BR112017023418B1 - Desbloqueio ortogonal de nucleotídeos - Google Patents

Desbloqueio ortogonal de nucleotídeos Download PDF

Info

Publication number
BR112017023418B1
BR112017023418B1 BR112017023418-1A BR112017023418A BR112017023418B1 BR 112017023418 B1 BR112017023418 B1 BR 112017023418B1 BR 112017023418 A BR112017023418 A BR 112017023418A BR 112017023418 B1 BR112017023418 B1 BR 112017023418B1
Authority
BR
Brazil
Prior art keywords
nucleic acid
primer
different
nucleotide
sites
Prior art date
Application number
BR112017023418-1A
Other languages
English (en)
Other versions
BR112017023418A2 (pt
Inventor
Eliane H. Trepagnier
Tarun Khurana
Original Assignee
Illumina, Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Illumina, Inc filed Critical Illumina, Inc
Priority claimed from PCT/US2016/041568 external-priority patent/WO2017019278A1/en
Publication of BR112017023418A2 publication Critical patent/BR112017023418A2/pt
Publication of BR112017023418B1 publication Critical patent/BR112017023418B1/pt

Links

Abstract

DESBLOQUEIO ORTOGONAL DE NUCLEOTÍDEOS. A presente invenção refere-se a um processo incluindo as etapas de: (a) fornecer um conjunto de sítios, em que cada sítio compreende uma mistura de diferentes moldes de ácidos nucleicos; (b) estender os iniciadores hibridizados para os diferentes moldes de ácido nucleico em cada um dos sítios com diferentes análogos de nucleotídeo com diferentes porções de bloqueio reversíveis, respectivamente, desse modo produzindo produtos de extensão de iniciador diferentes em cada sítio; (c) detectar os produtos de extensão de iniciador diferentes para distinguir os diferentes análogos de nucleotídeo em cada sítio; e (d) remover as diferentes porções de bloqueio reversíveis dos produtos de extensão de iniciador em cada um dos sítios utilizando um primeiro tratamento que é seletivo para uma primeira das diferentes porções de bloqueio reversíveis e um segundo tratamento que é seletivo para uma segunda das diferentes porções de bloqueio reversíveis.

Description

ANTECEDENTES DA INVENÇÃO
[0001] Essa invenção se refere, em geral, à análise de ácidos nucleicos e, mais especificamente, ao sequenciamento de ácidos nucleicos.
[0002] As plataformas comerciais atualmente disponíveis para o sequenciamento de DNA são relativamente caras. Essas plataformas usam uma abordagem de “sequenciamento-por-síntese”, assim chamada porque os polímeros de DNA são sintetizados durante a detecção da adição de cada monômero (ou seja, nucleotídeo) à estrutura crescente de polímero. Devido ao fato de uma fita de DNA molde direcionar estritamente a síntese de um novo polímero de DNA, pode-se deduzir a sequência do DNA modelo da série de monômeros de nucleotídeos que foram adicionados à fita crescente durante a síntese. A capacidade de detectar adições de monômero é facilitada pelas variantes especialmente projetadas dos componentes bioquímicos que normalmente realizam a síntese de DNA nos sistemas biológicos. Fazer esses componentes projetados é relativamente caro e eles são consumidos em quantidades relativamente grandes durante o sequenciamento por síntese. Além disso, o monitoramento da reação usa hardware relativamente caro, como lasers, óptica de detecção e sistemas de liberação de fluidos complexos. As plataformas comerciais mais bem-sucedidas até o momento também requerem reagentes caros e hardware para amplificar os moldes de DNA antes do sequenciamento por síntese poder até mesmo começar. A complexidade e o custo dessas plataformas têm dificultado o seu uso em alguns contextos clínicos e de pesquisa, onde existe uma clara necessidade da tecnologia.
[0003] Assim, existe uma necessidade de melhorias para as plataformas de sequenciamento por síntese para torna- las mais eficazes em termos de custo, rápidas e convenientes. A presente invenção aborda essa necessidade e também oferece outras vantagens.
BREVE SUMÁRIO
[0004] A presente invenção fornece um método para identificar modelos de ácido nucleico. O método pode incluir as etapas de (a) fornecer um conjunto de sítios, em que cada sítio compreende uma mistura de pelo menos dois diferentes moldes de ácidos nucleicos; (b) estender os iniciadores hibridizados para os diferentes moldes de ácido nucleico em cada um dos sítios com diferentes análogos de nucleotídeo com diferentes porções de bloqueio reversíveis, respectivamente, desse modo produzindo produtos de extensão de iniciador diferentes em cada sítio; (c) detectar os produtos de extensão de iniciador diferentes para distinguir os diferentes análogos de nucleotídeo em cada sítio; e (d) remover as diferentes porções de bloqueio reversíveis dos produtos de extensão de iniciador em cada um dos sítios utilizando um primeiro tratamento que é seletivo para uma primeira das diferentes porções de bloqueio reversíveis e um segundo tratamento que é seletivo para uma segunda das diferentes porções de bloqueio reversíveis. Opcionalmente, o método pode incluir ainda repetir (e) as etapas (b) a (d) para determinar a sequência de diferentes análogos de nucleotídeo adicionados a cada um dos diferentes produtos de extensão em cada um dos sítios.
[0005] Também é fornecido um método para o sequenciamento de moldes de ácido nucleico que podem incluir as etapas de (a) fornecer um conjunto de sites, em que cada sítio inclui um molde de ácido nucleico e um segundo molde de ácido nucleico, em que o primeiro molde de ácido nucleico tem uma sequência que é diferente da sequência do segundo molde de ácido nucleico, em que um primeiro molde está ligado ao primeiro molde de ácido nucleico, e em que um segundo molde está ligado ao segundo molde de ácido nucleico, uma porção de bloqueio reversível sendo ligada ao segundo iniciador/ (b) estender o primeiro iniciador pela adição de um primeiro análogo de nucleotídeo que está ligado a uma porção de bloqueio reversível, em que a porção de bloqueio reversível que está ligada ao primeiro nucleotídeo é diferente da porção de bloqueio reversível que está ligada ao segundo iniciador; (c) remover seletivamente a porção de bloqueio reversível que está ligada ao segundo polímero retendo, ao mesmo tempo, a porção de bloqueio reversível que está ligada ao análogo de nucleotídeo que é adicionado ao é adicionado ao primeiro iniciador; (d) estender o segundo iniciador pela adição de um segundo análogo de nucleotídeo que é ligado a uma porção de bloqueio reversível, em que a porção de bloqueio reversível que é ligada ao primeiro análogo de nucleotídeo é diferente da porção de bloqueio reversível que é ligada ao segundo análogo de nucleotídeo; e (e) detectar o análogo de nucleotídeo que é adicionado ao primeiro iniciador e o análogo de nucleotídeo que é adicionado ao segundo iniciador, em cada um dos sítios, determinando, assim, as diferentes sequências do primeiro molde e do segundo molde, em cada um dos sítios. Opcionalmente, o método pode compreender ainda as etapas de (f) remover seletivamente a porção de bloqueio reversível que está ligada ao primeiro análogo de nucleotídeo que é adicionado ao primeiro iniciador e reter, concomitantemente, a porção de bloqueio reversível que está ligada ao segundo análogo de nucleotídeo que é adicionado ao segundo iniciador; (g) estender o primeiro iniciador após (f), pela adição de um terceiro análogo de nucleotídeo que é ligado a uma porção de bloqueio reversível; (h) remover seletivamente a porção de bloqueio reversível que é ligada ao segundo análogo de nucleotídeo que é adicionado ao segundo iniciador e reter, concomitantemente, a porção de bloqueio reversível que é ligada ao primeiro análogo de nucleotídeo que é ligado ao primeiro análogo de nucleotídeo que é adicionado ao primeiro iniciador; (i) estender o segundo iniciador, após (h), pela adição de um quarto análogo de nucleotídeo que é ligado à porção de bloqueio reversível, em que a porção de bloqueio reversível que é ligada ao terceiro análogo de nucleotídeo é diferente da porção de bloqueio reversível que é ligada ao quarto análogo de nucleotídeo; e (h) detectar o análogo de nucleotídeo que é adicionado ao primeiro iniciador em (g) e o análogo de nucleotídeo que é adicionado ao segundo iniciador em (i), em cada um dos sítios, determinando, assim, as diferentes sequências do primeiro molde e do segundo molde em cada um dos sítios. Opcionalmente, as etapas (f) a (h) podem ser repetidas.
[0006] Também é fornecido um método para o sequenciamento de moldes de ácido nucleico que podem incluir as etapas de (a) fornecer um conjunto de sítios, em que cada sítio inclui um primeiro molde de ácido nucleico e um segundo molde de ácido nucleico, em que o primeiro molde de ácido nucleico tem uma sequência que é diferente da sequência do segundo molde de ácido nucleico, em que um primeiro molde está ligado ao primeiro molde de ácido nucleico, uma porção de bloqueio reversível sendo ligada ao primeiro molde, em que um segundo molde está ligado ao segundo molde de ácido nucleico, estando uma porção de bloqueio reversível ligada ao segundo iniciador, e em que a porção de bloqueio reversível que está ligada ao primeiro iniciador é diferente da porção de bloqueio reversível que está ligada ao segundo iniciador; (b) remover seletivamente a porção de bloqueio reversível que está ligada ao primeiro polímero retendo, ao mesmo tempo, a porção de bloqueio reversível que está ligada ao segundo iniciador; (c) estender o primeiro iniciador pela adição de um primeiro análogo de nucleotídeo que é ligado a uma porção de bloqueio reversível; (d) remover seletivamente a porção de bloqueio reversível que está ligada ao segundo iniciador, retendo, ao mesmo tempo, a porção de bloqueio reversível que está ligada ao análogo de nucleotídeo que é adicionado ao primeiro iniciador; (e) estender o segundo iniciador pela adição de um segundo análogo de nucleotídeo que está ligado a uma porção de bloqueio reversível, em que a porção de bloqueio reversível que está ligada ao primeiro análogo de nucleotídeo é diferente da porção de bloqueio reversível que está ligada ao segundo análogo de nucleotídeo; e (f) detectar o análogo de nucleotídeo que é adicionado ao primeiro iniciador e o análogo de nucleotídeo que é adicionado ao segundo iniciador, em cada um dos sítios, determinando assim as diferentes sequências do primeiro molde e o segundo molde em cada um dos sítios.
[0007] A presente invenção fornece ainda uma matriz de ácidos nucleicos que inclui uma pluralidade de sítios em um suporte sólido, em que cada sítio inclui um primeiro molde de ácido nucleico e um segundo molde de ácido nucleico, em que o primeiro molde de ácido nucleico tem uma sequência que é diferente da sequência do segundo molde de ácido nucleico, em que um primeiro iniciador está ligado ao primeiro molde de ácido nucleico, uma primeira porção de bloqueio reversível estando ligada ao primeiro iniciador, em que um segundo iniciador está ligado ao segundo molde de ácido nucleico, uma segunda porção de bloqueio reversível sendo ligada ao segundo iniciador e em que a primeira porção de bloqueio reversível é diferente da segunda porção de bloqueio reversível.
BREVE DESCRIÇÃO DOS DESENHOS
[0008] A figura 1 mostra um diagrama de ciclo para o sequenciamento por síntese realizado simultaneamente para uma mistura dos dois moldes em um sítio de uma matriz, em que os subconjuntos das porções de marcadores e das porções de desbloqueio que estão presentes nos mesmos produtos de extensão são clivados simultaneamente.
[0009] A figura 2 mostra um diagrama de ciclo para o sequenciamento por síntese realizado simultaneamente para uma mistura dos dois moldes em um sítio de uma matriz, em que as porções de marcador que estão presentes em produtos de extensão diferentes (ou seja, produzidas nas reações tanto de R1 como de R2) são clivadas simultaneamente.
DESCRIÇÃO DETALHADA
[0010] Essa invenção fornece um método para a detecção de alta densidade de ácidos nucleicos. Modalidades particulares dos métodos da presente divulgação exploram técnicas conhecidas para manipular e detectar ácidos nucleicos. No entanto, as melhorias descritas abaixo proporcionam processamento ortogonal, de modo que a densidade de informações obtidas através do uso dessas técnicas é aumentada.
[0011] O exemplo de uma técnica de detecção baseada em extensão de iniciador é ilustrativo da crescente densidade de informações que podem ser obtidas. Especificamente, uma sequência alvo de um ácido nucleico pode ser hibridizada em um iniciador, e o iniciador pode ser estendido por uma DNA polimerase para adicionar um análogo de nucleotídeo marcado. Um formato de matriz pode ser usado com vários sítios, com cada sítio tendo uma única sequência alvo que difere das sequências alvo presentes em outros sítios. Opcionalmente, várias espécies de análogo de nucleotídeo, cada uma com um marcador distinguível, são igualmente usadas. A extensão do iniciador resulta no recrutamento do nucleotídeo marcado análogo ao ácido nucleico com a sequência alvo. Em um formato de matriz, onde diferentes análogos de nucleotídeo marcados são usados, pode-se distinguir o marcador que é recrutado para cada sítio e usar essas informações para identificar o ácido nucleico alvo naquele sítio. A densidade das informações obtidas desse formato de matriz é uma sequência alvo identificada por sítio.
[0012] Em um formato ortogonal da presente divulgação, cada sítio da matriz pode conter uma mistura de duas ou mais sequências alvo diferentes que são tratadas simultaneamente (por exemplo, com reagentes químicos ou manipulações físicas) e simultaneamente observadas (por exemplo, com um detector com resolução que é muito baixa para separar espacialmente os ácidos nucleicos na mistura). No entanto, os tratamentos ortogonais estabelecidos na presente invenção produzem efeitos diferenciais que permitem que sequências alvo diferentes sejam distinguíveis entre si. Nesse caso, as informações obtidas a partir da matriz podem ser pelo menos dobradas. Dois diferentes iniciadores podem ser fornecidos a uma matriz e, devido à complementaridade diferencial, eles irão hibridizar para as duas sequências moldes diferentes, respectivamente, em cada sítio individual. O primeiro iniciador pode ter uma primeira porção de bloqueio reversível que o impede de ser estendido até um primeiro tratamento de desbloqueio ser aplicado, e o segundo iniciador pode ter uma segunda porção de bloqueio reversível que o impede de ser estendido até um segundo tratamento de desbloqueio ser aplicado. Neste exemplo, o primeiro tratamento de desbloqueio é seletivo para a primeira porção de bloqueio reversível em comparação com uma segunda porção de bloqueio, e o segundo tratamento de desbloqueio é seletivo para a segunda porção de bloqueio reversível em comparação com a primeira porção de bloqueio reversível. Essa capacidade seletiva de desbloqueio proporciona a ortogonalidade, de modo que os iniciadores, apesar de serem expostos a cada tratamento de desbloqueio, podem ser individualmente modificados para extensão e detecção. Assim, os dois iniciadores e, mais significativamente, os moldes que direcionam a sua extensão, podem ser distinguidos por esse deslocamento químico, mesmo que as moléculas em si não possam se separar suficientemente para permitir uma distinção espacial usando o sistema de detecção em uso.
[0013] Os conceitos da ortogonalidade exemplificados acima para uma técnica de detecção baseada em extensão de iniciador podem ser facilmente aplicados a uma técnica de sequenciamento por síntese (SBS). Um diagrama de ciclo exemplar para a SBS ortogonal para dois moldes (R1 e R2) em um sítio é mostrado na figura 1. A primeira coluna no diagrama representa um tratamento ao qual a matriz é exposta (ou seja, ambos os moldes são expostos ao tratamento). As segunda e terceira colunas indicam o efeito do tratamento sobre o primeiro molde e o segundo molde, respectivamente. Na primeira etapa do primeiro ciclo, uma mistura de iniciadores entra em contato com a matriz, o que resulta na hibridização aos respectivos sítios de ligação do iniciador. Após a etapa 1, o primeiro iniciador R1 que é hibridizado ao molde R1 está bloqueado pelo bloco 1, e o iniciador R2 não tem um grupo de bloqueio (opcionalmente, o iniciador R2 pode ser bloqueado por uma porção de bloqueio ortogonal, o bloco 2). Como tal, os dois iniciadores podem ser estendidos separadamente. Por exemplo, na segunda etapa do primeiro ciclo, um nucleotídeo com o bloco 2 e o marcador 2 é fornecido à matriz, o que resulta na extensão seletiva do iniciador R2 desbloqueado (ou seja, o iniciador R1 não é estendido). Em seguida, na terceira etapa do primeiro ciclo, a matriz pode ser exposta a um tratamento que desbloqueia seletivamente o iniciador R1, por exemplo, pela clivagem do bloco 1 (ou seja, o bloco 2 não é clivado). Na quarta etapa do primeiro ciclo, um nucleotídeo com o bloco 1 e o marcador 1 é fornecido à matriz, o que resulta na extensão seletiva do iniciador R1 desbloqueado (ou seja, o iniciador R2 não é estendido). A matriz pode ser então observada usando um dispositivo de detecção, de modo que os dois marcadores podem ser distinguidos em cada sítio. Conforme é exemplificado na figura 1, os ciclos de entrega de nucleotídeos que são bloqueados e marcados, clivando grupos de bloqueio e marcadores, e detecção, podem ser repetidos ciclicamente.
[0014] Como exemplificado acima e na figura 1, os análogos de nucleotídeo que são usados para estender os iniciadores podem incluir porções de bloqueio reversíveis que são seletivamente cliváveis para proporcionar o controle ortogonal através de vários ciclos de um sequenciamento por processo de síntese. Assim, os análogos de nucleotídeo podem ser fornecidos em dois conjuntos: um primeiro conjunto (por exemplo, com uma porção de bloqueio reversível (por exemplo, a mesma que a porção de bloqueio reversível do primeiro iniciador, bloco 1) e um segundo conjunto com uma segunda porção de bloqueio reversível (por exemplo, o bloco 2). Em algumas modalidades, os análogos de nucleotídeo no primeiro conjunto podem ter marcadores que são distinguíveis dos marcadores nos análogos de nucleotídeo no segundo conjunto (por exemplo, um primeiro conjunto é indicado no marcador 1 e um segundo conjunto é indicado como marcador 2 na figura 1). A ortogonalidade resultante na reatividade bioquímica e o controle do marcador permite que os dois eventos de extensão de iniciador sejam distinguíveis entre si em cada sítio de uma matriz. Assim, as duas sequências alvo podem ser distintamente detectadas.
[0015] Deve-se compreender que outros métodos podem também se beneficiar de manipulação ortogonal e detecção, conforme é definido em mais detalhes abaixo. Assim, as composições, aparelhos e métodos definidos na presente invenção não precisam ser limitados às aplicações de sequenciamento.
[0016] A ortogonalidade pode ser explorada para aumentar a densidade de aquisição de informações por 2 vezes ou mais. Por exemplo, um aumento maior do que 2 vezes de densidade de informações pode ser obtido usando mais do que dois conjuntos de reagentes ortogonais. Como um exemplo 3, os conjuntos de reagentes podem ser usados incluindo 3 diferentes tratamentos de desbloqueio que são, cada um, seletivo para os iniciadores e/ou análogos de nucleotídeos em um dos conjuntos de reagentes.
[0017] Como demonstrado acima e como será definido mais adiante detalhadamente abaixo, a presente divulgação fornece a vantagem da imagem de visualizar com super- resolução uma matriz, por meio do que o número de sequências alvo simultaneamente separáveis em um determinado sítio é maior do que um. A captura de imagem em super-resolução pode fornecer o benefício de simultaneamente, distinguindo vários ácidos nucleicos alvo diferentes que são maiores do que o número de sítios na matriz. Da mesma forma, a super- resolução é fornecida de modo que duas sequências alvo diferentes podem ser distinguidas em uma fase sólida usando um detector que tem uma resolução inferior à resolução espacial que, de outro modo, poderia ser necessário para distinguir as duas sequências alvo no substrato.
[0018] Em modalidades particulares, essa divulgação fornece configurações de hardware e reagentes para a detecção eficiente do ácido nucleico. Uma configuração exemplar usa menos marcadores do que o número de análogos de nucleotídeo que devem ser distinguidos em uma primeira etapa de extensão. Por exemplo, quatro espécies de análogos de nucleotídeo podem ser distinguidas com base na detecção de uma única espécie de marcador. Conforme é estabelecido em detalhes abaixo, isso pode ser conseguido usando um primeiro conjunto de análogos de nucleotídeos, incluindo as quatro espécies a seguir: (1) uma espécie com um primeiro marcador, (2) uma espécie com um ligante, (3) uma espécie com uma ligação clivável ao primeiro marcador e (4) uma espécie sem qualquer marcador ou ligante usada em uma etapa posterior, em que todas as quatro espécies têm uma porção de bloqueio que é seletivamente desbloqueada por um primeiro tratamento. Um conjunto ortogonal de análogos de nucleotídeo pode incluir as seguintes quatro espécies (5) uma espécie que tem um segundo marcador, (6) uma espécie que tem uma mistura do primeiro e segundo marcadores, (7) uma espécie que tem uma ligação clivável ao segundo marcador e (8) uma espécie sem qualquer marcador ou ligante usada em uma etapa posterior, em que todas as quatro espécies têm uma porção de bloqueio que é seletivamente desbloqueada por um segundo tratamento. Especificamente, o primeiro tratamento não causa o desbloqueio substancial do primeiro conjunto de análogos de nucleotídeo, e o segundo tratamento não causa o desbloqueio substancial do conjunto ortogonal de análogos de nucleotídeo.
[0019] As espécies em cada conjunto acima podem distinguir-se umas das outras com base em uma contabilidade adequada do que marcadores aparecem ou desaparecem após as etapas fluidas específicas e os dois conjuntos ortogonais de análogos de nucleotídeos podem ser distinguidos com base nos dois marcadores diferentes. Mais especificamente, as espécies (1) e (5) podem ser distinguidas entre si com base em diferentes marcadores e de todas as outras espécies devido à sua aparência após uma etapa de marcação inicial e suas resistências aos respectivos agentes de clivagem; as espécies (2) podem ser distinguidas com base na aparência do marcador após a incubação com um receptor marcado; as espécies (3) e (7) podem ser distinguidas uma da outra com base em diferentes marcadores, e são distinguidas de todas as outras espécies com base na aparência inicial do marcador e, em seguida, do desaparecimento após o tratamento com um respectivo reagente de clivagem; as espécies (6) podem ser distinguidas de todas as outras espécies com base na presença de ambos os marcadores em uma intensidade que é a metade da intensidade para espécies totalmente marcadas; e as espécies (4) e (8) podem ser distinguidas com base na inferência da falta de qualquer outra espécie nos respectivos conjuntos que foram detectados. Muitas outras configurações são possíveis alterar o número de marcadores, o número de manipulações fluídicas durante uma fase de detecção e/ou a complexidade do dispositivo de detecção para distinguir um certo número de marcadores. Como tal, a configuração pode ser adaptada para atender a uma determinada abordagem ou aplicação.
[0020] Os termos usados nesse documento serão compreendidos como assumindo os seus sentidos usuais, a menos que seja especificado de outra forma. Exemplos de vários termos usados nesse documento e suas definições são definidos abaixo.
[0021] Conforme utilizado na presente invenção, o termo “amplicon”, quando usado em referência a um ácido nucleico, significa o produto da cópia do ácido nucleico, em que o produto tem uma sequência de nucleotídeos que é igual ou complementar a pelo menos uma porção da sequência de nucleotídeos do ácido nucleico. Um amplicon pode ser produzido por qualquer um de uma variedade de métodos de amplificação que usam o ácido nucleico, ou um amplicon do mesmo, como um molde, incluindo, por exemplo, a extensão da polimerase, reação em cadeia da polimerase (PCR), amplificação por círculo rolante (RCA), extensão de ligação ou reação em cadeia por ligação. Um amplicon pode ser uma molécula de ácido nucleico tendo uma única cópia de uma sequência de nucleotídeos específica (por exemplo, um produto da PCR) ou várias cópias da sequência nucleotídica (por exemplo, um produto concatamérico de RCA). Um primeiro amplicon de um ácido nucleico alvo é tipicamente uma cópia complementar. Os amplicons subsequentes são cópias que são criadas, após a geração do primeiro amplicon, a partir do ácido nucleico alvo ou de outro amplicon. Um amplicon subsequente pode ter uma sequência que é substancialmente complementar ao ácido nucleico alvo ou substancialmente idêntica ao ácido nucleico alvo.
[0022] Conforme utilizado na presente invenção, o termo “matriz” se refere a uma população de sítios que podem ser diferenciados entre si, de acordo com a localização relativa. Diferentes moléculas que estão em sítios diferentes de uma matriz podem ser diferenciadas entre si, de acordo com os locais dos sítios na matriz. Um sítio individual de uma matriz pode incluir uma ou mais moléculas de um tipo particular. Por exemplo, um sítio pode incluir uma única molécula de ácido nucleico alvo com uma sequência particular ou um sítio pode incluir várias moléculas de ácido nucleico tendo a mesma sequência (e/ou a sua sequência complementar). Alternativamente, um sítio pode incluir uma mistura de sequências de ácidos nucleicos alvo, por exemplo, de modo que as moléculas individuais contêm duas ou mais moléculas diferentes cada, ou de modo que duas ou mais moléculas cada contém uma única sequência alvo da mistura. Os sítios de uma matriz podem ser diferentes especificidades localizadas no mesmo substrato. As especificidades exemplares incluem, sem limitação, poços em um substrato, esferas (ou outras partículas) em ou sobre um substrato, projeções de um substrato, passos em um substrato ou canais em um substrato. Os sítios de uma matriz podem ser substratos separado, com cada um possuindo uma molécula diferente. Diferentes moléculas ligadas a substratos separados podem ser identificadas de acordo com os locais dos substratos sobre uma superfície à qual os substratos estão associados ou de acordo com a localização dos substratos em um líquido ou gel. Matrizes exemplares, em que os substratos separados estão localizados em uma superfície incluem, sem limitação, aqueles com esferas nos poços.
[0023] Conforme utilizado na presente invenção, o termo “ligado” se refere ao estado de duas coisas sendo unidas, presas, aderidas, conectadas ou ligadas entre si. Por exemplo, um analito, como um ácido nucleico, pode estar ligado a um material, como um gel ou suporte sólido, por uma ligação covalente ou não covalente. Uma ligação covalente é caracterizada pelo compartilhamento de pares de elétrons entre os átomos. Uma ligação não covalente é uma ligação química que não envolve o compartilhamento de pares de elétrons e pode incluir, por exemplo, ligações de hidrogênio, ligações iônicas, forças de van der Waals, interações hidrofílicas e interações hidrofóbicas. Um ácido nucleico pode estar ligado a um suporte sólido através de um revestimento de gel sobre o suporte sólido.
[0024] Conforme utilizado na presente invenção, o termo “porção de bloqueio”, quando usado em referência a um análogo de nucleotídeo, significa uma parte do análogo de nucleotídeo que inibe ou impede que o análogo de nucleotídeo forme uma ligação covalente com um segundo análogo de nucleotídeo. Por exemplo, no caso de análogos de nucleotídeo com uma porção pentose, uma porção de bloqueio pode impedir a formação de uma ligação fosfodiéster entre o oxigênio 3' do análogo de nucleotídeo e o fosfato 5' do segundo análogo de nucleotídeo. A porção de bloqueio pode ser parte de um análogo de nucleotídeo que é uma unidade monomérica presente em um polímero de ácido nucleico ou a porção de bloqueio pode ser parte de um análogo de nucleotídeo livre (por exemplo, um trifosfato de nucleotídeo). A porção de bloqueio que faz parte de um análogo de nucleotídeo pode ser reversível, de modo que a porção de bloqueio pode ser removida ou modificada para tornar o análogo de nucleotídeo capaz de formar uma ligação covalente com um segundo análogo de nucleotídeo. Porções de bloqueio reversíveis particularmente úteis são os fosfatos, fosfoésteres, alquil azidas, acetais, ésteres, éteres ou similares. Outros exemplos de porções de bloqueio reversíveis que podem ser usadas são descritos abaixo e nas referências incorporadas por referência na presente invenção, como definido abaixo. Em modalidades particulares, uma porção de bloqueio, como uma porção de bloqueio reversível, pode ser ligada na posição 3' ou na posição 2' de uma porção pentose de um análogo de nucleotídeo.
[0025] Conforme utilizado na presente invenção, o termo “cluster”, quando usado em referência aos ácidos nucleicos, se refere a uma população de ácidos nucleicos que é ligada a um suporte sólido para formar um recurso ou sítio. Os ácidos nucleicos são geralmente de uma única espécie, formando assim um clister homogêneo. No entanto, em algumas modalidades, os ácidos nucleicos podem ser heterogêneos, tal que moléculas individuais com sequências diferentes estejam presentes no sítio ou elemento. Os ácidos nucleicos estão, em geral, covalentemente ligados ao suporte sólido, por exemplo, através de suas extremidades 5', mas, em alguns casos, outros meios de ligação são possíveis. Os ácidos nucleicos em um cluster podem ser de fita simples ou de fita dupla. Em algumas, mas não em todas as modalidades, os clusters são feitos por um método de amplificação em fase sólida, conhecido como amplificação em ponte. Configurações exemplares para clusters e métodos para sua produção são definidos, por exemplo, na Patente Norte-Americana No. 5,641,658; na Publicação de Patente Norte-Americana No. 2002/0055100; na Patente Norte-Americana No. 7,115,400; na Publicação de Patente Norte-Americana No. 2004/0096853; na Publicação de Patente Norte-Americana No. 2004/0002090; na Publicação de Patente Norte-Americana No. 2007/0128624; e a Publicação de Patente Norte-Americana No. 2008/0009420, cada uma das quais sendo incorporada na presente invenção a título de referência.
[0026] Conforme utilizado na presente invenção, o termo “agente de desbloqueio” significa um catalisador, enzima, reagente ou outra substância que é capaz de modificar ou remover uma porção de bloqueio. Em modalidades particulares, um agente de desbloqueio pode ter especificidade para uma determinada porção de bloqueio. Como tal, o agente de desbloqueio pode remover seletivamente uma porção de bloqueio particular de um análogo de nucleotídeo em comparação com outra porção de bloqueio. Agentes de desbloqueio exemplares incluem, mas não se limitam, a uma enzima, como uma fosfoesterase, esterase, alquil transferase ou metiltransferase; ou um reagente químico como uma fosfina, um próton ou um catalisador químico, como um catalisador de paládio ou similares. Outros exemplos de agentes de desbloqueio são definidos em mais detalhes abaixo.
[0027] Conforme utilizado na presente invenção, o termo “diferente”, quando usado em referência aos ácidos nucleicos, significa que os ácidos nucleicos têm sequências de nucleotídeos que não iguais entre si. Dois ou mais ácidos nucleicos podem ter sequências de nucleotídeos que são diferentes ao longo de toda a sua extensão. Alternativamente, dois ou mais ácidos nucleicos podem ter sequências de nucleotídeos que são diferentes ao longo de uma porção substancial de seu comprimento. Por exemplo, dois ou mais ácidos nucleicos pode ter porções de sequência nucleotídica alvo que são diferentes entre si, tendo também uma região de sequência universal que é igual para ambos. Geralmente, quando duas espécies são referidas nesse documento como sendo “diferentes”, uma das espécies terá uma propriedade estrutural que não é igual às propriedades estruturais da segunda espécie. Por exemplo, duas espécies poliméricas diferentes (por exemplo, duas proteínas) podem ter sequências diferentes de subunidades monoméricas (tais como diferentes sequências de aminoácidos para duas proteínas diferentes).
[0028] Conforme utilizado na presente invenção, o termo “cada”, quando usado em referência a uma coleção de itens, destina-se a identificar um item individual na coleção, mas não necessariamente se refere a cada item na coleção. Exceções podem ocorrer se a divulgação ou o contexto explícito claramente dizer de outra forma.
[0029] Conforme utilizado na presente invenção, o termo “ácido nucleico” destina-se a ser coerente com seu uso na técnica e inclui ácidos nucleicos que ocorrem na natureza ou análogos funcionais dos mesmos. Análogos funcionais particularmente úteis são capazes de hibridizar com um ácido nucleico de modo específico em termos de sequência ou ser capazes de serem usados como um molde para a replicação de uma sequência nucleotídica específica. Ácidos nucleicos que ocorrem na natureza geralmente têm uma estrutura contendo ligações fosfodiéster. Uma estrutura análoga pode ter uma ligação de estrutura alternativa, incluindo qualquer um de uma variedade daquelas conhecidas na técnica. Ácidos nucleicos que ocorrem na natureza geralmente têm um açúcar desoxirribose (por exemplo, encontrado no ácido desoxirribonucleico (DNA)) ou em uma ribose (por exemplo, encontrado no ácido ribonucleico (RNA)). Um ácido nucleico pode conter qualquer de uma variedade de análogos dessas porções de açúcar que são conhecidas na técnica. Um ácido nucleico pode incluir bases nativas ou não nativas. Sob este aspecto, um ácido desoxirribonucleico nativo pode ter uma ou mais bases selecionadas do grupo consistindo em adenina, timina, citosina ou guanina, e um ácido ribonucleico pode ter uma ou mais bases selecionadas do grupo consistindo em uracila, adenina, citosina ou guanina. As bases não nativas úteis que podem ser incluídas em um ácido nucleico são conhecidas na técnica. O termo “alvo”, quando usado em referência a um ácido nucleico, destina-se a ser um identificador semântico para o ácido nucleico no contexto de um método ou composição estabelecida nesse documento, e não necessariamente limita a estrutura ou a função do ácido nucleico além do que é explicitamente indicado.
[0030] Conforme utilizado na presente invenção, o termo “molde de ácido nucleico” se refere a um ácido nucleico ou parte do mesmo que é capaz de usar, via de regra, para a replicação catalisada pela polimerase. Uma molécula de ácido nucleico pode incluir vários moldes ao longo de seu comprimento, ou, alternativamente, apenas um único molde por molécula pode ser utilizado em uma modalidade particular na presente invenção. Um molde de ácido nucleico também pode funcionar como um guia para a extensão do iniciador catalisada pela ligase.
[0031] Conforme utilizado na presente invenção, o termo “nucleotídeo” ou “análogo de nucleotídeo” destina-se a incluir nucleotídeos naturais, nucleotídeos não naturais, ribonucleotídeos, desoxirribonucleicos, didesoxirribonucleotídeos e outras moléculas conhecidas como nucleotídeos. Por exemplo, os termos são usados neste documento para se referir, de modo geral, a uma porção de nucleosídeos (seja ela de ribose, desoxirribose ou um análogo dos mesmos), incluindo uma porção de base e são, opcionalmente, ligados a uma ou mais porções fosfato. O termo pode ser usado para se referir a uma unidade monomérica que está presente em um polímero, por exemplo, para identificar uma subunidade presente em uma fita de DNA ou RNA. O termo também pode ser usado para se referir a uma molécula monomérica que não está necessariamente presente em um polímero, por exemplo, a uma molécula que é capaz de ser incorporada em um polinucleotídeo de modo dependente do molde por uma polimerase.
[0032] Os análogos de nucleotídeo exemplares incluem, mas não se limitam, ao monofosfato de ribonucleotídeo (às vezes referido como um monofosfato de ribonucleosídeo), difosfato de ribonucleotídeo (às vezes referido como uma ribonucleosídeo difosfato), ribonucleotídeo trifosfato (às vezes referido como uma ribonucleosídeo trifosfato), desoxinucleotídeo monofosfato (às vezes referido como um desoxinucleosídeo monofosfato), desoxinucleotídeo difosfato (às vezes referido como um desoxinucleotídeo difosfato) e desoxinucleotídeo trifosfato (às vezes referido como um desoxinucleosídeo trifosfato). Para maior clareza, quando se deseja distinguir os componentes de RNA dos componentes de DNA, o termo “ribonucleotídeo” pode ser usado para especificar os nucleotídeos de RNA, como o trifosfato de ribouridina, trifosfato de riboguanidina, trifosfato de ribocitidina ou trifosfato de riboadenosina; e o termo “desoxinucleotídeo” pode ser usado para especificar nucleotídeos de DNA, tais como o trifosfato de desoxitimidina, trifosfato de desoxiguanidina, trifosfato de desoxicitidina e trifosfato de desoxiadenosina. Em modalidades particulares, os nucleotídeos são “extensíveis”, por exemplo, eles não têm uma porção de bloqueio de extensão na hidroxila 3' ou em qualquer outra posição no nucleotídeo. Em outras modalidades, os nucleotídeos são “bloqueados”, tendo uma porção que impede que a posição 3' participe da extensão por adição de outro nucleotídeo ou oligonucleotídeo.
[0033] Como utilizado aqui, o termo “passo” se refere à distância entre dois centros para dois sítios em uma matriz. Um padrão de sítios pode ser regular, de modo que o coeficiente de variação ao redor do passo médio seja pequena, ou o padrão pode ser não regular, em cujo caso o coeficiente de variação pode ser relativamente grande. Em qualquer caso, o passo médio pode ser, por exemplo, de pelo menos 10 nm, 0,1 μm, 0,5 μm, 1 μm, 5 μm, 10 μm, 100 μm ou mais. Alternativamente ou adicionalmente, o passo médio pode ser, por exemplo, de no máximo 100 μm, 10 μm, 5 μm, 1 μm, 0,5 μm, 0,1 μm ou menos. Obviamente, o passo médio para um determinado padrão de sítios pode estar entre um dos valores mais baixos e um dos valores mais altos selecionados das faixas acima.
[0034] Conforme utilizado na presente invenção, o termo “iniciador” significa um ácido nucleico tendo uma sequência que se liga a um sítio de ligação de iniciador em ou perto de uma sequência molde. Geralmente, o iniciador se liga em uma configuração que permite que a replicação do molde, por exemplo, via extensão da polimerase do iniciador. O iniciador pode ser uma primeira porção de uma molécula de ácido nucleico que se liga a uma segunda porção da molécula de ácido nucleico, a primeira porção sendo uma sequência do iniciador e a segunda porção sendo uma sequência de ligação do iniciador (por exemplo, um iniciador tipo grampo/”hairpin”). Alternativamente, o iniciador pode ser uma primeira molécula de ácido nucleico que se liga a uma segunda molécula de ácido nucleico tendo a sequência molde. Um iniciador pode consistir em um DNA, RNA ou em análogos dos mesmos.
[0035] Conforme utilizado na presente invenção, o termo “produto de extensão de iniciador” significa um iniciador que foi modificado pela adição de pelo menos um análogo de nucleotídeo. Por exemplo, um iniciador pode ser modificado pela adição de um ou mais análogos de nucleotídeo em sua extremidade 3' (por exemplo, através de catálise da polimerase), formando assim um produto de extensão do iniciador. Um produto de extensão do iniciador pode ser alternativamente produzido pela ligação de um oligonucleotídeo à extremidade 3' ou 5' de um iniciador. Nesse caso, o produto de extensão do iniciador é estendido por um comprimento equivalente ao comprimento do oligonucleotídeo. Um produto de extensão do iniciador pode ser pelo menos 1, 2, 5, 10, 500, 1000 ou mais nucleotídeos mais longo do que o iniciador. Alternativamente ou adicionalmente, um produto de extensão do iniciador pode ser pelo menos não maior do que 1, 2, 5, 10, 500 ou 1000 nucleotídeos mais longo do que o iniciador. Por exemplo, o uso de um análogo de nucleotídeo bloqueado proporciona um produto de extensão que é pelo menos 1 nucleotídeo mais longo do que o iniciador, e também, não mais do que 1 nucleotídeo mais longo do que o iniciador.
[0036] Conforme utilizado na presente invenção, referência a manipulando “seletivamente” (ou manipulação “seletiva” de) um primeiro fator em comparação com um segundo fator destina-se a significar que a manipulação tem um efeito maior sobre o primeiro fator em comparação com o efeito sobre o segundo fator. A manipulação não precisa ter qualquer efeito sobre o segundo fator. A manipulação pode ter um efeito sobre o primeiro fator que é pelo menos 1%, 5%, 10%, 25%, 50%, 75%, 90%, 95% ou 99% maior do que o efeito sobre o segundo fator. A manipulação pode ter um efeito sobre o primeiro fator que é pelo menos 2 vezes, 3 vezes, 4 vezes, 5 vezes, 10 vezes, 100 vezes, 1x103 vezes, 1x104 vezes ou 1x106 vezes maior do que o efeito sobre o segundo fator. A manipulação pode incluir, por exemplo, modificar, colocar em contato, tratar, mudar, clivar (por exemplo, uma ligação química), clivar fotoquimicamente (por exemplo, de uma ligação química), formar (por exemplo, uma ligação química), formar fotoquimicamente (por exemplo, uma ligação química), modificar covalentemente, modificar não covalentemente, destruir, fotorremover, remover, sintetizar, polimerizar, fotopolimerizar, amplificar (por exemplo, um ácido nucleico), copiar (por exemplo, um ácido nucleico), estender (por exemplo, um ácido nucleico), ligar (por exemplo, um ácido nucleico), ou manipular de outra forma estabelecida na presente invenção ou de alguma outra forma conhecida na técnica.
[0037] Conforme utilizado na presente invenção, o termo “sequência”, quando usado em referência a um ácido nucleico, se refere à ordem dos nucleotídeos (ou bases) nos ácidos nucleicos. Nos casos em que espécies diferentes de nucleotídeos estão presentes no ácido nucleico, a sequência inclui a identificação das espécies de nucleotídeo (ou base) nas respectivas posições no ácido nucleico. Uma sequência é uma propriedade de todo ou parte de uma molécula de ácido nucleico. O termo pode ser usado da mesma forma para descrever a ordem e a identidade posicional de unidades monoméricas em outros polímeros, como em unidades monoméricas de aminoácidos de polímeros de proteínas.
[0038] Conforme utilizado na presente invenção, o termo “sítio” significa um local em uma matriz onde pelo menos uma molécula de analito está presente. Um sítio pode conter apenas uma única molécula de analito, ou ele pode conter uma população de várias moléculas de analito da mesma espécie. Em algumas modalidades, um sítio pode incluir múltiplas espécies de moléculas de analito diferentes, com cada espécie estando presente em uma ou mais cópias. Os sítios de uma matriz são normalmente discretos. Os sítios discretos podem ser contíguos ou eles podem ter espaços entre si.
[0039] Conforme utilizado na presente invenção, o termo “espécie” ou “tipo” é usado para identificar moléculas que compartilham a mesma estrutura química. Por exemplo, uma mistura de análogos de nucleotídeo pode incluir várias moléculas dCTP. As moléculas dCTP serão compreendidas como sendo da mesma espécie, ou tipo, que as outras, porém de uma espécie ou tipo diferente em comparação com dATP, dGTP, dTTP, etc. Da mesma forma, as moléculas de DNA individuais que têm a mesma sequência de nucleotídeos são da mesma espécie ou tipo, enquanto que as moléculas de DNA com sequências diferentes são de diferentes espécies ou tipos. Como outro exemplo, uma DNA polimerase é uma espécie ou tipo de polimerase diferente em comparação com uma RNA polimerase (mesmo se as duas polimerases forem derivadas do mesmo organismo).
[0040] Conforme utilizado na presente invenção, o termo “sequência universal” se refere a uma sequência que é comum a duas ou mais moléculas de ácidos nucleicos, mesmo onde as moléculas também têm outras regiões da sequência que as diferem umas das outras. Uma sequência universal que está presente em diferentes membros de uma coleção de moléculas pode permitir a captura de vários ácidos nucleicos diferentes, usando uma população de ácidos nucleicos de captura universal que são complementares à sequência universal. Semelhantemente, uma sequência universal presente em diferentes membros de uma coleção de moléculas pode permitir a replicação ou a amplificação de vários ácidos nucleicos diferentes usando uma população de iniciadores universais que são complementares à sequência universal. Assim, um ácido nucleico de captura universal ou um iniciador universal inclui uma sequência que pode hibridizar especificamente com uma sequência universal. As moléculas de ácido nucleico alvo podem ser modificadas para se ligar a adaptadores universais, por exemplo, em uma ou em ambas as extremidades das sequências alvo diferentes.
[0041] As modalidades definidas abaixo e citadas nas reivindicações podem ser compreendidas tendo em vista as definições acima.
[0042] A presente divulgação fornece um método para sequenciar moldes de ácido nucleico. O método pode incluir as etapas de (a) fornecer um conjunto de sítios, em que cada sítio compreende uma mistura de pelo menos dois diferentes moldes de ácidos nucleicos; (b) estender os iniciadores hibridizados para os diferentes moldes de ácido nucleico em cada um dos sítios com diferentes análogos de nucleotídeo com diferentes porções de bloqueio reversíveis, respectivamente, desse modo produzindo produtos de extensão de iniciador diferentes em cada sítio; (c) detectar os produtos de extensão de iniciador diferentes para distinguir os diferentes análogos de nucleotídeo em cada sítio; (d) remover as diferentes porções de bloqueio reversíveis dos produtos de extensão de iniciador em cada um dos sítios utilizando um primeiro tratamento que é seletivo para uma primeira das diferentes porções de bloqueio reversíveis e um segundo tratamento que é seletivo para uma segunda das diferentes porções de bloqueio reversíveis; e (e) repetir as etapas (b) até (d) para determinar a sequência de diferentes análogos de nucleotídeos adicionados a cada um dos diferentes produtos de extensão em cada um dos sítios.
[0043] Conforme definido acima, um método da presente divulgação pode incluir uma etapa de fornecer o primeiro e o segundo moldes de ácido nucleico, no qual as sequências para os dois moldes são diferentes. As duas sequências de molde podem ser porções de uma única molécula do ácido nucleico ou, alternativamente, as duas sequências de molde podem estar localizadas em moléculas separadas. Conforme é definido em mais detalhes em outras partes nesse documento, as duas sequências molde podem estar em uma proximidade que é muito próxima para separar espacialmente com o sistema de detecção utilizado. No entanto, os métodos de detecção ortogonal da presente divulgação permitem que essas sequências moldes sejam distinguidas. O esquema de detecção ortogonal é exemplificado para duas sequências moldes, mas ele pode ser usado com duas ou mais sequências moldes. Nesse sentido, um sistema ou método estabelecido na presente invenção pode incluir pelo menos 2, 3, 4, 5, 10 ou mais sequências moldes que estão próximas, por exemplo, em uma única molécula de ácido nucleico, em um único sítio de uma matriz ou, de outro modo, em uma proximidade muito perto de separar espacialmente com o sistema de detecção utilizado.
[0044] Os ácidos nucleicos alvo usados neste documento podem ser compostos de DNA, RNA ou seus análogos. A fonte dos ácidos nucleicos alvo pode ser o DNA genômico, o RNA mensageiro ou outros ácidos nucleicos de fontes nativas. Em alguns casos, os ácidos nucleicos alvo que são derivados de tais fontes podem ser amplificados antes de usar em um método ou composição na presente invenção.
[0045] Amostras biológicas exemplares das quais os ácidos nucleicos alvos podem ser derivados incluem, por exemplo, aquelas de um mamífero como um roedor, camundongo, rato, coelho, porquinho-da-índia, ungulado, cavalo, ovelha, porco, cabra, vaca, gato, cão, primata, ser humano ou primata não humano; uma planta, como Arabidopsis thaliana, milho, sorgo, aveia, trigo, arroz, canola ou soja; uma alga, como Chlamydomonas reinhardtii; um nematoide, como Caenorhabditis elegans; um inseto, como Drosophila melanogaster, mosquito, mosca da fruta, abelha ou aranha; um peixe, como o peixe- zebra; um réptil; um anfíbio, como um sapo ou Xenopus laevis; um dictyostelium discoideum; um fungo, como pneumocystis carinii, Takifugu rubripes, uma levedura, Saccharamoyces cerevisiae ou Schizosaccharomyces pombe; ou um plasmodium falciparum. Os ácidos nucleicos alvo também podem ser derivados de um procarioto, como uma bactéria, Escherichia coli, estafilococo ou micoplasma pneumoniae; uma arquebactéria; um vírus, como o vírus da hepatite C ou o vírus da imunodeficiência humana; ou um viroide. Os ácidos nucleicos alvos podem ser derivados de uma cultura homogênea ou de uma população dos organismos acima ou, alternativamente, de uma coleção de vários organismos diferentes, por exemplo, em uma comunidade ou ecossistema. Os ácidos nucleicos podem ser isolados usando métodos conhecidos na técnica, incluindo, por exemplo, aqueles descritos em Sambrook et al., Molecular Cloning: A Laboratory Manual, 3a edição, Cold Spring Harbor Laboratory, New York (2001) ou em Ausubel et al., Current Protocols in Molecular Biology, John Wiley and Sons, Baltimore, Md. (1998), cada uma das quais sendo incorporado na presente invenção a título de referência.
[0046] Em modalidades particulares, uma amostra de ácido nucleico pode ser modificada ou preparada para uso em um ou mais dos métodos estabelecidos na presente invenção. Em alguns casos, é desejável adicionar um ou mais sítios de ligação do iniciador a um ácido nucleico. Técnicas de biologia molecular conhecidas podem ser usadas para introduzir sítios de ligação do iniciador a montante das respectivas sequências alvo, por exemplo, por meio da inserção de um adaptador com o sítio de ligação do iniciador, uma mutação para criar o sítio de ligação do iniciador, a ligação de um adaptador com o sítio de ligação do iniciador, etc. Métodos úteis são descritos em Sambrook et al., supra e em Ausubel et al., supra. A Publicação do Pedido de Patente Norte-Americana No. 2015/0031560 A1 (que é incorporada na presente invenção por referência) fornece uma ilustração de uma técnica baseada na tagmentação para introduzir sítios de ligação do iniciador. A tagmentação é particularmente útil para introduzir um ou mais sítios de ligação do iniciador e pode ser realizada, por exemplo, usando técnicas definidas nas Patentes Norte-Americanas Nos. 6,294,385 e 8,383,345, e na Publicação PCT No. WO 2012/106546, cada um dos quais sendo incorporado na presente invenção por referência. Será compreendido que, em alguns casos, as regiões de sequência que ocorrem na natureza que residem a montante das respectivas sequências moldes podem ser exploradas como sítios de ligação do iniciador em um método definido na presente invenção. Métodos semelhantes aos exemplificados acima para os sítios de ligação do iniciador podem ser usados para introduzir outros elementos de sequência desejados como elementos promotores para a extensão à base de polimerase ou sequências de marcador.
[0047] Sítios de iniciação universais são particularmente úteis para aplicações multiplex dos métodos estabelecidos na presente invenção. Os sítios de iniciação universal oferecem uma região da sequência que é comum a duas ou mais moléculas de ácido nucleico, onde as moléculas também têm regiões de molde ou alvo com diferentes sequências. Uma sequência de iniciação universal presente em diferentes membros de uma coleção de moléculas pode permitir a replicação, a amplificação ou a detecção de várias sequências diferentes usando uma única espécie de iniciador universal que é complementar à sequência de iniciação universal. Assim, um iniciador universal inclui uma sequência que pode hibridizar especificamente com uma sequência de iniciação universal. Exemplos dos métodos de ligação de sequências universais a uma coleção de ácidos nucleicos alvo podem ser encontrados na Publicação do Pedido de Patente Norte-Americana No. 2007/0128624 A1, que está incorporada na presente invenção por referência.
[0048] Em algumas modalidades, os ácidos nucleicos alvo podem ser obtidos como fragmentos de um ou mais ácidos nucleicos maiores. A fragmentação pode ser realizada usando qualquer uma de uma variedade de técnicas conhecidas na arte incluindo, por exemplo, nebulização, ultrassom, clivagem química, clivagem enzimática ou cisalhamento físico. A fragmentação também pode resultar do uso de uma técnica de amplificação específica que produz amplicons copiando apenas uma porção de um ácido nucleico maior. Por exemplo, a amplificação por PCR produz fragmentos com um tamanho definido pelo comprimento do fragmento entre os iniciadores flanqueadores utilizados para a amplificação.
[0049] Uma população de ácidos nucleicos alvo, ou amplicons dos mesmos, pode ter um comprimento de fita médio que é desejado ou apropriado para uma aplicação específica dos métodos ou composições estabelecidas na presente invenção. Por exemplo, o comprimento médio da fita pode ser menor que cerca de 100.000 nucleotídeos, 50.000 nucleotídeos, 10.000 nucleotídeos, 5.000 nucleotídeos, 1.000 nucleotídeos, 500 nucleotídeos, 100 nucleotídeos ou 50 nucleotídeos. Alternativamente ou adicionalmente, o comprimento médio da fita pode ser maior que cerca de 10 nucleotídeos, 50 nucleotídeos, 100 nucleotídeos, 500 nucleotídeos, 1.000 nucleotídeos, 5.000 nucleotídeos, 10.000 nucleotídeos, 50.000 nucleotídeos ou 100.000 nucleotídeos. O comprimento médio da fita para uma população de ácidos nucleicos alvo, ou seus amplicons, pode estar em uma faixa entre um valor máximo e um valor mínimo acima definidos. Será compreendido que os amplicons gerados em um sítio de amplificação (feito ou usado na presente invenção) pode ter um comprimento médio da fita que está em uma faixa entre um limite superior e um limite inferior selecionado daqueles exemplificados acima.
[0050] Em alguns casos, uma população de ácidos nucleicos alvo pode ser produzida ou, de outro modo, configurada para ter um comprimento máximo de seus membros. Por exemplo, o comprimento máximo para os membros que são feitos ou usados conforme definido na presente invenção pode ser menor do que cerca de 100.000 nucleotídeos, 50.000 nucleotídeos, 10.000 nucleotídeos, 5.000 nucleotídeos, 1.000 nucleotídeos, 500 nucleotídeos, 100 nucleotídeos ou 50 nucleotídeos. Alternativamente ou adicionalmente, uma população de ácidos nucleicos alvo, ou amplicons, pode ser produzida sob condições ou, de outro mofo, configurada para ter um comprimento mínimo para seus membros. Por exemplo, o comprimento mínimo para os membros que são usados em uma ou mais etapas de um método aqui definido, ou que estão presentes em uma determinada composição, pode ser maior do que cerca de 10 nucleotídeos, 50 nucleotídeos, 100 nucleotídeos, 500 nucleotídeos, 1.000 nucleotídeos, 5.000 nucleotídeos, 10.000 nucleotídeos, 50.000 nucleotídeos ou 100.000 nucleotídeos. O comprimento máximo e mínimo da fita para os ácidos nucleicos alvo em uma população pode estar em uma faixa entre um valor máximo e um valor mínimo acima definidos. Será compreendido que os amplicons gerados em um sítio de uma matriz (feito ou usado na presente invenção) podem ter comprimentos de fita máximo e/ou mínimo em uma faixa entre os limites superior e inferior exemplificados acima.
[0051] Qualquer uma de uma variedade de técnicas de amplificação conhecido pode ser usada para aumentar a quantidade de sequências molde presentes para uso em um método definido na presente invenção. Técnicas exemplares incluem, mas não se limitam, à reação em cadeia da polimerase (PCR), amplificação por círculo rolante (RCA), amplificação por deslocamento múltiplo (MDA) ou amplificação inicial aleatória (RPA) de moléculas de ácidos nucleicos com sequências molde. Será compreendido que a amplificação de ácidos nucleicos alvo antes de usar em um método ou composição estabelecida na presente invenção é opcional. Como tal, os ácidos nucleicos alvo não serão amplificados antes do uso em algumas modalidades dos métodos e composições definidos na presente invenção. Os ácidos nucleicos alvo podem ser opcionalmente derivados de bibliotecas sintéticas. Os ácidos nucleicos sintéticos podem ter composições de DNA ou RNA nativas ou podem ser os seus análogos. Métodos de amplificação de fase sólida também podem ser usados, incluindo, por exemplo, amplificação de cluster, amplificação em ponte ou outros métodos descritos abaixo, no contexto dos métodos baseados em matriz.
[0052] Um ácido nucleico usado em um método estabelecido na presente invenção pode estar em fase de solução ou em fase sólida. O ácido nucleico, quando está em fase de solução, é geralmente solúvel, mas também pode estar em uma forma suspensa que é capaz de ser precipitado, como é o caso de algumas espécies de grandes ácidos nucleicos, como cromossomas ou nanobolas de ácido nucleico (consulte, por exemplo, a Publicação do Pedido de Patente Norte- Americana No. 2007/0099208 A1, que está incorporada na presente invenção por referência). Um ácido nucleico que está em fase sólida pode ocorrer em ou sobre um suporte de fase sólida. Suportes de fase sólida exemplares incluem aqueles feitos de vidro, nitrocelulose, sílica, metal, plástico e outro materiais definidos em outras seções na presente invenção, por exemplo, no que diz respeito a formatos de matriz e células de fluxo. Da mesma forma, um ácido nucleico pode ocorrer em ou sobre um suporte semissólido, como um gel. Géis exemplares que são úteis incluem, mas não se limitam, àqueles com uma estrutura coloidal, como agarose; estrutura de malha de polímero, como gelatina; ou estrutura de polímero reticulado, como poliacrilamida. Os hidrogéis são particularmente úteis, tais como aqueles definidos na Publicação do Pedido de Patente Norte-Americana No. 2011/0059865 A1 e na Patente Norte-Americana No. 9,012,022, cada uma das quais sendo incorporada na presente invenção por referência.
[0053] A ligação de um ácido nucleico a um suporte, seja ele rígido ou semirrígido, pode ocorrer através de ligações covalentes ou não covalentes. As ligações exemplares são definidas nas Patentes Norte-Americanas Nos. 6,737,236; 7,259,258; 7,375,234 e 7,427,678; e na Publicação do Pedido de Patente Norte-Americana No. 2011/0059865 A1, cada um dos quais sendo aqui incorporado a título de referência. Em algumas modalidades, um ácido nucleico ou outro componente reacional pode ser ligado a um gel ou outro suporte semissólido que, por sua vez, é ligado ou adere a um suporte de fase sólida. Em tais modalidades, o ácido nucleico ou outro componente reacional será compreendido como sendo de fase sólida.
[0054] Uma reação multiplex pode utilizar um suporte de fase sólida (também conhecido como um suporte sólido). Um suporte de fase sólida pode ser útil para separar reações individuais, de modo que cada uma possa ser interrogada separadamente ou individualmente. Por exemplo, vários ácidos nucleicos diferentes em uma mistura podem ser ligados ao suporte de fase sólida. Os ácidos nucleicos podem ser ligados ao suporte de fase sólida em um formato de matriz.
[0055] Em algumas modalidades, uma matriz de sítios é fornecida, em que cada sítio inclui um primeiro molde de ácido nucleico e um segundo molde de ácido nucleico, e em que o primeiro molde de ácido nucleico tem uma sequência diferente da sequência do segundo molde de ácido nucleico. Pode haver mais do que dois moldes diferentes por sítio, em algumas modalidades. Materiais de matriz e métodos de fabricação exemplares que podem ser modificados para uso na presente invenção incluem, sem limitação, uma matriz BeadChip, disponível junto à Illumina®, Inc. (São Diego, CA) ou matrizes como aquelas descritas nas Patentes Norte- Americanas Nos. 6,266,459, 6,355,431, 6,770,441, 6,859,570 ou 7,622,294; ou na publicação PCT No. WO 00/63437, cada um dos quais sendo incorporado na presente invenção por referência. Outros exemplos de matrizes comercialmente disponíveis que podem ser usadas incluem, por exemplo, uma matriz Affymetrix® GeneChip® ou outra matriz sintetizada de acordo com técnicas às vezes referidas como tecnologias VLSIPS™ (síntese de polímero imobilizado em escala muito grande). Uma matriz marcada também pode ser usada de acordo com algumas modalidades. Uma matriz marcada exemplar é uma matriz CodeLink™, disponível junto à Amersham Biosciences. Outra matriz que é útil é aquela que é fabricado usando métodos de impressão a jato de tinta, tais como a tecnologia SurePrint™ disponível junto à Agilent Technologies.
[0056] Outras matrizes úteis que podem ser usadas, por exemplo, modificando os sítios para incluir várias sequências de ácidos nucleicos moldes diferentes incluem aquelas que são usadas em aplicações de sequenciamento de ácidos nucleicos. Por exemplo, matrizes com amplicons de fragmentos genômicos (muitas vezes referidas como clusters) são particularmente úteis, como aquelas descritas em Bentley et al., Nature 456:53-59 (2008), nas Publicações PCT Nos. WO 04/018497, WO 91/06678 ou WO 07/123744; nas Patentes Norte- Americanas Nos.7,057,026, 7,329,492, 7,211,414, 7,315,019 ou 7,405,281; ou na Publicação do Pedido de Patente Norte- Americana No. 2008/0108082 A1, cada um dos quais sendo aqui incorporado a título de referência.
[0057] Clusters de ácido nucleico podem ser criados por métodos de amplificação em fase sólida. Por exemplo, um ácido nucleico com uma ou mais sequências molde a serem detectadas pode ser ligado a uma superfície e amplificado usando amplificação em ponte. Métodos de amplificação em ponte úteis são descritos, por exemplo, nas Patentes Norte- Americanas Nos. 5,641,658 ou 7,115,400; ou na Publicação do Pedido de Patente Norte-Americana Nos. 2002/0055100 A1, 2004/0096853 A1, 2004/0002090 A1, 2007/0128624 A1 ou 2008/0009420 A1, sendo cada uma delas incorporada na presente invenção por referência. Outro método útil para amplificar ácidos nucleicos em uma superfície é a amplificação por círculo rolante (RCA), por exemplo, como descrito em Lizardi et al, Nat. Genet. 19:225-232 (1998) e na Publicação do Pedido de Patente Norte-Americana No. 2007/0099208 A1, cada um dos quais sendo aqui incorporado a título de referência. Outro tipo de matriz que é útil é uma matriz de partículas produzidas a partir de uma técnica de amplificação por PCR em emulsão. Exemplos são descritos em Dressman et al., Proc. Natl. Acad. Sci. USA 100: 8817 (2003), a Publicação do Pedido PCT No. WO 05/010145, ou a Publicação do Pedido de Patente Norte-Americana No. 2005/0130173 A1 ou 2005/0064460 A1, cada um dos quais sendo incorporado na presente invenção por referência. Embora as matrizes acima tenham sido descritas no contexto das aplicações de sequenciamento, será entendido que as matrizes podem ser usadas em outras modalidades incluindo, por exemplo, aquelas que usam uma técnica de extensão de iniciador não cíclica.
[0058] A detecção pode ser realizada nos níveis de molécula em conjunto ou individuais em uma matriz. A detecção do nível em conjunto é a detecção que ocorre de uma forma que várias cópias de uma única sequência molde (por exemplo, vários amplicons de um molde) são detectados em cada sítio individual, e cópias individuais no sítio não são distinguidas umas das outras. Assim, a detecção em conjunto fornece um sinal médio para muitas cópias de uma sequência de molde particular no sítio. Por exemplo, o sítio pode conter pelo menos 10, 100, 1000 ou mais cópias de uma sequência de molde particular. Obviamente, um sítio pode conter várias sequências de molde diferentes, cada uma das quais estando presentes como um conjunto. Alternativamente, a detecção em um nível de molécula única contempla a detecção que ocorre de uma forma que sequências molde individuais são separadas individualmente na matriz, cada uma em um sítio diferente. Assim, a detecção de uma única molécula fornece um sinal de uma molécula individual que é distinto de um ou mais sinais que podem surgir de uma população de moléculas na qual a molécula individual está presente. Naturalmente, mesmo em uma matriz de molécula única, um sítio pode conter várias sequências de molde diferentes (por exemplo, duas ou mais regiões de sequência molde situadas ao longo de uma molécula de ácido nucleico única).
[0059] Uma matriz de sítios pode surgir como uma grade de pontos ou manchas. Os sítios podem estar localizados em um padrão de repetição ou em um padrão de não repetição irregular. Padrões particularmente úteis são padrões hexagonais, padrões retilíneos, padrões de grade, padrões com simetria reflexiva, padrões com simetria rotacional ou similares. Padrões assimétricos também podem ser úteis.
[0060] O tamanho dos sítios e/ou o espaçamento entre os sítios em uma matriz pode variar para atingir uma alta densidade, média densidade ou baixa densidade. Matrizes de alta densidade são caracterizadas como tendo sítios com um passo que é menor do que cerca de 15 μm. Matrizes de média densidade possuem passos que são de cerca de 15 a 30 μm, enquanto matrizes de baixa densidade têm um passo que é maior do que 30 μm. Uma matriz útil em algumas modalidades pode ter sítios com um passo que é menor do que 100 μm, 50 μm, 10 μm, 5 μm, 1 μm ou 0,5 μm. Uma modalidade dos métodos definidos na presente invenção pode ser usada para visualizar uma matriz em uma resolução suficiente para distinguir sítios nas densidades acima ou nas faixas de densidade. No entanto, a etapa de detecção normalmente usará um detector com resolução espacial que é muito baixa para separar pontos a uma distância equivalente ao espaçamento entre um primeiro molde (ou o primeiro produto de extensão do iniciador hibridizado com ele) e um segundo molde (ou segundo produto de extensão do iniciador hibridizado com ele) em um sítio individual. Em modalidades particulares, os sítios de uma matriz podem ter, cada um, uma área que é maior do que cerca de 10 0 nm2, 2 50 nm2, 50 0 nm2, 1 μm2, 2,5 μm2, 5 μm2, 10 μm2, 100 μm2 ou 500 μm2. Alternativamente ou adicionalmente, os sítios de uma matriz podem ter, cada um uma área que é menor do que cerca de 1 mm2, 50 0 μm2, 100 μm2, 2 5 μm2, 10 μm2, 5 μm2, 1 μm2, 500 nm2 ou 100 nm2. Na verdade, um sítio pode ter um tamanho que esteja em um intervalo entre um limite superior e um limite inferior selecionados dentre aqueles exemplificados acima.
[0061] Os métodos definidos na presente invenção podem usar matrizes com sítios em qualquer uma de uma variedade de densidades, incluindo, por exemplo, pelo menos cerca de 10 sítios/cm2, 100 sítios/cm2, 500 sítios/cm2, 1.000 sítios/cm2, 5.000 sítios/cm2, 10.000 sítios/cm2, 50.000 sítios/cm2, 100.000 sítios/cm2, 1.000.000 sítios/cm2, 5.000.000 sítios/cm2 ou mais.
[0062] Geralmente, uma matriz terá sítios com diferentes conteúdos de sequência de ácidos nucleicos. Por conseguinte, cada um dos sítios em uma matriz pode conter uma sequência de ácidos nucleicos que é única em comparação com as sequências de ácidos nucleicos em outros sítios na matriz. No entanto, em alguns casos, uma matriz pode ter redundância, de modo que dois ou mais sítios tenham o mesmo teor de ácido nucleico.
[0063] Será compreendido que as etapas dos métodos estabelecidos podem ser realizadas de forma a expor um sítio inteiro, ou uma pluralidade de sítios de uma matriz com o tratamento. Por exemplo, uma etapa que envolve a extensão de um iniciador pode ser realizada mediante a liberação de reagentes de extensão do iniciador a qualquer matriz, de modo que vários ácidos nucleicos (por exemplo, diferentes ácidos nucleicos em uma mistura) em cada um de um ou mais sítios da matriz estejam em contato com os reagentes de extensão do iniciador. Da mesma forma, uma etapa de desbloqueio de um produto de extensão do iniciador pode ser realizada expondo uma matriz com um tratamento de desbloqueio, de modo que vários ácidos nucleicos (por exemplo, ácidos nucleicos diferentes em uma mistura) em cada um ou mais sítios da matriz estejam em contato com o tratamento.
[0064] Em um determinado ponto em um sequenciamento por síntese, ou em outra reação de extensão de iniciador, a espécie do nucleotídeo que está presente em um primeiro molde na posição que complementa o sítio de extensão do iniciador pode ser igual à espécie de nucleotídeo que está presente em um segundo molde na posição que complementa o sítio de extensão de iniciador. Em outras palavras, o primeiro molde de ácido nucleico em um sítio específico de uma matriz pode incluir pelo menos uma porção de base, que é a mesma espécie que uma porção de base no segundo molde de ácido nucleico naquele sítio particular, e um análogo de nucleotídeo complementar pode ser adicionado a cada um dos iniciadores nas posições nos moldes onde aquelas porções de base se encontram. Este pode ser o caso ou não das sequências modelo às quais os iniciadores estão hibridizados serem iguais ou diferentes. As técnicas definidas em mais detalhes abaixo podem ser usadas para distinguir os dois moldes, por exemplo, o uso de diferentes conjuntos de análogos de nucleotídeo com marcadores mutuamente distinguíveis.
[0065] Qualquer uma de uma variedade de polimerases pode ser usada em um método ou composição definida na presente invenção, incluindo, por exemplo, enzimas à base de proteínas isoladas de sistemas biológicos e variantes funcionais dos mesmos. Referência a um polimerase particular, como aquelas exemplificadas abaixo, serão compreendidas como incluindo variantes funcionais da mesma, a menos que seja definido de outra forma. Uma função particularmente útil de uma polimerase é catalisar a polimerização de uma fita de ácido nucleico usando um ácido nucleico existente como molde. Outras funções que são úteis são descritas em outros lugares na presente invenção. Exemplos de polimerases úteis incluem DNA polimerases, transcriptases reversas e RNA polimerases.
[0066] Um polimerase com uma atividade de exonuclease de correção intrínseca de 3' a 5' pode ser útil para algumas modalidades. As polimerases que substancialmente não têm a atividade exonuclease de correção 3' a 5' também são úteis em algumas modalidades, por exemplo, na maioria das modalidades de sequenciamento. A ausência de atividade exonuclease pode ser uma característica tipo selvagem ou uma característica transmitida por uma variante ou estrutura de polimerase manipulada. Por exemplo, o fragmento Klenow exo minus é uma versão mutante do fragmento Klenow que não tem a atividade exonuclease de correção 3' a 5'.
[0067] Dependendo da modalidade que deve ser usada, uma polimerase pode ser termofílica ou termoinativável. As polimerases termofílicas são geralmente úteis para condições de alta temperatura ou em condições de termociclagem, tais como aquelas empregadas para as técnicas de reação em cadeia da polimerase (PCR). Exemplos de polimerases termofílicas incluem, mas não se limitam, à 9°N DNA polimerase, Taq DNA polimerase, Phusion® DNA polimerase, Pfu DNA polimerase, RB69 DNA polimerase, KOD DNA polimerase e VentR® DNA polimerase. A maioria das polimerases isoladas de organismos não termofílicos são termoinativáveis. São exemplos as DNA polimerases do fago. Deve ser compreendido que as polimerases de qualquer uma de uma variedade de fontes podem ser modificadas para aumentar ou diminuir a sua tolerância a condições de altas temperaturas. Polimerases particularmente úteis para incorporar os análogos de nucleotídeo com marcadores e/ou porções de terminação reversíveis são descritas no documento US 2006/0281109 A1, que está incorporado na presente invenção por referência.
[0068] Em modalidades particulares dos métodos e das composições definidas na presente invenção, apenas uma única espécie de polimerase será usada. Em tais exemplos, cada sítio de uma matriz irá interagir com apenas uma espécie de polimerase em determinado momento, apesar de que várias polimerases podem estar presentes no sítio e ligadas a vários moldes primados em cada sítio. Por exemplo, todos os sites de uma matriz podem interagir com uma espécie particular de DNA polimerase e outras polimerases (tais como RNA polimerases) estarão ausentes da matriz.
[0069] Outra técnica de extensão que pode ser modificada para uso em um método ou composição aqui estabelecido é um sistema à base de ligase que é seletivo para incorporação de oligonucleotídeos em vez de nucleotídeos monoméricos que são incorporados com os sistemas de extensão à base de polimerase descritos acima. Um sistema de reagente de DNA ligase que usa um primeiro conjunto de oligonucleotídeos, tendo uma porção de bloqueio reversível que é seletivamente desbloqueada por um primeiro tratamento de desbloqueio é ortogonal com um sistema reagente que usa um segundo conjunto de oligonucleotídeos tendo uma porção de bloqueio reversível que é seletivamente desbloqueada por um segundo tratamento de desbloqueio. O desbloqueio de iniciadores estendidos com oligonucleotídeos reversivelmente bloqueados pode ser realizado de forma ortogonal, como exemplificado aqui para o desbloqueio de iniciadores estendidos com os análogos de nucleotídeo reversivelmente bloqueados. A extensão pela ligação pode ser feita em um aplicativo de sequenciamento usando uma população de oligonucleotídeos de sonda parcialmente aleatória, tendo um esquema que codifica uma ou duas bases. As técnicas de extensão baseadas em ligação que podem ser modificadas para uso na presente invenção, como no contexto de sequenciamento, estão estabelecidas em McKernan et al., Genome Research 19 (9): 1527-41 (2009); Shendure et al., Science 309:1728-1732 (2005); ou nas Patentes Norte-Americanas Nos. 5,599,675 ou 5,750,341, sendo cada uma das quais incorporada na presente invenção por referência.
[0070] Uma reação de extensão de ácido nucleico, ou outra reação cíclica, que é realizada usando métodos definidos na presente invenção, pode ocorrer durante um ou mais ciclos. Em modalidades particulares, uma reação de múltiplos ciclos pode incluir pelo menos 2 ciclos, 5 ciclos, 10 ciclos, 50 ciclos, 100 ciclos, 500 ciclos, 1.000 ciclos, 5.000 ciclos, 10.000 ciclos ou mais. Alternativamente ou adicionalmente, uma reação pode ter um limite superior por meio do que não mais de 1 ciclo, 2 ciclos, 5 ciclos, 10 ciclos, 50 ciclos, 100 ciclos, 500 ciclos, 1.000 ciclos, 5.000 ciclos ou 10.000 ciclos ocorrem. Em algumas modalidades, cada ciclo resultará na incorporação de um único análogo de nucleotídeo em um iniciador estendido. Nesse caso, o número mínimo ou máximo de ciclos exemplificado acima pode ser entendido para exemplificar o número mínimo ou máximo de nucleotídeos incorporado em um produto de extensão em uma reação catalisada pela polimerase.
[0071] Algumas modalidades podem usar reações de extensão não cíclicas, como uma extensão de base única (SBE) ou reações de extensão de iniciador específico de alelo (ASPE). As porções terminadoras reversíveis podem ser usadas para alcançar a extensão ortogonal de dois iniciadores diferentes em um formato de extensão não cíclico. Uma vez que a etapa de desbloqueio não é necessária para continuar essas reações não cíclicas (ou seja, uma vez que os iniciadores foram estendidos), os análogos de nucleotídeo usados na etapa de extensão podem ser terminados de forma não reversível. Por exemplo, didesoxinucleotídeos podem ser usados. Reagentes exemplares e técnicas relacionadas para SBE, ASPE e outras técnicas de extensão não cíclica úteis são descritas, por exemplo, na Patente Norte-Americana No. 7,670,810 ou nas Publicações do Pedido de Patente Norte- Americana Nos. 2003/0108867; 2003/0108900; 2003/0170684; 2003/0207295; ou 2005/0181394, sendo cada um deles incorporado na presente invenção por referência. Um exemplo de um produto comercialmente disponível que usa uma técnica de extensão não cíclica e que pode ser modificado para aumentar o conteúdo de informação por meio dos métodos de detecção ortogonais aqui estabelecidos é o produto de genotipagem Infinium®, disponível junto à Illumina, Inc. (São Diego, CA).
[0072] As reações cíclicas e não cíclicas, da mesma forma, podem incluir etapas onde os componentes reacionais são separados entre si ou removidos do ambiente reacional. Um ou mais componentes reacionais podem ser separados, por exemplo, pela separação dos componentes da fase sólida dos componentes da fase líquida. Etapas de lavagem podem ser opcionalmente incluídas para remover, mais completamente, o(s) componente(s) de fase líquida indesejáveis do(s) componente(s) de fase sólida. Um recipiente reacional particularmente útil para tais separações é uma célula de fluxo como aquelas comumente utilizadas nos procedimentos de sequenciamento cíclico. As células de fluxo exemplares, métodos para a sua fabricação e métodos para o seu uso são descritos nas Publicações de Pedido de Patente Norte- Americana Nos. 2010/0111768 A1 ou 2012/0270305 A1; ou na Publicação do Pedido PCT No. WO 05/065814, cada um dos quais sendo incorporado na presente invenção por referência. Sejam métodos de separação em fase sólida utilizados ou não, os componentes reacionais podem ser removidos por qualquer uma de várias outras técnicas conhecidas na arte, incluindo a extração líquido-líquido, extração em fase sólida, cromatografia, filtração, centrifugação ou similares.
[0073] As porções terminadoras reversíveis fornecem uma maneira conveniente de controlar uma reação de extensão para adicionar apenas um único nucleotídeo a um iniciador até uma etapa de desbloqueio subsequente ser realizada. Conforme definido na presente invenção, o uso de porções de bloqueio ortogonais e os tratamentos de desbloqueio proporcionam detecção de super-resolução, por meio da qual uma maior complexidade dos moldes pode ser monitorada e detectada do que seria, caso uma técnica não ortogonal fosse utilizada. Exemplos de porções de bloqueio reversíveis e de suas condições de desbloqueio incluem, mas não se limitam, às porções que podem ser removidas por fotoclivagem da posição 3', tais como o-nitrobenziléteres e carbonato de alquil-o-nitrobenzila; porções éster que podem ser removidas pela hidrólise de base; porções alila que podem ser removidas com NaI, clorotrimetilsilano e Na2S2O3, ou com Hg(II) em acetona/água; -azidometil(-CH2-N3), que pode ser clivado com fosfinas, tais como tris(2-carboxietil)fosfina (TCEP) ou tri(hidroxipropil)fosfina (THP); acetais, tais como terc- butoxietóxi, que pode ser clivado com condições ácidas; porções MOM (—CH2OCH3) que podem ser clivadas com LiBF4 e CH3CN/H2O; 2,4-dinitrobenzenossulfenila, que pode ser clivada com nucleófilos, como o tiofenol e tiossulfato; éter tetra-hidrofuranílico, que pode ser clivado com Ag(I) ou Hg(II); e 3' fosfato, que pode ser clivado pelas enzimas fosfatase (por exemplo, polinucleotídeo quinase). Outras porções reversíveis úteis incluem éteres, -F, -NH2, -OCH3, - N3, -NHCOCH3 e carbonato de 2-nitrobenzeno. Tratamentos de desbloqueio úteis incluem irradiação com luz (por exemplo, para induzir a fotoclivagem), aquecimento, exposição a reagentes químicos, exposição a catalisadores, exposição à corrente elétrica (por exemplo, para induzir a eletrólise) ou similares.
[0074] As modalidades particulares dos métodos da presente invenção aqui podem empregar iniciadores reversivelmente bloqueados e análogos de nucleotídeo reversivelmente bloqueados, por exemplo, em um processo de múltiplos ciclos, como por sequenciamento por síntese. Tal como foi exemplificado anteriormente na presente invenção, um iniciador reversivelmente bloqueado particular e um conjunto específico de análogos de nucleotídeo reversivelmente bloqueados pode ser suscetível às mesmas condições de desbloqueio. Isso pode ser devido à mesma espécie de porção de bloqueio reversível presente no iniciador e nos análogos de nucleotídeo no conjunto. No entanto, também é possível usar diferentes porções de bloqueio que, no entanto, são suscetíveis ao mesmo tratamento de desbloqueio.
[0075] Uma porção de bloqueio reversível pode ser ligada ao nucleotídeo 3' de um iniciador. Geralmente, a porção de bloqueio reversível é ligada na posição 3' da porção do açúcar ribose. No entanto, uma porção de bloqueio pode ser ligada, em vez disso, a posições alternativas, incluindo, por exemplo, na posição 2' da ribose ou sobre na porção de base. Uma porção de bloqueio também pode ser ligada na extremidade 5' de um iniciador, por exemplo, na posição 5' da ribose do nucleotídeo terminal ou na porção de fosfato 5'. Os iniciadores que são bloqueados na extremidade 5' podem ser úteis para as modalidades que empregam técnicas de ligação.
[0076] A extremidade 3' ou 5' de um iniciador pode ser ligada a uma porção de marcador, como a um marcador óptico. O marcador pode estar presente, independente do fato de uma porção de bloqueio reversível estar presente ou não no iniciador. Em alguns casos, uma porção particular pode funcionar como um marcador e como um bloco reversível para a extensão do iniciador.
[0077] Os mesmos pontos de ligação para um marcador e/ou uma porção de bloqueio reversível que são exemplificados acima para os iniciadores podem ser úteis para os nucleotídeos individuais.
[0078] Orientações adicionais exemplares sobre as porções de bloqueio e os tratamentos de desbloqueio são descritas, por exemplo, em Bentley et al., Nature 456:53-59 (2008), as Publicações dos Pedidos PCT Nos. WO 04/018497, WO 91/06678 ou WO 07/123744; nas Patentes Norte-Americanas Nos. 7,057,026, 7,329,492, 7,211,414, 7,315,019, 8,088,575 ou 7,405,281; ou a Publicação do Pedido de Patente Norte- Americana No. 2008/0108082 A1, cada um dos quais sendo aqui incorporado a título de referência.
[0079] A manipulação ortogonal e a detecção de acordo com a presente divulgação não exige que duas sequências molde sejam diferentes em cada posição ao longo de seu comprimento. Pelo contrário, a mesma porção de base pode estar presente em posições que são detectadas em um primeiro molde e em um segundo molde, respectivamente. As duas posições podem ser distinguidas com base nas características distinguíveis dos marcadores presentes nos sistemas de reagente ortogonais e na especificidade dos sistemas de reagentes para estender o iniciador adequadamente desbloqueado. Essa informação pode, por sua vez, ser usada para detectar distintamente as duas sequências alvo diferentes, mesmo se as duas posições forem detectadas simultaneamente utilizando um detector com uma resolução que é muito baixa para separar pontos a uma distância equivalente para o espaçamento das duas sequências moldes.
[0080] Qualquer um de uma variedade de rótulos pode ser usado. Uma porção de marcador que é particularmente útil quando usada para a detecção de um análogo de nucleotídeo pode ser qualquer parte do análogo de nucleotídeo que fornece uma característica distinguível quando comparado com outras moléculas presentes no seu ambiente. A característica distinguível pode ser, por exemplo, um sinal óptico como a absorção de radiação, emissão de fluorescência, emissão de luminescência, tempo de vida de fluorescência, polarização de fluorescência ou similares; a afinidade de ligação por um ligante ou receptor; propriedades magnéticas; propriedades elétricas; carga; massa; radioatividade ou similares. As porções de marcadores exemplares incluem, sem limitação, um fluoróforo, luminóforo, cromóforo, isótopo radioativo, marcador de massa, marcador de carga, marcador de spin, receptor, ligante ou similares. A porção do marcador pode ser parte de um nucleotídeo que é uma unidade monomérica presente em um polímero de ácido nucleico ou a porção do marcador pode ser parte de um análogo de nucleotídeo livre (por exemplo, um trifosfato de nucleotídeo).
[0081] Os fluoróforos são particularmente úteis e incluem, por exemplo, nanocristais fluorescentes; pontos quânticos, fluoresceína, rodamina, tetrametilrodamina, eosina, eritrosina, cumarina, metilcumarinas, pireno, verde malacita, Cy3, Cy5, estilbeno, amarelo lúcifer, azul cascata, vermelho Texas, corantes Alexa, corantes SETA, corantes Atto, ficoeritrina, boro-dipirrometeno e seus análogos. Sondas ópticas úteis são descritas em Lakowicz, Principles of Fluorescence Spectroscopy, 3a edição. Springer (2006); Haugland, Handbook of Fluorescent Probes and Research Products 9a edição, Molecular Probes, Inc, (2002); Shapiro, Practical Flow Cytometry, 4a edição, John Wiley & Sons (2003); Publicações do Pedido de Patente PCT Nos. WO 98/59066 ou WO 91/06678; ou a Publicação do Pedido de Patente Norte-Americana No. 2010/0092957 A1, cada um dos quais sendo aqui incorporado a título de referência.
[0082] Outros marcadores, alguns dos quais são marcadores não ópticos, podem ser usados em várias modalidades dos métodos e composições estabelecidos na presente invenção. Exemplos incluem, sem limitação, um marcador isotópico, como um isótopo radioativo ou pesado naturalmente não abundante; uma substância magnética; um material rico em elétrons, tal como um metal; um marcador eletroquimiluminescente, como Ru(bpy)32+; ou uma porção que pode ser detectada com base em uma característica magnética nuclear, paramagnética, elétrica, de carga/massa ou térmica. Os marcadores também podem incluir partículas magnéticas ou nanopartículas opticamente codificadas. Tais marcadores podem ser detectados utilizando métodos adequados conhecidos pelas pessoas versadas na técnica. Por exemplo, um marcador carregado pode ser detectado usando um detector elétrico, tais como aqueles usados nos sistemas de sequenciamento comercialmente disponíveis da Ion Torrent (Guilford, CT, uma subsidiária da Life Technologies) ou os sistemas de detecção descritos nas Publicações dos Pedidos de Patente Norte- Americanas Nos. 2009/0026082 A1; 2009/0127589 A1; 2010/0137143 A1; ou 2010/0282617 A1, sendo cada um deles incorporado na presente invenção por referência. Será compreendido que, para algumas modalidades, um análogo de nucleotídeo pode ser desprovido de um ou mais dos marcadores definidos na presente invenção.
[0083] Uma porção marcadora pode ser ligada a um análogo de nucleotídeo de várias maneiras. As ligações exemplares e as composições de marcador que são úteis para os análogos de nucleotídeo são definidas em Bentley et al., Nature 456: 53-59 (2008), nas Publicações dos Pedidos PCT Nos. WO 04/018497, WO 91/06678 ou WO 07/123744; nas Patentes Norte-Americanas Nos. 7,057,026, 7,329,492, 7,211,414, 7,315,019, 8,088,575 ou 7,405,281; ou a Publicação do Pedido de Patente Norte-Americana No. 2008/0108082 A1, cada um dos quais sendo aqui incorporado a título de referência.
[0084] Uma etapa de detecção de um método definido na presente invenção pode ser realizada em um método da presente divulgação usando um aparelho adequado para o marcador particular em uso. Por exemplo, um detector óptico, como um detector de fluorescência, detector de absorbância, detector de luminescência ou similares pode ser usado para detectar marcadores ópticos adequados. Sistemas concebidos para a detecção baseada em matriz são particularmente úteis. Por exemplo, os sistemas ópticos para uso com os métodos definidos na presente invenção podem ser construídos para incluir vários componentes e montagens, conforme é descrito nas Patentes Norte-Americanas Nos. 8,241,573; 7,329,860 ou 8,039,817; ou nas Publicações dos Pedidos de Patentes Norte- Americanas Nos. 2009/0272914 A1 ou 2012/0270305 A1, cada um dos quais sendo incorporado na presente invenção por referência.
[0085] Um sistema de detecção ortogonal, tal como um sistema utilizado para o sequenciamento por síntese, pode usar diferentes marcadores para distinguir diferentes nucleotídeos que são adicionados a cada iniciador. Em uma modalidade, cada espécie de nucleotídeo terá um marcador óptico único que produz um sinal único para distinguir aquela espécie de nucleotídeo. Um exemplo é uma abordagem de 8 corantes. Nesse exemplo, um primeiro conjunto de 4 análogos de nucleotídeo diferentes tem, cada um, corantes fluorescentes diferentes que distinguem cada um dos 4 análogos de nucleotídeos diferentes entre si, em que os 4 nucleotídeos diferentes no primeiro conjunto têm porções de bloqueio que podem ser seletivamente desbloqueadas por um primeiro tratamento. Um segundo conjunto de 4 análogos de nucleotídeo diferentes tem, cada um, corantes fluorescentes diferentes que distinguem cada um dos 4 análogos de nucleotídeos diferentes entre si, em que os 4 nucleotídeos diferentes no segundo conjunto têm porções de bloqueio que podem ser seletivamente desbloqueadas por um segundo tratamento. Nesse caso, o primeiro tratamento é seletivo para as porções de bloqueio no primeiro conjunto de nucleotídeos, e o segundo tratamento é seletivo para as porções de bloqueio partes no segundo conjunto de nucleotídeos. Os dois conjuntos de corantes são únicos, de modo que os 8 corantes produzem 8 sinais distinguíveis, respectivamente.
[0086] Nas modalidades onde todos os análogos de nucleotídeo são distintamente marcados, tal como a abordagem de 8 corantes acima descrita, um par de sequências molde pode entrar em contato com todos os análogos de nucleotídeo e, em seguida, a detecção de pode ser realizada depois disso. Aqui, a capacidade de distinguir todos os análogos de nucleotídeo devido aos marcadores ópticos exclusivos fornece o benefício de manipulações fluídicas relativamente simples, em que todos os análogos de nucleotídeo podem ser fornecidos às sequências molde, de modo que estejam simultaneamente presentes. Em uma modalidade personificação relativamente simples e preferencial, todos os 8 análogos de nucleotídeo são administrados simultaneamente; no entanto, um ou mais subconjuntos podem ser administrados em sequência, se for desejado. A detecção pode ocorrer durante ou após a liberação do análogo de nucleotídeo. Esse processo fluídico relativamente simples é acomodado por um dispositivo de detecção relativamente complexo tendo a capacidade de distinguir todos os sinais diferentes. Por exemplo, um sistema de detecção de fluorescência capaz de distinguir os 8 sinais fluorescentes diferentes pode ser usado para a abordagem de 8 corantes. As pessoas versadas na técnica saberão ou serão capazes de determinar um aparelho de detecção fluorescente adequado para conseguir esse tipo de diferenciação de sinal. Por exemplo, as propriedades de excitação e emissão dos marcadores fluorescentes podem ser adequadamente correspondidas com uma combinação de comprimentos de onda de excitação produzidos e com os comprimentos de onda de emissão detectados por um fluorômetro. Guias exemplares para ópticos e marcadores úteis na detecção de fluorescência de múltiplos comprimentos de onda são fornecidos em Lakowicz, Principles of Fluorescence Spectroscopy, 3a edição, Springer (2006); Haugland, Handbook of Fluorescent Probes and Research Products 9a edição, Molecular Probes, Inc, (2002); e Shapiro, Practical Flow Cytometry, 4a edição, John Wiley & Sons (2003), sendo cada um deles incorporado na presente invenção por referência.
[0087] Os princípios exemplificados acima para um sistema em que todos os nucleotídeos são distintamente marcados podem ser facilmente extrapolados para um formato de matriz. Espera-se que uma matriz com um número e variedade suficiente de sequências moldes diferentes incorpore todos os nucleotídeos marcados quando é tratada com sistemas de reação de extensão de iniciador. Mais especificamente, em uma abordagem baseada em matriz, com uma grande variedade de ácidos nucleicos através dos sítios da matriz e com dois moldes diferentes por sítio, todas as possíveis combinações de 2 em 2 corantes deverão ocorrer na matriz após um ciclo de extensão de iniciador, em que todos os 8 nucleotídeos foram liberados para a matriz. Os sítios podem ser espacialmente distinguidos usando dispositivos ópticos conhecidos na técnica, por exemplo, aqueles descritos nas Patentes Norte-Americanas Nos. 8,241,573; 7,329,860 ou 8,039,817; ou nas Publicações dos Pedidos de Patentes Norte-Americanas Nos. 2009/0272914 A1 ou 2012/0270305 A1, cada um dos quais sendo incorporado na presente invenção por referência. Tais sistemas de detecção podem ser facilmente modificados para acomodar a detecção fluorescente de 8 cores, conforme é estabelecido acima. Um sistema de detecção que é modificado dessa forma será capaz de realizar a detecção ortogonal multiplex, de modo que dois moldes diferentes sejam distinguidos (por exemplo, através do sequenciamento) em vários sítios, com cada um tendo uma composição de sequência diferente.
[0088] Em algumas modalidades, o número de diferentes sinais que são distinguidos em um método específico é menor do que o número de espécies de análogos de nucleotídeo diferentes usados nesse método. Por exemplo, várias espécies de análogos de nucleotídeos diferentes podem ter o mesmo marcador e/ou um subconjunto das espécies de nucleotídeos pode não ser marcado. Um exemplo de uma configuração que usa o mesmo marcador para várias espécies de nucleotídeos diferentes é o caso de um método de extensão de iniciador ortogonal, onde um primeiro conjunto de 4 análogos de nucleotídeos diferentes compartilham um primeiro marcador em comum, e são suscetíveis a um primeiro tratamento de desbloqueio seletivo, enquanto que um segundo conjunto de 4 análogos de nucleotídeos diferentes compartilham um segundo marcador em comum e são suscetíveis a um segundo tratamento de desbloqueio. Nesse exemplo, o primeiro marcador é opticamente distinguível do segundo marcador, sendo o primeiro tratamento seletivo para o primeiro conjunto de análogos de nucleotídeo e o segundo tratamento sendo seletivo para o segundo conjunto de análogos de nucleotídeo. Nessa configuração, os 4 nucleotídeos diferentes no primeiro conjunto podem ser distinguidos uns dos outros por ciclos sequenciais de liberação e a detecção (ou seja, um ciclo separado para cada um dos análogos de nucleotídeo diferentes). Contanto que o primeiro marcador e o segundo marcador, neste exemplo, sejam distinguíveis, os membros dos conjuntos de nucleotídeos reboques podem ser liberados em pares (1 de cada espécie de nucleotídeo única do primeiro conjunto e uma espécie de nucleotídeo única do segundo conjunto), em 4 ciclos de liberação e detecção. Assim, membros de um primeiro conjunto de análogos de nucleotídeo usados em uma reação de extensão de iniciador podem incluir somente um tipo de marcador óptico que foi detectado, e um segundo conjunto de análogos de nucleotídeo, que é ortogonal ao primeiro conjunto, também podem incluir somente um tipo de marcador óptico que é detectado, no qual o marcador usado no primeiro conjunto é opticamente distinguível do marcador utilizado no segundo conjunto.
[0089] A escala de cinza permite a utilização de múltiplas espécies de análogo de nucleotídeo diferentes que possuem o mesmo marcador. Aqui, diferentes espécies de análogo de nucleotídeo podem ser distinguidas com base na intensidade do sinal do marcador detectado. Por exemplo, cada espécie de análogo de nucleotídeo pode ser liberada como uma mistura exclusivamente proporcionada daquela espécie na forma marcada e não marcada. A variação na razão de análogos de nucleotídeo marcados:não marcados para cada espécie resultará em um sinal de saída único de escala de cinza para cada mistura. A título de um exemplo mais específico, um primeiro análogo de nucleotídeo pode ser totalmente marcado (sem mistura do primeiro análogo de nucleotídeo marcado e não marcado), um segundo análogo de nucleotídeo pode ser 75% marcado (uma mistura do segundo análogo de nucleotídeo 75% marcado e 25% não marcado), um terço análogo de nucleotídeo pode ser 50% marcado (uma mistura do terceiro análogo de nucleotídeo 50% marcado e 50% não marcado) e um quarto análogo de nucleotídeo pode ser 25% marcado (uma mistura do quarto análogo de nucleotídeo 25% marcado e 75% não marcado). Essas 4 espécies de análogos de nucleotídeo podem ser distinguidas com base nas diferenças resultantes de intensidade do sinal, por meio do que uma população de iniciadores apropriadamente desbloqueados (por exemplo, em um sítio de matriz) irá produzir um sinal cheio devido à incorporação do primeiro análogo de nucleotídeo; 75% de sinal devido à incorporação do segundo análogo de nucleotídeo, 50% de sinal devido à incorporação do terceiro análogo de nucleotídeo e 25% de sinal devido à incorporação do quarto análogo de nucleotídeo.
[0090] Em modalidades particulares, pelo menos uma das espécies de análogos de nucleotídeo pode ser inteiramente não marcada. Assim, em um caso onde os marcadores ópticos estão presentes nos outros análogos de nucleotídeo em um conjunto de análogos de nucleotídeos, pode haver também um análogo de nucleotídeo “escuro”. A extensão de um iniciador para incorporar um análogo de nucleotídeo escuro ou, de outro modo, não marcado, pode ser determinada por inferência com base na ausência de um marcador que seria esperado se os outros análogos de nucleotídeo no conjunto tivessem que ser incorporados pela reação de extensão. Assim, em algumas modalidades, apenas um subconjunto de análogos de nucleotídeo usados em uma reação de extensão de iniciador definida na presente invenção precisa ter um marcador.
[0091] O uso de espécies análogas de nucleotídeo não marcadas pode ser combinado com a escala de cinza. Por exemplo, três das quatro espécies análogas de nucleotídeo em um conjunto (ou seja, um conjunto que pode ser desbloqueado por um tratamento comum) pode ter quantidades diferentes de zero distinguíveis de um marcador particular (por exemplo, razões de análogos de nucleotídeo marcados e não marcados em uma mistura) e a quarta espécie análoga de nucleotídeo pode não ter esse marcador. Alternativamente ou adicionalmente, a escala de cinza pode ser combinada com o uso de vários marcadores opticamente distinguíveis. Por exemplo, algumas das espécies análogas de nucleotídeo podem ser representadas em uma reação de extensão como uma mistura de nucleotídeos do mesmo tipo, porém com diferentes marcadores. Essa configuração é exemplificada na Publicação do Pedido de Patente Norte-Americana No. 2013/0079232 A1 ou 2015/0031560 A1, cada um dos quais sendo incorporado na presente invenção por referência.
[0092] Alternativamente ou adicionalmente ao uso de múltiplos marcadores diferentes, escala de cinza e/ou espécies não marcadas, uma modalidade definida na presente invenção pode usar um análogo de nucleotídeo com um ligante, ligante clivável ou outra porção que prevê ganho ou perda de um marcador devido a um tratamento definido. Sistemas de reagente deste tipo são ilustrados nas Publicações dos Pedidos de Patente Norte-Americanas Nos. 2013/0079232 A1 ou 2015/0031560 A1, onde algumas espécies análogas de nucleotídeo têm um ligante tal que eles podem ser distinguidos de outros análogos de nucleotídeos com base na ausência inicial de um sinal detectável seguido pela aparição de um sinal após o tratamento com um receptor devidamente marcado. Essas referências também ilustram o uso de um análogo de nucleotídeo que pode ser distinguido com base em um sinal detectável inicial que é subsequentemente perdido, ou pelo menos reduzido, devido ao tratamento com um reagente que modifica o marcador (por exemplo, através de clivagem química de um ligante entre as porções de marcador e nucleotídeo). Nesse caso, as outras espécies análogas de nucleotídeo no conjunto não são suscetíveis à modificação (por exemplo, falta do ligante clivável) e são distinguidas com base na persistência da geração de sinal após o tratamento.
[0093] Como exemplificado acima, em algumas modalidades, um marcador pode ser ligado a um análogo de nucleotídeo por meio de um ligante clivável. Em modalidades particulares, os ligantes fotocliváveis podem ser usados no lugar do ligante quimicamente clivável exemplificado acima. Em algumas modalidades, o ligante é selecionado dentre ligantes ácido lábeis (incluindo ligantes de dialcoxibenzaila, ligantes Sieber, ligantes indol, ligantes Sieber de t-butila), ligantes eletrofilicamente cliváveis, ligantes nucleofilicamente cliváveis, ligantes fotocliváveis, ligantes que são clivados sob condições redutoras ou condições oxidativas, ligantes tipo trava de segurança (safety-catch linkers) e ligantes que são clivados por mecanismos de eliminação. Em algumas dessas modalidades, o ligante é selecionado de um ligante de dissulfeto (-S-S-), um éster, nitrobenzeno, imina e um polinucleotídeo, como o DNA, e um peptídeo enzimaticamente ou quimicamente clivável.
[0094] Em algumas modalidades, membros de um primeiro conjunto de análogos de nucleotídeo (por exemplo, análogos de nucleotídeo que são seletivamente desbloqueados por um primeiro tratamento comum) usados em uma reação de extensão de iniciador, incluirão apenas um tipo de marcador óptico que é detectado e um segundo conjunto de análogos de nucleotídeo (por exemplo, análogos de nucleotídeo que são seletivamente desbloqueados por um segundo tratamento comum), que é ortogonal ao primeiro conjunto também incluirá apenas um tipo marcador óptico que é detectado, no qual o marcador usado no primeiro conjunto é opticamente distinguível do marcador usado no segundo conjunto. Nessa modalidade, o um tipo de marcador óptico pode ser ligado a substancialmente todos os análogos de nucleotídeo de uma primeira espécie no primeiro conjunto, o um tipo de marcador óptico pode ser ligado a um subconjunto dos análogos de nucleotídeo de uma segunda espécie no primeiro conjunto, substancialmente todos os análogos de nucleotídeo de uma terceira espécie no primeiro conjunto podem ser ligado a um ligante, e substancialmente todos os análogos de nucleotídeo de uma quarta espécie no primeiro conjunto não são ligáveis nem a um tipo de marcador óptico e nem ao ligante.
[0095] Em outra modalidade, membros de um primeiro conjunto de análogos de nucleotídeo (por exemplo, análogos de nucleotídeo que são seletivamente desbloqueados por um primeiro tratamento comum) usados em uma reação de extensão de iniciador, incluirão apenas dois tipos de marcadores ópticos que são detectados e um segundo conjunto de análogos de nucleotídeo (por exemplo, análogos de nucleotídeo que são seletivamente desbloqueados por um segundo tratamento comum), que é ortogonal ao primeiro conjunto também incluindo apenas dois tipos de marcadores ópticos que são detectados. Nessa modalidade, um primeiro dos dois tipos de marcadores ópticos pode ser ligado a substancialmente todos os análogos de nucleotídeo de uma espécie no primeiro conjunto, um segundo dos dois tipos de marcadores ópticos pode ser ligado a substancialmente todos os análogos de nucleotídeo de uma segunda espécie no primeiro conjunto, o primeiro dos dois tipos de marcadores ópticos e o segundo dos dois tipos de marcadores ópticos podendo ser ligados a análogos de nucleotídeos de uma terceira espécie no primeiro conjunto, e substancialmente todos os análogos de nucleotídeo de uma quarta espécie no primeiro conjunto não estão ligados a um dos dois tipos de marcadores ópticos ou o segundo dos dois tipos de marcadores ópticos.
[0096] Será compreendido, a partir dos exemplos acima, que a redução do número de diferentes marcadores em um sistema de detecção ortogonal pode fornecer a vantagem de reduzir a complexidade do dispositivo detecção necessário para distinguir a adição de diferentes nucleotídeos a um iniciador ligado a molde. No entanto, em muitas modalidades, isto é alcançado através do aumento da complexidade das etapas fluídicas, de modo que o número de manipulações fluídicas usado durante as etapas de detecção é aumentado em comparação com as etapas fluídicas usadas quando cada uma das espécies de nucleotídeo tem um único marcador. Uma vantagem geral dos presentes métodos é que uma pessoa versada na técnica pode selecionar uma combinação apropriada de marcadores, etapas fluídicas e dispositivos de detecção para atender a uma aplicação ou circunstância específica.
[0097] Tal como é exemplificado pelas modalidades acima definidas, em alguns casos, dois ou mais iniciadores que são hibridizados a dois ou mais moldes de ácidos nucleicos diferentes, em um sítio, podem estar simultaneamente presentes durante uma etapa de extensão de iniciador. Alternativamente, um primeiro dos dois iniciadores que são hibridizados para dois ou mais moldes diferentes em um sítio pode ser removido do sítio antes de estender um segundo dos dois ou mais iniciadores que são hibridizados aos dois ou mais moldes diferentes no sítio.
[0098] Além disso, dois ou mais produtos de extensão de iniciador diferentes que resultam das etapas acima podem estar simultaneamente presentes em um sítio durante uma etapa de detecção. Alternativamente, um primeiro de dois ou mais produtos de extensão de iniciador diferentes pode ser removido de um sítio antes da detecção de um segundo dos dois ou mais produtos de extensão de iniciador diferentes no sítio.
[0099] Além disso, dois ou mais produtos de extensão de iniciador, cada um com diferentes porções de bloqueio reversíveis, podem estar simultaneamente presentes durante uma etapa de desbloqueio. A etapa de desbloqueio pode ser configurada para remover (ou modificar) seletivamente um ou apenas um subconjunto de diferentes porções de bloqueio reversíveis, de modo que pelo menos uma outra porção de bloqueio reversível seja retida (ou não modificada) após o tratamento. Alternativamente, as porções de bloqueio reversíveis diferentes que estão simultaneamente presentes podem ser todas removidas, por exemplo, usando uma combinação de tratamentos de desbloqueio ou um tratamento de desbloqueio universal. Como uma alternativa adicional, um primeiro de dois ou mais produtos de extensão de iniciador diferentes pode ser removido de um sítio antes de submeter um segundo dos dois ou mais produtos de extensão de iniciador com um tratamento de desbloqueio.
[0100] A presente divulgação fornece misturas reacionais (também referidas como sistemas de reagente) que incluem várias combinações de componentes. Em vários casos, os componentes reacionais e várias combinações dos componentes são descritos no contexto dos métodos exemplares, tais como aqueles estabelecidos nos parágrafos anteriores. Será compreendido que as misturas reacionais e os seus componentes não precisam ser limitados ao uso nos métodos aqui exemplificados. Outros usos são igualmente contemplados. Por conseguinte, os componentes podem ser montados em uma variedade de combinações úteis, por exemplo, para criar kits. Os kits podem ser úteis para armazenar, transportar ou efetuar a transação comercial dos componentes estabelecidos na presente invenção. Os kits podem opcionalmente incluir instruções para realizar um ou mais dos métodos estabelecidos na presente invenção.
[0101] Em modalidades particulares, essa divulgação fornece um método para o sequenciamento de moldes de ácido nucleico que podem incluir as etapas de (a) fornecer um conjunto de sítios, em que cada sítio inclui um primeiro molde de ácido nucleico e um segundo molde de ácido nucleico, em que o primeiro molde de ácido nucleico tem uma sequência que é diferente da sequência do segundo molde de ácido nucleico, em que um primeiro molde está ligado ao primeiro molde de ácido nucleico, uma porção de bloqueio reversível sendo ligada ao primeiro molde, em que um segundo molde está ligado ao segundo molde de ácido nucleico, estando uma porção de bloqueio reversível ligada ao segundo iniciador, e em que a porção de bloqueio reversível que está ligada ao primeiro iniciador é diferente da porção de bloqueio reversível que está ligada ao segundo iniciador; (b) remover seletivamente a porção de bloqueio reversível que está ligada ao primeiro polímero retendo, ao mesmo tempo, a porção de bloqueio reversível que está ligada ao segundo iniciador; (c) estender o primeiro iniciador pela adição de um primeiro análogo de nucleotídeo que é ligado a uma porção de bloqueio reversível; (d) remover seletivamente a porção de bloqueio reversível que está ligada ao segundo iniciador, retendo, ao mesmo tempo, a porção de bloqueio reversível que está ligada ao análogo de nucleotídeo que é adicionado ao primeiro iniciador; (e) estender o segundo iniciador pela adição de um segundo análogo de nucleotídeo que está ligado a uma porção de bloqueio reversível, em que a porção de bloqueio reversível que está ligada ao primeiro análogo de nucleotídeo é diferente da porção de bloqueio reversível que está ligada ao segundo análogo de nucleotídeo; e (f) detectar o análogo de nucleotídeo que é adicionado ao primeiro iniciador e o análogo de nucleotídeo que é adicionado ao segundo iniciador, em cada um dos sítios, determinando assim as diferentes sequências do primeiro molde e o segundo molde em cada um dos sítios.
[0102] Em algumas modalidades, o método acima pode compreender ainda as etapas de (g) remover seletivamente a porção de bloqueio reversível que está ligada ao primeiro análogo de nucleotídeo que é adicionado ao primeiro iniciador e reter, concomitantemente, a porção de bloqueio reversível que está ligada ao segundo análogo de nucleotídeo que é adicionado ao segundo iniciador; (h) estender o primeiro iniciador após (g), pela adição de um terceiro análogo de nucleotídeo que é ligado a uma porção de bloqueio reversível; (i) remover seletivamente a porção de bloqueio reversível que é ligada ao segundo análogo de nucleotídeo que é adicionado ao segundo iniciador e reter, concomitantemente, a porção de bloqueio reversível que é ligada ao primeiro análogo de nucleotídeo que é ligado ao primeiro iniciador; (j) estender o segundo iniciador, após (i), pela adição de um quarto análogo de nucleotídeo que é ligado a uma porção de bloqueio reversível, em que a porção de bloqueio reversível que é ligada ao terceiro análogo de nucleotídeo é diferente da porção de bloqueio reversível que é ligada ao quarto análogo de nucleotídeo; e (k) detectar o análogo de nucleotídeo que é adicionado ao primeiro iniciador em (h) e o análogo de nucleotídeo que é adicionado ao segundo iniciador em (j), em cada um dos sítios, determinando, assim, as diferentes sequências do primeiro molde e do segundo molde em cada um dos sítios. Opcionalmente, as etapas (g) a (k) podem ser repetidas.
[0103] Será compreendido que as etapas estabelecidas na modalidade acima e em outras modalidades da presente divulgação não precisam seguir a ordem exemplificada. Tomando como exemplo a modalidade nos parágrafos anteriores, a etapa (f), que cita uma atividade de detecção, não precisa ocorrer após a etapa (e). Pelo contrário, um primeiro iniciador que é estendido na etapa (c) pode ser detectado antes de estender um segundo iniciador na etapa (d). Geralmente, uma etapa de detecção pode ocorrer antes ou depois que uma ou mais porções de bloqueio reversíveis diferentes são removidas.
[0104] A ordem das outras etapas pode ser alterada para se adequar a aplicações específicas dos métodos. Um exemplo dos dois métodos que podem utilizar etapas similares, porém em ordens diferentes, é demonstrado pela comparação dos diagramas de ciclo na figura 1 e na figura 2. No diagrama de ciclo da figura 1, os marcadores nos produtos de extensão de iniciador são detectados antes do desbloqueio e da clivagem dos marcadores. O desbloqueio e a clivagem do marcador para os nucleotídeos em cada grupo são mostrados como acontecendo simultaneamente, que pode ser conveniente, por exemplo, quando ambos são suscetíveis ao mesmo tratamento ou devido a tratamentos compatíveis. No entanto, é possível que o desbloqueio e a clivagem do marcador ocorram separadamente. Como exemplificado pelo diagrama de ciclo da figura 2, a clivagem do marcador e o desbloqueio ocorrem separadamente. Neste exemplo, os marcadores diferentes que estão presentes em todas as duas reações diferentes (ou seja, R1 e R2) são clivados simultaneamente. Isto é conveniente, por exemplo, quando ambos os tipos de marcadores podem ser clivados usando o mesmo tratamento ou usando tratamentos compatíveis. A comparação dos diagramas de ciclo na figura 1 e na figura 2 ilustram também outras diferenças. Por exemplo, na figura 1, o desbloqueio dos produtos de extensão de ambas as reações (R1 e R2) ocorrem após a etapa de detecção do ciclo anterior, enquanto que, na figura 2, o produto de extensão R2 é desbloqueado antes da etapa de detecção do ciclo anterior e o produto de extensão R1 é desbloqueado após a etapa de detecção do ciclo anterior. Há uma variedade de disposições diferentes e as ordens das etapas que podem ser usadas em um método estabelecido na presente invenção. As pessoas versadas na técnica serão capazes de determinar prontamente uma disposição desejável e uma ordem baseada no ensinamento estabelecido na presente invenção, e as características reativas conhecidas dos reagentes utilizados.
[0105] Além disso, como exemplificado anteriormente na presente invenção, as etapas dos métodos estabelecidos na presente invenção podem ser realizadas sequencialmente ou simultaneamente. Por exemplo, a remoção seletiva de diferentes porções de bloqueio reversíveis (por exemplo, as etapas (b) e (d) nos parágrafos anteriores) pode ser realizada simultaneamente ou sequencialmente. Da mesma forma, a extensão de diferentes iniciadores (por exemplo, etapas (c) e (e) nos parágrafos anteriores), que foram desbloqueados usando os respectivos tratamentos de desbloqueio diferentes, podem ocorrer simultaneamente ou sequencialmente.
[0106] Sítios de iniciação universais são particularmente úteis para aplicações multiplex dos métodos estabelecidos na presente invenção. Os sítios de iniciação universal oferecem uma região da sequência que é comum a duas ou mais moléculas de ácido nucleico, onde as moléculas também têm diferentes sequências em suas regiões de molde. Uma sequência de iniciação universal presente em diferentes membros de uma coleção de moléculas pode permitir a replicação, a amplificação ou a detecção de várias sequências diferentes usando uma única espécie de iniciador universal que é complementar à sequência universal. Exemplos dos métodos de ligação de sequências universais a uma coleção de ácidos nucleicos alvo podem ser encontrados na Publicação do Pedido de Patente Norte-Americana No. 2007/0128624 A1, que está incorporada na presente invenção por referência.
[0107] Nas modalidades da presente divulgação, um primeiro iniciador pode ter uma primeira sequência do iniciador universal que é complementar a um primeiro sítio de iniciação universal para um primeiro molde em um sítio. O mesmo sítio de iniciação universal pode estar presente para uma variedade de diferentes primeiros moldes em diferentes sítios de uma matriz. Assim, uma única espécie do primeiro iniciador universal pode ser usada para amplificar ou estender os diferentes primeiros moldes nos sítios. Continuando com este exemplo, um segundo iniciador pode ter uma segunda sequência do iniciador universal que é complementar a um segundo sítio de iniciação universal para um segundo molde no sítio onde o primeiro molde também está localizado. O mesmo segundo sítio de iniciação universal pode estar presente para uma variedade de diferentes segundos moldes nos diferentes sítios da matriz. Assim, uma única espécie do segundo iniciador universal pode ser usada para amplificar ou estender os diferentes segundos moldes nos sítios.
[0108] Um método de sequenciamento ortogonal estabelecido na presente invenção pode ser utilizado em uma abordagem de sequenciamento de extremidade pareada. Geralmente, o sequenciamento de extremidades pareadas envolve determinar as sequências nas duas extremidades de uma região de sequência molde, em que o comprimento da região de sequência molde é conhecido. Métodos para fragmentar uma amostra de ácido nucleico alvo (por exemplo, amostra de DNA genômica), ligando iniciadores para acomodar leituras da extremidade pareada e ler a sequência das extremidades dos fragmentos são conhecidos e podem ser realizados conforme descrito, por exemplo, nas Patentes Norte-Americanas Nos. 7,754,429; 8,017,335 ou 8,192,930, cada uma das quais sendo incorporada na presente invenção por referência.
[0109] No caso de uma modalidade de sequenciamento por síntese, os fragmentos de ácidos nucleicos podem ser construídos para ter duas sequências moldes e as leituras pareadas podem ser obtidas de cada um dos dois moldes para obter 4 leituras a partir de um único fragmento. Um construto exemplar para obter 4 leituras de um único fragmento e métodos para fazer a construção são definidos na Publicação do Pedido de Patente Norte-Americana No. 2015/0031560 A1, que é incorporada na presente invenção por referência.
[0110] A presente divulgação fornece ainda uma matriz de ácidos nucleicos que inclui uma pluralidade de sítios em um suporte sólido, em que cada sítio inclui um primeiro molde de ácido nucleico e um segundo molde de ácido nucleico, em que o primeiro molde de ácido nucleico tem uma sequência que é diferente da sequência do segundo molde de ácido nucleico, em que um primeiro iniciador está ligado ao primeiro molde de ácido nucleico, uma primeira porção de bloqueio reversível estando ligada ao primeiro iniciador, em que um segundo iniciador está ligado ao segundo molde de ácido nucleico, uma segunda porção de bloqueio reversível sendo ligada ao segundo iniciador e em que a primeira porção de bloqueio reversível é diferente da segunda porção de bloqueio reversível. A matriz de ácido nucleico pode incluir ainda um ou mais dos componentes descritos no contexto dos métodos da presente divulgação. Produtos que inerentemente resultam dos métodos estabelecidos na presente invenção também destinam-se a serem considerados como componentes de um ácido nucleico em algumas modalidades.
[0111] Em modalidades particulares, uma matriz de ácido nucleico incluirá uma primeira polimerase que é ligada ao primeiro iniciador e ao primeiro molde de ácido nucleico em um sítio. Além disso, uma segunda polimerase pode se ligar ao segundo iniciador, e o segundo molde de ácido nucleico no sítio. Em alguns casos, a primeira polimerase e a segunda polimerase são a mesma espécie da polimerase. No entanto, também pode ser útil, em algumas modalidades, que a primeira e segunda polimerases sejam espécies diferentes (por exemplo, uma DNA polimerase e uma RNA polimerase).
[0112] Uma matriz de ácido nucleico da presente divulgação pode estar presente em um aparelho de detecção, como em um aparelho de sequenciamento de ácidos nucleicos. Aparelhos de detecção exemplares são descritos neste documento e nas referências que são incorporadas na presente invenção por referência. Geralmente, um aparelho de detecção pode incluir uma matriz de ácidos nucleicos e um detector que está posicionado para detectar um ou mais sítios na matriz. Tipicamente, o detector tem uma resolução espacial que é demasiadamente baixa para separar pontos a uma distância equivalente ao espaçamento entre o primeiro iniciador e o segundo iniciador, em cada um dos sítios. No entanto, o uso do desbloqueio do iniciador ortogonal e a extensão permite que os dois iniciadores sejam separados. O detector pode ser configurado para observar qualquer um de uma variedade de sinais, como exemplificado na presente invenção. Por exemplo, em algumas modalidades, o detector é um detector óptico. Os sítios da matriz podem ter marcadores ópticos que são detectáveis pelo detector óptico. Os iniciadores diferentes em cada sítio podem ser estendidos para incorporar diferentes marcadores ópticos e o detector óptico pode ser configurado para distinguir opticamente os diferentes marcadores (por exemplo, devido às diferenças no comprimento de onda de absorção de luz, comprimento de onda de excitação de luminescência ou comprimento de onda de emissão de luminescência). Em algumas configurações, um pixel do detector é configurado para adquirir simultaneamente sinais do primeiro iniciador e do segundo iniciador.
[0113] Em todo este pedido, várias publicações, patentes ou pedidos de patente foram referenciados. A divulgação dessas publicações em suas totalidades são incorporadas, por meio desse documento, nesse pedido.
[0114] O termo compreendendo é destinado, na presente invenção, a ser aberto, incluindo não apenas os elementos citados, mas além disso abrangendo quaisquer elementos adicionais.
[0115] Várias modalidades foram descritas. No entanto, será compreendido que várias modificações podem ser feitas. Portanto, outras modalidades estão dentro do escopo das reivindicações a seguir.

Claims (22)

1. Processo para sequenciar moldes de ácido nucleico caracterizado pelo fato de compreender: (a) fornecer uma matriz compreendendo uma pluralidade de sítios, em que cada sítio compreende um primeiro molde de ácido nucleico e um segundo molde de ácido nucleico, em que o primeiro molde de ácido nucleico tem uma sequência que é diferente da sequência do segundo molde de ácido nucleico, em que um primeiro iniciador está ligado ao primeiro molde de ácido nucleico, uma porção de bloqueio reversível sendo ligada ao primeiro iniciador, em que um segundo iniciador está ligado ao segundo molde de ácido nucleico, uma porção de bloqueio reversível sendo ligada ao segundo iniciador, e em que a porção de bloqueio reversível que está ligada ao primeiro iniciador é diferente da porção de bloqueio reversível que está ligada ao segundo iniciador; (b) remover seletivamente a porção de bloqueio reversível que está ligada ao primeiro iniciador e reter, concomitantemente, a porção de bloqueio reversível que está ligada ao segundo iniciador; (c) estender o primeiro iniciador pela adição de um primeiro análogo de nucleotídeo que compreende uma porção de bloqueio reversível; (d) remover seletivamente a porção de bloqueio reversível que está ligada ao segundo iniciador e reter, concomitantemente, a porção de bloqueio reversível que está ligada ao análogo de nucleotídeo que está adicionado ao primeiro iniciador; (e) estender o segundo iniciador pela adição de um segundo análogo de nucleotídeo que compreende uma porção de bloqueio reversível, em que a porção de bloqueio reversível do primeiro análogo de nucleotídeo é diferente da porção de bloqueio reversível do segundo análogo de nucleotídeo; e (f) detectar o análogo de nucleotídeo que é adicionado ao primeiro iniciador e o análogo de nucleotídeo que é adicionado ao segundo iniciador, em cada um dos sítios, determinando, assim, as diferentes sequências do primeiro molde e do segundo molde em cada um dos sítios em uma maneira ortogonal pelo uso de um desbloqueio seletivo de nucleotídeos.
2. Processo, de acordo com a reivindicação 1, caracterizado pelo fato de compreender, adicionalmente: (g) remover seletivamente a porção de bloqueio reversível do primeiro análogo de nucleotídeo que é adicionado ao primeiro iniciador e reter, concomitantemente, a porção de bloqueio reversível do segundo análogo de nucleotídeo que é adicionada ao segundo iniciador; (h) estender o primeiro iniciador, após a etapa (g), pela adição de um terceiro análogo de nucleotídeo que compreende a uma porção de bloqueio reversível; (i) remover seletivamente a porção de bloqueio reversível do segundo análogo de nucleotídeo que é adicionado ao segundo iniciador e reter, concomitantemente, a porção de bloqueio reversível do primeiro análogo de nucleotídeo que é adicionada ao primeiro iniciador; (j) estender o segundo iniciador, após a etapa (i), pela adição de um quarto análogo de nucleotídeo que compreende uma porção de bloqueio reversível, em que a porção de bloqueio reversível do terceiro análogo de nucleotídeo é diferente da porção de bloqueio reversível do quarto análogo de nucleotídeo; e (k) detectar o análogo de nucleotídeo que é adicionado ao primeiro iniciador na etapa (h) e o análogo de nucleotídeo que é adicionado ao segundo iniciador na etapa (j), em cada um dos sítios, determinando, assim, as diferentes sequências do primeiro molde e do segundo molde em cada um dos sítios em uma maneira ortogonal pelo uso de um desbloqueio seletivo de nucleotídeos, e, em que o processo pode compreender ainda repetir as etapas (g) a (k).
3. Processo, de acordo com a reivindicação 1 ou 2, caracterizado pelo fato de que a detecção usa um detector com uma resolução espacial que é demasiadamente baixa para separar pontos a uma distância equivalente ao espaçamento entre o primeiro iniciador e o segundo iniciador em cada um dos sítios.
4. Processo, de acordo com qualquer uma das reivindicações 1 a 3, caracterizado pelo fato de que o detector é um detector óptico, e, os análogos de nucleotídeo compreendem marcadores ópticos, opcionalmente, em que o primeiro análogo de nucleotídeo é de um primeiro conjunto de análogos de nucleotídeo, em que o segundo análogo de nucleotídeo é de um segundo conjunto de análogos de nucleotídeo, e em que os marcadores ópticos do primeiro conjunto de análogos de nucleotídeo são diferentes dos marcadores ópticos do segundo conjunto de análogos de nucleotídeo.
5. Processo, de acordo com qualquer uma das reivindicações 1 a 4, caracterizado pelo fato de que o primeiro análogo de nucleotídeo é de um primeiro conjunto de análogos de nucleotídeo, em que o segundo análogo de nucleotídeo é de um segundo conjunto de análogos de nucleotídeo, e em que um subconjunto de análogos de nucleotídeo no primeiro conjunto de análogos de nucleotídeo compreende marcadores ópticos, opcionalmente, em que um subconjunto dos análogos de nucleotídeo no segundo conjunto de análogos de nucleotídeo compreende marcadores ópticos, e, opcionalmente, em que o subconjunto de análogos de nucleotídeo no primeiro conjunto de análogos de nucleotídeo compreende marcadores ópticos que são diferentes dos marcadores ópticos do subconjunto de nucleotídeos no segundo conjunto de análogos de nucleotídeo.
6. Processo, de acordo com a reivindicação 5, caracterizado pelo fato de que o primeiro análogo de nucleotídeo é de um primeiro conjunto de análogos de nucleotídeo, em que o segundo análogo de nucleotídeo é de um segundo conjunto de análogos de nucleotídeo, em que o primeiro conjunto de análogos de nucleotídeo compreende apenas um tipo de marcador óptico que é detectado na etapa (f) e o segundo conjunto de análogos de nucleotídeo compreende apenas um tipo de marcador óptico que é detectado na etapa (f), opcionalmente, em que o um tipo de marcador óptico é ligado a substancialmente todos os análogos de nucleotídeo de uma primeira espécie no primeiro conjunto, o um tipo de marcador óptico está ligado a um subconjunto de análogos de nucleotídeo de uma segunda espécie no primeiro conjunto, substancialmente todos os análogos de nucleotídeo de uma terceira espécie no primeiro conjunto estão ligados a um ligante, e substancialmente todos os análogos de nucleotídeo de uma quarta espécie no primeiro conjunto não estão ligados ao um tipo de marcador óptico ou ao ligante.
7. Processo, de acordo com qualquer uma das reivindicações 1 a 6, caracterizado pelo fato de que o primeiro análogo de nucleotídeo é de um primeiro conjunto de análogos de nucleotídeo, em que o segundo análogo de nucleotídeo é de um segundo conjunto de análogos de nucleotídeo, em que o primeiro conjunto de análogos de nucleotídeo compreende apenas dois tipos de marcadores ópticos que são detectados na etapa (f) e o segundo conjunto de análogos de nucleotídeo compreende dois tipos de marcadores ópticos que são detectados na etapa (f), opcionalmente, em que apenas um dos dois tipos de marcador óptico é ligado a substancialmente todos os análogos de nucleotídeo de uma primeira espécie no primeiro conjunto, apenas um segundo dos dois tipos de marcadores ópticos é ligado a substancialmente todos os análogos de nucleotídeo de uma segunda espécie no primeiro conjunto, um dos dois tipos de marcadores ópticos e o segundo dos dois tipos de marcadores ópticos estão ligados aos análogos de nucleotídeo de uma terceira espécie no primeiro conjunto, e, substancialmente todos os análogos de nucleotídeo de uma quarta espécie no primeiro conjunto não estão ligados a um dos dois tipos de marcadores ópticos do segundo dos dois tipos de marcadores ópticos.
8. Processo, de acordo com qualquer uma das reivindicações 1 a 7, caracterizado pelo fato de que um pixel do detector simultaneamente capta sinais do primeiro iniciador e do segundo iniciador.
9. Processo, de acordo com qualquer uma das reivindicações 1 a 8, caracterizado pelo fato de que o primeiro molde de ácido nucleico compreende pelo menos uma porção de base que é a mesma espécie que uma porção de base no segundo molde de ácido nucleico.
10. Processo, de acordo com qualquer uma das reivindicações 1 a 9, caracterizado pelo fato de que as etapas (b) e (d) são realizadas simultaneamente ou sequencialmente.
11. Processo, de acordo com qualquer uma das reivindicações 1 a 10, caracterizado pelo fato de que as etapas (c) e (e) são realizadas simultaneamente ou sequencialmente.
12. Processo, de acordo com qualquer uma das reivindicações 1 a 11, caracterizado pelo fato de que uma única molécula de ácido nucleico contém o primeiro molde de ácido nucleico e o segundo molde de ácido nucleico; ou em que o primeiro molde de ácido nucleico e o segundo molde de ácido nucleico estão em diferentes moléculas de ácido nucleico.
13. Processo, de acordo com qualquer uma das reivindicações 1 a 12, caracterizado pelo fato de que: (i) os sítios têm uma área igual a 100 μm2 ou menos; e/ou (ii) os sítios compreendem vários amplicons do primeiro molde de ácido nucleico e vários amplicons do segundo molde de ácido nucleico, opcionalmente, em que os múltiplos amplicons compreendem um conjunto de ácidos nucleicos.
14. Processo, de acordo com qualquer uma das reivindicações 1 a 13, caracterizado pelo fato de que pelo menos um de (A) a (H) se aplica, em que (A) a (H) são: (A) a pluralidade de sítios tem um distanciamento de 10 μm ou menos; (B) a pluralidade de sítios compreende pelo menos 1 x 106 sítios; (C) cada um dos sítios compreende uma sequência de ácido nucleico que é única em comparação com as sequências de ácidos nucleicos em outros sítios na pluralidade; (D) o primeiro iniciador compreende uma primeira sequência do iniciador universal e o primeiro molde de ácido nucleico em cada sítio na pluralidade de sítios compreende uma primeira sequência de ligação de iniciador universal que é complementar à primeira sequência do iniciador universal, opcionalmente, em que o segundo iniciador compreende uma segunda sequência do iniciador universal e o segundo molde de ácido nucleico em cada sítio na pluralidade de sítios compreende uma segunda sequência de ligação ao iniciador universal que é complementar à segunda sequência do iniciador universal, em que a primeira sequência de ligação ao iniciador universal é diferente da segunda sequência de ligação ao iniciador universal; (E) as etapas (c) e (e) são realizadas pela mesma polimerase ou pelas mesmas espécies de polimerases; (F) azidometil e terc-butoxietóxi são usados como porções de bloqueio reversíveis, opcionalmente, em que azidametil é seletivamente removido por tratamento com fosfina e terc-butoxietóxi é seletivamente removido por tratamento com ácido; (G) remoção seletiva das porções de bloqueio reversíveis compreende tratamento químico, tratamento térmico, irradiação ou tratamento elétrico, ou (H) porção de bloqueio reversível que é ligada ao primeiro iniciador é da mesma espécie que a porção de bloqueio reversível que é ligada ao primeiro análogo de nucleotídeo, opcionalmente, em que a porção de bloqueio reversível que é ligada ao segundo iniciador é da mesma espécie que a porção de bloqueio reversível que é ligada ao segundo análogo de nucleotídeo.
15. Processo para sequenciar moldes de ácido nucleico caracterizado pelo fato de compreender: (a) fornecer uma matriz de sítios, em que cada sítio compreende uma mistura de pelo menos dois moldes de ácidos nucleicos diferentes; (b) estender os iniciadores hibridizados aos moldes de ácido nucleico diferentes em cada um dos sítios com análogos de nucleotídeos diferentes compreendendo diferentes porções de bloqueio reversíveis, respectivamente, desse modo produzindo produtos de extensão de iniciador diferentes em cada sítio; (c) detectar os diferentes produtos de extensão de iniciador para distinguir os análogos de nucleotídeo diferentes em cada sítio; (d) remover as diferentes porções de bloqueio reversíveis dos produtos de extensão de iniciador em cada um dos sítios utilizando um primeiro tratamento que é seletivo para uma primeira das diferentes porções de bloqueio reversíveis e um segundo tratamento que é seletivo para uma segunda das diferentes porções de bloqueio reversíveis; e (e) repetir as etapas (b) a (d) para determinar a sequência de diferentes análogos de nucleotídeo adicionados a cada um dos diferentes produtos de extensão em cada um dos sítios em uma maneira ortogonal.
16. Processo, de acordo com a reivindicação 15, caracterizado pelo fato de que pelo menos dentre: (a) os iniciadores que são hibridizados para diferentes moldes de ácido nucleico estão simultaneamente presentes durante a extensão na etapa (b); (b) os diferentes produtos de extensão de iniciador estão simultaneamente presentes durante a detecção na etapa (c); e (c) a primeira das diferentes porções de bloqueio reversíveis e a segunda das diferentes porções de bloqueio reversíveis estão simultaneamente presentes nos produtos de extensão de iniciador durante a remoção na etapa (d).
17. Processo, de acordo com a reivindicação 15, caracterizado pelo fato de que: (i) um primeiro dos iniciadores que é hibridizado para um primeiro dos diferentes moldes de ácidos nucleicos é removido da matriz de sítios antes da extensão de um segundo dos iniciadores que é hibridizado a um segundo dos diferentes moldes de ácido nucleico, opcionalmente, em que a etapa (c) é realizado após a etapa(d); ou (ii) um primeiro dos diferentes produtos de extensão de iniciador é removido da matriz de sítios antes da detecção de um segundo dos diferentes produtos de extensão de iniciador, em que a etapa (c) é realizada após a etapa(d); ou (iii) um primeiro dos diferentes produtos de extensão de iniciador é removido da matriz de sítios antes do segundo tratamento; ou (iv) em que a etapa (c) é realizada após a etapa (d).
18. Processo, de acordo com qualquer uma das reivindicações 15 a 17, caracterizado pelo fato de que pelo menos, um dentre (A) a (O) se aplica, em que (A) a (O) são como a seguir: (A) a detecção usa um detector com uma resolução espacial que é demasiadamente baixa para separar pontos a uma distância equivalente ao espaçamento entre os diferentes produtos de extensão de iniciador em cada um dos sítios, (B) o detector é um detector óptico, (C) os análogos de nucleotídeo compreendem marcadores ópticos, (D) um primeiro conjunto de análogos de nucleotídeo é adicionado a um primeiro dos diferentes produtos de extensão de iniciador e um segundo conjunto de análogos de nucleotídeo é adicionado a um segundo dos diferentes produtos de extensão de iniciador, em que o primeiro conjunto de análogos de nucleotídeo compreende marcadores ópticos que são diferentes dos marcadores ópticos do segundo conjunto de análogos de nucleotídeo, (E) um pixel de um detector simultaneamente capta sinais do primeiro produto de extensão de iniciador e do segundo produto de extensão de iniciador, (F) o primeiro molde de ácido nucleico compreende pelo menos uma porção de base que é a mesma espécie que uma porção de base no segundo molde de ácido nucleico, (G) uma única molécula de ácido nucleico contém pelo menos dois moldes diferentes de ácidos nucleicos, (H) um primeiro molde de ácido nucleico e um segundo molde de ácido nucleico dos pelo menos dois moldes de ácido nucleico diferentes estão em diferentes moléculas de ácidos nucleicos, (I) os sítios têm uma área igual a 100 μm2 ou menos, (J) os sítios compreendem múltiplos amplicons de cada um dos pelo menos dois moldes de ácido nucleico diferentes, opcionalmente, em que os múltiplos amplicons compreendem um conjunto de ácidos nucleicos, (K) a pluralidade de sítios tem um distanciamento de 10 μm ou menos, (L) a pluralidade de sítios compreende pelo menos 1 x 106 sítios, (M) cada um dos sítios compreende uma sequência de ácidos nucleicos que é única em comparação com as sequências de ácidos nucleicos nos outros sítios na pluralidade, (N) a mesma polimerase ou a mesma espécie de polimerase executa a extensão dos iniciadores hibridizados para os diferentes moldes de ácidos nucleicos em cada um dos sítios, (O)(a) os tratamentos seletivos compreendem remover, seletivamente, uma porção de bloqueio reversível que compreende azidometil usando tratamento com fosfina e remover, seletivamente, uma porção de bloqueio reversível que compreende terc-butoxietóxi usando tratamento com ácido; ou (b) a remoção seletiva das porções de bloqueio reversíveis compreende tratamento químico, tratamento térmico, irradiação ou tratamento elétrico.
19. Matriz de ácido nucleico caracterizada pelo fato de compreender: uma pluralidade de sítios em um suporte sólido, em que cada sítio compreende um primeiro molde de ácido nucleico e um segundo molde de ácido nucleico, em que o primeiro molde de ácido nucleico tem uma sequência que é diferente da sequência do segundo molde de ácido nucleico, em que um primeiro iniciador está ligado ao primeiro molde de ácido nucleico, uma primeira porção de bloqueio reversível sendo ligada ao primeiro iniciador, em que um segundo iniciador está ligado ao segundo molde de ácido nucleico, uma porção de bloqueio reversível sendo ligada ao segundo iniciador, em que a primeira porção de bloqueio reversível é diferente da segunda porção de bloqueio reversível, em que sequências diferentes do primeiro molde e do segundo molde em cada sítio pode ser determinado em uma maneira ortogonal pelo uso de desbloqueio seletivo de nucleotídeos.
20. Matriz de ácido nucleico, de acordo com a reivindicação 19, caracterizada pelo fato de que pelo menos um de (A) a (M) se aplica, em que (A) a (M) são como a seguir: (A) cada sítio ocupa uma área no suporte sólido que é igual a 100 μm2 ou menos, (B) a pluralidade de sítios tem um distanciamento de 10 μm ou menos, (C) a pluralidade de sítios compreende pelo menos 1 x 106 sítios, opcionalmente, em que cada um dos sítios compreende uma sequência de ácido nucleico que é única em comparação com as sequências de ácidos nucleicos nos outros sítios na pluralidade, (D) a primeira porção de bloqueio reversível é ligada ao nucleotídeo 3' do primeiro iniciador, em que o nucleotídeo 3' do primeiro iniciador é ligado a um primeiro marcador óptico, (E) a segunda porção de bloqueio reversível é ligada ao nucleotídeo 3' do segundo iniciador, opcionalmente, em que o nucleotídeo 3' do segundo iniciador é ligado a um segundo marcador óptico, em que o segundo marcador óptico é opticamente distinguível do primeiro marcador óptico, (F) o primeiro e o segundo marcadores ópticos compreendem fluoróforos, (G) o primeiro molde de ácido nucleico e o segundo molde de ácido nucleico compreendem DNA, (H) uma única molécula de ácido nucleico contém o primeiro molde de ácido nucleico e o segundo molde de ácido nucleico, (I) o primeiro molde de ácido nucleico e o segundo molde de ácido nucleico estão em diferentes moléculas de ácido nucleico, (J) os sítios compreendem vários amplicons do primeiro molde de ácido nucleico e vários amplicons do segundo molde de ácido nucleico, opcionalmente, em que os múltiplos amplicons compreendem um conjunto de ácidos nucleicos, (K) o primeiro iniciador compreende uma primeira sequência do iniciador universal e o primeiro molde de ácido nucleico em cada sítio na pluralidade de sítios compreende uma primeira sequência de ligação ao iniciador universal que é complementar à primeira sequência do iniciador universal, opcionalmente, em que o segundo iniciador compreende uma segunda sequência do iniciador universal e o segundo molde de ácido nucleico em cada sítio na pluralidade de sítios compreende uma segunda sequência de ligação ao iniciador universal, que é complementar à segunda sequência do iniciador universal, em que a primeira sequência de ligação ao iniciador universal é diferente da segunda sequência de ligação ao iniciador universal, (L)uma primeira polimerase se liga ao primeiro iniciador e ao primeiro molde de ácido nucleico, opcionalmente, em que uma segunda polimerase está ligada ao segundo iniciador e ao segundo molde de ácido nucleico, e em que a primeira polimerase e a segunda polimerase são as mesmas espécies da polimerase, (M) a primeira porção de bloqueio reversível compreende azidometil e em que a segunda porção de bloqueio reversível compreende terc-butoxietóxi.
21. Aparelho de detecção compreendendo uma matriz de ácido nucleico, conforme definida em qualquer uma das reivindicações 19 a 20, caracterizado pelo fato de que compreende um detector posicionado para detectar a pluralidade de sítios, opcionalmente, em que o detector tem uma resolução espacial que é demasiadamente baixa para separar pontos a uma distância equivalente ao espaçamento entre o primeiro iniciador e o segundo iniciador, em cada um dos sítios.
22. Aparelho de detecção de acordo com a reivindicação 21, caracterizado pelo fato de que (i) o detector é um detector óptico, ou (ii) um pixel do detector é configurado para captar simultaneamente sinais do primeiro iniciador e do segundo iniciador.
BR112017023418-1A 2015-07-30 2016-07-08 Desbloqueio ortogonal de nucleotídeos BR112017023418B1 (pt)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201562198947P 2015-07-30 2015-07-30
US62/198,947 2015-07-30
PCT/US2016/041568 WO2017019278A1 (en) 2015-07-30 2016-07-08 Orthogonal deblocking of nucleotides

Publications (2)

Publication Number Publication Date
BR112017023418A2 BR112017023418A2 (pt) 2018-07-24
BR112017023418B1 true BR112017023418B1 (pt) 2024-05-21

Family

ID=

Similar Documents

Publication Publication Date Title
US9982294B2 (en) Sequencing by orthogonal synthesis
US20220033898A1 (en) Orthogonal deblocking of nucleotides
JP6433575B2 (ja) 単一ヌクレオチド検出方法
JP2007530051A (ja) 標的分子を決定するためのライゲーション反応および増幅反応
US20040121342A1 (en) Methods and compositions for conducting primer extension and polymorphism detection reactions
EP3180448A1 (en) Multifunctional oligonucleotides
BR112017023418B1 (pt) Desbloqueio ortogonal de nucleotídeos
EP4400602A1 (en) Method for analyzing sequence of target polynucleotide
US20240052406A1 (en) Competitive methods and compositions for amplifying polynucleotides
JP2019532632A (ja) 単一ヌクレオチド検出方法および関連プローブ