BR112021008186A2 - dna polimerase projetada, sequência polinucleotídica, vetor de expressão, célula hospedeira, composição, sistema de ensaio de alto rendimento, e, métodos para produção de um polipeptídeo de dna polimerase projetado em uma célula hospedeira e para determinação de fidelidade de alto rendimento de uma dna polimerase. - Google Patents

dna polimerase projetada, sequência polinucleotídica, vetor de expressão, célula hospedeira, composição, sistema de ensaio de alto rendimento, e, métodos para produção de um polipeptídeo de dna polimerase projetado em uma célula hospedeira e para determinação de fidelidade de alto rendimento de uma dna polimerase. Download PDF

Info

Publication number
BR112021008186A2
BR112021008186A2 BR112021008186-0A BR112021008186A BR112021008186A2 BR 112021008186 A2 BR112021008186 A2 BR 112021008186A2 BR 112021008186 A BR112021008186 A BR 112021008186A BR 112021008186 A2 BR112021008186 A2 BR 112021008186A2
Authority
BR
Brazil
Prior art keywords
dna polymerase
amino acid
seq
sequence
acid positions
Prior art date
Application number
BR112021008186-0A
Other languages
English (en)
Inventor
Mathew G. Miller
Ericka Bermudez
Vesna Mitchell
Jovana Nazor
Donald S. Baskerville
Nikki Dellas
David Elgart
Jonathan Vroom
Sandy M. Gomes
Nandhitha Subramanian
Original Assignee
Codexis, Inc.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Codexis, Inc. filed Critical Codexis, Inc.
Publication of BR112021008186A2 publication Critical patent/BR112021008186A2/pt

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/10Transferases (2.)
    • C12N9/12Transferases (2.) transferring phosphorus containing groups, e.g. kinases (2.7)
    • C12N9/1241Nucleotidyltransferases (2.7.7)
    • C12N9/1252DNA-directed DNA polymerase (2.7.7.7), i.e. DNA replicase
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/52Genes encoding for enzymes or proenzymes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/48Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving transferase
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6897Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids involving reporter genes operably linked to promoters
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y207/00Transferases transferring phosphorus-containing groups (2.7)
    • C12Y207/07Nucleotidyltransferases (2.7.7)
    • C12Y207/07007DNA-directed DNA polymerase (2.7.7.7), i.e. DNA replicase
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2521/00Reaction characterised by the enzymatic activity
    • C12Q2521/10Nucleotidyl transfering
    • C12Q2521/101DNA polymerase
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2531/00Reactions of nucleic acids characterised by
    • C12Q2531/10Reactions of nucleic acids characterised by the purpose being amplify/increase the copy number of target nucleic acid
    • C12Q2531/113PCR
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2563/00Nucleic acid detection characterized by the use of physical, structural and functional properties
    • C12Q2563/107Nucleic acid detection characterized by the use of physical, structural and functional properties fluorescence
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N2333/00Assays involving biological materials from specific organisms or of a specific nature
    • G01N2333/90Enzymes; Proenzymes
    • G01N2333/91Transferases (2.)
    • G01N2333/912Transferases (2.) transferring phosphorus containing groups, e.g. kinases (2.7)
    • G01N2333/91205Phosphotransferases in general
    • G01N2333/91245Nucleotidyltransferases (2.7.7)
    • G01N2333/9125Nucleotidyltransferases (2.7.7) with a definite EC number (2.7.7.-)
    • G01N2333/9126DNA-directed DNA polymerase (2.7.7.7)

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Engineering & Computer Science (AREA)
  • Genetics & Genomics (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Molecular Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Biotechnology (AREA)
  • Biochemistry (AREA)
  • Microbiology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Biomedical Technology (AREA)
  • Physics & Mathematics (AREA)
  • Biophysics (AREA)
  • Medicinal Chemistry (AREA)
  • Analytical Chemistry (AREA)
  • Immunology (AREA)
  • Plant Pathology (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Enzymes And Modification Thereof (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

DNA POLIMERASE PROJETADA, SEQUÊNCIA POLINUCLEOTÍDICA, VETOR DE EXPRESSÃO, CÉLULA HOSPEDEIRA, COMPOSIÇÃO, SISTEMA DE ENSAIO DE ALTO RENDIMENTO, E, MÉTODOS PARA PRODUÇÃO DE UM POLIPEPTÍDEO DE DNA POLIMERASE PROJETADO EM UMA CÉLULA HOSPEDEIRA E PARA DETERMINAÇÃO DE FIDELIDADE DE ALTO RENDIMENTO DE UMA DNA POLIMERASE. A presente invenção fornece polipeptídeos de DNA polimerase projetados e composições dos mesmos, bem como polinucleotídeos que codificam os polipeptídeos de DNA polimerase projetados. A invenção também fornece métodos para o uso das composições compreendendo os polipeptídeos de DNA polimerase projetados para diagnóstico e outros fins.

Description

DNA POLIMERASE PROJETADA, SEQUÊNCIA POLINUCLEOTÍDICA, VETOR DE EXPRESSÃO, CÉLULA HOSPEDEIRA, COMPOSIÇÃO, SISTEMA DE ENSAIO DE ALTO RENDIMENTO, E, MÉTODOS PARA PRODUÇÃO DE UM POLIPEPTÍDEO DE DNA POLIMERASE PROJETADO EM UMA CÉLULA HOSPEDEIRA E PARA DETERMINAÇÃO DE FIDELIDADE DE ALTO RENDIMENTO DE UMA DNA POLIMERASE
[001] O presente pedido reivindica a prioridade do pedido de patente provisória norte-americano No. de série 62/752.215, depositado em 29 de outubro de 2018, que é incorporado por referência em sua totalidade para todos os fins. REFERÊNCIA À LISTAGEM DE SEQUÊNCIAS, TABELA OU
PROGRAMA DE COMPUTADOR
[002] A Listagem de Sequências submetida concomitantemente sob 37 C.F.R. §1.821 em um formato legível por computador (CRF) via EFS-Web, como nome de arquivo CX9-181WO2_ST25.txt é aqui incorporada por referência. A cópia eletrônica da Listagem de Sequências foi criada em 28 de outubro de 2019, com um tamanho de arquivo de 5.361 Kbytes.
CAMPO DA INVENÇÃO
[003] A presente invenção fornece polipeptídeos de DNA polimerase projetados e composições dos mesmos, bem como polinucleotídeos que codificam os polipeptídeos de DNA polimerase projetados. A invenção também fornece métodos para o uso das composições compreendendo os polipeptídeos de DNA polimerase projetados para diagnóstico e outros fins.
FUNDAMENTOS DA INVENÇÃO
[004] As DNA polimerases são enzimas que sintetizam DNA a partir de desoxirribonucleotídeos. Essas enzimas são essenciais para a replicação do DNA. Existem vários tipos de DNA polimerases, que, de forma geral, foram divididas em sete famílias, especificamente A, B, C, D, X, Y e RT. Essas famílias têm propriedades diferentes e são encontradas em diferentes tipos de organismos. Por exemplo, as polimerases do Grupo A são polimerases replicativas e de reparo que são encontradas em organismos eucarióticos e procarióticos (exemplos incluem DNA polimerase T7 e polI de E. coli). As polimerases do Grupo B também são enzimas replicativas e de reparo encontradas em organismos eucarióticos e procarióticos (por exemplo, pol II, pol B, etc.). Os grupos C e D contêm polimerases replicativas que são encontradas em organismos procarióticos e na Euriarchaeota, respectivamente (as polimerases do Grupo C incluem pol III, mas as polimerases do Grupo D não estão bem caracterizadas). As polimerases do Grupo X, Y e RT são enzimas replicativas e de reparo encontradas em eucariotos (Grupo X), eucariotos e procariotos (Grupo Y) e vírus, retrovírus e eucariotos (Grupo RT). Exemplos de polimerases do Grupo X incluem pol β, enquanto as polimerases do Grupo Y incluem pol IV e pol V, e as polimerases do Grupo RT incluem a polimerase do vírus da hepatite B. Algumas dessas polimerases, particularmente aquelas obtidas de organismos termofílicos, encontraram grande uso em vários métodos in vitro, incluindo, mas não se limitando à reação em cadeia da polimerase (PCR). A disponibilidade de polimerases termofílicas possibilitou a automação da PCR. Assim, essas são enzimas muito importantes em aplicações nas quais a PCR é útil. Embora existam numerosas enzimas comercialmente disponíveis (por exemplo, Taq e muitas outras), permanece uma necessidade na técnica de enzimas termoestáveis com altos níveis de fidelidade.
SUMÁRIO DA INVENÇÃO
[005] A presente invenção fornece polipeptídeos de DNA polimerase projetados e composições dos mesmos, bem como polinucleotídeos que codificam os polipeptídeos de DNA polimerase projetados. A invenção também fornece métodos para o uso das composições compreendendo os polipeptídeos de DNA polimerase projetados para diagnóstico e outros fins.
[006] A presente invenção fornece DNA polimerases projetadas compreendendo sequências polipeptídicas com pelo menos 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% ou mais de identidade de sequência com a sequência de referência da SEQ ID NO: 2, 6, 22, 24, 26, 28 e/ou 824, ou um fragmento funcional da mesma, em que a DNA polimerase projetada compreende pelo menos uma substituição ou conjunto de substituições em sua sequência polipeptídica, e em que as posições de aminoácidos da sequência polipeptídica são numeradas com referência à SEQ ID NO: 2, 6, 22, 24, 26, 28 e/ou 824.
[007] A presente invenção também fornece DNA polimerases projetadas compreendendo pelo menos uma substituição ou conjunto de substituições na(s) posição(ões) selecionada(s) a partir de 21, 21/66/247/282, 247/282/575, 282/575, 283/647/702/743, 339/647/661/664/668/702/712, 372/391/702, 391, 391/647/659/661/668/671/712/716, 391/647/659/661/668/671/716, 391/647/659/664/668/702/728/732, 391/647/659/664/671/702, 391/647/661/664/671/702/716, 391/647/671/728, 391/659/702/716/732/737, 391/661/664/668/671/716/737, 391/671, 391/702/712/716/732/743, 647/659/661/664/668/702, 647/659/664/668/702/712/737, 647/659/668/671/716/728, 647/668, 647/668/671/712, 659/702/743, 661/664/668/671/716, 668/702, 671/702, 671/702/716, 702 e 743, e/ou qualquer combinação das mesmas, em que as posições de aminoácidos são numeradas com referência à SEQ ID NO: 6. Em algumas modalidades, pelo menos um conjunto de substituição ou substituição é selecionada a partir de 21E, 21E/66T/247G/282R, 247G/282K/575L, 282K/575L, 283M/647H/702A/743A, 339L/647H/661T/664L/668E/702A/712V, 372S/391E/702A, 391E, 391E/647H/659E/661T/668E/671P/712V/716I, 391E/647H/659E/661T/668E/671P/716I, 391E/647E/659E/664L/702A/728A/732E, 391E/647H/659E/664L/671P/702A, 391E/647H/661T/664L/671P/702A/716I, 391E/647H/671P/728A,
391E/659E/702A/716I/737R, 391E/661T/664L/668E/671P/716I/737R, 391E/671P, 391E/702A/712V/716I/732E/743A, 647H/659E/661T/664L/668E/702A, 647H/659E/668E/702A/712V/737R, 647H/659E/668E/671P/716I/728A, 647H/668E, 647H/668E/671P/712V, 659E/702A/743A, 661T/664L/668E/671P/716I, 668E/671P/716I/702A, 671P/702A, 671P/702A/716I, 702A e 743A, em que as posições de aminoácidos são numeradas com referência à SEQ ID NO: 6.
[008] A presente invenção também fornece DNA polimerases projetadas compreendendo pelo menos uma substituição ou conjunto de substituições na(s) posição(ões) selecionada(s) a partir de 18/387, 24/719, 43/528, 48/760, 101/646, 108/679, 223, 257, 282, 359, 360, 361, 362, 376/619, 390, 391, 394, 394/399, 420, 421, 478, 502, 506, 514, 515, 521, 528, 583/730, 603, 619, 631, 646, 655, 662, 666, 668, 685, 691, 702, 721, 738, 754, 760 e 761, e/ou qualquer combinação das mesmas, em que as posições de aminoácidos são numeradas com referência à SEQ ID NO: 6. Em algumas modalidades, pelo menos um conjunto de substituição ou substituição é selecionada a partir de 18H/387C, 24M/719A, 43L/528S, 48H/760H, 101S/646R, 108C/679S, 223N, 257R, 257W, 282R, 359C, 360R, 360T, 360V, 361G, 361M, 361W, 362R, 376V/619F, 390A, 390G, 390Q, 391A, 391G, 394G, 394M/399R, 394N, 394T, 420A, 420G, 420I, 420K, 420V, 421M, 421Q, 478L, 502A, 506R, 514R, 515F, 515G, 515R, 521P, 521T, 528A, 528S, 583N/730A, 603R, 619C, 619V, 631G, 646R, 655W, 662C, 666T, 668C, 668L, 685D, 691S, 702A, 721R, 721T, 738V, 754C, 760F, 760G, 761R e 761W, e/ou quaisquer combinações das mesmas, em que as posições de aminoácidos são numeradas com referência à SEQ ID NO: 6. Em algumas modalidades, pelo menos uma substituição ou conjunto de substituições é selecionada a partir de Y18H/E387C, K24M/K719A, P43L/T528S, Y48H/E760H, P101S/K646R, R108C/Q679S, D223N, M257R, M257W, N282R, R359C, S60360, S60360T, S60360R, S60360, S60360R, S60360, S60360360360, S60360360. S361G, S361M, S361W, T362R,
A376V/T619F, Y390A, Y390G, Y390Q, K391A, K391G, L394G, L394M/L399R, L394N, L394T, R420A, R420G, R420I, R420K, R420V, S421M, S421Q, K478L, L502A, S506R, P514R, K515F, K515G, K515R, K521P, K521T, T528A, T528S, S583N/L730A, V603R, T619C, T619V, E631G, K646R, E655W, E662C, K666T, R668C, R668L, K685D, G691S, T702A, S721R, S721T, K738V, A754C, E760F, E760G, A761R e A761W, e/ou quaisquer combinações das mesmas, em que as posições de aminoácidos são numeradas com referência à SEQ ID NO: 6.
[009] A presente invenção também fornece DNA polimerases projetadas compreendendo pelo menos uma substituição ou conjunto de substituições na(s) posição(ões) selecionada(s) a partir de 174/361/394/666/668/721, 360/391, 361/391/659, 361/394/420/528/646/666/721/743, 361/394/420/528/666, 361/394/420/646/666/702/721/743, 361/528/646/666, 361/528/646/702/721, 361/528/666, 361/646, 394/420, 502/507/695, 528/646/659/668/743, 528/666, 528/668, 528/743, 619, 666 e 685/691/743, e/ou quaisquer combinações das mesmas, em que as posições de aminoácidos são numeradas com referência à SEQ ID NO: 22. Em algumas modalidades, pelo menos uma substituição ou conjunto de substituições é selecionada a partir de 174V/361G/394T/666T/668L/721T, 360T/391G, 361G/394T/420A/528A/666T, 361G/394T/420A/528S/646R/666T/721T/743P, 361G/528A/646R/666T, 361G/528A/666T, 361G/528S/646R/702T/721T, 361G/646R, 361M/391A/659D, 361W/394T/420A/646R/666T/702T/721T/743P, 394G/420K, 502I/507F/695A, 528S/646R/659D/668L/743P, 528S/666T, 528S/668L, 528S/743P, 619C, 666T e 685D/691S/743P, e/ou qualquer combinação das mesmas, em que as posições de aminoácidos são numeradas com referência à SEQ ID NO: 22. Em algumas modalidades, pelo menos uma substituição ou conjunto de substituições é selecionada a partir de A174V/S361G/L394T/K666T/R668L/S721T, S360T/K391G,
S361G/L394T/R420A/T528A/K666T, S361G/L394T/T64R6R28420A/K666T/S721T/A743P, S361G/T528A/K646R/K666T, S361G/T528A/K666T, S361G/T528S/K646R/A702T/S721T, S361G/K646R, S361M/K391A/E659D, S361W/L394T/R420A/K646R/K666T/A702T/S721T/A743P, L394G/R420K, L502I/Y507F/S695A, T528S/K646R/E659D/R668L/A743P, T528S/K666T, T528S/R668L, T528S/A743P, T619C, K666T, e K685D/G691S/A743P e/ou quaisquer combinações das mesmas, em que as posições de aminoácidos são numeradas com referência à SEQ ID NO: 22.
[0010] A presente invenção também fornece DNA polimerases projetadas compreendendo pelo menos uma substituição ou conjunto de substituições na(s) posição(ões) selecionada(s) a partir de 100, 277, 280, 281, 283, 339, 401, 468, 479, 480, 482, 489, 490, 491, 496, 497 e 498, e/ou quaisquer combinações das mesmas, em que as posições de aminoácidos são numeradas com referência à SEQ ID NO: 22. Em algumas modalidades, pelo menos uma substituição ou conjunto de substituições é selecionada a partir de 100Y, 277A, 280Y, 281C, 283V, 339M, 401S, 468N, 479P, 479Q, 480D, 480M, 482Q, 482V, 489V, 490L, 491L, 496A, 497D e 498C, e/ou qualquer combinação das mesmas, em que as posições de aminoácidos são numeradas com referência à SEQ ID NO: 22. Em algumas modalidades, pelo menos um conjunto de substituição ou substituição é selecionada a partir de H100Y, V277A, T280Y, I281C, L283V, F339M, G401S, G468N, K479P, K479Q, K480D, K480M, K482Q, K482V, E489V, K490L, K491A, Q497D e R498C e/ou quaisquer combinações das mesmas, em que as posições de aminoácidos são numeradas com referência à SEQ ID NO: 22.
[0011] A presente invenção também fornece DNA polimerases projetadas compreendendo pelo menos uma substituição ou conjunto de substituições na(s) posição(ões) selecionada(s) a partir de 15/134/482/490/497/671/685, 234/497/647, 257/390/420, 257/390/420/647,
257/401/420, 257/401/420/482/647/671/685, 257/482/497/647, 257/647, 257/671/685/702, 281, 281/391/478, 281/391/478/685, 281/391/488/492, 281/391/495/561/659/668, 281/391/659/668, 281/391/668, 281/478/659/685/702, 281/478/668, 281/488, 281/488/492/495/659/668, 281/488/492/668/702, 281/488/495, 281/488/495/668, 281/492/495/668, 281/492/495/668/702, 281/668, 390/401/716, 390/420, 390/491/671, 390/497, 390/671/685, 391, 391/478, 391/478/479/668, 391/478/492/668, 391/479/659/668, 391/488/492/659/685, 391/488/492/668, 391/488/495/668/685/702, 391/492/495, 391/492/495/659, 391/492/515/659/685, 391/495/659, 401, 401/482/659/671/702, 401/490, 401/490/659/671, 401/671, 420, 420/482/659/702, 420/490, 420/490/659/661/671, 420/659/702, 420/661/671, 420/685, 478, 478/479, 478/479/668, 478/479/702, 478/488/659, 478/488/668/685/702, 478/515, 479/492, 479/659/678, 482/497/647/716, 482/497/671/685, 482/671/702/716, 488, 488/492, 488/492/495, 488/495, 488/495/685, 490/497/661/671/685/702/716, 492, 492/495/659/668, 492/659/685, 492/668/685/712, 492/668/712, 495, 495/659, 495/659/685, 497/647, 497/647/659/671, 497/659/691/716, 497/661, 497/661/671, 497/671/702, 497/671/716, 497/685, 497/702, 515, 659, 659/691, e 671, e/ou quaisquer combinações das mesmas, em que as posições de aminoácidos são numeradas com referência à SEQ ID NO: 24. Em algumas modalidades, pelo menos uma substituição ou conjunto de substituição é selecionada a partir de 15N/134N/482Q/490L/497D/671P/685K, 234V/497D/647H, 257W/390H/420Q, 257W/390Q/420Q/647H, 257W/401S/420Q, 257W/401S/420Q/482Q/647H/671P/685K, 257W/482Q/497D/647H, 257W/647H, 257W/671P/685K/702T, 281C, 281C/391E/478L/685K, 281C/391E/488R/492V, 281C/391G/478L, 281C/391G/495N/561A/659D/668E, 281C/391G/659D/668E, 281C/391G/668E, 281C/478L/659D/685K/702T, 281C/478L/668E, 281C/488R,
281C/488R/492V/495N/659D/668E, 281C/488R/492V/668E/702T, 281C/488R/495N, 281C/488R/495N/668E, 281C/492V/495N/668E, 281C/492V/495N/668E/702T, 281C/668E, 390Q/401S/716I, 390Q/420Q, 390Q/491D/671P, 390Q/497D, 390Q/671P/685K, 391E, 391E/478L, 391E/478L/479P/668E, 391E/488R/492V/659D/685K, 391E/488R/492V/668E, 391E/492V/495N/659D, 391G/478L/492V/668E, 391G/479P/659D/668E, 391G/479P/659D/668E/488R/495N/668E/685K/702T, 391G/492V/495N, 391G/492V/515L/659D/685K, 391G/495N/659D, 401S, 401S/482Q/659D/671P/702T, 401S/490L, 401S/490L, 401S/490L/490L/659D/671P, 401S/671P, 420G, 420Q, 420Q/482Q/659D/702T, 420Q/490L, 420Q/490L/659D/661T/671P, 420Q/659D/702T, 420Q/661T/671P, 420Q/685K, 478L, 478L/479P, 478L/479P/668E, 478L/479P/702T, 478L/488R/659D, 478L/488R/668E/685K/702T, 478L/515L, 479P/492V, 479P/659D/678G, 482Q/497D/647H/716I, 482Q/497D/647H/716I, 497D/671P/685K, 482Q/671P/702T/716I, 488R, 488R/492V, 488R/492V/495N, 488R/495N, 488R/495N/685K, 490L/497D/661T/671P/685K/702T/716I, 492V, 492V/495N/659D/668E, 492V/659D/685K, 492V/668E/685K/712V, 492V/668E/712V, 495N, 495N/659D, 495N/659D/685K, 497H/647H, 497D/647 659D/671P, 497D/659D/691G/716I, 497D/661T, 497D/661T/671P, 497D/671P/702T, 497D/671P/716I, 497D/685K, 497D/702T, 515L, 659D, 659D, 659D e 671P, e/ou quaisquer combinações das mesmas, em que as posições de aminoácidos são numeradas com referência à SEQ ID NO: 24. Em algumas modalidades, pelo menos uma substituição ou conjunto de substituições é selecionada a partir de D15N/D134N/K482Q/K490L/Q497D/L671P/D685K, A234V/Q497D/D647H, M257W/Y390H/R420Q, M257W/Y390Q/R420Q/D647H, M257W/G401S/R 420Q, M257W/G401S/R420Q/K482Q/D647H/L671P/D685K, M257W/K482Q/Q497D/D647H, M257W/D647H, M257W/L671P/D685K/A702T, I281C, I281C/K391E/K478L/D685K,
I281C/K391E/I488R/M492V, I281C/K391G/K478L, I281C/K391G/Y495N/T561A/E659D/R668E, I281C/K391G/E659D/R668E, I281C/K391G/R668E, I281C/K478L/E659D/D685K/A702T, I281C/K478L/R668E, I281C/I488R, I281C/I488R/M492V/Y495N/E659D/R668E, I281C/I488R/M492V/R668E/A702T, I281C/I488R/Y495N, I281C/I488R/Y495N/R668E, I281C/M492V/Y495N/R668E, I281C/M492V/Y495N/R668E/A702T, I281C/R668E, Y390Q/G401S/L716I, Y390Q/R420Q, Y390Q/K491D/L671P, Y390Q/Q497D, Y390Q/L671P/D685K, K391E, K391E/K478L, K391E/K478L/K479P/R668E, K391E/I488R/M492V/E659D/D685K, K391E/I488R/M492V/R668E, K391E/M492V/Y495N/E659D, K391G/K478L/M492V/R668E, K391G/K479P/E659D/R668E, K391G/I488R/Y495N/R668E/D685K/A702T, K391G/M492V/Y495N, K391G/M492V/K515L/E659D/D685K, K391G/Y495N/E659D, G401S, G401S/K482Q/E659D/L671P/A702T, G401S/K490L, G401S/K490L/E659D/L671P, G401S/L671P, R420G, R420Q, R420Q/K482Q/E659D/A 702T, R420Q/K490L, R420Q/K490L/E659D/V661T/L671P, R420Q/E659D/A702T, R420Q/V661T/L671P, R420Q/D685K, K478L, K478L/K479P, K478L/K479P/R668E, K478L/K479P/A702T, K478L/I488R/E659D, K478L/I488R/R668E/D685K/A702T, K478L/K515L, K479P/M492V, K479P/E659D/E678G, K482Q/Q497D/D647H/L716I, K482Q/Q497D/L671P/D685K, K482Q/L671P/A702T/L716I, I488R, I488R/M492V, I488R/M492V/Y495N, I488R/Y495N, I488R/Y495N/D685K, K490L/Q497D/V661T/L671P/D685K/A702T/L716I, M492V, M492V/Y495N/E659D/R668E, M492V/E659D/D685K, M492V/R668E/D685K/I712V, M492V/R668E/I712V, Y495N, Y495N/E659D, Y495N/E659D/D685K, Q497D/D647H, Q497D/D647H/E659D/L671P, Q497D/E659D/S691G/L716I, Q497D/V661T, Q497D/V661T/L671P,
Q497D/L671P/A702T, Q497D/L671P/L716I, Q497D/D685K, Q497D/A702T, K515L, E659D, E659D/S691G, e L671P, em que as posições de aminoácidos são numeradas com referência à SEQ ID NO: 24.
[0012] A presente invenção também fornece DNA polimerases projetadas compreendendo pelo menos uma substituição ou conjunto de substituições na(s) posição(ões) selecionada(s) a partir de 55/579, 108, 108/521, 156/451, 236/755, 240, 247, 248, 256, 298, 299, 299/319, 302, 309, 316, 319, 350, 356, 357, 358, 370, 384, 385, 386, 389, 406, 407, 411, 415, 440, 443, 447, 450, 451, 520, 536, 539, 540, 544, 550/575, 566, 568, 575, 579, 579/767, 600, 601, 601/638, 609/648, 624, 634, 648, 656, 672, 758, 765, 767, 772, 777, 778, 779, 780, 782, 784 e 785, e/ou quaisquer combinações das mesmas, em que as posições de aminoácidos são numeradas com referência à SEQ ID NO: 24. Em alguns modalidades, a pelo menos uma substituição ou conjunto de substituição é selecionada a partir de 55E/579V, 55G/579A, 108A, 108C, 108F, 108G, 108S, 108V/521R, 108Y, 156L/451C, 236R/755T, 240A, 240Y, 247I, 247S, 248P, 256A, 298E, 299A, 299A/319G, 299E, 299Q, 299R, 302F, 309V, 316G, 319E, 319H, 319S, 350V, 356N, 356P, 356V, 357S, 358I, 370D, 370S, 370T, 384R, 385L, 386G, 386P, 386V, 389Q, 389R, 406V, 407A, 407L, 407R, 407S, 407Y, 411H, 415V, 440H, 443V, 447A, 447L, 450L, 450Y, 451G, 520C, 536N, 536Q, 536T, 539G, 539H, 539Q, 539G, 539H, 539 539S, 539V, 540G, 544G, 550S/575Q, 566G, 566Q, 568G, 568L, 575F, 575T, 579A, 579M, 579Q, 579Q/767Q, 579R, 579S, 600A, 601I, 601L/638L, 601M, 601L/6381 609C/648Q, 624C, 624S, 634R, 648Q, 648R, 656A, 656Y, 672G, 758V, 765D, 767G, 767T, 772G, 777D, 778Q, 779D, 780A, 780W, 782S, 782V, 784-, e 785G, e/ou quaisquer combinações das mesmas, em que as posições de aminoácidos são numeradas com referência à SEQ ID NO: 24. Em algumas modalidades, pelo menos uma substituição ou conjunto de substituições é selecionada a partir de D55E/N579V, D55G/N579A, R108A, R108C, R108F, R108G, R108S, R108V/K521R, R108Y, F156L/V451C, K236R/V755T,
R240A, R240Y, K247I, K247S, E248P, R256A, K298E, T299A, T299A/K319G, T299E, T299Q, T299R, K302F, A309V, E316G, K319E, K319H, K319S, I350V, D356N, D356P, D356V, V357S, S358I, L370D, L370S, L370T, K384R, P385L, D386G, D38406P, D386V, P386R9, E386R9, E407A, E407L, E407R, E407S, E407Y, W411H, I415V, E440H, E443V, I447A, I447L, I450L, I450Y, V451G, S520C, E536N, E536Q, E536T, I539G, I539H, I539Q, I539S, I539V, K540G, E544G, V550S/R575Q, K566G, K566Q, E568G, E568L, R575F, R575T, N579A, N579M, N579Q, N579Q/E767Q, N579R, N579S, G600A, F601I, F601L/A638L, F601M, F601V, A609C/G648Q, V624C, V624S, K634R, G648Q, G648R, I656A, I656Y, E672G, I758V, R765D, E767G, E767T, Q772G, T777D, G778Q, L779D, D780A, D780W, W782S, W782V, K784- e qualquer combinação das mesmas, e em que as posições de aminoácidos são numeradas com referência à SEQ ID NO: 24.
[0013] A presente invenção também fornece DNA polimerases projetadas compreendendo pelo menos uma substituição ou conjunto de substituições na(s) posição(ões) selecionada(s) a partir de 248, 281, 281/302, 281/492, 302/401, 339/491/492/579/712, 390/466/539/712 e 661, e/ou quaisquer combinações das mesmas, em que as posições de aminoácidos são numeradas com referência à SEQ ID NO: 26. Em algumas modalidades, pelo menos uma substituição ou conjunto de substituições é selecionada a partir de 248P, 281I, 281I/302F, 281I/492S, 302F/401S, 339A/491D/492V/579A/712V, 390Q/466A/539S/712V e 661T, e/ou quaisquer combinações das mesmas, em que as posições de aminoácidos são numeradas com referência à SEQ ID NO:
26. Em algumas modalidades, pelo menos uma substituição ou conjunto de substituições é selecionada a partir de E248P, C281I, C281I/K302F, C281I/M492S, K302F/G401S, F339A/K491D/M492V/N579A/I712V, Y390Q/I466A/I539S/I712V e V661T, e/ou quaisquer combinações das mesmas, em que as posições de aminoácidos são numeradas com referência à SEQ ID NO: 26.
[0014] A presente invenção também fornece DNA polimerases projetadas compreendendo pelo menos uma substituição ou conjunto de substituições na(s) posição(ões) selecionada(s) a partir de 240/579, 240/579/702, 248/391/539/579/659/702, 248/391/659, 302/391/579, 339/390/420/425/466/490/491/515/702, 391, 391/482, 391/659, 420/515, 579, 579/659/702, 579/702 e 659/702 e/ou qualquer combinação das mesmas, em que as posições de aminoácidos são numeradas com referência à SEQ ID NO: 28. Em algumas modalidades, pelo menos uma substituição ou conjunto de substituições é selecionada a partir de 240A/579A, 240A/579A/702A, 248P/391G/539S/579A/659D/702A, 248P/391G/659D, 302F/391G/579A, 339A/390Q/420G/425R/466A/490L/491P/515L/702A, 391G, 391G/482Q, 391G/659D, 420G/515F, 579A, 579A/659D/702A, 579A/702A e 659D/702A e/ou quaisquer combinações das mesmas, em que as posições de aminoácidos são numeradas com referência à SEQ ID NO: 28. Em algumas modalidades, pelo menos uma substituição ou conjunto de substituições é selecionada a partir de R240A/N579A, R240A/N579A/T702A, E248P/K391G/I539S/N579A/E659D/T702A, E248P/K391G/E659D, K302F/K391G/N579A, F339A/Y390Q/R420G/S425R/I466A/K490L/K491P/K515L/T702A, K391G, K391G/K482Q, K391G/E659D, R420G/K515F, N579A, N579A/E659D/T702A, N579A/T702A e E659D/T702A, e/ou quaisquer combinações das mesmas, em que as posições de aminoácidos são numeradas com referência à SEQ ID NO: 28.
[0015] A presente invenção também fornece DNA polimerases projetadas compreendendo pelo menos uma substituição ou conjunto de substituições na(s) posição(ões) selecionada(s) de 257, 420, 515 e 521 e/ou quaisquer combinações das mesmas, em que as posições de aminoácidos são numeradas com referência à SEQ ID NO: 6. Em algumas modalidades, pelo menos uma substituição ou conjunto de substituições é selecionado a partir de
257W, 420Q, 515L e 521S e/ou quaisquer combinações das mesmas, em que as posições de aminoácidos são numeradas com referência à SEQ ID NO: 6. Em algumas modalidades, pelo menos uma substituição ou conjunto de substituições é selecionado a partir de M257W, R420Q, K515L e K521S, e/ou quaisquer combinações das mesmas, em que as posições de aminoácidos são numeradas com referência à SEQ ID NO: 6
[0016] A presente invenção também fornece DNA polimerases projetadas compreendendo pelo menos uma substituição ou conjunto de substituições na(s) posição(ões) selecionada(s) a partir de 71/361/702/721/738, 277, 281, 339, 391/491, 401, 479, 480, 482, 488, 490, 491, 492, 495, 497, 528/646/659/668/743, 702/743 e 743, e/ou qualquer combinação das mesmas, em que as posições de aminoácidos são numeradas com referência à SEQ ID NO: 22. Em algumas modalidades, pelo menos um conjunto de substituição ou substituição é selecionada a partir de 71D/361M/702T/721R/738V, 277A, 281C, 339M, 391N/491Q, 401S, 479P, 480M, 482Q, 482V, 488R, 490L, 490Y, 491D, 492V, 495N, 497D, 528S/646R/659D/668L/743P, 702T/743P e 743P, e/ou quaisquer combinações das mesmas, em que as posições de aminoácidos são numeradas com referência à SEQ ID NO: 22. Em algumas modalidades, pelo menos uma substituição ou conjunto de substituições é selecionado a partir de G71D/S361M/A702T/S721R/K738V, V277A, I281C, F339M, K391N/K491Q, G401S, K479P, K480M, K482Q, K482V, I488R, K490L, K490Y, K491D, M492V, Y49 5N, Q497D, T528S/K646R/E659D/R668L/A743P, A702T/A743P e A743P e/ou quaisquer combinações das mesmas, em que as posições de aminoácidos são numeradas com referência à SEQ ID NO: 22.
[0017] A presente invenção também fornece DNA polimerases projetadas compreendendo pelo menos uma substituição ou conjunto de substituições na(s) posição(ões) selecionada(s) a partir de 240, 370, 385, 539, 540, 550/575, 634 e 777, e/ou quaisquer combinações das mesmas, em que as posições de aminoácidos são numeradas com referência à SEQ ID NO: 24. Em algumas modalidades, pelo menos uma substituição ou conjunto de substituições é selecionada a partir dentre 240A, 370T, 385L, 539V, 540G, 540Q, 550S/575Q, 634R, e 777D e 743P e/ou quaisquer combinações das mesmas, em que as posições de aminoácidos são numeradas com referência à SEQ ID NO: 24. Em algumas modalidades, pelo menos uma substituição ou conjunto de substituições é selecionada a partir de R240A, L370T, P385L, I539V, K540G, K540Q, V550S/R575Q, K634R e T777D, e/ou quaisquer combinações das mesmas, em que as posições de aminoácidos são numeradas com referência à SEQ ID NO:
24.
[0018] A presente invenção também fornece DNA polimerases projetadas compreendendo pelo menos uma substituição ou conjunto de substituições na(s) posição(ões) selecionada(s) a partir de 390/391, 482 e 515, e/ou qualquer combinação das mesmas, em que as posições de aminoácidos são numeradas com referência à SEQ ID NO: 28. Em algumas modalidades, pelo menos uma substituição ou conjunto de substituição é selecionado a partir de 390Q/391G, 482Q, 515F e 515L, e/ou quaisquer combinações das mesmas, em que as posições de aminoácidos são numeradas com referência para SEQ ID NO: 28. Em algumas modalidades, pelo menos um conjunto de substituição ou substituição é selecionada a partir de Y390Q/K391G, K482Q, K515F e K515L, e/ou quaisquer combinações das mesmas, em que as posições de aminoácidos são numeradas com referência à SEQ ID NO: 28.
[0019] A presente invenção também fornece DNA polimerases projetadas compreendendo pelo menos uma substituição ou conjunto de substituições na(s) posição(ões) selecionada(s) a partir de 281, 281/579, e/ou qualquer combinação das mesmas, em que as posições de aminoácidos são numeradas com referência à SEQ ID NO: 28. Em algumas modalidades, pelo menos uma substituição ou conjunto de substituições é selecionada a partir de 281I e 281I/579A, e/ou quaisquer combinações das mesmas, em que as posições de aminoácidos são numeradas com referência à SEQ ID NO: 28. Em algumas modalidades, pelo menos uma substituição ou conjunto de substituições é selecionada a partir de C281I e C281I/N579A, e/ou quaisquer combinações das mesmas, em que as posições de aminoácidos são numeradas com referência à SEQ ID NO: 28.
[0020] A presente invenção também fornece DNA polimerases projetadas compreendendo pelo menos uma substituição ou conjunto de substituições na(s) posição(ões) selecionada(s) a partir de 13, 15, 19, 26, 52, 55, 61, 80, 81, 82, 95, 111, 118, 141, 148, 152, 156, 162, 163, 179, 181, 187, 189, 191, 196, 208, 221, 229, 231, 242, 258, 274, 297, 313, 314, 317, 325, 326, 333, 349, 377, 387, 394, 395, 411, 447, 450, 451, 453, 469, 482, 496, 502, 520, 521, 537, 563, 564, 564/572, 567, 569, 575, 580, 601, 603, 619, 620, 648, 667, 673, 690, 705, 719, 731, 758, 761, 772, 774, 775, 778, 783 e 784, e/ou qualquer combinação das mesmas, em que as posições de aminoácidos são numeradas com referência à SEQ ID NO: 824. Em algumas modalidades, pelo menos uma substituição ou conjunto de substituições é selecionada a partir de 13T, 15G, 15W, 19S, 26S, 52M, 55K, 55P, 61A, 61R, 80G, 81T, 82Q, 95R, 111A, 111V, 118V, 141R, 141S, 148P, 152T, 156R, 162Q, 163A, 163G, 163K, 163P, 163Q, 163W, 179G, 181R, 187L, 189G, 191A, 191N, 196A, 196R, 208C, 221G, 229S, 231H, 242 L, 258L, 258R, 258S, 274I, 274L, 274V, 297F, 313F, 314V, 317P, 317R, 317T, 325Q, 326K, 333R, 349I, 377W, 387A, 387S, 394G, 394R, 395H, 411T, 447V, 450 V, 451Y, 453R, 469H, 469L, 482V, 496S, 502W, 520C, 521V, 537G, 537K, 563L, 564D/572G, 564Q, 567G, 569G, 569L, 569T, 575H, 575W, 580A, 580I, 601 603R, 619L, 619V, 620K, 648F, 667N, 667T, 673M, 690L, 705L, 719A, 731G, 758V, 761P, 772S, 774R, 775F, 775G, 778P, 778R, 783Q, 783R e 784E, em que as posições de aminoácido são numeradas com referência à SEQ ID NO: 824. Em algumas modalidades adicionais, pelo menos uma substituição ou conjunto de substituição é selecionada a partir de I13T, D15G, D15W, I19S, I26S, L52M, D55K, D55P, E61A, E61R, V80G, K81T, V82Q, K95R, I111A, I111V, I118V, E141R, E141S, L148P, D152T, F156R, E162Q,
F163A, F163G, F163K, F163P, F163Q, F163W, A179G, V181R, I187L, L189G, Y191A, Y191N, S196A, S196R, V208C, N221G, Y229S, I231H, V242L, G258L, G258R, G258S, F274I, F274L, F274V, G297F, E313F, T314V, S317P, S317R, S317T, S325Q, M325Q R, L349I, R377W, E387A, E387S, L394G, L394R, R395H, W411T, I447V, I450V, V451Y, Y453R, D469H, D469L, K482V, R496S, L503LW, S520D5/M564, K21L2W, S520C, V451Y, Y453R. G564Q, P567G, I569G, I569L, I569T, R575H, R575W, Y580A, Y580I, F601I, V603R, T619L, T619V, R620K, G648F, Y667N, Y667T, K673M, I690L, I705L, K719A, L731G, I758V, A761P, Q772S, S774R, K775F, K775G, G778P, G778R, L783Q, L783R e K784E, em que as posições de aminoácidos são numeradas com referência à SEQ ID NO: 824.
[0021] A presente invenção também fornece DNA polimerases projetadas compreendendo pelo menos uma substituição ou conjunto de substituições na(s) posição(ões) selecionada(s) a partir de 15/447/569/775/783/784, 82/242/569, 82/450/567/569, 313, 314/447/569/783/784, 537/667, 567/569/667 e 569, e/ou quaisquer combinações das mesmas, em que as posições de aminoácidos são numeradas com referência à SEQ ID NO: 824. Em algumas modalidades, o pelo menos um conjunto de substituição ou substituição é selecionada a partir de 15W/447V/569T/775F/783Q/784E, 82Q/242L/569L, 82Q/242L/569L, 82Q/450V/567G/569G, 313F, 314V/447V/569T/783Q/784E, 537K/667N, 567G/569G/667N e 569T, em que as posições de aminoácidos são numeradas com referência à SEQ ID NO: 824. Em algumas modalidades adicionais, pelo menos uma substituição ou conjunto de substituição é selecionada a partir de D15W/I447V/I569T/K775F/L783Q/K784E, V82Q/V242L/I569L, V82Q/I450V/P567G/I569G, E313F, T314V/I447V/I569T/L783Q/K784E, M537K/Y667N, P567G/I569G/Y667N, e I569T, em que as posições de aminoácidos são numeradas com referência para SEQ ID NO: 824.
[0022] A presente invenção também fornece DNA polimerases projetadas, em que as DNA polimerases projetadas compreendem sequências de polipeptídeos que são pelo menos 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% ou mais idênticas à sequência de pelo menos uma variante da DNA polimerase projetada apresentada na Tabela 3.1, 3.2, 3.3,3.4, 3.5, 3.6, 3.7,
3.8, 3.9, 4.1, 4.2, 4.3, 4.4, 4.5, 6.2 e/ou 6.3. Em algumas modalidades, a DNA polimerase projetada tem atividade de DNA polimerase. Em algumas modalidades, a DNA polimerase projetada tem pelo menos uma propriedade melhorada, em comparação com uma DNA polimerase de tipo selvagem. Em algumas modalidades, a DNA polimerase de tipo selvagem é selecionada a partir de Pfu DNA polimerase de Pyrococcus furiosus, Grupo B de DNA polimerase de Thermococcus sp. cepa 2319x1 e Taq DNA polimerase de Thermus aquaticus. Em algumas modalidades, a DNA polimerase projetada tem pelo menos uma propriedade melhorada, em comparação com a DNA polimerase de tipo selvagem, em que a propriedade melhorada é selecionada a partir da produção de produto aumentado em reações em cadeia de polimerase, maior fidelidade e maior termoestabilidade. Em algumas modalidades, a DNA polimerase projetada produz um maior rendimento do produto em reações em cadeia da polimerase do que a DNA polimerase de tipo selvagem. Em algumas modalidades, a DNA polimerase de tipo selvagem é selecionada a partir de Pfu DNA polimerase de Pyrococcus furiosus, Grupo B de DNA polimerase de Thermococcus sp. cepa 2319x1 e Taq DNA polimerase de Thermus aquaticus. Em algumas modalidades adicionais, a DNA polimerase projetada exibe maior fidelidade do que a DNA polimerase de tipo selvagem. Em algumas modalidades, a DNA polimerase de tipo selvagem é selecionada a partir de Pfu DNA polimerase de Pyrococcus furiosus, Grupo B de DNA polimerase de Thermococcus sp. cepa 2319x1 e Taq DNA polimerase de Thermus aquaticus. Em ainda algumas modalidades adicionais, a DNA polimerase projetada exibe maior termoestabilidade do que a DNA polimerase de tipo selvagem. Em algumas outras modalidades, a DNA polimerase de tipo selvagem é selecionada a partir de Pfu DNA polimerase de Pyrococcus furiosus, Grupo B de DNA polimerase de Thermococcus sp. cepa 2319x1 e Taq DNA polimerase de Thermus aquaticus. Em ainda algumas outras modalidades, a DNA polimerase projetada é purificada.
[0023] A presente invenção também fornece sequências de polinucleotídeos que codificam as DNA polimerases projetadas fornecidas neste documento. Em algumas modalidades, a sequência polinucleotídica codifica pelo menos uma DNA polimerase projetada fornecida neste documento. Em algumas modalidades adicionais, a sequência polinucleotídica compreende pelo menos 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% ou mais de identidade de sequência com a sequência de referência da SEQ ID NO: 1, 5, 21, 23, 25, 27 e/ou 823, ou um fragmento funcional da mesma, em que o polipeptídeo projetado compreende pelo menos uma substituição em uma ou mais posições de aminoácidos. Em algumas modalidades adicionais, a sequência polinucleotídica codifica pelo menos uma DNA polimerase projetada que compreende uma sequência com pelo menos 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% ou mais de identidade de sequência com a sequência de referência da SEQ ID NO: 2, 6, 22, 24, 26, 28 e/ou 824. Em algumas modalidades adicionais, a sequência polinucleotídica compreende SEQ ID NO: 1, 5, 21, 23, 25, 27 e/ou 823. Em algumas modalidades adicionais, a sequência polinucleotídica está operacionalmente ligada a uma sequência de controle. Em ainda algumas modalidades adicionais, a sequência polinucleotídica é otimizada por códons.
[0024] A presente invenção também fornece vetores de expressão compreendendo pelo menos uma sequência polinucleotídica fornecida neste documento. A presente invenção também fornece células hospedeiras transformadas com pelo menos um vetor de expressão fornecido neste documento.
[0025] A presente invenção também fornece métodos de produção de um polipeptídeo de DNA polimerase projetada em uma célula hospedeira, compreendendo cultivar uma célula hospedeira fornecida neste documento, sob condições de cultura adequadas, de modo que pelo menos uma DNA polimerase projetada seja produzida. Em algumas modalidades, os métodos compreendem ainda recuperar pelo menos uma DNA polimerase projetada da cultura e/ou das células hospedeiras. Em algumas modalidades adicionais, os métodos compreendem ainda a etapa de purificar pelo menos uma DNA polimerase projetada. A presente invenção também fornece composições compreendendo pelo menos uma DNA polimerase projetada fornecida neste documento.
[0026] A presente invenção também fornece sistemas de ensaio de alto rendimento para a determinação da fidelidade da DNA polimerase. A presente invenção também fornece métodos para determinação de fidelidade de alto rendimento de uma DNA polimerase, compreendendo: i) fornecer: pelo menos uma DNA polimerase; um plasmídeo repórter compreendendo genes que codificam uma primeira proteína repórter e uma segunda proteína repórter e um marcador de seleção; um sistema de amplificação, incluindo um termociclador e reagentes para conduzir uma reação em cadeia da polimerase; e um sistema de purificação; um sistema de transformação, incluindo células hospedeiras competentes; e um citômetro de fluxo; ii) expor a DNA polimerase e o plasmídeo repórter ao sistema de amplificação, em condições tais que a construto repórter seja amplificada pela DNA polimerase para produzir o produto de PCR; iii) circularizar os amplicons de PCR para fornecer amplicons de PCR circularizados; vi) transformar os amplicons de PCR usando o sistema de transformação para produzir células transformadas; vii) analisar as células transformadas usando o citômetro de fluxo; e viii) determinar a fidelidade da DNA polimerase. Em algumas modalidades, os métodos compreendem pelo menos uma DNA polimerase fornecida neste documento (por exemplo, conforme fornecido em qualquer um dos Exemplos e Tabelas). Em algumas modalidades, os métodos compreendem ainda a etapa de induzir as células transformadas. Em algumas modalidades adicionais, a primeira proteína repórter compreende proteína fluorescente verde. Em ainda algumas modalidades adicionais, a segunda proteína repórter compreende dsRed. Ainda em modalidades adicionais, o marcador de seleção compreende cloranfenicol acetiltransferase. Em algumas outras modalidades, a circularização dos amplicons de PCR é conduzida usando pelo menos uma ligase. Em algumas modalidades, os amplicons de PCR são purificados. Em algumas modalidades adicionais, os métodos compreendem ainda determinar a melhoria na fidelidade da polimerase em comparação com uma DNA polimerase de referência. Em algumas modalidades, a DNA polimerase de referência é uma polimerase de tipo selvagem. Em algumas outras modalidades, a polimerase de tipo selvagem é selecionada a partir de Pfu DNA polimerase de Pyrococcus furiosus, Grupo B de DNA polimerase de Thermococcus sp. cepa 2319x1 e Taq DNA polimerase de Thermus aquaticus. Em algumas modalidades, a taxa de erro relativa para cada variante é calculada dividindo a frequência da primeira proteína fluorescente (por exemplo, apenas verde) para a variante pela frequência para um controle parental. Em algumas modalidades adicionais, a melhoria na fidelidade da polimerase é relatada e a taxa de erro relativa determinada.
DESCRIÇÃO DOS DESENHOS
[0027] A Figura 1 fornece um gráfico que mostra as taxas de erro relativas das polimerases testadas como descrito no Exemplo 5.
[0028] A Figura 2 fornece um gráfico que mostra a uniformidade de cobertura para o ressequenciamento do genoma microbiano inteiro para um organismo com um baixo teor de GC (Staphylococcus epidermidis, 32% de GC). A cobertura normalizada é plotada como uma função do conteúdo de GC para cada genoma. O ideal teórico para cobertura normalizada é plotado como uma linha tracejada (1.0).
[0029] A Figura 3 fornece um gráfico que mostra a uniformidade de cobertura para o ressequenciamento do genoma microbiano inteiro para um organismo com um alto conteúdo de GC (Rhodobacter sphaeroides, 69% de GC). A cobertura normalizada é plotada como uma função do conteúdo de GC para cada genoma. O ideal teórico para cobertura normalizada é plotado como uma linha tracejada (1.0).
DESCRIÇÃO DA INVENÇÃO
[0030] A presente invenção fornece polipeptídeos de DNA polimerase projetados e composições dos mesmos, bem como polinucleotídeos que codificam os polipeptídeos de DNA polimerase projetados. A invenção também fornece métodos para o uso das composições compreendendo os polipeptídeos de DNA polimerase projetados para diagnóstico e outros fins. Em algumas modalidades, os polipeptídeos de DNA polimerase projetados são otimizados para fornecer atividade de polimerização aprimorada com alta fidelidade de replicação, particularmente sob condições que envolvem baixas concentrações de entrada de DNA, análise de alto rendimento e/ou reações de sequenciamento. Em algumas modalidades, a presente invenção fornece métodos e composições compreendendo as DNA polimerases projetadas para fins de diagnóstico e pesquisa. A presente invenção também fornece polipeptídeos de DNA polimerase projetados, mutantes, fragmentos biologicamente ativos e análogos dos mesmos, e composições compreendendo os mesmos.
[0031] Em algumas modalidades, as DNA polimerases projetadas da presente invenção encontram uso em aplicações de diagnóstico e pesquisa usando pequenas quantidades de DNA de amostras de pacientes, incluindo DNA livre de células, DNA de tumor circulante, DNA isolado de células tumorais circulantes, DNA de feto circulante, DNA isolado de células infectadas por vírus, aspirados de agulha fina ou células individuais isoladas por FACS (classificação de células ativadas por fluorescência), microscopia de captura a laser ou dispositivos microfluídicos. No entanto, não se pretende que a amostra utilizada com a presente invenção seja limitada a qualquer tipo de amostra particular, uma vez que qualquer amostra adequada, incluindo aquelas com baixas concentrações de DNA, encontra uso na presente invenção.
[0032] Em algumas modalidades, as DNA polimerases projetadas da presente invenção encontram uso na construção de bibliotecas de sequenciamento de DNA para amostras de DNA de concentração intermediária a alta.
[0033] Em algumas modalidades, as DNA polimerases projetadas da presente invenção encontram uso em aplicações de clonagem molecular, particularmente aquelas onde a concentração de DNA é baixa em comparação com Km de enzimas de ocorrência natural. Em algumas modalidades, isso se aplica a aplicações de clonagem de alto rendimento, onde a amostra é preparada em pequenos volumes ou qualquer amostra de DNA de baixa concentração, como amostras ambientais, amostras de pacientes ou DNA antigo.
[0034] Em algumas modalidades, as DNA polimerases projetadas da presente invenção encontram uso em fluxos de trabalho simplificados de biologia molecular, incluindo fluxos de trabalho automatizados, que removem etapas de limpeza entre as operações. Como as DNA polimerases projetadas são ativas em substratos de baixa concentração, um volume menor (ou uma diluição) da amostra de substrato contendo o inibidor pode ser adicionado à reação de ligação. As amostras de DNA contendo inibidores relevantes podem incluir DNA em tampão de PCR, DNA em tampão de eletroforese ou DNA em extratos brutos. As DNA polimerases modificadas da presente invenção são capazes de ligar eficientemente amostras diluídas, em comparação com as DNA polimerases nativas. Alternativamente, em outras modalidades, as DNA polimerases projetadas da presente invenção encontram uso em amostras não diluídas contendo inibidor(es).
[0035] Em algumas modalidades, as DNA polimerases projetadas da presente invenção encontram uso em reações multi-enzima de vaso único, realizadas em gotículas microfluídicas ou placas de poços. A alta atividade específica das DNA polimerases permite formulações de tampão selecionadas para o desempenho de outras enzimas na reação, que alcançam um desempenho de ligação que não é limitante para o fluxo de trabalho geral.
[0036] Em algumas modalidades, as DNA polimerases modificadas da presente invenção encontram uso na construção de bibliotecas de DNA. Essas bibliotecas podem ser usadas para sequenciamento de DNA, triagem de alto rendimento, seleções genéticas, exibição de fago, exibição de levedura, exibição ribossômica, ensaios baseados em células, ensaios bioquímicos ou triagem de alto conteúdo baseada em imagens. Em algumas modalidades, as DNA polimerases projetadas da presente invenção encontram utilidade particular quando o tamanho, a diversidade ou a fidelidade da biblioteca são limitados pela concentração do substrato de ligação quando uma DNA polimerase de tipo selvagem é usada. Abreviações e definições:
[0037] A menos que definido de outra forma, todos os termos técnicos e científicos usados neste documento geralmente têm o mesmo significado como comumente entendido por alguém versado na técnica à qual esta invenção pertence. Geralmente, a nomenclatura usada neste documento e os procedimentos laboratoriais de cultura de células, genética molecular, microbiologia, química orgânica, química analítica e química de ácido nucleico descritos abaixo são aqueles bem conhecidos e comumente empregados na técnica. Tais técnicas são bem conhecidas e descritas em numerosos textos e obras de referência bem conhecidas das pessoas versadas na técnica. Técnicas padrão, ou modificações das mesmas, são usadas para sínteses químicas e análises químicas.
[0038] Todas as patentes, os pedidos de patentes, os artigos e as publicações mencionados neste documento, tanto acima como abaixo, são expressamente incorporados por referência neste documento.
[0039] Embora quaisquer métodos e materiais adequados semelhantes ou equivalentes aos descritos neste documento encontrem uso na prática da presente invenção, alguns métodos e materiais são descritos neste documento. Deve ser entendido que esta invenção não está limitada à metodologia, aos protocolos e aos reagentes específicos descritos, uma vez que estes podem variar, dependendo do contexto em que são usados pelas pessoas versadas na técnica. Consequentemente, os termos definidos imediatamente abaixo são descritos de forma mais completa por referência ao pedido como um todo. Todas as patentes, os pedidos de patentes, os artigos e as publicações mencionados neste documento, tanto acima como abaixo, são expressamente incorporados por referência neste documento.
[0040] Tal como usado neste documento, o singular “um”, “uma” e “o/a” incluem as referências no plural, a menos que o contexto indique claramente o contrário.
[0041] As faixas numéricas incluem os números que definem a faixa. Assim, cada faixa numérica divulgada neste documento se destina a abranger cada faixa numérica mais estreita que cai dentro de tal faixa numérica mais ampla, como se tais faixas numéricas mais estreitas fossem todas expressamente escritas neste documento. Pretende-se também que cada limitação numérica máxima (ou mínima) divulgada neste documento inclua cada limitação numérica inferior (ou superior), como se tais limitações numéricas inferiores (ou superiores) fossem expressamente escritas neste documento.
[0042] O termo “cerca de” significa um erro aceitável para um valor particular. Em alguns casos, “cerca de” significa dentro de 0,05%, 0,5%, 1,0% ou 2,0%, de uma determinada faixa de valor. Em alguns casos, “cerca de” significa dentro de 1, 2, 3 ou 4 desvios padrão de um determinado valor.
[0043] Além disso, os títulos fornecidos neste documento não são limitações dos vários aspectos ou modalidades da invenção que podem ser tidos por referência ao pedido como um todo. Consequentemente, os termos definidos imediatamente abaixo são definidos de forma mais completa por referência ao pedido como um todo. No entanto, a fim de facilitar a compreensão da invenção,
vários termos são definidos abaixo.
[0044] Salvo indicação em contrário, os ácidos nucleicos são escritos da esquerda para a direita na orientação 5' para 3'; as sequências de aminoácidos são escritas da esquerda para a direita na orientação amino para carboxi, respectivamente.
[0045] Tal como usado neste documento, o termo “compreendendo” e seus cognatos são usados em seu sentido inclusivo (isto é, equivalente ao termo “incluindo” e seus cognatos correspondentes).
[0046] Tal como usado neste documento, o número “CE” se refere à Nomenclatura da Enzima do Comitê de Nomenclatura da União Internacional de Bioquímica e Biologia Molecular (NC-IUBMB). A classificação bioquímica IUBMB é um sistema de classificação numérica para enzimas com base nas reações químicas que elas catalisam.
[0047] Tal como usado neste documento, “ATCC” refere-se à American Type Culture Collection, cuja coleção de biorrepositório inclui genes e cepas.
[0048] Tal como usado neste documento, “NCBI” se refere ao National Center for Biological Information e aos bancos de dados de sequência fornecidos no mesmo.
[0049] Tal como usado neste documento, o termo “DNA” se refere ao ácido desoxirribonucleico.
[0050] Tal como usado neste documento, o termo “RNA” se refere ao ácido ribonucleico.
[0051] Tal como usado neste documento, os termos “proteína de fusão” e “proteína quimérica” e “quimera” se referem a proteínas híbridas criadas através da união de dois ou mais genes que codificavam originalmente proteínas separadas. Em algumas modalidades, as proteínas de fusão são criadas por tecnologia recombinante (por exemplo, técnicas de biologia molecular conhecidas na arte).
[0052] Tal como usado neste documento, o termo “polimerase” se refere a uma classe de enzimas que polimerizam trifosfatos de nucleosídeo. As polimerases usam uma fita de ácido nucleico modelo para sintetizar uma fita de ácido nucleico complementar. A fita molde e a fita de ácido nucleico sintetizada podem ser independentemente DNA ou RNA. As polimerases conhecidas na técnica incluem, mas não estão limitadas a DNA polimerases (por exemplo, DNA polI de E. coli, DNA polimerase de T. aquaticus [Taq], RNA polimerases dependentes de DNA e transcriptases reversas). Tal como usado aqui, a polimerase é um polipeptídeo ou proteína contendo aminoácidos suficientes para realizar uma função enzimática desejada da polimerase. Em algumas modalidades, a polimerase não contém todos os aminoácidos encontrados na enzima nativa, mas apenas aqueles que são suficientes para permitir que a polimerase realize uma atividade catalítica desejada, incluindo, mas não se limitando a polimerização 5'-3', atividades de exonuclease 5'-3' e exonuclease 3'- 5'.
[0053] Tal como usado neste documento, o termo “atividade de DNA polimerase”, “atividade sintética” e “atividade de polimerase” são usados indistintamente neste documento e se referem à capacidade de uma enzima de sintetizar novas fitas de DNA pela incorporação de trifosfatos de desoxinucleosídeo.
[0054] Tal como usado neste documento, os termos “duplex” e “ds” se referem a uma molécula de ácido nucleico de fita dupla (por exemplo, DNA) composta por dois polinucleotídeos de fita simples que são complementares em sua sequência (pares de A para T, pares de C para G), dispostos em uma orientação antiparalela 5' para 3' e mantidos juntos por ligações de hidrogênio entre as nucleobases (isto é, adenina [A], guanina [G], citosina [C] e timina [T]).
[0055] Tal como usado neste documento, o termo “cego” se refere ao final de um DNA duplex ou de fita simples (“ss”) com auto-complementaridade que não tem uma saliência 5' ou 3'. As extremidades cegas podem ter fosfatos 5' em uma ou ambas as fitas, o que as torna compatíveis para ligação por meio de uma ligase, tal como T4 DNA ligase.
[0056] Tal como usado neste documento, o termo “reparo final” se refere a métodos para reparar DNA (por exemplo, DNA fragmentado ou danificado ou moléculas de DNA que são incompatíveis com outras moléculas de DNA). Em algumas modalidades, o processo envolve duas funções: 1) conversão de DNA de fita dupla com saliências em DNA de fita dupla sem saliências por uma enzima, como DNA polimerase de T4 e/ou fragmento de Klenow; e 2) adição de um grupo fosfato às extremidades 5' do DNA (fita simples ou dupla), por uma enzima, como polinucleotídeo quinase.
[0057] “Proteína”, “polipeptídeo” e “peptídeo” são usados indistintamente aqui para denotar um polímero de pelo menos dois aminoácidos covalentemente ligados por uma ligação amida, independentemente do comprimento ou modificação pós-tradução (por exemplo, glicosilação ou fosforilação).
[0058] “Aminoácidos” são ditos neste documento por seus símbolos de três letras comumente conhecidos ou pelos símbolos de uma letra recomendados pela Comissão de Nomenclatura Bioquímica da IUPAC-IUB. Os nucleotídeos, da mesma forma, podem ser ditos por seus códigos de uma única letra comumente aceitos. As abreviaturas utilizadas para os aminoácidos codificados geneticamente são convencionais e são as seguintes: alanina (Ala ou A), arginina (Arg ou R), asparagina (Asn ou N), aspartato (Asp ou D), cisteína (Cys ou C), glutamato (Glu ou E), glutamina (Gln ou Q), histidina (His ou H), isoleucina (Ile ou I), leucina (Leu ou L), lisina (Lys ou K), metionina (Met ou M), fenilalanina (Phe ou F), prolina (Pro ou P), serina (Ser ou S), treonina (Thr ou T), triptofano (Trp ou W), tirosina (Tyr ou Y) e valina (Val ou V). Quando as abreviaturas de três letras são usadas, a menos que especificamente precedido por um “L” ou um “D” ou claro do contexto em que a abreviatura é usada, o aminoácido pode estar na configuração L ou D de cerca de carbono α (Cα). Por exemplo, enquanto “Ala” designa alanina sem especificar a configuração sobre o carbono α, “D-
Ala” e “L-Ala” designam D-alanina e L-alanina, respectivamente. Quando as abreviaturas de uma letra são usadas, as letras maiúsculas designam os aminoácidos na configuração L sobre o carbono α e as letras minúsculas designam os aminoácidos na configuração D sobre o carbono α. Por exemplo, “A” designa L-alanina e “a” designa D-alanina. Quando as sequências polipeptídicas são apresentadas como uma cadeia de abreviaturas de uma ou três letras (ou misturas das mesmas), as sequências são apresentadas na direção amino (N) para carboxi (C) de acordo com a convenção comum.
[0059] As abreviaturas utilizadas para os nucleosídeos que codificam geneticamente são convencionais e são as seguintes: adenosina (A); guanosina (G); citidina (C); timidina (T); e uridina (U). A menos que especificamente delineados, os nucleosídeos abreviados podem ser ribonucleosídeos ou 2'- desoxirribonucleosídeos. Os nucleosídeos podem ser especificados como sendo ribonucleosídeos ou 2'-desoxirribonucleosídeos em uma base individual ou em uma base agregada. Quando as sequências de ácido nucleico são apresentadas como uma sequência de abreviaturas de uma letra, as sequências são apresentadas na direção de 5' para 3' de acordo com a convenção comum, e os fosfatos não são indicados.
[0060] Os termos “projetado”, “recombinante”, “de ocorrência não natural” e “variante”, quando usados com referência a uma célula, um polinucleotídeo ou polipeptídeo se referem a um material ou um material correspondente ao natural ou forma nativa do material que foi modificado de uma maneira que não existiria de outra forma na natureza ou é idêntica a ela, mas produzida ou derivada de materiais sintéticos e/ou por manipulação usando técnicas recombinantes.
[0061] Tal como usado neste documento, “tipo selvagem” e “de ocorrência natural” se referem à forma encontrada na natureza. Por exemplo, um polipeptídeo de tipo selvagem ou sequência polinucleotídica é uma sequência presente em um organismo que pode ser isolada de uma fonte na natureza e que não foi intencionalmente modificada por manipulação humana.
[0062] Tal como usado neste documento, “sequência de codificação” se refere à parte de um ácido nucleico (por exemplo, um gene) que codifica uma sequência de aminoácidos de uma proteína.
[0063] Tal como usado neste documento, o termo “porcentagem (%) de identidade de sequência” se refere a comparações entre polinucleotídeos e polipeptídeos e são determinados pela comparação de duas sequências alinhadas de forma otimizada em uma janela de comparação, em que a porção do polinucleotídeo ou sequência polipeptídica na janela de comparação pode compreender adições ou deleções (isto é, lacunas) em comparação com a sequência de referência para o alinhamento ideal das duas sequências. A porcentagem pode ser calculada determinando o número de posições em que a base de ácido nucleico idêntica ou resíduo de aminoácido ocorre em ambas as sequências para produzir o número de posições correspondentes, dividindo o número de posições correspondentes pelo número total de posições na janela de comparação e multiplicação do resultado por 100 para produzir a porcentagem de identidade de sequência. Alternativamente, a porcentagem pode ser calculada determinando o número de posições em que a base de ácido nucleico idêntica ou resíduo de aminoácido ocorre em ambas as sequências ou uma base de ácido nucleico ou resíduo de aminoácido está alinhado com uma lacuna para produzir o número de posições correspondentes, dividindo o número de posições correspondentes pelo número total de posições na janela de comparação e multiplicando o resultado por 100 para produzir a porcentagem de identidade de sequência. Aqueles versados na técnica reconhecem que existem muitos algoritmos estabelecidos disponíveis para alinhar duas sequências. O alinhamento ideal de sequências para comparação pode ser conduzido, por exemplo, pelo algoritmo de homologia local de Smith e Waterman (Smith e Waterman, Adv. Appl. Math., 2: 482 [1981]), pelo algoritmo de alinhamento de homologia de Needleman e Wunsch (Needleman e Wunsch, J. Mol. Biol., 48:
443 [1970]), pelo método de pesquisa de similaridade de Pearson e Lipman (Pearson e Lipman, Proc.
Natl.
Acad.
Sei.
USA 85: 2444 [1988]), por implementações computadorizadas desses algoritmos (por exemplo, GAP, BESTFIT, FASTA e TFASTA no pacote de software GCG Wisconsin) ou por inspeção visual, conforme conhecido na técnica.
Exemplos de algoritmos que são adequados para determinar a porcentagem de identidade de sequência e similaridade de sequência incluem, mas não estão limitados aos algoritmos BLAST e BLAST 2.0 (ver, por exemplo, Altschul et al., J.
Mol.
Biol., 215: 403 a 410 [1990]; e Altschul et al., Nucleic Acids Res., 3389 a 3402 [1977]). O software para realizar análises BLAST está publicamente disponível através do website do National Center for Biotechnology Information.
Este algoritmo envolve primeiro a identificação de pares de sequência de alta pontuação (HSPs), identificando palavras curtas de comprimento “W” na sequência de consulta, que combinam ou satisfazem alguma pontuação limite de valor positivo “T”, quando alinhadas com uma palavra do mesmo comprimento em uma sequência de banco de dados.
T é dito como o limite de pontuação de palavra de vizinhança (ver, Altschul et al, acima). Esses acertos de palavras de vizinhança iniciais atuam como sementes para iniciar pesquisas para encontrar HSPs mais longos que os contenham.
As ocorrências de palavras são então estendidas em ambas as direções ao longo de cada sequência, na medida em que a pontuação de alinhamento cumulativa pode ser aumentada.
Pontuações cumulativas são calculadas usando, para sequências de nucleotídeos, os parâmetros “M” (pontuação de recompensa para um par de resíduos correspondentes; sempre > 0) e “N” (pontuação de penalidade para resíduos incompatíveis; sempre < 0). Para sequências de aminoácidos, uma matriz de pontuação é usada para calcular a pontuação cumulativa.
A extensão dos acertos da palavra em cada direção é interrompida quando: a pontuação de alinhamento cumulativa cai pela quantidade “X” de seu valor máximo alcançado; a pontuação cumulativa vai para zero ou menos, devido ao acúmulo de um ou mais alinhamentos de resíduos de pontuação negativa; ou o final de qualquer uma das sequências é alcançado. Os parâmetros do algoritmo BLAST W, T e X determinam a sensibilidade e a velocidade do alinhamento. O programa BLASTN (para sequências de nucleotídeos) usa como padrão um comprimento de palavra (W) de 11, uma expectativa (E) de 10, M = 5, N = -4 e uma comparação de ambas as fitas. Para sequências de aminoácidos, o programa BLASTP usa como padrão um comprimento de palavra (W) de 3, uma expectativa (E) de 10 e a matriz de pontuação BLOSUM62 (ver, por exemplo, Henikoff e Henikoff, Proc. Natl. Acad. Sci. USA 89: 10915 [1989]). A determinação exemplar de alinhamento de sequência e a% de identidade de sequência pode empregar os programas BESTFIT ou GAP no pacote de software GCG Wisconsin (Accelrys, Madison WI), usando parâmetros padrão fornecidos.
[0064] Tal como usado neste documento, “sequência de referência” se refere a uma sequência definida usada como base para uma comparação de sequência. Uma sequência de referência pode ser um subconjunto de uma sequência maior, por exemplo, um segmento de um gene de comprimento total ou sequência polipeptídica. Geralmente, uma sequência de referência tem pelo menos 20 nucleotídeos ou resíduos de aminoácidos de comprimento, pelo menos 25 resíduos de comprimento, pelo menos 50 resíduos de comprimento, pelo menos 100 resíduos de comprimento ou o comprimento total do ácido nucleico ou polipeptídeo. Uma vez que dois polinucleotídeos ou polipeptídeos podem cada um (1) compreender uma sequência (ou seja, uma porção da sequência completa) que é semelhante entre as duas sequências, e (2) pode compreender ainda uma sequência que é divergente entre as duas sequências, comparações de sequência entre dois (ou mais) polinucleotídeos ou polipeptídeos são tipicamente realizadas comparando sequências dos dois polinucleotídeos ou polipeptídeos ao longo de uma “janela de comparação” para identificar e comparar regiões locais de similaridade de sequência. Em algumas modalidades, uma “sequência de referência” pode ser baseada em uma sequência de aminoácidos primária, onde a sequência de referência é uma sequência que pode ter uma ou mais mudanças na sequência primária. Por exemplo, a frase “uma sequência de referência com base na SEQ ID NO: 6, tendo uma valina no resíduo correspondente a X712” (ou “uma sequência de referência com base na SEQ ID NO: 6, tendo uma valina no resíduo correspondente à posição 712”) se refere a uma sequência de referência na qual o resíduo correspondente na posição X712 na SEQ ID NO: 6 (por exemplo, uma isoleucina), foi alterado para valina.
[0065] Tal como usado neste documento, “janela de comparação” se refere a um segmento conceitual de pelo menos cerca de 20 posições de nucleotídeos contíguas ou resíduos de aminoácidos em que uma sequência pode ser comparada a uma sequência de referência de pelo menos 20 nucleotídeos ou aminoácidos contíguos e em que a porção da sequência na janela de comparação pode compreender adições ou deleções (isto é, lacunas) de 20 por cento ou menos em comparação com a sequência de referência (que não compreende adições ou deleções) para alinhamento ideal das duas sequências. A janela de comparação pode ser maior do que 20 resíduos contíguos e inclui, opcionalmente, 30, 40, 50, 100 ou janelas mais longas.
[0066] Tal como usado neste documento, “correspondente a”, “referente a” e “relativo a” quando usado no contexto da numeração de um determinado aminoácido ou sequência de polinucleotídeo se refere à numeração dos resíduos de uma sequência de referência especificada quando a sequência de aminoácidos ou polinucleotídica dada é comparada com a sequência de referência. Por outras palavras, o número do resíduo ou a posição do resíduo de um determinado polímero é designado em relação à sequência de referência e não pela posição numérica real do resíduo dentro do aminoácido ou da sequência polinucleotídica dada. Por exemplo, uma dada sequência de aminoácidos, tal como a de uma DNA polimerase projetada, pode ser alinhada a uma sequência de referência pela introdução de lacunas para otimizar correspondências de resíduos entre as duas sequências. Nestes casos, embora as lacunas estejam presentes, a numeração do resíduo no aminoácido ou sequência polinucleotídica dada é feita em relação à sequência de referência à qual foi alinhada. Em algumas modalidades, a sequência é marcada (por exemplo, com uma etiqueta de histidina).
[0067] Tal como usado neste documento, “mutação” se refere à alteração de uma sequência de ácido nucleico. Em algumas modalidades, as mutações resultam em alterações na sequência polipeptídica codificada (ou seja, em comparação com a sequência original sem a mutação). Em algumas modalidades, a mutação compreende uma substituição, de modo que um aminoácido diferente seja produzido (por exemplo, substituição de um ácido aspártico por triptofano). Em algumas modalidades alternativas, a mutação compreende uma adição, de modo que um aminoácido seja adicionado à sequência polipeptídica original. Em algumas modalidades adicionais, a mutação compreende uma deleção, de modo que um aminoácido seja deletado da sequência polipeptídica original. Qualquer número de mutações pode estar presente em uma determinada sequência.
[0068] Tal como usado neste documento, “diferença de aminoácidos” e “diferença de resíduos” se referem a uma diferença no resíduo de aminoácido em uma posição de uma sequência de polipeptídeo em relação ao resíduo de aminoácido em uma posição correspondente em uma sequência de referência. As posições das diferenças de aminoácidos geralmente são ditas neste documento como “Xn”, onde n se refere à posição correspondente na sequência de referência na qual a diferença de resíduo é baseada. Por exemplo, uma “diferença de resíduo na posição X15 em comparação com a SEQ ID NO: 824” (ou uma “diferença de resíduo na posição 15 em comparação com a SEQ ID NO: 824”) se refere a uma diferença do resíduo de aminoácido na posição de polipeptídeo correspondente à posição 15 da SEQ ID NO: 824. Assim, se o polipeptídeo de referência da SEQ ID NO: 824 tem um ácido aspártico na posição 15, então uma “diferença de resíduo na posição X15 em comparação com a SEQ ID NO: 824” se refere a uma substituição de aminoácido de qualquer resíduo diferente de ácido aspártico na posição do polipeptídeo correspondente à posição 15 da SEQ ID NO: 824. Na maioria dos casos aqui, a diferença de resíduo de aminoácido específico em uma posição é indicada como “XnY”, onde “Xn” especificou o resíduo correspondente e a posição do polipeptídeo de referência (como descrito acima), e “Y” é o identificador de uma única letra do aminoácido encontrado no polipeptídeo projetado (ou seja, o resíduo diferente do polipeptídeo de referência). Em alguns casos (por exemplo, nas Tabelas nos Exemplos), a presente divulgação também fornece diferenças específicas de aminoácidos denotadas pela notação convencional “AnB”, onde A é o identificador de uma única letra do resíduo na sequência de referência, “n” é o número da posição do resíduo na sequência de referência, e B é o identificador de uma única letra da substituição do resíduo na sequência do polipeptídeo projetado. Em alguns casos, um polipeptídeo da presente divulgação pode incluir uma ou mais diferenças de resíduos de aminoácidos em relação a uma sequência de referência, que é indicada por uma lista das posições especificadas onde as diferenças de resíduos estão presentes em relação à sequência de referência. Em algumas modalidades, onde mais de um aminoácido pode ser usado em uma posição de resíduo específico de um polipeptídeo, os vários resíduos de aminoácido que podem ser usados são separados por um “/” (por exemplo, X775F/X775G, X775F/G ou K775F/G). A presente divulgação inclui sequências polipeptídicas projetadas compreendendo uma ou mais diferenças de aminoácidos que incluem uma ou ambas as substituições de aminoácidos conservativas e não conservativas, bem como inserções e deleções de aminoácidos na sequência (por exemplo, deleção na posição 784).
[0069] Tal como usado neste documento, os termos “conjunto de substituição de aminoácidos” e “conjunto de substituição” se referem a um grupo de substituições de aminoácidos dentro de uma sequência polipeptídica. Em algumas modalidades, os conjuntos de substituição compreendem 1, 2, 3, 4,
5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15 ou mais substituições de aminoácidos. Em algumas modalidades, um conjunto de substituição se refere ao conjunto de substituições de aminoácidos que está presente em qualquer um dos polipeptídeos de DNA polimerase variantes listados em qualquer uma das Tabelas nos Exemplos. Nestes conjuntos de substituição, as substituições individuais são separadas por um ponto e vírgula (“;”; por exemplo, P567G; I569G; Y667N) ou barra (“/”; por exemplo, P567G/I569G/Y667N). Em algumas modalidades, a “substituição” compreende a deleção de um aminoácido.
[0070] Tal como usado neste documento, “substituição conservativa de aminoácidos” se refere a uma substituição de um resíduo por um resíduo diferente com uma cadeia lateral semelhante e, portanto, tipicamente envolve a substituição do aminoácido no polipeptídeo por aminoácidos dentro da mesma classe ou classe semelhante definida de aminoácidos. A título de exemplo e não de limitação, um aminoácido com uma cadeia lateral alifática pode ser substituído por outro aminoácido alifático (por exemplo, alanina, valina, leucina e isoleucina); um aminoácido com cadeia lateral de hidroxila é substituído por outro aminoácido com uma cadeia lateral de hidroxila (por exemplo, serina e treonina); um aminoácido possuindo cadeias laterais aromáticas é substituído por outro aminoácido possuindo uma cadeia lateral aromática (por exemplo, fenilalanina, tirosina, triptofano e histidina); um aminoácido com uma cadeia lateral básica é substituído por outro aminoácido com uma cadeia lateral básica (por exemplo, lisina e arginina); um aminoácido com uma cadeia lateral ácida é substituído por outro aminoácido com uma cadeia lateral ácida (por exemplo, ácido aspártico ou ácido glutâmico); e um aminoácido hidrofóbico ou hidrofílico é substituído por outro aminoácido hidrofóbico ou hidrofílico, respectivamente.
[0071] Tal como usado neste documento, “substituição não conservativa” se refere à substituição de um aminoácido no polipeptídeo por um aminoácido com propriedades de cadeia lateral significativamente diferentes. As substituições não conservativas podem usar aminoácidos entre, em vez de dentro dos grupos definidos e afetar: (a) a estrutura do esqueleto do peptídeo na área da substituição (por exemplo, prolina por glicina); (b) a carga ou hidrofobicidade; e/ou (c) a maior parte da cadeia lateral. A título de exemplo e não de limitação, substituições não conservativas exemplares incluem um aminoácido ácido substituído por um aminoácido básico ou alifático; um aminoácido aromático substituído por um pequeno aminoácido; e um aminoácido hidrofílico substituído por um aminoácido hidrofóbico.
[0072] Tal como usado neste documento, “deleção” se refere à modificação do polipeptídeo pela remoção de um ou mais aminoácidos do polipeptídeo de referência. As deleções podem compreender a remoção de 1 ou mais aminoácidos, 2 ou mais aminoácidos, 5 ou mais aminoácidos, 10 ou mais aminoácidos, 15 ou mais aminoácidos, ou 20 ou mais aminoácidos, até 10% do número total de aminoácidos, ou até 20% do número total de aminoácidos que constituem a enzima de referência, enquanto retém a atividade enzimática e/ou retém as propriedades melhoradas de uma enzima polimerase projetada. As eliminações podem ser direcionadas para as porções internas e/ou porções terminais do polipeptídeo. Em várias modalidades, a exclusão pode compreender um segmento contínuo ou pode ser descontínua. As exclusões são indicadas por “-” e podem estar presentes em conjuntos de substituição.
[0073] Tal como usado neste documento, “inserção” se refere à modificação do polipeptídeo por adição de um ou mais aminoácidos do polipeptídeo de referência. As inserções podem ser nas porções internas do polipeptídeo ou no terminal carboxi ou amino. As inserções, conforme aqui utilizadas, incluem proteínas de fusão, como é conhecido na técnica. A inserção pode ser um segmento contíguo de aminoácidos ou separado por um ou mais dos aminoácidos no polipeptídeo de ocorrência natural.
[0074] Como usado aqui, “fragmento funcional” e “fragmento biologicamente ativo” são usados indistintamente aqui, para se referir a um polipeptídeo que tem uma deleção amino-terminal e/ou carboxi-terminal e/ou deleções internas, mas onde a sequência de aminoácidos remanescente é idêntica às posições correspondentes na sequência à qual está sendo comparada (por exemplo, uma DNA polimerase projetada de comprimento total da presente invenção) e que retém substancialmente toda a atividade do polipeptídeo de comprimento total.
[0075] Tal como usado neste documento, “polipeptídeo isolado” se refere a um polipeptídeo que é substancialmente separado de outros contaminantes que o acompanham naturalmente (por exemplo, proteína, lipídios e polinucleotídeos). O termo abrange polipeptídeos que foram removidos ou purificados de seu ambiente de ocorrência natural ou sistema de expressão (por exemplo, célula hospedeira ou síntese in vitro). Os polipeptídeos de DNA polimerase recombinante podem estar presentes dentro de uma célula, presentes no meio celular ou preparados em várias formas, tais como lisados ou preparações isoladas. Como tal, em algumas modalidades, os polipeptídeos de DNA polimerase recombinante fornecidos aqui são polipeptídeos isolados.
[0076] Tal como usado neste documento, “polipeptídeo substancialmente puro” se refere a uma composição em que a espécie de polipeptídeo é a espécie predominante presente (isto é, em uma base molar ou de peso é mais abundante do que qualquer outra espécie macromolecular individual na composição), e é geralmente uma composição substancialmente purificada quando a espécie objeto compreende pelo menos cerca de 50 por cento das espécies macromoleculares presentes por mol ou% em peso. Geralmente, uma composição de DNA polimerase substancialmente pura compreenderá cerca de 60% ou mais, cerca de 70% ou mais, cerca de 80% ou mais, cerca de 90% ou mais, cerca de 95% ou mais, e cerca de 98% ou mais de todas as espécies macromoleculares por mol ou% em peso presente na composição. Em algumas modalidades, a espécie objeto é purificada até a homogeneidade essencial (ou seja, as espécies contaminantes não podem ser detectadas na composição por métodos de detecção convencionais), em que a composição consiste essencialmente em uma única espécie macromolecular. Espécies de solvente, moléculas pequenas (< 500 Daltons) e espécies de íons elementares não são consideradas espécies macromoleculares. Em algumas modalidades, os polipeptídeos isolados da DNA polimerase recombinante são composições polipeptídicas substancialmente puras.
[0077] Tal como usado neste documento, “propriedade enzimática aprimorada” se refere a um polipeptídeo de DNA polimerase projetado que exibe uma melhoria em qualquer propriedade de enzima em comparação com um polipeptídeo de DNA polimerase de referência, tal como um polipeptídeo de DNA polimerase de tipo selvagem (por exemplo, DNA polimerase de tipo selvagem de SEQ ID NO: 2) ou outro polipeptídeo de DNA polimerase projetado. As propriedades melhoradas incluem, mas não estão limitadas a, propriedades como aumento da expressão de proteínas, aumento da termoatividade, aumento da termoestabilidade, aumento da estabilidade, aumento da atividade enzimática, aumento da especificidade e/ou afinidade do substrato, aumento da atividade específica, aumento da resistência ao substrato e/ou inibição do produto final, estabilidade química aumentada, quimiosseletividade aprimorada, estabilidade de solvente aprimorada, tolerância aumentada ao pH ácido, tolerância aumentada à atividade proteolítica (isto é, sensibilidade reduzida à proteólise), solubilidade aumentada e perfil de temperatura alterado.
[0078] Como usado neste documento, “atividade enzimática aumentada” e “atividade catalítica aprimorada” se referem a uma propriedade melhorada dos polipeptídeos de DNA polimerase projetados, que podem ser representados por um aumento na atividade específica (por exemplo, produto produzido/tempo/peso de proteína) e/ou um aumento na conversão percentual do substrato para o produto (por exemplo, conversão percentual da quantidade inicial de substrato para o produto em um período de tempo especificado usando uma quantidade especificada de DNA polimerase) em comparação com a enzima DNA polimerase de referência (por exemplo, DNA polimerase de tipo selvagem e/ou outra DNA polimerase projetada). Métodos exemplares para determinar a atividade enzimática são fornecidos nos Exemplos. Qualquer propriedade relacionada à atividade enzimática pode ser afetada, incluindo as propriedades clássicas da enzima Km, Vmax ou kcat, cujas alterações podem levar ao aumento da atividade enzimática. As melhorias na atividade enzimática podem ser de cerca de 1,1 vezes a atividade enzimática da enzima de tipo selvagem correspondente, até 2 vezes, 5 vezes, 10 vezes, 20 vezes, 25 vezes, 50 vezes, 75 vezes, 100 vezes, 150 vezes, 200 vezes ou mais de atividade enzimática do que a DNA polimerase de ocorrência natural ou outra DNA polimerase projetada da qual os polipeptídeos de DNA polimerase foram derivados.
[0079] Os termos “atividade proteolítica” e “proteólise” usados aqui indistintamente se referem à quebra de proteínas em polipeptídeos ou aminoácidos menores. A quebra de proteínas é geralmente o resultado da hidrólise da ligação peptídica pelas enzimas de protease (proteinase). As enzimas de protease incluem, mas não estão limitadas a pepsina, tripsina, quimotripsina, elastase; carboxipeptidase A e B, e peptidases (por exemplo, amino peptidase, dipeptidase e enteropeptidase).
[0080] As frases “reduzindo a sensibilidade à proteólise” e “reduzindo a sensibilidade proteolítica” são usadas indistintamente aqui e significam que um polipeptídeo de DNA polimerase projetado de acordo com a invenção terá uma atividade enzimática mais elevada em comparação com uma DNA polimerase de referência em um ensaio padrão (por exemplo, conforme divulgado nos Exemplos) após o tratamento com uma ou mais proteases.
[0081] Tal como usado neste documento, “conversão” se refere à conversão enzimática (ou biotransformação) do(s) substrato(s) para o(s) produto(s) correspondente(s)). “Porcentagem de conversão” se refere à porcentagem do substrato que é convertido no produto dentro de um período de tempo sob condições especificadas. Assim, a “atividade enzimática” ou “atividade” de um polipeptídeo de DNA polimerase pode ser expressa como “conversão percentual” do substrato para o produto em um período de tempo específico.
[0082] Tal como usado neste documento, “restringência de hibridização” se refere a condições de hibridização, tais como condições de lavagem, na hibridização de ácidos nucleicos. Geralmente, as reações de hibridização são realizadas sob condições de restringência mais baixa, seguidas por lavagens de restringência variável, mas superior. O termo “hibridização moderadamente rigorosa” se refere a condições que permitem que o DNA alvo se ligue a um ácido nucleico complementar que tem cerca de 60% de identidade, de preferência cerca de 75% de identidade, cerca de 85% de identidade com o DNA alvo, com mais de cerca de 90% de identidade com polinucleotídeo alvo. Condições moderadamente rigorosas exemplares são condições equivalentes à hibridização em 50% de formamida, 5 × solução de Denhart, 5 × SSPE, 0,2% de SDS a 42 °C, seguido por lavagem em 0,2 × SSPE, 0,2% de SDS, a 42 °C. “Hibridização de alta severidade” se refere geralmente a condições que são cerca de 10 °C ou menos da temperatura de fusão térmica Tm conforme determinado sob a condição de solução para uma sequência polinucleotídica definida. Em algumas modalidades, uma condição de alta severidade se refere a condições que permitem a hibridização apenas das sequências de ácido nucleico que formam híbridos estáveis em NaCl 0,018M a 65 °C (ou seja, se um híbrido não é estável em NaCl 0,018M a 65 °C, não será estável sob condições de alta severidade, conforme contemplado neste documento). Condições de alta severidade podem ser fornecidas, por exemplo, por hibridização em condições equivalentes a 50% de formamida, 5 × solução de Denhart, 5 × SSPE, 0,2% de SDS a 42 °C, seguido por lavagem em 0,1 × SSPE e 0,1% de SDS a 65 °C. Outra condição de alta severidade compreende a hibridização em condições equivalentes à hibridização em 5X SSC contendo 0,1% (p:v) SDS a 65 °C e lavagem em 0,1x SSC contendo
0,1% de SDS a 65 °C. Outras condições de hibridização de alta severidade, bem como condições moderadamente severas, são descritas nas referências citadas acima.
[0083] Tal como usado neste documento, “códon otimizado” se refere a mudanças nos códons do polinucleotídeo que codifica uma proteína para aqueles preferencialmente usados em um organismo particular, de modo que a proteína codificada seja mais eficientemente expressa nesse organismo. Embora o código genético seja degenerado, na medida em que a maioria dos aminoácidos são representados por vários códons, chamados de códons “sinônimos”, é bem conhecido que o uso de códons por organismos específicos é não aleatório e tendencioso para tripletos de códons específicos. Esse viés de uso de códon pode ser maior em referência a um determinado gene, genes de função comum ou origem ancestral, proteínas altamente expressas versus proteínas de baixo número de cópias e as regiões codificadoras de proteínas agregadas do genoma de um organismo. Em algumas modalidades, os polinucleotídeos que codificam as enzimas da DNA polimerase são códons otimizados para a produção ideal do organismo hospedeiro selecionado para expressão.
[0084] Tal como usado neste documento, “sequência de controle” se refere aqui para incluir todos os componentes que são necessários ou vantajosos para a expressão de um polinucleotídeo e/ou polipeptídeo da presente divulgação. Cada sequência de controle pode ser nativa ou estranha à sequência de ácido nucleico que codifica o polipeptídeo. Tais sequências de controle incluem, mas não estão limitadas a, líderes, sequências de poliadenilação, sequências de pró-peptídeos, sequências de promotores, sequências de peptídeos de sinal, sequências de iniciação e terminadores de transcrição. No mínimo, as sequências de controle incluem um promotor e sinais de parada da transcrição e tradução. Em algumas modalidades, as sequências de controle são fornecidas com ligantes com o propósito de introduzir locais de restrição específicos que facilitam a ligação das sequências de controle com a região de codificação da sequência de ácido nucleico que codifica um polipeptídeo.
[0085] “Ligado operacionalmente” é definido neste documento como uma configuração em que uma sequência de controle é adequadamente colocada (ou seja, em uma relação funcional) em uma posição em relação a um polinucleotídeo de interesse, de modo que a sequência de controle direcione ou regule a expressão do polinucleotídeo que codifica um polipeptídeo de interesse.
[0086] Tal como usado neste documento, “sequência promotora” se refere a uma sequência de ácido nucleico que é reconhecida por uma célula hospedeira para a expressão de um polinucleotídeo de interesse, como uma sequência de codificação. A sequência promotora contém sequências de controle transcricional que medeiam a expressão de um polinucleotídeo de interesse. O promotor pode ser qualquer sequência de ácido nucleico que mostra atividade transcricional na célula hospedeira de escolha, incluindo promotores mutantes, truncados e híbridos, e pode ser obtido a partir de genes que codificam polipeptídeos extracelulares ou intracelulares homólogos ou heterólogos à célula hospedeira.
[0087] Tal como usado neste documento, “condições de reação adequadas” referem-se às condições na solução de reação de conversão enzimática (por exemplo, faixas de carga de enzima, carga de substrato, temperatura, pH, tampões, co-solventes, etc.) sob as quais um polipeptídeo de DNA polimerase da presente divulgação é capaz de converter um substrato no composto do produto desejado. Exemplos de “condições de reação adequadas” são fornecidos neste documento (ver os exemplos).
[0088] Tal como usado neste documento, “carregamento”, tal como em “carregamento de composto” ou “carregamento de enzima” se refere à concentração ou quantidade de um componente em uma mistura de reação no início da reação. “Substrato”, no contexto de um processo de reação de conversão enzimática, se refere ao composto ou molécula sob a ação do polipeptídeo de DNA polimerase.
[0089] Tal como usado neste documento, “produto” no contexto de um processo de conversão enzimática se refere ao composto ou molécula resultante da ação do polipeptídeo de DNA polimerase no substrato.
[0090] Tal como usado neste documento, “cultura” se refere ao crescimento de uma população de células microbianas sob condições adequadas usando qualquer meio adequado (por exemplo, líquido, gel ou sólido).
[0091] Os polipeptídeos recombinantes (por exemplo, variantes da enzima DNA polimerase) podem ser produzidos usando quaisquer métodos adequados conhecidos na técnica. Por exemplo, existe uma grande variedade de diferentes técnicas de mutagênese bem conhecidas das pessoas versadas na técnica. Além disso, kits de mutagênese também estão disponíveis em muitos fornecedores comerciais de biologia molecular. Métodos estão disponíveis para fazer substituições específicas em aminoácidos definidos (direcionados ao local), mutações específicas ou aleatórias em uma região localizada do gene (região específica) ou mutagênese aleatória em todo o gene (por exemplo, mutagênese de saturação). Numerosos métodos adequados são conhecidos por aqueles versados na técnica para gerar variantes de enzimas, incluindo, mas não se limitando a mutagênese dirigida ao local de DNA de fita simples ou DNA de fita dupla usando PCR, mutagênese de cassete, síntese de genes, PCR propensa a erros, embaralhamento, e mutagênese de saturação química, ou qualquer outro método adequado conhecido na técnica. Exemplos não limitativos de métodos usados para engenharia de DNA e proteína são fornecidos nas seguintes patentes: Patente US No. 6.117.679; Patente US No. 6.420.175; Patente US No.
6.376.246; Patente US No. 6.586.182; Patente US No. 7.747.391; Patente US No. 7.747.393; Patente US No. 7.783.428; e Patente US No. 8.383.346. Depois que as variantes são produzidas, elas podem ser rastreadas para qualquer propriedade desejada (por exemplo, atividade alta ou aumentada, ou atividade baixa ou reduzida, atividade térmica aumentada, estabilidade térmica aumentada e/ou estabilidade de pH ácido, etc.). Em algumas modalidades, “polipeptídeos de
DNA polimerase recombinante” (também ditos aqui como “polipeptídeos de DNA polimerase projetados”, “DNA polimerases projetadas”, “enzimas de DNA polimerase variantes” e “variantes de DNA polimerase”) encontram uso.
[0092] Tal como usado neste documento, um “vetor” é uma construção de DNA para a introdução de uma sequência de DNA em uma célula. Em algumas modalidades, o vetor é um vetor de expressão que está operacionalmente ligado a uma sequência de controle adequada, capaz de efetuar a expressão em um hospedeiro adequado do polipeptídeo codificado na sequência de DNA. Em algumas modalidades, um “vetor de expressão” tem uma sequência promotora operacionalmente ligada à sequência de DNA (por exemplo, transgene) para conduzir a expressão em uma célula hospedeira e, em algumas modalidades, também compreende uma sequência terminadora da transcrição.
[0093] Tal como usado neste documento, o termo “expressão” inclui qualquer etapa envolvida na produção do polipeptídeo, incluindo, mas não se limitando a, transcrição, modificação pós-transcricional, tradução e modificação pós-tradução. Em algumas modalidades, o termo também abrange a secreção do polipeptídeo de uma célula.
[0094] Tal como usado neste documento, o termo “produz” se refere à produção de proteínas e/ou outros compostos pelas células. Pretende-se que o termo englobe qualquer etapa envolvida na produção de polipeptídeos, incluindo, mas não se limitando a, transcrição, modificação pós-transcricional, tradução e modificação pós-tradução. Em algumas modalidades, o termo também abrange a secreção do polipeptídeo de uma célula.
[0095] Tal como usado neste documento, uma sequência de aminoácidos ou nucleotídeos (por exemplo, uma sequência promotora, peptídeo sinal, sequência terminadora, etc.) é “heteróloga” para outra sequência com a qual está operacionalmente ligada se as duas sequências não estiverem associadas em natureza.
[0096] Tal como usado neste documento, os termos “célula hospedeira” e “cepa hospedeira” se referem a hospedeiros adequados para vetores de expressão compreendendo o DNA fornecido neste documento (por exemplo, uma sequência de polinucleotídeo que codifica pelo menos uma variante da DNA polimerase). Em algumas modalidades, as células hospedeiras são células procarióticas ou eucarióticas que foram transformadas ou transfectadas com vetores construídos usando técnicas de DNA recombinante conhecidas na arte.
[0097] Tal como usado neste documento, o termo “análogo” significa um polipeptídeo com mais de 70% de identidade de sequência, mas menos de 100% de identidade de sequência (por exemplo, mais de 75%, 78%, 80%, 83%, 85%, 88%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% de identidade de sequência) com um polipeptídeo de referência. Em algumas modalidades, os análogos incluem resíduos de aminoácidos de ocorrência não natural, incluindo, mas não se limitando, a homoarginina, ornitina e norvalina, bem como aminoácidos de ocorrência natural. Em algumas modalidades, os análogos também incluem um ou mais resíduos de aminoácidos D e ligações não peptídicas entre dois ou mais resíduos de aminoácidos.
[0098] Tal como usado neste documento, o termo “quantidade eficaz” significa uma quantidade suficiente para produzir o resultado desejado. Uma pessoa versada na técnica pode determinar qual a quantidade eficaz usando experimentação de rotina.
[0099] Os termos “isolado” e “purificado” são usados para se referir a uma molécula (por exemplo, um ácido nucleico isolado, polipeptídeo, etc.) ou outro componente que é removido de pelo menos um outro componente com o qual está naturalmente associado. O termo “purificado” não requer pureza absoluta, mas pretende ser uma definição relativa.
[00100] Tal como usado neste documento, “composição” e “formulação” abrangem produtos que compreendem pelo menos um
[00101] Tal como usado neste documento, “DNA livre de células” se refere ao DNA que circula livremente na corrente sanguínea e não está contido ou associado a células. Em algumas modalidades, o DNA livre de células compreende DNA originalmente derivado e liberado de células somáticas normais ou de linhagem germinativa, células cancerosas, células fetais, células microbianas ou vírus.
[00102] Tal como usado neste documento, “amplificação” se refere à replicação de ácido nucleico. Em algumas modalidades, o termo se refere à replicação do ácido nucleico modelo específico.
[00103] Tal como usado neste documento, “reação em cadeia da polimerase” e “PCR” se referem aos métodos descritos nas Patentes US Nos.
4.683.195 e 4.6884.202, incorporadas por referência neste documento. Estes métodos encontram uso no aumento da concentração de um segmento de uma sequência alvo ou uma sequência alvo inteira em uma mistura ou em um DNA purificado, sem clonagem ou purificação sendo necessária. A sequência de desnaturação, recozimento e extensão constituem um “ciclo”. As etapas de desnaturação, emparelhamento de primer e extensão de polimerase podem ser repetidas muitas vezes (isto é, múltiplos ciclos são usados), para obter uma alta concentração de DNA amplificado. O processo é bem conhecido na técnica e numerosas variações foram desenvolvidas ao longo dos anos desde que o método foi descrito pela primeira vez. Com a PCR, é possível amplificar uma única cópia de uma sequência alvo específica a um nível que é detectável por várias metodologias diferentes, incluindo, mas não se limitando a hibridização com uma sonda marcada, incorporação de iniciadores biotinilados seguido por detecção de conjugado avidina-enzima, incorporação de desoxirribonucleotídeo trifosfatos marcados com 32P (por exemplo, dCTP ou dATP) no segmento amplificado, etc. Além do DNA genômico, qualquer sequência de oligonucleotídeo passível de amplificação pode ser copiada usando PCR com um conjunto apropriado de primers. Os produtos de PCR também podem servir como modelos para amplificação.
[00104] Tal como usado neste documento, “alvo” quando usado em referência a PCR, se refere à região de ácido nucleico ligada pelos primers usados no método de PCR. O “alvo” é separado de outros ácidos nucleicos presentes na amostra usada no método de PCR. Um “segmento” é uma região de ácido nucleico dentro da sequência alvo.
[00105] Tal como usado neste documento, “modelo de amostra” se refere ao ácido nucleico originado de uma amostra que é analisada quanto à presença de ácido nucleico alvo. Em contraste, “modelo de fundo” se refere a ácido nucleico diferente do modelo de amostra que pode ou não estar presente em uma amostra. O modelo de fundo pode ser incluído inadvertidamente na amostra, pode resultar de transporte ou pode ser devido à presença de contaminantes de ácido nucleico a partir dos quais o ácido nucleico alvo é purificado. Por exemplo, em algumas modalidades, os ácidos nucleicos de organismos diferentes daqueles a serem detectados podem estar presentes como fundo em uma amostra de teste. No entanto, não se pretende que a presente invenção seja limitada a quaisquer amostras ou modelos de ácido nucleico específicos.
[00106] Tal como usado neste documento, “ácido nucleico amplificável” é usado em referência a ácidos nucleicos que podem ser amplificados por qualquer método de amplificação, incluindo, mas não se limitando a PCR. Na maioria das modalidades, os ácidos nucleicos amplificáveis compreendem modelos de amostra.
[00107] Tal como usado neste documento, “produto de PCR”, “fragmento de PCR” e “produto de amplificação” se referem aos compostos resultantes obtidos após dois ou mais ciclos de amplificação de PCR (ou outro método de amplificação, conforme indicado pelo contexto), tipicamente compreendendo as etapas de desnaturação, recozimento e extensão. Os termos abrangem a situação em que houve amplificação de um ou mais segmentos de uma ou mais sequências alvo.
[00108] Tal como usado neste documento, “reagentes de amplificação” e
“reagentes de PCR” se referem a esses reagentes (por exemplo, desoxirribonucleotídeo trifosfatos, tampão, etc.), necessários para a amplificação, exceto para os primers, modelo de ácido nucleico e a enzima de amplificação. Normalmente, os reagentes de amplificação, juntamente com outros componentes de reação, são colocados e contidos em um recipiente de reação (por exemplo, tubo de ensaio, micropoço, etc.). Não se pretende que a presente invenção seja limitada a quaisquer reagentes de amplificação específicos, uma vez que quaisquer reagentes adequados encontram uso na presente invenção.
[00109] Tal como usado neste documento, “endonuclease de restrição” e “enzima de restrição” se referem a enzimas que cortam ácidos nucleicos de fita dupla em ou próximo a uma sequência de nucleotídeos específica (isto é, um “sítio de restrição”). Em algumas modalidades, a enzima de restrição é uma enzima bacteriana e em algumas modalidades adicionais, o ácido nucleico é DNA.
[00110] Tal como usado neste documento, “primer” se refere a um oligonucleotídeo (ou seja, uma sequência de nucleotídeos), ocorrendo naturalmente ou produzido sinteticamente, recombinantemente ou por amplificação, que é capaz de atuar como um ponto de iniciação da síntese de ácido nucleico, quando colocado sob condições em que a síntese de um produto de extensão de primer que é complementar a uma fita de ácido nucleico é induzida (isto é, na presença de nucleotídeos e um agente indutor, como DNA polimerase, e em uma temperatura e pH adequados). Na maioria das modalidades, os primers são de fita simples, mas em algumas modalidades, eles são de fita dupla. Em algumas modalidades, os primers têm comprimento suficiente para iniciar a síntese de produtos de extensão na presença de DNA polimerase. O comprimento exato do primer depende de muitos fatores, como é conhecido pelas pessoas versadas na técnica.
[00111] Tal como usado neste documento, “sonda” se refere a um oligonucleotídeo (isto é, uma sequência de nucleotídeos), ocorrendo naturalmente ou produzido sinteticamente, recombinantemente ou por amplificação, que é capaz de hibridizar com outro oligonucleotídeo de interesse. As sondas encontram uso na detecção, identificação e/ou isolamento de sequências de genes particulares de interesse. Em algumas modalidades, as sondas são marcadas com uma “molécula repórter” (também chamada de “marcador”) que auxilia na detecção da sonda em um sistema de detecção adequado (por exemplo, fluorescente, radioativo, luminescente, enzimático e outros sistemas). Não se pretende que a presente invenção seja limitada a qualquer sistema de detecção ou marcador particular. Os primers, desoxirribonucleotídeos e desoxirribonucleosídeos podem conter marcadores. Na verdade, não se pretende que a composição marcada da presente invenção seja limitada a qualquer componente particular. Marcadores ilustrativos incluem, mas não estão limitados a 32P, 35S e moléculas fluorescentes (por exemplo, corantes fluorescentes, incluindo, mas não se limitando a, proteína fluorescente verde).
[00112] Tal como usado neste documento, “fidelidade”, quando usado em referência a uma polimerase, destina-se a se referir à precisão da incorporação dirigida por modelo de bases complementares em uma fita de DNA sintetizada em relação à fita modelo. Normalmente, a fidelidade é medida com base na frequência de incorporação de bases incorretas na fita de ácido nucleico recém-sintetizada. A incorporação de bases incorretas pode resultar em mutações pontuais, inserções ou deleções. A fidelidade pode ser calculada de acordo com qualquer método conhecido na técnica (ver, por exemplo, Tindall e Kunkel, Biochem., 27: 6008 a 6013 [1988]; e Barnes, Gene 112: 29 a 35
[1992]). Uma polimerase ou variante da polimerase pode exibir alta fidelidade ou baixa fidelidade. Tal como usado neste documento, “alta fidelidade” se refere a polimerases com uma frequência de incorporação de base precisa que excede um valor predeterminado. Tal como usado neste documento, o termo “baixa fidelidade” se refere a polimerases com uma frequência de incorporação de base precisa que é inferior a um valor predeterminado. Em algumas modalidades, o valor predeterminado é uma frequência desejada de incorporação de base precisa ou a fidelidade de uma polimerase conhecida (ou seja, uma polimerase de referência).
[00113] Tal como usado neste documento, “fidelidade alterada” se refere à fidelidade de uma variante da polimerase que difere da fidelidade da polimerase parental da qual a variante da polimerase foi derivada. Em algumas modalidades, a fidelidade alterada é maior do que a fidelidade da polimerase parental, enquanto em algumas outras modalidades, a fidelidade alterada é inferior à fidelidade da polimerase parental. A fidelidade alterada pode ser determinada testando as polimerases parentais e variantes e comparando suas atividades usando qualquer teste adequado conhecido na técnica.
[00114] Tal como usado neste documento, o termo “ligase” se refere a uma classe de enzimas que é comumente usada para unir polinucleotídeos ou para unir as extremidades de um único polinucleotídeo. As ligases incluem ligases polinucleotídicas de fita dupla dependentes de ATP, ligases de DNA ou RNA de fita dupla dependentes de NAD+ e ligases polinucleotídicas de fita simples. Em algumas modalidades, a presente invenção fornece ligases de bacteriófago (por exemplo, ligase de T3 DNA, ligase de T4 DNA e ligase de T7 DNA) e variantes das mesmas. Em algumas outras modalidades, a presente invenção fornece ligases de fusão ou quiméricas. As ligases de DNA frequentemente encontram uso com enzimas de restrição para a inserção de fragmentos de DNA (por exemplo, genes) em plasmídeos. Para a ligação de fragmentos com extremidades coesivas, controlar a temperatura ideal é importante para realizar a recombinação eficiente. A ligase de T4 DNA é mais ativa a 37 °C, mas para eficiência de ligação ideal com fragmentos de extremidades coesivas, a temperatura ideal para a enzima deve ser equilibrada com a temperatura de fusão das extremidades sendo ligadas; quanto mais curta for a saliência, mais baixa será a temperatura de fusão dos fragmentos. As reações de ligação tendem a ser mais eficientes quando as extremidades coesivas já estão recozidas de forma estável. Para a ligação de fragmentos de DNA com extremidades cegas, a temperatura de fusão não é um fator a ser levado em consideração quando a reação ocorre dentro das faixas de temperatura normais usadas para a ligação. Nessas reações, o fator limitante é o número de alinhamentos entre as extremidades dos fragmentos de DNA que podem ocorrer, ao invés da atividade da ligase. Assim, a temperatura mais eficiente para a ligação de fragmentos de DNA de extremidades cegas é a temperatura na qual o maior número de alinhamentos pode ocorrer na reação.
[00115] Tal como usado neste documento, o termo “adaptador” se refere a um oligonucleotídeo de fita simples ou dupla com extremidades de DNA compatíveis para ligação. As extremidades de um adaptador podem ser de fita simples ou dupla e podem conter saliências compatíveis com saliências complementares no DNA de inserção de biblioteca processado. Os adaptadores podem ter regiões de fita simples e dupla. Em algumas modalidades, o termo “adaptador” é usado para se referir a adaptadores de comprimento total usados em reações NGS (ou seja, sequenciamento de próxima geração) que podem incluir locais de lance de primer, códigos de barras e outros recursos, bem como se referindo a adaptadores de modelo simplificado usado em testes de triagem e ligação de HTP, tendo as mesmas extremidades compatíveis com a ligação que os adaptadores de comprimento total, mas sem esses recursos adicionais. Os adaptadores NGS projetados para uso na plataforma de sequenciamento Illumina® têm saliências de desoxitimidina 3' compatíveis para ligação com saliências de desoxiadenosina 3' presentes em fragmentos de inserção com cauda A. Os adaptadores de cauda T não são eficientemente ligados uns aos outros devido à seletividade da ligase de T4 DNA de tipo selvagem contra extremidades de DNA não complementares. A dimerização do adaptador ocorrerá como resultado de condições extremas de ligação, incluindo longos períodos de incubação, altas concentrações do adaptador ou altas concentrações de agente de aglomeração. É importante ressaltar que os contaminantes de nuclease na reação de ligação podem remover saliências nas extremidades do adaptador, resultando em substratos de extremidades cegas, que são compatíveis para a autoligação.
[00116] Tal como usado neste documento, o termo “extremidades compatíveis” se refere às extremidades de dois fragmentos de duplex de DNA com saliências 5' ou 3' que hibridizam em uma orientação antiparalela de 5' a 3', de modo que todas as bases nas saliências são complementares. No contexto da ligação, pelo menos um fragmento de DNA deve ter um fosfato 5' em um nucleotídeo que é colocado adjacente a uma hidroxila 3' de um nucleotídeo de outra molécula após a hibridização da saliência 3' ou 5'. A ligação resulta na ligação covalente das duas moléculas de substrato nas extremidades compatíveis. Em algumas modalidades que envolvem a preparação de biblioteca para sequenciamento de DNA, duas moléculas de DNA, como um adaptador e um fragmento de inserção devem ter extremidades compatíveis, e ambas as fitas do adaptador/híbrido de inserção devem ser ligadas a fim de permitir a amplificação produtiva da biblioteca por PCR ou sequenciamento por extensão da polimerase de um primer hibridizado com o adaptador.
[00117] Tal como usado neste documento, o termo “saliência” se refere a uma região de um ou mais polinucleotídeos desemparelhados que ocorrem no final de um fragmento de DNA de fita dupla. Uma extremidade de DNA 5' ou 3' pode estar presente na região desemparelhada. O fragmento de DNA de fita dupla pode ser um duplex de dois polinucleotídeos de fita simples complementares, ou pode ser um polinucleotídeo único com auto- complementaridade que forma uma região de DNA de fita dupla.
[00118] O termo “indivíduo” abrange mamíferos, como humanos, primatas não humanos, gado, animais de companhia e animais de laboratório (por exemplo, roedores e lagamorfos). Pretende-se que o termo abranja tanto mulheres quanto homens.
[00119] Tal como usado neste documento, o termo “paciente” significa qualquer indivíduo que está sendo avaliado, tratado ou que está sofrendo de doença. Polipeptídeos de DNA polimerase projetados:
[00120] Quando uma variante de DNA polimerase particular (isto é, um polipeptídeo de DNA polimerase projetado) é dita por referência à modificação de resíduos de aminoácidos particulares na sequência de uma DNA polimerase de tipo selvagem ou DNA polimerase de referência, deve ser entendido que as variantes de outra DNA polimerase modificada na(s) posição(ões) equivalente(s) (conforme determinado a partir do alinhamento opcional da sequência de aminoácidos entre as respectivas sequências de aminoácidos) são aqui englobadas.
[00121] As variantes de polipeptídeo de polipeptídeo de DNA polimerase projetadas da presente invenção realizam reações de polimerase, incluindo aquelas úteis na reação em cadeia da polimerase (PCR) e outras reações que utilizam a polimerase para produzir DNA.
[00122] As variantes de DNA polimerase projetadas da presente invenção encontram uso na criação eficiente de bibliotecas de DNA adequadas para NGS e outros métodos de diagnóstico. Estas variantes da DNA polimerase encontram uso em solução, bem como em modalidades imobilizadas.
[00123] Em algumas modalidades adicionais, o polipeptídeo de DNA polimerase projetado da presente invenção compreende um polipeptídeo compreendendo pelo menos 70%, pelo menos 75%, pelo menos 80%, pelo menos 85%, pelo menos 90%, pelo menos 91%, pelo menos 92%, pelo menos 93%, pelo menos 94%, pelo menos 95%, pelo menos 96%, pelo menos 97%, pelo menos 98% ou pelo menos 99% de identidade de sequência com SEQ ID NO: 2, 6, 22, 24, 26, 28 e/ou 824.
[00124] Em algumas modalidades, os polipeptídeos de DNA polimerase projetados são produzidos cultivando um micro-organismo compreendendo pelo menos uma sequência polinucleotídica que codifica pelo menos um polipeptídeo de DNA polimerase projetado sob condições que conduzem à produção do polipeptídeo de DNA polimerase projetado. Em algumas modalidades, o polipeptídeo de DNA polimerase projetado é subsequentemente recuperado do meio de cultura e/ou das células resultantes.
[00125] A presente invenção fornece exemplos de polipeptídeos de DNA polimerase projetados com atividade de DNA polimerase. Os exemplos fornecem tabelas que mostram informações estruturais de sequência correlacionando características específicas da sequência de aminoácidos com a atividade funcional dos polipeptídeos de DNA polimerase projetados. Esta informação de correlação de estrutura-função é fornecida na forma de diferenças específicas de resíduos de aminoácidos em relação ao polipeptídeo de engenharia de referência da SEQ ID NO: 2, 6, 22, 24, 26, 28 e/ou 824, bem como dados de atividade determinados experimentalmente associados para os polipeptídeos de DNA polimerase projetados exemplares.
[00126] Em algumas modalidades, os polipeptídeos de DNA polimerase projetados da presente invenção com atividade de DNA polimerase compreendem uma sequência de aminoácidos com pelo menos 85% de identidade de sequência com a sequência de referência SEQ ID NO: 2, 6, 22, 24, 26, 28, e/ou 824, e que exibe pelo menos uma propriedade melhorada, em comparação com a sequência de referência (por exemplo, DNA polimerase de tipo selvagem). Em algumas modalidades, a propriedade melhorada é maior produto produzido durante PCR, enquanto em algumas modalidades adicionais, a propriedade melhorada é maior fidelidade e, ainda em algumas modalidades adicionais, a propriedade melhorada é termoestabilidade aumentada.
[00127] Em algumas modalidades, os polipeptídeos de DNA polimerase projetados exibindo pelo menos uma propriedade melhorada têm pelo menos 85%, pelo menos 88%, pelo menos 90%, pelo menos 91%, pelo menos 92%,
pelo menos 93%, pelo menos 94%, pelo menos 95%, pelo menos 96%, pelo menos 97%, pelo menos 98%, pelo menos 99% ou maior identidade de sequência de aminoácidos com SEQ ID NO: 2, 6, 22, 24, 26, 28, e/ou 824, e uma diferença de resíduo de aminoácido em uma ou mais posições de aminoácido (tal como em 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 14, 15, 20 ou mais posições de aminoácidos) em comparação com SEQ ID NO: 2, 6, 22, 24, 26, 28 e/ou 824. Em algumas modalidades, o polipeptídeo de DNA polimerase projetado é um polipeptídeo listado nas Tabelas fornecidas nos Exemplos (por exemplo, Tabela
3.1, 3.2, 3.3. 3.4, 3.5, 3.6, 3.7, 3.8, 4.1, 4.2, 4.3, 4.4, 4.5, 6.2 e/ou 6.3).
[00128] Em algumas modalidades, a presente invenção fornece fragmentos funcionais de polipeptídeos de DNA polimerase projetados. Em algumas modalidades, os fragmentos funcionais compreendem pelo menos cerca de 90%, pelo menos cerca de 95%, pelo menos cerca de 96%, pelo menos cerca de 97%, pelo menos cerca de 98% ou pelo menos cerca de 99% da atividade do polipeptídeo de DNA polimerase modificado do qual foi derivado (ou seja, a DNA polimerase projetada parental). Em algumas modalidades, os fragmentos funcionais compreendem pelo menos cerca de 90%, pelo menos cerca de 91%, pelo menos cerca de 92%, pelo menos cerca de 93%, pelo menos cerca de 94%, pelo menos cerca de 95%, pelo menos cerca de 96%, pelo menos cerca de 97%, pelo menos cerca de 98% ou pelo menos cerca de 99% da sequência parental da DNA polimerase projetada. Em algumas modalidades, o fragmento funcional será truncado por menos de 5, menos de 10, menos de 15, menos de 10, menos de 25, menos de 30, menos de 35, menos de 40, menos de 45 e menos de 50 aminoácidos.
[00129] Em algumas modalidades, a presente invenção fornece fragmentos funcionais de polipeptídeos de DNA polimerase projetados. Em algumas modalidades, os fragmentos funcionais compreendem pelo menos cerca de 95%, 96%, 97%, 98% ou 99% da atividade do polipeptídeo da DNA polimerase projetado a partir do qual foi derivado (isto é, a DNA polimerase projetada parental). Em algumas modalidades, os fragmentos funcionais compreendem pelo menos 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% ou 99% da sequência parental da DNA polimerase projetada. Em algumas modalidades, o fragmento funcional será truncado por menos de 5, menos de 10, menos de 15, menos de 10, menos de 25, menos de 30, menos de 35, menos de 40, menos de 45, menos de 50, menos de 55, menos de 60, menos de 65 ou menos de 70 aminoácidos.
[00130] Em algumas modalidades, os polipeptídeos de DNA polimerase projetados exibindo pelo menos uma propriedade melhorada têm pelo menos 85%, pelo menos 88%, pelo menos 90%, pelo menos 91%, pelo menos 92%, pelo menos 93%, em pelo menos 94%, pelo menos 95%, pelo menos 96%, pelo menos 97%, pelo menos 98%, pelo menos 99% ou mais de identidade de sequência de aminoácidos com SEQ ID NO: 2, 6, 22, 24, 26, 28 e/ou 824, e uma diferença de resíduo de aminoácido em uma ou mais posições de aminoácidos (como em 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 14, 15 ou mais posições de aminoácidos) em comparação com SEQ ID NO: 2, 6, 22, 24, 26, 28 e/ou 824. Em algumas modalidades, as DNA polimerases projetadas compreendem pelo menos 90% de identidade de sequência com a SEQ ID NO: 2, 6, 22, 24, 26, 28 e/ou 824 e compreendem uma diferença de aminoácidos de pelo menos 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 ou mais posições de aminoácidos. Em algumas modalidades, o polipeptídeo de DNA polimerase projetado consiste na sequência de SEQ ID NO: 6, 22, 24, 26, 28 e/ou 824. Polinucleotídeos que codificam polipeptídeos projetados, vetores de expressão e células hospedeiras:
[00131] A presente invenção fornece polinucleotídeos que codificam os polipeptídeos de DNA polimerase projetados descritos neste documento. Em algumas modalidades, os polinucleotídeos são operativamente ligados a uma ou mais sequências regulatórias heterólogas que controlam a expressão do gene para criar um polinucleotídeo recombinante capaz de expressar o polipeptídeo.
Em algumas modalidades, os construtos de expressão contendo pelo menos um polinucleotídeo heterólogo que codifica o(s) polipeptídeo(s) de DNA polimerase projetado(s) são introduzidos em células hospedeiras apropriadas para expressar o(s) polipeptídeo(s) de DNA polimerase correspondente(s).
[00132] Como será evidente para a pessoa versada na técnica, a disponibilidade de uma sequência de proteína e o conhecimento dos códons correspondentes aos vários aminoácidos fornecem uma descrição de todos os polinucleotídeos capazes de codificar os polipeptídeos em questão. A degenerescência do código genético, onde os mesmos aminoácidos são codificados por códons alternativos ou sinônimos, permite que um número extremamente grande de ácidos nucléicos seja produzido, todos codificando um polipeptídeo de DNA polimerase projetado. Assim, a presente invenção fornece métodos e composições para a produção de cada uma das variações possíveis de polinucleotídeos de DNA polimerase que poderiam ser feitas que codificam os polipeptídeos de DNA polimerase descritos neste documento selecionando combinações com base nas possíveis escolhas de códons, e todas essas variações são para ser consideradas especificamente divulgadas para qualquer polipeptídeo descrito neste documento, incluindo as sequências de aminoácidos apresentadas nos Exemplos (por exemplo, na Tabela 3.1, 3.2, 3.3. 3.4, 3.5, 3.6, 3.7, 3.8, 4.1,
4.2, 4.3, 4.4, e/ou 4.5).
[00133] Em algumas modalidades, os códons são preferencialmente otimizados para utilização pela célula hospedeira escolhida para a produção de proteínas. Por exemplo, códons preferidos usados em bactérias são tipicamente usados para expressão em bactérias. Consequentemente, os polinucleotídeos com códon otimizado que codificam os polipeptídeos de DNA polimerase projetados contêm códons preferidos em cerca de 40%, 50%, 60%, 70%, 80%, 90% ou mais do que 90% das posições de códon na região de codificação de comprimento total.
[00134] Em algumas modalidades, o polinucleotídeo de DNA polimerase codifica um polipeptídeo projetado com atividade de DNA polimerase com as propriedades divulgadas neste documento, em que o polipeptídeo compreende uma sequência de aminoácidos com pelo menos 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% ou mais de identidade com uma sequência de referência selecionada a partir de SEQ ID NO: 2, 6, 22, 24, 26, 28 e/ou 824, ou a sequência de aminoácidos de qualquer variante (por exemplo, aquelas fornecidas nos Exemplos), e uma ou mais diferenças de resíduos em comparação com o polinucleotídeo de referência da SEQ ID NO: 2, 6, 22, 24, 26, 28 e/ou 824, ou a sequência de aminoácidos de qualquer variante, conforme divulgado nos Exemplos (por exemplo 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 ou mais posições de resíduos de aminoácidos). Em algumas modalidades, a sequência de referência é selecionada a partir de SEQ ID NO: 2, 6, 22, 24, 26, 28 e/ou 824. Em algumas modalidades, as variantes de DNA polimerase projetadas compreendem uma sequência polipeptídica estabelecida na SEQ ID NO: 6, 22, 24, 26, 28 e/ou 824. Em algumas modalidades, as variantes de DNA polimerase projetadas compreendem a(s) substituição(ões) ou conjunto(s) de substituição de DNA polimerases variantes fornecidas nos Exemplos.
[00135] A presente invenção fornece polinucleotídeos que codificam as variantes de DNA polimerase projetadas fornecida neste documento. Em algumas modalidades, os polinucleotídeos compreendem uma sequência de nucleotídeos com pelo menos 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% ou mais de identidade com uma sequência de referência selecionada a partir de SEQ ID NO: 1, 5, 21, 23, 25, 27 e/ou 823, ou a sequência de ácido nucleico de qualquer variante (por exemplo, aquelas fornecidas nos Exemplos), e uma ou mais diferenças de resíduos em comparação com o polinucleotídeo de referência da SEQ ID NO: 1, 5, 21, 23, 25, 27 e/ou 823, ou a sequência de ácido nucleico de qualquer variante conforme divulgado nos Exemplos (por exemplo 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 ou mais posições). Em algumas modalidades, a sequência de referência é selecionada a partir da SEQ ID NO: 1, 5, 21, 23, 25, 27 e/ou 823. Em algumas modalidades, os polinucleotídeos são capazes de hibridizar sob condições altamente rigorosas com uma sequência polinucleotídica de referência selecionada a partir de SEQ ID NO: 1, 5, 21, 23, 25, 27 e/ou 823, ou um complemento da mesma, ou uma sequência de polinucleotídeo que codifica qualquer um dos polipeptídeos de DNA polimerase variantes fornecidos neste documento. Em algumas modalidades, o polinucleotídeo capaz de hibridizar sob condições altamente rigorosas codifica um polipeptídeo de DNA polimerase compreendendo uma sequência de aminoácidos que tem uma ou mais diferenças de resíduos em comparação com SEQ ID NO: 2, 22, 24, 26, 28 e/ou 824. Em algumas modalidades, as variantes da DNA polimerase projetadas são codificadas por uma sequência polinucleotídica estabelecida na SEQ ID NO: 1, 5, 21, 23, 25, 27 e/ou 823.
[00136] Em algumas modalidades, um polinucleotídeo isolado que codifica qualquer um dos polipeptídeos de DNA polimerase projetados aqui é projetado de uma variedade de maneiras para facilitar a expressão do polipeptídeo de DNA polimerase. Em algumas modalidades, os polinucleotídeos que codificam os polipeptídeos de DNA polimerase compreendem vetores de expressão onde uma ou mais sequências de controle estão presentes para regular a expressão dos polinucleotídeos e/ou polipeptídeos de DNA polimerase. A manipulação do polinucleotídeo isolado antes da sua inserção em um vetor pode ser desejável ou necessária dependendo do vetor de expressão utilizado. As técnicas para modificar polinucleotídeos e sequências de ácido nucleico utilizando métodos de DNA recombinante são bem conhecidas na arte. Em algumas modalidades, as sequências de controle incluem, entre outros, promotores, sequências líder, sequências de poliadenilação, sequências de propeptídeos, sequências de peptídeos de sinal e terminadores de transcrição. Em algumas modalidades, os promotores adequados são selecionados com base na seleção de células hospedeiras. Para células hospedeiras bacterianas, promotores adequados para direcionar a transcrição dos construtos de ácido nucleico da presente divulgação incluem, mas não estão limitados a promotores obtidos a partir do operon lac de E. coli, gene de agarase de Streptomyces coelicolor (dagA), gene de levansucrase de Bacillus subtilis ( sacB), gene de alfa-amilase de Bacillus licheniformis (amyL), gene de amilase maltogênica de Bacillus stearothermophilus (amyM), gene de alfa-amilase de Bacillus amyloliquefaciens (amyQ), genes de penicilinase de Bacillus licheniformis (penP), genes xy1A e xy1B de Bacillus subtilis, e gene beta-lactamase procariótico (ver, por exemplo, Villa-Kamaroff et al., Proc. Natl Acad. Sei. USA 75: 3727 a 3731 [1978]), bem como o promotor tac (ver, por exemplo, DeBoer et al., Proc. Natl Acad. Sci. USA 80: 21 a 25 [1983]). Promotores exemplares para células hospedeiras de fungos filamentosos incluem, mas não estão limitados a promotores obtidos a partir dos genes para TAKA amilase de Aspergillus oryzae, proteinase aspártica de Rhizomucor miehei, alfa-amilase neutra de Aspergillus niger, alfa-amilase estável com ácido de Aspergillus niger, glucoamilase de Aspergillus niger ou Asperillus awamori (glaA), lipase de Rhizomucor miehei, protease alcalina de Aspergillus oryzae, triose fosfato isomerase de Aspergillus oryzae, acetamidase de Aspergillus nidulans e protease de Fusarium oxysporum semelhante a tripsina (ver, por exemplo, o promotor WO 96/00pi7) (um híbrido dos promotores dos genes para alfa-amilase neutra de Aspergillus niger e triose fosfato isomerase de Aspergillus oryzae) e seus promotores mutantes, truncados e híbridos. Os promotores de células de levedura exemplares podem ser dos genes para enolase de Saccharomyces cerevisiae (ENO-1), galactoquinase de Saccharomyces cerevisiae (GAL1), álcool desidrogenase/gliceraldeído-3-fosfato desidrogenase de Saccharomyces cerevisiae (ADH2/GAP), e 3-fosfoglicerato quinase de Saccharomyces cerevisiae. Outros promotores úteis para células hospedeiras de levedura são conhecidos na técnica (ver, por exemplo, Romanos et al., Yeast 8: 423 a 488 [1992]).
[00137] Em algumas modalidades, a sequência de controle também é uma sequência de terminação de transcrição adequada (ou seja, uma sequência reconhecida por uma célula hospedeira para terminar a transcrição). Em algumas modalidades, a sequência de terminação está operacionalmente ligada ao terminal 3' da sequência de ácido nucleico que codifica o polipeptídeo de DNA polimerase. Qualquer terminador adequado que seja funcional na célula hospedeira de escolha encontra uso na presente invenção. Terminadores de transcrição exemplares para células hospedeiras de fungos filamentosos podem ser obtidos a partir dos genes para TAKA amilase de Aspergillus oryzae, glucoamilase de Aspergillus niger, antranilato sintase de Aspergillus nidulans, alfa-glucosidase de Aspergillus niger e protease semelhante a tripsina de Fusarium oxysporum. Terminadores exemplares para células hospedeiras de levedura podem ser obtidos a partir dos genes para enolase de Saccharomyces cerevisiae, citocromo C de Saccharomyces cerevisiae (CYC1) e gliceraldeído-3- fosfato desidrogenase de Saccharomyces cerevisiae. Outros terminadores úteis para células hospedeiras de levedura são conhecidos na técnica (ver, por exemplo, Romanos et al., acima).
[00138] Em algumas modalidades, a sequência de controle também é uma sequência líder adequada (ou seja, uma região não traduzida de um mRNA que é importante para a tradução pela célula hospedeira). Em algumas modalidades, a sequência líder está operacionalmente ligada ao terminal 5' da sequência de ácido nucleico que codifica o polipeptídeo de DNA polimerase. Qualquer sequência líder adequada que seja funcional na célula hospedeira de escolha encontra uso na presente invenção. Líderes exemplares para células hospedeiras de fungos filamentosos são obtidos a partir dos genes para TAKA amilase de Aspergillus oryzae e triose fosfato isomerase de Aspergillus nidulans. Os líderes adequados para células hospedeiras de levedura são obtidos a partir dos genes para enolase de Saccharomyces cerevisiae (ENO-1), 3-fosfoglicerato quinase de Saccharomyces cerevisiae, fator alfa de Saccharomyces cerevisiae e álcool desidrogenase/gliceraldeído-3-fosfato desidrogenase de Saccharomyces cerevisiae (ADH ).
[00139] Em algumas modalidades, a sequência de controle também é uma sequência de poliadenilação (ou seja, uma sequência operacionalmente ligada ao terminal 3' da sequência de ácido nucleico e que, quando transcrita, é reconhecida pela célula hospedeira como um sinal para adicionar resíduos de poliadenosina para mRNA transcrito). Qualquer sequência de poliadenilação adequada que seja funcional na célula hospedeira de escolha encontra uso na presente invenção. Sequências de poliadenilação exemplificativas para células hospedeiras de fungos filamentosos incluem, mas não estão limitadas aos genes para TAKA amilase de Aspergillus oryzae, glucoamilase de Aspergillus niger, antranilato sintase de Aspergillus nidulans, TAKA amilase de Fusarium oxysporum, glucoamilase de Aspergillus niger, antranilato sintase de Aspergillus nidulans, protease semelhante à tripsina de Fusarium oxysporum e alfa- glucosidase de Aspergillus niger. São conhecidas sequências de poliadenilação úteis para células hospedeiras de levedura (ver, por exemplo, Guo e Sherman, Mol. Cell. Biol., 15: 5983 a 5990 [1995]).
[00140] Em algumas modalidades, a sequência de controle também é um peptídeo sinal (isto é, uma região de codificação que codifica uma sequência de aminoácidos ligada ao terminal amino de um polipeptídeo e que direciona o polipeptídeo codificado para a via secretória da célula). Em algumas modalidades, a extremidade 5' da sequência de codificação da sequência de ácido nucleico contém inerentemente uma região de codificação do peptídeo sinal naturalmente ligada no quadro de leitura da tradução com o segmento da região de codificação que codifica o polipeptídeo secretado. Alternativamente, em algumas modalidades, a extremidade 5' da sequência de codificação contém uma região de codificação do peptídeo sinal que é estranha à sequência de codificação. Qualquer região de codificação de peptídeo sinal adequada que direcione o polipeptídeo expresso para a via secretora de uma célula hospedeira de escolha encontra uso para a expressão do(s) polipeptídeo(s) projetado(s). As regiões de codificação de peptídeos sinal eficazes para células hospedeiras bacterianas são as regiões de codificação de peptídeos sinal que incluem, mas não estão limitadas àquelas obtidas a partir dos genes para amilase maltogênica de Bacillus NClB 11837, alfa-amilase de Bacillus stearothermophilus, subtilisina de Bacillus licheniformis, beta-lactamase de Bacillus licheniformis, proteases neutras de Bacillus stearothermophilus (nprT, nprS, nprM) e prsA de Bacillus subtilis. Outros peptídeos sinal são conhecidos na técnica (ver, por exemplo, Simonen e Palva, Microbiol. Rev., 57: 109 a 137 [1993]). Em algumas modalidades, regiões de codificação de peptídeo sinal eficazes para células hospedeiras de fungos filamentosos incluem, mas não estão limitadas às regiões de codificação de peptídeo sinal obtidas a partir dos genes para amilase TAKA de Aspergillus oryzae, amilase neutra de Aspergillus niger, glucoamilase de Aspergillus niger, proteinase aspártica de Rhizomucor miehei, celulase de Humicola insolens e lipase de Humicola lanuginosa. Peptídeos sinal úteis para células hospedeiras de levedura incluem, mas não estão limitados àqueles dos genes para fator alfa de Saccharomyces cerevisiae e invertase de Saccharomyces cerevisiae.
[00141] Em algumas modalidades, a sequência de controle também é uma região de codificação de propeptídeo que codifica uma sequência de aminoácidos posicionada no terminal amino de um polipeptídeo. O polipeptídeo resultante é dito como uma “proenzima”, “propolipeptídeo” ou “zimogênio”. Um propolipeptídeo pode ser convertido em um polipeptídeo ativo maduro por clivagem catalítica ou autocatalítica do propeptídeo do propolipeptídeo. A região de codificação do propeptídeo pode ser obtida a partir de qualquer fonte adequada, incluindo, mas não se limitando aos genes para protease alcalina de Bacillus subtilis (aprE), protease neutra de Bacillus subtilis (nprT), fator alfa de Saccharomyces cerevisiae, proteinase aspártica de Rhizomucor miehei e lactase de Myceliophthora termophila (ver, por exemplo, WO 95/33836). Quando ambas as regiões do peptídeo sinal e do propeptídeo estão presentes no terminal amino de um polipeptídeo, a região do propeptídeo é posicionada próximo ao terminal amino de um polipeptídeo e a região do peptídeo sinal está posicionada ao lado do terminal amino da região do propeptídeo.
[00142] Em algumas modalidades, sequências regulatórias também são utilizadas. Essas sequências facilitam a regulação da expressão do polipeptídeo em relação ao crescimento da célula hospedeira. Exemplos de sistemas reguladores são aqueles que fazem com que a expressão do gene seja ligada ou desligada em resposta a um estímulo químico ou físico, incluindo a presença de um composto regulador. Em células hospedeiras procarióticas, as sequências regulatórias adequadas incluem, mas não estão limitadas aos sistemas operacionais lac, tac e trp. Em células hospedeiras de levedura, os sistemas reguladores adequados incluem, mas não estão limitados ao sistema ADH2 ou sistema GAL1. Em fungos filamentosos, as sequências regulatórias adequadas incluem, mas não estão limitadas ao promotor TAKA alfa-amilase, promotor de glucoamilase de Aspergillus niger e promotor de glucoamilase de Aspergillus oryzae.
[00143] Em outro aspecto, a presente invenção é dirigida a um vetor de expressão recombinante compreendendo um polinucleotídeo que codifica um polipeptídeo de DNA polimerase projetado e uma ou mais regiões de regulação da expressão, como um promotor e um terminador, uma origem de replicação, etc., dependendo no tipo de hospedeiros nos quais eles devem ser introduzidos. Em algumas modalidades, os vários ácidos nucleicos e sequências de controle aqui descritos são unidos para produzir vetores de expressão recombinantes que incluem um ou mais locais de restrição convenientes para permitir a inserção ou a substituição da sequência de ácido nucleico que codifica o polipeptídeo de DNA polimerase em tais locais. Alternativamente, em algumas modalidades, a sequência de ácido nucleico da presente invenção é expressa inserindo a sequência de ácido nucleico ou um construto de ácido nucleico compreendendo a sequência em um vetor apropriado para expressão. Em algumas modalidades que envolvem a criação do vetor de expressão, a sequência de codificação está localizada no vetor de modo que a sequência de codificação esteja operacionalmente ligada às sequências de controle apropriadas para a expressão.
[00144] O vetor de expressão recombinante pode ser qualquer vetor adequado (por exemplo, um plasmídeo ou um vírus), que pode ser convenientemente submetido a procedimentos de DNA recombinante e provocar a expressão da sequência de polinucleotídeo da DNA polimerase. A escolha do vetor normalmente depende da compatibilidade do vetor com a célula hospedeira na qual o vetor será introduzido. Os vetores podem ser plasmídeos lineares ou circulares fechados.
[00145] Em algumas modalidades, o vetor de expressão é um vetor de replicação autônoma (ou seja, um vetor que existe como uma entidade extracromossômica, cuja replicação é independente da replicação cromossômica, como um plasmídeo, um elemento extracromossômico, um minicromossomo ou um cromossomo artificial). O vetor pode conter qualquer meio para assegurar a auto-replicação. Em algumas modalidades alternativas, o vetor é aquele em que, quando introduzido na célula hospedeira, é integrado no genoma e replicado junto com o(s) cromossomo(s) em que foi integrado. Além disso, em algumas modalidades, é utilizado um único vetor ou plasmídeo, ou dois ou mais vetores ou plasmídeos que, juntos, contêm o DNA total a ser introduzido no genoma da célula hospedeira e/ou um transposon.
[00146] Em algumas modalidades, o vetor de expressão contém um ou mais marcadores selecionáveis, que permitem fácil seleção de células transformadas. Um “marcador selecionável” é um gene, o produto do qual fornece resistência a biocida ou viral, resistência a metais pesados, prototrofia a auxotróficos e semelhantes. Exemplos de marcadores bacterianos selecionáveis incluem, mas não estão limitados aos genes dal de Bacillus subtilis ou Bacillus licheniformis, ou marcadores, que conferem resistência a antibióticos, como resistência à ampicilina, canamicina, cloranfenicol ou tetraciclina. Os marcadores adequados para células hospedeiras de levedura incluem, mas não estão limitados a ADE2, HIS3, LEU2, LYS2, MET3, TRP1 e URA3. Os marcadores selecionáveis para uso em células hospedeiras de fungos filamentosos incluem, mas não estão limitados a, amdS (acetamidase; por exemplo, de A. nidulans ou A. orzyae), argB (ornitina carbamoiltransferases), bar (fosfinotricina acetiltransferase; por exemplo, de S. hygroscopicus), hph (higromicina fosfotransferase), niaD (nitrato redutase), pyrG (orotidina-5'-fosfato descarboxilase; por exemplo, de A. nidulans ou A. orzyae), sC (sulfato adeniltransferase) e trpC (antranilato sintase), bem como equivalentes dos mesmos. Em outro aspecto, a presente invenção fornece uma célula hospedeira compreendendo pelo menos um polinucleotídeo que codifica pelo menos um polipeptídeo de DNA polimerase projetado da presente invenção, o(s) polinucleotídeo(s) sendo operativamente ligado(s) a uma ou mais sequências de controle para a expressão da enzima(s) DNA polimerase projetada(s) na célula hospedeira. As células hospedeiras adequadas para uso na expressão dos polipeptídeos codificados pelos vetores de expressão da presente invenção são bem conhecidas na técnica e incluem, mas não estão limitadas a, células bacterianas, tais como células de E. coli, Vibrio fluvialis, Streptomyces e Salmonella typhimurium; células fúngicas, tais como células de levedura (por exemplo, Saccharomyces cerevisiae ou Pichia pastoris (No. de Acesso ATCC 201178)); células de inseto, tais como células Drosophila S2 e Spodoptera Sf9; células animais, tais como células de melanoma CHO, COS, BHK, 293 e Bowes; e células vegetais. Células hospedeiras exemplares também incluem várias cepas de Escherichia coli (por exemplo, W3110 (ΔfhuA) e BL21).
[00147] Consequentemente, em outro aspecto, a presente invenção fornece métodos de produção de polipeptídeos de DNA polimerase projetados, em que os métodos compreendem cultivar uma célula hospedeira capaz de expressar um polinucleotídeo que codifica o polipeptídeo de DNA polimerase projetado sob condições adequadas para a expressão do polipeptídeo. Em algumas modalidades, os métodos compreendem ainda as etapas de isolar e/ou purificar os polipeptídeos de DNA polimerase, conforme descrito neste documento.
[00148] Os meios de cultura adequados e as condições de crescimento para células hospedeiras são bem conhecidos na técnica. É contemplado que qualquer método adequado para a introdução de polinucleotídeos para a expressão dos polipeptídeos de DNA polimerase em células encontrará uso na presente invenção. As técnicas adequadas incluem, mas não estão limitadas a eletroporação, bombardeio de partículas biolísticas, transfecção mediada por lipossomas, transfecção de cloreto de cálcio e fusão de protoplastos.
[00149] Polipeptídeos de DNA polimerase projetados com as propriedades aqui divulgadas podem ser obtidos submetendo o polinucleotídeo que codifica o polipeptídeo de DNA polimerase de ocorrência natural ou projetado a qualquer mutagênese adequada e/ou métodos de evolução dirigida conhecidos na técnica e/ou conforme descrito neste documento. Uma técnica de evolução dirigida exemplar é a mutagênese e/ou o embaralhamento de DNA (ver, por exemplo, Stemmer, Proc. Natl. Acad. Sci. USA 91: 10747 a 10751
[1994]; WO 95/22625; WO 97/0078; WO 97/35966; WO 98/27230; WO 00/42651; WO 01/75767 e Patente US 6.537.746). Outros procedimentos de evolução direcionada que podem ser usados incluem, entre outros, processo de extensão escalonada (StEP), recombinação in vitro (ver, por exemplo, Zhao et al., Nat. Biotechnol., 16: 258 a 261 [1998]), PCR mutagênico (ver, por exemplo, Caldwell et al., PCR Methods Appl., 3: S136-S140 [1994]) e mutagênese de cassete (ver, por exemplo, Black et al., Proc. Natl. Acad. Sci. USA 93: 3525 a 3529 [1996]).
[00150] Métodos de mutagênese e evolução direcionada podem ser prontamente aplicados a polinucleotídeos que codificam polinucleotídeos de DNA polimerase para gerar bibliotecas variantes que podem ser expressas, rastreadas e testadas. Qualquer mutagênese adequada e métodos de evolução dirigida encontram uso na presente invenção e são bem conhecidos na técnica (ver, por exemplo, as Patentes US Nos. 6.251.674, 6.265.201, 6.277.638,
6.287.861, 6.287.862, 6.291.242, 6.297.053, 6.303.344, 6.309.883, 6.319.713,
6.319.714, 6.323.030, 6.326.204, 6.335.160, 6.335.198, 6.344.356, 6.352.859,
6.355.484, 6.358.740, 6.358.742, 6.365.377, 6.365.408, 6.368.861, 6.372.497,
6.337.186, 6.376.246, 6.379.964, 6.387.702, 6.391.552, 6.391.640, 6.395.547,
6.406.855, 6.406.910, 6.413.745, 6.413.774, 6.420.175, 6.423.542, 6.426.224,
6.436.675, 6.444.468, 6.455.253, 6.479.652, 6.482.647, 6.483.011, 6.484.105,
6.489.146, 6.500.617, 6.500.639, 6.506.602, 6.506.603, 6.518.065, 6.519.065,
6.521.453, 6.528.311, 6.537.746, 6.573.098, 6.576.467, 6.579.678, 6.586.182,
6.602.986, 6.605.430, 6.613.514, 6.653.072, 6.686.515, 6.703.240, 6.686.515,
6.703.240, 6.716.631, 6.825.001, 6.902.922, 6.917.882, 6.946.296, 6.961.664,
6.995.017, 7.024.312, 7.058.515, 7.105.297, 7.148.054, 7.220.566, 7.288.375,
7.384.387, 7.421.347, 7.430.477, 7.462.469, 7.534.564, 7.620.500, 7.620.502,
7.629.170, 7.702.464, 7.747.391, 7.747.393, 7.751.986, 7.776.598, 7.783.428,
7.795.030, 7.853.410, 7.868.138, 7.783.428, 7.873.477, 7.873.499, 7.904.249,
7.957.912, 7.981.614, 8.014.961, 8.029.988, 8.048.674, 8.058.001, 8.076.138,
8.108.150, 8.170.806, 8.224.580, 8.377.681, 8.383.346, 8.457.903, 8.504.498,
8.589.085, 8.762.066, 8.768.871, 9.593.326, 9.665.694, 9.684.771 e todas as contrapartes PCT e não americanas relacionadas; Ling et ai., Anal. Biochem., 254 (2): 157 a 178 [1997]; Dale et al., Meth. Mol. Biol., 57: 369 a 374 [1996]; Smith, Ann. Rev. Genet., 19: 423 a 462 [1985]; Botstein et al., Science, 229: 1193 a 1201 [1985]; Carter, Biochem. J., 237: 1 a 7 [1986]; Kramer et al., Cell, 38: 879 a 887 [1984]; Wells et al., Gene, 34: 315 a 323 [1985]; Minshull et al., Curr. Op. Chem. Biol., 3: 284 a 290 [1999]; Christians et al., Nat. Biotechnol., 17: 259 a 264 [1999]; Crameri et al., Nature, 391: 288 a 291 [1998]; Crameri, et al., Nat. Biotechnol., 15: 436 a 438 [1997]; Zhang et al., Proc. Nat. Acad. Sci. U.S.A., 94: 4504 a 4509 [1997]; Crameri et al., Nat. Biotechnol., 14: 315 a 319
[1996]; Stemmer, Nature, 370: 389 a 391 [1994]; Stemmer, Proc. Nat. Acad. Sci.
USA, 91: 10747 a 10751 [1994]; EP 3 049 973; WO 95/22625; WO 97/0078; WO 97/35966; WO 98/27230; WO 00/42651; WO 01/75767; WO 2009/152336; e WO 2015/048573, todos incorporados por referência neste documento).
[00151] Em algumas modalidades, os clones de enzima obtidos após o tratamento de mutagênese são rastreados submetendo as preparações de enzima a uma temperatura definida (ou outras condições de ensaio) e medindo a quantidade de atividade enzimática remanescente após tratamentos térmicos ou outras condições de ensaio adequadas. Os clones contendo um polinucleotídeo que codifica um polipeptídeo de DNA polimerase são então isolados do gene, sequenciados para identificar as alterações na sequência de nucleotídeos (se houver) e usados para expressar a enzima em uma célula hospedeira. A medição da atividade enzimática a partir das bibliotecas de expressão pode ser realizada usando qualquer método adequado conhecido na técnica (por exemplo, técnicas bioquímicas padrão, como análise de HPLC).
[00152] Para polipeptídeos projetados de sequência conhecida, os polinucleotídeos que codificam a enzima podem ser preparados por métodos de fase sólida padrão, de acordo com métodos sintéticos conhecidos. Em algumas modalidades, fragmentos de até cerca de 100 bases podem ser sintetizados individualmente, em seguida, unidos (por exemplo, por métodos de ligação enzimática ou química ou métodos mediados por polimerase) para formar qualquer sequência contínua desejada. Por exemplo, polinucleotídeos e oligonucleotídeos aqui divulgados podem ser preparados por síntese química usando o método de fosforamidita clássico (ver, por exemplo, Beaucage et al., Tet. Lett., 22: 1859 a 1869 [1981]; e Matthes et al., EMBO J., 3: 801 a 805
[1984]), como é tipicamente praticado em métodos sintéticos automatizados. De acordo com o método da fosforamidita, os oligonucleotídeos são sintetizados (por exemplo, em um sintetizador automático de DNA, purificados, recozidos, ligados e clonados em vetores apropriados).
[00153] Por conseguinte, em algumas modalidades, um método para preparar o polipeptídeo de DNA polimerase projetado pode compreender: (a) sintetizar um polinucleotídeo que codifica um polipeptídeo compreendendo uma sequência de aminoácidos selecionada a partir da sequência de aminoácidos de qualquer variante como descrito neste documento, e (b) expressar o polipeptídeo de DNA polimerase codificado pelo polinucleotídeo. Em algumas modalidades do método, a sequência de aminoácidos codificada pelo polinucleotídeo pode opcionalmente ter uma ou várias (por exemplo, até 3, 4, 5 ou até 10) deleções, inserções e/ou substituições de resíduos de aminoácidos. Em algumas modalidades, a sequência de aminoácidos tem opcionalmente 1 a 2, 1 a 3, 1 a 4, 1 a 5, 1 a 6, 1 a 7, 1 a 8, 1 a 9, 1 a 10, 1 a 15, 1 a 20, 1 a 21, 1 a 22, 1 a 23, 1 a 24, 1 a 25, 1 a 30, 1 a 35, 1 a 40, 1 a 45 ou 1 a 50 deleções, inserções e/ou substituições de resíduos de aminoácidos. Em algumas modalidades, a sequência de aminoácidos tem opcionalmente 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 30, 30, 35, 40, 45 ou 50 deleções, inserções e/ou substituições de resíduos de aminoácidos. Em algumas modalidades, a sequência de aminoácidos tem opcionalmente 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 18, 20, 21, 22, 23, 24 ou 25 deleções, inserções e/ou substituições de resíduos de aminoácidos. Em algumas modalidades, as substituições são substituições conservativas ou não conservativas.
[00154] O polipeptídeo de DNA polimerase expresso pode ser avaliado para qualquer propriedade melhorada desejada ou combinação de propriedades (por exemplo, atividade, seletividade, fidelidade, estabilidade, termoestabilidade, tolerância a vários níveis de pH, sensibilidade à protease, etc.) usando qualquer ensaio adequado conhecido na técnica, incluindo, mas não se limitando aos ensaios e condições descritos neste documento.
[00155] Em algumas modalidades, qualquer um dos polipeptídeos de DNA polimerase projetados expressos em uma célula hospedeira são recuperados das células e/ou do meio de cultura usando qualquer uma ou mais das técnicas bem conhecidas para purificação de proteínas, incluindo, entre outros, tratamento com lisozima, sonicação, filtração, precipitação, ultra- centrifugação e cromatografia.
[00156] As técnicas cromatográficas para o isolamento dos polipeptídeos de DNA polimerase incluem, entre outros, cromatografia de fase reversa, cromatografia líquida de alto desempenho, cromatografia de troca iônica, cromatografia de interação hidrofóbica, cromatografia de exclusão de tamanho, eletroforese em gel e cromatografia de afinidade. As condições para purificar uma determinada enzima dependem, em parte, de fatores como carga líquida, hidrofobicidade, hidrofilicidade, peso molecular, forma molecular, etc., e serão evidentes para as pessoas versadas na técnica. Em algumas modalidades, técnicas de afinidade podem ser usadas para isolar as enzimas de DNA polimerase aprimoradas. Para purificação por cromatografia de afinidade, qualquer anticorpo que se liga especificamente a um polipeptídeo de DNA polimerase de interesse pode encontrar uso. Para a produção de anticorpos, vários animais hospedeiros, incluindo, mas não se limitando a, coelhos, camundongos, ratos, etc., são imunizados por injeção com um polipeptídeo de DNA polimerase ou um fragmento do mesmo. Em algumas modalidades, o polipeptídeo ou fragmento de DNA polimerase é ligado a um carreador adequado, como BSA, por meio de um grupo funcional de cadeia lateral ou ligantes ligados a um grupo funcional de cadeia lateral.
[00157] Em algumas modalidades, o polipeptídeo de DNA polimerase projetado é produzido em uma célula hospedeira por um método que compreende cultivar uma célula hospedeira (por exemplo, uma cepa de E. coli) compreendendo uma sequência de polinucleotídeo que codifica um polipeptídeo de DNA polimerase projetado como descrito neste documento sob condições conducentes à produção do polipeptídeo de DNA polimerase projetado e recuperar o polipeptídeo de DNA polimerase projetado das células e/ou do meio de cultura. Em algumas modalidades, a célula hospedeira produz mais de um polipeptídeo de DNA polimerase projetado.
[00158] Em algumas modalidades, a presente invenção fornece um método para produção de um polipeptídeo de DNA polimerase projetado compreendendo cultivar uma célula bacteriana recombinante compreendendo uma sequência de polinucleotídeos que codifica um polipeptídeo de DNA polimerase projetado com pelo menos 85%, 90%, 95%, 96%, 97%, 98% ou 99% de identidade de sequência para sequências de referência SEQ ID NO: 2, 6, 26, 24, 26, 28 e/ou 824, e uma ou mais diferenças de resíduos de aminoácidos, sob condições de cultura adequadas para permitir a produção do polipeptídeo de DNA polimerase projetado e, opcionalmente, recuperar o polipeptídeo de DNA polimerase projetado da cultura e/ou células bacterianas em cultura. Em algumas modalidades, a célula hospedeira produz mais de um polipeptídeo de DNA polimerase projetado.
[00159] Em algumas modalidades, uma vez que os polipeptídeos de DNA polimerase projetados são recuperados das células hospedeiras recombinantes e/ou do meio de cultura, eles são ainda purificados por qualquer método adequado conhecido na técnica. Em algumas modalidades adicionais, os polipeptídeos de DNA polimerase purificados são combinados com outros ingredientes e compostos para fornecer composições e formulações compreendendo o polipeptídeo de DNA polimerase projetado conforme apropriado para diferentes aplicações e usos (por exemplo, métodos de diagnóstico e composições).
EXPERIMENTAL
[00160] Os seguintes exemplos, incluindo experiências e resultados alcançados, são fornecidos apenas para fins ilustrativos e não devem ser interpretados como limitando a presente invenção.
[00161] Na divulgação experimental abaixo, as seguintes abreviaturas se aplicam: ppm (partes por milhão); M (molar); mM (milimolar), uM e µM (micromolar); nM (nanomolar); mol (moles); gm e g (grama); mg (miligramas);
ug e µg (microgramas); L e l (litro); mL e ml (mililitro); cm (centímetros); mm (milímetros); um e µm (micrômetros); seg. (segundos); min(s) (minuto(s)); h(s) e hr(s) (hora(s)); Ω (ohm); µf (microfarad); U (unidades); MW (peso molecular); rpm (rotações por minuto); rcf (força centrífuga relativa); psi e PSI (libras por polegada quadrada); ºC (graus centígrados); RT e rt (temperatura ambiente); NGS (sequenciamento de última geração); ds (fita dupla); ss (fita simples); CDS (sequência de codificação); DNA (ácido desoxirribonucleico); RNA (ácido ribonucleico); E. coli W3110 (cepa de E. coli de laboratório comumente usada, disponível no Coli Genetic Stock Center [CGSC], New Haven, CT); HTP (alto rendimento); HPLC (cromatografia líquida de alta eficiência); MCYP (microciclo); ddH2O (água bidestilada); PBS (solução salina tamponada com fosfato); BSA (albumina de soro bovino); DTT (ditiotreitol); CAM (cloranfenicol); CAT (cloranfenicol acetiltransferase); IPTG (isopropil-β-D-1- tiogalactopiranosídeo); GFP (proteína fluorescente verde); eGFP (GFP aprimorado); DsRed (proteína fluorescente vermelha isolada de Discosoma sp.); FIOPC (melhorias de dobra em relação ao controle positivo); LB (Luria- Bertani); SPRI (imobilização reversível em fase sólida); Sigma-Aldrich (Sigma- Aldrich, St.
Louis, MO); Perkin Elmer (Perkin Elmer, Inc, Waltham, MA); Harvard Apparatus (Harvard Apparatus, Holliston, MA); Millipore (Millipore, Corp., Billerica MA); Covaris (Covaris, Inc., Woburn, MA); MagBio (MagBio Genomics, Inc., Gaithersburg, MD); Qiagen (Qiagen Inc., Germantown, MD); Illumina (Illumina, Inc., San Diego, CA); BD Biosciences (BD Biosciences, San Jose, CA); Difco (Difco Laboratories, BD Diagnostic Systems, Detroit, MI); Kuhner (Adolf Kuhner, AG, Basel, Suíça); Zymo (Zymo Research, Irvine, CA); Agilent (Agilent Technologies, Inc., Santa Clara, CA); Thermo Scientific (parte da Thermo Fisher Scientific, Waltham, MA); GE Healthcare (GE Healthcare Bio-Sciences, Piscataway, NJ); e Bio-Rad (Bio-Rad Laboratories, Hercules, CA). EXEMPLO 1
Aquisição do gene da DNA polimerase e construção de vetores de expressão
[00162] A polimerase do Grupo B codificada pelo genoma de Thermococcus sp. cepa 2319x1 (Unprot ID A0A0U3SCT0; SEQ ID NOS: 1 e 2, sequências de polinucleotídeo e polipeptídeo, respectivamente), compartilha 73% de identidade de sequência de proteína com a DNA polimerase de Pyrococcus furiosus (SEQ ID NO: 4). Esta polimerase (SEQ ID NO: 2) é aqui dita como “Pol3”. Para maior clareza, esta enzima não é a mesma que a holoenzima DNA polimerase III envolvida na replicação do DNA procariótico. Um gene sintético (SEQ ID NO: 5) que codifica uma versão marcada com 6- histidina da polimerase Pol3 de tipo selvagem (WT) (SEQ ID NO: 6), foi construído e subclonado no vetor de expressão de Escherichia coli pCK100900i (ver, por exemplo, Patente US No. 7.629.157 e Publicação do Pedido de Patente US No. 2016/0244787, ambas incorporadas por referência neste documento). Estas construções de plasmídeo foram transformadas em uma cepa de E. coli derivada de W3110. Técnicas de evolução dirigida geralmente conhecidas por aqueles versados na técnica foram usadas para gerar bibliotecas de variantes de genes a partir desses plasmídeos (ver, por exemplo, Patente US 8.383.346 e WO 2010/144103, ambos os quais são incorporados por referência neste documento). As substituições nas variantes enzimáticas aqui descritas são indicadas com referência à enzima marcada com 6-histidina (isto é, SEQ ID NO: 6) ou suas variantes, conforme indicado. EXEMPLO 2 Expressão de DNA polimerase Pol3 de alto rendimento (HTP) e preparação de lisado
[00163] Neste exemplo, os métodos usados para o crescimento de HTP e preparação de lisado de variantes de polimerase são descritos. Crescimento de alto rendimento da polimerase Pol3 e variantes
[00164] As células de E. coli transformadas foram selecionadas por plaqueamento em placas de ágar LB contendo 1% de glicose e 30 µg/ml de cloranfenicol. Após incubação durante a noite a 37 °C, as colônias foram colocadas nos poços de microplacas NUNC™ de fundo plano raso de 96 poços (Thermo-Scientific) preenchidas com 180 µl/poço de meio LB suplementado com 1% de glicose e 30 µg/ml de cloranfenicol. As culturas foram deixadas crescer durante a noite por 18 a 20 horas em um agitador (200 rpm, 30 °C e 85% de umidade relativa; Kuhner). As amostras de crescimento durante a noite (20 µL) foram transferidas para placas Costar de 96 poços de profundidade cheias com 380 µL de Terrific Broth suplementado com 30 µg/ml de cloranfenicol. As placas foram incubadas por 120 minutos em um agitador (250 rpm, 30 °C e 85% de umidade relativa; Kuhner) até a OD600 atingir entre 0,4 a 0,8. As células foram então induzidas com 40 µL de IPTG 10 mM em água estéril e incubadas durante a noite por 18 a 20 horas em um agitador (250 rpm, 30 °C e 85% de umidade relativa; Kuhner). As células foram sedimentadas (4000 rpm x 20 minutos), os sobrenadantes foram descartados e as células foram congeladas a -80 ˚C antes da análise. Lise de pelotas de HTP
[00165] Os sedimentos celulares foram descongelados e ressuspensos por agitação durante 10 minutos à temperatura ambiente em 300 µl/poço de tampão de lise (NaCl 20 mM, Tris-HCl 50 mM, pH 7,5). Em seguida, 150 µl do sedimento ressuspenso foram transferidos para uma placa de PCR HARDSHELL® (Bio-Rad). A lise celular e o tratamento térmico foram obtidos em uma única etapa de incubação com termociclador a 93⁰C por 60 minutos. Os detritos celulares e o material insolúvel em calor foram sedimentados (4000 rpm x 10 minutos) e os sobrenadantes lisados clarificados foram utilizados para ensaios de PCR conforme descrito nos Exemplos seguintes. EXEMPLO 3 Ensaios de Rendimento de Produto de PCR
[00166] A seleção de variantes de Pol3 foi alcançada medindo o rendimento do produto de PCR em um ensaio de PCR de ponto final com tempos de extensão curtos em relação ao comprimento do modelo usado. Cada variante foi rastreada em uma reação de 30 µL composta por 80 pg/µL de DNA modelo MCYP (SEQ ID NO: 7), dNTPs 0,2 mM, 400 nM cada um dos primers MCYP direto (SEQ ID NO: 10) e reverso (SEQ ID NO: 11), tampão Tris 20 mM, pH 8,8, KCl 10 mM, MgSO4 2 mM, (NH4)2SO4 10 mM, Triton x-100 0,1% v/v e BSA 0,1 g/L. Os lisados foram diluídos em Tris 20 mM, pH 8,8 e 5 µl dos lisados diluídos foram adicionados a uma mistura principal de PCR para uma concentração final de 0,12 a 0,58% (v/v) de lisados, conforme indicado nas condições abaixo de cada tabela nos exemplos seguintes. Os ciclos de PCR incluíram uma desnaturação inicial por 2 minutos a 95 °C seguida por 25 ciclos de: 95 °C por 25 segundos, anelamento a 51 °C a 53 °C por 30 segundos e extensão a 72 °C por 10 segundos a 2,25 minutos. Concentrações de lisado, temperaturas de recozimento e tempos de extensão estão incluídos para cada tabela no exemplo. Na conclusão da reação, 70 µL de ddH2O foi adicionado a cada reação. Os produtos de PCR de 3kb MCYP foram quantificados usando o ensaio DNA 5k em um instrumento de eletroforese capilar LABCHIP® GX (Perkin-Elmer). Para a Tabela 3.2, o rendimento do produto foi classificado qualitativamente após eletroforese em géis de agarose a 1% E-gel 96 (ThermoFisher). Tabela 3.1 Melhorias no rendimento do produto em relação a SEQ ID NO: 6 Melhoria no
SEQ rendimento do ID Diferenças de aminoácido produto (em relação NO: (em relação a SEQ ID NO: 6) a (nt/aa) SEQ ID NO: 6)1 29/30 K391E/L671P +++ 31/32 L283M/D647H/T702A/P743A +++ 33/34 D647H/D659E/V661T/I664L/R668E/T702A +++ 35/36 D647H/D659E/R668E/L671P/L716I/V728A +++ 37/38 K391E/D647H/L671P/V728A +++ 39/40 L671P/T702A ++ 41/42 K391E +++ 43/44 R668E/T702A ++ 45/46 D659E/T702A/P743A ++ 47/48 K391E/D659E/T702A/L716I/T732E/E737R ++ 49/50 K391E/D647H/D659E/V661T/R668E/L671P/I712V/L716I ++
Tabela 3.1 Melhorias no rendimento do produto em relação a SEQ ID NO: 6 Melhoria no
SEQ rendimento do ID Diferenças de aminoácido produto (em relação NO: (em relação a SEQ ID NO: 6) a (nt/aa) SEQ ID NO: 6)1 51/52 D647H/R668E ++ 53/54 K391E/T702A/I712V/L716I/T732E/P743A ++ 55/56 D647H/D659E/I664L/R668E/T702A/I712V/E737R ++ 57/58 L671P/T702A/L716I ++ 59/60 K391E/D647H/D659E/V661T/R668E/L671P/L716I + 61/62 D647H/R668E/L671P/I712V + 63/64 K391E/D647H/D659E/I664L/R668E/T702A/V728A/T732E + 65/66 P743A + 67/68 K391E/D647H/V661T/I664L/L671P/T702A/L716I + 69/70 N282K/R575L + 71/72 K391E/D647H/D659E/I664L/L671P/T702A + 73/74 K391E/V661T/I664L/R668E/L671P/L716I/E737R + 75/76 K21E/K66T/K247G/N282R + 77/78 R372S/K391E/T702A + 79/80 T702A + 81/82 F339L/D647H/V661T/I664L/R668E/T702A/I712V + 83/84 K247G/N282K/R575L + 85/86 K21E + 87/88 V661T/I664L/R668E/L671P/L716I + 1 Os níveis de atividade aumentada foram determinados em relação ao polipeptídeo de referência de SEQ ID NO: 6, e foram definidos como segue: “+” = 1,20 a 1,29 (primeiro 50%); “++” > 1,29 (próximo 30%); e “+++” > 1,36 (superior a 20%). Nesta reação, a % em volume (v/v) de lisado foi 0,45, a temperatura de recozimento foi 53 ⁰C, e o tempo de extensão foi 1,5 minutos.
Tabela 3.2 Melhorias no rendimento do produto em relação a SEQ ID NO: 6 Melhoria no rendimento do SEQ ID Diferenças de aminoácido produto (em relação a SEQ ID NO: (nt/aa) (em relação a SEQ ID NO: 6) NO: 6)1 89/90 K478L ++ 91/92 N282R ++ 93/94 R420A +++ 95/96 M257W +++ 97/98 P514R +++ 99/100 T619C +++ 101/102 V603R +++ 103/104 K391A +++ 105/106 R668C +++ 107/108 L394G ++ 109/110 K391G +++ 111/112 E760G +++ 113/114 A761W +++ 115/116 K738V +++ 117/118 A376V/T619F +++ 119/120 P101S/K646R +++ 121/122 Y48H/E760H +++ 123/124 R420I ++
Tabela 3.2 Melhorias no rendimento do produto em relação a SEQ ID NO: 6 Melhoria no rendimento do SEQ ID Diferenças de aminoácido produto (em relação a SEQ ID NO: (nt/aa) (em relação a SEQ ID NO: 6) NO: 6)1 125/126 R420G ++ 127/128 G691S ++ 129/130 K515F ++ 131/132 T528S ++ 133/134 T619V ++ 135/136 A761R ++ 137/138 R108C/Q679S ++ 139/140 Y18H/E387C ++ 141/142 S360R + 143/144 Y390G ++ 145/146 M257R ++ 147/148 S421Q + 149/150 R420V + 151/152 R420K ++ 153/154 S361G + 155/156 S361W + 157/158 K515R + 159/160 K521T ++ 161/162 K515G + 163/164 T528A ++ 165/166 K666T ++ 167/168 E662C ++ 169/170 A754C + 171/172 E631G + 173/174 K685D + 175/176 S721R + 177/178 P43L/T528S + 179/180 L394M/L399R + 181/182 K24M/K719A + 183/184 S583N/L730A ++ 185/186 S506R + 187/188 R359C + 189/190 L502A + 191/192 S421M + 193/194 Y390Q + 195/196 Y390A + 197/198 S360V + 199/200 S360T + 201/202 S361M + 203/204 T362R + 205/206 K521P + 207/208 L394T + 209/210 D223N + 211/212 L394N + 213/214 R668L + 215/216 E655W + 217/218 K646R + 219/220 T702A + 221/222 S721T + 223/224 E760F + 1 Os níveis de aumento de atividade foram determinados em relação ao polipeptídeo de referência da SEQ ID NO: 6, e foram definidos como segue: “+” = 1,00 a 2,00 (primeiro 50%); “++” > 2,00 (próximo 30%); e “+++” > 4,00 (superior a 20%). Nesta reação, a % em volume de lisado (v/v) foi 0,45, a temperatura de recozimento foi 53 ⁰C, e o tempo de extensão foi 1,5 minutos.
Tabela 3.3 Melhorias no rendimento do produto em relação a SEQ ID NO: 22 Melhoria no SEQ ID rendimento do Diferenças de aminoácido NO: produto (em relação (em relação a SEQ ID NO: 22) (nt/aa) a SEQ ID NO: 22)1 225/226 L502I/Y507F/S695A +++ 227/228 S361G/L394T/R420A/T528S/K646R/K666T/S721T/A743P +++ 229/230 T528S/K646R/E659D/R668L/A743P +++ 231/232 S361G/T528A/K646R/K666T ++ 233/234 L394G/R420K ++ 235/236 S361G/L394T/R420A/T528A/K666T ++ 237/238 T528S/R668L ++ 239/240 K685D/G691S/A743P ++ 241/242 K666T ++ 243/244 S361G/T528S/K646R/A702T/S721T + 245/246 T528S/A743P + 247/248 S361W/L394T/R420A/K646R/K666T/A702T/S721T/A743P + 249/250 S361G/T528A/K666T + 251/252 S361M/K391A/E659D + 253/254 T619C + 255/256 S361G/K646R + 257/258 A174V/S361G/L394T/K666T/R668L/S721T + 259/260 S360T/K391G + 261/262 T528S/K666T + 1 Os níveis de aumento de atividade foram determinados em relação ao polipeptídeo de referência da SEQ ID NO: 22 e foram definidos como segue: “+” = 1,25 a 1.33 (primeiro 50%); “++” > 1,33 (próximo 30%); e “+++” > 1,43 (superior a 20%). Nesta reação, a % em volume de lisado (v/v) foi 0,2, a temperatura de recozimento foi 51 ⁰C, e o tempo de extensão foi 0,167 minutos. Nesta tabela, “*” indica a presença de um códon de terminação prematuro; os últimos 7 aminoácidos da proteína não estão presentes. Também nesta tabela, “-” indica a deleção do aminoácido na posição 786 na proteína.
Tabela 3.4 Melhorias no rendimento do produto em relação a SEQ ID NO: 22 Melhoria no rendimento do SEQ ID NO: Diferenças de aminoácido produto (em relação a SEQ (nt/aa) (em relação a SEQ ID NO: 22) ID NO: 22)1 263/264 R496A +++ 265/266 Q497D +++ 267/268 G468N +++ 269/270 V277A +++ 271/272 K482V ++ 273/274 K490L ++ 275/276 K480M ++ 277/278 H100Y ++ 279/280 K491L ++ 281/282 K482Q ++ 283/284 K479Q + 285/286 K479P + 287/288 E489V + 289/290 G401S + 291/292 I281C + 293/294 T280Y + 295/296 R498C + 297/298 L283V + 299/300 K480D +
Tabela 3.4 Melhorias no rendimento do produto em relação a SEQ ID NO: 22 Melhoria no rendimento do SEQ ID NO: Diferenças de aminoácido produto (em relação a SEQ (nt/aa) (em relação a SEQ ID NO: 22) ID NO: 22)1 301/302 F339M + 1 Os níveis de aumento de atividade foram determinados em relação ao polipeptídeo de referência da SEQ ID NO: 22, e foram definidos como segue: “+” = 1,25 a 1,33 (primeiro 50%); “++” > 1,33 (próximo 30%); and “+++” > 1,42 (superior a 20%). Nesta reação, a % em volume (v/v) de lisado foi 0,2, a temperatura de recozimento foi 51 ⁰C, e o tempo de extensão foi 0,167 minutos.
Tabela 3.5 Melhorias no rendimento do produto em relação a SEQ ID NO: 24 SEQ ID Melhoria no rendimento Diferenças de aminoácido NO: do produto (em relação (em relação a SEQ ID NO: 24) (nt/aa) a SEQ ID NO: 24)1 303/304 M257W/L671P/D685K/A702T +++ 305/306 M257W/D647H +++ 307/308 E659D/S691G +++ 309/310 Q497D/L671P/L716I +++ 311/312 K482Q/Q497D/L671P/D685K +++ 313/314 K478L/K479P/R668E +++ 315/316 D15N/D134N/K482Q/K490L/Q497D/L671P/D685K +++ 317/318 K391E/K478L/K479P/R668E +++ 319/320 K391E/I488R/M492V/R668E +++ 321/322 K478L/I488R/R668E/D685K/A702T +++ 323/324 Q497D/L671P/A702T +++ 325/326 I281C/R668E +++ 327/328 K391E/K478L +++ 329/330 K391G/K479P/E659D/R668E +++ 331/332 K482Q/Q497D/D647H/L716I +++ 333/334 Q497D/V661T/L671P +++ 335/336 K478L +++ 337/338 Q497D/D647H/E659D/L671P +++ 339/340 K391G/K478L/M492V/R668E +++ 341/342 K391G/I488R/Y495N/R668E/D685K/A702T +++ 343/344 K478L/K479P/R668E +++ 345/346 I281C/K391G/Y495N/T561A/E659D/R668E +++ 347/348 I488R/Y495N/D685K ++ 349/350 Q497D/D685K ++ 351/352 Y390Q/Q497D ++ 353/354 R420Q/V661T/L671P ++ 355/356 K478L ++ 357/358 R420Q/K490L/E659D/V661T/L671P ++ 359/360 I281C/K478L/R668E ++ 361/362 Q497D/D685K ++ 363/364 K490L/Q497D/V661T/L671P/D685K/A702T/L716I ++ 365/366 I281C/K391E/K478L/D685K ++ 367/368 R420G ++ 369/370 I281C/K391G/R668E ++ 371/372 A234V/Q497D/D647H ++ 373/374 I281C/I488R/Y495N/R668E ++ 375/376 M492V ++ 377/378 Y390Q/R420Q ++ 379/380 M257W/Y390H/R420Q ++ 381/382 Q497D/D647H ++ 383/384 K479P/E659D/E678G ++ 385/386 R420Q ++ 387/388 I488R/M492V ++ 389/390 Y390Q/K491D/L671P ++
Tabela 3.5 Melhorias no rendimento do produto em relação a SEQ ID NO: 24 SEQ ID Melhoria no rendimento Diferenças de aminoácido NO: do produto (em relação (em relação a SEQ ID NO: 24) (nt/aa) a SEQ ID NO: 24)1 391/392 Q497D/D647H ++ 393/394 L671P ++ 395/396 R420Q/K482Q/E659D/A702T ++ 397/398 Y390Q/R420Q ++ 399/400 K391E/M492V/Y495N/E659D ++ 401/402 G401S/K490L ++ 403/404 K478L/I488R/E659D ++ 405/406 K391E ++ 407/408 M257W/Y390Q/R420Q/D647H ++ 409/410 I281C/K391E/I488R/M492V ++ 411/412 R420Q/K490L + 413/414 I281C/I488R/M492V/Y495N/E659D/R668E + 415/416 M492V/R668E/I712V + 417/418 I281C/I488R/M492V/R668E/A702T + 419/420 K391E + 421/422 G401S/L671P + 423/424 K478L/K515L + 425/426 G401S/K482Q/E659D/L671P/A702T + 427/428 R420Q/D685K + 429/430 R420G + 431/432 Y390Q/G401S/L716I + 433/434 I281C + 435/436 I281C/K391G/K478L + 437/438 K391G/Y495N/E659D + 439/440 K478L/K479P + 441/442 Q497D/A702T + 443/444 K391E/I488R/M492V/E659D/D685K + 445/446 I488R/Y495N + 447/448 Q497D/E659D/S691G/L716I + 449/450 M492V/E659D/D685K + 451/452 I281C/R668E + 453/454 I281C + 455/456 I281C/K391G/E659D/R668E + 457/458 Y495N + 459/460 L671P + 461/462 Y495N/E659D/D685K + 463/464 M257W/G401S/R420Q/K482Q/D647H/L671P/D685K + 465/466 I281C/K391G/K478L + 467/468 K482Q/L671P/A702T/L716I + 469/470 Q497D/V661T + 471/472 I281C/M492V/Y495N/R668E/A702T + 473/474 K391G/M492V/Y495N + 475/476 M492V/Y495N/E659D/R668E + 477/478 K479P/M492V + 479/480 K478L/K479P/A702T + 481/482 K515L + 483/484 I281C/I488R + 485/486 M257W/K482Q/Q497D/D647H + 487/488 I488R + 489/490 K391G/M492V/K515L/E659D/D685K + 491/492 I281C + 493/494 Y390Q/L671P/D685K + 495/496 I281C/K478L/E659D/D685K/A702T + 497/498 R420Q/E659D/A702T +
Tabela 3.5 Melhorias no rendimento do produto em relação a SEQ ID NO: 24 SEQ ID Melhoria no rendimento Diferenças de aminoácido NO: do produto (em relação (em relação a SEQ ID NO: 24) (nt/aa) a SEQ ID NO: 24)1 499/500 G401S/K490L/E659D/L671P + 501/502 I281C/I488R/Y495N + 503/504 I281C + 505/506 I488R/M492V/Y495N + 507/508 M492V/R668E/D685K/I712V + 509/510 Y495N/E659D + 511/512 I281C/M492V/Y495N/R668E + 513/514 G401S + 515/516 E659D + 517/518 M257W/G401S/R420Q + 1 Os níveis de aumento de atividade foram determinados em relação ao polipeptídeo de referência da SEQ ID NO: 24, e foram definidos como segue: “+” = 1,53 a 2,16 (primeiro 50%); “++” > 2,16 (próximo 30%); e “+++” > 2,68 (superior a 20%). Nesta reação, a % em volume (v/v) de lisado foi 0,25, a temperatura de recozimento foi 53 ⁰C, e o tempo de extensão foi 0,75 minutos.
Tabela 3.6 Melhorias no rendimento do produto em relação a SEQ ID NO: 24 Melhoria no rendimento do SEQ ID NO: Diferenças de aminoácido produto (em relação a SEQ ID (nt/aa) (em relação a SEQ ID NO: 24) NO: 24)1 519/520 K634R +++ 521/522 R785G +++ 523/524 A609C/G648Q +++ 525/526 G778Q +++ 527/528 N579S +++ 529/530 G600A +++ 531/532 N579M +++ 533/534 G648R +++ 535/536 N579Q +++ 537/538 E536Q +++ 539/540 Q772G +++ 541/542 E536N +++ 543/544 T777D +++ 545/546 V624S +++ 547/548 R575F +++ 549/550 K540G +++ 551/552 E536T +++ 553/554 N579R +++ 555/556 L779D +++ 557/558 K566G +++ 559/560 I539V +++ 561/562 K236R/V755T +++ 563/564 V550S/R575Q ++ 565/566 R240Y ++ 567/568 I656Y ++ 569/570 R240A ++ 571/572 I415V ++ 573/574 I758V ++ 575/576 R108A ++ 577/578 R108V/K521R ++ 579/580 D55E/N579V ++ 581/582 N579Q/E767Q ++ 583/584 E544G ++ 585/586 D780A ++ 587/588 E767G ++
Tabela 3.6 Melhorias no rendimento do produto em relação a SEQ ID NO: 24 Melhoria no rendimento do SEQ ID NO: Diferenças de aminoácido produto (em relação a SEQ ID (nt/aa) (em relação a SEQ ID NO: 24) NO: 24)1 589/590 E672G ++ 591/592 E568G ++ 593/594 D356N ++ 595/596 L370D ++ 597/598 T299A/K319G ++ 599/600 E568L ++ 601/602 F601I ++ 603/604 I447A ++ 605/606 F601M ++ 607/608 E389Q ++ 609/610 R108G ++ 611/612 D356P ++ 613/614 I447L ++ 615/616 S520C ++ 617/618 V624C ++ 619/620 R108F ++ 621/622 I539S ++ 623/624 F601L/A638L ++ 625/626 D780W ++ 627/628 T299R ++ 629/630 D386P ++ 631/632 K319E + 633/634 I450Y + 635/636 E767T + 637/638 K384R + 639/640 E248P + 641/642 E440H + 643/644 D356V + 645/646 L370T + 647/648 E407L + 649/650 E407R + 651/652 T299E + 653/654 K302F + 655/656 R108Y + 657/658 K247S + 659/660 T299A + 661/662 S358I + 663/664 L779* + 665/666 D55G/N579A + 667/668 A309V + 669/670 P385L + 671/672 N579A + 673/674 R575T + 675/676 R108C + 677/678 R108S + 679/680 K319S + 681/682 R256A + 683/684 W782V + 685/686 E407A + 687/688 I450L + 689/690 I539G + 691/692 I539Q + 693/694 L370S + 695/696 E443V +
Tabela 3.6 Melhorias no rendimento do produto em relação a SEQ ID NO: 24 Melhoria no rendimento do SEQ ID NO: Diferenças de aminoácido produto (em relação a SEQ ID (nt/aa) (em relação a SEQ ID NO: 24) NO: 24)1 697/698 I350V + 699/700 D386V + 701/702 I656A + 703/704 F601V + 705/706 K247I + 707/708 E316G + 709/710 K784- + 711/712 I539H + 713/714 E389R + 715/716 V451G + 717/718 K298E + 719/720 V357S + 721/722 P406V + 723/724 T299Q + 725/726 G648Q + 727/728 D386G + 729/730 E407S + 731/732 E407Y + 733/734 W782S + 735/736 W411H + 737/738 K319H + 739/740 R765D + 741/742 F156L/V451C + 743/744 K566Q + 1 Os níveis de aumento de atividade foram determinados em relação ao polipeptídeo de referência da SEQ ID NO: 24, e foram definidos como segue: “+” = 1,27 a 1,59 (primeiro 50%); “++” > 1,59 (próximo 30%); e “+++” > 2,78 (superior a 20%). Nesta reação, a % em volume (v/v) de lisado foi 0,3, a temperatura de recozimento foi 53 ⁰C, e o tempo de extensão foi 0,75 minutos. Nesta tabela, “*” indica a presença de um códon de terminação prematuro; os últimos 7 aminoácidos da proteína não estão presentes. Também nesta tabela, “-” indica a deleção do aminoácido na posição 784 na proteína.
Tabela 3.7 Melhorias no rendimento do produto em relação a SEQ ID NO: 26 Melhoria no rendimento do SEQ ID NO: Diferenças de aminoácido produto (nt/aa) (em relação a SEQ ID NO: 26) (em relação a SEQ ID NO: 26)1 745/746 V661T +++ 747/748 C281I +++ 749/750 C281I/K302F ++ 751/752 F339A/K491D/M492V/N579A/I712V ++ 753/754 Y390Q/I466A/I539S/I712V + 755/756 C281I/M492S + 757/758 E248P + 759/760 K302F/G401S + 1 Os níveis de aumento de atividade foram determinados em relação ao polipeptídeo de referência da SEQ ID NO: 26, e foram definidos como segue: “+” = 1,43 a 2,58 (primeiro 50%); “++” > 2,58 (próximo 30%); e “+++” > 4,73 (superior a 20%). Nesta reação, a % em volume (v/v) de lisado foi 0,5, a temperatura de recozimento foi 53 ⁰C, e o tempo de extensão foi 2,25 minutos.
Tabela 3.8 Melhorias no rendimento do produto em relação a SEQ ID NO: 28
Melhoria no rendimento
SEQ ID Diferenças de aminoácido do produto NO: (em relação a SEQ ID NO: 28) (em relação a (nt/aa) SEQ ID NO: 28)1 761/762 R420G/K515F +++ 763/764 K391G +++ 765/766 E659D/T702A +++ 767/768 F339A/Y390Q/R420G/S425R/I466A/K490L/K491P/K515L/T702A ++ 769/770 K391G/K482Q ++ 771/772 E248P/K391G/E659D ++ 773/774 K302F/K391G/N579A ++ 775/776 K391G/E659D + 777/778 R240A/N579A/T702A + 779/780 N579A/E659D/T702A + 781/782 E248P/K391G/I539S/N579A/E659D/T702A + 783/784 R240A/N579A + 785/786 N579A + 787/788 N579A/T702A + 1 Os níveis de aumento de atividade foram determinados em relação ao polipeptídeo de referência da SEQ ID NO: 28 e foram definidos como segue: “+” = 1,19 a 1,49 (primeiro 50%); “++” > 1,49 (próximo 30%); e “+++” > 1,63 (superior a 20%). Nesta reação, a % em volume (v/v) de lisado foi 0,3, a temperatura de recozimento foi 53 ⁰C, e o tempo de extensão foi 1 minuto.
EXEMPLO 4 Teste de fidelidade da polimerase de alto rendimento
[00167] Os ensaios de repórter baseados em colônias estão bem estabelecidos como métodos para determinar a fidelidade da polimerase. Nestes ensaios, genes repórter tais como lacZ (ver, Barnes, Gene 112: 29 a 35 [1992]), lacI (Jozwiakowksi e Connolly, Nucl. Acids Res., 37: e102 [2009]) e rpsL (Kitabayashi et al., Biosci. Biotechnol. Biochem., 66: 2194 a 2200 [2002]) são replicados, a frequência de mutações de inativação de genes observadas em clones é proporcional à taxa de erro da DNA polimerase usada na replicação do gene repórter. As taxas de erro são relatadas como a fração de colônias com um fenótipo azul ou branco em placas X-gal (5-Bromo-4-Cloro-3-Indolil BD- Galactopiranosídeo) para lacI ou lacZ, ou pela proporção de colônias que crescem em placas de ágar com ampicilina ou estreptomicina seletivas para rpsL.
Como as taxas de erro de revisão da DNA polimerase são excepcionalmente baixas (por exemplo, ~3 x 10-3), essas técnicas requerem o ensaio de um grande número de colônias, a fim de reduzir o efeito do erro de amostragem nas taxas de erro observadas. Embora simples e acessíveis, em comparação com o sequenciamento Sanger direto de amplicons clonados individuais, esses ensaios têm rendimento limitado.
[00168] Um ensaio de alto rendimento para a fidelidade da DNA polimerase foi desenvolvido para uso na presente invenção, usando um ensaio de citometria de fluxo baseado em células. Um plasmídeo repórter (SEQ ID NO: 18) foi construído que codifica genes para duas proteínas fluorescentes, eGFP (SEQ ID NO: 14) e dsRed de tipo selvagem (SEQ ID NO: 16), sob o controle de um promotor LacI induzível. O plasmídeo também codifica um gene para a cloranfenicol acetiltransferase para seleção. Quando este plasmídeo repórter é transformado em E. coli e induzido com IPTG, ambas as proteínas fluorescentes são expressas na maioria das células da população. Uma população de E. coli que expressa uma única proteína fluorescente (por exemplo, dsRed) exibe uma ampla distribuição log-normal de intensidades de fluorescência devido às variações na indução e ruído na expressão gênica. Assim, as mutações que inativam o dsRed seriam indistinguíveis do ruído na expressão do gene. Embora haja uma ampla gama de expressão gênica entre as células na população duplamente marcada (eGFP/dsRed), as duas proteínas co-variam em sua expressão. Como resultado, as células que expressam fortemente eGFP sem expressar dsRed são extremamente raras, e as células que expressam plasmídeos repórter que têm mutações de inativação em dsRed (mas retêm a expressão de eGFP) são facilmente distinguidas do fundo.
[00169] Uma reação de PCR é realizada com uma polimerase variante e primers fosforilados em 5' para replicar toda a sequência do plasmídeo repórter. Durante a amplificação por PCR, os erros induzidos pela polimerase são introduzidos em uma ou em ambas as proteínas repórter fluorescentes codificadas pelo plasmídeo repórter. Os produtos de replicação são circularizados por meio de ligação, transformados em E. coli e a população mista de transformantes de tipo selvagem e contendo erros é induzida a expressar os repórteres duais. A população induzida de células é então analisada usando citometria de fluxo para determinar a fração de células que perderam a expressão de dsRed devido a erros de PCR, mas ainda expressam GFP. É importante ressaltar que quando um clone isolado do plasmídeo repórter WT é induzido por 48 a 72 horas e analisado por meio de citometria de fluxo, o fundo de células que expressam apenas eGFP é extremamente baixo.
[00170] O construto repórter foi amplificado usando primers 5'- fosforilado direto (SEQ ID NO: 19) e reverso (SEQ ID NO: 20), conforme descrito para as reações de PCR no Exemplo 2. Normalmente, uma concentração final de 0,25% do volume/volume de lisado de HTP foi usado para cada DNA polimerase. Reações de 50 ul foram montadas com a construto repórter de fidelidade (SEQ ID NO: 18) a uma concentração final de 120 pg/ul. Um tempo de extensão de 5 minutos foi usado durante o ciclismo. A fim de remover o DNA de fundo que não tinha sido amplificado pela variante da DNA polimerase via PCR, o modelo de PCR do plasmídeo repórter de comprimento total metilado restante (SEQ ID NO: 18) foi fragmentado pela adição da enzima de restrição DpnI seguida por incubação a 37 ⁰C por 15 minutos.
[00171] Os amplicons de PCR de ssDNA linear foram purificados por purificação em coluna usando ZR-96 DNA Clean and Concentrator (Zymo). Resumidamente, 200 µl do tampão de ligação fornecido foram adicionados às reações de PCR de 50 µl e as amostras foram processadas de acordo com o protocolo do fabricante. As amostras foram eluídas em 10 a 50 µl de água sem nuclease.
[00172] Os amplicons lineares purificados foram então circularizados em uma reação de ligação de 200 µl com concentrações de componentes finais de Tris-HCl 66 mM, pH 8,0, ATP 1 mM, MgCl2 10 mM, DTT 1 mM, ligase de
DNA 50 ng/µl (SEQ ID NO: 38 do Pedido de Patente US No. 15/972.919) durante 1 hora a 20 ⁰C.
[00173] Os amplicons circularizados foram então purificados e concentrados usando o ZR-96 DNA Clean and Concentrator (Zymo). Resumidamente, 600 µl do tampão de ligação fornecido foram adicionados às reações de ligação de 200 µl e as amostras foram processadas usando o protocolo do fabricante. As amostras foram eluídas em 12 µl de água sem nuclease.
[00174] Os amplicons circularizados foram transformados em E. coli usando um aparelho de eletroporação de 96 poços BTX ECM®630/HT-100 (BTX, Harvard Apparatus). Células eletrocompetentes W3110 de E. coli (Agilent) foram diluídas com igual volume de água estéril gelada. Em seguida, 50 µl da suspensão de células diluída foram adicionados a um poço com 3 µl do eluato de amplicon circularizado e misturados. A mistura foi transferida para uma placa de eletroporação descartável de 96 poços não revestida com faixa de 2 mm (BTX). A placa foi resfriada em gelo, então pulsada usando configurações padrão para transformação de E. coli (2500 volts, 200 Ω, 25 µf). As células foram recuperadas dos poços e adicionadas a 500 µl de S.O.C. meio de recuperação (Invitrogen; Ver, Hanahan, J. Mol. Biol., 166: 557 a 580 [1983]), seguido por uma incubação de 1 hora com agitação a 37 ⁰C para permitir a recuperação celular e a expressão do marcador de resistência a antibióticos (cloranfenicol acetiltransferase) presente no plasmídeo repórter. Após 1 hora de incubação, 500 µl de caldo LB contendo cloranfenicol (60 µg/ml) foram adicionados aos poços para selecionar o plasmídeo repórter durante um crescimento noturno a 30 ⁰C ou 37 ⁰C. Também em 1 hora, uma porção das células superadas foi diluída 1:100 em LB, e 5 µl da cultura diluída foram manchados por meio de pipetagem para placas de glicose LB + CAM + 1% (v/v) para verificar a eficiência de transformação. Os pontos com 5 ou mais colônias continham pelo menos 105 transformantes; até 106 transformantes foram observados para alguns poços. Os poços de controle em branco foram inoculados com E. coli expressando a construto repórter eGFP/dsRed (SEQ ID NO: 18) e um controle positivo expressando eGFP sozinho.
[00175] No dia seguinte, as placas foram subcultivadas pela adição de 20 µl de cultura durante a noite em 380 µl de meio LB e cultivadas com agitação a 30 ⁰C. Após 2 horas de incubação, IPTG foi adicionado a cada placa para uma concentração final de 1 mM. As placas foram incubadas com agitação a 30 ⁰C por 40 a 72 horas para permitir a indução e a maturação completa da proteína dsRed de tipo selvagem. As culturas induzidas foram sedimentadas por centrifugação, os sobrenadantes decantados e as células foram ressuspensas em 400 µl de 1x PBS por agitação em vórtex. As células foram ainda diluídas 100 vezes em PBS para análise de citometria de fluxo.
[00176] As células foram analisadas usando um citômetro de fluxo ACCURI™ C6 (BD Biosciences) com um amostrador automático, a menos que indicado de outra forma nas tabelas abaixo. Tanto o eGFP quanto o dsRed foram excitados por meio de laser de 488 nm e a compensação de fluorescência foi usada para remover a sobreposição espectral nos canais de emissão eGFP e dsRed. As portas para células que expressam eGFP única (apenas verde) e células que expressam eGFP/dsRed duplas foram definidas usando as culturas de controle correspondentes em cada placa. Normalmente, a frequência de fundo de eventos apenas verdes foi de 1 x 10-5 em populações de controle que expressam eGFP/dsRed, enquanto as frequências de 1 x 10-3 a 3 x 10-3 eventos apenas verdes foram observadas para populações amplificadas por PCR usando polimerases de alta fidelidade, portanto, a subtração de fundo não foi aplicada. Para minimizar o erro de amostragem, os poços foram analisados para um total de 500 eventos apenas verdes ou um máximo de 106 eventos totais por amostra. A uma taxa de fluxo de 14 µl/min, isso requeria entre 15 a 4 minutos por amostra, dependendo da fidelidade da polimerase. A frequência somente verde para cada variante foi calculada dividindo a fração de eventos somente verde bloqueado pelo número total de eventos de célula fluorescente bloqueada. A taxa de erro relativa para cada variante foi calculada dividindo a frequência somente verde para a variante pela frequência para um controle dos pais. Finalmente, a melhoria na fidelidade da polimerase relatada nas tabelas abaixo é o recíproco da taxa de erro relativa.
Tabela 4.1 Melhorias de fidelidade em relação a SEQ ID NO: 6 SEQ ID NO: Diferenças de aminoácido Melhoria de fidelidade (em (nt/aa) (em relação a SEQ ID NO: 6) relação a SEQ ID NO: 6)1 789/790 R420Q ++ 791/792 K515L ++ 793/794 K521S + 95/96 M257W + 1 Os níveis de aumento de atividade foram determinados em relação ao polipeptídeo de referência da SEQ ID NO: 6, e foram definidos como segue: “+” = 2,01 a 3,1; e “++” = 3,11 a 4.
Tabela 4.2 Melhorias de fidelidade em relação a SEQ ID NO: 22 SEQ ID Diferenças de aminoácido Melhoria de fidelidade NO: (nt/aa) (em relação a SEQ ID NO: 22) (em relação a SEQ ID NO: 22)1 795/796 Y495N +++ 797/798 M492V +++ 265/266 Q497D +++ 289/290 G401S +++ 291/292 I281C ++ 273/274 K490L ++ 799/800 I488R ++ 801/802 A702T/A743P ++ 281/282 K482Q ++ 803/804 K491D ++ 229/230 T528S/K646R/E659D/R668L/A743P + 285/286 K479P + 301/302 F339M + 805/806 K490Y + 269/270 V277A + 275/276 K480M + 807/808 A743P + 271/272 K482V + 809/810 K391N/K491Q + 811/812 G71D/S361M/A702T/S721R/K738V + 1 Os níveis de aumento de atividade foram determinados em relação ao polipeptídeo de referência da SEQ ID NO: 22, e foram definidos como segue: “+” = 1,31 a 1,54 (primeiro 50%); “++” > 1,54 (próximo 30%); e “+++” > 2,14 (superior a 20%).
Tabela 4.3 Melhorias de fidelidade em relação a SEQ ID NO: 24
SEQ ID Diferenças de aminoácido Melhoria de fidelidade (em relação NO: (em relação a SEQ ID NO: 24) a SEQ ID NO: 24)1 (nt/aa) 645/646 L370T +++ 559/560 I539V ++ 669/670 P385L ++
Tabela 4.3 Melhorias de fidelidade em relação a SEQ ID NO: 24
SEQ ID Diferenças de aminoácido Melhoria de fidelidade (em relação NO: (em relação a SEQ ID NO: 24) a SEQ ID NO: 24)1 (nt/aa) 563/564 V550S/R575Q ++ 549/550 K540G + 519/520 K634R + 569/570 R240A + 813/814 K540Q + 543/544 T777D + 1 Os níveis de aumento de atividade foram determinados em relação ao polipeptídeo de referência da SEQ ID NO: 24, e foram definidos como segue: “+” = 1,23 a 1,55 (primeiro 50%); “++” > 1,55 (próximo 30%); e “+++” > 1,86 (superior a 20%).
Tabela 4.4 Melhorias de fidelidade em relação a SEQ ID NO: 28 SEQ ID NO: Diferenças de aminoácido Melhoria de fidelidade (em (nt/aa) (em relação a SEQ ID NO: 28) relação a SEQ ID NO: 28)1 815/816 K515L + 817/818 K515F + 819/820 K482Q + 821/822 Y390Q/K391G + 1 Os níveis de aumento de atividade foram determinados em relação ao polipeptídeo de referência da SEQ ID NO: 28, e foram definidos como segue: “+” = 1,14 a 1,31.
Tabela 4.5 Melhorias de fidelidade em relação a SEQ ID NO: 26 Diferenças de aminoácido (em Melhoria de fidelidade (em relação a SEQ ID NO: (nt/aa) relação a SEQ ID NO: 26) SEQ ID NO: 26)1 823/824 C281I + 825/826 C281I/ N579A + 1 Os níveis de aumento de atividade foram determinados em relação ao peptídeo de referência da SEQ ID NO:26, e foram definidos como segue: “+” = de 1 a 1,3.
EXEMPLO 5 Comparação relativa da fidelidade da polimerase
[00177] As taxas de erro de DNA polimerases variantes foram comparadas àquelas para DNA polimerases disponíveis comercialmente usadas em PCR, usando o ensaio de citometria de fluxo de alto rendimento. Polimerases variantes deste estudo foram usadas para amplificar o plasmídeo repórter de fidelidade e foram ensaiadas como descrito no Exemplo 4. Polimerases disponíveis comercialmente foram usadas para amplificar a construto repórter usando tampões fornecidos com a polimerase (nenhum magnésio foi adicionado) e tempos de ciclagem térmica e as temperaturas foram usadas de acordo com as recomendações dos fabricantes para um modelo de plasmídeo de 4,5 kb. Os tampões usados, a concentração de dNTPs, as temperaturas de recozimento e os tempos de extensão usados para cada polimerase estão listados na Tabela 5.1. As taxas de erro relativas à DNA polimerase PLATINUM SUPERFI™ foram calculadas para cada amostra e, em seguida, as taxas de erro relativas foram calculadas em comparação com a Taq DNA polimerase em tampão KCl. A Figura 1 mostra as taxas de erro relativas dessas polimerases. Tabela 5.1 Condições de amplificação para comparações de fidelidade da polimerase Polimerase Fonte Tampão [dNTPs] Temperatura de Tempo de (µM) recozimento (⁰C) extensão (min)
PLATINUMTM 200 SUPERFITM ThermoFisher fornecido 60 5 Q5® High- 200 Fidelity NEB fornecido 60 5 PHUSIONTM Hi- GC + 2% 200 Fidelity ThermoFisher DMSO 62 5 PHUSIONTM Hi- HF + 2% 200 Fidelity ThermoFisher DMSO 62 5 300 KAPA HiFi Roche/KAPA fornecido 60 5 Taq ThermoFisher tampão KCl 200 55 6 tampão 200 Taq ThermoFisher (NH4)2SO4 55 6 Pfu ultra II 250 Fusion HS Agilent fornecido 55 6 EXEMPLO 6 Triagem simultânea para vários traços de polimerase
[00178] O desempenho robusto da polimerase em uma gama de aplicações foi selecionado com base na amplificação de amplicons de tamanho variável e conteúdo de GC a partir de plasmídeo e modelos de DNA genômico. A triagem para rodadas subsequentes foi realizada em tampão M6a: 30mM Tris pH 8,8, (NH4)2SO4 10 mM, KCl 13,2 mM, 0,4% (v/v) de Triton x-100, 0,5 mg/ml de BSA, MgSO4 1,5 mM, 4,5% v/v de DMSO. As condições de PCR para as condições de desafio aparecem na Tabela 6.1. O rendimento do produto foi determinado conforme descrito no Exemplo 3, por meio de eletroforese capilar, e a fidelidade foi medida conforme descrito no Exemplo 4. Nestes experimentos de desafio de desempenho, diferentes modelos foram usados. A
Tabela 6.1 fornece as condições de reação, primers e modelos para cada um dos desafios. “ARX” se refere ao gene arx humano; “MCYP” se refere a um microciclo “KCL” se refere a um desafio usando o modelo de microciclo, com KCl adicional (4,5 mM); e “BRCA” se refere ao gene BRCA2 humano.
Tabela 6.1 Condições de PCR para ensaios de desafio
ARX MCYP Desafio de BRCA Fidelidade (79% GC) KCl (MCYP) KCl adicional (mM) 0 0 4.5 0 0 No. de ciclos 25 25 25 30 30 Temperatura de 54,8 53 53 58 60 recozimento (C) dNTPs, cada (mM) 0.2 0.2 0.2 0.2 0.2 Temperatura de extensão 72 72 72 72 72 (C) Tempo de extensão (m) 2 2 2 4 5 Primer direto SEQ ID NO: SEQ ID SEQ ID NO: SEQ ID SEQ ID 12 NO: 10 10 NO: 1083 NO: 19 Primer reverso SEQ ID NO: SEQ ID SEQ ID NO: SEQ ID SEQ ID 13 NO: 11 11 NO: 1084 NO: 20 Concentração de primer 400 400 400 400 400 direto (nM, cada) % em volume de lisado 2 2 2 2 2.5 (%(v/v)) Modelo DNA DNA de DNA de DNA SEQ ID genômico plasmídeo plasmídeo genômico NO: 18 humano (SEQ ID (SEQ ID NO: humano (SEQ ID NO: 7) 7) (SEQ ID NO: 8) NO: 1085) Concentração do modelo 3,33 0,08 0,08 3,33 0,1 (ng/uL) Comprimento do 500 bp 2,9kb 2,9kb 4kb 4,5kb amplicon (BP)
Tabela 6.2 Desempenho da polimerase em relação a SEQ ID NO: 824 SEQ ID Diferenças de ARX FIOP MCYP FIOP Desafio KCL BRCA FIOP Fidelity NO: aminoácido (Rendimento) (Rendimento) FIOP (Rendimento) FIOP (nt/aa) (em relação a (Rendimento) SEQ ID NO: 824) 827/828 V80G + ++ ++ + +++ 829/830 L783Q + ++ ++ + +++ 831/832 I447V + + + + +++ 833/834 P567G + + + + +++ 835/836 I569T + + ++ ++ +++ 837/838 V82Q + +++ +++ + +++ 839/840 G564D/K572G ++ ++ +++ + +++ 841/842 Y580A + + + + +++ 843/844 I569T +++ + ++ + +++ 845/846 L783R ++ + ++ ++ ++ 847/848 E387S + + + + ++
Tabela 6.2 Desempenho da polimerase em relação a SEQ ID NO: 824 SEQ ID Diferenças de ARX FIOP MCYP FIOP Desafio KCL BRCA FIOP Fidelity NO: aminoácido (Rendimento) (Rendimento) FIOP (Rendimento) FIOP (nt/aa) (em relação a (Rendimento) SEQ ID NO: 824) 849/850 I19S + + + + ++ 851/852 E61A ++ ++ + ++ 853/854 G297F ++ + + + ++ 855/856 I569G +++ +++ +++ + ++ 857/858 S196R ++ + + +++ ++ 859/860 I118V + ++ ++ ++ 861/862 Y667N + + ++ ++ ++ 863/864 I569L +++ + + + ++ 865/866 M537K + ++ ++ +++ ++ 867/868 I450V +++ + ++ + + 869/870 Y191N + ++ ++ + + 871/872 E313F + +++ ++ + + 873/874 Y229S + + + ++ + 875/876 L189G ++ ++ + +++ + 877/878 F163P + ++ + +++ + 879/880 F163A + ++ + +++ + 881/882 P563L + +++ +++ + + 883/884 Y191A ++ ++ + +++ + 885/886 P563L + + ++ ++ + 887/888 Y453R + ++ ++ +++ + 889/890 E61R +++ + + ++ + 891/892 A761P +++ +++ +++ + + 893/894 F156R +++ ++ ++ + + 895/896 K521V + ++ +++ + 897/898 F601I + ++ +++ ++ + 899/900 V451Y + ++ ++ +++ + 901/902 T619V + ++ +++ ++ + 903/904 T314V + + + +++ n.t. 905/906 G648F ++ + ++ +++ n.t. 907/908 D469H ++ ++ ++ +++ n.t. 909/910 D15W ++ ++ +++ +++ n.t. 911/912 R575H + + ++ +++ n.t. 913/914 L731G + + + +++ n.t. 915/916 Y667T + + + +++ n.t. 917/918 N221G + ++ + +++ n.t. 919/920 G258L + + + +++ n.t. 921/922 F163G + + +++ n.t. 923/924 S325Q + ++ +++ n.t. 925/926 W411T + + +++ n.t. 927/928 F274L ++ + + +++ n.t. 929/930 F274V +++ ++ + +++ n.t. 931/932 F163Q ++ + + +++ n.t.
Tabela 6.2 Desempenho da polimerase em relação a SEQ ID NO: 824 SEQ ID Diferenças de ARX FIOP MCYP FIOP Desafio KCL BRCA FIOP Fidelity NO: aminoácido (Rendimento) (Rendimento) FIOP (Rendimento) FIOP (nt/aa) (em relação a (Rendimento) SEQ ID NO: 824) 933/934 I231H ++ + + +++ n.t. 935/936 R620K ++ ++ +++ ++ n.t. 937/938 K719A ++ + + ++ n.t. 939/940 F163W + + + ++ n.t. 941/942 F274I + + + ++ n.t. 943/944 N221G ++ ++ ++ ++ n.t. 945/946 R377W + ++ ++ ++ n.t. 947/948 F163W + + + ++ n.t. 949/950 K81T + + + ++ n.t. 951/952 F163K +++ + + ++ n.t. 953/954 L502W + ++ ++ ++ n.t. 955/956 Y580I + ++ + ++ n.t. 957/958 I187L ++ +++ +++ ++ n.t. 959/960 E162Q + +++ + ++ n.t. 961/962 V208C ++ + + ++ n.t. 963/964 V181R ++ + + ++ n.t. 965/966 S317T ++ + + ++ n.t. 967/968 I705L ++ + + ++ n.t. 969/970 T619L + + + ++ n.t. 971/972 K482V + + + ++ n.t. 973/974 L52M + + + ++ n.t. 975/976 V603R + ++ ++ ++ n.t. 977/978 S317R ++ + + ++ n.t. 979/980 I13T ++ + + ++ n.t. 981/982 S325Q + +++ ++ n.t. 983/984 E141S ++ +++ +++ ++ n.t. 985/986 E387A + ++ +++ ++ n.t. 987/988 S317P ++ +++ ++ ++ n.t. 989/990 Q772S + +++ ++ + n.t. 991/992 S317P ++ +++ +++ + n.t. 993/994 I758V ++ ++ +++ + n.t. 995/996 R395H ++ +++ + + n.t. 997/998 I111V + +++ + + n.t. 999/1000 L394G +++ + + + n.t. 1001/1002 S520C +++ ++ + + n.t. 1003/1004 M326K + +++ + + n.t. 1005/1006 D15G +++ + ++ + n.t. 1007/1008 G778R ++ +++ + + n.t. 1009/1010 A179G ++ + +++ + n.t. 1011/1012 G778P + ++ +++ + n.t. 1013/1014 S774R ++ +++ + + n.t. 1015/1016 D55K +++ + + + n.t.
Tabela 6.2 Desempenho da polimerase em relação a SEQ ID NO: 824 SEQ ID Diferenças de ARX FIOP MCYP FIOP Desafio KCL BRCA FIOP Fidelity NO: aminoácido (Rendimento) (Rendimento) FIOP (Rendimento) FIOP (nt/aa) (em relação a (Rendimento) SEQ ID NO: 824) 1017/1018 S196A ++ +++ +++ + n.t. 1019/1020 R496S + +++ +++ + n.t. 1021/1022 G564Q ++ ++ ++ + n.t. 1023/1024 L148P ++ +++ ++ + n.t. 1025/1026 V242L ++ +++ ++ + n.t. 1027/1028 K784E ++++ + ++ + n.t. 1029/1030 M537G +++ ++ +++ + n.t. 1031/1032 E141R ++ +++ +++ + n.t. 1033/1034 R575W + ++ +++ + n.t. 1035/1036 L349I + ++ +++ + n.t. 1037/1038 I26S ++++ + + + n.t. 1039/1040 I690L ++++ + ++ + n.t. 1041/1042 K775F ++++ + ++ + n.t. 1043/1044 D55P ++++ + + + n.t. 1045/1046 D469L +++ + ++ + n.t. 1047/1048 Y333R + +++ ++ + n.t. 1049/1050 K95R + +++ + + n.t. 1051/1052 K775G ++ +++ + + n.t. 1053/1054 G258S +++ + n.t. 1055/1056 L394R +++ + ++ + n.t. 1057/1058 R575W ++ + +++ + n.t. 1059/1060 K673M ++++ + + + n.t. 1061/1062 G258R ++++ + ++ + n.t. 1063/1064 D152T +++ + + n.t. 1065/1066 I111A +++ + + n.t.
ARX FIOP: Os níveis de aumento de atividade foram determinados em relação ao polipeptídeo de referência da SEQ ID NO: 824, e foram definidos como segue: “+” 0,00 a 0,82 (primeiro 50%); “++” > 0,82 (próximo 30%); “+++” > 1,55 (superior a 20%); e “++++” > 15 (superior a 7). MCYP FIOP: Os níveis de aumento de atividade foram determinados em relação ao polipeptídeo de referência da SEQ ID NO: 824, e foram definidos como segue: “+” 0,00 a 0,89 (primeiro 50%); “++” > 0,89 (próximo 30%); e “+++” > 1,49 (superior a 20%). Desafio KCL FIOP: Os níveis de aumento de atividade foram determinados em relação ao polipeptídeo de referência da SEQ ID NO: 824, e foram definidos como segue: “+” 0,00 a 0,46 (primeiro 50%); “++” > 0,46 (próximo 30%); e “+++” > 1,86 (superior a 20%). BRCA FIOP: Os níveis de aumento de atividade foram determinados em relação ao polipeptídeo de referência da SEQ ID NO: 824. e foram definidos como segue: “+” 0,00 a 1,42 (primeiro 50%); “++” > 1,42 (próximo 30%); e “+++” > 1,97 (superior a 20%). Fidelidade FIOP: Os níveis de fidelidade de replicação foram determinados em relação ao polipeptídeo de referência da SEQ ID NO: 824, e foram definidos como segue: “+” 0,17 a 0,84 (primeiro 50%); “++” > 0,84 (próximo 30%); e “+++” > 1,42 (superior a 20%)
Tabela 6.3 Desempenho da polimerase em relação a SEQ ID NO: 824 SEQ Diferenças de ARX FIOP MCYP FIOP Desafio KCL BRCA FIOP Fidelidade ID aminoácido (Rendimento) (Rendimento) FIOP (Rendimento) FIOP NO: (em relação a (Rendimento) (nt/a SEQ ID NO: a) 824)
Tabela 6.3 Desempenho da polimerase em relação a SEQ ID NO: 824 SEQ Diferenças de ARX FIOP MCYP FIOP Desafio KCL BRCA FIOP Fidelidade ID aminoácido (Rendimento) (Rendimento) FIOP (Rendimento) FIOP NO: (em relação a (Rendimento) (nt/a SEQ ID NO: a) 824) 106 D15W/I447V/I ++ + ++ + + 7/ 569T/K775F/L 106 783Q/K784E 8 106 T314V/I447V/I + + + + + 9/ 569T/L783Q/K 107 784E 0 107 I569T + + + + +++ 1/ 107 2 107 V82Q/V242L/I + ++ + + +++ 3/ 569L 107 4 107 E313F ++ ++ ++ ++ ++ 5/ 107 6 107 M537K/Y667N + ++ + ++ + 7/ 107 8 107 V82Q/I450V/P +++ +++ +++ +++ + 9/ 567G/I569G 108 0 108 P567G/I569G/ +++ +++ +++ +++ ++ 1/ Y667N 108 2 ARX FIOP: Os níveis de aumento de atividade foram determinados em relação ao polipeptídeo de referência da SEQ ID NO: 824, e foram definidos como segue: “+” 0,91 a 1,11 (primeiro 50%); “++” > 1,11 (próximo 30%); e “+++” > 1,66 (superior a 20%). Rendimento de MCYP: Os níveis de aumento de atividade foram determinados em relação ao polipeptídeo de referência da SEQ ID NO: 824, e foram definidos como segue: “+” 0,32 a 2,41 (primeiro 50%); “++” > 2,41 (próximo 30%); e “+++” > 2,87 (superior a 20%). Desafio KCL: Os níveis de aumento de atividade foram determinados em relação ao polipeptídeo de referência da SEQ ID NO: 824, e foram definidos como segue: “+” 0,03 a 1,27 (primeiro 50%); “++” > 1,27 (próximo 30%); e “+++” > 1,53 (superior a 20%). BRCA FIOP: Os níveis de aumento de atividade foram determinados em relação ao polipeptídeo de referência da SEQ ID NO: 824, e foram definidos como segue: “+” 0,83 a 1,04 (primeiro 50%); “++” > 1,04 (próximo 30%); e “+++” > 1,13 (superior a 20%) Fidelidade FIOP: Os níveis de fidelidade de replicação (1/taxa de erro) foram determinados em relação ao polipeptídeo de referência da SEQ ID NO: 824, e foram definidos como segue: “+” 0,64 a 0,71 (primeiro 50%); “++” > 0,71 (próximo 30%); e “+++” > 0,86 (superior a 20%).
EXEMPLO 7 Uniformidade de cobertura no sequenciamento de próxima geração
[00179] O sequenciamento do genoma completo de genomas microbianos foi usado para testar a uniformidade de cobertura de bibliotecas amplificadas em aplicações de sequenciamento de próxima geração. O DNA genômico de duas bactérias, Staphylococcus epidermidis (ATCC 12228: 2,5 MB, 32,1% GC) e Rhodobacter sphaeroides (ATCC 17025: 3,22 MB, 68,5% GC) foram usados nestes experimentos. O DNA de cada organismo foi cortado para um comprimento médio de fragmento de 400 pb usando sonicação (Covaris). Em seguida, 100 ng de DNA genômico foram usados como entrada no fluxo de trabalho de preparação da Hiper biblioteca KAPA, usando adaptadores KAPA de indexação dupla, de acordo com as instruções do fabricante (Roche; produto KR0961). Fragmentos de biblioteca ligados foram purificados usando esferas MagBio HighPrep™ SPRI, e 10 ng do DNA de entrada foram usados como modelo para amplificação para PCR usando a polimerase purificada de SEQ ID NO: 1082. Oito ciclos de amplificação por PCR foram realizados em tampão M34b (Tris 30mM, pH 8,8, (NH4)2SO4 7mM, KCl 17mM, 0,05% (v/v) de tensoativo TWEEN®-20, 0,5 mg/ml de BSA, MgSO4 2 mM, 8% v/v de DMSO, ZnSO4 15 µM). O material amplificado foi limpo usando esferas HighPrep SPRI, normalizado e agrupado para sequenciamento multiplexado. O agrupamento da biblioteca foi sequenciado em um instrumento MiSeq (Illumina), usando o kit Miseq Reagent v2 (2 x 250pb). As leituras foram demultiplexadas, cortadas de sequências adaptadoras e, em seguida, alinhadas aos seus respectivos genomas usando o software CLC Genomics (Qiagen). CLC Genomics leu o mapeamento e métricas QC foram usadas para determinar a uniformidade de cobertura. As Figuras 2 e 3 fornecem os resultados desses experimentos.
[00180] Embora a invenção tenha sido descrita com referência às modalidades específicas, várias alterações podem ser feitas e equivalentes podem ser substituídos para se adaptar a uma situação, material, composição da matéria, processo, etapa ou etapas do processo particulares, alcançando assim os benefícios da invenção sem se afastar do escopo do que é reivindicado.
[00181] Para todos os efeitos nos Estados Unidos da América, toda e qualquer publicação e documento de patente citados nesta divulgação são incorporados neste documento por referência, como se cada publicação ou documento fosse especificamente e individualmente indicado para ser incorporado neste documento por referência.
A citação de publicações e documentos de patentes não pretende ser uma indicação de que qualquer documento seja pertinente à técnica anterior, nem constitui uma admissão quanto ao seu conteúdo ou data.

Claims (47)

REIVINDICAÇÕES
1. DNA polimerase projetada, caracterizada pelo fato de compreender uma sequência polipeptídica com pelo menos 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% ou mais de identidade de sequência à sequência de referência da SEQ ID NO: 2, 6, 22, 24, 26, 28 e/ou 824, ou um fragmento funcional da mesma, em que a DNA polimerase projetada compreende pelo menos uma mutação em sua sequência polipeptídica e em que as posições de aminoácidos da sequência polipeptídica são numeradas com referência à SEQ ID NO: 2, 6, 22, 24, 26, 28 ou 824.
2. DNA polimerase projetada de acordo com a reivindicação 1, caracterizada pelo fato de que pelo menos uma substituição ou conjunto de substituições é selecionado a partir de 21, 21/66/247/282, 247/282/575, 282/575, 283/647/702/743, 339/647/661/664/668/702/712, 372/391/702, 391, 391/647/659/661/668/671/712/716, 391/647/659/661/668/671/716, 391/647/659/664/668/702/728/732, 391/647/659/664/671/702, 391/647/661/664/671/702/716, 391/647/671/728, 391/659/702/716/732/737, 391/661/664/668/671/716/737, 391/671, 391/702/712/716/732/743, 647/659/661/664/668/702, 647/659/664/668/702/712/737, 647/659/668/671/716/728, 647/668, 647/668/671/712, 659/702/743, 661/664/668/671/716, 668/702, 671/702, 671/702/716, 702 e 743, e/ou quaisquer combinações das mesmas, em que as posições de aminoácidos são numeradas com referência à SEQ ID NO: 6 .
3. DNA polimerase projetada de acordo com a reivindicação 1, caracterizada pelo fato de que pelo menos uma substituição ou conjunto de substituições compreende substituições nas posições de aminoácidos selecionadas a partir de 18/387, 24/719, 43/528, 48/760, 101/646, 108/679, 223, 257, 282, 359, 360, 361, 362, 376/619, 390, 391, 394, 394/399, 420, 421, 478, 502, 506, 514, 515, 521, 528, 583/730, 603, 619, 631, 646, 655, 662, 666, 668, 685, 691, 702, 721, 738, 754, 760 e 761, e/ou qualquer combinação das mesmas,
em que as posições de aminoácidos são numeradas com referência à SEQ ID NO: 6.
4. DNA polimerase projetada de acordo com a reivindicação 1, caracterizada pelo fato de que pelo menos uma substituição ou conjunto de substituições compreende substituições nas posições de aminoácidos selecionadas a partir de 174/361/394/666/668/721, 360/391, 361/391/659, 361/394/420/528/646/666/721/743, 361/394/420/528/666, 361/394/420/646/666/702/721/743, 361/528/646/666, 361/528/646/702/721, 361/528/666, 361/646, 394/420, 502/507/695, 528/646/659/668/743, 528/666, 528/668, 528/743, 619, 666 e 685/691/743, e/ou quaisquer combinações das mesmas, em que as posições de aminoácidos são numeradas com referência à SEQ ID NO: 22.
5. DNA polimerase projetada de acordo com a reivindicação 1, caracterizada pelo fato de que pelo menos uma substituição ou conjunto de substituições compreende substituições nas posições de aminoácidos selecionadas a partir de 100, 277, 280, 281, 283, 339, 401, 468, 479, 480, 482, 489, 490, 491, 496, 497 e 498, e/ou quaisquer combinações das mesmas, em que as posições de aminoácidos são numeradas com referência à SEQ ID NO: 22.
6. DNA polimerase projetada de acordo com a reivindicação 1, caracterizada pelo fato de que pelo menos uma substituição ou conjunto de substituições compreende substituições nas posições de aminoácidos selecionadas a partir de 15/134/482/490/497/671/685, 234/497/647, 257/390/420, 257/390/420/647, 257/401/420, 257/401/420/482/647/671/685, 257/482/497/647, 257/647, 257/671/685/702, 281, 281/391/478, 281/391/478/685, 281/391/488/492, 281/391/495/561/659/668, 281/391/659/668, 281/391/668, 281/478/659/685/702, 281/478/668, 281/488, 281/488/492/495/659/668, 281/488/492/668/702, 281/488/495, 281/488/495/668, 281/492/495/668, 281/492/495/668/702, 281/668, 390/401/716, 390/420, 390/491/671, 390/497, 390/671/685, 391, 391/478,
391/478/479/668, 391/478/492/668, 391/479/659/668, 391/488/492/659/685, 391/488/492/668, 391/488/495/668/685/702, 391/492/495, 391/492/495/659, 391/492/515/659/685, 391/495/659, 401, 401/482/659/671/702, 401/490, 401/490/659/671, 401/671, 420, 420/482/659/702, 420/490, 420/490/659/661/671, 420/659/702, 420/661/671, 420/685, 478, 478/479, 478/479/668, 478/479/702, 478/488/659, 478/488/668/685/702, 478/515, 479/492, 479/659/678, 482/497/647/716, 482/497/671/685, 482/671/702/716, 488, 488/492, 488/492/495, 488/495, 488/495/685, 490/497/661/671/685/702/716, 492, 492/495/659/668, 492/659/685, 492/668/685/712, 492/668/712, 495, 495/659, 495/659/685, 497/647, 497/647/659/671, 497/659/691/716, 497/661, 497/661/671, 497/671/702, 497/671/716, 497/685, 497/702, 515, 659, 659/691 e 671, e/ou quaisquer combinações das mesmas, em que as posições de aminoácidos são numeradas com referência à SEQ ID NO: 24.
7. DNA polimerase projetada de acordo com a reivindicação 1, caracterizada pelo fato de que pelo menos uma substituição ou conjunto de substituições compreende substituições nas posições de aminoácidos selecionadas a partir de 55/579, 108, 108/521, 156/451, 236/755, 240, 247, 248, 256, 298, 299, 299/319, 302, 309, 316, 319, 350, 356, 357, 358, 370, 384, 385, 386, 389, 406, 407, 411, 415, 440, 443, 447, 450, 451, 520, 536, 539, 540, 544, 550/575, 566, 568, 575, 579, 579/767, 600, 601, 601/638, 609/648, 624, 634, 648, 656, 672, 758, 765, 767, 772, 777, 778, 779, 780, 782, 784 e 785, e/ou quaisquer combinações das mesmas, em que as posições de aminoácidos são numeradas com referência à SEQ ID NO: 24.
8. DNA polimerase projetada de acordo com a reivindicação 1, caracterizada pelo fato de que pelo menos uma substituição ou conjunto de substituições compreende substituições nas posições de aminoácidos selecionadas a partir de 248, 281, 281/302, 281/492, 302/401, 339/491/492/579/712, 390/466/539/712 e 661, e/ou quaisquer combinações das mesmas, em que as posições de aminoácidos são numeradas com referência à SEQ ID NO: 26.
9. DNA polimerase projetada de acordo com a reivindicação 1, caracterizada pelo fato de que pelo menos uma substituição ou conjunto de substituições compreende substituições nas posições de aminoácidos selecionadas a partir de 240/579, 240/579/702, 248/391/539/579/659/702, 248/391/659, 302/391/579, 339/390/420/425/466/490/491/515/702, 391, 391/482, 391/659, 420/515, 579, 579/659/702, 579/702 e 659/702 e/ou quaisquer combinações das mesmas, em que as posições de aminoácidos são numeradas com referência à SEQ ID NO: 28.
10. DNA polimerase projetada de acordo com a reivindicação 1, caracterizada pelo fato de que pelo menos uma substituição ou conjunto de substituições compreende substituições nas posições de aminoácidos selecionadas a partir de 257, 420, 515 e 521, e/ou quaisquer combinações das mesmas, em que as posições de aminoácidos são numeradas com referência à SEQ ID NO: 6.
11. DNA polimerase projetada de acordo com a reivindicação 1, caracterizada pelo fato de que pelo menos uma substituição ou conjunto de substituições compreende substituições nas posições de aminoácidos selecionadas a partir de 71/361/702/721/738, 277, 281, 339, 391/491, 401, 479, 480, 482, 488, 490, 491, 492, 495, 497, 528/646/659/668/743, 702/743 e 743, e/ou qualquer combinação das mesmas, em que as posições de aminoácidos são numeradas com referência à SEQ ID NO: 22.
12. DNA polimerase projetada de acordo com a reivindicação 1, caracterizada pelo fato de que pelo menos uma substituição ou conjunto de substituições compreende substituições nas posições de aminoácidos selecionadas a partir de 240, 370, 385, 539, 540, 550/575, 634 e 777, e/ou quaisquer combinações das mesmas, em que as posições de aminoácidos são numeradas com referência à SEQ ID NO: 24.
13. DNA polimerase projetada de acordo com a reivindicação 1, caracterizada pelo fato de que pelo menos uma substituição ou conjunto de substituições compreende substituições nas posições de aminoácidos selecionadas a partir de 390/391, 482 e 515, e/ou quaisquer combinações das mesmas, em que as posições de aminoácidos são numeradas com referência à SEQ ID NO: 28.
14. DNA polimerase projetada de acordo com a reivindicação 1, caracterizada pelo fato de que pelo menos uma substituição ou conjunto de substituições compreende substituições nas posições de aminoácidos selecionadas a partir de 281, 281/579 e/ou quaisquer combinações das mesmas, em que as posições de aminoácidos são numeradas com referência à SEQ ID NO: 28.
15. DNA polimerase projetada de acordo com a reivindicação 1, caracterizada pelo fato de que pelo menos uma substituição ou conjunto de substituições compreende substituições nas posições de aminoácidos selecionadas a partir de 13, 15, 19, 26, 52, 55, 61, 80, 81, 82, 95, 111, 118, 141, 148, 152, 156, 162, 163, 179, 181, 187, 189, 191, 196, 208, 221, 229, 231, 242, 258, 274, 297, 313, 314, 317, 325, 326, 333, 349, 377, 387, 394, 395, 411, 447, 450, 451, 453, 469, 482, 496, 502, 520, 521, 537, 563, 564, 564/572, 567, 569, 575, 580, 601, 603, 619, 620, 648, 667, 673, 690, 705, 719, 731, 758, 761, 772, 774, 775, 778, 783 e 784, e/ou qualquer combinação das mesmas, em que as posições de aminoácidos são numeradas com referência à SEQ ID NO: 824.
16. DNA polimerase projetada de acordo com a reivindicação 1, caracterizada pelo fato de que pelo menos uma substituição ou conjunto de substituições compreende substituições nas posições de aminoácidos selecionadas a partir de 15/447/569/775/783/784, 82/242/569, 82/450/567/569, 313, 314/447/569/783/784, 537/667, 567/569/667 e 569, e/ou quaisquer combinações das mesmas, em que as posições de aminoácidos são numeradas com referência à SEQ ID NO: 824.
17. DNA polimerase projetada de acordo com a reivindicação 1, caracterizada pelo fato de que a dita DNA polimerase projetada compreende uma sequência polipeptídica que é pelo menos 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% ou mais idêntica à sequência de pelo menos uma variante de DNA polimerase projetada apresentada na Tabela 3.1, 3.2, 3.3,
3.4, 3.5, 3.6, 3.7, 3.8, 3.9, 4.1, 4.2, 4.3, 4.4, 4.5, 6.2 e/ou 6.3.
18. DNA polimerase projetada de acordo com qualquer uma das reivindicações 1 a 17, caracterizada pelo fato de que a dita DNA polimerase projetada tem atividade de DNA polimerase.
19. DNA polimerase projetada de acordo com qualquer uma das reivindicações 1 a 18, caracterizada pelo fato de possuir pelo menos uma propriedade melhorada, em comparação com uma DNA polimerase de tipo selvagem selecionada a partir de Pfu DNA polimerase de Pyrococcus furiosus, Grupo B DNA polimerase de Thermococcus sp. cepa 2319x1 e Taq DNA polimerase de Thermus aquaticus.
20. DNA polimerase projetada de acordo com a reivindicação 19, caracterizada pelo fato de possuir pelo menos uma propriedade melhorada, em comparação com a DNA polimerase de tipo selvagem, em que a dita propriedade melhorada é selecionada a partir da produção de produto aumentado em reações em cadeia de polimerase, maior fidelidade e maior termoestabilidade.
21. DNA polimerase projetada de acordo com qualquer uma das reivindicações 1 a 20, caracterizada pelo fato de que a dita DNA polimerase projetada produz um maior rendimento de produto em reações em cadeia de polimerase do que a DNA polimerase de tipo selvagem, em que a dita DNA polimerase de tipo selvagem é selecionada a partir de Pfu DNA polimerase de Pyrococcus furiosus, Grupo B DNA polimerase de Thermococcus sp. cepa 2319x1 e Taq DNA polimerase de Thermus aquaticus.
22. DNA polimerase projetada de acordo com qualquer uma das reivindicações 1 a 21, caracterizada pelo fato de que a dita DNA polimerase projetada exibe maior fidelidade do que a DNA polimerase de tipo selvagem, em que a dita DNA polimerase de tipo selvagem é selecionada a partir de Pfu DNA polimerase de Pyrococcus furiosus, Grupo B DNA polimerase de Thermococcus sp. cepa 2319x1 e Taq DNA polimerase de Thermus aquaticus.
23. DNA polimerase projetada de acordo com qualquer uma das reivindicações 1 a 22, caracterizada pelo fato de que a dita DNA polimerase projetada exibe maior estabilidade térmica do que a DNA polimerase de tipo selvagem, em que a dita DNA polimerase de tipo selvagem é selecionada a partir de Pfu DNA polimerase de Pyrococcus furiosus, Grupo B DNA polimerase de Thermococcus sp. cepa 2319x1 e Taq DNA polimerase de Thermus aquaticus.
24. DNA polimerase projetada de acordo com qualquer uma das reivindicações 1 a 23, caracterizada pelo fato de que a dita polimerase é purificada.
25. Sequência polinucleotídica, caracterizada pelo fato de codificar pelo menos uma DNA polimerase projetada conforme qualquer uma das reivindicações 1 a 24.
26. Sequência polinucleotídica, caracterizada pelo fato de compreender pelo menos 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% ou mais de identidade de sequência com a sequência de referência da SEQ ID NO: 1, 5, 21, 23, 25, 27, 823 e/ou um fragmento funcional da mesma, em que o dito polipeptídeo projetado compreende pelo menos uma substituição em uma ou mais posições de aminoácidos.
27. Sequência polinucleotídica de acordo com a reivindicação 25 ou 26, caracterizada pelo fato de que a dita sequência polinucleotídica codifica pelo menos uma DNA polimerase projetada que compreende uma sequência com pelo menos 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% ou mais de identidade de sequência com a sequência de referência da SEQ ID NO: 2, 6, 22, 24, 26, 28 e/ou 824.
28. Sequência polinucleotídica de acordo com a reivindicação 27, caracterizada pelo fato de que a dita sequência compreende a SEQ ID NO: 1, 5, 21, 23, 25, 27 e/ou 823.
29. Sequência polinucleotídica de acordo com qualquer uma das reivindicações 25 a 28, caracterizada pelo fato de que a dita sequência polinucleotídica está operacionalmente ligada a uma sequência de controle.
30. Sequência polinucleotídica de acordo com qualquer uma das reivindicações 25 a 29, caracterizada pelo fato de que a dita sequência polinucleotídica é otimizada por códons.
31. Vetor de expressão, caracterizado pelo fato de compreender pelo menos uma sequência polinucleotídica conforme qualquer uma das reivindicações 25 a 30.
32. Célula hospedeira, caracterizada pelo fato de ser transformada com pelo menos um vetor de expressão conforme a reivindicação
31.
33. Método para produção de um polipeptídeo de DNA polimerase projetado em uma célula hospedeira, caracterizado pelo fato de compreender cultivar uma célula hospedeira conforme a reivindicação 32, em condições de cultura adequadas, de modo que pelo menos uma DNA polimerase projetada seja produzida.
34. Método de acordo com a reivindicação 33, caracterizado pelo fato de compreender adicionalmente recuperar pelo menos uma DNA polimerase projetada da cultura e/ou das células hospedeiras.
35. Método de acordo com a reivindicação 34, caracterizado pelo fato de compreender adicionalmente a etapa de purificar a dita pelo menos uma DNA polimerase projetada.
36. Composição, caracterizada pelo fato de compreender pelo menos uma DNA polimerase projetada como definida em qualquer uma das reivindicações 1 a 24.
37. Sistema de ensaio de alto rendimento, caracterizado pelo fato de ser para determinar a fidelidade da DNA polimerase.
38. Método para determinação de fidelidade de alto rendimento de uma DNA polimerase, caracterizado pelo fato de compreender i) fornecer: pelo menos uma DNA polimerase como definida em qualquer uma das reivindicações 1 a 24; um plasmídeo repórter compreendendo genes que codificam uma primeira proteína repórter e uma segunda proteína repórter e um marcador de seleção; um sistema de amplificação, incluindo um termociclador e reagentes para conduzir uma reação em cadeia da polimerase; e um sistema de purificação; um sistema de transformação, incluindo células hospedeiras competentes; e um citômetro de fluxo; ii) expor a dita DNA polimerase e o dito plasmídeo repórter ao dito sistema de amplificação, sob condições tais que a construto repórter seja amplificada pela dita DNA polimerase para produzir o produto de PCR; iii) circularizar o dito produto de PCR para fornecer amplicons de PCR circularizados; vi) transformar os ditos amplicons de PCR usando o dito sistema de transformação para produzir células transformadas; vii) analisar as ditas células transformadas usando o dito citômetro de fluxo; e viii) determinar a fidelidade da dita DNA polimerase.
39. Método de acordo com a reivindicação 38, caracterizado pelo fato de compreender adicionalmente a etapa de induzir as ditas células transformadas.
40. Método de acordo com a reivindicação 38 ou 39, caracterizado pelo fato de que a dita primeira proteína repórter compreende proteína fluorescente verde.
41. Método de acordo com qualquer uma das reivindicações 38 a 40, caracterizado pelo fato de que a dita segunda proteína repórter compreende dsRed.
42. Método de acordo com qualquer uma das reivindicações 38 a 41, caracterizado pelo fato de que o dito marcador de seleção compreende cloranfenicol acetiltransferase.
43. Método de acordo com qualquer uma das reivindicações 38 a 42, caracterizado pelo fato de que a dita circularização dos ditos amplicons de PCR é conduzida usando pelo menos uma ligase.
44. Método de acordo com qualquer uma das reivindicações 38 a 43, caracterizado pelo fato de que os ditos amplicons de PCR são purificados.
45. Método de acordo com qualquer uma das reivindicações 38 a 44, caracterizado pelo fato de compreender adicionalmente determinar a melhoria na fidelidade da polimerase em comparação com uma DNA polimerase de referência.
46. Método de acordo com a reivindicação 45, caracterizado pelo fato de que a DNA polimerase de referência é uma polimerase de tipo selvagem.
47. Método de acordo com a reivindicação 46, caracterizado pelo fato de que a dita polimerase de tipo selvagem é selecionada a partir de Pfu DNA polimerase de Pyrococcus furiosus, Grupo B de DNA polimerase de Thermococcus sp. cepa 2319x1 e Taq DNA polimerase de Thermus aquaticus.
Fidelidade em relação à Taq DNA polimerase (tampão KCl) Petição 870210038625, de 28/04/2021, pág. 124/127
Q 5® de al ta fid el id a de 1/3 ta m pã o ta m pã o cobertura normalizada janela de 100 bp cobertura normalizada janela de 100 bp
BR112021008186-0A 2018-10-29 2019-10-28 dna polimerase projetada, sequência polinucleotídica, vetor de expressão, célula hospedeira, composição, sistema de ensaio de alto rendimento, e, métodos para produção de um polipeptídeo de dna polimerase projetado em uma célula hospedeira e para determinação de fidelidade de alto rendimento de uma dna polimerase. BR112021008186A2 (pt)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201862752215P 2018-10-29 2018-10-29
US62/752,215 2018-10-29
PCT/US2019/058310 WO2020092216A1 (en) 2018-10-29 2019-10-28 Engineered dna polymerase variants

Publications (1)

Publication Number Publication Date
BR112021008186A2 true BR112021008186A2 (pt) 2021-08-17

Family

ID=70328324

Family Applications (1)

Application Number Title Priority Date Filing Date
BR112021008186-0A BR112021008186A2 (pt) 2018-10-29 2019-10-28 dna polimerase projetada, sequência polinucleotídica, vetor de expressão, célula hospedeira, composição, sistema de ensaio de alto rendimento, e, métodos para produção de um polipeptídeo de dna polimerase projetado em uma célula hospedeira e para determinação de fidelidade de alto rendimento de uma dna polimerase.

Country Status (12)

Country Link
US (2) US11060075B2 (pt)
EP (1) EP3874033A4 (pt)
JP (2) JP2022512847A (pt)
KR (1) KR20210084590A (pt)
CN (1) CN113316635A (pt)
AU (1) AU2019373208A1 (pt)
BR (1) BR112021008186A2 (pt)
CA (1) CA3116590A1 (pt)
IL (1) IL282456A (pt)
MX (1) MX2021004925A (pt)
SG (1) SG11202103639SA (pt)
WO (1) WO2020092216A1 (pt)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3874033A4 (en) 2018-10-29 2022-08-03 Codexis, Inc. MANIPULATED VARIANTS OF DNA POLYMERASE
WO2024059581A2 (en) * 2022-09-12 2024-03-21 Codexis, Inc. Engineered dna polymerase variants
WO2024059547A2 (en) * 2022-09-14 2024-03-21 Codexis, Inc. Engineered dna polymerase variants
WO2024102861A2 (en) * 2022-11-09 2024-05-16 Codexis, Inc. Dna polymerase variants
WO2024138419A1 (zh) * 2022-12-28 2024-07-04 深圳华大生命科学研究院 具有dna聚合酶活性的多肽及其应用

Family Cites Families (84)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4683195A (en) 1986-01-30 1987-07-28 Cetus Corporation Process for amplifying, detecting, and/or-cloning nucleic acid sequences
US20060257890A1 (en) 1996-05-20 2006-11-16 Maxygen, Inc. Methods and compositions for cellular and metabolic engineering
US6995017B1 (en) 1994-02-17 2006-02-07 Maxygen, Inc. Methods for generating polynucleotides having desired characteristics by iterative selection and recombination
US6309883B1 (en) 1994-02-17 2001-10-30 Maxygen, Inc. Methods and compositions for cellular and metabolic engineering
US5928905A (en) 1995-04-18 1999-07-27 Glaxo Group Limited End-complementary polymerase reaction
US6395547B1 (en) 1994-02-17 2002-05-28 Maxygen, Inc. Methods for generating polynucleotides having desired characteristics by iterative selection and recombination
US6165793A (en) 1996-03-25 2000-12-26 Maxygen, Inc. Methods for generating polynucleotides having desired characteristics by iterative selection and recombination
US6406855B1 (en) 1994-02-17 2002-06-18 Maxygen, Inc. Methods and compositions for polypeptide engineering
US5605793A (en) 1994-02-17 1997-02-25 Affymax Technologies N.V. Methods for in vitro recombination
US6335160B1 (en) 1995-02-17 2002-01-01 Maxygen, Inc. Methods and compositions for polypeptide engineering
US5837458A (en) 1994-02-17 1998-11-17 Maxygen, Inc. Methods and compositions for cellular and metabolic engineering
US6117679A (en) 1994-02-17 2000-09-12 Maxygen, Inc. Methods for generating polynucleotides having desired characteristics by iterative selection and recombination
US5834252A (en) 1995-04-18 1998-11-10 Glaxo Group Limited End-complementary polymerase reaction
DK0765394T3 (da) 1994-06-03 2001-12-10 Novozymes As Oprensede Myceliopthora-laccaser og nukleinsyrer der koder for disse
AU2705895A (en) 1994-06-30 1996-01-25 Novo Nordisk Biotech, Inc. Non-toxic, non-toxigenic, non-pathogenic fusarium expression system and promoters and terminators for use therein
FI104465B (fi) 1995-06-14 2000-02-15 Valio Oy Proteiinihydrolysaatteja allergioiden hoitamiseksi tai estämiseksi, niiden valmistus ja käyttö
US6096548A (en) 1996-03-25 2000-08-01 Maxygen, Inc. Method for directing evolution of a virus
US6506602B1 (en) 1996-03-25 2003-01-14 Maxygen, Inc. Methods for generating polynucleotides having desired characteristics by iterative selection and recombination
CZ293215B6 (cs) 1996-08-06 2004-03-17 F. Hoffmann-La Roche Ag Rekombinantní tepelně stálá DNA polymeráza, způsob její přípravy a prostředek, který ji obsahuje
US6326204B1 (en) 1997-01-17 2001-12-04 Maxygen, Inc. Evolution of whole cells and organisms by recursive sequence recombination
WO1998031837A1 (en) 1997-01-17 1998-07-23 Maxygen, Inc. Evolution of whole cells and organisms by recursive sequence recombination
US7148054B2 (en) 1997-01-17 2006-12-12 Maxygen, Inc. Evolution of whole cells and organisms by recursive sequence recombination
US6265201B1 (en) 1997-01-17 2001-07-24 Regents Of The University Of Minnesota DNA molecules and protein displaying improved triazine compound degrading ability
DE69842183D1 (de) * 1997-08-29 2011-04-28 Life Technologies Corp Hochempfindliche polymerasen und ihre verwendungen
CA2313380C (en) 1997-12-08 2008-12-30 California Institute Of Technology Method for creating polynucleotide and polypeptide sequences
IL138800A0 (en) 1998-04-02 2001-10-31 Tellus Genetic Resources Inc A method of identifying a plant with a lesion in a gene sequence
US6500617B1 (en) 1998-05-01 2002-12-31 Maxygen, Inc. Optimization of pest resistance genes using DNA shuffling
CA2335269A1 (en) 1998-06-17 1999-12-23 Maxygen, Inc. Method for producing polynucleotides with desired properties
US6365408B1 (en) 1998-06-19 2002-04-02 Maxygen, Inc. Methods of evolving a polynucleotides by mutagenesis and recombination
CA2332615A1 (en) 1998-08-12 2000-02-24 Maxygen Inc. Dna shuffling of monooxygenase genes for production of industrial chemicals
EP1119616A2 (en) 1998-10-07 2001-08-01 Maxygen, Inc. Dna shuffling to produce nucleic acids for mycotoxin detoxification
WO2000028018A1 (en) 1998-11-10 2000-05-18 Maxygen, Inc. Modified adp-glucose pyrophosphorylase for improvement and optimization of plant phenotypes
JP4221100B2 (ja) 1999-01-13 2009-02-12 エルピーダメモリ株式会社 半導体装置
US6376246B1 (en) 1999-02-05 2002-04-23 Maxygen, Inc. Oligonucleotide mediated nucleic acid recombination
US6368861B1 (en) 1999-01-19 2002-04-09 Maxygen, Inc. Oligonucleotide mediated nucleic acid recombination
US6917882B2 (en) 1999-01-19 2005-07-12 Maxygen, Inc. Methods for making character strings, polynucleotides and polypeptides having desired characteristics
US6436675B1 (en) 1999-09-28 2002-08-20 Maxygen, Inc. Use of codon-varied oligonucleotide synthesis for synthetic shuffling
IL138002A0 (en) 1999-01-19 2001-10-31 Maxygen Inc Methods for making character strings, polynucleotides and polypeptides having desired characteristics
US8457903B1 (en) 1999-01-19 2013-06-04 Codexis Mayflower Holdings, Llc Method and/or apparatus for determining codons
US7702464B1 (en) 2001-08-21 2010-04-20 Maxygen, Inc. Method and apparatus for codon determining
US20070065838A1 (en) 1999-01-19 2007-03-22 Maxygen, Inc. Oligonucleotide mediated nucleic acid recombination
US7873477B1 (en) 2001-08-21 2011-01-18 Codexis Mayflower Holdings, Llc Method and system using systematically varied data libraries
US6961664B2 (en) 1999-01-19 2005-11-01 Maxygen Methods of populating data structures for use in evolutionary simulations
US7024312B1 (en) 1999-01-19 2006-04-04 Maxygen, Inc. Methods for making character strings, polynucleotides and polypeptides having desired characteristics
CA2361384A1 (en) 1999-02-11 2000-08-17 Sun Ai Raillard High throughput mass spectrometry
US6531316B1 (en) 1999-03-05 2003-03-11 Maxyag, Inc. Encryption of traits using split gene sequences and engineered genetic elements
US6365377B1 (en) 1999-03-05 2002-04-02 Maxygen, Inc. Recombination of insertion modified nucleic acids
US6703240B1 (en) 1999-04-13 2004-03-09 Maxygar, Inc. Modified starch metabolism enzymes and encoding genes for improvement and optimization of plant phenotypes
US7430477B2 (en) 1999-10-12 2008-09-30 Maxygen, Inc. Methods of populating data structures for use in evolutionary simulations
US6519065B1 (en) 1999-11-05 2003-02-11 Jds Fitel Inc. Chromatic dispersion compensation device
US6686515B1 (en) 1999-11-23 2004-02-03 Maxygen, Inc. Homologous recombination in plants
IL150291A0 (en) 2000-01-11 2002-12-01 Maxygen Inc Integrated systems and methods for diversity generation and screening
US6329178B1 (en) * 2000-01-14 2001-12-11 University Of Washington DNA polymerase mutant having one or more mutations in the active site
JP2001269188A (ja) * 2000-03-11 2001-10-02 Roche Diagnostics Gmbh Pcrにおける性能が向上したb型dnaポリメラーゼ変異体
AU4964101A (en) 2000-03-30 2001-10-15 Maxygen Inc In silico cross-over site selection
WO2001075087A2 (en) 2000-04-03 2001-10-11 Maxygen, Inc. Subtilisin variants
CN1345937A (zh) * 2000-09-29 2002-04-24 上海博德基因开发有限公司 一种新的多肽——人rna聚合酶ⅲ亚单位12.76和编码这种多肽的多核苷酸
US7932070B2 (en) * 2001-12-21 2011-04-26 Agilent Technologies, Inc. High fidelity DNA polymerase compositions and uses therefor
US20050084907A1 (en) 2002-03-01 2005-04-21 Maxygen, Inc. Methods, systems, and software for identifying functional biomolecules
EP2390803B1 (en) 2002-03-01 2013-11-20 Codexis Mayflower Holdings, LLC Methods, systems, and software for identifying functional biomolecules
US7747391B2 (en) 2002-03-01 2010-06-29 Maxygen, Inc. Methods, systems, and software for identifying functional biomolecules
WO2003078583A2 (en) 2002-03-09 2003-09-25 Maxygen, Inc. Optimization of crossover points for directed evolution
JP2007502124A (ja) 2003-08-11 2007-02-08 コデクシス, インコーポレイテッド 改良ケトレダクターゼポリペプチドおよび関連ポリヌクレオチド
EP1963536B1 (en) * 2005-12-22 2016-05-04 Pacific Biosciences of California, Inc. Polymerases for nucleotide analogue incorporation
EP2250594B1 (en) 2008-02-12 2017-04-19 Codexis, Inc. Method of generating an optimized, diverse population of variants
US8504498B2 (en) 2008-02-12 2013-08-06 Codexis, Inc. Method of generating an optimized, diverse population of variants
ES2575005T3 (es) 2008-06-13 2016-06-23 Codexis, Inc. Método de síntesis de variantes de polinucleótidos
US20090312196A1 (en) 2008-06-13 2009-12-17 Codexis, Inc. Method of synthesizing polynucleotide variants
US8383346B2 (en) 2008-06-13 2013-02-26 Codexis, Inc. Combined automated parallel synthesis of polynucleotide variants
JP5258512B2 (ja) * 2008-10-30 2013-08-07 株式会社日立製作所 エキソヌクレアーゼ活性増強dnaポリメラーゼ変異体
CA2742594C (en) 2008-11-03 2020-03-24 William Bourn Modified type a dna polymerases
US20110082055A1 (en) * 2009-09-18 2011-04-07 Codexis, Inc. Reduced codon mutagenesis
DK2726651T3 (en) 2011-06-28 2019-01-28 Codexis Inc PROTEIN INVARIANT GENERATION BY REGION SHUFFLING
US20150133698A1 (en) 2012-04-20 2015-05-14 Codexis, Inc. Production of fatty alcohols from engineered microorganisms
NZ710299A (en) 2013-01-31 2020-01-31 Codexis Inc Methods, systems, and software for identifying bio-molecules with interacting components
HUE055899T2 (hu) * 2013-04-18 2022-01-28 Codexis Inc Átszerkesztett fenilalanin-ammónia-liáz polipeptidek
ES2857711T3 (es) 2013-09-27 2021-09-29 Codexis Inc Filtración automática de variantes de enzimas
NZ717647A (en) 2013-09-27 2020-06-26 Codexis Inc Structure based predictive modeling
CA2930595C (en) * 2013-11-14 2023-09-19 Integrated Dna Technologies, Inc. Dna polymerase mutants having enhanced template discrimination activity
EP2986719B1 (en) * 2013-12-06 2020-07-29 Bio-Rad Laboratories, Inc. Fusion polymerases
CN106701896A (zh) * 2015-08-28 2017-05-24 王金 一种检测dna聚合酶保真度的方法
EP3192806A1 (en) 2016-01-13 2017-07-19 Affiris AG Alpha chain of the high-affinity ige receptor (fceria)
LT3402880T (lt) 2016-01-15 2024-03-12 Thermo Fisher Scientific Baltics Uab Termofiliniai dnr polimerazės mutantai
EP3874033A4 (en) 2018-10-29 2022-08-03 Codexis, Inc. MANIPULATED VARIANTS OF DNA POLYMERASE

Also Published As

Publication number Publication date
JP2024057009A (ja) 2024-04-23
CA3116590A1 (en) 2020-05-07
MX2021004925A (es) 2021-06-15
CN113316635A (zh) 2021-08-27
US20200131485A1 (en) 2020-04-30
JP2022512847A (ja) 2022-02-07
US11060075B2 (en) 2021-07-13
US20210309977A1 (en) 2021-10-07
AU2019373208A1 (en) 2021-05-13
EP3874033A4 (en) 2022-08-03
KR20210084590A (ko) 2021-07-07
WO2020092216A1 (en) 2020-05-07
EP3874033A1 (en) 2021-09-08
US12018295B2 (en) 2024-06-25
SG11202103639SA (en) 2021-05-28
IL282456A (en) 2021-06-30

Similar Documents

Publication Publication Date Title
BR112021008186A2 (pt) dna polimerase projetada, sequência polinucleotídica, vetor de expressão, célula hospedeira, composição, sistema de ensaio de alto rendimento, e, métodos para produção de um polipeptídeo de dna polimerase projetado em uma célula hospedeira e para determinação de fidelidade de alto rendimento de uma dna polimerase.
JP7401902B2 (ja) 遺伝子操作されたリガーゼバリアント
US10883091B2 (en) DNA polymerase variant and application thereof
AU8416198A (en) Altered thermostable DNA polymerases for sequencing
JP2003505071A (ja) 核酸検出のための耐熱性ヌクレオシド二リン酸キナーゼ
EP3645712A1 (en) T7 rna polymerase variants
JP2020530266A (ja) T7 rnaポリメラーゼバリアント
KR20210031699A (ko) Rna로부터의 핵산 증폭반응에 적합한 dna 폴리머라아제 돌연변이체
CN114561374A (zh) 一种新型嗜热核酸内切酶突变体及其制备方法和应用
RU2820531C2 (ru) Сконструированные варианты днк-полимеразы
JP6416885B2 (ja) 高温で活性なhivタイプ1グループo逆転写酵素
WO2024102861A2 (en) Dna polymerase variants
US20230193224A1 (en) Engineered dna polymerase variants
WO2024059581A2 (en) Engineered dna polymerase variants
WO2023064935A1 (en) Recombinant reverse transcriptase variants
WO2024059547A2 (en) Engineered dna polymerase variants
WO2024138074A1 (en) Engineered rnase inhibitor variants