BR112021010925A2 - Anelossomos para entrega de modalidades terapêuticas de substituição de proteína - Google Patents

Anelossomos para entrega de modalidades terapêuticas de substituição de proteína Download PDF

Info

Publication number
BR112021010925A2
BR112021010925A2 BR112021010925-0A BR112021010925A BR112021010925A2 BR 112021010925 A2 BR112021010925 A2 BR 112021010925A2 BR 112021010925 A BR112021010925 A BR 112021010925A BR 112021010925 A2 BR112021010925 A2 BR 112021010925A2
Authority
BR
Brazil
Prior art keywords
nucleic acid
sequence
genetic element
orf1
acid sequence
Prior art date
Application number
BR112021010925-0A
Other languages
English (en)
Inventor
Erica Gabrielle Weinstein
Avak Kahvejian
Simon Delagrave
Nathan Lawrence Yozwiak
Kevin James Lebo
Fernando Martin Diaz
Dhananjay Maniklal Nawandar
Ryan D. Tedstone
Jared David Pitts
Original Assignee
Flagship Pioneering Innovations V, Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Flagship Pioneering Innovations V, Inc filed Critical Flagship Pioneering Innovations V, Inc
Publication of BR112021010925A2 publication Critical patent/BR112021010925A2/pt

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/87Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
    • C12N15/90Stable introduction of foreign DNA into chromosome
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K48/00Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/85Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
    • C12N15/86Viral vectors
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2750/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssDNA viruses
    • C12N2750/00011Details
    • C12N2750/00022New viral proteins or individual genes, new structural or functional aspects of known viral proteins or genes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2750/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssDNA viruses
    • C12N2750/00011Details
    • C12N2750/00041Use of virus, viral particle or viral elements as a vector
    • C12N2750/00043Use of virus, viral particle or viral elements as a vector viral genome or elements thereof as genetic vector

Landscapes

  • Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Chemical & Material Sciences (AREA)
  • Biotechnology (AREA)
  • Wood Science & Technology (AREA)
  • Biomedical Technology (AREA)
  • Organic Chemistry (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Zoology (AREA)
  • Molecular Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Biochemistry (AREA)
  • Microbiology (AREA)
  • Physics & Mathematics (AREA)
  • Plant Pathology (AREA)
  • Biophysics (AREA)
  • Virology (AREA)
  • Mycology (AREA)
  • Animal Behavior & Ethology (AREA)
  • Epidemiology (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Public Health (AREA)
  • Veterinary Medicine (AREA)
  • Medicinal Chemistry (AREA)
  • Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
  • Medicines Containing Material From Animals Or Micro-Organisms (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Medicinal Preparation (AREA)

Abstract

anelossomos para entrega de modalidades terapêuticas de substituição de proteína. a presente invenção refere-se geralmente a anelossomos e suas composições e usos.

Description

Relatório Descritivo da Patente de Invenção para “ANELOSSOMOS PARA ENTREGA DE MODALIDADES TERAPÊUTICAS DE SUBSTITUIÇÃO DE PROTEÍNA”.
REFERÊNCIA CRUZADA COM PEDIDOS RELACIONADOS
[001] Este pedido reivindica o benefício dos Pedidos Provisórios dos E.U.A. N.os 62/778,861, depositado a 12 de dezembro de 2018, e 62/778,866, depositado a 12 de dezembro de 2018. Os conteúdos dos pedidos acima mencionados são deste modo incorporados por referência em sua totalidade.
LISTAGEM DE SEQUÊNCIAS
[002] O presente pedido contém uma Listagem de Sequências que foi submetida eletronicamente no formato ASCII e é deste modo incorporada por referência em sua totalidade. A referida cópia ASCII, criada a 9 de dezembro de 2019, é chamada V2057-7003WO_SL.txt e tem 825.844 bytes em tamanho.
ANTECEDENTES
[003] Existe uma necessidade contínua de desenvolver vetores adequados para entregar material genético terapêutico aos pacientes.
SUMÁRIO
[004] A presente descrição proporciona um anelossomo, por exemplo, um anelossomo sintético, que pode ser usado como um veículo de entrega, por exemplo, para entrega de material genético, para entrega de um efetor, por exemplo, uma carga útil, ou para entrega de um agente terapêutico ou um efetor terapêutico (por exemplo, uma substituição de proteína) a uma célula eucariótica (por exemplo, uma célula humana ou um tecido humano). As terapêuticas de substituição de proteína exemplares que podem ser administradas incluem, por exemplo, enzimas ou proteínas estruturais. Os anelossomos podem ser usados para administração de uma proteína a um indivíduo com doença causada por uma mutação, por exemplo, administração de uma versão funcional da proteína mutante.
[005] Em algumas modalidades, um anelossomo (por exemplo, partícula, por exemplo, uma partícula viral, por exemplo, uma partícula de Anellovirus) compreende um elemento genético (por exemplo, um elemento genético compreendendo uma sequência de DNA terapêutica) encapsulado em um exterior proteináceo (por exemplo, um exterior proteináceo compreendendo uma proteína de capsídeo de Anellovirus, por exemplo, uma proteína ORF1 de Anellovirus ou um polipeptídeo codificado por um ácido nucleico de ORF1 de Anellovirus, por exemplo, como descrito no presente documento), que é capaz de introduzir o elemento genético em uma célula (por exemplo, uma célula de mamífero, por exemplo, uma célula humana). Em algumas modalidades, o anelossomo é uma partícula compreendendo um exterior proteináceo compreendendo um polipeptídeo codificado por um ácido nucleico de ORF1 de Anellovirus (por exemplo, um ácido nucleico de ORF1 de Alphatorquevirus, Betatorquevirus ou Gammatorquevirus, por exemplo, uma ORF1 de clado 1 de Alphatorquevirus, clado 2 de Alphatorquevirus, clado 3 de Alphatorquevirus, clado 4 de Alphatorquevirus, clado 5 de Alphatorquevirus, clado 6 de Alphatorquevirus ou clado 7de Alphatorquevirus, por exemplo, como descrito no presente documento). O elemento genético de um anelossomo da presente descrição é tipicamente uma molécula de DNA circular e/ou de fita simples (por exemplo, circular e de fita simples) e, geralmente, inclui uma sequência de ligação à proteína que se liga ao exterior proteináceo a encerrando, ou um polipeptídeo anexado a à mesma, o que pode facilitar o encerramento do elemento genético dentro do exterior proteínaceo e/ou enriquecimento do elemento genético, em relação a outros ácidos nucleicos, dentro do exterior proteináceo. Em alguns casos, o elemento genético é circular ou linear. Em alguns casos, o elemento genético compreende ou codifica um efetor (por exemplo, um efetor de ácido nucleico, tal como um RNA não codificante, ou um efetor de polipeptídeo, por exemplo, uma proteína), por exemplo, que pode ser expresso na célula. Em alguns casos, o efetor é um efetor endógeno ou um efetor exógeno, por exemplo, a um Anellovirus de tipo selvagem ou uma célula alvo. Em algumas modalidades, o efetor é exógeno a um Anellovirus de tipo selvagem ou uma célula alvo. Em algumas modalidades, o anelossomo pode entregar um efetor em uma célula por contato da célula e introdução de um elemento genético codificando o efetor na célula, tal que o efeito seja preparado ou expresso pela célula. Em certos casos, o efetor é um efetor endógeno (por exemplo, endógeno à célula alvo mas, por exemplo, proporcionado em quantidades aumentadas pelo anelossomo). Em outros casos, o efetor é um efetor exógeno. O efetor pode, em alguns casos, modular uma função da célula ou modular uma atividade ou nível de uma molécula alvo na célula. Por exemplo, o efetor pode diminuir os níveis de uma proteína alvo na célula (por exemplo, como descrito nos Exemplos 3 e 4). Em um outro exemplo, o anelossomo pode entregar e expressar um efetor, por exemplo, uma proteína exógena, in vivo (por exemplo, como descrito nos Exemplos 19 e 28). Os anelossomos podem ser usados, por exemplo, para entregar material genético a uma célula, tecido ou indivíduo alvo; para entregar um efetor a uma célula alvo, tecido ou indivíduo; ou para tratamento de doenças e disfunções, por exemplo, por entrega de um efetor que pode operar como um agente terapêutico a uma célula, tecido ou indivíduo desejado.
[006] A invenção proporciona ainda anelossomos sintéticos. Um anelossomo sintético tem pelo menos uma diferença estrutural em comparação com um vírus de tipo selvagem (por exemplo, um Anellovirus de tipo selvagem, por exemplo, como descrito no presente documento), por exemplo, uma deleção, inserção, substituição,
modificação (por exemplo, modificação enzimática), em relação ao vírus de tipo selvagem. Geralmente, os anelossomos sintéticos incluem um elemento genético exógeno encerrado dentro de um exterior proteináceo, que pode ser usado para entregar o elemento genético ou um efetor (por exemplo, um efetor exógeno ou um efetor endógeno) codificado aí (por exemplo, um efetor de polipeptídeo ou de ácido nucleico), em células eucarióticas (por exemplo, humanas). Em modalidades, o anelossomo não causa uma resposta imunitária ou inflamatória detectável e/ou indesejada, por exemplo, não causa um aumento maior do que 1%, 5%, 10%, 15% em um marcador(es) molecular(es) de inflamação, por exemplo, TNF-alfa, IL-6, IL-12, IFN, bem como resposta de células B, por exemplo, anticorpos reativos ou neutralizantes, por exemplo, o anelossomo pode ser substancialmente não imunogênico para a célula, tecido ou indivíduo alvo.
[007] Em um aspecto, a invenção apresenta um anelossomo compreendendo: (a) um exterior proteináceo; (b) um elemento genético compreendendo um elemento promotor e uma sequência de ácidos nucleicos (por exemplo, uma sequência de DNA) codificando um efetor exógeno e uma sequência de ligação à proteína (por exemplo, uma sequência de ligação à proteína exterior); em que o efetor exógeno compreende um polipeptídeo que, quando mutado, provoca uma doença humana, ou uma variante funcional do referido polipeptídeo; em que o elemento genético está encerrado dentro do exterior proteináceo; e em que o anelossomo é configurado para entregar o elemento genético em uma célula eucariótica. Opcionalmente, o elemento genético compreende pelo menos uma diferença (por exemplo, uma mutação, modificação química ou alteração epigenética) em relação a uma sequência do genoma de Anellovirus de tipo selvagem (por exemplo, como descrito no presente documento), por exemplo, uma inserção, substituição, modificação (por exemplo, modificação enzimática) e/ou deleção, por exemplo, uma deleção de um domínio ou sua porção (por exemplo, um ou mais de uma caixa TATA, local cap, local de início transcricional, 5´ UTR, grelha de leitura aberta (ORF), sinal de poli(A) ou região rica em GC).
[008] Em um aspecto, a invenção apresenta um anelossomo compreendendo: (i) um elemento genético compreendendo um elemento promotor e uma sequência codificando um efetor (por exemplo, um efetor endógeno ou exógeno) e uma sequência de ligação à proteína (por exemplo, uma sequência de ligação à proteína exterior, por exemplo, um sinal de empacotamento); e (ii) um exterior proteináceo; em que o elemento genético está encerrado dentro do exterior proteináceo; e em que o anelossomo é capaz de entregar o elemento genético em uma célula eucariótica (por exemplo, mamífera, por exemplo, humana). Em algumas modalidades, o elemento genético é um DNA de fita simples e/ou circular. Alternativamente ou em combinação, o elemento genético tem uma, duas, três ou todas as seguintes propriedades: é circular, tem fita simples, se integra no genoma de uma célula a uma frequência de menos do que cerca de 0,0001%, 0,001%, 0,005%, 0,01%, 0,05%, 0,1%, 0,5%, 1%, 1,5%, ou 2% do elemento genético que entra na célula e/ou se integra no genoma de uma célula alvo em menos do que 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 15, 20, 25, ou 30 cópias por genoma. Em algumas modalidades, a frequência de integração é determinada como descrito em Wang et al. (2004, Gene Therapy 11: 711-721, incorporado no presente documento por referência em sua totalidade). Em algumas modalidades, o elemento genético está encerrado dentro do exterior proteináceo. Em algumas modalidades, o anelossomo é capaz de entregar o elemento genético em uma célula eucariótica. Em algumas modalidades, o elemento genético compreende uma sequência de ácidos nucleicos (por exemplo, uma sequência de ácidos nucleicos de entre 300-4000 nucleotídeos, por exemplo, entre 300-3500 nucleotídeos, entre 300-3000 nucleotídeos, entre 300-2500 nucleotídeos, entre 300-2000 nucleotídeos, entre 300- 1500 nucleotídeos) possuindo pelo menos 75% (por exemplo, pelo menos 75, 76, 77, 78, 79, 80, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99, ou 100%) de identidade de sequências com uma sequência de um Anellovirus de tipo selvagem (por exemplo, um vírus Torque Teno (TTV) de tipo selvagem, um minivírus Torque Teno (TTMV) ou sequência de TTMDV, por exemplo, uma sequência de Anellovirus de tipo selvagem como listada em qualquer uma das Tabelas A1, A3, A5, A7, A9, A11, B1-B5, 1, 3, 5, 7, 9, 11, 13, 15, ou 17). Em algumas modalidades, o elemento genético compreende uma sequência de ácidos nucleicos (por exemplo, uma sequência de ácidos nucleicos de pelo menos 300 nucleotídeos, 500 nucleotídeos, 1000 nucleotídeos, 1500 nucleotídeos, 2000 nucleotídeos, 2500 nucleotídeos, 3000 nucleotídeos ou mais) possuindo pelo menos 75% (por exemplo, pelo menos 75, 76, 77, 78, 79, 80, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99, ou 100%) de identidade de sequências com uma sequência de Anellovirus de tipo selvagem (por exemplo, uma sequência de Anellovirus de tipo selvagem como descrito no presente documento, por exemplo, como listado em qualquer uma das Tabelas A1, A3, A5, A7, A9, A11, B1-B5, 1, 3, 5, 7, 9, 11, 13, 15, ou 17). Em algumas modalidades, a sequência de ácidos nucleicos é otimizada quanto aos códons, por exemplo, para expressão em uma célula de mamífero (por exemplo, humana). Em algumas modalidades, pelo menos 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% dos códons na sequência de ácidos nucleicos são otimizados quanto aos códons, por exemplo, para expressão em uma célula de mamífero (por exemplo, humana).
[009] Em um aspecto, a invenção apresenta uma partícula infecciosa (para uma célula humana) compreendendo um capsídeo de Anellovirus (por exemplo, um capsídeo compreendendo um polipeptídeo ORF, por exemplo, ORF1 de Anellovirus) encapsulando um elemento genético compreendendo uma sequência de ligação à proteína que se liga ao capsídeo e uma sequência heteróloga (para o Anellovirus) codificando um efetor terapêutico.
Em modalidades, a partícula é capaz de entregar o elemento genético em uma célula de mamífero, por exemplo, humana.
Em algumas modalidades, o elemento genético tem menos do que cerca de 6% (por exemplo, menos do que 6%, 5,5%, 5%, 4,5%, 4%, 3,5%, 3%, 2,5%, 2%, 1,5% ou menos) de identidade com um Anellovirus de tipo selvagem.
Em algumas modalidades, o elemento genético tem não mais do que 1,5%, 2%, 2,5%, 3%, 3,5%, 4%, 4,5%, 5%, 5,5% ou 6% de identidade com um Anellovirus de tipo selvagem.
Em algumas modalidades, o elemento genético tem pelo menos cerca de 2% a pelo menos cerca de 5,5% (por exemplo, 2 a 5%, 3% a 5%, 4% a 5%) de identidade com um Anellovirus de tipo selvagem.
Em algumas modalidades, o elemento genético tem mais do que cerca de 2000, 3000, 4000, 4500 ou 5000 nucleotídeos de sequência não viral (por exemplo, sequência de genoma diferente de Anellovirus). Em algumas modalidades, o elemento genético tem mais do que cerca de 2000 a 5000, 2500 a 4500, 3000 a 4500, 2500 a 4500, 3500 ou 4000, 4500 (por exemplo, entre cerca de 3000 e 4500) nucleotídeos de sequência não viral (por exemplo, sequência de genoma diferente de Anellovirus). Em algumas modalidades, o elemento genético é um DNA de fita simples, circular.
Alternativamente ou em combinação, o elemento genético tem uma, duas ou 3 das seguintes propriedades: é circular, tem fita simples, se integra no genoma de uma célula a uma frequência de menos do que cerca de 0,001%, 0,005%, 0,01%, 0,05%, 0,1%, 0,5%, 1%, 1,5%, ou 2% do elemento genético que entra na célula, se integra no genoma de uma célula alvo em menos do que 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 15, 20, 25, ou 30 cópias por genoma ou se integra a uma frequência de menos do que cerca de 0,0001%, 0,001%, 0,005%, 0,01%, 0,05%, 0,1%, 0,5%, 1%, 1,5%, ou 2% do elemento genético que entra na célula. Em algumas modalidades, a frequência de integração é determinada como descrito em Wang et al. (2004, Gene Therapy 11: 711-721, incorporado no presente documento por referência em sua totalidade).
[0010] São também descritos no presente documento vetores virais e partículas virais com base em Anelloviruses, que podem ser usados para entregar um agente (por exemplo, um efetor exógeno ou um efetor endógeno, por exemplo, um efetor terapêutico) a uma célula (por exemplo, uma célula em um indivíduo a ser tratada terapeuticamente). Em algumas modalidades, os Anelloviruses podem ser usados como veículos de entrega eficazes para introdução de um agente, tal como um efetor descrito no presente documento, a uma célula alvo, por exemplo, uma célula alvo em um indivíduo a ser tratado terapeuticamente ou profilaticamente.
[0011] Em um aspecto, a invenção apresenta um polipeptídeo (por exemplo, um polipeptídeo sintético, por exemplo, uma molécula ORF1) compreendendo (por exemplo, em série):
[0012] (i) uma primeira região compreendendo uma região rica em arginina, por exemplo, sequência de aminoácidos possuindo pelo menos 70% (por exemplo, pelo menos cerca de 70, 80, 90, 95, 96, 97, 98, 99, ou 100%) de identidade de sequências com uma sequência da região rica em arginina descrita no presente documento ou uma sequência de pelo menos cerca de 40 aminoácidos compreendendo pelo menos 60%, 70% ou 80% de resíduos básicos (por exemplo, arginina, lisina ou uma sua combinação),
[0013] (ii) uma segunda região compreendendo um domínio de jelly- roll, por exemplo, sequência de aminoácidos possuindo pelo menos 30% (por exemplo, pelo menos cerca de 30, 35, 40, 50, 60, 70, 80, 90, 95, 96, 97, 98, 99, ou 100%) de identidade de sequências com uma sequência da região jelly-roll descrita no presente documento ou uma sequência compreendendo pelo menos 6 fitas beta;
[0014] (iii) uma terceira região compreendendo uma sequência de aminoácidos possuindo pelo menos 30% (por exemplo, pelo menos cerca de 30, 35, 40, 50, 60, 70, 80, 90, 95, 96, 97, 98, 99, ou 100%) de identidade de sequências com uma sequência do domínio N22 descrita no presente documento,
[0015] (iv) uma quarta região compreendendo uma sequência de aminoácidos possuindo pelo menos 70% (por exemplo, pelo menos cerca de 70, 80, 90, 95, 96, 97, 98, 99, ou 100%) de identidade de sequências com uma sequência do domínio C-terminal (CTD) de ORF1 de Anellovirus descrita no presente documento e
[0016] (v) opcionalmente em que o polipeptídeo tem uma sequência de aminoácidos possuindo menos do que 100%, 99%, 98%, 95%, 90%, 85%, 80% de identidade de sequências com uma proteína ORF1 de Anellovirus de tipo selvagem descrita no presente documento.
[0017] Em algumas modalidades, o polipeptídeo compreende pelo menos cerca de 70, 80, 90, 95, 96, 97, 98, 99, ou 100% de identidade de sequências com uma molécula de ORF1 de Anellovirus como descrito no presente documento (por exemplo, como listado em qualquer uma das Tabelas A2, A4, A6, A8, A10, A12, C1-C5, 2, 4, 6, 8, 10, 12, 14, 16, 18, 20-37, ou D1-D10). Em algumas modalidades, o polipeptídeo compreende pelo menos cerca de 70, 80, 90, 95, 96, 97, 98, 99, ou 100% identidade de sequências com uma subsequência (por exemplo, um domínio rico em arginina (Arg), um domínio de jelly-roll, uma região hipervariável (HVR), um domínio N22 ou um domínio C- terminal (CTD)) de uma molécula ORF1 de Anellovirus como descrito no presente documento (por exemplo, como listado em qualquer uma das Tabelas A2, A4, A6, A8, A10, A12, C1-C5, 2, 4, 6, 8, 10, 12, 14, 16, 18, 20-37, ou D1-D10). Em uma modalidade, as sequências de aminoácidos da região (i), (ii), (iii) e (iv) têm pelo menos 90% de identidade de sequências com suas respectivas referências e em que o polipeptídeo tem uma sequência de aminoácidos possuindo menos do que 100%, 99%, 98%, 95%, 90%, 85%, 80% de identidade de sequências com uma proteína ORF1 de Anellovirus de tipo selvagem descrita no presente documento.
[0018] Em um aspecto, a invenção apresenta um complexo compreendendo um polipeptídeo como descrito no presente documento (por exemplo, uma molécula ORF1 de Anellovirus como descrito no presente documento) e um elemento genético compreendendo um elemento promotor e uma sequência de ácidos nucleicos (por exemplo, uma sequência de DNA) codificando um efetor (por exemplo, um efetor exógeno ou um efetor endógeno) e uma sequência de ligação à proteína.
[0019] A presente descrição proporciona ainda moléculas de ácido nucleico (por exemplo, uma molécula de ácido nucleico que inclui um elemento genético como descrito no presente documento ou uma molécula de ácido nucleico que inclui uma sequência codificando uma proteína exterior proteinácea como descrito no presente documento). Uma molécula de ácido nucleico da invenção pode incluir um ou ambos de (a) um elemento genético como descrito no presente documento e (b) uma sequência de ácidos nucleicos codificando uma proteína exterior proteinácea como descrito no presente documento.
[0020] Em um aspecto, a invenção apresenta uma molécula de ácido nucleico isolada compreendendo um elemento genético compreendendo um elemento promotor operacionalmente uma sequência codificando um efetor, por exemplo, uma carga útil, e uma sequência de ligação à proteína exterior. Em algumas modalidades, a sequência de ligação à proteína exterior inclui uma sequência pelo menos 75% (pelo menos 80%, 85%, 90%, 95%, 97%, 100%) idêntica a uma sequência de 5´ UTR de um Anellovirus, como descrito no presente documento. Em modalidades, o elemento genético é um DNA de fita simples, é circular, se integra a uma frequência de menos do que cerca de 0,001%, 0,005%, 0,01%, 0,05%, 0,1%, 0,5%, 1%, 1,5%, ou 2% do elemento genético que entra na célula e/ou se integra no genoma de uma célula alvo em menos do que 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 15, 20, 25, ou 30 cópias por genoma ou se integra a uma frequência de menos do que cerca de 0,001%, 0,005%, 0,01%, 0,05%, 0,1%, 0,5%, 1%, 1,5%, ou 2%do elemento genético que entra na célula. Em algumas modalidades, a frequência de integração é determinada como descrito em Wang et al. (2004, Gene Therapy 11: 711-721, incorporado no presente documento por referência em sua totalidade). Em modalidades, o efetor não tem origem em TTV e não é um SV40-miR- S1. Em modalidades, a molécula de ácido nucleico não compreende a sequência de polinucleotídeos de TTMV-LY2. Em modalidades, o elemento promotor é capaz de dirigir a expressão do efetor em uma célula eucariótica (por exemplo, mamífero, por exemplo, humana).
[0021] Em algumas modalidades, a molécula de ácido nucleico é circular. Em algumas modalidades, a molécula de ácido nucleico é linear. Em algumas modalidades, uma molécula de ácido nucleico descrita no presente documento compreende um ou mais nucleotídeos modificados (por exemplo, uma modificação de base, modificação de açúcar ou modificação de esqueleto).
[0022] Em algumas modalidades, a molécula de ácido nucleico compreende uma sequência codificando uma molécula ORF1 (por exemplo, uma proteína ORF1 de Anellovirus, por exemplo, como descrito no presente documento). Em algumas modalidades, a molécula de ácido nucleico compreende uma sequência codificando uma molécula ORF2 (por exemplo, uma proteína ORF2 de Anellovirus, por exemplo, como descrito no presente documento). Em algumas modalidades, a molécula de ácido nucleico compreende uma sequência codificando uma molécula ORF3 (por exemplo, uma proteína ORF3 de Anellovirus, por exemplo, como descrito no presente documento). Em um aspecto, a invenção apresenta um elemento genético compreendendo um, dois ou três de: (i) um elemento promotor e uma sequência codificando um efetor, por exemplo, um efetor exógeno ou endógeno; (ii) pelo menos 72 nucleotídeos contíguos (por exemplo, pelo menos 72, 73, 74, 75, 76, 77, 78, 79, 80, 90, 100, ou 150 nucleotídeos) possuindo pelo menos 75% (por exemplo, pelo menos 75, 76, 77, 78, 79, 80, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99, ou 100%) de identidade de sequências com uma sequência de Anellovirus de tipo selvagem; ou pelo menos 100 (por exemplo, pelo menos 300, 500, 1000, 1500) nucleotídeos contíguos possuindo pelo menos 72% (por exemplo, pelo menos 72, 73, 74, 75, 76, 77, 78, 79, 80, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99, ou 100%) de identidade de sequências com uma sequência de Anellovirus de tipo selvagem; e (iii) uma sequência de ligação à proteína, por exemplo, uma sequência de ligação à proteína exterior, e em que o construto de ácido nucleico é um DNA de fita simples; e em que o construto de ácido nucleico é circular, se integra a uma frequência de menos do que cerca de 0,001%, 0,005%, 0,01%, 0,05%, 0,1%, 0,5%, 1%, 1,5%, ou 2% do elemento genético que entra na célula e/ou se integra no genoma de uma célula alvo em menos do que 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 15, 20, 25, ou 30 cópias por genoma.
Em algumas modalidades, um elemento genético codificando um efetor (por exemplo, um efetor exógeno ou endógeno, por exemplo, como descrito no presente documento) é otimizado quanto aos códons.
Em algumas modalidades, o elemento genético é circular.
Em algumas modalidades, o elemento genético é linear.
Em algumas modalidades, o elemento genético compreende um anelovetor, por exemplo, como descrito no presente documento.
Em algumas modalidades, um elemento genético descrito no presente documento compreende um ou mais nucleotídeos modificados (por exemplo, uma modificação de base, modificação de açúcar ou modificação de esqueleto). Em algumas modalidades, o elemento genético compreende uma sequência codificando uma molécula ORF1 (por exemplo, uma proteína ORF1 de Anellovirus, por exemplo, como descrito no presente documento). Em algumas modalidades, o elemento genético compreende uma sequência codificando uma molécula ORF2 (por exemplo, uma proteína ORF2 de Anellovirus, por exemplo, como descrito no presente documento). Em algumas modalidades, o elemento genético compreende uma sequência codificando uma molécula ORF3 (por exemplo, uma proteína ORF3 de Anellovirus, por exemplo, como descrito no presente documento).
[0023] Em um aspecto, a invenção apresenta uma célula hospedeira ou célula ajudante compreendendo: (a) um ácido nucleico compreendendo uma sequência codificando um ou mais de uma molécula ORF1, uma molécula ORF2 ou uma molécula ORF3 (por exemplo, uma sequência codificando um polipeptídeo ORF1 de Anellovirus descrito no presente documento), em que o ácido nucleico é um plasmídeo, é um ácido nucleico viral ou está integrado em um cromossomo de célula ajudante; e (b) um elemento genético, em que o elemento genético compreende (i) um elemento promotor operacionalmente ligado a uma sequência de ácidos nucleicos (por exemplo, uma sequência de DNA) codificando um efetor (por exemplo, um efetor exógeno ou um efetor endógeno) e (ii) uma sequência de ligação à proteína que se liga ao polipeptídeo de (a), em que opcionalmente o elemento genético não codifica um polipeptídeo ORF1 (por exemplo, uma proteína ORF1). Por exemplo, a célula hospedeira ou célula ajudante compreende (a) e (b) em cis (ambos parte da mesma molécula de ácido nucleico) ou em trans (cada parte de uma molécula de ácido nucleico diferente). Em modalidades, o elemento genético de (b) é DNA circular, de fita simples. Em algumas modalidades, a célula hospedeira é uma linha de células fabricantes. Em algumas modalidades, a célula hospedeira ou célula ajudante é aderente ou em suspensão ou ambas. Em algumas modalidades, a célula hospedeira ou célula ajudante é cultivada em um microtransportador. Em alguns exemplos, a célula hospedeira ou célula ajudante é compatível com práticas de fabricação cGMP. Em algumas modalidades, a célula hospedeira ou célula ajudante é cultivada em um meio adequado para promoção do crescimento celular. Em certas modalidades, logo que a célula hospedeira ou célula ajudante tenha crescido suficientemente (por exemplo, até uma densidade celular apropriada), o meio pode ser trocado por um meio adequado para produção de anelossomos pela célula hospedeira ou célula ajudante.
[0024] Em um aspecto, a invenção apresenta uma composição farmacêutica compreendendo um anelossomo (por exemplo, um anelossomo sintético) como descrito no presente documento. Em modalidades, a composição farmacêutica compreende ainda um transportador ou excipiente farmaceuticamente aceitável. Em modalidades, a composição farmacêutica compreende uma dose unitária compreendendo cerca de 105-1014 equivalentes do genoma do anelossomo por quilograma de um indivíduo alvo. Em algumas modalidades, a composição farmacêutica compreendendo a preparação será estável ao longo de um período de tempo e temperatura aceitáveis e/ou será compatível com a via de administração desejada e/ou quaisquer dispositivos que esta via de administração requererá, por exemplo, agulhas ou seringas. Em algumas modalidades, a composição farmacêutica é formulada para administração como uma dose única ou doses múltiplas. Em algumas modalidades, a composição farmacêutica é formulada no local de administração, por exemplo, por um profissional de cuidados de saúde. Em algumas modalidades, a composição farmacêutica compreende uma concentração desejada de genomas de anelossomos ou equivalentes genômicos (por exemplo, como definido pelo número de genomas por volume).
[0025] Em um aspecto, a invenção apresenta um método de tratamento de uma doença ou disfunção em um indivíduo, o método compreendendo administração ao indivíduo de um anelossomo, por exemplo, um anelossomo sintético, por exemplo, como descrito no presente documento.
[0026] Em um aspecto, a invenção apresenta um método de entrega de um efetor ou carga útil (por exemplo, um efetor endógeno ou exógeno) a uma célula, tecido ou indivíduo, o método compreendendo administração ao indivíduo de um anelossomo, por exemplo, um anelossomo sintético, por exemplo, como descrito no presente documento, em que o anelossomo compreende uma sequência de ácidos nucleicos codificando o efetor. Em modalidades, a carga útil é um ácido nucleico. Em modalidades, a carga útil é uma polipeptídeo.
[0027] Em um aspecto, a invenção apresenta um método de entrega de um anelossomo a uma célula, compreendendo contato do anelossomo, por exemplo, um anelossomo sintético, por exemplo, como descrito no presente documento, com uma célula, por exemplo, uma célula eucariótica, por exemplo, uma célula de mamífero, por exemplo, in vivo ou ex vivo.
[0028] Em um aspecto, a invenção apresenta um método de preparação de um anelossomo, por exemplo, um anelossomo sintético. O método inclui:
[0029] a) proporcionar uma célula hospedeira compreendendo:
[0030] (i) uma primeira molécula de ácido nucleico compreendendo a sequência de ácidos nucleicos de um elemento genético de um anelossomo, por exemplo, um anelossomo sintético, como descrito no presente documento, e
[0031] (ii) o primeiro ácido nucleico ou uma segunda molécula de ácido nucleico codificando uma ou mais de uma sequência de aminoácidos escolhida de ORF1, ORF2, ORF2/2, ORF2/3, ORF1/1 ou ORF1/2, por exemplo, como listado em qualquer uma das Tabelas 16, ou uma sequência de aminoácidos possuindo pelo menos 70% (por exemplo, pelo menos 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100%) de identidade de sequências com as mesmas; e
[0032] b) incubar a célula hospedeira sob condições adequadas para preparar o anelossomo.
[0033] Em algumas modalidades, o método inclui ainda, antes do passo (a), introdução da primeira molécula de ácido nucleico e/ou da segunda molécula de ácido nucleico na célula hospedeira. Em algumas modalidades, a segunda molécula de ácido nucleico é introduzida na célula hospedeira antes da, simultaneamente com ou após a primeira molécula de ácido nucleico. Em outras modalidades, a segunda molécula de ácido nucleico está integrada no genoma da célula hospedeira. Em algumas modalidades, a segunda molécula de ácido nucleico ser um ajudante (por exemplo, um plasmídeo ajudante ou o genoma de um vírus ajudante).
[0034] Em um outro aspecto, a invenção apresenta um método de fabricação de uma composição de anelossomos, compreendendo:
[0035] a) proporcionar uma célula hospedeira compreendendo, por exemplo, expressando um ou mais componentes (por exemplo, todos os componentes) de um anelossomo, por exemplo, um anelossomo sintético, por exemplo, como descrito no presente documento. Por exemplo, a célula hospedeira compreende (a) um ácido nucleico compreendendo uma sequência codificando um polipeptídeo ORF1 de Anellovirus descrito no presente documento, em que o ácido nucleico é um plasmídeo, é um ácido nucleico viral ou está integrado em um cromossomo de célula ajudante; e (b) um elemento genético, em que o elemento genético compreende (i) um elemento promotor operacionalmente ligado a uma sequência de ácidos nucleicos (por exemplo, uma sequência de DNA) codificando um efetor (por exemplo, um efetor exógeno ou um efetor endógeno) e (i) uma sequência de ligação à proteína (por exemplo, sequência de empacotamento) que se liga ao polipeptídeo de (a), em que a célula hospedeira ou célula ajudante compreende (a) e (b) em cis ou em trans. Em modalidades, o elemento genético de (b) é DNA circular, de fita simples. Em algumas modalidades, a célula hospedeira é uma linha de células fabricantes;
[0036] b) cultivar a célula hospedeira sob condições adequadas para produção de uma preparação de anelossomos a partir da célula hospedeira, em que os anelossomos da preparação compreendem um exterior proteináceo (por exemplo, compreendendo uma molécula ORF1) encapsulando o elemento genético (por exemplo, como descrito no presente documento) preparando deste modo uma preparação de anelossomos; e
[0037] opcionalmente, c) formular a preparação de anelossomos, por exemplo, como uma composição farmacêutica adequada para administração a um indivíduo.
[0038] Em algumas modalidades, os componentes do anelossomo são introduzidos na célula hospedeira aquando da produção (por exemplo, por transfecção transitória). Em algumas modalidades, a célula hospedeira expressa estavelmente os componentes do anelossomo (por exemplo, em que um ou mais ácidos nucleicos codificando os componentes do anelossomo são introduzidos na célula hospedeira, ou um seu progenitor, por exemplo, por transfecção estável).
[0039] Em algumas modalidades, o método compreende ainda um ou mais passos de purificação (por exemplo, purificação por sedimentação, cromatografia e/ou ultrafiltração). Em algumas modalidades, os passos de purificação compreendem remoção de um ou mais de soro, DNA da célula hospedeira, proteínas da célula hospedeira, partículas carecendo do elemento genético e/ou vermelho de fenol da preparação. Em algumas modalidades, a preparação resultante ou uma composição farmacêutica compreendendo a preparação será estável ao longo de um período de tempo e temperatura aceitáveis e/ou será compatível com a via de administração desejada e/ou quaisquer dispositivos que esta via de administração requererá, por exemplo, agulhas ou seringas.
[0040] Em um aspecto, a invenção apresenta um método de fabricação de uma composição de anelossomos, compreendendo: a) proporcionar uma pluralidade de anelossomos descrita no presente documento ou uma preparação descrita no presente documento; e b) formular os anelossomos ou sua preparação, por exemplo, como uma composição farmacêutica adequada para administração a um indivíduo.
[0041] Em um aspecto, a invenção apresenta um método de fabricação de uma célula hospedeira, por exemplo, uma primeira célula hospedeira ou uma célula produtora (por exemplo, como mostrado na Figura 12), por exemplo, uma população de primeiras células hospedeiras, compreendendo um anelossomo, o método compreendendo introdução de um elemento genético, por exemplo, como descrito no presente documento, a uma célula hospedeira e cultura da célula hospedeira sob condições adequadas para produção do anelossomo. Em modalidades, o método compreende ainda introdução de um ajudante, por exemplo, um vírus ajudante, na célula hospedeira. Em modalidades, a introdução compreende transfecção (por exemplo, transfecção química) ou eletroporação da célula hospedeira com o anelossomo.
[0042] Em um aspecto, a invenção apresenta um método de fabricação de um anelossomo, compreendendo proporcionar uma célula hospedeira, por exemplo, uma primeira célula hospedeira ou célula produtora (por exemplo, como mostrado na Figura 12), compreendendo um anelossomo, por exemplo, como descrito no presente documento, e purificar o anelossomo a partir da célula hospedeira. Em algumas modalidades, o método compreende ainda, antes do passo de proporcionar, contato da célula hospedeira com um anelossomo, por exemplo, como descrito no presente documento, e incubação da célula hospedeira sob condições adequadas para produção do anelossomo. Em modalidades, a célula hospedeira é a primeira célula hospedeira ou célula produtora descrita no método acima de preparação de uma célula hospedeira. Em modalidades, a purificação do anelossomo a partir da célula hospedeira compreende lise da célula hospedeira.
[0043] Em algumas modalidades, o método compreende ainda um segundo passo de contato do anelossomo produzido pela primeira célula hospedeira ou célula produtora com uma segunda célula hospedeira, por exemplo, uma célula permissiva (por exemplo, como mostrado na Figura 12), por exemplo, uma população de segundas células hospedeiras. Em algumas modalidades, o método compreende ainda incubação da segunda célula hospedeira sob condições adequadas para produção do anelossomo. Em algumas modalidades, o método compreende ainda purificação de um anelossomo a partir da segunda célula hospedeira, por exemplo, produzindo deste modo uma população de sementes de anelossomo. Em modalidades, pelo menos cerca de 2-100 vezes mais do anelossomo é produzido a partir da população de segundas células hospedeiras do que a partir da população de primeiras células hospedeiras. Em modalidades, a purificação do anelossomo a partir da segunda célula hospedeira compreende lise da segunda célula hospedeira. Em algumas modalidades, o método compreende ainda um segundo passo de contato do anelossomo produzido pela segunda célula hospedeira com uma terceira célula hospedeira, por exemplo, células permissivas (por exemplo, como mostrado na Figura 12), por exemplo, uma população de terceiras células hospedeiras. Em algumas modalidades, o método compreende ainda incubação da terceira célula hospedeira sob condições adequadas para produção do anelossomo. Em algumas modalidades, o método compreende ainda purificação de um anelossomo a partir da terceira célula hospedeira, por exemplo, produzindo deste modo uma população de estoque de anelossomo. Em modalidades, a purificação do anelossomo a partir da terceira célula hospedeira compreende lise da terceira célula hospedeira. Em modalidades, pelo menos cerca de 2-100 vezes mais do anelossomo é produzido a partir da população de terceiras células hospedeiras do que a partir da população de segundas células hospedeiras.
[0044] Em algumas modalidades, a célula hospedeira é cultivada em um meio adequado para promoção do crescimento celular. Em certas modalidades, logo que a célula hospedeira tenha crescido suficientemente (por exemplo, até uma densidade celular apropriada), o meio pode ser trocado por um meio adequado para produção de anelossomos pela célula hospedeira. Em algumas modalidades, os anelossomos produzidos por uma célula hospedeira são separados da célula hospedeira (por exemplo, por lise da célula hospedeira) antes do contato com uma segunda célula hospedeira. Em algumas modalidades, os anelossomos produzidos por uma célula hospedeira são contatados com uma segunda célula hospedeira sem um passo de purificação interveniente.
[0045] Em um aspecto, a invenção apresenta um método de preparação de uma preparação farmacêutica de anelossomos. O método compreende (a) preparar uma preparação de anelossomos como descrito no presente documento, (b) avaliar a preparação (por exemplo, uma preparação farmacêutica de anelossomos, população de sementes de anelossomos ou a população de estoque de anelossomos) quanto a um ou mais parâmetros de controle da qualidade farmacêutica, por exemplo, identidade, pureza, título, potência (por exemplo, em equivalentes genômicos por partícula de anelossomo) e/ou a sequência de ácidos nucleicos, por exemplo, do elemento genético compreendido pelo anelossomo e (c) formular a preparação para uso farmacêutico da avaliação atende a um critério predeterminado, por exemplo, atende a uma especificação farmacêutica.
Em algumas modalidades, a avaliação da identidade compreende avaliação (por exemplo, confirmação) da sequência do elemento genético do anelossomo, por exemplo, a sequência codificando o efetor.
Em algumas modalidades, a avaliação da pureza compreende avaliação da quantidade de uma impureza, por exemplo, micoplasma, endotoxina, ácidos nucleicos da célula hospedeira (por exemplo, DNA da célula hospedeira e/ou RNA da célula hospedeira), impurezas do processo derivadas de animais (por exemplo, albumina sérica ou tripsina), agentes competentes em replicação (RCA), por exemplo, vírus competentes em replicação ou anelossomos indesejados (por exemplo, um anelossomo sem ser o anelossomo desejado, por exemplo, um anelossomo sintético como descrito no presente documento), proteína de capsídeo viral livre, agentes adventícios e/ou agregados.
Em algumas modalidades, a avaliação do título compreende avaliação da razão de anelossomos funcionais versus não funcionais (por exemplo, infecciosos vs. não infecciosos) na preparação (por exemplo, como avaliado por HPLC). Em algumas modalidades, a avaliação da potência compreende avaliação do nível da função de anelossomos (por exemplo, expressão e/ou função de um efetor codificado aí ou equivalentes genômicos)
detectáveis na preparação.
[0046] Em modalidades, a preparação formulada está substancialmente isenta de patógenos, contaminantes da célula hospedeira ou impurezas; tem um nível predeterminado de partículas não infecciosas ou uma razão predeterminada de partículas:unidades infecciosas (por exemplo, <300:1, <200:1, <100:1 ou <50:1). Em algumas modalidades, múltiplos anelossomos podem ser produzidos em um único lote. Em modalidades, os níveis dos anelossomos produzidos no lote podem ser avaliados (por exemplo, individualmente ou em conjunto).
[0047] Em um aspecto, a invenção apresenta uma célula hospedeira compreendendo:
[0048] (i) uma primeira molécula de ácido nucleico compreendendo a sequência de ácidos nucleicos de um elemento genético de um anelossomo como descrito no presente documento e
[0049] (ii) opcionalmente, uma segunda molécula de ácido nucleico codificando uma ou mais de uma sequência de aminoácidos escolhida de ORF1, ORF2, ORF2/2, ORF2/3, ORF1/1 ou ORF1/2 como listado em qualquer uma das Tabelas 16, ou uma sequência de aminoácidos possuindo pelo menos cerca de 70% (por exemplo, pelo menos cerca de 70, 80, 90, 95, 96, 97, 98, 99, ou 100%) identidade de sequências com as mesmas.
[0050] Em um aspecto, a invenção apresenta uma mistura reacional compreendendo um anelossomo descrito no presente documento e um vírus ajudante, em que o vírus ajudante compreende um polinucleotídeo, por exemplo, um polinucleotídeo codificando uma proteína exterior (por exemplo, uma proteína exterior capaz de se ligar à sequência de ligação à proteína exterior e, opcionalmente, um envelope de lipídeos), um polinucleotídeo codificando uma proteína de replicação (por exemplo, uma polimerase) ou qualquer sua combinação.
[0051] Em algumas modalidades, um anelossomo (por exemplo, um anelossomo sintético) é isolado, por exemplo, isolado a partir de uma célula hospedeira e/ou isolado a partir de outros constituintes em uma solução (por exemplo, um sobrenadante). Em algumas modalidades, um anelossomo (por exemplo, um anelossomo sintético) é purificado, por exemplo, a partir de uma solução (por exemplo, um sobrenadante). Em algumas modalidades, um anelossomo é enriquecido em uma solução em relação a outros constituintes na solução.
[0052] Em algumas modalidades de qualquer um dos anelossomos, anelovetores, composições ou métodos acima mencionados, o elemento genético compreende um genoma de anelossomo, por exemplo, como identificado de acordo com o método descrito no Exemplo 9. Em modalidades, o genoma de anelossomo compreende uma sequência de ácidos nucleicos de TTV-tth8, por exemplo, uma sequência de ácidos nucleicos de TTV-tth8 mostrada na Tabela 5, possuindo deleções de pelo menos 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 95%, 99%, ou 100% dos nucleotídeos 3436-3707 da sequência de ácidos nucleicos de TTV-tth8. Em modalidades, o genoma de anelossomo compreende uma sequência de ácidos nucleicos de TTMV-LY2, por exemplo, uma sequência de ácidos nucleicos de TTMV- LY2 mostrada na Tabela 15, possuindo deleções de pelo menos 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 95%, 99%, ou 100% dos nucleotídeos 574-1371, 1432-2210, 574-2210 e/ou 2610-2809 da sequência de ácidos nucleicos de TTMV-LY2. Em modalidades, o genoma de anelossomo é um genoma de anelossomo capaz de autorreplicação e/ou autoamplificação. Em modalidades, o genoma de anelossomo não é capaz de autorreplicação e/ou autoamplificação. Em modalidades, o genoma de anelossomo é capaz de se replicar e/ou ser amplificado em trans, por exemplo, na presença de um ajudante, por exemplo, um vírus ajudante.
[0053] Características adicionais de qualquer um dos anelossomos, anelovetores, composições ou métodos acima mencionados incluem uma ou mais das seguintes modalidades enumeradas.
[0054] Os peritos na técnica reconhecerão, ou serão capazes de determinar usando não mais do que experimentação de rotina, muitos equivalentes das modalidades específicas da invenção descrita no presente documento. Tais equivalentes se destinam a ser englobados pelas seguintes modalidades enumeradas.
[0055] Modalidades Enumeradas
[0056] 1. Um anelossomo compreendendo:
[0057] (a) um exterior proteináceo;
[0058] (b) um elemento genético compreendendo um elemento promotor e uma sequência de ácidos nucleicos (por exemplo, uma sequência de DNA) codificando um efetor exógeno e uma sequência de ligação à proteína (por exemplo, uma sequência de ligação à proteína exterior);
[0059] em que o efetor exógeno compreende um polipeptídeo que, quando mutado, provoca uma doença humana, ou uma variante funcional do referido polipeptídeo;
[0060] em que o elemento genético está encerrado dentro do exterior proteináceo; e
[0061] em que o anelossomo é configurado para entregar o elemento genético em uma célula eucariótica;
[0062] opcionalmente, em que o elemento genético compreende pelo menos uma diferença (por exemplo, uma mutação, modificação química ou alteração epigenética) em relação a uma sequência do genoma de Anellovirus de tipo selvagem (por exemplo, como descrito no presente documento), por exemplo, uma inserção, substituição, modificação enzimática e/ou deleção, por exemplo, uma deleção de um domínio (por exemplo, um ou mais de uma caixa TATA, local cap, local de início transcricional, 5´ UTR, grelha de leitura aberta (ORF), sinal de poli(A) ou região rica em GC).
[0063] 2. Um anelossomo compreendendo:
[0064] (a) um exterior proteináceo;
[0065] (b) um elemento genético compreendendo um elemento promotor operacionalmente ligado a uma sequência de ácidos nucleicos heteróloga (por exemplo, uma sequência de DNA) codificando um efetor (por exemplo, um efetor endógeno ou um efetor exógeno);
[0066] em que o efetor exógeno compreende um polipeptídeo que, quando mutado, provoca uma doença humana, um uma variante funcional do referido polipeptídeo;
[0067] em que o elemento genético está encerrado dentro do exterior proteináceo;
[0068] opcionalmente, em que o elemento genético compreende pelo menos uma diferença (por exemplo, uma mutação, modificação química ou alteração epigenética) em relação a uma sequência do genoma de Anellovirus de tipo selvagem (por exemplo, como descrito no presente documento), por exemplo, uma inserção, substituição, modificação enzimática e/ou deleção, por exemplo, uma deleção de um domínio (por exemplo, um ou mais de uma caixa TATA, local cap, local de início transcricional, 5´ UTR, grelha de leitura aberta (ORF), sinal de poli(A) ou região rica em GC).
[0069] 3. Um anelossomo compreendendo:
[0070] (a) um exterior proteináceo;
[0071] (b) um elemento genético compreendendo um elemento promotor e uma sequência de ácido nucleico (por exemplo, uma sequência de DNA) codificando um efetor exógeno e uma sequência de ligação à proteína (por exemplo, uma sequência de ligação à proteína exterior);
[0072] em que o efetor exógeno compreende uma enzima ou uma proteína estrutural;
[0073] em que o elemento genético está encerrado dentro do exterior proteináceo; e
[0074] em que o anelossomo é configurado para entregar o elemento genético em uma célula eucariótica;
[0075] opcionalmente, em que o elemento genético compreende pelo menos uma diferença (por exemplo, uma mutação, modificação química ou alteração epigenética) em relação a uma sequência do genoma de Anellovirus de tipo selvagem (por exemplo, como descrito no presente documento), por exemplo, uma inserção, substituição, modificação enzimática e/ou deleção, por exemplo, uma deleção de um domínio (por exemplo, um ou mais de uma caixa TATA, local cap, local de início transcricional, 5´ UTR, grelha de leitura aberta (ORF), sinal de poli(A) ou região rica em GC).
[0076] 4. O anelossomo de qualquer uma das modalidades precedentes, em que o efetor compreende uma enzima que atua sobre um substrato de molécula pequena que é endógeno a uma célula humana.
[0077] 5. O anelossomo de qualquer uma das modalidades precedentes, em que o efetor compreende um polipeptídeo que é endógeno a neurônios ou células musculares, ou uma variante funcional do referido polipeptídeo.
[0078] 6. O anelossomo de qualquer uma das modalidades precedentes, em que o efetor compreende uma enzima, uma proteína estrutural ou uma proteína do complemento.
[0079] 7. O anelossomo de qualquer uma das modalidades precedentes, em que o efetor é uma enzima da Tabela A ou uma variante funcional da mesma, ou em que o efetor é um polipeptídeo da Tabela B, ou uma variante funcional do mesmo.
[0080] 8. O anelossomo de qualquer uma das modalidades precedentes, em que o efetor compreende uma proteína humana de tipo selvagem, por exemplo, SMN de tipo selvagem, distrofina, UGT1A1, OCA1 ou C1.
[0081] 9. O anelossomo de qualquer uma das modalidades precedentes, em que a doença humana é uma doença que leva a níveis elevados de um substrato em comparação com o nível de substrato em um indivíduo saudável.
[0082] 10. O anelossomo de qualquer uma das modalidades precedentes, em que a doença humana é uma doença causada por níveis reduzidos de uma proteína estrutural em comparação com o nível da proteína estrutural em um indivíduo saudável.
[0083] 11. Um método de tratamento de uma doença ou disfunção em um indivíduo, o método compreendendo administração de uma quantidade eficaz de uma composição de anelossomos ao indivíduo, em que a composição de anelossomos compreende uma pluralidade de anelossomos que compreendem:
[0084] (a) um exterior proteináceo;
[0085] (b) um elemento genético compreendendo um elemento promotor e uma sequência de ácidos nucleicos (por exemplo, uma sequência de DNA) codificando um efetor (por exemplo, um efetor exógeno ou um efetor endógeno) e uma sequência de ligação à proteína (por exemplo, uma sequência de ligação à proteína exterior);
[0086] em que o efetor compreende um polipeptídeo que, quando mutado, provoca uma doença humana, ou uma variante funcional do referido polipeptídeo;
[0087] em que o elemento genético está encerrado dentro do exterior proteináceo; e
[0088] opcionalmente, em que o elemento genético compreende pelo menos uma diferença (por exemplo, uma mutação, modificação química ou alteração epigenética) em relação a uma sequência do genoma de Anellovirus de tipo selvagem (por exemplo, como descrito no presente documento), por exemplo, uma inserção, substituição, modificação enzimática e/ou deleção, por exemplo, uma deleção de um domínio (por exemplo, um ou mais de uma caixa TATA, local cap, local de início transcricional, 5´ UTR, grelha de leitura aberta (ORF), sinal de poli(A) ou região rica em GC).
[0089] 12. O método da modalidade 11, em que a doença ou disfunção é uma doença ou disfunção genética, por exemplo, uma doença genética diferente de interferonopatia.
[0090] 13. O método da modalidade 11, em que a doença ou disfunção é uma doença neuromuscular (por exemplo, atrofia muscular espinhal), uma distrofia muscular (por exemplo, distrofia muscular de Duchenne ou distrofia muscular de Becker), uma insuficiência enzimática (por exemplo, Síndrome de Crigler -Najjar), ou albinismo (por exemplo, albinismo ocular), ou deficiência de C1.
[0091] 14. Um método de tratamento de uma doença ou disfunção genética em um indivíduo, o método compreendendo a administração de uma quantidade eficaz de uma composição de anelossomo ao indivíduo, em que a composição de anelossomo compreende uma pluralidade de anelossomos que compreendem:
[0092] (a) um exterior proteináceo;
[0093] (b) um elemento genético compreendendo um elemento promotor e uma sequência de ácido nucleico (por exemplo, uma sequência de DNA) codificando um efetor (por exemplo, um efetor exógeno ou um efetor endógeno) e uma sequência de ligação à proteína (por exemplo, uma sequência de ligação à proteína exterior);
[0094] em que o elemento genético está fechado dentro do exterior proteináceo; e
[0095] opcionalmente, em que o elemento genético compreende pelo menos uma diferença (por exemplo, uma mutação, modificação química ou alteração epigenética) em relação a uma sequência do genoma de Anellovirus de tipo selvagem (por exemplo, como descrito no presente documento), por exemplo, uma inserção, substituição, modificação enzimática e/ou deleção, por exemplo, uma deleção de um domínio (por exemplo, um ou mais de uma caixa TATA, local cap, local de início transcricional, 5´ UTR, grelha de leitura aberta (ORF), sinal de poli(A) ou região rica em GC).
[0096] 15. O método da modalidade 14, em que o efetor compreende uma enzima, uma proteína estrutural ou uma proteína de complemento.
[0097] 16. Método para entregar uma atividade enzimática a um indivíduo com necessidade da atividade enzimática, o método compreendendo a administração de uma quantidade eficaz de uma composição de anelossomo ao indivíduo, em que a composição de anelossomo compreende uma pluralidade de anelossomos que compreendem:
[0098] (a) um exterior proteináceo;
[0099] (b) um elemento genético compreendendo um elemento promotor e uma sequência de ácido nucleico (por exemplo, uma sequência de DNA) codificando um efetor (por exemplo, um efetor endógeno ou um efetor exógeno) e uma sequência de ligação de proteína (por exemplo, uma sequência de ligação de proteína exterior);
[00100] opcionalmente, em que o elemento genético compreende pelo menos uma diferença (por exemplo, uma mutação, modificação química ou alteração epigenética) em relação a uma sequência do genoma de Anellovirus do tipo selvagem (por exemplo, como descrito no presente documento), por exemplo, uma inserção, substituição, modificação enzimática e/ou deleção, por exemplo, uma deleção de um domínio (por exemplo, um ou mais de uma caixa TATA, local cap, local de início transcricional, 5´ UTR, grelha de leitura aberta (ORF), sinal de poli(A) ou região rica em GC);
[00101] em que o elemento genético está fechado no exterior proteináceo; e
[00102] entragando deste modo a atividade enzimática ao indivíduo.
[00103] 17. Método para restaurar (pelo menos parcialmente) uma função em um indivíduo, por exemplo, para um fenótipo de tipo selvagem, o método compreendendo a administração de uma quantidade eficaz de uma composição de anelossomo ao indivíduo,
[00104] em que a composição de anelossomos compreende uma pluralidade de anelossomos que compreendem:
[00105] (a) um exterior proteináceo;
[00106] (b) um elemento genético compreendendo um elemento promotor e uma sequência de ácidos nucleicos (por exemplo, uma sequência de DNA) codificando um efetor (por exemplo, um efetor endógeno ou um efetor exógeno) e uma sequência de ligação à proteína (por exemplo, uma sequência de ligação à proteína exterior);
[00107] opcionalmente, em que o elemento genético compreende pelo menos uma diferença (por exemplo, uma mutação, modificação química ou alteração epigenética) em relação a uma sequência do genoma de Anellovirus de tipo selvagem (por exemplo, como descrito no presente documento), por exemplo, uma inserção, substituição, modificação enzimática e/ou deleção, por exemplo, uma deleção de um domínio (por exemplo, um ou mais de uma caixa TATA, local cap, local de início transcricional, 5´ UTR, grelha de leitura aberta (ORF), sinal de poli(A) ou região rica em GC);
[00108] em que o elemento genético está encerrado dentro do exterior proteináceo; e
[00109] restabelecendo deste modo a função no indivíduo.
[00110] 18. O método de qualquer uma das reivindicações 11-17, em que o efetor modifica covalentemente um substrato que está presente em um nível elevado no indivíduo em comparação com o nível de substrato em um indivíduo saudável.
[00111] 19. O método de qualquer uma das reivindicações 11-18, em que o efetor é uma variante funcional da proteína que é mutante no indivíduo, por exemplo, é uma proteína de tipo selvagem correspondendo à proteína que é mutante no indivíduo.
[00112] 20. O método de qualquer uma das reivindicações 11-19, em que o efetor é um homólogo funcional (por exemplo ortólogo ou parálogo) da proteína que é mutante no indivíduo.
[00113] 21. O método de qualquer uma das reivindicações 11-20, em que o efetor modifica covalentemente um substrato, em que o indivíduo também é modificado por uma proteína de tipo selvagem correspondendo à proteína que é mutante no indivíduo.
[00114] 22. O método de qualquer uma das reivindicações 11-21, em que o efetor cataliza a mesma reação química que a proteína de tipo selvagem correspondendo à proteína que é mutante no indivíduo.
[00115] 23. O método de qualquer uma das reivindicações 11-22, em que o efetor compreende uma proteína estrutural, uma enzima, ou uma proteína de complemento.
[00116] 24. Um método de entrega de um efetor a um indivíduo, o método compreendendo entregar uma quantidade eficaz de uma composição de anelossomos ao indivíduo.
[00117] em que a composição de anelossomos compreende uma pluralidade de anelossomos que compreendem:
[00118] (a) um exterior proteináceo;
[00119] (b) um elemento genético compreendendo um elemento promotor e uma sequência de ácidos nucleicos (por exemplo, uma sequência de DNA) codificando um efetor (por exemplo, um efetor endógeno ou um efetor exógeno) e uma sequência de ligação à proteína (por exemplo, uma sequência de ligação à proteína exterior);
[00120] em que o efetor compreende um polipeptídeo que, quando mutado, provoca uma doença humana, ou uma variante funcional do referido polipeptídeo;
[00121] opcionalmente, em que o elemento genético compreende pelo menos uma diferença (por exemplo, uma mutação, modificação química ou alteração epigenética) em relação a uma sequência do genoma de Anellovirus de tipo selvagem (por exemplo, como descrito no presente documento), por exemplo, uma inserção, substituição, modificação enzimática e/ou deleção, por exemplo, uma deleção de um domínio (por exemplo, um ou mais de uma caixa TATA, local cap, local de início transcricional, 5´ UTR, grelha de leitura aberta (ORF), sinal de poli(A) ou região rica em GC);
[00122] em que o elemento genético está encerrado dentro do exterior proteináceo; e
[00123] entregando deste modo o efetor ao indivíduo.
[00124] 25. Um método de modulação, por exemplo, inibição ou intensificação, de uma função biológica em um indivíduo, por exemplo, um indivíduo possuindo uma doença ou disfunção tratável por modulação da função biológica no indivíduo, o método compreendendo administração de uma quantidade eficaz de uma composição de anelossomos ao indivíduo
[00125] em que a composição de anelossomos compreende uma pluralidade de anelossomos que compreendem:
[00126] (a) um exterior proteináceo;
[00127] (b) um elemento genético compreendendo um elemento promotor e uma sequência de ácidos nucleicos (por exemplo, uma sequência de DNA) codificando um efetor (por exemplo, um efetor endógeno ou um efetor exógeno) e uma sequência de ligação à proteína (por exemplo, uma sequência de ligação à proteína exterior);
[00128] em que o efetor compreende um polipeptídeo que, quando mutado, provoca uma doença humana, ou uma variante funcional do referido polipeptídeo;
[00129] opcionalmente, em que o elemento genético compreende pelo menos uma diferença (por exemplo, uma mutação, modificação química ou alteração epigenética) em relação a uma sequência do genoma de Anellovirus de tipo selvagem (por exemplo, como descrito no presente documento), por exemplo, uma inserção, substituição, modificação enzimática e/ou deleção, por exemplo, uma deleção de um domínio (por exemplo, um ou mais de uma caixa TATA, local cap, local de início transcricional, 5´ UTR, grelha de leitura aberta (ORF), sinal de poli(A) ou região rica em GC);
[00130] em que o elemento genético está encerrado dentro do exterior proteináceo; e
[00131] modulando, por exemplo, inibindo ou intensificando, deste modo a função biológica no indivíduo.
[00132] 26. O anelossomo ou método de qualquer uma das modalidades precedentes, em que o efetor compreende SMN, distrofina, UGT1A1, OCA1, C1 ou uma variante de qualquer um dos precedentes.
[00133] 27. O anelossomo ou método de qualquer uma das modalidades precedentes, em que o efetor é um polipeptídeo secretado (por exemplo, o efetor compreende uma sequência de sinal, por exemplo uma sequência de sinal que é endógena ao efetor, ou uma sequência de sinal heteróloga), ou o efetor é um polipeptídeo intracelular.
[00134] 28. Um método de tratamento de uma doença ou disfunção em um indivíduo, o método compreendendo administração de uma quantidade eficaz de uma composição de anelossomos ou uma molécula de ácido nucleico isolada (por exemplo, um vetor de expressão) ao indivíduo,
[00135] em que a composição de anelossomos ou molécula de ácido nucleico isolada compreende um elemento genético compreendendo um elemento promotor e uma sequência de ácidos nucleicos (por exemplo, uma sequência de DNA) codificando um efetor (por exemplo, um efetor exógeno ou um efetor endógeno) (por exemplo cada um como descrito no presente documento), e em que
[00136] (i) a doença ou disfunção é ou compreende uma doença neuromulscular, por exemplo atrofia muscular espinhal e o efetor compreende um SMN ou uma variante funcional do mesmo;
[00137] (ii) a doença ou disfunção é uma distrofia muscular (por exemplo distrofia muscular de Duchenne ou distrofia muscular de Becker), e o efetor compreende distrofina ou uma variante funcional da mesma, por exemplo uma microdistrofina;
[00138] (iii) a doença ou disfunção é uma insuficiência enzimática, por exemplo síndrome de Crigler-Najjar, e o efetor compreende uma uridina difosfato glucuronil-transferase por exemplo, UGT1A1 ou uma variante funcional da mesma;
[00139] (iv) a doença ou disfunção é albinismo, por exemplo, albinismo ocular e o efetor compreende uma tirosinase, por exemplo OCA1 ou uma variante funcional da mesma;
[00140] (v) a doença ou disfunção é deficiência de complemento de C1 e o efetor compreende C1 ou uma variante funcional da mesma; ou
[00141] (vi) a doença ou disfunção é uma doença ou disfunção da Tabela A e o efetor compreende uma enzima da Tabela A, ou uma variante funcional da mesma.
[00142] (vii) a doença ou disfunção é uma doença ou disfunção da Tabela B o efetor compreende um polipeptídeo da Tabela B, ou uma variante funcional da mesma.
[00143] tratando deste modo a doença ou disfunção no indivíduo.
[00144] 29. Um método de entrega de um efetor a um indivíduo possuindo uma doença ou disfunção, o método compreendendo administração de uma quantidade eficaz de uma composição de anelossomos ou uma molécula de ácido nucleico isolada (por exemplo, um vetor de expressão) ao indivíduo,
[00145] em que a composição de anelossomos ou molécula de ácido nucleico isolada compreende um elemento genético compreendendo um elemento promotor e uma sequência de ácidos nucleicos (por exemplo, uma sequência de DNA) codificando um efetor (por exemplo, um efetor exógeno ou um efetor endógeno); e
[00146] em que
[00147] (i) a doença ou disfunção compreende uma doença neuromulscular, por exemplo atrofia muscular espinhal e o efetor compreende um SMN ou uma variante funcional do mesmo;
[00148] (ii) a doença ou disfunção é uma distrofia muscular (por exemplo distrofia muscular de Duchenne ou distrofia muscular de Becker), e o efetor compreende distrofina ou uma variante funcional da mesma, por exemplo uma microdistrofina;
[00149] (iii) a doença ou disfunção é uma insuficiência enzimática, por exemplo síndrome de Crigler-Najjar, e o efetor compreende uma uridina difosfato glucuronil-transferase por exemplo, UGT1A1 ou uma variante funcional da mesma;
[00150] (iv) a doença ou disfunção é albinismo, por exemplo, albinismo ocular e o efetor compreende uma tirosinase, por exemplo OCA1 ou uma variante funcional da mesma;
[00151] (v) a doença ou disfunção é deficiência de complemento de C1 e o efetor compreende C1 ou uma variante funcional da mesma; ou
[00152] (vi) a doença ou disfunção é uma doença ou disfunção da Tabela A e o efetor compreende uma enzima da Tabela A, ou uma variante funcional da mesma.
[00153] (vii) a doença ou disfunção é uma doença ou disfunção da
Tabela Be o efetor compreende um polipeptídeo da Tabela B, ou uma variante funcional da mesma.
[00154] entregando deste modo o efetor ao indivíduo.
[00155] 30. Um método de fabricação de uma composição de anelossomos, o método compreendendo:
[00156] a) proporcionar uma célula hospedeira compreendendo uma ou mais moléculas de ácido nucleico codificando componentes de um anelossomo de qualquer uma das modalidades precedentes;
[00157] b) manter (por exemplo, cultivar) a célula hospedeira sob condições que permitem que a célula produza um ou mais anelossomos, preparando deste modo anelossomos; e
[00158] c) formular os anelossomos, por exemplo, como uma composição farmacêutica adequada para administração a um indivíduo.
[00159] 31. Um método de fabricação de uma composição de anelossomos, o método compreendendo:
[00160] a) proporcionar uma pluralidade de anelossomos de acordo com qualquer uma das modalidades precedentes;
[00161] b) avaliar opcionalmente a pluralidade de um ou mais de: um contaminante descrito no presente documento, uma medição de densidade óptica (por exemplo, OD 260), número de partículas (por exemplo, por HPLC), infectividade (por exemplo, razão partícula:unidade infecciosa); e
[00162] c) formular a pluralidade de anelossomos, por exemplo, como uma composição farmacêutica adequada para administração a um indivíduo, por exemplo, se um ou mais dos parâmetros de (b) atingirem um limiar especificado.
[00163] 32. O método da modalidade 31, em que a composição de anelossomos compreende pelo menos 105, 106, 107, 108, 109, 1010, 1011, 1012, 1013, 1014, ou 1015 anelossomos.
[00164] 33. O método da modalidade 31 ou 32, em que a composição de anelossomos compreende pelo menos 10 mL, 20 mL, 50 mL, 100 mL, 200 mL, 500 mL, 1 L, 2 L, 5 L, 10 L, 20 L ou 50 L.
[00165] 34. O anelossomo ou método de qualquer uma das modalidades precedentes, em que o efetor compreende um polipeptídeo que, quando mutado, provoca uma doença humana, (por exemplo, SMN, distrofina, UGT1A1, OCA1, ou C1) ou uma variante funcional do referido polipeptídeo;
[00166] 35. O anelossomo ou método de qualquer uma das modalidades precedentes, em que o efetor compreende uma enzima que modifica covalentemente um substrato de molécula pequena, que é endógeno a uma célula humana (por exemplo uma uridina difosfato glucuronil-transferase por exemplo, UGT1A1; ou uma tirosinase, por exemplo, OCA1).
[00167] 36. O anelossomo ou método de qualquer uma das modalidades precedentes, em que o efetor compreende um polipeptídeo que é endógeno aos neurônios (por exemplo, SMN) ou células musculares (por exemplo distrofina), ou uma variante funcional do referido polipeptídeo).
[00168] 37. O anelossomo ou método de qualquer uma das modalidades precedentes, em que o efetor compreende uma proteína de complemento (por exemplo, C1).
[00169] 38. O anelossomo ou método de qualquer uma das modalidades precedentes, em que o elemento genético compreende pelo menos uma diferença (por exemplo, uma mutação, modificação química ou alteração epigenética) em relação a uma sequência do genoma de Anellovirus de tipo selvagem (por exemplo, como descrito no presente documento), por exemplo, uma inserção, substituição, modificação enzimática e/ou deleção, por exemplo, uma deleção de um domínio (por exemplo, um ou mais de uma caixa TATA, local cap, local de início transcricional, 5´ UTR, grelha de leitura aberta (ORF), sinal de poli(A) ou região rica em GC).
[00170] 39. O anelossomo ou método de qualquer uma das modalidades precedentes, em que o elemento genético compreende uma região compreendendo pelo menos 10, 15, 20, 25, 30, 31, 32, 33, 34, 35, ou 36 nucleotídeos consecutivos da sequência de ácidos nucleicos:
[00171] (i) CGCGCTGCGCGCGCCGCCCAGTAGGGGGAGCCATGC (SEQ ID NO: 160),
[00172] (ii) GCGCTX1CGCGCGCGCGCCGGGGGGCTGCGCCCCCCC (SEQ ID NO: 164), em que X1 é selecionado de T, G ou A;
[00173] (iii) GCGCTTCGCGCGCCGCCCACTAGGGGGCGTTGCGCG (SEQ ID NO: 165);
[00174] (iv) GCGCTGCGCGCGCCGCCCAGTAGGGGGCGCAATGCG (SEQ ID NO: 166);
[00175] (v) GCGCTGCGCGCGCGGCCCCCGGGGGAGGCATTGCCT (SEQ ID NO: 167);
[00176] (vi) GCGCTGCGCGCGCGCGCCGGGGGGGCGCCAGCGCCC (SEQ ID NO: 168);
[00177] (vii) GCGCTTCGCGCGCGCGCCGGGGGGCTCCGCCCCCCC (SEQ ID NO: 169);
[00178] (viii) GCGCTTCGCGCGCGCGCCGGGGGGCTGCGCCCCCCC (SEQ ID NO: 170);
[00179] (ix)
GCGCTACGCGCGCGCGCCGGGGGGCTGCGCCCCCCC (SEQ ID NO: 171); ou
[00180] (x) GCGCTACGCGCGCGCGCCGGGGGGCTCTGCCCCCCC (SEQ ID NO: 172);
[00181] ou uma sequência de ácidos nucleicos possuindo pelo menos 75, 76, 77, 78, 79, 80, 85, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99, ou 100% de identidade de sequências com a mesma.
[00182] 40. O anelossomo ou método de qualquer uma das modalidades precedentes, em que o elemento genético compreende uma sequência compreendendo pelo menos 20, 25, 30, 31, 32, 33, 34, 35, ou 36 nucleotídeos consecutivos possuindo um conteúdo de GC de pelo menos 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, ou 80,6%.
[00183] 41. O anelossomo ou método da modalidade 40, em que o elemento genético compreende pelo menos 20, 25, 30, 31, 32, 33, 34, 35, ou 36 nucleotídeos consecutivos possuindo um conteúdo de GC de pelo menos 80%.
[00184] 42. O anelossomo ou método da modalidade 40, em que o elemento genético compreende pelo menos 36 nucleotídeos consecutivos possuindo um conteúdo de GC de pelo menos 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, ou 80,6%.
[00185] 43. O anelossomo ou método da modalidade 40, em que o elemento genético compreende pelo menos 36 nucleotídeos consecutivos possuindo um conteúdo de GC de pelo menos 80%.
[00186] 1000. Um polipeptídeo, por exemplo, uma molécula ORF1, compreendendo uma ou mais de:
[00187] (a) uma primeira região compreendendo uma sequência de aminoácidos possuindo pelo menos 70% (por exemplo, pelo menos cerca de 70, 80, 90, 95, 96, 97, 98, 99, ou 100%) de identidade de sequências com uma sequência da região rica em arginina descrita no presente documento (por exemplo, MPYYYRRRRYNYRRPRWYGRGWIRRPFRRRFRRKRRVR (SEQ ID NO: 216) ou
MAWGWWKRRRRWWFRKRWTRGRLRRRWPRSARRRPRRRRVRR RRRWRRGRRKTRTYRRRRRFRRRGRK (SEQ ID NO: 186) ou como listado em qualquer uma das Tabelas A2, A4, A6, A8, A10, A12, C1-C5, 2, 4, 6, 8, 10, 12, 14, 16, 18, 20-37, ou D1-D10) ou uma sequência de pelo menos cerca de 40 aminoácidos compreendendo pelo menos 60%, 70% ou 80% de resíduos básicos (por exemplo, arginina, lisina ou uma sua combinação),
[00188] (b) uma segunda região compreendendo uma sequência de aminoácidos possuindo pelo menos 30% (por exemplo, pelo menos cerca de 30, 35, 40, 50, 60, 70, 80, 90, 95, 96, 97, 98, 99, ou 100%) de identidade de sequências com uma sequência da região jelly-roll descrita no presente documento (por exemplo,
PTYTTIPLKQWQPPYKRTCYIKGQDCLIYYSNLRLGMNSTMYEKSIVP VHWPGGGSFSVSMLTLDALYDIHKLCRNWWTSTNQDLPLVRYKGCK ITFYQSTFTDYIVRIHTELPANSNKLTYPNTHPLMMMMSKYKHIIPSRQ
TRRKKKPYTKIFVKPPPQFENKWYFATDLYKIPLLQIHCTACNLQNPF VKPDKLSNNVTLWSLNT (SEQ ID NO: 217) ou como listado em qualquer uma das Tabelas A2, A4, A6, A8, A10, A12, C1-C5, 2, 4, 6, 8, 10, 12, 14, 16, 18, 20-37, ou D1-D10) ou uma sequência compreendendo pelo menos 6 (por exemplo, pelo menos 6, 7, 8, 9, 10, 11 ou 12) fitas beta;
[00189] (c) uma terceira região compreendendo uma sequência de aminoácidos possuindo pelo menos 30% (por exemplo, pelo menos cerca de 30, 35, 40, 50, 60, 70, 80, 90, 95, 96, 97, 98, 99, ou 100%) de identidade de sequências com uma sequência do domínio N22 descrita no presente documento (por exemplo,
TMALTPFNEPIFTQIQYNPDRDTGEDTQLYLLSNATGTGWDPPGIPEL ILEGFPLWLIYWGFADFQKNLKKVTNIDTNYMLVAKTKFTQKPGTFYL
VILNDTFVEGNSPYEKQPLPEDNIKWYPQVQYQLEAQNKLLQTGPFT PNIQGQLSDNISMFYKFYFK (SEQ ID NO: 219) ou como listado em qualquer uma das Tabelas A2, A4, A6, A8, A10, A12, C1-C5, 2, 4, 6, 8, 10, 12, 14, 16, 18, 20-37, ou D1-D10); e
[00190] (d) uma quarta região compreendendo uma sequência de aminoácidos possuindo pelo menos 30% (por exemplo, pelo menos cerca de 30, 35, 40, 50, 60, 70, 80, 90, 95, 96, 97, 98, 99, ou 100%) de identidade de sequências com uma sequência do domínio C-terminal (CTD) de ORF1 de Anellovirus descrita no presente documento (por exemplo,
WGGSPPKAINVENPAHQIQYPIPRNEHETTSLQSPGEAPESILYSFDY
RHGNYTTTALSRISQDWALKDTVSKITEPDRQQLLKQALECLQISEET QEKKEKEVQQLISNLRQQQQLYRERIISLLKDQ (SEQ ID NO: 220) ou como listado em qualquer uma das Tabelas A2, A4, A6, A8, A10, A12, C1-C5, 2, 4, 6, 8, 10, 12, 14, 16, 18, 20-37, ou D1-D10);
[00191] em que a molécula ORF1 compreende pelo menos uma diferença (por exemplo, uma mutação, modificação química ou alteração epigenética) em relação a uma proteína ORF1 de tipo selvagem (por exemplo, como descrito no presente documento), por exemplo, uma inserção, substituição, modificação química ou enzimática e/ou deleção, por exemplo, uma deleção de um domínio (por exemplo, um ou mais de uma região rica em arginina, domínio de jelly- roll, HVR, N22 ou CTD, por exemplo, como descrito no presente documento).
[00192] 1000A. O polipeptídeo da modalidade 1000, em que as sequências de aminoácidos da região de (a), (b), (c) e (d) têm pelo menos 90% de identidade de sequências com suas respectivas referências.
[00193] 1001. O polipeptídeo da modalidade 1000, em que o polipeptídeo compreende:
[00194] (i) a primeira região e a segunda região;
[00195] (ii) a primeira região e a terceira região;
[00196] (iii) a primeira região e a quarta região;
[00197] (iv) a segunda região e a terceira região;
[00198] (v) a segunda região e a quarta região;
[00199] (vi) a segunda região e a quarta região;
[00200] (vii) a segunda região e a quarta região;
[00201] (viii) a segunda região e a quarta região;
[00202] (ix) a segunda região e a quarta região;
[00203] (x) a segunda região, a terceira região e a quarta região.
[00204] 1002. Um polipeptídeo, por exemplo, uma molécula ORF1, compreendendo:
[00205] (a) uma primeira região compreendendo uma sequência de aminoácidos possuindo pelo menos 70% (por exemplo, pelo menos cerca de 70, 80, 90, 95, 96, 97, 98, 99, ou 100%) de identidade de sequências com uma sequência da região rica em arginina descrita no presente documento (por exemplo, MPYYYRRRRYNYRRPRWYGRGWIRRPFRRRFRRKRRVR (SEQ ID NO: 216) ou
MAWGWWKRRRRWWFRKRWTRGRLRRRWPRSARRRPRRRRVRR RRRWRRGRRKTRTYRRRRRFRRRGRK (SEQ ID NO: 186) ou como listado em qualquer uma das Tabelas A2, A4, A6, A8, A10, A12, C1-C5, 2, 4, 6, 8, 10, 12, 14, 16, 18, 20-37, ou D1-D10) ou uma sequência de pelo menos cerca de 40 aminoácidos compreendendo pelo menos 60%, 70% ou 80% de resíduos básicos (por exemplo, arginina, lisina ou uma sua combinação),
[00206] (b) uma segunda região compreendendo uma sequência de aminoácidos possuindo pelo menos 30% (por exemplo, pelo menos cerca de 30, 35, 40, 50, 60, 70, 80, 90, 95, 96, 97, 98, 99, ou 100%) de identidade de sequências com uma sequência da região jelly-roll descrita no presente documento (por exemplo,
PTYTTIPLKQWQPPYKRTCYIKGQDCLIYYSNLRLGMNSTMYEKSIVP VHWPGGGSFSVSMLTLDALYDIHKLCRNWWTSTNQDLPLVRYKGCK ITFYQSTFTDYIVRIHTELPANSNKLTYPNTHPLMMMMSKYKHIIPSRQ
TRRKKKPYTKIFVKPPPQFENKWYFATDLYKIPLLQIHCTACNLQNPF VKPDKLSNNVTLWSLNT (SEQ ID NO: 217) ou como listado em qualquer uma das Tabelas A2, A4, A6, A8, A10, A12, C1-C5, 2, 4, 6, 8, 10, 12, 14, 16, 18, 20-37, ou D1-D10) ou uma sequência compreendendo pelo menos 6 fitas beta;
[00207] (c) uma terceira região compreendendo uma sequência de aminoácidos possuindo pelo menos 30% (por exemplo, pelo menos cerca de 30, 35, 40, 50, 60, 70, 80, 90, 95, 96, 97, 98, 99, ou 100%) de identidade de sequências com uma sequência do domínio N22 descrita no presente documento (por exemplo,
TMALTPFNEPIFTQIQYNPDRDTGEDTQLYLLSNATGTGWDPPGIPEL ILEGFPLWLIYWGFADFQKNLKKVTNIDTNYMLVAKTKFTQKPGTFYL
VILNDTFVEGNSPYEKQPLPEDNIKWYPQVQYQLEAQNKLLQTGPFT PNIQGQLSDNISMFYKFYFK (SEQ ID NO: 219) ou como listado em qualquer uma das Tabelas A2, A4, A6, A8, A10, A12, C1-C5, 2, 4, 6, 8, 10, 12, 14, 16, 18, 20-37, ou D1-D10); e
[00208] (d) uma quarta região compreendendo uma sequência de aminoácidos possuindo pelo menos 30% (por exemplo, pelo menos cerca de 30, 35, 40, 50, 60, 70, 80, 90, 95, 96, 97, 98, 99, ou 100%) de identidade de sequências com uma sequência do domínio C-terminal (CTD) de ORF1 de Anellovirus descrita no presente documento (por exemplo,
WGGSPPKAINVENPAHQIQYPIPRNEHETTSLQSPGEAPESILYSFDY RHGNYTTTALSRISQDWALKDTVSKITEPDRQQLLKQALECLQISEET
QEKKEKEVQQLISNLRQQQQLYRERIISLLKDQ (SEQ ID NO: 220) ou como listado em qualquer uma das Tabelas A2, A4, A6, A8, A10, A12, C1-C5, 2, 4, 6, 8, 10, 12, 14, 16, 18, 20-37, ou D1-D10);
[00209] em que a molécula ORF1 compreende pelo menos uma diferença (por exemplo, uma mutação, modificação química ou alteração epigenética) em relação a uma proteína ORF1 de tipo selvagem (por exemplo, como descrito no presente documento), por exemplo, uma inserção, substituição, modificação química ou enzimática e/ou deleção, por exemplo, uma deleção de um domínio (por exemplo, um ou mais de uma região rica em arginina, domínio de jelly- roll, HVR, N22 ou CTD, por exemplo, como descrito no presente documento).
[00210] 1002A. O polipeptídeo de acordo com a modalidade 1002, em que as sequências de aminoácidos da região (a), (b), (c) e (d) têm pelo menos 90% de identidade de sequências com suas respectivas referências.
[00211] 1003. O polipeptídeo de qualquer uma das modalidades precedentes, em que:
[00212] a primeira região compreende uma sequência de aminoácidos possuindo pelo menos 70% (por exemplo, pelo menos cerca de 70, 80, 90, 95, 96, 97, 98, 99, ou 100%) de identidade de sequências com os aminoácidos 1-38 da sequência de ORF1 listada na Tabela 16;
[00213] a segunda região compreende uma sequência de aminoácidos possuindo pelo menos 70% (por exemplo, pelo menos cerca de 70, 80, 90, 95, 96, 97, 98, 99, ou 100%) de identidade de sequências com os aminoácidos 39-246 da sequência de ORF1 listada na Tabela 16;
[00214] a terceira região compreende uma sequência de aminoácidos possuindo pelo menos 70% (por exemplo, pelo menos cerca de 70, 80, 90, 95, 96, 97, 98, 99, ou 100%) de identidade de sequências com os aminoácidos 375-537 da sequência de ORF1 listada na Tabela 16; e/ou
[00215] a quarta região compreende uma sequência de aminoácidos possuindo pelo menos 70% (por exemplo, pelo menos cerca de 70, 80, 90, 95, 96, 97, 98, 99, ou 100%) de identidade de sequências com os aminoácidos 538-666 da sequência de ORF1 listada na Tabela 16.
[00216] 1003A. O polipeptídeo de acordo com a modalidade 1003, em que as sequências de aminoácidos da primeira, segunda, terceira e quarta região têm pelo menos 90% de identidade de sequências com suas respectivas referências.
[00217] 1004. O polipeptídeo de qualquer uma das modalidades precedentes, em que:
[00218] a primeira região compreende uma sequência de aminoácidos possuindo pelo menos 70% (por exemplo, pelo menos cerca de 70, 80, 90, 95, 96, 97, 98, 99, ou 100%) de identidade de sequências com uma sequência da região rica em arginina como listado em qualquer uma das Tabelas A2, A4, A6, A8, A10, A12, C1-C5, 2, 4, 6, 8, 10, 12, 14, 16, 18, 20-37, ou D1-D10;
[00219] a segunda região compreende uma sequência de aminoácidos possuindo pelo menos 70% (por exemplo, pelo menos cerca de 70, 80, 90, 95, 96, 97, 98, 99, ou 100%) de identidade de sequências com uma sequência da região jelly-roll como listado em qualquer uma das Tabelas A2, A4, A6, A8, A10, A12, C1-C5, 2, 4, 6, 8, 10, 12, 14, 16, 18, 20-37, ou D1-D10;
[00220] a terceira região compreende uma sequência de aminoácidos possuindo pelo menos 70% (por exemplo, pelo menos cerca de 70, 80, 90, 95, 96, 97, 98, 99, ou 100%) de identidade de sequências com uma sequência do domínio N22 como listado em qualquer uma das Tabelas A2, A4, A6, A8, A10, A12, C1-C5, 2, 4, 6, 8,
10, 12, 14, 16, 18, 20-37, ou D1-D10;
[00221] a quarta região compreende uma sequência de aminoácidos possuindo pelo menos 70% (por exemplo, pelo menos cerca de 70, 80, 90, 95, 96, 97, 98, 99, ou 100%) de identidade de sequências com uma sequência de CTD como listado em qualquer uma das Tabelas A2, A4, A6, A8, A10, A12, C1-C5, 2, 4, 6, 8, 10, 12, 14, 16, 18, 20-37, ou D1- D10;
[00222] 1004A. O polipeptídeo de acordo com a modalidade 1004, em que as sequências de aminoácidos da primeira, segunda, terceira e quarta região têm pelo menos 90% de identidade de sequências com suas respectivas referências.
[00223] 1005. O polipeptídeo de qualquer uma das modalidades precedentes, em que o polipeptídeo compreende, na ordem do terminal N para o terminal C, a primeira região, a segunda região, a terceira região e a quarta região.
[00224] 1006. O polipeptídeo de qualquer uma das modalidades precedentes, em que a pelo menos uma diferença compreende pelo menos uma diferença na primeira região em relação à região rica em arginina de uma proteína ORF1 de tipo selvagem.
[00225] 1007. O polipeptídeo de qualquer uma das modalidades precedentes, em que a primeira região compreende uma região rica em arginina da proteína ORF1 de um Anellovirus sem ser o Anellovirus de tipo selvagem com o qual o polipeptídeo, ou a sua porção excluindo a primeira região, tem maior identidade de sequências.
[00226] 1008. O polipeptídeo de qualquer uma das modalidades precedentes, em que a primeira região compreende uma sequência de aminoácidos possuindo pelo menos 70% de identidade de sequências com a região rica em arginina de um Anellovirus sem ser o Anellovirus de tipo selvagem com o qual o polipeptídeo tem maior identidade de sequências.
[00227] 1009. O polipeptídeo de qualquer uma das modalidades precedentes, em que a primeira região compreende um polipeptídeo que tem menos do que 15% (por exemplo, menos do que 15%, 14%, 13%, 12%, 11%, 10%, 9%, 8%, 7%, 6%, 5%, 4%, 3%, 2%, ou 1%) de identidade de sequências com um genoma de Anellovirus de tipo selvagem (por exemplo, como descrito no presente documento) ou uma sua porção possuindo o mesmo comprimento de aminoácidos que a primeira região.
[00228] 1010. O polipeptídeo de qualquer uma das modalidades precedentes, em que a primeira região tem atividade de ligação ao DNA e/ou atividade de localização nuclear.
[00229] 1011. O polipeptídeo de qualquer uma das modalidades precedentes, em que a primeira região compreende uma região de ligação ao DNA e/ou uma sequência de localização nuclear.
[00230] 1012. O polipeptídeo de qualquer uma das modalidades precedentes, em que a pelo menos uma diferença compreende pelo menos uma diferença na segunda região em relação à região de jelly- roll de uma proteína ORF1 de tipo selvagem.
[00231] 1013. O polipeptídeo de qualquer uma das modalidades precedentes, em que a segunda região compreende uma região de jelly- roll da proteína ORF1 de um Anellovirus sem ser o Anellovirus de tipo selvagem com o qual o polipeptídeo, ou a sua porção excluindo a segunda região, tem maior identidade de sequências.
[00232] 1014. O polipeptídeo de qualquer uma das modalidades precedentes, em que a segunda região compreende uma sequência de aminoácidos possuindo pelo menos 70% de identidade de sequências com a região de jelly-roll de um Anellovirus sem ser o Anellovirus de tipo selvagem com o qual o polipeptídeo tem maior identidade de sequências.
[00233] 1015. O polipeptídeo de qualquer uma das modalidades precedentes, em que a segunda região compreende um polipeptídeo que tem menos do que 15% (por exemplo, menos do que 15%, 14%, 13%, 12%, 11%, 10%, 9%, 8%, 7%, 6%, 5%, 4%, 3%, 2%, ou 1%) de identidade de sequências com um genoma de Anellovirus de tipo selvagem (por exemplo, como descrito no presente documento) ou uma sua porção possuindo o mesmo comprimento de aminoácidos que a segunda região.
[00234] 1016. O polipeptídeo de qualquer uma das modalidades precedentes, em que a pelo menos uma diferença compreende pelo menos uma diferença na terceira região em relação ao domínio N22 de uma proteína ORF1 de tipo selvagem.
[00235] 1017. O polipeptídeo de qualquer uma das modalidades precedentes, em que a terceira região compreende um domínio N22 da proteína ORF1 de um Anellovirus sem ser o Anellovirus de tipo selvagem com o qual o polipeptídeo, ou a sua porção excluindo a terceira região, tem maior identidade de sequências.
[00236] 1018. O polipeptídeo de qualquer uma das modalidades precedentes, em que a terceira região compreende uma sequência de aminoácidos possuindo pelo menos 70% de identidade de sequências com a região N22 de um Anellovirus sem ser o Anellovirus de tipo selvagem com o qual o polipeptídeo tem maior identidade de sequências.
[00237] 1019. O polipeptídeo de qualquer uma das modalidades precedentes, em que a terceira região compreende um polipeptídeo que tem menos do que 15% (por exemplo, menos do que 15%, 14%, 13%, 12%, 11%, 10%, 9%, 8%, 7%, 6%, 5%, 4%, 3%, 2%, ou 1%) de identidade de sequências com um genoma de Anellovirus de tipo selvagem (por exemplo, como descrito no presente documento) ou uma sua porção possuindo o mesmo comprimento de aminoácidos que a terceira região.
[00238] 1020. O polipeptídeo de qualquer uma das modalidades precedentes, em que a pelo menos uma diferença compreende pelo menos uma diferença na quarta região em relação ao domínio CTD de uma proteína ORF1 de tipo selvagem.
[00239] 1021. O polipeptídeo de qualquer uma das modalidades precedentes, em que a quarta região compreende um domínio CTD da proteína ORF1 de um Anellovirus sem ser o Anellovirus de tipo selvagem com o qual o polipeptídeo, ou a sua porção excluindo a quarta região, tem maior identidade de sequências.
[00240] 1022. O polipeptídeo de qualquer uma das modalidades precedentes, em que a quarta região compreende uma sequência de aminoácidos possuindo pelo menos 70% de identidade de sequências com a região CTD de um Anellovirus sem ser o Anellovirus de tipo selvagem com o qual o polipeptídeo tem maior identidade de sequências.
[00241] 1023. O polipeptídeo de qualquer uma das modalidades precedentes, em que a quarta região compreende um polipeptídeo que tem menos do que 15% (por exemplo, menos do que 15%, 14%, 13%, 12%, 11%, 10%, 9%, 8%, 7%, 6%, 5%, 4%, 3%, 2%, ou 1%) de identidade de sequências com um genoma de Anellovirus de tipo selvagem (por exemplo, como descrito no presente documento) ou uma sua porção possuindo o mesmo comprimento de aminoácidos que a quarta região.
[00242] 1024. O polipeptídeo de qualquer uma das modalidades precedentes, compreendendo ainda uma sequência de aminoácidos, por exemplo, uma sequência de região hipervariável (HVR) (por exemplo, a sequência de HVR de uma molécula ORF1 de Anellovirus, por exemplo, como descrito no presente documento), em que a sequência de aminoácidos compreende pelo menos cerca de 55 (por exemplo, pelo menos cerca de 45, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59,
60, ou 65) aminoácidos (por exemplo, cerca de 45-160, 50-160, 55-160, 60-160, 45-150, 50-150, 55-150, 60-150, 45-140, 50-140, 55-140, ou 60- 140 aminoácidos).
[00243] 1025. O polipeptídeo da modalidade 1024, em que a sequência de HVR está posicionada entre a segunda região e a terceira região.
[00244] 1026. O polipeptídeo da modalidade 1024 ou 1025, em que a sequência de HVR compreende uma sequência de aminoácidos possuindo pelo menos 70% (por exemplo, pelo menos cerca de 70, 80, 90, 95, 96, 97, 98, 99, ou 100%) de identidade de sequências com a HVR de um Anellovirus sem ser o Anellovirus de tipo selvagem com o qual a proteína ORF1 tem maior identidade de sequências.
[00245] 1027. O polipeptídeo de qualquer uma das modalidades 1024-1026, em que a sequência de HVR é heteróloga em relação a uma ou mais da primeira região, segunda região, terceira região e/ou quarta região.
[00246] 1028. O polipeptídeo de qualquer uma das modalidades 1024-1027, em que a pelo menos uma diferença compreende pelo menos uma diferença na sequência de HVR em relação à sequência de uma HVR de uma proteína ORF1 de tipo selvagem (por exemplo, de um genoma de Anellovirus de tipo selvagem, por exemplo, como descrito no presente documento).
[00247] 1029. O polipeptídeo de qualquer uma das modalidades 1024-1028, em que a sequência de HVR compreende uma HVR da proteína ORF1 de um Anellovirus sem ser o Anellovirus de tipo selvagem com o qual o polipeptídeo, ou a sua porção excluindo a sequência de HVR, tem maior identidade de sequências.
[00248] 1030. O polipeptídeo de qualquer uma das modalidades 1024-1029, em que a sequência de HVR compreende uma sequência de aminoácidos possuindo pelo menos 70% de identidade de sequências com a HVR de um Anellovirus sem ser o Anellovirus de tipo selvagem com o qual o polipeptídeo tem maior identidade de sequências.
[00249] 1031. O polipeptídeo de qualquer uma das modalidades 1024-1030, em que a HVR compreende uma sequência de aminoácidos possuindo pelo menos 70% (por exemplo, pelo menos cerca de 70, 80, 90, 95, 96, 97, 98, 99, ou 100%) de identidade de sequências com a sequência de HVR como listado em qualquer uma das Tabelas A2, A4, A6, A8, A10, A12, C1-C5, 2, 4, 6, 8, 10, 12, 14, 16, 18, 20-37, ou D1- D10;
[00250] 1032. O polipeptídeo de qualquer uma das modalidades 1024-1031, em que a sequência de HVR compreende pelo menos 70% (por exemplo, pelo menos cerca de 70, 80, 90, 95, 96, 97, 98, 99, ou 100%) de identidade de sequências com os aminoácidos 247-374 da sequência de ORF1 listada na Tabela 16.
[00251] 1033. O polipeptídeo de qualquer uma das modalidades precedentes, compreendendo ainda um polipeptídeo heterólogo, por exemplo, um polipeptídeo que é heterólogo em relação a um ou mais da primeira região, segunda região, terceira região e/ou quarta região e/ou é exógeno em relação a um anelossomo compreendendo o polipeptídeo.
[00252] 1034. O polipeptídeo da modalidade 1033, em que o polipeptídeo carece de uma sequência de HVR de Anellovirus.
[00253] 1035. O polipeptídeo da modalidade 1033, em que o polipeptídeo heterólogo está presente no exterior do anelossomo.
[00254] 1036. O polipeptídeo da modalidade 1033, em que o polipeptídeo heterólogo está presente no interior do anelossomo.
[00255] 1037. O polipeptídeo de qualquer uma das modalidades 1033-1036, em que o polipeptídeo heterólogo tem uma funcionalidade que é exógena ao anelossomo ou um Anellovirus de tipo selvagem.
[00256] 1038. O polipeptídeo de qualquer uma das modalidades 1033-1037, em que o polipeptídeo heterólogo consiste em cerca de 140 ou menos aminoácidos (por exemplo, 100, 110, 120, 125, 130, 135, 136, 137, 138, 139, 140, 145, 150, 155, ou 160 ou menos aminoácidos).
[00257] 1039. O polipeptídeo de qualquer uma das modalidades 1033-1038, em que o tamanho do polipeptídeo heterólogo é entre 50- 150% em relação a uma região HVR de tipo selvagem de um Anellovirus, por exemplo, como descrito no presente documento.
[00258] 1039A. O polipeptídeo de qualquer uma das modalidades 1033-1039, em que o polipeptídeo heterólogo está posicionado entre a segunda região e a terceira região.
[00259] 1040. O polipeptídeo de qualquer uma das modalidades precedentes, compreendendo ainda um ou mais aminoácidos entre a primeira região e a segunda região, um ou mais aminoácidos entre a segunda região e a terceira região e/ou um ou mais aminoácidos entre a terceira região e a quarta região.
[00260] 1041. O polipeptídeo de qualquer uma das modalidades precedentes, compreendendo ainda um ou mais aminoácidos posicionados N-terminal em relação à primeira região.
[00261] 1042. O polipeptídeo de qualquer uma das modalidades precedentes, compreendendo ainda um ou mais aminoácidos posicionados C-terminal em relação à quarta região.
[00262] 1043. O polipeptídeo de qualquer uma das modalidades precedentes, compreendendo uma pluralidade de subsequências de pelo menos quatro (por exemplo, 4, 5, 6, 7, 8, 9, 10, 15, 20, 25, ou 30) aminoácidos contíguos possuindo 100% de identidade de sequências com as subsequências correspondentes de uma sequência de aminoácidos de ORF1 de Anellovirus de tipo selvagem, por exemplo, como listado em qualquer uma das Tabelas A2, A4, A6, A8, A10, A12, C1-C5, 2, 4, 6, 8, 10, 12, 14, 16, 18, 20-37, ou D1-D10.
[00263] 1044. O polipeptídeo de qualquer uma das modalidades precedentes, compreendendo uma pluralidade de subsequências de pelo menos dez (por exemplo, 10, 15, 20, 25, 30, 40 ou 50) aminoácidos contíguos possuindo pelo menos 80% de identidade de sequências com as subsequências correspondentes de uma sequência de aminoácidos de ORF1 de Anellovirus de tipo selvagem, por exemplo, como listado em qualquer uma das Tabelas A2, A4, A6, A8, A10, A12, C1-C5, 2, 4, 6, 8, 10, 12, 14, 16, 18, 20-37, ou D1-D10.
[00264] 1045. O polipeptídeo de qualquer uma das modalidades precedentes, compreendendo uma pluralidade de subsequências de pelo menos vinte (por exemplo, 20, 25, 30, 40, 50, 60, 70, 80, 90, ou 100) aminoácidos contíguos possuindo pelo menos 60% de identidade de sequências com as subsequências correspondentes de uma sequência de aminoácidos de ORF1 de Anellovirus de tipo selvagem, por exemplo, como listado em qualquer uma das Tabelas A2, A4, A6, A8, A10, A12, C1-C5, 2, 4, 6, 8, 10, 12, 14, 16, 18, 20-37, ou D1-D10.
[00265] 1046. O polipeptídeo de qualquer uma das modalidades 1043-1045, em que a pluralidade de subsequências está posicionada dentro da primeira região, segunda região, terceira região e/ou quarta região.
[00266] 1047. O polipeptídeo de qualquer uma das modalidades precedentes, em que a primeira região compreende pelo menos cerca de 40 aminoácidos (por exemplo, pelo menos cerca de 50, 60, 70, 80, 90 ou 100 aminoácidos, por exemplo, cerca de 40-100, 40-90, 40-80, 40-70, 50-100, 50-70, 60-100, 60-90, 60-80, ou 60-70 aminoácidos).
[00267] 1048. O polipeptídeo de qualquer uma das modalidades precedentes, em que a primeira região compreende pelo menos cerca de 70% (por exemplo, pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95% ou 100%) de resíduos básicos (por exemplo, arginina, lisina ou uma sua combinação).
[00268] 1049. O polipeptídeo de qualquer uma das modalidades precedentes, em que a primeira região compreende pelo menos cerca de 70% (por exemplo, pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95% ou 100%) de resíduos de arginina.
[00269] 1050. O polipeptídeo de qualquer uma das modalidades precedentes, em que o polipeptídeo forma homomultímeros com cópias adicionais do polipeptídeo.
[00270] 1051. O polipeptídeo da modalidade 1050, em que a primeira região se liga às primeiras regiões correspondentes em cópias adicionais do polipeptídeo.
[00271] 1052. O polipeptídeo da modalidade 1050, em que os homomultímeros formam um capsídeo, por exemplo, encapsulando um ácido nucleico, por exemplo, um elemento genético ou um genoma de Anellovirus ou uma sua porção.
[00272] 1053. O polipeptídeo de qualquer uma das modalidades precedentes, em que o polipeptídeo é uma proteína de capsídeo ou pode formar uma porção de um capsídeo.
[00273] 1054. O polipeptídeo de qualquer uma das modalidades precedentes, em que o polipeptídeo tem atividade de replicase.
[00274] 1055. O polipeptídeo de qualquer uma das modalidades precedentes, em que o polipeptídeo se liga a um ácido nucleico (por exemplo, DNA).
[00275] 1056. Um complexo compreendendo:
[00276] (a) o polipeptídeo de qualquer uma das modalidades precedentes e
[00277] (b) um elemento genético compreendendo um elemento promotor e uma sequência de ácidos nucleicos (por exemplo, uma sequência de DNA) codificando um efetor (por exemplo, um efetor exógeno ou um efetor endógeno) e uma sequência de ligação à proteína.
[00278] 1057. Um complexo compreendendo:
[00279] (a) uma molécula ORF1 e
[00280] (b) um elemento genético compreendendo um elemento promotor e uma sequência de ácidos nucleicos (por exemplo, uma sequência de DNA) codificando um efetor (por exemplo, um efetor exógeno ou um efetor endógeno) e uma sequência de ligação à proteína;
[00281] em que a molécula ORF1 está ligada ao (por exemplo, não covalentemente ligada ao) elemento genético,
[00282] em que a molécula ORF1, o elemento genético ou tanto a molécula ORF1 como o elemento genético compreendem pelo menos uma diferença (por exemplo, uma mutação, modificação química ou alteração epigenética) em relação a uma proteína ORF1 de tipo selvagem, genoma de Anellovirus de tipo selvagem ou tanto a proteína ORF1 de tipo selvagem como o genoma de Anellovirus de tipo selvagem, respectivamente (por exemplo, como descrito no presente documento), por exemplo, uma inserção, substituição, modificação química ou enzimática e/ou deleção, por exemplo, uma deleção de um domínio (por exemplo, um ou mais de uma região rica em arginina, domínio jelly-roll, HVR, N22 ou CTD, por exemplo, como descrito no presente documento) ou região genômica (por exemplo, um ou mais de uma caixa TATA, local cap, local de início transcricional, 5´ UTR, grelha de leitura aberta (ORF), sinal de poli(A) ou região rica em GC, por exemplo, como descrito no presente documento).
[00283] 1058. O complexo da modalidade 1056 ou 1057, em que o complexo está in vitro, por exemplo, em que o complexo está em uma composição substancialmente isenta de células.
[00284] 1059. O complexo de qualquer uma das modalidades 1056- 1058, em que o complexo está em uma célula, por exemplo, uma célula hospedeira, por exemplo, uma célula ajudante, por exemplo, no núcleo da célula.
[00285] 1060. O complexo de qualquer uma das modalidades 1056- 1059, em que a molécula ORF1 é parte de um exterior proteináceo.
[00286] 1061. O complexo de qualquer uma das modalidades 1056- 1060, em que o elemento genético está passando por replicação.
[00287] 1062. O complexo de qualquer uma das modalidades 1056- 1061, em que o complexo está em um anelossomo.
[00288] 1063. O complexo de qualquer uma das modalidades 1056- 1062, em que o elemento genético compreende ainda uma sequência de ácidos nucleicos codificando o polipeptídeo.
[00289] 1064. O complexo de qualquer uma das modalidades 1056- 1063, em que o elemento genético não compreende uma sequência de ácidos nucleicos codificando o polipeptídeo.
[00290] 1065. O complexo de qualquer uma das modalidades 1056- 1064, em que o elemento genético compreende uma região rica em GC, por exemplo, como descrito no presente documento.
[00291] 1066. O complexo da modalidade 1065, em que a região rica em GC compreende pelo menos 10, 15, 20, 25, 30, 31, 32, 33, 34, 35, ou 36 nucleotídeos consecutivos da sequência de ácidos nucleicos de qualquer uma de:
[00292] (i) CGCGCTGCGCGCGCCGCCCAGTAGGGGGAGCCATGC (SEQ ID NO: 160),
[00293] (ii) GCGCTX1CGCGCGCGCGCCGGGGGGCTGCGCCCCCCC (SEQ ID NO:164), em que X1 é selecionado de T, G ou A;
[00294] (iii) GCGCTTCGCGCGCCGCCCACTAGGGGGCGTTGCGCG (SEQ ID NO: 165);
[00295] (iv) GCGCTGCGCGCGCCGCCCAGTAGGGGGCGCAATGCG (SEQ ID
NO: 166);
[00296] (v) GCGCTGCGCGCGCGGCCCCCGGGGGAGGCATTGCCT (SEQ ID NO: 167);
[00297] (vi) GCGCTGCGCGCGCGCGCCGGGGGGGCGCCAGCGCCC (SEQ ID NO: 168);
[00298] (vii) GCGCTTCGCGCGCGCGCCGGGGGGCTCCGCCCCCCC (SEQ ID NO: 169);
[00299] (viii) GCGCTTCGCGCGCGCGCCGGGGGGCTGCGCCCCCCC (SEQ ID NO: 170);
[00300] (ix) GCGCTACGCGCGCGCGCCGGGGGGCTGCGCCCCCCC (SEQ ID NO: 171); ou
[00301] (x) GCGCTACGCGCGCGCGCCGGGGGGCTCTGCCCCCCC (SEQ ID NO: 172);
[00302] ou uma sequência de ácidos nucleicos possuindo pelo menos 75, 76, 77, 78, 79, 80, 85, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99, ou 100% de identidade de sequências com a mesma.
[00303] 1067. Um anelossomo compreendendo:
[00304] (a) um exterior proteináceo;
[00305] (b) o polipeptídeo ou complexo de qualquer uma das modalidades precedentes;
[00306] (c) um elemento genético compreendendo um elemento promotor operacionalmente ligado a uma sequência de ácidos nucleicos (por exemplo, uma sequência de DNA) codificando um efetor (por exemplo, um efetor endógeno ou um efetor exógeno, por exemplo,
como descrito no presente documento); e
[00307] em que o elemento genético está encerrado dentro do exterior proteináceo.
[00308] 1068. Um anelossomo compreendendo:
[00309] (a) um exterior proteináceo;
[00310] (b) um elemento genético compreendendo:
[00311] (i) um elemento promotor operacionalmente ligado a uma sequência de ácidos nucleicos (por exemplo, uma sequência de DNA) codificando um efetor (por exemplo, um efetor endógeno ou um efetor exógeno, por exemplo, como descrito no presente documento) e
[00312] (ii) um ácido nucleico codificando o polipeptídeo de qualquer uma das modalidades precedentes; e
[00313] em que o elemento genético está encerrado dentro do exterior proteináceo.
[00314] 1069. Um anelossomo compreendendo:
[00315] (a) um exterior proteináceo;
[00316] (b) uma molécula ORF1 ou um ácido nucleico codificando a molécula ORF1;
[00317] (c) um elemento genético compreendendo um elemento promotor operacionalmente ligado a uma sequência de ácidos nucleicos heteróloga (por exemplo, uma sequência de DNA) codificando um efetor; e
[00318] em que o elemento genético está encerrado dentro do exterior proteináceo.
[00319] 1070. Um anelossomo compreendendo:
[00320] (a) um exterior proteináceo;
[00321] (b) uma molécula ORF1 ou um ácido nucleico codificando a molécula ORF1;
[00322] (c) um elemento genético compreendendo um elemento promotor, uma sequência de ácidos nucleicos (por exemplo, uma sequência de DNA) codificando um efetor (por exemplo, um efetor exógeno ou um efetor endógeno) e uma região compreendendo pelo menos 10, 15, 20, 25, 30, 31, 32, 33, 34, 35, ou 36 nucleotídeos consecutivos da sequência de ácidos nucleicos:
[00323] (i) CGCGCTGCGCGCGCCGCCCAGTAGGGGGAGCCATGC (SEQ ID NO: 160),
[00324] (ii) GCGCTX1CGCGCGCGCGCCGGGGGGCTGCGCCCCCCC (SEQ ID NO: 164), em que X1 é selecionado de T, G ou A;
[00325] (iii) GCGCTTCGCGCGCCGCCCACTAGGGGGCGTTGCGCG (SEQ ID NO: 165);
[00326] (iv) GCGCTGCGCGCGCCGCCCAGTAGGGGGCGCAATGCG (SEQ ID NO: 166);
[00327] (v) GCGCTGCGCGCGCGGCCCCCGGGGGAGGCATTGCCT (SEQ ID NO: 167);
[00328] (vi) GCGCTGCGCGCGCGCGCCGGGGGGGCGCCAGCGCCC (SEQ ID NO: 168);
[00329] (vii) GCGCTTCGCGCGCGCGCCGGGGGGCTCCGCCCCCCC (SEQ ID NO: 169);
[00330] (viii) GCGCTTCGCGCGCGCGCCGGGGGGCTGCGCCCCCCC (SEQ ID NO: 170);
[00331] (ix) GCGCTACGCGCGCGCGCCGGGGGGCTGCGCCCCCCC (SEQ ID
NO: 171); ou
[00332] (x) GCGCTACGCGCGCGCGCCGGGGGGCTCTGCCCCCCC (SEQ ID NO: 172);
[00333] ou uma sequência de ácidos nucleicos possuindo pelo menos 75, 76, 77, 78, 79, 80, 85, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99, ou 100% de identidade de sequências com a mesma; e
[00334] em que o elemento genético compreende pelo menos uma diferença (por exemplo, uma mutação, modificação química ou alteração epigenética) em relação a uma sequência do genoma de Anellovirus de tipo selvagem (por exemplo, como descrito no presente documento), por exemplo, uma inserção, substituição, modificação enzimática e/ou deleção, por exemplo, uma deleção de um domínio (por exemplo, um ou mais de uma caixa TATA, local cap, local de início transcricional, 5´ UTR, grelha de leitura aberta (ORF), sinal de poli(A) ou região rica em GC);
[00335] em que o elemento genético está encerrado dentro do exterior proteináceo; e
[00336] em que o anelossomo é configurado para entregar o elemento genético em uma célula eucariótica; e, opcionalmente, em que o elemento genético:
[00337] (i) não compreende uma deleção dos nucleotídeos 3436 a 3607 em relação a uma sequência do genoma de TTV-tth8 de tipo selvagem, por exemplo, como descrito no presente documento;
[00338] (ii) não compreende uma deleção dos nucleotídeos 1432 a 2210 em relação a uma sequência do genoma de TTMV-LY2 de tipo selvagem, por exemplo, como descrito no presente documento; e/ou
[00339] (iii) não compreende uma deleção de pelo menos 101 nucleotídeos em relação a uma sequência do genoma de TTMV-LY2 de tipo selvagem, por exemplo, como descrito no presente documento.
[00340] 1071. Um anelossomo compreendendo:
[00341] (a) um exterior proteináceo;
[00342] (b) uma molécula ORF1 ou um ácido nucleico codificando a molécula ORF1;
[00343] (c) um elemento genético compreendendo um elemento promotor, uma sequência de ácidos nucleicos (por exemplo, uma sequência de DNA) codificando um efetor (por exemplo, um efetor exógeno ou um efetor endógeno) e uma sequência compreendendo pelo menos 20 (por exemplo, pelo menos 20, 25, 30, 31, 32, 33, 34, 35, ou 36) nucleotídeos consecutivos possuindo um conteúdo de GC de pelo menos 70% (por exemplo, 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, ou 80,6%);
[00344] em que o elemento genético compreende pelo menos uma diferença (por exemplo, uma mutação, modificação química ou alteração epigenética) em relação a uma sequência do genoma de Anellovirus de tipo selvagem (por exemplo, como descrito no presente documento), por exemplo, uma inserção, substituição, modificação enzimática e/ou deleção, por exemplo, uma deleção de um domínio (por exemplo, um ou mais de uma caixa TATA, local cap, local de início transcricional, 5´ UTR, grelha de leitura aberta (ORF), sinal de poli(A) ou região rica em GC);
[00345] em que o elemento genético está encerrado dentro do exterior proteináceo; e
[00346] em que o anelossomo é configurado para entregar o elemento genético em uma célula eucariótica; e
[00347] opcionalmente em que o elemento genético:
[00348] (i) não compreende uma deleção dos nucleotídeos 3436 a 3607 em relação a uma sequência do genoma de TTV-tth8 de tipo selvagem, por exemplo, como descrito no presente documento;
[00349] (ii) não compreende uma deleção dos nucleotídeos 1432 a
2210 em relação a uma sequência do genoma de TTMV-LY2 de tipo selvagem, por exemplo, como descrito no presente documento; e/ou
[00350] (iii) não compreende uma deleção de pelo menos 101 nucleotídeos em relação a uma sequência do genoma de TTMV-LY2 de tipo selvagem, por exemplo, como descrito no presente documento.
[00351] 1072. Um anelossomo compreendendo:
[00352] (a) um exterior proteináceo;
[00353] (b) uma molécula ORF1 ou um ácido nucleico codificando a molécula ORF1;
[00354] em que:
[00355] (i) pelo menos 30% (por exemplo, pelo menos 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 90% ou mais) dos aminoácidos da molécula ORF1 são parte de uma fita β;
[00356] (ii) a estrutura secundária da molécula ORF1 compreende pelo menos três (por exemplo, pelo menos 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, ou 20) fitas β;
[00357] (iii) a estrutura secundária da molécula ORF1 compreende uma razão entre fitas β e hélices α de pelo menos 1:1, 2:1, 3:1, 4:1, 5:1, 6:1, 7:1, 8:1, 9:1, ou 10:1; e
[00358] (c) um elemento genético compreendendo um elemento promotor, uma sequência de ácidos nucleicos (por exemplo, uma sequência de DNA) codificando um efetor (por exemplo, um efetor exógeno ou um efetor endógeno) e uma sequência de ligação à proteína;
[00359] em que o elemento genético compreende pelo menos uma diferença (por exemplo, uma mutação, modificação química ou alteração epigenética) em relação a uma sequência do genoma de Anellovirus de tipo selvagem (por exemplo, como descrito no presente documento), por exemplo, uma inserção, substituição, modificação enzimática e/ou deleção, por exemplo, uma deleção de um domínio (por exemplo, um ou mais de uma caixa TATA, local cap, local de início transcricional, 5´ UTR, grelha de leitura aberta (ORF), sinal de poli(A) ou região rica em GC);
[00360] em que o elemento genético está encerrado dentro do exterior proteináceo; e
[00361] em que o anelossomo é configurado para entregar o elemento genético em uma célula eucariótica; e
[00362] opcionalmente em que o elemento genético:
[00363] (i) não compreende uma deleção dos nucleotídeos 3436 a 3607 em relação a uma sequência do genoma de TTV-tth8 de tipo selvagem, por exemplo, como descrito no presente documento;
[00364] (ii) não compreende uma deleção dos nucleotídeos 1432 a 2210 em relação a uma sequência do genoma de TTMV-LY2 de tipo selvagem, por exemplo, como descrito no presente documento; e/ou
[00365] (iii) não compreende uma deleção de pelo menos 101 nucleotídeos em relação a uma sequência do genoma de TTMV-LY2 de tipo selvagem, por exemplo, como descrito no presente documento.
[00366] 1073. Um anelossomo compreendendo:
[00367] (a) um exterior proteináceo;
[00368] (b) uma molécula ORF1 ou um ácido nucleico codificando a molécula ORF1;
[00369] (c) um elemento genético compreendendo um elemento promotor e uma sequência de ácidos nucleicos (por exemplo, uma sequência de DNA) codificando um efetor (por exemplo, um efetor exógeno ou um efetor endógeno) e uma sequência de ligação à proteína;
[00370] em que o elemento genético compreende pelo menos uma diferença (por exemplo, uma mutação, modificação química ou alteração epigenética) em relação a uma sequência do genoma de Anellovirus de tipo selvagem (por exemplo, como descrito no presente documento), por exemplo, uma inserção, substituição, modificação enzimática e/ou deleção, por exemplo, uma deleção de um domínio (por exemplo, um ou mais de uma caixa TATA, local cap, local de início transcricional, 5´ UTR, grelha de leitura aberta (ORF), sinal de poli(A) ou região rica em GC);
[00371] em que o elemento genético está encerrado dentro do exterior proteináceo; e
[00372] em que o anelossomo é configurado para entregar o elemento genético em uma célula eucariótica; e
[00373] opcionalmente em que o elemento genético:
[00374] (i) não compreende uma deleção dos nucleotídeos 3436 a 3607 em relação a uma sequência do genoma de TTV-tth8 de tipo selvagem, por exemplo, como descrito no presente documento;
[00375] (ii) não compreende uma deleção dos nucleotídeos 1432 a 2210 em relação a uma sequência do genoma de TTMV-LY2 de tipo selvagem, por exemplo, como descrito no presente documento; e/ou
[00376] (iii) não compreende uma deleção de pelo menos 101 nucleotídeos em relação a uma sequência do genoma de TTMV-LY2 de tipo selvagem, por exemplo, como descrito no presente documento.
[00377] 1074. Um anelossomo compreendendo:
[00378] (a) um exterior proteináceo;
[00379] (b) um elemento genético compreendendo um elemento promotor, uma sequência de ácidos nucleicos (por exemplo, uma sequência de DNA) codificando um efetor (por exemplo, um efetor exógeno ou um efetor endógeno) e uma região compreendendo pelo menos 10, 15, 20, 25, 30, 31, 32, 33, 34, 35, ou 36 nucleotídeos consecutivos da sequência de ácidos nucleicos:
[00380] (i) CGCGCTGCGCGCGCCGCCCAGTAGGGGGAGCCATGC (SEQ ID NO: 160),
[00381] (ii) GCGCTX1CGCGCGCGCGCCGGGGGGCTGCGCCCCCCC (SEQ ID NO: 164), em que X1 é selecionado de T, G ou A;
[00382] (iii) GCGCTTCGCGCGCCGCCCACTAGGGGGCGTTGCGCG (SEQ ID NO: 165);
[00383] (iv) GCGCTGCGCGCGCCGCCCAGTAGGGGGCGCAATGCG (SEQ ID NO: 166);
[00384] (v) GCGCTGCGCGCGCGGCCCCCGGGGGAGGCATTGCCT (SEQ ID NO: 167);
[00385] (vi) GCGCTGCGCGCGCGCGCCGGGGGGGCGCCAGCGCCC (SEQ ID NO: 168);
[00386] (vii) GCGCTTCGCGCGCGCGCCGGGGGGCTCCGCCCCCCC (SEQ ID NO: 169);
[00387] (viii) GCGCTTCGCGCGCGCGCCGGGGGGCTGCGCCCCCCC (SEQ ID NO: 170);
[00388] (ix) GCGCTACGCGCGCGCGCCGGGGGGCTGCGCCCCCCC (SEQ ID NO: 171); ou
[00389] (x) GCGCTACGCGCGCGCGCCGGGGGGCTCTGCCCCCCC (SEQ ID NO: 172);
[00390] ou uma sequência de ácidos nucleicos possuindo pelo menos 75, 76, 77, 78, 79, 80, 85, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99, ou 100% de identidade de sequências com a mesma; e
[00391] em que o elemento genético compreende pelo menos uma diferença (por exemplo, uma mutação, modificação química ou alteração epigenética) em relação a uma sequência do genoma de Anellovirus de tipo selvagem (por exemplo, como descrito no presente documento), por exemplo, uma inserção, substituição, modificação enzimática e/ou deleção, por exemplo, uma deleção de um domínio (por exemplo, um ou mais de uma caixa TATA, local cap, local de início transcricional, 5´ UTR, grelha de leitura aberta (ORF), sinal de poli(A) ou região rica em GC);
[00392] em que o elemento genético está encerrado dentro do exterior proteináceo; e
[00393] em que o anelossomo é configurado para entregar o elemento genético em uma célula eucariótica; e
[00394] opcionalmente, em que o elemento genético:
[00395] (i) não compreende uma deleção dos nucleotídeos 3436 a 3607 em relação a uma sequência do genoma de TTV-tth8 de tipo selvagem, por exemplo, como descrito no presente documento;
[00396] (ii) não compreende uma deleção dos nucleotídeos 1432 a 2210 em relação a uma sequência do genoma de TTMV-LY2 de tipo selvagem, por exemplo, como descrito no presente documento; e/ou
[00397] (iii) não compreende uma deleção de pelo menos 101 nucleotídeos em relação a uma sequência do genoma de TTMV-LY2 de tipo selvagem, por exemplo, como descrito no presente documento.
[00398] 1075. Um anelossomo compreendendo:
[00399] (a) um exterior proteináceo;
[00400] (b) um elemento genético compreendendo um elemento promotor, uma sequência de ácidos nucleicos (por exemplo, uma sequência de DNA) codificando um efetor (por exemplo, um efetor exógeno ou um efetor endógeno) e uma sequência compreendendo pelo menos 20, 25, 30, 31, 32, 33, 34, 35, ou 36 nucleotídeos consecutivos possuindo um conteúdo de GC de pelo menos 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, ou 80,6%; e
[00401] em que o elemento genético compreende pelo menos uma diferença (por exemplo, uma mutação, modificação química ou alteração epigenética) em relação a uma sequência do genoma de Anellovirus de tipo selvagem (por exemplo, como descrito no presente documento), por exemplo, uma inserção, substituição, modificação enzimática e/ou deleção, por exemplo, uma deleção de um domínio (por exemplo, um ou mais de uma caixa TATA, local cap, local de início transcricional, 5´ UTR, grelha de leitura aberta (ORF), sinal de poli(A) ou região rica em GC);
[00402] em que o elemento genético está encerrado dentro do exterior proteináceo; e
[00403] em que o anelossomo é configurado para entregar o elemento genético em uma célula eucariótica; e
[00404] opcionalmente, em que o elemento genético:
[00405] (i) não compreende uma deleção dos nucleotídeos 3436 a 3607 em relação a uma sequência do genoma de TTV-tth8 de tipo selvagem, por exemplo, como descrito no presente documento;
[00406] (ii) não compreende uma deleção dos nucleotídeos 1432 a 2210 em relação a uma sequência do genoma de TTMV-LY2 de tipo selvagem, por exemplo, como descrito no presente documento; e/ou
[00407] (iii) não compreende uma deleção de pelo menos 101 nucleotídeos em relação a uma sequência do genoma de TTMV-LY2 de tipo selvagem, por exemplo, como descrito no presente documento.
[00408] 1076. Um anelossomo compreendendo:
[00409] (a) um exterior proteináceo;
[00410] (b) um elemento genético compreendendo um elemento promotor e uma sequência de ácidos nucleicos (por exemplo, uma sequência de DNA) codificando um efetor (por exemplo, um efetor exógeno ou um efetor endógeno),
[00411] em que o elemento genético compreende uma região (por exemplo, uma região de empacotamento, por exemplo, posicionada 3´ em relação à sequência de ácidos nucleicos codificando o efetor) possuindo:
[00412] pelo menos 95% (por exemplo, pelo menos 95, 96, 97, 98, 99 ou 100%) de identidade de sequências com a sequência de ácidos nucleicos: CGCGCTGCGCGCGCCGCCCAGTAGGGGGAGCCATGC (SEQ ID NO: 160);
[00413] em que o elemento genético está encerrado dentro do exterior proteináceo; e
[00414] em que o anelossomo é configurado para entregar o elemento genético em uma célula eucariótica.
[00415] 1076A. Um anelossomo compreendendo:
[00416] (i) um elemento genético compreendendo um elemento promotor e uma sequência de ácidos nucleicos codificando um efetor exógeno terapêutico, em que o elemento genético compreende uma sequência possuindo pelo menos 95% de identidade de sequências com a sequência de nucleotídeos de 5´ UTR de um Anellovirus descrito no presente documento (por exemplo, como listado em qualquer uma das Tabelas A1, A3, A5, A7, A9, A11, B1-B5, 1, 3, 5, 7, 9, 11, 13, 15, ou 17); e/ou
[00417] (ii) um exterior proteináceo compreendendo um polipeptídeo possuindo pelo menos 95% de identidade de sequências com um polipeptídeo codificado pelo gene ORF1 de um Anellovirus descrito no presente documento (por exemplo, como listado em qualquer uma das Tabelas A1, A3, A5, A7, A9, A11, B1-B5, 1, 3, 5, 7, 9, 11, 13, 15, ou 17);
[00418] em que o elemento genético está encerrado dentro do exterior proteináceo e
[00419] opcionalmente em que o anelossomo é capaz de entregar o elemento genético em uma célula de mamífero.
[00420] 1076B. Um anelossomo compreendendo:
[00421] (I) um elemento genético compreendendo: (a) um elemento promotor e (b) uma sequência de ácidos nucleicos codificando um efetor exógeno (por exemplo, um efetor exógeno como descrito no presente documento), em que a sequência de ácidos nucleicos está operacionalmente ligada ao elemento promotor; e (c) um domínio 5´ UTR compreendendo uma de:
[00422] (c)(i) uma sequência de ácidos nucleicos dos nucleotídeos 323 – 393 da SEQID NO: 54 ou uma sequência de ácidos nucleicos pelo menos 85% idêntica à mesma;
[00423] (c)(ii) uma sequência de ácidos nucleicos de qualquer uma de SEQ ID NO: 113, SEQ ID NO: 114, SEQ ID NO: 115 , SEQ ID NO: 116, SEQ ID NO: 117, SEQ ID NO: 118, SEQ ID NO: 119 ou uma sequência de ácidos nucleicos pelo menos 85% idêntica à mesma; ou
[00424] (c)(iii) uma sequência de ácidos nucleicos dos nucleotídeos 117 – 187 da SEQID NO: 61 ou uma sequência de ácidos nucleicos pelo menos 85% idêntica à mesma;
[00425] (II) um exterior proteináceo compreendendo uma molécula ORF1;
[00426] em que o elemento genético está encerrado dentro do exterior proteináceo; e
[00427] em que o anelossomo sintético é capaz de entregar o elemento genético em uma célula de mamífero, por exemplo, humana.
[00428] 1077. O anelossomo de qualquer uma das modalidades precedentes, em que o exterior proteináceo compreende a molécula ORF1.
[00429] 1078. O anelossomo de qualquer uma das modalidades precedentes, em que pelo menos 60% (por exemplo, pelo menos 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100%)
da proteína no exterior proteináceo compreende uma molécula de ORF1.
[00430] 1079. O anelossomo de qualquer uma das modalidades precedentes, em que não mais do que 1% (por exemplo, não mais do que 1%, 2%, 3%, 4%, 5%, 10%, 15%, 20%, 25%, 30%, 35%, ou 40%) da proteína no exterior proteináceo compreende uma molécula ORF1/1, ORF1/2, ORF2, ORF2/2, ORF2/3, ORF2t/3 e/ou ORF3.
[00431] 1080. O anelossomo de qualquer uma das modalidades precedentes, em que a molécula ORF1 compreende uma sequência de aminoácidos possuindo pelo menos 70% (por exemplo, pelo menos 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100%) de identidade com uma proteína ORF1 listada em, ou codificada por uma sequência listada em, qualquer uma das Tabelas A1-A12, B1-B5, C1- C5, 1-18, 20-37 ou D1-D10.
[00432] 1081. O anelossomo de qualquer uma das modalidades precedentes, em que a molécula ORF1 compreende um polipeptídeo de qualquer uma das modalidades precedentes.
[00433] 1082. O anelossomo de qualquer uma das modalidades precedentes, em que o elemento genético compreende ainda uma sequência de ácidos nucleicos codificando a molécula ORF1.
[00434] 1083. O anelossomo de qualquer uma das modalidades precedentes, em que o elemento genético não compreende uma sequência de ácidos nucleicos codificando a molécula ORF1.
[00435] 1084. O anelossomo de qualquer uma das modalidades precedentes, em que o elemento genético compreende pelo menos 20, 25, 30, 31, 32, 33, 34, 35, ou 36 nucleotídeos consecutivos possuindo um conteúdo de GC de pelo menos 80%.
[00436] 1085. O anelossomo de qualquer uma das modalidades precedentes, em que o elemento genético compreende pelo menos 36 nucleotídeos consecutivos possuindo um conteúdo de GC de pelo menos 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, ou 80,6%.
[00437] 1086. O anelossomo de qualquer uma das modalidades precedentes, em que o elemento genético compreende pelo menos 36 nucleotídeos consecutivos possuindo um conteúdo de GC de pelo menos 80%.
[00438] 1087. Uma composição de ácido nucleico isolada (por exemplo, compreendendo uma, duas ou mais moléculas de ácido nucleico) compreendendo um ácido nucleico codificando o polipeptídeo de qualquer uma das modalidades precedentes;
[00439] opcionalmente em que a composição de ácido nucleico isolada compreende ainda pelo menos uma diferença (por exemplo, uma mutação, modificação química ou alteração epigenética) em relação a uma sequência do genoma de Anellovirus de tipo selvagem (por exemplo, como descrito no presente documento), por exemplo, uma inserção, substituição, modificação enzimática e/ou deleção, por exemplo, uma deleção de um domínio (por exemplo, um ou mais de uma caixa TATA, local cap, local de início transcricional, 5´ UTR, grelha de leitura aberta (ORF), sinal de poli(A) ou região rica em GC); e
[00440] opcionalmente em que a molécula de ácido nucleico não compreende:
[00441] (i) uma deleção dos nucleotídeos 3436 a 3607 em relação a uma sequência do genoma de TTV-tth8 de tipo selvagem, por exemplo, como descrito no presente documento;
[00442] (ii) uma deleção dos nucleotídeos 1432 a 2210 em relação a uma sequência do genoma de TTMV-LY2 de tipo selvagem, por exemplo, como descrito no presente documento; e/ou
[00443] (iii) uma deleção de pelo menos 101 nucleotídeos em relação a uma sequência do genoma de TTMV-LY2 de tipo selvagem, por exemplo, como descrito no presente documento.
[00444] 1088. Uma composição de ácido nucleico isolada (por exemplo, compreendendo uma, duas ou mais moléculas de ácido nucleico), em que a composição de ácido nucleico isolada compreende um elemento genético codificando uma molécula ORF1;
[00445] em que:
[00446] (i) pelo menos 30% (por exemplo, pelo menos 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 90% ou mais) dos aminoácidos da molécula ORF1 são parte de uma folha β;
[00447] (ii) a estrutura secundária da molécula ORF1 compreende pelo menos três (por exemplo, pelo menos 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, ou 20) folhas β;
[00448] (iii) a estrutura secundária da molécula ORF1 compreende uma razão entre folhas β e hélices α de pelo menos 1:1, 2:1, 3:1, 4:1, 5:1, 6:1, 7:1, 8:1, 9:1, ou 10:1; e
[00449] em que o elemento genético compreende um elemento promotor, uma sequência de ácidos nucleicos codificando um efetor (por exemplo, um efetor exógeno ou um efetor endógeno) e uma sequência de ligação à proteína;
[00450] em que o elemento genético compreende pelo menos uma diferença (por exemplo, uma mutação, modificação química ou alteração epigenética) em relação a uma sequência do genoma de Anellovirus de tipo selvagem (por exemplo, como descrito no presente documento), por exemplo, uma inserção, substituição, modificação enzimática e/ou deleção, por exemplo, uma deleção de um domínio (por exemplo, um ou mais de uma caixa TATA, local cap, local de início transcricional, 5´ UTR, grelha de leitura aberta (ORF), sinal de poli(A) ou região rica em GC); e
[00451] opcionalmente em que a molécula de ácido nucleico não compreende:
[00452] (i) uma deleção dos nucleotídeos 3436 a 3607 em relação a uma sequência do genoma de TTV-tth8 de tipo selvagem, por exemplo, como descrito no presente documento;
[00453] (ii) uma deleção dos nucleotídeos 1432 a 2210 em relação a uma sequência do genoma de TTMV-LY2 de tipo selvagem, por exemplo, como descrito no presente documento; e/ou
[00454] (iii) uma deleção de pelo menos 101 nucleotídeos em relação a uma sequência do genoma de TTMV-LY2 de tipo selvagem, por exemplo, como descrito no presente documento.
[00455] 1089. Uma composição de ácido nucleico isolada (por exemplo, compreendendo uma, duas ou mais moléculas de ácido nucleico) compreendendo:
[00456] (a) um elemento genético codificando uma molécula ORF1;
[00457] (b) pelo menos 10, 15, 20, 25, 30, 31, 32, 33, 34, 35, ou 36 nucleotídeos consecutivos da sequência de ácidos nucleicos:
[00458] (i) CGCGCTGCGCGCGCCGCCCAGTAGGGGGAGCCATGC (SEQ ID NO: 160),
[00459] (ii) GCGCTX1CGCGCGCGCGCCGGGGGGCTGCGCCCCCCC (SEQ ID NO: 164), em que X1 é selecionado de T, G ou A;
[00460] (iii) GCGCTTCGCGCGCCGCCCACTAGGGGGCGTTGCGCG (SEQ ID NO: 165);
[00461] (iv) GCGCTGCGCGCGCCGCCCAGTAGGGGGCGCAATGCG(SEQ ID NO: 166);
[00462] (v) GCGCTGCGCGCGCGGCCCCCGGGGGAGGCATTGCCT (SEQ ID NO: 167);
[00463] (vi)
GCGCTGCGCGCGCGCGCCGGGGGGGCGCCAGCGCCC (SEQ ID NO: 168);
[00464] (vii) GCGCTTCGCGCGCGCGCCGGGGGGCTCCGCCCCCCC (SEQ ID NO: 169);
[00465] (viii) GCGCTTCGCGCGCGCGCCGGGGGGCTGCGCCCCCCC (SEQ ID NO: 170);
[00466] (ix) GCGCTACGCGCGCGCGCCGGGGGGCTGCGCCCCCCC (SEQ ID NO: 171); ou
[00467] (x) GCGCTACGCGCGCGCGCCGGGGGGCTCTGCCCCCCC (SEQ ID NO: 172);
[00468] ou uma sequência de ácidos nucleicos possuindo pelo menos 75, 76, 77, 78, 79, 80, 85, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99, ou 100% de identidade de sequências com a mesma; e
[00469] (c) pelo menos uma diferença (por exemplo, uma mutação, modificação química ou alteração epigenética) em relação a uma sequência do genoma de Anellovirus de tipo selvagem (por exemplo, como descrito no presente documento), por exemplo, uma inserção, substituição, modificação enzimática e/ou deleção, por exemplo, uma deleção de um domínio (por exemplo, um ou mais de uma caixa TATA, local cap, local de início transcricional, 5´ UTR, grelha de leitura aberta (ORF), sinal de poli(A) ou região rica em GC);
[00470] opcionalmente em que a molécula de ácido nucleico não compreende:
[00471] (i) uma deleção dos nucleotídeos 3436 a 3607 em relação a uma sequência do genoma de TTV-tth8 de tipo selvagem, por exemplo, como descrito no presente documento;
[00472] (ii) uma deleção dos nucleotídeos 1432 a 2210 em relação a uma sequência do genoma de TTMV-LY2 de tipo selvagem, por exemplo, como descrito no presente documento; e/ou
[00473] (iii) uma deleção de pelo menos 101 nucleotídeos em relação a uma sequência do genoma de TTMV-LY2 de tipo selvagem, por exemplo, como descrito no presente documento.
[00474] 1090. Uma composição de ácido nucleico isolada (por exemplo, compreendendo uma, duas ou mais moléculas de ácido nucleico), em que a composição de ácido nucleico isolada compreende:
[00475] (a) um elemento genético codificando uma molécula ORF1;
[00476] (b) pelo menos 20, 25, 30, 31, 32, 33, 34, 35 ou 36 nucleotídeos consecutivos possuindo um conteúdo de GC de pelo menos 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, ou 80,6%; e
[00477] em que a composição de ácido nucleico isolada compreende pelo menos uma diferença (por exemplo, uma mutação, modificação química ou alteração epigenética) em relação a uma sequência do genoma de Anellovirus de tipo selvagem (por exemplo, como descrito no presente documento), por exemplo, uma inserção, substituição, modificação enzimática e/ou deleção, por exemplo, uma deleção de um domínio (por exemplo, um ou mais de uma caixa TATA, local cap, local de início transcricional, 5´ UTR, grelha de leitura aberta (ORF), sinal de poli(A) ou região rica em GC); e
[00478] opcionalmente em que a molécula de ácido nucleico não compreende:
[00479] (i) uma deleção dos nucleotídeos 3436 a 3607 em relação a uma sequência do genoma de TTV-tth8 de tipo selvagem, por exemplo, como descrito no presente documento;
[00480] (ii) uma deleção dos nucleotídeos 1432 a 2210 em relação a uma sequência do genoma de TTMV-LY2 de tipo selvagem, por exemplo, como descrito no presente documento; e/ou
[00481] (iii) uma deleção de pelo menos 101 nucleotídeos em relação a uma sequência do genoma de TTMV-LY2 de tipo selvagem, por exemplo, como descrito no presente documento.
[00482] 1090A. Uma composição de ácido nucleico isolada (por exemplo, compreendendo uma, duas ou mais moléculas de ácido nucleico), em que a composição de ácido nucleico isolada compreende um elemento genético compreendendo uma sequência de nucleotídeos de 5´ UTR de um Anellovirus descrito no presente documento (por exemplo, como listado em qualquer um de Tabelas A1, A3, A5, A7, A9, A11, B1-B5, 1, 3, 5, 7, 9, 11, 13, 15, ou 17).
[00483] 1091. A composição de ácido nucleico isolada de qualquer uma das modalidades 1089-1090, em que (a) e (b) são parte do mesmo ácido nucleico.
[00484] 1092. A composição de ácido nucleico isolada de qualquer uma das modalidades 1089-1091, em que (a) e (b) são parte de ácidos nucleicos diferentes.
[00485] 1093. A composição de ácido nucleico isolada de qualquer uma das modalidades precedentes, em que o elemento genético compreende ainda um ou mais de: uma caixa TATA, um elemento iniciador, um local cap, um local de início transcricional, um domínio conservado 5´ UTR, uma sequência codificando ORF1, uma sequência codificando ORF1/1, uma sequência codificando ORF1/2, uma sequência codificando ORF2, uma sequência codificando ORF2/2, uma sequência codificando ORF2/3, uma sequência codificando ORF2/3t, uma regiões de três grelhas de leitura aberta, um sinal de poli(A) e/ou uma região rica em GC de um Anellovirus descrito no presente documento (por exemplo, como listado em qualquer uma das Tabelas A1, A3, A5, A7, A9, A11, B1-B5, 1, 3, 5, 7, 9, 11, 13, 15, ou 17) ou uma sequência possuindo pelo menos 70%, 75%, 80%, 85%, 90%, 95%,
96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a mesma.
[00486] 1094. A composição de ácido nucleico isolada de qualquer uma das modalidades precedentes, em que o elemento genético compreende ainda uma sequência do genoma de Anellovirus (por exemplo, como descrito no presente documento, por exemplo, como listado em qualquer uma das Tabelas A1, A3, A5, A7, A9, A11, B1-B5, 1, 3, 5, 7, 9, 11, 13, 15, ou 17) ou uma sequência possuindo pelo menos 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a mesma.
[00487] 1095. A composição de ácido nucleico isolada da modalidade 1094, compreendendo ainda pelo menos uma cópia adicional da sequência do genoma de Anellovirus ou a sequência possuindo pelo menos 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a mesma (por exemplo, um total de 1, 2, 3, 4, 5 ou 6 cópias).
[00488] 1096. A composição de ácido nucleico isolada de qualquer uma das modalidades precedentes, compreendendo ainda pelo menos uma cópia adicional do elemento genético (por exemplo, um total de 1, 2, 3, 4, 5 ou 6 cópias).
[00489] 1097. Uma composição de ácido nucleico isolada (por exemplo, compreendendo uma, duas ou mais moléculas de ácido nucleico) compreendendo pelo menos 10, 15, 20, 25, 30, 31, 32, 33, 34, 35, ou 36 nucleotídeos consecutivos da sequência de ácidos nucleicos:
[00490] (i) CGCGCTGCGCGCGCCGCCCAGTAGGGGGAGCCATGC (SEQ ID NO: 160),
[00491] (ii) GCGCTX1CGCGCGCGCGCCGGGGGGCTGCGCCCCCCC (SEQ ID NO: 164), em que X1 é selecionado de T, G ou A;
[00492] (iii) GCGCTTCGCGCGCCGCCCACTAGGGGGCGTTGCGCG (SEQ ID NO: 165);
[00493] (iv) GCGCTGCGCGCGCCGCCCAGTAGGGGGCGCAATGCG (SEQ ID NO: 166);
[00494] (v) GCGCTGCGCGCGCGGCCCCCGGGGGAGGCATTGCCT (SEQ ID NO: 167);
[00495] (vi) GCGCTGCGCGCGCGCGCCGGGGGGGCGCCAGCGCCC (SEQ ID NO: 168);
[00496] (vii) GCGCTTCGCGCGCGCGCCGGGGGGCTCCGCCCCCCC (SEQ ID NO: 169);
[00497] (viii) GCGCTTCGCGCGCGCGCCGGGGGGCTGCGCCCCCCC (SEQ ID NO: 170);
[00498] (ix) GCGCTACGCGCGCGCGCCGGGGGGCTGCGCCCCCCC (SEQ ID NO: 171); ou
[00499] (x) GCGCTACGCGCGCGCGCCGGGGGGCTCTGCCCCCCC (SEQ ID NO: 172);
[00500] ou uma sequência de ácidos nucleicos possuindo pelo menos 75, 76, 77, 78, 79, 80, 85, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99, ou 100% de identidade de sequências com a mesma; e
[00501] pelo menos uma diferença (por exemplo, uma mutação, modificação química ou alteração epigenética) em relação a uma sequência do genoma de Anellovirus de tipo selvagem (por exemplo,
como descrito no presente documento), por exemplo, uma inserção, substituição, modificação enzimática e/ou deleção, por exemplo, uma deleção de um domínio (por exemplo, um ou mais de uma caixa TATA, local cap, local de início transcricional, 5´ UTR, grelha de leitura aberta (ORF), sinal de poli(A) ou região rica em GC);
[00502] opcionalmente em que a molécula de ácido nucleico não compreende:
[00503] (i) uma deleção dos nucleotídeos 3436 a 3607 em relação a uma sequência do genoma de TTV-tth8 de tipo selvagem, por exemplo, como descrito no presente documento;
[00504] (ii) uma deleção dos nucleotídeos 1432 a 2210 em relação a uma sequência do genoma de TTMV-LY2 de tipo selvagem, por exemplo, como descrito no presente documento; e/ou
[00505] (iii) uma deleção de pelo menos 101 nucleotídeos em relação a uma sequência do genoma de TTMV-LY2 de tipo selvagem, por exemplo, como descrito no presente documento.
[00506] 1098. Uma composição de ácido nucleico isolada (por exemplo, compreendendo uma, duas ou mais moléculas de ácido nucleico), em que a composição de ácido nucleico isolada compreende pelo menos 20, 25, 30, 31, 32, 33, 34, 35, ou 36 nucleotídeos consecutivos possuindo um conteúdo GC de pelo menos 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, ou 80,6%; e
[00507] em que a composição de ácido nucleico isolada compreende pelo menos uma diferença (por exemplo, uma mutação, modificação química ou alteração epigenética) em relação a uma sequência do genoma de Anellovirus de tipo selvagem (por exemplo, como descrito no presente documento), por exemplo, uma inserção, substituição, modificação enzimática e/ou deleção, por exemplo, uma deleção de um domínio (por exemplo, um ou mais de uma caixa TATA, local cap, local de início transcricional, 5´ UTR, grelha de leitura aberta (ORF), sinal de poli(A) ou região rica em GC); e
[00508] opcionalmente em que a molécula de ácido nucleico não compreende:
[00509] (i) uma deleção dos nucleotídeos 3436 a 3607 em relação a uma sequência do genoma de TTV-tth8 de tipo selvagem, por exemplo, como descrito no presente documento;
[00510] (ii) uma deleção dos nucleotídeos 1432 a 2210 em relação a uma sequência do genoma de TTMV-LY2 de tipo selvagem, por exemplo, como descrito no presente documento; e/ou
[00511] (iii) uma deleção de pelo menos 101 nucleotídeos em relação a uma sequência do genoma de TTMV-LY2 de tipo selvagem, por exemplo, como descrito no presente documento.
[00512] 1099. A composição de ácido nucleico isolada de qualquer uma das modalidades precedentes, em que a molécula ORF1 compreende um polipeptídeo de qualquer uma das modalidades precedentes.
[00513] 1100. A composição de ácido nucleico isolada de qualquer uma das modalidades precedentes, compreendendo pelo menos 20, 25, 30, 31, 32, 33, 34, 35, ou 36 nucleotídeos consecutivos possuindo um conteúdo de GC de pelo menos 80%.
[00514] 1101. A composição de ácido nucleico isolada de qualquer uma das modalidades precedentes, compreendendo pelo menos 36 nucleotídeos consecutivos possuindo um conteúdo de GC de pelo menos 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, ou 80,6%.
[00515] 1102. A composição de ácido nucleico isolada de qualquer uma das modalidades precedentes, compreendendo pelo menos 36 nucleotídeos consecutivos possuindo um conteúdo de GC de pelo menos 80%.
[00516] 1103. A composição de ácido nucleico isolada de qualquer uma das modalidades precedentes, compreendendo ainda um ou mais de um elemento promotor, uma sequência de ácidos nucleicos codificando um efetor (por exemplo, um efetor exógeno ou um efetor endógeno) e/ou uma sequência de ligação à proteína (por exemplo, uma sequência de ligação à proteína exterior).
[00517] 1104. A composição de ácido nucleico isolada de qualquer uma das modalidades precedentes, compreendendo pelo menos cerca de 100, 150, 200, 250, 300, 350, 400, 450, ou 500 nucleotídeos consecutivos de uma sequência do genoma de Anellovirus de tipo selvagem ou uma sequência de ácidos nucleicos possuindo pelo menos 75, 76, 77, 78, 79, 80, 85, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99, ou 100% de identidade de sequências com a mesma.
[00518] 1105. Uma molécula de ácido nucleico isolada (por exemplo, um vetor de expressão) compreendendo uma sequência de ácidos nucleicos possuindo pelo menos 95% (por exemplo, pelo menos 95, 96, 97, 98, 99 ou 100%) de identidade de sequências com a sequência de ácidos nucleicos:
[00519] (i) CGCGCTGCGCGCGCCGCCCAGTAGGGGGAGCCATGC (SEQ ID NO: 160),
[00520] (ii) GCGCTX1CGCGCGCGCGCCGGGGGGCTGCGCCCCCCC (SEQ ID NO: 164), em que X1 é selecionado de T, G ou A;
[00521] (iii) GCGCTTCGCGCGCCGCCCACTAGGGGGCGTTGCGCG (SEQ ID NO: 165);
[00522] (iv) GCGCTGCGCGCGCCGCCCAGTAGGGGGCGCAATGCG (SEQ ID NO: 166);
[00523] (v)
GCGCTGCGCGCGCGGCCCCCGGGGGAGGCATTGCCT (SEQ ID NO: 167);
[00524] (vi) GCGCTGCGCGCGCGCGCCGGGGGGGCGCCAGCGCCC (SEQ ID NO: 168);
[00525] (vii) GCGCTTCGCGCGCGCGCCGGGGGGCTCCGCCCCCCC (SEQ ID NO: 169);
[00526] (viii) GCGCTTCGCGCGCGCGCCGGGGGGCTGCGCCCCCCC (SEQ ID NO: 170);
[00527] (ix) GCGCTACGCGCGCGCGCCGGGGGGCTGCGCCCCCCC (SEQ ID NO: 171); ou
[00528] (x) GCGCTACGCGCGCGCGCCGGGGGGCTCTGCCCCCCC (SEQ ID NO: 172).
[00529] 1106. A composição de ácido nucleico isolada de qualquer uma das modalidades precedentes, em que a molécula de ácido nucleico isolada é circular.
[00530] 1107. Uma célula isolada, por exemplo uma célula hospedeira, compreendendo:
[00531] (a) um ácido nucleico codificando um polipeptídeo de qualquer uma das modalidades precedentes, em que o ácido nucleico é um plasmídeo, é um ácido nucleico viral ou está integrado em um cromossomo celular, e
[00532] (b) um elemento genético, em que o elemento genético compreende um elemento promotor e uma sequência de ácidos nucleicos (por exemplo, uma sequência de DNA) codificando um efetor (por exemplo, um efetor exógeno ou um efetor endógeno) e uma sequência de ligação à proteína, em que opcionalmente o elemento genético não codifica um polipeptídeo ORF1 (por exemplo, uma proteína ORF1).
[00533] 1108. Uma célula isolada, por exemplo, uma célula hospedeira, compreendendo:
[00534] (a) um ácido nucleico codificando uma molécula ORF1, em que o ácido nucleico é um plasmídeo, é um ácido nucleico viral ou está integrado em um cromossomo celular, e
[00535] (b) um elemento genético, em que o elemento genético compreende um elemento promotor e uma sequência de ácidos nucleicos (por exemplo, uma sequência de DNA) codificando um efetor (por exemplo, um efetor exógeno ou um efetor endógeno) e uma sequência de ligação à proteína.
[00536] 1109. Uma célula isolada, por exemplo, uma célula hospedeira, compreendendo:
[00537] (a) um ácido nucleico codificando uma molécula ORF1 (por exemplo, em que o ácido nucleico é um plasmídeo, é um ácido nucleico viral ou está integrado em um cromossomo celular) e
[00538] (b) um elemento genético que não codifica uma molécula ORF1, em que o elemento genético compreende um elemento promotor e uma sequência de ácidos nucleicos (por exemplo, uma sequência de DNA) codificando um efetor (por exemplo, um efetor exógeno ou um efetor endógeno) e uma sequência de ligação à proteína.
[00539] 1109A. Uma célula isolada, por exemplo, uma célula hospedeira, compreendendo:
[00540] (i) uma molécula de ácido nucleico (por exemplo, uma primeira molécula de ácido nucleico) compreendendo a sequência de ácidos nucleicos de um elemento genético de um anelossomo como descrito no presente documento (por exemplo, um elemento genético que não codifica uma molécula de ORF1) e
[00541] (ii) opcionalmente, uma molécula de ácido nucleico, por exemplo, uma segunda molécula de ácido nucleico codificando uma ou mais de uma sequência de aminoácidos escolhida de ORF1, ORF2, ORF2/2, ORF2/3, ORF1/1 ou ORF1/2, por exemplo, como listado em qualquer uma das Tabelas 16, ou uma sequência de aminoácidos possuindo pelo menos 70% (por exemplo, pelo menos 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100%) de identidade de sequências com as mesmas.
[00542] 1110. A célula isolada de qualquer uma das modalidades precedentes, em que o elemento genético que não codifica uma molécula ORF1 codifica um fragmento de uma molécula ORF1, por exemplo, um fragmento que não forma um capsídeo, por exemplo, um fragmento de menos do que 1000, 900, 800, 700, 600, 500, 400, 300, 200, 100, 50, 20, ou 10 nucleotídeos.
[00543] 1111. Uma célula isolada, por exemplo, uma célula hospedeira, compreendendo um ácido nucleico codificando uma molécula ORF1 (por exemplo, em que o ácido nucleico é um plasmídeo, é um ácido nucleico viral ou está integrado em um cromossomo celular), em que a célula isolada não compreende uma ou mais de uma molécula ORF1/1, ORF1/2, ORF2, ORF2/2, ORF2/3, ORF2t/3 e/ou ORF3.
[00544] 1112. Uma célula isolada, por exemplo, uma célula hospedeira, compreendendo a composição de ácido nucleico de qualquer uma das modalidades precedentes.
[00545] 1113. Um ácido nucleico ajudante (por exemplo, um plasmídeo ou ácido nucleico viral) codificando uma molécula ORF1, em que a célula isolada não compreende uma ou mais de uma molécula ORF1/1, ORF1/2, ORF2, ORF2/2, ORF2/3, ORF2t/3 e/ou ORF3.
[00546] 1114. Uma composição compreendendo:
[00547] (a) uma célula isolada descrita no presente documento e
[00548] (b) um anelossomo descrito no presente documento.
[00549] 1115. Uma composição compreendendo:
[00550] (a) uma célula compreendendo um ácido nucleico codificando uma molécula ORF1 (por exemplo, em que o ácido nucleico é um plasmídeo, é um ácido nucleico viral ou está integrado em um cromossomo celular) e
[00551] (b) um elemento genético (por exemplo, dentro da célula ou fora da célula, por exemplo, em meio de cultura de células) que não codifica uma molécula ORF1, em que o elemento genético compreende um elemento promotor e uma sequência de ácidos nucleicos (por exemplo, uma sequência de DNA) codificando um efetor (por exemplo, um efetor exógeno ou um efetor endógeno) e uma sequência de ligação à proteína.
[00552] 1116. Uma composição farmacêutica compreendendo o polipeptídeo, complexo, anelossomo ou ácido nucleico isolado de qualquer uma das modalidades precedentes e um transportador e/ou excipiente farmaceuticamente aceitáveis.
[00553] 1117. Um método de fabricação de uma molécula ORF1, o método compreendendo:
[00554] (a) proporcionar uma célula hospedeira (por exemplo, uma célula hospedeira descrita no presente documento) compreendendo um ácido nucleico codificando o polipeptídeo de qualquer uma das modalidades precedentes e
[00555] (b) manter a célula hospedeira sob condições que permitem que a célula produza o polipeptídeo;
[00556] fabricando deste modo a molécula ORF1.
[00557] 1118. Um método de fabricação de uma molécula ORF1, o método compreendendo:
[00558] (a) proporcionar uma célula hospedeira (por exemplo, uma célula hospedeira descrita no presente documento) compreendendo a composição de ácido nucleico de qualquer uma das modalidades precedentes e
[00559] (b) manter a célula hospedeira sob condições que permitem que a célula produza o polipeptídeo;
[00560] fabricando deste modo a molécula ORF1.
[00561] 1119. O método da modalidade 1117 ou 1118, em que a célula hospedeira é uma célula ajudante.
[00562] 1120. O método da modalidade 1119, em que a célula ajudante compreende um ou mais ácidos nucleicos adicionais codificando um ou mais ORFs adicionais (por exemplo, uma ou mais de ORF1/1, ORF1/2, ORF2, ORF2/2, ORF2/3, ORF2t/3 e/ou ORF3) de um Anellovirus de tipo selvagem, por exemplo, como descrito no presente documento.
[00563] 1121. O método de qualquer uma das modalidades 1117- 1120, em que o ácido nucleico está integrado no genoma da célula hospedeira.
[00564] 1122. O método de qualquer uma das modalidades 1117- 1121, em que a célula hospedeira produz pelo menos cerca de 10, 20, 30, 40, 50, 60, 70, 80, 90, 100, 200, 300, 400, 500, 1000, 10,000, 50,000, 100,000, 500,000, ou 1,000,000 cópias (por exemplo, pelo menos cerca de 60 cópias) do polipeptídeo por célula hospedeira.
[00565] 1123. O método de qualquer uma das modalidades 1117- 1122, em que a célula hospedeira produz pelo menos cerca de 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 20, 30, 40, 50, 60, 70, 80, 90, 100, 200, 300, 400, 500, 1000, 10,000, ou 100,000 cópias (por exemplo, pelo menos cerca de 60 cópias) do polipeptídeo por anelossomo produzido pela célula hospedeira.
[00566] 1124. O método de qualquer uma das modalidades 1117- 1123, em que o método compreende proporcionar uma pluralidade de células hospedeiras e manter as células hospedeiras sob condições que permitem a produção de pelo menos 1000 cópias do polipeptídeo por célula.
[00567] 1125. O método da modalidade 1124, em que a pluralidade de células hospedeiras produz pelo menos cerca de 1x105, 1x106, 1x107, 1x108, 9x108, 1x109, 1x1010, 1x1011 ou 1x1012 cópias do polipeptídeo.
[00568] 1126. Um método de fabricação de uma composição de anelossomos, o método compreendendo:
[00569] (a) proporcionar uma célula ajudante, por exemplo, uma célula ajudante descrita no presente documento;
[00570] (b) introduzir um elemento genético na célula ajudante sob condições que permitem que a célula produza anelossomos e
[00571] (c) formular os anelossomos, por exemplo, como uma composição farmacêutica adequada para administração a um indivíduo,
[00572] preparando deste modo a composição de anelossomos.
[00573] 1127. Um método de fabricação de uma composição de anelossomos, o método compreendendo:
[00574] (a) proporcionar uma célula hospedeira;
[00575] (b) introduzir um ácido nucleico ajudante na célula hospedeira;
[00576] (c) introduzir um elemento genético na célula hospedeira (por exemplo, antes de, após ou simultaneamente com (c)), sob condições que permitem que a célula produza anelossomos; e
[00577] (d) formular os anelossomos, por exemplo, como uma composição farmacêutica adequada para administração a um indivíduo;
[00578] preparando deste modo a composição de anelossomos.
[00579] 1128. Um método de fabricação de uma composição de anelossomos, o método compreendendo:
[00580] (a) proporcionar uma célula ajudante compreendendo um ácido nucleico codificando uma molécula ORF1 (por exemplo, em que o ácido nucleico é um plasmídeo, é um ácido nucleico viral ou está integrado em um cromossomo celular ajudante);
[00581] (b) introduzir um elemento genético na célula ajudante sob condições que permitem que a célula produza anelossomos, em que o elemento genético não codifica uma molécula ORF1, em que o elemento genético compreende um elemento promotor e uma sequência de ácidos nucleicos (por exemplo, uma sequência de DNA) codificando um efetor (por exemplo, um efetor exógeno ou um efetor endógeno) e uma sequência de ligação à proteína; e
[00582] (c) formular os anelossomos, por exemplo, como uma composição farmacêutica adequada para administração a um indivíduo;
[00583] preparando deste modo a composição de anelossomos.
[00584] 1129. Um método de fabricação de uma composição de anelossomos, o método compreendendo:
[00585] (a) proporcionar uma célula hospedeira;
[00586] (b) introduzir um ácido nucleico ajudante codificando uma molécula ORF1 (por exemplo, em que o ácido nucleico é um plasmídeo ou um ácido nucleico viral) na célula hospedeira; e
[00587] (c) introduzir um elemento genético na célula hospedeira (por exemplo, antes de, após e simultaneamente com (b)), sob condições que permitem que a célula produza um anelossomo, em que o elemento genético não codifica uma molécula ORF1, em que o elemento genético compreende um elemento promotor e uma sequência de ácidos nucleicos (por exemplo, uma sequência de DNA) codificando um efetor (por exemplo, um efetor exógeno ou um efetor endógeno) e uma sequência de ligação à proteína,
[00588] preparando deste modo o anelossomo.
[00589] 1130. O método de qualquer uma das modalidades precedentes, que compreende ainda separação do anelossomo a partir da célula ajudante ou célula hospedeira.
[00590] 1131. O método de qualquer uma das modalidades precedentes, em que proporcionar uma célula ajudante compreende introduzir um ácido nucleico ajudante na célula hospedeira, por exemplo, em que o ácido nucleico ajudante codifica uma molécula ORF1 (por exemplo, em que o ácido nucleico é um plasmídeo ou um ácido nucleico viral).
[00591] 1132. O método de qualquer uma das modalidades precedentes, em que a célula ajudante compreende a molécula ORF1.
[00592] 1133. O método de qualquer uma das modalidades precedentes, em que o ácido nucleico compreende um ou mais de: uma caixa TATA, um elemento iniciador, um local cap, um local de início transcricional, um domínio conservado 5´ UTR, uma sequência codificando ORF1, uma sequência codificando ORF1/1, uma sequência codificando ORF1/2, uma sequência codificando ORF2, uma sequência codificando ORF2/2, uma sequência codificando ORF2/3, uma sequência codificando ORF2/3t, uma regiões de três grelhas de leitura aberta, um sinal de poli(A) e/ou uma região rica em GC de um Anellovirus descrito no presente documento (por exemplo, como listado em qualquer uma das Tabelas A1, A3, A5, A7, A9, A11, B1-B5, 1, 3, 5, 7, 9, 11, 13, 15, ou 17) ou uma sequência possuindo pelo menos 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a mesma.
[00593] 1134. O método de qualquer uma das modalidades precedentes, em que o ácido nucleico compreende uma sequência do genoma de Anellovirus (por exemplo, como descrito no presente documento, por exemplo, como listado em qualquer uma das Tabelas A1, A3, A5, A7, A9, A11, B1-B5, 1, 3, 5, 7, 9, 11, 13, 15, ou 17) ou uma sequência possuindo pelo menos 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a mesma.
[00594] 1135. O método de qualquer uma das modalidades precedentes, em que o ácido nucleico compreende pelo menos uma cópia adicional da sequência do genoma de Anellovirus ou a sequência possuindo pelo menos 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a mesma (por exemplo, um total de 1, 2, 3, 4, 5 ou 6 cópias).
[00595] 1136. O método de qualquer uma das modalidades precedentes, em que a célula hospedeira ou célula ajudante compreende pelo menos uma cópia adicional do ácido nucleico (por exemplo, um total de 1, 2, 3, 4, 5 ou 6 cópias).
[00596] 1137. O método de qualquer uma das modalidades precedentes, em que o ácido nucleico é circular.
[00597] 1137A. Um método de preparação de um anelossomo, por exemplo, um anelossomo sintético, compreendendo:
[00598] a) proporcionar uma célula hospedeira compreendendo:
[00599] (i) uma molécula de ácido nucleico, por exemplo, uma primeira molécula de ácido nucleico compreendendo a sequência de ácidos nucleicos de um elemento genético de um anelossomo, por exemplo, um anelossomo sintético, como descrito no presente documento, e
[00600] (ii) uma molécula de ácido nucleico, por exemplo, uma segunda molécula de ácido nucleico codificando uma ou mais de uma sequência de aminoácidos escolhida de ORF1, ORF2, ORF2/2, ORF2/3, ORF1/1 ou ORF1/2, por exemplo, como listado em qualquer uma das Tabelas 16, ou uma sequência de aminoácidos possuindo pelo menos 70% (por exemplo, pelo menos 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100%) de identidade de sequências com as mesmas; e
[00601] b) cultivar a célula hospedeira sob condições adequadas para preparar o anelossomo.
[00602] 1137B. O método da modalidade 1137A, compreendendo ainda, antes do passo (a), introdução da primeira molécula de ácido nucleico e/ou da segunda molécula de ácido nucleico na célula hospedeira.
[00603] 1137C. O método da modalidade 1137A ou 113B, em que a segunda molécula de ácido nucleico é introduzida na célula hospedeira antes da, simultaneamente com ou após a primeira molécula de ácido nucleico.
[00604] 1137D. O método da modalidade 1137C, em que a segunda molécula de ácido nucleico está integrada no genoma da célula hospedeira.
[00605] 1137E. O método da modalidade 1137C, em que a segunda molécula de ácido nucleico é um ajudante (por exemplo, um plasmídeo ajudante ou o genoma de um vírus ajudante).
[00606] 1137F. O método de qualquer uma das modalidades 1137A- 1137E, em que o primeiro ácido nucleico compreende um ou mais de: uma caixa TATA, um elemento iniciador, um local cap, um local de início transcricional, um domínio conservado 5´ UTR e/ou uma região rica em GC de um Anellovirus descrito no presente documento (por exemplo, como listado em qualquer uma das Tabelas A1, A3, A5, A7, A9, A11, B1-B5, 1, 3, 5, 7, 9, 11, 13, 15, ou 17) ou uma sequência possuindo pelo menos 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a mesma.
[00607] 1138. Um método de entrega de um efetor a um indivíduo, compreendendo administração ao indivíduo de um anelossomo compreendendo:
[00608] (a) um exterior proteináceo que compreende uma molécula ORF1;
[00609] (b) um elemento genético compreendendo um elemento promotor e uma sequência de ácidos nucleicos (por exemplo, uma sequência de DNA) codificando o efetor (por exemplo, um efetor exógeno ou um efetor endógeno) e uma região compreendendo pelo menos 10, 15, 20, 25, 30, 31, 32, 33, 34, 35, ou 36 nucleotídeos consecutivos da sequência de ácidos nucleicos:
[00610] (i) CGCGCTGCGCGCGCCGCCCAGTAGGGGGAGCCATGC (SEQ ID NO: 160),
[00611] (ii) GCGCTX1CGCGCGCGCGCCGGGGGGCTGCGCCCCCCC (SEQ ID NO: 164), em que X1 é selecionado de T, G ou A;
[00612] (iii) GCGCTTCGCGCGCCGCCCACTAGGGGGCGTTGCGCG (SEQ ID NO: 165);
[00613] (iv) GCGCTGCGCGCGCCGCCCAGTAGGGGGCGCAATGCG (SEQ ID NO: 166);
[00614] (v) GCGCTGCGCGCGCGGCCCCCGGGGGAGGCATTGCCT (SEQ ID NO: 167);
[00615] (vi) GCGCTGCGCGCGCGCGCCGGGGGGGCGCCAGCGCCC (SEQ ID NO: 168);
[00616] (vii) GCGCTTCGCGCGCGCGCCGGGGGGCTCCGCCCCCCC (SEQ ID NO: 169);
[00617] (viii) GCGCTTCGCGCGCGCGCCGGGGGGCTGCGCCCCCCC (SEQ ID NO: 170);
[00618] (ix) GCGCTACGCGCGCGCGCCGGGGGGCTGCGCCCCCCC (SEQ ID
NO: 171); ou
[00619] (x) GCGCTACGCGCGCGCGCCGGGGGGCTCTGCCCCCCC (SEQ ID NO: 172);
[00620] ou uma sequência de ácidos nucleicos possuindo pelo menos 75, 76, 77, 78, 79, 80, 85, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99, ou 100% de identidade de sequências com a mesma; e
[00621] em que o elemento genético está encerrado dentro do exterior proteináceo; e
[00622] opcionalmente em que o elemento genético:
[00623] (i) não compreende uma deleção dos nucleotídeos 3436 a 3607 em relação a uma sequência do genoma de TTV-tth8 de tipo selvagem, por exemplo, como descrito no presente documento;
[00624] (ii) não compreende uma deleção dos nucleotídeos 1432 a 2210 em relação a uma sequência do genoma de TTMV-LY2 de tipo selvagem, por exemplo, como descrito no presente documento; e/ou
[00625] (iii) não compreende uma deleção de pelo menos 101 nucleotídeos em relação a uma sequência do genoma de TTMV-LY2 de tipo selvagem, por exemplo, como descrito no presente documento,
[00626] entregando deste modo o efetor a um indivíduo.
[00627] 1139. Um método de entrega de um efetor a um indivíduo, compreendendo administração ao indivíduo de um anelossomo compreendendo:
[00628] (a) um exterior proteináceo que compreende uma molécula ORF1;
[00629] (b) um elemento genético compreendendo um elemento promotor, uma sequência de ácidos nucleicos (por exemplo, uma sequência de DNA) codificando o efetor (por exemplo, um efetor exógeno ou um efetor endógeno) e uma sequência compreendendo pelo menos 20, 25, 30, 31, 32, 33, 34, 35, ou 36 nucleotídeos consecutivos possuindo um conteúdo de GC de pelo menos 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, ou 80,6%;
[00630] em que o elemento genético está encerrado dentro do exterior proteináceo; e
[00631] opcionalmente em que o elemento genético:
[00632] (i) não compreende uma deleção dos nucleotídeos 3436 a 3607 em relação a uma sequência do genoma de TTV-tth8 de tipo selvagem, por exemplo, como descrito no presente documento;
[00633] (ii) não compreende uma deleção dos nucleotídeos 1432 a 2210 em relação a uma sequência do genoma de TTMV-LY2 de tipo selvagem, por exemplo, como descrito no presente documento; e/ou
[00634] (iii) não compreende uma deleção de pelo menos 101 nucleotídeos em relação a uma sequência do genoma de TTMV-LY2 de tipo selvagem, por exemplo, como descrito no presente documento,
[00635] entregando deste modo o efetor a um indivíduo.
[00636] 1140. Um método de entrega de um efetor a um indivíduo, compreendendo administração ao indivíduo de um anelossomo compreendendo:
[00637] (a) um exterior proteináceo que compreende uma molécula ORF1;
[00638] (b) um elemento genético compreendendo um elemento promotor e uma sequência de ácidos nucleicos (por exemplo, uma sequência de DNA) codificando o efetor (por exemplo, um efetor exógeno ou um efetor endógeno) e uma sequência de ligação à proteína;
[00639] em que o elemento genético está encerrado dentro do exterior proteináceo; e
[00640] opcionalmente em que o elemento genético:
[00641] (i) não compreende uma deleção dos nucleotídeos 3436 a 3607 em relação a uma sequência do genoma de TTV-tth8 de tipo selvagem, por exemplo, como descrito no presente documento;
[00642] (ii) não compreende uma deleção dos nucleotídeos 1432 a 2210 em relação a uma sequência do genoma de TTMV-LY2 de tipo selvagem, por exemplo, como descrito no presente documento; e/ou
[00643] (iii) não compreende uma deleção de pelo menos 101 nucleotídeos em relação a uma sequência do genoma de TTMV-LY2 de tipo selvagem, por exemplo, como descrito no presente documento,
[00644] entregando deste modo o efetor a um indivíduo.
[00645] 1141. Um método de entrega de um efetor a uma célula alvo, compreendendo contato da célula alvo com um anelossomo compreendendo:
[00646] (a) um exterior proteináceo que compreende uma molécula ORF1;
[00647] (b) um elemento genético compreendendo um elemento promotor e uma sequência de ácidos nucleicos (por exemplo, uma sequência de DNA) codificando o efetor (por exemplo, um efetor exógeno ou um efetor endógeno) e uma região compreendendo pelo menos 10, 15, 20, 25, 30, 31, 32, 33, 34, 35, ou 36 nucleotídeos consecutivos da sequência de ácidos nucleicos:
[00648] (i) CGCGCTGCGCGCGCCGCCCAGTAGGGGGAGCCATGC (SEQ ID NO: 160),
[00649] (ii) GCGCTX1CGCGCGCGCGCCGGGGGGCTGCGCCCCCCC (SEQ ID NO: 164), em que X1 é selecionado de T, G ou A;
[00650] (iii) GCGCTTCGCGCGCCGCCCACTAGGGGGCGTTGCGCG (SEQ ID NO: 165);
[00651] (iv) GCGCTGCGCGCGCCGCCCAGTAGGGGGCGCAATGCG (SEQ ID
NO: 166);
[00652] (v) GCGCTGCGCGCGCGGCCCCCGGGGGAGGCATTGCCT (SEQ ID NO: 167);
[00653] (vi) GCGCTGCGCGCGCGCGCCGGGGGGGCGCCAGCGCCC (SEQ ID NO: 168);
[00654] (vii) GCGCTTCGCGCGCGCGCCGGGGGGCTCCGCCCCCCC (SEQ ID NO: 169);
[00655] (viii) GCGCTTCGCGCGCGCGCCGGGGGGCTGCGCCCCCCC (SEQ ID NO: 170);
[00656] (ix) GCGCTACGCGCGCGCGCCGGGGGGCTGCGCCCCCCC (SEQ ID NO: 171); ou
[00657] (x) GCGCTACGCGCGCGCGCCGGGGGGCTCTGCCCCCCC (SEQ ID NO: 172);
[00658] ou uma sequência de ácidos nucleicos possuindo pelo menos 75, 76, 77, 78, 79, 80, 85, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99, ou 100% de identidade de sequências com a mesma; e
[00659] em que o elemento genético está encerrado dentro do exterior proteináceo; e
[00660] opcionalmente em que o elemento genético:
[00661] (i) não compreende uma deleção dos nucleotídeos 3436 a 3607 em relação a uma sequência do genoma de TTV-tth8 de tipo selvagem, por exemplo, como descrito no presente documento;
[00662] (ii) não compreende uma deleção dos nucleotídeos 1432 a 2210 em relação a uma sequência do genoma de TTMV-LY2 de tipo selvagem, por exemplo, como descrito no presente documento; e/ou
[00663] (iii) não compreende uma deleção de pelo menos 101 nucleotídeos em relação a uma sequência do genoma de TTMV-LY2 de tipo selvagem, por exemplo, como descrito no presente documento,
[00664] entregando deste modo o efetor à célula alvo.
[00665] 1142. Um método de entrega de um efetor a uma célula alvo, compreendendo contato da célula alvo com um anelossomo compreendendo:
[00666] (a) um exterior proteináceo que compreende uma molécula ORF1;
[00667] (b) um elemento genético compreendendo um elemento promotor, uma sequência de ácidos nucleicos (por exemplo, uma sequência de DNA) codificando o efetor (por exemplo, um efetor exógeno ou um efetor endógeno) e uma sequência compreendendo pelo menos 20, 25, 30, 31, 32, 33, 34, 35, ou 36 nucleotídeos consecutivos possuindo um conteúdo de GC de pelo menos 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, ou 80,6%;
[00668] em que o elemento genético está encerrado dentro do exterior proteináceo; e
[00669] opcionalmente em que o elemento genético:
[00670] (i) não compreende uma deleção dos nucleotídeos 3436 a 3607 em relação a uma sequência do genoma de TTV-tth8 de tipo selvagem, por exemplo, como descrito no presente documento;
[00671] (ii) não compreende uma deleção dos nucleotídeos 1432 a 2210 em relação a uma sequência do genoma de TTMV-LY2 de tipo selvagem, por exemplo, como descrito no presente documento; e/ou
[00672] (iii) não compreende uma deleção de pelo menos 101 nucleotídeos em relação a uma sequência do genoma de TTMV-LY2 de tipo selvagem, por exemplo, como descrito no presente documento,
[00673] entregando deste modo o efetor à célula alvo.
[00674] 1143. Um método de entrega de um efetor a uma célula alvo, compreendendo contato da célula alvo com um anelossomo compreendendo:
[00675] (a) um exterior proteináceo que compreende uma molécula ORF1;
[00676] (b) um elemento genético compreendendo um elemento promotor e uma sequência de ácidos nucleicos (por exemplo, uma sequência de DNA) codificando o efetor (por exemplo, um efetor exógeno ou um efetor endógeno) e uma sequência de ligação à proteína;
[00677] em que o elemento genético está encerrado dentro do exterior proteináceo; e
[00678] opcionalmente em que o elemento genético:
[00679] (i) não compreende uma deleção dos nucleotídeos 3436 a 3607 em relação a uma sequência do genoma de TTV-tth8 de tipo selvagem, por exemplo, como descrito no presente documento;
[00680] (ii) não compreende uma deleção dos nucleotídeos 1432 a 2210 em relação a uma sequência do genoma de TTMV-LY2 de tipo selvagem, por exemplo, como descrito no presente documento; e/ou
[00681] (iii) não compreende uma deleção de pelo menos 101 nucleotídeos em relação a uma sequência do genoma de TTMV-LY2 de tipo selvagem, por exemplo, como descrito no presente documento,
[00682] entregando deste modo o efetor à célula alvo.
[00683] 1143A. Um método de entrega de um efetor a uma célula alvo, compreendendo contato da célula alvo com um anelossomo compreendendo:
[00684] (i) um elemento genético compreendendo um elemento promotor e uma sequência de ácidos nucleicos codificando um efetor exógeno terapêutico, em que o elemento genético compreende uma sequência possuindo pelo menos 95% de identidade de sequências com a sequência de nucleotídeos de 5´ UTR de um Anellovirus descrito no presente documento (por exemplo, como listado em qualquer uma das Tabelas A1, A3, A5, A7, A9, A11, B1-B5, 1, 3, 5, 7, 9, 11, 13, 15, ou 17); e/ou
[00685] (ii) um exterior proteináceo compreendendo um polipeptídeo possuindo pelo menos 95% de identidade de sequências com um polipeptídeo codificado pelo gene ORF1 de um Anellovirus descrito no presente documento (por exemplo, como listado em qualquer uma das Tabelas A1, A3, A5, A7, A9, A11, B1-B5, 1, 3, 5, 7, 9, 11, 13, 15, ou 17);
[00686] em que o elemento genético está encerrado dentro do exterior proteináceo; e
[00687] opcionalmente em que o elemento genético:
[00688] (i) não compreende uma deleção dos nucleotídeos 3436 a 3607 em relação a uma sequência do genoma de TTV-tth8 de tipo selvagem, por exemplo, como descrito no presente documento;
[00689] (ii) não compreende uma deleção dos nucleotídeos 1432 a 2210 em relação a uma sequência do genoma de TTMV-LY2 de tipo selvagem, por exemplo, como descrito no presente documento; e/ou
[00690] (iii) não compreende uma deleção de pelo menos 101 nucleotídeos em relação a uma sequência do genoma de TTMV-LY2 de tipo selvagem, por exemplo, como descrito no presente documento,
[00691] entregando deste modo o efetor à célula alvo.
[00692] 1144. O polipeptídeo, complexo, anelossomo, ácido nucleico isolado, célula, composição ou método de qualquer uma das modalidades precedentes, em que o elemento genético não codifica a sequência de aminoácidos do N.º de Acesso NCBI A7XCE8.1.
[00693] 1145. O polipeptídeo, complexo, anelossomo, ácido nucleico isolado, célula, composição ou método de qualquer uma das modalidades precedentes, em que a molécula ORF1 compreende uma sequência de aminoácidos possuindo pelo menos 70% (por exemplo,
pelo menos 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100%) de identidade de sequências com uma sequência de ORF1 listada em qualquer uma das Tabelas A2, A4, A6, A8, A10, A12, C1-C5, 2, 4, 6, 8, 10, 12, 14, 16, 18, 20-37, ou D1-D10.
[00694] 1146. O polipeptídeo, complexo, anelossomo, ácido nucleico isolado, célula, composição ou método de qualquer uma das modalidades precedentes, em que pelo menos 30% (por exemplo, pelo menos 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 90% ou mais) dos aminoácidos da molécula ORF1 são parte de uma folha β.
[00695] 1147. O polipeptídeo, complexo, anelossomo, ácido nucleico isolado, célula, composição ou método de qualquer uma das modalidades precedentes, em que a estrutura secundária da molécula ORF1 compreende pelo menos três (por exemplo, pelo menos 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, ou 20) folhas β.
[00696] 1148. O polipeptídeo, complexo, anelossomo, ácido nucleico isolado, célula, composição ou método de qualquer uma das modalidades precedentes, em que a estrutura secundária da molécula ORF1 compreende uma razão entre folhas β e hélices α de pelo menos 1:1, 2:1, 3:1, 4:1, 5:1, 6:1, 7:1, 8:1, 9:1, ou 10:1.
[00697] 1149. O polipeptídeo, complexo, anelossomo, ácido nucleico isolado, célula, composição ou método de qualquer uma das modalidades precedentes, em que a molécula ORF1 compreende uma região rica em arginina (por exemplo, possuindo pelo menos 70%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade com uma sequência de região rica em arginina listada em qualquer uma das Tabelas A2, A4, A6, A8, A10, A12, C1-C5, 2, 4, 6, 8, 10, 12, 14, 16, 18, 20-37, ou D1-D10).
[00698] 1150. O polipeptídeo, complexo, anelossomo, ácido nucleico isolado, célula, composição ou método da modalidade 1149, em que a região rica em arginina compreende pelo menos 15, 20, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 45, ou 50 nucleotídeos consecutivos compreendendo pelo menos 40% (por exemplo, pelo menos 40%, 41%, 42%, 43%, 44%, 45%, 46%, 47%, 48%, 49%, 50%, 55%, 60%, 65%, 66%, 67%, 68%, 69%, 70%, 75%, 80%, 85%, 90%, ou 95%) resíduos de arginina.
[00699] 1151. O polipeptídeo, complexo, anelossomo, ácido nucleico isolado, célula, composição ou método da modalidade 1149 ou 1150, em que a região rica em arginina está localizada na extremidade N- terminal ou C-terminal da molécula ORF1.
[00700] 1152. O polipeptídeo, complexo, anelossomo, ácido nucleico isolado, célula, composição ou método de qualquer uma das modalidades 1149-1151, em que a região rica em arginina tem pelo menos 70% (por exemplo, pelo menos 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100%) de identidade de sequências com a sequência de aminoácidos TVVRRRGRSPRRRTPSPRRRRSQSPRRRRSQSRESQC (SEQ ID NO: 808), RRRYARPYRRRHIRRYRRRRRHFRRRR (SEQ ID NO: 809), MPYYYRRRRYNYRRPRWYGRGWIRRPFRRRFRRKRRVR (SEQ ID NO: 216), ou
MAWGWWKRRRRWWFRKRWTRGRLRRRWPRSARRRPRRRRVRR RRRWRRGRRKTRTYRRRRRFRRRGRK (SEQ ID NO: 186).
[00701] 1153. O polipeptídeo, complexo, anelossomo, ácido nucleico isolado, célula, composição ou método de qualquer uma das modalidades 1149-1152, em que a região rica em arginina tem pelo menos 70%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade com uma sequência de região rica em arginina listada em qualquer uma das Tabelas A2, A4, A6, A8, A10, A12, C1-C5, 2, 4, 6, 8, 10, 12, 14, 16, 18, 20-37, ou D1-D10.
[00702] 1154. O polipeptídeo, complexo, anelossomo, ácido nucleico isolado, célula, composição ou método de qualquer uma das modalidades precedentes, em que a molécula ORF1 compreende um domínio jelly-roll, por exemplo, possuindo pelo menos 30% (por exemplo, pelo menos cerca de 30, 35, 40, 50, 60, 70, 80, 90, 95, 96, 97, 98, 99, ou 100%) de identidade de sequências com a sequência de aminoácidos do domínio jelly-roll de uma molécula ORF1 descrita no presente documento, por exemplo, um domínio jelly-roll possuindo a sequência de aminoácidos
PTYTTIPLKQWQPPYKRTCYIKGQDCLIYYSNLRLGMNSTMYEKSIVP VHWPGGGSFSVSMLTLDALYDIHKLCRNWWTSTNQDLPLVRYKGCK ITFYQSTFTDYIVRIHTELPANSNKLTYPNTHPLMMMMSKYKHIIPSRQ
TRRKKKPYTKIFVKPPPQFENKWYFATDLYKIPLLQIHCTACNLQNPF VKPDKLSNNVTLWSLNT (SEQ ID NO: 217), ou uma sequência de domínio jelly-roll listada em qualquer uma das Tabelas A2, A4, A6, A8, A10, A12, C1-C5, 2, 4, 6, 8, 10, 12, 14, 16, 18, 20-37, ou D1-D10.
[00703] 1155. O polipeptídeo, complexo, anelossomo, ácido nucleico isolado, célula, composição ou método de qualquer uma das modalidades precedentes, em que a molécula ORF1 compreende um domínio N22, por exemplo, possuindo pelo menos 30% (por exemplo, pelo menos cerca de 30, 35, 40, 50, 60, 70, 80, 90, 95, 96, 97, 98, 99, ou 100%) de identidade de sequências com a sequência de aminoácidos do domínio N22 de uma molécula ORF1 descrita no presente documento, por exemplo, um domínio N22 possuindo a sequência de aminoácidos
TMALTPFNEPIFTQIQYNPDRDTGEDTQLYLLSNATGTGWDPPGIPEL ILEGFPLWLIYWGFADFQKNLKKVTNIDTNYMLVAKTKFTQKPGTFYL
VILNDTFVEGNSPYEKQPLPEDNIKWYPQVQYQLEAQNKLLQTGPFT PNIQGQLSDNISMFYKFYFK (SEQ ID NO: 219), ou uma sequência de domínio N22 listada em qualquer uma das Tabelas A2, A4, A6, A8, A10, A12, C1-C5, 2, 4, 6, 8, 10, 12, 14, 16, 18, 20-37, ou D1-D10.
[00704] 1156. O polipeptídeo, complexo, anelossomo, ácido nucleico isolado, célula, composição ou método de qualquer uma das modalidades precedentes, em que a molécula ORF1 se localiza para o núcleo de uma célula.
[00705] 1157. O polipeptídeo, complexo, anelossomo, ácido nucleico isolado, célula, composição ou método de qualquer uma das modalidades precedentes, em que o elemento genético ou molécula de ácido nucleico isolada compreende não mais do que 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências em relação a cerca de 500, 1000, 1100, 1200, 1210 ou 1219 nucleotídeos consecutivos de uma sequência do genoma de Anellovirus de tipo selvagem, por exemplo, como descrito no presente documento.
[00706] 1158. O polipeptídeo, complexo, anelossomo, ácido nucleico isolado, célula, composição ou método de qualquer uma das modalidades precedentes, em que o elemento genético ou molécula de ácido nucleico isolada compreende não mais do que 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências em relação a cerca de 500, 1000, 1500, 2000, 2100, 2200, 2300, 2400, 2500, 2600, 2700, 2800, 2900, 3000, 3100, 3200, 3300, 3400, 3450, 3460, 3470, 3480, 3490, 3500, 3510, 3520, 3530, 3540, 3550, 3560, 3570, ou 3580 nucleotídeos consecutivos de uma sequência do genoma de Alphatorquevirus de tipo selvagem (por exemplo, um Alphatorquevirus clade 1, 2 ou 3), por exemplo, como descrito no presente documento.
[00707] 1159. O polipeptídeo, complexo, anelossomo, ácido nucleico isolado, célula, composição ou método de qualquer uma das modalidades precedentes, em que o elemento genético ou molécula de ácido nucleico isolada compreende não mais do que 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências em relação a cerca de 500, 1000, 1100, 1200, 1210 ou 1219 nucleotídeos consecutivos de uma sequência do genoma de Betatorquevirus de tipo selvagem, por exemplo, como descrito no presente documento.
[00708] 1160. O polipeptídeo, complexo, anelossomo, ácido nucleico isolado, célula, composição ou método de qualquer uma das modalidades precedentes, em que o elemento genético ou molécula de ácido nucleico isolada compreende não mais do que 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências em relação a cerca de 500, 1000, 1500, 2000, 2100, 2200, 2300, 2400, 2500, 2600, 2700, 2800, 2900, 3000, 3100, 3120, 3130, 3140, 3141, ou 3142 nucleotídeos consecutivos de uma sequência do genoma de Gammatorquevirus, por exemplo, como descrito no presente documento.
[00709] 1161. O polipeptídeo, complexo, anelossomo, ácido nucleico isolado, célula, composição ou método de qualquer uma das modalidades precedentes, em que o elemento genético ou molécula de ácido nucleico isolada compreende pelo menos 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências em relação a pelo menos cerca de 500, 1000, 1500, 2000, 2100, 2200, 2300, 2400, 2500, 2600, 2700, 2800, 2900, 3000, 3100, 3200, 3300, 3400, 3450, 3460, 3470, 3480, 3490, 3500, 3510, 3520, 3530, 3540, 3550, 3560, 3570, ou 3580 nucleotídeos consecutivos (por exemplo, cerca de 500-3580, 1000-3580, 1500-3580, 2000-3580 ou 3000-3580 nucleotídeos consecutivos) de uma sequência do genoma de Alphatorquevirus de tipo selvagem (por exemplo, um Alphatorquevirus clade 1, 2 ou 3), por exemplo, como descrito no presente documento.
[00710] 1162. O polipeptídeo, complexo, anelossomo, ácido nucleico isolado, célula, composição ou método de qualquer uma das modalidades precedentes, em que o elemento genético ou molécula de ácido nucleico isolada compreende pelo menos 50%, 60%, 70%, 80%,
90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências em relação a pelo menos cerca de 500, 1000, 1100, 1200, 1210 ou 1219 nucleotídeos consecutivos (por exemplo, cerca de 500-1000, 500-1100, 500-1200, 500-1219, 1000-1100, 1000-1200 ou 1000-1219 nucleotídeos consecutivos) de uma sequência do genoma de Betatorquevirus de tipo selvagem, por exemplo, como descrito no presente documento.
[00711] 1163. O polipeptídeo, complexo, anelossomo, ácido nucleico isolado, célula, composição ou método de qualquer uma das modalidades precedentes, em que o elemento genético ou molécula de ácido nucleico isolada compreende pelo menos 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências em relação a pelo menos cerca de 500, 1000, 1500, 2000, 2100, 2200, 2300, 2400, 2500, 2600, 2700, 2800, 2900, 3000, 3100, 3120, 3130, 3140, 3141, ou 3142 nucleotídeos consecutivos (por exemplo, cerca de 500-3142, 1000-3142, 1500-3142, 2000-3142 ou 2500-3142 nucleotídeos consecutivos) de uma sequência do genoma de Gammatorquevirus de tipo selvagem, por exemplo, como descrito no presente documento.
[00712] 1164. O polipeptídeo, complexo, anelossomo, ácido nucleico isolado, célula, composição ou método de qualquer uma das modalidades precedentes, em que o elemento genético ou molécula de ácido nucleico isolada compreende não mais do que 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98%, ou 99% de identidade de sequências em relação a cerca de 500, 1000, 1100, 1200, 1210 ou 1219 nucleotídeos consecutivos de uma sequência do genoma de TTMV-LY2 de tipo selvagem, por exemplo, como descrito no presente documento.
[00713] 1165. O polipeptídeo, complexo, anelossomo, ácido nucleico isolado, célula, composição ou método de qualquer uma das modalidades precedentes, em que o elemento genético ou molécula de ácido nucleico isolada compreende não mais do que 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98%, ou 99% de identidade de sequências em relação a cerca de 500, 1000, 1500, 2000, 2100, 2200, 2300, 2400, 2500, 2600, 2700, 2800, 2900, 3000, 3100, 3200, 3300, 3400, 3500, 3550, 3560, 3570, 3580, ou 3581 nucleotídeos consecutivos de uma sequência do genoma de TTV-tth8, por exemplo, como descrito no presente documento.
[00714] 1166. O polipeptídeo, complexo, anelossomo, ácido nucleico isolado, célula, composição ou método de qualquer uma das modalidades precedentes, em que o elemento genético ou molécula de ácido nucleico isolada compreende uma deleção de pelo menos 1578, 1579, 1580, 1590, 1600, 1650, 1700, 1750 ou 2000 nucleotídeos em relação a uma sequência do genoma de Anellovirus de tipo selvagem, por exemplo, como descrito no presente documento.
[00715] 1167. O polipeptídeo, complexo, anelossomo, ácido nucleico isolado, célula, composição ou método de qualquer uma das modalidades precedentes, em que o elemento genético ou molécula de ácido nucleico isolada compreende uma deleção de entre 1 e 99, 1 e 90, 1 e 80, 1 e 70, 1 e 60, 1 e 50, 10 e 99, 10 e 90, 10 e 80, 10 e 70, 10 e 60, 10 e 50, 20 e 99, 20 e 90, 20 e 80, 20 e 70, 20 e 60, 20 e 50, 30 e 99, 30 e 90, 30 e 80, 30 e 70, 30 e 60, 30 e 50, 40 e 99, 40 e 90, 40 e 80, 40 e 70, 40 e 60 ou 40 e 50 nucleotídeos em relação a uma sequência do genoma de Anellovirus de tipo selvagem, por exemplo, como descrito no presente documento.
[00716] 1168. O polipeptídeo, complexo, anelossomo, ácido nucleico isolado, célula, composição ou método de qualquer uma das modalidades precedentes, em que o elemento genético ou molécula de ácido nucleico isolada não tem uma deleção de 100 nucleotídeos, uma deleção de 172 nucleotídeos ou uma deleção de 1577 nucleotídeos em relação a uma sequência do genoma de Anellovirus de tipo selvagem,
por exemplo, como descrito no presente documento.
[00717] 1169. O polipeptídeo, complexo, anelossomo, ácido nucleico isolado, célula, composição ou método de qualquer uma das modalidades precedentes, em que o elemento genético ou molécula de ácido nucleico isolada compreende três ou mais deleções em relação a uma sequência do genoma de Anellovirus, por exemplo, como descrito no presente documento.
[00718] 1170. O polipeptídeo, complexo, anelossomo, ácido nucleico isolado, célula, composição ou método de qualquer uma das modalidades precedentes, em que o elemento genético ou molécula de ácido nucleico isolada compreende uma região possuindo pelo menos 75% (por exemplo, pelo menos 75, 76, 77, 78, 79, 80, 85, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99, ou 100%) de identidade de sequências com a sequência de ácidos nucleicos:
[00719] (i) CGCGCTGCGCGCGCCGCCCAGTAGGGGGAGCCATGC (SEQ ID NO: 160),
[00720] (ii) GCGCTX1CGCGCGCGCGCCGGGGGGCTGCGCCCCCCC (SEQ ID NO: 164), em que X1 é selecionado de T, G ou A;
[00721] (iii) GCGCTTCGCGCGCCGCCCACTAGGGGGCGTTGCGCG (SEQ ID NO: 165);
[00722] (iv) GCGCTGCGCGCGCCGCCCAGTAGGGGGCGCAATGCG (SEQ ID NO: 166);
[00723] (v) GCGCTGCGCGCGCGGCCCCCGGGGGAGGCATTGCCT (SEQ ID NO: 167);
[00724] (vi)
GCGCTGCGCGCGCGCGCCGGGGGGGCGCCAGCGCCC (SEQ ID NO: 168);
[00725] (vii) GCGCTTCGCGCGCGCGCCGGGGGGCTCCGCCCCCCC (SEQ ID NO: 169);
[00726] (viii) GCGCTTCGCGCGCGCGCCGGGGGGCTGCGCCCCCCC (SEQ ID NO: 170);
[00727] (ix) GCGCTACGCGCGCGCGCCGGGGGGCTGCGCCCCCCC (SEQ ID NO: 171); ou
[00728] (x) GCGCTACGCGCGCGCGCCGGGGGGCTCTGCCCCCCC (SEQ ID NO: 172).
[00729] 1171. O polipeptídeo, complexo, anelossomo, ácido nucleico isolado, célula, composição ou método de qualquer uma das modalidades precedentes, em que o elemento genético ou molécula de ácido nucleico isolada compreende uma região possuindo pelo menos 95% (por exemplo, pelo menos 95, 96, 97, 98, 99 ou 100%) de identidade de sequências com a sequência de ácidos nucleicos:
[00730] (i) CGCGCTGCGCGCGCCGCCCAGTAGGGGGAGCCATGC (SEQ ID NO: 160),
[00731] (ii) GCGCTX1CGCGCGCGCGCCGGGGGGCTGCGCCCCCCC (SEQ ID NO: 164), em que X1 é selecionado de T, G ou A;
[00732] (iii) GCGCTTCGCGCGCCGCCCACTAGGGGGCGTTGCGCG (SEQ ID NO: 165);
[00733] (iv)
GCGCTGCGCGCGCCGCCCAGTAGGGGGCGCAATGCG (SEQ ID NO: 166);
[00734] (v) GCGCTGCGCGCGCGGCCCCCGGGGGAGGCATTGCCT (SEQ ID NO: 167);
[00735] (vi) GCGCTGCGCGCGCGCGCCGGGGGGGCGCCAGCGCCC (SEQ ID NO: 168);
[00736] (vii) GCGCTTCGCGCGCGCGCCGGGGGGCTCCGCCCCCCC (SEQ ID NO: 169);
[00737] (viii) GCGCTTCGCGCGCGCGCCGGGGGGCTGCGCCCCCCC (SEQ ID NO: 170);
[00738] (ix) GCGCTACGCGCGCGCGCCGGGGGGCTGCGCCCCCCC (SEQ ID NO: 171); ou
[00739] (x) GCGCTACGCGCGCGCGCCGGGGGGCTCTGCCCCCCC (SEQ ID NO: 172).
[00740] 1172. O polipeptídeo, complexo, anelossomo, ácido nucleico isolado, célula, composição ou método de qualquer uma das modalidades precedentes, em que o elemento genético ou molécula de ácido nucleico isolada compreende uma região possuindo pelo menos 75% (por exemplo, pelo menos 75, 76, 77, 78, 79, 80, 85, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99, ou 100%) de identidade de sequências com a sequência de ácidos nucleicos
CCGCCATCTTAAGTAGTTGAGGCGGACGGTGGCGTGAGTTCAAA GGTCACCATCAGCCACACCTACTCAAAATGGTGG (SEQ ID NO: 161).
[00741] 1173. O polipeptídeo, complexo, anelossomo, ácido nucleico isolado, célula, composição ou método de qualquer uma das modalidades precedentes, em que o elemento genético ou molécula de ácido nucleico isolada compreende uma região possuindo pelo menos 75% (por exemplo, pelo menos 75, 76, 77, 78, 79, 80, 85, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99, ou 100%) de identidade de sequências com a sequência de ácidos nucleicos
CTTAAGTAGTTGAGGCGGACGGTGGCGTGAGTTCAAAGGTCACC ATCAGCCACACCTACTCAAAATGGTGGACAATTTCTTCCGGGTCA
AAGGTTACAGCCGCCATGTTAAAACACGTGACGTATGACGTCACG GCCGCCATTTTGTGACACAAGATGGCCGACTTCCTTCC (SEQ ID NO: 162).
[00742] 1174. O polipeptídeo, complexo, anelossomo, ácido nucleico isolado, célula, composição ou método de qualquer uma das modalidades precedentes, em que o elemento genético ou molécula de ácido nucleico isolada compreende pelo menos 20, 25, 30, 31, 32, 33, 34, 35, ou 36 nucleotídeos consecutivos possuindo um conteúdo de GC de pelo menos 80%.
[00743] 1175. O polipeptídeo, complexo, anelossomo, ácido nucleico isolado, célula, composição ou método de qualquer uma das modalidades precedentes, em que o elemento genético ou molécula de ácido nucleico isolada compreende pelo menos 36 nucleotídeos consecutivos possuindo um conteúdo de GC de pelo menos 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, ou 80,6%.
[00744] 1176. O polipeptídeo, complexo, anelossomo, ácido nucleico isolado, célula, composição ou método de qualquer uma das modalidades precedentes, em que o elemento genético ou molécula de ácido nucleico isolada compreende pelo menos 36 nucleotídeos consecutivos possuindo um conteúdo de GC de pelo menos 80%.
[00745] 1177. O polipeptídeo, complexo, anelossomo, ácido nucleico isolado, célula, composição ou método de qualquer uma das modalidades precedentes, compreendendo ainda uma sequência de ácidos nucleicos codificando uma ORF1, ORF1/1, ORF1/2, ORF2, ORF2/2, ORF2/3, ORF2t/3 e/ou ORF3 de um Anellovirus, por exemplo, um Anellovirus de tipo selvagem, por exemplo, como descrito no presente documento.
[00746] 1178. O polipeptídeo, complexo, anelossomo, ácido nucleico isolado, célula, composição ou método de qualquer uma das modalidades precedentes, em que o elemento promotor, sequência de ácidos nucleicos codificando o efetor ou sequência de ligação à proteína tem pelo menos 75% (por exemplo, pelo menos 75, 76, 77, 78, 79, 80, 85, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99, ou 100%) de identidade de sequências com um elemento promotor, sequência de ácidos nucleicos codificando um efetor ou sequência de ligação à proteína, respectivamente, de um Anellovirus de qualquer uma das Tabelas A1- A12, B1-B5, C1-C5 ou 1-18, por exemplo, como descrito no presente documento.
[00747] 1179. O polipeptídeo, complexo, anelossomo, ácido nucleico isolado, célula, composição ou método de qualquer uma das modalidades precedentes, em que o elemento genético ou molécula de ácido nucleico isolada compreende uma região de empacotamento posicionada 3´ em relação à sequência de ácidos nucleicos codificando o efetor.
[00748] 1180. O polipeptídeo, complexo, anelossomo, ácido nucleico isolado, célula, composição ou método de qualquer uma das modalidades precedentes, em que o elemento genético ou molécula de ácido nucleico isolada compreende uma região de empacotamento posicionada 5´ em relação à sequência de ácidos nucleicos codificando o efetor.
[00749] 1181. O polipeptídeo, complexo, anelossomo, ácido nucleico isolado, célula, composição ou método de qualquer uma das modalidades precedentes, em que o elemento genético ou molécula de ácido nucleico isolada compreende uma sequência de ácidos nucleicos codificando uma proteína de Anellovirus possuindo pelo menos 75% (por exemplo, pelo menos 75, 76, 77, 78, 79, 80, 85, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99, ou 100%) de identidade de sequências com a sequência de aminoácidos de uma ORF1, ORF1/1, ORF1/2, ORF2, ORF2/2, ORF2/3, ORF2t/3 e/ou ORF3 de um Anellovirus descrito no presente documento.
[00750] 1182. O polipeptídeo, complexo, anelossomo, ácido nucleico isolado, célula, composição ou método de qualquer uma das modalidades precedentes, em que o elemento genético ou molécula de ácido nucleico isolada compreende um DNA de fita simples.
[00751] 1183. O polipeptídeo, complexo, anelossomo, ácido nucleico isolado, célula, composição ou método de qualquer uma das modalidades precedentes, em que o elemento genético ou molécula de ácido nucleico isolada é circular e/ou se integra no genoma de uma célula eucariótica a uma frequência de menos do que cerca de 0,001%, 0,005%, 0,01%, 0,05%, 0,1%, 0,5%, 1%, 1,5%, ou 2% do elemento genético que entra na célula.
[00752] 1184. O polipeptídeo, complexo, anelossomo, ácido nucleico isolado, célula, composição ou método de qualquer uma das modalidades precedentes, em que o elemento genético ou ácido nucleico isolado tem pelo menos 75% (por exemplo, pelo menos 75, 76, 77, 78, 79, 80, 85, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99, ou 100%) de identidade de sequências com uma sequência de Anellovirus de tipo selvagem (por exemplo, um vírus Torque Teno (TTV) de tipo selvagem, minivírus Torque Teno (TTMV) ou sequência de TTMDV, por exemplo, uma sequência de Anellovirus de tipo selvagem, por exemplo, como listado em qualquer uma das Tabelas A1, A3, A5, A7, A9, A11, B1-B5,
1, 3, 5, 7, 9, 11, 13, 15, ou 17) ou uma sua porção consistindo em cerca de 50, 60, 70, 80, 90, 100, 150, 200, 250, 300, 350, 400, 450, 500, 600, 700, 800, 900, 1000, 1100, 1200, 1300, 1400, 1500, 1600, 1700, 1800, 1900, 2000, 2100, 2200, 2300, 2400, 2500, 2600, 2700, 2800, 2900, ou 3000 nucleotídeos consecutivos dela.
[00753] 1185. O polipeptídeo, complexo, anelossomo, ácido nucleico isolado, célula, composição ou método de qualquer uma das modalidades precedentes, em que a sequência de ligação à proteína tem pelo menos 75% (por exemplo, pelo menos 75, 76, 77, 78, 79, 80, 85, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99, ou 100%) de identidade de sequências com a sequência de 5´ UTR de Consenso mostrada na Tabela 20.
[00754] 1186. O polipeptídeo, complexo, anelossomo, ácido nucleico isolado, célula, composição ou método de qualquer uma das modalidades precedentes, em que a sequência de ligação à proteína tem pelo menos 75% (por exemplo, pelo menos 75, 76, 77, 78, 79, 80, 85, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99, ou 100%) de identidade de sequências com a sequência rica em GC de Consenso mostrada na Tabela 21.
[00755] 1187. O polipeptídeo, complexo, anelossomo, ácido nucleico isolado, célula, composição ou método de qualquer uma das modalidades precedentes, em que a sequência de ligação à proteína tem pelo menos 75% (por exemplo, pelo menos 75, 76, 77, 78, 79, 80, 85, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99, ou 100%) de identidade de sequências com uma sequência de 5´ UTR mostrada na Tabela 38 e com uma sequência rica em GC mostrada na Tabela 39.
[00756] 1188. O polipeptídeo, complexo, anelossomo, ácido nucleico isolado, célula, composição ou método de qualquer uma das modalidades precedentes, em que o elemento genético ou molécula de ácido nucleico isolada compreende uma sequência possuindo pelo menos 85% de identidade de sequências com o domínio conservado 5´ UTR de Anellovirus da sequência de ácidos nucleicos de qualquer uma das Tabelas A1, A3, A5, A7, A9, A11, B1-B5, 1, 3, 5, 7, 9, 11, 13, 15, ou
17.
[00757] 1189. O polipeptídeo, complexo, anelossomo, ácido nucleico isolado, célula, composição ou método de qualquer uma das modalidades precedentes, em que o elemento genético ou molécula de ácido nucleico isolada compreende uma sequência possuindo pelo menos 85% de identidade de sequências com a sequência rica em GC de Anellovirus da sequência de ácidos nucleicos da Tabela A1, A3, A5, A7, A9, A11, B1-B5, 1, 3, 5, 7, 9, 11, 13, 15, ou 17.
[00758] 1190. O polipeptídeo, complexo, anelossomo, ácido nucleico isolado, célula, composição ou método de qualquer uma das modalidades precedentes, em que o elemento promotor compreende um promotor dependente de RNA polimerase II, um promotor dependente de RNA polimerase III, um promotor de PGK, um promotor de CMV, um promotor de EF-1α, um promotor de SV40, um promotor de CAGG ou um promotor de UBC, promotores virais de TTV, Específico de tecidos, U6 (pollIII), promotor mínimo de CMV com locais de ligação ao DNA a montante para proteínas ativadoras (TetR-VP16, Gal4-VP16, dCas9-VP16, etc.).
[00759] 1191. O polipeptídeo, complexo, anelossomo, ácido nucleico isolado, célula, composição ou método de qualquer uma das modalidades precedentes, em que o efetor codifica um agente terapêutico, por exemplo, um peptídeo ou polipeptídeo terapêutico ou um ácido nucleico terapêutico.
[00760] 1192. O polipeptídeo, complexo, anelossomo, ácido nucleico isolado, célula, composição ou método de qualquer uma das modalidades precedentes, em que o efetor compreende um ácido nucleico regulador, por exemplo, um miRNA, siRNA, mRNA, lncRNA,
RNA, DNA, um RNA antissenso, gRNA; uma etiqueta ou marcador fluorescente, um antígeno, um peptídeo, um peptídeo sintético ou análogo a partir de um peptídeo naturalmente bioativo, um peptídeo agonista ou antagonista, um peptídeo antimicrobiano, um peptídeo formador de poros, um peptídeo bicíclico, um peptídeo de direcionamento ou citotóxico, um peptídeo de degradação ou autodestruição, uma molécula pequena, um efetor imunitário (por exemplo, influencia a suscetibilidade a uma resposta/sinal imunitário), uma proteína de morte (por exemplo, um indutor da apoptose ou necrose), um inibidor não lítico de um tumor (por exemplo, um inibidor de uma oncoproteína), um agente modificador epigenético, uma enzima epigenética, um fator de transcrição, uma enzima de modificação de DNA ou proteína, um agente intercalador de DNA, um inibidor da bomba de efluxo, um ativador ou inibidor de receptor nuclear, um inibidor de proteassomo, um inibidor competitivo para uma enzima, um efetor ou inibidor da síntese de proteína, uma nuclease, um fragmento ou domínio de proteína, um ligante, um anticorpo, um receptor ou um sistema ou componente de CRISPR.
[00761] 1193. O polipeptídeo, complexo, anelossomo, ácido nucleico isolado, célula, composição ou método de qualquer uma das modalidades precedentes, em que o anelossomo é capaz de se replicar autonomamente.
[00762] 1194. A molécula de ácido nucleico isolada de qualquer uma das modalidades precedentes, em que o vetor de expressão é selecionado do grupo consistindo em um plasmídeo, um cosmídeo, um cromossomo artificial, um fago e um vírus.
[00763] 1195. Uma célula isolada compreendendo o ácido nucleico isolado ou anelossomo de qualquer uma das modalidades precedentes.
[00764] 1196. A célula isolada da modalidade 195, compreendendo ainda uma ORF1/1, ORF1/2, ORF2, ORF2/2, ORF2/3, ORF2t/3 e/ou
ORF3 de um Anellovirus, por exemplo, um Anellovirus de tipo selvagem, por exemplo, como descrito no presente documento.
[00765] 1197. Um método de entrega de um efetor a um indivíduo, compreendendo administração do polipeptídeo, complexo, anelossomo, ácido nucleico isolado, célula isolada ou composição de qualquer uma das modalidades precedentes ao indivíduo; em que o elemento genético ou molécula de ácido nucleico isolada codifica um efetor, e em que o efetor é expresso no indivíduo.
[00766] 1198. Um método de tratamento de uma doença ou disfunção em um indivíduo com sua necessidade, compreendendo administração do polipeptídeo, complexo, anelossomo, ácido nucleico isolado, célula isolada ou composição de qualquer uma das modalidades precedentes ao indivíduo; em que o elemento genético ou molécula de ácido nucleico isolada codifica um agente terapêutico, e em que o agente terapêutico é expresso no indivíduo.
[00767] 1199. Um método de entrega de um efetor a uma célula ou população de células ex vivo (por exemplo, uma célula ou população de células obtidas de um indivíduo), compreendendo introdução do polipeptídeo, complexo, anelossomo, ácido nucleico isolado, célula isolada ou composição de qualquer uma das modalidades precedentes na célula ou população de células; em que o elemento genético ou molécula de ácido nucleico isolada codifica um efetor, e em que o efetor é expresso na célula ou população de células.
[00768] 1200. O anelossomo de qualquer uma das modalidades precedentes, em que o elemento genético é um DNA de fita simples e tem uma das ou ambas as seguintes propriedades: é circular e/ou se integra no genoma de uma célula eucariótica a uma frequência de menos do que cerca de 0,001%, 0,005%, 0,01%, 0,05%, 0,1%, 0,5%, 1%, 1,5%, ou 2% do elemento genético que entra na célula.
[00769] 1201. O anelossomo de qualquer uma das modalidades precedentes, em que o elemento genético tem pelo menos 75% (por exemplo, pelo menos 75, 76, 77, 78, 79, 80, 85, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99, ou 100%) de identidade de sequências com uma sequência de Anellovirus de tipo selvagem (por exemplo, um vírus Torque Teno (TTV) de tipo selvagem, minivírus Torque Teno (TTMV) ou sequência de TTMDV, por exemplo, uma sequência de Anellovirus de tipo selvagem, por exemplo, como listado em qualquer uma das Tabelas A1, A3, A5, A7, A9, A11, B1-B5, 1, 3, 5, 7, 9, 11, 13, 15, ou 17).
[00770] 1202. O anelossomo de qualquer uma das modalidades precedentes, em que a sequência de ligação à proteína tem pelo menos 75% (por exemplo, pelo menos 75, 76, 77, 78, 79, 80, 85, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99, ou 100%) de identidade de sequências com a sequência de 5´ UTR de Consenso mostrada na Tabela 38 ou com a sequência rica em GC de Consenso mostrada na Tabela 39 ou com ambas a sequência 5´ UTR de Consenso mostrada na Tabela 38 e a sequência rica em GC de Consenso mostrada na Tabela 39.
[00771] 1203. O anelossomo de qualquer uma das modalidades precedentes, em que o elemento promotor compreende um promotor dependente de RNA polimerase II, um promotor dependente de RNA polimerase III, um promotor de PGK, um promotor de CMV, um promotor de EF-1α, um promotor de SV40, um promotor de CAGG ou um promotor de UBC, promotores virais de TTV, Específico de tecidos, U6 (pollIII), promotor mínimo de CMV com locais de ligação ao DNA a montante para proteínas ativadoras (TetR-VP16, Gal4-VP16, dCas9- VP16, etc.).
[00772] 1204. O anelossomo de qualquer uma das modalidades precedentes, em que o elemento promotor compreende uma caixa TATA.
[00773] 1205. O anelossomo de qualquer uma das modalidades precedentes, em que o elemento promotor é endógeno a um Anellovirus de tipo selvagem, por exemplo, uma sequência de Anellovirus de tipo selvagem como listado em qualquer uma das Tabelas A1, A3, A5, A7, A9, A11, B1-B5, 1, 3, 5, 6, 9, 11, 13, 15, ou 17.
[00774] 1206. O anelossomo de qualquer uma das modalidades precedentes, em que o elemento promotor é exógeno a Anellovirus de tipo selvagem, por exemplo, uma sequência de Anellovirus de tipo selvagem como listado em qualquer uma das Tabelas A1, A3, A5, A7, A9, A11, B1-B5, 1, 3, 5, 6, 9, 11, 13, 15, ou 17.
[00775] 1207. O anelossomo de qualquer uma das modalidades precedentes, em que o efetor codifica um agente terapêutico, por exemplo, um peptídeo ou polipeptídeo terapêutico ou um ácido nucleico terapêutico.
[00776] 1208. O anelossomo de qualquer uma das modalidades precedentes, em que o efetor compreende um ácido nucleico regulador, por exemplo, um miRNA, siRNA, mRNA, lncRNA, RNA, DNA, um RNA antissenso, gRNA; uma etiqueta ou marcador fluorescente, um antígeno, um peptídeo, um peptídeo sintético ou análogo a partir de um peptídeo naturalmente bioativo, um peptídeo agonista ou antagonista, um peptídeo antimicrobiano, um peptídeo formador de poros, um peptídeo bicíclico, um peptídeo de direcionamento ou citotóxico, um peptídeo de degradação ou autodestruição, uma molécula pequena, um efetor imunitário (por exemplo, influencia a suscetibilidade a uma resposta/sinal imunitário), uma proteína de morte (por exemplo, um indutor da apoptose ou necrose), um inibidor não lítico de um tumor (por exemplo, um inibidor de uma oncoproteína), um agente modificador epigenético, uma enzima epigenética, um fator de transcrição, uma enzima de modificação de DNA ou proteína, um agente intercalador de DNA, um inibidor da bomba de efluxo, um ativador ou inibidor de receptor nuclear, um inibidor de proteassomo, um inibidor competitivo para uma enzima, um efetor ou inibidor da síntese de proteína, uma nuclease, um fragmento ou domínio de proteína, um ligante, um anticorpo, um receptor ou um sistema ou componente de CRISPR.
[00777] 1209. O anelossomo de qualquer uma das modalidades precedentes, em que o efetor compreende um miRNA.
[00778] 1210. O anelossomo de qualquer uma das modalidades precedentes, em que o efetor, por exemplo, miRNA, visa um gene hospedeiro, por exemplo, modula a expressão do gene, por exemplo, aumenta ou diminui a expressão do gene.
[00779] 1211. O anelossomo de qualquer uma das modalidades precedentes, em que o efetor compreende um miRNA e diminui a expressão de um gene hospedeiro.
[00780] 1212. O anelossomo de qualquer uma das modalidades precedentes, em que o efetor compreende uma sequência de ácidos nucleicos com cerca de 20-200, 30-180, 40-160, 50-140 ou 60-120 nucleotídeos em comprimento.
[00781] 1213. O anelossomo de qualquer uma das modalidades precedentes, em que a sequência de ácidos nucleicos codificando o efetor tem cerca de 20-200, 30-180, 40-160, 50-140 ou 60-120 nucleotídeos em comprimento.
[00782] 1214. O anelossomo de qualquer uma das modalidades precedentes, em que a sequência codificando o efetor tem um tamanho de pelo menos cerca de 100 nucleotídeos.
[00783] 1215. O anelossomo de qualquer uma das modalidades precedentes, em que a sequência codificando o efetor tem um tamanho de cerca de 100 a cerca de 5000 nucleotídeos.
[00784] 1216. O anelossomo de qualquer uma das modalidades precedentes, em que a sequência codificando o efetor tem um tamanho de cerca de 100-200, 200-300, 300-400, 400-500, 500-600, 600-700, 700-800, 800-900, 900-1000, 1000-1500, ou 1500-2000 nucleotídeos.
[00785] 1217. O anelossomo de qualquer uma das modalidades precedentes, em que a sequência codificando o efetor está situada em, dentro de ou adjacente a (por exemplo, 5´ ou 3´) um ou mais do lócus de ORF1 (por exemplo, no terminal C do lócus de ORF1), do lócus de miRNA, da região não codificante 5’ a montante da caixa TATA, da 5´ UTR, da região não codificante 3’ a jusante da região de poli-A ou uma região não codificante a montante da região rica em GC do elemento genético.
[00786] 1218. O anelossomo da modalidade 1217, em que a sequência codificando o efetor está localizada entre a região de poli-A e a região rica em GC do elemento genético.
[00787] 1219. O anelossomo de qualquer uma das modalidades precedentes, em que a sequência de ligação à proteína compreende uma sequência de ácidos nucleicos possuindo pelo menos 75% (por exemplo, pelo menos 75, 76, 77, 78, 79, 80, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99, ou 100%) de identidade de sequências com o domínio conservado 5´ UTR ou com o domínio rico em GC de um Anellovirus de tipo selvagem, por exemplo, uma sequência de Anellovirus de tipo selvagem como listado em qualquer uma das Tabelas A1, A3, A5, A7, A9, A11, B1-B5, 1, 3, 5, 6, 9, 11, 13, 15, ou 17.
[00788] 1220. O anelossomo de qualquer uma das modalidades precedentes, em que o elemento genético, por exemplo, sequência de ligação à proteína do elemento genético, compreende pelo menos cerca de 75% (por exemplo, pelo menos 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100%) de identidade com:
[00789] (i) a sequência de ácidos nucleicos de 5´ UTR de Consenso da Tabela 38;
[00790] (ii) a sequência de ácidos nucleicos de 5´ UTR de TTV exemplificativa da Tabela 38;
[00791] (iii) a sequência de ácidos nucleicos de 5´ UTR de TTV- CT30F da Tabela 38;
[00792] (iv) a sequência de ácidos nucleicos de 5´ UTR de TTV- HD23a da Tabela 38;
[00793] (v) a sequência de ácidos nucleicos de 5´ UTR de TTV-JA20 da Tabela 38;
[00794] (vi) a sequência de ácidos nucleicos de 5´ UTR de TTV- TJN02 da Tabela 38;
[00795] (vii) a sequência de ácidos nucleicos de 5´ UTR de TTV-tth8 da Tabela 38;
[00796] (viii) a região rica em GC de Consenso mostrada na Tabela 39;
[00797] (ix) a região rica em GC de TTV exemplificativa mostrada na Tabela 39;
[00798] (x) a região rica em GC de TTV-CT30F mostrada na Tabela 39;
[00799] (xi) a região rica em GC de TTV-JA20 mostrada na Tabela 39;
[00800] (xii) a região rica em GC de TTV-TJN02 mostrada na Tabela 39;
[00801] (xiii) a região rica em GC de TTV-HD23a mostrada na Tabela 39; ou
[00802] (xiv) a região rica em GC de TTV-tth8 mostrada na Tabela 39.
[00803] 1221. O anelossomo de qualquer uma das modalidades precedentes, em que o exterior proteináceo compreende uma proteína exterior capaz de se ligar especificamente à sequência de ligação à proteína.
[00804] 1222. O anelossomo de qualquer uma das modalidades precedentes, em que o exterior proteináceo compreende uma ou mais das seguintes: uma ou mais proteínas glicosiladas, uma região de ligação ao DNA hidrofílica, uma região rica em treonina, uma região rica em glutamina, uma sequência de poliarginina N-terminal, uma região variável, uma sequência de poliglutamina/glutamato C-terminal e uma ou mais pontes de dissulfeto.
[00805] 1223. O anelossomo de qualquer uma das modalidades precedentes, em que o exterior proteináceo compreende uma ou mais das seguintes características: uma simetria icosaédrica, reconhece e/ou se liga a uma molécula que interage com uma ou mais moléculas da célula hospedeira para mediar a entrada na célula hospedeira, carece de moléculas de lipídeos, carece de carboidratos, é estável quanto ao pH e à temperatura, é resistente a detergentes e é substancialmente não imunogênico ou substancialmente não patogênico em um hospedeiro.
[00806] 1224. O anelossomo de qualquer uma das modalidades precedentes, em que o exterior proteináceo compreende pelo menos um domínio funcional que proporciona uma ou mais funções, por exemplo, seletividade de espécies e/ou tecidos e/ou células, ligação e/ou empacotamento do elemento genético, evasão imunitária (não imunogenicidade e/ou tolerância substanciais), farmacocinética, endocitose e/ou anexação celular, entrada nuclear, modulação e localização intracelulares, modulação da exocitose, propagação e proteção de ácidos nucleicos.
[00807] 1225. O anelossomo de qualquer uma das modalidades precedentes, em que as porções do elemento genético excluindo o efetor têm um tamanho combinado de cerca de 2,5-5 kb (por exemplo, cerca de 2,8-4 kb, cerca de 2,8-3,2 kb, cerca de 3,6-3,9 kb ou cerca de 2,8-2,9 kb), menos do que cerca de 5 kb (por exemplo, menos do que cerca de 2,9 kb, 3,2 kb, 3,6 kb, 3,9 kb ou 4 kb) ou pelo menos 100 nucleotídeos (por exemplo, pelo menos 1 kb).
[00808] 1226. O anelossomo de qualquer uma das modalidades precedentes, em que o elemento genético tem fita simples.
[00809] 1227. O anelossomo de qualquer uma das modalidades precedentes, em que o elemento genético é circular.
[00810] 1228. O anelossomo de qualquer uma das modalidades precedentes, em que o elemento genético é DNA.
[00811] 1229. O anelossomo de qualquer uma das modalidades precedentes, em que o elemento genético é um DNA de fita negativa.
[00812] 1230. O anelossomo de qualquer uma das modalidades precedentes, em que o elemento genético compreende um epissomo.
[00813] 1231. O anelossomo de qualquer uma das modalidades precedentes, em que o anelossomo tem um conteúdo de lipídeos de menos do que 10%, 5%, 2% ou 1% em peso, por exemplo, não compreende uma bicamada de lipídeos.
[00814] 1232. O anelossomo de qualquer uma das modalidades precedentes, em que o anelossomo é resistente à degradação por um detergente (por exemplo, um detergente neutro, por exemplo, um sal biliar, por exemplo, desoxicolato de sódio) em relação a uma partícula viral compreendendo uma bicamada de lipídeos exterior, por exemplo, um retrovírus.
[00815] 1233. O anelossomo da modalidade 1232, em que pelo menos cerca de 50% (por exemplo, pelo menos cerca de 50%, 60%, 70%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, 99,5%, ou 99,9%) do anelossomo não é degradado após incubação no detergente (por exemplo, 0,5% em peso do detergente) durante 30 minutos a 37 °C.
[00816] 1234. O anelossomo de qualquer uma das modalidades precedentes, em que o elemento genético compreende uma deleção de pelo menos um elemento, por exemplo, um elemento como listado em qualquer uma das Tabelas A1, A3, A5, A7, A9, A11, B1-B5, 1, 3, 5, 7, 9, 11, 13, 15, ou 17, em relação a uma sequência de Anellovirus de tipo selvagem, por exemplo, uma sequência de TTV de tipo selvagem ou uma sequência de TTMV de tipo selvagem.
[00817] 1235. O anelossomo da modalidade 1234, em que o elemento genético compreende uma deleção compreendendo uma sequência de ácidos nucleicos correspondendo a:
[00818] (i) nucleotídeos 3436-3607 de uma sequência de TTV-tth8, por exemplo, a sequência de ácidos nucleicos mostrada na Tabela 5;
[00819] (ii) nucleotídeos 574-1371 e/ou nucleotídeos 1432-2210 de uma sequência de TTMV-LY2, por exemplo, a sequência de ácidos nucleicos mostrada na Tabela 15;
[00820] (iii) nucleotídeos 1372-1431 de uma sequência de TTMV- LY2, por exemplo, a sequência de ácidos nucleicos mostrada na Tabela 15; ou
[00821] (iv) nucleotídeos 2610-2809 de uma sequência de TTMV- LY2, por exemplo, a sequência de ácidos nucleicos mostrada na Tabela 15.
[00822] 1236. O anelossomo de qualquer uma das modalidades precedentes, em que o elemento genético compreende pelo menos 72 nucleotídeos (por exemplo, pelo menos 73, 74, 75, etc., nt, opcionalmente menos do que o comprimento total do genoma) de uma sequência de Anellovirus de tipo selvagem, por exemplo, um vírus Torque Teno (TTV) de tipo selvagem, um minivírus Torque Teno (TTMV) ou uma sequência de TTMDV, por exemplo, uma sequência como listado em qualquer uma das Tabelas A1, A3, A5, A7, A9, A11, B1-B5, 1, 3, 5, 7, 9, 11, 13, 15, ou 17.
[00823] 1237. O anelossomo de qualquer uma das modalidades precedentes, em que o elemento genético compreende ainda uma ou mais das seguintes sequências: uma sequência que codifica um ou mais miRNAs, uma sequência que codifica uma ou mais proteínas de replicação, uma sequência que codifica um gene exógeno, uma sequência que codifica um terapêutico, uma sequência reguladora (por exemplo, um promotor, intensificador), uma sequência que codifica uma ou mais sequências reguladoras que visam genes endógenos (siRNA, lncRNAs, shRNA), uma sequência que codifica um mRNA ou proteína terapêutico e uma sequência que codifica um RNA/proteína citolítico/citotóxico.
[00824] 1238. O anelossomo de qualquer uma das modalidades precedentes, em que o anelossomo compreende ainda um segundo elemento genético, por exemplo, um segundo elemento genético encerrado dentro do exterior proteináceo.
[00825] 1239. O anelossomo da modalidade 1238, em que o segundo elemento genético compreende uma sequência de ligação à proteína, por exemplo, uma sequência de ligação à proteína exterior, por exemplo, um sinal de empacotamento, por exemplo, um domínio conservado 5´ UTR ou região rica em GC, por exemplo, como descrito no presente documento.
[00826] 1240. O anelossomo de qualquer uma das modalidades precedentes, em que o anelossomo não infecta detectavelmente células bacterianas, por exemplo, infecta menos do que 1%, 0,5%, 0,1% ou 0,01% de células bacterianas.
[00827] 1241. O anelossomo de qualquer uma das modalidades precedentes, em que o anelossomo é capaz de infectar células de mamífero, por exemplo, células humanas, por exemplo, células imunitárias, células hepáticas, células epiteliais, por exemplo, in vitro.
[00828] 1242. O anelossomo de qualquer uma das modalidades precedentes, em que o elemento genético se integra a uma frequência de menos do que 10%, 8%, 6%, 4%, 3%, 2%, 1%, 0,5%, 0,2%, 0,1% dos anelossomos que entram na célula, por exemplo, em que o anelossomo é não integrante.
[00829] 1243. O anelossomo de qualquer uma das modalidades precedentes, em que o elemento genético é capaz de se replicar (por exemplo, por replicação de círculo rolante), por exemplo, capaz de gerar pelo menos 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 20, 30, 40, 50, 60, 70, 80, 90, 102, 2 x 102, 5 x 102,103, 2 x 103, 5 x 103,ou 104 equivalentes genômicos do elemento genético por célula, por exemplo, como medido por um ensaio de PCR quantitativa.
[00830] 1244. O anelossomo de qualquer uma das modalidades precedentes, em que o elemento genético é capaz de se replicar (por exemplo, por replicação de círculo rolante), por exemplo, capaz de gerar pelo menos 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 20, 30, 40, 50, 60, 70, 80, 90, 102, 2 x 102, 5 x 102,103, 2 x 103, 5 x 103,ou 104 mais equivalentes genômicos do elemento genético em uma célula, por exemplo, como medido por um ensaio de PCR quantitativa, do que estavam presentes no anelossomo antes da entrega do elemento genético na célula.
[00831] 1244A. O anelossomo da modalidade 1243 ou 1244, em que o exterior proteináceo é proporcionado em cis e/ou em trans em relação ao elemento genético.
[00832] 1244B. O anelossomo de qualquer uma das modalidades 1243-1244A, em que um ácido nucleico ajudante (por exemplo, um vírus ajudante) na célula codifica o exterior proteináceo ou uma sua porção (por exemplo, uma molécula ORF1).
[00833] 1244C. O anelossomo de qualquer uma das modalidades 1243-1244B, em que um ou mais fatores de replicação (por exemplo, uma replicase) são proporcionados em cis e/ou em trans em relação ao elemento genético.
[00834] 1244D. O anelossomo da modalidade 1244C, em que um ácido nucleico ajudante (por exemplo, um vírus ajudante) na célula codifica o um ou mais fatores de replicação.
[00835] 1245. O anelossomo de qualquer uma das modalidades precedentes, em que o elemento genético não é capaz de se replicar, por exemplo, em que o elemento genético é alterado em uma origem de replicação ou carece de uma origem de replicação.
[00836] 1246. O anelossomo de qualquer uma das modalidades precedentes, em que o elemento genético não é capaz de se autorreplicar, por exemplo, capaz de ser replicado sem ser integrado no genoma de uma célula hospedeira.
[00837] 1247. O anelossomo de qualquer uma das modalidades precedentes, em que o anelossomo é substancialmente não patogênico, por exemplo, não induz um sintoma prejudicial detectável em um indivíduo (por exemplo, elevada morte celular ou toxicidade, por exemplo, em relação a um indivíduo não exposto ao anelossomo).
[00838] 1248. O anelossomo de qualquer uma das modalidades precedentes, em que o anelossomo é substancialmente não imunogênico, por exemplo, não induz uma resposta imunitária detectável e/ou indesejada, por exemplo, como detectado de acordo com o método descrito no Exemplo 4.
[00839] 1249. O anelossomo da modalidade 1248, em que o anelossomo substancialmente não imunogênico tem uma eficácia em um indivíduo que é pelo menos cerca de 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 95%, ou 100% da eficácia em um indivíduo de referência carecendo de uma resposta imunitária.
[00840] 1250. O anelossomo da modalidade 1248 ou 1249, em que a resposta imunitária compreende um ou mais de um anticorpo específico do anelossomo ou uma sua porção ou um produto codificado por um seu ácido nucleico; uma resposta celular (por exemplo, uma resposta de células efetoras (por exemplo, células T ou células NK) imunitárias) contra o anelossomo ou células compreendendo o anelossomo; ou absorção de macrófagos do anelossomo ou células compreendendo o anelossomo.
[00841] 1251. O anelossomo de qualquer uma das modalidades precedentes, em que o anelossomo é menos imunogênico do que um AAV, provoca uma resposta imunitária abaixo daquela detectada para uma quantidade comparável de AAV, por exemplo, como medido por um ensaio descrito no presente documento, induz uma prevalência de anticorpos de menos do que 70% (por exemplo, menos do que cerca de 60%, 50%, 40%, 30%, 20% ou 10% de prevalência de anticorpos) como medido por um ensaio descrito no presente documento, ou é substancialmente não imunogênico.
[00842] 1252. O anelossomo de qualquer uma das modalidades precedentes, em que uma população de pelo menos 1000 dos anelossomos sintéticos é capaz de entregar pelo menos cerca de 100 cópias (por exemplo, pelo menos 1, 2, 3, 4, 5, 10, 20, 30, 40, 50, 100, 200, 300, 400, 500, 600, 700, 800, 900, ou 1000 cópias) do elemento genético em uma ou mais das células eucarióticas.
[00843] 1253. O anelossomo de qualquer uma das modalidades precedentes, em que uma população dos anelossomos (por exemplo, pelo menos 1, 2, 3, 4, 5, 10, 20, 30, 40, 50, 100, 200, 300, 400, 500, 600, 700, 800, 900, ou 1000 equivalentes de genoma do elemento genético por célula) é capaz de entregar o elemento genético em pelo menos 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 95%, 99% ou mais de uma população das células eucarióticas, por exemplo, em que as células eucarióticas são células HEK293T, por exemplo, como descrito no Exemplo 22.
[00844] 1254. O anelossomo de qualquer uma das modalidades precedentes, em que uma população dos anelossomos (por exemplo, pelo menos 1, 2, 3, 4, 5, 10, 20, 30, 40, 50, 100, 200, 300, 400, 500, 600, 700, 800, 900, ou 1000 equivalentes de genoma do elemento genético por célula) é capaz de entregar pelo menos 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 20, 50, 100, 200, 500, 1000, 2000, 5000, 8,000, 1 x 104, 1 x 105, 1 x 106, 1 x 107 ou mais cópias do elemento genético a uma população das células eucarióticas, por exemplo, em que as células eucarióticas são células HEK293T, por exemplo, como descrito no Exemplo 22.
[00845] 1255. O anelossomo de qualquer uma das modalidades precedentes, em que uma população dos anelossomos (por exemplo, pelo menos 1, 2, 3, 4, 5, 10, 20, 30, 40, 50, 100, 200, 300, 400, 500, 600, 700, 800, 900, ou 1000 equivalentes de genoma do elemento genético por célula) é capaz de entregar 1-3, 1-4, 1-5, 1-6, 1-7, 1-8, 1- 9, 1-10, 5-10, 10-20, 20-50, 50-100, 100-1000, 1000-104, 1 x 104-1 x 105, 1 x 104-1 x 106, 1 x 104-1 x 107, 1 x 105-1 x 106, 1 x 105-1 x 107, ou 1 x 106-1 x 107 cópias do elemento genético a uma população das células eucarióticas, por exemplo, em que as células eucarióticas são células HEK293T, por exemplo, como descrito no Exemplo 22.
[00846] 1256. O anelossomo de qualquer uma das modalidades precedentes, em que o anelossomo está presente após pelo menos duas passagens.
[00847] 1257. O anelossomo de qualquer uma das modalidades precedentes, em que o anelossomo foi produzido por um processo compreendendo pelo menos duas passagens.
[00848] 1258. O anelossomo de qualquer uma das modalidades precedentes, em que o anelossomo entrega seletivamente o efetor a, ou está presente a níveis mais elevados em (por exemplo, se acumula preferencialmente em), um tipo de célula, tecido ou órgão desejado (por exemplo, medula óssea, sangue, coração, GI, pele, fotorreceptores na retina, revestimentos epiteliais ou pâncreas).
[00849] 1259. O anelossomo de qualquer uma das modalidades precedentes, em que a célula eucariótica é uma célula de mamífero, por exemplo, uma célula humana.
[00850] 1260. O anelossomo de qualquer uma das modalidades precedentes, em que o anelossomo, ou suas cópias, são detectáveis em uma célula 24 horas (por exemplo, 1 dia, 2 dias, 3 dias, 4 dias, 5 dias, 6 dias, 1 semana, 2 semanas, 3 semanas, 4 semanas, 30 dias ou 1 mês) após entrega na célula.
[00851] 1261. O anelossomo de qualquer uma das modalidades precedentes, em que o anelossomo é produzido no pélete celular e no sobrenadante em pelo menos cerca de 108 vezes (por exemplo, cerca de 105 vezes, 106 vezes, 107 vezes, 108 vezes, 109 vezes, ou 1010 vezes) equivalentes genômicos/mL, por exemplo, em relação à quantidade do anelossomo usada para infectar as células, após 3-4 dias pós-infecção, por exemplo, usando um ensaio de infectividade, por exemplo, um ensaio de acordo com o Exemplo 7.
[00852] 1262. Uma composição compreendendo o anelossomo de qualquer uma das modalidades precedentes.
[00853] 1263. Uma composição farmacêutica compreendendo o anelossomo de qualquer uma das modalidades precedentes e um transportador ou excipiente farmaceuticamente aceitável.
[00854] 1264. A composição ou composição farmacêutica da modalidade 1262 ou 1263, que compreende pelo menos 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98%, 99% ou mais anelossomos, por exemplo, anelossomos sintéticos.
[00855] 1265. A composição ou composição farmacêutica de qualquer uma das modalidades 1262-1264, que compreende pelo menos 103, 104, 105, 106, 107, 108 ou 109 anelossomos sintéticos.
[00856] 1266. A composição ou composição farmacêutica de qualquer uma das modalidades 1262-1265, possuindo uma ou mais das seguintes características:
[00857] a) a composição farmacêutica atende a um padrão farmacêutico ou de boas práticas de fabricação (GMP);
[00858] b) a composição farmacêutica foi feita de acordo com boas práticas de fabricação (GMP);
[00859] c) a composição farmacêutica tem um nível de patógenos abaixo de um valor de referência predeterminado, por exemplo, está substancialmente isenta de patógenos;
[00860] d) a composição farmacêutica tem um nível de contaminantes abaixo de um valor de referência predeterminado, por exemplo, está substancialmente isenta de contaminantes;
[00861] e) a composição farmacêutica tem um nível predeterminado de partículas não infecciosas ou uma razão predeterminada de partículas:unidades infecciosas (por exemplo, <300:1, < 200:1, <100:1 ou <50:1) ou
[00862] f) a composição farmacêutica tem baixa imunogenicidade ou é substancialmente não imunogênica, por exemplo, como descrito no presente documento.
[00863] 1267. A composição ou composição farmacêutica de qualquer uma das modalidades 1262-1266, em que a composição farmacêutica tem um nível de contaminantes abaixo de um valor de referência predeterminado, por exemplo, está substancialmente isenta de contaminantes.
[00864] 1268. A composição ou composição farmacêutica da modalidade 1267, em que o contaminante é selecionado do grupo consistindo em: micoplasma, endotoxina, ácidos nucleicos da célula hospedeira (por exemplo, DNA da célula hospedeira e/ou RNA da célula hospedeira), impurezas do processo derivadas de animais (por exemplo, albumina sérica ou tripsina), agentes competentes em replicação (RCA), por exemplo, vírus competentes em replicação ou anelossomos indesejados (por exemplo, um anelossomo sem ser o anelossomo desejado, por exemplo, um anelossomo sintético como descrito no presente documento), proteína de capsídeo viral livre, agentes adventícios e/ou agregados.
[00865] 1269. A composição ou composição farmacêutica da modalidade 1268, em que a contaminação é DNA da célula hospedeira e a quantidade limiar é cerca de 10 ng de DNA da célula hospedeira por dose da composição farmacêutica.
[00866] 1270. A composição ou composição farmacêutica de qualquer uma das modalidades 1262-1269, em que a composição farmacêutica compreende menos do que 10% (por exemplo, menos do que cerca de 10%, 5%, 4%, 3%, 2%, 1%, 0,5% ou 0,1%) de contaminante por peso.
[00867] 1271. Uso do anelossomo, composição ou composição farmacêutica de qualquer uma das modalidades precedentes para tratamento de uma doença ou disfunção (por exemplo, como descrito no presente documento) em um indivíduo.
[00868] 1272. O anelossomo, composição ou composição farmacêutica de qualquer uma das modalidades precedentes para uso no tratamento de uma doença ou disfunção (por exemplo, como descrito no presente documento) em um indivíduo.
[00869] 1273. Um método de tratamento de uma doença ou disfunção (por exemplo, como descrito no presente documento) em um indivíduo, o método compreendendo administração do anelossomo (por exemplo, um anelossomo sintético) ou a composição farmacêutica de qualquer uma das modalidades precedentes ao indivíduo.
[00870] 1274. Um método de modulação, por exemplo, intensificação ou inibição, de uma função biológica (por exemplo, como descrito no presente documento) em um indivíduo, o método compreendendo administração do anelossomo (por exemplo, um anelossomo sintético) ou a composição farmacêutica de qualquer uma das modalidades precedentes ao indivíduo.
[00871] 1275. O método de qualquer uma das modalidades 1273- 1274, em que o anelossomo não compreende um efetor exógeno.
[00872] 1276. O método de qualquer uma das modalidades 1273- 1275, em que o anelossomo compreende um Anellovirus de tipo selvagem, por exemplo, como descrito no presente documento.
[00873] 1277. O método de qualquer uma das modalidades 1273- 1276, em que a administração do anelossomo, por exemplo, anelossomo sintético, resulta na entrega do elemento genético em pelo menos 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 95%, 99% ou mais de uma população de células alvo no indivíduo.
[00874] 1278. O método de qualquer uma das modalidades 1273- 1277, em que a administração do anelossomo, por exemplo, anelossomo sintético, resulta na entrega do efetor em pelo menos 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 95%, 99% ou mais de uma população de células alvo no indivíduo.
[00875] 1279. O método da modalidade 1277 ou 1278, em que as células alvo compreendem células de mamífero, por exemplo, células humanas, por exemplo, neurônios (por exemplo, neurônios motores) miócitos, células retinais, células do fígado, células de sangue, células de pele, células nervosas, células adiposas, ou células endoteliais, por exemplo, in vitro.
[00876] 1280. O método de qualquer uma das modalidades 1277- 1279, em que as células alvo estão presentes na medula espinal, músculos, retina ou fígado.
[00877] 1281. O método de qualquer uma das modalidades 1277- 1280, em que as células alvo nas quais o elemento genético é entregue recebem cada uma pelo menos 10, 50, 100, 500, 1000, 10.000, 50.000,
100.000 ou mais cópias do elemento genético.
[00878] 1282. O método de qualquer uma das modalidades 1273- 1281, em que o efetor compreende um miRNA e em que o miRNA reduz o nível de uma proteína ou RNA alvo em uma célula ou em uma população de células, por exemplo, na qual o anelossomo é entregue, por exemplo, em pelo menos 10%, 20%, 30%, 40% ou 50%.
[00879] 1283. Um método de entrega de um anelossomo, por exemplo, um anelossomo sintético, a uma célula, compreendendo contato do anelossomo de qualquer uma das modalidades precedentes com uma célula, por exemplo, uma célula eucariótica, por exemplo, uma célula de mamífero.
[00880] 1284. O método da modalidade 1283, compreendendo ainda contato de um vírus ajudante com a célula, em que o vírus ajudante compreende um polinucleotídeo, por exemplo, um polinucleotídeo codificando uma proteína exterior, por exemplo, uma proteína exterior capaz de se ligar à sequência de ligação à proteína exterior e, opcionalmente, um envelope de lipídeos.
[00881] 1285. O método da modalidade 1284, em que o vírus ajudante é contatado com a célula antes do, simultaneamente com o ou após contato do anelossomo com a célula.
[00882] 1286. O método da modalidade 1283, compreendendo ainda contato de um polinucleotídeo ajudante com a célula.
[00883] 1287. O método da modalidade 1286 em que o polinucleotídeo ajudante compreende uma sequência de polinucleotídeos codificando uma proteína exterior, por exemplo, uma proteína exterior capaz de se ligar à sequência de ligação à proteína exterior e um envelope de lipídeos.
[00884] 1288. O método da modalidade 1286, em que o polinucleotídeo ajudante é um RNA (por exemplo, mRNA), DNA, plasmídeo, polinucleotídeo viral ou qualquer sua combinação.
[00885] 1289. O método de qualquer uma das modalidades 1286- 1288, em que o polinucleotídeo ajudante é contatado com a célula antes do, simultaneamente com o ou após contato do anelossomo com a célula.
[00886] 1290. O método de qualquer uma das modalidades 1283- 1289, compreendendo ainda contato de uma proteína ajudante (por exemplo, um fator de crescimento) com a célula.
[00887] 1291. O método da modalidade 1290, em que a proteína ajudante compreende uma proteína de replicação viral ou uma proteína de capsídeo.
[00888] 1292. Uma célula hospedeira compreendendo o anelossomo de qualquer uma das modalidades precedentes.
[00889] 1293. Uma molécula de ácido nucleico compreendendo um elemento promotor, uma sequência codificando um efetor (por exemplo, uma carga útil) e uma sequência de ligação à proteína exterior,
[00890] em que a molécula de ácido nucleico é um DNA de fita simples, e em que a molécula de ácido nucleico é circular e/ou se integra a uma frequência de menos do que cerca de 0,001%, 0,005%, 0,01%, 0,05%, 0,1%, 0,5%, 1%, 1,5%, ou 2% da molécula de ácido nucleico que entra em uma célula;
[00891] em que o efetor não tem origem em TTV e não é um SV40- miR-S1;
[00892] em que a molécula de ácido nucleico não compreende a sequência de polinucleotídeos de TTMV-LY;
[00893] em que o elemento promotor é capaz de dirigir a expressão do efetor em uma célula eucariótica.
[00894] 1294. Um elemento genético compreendendo:
[00895] (i) um elemento promotor e uma sequência codificando um efetor, por exemplo, uma carga útil, em que o efetor é exógeno em relação a uma sequência de Anellovirus de tipo selvagem;
[00896] (ii) pelo menos 72 nucleotídeos contíguos (por exemplo, pelo menos 72, 73, 74, 75, 76, 77, 78, 79, 80, 90, 100, ou 150 nucleotídeos) possuindo pelo menos 75% de identidade de sequências com uma sequência de Anellovirus de tipo selvagem; ou pelo menos 100 nucleotídeos contíguos possuindo pelo menos 72% (por exemplo, pelo menos 72, 73, 74, 75, 76, 77, 78, 79, 80, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99, ou 100%) de identidade de sequências com uma sequência de Anellovirus de tipo selvagem; e
[00897] (iii) uma sequência de ligação à proteína, por exemplo, uma sequência de ligação à proteína exterior, e
[00898] em que o construto de ácido nucleico é um DNA de fita simples; e
[00899] em que o construto de ácido nucleico é circular e/ou se integra a uma frequência de menos do que cerca de 0,001%, 0,005%, 0,01%, 0,05%, 0,1%, 0,5%, 1%, 1,5%, ou 2% do elemento genético que entra em uma célula.
[00900] 1295. Um método de fabricação de uma composição de anelossomos, compreendendo:
[00901] a) proporcionar uma célula hospedeira compreendendo uma ou mais moléculas de ácido nucleico codificando os componentes de um anelossomo, por exemplo, um anelossomo sintético descrito no presente documento, em que o anelossomo compreende um exterior proteináceo e um elemento genético, por exemplo, um elemento genético compreendendo um elemento promotor, uma sequência codificando um efetor (por exemplo, um efetor endógeno ou exógeno) e uma sequência de ligação à proteína (por exemplo, uma sequência de ligação à proteína exterior, por exemplo, um sinal de empacotamento);
[00902] b) produzir um anelossomo a partir da célula hospedeira, preparando deste modo um anelossomo; e
[00903] c) formular os anelossomos, por exemplo, como uma composição farmacêutica adequada para administração a um indivíduo.
[00904] 1296. Um método de fabricação de uma composição de anelossomos sintéticos, compreendendo:
[00905] a) proporcionar uma pluralidade de anelossomos, composições ou composições farmacêuticas de acordo com qualquer uma das modalidades precedentes;
[00906] b) avaliar opcionalmente a pluralidade de um ou mais de: um contaminante descrito no presente documento, uma medição de densidade óptica (por exemplo, OD 260), número de partículas (por exemplo, por HPLC), infectividade (por exemplo, razão partícula:unidade infecciosa, por exemplo, como determinado por fluorescência e/ou ELISA); e
[00907] c) formular a pluralidade de anelossomos, por exemplo,
como uma composição farmacêutica adequada para administração a um indivíduo, por exemplo, se um ou mais dos parâmetros de (b) atingirem um limiar especificado.
[00908] 1297. O método da modalidade 1296, em que a composição de anelossomos compreende pelo menos 105, 106, 107, 108, 109, 1010, 1011, 1012, 1013, 1014, ou 1015 anelossomos, ou em que a composição de anelossomos compreende pelo menos 105, 106, 107, 108, 109, 1010, 1011, 1012, 1013, 1014, ou 1015 genomas de anelossomos por mL.
[00909] 1298. O método da modalidade 1296 ou 1297, em que a composição de anelossomos compreende pelo menos 10 mL, 20 mL, 50 mL, 100 mL, 200 mL, 500 mL, 1 L, 2 L, 5 L, 10 L, 20 L ou 50 L.
[00910] 1299. Uma mistura reacional compreendendo o anelossomo de qualquer uma das modalidades precedentes e um vírus ajudante, em que o vírus ajudante compreende um polinucleotídeo, por exemplo, um polinucleotídeo codificando uma proteína exterior, por exemplo, uma proteína exterior capaz de se ligar à sequência de ligação à proteína exterior e, opcionalmente, um envelope de lipídeos.
[00911] 1300. Uma mistura reacional compreendendo o anelossomo de qualquer uma das modalidades precedentes e uma segunda sequência de ácidos nucleicos codificando uma ou mais de uma sequência de aminoácidos escolhida de ORF2, ORF2/2, ORF2/3, ORF2t/3, ORF1, ORF1/1 ou ORF1/2 de qualquer uma das Tabelas A2, A4, A6, A8, A10, A12, C1-C5, 2, 4, 6, 8, 10, 12, 14, 16, ou 18, 20-37, ou D1-D10 ou uma sequência de aminoácidos possuindo pelo menos 75% (por exemplo, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100%) de identidade de sequências com a mesma.
[00912] 1301. A mistura reacional da modalidade 1300, em que a segunda sequência de ácidos nucleicos é parte do elemento genético.
[00913] 1302. A mistura reacional da modalidade 1301, em que a segunda sequência de ácidos nucleicos não é parte do elemento genético, por exemplo, a segunda sequência de ácidos nucleicos é compreendida por uma célula ajudante ou vírus ajudante.
[00914] 1303. Um anelossomo sintético compreendendo:
[00915] um elemento genético compreendendo (i) uma sequência codificando uma proteína exterior não patogênica, (ii) uma sequência de ligação à proteína exterior que liga o elemento genético à proteína exterior não patogênica e (iii) uma sequência codificando um efetor, por exemplo, um ácido nucleico regulador; e
[00916] um exterior proteináceo que está associado ao, por exemplo, envolve ou encerra o, elemento genético.
[00917] 1304. Uma composição farmacêutica compreendendo
[00918] a) um anelossomo compreendendo:
[00919] um elemento genético compreendendo (i) uma sequência codificando uma proteína exterior não patogênica, (ii) uma sequência de ligação à proteína exterior que liga o elemento genético à proteína exterior não patogênica e (iii) uma sequência codificando um efetor, por exemplo, um ácido nucleico regulador; e
[00920] um exterior proteináceo que está associado ao, por exemplo, envolve ou encerra o, elemento genético; e
[00921] b) um excipiente farmacêutico.
[00922] 1305. Uma composição farmacêutica compreendendo
[00923] a) pelo menos 103, 104, 105, 106, 107, 108 ou 109 anelossomos (por exemplo, anelossomos sintéticos descritos no presente documento) compreendendo:
[00924] um elemento genético compreendendo (i) uma sequência codificando uma proteína exterior não patogênica, (ii) uma sequência de ligação à proteína exterior que liga o elemento genético à proteína exterior não patogênica e (iii) uma sequência codificando um efetor, por exemplo, um ácido nucleico regulador; e
[00925] um exterior proteináceo que está associado ao, por exemplo, envolve ou encerra o, elemento genético;
[00926] b) um excipiente farmacêutico e, opcionalmente,
[00927] c) menos do que uma quantidade predeterminada de: micoplasma, endotoxina, ácidos nucleicos da célula hospedeira (por exemplo, DNA da célula hospedeira e/ou RNA da célula hospedeira), impurezas do processo derivadas de animais (por exemplo, albumina sérica ou tripsina), agentes competentes em replicação (RCA), por exemplo, vírus competentes em replicação ou anelossomos indesejados, proteína de capsídeo viral livre, agentes adventícios, agentes endógenos e/ou agregados.
[00928] 1306. O anelossomo ou composição de qualquer uma das modalidades prévias, compreendendo ainda pelo menos uma das seguintes características: o elemento genético é um DNA de fita simples; o elemento genético é circular; o anelossomo é não integrante; o anelossomo tem uma sequência, estrutura e/ou função com base em um anelovírus ou outro vírus não patogênico e o anelossomo é não patogênico.
[00929] 1307. O anelossomo ou composição de qualquer uma das modalidades prévias, em que o exterior proteináceo compreende a proteína exterior não patogênica.
[00930] 1308. O anelossomo ou composição de qualquer uma das modalidades prévias, em que o exterior proteináceo compreende uma ou mais dos seguintes: uma ou mais proteínas glicosiladas, uma região de ligação ao DNA hidrofílica, uma região rica em arginina, uma região rica em treonina, uma região rica em glutamina, uma sequência de poliarginina N-terminal, uma região variável, uma sequência de poliglutamina/glutamato C-terminal e uma ou mais pontes de dissulfeto.
[00931] 1309. O anelossomo ou composição de qualquer uma das modalidades prévias, em que o exterior proteináceo compreende uma ou mais das seguintes características: uma simetria icosaédrica, reconhece e/ou se liga a uma molécula que interage com uma ou mais moléculas da célula hospedeira para mediar a entrada na célula hospedeira, carece de moléculas de lipídeos, carece de carboidratos, compreende um ou mais carboidratos desejados (por exemplo, glicosilações), é estável quanto ao pH e à temperatura, é resistente a detergentes e é não imunogênico ou não patogênico em um hospedeiro.
[00932] 1310. O anelossomo ou composição de qualquer uma das modalidades prévias, em que a sequência codificando a proteína exterior não patogênica compreende uma sequência pelo menos 70%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% idêntica a uma ou mais sequências ou um seu fragmento listadas na Tabela 19.
[00933] 1311. O anelossomo ou composição de qualquer uma das modalidades prévias, em que a proteína exterior proteinácea compreende pelo menos um domínio funcional que proporciona uma ou mais funções, por exemplo, tropismo de espécies e/ou tecidos e/ou células, ligação e/ou empacotamento do genoma viral, evasão imunitária (não imunogenicidade e/ou tolerância), farmacocinética, endocitose e/ou anexação celular, entrada nuclear, modulação e localização intracelulares, modulação da exocitose, propagação e proteção de ácidos nucleicos.
[00934] 1312. O anelossomo ou composição de qualquer uma das modalidades prévias, em que o efetor compreende um ácido nucleico regulador, por exemplo, um miRNA, siRNA, mRNA, lncRNA, RNA, DNA, um RNA antissenso, gRNA; um terapêutico, por exemplo, uma etiqueta ou marcador fluorescente, antígeno, um terapêutico de peptídeo, peptídeo sintético ou análogo a partir de peptídeo naturalmente bioativo, peptídeo agonista ou antagonista, peptídeo antimicrobiano, peptídeo formador de poros, um peptídeo bicíclico, um peptídeo de direcionamento ou citotóxico, um peptídeo de degradação ou autodestruição e peptídeos de degradação ou autodestruição, molécula pequena, um efetor imunitário (por exemplo, influencia a suscetibilidade a uma resposta/sinal imunitário), uma proteína de morte (por exemplo, um indutor da apoptose ou necrose), um inibidor não lítico de um tumor (por exemplo, um inibidor de uma oncoproteína), um agente modificador epigenético, enzima epigenética, um fator de transcrição, uma enzima de modificação de DNA ou proteína, um agente intercalador de DNA, um inibidor da bomba de efluxo, um ativador ou inibidor de receptor nuclear, um inibidor de proteassomo, um inibidor competitivo para uma enzima, um efetor ou inibidor da síntese de proteína, uma nuclease, um fragmento ou domínio de proteína, um ligante, ou um receptor e um sistema ou componente de CRISPR.
[00935] 1312b. O anelossomo ou composição de qualquer uma das modalidades prévias, em que o efetor compreende Factor IX ou uma variante funcional do mesmo.
[00936] 1313. O anelossomo ou composição de qualquer uma das modalidades prévias, em que o efetor compreende uma sequência possuindo pelo menos 70%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade com uma ou mais das sequências de miRNA no presente documento descritas.
[00937] 1314. O anelossomo ou composição de qualquer uma das modalidades prévias, em que o efetor, por exemplo, miRNA, visa um gene hospedeiro, por exemplo, modula a expressão do gene.
[00938] 1315. O anelossomo ou composição da modalidade prévia, em que o miRNA compreende uma sequência possuindo pelo menos 70%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade com uma ou mais das sequências de miRNA no presente documento descritas.
[00939] 1316. O anelossomo ou composição de qualquer uma das modalidades prévias, em que o elemento genético compreende ainda uma ou mais das seguintes sequências: uma sequência que codifica um ou mais miRNAs, uma sequência que codifica uma ou mais proteínas de replicação, uma sequência que codifica um gene exógeno, uma sequência que codifica um terapêutico, uma sequência reguladora (por exemplo, um promotor, intensificador), uma sequência que codifica uma ou mais sequências reguladoras que visam genes endógenos (siRNA, lncRNAs, shRNA), uma sequência que codifica um mRNA ou proteína terapêutico e uma sequência que codifica um RNA/proteína citolítico/citotóxico.
[00940] 1317. O anelossomo ou composição de qualquer uma das modalidades prévias, em que o elemento genético tem uma ou mais das seguintes características: é não integrante com o genoma de uma célula hospedeira, é um ácido nucleico epissomal, é um DNA de fita simples, tem cerca de 1 a 10 kb, existe dentro do núcleo da célula, é capaz de ser ligado por proteínas endógenas e produz um microRNA que visa genes hospedeiros.
[00941] 1318. O anelossomo ou composição de qualquer uma das modalidades prévias, em que o elemento genético compreende pelo menos uma sequência viral ou pelo menos 70%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% de identidade com uma ou mais sequências listadas na Tabela 23 ou um seu fragmento (por exemplo, um fragmento codificando uma molécula ORF1/1, ORF1/2, ORF2, ORF2/2, ORF2/3, ORF2t/3 e/ou ORF3 e/ou um fragmento compreendendo um ou mais de uma caixa TATA, local cap, local de início transcricional, 5´ UTR, grelha de leitura aberta (ORF), sinal de poli(A) ou região rica em GC).
[00942] 1319. O anelossomo ou composição da modalidade prévia, em que a sequência viral é de pelo menos um de um vírus de DNA de fita simples (por exemplo, Anellovirus, Bidnavirus, Circovirus, Geminivirus, Genomovirus, Inovirus, Microvirus, Nanovirus, Parvovirus e Spiravirus), um vírus de DNA de fita dupla (por exemplo, Adenovirus,
Ampullavirus, Ascovirus, Asfarvirus, Baculovirus, Fusellovirus, Globulovirus, Guttavirus, Hytrosavirus, Herpesvirus, Iridovirus, Lipothrixvirus, Nimavirus e Poxvirus), um vírus de RNA (por exemplo, Alphavirus, Furovirus, Hepatitis virus, Hordeivirus, Tobamovirus, Tobravirus, Tricornavirus, Rubivirus, Birnavirus, Cystovirus, Partitivirus e Reovirus).
[00943] 1320. O anelossomo ou composição da modalidade prévia, em que a sequência viral é de um ou mais não anelovírus, por exemplo, adenovírus, vírus do herpes, vírus da varíola, vírus da vaccínia, SV40, vírus do papiloma, um vírus de RNA tal como um retrovírus, por exemplo, lentivírus, um vírus de RNA de fita simples, por exemplo, vírus da hepatite, ou um vírus de RNA de fita dupla, por exemplo, rotavírus.
[00944] 1321. O anelossomo ou composição de qualquer uma das modalidades prévias, em que a sequência de ligação à proteína interage com a região rica em arginina do exterior proteináceo.
[00945] 1322. O anelossomo ou composição de qualquer uma das modalidades prévias, em que o anelossomo é capaz de se replicar em uma célula de mamífero, por exemplo, célula humana.
[00946] 1323. O anelossomo ou composição da modalidade prévia, em que o anelossomo é não patogênico e/ou não integrante em uma célula hospedeira.
[00947] 1324. O anelossomo ou composição de qualquer uma das modalidades prévias, em que o anelossomo é não imunogênico em um hospedeiro.
[00948] 1325. O anelossomo ou composição de qualquer uma das modalidades prévias, em que o anelossomo inibe/intensifica uma ou mais propriedades virais, por exemplo, seletividade, por exemplo, infectividade, por exemplo, imunossupressão/ativação, em um hospedeiro ou célula hospedeira.
[00949] 1326. O anelossomo ou composição da modalidade prévia,
em que o anelossomo está em uma quantidade suficiente para modular (por exemplo, fenótipo, níveis de vírus, expressão gênica, compete com outros vírus, estado de doença, etc. pelo menos cerca de 5%, 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50% ou mais).
[00950] 1327. A composição de qualquer uma das modalidades prévias compreendendo ainda pelo menos um vírus ou vetor compreendendo um genoma do vírus, por exemplo, uma variante do anelossomo, por exemplo, um vírus comensal/nativo.
[00951] 1328. A composição de qualquer uma das modalidades prévias compreendendo ainda uma fração heteróloga, pelo menos uma molécula pequena, anticorpo, polipeptídeo, ácido nucleico, agente de direcionamento, agente de visualização, nanopartícula e uma sua combinação.
[00952] 1329. Um vetor compreendendo um elemento genético compreendendo (i) uma sequência codificando uma proteína exterior não patogênica, (ii) uma sequência de ligação à proteína exterior que liga o elemento genético à proteína exterior não patogênica e (iii) uma sequência codificando um efetor, por exemplo, um ácido nucleico regulador.
[00953] 1330. O vetor da modalidade prévia, em que o elemento genético falha a se integrar com o genoma de uma célula hospedeira.
[00954] 1331. O vetor de qualquer uma das modalidades prévias, em que o elemento genético é capaz de se replicar em uma célula de mamífero, por exemplo, célula humana.
[00955] 1332. O vetor de qualquer uma das modalidades prévias compreendendo ainda uma sequência de ácidos nucleicos exógena, por exemplo, selecionada para modular a expressão de um gene, por exemplo, um gene humano.
[00956] 1333. Uma composição farmacêutica compreendendo o vetor de qualquer uma das modalidades prévias e um excipiente farmacêutico.
[00957] 1334. A composição da modalidade prévia, em que o vetor é não patogênico e/ou não integrante em uma célula hospedeira.
[00958] 1335. A composição de qualquer uma das modalidades prévias, em que o vetor é não imunogênico em um hospedeiro.
[00959] 1336. A composição da modalidade prévia, em que o vetor está em uma quantidade suficiente para modular (fenótipo, níveis de vírus, expressão gênica, compete com outros vírus, estado de doença, etc. pelo menos cerca de 5%, 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50% ou mais).
[00960] 1337. A composição de qualquer uma das modalidades prévias compreendendo ainda pelo menos um vírus ou vetor compreendendo um genoma do vírus, por exemplo, uma variante do anelossomo, um vírus comensal/nativo, um vírus ajudante, um não anelovírus.
[00961] 1338. A composição de qualquer uma das modalidades prévias compreendendo ainda uma fração heteróloga, pelo menos uma molécula pequena, anticorpo, polipeptídeo, ácido nucleico, agente de direcionamento, agente de visualização, nanopartícula e uma sua combinação.
[00962] 1339. Um método de produção, propagação e coleta do anelossomo de qualquer uma das modalidades prévias.
[00963] 1340. Um método de desenho e preparação do vetor de qualquer uma das modalidades prévias.
[00964] 1341. Um método de administração a um indivíduo de uma quantidade eficaz da composição de qualquer uma das modalidades prévias.
[00965] 1342. Um método de entrega de uma carga útil de ácido nucleico ou proteína a uma célula, tecido ou indivíduo alvo, o método compreendendo contato da célula, tecido ou indivíduo alvo com uma composição de ácido nucleico que compreende (a) uma primeira sequência de DNA derivada de um vírus em que a primeira sequência de DNA é suficiente para permitir a produção de uma partícula capaz de infectar a célula, tecido ou indivíduo alvo e (a) uma segunda sequência de DNA codificando a carga útil de ácido nucleico ou proteína, a melhoria compreendendo:
[00966] a primeira sequência de DNA compreende pelo menos 500 (pelo menos 600, 700, 800, 900, 1000, 1200, 1400, 1500, 1600, 1800, 2000) nucleotídeos possuindo pelo menos 80% (pelo menos 85%, 90%, 95%, 97%, 99%, 100%) de identidade de sequências com uma sequência correspondente listada em qualquer uma das Tabelas A1, A3, A5, A7, A9, A11, B1-B5, 1, 3, 5, 7, 9, 11, 13, 15, ou 17 ou
[00967] a primeira sequência de DNA codifica uma sequência possuindo pelo menos 80% (pelo menos 85%, 90%, 95%, 97%, 99%, 100%) de identidade de sequências com uma ORF listado na Tabela A2, A4, A6, A8, A10, A12, C1-C5, 2, 4, 6, 8, 10, 12, 14, 16, 18, 20-37, ou D1-D10 ou
[00968] a primeira sequência de DNA compreende uma sequência possuindo pelo menos 90% (pelo menos 95%, 97%, 99%, 100%) de identidade de sequências com uma sequência de consenso listada na Tabela 19.
[00969] 1343. Um método de entrega de um efetor de ácido nucleico ou proteína a uma célula, tecido ou indivíduo alvo, o método compreendendo contato da célula, tecido ou indivíduo alvo com um anelossomo de qualquer uma das modalidades precedentes ou uma composição de ácido nucleico que compreende (a) uma primeira sequência de DNA derivada de um vírus em que a primeira sequência de DNA é suficiente para permitir a produção de um anelossomo de qualquer uma das modalidades precedentes que pode infectar a célula, tecido ou indivíduo alvo e (a) uma segunda sequência de DNA codificando o efetor de ácido nucleico ou proteína.
[00970] 1344. Uma molécula de ácido nucleico otimizada quanto aos códons codificando uma sequência de aminoácidos possuindo pelo menos 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade com uma sequência de aminoácidos de ORF1, ORF2 ou ORF3 de Anellovirus de tipo selvagem.
[00971] 1345. A molécula de ácido nucleico otimizada quanto aos códons da modalidade 1344, codificando uma sequência de aminoácidos possuindo pelo menos 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade com uma sequência de aminoácidos de ORF1 de Anellovirus de tipo selvagem, por exemplo, como listado em qualquer uma das Tabelas A2, A4, A6, A8, A10, A12, C1-C5, 2, 4, 6, 8, 10, 12, 14, 16, 18, 20-37, ou D1-D10.
[00972] 1346. Uma composição farmacêutica compreendendo:
[00973] (a) um anelossomo, por exemplo, um anelossomo de qualquer uma das modalidades precedentes, e
[00974] (b) um transportador escolhido de uma vesícula, nanopartícula de lipídeo (LNP), glóbulo vermelho, exossomo (por exemplo, um exossomo de mamífero ou planta) ou fusossomo.
[00975] 2001. Um anelossomo compreendendo:
[00976] (a) um exterior proteináceo;
[00977] (b) um elemento genético compreendendo um elemento promotor e uma sequência de ácidos nucleicos (por exemplo, uma sequência de DNA) codificando um efetor (por exemplo, um efetor endógeno ou um efetor exógeno) e uma sequência de ligação à proteína (por exemplo, uma sequência de ligação à proteína exterior),
[00978] em que o elemento genético tem pelo menos:
[00979] (i) 72,2% (por exemplo, pelo menos 72,2, 72,3, 72,4, 72,5, 73, 74, 75, 76, 77, 78, 79, 80, 85, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99, ou 100%) de identidade de sequências com uma sequência de
Anellovirus como listado na Tabela A1;
[00980] (ii) 68,4% (por exemplo, pelo menos 68,4, 68,5, 68,6, 68,7, 68,8, 68,9, 69, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 85, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99, ou 100%) de identidade de sequências com uma sequência de Anellovirus como listado na Tabela A3;
[00981] (iii) 81,7% (por exemplo, pelo menos 81,7, 81,8, 81,9, 82, 83, 84, 85, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99, ou 100%) de identidade de sequências com uma sequência de Anellovirus como listado na Tabela A5;
[00982] (iv) 92,6% (por exemplo, pelo menos 92,6, 92,7, 92,8, 92,9, 93, 94, 95, 96, 97, 98, 99, ou 100%) de identidade de sequências com uma sequência de Anellovirus como listado na Tabela A7;
[00983] (v) 65% (por exemplo, pelo menos 65, 66, 67, 68, 69, 70, 75, 76, 77, 78, 79, 80, 85, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99, ou 100%) de identidade de sequências com uma sequência de Anellovirus como listado na Tabela A9; ou
[00984] (vi) 65% (por exemplo, pelo menos 65, 66, 67, 68, 69, 70, 75, 76, 77, 78, 79, 80, 85, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99, ou 100%) de identidade de sequências com uma sequência de Anellovirus como listado na Tabela A11;
[00985] opcionalmente, em que o elemento genético compreende pelo menos uma diferença (por exemplo, uma mutação, modificação química ou alteração epigenética) em relação a uma sequência do genoma de Anellovirus de tipo selvagem (por exemplo, como descrito no presente documento), por exemplo, uma inserção, substituição, modificação enzimática e/ou deleção, por exemplo, uma deleção de um domínio (por exemplo, um ou mais de uma caixa TATA, local cap, local de início transcricional, 5´ UTR, grelha de leitura aberta (ORF), sinal de poli(A) ou região rica em GC);
[00986] em que o elemento genético está encerrado dentro do exterior proteináceo; e
[00987] em que o anelossomo é configurado para entregar o elemento genético em uma célula eucariótica.
[00988] 2002. Um anelossomo compreendendo:
[00989] (a) um exterior proteináceo;
[00990] (b) um elemento genético compreendendo um elemento promotor e uma sequência de ácidos nucleicos (por exemplo, uma sequência de DNA) codificando um efetor (por exemplo, um efetor endógeno ou um efetor exógeno) e uma sequência de ligação à proteína (por exemplo, uma sequência de ligação à proteína exterior),
[00991] em que o elemento genético compreende não mais do que cerca de:
[00992] (i) 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 20, 25, 30, 35, 40, 45, 50, 60, 70, 80, 90, 100, 125, 150, 175, 200, 250, 300, 350, 400, 450, 500, 600, 700, 800, 900, 1000, 1010, 1011, 1012, 1013, 1014, 1015, 1016, ou 1017 diferenças de nucleotídeos, por exemplo, substituições, inserções ou deleções, em relação a uma sequência de Anellovirus como listado na Tabela A1;
[00993] (ii) 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 20, 25, 30, 35, 40, 45, 50, 60, 70, 80, 90, 100, 125, 150, 175, 200, 250, 300, 350, 400, 450, 500, 600, 700, 800, 900, 1000, 1100, 1110, 1120, 1130, 1140, 1150, 11160, 1170, 1171, 1172, 1173, ou 1174 diferenças de nucleotídeos, por exemplo, substituições, inserções ou deleções, em relação a uma sequência de Anellovirus como listado na Tabela A3;
[00994] (iii) 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 20, 25, 30, 35, 40, 45, 50, 60, 70, 80, 90, 100, 125, 150, 175, 200, 250, 300, 350, 400, 450, 500, 600, 610, 620, 630, 640, 650, 660, 670, 671, ou 672 diferenças de nucleotídeos, por exemplo, substituições, inserções ou deleções, em relação a uma sequência de Anellovirus como listado na Tabela A5;
[00995] (iv) 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 20, 25, 30, 35, 40, 45, 50, 60, 70, 80, 90, 100, 125, 150, 175, 200, 250, 260, 270, 271, 272, 273, 274, 275, 276, 277, 278, 279, ou 280 diferenças de nucleotídeos, por exemplo, substituições, inserções ou deleções, em relação a uma sequência de Anellovirus como listado na Tabela A7;
[00996] (v) 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 20, 25, 30, 35, 40, 45, 50, 60, 70, 80, 90, 100, 125, 150, 175, 200, 250, 300, 350, 400, 450, 500, 600, 700, 800, 900, ou 1000 diferenças de nucleotídeos, por exemplo, substituições, inserções ou deleções, em relação a uma sequência de Anellovirus como listado na Tabela A9; ou
[00997] (vi) 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 20, 25, 30, 35, 40, 45, 50, 60, 70, 80, 90, 100, 125, 150, 175, 200, 250, 300, 350, 400, 450, 500, 600, 700, 800, 900, ou 1000 diferenças de nucleotídeos, por exemplo, substituições, inserções ou deleções, em relação a uma sequência de Anellovirus como listado na Tabela A11;
[00998] opcionalmente, em que o elemento genético compreende pelo menos uma diferença (por exemplo, uma mutação, modificação química ou alteração epigenética) em relação a uma sequência do genoma de Anellovirus de tipo selvagem (por exemplo, como descrito no presente documento), por exemplo, uma inserção, substituição, modificação enzimática e/ou deleção, por exemplo, uma deleção de um domínio (por exemplo, um ou mais de uma caixa TATA, local cap, local de início transcricional, 5´ UTR, grelha de leitura aberta (ORF), sinal de poli(A) ou região rica em GC);
[00999] em que o elemento genético está encerrado dentro do exterior proteináceo; e
[001000] em que o anelossomo é configurado para entregar o elemento genético em uma célula eucariótica.
[001001] 2002. Um anelossomo compreendendo:
[001002] (a) um exterior proteináceo;
[001003] (b) um elemento genético compreendendo um elemento promotor e uma sequência de ácidos nucleicos (por exemplo, uma sequência de DNA) codificando um efetor (por exemplo, um efetor endógeno ou um efetor exógeno) e uma sequência de ligação à proteína (por exemplo, uma sequência de ligação à proteína exterior),
[001004] em que o elemento genético compreende não mais do que cerca de:
[001005] (i) 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 20, 25, 30, 35, 40, 45, 50, 60, 70, 80, 90, 100, 125, 150, 175, 200, 250, 300, 350, 400, 450, 500, 600, 700, 800, 900, 1000, 1010, 1011, 1012, 1013, 1014, 1015, 1016, ou 1017 diferenças de nucleotídeos, por exemplo, substituições, inserções ou deleções, em relação a uma sequência de Anellovirus como listado na Tabela B1;
[001006] (ii) 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 20, 25, 30, 35, 40, 45, 50, 60, 70, 80, 90, 100, 125, 150, 175, 200, 250, 300, 350, 400, 450, 500, 600, 700, 800, 900, 1000, 1100, 1110, 1120, 1130, 1140, 1150, 11160, 1170, 1171, 1172, 1173, ou 1174 diferenças de nucleotídeos, por exemplo, substituições, inserções ou deleções, em relação a uma sequência de Anellovirus como listado na Tabela B2;
[001007] (iii) 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 20, 25, 30, 35, 40, 45, 50, 60, 70, 80, 90, 100, 125, 150, 175, 200, 250, 300, 350, 400, 450, 500, 600, 610, 620, 630, 640, 650, 660, 670, 671, ou 672 diferenças de nucleotídeos, por exemplo, substituições, inserções ou deleções, em relação a uma sequência de Anellovirus como listado na Tabela B3;
[001008] (iv) 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 20, 25, 30, 35, 40, 45, 50, 60, 70, 80, 90, 100, 125, 150, 175, 200, 250, 260, 270, 271, 272, 273, 274, 275, 276, 277, 278, 279, ou 280 diferenças de nucleotídeos, por exemplo, substituições, inserções ou deleções, em relação a uma sequência de Anellovirus como listado na Tabela B4; ou
[001009] (v) 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 20, 25, 30, 35, 40, 45, 50, 60, 70, 80, 90, 100, 125, 150, 175, 200, 250, 300, 350, 400, 450, 500, 600, 700, 800, 900, ou 1000 diferenças de nucleotídeos, por exemplo, substituições, inserções ou deleções, em relação a uma sequência de Anellovirus como listado na Tabela B5;
[001010] opcionalmente, em que o elemento genético compreende pelo menos uma diferença (por exemplo, uma mutação, modificação química ou alteração epigenética) em relação a uma sequência do genoma de Anellovirus de tipo selvagem (por exemplo, como descrito no presente documento), por exemplo, uma inserção, substituição, modificação enzimática e/ou deleção, por exemplo, uma deleção de um domínio (por exemplo, um ou mais de uma caixa TATA, local cap, local de início transcricional, 5´ UTR, grelha de leitura aberta (ORF), sinal de poli(A) ou região rica em GC);
[001011] em que o elemento genético está encerrado dentro do exterior proteináceo; e
[001012] em que o anelossomo é configurado para entregar o elemento genético em uma célula eucariótica.
[001013] 2003. O anelossomo de qualquer uma das modalidades precedentes, em que o elemento genético não é uma sequência de ocorrência natural (por exemplo, compreende pelo menos uma diferença (por exemplo, uma mutação, modificação química ou alteração epigenética), por exemplo, uma inserção, substituição, modificação enzimática e/ou deleção, por exemplo, uma deleção de um domínio (por exemplo, um ou mais de uma caixa TATA, local cap, local de início transcricional, 5´ UTR, grelha de leitura aberta (ORF), sinal de poli(A) ou região rica em GC)), em relação a uma sequência de Anellovirus de tipo selvagem (por exemplo, um vírus Torque Teno (TTV) de tipo selvagem, minivírus Torque Teno (TTMV) ou sequência de TTMDV, por exemplo, uma sequência de Anellovirus de tipo selvagem,
por exemplo, como listado em qualquer uma das Tabelas B1-B5, A1, A3, A5, A7, A9, A11, 1, 3, 5, 7, 9, 11, ou 13).
[001014] 2004. O anelossomo de qualquer uma das modalidades precedentes, compreendendo um polipeptídeo compreendendo uma sequência de aminoácidos possuindo pelo menos 70% (por exemplo, pelo menos cerca de 70, 80, 90, 95, 96, 97, 98, 99, ou 100%) de identidade de sequências com a sequência de aminoácidos de uma molécula ORF1 de Anellovirus (por exemplo, uma sequência de ORF1 de Anellovirus como listado em qualquer uma das Tabelas C1-C5, A2, A4, A6, A8, A10 ou A12).
[001015] 2005. O anelossomo da modalidade 2004, em que o exterior proteináceo compreende o polipeptídeo.
[001016] 2006. O anelossomo da modalidade 2005, em que pelo menos 60% (por exemplo, pelo menos 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100%) da proteína no exterior proteináceo compreende o polipeptídeo.
[001017] 2007. O anelossomo de qualquer uma das modalidades precedentes, em que pelo menos 60% (por exemplo, pelo menos 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100%) da proteína no exterior proteináceo compreende uma molécula de ORF1.
[001018] 2008. O anelossomo de qualquer uma das modalidades precedentes, compreendendo uma molécula de ácido nucleico (por exemplo, no elemento genético) codificando uma sequência de aminoácidos possuindo pelo menos 70% (por exemplo, pelo menos cerca de 70, 80, 90, 95, 96, 97, 98, 99, ou 100%) de identidade de sequências com a sequência de aminoácidos de uma molécula ORF1 de Anellovirus (por exemplo, uma sequência de ORF1 de Anellovirus como listado em qualquer uma das Tabelas C1-C5, A2, A4, A6, A8, A10 ou A12).
[001019] 2009. O anelossomo de qualquer uma das modalidades precedentes, em que o elemento genético compreende uma região compreendendo pelo menos 10, 15, 20, 25, 30, 31, 32, 33, 34, 35, ou 36 nucleotídeos consecutivos da sequência de ácidos nucleicos:
[001020] (i) CGCGCTGCGCGCGCCGCCCAGTAGGGGGAGCCATGC (SEQ ID NO: 160),
[001021] (ii) GCGCTX1CGCGCGCGCGCCGGGGGGCTGCGCCCCCCC (SEQ ID NO: 164), em que X1 é selecionado de T, G ou A;
[001022] (iii) GCGCTTCGCGCGCCGCCCACTAGGGGGCGTTGCGCG (SEQ ID NO: 165);
[001023] (iv) GCGCTGCGCGCGCCGCCCAGTAGGGGGCGCAATGCG (SEQ ID NO: 166);
[001024] (v) GCGCTGCGCGCGCGGCCCCCGGGGGAGGCATTGCCT (SEQ ID NO: 167);
[001025] (vi) GCGCTGCGCGCGCGCGCCGGGGGGGCGCCAGCGCCC (SEQ ID NO: 168);
[001026] (vii) GCGCTTCGCGCGCGCGCCGGGGGGCTCCGCCCCCCC (SEQ ID NO: 169);
[001027] (viii) GCGCTTCGCGCGCGCGCCGGGGGGCTGCGCCCCCCC (SEQ ID NO: 170);
[001028] (ix) GCGCTACGCGCGCGCGCCGGGGGGCTGCGCCCCCCC (SEQ ID
NO: 171); ou
[001029] (x) GCGCTACGCGCGCGCGCCGGGGGGCTCTGCCCCCCC (SEQ ID NO: 172);
[001030] ou uma sequência de ácidos nucleicos possuindo pelo menos 75, 76, 77, 78, 79, 80, 85, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99, ou 100% de identidade de sequências com a mesma.
[001031] 2010. O anelossomo de qualquer uma das modalidades precedentes, em que o elemento genético compreende uma região 5´ UTR e/ou uma região rica em GC como descrito no presente documento (por exemplo, como listado na Tabela 38 ou 39, respectivamente).
[001032] 2011. Uma molécula de ácido nucleico isolada (por exemplo, um vetor de expressão) compreendendo um elemento genético compreendendo pelo menos:
[001033] (i) 72,2% (por exemplo, pelo menos 72,2, 72,3, 72,4, 72,5, 73, 74, 75, 76, 77, 78, 79, 80, 85, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99, ou 100%) de identidade de sequências com uma sequência de Anellovirus como listado na Tabela A1;
[001034] (ii) 68,4% (por exemplo, pelo menos 68,4, 68,5, 68,6, 68,7, 68,8, 68,9, 69, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 85, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99, ou 100%) de identidade de sequências com uma sequência de Anellovirus como listado na Tabela A3;
[001035] (iii) 81,7% (por exemplo, pelo menos 81,7, 81,8, 81,9, 82, 83, 84, 85, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99, ou 100%) de identidade de sequências com uma sequência de Anellovirus como listado na Tabela A5;
[001036] (iv) 92,6% (por exemplo, pelo menos 92,6, 92,7, 92,8, 92,9, 93, 94, 95, 96, 97, 98, 99, ou 100%) de identidade de sequências com uma sequência de Anellovirus como listado na Tabela A7;
[001037] (v) 65% (por exemplo, pelo menos 65, 66, 67, 68, 69, 70, 75,
76, 77, 78, 79, 80, 85, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99, ou 100%) de identidade de sequências com uma sequência de Anellovirus como listado na Tabela A9; ou
[001038] (vi) 65% (por exemplo, pelo menos 65, 66, 67, 68, 69, 70, 75, 76, 77, 78, 79, 80, 85, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99, ou 100%) de identidade de sequências com uma sequência de Anellovirus como listado na Tabela A11;
[001039] opcionalmente, em que o elemento genético compreende pelo menos uma diferença (por exemplo, uma mutação, modificação química ou alteração epigenética) em relação a uma sequência do genoma de Anellovirus de tipo selvagem (por exemplo, como descrito no presente documento), por exemplo, uma inserção, substituição, modificação enzimática e/ou deleção, por exemplo, uma deleção de um domínio (por exemplo, um ou mais de uma caixa TATA, local cap, local de início transcricional, 5´ UTR, grelha de leitura aberta (ORF), sinal de poli(A) ou região rica em GC).
[001040] 2012. Uma molécula de ácido nucleico isolada (por exemplo, um vetor de expressão) compreendendo um elemento genético compreendendo não mais do que cerca de:
[001041] (i) 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 20, 25, 30, 35, 40, 45, 50, 60, 70, 80, 90, 100, 125, 150, 175, 200, 250, 300, 350, 400, 450, 500, 600, 700, 800, 900, 1000, 1010, 1011, 1012, 1013, 1014, 1015, 1016, ou 1017 diferenças de nucleotídeos, por exemplo, substituições, inserções ou deleções, em relação a uma sequência de Anellovirus como listado na Tabela A1;
[001042] (ii) 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 20, 25, 30, 35, 40, 45, 50, 60, 70, 80, 90, 100, 125, 150, 175, 200, 250, 300, 350, 400, 450, 500, 600, 700, 800, 900, 1000, 1100, 1110, 1120, 1130, 1140, 1150, 11160, 1170, 1171, 1172, 1173, ou 1174 diferenças de nucleotídeos, por exemplo, substituições, inserções ou deleções, em relação a uma sequência de Anellovirus como listado na Tabela A3;
[001043] (iii) 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 20, 25, 30, 35, 40, 45, 50, 60, 70, 80, 90, 100, 125, 150, 175, 200, 250, 300, 350, 400, 450, 500, 600, 610, 620, 630, 640, 650, 660, 670, 671, ou 672 diferenças de nucleotídeos, por exemplo, substituições, inserções ou deleções, em relação a uma sequência de Anellovirus como listado na Tabela A5;
[001044] (iv) 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 20, 25, 30, 35, 40, 45, 50, 60, 70, 80, 90, 100, 125, 150, 175, 200, 250, 260, 270, 271, 272, 273, 274, 275, 276, 277, 278, 279, ou 280 diferenças de nucleotídeos, por exemplo, substituições, inserções ou deleções, em relação a uma sequência de Anellovirus como listado na Tabela A7;
[001045] (v) 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 20, 25, 30, 35, 40, 45, 50, 60, 70, 80, 90, 100, 125, 150, 175, 200, 250, 300, 350, 400, 450, 500, 600, 700, 800, 900, ou 1000 diferenças de nucleotídeos, por exemplo, substituições, inserções ou deleções, em relação a uma sequência de Anellovirus como listado na Tabela A9; ou
[001046] (vi) 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 20, 25, 30, 35, 40, 45, 50, 60, 70, 80, 90, 100, 125, 150, 175, 200, 250, 300, 350, 400, 450, 500, 600, 700, 800, 900, ou 1000 diferenças de nucleotídeos, por exemplo, substituições, inserções ou deleções, em relação a uma sequência de Anellovirus como listado na Tabela A11;
[001047] opcionalmente, em que o elemento genético compreende pelo menos uma diferença (por exemplo, uma mutação, modificação química ou alteração epigenética) em relação a uma sequência do genoma de Anellovirus de tipo selvagem (por exemplo, como descrito no presente documento), por exemplo, uma inserção, substituição, modificação enzimática e/ou deleção, por exemplo, uma deleção de um domínio (por exemplo, um ou mais de uma caixa TATA, local cap, local de início transcricional, 5´ UTR, grelha de leitura aberta (ORF), sinal de poli(A) ou região rica em GC).
[001048] 2012A. Uma molécula de ácido nucleico isolada (por exemplo, um vetor de expressão) compreendendo um elemento genético compreendendo não mais do que cerca de:
[001049] (i) 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 20, 25, 30, 35, 40, 45, 50, 60, 70, 80, 90, 100, 125, 150, 175, 200, 250, 300, 350, 400, 450, 500, 600, 700, 800, 900, 1000, 1010, 1011, 1012, 1013, 1014, 1015, 1016, ou 1017 diferenças de nucleotídeos, por exemplo, substituições, inserções ou deleções, em relação a uma sequência de Anellovirus como listado na Tabela B1;
[001050] (Ii) 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 20, 25, 30, 35, 40, 45, 50, 60, 70, 80, 90, 100, 125, 150, 175, 200, 250, 300, 350, 400, 450, 500, 600, 700, 800, 900, 1000, 1100, 1110, 1120, 1130, 1140, 1150, 11160, 1170, 1171, 1172, 1173, ou 1174 diferenças de nucleotídeos, por exemplo, substituições, inserções ou deleções, em relação a uma sequência de Anellovirus como listado na Tabela B2;
[001051] (iii) 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 20, 25, 30, 35, 40, 45, 50, 60, 70, 80, 90, 100, 125, 150, 175, 200, 250, 300, 350, 400, 450, 500, 600, 610, 620, 630, 640, 650, 660, 670, 671, ou 672 diferenças de nucleotídeos, por exemplo, substituições, inserções ou deleções, em relação a uma sequência de Anellovirus como listado na Tabela B3;
[001052] (iv) 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 20, 25, 30, 35, 40, 45, 50, 60, 70, 80, 90, 100, 125, 150, 175, 200, 250, 260, 270, 271, 272, 273, 274, 275, 276, 277, 278, 279, ou 280 diferenças de nucleotídeos, por exemplo, substituições, inserções ou deleções, em relação a uma sequência de Anellovirus como listado na Tabela B4; ou
[001053] (v) 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 20, 25, 30, 35, 40, 45, 50, 60, 70, 80, 90, 100, 125, 150, 175, 200, 250, 300, 350, 400, 450, 500, 600, 700, 800, 900, ou 1000 diferenças de nucleotídeos,
por exemplo, substituições, inserções ou deleções, em relação a uma sequência de Anellovirus como listado na Tabela B5;
[001054] opcionalmente, em que o elemento genético compreende pelo menos uma diferença (por exemplo, uma mutação, modificação química ou alteração epigenética) em relação a uma sequência do genoma de Anellovirus de tipo selvagem (por exemplo, como descrito no presente documento), por exemplo, uma inserção, substituição, modificação enzimática e/ou deleção, por exemplo, uma deleção de um domínio (por exemplo, um ou mais de uma caixa TATA, local cap, local de início transcricional, 5´ UTR, grelha de leitura aberta (ORF), sinal de poli(A) ou região rica em GC).
[001055] 2013. A molécula de ácido nucleico isolada de qualquer uma das modalidades precedentes, em que o elemento genético não é uma sequência de ocorrência natural (por exemplo, compreende pelo menos uma diferença (por exemplo, uma mutação, modificação química ou alteração epigenética), por exemplo, uma inserção, substituição, modificação enzimática e/ou deleção, por exemplo, uma deleção de um domínio (por exemplo, um ou mais de uma caixa TATA, local cap, local de início transcricional, 5´ UTR, grelha de leitura aberta (ORF), sinal de poli(A) ou região rica em GC)), em relação a uma sequência de Anellovirus de tipo selvagem (por exemplo, um vírus Torque Teno (TTV) de tipo selvagem, minivírus Torque Teno (TTMV) ou sequência de TTMDV, por exemplo, uma sequência de Anellovirus de tipo selvagem, por exemplo, como listado em qualquer uma das Tabelas B1-B5, A1, A3, A5, A7, A9, A11, 1, 3, 5, 7, 9, 11, ou 13).
[001056] 2014. A molécula de ácido nucleico isolada de qualquer uma das modalidades precedentes, em que a molécula de ácido nucleico isolada compreende um elemento genético codificando uma molécula ORF1 (por exemplo, uma molécula ORF1 listada em qualquer uma das Tabelas C1-C5, A2, A4, A6, A8, A10 ou A12 ou um polipeptídeo possuindo pelo menos 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a mesma);
[001057] em que:
[001058] (i) pelo menos 30% (por exemplo, pelo menos 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 90% ou mais) dos aminoácidos da molécula ORF1 são parte de uma folha β;
[001059] (ii) a estrutura secundária da molécula ORF1 compreende pelo menos três (por exemplo, pelo menos 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, ou 20) folhas β;
[001060] (iii) a estrutura secundária da molécula ORF1 compreende uma razão entre folhas β e hélices α de pelo menos 1:1, 2:1, 3:1, 4:1, 5:1, 6:1, 7:1, 8:1, 9:1, ou 10:1; e
[001061] 2015. A molécula de ácido nucleico isolada de qualquer uma das modalidades precedentes, compreendendo pelo menos 10, 15, 20, 25, 30, 31, 32, 33, 34, 35, ou 36 nucleotídeos consecutivos da sequência de ácidos nucleicos:
[001062] (i) CGCGCTGCGCGCGCCGCCCAGTAGGGGGAGCCATGC (SEQ ID NO: 160),
[001063] (ii) GCGCTX1CGCGCGCGCGCCGGGGGGCTGCGCCCCCCC (SEQ ID NO: 164), em que X1 é selecionado de T, G ou A;
[001064] (iii) GCGCTTCGCGCGCCGCCCACTAGGGGGCGTTGCGCG (SEQ ID NO: 165);
[001065] (iv) GCGCTGCGCGCGCCGCCCAGTAGGGGGCGCAATGCG (SEQ ID NO: 166);
[001066] (v) GCGCTGCGCGCGCGGCCCCCGGGGGAGGCATTGCCT (SEQ ID
NO: 167);
[001067] (vi) GCGCTGCGCGCGCGCGCCGGGGGGGCGCCAGCGCCC (SEQ ID NO: 168);
[001068] (vii) GCGCTTCGCGCGCGCGCCGGGGGGCTCCGCCCCCCC (SEQ ID NO: 169);
[001069] (viii) GCGCTTCGCGCGCGCGCCGGGGGGCTGCGCCCCCCC (SEQ ID NO: 170);
[001070] (ix) GCGCTACGCGCGCGCGCCGGGGGGCTGCGCCCCCCC (SEQ ID NO: 171); ou
[001071] (x) GCGCTACGCGCGCGCGCCGGGGGGCTCTGCCCCCCC (SEQ ID NO: 172);
[001072] ou uma sequência de ácidos nucleicos possuindo pelo menos 75, 76, 77, 78, 79, 80, 85, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99, ou 100% de identidade de sequências com a mesma.
[001073] 2016. A molécula de ácido nucleico isolada de qualquer uma das modalidades precedentes, compreendendo pelo menos 20, 25, 30, 31, 32, 33, 34, 35, ou 36 nucleotídeos consecutivos possuindo um conteúdo de GC de pelo menos 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, ou 80,6%.
[001074] 2017. A molécula de ácido nucleico isolada de qualquer uma das modalidades precedentes, em que o elemento genético compreende ainda um ou mais de: uma caixa TATA, um elemento iniciador, um local cap, um local de início transcricional, um domínio conservado 5´ UTR, uma sequência codificando ORF1, uma sequência codificando ORF1/1, uma sequência codificando ORF1/2, uma sequência codificando ORF2, uma sequência codificando ORF2/2, uma sequência codificando ORF2/3, uma sequência codificando ORF2/3t, uma regiões de três grelhas de leitura aberta, um sinal de poli(A) e/ou uma região rica em GC de um Anellovirus descrito no presente documento (por exemplo, como listado em qualquer uma das Tabelas B1-B5, A1, A3, A5, A7, A9 ou A11) ou uma sequência possuindo pelo menos 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a mesma.
[001075] 2018. A molécula de ácido nucleico isolada de qualquer uma das modalidades precedentes, em que o elemento genético compreende ainda pelo menos uma ou duas cópias (por exemplo, 1, 2, 3, 4, 5 ou 6 cópias) de uma sequência do genoma de Anellovirus (por exemplo, como descrito no presente documento, por exemplo, como listado em qualquer uma das Tabelas B1-B5, A1, A3, A5, A7, A9, A11, 1, 3, 5, 7, 9, 11, 13, 15, ou 17) ou uma sequência possuindo pelo menos 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a mesma.
[001076] 2019. A molécula de ácido nucleico isolada de qualquer uma das modalidades precedentes, compreendendo ainda pelo menos uma cópia adicional do elemento genético (por exemplo, um total de 1, 2, 3, 4, 5 ou 6 cópias).
[001077] 2020. A molécula de ácido nucleico isolada de qualquer uma das modalidades precedentes, em que a molécula de ácido nucleico isolada é circular.
[001078] 2021. Uma composição de ácido nucleico isolada (por exemplo, compreendendo uma, duas ou mais moléculas de ácido nucleico) compreendendo o ácido nucleico isolado de qualquer uma das modalidades precedentes.
[001079] 2022. O ácido nucleico isolada de qualquer uma das modalidades precedentes, em que o elemento genético compreende ainda um elemento promotor, uma sequência de ácidos nucleicos (por exemplo, uma sequência de DNA) codificando um efetor (por exemplo, um efetor endógeno ou um efetor exógeno) e/ou uma sequência de ligação à proteína (por exemplo, uma sequência de ligação à proteína exterior).
[001080] 2022A. A molécula de ácido nucleico isolada de qualquer uma das modalidades precedentes, em que o elemento genético compreende uma inserção ou substituição no domínio hipervariável (HVD) da ORF1.
[001081] 2023. O anelossomo ou molécula de ácido nucleico isolada de qualquer uma das modalidades precedentes, em que o elemento genético compreende um ou mais de uma caixa TATA, local iniciador, domínio conservado 5´ UTR, ORF1, ORF2, sequência a jusante de ORF2, ORF2, ORF3 e/ou região rica em GC ou sequências possuindo pelo menos 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade com ele, por exemplo, como mostrado em qualquer uma das Tabelas B1-B5, A1, A3, A5, A7, A9 ou A11.
[001082] 2024. O anelossomo ou ácido nucleico isolado de qualquer uma das modalidades precedentes, que compreende (por exemplo, no exterior proteináceo) ou codifica um ou mais polipeptídeos compreendendo uma sequência de aminoácidos escolhida de ORF1, ORF1/1, ORF1/2, ORF2, ORF2/2, ORF2/3, ORF2t/3 e/ou ORF3 de qualquer uma das Tabelas C1-C5, A2, A4, A6, A8, A10 ou A12 ou uma sequência de aminoácidos possuindo pelo menos 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a mesma.
[001083] 2025. O anelossomo ou ácido nucleico isolado de qualquer uma das modalidades precedentes, em que o elemento genético compreende uma sequência compreendendo pelo menos 20, 25, 30, 31, 32, 33, 34, 35, ou 36 nucleotídeos consecutivos possuindo um conteúdo de GC de pelo menos 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, ou 80,6%.
[001084] 2026. O anelossomo ou ácido nucleico isolado da modalidade 2025, em que o elemento genético compreende pelo menos 20, 25, 30, 31, 32, 33, 34, 35, ou 36 nucleotídeos consecutivos possuindo um conteúdo de GC de pelo menos 80%.
[001085] 2027. O anelossomo ou ácido nucleico isolado da modalidade 2025, em que o elemento genético compreende pelo menos 36 nucleotídeos consecutivos possuindo um conteúdo de GC de pelo menos 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, ou 80,6%.
[001086] 2028. O anelossomo ou ácido nucleico isolado da modalidade 2025, em que o elemento genético compreende pelo menos 36 nucleotídeos consecutivos possuindo um conteúdo de GC de pelo menos 80%.
[001087] 2029. O anelossomo ou ácido nucleico isolado de qualquer uma das modalidades precedentes, em que o elemento genético compreende uma região (por exemplo, uma região de empacotamento) compreendendo pelo menos 10, 15, 20, 25, 30, 31, 32, 33, 34, 35, ou 36 nucleotídeos consecutivos da sequência de ácidos nucleicos:
[001088] (i) CGCGCTGCGCGCGCCGCCCAGTAGGGGGAGCCATGC (SEQ ID NO: 160),
[001089] (ii) GCGCTX1CGCGCGCGCGCCGGGGGGCTGCGCCCCCCC (SEQ ID NO: 164), em que X1 é selecionado de T, G ou A;
[001090] (iii) GCGCTTCGCGCGCCGCCCACTAGGGGGCGTTGCGCG (SEQ ID NO: 165);
[001091] (iv)
GCGCTGCGCGCGCCGCCCAGTAGGGGGCGCAATGCG (SEQ ID NO: 166);
[001092] (v) GCGCTGCGCGCGCGGCCCCCGGGGGAGGCATTGCCT (SEQ ID NO: 167);
[001093] (vi) GCGCTGCGCGCGCGCGCCGGGGGGGCGCCAGCGCCC (SEQ ID NO: 168);
[001094] (vii) GCGCTTCGCGCGCGCGCCGGGGGGCTCCGCCCCCCC (SEQ ID NO: 169);
[001095] (viii) GCGCTTCGCGCGCGCGCCGGGGGGCTGCGCCCCCCC (SEQ ID NO: 170);
[001096] (ix) GCGCTACGCGCGCGCGCCGGGGGGCTGCGCCCCCCC (SEQ ID NO: 171); ou
[001097] (x) GCGCTACGCGCGCGCGCCGGGGGGCTCTGCCCCCCC (SEQ ID NO: 172);
[001098] ou uma sequência de ácidos nucleicos possuindo pelo menos 75, 76, 77, 78, 79, 80, 85, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99, ou 100% de identidade de sequências com a mesma.
[001099] 2030. O anelossomo ou ácido nucleico isolado da modalidade 2029, em que a região de empacotamento está posicionada 3´ em relação à sequência de ácidos nucleicos codificando o efetor.
[001100] 2031. Um polipeptídeo compreendendo uma ou mais de:
[001101] (a) uma primeira região compreendendo uma sequência de aminoácidos possuindo pelo menos 70% (por exemplo, pelo menos cerca de 70, 80, 90, 95, 96, 97, 98, 99, ou 100%) de identidade de sequências com a sequência de região rica em arginina de uma molécula ORF1 de Anellovirus descrita no presente documento (por exemplo, uma sequência de ORF1 de Anellovirus como listado em qualquer uma das Tabelas C1-C5, A2, A4, A6, A8, A10 ou A12);
[001102] (b) uma segunda região compreendendo uma sequência de aminoácidos possuindo pelo menos 30% (por exemplo, pelo menos cerca de 30, 35, 40, 50, 60, 70, 80, 90, 95, 96, 97, 98, 99, ou 100%) de identidade de sequências com a sequência de região jelly-roll de uma molécula ORF1 de Anellovirus descrita no presente documento (por exemplo, uma sequência de ORF1 de Anellovirus como listado em qualquer uma das Tabelas C1-C5, A2, A4, A6, A8, A10 ou A12);
[001103] (c) uma terceira região compreendendo uma sequência de aminoácidos possuindo pelo menos 30% (por exemplo, pelo menos cerca de 30, 35, 40, 50, 60, 70, 80, 90, 95, 96, 97, 98, 99, ou 100%) de identidade de sequências com a sequência do domínio N22 de uma molécula ORF1 de Anellovirus descrita no presente documento (por exemplo, uma sequência de ORF1 de Anellovirus como listado em qualquer uma das Tabelas C1-C5, A2, A4, A6, A8, A10 ou A12); e/ou
[001104] (d) uma quarta região compreendendo uma sequência de aminoácidos possuindo pelo menos 30% (por exemplo, pelo menos cerca de 30, 35, 40, 50, 60, 70, 80, 90, 95, 96, 97, 98, 99, ou 100%) de identidade de sequências com a sequência do domínio C-terminal (CTD) de ORF1 de Anellovirus de uma molécula ORF1 de Anellovirus descrita no presente documento (por exemplo, uma sequência de ORF1 de Anellovirus como listado em qualquer uma das Tabelas C1-C5, A2, A4, A6, A8, A10 ou A12);
[001105] em que a molécula ORF1 compreende pelo menos uma diferença (por exemplo, uma mutação, modificação química ou alteração epigenética) em relação a uma proteína ORF1 de tipo selvagem (por exemplo, como descrito no presente documento), por exemplo, uma inserção, substituição, modificação química ou enzimática e/ou deleção, por exemplo, uma deleção de um domínio (por exemplo, um ou mais de uma região rica em arginina, domínio de jelly- roll, HVR, N22 ou CTD, por exemplo, como descrito no presente documento).
[001106] 2031A. O polipeptídeo da modalidade 2031, compreendendo uma ou mais de:
[001107] (a) uma primeira região compreendendo uma sequência de aminoácidos possuindo pelo menos 90% de identidade de sequências com a sequência de região rica em arginina de uma molécula ORF1 de Anellovirus descrita no presente documento (por exemplo, uma sequência de ORF1 de Anellovirus como listado em qualquer uma das Tabelas C1-C5, A2, A4, A6, A8, A10 ou A12);
[001108] (b) uma segunda região compreendendo uma sequência de aminoácidos possuindo pelo menos 90% de identidade de sequências com a sequência de região jelly-roll de uma molécula ORF1 de Anellovirus descrita no presente documento (por exemplo, uma sequência de ORF1 de Anellovirus como listado em qualquer uma das Tabelas C1-C5, A2, A4, A6, A8, A10 ou A12);
[001109] (c) uma terceira região compreendendo uma sequência de aminoácidos possuindo pelo menos 90% de identidade de sequências com a sequência do domínio N22 de uma molécula ORF1 de Anellovirus descrita no presente documento (por exemplo, uma sequência de ORF1 de Anellovirus como listado em qualquer uma das Tabelas C1-C5, A2, A4, A6, A8, A10 ou A12); e/ou
[001110] (d) uma quarta região compreendendo uma sequência de aminoácidos possuindo pelo menos 90% de identidade de sequências com a sequência do domínio C-terminal (CTD) de ORF1 de Anellovirus de uma molécula ORF1 de Anellovirus descrita no presente documento (por exemplo, uma sequência de ORF1 de Anellovirus como listado em qualquer uma das Tabelas C1-C5, A2, A4, A6, A8, A10 ou A12);
[001111] em que a molécula ORF1 compreende pelo menos uma diferença (por exemplo, uma mutação, modificação química ou alteração epigenética) em relação a uma proteína ORF1 de tipo selvagem (por exemplo, como descrito no presente documento), por exemplo, uma inserção, substituição, modificação química ou enzimática e/ou deleção, por exemplo, uma deleção de um domínio (por exemplo, um ou mais de uma região rica em arginina, domínio de jelly- roll, HVR, N22 ou CTD, por exemplo, como descrito no presente documento).
[001112] 2032. O polipeptídeo da modalidade 2031, em que o polipeptídeo compreende:
[001113] (i) a primeira região e a segunda região;
[001114] (ii) a primeira região e a terceira região;
[001115] (iii) a primeira região e a quarta região;
[001116] (iv) a segunda região e a terceira região;
[001117] (v) a segunda região e a quarta região;
[001118] (vi) a segunda região e a quarta região;
[001119] (vii) a segunda região e a quarta região;
[001120] (viii) a segunda região e a quarta região;
[001121] (ix) a segunda região e a quarta região;
[001122] (x) a segunda região, a terceira região e a quarta região.
[001123] 2033. O polipeptídeo da modalidade 2031 ou 2032, em que o polipeptídeo compreende, na ordem do terminal N para o terminal C, a primeira região, a segunda região, a terceira região e a quarta região.
[001124] 2034. O polipeptídeo de qualquer uma das modalidades precedentes, compreendendo ainda uma sequência de aminoácidos, por exemplo, uma sequência de região hipervariável (HVR) (por exemplo, a sequência de HVR de uma molécula ORF1 de Anellovirus, por exemplo, como descrito no presente documento), em que a sequência de aminoácidos compreende pelo menos cerca de 55 (por exemplo, pelo menos cerca de 45, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, ou 65) aminoácidos (por exemplo, cerca de 45-160, 50-160, 55-160, 60-160, 45-150, 50-150, 55-150, 60-150, 45-140, 50-140, 55-140, ou 60- 140 aminoácidos).
[001125] 2035. O polipeptídeo da modalidade 2034, em que a HVR compreende uma sequência de aminoácidos possuindo pelo menos 30% (por exemplo, pelo menos cerca de 30, 35, 40, 50, 60, 70, 80, 90, 95, 96, 97, 98, 99, ou 100%) de identidade de sequências com uma sequência de HVR de ORF1 de Anellovirus de uma molécula ORF1 de Anellovirus descrita no presente documento (por exemplo, uma sequência de ORF1 de Anellovirus como listado em qualquer uma das Tabelas C1-C5, A2, A4, A6, A8, A10 ou A12).
[001126] 2036. O polipeptídeo da modalidade 2034 ou 2035, em que a sequência de HVR está posicionada entre a segunda região e a terceira região.
[001127] 2037. O polipeptídeo de qualquer uma das modalidades 2034-2036, em que a HVR compreende uma ou mais características de uma HVR como descrito no presente documento.
[001128] 2038. Um polipeptídeo compreendendo a sequência de aminoácidos de ORF1, ORF1/1, ORF1/2, ORF2, ORF2/2, ORF2/3, ORF2t/3 e/ou ORF3 de qualquer uma das Tabelas C1-C5, A2, A4, A6, A8, A10 ou A12 ou possuindo pelo menos 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a mesma, e em que o polipeptídeo compreende ainda pelo menos uma diferença (por exemplo, uma mutação ou modificação química) em relação a uma sequência de ORF1, ORF1/1, ORF1/2, ORF2, ORF2/2, ORF2/3, ORF2t/3 e/ou ORF3 de Anellovirus de tipo selvagem (por exemplo, como descrito no presente documento, por exemplo, como listado em qualquer uma das Tabelas C1-C5, A2, A4, A6, A8, A10 ou
A12), por exemplo, uma conjugação, adição, inserção, substituição e/ou deleção, por exemplo, uma deleção de um domínio.
[001129] 2039. Um polipeptídeo compreendendo uma sequência de aminoácidos de ORF1, ORF1/1, ORF1/2, ORF2, ORF2/2, ORF2/3, ORF2t/3 e/ou ORF3 de qualquer uma das Tabelas C1-C5, A2, A4, A6, A8, A10 ou A12 ou possuindo pelo menos 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a mesma.
[001130] 2040. Um polipeptídeo possuindo pelo menos 75%, 80%, 85%, 90%, 95%, 96%, 97% ou 98%, mas não mais do que 99%, de identidade de sequências com uma sequência de aminoácidos escolhida de ORF1, ORF2, ORF2 ou ORF3 de qualquer uma das Tabelas C1-C5, A2, A4, A6, A8, A10 ou A12.
[001131] 2041. Um polipeptídeo possuindo pelo menos 1, mas não mais do que 2, 5, 10, 20, 50 ou 100, diferenças de aminoácidos, por exemplo, substituições, inserções ou deleções, em relação a uma sequência de aminoácidos escolhida de ORF1, ORF1/1, ORF1/2, ORF2, ORF2/2, ORF2/3, ORF2t/3 e/ou ORF3 de qualquer uma das Tabelas C1-C5, A2, A4, A6, A8, A10 ou A12.
[001132] 2042. O polipeptídeo de qualquer uma das modalidades precedentes, em que o polipeptídeo é um polipeptídeo isolado.
[001133] 2043. Um complexo compreendendo:
[001134] (a) o polipeptídeo de qualquer uma das modalidades precedentes e
[001135] (b) um elemento genético compreendendo um elemento promotor e uma sequência de ácidos nucleicos (por exemplo, uma sequência de DNA) codificando um efetor (por exemplo, um efetor exógeno ou um efetor endógeno) e uma sequência de ligação à proteína.
[001136] 2044. O complexo da modalidade 2043, em que o complexo compreende uma ou mais características de um complexo como descrito no presente documento.
[001137] 2045. Uma proteína de fusão compreendendo uma primeira sequência de aminoácidos escolhida da molécula ORF1, ORF1/1, ORF1/2, ORF2, ORF2/2, ORF2/3, ORF2t/3 e/ou ORF3 de qualquer uma das Tabelas C1-C5, A2, A4, A6, A8, A10 ou A12, ou possuindo pelo menos 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a mesma, e uma fração heteróloga.
[001138] 2046. Uma proteína de fusão compreendendo uma primeira sequência de aminoácidos escolhida da molécula ORF1 de qualquer uma das Tabelas C1-C5, A2, A4, A6, A8, A10 ou A12, ou possuindo pelo menos 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a mesma, e uma fração heteróloga.
[001139] 2047. A proteína de fusão de qualquer uma das modalidades precedentes, em que a fração heteróloga compreende uma fração de direcionamento.
[001140] 2048. A proteína de fusão de qualquer uma das modalidades precedentes, em que a primeira sequência de aminoácidos compreende pelo menos uma diferença (por exemplo, uma mutação ou modificação química) em relação a uma sequência de ORF1, ORF1/1, ORF1/2, ORF2, ORF2/2, ORF2/3, ORF2t/3 e/ou ORF3 de Anellovirus de tipo selvagem (por exemplo, como descrito no presente documento, por exemplo, como listado em qualquer uma das Tabelas C1-C5, A2, A4, A6, A8, A10 ou A12), por exemplo, uma conjugação, adição, inserção, substituição e/ou deleção, por exemplo, uma deleção de um domínio.
[001141] 2049. Uma célula hospedeira compreendendo o anelossomo, ácido nucleico isolado, proteína de fusão ou polipeptídeo de qualquer uma das modalidades precedentes.
[001142] 2050. Uma mistura reacional compreendendo o anelossomo de qualquer uma das modalidades precedentes e um vírus ajudante, em que o vírus ajudante compreende um polinucleotídeo, por exemplo, um polinucleotídeo codificando uma proteína exterior, por exemplo, uma proteína exterior que se liga à sequência de ligação à proteína exterior e, opcionalmente, um envelope de lipídeos.
[001143] 2051. Um método de tratamento de uma doença ou disfunção em um indivíduo, o método compreendendo administração de um anelossomo, molécula de ácido nucleico isolada, proteína de fusão ou polipeptídeo de qualquer uma das modalidades precedentes ou da composição farmacêutica de qualquer uma das modalidades precedentes ao indivíduo.
[001144] 2052. O método da modalidade 2051, em que a doença ou disfunção é escolhida de uma disfunção imunitária, doença infecciosa, disfunção inflamatória, condição autoimune, câncer (por exemplo, um tumor sólido) e uma disfunção gastrointestinal.
[001145] 2053. Uso do anelossomo, ácido nucleico isolado, proteína de fusão ou polipeptídeo de qualquer uma das modalidades precedentes para tratamento de uma doença ou disfunção em um indivíduo.
[001146] 2054. O uso da modalidade 2053, em que a doença ou disfunção é escolhida de uma disfunção imunitária, doença infecciosa, disfunção inflamatória, condição autoimune, câncer (por exemplo, um tumor sólido, por exemplo, câncer de pulmão) e uma disfunção gastrointestinal.
[001147] 2055.O anelossomo, ácido nucleico isolado, composição ou composição farmacêutica de qualquer uma das modalidades precedentes para uso no tratamento de uma doença ou disfunção em um indivíduo.
[001148] 2055A.O anelossomo, ácido nucleico isolado, composição ou composição farmacêutica de qualquer uma das modalidades precedentes para uso como um medicamento.
[001149] 2056. Um método de modulação, por exemplo, inibição ou intensificação, de uma função biológica em um indivíduo, o método compreendendo administração de um anelossomo, ácido nucleico isolado, proteína de fusão ou polipeptídeo de qualquer uma das modalidades precedentes ou da composição farmacêutica de qualquer uma das modalidades precedentes ao indivíduo.
[001150] 2057. Um método de entrega de um anelossomo uma célula, compreendendo contato do anelossomo, ácido nucleico isolado, proteína de fusão ou polipeptídeo de qualquer uma das modalidades precedentes com uma célula, por exemplo, uma célula eucariótica, por exemplo, uma célula de mamífero.
[001151] 2058. O método da modalidade 2057, compreendendo ainda contato de um vírus ajudante com a célula, em que o vírus ajudante compreende um polinucleotídeo, por exemplo, um polinucleotídeo codificando uma proteína exterior, por exemplo, uma proteína exterior que se liga à sequência de ligação à proteína exterior e, opcionalmente, um envelope de lipídeos.
[001152] 2059. O método da modalidade 2058, em que o vírus ajudante é contatado com a célula antes do, simultaneamente com o ou após contato do anelossomo com a célula.
[001153] 2060. O método da modalidade 2057, compreendendo ainda contato de um polinucleotídeo ajudante com a célula.
[001154] 2061. O método da modalidade 2060 em que o polinucleotídeo ajudante compreende uma sequência de polinucleotídeos codificando uma proteína exterior, por exemplo, uma proteína exterior que se liga à sequência de ligação à proteína exterior e um envelope de lipídeos.
[001155] 2062. O método da modalidade 2060, em que o polinucleotídeo ajudante é um RNA (por exemplo, mRNA), DNA, plasmídeo, polinucleotídeo viral ou qualquer sua combinação.
[001156] 2063. O método de qualquer uma das modalidades 2060- 2062, em que o polinucleotídeo ajudante é contatado com a célula antes do, simultaneamente com o ou após contato do anelossomo com a célula.
[001157] 2064. O método de qualquer uma das modalidades 2057- 2063, compreendendo ainda contato de uma proteína ajudante com a célula.
[001158] 2065. O método da modalidade 2064, em que a proteína ajudante compreende uma proteína de replicação viral ou uma proteína de capsídeo.
[001159] 2066. Um método de entrega de um efetor de ácido nucleico ou proteína a uma célula, tecido ou indivíduo alvo, o método compreendendo contato da célula, tecido ou indivíduo alvo com uma composição de ácido nucleico que compreende (a) uma primeira sequência de DNA derivada de um vírus em que a primeira sequência de DNA é suficiente para permitir a produção de uma partícula que pode infectar a célula, tecido ou indivíduo alvo e (a) uma segunda sequência de DNA codificando o efetor de ácido nucleico ou proteína, a melhoria compreendendo:
[001160] a primeira sequência de DNA compreende pelo menos 500 (pelo menos 600, 700, 800, 900, 1000, 1200, 1400, 1500, 1600, 1800, 2000) nucleotídeos possuindo pelo menos 80% (pelo menos 85%, 90%, 95%, 97%, 99%, 100%) de identidade de sequências com uma sequência correspondente listada em qualquer uma das Tabelas B1-B5, A1, A3, A5, A7, A9 ou A11 ou
[001161] a primeira sequência de DNA codifica uma sequência possuindo pelo menos 80% (pelo menos 85%, 90%, 95%, 97%, 99%, 100%) de identidade de sequências com uma molécula ORF1, ORF1/1, ORF1/2, ORF2, ORF2/2, ORF2/3, ORF2t/3 e/ou ORF3 de Anellovirus(por exemplo, listada em qualquer uma das Tabelas C1-C5,
A2, A4, A6, A8, A10 ou A12).
[001162] 2067. Um método de fabricação de uma composição de anelossomos, compreendendo:
[001163] a) proporcionar uma célula hospedeira compreendendo uma ou mais moléculas de ácido nucleico codificando os componentes de um anelossomo de qualquer uma das modalidades precedentes, em que o anelossomo compreende um exterior proteináceo e um elemento genético, por exemplo, um elemento genético compreendendo um elemento promotor, uma sequência codificando um efetor (por exemplo, um efetor endógeno ou um efetor exógeno) e uma sequência de ligação à proteína (por exemplo, uma sequência de ligação à proteína exterior, por exemplo, um sinal de empacotamento);
[001164] b) produzir um anelossomo a partir da célula hospedeira, preparando deste modo um anelossomo; e
[001165] (c) formular os anelossomos, por exemplo, como uma composição farmacêutica adequada para administração a um indivíduo;
[001166] opcionalmente em que a uma ou mais moléculas de ácido nucleico codificam uma proteína ajudante.
[001167] 2068. Um método de fabricação de uma composição de anelossomos, compreendendo:
[001168] a) proporcionar uma pluralidade de anelossomos de acordo com qualquer uma das modalidades precedentes;
[001169] b) avaliar opcionalmente a pluralidade de um ou mais de: um contaminante descrito no presente documento, uma medição de densidade óptica (por exemplo, OD 260), número de partículas (por exemplo, por HPLC), infectividade (por exemplo, razão partícula:unidade infecciosa); e
[001170] c) formular a pluralidade de anelossomos, por exemplo, como uma composição farmacêutica adequada para administração a um indivíduo, por exemplo, se um ou mais dos parâmetros de (b)
atingirem um limiar especificado.
[001171] 2069. O método da modalidade 2068, em que a composição de anelossomos compreende pelo menos 105, 106, 107, 108, 109, 1010, 1011, 1012, 1013, 1014, ou 1015 anelossomos.
[001172] 2070. O método da modalidade 2068 ou 2069, em que a composição de anelossomos compreende pelo menos 10 mL, 20 mL, 50 mL, 100 mL, 200 mL, 500 mL, 1 L, 2 L, 5 L, 10 L, 20 L ou 50 L.
[001173] 2071. O anelossomo ou ácido nucleico isolado de qualquer uma das modalidades precedentes, em que o elemento genético é configurado para se replicar em uma célula de mamífero, por exemplo, uma célula humana.
[001174] 2072. O anelossomo ou ácido nucleico isolado de qualquer uma das modalidades precedentes, em que o elemento genético compreende ainda uma sequência de ácidos nucleicos exógena, por exemplo, selecionada para modular a expressão de um gene, por exemplo, um gene humano.
[001175] 2073. O anelossomo ou ácido nucleico isolado de qualquer uma das modalidades precedentes, em que pelo menos 60% (por exemplo, pelo menos 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, ou 100%) da sequência de ligação à proteína consiste em G ou C.
[001176] 2074. O anelossomo ou ácido nucleico isolado de qualquer uma das modalidades precedentes, em que o elemento genético compreende uma sequência com pelo menos 80, 90, 100, 110, 120, 130 ou 140 nucleotídeos em comprimento, que consiste em G ou C em pelo menos 70% (por exemplo, pelo menos 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100%) ou cerca de 70-100%, 75-95%, 80-95%, 85-95% ou 85-90% das posições.
[001177] 2075. O anelossomo ou ácido nucleico isolado de qualquer uma das modalidades precedentes, em que a sequência de ligação à proteína se liga a uma região rica em arginina do exterior proteináceo.
[001178] 2076. O anelossomo ou ácido nucleico isolado de qualquer uma das modalidades precedentes, em que o exterior proteináceo compreende uma proteína exterior que se liga especificamente à sequência de ligação à proteína.
[001179] 2077. O anelossomo ou ácido nucleico isolado de qualquer uma das modalidades precedentes, em que as porções do elemento genético excluindo o efetor têm um tamanho combinado de cerca de 2,5-5 kb (por exemplo, cerca de 2,8-4 kb, cerca de 2,8-3,2 kb, cerca de 3,6-3,9 kb ou cerca de 2,8-2,9 kb), menos do que cerca de 5 kb (por exemplo, menos do que cerca de 2,9 kb, 3,2 kb, 3,6 kb, 3,9 kb ou 4 kb) ou pelo menos 100 nucleotídeos (por exemplo, pelo menos 1 kb).
[001180] 2078. O anelossomo ou ácido nucleico isolado de qualquer uma das modalidades precedentes, em que o elemento genético tem fita simples.
[001181] 2079. O anelossomo ou ácido nucleico isolado de qualquer uma das modalidades precedentes, em que o elemento genético é circular.
[001182] 2080. O anelossomo ou ácido nucleico isolado de qualquer uma das modalidades precedentes, em que o elemento genético é DNA.
[001183] 2081. O anelossomo ou ácido nucleico isolado de qualquer uma das modalidades precedentes, em que o elemento genético é um DNA de fita negativa.
[001184] 2082. O anelossomo ou ácido nucleico isolado de qualquer uma das modalidades precedentes, em que o elemento genético compreende um epissomo.
[001185] 2083. O anelossomo ou ácido nucleico isolado de qualquer uma das modalidades precedentes, em que o anelossomo está presente a níveis mais elevados em (por exemplo, se acumula preferencialmente em) um órgão ou tecido desejado em relação a outros órgãos ou tecidos.
[001186] 2084. O anelossomo ou ácido nucleico isolado de qualquer uma das modalidades precedentes, em que a célula eucariótica é uma célula de mamífero, por exemplo, uma célula humana.
[001187] 2085. Uma composição compreendendo o anelossomo ou ácido nucleico isolado de qualquer uma das modalidades precedentes.
[001188] 2086. Uma composição farmacêutica compreendendo o anelossomo ou ácido nucleico isolado de qualquer uma das modalidades precedentes e um transportador ou excipiente farmaceuticamente aceitável.
[001189] 2087. Uma composição farmacêutica compreendendo
[001190] a) pelo menos 103, 104, 105, 106, 107, 108 ou 109 anelossomos de qualquer uma das modalidades precedentes;
[001191] b) um excipiente farmacêutico e, opcionalmente,
[001192] c) menos do que uma quantidade predeterminada de: micoplasma, endotoxina, ácidos nucleicos da célula hospedeira (por exemplo, DNA da célula hospedeira e/ou RNA da célula hospedeira), impurezas do processo derivadas de animais (por exemplo, albumina sérica ou tripsina), agentes competentes em replicação (RCA), por exemplo, vírus competentes em replicação ou anelossomos indesejados, proteína de capsídeo viral livre, agentes adventícios e/ou agregados.
[001193] 2088. A composição ou composição farmacêutica da modalidade 2085 ou 2086, que compreende pelo menos 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98%, 99% ou mais anelossomos, por exemplo, anelossomos sintéticos.
[001194] 2089. A composição ou composição farmacêutica de qualquer uma das modalidades 2085-2088, que compreende pelo menos 103, 104, 105, 106, 107, 108 ou 109 anelossomos.
[001195] 2090. Uma composição farmacêutica compreendendo
[001196] a) pelo menos 103, 104, 105, 106, 107, 108 ou 109 anelossomos de qualquer uma das modalidades precedentes;
[001197] b) um excipiente farmacêutico e, opcionalmente,
[001198] c) menos do que uma quantidade predeterminada de: micoplasma, endotoxina, ácidos nucleicos da célula hospedeira (por exemplo, DNA da célula hospedeira e/ou RNA da célula hospedeira), impurezas do processo derivadas de animais (por exemplo, albumina sérica ou tripsina), agentes competentes em replicação (RCA), por exemplo, vírus competentes em replicação ou anelossomos indesejados, proteína de capsídeo viral livre, agentes adventícios e/ou agregados.
[001199] 2091. A composição ou composição farmacêutica de qualquer uma das modalidades 2085-2090, possuindo uma ou mais das seguintes características:
[001200] a) a composição farmacêutica atende a um padrão farmacêutico ou de boas práticas de fabricação (GMP);
[001201] b) a composição farmacêutica foi feita de acordo com boas práticas de fabricação (GMP);
[001202] c) a composição farmacêutica tem um nível de patógenos abaixo de um valor de referência predeterminado, por exemplo, está substancialmente isenta de patógenos;
[001203] d) a composição farmacêutica tem um nível de contaminantes abaixo de um valor de referência predeterminado, por exemplo, está substancialmente isenta de contaminantes;
[001204] e) a composição farmacêutica tem um nível predeterminado de partículas não infecciosas ou uma razão predeterminada de partículas:unidades infecciosas (por exemplo, <300:1, < 200:1, <100:1 ou <50:1) ou
[001205] f)a composição farmacêutica tem baixa imunogenicidade ou é substancialmente não imunogênica, por exemplo, como descrito no presente documento.
[001206] 2092. A composição ou composição farmacêutica de qualquer uma das modalidades 2085-2091, em que a composição farmacêutica tem um nível de contaminantes abaixo de um valor de referência predeterminado, por exemplo, está substancialmente isenta de contaminantes.
[001207] 2093. A composição ou composição farmacêutica da modalidade 92, em que o contaminante é selecionado do grupo consistindo em: micoplasma, endotoxina, ácidos nucleicos da célula hospedeira (por exemplo, DNA da célula hospedeira e/ou RNA da célula hospedeira), impurezas do processo derivadas de animais (por exemplo, albumina sérica ou tripsina), agentes competentes em replicação (RCA), por exemplo, vírus competentes em replicação ou anelossomos indesejados (por exemplo, um anelossomo sem ser o anelossomo desejado, por exemplo, um anelossomo sintético como descrito no presente documento), proteína de capsídeo viral livre, agentes adventícios e/ou agregados.
[001208] 2094. A composição ou composição farmacêutica da modalidade 2093, em que a contaminação é DNA da célula hospedeira e a quantidade limiar é cerca de 500 ng de DNA da célula hospedeira por dose da composição farmacêutica.
[001209] 2095. A composição ou composição farmacêutica de qualquer uma das modalidades 2085-2094, em que a composição farmacêutica compreende menos do que 10% (por exemplo, menos do que cerca de 10%, 5%, 4%, 3%, 2%, 1%, 0,5% ou 0,1%) de contaminante por peso.
[001210] 2096. O método de qualquer uma das modalidades precedentes, em que o anelossomo não compreende um efetor exógeno.
[001211] 2097. O método de qualquer uma das modalidades precedentes, em que a administração do anelossomo, por exemplo,
anelossomo sintético, resulta na entrega do elemento genético em pelo menos 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 95%, 99% ou mais de uma população de células alvo no indivíduo.
[001212] 2098. O método de qualquer uma das modalidades precedentes, em que a administração do anelossomo, por exemplo, anelossomo sintético, resulta na entrega do efetor exógeno em pelo menos 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 95%, 99% ou mais de uma população de células alvo no indivíduo.
[001213] 2099. O método da modalidade 2097 ou 2098, em que as células alvo compreendem células de mamífero, por exemplo, células humanas, por exemplo, células imunitárias, células hepáticas, células epiteliais do pulmão, por exemplo, in vitro.
[001214] 2100. O método de qualquer uma das modalidades 2097- 2099, em que as células alvo estão presentes no fígado ou pulmão.
[001215] 2101. O método de qualquer uma das modalidades 2097- 2100, em que as células alvo nas quais o elemento genético é entregue recebem cada uma pelo menos 10, 50, 100, 500, 1000, 10.000, 50.000,
100.000 ou mais cópias do elemento genético.
[001216] 2102. O método de qualquer uma das modalidades precedentes, em que o efetor compreende um miRNA e opcionalmente em que o miRNA reduz o nível de uma proteína ou RNA alvo em uma célula ou em uma população de células, por exemplo, na qual o anelossomo é entregue, por exemplo, em pelo menos 10%, 20%, 30%, 40% ou 50%.
[001217] 2103. O polipeptídeo, complexo, anelossomo, ácido nucleico isolado, célula, composição ou método de qualquer uma das modalidades precedentes, em que o elemento genético (por exemplo, a 5´ UTR do elemento genético) se associa fisicamente (por exemplo, se liga) ao exterior proteináceo (por exemplo, a uma molécula ORF1 em um exterior proteináceo).
[001218] 2104. O polipeptídeo, complexo, anelossomo, ácido nucleico isolado, célula, composição ou método de qualquer uma das modalidades precedentes, em que o elemento genético encerrado dentro do exterior proteináceo é resistente à digestão por endonucleases, por exemplo, como determinado de acordo com o método descrito em Martin et al. (2013, Hum. Gene Ther. Methods 24 (4): 253-269; incorporado no presente documento por referência em sua totalidade); opcionalmente em que a quantidade de DNase usada é cerca de 60 U/mL ou cerca de 300 U.
[001219] 2105. O polipeptídeo, complexo, anelossomo, ácido nucleico isolado, célula, composição ou método de qualquer uma das modalidades precedentes, em que o elemento genético compreende uma sequência de pelo menos 100 nucleotídeos em comprimento, que consiste em G ou C em pelo menos 80% das posições.
[001220] 2106. O polipeptídeo, complexo, anelossomo, ácido nucleico isolado, célula, composição ou método de qualquer uma das modalidades precedentes, em que o elemento genético é DNA circular, de fita simples.
[001221] 2107. O polipeptídeo, complexo, anelossomo, ácido nucleico isolado, célula, composição ou método de qualquer uma das modalidades precedentes, em que o elemento genético não compreende um ou mais elementos de plasmídeos bacterianos (por exemplo, uma origem de replicação bacteriana ou um marcador selecionável, por exemplo, um gene de resistência bacteriana).
[001222] 2108. O polipeptídeo, complexo, anelossomo, ácido nucleico isolado, célula, composição ou método de qualquer uma das modalidades precedentes, em que o elemento genético se integra a uma frequência de menos do que 1% dos anelossomos que entram na célula de mamífero.
[001223] 2109. O polipeptídeo, complexo, anelossomo, ácido nucleico isolado, célula, composição ou método de qualquer uma das modalidades precedentes, em que o elemento promotor é exógeno ou endógeno a Anellovirus de tipo selvagem.
[001224] 2110. O polipeptídeo, complexo, anelossomo, ácido nucleico isolado, célula, composição ou método de qualquer uma das modalidades precedentes, em que o efetor exógeno é um efetor exógeno terapêutico, por exemplo, um peptídeo terapêutico, um polipeptídeo terapêutico ou um ácido nucleico terapêutico (por exemplo, miRNA).
[001225] 2111. O polipeptídeo, complexo, anelossomo, ácido nucleico isolado, célula, composição ou método de qualquer uma das modalidades precedentes, em que uma população de pelo menos 1000 (por exemplo, pelo menos 1000, 1500, 2000, 3000, 4000, 5000, 6000, 7000, 8000, 9000, 10,000, 20,000, 50,000, 75,000, 100,000, 200,000, 500,000, 1,000,000 ou mais) dos anelossomos entrega pelo menos 100 (por exemplo, pelo menos 100, 150, 200, 250, 300, 400, 500, 600, 700, 800, 900, 1000, 2000, 3000, 4000, 5000, 6000, 7000, 8000, 9000, 10,000, 50,000, 100,000 ou mais) cópias do elemento genético em uma ou mais das células de mamífero.
[001226] 2112. O polipeptídeo, complexo, anelossomo, ácido nucleico isolado, célula, composição ou método de qualquer uma das modalidades precedentes, em que o anelossomo compreende um ou mais polipeptídeos compreendendo uma ou mais de uma sequência de aminoácidos escolhida de ORF2, ORF2/2, ORF2/3, ORF1, ORF1/1 ou ORF1/2 de Anellovirus (por exemplo, como descrito no presente documento) ou uma sequência de aminoácidos possuindo pelo menos 95% de identidade de sequências com as mesmas.
[001227] 2113. O polipeptídeo, complexo, anelossomo, ácido nucleico isolado, célula, composição ou método de qualquer uma das modalidades precedentes, em que o elemento genético compreende uma sequência de ácidos nucleicos codificando uma sequência de aminoácidos escolhida de uma ORF1, ORF2, ORF2/2, ORF2/3, ORF1/1 ou ORF1/2 de Anellovirus (por exemplo, como descrito no presente documento) ou uma sequência de aminoácidos possuindo pelo menos 95% de identidade de sequências com as mesmas.
[001228] 2114. O polipeptídeo, complexo, anelossomo, ácido nucleico isolado, célula, composição ou método de qualquer uma das modalidades precedentes, em que o anelossomo não compreende um polinucleotídeo codificando um ou ambos de um fator de replicação e uma proteína de capsídeo, ou em que os anelossomos são defeituosos em replicação.
[001229] 2115. O polipeptídeo, complexo, anelossomo, ácido nucleico isolado, célula, composição ou método de qualquer uma das modalidades precedentes, em que o anelossomo é contatado com uma célula in vitro ou in vivo.
[001230] 2116. O polipeptídeo, complexo, anelossomo, ácido nucleico isolado, célula, composição ou método de qualquer uma das modalidades precedentes, em que o anelossomo não compreende um polipeptídeo possuindo pelo menos 95% de identidade de sequências com uma ORF2, ORF2/2, ORF2/3, ORF1/1 ou ORF1/2 de Anellovirus (por exemplo, como descrito no presente documento).
[001231] 2117. O polipeptídeo, complexo, anelossomo, ácido nucleico isolado, célula, composição ou método de qualquer uma das modalidades precedentes, em que o elemento genético é capaz de ser amplificado por replicação de círculo rolante (por exemplo, em uma célula, por exemplo, uma célula hospedeira, por exemplo, uma célula de mamífero, por exemplo, uma célula humana, por exemplo, uma célula HEK293T ou A549), por exemplo, para produzir pelo menos 2, 4, 8, 16, 32, 64, 128, 256, 518, ou 1024 cópias.
[001232] 2118. O polipeptídeo, complexo, anelossomo, ácido nucleico isolado, célula, composição ou método de qualquer uma das modalidades precedentes, em que o elemento genético é produzido a partir de uma molécula de DNA circular de fita dupla.
[001233] 2119. O polipeptídeo, complexo, anelossomo, ácido nucleico isolado, célula, composição ou método da modalidade 2118, em que a molécula de DNA circular de fita dupla é produzida por circularização in vitro.
[001234] 2118. O polipeptídeo, complexo, anelossomo, ácido nucleico isolado, célula, composição ou método de qualquer uma das modalidades precedentes, em que o elemento genético é produzido a partir de uma molécula de DNA compreendendo duas cópias da sequência de ácidos nucleicos do elemento genético.
[001235] 2119. O polipeptídeo, complexo, anelossomo, ácido nucleico isolado, célula, composição ou método de qualquer uma das modalidades precedentes, em que as duas cópias da sequência de ácidos nucleicos do elemento genético estão dispostas em tandem na molécula de DNA.
[001236] 2120. Uma molécula de ácido nucleico compreendendo duas cópias de uma sequência de ácidos nucleicos compreendendo a 5´ UTR de um elemento genético de anelossomo (por exemplo, o elemento genético de qualquer uma das modalidades precedentes).
[001237] 2121. Uma molécula de ácido nucleico compreendendo um elemento promotor; uma sequência de ácidos nucleicos codificando um efetor exógeno; uma sequência de 5´ UTR como listada em qualquer uma das Tabelas B1-B5 ou uma sequência de ácidos nucleicos possuindo pelo menos 85% (por exemplo, pelo menos 85%, 90%, 95% 96%, 97%, 98%, 99%, ou 100%) de identidade com a mesma; e uma região rica em GC como listada em qualquer uma das Tabelas B1-B5 ou uma sequência de ácidos nucleicos possuindo pelo menos 85% (por exemplo, pelo menos 85%, 90%, 95% 96%, 97%, 98%, 99%, ou 100%)
de identidade com a mesma.
[001238] 2122. A molécula de ácido nucleico da modalidade 2121, em que a molécula de ácido nucleico tem fita simples ou fita dupla.
[001239] 2123. A molécula de ácido nucleico da modalidade 2121, em que a molécula de ácido nucleico é circular.
[001240] 2124. O polipeptídeo, complexo, anelossomo, ácido nucleico isolado, célula, composição ou método de qualquer uma das modalidades precedentes, em que o elemento genético compreende uma 5´ UTR compreendendo a sequência de ácidos nucleicos de:
[001241] CGGGAGCCX1CGAGGTGAGTGAAACCACCGAGGTCTA GGGGCAATTCGGGCTAGGGCAGTCTAGCGGAACGGG, em que X1 é C ou está ausente
[001242] ou uma sequência de ácidos nucleicos pelo menos 95% idêntica à mesma.
[001243] 3001. Um anelossomo sintético compreendendo:
[001244] (I) um elemento genético compreendendo:
[001245] (a) um elemento promotor,
[001246] (b) uma sequência de ácidos nucleicos codificando um efetor exógeno, em que a sequência de ácidos nucleicos está opera- cionalmente ligada ao elemento promotor,
[001247] em que o efetor exógeno compreende um polipeptídeo que, quando mutado, provoca uma doença humana, ou uma variante funcional do referido polipeptídeo, escolhida a partir de:
[001248] (i) uma enzima terapêutica, (por exemplo, Factor IX, UGT1A1, ou OCA1,
[001249] (ii) uma proteína estrutural (por exemplo, SMN, distrofina), ou
[001250] (iii) uma proteína de complemento (por exemplo C1); e
[001251] (c) um domínio 5´ UTR compreendendo:
[001252] uma sequência de ácidos nucleicos dos nucleotídeos 323 –
393 da SEQID NO: 54 ou uma sequência de ácidos nucleicos pelo menos 85% idêntica à mesma;
[001253] uma sequência de ácidos nucleicos de qualquer uma de SEQ ID NO: 113, SEQ ID NO: 114, SEQ ID NO: 115 , SEQ ID NO: 116, SEQ ID NO: 117, SEQ ID NO: 118, SEQ ID NO: 119 ou uma sequência de ácidos nucleicos pelo menos 85% idêntica à mesma; ou
[001254] uma sequência de ácidos nucleicos dos nucleotídeos 117 – 187 da SEQID NO: 61 ou uma sequência de ácidos nucleicos pelo menos 85% idêntica à mesma;
[001255] (II) um exterior proteináceo compreendendo uma molécula ORF1;
[001256] em que o elemento genético está encerrado dentro do exterior proteináceo; e
[001257] em que o anelossomo sintético é capaz de entregar o elemento genético em uma célula humana.
[001258] 3002. O anelossomo sintético da modalidade 3001, em que o efetor exógeno compreende o Factor IX ou uma variante funcional do mesmo.
[001259] 3003. O anelossomo sintético da modalidade 3001, em que o efetor exógeno é uma enzima da Tabela A ou uma variante funcional da mesma.
[001260] 3004. O anelossomo sintético da modalidade 3001, em que o efetor é um polipeptídeo da Tabela B ou uma variante funcional do mesmo.
[001261] 3005. O anelossomo sintético da modalidade 3001, , em que o efetor exógeno compreende molécula ORF1 compreende a sequência de aminoácidos da SEQID NO: 217 ou uma sequência de aminoácidos possuindo pelo menos 90% de identidade a mesma.
[001262] 3006. O anelossomo sintético de qualquer uma das modalidades precedentes, em que a molécula ORF1 é codificada pelos nucleotídeos 612-2612 da SEQID NO: 54.
[001263] 3007. O anelossomo sintético de qualquer uma das modalidades precedentes, em que o elemento genético compreende a sequência de ácidos nucleicos dos nucleotídeos 2868-2929 da SEQID NO: 54 ou uma sequência de ácidos nucleicos possuindo pelo menos 85% de identidade de sequências com a mesma.
[001264] 3008. O anelossomo sintético de qualquer uma das modalidades precedentes, em que a molécula ORF1 compreende uma sequência de aminoácidos compreendendo uma ou mais das sequências de aminoácidos de uma região rica em arg, domínio jelly- roll, domínio hipervariável, domínio N22 e/ou domínio C-terminal como listado na Tabela 16 ou uma sequência de aminoácidos possuindo pelo menos 85% de identidade com as mesmas.
[001265] 3009. O anelossomo sintético de qualquer uma das modalidades precedentes, em que a molécula ORF1 compreende a sequência de aminoácidos da SEQID NO: 58 ou uma sequência de ácidos nucleicos possuindo pelo menos 85% de identidade de sequências com a mesma.
[001266] 3010. O anelossomo sintético de qualquer uma das modalidades precedentes, compreendendo ainda um polipeptídeo compreendendo a sequência de aminoácidos de uma ORF2, ORF2/2, ORF2/3, ORF1/1 ou ORF1/2 como listado na Tabela 16 ou uma sequência de aminoácidos possuindo pelo menos 85% de identidade a mesma.
[001267] 3011. O anelossomo sintético de qualquer uma das modalidades precedentes, em que o elemento genético codifica a sequência de aminoácidos de uma ORF1, ORF2, ORF2/2, ORF2/3, ORF1/1 ou ORF1/2 como listado na Tabela 16 ou uma sequência de aminoácidos possuindo pelo menos 85% de identidade a mesma.
[001268] 3012. O anelossomo sintético de qualquer uma das modalidades precedentes, em que o anelossomo sintético não compreende um polipeptídeo compreendendo a sequência de aminoácidos de uma ORF2, ORF2/2, ORF2/3, TAIP, ORF1/1 ou ORF1/2 como listado na Tabela 16 ou uma sequência de aminoácidos possuindo pelo menos 85% de identidade a mesma.
[001269] 3013. O anelossomo sintético de qualquer uma das modalidades precedentes, em que o elemento genético não codifica a sequência de aminoácidos de uma ORF1, ORF2, ORF2/2, ORF2/3, ORF1/1 ou ORF1/2 como listado na Tabela 16 ou uma sequência de aminoácidos possuindo pelo menos 85% de identidade a mesma.
[001270] 3014. O anelossomo sintético de qualquer uma das modalidades precedentes, em que a molécula ORF1 compreende a sequência de aminoácidos YNPX2DXGX2N (SEQ ID NO: 829), em que Xn é cada um independentemente uma sequência contígua de quaisquer n aminoácidos.
[001271] 3015. O anelossomo sintético da modalidade 3014, em que a molécula ORF1 compreende ainda uma primeira fita beta e uma segunda fita beta flanqueando a sequência de aminoácidos YNPX2DXGX2N (SEQ ID NO: 829), por exemplo, em que a primeira fita beta compreende o resíduo de tirosina (Y) da sequência de aminoácidos YNPX2DXGX2N (SEQ ID NO: 829) e/ou em que a segunda fita beta compreende o segundo resíduo de asparagina (N) (de N para C) da sequência de aminoácidos YNPX2DXGX2N (SEQ ID NO: 829).
[001272] 3016. O anelossomo sintético de qualquer uma das modalidades precedentes, em que a molécula ORF1 compreende, na ordem da direção do terminal N para o terminal C, uma primeira fita beta, uma segunda fita beta, uma primeira hélice alfa, uma terceira fita beta, uma quarta fita beta, uma quinta fita beta, uma segunda hélice alfa, uma sexta fita beta, uma sétima fita beta, uma oitava fita beta e uma nona fita beta.
[001273] 3017. O anelossomo sintético de qualquer uma das modalidades precedentes, em que o elemento genético é capaz de ser amplificado por replicação de círculo rolante em uma célula hospedeira, por exemplo, para produzir pelo menos 8 cópias.
[001274] 3018. O anelossomo sintético de qualquer uma das modalidades precedentes, em que o elemento genético é de fita única.
[001275] 3019. O anelossomo sintético de qualquer uma das modalidades precedentes, em que o elemento genético é circular.
[001276] 3020. O anelossomo sintético de qualquer uma das modalidades precedentes, em que o elemento genético é DNA.
[001277] 3021. O anelossomo sintético de qualquer uma das modalidades precedentes, em que o elemento genético é um DNA de fita negativa.
[001278] 3022. O anelossomo sintético de qualquer uma das modalidades precedentes, em que o elemento genético se integra a uma frequência de menos do que 10%, 8%, 6%, 4%, 3%, 2%, 1%, 0,5%, 0,2%, 0,1% dos anelossomos que entram na célula, por exemplo, em que o anelossomo sintético é não integrante.
[001279] 3023. O anelossomo sintético de qualquer uma das modalidades precedentes, em que o elemento genético compreende uma sequência de ácidos nucleicos de 5´ UTR de Consenso mostrada na Tabela 16-1.
[001280] 3024. O anelossomo sintético de qualquer uma das modalidades precedentes, em que o elemento genético compreende uma sequência da região rica em GC de Consenso mostrada na Tabela 16-2.
[001281] 3025. O anelossomo sintético de qualquer uma das modalidades precedentes, em que o elemento genético compreende uma sequência de pelo menos 100 nucleotídeos em comprimento, que consiste em G ou C em pelo menos 70% (por exemplo, pelo menos cerca de 70-100%, 75-95%, 80-95%, 85-95% ou 85-90%) das posições.
[001282] 3026. O anelossomo sintético de qualquer uma das modalidades precedentes, em que o elemento genético compreende a sequência de ácidos nucleicos da SEQID NO: 120.
[001283] 3027. O anelossomo sintético de qualquer uma das modalidades precedentes, em que o elemento promotor é exógeno ao Anellovirus de tipo selvagem.
[001284] 3028. O anelossomo sintético de qualquer uma das modalidades precedentes, em que o elemento promotor é endógeno ao Anellovirus de tipo selvagem.
[001285] 3029. O anelossomo sintético de qualquer uma das modalidades precedentes, em que o efetor exógeno compreende um peptídeo, um peptídeo sintético ou análogo de um peptídeo naturalmente bioativo, um peptídeo agonista ou antagonista, um inibidor competitivo para uma enzima, um ligante, um anticorpo, ou um receptor.
[001286] 3030. O anelossomo sintético de qualquer uma das modalidades precedentes, em que a sequência de ácidos nucleicos codificando o efetor exógeno tem cerca de 20-200, 30-180, 40-160, 50- 140, 60-120, 200-2000, 200-500, 500-1000, 1000-1500, ou 1500-2000 nucleotídeos em comprimento.
[001287] 3031. O anelossomo sintético de qualquer uma das modalidades precedentes, em que o elemento genético tem um comprimento de cerca de 1,5-2,0, 2,0-2,5, 2,5-3,0, 3,0-3,5, 3,1-3,6, 3,2- 3,7, 3,3-3,8, 3,4-3,9, 3,5-4,0, 4,0-4,5, ou 4,5-5,0 kb.
[001288] 3032. O anelossomo sintético de qualquer uma das modalidades precedentes, em que o anelossomo sintético é capaz de infectar células humanas, por exemplo, neurônios (por exemplo, neurônios motores) miócitos, células retinais, células do fígado, células de sangue, células de pele, células nervosas, células adiposas, ou células endoteliais, por exemplo, in vitro.
[001289] 3033. O anelossomo sintético de qualquer uma das modalidades precedentes, que é substancialmente não imunogênico, por exemplo, não induz uma resposta imunitária detectável e/ou indesejada, por exemplo, como detectado de acordo com o método descrito no Exemplo 4.
[001290] 3034. O anelossomo sintético da modalidade 3033, em que o anelossomo substancialmente não imunogênico tem uma eficácia em um indivíduo que é pelo menos cerca de 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 95%, ou 100% da eficácia em um indivíduo de referência carecendo de uma resposta imunitária.
[001291] 3035. O anelossomo sintético de qualquer uma das modalidades precedentes, em que uma população de pelo menos 1000 dos anelossomos sintéticos é capaz de entregar pelo menos cerca de 100 cópias (por exemplo, pelo menos 1, 2, 3, 4, 5, 10, 20, 30, 40, 50, 100, 200, 300, 400, 500, 600, 700, 800, 900, ou 1000 cópias) do elemento genético em uma ou mais células humanas.
[001292] 3036. Uma composição farmacêutica compreendendo o anelossomo sintético de qualquer uma das modalidades precedentes e um transportador ou excipiente farmaceuticamente aceitável.
[001293] 3037. A composição farmacêutica da modalidade 3036, que compreende pelo menos 103, 104, 105, 106, 107, 108 ou 109 anelossomos sintéticos.
[001294] 3038. A composição farmacêutica da modalidade 3036 ou 3037, em que a composição farmacêutica tem uma razão predeterminada de partículas:unidades infecciosas (por exemplo, <300:1, < 200:1, <100:1 ou <50:1).
[001295] 3039. Uma mistura reacional compreendendo:
[001296] (i) um primeiro ácido nucleico (por exemplo, um DNA circular de fita dupla ou fita simples) compreendendo a sequência do elemento genético do anelossomo sintético de qualquer uma das modalidades precedentes e
[001297] (ii) uma segunda sequência de ácidos nucleicos codificando uma ou mais de uma sequência de aminoácidos escolhida de ORF1, ORF2, ORF2/2, ORF2/3, ORF1/1 ou ORF1/2, por exemplo, como listado na Tabela 16, ou uma sequência de aminoácidos possuindo pelo menos 85% de identidade de sequências com as mesmas.
[001298] 3040. A mistura reacional da modalidade 3039, em que o primeiro ácido nucleico e o segundo ácido nucleico estão na mesma molécula de ácido nucleico.
[001299] 3041. A mistura reacional da modalidade 3039, em que o primeiro ácido nucleico e o segundo ácido nucleico são moléculas de ácido nucleico diferentes.
[001300] 3042. A mistura reacional da modalidade 3039, em que o primeiro ácido nucleico e o segundo ácido nucleico são moléculas de ácido nucleico diferentes e em que o segundo ácido nucleico é proporcionado como DNA circular de fita dupla.
[001301] 3043. A mistura reacional da modalidade 3039, em que o primeiro ácido nucleico e o segundo ácido nucleico são moléculas de ácido nucleico diferentes e em que o primeiro e o segundo ácidos nucleicos são proporcionados como DNA circular de fita dupla.
[001302] 3044. A mistura reacional da modalidade 3041, em que a segunda sequência de ácidos nucleicos está compreendida por uma célula ajudante ou vírus ajudante.
[001303] 3045. Um método de preparação de um anelossomo sintético, o método compreendendo:
[001304] a) proporcionar uma célula hospedeira compreendendo:
[001305] (i) uma primeira molécula de ácido nucleico compreendendo a sequência de ácidos nucleicos de um elemento genético de um anelossomo sintético de qualquer uma das reivindicações modalidades e
[001306] (ii) uma segunda molécula de ácido nucleico codificando uma ou mais de uma sequência de aminoácidos escolhida de ORF1, ORF2, ORF2/2, ORF2/3, ORF1/1 ou ORF1/2, por exemplo, como listado em qualquer uma das Tabelas 16, ou uma sequência de aminoácidos possuindo pelo menos 85% de identidade de sequências com as mesmas; e
[001307] b) incubar a célula hospedeira sob condições adequadas para preparar um anelossomo sintético;
[001308] preparando deste modo o anelossomo sintético.
[001309] 3046. O método da modalidade 3045, compreendendo ainda, antes do passo (a), introdução da primeira molécula de ácido nucleico e/ou da segunda molécula de ácido nucleico na célula.
[001310] 3047. O método da modalidade 3046, em que a segunda molécula de ácido nucleico é introduzida na célula hospedeira antes da, simultaneamente com ou após a primeira molécula de ácido nucleico.
[001311] 3048. O método de qualquer uma das modalidades 3045 ou 3046, em que a segunda molécula de ácido nucleico é integrada no genoma da célula hospedeira.
[001312] 3049. O método de qualquer uma das modalidades 3045- 3048, em que a segunda molécula de ácido nucleico é um ajudante (por exemplo, um plasmídeo ajudante ou o genoma de um vírus ajudante).
[001313] 3050. O método de qualquer uma das modalidades 3045- 3048, em que a segunda molécula de ácido nucleico codifica uma molécula ORF2 compreendendo a sequência de aminoácidos [W/F]X7HX3CX1CX5H (SEQ ID NO: 949), em que Xn é uma sequência contígua de quaisquer n aminoácidos.
[001314] 3051. Um método de fabricação de uma preparação de anelossomos sintéticos, o método compreendendo:
[001315] a) proporcionar uma pluralidade de anelossomos sintéticos de acordo com as modalidades 3001-3035, uma composição farmacêutica de qualquer uma das modalidades 3036-3038 ou uma mistura reacional de qualquer uma das modalidades 3039-3044;
[001316] b) avaliar opcionalmente a pluralidade de um ou mais de: um contaminante descrito no presente documento, uma medição de densidade óptica (por exemplo, OD 260), número de partículas (por exemplo, por HPLC), infectividade (por exemplo, razão partícula:unidade infecciosa); e
[001317] c) formular a pluralidade de anelossomos sintéticos, por exemplo, como uma composição farmacêutica adequada para administração a um indivíduo, por exemplo, se um ou mais dos parâmetros de (b) atingirem um limiar especificado.
[001318] 3052. Uma célula hospedeira compreendendo:
[001319] (i) uma primeira molécula de ácido nucleico compreendendo a sequência de ácidos nucleicos de um elemento genético de um anelossomo sintético de qualquer uma das reivindicações modalidades e
[001320] (ii) opcionalmente, uma segunda molécula de ácido nucleico codificando uma ou mais de uma sequência de aminoácidos escolhida de ORF1, ORF2, ORF2/2, ORF2/3, ORF1/1 ou ORF1/2 como listado em qualquer uma das Tabelas 16, ou uma sequência de aminoácidos possuindo pelo menos 85% de identidade de sequências com as mesmas.
[001321] 3053. Um método de entrega de um efetor exógeno (por exemplo, um efetor exógeno terapêutico) a uma célula de mamífero, compreendendo:
[001322] (a) proporcionar um anelossomo sintético de qualquer uma das modalidades precedentes; e
[001323] (b) contatar uma célula de mamífero com o anelossomo sintético;
[001324] em que o anelossomo sintético é capaz de entregar o elemento genético na célula de mamífero; e
[001325] opcionalmente em que o anelossomo sintético é produzido por introdução do elemento genético em uma célula hospedeira, sob condições adequadas para encerrar o elemento genético dentro do exterior proteináceo na célula hospedeira;
[001326] entregando deste modo o efetor exógeno terapêutico à célula de mamífero.
[001327] 3054. Uso de um anelossomo sintético de qualquer uma das modalidades 3001-3035 ou da composição farmacêutica de qualquer uma das modalidades 3036-3038 para entrega do elemento genético a uma célula hospedeira.
[001328] 3055. Uso de um anelossomo sintético de qualquer uma das modalidades 3001-3035 ou da composição farmacêutica de qualquer uma das modalidades 3036-3038 para tratamento de uma doença ou disfunção em um indivíduo.
[001329] 3056. O uso da modalidade 3055, em que a doença ou disfunção é uma doença neuromuscular (por exemplo, atrofia muscular espinhal), uma distrofia muscular (por exemplo, distrofia muscular de Duchenne ou distrofia muscular de Becker), uma insuficiência enzimática (por exemplo, Síndrome de Crigler-Najjar), ou albinismo (por exemplo, albinismo ocular), ou deficiência de C1.
[001330] 3057. Um anelossomo sintético de qualquer uma das modalidades 3001-3035 ou da composição farmacêutica de qualquer uma das modalidades 3036-3038, para uso no tratamento de uma doença ou disfunção em um indivíduo.
[001331] 3058. Um método de tratamento de uma doença ou disfunção em um indivíduo, o método compreendendo administração de um anelossomo sintético de qualquer uma das modalidades 3001-3035 ou da composição farmacêutica de qualquer uma das modalidades 3036-3038, em que a doença ou disfunção é uma doença neuromuscular (por exemplo, atrofia muscular espinhal), uma distrofia muscular (por exemplo, distrofia muscular de Duchenne ou distrofia muscular de Becker), uma insuficiência enzimática (por exemplo, Síndrome de Crigler -Najjar), ou albinismo (por exemplo, albinismo ocular), ou deficiência de C1.
[001332] 3059. Uso do anelossomo sintético de qualquer uma das modalidades 3001-3035 ou da composição farmacêutica de qualquer uma das modalidades 3036-3038, na fabricação de um medicamento para tratamento de uma doença ou disfunção em um indivíduo, opcionalmente em que a doença ou disfunção é uma doença neuromuscular (por exemplo, atrofia muscular espinhal), uma distrofia muscular (por exemplo, distrofia muscular de Duchenne ou distrofia muscular de Becker), uma insuficiência enzimática (por exemplo, Síndrome de Crigler-Najjar), ou albinismo (por exemplo, albinismo ocular), ou deficiência de C1.
[001333] Outras características, objetivos e vantagens da invenção serão evidentes a partir da descrição e desenhos e a partir das reivindicações.
[001334] A não ser que de outro modo definido, todos os termos técnicos e científicos usados no presente documento têm o mesmo significado como comumente entendido por um perito na técnica à qual a presente invenção pertence. Todas as publicações, pedidos de patentes, patentes e outras referências mencionados no presente documento são incorporados por referência em sua totalidade. Ainda, os materiais, métodos e exemplos são somente ilustrativos e não se destinam a ser limitantes.
BREVE DESCRIÇÃO DOS DESENHOS
[001335] A seguinte descrição detalhada das modalidades da invenção será mais bem entendida quando lida em conjunção com os desenhos anexados. Para o propósito de ilustração da invenção são mostrados nos desenhos modalidades que são presentemente exemplificadas. Deve ser entendido, no entanto, que a invenção não está limitada à disposição e instrumentalidades precisas das modalidades mostradas nos desenhos.
[001336] A patente ou ficheiro do pedido contém pelo menos um desenho executado a cores. Cópias desta patente ou publicação do pedido de patente com desenho(s) a cores serão proporcionadas pelo Escritório após solicitação e pagamento da taxa necessária.
[001337] A Figura 1A é uma ilustração mostrando a percentagem de similaridade de sequências de regiões de aminoácidos das sequências de proteínas de capsídeo.
[001338] A Figura 1B é uma ilustração mostrando a percentagem de similaridade de sequências de proteínas de capsídeo.
[001339] A Figura 2 é uma ilustração mostrando uma modalidade de um anelossomo.
[001340] A Figura 3 ilustra um esquema de um vetor de canamicina codificando a estirpe LY1 de TTMiniV (“Anelossomo 1”).
[001341] A Figura 4 ilustra um esquema de um vetor de canamicina codificando a estirpe LY2 de TTMiniV (“Anelossomo 2”).
[001342] A Figura 5 ilustra a eficiência de transfecção de anelossomos sintéticos em células 293T e A549.
[001343] As Figuras 6A e 6B ilustram os resultados de PCR quantitativa que ilustram infecção bem-sucedida de células 293T por anelossomos sintéticos.
[001344] As Figuras 7A e 7B ilustram os resultados de PCR quantitativa que ilustram infecção bem-sucedida de células A549 por anelossomos sintéticos.
[001345] As Figuras 8A e 8B ilustram os resultados de PCR quantitativa que ilustram infecção bem-sucedida de células Raji por anelossomos sintéticos.
[001346] As Figuras 9A e 9B ilustram os resultados de PCR quantitativa que ilustram infecção bem-sucedida de células Jurkat por anelossomos sintéticos.
[001347] As Figuras 10A e 10B ilustram os resultados de PCR quantitativa que ilustram infecção bem-sucedida de células Chang por anelossomos sintéticos.
[001348] As Figuras 11A-11B são uma série de gráficos mostrando a expressão da luciferase a partir de células transfectadas ou infectadas com TTMV-LY2∆574-1371,∆1432-2210,2610::nLuc. Foi observada luminescência nas células infectadas, indicando replicação e empacotamento bem-sucedidos.
[001349] A Figura 11C é um diagrama ilustrando a árvore filogenética de Alphatorquevirus (Vírus Torque Teno; TTV) com os clados destacados. São representadas pelo menos 100 estirpes de Anellovirus. Sequências exemplificativas de vários clados são proporcionadas no presente documento, por exemplo, nas Tabelas A1-A12, B1-B5, C1-C5 e 1-18.
[001350] A Figura 12 é um esquema mostrando um fluxo de trabalho exemplificativo para produção de anelossomos (por exemplo, anelossomos competentes em replicação ou deficientes em replicação como descrito no presente documento).
[001351] A Figura 13 é um gráfico mostrando a especificidade de conjuntos de iniciadores desenhados para quantificação de equivalentes genômicos de TTV e TTMV. A PCR quantitativa baseada na química verde SYBR mostra um pico distinto para cada um dos produtos de amplificação usando conjuntos de iniciadores específicos de TTMV ou TTV, como indicado, em plasmídeos codificando os respectivos genomas.
[001352] A Figura 14 é uma série de gráficos mostrando eficiências de PCR na quantificação de equivalentes do genoma de TTV por qPCR.
Concentrações crescentes de iniciadores e uma concentração fixa de sonda de hidrólise (250 nM) foram usadas com duas misturas principais de qPCR comerciais diferentes. Eficiências de 90-110% resultaram em propagação mínima de erros durante a quantificação.
[001353] A Figura 15 é um gráfico mostrando uma representação gráfica de amplificação exemplificativa para amplificação linear de TTMV (Alvo 1) ou TTV (Alvo 2) ao longo de 7 log10 de concentrações equivalentes de genoma. Os equivalentes de genoma foram quantificados ao longo de 7 diluições de 10 vezes com eficiências de PCR elevadas e linearidade (R2 TTMV: 0,996; R2 TTV: 0,997).
[001354] As Figuras 16A-16B são uma série de gráficos mostrando a quantificação de equivalentes de genoma de TTMV em um estoque de anelossomos. (A) Representação gráfica de amplificação de dois estoques, cada um diluído 1:10 e executado em duplicado. (B) As mesmas duas amostras como mostrado no painel A no presente documento mostradas no contexto da gama linear. São mostrados os limites superior e inferior nas duas amostras representativas. Eficiência de PCR: 99,58%, R2: 0988.
[001355] A Figura 17 é um gráfico mostrando a dimensão da mudança na expressão de miR-625 em células HEK293T transfectadas com o plasmídeo indicado.
[001356] A Figura 18 é um diagrama mostrando a identidade par a par para alinhamentos de sequências representativas a partir de cada clado de Alphatorquevirus. As sequências de DNA para TTV-CT30F, TTV- P13-1, TTV-tth8, TTV-HD20a, TTV-16, TTV-TJN02 e TTV-HD16d foram alinhadas. A percentagem de identidade par a par ao longo de uma janela deslizante de 50 pb é mostrada ao longo do comprimento do alinhamento. Os parêntesis acima indicam regiões não codificantes e codificantes com as identidades par a par indicadas. Os parêntesis abaixo indicam regiões de elevada ou baixa conservação de sequências.
[001357] A Figura 19 é um diagrama mostrando a identidade par a par para alinhamentos de aminoácidos para proteínas putativas ao longo dos sete clados de Alphatorquevirus. As sequências de aminoácidos para proteínas putativas a partir de TTV-CT30F, TTV-P13-1, TTV-tth8, TTV-HD20a, TTV-16, TTV-TJN02 e TTV-HD16d foram alinhadas. A percentagem de identidade par a par ao longo de uma janela deslizante de 15 aa é mostrada ao longo do comprimento de casa alinhamento. A identidade par a par tanto para a sequência de DNA de grelha de leitura aberta como para a sequência de aminoácidos da proteína é indicada. (*) As sequências de aminoácidos de ORF2t/3 putativas foram alinhadas para TTV-CT30F, TTV-tth8, TTV-16 e TTV-TJN02.
[001358] A Figura 20 é um diagrama mostrando que um domínio dentro da 5´ UTR é altamente conservado ao longo dos sete clados de Alphatorquevirus (SEQ ID NOS 810-817, respectivamente, por ordem de aparecimento). As sequências de domínio conservado 5´ UTR de 71 pb para cada Alphatorquevirus representativo foram alinhadas. A sequência tem 95,2% de identidade par a par entre os sete clados.
[001359] A Figura 21 é um diagrama mostrando um alinhamento dos domínios ricos em GC a partir dos sete clados de Alphatorquevirus. Cada Anellovirus tem uma região a jusante das ORFs com mais do que 70% de conteúdo de GC. É mostrado um alinhamento das regiões ricas em GC a partir de TTV-CT30F, TTV-P13-1, TTV-tth8, TTV-HD20a, TTV- 16, TTV-TJN02 e TTV-HD16d. As regiões variam em comprimento, mas onde se alinham têm identidade par a par de 75,4%.
[001360] A Figura 22 é um diagrama mostrando a infecção de células B Raji com anelossomos codificando um miRNA visando a proteína de interação com n-myc (NMI). É mostrada a quantificação de equivalentes de genoma de anelossomos detectados após infecção de células B Raji (seta) ou células de controle com anelossomos codificando miRNA de NMI.
[001361] A Figura 23 é um diagrama mostrando a infecção de células B Raji com anelossomos codificando um miRNA visando a proteína de interação com n-myc (NMI). A transferência de Western mostra que anelossomos codificando o miRNA contra NMI reduziram a expressão da proteína NMI em células Raji B, ao passo que células Raji B infectadas com anelossomos carecendo do miRNA mostraram expressão da proteína NMI comparável aos controles.
[001362] A Figura 24 é uma série de gráficos mostrando a quantificação de partículas de anelossomo geradas em células hospedeiras após infecção com um anelossomo compreendendo uma sequência codificante de miRNA endógeno e um anelossomo correspondente no qual a sequência codificante de miRNA endógeno foi deletada.
[001363] As Figuras 25A-25C são uma série de diagramas mostrando a localização intracelular de ORFs de TTMV-LY2 fundidas à nano- luciferase. (A) Em células Vero, ORF2 (linha superior) pareceu se localizar para o citoplasma enquanto ORF1/1 (linha inferior) pareceu se localizar para o núcleo. (B) Em células HEK293, ORF2 (linha superior) pareceu se localizar para o citoplasma enquanto ORF1/1 (linha inferior) pareceu se localizar para o núcleo. (C) Padrões de localização para ORF1/2 e ORF2/2 nas células.
[001364] A Figura 26 é uma série de diagramas mostrando controles de deleção sequencial na região não codificante (NCR) 3´ de TTV-tth8. A linha superior mostra a estrutura do Anellovirus TTV-tth8 de tipo selvagem. A segunda linha mostra TTV-tth8 com uma deleção de 36 nucleotídeos na região rica em GC da 3´ NCR (Δ36nt (GC)). A terceira linha mostra TTV-tth8 com a deleção de 36 nucleotídeos e uma deleção adicional da sequência de miRNA, resultando em uma deleção total de 78 nucleotídeos (Δ36nt (GC) ΔmiR). A quarta linha mostra TTV-tth8 com uma deleção de 171 nucleotídeos da 3´ NCR, que inclui tanto a região de deleção de 36 nucleotídeos como a sequência de miRNA (Δ3' NCR).
[001365] As Figuras 27A-27D são uma série de diagramas mostrando que as deleções sequenciais na 3´ NCR de TTV-tth8 têm efeitos significativos nos níveis de transcrito de ORF de Anellovirus. São mostradas as expressões de ORF1 e ORF2 no dia 2 (A), ORF1/1 e ORF2/2 no dia 2 (B), ORF1/2 e ORF2/3 no dia 2 (C) e ORF2t3 no dia 2 (D).
[001366] As Figuras 28A-28B são uma série de diagramas mostrando construtos usados para produzir anelossomos expressando nano- luciferase (A) e uma série de combinações anelossomo/plasmídeo usadas para transfectar células (B).
[001367] As Figuras 29A-29C são uma série de diagramas mostrando a expressão de nano-luciferase em camundongos injetados com anelossomos. (A) Expressão de nano-luciferase em camundongos nos dias 0-9 após injeção. (B) Expressão de nano-luciferase em camundongos injetados com várias combinações de construto de anelossomo/plasmídeo, como indicado. (C) Quantificação da luminescência da nano-luciferase detectada em camundongos após injeção. O grupo A recebeu um vetor TTMV-LY2 + nano-luciferase. O grupo B recebeu uma proteína nano-luciferase e ORFs de TTMV-LY2.
[001368] A Figura 29D é um esquema da organização genômica de anelos representativos de sete clados diferentes de Alphatorquevirus. As sequências para TTV-CT30F, TTV-P13-1, TTV-tth8, TTV-HD20a, TTV-16, TTV-TJN02 e TTV-HD16d foram alinhadas, com regiões críticas anotadas. As grelhas de leitura aberta (ORFs) putativas são representadas em cinza-claro, as caixas TATA são representadas em cinza-escuro e as regiões reguladoras críticas são representadas em cinza-médio, incluindo o elemento iniciador, o domínio conservado 5´ UTR e a região rica em GC (por exemplo, como indicado).
[001369] A Figura 30 é um esquema mostrando um fluxo de trabalho exemplificativo para determinação do alvo endógeno de pré-miRNAs de Anellovirus.
[001370] As Figuras 31A-31B são uma série de diagramas mostrando que um plasmídeo de Anellovirus em tandem pode aumentar a produção de anelovírus ou anelossomos. (A) Mapa de plasmídeo para um plasmídeo de Anellovirus em tandem exemplificativo. (B) A transfecção de células HEK293T com um plasmídeo de Anellovirus em tandem resultou na produção de quatro vezes o número de genomas virais em comparação com plasmídeos transportando cópia única.
[001371] A Figura 31C é uma imagem de eletroforese em gel mostrando a circularização dos plasmídeos TTMV-LY2 pVL46-063 e pVL46-240.
[001372] A Figura 31D é um cromatograma mostrando os números de cópias para construtos TTMV-LY2 lineares e circulares, como determinado por cromatografia de exclusão por tamanhos (SEC).
[001373] A Figura 32 é um diagrama mostrando um alinhamento de regiões ricas em GC de 36 nucleotídeos de nove sequências do genoma de Anellovirus e uma sequência de consenso com base nelas (SEQ ID NOS 818-827, respectivamente, por ordem de aparecimento).
[001374] A Figura 33 é uma série de diagramas mostrando as estruturas de ORF1 das estirpes de Anellovirus LY2 e CBD203. Os domínios putativos são marcados: região rica em arginina (rica em arg), região nuclear compreendendo um domínio jelly-roll, região hipervariável (HVR), região N22 e domínio C-terminal (CTD), como indicado.
[001375] A Figura 34 é um diagrama mostrando uma estrutura de ORF1 da estirpe de Betatorquevirus CBS203. Os resíduos mostrando elevada similaridade entre um conjunto de 110 betatorquevírus são indicados. São indicados os resíduos de 60-79,9% de similaridade, os resíduos de 80-99,9% de similaridade e os resíduos de 100% de similaridade entre todas as estirpes avaliadas.
[001376] A Figura 35 é um diagrama mostrando a sequência de consenso (SEQ ID NO: 828) do alinhamento de 258 sequências de Alphatorqueviruses com resíduos com pontuações de elevada similaridade destacadas em cinza-escuro (100%), cinza-médio (80- 99,9%), cinza-claro (60-80%). Os domínios putativos são indicados em caixas. A percentagem de identidade é também indicada pelo gráfico de caixas abaixo da sequência de consenso, com as caixas cinza-médio indicando 100% de identidade, as caixas cinza-claro indicando 30-99% de identidade e as caixas cinza-escuro indicando identidade abaixo de 30%.
[001377] A Figura 36 é um esquema mostrando os domínios de uma molécula de ORF1 de Anellovirus e a região hipervariável a ser substituída por um domínio hipervariável de um Anellovirus diferente.
[001378] A Figura 37 é um esquema mostrando os domínios de ORF1 e a região hipervariável que será substituída por uma proteína ou peptídeo de interesse (POI) de uma fonte diferente de anelovírus.
[001379] A Figura 38 é uma série de diagramas mostrando o desenho de um elemento genético de anelossomo exemplificativo com base em um genoma de Anellovirus. A região codificante de proteína foi deletada do genoma de anelovírus (esquerda), deixando a região não codificante (NCR) aneloviral, incluindo o promotor viral, domínio conservado 5´ UTR (5CD) e a região rica em GC. O DNA de carga útil foi inserido na região não codificante no lócus codificante de proteína (direita). O anelossomo resultante abrigava o DNA de carga útil (incluindo grelhas de leitura aberta, genes, RNAs não codificantes, etc.) e os elementos essenciais de replicação e empacotamento cis do anelovírus, mas careciam dos elementos de proteína essenciais para replicação e empacotamento.
[001380] A Figura 39 é um gráfico de barras mostrando que os anelossomos compreendendo um elemento genético codificando uma imunoadesina humana exógena transduziram com sucesso a linha de células derivada de pulmão humano EKVX.
[001381] A Figura 40 é um gráfico mostrando que os anelossomos baseados em tth8 ou LY2, manipulados para conterem uma sequência codificando eritropoietina humana (hEpo), poderiam entregar um transgene funcional às células de mamífero.
[001382] As Figuras 41A e 41B são uma série de gráficos mostrando que os anelossomos manipulados administrados a camundongos eram detectáveis sete dias após injeção intravenosa.
[001383] A Figura 42 é um gráfico mostrando que o mRNA de hGH foi detectado na fração celular de sangue inteiro sete dias após administração intravenosa de um anelossomo manipulado codificando hGH.
[001384] As Figuras 43A-43D são uma série de diagramas ilustrando um motivo altamente conservado em ORF2 de Anellovirus. A Figura 43 descreve SEQ ID NO: 949.
[001385] As Figuras 44A e 44B são uma série de diagramas mostrando evidência da expressão de mRNA de ORF1 de comprimento total em tecidos humanos.
[001386] A Figura 45 é um gráfico mostrando a capacidade de um genoma de TTV-tth8 circularizado in vitro (IVC) (IVC TTV-tth8) em comparação com um genoma de TTV-tth8 em um plasmídeo de originar cópias do genoma de TTV-tth8 na densidade esperada em células HEK293T.
[001387] A Figura 46 é uma série de gráficos mostrando a capacidade de um genoma de LY2 circularizado in vitro (IVC) (WT LY2 IVC) e um genoma de LY2 de tipo selvagem no plasmídeo (Plasmídeo WT LY2) de originar cópias do genoma de LY2 na densidade esperada em células Jurkat.
[001388] A Figura 47 é um diagrama mostrando um alinhamento da estrutura secundária do domínio jelly roll de proteínas ORF1 de Anellovirus de Alphatorquevirus, Betatorquevirus e Gammatorquevirus (SEQ ID NOs: 950-975). Estes elementos estruturais secundários são altamente conservados.
[001389] A Figura 48 é um diagrama mostrando a sequência conservada e a estrutura secundária do motivo de ORF1 localizado no domínio N22 (SEQ ID NOS 976-1000 e 851, respectivamente, por ordem de aparecimento). O Motivo YNPXXDXGXXN (SEQ ID NO: 829) conservado de ORF1 de TTV humano tem uma estrutura secundária conservada. Em particular, a tirosina no motivo quebra uma fita beta, e uma segunda fita beta começa na asparagina terminal do motivo.
DESCRIÇÃO DETALHADA DE CERTAS MODALIDADES Definições
[001390] A presente invenção será descrita no que diz respeito a modalidades particulares e com referência a certas figuras, mas a invenção não está limitada às mesmas, mas somente pelas reivindicações. Os termos como apresentados doravante serão geralmente para serem entendidos em seu sentido comum a não ser que indicado de outro modo.
[001391] Onde o termo “compreendendo” é usado na presente descrição e reivindicações, ele não exclui outros elementos. Para os propósitos da presente invenção, o termo “consistindo em” é considerado como sendo uma modalidade preferencial do termo “compreendendo em”. Se doravante um grupo for definido como compreendendo pelo menos um certo número de modalidades, isto é para ser entendido como preferencialmente também descrevendo um grupo que consiste somente em estas modalidades.
[001392] Onde um artigo indefinido ou definido é usado para se referir a um nome singular, por exemplo, “um”, “uma” ou “o/a”, isto inclui um plural desse nome a não ser que outra coisa seja especificamente afirmada.
[001393] A expressão “composto, composição, produto, etc. para tratamento, modulação, etc.” é para ser entendida como se referindo a um composto, composição, produto, etc. per se que seja adequado para os propósitos indicados de tratamento, modulação, etc. A expressão “composto, composição, produto, etc. para tratamento, modulação, etc.” descreve ainda que, como uma modalidade, tal composto, composição, produto, etc. é para uso no tratamento, modulação, etc.
[001394] A expressão “composto, composição, produto, etc. para uso em...”, “uso de um composto, composição, produto, etc. na fabricação de um medicamento, composição farmacêutica, composição veterinária, composição de diagnóstico, etc. para...” ou “composto, composição, produto, etc. para uso como um medicamento...” indica que tais compostos, composições, produtos, etc. são para serem usados em métodos terapêuticos que podem ser praticados no corpo humano ou animal. São considerados como uma descrição equivalente de modalidades e reivindicações pertencendo a métodos de tratamento, etc. Se uma modalidade ou uma reivindicação se referir assim a “um composto para uso no tratamento de um humano ou animal sendo suspeito de sofrer de uma doença”, isto é considerado como sendo também uma descrição de um “uso de um composto na fabricação de um medicamento para tratamento de um humano ou animal sendo suspeito de sofrer de uma doença” ou um “método de tratamento por administração de um composto a um humano ou animal sendo suspeito de sofrer de uma doença”. A expressão “composto, composição, produto, etc. para tratamento, modulação, etc.” é para ser entendida como se referindo a um composto, composição, produto, etc. per se que seja adequada para os propósitos indicados de tratamento, modulação, etc.
[001395] Se doravante exemplos de um termo, valor, número, etc.,
forem proporcionados entre parêntesis, isto é para ser entendido como uma indicação de que os exemplos mencionados entre parênteses podem constituir uma modalidade. Por exemplo, se for afirmado que “em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de nucleotídeos codificando ORF1 de Anellovirus da Tabela 1 (por exemplo, nucleotídeos 571 – 2613 da sequência de ácidos nucleicos da Tabela 1)”, então algumas modalidades se relacionam com moléculas de ácido nucleico molécula compreendendo uma sequência de ácidos nucleicos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com os nucleotídeos 571 – 2613 da sequência de ácidos nucleicos da Tabela 1.
[001396] Como usado no presente documento, o termo “anelossomo” se refere a um veículo compreendendo um elemento genético, por exemplo, um epissomo, por exemplo, DNA circular, encerrado em um exterior proteináceo. Um “anelossomo sintético”, como usado no presente documento, se refere geralmente a um anelossomo que não é de ocorrência natural, por exemplo, tem uma sequência que é diferente em relação a um vírus de tipo selvagem (por exemplo, um Anellovirus de tipo selvagem como descrito no presente documento). Em algumas modalidades, o anelossomo sintético é manipulado ou recombinante, por exemplo, compreende um elemento genético que compreende uma diferença ou modificação em relação a um genoma viral de tipo selvagem (por exemplo, um genoma de Anellovirus de tipo selvagem como descrito no presente documento). Em algumas modalidades, encerrado dentro de um exterior proteináceo engloba 100% de cobertura por um exterior proteináceo, bem como menos do que 100% de cobertura, por exemplo, 95%, 90%, 85%, 80%, 70%, 60%, 50% ou menos. Por exemplo, lacunas ou descontinuidades (por exemplo, que tornam o exterior proteináceo permeável à água, íons, peptídeos ou moléculas pequenas) podem estar presentes no exterior proteináceo, desde que o elemento genético seja retido no exterior proteináceo, por exemplo, antes da entrada em uma célula hospedeira. Em algumas modalidades, o anelossomo é purificado, por exemplo, é separado da sua fonte original e/ou está substancialmente isento (>50%, >60%, >70%, >80%, >90%) de outros componentes.
[001397] Como usado no presente documento, o termo “anelovetor” se refere a um vetor que compreende uma sequência de ácidos nucleicos suficiente derivada de ou altamente similar a (por exemplo, pelo menos 85%, 90%, 95%, 96%, 97%, 98%, 99% ou 100% idêntico a) uma sequência do genoma de Anellovirus ou uma sua porção para permitir empacotamento em um exterior proteináceo (por exemplo, um capsídeo) e, ainda, compreende uma sequência heteróloga. Em algumas modalidades, o anelovetor é um vetor viral ou um ácido nucleico nu. Em algumas modalidades, o anelovetor compreende pelo menos cerca de 50, 60, 70, 71, 72, 73, 74, 75, 80, 90, 100, 150, 200, 300, 400, 500, 600, 700, 800, 900, 1000, 1100, 1200, 1300, 1400, 1500, 1600, 1700, 1800, 1900, 2000, 2500, 3000, ou 3500 nucleotídeos consecutivos de uma sequência de Anellovirus nativa ou uma sequência altamente similar (por exemplo, pelo menos 85%, 90%, 95%, 96%, 97%, 98%, 99% ou 100% idêntica). Em algumas modalidades, o anelovetor compreende ainda uma ou mais de uma ORF1, ORF2 ou ORF3 de Anellovirus. Em algumas modalidades, a sequência heteróloga compreende um local de clonagem múltipla, compreende um promotor heterólogo, compreende uma região codificante para uma proteína terapêutica ou codifica um ácido nucleico terapêutico. Em algumas modalidades, o capsídeo é um capsídeo de Anellovirus de tipo selvagem. Em modalidades, um anelovetor compreende um elemento genético descrito no presente documento, por exemplo, compreende um elemento genético compreendendo um promotor, uma sequência codificando um efetor terapêutico e uma sequência de ligação ao capsídeo.
[001398] Como usado no presente documento, o termo “molécula de anticorpo” se refere a uma proteína, por exemplo, uma cadeia de imunoglobulina ou seu fragmento, compreendendo pelo menos uma sequência de domínio variável de imunoglobulina. O termo “molécula de anticorpo” engloba anticorpos de comprimento total e fragmentos de anticorpos (por exemplo, scFvs). Em algumas modalidades, uma molécula de anticorpo é uma molécula de anticorpo multiespecífica, por exemplo, a molécula de anticorpo compreende uma pluralidade de sequências de domínio variável de imunoglobulina, em que uma primeira sequência de domínio variável de imunoglobulina da pluralidade tem especificidade de ligação para um primeiro epítopo e uma segunda sequência de domínio variável de imunoglobulina da pluralidade tem especificidade de ligação para um segundo epítopo. Em modalidades, a molécula de anticorpo multiespecífica é uma molécula de anticorpo biespecífica. Uma molécula de anticorpo biespecífico é geralmente caracterizada por uma primeira sequência de domínio variável de imunoglobulina que tem especificidade de ligação para um primeiro epítopo e uma segunda sequência de domínio variável de imunoglobulina que tem especificidade de ligação para um segundo epítopo.
[001399] Como usado no presente documento, um ácido nucleico “codificando” se refere a uma sequência de ácidos nucleicos codificando uma sequência de aminoácidos ou um polinucleotídeo funcional (por exemplo, um RNA não codificante, por exemplo, um siRNA ou miRNA).
[001400] Um agente “exógeno” (por exemplo, um efetor, um ácido nucleico (por exemplo, RNA), um gene, carga útil, proteína) como usado no presente documento se refere a um agente que não está compreendido por, ou não é codificado por, um vírus de tipo selvagem correspondente, por exemplo, um Anellovirus como descrito no presente documento. Em algumas modalidades, o agente exógeno não existe naturalmente, tal como uma proteína ou ácido nucleico que tem uma sequência que é alterada (por exemplo, por inserção, deleção ou substituição) em relação a uma proteína ou ácido nucleico de ocorrência natural. Em algumas modalidades, o agente exógeno não existe naturalmente na célula hospedeira. Em algumas modalidades, o agente exógeno existe naturalmente na célula hospedeira mas é exógeno ao vírus. Em algumas modalidades, o agente exógeno existe naturalmente na célula hospedeira, mas não está presente a um nível desejado ou em um momento desejado.
[001401] Um agente ou elemento “heterólogo” (por exemplo, um efetor, uma sequência de ácidos nucleicos, uma sequência de aminoácidos), como usado no presente documento no que diz respeito a um outro agente ou elemento (por exemplo, um efetor, uma sequência de ácidos nucleicos, uma sequência de aminoácidos), se refere a agentes ou elementos que não são encontrados naturalmente em conjunto, por exemplo, em um vírus de tipo selvagem, por exemplo, um Anellovirus. Em algumas modalidades, uma sequência de ácidos nucleicos heteróloga pode estar presente no mesmo ácido nucleico que uma sequência de ácidos nucleicos de ocorrência natural (por exemplo, uma sequência que ocorre naturalmente no Anellovirus). Em algumas modalidades, um agente ou elemento heterólogo é exógeno em relação a um Anellovirus a partir do qual outros (por exemplo, o resto dos) elementos do anelossomo são baseados.
[001402] Como usado no presente documento, o termo “elemento genético” se refere a uma sequência de ácidos nucleicos, geralmente em um anelossomo. É entendido que o elemento genético pode ser produzido como DNA nu e, opcionalmente, ainda montado em um exterior proteináceo. É também entendido que um anelossomo pode inserir seu elemento genético em uma célula, resultando no elemento genético estando presente na célula e o exterior proteináceo não entrando necessariamente na célula.
[001403] Como usado no presente documento, o termo “molécula ORF1” se refere a um polipeptídeo possuindo uma atividade e/ou uma característica estrutural de uma proteína ORF1 de Anellovirus (por exemplo, uma proteína ORF1 de Anellovirus como descrito no presente documento, por exemplo, como listado em qualquer uma das TabelasA2, A4, A6, A8, A10, A12, C1-C5,2, 4, 6, 8, 10, 12, 14, 16, 18, 20-37, ou D1-D10) ou um seu fragmento funcional. Uma molécula ORF1 pode, em alguns casos, compreender um ou mais de (por exemplo, 1, 2, 3 ou 4 de): uma primeira região compreendendo pelo menos 60% de resíduos básicos (por exemplo, pelo menos 60% de resíduos de arginina), um segundo região compreendendo pelo menos cerca de seis fitas beta (por exemplo, pelo menos 4, 5, 6, 7, 8, 9, 10, 11, ou 12 fitas beta), uma terceira região compreendendo uma estrutura ou uma atividade de um domínio N22 de Anellovirus (por exemplo, como descrito no presente documento, por exemplo, um domínio N22 de uma proteína ORF1 de Anellovirus como descrito no presente documento) e/ou uma quarta região compreendendo uma estrutura ou uma atividade de um domínio C-terminal (CTD) de Anellovirus (por exemplo, como descrito no presente documento, por exemplo, um CTD de uma proteína ORF1 de Anellovirus como descrito no presente documento). Em alguns casos, a molécula ORF1 compreende, na ordem N-terminal para C- terminal, a primeira, segunda, terceira e quarta regiões. Em alguns casos, um anelossomo compreende uma molécula ORF1 compreendendo, na ordem N-terminal para C-terminal, a primeira, segunda, terceira e quarta regiões. Uma molécula ORF1 pode, em alguns casos, compreender um polipeptídeo codificado por um ácido nucleico de ORF1 de Anellovirus (por exemplo, como listado em qualquer uma das Tabelas A1, A3, A5, A7, A9, A11, B1-B5, 1, 3, 5, 7, 9, 11, 13, 15, ou 17). Uma molécula ORF1 pode, em alguns casos, compreender ainda uma sequência heteróloga, por exemplo, uma região hipervariável (HVR), por exemplo, uma HVR de uma proteína ORF1 de Anellovirus, por exemplo, como descrito no presente documento. Uma “proteína ORF1 de Anellovirus”, como usado no presente documento, se refere a uma proteína ORF1 codificada por um genoma de Anellovirus (por exemplo, um genoma de Anellovirus de tipo selvagem, por exemplo, como descrito no presente documento), por exemplo, uma proteína ORF1 possuindo a sequência de aminoácidos como listado em qualquer uma das Tabelas A2, A4, A6, A8, A10, A12, C1-C5, 2, 4, 6, 8, 10, 12, 14, 16, 18, 20-37, ou D1-D10, ou como codificado pelo gene ORF1 como listado em qualquer uma das Tabelas A1, A3, A5, A7, A9, A11, B1-B5, 1, 3, 5, 7, 9, 11, 13, 15, ou 17.
[001404] Como usado no presente documento, o termo “molécula ORF2” se refere a um polipeptídeo possuindo uma atividade e/ou uma característica estrutural de uma proteína ORF2 de Anellovirus (por exemplo, uma proteína ORF2 de Anellovirus como descrito no presente documento, por exemplo, como listado em qualquer uma das Tabelas A2, A4, A6, A8, A10, A12, C1-C5, 2, 4, 6, 8, 10, 12, 14, 16, 18, 20-37, ou D1-D10) ou um seu fragmento funcional. Uma “proteína ORF2 de Anellovirus”, como usado no presente documento, se refere a uma proteína ORF2 codificada por um genoma de Anellovirus (por exemplo, um genoma de Anellovirus de tipo selvagem, por exemplo, como descrito no presente documento), por exemplo, uma proteína ORF2 possuindo a sequência de aminoácidos como listado em qualquer uma das Tabelas A2, A4, A6, A8, A10, A12, C1-C5, 2, 4, 6, 8, 10, 12, 14, 16, 18, 20-37, ou D1-D10, ou como codificado pelo gene ORF2 como listado em qualquer uma das Tabelas A1, A3, A5, A7, A9, A11, B1-B5, 1, 3, 5, 7, 9, 11, 13, 15, ou 17.
[001405] Como usado no presente documento, o termo “exterior proteináceo” se refere a um componente exterior que é predominantemente (por exemplo, >50%, >60%, > 70%, >80%, > 90%) proteína.
[001406] Como usado no presente documento, o termo “ácido nucleico regulador” se refere a uma sequência de ácidos nucleicos que modifica expressão, por exemplo, transcrição e/ou tradução, de uma sequência de DNA que codifica um produto de expressão. Em modalidades, o produto de expressão compreende RNA ou proteína.
[001407] Como usado no presente documento, o termo “sequência reguladora” se refere a uma sequência de ácidos nucleicos que modifica a transcrição de um produto gênico alvo. Em algumas modalidades, a sequência reguladora é um promotor ou um intensificador.
[001408] Como usado no presente documento, o termo “proteína de replicação” se refere a uma proteína, por exemplo, uma proteína viral, que é utilizada durante a infecção, replicação/expressão do genoma viral, síntese de proteínas virais e/ou montagem dos componentes virais.
[001409] Como usado no presente documento, um organismo, partícula ou componente “substancialmente não patogênico” se refere a um organismo, partícula (por exemplo, um vírus ou um anelossomo, por exemplo, como descrito no presente documento) ou seu componente que não causa ou induz uma doença ou condição patogênica detectável, por exemplo, em um organismo hospedeiro, por exemplo, um mamífero, por exemplo, um humano. Em algumas modalidades, a administração de um anelossomo a um indivíduo pode resultar em reações mínimas ou efeitos secundários que são aceitáveis como parte do padrão de tratamento.
[001410] Como usado no presente documento, o termo “não patogênico” se refere a um organismo ou seu componente que não causa ou induz uma doença ou condição patogênica detectável, por exemplo, em um organismo hospedeiro, por exemplo, um mamífero, por exemplo, um humano.
[001411] Como usado no presente documento, um elemento genético “substancialmente não integrante” se refere a um elemento genético, por exemplo, um elemento genético em um vírus ou anelossomo, por exemplo, como descrito no presente documento, em que menos do que cerca de 0,01%, 0,05%, 0,1%, 0,5% ou 1% do elemento genético que entra em uma célula hospedeira (por exemplo, uma célula eucariótica) ou organismo (por exemplo, um mamífero, por exemplo, um humano) se integram no genoma. Em algumas modalidades, o elemento genético não se integra detectavelmente no genoma de, por exemplo, uma célula hospedeira. Em algumas modalidades, a integração do elemento genético no genoma pode ser detectada usando técnicas como descrito no presente documento, por exemplo, sequenciamento de ácidos nucleicos, detecção de PCR e/ou hibridação de ácidos nucleicos.
[001412] Como usado no presente documento, um organismo, partícula ou componente “substancialmente não imunogênico” se refere a um organismo, partícula (por exemplo, um vírus ou anelossomo, por exemplo, como descrito no presente documento) ou seu componente, que não causa ou induz uma resposta imunitária indesejada ou não visada, por exemplo, em um tecido ou organismo hospedeiro (por exemplo, um mamífero, por exemplo, um humano). Em modalidades, o organismo, partícula ou componente substancialmente não imunogênico não produz uma resposta imunitária detectável. Em modalidades, o anelossomo substancialmente não imunogênico não produz uma resposta imunitária detectável contra uma proteína compreendendo uma sequência de aminoácidos ou codificada por uma sequência de ácidos nucleicos mostrada em qualquer uma das Tabelas A1, A3, A5, A7, A9, A11, B1-B5, 1, 3, 5, 7, 9, 11, 13, 15, ou 17. Em modalidades, uma resposta imunitária (por exemplo, uma resposta imunitária indesejada ou não visada) é detectada por avaliação da presença ou nível de anticorpos (por exemplo, presença ou nível de um anticorpo antianelossomo, por exemplo, presença ou nível de um anticorpo contra um anelossomo sintético como descrito no presente documento) em um indivíduo, por exemplo, de acordo com o método de detecção de anticorpos anti-TTV descrito em Tsuda et al. (1999; J. Virol. Methods 77: 199-206; incorporado no presente documento por referência) e/ou o método para determinação dos níveis de IgG anti-TTV descrito em Kakkola et al. (2008; Virology 382: 182-189; incorporado no presente documento por referência). Os anticorpos contra um Anellovirus ou um anelossomo com base neles podem ser também detectados por métodos na técnica para detecção de anticorpos antivirais, por exemplo, métodos para detecção de anticorpos anti-AAV, por exemplo, como descrito em Calcedo et al. (2013; Front. Immunol. 4(341): 1-7; incorporado no presente documento por referência).
[001413] Uma “subsequência” como usado no presente documento se refere a uma sequência de ácidos nucleicos ou uma sequência de aminoácidos que está compreendida em uma sequência de ácidos nucleicos ou sequência de aminoácidos maior, respectivamente. Em alguns casos, uma subsequência pode compreender um domínio ou fragmento funcional da sequência maior. Em alguns casos, a subsequência pode compreender um fragmento da sequência maior capaz de formar estruturas secundárias e/ou terciárias quando isolada a partir da sequência maior similar às estruturas secundárias e/ou terciárias formadas pela subsequência quando presente com o resto da sequência maior. Em alguns casos, uma subsequência pode ser substituída por uma outra sequência (por exemplo, uma subsequência compreendendo uma sequência exógena ou uma sequência heteróloga ao resto da sequência maior, por exemplo, uma subsequência correspondente de um Anellovirus diferente).
[001414] Como usado no presente documento, “tratamento”, “tratando” e seus cognatos se referem à gestão médica de um indivíduo com a intenção de melhorar, aprimorar, estabilizar, prevenir ou curar uma doença, condição patológica ou disfunção. Este termo inclui tratamento ativo (tratamento dirigido para melhorar a doença, condição patológica ou disfunção), tratamento causal (tratamento dirigido para a causa da doença, condição patológica ou disfunção associada), tratamento paliativo (tratamento desenhado para o alívio dos sintomas), tratamento preventivo (tratamento dirigido para prevenção, minimização ou inibição parcial ou completa do desenvolvimento da doença, condição patológica ou disfunção associada); e tratamento de suporte (tratamento usado para suplementar uma outra terapia).
[001415] Como usado no presente documento, o termo “viroma” se refere a vírus em um ambiente particular, por exemplo, uma parte de um corpo, por exemplo, em um organismo, por exemplo, em uma célula, por exemplo, em um tecido.
[001416] Esta invenção se relaciona geralmente com anelossomos, por exemplo, anelossomos sintéticos, e seus usos. A presente descrição proporciona anelossomos, composições compreendendo anelossomos e métodos de preparação ou uso de anelossomos. Os anelossomos são geralmente úteis como veículos de entrega, por exemplo, para entrega de um agente terapêutico a uma célula eucariótica. Geralmente, um anelossomo incluirá um elemento genético compreendendo uma sequência de ácidos nucleicos (por exemplo, codificando um efetor, por exemplo, um efetor exógeno ou um efetor endógeno) encerrado dentro de um exterior proteináceo. Um anelossomo pode incluir uma ou mais deleções de sequências (por exemplo, regiões ou domínios como descritos no presente documento) em relação a uma sequência de Anellovirus (por exemplo, como descrito no presente documento). Os anelossomos podem ser usados como um veículo substancialmente não imunogênico para entrega do elemento genético, ou um efetor codificado nele (por exemplo, um polipeptídeo ou efetor de ácidos nucleicos, por exemplo, como descrito no presente documento), em células eucarióticas, por exemplo, para tratar uma doença ou disfunção em um indivíduo compreendendo as células.
TABELA DE CONTEÚDOS I. Anelossomos A. Anelovírus B. Moléculas ORF1 C. Moléculas ORF2 D. Elementos genéticos E. Sequências de ligação à proteína F. Regiões 5´ UTR G. Regiões ricas em GC H. Efetores I. Exterior proteináceo II. Vetores III. Composições IV. Células hospedeiras V. Métodos de uso VI. Métodos de produção VII. Administração/Entrega I. Anelossomos
[001417] Em alguns aspectos, a invenção descrita no presente documento compreende composições e métodos de uso e preparação de um anelossomo, preparações de anelossomos e composições terapêuticas. Em algumas modalidades, o anelossomo tem uma sequência, estrutura e/ou função que são baseadas em um Anellovirus (por exemplo, um Anellovirus como descrito no presente documento, por exemplo, um Anellovirus compreendendo um ácido nucleico ou polipeptídeo compreendendo uma sequência como mostrado em qualquer uma das Tabelas A1-A12, B1-B5, C1-C5, 1-18, 20-37 ou D1- D10), ou seus fragmentos ou porções, ou outro vírus substancialmente não patogênico, por exemplo, um vírus simbiótico, vírus comensal, vírus nativo.
Em algumas modalidades, um anelossomo baseado em Anellovirus compreende pelo menos um elemento exógeno a esse Anellovirus, por exemplo, um efetor exógeno ou uma sequência de ácidos nucleicos codificando um efetor exógeno disposta dentro de um elemento genético do anelossomo.
Em algumas modalidades, um anelossomo baseado em Anellovirus compreende pelo menos um elemento heterólogo a um outro elemento desse Anellovirus, por exemplo, uma sequência de ácidos nucleicos codificando um efetor que é heteróloga a um outra sequência de ácidos nucleicos ligada, tal como um elemento promotor.
Em algumas modalidades, um anelossomo compreende um elemento genético (por exemplo, DNA circular, por exemplo, DNA de fita simples), que compreende pelo menos um elemento que é heterólogo em relação ao resto do elemento genético e/ou ao exterior proteináceo (por exemplo, um elemento exógeno codificando um efetor, por exemplo, como descrito no presente documento). Um anelossomo pode ser um veículo de entrega (por exemplo, um veículo de entrega substancialmente não patogênico) para uma carga útil em um hospedeiro, por exemplo, um humano.
Em algumas modalidades, o anelossomo é capaz de se replicar em uma célula eucariótica, por exemplo, uma célula de mamífero, por exemplo, uma célula humana.
Em algumas modalidades, o anelossomo é substancialmente não patogênico e/ou substancialmente não integrante na célula de mamífero (por exemplo, humana). Em algumas modalidades, o anelossomo é substancialmente não imunogênico em um mamífero, por exemplo, um humano. Em algumas modalidades, o anelossomo é deficiente em replicação. Em algumas modalidades, o anelossomo é competente em replicação.
[001418] Em algumas modalidades, o anelossomo compreende um cúron ou um seu componente (por exemplo, um elemento genético, por exemplo, compreendendo uma sequência codificando um efetor e/ou um exterior proteináceo), por exemplo, como descrito no Pedido PCT N.º PCT/US2018/037379, que é incorporado no presente documento por referência em sua totalidade.
[001419] Em um aspecto, a invenção inclui um anelossomo compreendendo (i) um elemento genético compreendendo um elemento promotor, uma sequência codificando um efetor (por exemplo, um efetor endógeno ou um efetor exógeno, por exemplo, uma carga útil) e uma sequência de ligação à proteína (por exemplo, uma sequência de ligação à proteína exterior, por exemplo, um sinal de empacotamento), em que o elemento genético é um DNA de fita simples e tem uma das ou ambas as seguintes propriedades: é circular e/ou se integra no genoma de uma célula eucariótica a uma frequência de menos do que cerca de 0,001%, 0,005%, 0,01%, 0,05%, 0,1%, 0,5%, 1%, 1,5%, ou 2% do elemento genético que entra na célula; e (ii) um exterior proteináceo; em que o elemento genético está encerrado dentro do exterior proteináceo; e em que o anelossomo é capaz de entregar o elemento genético em uma célula eucariótica.
[001420] Em algumas modalidades do anelossomo descrito no presente documento, o elemento genético se integra a uma frequência de menos do que cerca de 0,001%, 0,005%, 0,01%, 0,05%, 0,1%, 0,5%, 1%, 1,5%, ou 2% do elemento genético que entra em uma célula. Em algumas modalidades, menos do que cerca de 0,01%, 0,05%, 0,1%, 0,5%, 1%, 2%, 3%, 4% ou 5% dos elementos genéticos de uma pluralidade de anelossomos administrados a um indivíduo se integrarão no genoma de uma ou mais células hospedeiras no indivíduo. Em algumas modalidades, os elementos genéticos de uma população de anelossomos, por exemplo, como descrito no presente documento, se integram no genoma de uma célula hospedeira a uma frequência menor do que aquela de uma população comparável de vírus AAV, por exemplo, a cerca de uma frequência de 50%, 60%, 70%, 75%, 80%, 85%, 90%, 95%, 100% ou mais baixa do que a população comparável de vírus AAV.
[001421] Em um aspecto, a invenção inclui um anelossomo compreendendo: (i) um elemento genético compreendendo um elemento promotor e uma sequência codificando um efetor (por exemplo, um efetor endógeno ou um efetor exógeno, por exemplo, uma carga útil) e uma sequência de ligação à proteína (por exemplo, uma sequência de ligação à proteína exterior), em que o elemento genético tem pelo menos 75% (por exemplo, pelo menos 75, 76, 77, 78, 79, 80, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99, ou 100%) de identidade de sequências com uma sequência de Anellovirus de tipo selvagem (por exemplo, um vírus Torque Teno (TTV) de tipo selvagem, minivírus Torque Teno (TTMV) ou sequência de TTMDV, por exemplo, uma sequência de Anellovirus de tipo selvagem como listado em qualquer uma das Tabelas A1, A3, A5, A7, A9, A11, B1-B5, 1, 3, 5, 7, 9, 11, 13, 15, ou 17); e (ii) um exterior proteináceo; em que o elemento genético está encerrado dentro do exterior proteináceo; e em que o anelossomo é capaz de entregar o elemento genético em uma célula eucariótica.
[001422] Em um aspecto, a invenção inclui um anelossomo compreendendo:
[001423] a) um elemento genético compreendendo (i) uma sequência codificando uma proteína exterior (por exemplo, proteína exterior não patogênica), (ii) uma sequência de ligação à proteína exterior que liga o elemento genético à proteína exterior não patogênica e (iii) uma sequência codificando um efetor (por exemplo, um efetor endógeno ou exógeno); e
[001424] b) um exterior proteináceo que está associado ao, por exemplo, envolve ou encerra o, elemento genético.
[001425] Em algumas modalidades, o anelossomo inclui sequências ou produtos de expressão de (ou possuindo >70%, 75%, 80%, 85%, 90%, 95%, 97%, 98%, 99%, 100% de homologia com) um vírus de DNA não envelopado, circular, de fita simples. Os vírus de DNA de fita simples circulares de animais se referem geralmente a um subgrupo de vírus de DNA de fita simples (ssDNA), que infectam hospedeiros diferentes de plantas eucarióticos e têm um genoma circular. Assim, os vírus de ssDNA circulares de animais são distinguíveis dos vírus de ssDNA que infectam procarióticas (i.e., Microviridae e Inoviridae) e dos vírus de ssDNA que infectam plantas (i.e., Geminiviridae e Nanoviridae). São também distinguíveis dos vírus de ssDNA lineares que infectam eucariotas diferentes de plantas (por exemplo, Parvoviridiae).
[001426] Em algumas modalidades, o anelossomo modula uma função celular hospedeira, por exemplo, transientemente ou a longo prazo. Em certas modalidades, a função celular é estavelmente alterada, tal como uma modulação que persiste durante pelo menos cerca de 1 h a cerca de 30 dias ou pelo menos cerca de 2 h, 6 h, 12 h, 18 h, 24 h, 2 dias, 3, dias, 4 dias, 5 dias, 6 dias, 7 dias, 8 dias, 9 dias, 10 dias, 11 dias, 12 dias, 13 dias, 14 dias, 15 dias, 16 dias, 17 dias, 18 dias, 19 dias, 20 dias, 21 dias, 22 dias, 23 dias, 24 dias, 25 dias, 26 dias, 27 dias, 28 dias, 29 dias, 30 dias, 60 dias ou mais ou qualquer momento intermédio. Em certas modalidades, a função celular é transientemente alterada, por exemplo, tal como uma modulação que persiste durante não mais do que cerca de 30 min a cerca de 7 dias ou não mais do que cerca de 1 h, 2 h, 3 h, 4 h, 5 h, 6 h, 7 h, 8 h, 9 h, 10 h, 11 h, 12 h, 13 h,
14 h, 15 h, 16 h, 17 h, 18 h, 19 h, 20 h, 21 h, 22 h, 24 h, 36 h, 48 h, 60 h, 72 h, 4 dias, 5 dias, 6 dias, 7 dias ou qualquer outro momento intermédio.
[001427] Em algumas modalidades, o elemento genético compreende um elemento promotor. Em modalidades, o elemento promotor é selecionado de um promotor dependente de RNA polimerase II, um promotor dependente de RNA polimerase III, um promotor de PGK, um promotor de CMV, um promotor de EF-1α, um promotor de SV40, um promotor de CAGG ou um promotor de UBC, promotores virais de TTV, Específico de tecidos, U6 (pollIII), promotor mínimo de CMV com locais de ligação ao DNA a montante para proteínas ativadoras (TetR-VP16, Gal4-VP16, dCas9-VP16, etc.). Em modalidades, o elemento promotor compreende uma caixa TATA. Em modalidades, o elemento promotor é endógeno a um Anellovirus de tipo selvagem, por exemplo, como descrito no presente documento.
[001428] Em algumas modalidades, o elemento genético compreende uma ou mais das seguintes características: fita simples, circular, fita negativa e/ou DNA. Em modalidades, o elemento genético compreende um epissomo. Em algumas modalidades, as porções do elemento genético excluindo o efetor têm um tamanho combinado de cerca de 2,5-5 kb (por exemplo, cerca de 2,8-4 kb, cerca de 2,8-3,2 kb, cerca de 3,6-3,9 kb ou cerca de 2,8-2,9 kb), menos do que cerca de 5 kb (por exemplo, menos do que cerca de 2,9 kb, 3,2 kb, 3,6 kb, 3,9 kb ou 4 kb) ou pelo menos 100 nucleotídeos (por exemplo, pelo menos 1 kb).
[001429] Os anelossomos, composições compreendendo anelossomos, métodos usando tais anelossomos, etc., como descrito no presente documento são, em alguns casos, baseados em parte nos exemplos que ilustram como é que diferentes efetores, por exemplo miRNAs (por exemplo, contra IFN ou miR-625), shRNA, etc. e sequências de ligação à proteína, por exemplo sequências de DNA que se ligam à proteínas de capsídeo tal como Q99153, são combinados com exteriores proteináceos, por exemplo um capsídeo descrito em Arch Virol (2007) 152: 1961-1975, para produzir anelossomos que podem ser depois usados para entregar um efetor às células (por exemplo, células animais, por exemplo, células humanas ou células animais não humanas tais como células de porco ou camundongo). Em modalidades, o efetor pode silenciar a expressão de um fator tal como um interferon. Os exemplos descrevem ainda como os anelossomos podem ser preparados por inserção de efetores em sequências derivadas, por exemplo, de um Anellovirus. É com base em estes exemplos que a descrição doravante contempla várias variações das descobertas e combinações específicas consideradas nos exemplos. Por exemplo, o perito entenderá a partir dos exemplos que os miRNAs específicos são usados meramente como um exemplo de um efetor e que outros efetores podem ser, por exemplo, outros ácidos nucleicos reguladores ou peptídeos terapêuticos. Similarmente, os capsídeos específicos usados nos exemplos podem ser substituídos por proteínas substancialmente não patogênicas descritas doravante. As sequências de Anellovirus específicas descritas nos exemplos podem ser também substituídas pelas sequências de Anellovirus descritas doravante. Estas considerações se aplicam similarmente a sequências de ligação à proteína, sequências reguladoras tais como promotores e similares. Independentemente disso, o perito na técnica considerará em particular tais modalidades que estão intimamente relacionadas com os exemplos.
[001430] Em algumas modalidades, um anelossomo, ou o elemento genético compreendido no anelossomo, é introduzido em uma célula (por exemplo, uma célula humana). Em algumas modalidades, o efetor (por exemplo, um RNA, por exemplo, um miRNA), por exemplo, codificado pelo elemento genético de um anelossomo, é expresso em uma célula (por exemplo, uma célula humana), por exemplo, logo que o anelossomo ou o elemento genético tenha sido introduzido na célula. Em modalidades, a introdução do anelossomo, ou elemento genético compreendido nele, em uma célula modula (por exemplo, aumenta ou diminui) o nível de uma molécula alvo (por exemplo, um ácido nucleico alvo, por exemplo, RNA ou um polipeptídeo alvo) na célula, por exemplo, por alteração do nível de expressão da molécula alvo pela célula. Em modalidades, a introdução do anelossomo, ou elemento genético compreendido nele, diminui o nível de interferon produzido pela célula. Em modalidades, a introdução do anelossomo, ou elemento genético compreendido nele, em uma célula modula (por exemplo, aumenta ou diminui) uma função da célula. Em modalidades, a introdução do anelossomo, ou elemento genético compreendido nele, em uma célula modula (por exemplo, aumenta ou diminui) a viabilidade da célula. Em modalidades, a introdução do anelossomo, ou elemento genético compreendido nele, em uma célula diminui a viabilidade de uma célula (por exemplo, uma célula cancerosa).
[001431] Em algumas modalidades, um anelossomo (por exemplo, um anelossomo sintético) descrito no presente documento induz uma prevalência de anticorpos de menos do que 70% (por exemplo, menos do que cerca de 60%, 50%, 40%, 30%, 20% ou 10% de prevalência de anticorpos). Em modalidades, a prevalência de anticorpos é determinada de acordo com métodos conhecidos na técnica. Em modalidades, a prevalência de anticorpos é determinada por detecção de anticorpos contra um Anellovirus (por exemplo, como descrito no presente documento) ou um anelossomo com base nele, em uma amostra biológica, por exemplo, de acordo com o método de detecção de anticorpos anti-TTV descrito em Tsuda et al. (1999; J. Virol. Methods 77: 199-206; incorporado no presente documento por referência) e/ou o método para determinação da seroprevalência de IgG anti-TTV descrito em Kakkola et al. (2008; Virology 382: 182-189; incorporado no presente documento por referência). Os anticorpos contra um Anellovirus ou um anelossomo com base neles podem ser também detectados por métodos na técnica para detecção de anticorpos antivirais, por exemplo, métodos para detecção de anticorpos anti-AAV, por exemplo, como descrito em Calcedo et al. (2013; Front. Immunol. 4(341): 1-7; incorporado no presente documento por referência).
[001432] Em algumas modalidades, um elemento genético deficiente em replicação, defeituoso em replicação ou incompetente em replicação não codifica toda a maquinaria ou componentes necessários requeridos para replicação do elemento genético. Em algumas modalidades, um elemento genético defeituoso em replicação não codifica um fator de replicação. Em algumas modalidades, um elemento genético defeituoso em replicação não codifica uma ou mais ORFs (por exemplo, ORF1, ORF1/1, ORF1/2, ORF2, ORF2/2, ORF2/3 e/ou ORF2t/3, por exemplo, como descrito no presente documento). Em algumas modalidades, a maquinaria ou componentes não codificados pelo elemento genético podem ser proporcionados em trans (por exemplo, usando um ajudante, por exemplo, um vírus ajudante ou plasmídeo ajudante, ou codificados em um ácido nucleico compreendido pela célula hospedeira, por exemplo, integrado no genoma da célula hospedeira), por exemplo, tal que o elemento genético possa sofrer replicação na presença da maquinaria ou componentes proporcionados em trans.
[001433] Em algumas modalidades, um elemento genético deficiente em empacotamento, defeituoso em empacotamento ou incompetente em empacotamento não pode ser empacotado em um exterior proteináceo (por exemplo, em que o exterior proteináceo compreende um capsídeo ou uma sua porção, por exemplo, compreendendo um polipeptídeo codificado por um ácido nucleico de ORF1, por exemplo, como descrito no presente documento). Em algumas modalidades, um elemento genético deficiente em empacotamento é empacotado em um exterior proteináceo a uma eficiência menor do que 10% (e.g., menor do que 10%, 9%, 8%, 7%, 6%, 5%, 4%, 3%, 2%, 1%, 0,5%, 0,1%, 0,01%, ou 0,001%) em comparação com um Anellovirus de tipo selvagem (por exemplo, como descrito no presente documento). Em algumas modalidades, o elemento genético defeituoso em empacotamento não pode ser empacotado em um exterior proteináceo mesmo na presença de fatores (por exemplo, ORF1, ORF1/1, ORF1/2, ORF2, ORF2/2, ORF2/3 ou ORF2t/3) que permitiria o empacotamento do elemento genético de um Anellovirus de tipo selvagem (por exemplo, como descrito no presente documento). Em algumas modalidades, um elemento genético deficiente em empacotamento é empacotado em um exterior proteináceo a uma eficiência menor do que 10% (por exemplo, menor do que 10%, 9%, 8%, 7%, 6%, 5%, 4%, 3%, 2%, 1%, 0,5%, 0,1%, 0,01%, ou 0,001%) em comparação com um Anellovirus de tipo selvagem (por exemplo, como descrito no presente documento), mesmo na presença de fatores (por exemplo, ORF1, ORF1/1, ORF1/2, ORF2, ORF2/2, ORF2/3 ou ORF2t/3) que permitiria o empacotamento do elemento genético de um Anellovirus de tipo selvagem (por exemplo, como descrito no presente documento).
[001434] Em algumas modalidades, um elemento genético competente em empacotamento pode ser empacotado em um exterior proteináceo (por exemplo, em que o exterior proteináceo compreende um capsídeo ou uma sua porção, por exemplo, compreendendo um polipeptídeo codificado por um ácido nucleico de ORF1, por exemplo, como descrito no presente documento). Em algumas modalidades, um elemento genético competente em empacotamento é empacotado em um exterior proteináceo a uma eficiência de pelo menos 20% (e.g., pelo menos 20%, 30%, 40%, 50%, 60%, 70%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, 100% ou mais elevada) em comparação com um
Anellovirus de tipo selvagem (por exemplo, como descrito no presente documento). Em algumas modalidades, o elemento genético competente em empacotamento pode ser empacotado em um exterior proteináceo na presença de fatores (por exemplo, ORF1, ORF1/1, ORF1/2, ORF2, ORF2/2, ORF2/3 ou ORF2t/3) que permitiria o empacotamento do elemento genético de um Anellovirus de tipo selvagem (por exemplo, como descrito no presente documento). Em algumas modalidades, um elemento genético competente em empacotamento é empacotado em um exterior proteináceo a uma eficiência de pelo menos 20% (por exemplo, pelo menos 20%, 30%, 40%, 50%, 60%, 70%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, 100% ou mais elevada) em comparação com um Anellovirus de tipo selvagem (por exemplo, como descrito no presente documento) na presença de fatores (por exemplo, ORF1, ORF1/1, ORF1/2, ORF2, ORF2/2, ORF2/3 ou ORF2t/3) que permitiria o empacotamento do elemento genético de um Anellovirus de tipo selvagem (por exemplo, como descrito no presente documento). Anelloviruses
[001435] Em algumas modalidades, um anelossomo, por exemplo, como descrito no presente documento, compreende sequências ou produtos de expressão derivados de um Anellovirus. Em algumas modalidades, um anelossomo inclui uma ou mais sequências ou produtos de expressão que são exógenos em relação ao Anellovirus. Em algumas modalidades, um anelossomo inclui uma ou mais sequências ou produtos de expressão que são endógenos em relação ao Anellovirus. Em algumas modalidades, um anelossomo inclui uma ou mais sequências ou produtos de expressão que são heterólogos em relação a uma ou mais outras sequências ou produtos de expressão no anelossomo. Os Anelloviruses têm geralmente genomas de DNA circular de fita simples com polaridade negativa. Os Anellovirus não foram geralmente ligados a qualquer doença humana. No entanto, as tentativas de ligar a infecção por Anellovirus com doença humana são confundidas pela elevada incidência de viremia assintomática por Anellovirus na(s) população(ões) de coorte de controle, pela notável diversidade genômica dentro da família viral de anelovírus, pela incapacidade histórica de propagar o agente in vitro e pela ausência de modelo(s) animal(ais) de doença por Anellovirus (Yzebe et al., Panminerva Med. (2002) 44: 167-177; Biagini, P., Vet.Microbiol. (2004) 98: 95-101).
[001436] Os Anellovirus são geralmente transmitidos por infecção oronasal ou fecal-oral, transmissão de mãe-para-filho e/ou in utero (Gerner et al., Ped.Infect.Dis. J. (2000) 19: 1074-1077). As pessoas infectadas podem, em alguns casos, ser caracterizadas por uma viremia de Anellovirus prolongada (meses a anos). Os humanos podem ser coinfectados com mais do que um genogrupo ou estirpe (Saback, et al., Scad.J. Infect.Dis. (2001) 33: 121-125). Existe uma sugestão de que estes genogrupos possam se recombinar dentro de humanos infectados (Rey et al., Infect. (2003) 31: 226-233). Os intermediários de isoforma (replicativos) de fita dupla foram encontrados em vários tecidos, tal como fígado, células monucleares do sangue periférico e medula óssea (Kikuchi et al., J. Med. Virol. (2000) 61: 165-170; Okamoto et al., Biochem. Biophys. Res. Commun. (2002) 270: 657-662; Rodriguez- lnigo et al., Am. J. Pathol. (2000) 156: 1227-1234).
[001437] Em algumas modalidades, o elemento genético compreende uma sequência de nucleotídeos codificando uma sequência de aminoácidos ou um seu fragmento funcional ou uma sequência possuindo pelo menos cerca de 60%, 70% 80%, 85%, 90% 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com qualquer uma das sequências de aminoácidos descritas no presente documento, por exemplo, uma sequência de aminoácidos de Anellovirus.
[001438] Em algumas modalidades, um anelossomo como descrito no presente documento compreende uma ou mais moléculas de ácido nucleico (por exemplo, um elemento genético como descrito no presente documento) compreendendo uma sequência possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com uma sequência de Anellovirus, por exemplo, como descrito no presente documento, ou um seu fragmento. Em modalidades, o anelossomo compreende uma sequência de ácidos nucleicos selecionado de uma sequência como mostrado em qualquer uma das Tabelas A1, A3, A5, A7, A9, A11, B1- B5, 1, 3, 5, 7, 9, 11, 13, 15, ou 17 ou uma sequência possuindo pelo menos 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a mesma. Em modalidades, o anelossomo compreende um polipeptídeo compreendendo uma sequência como mostrado em qualquer uma das Tabelas A2, A4, A6, A8, A10, A12, C1-C5, 2, 4, 6, 8, 10, 12, 14, 16, 18, 20-37, ou D1-D10 ou uma sequência possuindo pelo menos 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a mesma.
[001439] Em algumas modalidades, um anelossomo como descrito no presente documento compreende uma ou mais moléculas de ácido nucleico (por exemplo, um elemento genético como descrito no presente documento) compreendendo uma sequência possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com um ou mais de uma caixa TATA, local cap, elemento iniciador, local de início transcricional, domínio conservado 5´ UTR, ORF1, ORF1/1, ORF1/2, ORF2, ORF2/2, ORF2/3, ORF2t/3, região de três grelhas de leitura aberta, sinal de poli(A), região rica em GC, ou qualquer sua combinação, de qualquer um dos Anelloviruses descritos no presente documento (por exemplo, uma sequência de Anellovirus como anotada, ou como codificada por uma sequência listada, em qualquer uma das Tabelas A1-A12, B1-B5, C1-C5 ou 1-18). Em algumas modalidades, a molécula de ácido nucleico compreende uma sequência codificando uma proteína de capsídeo, por exemplo, uma sequência de ORF1, ORF1/1, ORF1/2, ORF2, ORF2/2, ORF2/3, ORF2t/3 de qualquer um dos Anelloviruses descritos no presente documento (por exemplo, uma sequência de Anellovirus como anotada, ou como codificada por uma sequência listada, em qualquer uma das Tabelas A1-A12 ou 1-18). Em modalidades, a molécula de ácido nucleico compreende uma sequência codificando uma proteína de capsídeo compreendendo uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com uma proteína ORF1 ou ORF2 de Anellovirus (por exemplo, uma sequência de aminoácidos de ORF1 ou ORF2 como mostrado em qualquer uma das Tabelas A2, A4, A6, A8, A10, A12, C1-C5, 2, 4, 6, 8, 10, 12, 14, 16, 18, 20-37, ou D1-D10 ou uma sequência de aminoácidos de ORF1 ou ORF2 codificada por uma sequência de ácidos nucleicos como mostrado em qualquer uma das Tabelas A1, A3, A5, A7, A9, A11, B1-B5, 1, 3, 5, 7, 9, 11, 13, 15, ou 17). Em modalidades, a molécula de ácido nucleico compreende uma sequência codificando uma proteína de capsídeo compreendendo uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com uma proteína ORF1 de Anellovirus (por exemplo, uma sequência de aminoácidos de ORF1 como mostrado em qualquer uma das Tabelas A2, A4, A6, A8, A10, A12, C1-C5, 2, 4, 6, 8, 10, 12, 14, 16, 18, 20-37, ou D1-D10 ou uma sequência de aminoácidos de ORF1 codificada por uma sequência de ácidos nucleicos como mostrado em qualquer uma das Tabelas A1, A3, A5, A7, A9, A11, B1-B5, 1, 3, 5, 7, 9, 11, 13, 15, ou 17).
[001440] Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de nucleotídeos de ORF1 de Anellovirus da Tabela A1 (por exemplo, nucleotídeos 574 – 2775 da sequência de ácidos nucleicos da Tabela A1). Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de nucleotídeos de ORF1/1 de Anellovirus da Tabela A1 (por exemplo, nucleotídeos 574 – 699 e/ou 2326 – 2775 da sequência de ácidos nucleicos da Tabela A1). Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de nucleotídeos de ORF1/2 de Anellovirus da Tabela A1 (por exemplo, nucleotídeos 574 – 699 e/ou 2552 – 2759 da sequência de ácidos nucleicos da Tabela A1). Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de nucleotídeos de ORF2 de Anellovirus da Tabela A1 (por exemplo, nucleotídeos 335 – 703 da sequência de ácidos nucleicos da Tabela A1). Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de nucleotídeos de ORF2/2 de Anellovirus da Tabela A1 (por exemplo, nucleotídeos 335 – 699 e/ou 2326 – 2759 da sequência de ácidos nucleicos da Tabela A1). Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100%de identidade de sequências com a sequência de nucleotídeos de ORF2/3 de Anellovirus da Tabela A1 (por exemplo, nucleotídeos 335 – 699 e/ou 2552 – 2957 da sequência de ácidos nucleicos da Tabela A1). Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de nucleotídeos de ORF2t/3 de Anellovirus da Tabela A1 (por exemplo, nucleotídeos 335 – 465 e/ou 2552 – 2957 da sequência de ácidos nucleicos da Tabela A1). Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de nucleotídeos da caixa TATA de Anellovirus da Tabela A1 (por exemplo, nucleotídeos 77 – 81 da sequência de ácidos nucleicos da Tabela A1). Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de nucleotídeos do elemento iniciador de Anellovirus da Tabela A1 (por exemplo, nucleotídeos 95 – 110 da sequência de ácidos nucleicos da Tabela A1). Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de nucleotídeos do local de início transcricional de Anellovirus da Tabela A1 (por exemplo, nucleotídeo 105 da sequência de ácidos nucleicos da Tabela A1). Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos possuindo pelo menos cerca de 70%, 75%, 80%,
85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de nucleotídeos do domínio conservado de 5´ UTR de Anellovirus da Tabela A1 (por exemplo, nucleotídeos 165 – 235 da sequência de ácidos nucleicos da Tabela A1). Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de nucleotídeos da região de três grelhas de leitura aberta de Anellovirus da Tabela A1 (por exemplo, nucleotídeos 2535 – 2746 da sequência de ácidos nucleicos da Tabela A1). Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de nucleotídeos do sinal de poli(A) de Anellovirus da Tabela A1 (por exemplo, nucleotídeos 2953 – 2958 da sequência de ácidos nucleicos da Tabela A1). Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de nucleotídeos rica em GC de Anellovirus da Tabela A1 (por exemplo, nucleotídeos 3620 – 3648 da sequência de ácidos nucleicos da Tabela A1).
[001441] Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de nucleotídeos de ORF1 de Anellovirus da Tabela A3 (por exemplo, nucleotídeos 599 – 2887 da sequência de ácidos nucleicos da Tabela A3). Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%,
95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de nucleotídeos de ORF1/1 de Anellovirus da Tabela A3 (por exemplo, nucleotídeos 599 – 724 e/ou 2414 – 2887 da sequência de ácidos nucleicos da Tabela A3). Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de nucleotídeos de ORF1/2 de Anellovirus da Tabela A3 (por exemplo, nucleotídeos 599 – 724 e/ou 2643 – 2849 da sequência de ácidos nucleicos da Tabela A3). Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de nucleotídeos de ORF2 de Anellovirus da Tabela A3 (por exemplo, nucleotídeos 342 – 728 da sequência de ácidos nucleicos da Tabela A3). Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de nucleotídeos de ORF2/2 de Anellovirus da Tabela A3 (por exemplo, nucleotídeos 342 – 724 e/ou 2414 – 2849 da sequência de ácidos nucleicos da Tabela A3). Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de nucleotídeos de ORF2/3 de Anellovirus da Tabela A3 (por exemplo, nucleotídeos 342 – 724 e/ou 2643 – 3057 da sequência de ácidos nucleicos da Tabela A3). Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de nucleotídeos da caixa TATA de Anellovirus da Tabela A3 (por exemplo, nucleotídeos 87 – 91 da sequência de ácidos nucleicos da Tabela A3). Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de nucleotídeos do elemento iniciador de Anellovirus da Tabela A3 (por exemplo, nucleotídeos 105 – 120 da sequência de ácidos nucleicos da Tabela A3). Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de nucleotídeos do local de início transcricional de Anellovirus da Tabela A3 (por exemplo, nucleotídeo 115 da sequência de ácidos nucleicos da Tabela A3). Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de nucleotídeos do domínio conservado de 5´ UTR de Anellovirus da Tabela A3 (por exemplo, nucleotídeos 175 – 245 da sequência de ácidos nucleicos da Tabela A3). Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de nucleotídeos da região de grelha de leitura aberta três de Anellovirus da Tabela A3 (por exemplo, nucleotídeos 2626 – 2846 da sequência de ácidos nucleicos da Tabela A3). Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de nucleotídeos do sinal de poli(A) de Anellovirus da Tabela A3 (por exemplo, nucleotídeos 3052 – 3058 da sequência de ácidos nucleicos da Tabela A3).
[001442] Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de nucleotídeos de ORF1 de Anellovirus da Tabela A5 (por exemplo, nucleotídeos 556 – 2904 da sequência de ácidos nucleicos da Tabela A5). Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de nucleotídeos de ORF1/1 de Anellovirus da Tabela A5 (por exemplo, nucleotídeos 556 – 687 e/ou 2422 – 2904 da sequência de ácidos nucleicos da Tabela A5). Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de nucleotídeos de ORF1/2 de Anellovirus da Tabela A5 (por exemplo, nucleotídeos 556 – 687 e/ou 2564 – 2878 da sequência de ácidos nucleicos da Tabela A5). Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de nucleotídeos de ORF2 de Anellovirus da Tabela A5 (por exemplo, nucleotídeos 305 – 691 da sequência de ácidos nucleicos da Tabela A5). Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de nucleotídeos de ORF2/2 de Anellovirus da Tabela A5 (por exemplo, nucleotídeos 305 – 687 e/ou
2422 – 2878 da sequência de ácidos nucleicos da Tabela A5). Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de nucleotídeos de ORF2/3 de Anellovirus da Tabela A5 (por exemplo, nucleotídeos 305 – 687 e/ou 2564 – 3317 da sequência de ácidos nucleicos da Tabela A5). Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de nucleotídeos de ORF2t/3 de Anellovirus da Tabela A5 (por exemplo, nucleotídeos 305 – 360 e/ou 2564 – 3317 da sequência de ácidos nucleicos da Tabela A5). Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de nucleotídeos da caixa TATA de Anellovirus da Tabela A5 (por exemplo, nucleotídeos 50 – 55 da sequência de ácidos nucleicos da Tabela A5). Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de nucleotídeos do elemento iniciador de Anellovirus da Tabela A5 (por exemplo, nucleotídeos 68 – 83 da sequência de ácidos nucleicos da Tabela A5). Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de nucleotídeos do local de início transcricional de Anellovirus da Tabela A5 (por exemplo, nucleotídeo 78 da sequência de ácidos nucleicos da Tabela A5). Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de nucleotídeos do domínio conservado de 5´ UTR de Anellovirus da Tabela A5 (por exemplo, nucleotídeos 138 – 208 da sequência de ácidos nucleicos da Tabela A5). Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de nucleotídeos da região de grelha de leitura aberta três de Anellovirus da Tabela A5 (por exemplo, nucleotídeos 2626 – 2846 da sequência de ácidos nucleicos da Tabela A5). Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de nucleotídeos do sinal de poli(A) de Anellovirus da Tabela A5 (por exemplo, nucleotídeos 3316 – 3319 da sequência de ácidos nucleicos da Tabela A5).
[001443] Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de nucleotídeos de ORF1 de Anellovirus da Tabela A7 (por exemplo, nucleotídeos 589 – 2889 da sequência de ácidos nucleicos da Tabela A7). Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de nucleotídeos de ORF1/1 de Anellovirus da Tabela A7 (por exemplo, nucleotídeos 589 – 711 e/ou 2362 – 2889 da sequência de ácidos nucleicos da Tabela A7). Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de nucleotídeos de ORF1/2 de Anellovirus da Tabela A7 (por exemplo, nucleotídeos 589 – 711 e/ou 2555 – 2863 da sequência de ácidos nucleicos da Tabela A7). Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de nucleotídeos de ORF2 de Anellovirus da Tabela A7 (por exemplo, nucleotídeos 353 – 715 da sequência de ácidos nucleicos da Tabela A7). Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de nucleotídeos de ORF2/2 de Anellovirus da Tabela A7 (por exemplo, nucleotídeos 353 – 711 e/ou 2362 – 2863 da sequência de ácidos nucleicos da Tabela A7). Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de nucleotídeos de ORF2/3 de Anellovirus da Tabela A7 (por exemplo, nucleotídeos 353 – 711 e/ou 2555 – 3065 da sequência de ácidos nucleicos da Tabela A7). Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de nucleotídeos de ORF2t/3 de Anellovirus da Tabela A7 (por exemplo, nucleotídeos 353 – 432 e/ou 2555 – 3065 da sequência de ácidos nucleicos da Tabela A7). Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de nucleotídeos da caixa TATA de Anellovirus da Tabela A7 (por exemplo, nucleotídeos 86 – 90 da sequência de ácidos nucleicos da Tabela A7). Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de nucleotídeos do elemento iniciador de Anellovirus da Tabela A7 (por exemplo, nucleotídeos 104 – 119 da sequência de ácidos nucleicos da Tabela A7). Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de nucleotídeos do local de início transcricional de Anellovirus da Tabela A7 (por exemplo, nucleotídeo 114 da sequência de ácidos nucleicos da Tabela A7). Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de nucleotídeos do domínio conservado de 5´ UTR de Anellovirus da Tabela A7 (por exemplo, nucleotídeos 174 – 244 da sequência de ácidos nucleicos da Tabela A7). Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de nucleotídeos da região de grelha de leitura aberta três de Anellovirus da Tabela A7 (por exemplo, nucleotídeos 2555 – 2863 da sequência de ácidos nucleicos da Tabela A7). Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos possuindo pelo menos cerca de 70%,
75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de nucleotídeos do sinal de poli(A) de Anellovirus da Tabela A7 (por exemplo, nucleotídeos 3062 – 3066 da sequência de ácidos nucleicos da Tabela A7). Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de nucleotídeos rica em GC de Anellovirus da Tabela A7 (por exemplo, nucleotídeos 3720 – 3742 da sequência de ácidos nucleicos da Tabela A7).
[001444] Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de nucleotídeos de ORF1 de Anellovirus da Tabela A9 (por exemplo, nucleotídeos 511 – 2793 da sequência de ácidos nucleicos da Tabela A9). Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de nucleotídeos de ORF1/1 de Anellovirus da Tabela A9 (por exemplo, nucleotídeos 511 – 711 e/ou 2326 – 2793 da sequência de ácidos nucleicos da Tabela A9). Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de nucleotídeos de ORF1/2 de Anellovirus da Tabela A9 (por exemplo, nucleotídeos 511 – 711 e/ou 2525 – 2767 da sequência de ácidos nucleicos da Tabela A9). Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%,
99%, ou 100% de identidade de sequências com a sequência de nucleotídeos de ORF2 de Anellovirus da Tabela A9 (por exemplo, nucleotídeos 272 – 637 da sequência de ácidos nucleicos da Tabela A9). Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de nucleotídeos de ORF2/2 de Anellovirus da Tabela A9 (por exemplo, nucleotídeos 272 – 633 e/ou 2326 – 2767 da sequência de ácidos nucleicos da Tabela A9). Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de nucleotídeos de ORF2/3 de Anellovirus da Tabela A9 (por exemplo, nucleotídeos 272 – 633 e/ou 2525 – 2984 da sequência de ácidos nucleicos da Tabela A9). Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de nucleotídeos de ORF2t/3 de Anellovirus da Tabela A9 (por exemplo, nucleotídeos 272 – 633 e/ou 2525 – 2984 da sequência de ácidos nucleicos da Tabela A9). Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de nucleotídeos da caixa TATA de Anellovirus da Tabela A9 (por exemplo, nucleotídeos 12 – 17 da sequência de ácidos nucleicos da Tabela A9). Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de nucleotídeos do elemento iniciador de Anellovirus da Tabela A9 (por exemplo, nucleotídeos 30 – 45 da sequência de ácidos nucleicos da Tabela A9). Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de nucleotídeos do local de início transcricional de Anellovirus da Tabela A9 (por exemplo, nucleotídeo 40 da sequência de ácidos nucleicos da Tabela A9). Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de nucleotídeos do domínio conservado de 5´ UTR de Anellovirus da Tabela A9 (por exemplo, nucleotídeos 100 – 171 da sequência de ácidos nucleicos da Tabela A9). Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de nucleotídeos da região de grelha de leitura aberta três de Anellovirus da Tabela A9 (por exemplo, nucleotídeos 2525 – 2767 da sequência de ácidos nucleicos da Tabela A9). Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de nucleotídeos do sinal de poli(A) de Anellovirus da Tabela A9 (por exemplo, nucleotídeos 2981 – 2985 da sequência de ácidos nucleicos da Tabela A9).
[001445] Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de nucleotídeos de ORF1 de Anellovirus da Tabela A11 (por exemplo, nucleotídeos 704 – 3001 da sequência de ácidos nucleicos da Tabela A11). Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de nucleotídeos de ORF1/1 de Anellovirus da Tabela A11 (por exemplo, nucleotídeos 704 – 826 e/ou 2534 – 3001 da sequência de ácidos nucleicos da Tabela A11). Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de nucleotídeos de ORF1/2 de Anellovirus da Tabela A11 (por exemplo, nucleotídeos 704 – 826 e/ou 2721 – 2975 da sequência de ácidos nucleicos da Tabela A11). Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de nucleotídeos de ORF2 de Anellovirus da Tabela A11 (por exemplo, nucleotídeos 465 – 830 da sequência de ácidos nucleicos da Tabela A11). Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de nucleotídeos de ORF2/2 de Anellovirus da Tabela A11 (por exemplo, nucleotídeos 465 – 826 e/ou 2534 – 2975 da sequência de ácidos nucleicos da Tabela A11). Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de nucleotídeos de ORF2/3 de Anellovirus da Tabela A11 (por exemplo, nucleotídeos 465 – 826 e/ou
2721 – 3192 da sequência de ácidos nucleicos da Tabela A11). Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de nucleotídeos de ORF2t/3 de Anellovirus da Tabela A11 (por exemplo, nucleotídeos 465 – 595 e/ou 2721 – 3192 da sequência de ácidos nucleicos da Tabela A11). Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de nucleotídeos da caixa TATA de Anellovirus da Tabela A11 (por exemplo, nucleotídeos 206 – 210 da sequência de ácidos nucleicos da Tabela A11). Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de nucleotídeos do elemento iniciador de Anellovirus da Tabela A11 (por exemplo, nucleotídeos 224 – 239 da sequência de ácidos nucleicos da Tabela A11). Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de nucleotídeos do local de início transcricional de Anellovirus da Tabela A11 (por exemplo, nucleotídeo 234 da sequência de ácidos nucleicos da Tabela A11). Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de nucleotídeos do domínio conservado de 5´ UTR de Anellovirus da Tabela A11 (por exemplo, nucleotídeos 294 – 364 da sequência de ácidos nucleicos da Tabela
A11). Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de nucleotídeos da região de grelha de leitura aberta três de Anellovirus da Tabela A11 (por exemplo, nucleotídeos 2721 – 2975 da sequência de ácidos nucleicos da Tabela A11). Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de nucleotídeos do sinal de poli(A) de Anellovirus da Tabela A11 (por exemplo, nucleotídeos 3189 – 3193 da sequência de ácidos nucleicos da Tabela A11). Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de nucleotídeos rica em GC de Anellovirus da Tabela A11 (por exemplo, nucleotídeos 3844 – 3895 da sequência de ácidos nucleicos da Tabela A11).
[001446] Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de nucleotídeos de ORF1 de Anellovirus da Tabela B1 (por exemplo, nucleotídeos 574 – 2775 da sequência de ácidos nucleicos da Tabela B1). Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de nucleotídeos de ORF1/1 de Anellovirus da Tabela B1 (por exemplo, nucleotídeos 574 – 699 e/ou 2326 – 2775 da sequência de ácidos nucleicos da Tabela B1). Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de nucleotídeos de ORF1/2 de Anellovirus da Tabela B1 (por exemplo, nucleotídeos 574 – 699 e/ou 2552 – 2759 da sequência de ácidos nucleicos da Tabela B1). Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de nucleotídeos de ORF2 de Anellovirus da Tabela B1 (por exemplo, nucleotídeos 335 – 703 da sequência de ácidos nucleicos da Tabela B1). Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de nucleotídeos de ORF2/2 de Anellovirus da Tabela B1 (por exemplo, nucleotídeos 335 – 699 e/ou 2326 – 2759 da sequência de ácidos nucleicos da Tabela B1). Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de nucleotídeos de ORF2/3 de Anellovirus da Tabela B1 (por exemplo, nucleotídeos 335 – 699 e/ou 2552 – 2957 da sequência de ácidos nucleicos da Tabela B1). Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de nucleotídeos de ORF2t/3 de Anellovirus da Tabela B1 (por exemplo, nucleotídeos 335 – 465 e/ou 2552 – 2957 da sequência de ácidos nucleicos da Tabela B1). Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de nucleotídeos da caixa TATA de Anellovirus da Tabela B1 (por exemplo, nucleotídeos 77 – 81 da sequência de ácidos nucleicos da Tabela B1). Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de nucleotídeos do elemento iniciador de Anellovirus da Tabela B1 (por exemplo, nucleotídeos 95 – 110 da sequência de ácidos nucleicos da Tabela B1). Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de nucleotídeos do local de início transcricional de Anellovirus da Tabela B1 (por exemplo, nucleotídeo 105 da sequência de ácidos nucleicos da Tabela B1). Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de nucleotídeos do domínio conservado de 5´ UTR de Anellovirus da Tabela B1 (por exemplo, nucleotídeos 165 – 235 da sequência de ácidos nucleicos da Tabela B1). Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de nucleotídeos da região de grelha de leitura aberta três de Anellovirus da Tabela B1 (por exemplo, nucleotídeos 2535 – 2746 da sequência de ácidos nucleicos da Tabela B1). Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos possuindo pelo menos cerca de 70%,
75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de nucleotídeos do sinal de poli(A) de Anellovirus da Tabela B1 (por exemplo, nucleotídeos 2953 – 2958 da sequência de ácidos nucleicos da Tabela B1). Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de nucleotídeos rica em GC de Anellovirus da Tabela B1 (por exemplo, nucleotídeos 3620 – 3648 da sequência de ácidos nucleicos da Tabela B1).
[001447] Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de nucleotídeos de ORF1 de Anellovirus da Tabela B2 (por exemplo, nucleotídeos 574 – 2775 da sequência de ácidos nucleicos da Tabela B2). Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de nucleotídeos de ORF1/1 de Anellovirus da Tabela B2 (por exemplo, nucleotídeos 574 – 699 e/ou 2326 – 2775 da sequência de ácidos nucleicos da Tabela B2). Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de nucleotídeos de ORF1/2 de Anellovirus da Tabela B2 (por exemplo, nucleotídeos 574 – 699 e/ou 2552 – 2759 da sequência de ácidos nucleicos da Tabela B2). Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%,
99%, ou 100% de identidade de sequências com a sequência de nucleotídeos de ORF2 de Anellovirus da Tabela B2 (por exemplo, nucleotídeos 335 – 703 da sequência de ácidos nucleicos da Tabela B2). Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de nucleotídeos de ORF2/2 de Anellovirus da Tabela B2 (por exemplo, nucleotídeos 335 – 699 e/ou 2326 – 2759 da sequência de ácidos nucleicos da Tabela B2). Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de nucleotídeos de ORF2/3 de Anellovirus da Tabela B2 (por exemplo, nucleotídeos 335 – 699 e/ou 2552 – 2957 da sequência de ácidos nucleicos da Tabela B2). Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de nucleotídeos de ORF2t/3 de Anellovirus da Tabela B2 (por exemplo, nucleotídeos 335 – 465 e/ou 2552 – 2957 da sequência de ácidos nucleicos da Tabela B2). Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de nucleotídeos da caixa TATA de Anellovirus da Tabela B2 (por exemplo, nucleotídeos 77 – 81 da sequência de ácidos nucleicos da Tabela B2). Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de nucleotídeos do elemento iniciador de Anellovirus da Tabela B2 (por exemplo, nucleotídeos 95 – 110 da sequência de ácidos nucleicos da Tabela B2). Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de nucleotídeos do local de início transcricional de Anellovirus da Tabela B2 (por exemplo, nucleotídeo 105 da sequência de ácidos nucleicos da Tabela B2). Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de nucleotídeos do domínio conservado de 5´ UTR de Anellovirus da Tabela B2 (por exemplo, nucleotídeos 165 – 235 da sequência de ácidos nucleicos da Tabela B2). Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de nucleotídeos da região de grelha de leitura aberta três de Anellovirus da Tabela B2 (por exemplo, nucleotídeos 2535 – 2746 da sequência de ácidos nucleicos da Tabela B2). Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de nucleotídeos do sinal de poli(A) de Anellovirus da Tabela B2 (por exemplo, nucleotídeos 2953 – 2958 da sequência de ácidos nucleicos da Tabela B2). Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de nucleotídeos rica em GC de Anellovirus da Tabela B2
(por exemplo, nucleotídeos 3620 – 3648 da sequência de ácidos nucleicos da Tabela B2).
[001448] Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de nucleotídeos de ORF1 de Anellovirus da Tabela B3 (por exemplo, nucleotídeos 574 – 2775 da sequência de ácidos nucleicos da Tabela B3). Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de nucleotídeos de ORF1/1 de Anellovirus da Tabela B3 (por exemplo, nucleotídeos 574 – 699 e/ou 2326 – 2775 da sequência de ácidos nucleicos da Tabela B3). Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de nucleotídeos de ORF1/2 de Anellovirus da Tabela B3 (por exemplo, nucleotídeos 574 – 699 e/ou 2552 – 2759 da sequência de ácidos nucleicos da Tabela B3). Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de nucleotídeos de ORF2 de Anellovirus da Tabela B3 (por exemplo, nucleotídeos 335 – 703 da sequência de ácidos nucleicos da Tabela B3). Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de nucleotídeos de ORF2/2 de Anellovirus da Tabela B3 (por exemplo, nucleotídeos 335 – 699 e/ou
2326 – 2759 da sequência de ácidos nucleicos da Tabela B3). Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de nucleotídeos de ORF2/3 de Anellovirus da Tabela B3 (por exemplo, nucleotídeos 335 – 699 e/ou 2552 – 2957 da sequência de ácidos nucleicos da Tabela B3). Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de nucleotídeos de ORF2t/3 de Anellovirus da Tabela B3 (por exemplo, nucleotídeos 335 – 465 e/ou 2552 – 2957 da sequência de ácidos nucleicos da Tabela B3). Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de nucleotídeos da caixa TATA de Anellovirus da Tabela B3 (por exemplo, nucleotídeos 77 – 81 da sequência de ácidos nucleicos da Tabela B3). Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de nucleotídeos do elemento iniciador de Anellovirus da Tabela B3 (por exemplo, nucleotídeos 95 – 110 da sequência de ácidos nucleicos da Tabela B3). Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de nucleotídeos do local de início transcricional de Anellovirus da Tabela B3 (por exemplo, nucleotídeo 105 da sequência de ácidos nucleicos da Tabela B3). Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de nucleotídeos do domínio conservado de 5´ UTR de Anellovirus da Tabela B3 (por exemplo, nucleotídeos 165 – 235 da sequência de ácidos nucleicos da Tabela B3). Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de nucleotídeos da região de grelha de leitura aberta três de Anellovirus da Tabela B3 (por exemplo, nucleotídeos 2535 – 2746 da sequência de ácidos nucleicos da Tabela B3). Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de nucleotídeos do sinal de poli(A) de Anellovirus da Tabela B3 (por exemplo, nucleotídeos 2953 – 2958 da sequência de ácidos nucleicos da Tabela B3). Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de nucleotídeos rica em GC de Anellovirus da Tabela B3 (por exemplo, nucleotídeos 3620 – 3648 da sequência de ácidos nucleicos da Tabela B3).
[001449] Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de nucleotídeos de ORF1 de Anellovirus da Tabela B4 (por exemplo, nucleotídeos 574 – 2775 da sequência de ácidos nucleicos da Tabela B4). Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de nucleotídeos de ORF1/1 de Anellovirus da Tabela B4 (por exemplo, nucleotídeos 574 – 699 e/ou 2326 – 2775 da sequência de ácidos nucleicos da Tabela B4). Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de nucleotídeos de ORF1/2 de Anellovirus da Tabela B4 (por exemplo, nucleotídeos 574 – 699 e/ou 2552 – 2759 da sequência de ácidos nucleicos da Tabela B4). Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de nucleotídeos de ORF2 de Anellovirus da Tabela B4 (por exemplo, nucleotídeos 335 – 703 da sequência de ácidos nucleicos da Tabela B4). Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de nucleotídeos de ORF2/2 de Anellovirus da Tabela B4 (por exemplo, nucleotídeos 335 – 699 e/ou 2326 – 2759 da sequência de ácidos nucleicos da Tabela B4). Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de nucleotídeos de ORF2/3 de Anellovirus da Tabela B4 (por exemplo, nucleotídeos 335 – 699 e/ou 2552 – 2957 da sequência de ácidos nucleicos da Tabela B4). Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de nucleotídeos de ORF2t/3 de Anellovirus da Tabela B4 (por exemplo, nucleotídeos 335 – 465 e/ou 2552 – 2957 da sequência de ácidos nucleicos da Tabela B4). Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de nucleotídeos da caixa TATA de Anellovirus da Tabela B4 (por exemplo, nucleotídeos 77 – 81 da sequência de ácidos nucleicos da Tabela B4). Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de nucleotídeos do elemento iniciador de Anellovirus da Tabela B4 (por exemplo, nucleotídeos 95 – 110 da sequência de ácidos nucleicos da Tabela B4). Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de nucleotídeos do local de início transcricional de Anellovirus da Tabela B4 (por exemplo, nucleotídeo 105 da sequência de ácidos nucleicos da Tabela B4). Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de nucleotídeos do domínio conservado de 5´ UTR de Anellovirus da Tabela B4 (por exemplo, nucleotídeos 165 – 235 da sequência de ácidos nucleicos da Tabela B4). Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos possuindo pelo menos cerca de 70%, 75%, 80%,
85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de nucleotídeos da região de grelha de leitura aberta três de Anellovirus da Tabela B4 (por exemplo, nucleotídeos 2535 – 2746 da sequência de ácidos nucleicos da Tabela B4). Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de nucleotídeos do sinal de poli(A) de Anellovirus da Tabela B4 (por exemplo, nucleotídeos 2953 – 2958 da sequência de ácidos nucleicos da Tabela B4). Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de nucleotídeos rica em GC de Anellovirus da Tabela B4 (por exemplo, nucleotídeos 3620 – 3648 da sequência de ácidos nucleicos da Tabela B4).
[001450] Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de nucleotídeos de ORF1 de Anellovirus da Tabela B5 (por exemplo, nucleotídeos 574 – 2775 da sequência de ácidos nucleicos da Tabela B5). Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de nucleotídeos de ORF1/1 de Anellovirus da Tabela B5 (por exemplo, nucleotídeos 574 – 699 e/ou 2326 – 2775 da sequência de ácidos nucleicos da Tabela B5). Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%,
97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de nucleotídeos de ORF1/2 de Anellovirus da Tabela B5 (por exemplo, nucleotídeos 574 – 699 e/ou 2552 – 2759 da sequência de ácidos nucleicos da Tabela B5). Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de nucleotídeos de ORF2 de Anellovirus da Tabela B5 (por exemplo, nucleotídeos 335 – 703 da sequência de ácidos nucleicos da Tabela B5). Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de nucleotídeos de ORF2/2 de Anellovirus da Tabela B5 (por exemplo, nucleotídeos 335 – 699 e/ou 2326 – 2759 da sequência de ácidos nucleicos da Tabela B5). Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de nucleotídeos de ORF2/3 de Anellovirus da Tabela B5 (por exemplo, nucleotídeos 335 – 699 e/ou 2552 – 2957 da sequência de ácidos nucleicos da Tabela B5). Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de nucleotídeos de ORF2t/3 de Anellovirus da Tabela B5 (por exemplo, nucleotídeos 335 – 465 e/ou 2552 – 2957 da sequência de ácidos nucleicos da Tabela B5). Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de nucleotídeos da caixa TATA de Anellovirus da Tabela B5 (por exemplo, nucleotídeos 77 – 81 da sequência de ácidos nucleicos da Tabela B5). Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de nucleotídeos do elemento iniciador de Anellovirus da Tabela B5 (por exemplo, nucleotídeos 95 – 110 da sequência de ácidos nucleicos da Tabela B5). Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de nucleotídeos do local de início transcricional de Anellovirus da Tabela B5 (por exemplo, nucleotídeo 105 da sequência de ácidos nucleicos da Tabela B5). Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de nucleotídeos do domínio conservado de 5´ UTR de Anellovirus da Tabela B5 (por exemplo, nucleotídeos 165 – 235 da sequência de ácidos nucleicos da Tabela B5). Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de nucleotídeos da região de grelha de leitura aberta três de Anellovirus da Tabela B5 (por exemplo, nucleotídeos 2535 – 2746 da sequência de ácidos nucleicos da Tabela B5). Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de nucleotídeos do sinal de poli(A) de Anellovirus da Tabela B5 (por exemplo, nucleotídeos 2953 – 2958 da sequência de ácidos nucleicos da Tabela B5). Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de nucleotídeos rica em GC de Anellovirus da Tabela B5 (por exemplo, nucleotídeos 3620 – 3648 da sequência de ácidos nucleicos da Tabela B5).
[001451] Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de nucleotídeos de ORF1 de Anellovirus da Tabela 1 (por exemplo, nucleotídeos 571 – 2613 da sequência de ácidos nucleicos da Tabela 1). Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de nucleotídeos de ORF1/1 de Anellovirus da Tabela 1 (por exemplo, nucleotídeos 571 – 587 e/ou 2137 – 2613 da sequência de ácidos nucleicos da Tabela 1). Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de nucleotídeos de ORF1/2 de Anellovirus da Tabela 1 (por exemplo, nucleotídeos 571 – 687 e/ou 2339 – 2659 da sequência de ácidos nucleicos da Tabela 1). Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de nucleotídeos de ORF2 de Anellovirus da Tabela 1 (por exemplo, nucleotídeos 299 –
691 da sequência de ácidos nucleicos da Tabela 1). Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de nucleotídeos de ORF2/2 de Anellovirus da Tabela 1 (por exemplo, nucleotídeos 299 – 687 e/ou 2137 – 2659 da sequência de ácidos nucleicos da Tabela 1). Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de nucleotídeos de ORF2/3 de Anellovirus da Tabela 1 (por exemplo, nucleotídeos 299 – 687 e/ou 2339 – 2831 da sequência de ácidos nucleicos da Tabela 1). Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de nucleotídeos de ORF2t/3 de Anellovirus da Tabela 1 (por exemplo, nucleotídeos 299 – 348 e/ou 2339 – 2831 da sequência de ácidos nucleicos da Tabela 1). Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de nucleotídeos da caixa TATA de Anellovirus da Tabela 1 (por exemplo, nucleotídeos 84 – 90 da sequência de ácidos nucleicos da Tabela 1). Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de nucleotídeos do local Cap de Anellovirus da Tabela 1 (por exemplo, nucleotídeos 107 – 114 da sequência de ácidos nucleicos da Tabela 1). Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de nucleotídeos do local de início transcricional de Anellovirus da Tabela 1 (por exemplo, nucleotídeo 114 da sequência de ácidos nucleicos da Tabela 1). Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de nucleotídeos do domínio conservado de 5´ UTR de Anellovirus da Tabela 1 (por exemplo, nucleotídeos 177 – 247 da sequência de ácidos nucleicos da Tabela 1). Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de nucleotídeos da região de três grelhas de leitura aberta de Anellovirus da Tabela 1 (por exemplo, nucleotídeos 2325 – 2610 da sequência de ácidos nucleicos da Tabela 1). Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de nucleotídeos do sinal de poli(A) de Anellovirus da Tabela 1 (por exemplo, nucleotídeos 2813 – 2818 da sequência de ácidos nucleicos da Tabela 1). Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de nucleotídeos rica em GC de Anellovirus da Tabela 1 (por exemplo, nucleotídeos 3415 – 3570 da sequência de ácidos nucleicos da Tabela 1).
[001452] Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos possuindo pelo menos cerca de
70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de nucleotídeos de ORF1 de Anellovirus da Tabela 3 (por exemplo, nucleotídeos 729 – 2972 da sequência de ácidos nucleicos da Tabela 3). Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de nucleotídeos de ORF1/1 de Anellovirus da Tabela 3 (por exemplo, nucleotídeos 729 – 908 e/ou 2490 – 2972 da sequência de ácidos nucleicos da Tabela 3). Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de nucleotídeos de ORF1/2 de Anellovirus da Tabela 3 (por exemplo, nucleotídeos 729 – 908 e/ou 2725 – 3039 da sequência de ácidos nucleicos da Tabela 3). Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de nucleotídeos de ORF2 de Anellovirus da Tabela 3 (por exemplo, nucleotídeos 412 – 912 da sequência de ácidos nucleicos da Tabela 3). Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de nucleotídeos de ORF2/2 de Anellovirus da Tabela 3 (por exemplo, nucleotídeos 412 – 908 e/ou 2490 – 3039 da sequência de ácidos nucleicos da Tabela 3). Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de nucleotídeos de ORF2/3 de Anellovirus da Tabela 3 (por exemplo, nucleotídeos 412 – 908 e/ou 2725 – 3208 da sequência de ácidos nucleicos da Tabela 3). Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de nucleotídeos da caixa TATA de Anellovirus da Tabela 3 (por exemplo, nucleotídeos 112 – 119 da sequência de ácidos nucleicos da Tabela 3). Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de nucleotídeos do elemento iniciador de Anellovirus da Tabela 3 (por exemplo, nucleotídeos 128 – 148 da sequência de ácidos nucleicos da Tabela 3). Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de nucleotídeos do local de início transcricional de Anellovirus da Tabela 3 (por exemplo, nucleotídeo 148 da sequência de ácidos nucleicos da Tabela 3). Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de nucleotídeos do domínio conservado de 5´ UTR de Anellovirus da Tabela 3 (por exemplo, nucleotídeos 204 – 273 da sequência de ácidos nucleicos da Tabela 3). Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de nucleotídeos da região de três grelhas de leitura aberta de Anellovirus da Tabela 3
(por exemplo, nucleotídeos 2699 – 2969 da sequência de ácidos nucleicos da Tabela 3). Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100%de identidade de sequências com a sequência de nucleotídeos do sinal de poli(A) de Anellovirus da Tabela 3 (por exemplo, nucleotídeos 3220 – 3225 da sequência de ácidos nucleicos da Tabela 3). Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de nucleotídeos rica em GC de Anellovirus da Tabela 3 (por exemplo, nucleotídeos 3302 – 3541 da sequência de ácidos nucleicos da Tabela 3).
[001453] Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de nucleotídeos de ORF1 de Anellovirus da Tabela 5 (por exemplo, nucleotídeos 599 – 2830 da sequência de ácidos nucleicos da Tabela 5). Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de nucleotídeos de ORF1/1 de Anellovirus da Tabela 5 (por exemplo, nucleotídeos 599 – 715 e/ou 2363 – 2830 da sequência de ácidos nucleicos da Tabela 5). Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de nucleotídeos de ORF1/2 de Anellovirus da Tabela 5 (por exemplo, nucleotídeos 599 – 715 e/ou 2565 – 2789 da sequência de ácidos nucleicos da Tabela 5). Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de nucleotídeos de ORF2 de Anellovirus da Tabela 5 (por exemplo, nucleotídeos 336 – 719 da sequência de ácidos nucleicos da Tabela 5). Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de nucleotídeos de ORF2/2 de Anellovirus da Tabela 5 (por exemplo, nucleotídeos 336 – 715 e/ou 2363 – 2789 da sequência de ácidos nucleicos da Tabela 5). Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de nucleotídeos de ORF2/3 de Anellovirus da Tabela 5 (por exemplo, nucleotídeos 336 – 715 e/ou 2565 – 3015 da sequência de ácidos nucleicos da Tabela 5). Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de nucleotídeos de ORF2t/3 de Anellovirus da Tabela 5 (por exemplo, nucleotídeos 336 – 388 e/ou 2565 – 3015 da sequência de ácidos nucleicos da Tabela 5). Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de nucleotídeos da caixa TATA de Anellovirus da Tabela 5 (por exemplo, nucleotídeos 83 – 88 da sequência de ácidos nucleicos da Tabela 5). Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de nucleotídeos do local Cap de Anellovirus da Tabela 5 (por exemplo, nucleotídeos 104 – 111 da sequência de ácidos nucleicos da Tabela 5). Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de nucleotídeos do local de início transcricional de Anellovirus da Tabela 5 (por exemplo, nucleotídeo 111 da sequência de ácidos nucleicos da Tabela 5). Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de nucleotídeos do domínio conservado de 5´ UTR de Anellovirus da Tabela 5 (por exemplo, nucleotídeos 170 – 240 da sequência de ácidos nucleicos da Tabela 5). Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de nucleotídeos da região de três grelhas de leitura aberta de Anellovirus da Tabela 5 (por exemplo, nucleotídeos 2551 – 2786 da sequência de ácidos nucleicos da Tabela 5). Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de nucleotídeos do sinal de poli(A) de Anellovirus da Tabela 5 (por exemplo, nucleotídeos 3011 – 3016 da sequência de ácidos nucleicos da Tabela 5). Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou
100% de identidade de sequências com a sequência de nucleotídeos rica em GC de Anellovirus da Tabela 5 (por exemplo, nucleotídeos 3632 – 3753 da sequência de ácidos nucleicos da Tabela 5).
[001454] Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de nucleotídeos de ORF1 de Anellovirus da Tabela 7 (por exemplo, nucleotídeos 586 – 2928 da sequência de ácidos nucleicos da Tabela 7). Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de nucleotídeos de ORF1/1 de Anellovirus da Tabela 7 (por exemplo, nucleotídeos 586 – 717 e/ou 2446 – 2928 da sequência de ácidos nucleicos da Tabela 7). Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de nucleotídeos de ORF1/2 de Anellovirus da Tabela 7 (por exemplo, nucleotídeos 586 – 717 e/ou 2675 – 2902 da sequência de ácidos nucleicos da Tabela 7). Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de nucleotídeos de ORF2 de Anellovirus da Tabela 7 (por exemplo, nucleotídeos 335 – 721 da sequência de ácidos nucleicos da Tabela 7). Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de nucleotídeos de ORF2/2 de Anellovirus da Tabela 7 (por exemplo, nucleotídeos 335 – 717 e/ou 2446 – 2902 da sequência de ácidos nucleicos da Tabela 7). Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de nucleotídeos de ORF2/3 de Anellovirus da Tabela 7 (por exemplo, nucleotídeos 335 – 717 e/ou 2675 – 3109 da sequência de ácidos nucleicos da Tabela 7). Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de nucleotídeos da caixa TATA de Anellovirus da Tabela 7 (por exemplo, nucleotídeos 82 – 87 da sequência de ácidos nucleicos da Tabela 7). Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de nucleotídeos do elemento iniciador de Anellovirus da Tabela 7 (por exemplo, nucleotídeos 95 – 115 da sequência de ácidos nucleicos da Tabela 7). Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de nucleotídeos do local de início transcricional de Anellovirus da Tabela 7 (por exemplo, nucleotídeo 115 da sequência de ácidos nucleicos da Tabela 7). Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de nucleotídeos do domínio conservado de 5´ UTR de Anellovirus da Tabela 7 (por exemplo, nucleotídeos 170 – 238 da sequência de ácidos nucleicos da Tabela 7). Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de nucleotídeos da região de três grelhas de leitura aberta de Anellovirus da Tabela 7 (por exemplo, nucleotídeos 2640 – 2899 da sequência de ácidos nucleicos da Tabela 7). Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de nucleotídeos do sinal de poli(A) de Anellovirus da Tabela 7 (por exemplo, nucleotídeos 3106 – 3114 da sequência de ácidos nucleicos da Tabela 7). Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de nucleotídeos rica em GC de Anellovirus da Tabela 7 (por exemplo, nucleotídeos 3768 – 3878 da sequência de ácidos nucleicos da Tabela 7).
[001455] Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de nucleotídeos de ORF1 de Anellovirus da Tabela 9 (por exemplo, nucleotídeos 588 – 2873 da sequência de ácidos nucleicos da Tabela 9). Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de nucleotídeos de ORF1/1 de Anellovirus da Tabela 9 (por exemplo, nucleotídeos 588 – 722 e/ou 2412 – 2873 da sequência de ácidos nucleicos da Tabela 9). Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de nucleotídeos de ORF1/2 de Anellovirus da Tabela 9 (por exemplo, nucleotídeos 588 – 722 e/ou 2638 – 2847 da sequência de ácidos nucleicos da Tabela 9). Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de nucleotídeos de ORF2 de Anellovirus da Tabela 9 (por exemplo, nucleotídeos 331 – 726 da sequência de ácidos nucleicos da Tabela 9). Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de nucleotídeos de ORF2/2 de Anellovirus da Tabela 9 (por exemplo, nucleotídeos 331 – 722 e/ou 2412 – 2847 da sequência de ácidos nucleicos da Tabela 9). Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de nucleotídeos de ORF2/3 de Anellovirus da Tabela 9 (por exemplo, nucleotídeos 331 – 722 e/ou 2638 – 3058 da sequência de ácidos nucleicos da Tabela 9). Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de nucleotídeos de ORF2t/3 de Anellovirus da Tabela 9 (por exemplo, nucleotídeos 331 – 380 e/ou 2638 – 3058 da sequência de ácidos nucleicos da Tabela 9). Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos possuindo pelo menos cerca de 70%,
75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de nucleotídeos da caixa TATA de Anellovirus da Tabela 9 (por exemplo, nucleotídeos 82 – 86 da sequência de ácidos nucleicos da Tabela 9). Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de nucleotídeos do elemento iniciador de Anellovirus da Tabela 9 (por exemplo, nucleotídeos 100 – 115 da sequência de ácidos nucleicos da Tabela 9). Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de nucleotídeos do local de início transcricional de Anellovirus da Tabela 9 (por exemplo, nucleotídeo 115 da sequência de ácidos nucleicos da Tabela 9). Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de nucleotídeos do domínio conservado de 5´ UTR de Anellovirus da Tabela 9 (por exemplo, nucleotídeos 170 – 240 da sequência de ácidos nucleicos da Tabela 9). Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de nucleotídeos da região de três grelhas de leitura aberta de Anellovirus da Tabela 9 (por exemplo, nucleotídeos 2699 – 2969 da sequência de ácidos nucleicos da Tabela 9). Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de nucleotídeos do sinal de poli(A) de Anellovirus da Tabela 9 (por exemplo, nucleotídeos 3220 – 3225 da sequência de ácidos nucleicos da Tabela 9). Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de nucleotídeos rica em GC de Anellovirus da Tabela 9 (por exemplo, nucleotídeos 3302 – 3541 da sequência de ácidos nucleicos da Tabela 9).
[001456] Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de nucleotídeos de ORF1 de Anellovirus da Tabela 11 (por exemplo, nucleotídeos 599 – 2839 da sequência de ácidos nucleicos da Tabela 11). Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de nucleotídeos de ORF1/1 de Anellovirus da Tabela 11 (por exemplo, nucleotídeos 599 – 727 e/ou 2381 – 2839 da sequência de ácidos nucleicos da Tabela 11). Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de nucleotídeos de ORF1/2 de Anellovirus da Tabela 11 (por exemplo, nucleotídeos 599 – 727 e/ou 2619 – 2813 da sequência de ácidos nucleicos da Tabela 11). Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de nucleotídeos de ORF2 de Anellovirus da Tabela 11 (por exemplo,
nucleotídeos 357 – 731 da sequência de ácidos nucleicos da Tabela 11). Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de nucleotídeos de ORF2/2 de Anellovirus da Tabela 11 (por exemplo, nucleotídeos 357 – 727 e/ou 2381 – 2813 da sequência de ácidos nucleicos da Tabela 11). Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de nucleotídeos de ORF2/3 de Anellovirus da Tabela 11 (por exemplo, nucleotídeos 357 – 727 e/ou 2619 – 3021 da sequência de ácidos nucleicos da Tabela 11). Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de nucleotídeos de ORF2t/3 de Anellovirus da Tabela 11 (por exemplo, nucleotídeos 357 – 406 e/ou 2619 – 3021 da sequência de ácidos nucleicos da Tabela 11). Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de nucleotídeos da caixa TATA de Anellovirus da Tabela 11 (por exemplo, nucleotídeos 89 – 90 da sequência de ácidos nucleicos da Tabela 11). Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de nucleotídeos do local Cap de Anellovirus da Tabela 11 (por exemplo, nucleotídeos 107 – 114 da sequência de ácidos nucleicos da Tabela 11). Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de nucleotídeos do local de início transcricional de Anellovirus da Tabela 11 (por exemplo, nucleotídeo 114 da sequência de ácidos nucleicos da Tabela 11). Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de nucleotídeos do domínio conservado de 5´ UTR de Anellovirus da Tabela 11 (por exemplo, nucleotídeos 174 – 244 da sequência de ácidos nucleicos da Tabela 11). Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de nucleotídeos da região de três grelhas de leitura aberta de Anellovirus da Tabela 11 (por exemplo, nucleotídeos 2596 – 2810 da sequência de ácidos nucleicos da Tabela 11). Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de nucleotídeos do sinal de poli(A) de Anellovirus da Tabela 11 (por exemplo, nucleotídeos 3017 – 3022 da sequência de ácidos nucleicos da Tabela 11). Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de nucleotídeos rica em GC de Anellovirus da Tabela 11 (por exemplo, nucleotídeos 3691 – 3794 da sequência de ácidos nucleicos da Tabela 11).
[001457] Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de nucleotídeos de ORF1 de Anellovirus da Tabela 13 (por exemplo, nucleotídeos 599 – 2896 da sequência de ácidos nucleicos da Tabela 13). Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de nucleotídeos de ORF1/1 de Anellovirus da Tabela 13 (por exemplo, nucleotídeos 599 – 724 e/ou 2411 – 2896 da sequência de ácidos nucleicos da Tabela 13). Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de nucleotídeos de ORF1/2 de Anellovirus da Tabela 13 (por exemplo, nucleotídeos 599 – 724 e/ou 2646 – 2870 da sequência de ácidos nucleicos da Tabela 13). Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de nucleotídeos de ORF2 de Anellovirus da Tabela 13 (por exemplo, nucleotídeos 357 – 728 da sequência de ácidos nucleicos da Tabela 13). Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de nucleotídeos de ORF2/2 de Anellovirus da Tabela 13 (por exemplo, nucleotídeos 357 – 724 e/ou 2411 – 2870 da sequência de ácidos nucleicos da Tabela 13). Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos possuindo pelo menos cerca de 70%, 75%, 80%,
85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de nucleotídeos de ORF2/3 de Anellovirus da Tabela 13 (por exemplo, nucleotídeos 357 – 724 e/ou 2646 – 3081 da sequência de ácidos nucleicos da Tabela 13). Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de nucleotídeos da caixa TATA de Anellovirus da Tabela 13 (por exemplo, nucleotídeos 82 – 86 da sequência de ácidos nucleicos da Tabela 13). Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de nucleotídeos do elemento iniciador de Anellovirus da Tabela 13 (por exemplo, nucleotídeos 94 – 115 da sequência de ácidos nucleicos da Tabela 13). Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de nucleotídeos do local de início transcricional de Anellovirus da Tabela 13 (por exemplo, nucleotídeo 115 da sequência de ácidos nucleicos da Tabela 13). Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de nucleotídeos do domínio conservado de 5´ UTR de Anellovirus da Tabela 13 (por exemplo, nucleotídeos 170 – 240 da sequência de ácidos nucleicos da Tabela 13). Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de nucleotídeos da região de três grelhas de leitura aberta de Anellovirus da Tabela 13 (por exemplo, nucleotídeos 2629 – 2867 da sequência de ácidos nucleicos da Tabela 13). Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de nucleotídeos do sinal de poli(A) de Anellovirus da Tabela 13 (por exemplo, nucleotídeos 3076 – 3086 da sequência de ácidos nucleicos da Tabela 13). Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de nucleotídeos rica em GC de Anellovirus da Tabela 13 (por exemplo, nucleotídeos 3759 – 3866 da sequência de ácidos nucleicos da Tabela 13).
[001458] Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de nucleotídeos de ORF1 de Anellovirus da Tabela 15 (por exemplo, nucleotídeos 612 – 2612 da sequência de ácidos nucleicos da Tabela 15). Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de nucleotídeos de ORF1/1 de Anellovirus da Tabela 15 (por exemplo, nucleotídeos 612 – 719 e/ou 2274 – 2612 da sequência de ácidos nucleicos da Tabela 15). Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de nucleotídeos de ORF1/2 de Anellovirus da Tabela 15 (por exemplo, nucleotídeos 612 – 719 e/ou 2449 – 2589 da sequência de ácidos nucleicos da Tabela 15). Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de nucleotídeos de ORF2 de Anellovirus da Tabela 15 (por exemplo, nucleotídeos 424 – 723 da sequência de ácidos nucleicos da Tabela 15). Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de nucleotídeos de ORF2/2 de Anellovirus da Tabela 15 (por exemplo, nucleotídeos 424 – 719 e/ou 2274 – 2589 da sequência de ácidos nucleicos da Tabela 15). Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de nucleotídeos de ORF2/3 de Anellovirus da Tabela 15 (por exemplo, nucleotídeos 424 – 719 e/ou 2449 – 2812 da sequência de ácidos nucleicos da Tabela 15). Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de nucleotídeos da caixa TATA de Anellovirus da Tabela 15 (por exemplo, nucleotídeos 237 – 243 da sequência de ácidos nucleicos da Tabela 15). Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de nucleotídeos do local Cap de Anellovirus da Tabela 15 (por exemplo, nucleotídeos
260 – 267 da sequência de ácidos nucleicos da Tabela 15). Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de nucleotídeos do local de início transcricional de Anellovirus da Tabela 15 (por exemplo, nucleotídeo 267 da sequência de ácidos nucleicos da Tabela 15). Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de nucleotídeos do domínio conservado de 5´ UTR de Anellovirus da Tabela 15 (por exemplo, nucleotídeos 323 – 393 da sequência de ácidos nucleicos da Tabela 15). Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de nucleotídeos da região de três grelhas de leitura aberta de Anellovirus da Tabela 15 (por exemplo, nucleotídeos 2441 – 2586 da sequência de ácidos nucleicos da Tabela 15). Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de nucleotídeos do sinal de poli(A) de Anellovirus da Tabela 15 (por exemplo, nucleotídeos 2808 – 2813 da sequência de ácidos nucleicos da Tabela 15). Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de nucleotídeos rica em GC de Anellovirus da Tabela 15 (por exemplo, nucleotídeos 2868 – 2929 da sequência de ácidos nucleicos da Tabela 15).
[001459] Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de nucleotídeos de ORF1 de Anellovirus da Tabela 17 (por exemplo, nucleotídeos 432 – 2453 da sequência de ácidos nucleicos da Tabela 17). Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de nucleotídeos de ORF1/1 de Anellovirus da Tabela 17 (por exemplo, nucleotídeos 432 – 584 e/ou 1977 – 2453 da sequência de ácidos nucleicos da Tabela 17). Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de nucleotídeos de ORF1/2 de Anellovirus da Tabela 17 (por exemplo, nucleotídeos 432 – 584 e/ou 2197 – 2388 da sequência de ácidos nucleicos da Tabela 17). Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de nucleotídeos de ORF2 de Anellovirus da Tabela 17 (por exemplo, nucleotídeos 283 – 588 da sequência de ácidos nucleicos da Tabela 17). Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de nucleotídeos de ORF2/2 de Anellovirus da Tabela 17 (por exemplo, nucleotídeos 283 – 584 e/ou 1977 – 2388 da sequência de ácidos nucleicos da Tabela 17). Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de nucleotídeos de ORF2/3 de Anellovirus da Tabela 17 (por exemplo, nucleotídeos 283 – 584 e/ou 2197 – 2614 da sequência de ácidos nucleicos da Tabela 17). Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de nucleotídeos da caixa TATA de Anellovirus da Tabela 17 (por exemplo, nucleotídeos 21 – 25 da sequência de ácidos nucleicos da Tabela 17). Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de nucleotídeos do local Cap de Anellovirus da Tabela 17 (por exemplo, nucleotídeos 42 – 49 da sequência de ácidos nucleicos da Tabela 17). Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de nucleotídeos do local de início transcricional de Anellovirus da Tabela 17 (por exemplo, nucleotídeo 49 da sequência de ácidos nucleicos da Tabela 17). Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de nucleotídeos do domínio conservado de 5´ UTR de Anellovirus da Tabela 17 (por exemplo, nucleotídeos 117 – 187 da sequência de ácidos nucleicos da Tabela 17). Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou
100% de identidade de sequências com a sequência de nucleotídeos da região de três grelhas de leitura aberta de Anellovirus da Tabela 17 (por exemplo, nucleotídeos 2186 – 2385 da sequência de ácidos nucleicos da Tabela 17). Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de nucleotídeos do sinal de poli(A) de Anellovirus da Tabela 17 (por exemplo, nucleotídeos 2676 – 2681 da sequência de ácidos nucleicos da Tabela 17). Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de nucleotídeos rica em GC de Anellovirus da Tabela 17 (por exemplo, nucleotídeos 3054 – 3172 da sequência de ácidos nucleicos da Tabela 17).
[001460] Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos codificando uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos de ORF1 de Anellovirus da Tabela A2. Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos codificando uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos de ORF1/1 de Anellovirus da Tabela A2. Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos codificando uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos de ORF1/2 de Anellovirus da Tabela
A2. Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos codificando uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos de ORF2 de Anellovirus da Tabela A2. Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos codificando uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos de ORF2/2 de Anellovirus da Tabela A2. Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos codificando uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos de ORF2/3 de Anellovirus da Tabela A2. Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos codificando uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos de ORF2t/3 de Anellovirus da Tabela A2.
[001461] Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos codificando uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos de ORF1 de Anellovirus da Tabela A4. Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos codificando uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos de ORF1/1 de Anellovirus da Tabela A4. Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos codificando uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos de ORF1/2 de Anellovirus da Tabela A4. Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos codificando uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos de ORF2 de Anellovirus da Tabela A4. Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos codificando uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos de ORF2/2 de Anellovirus da Tabela A4. Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos codificando uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos de ORF2/3 de Anellovirus da Tabela A4.
[001462] Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos codificando uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos de ORF1 de Anellovirus da Tabela A6. Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos codificando uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%,
90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos de ORF1/1 de Anellovirus da Tabela A6. Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos codificando uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos de ORF1/2 de Anellovirus da Tabela A6. Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos codificando uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos de ORF2 de Anellovirus da Tabela A6. Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos codificando uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos de ORF2/2 de Anellovirus da Tabela A6. Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos codificando uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos de ORF2/3 de Anellovirus da Tabela A6. Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos codificando uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos de ORF2t/3 de Anellovirus da Tabela A6.
[001463] Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos codificando uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos de ORF1 de Anellovirus da Tabela A8. Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos codificando uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos de ORF1/1 de Anellovirus da Tabela A8. Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos codificando uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos de ORF1/2 de Anellovirus da Tabela A8. Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos codificando uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos de ORF2 de Anellovirus da Tabela A8. Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos codificando uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos de ORF2/2 de Anellovirus da Tabela A8. Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos codificando uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos de ORF2/3 de Anellovirus da Tabela A8. Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos codificando uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos de ORF2t/3 de Anellovirus da Tabela A8.
[001464] Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos codificando uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos de ORF1 de Anellovirus da Tabela A10. Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos codificando uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos de ORF1/1 de Anellovirus da Tabela A10. Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos codificando uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos de ORF1/2 de Anellovirus da Tabela A10. Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos codificando uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos de ORF2 de Anellovirus da Tabela A10. Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos codificando uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos de ORF2/2 de Anellovirus da Tabela A10. Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos codificando uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos de ORF2/3 de Anellovirus da Tabela A10. Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos codificando uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos de ORF2t/3 de Anellovirus da Tabela A10.
[001465] Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos codificando uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos de ORF1 de Anellovirus da Tabela A12. Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos codificando uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos de ORF1/1 de Anellovirus da Tabela A12. Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos codificando uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos de ORF1/2 de Anellovirus da Tabela A12. Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos codificando uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos de ORF2 de Anellovirus da Tabela
A12. Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos codificando uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos de ORF2/2 de Anellovirus da Tabela A12. Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos codificando uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos de ORF2/3 de Anellovirus da Tabela A12. Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos codificando uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos de ORF2t/3 de Anellovirus da Tabela A12.
[001466] Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos codificando uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos de ORF1 de Anellovirus da Tabela C1. Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos codificando uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos de ORF1/1 de Anellovirus da Tabela C1. Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos codificando uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos de ORF1/2 de Anellovirus da Tabela C1. Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos codificando uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos de ORF2 de Anellovirus da Tabela C1. Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos codificando uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos de ORF2/2 de Anellovirus da Tabela C1. Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos codificando uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos de ORF2/3 de Anellovirus da Tabela C1. Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos codificando uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos de TAIP de Anellovirus da Tabela C1.
[001467] Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos codificando uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos de ORF1 de Anellovirus da Tabela C2. Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos codificando uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos de ORF1/1 de Anellovirus da Tabela C2. Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos codificando uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos de ORF1/2 de Anellovirus da Tabela C2. Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos codificando uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos de ORF2 de Anellovirus da Tabela C2. Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos codificando uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos de ORF2/2 de Anellovirus da Tabela C2. Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos codificando uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos de ORF2/3 de Anellovirus da Tabela C2. Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos codificando uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos de TAIP de Anellovirus da Tabela C2.
[001468] Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos codificando uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos de ORF1 de Anellovirus da Tabela C3. Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos codificando uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos de ORF1/1 de Anellovirus da Tabela C3. Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos codificando uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos de ORF1/2 de Anellovirus da Tabela C3. Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos codificando uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos de ORF2 de Anellovirus da Tabela C3. Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos codificando uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos de ORF2/2 de Anellovirus da Tabela C3. Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos codificando uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos de ORF2/3 de Anellovirus da Tabela C3. Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos codificando uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos de TAIP de Anellovirus da Tabela C3.
[001469] Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos codificando uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos de ORF1 de Anellovirus da Tabela C4. Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos codificando uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos de ORF1/1 de Anellovirus da Tabela C4. Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos codificando uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos de ORF1/2 de Anellovirus da Tabela C4. Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos codificando uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos de ORF2 de Anellovirus da Tabela C4. Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos codificando uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos de ORF2/2 de Anellovirus da Tabela C4. Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos codificando uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos de ORF2/3 de Anellovirus da Tabela C4. Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos codificando uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos de TAIP de Anellovirus da Tabela C4.
[001470] Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos codificando uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos de ORF1 de Anellovirus da Tabela C5. Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos codificando uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos de ORF1/1 de Anellovirus da Tabela C5. Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos codificando uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos de ORF1/2 de Anellovirus da Tabela C5. Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos codificando uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos de ORF2 de Anellovirus da Tabela C5. Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos codificando uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos de ORF2/2 de Anellovirus da Tabela C5. Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos codificando uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos de ORF2/3 de Anellovirus da Tabela C5. Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos codificando uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos de TAIP de Anellovirus da Tabela C5.
[001471] Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos codificando uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos de ORF1 de Anellovirus da Tabela 2. Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos codificando uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos de ORF1/1 de Anellovirus da Tabela 2. Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos codificando uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos de ORF1/2 de Anellovirus da Tabela 2. Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos codificando uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos de ORF2 de
Anellovirus da Tabela 2. Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos codificando uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos de ORF2/2 de Anellovirus da Tabela 2. Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos codificando uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos de ORF2/3 de Anellovirus da Tabela 2. Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos codificando uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos de ORF2t/3 de Anellovirus da Tabela 2.
[001472] Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos codificando uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos de ORF1 de Anellovirus da Tabela 4. Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos codificando uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos de ORF1/1 de Anellovirus da Tabela 4. Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos codificando uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos de ORF1/2 de Anellovirus da Tabela 4. Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos codificando uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos de ORF2 de Anellovirus da Tabela 4. Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos codificando uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos de ORF2/2 de Anellovirus da Tabela 4. Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos codificando uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos de ORF2/3 de Anellovirus da Tabela 4.
[001473] Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos codificando uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos de ORF1 de Anellovirus da Tabela 6. Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos codificando uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos de ORF1/1 de Anellovirus da Tabela 6. Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos codificando uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos de ORF1/2 de Anellovirus da Tabela 6. Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos codificando uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos de ORF2 de Anellovirus da Tabela 6. Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos codificando uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos de ORF2/2 de Anellovirus da Tabela 6. Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos codificando uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos de ORF2/3 de Anellovirus da Tabela 6. Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos codificando uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos de ORF2t/3 de Anellovirus da Tabela 6.
[001474] Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos codificando uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos de ORF1 de Anellovirus da Tabela 8. Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos codificando uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos de ORF1/1 de Anellovirus da Tabela 8. Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos codificando uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos de ORF1/2 de Anellovirus da Tabela 8. Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos codificando uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos de ORF2 de Anellovirus da Tabela 8. Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos codificando uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos de ORF2/2 de Anellovirus da Tabela 8. Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos codificando uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos de ORF2/3 de Anellovirus da Tabela 8.
[001475] Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos codificando uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos de ORF1 de Anellovirus da Tabela 10. Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos codificando uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos de ORF1/1 de Anellovirus da Tabela 10. Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos codificando uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%,
97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos de ORF1/2 de Anellovirus da Tabela 10. Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos codificando uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos de ORF2 de Anellovirus da Tabela 10. Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos codificando uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos de ORF2/2 de Anellovirus da Tabela 10. Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos codificando uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos de ORF2/3 de Anellovirus da Tabela 10. Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos codificando uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos de ORF2t/3 de Anellovirus da Tabela 10.
[001476] Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos codificando uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos de ORF1 de Anellovirus da Tabela 12. Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos codificando uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%,
97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos de ORF1/1 de Anellovirus da Tabela 12. Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos codificando uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos de ORF1/2 de Anellovirus da Tabela 12. Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos codificando uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos de ORF2 de Anellovirus da Tabela 12. Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos codificando uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos de ORF2/2 de Anellovirus da Tabela 12. Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos codificando uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos de ORF2/3 de Anellovirus da Tabela 12. Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos codificando uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos de ORF2t/3 de Anellovirus da Tabela 12.
[001477] Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos codificando uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%,
95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos de ORF1 de Anellovirus da Tabela 14. Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos codificando uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos de ORF1/1 de Anellovirus da Tabela 14. Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos codificando uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos de ORF1/2 de Anellovirus da Tabela 14. Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos codificando uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos de ORF2 de Anellovirus da Tabela 14. Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos codificando uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos de ORF2/2 de Anellovirus da Tabela 14. Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos codificando uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos de ORF2/3 de Anellovirus da Tabela 14.
[001478] Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos codificando uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%,
95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos de ORF1 de Anellovirus da Tabela 16. Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos codificando uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos de ORF1/1 de Anellovirus da Tabela 16. Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos codificando uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos de ORF1/2 de Anellovirus da Tabela 16. Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos codificando uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos de ORF2 de Anellovirus da Tabela 16. Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos codificando uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos de ORF2/2 de Anellovirus da Tabela 16. Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos codificando uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos de ORF2/3 de Anellovirus da Tabela 16.
[001479] Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos codificando uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%,
95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos de ORF1 de Anellovirus da Tabela 18. Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos codificando uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos de ORF1/1 de Anellovirus da Tabela 18. Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos codificando uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos de ORF1/2 de Anellovirus da Tabela 18. Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos codificando uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos de ORF2 de Anellovirus da Tabela 18. Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos codificando uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos de ORF2/2 de Anellovirus da Tabela 18. Em modalidades, a molécula de ácido nucleico compreende uma sequência de ácidos nucleicos codificando uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos de ORF2/3 de Anellovirus da Tabela 18.
[001480] Em modalidades, o anelossomo descrito no presente documento compreende uma proteína possuindo uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%,
90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos de ORF1 de Anellovirus da Tabela A2. Em modalidades, o anelossomo descrito no presente documento compreende uma proteína possuindo uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos de ORF1/1 de Anellovirus da Tabela A2. Em modalidades, o anelossomo descrito no presente documento compreende uma proteína possuindo uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos de ORF1/2 de Anellovirus da Tabela A2. Em modalidades, o anelossomo descrito no presente documento compreende uma proteína possuindo uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos de ORF2 de Anellovirus da Tabela A2. Em modalidades, o anelossomo descrito no presente documento compreende uma proteína possuindo uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos de ORF2/2 de Anellovirus da Tabela A2. Em modalidades, o anelossomo descrito no presente documento compreende uma proteína possuindo uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos de ORF2/3 de Anellovirus da Tabela A2. Em modalidades, o anelossomo descrito no presente documento compreende uma proteína possuindo uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%,
97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos de ORF2t/3 de Anellovirus da Tabela A2. Em algumas modalidades, uma molécula ORF1 (por exemplo, compreendida no anelossomo) compreende um polipeptídeo codificado pela sequência de ácidos nucleicos de ORF1 de Anellovirus dos nucleotídeos 574-2775 da sequência de ácidos nucleicos da Tabela A1. Em algumas modalidades, a molécula ORF1 (por exemplo, compreendida no anelossomo) compreende uma proteína ORF1 de Anellovirus da Tabela A2 ou uma sua variante de splice ou variante pós- translacionalmente processada (por exemplo, proteoliticamente processada).
[001481] Em modalidades, o anelossomo descrito no presente documento compreende uma proteína possuindo uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos de ORF1 de Anellovirus da Tabela A4. Em modalidades, o anelossomo descrito no presente documento compreende uma proteína possuindo uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos de ORF1/1 de Anellovirus da Tabela A4. Em modalidades, o anelossomo descrito no presente documento compreende uma proteína possuindo uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos de ORF1/2 de Anellovirus da Tabela A4. Em modalidades, o anelossomo descrito no presente documento compreende uma proteína possuindo uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos de ORF2 de Anellovirus da Tabela A4. Em modalidades, o anelossomo descrito no presente documento compreende uma proteína possuindo uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos de ORF2/2 de Anellovirus da Tabela A4. Em modalidades, o anelossomo descrito no presente documento compreende uma proteína possuindo uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos de ORF2/3 de Anellovirus da Tabela A4. Em algumas modalidades, uma molécula ORF1 (por exemplo, compreendida no anelossomo) compreende um polipeptídeo codificado pela sequência de ácidos nucleicos de ORF1 de Anellovirus dos nucleotídeos 599-2887 da sequência de ácidos nucleicos da Tabela A3. Em algumas modalidades, a molécula ORF1 (por exemplo, compreendida no anelossomo) compreende uma proteína ORF1 de Anellovirus da Tabela A4 ou uma sua variante de splice ou variante pós- translacionalmente processada (por exemplo, proteoliticamente processada).
[001482] Em modalidades, o anelossomo descrito no presente documento compreende uma proteína possuindo uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos de ORF1 de Anellovirus da Tabela A6. Em modalidades, o anelossomo descrito no presente documento compreende uma proteína possuindo uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos de ORF1/1 de Anellovirus da Tabela A6. Em modalidades, o anelossomo descrito no presente documento compreende uma proteína possuindo uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos de ORF1/2 de Anellovirus da Tabela A6. Em modalidades, o anelossomo descrito no presente documento compreende uma proteína possuindo uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos de ORF2 de Anellovirus da Tabela A6. Em modalidades, o anelossomo descrito no presente documento compreende uma proteína possuindo uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos de ORF2/2 de Anellovirus da Tabela A6. Em modalidades, o anelossomo descrito no presente documento compreende uma proteína possuindo uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos de ORF2/3 de Anellovirus da Tabela A6. Em modalidades, o anelossomo descrito no presente documento compreende uma proteína possuindo uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos de ORF2t/3 de Anellovirus da Tabela A6. Em algumas modalidades, uma molécula ORF1 (por exemplo, compreendida no anelossomo) compreende um polipeptídeo codificado pela sequência de ácidos nucleicos de ORF1 de Anellovirus dos nucleotídeos 556-2904 da sequência de ácidos nucleicos da Tabela A5. Em algumas modalidades, a molécula ORF1 (por exemplo,
compreendida no anelossomo) compreende uma proteína ORF1 de Anellovirus da Tabela A6 ou uma sua variante de splice ou variante pós- translacionalmente processada (por exemplo, proteoliticamente processada).
[001483] Em modalidades, o anelossomo descrito no presente documento compreende uma proteína possuindo uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos de ORF1 de Anellovirus da Tabela A8. Em modalidades, o anelossomo descrito no presente documento compreende uma proteína possuindo uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos de ORF1/1 de Anellovirus da Tabela A8. Em modalidades, o anelossomo descrito no presente documento compreende uma proteína possuindo uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos de ORF1/2 de Anellovirus da Tabela A8. Em modalidades, o anelossomo descrito no presente documento compreende uma proteína possuindo uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos de ORF2 de Anellovirus da Tabela A8. Em modalidades, o anelossomo descrito no presente documento compreende uma proteína possuindo uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos de ORF2/2 de Anellovirus da Tabela A8. Em modalidades, o anelossomo descrito no presente documento compreende uma proteína possuindo uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos de ORF2/3 de Anellovirus da Tabela A8. Em modalidades, o anelossomo descrito no presente documento compreende uma proteína possuindo uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos de ORF2t/3 de Anellovirus da Tabela A8. Em algumas modalidades, uma molécula ORF1 (por exemplo, compreendida no anelossomo) compreende um polipeptídeo codificado pela sequência de ácidos nucleicos de ORF1 de Anellovirus dos nucleotídeos 589-2889 da sequência de ácidos nucleicos da Tabela A7. Em algumas modalidades, a molécula ORF1 (por exemplo, compreendida no anelossomo) compreende uma proteína ORF1 de Anellovirus da Tabela A8 ou uma sua variante de splice ou variante pós- translacionalmente processada (por exemplo, proteoliticamente processada).
[001484] Em modalidades, o anelossomo descrito no presente documento compreende uma proteína possuindo uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos de ORF1 de Anellovirus da Tabela A10. Em modalidades, o anelossomo descrito no presente documento compreende uma proteína possuindo uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos de ORF1/1 de Anellovirus da Tabela A10. Em modalidades, o anelossomo descrito no presente documento compreende uma proteína possuindo uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos de ORF1/2 de Anellovirus da Tabela A10. Em modalidades, o anelossomo descrito no presente documento compreende uma proteína possuindo uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos de ORF2 de Anellovirus da Tabela A10. Em modalidades, o anelossomo descrito no presente documento compreende uma proteína possuindo uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos de ORF2/2 de Anellovirus da Tabela A10. Em modalidades, o anelossomo descrito no presente documento compreende uma proteína possuindo uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos de ORF2/3 de Anellovirus da Tabela A10. Em modalidades, o anelossomo descrito no presente documento compreende uma proteína possuindo uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos de ORF2t/3 de Anellovirus da Tabela A10. Em algumas modalidades, uma molécula ORF1 (por exemplo, compreendida no anelossomo) compreende um polipeptídeo codificado pela sequência de ácidos nucleicos de ORF1 de Anellovirus dos nucleotídeos 511-2793 da sequência de ácidos nucleicos da Tabela A9. Em algumas modalidades, a molécula ORF1 (por exemplo, compreendida no anelossomo) compreende uma proteína ORF1 de Anellovirus da Tabela A10 ou uma sua variante de splice ou variante pós-translacionalmente processada (por exemplo, proteoliticamente processada).
[001485] Em modalidades, o anelossomo descrito no presente documento compreende uma proteína possuindo uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos de ORF1 de Anellovirus da Tabela A12. Em modalidades, o anelossomo descrito no presente documento compreende uma proteína possuindo uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos de ORF1/1 de Anellovirus da Tabela A12. Em modalidades, o anelossomo descrito no presente documento compreende uma proteína possuindo uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos de ORF1/2 de Anellovirus da Tabela A12. Em modalidades, o anelossomo descrito no presente documento compreende uma proteína possuindo uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos de ORF2 de Anellovirus da Tabela A12. Em modalidades, o anelossomo descrito no presente documento compreende uma proteína possuindo uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos de ORF2/2 de Anellovirus da Tabela A12. Em modalidades, o anelossomo descrito no presente documento compreende uma proteína possuindo uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%,
97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos de ORF2/3 de Anellovirus da Tabela A12. Em modalidades, o anelossomo descrito no presente documento compreende uma proteína possuindo uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos de ORF2t/3 de Anellovirus da Tabela A12. Em algumas modalidades, uma molécula ORF1 (por exemplo, compreendida no anelossomo) compreende um polipeptídeo codificado pela sequência de ácidos nucleicos de ORF1 de Anellovirus dos nucleotídeos 704-3001 da sequência de ácidos nucleicos da Tabela A11. Em algumas modalidades, a molécula ORF1 (por exemplo, compreendida no anelossomo) compreende uma proteína ORF1 de Anellovirus da Tabela A12 ou uma sua variante de splice ou variante pós-translacionalmente processada (por exemplo, proteoliticamente processada).
[001486] Em modalidades, o anelossomo descrito no presente documento compreende uma proteína possuindo uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos de ORF1 de Anellovirus da Tabela C1. Em modalidades, o anelossomo descrito no presente documento compreende uma proteína possuindo uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos de ORF1/1 de Anellovirus da Tabela C1. Em modalidades, o anelossomo descrito no presente documento compreende uma proteína possuindo uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos de ORF1/2 de Anellovirus da Tabela C1. Em modalidades, o anelossomo descrito no presente documento compreende uma proteína possuindo uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos de ORF2 de Anellovirus da Tabela C1. Em modalidades, o anelossomo descrito no presente documento compreende uma proteína possuindo uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos de ORF2/2 de Anellovirus da Tabela C1. Em modalidades, o anelossomo descrito no presente documento compreende uma proteína possuindo uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos de ORF2/3 de Anellovirus da Tabela C1. Em modalidades, o anelossomo descrito no presente documento compreende uma proteína possuindo uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos de ORF2t/3 de Anellovirus da Tabela C1. Em modalidades, o anelossomo descrito no presente documento compreende uma proteína possuindo uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos de TAIP de Anellovirus da Tabela C1. Em algumas modalidades, uma molécula ORF1 (por exemplo, compreendida no anelossomo) compreende um polipeptídeo codificado pela sequência de ácidos nucleicos de ORF1 de Anellovirus dos nucleotídeos 512-2545 da sequência de ácidos nucleicos da Tabela B1.
Em algumas modalidades, a molécula ORF1 (por exemplo, compreendida no anelossomo) compreende uma proteína ORF1 de Anellovirus da Tabela C1 ou uma sua variante de splice ou variante pós- translacionalmente processada (por exemplo, proteoliticamente processada).
[001487] Em modalidades, o anelossomo descrito no presente documento compreende uma proteína possuindo uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos de ORF1 de Anellovirus da Tabela C2. Em modalidades, o anelossomo descrito no presente documento compreende uma proteína possuindo uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos de ORF1/1 de Anellovirus da Tabela C2. Em modalidades, o anelossomo descrito no presente documento compreende uma proteína possuindo uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos de ORF1/2 de Anellovirus da Tabela C2. Em modalidades, o anelossomo descrito no presente documento compreende uma proteína possuindo uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos de ORF2 de Anellovirus da Tabela C2. Em modalidades, o anelossomo descrito no presente documento compreende uma proteína possuindo uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos de ORF2/2 de Anellovirus da Tabela C2. Em modalidades, o anelossomo descrito no presente documento compreende uma proteína possuindo uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos de ORF2/3 de Anellovirus da Tabela C2. Em modalidades, o anelossomo descrito no presente documento compreende uma proteína possuindo uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos de ORF2t/3 de Anellovirus da Tabela C2. Em modalidades, o anelossomo descrito no presente documento compreende uma proteína possuindo uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos de TAIP de Anellovirus da Tabela C2. Em algumas modalidades, uma molécula ORF1 (por exemplo, compreendida no anelossomo) compreende um polipeptídeo codificado pela sequência de ácidos nucleicos de ORF1 de Anellovirus dos nucleotídeos 501-2489 da sequência de ácidos nucleicos da Tabela B2. Em algumas modalidades, a molécula ORF1 (por exemplo, compreendida no anelossomo) compreende uma proteína ORF1 de Anellovirus da Tabela C2 ou uma sua variante de splice ou variante pós- translacionalmente processada (por exemplo, proteoliticamente processada).
[001488] Em modalidades, o anelossomo descrito no presente documento compreende uma proteína possuindo uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos de ORF1 de Anellovirus da Tabela C3. Em modalidades, o anelossomo descrito no presente documento compreende uma proteína possuindo uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos de ORF1/1 de Anellovirus da Tabela C3. Em modalidades, o anelossomo descrito no presente documento compreende uma proteína possuindo uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos de ORF1/2 de Anellovirus da Tabela C3. Em modalidades, o anelossomo descrito no presente documento compreende uma proteína possuindo uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos de ORF2 de Anellovirus da Tabela C3. Em modalidades, o anelossomo descrito no presente documento compreende uma proteína possuindo uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos de ORF2/2 de Anellovirus da Tabela C3. Em modalidades, o anelossomo descrito no presente documento compreende uma proteína possuindo uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos de ORF2/3 de Anellovirus da Tabela C3. Em modalidades, o anelossomo descrito no presente documento compreende uma proteína possuindo uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos de ORF2t/3 de Anellovirus da Tabela C3. Em modalidades, o anelossomo descrito no presente documento compreende uma proteína possuindo uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos de TAIP de Anellovirus da Tabela C3. Em algumas modalidades, uma molécula ORF1 (por exemplo, compreendida no anelossomo) compreende um polipeptídeo codificado pela sequência de ácidos nucleicos de ORF1 de Anellovirus dos nucleotídeos 572-2758 da sequência de ácidos nucleicos da Tabela B3. Em algumas modalidades, a molécula ORF1 (por exemplo, compreendida no anelossomo) compreende uma proteína ORF1 de Anellovirus da Tabela C3 ou uma sua variante de splice ou variante pós- translacionalmente processada (por exemplo, proteoliticamente processada).
[001489] Em modalidades, o anelossomo descrito no presente documento compreende uma proteína possuindo uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos de ORF1 de Anellovirus da Tabela C4. Em modalidades, o anelossomo descrito no presente documento compreende uma proteína possuindo uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos de ORF1/1 de Anellovirus da Tabela C4. Em modalidades, o anelossomo descrito no presente documento compreende uma proteína possuindo uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos de ORF1/2 de Anellovirus da Tabela C4. Em modalidades, o anelossomo descrito no presente documento compreende uma proteína possuindo uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos de ORF2 de Anellovirus da Tabela C4. Em modalidades, o anelossomo descrito no presente documento compreende uma proteína possuindo uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos de ORF2/2 de Anellovirus da Tabela C4. Em modalidades, o anelossomo descrito no presente documento compreende uma proteína possuindo uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos de ORF2/3 de Anellovirus da Tabela C4. Em modalidades, o anelossomo descrito no presente documento compreende uma proteína possuindo uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos de ORF2t/3 de Anellovirus da Tabela C4. Em modalidades, o anelossomo descrito no presente documento compreende uma proteína possuindo uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos de TAIP de Anellovirus da Tabela C4. Em algumas modalidades, uma molécula ORF1 (por exemplo, compreendida no anelossomo) compreende um polipeptídeo codificado pela sequência de ácidos nucleicos de ORF1 de Anellovirus dos nucleotídeos 581-2884 da sequência de ácidos nucleicos da Tabela B4. Em algumas modalidades, a molécula ORF1 (por exemplo, compreendida no anelossomo) compreende uma proteína ORF1 de Anellovirus da Tabela C4 ou uma sua variante de splice ou variante pós-
translacionalmente processada (por exemplo, proteoliticamente processada).
[001490] Em modalidades, o anelossomo descrito no presente documento compreende uma proteína possuindo uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos de ORF1 de Anellovirus da Tabela C5. Em modalidades, o anelossomo descrito no presente documento compreende uma proteína possuindo uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos de ORF1/1 de Anellovirus da Tabela C5. Em modalidades, o anelossomo descrito no presente documento compreende uma proteína possuindo uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos de ORF1/2 de Anellovirus da Tabela C5. Em modalidades, o anelossomo descrito no presente documento compreende uma proteína possuindo uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos de ORF2 de Anellovirus da Tabela C5. Em modalidades, o anelossomo descrito no presente documento compreende uma proteína possuindo uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos de ORF2/2 de Anellovirus da Tabela C5. Em modalidades, o anelossomo descrito no presente documento compreende uma proteína possuindo uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%,
97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos de ORF2/3 de Anellovirus da Tabela C5. Em modalidades, o anelossomo descrito no presente documento compreende uma proteína possuindo uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos de ORF2t/3 de Anellovirus da Tabela C5. Em modalidades, o anelossomo descrito no presente documento compreende uma proteína possuindo uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos de TAIP de Anellovirus da Tabela C5. Em algumas modalidades, uma molécula ORF1 (por exemplo, compreendida no anelossomo) compreende um polipeptídeo codificado pela sequência de ácidos nucleicos de ORF1 de Anellovirus dos nucleotídeos 614-2911 da sequência de ácidos nucleicos da Tabela B5. Em algumas modalidades, a molécula ORF1 (por exemplo, compreendida no anelossomo) compreende uma proteína ORF1 de Anellovirus da Tabela C5 ou uma sua variante de splice ou variante pós- translacionalmente processada (por exemplo, proteoliticamente processada).
[001491] Em modalidades, o anelossomo descrito no presente documento compreende uma proteína possuindo uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos de ORF1 de Anellovirus da Tabela 2. Em modalidades, o anelossomo descrito no presente documento compreende uma proteína possuindo uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos de ORF1/1 de Anellovirus da Tabela 2. Em modalidades, o anelossomo descrito no presente documento compreende uma proteína possuindo uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos de ORF1/2 de Anellovirus da Tabela 2. Em modalidades, o anelossomo descrito no presente documento compreende uma proteína possuindo uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos de ORF2 de Anellovirus da Tabela 2. Em modalidades, o anelossomo descrito no presente documento compreende uma proteína possuindo uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos de ORF2/2 de Anellovirus da Tabela 2. Em modalidades, o anelossomo descrito no presente documento compreende uma proteína possuindo uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos de ORF2/3 de Anellovirus da Tabela 2. Em modalidades, o anelossomo descrito no presente documento compreende uma proteína possuindo uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos de ORF2t/3 de Anellovirus da Tabela 2. Em algumas modalidades, uma molécula ORF1 (por exemplo, compreendida no anelossomo) compreende um polipeptídeo codificado pela sequência de ácidos nucleicos de ORF1 de Anellovirus dos nucleotídeos 571-2613 da sequência de ácidos nucleicos da Tabela 1.
Em algumas modalidades, a molécula ORF1 (por exemplo, compreendida no anelossomo) compreende uma proteína ORF1 de Anellovirus da Tabela 2 ou uma sua variante de splice ou variante pós- translacionalmente processada (por exemplo, proteoliticamente processada).
[001492] Em modalidades, o anelossomo descrito no presente documento compreende uma proteína possuindo uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos de ORF1 de Anellovirus da Tabela 4. Em modalidades, o anelossomo descrito no presente documento compreende uma proteína possuindo uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos de ORF1/1 de Anellovirus da Tabela 4. Em modalidades, o anelossomo descrito no presente documento compreende uma proteína possuindo uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos de ORF1/2 de Anellovirus da Tabela 4. Em modalidades, o anelossomo descrito no presente documento compreende uma proteína possuindo uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos de ORF2 de Anellovirus da Tabela 4. Em modalidades, o anelossomo descrito no presente documento compreende uma proteína possuindo uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos de ORF2/2 de Anellovirus da Tabela 4. Em modalidades, o anelossomo descrito no presente documento compreende uma proteína possuindo uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos de ORF2/3 de Anellovirus da Tabela 4. Em algumas modalidades, uma molécula ORF1 (por exemplo, compreendida no anelossomo) compreende um polipeptídeo codificado pela sequência de ácidos nucleicos de ORF1 de Anellovirus dos nucleotídeos 729-2972 da sequência de ácidos nucleicos da Tabela 3. Em algumas modalidades, a molécula ORF1 (por exemplo, compreendida no anelossomo) compreende uma proteína ORF1 de Anellovirus da Tabela 4 ou uma sua variante de splice ou variante pós- translacionalmente processada (por exemplo, proteoliticamente processada).
[001493] Em modalidades, o anelossomo descrito no presente documento compreende uma proteína possuindo uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos de ORF1 de Anellovirus da Tabela 6. Em modalidades, o anelossomo descrito no presente documento compreende uma proteína possuindo uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos de ORF1/1 de Anellovirus da Tabela 6. Em modalidades, o anelossomo descrito no presente documento compreende uma proteína possuindo uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos de ORF1/2 de Anellovirus da Tabela 6. Em modalidades, o anelossomo descrito no presente documento compreende uma proteína possuindo uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos de ORF2 de Anellovirus da Tabela 6. Em modalidades, o anelossomo descrito no presente documento compreende uma proteína possuindo uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos de ORF2/2 de Anellovirus da Tabela 6. Em modalidades, o anelossomo descrito no presente documento compreende uma proteína possuindo uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos de ORF2/3 de Anellovirus da Tabela 6. Em modalidades, o anelossomo descrito no presente documento compreende uma proteína possuindo uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos de ORF2t/3 de Anellovirus da Tabela 6. Em algumas modalidades, uma molécula ORF1 (por exemplo, compreendida no anelossomo) compreende um polipeptídeo codificado pela sequência de ácidos nucleicos de ORF1 de Anellovirus dos nucleotídeos 599-2830 da sequência de ácidos nucleicos da Tabela 5. Em algumas modalidades, a molécula ORF1 (por exemplo, compreendida no anelossomo) compreende uma proteína ORF1 de Anellovirus da Tabela 6 ou uma sua variante de splice ou variante pós- translacionalmente processada (por exemplo, proteoliticamente processada).
[001494] Em modalidades, o anelossomo descrito no presente documento compreende uma proteína possuindo uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos de ORF1 de Anellovirus da Tabela 8. Em modalidades, o anelossomo descrito no presente documento compreende uma proteína possuindo uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos de ORF1/1 de Anellovirus da Tabela 8. Em modalidades, o anelossomo descrito no presente documento compreende uma proteína possuindo uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos de ORF1/2 de Anellovirus da Tabela 8. Em modalidades, o anelossomo descrito no presente documento compreende uma proteína possuindo uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos de ORF2 de Anellovirus da Tabela 8. Em modalidades, o anelossomo descrito no presente documento compreende uma proteína possuindo uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos de ORF2/2 de Anellovirus da Tabela 8. Em modalidades, o anelossomo descrito no presente documento compreende uma proteína possuindo uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos de ORF2/3 de Anellovirus da Tabela 8. Em algumas modalidades, uma molécula ORF1 (por exemplo, compreendida no anelossomo) compreende um polipeptídeo codificado pela sequência de ácidos nucleicos de ORF1 de Anellovirus dos nucleotídeos 586-2928 da sequência de ácidos nucleicos da Tabela 7. Em algumas modalidades, a molécula ORF1 (por exemplo, compreendida no anelossomo) compreende uma proteína ORF1 de Anellovirus da Tabela 8 ou uma sua variante de splice ou variante pós- translacionalmente processada (por exemplo, proteoliticamente processada).
[001495] Em modalidades, o anelossomo descrito no presente documento compreende uma proteína possuindo uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos de ORF1 de Anellovirus da Tabela 10. Em modalidades, o anelossomo descrito no presente documento compreende uma proteína possuindo uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos de ORF1/1 de Anellovirus da Tabela 10. Em modalidades, o anelossomo descrito no presente documento compreende uma proteína possuindo uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos de ORF1/2 de Anellovirus da Tabela 10. Em modalidades, o anelossomo descrito no presente documento compreende uma proteína possuindo uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos de ORF2 de Anellovirus da Tabela 10. Em modalidades, o anelossomo descrito no presente documento compreende uma proteína possuindo uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%,
97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos de ORF2/2 de Anellovirus da Tabela 10. Em modalidades, o anelossomo descrito no presente documento compreende uma proteína possuindo uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos de ORF2/3 de Anellovirus da Tabela 10. Em modalidades, o anelossomo descrito no presente documento compreende uma proteína possuindo uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos de ORF2t/3 de Anellovirus da Tabela 10. Em algumas modalidades, uma molécula ORF1 (por exemplo, compreendida no anelossomo) compreende um polipeptídeo codificado pela sequência de ácidos nucleicos de ORF1 de Anellovirus dos nucleotídeos 588-2873 da sequência de ácidos nucleicos da Tabela 9. Em algumas modalidades, a molécula ORF1 (por exemplo, compreendida no anelossomo) compreende uma proteína ORF1 de Anellovirus da Tabela 10 ou uma sua variante de splice ou variante pós- translacionalmente processada (por exemplo, proteoliticamente processada).
[001496] Em modalidades, o anelossomo descrito no presente documento compreende uma proteína possuindo uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos de ORF1 de Anellovirus da Tabela 12. Em modalidades, o anelossomo descrito no presente documento compreende uma proteína possuindo uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos de ORF1/1 de Anellovirus da Tabela 12. Em modalidades, o anelossomo descrito no presente documento compreende uma proteína possuindo uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos de ORF1/2 de Anellovirus da Tabela 12. Em modalidades, o anelossomo descrito no presente documento compreende uma proteína possuindo uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos de ORF2 de Anellovirus da Tabela 12. Em modalidades, o anelossomo descrito no presente documento compreende uma proteína possuindo uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos de ORF2/2 de Anellovirus da Tabela 12. Em modalidades, o anelossomo descrito no presente documento compreende uma proteína possuindo uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos de ORF2/3 de Anellovirus da Tabela 12. Em modalidades, o anelossomo descrito no presente documento compreende uma proteína possuindo uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos de ORF2t/3 de Anellovirus da Tabela 12. Em algumas modalidades, uma molécula ORF1 (por exemplo, compreendida no anelossomo) compreende um polipeptídeo codificado pela sequência de ácidos nucleicos de ORF1 de Anellovirus dos nucleotídeos 599-2839 da sequência de ácidos nucleicos da Tabela 11.
Em algumas modalidades, a molécula ORF1 (por exemplo, compreendida no anelossomo) compreende uma proteína ORF1 de Anellovirus da Tabela 12 ou uma sua variante de splice ou variante pós- translacionalmente processada (por exemplo, proteoliticamente processada).
[001497] Em modalidades, o anelossomo descrito no presente documento compreende uma proteína possuindo uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos de ORF1 de Anellovirus da Tabela 14. Em modalidades, o anelossomo descrito no presente documento compreende uma proteína possuindo uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos de ORF1/1 de Anellovirus da Tabela 14. Em modalidades, o anelossomo descrito no presente documento compreende uma proteína possuindo uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos de ORF1/2 de Anellovirus da Tabela 14. Em modalidades, o anelossomo descrito no presente documento compreende uma proteína possuindo uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos de ORF2 de Anellovirus da Tabela 14. Em modalidades, o anelossomo descrito no presente documento compreende uma proteína possuindo uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos de ORF2/2 de Anellovirus da Tabela 14. Em modalidades, o anelossomo descrito no presente documento compreende uma proteína possuindo uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos de ORF2/3 de Anellovirus da Tabela 14. Em algumas modalidades, uma molécula ORF1 (por exemplo, compreendida no anelossomo) compreende um polipeptídeo codificado pela sequência de ácidos nucleicos de ORF1 de Anellovirus dos nucleotídeos 599-2896 da sequência de ácidos nucleicos da Tabela 13. Em algumas modalidades, a molécula ORF1 (por exemplo, compreendida no anelossomo) compreende uma proteína ORF1 de Anellovirus da Tabela 14 ou uma sua variante de splice ou variante pós- translacionalmente processada (por exemplo, proteoliticamente processada).
[001498] Em modalidades, o anelossomo descrito no presente documento compreende uma proteína possuindo uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos de ORF1 de Anellovirus da Tabela 16. Em modalidades, o anelossomo descrito no presente documento compreende uma proteína possuindo uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos de ORF1/1 de Anellovirus da Tabela 16. Em modalidades, o anelossomo descrito no presente documento compreende uma proteína possuindo uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos de ORF1/2 de Anellovirus da Tabela 16. Em modalidades, o anelossomo descrito no presente documento compreende uma proteína possuindo uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos de ORF2 de Anellovirus da Tabela 16. Em modalidades, o anelossomo descrito no presente documento compreende uma proteína possuindo uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos de ORF2/2 de Anellovirus da Tabela 16. Em modalidades, o anelossomo descrito no presente documento compreende uma proteína possuindo uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos de ORF2/3 de Anellovirus da Tabela 16. Em algumas modalidades, uma molécula ORF1 (por exemplo, compreendida no anelossomo) compreende um polipeptídeo codificado pela sequência de ácidos nucleicos de ORF1 de Anellovirus dos nucleotídeos 612-2612 da sequência de ácidos nucleicos da Tabela 15. Em algumas modalidades, a molécula ORF1 (por exemplo, compreendida no anelossomo) compreende uma proteína ORF1 de Anellovirus da Tabela 16 ou uma sua variante de splice ou variante pós- translacionalmente processada (por exemplo, proteoliticamente processada).
[001499] Em modalidades, o anelossomo descrito no presente documento compreende uma proteína possuindo uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos de ORF1 de Anellovirus da Tabela 18. Em modalidades, o anelossomo descrito no presente documento compreende uma proteína possuindo uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos de ORF1/1 de Anellovirus da Tabela 18. Em modalidades, o anelossomo descrito no presente documento compreende uma proteína possuindo uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos de ORF1/2 de Anellovirus da Tabela 18. Em modalidades, o anelossomo descrito no presente documento compreende uma proteína possuindo uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos de ORF2 de Anellovirus da Tabela 18. Em modalidades, o anelossomo descrito no presente documento compreende uma proteína possuindo uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos de ORF2/2 de Anellovirus da Tabela 18. Em modalidades, o anelossomo descrito no presente documento compreende uma proteína possuindo uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos de ORF2/3 de Anellovirus da Tabela 18. Em algumas modalidades, uma molécula ORF1 (por exemplo, compreendida no anelossomo) compreende um polipeptídeo codificado pela sequência de ácidos nucleicos de ORF1 de Anellovirus dos nucleotídeos 432-2453 da sequência de ácidos nucleicos da Tabela 17. Em algumas modalidades, a molécula ORF1 (por exemplo, compreendida no anelossomo) compreende uma proteína ORF1 de Anellovirus da Tabela 18 ou uma sua variante de splice ou variante pós-
translacionalmente processada (por exemplo, proteoliticamente processada).
[001500] Em algumas modalidades, o polipeptídeo descrito no presente documento compreende uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos de ORF1 de Anellovirus descrita no presente documento. Em modalidades, o polipeptídeo descrito no presente documento compreende uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos de ORF1 de Anellovirus da Tabela 2. Em modalidades, o polipeptídeo descrito no presente documento compreende uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos de ORF1 de Anellovirus da Tabela 4. Em modalidades, o polipeptídeo descrito no presente documento compreende uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos de ORF1 de Anellovirus da Tabela 6. Em modalidades, o polipeptídeo descrito no presente documento compreende uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos de ORF1 de Anellovirus da Tabela 8. Em modalidades, o polipeptídeo descrito no presente documento compreende uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos de ORF1 de Anellovirus da Tabela 10. Em modalidades, o polipeptídeo descrito no presente documento compreende uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos de ORF1 de Anellovirus da Tabela 12. Em modalidades, o polipeptídeo descrito no presente documento compreende uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos de ORF1 de Anellovirus da Tabela 14. Em modalidades, o polipeptídeo descrito no presente documento compreende uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos de ORF1 de Anellovirus da Tabela 16. Em modalidades, o polipeptídeo descrito no presente documento compreende uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos de ORF1 de Anellovirus da Tabela 18. Em modalidades, o polipeptídeo descrito no presente documento compreende uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos de ORF1 de Anellovirus da Tabela A2. Em modalidades, o polipeptídeo descrito no presente documento compreende uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos de ORF1 de Anellovirus da Tabela A4. Em modalidades, o polipeptídeo descrito no presente documento compreende uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos de ORF1 de Anellovirus da Tabela A6. Em modalidades, o polipeptídeo descrito no presente documento compreende uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos de ORF1 de Anellovirus da Tabela A8. Em modalidades, o polipeptídeo descrito no presente documento compreende uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos de ORF1 de Anellovirus da Tabela A10. Em modalidades, o polipeptídeo descrito no presente documento compreende uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos de ORF1 de Anellovirus da Tabela A12. Em modalidades, o polipeptídeo descrito no presente documento compreende uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos de ORF1 de Anellovirus da Tabela C1. Em modalidades, o polipeptídeo descrito no presente documento compreende uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos de ORF1 de Anellovirus da Tabela C2. Em modalidades, o polipeptídeo descrito no presente documento compreende uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos de ORF1 de Anellovirus da Tabela C3. Em modalidades, o polipeptídeo descrito no presente documento compreende uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos de ORF1 de Anellovirus da Tabela C4. Em modalidades, o polipeptídeo descrito no presente documento compreende uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos de ORF1 de Anellovirus da Tabela C5.
[001501] Em algumas modalidades, o polipeptídeo descrito no presente documento compreende uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com uma molécula ORF1 codificada por um ácido nucleico de ORF1 de Anellovirus descrito no presente documento. Em modalidades, o polipeptídeo descrito no presente documento compreende uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com uma molécula ORF1 codificada por um ácido nucleico de ORF1 de Anellovirus como listado na Tabela 1. Em modalidades, o polipeptídeo descrito no presente documento compreende uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com uma molécula ORF1 codificada por um ácido nucleico de ORF1 de Anellovirus como listado na Tabela 3. Em modalidades, o polipeptídeo descrito no presente documento compreende uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com uma molécula ORF1 codificada por um ácido nucleico de ORF1 de Anellovirus como listado na Tabela 5. Em modalidades, o polipeptídeo descrito no presente documento compreende uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com uma molécula ORF1 codificada por um ácido nucleico de ORF1 de Anellovirus como listado na Tabela 7. Em modalidades, o polipeptídeo descrito no presente documento compreende uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com uma molécula ORF1 codificada por um ácido nucleico de ORF1 de Anellovirus como listado na Tabela 9. Em modalidades, o polipeptídeo descrito no presente documento compreende uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com uma molécula ORF1 codificada por um ácido nucleico de ORF1 de Anellovirus como listado na Tabela 11. Em modalidades, o polipeptídeo descrito no presente documento compreende uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com uma molécula ORF1 codificada por um ácido nucleico de ORF1 de Anellovirus como listado na Tabela 13. Em modalidades, o polipeptídeo descrito no presente documento compreende uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com uma molécula ORF1 codificada por um ácido nucleico de ORF1 de Anellovirus como listado na Tabela 15. Em modalidades, o polipeptídeo descrito no presente documento compreende uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com uma molécula ORF1 codificada por um ácido nucleico de ORF1 de Anellovirus como listado na Tabela 17. Em modalidades, o polipeptídeo descrito no presente documento compreende uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com uma molécula ORF1 codificada por um ácido nucleico de ORF1 de Anellovirus como listado na Tabela A1. Em modalidades, o polipeptídeo descrito no presente documento compreende uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com uma molécula ORF1 codificada por um ácido nucleico de ORF1 de Anellovirus como listado na Tabela A3. Em modalidades, o polipeptídeo descrito no presente documento compreende uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com uma molécula ORF1 codificada por um ácido nucleico de ORF1 de Anellovirus como listado na Tabela A5. Em modalidades, o polipeptídeo descrito no presente documento compreende uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com uma molécula ORF1 codificada por um ácido nucleico de ORF1 de Anellovirus como listado na Tabela A7. Em modalidades, o polipeptídeo descrito no presente documento compreende uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com uma molécula ORF1 codificada por um ácido nucleico de ORF1 de Anellovirus como listado na Tabela A9. Em modalidades, o polipeptídeo descrito no presente documento compreende uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com uma molécula ORF1 codificada por um ácido nucleico de ORF1 de Anellovirus como listado na Tabela A11. Em modalidades, o polipeptídeo descrito no presente documento compreende uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com uma molécula ORF1 codificada por um ácido nucleico de ORF1 de Anellovirus como listado na Tabela B1. Em modalidades, o polipeptídeo descrito no presente documento compreende uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com uma molécula ORF1 codificada por um ácido nucleico de ORF1 de Anellovirus como listado na Tabela B2. Em modalidades, o polipeptídeo descrito no presente documento compreende uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com uma molécula ORF1 codificada por um ácido nucleico de ORF1 de Anellovirus como listado na Tabela B3. Em modalidades, o polipeptídeo descrito no presente documento compreende uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com uma molécula ORF1 codificada por um ácido nucleico de ORF1 de Anellovirus como listado na Tabela B4. Em modalidades, o polipeptídeo descrito no presente documento compreende uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com uma molécula ORF1 codificada por um ácido nucleico de ORF1 de Anellovirus como listado na Tabela B5.
[001502] Em algumas modalidades, o polipeptídeo compreende uma sequência de aminoácidos (por exemplo, uma sequência de ORF1, ORF1/1, ORF1/2, ORF2, ORF2/2, ORF2/3 ou ORF2t/3) como mostrado em qualquer uma das Tabelas 2, 4, 6, 8, 10, 12, 14, 16 ou 18 ou uma sequência possuindo pelo menos 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a mesma. Tabela A1. Nova sequência de ácidos nucleicos de Anellovirus (Alphatorquevirus) Nome TTV-RTx1 Gênero/Clado Alphatorquevirus, Clado 6 Número de Acesso SRR2167793 Sequência Total: 3648 pb 1 10 20 30 40 50 | | | | | |
CGTCACTAACCACGTGACTCCCACAGGCCAACCACAGTGTACGTGATTCA CTTCCTGGGAGTGGTTTACATTATAATATAAGCAACTGCACTTCCGAATG GCTGAGTTTTCCACGCCCGTCCGCAGCGAGAACACCACGGAGGGGAGTCC GCGCGTCCCGTGGGCGGGTGCCGAAGGTGAGTTTACACACCGCAGTCAAG GGGCAATTCGGGCACGGGACTGGCCGGGCTATGGGCAAGGCTCTTAAAAA GCTATGTTTCTTGGTAGGCCGTACCGAAAGAAAAGGAAACTGCTACTGCT ACCACTGCATTCTACACCGAAAACTAGCCGGGTTATGAGCTGGTCTAGGC CTGTACATAATGCCACAGGCATTGAAAGAAACTGGTGGGAGTCCTGTCTT AGATCCCACGCAAGTTCTTGTGGCTGCGGTAATTTTGTTAATCATATTAA TGTACTGGCTAATCGGTATGGCTTTGCTGGTTCCACGGAGACGCCGGGTA ATCCTCGGCCGAGGCCCCCGGTACTGAGCTCCACCACCAGCACTCCTACC GATCAATCCAGACCAGCTCTACCATGGCATGGGGATACTGGTGGAGAAGG CGCTTCTGGAGACCCCGCAGGAGATGGAGAACGTGGCGCCGCAGAAGGAG ACTACGGCCCAGAAGATCTAGACGCACTTTTCGACGCACTCGACGAAGAG TAAGGAGGCGACGGTGGGGGAGGCGTGCACGCAGGCGGGGATGGCGACGC AGGACTTATATTAGAGCCAGGCGACGCAGGAGACGAAAAAGACTTGTACT GACTCAGTGGCATCCCGCAGTTAGAAGAAAATGTAAAATTACAGGCTACA TGCCTATAGTATACTGTGGACATGGCAGAGCTAGTTTTAACTATGCCTGG CACTCTGATGACTGTATAAAACAACCACTACCCTTTGGAGGCTCACTATC TACAGTGTCCTTCAACCTAAAAGTACTATTTGACGAAAACCAAAGAGGAC TAAACAAATGGAGCTACCCAAATGACCAACTAGACCTCGCCAGATACAAA GGCTGTAGACTAACATTTTACAGAAAAAAAAACACAGACTACATAGCTCA ATATGACATATCAGAACCTTATCAACTAGACAAATATAGCTGTGCAAACT ATCACCCCTCAAAAATGATGTTTGCAAAAAACAAAATTTTAATTCCTAGC TATGATACAAAACCTAGAGGCAGACAAAGAGTTAGAGTTAGAATAGGGCC CCCTAAACTATTTACAGACAAGTGGTACAGTCAATCAGACTTATGCAAGG TAAACCTTGTGTCACTTGCGGTTTCTGCGGCTTCCTTTCTCCACCCATTC GGCTCACCACAAACTGCCAACTTTTGTGCAACCTTCCAGGTGCTGCAACC GTTCTACTACCAGGCTATAGGCATTAGTTCTACAAAACACTCAGAAGTTA TAGACATTTTATATAAGAAAAATACATACTGGCAAAGCAACATTACCTCT TGGTTTTTAACTAATGTTAAAAACCCAAAAAATATGTCCACAAAAATGTT TGAGGACATTAATGTTAAATCAAACAAAGACAGTAATTATGACTGGTTTC CATTTACCCCATACACTACAGAAAACTATTCAAAAATTCAAAATGCAGCT CAAGAATACTGGAAATATTTAACTAGTGACCACCCACAAGCTACTAATAG CAATGAAGGCCTAGTACAACCATGGACTAATGCCACTATAAAACAATATG AATACCACCTCGGTATGTTTAGTCCTATATTTATAGGACCTACCAGAGCT AAAACTAAATTTAAAACAGCATACTTTGACTGCACTTATAACCCACTACT AGACAAAGGAATGGGAAACAGAATATGGTATCAATACGCAACCAAAGCTG ACACACAAATATCAAAAACAGGGTGCTACTGCATGTTAGAAGACATTCCA ATATATGCAGCATTTTATGGATACGTAGACTTTATAGAAATGGAAATAGG TAAAGGACAAGACATTAAAGAGAACGGACTTATTTGCTGCATATGTAGAT ACACAGACCCCCCAATGTACAATGAACAACATCCAGACATGGGATTTGTA TTTTATAACACTAACTTTGGAAATGGAAAATGGATAGATGGACGGGGCGA CATACCTACTTACTGGATGCAAAGATGGAGACCTGTTGTATTATTTCAAA CTGATGTTATTAGAGACTTAGTAGAAACTGGACCTTTTAGTTACAAAGAT GACCTAGCAAATACCTCACTGACTATGAAATATGAATTCTATTTTACCTG GGGCGGAAACCAGGCGTACCACCAGACAATCAAAAACCCTTGTAAAGACG AAGGTACCGGACCCCATAGACAGCCTAGAGACGTACAAGTTACGGACCCG ACAACCGTGGGACCTGAATATGTGTTCCACGCGTGGGACTGGAGACGGGG CTTCCTTAGCGAGCGAGCTCTCAGACGCATGTTCGAAAAACCTCTCAACT ATGATGAGTATTCTAAAAAACCAAAAAGACCTAGAATATTTCCTCCAACA GAAACAGAGTCCCGAAACCAAGAGCTCGAAGAAAGCTCGCTTTCAGAGGA AGAAAAGTCGCTACTCTCCACAGAAGAGATCCAGAAAGAGGAGATACAGC GACAGTTCAAGCGACAGCTCAAGCGACAGCTGCGCCTCGGGCAGCAGCTC AAACTCCTCCAACAACAACTCCTCAAGACGCAAGCGGGCCTGCACCTAAA CCCCCTTTCATATTTCCCGCAATAAATAAAGTGTACCTGTTCCCAGACAG AGCTCCAAAACCTAAACCCACCTCTGGAGACTGGGAAACAGAGTATGCAG CTTGCAGTGCCTTTGACAGACCCGCTAGAACCAACCTTAGCTCACCCCCT TACTACCCAGGAGTACCTACTCCCTGGCAAGTAAAATTCAGCCTTAAATT TCAATAAAGTGCATTTTTACTACAGCTGGGCCGTGGGAGTTTCACTTGTC GGTGTCTACCTCTTAAGGTCACTAAGCACTCCGAGCGCAGCGAGGAGTGC GACCCTTAACCCTGGGTCAACGCCTTCGGAGCCGCGCGCTACGCCTTCGG CTGCGCGCGGCACCTCAGACCCCCGCTCGTGCTGACGCGCTTGCGCGCGT CAGACCACTTCGGGCTCGCGGGGGTCGGGAACTTTGCTAACAGACTCCGA GGTGCCATTGGACACAGAGTGGGCGTTCAGCAACGAAAGTGAGTGGGGCC AGACTTCGCCATAAGGCCTTTATCTTCTTGCCATTTGTCAGTATAAGGGG TTGCCATAGGCTTCGGCCTCAATTTTAGGCCTTCCGGACTACCAAAATGG CCGATTTAGTGACGTCACGGCGGCCATTTTAAGTAAGGCGGAAGTAACTC CACTATTTACAAAATGGCGGCGGAGCACTTCCGGCTTGCCCAAAATGGCG GCAAAAAACATCCGGGTCAAAGGTCGTTACCACGTCACAAGTCACGTGGG AGGGTGGTGCTGTAAACCCGGAAGCAATCCTCTCACGTGGCTAGTCACGT GACTAACACGTCACACCCGCCATTTTGTTTTACAAAATGGCCGACTTCCT
TCCGCTTTTTTAAAAATAACGGCTCAGCGGCGGCGCGCGCGCTACGCG (SEQ ID NO: 830) Anotações: Domínio Putativo Gama base Caixa TATA 77 – 81 Elemento Iniciador 95-110 Local de Início Transcricional 105 Domínio Conservado 5´ UTR 165 - 235 ORF2 335 - 703 ORF2/2 335 – 699 ; 2326 – 2759 ORF2/3 335 – 699 ; 2552 – 2957 ORF2t/3 335-465 ; 2552 - 2957 ORF1 574 – 2775 ORF1/1 574 – 699 ; 2326 – 2775 ORF1/2 574 – 699 ; 2552 – 2759 Região de três grelhas de leitura aberta 2535 – 2746 Sinal de Poli(A) 2953 - 2958 Região rica em GC** 3620 – 3648 Tabela A2. Novas sequências de aminoácidos de Anellovirus (Alphatorquevirus, Clado 6) TTV-RTx1 (Clado 6 de Alphatorquevirus) ORF2 MSWSRPVHNATGIERNWWESCLRSHASSCGCGNFVNHINVLANRYGFAG
STETPGNPRPRPPVLSSTTSTPTDQSRPALPWHGDTGGEGASGDPAGDGE RGAAEGDYGPEDLDALFDALDEE (SEQ ID NO: 831) ORF2/2 MSWSRPVHNATGIERNWWESCLRSHASSCGCGNFVNHINVLANRYGFAG
STETPGNPRPRPPVLSSTTSTPTDQSRPALPWHGDTGGEGASGDPAGDGE RGAAEGDYGPEDLDALFDALDEEQSKTLVKTKVPDPIDSLETYKLRTRQPW DLNMCSTRGTGDGASLASELSDACSKNLSTMMSILKNQKDLEYFLQQKQSP ETKSSKKARFQRKKSRYSPQKRSRKRRYSDSSSDSSSDSCASGSSSNSSN
TTV-RTx1 (Clado 6 de Alphatorquevirus) NNSSRRKRACT (SEQ ID NO: 832) ORF2/3 MSWSRPVHNATGIERNWWESCLRSHASSCGCGNFVNHINVLANRYGFAG
STETPGNPRPRPPVLSSTTSTPTDQSRPALPWHGDTGGEGASGDPAGDGE RGAAEGDYGPEDLDALFDALDEENRVPKPRARRKLAFRGRKVATLHRRDP ERGDTATVQATAQATAAPRAAAQTPPTTTPQDASGPAPKPPFIFPAINKVYL
FPDRAPKPKPTSGDWETEYAACSAFDRPARTNLSSPPYYPGVPTPWQVKF SLKFQ (SEQ ID NO: 833) ORF2t/3 MSWSRPVHNATGIERNWWESCLRSHASSCGCGNFVNHINVLANRNRVPK
PRARRKLAFRGRKVATLHRRDPERGDTATVQATAQATAAPRAAAQTPPTTT
PQDASGPAPKPPFIFPAINKVYLFPDRAPKPKPTSGDWETEYAACSAFDRPA RTNLSSPPYYPGVPTPWQVKFSLKFQ (SEQ ID NO: 834) ORF1 MAWGYWWRRRFWRPRRRWRTWRRRRRLRPRRSRRTFRRTRRRVRRRR
WGRRARRRGWRRRTYIRARRRRRRKRLVLTQWHPAVRRKCKITGYMPIVY CGHGRASFNYAWHSDDCIKQPLPFGGSLSTVSFNLKVLFDENQRGLNKWS YPNDQLDLARYKGCRLTFYRKKNTDYIAQYDISEPYQLDKYSCANYHPSKM MFAKNKILIPSYDTKPRGRQRVRVRIGPPKLFTDKWYSQSDLCKVNLVSLAV SAASFLHPFGSPQTANFCATFQVLQPFYYQAIGISSTKHSEVIDILYKKNTYW QSNITSWFLTNVKNPKNMSTKMFEDINVKSNKDSNYDWFPFTPYTTENYSKI QNAAQEYWKYLTSDHPQATNSNEGLVQPWTNATIKQYEYHLGMFSPIFIGP TRAKTKFKTAYFDCTYNPLLDKGMGNRIWYQYATKADTQISKTGCYCMLEDI PIYAAFYGYVDFIEMEIGKGQDIKENGLICCICRYTDPPMYNEQHPDMGFVFY NTNFGNGKWIDGRGDIPTYWMQRWRPVVLFQTDVIRDLVETGPFSYKDDL ANTSLTMKYEFYFTWGGNQAYHQTIKNPCKDEGTGPHRQPRDVQVTDPTT VGPEYVFHAWDWRRGFLSERALRRMFEKPLNYDEYSKKPKRPRIFPPTETE
SRNQELEESSLSEEEKSLLSTEEIQKEEIQRQFKRQLKRQLRLGQQLKLLQQ QLLKTQAGLHLNPLSYFPQ (SEQ ID NO:835) ORF1/1 MAWGYWWRRRFWRPRRRWRTWRRRRRLRPRRSRRTFRRTRRRTIKNPC
KDEGTGPHRQPRDVQVTDPTTVGPEYVFHAWDWRRGFLSERALRRMFEK
PLNYDEYSKKPKRPRIFPPTETESRNQELEESSLSEEEKSLLSTEEIQKEEIQ RQFKRQLKRQLRLGQQLKLLQQQLLKTQAGLHLNPLSYFPQ (SEQ ID NO: 836) ORF1/2 MAWGYWWRRRFWRPRRRWRTWRRRRRLRPRRSRRTFRRTRRRKQSPE
TKSSKKARFQRKKSRYSPQKRSRKRRYSDSSSDSSSDSCASGSSSNSSNN NSSRRKRACT (SEQ ID NO: 837)
Tabela A3. Nova sequência de ácidos nucleicos de Anellovirus (Alphatorquevirus) Nome TTV-RTx2 Gênero/Clado Alphatorquevirus, Clado 6 Número de Acesso SRR3479021 Sequência Total: 3704 pb 1 10 20 30 40 50 | | | | | |
CCCCGAAGTCCGTCACTAACCACGTGACTCCCACAGGCCAATCAGATGCT ATGTCGTGCACTTCCTGGGCTGTGTCTACGTCCTCATATAAGTAACTGCA CTTCCGAATGGCTGAGTTTTCCACGCCCGTCCGCAGCGGCAGCACCACGG AGGGTGATCCCCGCGTCCCGTGGGCGGGTGCCGGAGGTGAGTTTACACAC CGCAGTCAAGGGGCAATTCGGGCACGGGACTGGCCGGGCTATGGGCAAGG CTCTTAAAAAGCTATGTTCTTCGGTAGGTGCTGGAGAAAGAAAAGGAAAG TGCTTCTGCAAGATCTGTCAACTCCACCGAAAAAACCTGCTATGAGTGTG TGGCTTCCTCCCATAGACAATGTTACCGAGCGTGAGAGGAGCTGGCTCTC TAGCATTCTTCAGTCTCACAGAGCTTTTTGTGGGTGCCATGATGCTATCT ATCATCTTAGCAGTCTGGCTGCTCGCTTTAATATGCAACCAGGGCCGTCG CCGGGTGGTGATTCTAGGCCGCCGCGACCGCCACTAAGACGCCTGCCCGC GCTCCCGGGTCCCAGAGACCCCCCTAGCGACACCAACAACCGCAGGTCAT GGCCTACTGGGGATGGTGGAGACGGAGGCGCTGGCCAAGGCGCAGGTGGA GGCGCTACCGCTACCGAAGAAGACTACCGCGCCGAAGACCTAGACGAGCT GTACGCCGCCCTCGAAGGAGACGAGTAAGGAGGCGCCGCGGTAGGGGGTG GTACAGAGGGCGACGCTACTCCCGCAGACGGTACAGACGTAGATATGTGA GGCGAAAGAGAAAGACTCTAGTTTGGAGACAGTGGCAGCCTCAAAATATC AGAAAATGCAGGATCAGGGGCATAATTCCCATCCTGATATGCGGACACGG GAGGGGGGCCAGAAACTATGCGCTCCACAGCGACGACATAACCCCCCAGA ACACCCCCTTCGGGGGAGGACTGAGCACCACCTCCTGGAGCCTAAAAGTG CTATATGACCAGCACACCAGGGGACTCAACAGGTGGTCTGCCAGTAACGA GAGCCTAGACCTTGCCAGATACAATGGCTGTAGTTTCACTTTCTACAGAG ACAAAAAGACTGACTTTATAGTGACCTATGACACCTCTGCTCCCTACAAA CTAGACAAATACAGCTCCCCCAGCTACCACCCAGGGTCCATGATGCTCAT GACAAAACACAAAATCCTGATCCCCAGTTTTGACACAAAACCCAAAGGTC CTGCCAAAATTAGAGTCAGAATCAAGCCCCCCAAAATGTTCTTAGATAAA TGGTACACTCAAGACGACCTCTGTTCCGTTAATCTTGTGTCACTTGCGGT TAGCGCAGCTTCCTTTACACATCCGTTCTGCCCACCACTAACTGACACTC CTTGTGTAACGCTGCAGGTGTTGAAAGACTTCTACTACACAACCATAGGC TACTCCTCTAATGCAGACAAAGTAGAGTCTGTATTCACTAACACTCTCTA CAAACACTGCTGCTACTATCAGTCCTTTCTCACCACTCAATTTATAGCCA AAATCACTCGCACACCAGATGGACAACCAGTAGCCACATTCTCTCCTCCT ACCTCTTTCCCTGGCACAACTGTAACAAAAAGTTCCATAGAATCATTTAA CCAATGGGTAACTTCCACAGGTACAAGTGGCTGGCTAACAAATGCAAACC AACACTTTCATTTCTGTAACTATAAACCAGATGCCACAAAGCTAAAATGG CTCAGACAGTACTACTTTGACTGGGAAACATACAAATTAGCAGATGTAAA GCCAGACGGCCTTACACCCTCAGTAAACTGGTATGAGTACAGAATAGGCC TCTTTAGTCCTATTTTCCTGAGCCCCTTCAGATCTAGCAGTCTAGACTTT CCCAGAGCCTACCAGGATGTGAACTACAACCCCCTGGTAGACAAAGGAGT GGGCAACATCATATGGTTCCAATACAACACAAAACCAGACACACAGCTGT CAGTACCCAGCTGCAAGTGTGTCATAGAAGACAAACCCCTATGGGCAGCC TTCTATGGCTACAGTGACTTTGTACAACAAGAGATAGGAGACTACACAGA CGCAGAGGCCGTGGGCTTCGTCTGTGTCATCTGTCCATACACCAAACCCC CTCTAAAAAACCCAGACAACCCCATGCAAGGGTTCATATTCTATGACAGC CTTTTTGGCAATGGCAAGTGGATAGATGGCACGGGGCACGTCCCCCTTTA CTGGCAGAGCAGGTGGAGGCCAGAGATGCTCTTCCAAGAAAACACCATGA GAGACATCACACTATCTGGGCCCTTCAGCTACAAGGACGACTATAAGAAC TGTGTACTGACTTGCAAATACAAATTTAACTTTCGATTCGGGGGCAATCT TCTCCACGAACAGACGATCAGAAACCCATGCCCCACGGACGGACATCCCA GTACCGGTAGACAGCCTAGAGACGTACAAGTGGTTGACCCGATCAAAGTG GGCCCCCGGTTCGTGTTCCACTCCTGGGACTGGCGCAGAGGCTACCTTAG CCCAGCAGCTCTCAAAAGAATTGGAGAGCAACCGCTCGATTATGAAGCTT ATTCGTACCGCCCAAAGAGACCTAGAATCTTTCCTCCCACAGAAGGAGAC CAGCTCGCCCGAAGTCGAGAAGAAGACTCATTTTCAGAGGAAGAAAGTCC CCATATCTCGTTCGAAGAGGGGCAGGAACCGAAAGCCCAGGCGGTACAGC AGCACCTCCTCCGACACCTCAGAAAGCAGCGAGAACTCCGAAAGCGACTC CGAGCCCTGTTCCAAAGCCTCCAAAAGACGCAGGCGGGTCTCCACGTAAA TCCATTATTATTCAACCAGCCTGCAATCAGGTTCTGATGTTCCCAGAGAT GGGGCCTAAGCCAGCTCCCACTGCCCAAGACTGGCAGTGCGAATACGAGA CATGTAAGCACTGGGATAGACCCCCCAGAAAGTTTCTCACAGACCCCCCT TTCTATCCCTGGGCCCCTACTACTTACAATGTATCTTTCAAGCTAAACTT CAAATAAACTAGGCCGTGGGAGTCTCACTTGTCGGTGTCTACCTCTTAAG GTCACTAAGCACTCCGAGCGTCAGCGAGGAGTGCGACCCTTCCCCCTGGT GCAACGCCCTCGGCGGCCGCGCGCTACGCCTTCGGCTGCGCGCGGCACCT CGGACCCCCGCTCGTGCTGACGCGCTCGCGCGCGTCAGACCACTTCGGGC TCGCGGGGGTCGGGAAATTTGCTAAACAGACTCCGAGTTGCCATTGGACA CAGGAGCTGTGAATCAGTAACGAAAGTGAGTGGGGCCAGACTTCGCCATA AGGCCTTTATCTTCTTGCCATTTGTCCGTGAGGAGGGGTCGCCAAGACGC GGACCCCGTTTTCGGACCTTCCGAACTACCAAAATGGCCGATTCAGTGAC GTCACGGCAGCCATTTTGTGTAAGCACCGCCCAGGACAGACGTCACAGTT CAAAGGTCATCCTCGAGCGGAACTTACAGAAAATGGCGGTCAATTGCTTC CGGGTCAAAGGTCACGCCTACGTCATAAGTCACGTGGTGGAGGCTACTGC GCATACACGGAAGTAGGCCCCGCCACGTGACCGACCACGTGGGTGCTGCG
TCACGGCCGCCATTTTGTATCACAAAATGGCCGACTTCCTTCCTCTTTTT CAAA (SEQ ID NO: 838) Anotações: Domínio Putativo Gama base Caixa TATA 87 – 91 Elemento Iniciador 105-120 Local de Início Transcricional 115 Domínio Conservado 5´ UTR 175 - 245 ORF2 342 - 728 ORF2/2 342 – 724 ; 2414 – 2849 ORF2/3 342 – 724 ; 2643 – 3057 ORF1 599 – 2887 ORF1/1 599 – 724 ; 2414 – 2887 ORF1/2 599 – 724 ; 2643 – 2849 Região de três grelhas de leitura aberta 2626 – 2846 Sinal de Poli(A) 3052 - 3058 Tabela A4. Novas sequências de aminoácidos de Anellovirus (Alphatorquevirus, Clado 6) TTV-RTx2 (Clado 6 de Alphatorquevirus) ORF2 MSVWLPPIDNVTERERSWLSSILQSHRAFCGCHDAIYHLSSLAARFNMQPG
PSPGGDSRPPRPPLRRLPALPGPRDPPSDTNNRRSWPTGDGGDGGAGQG AGGGATATEEDYRAEDLDELYAALEGDE (SEQ ID NO: 839) ORF2/2 MSVWLPPIDNVTERERSWLSSILQSHRAFCGCHDAIYHLSSLAARFNMQPG
PSPGGDSRPPRPPLRRLPALPGPRDPPSDTNNRRSWPTGDGGDGGAGQG AGGGATATEEDYRAEDLDELYAALEGDERSETHAPRTDIPVPVDSLETYKW LTRSKWAPGSCSTPGTGAEATLAQQLSKELESNRSIMKLIRTAQRDLESFLP
QKETSSPEVEKKTHFQRKKVPISRSKRGRNRKPRRYSSTSSDTSESSENSE SDSEPCSKASKRRRRVST (SEQ ID NO: 840) ORF2/3 MSVWLPPIDNVTERERSWLSSILQSHRAFCGCHDAIYHLSSLAARFNMQPG
PSPGGDSRPPRPPLRRLPALPGPRDPPSDTNNRRSWPTGDGGDGGAGQG
TTV-RTx2 (Clado 6 de Alphatorquevirus)
AGGGATATEEDYRAEDLDELYAALEGDERRPARPKSRRRLIFRGRKSPYLV RRGAGTESPGGTAAPPPTPQKAARTPKATPSPVPKPPKDAGGSPRKSIIIQP
ACNQVLMFPEMGPKPAPTAQDWQCEYETCKHWDRPPRKFLTDPPFYPWA PTTYNVSFKLNFK (SEQ ID NO: 841) ORF1 MAYWGWWRRRRWPRRRWRRYRYRRRLPRRRPRRAVRRPRRRRVRRRR
GRGWYRGRRYSRRRYRRRYVRRKRKTLVWRQWQPQNIRKCRIRGIIPILIC GHGRGARNYALHSDDITPQNTPFGGGLSTTSWSLKVLYDQHTRGLNRWSA SNESLDLARYNGCSFTFYRDKKTDFIVTYDTSAPYKLDKYSSPSYHPGSMM LMTKHKILIPSFDTKPKGPAKIRVRIKPPKMFLDKWYTQDDLCSVNLVSLAVS AASFTHPFCPPLTDTPCVTLQVLKDFYYTTIGYSSNADKVESVFTNTLYKHC CYYQSFLTTQFIAKITRTPDGQPVATFSPPTSFPGTTVTKSSIESFNQWVTST GTSGWLTNANQHFHFCNYKPDATKLKWLRQYYFDWETYKLADVKPDGLTP SVNWYEYRIGLFSPIFLSPFRSSSLDFPRAYQDVNYNPLVDKGVGNIIWFQY NTKPDTQLSVPSCKCVIEDKPLWAAFYGYSDFVQQEIGDYTDAEAVGFVCVI CPYTKPPLKNPDNPMQGFIFYDSLFGNGKWIDGTGHVPLYWQSRWRPEML FQENTMRDITLSGPFSYKDDYKNCVLTCKYKFNFRFGGNLLHEQTIRNPCPT DGHPSTGRQPRDVQVVDPIKVGPRFVFHSWDWRRGYLSPAALKRIGEQPL DYEAYSYRPKRPRIFPPTEGDQLARSREEDSFSEEESPHISFEEGQEPKAQ
AVQQHLLRHLRKQRELRKRLRALFQSLQKTQAGLHVNPLLFNQPAIRF (SEQ ID NO: 842) ORF1/1 MAYWGWWRRRRWPRRRWRRYRYRRRLPRRRPRRAVRRPRRRRTIRNP
CPTDGHPSTGRQPRDVQVVDPIKVGPRFVFHSWDWRRGYLSPAALKRIGE QPLDYEAYSYRPKRPRIFPPTEGDQLARSREEDSFSEEESPHISFEEGQEPK
AQAVQQHLLRHLRKQRELRKRLRALFQSLQKTQAGLHVNPLLFNQPAIRF (SEQ ID NO: 843) ORF1/2 MAYWGWWRRRRWPRRRWRRYRYRRRLPRRRPRRAVRRPRRRRKETSS
PEVEKKTHFQRKKVPISRSKRGRNRKPRRYSSTSSDTSESSENSESDSEPC SKASKRRRRVST (SEQ ID NO: 844)
Tabela A5. Nova sequência de ácidos nucleicos de Anellovirus (Alphatorquevirus) Nome TTV-RTx3 Gênero/Clado Alphatorquevirus, Clado 4 Número de Acesso SRR3479781 Sequência Total: 3653 pb 1 10 20 30 40 50 | | | | | |
CCAACCAGAGTCTATGTCGTGCACTTCCTGGGCATGGTCTACGTAATAAT ATAAAGCGGTGCACTTCCGAATGGCTGAGTTTTCCACGCCCGTCCGCAGC GAGATCGCGACGGAGGAGCGATCGAGCGTCCCGAGGGCGGGTGCCGGAGG TGAGTTTACACACCGCAGTCAAGGGGCAATTCGGGCTCGGGACTGGCCGG GCTATGGGCAAGGCTCTTAAAAAGCCATGTTTCTCGGTAAACTTTACAGG CAGAAAAGGAAACTGCTACTGCAGCCTGTGCGTGCTCCACAGACGCCATC TTCCATGAGCTCTACCTGGCGAGTGCCCCGCGGCGATGTCTCCGCCCGCG AGCTATGTTGGTACCGCTCAGTTCGAGAGAGCCACGATGCTTTTTGTGGC TGTCGTGATCCTGTTTTTCATCTTTCTCGTCTGGCTGCACGTTCTAACCA TCAGGGACCTCCGACGCCCCCCACGGACGAGCGCCCGTCGGCGTCTACCC CAGTGAGGCGCCTGCTGCCGCTGCCCTCCTACCCCGGCGAGGGTCCCCAG GCTAGATGGCCTGGTGGGGATGGAGAAGGCGCTGGTGGCGCCCGCGGAGG CGCTGGAGATGGCGGCGCCCGCGCAGGCGAAGAAGAGTACCGGCCCGAAG ACCTCGACGAGCTGTTCGACGCTATCGAACAAGAACAGTAAGGAGACGGA GGCGAGGGTGGCGGAGGGGCTACAGGCGCCGTTACAGACTGAGACGCTAC CGTAGAAGGGGCAGGCGACGCAAAAAAATAGTACTGACTCAGTGGAACCC CCAGACTGTCAGAAAGTGCTTTATCAGAGGACTGATGCCAGTACTATGGG CGGGCATGGGCACGGGGGGCCACAACTACGCCGTCCGCTCAGATGACTTT GTGGTAGACAGAGGCTTCGGGGGCTCCTTCGCCACAGAAACTTTCTCCCT GAGGGTCCTCTTTGACCAGTACCAGAGAGGATTTAATAGGTGGTCTCACA CCAACGAAGACCTAGACCTGGCCCGCTACACGGGCTGCAAATGGACATTT TACAGACACCAAGACACAGACTTTATAGTGTACTTTACAAACAATCCCCC CATGAAAACCAACCAGCACACAGCCCCTCTCACAACTCCAGGCATGCTCA TGAGGAGCAAGTATAAAATACTAGTGCCCAGTTTTAAAACAAGACCAAAG GGCAGAAAAACAGTGTCAGTGAGAGTTAGACCCCCCAAACTGTTTCAGGA CAAATGGTATACTCAACAGGACCTCTGTCCAGTACCCCTCGTCCAACTGA ACGTGACCGCAGCGGATTTCACACATCCGTTCGGCTCACCACTAACTGAC ACGCCTTGCATAAGATTCCAAGTTTTAGGGAACTTATACAACAAGTGCCT AAATATAGATCTTCCGCAATTTGATGAGGACGGTGAGATACTCACTTCAA CACCTTATAACAGAGAAAACAAAGAAGATCTTAAAAAGCTTTATAAAACT
Nome TTV-RTx3 Gênero/Clado Alphatorquevirus, Clado 4 Número de Acesso SRR3479781
CTATTTGTAGATGAACACGCAGGCAATTATTGGCAGACATTCTTAACCAA CACAATGGTAAAGTCACACATAGATGCAAACCAAGCAAAGACATACGATC AAGAAAAAACTGCTGCAGAACAAGGTAAAGACCCCTTCCCAACAAACCCA CCAAAAGACCAATTCACTACCTGGAACAAGAAACTAGTAGACCCTAGAGA CAGCAACTTTCTCTTTGCCACATATCACCCAAAAAACATTAAAAAAGCTA TAAAAACCATGAGAGACAACAACTTTGCTCTCACCACAGGCAAAAATGAC ATATATGGAGACTACACCGCGGCCTACACCAGAAACACCCACATGCTAGA CTACTACCTAGGCTTTTATAGCCCCATATTTCTTTCCAGCGGTAGGTCCA ACACAGAGTTCTGGACCGCCTACAGAGACATAGTATATAATCCCCTCTTA GACAAAGGCACAGGCAACATGATCTGGTTCCAATATCACACAAAAACAGA CAATATATACAAAAAACCAGAGTGCCACTGGGAGATACTAGACATGCCCC TGTGGGCCCTCTGCAACGGGTATGTAGAGTACCTAGAGAGCCAAATAAAG TACGGGGACATCCTAGTAGAGGGCAAAGTCCTCATCAGATGCCCCTACAC CAAACCCGCACTGGTAGACCCCAATAACAGCCTAGCTGGTTACGTGGTAT TCAACACCACCTTCGGCCAGGGAAAATGGATAGATGGCAAAGGCTACATC CCCCTACACGAGAGGAGCAAGTGGTACGTCATGCTCAGATACCAGACCGA CGTACTCCATGACATAGTGACTTGTGGACCCTGGCAGTACAGAGACGATA ACAAAAACTCTCAGCTAATAGCCAAGTACAGATTCAAGTTCTACTGGGGA GGTAACATGGTACATTCTCAGGTCATCAGAAACCCGTGCAAAGACACCCA AGTATCCGGACCCCGTCGACAGCCTCGCGAAGTACAAGTCGTTGACCCGC AACTCATTACGCCGCCGTGGGTCCTCCACTCGTTCGACCAGAGACGAGGA ATGTTTACTGCAGGAGCTATCAAACGTCTGCTCAAGCAACCAATACCTGG CGAGTATGCTCCTACACCACTCAGGGTCCCGCTCCTCTTTCCCTCCTCAG AGTTCCAGCGAGAGGGAGAAGATGCAGAAAGCGGCTCAGGTTCACCACCC AAGAGACCGCGACTCTGGCAGGAAGAGGCCAACCAGACGCAAACGGAGTC CTCGGAGGGGCCGGCGGAGACGACGAGGGAGCTCCTCGAGCGAAAGCTCA GAGAGCAGCGAGTCCTCAACCTCCAACTCCAGCATGTCGCAGTACAACTC GCCAAAACCCAAGCGAACCTCCACATAAACCCCCTATTATACTCCCAGCC TTAAACAAAGTGTATCTATTCCCCCCTGACAAGCCCACTCCCATACAGNN NNNNNNNNNNNNNNNNAACACAGAGTTCGAAGCCTGCCAGGCCTTCGACA GACCACCTAGAAAATACCTCTCAGACACACCTACCTACCCTTGGCTCCCC GTCCCCAATCCTGAAATAAAGGTCAGCTTTAAGCTCGGTTTCAAATCTTA CAAGGCCGTGGGAGTTTCACTGGTCGGTGTCTACCTCTTAAGGTCACTAA GCACTCCGAGCGTCAGCGAGGAGTGCGACCCTTCCCCCTGGTGCAACGCC CTCGGCGGCCGCGCGCTACGCCTTCGGCTGCGCGCGGCACCTCGGACCCC CGCTCGTGCTGACGCGCTCGCGCGCGTCAGACCACTTCGGGCTCGCGGGG
Nome TTV-RTx3 Gênero/Clado Alphatorquevirus, Clado 4 Número de Acesso SRR3479781
GTCGGGAATTTTGCTAAACAGACTCCGAGTTGCCATTGGACACTGTAGCT GTGAATCAGTAACGAAAGTGAGTGGGGCCAGACTTCGCCATAAGGCCTTT ATCTTCTTGCCATTGGTCCGTGTAGGGGGTCGCCATAGGCTTCGGGTTCG GTTTTAGGCCTTCCGGACTACAAAAATGGCGGATTTAGTGACGTCACGGC CGCCATTTTAAGTAGGTGCCGTCCAGGACTGCTGTTCCGGGTCACAGGGC ATCCTCGGCGGAACTTACACAAAATGGCGGTCAAAAACATCCGGGTCAAA
GGTCGCAGCTACGTCATAAGTCACGTGCAGGGGTCCTGCTGCGTCATATG CGG (SEQ ID NO: 845) Anotações: Domínio Putativo Gama base Caixa TATA 50 – 55 Elemento Iniciador 68-83 Local de Início Transcricional 78 Domínio Conservado 5´ UTR 138 - 208 ORF2 305 - 691 ORF2/2 305 – 687 ; 2422 – 2878 ORF2/3 305 – 687 ; 2564 – 3317 ORF2t/3 305 – 360 ; 2564 – 3317 ORF1 556 – 2904 ORF1/1 556 – 687 ; 2422 – 2904 ORF1/2 556 – 687 ; 2564 – 2878 Região de três grelhas de leitura aberta 2626 – 2846 Sinal de Poli(A) 3316 - 3319 Tabela A6. Novas sequências de aminoácidos de Anellovirus (Alphatorquevirus, Clado 4) TTV-RTx3 (Clado 4 de Alphatorquevirus) ORF2 MSSTWRVPRGDVSARELCWYRSVRESHDAFCGCRDPVFHLSRLAARSNH
QGPPTPPTDERPSASTPVRRLLPLPSYPGEGPQARWPGGDGEGAGGARG GAGDGGARAGEEEYRPEDLDELFDAIEQEQ (SEQ ID NO: 846) ORF2/2 MSSTWRVPRGDVSARELCWYRSVRESHDAFCGCRDPVFHLSRLAARSNH
QGPPTPPTDERPSASTPVRRLLPLPSYPGEGPQARWPGGDGEGAGGARG
TTV-RTx3 (Clado 4 de Alphatorquevirus)
GAGDGGARAGEEEYRPEDLDELFDAIEQEQSSETRAKTPKYPDPVDSLAKY KSLTRNSLRRRGSSTRSTRDEECLLQELSNVCSSNQYLASMLLHHSGSRSS
FPPQSSSEREKMQKAAQVHHPRDRDSGRKRPTRRKRSPRRGRRRRRGSS SSESSESSESSTSNSSMSQYNSPKPKRTST (SEQ ID NO: 847) ORF2/3 MSSTWRVPRGDVSARELCWYRSVRESHDAFCGCRDPVFHLSRLAARSNH
QGPPTPPTDERPSASTPVRRLLPLPSYPGEGPQARWPGGDGEGAGGARG GAGDGGARAGEEEYRPEDLDELFDAIEQEQSYQTSAQATNTWRVCSYTTQ GPAPLSLLRVPARGRRCRKRLRFTTQETATLAGRGQPDANGVLGGAGGDD EGAPRAKAQRAASPQPPTPACRSTTRQNPSEPPHKPPIILPALNKVYLFPPD KPTPIQXXXXXXNTEFEACQAFDRPPRKYLSDTPTYPWLPVPNPEIKVSFKL
GFKSYKAVGVSLVGVYLLRSLSTPSVSEECDPSPWCNALGGRALRLRLRAA PRTPARADALARVRPLRARGGREFC (SEQ ID NO: 848) ORF2t/3 MSSTWRVPRGDVSARELCWSYQTSAQATNTWRVCSYTTQGPAPLSLLRV
PARGRRCRKRLRFTTQETATLAGRGQPDANGVLGGAGGDDEGAPRAKAQ RAASPQPPTPACRSTTRQNPSEPPHKPPIILPALNKVYLFPPDKPTPIQXXXX XXNTEFEACQAFDRPPRKYLSDTPTYPWLPVPNPEIKVSFKLGFKSYKAVG
VSLVGVYLLRSLSTPSVSEECDPSPWCNALGGRALRLRLRAAPRTPARADA LARVRPLRARGGREFC (SEQ ID NO: 849 ) ORF1 MAWWGWRRRWWRPRRRWRWRRPRRRRRVPARRPRRAVRRYRTRTVR
RRRRGWRRGYRRRYRLRRYRRRGRRRKKIVLTQWNPQTVRKCFIRGLMP VLWAGMGTGGHNYAVRSDDFVVDRGFGGSFATETFSLRVLFDQYQRGFN RWSHTNEDLDLARYTGCKWTFYRHQDTDFIVYFTNNPPMKTNQHTAPLTTP GMLMRSKYKILVPSFKTRPKGRKTVSVRVRPPKLFQDKWYTQQDLCPVPLV Q LNVTAADFTHPFGSPLTDTPCIRFQVLGNLYNKCLNIDLPQFDEDGEILTSTP YNRENKEDLKKLYKTLFVDEHAGNYWQTFLTNTMVKSHIDANQAKTYDQEK TAAEQGKDPFPTNPPKDQFTTWNKKLVDPRDSNFLFATYHPKNIKKAIKTMR DNNFALTTGKNDIYGDYTAAYTRNTHMLDYYLGFYSPIFLSSGRSNTEFWTA YRDIVYNPLLDKGTGNMIWFQYHTKTDNIYKKPECHWEILDMPLWALCNGY VEYLESQIKYGDILVEGKVLIRCPYTKPALVDPNNSLAGYVVFNTTFGQGKWI DGKGYIPLHERSKWYVMLRYQTDVLHDIVTCGPWQYRDDNKNSQLIAKYRF KFYWGGNMVHSQVIRNPCKDTQVSGPRRQPREVQVVDPQLITPPWVLHSF DQRRGMFTAGAIKRLLKQPIPGEYAPTPLRVPLLFPSSEFQREGEDAESGS
GSPPKRPRLWQEEANQTQTESSEGPAETTRELLERKLREQRVLNLQLQHV AVQLAKTQANLHINPLLYSQP (SEQ ID NO: 850) ORF1/1 MAWWGWRRRWWRPRRRWRWRRPRRRRRVPARRPRRAVRRYRTRTVIR
NPCKDTQVSGPRRQPREVQVVDPQLITPPWVLHSFDQRRGMFTAGAIKRLL KQPIPGEYAPTPLRVPLLFPSSEFQREGEDAESGSGSPPKRPRLWQEEAN
TTV-RTx3 (Clado 4 de Alphatorquevirus)
QTQTESSEGPAETTRELLERKLREQRVLNLQLQHVAVQLAKTQANLHINPLL YSQP (SEQ ID NO: 852) ORF1/2 MAWWGWRRRWWRPRRRWRWRRPRRRRRVPARRPRRAVRRYRTRTEL
SNVCSSNQYLASMLLHHSGSRSSFPPQSSSEREKMQKAAQVHHPRDRDS
GRKRPTRRKRSPRRGRRRRRGSSSSESSESSESSTSNSSMSQYNSPKPK RTST (SEQ ID NO: 853) Tabela A7. Nova sequência de ácidos nucleicos de Anellovirus (Alphatorquevirus) Nome TTV-RTx4 Gênero/Clado Alphatorquevirus, Clado 4 Número de Acesso SRR3481579 Sequência Total: 3742 pb 1 10 20 30 40 50 | | | | | |
AAAGTGCTACGTCACTAACCACGTGACACCCACAGGCCAACCGAATGCTA TGTCGTGCACTTCCTGGGCCGGGTCTACGTCCTCATATAACTACCTGCAC TTCCGAATGGCTGAGTTTTCCACGCCCGTCCGCAGCGGTGAAGCCACGGA GGGAGATCAGCGCGTCCCGAGGGCGGGTGCCGAAGGTGAGTTTACACACC GAAGTCAAGGGGCAATTCGGGCTCGGGACTGGCCGGGCTATGGGCAAGGC TCTGAAAAAAGCATGTTTATTGGCAGGCATTACAGAAAGAAAAGGGCGCT GCCACTGTGTGCTGTGCGATCAACAAAGAAGGCTTGCAAACTACTAATAG TAATGTGGACCCCACCTCGCAATGACCAACAGTACCTTAACTGGCAATGG TACTCAAGTATACTTAGCTCCCACGCTGCTATGTGCGGGTGTCCCGACGT TGTTGCTCATTTTAATCATCTTGCTTCTGTGCTTCGCGCCCCGCAAAATC CACCCCCACCCGGTCCCCAGCGAAACCTGCCCCTCCGACGGCTGCCGGCT CTCCCGGCTGCGCCAGAGGCGCCCGGAGATAGAGCACCATGGCCTATGGC TGGTGGCGCCGGAGGAGAAGACGGTGGCGCAGGTGGAGACGCAGACCATG GAGGCGCCGCTGGAGGACCAGAAGACGCAGACCTGTTAGACGCCGTGGCC GCCGCAGAAACGTAAGGAGACGCCGCAGAGGAGGGAGGTGGAGGAGGAGG TACAGGAGATGGAAAAGAAAGGGCAGACGCAGAAAAAAAGCTAAAATAAT AATAAGACAATGGCAACCTAACTACAGAAGGAGATGTAACATAGTAGGCT ATATTCCTGTACTGATATGTGGCGAAAATACTGTCAGCAGAAACTATGCC ACACACTCAGACGATACTAACTACCCAGGACCCTTTGGGGGGGGTATGAC TACAGACAAATTTACCTTAAGAATTCTGTATGACGAGTACAAAAGGTTTA TGAACTATTGGACAGCATCTAATGAAGACCTAGACCTCTGTAGATATCTA GGAGTAAACCTGTACTTTTTTAGACACCCAGAAGTAGACTTTATTATAAA
Nome TTV-RTx4 Gênero/Clado Alphatorquevirus, Clado 4 Número de Acesso SRR3481579
AATAAATACCATGCCCCCTTTTCTAGACACAGAACTAACAGCTCCTAGCA TACACCCAGGAATGCTAGCCTTAGACAAAAGAGCAAGATGGATACCTAGC TTAAAATCTAGACCAGGAAAAAAACACTATATTAAAATAAGAGTAGGGGC GCCTAAAATGTTCACAGATAAATGGTACCCCCAAACAGATCTTTGTGACA TGGTGCTGCTAACTGTCTATGCAACCGCAGCGGATATGCAATATCCGTTC GGCTCACCACTAACTGACTCTGTGGTTGTGAACTTCCAGGTTCTGCAATC CATGTATGATGAAACCATTAGCATATTACCAGATCAAAAGGAGAAAAGAA TAACGCTGCTCACTAGTATAGCCTTTTATAACACCACACAAACTATAGCC CAATTAAAGCCATTTATAGATGCAGGCAATATGACTTCAACTACAACAGC AACAACATGGGGATCATACATAAACACAACCAAATTTAATACAGCAGCCA CTACAACATACACATACCCAGGCAGTACTACAACTACAGTAACTATGTTA ACTTGTAATGACTCCTGGTACAGAGGAACAGTATATAACGACCAAATTAA AAATTTACCAAAGGAAGCAGCTCAATTATACTTAAAAGCAACAAAAACCT TACTAGGAAACACCTTCACAAATGACGACCACACACTAGAATACCATGGA GGACTGTACAGCTCAATTTGGCTGTCCCCCGGCAGATCTTACTTTGAAAC ACCAGGAGCATACACAGACATAAAATACAACCCATTTACAGACAGAGGAG AAGGAAACATGCTATGGATAGACTGGCTAAGCAAAAAAAATATGAACTAT GACAAACTACAAAGTAAATGTTTAATATCAGACCTACCTTTATGGGCAGC AGCATATGGATATTTAGAATTTTGTGCAAAAAGTACAGGAGACCAAAATA TACACATGAATGCCAGACTACTAATAAGAAGTCCCTTTACAGACCCCCAA CTACTAGTACACACAAACCCCACAAAAGGCTTTGTTCCCTACTCTTTAAA CTTTGGAAATGGTAAAATGCCAGGAGGTAGTAGTAATGTTCCTATTAGAA TGAGAGCTAAATGGTATCCAACATTGTTTCACCAGCAAGAAGTACTAGAG GCCTTAGCACAGTCAGGCCCCTTTGCATACCACTCAGACATTAAAAAAGT ATCTCTGGGTATGAAATACCGTTTTAAGTGGATCTGGGGTGGAAACCCCG TTCGCCAACAGGTTGTTAGAAATCCCTGCAAAGACTCCCACTCCTCGGTC AATAGAGTCCCTAGAAGCTTACAAATCGTTGACCCGAAATACAACTCACC GGAACTCACATTCCATACGTGGGACTTCAGACGTGGCCTCTTTGGCCAGA AAGCTATTGAGAGAATGCAACAACAACCAACAACTACTGACATTTTTTCA GCAGGCCGCAAGAGACCCAGGAGGGACACCGAGGTGTACCACTCCAGCCA AGAAGGGGAGCAAAAAGAAAGCTTACTTTTCCCCCCAGTCAAGCTCCTCA GACGAGTCCCCCCGTGGGAAGACTCGCAGCAGGAGGAAAGCGGGTCGCAA AGCTCAGAGGAAGAGACGCAGACCGTCTCCCAGCAGCTCAAGCAGCAGCT GCAGCAACAGCGAATCCTGGGAGTCAAACTCATACTCCTGTTCAACCAAG TCCAAAAAATCCAACAAAATCAAGATATCAACCCTACCTTGTTACCAAGG GGGGGGGATCTAGCATCCTTATTTCAAATAGCACCATAAACATGTTTGGA
Nome TTV-RTx4 Gênero/Clado Alphatorquevirus, Clado 4 Número de Acesso SRR3481579
GACCCCAAACCTTACAACCCTTCCAGTAATGACTGGAAAGAGGAGTATGA GGCCTGTAGAATATGGGACAGACCCCCAAGAGGCAATCTAAGAGACACCC CCTTTTACCCCTGGGCCCCCAAAGAAAACCAGTACCGTGTAAACTTTAAA CTTGGATTTCAATAAAGCTAGGCCGTGGGACTTTCACTTGTCGGTGTCTG CTTATAAAAGTAACCAAGCACTCCGAGCGAAGCGAGGAGTGCGACCCTTG GGGGCTCAACGACTTCGGAGCCGCGCGTTAAGCCTTCGGCTGCGCGCGGC ACCTCAGACCCCCGCTCGTGCTGACACGCTTGCGCGTGTCAGACCACTTC GGGCTCGCGGGGGTCGGGAAATTTATTAAACAGACTCCGAGTTGCCATTG GACACAGTAGTCTATGAACAGCAACGAAAGTGAGTGGGGCCAGACTTCGC CATAAGGCCTTTATCTTCTTGCCATTTGTCAGTATAGAGGGTCGCCATAG GCTTCGGTCTCCATTTTAACCTGTAAAAACTACCAAAATGGCCGTTCCAG TGACGTGACAGCCGCCATTTTAAGTAGCTGACGTCAAGGATTGACGTAAA GGTTAAAGGTCATCCTCGGCGGAAGCTACACAAAATGGTGGACAACATCT TCCGGGTCAAAGGTCGTGCACACGTCAAAAGTCACGTGGTGGGGACCCGC TGTAACCCGGAAGTAGGCCCCGTCACGTGATTTGTCACGTGTGTACACGT
CACAGCCGCCATTTTGTTTTACAAAATGGCTGACTTCCTTCCTCTTTTTT GAAAAAAGGCGCCAAAAAAGGCTCCGCCCCCCGGCCCCCCCC (SEQ ID NO: 854) Anotações: Domínio Putativo Gama base Caixa TATA 86 – 90 Elemento Iniciador 104 – 119 Local de Início Transcricional 114 Domínio Conservado 5´ UTR 174 – 244 ORF2 353 – 715 ORF2/2 353 – 711 ; 2362 – 2863 ORF2/3 353 – 711 ; 2555 – 3065 ORF2t/3 353 – 432; 2555 – 3065 ORF1 589 – 2889 ORF1/1 589 – 711 ; 2362 – 2889 ORF1/2 589 – 711 ; 2555 – 2863 Região de três grelhas de leitura aberta 2555 – 2863 Sinal de Poli(A) 3062 – 3066 Região rica em GC ou uma sua porção** 3720 – 3742
Tabela A8. Novas sequências de aminoácidos de Anellovirus (Alphatorquevirus, Clado 4) TTV-RTx4 (Clado 4 de Alphatorquevirus) ORF2 MWTPPRNDQQYLNWQWYSSILSSHAAMCGCPDVVAHFNHLASVLRAPQ
NPPPPGPQRNLPLRRLPALPAAPEAPGDRAPWPMAGGAGGEDGGAGGD ADHGGAAGGPEDADLLDAVAAAET (SEQ ID NO: 855) ORF2/2 MWTPPRNDQQYLNWQWYSSILSSHAAMCGCPDVVAHFNHLASVLRAPQ
NPPPPGPQRNLPLRRLPALPAAPEAPGDRAPWPMAGGAGGEDGGAGGD ADHGGAAGGPEDADLLDAVAAAETLLEIPAKTPTPRSIESLEAYKSLTRNTT HRNSHSIRGTSDVASLARKLLRECNNNQQLLTFFQQAARDPGGTPRCTTP
AKKGSKKKAYFSPQSSSSDESPRGKTRSRRKAGRKAQRKRRRPSPSSSS SSCSNSESWESNSYSCSTKSKKSNKIKISTLPCYQGGGI (SEQ ID NO: 856) ORF2/3 MWTPPRNDQQYLNWQWYSSILSSHAAMCGCPDVVAHFNHLASVLRAPQ
NPPPPGPQRNLPLRRLPALPAAPEAPGDRAPWPMAGGAGGEDGGAGGD ADHGGAAGGPEDADLLDAVAAAETPQETQEGHRGVPLQPRRGAKRKLTF PPSQAPQTSPPVGRLAAGGKRVAKLRGRDADRLPAAQAAAAATANPGSQ
THTPVQPSPKNPTKSRYQPYLVTKGGGSSILISNSTINMFGDPKPYNPSSN DWKEEYEACRIWDRPPRGNLRDTPFYPWAPKENQYRVNFKLGFQ (SEQ ID NO: 857) ORF2t/3 MWTPPRNDQQYLNWQWYSSILSSHAAMPQETQEGHRGVPLQPRRGAKR
KLTFPPSQAPQTSPPVGRLAAGGKRVAKLRGRDADRLPAAQAAAAATANP GSQTHTPVQPSPKNPTKSRYQPYLVTKGGGSSILISNSTINMFGDPKPYNP
SSNDWKEEYEACRIWDRPPRGNLRDTPFYPWAPKENQYRVNFKLGFQ (SEQ ID NO: 858) ORF1 MAYGWWRRRRRRWRRWRRRPWRRRWRTRRRRPVRRRGRRRNVRRR
RRGGRWRRRYRRWKRKGRRRKKAKIIIRQWQPNYRRRCNIVGYIPVLICG ENTVSRNYATHSDDTNYPGPFGGGMTTDKFTLRILYDEYKRFMNYWTASN EDLDLCRYLGVNLYFFRHPEVDFIIKINTMPPFLDTELTAPSIHPGMLALDKR ARWIPSLKSRPGKKHYIKIRVGAPKMFTDKWYPQTDLCDMVLLTVYATAAD MQYPFGSPLTDSVVVNFQVLQSMYDETISILPDQKEKRITLLTSIAFYNTTQT IAQLKPFIDAGNMTSTTTATTWGSYINTTKFNTAATTTYTYPGSTTTTVTMLT CNDSWYRGTVYNDQIKNLPKEAAQLYLKATKTLLGNTFTNDDHTLEYHGGL YSSIWLSPGRSYFETPGAYTDIKYNPFTDRGEGNMLWIDWLSKKNMNYDK LQSKCLISDLPLWAAAYGYLEFCAKSTGDQNIHMNARLLIRSPFTDPQLLVH TNPTKGFVPYSLNFGNGKMPGGSSNVPIRMRAKWYPTLFHQQEVLEALAQ SGPFAYHSDIKKVSLGMKYRFKWIWGGNPVRQQVVRNPCKDSHSSVNRV PRSLQIVDPKYNSPELTFHTWDFRRGLFGQKAIERMQQQPTTTDIFSAGRK RPRRDTEVYHSSQEGEQKESLLFPPVKLLRRVPPWEDSQQEESGSQSSE
TTV-RTx4 (Clado 4 de Alphatorquevirus)
EETQTVSQQLKQQLQQQRILGVKLILLFNQVQKIQQNQDINPTLLPRGGDLA SLFQIAP (SEQ ID NO: 859) ORF1/1 MAYGWWRRRRRRWRRWRRRPWRRRWRTRRRRPVRRRGRRRNVVRN
PCKDSHSSVNRVPRSLQIVDPKYNSPELTFHTWDFRRGLFGQKAIERMQQ QPTTTDIFSAGRKRPRRDTEVYHSSQEGEQKESLLFPPVKLLRRVPPWED
SQQEESGSQSSEEETQTVSQQLKQQLQQQRILGVKLILLFNQVQKIQQNQ DINPTLLPRGGDLASLFQIAP (SEQ ID NO: 860) ORF1/2 MAYGWWRRRRRRWRRWRRRPWRRRWRTRRRRPVRRRGRRRNAARD
PGGTPRCTTPAKKGSKKKAYFSPQSSSSDESPRGKTRSRRKAGRKAQRK
RRRPSPSSSSSSCSNSESWESNSYSCSTKSKKSNKIKISTLPCYQGGGI (SEQ ID NO: 861) Tabela A9. Nova sequência de ácidos nucleicos de Anellovirus (Alphatorquevirus) Nome TTV-RTx5b Gênero/Clado Alphatorquevirus, Clado 5 Número de Acesso SRR3481639 Sequência Total: 3553 pb 1 10 20 30 40 50 | | | | | |
ATACCTCATCATATAAAGCGGCGCACTTCCGAATGGCTGAGTTTTCCACG CCCGTCCGCAGCGAGATCGCGACGGAGGAGCGATCGAGCGTCCCGAGGGC GGGTGCCGGAGGTGAGTTTACACACCGCAGTCAAGGGGCAATTCGGGCTC GGGACTGGCCGGGCTATGGGGCAAGACTCTTAAAAAAGCCATGTTTCTCG GTAAACTTTACAGAAAGAAAAGGGCACTGTCACTGCTACGCGTGCGAGCT CCAGAGGCGAAACCACCTGCTATGAGTTGGAGACCCCCGGTGCACAACCC CAATGGGATCGAGAGAAACCTGTGGGAGGCATTCTTTCGCATGCATGCTT CAGCTTGTGGTTGTGGCGATCTTGTTGGCCATCTTACTGTACTGGCTGGT CGGTATGGTGCTCCTCCTCGTCCCCCGGCCCCCGGCGCTCCCAGACCACC GCTGATACGCCAGCTGGCCCTTCCGGCGCCCCCCGCCGATCCTCAACAGG CTAACCCACAATGGCCTGGTGGGGACGGTGGAGAAGATGGCGCTGGAGGC CCCGCCGCTGGCGGCGCCGTCGCAGACGCCGAGTACCAAGAAGACGAGCT CAACGCCCTGTTCGACGCCGTCGAGCAAGAAGAGTAAGGAGGAGGCGATG GGGGAGGCGGAGGTGGAGACGGGGGTACAGACGCAGACTGAGACTAAGAC GCAGACGCAGACGAAAGCGAAAGATAGTACTAACTCAGTGGAATCCCGCC AAAGTGCGGAGGTGTACTATTAAGGGAGTTCTGCCCATGATCCTGTGCGG GGCCGGGCGCTCGGGGTTTAACTACGGACTGCACAGCGACGACTACACTG
Nome TTV-RTx5b Gênero/Clado Alphatorquevirus, Clado 5 Número de Acesso SRR3481639
TACAGAAGCCCCTTGGCCAGAACCCCCACGGGGGCGGCATGAGTACAGTG ACTTTTAGCCTACAGGTGCTCTATGACCAGTACCAGAGGTTTATGAACAA GTGGTCGTACTCCAACGACCAGCTAGACCTCGCCAGGTACTTTGGCTGCA CCTTCTGGTTCTACAGACACCCAGAGGTGGACTTTGTAGCTCAGTTTGAC AACGTTCCCCCCATGAAAATGGACGAGAACACAGCCCCAAACACTCATCC CTCTTTCTTACTACAGAACAAACACAAGGTTAAAATTCCCAGCTTTAAAA CAAAGCCTTTTGGTAAAAAAAGAGTTAGAGTTACAGTAGGGCCCCCCAAA CTGTTTGAAGATAAGTGGTACAGCCAACATGACTTGTGTAAGGTGCCCCT AGTCAGTTGGCGGTTAACCGCAGCTGACTTCAGGTTTCCGTTCTGCTCAC CACAAACTGACAACCCTTGCTACACCTTCCAGGTATTGCATGAAGAGTAT TACCCAGTAATAGGCACTTCTGCTTTAGAAAACGGCAGTAACTACAATAG CTCAGCTATAACAGCCTTAGAAAAATTCTTATATGAAAAATGCACACACT ATCAAACATTTGCCACAGACACCAGACTTAATCCTCAGCGACCAGTGTCA TCTACAAATGCAAACAAAACATACACCCCCTCAGGCTCCCAAGAAACAAT AGTGTGGGGGCAGTCAGATTTTAATTTATTTAAAAAGCACACAGACAGCA ACTATGGCTACTGCACCTACTGTCCTACCAATGACTTAGCTACAAAAATT AAAAAGTACAGAGACAAAAGATTCGACTGGCTAACAAACATGCCAGTAAC AAACACCTGCCACATAAATGCCACCTTCGCCCGAGGCAAAATTAAAGAAT GGGAGTACCACCTAGGGTGGTTCTCAAACATCTTTATAGGCAACCTGAGA CACAACCTAGCATTCCGGGCCGCATACATAGACATCACCTANACAGACAA GGGAGAAGGCAACATTATCTGGTTCCAGTACCTCACTAAACCCACCACAG AGTACATAGAAGCCCAAGCAAAGTGCTCCATCACAAACATACCCCTGTAT GCTGCTTTTTATGGCTACGAAGACTACCTCCAGAGAACACTAGGCCCCTA CCAAGATGTAGAAACCCTAGGTATAATCTGTGTTAAATGTCCCTACACAG ATCCCCCTCTAGTTCACAAGTCTACAGATAAAAAGAACTGGGGCTACGTG TTCTACGACGTGCACTTTGGCAACGGAAAGACCCCAGAGGGACTGGGCCA GGTGCACCCTTACTGGATGCAGAGGTGGAGACCCTACGTACAGTTTCAGA AAGACACTATGAACAAAATAGCCAGGACGGGACCGTTCAGCTACAGAGAC GAGACGCCTTCCATCACCCTGACCGCCGGGTACAAGTTTCATTTTAACTG GGGGGGCGACTCTATATTTCCACAGATTATTAAAAACCCCTGCCCAGACA GCGGGGTACGACCTTCATCCAGTAGAGAGCGTCGCTCAGTACAAGTCGTT AGCCCGCTCACAATGGGGCCAGAGTACATATTCCACCGGTGGGACTGGCG ACGGGGGTTCTTTAATCAAAAAGCTCTCAAAAGAATGCTTGAAAAATCAA TTAATGATGGAGAGTATCCAACAGGCCCAAAGGTCCCTCGATGGTTTCCC CCACTCGACAACCAAGAGCAAGAAGGCGCCTCAGGTTCAGAGGAGACAAG GTCGCAGTCCTCGCAAGAAGAAGCCGCTCAAGAAGCCCTCCAAGAAGTCC
Nome TTV-RTx5b Gênero/Clado Alphatorquevirus, Clado 5 Número de Acesso SRR3481639
AAGAGGCGTCGCTACAGCAGCACCTCCTCCAGCAGTACCGAGAGCAGCGA CGGATCGGAAAGCAACTCCAACTCGTCATGCTGCAGCTCACCAAGACGCA GAGCAACCTGCACATAAACCCCCGTGTTCTTGGCCATGCATAAATAAAGT CTACATGTTTCCCCCCGACAAGCCCATGCCCATACACGGGTACCACGGGT GGGAGACGGAGTACCAGGCCTGCAAGGCCTTCAACAGGCCCCCCAGAAAC TACCTTTCAGACAAACCCATCTACCCTTGGCTCCCTCGCCCCGAACCCGA AATAATAGTGAGCTTTAGGTTCGGTTTCAAATAAACAAGGCCGCAAATAA ACAAGGCCGTGGGAGTTTCACTGGTCGGTGTCTACCTCTTAAGGTCACTA AGCACTCCGAGCGTTAGCGAGGAGTGCGACCCTTCCCCCTGGTGCCACGC CCTCGGCGGCCGCGCGCTACGCCTNNNNNNNNNNNNNNNNNNNNNNNNNN NNNNNNNNNNNNNNNNNNNNNNNNNNTGAATCAGTAACGAAAGTGAGTGG GGCCAGACTTCGCCATAAGGCCTTTATCTTCTTGCCATTGGTCCGTGTGG GGAGTCGCCATAGGCTTCGGGCTCGGTTTTAGGCCTTCCGGACTACAAAA ACCGCCATTTTAGTGACGTCACGGCGGCCATTTTAAGTAAGCATGGCGGG CGGTGACGTACAAGTTGAAAGGTCACCGCGCTTCCGTGTTTACTCAAAAT GGTGGCCAACTGCTTCCGGGTCAAAGGTCGGCGGCCACGTCATAAGTCAC GTGGGAGGGCTGCGTCACAAACACGGAAGTGGCTGTCCCACGTGACTTGT
CACGTGATTGCTACGTCACGGCCGCCATTTTAGTTCACAAAATGGCGGAC TTC (SEQ ID NO: 862) Anotações: Domínio Putativo Gama base Caixa TATA 12 – 17 Elemento Iniciador 30 – 45 Local de Início Transcricional 40 Domínio Conservado 5´ UTR 100 – 171 ORF2 272 – 637 ORF2/2 272 – 633 ; 2326 – 2767 ORF2/3 272 – 633 ; 2525 – 2984 ORF2t/3 272 – 633 ; 2525 – 2984 ORF1 511 – 2793 ORF1/1 511 – 711 ; 2326 – 2793 ORF1/2 511 – 711 ; 2525 – 2767 Região de três grelhas de leitura aberta 2525 – 2767 Sinal de Poli(A) 2981 – 2985
Nome TTV-RTx5b Gênero/Clado Alphatorquevirus, Clado 5 Número de Acesso SRR3481639 Sequência desconhecida 3125-3176 *Nota: Modificações feitas para manter as grelhas de leitura: 430 - ”C” inserida em ORF2 1842 - ”N” inserida em ORF1 Tabela A10. Novas sequências de aminoácidos de Anellovirus (Alphatorquevirus, Clado 5) TTV-RTx5b (Clado 5 de Alphatorquevirus) ORF2 MSWRPPVHNPNGIERNLWEAFFRMHASACGCGDLVGHLTVLAGRYGAPP
RPPAPGAPRPPLIRQLALPAPPADPQQANPQWPGGDGGEDGAGGPAAGG AVADAEYQEDELNALFDAVEQEE (SEQ ID NO: 863) ORF2/2 MSWRPPVHNPNGIERNLWEAFFRMHASACGCGDLVGHLTVLAGRYGAPP
RPPAPGAPRPPLIRQLALPAPPADPQQANPQWPGGDGGEDGAGGPAAGG AVADAEYQEDELNALFDAVEQEELLKTPAQTAGYDLHPVESVAQYKSLARS QWGQSTYSTGGTGDGGSLIKKLSKECLKNQLMMESIQQAQRSLDGFPHST
TKSKKAPQVQRRQGRSPRKKKPLKKPSKKSKRRRYSSTSSSSTESSDGSE SNSNSSCCSSPRRRATCT (SEQ ID NO: 864) ORF2/3 MSWRPPVHNPNGIERNLWEAFFRMHASACGCGDLVGHLTVLAGRYGAPP
RPPAPGAPRPPLIRQLALPAPPADPQQANPQWPGGDGGEDGAGGPAAGG AVADAEYQEDELNALFDAVEQEEPKGPSMVSPTRQPRARRRLRFRGDKVA VLARRSRSRSPPRSPRGVATAAPPPAVPRAATDRKATPTRHAAAHQDAEQ
PAHKPPCSWPCINKVYMFPPDKPMPIHGYHGWETEYQACKAFNRPPRNYL SDKPIYPWLPRPEPEIIVSFRFGFK (SEQ ID NO:865) ORF2t/3 MSWRPPVHNPNGIERNLWEAFFRMHASACGCGDLVGHLTVLAGRPKGPS
MVSPTRQPRARRRLRFRGDKVAVLARRSRSRSPPRSPRGVATAAPPPAVP
RAATDRKATPTRHAAAHQDAEQPAHKPPCSWPCINKVYMFPPDKPMPIHG YHGWETEYQACKAFNRPPRNYLSDKPIYPWLPRPEPEIIVSFRFGFK (SEQ ID NO: 866) ORF1 MAWWGRWRRWRWRPRRWRRRRRRRVPRRRAQRPVRRRRARRVRRRR
WGRRRWRRGYRRRLRLRRRRRRKRKIVLTQWNPAKVRRCTIKGVLPMILC GAGRSGFNYGLHSDDYTVQKPLGQNPHGGGMSTVTFSLQVLYDQYQRFM NKWSYSNDQLDLARYFGCTFWFYRHPEVDFVAQFDNVPPMKMDENTAPN THPSFLLQNKHKVKIPSFKTKPFGKKRVRVTVGPPKLFEDKWYSQHDLCKV
TTV-RTx5b (Clado 5 de Alphatorquevirus)
PLVSWRLTAADFRFPFCSPQTDNPCYTFQVLHEEYYPVIGTSALENGSNYN SSAITALEKFLYEKCTHYQTFATDTRLNPQRPVSSTNANKTYTPSGSQETIV WGQSDFNLFKKHTDSNYGYCTYCPTNDLATKIKKYRDKRFDWLTNMPVTN TCHINATFARGKIKEWEYHLGWFSNIFIGNLRHNLAFRAAYIDITXTDKGEGNI IWFQYLTKPTTEYIEAQAKCSITNIPLYAAFYGYEDYLQRTLGPYQDVETLGII CVKCPYTDPPLVHKSTDKKNWGYVFYDVHFGNGKTPEGLGQVHPYWMQR WRPYVQFQKDTMNKIARTGPFSYRDETPSITLTAGYKFHFNWGGDSIFPQII KNPCPDSGVRPSSSRERRSVQVVSPLTMGPEYIFHRWDWRRGFFNQKALK RMLEKSINDGEYPTGPKVPRWFPPLDNQEQEGASGSEETRSQSSQEEAAQ
EALQEVQEASLQQHLLQQYREQRRIGKQLQLVMLQLTKTQSNLHINPRVLG HA (SEQ ID NO: 867) ORF1/1 MAWWGRWRRWRWRPRRWRRRRRRRVPRRRAQRPVRRRRARRIIKNPC
PDSGVRPSSSRERRSVQVVSPLTMGPEYIFHRWDWRRGFFNQKALKRMLE KSINDGEYPTGPKVPRWFPPLDNQEQEGASGSEETRSQSSQEEAAQEALQ
EVQEASLQQHLLQQYREQRRIGKQLQLVMLQLTKTQSNLHINPRVLGHA (SEQ ID NO: 868) ORF1/2 MAWWGRWRRWRWRPRRWRRRRRRRVPRRRAQRPVRRRRARRAQRSL
DGFPHSTTKSKKAPQVQRRQGRSPRKKKPLKKPSKKSKRRRYSSTSSSST ESSDGSESNSNSSCCSSPRRRATCT (SEQ ID NO: 869) Tabela A11. Nova sequência de ácidos nucleicos de Anellovirus (Alphatorquevirus) Nome TTV-RTx6 Gênero/Clado Alphatorquevirus, Clado 5 Número de Acesso SRR3438066 Sequência Total: 3896 pb 1 10 20 30 40 50 | | | | | |
TAAACTTCCTCTTTTAATAGGAAACCACAAAATTTGCATTGCCGACCACA AACGCATATGCAAATTTACTTCCCCAAAAACTCAACCACAAAATTTGCAT TGCCGCCCACAAACGTCTACTTTAACCACATCCTCTAACATGTTAGAAAC TCCACCCAACTACTTCATTAGTATACAGCATCACAAGGGAGGAGCCAAAC AACTATATAACCAAGTGTACTTCCGAATGGCTGAGTTTATGCCGCCAGAC GGAGACGGGATCGCGACGGAGGAGCGATCGAGCGTCCCGAGGGCGGGTGC CGGAGGTGAGTTTACACACCGCAGTCAAGGGGCAATTCGGGCTCGGGACT GGCCGGGCTATGGGCAAGGCTCTTAAAAAAGCCATGTTTCTCGGTCGACC TTACAGAAAGAAAAGGGCACTGTCACTGCTACGCGTGCGAGCTCCAGAGG CGAAACCACCTGCTATGAGCTGGAGGCCCCCGGTGCACAACCCTAATGGG ATCCAGAGAAACCTGTGGGAGGCATTCTTTCGCATGCATGCTGCAGCTTG
Nome TTV-RTx6 Gênero/Clado Alphatorquevirus, Clado 5 Número de Acesso SRR3438066
TGGTTGTGGCGATCTTGTTGGCCATATTACTGTACTGGCTGGTCGGTATG GTGCTCCTCCTCGTCCCCCGGCCCCCGGGGCTCCCAGACCACCGCTGATA CGCCAGCTGGCCCTTCCGGCGCCCCCCGCCGATCCTCAACAGGCTAACCC ACAATGGCCTGGTGGGGACGGTGGAGAAGATGGCGCTGGAGGCCCCGCCG CTGGCGGCGCCGTCGCAGACGCCGAGTACCAAGAAGACGAGCTCAACGCC CTGTTCGACGCCGTCGAGCAAGAAGAGTAAGGAGGAGGCGATGGGGGAGG CGGAGGTGGAGACGGGGGTACAGACGCAGACTAAGACTGAGACGCAGACG CAGACGAAAGAAAATAAGACTGACTCAGTGGAACCCAGCCAAAGTCAGGA GATGTACTATTAAGGGGGTGCTACCCATGATCTTATGCGGCGCCGGCCGC TCGGGGTTTAACTATGGACTGCACAGCGACGACTACACGGTGCAGAAACC CCTGGGGCAGAACCCCCACGGGGGCGGCATGAGCACAGTAACTTTTAGCC TACAAGTACTATTTGACCAGTACCAGAGGTTTATGAACCGGTGGTCGTAC TCCAACGACCAGCTAGACCTCGCCAGGTACTTTGGCTGCACCTTCTACTT TTACAGACACCCTGAAATTGACTTTGTAGCTCAGTATGACAATGTACCCC CAATGAAAATGGACGAGAACACGGCNCCTAACACTCACCCCTCTTTTCTA CTACAAAACAAACGCAAAATTAAAATCCCCAGCTTTAAAACCAAGCCATT TGGCAGAAAAAGAGTAAAAGTAACAGTGGGGCCCCCCAAACTGTTTGAAG ATAAATGGTACAGCCAGCATGACTTGTGTAAGGTGCCCCTAGTCAGTTGG CGGTTAACCGCATGTGACTTCAGGTTTCCGTTCTGCTCACCACTAACTGA CAACCCTTGCTACACCTTCCAGGTATTGCATGAAAACTATTACCCAGTCA TAGGCACTTCCTCTTTAGAAAACGGTACAAACTACAATAACACTGCTATA ACTACCCTTGAGACATGGCTATATGGAAAATGCACACACTATCAAACATT TGCCACAGACACCAGACTTAATCCACAGAGACCTGTATCTTCAAGTAATG CAAATGAAACTTATACTCCTAGTGGTTCTAAAGAATCAATAATATGGGGA CAGTCTGACTGGGCAAACTTTAAAAAGAACACAGACAGCAACTATGGCTA CTGTTCCTACTGCCCCTCAAATGGCACTAACGGAACAGTAGATAAAATTA AAAAATACAGAGACCAAAGATTTAGATGGCTTACAGAAATGCCAGTACCT AACACCTGTCACATACATGCCACCTTCGCCCGAGGCACTATTAAATACTG GGAGTACCACCTAGGCTGGTACTCAAACATATTTATTGGCAACCTCAGAC ACAACTTAGCCTTCAGACCAGCCTACATAGACATTACCTACAATCCCATC ACTGACAAAGGAGAGGGCAACATTATCTGGTTCCAGTACCTCACTAAGCC CACCACAGAATACATAGAAACCCAGGCAAAATGCACCATTACTAACATTC CCCTTTATGCTGCTTTCTATGGCTACGAAGACTACCTCCAGAGAACACTA GGCCCCTACCAAGATGTAGAAACCCTAGGCATAATCTGTGTTAAATGTCC CTACACAGATCCCCCTCTAGTTCACAAAGACAAAAGTAAAACCAACTGGG GCTACGTATTCTACGACGCCCACTTTGGCAACGGAAAGACCCCAGAGGGA
Nome TTV-RTx6 Gênero/Clado Alphatorquevirus, Clado 5 Número de Acesso SRR3438066
CTAGGCCAAGTACACCCTTACTGGATGCAGAGATGGAGACCCTATGTACA GTTTCAAAAAGACACCATGCACAAAATATCCAGAACGGGACCCTTCAGCT ACAGAGACGACACGCCTTCCATCACCCTCACTGCCGAATACAAGTTTCGT TTTAACTGGGGGGGCGACTCTATATTTCCACAGATTATTAAAAACCCCTG CCCAGACACCGGGGTTCGACCTTCAACCGGTAGAGACCGTCGCTCAGTAC AAGTCGTTAGCCCGCTCACAATGGGACCCCAGTTTATATTCCACTCATGG GACTGGAGACGGGGGTTCTTTAATCAAAAAACTCTCAAAAGAATGCTTGA AAAACCAGTTAATGATGGAGAATATCCAACAGGCCCAAAGGTGCCTCGAT GGTTTCCCCCACTCGACAACCAAGAGCAAGAAGGCGTCTCAGATACAGAG ACGACAACCTCGCAGTCCTCGCAAGAAGAAGCCGCTCAAGAAGCCCTCCA AGAAGTCCAAGAGGCGTCGCTACAGCAGCACCTCCTCCAGCAGTACCGAG AGCAGCGAAGAATCGGAAAGCAACTCCAACTCGTCATGCTCCAACTCACC AAGACGCAGAGCAACCTGCACATAAATCCCCGTGTCCTTGGCCATGCATA AATAAAGTGTACATGTTTCCCCCCGAAAAGCCAATGCCCATACACGGCTA CCACGGGTGGGAGACAGAGTATCAGGCCTGCAAGGCCTTTGACAGGCCCC CTAGAAACTACCTATCAGACAAACCCATCTACCCCTGGCTTCCCCGCTCC CAACCAGAATTTAAAGTGAGTTTTAAGCTTGGCTGTCAATAAACAAGNNN NNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN NNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN NNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN NNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN NNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN NNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN NNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN NNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN NNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN NNNNNGTTTACACAAAATGGTGGCCAAGTCCTTCCGGGTGAAAGGTCGGC GCCTACGTCATAAGTCACGTGGGGAGGGCTGCGTCACAACCAGGAAGCAA TCCTCACCACGTGATTTGTCACGTGATCGCTACGTCACGGCCGCCATTTT
AGTTTACAAAATGGCGGACTTCCTTCCTCTTTTTCAAAAATAACGGCCCT GCGGCGGCGCGCGCGCTGCGCGCGCGCGCCGGGGGCTGCCGCCCCA (SEQ ID NO: 870) Anotações: Domínio Putativo Gama base
Nome TTV-RTx6 Gênero/Clado Alphatorquevirus, Clado 5 Número de Acesso SRR3438066 Caixa TATA 206 – 210 Elemento Iniciador 224 – 239 Local de Início Transcricional 234 Domínio Conservado 5´ UTR 294 – 364 ORF2 465 – 830 ORF2/2 465 – 826 ; 2534 – 2975 ORF2/3 465 – 826; 2721 – 3192 ORF2t/3 465 – 595 ; 2721 – 3192 ORF1 704 – 3001 ORF1/1 704 – 826; 2534 – 3001 ORF1/2 704 – 826; 2721 – 2975 Região de três grelhas de leitura aberta 2721 – 2975 Sinal de Poli(A) 3189 – 3193 Sequência desconhecida 3198 – 3655 Região rica em GC ou uma sua porção** 3844 – 3895 Tabela A12. Novas sequências de aminoácidos de Anellovirus (Alphatorquevirus, Clado 5) TTV-RTx6 (Clado 5 de Alphatorquevirus) ORF2 MSWRPPVHNPNGIQRNLWEAFFRMHAAACGCGDLVGHITVLAGRYGAPPR
PPAPGAPRPPLIRQLALPAPPADPQQANPQWPGGDGGEDGAGGPAAGGA VADAEYQEDELNALFDAVEQEE (SEQ ID NO: 871) ORF2/2 MSWRPPVHNPNGIQRNLWEAFFRMHAAACGCGDLVGHITVLAGRYGAPPR
PPAPGAPRPPLIRQLALPAPPADPQQANPQWPGGDGGEDGAGGPAAGGA VADAEYQEDELNALFDAVEQEELLKTPAQTPGFDLQPVETVAQYKSLARSQ WDPSLYSTHGTGDGGSLIKKLSKECLKNQLMMENIQQAQRCLDGFPHSTTK
SKKASQIQRRQPRSPRKKKPLKKPSKKSKRRRYSSTSSSSTESSEESESNS NSSCSNSPRRRATCT (SEQ ID NO: 872) ORF2/3 MSWRPPVHNPNGIQRNLWEAFFRMHAAACGCGDLVGHITVLAGRYGAPPR
PPAPGAPRPPLIRQLALPAPPADPQQANPQWPGGDGGEDGAGGPAAGGA VADAEYQEDELNALFDAVEQEEISNRPKGASMVSPTRQPRARRRLRYRDD NLAVLARRSRSRSPPRSPRGVATAAPPPAVPRAAKNRKATPTRHAPTHQD
AEQPAHKSPCPWPCINKVYMFPPEKPMPIHGYHGWETEYQACKAFDRPPR NYLSDKPIYPWLPRSQPEFKVSFKLGCQ (SEQ ID NO: 873) ORF2t/3 MSWRPPVHNPNGIQRNLWEAFFRMHAAACGCGDLVGHITVLAGRISNRPK
GASMVSPTRQPRARRRLRYRDDNLAVLARRSRSRSPPRSPRGVATAAPPP
TTV-RTx6 (Clado 5 de Alphatorquevirus)
AVPRAAKNRKATPTRHAPTHQDAEQPAHKSPCPWPCINKVYMFPPEKPMPI
HGYHGWETEYQACKAFDRPPRNYLSDKPIYPWLPRSQPEFKVSFKLGCQ (SEQ ID NO: 874) ORF1 MAWWGRWRRWRWRPRRWRRRRRRRVPRRRAQRPVRRRRARRVRRRR
WGRRRWRRGYRRRLRLRRRRRRKKIRLTQWNPAKVRRCTIKGVLPMILCG AGRSGFNYGLHSDDYTVQKPLGQNPHGGGMSTVTFSLQVLFDQYQRFMN RWSYSNDQLDLARYFGCTFYFYRHPEIDFVAQYDNVPPMKMDENTAPNTH PSFLLQNKRKIKIPSFKTKPFGRKRVKVTVGPPKLFEDKWYSQHDLCKVPLV SWRLTACDFRFPFCSPLTDNPCYTFQVLHENYYPVIGTSSLENGTNYNNTAI TTLETWLYGKCTHYQTFATDTRLNPQRPVSSSNANETYTPSGSKESIIWGQ SDWANFKKNTDSNYGYCSYCPSNGTNGTVDKIKKYRDQRFRWLTEMPVPN TCHIHATFARGTIKYWEYHLGWYSNIFIGNLRHNLAFRPAYIDITYNPITDKGE GNIIWFQYLTKPTTEYIETQAKCTITNIPLYAAFYGYEDYLQRTLGPYQDVETL GIICVKCPYTDPPLVHKDKSKTNWGYVFYDAHFGNGKTPEGLGQVHPYWM QRWRPYVQFQKDTMHKISRTGPFSYRDDTPSITLTAEYKFRFNWGGDSIFP QIIKNPCPDTGVRPSTGRDRRSVQVVSPLTMGPQFIFHSWDWRRGFFNQK TLKRMLEKPVNDGEYPTGPKVPRWFPPLDNQEQEGVSDTETTTSQSSQEE
AAQEALQEVQEASLQQHLLQQYREQRRIGKQLQLVMLQLTKTQSNLHINPR VLGHA (SEQ ID NO: 875) ORF1/1 MAWWGRWRRWRWRPRRWRRRRRRRVPRRRAQRPVRRRRARRIIKNPC
PDTGVRPSTGRDRRSVQVVSPLTMGPQFIFHSWDWRRGFFNQKTLKRMLE KPVNDGEYPTGPKVPRWFPPLDNQEQEGVSDTETTTSQSSQEEAAQEALQ
EVQEASLQQHLLQQYREQRRIGKQLQLVMLQLTKTQSNLHINPRVLGHA (SEQ ID NO: 876) ORF1/2 MAWWGRWRRWRWRPRRWRRRRRRRVPRRRAQRPVRRRRARRNIQQA
QRCLDGFPHSTTKSKKASQIQRRQPRSPRKKKPLKKPSKKSKRRRYSSTSS SSTESSEESESNSNSSCSNSPRRRATCT (SEQ ID NO: 877) Tabela 1. Sequência de ácidos nucleicos de Anellovirus exemplificativa (Alphatorquevirus, Clado 1) Nome TTV-CT30F Gênero/Clado Alphatorquevirus, Clado 1 Número de Acesso AB064597.1 Sequência Total: 3570 pb 1 10 20 30 40 50 | | | | | |
ATTTTGTGCAGCCCGCCAATTCTCGTTCAAACAGGCCAATCAGGAGGCTC TACGTACACTTCCTGGGGTGTGTCTTCGAAGAGTATATAAGCAGAGGCGG TGACGAATGGTAGAGTTTTTCCTGGCCCGTCCGCGGCGAGAGCGCGAGCG
Nome TTV-CT30F Gênero/Clado Alphatorquevirus, Clado 1 Número de Acesso AB064597.1
GAGCGAGCGATCGAGCGTCCCGTGGGCGGGTGCCGTAGGTGAGTTTACAC ACCGCAGTCAAGGGGCAATTCGGGCTCGGGACTGGCCGGGCTATGGGCAA GATTCTTAAAAAATTCCCCCGATCCCTCTGTCGCCAGGACATAAAAACAT GCCGTGGAGACCGCCGGTGCATAGTGTCCAGGGGCGAGAGGATCAGTGGT TCGCGAGCTTTTTTCACGGCCACGCTTCATTTTGCGGTTGCGGTGACGCT GTTGGCCATCTTAATAGCATTGCTCCTCGCTTTCCTCGCGCCGGTCCACC AAGGCCCCCTCCGGGGCTAGAGCAGCCTAACCCCCCGCAGCAGGGCCCGG CCGGGCCCGGAGGGCCGCCCGCCATCTTGGCGCTGCCGGCTCCGCCCGCG GAGCCTGACGACCCGCAGCCACGGCGTGGTGGTGGGGACGGTGGCGCCGC CGCTGGCGCCGCAGGCGACCGTGGAGACCGAGACTACGACGAAGAAGAGC TAGACGAGCTTTTCCGCGCCGCCGCCGAAGACGATTTGTAAGTAGGAGAT GGCGCCGGCCTTACAGGCGCAGGAGGAGACGCGGGCGACGCAGACGCAGA CGCAGACGCAGACATAAGCCCACCCTAGTACTCAGACAGTGGCAACCTGA CGTTATCAGACACTGTAAGATAACAGGACGGATGCCCCTCATTATCTGTG GAAAGGGGTCCACCCAGTTCAACTACATCACCCACGCGGACGACATCACC CCCAGGGGAGCCTCCTACGGGGGCAACTTCACAAACATGACTTTCTCCCT GGAGGCAATATACGAACAGTTTCTGTACCACAGAAACAGGTGGTCAGCCT CCAACCACGACCTCGAACTCTGCAGATACAAGGGTACCACCCTAAAACTG TACAGGCACCCAGATGTAGACTACATAGTCACCTACAGCAGAACGGGACC CTTTGAGATCAGCCACATGACCTACCTCAGCACTCACCCCCTTCTCATGC TGCTAAACAAACACCACATAGTGGTGCCCAGCCTAAAGACTAAGCCCAGG GGCAGAAAGGCCATAAAAGTCAGAATAAGACCCCCCAAACTCATGAACAA CAAGTGGTACTTCACCAGAGACTTCTGTAACATAGGCCTCTTCCAGCTCT GGGCCACAGGCTTAGAACTCAGAAACCCCTGGCTCAGAATGAGCACCCTG AGCCCCTGCATAGGCTTCAATGTCCTTAAAAACAGCATTTACACAAACCT CAGCAACCTACCTCAGCACAGAGAAGACAGACTTAACATTATTAACAACA CATTACACCCACATGACATAACAGGACCAAACAATAAAAAATGGCAGTAC ACATATACCAAACTCATGGCCCCCATTTACTATTCAGCAAACAGGGCCAG CACCTATGACTTACTACGAGAGTATGGCCTCTACAGTCCATACTACCTAA ACCCCACAAGGATAAACCTTGACTGGATGACCCCCTACACACACGTCAGG TACAATCCACTAGTAGACAAGGGCTTCGGAAACAGAATATACATACAGTG GTGCTCAGAGGCAGATGTAAGCTACAACAGGACTAAATCCAAGTGTCTCT TACAAGACATGCCCCTGTTTTTCATGTGCTATGGCTACATAGACTGGGCA ATTAAAAACACAGGGGTCTCCTCACTAGCGAGAGACGCCAGAATCTGCAT CAGGTGTCCCTACACAGAGCCACAGCTGGTGGGCTCCACAGAAGACATAG GGTTCGTACCCATCACAGAGACCTTCATGAGGGGCGACATGCCGGTACTT
Nome TTV-CT30F Gênero/Clado Alphatorquevirus, Clado 1 Número de Acesso AB064597.1
GCACCATACATACCGTTGAGCTGGTTTTGCAAGTGGTATCCCAACATAGC TCACCAGAAGGAAGTACTTGAGGCAATCATTTCCTGCAGCCCCTTCATGC CCCGTGACCAGGGCATGAACGGTTGGGATATTACAATAGGTTACAAAATG GACTTCTTATGGGGCGGTTCCCCTCTCCCCTCACAGCCAATCGACGACCC CTGCCAGCAGGGAACCCACCCGATTCCCGACCCCGATAAGCACCCTCGCC TCCTACAAGTGTCGAACCCGAAACTGCTCGGACCGAGGACAGTGTTCCAC AAGTGGGACATCAGACGTGGGCAGTTTAGCAAAAGAAGTATTAAAAGAGT GTCAGAATACTCATCGGATGATGAATCTCTTGCGCCAGGTCTCCCATCAA AGCGAAACAAGCTCGACTCGGCCTTCAGAGGAGAAAACCCAGAGCAAAAA GAATGCTATTCTCTCCTCAAAGCACTCGAGGAAGAAGAGACCCCAGAAGA AGAAGAACCAGCACCCCAAGAAAAAGCCCAGAAAGAGGAGCTACTCCACC AGCTCCAGCTCCAGAGACGCCACCAGCGAGTCCTCAGACGAGGGCTCAAG CTCGTCTTTACAGACATCCTCCGACTCCGCCAGGGAGTCCACTGGAACCC CGAGCTCACATAGAGCCCCCACCTTACATACCAGACCTACTTTTTCCCAA TACTGGTAAAAAAAAAAAATTCTCTCCCTTCGACTGGGAAACGGAGGCCC AGCTAGCAGGGATATTCAAGCGTCCTATGCGCTTCTATCCCTCAGACACC CCTCACTACCCGTGGTTACCCCCCAAGCGCGATATCCCGAAAATATGTAA CATAAACTTCAAAATAAAGCTGCAAGAGTGAGTGATTCGAGGCCCTCCTC TGTTCACTTAGCGGTGTCTACCTCTTAAAGTCACCAAGCACTCCGAGCGT CAGCGAGGAGTGCGACCCTCCACCAAGGGGCAACTTCCTCGGGGTCCGGC GCTACGCGCTTCGCGCTGCGCCGGACGCCTCGGACCCCCCCCCGACCCGA ATCGCTCGCGCGATTCGGACCTGCGGCCTCGGGGGGGGTCGGGGGCTTTA CTAAACAGACTCCGAGTTGCCACTGGACTCAGGAGCTGTGAATCAGTAAC GAAAGTGAGTGGGGCCAGACTTCGCCATAGGGCCTTTAACTTGGGGTCGT CTGTCGGTGGCTTCCGGGTCCGCCTGGGCGCCGCCATTTTAGCTTTAGAC GCCATTTTAGGCCCTCGCGGGCACCCGTAGGCGCGTTTTAATGACGTCAC GGCAGCCATTTTGTCGTGACGTTTGAGACACGTGATGGGGGCGTGCCTAA ACCCGGAAGCATCCCTGGTCACGTGACTCTGACGTCACGGCGGCCATTTT GTGCTGTCCGCCATCTTGTGACTTCCTTCCGCTTTTTCAAAAAAAAAGAG GAAGTATGACAGTAGCGGCGGGGGGGCGGCCGCGTTCGCGCGCCGCCCAC CAGGGGGTGCTGCGCGCCCCCCCCCGCGCATGCGCGGGGCCCCCCCCCGG
GGGGGCTCCGCCCCCCCGGCCCCCCCCCGTGCTAAACCCACCGCGCATGC GCGACCACGCCCCCGCCGCC (SEQ ID NO: 1) Anotações: Domínio Putativo Gama base
Nome TTV-CT30F Gênero/Clado Alphatorquevirus, Clado 1 Número de Acesso AB064597.1 Caixa TATA 84 – 90 Local Cap 107 – 114 Local de Início Transcricional 114 Domínio Conservado 5´ UTR 177 – 247 ORF2 299 – 691 ORF2/2 299 – 687 ; 2137 – 2659 ORF2/3 299 – 687 ; 2339 – 2831 ORF2t/3 299 – 348 ; 2339 – 2831 ORF1 571 – 2613 ORF1/1 571 – 687 ; 2137 – 2613 ORF1/2 571 – 687 ; 2339 – 2659 Região de três grelhas de leitura aberta 2325 – 2610 Sinal de Poli(A) 2813 – 2818 Região rica em GC 3415 – 3570 Tabela 2. Sequências de aminoácidos de Anellovirus exemplificativas (Alphatorquevirus, Clado 1) TTV-CT30F (Clado 1 de Alphatorquevirus) ORF2 MPWRPPVHSVQGREDQWFASFFHGHASFCGCGDAVGHLNSIAPRFPRAG
PPRPPPGLEQPNPPQQGPAGPGGPPAILALPAPPAEPDDPQPRRGGGDGG AAAGAAGDRGDRDYDEEELDELFRAAAEDDL (SEQ ID NO: 2) ORF2/2 MPWRPPVHSVQGREDQWFASFFHGHASFCGCGDAVGHLNSIAPRFPRAG
PPRPPPGLEQPNPPQQGPAGPGGPPAILALPAPPAEPDDPQPRRGGGDGG AAAGAAGDRGDRDYDEEELDELFRAAAEDDFQSTTPASREPTRFPTPISTL ASYKCRTRNCSDRGQCSTSGTSDVGSLAKEVLKECQNTHRMMNLLRQVSH QSETSSTRPSEEKTQSKKNAILSSKHSRKKRPQKKKNQHPKKKPRKRSYST
SSSSRDATSESSDEGSSSSLQTSSDSARESTGTPSSHRAPTLHTRPTFSQY W (SEQ ID NO: 3) ORF2/3 MPWRPPVHSVQGREDQWFASFFHGHASFCGCGDAVGHLNSIAPRFPRAG
PPRPPPGLEQPNPPQQGPAGPGGPPAILALPAPPAEPDDPQPRRGGGDGG AAAGAAGDRGDRDYDEEELDELFRAAAEDDLSPIKAKQARLGLQRRKPRAK RMLFSPQSTRGRRDPRRRRTSTPRKSPERGATPPAPAPETPPASPQTRAQ
ARLYRHPPTPPGSPLEPRAHIEPPPYIPDLLFPNTGKKKKFSPFDWETEAQL AGIFKRPMRFYPSDTPHYPWLPPKRDIPKICNINFKIKLQE (SEQ ID NO: 4) ORF2t/3 MPWRPPVHSVQGREDQWSPIKAKQARLGLQRRKPRAKRMLFSPQSTRGR
TTV-CT30F (Clado 1 de Alphatorquevirus)
RDPRRRRTSTPRKSPERGATPPAPAPETPPASPQTRAQARLYRHPPTPPG
SPLEPRAHIEPPPYIPDLLFPNTGKKKKFSPFDWETEAQLAGIFKRPMRFYPS DTPHYPWLPPKRDIPKICNINFKIKLQE (SEQ ID NO: 5) ORF1 TAWWWGRWRRRWRRRRPWRPRLRRRRARRAFPRRRRRRFVSRRWRRP
YRRRRRRGRRRRRRRRRHKPTLVLRQWQPDVIRHCKITGRMPLIICGKGST QFNYITHADDITPRGASYGGNFTNMTFSLEAIYEQFLYHRNRWSASNHDLEL CRYKGTTLKLYRHPDVDYIVTYSRTGPFEISHMTYLSTHPLLMLLNKHHIVVP SLKTKPRGRKAIKVRIRPPKLMNNKWYFTRDFCNIGLFQLWATGLELRNPWL RMSTLSPCIGFNVLKNSIYTNLSNLPQHREDRLNIINNTLHPHDITGPNNKKW QYTYTKLMAPIYYSANRASTYDLLREYGLYSPYYLNPTRINLDWMTPYTHVR YNPLVDKGFGNRIYIQWCSEADVSYNRTKSKCLLQDMPLFFMCYGYIDWAIK NTGVSSLARDARICIRCPYTEPQLVGSTEDIGFVPITETFMRGDMPVLAPYIP LSWFCKWYPNIAHQKEVLEAIISCSPFMPRDQGMNGWDITIGYKMDFLWGG SPLPSQPIDDPCQQGTHPIPDPDKHPRLLQVSNPKLLGPRTVFHKWDIRRG QFSKRSIKRVSEYSSDDESLAPGLPSKRNKLDSAFRGENPEQKECYSLLKAL
EEEETPEEEEPAPQEKAQKEELLHQLQLQRRHQRVLRRGLKLVFTDILRLRQ GVHWNPELT (SEQ ID NO: 6) ORF1/1 TAWWWGRWRRRWRRRRPWRPRLRRRRARRAFPRRRRRRFPIDDPCQQ
GTHPIPDPDKHPRLLQVSNPKLLGPRTVFHKWDIRRGQFSKRSIKRVSEYSS
DDESLAPGLPSKRNKLDSAFRGENPEQKECYSLLKALEEEETPEEEEPAPQ EKAQKEELLHQLQLQRRHQRVLRRGLKLVFTDILRLRQGVHWNPELT (SEQ ID NO: 7) ORF1/2 TAWWWGRWRRRWRRRRPWRPRLRRRRARRAFPRRRRRRFVSHQSETS
STRPSEEKTQSKKNAILSSKHSRKKRPQKKKNQHPKKKPRKRSYSTSSSSR DATSESSDEGSSSSLQTSSDSARESTGTPSSHRAPTLHTRPTFSQYW (SEQ ID NO: 8) Tabela 3. Sequência exemplificativa de ácido nucleico de Anellovirus (Alphatorquevirus, Clado 2) Nome TTV-P13-1 Gênero/Clado Alphatorquevirus, Clado 2 Número de Acesso KT163896.1 Sequência Total: 3451 pb 1 10 20 30 40 50 | | | | | |
AATTTTGCTAAACAGACTCCGAGGTGCTCTTGGACACTGAGTGGGCGTAC AGCAACGAAAGTGAGTGGGGCCAGACTTCGCCATAAGGCCTTTATCTTCG GGTCTACATCATAATATAAAGATGTGCACTTCCGAATGGCTGAGTTTTTC ACGCCATTCCGCAGCGGTGGAGCAGCGCAGCCACGACCCCCGCGTCCCGA GGGCGGGTGCCGGAGGTGAGTTTACACACCGCAGTCAAGGGGCAATTCGG GCTCGGGACTGGCCGGGCCCGGGCAAGGCTCTTAAAGCGAAACCATGTTC CTCGGCAGGCCCTACCGCCACAGAAAGCGGCACCAGGCCGGCAAGAAAGG GCCACTGCCACTGCCAAATCTGCAACCTGCACAGGAGAAACGGGCTGGTG GTCCGTCCTTGATGGCCTCCGGACGCAGGGGATGGATGCCCCCGGACCTG ACGGTCCAGGAGAGGGAGGATGCCTGGTGGACCAGCTTCTGCGCTAGCCA CCGCAGCTTTTGTAGCTGCGACGATCCTGTGGGCCATATTAATACTCTCG CCCGCGATAATAGTCCTCTGGCCCAGACTCCTACTACAACTTCAGGCCAG GGGCCGCCGCCGCCGCCTACGCCTCCGCGGACGCCGGGGCCGCGCCCTGG GTCTGCTCCGGACCAGGGGGGAAGGATCAGGGCCTCCTGGACCTACCCCC TAGCCCCCGGAGGTCCCGGTAGCACGCCATGGCCTACTGGTGGGGCCGGA GACGCCGGTGGCGCCGCTGGAGGAGGCGCCGGCGTCCTCTCCGCCGCCGC CGGCGGTGGCGGAGAAGGCGACGCTGGCCCAGAAGGCGCCGGTGGAGGCG AAGGAGACGACGTGCGAGACCTGCTCGCCGCTATCGAAGGAGACGTGGGC GCAGACGGGTAAGGAGACGCCGTCGCCCCCAGAAACTAGTACTGACTCAG TGGAATCCCCAGACTGTGAGAAAGTGTGTTATTAGGGGGTTTCTGCCCCT GTTCTTCTGCGGACAGGGGGCCTACCACAGAAACTTTACAGACCACTATG ACGATGTGTTCCCCAAGGGACCCAGCGGAGGTGGGCACGGGAGCATGGTG TTCAACCTGTCCTTTCTGTACCAAGAGTTTAAGAAGCACCACAATAAGTG GTCGCGCAGCAACCTGGACTTTGACTTAGTGAGATACAAGGGCACAGTGA TAAAGCTGTACAGACACCAGGACTTTGACTACATAGTGTGGATAAGCAGG ACCCCTCCCTTCCAGGAGAGCCTGCTCACAGTAATGACCCACCAGCCCAG CGTCATGCTGCAGGCAAAAAAGTGCATAATAGTAAAGAGCTACAGGACCC ACCCGGGGGGCAAACCCTATGTAACTGCAAAAGTTAGGCCCCCCAGACTC CTAACTGACAAGTGGTACTTCCAGTCAGACTTCTGCAACGTTCCGCTTTT TAGCCTACAGTTTGCCCTTGCGGAACTGCGGTTTCCGATCTGCTCACCAC AAACTGACACCAATTGCATTAACTTCCTGGTGTTAGATGACATCTACTAC AAGTTTCTAGATAATAAGCCTAAACAGAGTTCAGACCCTAATGACGAAAA CAGAATAAAATTCTGGCACGGCCTATGGTCCACTATGAGATATTTAAACA CCACCTACATAAACACACTGTTTCCAGGCACAGACAGTCTAGTGGCCGCC AAAGATACTGACAATAGTGTAAATAAATACCCCAGCACAGCCACTAAACA GCCCTACAAAGACAGTCAGTACATGCAAAATATATGGAATACATCAAAAA TACATGCCTTATATACGTGGGTAGCAGAGACAAACTACAAAAGACTGCAG GCCTACTACACACAGACCTACGGAGGCTACCAGAGACAATTTTTCACAGG AAAACAGTACTGGGACTACAGAGTAGGCATGTTTAGTCCAGCCTTCCTGA GTCCCAGCAGACTAAATCCCCAGAACCCAGGGGCATACACAGAGGTCTCC TACAACCCCTGGACAGACGAGGGCACGGGCAACGTAGTGTGCCTGCAGTA TCTGACTAAAGAGACCTCAGACTACAAACCAGGTGGTGGGAGCAAGTTCT GCATAGAAGGTGTGCCTCTATGGGCAGCGCTGGTGGGATACGTAGACATG TGTAAAAAAGAGGGCAAGGACCCGGGCATCAGACTAAACTGTCTCCTGTT AGTCAAGTGTCCCTATACAAAGCCTCAGCTGTATGACAAAAAAAACCCCG AGAAACTGTTTGTACCTTACTCCTATAACTTTGGGCACGGCAAGATGCCG GGGGGAGACAAATACATACCCATAGAGTTCAAAGACAGGTGGTACCCCTG CCTGCTCCACCAAGAGGAGTGGATAGAGGACATTGTCAGGTCGGGACCCT TCGTTCCAAAAGACATGCCCAGCAGCGTCACCTGCATGATGAGGTACAGC TCTCTTTTTAACTGGGGCGGTAATATAATCCAAGAACAGGCCGTGGAAGA CCCCTGTAAGAAAGGCACCTTCGTCGTTCCCGGAACCAGTGGCATCGCTC GCATACTACAAGTCAGCAACCCGGCCAAGCAGACCCCCACGACAACCTGG CACTCGTGGGACTGGAGACGATCCCTCTTTACAGAGACGGGTCTTAAAAG AATGCGCGAACAACAACCATATGATGAACTGTCTTATACGGGCCCTAAAA AGCCAAAACTGTCCCTTCCCGCAGGGCCCGCCGTCCCCGGTGCCGCCGTC GCCTCCTCCTGGTGGGAAACAAAACAGGTCACCTCGCCAGACGTCAGCGA GACGGAGACCGAAGCAGAAGCCCACCAAGAGGAAGAGACGGAGCCGGAGG AGGGAGTCCAGCTCCAGCAGCTGTGGGAGCAGCAACTCCTGCAAAAGCGA CAGCTGGGAGTCGTGTTCCAGCAACTCCTCCGACTCAGACAGGGGGCGGA GATCCACCCGGGCCTCGTATAATTCCTGGGCCCCAGAACCCGTACCTGCT TTTCCCGGAGCAGGCCCCTCCAAAAGTGCCTATTTTTGACCCCTTTGGTC AGAAAACAGAGCTAGAGCTGTGCGGCTGCTTCGACAGGCCGCCCAGGAAC AACCCCTACGACCACCCCTTCTACCCCTGGCTGCCCAAAGAGCCTCCCTC CTACTACCAGGGCTACAAAGTGTCTTTCAAACTAGGGTTCCACCCAGACA AGCATGTGTGAACCCCGCCAATAAACCACTGCTGCTACACTGATTCTTAG GCCGTGGGAGTCTCACTGGTCGGTGTCTACCTCTTAAGGTCACTAAGCAC TCCGAGCGTTAGCGAGGAGTGCGACCCTACCCCCTGGGCCCACTTCTTCG GAGCCGCGCGCTACGCCTTCGGCTGCGCGCGGCACCTCAGACCCCCGCTC
GTGCTGACACGCTTGCGCGTGTCAGACCACTTCGGGCTCGCGGGGGTCGG G (SEQ ID NO: 9) Anotações: Domínio Putativo Gama base Caixa TATA 112 – 119 Elemento Iniciador 128-148 Local de Início Transcricional 148 Domínio Conservado 5´ UTR 204 – 273 ORF2 412-912 ORF2/2 412 – 908 ; 2490 – 3039 ORF2/3 412 – 908 ; 2725 – 3208 ORF1 729 – 2972 ORF1/1 729 – 908 ; 2490 – 2972
ORF1/2 729 – 908 ; 2725 – 3039 Região de três grelhas de leitura aberta 2699 – 2969 Sinal de Poli(A) 3220 - 3225 região rica em GC 3302 – 3541 Tabela 4. Sequências exemplificativas de aminoácido de Anellovirus (Alphatorquevirus, Clado 2) TTV-P13-1 (Alphatorquevirus Clado 2) ORF2 MASGRRGWMPPDLTVQEREDAWWTSFCASHRSFCSCDDPVGHINTLARD
NSPLAQTPTTTSGQGPPPPPTPPRTPGPRPGSAPDQGGRIRASWTYPLAP
GGPGSTPWPTGGAGDAGGAAGGGAGVLSAAAGGGGEGDAGPEGAGGG EGDDVRDLLAAIEGDVGADG (SEQ ID NO: 10) ORF2/2 MASGRRGWMPPDLTVQEREDAWWTSFCASHRSFCSCDDPVGHINTLARD
NSPLAQTPTTTSGQGPPPPPTPPRTPGPRPGSAPDQGGRIRASWTYPLAP GGPGSTPWPTGGAGDAGGAAGGGAGVLSAAAGGGGEGDAGPEGAGGG EGDDVRDLLAAIEGDVGADGPWKTPVRKAPSSFPEPVASLAYYKSATRPSR PPRQPGTRGTGDDPSLQRRVLKECANNNHMMNCLIRALKSQNCPFPQGPP SPVPPSPPPGGKQNRSPRQTSARRRPKQKPTKRKRRSRRRESSSSSCGS
SNSCKSDSWESCSSNSSDSDRGRRSTRASYNSWAPEPVPAFPGAGPSKS AYF (SEQ ID NO: 11) ORF2/3 MASGRRGWMPPDLTVQEREDAWWTSFCASHRSFCSCDDPVGHINTLARD
NSPLAQTPTTTSGQGPPPPPTPPRTPGPRPGSAPDQGGRIRASWTYPLAP GGPGSTPWPTGGAGDAGGAAGGGAGVLSAAAGGGGEGDAGPEGAGGG EGDDVRDLLAAIEGDVGADGARRPRCRRRLLLVGNKTGHLARRQRDGDRS RSPPRGRDGAGGGSPAPAAVGAATPAKATAGSRVPATPPTQTGGGDPPG
PRIIPGPQNPYLLFPEQAPPKVPIFDPFGQKTELELCGCFDRPPRNNPYDHP FYPWLPKEPPSYYQGYKVSFKLGFHPDKHV (SEQ ID NO: 12) ORF1 MAYWWGRRRRWRRWRRRRRPLRRRRRWRRRRRWPRRRRWRRRRRRA
RPARRYRRRRGRRRVRRRRRPQKLVLTQWNPQTVRKCVIRGFLPLFFCGQ GAYHRNFTDHYDDVFPKGPSGGGHGSMVFNLSFLYQEFKKHHNKWSRSN LDFDLVRYKGTVIKLYRHQDFDYIVWISRTPPFQESLLTVMTHQPSVMLQAK KCIIVKSYRTHPGGKPYVTAKVRPPRLLTDKWYFQSDFCNVPLFSLQFALAE LRFPICSPQTDTNCINFLVLDDIYYKFLDNKPKQSSDPNDENRIKFWHGLWS TMRYLNTTYINTLFPGTDSLVAAKDTDNSVNKYPSTATKQPYKDSQYMQNI WNTSKIHALYTWVAETNYKRLQAYYTQTYGGYQRQFFTGKQYWDYRVGM FSPAFLSPSRLNPQNPGAYTEVSYNPWTDEGTGNVVCLQYLTKETSDYKP GGGSKFCIEGVPLWAALVGYVDMCKKEGKDPGIRLNCLLLVKCPYTKPQLY DKKNPEKLFVPYSYNFGHGKMPGGDKYIPIEFKDRWYPCLLHQEEWIEDIVR SGPFVPKDMPSSVTCMMRYSSLFNWGGNIIQEQAVEDPCKKGTFVVPGTS
TTV-P13-1 (Alphatorquevirus Clado 2)
GIARILQVSNPAKQTPTTTWHSWDWRRSLFTETGLKRMREQQPYDELSYT
GPKKPKLSLPAGPAVPGAAVASSWWETKQVTSPDVSETETEAEAHQEEET EPEEGVQLQQLWEQQLLQKRQLGVVFQQLLRLRQGAEIHPGLV (SEQ ID NO: 13) ORF1/1 MAYWWGRRRRWRRWRRRRRPLRRRRRWRRRRRWPRRRRWRRRRRRA
RPARRYRRRRGRRRAVEDPCKKGTFVVPGTSGIARILQVSNPAKQTPTTTW HSWDWRRSLFTETGLKRMREQQPYDELSYTGPKKPKLSLPAGPAVPGAAV
ASSWWETKQVTSPDVSETETEAEAHQEEETEPEEGVQLQQLWEQQLLQK RQLGVVFQQLLRLRQGAEIHPGLV (SEQ ID NO: 14) ORF1/2 MAYWWGRRRRWRRWRRRRRPLRRRRRWRRRRRWPRRRRWRRRRRRA
RPARRYRRRRGRRRGPPSPVPPSPPPGGKQNRSPRQTSARRRPKQKPTK
RKRRSRRRESSSSSCGSSNSCKSDSWESCSSNSSDSDRGRRSTRASYNS WAPEPVPAFPGAGPSKSAYF (SEQ ID NO: 15) Tabela 5. Sequência de ácidos nucleicos de Anellovirus exemplificativa (Alphatorquevirus, Clado 3) Nome TTV-tth8 Gênero/Clado Alphatorquevirus, Clado 3 Número de Acesso AJ620231.1 Sequência Total: 3753 pb 1 10 20 30 40 50 | | | | | |
TGCTACGTCACTAACCCACGTGTCCTCTACAGGCCAATCGCAGTCTATGT CGTGCACTTCCTGGGCATGGTCTACATAATTATATAAATGCTTGCACTTC CGAATGGCTGAGTTTTTGCTGCCCGTCCGCGGAGAGGAGCCACGGCAGGG GATCCGAACGTCCTGAGGGCGGGTGCCGGAGGTGAGTTTACACACCGAAG TCAAGGGGCAATTCGGGCTCAGGACTGGCCGGGCTTTGGGCAAGGCTCTT AAAAATGCACTTTTCTCGAATAAGCAGAAAGAAAAGGAAAGTGCTACTGC TTTGCGTGCCAGCAGCTAAGAAAAAACCAACTGCTATGAGCTTCTGGAAA CCTCCGGTACACAATGTCACGGGGATCCAACGCATGTGGTATGAGTCCTT TCACCGTGGCCACGCTTCTTTTTGTGGTTGTGGGAATCCTATACTTCACA TTACTGCACTTGCTGAAACATATGGCCATCCAACAGGCCCGAGACCTTCT GGGCCACCGGGAGTAGACCCCAACCCCCACATCCGTAGAGCCAGGCCTGC CCCGGCCGCTCCGGAGCCCTCACAGGTTGATTCGAGACCAGCCCTGACAT GGCATGGGGATGGTGGAAGCGACGGAGGCGCTGGTGGTTCCGGAAGCGGT GGACCCGTGGCAGACTTCGCAGACGATGGCCTCGATCAGCTCGTCGCCGC CCTAGACGACGAAGAGTAAGGAGGCGCAGACGGTGGAGGAGGGGGAGACG AAAAACAAGGACTTACAGACGCAGGAGACGCTTTAGACGCAGGGGACGAA AAGCAAAACTTATAATAAAACTGTGGCAACCTGCAGTAATTAAAAGATGC AGAATAAAGGGATACATACCACTGATTATAAGTGGGAACGGTACCTTTGC CACAAACTTTACCAGTCACATAAATGACAGAATAATGAAAGGCCCCTTCG GGGGAGGACACAGCACTATGAGGTTCAGCCTCTACATTTTGTTTGAGGAG CACCTCAGACACATGAACTTCTGGACCAGAAGCAACGATAACCTAGAGCT AACCAGATACTTGGGGGCTTCAGTAAAAATATACAGGCACCCAGACCAAG ACTTTATAGTAATATACAACAGAAGAACCCCTCTAGGAGGCAACATCTAC ACAGCACCCTCTCTACACCCAGGCAATGCCATTTTAGCAAAACACAAAAT ATTAGTACCAAGTTTACAGACAAGACCAAAGGGTAGAAAAGCAATTAGAC TAAGAATAGCACCCCCCACACTCTTTACAGACAAGTGGTACTTTCAAAAG GACATAGCCGACCTCACCCTTTTCAACATCATGGCAGTTGAGGCTGACTT GCGGTTTCCGTTCTGCTCACCACAAACTGACAACACTTGCATCAGCTTCC AGGTCCTTAGTTCCGTTTACAACAACTACCTCAGTATTAATACCTTTAAT AATGACAACTCAGACTCAAAGTTAAAAGAATTTTTAAATAAAGCATTTCC AACAACAGGCACAAAAGGAACAAGTTTAAATGCACTAAATACATTTAGAA CAGAAGGATGCATAAGTCACCCACAACTAAAAAAACCAAACCCACAAATA AACAAACCATTAGAGTCACAATACTTTGCACCTTTAGATGCCCTCTGGGG AGACCCCATATACTATAATGATCTAAATGAAAACAAAAGTTTGAACGATA TCATTGAGAAAATACTAATAAAAAACATGATTACATACCATGCAAAACTA AGAGAATTTCCAAATTCATACCAAGGAAACAAGGCCTTTTGCCACCTAAC AGGCATATACAGCCCACCATACCTAAACCAAGGCAGAATATCTCCAGAAA TATTTGGACTGTACACAGAAATAATTTACAACCCTTACACAGACAAAGGA ACTGGAAACAAAGTATGGATGGACCCACTAACTAAAGAGAACAACATATA TAAAGAAGGACAGAGCAAATGCCTACTGACTGACATGCCCCTATGGACTT TACTTTTTGGATATACAGACTGGTGTAAAAAGGACACTAATAACTGGGAC TTACCACTAAACTACAGACTAGTACTAATATGCCCTTATACCTTTCCAAA ATTGTACAATGAAAAAGTAAAAGACTATGGGTACATCCCGTACTCCTACA AATTCGGAGCGGGTCAGATGCCAGACGGCAGCAACTACATACCCTTTCAG TTTAGAGCAAAGTGGTACCCCACAGTACTACACCAGCAACAGGTAATGGA GGACATAAGCAGGAGCGGGCCCTTTGCACCTAAGGTAGAAAAACCAAGCA CTCAGCTGGTAATGAAGTACTGTTTTAACTTTAACTGGGGCGGTAACCCT ATCATTGAACAGATTGTTAAAGACCCCAGCTTCCAGCCCACCTATGAAAT ACCCGGTACCGGTAACATCCCTAGAAGAATACAAGTCATCGACCCGCGGG TCCTGGGACCGCACTACTCGTTCCGGTCATGGGACATGCGCAGACACACA TTTAGCAGAGCAAGTATTAAGAGAGTGTCAGAACAACAAGAAACTTCTGA CCTTGTATTCTCAGGCCCAAAAAAGCCTCGGGTCGACATCCCAAAACAAG AAACCCAAGAAGAAAGCTCACATTCACTCCAAAGAGAATCGAGACCGTGG GAGACCGAGGAAGAAAGCGAGACAGAAGCCCTCTCGCAAGAGAGCCAAGA GGTCCCCTTCCAACAGCAGTTGCAGCAGCAGTACCAAGAGCAGCTCAAGC TCAGACAGGGAATCAAAGTCCTCTTCGAGCAGCTCATAAGGACCCAACAA GGGGTCCATGTAAACCCATGCCTACGGTAGGTCCCAGGCAGTGGCTGTTT CCAGAGAGAAAGCCAGCCCCAGCTCCTAGCAGTGGAGACTGGGCCATGGA GTTTCTCGCAGCAAAAATATTTGATAGGCCAGTTAGAAGCAACCTTAAAG ATACCCCTTACTACCCATATGTTAAAAACCAATACAATGTCTACTTTGAC CTTAAATTTGAATAAACAGCAGCTTCAAACTTGCAAGGCCGTGGGAGTTT CACTGGTCGGTGTCTACCTCTAAAGGTCACTAAGCACTCCGAGCGTAAGC GAGGAGTGCGACCCTCCCCCCTGGAACAACTTCTTCGGAGTCCGGCGCTA CGCCTTCGGCTGCGCCGGACACCTCAGACCCCCCCTCCACCCGAAACGCT TGCGCGTTTCGGACCTTCGGCGTCGGGGGGGTCGGGAGCTTTATTAAACG GACTCCGAAGTGCTCTTGGACACTGAGGGGGTGAACAGCAACGAAAGTGA GTGGGGCCAGACTTCGCCATAAGGCCTTTATCTTCTTGCCATTTGTCAGT GTCCGGGGTCGCCATAGGCTTCGGGCTCGTTTTTAGGCCTTCCGGACTAC AAAAATCGCCATTTTGGTGACGTCACGGCCGCCATCTTAAGTAGTTGAGG CGGACGGTGGCGTGAGTTCAAAGGTCACCATCAGCCACACCTACTCAAAA TGGTGGACAATTTCTTCCGGGTCAAAGGTTACAGCCGCCATGTTAAAACA CGTGACGTATGACGTCACGGCCGCCATTTTGTGACACAAGATGGCCGACT TCCTTCCTCTTTTTCAAAAAAAAGCGGAAGTGCCGCCGCGGCGGCGGGGG GCGGCGCGCTGCGCGCGCCGCCCAGTAGGGGGAGCCATGCGCCCCCCCCC
GCGCATGCGCGGGGCCCCCCCCCGCGGGGGGCTCCGCCCCCCGGCCCCCC CCG (SEQ ID NO: 16) Anotações: Domínio Putativo Gama base Caixa TATA 83 – 88 Local Cap 104 – 111 Local de Início Transcricional 111 Domínio Conservado 5´ UTR 170 – 240 ORF2 336 – 719 ORF2/2 336 – 715 ; 2363 – 2789 ORF2/3 336 – 715 ; 2565 – 3015 ORF2t/3 336 – 388 ; 2565 – 3015 ORF1 599 – 2830 ORF1/1 599 – 715 ; 2363 – 2830 ORF1/2 599 – 715 ; 2565 – 2789 Região de três grelhas de leitura aberta 2551 – 2786 Sinal de Poli(A) 3011 – 3016 região rica em GC 3632 – 3753
Tabela 6. Sequências exemplificativas de aminoácido de Anellovirus (Alphatorquevirus, Clado 3) TTV-tth8 (Alphatorquevirus Clado 3) ORF2 MSFWKPPVHNVTGIQRMWYESFHRGHASFCGCGNPILHITALAETYGHPTG
PRPSGPPGVDPNPHIRRARPAPAAPEPSQVDSRPALTWHGDGGSDGGAG GSGSGGPVADFADDGLDQLVAALDDEE (SEQ ID NO: 17) ORF2/2 MSFWKPPVHNVTGIQRMWYESFHRGHASFCGCGNPILHITALAETYGHPTG
PRPSGPPGVDPNPHIRRARPAPAAPEPSQVDSRPALTWHGDGGSDGGAG GSGSGGPVADFADDGLDQLVAALDDEELLKTPASSPPMKYPVPVTSLEEYK SSTRGSWDRTTRSGHGTCADTHLAEQVLRECQNNKKLLTLYSQAQKSLGS
TSQNKKPKKKAHIHSKENRDRGRPRKKARQKPSRKRAKRSPSNSSCSSST KSSSSSDRESKSSSSSS (SEQ ID NO: 18) ORF2/3 MSFWKPPVHNVTGIQRMWYESFHRGHASFCGCGNPILHITALAETYGHPTG
PRPSGPPGVDPNPHIRRARPAPAAPEPSQVDSRPALTWHGDGGSDGGAG GSGSGGPVADFADDGLDQLVAALDDEEPKKASGRHPKTRNPRRKLTFTPK RIETVGDRGRKRDRSPLAREPRGPLPTAVAAAVPRAAQAQTGNQSPLRAA
HKDPTRGPCKPMPTVGPRQWLFPERKPAPAPSSGDWAMEFLAAKIFDRPV RSNLKDTPYYPYVKNQYNVYFDLKFE (SEQ ID NO: 19) ORF2t/3 MSFWKPPVHNVTGIQRMWPKKASGRHPKTRNPRRKLTFTPKRIETVGDRG
RKRDRSPLAREPRGPLPTAVAAAVPRAAQAQTGNQSPLRAAHKDPTRGPC
KPMPTVGPRQWLFPERKPAPAPSSGDWAMEFLAAKIFDRPVRSNLKDTPY YPYVKNQYNVYFDLKFE (SEQ ID NO: 20) ORF1 MAWGWWKRRRRWWFRKRWTRGRLRRRWPRSARRRPRRRRVRRRRRW
RRGRRKTRTYRRRRRFRRRGRKAKLIIKLWQPAVIKRCRIKGYIPLIISGNGT FATNFTSHINDRIMKGPFGGGHSTMRFSLYILFEEHLRHMNFWTRSNDNLEL TRYLGASVKIYRHPDQDFIVIYNRRTPLGGNIYTAPSLHPGNAILAKHKILVPS LQTRPKGRKAIRLRIAPPTLFTDKWYFQKDIADLTLFNIMAVEADLRFPFCSP QTDNTCISFQVLSSVYNNYLSINTFNNDNSDSKLKEFLNKAFPTTGTKGTSL NALNTFRTEGCISHPQLKKPNPQINKPLESQYFAPLDALWGDPIYYNDLNEN KSLNDIIEKILIKNMITYHAKLREFPNSYQGNKAFCHLTGIYSPPYLNQGRISPE IFGLYTEIIYNPYTDKGTGNKVWMDPLTKENNIYKEGQSKCLLTDMPLWTLLF GYTDWCKKDTNNWDLPLNYRLVLICPYTFPKLYNEKVKDYGYIPYSYKFGA GQMPDGSNYIPFQFRAKWYPTVLHQQQVMEDISRSGPFAPKVEKPSTQLV MKYCFNFNWGGNPIIEQIVKDPSFQPTYEIPGTGNIPRRIQVIDPRVLGPHYS FRSWDMRRHTFSRASIKRVSEQQETSDLVFSGPKKPRVDIPKQETQEESSH
SLQRESRPWETEEESETEALSQESQEVPFQQQLQQQYQEQLKLRQGIKVL FEQLIRTQQGVHVNPCLR (SEQ ID NO: 21) ORF1/1 MAWGWWKRRRRWWFRKRWTRGRLRRRWPRSARRRPRRRRIVKDPSFQ
TTV-tth8 (Alphatorquevirus Clado 3)
PTYEIPGTGNIPRRIQVIDPRVLGPHYSFRSWDMRRHTFSRASIKRVSEQQE
TSDLVFSGPKKPRVDIPKQETQEESSHSLQRESRPWETEEESETEALSQES QEVPFQQQLQQQYQEQLKLRQGIKVLFEQLIRTQQGVHVNPCLR (SEQ ID NO: 22) ORF1/2 MAWGWWKRRRRWWFRKRWTRGRLRRRWPRSARRRPRRRRAQKSLGS
TSQNKKPKKKAHIHSKENRDRGRPRKKARQKPSRKRAKRSPSNSSCSSST KSSSSSDRESKSSSSSS (SEQ ID NO: 23) Tabela 7. Sequência de ácidos nucleicos de Anellovirus exemplificativa (Alphatorquevirus, Clado 4) Nome TTV-HD20a Gênero/Clado Alphatorquevirus, Clado 4 Número de Acesso FR751492.1 Sequência Total: 3878 pb 1 10 20 30 40 50 | | | | | |
AAATACGTCACTAACCACGTGACTCCCACAGGCCAACCACAGTCTATGTC GTGCACTTCCTGGGCATGGTCTACGTGATAATATAAAGCGGTGCACTTCC GAATGGCTGAGTTTTCCACGCCCGTCCGCAGCGAGATCGCGACGTAGGAG CGATCGAGCGTCCCGAGGGCGGGTGCCGGAGGTGAGTTTACACACCGCAG TCAAGGGGCAATTCGGGCTCGGGAGGCCGGGCCATGGGCAAGGCTCTTAA AAAGCTATGTTTCTCGGTAAAATCTACAGGAAGAAAAGGAAACTGCTTCT GCAGGCTGTGCGTGCTCCGCAGACGCCATCTTCCATGAGCCGCTGCTGGT GTCCCCCTCGGGGTGATGTCTCCTCCCGCGAGTCTCGATGGTACGAGGCG GTTCGAGGAAGCCACGATGCTTTTTGTGGCTGTAGTGATCCTATTCTTCA TCTTTCTCGTCTGGCTGCACGTTTTAACCATCAGGGACCTCCGACGCCCC CCACGGACGACCGTGCGCCGCAGAATACCCCAGTGAGACGCCTGCTGCCT CTCCCCAGCTACCCCGGCGAGGGTCCCCAGGCTAGATGGCCTGGTGGGGA TGGAGGCGCCGCTGGTGGCGACCGAAGAGAAGGTGGAGATGGCGGCGCGC GCGCCGCCGAAGACGAGTACCAGCCCGAAGACCTAGACGAGCTTTTCGGC GCTATCGAACAAGAACAGTAAGGAGGAGGCGAAGGGGGAGGCGGAGGGGC TACCGGCGCCGTTACAGACTGAGACGCTATGCCAGACGCAGGTTCCGACG CAAAAAGATAGTACTGACTCAGTGGAACCCCCAGACTACCAGAAAATGTA TAATAAGGGGCATGATGCCAGTACTGTGGGCCGGCATGGGTACGGGGGGC AGAAACTATGCAGTGAGGTCAGATGACTATGTGGTGAACAAAGGGTTCGG GGGCTCCTTCGCCACGGAGACCTTCTCCCTGAAGGTTCTCTATGACCAGT TTCAAAGGGGCTTCAACAGGTGGTCCCACACTAACGAGGACCTAGACCTG GCCCGCTACAGGGGCTGCAGGTGGACTTTTTACAGACATAAAGACACAGA CTTTATAGTGTACTTTACAAACAATCCTCCCATGAAGACCAACCAGTTCT CCGCGCCCCTGACGACCCCCGGCATGCTCATGCGCAGTAAATACAAAGTC CTCATTCCCAGCTTCCAGACCAGACCCAAGGGTCGCAAAACAGTAACCGT TAAAATAAGACCCCCCAAACTATTTCAAGACAAGTGGTACACCCAGCAGG ACCTGTGTTCAGTTCCTCTTGTCCAACTGAACGTGACCGCAGCTGATTTC ACACATCCGTTCGGCTCACCACTAACTGAAACTCCTTGCGTAGAGTTCCA GGTGCTGGGTGACTTGTACAATACATGTCTCAATATCGACCTTCCGCAAT TTAGTGAATTAGGAGAAATAACTAGTGCCTACTCAAAACCAAACTCAAAT AACCTAAAAGAATTATACAAAGAATTGTTCACAAAAGCCACATCAGGACA CTACTGGCAGACATTCATAACCAACAGCATGGTCAGAGCACACATAGATG CAGACAAAGCTAAAGAAGCACAAAGAGCATCCACCACACCCTCATACAAC AATGACCCCTTCCCCACAATACCTGTTAAATCAGAGTTTGCACAGTGGAA AAAGAAATTCACAGACACTAGAGACAGCCCCTTTCTTTTTGCCACTTACC ATCCCGAAGCTATAAAAGACACAATTATGAAAATGAGAGAGAACAACTTT AAGCTAGAGACAGGACCCAATGACAAGTATGGAGACTACACAGCACAGTA CCAAGGAAACACACACATGCTAGACTACTACCTTGGCTTTTACAGCCCCA TATTCCTCTCAGATGGAAGGTCTAACGTAGAATTCTTCACTGCCTACAGA GACATAGTATACAATCCCTTCTTAGACAAGGCCCAGGGCAACATGGTGTG GTTTCAGTACCACACAAAGACAGACAACAAGTTTAAAAAACCAGAGTGCC ACTGGGAAATCAAAGACATGCCCCTGTGGGCCCTCCTAAACGGATATGTA GACTACTTAGAGACTCAAATACAGTATGGTGACCTCAGTAAAGAAGGGAA AGTCCTCATCAGGTGTCCCTACACCAAGCCAGCACTAGTAGACCCCAGAG ACGACACTGCAGGATATGTAGTCTACAACAGAAACTTTGGCAGAGGCAAG TGGATAGACGGAGGGGGCTACATCCCCCTGCACGAGAGGACAAAATGGTA CGTGATGCTCAGATACCAGACGGACGTCTTCCATGACATAGTGACCTGTG GGCCCTGGCAGTACAGAGACGACAACAAAAACAGCCAGCTAGTGGCCAAA TACCGCTTCAGCTTTATATGGGGAGGTAACACTGTCCACTCTCAGGTCAT CAGAAACCCGTGCAAAGACAACCAAGTATCCGGTCCCCGTCGACAGCCTA GGGATATACAAGTCGTTGACCCGCAACGCATCACGCCGCCGTGGGTCCTC CACAGCTTCGACCAGCGAAGAGGCCTCTTTACTGAAACAGCTCTCAGGCG CCTGCTCCAGGAACCACTACCTGGCGAGTATGCTGTTAGCACCCTCAGGA CACCCCTCCTCTTTCTACCCTCAGAATACCAGCGAGAAGACGGCGCTGCA GAAAGCGCCTCAGGTTCACCGGCCAAAAGACCCCGTATCTGGTCAGAAGA GAGTCAGACGGAGACGATCTCCTCGGAGGAGAACCCGGCGGAGACGACGA GGGAGCTCCTCCAGCGAAAGCTCCGAGAGCAGCGAGCACTCCAGTTCCAA CTCCAGCACTTCGCGGTCCAACTCGCCAAGACCCAGGCGAATCTCCACGT AAACCCCCTGTTATCTTTCCCGCAATGAATAAGGTCTTTCTGTTTCCCCC AGAGGGTCCCAAGCCCATCCTGGGCAAAGAGGCCTGGCAGGACGAGTACG AGACCTGCAGGGTCTGGAACAGACCTGCCAGAACCCACCACACAGACACC CCCTTCTATCCCTGGGCCCCCCACAAGTTCCATGTAAGCTTCAAACTTGG CTTCCAATAAAATTACTAGGCCGTGGAACTCTCACTGGTCGGTGTCTACC TCTTAAGGTCACTAAGCACTCCGAGCGTCAGCGAGGAGTGCGACCCTCTA CCCTGGTGCAACGCCCTCGGCGGCCGCGCGCTACGCCTTCGGCTGCGCGC GGCACCTCGGACCCCCGCTCGTGCTGACGCGCTCGCGCGCGTCAGACCAC TTCGGGCTCGCGGGGGTCGGGAATTTTGCTAAACAGACTCCGAGTTGCCA TTGGACACTGTAGCTGTGAATCAGTAACGAAAGTGAGTGGGGCCAGACTT CGCCATAGGGCCTTTATCTTCTTGCCATTGGTCCGTGTAGGGGGTCGCCA TAGGCTTCGACCTCCCTTTTAGGCCTTCCGGACTACAAAAATGGCGGATT CAGTGACGTCACGGCCGCCATTTTAAGTAGGTGCCGTCCAGGACTGCAGT TCCGGGTCAGAGTGCATCCTCGGCGGAACCTGCACAAAATGGCGGTCAAT ATCTTCCGGGTCAAAGGTCACACCTACGTCATAAGTCACGTGACTGGGTC CTGCTACGTCATATGCGGAAGTAGGCCCCGCCACGTGACTCGTCACGTGG GCGCTGCGTCACGGCGGCCATTTTGTATCACAAAATGGCGGACTTCCTTC CTCTTTTTTAAAAATAACGGCCCAGCGGCGGCGCGCGCGCTTCGCGCGCG
CGCCGGGGGGCTCCGCCCCCCCCCGCGCATGCGCGGGGCCCCCCCCCGCG GGGGGCTCCGCCCCCCGGTCCCCCCCCG (SEQ ID NO: 24) Anotações: Domínio Putativo Gama base Caixa TATA 82 – 87 Elemento Iniciador 95-115 Local de Início Transcricional 115 Domínio Conservado 5´ UTR 170 - 238 ORF2 335 - 721 ORF2/2 335 – 717 ; 2446 – 2902 ORF2/3 335 – 717 ; 2675 – 3109 ORF1 586 – 2928 ORF1/1 586 – 717 ; 2446 – 2928 ORF1/2 586 – 717 ; 2675 – 2902 Região de três grelhas de leitura aberta 2640 – 2899 Sinal de Poli(A) 3106 - 3114 região rica em GC 3768 – 3878
Tabela 8. Sequências exemplificativas de aminoácido de Anellovirus (Alphatorquevirus, Clado 4) TTV-HD20a (Alphatorquevirus Clado 4) ORF2 MSRCWCPPRGDVSSRESRWYEAVRGSHDAFCGCSDPILHLSRLAARFNH
QGPPTPPTDDRAPQNTPVRRLLPLPSYPGEGPQARWPGGDGGAAGGDRR EGGDGGARAAEDEYQPEDLDELFGAIEQEQ (SEQ ID NO: 25) ORF2/2 MSRCWCPPRGDVSSRESRWYEAVRGSHDAFCGCSDPILHLSRLAARFNH
QGPPTPPTDDRAPQNTPVRRLLPLPSYPGEGPQARWPGGDGGAAGGDRR EGGDGGARAAEDEYQPEDLDELFGAIEQEQSSETRAKTTKYPVPVDSLGIY KSLTRNASRRRGSSTASTSEEASLLKQLSGACSRNHYLASMLLAPSGHPSS
FYPQNTSEKTALQKAPQVHRPKDPVSGQKRVRRRRSPRRRTRRRRRGSS SSESSESSEHSSSNSSTSRSNSPRPRRIST (SEQ ID NO: 26) ORF2/3 MSRCWCPPRGDVSSRESRWYEAVRGSHDAFCGCSDPILHLSRLAARFNH
QGPPTPPTDDRAPQNTPVRRLLPLPSYPGEGPQARWPGGDGGAAGGDRR EGGDGGARAAEDEYQPEDLDELFGAIEQEQIPARRRRCRKRLRFTGQKTPY LVRRESDGDDLLGGEPGGDDEGAPPAKAPRAASTPVPTPALRGPTRQDPG
ESPRKPPVIFPAMNKVFLFPPEGPKPILGKEAWQDEYETCRVWNRPARTHH TDTPFYPWAPHKFHVSFKLGFQ (SEQ ID NO: 27) ORF1 MAWWGWRRRWWRPKRRWRWRRARRRRRVPARRPRRAFRRYRTRTVR
RRRRGRRRGYRRRYRLRRYARRRFRRKKIVLTQWNPQTTRKCIIRGMMPV LWAGMGTGGRNYAVRSDDYVVNKGFGGSFATETFSLKVLYDQFQRGFNR WSHTNEDLDLARYRGCRWTFYRHKDTDFIVYFTNNPPMKTNQFSAPLTTP GMLMRSKYKVLIPSFQTRPKGRKTVTVKIRPPKLFQDKWYTQQDLCSVPLV QLNVTAADFTHPFGSPLTETPCVEFQVLGDLYNTCLNIDLPQFSELGEITSAY SKPNSNNLKELYKELFTKATSGHYWQTFITNSMVRAHIDADKAKEAQRASTT PSYNNDPFPTIPVKSEFAQWKKKFTDTRDSPFLFATYHPEAIKDTIMKMREN NFKLETGPNDKYGDYTAQYQGNTHMLDYYLGFYSPIFLSDGRSNVEFFTAY RDIVYNPFLDKAQGNMVWFQYHTKTDNKFKKPECHWEIKDMPLWALLNGY VDYLETQIQYGDLSKEGKVLIRCPYTKPALVDPRDDTAGYVVYNRNFGRGK WIDGGGYIPLHERTKWYVMLRYQTDVFHDIVTCGPWQYRDDNKNSQLVAK YRFSFIWGGNTVHSQVIRNPCKDNQVSGPRRQPRDIQVVDPQRITPPWVLH SFDQRRGLFTETALRRLLQEPLPGEYAVSTLRTPLLFLPSEYQREDGAAESA
SGSPAKRPRIWSEESQTETISSEENPAETTRELLQRKLREQRALQFQLQHFA VQLAKTQANLHVNPLLSFPQ (SEQ ID NO: 28) ORF1/1 MAWWGWRRRWWRPKRRWRWRRARRRRRVPARRPRRAFRRYRTRTVIR
NPCKDNQVSGPRRQPRDIQVVDPQRITPPWVLHSFDQRRGLFTETALRRLL QEPLPGEYAVSTLRTPLLFLPSEYQREDGAAESASGSPAKRPRIWSEESQT ETISSEENPAETTRELLQRKLREQRALQFQLQHFAVQLAKTQANLHVNPLLS
TTV-HD20a (Alphatorquevirus Clado 4) FPQ (SEQ ID NO: 29) ORF1/2 MAWWGWRRRWWRPKRRWRWRRARRRRRVPARRPRRAFRRYRTRTNT
SEKTALQKAPQVHRPKDPVSGQKRVRRRRSPRRRTRRRRRGSSSSESSE SSEHSSSNSSTSRSNSPRPRRIST (SEQ ID NO: 30) Tabela 9. Sequência de ácidos nucleicos de Anellovirus exemplificativa (Alphatorquevirus, Clado 5) Nome TTV-16 (TUS01) Gênero/Clado Alphatorquevirus, Clado 5 Número de Acesso AB017613.1 Sequência Total: 3818 pb 1 10 20 30 40 50 | | | | | |
AAGTCCGCCACTAACCACGTGACTCCCGCAGGCCAACCCAGTACTATGTC GTCCACTTCCTGGGACGAGTCTACGTCCTGATATAAGTAAGTGCACTTCC GAATGGCTGAGTTTTCCACGCCCGTCCGCAGCGAGAACGCCACGGAGGGG AGTCCGCGCGTCCCGAGGGCGGGTGCCGGAGGTGAGTTTACACACCGCAG TCAAGGGGCAATTCGGGCTCGGGACTGGCCGGGCCCCGGGCAAGGCTCTT AAAAAATGCACTTTCGCAGAGTGCGAGCGAAAAGGAAACTGCTACTGCAA GCTGTGCGAGCTCCACCGAAGGCACCTGCCATGAGCTTCACCACACCTAC TATTAATGCCGGGATCCGAGAGCAGCAATGGTTCGAGTCCACCCTTAGAT CCCACCACTCGTTCTGTGGCTGTGGTGATCCCGTGCTTCATTTTACTAAC CTTGCTACTCGCTTTAACTATCTGCCTGCTACCTCTTCGCCTCTGGACCC TCCCGGCCCAGCGCCGCGAGGCCGCCCGGCGCTCCGCCGCCTCCCGGCAC TCCCTTCAGCCCCCGCGACCCCTTCTAGAGAACTAGCATGGCCTACTGGT TCAGAAGGTGGGGCTGGAGGCCGAGGCGCCGGTGGAGAAGGTGGCGCCGC CGTCGAAGGAGACTACCGAGAAGAAGAACTAGACGAGCTGTTCGCGGCCT TGGAAGAAGACGCAAACCAAGGGTAAGGAGGCGCCGCAGAACTCGCAGAC GTACCTACAGACGGGGGTGGAGACGCAGGAGGTACATAAGACGGGGGCGA CGCAAAAAGAAACTCATACTGACTCAGTGGAACCCGGCAATAGTTAAGAG GTGCAACATTAAGGGCGGACTTCCAATAATTATATGCGGAGAGCCCAGGG CAGCCTTTAACTATGGCTACCACATGGAGGACTACACTCCTCAACCTTTC CCCTTCGGAGGGGGAATGAGCACAGTGACTTTCTCTCTGAAAGCCTTGTA TGACCAGTACCTAAAACACCAAAACAGGTGGACTTTCTCAAACGACCAGC TAGACCTCGCCAGATACAGGGGCTGTAAACTAAGGTTCTACAGAAGCCCC GTCTGTGACTTTATAGTACACTACAACCTAATACCTCCACTAAAAATGAA
Nome TTV-16 (TUS01) Gênero/Clado Alphatorquevirus, Clado 5 Número de Acesso AB017613.1
CCAGTTCACAAGTCCCAACACGCACCCGGGACTACTCATGCTCAGCAAAC ACAAGATAATAATTCCCAGCTTTCAAACAAGACCTGGGGGCAGACGCTTT GTTAAAATAAGACTTAATCCCCCCAAACTATTTGAAGACAAGTGGTACAC TCAGCAAGACCTGTGCAAGGTTCCGCTCGTTAGTATTACAGCAACTGCGG CTGACTTGCGGTATCCGTTCTGCTCACCACAAACGAACAACCCTTGCACC ACCTTCCAGGTACTGCGCAAGAACTACAATACAGTTATAGGAACTTCCGT AAAAGACCAAGAGTCCACACAAGACTTTGAAAATTGGCTTTATAAAACAG ACTCACACTATCAAACATTTGCCACAGAGGCTCAACTAGGCAGAATTCCT GCATTTAATCCTGATGGCACTAAAAACACTAAACAGCAGTCGTGGCAAGA TAACTGGAGCAAAAAAAATTCACCATGGACAGGTAACTCAGGTACATACC CACAAACAACCAGTGAAATGTACAAAATTCCATATGACAGTAACTTCGGC TTTCCCACATACAGAGCCCAAAAAGACTACATTTTAGAAAGAAGACAGTG CAACTTTAACTATGAAGTTAATAATCCAGTTAGCAAAAAAGTATGGCCAC AACCTAGTACAACAACACCCACAGTAGACTACTATGAATACCACTGTGGA TGGTTCAGCAACATATTCATAGGCCCCAACAGATACAACCTACAGTTTCA AACAGCATATGTAGACACCACATACAACCCACTAATGGACAAGGGCAAAG GCAACAAAATATGGTTTCAATATCTGTCTAAAAAGGGCACAGACTACAAT GAAAAACAATGCTACTGCACCCTAGAAGACATGCCCCTATGGGCAATATG CTTTGGATACACTGACTATGTAGAGACTCAACTAGGACCCAATGTGGACC ATGAAACAGCAGGCTTAATAATTATGATCTGTCCATACACTCAACCACCT ATGTATGACAAAAACAGACCTAACTGGGGATACGTAGTCTATGACACAAA CTTTGGCAATGGAAAAATGCCCTCAGGAAGTGGCCAAGTCCCAGTATACT GGCAATGCCGATGGAGGCCCATGCTGTGGTTCCAACAACAAGTACTCAAT GACATCTCAAAGACTGGACCGTACGCCTACAGAGACGAATATAAAAATGT ACAACTGACTCTCTACTACAACTTTATTTTTAACTGGGGGGGCGACATGT ATTACCCACAGGTCGTTAAAAACCCCTGTGGAGACTCCGGAATCGTTCCC GGTTCCGGTAGATTCACTCGAGAAGTACAAGTCGTTAGCCCGCTTTCCAT GGGACCGGCCTACATCTTCCACTACTTCGACTCCAGACGCGGGTTCTTTA GTGAAAAAGCTCTTAAAAGAATGCAACAACAACAAGAATTTGATGAATCT TTTACATTCAAACCTAAGAGACCCAAACTTTCTACAGCAGCCGCAGAAAT CCTCCAGCTCGAAGAAGACTCGACTTCAGGGGAAGGAAAATCGCCACTAC AGCAAGAAGAGAAAGAAGTCGAAGTCCTCCAAACGCCGACAGTACAGCTC CAGCTCCAGCGAAACATCCAGGAGCAGCTCGCAATCAAGCAGCAGCTCCA ATTCCTCTTGCTCCAACTCCTCAAAACCCAATCCAATTTGCATTTAAACC CACAATTTTTAAGCCCTTCATAAAATATGACATGTTTGGGGACCCCCTTC CTCACCCCCCAACAGCCGAAGAGTGGGAAACAGAGTACCAGTGCTGTAAG
Nome TTV-16 (TUS01) Gênero/Clado Alphatorquevirus, Clado 5 Número de Acesso AB017613.1
GCCTTTAACAGACCACCTAGAACCAACCTAAAAGACACCCCCTTCTACCC CTGGGTACCTAAACCTAAACCTCAATTCCGTGTATCTTTTAAACTTGGTT TTCAATAAACAAGGCCGTGGGAGTTTCACTTGTCGGTGTCAACCTCTTAA GGTCACTAAGCACTCCGAGCGTAAGCGAGGAGTGCGACCCTCCCCCCTGG GGCAACTCCCTCGAAGTCCGGCGCTACGCGCTTCGCGCTGCGCCGGACAT CTCGGACCCCCCCTCCACCCGAAACGCTTGCGCGTTTCGGACCTTCGGCG TCGGGGGGGTCGGGGGCTTTACTAAACAGACTCCGAGGTGCCATTGGACA CTGAGGGGATGAACAGCAACGAAAGTGAGTGGGGCCAGACTTCGCCATAA GGCCTTTATCTTCTTGCCATTTGTCAGTATAGAGGGTCGCCATAGGCTTC GGCCTCCATTTTAACCTCTAAAAACTACCAAAATGGCCGTTCCAGTGACG TCACAGCCGCCATTTTAAGTAGCTGACGTCAAGGATTGACGTGAAGGTTA AAGGTCATCCTCGGCGGAAGCTACACAAAATGGTGGACAACATCTTCCGG GTCAAAGGTCGTGCACACGTCATAAGTCACGTGGTGGGGACCCGCTGTAA CCCGGAAGTAGGCCCCGTCACGTGATTTGTCACGTGTGTACACGTCACAA CCGCCATTTTGTTTTACAAAATGGCTGACTTCCTTCCTCTTTTTTAAAAA AAACGGCCGTGCGGCGGCGCGCGCGCTTCGCGCGCGCGCCGGGGGCTGCC
GCCCCCCCCCGCGCATGCGCGCGGGGCCCCCCCCCGCGGGGGGCTCCGCC CCCCGGCCCCCCCCCCCG (SEQ ID NO: 31) Anotações: Domínio Putativo Gama base Caixa TATA 82 – 86 Elemento Iniciador 100-115 Local de Início Transcricional 115 Domínio Conservado 5´ UTR 170 - 240 ORF2 331- 726 ORF2/2 331 – 722 ; 2412 – 2847 ORF2/3 331 – 722 ; 2638 – 3058 ORF2t/3 331 – 380 ; 2638 - 3058 ORF1 588 – 2873 ORF1/1 588 – 722 ; 2412 – 2873 ORF1/2 588 – 722 ; 2638 – 2847 Região de três grelhas de leitura aberta 2699 – 2969 Sinal de Poli(A) 3220 - 3225 região rica em GC 3302 – 3541
Tabela 10. Sequências exemplificativas de aminoácido de Anellovirus (Alphatorquevirus, Clado 5) TTV-16-TUS01 (Alphatorquevirus Clado 5) ORF2 MSFTTPTINAGIREQQWFESTLRSHHSFCGCGDPVLHFTNLATRFNYLPATS
SPLDPPGPAPRGRPALRRLPALPSAPATPSRELAWPTGSEGGAGGRGAGG EGGAAVEGDYREEELDELFAALEEDANQG (SEQ ID NO: 32) ORF2/2 MSFTTPTINAGIREQQWFESTLRSHHSFCGCGDPVLHFTNLATRFNYLPATS
SPLDPPGPAPRGRPALRRLPALPSAPATPSRELAWPTGSEGGAGGRGAGG EGGAAVEGDYREEELDELFAALEEDANQGSLKTPVETPESFPVPVDSLEKY KSLA RFPWDRPTSSTTSTPDAGSLVKKLLKECNNNKNLMNLLHSNLRDPNFLQQP
QKSSSSKKTRLQGKENRHYSKKRKKSKSSKRRQYSSSSSETSRSSSQSSS SSNSSCSNSSKPNPICI (SEQ ID NO: 33) ORF2/3 MSFTTPTINAGIREQQWFESTLRSHHSFCGCGDPVLHFTNLATRFNYLPATS
SPLDPPGPAPRGRPALRRLPALPSAPATPSRELAWPTGSEGGAGGRGAGG EGGAAVEGDYREEELDELFAALEEDANQGSRRNPPARRRLDFRGRKIATTA RRERSRSPPNADSTAPAPAKHPGAARNQAAAPIPLAPTPQNPIQFAFKPTIF
KPFIKYDMFGDPLPHPPTAEEWETEYQCCKAFNRPPRTNLKDTPFYPWVPK PKPQFRVSFKLGFQ (SEQ ID NO: 34) ORF2t/3 MSFTTPTINAGIREQQCSRRNPPARRRLDFRGRKIATTARRERSRSPPNAD
STAPAPAKHPGAARNQAAAPIPLAPTPQNPIQFAFKPTIFKPFIKYDMFGDPL
PHPPTAEEWETEYQCCKAFNRPPRTNLKDTPFYPWVPKPKPQFRVSFKLG FQ (SEQ ID NO: 35) ORF1 MAYWFRRWGWRPRRRWRRWRRRRRRLPRRRTRRAVRGLGRRRKPRVR
RRRRTRRRTYRRGWRRRRYIRRGRRKKKLILTQWNPAIVKRCNIKGGLPIIIC GEPRAAFNYGYHMEDYTPQPFPFGGGMSTVTFSLKALYDQYLKHQNRWTF SNDQLDLARYRGCKLRFYRSPVCDFIVHYNLIPPLKMNQFTSPNTHPGLLML SKHKIIIPSFQTRPGGRRFVKIRLNPPKLFEDKWYTQQDLCKVPLVSITATAA DLRYPFCSPQTNNPCTTFQVLRKNYNTVIGTSVKDQESTQDFENWLYKTDS HYQTFATEAQLGRIPAFNPDGTKNTKQQSWQDNWSKKNSPWTGNSGTYP QTTSEMYKIPYDSNFGFPTYRAQKDYILERRQCNFNYEVNNPVSKKVWPQP STTTPTVDYYEYHCGWFSNIFIGPNRYNLQFQTAYVDTTYNPLMDKGKGNKI WFQYLSKKGTDYNEKQCYCTLEDMPLWAICFGYTDYVETQLGPNVDHETA GLIIMICPYTQPPMYDKNRPNWGYVVYDTNFGNGKMPSGSGQVPVYWQCR WRPMLWFQQQVLNDISKTGPYAYRDEYKNVQLTLYYNFIFNWGGDMYYPQ VVKNPCGDSGIVPGSGRFTREVQVVSPLSMGPAYIFHYFDSRRGFFSEKAL KRMQQQQEFDESFTFKPKRPKLSTAAAEILQLEEDSTSGEGKSPLQQEEKE VEVLQTPTVQLQLQRNIQEQLAIKQQLQFLLLQLLKTQSNLHLNPQFLSPS
(SEQ ID NO: 36) ORF1/1 MAYWFRRWGWRPRRRWRRWRRRRRRLPRRRTRRAVRGLGRRRKPRVV
KNPCGDSGIVPGSGRFTREVQVVSPLSMGPAYIFHYFDSRRGFFSEKALKR
MQQQQEFDESFTFKPKRPKLSTAAAEILQLEEDSTSGEGKSPLQQEEKEVE VLQTPTVQLQLQRNIQEQLAIKQQLQFLLLQLLKTQSNLHLNPQFLSPS (SEQ ID NO: 37) ORF1/2 MAYWFRRWGWRPRRRWRRWRRRRRRLPRRRTRRAVRGLGRRRKPRQP
QKSSSSKKTRLQGKENRHYSKKRKKSKSSKRRQYSSSSSETSRSSSQSSS SSNSSCSNSSKPNPICI (SEQ ID NO: 38) Tabela 11. Sequência de ácidos nucleicos de Anellovirus exemplificativa (Alphatorquevirus, Clado 6) Nome TTV-TJN02 Gênero/Clado Alphatorquevirus, Clado 6 Número de Acesso AB028669.1 Sequência Total: 3794 pb 1 10 20 30 40 50 | | | | | |
CCCGAAGTCCGTCACTAACCACGTGACTCCTGTCGCCCAATCAGAGTGTA TGTCGTGCATTTCCTGGGCATGGTCTACATCCTGATATAACTAAGTGCAC TTCCGAATGGCTGAGTTTTCCACGCCCGTCCGCAGCGAGGGAGCGACGGA GGAGCTCCCGAGCGTCCCGAGGGCGGGTGCCGGAGGTGAGTTTACACACC GCAGTCAAGGGGCAATTCGGGCTCGGGACTGGCCGGGCTATGGGCAAGGC TCTTAGGGTCTTCATTCTTAATATGTTTCTTGGCAGAGTTTACCGCCACA AGAAAAGGAAAGTGCTACTGTCCACACTGCGAGCTCCACAGGCGTCTCGC AGGGCTATGAGTTGGCGACCCCCGGTACACGATGCACCCGGCATCGAGCG CAATTGGTACGAGGCCTGTTTCAGAGCCCACGCTGGAGCTTGTGGCTGTG GCAATTTTATTATGCACCTTAATCTTTTGGCTGGGCGTTATGGTTTTACT CCGGGGTCAGCGCCGCCAGGTGGTCCTCCTCCGGGCACCCCGCAGATAAG GAGAGCCAGGCCTAGTCCCGCCGCACCAGAGCAGCCCGCTGCCCTACCAT GGCATGGGGATGGTGGAGATGGCGGCGCCGCTGGCCCGCCAGACGCTGGA GGAGACGCCGTCGCCGGCGCCCCGTACGGAGAACAAGAGCTCGCCGACCT GCTCGACGCTATAGAAGACGACGAACAGTAAGAACCAGGCGAAGGCGGTG GGGGCGCAGACGGTACAGACGGGGCTGGAGACGCAGGACTTATGTGAGAA AGGGGCGACACAGAAAAAAGAAAAAGAGACTGATACTGAGACAGTGGCAA CCAGCCACAAGACGCAGATGTACCATAACTGGGTACCTGCCCATAGTGTT CTGCGGCCACACTAGGGGCAATAAAAACTATGCACTACACTCTGACGACT ACACCCCCCAAGGACAACCATTTGGAGGGGCTCTAAGCACTACCTCATTC
Nome TTV-TJN02 Gênero/Clado Alphatorquevirus, Clado 6 Número de Acesso AB028669.1
TCTTTAAAAGTACTATTTGACCAGCATCAGAGAGGACTAAACAAGTGGTC TTTTCCAAACGACCAACTAGACCTCGCCAGATATAGAGGCTGCAAATTTA TATTTTATAGAACAAAACAAACTGACTGGGTGGGCCAGTATGACATATCA GAACCCTACAAGCTAGACAAATACAGCTGCCCCAACTATCACCCTGGAAA CATGATTAAGGCAAAGCACAAATTTTTAATACCAAGCTATGACACTAATC CTAGAGGCAGACAAAAAATTATAGTTAAAATTCCCCCCCCAGACCTCTTT GTAGACAAGTGGTACACTCAAGAGGATCTGTGTTCCGTTAATCTTGTGTC ACTTGCGGTTTCTGCGGCTTCCTTTCTCCACCCATTCGGCTCACCACAAA CTGACAACCCTTGCTACACCTTCCAGGTGTTGAAAGAGTTCTACTATCAG GCAATAGGCTTCTCTGCAAGCACACAAGCAATGACATCAGTATTAGACAC GCTATACACACAAAACAGTTATTGGGAATCTAATCTAACTCAGTTTTATG TACTTAATGCAAAAAAAGGCAGTGATACAACACAGCCTTTAACTAGCAAT ATGCCAACTCGTGAAGAGTTTATGGCAAAAAAAAATACCAATTACAACTG GTATACATACAAGGCCGCGTCAGTAAAAAATAAACTACATCAAATGAGAC AAACCTATTTTGAGGAGTTAACCTCTAAGGGGCCACAAACAACAAAAAGT GAGGAAGGCTACAGTCAGCACTGGACCACCCCCTCCACAAACGCCTACGA ATATCACTTAGGAATGTTTAGTGCAATATTTCTAGCCCCAGACAGGCCAG TACCTAGATTTCCATGCGCCTACCAAGATGTAACTTACAACCCCTTAATG GACAAAGGGGTGGGAAACCACATTTGGTTTCAGTACAACACAAAGGCAGA CACTCAGCTAATAGTCACAGGAGGGTCCTGCAAAGCACACATACAAGACA TACCACTGTGGGCGGCCTTCTATGGATACAGTGACTTTATAGAGTCAGAA CTAGGCCCCTTTGTAGATGCAGAGACGGTAGGCTTAGTGTGTGTAATATG CCCTTATACAAAACCCCCCATGTACAACAAGACAAACCCCGCCATGGGCT ACGTGTTCTATGACAGAAACTTTGGTGACGGAAAATGGACTGACGGACGG GGCAAAATAGAGCCCTACTGGCAAGTTAGGTGGAGGCCCGAAATGCTTTT CCAAGAAACTGTAATGGCAGACCTAGTTCAGACTGGGCCCTTTAGCTACA AAGACGAACTTAAAAACAGCACCCTAGTGTGCAAGTACAAATTCTATTTC ACCTGGGGAGGTAACATGATGTTCCAACAGACGATCAAAAACCCGTGCAA GACGGACGGACAACCCACCGACTCCAGTAGACACCCTAGAGGAATACAAG TGGCGGACCCGGAACAAATGGGACCCCGCTGGGTGTTCCACTCCTTTGAC TGGCGAAGGGGCTATCTTAGCGAGAAAGCTCTCAAACGCCTGCAAGAAAA ACCTCTTGACTATGACGAATATTTTACACAACCAAAAAGACCTAGAATCT TTCCTCCAACAGAATCAGCAGAGGGAGAGTTCCGAGAGCCCGAAAAAGGC TCGTATTCAGAGGAAGAAAGGTCGCAAGCCTCTGCCGAAGAGCAGACGCA GGAGGCGACAGTACTCCTCCTCAAGCGACGACTCAGAGAGCAACAGCAGC TCCAGCAGCAGCTCCAATTCCTCACCCGAGAAATGTTCAAAACGCAAGCG
Nome TTV-TJN02 Gênero/Clado Alphatorquevirus, Clado 6 Número de Acesso AB028669.1
GGTCTCCACCTAAACCCTATGTTATTAAACCAGCGATAAACCAAGTGTAC CTGTTTCCAGAGAGGGCCCCAAAACCCCCTCCTAGCAGCCAAGACTGGCA GCAGGAGTACGAGGCCTGCGCAGCCTGGGACAGGCCCCCTAGATACAATC TGTCCTCTCCTCCTTTCTACCCCAGCTGCCCTTCAAAATTCTGTGTAAAA TTCAGCCTTGGCTTTAAATAAATGGCAACTTTACTGTGCAAGGCCGTGGG AGTTTCACTGGTCGGTGTCTACCTCTAAAGGTCACTAAGCACTCCGAGCG TTAGCGAGGAGTGCGACCCTTCCCCCTGACTCAACTTCTTCGGAGCCGCG CGCTACGCCTTCGGCTGCGCGCGGCACCTCAGACCCCCGCTCGTGCTGAC ACGCTCGCGCGTGTCAGACCACTTCGGGCTCGCGGGGGTCGGGAATTTTG CTAAACAGACTCCGAGTTGCTCTTGGACACTGAGGGGGCATATCAGTAAC GAAAGTGAGTGGGGCCAGACTTCGCCATAAGGCCTTTATCTTCTTGCCAT TGGATAGTATCGAGGGTTGCCATAGGCTTCGACCTCCATTTTAGGCCTTC CGGACTACAAAAATGGCCGTTTTAGTGACGTCACGGCCGCCATTTTAAGT AAGGCGGAAGCAGCTCGGCGTACACAAAATGGCGGCGGAGCACTTCCGGC TTGCCCAAAATGGTGGGCAACTTCTTCCGGGTCAAAGGTCACAGCTACGT CACAAGTCACGTGGGGAGGGTTGGCGTTTAACCCGGAAGCCAATCCTCTT ACGTGGCCTGTCACGTGACTTGTACGTCACGACCACCATTTTGTTTTACA AAATGGCCGACTTCCTTCCTCTTTTTTAAAAATAACGGTTCGGCGGCGGC
GCGCGCGCTACGCGCGCGCGCCGGGGGGCTGCCGCCCCCCCCCCGCGCAT GCGCGGGGCCCCCCCCCGCGGGGGGCTCCGCCCCCCGGCCCCCC (SEQ ID NO: 39) Anotações: Domínio Putativo Gama base Caixa TATA 89 – 90 Local Cap 107 – 114 Local de Início Transcricional 114 Domínio Conservado 5´ UTR 174 – 244 ORF2 357 – 731 ORF2/2 357 – 727 ; 2381 – 2813 ORF2/3 357 – 727 ; 2619 – 3021 ORF2t/3 357 – 406 ; 2619 – 3021 ORF1 599 – 2839 ORF1/1 599 – 727 ; 2381 – 2839 ORF1/2 599 – 727 ; 2619 – 2813 Região de três grelhas de leitura aberta 2596 – 2810 Sinal de Poli(A) 3017 – 3022
Nome TTV-TJN02 Gênero/Clado Alphatorquevirus, Clado 6 Número de Acesso AB028669.1 região rica em GC 3691 – 3794 Tabela 12. Sequências exemplificativas de aminoácido de Anellovirus (Alphatorquevirus, Clado 6) TTV-TJN02 (Alphatorquevirus Clado 6) ORF2 MSWRPPVHDAPGIERNWYEACFRAHAGACGCGNFIMHLNLLAGRYGFTPG
SAPPGGPPPGTPQIRRARPSPAAPEQPAALPWHGDGGDGGAAGPPDAGG DAVAGAPYGEQELADLLDAIEDDEQ (SEQ ID NO: 40) ORF2/2 MSWRPPVHDAPGIERNWYEACFRAHAGACGCGNFIMHLNLLAGRYGFTPG
SAPPGGPPPGTPQIRRARPSPAAPEQPAALPWHGDGGDGGAAGPPDAGG DAVAGAPYGEQELADLLDAIEDDEQRSKTRARRTDNPPTPVDTLEEYKWRT RNKWDPAGCSTPLTGEGAILARKLSNACKKNLLTMTNILHNQKDLESFLQQ
NQQRESSESPKKARIQRKKGRKPLPKSRRRRRQYSSSSDDSESNSSSSSS SNSSPEKCSKRKRVST (SEQ ID NO: 41) ORF2/3 MSWRPPVHDAPGIERNWYEACFRAHAGACGCGNFIMHLNLLAGRYGFTPG
SAPPGGPPPGTPQIRRARPSPAAPEQPAALPWHGDGGDGGAAGPPDAGG DAVAGAPYGEQELADLLDAIEDDEHRGRVPRARKRLVFRGRKVASLCRRAD AGGDSTPPQATTQRATAAPAAAPIPHPRNVQNASGSPPKPYVIKPAINQVYL
FPERAPKPPPSSQDWQQEYEACAAWDRPPRYNLSSPPFYPSCPSKFCVKF SLGFK (SEQ ID NO: 42) ORF2t/3 MSWRPPVHDAPGIERNCRGRVPRARKRLVFRGRKVASLCRRADAGGDST
PPQATTQRATAAPAAAPIPHPRNVQNASGSPPKPYVIKPAINQVYLFPERAP
KPPPSSQDWQQEYEACAAWDRPPRYNLSSPPFYPSCPSKFCVKFSLGFK (SEQ ID NO: 43) ORF1 MAWGWWRWRRRWPARRWRRRRRRRPVRRTRARRPARRYRRRRTVRT
RRRRWGRRRYRRGWRRRTYVRKGRHRKKKKRLILRQWQPATRRRCTITG YLPIVFCGHTRGNKNYALHSDDYTPQGQPFGGALSTTSFSLKVLFDQHQRG LNKWSFPNDQLDLARYRGCKFIFYRTKQTDWVGQYDISEPYKLDKYSCPNY HPGNMIKAKHKFLIPSYDTNPRGRQKIIVKIPPPDLFVDKWYTQEDLCSVNLV SLAVSAASFLHPFGSPQTDNPCYTFQVLKEFYYQAIGFSASTQAMTSVLDTL YTQNSYWESNLTQFYVLNAKKGSDTTQPLTSNMPTREEFMAKKNTNYNWY TYKAASVKNKLHQMRQTYFEELTSKGPQTTKSEEGYSQHWTTPSTNAYEY HLGMFSAIFLAPDRPVPRFPCAYQDVTYNPLMDKGVGNHIWFQYNTKADTQ LIVTGGSCKAHIQDIPLWAAFYGYSDFIESELGPFVDAETVGLVCVICPYTKP PMYNKTNPAMGYVFYDRNFGDGKWTDGRGKIEPYWQVRWRPEMLFQETV MADLVQTGPFSYKDELKNSTLVCKYKFYFTWGGNMMFQQTIKNPCKTDGQ
TTV-TJN02 (Alphatorquevirus Clado 6)
PTDSSRHPRGIQVADPEQMGPRWVFHSFDWRRGYLSEKALKRLQEKPLDY
DEYFTQPKRPRIFPPTESAEGEFREPEKGSYSEEERSQASAEEQTQEATVL LLKRRLREQQQLQQQLQFLTREMFKTQAGLHLNPMLLNQR (SEQ ID NO: 44) ORF1/1 MAWGWWRWRRRWPARRWRRRRRRRPVRRTRARRPARRYRRRRTTIKN
PCKTDGQPTDSSRHPRGIQVADPEQMGPRWVFHSFDWRRGYLSEKALKR LQEKPLDYDEYFTQPKRPRIFPPTESAEGEFREPEKGSYSEEERSQASAEE
QTQEATVLLLKRRLREQQQLQQQLQFLTREMFKTQAGLHLNPMLLNQR (SEQ ID NO: 45) ORF1/2 MAWGWWRWRRRWPARRWRRRRRRRPVRRTRARRPARRYRRRRTQRE
SSESPKKARIQRKKGRKPLPKSRRRRRQYSSSSDDSESNSSSSSSSNSSP EKCSKRKRVST (SEQ ID NO: 46) Tabela 13. Sequência de ácidos nucleicos de Anellovirus exemplificativa (Alphatorquevirus, Clado 7) Nome TTV-HD16d Gênero/Clado Alphatorquevirus, Clado 7 Número de Acesso FR751479.1 Sequência Total: 3866 bp 1 10 20 30 40 50 | | | | | |
AAGTCCGTCACTAACCACGTGACTCCCGCAGGCCAATCAGAGTCTATGTC GTGCACTTCCTGGGCATGGTCTACGTTCTCATATAACTAACTGCACTTCC GAATGGCTGAGTTTTCCACGCCCGTCCGCAGCGGCAGCACCACGGAGGGT GATCCCCGCGTCCCGAGGGCGGGTGCCGAAGGTGAGTTTACACACCGCAG TCAAGGGGCAATTCGGGCTCGGGACTGGCCGGGCTATGGGCAAGGCTCTT AGGGCTTTCATTGTTAAAAATGTTTCTCGGCAGGCCTTACAGGAGAAAGA AAAGGGCGCTGTCACTGCCTGGCGTGCGAGCTGCACAGGCGAAACAACCT GGTGATATGAGCTGGAGCCGTCCAGTACATAATGCCGCCGGGATCGAAAG GCAGTGGTTCGAATCCACCTTTAGATCCCACGCTAGTTGCTGTGGCTGCG GCAATTTTGTTAATCATATTAATGTACTGGCTGCTCGCTACGGCTTTACT GGGGGGCCGACGCCGCCAGGTGGTCCTGGGCCGCGTCCACAACTGAGGCC CGCGCTTCCCGCGCCGGACCCCGACCCCCAGGCGCCCAACCGTGAGCCAT GGCGTGGAGCTGGTGGTGGCAACGATGGAGAAGGCGCCGCTGGAAACCCA GGAGGCGCCGCTGGAGACGTCTACGATGGAGAAGACCTAGACGCGCTGTT CGCCGCCGTCGTCGAGGACGTAGAGTAAGGAGGCGGAGGTGGGCGCGTAG ACGGGGGCGACGCAGACGGTACGCCACCAGACGAAAGAGACGTTATAGGG GTCGCCGCTTTAAAAAGAAACTAGTACTGACTCAGTGGCACCCTAATACC ATGAGACGCTGCTTAATCAAGGGCATAGTCCCCCTGGTAATATGCGGCCA CACCAGGTGGAACTACAACTACGCCCTCCATAGCAAGGACTACACAGAGG AGGGTCGCTACCCTCACGGGGGGGCCCTCAGCACCACTACGTGGTCCCTT AAGGTGCTGTATGACGAGCACCTCAAACACCACGACTTCTGGGGCTATCC CAACAACCAGCTAGACCTGGCCAGGTACAAGGGGGCCAAGTTCACCTTCT ACAGACACAAAAAGACTGACTTTATAATATTCTTTAACAGAAAGCCTCCC TTTAAGCTAAACAAGTACAGCTGTGCCTCCTATCACCCAGGCATGCTGAT GCAGCAGAGACACAAGATCCTGCTACCCAGCTACGAAACTAAACCCAAGG GCAGGCCAAAGATAACAGTTAGAATAAAGCCCCCCACTCTGTTAGAGGAC AAGTGGTACACCCAGCAGGACCTGTGCGACGTTAACCTGTTGCAACTTGT GGTCACTGCGGCTGACTTTCGACATCCACTCTGCTCACCACAAACGAACA CTCCAACCACAACCTTCCAGGTGTTGAAAGACATCTATTATGACACTATG AGCATATCTGAACCCACAGACTCCTACACTAGTGTTAACAATAAAAGTAC AACACAAACTTTTACTAACTACTCAAACACCTTAGAAAACATTCTGTACA CACGAGCCTCCTACTGGAACTCGTTCCACGCCACTGAATACCTAAACCCC AACATCATATACAAAAACGGTGAAAAACTATTCAAAGAACATGAAGACTT AATAACCTGGATGACCCAAACTAACAATACCGGGTTTCTAACTAAAAACA ACACAGCTTTTGGCAACAACAGCTACAGGCCCAATGCAGACAAAATTAAA AAAGCCAGAAAGACATACTGGAACGCCCTAATAGGCACCAACGACCTGGC CACTAATATAGGCCAGGCCAGAGCAGAAAGGTTCGAGTACCACCTAGGCT GGTACTCCCCCATATTTCTCAGCAGACACAGGAGCAACATGAACTTTGCC AGGGCCTACCAAGACGTCACATACAACCCCAACTGTGACAGGGGAGTTAA CAACAGGGTGTGGGTTCAGCCTCTAACTAAACCCACCACAGAGTTCGACG AGAAAAGGTGTAAGTGCGTAGTGCAGCACCTGCCTCTGTGGGCGGCTCTG TACTGCTACCAAGACTTTGTAGAGGAGGAGCTGGGGTCCTCCTCAGAGAT ATTAAATTCATGCCTACTGGTATTACAGTGCCCTTACACCTTTCCCCCAA TGTATGACAAAAAGCTACCAGACAAGGGATTCGTGTTTTATGACTCCCTT TTTGGAGACGGCAAAATGTCTGACGGACGCGGACAGGTGGACATTTTCTG GCAACAGCGATGGTACCCTCGCTTAGCCACTCAGATGCAAGTCATGCACG ACATCACCATGACGGGCCCCTTCTCCTACCGAGACGAGCTAGTTAGCACC CAACTGACTGCCAAGTACACCTTTGACTTTATGTGGGGCGGAAATATGAT CTCCACACAGATCATCAAGAACCCCTGCAAAGACAGTGGACTGGAACCCG CCTACCCCGGTAGACAGCGTCGCGACTTACAAATTGTTGACCCATACTCC ATGGGCCCCCAATTCTCGTTCCACAACTGGGACTACAGACATGGCCTTTT TGGCCAAGACGCTATCGACAGAGTGTCTAAACAACCAAAAGATGATGCAG ACTATCCTAACCCATACAAAAGGCCTAGATATTTTCCACCCACAGACCAA GCCGCCCAAGAGCAAGAAAAAGACTTCAGTTTCCTCAAAACAGCACCGTC GAACTCAGAAGAGAGCGATCAAGAAGTCCTCCAAGAAACGCAAGTACTCC GATTCCAGCCAGAGCAGCACAAGCAACTCCACCTGCAGCTCGCAGAGCGG CAGCGAATCGGAGAGCAACTCCGATACCTACTCCAACAGATGTTCAAAAC TCAGGCCAATCTCCACCTAAACCCATATACATTTACCCAGCTGTAAAGCA GGTGTTTATGTTTGACCCCCCGGGCCCTAAGGCTATCTCGGGCGCCAAGG CCTGGGAGGACGAGTTCCTCACCGCAAAAGTGTGGAACCGCCCGGTACGC AAGTACTACTCAGACACCCCCTACTACCCCTGGGCCCCCAAACCCCAGTA CTCTGTCAGTTTCAAACTCGGCTGGAAATAAAAAAAGCCTGCTCCACTGT ACTAGGCCGTGGGAGTTTCACTCGTCGGTGTCTACCTCTTAAGGTCACCA AGCACTCCGAGCGTCAGCGAGGAGTGCGACCCTTGGGGGTGGGTGCAACG CCCTCGGCGGCCGCGCGCTACGCCTTCGGCTGCGCGCGGCACCTCGGACC CCCGCTCGTGCTGACGCGCTTGCGCGCGTCAGACCACTTCGGGCTCGCGG GGGTCGGAAATTTTGCTAAACAGACTCCGAGTTGCCATTGGACACTGGAG CCGTGAATCAGTAACGAAAGTGAGTGGGGCCAGACTTCGCCATAAGGCCT TTATCTTTTTGCCATTTGTCCGTGGGGAAGGGTCGCTGCAAGCGCGGACC CCGTTTTCACCCCTTCCGGACTACAAAAATAGCGCATTAGTGACGTCACG GCCGCCATTTTAAGTAAGGCGGAAGCAACTCCACTTTCTCACAAAATGGC GGCGGAGCACTTCCGGCTTGCCCAAAATGGCCGCCAAAAACATCCGGGTC AAAGTTCGCCGCTACGTCATAAGTCACGTGACTGGGGAGGTACTTAAACA CGGAAGTATCCTCAACCACGTAACTGGTCACGTGGTGCGCACGTCACGGC AACCATTTTGTTTTACAAAATGGCGCATTTCCTTCCTCTTTTTTAAAAAT TAACCGTTGGCGGCGGCGCGCGCGCTACGCGCGCGCGCCGGGGAGCTCTG
CCCCCCCCCGCGCATGCGCGCGGGTCCCCCCCCCGCGGGGGGCTCCGCCC CCCGGTCCCCCCCCCG (SEQ ID NO: 47) Anotações: Domínio Putativo Gama base Caixa TATA 82 – 86 Elemento Iniciador 94-115 Local de Início Transcricional 115 Domínio Conservado 5´ UTR 170 - 240 ORF2 357 - 728 ORF2/2 357 – 724 ; 2411 – 2870 ORF2/3 357 – 724 ; 2646 – 3081 ORF1 599 – 2896 ORF1/1 599 – 724 ; 2411 – 2896 ORF1/2 599 – 724 ; 2646 – 2870 Região de três grelhas de leitura aberta 2629 – 2867 Sinal de Poli(A) 3076 - 3086 região rica em GC 3759 – 3866
Tabela 14. Sequências exemplificativas de aminoácido de Anellovirus (Alphatorquevirus, Clado 7) TTV-HD16d (Alphatorquevirus Clado 7) ORF2 MSWSRPVHNAAGIERQWFESTFRSHASCCGCGNFVNHINVLAARYGFTGG
PTPPGGPGPRPQLRPALPAPDPDPQAPNREPWRGAGGGNDGEGAAGNP GGAAGDVYDGEDLDALFAAVVEDVE (SEQ ID NO: 48) ORF2/2 MSWSRPVHNAAGIERQWFESTFRSHASCCGCGNFVNHINVLAARYGFTGG
PTPPGGPGPRPQLRPALPAPDPDPQAPNREPWRGAGGGNDGEGAAGNP GGAAGDVYDGEDLDALFAAVVEDVESSRTPAKTVDWNPPTPVDSVATYKLL THTPWAPNSRSTTGTTDMAFLAKTLSTECLNNQKMMQTILTHTKGLDIFHPQ
TKPPKSKKKTSVSSKQHRRTQKRAIKKSSKKRKYSDSSQSSTSNSTCSSQS GSESESNSDTYSNRCSKLRPIST (SEQ ID NO: 49) ORF2/3 MSWSRPVHNAAGIERQWFESTFRSHASCCGCGNFVNHINVLAARYGFTGG
PTPPGGPGPRPQLRPALPAPDPDPQAPNREPWRGAGGGNDGEGAAGNP GGAAGDVYDGEDLDALFAAVVEDVEPSRPRARKRLQFPQNSTVELRRERS RSPPRNASTPIPARAAQATPPAARRAAANRRATPIPTPTDVQNSGQSPPKPI
YIYPAVKQVFMFDPPGPKAISGAKAWEDEFLTAKVWNRPVRKYYSDTPYYP WAPKPQYSVSFKLGWK (SEQ ID NO: 50) ORF1 MAWSWWWQRWRRRRWKPRRRRWRRLRWRRPRRAVRRRRRGRRVRR
RRWARRRGRRRRYATRRKRRYRGRRFKKKLVLTQWHPNTMRRCLIKGIVP LVICGHTRWNYNYALHSKDYTEEGRYPHGGALSTTTWSLKVLYDEHLKHHD FWGYPNNQLDLARYKGAKFTFYRHKKTDFIIFFNRKPPFKLNKYSCASYHPG MLMQQRHKILLPSYETKPKGRPKITVRIKPPTLLEDKWYTQQDLCDVNLLQL VVTAADFRHPLCSPQTNTPTTTFQVLKDIYYDTMSISEPTDSYTSVNNKSTT QTFTNYSNTLENILYTRASYWNSFHATEYLNPNIIYKNGEKLFKEHEDLITWM TQTNNTGFLTKNNTAFGNNSYRPNADKIKKARKTYWNALIGTNDLATNIGQA RAERFEYHLGWYSPIFLSRHRSNMNFARAYQDVTYNPNCDRGVNNRVWV QPLTKPTTEFDEKRCKCVVQHLPLWAALYCYQDFVEEELGSSSEILNSCLLV LQCPYTFPPMYDKKLPDKGFVFYDSLFGDGKMSDGRGQVDIFWQQRWYP RLATQMQVMHDITMTGPFSYRDELVSTQLTAKYTFDFMWGGNMISTQIIKN PCKDSGLEPAYPGRQRRDLQIVDPYSMGPQFSFHNWDYRHGLFGQDAIDR VSKQPKDDADYPNPYKRPRYFPPTDQAAQEQEKDFSFLKTAPSNSEESDQ
EVLQETQVLRFQPEQHKQLHLQLAERQRIGEQLRYLLQQMFKTQANLHLNP YTFTQL (SEQ ID NO: 51) ORF1/1 MAWSWWWQRWRRRRWKPRRRRWRRLRWRRPRRAVRRRRRGRRIIKNP
CKDSGLEPAYPGRQRRDLQIVDPYSMGPQFSFHNWDYRHGLFGQDAIDRV SKQPKDDADYPNPYKRPRYFPPTDQAAQEQEKDFSFLKTAPSNSEESDQE VLQETQVLRFQPEQHKQLHLQLAERQRIGEQLRYLLQQMFKTQANLHLNPY
TTV-HD16d (Alphatorquevirus Clado 7) TFTQL (SEQ ID NO: 52) ORF1/2 MAWSWWWQRWRRRRWKPRRRRWRRLRWRRPRRAVRRRRRGRRTKPP
KSKKKTSVSSKQHRRTQKRAIKKSSKKRKYSDSSQSSTSNSTCSSQSGSES ESNSDTYSNRCSKLRPIST (SEQ ID NO: 53) Tabela 15. Sequência de ácidos nucleicos de Anellovirus exemplificativa (Betatorquevirus) Nome TTMV-LY2 Gênero/Clado Betatorquevirus Número de Acesso JX134045.1 Sequência Total: 2797 pb 1 10 20 30 40 50 | | | | | |
TAATAAATATTCAACAGGAAAACCACCTAATTTAAATTGCCGACCACAAA CCGTCACTTAGTTCCCCTTTTTGCAACAACTTCTGCTTTTTTCCAACTGC CGGAAAACCACATAATTTGCATGGCTAACCACAAACTGATATGCTAATTA ACTTCCACAAAACAACTTCCCCTTTTAAAACCACACCTACAAATTAATTA TTAAACACAGTCACATCCTGGGAGGTACTACCACACTATAATACCAAGTG CACTTCCGAATGGCTGAGTTTATGCCGCTAGACGGAGAACGCATCAGTTA CTGACTGCGGACTGAACTTGGGCGGGTGCCGAAGGTGAGTGAAACCACCG AAGTCAAGGGGCAATTCGGGCTAGTTCAGTCTAGCGGAACGGGCAAGAAA CTTAAAATTATTTTATTTTTCAGATGAGCGACTGCTTTAAACCAACATGC TACAACAACAAAACAAAGCAAACTCACTGGATTAATAACCTGCATTTAAC CCACGACCTGATCTGCTTCTGCCCAACACCAACTAGACACTTATTACTAG CTTTAGCAGAACAACAAGAAACAATTGAAGTGTCTAAACAAGAAAAAGAA AAAATAACAAGATGCCTTATTACTACAGAAGAAGACGGTACAACTACAGA CGTCCTAGATGGTATGGACGAGGTTGGATTAGACGCCCTTTTCGCAGAAG ATTTCGAAGAAAAAGAAGGGTAAGACCTACTTATACTACTATTCCTCTAA AGCAATGGCAACCGCCATATAAAAGAACATGCTATATAAAAGGACAAGAC TGTTTAATATACTATAGCAACTTAAGACTGGGAATGAATAGTACAATGTA TGAAAAAAGTATTGTACCTGTACATTGGCCGGGAGGGGGTTCTTTTTCTG TAAGCATGTTAACTTTAGATGCCTTGTATGATATACATAAACTTTGTAGA AACTGGTGGACATCCACAAACCAAGACTTACCACTAGTAAGATATAAAGG ATGCAAAATAACATTTTATCAAAGCACATTTACAGACTACATAGTAAGAA TACATACAGAACTACCAGCTAACAGTAACAAACTAACATACCCAAACACA CATCCACTAATGATGATGATGTCTAAGTACAAACACATTATACCTAGTAG ACAAACAAGAAGAAAAAAGAAACCATACACAAAAATATTTGTAAAACCAC
Nome TTMV-LY2 Gênero/Clado Betatorquevirus Número de Acesso JX134045.1
CTCCGCAATTTGAAAACAAATGGTACTTTGCTACAGACCTCTACAAAATT CCATTACTACAAATACACTGCACAGCATGCAACTTACAAAACCCATTTGT AAAACCAGACAAATTATCAAACAATGTTACATTATGGTCACTAAACACCA TAAGCATACAAAATAGAAACATGTCAGTGGATCAAGGACAATCATGGCCA TTTAAAATACTAGGAACACAAAGCTTTTATTTTTACTTTTACACCGGAGC AAACCTACCAGGTGACACAACACAAATACCAGTAGCAGACCTATTACCAC TAACAAACCCAAGAATAAACAGACCAGGACAATCACTAAATGAGGCAAAA ATTACAGACCATATTACTTTCACAGAATACAAAAACAAATTTACAAATTA TTGGGGTAACCCATTTAATAAACACATTCAAGAACACCTAGATATGATAC TATACTCACTAAAAAGTCCAGAAGCAATAAAAAACGAATGGACAACAGAA AACATGAAATGGAACCAATTAAACAATGCAGGAACAATGGCATTAACACC ATTTAACGAGCCAATATTCACACAAATACAATATAACCCAGATAGAGACA CAGGAGAAGACACTCAATTATACCTACTCTCTAACGCTACAGGAACAGGA TGGGACCCACCAGGAATTCCAGAATTAATACTAGAAGGATTTCCACTATG GTTAATATATTGGGGATTTGCAGACTTTCAAAAAAACCTAAAAAAAGTAA CAAACATAGACACAAATTACATGTTAGTAGCAAAAACAAAATTTACACAA AAACCTGGCACATTCTACTTAGTAATACTAAATGACACCTTTGTAGAAGG CAATAGCCCATATGAAAAACAACCTTTACCTGAAGACAACATTAAATGGT ACCCACAAGTACAATACCAATTAGAAGCACAAAACAAACTACTACAAACT GGGCCATTTACACCAAACATACAAGGACAACTATCAGACAATATATCAAT GTTTTATAAATTTTACTTTAAATGGGGAGGAAGCCCACCAAAAGCAATTA ATGTTGAAAATCCTGCCCACCAGATTCAATATCCCATACCCCGTAACGAG CATGAAACAACTTCGTTACAGAGTCCAGGGGAAGCCCCAGAATCCATCTT ATACTCCTTCGACTATAGACACGGGAACTACACAACAACAGCTTTGTCAC GAATTAGCCAAGACTGGGCACTTAAAGACACTGTTTCTAAAATTACAGAG CCAGATCGACAGCAACTGCTCAAACAAGCCCTCGAATGCCTGCAAATCTC GGAAGAAACGCAGGAGAAAAAAGAAAAAGAAGTACAGCAGCTCATCAGCA ACCTCAGACAGCAGCAGCAGCTGTACAGAGAGCGAATAATATCATTATTA AAGGACCAATAACTTTTAACTGTGTAAAAAAGGTGAAATTGTTTGATGAT AAACCAAAAAACCGTAGATTTACACCTGAGGAATTTGAAACTGAGTTACA AATAGCAAAATGGTTAAAGAGACCCCCAAGATCCTTTGTAAATGATCCTC CCTTTTACCCATGGTTACCACCTGAACCTGTTGTAAACTTTAAGCTTAAT TTTACTGAATAAAGGCCAGCATTAATTCACTTAAGGAGTCTGTTTATTTA AGTTAAACCTTAATAAACGGTCACCGCCTCCCTAATACGCAGGCGCAGAA
AGGGGGCTCCGCCCCCTTTAACCCCCAGGGGGCTCCGCCCCCTGAAACCC CCAAGGGGGCTACGCCCCCTTACACCCCC (SEQ ID NO: 54)
Nome TTMV-LY2 Gênero/Clado Betatorquevirus Número de Acesso JX134045.1 Anotações: Domínio Putativo Gama base Caixa TATA 237– 243 Local Cap 260 – 267 Local de Início Transcricional 267 Domínio Conservado 5´ UTR 323 – 393 ORF2 424 – 723 ORF2/2 424 – 719 ; 2274 – 2589 ORF2/3 424 – 719 ; 2449 – 2812 ORF1 612 – 2612 ORF1/1 612 – 719 ; 2274 – 2612 ORF1/2 612 – 719 ; 2449 – 2589 Região de três grelhas de leitura aberta 2441 – 2586 Sinal de Poli(A) 2808 – 2813 Região rica em GC 2868 – 2929 Tabela 16. Sequências de aminoácidos de Anellovirus exemplificativas (Betatorquevirus) TTMV-LY2 (Betatorquevirus) ORF2 MSDCFKPTCYNNKTKQTHWINNLHLTHDLICFCPTPTRHLLLALAEQQETIEV SKQEKEKITRCLITTEEDGTTTDVLDGMDEVGLDALFAEDFEEKEG (SEQ ID NO: 55) ORF2/2 MSDCFKPTCYNNKTKQTHWINNLHLTHDLICFCPTPTRHLLLALAEQQETIEV
SKQEKEKITRCLITTEEDGTTTDVLDGMDEVGLDALFAEDFEEKEGFNIPYPV
TSMKQLRYRVQGKPQNPSYTPSTIDTGTTQQQLCHELAKTGHLKTLFLKLQ SQIDSNCSNKPSNACKSRKKRRRKKKKKYSSSSATSDSSSSCTESE (SEQ ID NO: 56) ORF2/3 MSDCFKPTCYNNKTKQTHWINNLHLTHDLICFCPTPTRHLLLALAEQQETIEV
SKQEKEKITRCLITTEEDGTTTDVLDGMDEVGLDALFAEDFEEKEGARSTAT AQTSPRMPANLGRNAGEKRKRSTAAHQQPQTAAAAVQRANNIIIKGPITFNC
VKKVKLFDDKPKNRRFTPEEFETELQIAKWLKRPPRSFVNDPPFYPWLPPE PVVNFKLNFTE (SEQ ID NO: 57) ORF1 MPYYYRRRRYNYRRPRWYGRGWIRRPFRRRFRRKRRVRPTYTTIPLKQW
QPPYKRTCYIKGQDCLIYYSNLRLGMNSTMYEKSIVPVHWPGGGSFSVSML TLDALYDIHKLCRNWWTSTNQDLPLVRYKGCKITFYQSTFTDYIVRIHTELPA NSNKLTYPNTHPLMMMMSKYKHIIPSRQTRRKKKPYTKIFVKPPPQFENKW
TTMV-LY2 (Betatorquevirus)
YFATDLYKIPLLQIHCTACNLQNPFVKPDKLSNNVTLWSLNTISIQNRNMSVD QGQSWPFKILGTQSFYFYFYTGANLPGDTTQIPVADLLPLTNPRINRPGQSL NEAKITDHITFTEYKNKFTNYWGNPFNKHIQEHLDMILYSLKSPEAIKNEWTT ENMKWNQLNNAGTMALTPFNEPIFTQIQYNPDRDTGEDTQLYLLSNATGTG WDPPGIPELILEGFPLWLIYWGFADFQKNLKKVTNIDTNYMLVAKTKFTQKP GTFYLVILNDTFVEGNSPYEKQPLPEDNIKWYPQVQYQLEAQNKLLQTGPFT PNIQGQLSDNISMFYKFYFKWGGSPPKAINVENPAHQIQYPIPRNEHETTSL
QSPGEAPESILYSFDYRHGNYTTTALSRISQDWALKDTVSKITEPDRQQLLK QALECLQISEETQEKKEKEVQQLISNLRQQQQLYRERIISLLKDQ (SEQ ID NO: 58) ORF1/1 MPYYYRRRRYNYRRPRWYGRGWIRRPFRRRFRRKRRIQYPIPRNEHETTS
LQSPGEAPESILYSFDYRHGNYTTTALSRISQDWALKDTVSKITEPDRQQLL KQALECLQISEETQEKKEKEVQQLISNLRQQQQLYRERIISLLKDQ (SEQ ID NO: 59) ORF1/2 MPYYYRRRRYNYRRPRWYGRGWIRRPFRRRFRRKRRSQIDSNCSNKPSN ACKSRKKRRRKKKKKYSSSSATSDSSSSCTESE (SEQ ID NO: 60) Tabela 17. Sequência de ácidos nucleicos de Anellovirus exemplificativa (Gammatorquevirus) Nome TTMDV-MD1-073 Gênero/Clado Gammatorquevirus Número de Acesso AB290918.1 Sequência Total: 3242 pb 1 10 20 30 40 50 | | | | | |
AGGTGGAGACTCTTAAGCTATATAACCAAGTGGGGTGGCGAATGGCTGAG TTTACCCCGCTAGACGGTGCAGGGACCGGATCGAGCGCAGCGAGGAGGTC CCCGGCTGCCCGTGGGCGGGAGCCCGAGGTGAGTGAAACCACCGAGGTCT AGGGGCAATTCGGGCTAGGGCAGTCTAGCGGAACGGGCAAGAAACTTAAA AATATTTCTTTTACAGATGCAAAACCTATCAGCCAAAGACTTCTACAAAC CATGCAGATACAACTGTGAAACTAAAAACCAAATGTGGATGTCTGGCATT GCTGACTCCCATGACAGTTGGTGTGACTGTGATACTCCTTTTGCTCACCT CCTGGCTAGTATTTTTCCTCCTGGTCACACAGATCGCACACGAACCATCC AAGAAATACTTACCAGAGATTTTAGGAAAACATGCCTTTCTGGTGGGGCC GACGCAACAAATTCTGGTATGGCCGAAACTATAGAAGAAAAAAGAGAAGA TTTCCAAAAAGAAGAAAAAGAAGATTTTACAGAAGAACAAAATATAGAAG ACCTGCTCGCCGCCGTCGCAGACGCAGAAGGAAGGTAAGAAGAAAAAAAA AAACTCTTATAGTAAGACAATGGCAGCCAGACTCTATTGTACTCTGTAAA ATTAAAGGGTATGACTCTATAATATGGGGAGCTGAAGGCACACAGTTTCA
Nome TTMDV-MD1-073 Gênero/Clado Gammatorquevirus Número de Acesso AB290918.1
ATGTTCTACACATGAAATGTATGAATATACAAGACAAAAGTACCCTGGGG GAGGAGGATTTGGTGTACAACTTTACAGCTTAGAGTATTTGTATGACCAA TGGAAACTTAGAAATAATATATGGACTAAAACAAATCAACTCAAAGATTT GTGTAGATACTTAAAATGTGTTATGACCTTTTACAGACACCAACACATAG ATTTTGTAATTGTATATGAAAGACAACCCCCATTTGAAATAGATAAACTA ACATACATGAAATATCATCCATATATGTTATTACAAAGAAAGCATAAAAT AATTTTACCTAGTCAAACAACTAATCCTAGAGGTAAATTAAAAAAAAAGA AAACTATTAAACCTCCCAAACAAATGCTCAGCAAATGGTTTTTTCAACAA CAATTTGCTAAATATGATCTACTACTTATTGCTGCAGCAGCATGTAGTTT AAGATACCCTAGAATAGGCTGCTGCAATGAAAATAGAATGATAACCTTAT ACTGTTTAAATACTAAATTTTATCAAGATACAGAATGGGGAACTACAAAA CAGGCCCCCCACTACTTTAAACCATATGCAACAATTAATAAATCCATGAT ATTTGTCTCTAACTATGGAGGTAAAAAAACAGAATATAACATAGGCCAAT GGATAGAAACAGATATACCTGGAGAAGGTAATCTAGCAAGATACTACAGA TCAATAAGTAAAGAAGGAGGTTACTTTTCACCTAAAATACTGCAAGCATA TCAAACAAAAGTAAAGTCTGTAGACTACAAACCTTTACCAATTGTTTTAG GTAGATATAACCCAGCAATAGATGATGGAAAAGGCAACAAAATTTACTTA CAAACTATAATGAATGGCCATTGGGGCCTACCTCAAAAAACACCAGATTA TATAATAGAAGAGGTCCCTCTTTGGCTAGGCTTCTGGGGATACTATAACT ACTTAAAACAAACAAGAACTGAAGCTATATTTCCACTACACATGTTTGTA GTGCAAAGCAAATACATTCAAACACAACAAACAGAAACACCTAACAATTT TTGGGCATTTATAGACAACAGCTTTATACAGGGCAAAAACCCATGGGACT CAGTTATTACTTACTCAGAACAAAAGCTATGGTTTCCTACAGTTGCATGG CAACTAAAAACCATAAATGCTATTTGTGAAAGTGGACCATATGTACCTAA ACTAGACAATCAAACATATAGTACCTGGGAACTAGCAACTCATTACTCAT TTCACTTTAAATGGGGTGGTCCACAGATATCAGACCAACCAGTTGAAGAC CCAGGAAACAAAAACAAATATGATGTGCCCGATACAATCAAAGAAGCATT ACAAATTGTTAACCCAGCAAAAAACATTGCTGCCACGATGTTCCATGACT GGGACTACAGACGGGGTTGCATTACATCAACAGCTATTAAAAGAATGCAA CAAAACCTCCCAACTGATTCATCTCTCGAATCTGATTCAGACTCAGAACC AGCACCCAAGAAAAAAAGACTACTACCAGTCCTCCACGACCCACAAAAGA AAACGGAAAAGATCAACCAATGTCTCCTCTCTCTCTGCGAAGAAAGTACA TGCCAGGAGCAGGAAACGGAGGAAAACATCCTCAAGCTCATCCAGCAGCA GCAGCAGCAGCAGCAGAAACTCAAGCACAACCTCTTAGTACTAATCAAGG ACTTAAAAGTGAAACAAAGATTATTACAACTACAAACGGGGGTACTAGAA TAACCCTTACCAGATTTAAACCAGGATTTGAGCAAGAAACTGAAAAAGAG
Nome TTMDV-MD1-073 Gênero/Clado Gammatorquevirus Número de Acesso AB290918.1
TTAGCACAAGCATTTAACAGACCCCCTAGACTGTTCAAAGAAGATAAACC CTTTTACCCCTGGCTACCCAGATTTACACCCCTTGTAAACTTTCACCTTA ATTTTAAAGGCTAGGCCTACACTGCTCACTTAGTGGTGTATGTTTATTAA AGTTTGCACCCCAGAAAAATTGTAAAATAAAAAAAAAAAAAAAAAATAAA AAATTGCAAAAATTCGGCGCTCGCGCGCGCTGCGCGCGCGAGCGCCGTCA CGCGCCGGCGCTCGCGCGCCGCGCGTATGTGCTAACACACCACGCACCTA GATTGGGGTGCGCGCGTAGCGCGCGCACCCCAATGCGCCCCGCCCTCGTT CCGACCCGCTTGCGCGGGTCGGACCACTTCGGGCTCGGGGGGGCGCGCCT GCGGCGCTTATTTACTAAACAGACTCCGAGTCGCCATTGGGCCCCCCCTA AGCTCCGCCCCCCTCATGAATATTCATAAAGGAAACCACAAAATTAGAAT TGCCGACCACAAACTGCCATATGCTAATTAGTTCCCCTTTTACACAGTAA AAAGGGGAAGTGGGGGGGCAGAGCCCCCCCACACCCCCCGCGGGGGGGGC AGAGCCCCCCCCGCACCCCCCCTACGTCACAGGCCACGCCCCCGCCGCCA
TCTTGGGTGCGGCAGGGCGGGGACTAAAATGGCGGGACCCAATCATTTTA TACTTTCACTTTCCAATTAAAACCCGCCACGTCACACAAAAG (SEQ ID NO: 61) Anotações: Domínio Putativo Gama base Caixa TATA 21– 25 Local Cap 42 – 49 Local de Início Transcricional 49 Domínio Conservado 5´ UTR 117 – 187 ORF2 283 – 588 ORF2/2 283 – 584 ; 1977 – 2388 ORF2/3 283 – 584 ; 2197 – 2614 ORF1 432 – 2453 ORF1/1 432 – 584 ; 1977 – 2453 ORF1/2 432 – 584 ; 2197 – 2388 Região de três grelhas de leitura aberta 2186 – 2385 Sinal de Poli(A) 2676 – 2681 Região rica em GC 3054 – 3172
Tabela 18. Sequências de aminoácidos de Anellovirus exemplificativas (Gammatorquevirus) TTMDV-MD1-073 (Gammatorquevirus) ORF2 MWMSGIADSHDSWCDCDTPFAHLLASIFPPGHTDRTRTIQEILTRDFRKTCLSGGADATNSG MAETIEEKREDFQKEEKEDFTEEQNIEDLLAAVADAEGR (SEQ ID NO: 62) ORF2/2 MWMSGIADSHDSWCDCDTPFAHLLASIFPPGHTDRTRTIQEILTRDFRKTCLSGGADATNSG
MAETIEEKREDFQKEEKEDFTEEQNIEDLLAAVADAEGRYQTNQLKTQETKTNMMCPIQSKKH
YKLLTQQKTLLPRCSMTGTTDGVALHQQLLKECNKTSQLIHLSNLIQTQNQHPRKKDYYQSST THKRKRKRSTNVSSLSAKKVHARSRKRRKTSSSSSSSSSSSSRNSSTTS (SEQ ID NO: 63) ORF2/3 MWMSGIADSHDSWCDCDTPFAHLLASIFPPGHTDRTRTIQEILTRDFRKTCLSGGADATNSG
MAETIEEKREDFQKEEKEDFTEEQNIEDLLAAVADAEGRTSTQEKKTTTSPPRPTKENGKDQP
MSPLSLRRKYMPGAGNGGKHPQAHPAAAAAAAETQAQPLSTNQGLKSETKIITTTNGGTRITL TRFKPGFEQETEKELAQAFNRPPRLFKEDKPFYPWLPRFTPLVNFHLNFKG (SEQ ID NO: 64) ORF1 MPFWWGRRNKFWYGRNYRRKKRRFPKRRKRRFYRRTKYRRPARRRRRRRRKVRRKKKTLI
VRQWQPDSIVLCKIKGYDSIIWGAEGTQFQCSTHEMYEYTRQKYPGGGGFGVQLYSLEYLYD QWKLRNNIWTKTNQLKDLCRYLKCVMTFYRHQHIDFVIVYERQPPFEIDKLTYMKYHPYMLLQ RKHKIILPSQTTNPRGKLKKKKTIKPPKQMLSKWFFQQQFAKYDLLLIAAAACSLRYPRIGCCN ENRMITLYCLNTKFYQDTEWGTTKQAPHYFKPYATINKSMIFVSNYGGKKTEYNIGQWIETDIP GEGNLARYYRSISKEGGYFSPKILQAYQTKVKSVDYKPLPIVLGRYNPAIDDGKGNKIYLQTIM NGHWGLPQKTPDYIIEEVPLWLGFWGYYNYLKQTRTEAIFPLHMFVVQSKYIQTQQTETPNNF WAFIDNSFIQGKNPWDSVITYSEQKLWFPTVAWQLKTINAICESGPYVPKLDNQTYSTWELAT HYSFHFKWGGPQISDQPVEDPGNKNKYDVPDTIKEALQIVNPAKNIAATMFHDWDYRRGCITS
TAIKRMQQNLPTDSSLESDSDSEPAPKKKRLLPVLHDPQKKTEKINQCLLSLCEESTCQEQET EENILKLIQQQQQQQQKLKHNLLVLIKDLKVKQRLLQLQTGVLE (SEQ ID NO: 65) ORF1/1 MPFWWGRRNKFWYGRNYRRKKRRFPKRRKRRFYRRTKYRRPARRRRRRRRKISDQPVED
PGNKNKYDVPDTIKEALQIVNPAKNIAATMFHDWDYRRGCITSTAIKRMQQNLPTDSSLESDS
DSEPAPKKKRLLPVLHDPQKKTEKINQCLLSLCEESTCQEQETEENILKLIQQQQQQQQKLKH NLLVLIKDLKVKQRLLQLQTGVLE (SEQ ID NO: 66) ORF1/2 MPFWWGRRNKFWYGRNYRRKKRRFPKRRKRRFYRRTKYRRPARRRRRRRRKISDQPVED
PGNKNKYDVPDTIKEALQIVNPAKNIAATMFHDWDYRRGCITSTAIKRMQQNLPTDSSLESDS
DSEPAPKKKRLLPVLHDPQKKTEKINQCLLSLCEESTCQEQETEENILKLIQQQQQQQQKLKH NLLVLIKDLKVKQRLLQLQTGVLE (SEQ ID NO: 67)
Tabela B1. Sequência de ácidos nucleicos de Anellovirus exemplificativa (Gammatorquevirus) Nome Ring3.1 Gênero/Clado Gammatorquevirus Número de Acesso Sequência Total: 3264 pb 1 10 20 30 40 50 | | | | | |
TAAAATGGCGGCAACCAATCATTTTATACTTTCACTTTCCAATTACAAGC CGCCACGTCACAGAACAGGGGTGGAGACTTTAAAACTATATAACCAAGTG ATGTGACGAATGGCTGAGTTTACCCCGCTAGACGGTGCAGGGACCGGATC GAGCGCAGCGAGGAGGTCCCCGGCTGCCCGTGGGCGGGAGCCCGAGGTGA GTGAAACCACCGAGGTCTAGGGGCAATTCGGGCTAGGGCAGTCTAGCGGA ACGGGCAAGAAACTTAAAATATGTTTTGTTTCAGATGCAGACACCTGCTT CACAGATAAGCTCAGACGACTTCTTTGTACACACTCCATTTAATGCAGTA ACTAAACAGCAAATATGGATGTCTCAAATTGCTGATGGACATGACAACAT TTGTCACTGCCACCGTCCTTTTGCTCACCTGCTTGCTAATATTTTTCCTC CTGGTCATAAAGACAGGGATCTTACCATTAATCAAATACTTGCTAGAGAT CTTACAGAAACATGCCATTCTGGTGGAGACGAAGGAACAAGCGGTGGTGG GGTCGCCGCTTCCGCTACCGCCGCTACAACAAATATAAAACCAGAAGGAG ACGCAGAATACCCAGAAGACGAAATAGAAGATTTACTAAGACACGCAGGA GAAGAAAAAGAAAGAAGGTAAGAAGAAAACTTAAAAAAATTACTATTAAA CAATGGCAGCCAGATTCAGTGAAAAAATGTAAAATTAAAGGATATAGTAC TTTAGTTATGGGTGCACAAGGAAAACAATACAACTGTTACACAAACCAAG CAAGTGACTATGTTCAGCCTAAAGCACCACAAGGTGGGGGCTTTGGCTGT GAAGTATTTAATTTAAAATGGCTATACCAAGAATATACTGCACACAGAAA TATTTGGACAAAAACAAATGAATATACAGACCTTTGTAGATACACTGGAG CTCAAATAATTTTATACAGGCACCCAGATGTTGATTTTATAGTCAGCTGG GACAATCAGCCACCTTTTTTACTTAACAAATATACATATCCAGAACTGCA ACCACAAAACCTTTTACTAGCTAGAAGGAAAAGAATTATTCTTAGTCAAA AATCAAACCCCAAAGGAAAACTAAGAATTAAACTAAGAATACCACCACCA AAACAAATGATAACAAAATGGTTTTTTCAAAGAGACTTTTGTGATGTGAA TCTGTTTAAACTATGTGCTTCTGCTGCTTCTTTCCGCTACCCAGGTATCA GTCATGGAGCTCAAAGTACTATTTTTTCTGCATATGCTTTAAACACTGAC TTTTATCAATGCAGTGACTGGTGCCAAACTAACACAGAAACTGGCTACCT AAACATTAAAACACAACAAATGCCACTATGGTTTCATTACAGAGAGGGTG GCAAAGAGAAATGGTATAAATACACCAACAAAGAACACAGACCATATACA AATACATATCTTAAAAGTATTAGCTATAATGATGGATTGTTTTCTCCTAA AGCCATGTTTGCATTTGAAGTAAAAGCGGGGGGTGAAGGAACAACAGAAC CACCACAAGGCGCCCAATTAATTGCTAACCTTCCACTCATTGCACTAAGA TATAATCCACATGAAGACACAGGCCATGGCAATGAAATTTACCTTACATC AACTTTTAAAGGTACATATGACAAACCTAAAGTTACTGATGCTCTATACT TTAACAATGTACCCCTGTGGATGGGATTTTATGGCTACTGGGACTTTATA TTACAAGAAACAAAAAACAAAGGTGTCTTTGATCAACATATGTTTGTTGT TAAATGTCCTGCCTTAAGGCCCATATCACAAGTCACAAAACAAGTATACT ACCCACTTGTAGACATGGACTTTTGTTCAGGGAGACTGCCATTTGATGAA TATTTATCCAAAGACATTAAAAGTCATTGGTATCCCACTGCAGAAAGACA AACAGTTACAATAAATAATTTTGTTACAGCAGGTCCATACATGCCTAAAT TTGAACCCACAGACAAAGACAGTACATGGCAATTAAACTATCACTATAAA TTTTTTTTTAAGTGGGGTGGTCCACAAGTCACAGACCCAACTGTTGAAGA CCCATGCAGCAGAAACAAATATCCTGTCCCCGATACAATGCAACAAACAA TACAAATTAAAAACCCTGAAAAGCTGCACCCAGCAACCCTCTTCCATGAC TGGGACCTTAGAAGGGGCTTCATTACACAAGCAGCTATTAAAAGAATGTC AGAAAACCTCCAAATTGATTCATCTTTCGAATCTGATGGCACAGAATCAC CCAAAAAAAAGAAAAGATGCACCAAAGAAATCCCAACACAAAACCAAAAG CAAGAAGAGATCCAAGAATGTCTCCTCTCACTCTGCGAAGAGCCTACATG CCAAGAAGAAACAGAGGACCTCCAGCTCTTCATCCAGCAGCAGCAGCAGC AGCAGTACAAGCTCAGAAAAAACCTCTTCAAACTCCTCACTCACCTGAAA AAAGGACAGAGAATAAGTCAACTACAAACGGGACTTTTAGAGTAATACCA TTTAAACCAGGTTTTGAACAAGAAACAGAAAAAGAACTTGCCATAGCTTT CTGCAGACCACCTAGAAAATATAAAAATGATCCCCCTTTTTATCCCTGGT TACCATGGACACCCCTTGTACACTTTAACCTTAATTACAAAGGCTAGGCC AACACTGTTCACTTAGTGGTGTATGTTTAATAAAGTTTCACCCCCAAAAA AAAAAAAAAAAAAAAAAAAAAAAAAAAAAATAAAAAATTGCAAAAATTCG GCGCTCGCGCGCGCTGCGCGCGCGCGAGCGCCGTCACGCGCCGGCGCTCG CGCGCCGCGCGTATGTGCTAACACACCACGCACCTAGATTGGGGTGCGCG CGCTAGCGCGCGCACCCCAATGCGCCCCGCCCTCGTTCCGACCCGCTTGC GCGGGTCGGACCACTTCGGGCTCGGGGGGGCGCGCCTGCGGCGCTTTTTT ACTAAACAGACTCCGAGCCGCCATTTGGCCCCCCCTAAGCTCCGCCCCCC TCATGAATATTCATAAAGGAAACCACATAATTAGAATTGCCGACCACAAA CTGCCATATGCTAATTAGTTCCCCTTTTACACAGTAAAAAGGGGAAGTGG GGGGGCATAGCCCCCCCACACCCCCCGCGGGGGGGGCAGAGCCCCCCCCC
GCACCCCCCCCCTACGTCACAATCCACGCCCCCGCCGCCATCTTGGGTGC GGCAGGGCGGGGGC (SEQ ID NO: 878) Anotações: Domínio Putativo Gama base Caixa TATA 87– 93
Local Cap 110 – 117 Local de Início Transcricional 117 Domínio Conservado 5´ UTR 185 – 255 ORF2 285 – 671 ORF2/2 285 – 667 ; 2063 – 2498 ORF2/3 285 – 667 ; 2295 – 2697 TAIP 385 - 585 ORF1 512 – 2545 ORF1/1 512 – 667 ; 2063 – 2545 ORF1/2 512 – 667 ; 2295 – 2498 Região de três grelhas de leitura aberta 2295 – 2495 Sinal de Poli(A) 2729 – 2734 Região rica em GC 3141 – 3264 Tabela C1. Sequências de aminoácidos de Anellovirus exemplificativas (Gammatorquevirus) Ring 3.1 (Gammatorquevirus) ORF2 MQTPASQISSDDFFVHTPFNAVTKQQIWMSQIADGHDNICHCHRPFAHLLA
NIFPPGHKDRDLTINQ
ILARDLTETCHSGGDEGTSGGGVAASATAATTNIKPEGDAEYPEDEIEDLLR HAGEEKERR (SEQ ID NO: 879) ORF2/2 MQTPASQISSDDFFVHTPFNAVTKQQIWMSQIADGHDNICHCHRPFAHLLA
NIFPPGHKDRDLTINQ ILARDLTETCHSGGDEGTSGGGVAASATAATTNIKPEGDAEYPEDEIEDLLR HAGEEKERSGVVHKSQTQLLKTHAAETNILSPIQCNKQYKLKTLKSCTQQPS SMTGTLEGASLHKQLLKECQKTSKLIHLSNLMAQNHPKKRKDAPKKSQHKT
KSKKRSKNVSSHSAKSLHAKKKQRTSSSSSSSSSSSSTSSEKTSSNSSLT (SEQ ID NO: 880) ORF2/3 MQTPASQISSDDFFVHTPFNAVTKQQIWMSQIADGHDNICHCHRPFAHLLA
NIFPPGHKDRDLTINQ ILARDLTETCHSGGDEGTSGGGVAASATAATTNIKPEGDAEYPEDEIEDLLR HAGEEKERRITQKKEKMHQRNPNTKPKARRDPRMSPLTLRRAYMPRRNRG
PPALHPAAAAAAVQAQKKPLQTPHSPEKRTENKSTTNGTFRVIPFKPGFEQ ETEKELAIAFCRPPRKYKNDPPFYPWLPWTPLVHFNLNYKG (SEQ ID NO: 881)
TAIP MDMTTFVTATVLLLTCLLIFFLLVIKTGILPLIKYLLEILQKHAILVETKEQAVVG SPLPLPPLQQI (SEQ ID NO: 882) ORF1 MPFWWRRRNKRWWGRRFRYRRYNKYKTRRRRRIPRRRNRRFTKTRRRR
KRKKVRRKLKKITIKQWQP
Ring 3.1 (Gammatorquevirus)
DSVKKCKIKGYSTLVMGAQGKQYNCYTNQASDYVQPKAPQGGGFGCEVF NLKWLYQEYTAHRNIWTKTNEYTDLCRYTGAQIILYRHPDVDFIVSWDNQPP FLLNKYTYPELQPQNLLLARRKRIILSQKSNPKGKLRIKLRIPPPKQMITKWFF QRDFCDVNLFKLCASAASFRYPGISHGAQSTIFSAYALNTDFYQCSDWCQT NTETGYLNIKTQQMPLWFHYREGGKEKWYKYTNKEHRPYTNTYLKSISYND GLFSPKAMFAFEVKAGGEGTTEPPQGAQLIANLPLIALRYNPHEDTGHGNEI YLTSTFKGTYDKPKVTDALYFNNVPLWMGFYGYWDFILQETKNKGVFDQH MFVVKCPALRPISQVTKQVYYPLVDMDFCSGRLPFDEYLSKDIKSHWYPTA ERQTVTINNFVTAGPYMPKFEPTDKDSTWQLNYHYKFFFKWGGPQVTDPT VEDPCSRNKYPVPDTMQQTIQIKNPEKLHPATLFHDWDLRRGFITQAAIKRM
SENLQIDSSFESDGTESPKKKKRCTKEIPTQNQKQEEIQECLLSLCEEPTCQ EETEDLQLFIQQQQQQQYKLRKNLFKLLTHLKKGQRISQLQTGLLE (SEQ ID NO: 883) ORF1/1 MPFWWRRRNKRWWGRRFRYRRYNKYKTRRRRRIPRRRNRRFTKTRRRR
KRKKWGGPQVTDPTVEDPCSRNKYPVPDTMQQTIQIKNPEKLHPATLFHD WDLRRGFITQAAIKRMSENLQIDSSFESDGTESPKKKKRCTKEIPTQNQKQE
EIQECLLSLCEEPTCQEETEDLQLFIQQQQQQQYKLRKNLFKLLTHLKKGQR ISQLQTGLLE (SEQ ID NO: 884) ORF1/2 MPFWWRRRNKRWWGRRFRYRRYNKYKTRRRRRIPRRRNRRFTKTRRRR
KRKKNHPKKRKDAPKKSQHKTKSKKRSKNVSSHSAKSLHAKKKQRTSSSS SSSSSSSSTSSEKTSSNSSLT (SEQ ID NO: 885) Tabela B2. Sequência de ácidos nucleicos de Anellovirus exemplificativa (Gammatorquevirus) Nome Ring4.0 Gênero/Clado Gammatorquevirus Número de Acesso Sequência Total: 3176 pb 1 10 20 30 40 50 | | | | | |
TAAAATGGCGGGAGCCAATCATTTTATACTTTCACTTTCCAATTAAAAAT GGCCACGTCACAAACAAGGGGTGGAGCCATTTAAACTATATAACTAAGTG GGGTGGCGAATGGCTGAGTTTACCCCGCTAGACGGTGCAGGGACCGGATC GAGCGCAGCGAGGAGGTCCCCGGCTGCCCATGGGCGGGAGCCGAGGTGAG TGAAACCACCGAGGTCTAGGGGCAATTCGGGCTAGGGCAGTCTAGCGGAA CGGGCAAGAAACTTAAAACAATATTTGTTTTACAGATGGTTAGTATATCC TCAAGTGATTTTTTTAAGAAAACGAAATTTAATGAGGAGACGCAGAACCA AGTATGGATGTCTCAAATTGCTGACTCTCATGATAATATCTGCAGTTGCT GGCATCCATTTGCTCACCTTCTTGCTTCCATATTTCCTCCTGGCCACAAA GATCGTGATCTTACTATTAACCAAATTCTTCTAAGAGATTATAAAGAAAA ATGCCATTCTGGTGGAGAAGAAGGAGAAAATTCTGGACCAACAACAGGTT TAATTACACCAAAAGAAGAAGATATAGAAAAAGATGGCCCAGAAGGCGCC GCAGAAGAAGACCATACAGACGCCCTGTTCGCCGCCGCCGTAGAAAACTT CGAAAGGTAAAGAGAAAAAAAAAATCTTTAATTGTTAGACAATGGCAACC AGACAGTATAAGAACTTGTAAAATTATAGGACAGTCAGCTATAGTTGTTG GGGCTGAAGGAAAGCAAATGTACTGTTATACTGTCAATAAGTTAATTAAT GTGCCCCCAAAAACACCATATGGGGGAGGCTTTGGAGTAGACCAATACAC ACTGAAATACTTATATGAAGAATACAGATTTGCACAAAACATTTGGACAC AATCTAATGTACTGAAAGACTTATGCAGATACATAAATGTTAAGCTAATA TTCTACAGAGACAACAAAACAGACTTTGTCCTTTCCTATGACAGAAACCC ACCTTTTCAACTAACAAAATTTACATACCCAGGAGCACACCCACAACAAA TCATGCTTCAAAAACACCACAAATTCATACTATCACAAATGACAAAGCCT AATGGAAGACTAACAAAAAAACTCAAAATTAAACCTCCTAAACAAATGCT TTCTAAATGGTTCTTTTCAAAACAATTCTGTAAATACCCTTTACTATCTC TTAAAGCTTCTGCACTAGACCTTAGGCACTCTTACCTAGGCTGCTGTAAT GAAAATCCACAGGTATTTTTTTATTATTTAAACCATGGATACTACACAAT AACAAACTGGGGAGCACAATCCTCAACAGCATACAGACCTAACTCCAAGG TGACAGACACAACATACTACAGATACAAAAATGACAGAAAAAATATTAAC ATTAAAAGCCATGAATACGAAAAAAGTATATCATATGAAAACGGTTATTT TCAATCTAGTTTCTTACAAACACAGTGCATATATACCAGTGAGCGTGGTG AAGCCTGTATAGCAGAAAAACCACTAGGAATAGCTATTTACAATCCAGTA AAAGACAATGGAGATGGTAATATGATATACCTTGTAAGCACTCTAGCAAA CACTTGGGACCAGCCTCCAAAAGACAGTGCTATTTTAATACAAGGAGTAC CCATATGGCTAGGCTTATTTGGATATTTAGACTACTGTAGACAAATTAAA GCTGACAAAACATGGCTAGACAGTCATGTACTAGTAATTCAAAGTCCTGC TATTTTTACTTACCCAAATCCAGGAGCAGGCAAATGGTATTGTCCACTAT CACAAAGTTTTATAAATGGCAATGGTCCGTTTAATCAACCACCTACACTG CTACAAAAAGCAAAGTGGTTTCCACAAATACAATACCAACAAGAAATTAT TAATAGCTTTGTAGAATCAGGACCATTTGTTCCCAAATATGCAAATCAAA CTGAAAGCAACTGGGAACTAAAATATAAATATGTTTTTACATTTAAGTGG GGTGGACCACAATTCCATGAACCAGAAATTGCTGACCCTAGCAAACAAGA GCAGTATGATGTCCCCGATACTTTCTACCAAACAATACAAATTGAAGATC CAGAAGGACAAGACCCCAGATCTCTCATCCATGATTGGGACTACAGACGA GGCTTTATTAAAGAAAGATCTCTTAAAAGAATGTCAACTTACTTCTCAAC TCATACAGATCAGCAAGCAACTTCAGAGGAAGACATTCCCAAAAAGAAAA AGAGAATTGGACCCCAACTCACAGTCCCACAACAAAAAGAAGAGGAGACA CTGTCATGTCTCCTCTCTCTCTGCAAAAAAGATACCTTCCAAGAAACAGA GACACAAGAAGACCTCCAGCAGCTCATCAAGCAGCAGCAGGAGCAGCAGC TCCTCCTCAAGAGAAACATCCTCCAGCTCATCCACAAACTAAAAGAGAAT CAACAAATGCTTCAGCTTCACACAGGCATGTTACCTTAACCAGATTTAAA CCTGGATTTGAAGAGCAAACAGAGAGAGAATTAGCAATTATATTTCATAG GCCCCCTAGAACCTACAAAGAGGACCTTCCATTCTATCCCTGGCTACCAC CTGCACCCCTTGTACAATTTAACCTTAACTTCAAAGGCTAGGCCAACAAT GTACACTTAGTAAAGCATGTTTATTAAAGCACAACCCCCAAAATAAATGT AAAAATAAAAAAAAAAAAAAAAAAATAAAAAATTGCAAAAATTCGGCGCT CGCGCGCATGTGCGCCTCTGGCGCAAATCACGCAACGCTCGCGCGCCCGC GTATGTCTCTTTACCACGCACCTAGATTGGGGTGCGCGCGCTAGCGCGCG CACCCCAATGCGCCCCGCCCTCGTTCCGACCCGCTTGCGCGGGTCGGACC ACTTCGGGCTCGGGGGGGCGCGCCTGCGGCGCTTTTTTACTAAACAGACT CCGAGCCGCCATTTGGCCCCCTAAGCTCCGCCCCCCTCATGAATATTCAT AAAGGAAACCACATAATTAGAATTGCCGACCACAAACTGCCATATGCTAA TTAGTTCCCCTTTTACAAAGTAAAAGGGGAAGTGAACATAGCCCCACACC
CGCAGGGGCAAGGCCCCGCACCCCTACGTCACTAACCACGCCCCCGCCGC CATCTTGGGTGCGGCAGGGCGGGGGC (SEQ ID NO: 886) Anotações: Domínio Putativo Gama base Caixa TATA 87– 93 Local Cap 110 – 117 Local de Início Transcricional 117 Domínio Conservado 5´ UTR 185 – 254 ORF2 286 – 660 ORF2/2 286 – 656 ; 1998 – 2442 ORF2/3 286 – 656 ; 2209 – 2641 TAIP 385 - 484 ORF1 501 – 2489 ORF1/1 501 – 656 ; 1998 – 2489 ORF1/2 501 – 656 ; 2209 – 2442 Região de três grelhas de leitura aberta 2209 – 2439 Sinal de Poli(A) 2672 – 2678 Região rica em GC 3076 – 3176
Tabela C2. Sequências de aminoácidos de Anellovirus exemplificativas (Gammatorquevirus) Ring 4.0 (Gammatorquevirus) ORF2 MVSISSSDFFKKTKFNEETQNQVWMSQIADSHDNICSCWHPFAHLLASIFPP
GHKDRDLTINQILLR
DYKEKCHSGGEEGENSGPTTGLITPKEEDIEKDGPEGAAEEDHTDALFAAA VENFER (SEQ ID NO: 887) ORF2/2 MVSISSSDFFKKTKFNEETQNQVWMSQIADSHDNICSCWHPFAHLLASIFPP
GHKDRDLTINQILLRDYKEKCHSGGEEGENSGPTTGLITPKEEDIEKDGPEG AAEEDHTDALFAAAVENFESGVDHNSMNQKLLTLANKSSMMSPILSTKQYK LKIQKDKTPDLSSMIGTTDEALLKKDLLKECQLTSQLIQISKQLQRKTFPKRKR
ELDPNSQSHNKKKRRHCHVSSLSAKKIPSKKQRHKKTSSSSSSSSRSSSSS SRETSSSSSTN (SEQ ID NO: 888) ORF2/3 MVSISSSDFFKKTKFNEETQNQVWMSQIADSHDNICSCWHPFAHLLASIFPP
GHKDRDLTINQILLRDYKEKCHSGGEEGENSGPTTGLITPKEEDIEKDGPEG AAEEDHTDALFAAAVENFERSASNFRGRHSQKEKENWTPTHSPTTKRRGD TVMSPLSLQKRYLPRNRDTRRPPAAHQAAAGAAAPPQEKHPPAHPQTKRE
STNASASHRHVTLTRFKPGFEEQTERELAIIFHRPPRTYKEDLPFYPWLPPA PLVQFNLNFKG (SEQ ID NO: 889) TAIP MRRRRTKYGCLKLLTLMIISAVAGIHLLTFLLPYFLLATKIVILLLTKFF (SEQ ID NO: 890) ORF1 MPFWWRRRRKFWTNNRFNYTKRRRYRKRWPRRRRRRRPYRRPVRRRRR
KLRKVKRKKKSLIVRQWQPDSIRTCKIIGQSAIVVGAEGKQMYCYTVNKLINV PPKTPYGGGFGVDQYTLKYLYEEYRFAQNIWTQSNVLKDLCRYINVKLIFYR DNKTDFVLSYDRNPPFQLTKFTYPGAHPQQIMLQKHHKFILSQMTKPNGRL TKKLKIKPPKQMLSKWFFSKQFCKYPLLSLKASALDLRHSYLGCCNENPQVF FYYLNHGYYTITNWGAQSSTAYRPNSKVTDTTYYRYKNDRKNINIKSHEYEK SISYENGYFQSSFLQTQCIYTSERGEACIAEKPLGIAIYNPVKDNGDGNMIYL VSTLANTWDQPPKDSAILIQGVPIWLGLFGYLDYCRQIKADKTWLDSHVLVIQ SPAIFTYPNPGAGKWYCPLSQSFINGNGPFNQPPTLLQKAKWFPQIQYQQEI INSFVESGPFVPKYANQTESNWELKYKYVFTFKWGGPQFHEPEIADPSKQE QYDVPDTFYQTIQIEDPEGQDPRSLIHDWDYRRGFIKERSLKRMSTYFSTHT
DQQATSEEDIPKKKKRIGPQLTVPQQKEEETLSCLLSLCKKDTFQETETQED LQQLIKQQQEQQLLLKRNILQLIHKLKENQQMLQLHTGMLP (SEQ ID NO: 891) ORF1/1 MPFWWRRRRKFWTNNRFNYTKRRRYRKRWPRRRRRRRPYRRPVRRRRR
KLRKWGGPQFHEPEIADPSKQEQYDVPDTFYQTIQIEDPEGQDPRSLIHDW DYRRGFIKERSLKRMSTYFSTHTDQQATSEEDIPKKKKRIGPQLTVPQQKEE
Ring 4.0 (Gammatorquevirus)
ETLSCLLSLCKKDTFQETETQEDLQQLIKQQQEQQLLLKRNILQLIHKLKENQ QMLQLHTGMLP (SEQ ID NO: 892) ORF1/2 MPFWWRRRRKFWTNNRFNYTKRRRYRKRWPRRRRRRRPYRRPVRRRRR
KLRKISKQLQRKTFPKRKR
ELDPNSQSHNKKKRRHCHVSSLSAKKIPSKKQRHKKTSSSSSSSSRSSSSS SRETSSSSSTN (SEQ ID NO: 893) Tabela B3. Sequência de ácidos nucleicos de Anellovirus exemplificativa (Alphatorquevirus) – Clado 1 Nome Ring5.2 Gênero/Clado Clado 1 de Alphatorquevirus Número de Acesso Sequência Total: 3696 pb 1 10 20 30 40 50 | | | | | |
ATTTTGTTCAGCCCGCCAATTTCTCTTTCAAACAGGCCAATCAGCTACTA CTTCGTGCACTTCCTGGGGCGTGTCCTGCCGCTCTATATAAGCAGAGGCG GTGACGAATGGTAGAGTTTTTCTTGGCCCGTCCGCGGCGAGAGCGCGAGC GAAGCGAGCGATCGAGCGTCCCGAGGGCGGGTGCCGGAGGTGAGTTTACA CACCGCAGTCAAGGGGCAATTCGGGCTCGGGACTGGCCGGGCTATGGGCA AGATTCTTAAAAAATTCCCCCGATCCCTTTGCCGCCAGGACATAAAAACA TGCCGTGGAGACCGCCGGTCCATAGTGTCCAGGGGCGAGAGGATCAGTGG TTCGCAAGCTTTTTTCACGGCCACGATTCGTTTTGCGGCTGCGGTGACCC TCTTGGCCATATTAATAGCATTGCTCATCGCTTTCCTCGCGCCGGTCCAC CAAGGCCCCCTCCGGGGCTAGATCAGCCTAACCCCCGGGAGCAGGGCCCG GCCGGACCCGGAGGGCCGCCCGCCATCTTGGCCCTGCCGGCTCCGCCCGC GGAGCCTGACGACCCGCAGCCACGGCGTGGTGGTGGGGACGGTGGCGCCG CCGCTGGCGCCGCAGACGACCATACACAACGAGACTACGACGAAGAAGAG CTAGACGAGCTTTTCCGCGCCGCCGCCGAAGACGATTTGTAAGTAGGAGA TGGCGCCGGCCTTACAGGCGCAGGAGGAGACGCGGGCGACGCAGACGCAG ACGCAGACGCAGACATAAGCCCACCCTAATACTCAGACAGTGGCAACCTG ACTGTATCAGACACTGTAAAATAACAGGATGGATGCCCCTCATTATCTGT GGAAAGGGGTCCACCCAGTTCAACTACATCACCCACGCGGACGATATCAC CCCCAGGGGAGCCTCCTACGGAGGCAATTTCACAAACATGACTTTCTCCC TGGAGGCCATATATGAACAGTTCCTATACCACAGAAACAGGTGGTCGGCC TCTAACCACGACCTAGAACTGTGCAGATACAAGGGGACCACCTTAAAACT CTACAGACACCCAGAAGTAGACTACATAGTTACCTACAGCAGAACAGGAC CCTTTGAAATCAGCCACATGACCTACCTCAGCACTCACCCCATGCTAATG CTGCTAAACAAGCACCACATTGTGGTGCCCAGCTTAAAGACTAAGCCCAG AGGCAGAAAGGCCATAAAAGTCAGGATAAGGCCCCCAAAACTCATGAACA ACAAGTGGTACTTCACCAGAGACTTCTGTAACATAGGCCTCTTCCAGCTC TGGGCCACAGGCTTAGAACTCAGAAACCCCTGGCTCAGAATGAGCACCCT GAGCCCCTGCATAGGCTTTAATGTCCTCAAAAACAGCATTTACACAAACC TCAGCAACCTGCCACAATACAAAAACGAAAGACTAAACATCATTAACAAC ATACTTCACCCACAAGAAATTACAGGTACAAACAACAAAAAGTGGCAGTA CACATACACCAAACTCATGGCCCCTATTTACTATTCAGCAAACAGGGCCA GCACCTATGACTGGGAAAATTACAGCAAAGAAACAAACTACAATAATACA TATGTTAAATTTACCCAGAAAAGACAGGAAAAACTAACTAAAATTAGAAA AGAGTGGCAGATGCTTTATCCACAACAACCCACAGCACTGCCAGACTCCT ATGACCTCCTACAAGAGTATGGCCTCTACAGTCCATACTACCTAAACCCC ACAAGAATAAACCTAGACTGGATGACCCCATACACACACGTCAGATACAA TCCCCTAGTAGACAAGGGCTTTGGAAACAGAATATACATCCAGTGGTGCT CAGAAGCAGATGTTAGCTACAACAGGACAAAATCCAAGTGTCTGCTACAA GACATGCCCCTGTTTTTCATGTGCTATGGCTACATAGACTGGGCAATAAA AAACACTGGAGTGTCATCTCTAGTGAAGGACGCCAGAATCTGCATCAGGT GTCCCTACACAGAGCCACAACTAGTTGGCTCCACAGAAGACATAGGCTTT GTACCCATCTCAGAAACCTTCATGAGGGGCGACATGCCGGTACTTGCACC ATACATACCGTTAAGCTGGTTTTGCAAGTGGTATCCCAACATAGCTCACC AAAAGGAAGTCCTTGAGTCAATCATTTCCTGCAGCCCCTTCATGCCCCGT GACCAAGACATGAACGGTTGGGATATCACAATCGGTTACAAAATGGACTT CTTATGGGGCGGTTCCCCTCTCCCCTCACAGCCAATCGACGACCCCTGCC AGCAGGGAACCCACCCGATTCCCGACCCCGATAAACACCCTCGCCTCCTA CAAGTCTCGAACCCGAAACTACTCGGACCGAGGACAGTGTTCCACAAGTG GGACATCAGACGTGGGCAGTTTAGCAAAAGAAGTATTAAGAGAGTGTCAG AATACTCAAGCGATGATGAATCTCTTGCGCCAGGTCTCCCATCAAAGCGA AACAAGCTCGACTCGGCGTTCCGAGGAGAAAATCGAGAGCAAAAAGAATG CTATTCTCTCCTCAAAGCGCTCGAGGAAGAAGAGACCCCAGAAGAAGAAG AACCAGCACCCCAAGAAAAAGCCCAGAAAGAGGAGCTACTCCACCAGCTC CAGCTCCAGAGACGCCACCAGCGAGTCCTCAGACGAGGGCTCAAGCTCGT CTTTACAGACATCCTCCGACTCCGCCAGGGAGTCCACTGGAACCCGGAGC TCACATAGCGCCCCCACCTTACATACCAGACCTGCTTTTTCCCAATACTG GTAAAAAAAAAAAATTCTCTCCCTTCGATTGGGAGACAGAGGCGCAAATA GCGGGGTGGATGCGGCGGCCCATGCGCTTCTATCCCTCAGACACCCCTCA CTACCCGTGGCTACCCCCCGAGCGAGATATCCCGAAAATATGTAACATAA ACTTCAAAATAAAGCTTCAAGAGTGAGTGATTCGAGGCCCTCCTCTGTTC ACTTAGCGGTGTCTACCTCTTAAGGTCACTAAGCACTCCGAGCGTAAGCG AGGAGTGCGACCCTCTACCAAGGGGCAACTTCCTCGGGGTCCGGCGCTAC GCGCTTCGCGCTGCGCCGGACATCTCGGACCCCTCGACCCGAATCGCTTG CGCGATTCGGACCTGCGGCCTCGGGGGGGTCGGGGGCTTTACTAAACAGA CTCCGAGGTGCCATTGGACACTGTAGGGGGTGAACAGCAACGAAAGTGAG TGGGGCCAGACTTCGCCATAAGGCCTTTATCTTCTTGCCATTGGATAGTG ACTTCCGGGTCCGCCTGGGGGCCGCCATTTTAGCTTCGGCCGCCATTTTA GGCCCTCGCGGGCCTCCGTAGGCGCGCTTTAGTGACGTCACGGCAGCCAT TTTGTCGTGACGTTTGAGACACGTGATGGGGGCGTGCCTAAACCCGGAAG CATCCCTGGTCACGTGACTCTGACGTCACGGCGGCCATCTTGTGCTGTCC GCCATCTTGTAACTTCCTTCCGCTTTTTCAAAAAAAAAGAGGAAGTGTGA CGTAGCGGCGGGGGGGCGGCGCGCTTCGCGCGCCGCCCACCAGGGGGCGC
TGCGCGCCCCCCGCGCATGCGCAGGGGCCTCTCGAGGGGCTCCGCCCCCC CCCCGTGCTAAATTTACCGCGCATGCGCGACCACGCCCCCGCCGCC (SEQ ID NO: 894) Anotações: Domínio Putativo Gama base Caixa TATA 85– 91 Local Cap 108 – 115 Local de Início Transcricional 115 Domínio Conservado 5´ UTR 178 – 248 ORF2 300 – 692 ORF2/2 300 – 688 ; 2282 – 2804 ORF2/3 300 – 688 ; 2484 – 2976 ORF2t/3 300 – 349 : 2484 - 2976 TAIP 322 - 471 ORF1 572 – 2758 ORF1/1 572 – 688 ; 2282 – 2758 ORF1/2 572 – 688 ; 2484 – 2804 Região de três grelhas de leitura aberta 2484 – 2755 Sinal de Poli(A) 3018 –3023 Região rica em GC 3555 – 3696 Tabela C3. Sequências de aminoácidos de Anellovirus exemplificativas (Alphatorquevirus) Clado 1 Ring 5.2 (Alphatorquevirus) Clado 1 ORF2 MPWRPPVHSVQGREDQWFASFFHGHDSFCGCGDPLGHINSIAHRFPRAG
PPRPPPGLDQPNPREQGPAGPGGPPAILALPAPPAEPDDPQPRRGGGDG GAAAGAADDHTQRDYDEEELDELFRAAAEDDL (SEQ ID NO: 895) ORF2/2 MPWRPPVHSVQGREDQWFASFFHGHDSFCGCGDPLGHINSIAHRFPRAG
PPRPPPGLDQPNPREQGPAGPGGPPAILALPAPPAEPDDPQPRRGGGDG
Ring 5.2 (Alphatorquevirus) Clado 1
GAAAGAADDHTQRDYDEEELDELFRAAAEDDFQSTTPASREPTRFPTPINT LASYKSRTRNYSDRGQCSTSGTSDVGSLAKEVLRECQNTQAMMNLLRQVS HQSETSSTRRSEEKIESKKNAILSSKRSRKKRPQKKKNQHPKKKPRKRSYS
TSSSSRDATSESSDEGSSSSLQTSSDSARESTGTRSSHSAPTLHTRPAFSQ YW (SEQ ID NO: 896) ORF2/3 MPWRPPVHSVQGREDQWFASFFHGHDSFCGCGDPLGHINSIAHRFPRAG
PPRPPPGLDQPNPREQGPAGPGGPPAILALPAPPAEPDDPQPRRGGGDG GAAAGAADDHTQRDYDEEELDELFRAAAEDDLSPIKAKQARLGVPRRKSRA KRMLFSPQSARGRRDPRRRRTSTPRKSPERGATPPAPAPETPPASPQTRA
QARLYRHPPTPPGSPLEPGAHIAPPPYIPDLLFPNTGKKKKFSPFDWETEAQ IAGWMRRPMRFYPSDTPHYPWLPPERDIPKICNINFKIKLQ (SEQ ID NO: 897) ORF2t/3 MPWRPPVHSVQGREDQWSPIKAKQARLGVPRRKSRAKRMLFSPQSARGR
RDPRRRRTSTPRKSPERGATPPAPAPETPPASPQTRAQARLYRHPPTPPG
SPLEPGAHIAPPPYIPDLLFPNTGKKKKFSPFDWETEAQIAGWMRRPMRFY PSDTPHYPWLPPERDIPKICNINFKIKLQE (SEQ ID NO: 898) TAIP IVSRGERISGSQAFFTATIRFAAAVTLLAILIALLIAFLAPVHQGPLRG (SEQ ID NO: 899) ORF1 TAWWWGRWRRRWRRRRPYTTRLRRRRARRAFPRRRRRRFVSRRWRRP
YRRRRRRGRRRRRRRRRHKPTLILRQWQPDCIRHCKITGWMPLIICGKGST QFNYITHADDITPRGASYGGNFTNMTFSLEAIYEQFLYHRNRWSASNHDLEL CRYKGTTLKLYRHPEVDYIVTYSRTGPFEISHMTYLSTHPMLMLLNKHHIVVP SLKTKPRGRKAIKVRIRPPKLMNNKWYFTRDFCNIGLFQLWATGLELRNPWL RMSTLSPCIGFNVLKNSIYTNLSNLPQYKNERLNIINNILHPQEITGTNNKKWQ YTYTKLMAPIYYSANRASTYDWENYSKETNYNNTYVKFTQKRQEKLTKIRKE WQMLYPQQPTALPDSYDLLQEYGLYSPYYLNPTRINLDWMTPYTHVRYNPL VDKGFGNRIYIQWCSEADVSYNRTKSKCLLQDMPLFFMCYGYIDWAIKNTG VSSLVKDARICIRCPYTEPQLVGSTEDIGFVPISETFMRGDMPVLAPYIPLSW FCKWYPNIAHQKEVLESIISCSPFMPRDQDMNGWDITIGYKMDFLWGGSPL PSQPIDDPCQQGTHPIPDPDKHPRLLQVSNPKLLGPRTVFHKWDIRRGQFS KRSIKRVSEYSSDDESLAPGLPSKRNKLDSAFRGENREQKECYSLLKALEE
EETPEEEEPAPQEKAQKEELLHQLQLQRRHQRVLRRGLKLVFTDILRLRQG VHWNPELT (SEQ ID NO: 900) ORF1/1 TAWWWGRWRRRWRRRRPYTTRLRRRRARRAFPRRRRRRFPIDDPCQQG
THPIPDPDKHPRLLQVSNPKLLGPRTVFHKWDIRRGQFSKRSIKRVSEYSSD
DESLAPGLPSKRNKLDSAFRGENREQKECYSLLKALEEEETPEEEEPAPQE KAQKEELLHQLQLQRRHQRVLRRGLKLVFTDILRLRQGVHWNPELT (SEQ ID NO: 901)
Ring 5.2 (Alphatorquevirus) Clado 1 ORF1/2 TAWWWGRWRRRWRRRRPYTTRLRRRRARRAFPRRRRRRFVSHQSETSS
TRRSEEKIESKKNAILSSK
RSRKKRPQKKKNQHPKKKPRKRSYSTSSSSRDATSESSDEGSSSSLQTSS DSARESTGTRSSHSAPTLHTRPAFSQYW (SEQ ID NO: 902) Tabela B4. Sequência de ácidos nucleicos de Anellovirus exemplificativa (Alphatorquevirus) – Clado 3 Nome Ring 6.0 Gênero/Clado Alphatorquevirus – Clado 3 Número de Acesso Sequência Total: 3828 pb 1 10 20 30 40 50 | | | | | |
GTGCTACGTCACTAACCTACGTGTCCGTCTCCCATAGGCCGGACACCGTA TACGTCATACACTTCCTGGGCATGGTCTACGTGATAATATAAGTGGCTGC ACTTCCGAATGGCTGAGTTTTCCACGCCCGTCCGCAGCGAGGACGCCACG GAGGGGGATCCGCGCGTCCCGAGGGCGGGTGCCGGAGGTGAGTTTACACA CCGCAGTCAAGGGGCAATTCGGGCTCGGGACTGGCCGGGCTATGGGCAAG GCTCTTAAAAATGCACTTTTCTAGGTGCAGTAGAAAGAAAAGGACATTGT CACTGCTACCACTGTACCATTCACAGAAAGCTAGGCCATCTGTGACAGGT ATGTGGAGACCCCCGACTCGAAATGCGTTCAATATTCAACGTGACTGGTT CTACAGTTGCTTTCACTCCCACGCTTCTATGTGCGGCTGTGCTGATTTTA TTGGTCATTTCAATCATATCGCTGCTATGCTCGGCCGTCCGGAAGACCAG AACCCTCCTCCGCCACCCGGGGCTCTGAGACCCCTACCCGCTCTCCCGGC CTCTTCCGAGGCACCCGGTGATCGAGCGCCATGGCCTATGGGTGGTGGCG GAGGCGACGGAGGCGCCCGTGGTGGAGGAGGAGATGGCGCCGCTGGAGAC GCCGTCGGAGACCCCGCAGACGCCGACCTCGTCGCCGCTATCGACGCCGC AGAACAGTAAGGAGGCGCGGCAGGGGGAGGTGGACTAGAGCACACAGGAG ATGGCGCCGCAAGGGAAAACGCAGTCGCAAAAAAAAGATTATTATAAGAC AATGGCAGCCCAACTACACTCGCAGATGCAACATAGTGGGCTACATGCCT CTACTAATATGTGGGGAAAATACTGTTGCTACAAACTATGCCACCCACTC AGACGACAGCTACTACCCCGGACCCTTTGGGGGGGGAATGACTACAGACA AATTTACTCTAAGAATACTGTATGATGAGTACAAAAGGTTCATGAACTAC TGGACCTCTTCAAACGAGGACCTAGACCTATGTAGATACCTGGGATGCAC TCTATATGTGTTTAGACACCCAGAAGTAGACTTTATAATCATTATAAATA CCTCTCCTCCATTCCTAGACACAGAAATAACAGGGCCTAGCATACACCCA GGTATGATGGCCCTTAACAAAAGAAGCAGATGGATACCTAGCATAAAAAA CAGACCAGGCAGAAAGCACTATATAAAGATTAAAGTAGGAGCCCCCCGAA TGTTCACAGATAAGTGGTACCCCCAAACAGACCTCTGTGACATGACACTC CTAACGATCTTTGCCAGTGCGGCGGATATGCAATATCCGTTCGGCTCACC ACTAACTGACACCATAGTTGTGTCATTCCAAGTTCTGCAATCCATGTACA ACGACTGCCTGAGTGTACTTCCTGATAATTTTGCAGAGACATCAGGCAAA GGCACCCAACTACATGAGAACATAATACAACATCTGCCCTACTACAACAC CACACAAACACAAGCACAATTTAAAAGATTTATAGAAAACATGAATGCAA CAAATGGAGACAATATATGGGCAAGCTACATAAACACAACCAAGTTCTCA TCCGCAAACACTCCAAAGAATGACACAGGCATAGGAGGCCCTTACACTAC ATATTCAGACTCATGGTACAAAGGCACAGTATACAATGACAAAATTAAAA CCATACCAATAAAAGCAAGCAAGTTATACTACGAGCAAACCAAAAACCTC ATTGGCATTACATTCACTGGATCCACACACAGACTCCATTACTGTGGAGG CCTATACTCCTCCGTATGGCTATCAGCAGGTAGATCCTACTTTGAAACCA AAGGCCCATACACAGACATAACTTACAACCCCTTTTCAGACAGAGGAGAG GGTAACATGCTATGGATAGACTGGCTAACTAAAAATGACTCAGTGTACTC AAAAACAAGTAGCAAGTGTCTTATAGAAAACCTGCCCCTGTGGGCCTCAG TATACGGATATAAAGAATACTGCAGCAAGGTAACAGGAGACACAAACATA GAACACAACTGTAGATGTGTTATCAGAAGCCCCTACACAGTACCACAACT GTTAGACCACAACAATCCCTTCAGAGGATACGTGCCTTATAGCTTCAACT TTGGAAATGGTAAAATGCCAGGCGGTAGCAGCCTAGTGCCCATTAGAATG AGAGCCAAGTGGTACCCCACTCTGTTCCACCAAAAAGAAGTTCTAGAAGC CATAGCACAGGCGGGCCCCTTCGCATACCACTCAGATATTAAAAAAGTGT CCCTGGGCATAAAGTACAGATTTAAGTGGGTGTGGGGTGGCAACCCCGTG TCCCAACAGGTTGTTAGAAACCCCTGCAAGACCACCCAAGGTTCCTCGGG CAATAGAGTGCCTCGATCAATACAAGTCGTTGACCCGCGGTACAACACGC CAGAACTCACCATACACGCGTGGGACTTCAGACATGGGTTCTTTGGCAGA AAAGCTATTAAGAGAATGCAAGAACAACCAATACCTCATGACACTTTTTC AGCAGGGTTCAAGCGCAGTCGCCGAGATACAGAAGCACTCCAATGCAGCC AAGAAGAGCAACAAAAAGAAAACTTACTTTTCCCAGTCCAGCAGCTCAAG CGAGTCCCCCCGTGGGAGACCTCGCAAGAGAGCCAAAGCGAGGAAGAAAA CTCGCAAAAACAGGAGACCCTCTCCCAGCAACTCAGAGACCAGCTGCACA AGCAGCGGCTCATGGGAGAGCAACTCCGATCGCTCCTCTACCAAATGCAG AGGGTCCAACAAAATCAACACATAAACCCTATGTTATTGCCAAAGGGTCT GGCATTAACTTCTATTTCTCACAATGTAATATAGATATGTTTGGTGACCC CAAACCCTACAAGCCCTCCTCCAATGACTGGAAGGAGGAGTACGAGGCCG CAAAGTACTGGGACAGACCCCCCAGACGCGACCTGAGGAGCACCCCCTTC TACCCCTGGGCCCCCACCCCCAAACCATACAATGTCAACTTTGCCCTCAA CTACAAATAAACGGTGGCCGTGGGAGTTTCACTTGTCGGTGTCTACCTCT TAAGGTCACTAAGCACTCCGAGCGTAAGCGAGGAGTGCGACCCTTCACCA AGGGCAACTCCCTCGAAGTCCGGCGCTACGCGCTTCGCGCTGCGCCGGAC ATCTCGGACCCCCCCTCGACCCGAATCGCTTGCGCGATTCGGACCTGCGG CCTCGGGGGGGTCGGGGGCTTTACTAAACAGACTCCGAGGTGCCATTGGA CACTGAGGGGGTGAACAGCAACGAAAGTGAGTGGGGCCAGACTTCGCCAT AAGGCCTTTATCTTCTTGCCATTTGTCCGCGACCGGGGGTCGCTCCTAGG CGCGGACCCCGTTTCGGGGTCCTTCCGGGTTCATCGGCGCCGTTCCAGTG ACGTCACGGGCGCCATGTTAAGTGGCTGTCGCCGAGGATTGACGTCACAG TTCAAAGGTCATCCTCGGCGGTAACCGCAAACATGGCGGTCAATCTCTTC CGGGTCAAAGGTCGTGCATACGTCATAAGTCACATGACAGGGGTCCACTT AAACACGGAAGTAGGCCCCGACATGTGACTCGTCACGTGTGTACACGTCA CGGCCGCCATTTTGTTTTACAAAATGGCCGACTTCCTTCCTGTTTTTTAA AAAAAGGCGCGAAAAAACCGTCGGCGGGGGCCGCGCGCTGCGCGCGCGGG
AGGCAATGCCTCCCCCCCCCCGCGCGCATGCGCGCGGGTCCCCCCCCCTC CGGGGGGCTCCGCCCCCCGGCCCCCCCC (SEQ ID NO: 903) Anotações: Domínio Putativo Gama base Caixa TATA 85– 92 Local Cap 109 – 116 Local de Início Transcricional 116 Domínio Conservado 5´ UTR 176 – 246 ORF2 351 – 710 ORF2/2 351 – 706 ; 2360 – 2825 ORF2/3 351 – 706 ; 2556 – 3060 TAIP 373 – 528 ORF1 581 – 2884 ORF1/1 581 – 706 ; 2360 – 2884 ORF1/2 581 – 706 ; 2556 – 2825 Região de três grelhas de leitura aberta 2556 – 2821 Sinal de Poli(A) 3055 – 3061 Região rica em GC 3720 – 3828 Tabela C4. Sequências de aminoácidos de Anellovirus exemplificativas (Alphatorquevirus) – Clado 3 Ring 6.0 (Alphatorquevirus) ORF2 MWRPPTRNAFNIQRDWFYSCFHSHASMCGCADFIGHFNHIAAMLGRPEDQ
NPPPPPGALRPLPALPASSEAPGDRAPWPMGGGGGDGGARGGGGDGAA GDAVGDPADADLVAAIDAAEQ (SEQ ID NO: 904) ORF2/2 MWRPPTRNAFNIQRDWFYSCFHSHASMCGCADFIGHFNHIAAMLGRPEDQ
NPPPPPGALRPLPALPASSEAPGDRAPWPMGGGGGDGGARGGGGDGAA GDAVGDPADADLVAAIDAAEQLLETPARPPKVPRAIECLDQYKSLTRGTTRQ
Ring 6.0 (Alphatorquevirus)
NSPYTRGTSDMGSLAEKLLRECKNNQYLMTLFQQGSSAVAEIQKHSNAAKK
SNKKKTYFSQSSSSSESPRGRPRKRAKARKKTRKNRRPSPSNSETSCTSS GSWESNSDRSSTKCRGSNKINT (SEQ ID NO: 905) ORF2/3 MWRPPTRNAFNIQRDWFYSCFHSHASMCGCADFIGHFNHIAAMLGRPEDQ
NPPPPPGALRPLPALPASSEAPGDRAPWPMGGGGGDGGARGGGGDGAA GDAVGDPADADLVAAIDAAEQVQAQSPRYRSTPMQPRRATKRKLTFPSPA AQASPPVGDLAREPKRGRKLAKTGDPLPATQRPAAQAAAHGRATPIAPLPN
AEGPTKSTHKPYVIAKGSGINFYFSQCNIDMFGDPKPYKPSSNDWKEEYEA AKYWDRPPRRDLRSTPFYPWAPTPKPYNVNFALNYK (SEQ ID NO: 906) TAIP MRSIFNVTGSTVAFTPTLLCAAVLILLVISIISLLCSAVRKTRTLLRHPGL (SEQ ID NO: 907) ORF1 MAYGWWRRRRRRPWWRRRWRRWRRRRRPRRRRPRRRYRRRRTVRRR
GRGRWTRAHRRWRRKGKRSRKKKIIIRQWQPNYTRRCNIVGYMPLLICGEN TVATNYATHSDDSYYPGPFGGGMTTDKFTLRILYDEYKRFMNYWTSSNEDL DLCRYLGCTLYVFRHPEVDFIIIINTSPPFLDTEITGPSIHPGMMALNKRSRWI PSIKNRPGRKHYIKIKVGAPRMFTDKWYPQTDLCDMTLLTIFASAADMQYPF GSPLTDTIVVSFQVLQSMYNDCLSVLPDNFAETSGKGTQLHENIIQHLPYYN TTQTQAQFKRFIENMNATNGDNIWASYINTTKFSSANTPKNDTGIGGPYTTY SDSWYKGTVYNDKIKTIPIKASKLYYEQTKNLIGITFTGSTHRLHYCGGLYSS VWLSAGRSYFETKGPYTDITYNPFSDRGEGNMLWIDWLTKNDSVYSKTSSK CLIENLPLWASVYGYKEYCSKVTGDTNIEHNCRCVIRSPYTVPQLLDHNNPF RGYVPYSFNFGNGKMPGGSSLVPIRMRAKWYPTLFHQKEVLEAIAQAGPFA YHSDIKKVSLGIKYRFKWVWGGNPVSQQVVRNPCKTTQGSSGNRVPRSIQ VVDPRYNTPELTIHAWDFRHGFFGRKAIKRMQEQPIPHDTFSAGFKRSRRD TEALQCSQEEQQKENLLFPVQQLKRVPPWETSQESQSEEENSQKQETLSQ
QLRDQLHKQRLMGEQLRSLLYQMQRVQQNQHINPMLLPKGLALTSISHNVI (SEQ ID NO: 908) ORF1/1 MAYGWWRRRRRRPWWRRRWRRWRRRRRPRRRRPRRRYRRRRTVVRN
PCKTTQGSSGNRVPRSIQVVDPRYNTPELTIHAWDFRHGFFGRKAIKRMQE QPIPHDTFSAGFKRSRRDTEALQCSQEEQQKENLLFPVQQLKRVPPWETS
QESQSEEENSQKQETLSQQLRDQLHKQRLMGEQLRSLLYQMQRVQQNQH INPMLLPKGLALTSISHNVI (SEQ ID NO: 909) ORF1/2 MAYGWWRRRRRRPWWRRRWRRWRRRRRPRRRRPRRRYRRRRTGSSA
VAEIQKHSNAAKKSNKKKTYFSQSSSSSESPRGRPRKRAKARKKTRKNRRP SPSNSETSCTSSGSWESNSDRSSTKCRGSNKINT (SEQ ID NO: 910) Tabela B5. Sequência de ácidos nucleicos de Anellovirus exemplificativa (Alphatorquevirus) – Clado 7
Nome Ring7 Gênero/Clado Alphatorquevirus – Clado 7 Número de Acesso Sequência Total: 3815 pb 1 10 20 30 40 50 | | | | | |
AAGATCGTCACTAACCACGTGACTCCTCTCGCCCAATCAGTGTCTACGTC GTCCATTTCCTGGGCATGGTCTACATCCTGATATAAAGCGATGCACTTCC GAATGGCTGAGTTTTCCACGCCCGTCCGCGGCGAGATCGCGACGGAGGAG CGATCGAGCGTCCCGAGGGCGGGTGCCGGAGGTGAGTTTACACACCGCAG TCAAGGGGCAATTCGGGCTCGGGACTGGCCGGGCTATGGGCAAGGCTCTT AAAGCGTACGTCCCCCGCTATGTTTCTCGGCAGGGTGTGGAGGAAACAGA AAAGGAAAGTGCTTCTGCTGGCTGTGCGAGCTACACAGAAAACATCTTCC ATGAGTATCTGGCGTCCCCCCCTTGGGAATGTCTCCTACAGGGAGAGAAA TTGGCTTCAGGCCGTCGAAACATCCCACAGTTCTTTTTGTGGCTGTGGTG ATTTTATTCTTCATCTTACTAATTTGGCTGCACGCTTTGCTCTCCAGGGG CCCCCGCCAGAGGGTGGTCCACCTCGGCCGAGGCCGCCGCTCCTGAGAGC GCTGCCGGCCCCCGAGGTCCGCAGGGAGACGCGCACAGAGAACCGGGGCG CCTCCGGTGAGCCATGGCCTGGCGATGGTGGTGGCAGAGACGATGGCGCC GCCGCCGGTGGCCCCGCAGACGGTGGAGACGCCTACGACGCCGGAGACCT AGACGACCTGTTCGCCGCCGTCGAAGAAGAACAACAGTAAGGAGGCGGAG GTGGAGGGGCAGACGTGGGCGACGCACATACACCCGACGCGCGGTCAGAC GCAGACGCAGACCCAGAAAGAGACTTGTACTGACTCAGTGGAGCCCCCAG ACAGTCAGAAACTGCTCAATAAGGGGCATAGTGCCCATGGTAATATGCGG ACACACAAAAGCAGGTAGAAACTATGCTATTCATAGCGAGGACTTCACCA CACAGATACAACCCTTCGGGGGCAGTTTCAGCACGACCACCTGGTCCCTA AAAGTGCTGTGGGACGAGCACCAGAAATTCCAGAACAGATGGTCCTACCC AAACACACAACTAGACCTGGCCAGATACAGAGGGGTCACCTTCTGGTTCT ACAGAGACCAGAAAACAGACTATATAGTACAGTGGAGTAGGAATCCCCCT TTTAAACTCAATAAATACAGCAGTGCCATGTACCACCCGGGCATGATGAT GCAGGCCAAAAGGAAACTAGTTGTACCTAGTTTCCAGACCAGACCCAAAG GCAAGAAGAGATACAGAGTCACAATAAAACCCCCTAACATGTTTGCTGAC AAGTGGTACACTCAAGAGGACCTGTGTCCGGTACCTCTTGTGCAAATTGT GGTTTCTGCGGCGAGCCTGCTACATCCGTTCTGCCCACCACAAACGAACA ACCCTTGCATCACCTTCCAGGTTTTGAAAGACATATATGATGAATGCATA GGAGTTAACGAAACTATGAAAGATAAGTATAAGAAATTACAAACAACACT ATACACCACTTGCACATACTATCAAACAACACAAGTACTGGCACAGCTAT CTCCTGCCTTTCAACCTGCTATGAAACCTACTACTACACAATCAGCAGCT ACAGCGACAACACTAGGAAACTATGTACCAGAGTTAAAGTACAACAATGG CTCTTTTCACACAGGACAAAACGCAGTATTCGGCATGTGCTCATACAAAC CAACAGACAGCATAATGACAAAAGCTAATGGCTGGTTTTGGCAAAACCTA ATGGTAGACAACAACCTACATAGTTCTTATGGCAAGGCAACATTAGAATG CATGGAGTATCACACAGGCATATACAGCTCTATATTTCTAAGTCCACAAA GATCTTTAGAATTCCCAGCAGCATACCAAGACGTTACATACAACCCTAAC TGTGATAGAGCAGTTGGAAACGTAGTTTGGTTTCAGTACAGCACTAAAAT GGATACAAATTTTGATGAAACAAAATGTAAATGTGTCCTTAAAAACATTC CACTGTGGGCGGCCTTCAATGGCTACTCAGACTTTATAATGCAAGAACTC AGCATAAGTACAGAAATCCACAACTTTGGCATAGTGTGCTTTCAGTGCCC GTACACTTTTCCCCCCTGTTTCAATAAAAACAAACCCCTAAAGGGGTACG TGTTCTATGACACCACCTTTGGTAATGGAAAAATGCCAGACGGATCGGGG CACGTACCCATCTACTGGCAGCAGAGATGGTGGATCAGACTAGCCTTCCA GGTCCAGGTCATGCATGACTTTGTACTAACAGGCCCCTTTAGCTACAAAG ATGACCTAGCAAACACCACACTCACAGCCAGATACAAATTTAAATTCAAA TGGGGCGGCAATATCATCCCTGAACAGATTATCAAGAACCCGTGTCACAG AGAGCAGTCCCTCGCTTCCTATCCCGATAGACAACGTCGCGACCTACAAG TTGTTGACCCATCAACCATGGGCCCGATCTACACCTTCCACACATGGGAC TGGCGACGGGGGCTTTTTGGTGCAGATGCTATCCAGAGAGTGTCACAAAA ACCGGGAGATGCTCTCCGCTTTACAAACCCTTTCAAGAGACCCAGATATC TTCCCCCGACAGACAGAGAAGACTACCGACAAGAAGAAGACTTCGCTTTA CAGGAAAAAAGACGGCGCACATCCACAGAAGAAGCCCAGGACGAGGAGAG CCCCCCGGAAAGCGCGCCGCTCCTACAGCAGCAGCAGCAGCAGCGGCAGC TCTCAGTCCACCTCGCGGAGCAGCAGCGACTCGGAGTCCAACTCCGATAC ATCCTCCAAGAAGTCCTCAAAACGCAAGCGGGTCTCCACCTAAACCCCCT ATTATTAGGCCCGCCACAAACAAGGTCTATCTCTTTGAGCCCTCCAAAGG CCTACTCCCCATAGTAGGAAAAGAGGCCTGGGAGGACGAGTACTGCACCT GCAAGTACTGGGATCGCCCTCCCAGAACCAACCACCTAGACATCCCCACT TATCCCTGGATGCCCACAAACTTCAAAGTCAGCTTCAAACTTGGATTTAA ACCCTAAATAAAAATACAAGGCCGTACACTGTTCACTTGTCGGTGTCTAC CTCTATAAGTCACTAAGCACTCCGAGCGCAGCGAGGAGTGCGACCCTCAG CGGTGGGTGCAACGCCCTCGGCGGCCGCGCGCTACGCCTTCGGCTGCGCG CGGCACCTCGGACCCCCGCTCGTGCTGACACGCTCGCGCGTGTCAGACCA CTTCGGGCTCGCGGGGGTCGGGAATTTTGCTAAACAGACTCCGAGTTGCT CTTGGACACTGTAGCTGTGAATCAGTAACGAAAGTGAGTGGGGCCAGACT TCGCCATAAGGCCTTTATCTTCTTGCCATTGGTCCGTCTCGGGGGTCGCC ATAGGCTTCGGGCTCGGTTTTAGGCCTTCCGGACTACCAAAATGGCGGAT TCCGTGACGTCATGGCCGCCATTTTAAGTAAGGCGGAACAGGCTGTCACC CCGTGTCAAAGTTCAGGGGTCAGCCTTCCGCTTTACACAAAATGGAGGTC AATATCTTCCGGGTCAAAGGTCGCTACCGCGTCATAAGTCACGTGGGGAA GGCTGCTGTGAATCCGGAAGTAGCTGACCCACGTGACTTGTCACGTGACT AGCACGTCACGGCAGCCATTTTGAATCACAAAATGGCCGACTTCCTTCCT CTTTTTTAAAAATAACGGCCCGGCGGCGGCGCGCGCGCTTCGCGCCGCTC
CGCCCCCCCCGCGCATGCGCGGGACCCCCCCCCGCGGGGGGCTCCGCCCC CCGGTCCCCCCCCCG (SEQ ID NO: 911) Anotações: Domínio Putativo Gama base Caixa TATA 82– 87 Local Cap 103 – 110 Local de Início Transcricional 110 Domínio Conservado 5´ UTR 170 – 240 ORF2 351 – 740 ORF2/2 351 – 737 ; 2378 – 2843 ORF2/3 351 – 737 ; 2526 – 3057 TAIP 379 - 543 ORF1 614 – 2911 ORF1/1 614 – 737 ; 2378 – 2911 ORF1/2 614 – 737 ; 2526 – 2843 Região de três grelhas de leitura aberta 2526 – 2840 Sinal de Poli(A) 3056 – 3062 Região rica em GC 3716 – 3815 Tabela C5. Sequências de aminoácidos de Anellovirus exemplificativas (Alphatorquevirus) – Clado 7 Ring7.0 (Alphatorquevirus) ORF2 MSIWRPPLGNVSYRERNWLQAVETSHSSFCGCGDFILHLTNLAARFALQGP
PPEGGPPRPRPPLLRA
LPAPEVRRETRTENRGASGEPWPGDGGGRDDGAAAGGPADGGDAYDAG DLDDLFAAVEEEQQ (SEQ ID NO: 912) ORF2/2 MSIWRPPLGNVSYRERNWLQAVETSHSSFCGCGDFILHLTNLAARFALQGP
PPEGGPPRPRPPLLRA LPAPEVRRETRTENRGASGEPWPGDGGGRDDGAAAGGPADGGDAYDAG DLDDLFAAVEEEQQLSRTRVTESSPSLPIPIDNVATYKLLTHQPWARSTPST HGTGDGGFLVQMLSRECHKNREMLSALQTLSRDPDIFPRQTEKTTDKKKTS
LYRKKDGAHPQKKPRTRRAPRKARRSYSSSSSSGSSQSTSRSSSDSESNS DTSSKKSSKRKRVST (SEQ ID NO: 913) ORF2/3 MSIWRPPLGNVSYRERNWLQAVETSHSSFCGCGDFILHLTNLAARFALQGP
PPEGGPPRPRPPLLRA
Ring7.0 (Alphatorquevirus)
LPAPEVRRETRTENRGASGEPWPGDGGGRDDGAAAGGPADGGDAYDAG DLDDLFAAVEEEQQCYPESVTKTGRCSPLYKPFQETQISSPDRQRRLPTRR RLRFTGKKTAHIHRRSPGRGEPPGKRAAPTAAAAAAAALSPPRGAAATRSP
TPIHPPRSPQNASGSPPKPPIIRPATNKVYLFEPSKGLLPIVGKEAWEDEYCT CKYWDRPPRTNHLDIPTYPWMPTNFKVSFKLGFKP (SEQ ID NO: 914)
TAIP MSPTGREIGFRPSKHPTVLFVAVVILFFILLIWLHALLSRGPRQRVVHLGRGR RS (SEQ ID NO: 915) ORF1 MAWRWWWQRRWRRRRWPRRRWRRLRRRRPRRPVRRRRRRTTVRRRR
WRGRRGRRTYTRRAVRRRRRPRKRLVLTQWSPQTVRNCSIRGIVPMVICG HTKAGRNYAIHSEDFTTQIQPFGGSFSTTTWSLKVLWDEHQKFQNRWSYP NTQLDLARYRGVTFWFYRDQKTDYIVQWSRNPPFKLNKYSSAMYHPGMM MQAKRKLVVPSFQTRPKGKKRYRVTIKPPNMFADKWYTQEDLCPVPLVQIV VSAASLLHPFCPPQTNNPCITFQVLKDIYDECIGVNETMKDKYKKLQTTLYTT CTYYQTTQVLAQLSPAFQPAMKPTTTQSAATATTLGNYVPELKYNNGSFHT GQNAVFGMCSYKPTDSIMTKANGWFWQNLMVDNNLHSSYGKATLECMEY HTGIYSSIFLSPQRSLEFPAAYQDVTYNPNCDRAVGNVVWFQYSTKMDTNF DETKCKCVLKNIPLWAAFNGYSDFIMQELSISTEIHNFGIVCFQCPYTFPPCF NKNKPLKGYVFYDTTFGNGKMPDGSGHVPIYWQQRWWIRLAFQVQVMHD FVLTGPFSYKDDLANTTLTARYKFKFKWGGNIIPEQIIKNPCHREQSLASYPD RQRRDLQVVDPSTMGPIYTFHTWDWRRGLFGADAIQRVSQKPGDALRFTN PFKRPRYLPPTDREDYRQEEDFALQEKRRRTSTEEAQDEESPPESAPLLQQ
QQQQRQLSVHLAEQQRLGVQLRYILQEVLKTQAGLHLNPLLLGPPQTRSISL SPPKAYSP (SEQ ID NO: 916) ORF1/1 MAWRWWWQRRWRRRRWPRRRWRRLRRRRPRRPVRRRRRRTTIIKNPC
HREQSLASYPDRQRRDLQVVDPSTMGPIYTFHTWDWRRGLFGADAIQRVS QKPGDALRFTNPFKRPRYLPPTDREDYRQEEDFALQEKRRRTSTEEAQDE
ESPPESAPLLQQQQQQRQLSVHLAEQQRLGVQLRYILQEVLKTQAGLHLNP LLLGPPQTRSISLSPPKAYSP (SEQ ID NO: 917) ORF1/2 MAWRWWWQRRWRRRRWPRRRWRRLRRRRPRRPVRRRRRRTTMLSRE
CHKNREMLSALQTLSRDPDIFPRQTEKTTDKKKTSLYRKKDGAHPQKKPRT
RRAPRKARRSYSSSSSSGSSQSTSRSSSDSESNSDTSSKKSSKRKRVST (SEQ ID NO: 918)
[001503] Em algumas modalidades, um anelossomo compreende um ácido nucleico compreendendo uma sequência listada no Pedido PCT N.º PCT/US2018/037379, incorporado no presente documento por referência em sua totalidade. Em algumas modalidades, um anelossomo compreende um polipeptídeo compreendendo uma sequência listada no Pedido PCT N.º PCT/US2018/037379, incorporado no presente documento por referência em sua totalidade.
[001504] Em algumas modalidades, um anelossomo compreende um genoma de Anellovirus, por exemplo, como identificado de acordo com o método descrito no Exemplo 9. Em algumas modalidades, um anelossomo compreende uma sequência de Anellovirus, ou uma sua porção, como descrito no Exemplo 13.
[001505] Em algumas modalidades, um anelossomo compreende um elemento genético compreendendo um motivo de Anellovirus de consenso, por exemplo, como mostrado na Tabela 19. Em algumas modalidades, um anelossomo compreende um elemento genético compreendendo um motivo de ORF1 de Anellovirus de consenso, por exemplo, como mostrado na Tabela 19. Em algumas modalidades, um anelossomo compreende um elemento genético compreendendo um motivo de ORF1/1 de Anellovirus de consenso, por exemplo, como mostrado na Tabela 19. Em algumas modalidades, um anelossomo compreende um elemento genético compreendendo um motivo de ORF1/2 de Anellovirus de consenso, por exemplo, como mostrado na Tabela 19. Em algumas modalidades, um anelossomo compreende um elemento genético compreendendo um motivo de ORF2/2 de Anellovirus de consenso, por exemplo, como mostrado na Tabela 19. Em algumas modalidades, um anelossomo compreende um elemento genético compreendendo um motivo de ORF2/3 de Anellovirus de consenso, por exemplo, como mostrado na Tabela 19. Em algumas modalidades, um anelossomo compreende um elemento genético compreendendo um motivo de ORF2t/3 de Anellovirus de consenso, por exemplo, como mostrado na Tabela 19. Em algumas modalidades, X, como mostrado na Tabela 19, indica qualquer aminoácido. Em algumas modalidades, Z, como mostrado na Tabela 19, indica ácido glutâmico ou glutamina. Em algumas modalidades, B, como mostrado na Tabela
19, indica ácido aspártico ou asparagina.
Em algumas modalidades, J, como mostrado na Tabela 19, indica leucina ou isoleucina.
Tabela 19. Motivos de consenso em grelhas de leitura aberta (ORFs) de Anelloviruses Limiar de Grelha de Posição Motivo SEQ ID Consenso leitura NO: aberta 50 ORF1 79 LIJRQWQPXXIRRCXIXGYXPLIXC 68 50 ORF1 111 NYXXHXD 69 50 ORF1 135 FSLXXLYDZ 70 50 ORF1 149 NXWTXSNXDLDLCRYXGC 71 50 ORF1 194 TXPSXHPGXMXLXKHK 72 50 ORF1 212 IPSLXTRPXG 73 50 ORF1 228 RIXPPXLFXDKWYFQXDL 74 50 ORF1 250 LLXIXATA 75 50 ORF1 260 LXXPFXSPXTD 76 50 ORF1 448 YNPXXDKGXGNXIW 77 50 ORF1 519 CPYTZPXL 78 50 ORF1 542 XFGXGXMP 79 50 ORF1 569 HQXEVXEX 80 50 ORF1 600 KYXFXFXWGGNP 81 50 ORF1 653 HSWDXRRG 82 50 ORF1 666 AIKRXQQ 83 50 ORF1 750 XQZQXXLR 84 50 ORF1/1 73 PRXJQXXDP 85 50 ORF1/1 91 HSWDXRRG 86 50 ORF1/1 105 AIKRXQQ 87 50 ORF1/1 187 QZQXXLR 88 50 ORF1/2 97 KXKRRRR 89 50 ORF2/2 158 PIXSLXXYKXXTR 90 50 ORF2/2 189 LAXQLLKECXKN 91 50 ORF2/3 39 HLNXLA 92 50 ORF2/3 272 DRPPR 93 50 ORF2/3 281 DXPFYPWXP 94 50 ORF2/3 300 VXFKLXF 95 50 ORF2t/3 4 WXPPVHBVXGIERXW 96 50 ORF2t/3 37 AKRKLX 97
Limiar de Grelha de Posição Motivo SEQ ID Consenso leitura NO: aberta 50 ORF2t/3 140 PSSXDWXXEY 98 50 ORF2t/3 156 DRPPR 99 50 ORF2t/3 167 PFYPW 100 50 ORF2t/3 183 NVXFKLXF 101 50 ORF1 84 JXXXXWQPXXXXXCXIXGXXXJWQP 102 50 ORF1 149 NXWXXXNXXXXLXRY 103 50 ORF1 448 YNPXXDXG 104 Moléculas ORF1
[001506] Em algumas modalidades, o anelossomo compreende uma molécula ORF1 e/ou um ácido nucleico codificando uma molécula ORF1. Geralmente, uma molécula ORF1 compreende um polipeptídeo possuindo as características estruturais e/ou atividade de uma proteína ORF1 de Anellovirus (por exemplo, uma proteína ORF1 de Anellovirus como descrito no presente documento, por exemplo, como listado em qualquer uma das Tabelas A2, A4, A6, A8, A10, A12, C1-C5, 2, 4, 6, 8, 10, 12, 14, 16, 18, 20-37, ou D1-D10) ou um seu fragmento funcional. Em algumas modalidades, a molécula ORF1 compreende um truncamento em relação a uma proteína ORF1 de Anellovirus (por exemplo, uma proteína ORF1 de Anellovirus como descrito no presente documento, por exemplo, como listado em qualquer uma das Tabelas A2, A4, A6, A8, A10, A12, C1-C5, 2, 4, 6, 8, 10, 12, 14, 16, 18, 20-37, ou D1-D10). Em algumas modalidades, a molécula ORF1 é truncada por pelo menos 10, 20, 30, 40, 50, 60, 70, 80, 90, 100, 150, 200, 250, 300, 350, 400, 450, 500, 550, 600, 650, ou 700 aminoácidos da proteína ORF1 de Anellovirus. Em algumas modalidades, uma molécula ORF1 compreende uma sequência de aminoácidos possuindo pelo menos 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com uma sequência de proteína ORF1 de Anellovirus como mostrado em qualquer uma das Tabelas A2, A4, A6, A8, A10, A12, C1-C5, 2, 4, 6, 8, 10, 12, 14, 16, 18, 20-37, ou D1-D10.
Em algumas modalidades, uma molécula ORF1 compreende uma sequência de aminoácidos possuindo pelo menos 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, ou 99% de identidade de sequências com uma sequência de proteína ORF1 de Alphatorquevirus, Betatorquevirus ou Gammatorquevirus, por exemplo, como descrito no presente documento. Uma molécula ORF1 pode geralmente se ligar a uma molécula de ácido nucleico, tal como DNA (por exemplo, um elemento genético, por exemplo, como descrito no presente documento). Em algumas modalidades, uma molécula ORF1 se localiza para o núcleo de uma célula. Em certas modalidades, uma molécula ORF1 se localiza para o nucléolo de uma célula.
[001507] Sem desejar ser limitado pela teoria, uma molécula ORF1 pode ser capaz de se ligar a outras moléculas ORF1, por exemplo, para formar um exterior proteináceo (por exemplo, como descrito no presente documento). Tal molécula ORF1 pode ser descrita como possuindo a capacidade de formar um capsídeo. Em algumas modalidades, o exterior proteináceo pode encapsular uma molécula de ácido nucleico (por exemplo, um elemento genético como descrito no presente documento). Em algumas modalidades, uma pluralidade de moléculas ORF1 pode formar um multímero, por exemplo, para produzir um exterior proteináceo. Em algumas modalidades, o multímero pode ser um homomultímero. Em outras modalidades, o multímero pode ser um heteromultímero (por exemplo, compreendendo uma pluralidade de moléculas ORF1 distintas). Está também contemplado que uma molécula ORF1 pode possuir atividade de replicase.
[001508] Uma molécula ORF1 pode, em algumas modalidades, compreender um ou mais de: uma primeira região compreendendo uma região rica em arginina, por exemplo, uma região possuindo pelo menos 60% de resíduos básicos (por exemplo, pelo menos 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, ou 100% resíduos básicos; por exemplo,
entre 60%-90 %, 60%-80%, 70%-90% ou 70-80% de resíduos básicos) e uma segunda região compreendendo domínio jelly-roll, por exemplo, pelo menos seis fitas beta (por exemplo, 4, 5, 6, 7, 8, 9, 10, 11, ou 12 fitas beta). Região rica em arginina
[001509] Uma região rica em arginina tem pelo menos 70% (por exemplo, pelo menos cerca de 70, 80, 90, 95, 96, 97, 98, 99, ou 100%) de identidade de sequências com uma sequência da região rica em arginina descrita no presente documento ou uma sequência de pelo menos cerca de 40 aminoácidos compreendendo pelo menos 60%, 70% ou 80% de resíduos básicos (por exemplo, arginina, lisina ou uma sua combinação). Domínio jelly-roll
[001510] Um domínio ou região jelly-roll compreende (por exemplo, consiste em) um polipeptídeo (por exemplo, um domínio ou região compreendida em um polipeptídeo maior) compreendendo uma ou mais (por exemplo, 1, 2 ou 3) das seguintes características:
[001511] (i) pelo menos 30% (por exemplo, pelo menos 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 90% ou mais) dos aminoácidos do domínio jelly-roll são parte de uma ou mais folhas β;
[001512] (ii) a estrutura secundária do domínio jelly-roll compreende pelo menos quatro (por exemplo, pelo menos 4, 5, 6, 7, 8, 9, 10, 11, ou 12) folhas β; e/ou
[001513] (iii) a estrutura terciária do domínio jelly-roll compreende pelo menos dois (por exemplo, pelo menos 2, 3 ou 4) folhas β; e/ou
[001514] (iv) o domínio jelly-roll compreende uma razão entre folhas β e hélices α de pelo menos 2:1, 3:1, 4:1, 5:1, 6:1, 7:1, 8:1, 9:1, ou 10:1.
[001515] Em certas modalidades, um domínio jelly-roll compreende duas folhas β.
[001516] Em certas modalidades, uma ou mais (por exemplo, 1, 2, 3,
4, 5, 6, 7, 8, 9, ou 10) das folhas β compreendem certa de oito (por exemplo, 4, 5, 6, 7, 8, 9, 10, 11, ou 12) fitas β. Em certas modalidades, uma ou mais (por exemplo, 1, 2, 3, 4, 5, 6, 7, 8, 9, ou 10) das folhas β compreendem oito fitas β. Em certas modalidades, uma ou mais (por exemplo, 1, 2, 3, 4, 5, 6, 7, 8, 9, ou 10) das folhas β compreendem sete fitas β. Em certas modalidades, uma ou mais (por exemplo, 1, 2, 3, 4, 5, 6, 7, 8, 9, ou 10) das folhas β compreendem seis fitas β. Em certas modalidades, uma ou mais (por exemplo, 1, 2, 3, 4, 5, 6, 7, 8, 9, ou 10) das folhas β compreendem cinco fitas β. Em certas modalidades, uma ou mais (por exemplo, 1, 2, 3, 4, 5, 6, 7, 8, 9, ou 10) das folhas β compreendem quatro fitas β.
[001517] Em algumas modalidades, o domínio jelly-roll compreende uma primeira folha β em orientação antiparalela em relação a uma segunda folha β. Em certas modalidades, a primeira folha β compreende cerca de quatro folhas (por exemplo, 3, 4, 5 ou 6) β. Em certas modalidades, a segunda folha β compreende cerca de quatro (por exemplo, 3, 4, 5 ou 6) fitas β. Em modalidades, a primeira e a segunda folha β compreendem, no total, cerca de oito (por exemplo, 6, 7, 8, 9, 10, 11 ou 12) fitas β.
[001518] Em certas modalidades, um domínio jelly-roll é um componente de uma proteína de capsídeo (por exemplo, uma molécula ORF1 como descrito no presente documento). Em certas modalidades, um domínio jelly-roll tem atividade de automontagem. Em algumas modalidades, um polipeptídeo compreendendo um domínio jelly-roll se liga a uma outra cópia do polipeptídeo compreendendo o domínio jelly- roll. Em algumas modalidades, um domínio jelly-roll de um primeiro polipeptídeo se liga a um domínio jelly-roll de uma segunda cópia do polipeptídeo.
[001519] Uma molécula ORF1 pode também incluir uma terceira região compreendendo a estrutura ou atividade de um domínio N22 de
Anellovirus (por exemplo, como descrito no presente documento, por exemplo, um domínio N22 de uma proteína ORF1 de Anellovirus como descrito no presente documento) e/ou uma quarta região compreendendo a estrutura ou atividade de um domínio C-terminal (CTD) de Anellovirus (por exemplo, como descrito no presente documento, por exemplo, um CTD de uma proteína ORF1 de Anellovirus como descrito no presente documento). Em algumas modalidades, a molécula ORF1 compreende, na ordem N-terminal para C-terminal, a primeira, segunda, terceira e quarta regiões.
[001520] A molécula ORF1 pode, em algumas modalidades, compreender ainda uma região hipervariável (HVR), por exemplo, uma HVR de uma proteína ORF1 de Anellovirus, por exemplo, como descrito no presente documento. Em algumas modalidades, a HVR está posicionada entre a segunda região e a terceira região. Em algumas modalidades, a HVR compreende pelo menos cerca de 55 (por exemplo, pelo menos cerca de 45, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, ou 65) aminoácidos (por exemplo, cerca de 45-160, 50-160, 55-160, 60-160, 45-150, 50-150, 55-150, 60-150, 45-140, 50-140, 55-140, ou 60- 140 aminoácidos).
[001521] Em algumas modalidades, a primeira região pode se ligar a uma molécula de ácido nucleico (por exemplo, DNA). Em algumas modalidades, os resíduos básicos são selecionados de arginina, histidina ou lisina ou uma sua combinação. Em algumas modalidades, a primeira região compreende pelo menos 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, ou 100% resíduos de arginina (por exemplo, entre 60%-90%, 60%-80%, 70%-90% ou 70-80% resíduos de arginina). Em algumas modalidades, a primeira região compreende cerca de 30-120 aminoácidos (por exemplo, cerca de 40-120, 40-100, 40-90, 40-80, 40- 70, 50-100, 50-90, 50-80, 50-70, 60-100, 60-90, ou 60-80aminoácidos). Em algumas modalidades, a primeira região compreende a estrutura ou atividade de uma região rica em arginina de ORF1 viral (por exemplo, uma região rica em arginina de uma proteína ORF1 de Anellovirus, por exemplo, como descrito no presente documento). Em algumas modalidades, a primeira região compreende um sinal de localização nuclear.
[001522] Em algumas modalidades, a segunda região compreende um domínio jelly-roll, por exemplo, a estrutura ou atividade de um domínio jelly-roll de ORF1 viral (por exemplo, um domínio jelly-roll de uma proteína ORF1 de Anellovirus, por exemplo, como descrito no presente documento). Em algumas modalidades, a segunda região é capaz de se ligar à segunda região de uma outra molécula ORF1, por exemplo, para formar um exterior proteináceo (por exemplo, capsídeo) ou uma sua porção.
[001523] Em algumas modalidades, a quarta região é exposta na superfície de um exterior proteináceo (por exemplo, um exterior proteináceo compreendendo um multímero de moléculas ORF1, por exemplo, como descrito no presente documento).
[001524] Em algumas modalidades, a primeira região, segunda região, terceira região, quarta região e/ou HVR compreendem cada uma menos do que quatro (por exemplo, 0, 1, 2 ou 3) folhas beta.
[001525] Em algumas modalidades, um ou mais da primeira região, segunda região, terceira região, quarta região e/ou HVR podem ser substituídos por uma sequência de aminoácidos heteróloga (por exemplo, a região correspondente de uma molécula ORF1 heteróloga). Em algumas modalidades, a sequência de aminoácidos heteróloga tem uma funcionalidade desejada, por exemplo, como descrito no presente documento.
[001526] Em algumas modalidades, a molécula ORF1 compreende uma pluralidade de motivos conservados (por exemplo, motivos compreendendo cerca de 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18,
19, 20, 25, 30, 35, 40, 45, 50, 60, 70, 80, 90, 100 ou mais aminoácidos) (por exemplo, como mostrado na Figura 34). Em algumas modalidades, os motivos conservados podem mostrar 60, 70, 80, 85, 90, 95 ou 100% de identidade de sequências com uma proteína ORF1 de um ou mais clados de Anellovirus de tipo selvagem (por exemplo, Alphatorquevirus, clado 1; Alphatorquevirus, clado 2; Alphatorquevirus, clado 3; Alphatorquevirus, clado 4; Alphatorquevirus, clado 5; Alphatorquevirus, clado 6; Alphatorquevirus, clado 7; Betatorquevirus; e/ou Gammatorquevirus). Em modalidades, os motivos conservados têm cada um um comprimento entre 1-1000 (por exemplo, entre 5-10, 5-15, 5-20, 10-15, 10-20, 15-20, 5-50, 5-100, 10-50, 10-100, 10-1000, 50-100, 50-1000, ou 100-1000) aminoácidos. Em certas modalidades, os motivos conservados consistem em cerca de 2-4% (por exemplo, cerca de 1-8%, 1-6%, 1-5%, 1-4%, 2-8%, 2-6%, 2-5% ou 2-4%) da sequência da molécula ORF1, e cada um mostra 100% de identidade de sequências com os motivos correspondentes em uma proteína ORF1 do clado de Anellovirus de tipo selvagem. Em certas modalidades, os motivos conservados consistem em cerca de 5-10% (por exemplo, cerca de 1-20%, 1-10%, 5-20% ou 5-10%) da sequência da molécula ORF1, e cada um mostra 80% de identidade de sequências com os motivos correspondentes em uma proteína ORF1 do clado de Anellovirus de tipo selvagem. Em certas modalidades, os motivos conservados consistem em cerca de 10-50% (por exemplo, cerca de 10-20%, 10-30%, 10-40%, 10-50%, 20-40%, 20-50% ou 30-50%) da sequência da molécula ORF1, e cada um mostra 60% de identidade de sequências com os motivos correspondentes em uma proteína ORF1 do clado de Anellovirus de tipo selvagem. Em algumas modalidades, os motivos conservados compreendem uma ou mais sequências de aminoácidos como listado na Tabela 19.
[001527] Em algumas modalidades, uma molécula ORF1 compreende pelo menos uma diferença (por exemplo, uma mutação, modificação química ou alteração epigenética) em relação a uma proteína ORF1 de tipo selvagem, por exemplo, como descrito no presente documento (por exemplo, como mostrado em qualquer uma das Tabelas A2, A4, A6, A8, A10, A12, C1-C5, 2, 4, 6, 8, 10, 12, 14, 16, 18, 20-37, ou D1-D10). Motivo de ORF1 Conservado em Domínio N22
[001528] Em algumas modalidades, um polipeptídeo (por exemplo, uma molécula ORF1) descrito no presente documento compreende a sequência de aminoácidos YNPX2DXGX2N (SEQ ID NO: 829), em que Xn é uma sequência contígua de quaisquer n aminoácidos. Por exemplo, X2 indica uma sequência contígua de quaisquer dois aminoácidos. Em algumas modalidades, a YNPX2DXGX2N (SEQ ID NO: 829) está compreendida dentro do domínio N22 de uma molécula ORF1, por exemplo, como descrito no presente documento. Em algumas modalidades, um elemento genético descrito no presente documento compreende uma sequência de ácidos nucleicos (por exemplo, uma sequência de ácidos nucleicos codificando uma molécula ORF1, por exemplo, como descrito no presente documento) codificando a sequência de aminoácidos YNPX2DXGX2N (SEQ ID NO: 829), em que Xn é uma sequência contígua de quaisquer n aminoácidos.
[001529] Em algumas modalidades, um polipeptídeo (por exemplo, uma molécula ORF1) compreende uma estrutura secundária conservada, por exemplo, flanqueando e/ou compreendendo uma porção do motivo YNPX2DXGX2N (SEQ ID NO: 829), por exemplo, em um domínio N22. Em algumas modalidades, a estrutura secundária conservada compreende uma primeira fita beta e/ou uma segunda fita beta. Em algumas modalidades, a primeira fita beta tem cerca de 5-6 (por exemplo, 3, 4, 5, 6, 7 ou 8) aminoácidos em comprimento. Em algumas modalidades, a primeira fita beta compreende o resíduo de tirosina (Y) na extremidade N-terminal do motivo YNPX2DXGX2N (SEQ
ID NO: 829). Em algumas modalidades, o motivo YNPX2DXGX2N (SEQ ID NO: 829) compreende uma bobina aleatória (por exemplo, cerca de 8-9 aminoácidos de bobina aleatória). Em algumas modalidades, a segunda fita beta tem cerca de 7-8 (por exemplo, 5, 6, 7, 8, 9 ou 10) aminoácidos em comprimento. Em algumas modalidades, a segunda fita beta compreende o resíduo de asparagina (N) na extremidade C- terminal do motivo YNPX2DXGX2N (SEQ ID NO: 829).
[001530] Estruturas secundárias flanqueando o motivo YNPX2DXGX2N (SEQ ID NO: 829) exemplificativas são descritas no Exemplo 47 e Figura 48. Em algumas modalidades, uma molécula ORF1 compreende uma região compreendendo um ou mais dos (por exemplo, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 ou todos os) elementos estruturais secundários (por exemplo, fitas beta) mostrados na Figura 48. Em algumas modalidades, uma molécula ORF1 compreende uma região compreendendo um ou mais dos (por exemplo, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 ou todos os) elementos estruturais secundários (por exemplo, fitas beta) mostrados na Figura 48, flanqueando um motivo YNPX2DXGX2N (SEQ ID NO: 829) (por exemplo, como descrito no presente documento). Motivo Estrutural Secundário Conservado em Domínio Jelly-Roll de ORF1
[001531] Em algumas modalidades, um polipeptídeo (por exemplo, uma molécula ORF1) descrito no presente documento compreende um ou mais elementos estruturais secundários compreendidos por uma proteína ORF1 de Anellovirus (por exemplo, como descrito no presente documento). Em algumas modalidades, uma molécula ORF1 compreende um ou mais elementos estruturais secundários compreendidos pelo domínio jelly-roll de uma proteína ORF1 de Anellovirus (por exemplo, como descrito no presente documento). Geralmente, um domínio jelly-roll de ORF1 compreende uma estrutura secundária compreendendo, na ordem da direção do terminal N para o terminal C, uma primeira fita beta, uma segunda fita beta, uma primeira hélice alfa, uma terceira fita beta, uma quarta fita beta, uma quinta fita beta, uma segunda hélice alfa, uma sexta fita beta, uma sétima fita beta, uma oitava fita beta e uma nona fita beta. Em algumas modalidades, uma molécula ORF1 compreende uma estrutura secundária compreendendo, na ordem da direção do terminal N para o terminal C, uma primeira fita beta, uma segunda fita beta, uma primeira hélice alfa, uma terceira fita beta, uma quarta fita beta, uma quinta fita beta, uma segunda hélice alfa, uma sexta fita beta, uma sétima fita beta, uma oitava fita beta e/ou uma nona fita beta.
[001532] Em algumas modalidades, um par dos elementos estruturais secundários conservados (i.e., as fitas beta e/ou hélices alfa) é separado por uma sequência de aminoácidos intersticial, por exemplo, compreendendo uma sequência de bobina aleatória, uma fita beta ou uma hélice alfa ou uma sua combinação. As sequências de aminoácidos intersticiais entre os elementos estruturais secundários conservados podem compreender, por exemplo, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30 ou mais aminoácidos. Em algumas modalidades, uma molécula ORF1 pode compreender ainda uma ou mais fitas beta e/ou hélices alfa adicionais (por exemplo, no domínio jelly-roll). Em algumas modalidades, cadeias beta consecutivas ou hélices alfa consecutivas podem ser combinadas. Em algumas modalidades, a primeira fita beta e a segunda fita beta estão compreendidas em uma fita beta maior. Em algumas modalidades, a terceira fita beta e a quarta fita beta estão compreendidas em uma fita beta maior. Em algumas modalidades, a quarta fita beta e a quinta fita beta estão compreendidas em uma fita beta maior. Em algumas modalidades, a sexta fita beta e a sétima fita beta estão compreendidas em uma fita beta maior. Em algumas modalidades, a sétima fita beta e a oitava fita beta estão compreendidas em uma fita beta maior. Em algumas modalidades, a oitava fita beta e a nona fita beta estão compreendidas em uma fita beta maior.
[001533] Em algumas modalidades, a primeira fita beta tem cerca de 5-7 (por exemplo, 3, 4, 5, 6, 7, 8, 9 ou 10) aminoácidos em comprimento. Em algumas modalidades, a segunda fita beta tem cerca de 15-16 (por exemplo, 13, 14, 15, 16, 17, 18 ou 19) aminoácidos em comprimento. Em algumas modalidades, a primeira hélice alfa tem cerca de 15-17 (por exemplo, 13, 14, 15, 16, 17, 18, 19 ou 20) aminoácidos em comprimento. Em algumas modalidades, a terceira fita beta tem cerca de 3-4 (por exemplo, 1, 2, 3, 4, 5 ou 6) aminoácidos em comprimento. Em algumas modalidades, a quarta fita beta tem cerca de 10-11 (por exemplo, 8, 9, 10, 11, 12 ou 13) aminoácidos em comprimento. Em algumas modalidades, a quinta fita beta tem cerca de 6-7 (por exemplo, 4, 5, 6, 7, 8, 9 ou 10) aminoácidos em comprimento. Em algumas modalidades, a segunda hélice alfa tem cerca de 8-14 (por exemplo, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, ou 17) aminoácidos em comprimento. Em algumas modalidades, a segunda hélice alfa pode ser dividida em duas hélices alfa mais pequenas (por exemplo, separadas por uma sequência de bobina aleatória). Em algumas modalidades, cada uma das duas hélices alfa mais pequenas tem cerca de 4-6 (por exemplo, 2, 3, 4, 5, 6, 7 ou 8) aminoácidos em comprimento. Em algumas modalidades, a sexta fita beta tem cerca de 4-5 (por exemplo, 2, 3, 4, 5, 6 ou 7) aminoácidos em comprimento. Em algumas modalidades, a sétima fita beta tem cerca de 5-6 (por exemplo, 3, 4, 5, 6, 7, 8 ou 9) aminoácidos em comprimento. Em algumas modalidades, a oitava fita beta tem cerca de 7-9 (por exemplo, 5, 6, 7, 8, 9, 10, 11, 12 ou 13) aminoácidos em comprimento. Em algumas modalidades, a nona fita beta tem cerca de 5-7 (por exemplo, 3, 4, 5, 6, 7, 8, 9 ou 10) aminoácidos em comprimento.
[001534] Estruturas secundárias de domínio jelly-roll exemplificativos são descritas no Exemplo 47 e Figura 47. Em algumas modalidades, uma molécula ORF1 compreende uma região compreendendo um ou mais dos (por exemplo, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 ou todos os) elementos estruturais secundários (por exemplo, fitas beta e/ou hélices alfa) de qualquer uma das estruturas secundárias de domínio jelly-roll mostradas na Figura 47. Sequências de ORF1 Exemplificativas
[001535] Em algumas modalidades, um polipeptídeo (por exemplo, uma molécula ORF1) descrito no presente documento compreende uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com uma ou mais subsequências de ORF1 de Anellovirus, por exemplo, como descrito em qualquer uma das Tabelas 20-37 ou D1- D10. Em algumas modalidades, um anelossomo descrito no presente documento compreende uma molécula ORF1 compreendendo uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com uma ou mais subsequências de ORF1 de Anellovirus, por exemplo, como descrito em qualquer uma das Tabelas 20-37 ou D1- D10. Em algumas modalidades, um anelossomo descrito no presente documento compreende uma molécula de ácido nucleico (por exemplo, um elemento genético) codificando uma molécula ORF1 compreendendo uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com uma ou mais subsequências de ORF1 de Anellovirus, por exemplo, como descrito em qualquer uma das Tabelas 20-37 ou D1-D10.
[001536] Em algumas modalidades, a uma ou mais subsequências de ORF1 de Anellovirus compreendem um ou mais de um domínio rico em arginina (Arg), um domínio jelly-roll, uma região hipervariável (HVR), um domínio N22 ou um domínio C-terminal (CTD) (por exemplo, como listado em qualquer uma das Tabelas 20-37 ou D1-D10) ou sequências possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com as mesmas. Em algumas modalidades, a molécula ORF1 compreende uma pluralidade de subsequências de diferentes Anelloviruses (por exemplo, qualquer combinação de subsequências de ORF1 selecionadas das subsequências dos Clados 1-7 de Alphatorquevirus nas Tabelas 20-37 ou D1-D10). Em modalidades, a molécula ORF1 compreende um ou mais de um domínio rico em Arg, um domínio jelly- roll, um domínio N22 e um CTD de um Anellovirus e uma HVR de um outro. Em modalidades, a molécula ORF1 compreende um ou mais de um domínio jelly-roll, uma HVR, um domínio N22 e um CTD de um Anellovirus e um domínio rico em Arg de um outro. Em modalidades, a molécula ORF1 compreende um ou mais de um domínio rico em Arg, uma HVR, um domínio N22 e um CTD de um Anellovirus e um domínio jelly-roll de um outro. Em modalidades, a molécula ORF1 compreende um ou mais de um domínio rico em Arg, um domínio jelly-roll, uma HVR e um CTD de um Anellovirus e um domínio N22 de um outro. Em modalidades, a molécula ORF1 compreende um ou mais de um domínio rico em Arg, um domínio jelly-roll, uma HVR e um domínio N22 de um Anellovirus e um CTD de um outro.
[001537] Em modalidades, a uma ou mais subsequências de ORF1 de Anellovirus compreendem uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos da região rica em Arg da Tabela 20 (por exemplo, aminoácidos 1 – 66 da Tabela 20). Em modalidades, a uma ou mais subsequências de ORF1 de Anellovirus compreendem uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos da região rica em Arg da Tabela 21. Em modalidades, a uma ou mais subsequências de ORF1 de Anellovirus compreendem uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos da região jelly-roll da Tabela 20 (por exemplo, aminoácidos 67 – 277 da Tabela 20). Em modalidades, a uma ou mais subsequências de ORF1 de Anellovirus compreendem uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos da região jelly-roll da Tabela 21. Em modalidades, a uma ou mais subsequências de ORF1 de Anellovirus compreendem uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos de HVR da Tabela 20 (por exemplo, aminoácidos 278 – 347 da Tabela 20). Em modalidades, a uma ou mais subsequências de ORF1 de Anellovirus compreendem uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos de HVR da Tabela 21. Em modalidades, a uma ou mais subsequências de ORF1 de Anellovirus compreendem uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos do domínio N22 da Tabela 20 (por exemplo, aminoácidos 348 – 513 da Tabela 20). Em modalidades, a uma ou mais subsequências de ORF1 de Anellovirus compreendem uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos do domínio N22 da Tabela 21. Em modalidades, a uma ou mais subsequências de ORF1 de Anellovirus compreendem uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos de CTD da Tabela 20 (por exemplo, aminoácidos 513 – 680 da Tabela 20). Em modalidades, a uma ou mais subsequências de ORF1 de Anellovirus compreendem uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos de CTD da Tabela 21.
[001538] Em modalidades, a uma ou mais subsequências de ORF1 de Anellovirus compreendem uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos da região rica em Arg da Tabela 22 (por exemplo, aminoácidos 1 – 69 da Tabela 22). Em modalidades, a uma ou mais subsequências de ORF1 de Anellovirus compreendem uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos da região rica em Arg da Tabela 23. Em modalidades, a uma ou mais subsequências de ORF1 de Anellovirus compreendem uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos da região jelly-roll da Tabela 22 (por exemplo, aminoácidos 70 – 279 da Tabela 22). Em modalidades, a uma ou mais subsequências de ORF1 de Anellovirus compreendem uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos da região jelly-roll da Tabela 23. Em modalidades, a uma ou mais subsequências de ORF1 de Anellovirus compreendem uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos de HVR da Tabela 22 (por exemplo, aminoácidos 280 – 411 da Tabela 22). Em modalidades, a uma ou mais subsequências de ORF1 de Anellovirus compreendem uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos de HVR da Tabela 23. Em modalidades, a uma ou mais subsequências de ORF1 de Anellovirus compreendem uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos do domínio N22 da Tabela 22 (por exemplo, aminoácidos 412 – 578 da Tabela 22). Em modalidades, a uma ou mais subsequências de ORF1 de Anellovirus compreendem uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos do domínio N22 da Tabela 23. Em modalidades, a uma ou mais subsequências de ORF1 de Anellovirus compreendem uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos de CTD da Tabela 22 (por exemplo, aminoácidos 579 – 747 da Tabela 22). Em modalidades, a uma ou mais subsequências de ORF1 de Anellovirus compreendem uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos de CTD da Tabela 23.
[001539] Em modalidades, a uma ou mais subsequências de ORF1 de Anellovirus compreendem uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos da região rica em Arg da Tabela 24 (por exemplo, aminoácidos 1 – 68 da Tabela 24). Em modalidades, a uma ou mais subsequências de ORF1 de Anellovirus compreendem uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos da região rica em Arg da Tabela 25. Em modalidades, a uma ou mais subsequências de ORF1 de Anellovirus compreendem uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos da região jelly-roll da Tabela 24 (por exemplo, aminoácidos 69 – 280 da Tabela 24). Em modalidades, a uma ou mais subsequências de ORF1 de Anellovirus compreendem uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos da região jelly-roll da Tabela 25. Em modalidades, a uma ou mais subsequências de ORF1 de Anellovirus compreendem uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos de HVR da Tabela 24 (por exemplo, aminoácidos 281 – 413 da Tabela 24). Em modalidades, a uma ou mais subsequências de ORF1 de Anellovirus compreendem uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos de HVR da Tabela 25. Em modalidades, a uma ou mais subsequências de ORF1 de Anellovirus compreendem uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos do domínio N22 da Tabela 24 (por exemplo, aminoácidos 414 – 479 da Tabela 24). Em modalidades, a uma ou mais subsequências de ORF1 de Anellovirus compreendem uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos do domínio N22 da Tabela 25. Em modalidades, a uma ou mais subsequências de ORF1 de Anellovirus compreendem uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos de CTD da Tabela 24 (por exemplo, aminoácidos 580 – 743 da Tabela 24). Em modalidades, a uma ou mais subsequências de ORF1 de Anellovirus compreendem uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos de CTD da Tabela 25.
[001540] Em modalidades, a uma ou mais subsequências de ORF1 de Anellovirus compreendem uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos da região rica em Arg da Tabela 26 (por exemplo, aminoácidos 1 – 74 da Tabela 26). Em modalidades, a uma ou mais subsequências de ORF1 de Anellovirus compreendem uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos da região rica em Arg da Tabela 27. Em modalidades, a uma ou mais subsequências de ORF1 de Anellovirus compreendem uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos da região jelly-roll da Tabela 26 (por exemplo, aminoácidos 75 – 284 da Tabela 26). Em modalidades, a uma ou mais subsequências de ORF1 de Anellovirus compreendem uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos da região jelly-roll da Tabela 27. Em modalidades, a uma ou mais subsequências de ORF1 de Anellovirus compreendem uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos de HVR da Tabela 26 (por exemplo, aminoácidos 285 – 445 da Tabela 26). Em modalidades, a uma ou mais subsequências de ORF1 de Anellovirus compreendem uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos de HVR da Tabela 27. Em modalidades, a uma ou mais subsequências de ORF1 de Anellovirus compreendem uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos do domínio N22 da Tabela 26 (por exemplo, aminoácidos 446 – 611 da Tabela 26). Em modalidades, a uma ou mais subsequências de ORF1 de Anellovirus compreendem uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos do domínio N22 da Tabela 27. Em modalidades, a uma ou mais subsequências de ORF1 de Anellovirus compreendem uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos de CTD da Tabela 26 (por exemplo, aminoácidos 612 – 780 da Tabela 26). Em modalidades, a uma ou mais subsequências de ORF1 de Anellovirus compreendem uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos de CTD da Tabela 27.
[001541] Em modalidades, a uma ou mais subsequências de ORF1 de Anellovirus compreendem uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos da região rica em Arg da Tabela 28 (por exemplo, aminoácidos 1 – 75 da Tabela 28). Em modalidades, a uma ou mais subsequências de ORF1 de Anellovirus compreendem uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos da região rica em Arg da Tabela 29. Em modalidades, a uma ou mais subsequências de ORF1 de Anellovirus compreendem uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos da região jelly-roll da Tabela 28 (por exemplo, aminoácidos 75 – 284 da Tabela 28). Em modalidades, a uma ou mais subsequências de ORF1 de Anellovirus compreendem uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos da região jelly-roll da Tabela 29. Em modalidades, a uma ou mais subsequências de ORF1 de Anellovirus compreendem uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos de HVR da Tabela 28 (por exemplo, aminoácidos 285 – 432 da Tabela 28). Em modalidades, a uma ou mais subsequências de ORF1 de Anellovirus compreendem uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos de HVR da Tabela 29. Em modalidades, a uma ou mais subsequências de ORF1 de Anellovirus compreendem uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos do domínio N22 da Tabela 28 (por exemplo, aminoácidos 433 – 599 da Tabela 28). Em modalidades, a uma ou mais subsequências de ORF1 de Anellovirus compreendem uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos do domínio N22 da Tabela 29. Em modalidades, a uma ou mais subsequências de ORF1 de Anellovirus compreendem uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos de CTD da Tabela 28 (por exemplo, aminoácidos 600 – 780 da Tabela 28). Em modalidades, a uma ou mais subsequências de ORF1 de Anellovirus compreendem uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos de CTD da Tabela 29.
[001542] Em modalidades, a uma ou mais subsequências de ORF1 de Anellovirus compreendem uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos da região rica em Arg da Tabela 30 (por exemplo, aminoácidos 1 – 77 da Tabela 30). Em modalidades, a uma ou mais subsequências de ORF1 de Anellovirus compreendem uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos da região rica em Arg da Tabela 31. Em modalidades, a uma ou mais subsequências de ORF1 de Anellovirus compreendem uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos da região jelly-roll da Tabela 30 (por exemplo, aminoácidos 78 – 286 da Tabela 30). Em modalidades, a uma ou mais subsequências de ORF1 de Anellovirus compreendem uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos da região jelly-roll da Tabela 31. Em modalidades, a uma ou mais subsequências de ORF1 de Anellovirus compreendem uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos de HVR da Tabela 30 (por exemplo, aminoácidos 287 – 416 da Tabela 30). Em modalidades, a uma ou mais subsequências de ORF1 de Anellovirus compreendem uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos de HVR da Tabela 31. Em modalidades, a uma ou mais subsequências de ORF1 de Anellovirus compreendem uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos do domínio N22 da Tabela 30 (por exemplo, aminoácidos 417 – 585 da Tabela 30). Em modalidades, a uma ou mais subsequências de ORF1 de Anellovirus compreendem uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos do domínio N22 da Tabela 31. Em modalidades, a uma ou mais subsequências de ORF1 de Anellovirus compreendem uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos de CTD da Tabela 30 (por exemplo, aminoácidos 586 – 746 da Tabela 30). Em modalidades, a uma ou mais subsequências de ORF1 de Anellovirus compreendem uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos de CTD da Tabela 31.
[001543] Em modalidades, a uma ou mais subsequências de ORF1 de Anellovirus compreendem uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos da região rica em Arg da Tabela 32 (por exemplo, aminoácidos 1 – 74 da Tabela 32). Em modalidades, a uma ou mais subsequências de ORF1 de Anellovirus compreendem uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos da região rica em Arg da Tabela 33. Em modalidades, a uma ou mais subsequências de ORF1 de Anellovirus compreendem uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos da região jelly-roll da Tabela 32 (por exemplo, aminoácidos 75 – 286 da Tabela 32). Em modalidades, a uma ou mais subsequências de ORF1 de Anellovirus compreendem uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos da região jelly-roll da Tabela 33. Em modalidades, a uma ou mais subsequências de ORF1 de Anellovirus compreendem uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos de HVR da Tabela 32 (por exemplo, aminoácidos 287 – 428 da Tabela 32). Em modalidades, a uma ou mais subsequências de ORF1 de Anellovirus compreendem uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos de HVR da Tabela 33. Em modalidades, a uma ou mais subsequências de ORF1 de Anellovirus compreendem uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos do domínio N22 da Tabela 32 (por exemplo, aminoácidos 429 – 595 da Tabela 32). Em modalidades, a uma ou mais subsequências de ORF1 de Anellovirus compreendem uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos do domínio N22 da Tabela 33. Em modalidades, a uma ou mais subsequências de ORF1 de Anellovirus compreendem uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100%de identidade de sequências com a sequência de aminoácidos de CTD da Tabela 32 (por exemplo, aminoácidos 596 – 765 da Tabela 32). Em modalidades, a uma ou mais subsequências de ORF1 de Anellovirus compreendem uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos de CTD da Tabela 33.
[001544] Em modalidades, a uma ou mais subsequências de ORF1 de Anellovirus compreendem uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos da região rica em Arg da Tabela 34 (por exemplo, aminoácidos 1 – 38 da Tabela 34). Em modalidades, a uma ou mais subsequências de ORF1 de Anellovirus compreendem uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos da região rica em Arg da Tabela 35. Em modalidades, a uma ou mais subsequências de ORF1 de Anellovirus compreendem uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos da região jelly-roll da Tabela 34 (por exemplo, aminoácidos 39 – 246 da Tabela 34). Em modalidades, a uma ou mais subsequências de ORF1 de Anellovirus compreendem uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos da região jelly-roll da Tabela 35. Em modalidades, a uma ou mais subsequências de ORF1 de Anellovirus compreendem uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos de HVR da Tabela 34 (por exemplo, aminoácidos 247 – 374 da Tabela 34). Em modalidades, a uma ou mais subsequências de ORF1 de Anellovirus compreendem uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos de HVR da Tabela 35. Em modalidades, a uma ou mais subsequências de ORF1 de Anellovirus compreendem uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos do domínio N22 da Tabela 34 (por exemplo, aminoácidos 375 – 537 da Tabela 34). Em modalidades, a uma ou mais subsequências de ORF1 de Anellovirus compreendem uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos do domínio N22 da Tabela 35. Em modalidades, a uma ou mais subsequências de ORF1 de Anellovirus compreendem uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos de CTD da Tabela 34 (por exemplo, aminoácidos 538 – 666 da Tabela 34). Em modalidades, a uma ou mais subsequências de ORF1 de Anellovirus compreendem uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos de CTD da Tabela 35.
[001545] Em modalidades, a uma ou mais subsequências de ORF1 de Anellovirus compreendem uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos da região rica em Arg da Tabela 36 (por exemplo, aminoácidos 1 – 57 da Tabela 36). Em modalidades, a uma ou mais subsequências de ORF1 de Anellovirus compreendem uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos da região rica em Arg da Tabela 37. Em modalidades, a uma ou mais subsequências de ORF1 de Anellovirus compreendem uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos da região jelly-roll da Tabela 36 (por exemplo, aminoácidos 58 – 259 da Tabela 36). Em modalidades, a uma ou mais subsequências de ORF1 de Anellovirus compreendem uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos da região jelly-roll da Tabela 37. Em modalidades, a uma ou mais subsequências de ORF1 de Anellovirus compreendem uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos de HVR da Tabela 36 (por exemplo, aminoácidos 260 – 351 da Tabela 36). Em modalidades, a uma ou mais subsequências de ORF1 de Anellovirus compreendem uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos de HVR da Tabela 37. Em modalidades, a uma ou mais subsequências de ORF1 de Anellovirus compreendem uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos do domínio N22 da Tabela 36 (por exemplo, aminoácidos 352 – 510 da Tabela 36). Em modalidades, a uma ou mais subsequências de ORF1 de Anellovirus compreendem uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos do domínio N22 da Tabela 37. Em modalidades, a uma ou mais subsequências de ORF1 de Anellovirus compreendem uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos de CTD da Tabela 36 (por exemplo, aminoácidos 511 – 673 da Tabela 36). Em modalidades, a uma ou mais subsequências de ORF1 de Anellovirus compreendem uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos de CTD da Tabela 37.
[001546] Em modalidades, a uma ou mais subsequências de ORF1 de Anellovirus compreendem uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos da região rica em Arg da Tabela D1 (por exemplo, aminoácidos 1 – 66 da Tabela D1). Em modalidades, a uma ou mais subsequências de ORF1 de Anellovirus compreendem uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos da região rica em Arg da Tabela D2. Em modalidades, a uma ou mais subsequências de ORF1 de Anellovirus compreendem uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos da região jelly-roll da Tabela D1 (por exemplo, aminoácidos 67 – 277 da Tabela D1). Em modalidades, a uma ou mais subsequências de ORF1 de Anellovirus compreendem uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos da região jelly-roll da Tabela D2. Em modalidades, a uma ou mais subsequências de ORF1 de Anellovirus compreendem uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos de HVR da Tabela D1 (por exemplo, aminoácidos 278 – 347 da Tabela D1). Em modalidades, a uma ou mais subsequências de ORF1 de Anellovirus compreendem uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos de HVR da Tabela D2. Em modalidades, a uma ou mais subsequências de ORF1 de Anellovirus compreendem uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos do domínio N22 da Tabela D1 (por exemplo, aminoácidos 348 – 513 da Tabela D1). Em modalidades, a uma ou mais subsequências de ORF1 de Anellovirus compreendem uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos do domínio N22 da Tabela D2. Em modalidades, a uma ou mais subsequências de ORF1 de Anellovirus compreendem uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos de CTD da Tabela D1 (por exemplo, aminoácidos 513 – 680 da Tabela D1). Em modalidades, a uma ou mais subsequências de ORF1 de Anellovirus compreendem uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos de CTD da Tabela D2.
[001547] Em modalidades, a uma ou mais subsequências de ORF1 de Anellovirus compreendem uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos da região rica em Arg da Tabela D3 (por exemplo, aminoácidos 1 – 66 da Tabela D3). Em modalidades, a uma ou mais subsequências de ORF1 de Anellovirus compreendem uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos da região rica em Arg da Tabela D4. Em modalidades, a uma ou mais subsequências de ORF1 de Anellovirus compreendem uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos da região jelly-roll da Tabela D3 (por exemplo, aminoácidos 67 – 277 da Tabela D3). Em modalidades, a uma ou mais subsequências de ORF1 de Anellovirus compreendem uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos da região jelly-roll da Tabela D4. Em modalidades, a uma ou mais subsequências de ORF1 de Anellovirus compreendem uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos de HVR da Tabela D3 (por exemplo, aminoácidos 278 – 347 da Tabela D3). Em modalidades, a uma ou mais subsequências de ORF1 de Anellovirus compreendem uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos de HVR da Tabela D4. Em modalidades, a uma ou mais subsequências de ORF1 de Anellovirus compreendem uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos do domínio N22 da Tabela D3 (por exemplo, aminoácidos 348 – 513 da Tabela D3). Em modalidades, a uma ou mais subsequências de ORF1 de Anellovirus compreendem uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos do domínio N22 da Tabela D4. Em modalidades, a uma ou mais subsequências de ORF1 de Anellovirus compreendem uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos de CTD da Tabela D3 (por exemplo, aminoácidos 513 – 680 da Tabela D3). Em modalidades, a uma ou mais subsequências de ORF1 de Anellovirus compreendem uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos de CTD da Tabela D4.
[001548] Em modalidades, a uma ou mais subsequências de ORF1 de Anellovirus compreendem uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos da região rica em Arg da Tabela D5 (por exemplo, aminoácidos 1 – 66 da Tabela D5). Em modalidades, a uma ou mais subsequências de ORF1 de Anellovirus compreendem uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos da região rica em Arg da Tabela D6. Em modalidades, a uma ou mais subsequências de ORF1 de Anellovirus compreendem uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos da região jelly-roll da Tabela D5 (por exemplo, aminoácidos 67 – 277 da Tabela D5). Em modalidades, a uma ou mais subsequências de ORF1 de Anellovirus compreendem uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100%de identidade de sequências com a sequência de aminoácidos da região jelly-roll da Tabela D6. Em modalidades, a uma ou mais subsequências de ORF1 de Anellovirus compreendem uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos de HVR da Tabela D5 (por exemplo, aminoácidos 278 – 347 da Tabela D5). Em modalidades, a uma ou mais subsequências de ORF1 de Anellovirus compreendem uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos de HVR da Tabela D6. Em modalidades, a uma ou mais subsequências de ORF1 de Anellovirus compreendem uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos do domínio N22 da Tabela D5 (por exemplo, aminoácidos 348 – 513 da Tabela D5). Em modalidades, a uma ou mais subsequências de ORF1 de Anellovirus compreendem uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos do domínio N22 da Tabela D6. Em modalidades, a uma ou mais subsequências de ORF1 de Anellovirus compreendem uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos de CTD da Tabela D5 (por exemplo, aminoácidos 513 – 680 da Tabela D5). Em modalidades, a uma ou mais subsequências de ORF1 de Anellovirus compreendem uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos de CTD da Tabela D6.
[001549] Em modalidades, a uma ou mais subsequências de ORF1 de Anellovirus compreendem uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos da região rica em Arg da Tabela D7 (por exemplo, aminoácidos 1 – 57 da Tabela D7). Em modalidades, a uma ou mais subsequências de ORF1 de Anellovirus compreendem uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos da região rica em Arg da Tabela D8. Em modalidades, a uma ou mais subsequências de ORF1 de Anellovirus compreendem uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos da região jelly-roll da Tabela D7 (por exemplo, aminoácidos 58 – 259 da Tabela D7). Em modalidades, a uma ou mais subsequências de ORF1 de Anellovirus compreendem uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos da região jelly-roll da Tabela D8. Em modalidades, a uma ou mais subsequências de ORF1 de Anellovirus compreendem uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos de HVR da Tabela D7 (por exemplo, aminoácidos 260 – 351 da Tabela D7). Em modalidades, a uma ou mais subsequências de ORF1 de Anellovirus compreendem uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos de HVR da Tabela D8. Em modalidades, a uma ou mais subsequências de ORF1 de Anellovirus compreendem uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos do domínio N22 da Tabela D7 (por exemplo, aminoácidos 352 – 510 da Tabela D7). Em modalidades, a uma ou mais subsequências de ORF1 de Anellovirus compreendem uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos do domínio N22 da Tabela D8. Em modalidades, a uma ou mais subsequências de ORF1 de Anellovirus compreendem uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos de CTD da Tabela D7 (por exemplo, aminoácidos 511 – 673 da Tabela D7). Em modalidades, a uma ou mais subsequências de ORF1 de Anellovirus compreendem uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos de CTD da Tabela D8.
[001550] Em modalidades, a uma ou mais subsequências de ORF1 de Anellovirus compreendem uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos da região rica em Arg da Tabela D9 (por exemplo, aminoácidos 1 – 57 da Tabela D9). Em modalidades, a uma ou mais subsequências de ORF1 de Anellovirus compreendem uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos da região rica em Arg da Tabela D10. Em modalidades, a uma ou mais subsequências de ORF1 de Anellovirus compreendem uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos da região jelly-roll da Tabela D9 (por exemplo, aminoácidos 58 – 259 da Tabela D9). Em modalidades, a uma ou mais subsequências de ORF1 de Anellovirus compreendem uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos da região jelly-roll da Tabela D10. Em modalidades, a uma ou mais subsequências de ORF1 de Anellovirus compreendem uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos de HVR da Tabela D9 (por exemplo, aminoácidos 260 – 351 da Tabela D9). Em modalidades, a uma ou mais subsequências de ORF1 de Anellovirus compreendem uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos de HVR da Tabela D10. Em modalidades, a uma ou mais subsequências de ORF1 de Anellovirus compreendem uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos do domínio N22 da Tabela D9 (por exemplo, aminoácidos 352 – 510 da Tabela D9). Em modalidades, a uma ou mais subsequências de ORF1 de Anellovirus compreendem uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos do domínio N22 da Tabela D10. Em modalidades, a uma ou mais subsequências de ORF1 de Anellovirus compreendem uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos de CTD da Tabela D9 (por exemplo, aminoácidos 511 – 673 da Tabela D9). Em modalidades, a uma ou mais subsequências de ORF1 de Anellovirus compreendem uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de aminoácidos de CTD da Tabela D10. Tabela 20. Subsequências de aminoácidos de ORF1 de Anellovirus exemplificativas (Alphatorquevirus, Clado 1) Nome CT30F Gênero/Clado Alphatorquevirus, Clado 1 Número de Acesso da Estirpe AB064597.1 Número de Acesso da Proteína ANQ39351.1 Sequência Total: 680 AA 1 10 20 30 40 50 | | | | | |
TAWWWGRWRRRWRRRRPWRPRLRRRRARRAFPRRRRRRFVSRRWRRPYRR RRRRGRRRRRRRRRHKPTLVLRQWQPDVIRHCKITGRMPLIICGKGSTQF NYITHADDITPRGASYGGNFTNMTFSLEAIYEQFLYHRNRWSASNHDLEL CRYKGTTLKLYRHPDVDYIVTYSRTGPFEISHMTYLSTHPLLMLLNKHHI VVPSLKTKPRGRKAIKVRIRPPKLMNNKWYFTRDFCNIGLFQLWATGLEL RNPWLRMSTLSPCIGFNVLKNSIYTNLSNLPQHREDRLNIINNTLHPHDI TGPNNKKWQYTYTKLMAPIYYSANRASTYDLLREYGLYSPYYLNPTRINL DWMTPYTHVRYNPLVDKGFGNRIYIQWCSEADVSYNRTKSKCLLQDMPLF FMCYGYIDWAIKNTGVSSLARDARICIRCPYTEPQLVGSTEDIGFVPITE TFMRGDMPVLAPYIPLSWFCKWYPNIAHQKEVLEAIISCSPFMPRDQGMN GWDITIGYKMDFLWGGSPLPSQPIDDPCQQGTHPIPDPDKHPRLLQVSNP KLLGPRTVFHKWDIRRGQFSKRSIKRVSEYSSDDESLAPGLPSKRNKLDS
AFRGENPEQKECYSLLKALEEEETPEEEEPAPQEKAQKEELLHQLQLQRR HQRVLRRGLKLVFTDILRLRQGVHWNPELT (SEQ ID NO: 173) Anotações: Domínio Putativo Gama de AA Região Rica em Arg 1 – 66 Domínio jelly-roll 67 - 277 Região Hipervariável 278 - 347 N22 348 – 513 Domínio C-terminal 513 - 680
Tabela 21. Subsequências de aminoácidos de ORF1 de Anellovirus exemplificativas (Alphatorquevirus, Clado 1) TTV-CT30F-ORF1 (Clado 1 de Alphatorquevirus) Região Rica TAWWWGRWRRRWRRRRPWRPRLRRRRARRAFPRRRRRRFVSRR em Arg WRRPYRRRRRRGRRRRRRRRRHK (SEQ ID NO: 174) Domínio Jelly- PTLVLRQWQPDVIRHCKITGRMPLIICGKGSTQFNYITHADDITPRGAS roll YGGNFTNMTFSLEAIYEQFLYHRNRWSASNHDLELCRYKGTTLKLYRH
PDVDYIVTYSRTGPFEISHMTYLSTHPLLMLLNKHHIVVPSLKTKPRGR
KAIKVRIRPPKLMNNKWYFTRDFCNIGLFQLWATGLELRNPWLRMSTL SPCIGFNVLKNSIYTNL (SEQ ID NO: 175) Domínio SNLPQHREDRLNIINNTLHPHDITGPNNKKWQYTYTKLMAPIYYSANRA hipervariável STYDLLREYGLYSPYYLNPTR (SEQ ID NO: 176) N22 INLDWMTPYTHVRYNPLVDKGFGNRIYIQWCSEADVSYNRTKSKCLLQ
DMPLFFMCYGYIDWAIKNTGVSSLARDARICIRCPYTEPQLVGSTEDIG
FVPITETFMRGDMPVLAPYIPLSWFCKWYPNIAHQKEVLEAIISCSPFM PRDQGMNGWDITIGYKMDFL (SEQ ID NO: 177) domínio C- WGGSPLPSQPIDDPCQQGTHPIPDPDKHPRLLQVSNPKLLGPRTVFH terminal KWDIRRGQFSKRSIKRVSEYSSDDESLAPGLPSKRNKLDSAFRGENPE
QKECYSLLKALEEEETPEEEEPAPQEKAQKEELLHQLQLQRRHQRVL RRGLKLVFTDILRLRQGVHWNPELT (SEQ ID NO: 178) Tabela 22. Subsequências de aminoácidos de ORF1 de Anellovirus exemplificativas (Alphatorquevirus, Clado 2) Nome TTV-P13-1 Gênero/Clado Alphatorquevirus, Clado 2 Número de Acesso KT163896.1 Número de Acesso da Proteína ANQ39351.1 Sequência Total: 747 AA 1 10 20 30 40 50 | | | | | |
MAYWWGRRRRWRRWRRRRRPLRRRRRWRRRRRWPRRRRWRRRRRRARPAR RYRRRRGRRRVRRRRRPQKLVLTQWNPQTVRKCVIRGFLPLFFCGQGAYH RNFTDHYDDVFPKGPSGGGHGSMVFNLSFLYQEFKKHHNKWSRSNLDFDL VRYKGTVIKLYRHQDFDYIVWISRTPPFQESLLTVMTHQPSVMLQAKKCI IVKSYRTHPGGKPYVTAKVRPPRLLTDKWYFQSDFCNVPLFSLQFALAEL RFPICSPQTDTNCINFLVLDDIYYKFLDNKPKQSSDPNDENRIKFWHGLW STMRYLNTTYINTLFPGTDSLVAAKDTDNSVNKYPSTATKQPYKDSQYMQ NIWNTSKIHALYTWVAETNYKRLQAYYTQTYGGYQRQFFTGKQYWDYRVG MFSPAFLSPSRLNPQNPGAYTEVSYNPWTDEGTGNVVCLQYLTKETSDYK PGGGSKFCIEGVPLWAALVGYVDMCKKEGKDPGIRLNCLLLVKCPYTKPQ LYDKKNPEKLFVPYSYNFGHGKMPGGDKYIPIEFKDRWYPCLLHQEEWIE DIVRSGPFVPKDMPSSVTCMMRYSSLFNWGGNIIQEQAVEDPCKKGTFVV PGTSGIARILQVSNPAKQTPTTTWHSWDWRRSLFTETGLKRMREQQPYDE LSYTGPKKPKLSLPAGPAVPGAAVASSWWETKQVTSPDVSETETEAEAHQ
EEETEPEEGVQLQQLWEQQLLQKRQLGVVFQQLLRLRQGAEIHPGLV (SEQ ID NO: 179) Anotações: Domínio Putativo Gama de AA Região Rica em Arg 1 – 69 Domínio jelly-roll 70 - 279 Região Hipervariável 280 - 411 N22 412 – 578 Domínio C-terminal 579 - 747 Tabela 23. Subsequências de aminoácidos de ORF1 de Anellovirus exemplificativas (Alphatorquevirus, Clado 2) TTV-P13-1-ORF1 (Clado 2 de Alphatorquevirus) Região Rica MAYWWGRRRRWRRWRRRRRPLRRRRRWRRRRRWPRRRRWRRR em Arg RRRARPARRYRRRRGRRRVRRRRRPQK (SEQ ID NO: 180) Domínio Jelly- LVLTQWNPQTVRKCVIRGFLPLFFCGQGAYHRNFTDHYDDVFPKGPS roll GGGHGSMVFNLSFLYQEFKKHHNKWSRSNLDFDLVRYKGTVIKLYRH
QDFDYIVWISRTPPFQESLLTVMTHQPSVMLQAKKCIIVKSYRTHPGGK
PYVTAKVRPPRLLTDKWYFQSDFCNVPLFSLQFALAELRFPICSPQTD TNCINFLVLDDIYYKFLDN (SEQ ID NO: 181) Domínio KPKQSSDPNDENRIKFWHGLWSTMRYLNTTYINTLFPGTDSLVAAKDT hipervariável DNSVNKYPSTATKQPYKDSQYMQNIWNTSKIHALYTWVAETNYKRLQ AYYTQTYGGYQRQFFTGKQYWDYRVGMFSPAFLSPSR (SEQ ID NO: 182) N22 LNPQNPGAYTEVSYNPWTDEGTGNVVCLQYLTKETSDYKPGGGSKF
CIEGVPLWAALVGYVDMCKKEGKDPGIRLNCLLLVKCPYTKPQLYDKK
NPEKLFVPYSYNFGHGKMPGGDKYIPIEFKDRWYPCLLHQEEWIEDIV RSGPFVPKDMPSSVTCMMRYSSLFN (SEQ ID NO: 183) domínio C- WGGNIIQEQAVEDPCKKGTFVVPGTSGIARILQVSNPAKQTPTTTWHS terminal WDWRRSLFTETGLKRMREQQPYDELSYTGPKKPKLSLPAGPAVPGA
AVASSWWETKQVTSPDVSETETEAEAHQEEETEPEEGVQLQQLWEQ QLLQKRQLGVVFQQLLRLRQGAEIHPGLV (SEQ ID NO: 184)
Tabela 24. Subsequências de aminoácidos de ORF1 de Anellovirus exemplificativas (Alphatorquevirus, Clado 3) Nome TTV-tth8 Gênero/Clado Alphatorquevirus, Clado 3 Número de Acesso AJ620231.1 Número de Acesso da Proteína CAF05750.1 Sequência Total: 743 AA 1 10 20 30 40 50 | | | | | |
MAWGWWKRRRRWWFRKRWTRGRLRRRWPRSARRRPRRRRVRRRRRWRRGR RKTRTYRRRRRFRRRGRKAKLIIKLWQPAVIKRCRIKGYIPLIISGNGTF ATNFTSHINDRIMKGPFGGGHSTMRFSLYILFEEHLRHMNFWTRSNDNLE LTRYLGASVKIYRHPDQDFIVIYNRRTPLGGNIYTAPSLHPGNAILAKHK ILVPSLQTRPKGRKAIRLRIAPPTLFTDKWYFQKDIADLTLFNIMAVEAD LRFPFCSPQTDNTCISFQVLSSVYNNYLSINTFNNDNSDSKLKEFLNKAF PTTGTKGTSLNALNTFRTEGCISHPQLKKPNPQINKPLESQYFAPLDALW GDPIYYNDLNENKSLNDIIEKILIKNMITYHAKLREFPNSYQGNKAFCHL TGIYSPPYLNQGRISPEIFGLYTEIIYNPYTDKGTGNKVWMDPLTKENNI YKEGQSKCLLTDMPLWTLLFGYTDWCKKDTNNWDLPLNYRLVLICPYTFP KLYNEKVKDYGYIPYSYKFGAGQMPDGSNYIPFQFRAKWYPTVLHQQQVM EDISRSGPFAPKVEKPSTQLVMKYCFNFNWGGNPIIEQIVKDPSFQPTYE IPGTGNIPRRIQVIDPRVLGPHYSFRSWDMRRHTFSRASIKRVSEQQETS DLVFSGPKKPRVDIPKQETQEESSHSLQRESRPWETEEESETEALSQESQ
EVPFQQQLQQQYQEQLKLRQGIKVLFEQLIRTQQGVHVNPCLR (SEQ ID NO: 185) Anotações: Domínio Putativo Gama de AA Região Rica em Arg 1 – 68 Domínio jelly-roll 69 - 280 Região Hipervariável 281 - 413 N22 414 – 579 Domínio C-terminal 580 - 743
Tabela 25. Subsequências de aminoácidos de ORF1 de Anellovirus exemplificativas (Alphatorquevirus, Clado 3) TTV-tth8-ORF1 (Clado 3 de Alphatorquevirus) Região Rica MAWGWWKRRRRWWFRKRWTRGRLRRRWPRSARRRPRRRRVRRR em Arg RRWRRGRRKTRTYRRRRRFRRRGRK (SEQ ID NO: 186) Domínio Jelly- AKLIIKLWQPAVIKRCRIKGYIPLIISGNGTFATNFTSHINDRIMKGPFGG roll GHSTMRFSLYILFEEHLRHMNFWTRSNDNLELTRYLGASVKIYRHPDQ
DFIVIYNRRTPLGGNIYTAPSLHPGNAILAKHKILVPSLQTRPKGRKAIRL
RIAPPTLFTDKWYFQKDIADLTLFNIMAVEADLRFPFCSPQTDNTCISFQ VLSSVYNNYLSI (SEQ ID NO: 187) Domínio NTFNNDNSDSKLKEFLNKAFPTTGTKGTSLNALNTFRTEGCISHPQLK hipervariável KPNPQINKPLESQYFAPLDALWGDPIYYNDLNENKSLNDIIEKILIKNMIT YHAKLREFPNSYQGNKAFCHLTGIYSPPYLNQGR (SEQ ID NO: 188) N22 ISPEIFGLYTEIIYNPYTDKGTGNKVWMDPLTKENNIYKEGQSKCLLTD
MPLWTLLFGYTDWCKKDTNNWDLPLNYRLVLICPYTFPKLYNEKVKDY
GYIPYSYKFGAGQMPDGSNYIPFQFRAKWYPTVLHQQQVMEDISRSG PFAPKVEKPSTQLVMKYCFNFN (SEQ ID NO: 189) domínio C- WGGNPIIEQIVKDPSFQPTYEIPGTGNIPRRIQVIDPRVLGPHYSFRSW terminal DMRRHTFSRASIKRVSEQQETSDLVFSGPKKPRVDIPKQETQEESSHS
LQRESRPWETEEESETEALSQESQEVPFQQQLQQQYQEQLKLRQGIK VLFEQLIRTQQGVHVNPCLR (SEQ ID NO: 190) Tabela 26. Subsequências de aminoácidos de ORF1 de Anellovirus exemplificativas (Alphatorquevirus, Clado 4) Nome TTV-HD20a Gênero/Clado Alphatorquevirus, Clado 4 Número de Acesso FR751492.1 Número de Acesso da Proteína NA Sequência Total: 780 AA 1 10 20 30 40 50 | | | | | |
MAWWGWRRRWWRPKRRWRWRRARRRRRVPARRPRRAFRRYRTRTVRRRRR GRRRGYRRRYRLRRYARRRFRRKKIVLTQWNPQTTRKCIIRGMMPVLWAG MGTGGRNYAVRSDDYVVNKGFGGSFATETFSLKVLYDQFQRGFNRWSHTN EDLDLARYRGCRWTFYRHKDTDFIVYFTNNPPMKTNQFSAPLTTPGMLMR SKYKVLIPSFQTRPKGRKTVTVKIRPPKLFQDKWYTQQDLCSVPLVQLNV TAADFTHPFGSPLTETPCVEFQVLGDLYNTCLNIDLPQFSELGEITSAYS KPNSNNLKELYKELFTKATSGHYWQTFITNSMVRAHIDADKAKEAQRAST TPSYNNDPFPTIPVKSEFAQWKKKFTDTRDSPFLFATYHPEAIKDTIMKM RENNFKLETGPNDKYGDYTAQYQGNTHMLDYYLGFYSPIFLSDGRSNVEF FTAYRDIVYNPFLDKAQGNMVWFQYHTKTDNKFKKPECHWEIKDMPLWAL LNGYVDYLETQIQYGDLSKEGKVLIRCPYTKPALVDPRDDTAGYVVYNRN FGRGKWIDGGGYIPLHERTKWYVMLRYQTDVFHDIVTCGPWQYRDDNKNS QLVAKYRFSFIWGGNTVHSQVIRNPCKDNQVSGPRRQPRDIQVVDPQRIT PPWVLHSFDQRRGLFTETALRRLLQEPLPGEYAVSTLRTPLLFLPSEYQR
EDGAAESASGSPAKRPRIWSEESQTETISSEENPAETTRELLQRKLREQR ALQFQLQHFAVQLAKTQANLHVNPLLSFPQ (SEQ ID NO: 191) Anotações: Domínio Putativo Gama de AA Região Rica em Arg 1 – 74 Domínio jelly-roll 75 - 284 Região Hipervariável 285 - 445 N22 446 – 611 Domínio C-terminal 612 - 780 Tabela 27. Subsequências de aminoácidos de ORF1 de Anellovirus exemplificativas (Alphatorquevirus, Clado 4) TTV-HD20a-ORF1 (Clado 4 de Alphatorquevirus) Região Rica em MAWWGWRRRWWRPKRRWRWRRARRRRRVPARRPRRAFRRYRTRTVRRRRRGRR Arg RGYRRRYRLRRYARRRFRRKK (SEQ ID NO: 192) Domínio Jelly-roll IVLTQWNPQTTRKCIIRGMMPVLWAGMGTGGRNYAVRSDDYVVNKGFGGSFATETFS
LKVLYDQFQRGFNRWSHTNEDLDLARYRGCRWTFYRHKDTDFIVYFTNNPPMKTNQF
SAPLTTPGMLMRSKYKVLIPSFQTRPKGRKTVTVKIRPPKLFQDKWYTQQDLCSVPLVQ LNVTAADFTHPFGSPLTETPCVEFQVLGDLYNTCLNI (SEQ ID NO: 193) Domínio DLPQFSELGEITSAYSKPNSNNLKELYKELFTKATSGHYWQTFITNSMVRAHIDADKAK hipervariável EAQRASTTPSYNNDPFPTIPVKSEFAQWKKKFTDTRDSPFLFATYHPEAIKDTIMKMRE NNFKLETGPNDKYGDYTAQYQGNTHMLDYYLGFYSPIFLSDGR (SEQ ID NO: 194) N22 SNVEFFTAYRDIVYNPFLDKAQGNMVWFQYHTKTDNKFKKPECHWEIKDMPLWALLN
GYVDYLETQIQYGDLSKEGKVLIRCPYTKPALVDPRDDTAGYVVYNRNFGRGKWIDGG GYIPLHERTKWYVMLRYQTDVFHDIVTCGPWQYRDDNKNSQLVAKYRFSFI (SEQ ID NO: 195) domínio C- WGGNTVHSQVIRNPCKDNQVSGPRRQPRDIQVVDPQRITPPWVLHSFDQRRGLFTET terminal ALRRLLQEPLPGEYAVSTLRTPLLFLPSEYQREDGAAESASGSPAKRPRIWSEESQTET ISSEENPAETTRELLQRKLREQRALQFQLQHFAVQLAKTQANLHVNPLLSFPQ (SEQ ID NO: 196)
Tabela 28. Subsequências de aminoácidos de ORF1 de Anellovirus exemplificativas (Alphatorquevirus, Clado 5) Nome TTV-16 (TUS01) Gênero/Clado Alphatorquevirus, Clado 5 Número de Acesso AB017613.1 Número de Acesso da Proteína BAA82454.1 Sequência Total: 761 AA 1 10 20 30 40 50 | | | | | |
MAYWFRRWGWRPRRRWRRWRRRRRRLPRRRTRRAVRGLGRRRKPRVRRRR RTRRRTYRRGWRRRRYIRRGRRKKKLILTQWNPAIVKRCNIKGGLPIIIC GEPRAAFNYGYHMEDYTPQPFPFGGGMSTVTFSLKALYDQYLKHQNRWTF SNDQLDLARYRGCKLRFYRSPVCDFIVHYNLIPPLKMNQFTSPNTHPGLL MLSKHKIIIPSFQTRPGGRRFVKIRLNPPKLFEDKWYTQQDLCKVPLVSI TATAADLRYPFCSPQTNNPCTTFQVLRKNYNTVIGTSVKDQESTQDFENW LYKTDSHYQTFATEAQLGRIPAFNPDGTKNTKQQSWQDNWSKKNSPWTGN SGTYPQTTSEMYKIPYDSNFGFPTYRAQKDYILERRQCNFNYEVNNPVSK KVWPQPSTTTPTVDYYEYHCGWFSNIFIGPNRYNLQFQTAYVDTTYNPLM DKGKGNKIWFQYLSKKGTDYNEKQCYCTLEDMPLWAICFGYTDYVETQLG PNVDHETAGLIIMICPYTQPPMYDKNRPNWGYVVYDTNFGNGKMPSGSGQ VPVYWQCRWRPMLWFQQQVLNDISKTGPYAYRDEYKNVQLTLYYNFIFNW GGDMYYPQVVKNPCGDSGIVPGSGRFTREVQVVSPLSMGPAYIFHYFDSR RGFFSEKALKRMQQQQEFDESFTFKPKRPKLSTAAAEILQLEEDSTSGEG
KSPLQQEEKEVEVLQTPTVQLQLQRNIQEQLAIKQQLQFLLLQLLKTQSN LHLNPQFLSPS (SEQ ID NO: 197) Anotações: Domínio Putativo Gama de AA Região Rica em Arg 1 – 75 Domínio jelly-roll 75 - 284 Região Hipervariável 285 - 432 N22 433 – 599 Domínio C-terminal 600 - 780
Tabela 29. Subsequências de aminoácidos de ORF1 de Anellovirus exemplificativas (Alphatorquevirus, Clado 5) TTV-16(TUS01)-ORF1 (Clado 5 de Alphatorquevirus) Região Rica MAYWFRRWGWRPRRRWRRWRRRRRRLPRRRTRRAVRGLGRRRKP em Arg RVRRRRRTRRRTYRRGWRRRRYIRRGRRKKK (SEQ ID NO: 198) Domínio Jelly- LILTQWNPAIVKRCNIKGGLPIIICGEPRAAFNYGYHMEDYTPQPFPFGG roll GMSTVTFSLKALYDQYLKHQNRWTFSNDQLDLARYRGCKLRFYRSPV
CDFIVHYNLIPPLKMNQFTSPNTHPGLLMLSKHKIIIPSFQTRPGGRRFV
KIRLNPPKLFEDKWYTQQDLCKVPLVSITATAADLRYPFCSPQTNNPCT TFQVLRKNYNTVI (SEQ ID NO: 199) Domínio GTSVKDQESTQDFENWLYKTDSHYQTFATEAQLGRIPAFNPDGTKNT hipervariável KQQSWQDNWSKKNSPWTGNSGTYPQTTSEMYKIPYDSNFGFPTYRA
QKDYILERRQCNFNYEVNNPVSKKVWPQPSTTTPTVDYYEYHCGWFS NIFIGPNR (SEQ ID NO: 200) N22 YNLQFQTAYVDTTYNPLMDKGKGNKIWFQYLSKKGTDYNEKQCYCTL
EDMPLWAICFGYTDYVETQLGPNVDHETAGLIIMICPYTQPPMYDKNR
PNWGYVVYDTNFGNGKMPSGSGQVPVYWQCRWRPMLWFQQQVLN DISKTGPYAYRDEYKNVQLTLYYNFIFN (SEQ ID NO: 201) domínio C- WGGDMYYPQVVKNPCGDSGIVPGSGRFTREVQVVSPLSMGPAYIFHY terminal FDSRRGFFSEKALKRMQQQQEFDESFTFKPKRPKLSTAAAEILQLEED
STSGEGKSPLQQEEKEVEVLQTPTVQLQLQRNIQEQLAIKQQLQFLLL QLLKTQSNLHLNPQFLSPS (SEQ ID NO: 202) Tabela 30. Subsequências de aminoácidos de ORF1 de Anellovirus exemplificativas (Alphatorquevirus, Clado 6) Nome TTV-TJN02 Gênero/Clado Alphatorquevirus, Clado 6 Número de Acesso AB028669.1 Número de Acesso da Proteína BAA94878.1 Sequência Total: 746 AA 1 10 20 30 40 50 | | | | | |
MAWGWWRWRRRWPARRWRRRRRRRPVRRTRARRPARRYRRRRTVRTRRRR WGRRRYRRGWRRRTYVRKGRHRKKKKRLILRQWQPATRRRCTITGYLPIV FCGHTRGNKNYALHSDDYTPQGQPFGGALSTTSFSLKVLFDQHQRGLNKW SFPNDQLDLARYRGCKFIFYRTKQTDWVGQYDISEPYKLDKYSCPNYHPG NMIKAKHKFLIPSYDTNPRGRQKIIVKIPPPDLFVDKWYTQEDLCSVNLV SLAVSAASFLHPFGSPQTDNPCYTFQVLKEFYYQAIGFSASTQAMTSVLD TLYTQNSYWESNLTQFYVLNAKKGSDTTQPLTSNMPTREEFMAKKNTNYN WYTYKAASVKNKLHQMRQTYFEELTSKGPQTTKSEEGYSQHWTTPSTNAY EYHLGMFSAIFLAPDRPVPRFPCAYQDVTYNPLMDKGVGNHIWFQYNTKA DTQLIVTGGSCKAHIQDIPLWAAFYGYSDFIESELGPFVDAETVGLVCVI CPYTKPPMYNKTNPAMGYVFYDRNFGDGKWTDGRGKIEPYWQVRWRPEML FQETVMADLVQTGPFSYKDELKNSTLVCKYKFYFTWGGNMMFQQTIKNPC KTDGQPTDSSRHPRGIQVADPEQMGPRWVFHSFDWRRGYLSEKALKRLQE KPLDYDEYFTQPKRPRIFPPTESAEGEFREPEKGSYSEEERSQASAEEQT
QEATVLLLKRRLREQQQLQQQLQFLTREMFKTQAGLHLNPMLLNQR (SEQ ID NO: 203) Anotações: Domínio Putativo Gama de AA Região Rica em Arg 1 – 77 Domínio jelly-roll 78 - 286 Região Hipervariável 287 - 416 N22 417 – 585 Domínio C-terminal 586 - 746 Tabela 31. Subsequências de aminoácidos de ORF1 de Anellovirus exemplificativas (Alphatorquevirus, Clado 6) TTV-TJN02-ORF1 (Clado 6 de Alphatorquevirus) Região Rica MAWGWWRWRRRWPARRWRRRRRRRPVRRTRARRPARRYRRRRTVRTRRRRWGR em Arg RRYRRGWRRRTYVRKGRHRKKKKR (SEQ ID NO: 204) Domínio Jelly- LILRQWQPATRRRCTITGYLPIVFCGHTRGNKNYALHSDDYTPQGQPFGGALSTTSFSL roll KVLFDQHQRGLNKWSFPNDQLDLARYRGCKFIFYRTKQTDWVGQYDISEPYKLDKYSC
PNYHPGNMIKAKHKFLIPSYDTNPRGRQKIIVKIPPPDLFVDKWYTQEDLCSVNLVSLAV SAASFLHPFGSPQTDNPCYTFQVLKEFYYQAI (SEQ ID NO: 205) Domínio GFSASTQAMTSVLDTLYTQNSYWESNLTQFYVLNAKKGSDTTQPLTSNMPTREEFMAK hipervariável KNTNYNWYTYKAASVKNKLHQMRQTYFEELTSKGPQTTKSEEGYSQHWTTPSTNAYE YHLGMFSAIFLAPDR (SEQ ID NO: 206) N22 PVPRFPCAYQDVTYNPLMDKGVGNHIWFQYNTKADTQLIVTGGSCKAHIQDIPLWAAF
YGYSDFIESELGPFVDAETVGLVCVICPYTKPPMYNKTNPAMGYVFYDRNFGDGKWTD GRGKIEPYWQVRWRPEMLFQETVMADLVQTGPFSYKDELKNSTLVCKYKFYFT (SEQ ID NO: 207) domínio C- WGGNMMFQQTIKNPCKTDGQPTDSSRHPRGIQVADPEQMGPRWVFHSFDWRRGYL terminal SEKALKRLQEKPLDYDEYFTQPKRPRIFPPTESAEGEFREPEKGSYSEEERSQASAEE QTQEATVLLLKRRLREQQQLQQQLQFLTREMFKTQAGLHLNPMLLNQR (SEQ ID NO: 208)
Tabela 32. Subsequências de aminoácidos de ORF1 de Anellovirus exemplificativas (Alphatorquevirus, Clado 7) Nome TTV-HD16d Gênero/Clado Alphatorquevirus, Clado 7 Número de Acesso FR751479.1 Número de Acesso da Proteína NA Sequência Total: 765 AA 1 10 20 30 40 50 | | | | | |
MAWSWWWQRWRRRRWKPRRRRWRRLRWRRPRRAVRRRRRGRRVRRRRWAR RRGRRRRYATRRKRRYRGRRFKKKLVLTQWHPNTMRRCLIKGIVPLVICG HTRWNYNYALHSKDYTEEGRYPHGGALSTTTWSLKVLYDEHLKHHDFWGY PNNQLDLARYKGAKFTFYRHKKTDFIIFFNRKPPFKLNKYSCASYHPGML MQQRHKILLPSYETKPKGRPKITVRIKPPTLLEDKWYTQQDLCDVNLLQL VVTAADFRHPLCSPQTNTPTTTFQVLKDIYYDTMSISEPTDSYTSVNNKS TTQTFTNYSNTLENILYTRASYWNSFHATEYLNPNIIYKNGEKLFKEHED LITWMTQTNNTGFLTKNNTAFGNNSYRPNADKIKKARKTYWNALIGTNDL ATNIGQARAERFEYHLGWYSPIFLSRHRSNMNFARAYQDVTYNPNCDRGV NNRVWVQPLTKPTTEFDEKRCKCVVQHLPLWAALYCYQDFVEEELGSSSE ILNSCLLVLQCPYTFPPMYDKKLPDKGFVFYDSLFGDGKMSDGRGQVDIF WQQRWYPRLATQMQVMHDITMTGPFSYRDELVSTQLTAKYTFDFMWGGNM ISTQIIKNPCKDSGLEPAYPGRQRRDLQIVDPYSMGPQFSFHNWDYRHGL FGQDAIDRVSKQPKDDADYPNPYKRPRYFPPTDQAAQEQEKDFSFLKTAP
SNSEESDQEVLQETQVLRFQPEQHKQLHLQLAERQRIGEQLRYLLQQMFK TQANLHLNPYTFTQL (SEQ ID NO: 209) Anotações: Domínio Putativo Gama de AA Região Rica em Arg 1 – 74 Domínio jelly-roll 75 - 286 Região Hipervariável 287 - 428 N22 429 – 595 Domínio C-terminal 596 - 765
Tabela 33. Subsequências de aminoácidos de ORF1 de Anellovirus exemplificativas (Alphatorquevirus, Clado 7) TTV-HD16d-ORF1 (Clado 7 de Alphatorquevirus) Região Rica em MAWSWWWQRWRRRRWKPRRRRWRRLRWRRPRRAVRRRRRGRRVRRRRWARRR Arg GRRRRYATRRKRRYRGRRFKKK (SEQ ID NO: 210) Domínio Jelly-roll LVLTQWHPNTMRRCLIKGIVPLVICGHTRWNYNYALHSKDYTEEGRYPHGGALSTTTW
SLKVLYDEHLKHHDFWGYPNNQLDLARYKGAKFTFYRHKKTDFIIFFNRKPPFKLNKYS
CASYHPGMLMQQRHKILLPSYETKPKGRPKITVRIKPPTLLEDKWYTQQDLCDVNLLQL VVTAADFRHPLCSPQTNTPTTTFQVLKDIYYDTMSI (SEQ ID NO: 211) Domínio SEPTDSYTSVNNKSTTQTFTNYSNTLENILYTRASYWNSFHATEYLNPNIIYKNGEKLFK hipervariável EHEDLITWMTQTNNTGFLTKNNTAFGNNSYRPNADKIKKARKTYWNALIGTNDLATNIG QARAERFEYHLGWYSPIFLSRHR (SEQ ID NO: 212) N22 SNMNFARAYQDVTYNPNCDRGVNNRVWVQPLTKPTTEFDEKRCKCVVQHLPLWAAL
YCYQDFVEEELGSSSEILNSCLLVLQCPYTFPPMYDKKLPDKGFVFYDSLFGDGKMSD GRGQVDIFWQQRWYPRLATQMQVMHDITMTGPFSYRDELVSTQLTAKYTFDFM (SEQ ID NO: 213) domínio C- WGGNMISTQIIKNPCKDSGLEPAYPGRQRRDLQIVDPYSMGPQFSFHNWDYRHGLFG terminal QDAIDRVSKQPKDDADYPNPYKRPRYFPPTDQAAQEQEKDFSFLKTAPSNSEESDQEV
LQETQVLRFQPEQHKQLHLQLAERQRIGEQLRYLLQQMFKTQANLHLNPYTFTQL (SEQ ID NO: 214) Tabela 34. Subsequência de aminoácidos de ORF1 de Anellovirus exemplificativa (Betatorquevirus) Nome TTMV-LY2 Gênero/Clado Betatorquevirus Número de Acesso JX134045.1 Número de Acesso da Proteína AGG91484.1 Sequência Total: 666 AA 1 10 20 30 40 50 | | | | | |
MPYYYRRRRYNYRRPRWYGRGWIRRPFRRRFRRKRRVRPTYTTIPLKQWQ PPYKRTCYIKGQDCLIYYSNLRLGMNSTMYEKSIVPVHWPGGGSFSVSML TLDALYDIHKLCRNWWTSTNQDLPLVRYKGCKITFYQSTFTDYIVRIHTE LPANSNKLTYPNTHPLMMMMSKYKHIIPSRQTRRKKKPYTKIFVKPPPQF ENKWYFATDLYKIPLLQIHCTACNLQNPFVKPDKLSNNVTLWSLNTISIQ NRNMSVDQGQSWPFKILGTQSFYFYFYTGANLPGDTTQIPVADLLPLTNP RINRPGQSLNEAKITDHITFTEYKNKFTNYWGNPFNKHIQEHLDMILYSL KSPEAIKNEWTTENMKWNQLNNAGTMALTPFNEPIFTQIQYNPDRDTGED TQLYLLSNATGTGWDPPGIPELILEGFPLWLIYWGFADFQKNLKKVTNID TNYMLVAKTKFTQKPGTFYLVILNDTFVEGNSPYEKQPLPEDNIKWYPQV QYQLEAQNKLLQTGPFTPNIQGQLSDNISMFYKFYFKWGGSPPKAINVEN PAHQIQYPIPRNEHETTSLQSPGEAPESILYSFDYRHGNYTTTALSRISQ
DWALKDTVSKITEPDRQQLLKQALECLQISEETQEKKEKEVQQLISNLRQ QQQLYRERIISLLKDQ (SEQ ID NO: 215) Anotações: Domínio Putativo Gama de AA Região Rica em Arg 1 – 38 Domínio jelly-roll 39 - 246 Região Hipervariável 247 - 374 N22 375 – 537 Domínio C-terminal 538 – 666 Tabela 35. Subsequência de aminoácidos de ORF1 de Anellovirus exemplificativa (Betatorquevirus) TTV-HD16d-ORF1 (Betatorquevirus) Região Rica MPYYYRRRRYNYRRPRWYGRGWIRRPFRRRFRRKRRVR (SEQ ID em Arg NO: 216) Domínio Jelly- PTYTTIPLKQWQPPYKRTCYIKGQDCLIYYSNLRLGMNSTMYEKSIVPV roll HWPGGGSFSVSMLTLDALYDIHKLCRNWWTSTNQDLPLVRYKGCKIT
FYQSTFTDYIVRIHTELPANSNKLTYPNTHPLMMMMSKYKHIIPSRQTR
RKKKPYTKIFVKPPPQFENKWYFATDLYKIPLLQIHCTACNLQNPFVKP DKLSNNVTLWSLNT (SEQ ID NO: 217) Domínio ISIQNRNMSVDQGQSWPFKILGTQSFYFYFYTGANLPGDTTQIPVADLL hipervariável PLTNPRINRPGQSLNEAKITDHITFTEYKNKFTNYWGNPFNKHIQEHLD MILYSLKSPEAIKNEWTTENMKWNQLNNAG (SEQ ID NO: 218) N22 TMALTPFNEPIFTQIQYNPDRDTGEDTQLYLLSNATGTGWDPPGIPELI
LEGFPLWLIYWGFADFQKNLKKVTNIDTNYMLVAKTKFTQKPGTFYLVI
LNDTFVEGNSPYEKQPLPEDNIKWYPQVQYQLEAQNKLLQTGPFTPNI QGQLSDNISMFYKFYFK (SEQ ID NO: 219) domínio C- WGGSPPKAINVENPAHQIQYPIPRNEHETTSLQSPGEAPESILYSFDYR terminal HGNYTTTALSRISQDWALKDTVSKITEPDRQQLLKQALECLQISEETQE KKEKEVQQLISNLRQQQQLYRERIISLLKDQ (SEQ ID NO: 220)
Tabela 36. Subsequência de aminoácidos de ORF1 de Anellovirus exemplificativa (Gammatorquevirus) Nome TTMDV-MD1-073 Gênero/Clado Gammatorquevirus Número de Acesso AB290918.1 Número de Acesso da Proteína BAG49427.1 Sequência Total: 673 AA 1 10 20 30 40 50 | | | | | |
MPFWWGRRNKFWYGRNYRRKKRRFPKRRKRRFYRRTKYRRPARRRRRRRR KVRRKKKTLIVRQWQPDSIVLCKIKGYDSIIWGAEGTQFQCSTHEMYEYT RQKYPGGGGFGVQLYSLEYLYDQWKLRNNIWTKTNQLKDLCRYLKCVMTF YRHQHIDFVIVYERQPPFEIDKLTYMKYHPYMLLQRKHKIILPSQTTNPR GKLKKKKTIKPPKQMLSKWFFQQQFAKYDLLLIAAAACSLRYPRIGCCNE NRMITLYCLNTKFYQDTEWGTTKQAPHYFKPYATINKSMIFVSNYGGKKT EYNIGQWIETDIPGEGNLARYYRSISKEGGYFSPKILQAYQTKVKSVDYK PLPIVLGRYNPAIDDGKGNKIYLQTIMNGHWGLPQKTPDYIIEEVPLWLG FWGYYNYLKQTRTEAIFPLHMFVVQSKYIQTQQTETPNNFWAFIDNSFIQ GKNPWDSVITYSEQKLWFPTVAWQLKTINAICESGPYVPKLDNQTYSTWE LATHYSFHFKWGGPQISDQPVEDPGNKNKYDVPDTIKEALQIVNPAKNIA ATMFHDWDYRRGCITSTAIKRMQQNLPTDSSLESDSDSEPAPKKKRLLPV
LHDPQKKTEKINQCLLSLCEESTCQEQETEENILKLIQQQQQQQQKLKHN LLVLIKDLKVKQRLLQLQTGVLE(SEQ ID NO: 221) Anotações: Domínio Putativo Gama de AA Região Rica em Arg 1 – 57 Domínio jelly-roll 58 – 259 Região Hipervariável 260 - 351 N22 352 – 510 Domínio C-terminal 511 – 673
Tabela 37. Subsequência de aminoácidos de ORF1 de Anellovirus exemplificativa (Gammatorquevirus) TTV-HD16d-ORF1 (Gammatorquevirus) Região Rica MPFWWGRRNKFWYGRNYRRKKRRFPKRRKRRFYRRTKYRRPARRR em Arg RRRRRKVRRKKK (SEQ ID NO: 222) Domínio Jelly- TLIVRQWQPDSIVLCKIKGYDSIIWGAEGTQFQCSTHEMYEYTRQKYP roll GGGGFGVQLYSLEYLYDQWKLRNNIWTKTNQLKDLCRYLKCVMTFYR
HQHIDFVIVYERQPPFEIDKLTYMKYHPYMLLQRKHKIILPSQTTNPRGK
LKKKKTIKPPKQMLSKWFFQQQFAKYDLLLIAAAACSLRYPRIGCCNEN RMITLYCL (SEQ ID NO: 223) Domínio NTKFYQDTEWGTTKQAPHYFKPYATINKSMIFVSNYGGKKTEYNIGQW hipervariável IETDIPGEGNLARYYRSISKEGGYFSPKILQAYQTKVKSVDYKP (SEQ ID NO: 224) N22 LPIVLGRYNPAIDDGKGNKIYLQTIMNGHWGLPQKTPDYIIEEVPLWLG
FWGYYNYLKQTRTEAIFPLHMFVVQSKYIQTQQTETPNNFWAFIDNSFI
QGKNPWDSVITYSEQKLWFPTVAWQLKTINAICESGPYVPKLDNQTYS TWELATHYSFHFK (SEQ ID NO: 225) domínio C- WGGPQISDQPVEDPGNKNKYDVPDTIKEALQIVNPAKNIAATMFHDWD terminal YRRGCITSTAIKRMQQNLPTDSSLESDSDSEPAPKKKRLLPVLHDPQK
KTEKINQCLLSLCEESTCQEQETEENILKLIQQQQQQQQKLKHNLLVLI KDLKVKQRLLQLQTGVLE (SEQ ID NO: 226) Tabela D1. Subsequência de aminoácidos de ORF1 de Anellovirus exemplificativa (Gammatorquevirus) Nome Ring 3.1 Gênero/Clado Gammatorquevirus Número de Acesso Número de Acesso da Proteína Sequência Total: 677 AA 1 10 20 30 40 50 | | | | | |
MPFWWRRRNKRWWGRRFRYRRYNKYKTRRRRRIPRRRNRRFTKTRRRRKR KKVRRKLKKITIKQWQPDSVKKCKIKGYSTLVMGAQGKQYNCYTNQASDY VQPKAPQGGGFGCEVFNLKWLYQEYTAHRNIWTKTNEYTDLCRYTGAQII LYRHPDVDFIVSWDNQPPFLLNKYTYPELQPQNLLLARRKRIILSQKSNP KGKLRIKLRIPPPKQMITKWFFQRDFCDVNLFKLCASAASFRYPGISHGA QSTIFSAYALNTDFYQCSDWCQTNTETGYLNIKTQQMPLWFHYREGGKEK WYKYTNKEHRPYTNTYLKSISYNDGLFSPKAMFAFEVKAGGEGTTEPPQG AQLIANLPLIALRYNPHEDTGHGNEIYLTSTFKGTYDKPKVTDALYFNNV PLWMGFYGYWDFILQETKNKGVFDQHMFVVKCPALRPISQVTKQVYYPLV DMDFCSGRLPFDEYLSKDIKSHWYPTAERQTVTINNFVTAGPYMPKFEPT DKDSTWQLNYHYKFFFKWGGPQVTDPTVEDPCSRNKYPVPDTMQQTIQIK NPEKLHPATLFHDWDLRRGFITQAAIKRMSENLQIDSSFESDGTESPKKK
KRCTKEIPTQNQKQEEIQECLLSLCEEPTCQEETEDLQLFIQQQQQQQYK LRKNLFKLLTHLKKGQRISQLQTGLLE (SEQ ID NO: 919) Anotações: Domínio Putativo Gama de AA Região Rica em Arg 1 – 59 Domínio jelly-roll 60 - 260 Região Hipervariável 261 - 356 N22 357 – 517 Domínio C-terminal 518 – 677 Tabela D2. Subsequência de aminoácidos de ORF1 de Anellovirus exemplificativa (Gammatorquevirus) Ring3.1 (Gammatorquevirus) Região Rica em MPFWWRRRNKRWWGRRFRYRRYNKYKTRRRRRIPRRRNRRFTKTRRRRKRKKVRR Arg KLKK (SEQ ID NO: 920) Domínio Jelly-roll ITIKQWQPDSVKKCKIKGYSTLVMGAQGKQYNCYTNQASDYVQPKAPQGGGFGCEVF
NLKWLYQEYTAHRNIWTKTNEYTDLCRYTGAQIILYRHPDVDFIVSWDNQPPFLLNKYT
YPELQPQNLLLARRKRIILSQKSNPKGKLRIKLRIPPPKQMITKWFFQRDFCDVNLFKLCA SAASFRYPGISHGAQSTIFSAYAL (SEQ ID NO: 921) Domínio NTDFYQCSDWCQTNTETGYLNIKTQQMPLWFHYREGGKEKWYKYTNKEHRPYTNTYL hipervariável KSISYNDGLFSPKAMFAFEVKAGGEGTTEPPQGAQLIAN (SEQ ID NO: 922) N22 LPLIALRYNPHEDTGHGNEIYLTSTFKGTYDKPKVTDALYFNNVPLWMGFYGYWDFILQ
ETKNKGVFDQHMFVVKCPALRPISQVTKQVYYPLVDMDFCSGRLPFDEYLSKDIKSHW YPTAERQTVTINNFVTAGPYMPKFEPTDKDSTWQLNYHYKFFFK (SEQ ID NO: 923) domínio C- WGGPQVTDPTVEDPCSRNKYPVPDTMQQTIQIKNPEKLHPATLFHDWDLRRGFITQAA terminal IKRMSENLQIDSSFESDGTESPKKKKRCTKEIPTQNQKQEEIQECLLSLCEEPTCQEETE DLQLFIQQQQQQQYKLRKNLFKLLTHLKKGQRISQLQTGLLE (SEQ ID NO: 924)
Tabela D3. Subsequência de aminoácidos de ORF1 de Anellovirus exemplificativa (Gammatorquevirus) Nome Ring 4.0 Gênero/Clado Gammatorquevirus Número de Acesso Número de Acesso da Proteína Sequência Total: 662 AA 1 10 20 30 40 50 | | | | | |
MPFWWRRRRKFWTNNRFNYTKRRRYRKRWPRRRRRRRPYRRPVRRRRRKL RKVKRKKKSLIVRQWQPDSIRTCKIIGQSAIVVGAEGKQMYCYTVNKLIN VPPKTPYGGGFGVDQYTLKYLYEEYRFAQNIWTQSNVLKDLCRYINVKLI FYRDNKTDFVLSYDRNPPFQLTKFTYPGAHPQQIMLQKHHKFILSQMTKP NGRLTKKLKIKPPKQMLSKWFFSKQFCKYPLLSLKASALDLRHSYLGCCN ENPQVFFYYLNHGYYTITNWGAQSSTAYRPNSKVTDTTYYRYKNDRKNIN IKSHEYEKSISYENGYFQSSFLQTQCIYTSERGEACIAEKPLGIAIYNPV KDNGDGNMIYLVSTLANTWDQPPKDSAILIQGVPIWLGLFGYLDYCRQIK ADKTWLDSHVLVIQSPAIFTYPNPGAGKWYCPLSQSFINGNGPFNQPPTL LQKAKWFPQIQYQQEIINSFVESGPFVPKYANQTESNWELKYKYVFTFKW GGPQFHEPEIADPSKQEQYDVPDTFYQTIQIEDPEGQDPRSLIHDWDYRR GFIKERSLKRMSTYFSTHTDQQATSEEDIPKKKKRIGPQLTVPQQKEEET
LSCLLSLCKKDTFQETETQEDLQQLIKQQQEQQLLLKRNILQLIHKLKEN QQMLQLHTGMLP (SEQ ID NO: 925) Anotações: Domínio Putativo Gama de AA Região Rica em Arg 1 – 58 Domínio jelly-roll 59 - 260 Região Hipervariável 261 - 339 N22 340 – 499 Domínio C-terminal 500 – 662
Tabela D4. Subsequência de aminoácidos de ORF1 de Anellovirus exemplificativa (Gammatorquevirus) Ring4.0 (Gammatorquevirus) Região Rica em MPFWWRRRRKFWTNNRFNYTKRRRYRKRWPRRRRRRRPYRRPVRRRRRKLRKVKR Arg KKK (SEQ ID NO: 926) Domínio Jelly-roll SLIVRQWQPDSIRTCKIIGQSAIVVGAEGKQMYCYTVNKLINVPPKTPYGGGFGVDQYTL
KYLYEEYRFAQNIWTQSNVLKDLCRYINVKLIFYRDNKTDFVLSYDRNPPFQLTKFTYPG
AHPQQIMLQKHHKFILSQMTKPNGRLTKKLKIKPPKQMLSKWFFSKQFCKYPLLSLKAS ALDLRHSYLGCCNENPQVFFYYL (SEQ ID NO: 927) Domínio NHGYYTITNWGAQSSTAYRPNSKVTDTTYYRYKNDRKNINIKSHEYEKSISYENGYFQS hipervariável SFLQTQCIYTSERGEACIAE (SEQ ID NO: 928) N22 KPLGIAIYNPVKDNGDGNMIYLVSTLANTWDQPPKDSAILIQGVPIWLGLFGYLDYCRQI
KADKTWLDSHVLVIQSPAIFTYPNPGAGKWYCPLSQSFINGNGPFNQPPTLLQKAKWF PQIQYQQEIINSFVESGPFVPKYANQTESNWELKYKYVFTFK (SEQ ID NO: 929) domínio C- WGGPQFHEPEIADPSKQEQYDVPDTFYQTIQIEDPEGQDPRSLIHDWDYRRGFIKERSL terminal KRMSTYFSTHTDQQATSEEDIPKKKKRIGPQLTVPQQKEEETLSCLLSLCKKDTFQETE TQEDLQQLIKQQQEQQLLLKRNILQLIHKLKENQQMLQLHTGMLP (SEQ ID NO: 930) Tabela D5. Subsequências de aminoácidos de ORF1 de Anellovirus exemplificativas (Alphatorquevirus) Clado 1 Nome Ring 5.2 Gênero/Clado Clado 1 de Alphatorquevirus Número de Acesso Número de Acesso da Proteína Sequência Total: 728 AA 1 10 20 30 40 50 | | | | | |
TAWWWGRWRRRWRRRRPYTTRLRRRRARRAFPRRRRRRFVSRRWRRPYRR RRRRGRRRRRRRRRHKPTLILRQWQPDCIRHCKITGWMPLIICGKGSTQF NYITHADDITPRGASYGGNFTNMTFSLEAIYEQFLYHRNRWSASNHDLEL CRYKGTTLKLYRHPEVDYIVTYSRTGPFEISHMTYLSTHPMLMLLNKHHI VVPSLKTKPRGRKAIKVRIRPPKLMNNKWYFTRDFCNIGLFQLWATGLEL RNPWLRMSTLSPCIGFNVLKNSIYTNLSNLPQYKNERLNIINNILHPQEI TGTNNKKWQYTYTKLMAPIYYSANRASTYDWENYSKETNYNNTYVKFTQK RQEKLTKIRKEWQMLYPQQPTALPDSYDLLQEYGLYSPYYLNPTRINLDW MTPYTHVRYNPLVDKGFGNRIYIQWCSEADVSYNRTKSKCLLQDMPLFFM CYGYIDWAIKNTGVSSLVKDARICIRCPYTEPQLVGSTEDIGFVPISETF MRGDMPVLAPYIPLSWFCKWYPNIAHQKEVLESIISCSPFMPRDQDMNGW DITIGYKMDFLWGGSPLPSQPIDDPCQQGTHPIPDPDKHPRLLQVSNPKL LGPRTVFHKWDIRRGQFSKRSIKRVSEYSSDDESLAPGLPSKRNKLDSAF
RGENREQKECYSLLKALEEEETPEEEEPAPQEKAQKEELLHQLQLQRRHQ RVLRRGLKLVFTDILRLRQGVHWNPELT (SEQ ID NO: 931) Anotações: Domínio Putativo Gama de AA Região Rica em Arg 1 – 66 Domínio jelly-roll 67 - 277 Região Hipervariável 278 - 395 N22 396 – 561 Domínio C-terminal 562 – 728 Tabela D6. Subsequências de aminoácidos de ORF1 de Anellovirus exemplificativas (Alphatorquevirus) Clado 1 Clado 1 de Ring5.2 (Alphatorquevirus) Região Rica em TAWWWGRWRRRWRRRRPYTTRLRRRRARRAFPRRRRRRFVSRRWRRPYRRRRRR Arg GRRRRRRRRRHK (SEQ ID NO: 932) Domínio Jelly-roll PTLILRQWQPDCIRHCKITGWMPLIICGKGSTQFNYITHADDITPRGASYGGNFTNMTFS
LEAIYEQFLYHRNRWSASNHDLELCRYKGTTLKLYRHPEVDYIVTYSRTGPFEISHMTYL
STHPMLMLLNKHHIVVPSLKTKPRGRKAIKVRIRPPKLMNNKWYFTRDFCNIGLFQLWA TGLELRNPWLRMSTLSPCIGFNVLKNSIYTNL (SEQ ID NO: 933) Domínio SNLPQYKNERLNIINNILHPQEITGTNNKKWQYTYTKLMAPIYYSANRASTYDWENYSKE hipervariável TNYNNTYVKFTQKRQEKLTKIRKEWQMLYPQQPTALPDSYDLLQEYGLYSPYYLNPTR (SEQ ID NO: 934) N22 INLDWMTPYTHVRYNPLVDKGFGNRIYIQWCSEADVSYNRTKSKCLLQDMPLFFMCYG
YIDWAIKNTGVSSLVKDARICIRCPYTEPQLVGSTEDIGFVPISETFMRGDMPVLAPYIPL SWFCKWYPNIAHQKEVLESIISCSPFMPRDQDMNGWDITIGYKMDFL (SEQ ID NO: 935) domínio C- WGGSPLPSQPIDDPCQQGTHPIPDPDKHPRLLQVSNPKLLGPRTVFHKWDIRRGQFSK terminal RSIKRVSEYSSDDESLAPGLPSKRNKLDSAFRGENREQKECYSLLKALEEEETPEEEEP APQEKAQKEELLHQLQLQRRHQRVLRRGLKLVFTDILRLRQGVHWNPELT (SEQ ID NO: 936)
Tabela D7. Subsequências de aminoácidos de ORF1 de Anellovirus exemplificativas (Alphatorquevirus) – Clado 3 Nome Ring6.0 Gênero/Clado Clado 3 de Alphatorquevirus Número de Acesso Número de Acesso da Proteína Sequência Total: 767 AA 1 10 20 30 40 50 | | | | | |
MAYGWWRRRRRRPWWRRRWRRWRRRRRPRRRRPRRRYRRRRTVRRRGRGR WTRAHRRWRRKGKRSRKKKIIIRQWQPNYTRRCNIVGYMPLLICGENTVA TNYATHSDDSYYPGPFGGGMTTDKFTLRILYDEYKRFMNYWTSSNEDLDL CRYLGCTLYVFRHPEVDFIIIINTSPPFLDTEITGPSIHPGMMALNKRSR WIPSIKNRPGRKHYIKIKVGAPRMFTDKWYPQTDLCDMTLLTIFASAADM QYPFGSPLTDTIVVSFQVLQSMYNDCLSVLPDNFAETSGKGTQLHENIIQ HLPYYNTTQTQAQFKRFIENMNATNGDNIWASYINTTKFSSANTPKNDTG IGGPYTTYSDSWYKGTVYNDKIKTIPIKASKLYYEQTKNLIGITFTGSTH RLHYCGGLYSSVWLSAGRSYFETKGPYTDITYNPFSDRGEGNMLWIDWLT KNDSVYSKTSSKCLIENLPLWASVYGYKEYCSKVTGDTNIEHNCRCVIRS PYTVPQLLDHNNPFRGYVPYSFNFGNGKMPGGSSLVPIRMRAKWYPTLFH QKEVLEAIAQAGPFAYHSDIKKVSLGIKYRFKWVWGGNPVSQQVVRNPCK TTQGSSGNRVPRSIQVVDPRYNTPELTIHAWDFRHGFFGRKAIKRMQEQP IPHDTFSAGFKRSRRDTEALQCSQEEQQKENLLFPVQQLKRVPPWETSQE
SQSEEENSQKQETLSQQLRDQLHKQRLMGEQLRSLLYQMQRVQQNQHINP MLLPKGLALTSISHNVI (SEQ ID NO: 937) Anotações: Domínio Putativo Gama de AA Região Rica em Arg 1 – 69 Domínio jelly-roll 70 - 269 Região Hipervariável 270 - 424 N22 425 – 584 Domínio C-terminal 585 – 767
Tabela D8. Subsequências de aminoácidos de ORF1 de Anellovirus exemplificativas (Alphatorquevirus) – Clado 3 Ring6.0 (Alphatorquevirus) Região Rica MAYGWWRRRRRRPWWRRRWRRWRRRRRPRRRRPRRRYRRRRTV em Arg RRRGRGRWTRAHRRWRRKGKRSRKKK (SEQ ID NO: 938) Domínio Jelly- IIIRQWQPNYTRRCNIVGYMPLLICGENTVATNYATHSDDSYYPGPFGG roll GMTTDKFTLRILYDEYKRFMNYWTSSNEDLDLCRYLGCTLYVFRHPEV
DFIIIINTSPPFLDTEITGPSIHPGMMALNKRSRWIPSIKNRPGRKHYIKIK
VGAPRMFTDKWYPQTDLCDMTLLTIFASAADMQYPFGSPLTDTIVVSF QVL (SEQ ID NO: 939) Domínio QSMYNDCLSVLPDNFAETSGKGTQLHENIIQHLPYYNTTQTQAQFKRF hipervariável IENMNATNGDNIWASYINTTKFSSANTPKNDTGIGGPYTTYSDSWYKG
TVYNDKIKTIPIKASKLYYEQTKNLIGITFTGSTHRLHYCGGLYSSVWLS AGRSYFETK (SEQ ID NO: 940) N22 GPYTDITYNPFSDRGEGNMLWIDWLTKNDSVYSKTSSKCLIENLPLWA
SVYGYKEYCSKVTGDTNIEHNCRCVIRSPYTVPQLLDHNNPFRGYVPY
SFNFGNGKMPGGSSLVPIRMRAKWYPTLFHQKEVLEAIAQAGPFAYH SDIKKVSLGIKYRFKWV (SEQ ID NO: 941) domínio C- WGGNPVSQQVVRNPCKTTQGSSGNRVPRSIQVVDPRYNTPELTIHA terminal WDFRHGFFGRKAIKRMQEQPIPHDTFSAGFKRSRRDTEALQCSQEEQ
QKENLLFPVQQLKRVPPWETSQESQSEEENSQKQETLSQQLRDQLH KQRLMGEQLRSLLYQMQRVQQNQHINPMLLPKGLALTSISHNVI (SEQ ID NO: 942) Tabela D9. Subsequências de aminoácidos de ORF1 de Anellovirus exemplificativas (Alphatorquevirus) – Clado 7 Nome Ring 7.0 Gênero/Clado Alphatorquevirus – Clado 7 Número de Acesso Número de Acesso da Proteína Sequência Total: 766 AA 1 10 20 30 40 50 | | | | | |
MAWRWWWQRRWRRRRWPRRRWRRLRRRRPRRPVRRRRRRTTVRRRRWRGR RGRRTYTRRAVRRRRRPRKRLVLTQWSPQTVRNCSIRGIVPMVICGHTKA GRNYAIHSEDFTTQIQPFGGSFSTTTWSLKVLWDEHQKFQNRWSYPNTQL DLARYRGVTFWFYRDQKTDYIVQWSRNPPFKLNKYSSAMYHPGMMMQAKR KLVVPSFQTRPKGKKRYRVTIKPPNMFADKWYTQEDLCPVPLVQIVVSAA SLLHPFCPPQTNNPCITFQVLKDIYDECIGVNETMKDKYKKLQTTLYTTC TYYQTTQVLAQLSPAFQPAMKPTTTQSAATATTLGNYVPELKYNNGSFHT GQNAVFGMCSYKPTDSIMTKANGWFWQNLMVDNNLHSSYGKATLECMEYH TGIYSSIFLSPQRSLEFPAAYQDVTYNPNCDRAVGNVVWFQYSTKMDTNF DETKCKCVLKNIPLWAAFNGYSDFIMQELSISTEIHNFGIVCFQCPYTFP PCFNKNKPLKGYVFYDTTFGNGKMPDGSGHVPIYWQQRWWIRLAFQVQVM HDFVLTGPFSYKDDLANTTLTARYKFKFKWGGNIIPEQIIKNPCHREQSL ASYPDRQRRDLQVVDPSTMGPIYTFHTWDWRRGLFGADAIQRVSQKPGDA LRFTNPFKRPRYLPPTDREDYRQEEDFALQEKRRRTSTEEAQDEESPPES
APLLQQQQQQRQLSVHLAEQQRLGVQLRYILQEVLKTQAGLHLNPLLLGP PQTRSISLSPPKAYSP (SEQ ID NO: 943) Anotações: Domínio Putativo Gama de AA Região Rica em Arg 1 – 70 Domínio jelly-roll 71 - 271 Região Hipervariável 272 - 418 N22 419 – 579 Domínio C-terminal 580 – 766 Tabela D10. Subsequências de aminoácidos de ORF1 de Anellovirus exemplificativas (Alphatorquevirus) – Clado 7 Ring7.0 (Alphatorquevirus) Região Rica em MAWRWWWQRRWRRRRWPRRRWRRLRRRRPRRPVRRRRRRTTVRRRRWRGRRG Arg RRTYTRRAVRRRRRPRKR (SEQ ID NO: 944) Domínio Jelly-roll LVLTQWSPQTVRNCSIRGIVPMVICGHTKAGRNYAIHSEDFTTQIQPFGGSFSTTTWSL
KVLWDEHQKFQNRWSYPNTQLDLARYRGVTFWFYRDQKTDYIVQWSRNPPFKLNKY
SSAMYHPGMMMQAKRKLVVPSFQTRPKGKKRYRVTIKPPNMFADKWYTQEDLCPVPL VQIVVSAASLLHPFCPPQTNNPCITFQVL (SEQ ID NO: 945) Domínio KDIYDECIGVNETMKDKYKKLQTTLYTTCTYYQTTQVLAQLSPAFQPAMKPTTTQSAAT hipervariável ATTLGNYVPELKYNNGSFHTGQNAVFGMCSYKPTDSIMTKANGWFWQNLMVDNNLH SSYGKATLECMEYHTGIYSSIFLSPQRSLEFP (SEQ ID NO: 946) N22 AAYQDVTYNPNCDRAVGNVVWFQYSTKMDTNFDETKCKCVLKNIPLWAAFNGYSDFI
MQELSISTEIHNFGIVCFQCPYTFPPCFNKNKPLKGYVFYDTTFGNGKMPDGSGHVPIY WQQRWWIRLAFQVQVMHDFVLTGPFSYKDDLANTTLTARYKFKFK (SEQ ID NO: 947) domínio C- WGGNIIPEQIIKNPCHREQSLASYPDRQRRDLQVVDPSTMGPIYTFHTWDWRRGLFGA terminal DAIQRVSQKPGDALRFTNPFKRPRYLPPTDREDYRQEEDFALQEKRRRTSTEEAQDEE
SPPESAPLLQQQQQQRQLSVHLAEQQRLGVQLRYILQEVLKTQAGLHLNPLLLGPPQT RSISLSPPKAYSP (SEQ ID NO: 948)
Sequências de Domínio de ORF1 de Consenso
[001551] Em algumas modalidades, uma molécula ORF1, por exemplo, como descrito no presente documento, compreende um ou mais de um domínio jelly-roll, domínio N22 e/ou domínio C-terminal (CTD). Em algumas modalidades, o domínio jelly-roll compreende uma sequência de aminoácidos possuindo uma sequência de consenso de domínio jelly-roll como descrito no presente documento (por exemplo, como listado em qualquer uma das Tabelas 37A-37C). Em algumas modalidades, o domínio N22 compreende uma sequência de aminoácidos possuindo uma sequência de consenso de domínio N22 como descrito no presente documento (por exemplo, como listado em qualquer uma das Tabelas 37A-37C). Em algumas modalidades, o domínio CTD compreende uma sequência de aminoácidos possuindo uma sequência de consenso de domínio CTD como descrito no presente documento (por exemplo, como listado em qualquer uma das Tabelas 37A-37C). Em algumas modalidades, os aminoácidos listados em qualquer uma das Tabelas 37A-37C no formato “(Xa-b)” compreendem uma série contígua de aminoácidos, na qual a série compreende pelo menos a, e no máximo b, aminoácidos. Em certas modalidades, todos os aminoácidos na série são idênticos. Em outras modalidades, a série compreende pelo menos dois (por exemplo, pelo menos 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20 ou 21) aminoácidos diferentes. Tabela 37A. Sequências de consenso de domínio de ORF1 de Alphatorquevirus Domínio Sequência SEQ ID NO: Jelly-Roll LVLTQWQPNTVRRCYIRGYLPLIICGEN(X0- 227 3)TTSRNYATHSDDTIQKGPFGGGMSTTTFSLRVLYDEYQR
FMNRWTYSNEDLDLARYLGCKFTFYRHPDXDFIVQYNTN PPFKDTKLTAPSIHP(X1- 5)GMLMLSKRKILIPSLKTRPKGKHYVKVRIGPPKLFEDKWY
Domínio Sequência SEQ ID NO:
TQSDLCDVPLVXLYATAADLQHPFGSPQTDNPCVTFQVLG SXYNKHLSISP; em que X = qualquer aminoácido. N22 SNFEFPGAYTDITYNPLTDKGVGNMVWIQYLTKPDTIXDKT 228 QS(X0- 3)KCLIEDLPLWAALYGYVDFCEKETGDSAIIXNXGRVLIRC PYTKPPLYDKT(X0- 4)NKGFVPYSTNFGNGKMPGGSGYVPIYWRARWYPTLFH QKEVLEDIVQSGPFAYKDEKPSTQLVMKYCFNFN; em que X = qualquer aminoácido. CTD WGGNPISQQVVRNPCKDSG(X0- 229 3)SGXGRQPRSVQVVDPKYMGPEYTFHSWDWRRGLFGE KAIKRMSEQPTDDEIFTGGXPKRPRRDPPTXQXPEE(X1- 4)QKESSSFR(X2-14)PWESSSQEXESESQEEEE(X0- 30)EQTVQQQLRQQLREQRRLRVQLQLLFQQLLKT(X0- 4)QAGLHINPLLLSQA(X0-40)*; em que X = qualquer aminoácido.
Tabela 37B. Sequências de consenso de domínio de ORF1 de Betatorquevirus Domínio Sequência SEQ ID NO: Jelly-Roll LKQWQPSTIRKCKIKGYLPLFQCGKGRISNNYTQYKESIVPHH 230
EPGGGGWSIQQFTLGALYEEHLKLRNWWTKSNDGLPLVRYL
GCTIKLYRSEDTDYIVTYQRCYPMTATKLTYLSTQPSRMLMNK HKIIVPSKXT(X1- 4)NKKKKPYKKIFIKPPSQMQNKWYFQQDIANTPLLQLTXTACS LDRMYLSSDSISNNITFTSLNTNFFQNPNFQ; em que X = qualquer aminoácido. N22 (X4-10)TPLYFECRYNPFKDKGTGNKVYLVSNN(X1- 231 8)TGWDPPTDPDLIIEGFPLWLLLWGWLDWQKKLGKIQNIDTDY ILVIQSXYYIPP(X1-3)KLPYYVPLDXD(X0-2)FLHGRSPY(X3- 16)PSDKQHWHPKVRFQXETINNIALTGPGTPKLPNQKSIQAHM
Domínio Sequência SEQ ID NO: KYKFYFK; em que X = qualquer aminoácido. CTD WGGCPAPMETITDPCKQPKYPIPNNLLQTTSLQXPTTPIETYLY 232
KFDERRGLLTKKAAKRIKKDXTTETTLFTDTGXXTSTTLPTXXQ TETTQEEXTSEEE(X0- 5)ETLLQQLQQLRRKQKQLRXRILQLLQLLXLL(X0-26)*; em que X = qualquer aminoácido. Tabela 37C. Sequências de consenso de domínio de ORF1 de Gammatorquevirus Domínio Sequência SEQ ID NO: Jelly-Roll TIPLKQWQPESIRKCKIKGYGTLVLGAEGRQFYCYTNEKDEYTPPKAP 233
GGGGFGVELFSLEYLYEQWKARNNIWTKSNXYKDLCRYTGCKITFYR HPTTDFIVXYSRQPPFEIDKXTYMXXHPQXLLLRKHKKIILSKATNPKGK
LKKKIKIKPPKQMLNKWFFQKQFAXYGLVQLQAAACBLRYPRLGCCNE NRLITLYYLN; em que X = qualquer aminoácido. N22 LPIVVARYNPAXDTGKGNKXWLXSTLNGSXWAPPTTDKDLIIEGLPLWL 234
ALYGYWSYJKKVKKDKGILQSHMFVVKSPAIQPLXTATTQXTFYPXIDN
SFIQGKXPYDEPJTXNQKKLWYPTLEHQQETINAIVESGPYVPKLDNQK NSTWELXYXYTFYFK; em que X = qualquer aminoácido. CTD WGGPQIPDQPVEDPKXQGTYPVPDTXQQTIQIXNPLKQKPETMFHDW 235 DYRRGIITSTALKRMQENLETDSSFXSDSEETP(X0- 2)KKKKRLTXELPXPQEETEEIQSCLLSLCEESTCQEE(X1- 6)ENLQQLIHQQQQQQQQLKHNILKLLSDLKZKQRLLQLQTGILE(X1-10)*; em que X = qualquer aminoácido.
[001552] Em algumas modalidades, o domínio jelly-roll compreende uma sequência de aminoácidos de domínio jelly-roll como listado em qualquer uma das Tabelas 21, 23, 25, 27, 29, 31, 33, 35, D2, D4, D6, D8, D10, ou 37A-37C ou uma sequência de aminoácidos possuindo pelo menos 70%, 75%, 80%, 8%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a mesma. Em algumas modalidades, o domínio N22 compreende uma sequência de aminoácidos de domínio N22 como listado em qualquer uma das Tabelas 21, 23, 25, 27, 29, 31, 33, 35, D2, D4, D6, D8, D10, ou 37A-37C ou uma sequência de aminoácidos possuindo pelo menos 70%, 75%, 80%, 8%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a mesma. Em algumas modalidades, o domínio CTD compreende uma sequência de aminoácidos de domínio CTD como listado em qualquer uma das Tabelas 21, 23, 25, 27, 29, 31, 33, 35, D2, D4, D6, D8, D10, ou 37A-37C ou uma sequência de aminoácidos possuindo pelo menos 70%, 75%, 80%, 8%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a mesma. Moléculas ORF2
[001553] Em algumas modalidades, o anelossomo compreende uma molécula ORF2 e/ou um ácido nucleico codificando uma molécula ORF2. Geralmente, uma molécula ORF2 compreende um polipeptídeo possuindo as características estruturais e/ou atividade de uma proteína ORF2 de Anellovirus (por exemplo, uma proteína ORF2 de Anellovirus como descrito no presente documento, por exemplo, como listado em qualquer uma das Tabelas A2, A4, A6, A8, A10, A12, C1-C5, 2, 4, 6, 8, 10, 12, 14, 16 ou 18) ou um seu fragmento funcional. Em algumas modalidades, uma molécula ORF2 compreende uma sequência de aminoácidos possuindo pelo menos 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com uma sequência de proteína ORF2 de Anellovirus como mostrado em qualquer uma das Tabelas A2, A4, A6, A8, A10, A12, C1-C5, 2, 4, 6, 8, 10, 12, 14, 16, ou 18.
[001554] Em algumas modalidades, uma molécula ORF2 compreende uma sequência de aminoácidos possuindo pelo menos 75%, 80%, 85%,
90%, 95%, 96%, 97%, 98%, ou 99% de identidade de sequências com uma sequência de proteína ORF2 de Alphatorquevirus, Betatorquevirus ou Gammatorquevirus.
Em algumas modalidades, uma molécula ORF2 (por exemplo, uma molécula ORF2 possuindo pelo menos 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, ou 99% de identidade de sequências com uma proteína ORF2 de Alphatorquevirus) tem um comprimento de 250 ou menos aminoácidos (por exemplo, cerca de 150-200 aminoácidos). Em algumas modalidades, uma molécula ORF2 (por exemplo, uma molécula ORF2 possuindo pelo menos 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, ou 99% de identidade de sequências com uma proteína ORF2 de Betatorquevirus) tem um comprimento de cerca de 50-150 aminoácidos.
Em algumas modalidades, uma molécula ORF2 (por exemplo, uma molécula ORF2 possuindo pelo menos 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, ou 99% de identidade de sequências com uma proteína ORF2 de Gammatorquevirus) tem um comprimento de cerca de 100-200 aminoácidos (por exemplo, cerca de 100-150 aminoácidos). Em algumas modalidades, a molécula ORF2 compreende um motivo de hélice-volta-hélice (por exemplo, um motivo de hélice-volta-hélice compreendendo duas hélices alfa flanqueando uma região de volta). Em algumas modalidades, a molécula ORF2 não compreende a sequência de aminoácidos da proteína ORF2 do isolado de TTV TA278 ou isolado de TTV SANBAN.
Em algumas modalidades, uma molécula ORF2 tem atividade de proteína fosfatase.
Em algumas modalidades, uma molécula ORF2 compreende pelo menos uma diferença (por exemplo, uma mutação, modificação química ou alteração epigenética) em relação a uma proteína ORF2 de tipo selvagem, por exemplo, como descrito no presente documento (por exemplo, como mostrado em qualquer uma das Tabelas A2, A4, A6, A8, A10, A12, C1-C5, 2, 4, 6, 8, 10, 12, 14, 16, ou 18). Motivo de ORF2 Conservado
[001555] Em algumas modalidades, um polipeptídeo (por exemplo, uma molécula ORF2) descrito no presente documento compreende a sequência de aminoácidos [W/F]X7HX3CX1CX5H (SEQ ID NO: 949), em que Xn é uma sequência contígua de quaisquer n aminoácidos. Em modalidades, X7 indica uma sequência contígua de quaisquer sete aminoácidos. Em modalidades, X3 indica uma sequência contígua de quaisquer três aminoácidos. Em modalidades, X1 indica qualquer aminoácido único. Em modalidades, X5 indica uma sequência contígua de quaisquer cinco aminoácidos. Em algumas modalidades, o [W/F] pode ser triptofano ou fenilalanina. Em algumas modalidades, a [W/F]X7HX3CX1CX5H (SEQ ID NO: 949) está compreendida dentro do domínio N22 de uma molécula ORF2, por exemplo, como descrito no presente documento. Em algumas modalidades, um elemento genético descrito no presente documento compreende uma sequência de ácidos nucleicos (por exemplo, uma sequência de ácidos nucleicos codificando uma molécula ORF2, por exemplo, como descrito no presente documento) codificando a sequência de aminoácidos [W/F]X7HX3CX1CX5H (SEQ ID NO: 949), em que Xn é uma sequência contígua de quaisquer n aminoácidos. Elemento Genético
[001556] Em algumas modalidades, o anelossomo compreende um elemento genético. Em algumas modalidades o elemento genético tem uma ou mais das seguintes características: é substancialmente não integrante com um genoma da célula hospedeira, é um ácido nucleico epissomal, é um DNA de fita simples, é circular, tem cerca de 1 a 10 kb, existe dentro do núcleo da célula, pode ser ligado por proteínas endógenas, produz um efetor, tal como um polipeptídeo ou ácido nucleico (por exemplo, um RNA, iRNA, microRNA) que visa um gene, atividade ou função de uma célula hospedeira ou alvo. Em uma modalidade, o elemento genético é DNA substancialmente não integrante. Em algumas modalidades, o elemento genético compreende um sinal de empacotamento, por exemplo, uma sequência que se liga a uma proteína de capsídeo. Em algumas modalidades, fora da sequência de empacotamento ou de ligação ao capsídeo, o elemento genético tem menos do que 70%, 60%, 50%, 40%, 30%, 20%, 10%, 5% de identidade de sequências com uma sequência de ácidos nucleicos de Anellovirus de tipo selvagem, por exemplo, tem menos do que 70%, 60%, 50%, 40%, 30%, 20%, 10%, 5% de identidade de sequências com uma sequência de ácidos nucleicos de Anellovirus, por exemplo, como descrito no presente documento. Em algumas modalidades, fora da sequência de empacotamento ou de ligação ao capsídeo, o elemento genético tem menos do que 500 450, 400, 350, 300, 250, 200, 150, ou 100 nucleotídeos contíguos que são pelo menos 70%, 75%, 80%, 8%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% idênticos a uma sequência de ácidos nucleicos de Anellovirus. Em certas modalidades, o elemento genético é um DNA circular, de fita simples que compreende uma sequência promotora, uma sequência codificando um efetor terapêutico e uma proteína de ligação ao capsídeo.
[001557] Em algumas modalidades, o elemento genético tem pelo menos cerca de 70%, 75%, 80%, 8%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com uma sequência de ácidos nucleicos de Anellovirus, por exemplo, como descrito no presente documento (por exemplo, como descrito em qualquer uma das Tabelas A1, A3, A5, A7, A9, A11, B1-B5, 1, 3, 5, 7, 9, 11, 13, 15, ou 17), ou um seu fragmento, ou codifica uma sequência de aminoácidos possuindo pelo menos cerca de 70%, 75%, 80%, 8%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com uma sequência de aminoácidos de Anellovirus (por exemplo, como descrito em qualquer uma das Tabelas A2, A4, A6, A8, A10, A12, C1-C5, 2, 4, 6, 8, 10, 12, 14, 16, ou 18) ou um seu fragmento. Em modalidades, o elemento genético compreende uma sequência codificando um efetor (por exemplo, um efetor endógeno ou um efetor exógeno, por exemplo, uma carga útil), por exemplo, um efetor de polipeptídeo (por exemplo, uma proteína) ou efetor de ácido nucleico (por exemplo, um RNA não codificante, por exemplo, um miRNA, siRNA, mRNA, lncRNA, RNA, DNA, um RNA antissenso, gRNA).
[001558] Em algumas modalidades, o elemento genético tem um comprimento menor do que 20 kb (por exemplo, menor do que cerca de 19 kb, 18 kb, 17 kb, 16 kb, 15 kb, 14 kb, 13 kb, 12 kb, 11 kb, 10 kb, 9 kb, 8 kb, 7 kb, 6 kb, 5 kb, 4 kb, 3 kb, 2 kb, 1 kb ou menor). Em algumas modalidades, o elemento genético tem, independentemente ou ainda a, um comprimento maior do que 1000b (por exemplo, pelo menos cerca de 1,1 kb, 1,2 kb, 1,3 kb, 1,4 kb, 1,5 kb, 1,6 kb, 1,7 kb, 1,8 kb, 1,9 kb, 2 kb, 2,1 kb, 2,2 kb, 2,3 kb, 2,4 kb, 2,5 kb, 2,6 kb, 2,7 kb, 2,8 kb, 2,9 kb, 3 kb, 3,1 kb, 3,2 kb, 3,3 kb, 3,4 kb, 3,5 kb, 3,6 kb, 3,7 kb, 3,8 kb, 3,9 kb, 4 kb, 4,1 kb, 4,2 kb, 4,3 kb, 4,4 kb, 4,5 kb, 4,6 kb, 4,7 kb, 4,8 kb, 4,9 kb, 5 kb ou maior). Em algumas modalidades, o elemento genético tem um comprimento de cerca de 2,5-4,6, 2,8-4,0, 3,0-3,8 ou 3,2-3,7 kb. Em algumas modalidades, o elemento genético tem um comprimento de cerca de 1,5-2,0, 1,5-2,5, 1,5-3,0, 1,5-3,5, 1,5-3,8, 1,5-3,9, 1,5-4,0, 1,5- 4,5 ou 1,5-5,0 kb. Em algumas modalidades, o elemento genético tem um comprimento de cerca de 2,0-2,5, 2,0-3,0, 2,0-3,5, 2,0-3,8, 2,0-3,9, 2,0-4,0, 2,0-4,5 ou 2,0-5,0 kb. Em algumas modalidades, o elemento genético tem um comprimento de cerca de 2,5-3,0, 2,5-3,5, 2,5-3,8, 2,5- 3,9, 2,5-4,0, 2,5-4,5 ou 2,5-5,0 kb. Em algumas modalidades, o elemento genético tem um comprimento de cerca de 3,0-5,0, 3,5-5,0, 4,0-5,0 ou 4,5-5,0 kb. Em algumas modalidades, o elemento genético tem um comprimento de cerca de 1,5-2,0, 2,0-2,5, 2,5-3,0, 3,0-3,5, 3,1- 3,6, 3,2-3,7, 3,3-3,8, 3,4-3,9, 3,5-4,0, 4,0-4,5, ou 4,5-5,0 kb.
[001559] Em algumas modalidades, o elemento genético compreende uma ou mais das características descritas no presente documento, por exemplo, uma sequência codificando uma proteína substancialmente não patogênica, uma sequência de ligação à proteína, uma ou mais sequências codificando um ácido nucleico regulador, uma ou mais sequências reguladoras, uma ou mais sequências codificando uma proteína de replicação e outras sequências. Em algumas modalidades, a proteína substancialmente não patogênica compreende uma sequência de aminoácidos ou um seu fragmento funcional ou uma sequência possuindo pelo menos cerca de 60%, 65%, 70%, 75%, 80%, 85%, 90% 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com qualquer uma das sequências de aminoácidos descritas no presente documento, uma sequência de aminoácidos de Anellovirus, por exemplo, como listado em qualquer uma das Tabelas A2, A4, A6, A8, A10, A12, C1-C5, 2, 4, 6, 8, 10, 12, 14, 16, ou 18.
[001560] Em modalidades, o elemento genético foi produzido a partir de um DNA circular de fita dupla (por exemplo, produzido por circularização in vitro). Em algumas modalidades, o elemento genético foi produzido pela replicação de círculo rolante a partir do DNA circular de fita dupla. Em modalidades, a replicação de círculo rolante ocorre em uma célula (por exemplo, uma célula hospedeira, por exemplo, uma célula de mamífero, por exemplo, uma célula humana, por exemplo, uma célula HEK293T, uma célula A549 ou uma célula Jurkat). Em modalidades, o elemento genético pode ser amplificado exponencialmente por replicação de círculo rolante na célula. Em modalidades, o elemento genético pode ser amplificado linearmente por replicação de círculo rolante na célula. Em modalidades, o DNA circular de fita dupla ou elemento genético é capaz de originar pelo menos 2, 4, 8, 16, 32, 64, 128, 256, 518, 1024 ou mais vezes a quantidade original por replicação de círculo rolante na célula. Em modalidades, o DNA circular de fita dupla foi introduzido na célula, por exemplo, como descrito no presente documento.
[001561] Em algumas modalidades, o DNA circular de fita dupla e/ou o elemento genético não compreendem um ou mais elementos de plasmídeos bacterianos (por exemplo, uma origem de replicação bacteriana ou um marcador selecionável, por exemplo, um gene de resistência bacteriana). Em algumas modalidades, o DNA circular de fita dupla e/ou o elemento genético não compreendem um esqueleto de plasmídeo bacteriano.
[001562] Em uma modalidade, a invenção inclui um elemento genético compreendendo uma sequência de ácidos nucleicos (por exemplo, uma sequência de DNA) codificando (i) uma proteína exterior substancialmente não patogênica, (ii) uma sequência de ligação à proteína exterior que liga o elemento genético à proteína exterior substancialmente não patogênica e (iii) um ácido nucleico regulador. Em uma tal modalidade, o elemento genético pode compreender uma ou mais sequências com pelo menos cerca de60%, 70% 80%, 85%, 90% 95%, 96%, 97%, 98% e 99% identidade de sequências de nucleotídeos com qualquer uma das sequências de nucleotídeos com uma sequência viral nativa (por exemplo, uma sequência de Anellovirus nativa, por exemplo, como descrito no presente documento). Sequência de Ligação à Proteína
[001563] Uma estratégia usada por muitos vírus é que a proteína de capsídeo viral reconhece uma sequência de ligação à proteína específica em seu genoma. Por exemplo, em vírus com genomas não segmentados, tal como o vírus da levedura L-A, existe uma estrutura secundária (alça-tronco) e uma sequência específica na extremidade 5´ do genoma que são ambas usadas para ligar a proteína de capsídeo viral. No entanto, vírus com genomas segmentados, tais comoReoviridae,Orthomyxoviridae(gripe),BunyaviruseseArenaviruses, necessitam de empacotar cada um dos segmentos genômicos. Alguns vírus utilizam uma região de complementaridade dos segmentos para auxiliar o vírus na inclusão de uma de cada uma das moléculas genômicas. Outros vírus têm locais de ligação específicos para cada um dos diferentes segmentos. Ver, por exemplo, Curr Opin Struct Biol. Fev de 2010; 20 (1): 114–120; e Journal of Virology (2003), 77 (24), 13036-
13041.
[001564] Em algumas modalidades, o elemento genético codifica uma sequência de ligação à proteína que se liga à proteína substancialmente não patogênica. Em algumas modalidades, a sequência de ligação à proteína facilita o empacotamento do elemento genético no exterior proteináceo. Em algumas modalidades, a sequência de ligação à proteína se liga especificamente a uma região rica em arginina da proteína substancialmente não patogênica. Em algumas modalidades, o elemento genético compreende uma sequência de ligação à proteína como descrito no Exemplo 8. Em algumas modalidades, o elemento genético compreende uma sequência de ligação à proteína possuindo pelo menos 70%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com um domínio conservado 5´ UTR ou domínio rico em GC de uma sequência de Anellovirus (por exemplo, como mostrado em qualquer uma das Tabelas A1, A3, A5, A7, A9, A11, B1-B5, 1, 3, 5, 7, 9, 11, 13, 15, ou 17).
[001565] Em modalidades, a sequência de ligação à proteína tem pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de nucleotídeos do domínio conservado de 5´ UTR de Anellovirus da Tabela A1 (por exemplo, nucleotídeos 165 – 235 da sequência de ácidos nucleicos da Tabela A1). Em modalidades, a sequência de ligação à proteína tem pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de nucleotídeos rica em GC de Anellovirus da Tabela A1
(por exemplo, nucleotídeos 3620 – 3648 da sequência de ácidos nucleicos da Tabela A1). Em modalidades, a sequência de ligação à proteína tem pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de nucleotídeos do domínio conservado de 5´ UTR de Anellovirus da Tabela A3 (por exemplo, nucleotídeos 175 – 245 da sequência de ácidos nucleicos da Tabela A3). Em modalidades, a sequência de ligação à proteína tem pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de nucleotídeos do domínio conservado de 5´ UTR de Anellovirus da Tabela A5 (por exemplo, nucleotídeos 138 – 208 da sequência de ácidos nucleicos da Tabela A5). Em modalidades, a sequência de ligação à proteína tem pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de nucleotídeos do domínio conservado de 5´ UTR de Anellovirus da Tabela A7 (por exemplo, nucleotídeos 174 – 244 da sequência de ácidos nucleicos da Tabela A7). Em modalidades, a sequência de ligação à proteína tem pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de nucleotídeos rica em GC de Anellovirus da Tabela A7 (por exemplo, nucleotídeos 3720 – 3742 da sequência de ácidos nucleicos da Tabela A7). Em modalidades, a sequência de ligação à proteína tem pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de nucleotídeos do domínio conservado de 5´ UTR de Anellovirus da Tabela A9 (por exemplo, nucleotídeos 100 – 171 da sequência de ácidos nucleicos da Tabela A9). Em modalidades, a sequência de ligação à proteína tem pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de nucleotídeos do domínio conservado de 5´ UTR de Anellovirus da Tabela A11 (por exemplo, nucleotídeos 294 – 364 da sequência de ácidos nucleicos da Tabela A11). Em modalidades, a sequência de ligação à proteína tem pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de nucleotídeos rica em GC de Anellovirus da Tabela A1 (por exemplo, nucleotídeos 3844 – 3895 da sequência de ácidos nucleicos da Tabela A11).
[001566] Em modalidades, a sequência de ligação à proteína tem pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de nucleotídeos do domínio conservado de 5´ UTR de Anellovirus da Tabela 1 (por exemplo, nucleotídeos 177 – 247 da sequência de ácidos nucleicos da Tabela 1). Em modalidades, a sequência de ligação à proteína tem pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de nucleotídeos rica em GC de Anellovirus da Tabela 1 (por exemplo, nucleotídeos 3415 – 3570 da sequência de ácidos nucleicos da Tabela 1). Em modalidades, a sequência de ligação à proteína tem pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de nucleotídeos do domínio conservado de 5´ UTR de Anellovirus da Tabela 3 (por exemplo, nucleotídeos 204 – 273 da sequência de ácidos nucleicos da Tabela 3). Em modalidades, a sequência de ligação à proteína tem pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de nucleotídeos rica em GC de Anellovirus da Tabela 3 (por exemplo, nucleotídeos 3302 – 3541 da sequência de ácidos nucleicos da Tabela 3). Em modalidades, a sequência de ligação à proteína tem pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%,
99%, ou 100% de identidade de sequências com a sequência de nucleotídeos do domínio conservado de 5´ UTR de Anellovirus da Tabela 5 (por exemplo, nucleotídeos 170 – 240 da sequência de ácidos nucleicos da Tabela 5). Em modalidades, a sequência de ligação à proteína tem pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de nucleotídeos rica em GC de Anellovirus da Tabela 5 (por exemplo, nucleotídeos 3632 – 3753 da sequência de ácidos nucleicos da Tabela 5). Em modalidades, a sequência de ligação à proteína tem pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de nucleotídeos do domínio conservado de 5´ UTR de Anellovirus da Tabela 7 (por exemplo, nucleotídeos 170 – 238 da sequência de ácidos nucleicos da Tabela 7). Em modalidades, a sequência de ligação à proteína tem pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de nucleotídeos rica em GC de Anellovirus da Tabela 7 (por exemplo, nucleotídeos 3768 – 3878 da sequência de ácidos nucleicos da Tabela 7). Em modalidades, a sequência de ligação à proteína tem pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de nucleotídeos do domínio conservado de 5´ UTR de Anellovirus da Tabela 9 (por exemplo, nucleotídeos 170 – 240 da sequência de ácidos nucleicos da Tabela 9). Em modalidades, a sequência de ligação à proteína tem pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de nucleotídeos rica em GC de Anellovirus da Tabela 9 (por exemplo, nucleotídeos 3302 – 3541 da sequência de ácidos nucleicos da Tabela 9). Em modalidades, a sequência de ligação à proteína tem pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%,
99%, ou 100% de identidade de sequências com a sequência de nucleotídeos do domínio conservado de 5´ UTR de Anellovirus da Tabela 11 (por exemplo, nucleotídeos 174 – 244 da sequência de ácidos nucleicos da Tabela 11). Em modalidades, a sequência de ligação à proteína tem pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de nucleotídeos rica em GC de Anellovirus da Tabela 11 (por exemplo, nucleotídeos 3691 – 3794 da sequência de ácidos nucleicos da Tabela 11). Em modalidades, a sequência de ligação à proteína tem pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de nucleotídeos do domínio conservado de 5´ UTR de Anellovirus da Tabela 13 (por exemplo, nucleotídeos 170 – 240 da sequência de ácidos nucleicos da Tabela 13). Em modalidades, a sequência de ligação à proteína tem pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de nucleotídeos rica em GC de Anellovirus da Tabela 13 (por exemplo, nucleotídeos 3759 – 3866 da sequência de ácidos nucleicos da Tabela 13). Em modalidades, a sequência de ligação à proteína tem pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de nucleotídeos do domínio conservado de 5´ UTR de Anellovirus da Tabela 15 (por exemplo, nucleotídeos 323 – 393 da sequência de ácidos nucleicos da Tabela 15). Em modalidades, a sequência de ligação à proteína tem pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de nucleotídeos rica em GC de Anellovirus da Tabela 15 (por exemplo, nucleotídeos 2868 – 2929 da sequência de ácidos nucleicos da Tabela 15). Em modalidades, a sequência de ligação à proteína tem pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%,
99%, ou 100% de identidade de sequências com a sequência de nucleotídeos do domínio conservado de 5´ UTR de Anellovirus da Tabela 17 (por exemplo, nucleotídeos 117 – 187 da sequência de ácidos nucleicos da Tabela 17). Em modalidades, a sequência de ligação à proteína tem pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de nucleotídeos rica em GC de Anellovirus da Tabela 17 (por exemplo, nucleotídeos 3054 – 3172 da sequência de ácidos nucleicos da Tabela 17).
[001567] Em modalidades, a sequência de ligação à proteína tem pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de nucleotídeos do domínio conservado de 5´ UTR de Anellovirus da Tabela B1 (por exemplo, nucleotídeos 185-255 da sequência de ácidos nucleicos da Tabela B1). Em modalidades, a sequência de ligação à proteína tem pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de nucleotídeos rica em GC de Anellovirus da Tabela B1 (por exemplo, nucleotídeos 3141-3264 da sequência de ácidos nucleicos da Tabela B1). Em modalidades, a sequência de ligação à proteína tem pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de nucleotídeos do domínio conservado de 5´ UTR de Anellovirus da Tabela B2 (por exemplo, nucleotídeos 185-254 da sequência de ácidos nucleicos da Tabela B2). Em modalidades, a sequência de ligação à proteína tem pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de nucleotídeos rica em GC de Anellovirus da Tabela B2 (por exemplo, nucleotídeos 3076-3176 da sequência de ácidos nucleicos da Tabela B2). Em modalidades, a sequência de ligação à proteína tem pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de nucleotídeos do domínio conservado de 5´ UTR de Anellovirus da Tabela B3 (por exemplo, nucleotídeos 178-248 da sequência de ácidos nucleicos da Tabela B3). Em modalidades, a sequência de ligação à proteína tem pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de nucleotídeos rica em GC de Anellovirus da Tabela B3 (por exemplo, nucleotídeos 3555-3696 da sequência de ácidos nucleicos da Tabela B3). Em modalidades, a sequência de ligação à proteína tem pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de nucleotídeos do domínio conservado de 5´ UTR de Anellovirus da Tabela B4 (por exemplo, nucleotídeos 176-246 da sequência de ácidos nucleicos da Tabela B4). Em modalidades, a sequência de ligação à proteína tem pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de nucleotídeos rica em GC de Anellovirus da Tabela B4 (por exemplo, nucleotídeos 3720-3828 da sequência de ácidos nucleicos da Tabela B4). Em modalidades, a sequência de ligação à proteína tem pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de nucleotídeos do domínio conservado de 5´ UTR de Anellovirus da Tabela B5 (por exemplo, nucleotídeos 170-240 da sequência de ácidos nucleicos da Tabela B5). Em modalidades, a sequência de ligação à proteína tem pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de nucleotídeos rica em GC de Anellovirus da Tabela B5 (por exemplo, nucleotídeos 3716-3815 da sequência de ácidos nucleicos da Tabela B5).
Regiões 5´ UTR
[001568] Em algumas modalidades, o elemento genético (por exemplo, sequência de ligação à proteína do elemento genético) compreende uma sequência de ácidos nucleicos possuindo pelo menos cerca de 75% (por exemplo, pelo menos 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100%) de identidade com uma sequência de ácidos nucleicos mostrada na Tabela 38 e/ou Figura 20. Em algumas modalidades, o elemento genético (por exemplo, sequência de ligação à proteína do elemento genético) compreende uma sequência de ácidos nucleicos da sequência de 5´ UTR de Consenso mostrada na Tabela 38, em que X1, X2, X3, X4 e X5 são cada um independentemente qualquer nucleotídeo, por exemplo, em que X1 = G ou T, X2 = C ou A, X3 = G ou A, X4 = T ou C e X5 = A, C ou T. Em modalidades, o elemento genético (por exemplo, sequência de ligação à proteína do elemento genético) compreende uma sequência de ácidos nucleicos possuindo pelo menos cerca de 75% (por exemplo, pelo menos 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100%) de identidade com uma sequência de 5´ UTR de Consenso mostrada na Tabela 38. Em modalidades, o elemento genético (por exemplo, sequência de ligação à proteína do elemento genético) compreende uma sequência de ácidos nucleicos possuindo pelo menos cerca de 75% (por exemplo, pelo menos 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100%) de identidade com uma sequência de 5´ UTR de TTV exemplificativa mostrada na Tabela 38. Em modalidades, o elemento genético (por exemplo, sequência de ligação à proteína do elemento genético) compreende uma sequência de ácidos nucleicos possuindo pelo menos cerca de 75% (por exemplo, pelo menos 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100%) de identidade com uma sequência de 5´ UTR de TTV-CT30F mostrada na Tabela 38. Em modalidades, o elemento genético (por exemplo, sequência de ligação à proteína do elemento genético) compreende uma sequência de ácidos nucleicos possuindo pelo menos cerca de 75% (por exemplo, pelo menos 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100%) de identidade com uma sequência de 5´ UTR de TTV-HD23a mostrada na Tabela 38. Em modalidades, o elemento genético (por exemplo, sequência de ligação à proteína do elemento genético) compreende uma sequência de ácidos nucleicos possuindo pelo menos cerca de 75% (por exemplo, pelo menos 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100%) de identidade com uma sequência de 5´ UTR de TTV-JA20 mostrada na Tabela 38. Em modalidades, o elemento genético (por exemplo, sequência de ligação à proteína do elemento genético) compreende uma sequência de ácidos nucleicos possuindo pelo menos cerca de 75% (por exemplo, pelo menos 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100%) de identidade com uma sequência de 5´ UTR de TTV-TJN02 mostrada na Tabela 38. Em modalidades, o elemento genético (por exemplo, sequência de ligação à proteína do elemento genético) compreende uma sequência de ácidos nucleicos possuindo pelo menos cerca de 75% (por exemplo, pelo menos 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100%) de identidade com uma sequência de 5´ UTR de TTV-tth8 mostrada na Tabela 38.
[001569] Em modalidades, o elemento genético (por exemplo, sequência de ligação à proteína do elemento genético) compreende uma sequência de ácidos nucleicos possuindo pelo menos cerca de 75% (por exemplo, pelo menos 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100%) de identidade com uma sequência de 5´ UTR de Consenso de Alphatorquevirus mostrada na Tabela 38. Em modalidades, o elemento genético (por exemplo, sequência de ligação à proteína do elemento genético) compreende uma sequência de ácidos nucleicos possuindo pelo menos cerca de 75% (por exemplo, pelo menos 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100%) de identidade com uma sequência de 5´ UTR de Clado 1 de Alphatorquevirus mostrada na Tabela 38. Em modalidades, o elemento genético (por exemplo, sequência de ligação à proteína do elemento genético) compreende uma sequência de ácidos nucleicos possuindo pelo menos cerca de 75% (por exemplo, pelo menos 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100%) de identidade com uma sequência de 5´ UTR de Clado 2 de Alphatorquevirus mostrada na Tabela 38. Em modalidades, o elemento genético (por exemplo, sequência de ligação à proteína do elemento genético) compreende uma sequência de ácidos nucleicos possuindo pelo menos cerca de 75% (por exemplo, pelo menos 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100%) de identidade com uma sequência de 5´ UTR de Clado 3 de Alphatorquevirus mostrada na Tabela 38. Em modalidades, o elemento genético (por exemplo, sequência de ligação à proteína do elemento genético) compreende uma sequência de ácidos nucleicos possuindo pelo menos cerca de 75% (por exemplo, pelo menos 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100%) de identidade com uma sequência de 5´ UTR de Clado 4 de Alphatorquevirus mostrada na Tabela 38. Em modalidades, o elemento genético (por exemplo, sequência de ligação à proteína do elemento genético) compreende uma sequência de ácidos nucleicos possuindo pelo menos cerca de 75% (por exemplo, pelo menos 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100%) de identidade com uma sequência de 5´ UTR de Clado 5 de Alphatorquevirus mostrada na Tabela 38. Em modalidades, o elemento genético (por exemplo, sequência de ligação à proteína do elemento genético) compreende uma sequência de ácidos nucleicos possuindo pelo menos cerca de 75% (por exemplo, pelo menos 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100%) de identidade com uma sequência de 5´ UTR de Clado 6 de Alphatorquevirus mostrada na Tabela 38. Em modalidades, o elemento genético (por exemplo, sequência de ligação à proteína do elemento genético) compreende uma sequência de ácidos nucleicos possuindo pelo menos cerca de 75% (por exemplo, pelo menos 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100%) de identidade com uma sequência de 5´ UTR de Clado 7 de Alphatorquevirus mostrada na Tabela 38.
[001570] Em modalidades, o elemento genético compreende uma sequência de ácidos nucleicos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de nucleotídeos do domínio conservado de 5´ UTR de Anellovirus da Tabela A1 (por exemplo, nucleotídeos 165 – 235 da sequência de ácidos nucleicos da Tabela A1). Em modalidades, o elemento genético compreende uma sequência de ácidos nucleicos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de nucleotídeos do domínio conservado de 5´ UTR de Anellovirus da Tabela A3 (por exemplo, nucleotídeos 175 – 245 da sequência de ácidos nucleicos da Tabela A3). Em modalidades, o elemento genético compreende uma sequência de ácidos nucleicos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de nucleotídeos do domínio conservado de 5´ UTR de Anellovirus da Tabela A5 (por exemplo, nucleotídeos 138 – 208 da sequência de ácidos nucleicos da Tabela A5). Em modalidades, o elemento genético compreende uma sequência de ácidos nucleicos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de nucleotídeos do domínio conservado de 5´ UTR de Anellovirus da Tabela A7 (por exemplo, nucleotídeos 174 – 244 da sequência de ácidos nucleicos da Tabela A7). Em modalidades, o elemento genético compreende uma sequência de ácidos nucleicos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de nucleotídeos do domínio conservado de 5´ UTR de Anellovirus da Tabela A9 (por exemplo, nucleotídeos 100 – 171 da sequência de ácidos nucleicos da Tabela A9). Em modalidades, o elemento genético compreende uma sequência de ácidos nucleicos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de nucleotídeos do domínio conservado de 5´ UTR de Anellovirus da Tabela A11 (por exemplo, nucleotídeos 294 – 364 da sequência de ácidos nucleicos da Tabela A11).
[001571] Em modalidades, o elemento genético compreende uma sequência de ácidos nucleicos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de nucleotídeos do domínio conservado de 5´ UTR de Anellovirus da Tabela 1 (por exemplo, nucleotídeos 177 – 247 da sequência de ácidos nucleicos da Tabela 1). Em modalidades, o elemento genético compreende uma sequência de ácidos nucleicos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de nucleotídeos do domínio conservado de 5´ UTR de Anellovirus da Tabela 3 (por exemplo, nucleotídeos 204 – 273 da sequência de ácidos nucleicos da Tabela 3). Em modalidades, o elemento genético compreende uma sequência de ácidos nucleicos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de nucleotídeos do domínio conservado de 5´ UTR de Anellovirus da Tabela 5 (por exemplo, nucleotídeos 170 – 240 da sequência de ácidos nucleicos da Tabela 5). Em modalidades, o elemento genético compreende uma sequência de ácidos nucleicos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de nucleotídeos do domínio conservado de 5´ UTR de Anellovirus da Tabela 7 (por exemplo, nucleotídeos 170 – 238 da sequência de ácidos nucleicos da Tabela 7). Em modalidades, o elemento genético compreende uma sequência de ácidos nucleicos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de nucleotídeos do domínio conservado de 5´ UTR de Anellovirus da Tabela 9 (por exemplo, nucleotídeos 170 – 240 da sequência de ácidos nucleicos da Tabela 9). Em modalidades, o elemento genético compreende uma sequência de ácidos nucleicos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de nucleotídeos do domínio conservado de 5´ UTR de Anellovirus da Tabela 11 (por exemplo, nucleotídeos 174 – 244 da sequência de ácidos nucleicos da Tabela 11). Em modalidades, o elemento genético compreende uma sequência de ácidos nucleicos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de nucleotídeos do domínio conservado de 5´ UTR de Anellovirus da Tabela 13 (por exemplo, nucleotídeos 170 – 240 da sequência de ácidos nucleicos da Tabela 13). Em modalidades, o elemento genético compreende uma sequência de ácidos nucleicos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de nucleotídeos do domínio conservado de 5´ UTR de Anellovirus da Tabela 15 (por exemplo, nucleotídeos 323 – 393 da sequência de ácidos nucleicos da Tabela 15). Em modalidades, o elemento genético compreende uma sequência de ácidos nucleicos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de nucleotídeos do domínio conservado de 5´ UTR de Anellovirus da Tabela 17 (por exemplo, nucleotídeos 117 – 187 da sequência de ácidos nucleicos da Tabela 17).
[001572] Em modalidades, o elemento genético compreende uma sequência de ácidos nucleicos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de nucleotídeos do domínio conservado de 5´ UTR de Anellovirus da Tabela B1 (por exemplo, nucleotídeos 185-255 da sequência de ácidos nucleicos da Tabela B1). Em modalidades, o elemento genético compreende uma sequência de ácidos nucleicos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de nucleotídeos do domínio conservado de 5´ UTR de Anellovirus da Tabela B2 (por exemplo, nucleotídeos 185-254 da sequência de ácidos nucleicos da Tabela B2). Em modalidades, o elemento genético compreende uma sequência de ácidos nucleicos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de nucleotídeos do domínio conservado de 5´ UTR de Anellovirus da Tabela B3 (por exemplo, nucleotídeos 178-248 da sequência de ácidos nucleicos da Tabela B3). Em modalidades, o elemento genético compreende uma sequência de ácidos nucleicos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de nucleotídeos do domínio conservado de 5´ UTR de Anellovirus da Tabela B4 (por exemplo, nucleotídeos 176-246 da sequência de ácidos nucleicos da Tabela B4). Em modalidades, o elemento genético compreende uma sequência de ácidos nucleicos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de nucleotídeos do domínio conservado de 5´ UTR de Anellovirus da Tabela B5 (por exemplo, nucleotídeos 170-240 da sequência de ácidos nucleicos da Tabela B5). Tabela 38. Sequências de 5´ UTR exemplificativas de Anelloviruses Fonte Sequência SEQ ID NO: Consenso CGGGTGCCGX1AGGTGAGTTTACACACCGX2AGTCAAGGGGC 105 AATTCGGGCTCX3GGACTGGCCGGGCX4X5TGGG X1 = G ou T X2 = C ou A X3 = G ou A X4 = T ou C X5 = A, C ou T Sequência de TTV CGGGTGCCGGAGGTGAGTTTACACACCGCAGTCAAGGGGCA 106 Exemplificativa ATTCGGGCTCGGGACTGGCCGGGCTWTGGG TTV-CT30F CGGGTGCCGTAGGTGAGTTTACACACCGCAGTCAAGGGGCA 107
ATTCGGGCTCGGGACTGGCCGGGCTATGGG TTV-HD23a CGGGTGCCGGAGGTGAGTTTACACACCGCAGTCAAGGGGCA 108
ATTCGGGCTCGGGACTGGCCGGGCCCTGGG TTV-JA20 CGGGTGCCGGAGGTGAGTTTACACACCGCAGTCAAGGGGCA 109
ATTCGGGCTCGGGACTGGCCGGGCTTTGGG TTV-TJN02 CGGGTGCCGGAGGTGAGTTTACACACCGCAGTCAAGGGGCA 110
ATTCGGGCTCGGGACTGGCCGGGCTATGGG TTV-tth8 CGGGTGCCGGAGGTGAGTTTACACACCGAAGTCAAGGGGCA 111
ATTCGGGCTCAGGACTGGCCGGGCTTTGGG Alphatorquevirus CGGGTGCCGGAGGTGAGTTTACACACCGCAGTCAAGGGGCA 112 5´ UTR de Consenso ATTCGGGCTCGGGACTGGCCGGGC X1X2TGGG; em que X1 compreende T ou C, e em que X2 compreende A, C ou T. Alphatorquevirus CGGGTGCCGTAGGTGAGTTTACACACCGCAGTCAAGGGGCA 113 5´ UTR de Clado 1 (por ATTCGGGCTCGGGACTGGCCGGGCTATGGG exemplo, TTV-CT30F) Alphatorquevirus CGGGTGCCGGAGGTGAGTTTACACACCGCAGTCAAGGGGCA 114 5´ UTR de Clado 2 (por ATTCGGGCTCGGGACTGGCCGGGCCCGGG exemplo, TTV-P13-1)
Fonte Sequência SEQ ID NO: Alphatorquevirus CGGGTGCCGGAGGTGAGTTTACACACCGAAGTCAAGGGGCA 115 5´ UTR de Clado 3 (por ATTCGGGCTCAGGACTGGCCGGGCTTTGGG exemplo, TTV-tth8) Alphatorquevirus CGGGTGCCGGAGGTGAGTTTACACACCGCAGTCAAGGGGCA 116 5´ UTR de Clado 4 (por ATTCGGGCTCGGGAGGCCGGGCCATGGG exemplo, TTV-HD20a) Alphatorquevirus CGGGTGCCGGAGGTGAGTTTACACACCGCAGTCAAGGGGCA 117 5´ UTR de Clado 5 (por ATTCGGGCTCGGGACTGGCCGGGCCCCGGG exemplo, TTV-16) Alphatorquevirus CGGGTGCCGGAGGTGAGTTTACACACCGCAGTCAAGGGGCA 118 5´ UTR de Clado 6 (por ATTCGGGCTCGGGACTGGCCGGGCTATGGG exemplo, TTV-TJN02) Alphatorquevirus CGGGTGCCGAAGGTGAGTTTACACACCGCAGTCAAGGGGCA 119 5´ UTR de Clado 7 (por ATTCGGGCTCGGGACTGGCCGGGCTATGGG exemplo, TTV-HD16d) Regiões Ricas em GC
[001573] Em algumas modalidades, o elemento genético (por exemplo, sequência de ligação à proteína do elemento genético) compreende uma sequência de ácidos nucleicos possuindo pelo menos cerca de 75% (por exemplo, pelo menos 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100%) de identidade com uma sequência de ácidos nucleicos mostrada em qualquer uma da Tabela 39 e/ou Figuras 20 e 32. Em modalidades, o elemento genético (por exemplo, sequência de ligação à proteína do elemento genético) compreende uma sequência de ácidos nucleicos possuindo pelo menos cerca de 75% (por exemplo, pelo menos 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100%) de identidade com uma sequência rica em GC mostrada na Tabela 39.
[001574] Em modalidades, o elemento genético (por exemplo, sequência de ligação à proteína do elemento genético) compreende uma sequência de ácidos nucleicos possuindo pelo menos cerca de 75% (por exemplo, pelo menos 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100%) de identidade com uma sequência rica em GC de
36 nucleotídeos como mostrado na Tabela 39 (por exemplo, sequência de região rica em GC de consenso de 36 nucleotídeos 1, sequência de região rica em GC de consenso de 36 nucleotídeos 2, região de 36 nucleotídeos de Clado 1 de TTV, região de 36 nucleotídeos de Clado 3 de TTV, região de 36 nucleotídeos do isolado GHI de Clado 3 de TTV, região de 36 nucleotídeos de sle1932 de Clado 3 de TTV, região de 36 nucleotídeos de ctdc002 de Clado 4 de TTV, região de 36 nucleotídeos de Clado 5 de TTV, região de 36 nucleotídeos de Clade 6 de TTV ou região de 36 nucleotídeos de Clado 7 de TTV). Em modalidades, o elemento genético (por exemplo, sequência de ligação à proteína do elemento genético) compreende uma sequência de ácidos nucleicos compreendendo pelo menos 10, 15, 20, 25, 30, 31, 32, 33, 34, 35, ou 36 nucleotídeos consecutivos de uma sequência rica em GC de 36 nucleotídeos como mostrado na Tabela 39 (por exemplo, sequência de região rica em GC de consenso de 36 nucleotídeos 1, sequência de região rica em GC de consenso de 36 nucleotídeos 2, região de 36 nucleotídeos de Clado 1 de TTV, região de 36 nucleotídeos de Clado 3 de TTV, região de 36 nucleotídeos do isolado GHI de Clado 3 de TTV, região de 36 nucleotídeos de sle1932 de Clado 3 de TTV, região de 36 nucleotídeos de ctdc002 de Clado 4 de TTV, região de 36 nucleotídeos de Clado 5 de TTV, região de 36 nucleotídeos de Clade 6 de TTV ou região de 36 nucleotídeos de Clado 7 de TTV).
[001575] Em modalidades, o elemento genético (por exemplo, sequência de ligação à proteína do elemento genético) compreende uma sequência de ácidos nucleicos possuindo pelo menos cerca de 75% (por exemplo, pelo menos 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100%) de identidade com uma sequência rica em GC de Alphatorquevirus, por exemplo, selecionada de TTV-CT30F, TTV-P13- 1, TTV-tth8, TTV-HD20a, TTV-16, TTV-TJN02 ou TTV-HD16d, por exemplo, como listado na Tabela 39. Em modalidades, o elemento genético (por exemplo, sequência de ligação à proteína do elemento genético) compreende uma sequência de ácidos nucleicos compreendendo pelo menos 10, 15, 20, 25, 30, 35, 40, 45, 50, 60, 70, 80, 90, 100, 104, 105, 108, 110, 111, 115, 120, 122, 130, 140, 145, 150, 155, ou 156 nucleotídeos consecutivos de uma sequência rica em GC de Alphatorquevirus, por exemplo, selecionada de TTV-CT30F, TTV- P13-1, TTV-tth8, TTV-HD20a, TTV-16, TTV-TJN02 ou TTV-HD16d, por exemplo, como listado na Tabela 39.
[001576] Em modalidades, a sequência rica em GC de 36 nucleotídeos é selecionada de:
[001577] (i) CGCGCTGCGCGCGCCGCCCAGTAGGGGGAGCCATGC (SEQ ID NO: 160),
[001578] (ii) GCGCTX1CGCGCGCGCGCCGGGGGGCTGCGCCCCCCC (SEQ ID NO: 164), em que X1 é selecionado de T, G ou A;
[001579] (iii) GCGCTTCGCGCGCCGCCCACTAGGGGGCGTTGCGCG (SEQ ID NO: 165);
[001580] (iv) GCGCTGCGCGCGCCGCCCAGTAGGGGGCGCAATGCG (SEQ ID NO: 166);
[001581] (v) GCGCTGCGCGCGCGGCCCCCGGGGGAGGCATTGCCT (SEQ ID NO: 167);
[001582] (vi) GCGCTGCGCGCGCGCGCCGGGGGGGCGCCAGCGCCC (SEQ ID NO: 168);
[001583] (vii) GCGCTTCGCGCGCGCGCCGGGGGGCTCCGCCCCCCC (SEQ ID
NO: 169);
[001584] (viii) GCGCTTCGCGCGCGCGCCGGGGGGCTGCGCCCCCCC (SEQ ID NO: 170);
[001585] (ix) GCGCTACGCGCGCGCGCCGGGGGGCTGCGCCCCCCC (SEQ ID NO: 171); ou
[001586] (x) GCGCTACGCGCGCGCGCCGGGGGGCTCTGCCCCCCC (SEQ ID NO: 172).
[001587] Em modalidades, o elemento genético (por exemplo, sequência de ligação à proteína do elemento genético) compreende a sequência de ácidos nucleicos CGCGCTGCGCGCGCCGCCCAGTAGGGGGAGCCATGC (SEQ ID NO: 160).
[001588] Em modalidades, o elemento genético (por exemplo, sequência de ligação à proteína do elemento genético) compreende uma sequência de ácidos nucleicos d sequência rica de GC de Consenso C mostrada na Tabela 39, em que X1, X4, X5, X6, X7, X12, X13, X14, X15, X20, X21, X22, X26, X29, X30, e X33 são cada um independentemente qualquer nucleotídeo e em que X2, X3, X8, X9, X10, X11, X16, X17, X18, X19, X23, X24, X25, X27, X28, X31, X32, e X34 estão cada um independentemente ausentes ou são qualquer nucleotídeo. Em algumas modalidades, um ou mais de (por exemplo, todos de) X1 até X34 são cada um independentemente o nucleotídeo (ou estão ausentes) especificado na Tabela 39. Em modalidades, o elemento genético (por exemplo, sequência de ligação à proteína do elemento genético) compreende uma sequência de ácidos nucleicos possuindo pelo menos cerca de 75% (por exemplo, pelo menos 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100%) de identidade com uma sequência rica em GC de TTV exemplificativa mostrada na Tabela 39 (por exemplo, a sequência total, Fragmento 1, Fragmento 2, Fragmento 3 ou qualquer sua combinação, por exemplo, Fragmentos 1-3 em ordem). Em modalidades, o elemento genético (por exemplo, sequência de ligação à proteína do elemento genético) compreende uma sequência de ácidos nucleicos possuindo pelo menos cerca de 75% (por exemplo, pelo menos 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100%) de identidade com uma sequência rica em GC de TTV-CT30F mostrada na Tabela 39 (por exemplo, a sequência total, Fragmento 1, Fragmento 2, Fragmento 3, Fragmento 4, Fragmento 5, Fragmento 6, Fragmento 7, Fragmento 8 ou qualquer sua combinação, por exemplo, Fragmentos 1- 7 em ordem). Em modalidades, o elemento genético (por exemplo, sequência de ligação à proteína do elemento genético) compreende uma sequência de ácidos nucleicos possuindo pelo menos cerca de 75% (por exemplo, pelo menos 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100%) de identidade com uma sequência rica em GC de TTV-HD23a mostrada na Tabela 39 (por exemplo, a sequência total, Fragmento 1, Fragmento 2, Fragmento 3, Fragmento 4, Fragmento 5, Fragmento 6 ou qualquer sua combinação, por exemplo, Fragmentos 1- 6 em ordem). Em modalidades, o elemento genético (por exemplo, sequência de ligação à proteína do elemento genético) compreende uma sequência de ácidos nucleicos possuindo pelo menos cerca de 75% (por exemplo, pelo menos 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100%) de identidade com uma sequência rica em GC de TTV-JA20 mostrada na Tabela 39 (por exemplo, a sequência total, Fragmento 1, Fragmento 2 ou qualquer sua combinação, por exemplo, Fragmentos 1 e 2 em ordem). Em modalidades, o elemento genético (por exemplo, sequência de ligação à proteína do elemento genético) compreende uma sequência de ácidos nucleicos possuindo pelo menos cerca de 75% (por exemplo, pelo menos 75%, 80%, 85%, 90%, 95%,
96%, 97%, 98%, 99%, ou 100%) de identidade com uma sequência rica em GC de TTV-TJN02 mostrada na Tabela 39 (por exemplo, a sequência total, Fragmento 1, Fragmento 2, Fragmento 3, Fragmento 4, Fragmento 5, Fragmento 6, Fragmento 7, Fragmento 8 ou qualquer sua combinação, por exemplo, Fragmentos 1-8 em ordem). Em modalidades, o elemento genético (por exemplo, sequência de ligação à proteína do elemento genético) compreende uma sequência de ácidos nucleicos possuindo pelo menos cerca de 75% (por exemplo, pelo menos 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100%) de identidade com uma sequência rica em GC de TTV-tth8 mostrada na Tabela 39 (por exemplo, a sequência total, Fragmento 1, Fragmento 2, Fragmento 3, Fragmento 4, Fragmento 5, Fragmento 6, Fragmento 7, Fragmento 8, Fragmento 9 ou qualquer sua combinação, por exemplo, Fragmentos 1-6 em ordem). Em modalidades, o elemento genético (por exemplo, sequência de ligação à proteína do elemento genético) compreende uma sequência de ácidos nucleicos possuindo pelo menos cerca de 75% (por exemplo, pelo menos 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100%) de identidade com o Fragmento 7 mostrado na Tabela 39. Em modalidades, o elemento genético (por exemplo, sequência de ligação à proteína do elemento genético) compreende uma sequência de ácidos nucleicos possuindo pelo menos cerca de 75% (por exemplo, pelo menos 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100%) de identidade com o Fragmento 8 mostrado na Tabela 39. Em modalidades, o elemento genético (por exemplo, sequência de ligação à proteína do elemento genético) compreende uma sequência de ácidos nucleicos possuindo pelo menos cerca de 75% (por exemplo, pelo menos 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100%) de identidade com o Fragmento 9 mostrado na Tabela 39. Tabela 39. Sequências ricas em GC exemplificativas de
Anelloviruses Fonte Sequência SEQ ID NO: Consenso CGGCGGX1GGX2GX3X4X5CGCGCTX6CGCGCG 120 CX7X8X9X10CX11X12X13X14GGGGX15X16X17X18X19X 20X21GCX22X23X 24X25CCCCCCCX26CGCGCATX27
X28GCX29CGGGX30CCCCCCCCCX31X32X33GGGG GGCTCCGX34CCCCCCGGCCCCCC
X1 = G ou C X2 = G, C ou ausente X3 = C ou ausente X4 = G ou C X5 = G ou C X6 = T, G, ou A X7 = G ou C X8 = G ou ausente X9 = C ou ausente X10 = C ou ausente X11 = G, A ou ausente X12 = G ou C X13 = C ou T X14 = G ou A X15 = G ou A X16 = A, G, T ou ausente X17 = G, C ou ausente X18 = G, C ou ausente X19 = C, A ou ausente X20 = C ou A X21 = T ou A X22 = G ou C X23 = G, T ou ausente X24 = C ou ausente X25 = G, C ou ausente X26 = G ou C X27 = G ou ausente X28 = C ou ausente X29 = G ou A X30 = G ou T
Fonte Sequência SEQ ID NO: X31 = C, T ou ausente X32 = G, C, A ou ausente X33 = G ou C X34 = C ou ausente Sequência de TTV Sequência total GCCGCCGCGGCGGCGGSGGNGNSGCGCGCT 121 Exemplificativa DCGCGCGCSNNNCRCCRGGGGGNNNNCWGC
SNCNCCCCCCCCCGCGCATGCGCGGGKCCCC CCCCCNNCGGGGGGCTCCGCCCCCCGGCCC CCCCCCGTGCTAAACCCACCGCGCATGCGCG
ACCACGCCCCCGCCGCC Fragmento 1 GCCGCCGCGGCGGCGGSGGNGNSGCGCGCT 122
DCGCGCGCSNNNCRCCRGGGGGNNNNCWGC
SNCNCCCCCCCCCGCGCAT Fragmento 2 GCGCGGGKCCCCCCCCCNNCGGGGGGCTCC 123
G Fragmento 3 CCCCCCGGCCCCCCCCCGTGCTAAACCCACC 124
GCGCATGCGCGACCACGCCCCCGCCGCC TTV-CT30F Sequência total GCGGCGG-GGGGGCG-GCCGCG- 125 TTCGCGCGCCGCCCACCAGGGGGTG-- CTGCG-CGCCCCCCCCCGCGCAT GCGCGGGGCCCCCCCCC--
GGGGGGGCTCCGCCCCCCCGGCCCCCCCCC GTGCTAAACCCACCGCGCATGCGCGACCACG
CCCCCGCCGCC Fragmento 1 GCGGCGG 126 Fragmento 2 GGGGGCG 127 Fragmento 3 GCCGCG 128 Fragmento 4 TTCGCGCGCCGCCCACCAGGGGGTG 129 Fragmento 5 CTGCG 130 Fragmento 6 CGCCCCCCCCCGCGCAT 131 Fragmento 7 GCGCGGGGCCCCCCCCC 132 Fragmento 8 GGGGGGGCTCCGCCCCCCCGGCCCCCCCCC 133
GTGCTAAACCCACCGCGCATGCGCGACCACG
CCCCCGCCGCC TTV-HD23a Sequência total CGGCGGCGGCGGCG- 134 CGCGCGCTGCGCGCGCG--- CGCCGGGGGGGCGCCAGCG-
Fonte Sequência SEQ ID NO:
CCCCCCCCCCCGCGCAT GCACGGGTCCCCCCCCCCACGGGGGGCTCC
G CCCCCCGGCCCCCCCCC Fragmento 1 CGGCGGCGGCGGCG 135 Fragmento 2 CGCGCGCTGCGCGCGCG 136 Fragmento 3 CGCCGGGGGGGCGCCAGCG 137 Fragmento 4 CCCCCCCCCCCGCGCAT 138 Fragmento 5 GCACGGGTCCCCCCCCCCACGGGGGGCTCC 139
G Fragmento 6 CCCCCCGGCCCCCCCCC 140 TTV-JA20 Sequência total CCGTCGGCGGGGGGGCCGCGCGCTGCGCGC 141 GCGGCCC-
CCGGGGGAGGCACAGCCTCCCCCCCCCGCG CGCATGCGCGCGGGTCCCCCCCCCTCCGGG
GGGCTCCGCCCCCCGGCCCCCCCC Fragmento 1 CCGTCGGCGGGGGGGCCGCGCGCTGCGCGC 142
GCGGCCC Fragmento 2 CCGGGGGAGGCACAGCCTCCCCCCCCCGCG 143
CGCATGCGCGCGGGTCCCCCCCCCTCCGGG
GGGCTCCGCCCCCCGGCCCCCCCC TTV-TJN02 Sequência total CGGCGGCGGCG-CGCGCGCTACGCGCGCG--- 144 CGCCGGGGGG----CTGCCGC-
CCCCCCCCCGCGCAT GCGCGGGGCCCCCCCCC-
GCGGGGGGCTCCG CCCCCCGGCCCCCC Fragmento 1 CGGCGGCGGCG 145 Fragmento 2 CGCGCGCTACGCGCGCG 146 Fragmento 3 CGCCGGGGGG 147 Fragmento 4 CTGCCGC 148 Fragmento 5 CCCCCCCCCGCGCAT 149 Fragmento 6 GCGCGGGGCCCCCCCCC 150 Fragmento 7 GCGGGGGGCTCCG 151 Fragmento 8 CCCCCCGGCCCCCC 152 TTV-tth8 Sequência total GCCGCCGCGGCGGCGGGGG- 153
GCGGCGCGCTGCGCGCGCCGCCCAGTAGGG GGAGCCATGCG---CCCCCCCCCGCGCAT GCGCGGGGCCCCCCCCC-
Fonte Sequência SEQ ID NO:
GCGGGGGGCTCCG CCCCCCGGCCCCCCCCG Fragmento 1 GCCGCCGCGGCGGCGGGGG 154 Fragmento 2 GCGGCGCGCTGCGCGCGCCGCCCAGTAGGG 155
GGAGCCATGCG Fragmento 3 CCCCCCCCCGCGCAT 156 Fragmento 4 GCGCGGGGCCCCCCCCC 157 Fragmento 5 GCGGGGGGCTCCG 158 Fragmento 6 CCCCCCGGCCCCCCCCG 159 Fragmento 7 CGCGCTGCGCGCGCCGCCCAGTAGGGGGAG 160
CCATGC Fragmento 8 CCGCCATCTTAAGTAGTTGAGGCGGACGGTG 161
GCGTGAGTTCAAAGGTCACCATCAGCCACACC
TACTCAAAATGGTGG Fragmento 9 CTTAAGTAGTTGAGGCGGACGGTGGCGTGAG 162
TTCAAAGGTCACCATCAGCCACACCTACTCAA AATGGTGGACAATTTCTTCCGGGTCAAAGGTT ACAGCCGCCATGTTAAAACACGTGACGTATGA CGTCACGGCCGCCATTTTGTGACACAAGATGG
CCGACTTCCTTCC Sequências ricas em Sequência de CGCGCTGCGCGCGCCGCCCAGTAGGGGGAG 163 GC Adicionais (como região rica em GC CCATGC mostrado na Figura de consenso de 32) 36 nucleotídeos 1 Sequência de GCGCTX1CGCGCGCGCGCCGGGGGGCTGCG 164 consenso de CCCCCCC, em que X1 é selecionado de T, G ou A região de 36 nucleotídeos 2 Região de 36 GCGCTTCGCGCGCCGCCCACTAGGGGGCGTT 165 nucleotídeos de GCGCG Clado 1 de TTV Região de 36 GCGCTGCGCGCGCCGCCCAGTAGGGGGCGC 166 nucleotídeos de AATGCG Clado 3 de TTV Região de 36 GCGCTGCGCGCGCGGCCCCCGGGGGAGGCA 167 nucleotídeos de TTGCCT isolado GH1 de Clado 3 de TTV
Fonte Sequência SEQ ID NO: Região de 36 GCGCTGCGCGCGCGCGCCGGGGGGGCGCCA 168 nucleotídeos de GCGCCC sle1932 de Clado 3 de TTV Região de 36 GCGCTTCGCGCGCGCGCCGGGGGGCTCCGC 169 nucleotídeos de CCCCCC ctdc002 de Clado 4 de TTV Região de 36 GCGCTTCGCGCGCGCGCCGGGGGGCTGCGC 170 nucleotídeos de CCCCCC Clado 5 de TTV Região de 36 GCGCTACGCGCGCGCGCCGGGGGGCTGCGC 171 nucleotídeos de CCCCCC Clado 6 de TTV Região de 36 GCGCTACGCGCGCGCGCCGGGGGGCTCTGC 172 nucleotídeos de CCCCCC Clado 7 de TTV Sequências de região TTV-CT30F GCGGCGGGGGGGCGGCCGCGTTCGCGCGCC 801 rica em GC de GCCCACCAGGGGGTGCTGCGCGCCCCCCCC Alphatorquevirus CGCGCATGCGCGGGGCCCCCCCCCGGGGGG adicionais GCTCCGCCCCCCCGGCCCCCCCCCGTGCTAA
ACCCACCGCGCATGCGCGACCACGCCCCCGC
CGCC TTV-P13-1 CCGAGCGTTAGCGAGGAGTGCGACCCTACCC 802
CCTGGGCCCACTTCTTCGGAGCCGCGCGCTA CGCCTTCGGCTGCGCGCGGCACCTCAGACCC CCGCTCGTGCTGACACGCTTGCGCGTGTCAG
ACCACTTCGGGCTCGCGGGGGTCGGG TTV-tth8 GCCGCCGCGGCGGCGGGGGGCGGCGCGCT 803
GCGCGCGCCGCCCAGTAGGGGGAGCCATGC GCCCCCCCCCGCGCATGCGCGGGGCCCCCC CCCGCGGGGGGCTCCGCCCCCCGGCCCCCC
CCG TTV-HD20a CGGCCCAGCGGCGGCGCGCGCGCTTCGCGC 804
GCGCGCCGGGGGGCTCCGCCCCCCCCCGCG CATGCGCGGGGCCCCCCCCCGCGGGGGGCT CCGCCCCCCGGTCCCCCCCCG
Fonte Sequência SEQ ID NO: TTV-16 CGGCCGTGCGGCGGCGCGCGCGCTTCGCGC 805
GCGCGCCGGGGGCTGCCGCCCCCCCCCGCG CATGCGCGCGGGGCCCCCCCCCGCGGGGGG
CTCCGCCCCCCGGCCCCCCCCCCCG TTV-TJN02 CGGCGGCGGCGCGCGCGCTACGCGCGCGCG 806
CCGGGGGGCTGCCGCCCCCCCCCCGCGCAT GCGCGGGGCCCCCCCCCGCGGGGGGCTCCG
CCCCCCGGCCCCCC TTV-HD16d GGCGGCGGCGCGCGCGCTACGCGCGCGCGC 807
CGGGGAGCTCTGCCCCCCCCCGCGCATGCGC GCGGGTCCCCCCCCCGCGGGGGGCTCCGCC CCCCGGTCCCCCCCCCG
[001589] Em modalidades, o elemento genético compreende uma sequência de ácidos nucleicos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de nucleotídeos rica em GC de Anellovirus da Tabela A1 (por exemplo, nucleotídeos 3620 – 3648 da sequência de ácidos nucleicos da Tabela A1). Em modalidades, o elemento genético compreende uma sequência de ácidos nucleicos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de nucleotídeos rica em GC de Anellovirus da Tabela A7 (por exemplo, nucleotídeos 3720 – 3742 da sequência de ácidos nucleicos da Tabela A7). Em modalidades, o elemento genético compreende uma sequência de ácidos nucleicos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de nucleotídeos rica em GC de Anellovirus da Tabela A1 (por exemplo, nucleotídeos 3844 – 3895 da sequência de ácidos nucleicos da Tabela A11).
[001590] Em modalidades, o elemento genético compreende uma sequência de ácidos nucleicos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de nucleotídeos rica em GC de Anellovirus da Tabela 1 (por exemplo, nucleotídeos 3415 – 3570 da sequência de ácidos nucleicos da Tabela 1). Em modalidades, o elemento genético compreende uma sequência de ácidos nucleicos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de nucleotídeos rica em GC de Anellovirus da Tabela 3 (por exemplo, nucleotídeos 3302 – 3541 da sequência de ácidos nucleicos da Tabela 3). Em modalidades, o elemento genético compreende uma sequência de ácidos nucleicos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de nucleotídeos rica em GC de Anellovirus da Tabela 5 (por exemplo, nucleotídeos 3632 – 3753 da sequência de ácidos nucleicos da Tabela 5). Em modalidades, o elemento genético compreende uma sequência de ácidos nucleicos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de nucleotídeos rica em GC de Anellovirus da Tabela 7 (por exemplo, nucleotídeos 3768 – 3878 da sequência de ácidos nucleicos da Tabela 7). Em modalidades, o elemento genético compreende uma sequência de ácidos nucleicos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de nucleotídeos rica em GC de Anellovirus da Tabela 9 (por exemplo, nucleotídeos 3302 – 3541 da sequência de ácidos nucleicos da Tabela 9). Em modalidades, o elemento genético compreende uma sequência de ácidos nucleicos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de nucleotídeos rica em GC de Anellovirus da Tabela 11 (por exemplo, nucleotídeos 3691 – 3794 da sequência de ácidos nucleicos da Tabela 11). Em modalidades, o elemento genético compreende uma sequência de ácidos nucleicos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de nucleotídeos rica em GC de Anellovirus da Tabela 13 (por exemplo, nucleotídeos 3759 – 3866 da sequência de ácidos nucleicos da Tabela 13). Em modalidades, o elemento genético compreende uma sequência de ácidos nucleicos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de nucleotídeos rica em GC de Anellovirus da Tabela 15 (por exemplo, nucleotídeos 2868 – 2929 da sequência de ácidos nucleicos da Tabela 15). Em modalidades, o elemento genético compreende uma sequência de ácidos nucleicos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de nucleotídeos rica em GC de Anellovirus da Tabela 17 (por exemplo, nucleotídeos 3054 – 3172 da sequência de ácidos nucleicos da Tabela 17).
[001591] Em modalidades, o elemento genético compreende uma sequência de ácidos nucleicos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de nucleotídeos rica em GC de Anellovirus da Tabela B1 (por exemplo, nucleotídeos 3141-3264 da sequência de ácidos nucleicos da Tabela B1). Em modalidades, o elemento genético compreende uma sequência de ácidos nucleicos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de nucleotídeos rica em GC de Anellovirus da Tabela B2 (por exemplo, nucleotídeos 3076-3176 da sequência de ácidos nucleicos da Tabela B2). Em modalidades, o elemento genético compreende uma sequência de ácidos nucleicos possuindo pelo menos cerca de 70%,
75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de nucleotídeos rica em GC de Anellovirus da Tabela B3 (por exemplo, nucleotídeos 3555-3696 da sequência de ácidos nucleicos da Tabela B3). Em modalidades, o elemento genético compreende uma sequência de ácidos nucleicos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de nucleotídeos rica em GC de Anellovirus da Tabela B4 (por exemplo, nucleotídeos 3720-3828 da sequência de ácidos nucleicos da Tabela B4). Em modalidades, o elemento genético compreende uma sequência de ácidos nucleicos possuindo pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com a sequência de nucleotídeos rica em GC de Anellovirus da Tabela B5 (por exemplo, nucleotídeos 3716-3815 da sequência de ácidos nucleicos da Tabela B5). Efetor
[001592] Em algumas modalidades, o elemento genético pode incluir uma ou mais sequências que codificam um efetor funcional, por exemplo, um efetor endógeno ou um efetor exógeno, por exemplo, um polipeptídeo ou ácido nucleico terapêutico, por exemplo, RNA ou proteína citotóxico ou citolítico. Em algumas modalidades, o ácido nucleico funcional é um RNA não codificante. Em algumas modalidades, o ácido nucleico funcional é um RNA codificante. O efetor pode modular uma atividade biológica, por exemplo, aumentar ou diminuir a atividade enzimática, expressão gênica, sinalização celular e função celular ou dos órgãos. As atividades efetoras podem também incluir proteínas reguladoras de ligação para modular a atividade do regulador, tal como transcrição ou tradução. As atividades efetoras podem também incluir funções ativadoras ou inibidoras. Por exemplo, o efetor pode induzir a atividade enzimática por desencadeamento de afinidade do substrato aumentada em uma enzima, por exemplo, 2,6-bifosfato de frutose ativa fosfofrutocinase 1 e aumenta a taxa de glicólise em resposta à insulina. Em um outro exemplo, o efetor pode inibir a ligação do substrato a um receptor e inibir sua ativação, por exemplo, naltrexona e naloxona se ligam aos receptores opioides sem os ativar e bloqueiam a capacidade dos receptores de se ligarem aos opioides. As atividades efetoras podem também incluir modulação da estabilidade/degradação de proteínas e/ou estabilidade/degradação de transcritos. Por exemplo, as proteínas podem ser visadas para degradação pelo cofator de polipeptídeo, ubiquitina, em proteínas para as marcar para degradação. Em um outro exemplo, o efetor inibe a atividade enzimática por bloqueio do local ativo da enzima, por exemplo, o metotrexato é um análogo estrutural de tetra-hidrofolato, uma coenzima para a enzima di- hidrofolato redutase que se liga à di-hidrofolato redutase 1000 vezes mais estreitamente do que o substrato natural e inibe a síntese de bases de nucleotídeos.
[001593] Em algumas modalidades, a sequência codificando um efetor é parte do elemento genético, por exemplo, pode ser inserido em um local de inserção como descrito nos Exemplos 10, 12 ou 22. Em modalidades, a sequência codificando um efetor é inserida no elemento genético em uma região não codificante, por exemplo, uma região não codificante disposta 3´ das grelhas de leitura aberta e 5´ da região rica em GC do elemento genético, na região 5´ não codificante a montante da caixa TATA, na 5´ UTR, na região não codificante 3´ a jusante do sinal de poli-A ou a montante da região rica em GC. Em modalidades, a sequência codificando um efetor é inserida no elemento genético a cerca do nucleotídeo 3588 de um plasmídeo TTV-tth8, por exemplo, como descrito no presente documento ou a cerca do nucleotídeo 2843 de um plasmídeo TTMV-LY2, por exemplo, como descrito no presente documento. Em modalidades, a sequência codificando um efetor é inserida no elemento genético nos ou dentro dos nucleotídeos 336-3015 de um plasmídeo TTV-tth8, por exemplo, como descrito no presente documento, ou nos ou dentro dos nucleotídeos 242-2812 de um plasmídeo TTV-LY2, por exemplo, como descrito no presente documento. Em algumas modalidades, a sequência codificando um efetor substitui parte de ou toda uma grelha de leitura aberta (por exemplo, uma ORF como descrito no presente documento, por exemplo, uma ORF1, ORF1/1, ORF1/2, ORF2, ORF2/2, ORF2/3 e/ou ORF2t/3 como mostrado em qualquer uma das Tabelas A1-A12, B1-B5, C1-C5 ou 1-18).
[001594] Em algumas modalidades, a sequência codificando um efetor compreende 100-2000, 100-1000, 100-500, 100-200, 200-2000, 200-1000, 200-500, 500-1000, 500-2000, ou 1000-2000 nucleotídeos. Em algumas modalidades, o efetor é uma carga útil de ácido nucleico ou proteína, por exemplo, como descrito no Exemplo 11. Ácido Nucleico Regulador
[001595] Em algumas modalidades, o efetor é um ácido nucleico regulador. Os ácidos nucleicos reguladores modificam a expressão de um gene endógeno e/ou um gene exógeno. Em uma modalidade, o ácido nucleico regulador visa um gene hospedeiro. Os ácidos nucleicos reguladores podem incluir, mas não estão limitados a, um ácido nucleico que hibrida com um gene endógeno (por exemplo, miRNA, siRNA, mRNA, lncRNA, RNA, DNA, um RNA antissenso, gRNA como descrito no presente documento em outro lugar), ácido nucleico que hibrida com um ácido nucleico exógeno tal como um DNA ou RNA viral, ácido nucleico que hibrida com um RNA, ácido nucleico que interfere com a transcrição gênica, ácido nucleico que interfere com a tradução de RNA, ácido nucleico que estabiliza o RNA ou desestabiliza o RNA tal como através de direcionamento para degradação e ácido nucleico que modula um fator de ligação ao DNA ou RNA. Em modalidades, o ácido nucleico regulador codifica um miRNA.
[001596] Em algumas modalidades, o ácido nucleico regulador compreende RNA ou estruturas tipo RNA tipicamente contendo 5-500 pares de bases (dependendo da estrutura de RNA específica, por exemplo, 5-30 pbs de miRNA, 200-500 pbs de lncRNA) e podem possuir uma sequência de nucleobases idêntica (ou complementar) ou quase idêntica (ou substancialmente complementar) a uma sequência codificante em um gene alvo expresso dentro da célula ou uma sequência codificando um gene alvo expresso dentro da célula.
[001597] Em algumas modalidades, o ácido nucleico regulador é configurado para subregular KRAS G12D, CpG(B)-STAT3, ciclina D1, C-myc, C-myb ou uma proteína antitripsina alfa-1 patogênica. Em algumas modalidades, o ácido nucleico regulador é configurado para subrregular DPP-4, FGFR3, HTT ou IDH. Em algumas modalidades, o ácido nucleico regulador é configurado para subrregular um alvo de oncologia tal como EGFR, IDH1, IDH2, LRP5, DKK2, KRAS, um fator de crescimento (por exemplo, VEGF), um receptor de fator de crescimento (por exemplo, receptor de IGF, receptor de FGF ou receptor de TGF-beta). Em algumas modalidades, o ácido nucleico regulador compreende um miRNA, por exemplo, miR-34a, miR-506 ou Let7a. Em algumas modalidades, o ácido nucleico regulador compreende miR- 367, miR-302a, miR-302b, miR-302c ou miR-302d.
[001598] Em algumas modalidades, o ácido nucleico regulador compreende uma sequência de ácidos nucleicos, por exemplo, um RNA guia (gRNA). Em algumas modalidades, a fração visando DNA compreende um RNA guia ou ácido nucleico codificando o RNA guia. Um curto RNA sintético gRNA pode ser composto por uma sequência de “molde” necessária para ligação à fração efetora incompleta e uma sequência visante de ∼20 nucleotídeos definida pelo usuário para um alvo genômico. Na prática, as sequências de RNA guia são geralmente desenhadas para terem um comprimento entre 17 – 24 nucleotídeos (por exemplo, 19, 20 ou 21 nucleotídeos) e para serem complementares à sequência de ácidos nucleicos visada. Geradores de gRNA e algoritmos customizados estão comercialmente disponíveis para uso no desenho de RNA guia eficazes. Foi também alcançada edição gênica usando um “RNA guia simples” (sgRNA) quimérico, uma molécula de RNA simples manipulada (sintética) que mimetiza um complexo crRNA- tracrRNA de ocorrência natural e contém tanto um tracrRNA (para ligação da nuclease) como pelo menos um crRNA (para guiar a nuclease para a sequência visada para edição). Foi também demonstrado que sgRNAs quimicamente modificados são eficazes na edição do genoma; ver, por exemplo, Hendel et al. (2015) Nature Biotechnol., 985 – 991.
[001599] O ácido nucleico regulador compreende um gRNA que reconhece sequências específicas de DNA (por exemplo, sequências adjacentes a ou dentro de um promotor, intensificador, silenciador ou repressor de um gene).
[001600] Certos ácidos nucleicos reguladores podem inibir a expressão de genes através do processo biológico de interferência de RNA (RNAi). As moléculas de RNAi compreendem RNA ou estruturas do tipo RNA tipicamente contendo 15-50 pares de bases (tal como cerca de 18-25 pares de bases) e possuindo uma sequência de nucleobases idêntica (complementar) ou quase idêntica (substancialmente complementar) a uma sequência codificante em um gene alvo expresso dentro da célula. As moléculas de RNAi incluem, mas não estão limitadas a: curtos RNAs interferentes (siRNAs), RNA de fita dupla (dsRNAs), microRNA (miRNAs), RNAs de grampo curto (shRNAs), merodúplexes e substratos de dicer (Pat. dos E.U.A. N.os 8,084,599, 8,349,809 e 8,513,207).
[001601] Os RNAs longos não codificantes (lncRNA) são definidos como transcritos não codificantes de proteína mais longos do que 100 nucleotídeos. Este limite algo arbitrário distingue lncRNAs de pequenos RNAs reguladores tais como microRNAs (miRNAs), curtos RNAs interferentes (siRNAs) e outros RNAs curtos. Em geral, a maioria (~78%) dos lncRNAs é caracterizada como específica de tecidos. Os lncRNAs divergentes que são transcritos na direção oposta aos genes codificantes de proteínas próximos (compreendem uma proporção significativa ~20% de lncRNAs totais nos genomas de mamíferos) podem possivelmente regular a transcrição do gene próximo.
[001602] O elemento genético pode codificar ácidos nucleicos reguladores com uma sequência substancialmente complementar ou totalmente complementar, para todo ou um fragmento de um gene ou produto genético endógeno (por exemplo, mRNA). Os ácidos nucleicos reguladores podem complementar sequências na fronteira entre íntrons e éxons para prevenir a maturação de transcritos de RNA nuclear recém-gerados de genes específicos em mRNA para transcrição. Os ácidos nucleicos reguladores que são complementares com genes específicos podem hibridar com o mRNA para esse gene e prevenir sua tradução. O ácido nucleico regulador antissenso pode ser DNA, RNA ou um seu derivado ou híbrido.
[001603] O comprimento do ácido nucleico regulador que hibrida com o transcrito de interesse pode ser entre 5 e 30 nucleotídeos, entre cerca de 10 e 30 nucleotídeos ou cerca de 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30 ou mais nucleotídeos. O grau de identidade do ácido nucleico regulador com o transcrito visado deve ser pelo menos 75%, pelo menos 80%, pelo menos 85%, pelo menos 90%, ou pelo menos 95%.
[001604] O elemento genético pode codificar um ácido nucleico regulador, por exemplo, uma molécula de microRNA (miRNA) idêntica a cerca de 5 a cerca de 25 nucleotídeos contíguos de um gene alvo. Em algumas modalidades, a sequência de miRNA visa um mRNA e começa com o dinucleotídeo AA, compreende um conteúdo de GC de cerca de 30-70% (cerca de 30-60%, cerca de 40-60% ou cerca de 45%-55%) e não tem uma elevada percentagem de identidade com qualquer sequência de nucleotídeos sem ser o alvo no genoma mamífero no qual é para ser introduzida, por exemplo como determinado por pesquisa por BLAST padrão.
[001605] Em algumas modalidades, o ácido nucleico regulador é pelo menos um miRNA, por exemplo, 2, 3, 4, 5, 6 ou mais. Em algumas modalidades, o elemento genético compreende uma sequência que codifica um miRNA pelo menos cerca de 75%, 80%, 85%, 90% 95%, 96%, 97%, 98%, 99% ou 100% de identidade de sequência de nucleotídeos com qualquer uma das sequências de nucleotídeos ou uma sequência que é complementar a uma sequência descrita no presente documento.
[001606] siRNA e shRNA se assemelham a intermediários na via de processamento dos genes de microRNA (miRNA) endógenos (Bartel, Cell 116: 281-297, 2004). Em algumas modalidades, os siRNAs podem funcionar como miRNAs e vice-versa (Zeng et al., Mol Cell 9: 1327- 1333, 2002; Doench et al., Genes Dev 17: 438-442, 2003). Os microRNAs, como siRNAs, usam RISC para subrregular genes alvo mas, ao contrário dos siRNAs, a maioria dos miRNAs de animais não cliva o mRNA. Ao invés, os miRNAs reduzem a produção de proteínas através da supressão translacional ou remoção de poliA e degradação de mRNA (Wu et al., Proc Natl Acad Sci USA 103: 4034-4039, 2006). Os locais de ligação ao miRNA conhecidos estão dentro das 3´ UTRs de mRNA; os miRNAs parecem visar locais com complementaridade quase perfeita com os nucleotídeos 2-8 a partir da extremidade 5’ do miRNA (Rajewsky, Nat Genet 38 Supl: S8-13, 2006; Lim et al., Nature 433: 769-773, 2005). Esta região é conhecida como a região de semente. Uma vez que os siRNAs e os miRNAs são intercambiáveis, os siRNAs exógenos subrregulam os mRNAs com complementaridade de sementes em siRNA (Birmingham et al., Nat Methods 3: 199-204, 2006). Múltiplos locais alvo dentro de uma 3' UTR dão subrregulação mais forte (Doench et al., Genes Dev 17: 438-442, 2003).
[001607] Listas de sequências conhecidas de miRNA podem ser encontradas em bases de dados mantidas por organizações de pesquisa, tais como Wellcome Trust Sanger Institute, Penn Center for Bioinformatics, Memorial Sloan Kettering Cancer Center e European Molecule Biology Laboratory, entre outros. Sequências de siRNA eficazes conhecidas e locais de ligação cognatos são também bem representados na literatura relevante. As moléculas de RNAi são prontamente desenhadas e produzidas por tecnologias conhecidas na técnica. Ainda existem ferramentas computacionais que aumentam a chance de se encontrarem motivos de sequência eficazes e específicos (Lagana et al., Methods Mol. Bio., 2015, 1269: 393-412).
[001608] O ácido nucleico regulador pode modular a expressão do RNA codificado por um gene. Uma vez que múltiplos genes podem partilhar algum grau de homologia de sequência entre si, em algumas modalidades, o ácido nucleico regulador pode ser projetado de modo a visar uma classe de genes com suficiente homologia de sequência. Em algumas modalidades, o ácido nucleico regulador pode conter uma sequência que tem complementaridade com sequências que são partilhadas entre diferentes alvos gênicos ou são únicas de um alvo gênico específico. Em algumas modalidades, o ácido nucleico regulador pode ser desenhado para visar regiões conservadas de uma sequência de RNA possuindo homologia entre vários genes visando deste modo vários genes em uma família de genes (por exemplo, diferentes isoformas gênicas, variantes de splice, genes mutantes, etc.). Em algumas modalidades, o ácido nucleico regulador pode ser desenhado para visar uma sequência que é única para uma sequência de RNA específica de um único gene.
[001609] Em algumas modalidades, o elemento genético pode incluir uma ou mais sequências que codificam ácidos nucleicos reguladores que modulam a expressão de um ou mais genes.
[001610] Em uma modalidade, o gRNA descrito em outra parte no presente documento é usado como parte de um sistema CRISPR para edição gênica. Para os propósitos de edição gênica, o anelossomo pode ser desenhado para incluir uma ou múltiplas sequências de RNA guia correspondendo a uma sequência de DNA alvo desejada; ver, por exemplo, Cong et al. (2013) Science, 339: 819–823; Ran et al. (2013) Nature Protocols, 8: 2281 – 2308. Pelo menos cerca de 16 ou 17 nucleotídeos da sequência de gRNA são geralmente permitidos para que ocorra clivagem de DNA mediada por Cas9; para Cpf1 são necessários pelo menos cerca de 16 nucleotídeos da sequência de gRNA para alcançar clivagem de DNA detectável. Peptídeos ou polipeptídeos terapêuticos
[001611] Em algumas modalidades, o elemento genético compreende uma sequência que codifica um peptídeo ou polipeptídeo terapêutico, por exemplo, uma terapêutica de susbstituição de proteína. Tais terapêuticos incluem, mas não estão limitados a, peptídeos pequenos, peptidomiméticos (por exemplo, peptoides), aminoácidos e análogos de aminoácidos. Tais terapêuticos têm geralmente um peso molecular menor do que cerca de 5000 gramas por mole, um peso molecular menor do que cerca de 2000 gramas por mole, um peso molecular menor do que cerca de 1000 gramas por mole, um peso molecular menor do que cerca de 500 gramas por mole e sais, ésteres e outras formas farmaceuticamente aceitáveis de tais compostos. Tais terapêuticos podem incluir, mas não estão limitados a, um neurotransmissor, um hormônio, um fármaco, uma toxina, uma partícula viral ou microbiana, uma molécula sintética e seus agonistas ou antagonistas.
[001612] Em algumas modalidades, o elemento genético inclui uma sequência codificando um peptídeo, por exemplo, um peptídeo terapêutico. Os peptídeos podem ser lineares ou ramificados. O peptídeo tem um comprimento de cerca de 5 a cerca de 500 aminoácidos, cerca de 15 a cerca de 400 aminoácidos, cerca de 20 a cerca de 325 aminoácidos, cerca de 25 a cerca de 250 aminoácidos, cerca de 50 a cerca de 150 aminoácidos ou qualquer gama entre eles.
[001613] Efetores exemplares são descritos no presente documento, p.ex, nas tabelas abaixo. Tabela A. Efetores enzimáticos exemplares e indicações correspondentes Efetor Indicação 3-metilcrotonil-CoA carboxilase Deficiência de 3-metilcrotonil-CoA carboxilase Acetil-CoA- glucosaminida N- Mucopolissacaridose MPS III (síndrome de acetiltransferase Sanfilippo) Tipo III-C ADAMTS13 Trombocitopénica trombótica púrpura adenina fosforribosiltransferase Deficiência de adenina fosforribosiltransferase Adenosina desaminase Deficiência de adenosina desaminase Hidrolase da proteína ADP-ribose Doença de armazenamento de ribose-5- fosfato de glutamila alfa glucosidase Doença de armazenamento de glicogênio de tipo 2 (doença de Pompe) Monoxigenase de amônia Argininemia Monoxigenase de amônia Acidúria de argininosuccinato Monoxigenase de amônia citrulinemia de tipo I Monoxigenase de amônia citrulinemia de tipo II Monoxigenase de amônia hiperamonemia/ ornitinemia/ citrulinemia (defeito do portador de ornitina) Arginase Hiperarginemia familiar Arilsulfatase A Leucodistrofia metacromática Catepsina K Picnodisostose
Efetor Indicação Ceramidase Doença de Farber (lipogranulomatose) Cistationina B sintase Homocistinúria Dolicol-P-manose sintase Disfunções congênitas de N-glicosilação CDG Ie Dolico-P-Glc: Man9GlcNAc2-PP-dolicol Disfunções congênitas de N-glicosilação glucosiltransferase CDG Ic Dolico-P-Man: Man5GlcNAc2-PP-dolicol Disfunções congênitos de N-glicosilação manosiltransferase CDG Id Doliquil-P-glucose: Glc-1-Man-9-GlcNAc-2- Disfunções congênitos de N-glicosilação PP-dolicquil-α-3-glucosiltransferase CDG Ih Doliquil-P-manose: Man-7-GlcNAc-2-PP- Disfunções congênitas de N-glicosilação doliquil-α-6-manosiltransferase CDG Ig Fator II Deficiência de fator II Fator IX Hemofilia B Fator V Doença de Owren Fator VII Hemofilia A Fator X Deficiência do Fator de Stuart-Prower Fator XI Hemofilia C Fator XIII Deficiência de fator de estabilização de fibrina Galactosamina-6-sulfato sulfatase Mucopolissacaridose MPS IV (síndrome de Morquio) de Tipo IV-A galactose desidrogenase Galactosemia deficiente em transferase (Galactosemia de tipo 1) Galactosilceramida β-galactosidase Doença de Krabbe Gangliosídeo β-galactosidase GM1 gangliosidose, generalizada Gangliosídeo β-galactosidase GM2 gangliosidose Gangliosídeo β-galactosidase Esfingolipidose de Tipo I Gangliosídeo β-galactosidase Esfingolipidose de Tipo II (tipo juvenil) Gangliosídeo β-galactosidase Esfingolipidose de Tipo III (tipo adulto) Glucosidase I Disfunções congênitas da N-glicosilação CDG IIb Glucosilceramida β-glucosidase Doença de Gaucher Heparan-S-sulfato sulfamidase Mucopolissacaridose MPS III (síndrome de Sanfilippo) de Tipo III-A homogentisato oxidase Alcaptonúria Hialuronidase Mucopolissacaridose MPS IX (deficiência
Efetor Indicação de hialuronidase) Iduronato sulfato sulfatase Mucopolissacaridose MPS II (síndrome de Hunter) Lecitina-colesterol aciltransferase (LCAT) Deficiência completa de LCAT, doença do olho de peixe, aterosclerose, hipercolesterolemia Enzima metabolizadora de leucina Acidemia isovalérica Enzima metabolizadora de leucina Doença da urina de xarope de bordo Lisina oxidase Acidemia glutárica de tipo I Lipase ácida lisossomal Doença de armazenamento de éster colesterílico (CESD) Lipase ácida lisossomal Deficiência de lipase ácida lisossomal Lipase ácida lisossomal Doença de Wolman Pepstatina lisossomal -insensitiva peptidase Lipofuscinose ceróide de forma infantil tardia (CLN2, doença de Jansky- Bielschowsky) Manose (Man) fosfato (P) isomerase Disfunções congênitas de N-glicosilação CDG Ib Manosil -α-1,6-glicoproteína-β-1,2-N- Doenças congênitas de N-glicosilação acetilglucosminiltransferase CDG IIa Metaloproteinase-2 Síndrome de Winchester metilmalonil -CoA mutase Acidemia metilmalônica (não responsiva à vitamina B12) N-acetil galactosamina α-4-sulfatase Mucopolissacaridose MPS VI ( síndrome sulfatase (arilsulfatase B) de Maroteaux- Lamy) N-acetil-D- glucosaminidase Mucopolissacaridose MPS III (síndrome de Sanfilippo) de Tipo III-B N-acetil- galactosaminidase Doença de Schindler de Tipo I (forma infantil grave) N-acetil- galactosaminidase Doença de Schindler de Tipo II ( doença de Kanzaki , forma de início na idade adulta) N-acetil- galactosaminidase Doença de Schindler de Tipo III (forma intermediária) N-acetil-glucosaminina-6-sulfato sulfatase Mucopolissacaridose MPS III (síndrome de Sanfilippo) de Tipo III-D N-acetilglucosaminil-1-fosfotransferase Mucolipidose ML III (polidistrofia de pseudo-Hurler)
Efetor Indicação Subunidade catalítica de N- Mucolipidose ML II (doença das células I) acetilglucosaminil-1-fosfotransferase N-acetilglucosaminil-1-fosfotransferase, Mucolipidose ML III (polidistrofia de subunidade de reconhecimento de pseudo-Hurler) de Tipo III-C substrato N- Aspartilglucosaminidase Aspartilglucosaminúria Neuraminidase 1 (sialidase) Sialidose Oxalato oxidase Hiperoxalúria primária Palmitoil-proteína tioesterase-1 Lipofuscinose ceróide de forma adulta (CLN4, doença de Kufs) Palmitoil-proteína tioesterase-1 Lipofuscinose ceróide de forma infantil (CLN1, doença de Santavuori-Haltia) Fenilalanina hidroxilase Fenilcetonúria Fosfomanomutase-2 Disfunções congênitas de N-glicosilação CDG Ia (apenas formas neurológicas e neurológicas-multiviscerais) Porfobilinogênio desaminase Porfiria aguda intermitente Fosforilase de nucleosídeo de purina Deficiência de fosforilase de nucleosídeo de purina pirimidina 5 ' nucleotidase Anemia hemolítica e/ou deficiência de pirimidina 5' nucleotidase Esfingomielinase Doença de Niemann-Pick de tipo A Esfingomielinase Doença de Niemann-Pick de tipo B Esterol 27-hidroxilase Cerebrotendínea xantomatose (Lipidose de colestanol) Timidina fosforilase Encefalomiopatia neurogastrointestinal mitocondrial (MNGIE) Tri-hexosilceramida α-galactosidase Doença de Fabry tirosinofenol-liase Tirosinemia de tipo 1 tirosinase, por exemplo, OCA1 albinismo, por exemplo, albinismo ocular UDP-GlcNAc: dolicil-P NAcGlc Doenças congênitas de N-glicosilação fosfotransferase CDG Ij UDP-N-acetilglucosamina-2-epimerase/N- Sialúria de Tipo francês acetilmanosamina quinase, sialina Uricase Síndrome de Lesch-Nyhan , gota uridina difosfato glucuronil- transferase Síndrome de Crigler-Najjar (p.ex, UGT1A1) α-1,2-manosiltransferase Disfunções congênitas de N-glicosilação
Efetor Indicação CDG Il (608776) α-1,2-manosiltransferase Disfunções congênitas de N-glicosilação, de tipo I (defeitos de glicosilação pré-Golgi) α-1,3-manosiltransferase Disfunções congênitas de N-glicosilação CDG Ii α-D-Manosidase α-Manosidose, de tipo I (grave) ou II (leve) α-L- Fucosidase Fucosidose α-l- iduronidase Mucopolissacaridose MPS I H/S ( síndrome de Hurler- Scheie) α-l- iduronidase Mucopolissacaridose MPS I-H (síndrome de Hurler) α-l- iduronidase Mucopolissacaridose MPS I-S ( síndrome de Scheie ) β-1,4-Galactosiltransferase Disfunções congênitas de N-glicosilação CDG IId β-1,4-manosiltransferase Disfunções congênitas de N-glicosilação CDG Ik β-D-Manosidase β-Manosidose β-Galactosidase Mucopolissacaridose MPS IV (síndrome de Morquio) de Tipo IV-B β-glucuronidase Mucopolissacaridose MPS VII (síndrome de Sly) β-Hexosaminidase A Doença de Tay-Sachs β-Hexosaminidase B Doença de Sandhoff
[001614] Em algumas modalidades, um efetor no presente documento descrito compreende uma enzima da Tabela A, ou uma variante funcional da mesma, por exemplo, um homólogo (por exemplo, ortólogo ou parálogo) ou fragmento. Em algumas modalidades, a variante funcional catalisa a mesma reação que a proteína de tipo selvagem correspondente, por exemplo, a uma taxa não inferior a 10%, 20%, 30% , 40% ou 50% menor do que a proteína de tipo selvagem. Em algumas modalidades, um anelossomo codificando uma enzima da Tabela A, ou uma variante funcional da mesma, é usado para o tratamento de uma doença ou disfunção da Tabela A. Em algumas modalidades, um anelossomo é usado para entregar uridina difosfato glucuronil-transferase ou uma variante funcional da mesma a uma célula-alvo, por exemplo, uma célula do fígado.
Em algumas modalidades, um anelossomo é usado para entregar OCA1 ou uma variante funcional do mesmo a uma célula alvo, por exemplo, uma célula retinal.
Tabela B.
Efetores não enzimáticos exemplares e indicações correspondentes Efetor Indicação Proteína do neurônio motor de atrofia muscular espinhal sobrevivência (SMN) Distrofina ou microdistrofina distrofia muscular (por exemplo, distrofia muscular de Duchenne ou distrofia muscular de Becker) Proteína de complemento, por Deficiência do fator de complemento I exemplo, fator de complemento C1 Fator de complemento H Síndrome urêmica hemolítica atípica Cistinosina (transportador de Cistinose cistina lisossomal) Proteína secretora epididimal 1 Doença de Niemann-Pick de Tipo C2 (HE1; proteína NPC2) Transportador de GDP-fucose-1 Disfunções congênitas de N-glicosilação CDG IIc (síndrome de Rambam-Hasharon) Proteína ativadora GM2 Deficiência de proteína ativadora GM2 (variante AB da doença de Tay-Sachs, GM2A) Proteína CLN3 transmembrana Lipofuscinose ceróide de forma juvenil (CLN3, lisossomal doença de Batten, doença de Vogt- Spielmeyer) Proteína CLN5 transmembrana Lipofuscinose ceróide variante da forma infantil lisossomal tardia, tipo finlandês (CLN5) Co-transportador de fosfato de Na, Disfunção de armazenamento de ácido siálico sialina infantil Co-transportador de fosfato de Na, Sialúria de tipo finlandês (doença de Salla) sialina Proteína NPC1 Doença de Niemann-Pick de Tipo C1/Tipo D Complexo oligomérico de Golgi-7 Disfunções congênitas de N-glicosilação CDG IIe Prosaposina Deficiência de prosaposina Proteína protetora/ catepsina A Galactosialidose (síndrome de Goldberg,
Efetor Indicação (PPCA) deficiência combinada de neuraminidase e β- galactosidase) Proteína envolvida na utilização de Disfunçõescongênitas de N-glicosilação CDG Se manose-P-dolicol Saposina B Deficiência de saposina B (deficiência de ativador de sulfatídeo) Saposina C Deficiência de saposina C (deficiência de ativador de Gaucher) Fator de modificação da sulfatase-1 Mucossulfatidose (deficiência de sulfatase múltipla) Proteína CLN6 transmembranar Lipofuscinose ceróide variante da forma infantil tardia (CLN6) Proteína CLN8 transmembranar Epilepsia progressiva de Lipofuscinose ceróide com deficiência intelectual vWF doença de von Willebrand Fator I (fibrinogênio) Afibrinogenomia
[001615] Em algumas modalidades, um efetor no presente documento descrito compreende uma eritropoietina (EPO), por exemplo, uma eritropoietina humana (hEPO) ou uma variante funcional da mesma. Em algumas modalidades, um anelossomo codificando uma eritropoietina, ou uma variante funcional da mesma, é usado para estimular a eritropoiese. Em algumas modalidades, um anelossomo codificando uma eritropoietina, ou uma variante funcional da mesma, é usado para o tratamento de uma doença ou disfunção, por exemplo, anemia. Em algumas modalidades, um anelossomo é usado para entregar EPO ou uma variante funcional do mesmo a uma célula alvo, por exemplo, um glóbulo vermelho.
[001616] Em algumas modalidades, um efetor no presente documento descrito compreende um polipeptídeo da Tabela B, ou uma variante funcional do mesmo, por exemplo, um homólogo (por exemplo, ortólogo ou parálogo) ou fragmento. Em algumas modalidades, um anelossomo codificando um polipeptídeo da Tabela B, ou uma variante funcional do mesmo é usado para o tratamento de uma doença ou disfunção da Tabela B. Em algumas modalidades, um anelossomo é usado para entregar SMN ou uma variante funcional do mesmo a um célula-alvo, por exemplo, uma célula da medula espinhal e/ou um neurônio motor. Em algumas modalidades, um anelossomo é usado para entregar uma microdistrofina a uma célula alvo, por exemplo, um miócito.
[001617] Microdistrofinas exemplares são descritas em Duan, "Systemic AAV Micro-dystrophin Gene Therapy for Duchenne Muscular Dystrophy". Mol Ther. 3 de outubro de 2018; 26(10): 2337-2356. doi:
10.1016/j.ymthe.2018.07.011. Epub 17 de julho de 2018.
[001618] Em algumas modalidades, um efetor no presente documento descrito compreende um fator de coagulação, por exemplo, um fator de coagulação listado na Tabela A ou na Tabela B no presente documento. Em algumas modalidades, um efetor no presente documento descrito compreende uma proteína que, quando mutada, causa um disfunçãono armazenamento lisossomal, por exemplo, uma proteína listada na Tabela A ou Tabela B no presente documento. Em algumas modalidades, um efetor no presente documento descrito compreende uma proteína transportadora, por exemplo, uma proteína transportadora listada na Tabela B no presente documento.
[001619] Em algumas modalidades, uma variante funcional de uma proteína de tipo selvagem compreende uma proteína que tem uma ou mais atividades da proteína de tipo selvagem, por exemplo, a variante funcional catalisa a mesma reação que a proteína de tipo selvagem correspondente, por exemplo, a um taxa não menor do que 10%, 20%, 30%, 40% ou 50% menor do que a proteína de tipo selvagem. Em algumas modalidades, a variante funcional se liga ao mesmo parceiro de ligação que é ligado pela proteína de tipo selvagem, por exemplo, com uma Kd de não mais do que 10%, 20%, 30%, 40% ou 50% mais elevada do que a Kd da proteína de tipo selvagem correspondente para o mesmo parceiro de ligação sob as mesmas condições. Em algumas modalidades, a variante funcional tem uma sequência de polipeptídeos pelo menos 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, ou 99% idêntica àquela do polipeptídeo de tipo selvagem. Em algumas modalidades, a variante funcional compreende um homólogo (por exemplo, ortólogo ou parálogo) da proteína de tipo selvagem correspondente. Em algumas modalidades, a variante funcional é uma proteína de fusão. Em algumas modalidades, a fusão compreende uma primeira região com pelo menos 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, ou 99% de identidade com a proteína de tipo selvagem correspondente e uma segunda região heteróloga. Em algumas modalidades, a variante funcional compreende ou consiste em um fragmento da proteína de tipo selvagem correspondente.
[001620] Alguns exemplos de peptídeos incluem, mas não estão limitados a, uma etiqueta ou marcador fluorescente, antígeno, peptídeo terapêutico, peptídeo sintético ou análogo a partir de peptídeo naturalmente bioativo, peptídeo agonista ou antagonista, peptídeo antimicrobiano, um peptídeo de direcionamento ou citotóxico, um peptídeo de degradação ou autodestruição e peptídeos de degradação ou autodestruição. Os peptídeos úteis na invenção descrita no presente documento incluem também peptídeos de ligação ao antígeno, por exemplo, anticorpo de ligação ao antígeno ou fragmentos tipo anticorpos, tais como anticorpos de cadeia única, nanocorpos (ver, por exemplo, Steeland et al. 2016. Nanobodies as therapeutics: big opportunities for small antibodies.Drug Discov Today: 21 (7): 1076-113). Tais peptídeos de ligação ao antígeno se podem ligar a um antígeno citosólico, um antígeno nuclear ou um antígeno intraorganelar.
[001621] Em algumas modalidades, o elemento genético inclui uma sequência codificando uma proteína, por exemplo, uma proteína terapêutica. Alguns exemplos de proteínas terapêuticas podem incluir, mas não estão limitados a, um hormônio, uma citocina, uma enzima, um anticorpo, um fator de transcrição, um receptor (por exemplo, um receptor de membrana), um ligante, um transportador de membrana, uma proteína secretada, um peptídeo, uma proteína transportadora, uma proteína estrutural, uma nuclease ou um seu componente.
[001622] Em algumas modalidades, a composição ou anelossomo descrito no presente documento inclui um polipeptídeo ligado a um ligante que é capaz de visar um local, tecido ou célula específico. Sequências Reguladoras
[001623] Em algumas modalidades, o elemento genético compreende uma sequência reguladora, por exemplo, um promotor ou um intensificador, operacionalmente ligada à sequência codificando o efetor.
[001624] Em algumas modalidades, um promotor inclui uma sequência de DNA que está localizada adjacente a uma sequência de DNA que codifica um produto de expressão. Um promotor pode ser ligado operacionalmente à sequência de DNA adjacente. Um promotor aumenta tipicamente uma quantidade de produto expressa a partir da sequência de DNA em comparação com uma quantidade do produto expresso quando não existe promotor. Um promotor de um organismo pode ser usado para intensificar a expressão do produto a partir da sequência de DNA que tem origem a partir de um outro organismo. Por exemplo, um promotor vertebrado pode ser usado para a expressão de GFP de água-viva em vertebrados. Ainda, um elemento promotor pode aumentar uma quantidade de produtos expressos para múltiplas sequências de DNA anexadas em tandem. Consequentemente, um elemento promotor pode intensificar a expressão de um ou mais produtos. Múltiplos elementos promotores são bem conhecidos dos peritos na técnica.
[001625] Em uma modalidade é desejada expressão constitutiva de elevado nível. Exemplos de tais promotores incluem, sem limitação, o promotor/intensificador da repetição de terminal longo (LTR) do vírus retroviral de sarcoma de Rous (RSV), o promotor/intensificador imediato de citomegalovírus (CMV) (ver, por exemplo, Boshart et al., Cell, 41: 521-530 (1985)), o promotor de SV40, o promotor de di-hidrofolato redutase, o promotor citoplasmático de .beta.-actina e o promotor de fosfoglicerol cinase (PGK).
[001626] Em uma outra modalidade podem ser desejados promotores indutíveis. Os promotores indutíveis são aqueles que são regulados por compostos exogenamente fornecidos, tanto em cis como em trans, incluindo, sem limitação, o promotor de metalotionina (MT) de ovelha indutível por zinco; o promotor do vírus do tumor mamário de camundongo (MMTV) indutível por dexametasona (Dex); o sistema promotor da polimerase T7 (WO 98/10088); o sistema repressível para tetraciclina (Gossen et al., Proc. Natl. Acad. Sci. USA, 89: 5547-5551 (1992)); o sistema indutível por tetraciclina (Gossen et al., Science, 268: 1766-1769 (1995); ver também Harvey et al., Curr. Opin. Chem. Biol., 2: 512-518 (1998)); o sistema indutível por RU486 (Wang et al., Nat. Biotech., 15: 239-243 (1997) e Wang et al., Gene Ther., 4: 432-441 (1997)]; e o sistema indutível por rapamicina (Magari et al., J. Clin. Invest., 100: 2865-2872 (1997); Rivera et al., Nat. Medicine. 2: 1028- 1032 (1996)). Outros tipos de promotores indutíveis que podem ser úteis em este contexto, são aqueles que são regulados por um estado fisiológico específico, por exemplo, temperatura, fase aguda ou somente em células replicantes.
[001627] Em algumas modalidades é usado um promotor nativo para uma sequência de gene ou ácido nucleico de interesse. O promotor nativo pode ser usado quando é desejado que a expressão do gene ou da sequência de ácidos nucleicos deva mimetizar a expressão nativa. O promotor nativo pode ser usado quando a expressão do gene ou outra sequência de ácidos nucleicos tem de ser regulada temporalmente ou pelo desenvolvimento ou de uma maneira específica de tecidos ou em resposta a estímulos transcricionais específicos. Em uma modalidade adicional, outros elementos de controle de expressão nativa, tal como elementos intensificadores, locais de poliadenilação ou sequências de consenso de Kozak, podem ser também usados para mimetizar a expressão nativa.
[001628] Em algumas modalidades, o elemento genético compreende um gene operacionalmente ligado a um promotor específico de tecidos. Por exemplo, se for desejada expressão no músculo esquelético, pode ser usado um promotor ativo no músculo. Estes incluem os promotores de genes codificando α-actina esquelética, fita leve 2A da miosina, distrofina, creatina cinase muscular, bem como promotores musculares sintéticos com atividades mais elevadas do que os promotores de ocorrência natural. Ver Li et al., Nat. Biotech., 17: 241-245 (1999). Exemplos de promotores que são específicos de tecidos são conhecidos para a albumina hepática, Miyatake et al. J. Virol., 71: 5124- 32 (1997); promotor do núcleo do vírus da hepatite B, Sandig et al., Gene Ther. 3: 1002-9 (1996); alfa-fetoproteína (AFP), Arbuthnot et al., Hum. Gene Ther., 7: 1503-14 (1996)], osso (osteocalcina, Stein et al., Mol. Biol. Rep., 24: 185-96 (1997); sialoproteína óssea, Chen et al., J. Bone Miner.Res. 11: 654-64 (1996)), linfócitos (CD2, Hansal et al., J. Immunol., 161: 1063-8 (1998); fita pesada de imunoglobulina; cadeia a de receptor de células T), neuronal (promotor da enolase específica de neurônios (NSE), Andersen et al., Cell. Mol. Neurobiol., 13: 503-15 (1993); gene de cadeia leve dos neurofilamentos, Piccioliet al., Proc. Natl. Acad. Sci. USA, 88: 5611-5 (1991); o gene de vgf específico de neurônios, Piccioli et al., Neuron, 15: 373-84 (1995)]; entre outros.
[001629] O elemento genético pode incluir um intensificador, por exemplo, uma sequência de DNA que está localizada adjacente à sequência de DNA que codifica um gene. Os elementos intensificadores estão tipicamente localizados a montante de um elemento promotor ou podem estar localizados a jusante de ou dentro de uma sequência de DNA codificante (por exemplo, uma sequência de DNA transcrita ou traduzida em um produto ou produtos). Consequentemente, um elemento intensificador pode estar localizado 100 pares de bases, 200 pares de bases ou 300 ou mais pares de bases a montante ou a jusante de uma sequência de DNA que codifica o produto. Os elementos intensificadores podem aumentar uma quantidade de produto recombinante expressa a partir de uma sequência de DNA acima da expressão aumentada originada por um elemento promotor. Múltiplos elementos intensificadores estão prontamente disponíveis para os peritos na técnica.
[001630] Em algumas modalidades, o elemento genético compreende uma ou mais repetições terminais invertidas (ITR) flanqueando as sequências codificando os produtos de expressão descritos no presente documento. Em algumas modalidades, o elemento genético compreende uma ou mais repetições terminais longas (LTR) flanqueando a sequência codificando os produtos de expressão descritos no presente documento. Exemplos de sequências promotoras que podem ser usadas incluem, mas não estão limitadas, ao promotor inicial do vírus símio 40 (SV40), vírus do tumor mamário do camundongo (MMTV), promotor da repetição do terminal longo (LTR) do vírus da imunodeficiência humana (HIV), promotor MoMuLV, um promotor do vírus da leucemia aviária, um promotor inicial imediato do vírus Epstein- Barr e um promotor do vírus Rous sarcoma. Proteínas de Replicação
[001631] Em algumas modalidades, o elemento genético do anelossomo, por exemplo, anelossomo sintético, pode incluir sequências que codificam uma ou mais proteínas de replicação. Em algumas modalidades, o anelossomo pode se replicar por um método de replicação de círculo rolante, por exemplo, a síntese da fita principal e da fita secundária é desacoplada. Em tais modalidades, o anelossomo compreende três elementos adicionais: i) um gene codificando uma proteína iniciadora, ii) uma origem de fita dupla e iii) uma origem de fita única. Um complexo de proteína de replicação de círculo rolante (RCR) compreendendo proteínas de replicação se liga à fita principal e desestabiliza a origem de replicação. O complexo RCR cliva o genoma para gerar uma extremidade 3'OH livre. A DNA polimerase celular inicia a replicação do DNA viral a partir da extremidade 3'OH livre. Após o genoma possuir sido replicado, o complexo RCR fecha o ciclo covalentemente. Isto leva à liberação de uma molécula de um DNA parental de fita simples circular positiva e uma molécula de DNA de fita dupla circular composta pela fita parental negativa e pela fita positiva recém-sintetizada. A molécula de DNA de fita simples pode ser tanto encapsidada como envolvida em uma segunda ronda de replicação. Ver, por exemplo, Virology Journal 2009, 6: 60 doi: 10.1186/1743-422X- 6-60.
[001632] O elemento genético pode compreender uma sequência codificando uma polimerase, por exemplo, RNA polimerase ou uma DNA polimerase. Outras Sequências
[001633] Em algumas modalidades, o elemento genético inclui ainda um ácido nucleico codificando um produto (por exemplo, uma ribozima, um mRNA terapêutico codificando uma proteína, um gene exógeno).
[001634] Em algumas modalidades, o elemento genético inclui uma ou mais sequências que afetam o tropismo de espécies e/ou tecidos e/ou células (por exemplo, sequências de proteínas de capsídeo), infectividade (por exemplo, sequências de proteínas de capsídeo), imunossupressão/ativação (por exemplo, ácidos nucleicos reguladores), ligação e/ou empacotamento do genoma viral, evasão imunitária (não imunogenicidade e/ou tolerância), farmacocinética,
endocitose e/ou anexação celular, entrada nuclear, modulação e localização intracelulares, modulação da exocitose, propagação e proteção de ácidos nucleicos do anelossomo em um hospedeiro ou célula hospedeira.
[001635] Em algumas modalidades, o elemento genético pode compreender outras sequências que incluem DNA, RNA ou ácidos nucleicos artificiais. As outras sequências podem incluir, mas não estão limitadas a, DNA genômico, cDNA ou sequências que codificam tRNA, mRNA, rRNA, miRNA, gRNA, siRNA ou outras moléculas de RNAi. Em uma modalidade, o elemento genético inclui uma sequência codificando um siRNA para visar um loci diferente do mesmo produto de expressão gênica que o ácido nucleico regulador. Em uma modalidade, o elemento genético inclui uma sequência codificando um siRNA para visar um produto de expressão gênica diferente do ácido nucleico regulador.
[001636] Em algumas modalidades, o elemento genético compreende ainda uma ou mais das seguintes sequências: uma sequência que codifica um ou mais miRNAs, uma sequência que codifica uma ou mais proteínas de replicação, uma sequência que codifica um gene exógeno, uma sequência que codifica um terapêutico, uma sequência reguladora (por exemplo, um promotor, intensificador), uma sequência que codifica uma ou mais sequências reguladoras que visam genes endógenos (siRNA, lncRNAs, shRNA) e uma sequência que codifica um mRNA ou proteína terapêutico.
[001637] As outras sequências podem possuir um comprimento de cerca de 2 a cerca de 5000 nts, cerca de 10 a cerca de 100 nts, cerca de 50 a cerca de 150 nts, cerca de 100 a cerca de 200 nts, cerca de 150 a cerca de 250 nts cerca de 200 a cerca de 300 nts, cerca de 250 a cerca de 350 nts, cerca de 300 a cerca de 500 nts, cerca de 10 a cerca de 1000 nts, cerca de 50 a cerca de 1000 nts, cerca de 100 a cerca de 1000 nts, cerca de 1000 a cerca de 2000 nts, cerca de 2000 a cerca de
3000 nts, cerca de 3000 a cerca de 4000 nts, cerca de 4000 a cerca de 5000 nts ou qualquer gama intermédia. Genes Codificados
[001638] Por exemplo, o elemento genético pode incluir um gene associado a uma via bioquímica de sinalização, por exemplo, um gene ou polinucleotídeo associado à via bioquímica de sinalização. Os exemplos incluem um gene ou polinucleotídeo associado à doença. Um gene ou polinucleotídeo “associado à doença” se refere a qualquer gene ou polinucleotídeo que está originando produtos de transcrição ou tradução a um nível anormal ou em uma forma anormal em células derivadas de um tecido afetado por doença em comparação com tecidos ou células de um controlo sem doença. Pode ser um gene que se torne expresso a um nível anormalmente elevado; pode ser um gene que se torne expresso a um nível anormalmente baixo, onde a expressão alterada se correlaciona com a ocorrência e/ou progressão da doença. Um gene associado à doença se refere também a um gene possuindo mutação(ções) ou variação genética que é diretamente responsável ou está em desequilíbrio de ligação com um gene(s) que é(são) responsável(eis) pela etiologia de uma doença.
[001639] Exemplos de genes e polinucleotídeos associados a doenças estão disponíveis a partir do McKusick-Nathans Institute of Genetic Medicine, Johns Hopkins University (Baltimore, Md.) e National Center for Biotechnology Information, National Library of Medicine (Bethesda, Md.). Exemplos de genes e polinucleotídeos associados a doenças são listados nas Tabelas A e B da Patente dos E.U.A. N.º: 8,697,359, que é no presente documento incorporada por referência em sua totalidade. Informação específica sobre doenças está disponível a partir do McKusick-Nathans Institute of Genetic Medicine, Johns Hopkins University (Baltimore, Md.) e National Center for Biotechnology Information, National Library of Medicine (Bethesda, Md.). Exemplos de genes e polinucleotídeos associados à via bioquímica de sinalização são listados nas Tabelas A-C da Patente dos E.U.A. N.º: 8,697,359, que é no presente documento incorporada por referência em sua totalidade.
[001640] Além disso, os elementos genéticos podem codificar frações de direcionamento, como descrito em outro lugar no presente documento. Isto pode ser alcançado, por exemplo, por inserção de um polinucleotídeo codificando um açúcar, um glicolipídeo ou uma proteína, tal como um anticorpo. Os peritos na técnica conhecem métodos adicionais para geração de frações de direcionamento. Sequência Viral
[001641] Em algumas modalidades, o elemento genético compreende pelo menos uma sequência viral. Em algumas modalidades, a sequência tem homologia ou identidade com uma ou mais sequências de um vírus de DNA de fita simples, por exemplo, Anellovirus, Bidnavirus, Circovirus, Geminivirus, Genomovirus, Inovirus, Microvirus, Nanovirus, Parvovirus e Spiravirus. Em algumas modalidades, a sequência tem homologia ou identidade com uma ou mais sequências de um vírus de DNA de fita dupla, por exemplo, Adenovirus, Ampullavirus, Ascovirus, Asfarvirus, Baculovirus, Fusellovirus, Globulovirus, Guttavirus, Hytrosavirus, Herpesvirus, Iridovirus, Lipothrixvirus, Nimavirus e Poxvirus. Em algumas modalidades, a sequência tem homologia ou identidade com uma ou mais sequências de um vírus de RNA, por exemplo, Alphavirus, Furovirus, Hepatitis virus, Hordeivirus, Tobamovirus, Tobravirus, Tricornavirus, Rubivirus, Birnavirus, Cystovirus, Partitivirus e Reovirus.
[001642] Em algumas modalidades, o elemento genético pode compreender uma ou mais sequências a partir de um vírus não patogênico, por exemplo, um vírus simbiótico, por exemplo, um vírus comensal, por exemplo, um vírus nativo, por exemplo, um Anellovirus. Mudanças recentes na nomenclatura classificaram os três Anelloviruses capazes de infectar células humanas nos Gêneros Alphatorquevirus (TT), Betatorquevirus (TTM) e Gammatorquevirus (TTMD) da família de vírus Anelloviridae. Até à data, os Anelloviruses não foram ligados a qualquer doença humana. Em algumas modalidades, o elemento genético pode compreender uma sequência com homologia ou identidade com um vírus Torque Teno (TT), um vírus de DNA não envelopado, de fita simples com um genoma circular, de sentido negativo. Em algumas modalidades, o elemento genético pode compreender uma sequência com homologia ou identidade com um vírus SEN, um vírus Sentinel, um minivírus tipo TTV e um vírus TT. Diferentes tipos de vírus TT foram descritos incluindo genótipo 6 de vírus TT, grupo de vírus TT, vírus tipo TTV DXL1 e vírus tipo TTV DXL2. Em algumas modalidades, o elemento genético pode compreender uma sequência com homologia ou identidade com um vírus mais pequeno, Mini Vírus tipo Torque Teno (TTM) ou um terceiro vírus com um tamanho genômico entre aquele de TTV e TTMV, chamado vírus Médio tipo Torque Teno (TTMD). Em algumas modalidades, o elemento genético pode compreender uma ou mais sequências ou um fragmento de uma sequência de um vírus não patogênico possuindo pelo menos cerca de 60%, 70% 80%, 85%, 90% 95%, 96%, 97%, 98% e 99% de identidade de sequências de nucleotídeos com qualquer uma das sequências de nucleotídeo descritas no presente documento.
[001643] Em algumas modalidades, o elemento genético pode compreender uma ou mais sequências ou um fragmento de uma sequência de um vírus substancialmente não patogênico possuindo pelo menos cerca de 60%, 70% 80%, 85%, 90% 95%, 96%, 97%, 98% e 99% de identidade de sequências de nucleotídeos com qualquer uma das sequências de nucleotídeo descritas no presente documento, por exemplo, Tabela 41. Tabela 41: Exemplos de Anelloviruses e suas sequências. Os números de acesso e informação de sequências relacionadas podem ser obtidos em www.ncbi.nlm.nih.gov/genbank/, como referenciado em 11 de dezembro de 2018. # de Acesso Descrição AB017613,1 DNA do vírus Torque teno 16, genoma completo, isolado: TUS01 AB026345,1 Genes do vírus TT para ORF1 e ORF2, cds completas, isolado:TRM1 AB026346,1 Genes do vírus TT para ORF1 e ORF2, cds completas, isolado:TK16 AB026347,1 Genes do vírus TT para ORF1 e ORF2, cds completas, isolado:TP1-3 AB028669,1 Gene do vírus TT para ORF1 e ORF2, genoma completo, isolado:TJN02 AB030487,1 Gene do vírus TT para pORF2a, pORF2b, pORF1, cds completas, clone:JaCHCTC19 AB030488,1 Gene do vírus TT para pORF2a, pORF2b, pORF1, cds completas, clone:JaBD89 AB030489,1 Gene do vírus TT para pORF2a, pORF2b, pORF1, cds completas, clone:JaBD98 AB038340,1 Genes do vírus TT para ORF2s, ORF1, ORF3, cds completas AB038622,1 Genes do vírus TT para ORF2, ORF1, ORF3, cds completas, isolado:TTVyon-LC011 AB038623,1 Genes do vírus TT para ORF2, ORF1, ORF3, cds completas, isolado:TTVyon-KC186 AB038624,1 Genes do vírus TT para ORF2, ORF1, ORF3, cds completas, isolado:TTVyon-KC197 AB041821,1 mRNA do vírus TT para VP1, cds completas Genes do vírus Torque teno para ORF1, ORF2, ORF3, ORF4, cds completas, isolado: AB050448,1 TYM9 AB060592,1 Gene do vírus Torque teno para ORF1, ORF2, ORF3, ORF4, clone: SAa-39 Gene do vírus Torque teno para ORF1, ORF2, ORF3, ORF4, cds completas, clone: SAa- AB060593,1 38 AB060595,1 Gene do vírus TT para ORF1, ORF2, ORF3, ORF4, cds completas, clone:SAj-30 AB060596,1 Gene do vírus TT para ORF1, ORF2, ORF3, ORF4, cds completas, clone:SAf-09 AB064596,1 DNA do vírus Torque teno, genoma completo, isolado: CT25F AB064597,1 DNA do vírus Torque teno, genoma completo, isolado: CT30F AB064599,1 DNA do vírus Torque teno, genoma completo, isolado: JT03F AB064600,1 DNA do vírus Torque teno, genoma completo, isolado: JT05F AB064601,1 DNA do vírus Torque teno, genoma completo, isolado: JT14F AB064602,1 DNA do vírus Torque teno, genoma completo, isolado: JT19F AB064603,1 DNA do vírus Torque teno, genoma completo, isolado: JT41F AB064604,1 DNA do vírus Torque teno, genoma completo, isolado: CT39F AB064606,1 DNA do vírus Torque teno, genoma completo, isolado: JT33F AB290918,1 DNA do vírus médio Torque teno 1, genoma completo, isolado: MD1-073 AF079173,1 Estirpe do vírus TT TTVCHN1, genoma completo AF116842,1 Estirpe do vírus TT BDH1, genoma completo AF122914,3 Isolado do vírus TT JA20, genoma completo
# de Acesso Descrição AF122917,1 Isolado do vírus TT JA4, genoma completo AF122919,1 Isolado do vírus TT JA10 genes desconhecidos AF129887,1 Vírus TT TTVCHN2, genoma completo AF247137,1 Isolado do vírus TT TUPB, genoma completo AF254410,1 Genes da proteína ORF2 e proteína ORF1 do vírus TT, cds completas AF298585,1 Isolado de vírus TT Polish P/1C1, genoma completo AF315076,1 Genes desconhecidos de vírus tipo TT DXL1 AF315077,1 Genes desconhecidos de vírus tipo TT DXL2 AF345521,1 Genes Orf2 e Orf1 de isolado de vírus TT TCHN-G1, cds completas AF345522,1 Genes Orf2 e Orf1 de isolado de vírus TT TCHN-E, cds completas AF345525,1 Genes Orf2 e Orf1 de isolado de vírus TT TCHN-D2, cds completas AF345527,1 Genes Orf2 e Orf1 de isolado de vírus TT TCHN-C2, cds completas AF345528,1 Genes Orf2 e Orf1 de isolado de vírus TCHN-F, cds completas AF345529,1 Genes Orf2 e Orf1 de isolado de vírus TT TCHN-G2, cds completas AF371370,1 Genes ORF1, ORF3 e ORF2 de vírus TT, cds completas AJ620212,1 Vírus Torque teno, isolado tth6, genoma completo AJ620213,1 Vírus Torque teno, isolado tth10, genoma completo AJ620214,1 Vírus Torque teno, isolado tth11g2, genoma completo AJ620215,1 Vírus Torque teno, isolado tth18, genoma completo AJ620216,1 Vírus Torque teno, isolado tth20, genoma completo AJ620217,1 Vírus Torque teno, isolado tth21, genoma completo AJ620218,1 Vírus Torque teno, isolado tth3, genoma completo AJ620219,1 Vírus Torque teno, isolado tth9, genoma completo AJ620220,1 Vírus Torque teno, isolado tth16, genoma completo AJ620221,1 Vírus Torque teno, isolado tth17, genoma completo AJ620222,1 Vírus Torque teno, isolado tth25, genoma completo AJ620223,1 Vírus Torque teno, isolado tth26, genoma completo AJ620224,1 Vírus Torque teno, isolado tth27, genoma completo AJ620225,1 Vírus Torque teno, isolado tth31, genoma completo AJ620226,1 Vírus Torque teno, isolado tth4, genoma completo AJ620227,1 Vírus Torque teno, isolado tth5, genoma completo AJ620228,1 Vírus Torque teno, isolado tth14, genoma completo AJ620229,1 Vírus Torque teno, isolado tth29, genoma completo AJ620230,1 Vírus Torque teno, isolado tth7, genoma completo AJ620231,1 Vírus Torque teno, isolado tth8, genoma completo AJ620232,1 Vírus Torque teno, isolado tth13, genoma completo AJ620233,1 Vírus Torque teno, isolado tth19, genoma completo
# de Acesso Descrição AJ620234,1 Vírus Torque teno, isolado tth22g4, genoma completo AJ620235,1 Vírus Torque teno, isolado tth23, genoma completo AM711976,1 Genoma completo de vírus TT sle1957 AM712003,1 Genoma completo de vírus TT sle1931 AM712004,1 Genoma completo de vírus TT sle1932 AM712030,1 Genoma completo de vírus TT sle2057 AM712031,1 Genoma completo de vírus TT sle2058 AM712032,1 Genoma completo de vírus TT sle2072 AM712033,1 Genoma completo de vírus TT sle2061 AM712034,1 Genoma completo de vírus TT sle2065 AY026465,1 Genes ORF2 e ORF1 de isolado de vírus TT L01, cds completas AY026466,1 Genes ORF2 e ORF1 de isolado de vírus TT L02, cds completas Genes ORF2 (ORF2), ORF1A (ORF1A) e ORF1B (ORF1B) de clone P2-9-02 de vírus DQ003341,1 Torque teno, cds completas Genes ORF2 (ORF2), ORF1A (ORF1A) e ORF1B (ORF1B) de clone P2-9-07 de vírus DQ003342,1 Torque teno, cds completas Genes ORF2 (ORF2), ORF1A (ORF1A) e ORF1B (ORF1B) de clone P2-9-08 de vírus DQ003343,1 Torque teno, cds completas Genes ORF2 (ORF2), ORF1A (ORF1A) e ORF1B (ORF1B) de clone P2-9-16 de vírus DQ003344,1 Torque teno, cds completas DQ186994,1 Genes ORF2 (ORF2) e ORF1 (ORF1) de clone P601 de vírus Torque teno, cds completas DQ186995,1 Genes ORF2 (ORF2) e ORF1 (ORF1) de clone P605 de vírus Torque teno, cds completas Genes ORF2 (ORF2) e ORF1 (ORF1) de clone BM1A-02 de vírus Torque teno, cds DQ186996,1 completas Genes ORF2 (ORF2) e ORF1 (ORF1) de clone BM1A-09 de vírus Torque teno, cds DQ186997,1 completas Genes ORF2 (ORF2) e ORF1 (ORF1) de clone BM1A-13 de vírus Torque teno, cds DQ186998,1 completas Genes ORF2 (ORF2) e ORF1 (ORF1) de clone BM1B-05 de vírus Torque teno, cds DQ186999,1 completas Genes ORF2 (ORF2) e ORF1 (ORF1) de clone BM1B-07 de vírus Torque teno, cds DQ187000,1 completas Genes ORF2 (ORF2) e ORF1 (ORF1) de clone BM1B-11 de vírus Torque teno, cds DQ187001,1 completas Genes ORF2 (ORF2) e ORF1 (ORF1) de clone BM1B-14 de vírus Torque teno, cds DQ187002,1 completas Gene ORF2 (ORF2) de clone BM1B-08 de vírus Torque teno, cds completas; e gene ORF1 DQ187003,1 (ORF1) não funcional, sequência completa
# de Acesso Descrição Genes ORF2 (ORF2) e ORF1 (ORF1) de clone BM1C-16 de vírus Torque teno, cds DQ187004,1 completas Genes ORF2 (ORF2) e ORF1 (ORF1) de clone BM1C-10 de vírus Torque teno, cds DQ187005,1 completas Gene ORF2 (ORF2) de clone BM2C-25 de vírus Torque teno, cds completas; e gene ORF1 DQ187007,1 (ORF1) não funcional, sequência completa DQ361268,1 Gene ORF1 de isolado de vírus Torque teno ViPi04, cds completas EF538879,1 Genes ORF2 e ORF1 de isolado de vírus Torque teno CSC5, cds completas EU305675,1 Gene ORF1 de isolado de vírus Torque teno LTT7, cds completas EU305676,1 Gene ORF1 de isolado de vírus Torque teno LTT10, cds completas EU889253,1 Gene ORF1 não funcional de isolado de vírus Torque teno ViPi08, sequência completa Gene ORF2 de isolado de vírus Torque teno TW53A25, cds parciais; e gene ORF1, cds FJ392105,1 completas Gene ORF2 de isolado de vírus Torque teno TW53A27, cds parciais; e gene ORF1, cds FJ392107,1 completas Gene ORF2 de isolado de vírus Torque teno TW53A29, cds parciais; e gene ORF1, cds FJ392108,1 completas Gene ORF2 de isolado de vírus Torque teno TW53A35, cds parciais; e gene ORF1, cds FJ392111,1 completas Gene ORF2 de isolado de vírus Torque teno TW53A39, cds parciais; e gene ORF1, cds FJ392112,1 completas Gene ORF2 de isolado de vírus Torque teno TW53A26, cds completas; e gene ORF1 não FJ392113,1 funcional, sequência completa FJ392114,1 Genes ORF2 e ORF1 de isolado de vírus Torque teno TW53A30, cds completas FJ392115,1 Genes ORF2 e ORF1 de isolado de vírus Torque teno TW53A31, cds completas FJ392117,1 Gene ORF1 de isolado de vírus Torque teno TW53A37, cds completas FJ426280,1 Estirpe de vírus Torque teno SIA109, genoma completo FR751500,1 Genoma completo de vírus Torque teno, isolado TTV-HD23a (rheu215) GU797360,1 Clone 8-17 de vírus Torque teno, genoma completo HC742700,1 Sequência 7 da Patente WO2010044889 HC742710,1 Sequência 17 da Patente WO2010044889 JX134044,1 Isolado de minivírus TTV TTMV_LY1, genoma completo JX134045,1 Isolado de minivírus TTV TTMV_LY2, genoma completo KU243129,1 Isolado de minivírus TTV TTMV-204, genoma completo KY856742,1 Isolado de minivírus TTV zhenjiang, genoma completo LC381845,1 DNA de vírus Torque teno Humano/Japão/KS025/2016, genoma completo MH648892,1 Isolado de Anelloviridae sp. ctdc048, genoma completo
# de Acesso Descrição MH648893,1 Isolado de Anelloviridae sp. ctdh007, genoma completo MH648897,1 Isolado de Anelloviridae sp. ctcb038, genoma completo MH648900,1 Isolado de Anelloviridae sp. ctfc019, genoma completo MH648901,1 Isolado de Anelloviridae sp. ctbb022, genoma completo MH648907,1 Isolado de Anelloviridae sp. ctcf040, genoma completo MH648911,1 Isolado de Anelloviridae sp. cthi018, genoma completo MH648912,1 Isolado de Anelloviridae sp. ctea38, genoma completo MH648913,1 Isolado de Anelloviridae sp. ctbg006, genoma completo MH648916,1 Isolado de Anelloviridae sp. ctbg020, genoma completo MH648925,1 Isolado de Anelloviridae sp. ctci019, genoma completo MH648932,1 Isolado de Anelloviridae sp. ctid031, genoma completo MH648946,1 Isolado de Anelloviridae sp. ctdb017, genoma completo MH648957,1 Isolado de Anelloviridae sp. ctch017, genoma completo MH648958,1 Isolado de Anelloviridae sp. ctbh011, genoma completo MH648959,1 Isolado de Anelloviridae sp. ctbc020, genoma completo MH648962,1 Isolado de Anelloviridae sp. ctif015, genoma completo MH648966,1 Isolado de Anelloviridae sp. ctei055, genoma completo MH648969,1 Isolado de Anelloviridae sp. ctjg000, genoma completo MH648976,1 Isolado de Anelloviridae sp. ctcj064, genoma completo MH648977,1 Isolado de Anelloviridae sp. ctbj022, genoma completo MH648982,1 Isolado de Anelloviridae sp. ctbf014, genoma completo MH648983,1 Isolado de Anelloviridae sp. ctbd027, genoma completo MH648985,1 Isolado de Anelloviridae sp. ctch016, genoma completo MH648986,1 Isolado de Anelloviridae sp. ctbd020, genoma completo MH648989,1 Isolado de Anelloviridae sp. ctga035, genoma completo MH648990,1 Isolado de Anelloviridae sp. cthf001, genoma completo MH648995,1 Isolado de Anelloviridae sp. ctbd067, genoma completo MH648997,1 Isolado de Anelloviridae sp. ctce026, genoma completo MH648999,1 Isolado de Anelloviridae sp. ctfb058, genoma completo MH649002,1 Isolado de Anelloviridae sp. ctjj046, genoma completo MH649006,1 Isolado de Anelloviridae sp. ctcf030, genoma completo MH649008,1 Isolado de Anelloviridae sp. ctbg025, genoma completo MH649011,1 Isolado de Anelloviridae sp. ctbh052, genoma completo MH649014,1 Isolado de Anelloviridae sp. ctba003, genoma completo MH649017,1 Isolado de Anelloviridae sp. ctbb016, genoma completo MH649022,1 Isolado de Anelloviridae sp. ctch023, genoma completo MH649023,1 Isolado de Anelloviridae sp. ctbd051, genoma completo
# de Acesso Descrição MH649028,1 Isolado de Anelloviridae sp. ctbf9, genoma completo MH649038,1 Isolado de Anelloviridae sp. ctbi030, genoma completo MH649039,1 Isolado de Anelloviridae sp. ctca057, genoma completo MH649040,1 Isolado de Anelloviridae sp. ctch033, genoma completo MH649042,1 Isolado de Anelloviridae sp. ctjd005, genoma completo MH649045,1 Isolado de Anelloviridae sp. ctdc021, genoma completo MH649051,1 Isolado de Anelloviridae sp. ctdg044, genoma completo MH649056,1 Isolado de Anelloviridae sp. ctcc062, genoma completo MH649061,1 Isolado de Anelloviridae sp. ctid009, genoma completo MH649062,1 Isolado de Anelloviridae sp. ctdc018, genoma completo MH649063,1 Isolado de Anelloviridae sp. ctbf012, genoma completo MH649068,1 Isolado de Anelloviridae sp. ctcc066, genoma completo MH649070,1 Isolado de Anelloviridae sp. ctda011, genoma completo MH649077,1 Isolado de Anelloviridae sp. ctbh034, genoma completo MH649083,1 Isolado de Anelloviridae sp. ctdg028, genoma completo MH649084,1 Isolado de Anelloviridae sp. ctii061, genoma completo MH649085,1 Isolado de Anelloviridae sp. cteh021, genoma completo MH649092,1 Isolado de Anelloviridae sp. ctbg012, genoma completo MH649101,1 Isolado de Anelloviridae sp. ctif053, genoma completo MH649104,1 Isolado de Anelloviridae sp. ctei657, genoma completo MH649106,1 Isolado de Anelloviridae sp. ctca015, genoma completo MH649114,1 Isolado de Anelloviridae sp. ctbf050, genoma completo MH649122,1 Isolado de Anelloviridae sp. ctdc002, genoma completo MH649125,1 Isolado de Anelloviridae sp. ctbb15, genoma completo MH649127,1 Isolado de Anelloviridae sp. ctba013, genoma completo MH649137,1 Isolado de Anelloviridae sp. ctbb000, genoma completo MH649141,1 Isolado de Anelloviridae sp. ctbc019, genoma completo MH649142,1 Isolado de Anelloviridae sp. ctid026, genoma completo MH649144,1 Isolado de Anelloviridae sp. ctfj004, genoma completo MH649152,1 Isolado de Anelloviridae sp. ctcj13, genoma completo MH649156,1 Isolado de Anelloviridae sp. ctci006, genoma completo MH649157,1 Isolado de Anelloviridae sp. ctbd025, genoma completo MH649158,1 Isolado de Anelloviridae sp. ctbf005, genoma completo MH649161,1 Isolado de Anelloviridae sp. ctcf045, genoma completo MH649165,1 Isolado de Anelloviridae sp. ctcc29, genoma completo MH649169,1 Isolado de Anelloviridae sp. ctib021, genoma completo MH649172,1 Isolado de Anelloviridae sp. ctbh857, genoma completo
# de Acesso Descrição MH649174,1 Isolado de Anelloviridae sp. ctbj049, genoma completo MH649178,1 Isolado de Anelloviridae sp. ctfc006, genoma completo MH649179,1 Isolado de Anelloviridae sp. ctbe000, genoma completo MH649183,1 Isolado de Anelloviridae sp. ctbb031, genoma completo MH649186,1 Isolado de Anelloviridae sp. ctcb33, genoma completo MH649189,1 Isolado de Anelloviridae sp. ctcc12, genoma completo MH649196,1 Isolado de Anelloviridae sp. ctci060, genoma completo MH649199,1 Isolado de Anelloviridae sp. ctbb017, genoma completo MH649203,1 Isolado de Anelloviridae sp. cthc018, genoma completo MH649204,1 Isolado de Anelloviridae sp. ctbj003, genoma completo MH649206,1 Isolado de Anelloviridae sp. ctbg010, genoma completo MH649208,1 Isolado de Anelloviridae sp. ctid008, genoma completo MH649209,1 Isolado de Anelloviridae sp. ctbg056, genoma completo MH649210,1 Isolado de Anelloviridae sp. ctda001, genoma completo MH649212,1 Isolado de Anelloviridae sp. ctcf004, genoma completo MH649217,1 Isolado de Anelloviridae sp. ctbe029, genoma completo MH649223,1 Isolado de Anelloviridae sp. ctci016, genoma completo MH649224,1 Isolado de Anelloviridae sp. ctce11, genoma completo MH649228,1 Isolado de Anelloviridae sp. ctcf013, genoma completo MH649229,1 Isolado de Anelloviridae sp. ctcb036, genoma completo MH649241,1 Isolado de Anelloviridae sp. ctda027, genoma completo MH649242,1 Isolado de Anelloviridae sp. ctbf003, genoma completo MH649254,1 Isolado de Anelloviridae sp. ctjb007, genoma completo MH649255,1 Isolado de Anelloviridae sp. ctbb023, genoma completo MH649256,1 Isolado de Anelloviridae sp. ctca002, genoma completo MH649258,1 Isolado de Anelloviridae sp. ctcg010, genoma completo MH649263,1 Isolado de Anelloviridae sp. ctgh3, genoma completo MK012439,1 Isolado de Anelloviridae sp. cthe000, genoma completo MK012440,1 Isolado de Anelloviridae sp. ctjd008, genoma completo MK012448,1 Isolado de Anelloviridae sp. ctch012, genoma completo MK012457,1 Isolado de Anelloviridae sp. ctda009, genoma completo MK012458,1 Isolado de Anelloviridae sp. ctcd015, genoma completo MK012485,1 Isolado de Anelloviridae sp. ctfd011, genoma completo MK012489,1 Isolado de Anelloviridae sp. ctba003, genoma completo MK012492,1 Isolado de Anelloviridae sp. ctbb005, genoma completo MK012493,1 Isolado de Anelloviridae sp. ctcj014, genoma completo MK012500,1 Isolado de Anelloviridae sp. ctcb001, genoma completo
# de Acesso Descrição MK012504,1 Isolado de Anelloviridae sp. ctcj010, genoma completo MK012516,1 Isolado de Anelloviridae sp. ctcf003, genoma completo NC_038336,1 Genes Orf2 e Orf1 de isolado de vírus Torque teno TCHN-C1 5, cds completas NC_038338,1 Genes Orf2 e Orf1 de isolado de vírus Torque teno TCHN-D1 11, cds completas NC_038339,1 Genes Orf2 e Orf1 de isolado de vírus Torque teno TCHN-A 13, cds completas NC_038340,1 Genes ORF4, ORF3, ORF2, ORF1 de vírus Torque teno 20, cds completas, clone: SAa-10 NC_038341,1 Genes ORF2 e ORF1 de isolado de vírus Torque teno TCHN-B 21, cds completas NC_038342,1 Genes ORF2, ORF1 de vírus Torque teno 23, cds completas, isolado: s-TTV CH65-2 NC_038343,1 Genes ORF4, ORF3, ORF2, ORF1 de vírus Torque teno 24, cds completas, clone: SAa-01 Genes ORF2, ORF1, ORF3 de vírus Torque teno 29, cds completas, isolado: TTVyon- NC_038344,1 KC009 Genes ORF2, ORF1, ORF3 e ORF4 de isolado de minivírus Torque teno LIL-y1 10, cds NC_038345,1 completas NC_038346,1 Genes ORF2, ORF1 e ORF3 de isolado de minivírus Torque teno LIL-y2 11, cds completas Genes ORF2, ORF1, ORF3 e ORF4 de isolado de minivírus Torque teno LIL-y3 12, cds NC_038347,1 completas NC_038350,1 Genes ORF2 e ORF1 de isolado de vírus médio Torque teno 2PoSMA 3, cds completas Genes ORF2, ORF1 e ORF3 de isolado de vírus médio Torque teno 6PoSMA 4, cds NC_038351,1 completas NC_038352,1 DNA do vírus médio Torque teno 5, genoma completo, isolado: MDJHem2 NC_038353,1 DNA do vírus médio Torque teno 6, genoma completo, isolado: MDJHem3-1 NC_038354,1 DNA do vírus médio Torque teno 7, genoma completo, isolado: MDJHem3-2 NC_038355,1 DNA do vírus médio Torque teno 8, genoma completo, isolado: MDJN1 NC_038356,1 DNA do vírus médio Torque teno 9, genoma completo, isolado: MDJN2 NC_038357,1 DNA do vírus médio Torque teno 10, genoma completo, isolado: MDJN14 NC_038358,1 DNA do vírus médio Torque teno 11, genoma completo, isolado: MDJN47 NC_038359,1 DNA do vírus médio Torque teno 12, genoma completo, isolado: MDJN51 NC_038360,1 DNA do vírus médio Torque teno 13, genoma completo, isolado: MDJN69 NC_038361,1 DNA do vírus médio Torque teno 14, genoma completo, isolado: MDJN97 NC_038362,1 DNA do vírus médio Torque teno 15, genoma completo, isolado: Pt-TTMDV210
[001644] Em algumas modalidades, o elemento genético compreende uma ou mais sequências com homologia ou identidade com uma ou mais sequências de um ou mais vírus diferentes de Anelloviruses, por exemplo, adenovírus, vírus do herpes, vírus da varíola, vírus da vaccínia, SV40, vírus do papiloma, um vírus de RNA tal como um retrovírus, por exemplo, lentivírus, um vírus de RNA de fita simples, por exemplo, vírus da hepatite, ou um vírus de RNA de fita dupla, por exemplo, rotavírus. Uma vez que, em algumas modalidades, os retrovírus recombinantes são defeituosos pode ser proporcionada assistência de modo a produzir partículas infecciosas. Tal assistência pode ser proporcionada, por exemplo, por uso de linhas de células ajudantes que contêm plasmídeos codificando todos os genes estruturais do retrovírus sob o controle de sequências reguladoras dentro da LTR. Linhas de células adequadas para replicação dos anelossomos descritos no presente documento incluem linhas de células conhecidas na técnica, por exemplo, células A549, que podem ser modificadas como descrito no presente documento. O referido elemento genético pode ainda conter um gene codificando um marcador selecionável tal que os elementos genéticos desejados possam ser identificados.
[001645] Em algumas modalidades, o elemento genético inclui mutações não silenciosas, por exemplo, substituições, deleções ou adições de bases resultando em diferenças de aminoácidos no polipeptídeo codificado, desde que a sequência permaneça pelo menos cerca de 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, ou 99% idêntica ao polipeptídeo codificado pela primeira sequência de nucleotídeos ou de outro modo seja útil para prática da presente invenção. A este respeito podem ser feitas certas substituições conservativas de aminoácidos que são geralmente reconhecidas como não inativando a função global da proteína: tal como no que diz respeito aos aminoácidos positivamente carregados (e vice-versa), lisina, arginina e histidina; no que diz respeito a aminoácidos negativamente carregados (e vice-versa), ácido aspártico e ácido glutâmico; e no que diz respeito a certos grupos de aminoácidos neutralmente carregados (e em todos os casos, também vice-versa), (1) alanina e serina, (2) asparagina, glutamina e histidina, (3) cisteína e serina, (4) glicina e prolina, (5) isoleucina, leucina e valina, (6) metionina, leucina e isoleucina, (7) fenilalanina, metionina, leucina e tirosina, (8) serina e treonina, (9) triptofano e tirosina, (10) e por exemplo tirosina, triptofano e fenilalanina. Os aminoácidos podem ser classificados de acordo com propriedades físicas e contribuição para a estrutura de proteína secundária e terciária. Uma substituição conservativa é reconhecida na técnica como uma substituição de um aminoácido por um outro aminoácido que tenha propriedades similares.
[001646] A identidade de duas ou mais sequências de ácidos nucleicos ou polipeptídeos possuindo a mesma percentagem ou uma percentagem especificada de resíduos de nucleotídeos ou aminoácidos que são os mesmos (por exemplo, cerca de 60%, 65%, 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% ou identidade superior ao longo de uma região especificada, quando comparados e alinhados para correspondência máxima ao longo de uma janela de comparação ou região designada) pode ser medida usando um algoritmo de comparação de sequências BLAST ou BLAST
2.0 com parâmetros padrão descritos abaixo ou por alinhamento manual e inspeção visual (ver, por exemplo, site de NCBI www.ncbi.nlm.nih.gov/BLAST/ ou similares). A identidade se pode também referir ao, ou pode ser aplicada ao, complemento de uma sequência de teste. A identidade inclui também sequências que têm deleções e/ou adições, bem como aquelas que têm substituições. Como descrito no presente documento, os algoritmos são responsáveis por lacunas e similares. A identidade pode existir ao longo de uma região que tem pelo menos cerca de 10 aminoácidos ou nucleotídeos em comprimento, cerca de 15 aminoácidos ou nucleotídeos em comprimento, cerca de 20 aminoácidos ou nucleotídeos em comprimento, cerca de 25 aminoácidos ou nucleotídeos em comprimento, cerca de 30 aminoácidos ou nucleotídeos em comprimento, cerca de 35 aminoácidos ou nucleotídeos em comprimento, cerca de 40 aminoácidos ou nucleotídeos em comprimento, cerca de 45 aminoácidos ou nucleotídeos em comprimento, cerca de 50 aminoácidos ou nucleotídeos em comprimento ou mais.
[001647] Em algumas modalidades, o elemento genético compreende uma sequência de nucleotídeos com pelo menos cerca de 75% de identidade de sequências de nucleotídeos, pelo menos cerca de 80%, 85%, 90% 95%, 96%, 97%, 98%, 99% ou 100% de identidade de sequências de nucleotídeos com qualquer uma das sequências de nucleotídeos descritas no presente documento, por exemplo, como listado em qualquer uma das Tabelas A1, A3, A5, A7, A9, A11, B1-B5, 1, 3, 5, 7, 9, 11, 13, 15, 17, ou 41. Uma vez que o código genético é degenerado, uma sequência de nucleotídeos homóloga pode incluir qualquer número de mudanças silenciosas de bases, i.e., substituições de nucleotídeos que não obstante codificam o mesmo aminoácido. Componente de Edição Gênica
[001648] O elemento genético do anelossomo pode incluir um ou mais genes que codificam um componente de um sistema de edição gênica. Sistemas de edição gênica incluem o sistema de repetições palindrômicas curtas agrupadas e regularmente espaçadas (CRISPR), nucleases de dedos de zinco (ZFNs) e Nucleases baseadas em Efetores do Tipo Ativador da Transcrição (TALEN). Os métodos baseados em ZFNs, TALENs e CRISPR são descritos, por exemplo, em Gaj et al. Trends Biotechnol. 31.7 (2013): 397-405; os métodos CRISPR de edição gênica são descritos, por exemplo, em Guan et al., Application of CRISPR-Cas system in gene therapy:Pre-clinical progress in animal model. DNA Repair out de 2016; 46: 1-8. doi:
10.1016/j.dnarep.2016.07.004; Zheng et al., Precise gene deletion and replacement using the CRISPR/Cas9 system in human cells.
BioTechniques, Vol. 57, N.º 3, setembro 2014, pg. 115–124.
[001649] Os sistemas CRISPR são sistemas de defesa adaptativos originalmente descobertos em bactérias e arqueobactérias. Os sistemas CRISPR usam nucleases guiadas por RNA denominadas endonucleases “Cas” ou associadas a CRISPR (por exemplo, Cas9 ou Cpf1) para clivar DNA estranho. Em um sistema CRISPR/Cas típico, uma endonuclease é dirigida para uma sequência de nucleotídeos alvo (por exemplo, um local no genoma que é para ser editado quanto à sequência) por “RNAs guia” não codificantes, específicos da sequência que visam sequências de DNA de fita simples ou dupla. Foram identificadas três classes (I-III) de sistemas CRISPR. Os sistemas CRISPR de classe II usam uma única endonuclease Cas (em vez de múltiplas proteínas Cas). Um sistema CRISPR de classe II inclui uma endonuclease Cas de tipo II tal como Cas9, um RNA de CRISPR (“crRNA”) e um crRNA transativador (“tracrRNA”). O crRNA contém um “RNA guia”, tipicamente sequência de RNA de cerca de 20 nucleotídeos que corresponde a uma sequência de DNA alvo. O crRNA contém também uma região que se liga ao tracrRNA para formar uma estrutura parcialmente de fita dupla que é clivada por RNase III, resultando em um híbrido crRNA/tracrRNA. O híbrido crRNA/tracrRNA dirige então a endonuclease Cas9 para reconhecer e clivar a sequência de DNA alvo. A sequência de DNA alvo tem geralmente de ser adjacente a um “motivo adjacente protoespaçador” (“PAM”) que é específico para uma dada endonuclease Cas; no entanto, as sequências PAM aparecem ao longo de um dado genoma.
[001650] Em algumas modalidades, o anelossomos inclui um gene para uma endonuclease de CRISPR. Por exemplo, algumas endonucleases de CRISPR identificadas a partir de várias espécies procarióticas têm requisitos únicos de sequências PAM; exemplos de sequências PAM incluem 5'-NGG (Streptococcus pyogenes), 5'-
NNAGAA (Streptococcus thermophilus CRISPR1), 5'-NGGNG (Streptococcus thermophilus CRISPR3), e 5'-NNNGATT (Neisseria meningiditis). Algumas endonucleases, por exemplo, endonucleases Cas9, estão associadas a locais PAM ricos em G, por exemplo, 5’-NGG, e realizam clivagem final do DNA alvo em uma localização 3 nucleotídeos a montante do (5’ do) local PAM. Um outro sistema CRISPR de classe II inclui a endonuclease de tipo V Cpf1, que é mais pequena do que Cas9; exemplos incluem AsCpf1 (de Acidaminococcus sp.) e LbCpf1 (de Lachnospiraceae sp.). As endonucleases Cpf1 estão associadas a locais PAM ricos em T, por exemplo, 5’-TTN. Cpf1 pode também reconhecer um motivo PAM 5'-CTA. Cpf1 cliva o DNA alvo por introdução de uma quebra de fita dupla assimétrica ou coesiva com uma protuberância 5' de 4 ou 5 nucleotídeos, por exemplo, clivagem de um DNA alvo com um corte assimétrico ou coesivo de 5 nucleotídeos localizado 18 nucleotídeos a jusante do (3’ a partir do) local PAM na fita codificante e 23 nucleotídeos a jusante do local PAM na fita complementar; a protuberância de 5 nucleotídeos que resulta de tal clivagem assimétrica permite edição do genoma mais precisa por inserção de DNA por recombinação homóloga do que por inserção em DNA clivado em extremidades não coesivas. Ver, por exemplo, Zetsche et al. (2015) Cell, 163: 759 – 771.
[001651] Uma variedade de genes (Cas) associados a CRISPR pode ser incluída no anelossomo. Exemplos específicos de genes são aqueles que codificam proteínas Cas a partir de sistemas de classe II, incluindo Cas1, Cas2, Cas3, Cas4, Cas5, Cas6, Cas7, Cas8, Cas9, Cas10, Cpf1, C2C1 ou C2C3. Em algumas modalidades, o anelossomo inclui um gene codificando uma proteína Cas, por exemplo, uma proteína Cas9, pode ser de qualquer uma de uma variedade de espécies procarióticas. Em algumas modalidades, o anelossomo inclui um gene codificando uma proteína Cas específica, por exemplo, uma proteína Cas9 particular, é selecionado para reconhecer uma sequência de motivo adjacente protoespaçadora (PAM) particular. Em algumas modalidades, o anelossomo inclui ácidos nucleicos codificando duas ou mais proteínas Cas diferentes, ou duas ou mais proteínas Cas, podem ser introduzidas em uma célula, zigoto, embrião ou animal, por exemplo, para permitir o reconhecimento e a modificação de locais compreendendo os mesmos motivos PAM, motivos PAM similares ou diferentes. Em algumas modalidades, o anelossomo inclui um gene codificando uma proteína Cas modificada com uma nuclease desativada, por exemplo, Cas9 deficiente em nuclease.
[001652] Ao passo que a proteína Cas9 de tipo selvagem gera quebras de fita dupla (DSBs) em sequências de DNA específicas visadas por um gRNA, um número de endonucleases de CRISPR possuindo funcionalidades modificadas é conhecido, por exemplo: uma versão “nickase” de Cas9 gera somente uma quebra de fita simples; uma Cas9 cataliticamente inativa (“dCas9”) não corta o DNA alvo. Um gene codificando uma dCas9 pode ser fundido com um gene codificando um domínio efetor para reprimir (CRISPRi) ou ativar (CRISPRa) a expressão de um gene alvo. Por exemplo, o gene pode codificar uma fusão de Cas9 com um silenciador transcricional (por exemplo, um domínio KRAB) ou um ativador transcricional (por exemplo, uma fusão dCas9–VP64). Um gene codificando uma Cas9 cataliticamente inativa (dCas9) fundida à nuclease FokI (“dCas9-FokI”) pode ser incluída para gerar DSBs nas sequências homólogas alvo a dois gRNAs. Ver, por exemplo, os numerosos plasmídeos CRISPR/Cas9 descritos no e publicamente disponíveis a partir do repositório Addgene (Addgene, 75 Sidney St., Suite 550A, Cambridge, MA 02139; addgene.org/crispr/). Uma Cas9 “dupla nickase” que introduz duas quebras de fita dupla separadas, cada uma dirigida por um RNA guia separado, é descrita como alcançando edição do genoma mais precisa por Ran et al. (2013) Cell, 154: 1380 – 1389.
[001653] A tecnologia CRISPR para edição dos genes de eucariotas é descrita nas Publicações de Pedidos de Patentes dos EUA 2016/0138008A1 e US2015/0344912A1 e nas Patentes dos EUA 8,697,359, 8,771,945, 8,945,839, 8,999,641, 8,993,233, 8,895,308, 8,865,406, 8,889,418, 8,871,445, 8,889,356, 8,932,814, 8,795,965 e 8,906,616. A endonuclease de Cpf1 e correspondentes RNAs guia e locais PAM são descritos na Publicação de Pedido de Patente dos EUA 2016/0208243 A1.
[001654] Em algumas modalidades, o anelossomo compreende um gene codificando um polipeptídeo descrito no presente documento, por exemplo, uma nuclease visada, por exemplo, uma Cas9, por exemplo, uma Cas9 de tipo selvagem, uma Cas9 nickase (por exemplo, Cas9 D10A), uma Cas9 morta (dCas9), eSpCas9, Cpf1, C2C1 ou C2C3 e um gRNA. A escolha dos genes codificando a nuclease e o(s) gRNA(s) é determinada pelo fato de a mutação visada ser uma deleção, substituição ou adição de nucleotídeos, por exemplo, uma deleção, substituição ou adição de nucleotídeos a uma sequência visada. Os genes que codificam uma endonuclease cataliticamente inativa, por exemplo, uma cas9 morta (dCas9, por exemplo, D10A; H840A) amarrada com todo ou uma porção de (por exemplo, porção biologicamente ativa de) um (um ou mais) de domínio efetor (por exemplo, VP64) criam proteínas quiméricas que podem modular a atividade e/ou expressão de uma ou mais sequências de ácidos nucleicos alvo.
[001655] Como usado no presente documento, uma “porção biologicamente ativa de um domínio efetor” é uma porção que mantém a função (por exemplo, completamente, parcialmente ou minimamente) de um domínio efetor (por exemplo, um domínio “mínimo” ou “nuclear”). Em algumas modalidades, o anelossomo inclui um gene codificando uma fusão de uma dCas9 com todo ou uma porção de um ou mais domínios efetores para criar uma proteína quimérica útil nos métodos descritos no presente documento. Comomente, em algumas modalidades, o anelossomo inclui um gene codificando uma fusão dCas9-metilase. Em algumas outras modalidades, o anelossomo inclui um gene codificando uma fusão dCas9-enzima com um gRNA sítio- específico para visar um gene endógeno.
[001656] Em outros aspectos, o anelossomo inclui um gene codificando 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20 ou mais domínios efetores (todo ou uma porção biologicamente ativa) fundidos com dCas9. Exterior Proteináceo
[001657] Em algumas modalidades, o anelossomo, por exemplo, anelossomo sintético, compreende um exterior proteináceo que encerra o elemento genético. O exterior proteináceo pode compreender uma proteína exterior substancialmente não patogênica que não falha em provocar uma resposta imunitária indesejada em um mamífero. O exterior proteináceo dos anelossomos compreendem tipicamente uma proteína substancialmente não patogênica que se pode automontar em uma formação icosaédrica que constitui o exterior proteináceo.
[001658] Em algumas modalidades, a proteína exterior proteinácea é codificada por uma sequência do elemento genético do anelossomo (por exemplo, está em cis com o elemento genético). Em outras modalidades, a proteína exterior proteinácea é codificada por um ácido nucleico separado do elemento genético do anelossomo (por exemplo, está em trans com o elemento genético).
[001659] Em algumas modalidades, a proteína, por exemplo, proteína substancialmente não patogênica e/ou proteína exterior proteinácea, compreende um ou mais aminoácidos glicosilados, por exemplo, 2, 3, 4, 5, 6, 7, 8, 9, 10 ou mais.
[001660] Em algumas modalidades, a proteína, por exemplo, proteína substancialmente não patogênica e/ou proteína exterior proteinácea compreende pelo menos uma região de ligação ao DNA hidrofílica, uma região rica em arginina, uma região rica em treonina, uma região rica em glutamina, uma sequência de poliarginina N-terminal, uma região variável, uma sequência de poliglutamina/glutamato C-terminal e uma ou mais pontes de dissulfeto.
[001661] Em algumas modalidades, a proteína é uma proteína de capsídeo, por exemplo, tem uma sequência possuindo pelo menos cerca de 60%, 65%, 70%, 75%, 80%, 85%, 90% 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com uma proteína codificada por qualquer uma das sequências de nucleotídeos codificando uma proteína de capsídeo descrita no presente documento, por exemplo, uma sequência de ORF1 de Anellovirus ou uma sequência de proteína de capsídeo como listado em qualquer uma das Tabelas 1- 18, A1-A12, B1-B5, C1-C5, D1-D10 ou 20-37. Em algumas modalidades, a proteína ou um fragmento funcional de uma proteína de capsídeo é codificada por uma sequência de nucleotídeos possuindo pelo menos cerca de 60%, 70% 80%, 85%, 90% 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com qualquer uma das sequências de nucleotídeos descritas no presente documento, por exemplo, uma sequência de capsídeo de Anellovirus ou uma sequência de proteína de capsídeo como listado em qualquer uma das Tabelas A1-A12, B1-B5, C1-C5, D1-D10 ou 20-37. Em algumas modalidades, a proteína compreende uma proteína de capsídeo ou um fragmento funcional de uma proteína de capsídeo que é codificada por uma sequência de nucleotídeos de capsídeo ou uma sequência possuindo pelo menos cerca de 60%, 65%, 70%, 75%, 80%, 85%, 90% 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências de nucleotídeos com qualquer uma das sequências de nucleotídeos descritas no presente documento, por exemplo, uma sequência de capsídeo de Anellovirus ou uma sequência de proteína de capsídeo como listado em qualquer uma das Tabelas A1, A3, A5, A7, A9, A11, B1-B5, 1, 3, 5, 7, 9, 11, 13, 15, ou 17.
[001662] Em algumas modalidades, o anelossomo compreende uma sequência de nucleotídeos codificando uma proteína de capsídeo ou um fragmento funcional ou uma sequência possuindo pelo menos cerca de 60%, 70% 80%, 85%, 90% 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com qualquer uma das sequências de aminoácidos descritas no presente documento, por exemplo, uma sequência de capsídeo de Anellovirus ou uma sequência de proteína de capsídeo em qualquer uma das Tabelas A2, A4, A6, A8, A10, A12, C1- C5, 2, 4, 6, 8, 10, 12, 14, 16, ou 18. Em algumas modalidades, o anelossomo compreende uma sequência de nucleotídeos codificando uma proteína de capsídeo ou um fragmento funcional ou uma sequência possuindo pelo menos cerca de 60%, 65%, 70%, 75%, 80%, 85%, 90% 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com qualquer uma das sequências de aminoácidos descritas no presente documento, por exemplo, uma sequência de capsídeo de Anellovirus ou uma sequência de proteína de capsídeo em qualquer uma das Tabelas A2, A4, A6, A8, A10, A12, C1-C5, 2, 4, 6, 8, 10, 12, 14, 16, ou 18.
[001663] Em algumas modalidades, o anelossomo compreende uma sequência de nucleotídeos codificando uma sequência de aminoácidos possuindo cerca da posição 1 a cerca da posição 150 (por exemplo, ou qualquer subconjunto de aminoácidos dentro de cada gama, por exemplo, cerca da posição 20 a cerca da posição 35, cerca da posição 25 a cerca da posição 30, cerca da posição 26 a cerca da 30), cerca da posição 150 a cerca da posição 390 (por exemplo, ou qualquer subconjunto de aminoácidos dentro de cada gama, por exemplo, cerca da posição 200 a cerca da posição 380, cerca da posição 205 a cerca da posição 375, cerca da posição 205 a cerca da 371), cerca da 390 a cerca da posição 525, cerca da posição 525 a cerca da posição 850 (por exemplo, ou qualquer subconjunto de aminoácidos dentro de cada gama, por exemplo, cerca da posição 530 a cerca da posição 840, cerca da posição 545 a cerca da posição 830, cerca da posição 550 a cerca da 820), cerca da 850 a cerca da posição 950 (por exemplo, ou qualquer subconjunto de aminoácidos dentro de cada gama, por exemplo, cerca da posição 860 a cerca da posição 940, cerca da posição 870 a cerca da posição 930, cerca da posição 880 a cerca da 923) das sequências de aminoácidos descritas no presente documento, uma sequência de aminoácidos de Anellovirus, por exemplo, como listado em qualquer uma das Tabelas A2, A4, A6, A8, A10, A12, C1-C5, 2, 4, 6, 8, 10, 12, 14, 16, ou 18 ou mostrado na Figura 1 ou um seu fragmento funcional. Em algumas modalidades, a proteína compreende uma sequência de aminoácidos ou um seu fragmento funcional ou uma sequência possuindo pelo menos cerca de 60%, 65%, 70%, 75%, 80%, 85%, 90% 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com cerca da posição 1 a cerca da posição 150 (por exemplo, ou qualquer subconjunto de aminoácidos dentro de cada gama como descrito no presente documento), cerca da posição 150 a cerca da posição 390, cerca da posição 390 a cerca da posição 525, cerca da posição 525 a cerca da posição 850, cerca da posição 850 a cerca da posição 950 das sequências de aminoácidos descritas no presente documento, por exemplo, como listado em qualquer uma das Tabelas A2, A4, A6, A8, A10, A12, C1-C5, 2, 4, 6, 8, 10, 12, 14, 16, ou 18 ou como mostrado na Figura 1.
[001664] Em algumas modalidades, a proteína compreende uma sequência de aminoácidos ou um seu fragmento funcional ou uma sequência possuindo pelo menos cerca de 60%, 65%, 70%, 75%, 80%, 85%, 90% 95%, 96%, 97%, 98%, 99%, ou 100% de identidade de sequências com qualquer uma das sequências de aminoácidos ou gamas de aminoácidos descritas no presente documento, uma sequência de aminoácidos de Anellovirus, por exemplo, como listado em qualquer uma das Tabelas A2, A4, A6, A8, A10, A12, C1-C5, 2, 4, 6, 8, 10, 12, 14, 16, ou 18 ou mostrado na Figura 1. Em algumas modalidades, as gamas de aminoácidos com menos identidade de sequências podem proporcionar uma ou mais das propriedades descritas no presente documento e diferenças na especificidade de células/tecidos/espécies (por exemplo, tropismo).
[001665] Em algumas modalidades, o anelossomo carece de lipídeos no exterior proteináceo. Em algumas modalidades, o anelossomo carece de uma bicamada de lipídeos, por exemplo, um envelope viral. Em algumas modalidades, o interior do anelossomo é inteiramente coberto (por exemplo, 100% de cobertura) por um exterior proteináceo. Em algumas modalidades, o interior do anelossomo está menos do que 100% coberto pelo exterior proteináceo, por exemplo, 95%, 90%, 85%, 80%, 70%, 60%, 50% ou menos de cobertura. Em algumas modalidades, o exterior proteináceo compreende lacunas ou descontinuidades, por exemplo, permitindo permeabilidade à água, íons, peptídeos ou moléculas pequenas, desde que o elemento genético seja retido no anelossomo.
[001666] Em algumas modalidades, o exterior proteináceo compreende uma ou mais proteínas ou polipeptídeos que reconhecem e/ou se ligam especificamente a uma célula hospedeira, por exemplo, uma proteína ou polipeptídeo complementar, para mediar a entrada do elemento genético na célula hospedeira.
[001667] Em algumas modalidades, o exterior proteináceo compreende um ou mais dos seguintes: uma ou mais proteínas glicosiladas, uma região de ligação ao DNA hidrofílica, uma região rica em arginina, uma região rica em treonina, uma região rica em glutamina,
uma sequência de poliarginina N-terminal, uma região variável, uma sequência de poliglutamina/glutamato C-terminal e uma ou mais pontes de dissulfeto. Por exemplo, o exterior proteináceo compreende uma proteína codificada por uma ORF1 de Anellovirus descrita no presente documento.
[001668] Em algumas modalidades, o exterior proteináceo compreende uma ou mais das seguintes características: uma simetria icosaédrica, reconhece e/ou se liga a uma molécula que interage com uma ou mais moléculas da célula hospedeira para mediar a entrada na célula hospedeira, carece de moléculas de lipídeos, carece de carboidratos, é estável quanto ao pH e à temperatura, é resistente a detergentes e é substancialmente não imunogênico ou substancialmente não patogênico em um hospedeiro. II. Vetores
[001669] O elemento genético descrito no presente documento pode ser incluído em um vetor. Vetores adequados bem como os métodos para sua fabricação e seu uso são bem conhecidos na técnica prévia.
[001670] Em um aspecto, a invenção inclui um vetor compreendendo um elemento genético compreendendo (i) uma sequência codificando uma proteína exterior não patogênica, (ii) uma sequência de ligação à proteína exterior que liga o elemento genético à proteína exterior não patogênica e (iii) uma sequência codificando um ácido nucleico regulador.
[001671] O elemento genético ou qualquer uma das sequências dentro do elemento genético podem ser obtidas usando qualquer método adequado. Vários métodos recombinantes são conhecidos na técnica, tais como, por exemplo, rastreamento de bibliotecas a partir de células abrigando sequências virais, derivação das sequências de um vetor conhecido por incluir o mesmo ou isolamento direto a partir de células e tecidos contendo o mesmo, usando técnicas padrão.
Alternativamente ou em combinação, parte do ou todo o elemento genético pode ser produzido sinteticamente, em vez de clonado.
[001672] Em algumas modalidades, o vetor inclui elementos reguladores, sequências de ácidos nucleicos homólogas a genes alvo e vários construtos repórteres para causar a expressão de moléculas repórter dentro de uma célula viável e/ou quando uma molécula intracelular está presente dentro de uma célula alvo.
[001673] Os genes repórteres são usados para identificação de células potencialmente transfectadas e para avaliação da funcionalidade das sequências reguladoras. Em geral, um gene repórter é um gene que não está presente no ou expresso pelo organismo ou tecido receptor e que codifica um polipeptídeo cuja expressão se manifesta por alguma propriedade facilmente detectável, por exemplo, atividade enzimática. A expressão do gene repórter é avaliada em um momento adequado após o DNA possuir sido introduzido nas células receptoras. Os genes repórter adequados podem incluir genes codificando luciferase, beta-galactosidase, cloranfenicol acetil transferase, fosfatase alcalina secretada ou o gene da proteína fluorescente verde (por exemplo, Ui-Tei et al., 2000 FEBS Letters 479: 79-82). Sistemas de expressão adequados são bem conhecidos e podem ser preparados usando técnicas conhecidas ou obtidos comercialmente. Em geral, o construto com a região flanqueante 5' mínima mostrando o nível mais elevado de expressão do gene repórter é identificado como o promotor. Tais regiões promotoras podem ser ligadas a um gene repórter e usadas para se avaliarem agentes quanto à capacidade de modular a transcrição dirigida por promotores.
[001674] Em algumas modalidades, o vetor é substancialmente não patogênico e/ou substancialmente não integrável em uma célula hospedeira ou é substancialmente não imunogênico em um hospedeiro.
[001675] Em algumas modalidades, o vetor está em uma quantidade suficiente para modular um ou mais de fenótipo, níveis de vírus, expressão gênica, competir com outros vírus, estado de doença, etc. pelo menos cerca de 5%, 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50% ou mais. Sistemas modelo para quantificar a atividade anelossômica
[001676] Os anelossomos descritos neste documento podem ser testados em uma série de modelos animais e modelos in vitro. Por exemplo, um modelo de camundongo para atrofia muscular espinhal pode ser usado para quantificar a atividade de um anelossomo codificando SMN ou uma variante funcional do mesmo. Em algumas modalidades, um modelo de camundongo para distrofia muscular pode ser usado para quantificar a atividade de um anelossomo codificando microdistrofina ou uma variante funcional da mesma. Em algumas modalidades, um modelo de camundongo deficiente em UGT1A1 pode ser usado para quantificar a atividade de um anelossomo codificando UGT1A1 ou uma variante funcional do mesmo. III. Composições
[001677] O anelossomo ou vetor descrito no presente documento pode ser também incluído em composições farmacêuticas com um excipiente farmacêutico, por exemplo, como descrito no presente documento. Em algumas modalidades, a composição farmacêutica compreende pelo menos105, 106, 107, 108, 109, 1010, 1011, 1012, 1013, 1014, ou 1015 anelossomos. Em algumas modalidades, a composição farmacêutica compreende cerca de 105-1015, 105-1010 ou 1010-1015 anelossomos. Em algumas modalidades, a composição farmacêutica compreende cerca de 108 (por exemplo, cerca de 105, 106, 107, 108, 109 ou 1010) equivalentes genômicos/mL do anelossomo. Em algumas modalidades, a composição farmacêutica compreende 105-1010, 106- 1010, 107-1010, 108-1010, 109-1010, 105-106, 105-107, 105-108, 105-109, 105-1011, 105-1012, 105-1013, 105-1014, 105-1015, ou 1010-1015 equivalentes genômicos/mL do anelossomo, por exemplo, como determinado de acordo com o método do Exemplo 18. Em algumas modalidades, a composição farmacêutica compreende anelossomos suficientes para entregar pelo menos 1, 2, 5, ou 10, 100, 500, 1000, 2000, 5000, 8,000, 1 x 104, 1 x 105, 1 x 106, 1 x 107 ou mais cópias de um elemento genético compreendidas nos anelossomos por célula a uma população das células eucarióticas. Em algumas modalidades, a composição farmacêutica compreende anelossomos suficientes para entregar pelo menos cerca de 1 x 104, 1 x 105, 1 x 106, 1 x ou 107 ou cerca de 1 x 104-1 x 105, 1 x 104-1 x 106, 1 x 104-1 x 107, 1 x 105-1 x 106, 1 x 105-1 x 107, ou 1 x 106-1 x 107 cópias de um elemento genético compreendidas nos anelossomos por célula a uma população das células eucarióticas.
[001678] Em algumas modalidades, a composição farmacêutica tem uma ou mais das seguintes características: a composição farmacêutica atende a um padrão farmacêutico ou de boas práticas de fabricação (GMP); a composição farmacêutica foi feita de acordo com boas práticas de fabricação (GMP); a composição farmacêutica tem um nível de patógenos abaixo de um valor de referência predeterminado, por exemplo, está substancialmente isenta de patógenos; a composição farmacêutica tem um nível de contaminantes abaixo de um valor de referência predeterminado, por exemplo, está substancialmente isenta de contaminantes; ou a composição farmacêutica tem baixa imunogenicidade ou é substancialmente não imunogênica, por exemplo, como descrito no presente documento.
[001679] Em algumas modalidades, a composição farmacêutica compreende abaixo de uma quantidade limiar de um ou mais contaminantes. Exemplos de contaminantes que são desejavelmente excluídos ou minimizados na composição farmacêutica incluem, sem limitação, ácidos nucleicos da célula hospedeira (por exemplo, DNA da célula hospedeira e/ou RNA da célula hospedeira), componentes derivados de animais (por exemplo, albumina sérica ou tripsina), vírus competentes em replicação, partículas não infecciosas, proteína de capsídeo viral livre, agentes adventícios e agregados. Em modalidades, o contaminante é DNA da célula hospedeira. Em modalidades, a composição compreende menos do que cerca de 10 ng de DNA da célula hospedeira por dose. Em modalidades, o nível de DNA da célula hospedeira na composição é reduzido por filtração e/ou degradação enzimática do DNA da célula hospedeira. Em modalidades, a composição farmacêutica consiste em menos do que 10% (por exemplo, menos do que cerca de 10%, 5%, 4%, 3%, 2%, 1%, 0,5% ou 0,1%) de contaminante em peso.
[001680] Em um aspecto, a invenção descrita no presente documento inclui uma composição farmacêutica compreendendo:
[001681] a) um anelossomo compreendendo um elemento genético compreendendo (i) uma sequência codificando uma proteína exterior não patogênica, (ii) uma sequência de ligação à proteína exterior que liga o elemento genético à proteína exterior não patogênica e (iii) uma sequência codificando um ácido nucleico regulador; e um exterior proteináceo que está associado ao, por exemplo, envolve ou encerra o, elemento genético; e
[001682] b) um excipiente farmacêutico. Vesículas
[001683] Em algumas modalidades, a composição compreende ainda um componente transportador, por exemplo, uma microparticula, lipossomo, vesícula ou exossomo. Em algumas modalidades, os lipossomos compreendem estruturas de vesículas esféricas compostas por uma bicamada de lipídeos uni- ou multilamelar rodeando compartimentos aquosos internos e uma bicamada de fosfolipídeos lipofílica exterior relativamente impermeável. Os lipossomos podem ser aniônicos, neutros ou catiônicos. Os lipossomos são geralmente biocompatíveis, não tóxicos, podem entregar moléculas de fármacos tanto hidrofílicas como lipofílicas, protegem sua carga da degradação por enzimas plasmáticas e transportam sua carga através de membranas biológicas (ver, por exemplo, Spuch e Navarro, Journal of Drug Delivery, vol. 2011, ID do artigo 469679, 12 páginas, 2011. doi:
10.1155/2011/469679 para revisão).
[001684] As vesículas podem ser feitas a partir de vários tipos diferentes de lipídeos; no entanto, os fosfolipídeos são o mais comumente usados para gerar lipossomos como transportadores de fármacos. As vesículas podem compreender sem limitação DOTMA, DOTAP, DOTIM, DDAB, isoladamente ou em conjunto com colesterol para originar DOTMA e colesterol, DOTAP e colesterol, DOTIM e colesterol, DOTIM e colesterol e DDAB e colesterol. Métodos para preparação de lipídeos de vesículas multilamelares são conhecidos na técnica (ver por exemplo Pat. dos E.U.A. N.º 6,693,086, os ensinamentos da qual se relacionando com preparação de lipídeos de vesículas multilamelares são incorporados no presente documento por referência). Embora a formação de vesículas possa ser espontânea quando uma película de lipídeos é misturada com uma solução aquosa, esta pode ser também acelerada por aplicação de força na forma de agitação por uso de um homogeneizador, sonicador ou um dispositivo de extrusão (ver, por exemplo, Spuch e Navarro, Journal of Drug Delivery, vol. 2011, ID do Artigo 469679, 12 páginas, 2011. doi:
10.1155/2011/469679 para revisão). Os lipídeos extrudados podem ser preparados por extrusão através de filtros de tamanho decrescente, como descrito em Templeton et al., Nature Biotech, 15: 647-652, 1997, os ensinamentos dos quais se relacionando com preparação de lipídeos extrudados são incorporados no presente documento por referência.
[001685] Como descrito no presente documento podem ser adicionados aditivos às vesículas para modificar a sua estrutura e/ou propriedades. Por exemplo, colesterol ou esfingomielina podem ser adicionados à mistura para ajudar a estabilizar a estrutura e para prevenir o vazamento da carga interna. Ainda, as vesículas podem ser preparadas a partir de fosfatidilcolina de ovo hidrogenada ou fosfatidilcolina de ovo, colesterol e fosfato de dicetila. (ver, por exemplo, Spuch e Navarro, Journal of Drug Delivery, vol. 2011, ID do Artigo 469679, 12 páginas, 2011. doi: 10.1155/2011/469679 para revisão). Igualmente, as vesículas podem ser modificadas na superfície durante a ou após síntese para incluir grupos reativos complementares aos grupos reativos nas células receptoras. Tais grupos reativos incluem sem limitação grupos maleimida. Como um exemplo, as vesículas podem ser sintetizadas para incluírem fosfolipídeos conjugados à maleimida, tal como sem limitação DSPE-MaL-PEG2000.
[001686] Uma formulação de vesículas pode ser maioritariamente compreendida por fosfolipídeos e lipídeos naturais tais como 1,2- distearoril-sn-glicero-3-fosfatidilcolina (DSPC), esfingomielina, fosfatidilcolinas de ovo e monossialogangliosídeo. As formulações constituídas somente por fosfolipídeos são menos estáveis no plasma. No entanto, a manipulação da membrana de lipídeos com colesterol reduz a liberação rápida da carga encapsulada ou a 1,2-dioleoil-sn- glicero-3-fosfoetanolamina (DOPE) aumenta a estabilidade (ver, por exemplo, Spuch e Navarro, Journal of Drug Delivery, vol. 2011, ID do Artigo 469679, 12 páginas, 2011. doi: 10.1155/2011/469679 para revisão).
[001687] Em modalidades, os lipídeos podem ser usados para formar micropartículas de lipídeos. Os lipídeos incluem, mas não estão limitados a, DLin-KC2-DMA4, C12-200 e colipídeos disterilfosfatidilcolina, colesterol e PEG-DMG podem ser formulados (ver, por exemplo, Novobrantseva, Molecular Therapy-Nucleic Acids
(2012) 1, e4; doi: 10.1038/mtna.2011.3) usando um procedimento de formação espontânea de vesículas. A razão molar do componente pode ser cerca de 50/10/38,5/1,5 (DLin-KC2-DMA ou C12-200/colina de disterililfosfatidila/colesterol/PEG-DMG). A Tekmira tem um portfólio de aproximadamente 95 famílias de patentes, nos E.U.A. e no exterior, que estão dirigidas a vários aspectos de micropartículas de lipídeos e formulações de micropartículas de lipídeos (ver, por exemplo, Pat dos E.U.A. N.os 7,982,027; 7,799,565; 8,058,069; 8,283,333; 7,901,708; 7,745,651; 7,803,397; 8,101,741; 8,188,263; 7,915,399; 8,236,943 e 7,838,658 e Pat. Europeias N.os 1766035; 1519714; 1781593 e 1664316), todas as quais podem ser usadas e/ou adaptadas à presente invenção.
[001688] Em algumas modalidades, as micropartículas compreendem um ou mais polímero(s) solidificado(s) que é(são) disposto(s) de uma maneira aleatória. As micropartículas podem ser biodegradáveis. As micropartículas biodegradáveis podem ser sintetizadas, por exemplo, usando métodos conhecidos na técnica incluindo sem limitação evaporação de solvente, microencapsulação por fusão a quente, remoção de solvente e secagem por pulverização. Métodos exemplificativos para síntese de micropartículas são descritos por Bershteyn et al., Soft Matter 4: 1787-1787, 2008 e em US 2008/0014144 A1, os ensinamentos específicos dos quais se relacionando com a síntese de micropartículas são incorporados no presente documento por referência.
[001689] Polímeros sintéticos exemplificativos que podem ser usados para formar micropartículas biodegradáveis incluem sem limitação poliésteres alifáticos, poli(ácido láctico) (PLA), poli(ácido glicólico) (PGA), copolímeros de ácido láctico e ácido glicólico (PLGA), policarprolactona (PCL), polianidridos, poli(orto)ésteres, poliuretanos, poli(ácido butírico), poli(ácido valérico) e poli(lactídeo-co-caprolactona)
e polímeros naturais tais como albumina, alginato e outros polissacarídeos incluindo dextrana e celulose, colágeno, seus derivados químicos, incluindo substituições, adições de grupos químicos tais como por exemplo alquila, alquileno, hidroxilações, oxidações e outras modificações rotineiramente feitas pelos peritos na técnica, albumina e outras proteínas hidrofílicas, zeína e outras prolaminas e proteínas hidrofóbicas, copolímeros e suas misturas. Em geral, estes materiais se degradam tanto por hidrólise enzimática como por exposição à água, por erosão superficial ou a granel.
[001690] O diâmetro das micropartículas varia de 0,1-1000 micrômetros (µm). Em algumas modalidades, seu diâmetro varia em tamanho de 1-750 µm ou de 50-500 µm ou de 100-250 µm. Em algumas modalidades, seu diâmetro varia em tamanho de 50-1000 µm, de 50- 750 µm, de 50-500 µm ou de 50-250 µm. Em algumas modalidades, seu diâmetro varia em tamanho de 0,05-1000 µm, de 10-1000 µm, de 100- 1000 µm ou de 500-1000 µm. Em algumas modalidades, seu diâmetro é cerca de 0,5 µm, cerca de 10 µm, cerca de 50 µm, cerca de 100 µm, cerca de 200 µm, cerca de 300 µm, cerca de 350 µm, cerca de 400 µm, cerca de 450 µm, cerca de 500 µm, cerca de 550 µm, cerca de 600 µm, cerca de 650 µm, cerca de 700 µm, cerca de 750 µm, cerca de 800 µm, cerca de 850 µm, cerca de 900 µm, cerca de 950 µm ou cerca de 1000 µm. Como usado no contexto de diâmetros de micropartículas, o termo “cerca de” significa +/-5% do valor absoluto indicado.
[001691] Em algumas modalidades, um ligante é conjugado à superfície da micropartícula através de um grupo químico funcional (ácidos carboxílicos, aldeídos, aminas, sulfidrilos e hidroxilas) presentes na superfície da partícula e presentes no ligante a ser anexado. A funcionalidade pode ser introduzida nas micropartículas por, por exemplo, durante a preparação de emulsões de micropartículas, incorporação de estabilizantes com grupos químicos funcionais.
[001692] Um outro exemplo de introdução de grupos funcionais na micropartícula é durante a preparação pós-partícula, por reticulação direta de partículas e ligantes com reticulantes homo ou heterobifuncionais. Esse procedimento pode usar uma química adequada e uma classe de reticulantes (CDI, EDAC, glutaraldeídos, etc., como discutido em mais detalhe abaixo) ou qualquer outro reticulante que acopla ligantes à superfície da partícula através de modificação química da superfície da partícula após preparação. Isto inclui também um processo por meio do que moléculas anfifílicas tais como ácidos graxos lipídeos ou estabilizantes funcionais podem ser passivamente adsorvidas e aderidas à superfície da partícula, deste modo introduzindo grupos terminais funcionais para amarrar os ligantes.
[001693] Em algumas modalidades, as micropartículas podem ser sintetizadas para compreenderem um ou mais grupos de direcionamento na sua superfície exterior para visar um tipo específico de célula ou tecido (por exemplo, cardiomiócitos). Estes grupos de direcionamento incluem sem limitação receptores, ligantes, anticorpos e similares. Estes grupos de direcionamento se ligam ao seu parceiro na superfície das células. Em algumas modalidades, as micropartículas se integrarão em uma bicamada de lipídeos que compreende a superfície celular e as mitocôndrias são entregues à célula.
[001694] As micropartículas podem também compreender uma bicamada de lipídeos na sua superfície mais exterior. Esta bicamada pode ser compreendida por um ou mais lipídeos do mesmo tipo ou tipo diferente. Exemplos incluem sem limitação fosfolipídeos tais como fosfolocolinas e fosfoinositóis. Exemplos específicos incluem sem limitação DMPC, DOPC, DSPC e vários outros lipídeos tais como aqueles descritos no presente documento para lipossomos.
[001695] Em algumas modalidades, o transportador compreende nanopartículas, por exemplo, como descrito no presente documento.
[001696] Em algumas modalidades, as vesículas ou micropartículas descritas no presente documento são funcionalizadas com um agente de diagnóstico. Exemplos de agentes de diagnóstico incluem, mas não estão limitados a, agentes de visualização comercialmente disponíveis usados na tomografia de emissão de pósitrons (PET), tomografia assistida por computador (CAT), tomografia computadorizada de emissão de fóton único, raios-x, fluoroscopia e visualização de ressonância magnética (MRI)); e agentes de contraste. Exemplos de materiais adequados para uso como agentes de contraste em MRI incluem quelatos de gadolínio, bem como ferro, magnésio, manganês, cobre e crômio. Transportadores
[001697] Uma composição (por exemplo, composição farmacêutica) descrita no presente documento pode compreender, ser formulada com, e/ou ser entregue em, um transportador. Em um aspecto, a invenção inclui uma composição, por exemplo, uma composição farmacêutica, compreendendo um transportador (por exemplo, uma vesícula, um lipossomo, uma nanopartícula de lipídeo, um exossomo, um glóbulo vermelho, um exossomo (por exemplo, um exossomo de mamífero ou planta), um fusossomo) compreendendo (por exemplo, encapsulando) uma composição descrita no presente documento (por exemplo, um anelossomo, Anellovirus, anelovetor ou elemento genético descrito no presente documento).
[001698] Em algumas modalidades modalidade, as composições e sistemas descritos no presente documento podem ser formulados em lipossomos ou outras vesículas similares. Geralmente, os lipossomos são estruturas de vesículas esféricas compostas por uma bicamada de lipídeos uni- ou multilamelar rodeando compartimentos aquosos internos e uma bicamada de fosfolipídeos lipofílica exterior relativamente impermeável. Os lipossomos podem ser aniônicos,
neutros ou catiônicos. Os lipossomos têm geralmente uma ou mais das (por exemplo, todas as) seguintes características: biocompatibilidade, não toxicidade, podem entregar moléculas de fármacos tanto hidrofílicas como lipofílicas, podem proteger sua carga da degradação por enzimas plasmáticas e podem transportam sua carga através de membranas biológicas e da barreira hematoencefálica (BBB) (ver, por exemplo, Spuch e Navarro, Journal of Drug Delivery, vol. 2011, ID do artigo 469679, 12 páginas, 2011. doi: 10.1155/2011/469679; e Zylberberg & Matosevic. 2016. Drug Delivery, 23: 9, 3319-3329, doi:
10.1080/10717544.2016.1177136).
[001699] As vesículas podem ser preparadas a partir de vários tipos diferentes de lipídeos; no entanto, os fosfolipídeos são o mais comumente usados para gerar lipossomos como transportadores de fármacos. Métodos para preparação de lipídeos de vesículas multilamelares são conhecidos (ver, por exemplo, Pat. dos E.U.A. N.º 6,693,086, os ensinamentos da qual se relacionando com preparação de lipídeos de vesículas multilamelares são incorporados no presente documento por referência). Embora a formação de vesículas possa ser espontânea quando uma película de lipídeos é misturada com uma solução aquosa, esta pode ser também acelerada por aplicação de força na forma de agitação por uso de um homogeneizador, sonicador ou um dispositivo de extrusão (ver, por exemplo, Spuch e Navarro, Journal of Drug Delivery, vol. 2011, ID do Artigo 469679, 12 páginas, 2011. doi:
10.1155/2011/469679 para revisão). Os lipídeos extrudados podem ser preparados por, por exemplo, extrusão através de filtros de tamanho decrescente, como descrito em Templeton et al., Nature Biotech, 15: 647-652, 1997.
[001700] As nanopartículas de lipídeos (LNPs) são um outro exemplo de um transportador que proporciona um sistema de entrega biocompatível e biodegradável para as composições farmacêuticas descritas no presente documento. Ver, por exemplo, Gordillo-Galeano et al. European Journal of Pharmaceutics and Biopharmaceutics.Volume 133, dezembro 2018, Páginas 285-308. Os transportadores de lipídeos nanoestruturados (NLCs) são nanopartículas de lipídeos sólidas (SLNs) modificadas que retêm as características da SLN, melhoram a estabilidade dos fármacos e capacidade de carga e previnem o vazamento dos fármacos. As nanopartículas de polímeros (PNPs) são um componente importante de entrega de fármacos. Estas nanopartículas podem dirigir eficazmente a entrega de fármacos para alvos específicos e melhorar a estabilidade de fármacos e liberação controlada de fármacos. As nanopartículas de lipídeos–polímeros (PLNs), um novo tipo de transportador que combina lipossomos e polímeros, podem ser também usados. Estas nanopartículas possuem as vantagens complementares de PNPs e lipossomos. Uma PLN é composta por uma estrutura núcleo–invólucro; o núcleo de polímero proporciona uma estrutura estável, e o invólucro de fosfolipídeo oferece boa biocompatibilidade. Como tal, os dois componentes aumentam a taxa de eficiência de encapsulação de fármacos, facilitam a modificação da superfície e previnem o vazamento de fármacos solúveis em água. Para uma revisão ver, por exemplo, Li et al. 2017, Nanomaterials 7, 122; doi: 10.3390/nano7060122.
[001701] Os exossomos podem ser também usados como veículos de entrega de fármacos para as composições e sistemas descritos no presente documento. Para uma revisão ver Ha et al., julho de 2016. Acta Pharmaceutica Sinica B. Volume 6, Edição 4, Páginas 287-296; doi.org/10.1016/j.apsb.2016.02.001.
[001702] Os glóbulos vermelhos diferenciados ex vivo podem ser também usados como um transportador para uma composição descrita no presente documento. Ver, por exemplo, WO2015073587; WO2017123646; WO2017123644; WO2018102740; WO2016183482;
WO2015153102; WO2018151829; WO2018009838; Shi et al. 2014. Proc Natl Acad Sci USA. 111 (28): 10131–10136; Patente dos E.U.A. 9,644,180; Huang et al. 2017. Nature Communications 8: 423; Shi et al.
2014. Proc Natl Acad Sci USA. 111 (28): 10131–10136.
[001703] As composições de fusossomo, por exemplo, como descrito em WO2018208728, podem ser também usadas como transportadores para entregar uma composição descrita no presente documento. Polipeptídeos de Penetração na Membrana
[001704] Em algumas modalidades, a composição compreende ainda um polipeptídeo de penetração na membrana (MPP) para transportar os componentes para dentro das células ou através de uma membrana, por exemplo, célula ou membrana nuclear. Os polipeptídeos de penetração na membrana que são capazes de facilitar o transporte de substâncias através de uma membrana incluem, mas não estão limitados a, peptídeos de penetração celular (CPPs) (ver, por exemplo, Pat. dos E.U.A. N.º: 8,603,966), peptídeos de fusão para entrega intracelular de plantas (ver, por exemplo, Ng et al., PLoS One, 2016, 11: e0154081), domínios de transdução de proteínas, peptídeos de Trojan e sinais de translocação de membrana (MTS) (ver, por exemplo, Tung et al., Advanced Drug Delivery Reviews 55: 281-294 (2003)). Alguns MPP são ricos em aminoácidos, tais como arginina, com cadeias laterais positivamente carregadas.
[001705] Os polipeptídeos de penetração na membrana têm a capacidade de induzir a penetração na membrana de um componente e permitem a translocação macromolecular dentro das células de múltiplos tecidos in vivo após administração sistêmica. Um polipeptídeo de penetração na membrana se pode também referir a um peptídeo que, quando colocado em contato com uma célula sob condições apropriadas, passa do ambiente externo no ambiente intracelular, incluindo o citoplasma, organelas tais como mitocôndrias ou o núcleo da célula, em quantidades significativamente maiores do que seria alcançado com difusão passiva.
[001706] Os componentes transportados através de uma membrana podem reversivelmente ou irreversivelmente ligados ao polipeptídeo de penetração na membrana. Um ligante pode ser uma ligação química, por exemplo, uma ou mais ligações covalentes ou ligações não covalentes. Em algumas modalidades, o ligante é um ligante de peptídeo. Um tal ligante pode possuir entre 2-30 aminoácidos ou mais. O ligante inclui ligantes flexíveis, rígidos ou cliváveis. Combinações
[001707] Em um aspecto, o anelossomo ou composição compreendendo um anelossomo descrito no presente documento pode também incluir uma ou mais frações heterólogas. Em um aspecto, o anelossomo ou composição compreendendo um anelossomo descrito no presente documento pode também incluir uma ou mais frações heterólogas em uma fusão. Em algumas modalidades, uma fração heteróloga pode estar ligada ao elemento genético. Em algumas modalidades, uma fração heteróloga pode estar encerrada no exterior proteináceo como parte do anelossomo. Em algumas modalidades, uma fração heteróloga pode ser administrada com o anelossomo.
[001708] Em um aspecto, a invenção inclui uma célula ou tecido compreendendo qualquer um dos anelossomos e frações heterólogas descritos no presente documento.
[001709] Em um outro aspecto, a invenção inclui uma composição farmacêutica compreendendo um anelossomo e a fração heteróloga descritos no presente documento.
[001710] Em algumas modalidades, a fração heteróloga pode ser um vírus (por exemplo, um efetor (por exemplo, um fármaco, molécula pequena), um agente de direcionamento (por exemplo, um agente de direcionamento de DNA, anticorpo, ligante receptor), uma etiqueta (por exemplo, fluoróforo, agente sensível à luz tal como KillerRed) ou uma fração de edição ou direcionamento descrita no presente documento. Em algumas modalidades, um polipeptídeo de translocação da membrana descrito no presente documento está ligado a uma ou mais frações heterólogas. Em uma modalidade, a fração heteróloga é uma molécula pequena (por exemplo, um peptidomimético ou uma pequena molécula orgânica com um peso molecular de menos do que 2000 daltons), um peptídeo ou polipeptídeo (por exemplo, um anticorpo ou seu fragmento de ligação ao antígeno), uma nanopartícula, um aptâmero ou farmacoagente. Vírus
[001711] Em algumas modalidades, a composição pode compreender ainda um vírus como uma fração heteróloga, por exemplo, um vírus de DNA de fita simples, por exemplo, Anellovirus, Bidnavirus, Circovirus, Geminivirus, Genomovirus, Inovirus, Microvirus, Nanovirus, Parvovirus e Spiravirus. Em algumas modalidades, a composição pode compreender ainda um vírus de DNA de fita dupla, por exemplo, Adenovirus, Ampullavirus, Ascovirus, Asfarvirus, Baculovirus, Fusellovirus, Globulovirus, Guttavirus, Hytrosavirus, Herpesvirus, Iridovirus, Lipothrixvirus, Nimavirus e Poxvirus. Em algumas modalidades, a composição pode compreender ainda um vírus de RNA, por exemplo, Alphavirus, Furovirus, Vírus da hepatite, Hordeivirus, Tobamovirus, Tobravirus, Tricornavirus, Rubivirus, Birnavirus, Cystovirus, Partitivirus e Reovirus. Em algumas modalidades, o anelossomo é administrado com um vírus como uma fração heteróloga.
[001712] Em algumas modalidades, a fração heteróloga pode compreender um vírus não patogênico, por exemplo, simbiótico, comensal, nativo. Em algumas modalidades, o vírus não patogênico é um ou mais anelovírus, por exemplo, Alphatorquevirus (TT), Betatorquevirus (TTM) e Gammatorquevirus (TTMD). Em algumas modalidades, o anelovírus pode incluir um vírus Torque Teno (TT), um vírus SEN, um vírus Sentinel, um minivírus tipo TTV, um vírus TT, um genótipo 6 de vírus TT, um grupo de vírus TT, um grupo de vírus TT, um vírus DXL1 tipo TTV, um vírus DXL2 tipo TTV, um minivírus tipo Torque Teno (TTM) ou um Vírus Médio tipo Torque Teno (TTMD). Em algumas modalidades, o vírus não patogênico compreende uma ou mais sequências possuindo pelo menos cerca de 60%, 70% 80%, 85%, 90% 95%, 96%, 97%, 98% e 99% de identidade de sequências de nucleotídeos com qualquer uma das sequências de nucleotídeos descritas no presente documento, por exemplo, como listado em qualquer uma das Tabelas A1, A3, A5, A7, A9, A11, B1-B5, 1, 3, 5, 7, 9, 11, 13, 15, 17, ou 41.
[001713] Em algumas modalidades, a fração heteróloga pode compreender um ou mais vírus que são identificados como ausentes no indivíduo. Por exemplo, um indivíduo identificado como possuindo divirose pode receber uma composição compreendendo um anelossomo e um ou mais componentes virais ou vírus que estão desequilibrados no indivíduo ou possuindo uma razão que difere de um valor de referência, por exemplo, um indivíduo saudável.
[001714] Em algumas modalidades, a fração heteróloga pode compreender um ou mais vírus diferentes de anelovírus, por exemplo, adenovírus, vírus do herpes, vírus da varíola, vírus da vaccínia, SV40, vírus do papiloma, um vírus de RNA tal como um retrovírus, por exemplo, vírus de lenti, um vírus de RNA de fita simples, por exemplo, vírus da hepatite ou um vírus de RNA de fita dupla, por exemplo, rotavírus. Em algumas modalidades, o anelossomo ou o vírus é defeituoso ou requer assistência de modo a produzir partículas infecciosas. Tal assistência pode ser proporcionada, por exemplo, por uso de linhas de células ajudantes que contêm um ácido nucleico, por exemplo, plasmídeos ou DNA integrados no genoma, codificando um ou mais dos (por exemplo, todos os) genes estruturais do anelossomo ou vírus defeituoso em replicação sob o controle de sequências reguladoras dentro da LTR. Linhas de células adequadas para replicação dos anelossomos descritos no presente documento incluem linhas de células conhecidas na técnica, por exemplo, células A549, que podem ser modificadas como descrito no presente documento. Fração de Direcionamento
[001715] Em algumas modalidades, a composição ou anelossomo descrito no presente documento pode compreender ainda uma fração de direcionamento, por exemplo, uma fração de direcionamento que se liga especificamente a uma molécula de interesse presente em uma célula alvo. A fração de direcionamento pode modular uma função específica da molécula de interesse ou célula, modular uma molécula específica (por exemplo, enzima, proteína ou ácido nucleico), por exemplo, uma molécula específica a jusante da molécula de interesse em uma via, ou se ligar especificamente a um alvo para localizar o anelossomo ou elemento genético. Por exemplo, uma fração de direcionamento pode incluir um terapêutico que interage com uma molécula específica de interesse para aumentar, diminuir ou de outro modo modular sua função. Fração de Etiquetagem ou Monitorização
[001716] Em algumas modalidades, a composição ou anelossomo descrito no presente documento pode compreender ainda uma etiqueta para marcar ou monitorizar o anelossomo ou elemento genético descrito no presente documento. A porção de marcação ou monitoração pode ser removível por agentes químicos ou clivagem enzimática, tal como proteólise ou emenda de inteína. Uma etiqueta de afinidade pode ser útil para purificar o polipeptídeo marcado usando uma técnica de afinidade. Alguns exemplos incluem proteína de ligação à quitina (CBP), proteína de ligação à maltose (MBP), glutationa-S-transferase (GST) e etiqueta de poli(His). Uma etiqueta de solubilização pode ser útil para auxiliar proteínas recombinantes expressas em espécies deficientes em chaperona tais como E. coli para auxiliar no dobramento apropriado das proteínas e evitar que precipitem. Alguns exemplos incluem tiorredoxina (TRX) e poli(NANP). A fração de etiquetagem ou monitorização pode incluir uma etiqueta sensível à luz, por exemplo, fluorescência. As etiquetas fluorescentes são úteis para visualização. GFP e suas variantes são alguns exemplos comumente usados como etiquetas fluorescentes. As etiquetas de proteínas podem permitir que ocorram modificações enzimáticas específicas (tais como biotinilação pela biotina ligase) ou modificações químicas (tais como reação com FlAsH- EDT2 para visualização por fluorescência). Frequentemente, a fração de etiquetagem ou monitorização são combinadas, de modo a conectar proteínas a múltiplos outros componentes. A fração de etiquetagem ou monitorização pode ser também removida por proteólise específica ou clivagem enzimática (por exemplo, por protease de TEV, Trombina, Fator Xa ou Enteropeptidase). Nanopartículas
[001717] Em algumas modalidades, a composição ou anelossomo descrito no presente documento pode compreender ainda uma nanopartícula. As nanopartículas incluem materiais inorgânicos com um tamanho entre cerca de 1 e cerca de 1000 nanômetros, entre cerca de 1 e cerca de 500 nanômetros de tamanho, entre cerca de 1 e cerca de 100 nm, entre cerca de 50 nm e cerca de 300 nm, entre cerca de 75 nm e cerca de 200 nm, entre cerca de 100 nm e cerca de 200 nm e qualquer gama intermédia. As nanopartículas têm geralmente uma estrutura compósita de dimensões em nanoescala. Em algumas modalidades, as nanopartículas são tipicamente esféricas embora sejam possíveis diferentes morfologias dependendo da composição das nanopartículas. A porção da nanopartícula contatando com um ambiente externo à nanopartícula é geralmente identificada como a superfície da nanopartícula. Nas nanopartículas descritas no presente documento, a limitação de tamanho pode ser restrita a duas dimensões e tal que as nanopartículas incluam estrutura compósita possuindo um diâmetro de cerca de 1 a cerca de 1000 nm, onde o diâmetro específico depende da composição da nanopartícula e do uso pretendido da nanopartícula de acordo com o desenho experimental. Por exemplo, as nanopartículas usadas em aplicações terapêuticas têm tipicamente um tamanho de cerca de 200 nm ou menor.
[001718] Propriedades desejáveis adicionais da nanopartícula, tais como cargas superficiais e estabilização estérica, podem também variar em vista da aplicação específica de interesse. Propriedades exemplificativas que podem ser desejáveis em aplicações clínicas tais como tratamento de câncer são descritas em Davis et al., Nature 2008 vol. 7, páginas 771-782; Duncan, Nature 2006 vol. 6, páginas 688-701; e Allen, Nature 2002 vol. 2 páginas 750-763, cada um incorporado no presente documento por referência em sua totalidade. Propriedades adicionais são identificáveis por um perito após leitura da presente descrição. As dimensões e propriedades das nanopartículas podem ser detectadas por técnicas conhecidas na técnica. Técnicas exemplificativas para detectar dimensões de partículas incluem mas não estão limitadas a dispersão dinâmica da luz (DLS) e uma variedade de microscopias tais como microscopia eletrônica de transmissão (TEM) e microscopia de força atômica (AFM). Técnicas exemplificativas para detectar a morfologia de partículas incluem mas não estão limitadas a TEM e AFM. Técnicas exemplificativas para detectar cargas superficiais da nanopartícula incluem o mas não estão limitadas ao método do potencial zeta. Técnicas adicionais adequadas para detectar outras propriedades químicas compreendem por 1H,11B, e13C e19F RMN, UV/Vis e espectroscopia de UV/visível e infravermelhos/Raman e espectroscopia de fluorescência (quando a nanopartícula é usada em combinação com marcadores fluorescentes) e técnicas adicionais identificáveis por um perito. Moléculas pequenas
[001719] Em algumas modalidades, a composição ou anelossomo descrito no presente documento pode compreender ainda uma molécula pequena. As frações de moléculas pequenas incluem, mas não estão limitadas a, peptídeos pequenos, peptidomiméticos (por exemplo, peptoides), aminoácidos, análogos de aminoácidos, polinucleotídeos sintéticos, análogos de polinucleotídeos, nucleotídeos, análogos de nucleotídeos, compostos orgânicos e inorgânicos (incluindo compostos heterorgânicos e organometálicos) possuindo geralmente um peso molecular menor do que cerca de 5000 gramas por mole, por exemplo, compostos orgânicos ou inorgânicos possuindo um peso molecular menor do que cerca de 2000 gramas por mole, por exemplo, compostos orgânicos ou inorgânicos possuindo um peso molecular menor do que cerca de 1000 gramas por mole, por exemplo, compostos orgânicos ou inorgânicos possuindo um peso molecular inferior a cerca de 500 gramas por mole e sais, ésteres e outras formas farmaceuticamente aceitáveis de tais compostos. As moléculas pequenas podem incluir, mas não estão limitadas a, um neurotransmissor, um hormônio, um fármaco, uma toxina, uma partícula viral ou microbiana, uma molécula sintética e agonistas ou antagonistas.
[001720] Exemplos de pequenas moléculas adequadas incluem aquelas descritas em “The Pharmacological Basis of Therapeutics”, Goodman and Gilman, McGraw-Hill, Nova Iorque, NY, (1996), Nona edição, sob as seções: Drugs Acting at Synaptic and Neuroeffector Junctional Sites; Drugs Acting on the Central Nervous System; Autacoids: Drug Therapy of Inflammation; Water, Salts and Ions; Drugs Affecting Renal Function and Electrolyte Metabolism; Cardiovascular
Drugs; Drugs Affecting Gastrointestinal Function; Drugs Affecting Uterine Motility; Chemotherapy of Parasitic Infections; Chemotherapy of Microbial Diseases; Chemotherapy of Neoplastic Diseases; Drugs Used for Immunosuppression; Drugs Acting on Blood-Forming organs; Hormones and Hormone Antagonists; Vitamins, Dermatology; e Toxicology, todas incorporadas no presente documento por referência. Alguns exemplos de moléculas pequenas incluem, mas não estão limitadas a, fármacos de príons tais como tacrolimus, ubiquitina ligase ou inibidores de HECT ligase tais como heclina, fármacos modificadores de histonas tais como butirato de sódio, inibidores enzimáticos tais como 5-aza-citidina, antraciclinas tais como doxorrubicina, beta-lactâmicos tais como penicilina, antibacterianos, agentes de quimioterapia, antivirais, moduladores de outros organismos tais como VP64 e fármacos com biodisponibilidade insuficiente tais como quimioterapêuticos com farmacocinética deficiente.
[001721] Em algumas modalidades, a molécula pequena é um agente modificador epigenético, por exemplo tal como aqueles descritos em Groote et al. Nuc.Acids Res. (2012): 1-18. Agentes modificadores epigenéticos de moléculas pequenas exemplificativos são descritos, por exemplo, em Lu et al. J. Biomolecular Screening 17.5 (2012): 555-71, por exemplo, na Tabela 1 ou 2, incorporado no presente documento por referência. Em algumas modalidades, um agente modificador epigenético compreende vorinostat ou romidepsina. Em algumas modalidades, um agente modificador epigenético compreende um inibidor da histona desacetilase (HDAC) de classe I, II, III e/ou IV. Em algumas modalidades, um agente modificador epigenético compreende um ativador de SirTI. Em algumas modalidades, um agente modificador epigenético compreende Garcinol, Lys-CoA, C646, (+)-JQI, I-BET, BICI, MS120, DZNep, UNC0321, EPZ004777, AZ505, AMI-I, pirazol amida 7b, benzo[d]imidazol 17b, derivado de dapsona acilado (por exemplo,
PRMTI), metilstat, 4,4’-dicarbóxi-2,2’-bipiridina, SID 85736331, análogo de hidroxamato 8, análogos da tanilcipromia, bisguanidina e biguanida poliamina, UNC669, Vidaza, decitabina fenilbutirato de sódio (SDB), ácido lipoico (LA), quercetina, ácido valproico, hidralazina, bactrim, extrato de chá verde (por exemplo, galato de epigalocatequina (EGCG)), curcumina, sulforfano e/ou alicina/dissulfeto de dialila. Em algumas modalidades, um agente modificador epigenético inibe a metilação do DNA, por exemplo, é um inibidor da DNA metiltransferase (por exemplo, é 5-azacitidina e/ou decitabina). Em algumas modalidades, um agente modificador epigenético modifica a modificação de histonas, por exemplo, acetilação de histonas, metilação de histonas, permutação de histonas e/ou fosforilação de histonas. Em algumas modalidades, o agente modificador epigenético é um inibidor de uma histona desacetilase (por exemplo, é vorinostat e/ou tricostatina A).
[001722] Em algumas modalidades, a molécula pequena é um agente farmaceuticamente ativo. Em uma modalidade, a molécula pequena é um inibidor de uma atividade ou componente metabólico. Classes úteis de agentes farmaceuticamente ativos incluem, mas não estão limitadas a, antibióticos, fármacos anti-inflamatórios, agentes angiogênicos ou vasoativos, fatores de crescimento e agentes quimioterapêuticos (antineoplásicos) (por exemplo, supressores tumorais). Uma ou uma combinação de moléculas das categorias e exemplos descritos no presente documento ou a partir de (Orme-Johnson 2007, Methods Cell Biol. 2007; 80: 813-26) pode ser usada. Em uma modalidade, a invenção inclui uma composição compreendendo um antibiótico, fármaco anti-inflamatório, agente angiogênico ou vasoativo, fator de crescimento ou agente quimioterapêutico. Peptídeos ou proteínas
[001723] Em algumas modalidades, a composição ou anelossomo descrito no presente documento pode compreender ainda um peptídeo ou proteína. As frações de peptídeos podem incluir, mas não estão limitadas a, um ligante de peptídeo ou fragmento de anticorpo (por exemplo, fragmento de anticorpo que se liga a um receptor tal como um receptor extracelular), neuropeptídeo, peptídeo hormonal, fármaco de peptídeo, peptídeo tóxico, peptídeo viral ou microbiano, peptídeo sintético e peptídeo agonista ou antagonista.
[001724] As frações de peptídeos podem ser lineares ou ramificadas. O peptídeo tem um comprimento de cerca de 5 a cerca de 200 aminoácidos, cerca de 15 a cerca de 150 aminoácidos, cerca de 20 a cerca de 125 aminoácidos, cerca de 25 a cerca de 100 aminoácidos ou qualquer gama intermédia.
[001725] Alguns exemplos de peptídeos incluem, mas não estão limitados, etiquetas ou marcadores fluorescentes, antígenos, anticorpos, fragmentos de anticorpos tais como anticorpos de domínio único, ligantes e receptores tais como peptídeo-1 tipo glucagon (GLP- 1), receptor 2 de GLP-2, colecistocinina B (CCKB) e receptor de somatostatina, terapêuticos de peptídeos tais como aquelas que se ligam a receptores específicos da superfície celular tais como receptores acoplados à proteína G (GPCRs) ou canais de íons, peptídeos sintéticos ou analógicos de peptídeos naturalmente bioativos, peptídeos antimicrobianos, peptídeos formadores de poros, peptídeos visando tumores ou citotóxicos e peptídeos de degradação ou autodestruição tais como um sinal de peptídeo indutor da apoptose ou peptídeo fotossensibilizador.
[001726] Os peptídeos úteis na invenção descritos no presente documento incluem também pequenos peptídeos de ligação ao antígeno, por exemplo, anticorpo de ligação ao antígeno ou fragmentos tipo anticorpos, tais como anticorpos de cadeia única, nanocorpos (ver, por exemplo, Steeland et al. 2016. Nanobodies as therapeutics: big opportunities for small antibodies.Drug Discov Today: 21 (7): 1076-113).
Tais pequenos peptídeos de ligação ao antígeno se podem ligar a um antígeno citosólico, um antígeno nuclear, um antígeno intraorganelar.
[001727] Em algumas modalidades, a composição ou anelossomo descrito no presente documento inclui um polipeptídeo ligado a um ligante que é capaz de visar um local, tecido ou célula específico. Aptâmeros de oligonucleotídeos
[001728] Em algumas modalidades, a composição ou anelossomo descrito no presente documento pode compreender ainda um aptâmero de oligonucleotídeo. As frações de aptâmeros são aptâmeros de oligonucleotídeos ou peptídeos. Os aptâmeros de oligonucleotídeos são moléculas de DNA ou RNA de fita simples (ssDNA ou ssRNA) que se podem ligar a alvos pré-selecionados incluindo proteínas e peptídeos com elevada afinidade e especificidade.
[001729] Os aptâmeros de oligonucleotídeos são espécies de ácidos nucleicos que podem ser manipulados através de rondas repetidas de seleção in vitroou, equivalentemente, SELEX (evolução sistemática de ligantes por enriquecimento exponencial) para se ligar a vários alvos moleculares tais como moléculas pequenas, proteínas, ácidos nucleicos e mesmo células, tecidos e organismos. Os aptâmeros proporcionam reconhecimento molecular discriminativo e podem ser produzidos por síntese química. Ainda, os aptâmeros podem possuir propriedades desejáveis de armazenamento e provocar pouca ou nenhuma imunogenicidade em aplicações terapêuticas.
[001730] Os aptâmeros tanto de DNA como de RNA podem mostrar afinidades de ligação robustas para vários alvos. Por exemplo, os aptâmeros de DNA e RNA foram selecionados quanto à lisozima t, trombina, elemento responsivo de ação trans do vírus da imunodeficiência humana (TAR de HIV),(ver en.wikipedia.org/wiki/Aptamer-cite_note-10), hemina, interferon γ, fator de crescimento endotelial vascular(VEGF),antígeno específico da próstata(PSA), dopaminae o oncogene não clássico, fator de choque térmico 1 (HSF1). Aptâmeros de peptídeos
[001731] Em algumas modalidades, a composição ou anelossomo descrito no presente documento pode compreender ainda um aptâmero de peptídeo. Os aptâmeros de peptídeos têm um (ou mais) domínios de peptídeos variáveis curtos, incluindo peptídeos possuindo baixo peso molecular, 12–14 kDa. Os aptâmeros de peptídeos podem ser desenhados para se ligarem às ou interferirem especificamente com as interações proteína-proteína dentro das células.
[001732] Os aptâmeros de peptídeos são proteínas artificiais selecionadas ou manipuladas para se ligarem a moléculas alvo específicas. Estas proteínas incluem uma ou mais alças de peptídeos de sequência variável. São tipicamente isoladas a partir de bibliotecas combinatoriais e frequentemente subsequentemente melhoradas por mutação dirigida ou rondas de mutagênese de região variável e seleção. Os aptâmeros de peptídeos in vivo se podem ligar a alvos de proteínas celulares e exercer efeitos biológicos, incluindo interferência com as interações de proteínas normais das suas moléculas visadas com outras proteínas. Em particular, uma alça de aptâmero de peptídeo variável anexada a um domínio de ligação ao fator de transcrição é rastreada contra a proteína alvo anexada a um domínio de ativação do fator de transcrição. A ligação in vivo do aptâmero de peptídeo ao seu alvo através desta estratégia de seleção é detectada como expressão de um gene marcador de levedura a jusante. Tais experiências identificam proteínas particulares ligadas pelos aptâmeros e interações de proteínas que os aptâmeros interrompem, para causar o fenótipo. Ainda, os aptâmeros de peptídeos derivados com frações funcionais apropriadas podem causar modificações pós-translacionais específicas das suas proteínas alvo ou mudar a localização subcelular dos alvos.
[001733] Os aptâmeros de peptídeos podem também reconhecer alvos in vitro. Encontraram uso no lugar de anticorpos em biossensores e foram usados para detectar isoformas ativas de proteínas a partir de populações contendo formas de proteínas tanto inativas como ativas. Derivados conhecidos como girinos, nos quais as “cabeças” do aptâmero de peptídeo estão covalentemente ligadas a “caudas” de sequências únicas de DNA de fita dupla, permitem a quantificação de moléculas alvo escassas em misturas por PCR (usando, por exemplo, a reação quantitativa da cadeia da polimerase em tempo real) de suas caudas de DNA.
[001734] A seleção do aptâmero de peptídeo pode ser feita usando sistemas diferentes, mas o mais usado é correntemente o sistema bi- híbrido de levedura. Os aptâmeros de peptídeos podem ser também selecionados de bibliotecas combinatoriais de peptídeos construídas por exibição em fagos e outras tecnologias de exibição à superfície tais como exibição em mRNA, exibição em ribossomos, exibição bacteriana e exibição em levedura. Estes procedimentos experimentais são também conhecidos como biopanings. Entre os peptídeos obtidos de biopanings, os mimótopos podem ser considerados como um tipo de aptâmeros de peptídeos. Todos os peptídeos panned a partir das bibliotecas combinatoriais de peptídeos foram armazenados em uma base de dados especial com o nome MimoDB. IV. Hospedeiros
[001735] A invenção está ainda dirigida a um hospedeiro ou célula hospedeira compreendendo um anelossomo descrito no presente documento. Em algumas modalidades, o hospedeiro ou célula hospedeira é uma planta, insetos, bactéria, fungo, vertebrado, mamífero (por exemplo, humano) ou outro organismo ou célula. Em certas modalidades, como confirmado no presente documento, os anelossomos proporcionados infectam uma gama de células hospedeiras diferentes. As células hospedeiras alvo incluem células de origem mesodérmica, endodérmica ou ectodérmica. As células hospedeiras alvo incluem, por exemplo, células epiteliais, células musculares, glóbulos brancos (por exemplo, linfócitos), células de tecido renal, células de tecido pulmonar.
[001736] Em algumas modalidades, o anelossomo é substancialmente não imunogênico no hospedeiro. O anelossomo ou elemento genético não consegue produzir uma resposta indesejada substancial pelo sistema imunitário do hospedeiro. Algumas respostas imunitárias incluem, mas não estão limitadas a, respostas imunitárias humorais (por exemplo, produção de anticorpos específicos do antígeno) e respostas imunitárias mediadas por células (por exemplo, proliferação de linfócitos).
[001737] Em algumas modalidades, um hospedeiro ou uma célula hospedeira é contatado com (por exemplo, infectado com) um anelossomo. Em algumas modalidades, o hospedeiro é um mamífero, tal como um humano. A quantidade do anelossomo no hospedeiro pode ser medida em qualquer momento após administração. Em certas modalidades é determinado um decurso temporal de crescimento de anelossomos em uma cultura.
[001738] Em algumas modalidades, o anelossomo, por exemplo, um anelossomo como descrito no presente documento, é hereditário. Em algumas modalidades, o anelossomo é transmitido linearmente em fluidos e/ou células da mãe para o filho. Em algumas modalidades, as células filhas de uma célula hospedeira original compreendem o anelossomo. Em algumas modalidades, uma mãe transmite o anelossomo para o filho com uma eficiência de pelo menos 25%, 50%, 60%, 70%, 80%, 85%, 90%, 95%, ou 99% ou uma eficiência de transmissão da célula hospedeira para a célula filha de pelo menos 25%, 50%, 60%, 70%, 80%, 85%, 90%, 95%, ou 99%. Em algumas modalidades, o anelossomo em uma célula hospedeira tem uma eficiência de transmissão durante a meiose de pelo 25%, 50%, 60%, 70%, 80%, 85%, 90%, 95%, ou 99%. Em algumas modalidades, o anelossomo em uma célula hospedeira tem uma eficiência de transmissão durante a mitose de pelo menos 25%, 50%, 60%, 70%, 80%, 85%, 90%, 95%, ou 99%. Em algumas modalidades, o anelossomo em uma célula tem uma eficiência de transmissão entre cerca de 10%-20%, 20%-30%, 30%-40%, 40%-50%, 50%-60%, 60%- 70%, 70%-75%, 75%-80%, 80%-85%, 85%-90%, 90%-95%, 95%-99% ou qualquer percentagem intermédia.
[001739] Em algumas modalidades, o anelossomo, por exemplo, anelossomo se replica dentro da célula hospedeira. Em uma modalidade, o anelossomo é capaz de se replicar em uma célula de mamífero, por exemplo, célula humana. Em outras modalidades, o anelossomo é deficiente em replicação ou incompetente em replicação.
[001740] Enquanto em algumas modalidades o anelossomo se replica na célula hospedeira, o anelossomo não se integra no genoma do hospedeiro, por exemplo, com os cromossomos do hospedeiro. Em algumas modalidades, o anelossomo tem uma frequência de recombinação negligenciável, por exemplo, com os cromossomos do hospedeiro. Em algumas modalidades, o anelossomo tem uma frequência de recombinação, por exemplo, menor do que cerca de 1,0 cM/Mb, 0,9 cM/Mb, 0,8 cM/Mb, 0,7 cM/Mb, 0,6 cM/Mb, 0,5 cM/Mb, 0,4 cM/Mb, 0,3 cM/Mb, 0,2 cM/Mb, 0,1 cM/Mb ou menor, por exemplo, com os cromossomos do hospedeiro. V. Métodos de Uso
[001741] Os anelossomos e composições compreendendo anelossomos descritos no presente documento podem ser usados em métodos de tratamento de uma doença, disfunção ou condição, por exemplo, em um indivíduo (por exemplo, um indivíduo mamífero, por exemplo, um indivíduo humano) com sua necessidade. A administração de uma composição farmacêutica descrita no presente documento pode ser, por exemplo, por meio de administração parenteral (incluindo intravenosa, intratumoral, intraperitoneal, intramuscular, intracavidade e subcutânea). Os anelossomos podem ser administrados sozinhos ou formulados como uma composição farmacêutica.
[001742] Os anelossomos podem ser administrados na forma de uma composição de dose unitária, tal como uma composição parenteral de dose unitária. Tais composições são geralmente preparadas por mistura com adição e podem ser adequadamente adaptadas para administração parenteral. Tais composições podem estar, por exemplo, na forma de soluções ou suspensões ou suspensões ou supositórios ou aerossóis injetáveis e infusáveis.
[001743] Em algumas modalidades, a administração de um anelossomo ou composição compreendendo o mesmo, por exemplo, como descrito no presente documento, pode resultar na entrega de um elemento genético compreendido pelo anelossomo a uma célula alvo, por exemplo, em um indivíduo.
[001744] Um anelossomo ou sua composição descrito no presente documento, por exemplo, compreendendo um efetor (por exemplo, um efetor endógeno ou exógeno), pode ser usado para entregar o efetor a uma célula, tecido ou indivíduo. Em algumas modalidades, o anelossomo ou sua composição é usado para entregar o efetor à medula óssea, sangue, coração, GI ou pele. A entrega de um efetor por administração de uma composição de anelossomo descrito no presente documento pode modular (por exemplo, aumentar ou diminuir) os níveis de expressão de um RNA não codificante ou polipeptídeo na célula, tecido ou indivíduo. A modulação do nível de expressão deste modo pode resultar na alteração de uma atividade funcional na célula à qual o efetor é entregue. Em algumas modalidades, a atividade funcional modulada pode ser de natureza enzimática, estrutural ou reguladora.
[001745] Em algumas modalidades, o anelossomo, ou suas cópias, é detectável em uma célula 24 horas (por exemplo, 1 dia, 2 dias, 3 dias, 4 dias, 5 dias, 6 dias, 1 semana, 2 semanas, 3 semanas, 4 semanas, 30 dias ou 1 mês) após entrega na célula. Em modalidades, um anelossomo ou sua composição medeia um efeito em uma célula alvo, e o efeito dura durante pelo menos 1, 2, 3, 4, 5, 6 ou 7 dias, 2, 3 ou 4 semanas ou 1, 2, 3, 6 ou 12 meses. Em algumas modalidades (por exemplo, em que o anelossomo ou sua composição compreende um elemento genético codificando uma proteína exógena), o efeito dura durante menos do que 1, 2, 3, 4, 5, 6 ou 7 dias, 2, 3 ou 4 semanas ou 1, 2, 3, 6 ou 12 meses.
[001746] Exemplos de doenças, disfunções e condições que podem ser tratadas com o anelossomo descrito no presente documento, ou uma composição compreendendo o anelossomo, incluem, sem limitação: disfunções imunitárias, interferonopatias (por exemplo, Interferonopatias de tipo I), doenças infecciosas, disfunções inflamatórias, condições autoimunes, câncer (por exemplo, um tumor sólido, por exemplo, câncer de pulmão, câncer de pulmão de células não pequenas, por exemplo, um tumor que expressa um gene responsivo a miR-625, por exemplo, caspase-3) e disfunções gastrointestinais. Em algumas modalidades, o anelossomo modula (por exemplo, aumenta ou diminui) uma atividade ou função em uma célula com a qual o anelossomo é contatado. Em algumas modalidades, o anelossomo modula (por exemplo, aumenta ou diminui) o nível ou atividade de uma molécula (por exemplo, um ácido nucleico ou uma proteína) em uma célula com a qual o anelossomo é contatado. Em algumas modalidades, o anelossomo diminui a viabilidade de uma célula, por exemplo, uma célula cancerosa, com a qual o anelossomo é contatado, por exemplo, em pelo menos cerca de 10%, 20%, 30%, 40%,
50%, 60%, 70%, 80%, 90%, 95%, 99% ou mais. Em algumas modalidades, o anelossomo compreende um efetor, por exemplo, um miRNA, por exemplo, miR-625, que diminui a viabilidade de uma célula, por exemplo, uma célula cancerosa, com a qual o anelossomo é contatado, por exemplo, em pelo menos cerca de 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 95%, 99% ou mais. Em algumas modalidades, o anelossomo aumenta a apoptose de uma célula, por exemplo, uma célula cancerosa, por exemplo, por aumento da atividade de caspase-3, com a qual o anelossomo é contatado, por exemplo, em pelo menos cerca de 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 95%, 99% ou mais. Em algumas modalidades, o anelossomo compreende um efetor, por exemplo, um miRNA, por exemplo, miR-625, que aumenta a apoptose de uma célula, por exemplo, uma célula cancerosa, por exemplo, por aumento da atividade de caspase-3, com a qual o anelossomo é contatado, por exemplo, em pelo menos cerca de 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 95%, 99% ou mais. VI. Métodos de Produção Produção do Elemento Genético
[001747] Os métodos de preparação do elemento genético do anelossomo são descritos em, por exemplo, Khudyakov & Fields, Artificial DNA: Methods and Applications, CRC Press (2002); em Zhao, Synthetic Biology: Tools and Applications, (Primeira Edição), Academic Press (2013); e Egli & Herdewijn, Chemistry and Biology of Artificial Nucleic Acids, (Primeira Edição), Wiley-VCH (2012).
[001748] Em algumas modalidades, o elemento genético pode ser desenhado usando ferramentas de desenho auxiliadas por computador. O anelossomo pode ser dividido em partes sobrepostas mais pequenas (por exemplo, na gama de segmentos ou ORFs individuais de cerca de 100 pb a cerca de 10 kb) que são mais fáceis de sintetizar. Estes segmentos de DNA são sintetizados a partir de um conjunto de oligonucleotídeos de fita simples sobrepostos. Os síntons resultantes sobrepostos são depois montados em pedaços maiores de DNA, por exemplo, o anelossomo. Os segmentos ou ORFs podem ser montados no anelossomo, por exemplo, recombinação in vitro ou locais de restrição únicos nas extremidades 5’ e 3’ para permitir a ligação.
[001749] O elemento genético pode ser alternativamente sintetizado com um algoritmo de desenho que analisa o anelossomo em fragmentos de comprimento de oligo, criando condições ideais de desenho para a síntese que levam em consideração a complexidade do espaço de sequência. Os oligos são depois quimicamente sintetizados em chips de elevada densidade, baseados em semicondutores, onde são sintetizados mais do que 200.000 oligos individuais por chip. Os oligos são montados com uma técnica de montagem, tal como BioFab®, para construir segmentos de DNA mais longos a partir dos oligos mais pequenos. Isto é feito de um modo paralelo, logo centenas a milhares de segmentos de DNA sintético são construídos ao mesmo tempo.
[001750] Cada elemento genético ou segmento do elemento genético pode ser verificado quanto à sequência. Em algumas modalidades, o sequenciamento de elevada produtividade de RNA ou DNA pode possuir lugar usando AnyDot.chips (Genovoxx, Alemanha), que permite a monitorização de processos biológicos (por exemplo, expressão de miRNA ou variabilidade de alelos (detecção de SNP)). Em particular, os chips AnyDot permitem a intensificação de 10x-50x da detecção do sinal de fluorescência de nucleotídeos. Os chips e métodos para uso dos mesmos são descritos em parte nos Pedidos de Publicação Internacional N.os WO 02088382, WO 03020968, WO 0303 1947, WO 2005044836, PCTEP 05105657, PCMEP 05105655; e nos pedidos de patente alemã N.os DE 101 49 786, DE 102 14 395, DE 103 56 837, DE 10 2004 009 704, DE 10 2004 025 696, DE 10 2004 025 746, DE 10
2004 025 694, DE 10 2004 025 695, DE 10 2004 025 744, DE 10 2004 025 745 e DE 10 2005 012 301.
[001751] Outros sistemas de sequenciamento de elevada produtividade incluem aqueles descritos em Venter, J., et al. Science 16 de fev. de 2001; Adams, M. et al., Science 24 de mar. de 2000; e M.J, Levene, et al. Science 299: 682-686, janeiro de 2003; bem como Pedidos de Publicação dos EUA N.º 20030044781 e 2006/0078937. Globalmente, tais sistemas envolvem sequenciamento de uma molécula de ácido nucleico alvo possuindo uma pluralidade de bases pela adição temporal de bases através de uma reação de polimerização que é medida em uma molécula de ácido nucleico, i.e., a atividade de uma enzima polimerizadora de ácido nucleico na molécula de ácido nucleico modelo a ser sequenciada é seguida em tempo real. A sequência pode ser depois deduzida por identificação de qual a base que está sendo incorporada na fita complementar crescente do ácido nucleico alvo pela atividade catalítica da enzima polimerizadora de ácido nucleico em cada passo na sequência de adições de bases. Uma polimerase no complexo da molécula de ácido nucleico alvo é proporcionada em uma posição adequada para se mover ao longo da molécula de ácido nucleico alvo e estender o iniciador de oligonucleotídeo em um local ativo. Uma pluralidade de tipos marcados de análogos de nucleotídeos é proporcionada próxima do local ativo, com cada tipo distinguível de análogo de nucleotídeo sendo complementar a um nucleotídeo diferente na sequência de ácidos nucleicos alvo. A fita de ácido nucleico crescente é estendida por uso da polimerase para adicionar um análogo de nucleotídeo à fita de ácido nucleico no local ativo, onde o análogo de nucleotídeo sendo adicionado é complementar ao nucleotídeo do ácido nucleico alvo no local ativo. O análogo de nucleotídeo adicionado ao iniciador de oligonucleotídeo em resultado do passo de polimerização é identificado. Os passos de proporcionar análogos de nucleotídeos marcados, polimerizar a fita de ácido nucleico crescente e identificar o análogo de nucleotídeo adicionado são repetidos tal que a fita de ácido nucleico seja ainda estendida e a sequência do ácido nucleico alvo seja determinada.
[001752] Em algumas modalidades, o sequenciamento de espingarda é realizado. No sequenciamento de espingarda, o DNA é quebrado aleatoriamente em numerosos segmentos pequenos, que são sequenciados usando o método de terminação de cadeia para obter leituras. Múltiplas leituras sobrepostas para o DNA alvo são obtidas por realização de várias rondas desta fragmentação e sequenciamento. Os programas de computador usam depois as extremidades sobrepostas de diferentes leituras para as montar em uma sequência contínua.
[001753] Em algumas modalidades, os fatores para replicação ou empacotamento podem ser fornecidos em cis ou em trans, em relação ao elemento genético. Por exemplo, quando fornecido em cis, o elemento genético pode compreender um ou mais genes codificando uma ORF1, ORF1/1, ORF1/2, ORF2, ORF2/2, ORF2/3 ou ORF2t/3 de Anellovirus, por exemplo, como descrito no presente documento. Em algumas modalidades, os sinais de replicação e/ou empacotamento podem ser incorporados em um elemento genético, por exemplo, para induzir a amplificação e/ou encapsulação. Em algumas modalidades, isto é feito no contexto de regiões maiores do genoma do anelossomo (por exemplo, inserção de efetores em um local específico no genoma ou substituição de ORFs virais por efetores).
[001754] Em outro exemplo, quando fornecido em trans, o elemento genético pode carecer de genes codificando uma ou mais de uma ORF1, ORF1/1, ORF1/2, ORF2, ORF2/2, ORF2/3 ou ORF2t/3 de Anellovirus, por exemplo, como descrito no presente documento; esta proteína ou proteínas podem ser fornecidas, por exemplo, por um outro ácido nucleico, por exemplo, um ácido nucleico ajudante. Em algumas modalidades, sinais em cis mínimos (por exemplo, 5´ UTR e/ou região rica em GC) estão presentes no elemento genético. Em algumas modalidades, o elemento genético não codifica fatores de replicação ou empacotamento (por exemplo, replicase e/ou proteínas de capsídeo). Tais fatores podem, em algumas modalidades, ser fornecidos por um ou mais ácidos nucleicos ajudantes (por exemplo, um ácido nucleico viral ajudante, um plasmídeo ajudante ou um ácido nucleico ajudante integrado no genoma da célula hospedeira). Em algumas modalidades, os ácidos nucleicos ajudantes expressam proteínas e/ou RNAs suficientes para induzir a amplificação e/ou empacotamento, mas podem carecer de seus próprios sinais de empacotamento. Em algumas modalidades, o elemento genético e o ácido nucleico ajudante são introduzidos na célula hospedeira (por exemplo, simultaneamente ou separadamente), resultando na amplificação e/ou empacotamento do elemento genético mas não do ácido nucleico ajudante. Circularização in vitro
[001755] Em alguns casos, o elemento genético a ser empacotado em um exterior proteináceo é um DNA circular de fita simples. O elemento genético pode, em alguns casos, ser introduzido em uma célula hospedeira em uma forma sem ser um DNA circular de fita simples. Por exemplo, o elemento genético pode ser introduzido na célula hospedeira como um DNA circular de fita dupla. O DNA circular de fita dupla pode ser depois convertido em um DNA circular de fita simples na célula hospedeira (por exemplo, uma célula hospedeira compreendendo uma enzima adequada para replicação de círculo rolante, por exemplo, uma proteína Rep de Anellovirus, por exemplo, Rep68/78, Rep60, RepA, RepB, Pre, MobM, TraX, TrwC, Mob02281, Mob02282, NikB, ORF50240, NikK, TecH, OrfJ ou TraI, por exemplo, como descrito em Wawrzyniak et al. 2017, Front. Microbiol. 8: 2353; incorporado no presente documento por referência no que diz respeito às enzimas listadas). Em algumas modalidades, o DNA circular de fita dupla é produzido por circularização in vitro, por exemplo, como descrito no Exemplo 35. Geralmente, os construtos de DNA circularizado in vitro podem ser produzidas por digestão de um plasmídeo compreendendo a sequência de um elemento genético a ser empacotado, tal que a sequência do elemento genético seja excisada como uma molécula de DNA linear. O DNA linear resultante pode ser depois ligado, por exemplo, usando uma DNA ligase, para formar um DNA circular de fita dupla. Em alguns casos, um DNA circular de fita dupla produzido por circularização in vitro pode sofrer replicação de círculo rolante, por exemplo, como descrito no presente documento. Sem desejar ser limitado pela teoria é contemplado que a circularização in vitro resulta em um construto de DNA de fita dupla que pode sofrer replicação de círculo rolante sem modificação adicional, sendo deste modo capaz de produzir DNA circular de fita simples de um tamanho adequado a ser empacotado em um anelossomo, por exemplo, como descrito no presente documento. Em algumas modalidades, o construto de DNA de fita dupla é mais pequeno do que um plasmídeo (por exemplo, um plasmídeo bacteriano). Em algumas modalidades, o construto de DNA de fita dupla é excisada de um plasmídeo (por exemplo, um plasmídeo bacteriano) e depois circularizado, por exemplo, por circularização in vitro. Produção do Anelossomo
[001756] Os elementos genéticos e vetores compreendendo os elementos genéticos preparados como descrito no presente documento podem ser usados em uma variedade de modos para expressar o anelossomo em células hospedeiras apropriadas. Em algumas modalidades, o elemento genético e vetores compreendendo o elemento genético são transfectados em células hospedeiras apropriadas e o RNA resultante pode dirigir a expressão dos produtos gênicos do anelossomo, por exemplo, proteína não patogênica e sequência de ligação à proteína, a níveis elevados. Os sistemas das células hospedeiras que proporcionam elevados níveis de expressão incluem linhas de células contínuas que fornecem funções virais, tais como linhas de células superinfectadas com APV ou MPV, respectivamente, linhas de células manipuladas para complementar as funções de APV ou MPV, etc.
[001757] Em algumas modalidades, o anelossomo é produzido como descrito em qualquer um dos Exemplos 1, 2, 5, 6 ou 15-17.
[001758] Em algumas modalidades, o anelossomo é cultivado em linhas de células animais contínuas in vitro. De acordo com uma modalidade da invenção, as linhas de células podem incluir linhas de células porcinas. As linhas de células previstas no contexto da presente invenção incluem linhas de células porcinas imortalizadas tais como as, mas não limitadas às, linhas de células epiteliais renais porcinas PK-15 e SK, a linha de células monomieloides 3D4/31 e a linha de células testiculares ST. Igualmente, outras linhas de células de mamíferos estão incluídas, tais como células CHO (ovários de hamster chinês), MARC- 145, MDBK, RK-13, EEL. Ainda ou alternativamente, modalidades particulares dos métodos da invenção fazem uso de uma linha de células animais que é uma linha de células epiteliais, i.e., uma linha de células de células da linhagem epitelial. As linhas de células suscetíveis à infecção por anelossomos incluem, mas não estão limitadas a, linhas de células de origem humana ou primata, tais como linhas de células de carcinoma de rim humano ou de primata.
[001759] Em algumas modalidades, os elementos genéticos e vetores compreendendo os elementos genéticos são transfectados em linhas de células que expressam uma proteína polimerase viral de modo a alcançar expressão do anelossomo. Para este fim, as linhas de células transformadas que expressam uma proteína polimerase de anelossomo podem ser usadas como células hospedeiras apropriadas. As células hospedeiras podem ser similarmente manipuladas para proporcionarem outras funções virais ou funções adicionais.
[001760] Para preparar o anelossomo descrito no presente documento pode ser usado um elemento genético ou vetor compreendendo o elemento genético descrito no presente documento para transfectar células que proporcionam proteínas e funções do anelossomo requeridas para replicação e produção. Alternativamente, as células podem ser transfectadas com vírus ajudante antes da, durante a ou após transfecção pelo elemento ou vetor genético compreendendo o elemento genético descrito no presente documento. Em algumas modalidades, um vírus ajudante pode ser útil para complementar a produção de uma partícula viral incompleta. O vírus ajudante pode possuir um defeito de crescimento condicional, tal como restrição da gama de hospedeiros ou sensibilidade à temperatura, que permite a seleção subsequente de vírus transfectantes. Em algumas modalidades, um vírus ajudante pode proporcionar uma ou mais proteínas de replicação utilizadas pelas células hospedeiras para alcançar expressão do anelossomo. Em algumas modalidades, as células hospedeiras podem ser transfectadas com vetores codificando proteínas virais tais como a uma ou mais proteínas de replicação. Em algumas modalidades, um vírus ajudante compreende uma sensibilidade antiviral.
[001761] O elemento genético ou vetor compreendendo o elemento genético descrito no presente documento pode ser replicado e produzido em partículas de anelossomo por qualquer número de técnicas conhecidas na técnica, como descrito, por exemplo, na Pat. dos E.U.A. N.º 4,650,764; Pat. dos E.U.A. N.º 5,166,057; Pat. dos E.U.A. N.º 5,854,037; Pedido de Patente Europeia EP 0702085A1; pedido de patente dos E.U.A. N.º de Sér. 09/152,845; Pedidos de Patentes
Internacionais PCT WO97/12032; WO96/34625; Pedido de Patente Europeia EP-A780475; WO 99/02657; WO 98/53078; WO 98/02530; WO 99/15672; WO 98/13501; WO 97/06270; e EPO 780 47SA1, cada um dos quais é incorporado por referência no presente documento em sua totalidade.
[001762] A produção de culturas de células contendo anelossomos de acordo com a presente invenção pode ser levada a cabo em diferentes escalas, tal como em frascos, garrafas de rolo ou biorreatores. Os meios usados para o cultivo das células a serem infectadas são conhecidos do perito e podem compreender geralmente os nutrientes padrão requeridos para viabilidade celular, mas podem também compreender nutrientes adicionais dependentes do tipo de célula. Opcionalmente, o meio pode estar isento de proteínas e/ou isento de soro. Dependendo do tipo de célula, as células podem ser cultivadas em suspensão ou em um substrato. Em algumas modalidades, diferentes meios são usados para crescimento das células hospedeiras e para produção de anelossomos.
[001763] A purificação e o isolamento de anelossomos podem ser realizados de acordo com métodos conhecidos pelo perito na produção de vírus e são descritos por exemplo por Rinaldi, et al., DNA Vaccines: Methods and Protocols (Methods in Molecular Biology),3ª ed. 2014, Humana Press.
[001764] Em um aspecto, a presente invenção inclui um método para a replicação e propagação in vitro do anelossomo como descrito no presente documento, que pode compreender os seguintes passos: (a) transfecção de um elemento genético linearizado em uma linha de células sensível à infecção por anelossomos; (b) coleta das células e isolamento de células mostrando a presença do elemento genético; (c) cultivo das células obtidas no passo (b) durante pelo menos três dias, tal como pelo menos uma semana ou mais, dependendo das condições experimentais e expressão gênica; e (d) coleta das células do passo (c).
[001765] Em algumas modalidades, um anelossomo pode ser introduzido em uma linha de células hospedeiras cultivada até uma elevada densidade celular. Em algumas modalidades, o anelossomo pode ser coletado e/ou purificado por separação de solutos com base em propriedades biofísicas, por exemplo, cromatografia de troca iônica ou filtração de fluxo tangencial, antes da formulação com um excipiente farmacêutico. VII. Administração/Entrega
[001766] A composição (por exemplo, uma composição farmacêutica compreendendo um anelossomo como descrito no presente documento) pode ser formulada para incluir um excipiente farmaceuticamente aceitável. As composições farmacêuticas podem compreender, opcionalmente, uma ou mais substâncias ativas adicionais, por exemplo, substâncias terapeuticamente e/ou profilaticamente ativas. As composições farmacêuticas da presente invenção podem ser estéreis e/ou estar isentas de pirogênios. Considerações gerais na formulação e/ou fabricação de agentes farmacêuticos podem ser encontradas, por exemplo, em Remington:The Science and Practice of Pharmacy 21ª ed., Lippincott Williams & Wilkins, 2005 (incorporado no presente documento por referência).
[001767] Embora as descrições de composições farmacêuticas proporcionadas no presente documento estejam principalmente dirigidas a composições farmacêuticas que são adequadas para administração a humanos será entendido pelo perito que tais composições são geralmente adequadas para administração a qualquer outro animal, por exemplo, a animais não humanos, por exemplo, mamíferos não humanos. A modificação de composições farmacêuticas adequadas para administração a humanos de modo a tornar as composições adequadas para administração a vários animais é bem entendida, e o farmacologista veterinário perito pode desenhar e/ou realizar tal modificação com experimentação meramente habitual, se alguma. Os indivíduos para os quais a administração das composições farmacêuticas é contemplada incluem, mas não estão limitados a, humanos e/ou outros primatas; mamíferos, incluindo mamíferos comercialmente relevantes tais como gado, porcos, cavalos, ovelhas, gatos, cães, camundongos e/ou ratos; e/ou aves, incluindo aves comercialmente relevantes tais como aves domésticas, galinhas, patos, gansos e/ou perus.
[001768] As formulações das composições farmacêuticas descritas no presente documento podem ser preparadas por qualquer método conhecido ou doravante desenvolvido na técnica de farmacologia. Em geral, tais métodos preparatórios incluem o passo de colocação do ingrediente ativo em associação a um excipiente e/ou um ou mais outros ingredientes acessórios e, depois, se necessário e/ou desejável, divisão, modelação e/ou empacotamento do produto.
[001769] Em um aspecto, a invenção apresenta um método de entrega de um anelossomo a um indivíduo. O método inclui administração de uma composição farmacêutica compreendendo um anelossomo como descrito no presente documento ao indivíduo. Em algumas modalidades, o anelossomo administrado se replica no indivíduo (por exemplo, se torna uma parte do viroma do indivíduo).
[001770] A composição farmacêutica pode incluir elementos virais de tipo selvagem ou nativos e/ou elementos virais modificados. O anelossomo pode incluir um ou mais das sequências (por exemplo, sequências de ácidos nucleicos ou sequências de ácidos nucleicos codificando suas sequências de aminoácidos) em qualquer uma das Tabelas A1-A12, B1-B5, C1-C5 ou 1-18 ou uma sequência com pelo menos cerca de 60%, 65%, 70%, 75%, 80%, 85%, 90% 95%, 96%, 97%,
98% e 99% de identidade da sequências de nucleotídeos com qualquer uma das sequências de nucleotídeos ou uma sequência que é complementar com a sequência em qualquer uma das Tabelas A1-A12, B1-B5, C1-C5 ou 1-18. O anelossomo pode compreender uma molécula de ácido nucleico compreendendo uma sequência de ácidos nucleicos com pelo menos cerca de 60%, 65%, 70%, 75%, 80%, 85%, 90% 95%, 96%, 97%, 98% e 99% de identidade de sequências com uma ou mais das sequências em qualquer uma das Tabelas A1, A3, A5, A7, A9, A11, B1-B5, 1, 3, 5, 7, 9, 11, 13, 15, 17, ou 41. O anelossomo pode compreender uma molécula de ácido nucleico codificando uma sequência de aminoácidos com pelo menos cerca de 60%, 65%, 70%, 75%, 80%, 85%, 90% 95%, 96%, 97%, 98% e 99% de identidade de sequências com qualquer uma das sequências de aminoácidos em qualquer uma das Tabelas A2, A4, A6, A8, A10, A12, C1-C5, 2, 4, 6, 8, 10, 12, 14, 16, ou 18. O anelossomo pode compreender um polipeptídeo compreendendo uma sequência de aminoácidos com pelo menos cerca de 60%, 65%, 70%, 75%, 80%, 85%, 90% 95%, 96%, 97%, 98% e 99% de identidade de sequências com qualquer uma das sequências de aminoácidos em qualquer uma das Tabelas A2, A4, A6, A8, A10, A12, C1-C5, 2, 4, 6, 8, 10, 12, 14, 16, ou 18. O anelossomo pode incluir uma ou mais das sequências em qualquer uma das Tabelas A1, A3, A5, A7, A9, A11, B1-B5, 1, 3, 5, 7, 9, 11, 13, 15, 17, ou 41 ou uma sequência com pelo menos cerca de 60%, 65%, 70%, 75%, 80%, 85%, 90% 95%, 96%, 97%, 98% e 99% de identidade de sequências de nucleotídeos com qualquer uma das sequências de nucleotídeos ou uma sequência que é complementar com a sequência em qualquer uma das Tabelas A1, A3, A5, A7, A9, A11, B1-B5, 1, 3, 5, 7, 9, 11, 13, 15, 17, ou 41.
[001771] Em algumas modalidades, o anelossomo é suficiente para aumentar (estimular) a expressão endógena de genes e proteínas, por exemplo, pelo menos cerca de 5%, 10%, 15%, 20%, 25%, 30%, 35%,
40%, 45%, 50% ou mais em comparação com uma referência, por exemplo, um controle saudável. Em certas modalidades, o anelossomo é suficiente para diminuir (inibir) a expressão endógena de genes e proteínas, por exemplo, pelo menos cerca de 5%, 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50% ou mais em comparação com uma referência, por exemplo, um controle saudável.
[001772] Em algumas modalidades, o anelossomo inibe/intensifica uma ou mais propriedades virais, por exemplo, tropismo, infectividade, imunossupressão/ativação, em um hospedeiro ou célula hospedeira, por exemplo, pelo menos cerca de 5%, 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50% ou mais em comparação com uma referência, por exemplo, um controle saudável.
[001773] Em algumas modalidades, o indivíduo recebe a composição farmacêutica compreendendo ainda uma ou mais estirpes virais que não estão representadas na informação genética viral.
[001774] Em algumas modalidades, a composição farmacêutica compreendendo um anelossomo descrito no presente documento é administrada em uma dose e tempo suficientes para modular uma infecção viral. Alguns exemplos não limitantes de infecções virais incluem vírus adenoassociado, Vírus Aichi, Lissavírus do morcego australiano, Poliomavírus BK, Vírus Banna, Vírus da floresta Barmah, Vírus Bunianvera, Vírus da lebre La Crosse, Vírus da lebre da neve, Herpesvírus Cercopitecina, Vírus Chandipura, Vírus Chikungunya, Cosavírus A, Vírus Cowpox, Coxsaquievírus, Vírus da febre hemorrágica da Crimeia-Congo, Vírus da dengue, Vírus Dhori, Vírus Dugbe, Vírus Duvenhage, Vírus da encefalite equina oriental, Ebolavírus, Ecovírus, Vírus da encefalomiocardite, Vírus Epstein-Barr, Lissavírus do morcego europeu, Vírus C GB/vírus da hepatite G, Vírus Hantaan, Vírus Hendra, Vírus da hepatite A, Vírus da hepatite B, Vírus da hepatite C, Vírus da hepatite E, Vírus da hepatite delta, Vírus da varicela, Adenovírus humano, Astrovírus humano, Coronavírus humano, Citomegalovírus humano, Enterovírus humano 68, Enterovírus humano 70, Herpesvírus humano 1, Herpesvírus humano 2, Herpesvírus humano 6, Herpesvírus humano 7, Herpesvírus humano 8, Vírus da imunodeficiência humana, Papilomavírus humano 1, Papilomavírus humano 2, Papilomavírus humano 16, Papilomavírus humano 18, Paragripe humana, Parvovírus humano B19, Vírus respiratório sincicial humano, Rinovírus humano, Coronavírus SARS humano, Espumaretrovírus humano, Vírus linfotrópico T humano, Torovírus humano, Vírus da Gripe A, Vírus da Gripe B, Vírus da Gripe C, Vírus Isfahan, Poliomavírus JC, Vírus da encefalite japonesa, Arenavírus Junin, Poliomavírus KI, Vírus Kunjin, Vírus do morcego de Lagos, Marburgvírus do Lago Victoria, Vírus Langat, Vírus Lassa, Vírus Lordsdale, Vírus da doença de Louping, Vírus da coriomeningite linfocítica, Vírus de Machupo, Vírus de Mayaro, Coronavírus MERS, Vírus do sarampo, Vírus da encefalomiocardite de Mengo, Poliomavírus de células Merkel, Vírus de Mokola, Vírus de molusco contagioso, Vírus de varicela dos macacos, Vírus de caxumba, Vírus de encefalite do vale Murray, Vírus de Nova Iorque, Vírus de Nipah, Vírus de Norwalk, Vírus O’nyong-nyong, Vírus Orf, Vírus Oropouche, Vírus Pichinde, Poliovírus, Flebovírus de Punta toro, Vírus Puumala, Vírus da raiva, Vírus da febre do vale do Rift, Rosavírus A, Vírus do rio Ross, Rotavírus A, Rotavírus B, Rotavírus C, Vírus da rubéola, Vírus Sagiyama, Salivírus A, Vírus da febre da mosca siciliana, Vírus Sapporo, Vírus da floresta SemLiki, Vírus de Seul, Vírus espumoso simiano, Vírus Simiano 5, Vírus de Sindbis, Vírus de Southampton, Vírus da encefalite de St.
Louis, Vírus powassan transmitido por carrapatos, Vírus Torque teno, Vírus da Toscana, Vírus Uukuniemi, Vírus Vaccínia, Vírus da Varicella-zoster, Vírus da varíola, Vírus da encefalite equina venezuelana, Vírus da estomatite vesicular, Vírus da encefalite equina ocidental, poliomavírus WU, Vírus do Nilo
Ocidental, Vírus do tumor do macaco Yaba, Vírus da doença do tipo Yaba, Vírus da febre amarela e Vírus do Zika. Em certas modalidades, o anelossomo é suficiente para superar e/ou substituir um vírus já presente no indivíduo, por exemplo, pelo menos cerca de 5%, 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50% ou mais em comparação com uma referência. Em certas modalidades, o anelossomo é suficiente para competir com a infecção viral crônica ou aguda. Em certas modalidades, o anelossomo pode ser administrado profilaticamente para proteger de infecções virais (por exemplo, um provirótico). Em algumas modalidades, o anelossomo está em uma quantidade suficiente para modular (por exemplo, fenótipo, níveis de vírus, expressão gênica, competir com outros vírus, estado de doença, etc. pelo menos cerca de 5%, 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50% ou mais).
[001775] Todas as referências e publicações e referências citadas no presente documento são deste modo incorporadas por referência.
[001776] Os seguintes exemplos são proporcionados para ilustrar ainda algumas modalidades da presente invenção, mas não se destinam a limitar o escopo da invenção; será entendido pela sua natureza exemplificativa que outros procedimentos, metodologias ou técnicas conhecidas dos peritos na técnica podem ser alternativamente usados.
EXEMPLOS Tabela de Conteúdos
[001777] Exemplo 1: Preparação de Anelossomos: Desenho e síntese de um anelossomo sintético que inibe a expressão de interferon (IFN).
[001778] Exemplo 2: Produção em Larga Escala de Anelossomos (Anelossomo A e/ou B): Produção e propagação de anelossomos
[001779] Exemplo 3: Efeitos de Anelossomos in vitro (Anelossomo A): Avaliação in vitro da expressão e função efetora, por exemplo,
expressão do miRNA, do anelossomo após infecção celular
[001780] Exemplo 4: Efeitos imunológicos de Anelossomos (Anelossomo A): função efetora in vivo, por exemplo, expressão do miRNA, do anelossomo após administração
[001781] Exemplo 5: Preparação de anelossomos sintéticos: Produção in vitro de um anelossomo sintético
[001782] Exemplo 6: Montagem e infecção de anelossomos: Produção in vitro de anelossomos infecciosos usando sequências de DNA sintéticas como descrito no Exemplo 5
[001783] Exemplo 7: Seletividade de anelossomos: Os anelossomos sintéticos produzidos in vitro infectam linhas de células de uma variedade de origens de tecidos
[001784] Exemplo 8: Identificação e uso de sequências de ligação à proteína: locais de ligação à proteína putativos no genoma de Anellovirus
[001785] Exemplo 9: Um genoma de Anellovirus
[001786] Exemplo 10: Inserções de nucleotídeos de vários comprimentos em um genoma de Anellovirus: adição de vários comprimentos em um genoma de Anellovirus
[001787] Exemplo 11: Carga exemplificativa a ser entregue: classes exemplificativas de cargas úteis de ácidos nucleicos e proteínas em um anelossomo
[001788] Exemplo 12: Loci de integração de cargas úteis exemplificativas
[001789] Exemplo 13: Categorias definidas de Anellovirus e suas regiões conservadas
[001790] Exemplo 14: Anelossomos deficientes em replicação e vírus ajudantes
[001791] Exemplo 15: Processo de fabricação para anelossomos competentes em replicação
[001792] Exemplo 16: Processo de fabricação de anelossomos deficientes em replicação: recuperação e escalonamento da produção de anelossomos deficientes em replicação
[001793] Exemplo 17: Produção de anelossomos usando células em suspensão: produção de anelossomos em células em suspensão.
[001794] Exemplo 18: Quantificação de equivalentes do genoma de anelossomos por qPCR: desenvolvimento de um ensaio de PCR quantitativa baseado em sonda de hidrólise para quantificar anelossomos
[001795] Exemplo 19: Utilização de anelossomos para expressar uma proteína exógena em camundongos: uso de um anelossomo para expressar uma proteína modelo funcional in vivo
[001796] Exemplo 20: Alinhamentos de genoma para determinar se o DNA de anelossomos se integrou nos genomas do hospedeiro
[001797] Exemplo 21: Avaliação da integração de anelossomos em um genoma hospedeiro
[001798] Exemplo 22: Efeitos funcionais de um anelossomo expressando uma sequência de microRNA exógena: uso de um anelossomo para expressar um efetor de ácido nucleico funcional
[001799] Exemplo 23: Preparação e produção de anelossomos para expressar RNAs não codificantes exógenos: uso de anelossomos para expressar pequenos RNAs não codificantes exógenos
[001800] Exemplo 24: Conservação em clados de Anellovirus: identificação de sete clados dentro do gênero Alphatorquevirus
[001801] Exemplo 25: Expressão de um miRNA endógeno a partir de um anelossomo e deleção do miRNA endógeno
[001802] Exemplo 26: Localização de ORFs de Anellovirus
[001803] Exemplo 27: Caracterização das regiões requeridas para desenvolvimento de anelossomos
[001804] Exemplo 28: Entrega de anelossomos de proteínas exógenas in vivo: Este exemplo demonstra a função efetora in vivo (por exemplo, expressão de proteínas) de anelossomos após administração
[001805] Exemplo 29: Identificação de miRNAs precursores (pré- mIRs) em Anelloviruses: abordagens computacionais e experimentais para identificar novos miRNAs precursores codificados por vários Anelloviruses
[001806] Exemplo 30: Determinação do alvo endógeno de pré-miRs de Anellovirus: análise para determinar alvos endógenos e vias alvo potencialmente terapeuticamente relevantes de pré-miRs codificados por várias estirpes de Anelloviruses
[001807] Exemplo 31: Preparação de um anelossomo codificando um pré-miR de Anellovirus nativo: um processo para empacotar a forma replicante ou não replicante de anelossomos expressando pré-miRs de Anellovirus nativos
[001808] Exemplo 32: Utilização de pré-miRs de Anellovirus como supressor tumoral em um modelo de cultura de células in vitro: efeito fenotípico de pré-miRs candidatos identificados como supressores tumorais a partir da análise, por exemplo, como descrito no Exemplo 29
[001809] Exemplo 33: Utilização de pré-miRs de Anellovirus como supressores tumorais in vivo: Experiências in vivo para confirmar o efeito supressor tumoral de um pré-miR de Anellovirus supressor tumoral e linhas de células cancerosas a partir da análise in vitro, como descrito no Exemplo 32
[001810] Exemplo 34: Cópias em tandem do genoma de Anellovirus
[001811] Exemplo 35: Genomas de Anellovirus circularizados in vitro: construtos compreendendo DNA de genoma aneloviral circular, de fita dupla com DNA não viral mínimo
[001812] Exemplo 36: Modelação de ORF1 e identificação de resíduos e domínios conservados: modelação de proteínas ORF1 de Betatorqueviruses e definição de domínios putativos
[001813] Exemplo 37: Produção de anelossomos contendo ORF1 quimérica com domínios hipervariáveis de diferentes estirpes de Vírus Torque Teno
[001814] Exemplo 38: Produção de ORF1 quimérica contendo proteína/peptídeos diferentes de TTV em vez de domínios hipervariáveis
[001815] Exemplo 39: Entrega de anelossomo de enzima secretada in vivo
[001816] Exemplo 40: Projeto de um anelossomo abrigando uma carga útil de DNA
[001817] Exemplo 41: Anelossomos baseados em tth8 e LY2 cada um transduziu com sucesso o gene EPO em células de câncer de pulmão
[001818] Exemplo 42: Os anelossomos com transgenes terapêuticos podem ser detectados in vivo após administração intravenosa (i.v.)
[001819] Exemplo 43: Distribuição do tamanho das sequências codificantes em Anelloviruses
[001820] Exemplo 44: Um motivo altamente conservado para caracterizar ORF2
[001821] Exemplo 45: Evidência de mRNA de ORF1 de Anellovirus de comprimento total em humanos
[001822] Exemplo 46: Genoma circularizado in vitro como material de entrada para produção de anelossomos in vitro
[001823] Exemplo 47: Identificação de motivos estruturais secundários conservados em ORF1 de Anellovirus Exemplo 1: Preparação de Anelossomos
[001824] Este exemplo descreve o desenho e síntese de um anelossomo sintético que inibe a expressão de interferon (IFN).
[001825] Um anelossomo (Anelossomo A) é desenhado começando com 1) uma sequência de DNA para um gene de capsídeo codificando um invólucro de empacotamento não patogênico (Arch Virol (2007) 152:
1961-1975), Número de Acesso: A7XCE8.1 (ORF11_TTW3); 2) uma sequência de DNA codificando um microRNA que visa um gene hospedeiro (por exemplo, IFN) (PLOS Pathogen (2013), 9 (12), e1003818), Número de acesso: AJ620231.1; e 3) uma sequência de DNA (Journal of Virology (2003), 77 (24), 13036-13041 que se liga a uma região específica na proteína de capsídeo (por exemplo, região específica de capsídeo possuindo um Número de Acesso: Q99153.1).
[001826] A esta sequência são adicionadas sequências de DNA não codificantes de 1 kb (Anelossomo B). O anelossomo desenhado (Figura 2) é quimicamente sintetizado em 3 kb (tamanho total), que é verificado quanto à sequência.
[001827] A sequência de anelossomo é transfectada em células 293T de rim embrionário humano (1 mg por 105 células em placas de 12 poços) com reagente JetPEI (transfecção PolyPlus, Illkirch, França) como recomendado pelo fabricante. As transfecções dos controles estão incluídas com vetor sozinho ou as células transfectadas com JetPEI sozinho e as eficiências de transfecção são otimizadas com um repórter plasmídeo codificando GFP. A fluorescência das transfecções de controle é medida para assegurar células apropriadamente transfectadas. As culturas transfectadas são incubadas durante a noite a 37 °C e dióxido de carbono a 5%.
[001828] Após 18 horas, as células são lavadas três vezes com PBS antes da adição de meio fresco. O sobrenadante é coletado para ultracentrifugação e coleta de anelossomos como se segue. O meio é limpo por centrifugação a 4000 x g durante 30 min e depois a 8000 x g durante 15 min para remover as células e os resíduos celulares. O sobrenadante é depois filtrado através de filtros de tamanho de poros de 0,45 µm. Os anelossomos são peletizados a 27.000 rpm durante 1 h através de uma almofada de sacarose a 5% (5 mL) e ressuspensos em 1x solução salina tamponada com fosfato (PBS) mais bacitracina a 0,1%
em 1/100 do volume original. Os anelossomos concentrados são centrifugados através de um gradiente por passos de sacarose de 20 a 35% a 24.000 rpm durante 2 h. A banda de anelossomos na junção de gradiente é coletada. Os anelossomos são depois diluídos com 1x PBS e peletizados a 27.000 rpm durante 1 h. Os péletes de anelossomos são ressuspensos em 1x PBS e ainda purificados através de um gradiente contínuo de sacarose de 20 a 35%. Exemplo 2: Produção em Larga Escala de Anelossomos (Anelossomo A e/ou B)
[001829] Este exemplo descreve a produção e propagação de anelossomos.
[001830] Os anelossomos purificados como descrito no Exemplo 1 são preparados para amplificação em larga escala em frascos giratórios com células A549 produtoras cultivadas em suspensão. As células A549 são mantidas em meio F12K, soro fetal bovino a 10%, glutamina a 2 mM e antibióticos. As células A549 são infectadas com anelossomos a uma carga de anelossomos de 106 anelossomos para produzir ~1x10 7 partículas de anelossomo após uma incubação a 37 °C e dióxido de carbono a 5% durante 24 h. As células são depois lavadas três vezes com PBS e incubadas com meio fresco durante 6 h.
[001831] Para a purificação de anelossomos são realizados dois passos de ultracentrifugação baseados em gradientes de cloreto de césio seguidos por diálise como se segue (Bio-Protocol (2012) Bio101: e201).As células são removidas por centrifugação (6000 x g durante 10 min) e o sobrenadante é filtrado através de filtros de 0,8 e depois 0,2 µm. O filtrado é concentrado por passagem através de membranas de filtro (100.000 mw) até um volume de 8 mL. O retentado é introduzido em uma solução de sulfato de césio e centrifugado a 247.000 x g durante 20 h. As bandas de anelossomo são removidas, colocadas em tubagem de diálise de corte de 14.000 mw e dialisadas. Uma concentração adicional pode ser realizada, se desejado. Exemplo 3: Efeitos de Anelossomos in vitro (Anelossomo A)
[001832] Este exemplo descreve a avaliação in vitro da expressão e função efetora, por exemplo, expressão do miRNA, do anelossomo após infecção de células.
[001833] O efeito de anelossomos purificados como descrito no Exemplo 1 é avaliado in vitro através de regulação gênica endógena (por exemplo, sinalização de IFN). As células HEK293T são cotransfectadas com plasmídeos de luciferase dupla (luciferase de vaga-lume com um promotor de elemento de resposta estimulado por interferon (ISRE) e luciferase de Renilla de controle da transfecção com promotor constitutivo): Mistura de repórter de luciferase (pcDNA3.1dsRluc para pISRE-Luc à razão de 1:4 (Clonetech)) (J Virol (2008), 82: 9823-9828).
[001834] Os anelossomos são administrados na multiplicidade de infecção de 107 a células HEK293T semeadas em uma placa de 6 poços (2 conjuntos de triplicados - 3 poços de controle e 3 poços experimentais com o Anelossomo A).
[001835] Após 48 horas, o meio é substituído por novo meio com ou sem 100 u/mL de interferon universal tipo I (PBL, Piscataway, NJ). Dezesseis horas após tratamento com IFN é realizado um ensaio de luciferase dupla (J Virol (2008), 82: 9823-9828) para determinar a sinalização de IFN. A luciferase de vaga-lume é normalizada para a expressão de luciferase de Renilla para controlar as diferenças de transfecção. A dimensão da indução do repórter ISRE ffLuc é calculada por divisão dos poços experimentais comparáveis pelos poços de controle e a indução de cada condição é comparada em relação ao controle negativo.
[001836] Em uma modalidade, um sinal de luciferase diminuído no grupo de tratamento com anelossomos em comparação com um controle indicará que os anelossomos diminuem a produção de IFN nas células. Exemplo 4: Efeitos imunológicos dos Anelossomos (Anelossomo A)
[001837] Este exemplo descreve a função efetora in vivo, por exemplo, expressão do miRNA, do anelossomo após administração.
[001838] Anelossomos purificados preparados como descrito nos Exemplos 1 e 2 são intravenosamente administradas a porcos saudáveis em várias doses usando diluições de cem vezes começando a partir de 1014 equivalentes do genoma por quilograma até 0 equivalentes do genoma por quilograma. De modo a avaliar os efeitos na tolerância imunitária, os porcos são injetados diariamente durante 3 dias com as dosagens de anelossomos especificadas acima ou PBS de controle de veículo e sacrificados após 3 dias.
[001839] Baço, medula óssea e linfonodos são coletados. As suspensões de células individuais são preparadas a partir de cada um dos tecidos e coradas com marcadores extracelulares para MHC-II, CD11c e IFN intracelular. As células apresentadoras de antígenos MHC+, CD11c+, IFN+ são analisadas através de citometria de fluxo de cada tecido, por exemplo, em que uma célula que é positiva para um dado marcador de um dos marcadores acima mencionados é uma célula que exibe fluorescência mais elevada do que 99% das células em uma população de controle negativo que carece de expressão do marcador mas é de outro modo similar à população de células do ensaio, sob as mesmas condições.
[001840] Em uma modalidade, um número diminuído de células IFN+ no grupo de tratamento com anelossomos em comparação com o controle indicará que os anelossomos diminuem a produção de IFN nas células após administração. Exemplo 5: Preparação de anelossomos sintéticos.
[001841] Este exemplo demonstra a produção in vitro de um anelossomo sintético.
[001842] As sequências de DNA das estirpes LY1 e LY2 de TTMiniV (Eur Respir J. Ago de 2013; 42 (2): 470-9), entre os locais das enzimas de restrição EcoRV, foram clonadas em um vetor de canamicina (Integrated DNA Technologies). Os anelossomos incluindo sequências de DNA das estirpes LY1 e LY2 de TTMiniV são referidos como Anelossomo 1 (Anelo 1) e Anelossomo 2 (Anelo 2), respectivamente, nos Exemplos 6 e 7 e nas Figuras 6A-10B. Os construtos clonados foram transformados em E. coli competentes quanto a 10-Beta (New England Biolabs Inc.), seguido por purificação de plasmídeo (Qiagen) de acordo com o protocolo do fabricante.
[001843] Os construtos de DNA (Figura 3 e Figura 4) foram linearizados com digestão de restrição EcoRV (New England Biolabs, Inc.) a 37 graus Celsius durante 6 horas, originando fragmentos de DNA linear de fita dupla contendo o genoma de TTMiniV e excluindo elementos de esqueleto bacteriano (tal como a origem de replicação e marcadores selecionáveis). Isto foi seguido por eletroforese em gel de agarose, excisão de uma banda de DNA de tamanho correto para o fragmento do genoma de TTMiniV (2,9 pares de quilobases) e purificação em gel de DNA de bandas de agarose excisadas usando um estojo de extração de gel (Qiagen) de acordo com o protocolo do fabricante. Exemplo 6: Montagem e infecção de anelossomos
[001844] Este exemplo demonstra a produção in vitro bem-sucedida de anelossomos infecciosos usando sequências de DNA sintéticas como descrito no Exemplo 5.
[001845] O DNA de genoma de Anellovirus purificado em gel linearizado de fita dupla (obtido no Exemplo 5) foi transfectado quer em células HEK293T (linha de células de rim embrionário humano) ou células A549 (linha de células de carcinoma de pulmão humano), tanto em um plasmídeo intacto como na forma linearizada, com reagente de transfecção de lipídeos (Thermo Fisher Scientific). 6 ug de plasmídeo ou 1,5 ug de DNA de genoma de Anellovirus linearizado foram usados para transfecção de células confluentes a 70% em frascos T25. O esqueleto de vetor vazio carecendo das sequências virais incluídas no anelossomo foi usado como um controle negativo. Seis horas pós- transfecção, as células foram lavadas com PBS duas vezes e foram deixadas a crescer em meio de crescimento fresco a 37 graus Celsius e dióxido de carbono a 5%. As sequências de DNA codificando o promotor Ef1alfa humano seguido pelo gene YFP foram sintetizadas a partir de IDT. Esta sequência de DNA foi ligada de forma cega a um vetor de clonagem (Thermo Fisher Scientific). O vetor resultante foi usado como um controle para avaliar a eficiência da transfecção. O YFP foi detectado usando um sistema de visualização celular (Thermo Fisher Scientific) 72 horas pós-transfecção. As eficiências de transfecção das células HEK293T e A549 foram calculadas como 85% e 40%, respectivamente (Figura 5).
[001846] Os sobrenadantes de células 293T e A549 transfectados com anelossomos foram coletados 96 horas pós-transfecção. Os sobrenadantes coletados foram centrifugados a 2000 rpm durante 10 minutos a 4 graus Celsius para remover quaisquer detritos celulares. Cada um dos sobrenadantes coletados foi usado para infectar novas células 293T e A549, respectivamente, que eram 70% confluentes em poços de placas de 24 poços. Os sobrenadantes foram lavados após 24 horas de incubação a 37 graus Celsius e dióxido de carbono a 5%, seguidos por duas lavagens de PBS e substituição por meio de crescimento fresco. Após incubação destas células a 37 graus e dióxido de carbono a 5% durante 48 horas adicionais, as células foram individualmente coletadas para extração de DNA genômico. O DNA genômico de cada uma das amostras foi coletado usando um estojo de extração de DNA genômico (Thermo Fisher Scientific), de acordo com o protocolo do fabricante.
[001847] Para confirmar a infecção bem-sucedida das células 293T e A549 por anelossomos produzidos in vitro, 100 ng de DNA genômico coletados como descrito no presente documento foram usados para realizar a reação em cadeia da polimerase quantitativa (qPCR) usando iniciadores específicos para vírus beta-torquevírus ou sequências específicas para LY2. O reagente SYBR verde (Thermo Fisher Scientific) foi usado para realizar qPCR, como o protocolo do fabricante. A qPCR para iniciadores específicos para a sequência de DNA genômico de GAPDH foi usada para normalização. As sequências para todos os iniciadores usados são listadas na Tabela 42. Tabela 42: Sequência de iniciadores (5' > 3') Alvo Direto Inverso ATTCGAATGGCTGAGTTTATGC (SEQ ID CCTTGACTACGGTGGTTTCAC Betatorquevírus NO: 690) (SEQ ID NO: 693) Estirpe de TTMiniV CACGAATTAGCCAAGACTGGGCAC (SEQ TGCAGGCATTCGAGGGCTTGTT LY2 ID NO: 691) (SEQ ID NO: 694) GCTCCCACTCCTGATTTCTG (SEQ ID NO: TTTAACCCCCTAGTCCCAGG GAPDH 692) (SEQ ID NO: 695)
[001848] Como mostrado nos resultados de qPCR ilustrados nas Figuras 6A, 6B, 7A e 7B, os anelossomos produzidos in vitro e como descrito em este exemplo eram infecciosos. Exemplo 7: Seletividade de anelossomos
[001849] Este exemplo demonstra a capacidade de anelossomos sintéticos produzidos in vitro para infectar linhas de células de uma variedade de origens de tecidos.
[001850] Os sobrenadantes com os anelossomos de TTMiniV infecciosos (descritos no Exemplo 5) foram incubados com linhas de células 293T, A549, Jurkat (uma linha de células de leucemia de células T aguda), Raji (uma linha de células de linfoma B de Burkitt) e Chang
(uma linha de células de carcinoma do fígado) confluentes a 70% a 37 graus e dióxido de carbono a 5% em poços de placas de 24 poços. As células foram lavadas com PBS duas vezes, 24 horas pós-infecção, seguidas pela substituição por meio de crescimento fresco. As células foram depois incubadas novamente a 37 graus e dióxido de carbono a 5% durante outras 48 horas, seguidas pela coleta para extração de DNA genômico. O DNA genômico de cada uma das amostras foi coletado usando um estojo de extração de DNA genômico (Thermo Fisher Scientific), de acordo com o protocolo do fabricante.
[001851] Para confirmar a infecção bem-sucedida destas linhas de células por anelossomos produzidos no Exemplo prévio, 100 ng de DNA genômico coletado como descrito no presente documento foram usados para realizar a reação em cadeia da polimerase quantitativa (qPCR) usando iniciadores específicos para beta-torquevírus ou sequências específicas para LY2. O reagente SYBR verde (Thermo Fisher Scientific) foi usado para realizar qPCR, como o protocolo do fabricante. A qPCR para iniciadores específicos para a sequência de DNA genômico de GAPDH foi usada para normalização. As sequências para todos os iniciadores usados são listadas na Tabela 42.
[001852] Como mostrado nos resultados de qPCR ilustrados nas Figuras 6A-10B, não só os anelossomos produzidos in vitro eram infecciosos, foram capazes de infectar uma variedade de linhas de células, incluindo exemplos de células epiteliais, células de tecido pulmonar, células hepáticas, células de carcinoma, linfócitos, linfoblastos, células T, células B e células renais. Foi também observado que um anelossomo sintético foi capaz de infectar células HepG2 (uma linha de células hepáticas), resultando em um aumento maior do que 100 vezes em relação a um controle. Exemplo 8: Identificação e uso de sequências de ligação à proteína
[001853] Este exemplo descreve locais putativos de ligação à proteína no genoma de Anellovirus, que podem ser usados para amplificar e empacotar efetores, por exemplo, em um anelossomo como descrito no presente documento. Em alguns casos, os locais de ligação à proteína podem ser capazes de se ligar a uma proteína exterior, tal como uma proteína de capsídeo.
[001854] Dois domínios conservados dentro do genoma de Anellovirus são origens de replicação putativas: o domínio conservado 5´ UTR (5CD) e o domínio rico em GC (GCR) (de Villiers et al., Journal of Virology 2011; Okamoto et al., Virology 1999). Em um exemplo, de modo a confirmar se estas sequências atuam como locais de replicação de DNA ou como sinais de empacotamento de capsídeo, são feitas deleções de cada região em plasmídeos abrigando TTMV-LY2. As células A539 são transfectadas com pTTMV-LY2∆5CD ou pTTMV- LY2∆GCR. As células transfectadas são incubadas durante quatro dias e, depois, o vírus é isolado a partir do sobrenadante e péletes celulares. As células A549 são infectadas com vírus e, após quatro dias, o vírus é isolado do sobrenadante e dos péletes celulares infectados. A qPCR é realizada para quantificar os genomas virais a partir das amostras. A disrupção de uma origem de replicação previne a replicase viral de amplificar o DNA viral e resulta em genomas virais reduzidos isolados de péletes celulares transfectados em comparação com vírus de tipo selvagem. Uma pequena quantidade de vírus está ainda empacotada e pode ser encontrada no sobrenadante transfectado e nos péletes celulares infectados. Em algumas modalidades, a disrupção de um sinal de empacotamento prevenirá que o DNA viral seja encapsulado por proteínas de capsídeo. Portanto, em modalidades, existirá uma amplificação de genomas virais nas células transfectadas, mas não são encontrados genomas virais nos sobrenadantes ou péletes celulares infectados.
[001855] Em um exemplo adicional, de modo a caracterizar a replicação adicional ou os sinais de empacotamento no DNA, é usada uma série de deleções ao longo do genoma inteiro de TTMV-LY2. As deleções de 100 pb são feitas passo a passo ao longo do comprimento da sequência. Os plasmídeos abrigando as deleções de TTMV-LY2 são transfectados em A549 e testados como descrito acima. Em algumas modalidades, as deleções que perturbam a amplificação ou o empacotamento viral conterão potenciais domínios cis-reguladores.
[001856] Os sinais de replicação e empacotamento podem ser incorporados em sequências de DNA codificando efetores (por exemplo, em um elemento genético em um anelossomo) para induzir amplificação e encapsulação. Isto é feito tanto no contexto de regiões maiores do genoma do anelossomos (i.e., inserção de efetores em um local específico no genoma ou substituição de ORFs virais por efetores, etc.) ou por incorporação de sinais cis mínimos no DNA efetor. Nos casos onde o anelossomo carece de replicação ou fatores de empacotamento trans (por exemplo, replicase e proteínas de capsídeo, etc.), os fatores trans são fornecidos por genes ajudantes. Os genes ajudantes expressam todas as proteínas e RNAs suficientes para induzir a amplificação e o empacotamento, mas carecem de seus próprios sinais de empacotamento. O DNA do anelossomo é cotransfectado com genes ajudantes, resultando em amplificação e empacotamento do efetor mas não dos genes ajudantes. Exemplo 9: Um genoma de Anellovirus
[001857] Este Exemplo descreve deleções no genoma de Anellovirus.
[001858] Foi feita deleção de 172 nucleotídeos (nt) na região não codificante (NCR) do TTV-tth8 a jusante das ORFs mas a montante da região rica em GC (nts 3436 a 3607). Uma sequência aleatória de 56 nt (TTTGTGACACAAGATGGCCGACTTCCTTCCTCTTTAGTCTTCCCC AAAGAAGACAA (SEQ ID NO: 696)) foi inserida na deleção. Foi gerado pTTV-tth8(3436-3707::56nt), um plasmídeo de DNA abrigando o TTV-
tth8 alterado. 2 µg de plasmídeo circular de fita dupla ou DNA linearizado por SmaI de fita dupla (originando um fragmento de genoma de TTV-tth8 separado de elementos de esqueleto bacteriano) foram transfectados em células HEK293 ou A549 à confluência de 60% em uma placa de 6 cm usando lipofectamine 2000, em duplicado. O vírus foi isolado dos péletes celulares e sobrenadante 96 horas pós- transfecção por congelamento - descongelamento, alternando três vezes entre nitrogênio líquido e banho de água a 37 °C. O vírus do sobrenadante foi usado para reinfectar as células (células HEK293 infectadas por vírus isolado a partir de HEK293, e células A549 infectadas por vírus isolado a partir de A549). 72 horas após infecção, o vírus foi isolado dos péletes celulares e sobrenadante por congelamento - descongelamento. A qPCR foi realizada em todas as amostras. Como mostrado na Tabela 43 abaixo, o TTV-tth8 foi observado tanto nos péletes celulares como no sobrenadante das células infectadas, indicando produção bem-sucedida de vírus por pTTV-tth8(3436- 3707::56nt). Portanto, TTV-tth8 é capaz de tolerar a deleção dos nts 3436 a 3707. Tabela 43: As infecções por TTV-tth8 (3436-3707::56nt) em HEK293 e A549 resultam em amplificação viral. Equivalentes genômicos médios a partir de experiências duplicadas em comparação com células de controle negativo sem plasmídeo ou vírus adicionado. Equivalentes de HEK293 P0 HEK293 P1 A549 P0 A549 P1 Negativos Genoma/Rx TTH8 Sup 2,45E+06 1,02E+03 1,87E+07 1,00E+04 293 Vazio 1,42E+02 Linear Cél 2,52E+08 3,92E+05 2,89E+08 7,57E+05 293 Neg 5,08E+02 TTH8 Sup 1,69E+06 6,83E+02 5,07E+02 1,05E+04 549 Vazio 1,73E+01 circular Cél 2,00E+08 3,75E+05 2,61E+08 8,36E+05 549 Neg 2,08E+01
[001859] Uma versão manipulada de TTMV-LY2 foi montada, deletando os nucleotídeos 574 a 1371 e 1432 a 2210 (deleção de 1577 pb) e inserindo uma ORF de repórter NanoLuc (nLuc) de 513 pb no terminal C da ORF1 (após o nt 2609 no TTMV-LY2 de tipo selvagem).
Os plasmídeos abrigando a sequência de DNA para o TTMV-LY2 manipulado (pVL46-015B) foram transfectados em células A549 e, depois, o vírus foi isolado e usado para infectar novas células A549, como descrito no Exemplo 17. A luminescência de nLuc foi detectada nos péletes celulares e sobrenadante das células infectadas, indicando replicação viral (Figuras 11A-11B). Isto demonstra que TTMV-LY2 pode tolerar pelo menos uma deleção de 1577 pb na região de ORF.
[001860] Para caracterizar ainda um genoma viral é feita uma série de deleções no DNA de TTMV-LY2. Um TTMV-LY2 com deleções dos nts 574-1371 e 1432-2210 mas sem inserção de nLuc é feito e testado quanto à replicação viral como descrito previamente. São feitas deleções adicionais a TTMV-LY2∆574-1371,∆1432-2210. Os nts 1372- 1431 são deletados para criar TTMV-LY2∆574-2210. Ainda, a sequência de ORF3 a jusante de ORF1 é deletada (∆2610-2809). Finalmente, para testar deleções em regiões não codificantes, uma série de deleções de 100 pb é feita sequencialmente ao longo da NCR. Todos os mutantes de deleção são testados quanto à replicação viral como previamente descrito. As deleções que resultam em produção viral bem- sucedida (indicando que a região deletada não é essencial para a replicação viral) são combinadas para criar variantes de TTMV-LY2 com mais nucleotídeos deletados. Para identificar o genoma viral que possa ser amplificado com ajudantes, cada um dos mutantes de deleção que interromperam a replicação viral é testado em paralelo com genes ajudantes transportando replicação e empacotamento trans. As deleções resgatadas pela expressão trans de elementos de replicação indicam áreas do genoma viral que podem ser deletadas sem bloquear a formação de vírus quando os genes ajudantes são proporcionados a partir de uma fonte separada. Exemplo 10: Inserções de nucleotídeos de vários comprimentos em um genoma de Anellovirus
[001861] Este exemplo descreve a adição de sequências de DNA de vários comprimentos em um genoma de Anellovirus, que pode, em alguns casos, ser usado para gerar um anelossomo como descrito no presente documento.
[001862] As sequências de DNA são clonadas em plasmídeos abrigando TTV-tth8 (número de acesso do GenBank AJ620231.1) e TTMV-LY2 (número de acesso do GenBank JX134045.1). As inserções são feitas nas regiões não codificantes (NCR) 3’ das grelhas de leitura aberta e 5’ da região rica em GC: após o nucleotídeo 3588 em TTV-tth8 ou o nucleotídeo 2843 em TTMV-LY2.
[001863] Sequências de DNA randomizadas dos seguintes comprimentos são inseridas nas NCRs de TTV-tth8 e TTMV-LY2: 100 pares de bases (pb), 200 pb, 500 pb, 1000 pb e 2000 pb. Estas sequências são desenhadas para corresponderem ao conteúdo relativo de GC de cada genoma viral: aproximadamente 50% de GC para inserções em TTV-tth8 e aproximadamente 38% de GC para TTMV- LY2. Ainda, vários genes trans são inseridos na NCR. Estes incluem um miRNA (por exemplo, miRNA FF4) dirigido por um promotor U6 (351 pb) e EGFP dirigido por um promotor constitutivo de hEF1a (2509 pb).
[001864] As variantes de TTV-tth8 e TTMV-LY2 abrigando várias inserções de DNA de tamanho variado são transfectadas em linhas de células de mamífero, incluindo HEK293 e A549, como previamente descrito. O vírus é isolado do sobrenadante ou dos péletes celulares. O vírus isolado é usado para infectar células adicionais. A produção de vírus a partir das células infectadas é monitorizada por PCR quantitativa. Em algumas modalidades, a produção bem-sucedida de vírus indicará tolerância de inserções. Exemplo 11: Carga exemplificativa a ser entregue
[001865] Este descreve classes exemplificativas de cargas úteis de ácidos nucleicos e proteínas que podem ser entregues com um anelossomo, por exemplo, um anelossomo baseado em um Anellovirus, por exemplo, como descrito no presente documento.
[001866] Um exemplo de uma carga útil é mRNA para expressão de proteínas. Uma sequência codificante de interesse é transcrita tanto a partir de um promotor viral nativo do vírus de origem (por exemplo, um Anellovirus) como a partir de um promotor introduzido com a carga útil como parte de um gene trans. Alternativamente, o mRNA é codificado dentro das grelhas de leitura aberta dos mRNAs virais, resultando em fusões entre proteínas virais e a proteína de interesse. Os domínios de clivagem, por exemplo, o peptídeo 2A ou um local alvo da proteinase, podem ser usados para separar a proteína de interesse das proteínas virais quando desejado.
[001867] Os RNAs não codificantes (ncRNAs) são um outro exemplo de uma carga útil. Estes RNAs são geralmente transcritos usando promotores de RNA polimerase III, tais como U6 ou VA. Alternativamente, um ncRNA é transcrito usando RNA polimerase II, tal como o promotor viral nativo ou promotores sintéticos reguláveis. Quando expressos a partir de promotores de RNA polimerase II, os ncRNAs são codificados como parte do éxon de mRNA, íntrons ou como RNA extra transcrito a jusante do sinal de poli-A. Os ncRNAs são frequentemente codificados como parte de uma molécula de RNA maior ou são clivados usando ribozimas ou endorribonucleases. Os ncRNAs que podem ser codificados como carga no genoma de um anelossomos incluem micro-RNA (miRNA), pequenos RNAs interferentes (siRNA), RNA de grampo curto (shRNA), RNA antissenso, esponjas de miRNA, RNA não codificante longo (lncRNA) e RNA guia (gRNA).
[001868] O DNA pode ser usado como um elemento funcional sem requerer transcrição de RNA. Por exemplo, o DNA pode ser usado como um modelo para recombinação homóloga. Em um outro exemplo, uma sequência de DNA de ligação à proteína pode ser usada para dirigir o empacotamento de proteínas de interesse para um capsídeo (por exemplo, em um exterior proteináceo de um anelossomo). Para recombinação homóloga, regiões de homologia com o DNA genômico humano são codificadas no DNA do vetor para atuar como braços de homologia. A recombinação pode ser dirigida por uma endonuclease visada (tal como Cas9 com um gRNA ou uma nuclease de dedos de zinco), que pode ser expressa a partir do vetor ou a partir de uma fonte separada. Dentro da célula, um genoma de DNA de fita simples é convertido em DNA de fita dupla, que atua depois como um modelo para recombinação homóloga no local de quebra do DNA genômico. Para recrutar proteínas de interesse, uma sequência de ligação à proteína pode ser codificada no DNA do anelossomo. Uma proteína de interesse de ligação ao DNA, ou uma proteína de interesse fundida a uma proteína de ligação ao DNA (tal como Gal4), se liga ao DNA do anelossomo. Quando o DNA do anelossomo é encapsulado pelas proteínas de capsídeo, a proteína de ligação ao DNA é também encapsulada e pode ser entregue às células com o anelossomo. Exemplo 12: Loci de integração de carga útil exemplificativos
[001869] Este exemplo descreve loci exemplificativos nos genomas de TTV-tth8 (número de acesso do GenBank AJ620231.1) e TTMV-LY2 (número de acesso do GenBank JX134045) nos quais cargas úteis de ácidos nucleicos podem ser inseridas.
[001870] Várias estratégias podem ser usadas para inserções nas regiões de grelha de leitura aberta (ORF) de TTV-tth8 (nucleotídeos 336 a 3015) e TTMV-LY2 (nucleotídeos 424 a 2812). Em um exemplo, de modo a etiquetar proteínas virais ou criar proteínas de fusão, uma carga útil é inserida em grelha dentro da ORF específica de interesse. Alternativamente, parte da ou toda a região de ORF é deletada, o que pode ou não interromper a função da proteína viral. A carga útil é depois inserida na região deletada. Ainda, um domínio hipervariável (HVD) em
ORF1 de TTV-tth8 (entre os nucleotídeos 716 e 2362) ou TTMV-LY2 (entre os nucleotídeos 724 e 2273) pode ser usado como um local de inserção. Em alguns casos, inserções ou substituições de nucleotídeos na HVD podem ser mais bem toleradas e/ou interromper a função viral em um grau menor.
[001871] Alternativamente, inserções de carga útil são feitas em regiões do vetor comparáveis com as regiões não codificantes (NCRs) de TTV-tth8 ou TTMV-LY2. Em particular são feitas inserções na 5´ NCR a montante da caixa TATA, na 5´ região não traduzida (UTR), na 3´ NCR a jusante do sinal de poli-A e a montante da região rica em GC. Ainda são feitas inserções na região de miRNA de TTV-tth8 (nucleotídeos 3429 a 3506). Para a região 5´ NCR são feitas inserções a montante da caixa TATA (entre os nucleotídeos 1 e 82 em TTV-tth8 e os nucleotídeos 1 e 236 em TTMV-LY2). Em algumas modalidades, os genes trans são inseridos na orientação reversa para reduzir a interferência do promotor. Para a 5´ UTR são feitas inserções a jusante do local de início transcricional (nucleotídeo 111 em TTV-tth8 e nucleotídeo 267 em TTMV-LY2) e a montante do códon de início de ORF2 (nucleotídeo 336 em TTV-tth8 e nucleotídeo 421 em TTMV-LY2). As inserções de 5´ UTR adicionam ou substituem nucleotídeos na 5´ UTR. As inserções de 3´ NCR são feitas a montante da região rica em GC, em particular após o nucleotídeo 3588 em TTV-tth8 ou nucleotídeo 2843 em TTMV-LY2, como descrito no Exemplo 10. O miRNA de TTV-tth8 é substituído por grampos de miRNA naturais ou sintéticos alternativos. Exemplo 13: Categorias definidas de Anellovirus e suas regiões conservadas
[001872] Existem três gêneros de Anellovirus presentes em humanos: Alphatorquevirus (Vírus de Torque Teno, TTV), Betatorquevirus (Vírus Médio Torque Teno, TTMDV) e Gammatorquevirus (Mini Vírus Torque Teno, TTMV). Alphatorquevirus inclui pelo menos cinco (por exemplo,
sete) clados filogenéticos bem suportados (Figura 11C). Está contemplado que qualquer um destes Anelloviruses possa ser usado como um vírus fonte (por exemplo, uma fonte de sequências de DNA viral) para produção de um anelossomo como descrito no presente documento.
[001873] Entre estas sequências, a conservação mais elevada é encontrada no domínio 5´ UTR (cerca de 75% conservado) e no domínio rico em GC (mais do que 100 pares de bases, mais do que 70% de conteúdo de GC, cerca de 70% conservado). Ainda, um domínio hipervariável (HVD) nas sequências tem uma conservação muito baixa (cerca de 30% conservada). Todos os Anelloviruses contêm também uma região na qual todos as três grelhas de leitura estão abertas. Em alguns casos, a 5´ UTR ou a região rica em GC pode funcionar como uma origem de replicação.
[001874] São também proporcionadas no presente documento sequências exemplificativas de vírus representativos de cada um dos clados de TTV, e de TTMDV e TTMV, anotados com as regiões conservadas (ver, por exemplo, Tabelas A1-A12, B1-B5, C1-C5 ou 1- 18). Exemplo 14: Anelossomos deficientes em replicação e vírus ajudantes
[001875] Para replicação e empacotamento de um anelossomo, alguns elementos podem ser proporcionados em trans. Estes incluem proteínas ou RNAs não codificantes que dirigem ou suportam a replicação ou o empacotamento do DNA.Os elementos trans podem, em alguns casos, ser proporcionados a partir de uma fonte alternativa ao anelossomo, tal como um vírus ajudante, plasmídeo ou a partir do genoma celular.
[001876] Outros elementos são tipicamente proporcionados em cis. Estes elementos podem ser, por exemplo, sequências ou estruturas no
DNA do anelossomo que atuam como origens de replicação (por exemplo, para permitir a amplificação do DNA do anelossomo) ou sinais de empacotamento (por exemplo, para se ligar a proteínas para carregar o genoma no capsídeo). Geralmente, um vírus ou anelossomo deficiente em replicação terá falta de um ou mais destes elementos, tal que o DNA seja incapaz de ser empacotado em um vírion ou anelossomo infeccioso mesmo se outros elementos foram proporcionados em trans.
[001877] Vírus deficientes em replicação podem ser úteis como vírus ajudantes, por exemplo, para controlar a replicação de um anelossomo (por exemplo, um anelossomo deficiente em replicação ou deficiente em empacotamento) na mesma célula. Em alguns casos, o vírus ajudante carecerá de elementos de replicação ou empacotamento cis, mas expressará elementos trans tais como proteínas e RNAs não codificantes. Geralmente, o anelossomo terapêutico careceria de alguns destes ou todos estes elementos trans e portanto seria incapaz de se replicar por si próprio, mas reteria os elementos cis. Quando cotransfectado/infectado nas células, o vírus ajudante deficiente em replicação dirigiria a amplificação e o empacotamento do anelossomo. As partículas empacotadas coletadas seriam assim compreendidas meramente por anelossomo terapêutico, sem contaminação por vírus ajudante.
[001878] Para desenvolver um anelossomo deficiente em replicação, os elementos conservados nas regiões não codificantes de Anellovirus serão removidos. Em particular, as deleções do domínio 5´ UTR conservado e do domínio rico em GC serão testadas, tanto separadamente como em conjunto. Está contemplado que ambos os elementos são importantes para replicação ou empacotamento viral. Ainda, séries de deleção serão realizadas ao longo da região não codificante inteira para identificar regiões de interesse previamente desconhecidas.
[001879] A deleção bem-sucedida de um elemento de replicação resultará na redução da amplificação do DNA do anelossomo dentro da célula, por exemplo, como medido por qPCR, mas suportará alguma produção de anelossomos infecciosos, por exemplo, como monitorizada por ensaios em células infectadas que podem incluir qualquer uma das ou todas as qPCR, transferências de Western, ensaios de fluorescência ou ensaios de luminescência. A deleção bem-sucedida de um elemento de empacotamento não interromperá a amplificação do DNA de anelossomo, logo um aumento no DNA de anelossomo será observado nas células transfectadas pela qPCR. No entanto, os genomas de anelossomo não serão encapsulados, logo não será observada produção de anelossomos infecciosos. Exemplo 15: Processo de fabricação para anelossomos competentes em replicação
[001880] Este exemplo descreve um método para recuperação e escalonamento da produção de anelossomos competentes em replicação. Os anelossomos são competentes em replicação quando codificam em seu genoma todos os elementos genéticos e ORFs requeridos necessários para se replicarem nas células. Uma vez que estes anelossomos não são defeituosos na sua replicação, eles não necessitam de uma atividade complementar proporcionada em trans. Poderiam, no entanto, necessitar de atividade ajudante, tal como intensificadores de transcrições (por exemplo, butirato de sódio) ou fatores de transcrição viral (por exemplo, E1, E2 E4, VA adenoviral; HSV Vp16 e proteínas precoces imediatas).
[001881] Em este exemplo, o DNA de fita dupla codificando a sequência total de um anelossomo sintético na sua forma tanto linear como circular é introduzido em 5E+05 células de mamífero aderentes em um frasco T75 por transfecção química ou em 5E+05 células em suspensão por eletroporação. Após um período de tempo ideal (por exemplo, 3-7 dias pós-transfecção), as células e o sobrenadante são coletados por raspagem das células no meio sobrenadante. Um detergente suave, tal como um sal biliar, é adicionado até uma concentração final de 0,5% e incubado a 37 C durante 30 minutos. Cloreto de Cálcio e Magnésio é adicionado até uma concentração final de 0,5 mM e 2,5 mM, respectivamente. Endonuclease (por exemplo, DNAse I, Benzonase) é adicionada e incubada a 25-37 °C durante 0,5- 4 horas. A suspensão de anelossomos é centrifugada a 1000 x g durante 10 minutos a 4 C. O sobrenadante clarificado é transferido para um novo tubo e diluído 1:1 com um tampão crioprotetor (também conhecido como tampão de estabilização) e armazenado a -80 C se desejado. Isto produz a passagem 0 do anelossomo (P0). Para trazer a concentração de detergente abaixo do limite seguro a ser usado nas células cultivadas, este inóculo é diluído pelo menos 100 vezes ou mais em meio isento de soro (SFM) dependendo do título do anelossomo.
[001882] Uma monocamada fresca de células de mamífero em um frasco T225 é sobreposta com o volume mínimo suficiente para cobrir a superfície de cultura e incubada durante 90 minutos a 37 C e dióxido de carbono a 5% com agitação suave. As células de mamífero usadas para este passo podem ou não ser do mesmo tipo de células que usado para a recuperação de P0. Após esta incubação, o inóculo é substituído por 40 mL de meio de cultura isento de soro, isento de origem animal. As células são incubadas a 37 C e dióxido de carbono a 5% durante 3- 7 dias. 4 mL de uma solução 10X do mesmo detergente suave previamente utilizado são adicionados para alcançar uma concentração final de detergente de 0,5%, e a mistura é depois incubada a 37 C durante 30 minutos com agitação suave. Endonuclease é adicionada e incubada a 25-37 C durante 0,5-4 horas. O meio é depois coletado e centrifugado a 1000 xg, a 4 C durante 10 minutos. O sobrenadante clarificado é misturado com 40 mL de tampão de estabilização e armazenado a -80 C. Isto gera um estoque de sementes ou a passagem 1 de anelossomo (P1).
[001883] Dependendo do título do estoque é diluído não menos do que 100 vezes em SFM e adicionado às células cultivadas em frascos de multicamadas do tamanho requerido. A multiplicidade de infecção (MOI) e o tempo de incubação são otimizados à escala mais pequena para assegurar produção máxima de anelossomos. Após coleta, os anelossomos podem ser purificados e concentrados como necessário. Um esquema mostrando um fluxo de trabalho, por exemplo, como descrito em este exemplo, é proporcionado na Figura 12. Exemplo 16: Processo de fabricação de anelossomos deficientes em replicação
[001884] Este exemplo descreve um método para recuperação e escalonamento da produção de anelossomos deficientes em replicação.
[001885] Os anelossomos podem ser tornados deficientes em replicação por deleção de uma ou mais ORFs (por exemplo, ORF1, ORF1/1, ORF1/2, ORF2, ORF2/2, ORF2/3 e/ou ORF2t/3) envolvidas na replicação. Os anelossomos deficientes em replicação podem ser cultivados em uma linha de células complementar. Tal linha de células expressa constitutivamente componentes que promovem o crescimento de anelossomos mas que estão ausentes ou não funcionais no genoma do anelossomo.
[001886] Em um exemplo, a(s) sequência(s) de qualquer(quaisquer) ORF(s) envolvida(s) na propagação de anelossomos é(são) clonada(s) em um sistema de expressão lentiviral adequado para a geração de linhas de células estáveis que codificam um marcador de seleção, e o vetor lentiviral é gerado como descrito no presente documento. Uma linha de células de mamífero capaz de suportar a propagação de anelossomos é infectada com este vetor lentiviral e indivídua a pressão seletiva pelo marcador de seleção (por exemplo, puromicina ou qualquer outro antibiótico) para selecionar populações de células que integraram estavelmente as ORFs clonadas. Logo que esta linha de células seja caracterizada e certificada como complementando o defeito no anelossomo manipulado e, consequentemente, suporte o crescimento e a propagação de tais anelossomos, esta é expandida e armazenada em armazenamento criogênico. Durante a expansão e manutenção destas células, o antibiótico de seleção é adicionado ao meio de cultura para manter a pressão seletiva. Logo que os anelossomos sejam introduzidos em estes células, o antibiótico de seleção pode ser retido.
[001887] Logo que esta linha de células seja estabelecida, o crescimento e a produção de anelossomos deficientes em replicação são levados a cabo, por exemplo, como descrito no Exemplo 15. Exemplo 17: Produção de anelossomos usando células em suspensão
[001888] Este exemplo descreve a produção de anelossomos em células em suspensão.
[001889] No presente exemplo, uma linha celular produtora de A549 ou 293T que é adaptada de modo a crescer em condições de suspensão é cultivada em meio de suspensão sem componente animal e sem antibiótico (Thermo Fisher Scientific) em sacos de biorreator WAVE a 37 graus e dióxido de carbono a 5%. Estas células, semeadas a 1 x 10 6 células viáveis/mL, são transfectadas usando lipofectamine 2000 (Thermo Fisher Scientific) sob boas práticas correntes de fabricação (cGMP), com um plasmídeo compreendendo sequências de anelossomo, em conjunto com quaisquer plasmídeos complementares adequados ou requeridos para empacotar o anelossomo (por exemplo, no caso de um anelossomo deficiente em replicação, por exemplo, como descrito no Exemplo 16). Os plasmídeos complementares podem,
em alguns casos, codificar proteínas virais que foram deletadas do genoma de anelossomo (por exemplo, um genoma de anelossomo com base em um genoma viral, por exemplo, um genoma de Anellovirus, por exemplo, como descrito no presente documento) mas são úteis ou requeridos para replicação e empacotamento dos anelossomos. As células transfectadas são cultivadas nos sacos de biorreator WAVE e o sobrenadante é coletado nos seguintes momentos: 48, 72 e 96 horas pós-transfecção. O sobrenadante é separado dos péletes celulares para cada amostra usando centrifugação. As partículas de anelossomo empacotadas são depois purificadas a partir do sobrenadante coletado e os péletes das células lisadas usando cromatografia de troca iônica.
[001890] Os equivalentes de genoma na prep purificada dos anelossomos podem ser determinados, por exemplo, por uso de uma pequena alíquota da prep purificada para coletar o genoma do anelossomo usando um estojo de extração de genoma viral (Qiagen), seguido por qPCR usando iniciadores e sondas visados na direção da sequência de DNA do anelossomo, por exemplo, como descrito no Exemplo 18.
[001891] A infectividade dos anelossomos na prep purificada pode ser quantificada fazendo diluições em série da prep purificada para infectar novas células A549. Estas células são coletadas 72 horas pós- transfecção, seguido por um ensaio de qPCR no DNA genômico usando iniciadores e sondas que são específicos para a sequência de DNA do anelossomo. Exemplo 18: Quantificação de equivalentes do genoma do anelossomo por qPCR
[001892] Este exemplo demonstra o desenvolvimento de um ensaio de PCR quantitativa baseado em sonda de hidrólise para quantificar anelossomos. Conjuntos de iniciadores e sondas foram desenhados com base em sequências de genoma selecionadas de TTV (N.º de
Acesso AJ620231.1) e TTMV (N.º de Acesso JX134045.1) usando o software Geneious com uma otimização de usuário final. As sequências de iniciadores são mostradas na Tabela 44 abaixo. Tabela 44: Sequências de iniciadores diretos e reversos e sondas de hidrólise usadas para quantificar equivalentes do genoma de TTMV e TTV por PCR quantitativa. TTMV SEQ ID NO: Iniciador Direto 5'-GAAGCCCACCAAAAGCAATT-3' 697 Iniciador Reverso 5'-AGTTCCCGTGTCTATAGTCGA-3' 698 Sonda 5'-ACTTCGTTACAGAGTCCAGGGG-3' 699
TTV Iniciador Direto 5'-AGCAACAGGTAATGGAGGAC-3' 700 Iniciador Reverso 5'-TGGAAGCTGGGGTCTTTAAC-3' 701 Sonda 5'-TCTACCTTAGGTGCAAAGGGCC-3' 702
[001893] Como um primeiro passo no processo de desenvolvimento, a qPCR é executada usando os iniciadores de TTV e TTMV com química de SYBR-verde para verificar a especificidade dos iniciadores. A Figura 13 mostra um pico de amplificação distinto para cada par de iniciadores.
[001894] As sondas de hidrólise foram encomendadas marcadas com o fluoróforo 6FAM na extremidade 5’ e um extintor não fluorescente menor, de ligação ao sulco (MGBNFQ) na extremidade 3’. A eficiência de PCR dos novos iniciadores e sondas foi depois avaliada usando duas misturas principais comerciais diferentes usando DNA de plasmídeo purificado como componente de uma curva padrão e concentrações crescentes de iniciadores. A curva padrão foi estabelecida por uso de plasmídeos purificados contendo as sequências alvo para os diferentes conjuntos de iniciadores-sondas. Foram realizadas sete diluições em série de dez vezes para alcançar uma gama linear acima de 7 logs e um limite inferior de quantificação de 15 cópias por 20 uL de reação. A mistura principal #2 foi capaz de gerar uma eficiência de PCR entre 90-
110%, valores que são aceitáveis para a PCR quantitativa (Figura 14). Todos os iniciadores para qPCR foram encomendados à IDT. As sondas de hidrólise conjugadas ao fluoróforo 6FAM e um extintor não fluorescente menor, de ligação ao sulco (MGBNFQ) bem como todas as misturas principais de qPCR foram obtidas da Thermo Fisher. Uma representação gráfica de amplificação exemplificativa é mostrada na Figura 15.
[001895] Usando estes conjuntos de sondas-iniciadores e reagentes, o equivalente do genoma (GEq)/mL nos estoques de anelossomos foi quantificado. A gama linear estava entre 1,5E+07 – 15 GEq por 20 uL de reação, que foi depois usada para calcular o GEq/mL, como mostrado nas Figuras 16A-16B. Amostras com concentrações mais elevadas do que a gama linear podem ser diluídas como necessário. Exemplo 19: Utilização de anelossomos para expressar uma proteína exógena em camundongos
[001896] Este exemplo descreve o uso de um anelossomo no qual o genoma do Mini Vírus Torque Teno (TTMV) é manipulado para expressar a proteína luciferase do vaga-lume em camundongos.
[001897] O plasmídeo codificando a sequência de DNA do TTMV manipulado codificando o gene da luciferase do vaga-lume é introduzido em células A549 (linha de células de carcinoma do pulmão humano) por transfecção química. 18 ug de DNA de plasmídeo são usados para transfecção de células confluentes a 70% em uma placa de cultura de tecidos de 10 cm. O esqueleto de vetor vazio carecendo das sequências de TTMV é usado como um controle negativo. Cinco horas pós- transfecção, as células são lavadas com PBS duas vezes e são deixadas a crescer em meio de crescimento fresco a 37 °C e dióxido de carbono a 5%.
[001898] As células A549 transfectadas, em conjunto com seu sobrenadante, são coletadas 96 horas pós-transfecção. O material coletado é tratado com desoxicolato a 0,5% (peso em volume) a 37 °C durante 1 hora seguido pelo tratamento com endonuclease. As partículas de anelossomo são purificadas a partir deste lisado usando cromatografia de troca iônica. Para determinar a concentração de anelossomo, uma amostra do estoque de anelossomos é processada através de um estojo de purificação de DNA viral e os equivalentes de genoma por mL são medidos por qPCR usando iniciadores e sondas visados na direção da sequência de DNA de anelossomo.
[001899] Uma gama de doses de equivalentes do genoma de anelossomos em 1x solução salina tamponada com fosfato é realizada através de uma variedade de vias de injeção (por exemplo, intravenosa, intraperitoneal, subcutânea, intramuscular) em camundongos com 8-10 semanas de idade. A visualização de bioluminescência ventral e dorsal é realizada em cada animal aos 3, 7, 10 e 15 dias pós-injeção. A visualização é realizada por adição de substrato de luciferase (Perkin- Elmer) a cada animal intraperitonealmente nos momentos indicados, de acordo com o protocolo do fabricante, seguido por visualização intravital. Exemplo 20: Alinhamentos de genoma para determinar se o DNA de anelossomos se integrou nos genomas do hospedeiro
[001900] Este exemplo descreve a análise computacional realizada para determinar se o DNA do anelossomo se pode integrar no genoma do hospedeiro, por examinação se o Vírus Torque Teno (TTV) se integrou no genoma humano.
[001901] Os genomas completos de uma sequência de TTV representativa de cada um dos cinco clados de Alphatorquevirus exemplificativos foram alinhados contra a sequência do genoma humano usando a Basic Local Alignment Search Tooll (BLAST) que encontra regiões de similaridade local entre as sequências. As sequências de TTV representativas mostradas na Tabela 45 foram analisadas: Tabela 45: Sequências de TTV representativas Clado de TTV N.º de Acesso de NCBI Clado A AB064597,1 Clado B AB028669,1 Clado C AJ20231,1 Clado D AF122914,3 Clado E AF298585,1
[001902] Foi descoberto que as sequências de nenhum dos TTVs alinhados tinham similaridade significativa com o genoma humano, indicando que os TTVs não se integraram no genoma humano. Exemplo 21: Avaliação da integração de anelossomos em um genoma hospedeiro
[001903] Em este exemplo, as células A549 (linha de células de carcinoma do pulmão humano) e as células HEK293T (linha de células de rim embrionário humano) são infectadas tanto com partículas de anelossomo como com partículas de AAV em MOIs de 5, 10, 30 ou 50. As células são lavadas com PBS 5 horas pós-infecção e substituídas por meio de crescimento fresco. As células são depois deixadas a crescer a 37 graus e dióxido de carbono a 5%. As células são coletadas cinco dias pós-infecção e são processadas para coletar DNA genômico, usando o estojo de extração de DNA genômico (Qiagen). O DNA genômico é também coletado a partir de células não infectadas (controle negativo). Bibliotecas de sequenciamento de genoma inteiro são preparadas para estes DNAs coletados, usando o estojo de preparação de biblioteca de DNA Nextera (Illumina), de acordo com o protocolo do fabricante. As bibliotecas de DNA são sequenciadas usando o sistema NextSeq 550 (Ilumina) de acordo com o protocolo do fabricante. Os dados de sequenciamento são montados no genoma de referência e analisados para procurar junções entre os genomas de anelossomo ou AAV e o genoma do hospedeiro. Nos casos onde as junções são detectadas, estas são verificadas na amostra original de DNA genômico antes da preparação da biblioteca de sequenciamento por PCR. Os iniciadores são desenhados para amplificar a região contendo as e em redor das junções. A frequência de integração de anelossomos no genoma hospedeiro é determinada por quantificação do número de junções (representando eventos de integração) e do número total de cópias de anelossomo na amostra por qPCR. Esta razão pode ser comparada com aquela do AAV. Exemplo 22: Efeitos funcionais de um anelossomo expressando uma sequência de microRNA exógeno
[001904] Este exemplo demonstra a expressão bem-sucedida de um miRNA exógeno (miR-625) a partir do genoma de anelossomo usando um promotor nativo.
[001905] 500 ng dos seguintes DNAs de plasmídeo foram transfectados em poços confluentes a 60% de células HEK293T em uma placa de 24 poços: i) Esqueleto de plasmídeo vazio ii) Plasmídeo contendo genoma de TTV-tth8 no qual o miRNA endógeno está silenciado (KO) iii) TTV-tth8 no qual o miRNA endógeno está substituído por um miRNA embaralhado sem direcionamento iv) TTV-tth8 no qual a sequência de miRNA endógeno está substituída por miRNA codificando miR-625
[001906] 72 horas pós-transfecção, o miRNA total foi coletado das células transfectadas usando o estojo miRNeasy da Qiagen, seguido por transcrição reversa usando o estojo miRNA Script RT II. A PCR quantitativa foi realizada no DNA transcrito reverso usando iniciador que deve detectar especificamente o miRNA-625 ou o pequeno RNA RNU6. O pequeno RNA RNU6 foi usado como um gene de manutenção e os dados são representados graficamente na Figura 17 como uma dimensão da mudança em relação ao vetor vazio. Como mostrado na
Figura 17, o anelossomo miR-625 resultou em um aumento de aproximadamente 100 vezes na expressão de miR-625, ao passo que nenhum sinal foi detectado para o vetor vazio, nocaute de miR (KO) e miR embaralhado. Exemplo 23: Preparação e produção de anelossomos para expressar RNAs não codificantes exógenos
[001907] Este exemplo descreve a síntese e produção de anelossomos para expressar pequenos RNAs não codificantes exógenos.
[001908] A sequência de DNA da estirpe tth8 de TTV (Jelcic et al., Journal of Virology, 2004) é sintetizada e clonada em um vetor contendo a origem de replicação bacteriana e o gene de resistência a antibióticos bacterianos. Em este vetor, a sequência de DNA codificando o grampo de miRNA de TTV é substituída por uma sequência de DNA codificando um pequeno RNA não codificante exógeno tal como miRNA ou shRNA. O construto manipulado é depois transformado em bactérias eletrocompetentes, seguido por isolamento de plasmídeos usando um estojo de purificação de plasmídeos de acordo com os protocolos do fabricante.
[001909] O DNA do anelossomos codificando os pequenos RNAs não codificantes exógenos é transfectado em uma linha de células produtoras eucarióticas para produzir partículas de anelossomo. O sobrenadante das células transfectadas contendo as partículas de anelossomo é coletado em diferentes momentos pós-transfecção. Partículas de anelossomo, tanto a partir do sobrenadante filtrado como após purificação, são usadas para aplicações a jusante, por exemplo, como descrito no presente documento. Exemplo 24: Conservação em clados de Anellovirus
[001910] Este exemplo descreve a identificação de sete clados dentro do gênero Alphatorquevirus. As sequências representativas entre estes clados mostraram 54,7% de identidade par a par ao longo das sequências (Figura 18). A identidade par a par foi a mais baixa entre as grelhas de leitura aberta (~48,8%) e mais elevada nas regiões não codificantes (69,1% na 5´ NCR, 74,6% na 3´ NCR) (Figura 18). Isto sugere que sequências ou estruturas de DNA nas regiões não codificantes desempenham papéis importantes na replicação viral.
[001911] As sequências de aminoácidos das proteínas putativas em Alphatorquevirus foram também comparadas. As sequências de DNA mostraram aproximadamente 47-50% de identidade par a par, enquanto as sequências de aminoácidos mostraram aproximadamente 32-38% de identidade par a par (Figura 19). Interessantemente, as sequências representativas dos clados de Alphatorquevirus são capazes de se replicarem com sucesso in vivo e são observadas na população humana. Isto sugere que as sequências de aminoácidos para proteínas de Anellovirus podem variar amplamente enquanto se mantêm funcionalidades tais como replicação e empacotamento.
[001912] Foi descoberto que os Anelloviruses têm regiões de elevada conservação local nas regiões não codificantes. Na região a jusante do promotor existe um domínio conservado 5´ UTR de 71 pb que exibiu 95,2% de identidade par a par entre os sete clados de Alphatorquevirus (Figura 20). A jusante das grelhas de leitura aberta na região não codificante 3’ dos Alphatorqueviruses existir uma região com identidade par a par substancial entre as sequências representativas. Próximo da extremidade 3’ desta região não codificante conservada 3’ está uma sequência altamente conservada. Os Anelloviruses incluíram também uma região rica em GC possuindo conteúdo de GC maior do que 70%, que exibiu 75,4% de identidade par a par em áreas onde se alinham (Figura 21). Exemplo 25: Expressão de um miRNA endógeno a partir de um anelossomo e deleção do miRNA endógeno
[001913] Em um exemplo, os anelossomos compreendendo um genoma de TTV-tth8 modificado, no qual o genoma de TTV-tth8 foi modificado com uma deleção na região rica em GC como descrito no Exemplo 27, foram usados para infectar células B Raji em cultura. Estes anelossomos compreenderam uma sequência codificando a carga útil endógena do Anellovirus TTV-tth8, que é um miRNA visando o mRNA codificando a proteína de interação com n-myc (NMI) e foram produzidos por introdução de um plasmídeo compreendendo o genoma de Anellovirus em uma célula hospedeira. NMI opera a jusante da via JAK/STAT para regular a transcrição de vários sinais intracelulares, incluindo genes estimulados por interferon, genes de proliferação e crescimento e mediadores da resposta inflamatória. Como mostrado na Figura 22, os genomas virais foram detectados em células B Raji alvo. O silenciamento bem-sucedido de NMI foi também observado em células B Raji alvo em comparação com células de controle (Figura 23). O anelossomo compreendendo o miRNA contra NMI induziu uma redução maior do que 75% nos níveis de proteína NMI em comparação com células de controle. Este exemplo demonstra que um anelossomo com um miRNA de Anellovirus nativo pode silenciar uma molécula alvo nas células hospedeiras.
[001914] Em um outro exemplo, o miRNA endógeno de um anelossomo à base de Anellovirus foi deletado. O anelossomo resultante (Δ miR) foi depois incubado com células hospedeiras. Os equivalentes do genoma dos elementos genéticos do anelossomo Δ miR foram depois comparados com aqueles de anelossomos correspondentes nos quais o miRNA endógeno foi retido. Como mostrado na Figura 24, os genomas de anelossomo nos quais o miRNA endógeno foi deletado foram detectados em células em níveis comparáveis àqueles observados para genomas de anelossomo nos quais o miRNA endógeno estava ainda presente. Este exemplo demonstra que o miRNA endógeno de um anelossomo à base de Anellovirus pode ser mutado ou inteiramente deletado e o genoma de anelossomo pode ser ainda detectado em células alvo. Exemplo 26: Localização de ORFs de Anellovirus
[001915] Este Exemplo descreve nova funcionalidade de várias ORFs putativas de Anelloviruses. Em este exemplo, as sequências putativas de grelha de leitura aberta (ORF) foram desenhadas a jusante de uma proteína marcada (i.e., nanoluciferase) no terminal N de cada ORF. Cada plasmídeo ORF-nLuc foi introduzido em 5E+05 células aderentes (Vero ou HEK293T) em uma placa de 12 poços por transfecção química ou em 5E+05 células em suspensão por eletroporação. Após um período de tempo ideal (por exemplo, 3-7 dias pós-transfecção), as células foram fixadas com paraformaldeído a 4% (# de cat 28908 da ThermoFisher) em PBS e permeabilizadas com Triton X-100 a 0,5% e coradas para nLuc com um anticorpo policlonal anti-nLuc de coelho (gentil presente da Promega Corp.) seguido por anticorpo secundário conjugado com Alexa488 anticoelho de cabra (# de cat A-11008 da ThermoFisher). Os núcleos foram corados com DAPI (# de Cat D3571 da ThermoFisher ). As células coradas foram visualizadas em um Zeiss AxioVert A1 com uma objetiva 20X e uma câmera monocromática Axiocam 506 para localização celular de proteínas marcadas.
[001916] Como mostrado nas Figuras 25A-25B, ORF2 foi observada localizada para o citoplasma e ORF1/1 foi observada localizada para o núcleo tanto em células Vero como em células HEK293. A Figura 25C mostra a localização para ORF1/2 e ORF2/2. Exemplo 27: Caracterização das regiões requeridas para desenvolvimento de anelossomos
[001917] Este Exemplo descreve deleções no genoma de Anellovirus para ajudar a caracterizar as porções do genoma suficientes para replicação do vírus e produção de anelossomos. Uma série de deleções foi feita na região não codificante (NCR) de TTV-tth8 a jusante das ORFs (nts 3016 a 3753). Uma sequência de 36 nucleotídeos (nt) (CGCGCTGCGCGCGCCGCCCAGTAGGGGGAGCCATGC (SEQ ID NO: 160)) foi deletada da região GC (marcada Δ36nt (GC)). Ainda, uma sequência de pré-microRNA de 78 nt (CCGCCATCTTAAGTAGTTGAGGCGGACGGTGGCGTGAGTTCAAA GGTCACCATCAGCCACACCTACTCAAAATGGTGG (SEQ ID NO: 161)) foi deletada da 3’ NCR (marcada Δ36nt (GC) ΔmiR). E, em última instância, 171 nts extra na 3’NCR de Δ36nt (GC) foram deletados (CTTAAGTAGTTGAGGCGGACGGTGGCGTGAGTTCAAAGGTCACC
ATCAGCCACACCTACTCAAAATGGTGGACAATTTCTTCCGGGTCA
AAGGTTACAGCCGCCATGTTAAAACACGTGACGTATGACGTCACG GCCGCCATTTTGTGACACAAGATGGCCGACTTCCTTCC (SEQ ID NO: 162)) e marcados Δ3’NCR (Figura 26). 2 μg de plasmídeos de DNA circular pTTV-tth8 circular (WT), pTTV-tth8(Δ36nt (GC)), pTTV- tth8(Δ36nt (GC) ΔmiR), pTTV-tth8(Δ3'NCR) abrigando as 3’ NCRs TTV- tth8 alteradas, respectivamente descritos acima, foram transfectados em HEK293 a 60% de confluência em uma placa de 12 poços usando lipofectamine 2000, em triplicado. 48 horas após transfecção, os péletes celulares foram coletados e lisados para isolar os transcritos de mRNA (RNeasy, # de cat 74104 da Qiagen) e convertidos em cDNA (estojo High-Capacity cDNA Reverse Transcription, ThermoFisher, # de cat 4368814). A qPCR foi realizada em todas as amostras medindo a expressão de transcritos virais com cada deleção e normalizada para o mRNA de controle interno de GAPDH.
[001918] Como mostrado nas Figuras 27A-27D, todos os três mutantes de deleção inibiram significativamente a expressão de transcritos virais in vitro. Portanto, a 3´ NCR de TTV-tth8 é necessária para produção de anelossomos para expressão do transgene.
[001919] A estirpe de TTV tth8, N.º de Acesso do GenBank
AJ620231.1, foi depositada como uma sequência de genoma total. Na região rica em GC, entretanto, existe um trecho de 36 nucleotídeos anotado como Ns genéricos. Esta região é altamente conservada entre estirpes de TTV e portanto poderia ser importante para a biologia destes vírus. As sequências de DNA de várias centenas de estirpes de TTV foram computacionalmente alinhadas e usadas para gerar uma sequência de consenso forte para aqueles 36 nucleotídeos (CGCGCTGCGCGCGCCGCCCAGTAGGGGGAGCCATGC (SEQ ID NO: 160)). A sequência do genoma de TTV-tth8 referida no presente documento como a sequência “de tipo selvagem” tinha comomente esta sequência de consenso inserida no lugar do trecho de 36 Ns listado na sequência de TTV-tth8 publicamente disponível. Exemplo 28: Entrega de anelossomos de proteínas exógenas in vivo
[001920] Este exemplo demonstra a função efetora in vivo (por exemplo, expressão de proteínas) de anelossomos após administração.
[001921] Anelossomos compreendendo um transgene codificando nano-luciferase (nLuc) (Figuras 28A-28B) foram preparados. Resumidamente, plasmídeos de DNA de fita dupla abrigando as regiões não codificantes de TTMV-LY2 e um cassete de expressão de nLuc foram transfectados em células HEK293T em conjunto com plasmídeos de DNA de fita dupla codificando o genoma total de TTMV-LY2 para atuar como fatores de replicação e empacotamento trans. Após transfecção, as células foram incubadas para permitir a produção de anelossomos e o material de anelossomo foi coletado e enriquecido através de tratamento com nuclease, ultrafiltração/diafiltração e filtração estéril. Células HEK293T adicionais foram transfectadas com plasmídeos de DNA não replicantes abrigando cassetes de expressão de nLuc e cassetes de transfecção de ORF de TTMV-LY2, mas carecendo de domínios não codificantes essenciais para replicação e empacotamento, para atuar como um controle negativo “não viral”. As amostras não virais foram preparadas seguindo o mesmo protocolo que o material de anelossomo.
[001922] A preparação de anelossomos foi administrada a uma coorte de três camundongos saudáveis intramuscularmente e monitorizada por visualização IVIS Lumina (Bruker) ao longo de nove dias (Figura 29A). Como um controle não viral, a preparação não replicante foi administrada a três camundongos adicionais (Figura 29B). Injeções de 25 µL de preparações de anelossomos ou não virais foram administradas na pata traseira esquerda no Dia 0 e readministradas na pata traseira direita no Dia 4 (Ver setas nas Figura 29A e B). Após 9 dias de visualização IVIS, mais ocorrências de sinal luminescente de nLuc foram observadas em camundongos injetados com a preparação de anelossomos (Figura 29A) do que a preparação não viral (Figura 29B), o que é consistente com a expressão gênica trans após transdução de anelossomos in vivo. Exemplo 29: Identificação de miRNAs precursores (pré-mIRs) em Anelloviruses
[001923] Este exemplo descreve várias abordagens computacionais e experimentais para identificar novos miRNAs precursores codificados por vários Anelloviruses Métodos Computacionais
[001924] As estirpes de Anellovirus são muito diversas umas das outras ao nível da sequência de nucleotídeos. No entanto, as estirpes de Anellovirus, especialmente aquelas dentro do mesmo clado, podem mostrar similaridade significativa entre si em termos de organização genômica de vários componentes tais como promotor, região rica em GC, região não codificante e regiões codificantes (ver, por exemplo, Figura 29D). É descrito no presente documento um método no qual as sequências de pré-miR de várias estirpes de Anellovirus (cujas sequências de pré-miR são desconhecidas) são previstas pelo alinhamento com estirpes de Anellovirus cujas sequências de pré-miR já foram experimentalmente validadas.
[001925] Resumidamente, vários conjuntos de dados de sequenciamento de pequenos RNA publicamente disponíveis para pequenos RNAs de linhas de células e várias amostras humanas são minados para descobrir novas sequências de pré-miR codificadas por várias estirpes de Anellovirus. Ferramentas computacionais e algoritmos publicamente disponíveis que são baseados na previsão de estrutura ou classificação de aprendizagem por máquinas, tais como o programa mFold, algoritmo miRANDA, miRScan, miRanalyzer, miRDeep (https://www.ncbi.nlm.nih.gov/pmc/articles/PMC1559940/, https://www.frontiersin.org/articles/10.3389/fbioe.2015.00007/full) são usados para prever novos miRNAs codificados por vários anelos. Transferências de Northern com sondas desenhadas para sequências de miRNA específicas e/ou RT-qPCR usando iniciadores específicos para miRNAs são depois usadas para confirmar, validar e quantificar a expressão de novos miRNAs. Métodos Experimentais
[001926] Em um exemplo, o sequenciamento de pequeno RNA de elevada produtividade é realizado em amostras de tecido ou sangue humano que são infectadas com anelos para descobrir novos pré- miRNAs codificados por Anellovirus. Para realizar isto, o RNA é coletado de amostras de tecido humano ou amostras de sangue humano homogeneizadas. Bibliotecas de pequenos RNA são preparadas e sequenciadas usando estojos Illumina e plataformas de sequenciamento. As leituras de sequenciamento são armazenadas, alinhadas e analisadas no BaseSpace Sequence Hub (Illumina).
[001927] Em um segundo exemplo, o sequenciamento de pequenos RNA de elevada produtividade é realizado em várias linhas de células tratadas com as seguintes condições para descobrir novos pré-miRNAs codificados por Anelloviruses: (a) linhas de células infectadas com Anelloviruses de ocorrência natural, linhas de células transfectadas com genomas de Anellovirus sintetizados in vitro e (c) linhas de células infectadas com Anelloviruses empacotados in vitro usando genomas sintéticos. Transferências de Northern com sondas desenhadas para sequências de miRNA específicas e/ou RT-qPCR usando iniciadores específicos para miRNAs são usadas para confirmar, validar e quantificar a expressão de novos miRNAs. Exemplo 30: Determinação do alvo endógeno de pré-miRs de Anellovirus
[001928] Este exemplo descreve a análise para determinar alvos endógenos e vias alvo potencialmente terapeuticamente relevantes de pré-miRs codificados por várias estirpes de Anelloviruses
[001929] As sequências de pré-miRNA individuais computacionalmente previstas e/ou experimentalmente validadas codificadas por vários Anelloviruses são clonadas em um vetor lentiviral, dirigido por um promotor de U6. Uma sequência de miRNA embaralhada sem direcionamento, dirigida por um promotor de U6, é também clonada de um modo similar que é usada como um controle. O plasmídeo lentiviral é clonado tal que, quando empacotado, seu genoma conterá (i) uma sequência de pré-miRNA dirigida por um promotor de U6, (ii) um gene de resistência à puromicina dirigido por um promotor de SV40 e (iii) um gene da Proteína Fluorescente Verde (GFP) dirigido por um promotor de CMV. Cada um destes plasmídeos lentivirais é individualmente cotransfectado em células HEK-293T em conjunto com os plasmídeos ajudantes lentivirais para empacotar o vírus. Seis horas após transfecção, o meio das células transfectadas é aspirado, lavado com PBS uma vez e substituído por meio fresco. Este meio contendo o lentivírus é coletado 72 horas pós-transfecção. O meio é filtrado através de filtro de 0,4 um para remover quaisquer células e depois usado para infectar o tipo de célula de interesse tal como HeLa, Raji e THP1, em triplicado. As células contendo os genomas lentivirais integrados são selecionadas por tratamento com puromicina que é iniciado 3 dias pós- infecção. O RNA é coletado a partir de linhas de células estavelmente selecionadas usando os estojos de extração de RNA (Qiagen), seguido pela transcrição reversa em cDNA usando o estojo de transcriptase reversa (Thermo Fisher Scientific). As amostras de cDNA são processadas para gerar bibliotecas de leitura curta indexadas. As bibliotecas de leitura curta exclusivamente indexadas são multiplexadas em sequência para gerar cerca de 20 milhões de leituras por amostra, usando a plataforma de sequenciamento Illumina. As leituras de sequenciamento são armazenadas, alinhadas e analisadas usando o BaseSpace Sequence Hub (Illumina). Os alvos de cada pré-miR candidato individual são determinados por comparação da expressão de genes em linhas de células expressando o pré-miR candidato em comparação com em linhas celulares expressando o pré-miR embaralhado. A análise de Ingenuity Pathway é realizada para testar se os pré-miRNas visam vias específicas, especialmente vias terapeuticamente relevantes. Um esquema do fluxo de trabalho descrito em este Exemplo é mostrado na Figura 30. Exemplo 31: Preparação de um anelossomo codificando um pré- miR de Anellovirus nativo
[001930] Este exemplo descreve um processo para empacotar a forma replicante ou não replicante de anelossomos expressando pré- miRs de Anellovirus nativos
[001931] O genoma da forma não replicante do anelossomo é sintetizado contendo os seguintes componentes: (i) origem de replicação, (ii) sequência codificando pré-miRNA de Anellovirus, (iii) RNA polimerase III tal como U6 ou H1 dirigindo a expressão de pré-
miRNA e (iv) sinal de empacotamento. Este genoma é empacotado por transfecção em uma linha de células ajudante que expressa estavelmente todas as proteínas requeridas para o empacotamento viral. As células transfectadas são coletadas 7 dias pós-transfecção e processadas para preparar uma preparação de anelossomos, como descrito no presente documento. O título de equivalência do genoma da preparação de anelossomos é determinado por realização de qPCR, como descrito no presente documento. Uma dose apropriada da preparação de anelossomos é depois usada para aplicações a jusante.
[001932] O genoma da forma replicante do anelossomo pode ser sintetizado, por exemplo, por geração do Anellovirus nativo, exceto que a expressão da sequência de pré-miRNA é manipulada usando um promotor exógeno tal como U6 ou promotores específicos de tecido. O genoma é empacotado por transfecção em células HEK-293T. As células transfectadas são coletadas 7 dias pós-transfecção e processadas para preparar uma preparação de anelossomos, como descrito no presente documento. O título de equivalência do genoma da preparação de anelossomos é determinado por realização de qPCR, como descrito no presente documento. Uma dose apropriada da preparação de anelossomos é usada para aplicações a jusante. Exemplo 32: Utilização de pré-miRs de Anellovirus como supressor tumoral em um modelo de cultura de células in vitro
[001933] Este exemplo descreve estudos para confirmar o efeito fenotípico de pré-miRs candidatos identificados como supressores tumorais a partir da análise, por exemplo, como descrito no Exemplo 29.
[001934] Os pré-miRNAs candidatos possuindo um efeito supressor tumoral são identificados com base na análise como descrito no Exemplo 29. As preparações de anelossomos da forma replicante de anelossomos codificando estes pré-miRNAs candidatos, bem como pré- miRNAs embaralhados, são preparadas como descrito no Exemplo 31.
As linhas de células cancerosas do painel de linha de células cancerosas NCI-60 são plaqueadas em placas de 96 poços. Quando 30% confluentes, estas linhas de células são tratadas com anelossomos compreendendo os pré-miRs candidatos ou pré-miRs embaralhados a uma dosagem de cinco equivalentes de genoma por célula. O meio contendo anelossomos é aspirado cinco horas após infecção, seguido por lavagem com PBS duas vezes e substituição por meio fresco. O ensaio do azul de Alamar é realizado nas células tratadas três dias após tratamento para determinar quais dos pré-miRs inibem a proliferação das linhas de células cancerosas. Exemplo 33: Utilização de pré-miRs deAnellovirus como supressores tumorais in vivo
[001935] Este exemplo descreve experiências in vivo para confirmar o efeito supressor tumoral para pré-miRs de Anellovirus supressores tumorais candidatos selecionados e linhas de células cancerosas a partir da análise in vitro, como descrito no Exemplo 32
[001936] Os xenoenxertos são gerados por injeção subcutânea de linhas de células cancerígenas pré-selecionadas a partir da análise descrita no Exemplo 32, em conjunto com Matrigel, nos flancos de camundongos atímicos. Logo que os tumores do xenoenxerto se tornem palpáveis, a injeção tumoral local de 3 x 106 equivalentes do genoma de anelossomos codificando pré-miRNAs supressores tumorais ou pré- miRNA embaralhado é realizada. O efeito da injeção de anelossomos no crescimento tumoral é determinado por medições de crescimento tumoral de rotina durante três semanas, medição do peso tumoral do tumor de xenoenxerto no final da experiência, bem como por ensaios de incorporação de BrdU. Exemplo 34: Cópias em tandem do genoma de Anellovirus
[001937] Este exemplo descreve vetores de expressão baseados em plasmídeos abrigando duas cópias de um único genoma aneloviral,
arranjados em tandem tal que a região rica em GC do genoma a montante esteja próximo da região 5´ do genoma a jusante (Figura 31A).
[001938] Os Anelloviruses se replicam através de círculo rolante, no qual uma proteína replicase (Rep) se liga ao genoma em uma origem de replicação e inicia a síntese de DNA em torno do círculo. Para genomas de Anellovirus contidos em esqueletos de plasmídeo, isto requer a replicação do comprimento total do plasmídeo, que é mais longo do que o genoma viral nativo, ou recombinação do plasmídeo resultando em um círculo mais pequeno compreendendo o genoma com esqueleto mínimo. Portanto, a replicação viral de um plasmídeo pode ser ineficiente. Para melhorar a eficiência de replicação do genoma viral, os plasmídeos foram manipulados com cópias em tandem de TTV-tth8 e TTMV-LY2. Estes plasmídeos apresentavam todas as permutações circulares possíveis do genoma aneloviral: independentemente de onde a proteína Rep se liga, a mesma será capaz de dirigir a replicação do genoma viral a partir da origem de replicação a montante para a origem a jusante. Uma estratégia similar foi usada para produzir Anelloviruses suínos (Huang et al., 2012, Journal of Virology 86 (11) 6042-6054).
[001939] TTV-tth8 em tandem foi montado por clonagem sequencial de cópias do genoma em um esqueleto de plasmídeo, deixando 12 pb de DNA não viral entre as duas sequências. Várias variantes de TTV- tth8 foram montadas em plasmídeos em tandem, incluindo tipo selvagem e TTV-tth8(∆36GC) (i.e., um genoma de TTV-tth8 manipulado para incluir a sequência rica em GC de 36 nucleotídeos descrita no presente documento), que está com falta de 36 pares de bases da região rica em GC. TTMV-LY2 em tandem foi montado através de montagem Golden-gate, incorporando simultaneamente duas cópias do genoma em um esqueleto e não deixando nenhuns nucleotídeos extra entre os genomas.
[001940] O plasmídeo abrigando cópias em tandem de TTV-
tth8(∆36GC) foi transfectado em células HEK239T. As células foram incubadas durante cinco dias, depois lisadas usando Triton X-100 a 0,1% e tratadas com nucleases para digerir DNA não protegido por capsídeos virais. A qPCR foi depois realizada usando sondas Taqman para a sequência do genoma TTV-tth8 e o esqueleto do plasmídeo. As cópias do genoma de TTV-tth8 foram normalizadas para cópias de esqueleto. Como mostrado na Figura 31B, o TTV-tth8 em tandem produziu mais do que quatro vezes o número de genomas virais do que plasmídeos de cópia única. Quando se contabiliza o número duplicado de sequências do genoma de TTV-tth8, o plasmídeo em tandem produziu mais do que duas vezes mais cópias do genoma recém- sintetizado por cópia transfectada. Estes dados demonstraram que a manipulação de genomas anelovirais em tandem pode aumentar a replicação do genoma viral e pode ser usada como uma estratégia para aumentar a produção de Anellovirus. Exemplo 35: Genomas de Anellovirus circularizados in vitro
[001941] Este exemplo descreve construtos compreendendo DNA de genoma aneloviral circular, de fita dupla com DNA não viral mínimo Estes genomas virais circulares correspondem mais de perto aos intermediários de DNA de fita dupla encontrados durante a replicação de Anellovirus de tipo selvagem. Quando introduzido em uma célula, tal DNA de genoma aneloviral circular, de fita dupla com DNA não viral mínimo pode sofrer replicação de círculo rolante para produzir, por exemplo, um elemento genético como descrito no presente documento.
[001942] Em um exemplo, os plasmídeos abrigando variantes de TTV- tth8 e TTMV-LY2 foram digeridos com endonucleases de restrição reconhecendo locais flanqueando o DNA genômico. Os genomas linearizados resultantes foram depois ligados para formar DNA circular. Estas reações de ligação foram feitas com concentrações variáveis de DNA para otimizar as ligações intramoleculares. Os círculos ligados foram diretamente transfectados em células de mamífero ou ainda processados para remover o DNA do genoma não circular por digestão com endonucleases de restrição para clivar o esqueleto do plasmídeo e exonucleases para degradar o DNA linear. Para TTV-tth8, a endonuclease XmaI foi usada para linearizar o DNA; o círculo ligado continha 53 pb de DNA não viral entre a região rica em GC e a região não codificante 5´. Para TTMV-LY2 foi usada a enzima de restrição do tipo IIS Esp3I, originando um círculo de DNA genômico viral sem DNA não viral. Este protocolo foi adaptado a partir de circularizações previamente publicadas de TTV-tth8 (Kincaid et al., 2013, PLoS Pathogens 9 (12): e1003818). Para demonstrar as melhorias na produção de Anellovirus, TTV-tth8 e TTMV-LY2 circularizados foram transfectados em células HEK293T. Após 7 dias de incubação, as células foram lisadas e a qPCR foi realizada para comparar os níveis de genoma de Anellovirus entre genomas anelovirais circularizados e baseados em plasmídeo. Níveis aumentados de genomas anelovirais mostram que a circularização do DNA viral é uma estratégia útil para aumentar a produção de Anellovirus.
[001943] Em um outro exemplo, o plasmídeo TTMV-LY2 (pVL46-240) e TTMV-LY2-nLuc foram linearizados com Esp3I ou EcoRV-HF, respectivamente. O plasmídeo digerido foi purificado em géis de agarose a 1% antes da eletroeluição ou purificação em coluna Qiagen e ligação com T4 DNA Ligase. O DNA circularizado foi concentrado em uma membrana de UF/DF de 100 kDa antes da transfecção. A circularização foi confirmada por eletroforese em gel como mostrado na Figura 31C. Os frascos T-225 foram semeados com HEK293T a 3 x 10 4 células/cm2 um dia antes da lipofecção com Lipofectamine 2000. Nove microgramas de DNA de TTMV-LY2 circularizado e 50 μg de TTMV- LY2-nLuc circularizado foram cotransfectados um dia após-semeadura dos frascos. Como comparação, um frasco T-225 adicional foi cotransfectado com 50 μg de TTMV-LY2 linearizado e 50 μg de TTMV- LY2-nLuc linearizado.
[001944] A produção de anelossomos prosseguiu durante oito dias antes da coleta das células em tampão de coleta Triton X-100. Geralmente, os anelossomos podem ser enriquecidos, por exemplo, por lise de células hospedeiras, clarificação do lisado, filtração e cromatografia. Em este exemplo, as células coletadas foram tratadas com nuclease antes do ajuste com cloreto de sódio e filtração de fluxo normal de 1,2 μm/0,45 μm. A coleta clarificada foi concentrada e o tampão trocado em PBS em uma membrana de fibras ocas mPES de MWCO de 750 kDa. O retentado de TFF foi filtrado com um filtro de 0,45 μm antes de carregar em uma coluna Sephacryl S-500 HR SEC pré- equilibrada em PBS. Os anelossomos foram processados através da coluna SEC a 30 cm/h. As frações individuais foram coletadas e testadas por qPCR quanto ao número de cópias do genoma viral e número de cópias do transgene, como mostrado na Figura 31D. Os genomas virais e as cópias do transgene foram observados começando no volume vazio, Fração 7, do cromatograma de SEC. Um pico de plasmídeo residual foi observado na Fração 15. O número de cópias para genomas de TTMV-LY2 e transgene TTMV-LY2-nLuc estava em boa concordância para Anelossomos produzidos usando DNA de entrada circularizado na Fração 7 – Fração 10, indicando Anelossomos empacotados contendo transgene nLuc. As frações de SEC foram agrupadas e concentradas usando uma membrana de PVDF de MWCO de 100 kDa e depois filtradas por 0,2 μm antes da administração in vivo.
[001945] A circularização do DNA de Anelossomos de entrada resultou em um aumento de três vezes na percentagem de recuperação de genomas protegidos por nucleases ao longo do processo de purificação em comparação com o DNA de Anelossomos linearizado, indicando eficiência de fabricação melhorada usando o DNA de
Anelossomos de entrada circularizado como mostrado na Tabela 46. Tabela 46. Rendimentos do Processo de Purificação Passo TTMV-LY2 Linearizado TTMV-LY2 Circularizado Cópias de Cópias de genomas Cópias de Cópias de genomas genomas virais de transgenes nLuc genomas virais de transgenes nLuc totais totais totais totais Pré-nuclease de 2,78E+12 2,17E+12 1,04E+11 4,39E+11 coleta Coletado 9,96E+09 5,48E+09 6,55E+08 9,81E+08 Clarificado TFF 1,01E+10 7,66E+09 2,58E+08 3,56E+08 SEC 3,18E+07 8,73E+06 9,16E+06 7,75E+06 UF/DF 8,82E+06 3,25E+06 1,78E+06 2,73E+06 Filtração Estéril 5,60E+06 2,64E+06 8,66E+05 1,63E+06 Rendimento do 0,0002% 0,0001% 0,0006% 0,0004% Processo de Purificação (%) Exemplo 36: Modelação de ORF1 e identificação de resíduos e domínios conservados
[001946] Este exemplo descreve a modelação in silico de proteínas ORF1 de Betatorqueviruses e a definição de domínios putativos com base em motivos estruturais e conservação/similaridade de aminoácidos.
[001947] É previsto que a proteína ORF1 seja a principal proteína do capsídeo de Anelloviruses, com base na presença de uma região rica em arginina e na elevada presença de folhas beta na previsão da estrutura secundária usando PSIpred (http://bioinf.cs.ucl.ac.uk/psipred/). RaptorX (http://raptorx.uchicago.edu/) foi usado para previsão de estruturas e previsão de contato para as sequências de oito Betatorqueviruses. As sequências de ORF1 de Betatorquevirus foram usadas pois são mais curtas (~650 aminoácidos) do que Alphatorqueviruses (~750 aminoácidos) com menos regiões previstas como sendo não estruturadas. Cinco das estruturas previstas continham elementos de similaridade que foram usados para identificar domínios putativos de ORF1 (Figura 33). A ORF1 foi dividida em cinco regiões – a região rica em arginina, o núcleo putativo (domínio jelly-roll), a região hipervariável, a região N22 e o domínio C-terminal.
[001948] O modelo estrutural da estirpe de Betatorquevirus CBS203 foi usado para exibir os resíduos/regiões estruturais que têm alguma conservação entre a família de Betatorquevirus. Para analisar resíduos conservados, 110 sequências de ORF1 de Betatorquevirus foram alinhadas em Geneious usando o algoritmo de alinhamento ClustalW. Os resíduos foram depois avaliados quanto à conservação por percentagem de identidade e similaridade usando a matriz BLOSUM62 com um limite de 1. Os resíduos que possuíam similaridade de mais do que 60% de todas as estirpes no alinhamento foram destacados no modelo estrutural (Figura 34). No total, 26 resíduos (~4%) possuíam similaridade de aminoácidos com 100% das sequências alinhadas. Os limites de 80% e 60% continham 23,7% e 36,7% dos resíduos totais, respectivamente.
[001949] Um algoritmo de alinhamento similar e determinação de similaridade foram conduzidos em 258 estirpes de Alphatorqueviruses. A similaridade e a identidade foram exibidas na sequência de consenso a partir do alinhamento e os domínios putativos foram atribuídos com base no alinhamento da sequência primária com os Betatorqueviruses (Figura 35). Os Alphatorqueviruses possuíam 29 resíduos (3,9%) que eram 100% similares, notavelmente consistentes com a observação com Betatorqueviruses. Interessantemente, os Alphatorqueviruses possuem uma percentagem mais elevada de resíduos, em comparação com os Betatorqueviruses com pelo menos 80% (30,9% dos resíduos) ou 60% (42,9% dos resíduos) de similaridade. Exemplo 37: Produção de anelossomos contendo ORF1 quimérica com domínios hipervariáveis de diferentes estirpes de Vírus
Torque Teno
[001950] Este exemplo descreve a troca de domínio de regiões hipervariáveis de ORF1 para produzir anelossomos quiméricos contendo a região rica em arginina de ORF1, domínio jelly-roll, N22 e domínio C-terminal de uma estirpe de TTV e o domínio hipervariável de uma proteína ORF1 de uma estirpe diferente de TTV.
[001951] A estirpe LY2 com genoma de comprimento total de Betatorquevirus foi clonada em vetores de expressão para expressão em células de mamífero. Este genoma é mutado para remover o domínio hipervariável de LY2 e substituir o mesmo pelo domínio hipervariável de Betatorquevirus distantemente relacionado (Figura 36). O plasmídeo contendo o genoma de LY2 com o domínio hipervariável trocado (pTTMV-LY2-HVRa-z) é depois linearizado e circularizado usando métodos previamente publicados (Kincaid et al., PLoS Pathogens 2013). As células HEK293T são transfectadas com o genoma circularizado e incubadas durante 5-7 dias para permitir a produção de anelossomos. Após o período de incubação, os anelossomos são purificados a partir do sobrenadante e pélete celular das células transfectadas por ultracentrifugação com gradiente.
[001952] Para determinar se os anelossomos quiméricos são ainda infecciosos, as partículas virais isoladas são adicionadas às células não infectadas. As células são incubadas durante 5-7 dias para permitir a replicação viral. Após incubação, a capacidade dos anelossomos quiméricos de estabelecerem infecção será monitorizada por imunofluorescência, transferência de Western e qPCR. A integridade estrutural dos vírus quiméricos é avaliada por coloração negativa e microscopia crioeletrônica. Os anelossomos quiméricos podem ser ainda testados quanto à capacidade de infectarem células in vivo. O estabelecimento da capacidade de produzir anelossomos quiméricos funcionais através de troca de domínio hipervariável poderia permitir a manipulação de vírus para alterar o tropismo e potencialmente evitar a detecção imunitária. Exemplo 38: Produção de ORF1 quimérica contendo proteína/peptídeos diferentes de TTV em vez de domínios hipervariáveis
[001953] Este exemplo descreve a substituição das regiões hipervariáveis de ORF1 por outras proteínas ou peptídeos de interesse para produzir proteína ORF1 quimérica contendo a região rica em arginina, domínio jelly-roll, N22 e domínio C-terminal de uma estirpe de TTV e uma proteína/peptídeo não de TTV em vez do domínio hipervariável.
[001954] Como mostrado no exemplo B, o domínio hipervariável de LY2 é deletado do genoma e uma proteína ou peptídeo de interesse pode ser inserido em esta região (Figura 37). Exemplos de tipos de sequências que poderiam ser introduzidos em esta região incluem, mas não estão limitados a, marcadores de afinidade, regiões variáveis de cadeia simples (scFv) de anticorpos e peptídeos antigênicos. Os genomas mutados no plasmídeo (pTTMV-LY2-ΔHVR-POI) são linearizados e circularizados como descrito no exemplo B. Os genomas circularizados são transfectados em células HEK293T e incubados durante 5-7 dias. Após incubação, os anelossomos quiméricos contendo o POI são purificados a partir do sobrenadante e pélete celular através de ultracentrifugação e/ou cromatografia de afinidade onde apropriado.
[001955] A capacidade de produzir anelossomos quiméricos funcionais contendo POIs é avaliada usando uma variedade de técnicas. Em primeiro lugar, o vírus purificado é adicionado às células não infectadas para determinar se os anelossomos quiméricos podem se replicar e/ou entregar carga útil às células virgens. Ainda, a integridade estrutural dos anelossomos quiméricos é avaliada usando microscopia eletrônica. Para anelossomos quiméricos que são funcionais in vitro, a capacidade de replicação/entrega de carga útil in vivo é também avaliada. Exemplo 39: Entrega de anelossomo de enzima secretada in vivo
[001956] Este exemplo ilustra a função efetora in vivo de uma enzima secretada entregue por Anelossomos após a administração.
[001957] Anelosomos compreendendo um transgene codificando ADAMTS13 (uma disintegrina emetaloproteinase com um motivo trombospondino de tipo 1, membro 13) são preparados. Resumidamente, cinco construtos são produzidos: Construto A - vetor TTMV-LY2 ± ADAMTS13; Construto B - proteína ADAMTS13 e ORFs TTMV-LY2; Construto C - Plasmídeos usados na produção do vetor TTMV-LY2; Construto D - Plasmídeos usados na produção da proteína ADAMTS13 e ORFs TTMV-LY2; e Construto E - PBS estéril . O Construto A e o Construto B são produzidos em células HEK-293T e purificados por meio de tratamento com nuclease, ultrafiltração/diafiltração e filtração estéril. O construto C e o construto D são produzidos em E . coli, purificados via MaxiPrep e, em seguida, diluídos para um número de cópias alvo em PBS seguido por filtração estéril. O construto E é produzido por filtração estéril de PBS. As células HEK-293T são expandidas para a Passagem 4 a partir do descongelamento em DMEM + FBS a 10% em um cronograma de passagem de três e quatro dias. Na Passagem 5, as células são semeadas a aproximadamente 5 x 10 4 células/cm2 para a transfecção do dia seguinte. As células são cotransfectadas com construtos usando Lipofectamine 2000 um dia após a sementeira. Após a transfecção, as células são incubadas para permitir produção de anelossomo e os anelossomos são colhidos.
[001958] 25uL de preparação de anelossomo ou controles apropriados são administrados intravenosamente a camundongos de tipo VWD 2B geneticamente modificados. A recolha de sangue é realizada todos os dias para cada animal de modo a determinar a hemólise e trombocitopenia, bem como a secreção da ADAMTS13 medida no sangue (SensoLyte ® 520 ADAMTS13 Ensaio de Actividade, *Fluorimetric* AnaSpec, Inc.)
[001959] A presença do sinal ADAMTS13 é medida em cada um dos dias 0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20 e
21. Ainda, nos mesmos pontos de tempo, o protocolo de ensaio de hemólise in vitro é realizado. Resumidamente, o sangue é centrifugado e a absorbância do sobrenadante, que inclui plasma e eritrócitos lisados, é medida. A percentagem de lise é calculada a partir de uma curva padrão de eritrócitos lisados (Triton X-100). Presença aumentada de ADAMTS13 e hemólise diminuída irá demonstrar expressão e atividade in vivo de ADAMTS13 entregue via anelossomo. Exemplo 40: Desenho de um anelossomo abrigando uma carga útil
[001960] Este exemplo descreve o desenho de um elemento genético de anelossomo exemplificativo abrigando um gene trans. O elemento genético é composto pelos domínios de replicação e empacotamento cis essenciais de membros da família Anelloviridae em conjunto com carga útil diferente de Anellovirus, que pode incluir, por exemplo, proteína ou genes expressando RNA não codificantes. O anelossomo carece de elementos de proteína trans essenciais para replicação e empacotamento e requer proteínas proporcionadas por outras fontes (por exemplo, ajudantes, por exemplo, vírus replicantes, plasmídeos de expressão ou integrações de genoma) para replicação de círculo rolante e encapsidação.
[001961] Em um conjunto de exemplos, a sequência de DNA codificando proteína total foi deletada, a partir do primeiro códon de início até ao último códon de paragem (Figura 38). Para TTV-tth8, os nucleotídeos 336 até 3015 foram deletados, a partir do códon de iniciação de ORF2 até ao códon de paragem de ORF3. Para TTMV-LY2, 424 até 2813 foram deletados, a partir do códon de iniciação de ORF2 até ao códon de paragem de ORF3. O DNA resultante reteve a região não codificante (NCR) viral, incluindo o promotor viral, o domínio conservado 5´ UTR, a 3´ UTR (que codifica miRNAs em algumas estirpes de Anellovirus, tais como TTV-tth8) e a região rica em GC. A NCR de anelossomo abrigava domínios cis essenciais, incluindo a origem de replicação viral e os domínios de ligação do capsídeo. No entanto, carecendo as grelhas de leitura aberta codificando proteína de Anellovirus, o anelossomo foi incapaz de expressar fatores de proteínas essenciais requeridos para replicação e encapsidação do DNA e, portanto, não amplificaria ou empacotaria a não ser que estes elementos fossem proporcionados em trans.
[001962] DNA de carga útil, incluindo mas não se limitando a sequências codificando proteínas, genes trans totais (incluindo sequências promotoras não anelovirais) e genes de RNA não codificantes, foi incorporado no elemento genético de anelossomo por inserção no local das grelhas de leitura aberta anelovirais deletadas (Figura 38). A expressão a partir de sequências codificando proteínas poderia ser dirigida, por exemplo, pelo promotor viral nativo ou um promotor sintético incorporado como um gene trans.
[001963] Os elementos genéticos de anelossomo deficientes ou incompetentes em replicação (por exemplo, como descrito no presente documento) podem carecer das sequências codificantes de proteínas para replicação viral e/ou fatores de capsídeo. Portanto, anelossomos empacotados foram produzidos por cotransfecção de células com o DNA de anelossomo descrito em este exemplo e DNA codificante de proteína viral. As proteínas virais foram expressas a partir de genomas virais de tipo selvagem competentes em replicação, plasmídeos não replicantes abrigando as proteínas virais sob controle do promotor viral ou plasmídeos abrigando as proteínas virais sob controle de um forte promotor constitutivo. Exemplo 41: Anelossomos baseados em tth8 e LY2 cada um transduziu com sucesso o gene EPO em células de câncer de pulmão
[001964] Em este exemplo, uma linha de câncer de pulmão de células não pequenas (EKVX) foi transduzida usando dois anelossomos diferentes carregando o gene da eritropoetina (EPO). Os anelossomos foram gerados por circularização in vitro, como descrito no presente documento, e incluíram dois tipos de anelossomos com base em um esqueleto de LY2 ou tth8 (por exemplo, como descrito nas Tabelas 15 e 16 ou Tabelas 5 e 6, respectivamente). Cada um dos anelossomos LY2-EPO e tth8-EPO incluiu um elemento genético que incluiu o cassete codificando EPO e regiões não codificantes do genoma de LY2 ou tth8 (5´ UTR, região rica em GC), respectivamente, mas não incluiu ORFs de Anellovirus, por exemplo, como descrito no Exemplo 40. As células foram inoculadas com anelossomos purificados ou um controle positivo (AAV2-EPO em elevada dose ou à mesma dose que os anelossomos) e incubadas durante 7 dias. As ORFs de Anellovirus foram proporcionadas em trans em um DNA circularizado in vitro separado. O sobrenadante da cultura foi amostrado 3, 5,5 e 7 dias pós-inoculação e testado usando um estojo de ELISA comercial para detectar EPO. Ambos os anelossomos LY2-EPO e tth8-EPO transduziram células com sucesso, mostrando títulos de EPO significativamente mais elevados em comparação com células de controle não tratadas (negativas) (P < 0,013 em todos os momentos) (Figura 40). Exemplo 42: Os anelossomos com transgenes terapêuticos podem ser detectados in vivo após administração intravenosa (i.v.)
[001965] Em este exemplo, os anelossomos codificando o hormônio de crescimento humano (hGH) foram detectados in vivo após administração intravenosa (i.v.). Anelossomos deficientes em replicação, com base em um esqueleto de LY2 e codificando um hGH exógeno (LY2-hGH), foram gerados por circularização in vitro como descrito no presente documento. O elemento genético dos anelossomos LY2-hGH inclui regiões não codificantes de LY2 (5´ UTR, região rica em GC) e o cassete codificando hGH, mas não incluiu ORFs de Anellovirus, por exemplo, como descrito no Exemplo 40. Os anelossomos LY2-hGH foram administrados a camundongos intravenosamente. As ORFs de Anellovirus foram proporcionadas em trans em um DNA circularizado in vitro separado. Resumidamente, anelossomos (LY2-hGH) ou PBS foram injetados intravenosamente no dia 0 (n = 4 camundongos/grupo). Os anelossomos foram administrados a grupos de animais independentes em 4.66E+07 genomas de anelossomos por camundongo.
[001966] Em um primeiro exemplo, cópias de DNA do genoma viral de anelossomo foram detectadas. No dia 7, sangue e plasma foram coletados e analisados quanto ao amplicon de DNA de hGH por qPCR. Os anelossomos LY2-hGH estavam presentes na fração celular do sangue inteiro após 7 dias pós-infecção in vivo (Figura 41A). Além do mais, a ausência de anelossomos no plasma demonstrou a incapacidade destes anelossomos de se replicarem in vivo (Figura 41B).
[001967] Em um segundo exemplo, os transcritos de mRNA de hGH foram detectados após transdução in vivo. No dia 7, o sangue foi coletado e analisado quanto ao amplicon de transcrito de mRNA de hGH por qRT-PCR. GAPDH foi usado como um gene de manutenção de controle. Os transcritos de mRNA de hGH foram medidos na fração celular de sangue total. O mRNA do transgene codificado por anelossomo foi detectado in vivo (Figura 42). Exemplo 43: Distribuição do tamanho das sequências codificantes em Anelloviruses
[001968] O comprimento da sequência codificante (CDS) de todos os Anelloviruses foi avaliado utilizando um extenso catálogo de estirpes de tipo selvagem identificadas internamente. Os comprimentos de CDS de Anelloviruses foram representados graficamente, comparando estirpes de vírus entre os três gêneros de Anellovirus humanos (Alphatorqueviruses, alfa; Betatorqueviruses, beta; e Gammatorqueviruses, gama) e comparando comprimentos de sequências de genomas publicamente disponíveis para aqueles montados internamente (em casa) pelos presentes inventores. O comprimento médio de CDS de todos os Anelloviruses é cerca de 2100 nucleotídeos. Os TTVs no gênero Alphatorquevirus eram maiores do que os Anelloviruses dos gêneros Betatorquevirus e Gammatorquevirus (TTV minis e TTV médios, respectivamente). Especificamente, uma CDS média de 2237 nucleotídeos foi observada em TTVs Alphatorquevirus, com uma gama de 1800-2541 nucleotídeos. Um comprimento médio de CDS de 2011 nucleotídeos foi observada para Betatorqueviruses, com uma gama de 1803-2229 nucleotídeos. Um comprimento médio de CDS de 2012 nucleotídeos foi observada para Gammatorqueviruses, com uma gama de 1812-2379 nucleotídeos. Exemplo 44: Um motivo altamente conservado para caracterizar ORF2
[001969] A ORF2 de Anellovirus, como mostrado em um genoma exemplificativo na Figura 43A, codifica provavelmente uma proteína não estrutural com possível atividade de fosfatase e papéis na replicação viral e regulação da imunidade do hospedeiro. Um extenso repositório de sequências virais foi examinado quanto à presença de um motivo de aminoácidos de ORF2 conservado (Figura 43B). Este motivo foi depois usado para identificar mais do que 1000 sequências de ORF2 de Anellovirus entre sequências internas e públicas. Foi descoberto que este motivo de ORF2 permanece conservado ao longo de um vasto catálogo de estirpes de Anellovirus de humanos, bem como todos os Anelloviruses não humanos examinados (Anelloviruses de roedor, porco e primata, bem como vírus da anemia de frango), tornando o mesmo o Anellovirus mais altamente conservado motivo identificado até à data. A modelação estrutural de ORF2 foi também realizada, o que descreveu que os resíduos conservados no motivo de ORF2 foram mantidos em uma estrutura de hélice-volta-hélice, com uma orientação que sugere um possível domínio de ligação a metais (Figura 43C). Interessantemente, as árvores filogenéticas de ORF1 em comparação com ORF2 (Figura 43D) mostraram uma divisão ao nível de gênero similar por Alphatorqueviruses, Betatorqueviruses e Gammatorqueviruses, indicando que as ORF2s são específicas do gênero. Exemplo 45: Evidência de mRNA de ORF1 de Anellovirus de comprimento total em humanos
[001970] Os Anelloviruses expressam pelo menos três mRNAs alternativamente spliced in vitro, o mais longo dos quais (~2,2 kb) se prevê que codifica ORF1 de comprimento total. Em este exemplo, a transcrição do mRNA de ORF1 foi avaliada in vivo.
[001971] Para fazer isso, os dados de tecidos de RNA Seq publicamente disponíveis a partir do projeto GTEx (Genotype-Tissue Expression) foram examinados. O objetivo foi identificar amostras de tecido humano que continham leituras de RNA de Anellovirus suficientes para categorizar os transcritos virais. 104 amostras de tecido com leituras de RNA de Anellovirus foram identificadas (2,4% de todos os tecidos, 19% das amostras de sangue); 7 destas amostras tinham mais do que 20 leituras de RNA de Anellovirus, permitindo a análise do transcriptoma viral. 3 destas 7 amostras positivas para Anellovirus tinham também dados de WGS correspondidos, a partir dos quais poderia ser montado o genoma de DNA de Anellovirus correspondente para mapeamento de leitura precisa (Figura 44A). Na ausência de genomas de referência virais correspondentes, a diversidade de Anellovirus proíbe o mapeamento informativo de leituras de RNA. As leituras de RNA que mapeiam para a região ORF1 foram detectadas em três dadores (duas amostras de sangue e uma amostra de tecido pulmonar). Em uma amostra de sangue de dador foram identificadas leituras de RNA de Anellovirus que cobriam a região ORF1 de comprimento total (Figura 44B, as barras cinzas ilustram pares de leitura). Esta é a primeira confirmação de transcritos de Anellovirus de comprimento total in vivo usando dados de RNA Seq. Exemplo 46: Genoma circularizado in vitro como material de entrada para produção de anelossomos in vitro
[001972] Este exemplo demonstra que o DNA de Anellovirus de fita dupla circularizado in vitro (IVC), como material de origem para um elemento genético de anelossomo como descrito no presente documento, é mais robusto do que um DNA de genoma de Anellovirus em um plasmídeo para originar genomas de anelossomo empacotados da densidade esperada.
[001973] 1,2E+07 células HEK293T (linha de células de rim embrionário humano) em frascos T75 foram transfectadas com 11,25 ug de (i) genoma de TTV-tth8 de fita dupla circularizado in vitro (IVC TTV-tth8), (ii) genoma de TTV-tth8 em um esqueleto de plasmídeo ou (iii) plasmídeo contendo apenas a sequência de ORF1 de TTV-tth8 (TTV-tth8 não replicante). As células foram coletadas 7 dias pós- transfecção, lisadas com Triton a 0,1% e tratadas com 100 unidades por mL de Benzonase. Os lisados foram usados para análises de densidade de cloreto de césio; a densidade foi medida e a quantificação de cópias de TTV-tth8 foi realizada para cada fração do gradiente linear de cloreto de césio. Como mostrado na Figura 45, TTV-tth8 IVC originou dramaticamente mais cópias do genoma viral na densidade esperada de 1,33 em comparação com o plasmídeo TTV-tth8.
[001974] 1E+07 células Jurkat (linha de células de linfócitos T humanos) foram nucleofectadas com genoma de LY2 circularizado in vitro (LY2 IVC) ou genoma de LY2 em plasmídeo. As células foram coletadas 4 dias pós-transfecção e lisadas usando um tampão contendo triton a 0,5 e cloreto de sódio a 300 mM, seguido por duas rondas de congelamento-descongelamento instantâneo. Os lisados foram tratados com 100 unidades/mL de benzonase, seguido por análise de densidade de cloreto de césio. A medição da densidade e a quantificação do genoma de LY2 foram realizadas em cada fração do gradiente linear de cloreto de césio. Como mostrado na Figura 46, a transfecção do genoma de LY2 circularizado in vitro em células Jurkat levou a um pico agudo na densidade esperada, em comparação com a transfecção do plasmídeo contendo o genoma de LY2, que não mostrou pico detectável na Figura 46. Exemplo 47: Identificação de motivos estruturais secundários conservados em ORF1 de Anellovirus
[001975] Em este exemplo, a modelação computacional foi usada para identificar motivos conservados na estrutura secundária da proteína ORF1 de Anellovirus. As previsões da estrutura secundária foram conduzidas em estirpes únicas usando o programa JPred.
[001976] Geralmente, o domínio jelly-roll de TTVs humanos tem aproximadamente 200 aminoácidos (AA) ± 3 AA em comprimento. A estrutura secundária de um domínio jelly-roll exemplificativo começa com uma fita beta de 5-7 AA, seguida por uma bobina aleatória de 3-5 AA, uma fita beta de 15-16 AA, uma bobina aleatória de 26-28 AA, uma hélice alfa de 15-17 AA, uma bobina aleatória de 2 AA, uma fita beta de 3-4 AA, uma bobina aleatória de 8 AA, uma fita beta de 10-11 AA, uma bobina aleatória de 5-6 AA, uma fita beta de 6-7 AA, uma bobina aleatória de 8-14 AA, uma hélice alfa de 8-14 AA (que pode ser quebrada em 2 hélices mais pequenas em alguns casos), uma bobina aleatória de 3-4 AA, uma fita beta de 4-5 AA, uma bobina aleatória de 10 AA, uma fita beta de 5-6 AA, uma bobina aleatória de 20-21 AA, uma fita beta de 7-9 AA, uma bobina aleatória de 14-16 AA, uma fita beta de 5-7 AA. Um alinhamento de estruturas secundárias de ORF1 de Anellovirus exemplificativos dos clados de Alphatorquevirus, Betatorquevirus e Gammatorquevirus é mostrado na Figura 47.
[001977] A estrutura secundária do motivo YNPX2DXGX2N (SEQ ID NO: 829) no domínio N22 de ORF1 tem também uma estrutura secundária conservada ao seu redor. Começando com uma fita beta de 5-6 AA que se quebra após a tirosina (Y) na posição 1 do motivo, a maioria do motivo se alinha em uma bobina aleatória de 8-9 AA, até à asparagina terminal (N), ponto esse em que uma outra fita beta de 7-8 AA tem origem. Um alinhamento de sequências de motivo N22 de ORF1 de Anellovirus exemplificativas é mostrado na Figura 48. A tirosina no motivo quebra uma fita beta, e uma segunda fita beta começa na asparagina terminal do motivo.

Claims (54)

REIVINDICAÇÕES
1. Anelossomo sintético, caracterizado por compreender: (I) um elemento genético compreendendo: (a) um elemento promotor, (b) uma sequência de ácidos nucleicos codificando um efetor exógeno, em que a sequência de ácidos nucleicos está operacionalmente ligada ao elemento promotor, e em que o efetor exógeno é eritropoietina (EPO), e (c) um domínio 5´ UTR compreendendo uma sequência de ácidos nucleicos dos nucleotídeos 323–393 da SEQ ID NO: 54 ou uma sequência de ácidos nucleicos pelo menos 90% idêntica à mesma; (II) um exterior proteináceo compreendendo um polipeptídeo codificado por ácido nucleico de ORF1 de Anellovirus, por exemplo, uma molécula ORF1; em que o elemento genético está encerrado dentro do exterior proteináceo; e em que o anelossomo sintético é capaz de entregar o elemento genético em uma célula humana.
2. Anelossomo sintético, de acordo com a reivindicação 1, caracterizado por a molécula ORF1 compreender a sequência de aminoácidos de SEQ ID NO: 217 ou uma sequência de aminoácidos possuindo pelo menos 90% de identidade com a mesma.
3. Anelossomo sintético, de acordo com qualquer uma das reivindicações precedentes, caracterizado por a molécula ORF1 ser codificada pelos nucleotídeos 612-2612 da SEQ ID NO: 54.
4. Anelossomo sintético, de acordo com qualquer uma das reivindicações precedentes, caracterizado por o elemento genético compreender a sequência de ácidos nucleicos dos nucleotídeos 2868- 2929 da SEQ ID NO: 54 ou uma sequência de ácidos nucleicos possuindo pelo menos 85% de identidade de sequências com a mesma.
5. Anelossomo sintético, de acordo com qualquer uma das reivindicações precedentes, caracterizado por a molécula ORF1 compreender uma sequência de aminoácidos compreendendo uma ou mais das sequências de aminoácidos de uma região rica em arg, domínio jelly-roll, domínio hipervariável, domínio N22 e/ou domínio C- terminal como listado na Tabela 16, ou uma sequência de aminoácidos possuindo pelo menos 85% de identidade com as mesmas.
6. Anelossomo sintético, de acordo com qualquer uma das reivindicações precedentes, caracterizado por a molécula ORF1 compreender a sequência de aminoácidos de SEQ ID NO: 58 ou uma sequência de ácidos nucleicos possuindo pelo menos 85% de identidade de sequências com a mesma.
7. Anelossomo sintético, de acordo com qualquer uma das reivindicações precedentes, caracterizado por compreender ainda um polipeptídeo que compreende a sequência de aminoácidos de uma ORF2, ORF2/2, ORF2/3, ORF1/1 ou ORF1/2 como listado na Tabela 16, ou uma sequência de aminoácidos possuindo pelo menos 85% de identidade com a mesma.
8. Anelossomo sintético, de acordo com qualquer uma das reivindicações precedentes, caracterizado por o elemento genético codificar a sequência de aminoácidos de uma ORF1, ORF2, ORF2/2, ORF2/3, ORF1/1 ou ORF1/2 como listado na Tabela 16 ou uma sequência de aminoácidos possuindo pelo menos 85% de identidade com a mesma.
9. Anelossomo sintético, de acordo com qualquer uma das reivindicações precedentes, caracterizado por o anelossomo sintético não compreender um polipeptídeo compreendendo a sequência de aminoácidos de uma ORF2, ORF2/2, ORF2/3, TAIP, ORF1/1 ou ORF1/2 como listado na Tabela 16, ou uma sequência de aminoácidos possuindo pelo menos 85% de identidade com a mesma.
10. Anelossomo sintético, de acordo com qualquer uma das reivindicações precedentes, caracterizado por o elemento genético não codificar a sequência de aminoácidos de uma ORF1, ORF2, ORF2/2, ORF2/3, ORF1/1 ou ORF1/2 como listado na Tabela 16, ou uma sequência de aminoácidos possuindo pelo menos 85% de identidade com a mesma.
11. Anelossomo sintético, de acordo com qualquer uma das reivindicações precedentes, caracterizado por a molécula ORF1 compreender a sequência de aminoácidos YNPX2DXGX2N (SEQ ID NO: 829), em que Xn é cada um independentemente uma sequência contígua de quaisquer n aminoácidos.
12. Anelossomo sintético, de acordo com a reivindicação 11, caracterizado por a molécula ORF1 compreender ainda uma primeira fita beta e uma segunda fita beta flanqueando a sequência de aminoácidos YNPX2DXGX2N (SEQ ID NO: 829), por exemplo, em que a primeira fita beta compreende o resíduo de tirosina (Y) da sequência de aminoácidos YNPX2DXGX2N (SEQ ID NO: 829) e/ou em que a segunda fita beta compreende o segundo resíduo de asparagina (N) (de N para C) da sequência de aminoácidos YNPX2DXGX2N (SEQ ID NO: 829).
13. Anelossomo sintético, de acordo com qualquer uma das reivindicações precedentes, caracterizado por a molécula ORF1 compreender, na ordem da direção do N-terminal para o C-terminal , uma primeira fita beta, uma segunda fita beta, uma primeira hélice alfa, uma terceira fita beta, uma quarta fita beta, uma quinta fita beta, uma segunda hélice alfa, uma sexta fita beta, uma sétima fita beta, uma oitava fita beta e uma nona fita beta.
14. Anelossomo sintético, de acordo com qualquer uma das reivindicações precedentes, caracterizado por o elemento genético ser capaz de ser amplificado por replicação de círculo rolante em uma célula hospedeira, por exemplo, para produzir pelo menos 8 cópias.
15. Anelossomo sintético, de acordo com qualquer uma das reivindicações precedentes, caracterizado por o elemento genético possuir fita simples.
16. Anelossomo sintético, de acordo com qualquer uma das reivindicações precedentes, caracterizado por o elemento genético ser circular.
17. Anelossomo sintético, de acordo com qualquer uma das reivindicações precedentes, caracterizado por o elemento genético ser DNA.
18. Anelossomo sintético, de acordo com qualquer uma das reivindicações precedentes, caracterizado por o elemento genético ser um DNA de fita negativa.
19. Anelossomo sintético, de acordo com qualquer uma das reivindicações precedentes, caracterizado por o elemento genético se integrar a uma frequência de menos do que 10%, 8%, 6%, 4%, 3%, 2%, 1%, 0,5%, 0,2%, 0,1% dos anelossomos que entram na célula, por exemplo, em que o anelossomo sintético é não integrante.
20. Anelossomo sintético, de acordo com qualquer uma das reivindicações precedentes, caracterizado por o elemento genético compreender uma sequência de ácidos nucleicos de 5´ UTR de Consenso mostrada na Tabela 16-1.
21. Anelossomo sintético, de acordo com qualquer uma das reivindicações precedentes, caracterizado por o elemento genético compreender uma sequência da região rica em GC de Consenso mostrada na Tabela 16-2.
22. Anelossomo sintético, de acordo com qualquer uma das reivindicações precedentes, caracterizado por o elemento genético compreender uma sequência de pelo menos 100 nucleotídeos em comprimento, que consiste em G ou C em pelo menos 70% (por exemplo, pelo menos cerca de 70-100%, 75-95%, 80-95%, 85-95% ou 85-90%) das posições.
23. Anelossomo sintético, de acordo com qualquer uma das reivindicações precedentes, caracterizado por o elemento genético compreender a sequência de ácidos nucleicos de SEQ ID NO: 120.
24. Anelossomo sintético, de acordo com qualquer uma das reivindicações precedentes, caracterizado por o elemento promotor ser exógeno ao Anellovirus de tipo selvagem.
25. Anelossomo sintético, de acordo com qualquer uma das reivindicações precedentes, caracterizado por o elemento promotor ser endógeno ao Anellovirus de tipo selvagem.
26. Anelossomo sintético, de acordo com qualquer uma das reivindicações precedentes, caracterizado por o elemento genético possuir um comprimento de cerca de 1,5-2,0, 2,0-2,5, 2,5-3,0, 3,0-3,5, 3,1-3,6, 3,2-3,7, 3,3-3,8, 3,4-3,9, 3,5-4,0, 4,0-4,5 ou 4,5-5,0 kb.
27. Anelossomo sintético, de acordo com qualquer uma das reivindicações precedentes, caracterizado por o anelossomo sintético ser capaz de infectar células humanas, por exemplo, neurônios (por exemplo, neurônios motores), miócitos, célula retinal, células hepáticas, células sanguíneas, células da pele, células nervosas, células adiposas ou células endoteliais, por exemplo, in vitro.
28. Anelossomo sintético, de acordo com qualquer uma das reivindicações precedentes, caracterizado por ser substancialmente não imunogênico, por exemplo, não induzir uma resposta imunitária detectável e/ou indesejada, por exemplo, como detectado de acordo com o método descrito no Exemplo 4.
29. Anelossomo sintético, de acordo com a reivindicação 28, caracterizado por o anelossomo substancialmente não imunogênico possuir uma eficácia em um indivíduo que é pelo menos cerca de 10%,
20%, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 95% ou 100% da eficácia em um indivíduo de referência carecendo de uma resposta imunitária.
30. Anelossomo sintético, de acordo com qualquer uma das reivindicações precedentes, caracterizado por uma população de pelo menos 1000 dos anelossomos ser capaz de entregar pelo menos cerca de 100 cópias (por exemplo, pelo menos 1, 2, 3, 4, 5, 10, 20, 30, 40, 50, 100, 200, 300, 400, 500, 600, 700, 800, 900 ou 1000 cópias) do elemento genético em uma ou mais células humanas.
31. Anelossomo sintético, caracterizado por compreender: (I) um elemento genético compreendendo: (a) um elemento promotor, (b) uma sequência de ácidos nucleicos codificando um efetor exógeno, em que a sequência de ácidos nucleicos está operacionalmente ligada ao elemento promotor, em que o efetor exógeno compreende um polipeptídeo que, quando mutado, causa uma doença humana, ou uma variante funcional do referido polipeptídeo, escolhida de: (i) uma enzima terapêutica, (ii) uma proteína estrutural, ou (iii) uma proteína complementar; e (c) um domínio 5´ UTR compreendendo uma sequência de ácidos nucleicos dos nucleotídeos 323–393 da SEQ ID NO: 54 ou uma sequência de ácidos nucleicos pelo menos 85% idêntica a ela; ou (II) um exterior proteináceo compreendendo um polipeptídeo codificado por ácido nucleico de ORF1, por exemplo, uma molécula ORF1; em que o elemento genético está encerrado dentro do exterior proteináceo; e em que o anelossomo sintético é capaz de entregar o elemento genético em uma célula humana.
32. Composição farmacêutica, caracterizada por compreender o anelossomo sintético, como definido em qualquer uma das reivindicações precedentes, e um transportador ou excipiente farmaceuticamente aceitável.
33. Composição farmacêutica, de acordo com a reivindicação 32, caracterizada por compreender pelo menos 103, 104, 105, 106, 107, 108 ou 109 anelossomos sintéticos.
34. Composição farmacêutica, de acordo com a reivindicação 32 ou 33, caracterizada por a composição farmacêutica possuir uma razão predeterminada de partículas:unidades infecciosas (por exemplo, <300:1, < 200:1, <100:1 ou <50:1).
35. Mistura reacional, caracterizada por compreender: (i) um primeiro ácido nucleico (por exemplo, um DNA circular de fita dupla ou fita simples) compreendendo a sequência do elemento genético do anelossomo sintético, como definido em qualquer uma das reivindicações precedentes, e (ii) uma segunda sequência de ácidos nucleicos codificando uma ou mais de uma sequência de aminoácidos escolhida de ORF1, ORF2, ORF2/2, ORF2/3, ORF1/1 ou ORF1/2, por exemplo, como listado na Tabela 16, ou uma sequência de aminoácidos possuindo pelo menos 85% de identidade de sequências com as mesmas.
36. Mistura reacional, de acordo com a reivindicação 35, caracterizada por o primeiro ácido nucleico e o segundo ácido nucleico estarem na mesma molécula de ácido nucleico.
37. Mistura reacional, de acordo com a reivindicação 35, caracterizada por o primeiro ácido nucleico e o segundo ácido nucleico serem moléculas de ácido nucleico diferentes.
38. Mistura reacional, de acordo com a reivindicação 35, caracterizada por o primeiro ácido nucleico e o segundo ácido nucleico serem moléculas de ácido nucleico diferentes e em que o segundo ácido nucleico é proporcionado como DNA circular de fita dupla.
39. Mistura reacional, de acordo com a reivindicação 35, caracterizada por o primeiro ácido nucleico e o segundo ácido nucleico serem moléculas de ácido nucleico diferentes e em que o primeiro e o segundo ácidos nucleicos são proporcionados como DNA circular de fita dupla.
40. Mistura reacional, de acordo com a reivindicação 37, caracterizada por a segunda sequência de ácidos nucleicos estar compreendida por uma célula ajudante ou vírus ajudante.
41. Método de preparação de um anelossomo sintético, caracterizado por o método compreender: a) proporcionar uma célula hospedeira compreendendo: (i) uma primeira molécula de ácido nucleico compreendendo a sequência de ácidos nucleicos de um elemento genético de um anelossomo sintético, como definido em qualquer uma das reivindicações precedentes, e (ii) uma segunda molécula de ácido nucleico codificando uma ou mais de uma sequência de aminoácidos escolhida de ORF1, ORF2, ORF2/2, ORF2/3, ORF1/1 ou ORF1/2, por exemplo, como listado em qualquer uma das Tabelas 16, ou uma sequência de aminoácidos possuindo pelo menos 85% de identidade de sequências com as mesmas; e b) incubar a célula hospedeira sob condições adequadas para preparar um anelossomo sintético; preparando deste modo o anelossomo sintético.
42. Método, de acordo com a reivindicação 41, caracterizado por compreender ainda, antes do passo (a), introdução da primeira molécula de ácido nucleico e/ou da segunda molécula de ácido nucleico na célula.
43. Método, de acordo com a reivindicação 42, caracterizado por a segunda molécula de ácido nucleico ser introduzida na célula hospedeira antes de, simultaneamente com, ou após, a primeira molécula de ácido nucleico.
44. Método, de acordo com a reivindicação 41 ou 42, caracterizado por a segunda molécula de ácido nucleico ser integrada no genoma da célula hospedeira.
45. Método, de acordo com qualquer uma das reivindicações 41 a 44, caracterizado por a segunda molécula de ácido nucleico ser um ajudante (por exemplo, um plasmídeo ajudante ou o genoma de um vírus ajudante).
46. Método, de acordo com qualquer uma das reivindicações 41 a 44, caracterizado por a segunda molécula de ácido nucleico codificar uma molécula ORF2 compreendendo a sequência de aminoácidos [W/F]X7HX3CX1CX5H (SEQ ID NO: 949), em que Xn é uma sequência contígua de quaisquer n aminoácidos.
47. Método de fabricação de uma preparação de anelossomos sintéticos, caracterizado por o método compreender: a) proporcionar uma pluralidade de anelossomos sintéticos, como definidos em qualquer uma das reivindicações 1 a 31, uma composição farmacêutica, como definida em qualquer uma das reivindicações 32 a 34 ou uma mistura reacional, como definida em qualquer uma das reivindicações 35 a 40; b) avaliar opcionalmente a pluralidade de um ou mais de: um contaminante descrito aqui, uma medição de densidade óptica (por exemplo, OD 260), número de partículas (por exemplo, por HPLC), infectividade (por exemplo, razão partícula:unidade infecciosa); e c) formular a pluralidade de anelossomos sintéticos, por exemplo, como uma composição farmacêutica adequada para administração a um indivíduo, por exemplo, se um ou mais dos parâmetros de (b) atingirem um limiar especificado.
48. Célula hospedeira, caracterizada por compreender: (i) uma primeira molécula de ácido nucleico compreendendo a sequência de ácidos nucleicos de um elemento genético de um anelossomo sintético, como definido em qualquer uma das reivindicações precedentes, e (ii) opcionalmente, uma segunda molécula de ácido nucleico codificando uma ou mais de uma sequência de aminoácidos escolhida de ORF1, ORF2, ORF2/2, ORF2/3, ORF1/1 ou ORF1/2 como listado em qualquer uma das Tabelas 16, ou uma sequência de aminoácidos possuindo pelo menos 85% de identidade de sequências com as mesmas.
49. Método de entrega de um efetor exógeno (por exemplo, um efetor exógeno terapêutico) a uma célula de mamífero, caracterizado por compreender: (a) proporcionar um anelossomo sintético, como definido em qualquer uma das reivindicações precedentes; e (b) contatar uma célula de mamífero com o anelossomo sintético; em que o anelossomo sintético é capaz de entregar o elemento genético na célula de mamífero; e opcionalmente em que o anelossomo sintético é produzido por introdução do elemento genético em uma célula hospedeira, sob condições adequadas para encerrar o elemento genético dentro do exterior proteináceo na célula hospedeira; entregando deste modo o efetor exógeno terapêutico à célula de mamífero.
50. Uso de um anelossomo sintético, como definido em qualquer uma das reivindicações 1 a 31, ou da composição farmacêutica, como definida em qualquer uma das reivindicações 32 a
34, caracterizado por ser para entrega do elemento genético a uma célula hospedeira.
51. Uso de um anelossomo sintético, como definido em qualquer uma das reivindicações 1 a 31, ou da composição farmacêutica, como definida em qualquer uma das reivindicações 32 a 34, caracterizado por ser para tratamento de uma doença ou disfunção em um indivíduo.
52. Anelossomo sintético, de acordo com qualquer uma das reivindicações 1 a 31, ou composição farmacêutica, de acordo com qualquer uma das reivindicações 32 a 34, caracterizado por ser para uso no tratamento de uma doença ou disfunção em um indivíduo.
53. Método de tratamento de uma doença ou disfunção em um indivíduo, caracterizado por o método compreender administração de um anelossomo sintético, como definido em qualquer uma das reivindicações 1 a 31, ou da composição farmacêutica, como definida em qualquer uma das reivindicações 32 a 34 ao indivíduo.
54. Uso do anelossomo sintético, como definido em qualquer uma das reivindicações 1 a 31, ou da composição farmacêutica, como definida em qualquer uma das reivindicações 32 a 34, caracterizado por ser para fabricação de um medicamento para tratamento de uma doença ou disfunção em um indivíduo.
BR112021010925-0A 2018-12-12 2019-12-12 Anelossomos para entrega de modalidades terapêuticas de substituição de proteína BR112021010925A2 (pt)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US201862778861P 2018-12-12 2018-12-12
US201862778866P 2018-12-12 2018-12-12
US62/778,861 2018-12-12
US62/778,866 2018-12-12
PCT/US2019/065963 WO2020123795A2 (en) 2018-12-12 2019-12-12 Anellosomes for delivering protein replacement therapeutic modalities

Publications (1)

Publication Number Publication Date
BR112021010925A2 true BR112021010925A2 (pt) 2021-08-31

Family

ID=69160356

Family Applications (1)

Application Number Title Priority Date Filing Date
BR112021010925-0A BR112021010925A2 (pt) 2018-12-12 2019-12-12 Anelossomos para entrega de modalidades terapêuticas de substituição de proteína

Country Status (11)

Country Link
US (1) US20220073950A1 (pt)
EP (1) EP3894569A2 (pt)
JP (1) JP2022513459A (pt)
KR (1) KR20210125990A (pt)
CN (1) CN114127303A (pt)
AU (1) AU2019395418A1 (pt)
BR (1) BR112021010925A2 (pt)
CA (1) CA3119814A1 (pt)
IL (1) IL283781A (pt)
MX (1) MX2021006945A (pt)
WO (1) WO2020123795A2 (pt)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11624061B2 (en) 2017-04-28 2023-04-11 Agrospheres, Inc. Compositions and methods for enzyme immobilization
BR112019022539A2 (pt) 2017-04-28 2020-06-16 Agrospheres, Inc. Composições e métodos para o encapsulamento e entrega escalonável de agorquímicos
BR112020005803A2 (pt) 2017-09-25 2020-12-01 Agrospheres, Inc. composições e métodos para produção e administração moduláveis de produtos biológicos
WO2023064781A1 (en) * 2021-10-12 2023-04-20 Flagship Pioneering Innovations V, Inc. Novel anellovector compositions and methods
IL312184A (en) * 2021-10-18 2024-06-01 Flagship Pioneering Innovations Vii Llc DNA compositions and related methods

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6395472B1 (en) * 1999-02-05 2002-05-28 Abbott Laboratories Methods of utilizing the TT virus
RU2020100074A (ru) * 2017-06-13 2021-08-03 Флэгшип Пайониринг Инновейшнз V, Инк. Композиции, содержащие куроны, и пути их применения

Also Published As

Publication number Publication date
IL283781A (en) 2021-07-29
WO2020123795A2 (en) 2020-06-18
CA3119814A1 (en) 2020-06-18
MX2021006945A (es) 2021-08-24
US20220073950A1 (en) 2022-03-10
JP2022513459A (ja) 2022-02-08
WO2020123795A3 (en) 2020-08-27
AU2019395418A1 (en) 2021-06-03
KR20210125990A (ko) 2021-10-19
EP3894569A2 (en) 2021-10-20
CN114127303A (zh) 2022-03-01

Similar Documents

Publication Publication Date Title
US11446344B1 (en) Anellovirus compositions and methods of use
US20230279423A1 (en) Compositions comprising curons and uses thereof
BR112021010925A2 (pt) Anelossomos para entrega de modalidades terapêuticas de substituição de proteína
US20220042042A1 (en) Anellosomes and methods of use
BR112021009379A2 (pt) anelossomos para entrega de modalidades terapêuticas secretadas
BR112021009282A2 (pt) anelossomos para entrega de modalidades terapêuticas intracelulares
AU2021372533A1 (en) Chicken anemia virus (cav)-based vectors
US20230227849A1 (en) Methods of identifying and characterizing anelloviruses and uses thereof
JP2024087003A (ja) クロンを含む組成物及びその使用
WO2021252955A1 (en) Tandem anellovirus constructs