BR112021002017A2 - moléculas de ácido nucleico e usos das mesmas para terapia genética não viral - Google Patents

moléculas de ácido nucleico e usos das mesmas para terapia genética não viral Download PDF

Info

Publication number
BR112021002017A2
BR112021002017A2 BR112021002017-9A BR112021002017A BR112021002017A2 BR 112021002017 A2 BR112021002017 A2 BR 112021002017A2 BR 112021002017 A BR112021002017 A BR 112021002017A BR 112021002017 A2 BR112021002017 A2 BR 112021002017A2
Authority
BR
Brazil
Prior art keywords
itr
nucleic acid
acid molecule
sequence
seq
Prior art date
Application number
BR112021002017-9A
Other languages
English (en)
Inventor
Douglas DRAGER
Jiayun Liu
Tongyao Liu
Susannah PATARROYO-WHITE
Robert T. Peters
Alexey SEREGIN
Philip ZAKAS
Original Assignee
Bioverativ Therapeutics Inc.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Bioverativ Therapeutics Inc. filed Critical Bioverativ Therapeutics Inc.
Publication of BR112021002017A2 publication Critical patent/BR112021002017A2/pt

Links

Classifications

    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K48/00Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy
    • A61K48/005Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy characterised by an aspect of the 'active' part of the composition delivered, i.e. the nucleic acid delivered
    • A61K48/0058Nucleic acids adapted for tissue specific expression, e.g. having tissue specific promoters as part of a contruct
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/85Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
    • C12N15/86Viral vectors
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K31/00Medicinal preparations containing organic active ingredients
    • A61K31/70Carbohydrates; Sugars; Derivatives thereof
    • A61K31/7088Compounds having three or more nucleosides or nucleotides
    • A61K31/7105Natural ribonucleic acids, i.e. containing only riboses attached to adenine, guanine, cytosine or uracil and having 3'-5' phosphodiester links
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K31/00Medicinal preparations containing organic active ingredients
    • A61K31/70Carbohydrates; Sugars; Derivatives thereof
    • A61K31/7088Compounds having three or more nucleosides or nucleotides
    • A61K31/713Double-stranded nucleic acids or oligonucleotides
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K48/00Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy
    • A61K48/0008Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy characterised by an aspect of the 'non-active' part of the composition delivered, e.g. wherein such 'non-active' part is not delivered simultaneously with the 'active' part of the composition
    • A61K48/0016Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy characterised by an aspect of the 'non-active' part of the composition delivered, e.g. wherein such 'non-active' part is not delivered simultaneously with the 'active' part of the composition wherein the nucleic acid is delivered as a 'naked' nucleic acid, i.e. not combined with an entity such as a cationic lipid
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K48/00Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy
    • A61K48/0008Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy characterised by an aspect of the 'non-active' part of the composition delivered, e.g. wherein such 'non-active' part is not delivered simultaneously with the 'active' part of the composition
    • A61K48/0025Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy characterised by an aspect of the 'non-active' part of the composition delivered, e.g. wherein such 'non-active' part is not delivered simultaneously with the 'active' part of the composition wherein the non-active part clearly interacts with the delivered nucleic acid
    • A61K48/0033Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy characterised by an aspect of the 'non-active' part of the composition delivered, e.g. wherein such 'non-active' part is not delivered simultaneously with the 'active' part of the composition wherein the non-active part clearly interacts with the delivered nucleic acid the non-active part being non-polymeric
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K48/00Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy
    • A61K48/005Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy characterised by an aspect of the 'active' part of the composition delivered, i.e. the nucleic acid delivered
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K48/00Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy
    • A61K48/005Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy characterised by an aspect of the 'active' part of the composition delivered, i.e. the nucleic acid delivered
    • A61K48/0066Manipulation of the nucleic acid to modify its expression pattern, e.g. enhance its duration of expression, achieved by the presence of particular introns in the delivered nucleic acid
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K9/00Medicinal preparations characterised by special physical form
    • A61K9/0012Galenical forms characterised by the site of application
    • A61K9/0019Injectable compositions; Intramuscular, intravenous, arterial, subcutaneous administration; Compositions to be administered through the skin in an invasive manner
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P1/00Drugs for disorders of the alimentary tract or the digestive system
    • A61P1/16Drugs for disorders of the alimentary tract or the digestive system for liver or gallbladder disorders, e.g. hepatoprotective agents, cholagogues, litholytics
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P25/00Drugs for disorders of the nervous system
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P7/00Drugs for disorders of the blood or the extracellular fluid
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P7/00Drugs for disorders of the blood or the extracellular fluid
    • A61P7/04Antihaemorrhagics; Procoagulants; Haemostatic agents; Antifibrinolytic agents
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/745Blood coagulation or fibrinolysis factors
    • C07K14/755Factors VIII, e.g. factor VIII C (AHF), factor VIII Ag (VWF)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N7/00Viruses; Bacteriophages; Compositions thereof; Preparation or purification thereof
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01KANIMAL HUSBANDRY; CARE OF BIRDS, FISHES, INSECTS; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
    • A01K2227/00Animals characterised by species
    • A01K2227/10Mammal
    • A01K2227/105Murine
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01KANIMAL HUSBANDRY; CARE OF BIRDS, FISHES, INSECTS; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
    • A01K2267/00Animals characterised by purpose
    • A01K2267/03Animal model, e.g. for test or diseases
    • A01K2267/0306Animal model for genetic diseases
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/30Non-immunoglobulin-derived peptide or protein having an immunoglobulin constant or Fc region, or a fragment thereof, attached thereto
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/31Fusion polypeptide fusions, other than Fc, for prolonged plasma life, e.g. albumin
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2750/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssDNA viruses
    • C12N2750/00011Details
    • C12N2750/14011Parvoviridae
    • C12N2750/14041Use of virus, viral particle or viral elements as a vector
    • C12N2750/14043Use of virus, viral particle or viral elements as a vector viral genome or elements thereof as genetic vector
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2750/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssDNA viruses
    • C12N2750/00011Details
    • C12N2750/14011Parvoviridae
    • C12N2750/14111Dependovirus, e.g. adenoassociated viruses
    • C12N2750/14141Use of virus, viral particle or viral elements as a vector
    • C12N2750/14143Use of virus, viral particle or viral elements as a vector viral genome or elements thereof as genetic vector
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2750/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssDNA viruses
    • C12N2750/00011Details
    • C12N2750/14011Parvoviridae
    • C12N2750/14111Dependovirus, e.g. adenoassociated viruses
    • C12N2750/14171Demonstrated in vivo effect
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2750/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssDNA viruses
    • C12N2750/00011Details
    • C12N2750/14011Parvoviridae
    • C12N2750/14211Erythrovirus, e.g. B19 virus
    • C12N2750/14241Use of virus, viral particle or viral elements as a vector
    • C12N2750/14243Use of virus, viral particle or viral elements as a vector viral genome or elements thereof as genetic vector
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2750/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssDNA viruses
    • C12N2750/00011Details
    • C12N2750/14011Parvoviridae
    • C12N2750/14311Parvovirus, e.g. minute virus of mice
    • C12N2750/14341Use of virus, viral particle or viral elements as a vector
    • C12N2750/14343Use of virus, viral particle or viral elements as a vector viral genome or elements thereof as genetic vector
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2750/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssDNA viruses
    • C12N2750/00011Details
    • C12N2750/14011Parvoviridae
    • C12N2750/14311Parvovirus, e.g. minute virus of mice
    • C12N2750/14371Demonstrated in vivo effect
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2830/00Vector systems having a special element relevant for transcription
    • C12N2830/42Vector systems having a special element relevant for transcription being an intron or intervening sequence for splicing and/or stability of RNA
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2830/00Vector systems having a special element relevant for transcription
    • C12N2830/50Vector systems having a special element relevant for transcription regulating RNA stability, not being an intron, e.g. poly A signal

Abstract

MOLÉCULAS DE ÁCIDO NUCLEICO E USOS DAS MESMAS PARA TERAPIA GENÉTICA NÃO VIRAL. A presente invenção apresenta moléculas de ácido nucleico compreendendo uma primeira repetição terminal invertida (ITR), uma segunda ITR, e um cassete genético codificando uma sequência alvo. Em algumas modalidades, a sequência alvo codifica um miRNA e/ou uma proteína terapêutica. Em certas modalidades, a proteína terapêutica compreende um fator de coagulação, um fator de crescimento, um hormônio, uma citocina, um citocina, um fragmento da mesma, e uma combinação dos mesmos. Em algumas modalidades, a primeira ITR e/ou a segunda ITR é uma ITR de um vírus não adeno-associado (AAV). A presente invenção também apresenta métodos para o tratamento de um distúrbio metabólico do fígado em um indivíduo compreendendo administrar ao indivíduo a molécula de ácido nucleico ou um polipeptídio codificado pela mesma.

Description

Relatório Descritivo da Patente de Invenção para "MOLÉ- CULAS DE ÁCIDO NUCLEICO E USOS DAS MESMAS PARA TE- RAPIA GENÉTICA NÃO VIRAL". Pedidos Relacionados
[001] Este pedido reivindica prioridade para o Pedido de Patente Provisória US Série N° 62/716.826, depositado em 9 de agosto de 2018, cuja íntegra encontra-se aqui incorporada a título de referência.
REFERÊNCIA À LISTAGEM DE SEQUÊNCIAS APRESENTADA POR VIA ELETRÔNICA
[002] O conteúdo da listagem de sequências apresentada por via eletrônica no arquivo de texto ASCII (Nome: SA9-465PC_SL_ST25.txt; Tamanho: 460,648 bytes; e Data de Criação: 8 de agosto de 2019) aqui incorporado em sua íntegra a título de referência.
ANTECEDENTES DA INVENÇÃO
[003] A terapia genética oferece o potencial de ser um meio du- radouro para o tratamento de uma variedade de doenças. No passado, muitos tratamentos por terapia genética dependiam tipicamente do uso de vírus. Existem numerosos agentes virais que poderiam ser selecio- nados para este fim, cada um deles com propriedades diferentes que fazem deles mais ou menos adequados para terapia genética. Zhou et al., Adv Drug Deliv Rev. 106(Pt A):3-26, 2016. Entretanto, as proprie- dades indesejadas de alguns agentes virais, incluindo seu perfil imu- nogenético ou sua tendência a causar câncer, resultaram em preocu- pações de segurança clínica e, até recentemente, limitavam seu uso clínico a determinadas aplicações, por exemplo, vacinas e estratégias oncolíticas. Cotter et al., Front Biosci. 10:1098-105 (2005).
[004] O vírus adeno-associado (AAV) é um dos vetores mais co- mumente investigados para terapia genética. O AAV é um envoltório proteico que envolve e protege um genoma de DNA de cordão simples e pequeno de aproximadamente 4,8 quilobases (kb). Naso et al., Bio-
Drugs, 31(4): 317-334, 2017. O AAV pertence à família dos parvovírus e depende de co-infecção com outros vírus, principalmente adenoví- rus, para replicar. Id. Seu genoma de cordão simples contém três ge- nes, Rep (Replicação), Cap (Capsídeo), e aap (Montagem). Id. Estas sequências codificadoras são flanqueadas por repetições terminais invertidas (ITRs) que são necessárias para a replicação e acondicio- namento do genoma. Id. As duas AAV ITRs cis-atuantes possuem aproximadamente 145 nucleotídeos de comprimento com sequências palindrômicas interrompidas que podem se dobrar formando estruturas do tipo grampo de cabelo em forma de T que funcionam como inicia- dores durante a iniciação da replicação do DNA.
[005] No entanto, o uso de AAV convencional como um vetor de distribuição de genes apresenta certos inconvenientes. Um dos maio- res inconvenientes está associado à capacidade limitada de acondici- onamento viral do AAV de cerca de 4,5 kb de DNA heterólogo. (Dong et al., Hum Gene Ther. 7(17): 2101-12, 1996). Além disso, a adminis- tração de vetores de AAV pode induzir uma resposta imunológica nos seres humanos. Embora o AAV tenha se mostrado menos imunogené- tico que alguns outros vírus (i.e., adenovírus), as proteínas capsídicas podem desencadear vários componentes do sistema imunológico hu- mano. Vide Naso et al., 2017. O AAV é um vírus comum na população humana, e a maioria das pessoas já foi exposta ao AAV, por conse- guinte, a maioria das pessoas já desenvolveu uma resposta imunoló- gica contra as variantes específicas às quais elas foram anteriormente expostas. Esta resposta adaptativa pré-existente pode incluir anticor- pos neutralizantes (NAbs) e células T que poderiam diminuir a eficácia clínica de reinfecções subsequentes por AAV e/ou a eliminação das células que foram transduzidas, o que pode desqualificar pacientes com imunidade anti-AAV pré-existente para tratamento por terapia ge- nética à base de AVV. Além disso, as evidências sugerem que as al-
ças do tipo grampo de cabelo em forma de T das AAV ITRs são susce- tíveis à inibição por proteínas/complexos de proteínas da célula hos- pedeira que se ligam às estruturas do tipo grampo de cabelo em forma de T das AAV ITRs. Vide, por exemplo, Zhou et al., Scientific Reports 7:5432 (July 14, 2017).
[006] Assim sendo, faz-se necessário no estado da técnica ex- pressar de forma eficiente e persistente sequências alvo, por exemplo, proteínas terapêuticas e/ou miRNAs, em cenários in vitro e in vivo, evi- tando ao mesmo tempo algumas das consequências indesejadas e limitações da tecnologia de vetores de AAV existente. Sumário da Invenção
[007] Em certos aspectos, é apresentada uma molécula de ácido nucleico compreendendo uma primeira repetição terminal invertida (ITR) e uma segunda ITR flanqueando um cassete genético compre- endendo uma sequência de polinucleotídeos heterólogos, onde a pri- meira ITR e/ou a segunda ITR compreende uma sequência de nucleo- tídeos pelo menos cerca de 75%, pelo menos cerca de 80%, pelo me- nos cerca de 85%, pelo menos cerca de 90%, pelo menos cerca de 95%, pelo menos cerca de 96%, pelo menos cerca de 97%, pelo me- nos cerca de 98%, pelo menos cerca de 99%, ou 100% idêntica a uma sequência de nucleotídeos apresentada na SEQ ID NO: 180, 181, 183, 184, 185, 186, 187 ou 188, ou um derivado funcional da mesma.
[008] Em certas modalidades exemplificativas, a primeira ITR compreende a sequência de nucleotídeos apresentada na SEQ ID NO: 180 e a segunda ITR compreende a sequência de nucleotídeos apre- sentada na SEQ ID NO: 181. Em certas modalidades exemplificativas, a primeira ITR compreende a sequência de nucleotídeos apresentada na SEQ ID NO: 183 e a segunda ITR compreende a sequência de nu- cleotídeos apresentada na SEQ ID NO: 184. Em certas modalidades exemplificativas, a primeira ITR compreende a sequência de nucleotí-
deos apresentada na SEQ ID NO: 185 e a segunda ITR compreende a sequência de nucleotídeos apresentada na SEQ ID NO: 186. Em cer- tas modalidades exemplificativas, a primeira ITR compreende a se- quência de nucleotídeos apresentada na SEQ ID NO: 187 e a segunda ITR compreende a sequência de nucleotídeos apresentada na SEQ ID NO: 188.
[009] Em certas modalidades exemplificativas, a primeira ITR e/ou a segunda ITR consiste em uma sequência de nucleotídeos apre- sentada na SEQ ID NO: 180, 181, 183, 184, 185, 186, 187 ou 188. Em certas modalidades exemplificativas, a primeira ITR e a segunda ITR são complementos reversos uma da outra.
[0010] Em certas modalidades exemplificativas, a molécula de áci- do nucleico compreende ainda a promoter. Em certas modalidades exemplificativas, o promotor é um promotor tecido-específico. Em cer- tas modalidades exemplificativas, o promotor induz a expressão da sequência de polinucleotídeos heterólogos em um órgão selecionado dentre músculo, sistema nervoso central (SNC), olho, fígado, coração, rim, pâncreas, pulmão, pele, bexiga, trato urinário, ou qualquer combi- nação dos mesmos. Em certas modalidades exemplificativas, o promo- tor induz a expressão da sequência de polinucleotídeos heterólogos em hepatócitos, células endoteliais, células do músculo cardíaco, célu- las do músculo esquelético, células sinusoidais, neurônios aferentes, neurônios eferentes, células gliais, astrócitos, oligodendrócitos, micró- glia, células ependimárias, células epiteliais pulmonares, células de Schwann, células satélites, células fotorreceptoras, células gangliona- res retinianas, ou qualquer combinação das mesmas. Em certas mo- dalidades exemplificativas, o promotor está posicionado 5’ em relação à sequência de polinucleotídeos heterólogos. Em certas modalidades exemplificativas, o promotor é selecionado do grupo que consiste em um promotor de tiretina de camundongo (mTTR), um promotor de fator
VIII humano endógeno (F8), um promotor de alfa-1-antitripsina huma- na (hAAT), um promotor mínimo de albumina humana, um promotor de albumina de camundongo, um promotor de tristetraprolina (TTP), um promotor de CASI, um promotor de CAG, um promotor de citomegalo- vírus (CMV), α1-antitripsina (AAT), creatina quinase muscular (MCK), cadeia pesada alfa de miosina (αMHC), mioglobina (MB), desmina (DES), SPc5-12, 2R5Sc5-12, dMCK, tMCK, e um promotor de fosfogli- cerato quinase (PGK).
[0011] Em certas modalidades exemplificativas, a sequência de polinucleotídeos heterólogos compreende ainda uma sequência intrô- nica. Em certas modalidades exemplificativas, a sequência intrônica está posicionada 5’ em relação à sequência de polinucleotídeos hete- rólogos. Em certas modalidades exemplificativas, a sequência intrôni- ca está posicionada 3' em relação ao promotor. Em certas modalida- des exemplificativas, a sequência intrônica compreende uma sequên- cia intrônica sintética. Em certas modalidades exemplificativas, a se- quência intrônica compreende a SEQ ID NO: 115 ou 192.
[0012] Em certas modalidades exemplificativas, o cassete genético compreende ainda um elemento regulador pós-transcricional. Em cer- tas modalidades exemplificativas, o elemento regulador pós- transcricional está posicionado 3' em relação à sequência de polinu- cleotídeos heterólogos. Em certas modalidades exemplificativas, o elemento regulador pós-transcricional compreende um elemento regu- lador pós-transcricional do vírus da hepatite de marmota mutado (WPRE), um sítio de ligação a microRNA, uma sequência direcionado- ra de DNA nuclear, ou qualquer combinação dos mesmos. Em certas modalidades exemplificativas, o sítio de ligação a microRNA compre- ende um sítio de ligação ao miR142-3p.
[0013] Em certas modalidades exemplificativas, o cassete genético compreende ainda uma sequência de cauda de 3’UTR poli(A). Em cer-
tas modalidades exemplificativas, a sequência de cauda de 3’UTR po- li(A) é selecionada do grupo que consiste em bGH poli(A), actina po- li(A), hemoglobina poli(A), e qualquer combinação das mesmas. Em certas modalidades exemplificativas, a sequência de cauda de 3’UTR poli(A) compreende bGH poli(A).
[0014] Em certas modalidades exemplificativas, o cassete genético compreende ainda uma sequência melhoradora. Em certas modalida- des exemplificativas, a sequência melhoradora está posicionada entre a primeira ITR e a segunda ITR.
[0015] Em certas modalidades exemplificativas, a molécula de áci- do nucleico compreende de 5’ para 3’: a primeira ITR, o cassete gené- tico, e a segunda ITR; onde o cassete genético compreende uma se- quência promotora tecido-específica , uma sequência intrônica, a se- quência de polinucleotídeos heterólogos, um elemento regulador pós- transcricional, e uma sequência de cauda de 3’UTR poli(A). Em certas modalidades exemplificativas, o cassete genético compreende de 5’ para 3’: uma sequência promotora tecido-específica , uma sequência intrônica, a sequência de polinucleotídeos heterólogos, um elemento regulador pós-transcricional, e uma sequência de cauda de 3’UTR po- li(A). Em certas modalidades exemplificativas, a sequência promotora tecido-específica compreende um promotor TTT; o íntron é um íntron sintético; o elemento regulador pós-transcricional compreende WPRE; e a sequência de cauda de 3’UTR poli(A) compreende bGHpA.
[0016] Em certas modalidades exemplificativas, o cassete genético compreende um ácido nucleico de cordão simples. Em certas modali- dades exemplificativas, o cassete genético compreende um ácido nu- cleico de cordão duplo.
[0017] Em certas modalidades exemplificativas, a sequência de polinucleotídeos heterólogos codifica um fator de coagulação, um fator de crescimento, um hormônio, uma citocina, um anticorpo, um frag-
mento do mesmo, ou qualquer combinação das mesmas.
[0018] Em certas modalidades exemplificativas, a sequência de polinucleotídeos heterólogos codifica um fator de crescimento selecio- nado do grupo que consiste em adrenomedulina (AM), angiopoietina (Ang), fator de motilidade endócrina, um proteína morfogenética óssea (BMP) (por exemplo, BMP2, BMP4, BMP5, BMP7), um membro da família de fatores neurotróficos ciliares (por exemplo, fator neurotrófico ciliar (CNTF), fator inibitório de leucemia (LIF), interleucina-6 (IL-6)), um fator estimulante de colônias (por exemplo, fator estimulante de colônias de macrófagos (m-CSF), fator estimulante de colônias de granulócitos (G-CSF), fator estimulante de colônias de granulócitos e macrófagos (GM-CSF)), um fator de crescimento epidérmico (EGF), uma efrina (por exemplo, efrina A1, efrina A2, efrina A3, efrina A4, efri- na A5, efrina B1, efrina B2, efrina B3), eritropoietina (EPO), um fator de crescimento de fibroblastos (FGF) (por exemplo, FGF1, FGF2, FGF3, FGF4, FGF5, FGF6, FGF7, FGF8, FGF9, FGF10, FGF11, FGF12, FGF13, FGF14, FGF15, FGF16, FGF17, FGF18, FGF19, FGF20, FGF21, FGF22, FGF23), somatotrofina bovina fetal (FBS), um membro da família de GDNF (por exemplo, fator neurotrófico derivado da linhagem de células gliais (GDNF), neurturina, persefina, artemina), fator de diferenciação de crescimento tipo 9 (GDF9), fator de cresci- mento de hepatócitos (HGF), fator de crescimento derivado de hepa- toma (HDGF), insulina, fatores de crescimento semelhantes à insulina (por exemplo, fator de crescimento semelhante à insulina tipo 1 (IGF- 1) ou IGF-2, uma interleucina (IL) (por exemplo, IL-1, IL-2, IL-3, IL-4, IL-5, IL-6, IL-7), fator de crescimento de queratinóticos (KGF), fator es- timulante de migração (MSF), proteína estimulante de macrófagos (MSP ou proteína semelhante ao fator de crescimento de hepatócitos (HGFLP)), miostatina (GDF-8), uma neuregulina (por exemplo, neure- gulina 1 (NRG1), NRG2, NRG3, NRG4), uma neurotropina (por exem-
plo, fator neurotrófico derivado do cérebro (BDNF), fator de crescimen- to nervoso (NGF), uma neurotrofina-3 (NT-3), NT-4, fator de cresci- mento placentário (PGF), fator de crescimento de derivados plaquetá- rios (PDGF), renalase (RNLS), fator de crescimento de células T (TCGF), trombopoietina (TPO), um fator de transformação do cresci- mento (por exemplo, fator de transformação do crescimento alfalpha (TGF-α), TGF-β, fator de necrose tumoral alfa (TNF-α), e fator de cres- cimento endotelial vascular (VEGF), e qualquer combinação dos mesmos.
[0019] Em certas modalidades exemplificativas, a sequência de polinucleotídeos heterólogos codifica um hormônio.
[0020] Em certas modalidades exemplificativas, a sequência de polinucleotídeos heterólogos codifica uma citocina.
[0021] Em certas modalidades exemplificativas, a sequência de polinucleotídeos heterólogos codifica um anticorpo ou um fragmento do mesmo.
[0022] Em certas modalidades exemplificativas, a sequência de polinucleotídeos heterólogos codifica um gene selecionado dentre dis- trofina ligada ao X, MTM1 (miotubularina), tirosina hidroxilase, AADC, ciclo-hidrolase, SMN1, FXN (frataxina), GUCY2D, RS1, CFH, HTRA, ARMS, CFB/CC2, CNGA/CNGB, Prf65, ARSA, PSAP, IDUA (MPS I), IDS (MPS II), PAH, GAA (alfa-glicosidase ácida), e qualquer combina- ção dos mesmos.
[0023] Em certas modalidades exemplificativas, a sequência de polinucleotídeos heterólogos codifica um microRNA (miRNA). Em cer- tas modalidades exemplificativas, o miRNA infra-regula a expressão de um gene alvo selecionado dentre SOD1, HTT, RHO, e qualquer combinação dos mesmos.
[0024] Em certas modalidades exemplificativas, a sequência de polinucleotídeos heterólogos codifica um fator de coagulação selecio-
nado do grupo que consiste em fator I (FI), fator II (FII), fator III (FIII), fator IV (FVI), fator V (FV), fator VI (FVI), fator VII (FVII), fator VIII (FVIII), fator IX (FIX), fator X (FX), fator XI (FXI), fator XII (FXII), fator XIII (FVIII), fator de Von Willebrand (VWF), precalicreína, cininogênio de alto peso molecular, fibronectina, antitrombina III, cofator de hepari- na tipo II, proteína C, proteína S, proteína Z, inibidor da protease rela- cionada à Proteína Z (ZPI), plasminogênio, 2-antiplasmina alfa, ativa- dor de plasminogênio tecidual (tPA), uroquinase, inibidor-1 de ativador de plasminogênio (PAI-1), inibidor-2 de ativador de plasminogênio (PAI2), e qualquer combinação dos mesmos.
[0025] Em certas modalidades exemplificativas, o fator de coagu- lação é FVIII. Em certas modalidades exemplificativas, o FVIII com- preende FVIII maduro de comprimento total. Em certas modalidades exemplificativas, o FVIII compreende uma sequência de aminoácidos pelo menos cerca de 70%, pelo menos cerca de 75%, pelo menos cer- ca de 80%, pelo menos cerca de 85%, pelo menos cerca de 90%, pelo menos cerca de 95%, pelo menos cerca de 96%, pelo menos cerca de 97%, pelo menos cerca de 98%, pelo menos cerca de 99%, ou 100% idêntica a uma sequência de aminoácidos tendo a SEQ ID NO: 106.
[0026] Em certas modalidades exemplificativas, o FVIII compreen- de domínio A1, domínio A2, domínio A3, domínio C1, domínio C2, e um domínio B parcial ou nenhum domínio B. Em certas modalidades exemplificativas, o FVIII compreende uma sequência de aminoácidos pelo menos cerca de 70%, pelo menos cerca de 75%, pelo menos cer- ca de 80%, pelo menos cerca de 85%, pelo menos cerca de 90%, pelo menos cerca de 95%, pelo menos cerca de 96%, pelo menos cerca de 97%, pelo menos cerca de 98%, pelo menos cerca de 99%, ou 100% idêntica à sequência de aminoácidos de SEQ ID NO:109.
[0027] Em certas modalidades exemplificativas, o fator de coagu- lação compreende uma porção heteróloga. Em certas modalidades exemplificativas, a porção heteróloga é selecionada do grupo que con- siste em albumina ou um fragmento da mesma, uma região Fc de imunoglobulina, o peptídio C-terminal (CTP) da subunidade β da go- nadotropina coriônica humana, uma sequência de PAS, uma sequên- cia de HAP, uma transferrina ou um fragmento da mesma, uma porção de ligação à albumina, um derivado da mesma, ou qualquer combina- ção das mesmas. Em certas modalidades exemplificativas, a porção heteróloga é ligada ao terminal N ou ao terminal C do FVIII ou inserida entre dois aminoácidos no FVIII. Em certas modalidades exemplificati- vas, a porção heteróloga é inserida entre dois aminoácidos em um ou mais sítios de inserção selecionados dentre os sítios de inserção rela- cionados na Tabela 4.
[0028] Em certas modalidades exemplificativas, o FVIII compreen- de ainda domínio A1, domínio A2, domínio C1, domínio C2, um domí- nio B opcional, e uma porção heteróloga, onde a porção heteróloga é inserida imediatamente a jusante do aminoácido 745 correspondente ao FVIII maduro (SEQ ID NO:106).
[0029] Em certas modalidades exemplificativas, o FVIII compreen- de ainda um parceiro de ligação ao FcRn. Em certas modalidades exemplificativas, o parceiro de ligação ao FcRn compreende uma regi- ão Fc de um domínio constante de imunoglobulina.
[0030] Em certas modalidades exemplificativas, a sequência de ácidos nucleicos codificando o FVIII é códon-otimizada. Em certas modalidades exemplificativas, a sequência de ácidos nucleicos codifi- cando o FVIII é códon-otimizada para expressão em um ser humano.
[0031] Em certas modalidades exemplificativas, a sequência de ácidos nucleicos codificando o FVIII compreende uma sequência de nucleotídeos pelo menos cerca de 60%, pelo menos cerca de 65%, pelo menos cerca de 70%, pelo menos cerca de 75%, pelo menos cer- ca de 80%, pelo menos cerca de 85%, pelo menos cerca de 90%, pelo menos cerca de 95%, pelo menos cerca de 96%, pelo menos cerca de 97%, pelo menos cerca de 98%, pelo menos cerca de 99%, ou cerca de 100% idêntica a uma sequência de nucleotídeos de SEQ ID NO:
107.
[0032] Em certas modalidades exemplificativas, a sequência de ácidos nucleicos codificando o FVIII compreende uma sequência de nucleotídeos pelo menos cerca de 60%, pelo menos cerca de 65%, pelo menos cerca de 70%, pelo menos cerca de 75%, pelo menos cer- ca de 80%, pelo menos cerca de 85%, pelo menos cerca de 90%, pelo menos cerca de 95%, pelo menos cerca de 96%, pelo menos cerca de 97%, pelo menos cerca de 98%, pelo menos cerca de 99%, ou cerca de 100% idêntica à sequência de nucleotídeos de SEQ ID NO: 71. Em certas modalidades exemplificativas, a sequência de polinucleotí- deos heterólogos é códon-otimizada. Em certas modalidades exempli- ficativas, a sequência de polinucleotídeos heterólogos é códon- otimizada para expressão em um ser humano.
[0033] Em certas modalidades exemplificativas, a molécula de áci- do nucleico é formulada com um agente de distribuição. Em certas modalidades exemplificativas, o agente de distribuição compreende uma nanopartícula lipídica. Em certas modalidades exemplificativas, o agente de distribuição é selecionado do grupo que consiste em lipos- somas, moléculas poliméricas não lipídicas, e endossomas, e qualquer combinação dos mesmos.
[0034] Em certas modalidades exemplificativas, a molécula de áci- do nucleico é formulada para distribuição intravenosa, transdérmica, intradérmica, subcutânea, pulmonar, ou oral, ou qualquer combinação das mesmas. Em certas modalidades exemplificativas, a molécula de ácido nucleico é formulada para administração intravenosa.
[0035] Em certos aspectos, é apresentado um vetor compreen- dendo uma molécula de ácido nucleico descrita neste pedido.
[0036] Em certos aspectos, é apresentada uma célula hospedeira compreendendo uma molécula de ácido nucleico descrita neste pedi- do.
[0037] Em certos aspectos, é apresentada uma composição far- macêutica compreendendo uma molécula de ácido nucleico ou um ve- tor descrito neste pedido, e um excipiente farmaceuticamente aceitá- vel.
[0038] Em certos aspectos, é apresentada uma composição far- macêutica compreendendo uma célula hospedeira descrita neste pe- dido, e um excipiente farmaceuticamente aceitável.
[0039] Em certos aspectos, é apresentado um kit, compreendendo uma molécula de ácido nucleico descrita neste pedido, e instruções de administração da molécula de ácido nucleico a um indivíduo com ne- cessidade da mesma.
[0040] Em certos aspectos, é apresentado um sistema de baculo- vírus para a produção de uma molécula de ácido nucleico descrita neste pedido.
[0041] Em certas modalidades exemplificativas, uma molécula de ácido nucleico descrita neste pedido é produzida em células de inseto.
[0042] Em certos aspectos, é apresentado um sistema de distru- buição de nanopartículas compreendendo uma molécula de ácido nu- cleico descrita neste pedido.
[0043] Em certos aspectos, é apresentado um método para a pro- dução de um polipeptídio, compreendendo cultivar uma célula hospe- deira descrita neste pedido em condições adequadas e recuperar o polipeptídio.
[0044] Em certos aspectos, é apresentado um método para a pro- dução de um polipeptídio com atividade coagulante, compreendendo: cultivar uma célula hospedeira descrita neste pedido em condições adequadas e recuperar o polipeptídio com atividade coagulante.
[0045] Em certos aspectos, é apresentado um método para a ex- pressão de uma sequência de polinucleotídeos heterólogos em um indivíduo com necessidade do mesmo, compreendendo administrar ao indivíduo uma molécula de ácido nucleico descrita neste pedido, um vetor descrito neste pedido, ou uma composição farmacêutica descrita neste pedido.
[0046] Em certos aspectos, é apresentado um método para a ex- pressão de um fator de coagulação em um indivíduo com necessidade do mesmo, compreendendo administrar ao indivíduo uma molécula de ácido nucleico descrita neste pedido, um vetor descrito neste pedido, um polipeptídio descrito neste pedido, ou uma composição farmacêuti- ca descrita neste pedido.
[0047] Em certos aspectos, é apresentado um método para o tra- tamento de uma doença ou distúrbio em um indivíduo com necessida- de do mesmo, compreendendo administrar ao indivíduo uma molécula de ácido nucleico descrita neste pedido, um vetor descrito neste pedi- do, ou uma composição farmacêutica descrita neste pedido.
[0048] Em certos aspectos, é apresentado um método para o tra- tamento de um indivíduo com uma deficiência de fator de coagulação, compreendendo administrar ao indivíduo uma molécula de ácido nu- cleico descrita neste pedido, um vetor descrito neste pedido, um poli- peptídio descrito neste pedido, ou uma composição farmacêutica des- crita neste pedido.
[0049] Em certos aspectos, é apresentado um método para o tra- tamento de uma deficiência de fator de coagulação em um indivíduo com necessidade do mesmo, compreendendo administrar ao indivíduo uma molécula de ácido nucleico descrita neste pedido, um vetor des- crito neste pedido, um polipeptídio descrito neste pedido, ou uma composição farmacêutica descrita neste pedido.
[0050] Em certas modalidades exemplificativas, a molécula de áci-
do nucleico é administrada por via intravenosa, transdérmica, intra- dérmica, subcutânea, oral, pulmonar, ou qualquer combinação das mesmas. Em certas modalidades exemplificativas, a molécula de ácido nucleico é administrada por via intravenosa.
[0051] Em certas modalidades exemplificativas, o método compre- ende ainda administrar ao indivíduo um segundo agente.
[0052] Em certas modalidades exemplificativas, o indivíduo é um mamífero. Em certas modalidades exemplificativas, o indivíduo é um ser humano.
[0053] Em certas modalidades exemplificativas, a administração da molécula de ácido nucleico ao indivíduo resulta em uma atividade aumentada de FVIII em relação a uma atividade de FVIII no indivíduo antes da administração, onde a atividade de FVIII é aumentada em pelo menos cerca de 2 vezes, pelo menos cerca de 3 vezes, pelo me- nos cerca de 4 vezes, pelo menos cerca de 5 vezes, pelo menos cerca de 6 vezes, pelo menos cerca de 7 vezes, pelo menos cerca de 8 ve- zes, pelo menos cerca de 9 vezes, pelo menos cerca de 10 vezes, pe- lo menos cerca de 11 vezes, pelo menos cerca de 12 vezes, pelo me- nos cerca de 13 vezes, pelo menos cerca de 14 vezes, pelo menos cerca de 15 vezes, pelo menos cerca de 20 vezes, pelo menos cerca de 25 vezes, pelo menos cerca de 30 vezes, pelo menos cerca de 35 vezes, pelo menos cerca de 40 vezes, pelo menos cerca de 50 vezes, pelo menos cerca de 60 vezes, pelo menos cerca de 70 vezes, pelo menos cerca de 80 vezes, pelo menos cerca de 90 vezes, ou pelo me- nos cerca de 100 vezes.
[0054] Em certas modalidades exemplificativas, o indivíduo tem um distúrbio hemorrágico. Em certas modalidades exemplificativas, o distúrbio hemorrágico é uma hemofilia. Em certas modalidades exem- plificativas, o distúrbio hemorrágico é hemofilia A.
[0055] Em certos aspectos, é apresentado um método para o tra-
tamento de um distúrbio hemorrágico em um indivíduo com necessi- dade do mesmo, compreendendo administrar ao indivíduo uma molé- cula de ácido nucleico compreendendo uma primeira repetição termi- nal invertida (ITR) e uma segunda ITR flanqueando um cassete gené- tico compreendendo uma sequência de polinucleotídeos heterólogos codificando um fator de coagulação, onde a primeira ITR e/ou a se- gunda ITR compreende uma sequência de nucleotídeos pelo menos cerca de 75%, pelo menos cerca de 80%, pelo menos cerca de 85%, pelo menos cerca de 90%, pelo menos cerca de 95%, pelo menos cer- ca de 96%, pelo menos cerca de 97%, pelo menos cerca de 98%, pelo menos cerca de 99%, ou 100% idêntica a uma sequência de nucleotí- deos apresentada na SEQ ID NO: 180, 181, 183, 184, 185, 186, 187 ou 188, ou um derivado funcional da mesma.
[0056] Em certos aspectos, é apresentado um método para o tra- tamento de hemofilia A em um indivíduo com necessidade do mesmo, compreendendo administrar ao indivíduo uma molécula de ácido nu- cleico compreendendo uma primeira repetição terminal invertida (ITR) e uma segunda ITR flanqueando um cassete genético compreendendo uma sequência de polinucleotídeos heterólogos codificando o VIII (FVIII), onde a primeira ITR e/ou a segunda ITR compreende uma se- quência de nucleotídeos pelo menos cerca de 75%, pelo menos cerca de 80%, pelo menos cerca de 85%, pelo menos cerca de 90%, pelo menos cerca de 95%, pelo menos cerca de 96%, pelo menos cerca de 97%, pelo menos cerca de 98%, pelo menos cerca de 99%, ou 100% idêntica a uma sequência de nucleotídeos apresentada na SEQ ID NO: 180, 181, 183, 184, 185, 186, 187 ou 188, ou um derivado funcio- nal da mesma.
[0057] Em certos aspectos, é apresentado um método para o tra- tamento de um distúrbio metabólico do fígado em um indivíduo com necessidade do mesmo, compreendendo administrar ao indivíduo uma molécula de ácido nucleico compreendendo uma primeira repetição terminal invertida (ITR) e uma segunda ITR flanqueando um cassete genético compreendendo uma sequência de polinucleotídeos heteró- logos codificando uma enzima metabólica associada ao fígado que é deficiente no indivíduo, onde a primeira ITR e/ou a segunda ITR são uma ITR de um vírus não adeno-associado (não-AAV).
[0058] Em certas modalidades exemplificativas, a primeira ITR e/ou a segunda ITR compreende uma sequência de nucleotídeos pelo menos cerca de 75%, pelo menos cerca de 80%, pelo menos cerca de 85%, pelo menos cerca de 90%, pelo menos cerca de 95%, pelo me- nos cerca de 96%, pelo menos cerca de 97%, pelo menos cerca de 98%, pelo menos cerca de 99%, ou 100% idêntica a uma sequência de nucleotídeos apresentada na SEQ ID NO: 180, 181, 183, 184, 185, 186, 187 ou 188, ou um derivado funcional da mesma.
[0059] Em certos aspectos, é apresentado um método para o tra- tamento de um distúrbio metabólico do fígado em um indivíduo com necessidade do mesmo, compreendendo administrar ao indivíduo uma molécula de ácido nucleico compreendendo uma primeira repetição terminal invertida (ITR) e uma segunda ITR flanqueando um cassete genético compreendendo uma sequência de polinucleotídeos heteró- logos codificando uma enzima metabólica associada ao fígado que é deficiente no indivíduo, onde a primeira ITR e/ou a segunda ITR com- preende uma sequência de nucleotídeos pelo menos cerca de 75%, pelo menos cerca de 80%, pelo menos cerca de 85%, pelo menos cer- ca de 90%, pelo menos cerca de 95%, pelo menos cerca de 96%, pelo menos cerca de 97%, pelo menos cerca de 98%, pelo menos cerca de 99%, ou 100% idêntica a uma sequência de nucleotídeos apresentada na SEQ ID NO: 180, 181, 183, 184, 185, 186, 187 ou 188, ou um deri- vado funcional da mesma.
[0060] Em certas modalidades exemplificativas, o cassete genético compreende um ácido nucleico de cordão simples. Em certas modali- dades exemplificativas, o cassete genético compreende um ácido nu- cleico de cordão duplo.
[0061] Em certas modalidades exemplificativas, o distúrbio meta- bólico do fígado é selecionado do grupo que consiste em fenilcetonúria (PKU), uma doença do ciclo da ureia, um distúrbio de armazenamento lisossômico, e uma doença de armazenamento de glicogênio. Em cer- tas modalidades exemplificativas, o distúrbio metabólico do fígado é fenilcetonúria (PKU).
[0062] Em certas modalidades exemplificativas, a molécula de áci- do nucleico é administrada por via intravenosa, transdérmica, intra- dérmica, subcutânea, oral, pulmonar, ou qualquer combinação das mesmas. Em certas modalidades exemplificativas, a molécula de ácido nucleico é administrada por via intravenosa.
[0063] Em certas modalidades exemplificativas, o método compre- ende ainda administrar ao indivíduo um segundo agente.
[0064] Em certas modalidades exemplificativas, o indivíduo é um mamífero. Em certas modalidades exemplificativas, o indivíduo é um ser humano.
[0065] Em certos aspectos, é apresentado um método para o tra- tamento de fenilcetonúria (PKU) em um indivíduo com necessidade do mesmo, compreendendo administrar ao indivíduo uma molécula de ácido nucleico compreendendo uma primeira repetição terminal inver- tida (ITR) e uma segunda ITR flanqueando um cassete genético com- preendendo uma sequência de polinucleotídeos heterólogos codifican- do fenilalanina hidroxilase, onde a primeira ITR e/ou a segunda ITR compreende uma sequência de nucleotídeos pelo menos cerca de 75%, pelo menos cerca de 80%, pelo menos cerca de 85%, pelo me- nos cerca de 90%, pelo menos cerca de 95%, pelo menos cerca de 96%, pelo menos cerca de 97%, pelo menos cerca de 98%, pelo me-
nos cerca de 99%, ou 100% idêntica a uma sequência de nucleotídeos apresentada na SEQ ID NO: 180, 181, 183, 184, 185, 186, 187 ou 188, ou um derivado funcional da mesma.
[0066] Em certas modalidades exemplificativas, o cassete genético compreende um ácido nucleico de cordão simples. Em certas modali- dades exemplificativas, o cassete genético compreende um ácido nu- cleico de cordão duplo.
[0067] Em certas modalidades exemplificativas, a molécula de áci- do nucleico é formulada com um agente de distribuição. Em certas modalidades exemplificativas, o agente de distribuição compreende uma nanopartícula lipídica.
[0068] Em certos aspectos, é apresentado um método para a clo- nagem de uma molécula de ácido nucleico, compreendendo inserir uma molécula de ácido nucleico capaz de complexar estruturas se- cundárias em um vetor adequado, e introduzir o vetor resultante em uma cepa hospedeira bacteriana compreendendo uma ruptura no complexo SbcCD.
[0069] Em certas modalidades exemplificativas, a ruptura no com- plexo SbcCD compreende uma ruptura genética no gene SbcC e/ou no gene SbcD. Em certas modalidades exemplificativas, a ruptura no complexo SbcCD compreende uma ruptura genética no gene SbcC. Em certas modalidades exemplificativas, a ruptura no complexo SbcCD compreende uma ruptura genética no gene SbcD.
[0070] Em certas modalidades exemplificativas, a molécula de áci- do nucleico compreende uma primeira repetição terminal invertida (ITR) e uma segunda ITR, onde a primeira e/ou a segunda ITR é uma ITR de vírus não-adeno-associado (não-AAV).
[0071] Em certas modalidades exemplificativas, a primeira ITR e/ou a segunda ITR compreende uma sequência de nucleotídeos pelo menos cerca de 75%, pelo menos cerca de 80%, pelo menos cerca de
85%, pelo menos cerca de 90%, pelo menos cerca de 95%, pelo me- nos cerca de 96%, pelo menos cerca de 97%, pelo menos cerca de 98%, pelo menos cerca de 99%, ou 100% idêntica a uma sequência de nucleotídeos apresentada na SEQ ID NO: 180, 181, 183, 184, 185, 186, 187 ou 188, ou um derivado funcional da mesma.
[0072] Em certas modalidades exemplificativas, a molécula de áci- do nucleico compreende ainda um cassete genético, onde o cassete genético é flanqueado pela primeira ITR e pela segunda ITR.
[0073] Em certas modalidades exemplificativas, o cassete genético compreende uma sequência de polinucleotídeos heterólogos.
[0074] Em certas modalidades exemplificativas, o vetor adequado é um vetor de poucas cópias. Em certas modalidades exemplificativas, o vetor adequado é pBR322.
[0075] Em certas modalidades exemplificativas, a cepa hospedeira bacteriana é incapaz de resolver estruturas de DNA cruciformes.
[0076] Em certas modalidades exemplificativas, a cepa hospedeira bacteriana é PMC103, compreendendo o genótipo sbcC, recD, mcrA, ΔmcrBCF. Em certas modalidades exemplificativas, a cepa hospedeira bacteriana é PMC107, compreendendo o genótipo recBC, recJ, sbcBC, mcrA, ΔmcrBCF. Em certas modalidades exemplificativas, a cepa hospedeira bacteriana é SURE, compreendendo o genótipo recB, recJ, sbcC, mcrA, ΔmcrBCF, umuC, uvrC.
[0077] Em certos aspectos, é apresentado um método para a clo- nagem de uma molécula de ácido nucleico, compreendendo inserir uma molécula de ácido nucleico capaz de complexar estruturas se- cundárias em um vetor adequado, e introduzir o vetor resultante em uma cepa hospedeira bacteriana compreendendo uma ruptura no complexo SbcCD, onde a molécula de ácido nucleico compreende uma primeira repetição terminal invertida (ITR) e uma segunda ITR, onde a primeira ITR e/ou a segunda ITR compreende uma sequência de nucleotídeos pelo menos cerca de 75%, pelo menos cerca de 80%, pelo menos cerca de 85%, pelo menos cerca de 90%, pelo menos cer- ca de 95%, pelo menos cerca de 96%, pelo menos cerca de 97%, pelo menos cerca de 98%, pelo menos cerca de 99%, ou 100% idêntica a uma sequência de nucleotídeos apresentada na SEQ ID NO: 180, 181, 183, 184, 185, 186, 187 ou 188, ou um derivado funcional da mesma. Breve Descrição dos Desenhos
[0078] As FIG. 1A-1B são representações esquemáticas de um cassete de expressão de fator de coagulação de cordão simples (por exemplo, FVIII). As localizações da 5' ITR a partir de um não-AAV (com alça do tipo grampo de cabelo na extremidade da estrutura de ssDNA), 3' ITR a partir de um não-AAV (com alça do tipo grampo de cabelo), uma sequência promotora (por exemplo, TTPp ou CAGp), e uma sequência transgênica, por exemplo, uma sequência de FVIIIco6XTEN com um XTEN144 inserido no domínio B estão mostra- das. Os cassetes de expressão exemplificativos também mostram elementos adicionais possíveis, por exemplo, uma sequência de ín- trons, a sequência WPREmut, e a sequência bGHpA.
[0079] As FIGs. 1C-1F são representações esquemáticas de plasmídeos usados para preparar cassetes de expressão do fator de coagulação de cordão simples, tal como o cassete mostrado na FIG. 1A-1B, onde as ITRs do cassete são derivadas de AAV2 (FIG. 1C), B19 (FIG. 1D), GPV (FIG. 1E), ou são a sequência de B19 ITR do tipo selvagem (FIG. 1F). Um construto de plasmídeo compreendendo um cassete de expressão de ssFVIII como o mostrado neste pedido foi digerido com PvuII (nos sítios PvuII) (FIG. 1C) ou com LguI (nos sítios LguI) (FIGs. 1D-1F) para liberar de forma precisa a sequência com- preendendo as ITRs e o cassete de expressão. O DNA de cordão du- plo foi desnaturado termicamente a 95°C para produzir ssDNA e em seguida incubado a 4°C para possibilitar a formação da estrutura de
ITR.
[0080] A FIG. 2A é uma árvore filogenética ilustrando que as rela- ções entre os vários membros da família dos parvovírus. B19, AAV-2, e GPV estão assinadas pelas caixas apresentadas.
[0081] A FIG. 2B é um desenho esquemático dos vários cassetes, incluindo as estruturas do tipo grampo de cabelo.
[0082] As FIGs. 3A e 3B são alinhamentos das ITRs de B19, GPV, e AAV2 (FIG. 3A) e B19 e GPV (FIG. 3B). O sombreado cinza mostra homologia.
[0083] As FIGs. 4A-4C mostra a atividade plasmática do FVIII subsequente à administração de FVIII-DNA nu de cordão simples de AAV (ssAAV-FVIII; FIG. 1C), ssDNA-B19 FVIII (FIG. 1D), ou ssDNA- GPV FVIII (FIG. 1E) via injeção hidrodinâmica (HDI) em camundongos com Hem A. A atividade do FVIII foi medida (como uma percentagem dos níveis fisiológicos normais em seres humanos) em amostras de plasma depois de 24 horas, 3 dias, 2 semanas, 3 semanas, 1 mês, 2 meses, 3 meses, 4 meses, 5 meses e 6 meses de camundongos tra- tados com uma única HDI de ssDNA a 50 µg/camundongo (FIG. 4C), 20 µg/camundongo (FIGs. 4A and 4B), 10 µg/camundongo (FIGs. 4A, 4B, and 4C), ou 5 µg/camundongo (FIG. 4A). Uma HDI de 5 µg/camundongo de DNA plasmídico foi dada como um controle (FIGs. 4A, 4B, e 4C).
[0084] A FIG. 5 mostra a atividade do FVIII no plasma de camun- dongos com hemofilia A subsequente a uma única injeção hidrodinâ- mica de quantidades molares iguais de DNA nu de cordão simples (ssAAV-FVIII, FIG. 1A), AAV-FVIII DNA de cordão duplo contendo a sequência de ITR (dsDNA), FVIII DNA de cordão duplo sem a sequên- cia de ITR (dsDNA No ITR), ou FVIII DNA de cordão duplo circulariza- do sem sequências de ITR ou bacterianas (minicírculo). dsDNA foi ge- rado por clivagem enzimática do plasmídeo de AAV-FVIII (FIG. 2C)
com PvuII mas não termicamente desnaturado. dsDNA No foi gerado por clivagem enzimática do plasmídeo de AAV-FVIII (FIG. 2C) com AflII e subsequentemente purificado. DNA minicircular foi gerado por ligação do dsDNA No ITR DNA em sítios AflII. O plasma dos camun- dongos foi coletado ao longo de 3 meses ou 4 meses e o FVIII foi de- terminado pelo ensaio cromogenético de atividade.
[0085] A FIG. 6 mostra a atividade do FVIII no plasma de camun- dongos com hemofilia A subsequente a uma injeção hidrodinâmica de 30 µg de FVIII-DNA nu de cordão simples (FIG. 1A, FIGs. 1D-1F). Plasma foi coletado uma vez por semana durante 7 semanas e a ativi- dade do FVIII foi determinada pelo ensaio cromogenético, depois de 35 dias (representado por uma seta preta), os camundongos que re- ceberam FVIII-B19d135 e FVIII-GPVd162 ssDNA receberam mais uma vez 30 µg via injeção hidrodiâmica.
[0086] A FIG. 7A é uma representação esquemática de um casse- te de expressão de fenilalanina hidroxilase murina de cordão simples (por exemplo, PAH). As localizações da 5' ITR a partir de um não-AAV (com alça do tipo grampo de cabelo na extremidade da estrutura de ssDNA), 3' ITR a partir de um não-AAV (com alça do tipo grampo de cabelo), uma sequência promotora (por exemplo, CAGp), e uma se- quência transgênica, por exemplo, a sequência de 3xFLAG_mPAH estão mostradas. Os cassetes de expressão exemplificativos também mostram elementos adicionais possíveis, por exemplo, a sequência de WPREmut, e a sequência de bGHpA.
[0087] As FIGs. 7B-7D mostram concentrações plasmáticas de fenilalanina (Phe) em camundongos com fenilcetonúria (PKU) antes (dia 0) e depois de uma única administração de DNA de cordão sim- ples contendo o PAH cDNA murino e as não-AAV ITRs B19d135 ou GPVd162 via injeção hidrodinâmica. Plasma foi coletado nos dias 3, 7, 14, 28, 42, e 56 depois da administração de ssDNA. Os níveis de feni-
lalanina residual estão mostrados como concentração em µg/ml (FIGs. 7B-7C) ou como percentagem antes da administração (FIG.7D). A li- nha horizontal representa os níveis basais de Phe antes da adminis- tração.
[0088] A FIG. 7E mostra uma análise da mancha ocidental de lisa- dos hepáticos de camundongos com PKU tratados com ssDNA con- tendo o transgene PAH murino e ou B19d135 ou GPVd165 ITRs. Os fígados foram coletados no dia 81 após o tratamento e lisados protei- cos foram extraídos. Cada compartimento representa um único animal. A proteína PAH murina marcada com FLAG foi detectada através do uso do anticorpo anti-FLAG M2 e um controle de carga de GAPDH foi incluído para comparação.
[0089] As FIGs. 8A-B os níveis de atividade do FVIII no sobrena- dante de células Huh7 subsequente à transdução com nanopartículas lipídicas encapsuladas em FVIII-AAV DNA (FIGs. 1A-1C). FVIII-AAV plasmídico sob o promtor CAGp (FIG. 1B) foi encapsulado a três ra- zões de amina para fosfato (NP) e aplicado a células Huh7 em várias concentrações determinadas pelo ensaio picogreen (FIG 8A). Plasmí- deo, AAV-FVIII linear de cordão duplo (ds), e AAV-FVIII de cordão simples (ss) sob o promotor TTPp (FIG 1A) também foram encapsula- dos em nanopartículas lipídicas em duas razões de NP e usados para transduzir células Huh7 em várias concentrações de DNA (FIG. 8B). FVIII foi medido pelo ensaio cromogenético de atividade e comparados com um padrão de plasma FACT humano. Descrição Detalhada da Invenção
[0090] A presente invenção descreve moléculas de ácido nucleico semelhantes a plasmídeos compreendendo uma primeira repetição terminal invertida (ITR), uma segunda ITR, e um cassete genético, por exemplo, codificando uma sequência alvo (neste pedido também de- nominada sequência de polinucleotídeos heterólogos), por exemplo,
uma proteína terapêutica ou um miRNA, onde a primeira ITR e/ou a segunda ITR são uma ITR de um vírus não adeno-associado (por exemplo, a primeira ITR e/ou a segunda ITR são de um não-AAV). Em algumas modalidades, o cassete genético codifica uma proteína tera- pêutica, por exemplo, a sequência alvo codifica uma proteína terapêu- tica. Em algumas modalidades, a proteína terapêutica compreende uma proteína selecionada dentre um fator de coagulação, um fator de crescimento, um hormônio, uma citocina, um anticorpo, um fragmento do mesmo, ou uma combinação dos mesmos. Em algumas modalida- des, o cassete genético codifica distrofina ligada ao X, MTM1 (miotu- bularina), tirosina hidroxilase, AADC, ciclo-hidrolase, SMN1, FXN (fra- taxina), GUCY2D, RS1, CFH, HTRA, ARMS, CFB/CC2, CNGA/CNGB, Prf65, ARSA, PSAP, IDUA (MPS I), IDS (MPS II), PAH, GAA (alfa- glicosidase ácida), e qualquer combinação dos mesmos.
[0091] Em algumas modalidades, a proteína terapêutica compre- ende um fator de coagulação. Em uma modalidade particular, a proteí- na terapêutica compreende um FVIII ou uma proteína FIX.
[0092] Em algumas modalidades, o cassete genético codifica um miRNA. Em certas modalidades, o miRNA infra-regula a expressão de um gene alvo selecionado dentre SOD1, HTT, RHO, ou qualquer com- binação dos mesmos.
[0093] Em certas modalidades, o não-AAV é selecionado do grupo que consiste em um membro da família viral Parvoviridae e qualquer combinação dos mesmos. A presente invenção está voltada ainda pa- ra métodos para a expressão de uma proteína terapêutica, por exem- plo, um fator de coagulação, por exemplo, um FVIII, em um indivíduo com necessidade do mesmo, compreendendo administrar ao indivíduo uma molécula de ácido nucleico compreendendo uma primeira repeti- ção terminal invertida (ITR), uma segunda ITR, e um cassete genético, por exemplo, codificando uma proteína terapêutica ou um miRNA, on-
de a primeira ITR e/ou a segunda ITR são uma ITR de um vírus não adeno-associado (não-AAV). Em certas modalidades, a invenção des- creve uma molécula de ácido nucleico isolada compreendendo uma sequência de nucleotídeos, que apresenta homologia de sequência para uma sequência de nucleotídeos selecionada dentre as SEQ ID NOs: 113 e 120.
[0094] Em certas modalidades, a presente invenção apresenta moléculas de ácido nucleico compreendendo uma primeira repetição terminal invertida (ITR) e uma segunda ITR flanqueando um cassete genético compreendendo uma sequência de polinucleotídeos heteró- logos, onde a primeira e/ou a segunda ITR é derivada do parvovíirus B19 ou do parvovírus de ganso (GPV).
[0095] Construtos exemplificativos da invenção estão ilustrados nas figuras e na listagem de sequências que acompanham este pedi- do. Para uma compreensão clara do relatório descritivo e das reivindi- cações, abaixo estão apresentadas as seguintes definições. I. Definições
[0096] Deve-se observado que o termo "um" ou "uma" entidade refere-se a uma ou mais daquela entidade: por exemplo, entende-se que "uma sequência de nucleotídeo" representa uma ou mais sequên- cias de nucleotídeos. De maneira similar, entende-se que "uma proteí- na terapêutica" e "um miRNA" representa uma ou mais proteínas tera- pêuticas e um ou mais miRNA, respectivamente. Assim sendo, os ter- mos "um" (ou "uma), "um ou mais", e "pelo menos um" podem ser usados intercambiavelmente neste pedido.
[0097] O termo "cerca de" é usado neste pedido para indicar apro- ximadamente, grosseiramente, em torno de, ou próximo de. Quando o termo "cerca de" é usado junto com uma faixa numérica, ele modifica aquela faixa ampliando os limites acima e abaixo dos valores numéri- cos apresentados. Em geral, o termo "cerca de" é usado neste pedido para modificar um valor numérico acima e abaixo do valor estipulado por uma variação de 10 por cento, para mais ou para menos (maior ou menor).
[0098] Também conforme usado neste pedido, "e/ou" refere-se e abrange toda e qualquer combinação possível de um ou mais dos ter- mos listados associados, assim como a falta de combinações quando interpretado na alternativa ("ou").
[0099] "Ácidos nucleicos", "moléculas de ácido nucleico", "nucleo- tídeos", "sequências de nucleotídeos", e "polinucleotídeo" são usados intercabiavelmente e referem-se à forma polimérica éster de fosfato de ribonucleosídeos (adenosina, guanosina, uridina ou citidina; "molécu- las de RNA") ou desoxirribonucleosídeos (desoxiadenosina, desoxi- guanosina, desoxitimidina, ou desoxicitidina; "moléculas de DNA"), ou quaisquer análogos to tipo fosfoéster dos mesmos, tais como fosforoti- oatos e tioésteres, seja na forma de cordão simples ou na forma de hélice dupla. Sequências de ácidos nucleicos de cordão simples refe- rem-se a DNA de cordão simples (ssDNA) ou a RNA de cordão sim- ples (ssRNA). Hélices de DNA-DNA, DNA-RNA e RNA-RNA de cordão duplo são possíveis. O termo molécula de ácido nucleico, em particular molécula de DNA ou de RNA, refere-se apenas à estrutura primária e secundária da molécula, e não limitada a mesma a qualquer forma ter- ciária em particular. Assim sendo, este termo inclui DNA de cordão duplo encontrado, inter alia, em moléculas de DNA lineares ou circula- res (por exemplo, fragmentos de restrição), plasmídeos, DNA superen- rolado e cromossomas. Na discussão da estrutura de moléculas de DNA de cordão duplo particulares, as sequências podem ser aqui des- critas de acordo com a convenção normal de apresentar apenas a se- quência na direção 5’ para 3’ ao longo do cordão de DNA não transcri- to (i.e., o cordão tendo uma sequência homóloga ao mRNA). Uma "molécula de DNA recombinante" é uma molécula de DNA que sofreu uma manipulação biológica molecular. DNA inclui, porém sem limita- ção, cDNA, DNA genômico, DNA plasmídico, DNA sintético, e DNA semi-sintético. Uma "composição de ácido nucleico" da invenção com- preende um ou mais ácidos nucleicos descritos neste pedido.
[00100] Conforme usado neste pedido, uma "repetição terminal in- vertida" (ou "ITR") refere-se a uma sequência de ácidos nucleicos lo- calizada na extremidade 5' ou 3' de uma sequência de ácidos nuclei- cos de cordão simples, que compreende um conjunto de nucleotídeos (sequência inicial) seguido a jusante por complemento reverso, i.e., sequência palindrômica. A sequências de nucleotídeos interveniente entre a sequência inicial e o complemento reverso pode ter qualquer comprimento inclusive zero. Em uma modalidade, a ITR útil para a presente invenção compreende uma ou mais "sequências palindrômi- cas". Uma ITR pode ter qualquer número de funções. Em algumas modalidades, uma ITR descrita neste pedido forma uma estrutura do tipo grampo de cabelo. Em algumas modalidades, a ITR forma uma estrutura do tipo grampo de cabelo em forma de T. Em algumas moda- lidades, a ITR forma uma estrutura do tipo grampo de cabelo em forma diferente de T, por exemplo, uma estrutura do tipo grampo de cabelo em forma de U. Em algumas modalidades, a ITR promove a sobrevi- vência de longo prazo da molécula de ácido nucleico no núcleo de uma célula. Em algumas modalidades, a ITR promove a sobrevivência permanente da molécula de ácido nucleico no núcleo de uma célula (por exemplo, por toda a vida da célula). Em algumas modalidades, a ITR promove a estabilidade da molécula de ácido nucleico no núcleo de uma célula. Em algumas modalidades, a ITR promove a retenção da molécula de ácido nucleico no núcleo de uma célula. Em algumas modalidades, a ITR promove a persistência da molécula de ácido nu- cleico no núcleo de uma célula. Em algumas modalidades, a ITR inibe ou previne a degradação da molécula de ácido nucleico no núcleo de uma célula.
[00101] Em uma modalidade, a sequência inicial e/ou o comple- mento reverso compreendem cerca de 2-600 nucleotídeos, cerca de 2- 550 nucleotídeos, cerca de 2-500 nucleotídeos, cerca de 2-450 nucleo- tídeos, cerca de 2-400 nucleotídeos, cerca de 2-350 nucleotídeos, cer- ca de 2-300 nucleotídeos, ou cerca de 2-250 nucleotídeos. Em algu- mas modalidades, a sequência inicial e/ou o complemento reverso compreendem cerca de 5-600 nucleotídeos, cerca de 10-600 nucleotí- deos, cerca de 15-600 nucleotídeos, cerca de 20-600 nucleotídeos, cerca de 25-600 nucleotídeos, cerca de 30-600 nucleotídeos, cerca de 35-600 nucleotídeos, cerca de 40-600 nucleotídeos, cerca de 45-600 nucleotídeos, cerca de 50-600 nucleotídeos, cerca de 60-600 nucleotí- deos, cerca de 70-600 nucleotídeos, cerca de 80-600 nucleotídeos, cerca de 90-600 nucleotídeos, cerca de 100-600 nucleotídeos, cerca de 150-600 nucleotídeos, cerca de 200-600 nucleotídeos, cerca de 300-600 nucleotídeos, cerca de 350-600 nucleotídeos, cerca de 400- 600 nucleotídeos, cerca de 450-600 nucleotídeos, cerca de 500-600 nucleotídeos, ou cerca de 550-600 nucleotídeos. Em algumas modali- dades, a sequência inicial e/ou o complemento reverso compreendem cerca de 5-550 nucleotídeos, cerca de 5 to 500 nucleotídeos, cerca de 5-450 nucleotídeos, cerca de 5 to 400 nucleotídeos, cerca de 5-350 nucleotídeos, cerca de 5 to 300 nucleotídeos, ou cerca de 5-250 nu- cleotídeos. Em algumas modalidades, a sequência inicial e/ou o com- plemento reverso compreendem cerca de 10-550 nucleotídeos, cerca de 15-500 nucleotídeos, cerca de 20-450 nucleotídeos, cerca de 25- 400 nucleotídeos, cerca de 30-350 nucleotídeos, cerca de 35-300 nu- cleotídeos, ou cerca de 40-250 nucleotídeos. Em certas modalidades, a sequência inicial e/ou o complemento reverso compreendem cerca de 225 nucleotídeos, cerca de 250 nucleotídeos, cerca de 275 nucleo- tídeos, cerca de 300 nucleotídeos, cerca de 325 nucleotídeos, cerca de 350 nucleotídeos, cerca de 375 nucleotídeos, cerca de 400 nucleo- tídeos, cerca de 425 nucleotídeos, cerca de 450 nucleotídeos, cerca de 475 nucleotídeos, cerca de 500 nucleotídeos, cerca de 525 nucleo- tídeos, cerca de 550 nucleotídeos, cerca de 575 nucleotídeos, ou cer- ca de 600 nucleotídeos. Em modalidades particulares, a sequência inicial e/ou o complemento reverso compreendem cerca de 400 nucle- otídeos.
[00102] Em outras modalidades, a sequência inicial e/ou o comple- mento reverso compreendem cerca de 2-200 nucleotídeos, cerca de 5- 200 nucleotídeos, cerca de 10-200 nucleotídeos, cerca de 20-200 nu- cleotídeos, cerca de 30-200 nucleotídeos, cerca de 40-200 nucleotí- deos, cerca de 50-200 nucleotídeos, cerca de 60-200 nucleotídeos, cerca de 70-200 nucleotídeos, cerca de 80-200 nucleotídeos, cerca de 90-200 nucleotídeos, cerca de 100-200 nucleotídeos, cerca de 125- 200 nucleotídeos, cerca de 150-200 nucleotídeos, ou cerca de 175- 200 nucleotídeos. Em outras modalidades, a sequência inicial e/ou o complemento reverso compreendem cerca de 2-150 nucleotídeos, cerca de 5-150 nucleotídeos, cerca de 10-150 nucleotídeos, cerca de 20-150 nucleotídeos, cerca de 30-150 nucleotídeos, cerca de 40-150 nucleotídeos, cerca de 50-150 nucleotídeos, cerca de 75-150 nucleotí- deos, cerca de 100-150 nucleotídeos, ou cerca de 125-150 nucleotí- deos. Em outras modalidades, a sequência inicial e/ou o complemento reverso compreendem cerca de 2-100 nucleotídeos, cerca de 5-100 nucleotídeos, cerca de 10-100 nucleotídeos, cerca de 20-100 nucleotí- deos, cerca de 30-100 nucleotídeos, cerca de 40-100 nucleotídeos, cerca de 50-100 nucleotídeos, ou cerca de 75-100 nucleotídeos. Em outras modalidades, a sequência inicial e/ou o complemento reverso compreendem cerca de 2-50 nucleotídeos, cerca de 10-50 nucleotí- deos, cerca de 20-50 nucleotídeos, cerca de 30-50 nucleotídeos, cerca de 40-50 nucleotídeos, cerca de 3-30 nucleotídeos, cerca de 4-20 nu-
cleotídeos, ou cerca de 5-10 nucleotídeos. Em uma outra modalidade, a sequência inicial e/ou o complemento reverso consistem em dois nu- cleotídeos, três nucleotídeos, quatro nucleotídeos, cinco nucleotídeos, seis nucleotídeos, sete nucleotídeos, oito nucleotídeos, nove nucleotí- deos, dez nucleotídeos, 11 nucleotídeos, 12 nucleotídeos, 13 nucleotí- deos, 14 nucleotídeos, 15 nucleotídeos, 16 nucleotídeos, 17 nucleotí- deos, 18 nucleotídeos, 19 nucleotídeos, ou 20 nucleotídeos. Em outras modalidades, um nucleotídeo interveniente entre a sequência inicial ou o complemento reverso tem (por exemplo, consiste em) 0 nucleotídeo, 1 nucleotídeo, dois nucleotídeos, três nucleotídeos, quatro nucleotí- deos, cinco nucleotídeos, seis nucleotídeos, sete nucleotídeos, oito nucleotídeos, nove nucleotídeos, 10 nucleotídeos, 11 nucleotídeos, 12 nucleotídeos, 13 nucleotídeos, 14 nucleotídeos, 15 nucleotídeos, 16 nucleotídeos, 17 nucleotídeos, 18 nucleotídeos, 19 nucleotídeos, ou 20 nucleotídeos.
[00103] Portanto, uma "ITR" conforme usado neste pedido pode dobrar-se sobre si mesma e formar um segmento de cordão duplo. Por exemplo, a sequência GATCXXXXGATC compreende uma sequência inicial de GATC e seu complemento (3'CTAG5') quando dobrada para formar uma hélice dupla. Em algumas modalidades, a ITR compreen- de uma sequência palindrômica continua (por exemplo, GATCGATC) entre a sequência inicial e o complemento reverso. Em algumas moda- lidades, a ITR compreende uma sequência palindrômica interrompida (por exemplo, GATCXXXXGATC) entre a sequência inicial e o com- plemento reverso. Em algumas modalidades, as seções de comple- mentaridade da sequência palindrômica contínua ou interrompida inte- ragem entre si para formar uma estrutura do tipo "alça de grampo de cabelo". Conforme usado neste pedido, uma estrutura do tipo "alça de grampo de cabelo" é o resultado de quando pelo menos duas sequên- cias complementares em uma molécula de nucleotídeo de cordão pa-
reiam bases para formar uma seção de cordão duplo. Em algumas modalidades, apenas uma prte da ITR forma uma alça de grampo de cabelo. Em outras modalidades, a ITR inteira forma uma alça de grampo de cabelo.
[00104] Na presente invenção, pelo menos one ITR é uma ITR de um vírus não associado ao adenovírus (não-AAV). Em certas modali- dades, a ITR é uma ITR de membro não-AAV da família viral Parvo- viridae. Em algumas modalidades, a ITR é uma ITR de um membro não-AAV do gênero Dependovirus ou do gênero Erythrovirus. Em mo- dalidades particulares, a ITR é uma ITR de um parvovírus de ganso (GPV), um parvovírus de pato-do-mato (MDPV), ou um eritrovírus par- vovírus B19 (também conhecido como parvovírus B19, eritroparvovírus de primata 1, vírus B19, e eritrovírus). Em certas modalidades, uma ITR de duas ITRs é uma ITR de um AAV. Em outras modalidades, uma ITR de duas ITRs no construto é uma ITR de um sorotipo de AAV selecionado dentre os sorotipos 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11 e qual- quer combinação dos mesmos. Em uma modalidade particular, a ITR é derivada de AAV sorotipo 2, por exemplo, uma ITR de AAV sorotipo 2.
[00105] Em certos aspectos da presente invenção, a molécula de ácido nucleico molecule compreende duas ITRs, uma 5' ITR e uma 3' ITR, onde a 5' ITR fica localizada no terminal 5' da molécula de ácido nucleico, e a 3' ITR fica localizada no terminal 3' da molécula de ácido nucleico. A 5' ITR e a 3' ITR podem ser derivadas do mesmo vírus ou de virus diferentes. Em certas modalidades, a 5' ITR é derivada de um AAV e a 3' ITR não é derivada de um AAV (por exemplo, um não- AAV). Em algumas modalidades, a 3' ITR é derivada de um AAV e a 5' ITR não é derivada de um AAV (por exemplo, um não-AAV). Em ou- tras modalidades, a 5' ITR não é derivada de um AAV (por exemplo, um não-AAV), e a 3' ITR é derivada do mesmo não-AAV ou de um não-AAV diferente.
[00106] O termo "parvovírus" conforme usado neste pedido abrange a família Parvoviridae, incluindo, porém sem limitação, parvovírus e Dependovírus de replicação autônoma. Os parvorírus autônomos in- cluem, por exemplo, membros dos gêneros Bocavirus, Dependovirus, Erythrovirus, Amdovirus, Parvovirus, Densovirus, Iteravirus, Contravi- rus, Aveparvovirus, Copiparvovirus, Protoparvovirus, Tetraparvovirus, Ambidensovirus, Brevidensovirus, Hepandensovirus, e Penstyldensovi- rus.
[00107] Parvorírus autônomos exemplificativos incluem, porém sem limitação, parvorírus procinos, vírus minuto de camundongos, parvorí- rus caninos, vírus da enterite de visões, parvorírus bovineos, parvorí- rus de galinhas, vírus da panleucopenia felina, parvorírus felino, parvo- rírus de ganso, parvorírus H1, parvorírus do pato-do-mato, parvorírus de cobra, e vírus B19. Outros parvorírus autônomos são conhecidos pelos especialistas na técnica. Vide, por exemplo, FIELDS et al. VI- ROLOGY, volume 2, chapter 69 (4th ed., Lippincott-Raven Publishers).
[00108] O termo "não-AAV" conforme usado neste pedido abrange ácidos nucleicos, proteínas, e vírus da família Parvoviridae à exclusão de qualquer vírus adeno-associado (AAV) da família Parvoviridae. "Não-AAV" inclui, porém sem limitação, membros de replicação autô- noma dos gêneros Bocavirus, Dependovirus, Erythrovirus, Amdovirus, Parvovirus, Densovirus, Iteravirus, Contravirus, Aveparvovirus, Copi- parvovirus, Protoparvovirus, Tetraparvovirus, Ambidensovirus, Brevi- densovirus, Hepandensovirus, e Penstyldensovirus.
[00109] Conforme usado neste pedido, o termo "vírus adeno- associado" (AAV), inclui, porém sem limitação, AAV tipo 1, AAV tipo 2, AAV tipo 3 (inclusive os tipos 3A e 3B), AAV tipo 4, AAV tipo 5, AAV tipo 6, AAV tipo 7, AAV tipo 8, AAV tipo 9, AAV tipo 10, AAV tipo 11, AAV tipo 12, AAV tipo 13, AAV de cobra, AAV aviário, AAV bovino, AAV canino, AAV equino, AAV ovino, AAV de cabra, AAV de camarão,
os sorotipos e clados de AAV revelados por Gao et al. (J. Virol. 78:6381 (2004)) e Moris et al. (Virol. 33:375 (2004)), e qualquer outro AAV já conhecido ou posteriormente descoberto. Vide, por exemplo, FIELDS et al. VIROLOGY, volume 2, chapter 69 (4th ed., Lippincott- Raven Publishers).
[00110] O termo "derivado de", conforme usado neste pedido, refe- re-se a um componente que é isolado de uma molécula ou organismo específico ou usando o mesmo, ou a informações (por exemplo, se- quência de aminoácidos ou sequências de ácidos nucleicos) da molé- cula ou organismos específico. Por exemplo, uma sequência de ácidos nucleicos (por exemplo, ITR) que é derivada de uma segunda sequên- cia de ácidos nucleicos (por exemplo, ITR) pode incluir uma sequência de nucleotídeos que é idêntica ou substancialmente similar à sequên- cia de nucleotídeos da segunda sequência de ácidos nucleicos. No caso de nucleotídeos ou polipeptídios, a espécie derivada pode ser obtida por, por exemplo, mutagênese de ocorrência natural, mutagê- nese direcionada artificial ou mutagênese aleatória artificial. A muta- gênese usada para derivar nucleotídeos ou polipeptídios pode ser in- tencionalmente direcionada ou intencionalmente aleatória, ou uma mistura de cada. A mutagênese de um nucleotídeo ou polipeptídio pa- ra criar um nucleotídeo ou polipeptídio diferente derivado do primeiro pode ser um evento aleatório (por exemplo, causado por infidelidade da polimerase) e a identificação do nucleotídeo ou polipeptídio deriva- do pode ser feito por métodos de rastreamento adequados, por exem- plo, como discutidos neste pedido. A mutagênese de um polipeptídio tipicamente acarreta a manipulação do polinucleotídeo que codifica o polipeptídio. Em algumas modalidades, uma sequência de nucleotí- deos ou aminoácidos que é derivada de uma segunda sequência de nucleotídeos ou de aminoácidos tem uma identidade de sequência de pelo menos 50%, pelo menos 51%, pelo menos 52%, pelo menos
53%, pelo menos 54%, pelo menos 55%, pelo menos 56%, pelo me- nos 57%, pelo menos 58%, pelo menos 59%, pelo menos 60%, pelo menos 61%, pelo menos 62%, pelo menos 63%, pelo menos 64%, pe- lo menos 65%, pelo menos 66%, pelo menos 67%, pelo menos 68%, pelo menos 69%, pelo menos 70%, pelo menos 71%, pelo menos 72%, pelo menos 73%, pelo menos 74%, pelo menos 75%, pelo me- nos 76%, pelo menos 77%, pelo menos 78%, pelo menos 79%, pelo menos 80%, pelo menos 81%, pelo menos 82%, pelo menos 83%, pe- lo menos 84%, pelo menos 85%, pelo menos 86%, pelo menos 87%, pelo menos 88%, pelo menos 89%, pelo menos 90%, pelo menos 91%, pelo menos 92%, pelo menos 93%, pelo menos 94%, pelo me- nos 95%, pelo menos 96%, pelo menos 97%, pelo menos 98%, pelo menos 99%, ou 100% com a segunda sequência de nucleotídeos ou de aminoácidos, respectivamente, onde a primeira sequência de nu- cleotídeos ou de aminoácidos conserva a atividade biológica da se- gunda sequência de nucleotídeos ou de aminoácidos.
Em outras mo- dalidades, uma ITR derivada de uma ITR de um não-AVV (ou AAV) é pelo menos 90% idêntica à não-AAV ITR (ou AAV ITR, respectivamen- te), onde a não-AVV (ou AAV) ITR conserva uma propriedade funcio- nal da não-AAV ITR (ou AAV ITR, respectivamente). Em algumas mo- dalidades, uma ITR derivada de uma ITR de um não-AVV (ou AAV) é pelo menos 80% idêntica à não-AAV ITR (ou AAV ITR, respectivamen- te), onde a não-AVV (ou AAV) ITR conserva uma propriedade funcio- nal da não-AAV ITR (ou AAV ITR, respectivamente). Em algumas modalidades, uma ITR derivada de uma ITR de um não-AVV (ou AAV) é pelo menos 70% idêntica à não-AAV ITR (ou AAV ITR, respectiva- mente), onde a não-AVV (ou AAV) ITR conserva uma propriedade fun- cional da não-AAV ITR (ou AAV ITR, respectivamente). Em algumas modalidades, uma ITR derivada de uma ITR de um não-AVV (ou AAV) é pelo menos 60% idêntica à não-AAV ITR (ou AAV ITR, respectiva-
mente), onde a não-AVV (ou AAV) ITR conserva uma propriedade fun- cional da não-AAV ITR (ou AAV ITR, respectivamente). Em algumas modalidades, uma ITR derivada de uma ITR de um não-AVV (ou AAV) é pelo menos 50% idêntica à não-AAV ITR (ou AAV ITR, respectiva- mente), onde a não-AVV (ou AAV) ITR conserva uma propriedade fun- cional da não-AAV ITR (ou AAV ITR, respectivamente).
[00111] Em certas modalidades, uma ITR derivada de uma ITR de um não-AVV (ou AAV) compreende ou consiste em um fragmento da ITR do não-AVV (ou AAV). Em algumas modalidades, a ITR derivada de uma ITR de um não-AAV (ou AAV) compreende ou consiste em um fragmento da ITR do não-AVV (ou AAV), onde o fragmento compreen- de pelo menos cerca de 5 nucleotídeos, pelo menos cerca de 10 nu- cleotídeos, pelo menos cerca de 15 nucleotídeos, pelo menos cerca de 20 nucleotídeos, pelo menos cerca de 25 nucleotídeos, pelo menos cerca de 30 nucleotídeos, pelo menos cerca de 35 nucleotídeos, pelo menos cerca de 40 nucleotídeos, pelo menos cerca de 45 nucleotí- deos, pelo menos cerca de 50 nucleotídeos, pelo menos cerca de 55 nucleotídeos, pelo menos cerca de 60 nucleotídeos, pelo menos cerca de 65 nucleotídeos, pelo menos cerca de 70 nucleotídeos, pelo menos cerca de 75 nucleotídeos, pelo menos cerca de 80 nucleotídeos, pelo menos cerca de 85 nucleotídeos, pelo menos cerca de 90 nucleotí- deos, pelo menos cerca de 95 nucleotídeos, pelo menos cerca de 100 nucleotídeos, pelo menos cerca de 125 nucleotídeos, pelo menos cer- ca de 150 nucleotídeos, pelo menos cerca de 175 nucleotídeos, pelo menos cerca de 200 nucleotídeos, pelo menos cerca de 225 nucleotí- deos, pelo menos cerca de 250 nucleotídeos, pelo menos cerca de 275 nucleotídeos, pelo menos cerca de 300 nucleotídeos, pelo menos cerca de 325 nucleotídeos, pelo menos cerca de 350 nucleotídeos, pelo menos cerca de 375 nucleotídeos, pelo menos cerca de 400 nu- cleotídeos, pelo menos cerca de 425 nucleotídeos, pelo menos cerca de 450 nucleotídeos, pelo menos cerca de 475 nucleotídeos, pelo me- nos cerca de 500 nucleotídeos, pelo menos cerca de 525 nucleotí- deos, pelo menos cerca de 550 nucleotídeos, pelo menos cerca de 575 nucleotídeos, ou pelo menos cerca de 600 nucleotídeos; onde a ITR derivada de uma ITR de um não-AAV (ou AAV) conserva uma propriedade funcional da não-AAV ITR (ou AAV ITR, respectivamente). Em certas modalidades, a ITR derivada de uma ITR de um não-AAV (ou AAV) compreende ou consiste em um fragmento da ITR do não- AVV (ou AAV), onde o fragmento compreende pelo menos cerca de 129 nucleotídeos, e onde a ITR derivada de uma ITR de um não-AAV (ou AAV) conserva uma propriedade funcional da não-AAV ITR (ou AAV ITR, respectivamente). Em certas modalidades, a ITR derivada de uma ITR de um não-AAV (ou AAV) compreende ou consiste em um fragmento da ITR do não-AVV (ou AAV), onde o fragmento compreen- de pelo menos cerca de 102 nucleotídeos, e onde a ITR derivada de uma ITR de um não-AAV (ou AAV) conserva uma propriedade funcio- nal da não-AAV ITR (ou AAV ITR, respectivamente).
[00112] Em algumas modalidades, a ITR derivada de uma ITR de um não-AAV (ou AAV) compreende ou consiste em um fragmento da ITR do não-AVV (ou AAV), onde o fragmento compreende pelo menos cerca de 5%, pelo menos cerca de 10%, pelo menos cerca de 15%, pelo menos cerca de 20%, pelo menos cerca de 25%, pelo menos cer- ca de 30%, pelo menos cerca de 35%, pelo menos cerca de 40%, pelo menos cerca de 45%, pelo menos cerca de 50%, pelo menos cerca de 55%, pelo menos cerca de 60%, pelo menos cerca de 65%, pelo me- nos cerca de 70%, pelo menos cerca de 75%, pelo menos cerca de 80%, pelo menos cerca de 85%, pelo menos cerca de 90%, pelo me- nos cerca de 95%, pelo menos cerca de 96%, pelo menos cerca de 97%, pelo menos cerca de 98%, ou pelo menos cerca de 99% do comprimento da ITR do não-AVV (ou AAV).
[00113] Em certas modalidades, uma sequências de nucleotídeos ou de aminoácidos que é derivada de uma segunda sequência de nu- cleotídeos ou de aminoácidos tem uma identidade de sequência de pelo menos 50%, pelo menos 51%, pelo menos 52%, pelo menos 53%, pelo menos 54%, pelo menos 55%, pelo menos 56%, pelo me- nos 57%, pelo menos 58%, pelo menos 59%, pelo menos 60%, pelo menos 61%, pelo menos 62%, pelo menos 63%, pelo menos 64%, pe- lo menos 65%, pelo menos 66%, pelo menos 67%, pelo menos 68%, pelo menos 69%, pelo menos 70%, pelo menos 71%, pelo menos 72%, pelo menos 73%, pelo menos 74%, pelo menos 75%, pelo me- nos 76%, pelo menos 77%, pelo menos 78%, pelo menos 79%, pelo menos 80%, pelo menos 81%, pelo menos 82%, pelo menos 83%, pe- lo menos 84%, pelo menos 85%, pelo menos 86%, pelo menos 87%, pelo menos 88%, pelo menos 89%, pelo menos 90%, pelo menos 91%, pelo menos 92%, pelo menos 93%, pelo menos 94%, pelo me- nos 95%, pelo menos 96%, pelo menos 97%, pelo menos 98%, pelo menos 99%, ou 100% com uma porção homóloga da segunda se- quência de nucleotídeos ou de aminoácidos, respectivamente, quando alinhada de forma apropriada, onde a primeira sequência de nucleotí- deos ou de aminoácidos conserva a atividade biológica da segunda sequência de nucleotídeos ou de aminoácidos.
Em outras modalida- des, uma ITR derivada de uma ITR de um não-AVV (ou AAV) é pelo menos 90% idêntica a uma porção homóloga da não-AAV ITR (ou AAV ITR, respectivamente), quando alinhada de forma apropriada, on- de a primeira sequência de nucleotídeos ou de aminoácidos conserva a atividade biológica da segunda sequência de nucleotídeos ou de aminoácidos.
Em algumas modalidades, uma ITR derivada de uma ITR de um não-AVV (ou AAV) é pelo menos 80% idêntica a uma por- ção homóloga da não-AAV ITR (ou AAV ITR, respectivamente), quan- do alinhada de forma apropriada, onde a primeira sequência de nucle-
otídeos ou de aminoácidos conserva a atividade biológica da segunda sequência de nucleotídeos ou de aminoácidos. Em algumas modalida- des, uma ITR derivada de uma ITR de um não-AVV (ou AAV) é pelo menos 70% idêntica a uma porção homóloga da não-AAV ITR (ou AAV ITR, respectivamente), quando alinhada de forma apropriada, on- de a primeira sequência de nucleotídeos ou de aminoácidos conserva a atividade biológica da segunda sequência de nucleotídeos ou de aminoácidos. Em algumas modalidades, uma ITR derivada de uma ITR de um não-AVV (ou AAV) é pelo menos 60% idêntica a uma por- ção homóloga da não-AAV ITR (ou AAV ITR, respectivamente), quan- do alinhada de forma apropriada, onde a primeira sequência de nucle- otídeos ou de aminoácidos conserva a atividade biológica da segunda sequência de nucleotídeos ou de aminoácidos. Em algumas modalida- des, uma ITR derivada de uma ITR de um não-AVV (ou AAV) é pelo menos 50% idêntica a uma porção homóloga da não-AAV ITR (ou AAV ITR, respectivamente), quando alinhada de forma apropriada, on- de a primeira sequência de nucleotídeos ou de aminoácidos conserva a atividade biológica da segunda sequência de nucleotídeos ou de aminoácidos.
[00114] Um vetor ou molécula de ácido nucleico "livre de capsí- deos" ou "com menos capsídeos" refere-se a um construto vetorial li- vre de um capsídeo. Em algumas modalidades, o vetor ou molécula de ácido nucleico com menos capsídeos não contém sequências codifi- cando, por exemplo, uma proteína Rep do AAV.
[00115] Conforme usado neste pedido, uma "região codificadora" ou "sequência codificadora" é uma porção de polinucleotídeo que con- siste em códons passíveis de translação em aminoácidos. Embora um "códon de terminação" (TAG, TGA, ou TAA) tipicamente não seja transladado em um aminoácido, ele pode ser considerado parte de uma região codificadora, mas todas as sequências flanquedoras, por exemplo, promotores, sítios de ligação a ribossomas, terminadores de transcrição, íntrons, entre outros, não fazem parte de uma região codi- ficadora. Os limites de uma região codificadora são tipicamente deter- minados por um códon de início no terminal 5’, codificando o terminal amino do polipeptídio resultante, e um códon de término de translação no terminal 3’, codificando o terminal carboxil do polipeptídio resultan- te. Duas ou mais regiões codificadoras podem estar presente em um único construto polinucleotídico, por exemplo, em um único vetor, ou em construtos polinucleotídicos separados, por exemplo, em vetores separados (diferentes). Segue-se, então, que um único vetor pode conter apenas uma única região codificadora, ou compreender duas ou mais regiões codificadoras.
[00116] Certas proteínas secretadas por células de mamífero estão associadas a um peptídio sinal secretor que é clivado a partir da prote- ína madura uma vez iniciada a exportação da cadeia de proteínas em desenvolvimento através do retículo endoplasmático rugoso. Os espe- cialistas na técnica sabem os peptídios sinal geralmente são fusiona- dos ao terminal N do polipeptídio, e são clivados a partir do polipeptí- dio completo ou "de comprimento total" para produzir uma forma se- cretada ou "madura" do polipeptídio. Em certas modalidades, um pep- tídio sinal nativo ou um derivado funcional da sequência conserva a capacidade de direcionar a secreção do polipeptídio que é operacio- nalmente associada ao mesmo. Alternativamente, um peptídio sinal heterólogo de mamífero, por exemplo, um ativador de plasminogênio de tecido humano (TPA) ou um peptídio sinal de ß-glucuronidase de camundongo, ou um derivado funcional do mesmo, pode ser usado.
[00117] O termo "a jusante" refere-se a uma sequência de nucleotí- deos que está localizada 3’ em relação a uma sequência de nucleotí- deos de referência. Em certas modalidades, sequências de nucleotí- deos a jusante referem-se a sequências que acompanham o ponto ini-
cial de transcrição. Por exemplo, o códon de início de translação de um gene fica localizado a jusante do sítio de início de transcrição.
[00118] O termo "a montante" refere-se a uma sequência de nu- cleotídeos que fica localizada 5’ em relação a uma sequência de nu- cleotídeos de referência. Em certas modalidades, sequências de nu- cleotídeos a montante refeem-se a sequências que ficam localizadas no lado 5’ de uma região codificadora ou ponto inicial de transcrição. Por exemplo, a maioria dos promotores fica localizada a montante do sítio de início de transcrição.
[00119] Conforme usado neste pedido, o termo "região reguladora do gene" ou "região reguladora" refere-se a sequências de nucleotí- deos localizadas a montante (sequências não codificadoras 5'), no in- terior, ou a jusante (sequências não codificadoras 3’) de uma região codificadora, que influenciam a transcrição, o processamento de RNA, a estabilidade, ou a translação da região codificadora associada. Re- giões reguladoras podem incluir promoltores, sequências condutoras de translação, íntrons, sequências de reconhecimento de poliadenila- ção, sítios de processamento de RNA, sítios de ligação a efetores, ou estruturas do tipo tronco-alça. Se uma sequência codificadora for des- tinada à expressão em uma célula eucariótica, uma sequência de sinal de poliadenilação e de término de transcrição geralmente estarão loca- lizadas 3’ em relação à sequência codificadora.
[00120] Um polinucleotídeo que codifica um produto, por exemplo, um miRNA ou um produto genético (por exemplo, um polipeptídio tal como uma proteína terapêutica), pode incluir um promotor e/ou outros elementos de controle da expressão (por exemplo, transcrição ou translação) operacionalmente associadas a uma ou mais regiões codi- ficadoras. Em uma associação operável uma região codificadora para um produto genético, por exemplo, um polipeptídio, é associada a uma ou mais sequências reguladoras de maneira a colocar a expressão do produto genético sob a influência ou o controle das regiões regulado- ras. Por exemplo, uma região codificadora e um promotor estão "ope- racionalmente associados" se a indução da função do promotor resul- tar na transcrição de mRNA codificando o produto genético codificado pela região codificadora, e se a natureza da ligação entre o promotor e a região codificadora não inferir na capacidade do promotor de direci- onar a expressão do produto genético ou não interferir na capacidade do molde de DNA a ser transcrito. Outros elementos de controle da expressão, além de um promotor, por exemplo, melhoradores, opera- dores, repressores, e sinais de término de transcrição, também podem estar operacionalmente associados a uma região codificadora para direcionar a expressão de um produto genético.
[00121] "Sequências de controle da transcrição" referem-se a se- quências reguladoras do DNA, tais como promotores, melhoradores, terminadores, entre outros, que proporcionam a expressão de uma se- quência codificadora em uma célula hospedeira. Uma variedade de regiões de controle da transcrição é conhecida pelos especialistas na técnica. Estas incluem, porém sem limitação, regiões de controle de transcrição que funcionam em células de vertebrados, tais como, po- rém sem limitação, segmentos de promotores e de melhoradoras oriumdos de citomegalovírus (o promotor precoce imediato, em con- junto com o íntro A), vírus símio 40 (o promotor precoce), e retrovírus (tal como o vírus do sarcoma de Rous). Outras regiões de controle de transcrição incluem aquelas derivadas de genes de vertebrados tais como actina, proteína de choque térmico, hormônio de crescimento bovino e ß-globina de coelho, assim como outras sequências capazes de controlar a expressão gênica em células eucarióticas. Regiões de controle de transcrição adequadas adicionais incluem promotores e melhoradores tecido-específicos assim como promotores induzíveis por linfocinas (por exemplo, promotores induzíveis por interferons ou interleucinas).
[00122] De maneira similar, uma variedade de elementos de contro- le de translação é conhecida pelos especialistas na técnica. Estes in- cluem, porém sem limitação, sítios de ligação a ribossomas, códons de início e de término de translação, e elementos derivados de picornaví- rus (particularmente um sítio interno de entrada de ribossomas, ou IRES, também denominado sequência CITE).
[00123] O termo "expressão" conforme usado neste pedido refere- se a um processo pelo qual um polinucleotídeo produz um produto ge- nético, por exemplo, uma RNA ou um polipeptídio. O termo inclui, po- rém sem limitação, a transcrição do polinucleotídeo em RNA mensa- geiro (mRNA), RNA de transferência (tRNA), RNA do tipo grampo de cabelo pequeno (shRNA), RNA interferente pequeno (siRNA) ou qual- quer outro produto de RNA, e a translação de um mRNA em um poli- peptídio. A expressão produz um "produto genético". Conforme usado neste pedido, um produto genético pode ser seja um ácido nucleico, por exemplo, um RNA mensageiro produzido pela transcrição de um gene, ou um polipeptídio que é transladado a partir de um transcrito. Os produtos genéticos descritos neste pedido incluem ainda ácidos nucleicos com modificações pós-transcricionais, por exemplo, poliade- nilação ou junção, ou polipeptídios com modificações pós- translacionais, por exemplo, metilação, glicosilação, adição de lipídios, associação a outras subunidades proteicas, ou clivagem proteolítica. O termo "rendimento", conforme usado neste pedido, refere-se à quanti- dade de um polipeptídio produzido pela expressão de um gene.
[00124] Um "vetor" refere-se a qualquer veículo para a clonagem e/ou a transferência de um ácido nucleico para uma célula hospedeira. Um vetor pode ser um réplicon ao qual um outro segmento de ácido nucleico pode ser preso de forma a causar a replicação do segmento preso. Um "réplicon" refere-se a qualquer elemento genético (por exemplo, plasmídeo, fago, cosmídeo, cromossoma, vírus) que funcio- na como uma unidade de replicação autônoma in vivo, i.e., capaz de replicação por seu próprio controle. O termo "vetor" inclui veículos para a introdução do ácido nucleico em uma célula in vitro, ex vivo ou in vi- vo. Um grande número de vetores é conhecido e usado na técnica in- cluindo, por exemplo, plasmídeos, vírus eucarióticos modificados, ou vírus bacterianos modificados. A inserção de um polinucleotídeo em um vetor adequado pode ser realizada por ligação dos fragmentos apropriados do polinucleotídeo a um vetor escolhido que tenha termi- nais coesos complementares.
[00125] Os vetores podem ser geneticamente modificados para co- dificar marcadores selecionáveis ou repórteres que proporcionem a seleção ou a identificação das células que incorporaram o vetor. A ex- pressão de marcadores selecionáveis ou repórteres possibilita a identi- ficação e/ou a seleção das células hospedeiras que incorporam e ex- pressam outras regiões codificadoras contidas no vetor. Exemplos de genes marcadores selecionáveis conhecidos e usados na técnica in- cluem: genes que conferem resistência à ampicilina, estreptomicina, gentamicina, canamicina, higromicina, herbicida bialaphos, sulfonami- da, entre outros; e genes que são usados como marcadores fenotípi- cos, i.e., genes reguladores de antocianina, gene da isopentanil trans- ferase, entre outros. Exemplos de repórteres conhecidos e usados na técnica incluem: luciferase (Luc), proteína fluorescente verde (GFP), cloranfenicol acetiltransferase (CAT), β-galactosidase (LacZ), β- glucuronidase (Gus), entre outros. Os marcadores selecionáveis tam- bém podem ser considerados como repórteres.
[00126] O termo "célula hospedeira" conforme usado neste pedido refere-se, por exemplo, a micro-organismos, células de leveduras, cé- lulas de insetos, e células de mamífero, que podem ser, ou que já fo- ram, usadas como receptores de ssDNA ou vetores. O termo inclui a progênie da célula original que fora transduzida. Assim sendo, uma "célula hospedeira", conforme usado neste pedido, geralmente refere- se a uma célula que fora transduzida com uma sequência de DNA exógeno. Fica entendido que a progênie de uma única célula parental pode não ser necessariamente completamente idêntica em termos de morfologia ou do complemento do DNA genômico ou total à matriz ori- ginal, devido à mutação natural, acidental, ou intencional. Em algumas modalidades, a célula hospedeira pode ser uma célula hospedeira in vitro.
[00127] O termo "marcador selecionável" refere-se a um fator de identificação, geralmente um antibiótico ou gene de resistência quími- ca, que pode ser selecionado com base no efeito do gene marcador, i.e., resistência a um antibiótico, resistência a um herbicida, marcado- res colorimétricos, enzimas, marcadores fluorescentes, entre outros, onde o efeito é usado para rastrear a hereditariedade de um ácido nu- cleico de interesse e/ou identificar uma célula ou organismo que tenha herdado o ácido nucleico de interesse. Exemplos de genes marcado- res selecionáveis conhecidos e usados na técnica incluem: genes que conferem resistência à ampicilina, estreptomicina, gentamicina, cana- micina, higromicina, herbicida bialaphos, sulfonamida, entre outros; e genes que são usados como marcadores fenotípicos, i.e., genes regu- ladores de antocianina, gene isopentanil transferase, entre outros.
[00128] O termo "gene repórter" refere-se a um ácido nucleico codi- ficando um fator de identificação que pode ser identificado com base no efeito do gene repórter, onde o efeito é usado para rastrear a here- ditariedade de um ácido nucleico de interesse, para identificar uma cé- lula ou organismo que tenha herdado o ácido nucleico de interesse, e/ou para a indução ou transcrição de expressão gênica. Exemplos de genes repórteres conhecidos e usados na técnica incluem: luciferase (Luc), proteína fluorescente verde (GFP), cloranfenicol acetiltransfera-
se (CAT), -galactosidase (LacZ), -glucuronidase (Gus), entre outros. Os genes marcadores selecionáveis também podem ser considerados como genes repórteres.
[00129] "Promotor" e "sequência promotora" são usados intercam- biavelmente e referem-se a uma sequência de DNA capaz de controlar a expressão de uma sequência codificadora ou de um RNA funcional. Em geral, uma sequência codificadora fica localizada 3’ em relação a uma sequência promotora. Os promotores podem ser derivados em sua totalidade de um gene nativo, ou podem ser compostos de diferen- tes elementos derivados de diferentes promotores encontrados na na- tureza, ou ainda compreendem segmentos de DNA sintéticos. Os es- pecialistas na técnica entendem que diferentes promotores podem di- reciona a expressão de um gene em diferentes tecidos ou tipos de cé- lula, ou em diferentes estágios de desenvolvimento, ou em resposta a diferentes condições ambientais ou fisiológicas. Os promotores que fazem com que um gene seja expresso na maioria dos tipos de célula na maioria das vezes são comumente denominados "promotores cons- titutivos". Os promotores que fazem com que um gene seja expresso em um tipo de célula específico são comumente denominados "promo- tores célula-específicos" ou "promotores tecido-específicos". Os pro- motores que fazem com que um gene seja expresso em um estágio de desenvolvimento ou de diferenciação celular específico são comumen- te denominados "promotores desenvolvimento-específicos" ou "promo- tores diferenciação celular especificos". Os promotores que são indu- zidos e fazem com que um gene seja expresso subsequente à exposi- ção ou tratamento da célula com um agente, molécula biológica, quí- mico, ligante, luz, ou similar que induza o promotor são comumente denominados "promotores induzíveis" ou "promotores reguláveis". Re- conhece-se ainda que, como na maioria dos casos, os limites exatos das sequências reguladoras não foram completamente definidos, fra-
gmentos de DNA de diferentes comprimentos podem apresentar ativi- dade promotora idêntica.
[00130] A sequência promotora é tipicamente limitada em seu ter- minal 3’ pelo sítio de início de transcrição e se estende a montante (di- reção 5’) para incluir o número mínimo de bases ou elementos neces- sários para iniciar a transcrição em níveis detectáveis acima do valor de referência. Na sequência promotora serão encontrados um sítio de início de transcrição (convenientemente definido, por exemplo, por mapeamento com nuclease S1), assim como domínios de ligação a proteínas (sequências de consenso) responsáveis pela ligação da RNA polimerase.
[00131] Em algumas modalidades, a molécula de ácido nucleico compreende um promotor tecido-específico. Em certas modalidades, o promotor tecido-específico induz a expressão da proteína terapêutica, por exemplo, o fator de coagulação, no fígado, por exemplo, em hepa- tócios e/ou células endoteliais. Em modalidades particulares, o promo- tor é selecionado do grupo que consiste em um promotor de tiretina de camundongo (mTTR), um promotor de fator VIII humano endógeno (F8), um promotor de alfa-1-antitripsina humana (hAAT), um promotor mínimo de albumina humana, um promotor de albumina de camun- dongo, um promotor de tristetraprolina (TTP), um promotor de CASI, um promotor de CAG, um promotor de citomegalovírus (CMV), um promotor de fosfoglicerato quinase (PGK) e qualquer combinação dos mesmos. Em algumas modalidades, o promotor é selecionado dentre um promotor fígado-específico (por exemplo, α1-antitripsina (AAT)), um promotor músculo-específico (por exemplo, creatina quinase mus- cular (MCK), cadeia pesada alfa de miosina (αMHC), mioglobina (MB), e desmina (DES)), um promotor sintético (por exemplo, SPc5-12, 2R5Sc5-12, dMCK, e tMCK) e qualquer combinação dos mesmos. Em uma modalidade particular, o promotor compreende um promotor TTP.
[00132] Os termos "endonuclease de restrição" e "enzima de restri- ção" são usados ntercambiavelmente e referem-se a uma enzima que se liga a uma sequência de nucleotídeos específica e corta a mesma em um DNA de cordão duplo.
[00133] O termo "plasmídeo" refere-se a um elemento extra- cromossômica frequentemente transportando um gene que não faz parte do metabolismo central da célula, e usualmente na forma de mo- léculares de DNA de cordão duplo circular. Tais elementos podem ser sequências de replicação autônoma, sequências integrantes do geno- ma, sequências de fagos ou de nucleotídeos, lineares, circulares, ou super-enroladas, de um DNA ou RNA de cordão simples ou de cordão duplo, derivado de qualquer fonte, nas quais inúmeras sequências de nucleotídeos foram unidas ou recombinadas em um construto único, que é capaz de introduzir um fragmento promotor e uma sequência de DNA para um produto genético selecionado junto com uma sequência 3’ não transladada em uma célula.
[00134] Vetores virais eucarióticos que podem ser usados incluem, porém sem limitação, vetores de adenovírus, vetores de retrovírus, ve- tores de vírus adeno-associados, poxvírus, por exemplo, vetores do vírus da vacínia, vetores de baculovírus, ou vetores de herpesvírus. Vetores não virais incluem plasmídeos, lipossomas, lipídios eletrica- mente carregados (citofectina), complexos DNA-proteína, e biopolíme- ros.
[00135] Um "vetor de clonagem" refere-se a um "réplicon", que é um comprimento unitário de um ácido nucleico que replica sequenci- almente e que compreende uma origem de replicação, tal como um plasmídeo, fago ou cosmídeo, ao qual um outro segmento de ácido nucleico pode ser preso contanto que cause a replicação do segmento preso. Determinados vetores de clonagem são capazes de replicação em um tipo de célula, por exemplo, bactérias, e de expressão em um outro, por exemplo, células eucarióticas. Os vetores de clonagem tipi- camente compreendem uma ou mais sequências que podem ser usa- das para a seleção de células compreendendo o vetor e/ou um ou mais sítios de clonagem múltipla para inserção das sequências de áci- dos nucleicos de interesse.
[00136] O termo "vetor de expressão" refere-se a um veículo dese- nhado para permitir a expressão de uma sequência de ácidos nuclei- cos inserida subsequente à inserção em uma célula hospedeira. A se- quência de ácidos nucleicos inserida é colocada em associação ope- rável com regiões reguladoras como descrito acima.
[00137] Vetores são introduzidos em células hospedeiras por méto- dos bastante conhecidos na literatura, por exemplo, transfecção, ele- troporação, microinjeção, transdução, fusão de células, DEAE dextra- na, precipitação em fosfato de cálcio, lipofecção (fusão de lisossomas), uso de uma pistola de genee, ou transportador vetorial de DNA. "Cultu- ra", "para cultivar", "cultivar", conforme usado neste pedido, significam incubar células em condições in vitro que permitem o crescimento ou a divisão celular, ou manter as células em um estado vivo. "Células culti- vadas", conforme usado neste pedido, significa células que são propa- gadas in vitro.
[00138] Conforme usado neste pedido, o termo "polipeptídio" desti- na-se a abranger um único "polipeptídio" assim como vários "polipeptí- dios", e refere-se a uma molécula composta de monômeros (aminoá- cidos) linearmente ligados por ligações amida (também conhecidas como ligações peptídicas). O termo "polipeptídio" refee-se a qualquer cadeia ou cadeias de dois ou mais aminoácidos, e não se refere a um comprimento específico do produto. Assim sendo, peptídios, dipeptí- dios, tripeptídios, oligopeptídios, "proteína", "cadeia de aminoácidos", ou qualquer outro termo usado para indicar a uma cadeia ou cadeias de dois ou mais aminoácidos, estão incluídos na definição de "polipep-
tídio", e o termo "polipeptídio" pode ser usado no lugar de, ou inter- cambiavelmente com, qualquer um desses termos. O termo "polipeptí- dio" também se destina a indicar os produtos de modificações pós- expressão do polipeptídio, incluindo, porém sem limitação, glicosila- ção, acetilação, fosforilação, amidação, derivatização por quaisquer grupos protetores/bloqueadores conhecidos, clivagem proteolítica, ou modificação por aminoácidos de ocorrência não natural. Um polipeptí- dio pode ser derivado de uma fonte natural ou produzido por tecnolo- gia recombinante, mas não é necessariamente transladado a partir de uma sequência de ácidos nucleicos designada. Ele pode ser gerado de qualquer maneira, inclusive por síntese química.
[00139] O termo "aminoácido" inclui alanina (Ala ou A); arginina (Arg ou R); asparagina (Asn ou N); ácido aspártico (Asp ou D); cisteína (Cys ou C); glutamina (Gln ou Q); ácido glutâmico (Glu ou E); glicina (Gly ou G); histidina (His ou H); isoleucina (Ile ou I): leucina (Leu ou L); lisina (Lys ou K); metionina (Met ou M); fenilalanina (Phe ou F); prolina (Pro ou P); serina (Ser ou S); treonina (Thr ou T); triptofano (Trp ou W); tirosina (Tyr ou Y); e valina (Val ou V). aminoácidos não tradicio- nais também estão dentro do escopo da invenção e incluem norleuci- na, omitina, norvalina, homosserina, e outros análogos de resíduos aminoacídicos tais como aqueles descritos em Ellman et al. Meth. Enzym. 202:301-336 (1991). Para gerar tais resíduos aminoacídicos de ocorrência não natural, os procedimentos de Noren et al. Science 244:182 (1989) e de Ellman et al., supra, podem ser usados. Em su- ma, esses procedimentos envolvem a ativação química de um tRNA supressor com um resíduo aminoacídico de ocorrência não natural se- guida por transcrição e translação in vitro do RNA. A introdução do aminoácido não tradicional também pode ser conseguida por meio de químicas de peptídios conhecidas na literatura. Conforme usado neste pedido, o termo "aminoácido polar" inclui aminoácidos que têm carga líquida zero, mas têm cargas parciais diferentes de zero em diferentes porções de suas cadeias laterais (por exemplo, M, F, W, S, Y, N, Q, C). Estes aminoácidos podem participar de interações hidrófobas e de interações eletrostáticas. Conforme usado neste pedido, o termo "ami- noácido carregado" inclui aminoácidos que podem ter carga líquida diferente de zero em suas cadeias laterais (por exemplo, R, K, H, E, D). Estes aminoácidos podem participar de interações hidrófobas e de interações eletrostáticas.
[00140] Na presente invenção também estão incluídos fragmentos ou variantes de polipeptídios, e qualquer combinação dos mesmos. O termo "fragmento" ou "variante" quando se refere a domínios de liga- ção ou a moléculas de ligação a polipeptídios da presente invenção inclui quaisquer polipeptídios que conservem pelo menos algumas das propriedades (por exemplo, afinidade de ligação ao FcRn para um domínio de ligação do FcRn ou variante de Fc, atividade de coagula- ção para uma variante de FVIII, ou atividade de ligação ao FVIII para o fragmento VWF) do polipeptídio de referência. Fragmentos de polipep- tídios incluem fragmentos proteolíticos, assim como fragmentos de de- leção, além de fragmentos de anticorpos específicos discutidos em alguma parte deste pedido, mas não incluem o polipeptídio de com- primento total de ocorrência natural (ou polipeptídio maduro). Varian- tes dos domínios de ligação ou das moléculas de ligação a polipeptí- dios da presente invenção incluem os fragmentos descritos acima, e também polipeptídios com sequências de aminoácidos alteradas devi- do a substituições, deleções ou inserções de aminoácidos. As varian- tes podem ser de ocorrência natural ou não natural. Variantes de ocor- rência não natural poodem ser produzidas por ténicas de mutagênese bastante conhecidas. Os polipeptídios variantes podem compreender substituições, deleções ou adições conservativas ou não conservativas de aminoácidos.
[00141] Uma "substituição conservativa de aminoácidos" é aquela na qual o resíduo aminoacídico é substituído por um resíduo aminoa- cídico tendo uma cadeia lateral semelhante. As famílias de resíduos aminoacídicos tendo cadeias laterais semelhantes já foram definidas na literatura, incluindo cadeias laterais básicas (por exemplo, lisina, arginina, histidina), cadeias laterais ácidas (por exemplo, ácido aspár- tico, ácido glutâmico), cadeias laterais polares não carregadas (por exemplo, glicina, asparagina, glutamina, serina, treonina, tirosina, cis- teína), cadeias laterais não polares (por exemplo, alanina, valina, leu- cina, isoleucina, prolina, fenilalanina, metionina, triptofano), cadeias laterais beta-ramificadas (por exemplo, treonina, valina, isoleucina) e cadeias laterais aromáticas (por exemplo, tirosina, fenilalanina, tripto- fano, histidina). Assim sendo, se um aminoácido em um polipeptídio for substituído por um outro aminoácido da mesma família de cadeias laterais, a substituição é considerada conservativa. Em uma outra mo- dalidade, uma fileira de aminoácidos pode ser substituída de forma conservativa por outra fileira estruturalmente semelhante que difere na ordem e/ou na composição dos membros da família de cadeias late- rais.
[00142] O termo "percentagem de identidade", como conhecido na literatura, é uma relação entre duas ou mais sequências de polipeptí- dio ou duas ou mais sequências de polinucleotídeos, segundo deter- minado comparando-se as sequências. Na literatura, "identidade" tam- bém significa o grau de parentesco entre as sequências de polipeptí- dios ou de polinucleotídeos, conforme o caso, segundo determinado pelo pareamento entre as fileiras de tais sequências. A "identidade" pode ser facilmente calculada por métodos conhecidos, incluindo, po- rém sem limitação, aqueles descritos em: Computational Molecular Biology (Lesk, A. M., ed.) Oxford University Press, New York (1988); Biocomputing: Informatics and Genome Projects (Smith, D. W., ed.)
Academic Press, New York (1993); Computer Analysis of Sequence Data, Part I (Griffin, A.
M., and Griffin, H.
G., eds.) Humana Press, New Jersey (1994); Sequence Analysis in Molecular Biology (von Heinje, G., ed.) Academic Press (1987); and Sequence Analysis Primer (Gribskov, M. and Devereux, J., eds.) Stockton Press, New York (1991). Os métodos preferidos para determinar a identidade são dese- nhados para dar o melhor pareamento entre as sequências testadas.
Os métodos para determinar a identidde estão codificados em progra- mas de computador disponíveis ao público.
Os alinhamentos de se- quências e os cálculos de percentagem de identidade podem ser efe- tuados por um software de análise de sequências tal como o programa Megalign do pacote de bioinformática LASERGENE (DNASTAR Inc., Madison, WI), o pacote GCG de programas (Wisconsin Package Ver- sion 9.0, Genetics Computer Group (GCG), Madison, WI), BLASTP, BLASTN, BLASTX (Altschul et al., J.
Mol.
Biol. 215:403 (1990)), e DNASTAR (DNASTAR, Inc. 1228 S.
Park St.
Madison, WI 53715 USA). No contexto deste pedido, ficará entendido que quando for usa- do um software de análise de sequências para a análise, os resultados da análise estarão baseados nos "valores de default" do programa usado, a menos que especificado em contrário.
Conforme usado neste pedido, "valores de default" significam qualquer conjunto de valores ou parâmetros originalmente carregados com o software quando iniciali- zado pela primeira vez.
Para fins de determinar a percentagem de identidade entre a sequência de uma proteína terapêutica da invenção, por exemplo, um fator coagulação, e uma sequência de referência, somente os nucleotídeos na sequência de referência correspondentes aos nucleotídeos na sequência da proteína terapêutica da invenção, por exemplo, o fator de coagulação, são usados para calcular a per- centagem de identidade.
Por exemplo, ao comparar uma sequência de nucleotídeos do FVIII de comprimento total contendo o domínio B com uma sequência de nucleotídeos do FVIII sem o domínio B e otimizada (BDD) da invenção, a porção do alinhamento incluindo os domínios A1, A2, A3, C1, e C2 será usado para calcular a percentagem de iden- tidade. Os nucleotídeos na porção da sequência do FVIII de compri- mento total codificando o domínio B (que resultará em um "hiato" grande no alinhamento) não serão considerados um malpareamento. Além disso, ao determinar a percentagem de identidade entre uma se- quência de BDD FVIII otimizada da invenção, ou uma porção designa- da da mesma (por exemplo, nucleotídeos 58-2277 e 2320-4374 da SEQ ID NO:3), e uma sequência de referência, a percentagem de identidade será calculada pelo alinhamento, dividindo-se o número de nucleotídeos pareados pelo número total de nucleotídeos na sequên- cia completa da sequência de BDD-FVIII otimizada, ou uma porção designada da mesma, como descrito neste pedido.
[00143] Conforme usado neste pedido, os nucleotídeos correspon- dentes aos nucleotídeos em uma sequência particular da invenção são identificados por alinhamento da sequência da invenção para maximi- zar a identidade com uma sequência de referência. O número usado para identificar um aminoácido equivalente em uma sequência de refe- rência baseia-se no número usado para identificar o aminoácido cor- respondente na sequência da invenção.
[00144] Uma proteína "de fusão" ou "quimérica" compreende uma primeira sequência de aminoácidos ligada a uma segunda sequência de aminoácidos à qual não se encontra naturalmente ligada na nature- za. As sequências de aminoácidos que normalmente existem em pro- teínas separadas podem ser reunidas no polipeptídio de fusão, ou as sequências de aminoácidos que normalmente existem na mesma pro- teína podem ser dispostas em um novo arranjo no polipeptídio de fu- são, por exemplo, fusão de um domínio do Fator VIII da invenção com um domínio Fc de ig. Uma proteína de fusão é criada, por exemplo,
por síntese química, ou pela criação e translação de um polinucleotí- deo no qual as regiões do peptídio são codificadas na relação deseja- da. Uma proteína quimérica pode compreender ainda uma segunda sequência de aminoácidos associada à primeira sequência de amino- ácidos por uma ligação covalente, uma ligação não peptídica ou uma ligação não covalente.
[00145] Conforme usado neste pedido, o termo "sítio de inserção" refere-se a uma posição em um polipeptídio, ou fragmento, variante, ou derivado do mesmo, que está imediatamente a montante da posi- ção na qual uma porção heteróloga pode ser inserida. Um "sítio de in- serção" é identificado por um número, o número sendo o número do aminoácido em uma sequência de referência. Por exemplo, um "sítio de inserção" no FVIII refere-se ao número da sequência de aminoáci- dos no FVIII nativo maduro (SEQ ID NO: 15) à qual corresponde o sítio de inserção, que é imediatamente N-terminal para a posição de inser- ção. Por exemplo, a expressão "a3 compreende uma porção heterólo- ga em um sítio de inserção que corresponde ao aminoácido 1656 da SEQ ID NO: 15" indica que a porção heteróloga fica localizada entre dois aminoácidos que correspondem ao aminoácido 1656 e ao amino- ácido 1657 da SEQ ID NO: 15.
[00146] A expressão "imediatamente a jusante de um aminoácido", conforme usado neste pedido, refere-se à posição logo depois do gru- po carboxil terminal do aminoácido. De maneira similar, a expressão "imediatamente a montante de um aminoácido" refere-se à posição logo depois do grupo amina terminal do aminoácido.
[00147] Os termos "inserido", "é inserido", "inserido em" ou termos gramaticalmente relacionados, conforme usado neste pedido, referem- se à posição de uma porção heteróloga em um polipeptídio, por exem- plo, um fator de coagulação, em relação à posição análoga no polipep- tídio parental. Por exemplo, em certas modalidades, "inserido" e simila-
res referem-se à posição de uma porção heteróloga em um polipeptí- dio FVIII recombinante em relação à posição análoga no FVIII humano maduro. Conforme usado neste pedido, os termos referem-se às ca- racterísticas do polipeptídio, e não indicam, sugerem ou inferem qual- quer método ou processo pelo qual o polipeptídio fora feito.
[00148] Conforme usado neste pedido, o termo "meia-vida" refere- se a uma meia-vida biológica de um polipeptídio particular in vivo. A meia-vida pode ser representada pelo tempo necessário para metade da quantidade administrada a um indivíduo ser depurada da circulação e/ou de outros tecidos no animal. Quando uma curva de depuração de um dado polipeptídio é construída em função do tempo, geralmente a curva é bifásica com uma fase  rápida e uma fase  mais longa. A fase  representa tipicamente um equilíbrio do polipeptídio Fc adminis- trado entre o espaço intravascular e o extravascular e é, em parte, de- terminada pelo tamanho do polipeptídio. A fase  representa tipica- mente o catabolismo do polipeptídio no espaço intravascular. Em al- gumas modalidades, a proteína terapêutica, por exemplo, o fator de coagulação, por exemplo, FVIII, e proteínas quiméricas compreenden- do a mesma são monofásicas, e, portanto, não possuem uma fase al- fa, e sim apenas a fase beta única. Por conseguinte, em certas moda- lidades, o termo meia-vida, conforme usado neste pedido, refere-se à meia-vida do polipeptídio na fase .
[00149] O termo "ligado" conforme usado neste pedido refere-se a uma primeira sequência de aminoácidos ou sequência de nucleotídeos covalentemente ou não covalentemente ligada a uma segunda se- quência de aminoácidos ou sequências de nucleotídeos, respectiva- mente. A primeira sequência de aminoácidos ou sequência de nucleo- tídeos pode ser diretamente ligada ou justaposta à segunda sequência de aminoácidos ou sequência de nucleotídeos ou alternativamente uma sequência interveniente pode ligar covalentemente a primeira se-
quência à segunda sequência. O termo "ligado" significa não só uma fusão de uma primeira sequência de aminoácidos a uma segunda se- quência de aminoácidos no terminal C ou no terminal N, mas também inclui a inserção da primeira sequência de aminoácidos (ou da segun- da sequência de aminoácidos) inteira em quaisquer dois aminoácidos na segunda sequência de aminoácidos (ou na primeira sequência de aminoácidos, respectivamente). Em uma modalidade, a primeira se- quência de aminoácidos pode ser ligada a uma segunda sequência de aminoácidos por uma ligação peptídica ou um ligante. A primeira se- quência de nucleotídeos pode ser ligada a uma segunda sequência de nucleotídeos por uma ligação fosfodiéster ou um ligante. O ligante po- de ser um peptídio ou polipeptídio (para cadeias de polipeptídios) ou um nucleotídeo ou uma cadeia de nucleotídeos (para cadeias de nu- cleotídeos) ou qualquer porção química (tanto para cadeias de poli- peptídios como de polinucleotídeos). O termo "ligado" também é indi- cado por um hífen (-).
[00150] Hemostasia, conforme usado neste pedido, significa o es- tancamento ou diminuição do sangramento ou hemorragia; ou o es- tancamento ou diminuição do fluxo sanguíneo através de um vaso sanguíneo ou de uma parte do corpo.
[00151] Distúrbio hemostático, conforme usado neste pedido, signi- fica uma condição geneticamente hereditária ou adquirida caracteriza- da por uma tendência à hemorragia, seja espontânea ou decorrente de um trauma, devido a uma capacidade enfraquecida ou incapacidade de formar um coágulo de fibrina. Exemplos de tais distúrbios incluem as hemofilias. As três formas principais são hemofilia A (deficiência de fator VIII), hemofilia B (deficiência de fator IX ou "doença de Christ- mas") e hemofilia C (deficiência de fator XI, tendência a sangramento leve). Outros distúrbios hemostáticos incluem, por exemplo, doença de von Willebrand, deficiência de fator XI (deficiência de PTA), deficiência de fator XII, deficiências ou anormalidades estruturais em fibrinogênio, protrombina, fator V, fatr VII. Fator X ou fator XIII, síndrome de Ber- nard-Soulier, que é um defeito ou deficiência em GPIb. GPIb, o recep- tor para vWF, pode ser defeituoso e levar à falta de formação de coá- gulo primário (hemostasia primária) e tendência a sangramento au- mentado) e trombastenia de Glanzman e Naegeli (trombastenia de Glanzmann). Na insuficiência hepática (formas aguda e crônica), há produção insuficiente de fatores de coagulação pelo fígado; isto pode aumentar o risco de sangramento.
[00152] As moléculas de ácido nucleico isoladas, os polipeptídios isolados, ou os vetores isolados compreendendo a molécula de ácido nucleico isolada da invenção podem ser usados de forma profilática. Conforme usado neste pedido o termo "tratamento profilático" refere- se à administração de uma molécula antes de um episódio de san- gramento. Em uma modalidade, o indivíduo com necessidade de um agente hemostático genérico está passando, ou está prestes a passar, por uma cirurgia. Um polinucleotídeo, polipeptídio, ou vetor da inven- ção pode ser administrado antes ou depois da cirurgia como um profi- lático. O polinucleotídeo, polipeptídio, ou vetor da invenção pode ser administrado durante ou depois da cirurgia para controlar um episódio de sangramento agudo. A cirurgia pode incluir, porém sem limitação, transplante de fígado, ressecção do fígado, procedimentos dentais, ou transplante de células-tronco.
[00153] As moléculas de ácido nucleico isoladas, os polipeptídios isolados, ou os vetores isolados da invenção também podem ser usa- dos para tratamento sob demanda. O termo "tratamento sob demanda" refere-se à administração de uma molécula de ácido nucleico isolada, polipeptídio isolado, ou vetor em resposta a sintomas de um episódio de sangramente ou antes de uma atividade que possa causar sangra- mento. Em um aspecto, o tratamento sob demanda pode ser dado a um indivíduo quando o sangramento tem início, tal como depois de uma lesão, ou quando o sangramento é esperado, tal como antes de uma cirurgia. Em um outro aspecto, o tratamento sob demanda pode ser dado antes de atividades que aumentam o risco de sangramento, tal como esportes de contato.
[00154] Conforme usado neste pedido o termo "sangramento agu- do" refere0se a um episódio de sangramento independente da causa subjacente. Por exemplo, um indivíduo pode ter trauma, uremia, um distúribio de sangramento hereditário (por exemplo, deficiência de fator VII), um distúrbio plaquetário, ou resistência devida ao desenvolvimen- to de anticorpos para fatores de coagulação.
[00155] Tratar, tratamento, tratando, conforme usado neste pedido refere-se, por exemplo, à redução da severidade de uma doença ou condição; redução da duração do curso de uma doença; melhora de um ou mais sintomas associados a uma doença ou condição; provisão de efeitos benéficos para um indivíduo com uma doença ou condição, sem necessariamente curar a doença ou condição, ou profilaxia de um ou mais sintomas associados a uma doença ou condição. Em uma modalidade, o termo "tratar" ou "tratamento" significa manter, por exemplo, um nível de vale de FVIII de pelo menos cerca de 1 IU/dL, 2 IU/dL, 3 IU/dL, 4 IU/dL, 5 IU/dL, 6 IU/dL, 7 IU/dL, 8 IU/dL, 9 IU/dL, 10 IU/dL, 11 IU/dL, 12 IU/dL, 13 IU/dL, 14 IU/dL, 15 IU/dL, 16 IU/dL, 17 IU/dL, 18 IU/dL, 19 IU/dL, 20 IU/dL, 25 IU/dL, 30 IU/dL, 35 IU/dL, 40 IU/dL, 45 IU/dL, 50 IU/dL, 55 IU/dL, 60 IU/dL, 65 IU/dL, 70 IU/dL, 75 IU/dL, 80 IU/dL, 85 IU/dL, 90 IU/dL, 95 IU/dL, 100 IU/dL, 105 IU/dL, 110 IU/dL, 115 IU/dL, 120 IU/dL, 125 IU/dL, 130 IU/dL, 135 IU/dL, 140 IU/dL, 145 IU/dL, ou 150 IU/dL em um indivíduo pela administração de uma molécula de ácido nucleico isolada, um polipeptídio ou vetor iso- lado da invenção. Em uma outra modalidade, tratar ou tratamento sig- nifica manter um nível de vale de FVIII entre cerca de 1 e cerca de 150
IU/dL, cerca de 1 e cerca de 125 IU/dL, cerca de 1 e cerca de 100 IU/dL, cerca de 1 e cerca de 90 IU/dL, cerca de 1 e cerca de 85 IU/dL, cerca de 1 e cerca de 80 IU/dL, cerca de 1 e cerca de 75 IU/dL, cerca de 1 e cerca de 70 IU/dL, cerca de 1 e cerca de 65 IU/dL, cerca de 1 e cerca de 60 IU/dL, cerca de 1 e cerca de 55 IU/dL, cerca de 1 e cerca de 50 IU/dL, cerca de 1 e cerca de 45 IU/dL, cerca de 1 e cerca de 40 IU/dL, cerca de 1 e cerca de 35 IU/dL, cerca de 1 e cerca de 30 IU/dL, cerca de 1 e cerca de 25 IU/dL, cerca de 25 e cerca de 125 IU/dL, cer- ca de 50 e cerca de 100 IU/dL, cerca de 50 e cerca de 75 IU/dL, cerca de 75 e cerca de 100 IU/dL, cerca de 1 e cerca de 20 IU/dL, cerca de 2 e cerca de 20 IU/dL, cerca de 3 e cerca de 20 IU/dL, cerca de 4 e cer- ca de 20 IU/dL, cerca de 5 e cerca de 20 IU/dL, cerca de 6 e cerca de 20 IU/dL, cerca de 7 e cerca de 20 IU/dL, cerca de 8 e cerca de 20 IU/dL, cerca de 9 e cerca de 20 IU/dL, ou cerca de 10 e cerca de 20 IU/dL. Tratamento de uma doença ou condição também pode incluir a manutenção da atividade de FVIII em um indivíduo em um nível equi- parável a pelo menos cerca de 1%, 2%, 3%, 4%, 5%, 6%, 7%, 8%, 9%, 10%, 11%, 12%, 13%, 14%, 15%, 16%, 17%, 18%, 19%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 100%, 105%, 110%, 115%, 120%, 125%, 130%, 135%, 140%, 145%, ou 150% da atividade de FVIII em um indivíduo não hemofílico. O nível de vale mínimo necessário para o tratamento pode ser medido por um ou mais métodos conhecidos e pode ser ajus- tado (aumentado ou diminuído) para cada pessoa.
[00156] "Administrar", conforme usado neste pedido, significa dar uma molécula de ácido nucleico farmaceuticamente aceitável, um poli- peptídio expresso a partir da mesma, ou um vetor compreendendo a molécula de ácido nucleico da invenção a um indivíduo por uma via farmaceuticamente aceitável. As vias de administração podem ser in- travenosas, por exemplo, injeção intravenosa e infusão intravenosa.
Vias de administração adicionais incluem, por exemplo, administração subcutânea, intramuscular, oral, nasal, e pulmonar. As moléculas de ácido nucleico, os polipeptídios, e os vetores podem ser administrados como parte de uma composição farmacêutica compreendendo pelo menos um excipiente.
[00157] O termo "farmaceuticamente aceitável", conforme usado neste pedido, refere-se a entidades moleculares e composições que são fisiologicamente toleráveis e tipicamente não produzem toxicidade ou uma reação alérgica ou similar indesejada, tal como indisposições gástricas, vertigem, entre outras, quando administradas a um ser hu- mano. Opcionalmente, conforme usado neste pedido, o termo "farma- ceuticamente aceitável" significa aprovado por uma agência regulado- ra do governo federal ou de um governo estadual ou listada na Farma- copia Americana ou outras farmacopeias geralmente reconhecidas pa- ra uso em animais, e mais particularmente, em seres humanos.
[00158] Conforme usado neste pedido, a expressão "indivíduo com necessidade da mesma" inclui indivíduos, tais como mamíferos, que se beneficiariam da administração de uma molécula de ácido nucleico, polipeptídio, ou vetor da invenção, por exemplo, para melhorar a he- mostasia. Em uma modalidade, indivíduos incluem, porém sem limita- ção, indivíduos com hemofilia. Em uma outra modalidade, indivíduos incluem, porém sem limitação, indivíduos que desenvolveram um inibi- dor para a proteína terapêutica, por exemplo, o fator de coagulação, por exemplo, FVIII, e, portanto, precisam de uma terapia de bypass. O indivíduo pode ser um adulto ou uma criança (por exemplo, menor de 12 anos de idade).
[00159] Conforme usado neste pedido, o termo "proteína terapêuti- ca" refere-se a qualquer polipeptídio conhecido na literatura que pode ser administrado a um indivíduo. Em algumas modalidades, a proteína terapêutica compreende uma proteína selecionada dentre um fator de coagulação, um fator de crescimento, um anticorpo, um fragmento funcional do mesmo, ou uma combinação dos mesmos. Conforme usado neste pedido, o termo "fator de coagulação" refere-se a molécu- las, ou análogos das mesmas, de ocorrência natural ou produzidas de forma recombinante que previnem ou diminuem a duração de um epi- sódio de sangramento em um indivíduo. Em outras palavras, significa moléculas que apresentam atividade pró-coagulante, i.e., são respon- sáveis pela conversão de fibrinogênio em uma malha de fibrina insolú- vel que faz o sangue coagular. "Fator de coagulação", conforme usado neste pedido, inclui um fator de coagulação ativado, sem zimógeno, ou um fator de coagulação ativável. Um "fator de coagulação ativável" é um fator de coagulação em uma forma inativa (por exemplo, na forma de seu zimógeno ) que é capaz de ser convertido em uma forma ativa. O termo "fator de coagulação" inclui, porém sem limitação, fator I (FI), fator II (FII), fator V (FV), FVII, FVIII, FIX, fator X (FX), fator XI (FXI), fator XII (FXII), fator XIII (FXIII), fator de Von Willebrand (VWF), preca- licreína, cininogênio de alto peso molecular, fibronectina, antitrombina III, cofator de heparina tipo II, proteína C, proteína S, proteína Z, inibi- dor de protease relacionada à Proteína Z (ZPI), plasminogênio, alfa 2- antiplasmina, ativador de plasminogênio tecidual (tPA), uroquinase, inibidor do ativador de plasminogênio tipo 1 (PAI-1), inibidor do ativa- dor de plasminogênio tipo 2 (PAI2), zimógeno dos mesmos, formas ativadas ds mesmos, ou qualquer combinação dos mesmos.
[00160] Atividade coagulante, conforme usado neste pedido, signifi- ca a capacidade de participar em uma cascata de reações bioquímicas que culmina na formação de um coágulo de fibrina e/ou reduz a seve- ridade, a duração ou frequência de hemorragia ou de um episódio de sangramento.
[00161] Um "fator de crescimento", conforme usado neste pedido, inclui qualquer fator de crescimento conhecido na literatura, incluindo citocinas e hormônios.
Em algumas modalidades, o fator de cresci- mento é selecionado dentre adrenomedulina (AM), angiopoietina (Ang), fator de motilidade endócrina, um proteína morfogenética óssea (BMP) (por exemplo, BMP2, BMP4, BMP5, BMP7), um membro da família de fatores neurotróficos ciliares (por exemplo, fator neurotrófico ciliar (CNTF), fator inibitório de leucemia (LIF), interleucina-6 (IL-6)), um fator estimulante de colônias (por exemplo, fator estimulante de colônias de macrófagos (m-CSF), fator estimulante de colônias de granulócitos (G-CSF), fator estimulante de colônias de granulócitos e macrófagos (GM-CSF)), um fator de crescimento epidérmico (EGF), uma efrina (por exemplo, efrina A1, efrina A2, efrina A3, efrina A4, efri- na A5, efrina B1, efrina B2, efrina B3), eritropoietina (EPO), um fator de crescimento de fibroblastos (FGF) (por exemplo, FGF1, FGF2, FGF3, FGF4, FGF5, FGF6, FGF7, FGF8, FGF9, FGF10, FGF11, FGF12, FGF13, FGF14, FGF15, FGF16, FGF17, FGF18, FGF19, FGF20, FGF21, FGF22, FGF23), somatotrofina bovina fetal (FBS), um membro da família de GDNF (por exemplo, fator neurotrófico derivado da linhagem de células gliais (GDNF), neurturina, persefina, artemina), fator de diferenciação de crescimento tipo 9 (GDF9), fator de cresci- mento de hepatócitos (HGF), fator de crescimento derivado de hepa- toma (HDGF), insulina, fatores de crescimento semelhantes à insulina (por exemplo, fator de crescimento semelhante à insulina tipo 1 (IGF- 1) ou IGF-2, uma interleucina (IL) (por exemplo, IL-1, IL-2, IL-3, IL-4, IL-5, IL-6, IL-7), fator de crescimento de queratinóticos (KGF), fator es- timulante de migração (MSF), proteína estimulante de macrófagos (MSP ou proteína semelhante ao fator de crescimento de hepatócitos (HGFLP)), miostatina (GDF-8), uma neuregulina (por exemplo, neure- gulina 1 (NRG1), NRG2, NRG3, NRG4), uma neurotropina (por exem- plo, fator neurotrófico derivado do cérebro (BDNF), fator de crescimen- to nervoso (NGF), uma neurotrofina-3 (NT-3), NT-4, fator de cresci-
mento placentário (PGF), fator de crescimento de derivados plaquetá- rios (PDGF), renalase (RNLS), fator de crescimento de células T (TCGF), trombopoietina (TPO), um fator de transformação do cresci- mento (por exemplo, fator de transformação do crescimento alfa (TGF- α), TGF-β, fator de necrose tumoral alfa (TNF-α), e fator de crescimen- to endotelial vascular (VEGF).
[00162] Em algumas modalidades, a proteína terapêutica é codifi- cada por um gene selecionado dentre distrofina ligada ao X, MTM1 (miotubularina), tirosina hidroxilase, AADC, ciclo-hidrolase, SMN1, FXN (frataxina), GUCY2D, RS1, CFH, HTRA, ARMS, CFB/CC2, CNGA/CNGB, Prf65, ARSA, PSAP, IDUA (MPS I), IDS (MPS II), PAH, GAA (alfa-glicosidase ácida), ou qualquer combinação das mesmas.
[00163] Conforme usado neste pedido, os termos "heterólogo" ou "exógeno" referem-se a moléculas que normalmente não são encon- tradas em um dado contexto, por exemplo, em uma célula ou em um polipeptídio. Por exemplo, uma molécula exógena ou heteróloga pode ser introduzida em uma célula e só está presente depois de manipula- ção da célula, por exemplo, por transfecção ou outras formas de en- genharia genética ou uma sequência de aminoácidos heteróloga pode estar presente em uma proteína na qual normalmente ela é encontra- da.
[00164] Conforme usado neste pedido, o termo "sequência de nu- cleotídeos heterólogos" refere-se a uma sequência de nucleotídeos que não ocorrem naturalmente com uma dada sequência de polinucle- otídeos. Em uma modalidade, a sequência de nucleotídeos heterólo- gos codifica um polipeptídio capaz de aumentar a meia-vida da proteí- na terapêutica, por exemplo, o fator de coagulação, por exemplo, FVIII. Em uma outra modalidade, a sequência de nucleotídeos heterólogos codifica a polypeptide that increases the hydrodynamic radius of a pro- teína terapêutica, por exemplo, o fator de coagulação, por exemplo,
FVIII.
Em outras modalidades, a sequência de nucleotídeos heterólo- gos codifica um polipeptídio que melhora uma ou mais propriedades farmacocinéticas da proteína terapêutica sem afetar de forma significa- tiva sua atividade ou função biológica (por exemplo, uma atividade pró- coagulante). Em algumas modalidades, a proteína terapêutica é ligada ou conectada ao polipeptídio codificado pela sequência de nucleotí- deos heterólogos por um ligante.
Exemplos não limitativos de porções polipeptídicas codificadas por sequências de nucleotídeos incluem uma região constante de imunoglobulina ou uma porção da mesma, albumina ou um fragmento da mesma, ou porção de ligação à albumi- na, uma transferrina, os polipeptídios PAS do Pedido de Patente US N° 20100292130, uma sequência de HAP, transferrina ou um fragmen- to da mesma, o peptídio C-terminal (CTP) da subunidade β da gonado- tropina coriônica humana, molécula pequena de ligação à albumina, uma sequência de XTEN, porções de ligação ao FcRn (por exemplo, regiões Fc completas ou porções das mesmas que se ligam ao FcRn), regiões Fc de cadeia única (regiões ScFc, por exemplo, aquelas des- critas nos documentos US 2008/0260738, WO 2008/012543, ou WO 2008/1439545), ligantes tipo poliglicina, ligantes tipo polisserina, peptí- dios e polipeptídios curtos de 6-40 aminoácidos de dois tipos de ami- noácidos selecionados dentre glicina (G), alanina (A), serina (S), treo- nina (T), glutamato (E) e prolina (P) com graus variáveis de estruturas secundárias de menos de 50% a mais de 50%, entre outros, ou duas ou mais combinações dos mesmos.
Em algumas modalidades, o poli- peptídio codificado pela sequência de nucleotídeos heterólogos é liga- do a uma porção não polipeptídica.
Exemplos não limitativos de por- ções não polipeptídicas incluem polietileno glicol (PEG), moléculas pe- quenas de ligação à albumina, ácido polissiálico, hidroxietil amido (HES), um derivado do mesmo, ou quaisquer combinações dos mes- mos.
[00165] Conforme usado neste pedido, o termo "região Fc" é defini- do como a porção de um polipeptídio que corresponde à região Fc da Ig nativa, i.e., formada pela associação dimérica dos respectivos do- mínios Fc de suas duas cadeias pesadas. Uma região Fc nativa forma um homodímero com uma outra região Fc. Em contraste, o termo "re- gião Fc geneticamente fusionada" ou "região Fc de cadeia única" (re- gião scFc), conforme usado neste pedido, refere-se a uma região Fc dimérica sintética compreendida de domínios Fc geneticamente liga- dos em uma única cadeia polipeptídica (i.e., codificada em uma única sequência genética contígua).
[00166] Em uma modalidade, a "região Fc" refere-se à porção de uma única cadeia pesada de Ig começando na região de dobradiç até a montante do sítio de clivagem de papaína (i.e., o resíduo 216 na IgG, considerando o primeiro resíduo da região constante da cadeia pesada como send o 114) e terminando no terminal C do aminoácido. Por conseguinte, um domínio Fc completo compreende pelo menos um domínio de dobradiça, um domínio CH2, e um domínio CH3.
[00167] A região Fc de uma região constante de Ig, dependendo do isótipo da Ig pode incluir os domínios CH2, CH3, e CH4, assim como a região de dobradiça. Proteínas quiméricas compreendendo uma região Fc de uma Ig conferem diversas propriedades desejáveis a uma prote- ína quimérica incluindo maior estabilidade, maior meia-vida sérica (vi- de Capon et al., 1989, Nature 337:525) assim como ligação a recepto- res de Fc tal como o receptor de Fc neonatal (FcRn) (Patentes US N°
6.086.875, 6.485.726, 6.030.613; WO 03/077834; US2003- 0235536A1), cujas íntegras encontram-se aqui incorporada a título de referência.
[00168] Uma "sequência de nucleotídeos de referência", quando usada neste pedido como uma comparação a uma sequência de nu- cleotídeos da invenção, é uma sequência de polinucleotídeos essenci-
almente idêntica à sequência de nucleotídeos da invenção exceto que a sequência não é otimizada. Por exemplo, a sequência de nucleotí- deos de referência para uma molécula de ácido nucleico consistindo no BDD FVIII códon-otimizado de SEQ ID NO: 1 e uma sequência de nucleotídeos heterólogos que codifica uma região Fc de cadeia única ligada à SEQ ID NO: 1 em sua extremidade 3' é uma molécula de áci- do nucleico que consiste no BDD FVIII original (ou "parental") de SEQ ID NO: 16 e a sequências de nucleotídeos heterólogos idênticos que codifica uma região Fc de cadeia única ligada à SEQ ID NO: 16 em sua extremidade 3’.
[00169] Conforme usado neste pedido, o termo "optimizado", com relação a sequências de nucleotídeos, refere-se a uma sequência de polinucleotídeos que codifica um polipeptídio, onde a sequência de polinucleotídeos fora mutada para melhorar uma propriedade daquela sequência de polinucleotídeos. Em algumas modalidades, a otimiza- ção é feita para aumentar os níveis de transcrição, aumentar os níveis de translação, aumentar os níveis de mRNA de estado estacionário, aumentar ou diminuir a ligação de proteínas reguladoras tais como fa- tores de transcrição em geral, aumentar ou diminuir a junção, ou au- mentar o rendimento do polipeptídio produzido pela sequência de poli- nucleotídeos. Exemplos de alterações que podem ser feitas em uma sequência de polinucleotídeos para otimizar a mesma incluem otimiza- ção de códons, otimização do teor de G/C, remoção de sequências de repetição, remoção de elementos ricos em AT, remoção de sítios de junção críptica, remoção de elementos cis-atuantes que reprimem a transcrição ou a translação, adição ou remoção de sequências de poli- T ou poli-A, adição de sequências em torno do sítio de início de trans- crição que melhoram a transcrição, tais como sequências de consenso de Kozak, remoção de sequências que poderiam formar estruturas do tipo tronco-alça, remoção de sequências desestabilizantes, e duas ou mais combinações das mesmas. II. Moléculas de Ácido Nucleico
[00170] A presente invenção está voltada para uma molécula de ácido nucleico livre de capsídeo e semelhante a um plasmídeo, a qual codifica uma sequência alvo, onde a sequência alvo codifica uma pro- teína terapêutica ou um gene que pode modular a expressão de uma proteína alvo, por exemplo, um miRNA. Um capsídeo, o envoltório pro- teico de um vírus, contém o material genético do vírus. Sabe-se que os capsídeos auxiliam as funções do vírion protegendo o genoma viral, distribuindo o genoma para um hospedeiro, e interagindo com o hos- pedeiro. Contudo, os capsídeos virais podem ser um fator que limita a capacidade de acondicionamento dos vetores e/ou que induz respos- tas imunológicas, especialmente quando usasdos em terapias genéti- cas.
[00171] Os vetores AAV surgiram como um dos tipos mais comuns de vetores para terapia genética. No entanto, a presença do capsídeo limita a utilidade de um vetor AAV em terapia genética. Em particular, o próprio capsídeo pode limitar o tamanho do transgene que é incluído no vetor em um valor tão baixo quanto menos de 4,5 kb. Várias proteí- nas terapêuticas que podem ser úteis em uma terapia genética podem exceder facilmente este tamanho mesmo antes da adição de elemen- tos reguladores.
[00172] Além disso, as proteínas que constituem o capsídeo podem funcionar como antígenos que podem ser direcionados pelo sistema imunológico de um indivíduo. AAV é muito comum na população em geral, a maioria das pessoas tendo sido expostas a um AAV durante a vida. Como resultado, os mais potenciais receptores de terapia genéti- ca provavelmente já desenvolveram uma resposta imunológica para um AAV, e, por conseguinte, é mais provável que rejeitem a terapia.
[00173] Certos aspectos da presente invenção têm como objetivo superar essas deficiências dos vetores AAV. Em particular, certos as- pectos da presente invenção estão voltados para uma molécula de ácido nucleico, compreendendo uma primeira ITR, uma segunda ITR, e um cassete genético, por exemplo, codificando uma proteína tera- pêutica e/ou a miRNA. Em algumas modalidades, a primeira ITR e uma segunda ITR flanqueiam um cassete genético compreendendo uma sequência de polinucleotídeos heterólogos. Em algumas modali- dades, a molécula de ácido nucleico não compreende um gene codifi- cando uma proteína capsídica, uma proteína de replicação, e/ou uma proteína de montagem. Em algumas modalidades, o cassete genético codifica uma proteína terapêutica. Em algumas modalidades, a proteí- na terapêutica compreende um fator de coagulação. Em algumas mo- dalidades, o cassete genético codifica um miRNA. Em certas modali- dades, o cassete genético está posicionado entre a primeira ITR e a segunda ITR. Em algumas modalidades, a molécula de ácido nucleico compreende ainda uma ou mais regiões não codificadoras. Em certas modalidades, a uma ou mais regiões não codificadoras compreendem uma sequência promotora, um íntron, um elemento regulador pós- transcricional, uma sequênia 3'UTR poli(A), ou qualquer combinação das mesmas.
[00174] Em uma modalidade, o cassete genético é um ácido nuclei- co de cordão simples. Em uma outra modalidade, o cassete genético é um ácido nucleico de cordão duplo.
[00175] Em uma modalidade, a molécula de ácido nucleico com- preende: (a) uma primeira ITR que é uma ITR de um membro da fa- mília não-AAV de Parvoviridae (por exemplo, um B19 ou GPV ITR); (b) uma sequência promotora tecido-específica, por exem- plo, promotor TTP; (c) um íntron, por exemplo, um íntron sintético;
(d) a nucleotídeo codificando um miRNA ou uma proteína terapêutica, por exemplo, um fator de coagulação; (e) um elemento regulador pós-transcricional, por exemplo, WPRE; (f) uma sequência de cauda de 3’UTR poli(A), por exemplo, bGHpA; (g) uma segunda ITR que é uma ITR de um membro da fa- mília não-AAV de Parvoviridae (por exemplo, um B19 ou GPV ITR).
[00176] Em uma modalidade, a molécula de ácido nucleico com- preende: (a) uma primeira ITR que é uma ITR de um membro da fa- mília não-AAV de Parvoviridae; (b) uma sequência promotora tecido-específica, por exem- plo, promotor TTP; (c) um íntron, por exemplo, um íntron sintético; (d) a nucleotídeo codificando um miRNA, onde o miRNA in- fra-regula a expressão de um gene alvo selecionado dentre SOD1, HTT, RHO, e qualquer combinação dos mesmos ; (e) um elemento regulador pós-transcricional, por exemplo, WPRE; (f) uma sequência de cauda de 3’UTR poli(A), por exemplo, bGHpA; (g) uma segunda ITR que é uma ITR de um membro da fa- mília não-AAV de Parvoviridae
[00177] Em uma modalidade, a molécula de ácido nucleico com- preende: (a) uma primeira ITR que é uma ITR de um membro da fa- mília não-AAV de Parvoviridae; (b) uma sequência promotora tecido-específica, por exem- plo, promotor TTP;
(c) um íntron, por exemplo, um íntron sintético; (d) um nucleotídeo codificando distrofina ligada ao X, MTM1 (miotubularina), tirosina hidroxilase, AADC, ciclo-hidrolase, SMN1, FXN (frataxina), GUCY2D, RS1, CFH, HTRA, ARMS, CFB/CC2, CNGA/CNGB, Prf65, ARSA, PSAP, IDUA (MPS I), IDS (MPS II), PAH, GAA (alfa-glucosidase ácida), ou qualquer combinação das mesmas; (e) um elemento regulador pós-transcricional, por exemplo, WPRE; (f) uma sequência de cauda de 3’UTR poli(A), por exemplo, bGHpA; (g) uma segunda ITR que é uma ITR de um membro da fa- mília não-AAV de Parvoviridae Em uma modalidade, a molécula de ácido nucleico compreende: (a) uma primeira ITR que é uma ITR de um AAV, por exemplo, o genoma de um AAV sorotipo 2; (b) uma sequência promotora tecido-específica, por exem- plo, promotor TTP; (c) um íntron, por exemplo, um íntron sintético; (d) um nucleotídeo codificando FVIII; onde o nucleotídeo tem pelo menos 85%, pelo menos 90%, pelo menos 95%, pelo menos 96%, pelo menos 97%, pelo menos 98%, ou pelo menos 99% de iden- tidade de sequência com uma sequência de nucleotídeos selecionada dentre SEQ ID NOs: 1-14 ou SEQ ID NO: 71, onde o FVIII codificado pelo nucleotídeo conserva uma atividade de FVIII; (e) um elemento regulador pós-transcricional, por exemplo, WPRE; (f) uma sequência de cauda de 3’UTR poli(A), por exemplo, bGHpA; e (g) uma segunda ITR que é uma ITR de um AAV, por exemplo, o genoma de um AAV sorotipo 2.
[00178] Em uma modalidade, a molécula de ácido nucleico com- preende: (a) uma primeira ITR que é uma ITR de um AAV, por exemplo, o genoma de um AAV sorotipo 2; (b) uma sequência promotora tecido-específica, por exem- plo, promotor TTP; (c) um íntron, por exemplo, um íntron sintético; (d) a nucleotídeo codificando um miRNA, onde o miRNA in- fra-regula a expressão de um gene alvo, por exemplo, SOD1, HTT, RHO, e qualquer combinação dos mesmos ; (f) uma sequência de cauda de 3’UTR poli(A), por exemplo, bGHpA; e (g) uma segunda ITR que é uma ITR de um AAV, por exemplo, o genoma de um AAV sorotipo 2. Em uma modalidade, a molécula de ácido nucleico compreende: (a) uma primeira ITR que é uma ITR de um AAV, por exemplo, o genoma de um AAV sorotipo 2; (b) uma sequência promotora tecido-específica, por exem- plo, promotor TTP; (c) um íntron, por exemplo, um íntron sintético; (d) um nucleotídeo codificando distrofina ligada ao X, MTM1 (miotubularina), tirosina hidroxilase, AADC, ciclo-hidrolase, SMN1, FXN (frataxina), GUCY2D, RS1, CFH, HTRA, ARMS, CFB/CC2, CNGA/CNGB, Prf65, ARSA, PSAP, IDUA (MPS I), IDS (MPS II), PAH, GAA (alfa-glucosidase ácida), ou qualquer combinação das mesmas; (f) uma sequência de cauda de 3’UTR poli(A), por exemplo, bGHpA; e (g) uma segunda ITR que é uma ITR de um AAV, por exemplo, o genoma de um AAV sorotipo 2.
[00179] Em uma outra modalidade, a molécula de ácido nucleico compreende: (a) uma primeira ITR; (b) uma sequência promotora tecido-específica, por exem- plo, promotor TTP; (c) um íntron, por exemplo, um íntron sintético; (d) um nucleotídeo codificando um miRNA ou uma proteína terapêutica, por exemplo, fator de coagulação; (e) um elemento regulador pós-transcricional, por exemplo, WPRE; (f) uma sequência de cauda de 3’UTR poli(A), por exemplo, bGHpA; e (g) uma segunda ITR, onde uma da primeira ITR ou da segunda ITR é uma ITR de um mem- bro da família não-AAV de Parvoviridae e a outra ITR é uma ITR de um AAV, por exemplo, o genoma de um AAV sorotipo 2.
[00180] Em uma outra modalidade, a molécula de ácido nucleico compreende: (a) uma 5’ ITR carregando a sequência de AAV2 5’ ITR apresentada na SEQ ID NO: 111; (b) uma sequência promotora tecido-específica, por exem- plo, promotor TTP; (c) um íntron, por exemplo, um íntron sintético; (d) uma sequência de polinucleotídeos heterólogos codifi- cando FVIII, por exemplo, FVIIIco6XTEN; (e) um elemento regulador pós-transcricional, por exemplo, WPRE; (f) uma sequência de cauda de 3’UTR poli(A), por exemplo, bGHpA; e/ou (g) uma 3’ ITR carregando a sequência de AAV2 3’ ITR apresentada na SEQ ID NO: 124.
[00181] Em uma outra modalidade, a molécula de ácido nucleico compreende: (a) uma 5’ ITR carregando a sequência de AAV2 5’ ITR apresentada na SEQ ID NO: 111; (b) uma sequência promotora tecido-específica, por exem- plo, CAG promoter; (c) um íntron, por exemplo, um íntron sintético; (d) uma sequência de polinucleotídeos heterólogos codifi- cando FVIII, por exemplo, FVIIIco6XTEN; (e) um elemento regulador pós-transcricional, por exemplo, WPRE; (f) uma sequência de cauda de 3’UTR poli(A), por exemplo, bGHpA; e/ou (g) uma 3’ ITR carregando a sequência de AAV2 3’ ITR apresentada na SEQ ID NO: 193. Em uma outra modalidade, a molécula de ácido nucleico compreende: (a) uma primeira ITR; (b) uma sequência promotora tecido-específica, promotor TTP; (c) um íntron, por exemplo, um íntron sintético; (d) um nucleotídeo codificando um miRNA ou uma proteína terapêutica, por exemplo, fator de coagulação; (e) um elemento regulador pós-transcricional, por exemplo, WPRE; (f) uma sequência de cauda de 3’UTR poli(A), por exemplo, bGHpA; e (g) uma segunda ITR, onde a primeira ITR é uma ITR sintética, a segunda ITR é ima ITR sintética, ou tanto a primeira ITR quanto a segunda ITR são ITRs sintéticas.
[00182] Em uma outra modalidade, a molécula de ácido nucleico compreende: (a) uma primeira B19 ITR; (b) uma sequência promotora tecido-específica, por exem- plo, promotor TTP; (c) um íntron, por exemplo, um íntron sintético; (d) uma sequência de polinucleotídeos heterólogos codifi- cando uma proteína terapêutica selecionada do grupo que consiste em um fator de coagulação, um fator de crescimento, um hormônio, uma citocina, um anticorpo, um fragmento do mesmo, e uma combinação dos mesmos; (e) um elemento regulador pós-transcricional, por exemplo, WPRE; (f) uma sequência de cauda de 3’UTR poli(A), por exemplo, bGHpA; e/ou (g) uma segunda B19 ITR.
[00183] Em uma outra modalidade, a molécula de ácido nucleico compreende: (a) uma primeira GPV ITR; (b) uma sequência promotora tecido-específica, por exem- plo, promotor TTP; (c) um íntron, por exemplo, um íntron sintético; (d) uma sequência de polinucleotídeos heterólogos codifi- cando uma proteína terapêutica selecionada do grupo que consiste em um fator de coagulação, um fator de crescimento, um hormônio, uma citocina, um anticorpo, um fragmento do mesmo, e uma combinação dos mesmos; (e) um elemento regulador pós-transcricional, por exemplo, WPRE; (f) uma sequência de cauda de 3’UTR poli(A), por exemplo,
bGHpA; e/ou (g) uma segunda GPV ITR.
[00184] Em uma outra modalidade, a molécula de ácido nucleico compreende: (a) uma primeira B19 ITR; (b) uma sequência promotora ubíqua, por exemplo, promo- tor CAG; (c) um íntron, por exemplo, um íntron sintético; (d) uma sequência de polinucleotídeos heterólogos codifi- cando uma proteína terapêutica selecionada do grupo que consiste em um fator de coagulação, um fator de crescimento, um hormônio, uma citocina, um anticorpo, um fragmento do mesmo, e uma combinação dos mesmos; (e) um elemento regulador pós-transcricional, por exemplo, WPRE; (f) uma sequência de cauda de 3’UTR poli(A), por exemplo, bGHpA; e/ou (g) uma segunda B19 ITR.
[00185] Em uma outra modalidade, a molécula de ácido nucleico compreende: (a) uma primeira GPV ITR; (b) uma sequência promotora ubíqua, por exemplo, promo- tor CAG; (c) um íntron, por exemplo, um íntron sintético; (d) uma sequência de polinucleotídeos heterólogos codifi- cando uma proteína terapêutica selecionada do grupo que consiste em um fator de coagulação, um fator de crescimento, um hormônio, uma citocina, um anticorpo, um fragmento do mesmo, e uma combinação dos mesmos; (e) um elemento regulador pós-transcricional, por exemplo,
WPRE; (f) uma sequência de cauda de 3’UTR poli(A), por exemplo, bGHpA; e/ou (g) uma segunda GPV ITR.
[00186] Em uma outra modalidade, a molécula de ácido nucleico compreende: (a) uma primeira B19 ITR; (b) uma sequência promotora tecido-específica, por exem- plo, promotor TTP; (c) um íntron, por exemplo, um íntron sintético; (d) uma sequência de polinucleotídeos heterólogos codifi- cando fenilalanina hidroxilase (PAH); (e) um elemento regulador pós-transcricional, por exemplo, WPRE; (f) uma sequência de cauda de 3’UTR poli(A), por exemplo, bGHpA; e/ou (g) uma segunda B19 ITR.
[00187] Em uma outra modalidade, a molécula de ácido nucleico compreende: (a) uma primeira GPV ITR; (b) uma sequência promotora tecido-específica, por exem- plo, promotor TTP; (c) um íntron, por exemplo, um íntron sintético; (d) uma sequência de polinucleotídeos heterólogos codifi- cando fenilalanina hidroxilase (PAH); (e) um elemento regulador pós-transcricional, por exemplo, WPRE; (f) uma sequência de cauda de 3’UTR poli(A), por exemplo, bGHpA; e/ou (g) uma segunda GPV ITR.
[00188] Em uma outra modalidade, a molécula de ácido nucleico compreende: (a) uma 5’ ITR carregando a sequência de B19d135 5’ ITR apresentada na SEQ ID NO: 180; (b) uma sequência promotora tecido-específica, por exem- plo, promotor TTP; (c) um íntron, por exemplo, um íntron sintético; (d) uma sequência de polinucleotídeos heterólogos codifi- cando FVIII, por exemplo, FVIIIco6XTEN; (e) um elemento regulador pós-transcricional, por exemplo, WPRE; (f) uma sequência de cauda de 3’UTR poli(A), por exemplo, bGHpA; e/ou (g) uma 3’ ITR carregando a sequência de B19d135 3’ ITR apresentada na SEQ ID NO: 181.
[00189] Em uma outra modalidade, a molécula de ácido nucleico compreende: (a) uma 5’ ITR carregando a sequência de GPVd162 5’ ITR apresentada na SEQ ID NO: 183; (b) uma sequência promotora tecido-específica, por exem- plo, promotor TTP; (c) um íntron, por exemplo, um íntron sintético; (d) uma sequência de polinucleotídeos heterólogos codifi- cando FVIII, por exemplo, FVIIIco6XTEN; (e) um elemento regulador pós-transcricional, por exemplo, WPRE; (f) uma sequência de cauda de 3’UTR poli(A), por exemplo, bGHpA; e/ou (g) uma 3’ ITR carregando a sequência de GPVd162 3’ ITR apresentada na SEQ ID NO: 184.
[00190] Em uma outra modalidade, a molécula de ácido nucleico compreende: (a) uma 5’ ITR carregando a sequência de B19 5’ ITR de comprimento total apresentada na SEQ ID NO: 185; (b) uma sequência promotora tecido-específica, por exem- plo, promotor TTP; (c) um íntron, por exemplo, um íntron sintético; (d) uma sequência de polinucleotídeos heterólogos codifi- cando FVIII, por exemplo, FVIIIco6XTEN; (e) um elemento regulador pós-transcricional, por exemplo, WPRE; (f) uma sequência de cauda de 3’UTR poli(A), por exemplo, bGHpA; e/ou (g) uma 3’ ITR carregando a sequência de B19 3’ ITR de comprimento total apresentada na SEQ ID NO: 186.
[00191] Em uma outra modalidade, a molécula de ácido nucleico compreende: (a) uma 5’ ITR carregando a sequência de GPV 5’ ITR de comprimento total apresentada na SEQ ID NO: 187; (b) uma sequência promotora tecido-específica, por exem- plo, promotor TTP; (c) um íntron, por exemplo, um íntron sintético; (d) uma sequência de polinucleotídeos heterólogos codifi- cando FVIII, por exemplo, FVIIIco6XTEN; (e) um elemento regulador pós-transcricional, por exemplo, WPRE; (f) uma sequência de cauda de 3’UTR poli(A), por exemplo, bGHpA; e/ou (g) uma 3’ ITR carregando a sequência de GPV 3’ ITR de comprimento total apresentada na SEQ ID NO: 188.
[00192] Em uma outra modalidade, a molécula de ácido nucleico compreende: (a) uma 5’ ITR carregando a sequência de B19d135 5’ ITR apresentada na SEQ ID NO: 180; (b) uma sequência promotora tecido-específica, por exem- plo, promotor CAG; (c) um íntron, por exemplo, um íntron sintético; (d) uma sequência de polinucleotídeos heterólogos codifi- cando PAH; (e) um elemento regulador pós-transcricional, por exemplo, WPRE; (f) uma sequência de cauda de 3’UTR poli(A), por exemplo, bGHpA; e/ou (g) uma 3’ ITR carregando a sequência de B19d135 3’ ITR apresentada na SEQ ID NO: 181.
[00193] Em uma outra modalidade, a molécula de ácido nucleico compreende: (a) uma 5’ ITR carregando a sequência de GPVd162 5’ ITR apresentada na SEQ ID NO: 183; (b) uma sequência promotora tecido-específica, por exem- plo, promotor CAG; (c) um íntron, por exemplo, um íntron sintético; (d) uma sequência de polinucleotídeos heterólogos codifi- cando PAH; (e) um elemento regulador pós-transcricional, por exemplo, WPRE; (f) uma sequência de cauda de 3’UTR poli(A), por exemplo, bGHpA; e/ou (g) uma 3’ ITR carregando a sequência de GPVd162 3’ ITR apresentada na SEQ ID NO: 184.
[00194] Em uma outra modalidade, a molécula de ácido nucleico compreende: (a) uma 5’ ITR carregando a sequência de full length B19 5’ ITR apresentada na SEQ ID NO: 185; (b) uma sequência promotora tecido-específica, por exem- plo, promotor CAG; (c) um íntron, por exemplo, um íntron sintético; (d) uma sequência de polinucleotídeos heterólogos codifi- cando PAH; (e) um elemento regulador pós-transcricional, por exemplo, WPRE; (f) uma sequência de cauda de 3’UTR poli(A), por exemplo, bGHpA; e/ou (g) uma 3’ ITR carregando a sequência de full length B19 3’ ITR apresentada na SEQ ID NO: 186.
[00195] Em uma outra modalidade, a molécula de ácido nucleico compreende: (a) uma 5’ ITR carregando a sequência de GPV 5’ ITR de comprimento total apresentada na SEQ ID NO: 187; (b) uma sequência promotora tecido-específica, por exem- plo, promotor CAG; (c) um íntron, por exemplo, um íntron sintético; (d) uma sequência de polinucleotídeos heterólogos codifi- cando PAH; (e) um elemento regulador pós-transcricional, por exemplo, WPRE; (f) uma sequência de cauda de 3’UTR poli(A), por exemplo, bGHpA; e/ou (g) uma 3’ ITR carregando a sequência de GPV 3’ ITR de comprimento total apresentada na SEQ ID NO: 188.
A. Repetições Terminais Invertidas
[00196] Certos aspectos da presente invenção estão voltados para uma molécula de ácido nucleico compreendendo uma primeira ITR, por exemplo, a 5' ITR, e uma segunda ITR, por exemplo, a 3' ITR. Ti- picamente, as ITRs estão envolvidas na replicação e no resgate, ou excisão, de DNA parvovírus (por exemplo, AAV) a partir de plasmídeos procarióticos (Samulski et al., 1983, 1987; Senapathy et al., 1984; Got- tlieb and Muzyczka, 1988). Além disso, as ITRs parecem ser as se- quências mínimas necessárias para integração proviral de AAV e para acondicionamento do DNA de AAV em vírions (McLaughlin et al., 1988; Samulski et al., 1989). Estes elementos são essenciais para a multiplicação eficiente do genoma de um parvovírus. A hipótese é que os elementos de definição mínimos indispensáveis para a função da ITR são um sítio de ligação a Rep (por exemplo, RBS; GCGCG- CTCGCTCGCTC (SEQ ID NO: 104) para AAV2) e um sítio de resolu- ção terminal (por exemplo, TRS; AGTTGG (SEQ ID NO: 105) para AAV2) mais uma sequência palindrômica variável que permite a for- mação do tipo grampo de cabelo. As regiões nucleotídicas palindrômi- cas normalmente funcionam juntas em cis como origens de replicação de DNA e como sinais de acondicionamento para o vírus. Sequências complementares nas ITRs se dobram em uma estrutura do tipo gram- po de cabelo durante a formação do DNA. Em algumas modalidades, as ITRs fold into a hairpin T-shaped structure. Em outras modalidades, as ITRs se dobram em uma estrutura do tipo grampo de cabelo não em forma de T, por exemplo, em uma estrutura do tipo grampo de ca- belo em forma de U. Os dados sugerem que as estruturas do tipo grampo de cabelo em forma de T das AAV ITRs podem inibir a ex- pressão de um transgene flanqueado pelas ITRs. Vide, por exemplo, Zhou et al., Scientific Reports 7:5432 (July 14, 2017). Ao utilizar uma ITR que não forma estruturas do tipo grampo de cabelo em forma de
T, esta forma de inibição pode ser evitada. Por conseguinte, em certos aspectos, um polinucleotídeo compreendendo uma não-AAV ITR apresenta uma expressão transgênica melhorada em relação a um polinucleotídeo compreendendo uma AAV ITR que forma um grampo de cabelo em forma de T.
[00197] Em algumas modalidades, a ITR compreende uma ITR de ocorrência natural, por exemplo, a ITR compreende toda a ITR de um parvovírus ou uma porção da mesma. Em algumas modalidades, a ITR compreende uma sequência sintética. Em uma modalidade, a pri- meira ITR ou a segunda ITR compreende uma sequência sintética. Em uma outra modalidade, cada uma da primeira ITR e da segunda ITR compreende uma sequência sintética. Em algumas modalidades, a primeira ITR ou a segunda ITR compreende uma sequência de ocor- rência natural. Em uma outra modalidade, cada um da primeira ITR e da segunda ITR compreende uma sequência de ocorrência natural.
[00198] Em algumas modalidades, a ITR compreende ou consiste em uma porção de uma ITR de ocorrência natural, por exemplo, uma ITR truncada. Em algumas modalidades, a ITR compreende ou consis- te em um fragmento de uma ITR de ocorrência natural, onde o frag- mento compreende pelo menos cerca de 5 nucleotídeos, pelo menos cerca de 10 nucleotídeos, pelo menos cerca de 15 nucleotídeos, pelo menos cerca de 20 nucleotídeos, pelo menos cerca de 25 nucleotí- deos, pelo menos cerca de 30 nucleotídeos, pelo menos cerca de 35 nucleotídeos, pelo menos cerca de 40 nucleotídeos, pelo menos cerca de 45 nucleotídeos, pelo menos cerca de 50 nucleotídeos, pelo menos cerca de 55 nucleotídeos, pelo menos cerca de 60 nucleotídeos, pelo menos cerca de 65 nucleotídeos, pelo menos cerca de 70 nucleotí- deos, pelo menos cerca de 75 nucleotídeos, pelo menos cerca de 80 nucleotídeos, pelo menos cerca de 85 nucleotídeos, pelo menos cerca de 90 nucleotídeos, pelo menos cerca de 95 nucleotídeos, pelo menos cerca de 100 nucleotídeos, pelo menos cerca de 125 nucleotídeos, pelo menos cerca de 150 nucleotídeos, pelo menos cerca de 175 nu- cleotídeos, pelo menos cerca de 200 nucleotídeos, pelo menos cerca de 225 nucleotídeos, pelo menos cerca de 250 nucleotídeos, pelo me- nos cerca de 275 nucleotídeos, pelo menos cerca de 300 nucleotí- deos, pelo menos cerca de 325 nucleotídeos, pelo menos cerca de 350 nucleotídeos, pelo menos cerca de 375 nucleotídeos, pelo menos cerca de 400 nucleotídeos, pelo menos cerca de 425 nucleotídeos, pelo menos cerca de 450 nucleotídeos, pelo menos cerca de 475 nu- cleotídeos, pelo menos cerca de 500 nucleotídeos, pelo menos cerca de 525 nucleotídeos, pelo menos cerca de 550 nucleotídeos, pelo me- nos cerca de 575 nucleotídeos, ou pelo menos cerca de 600 nucleotí- deos; onde a ITR conserva uma propriedade funcional da ITR de ocor- rência natural. Em certas modalidades, a ITR compreende ou consiste em um fragmento de uma ITR de ocorrência natural, onde o fragmento compreende pelo menos cerca de 129 nucleotídeos; onde a ITR con- serva uma propriedade funcional da ITR de ocorrência natural. Em cer- tas modalidades, a ITR compreende ou consiste em um fragmento ITR de ocorrência natural, onde o fragmento compreende pelo menos cer- ca de 102 nucleotídeos; onde a ITR conserva uma propriedade funcio- nal ITR de ocorrência natural.
[00199] Em algumas modalidades, a ITR compreende ou consiste em um porção de uma ITR de ocorrência natural, onde o fragmento compreende pelo menos cerca de 5%, pelo menos cerca de 10%, pelo menos cerca de 15%, pelo menos cerca de 20%, pelo menos cerca de 25%, pelo menos cerca de 30%, pelo menos cerca de 35%, pelo me- nos cerca de 40%, pelo menos cerca de 45%, pelo menos cerca de 50%, pelo menos cerca de 55%, pelo menos cerca de 60%, pelo me- nos cerca de 65%, pelo menos cerca de 70%, pelo menos cerca de 75%, pelo menos cerca de 80%, pelo menos cerca de 85%, pelo me-
nos cerca de 90%, pelo menos cerca de 95%, pelo menos cerca de 96%, pelo menos cerca de 97%, pelo menos cerca de 98%, ou pelo menos cerca de 99% do comprimento da ITR de ocorrência natural; onde o fragmento conserva uma propriedade funcional da ITR de ocor- rência natural.
[00200] Em certas modalidades, a ITR compreende ou consiste em uma sequência que tem uma identidade de sequência de pelo menos 50%, pelo menos 51%, pelo menos 52%, pelo menos 53%, pelo me- nos 54%, pelo menos 55%, pelo menos 56%, pelo menos 57%, pelo menos 58%, pelo menos 59%, pelo menos 60%, pelo menos 61%, pe- lo menos 62%, pelo menos 63%, pelo menos 64%, pelo menos 65%, pelo menos 66%, pelo menos 67%, pelo menos 68%, pelo menos 69%, pelo menos 70%, pelo menos 71%, pelo menos 72%, pelo me- nos 73%, pelo menos 74%, pelo menos 75%, pelo menos 76%, pelo menos 77%, pelo menos 78%, pelo menos 79%, pelo menos 80%, pe- lo menos 81%, pelo menos 82%, pelo menos 83%, pelo menos 84%, pelo menos 85%, pelo menos 86%, pelo menos 87%, pelo menos 88%, pelo menos 89%, pelo menos 90%, pelo menos 91%, pelo me- nos 92%, pelo menos 93%, pelo menos 94%, pelo menos 95%, pelo menos 96%, pelo menos 97%, pelo menos 98%, pelo menos 99%, ou 100% com uma porção homóloga de uma ITR de ocorrência natural, quando alinhada de forma apropriada; onde a ITR conserva uma pro- priedade funcional da ITR de ocorrência natural. Em outras modalida- des, a ITR compreende ou consiste em uma sequência que tem uma identidade de sequência de pelo menos 90% com uma porção homó- loga de uma ITR de ocorrência natural, quando alinhada de forma apropriada; onde a ITR conserva uma propriedade funcional da ITR de ocorrência natural. Em algumas modalidades, a ITR compreende ou consiste em uma sequência que tem uma identidade de sequência de pelo menos 80% com uma porção homóloga de uma ITR de ocorrên-
cia natural, quando alinhada de forma apropriada; onde a ITR conser- va uma propriedade funcional da ITR de ocorrência natural. Em algu- mas modalidades, a ITR compreende ou consiste em uma sequência que tem uma identidade de sequência de pelo menos 70% com uma porção homóloga de uma ITR de ocorrência natural, quando alinhada de forma apropriada; onde a ITR conserva uma propriedade funcional da ITR de ocorrência natural. Em algumas modalidades, a ITR com- preende ou consiste em uma sequência que tem uma identidade de sequência de pelo menos 60% com uma porção homóloga de uma ITR de ocorrência natural, quando alinhada de forma apropriada; onde a ITR conserva uma propriedade funcional da ITR de ocorrência natural. Em algumas modalidades, a ITR compreende ou consiste em uma se- quência que tem uma identidade de sequência de pelo menos 50% com uma porção homóloga de uma ITR de ocorrência natural, quando alinhada de forma apropriada; onde a ITR conserva uma propriedade funcional da ITR de ocorrência natural.
[00201] Em algumas modalidades, a ITR compreende uma ITR de um genoma de AAV. Em algumas modalidades, a ITR é uma ITR de um genoma de AAV selecionado dentre AAV1, AAV2, AAV3, AAV4, AAV5, AAV6, AAV7, AAV8, AAV9, AAV10 AAV11, e qualquer combi- nação dos mesmos. Em uma modalidade particular, a ITR é uma ITR do genoma de AAV2. Em uma outra modalidade, a ITR é uma se- quência sintética geneticamente modificada para incluir em suas ex- tremidades 5′ e 3′ ITRs derivadas de um ou mais dos genomas de AAV.
[00202] Em algumas modalidades, a ITR é não é derivada de um genoma de AAV. Em algumas modalidades, a ITR é uma ITR de um não-AAV. Em algumas modalidades, a ITR é uma ITR de um genoma de não-AAV da família viral Parvoviridae selecionado, porém sem limi- tação, do grupo que consiste em Bocavirus, Dependovirus, Erythrovi-
rus, Amdovirus, Parvovirus, Densovirus, Iteravirus, Contravirus, Ave- parvovirus, Copiparvovirus, Protoparvovirus, Tetraparvovirus, Ambi- densovirus, Brevidensovirus, Hepandensovirus, Penstyldensovirus e qualquer combinação dos mesmos. Em certas modalidades, a ITR é derivada de eritrovírus parvovírus B19 (vírus humano). Em uma outra modalidade, a ITR é derivada de uma cepa de parvovírus de pato-do- mato (MDPV). Em certas modalidades, a cepa de MDPV é atenuada, por exemplo, a cepa FZ91-30 de MDPV. Em outras modalidades, a cepa de MDPV é patogênica, por exemplo, a cepa YY de MDPV. Em algumas modalidades, a ITR é derivada de um parvovírus suíno, por exemplo, o parvovírus suíno U44978. Em algumas modalidades, a ITR é derivada de um vírus minuto de camundongos, por exemplo, o vírus minuto de camundongos U34256. Em algumas modalidades, a ITR é derivada de um parvovírus canino, por exemplo, o parvovírus canino M19296. Em algumas modalidades, a ITR é derivada de um vírus da enterite de visões, por exemplo, o vírus da enterite de visões D00765. Em algumas modalidades, a ITR é derivada de um Dependoparvovi- rus. Em uma modalidade, o parvovírus Dependoparvovirus é uma ce- pa do parvovírus de ganso Dependovirus (GPV). Em uma modalidade específica, a cepa de GPV é atenuada, por exemplo, a cepa 82-0321V de GPV. Em uma outra modalidade específica, a cepa de GPV é pato- gênica, por exemplo, cepa B de GPV.
[00203] A primeira ITR e a segunda ITR da molécula de ácido nu- cleico podem ser derivadas do mesmo genoma, por exemplo, do ge- noma do mesmo vírus, ou de genomas diferentes, por exemplo, dos genomas de dois ou mais genomais virais diferentes. Em certas moda- lidades, a primeira ITR e a segunda ITR são derivadas do mesmo ge- noma de AAV. Em uma modalidade específica, as duas ITRs presen- tes na molécula de ácido nucleico da invenção são as mesmas, e po- dem ser em AAV2 ITRs. Em outras modalidades, a primeira ITR é de-
rivada de um genoma de AAV e a segunda ITR nãol é derivada de um genoma de AAV (por exemplo, um genoma de não-AAV). Em outras modalidades, a primeira ITR não é é derivada de um genoma de AAV (por exemplo, um genoma não-AAV) e a segunda ITR é derivada de um genoma de AAV. Em ainda outras modalidades, tanto a primeira ITR quanto a segunda ITR não são derivadas de um genoma de AAV (por exemplo, um genoma não-AAV). Em uma modalidade particular, a primeira ITR e a segunda ITR são idênticas.
[00204] Em algumas modalidades, a primeira ITR é derivada de um genoma de AAV, e a segunda ITR é derivada de um genoma selecio- nado do grupo que consiste em Bocavirus, Dependovirus, Erythrovirus, Amdovirus, Parvovirus, Densovirus, Iteravirus, Contravirus, Aveparvo- virus, Copiparvovirus, Protoparvovirus, Tetraparvovirus, Ambidensovi- rus, Brevidensovirus, Hepandensovirus, Penstyldensovirus e qualquer combinação dos mesmos. Em outras modalidades, a segunda ITR é derivada de um genoma de AAV, e a primeira ITR é derivada de um genoma selecionado do grupo que consiste em Bocavirus, Dependovi- rus, Erythrovirus, Amdovirus, Parvovirus, Densovirus, Iteravirus, Con- travirus, Aveparvovirus, Copiparvovirus, Protoparvovirus, Tetraparvovi- rus, Ambidensovirus, Brevidensovirus, Hepandensovirus, Penstylden- sovirus, e qualquer combinação dos mesmos. Em outras modalidades, a primeira ITR e a segunda ITR são derivadas de um genoma selecio- nado do grupo que consiste em Bocavirus, Dependovirus, Erythrovirus, Amdovirus, Parvovirus, Densovirus, Iteravirus, Contravirus, Aveparvo- virus, Copiparvovirus, Protoparvovirus, Tetraparvovirus, Ambidensovi- rus, Brevidensovirus, Hepandensovirus, Penstyldensovirus, e qualquer combinação dos mesmos, onde a primeira ITR e a segunda ITR são derivadas do mesmo genoma. Em outras modalidades, a primeira ITR e a segunda ITR são derivadas de um genoma selecionado do grupo que consiste em Bocavirus, Dependovirus, Erythrovirus, Amdovirus,
Parvovirus, Densovirus, Iteravirus, Contravirus, Aveparvovirus, Copi- parvovirus, Protoparvovirus, Tetraparvovirus, Ambidensovirus, Brevi- densovirus, Hepandensovirus, Penstyldensovirus, e qualquer combi- nação dos mesmos, onde a primeira ITR e a segunda ITR são deriva- das de genomas diferentes.
[00205] Em algumas modalidades, a primeira ITR é derivada de um genoma de AAV, e a segunda ITR é derivada de eritrovírus parvovírus B19 (vírus humano). Em outras modalidades, a segunda ITR é deriva- da de um genoma de AAV, e a primeira ITR é derivada de eritrovírus parvovírus B19 (vírus humano).
[00206] Em certas modalidades, a primeira ITR e/ou a segunda ITR compreende ou consiste em toda uma ITR derivada de B19 ou uma porção da mesma. Em algumas modalidades, a primeira ITR e/ou a segunda ITR compreende ou consiste em uma sequência de nucleotí- deos pelo menos cerca de 50%, pelo menos cerca de 55%, pelo me- nos cerca de 60%, pelo menos cerca de 65%, pelo menos cerca de 65%, pelo menos cerca de 70%, pelo menos cerca de 75%, pelo me- nos cerca de 80%, pelo menos cerca de 85%, pelo menos cerca de 90%, pelo menos cerca de 95%, pelo menos cerca de 96%, pelo me- nos cerca de 97%, pelo menos cerca de 98%, pelo menos cerca de 99%, ou 100% idêntica a uma sequência de nucleotídeos selecionada dentre as SEQ ID NOs: 167, 168, 169, 170, e 171, onde a primeira ITR e/ou a segunda ITR conserva uma propriedade funcional da B19 ITR da qual ela deriva. Em algumas modalidades, a primeira ITR e/ou a segunda ITR compreende ou consiste em uma sequência de nucleotí- deos pelo menos cerca de 50%, pelo menos cerca de 55%, pelo me- nos cerca de 60%, pelo menos cerca de 65%, pelo menos cerca de 65%, pelo menos cerca de 70%, pelo menos cerca de 75%, pelo me- nos cerca de 80%, pelo menos cerca de 85%, pelo menos cerca de 90%, pelo menos cerca de 95%, pelo menos cerca de 96%, pelo me-
nos cerca de 97%, pelo menos cerca de 98%, pelo menos cerca de 99%, ou 100% idêntica a uma sequência de nucleotídeos selecionado dentre as SEQ ID NOs: 167, 168, 169, 170, e 171, onde a primeira ITR e/ou a segunda ITR é capaz de forma uma estrutura do tipo grampo de cabelo. Em certas modalidades, a estrutura do tipo grampo de cabelo não compreende um grampo de cabelo em forma de T.
[00207] Em algumas modalidades, a primeira ITR e/ou a segunda ITR compreende ou consiste em uma sequência de nucleotídeos sele- cionada dentre as SEQ ID NOs: 167, 168, 169, 170, e 171. Em algu- mas modalidades, a primeira ITR e/ou a segunda ITR compreende ou consiste em a sequência de nucleotídeos apresentada na SEQ ID NO:
167. Em algumas modalidades, a primeira ITR e/ou a segunda ITR compreende ou consiste em a sequência de nucleotídeos apresentada na SEQ ID NO: 168. Em algumas modalidades, a primeira ITR e/ou a segunda ITR compreende ou consiste em a sequência de nucleotídeos apresentada na SEQ ID NO: 169. Em algumas modalidades, a primei- ra ITR e/ou a segunda ITR compreende ou consiste em a sequência de nucleotídeos apresentada na SEQ ID NO: 170. Em algumas moda- lidades, a primeira ITR e/ou a segunda ITR compreende ou consiste em a sequência de nucleotídeos apresentada na SEQ ID NO: 171.
Tabela 1. Sequências de ITR de Espécimes de Parvovírus. Com- Parvo- ITR Descrição primen- Sequência vírus ID to (nt)
CCAAATCAGATGCCGCCGGTCGCCG CCGGTAGGCGGGACTTCCGGTACAA GATGGCGGACAATTACGTCATTTCCT GTGACGTCATTTCCTGTGACGTCACT TCCGGTGGGCGGGACTTCCGGAATT AGGGTTGGCTCTGGGCCAGCTTGCT
TGGGGTTGCCTTGACACTAAGACAA Gene Bank: GCGGCGCGCCGCTTGATCTTAGTGG wt 383 KY940273.1 CACGTCAACCCCAAGCGCTGGCCCA
GAGCCAACCCTAATTCCGGAAGTCC CGCCCACCGGAAGTGACGTCACAGG AAATGACGTCACAGGAAATGACGTA ATTGTCCGCCATCTTGTACCGGAAGT CCCGCCTACCGGCGGCGACCGGCG
GCATCTGATTTGGTGTCTTCTTTTAA ATTTT (SEQ ID NO: 167)
CTCTGGGCCAGCTTGCTTGGGGTTG CCTTGACACTAAGACAAGCGGCGCG CCGCTTGATCTTAGTGGCACGTCAA
CCCCAAGCGCTGGCCCAGAGCCAAC exclui os
CCTAATTCCGGAAGTCCCGCCCACC 135 primei- d135 248 GGAAGTGACGTCACAGGAAATGACG ros nucleotí-
TCACAGGAAATGACGTAATTGTCCG deos
CCATCTTGTACCGGAAGTCCCGCCT B19 ACCGGCGGCGACCGGCGGCATCTG
ATTTGGTGTCTTCTTTTAAATTTT (SEQ ID NO: 168)
CGGCGCGCCGCTTGATCTTAGTGGC sequência
ACGTCAACCAGCGCTGGCCCAGAGC mínima ba-
CAACCCTAATTCCGGAAGTCCTCAGT v1 seada na 129
CCGCCATCTTGCCCGCCTACCGGCG comparação
GCGACCGGCGGCATCATTTGGTGTT com AAV2 CTT (SEQ ID NO: 169) exclui os 135 primei- ros nucleotí-
CTCTGGGCCAGCTTGCTTGGGGTTG deos e os
CCTTGACACTAAGACAAGCGGCGCG 135 nucleo- v2 113 CCGCTTGATCTTAGTGGCACGTCAA tídeos com-
CCCCAAGCGCTGGCCCAGAGTGTCT plementares TCTTTTAAATTTT (SEQ ID NO: 170) correspon- dentes no palíndromo sequência CAAATCAGATGCCGCCGGTCGCCGC mínima ba- CGGTAGGCGGGACTTCCGGTACAAG v3 seada na 340 ATGGCGGACAATTACGTCATTTCCTG comparação TGACGTATTTCCTGTGACGTACTTCC com GPV GGTGGCGGGACTTCCGGAATTTTGG
Com- Parvo- ITR Descrição primen- Sequência vírus ID to (nt)
CTCTGGGCCAGCTTGCTTGGGGTTG CCTTGACCAAGCGCGCGCCGCTTGA TCACCCCAAGCGCTGGCCCAGAGCC ACCTAACCGGAAGTCCCCCCACCGG AAGTGACGTCACAGGAAAGACGTCA CAGGAAGTAATTGTCCGCCATCTTGT ACCGGAAGTCCCGCACCGGCGGCG
ACCGGCGGCATCTGATTTGGTGTCT TCTTTTAAATTTT (SEQ ID NO: 171)
CTCATTGGAGGGTTCGTTCGTTCGA ACCAGCCAATCAGGGGAGGGGGAA GTGACGCAAGTTCCGGTCACATGCT TCCGGTGACGCACATCCGGTGACGT AGTTCCGGTCACGTGCTTCCTGTCA CGTGTTTCCGGTCACGTGACTTCCG GTCATGTGACTTCCGGTGACGTGTTT CCGGCTGTTAGGTTGACCACGCGCA
TGCCGCGCGGTCAGCCCAATAGTTA Gene Bank: wt 444 AGCCGGAAACACGTCACCGGAAGTC U25749.1
ACATGACCGGAAGTCACGTGACCGG AAACACGTGACAGGAAGCACGTGAC CGGAACTACGTCACCGGATGTGCGT CACCGGAAGCATGTGACCGGAACTT GCGTCACTTCCCCCTCCCCTGATTG GCTGGTTCGAACGAACGAACCCTCC
AATGAGACTCAAGGACAAGAGGATA TTTTGCGCGCCAGGAAGTG (SEQ ID NO: 172)
CGGTGACGTGTTTCCGGCTGTTAGG GPV TTGACCACGCGCATGCCGCGCGGTC AGCCCAATAGTTAAGCCGGAAACAC
GTCACCGGAAGTCACATGACCGGAA exclui os GTCACGTGACCGGAAACACGTGACA 162 primei- GGAAGCACGTGACCGGAACTACGTC d162 282 ros nucleotí- ACCGGATGTGCGTCACCGGAAGCAT deos GTGACCGGAACTTGCGTCACTTCCC
CCTCCCCTGATTGGCTGGTTCGAAC GAACGAACCCTCCAATGAGACTCAA
GGACAAGAGGATATTTTGCGCGCCA GGAAGTG (SEQ ID NO: 173)
TTGACCACGCGCATGCCGCGCGGTC sequência AGCCCAATAGTTAAGCCGGGTGACC mínima ba- ACACGTGACAGGAAGCACGGGATGT v1 seada na 145 GCGTCACCGGAAGCAGTGACCGGG comparação CTGGTTCGAACGAACGAACCCTCCA com AAV2 ACTCAAGGACAAGAGGATATT (SEQ ID NO: 174) exclui os CGGTGACGTGTTTCCGGCTGTTAGG v2 162 primei- 120 TTGACCACGCGCATGCCGCGCGGTC ros nucleotí- AGCCCAATAGTTAAGCCGGAAACAC
Com- Parvo- ITR Descrição primen- Sequência vírus ID to (nt) deos e os GTCACCGACTCAAGGACAAGAGGAT 162 nucleo- ATTTTGCGCGCCAGGAAGTG (SEQ tídeos com- ID NO: 175) plementares correspon- dentes no palíndromo sequência GGGAACAATCAGGGGAAGTGACCG mínima ba- GTGACGTCATGTAACTTGCGTCACTT v3 seada na 102 CCCGTTCGAACGAACGAACGAGACT comparação CAAGGACAAGAGGCGCGCCAGGAA com B19 GTG (SEQ ID NO: 176)
TTGGCCACTCCCTCTCTGCGCGCTC
GCTCGCTCACTGAGGCCGGGCGAC Gene Bank: CAAAGGTCGCCCGACGCCCGGGCTT wt NC_001401. 145 TGCCCGGGCGGCCTCAGTGAGCGA 2 GCGAGCGCGCAGAGAGGGAGTGGC
CAACTCCATCACTAGGGGTTCCT AAV2 (SEQ ID NO: 177)
CTGCGCGCTCGCTCGCTCACTGAGG
CCGCCCGGGCAAAGCCCGGGCGTC Usados em GGGCGACCTTTGGTCGCCCGGCCTC GTx 130 vetores GTx AGTGAGCGAGCGAGCGCGCAGAGA
GGGAGTGGCCAACTCCATCACTAGG GGTTCCT (SEQ ID NO: 178)
[00208] Em certas modalidades, a primeira ITR e/ou a segunda ITR compreende uma sequência de nucleotídeos pelo menos cerca de 50%, pelo menos cerca de 55%, pelo menos cerca de 60%, pelo me- nos cerca de 65%, pelo menos cerca de 65%, pelo menos cerca de 70%, pelo menos cerca de 75%, pelo menos cerca de 80%, pelo me- nos cerca de 85%, pelo menos cerca de 90%, pelo menos cerca de 95%, pelo menos cerca de 96%, pelo menos cerca de 97%, pelo me- nos cerca de 98%, pelo menos cerca de 99%, ou 100% idêntica à se- quência de nucleotídeos apresentada na SEQ ID NO: 167. Em certas modalidades, a primeira ITR e/ou a segunda ITR consiste em SEQ ID NO: 167. Em certas modalidades, a primeira ITR e/ou a segunda ITR compreende uma sequência de nucleotídeos pelo menos cerca de 50%, pelo menos cerca de 55%, pelo menos cerca de 60%, pelo me- nos cerca de 65%, pelo menos cerca de 65%, pelo menos cerca de
70%, pelo menos cerca de 75%, pelo menos cerca de 80%, pelo me- nos cerca de 85%, pelo menos cerca de 90%, pelo menos cerca de 95%, pelo menos cerca de 96%, pelo menos cerca de 97%, pelo me- nos cerca de 98%, pelo menos cerca de 99%, ou 100% idêntica à se- quência de nucleotídeos apresentada na SEQ ID NO: 168. Em certas modalidades, a primeira ITR e/ou a segunda ITR consiste em SEQ ID NO: 168. Em certas modalidades, a primeira ITR e/ou a segunda ITR compreende uma sequência de nucleotídeos, onde a sequência de nucleotídeos compreende a sequência de nucleotídeos mínima apre- sentada na SEQ ID NO: 169, e onde a sequência de nucleotídeos é a pelo menos cerca de 50%, pelo menos cerca de 55%, pelo menos cer- ca de 60%, pelo menos cerca de 65%, pelo menos cerca de 65%, pelo menos cerca de 70%, pelo menos cerca de 75%, pelo menos cerca de 80%, pelo menos cerca de 85%, pelo menos cerca de 90%, pelo me- nos cerca de 95%, pelo menos cerca de 96%, pelo menos cerca de 97%, pelo menos cerca de 98%, pelo menos cerca de 99%, ou 100% idêntica à sequência de nucleotídeos apresentada na SEQ ID NO: 167, conserva uma propriedade funcional da B19 ITR da qual ela deri- va.
Em algumas modalidades, a primeira ITR e/ou a segunda ITR compreende uma sequência de nucleotídeos, onde a sequência de nucleotídeos compreende a sequência de nucleotídeos mínima apre- sentada na SEQ ID NO: 169, e onde a sequência de nucleotídeos é a pelo menos cerca de 50%, pelo menos cerca de 55%, pelo menos cer- ca de 60%, pelo menos cerca de 65%, pelo menos cerca de 65%, pelo menos cerca de 70%, pelo menos cerca de 75%, pelo menos cerca de 80%, pelo menos cerca de 85%, pelo menos cerca de 90%, pelo me- nos cerca de 95%, pelo menos cerca de 96%, pelo menos cerca de 97%, pelo menos cerca de 98%, pelo menos cerca de 99%, ou 100% idêntica à sequência de nucleotídeos apresentada na SEQ ID NO: 167, onde a primeira ITR e/ou a segunda ITR é capaz de formar uma estrutura do tipo grampo de cabelo. Em certas modalidades, a estrutu- ra do tipo grampo de cabelo não compreende um grampo de cabelo em forma de T.
[00209] Em certas modalidades, a primeira ITR e/ou a segunda ITR compreende ou consiste em toda uma ITR derivada de B19 ou uma porção da mesma. Em algumas modalidades, a segunda ITR é um complemento reverso da primeira ITR. Em algumas modalidades, a primeira ITR é um complemento reverso da segunda ITR. Em algumas modalidades, a primeira ITR e/ou a segunda ITR compreende ou con- siste em uma sequência de nucleotídeos pelo menos cerca de 50%, pelo menos cerca de 55%, pelo menos cerca de 60%, pelo menos cer- ca de 65%, pelo menos cerca de 65%, pelo menos cerca de 70%, pelo menos cerca de 75%, pelo menos cerca de 80%, pelo menos cerca de 85%, pelo menos cerca de 90%, pelo menos cerca de 95%, pelo me- nos cerca de 96%, pelo menos cerca de 97%, pelo menos cerca de 98%, pelo menos cerca de 99%, ou 100% idêntica a uma sequência de nucleotídeos selecionada dentre as SEQ ID NOs: 180, 181, 185, e 186, ou um derivado funcional da mesma. Em algumas modalidades, o derivado funcional conserva uma propriedade funcional da B19 ITR da qual ele deriva. Em algumas modalidades, a primeira ITR e/ou a se- gunda ITR compreende ou consiste em uma sequência de nucleotí- deos pelo menos cerca de 50%, pelo menos cerca de 55%, pelo me- nos cerca de 60%, pelo menos cerca de 65%, pelo menos cerca de 65%, pelo menos cerca de 70%, pelo menos cerca de 75%, pelo me- nos cerca de 80%, pelo menos cerca de 85%, pelo menos cerca de 90%, pelo menos cerca de 95%, pelo menos cerca de 96%, pelo me- nos cerca de 97%, pelo menos cerca de 98%, pelo menos cerca de 99%, ou 100% idêntica a uma sequência de nucleotídeos selecionada dentre as SEQ ID NOs: 180, 181, 185, e 186, ou um derivado funcional da mesma. Em algumas modalidades, o derivado funcional é capaz de formar uma estrutura do tipo grampo de cabelo. Em certas modalida- des, a estrutura do tipo grampo de cabelo não compreende um gram- po de cabelo em forma de T.
[00210] Em certas modalidades, a primeira ITR e/ou a segunda ITR compreende uma sequência de nucleotídeos pelo menos cerca de 50%, pelo menos cerca de 55%, pelo menos cerca de 60%, pelo me- nos cerca de 65%, pelo menos cerca de 65%, pelo menos cerca de 70%, pelo menos cerca de 75%, pelo menos cerca de 80%, pelo me- nos cerca de 85%, pelo menos cerca de 90%, pelo menos cerca de 95%, pelo menos cerca de 96%, pelo menos cerca de 97%, pelo me- nos cerca de 98%, pelo menos cerca de 99%, ou 100% idêntica à se- quência de nucleotídeos apresentada na SEQ ID NO: 180. Em certas modalidades, a primeira ITR e/ou a segunda ITR consiste em SEQ ID NO: 180. Em certas modalidades, a primeira ITR e/ou a segunda ITR compreende uma sequência de nucleotídeos pelo menos cerca de 50%, pelo menos cerca de 55%, pelo menos cerca de 60%, pelo me- nos cerca de 65%, pelo menos cerca de 65%, pelo menos cerca de 70%, pelo menos cerca de 75%, pelo menos cerca de 80%, pelo me- nos cerca de 85%, pelo menos cerca de 90%, pelo menos cerca de 95%, pelo menos cerca de 96%, pelo menos cerca de 97%, pelo me- nos cerca de 98%, pelo menos cerca de 99%, ou 100% idêntica à se- quência de nucleotídeos apresentada na SEQ ID NO: 181. Em certas modalidades, a primeira ITR e/ou a segunda ITR consiste em SEQ ID NO: 181. Em certas modalidades, a primeira ITR e/ou a segunda ITR compreende uma sequência de nucleotídeos pelo menos cerca de 50%, pelo menos cerca de 55%, pelo menos cerca de 60%, pelo me- nos cerca de 65%, pelo menos cerca de 65%, pelo menos cerca de 70%, pelo menos cerca de 75%, pelo menos cerca de 80%, pelo me- nos cerca de 85%, pelo menos cerca de 90%, pelo menos cerca de 95%, pelo menos cerca de 96%, pelo menos cerca de 97%, pelo me-
nos cerca de 98%, pelo menos cerca de 99%, ou 100% idêntica à se- quência de nucleotídeos apresentada na SEQ ID NO: 185. Em certas modalidades, a primeira ITR e/ou a segunda ITR consiste em SEQ ID NO: 185. Em certas modalidades, a primeira ITR e/ou a segunda ITR compreende uma sequência de nucleotídeos pelo menos cerca de 50%, pelo menos cerca de 55%, pelo menos cerca de 60%, pelo me- nos cerca de 65%, pelo menos cerca de 65%, pelo menos cerca de 70%, pelo menos cerca de 75%, pelo menos cerca de 80%, pelo me- nos cerca de 85%, pelo menos cerca de 90%, pelo menos cerca de 95%, pelo menos cerca de 96%, pelo menos cerca de 97%, pelo me- nos cerca de 98%, pelo menos cerca de 99%, ou 100% idêntica à se- quência de nucleotídeos apresentada na SEQ ID NO: 186. Em certas modalidades, a primeira ITR e/ou a segunda ITR consiste em SEQ ID NO: 186.
[00211] Em algumas modalidades, a primeira ITR e/ou a segunda ITR compreende ou consiste em uma sequência de nucleotídeos sele- cionada dentre as SEQ ID NOs: 180, 181, 185, e 186. Em algumas modalidades, a primeira ITR compreende ou consiste em a sequência de nucleotídeos apresentada na SEQ ID NO: 180. Em algumas moda- lidades, a primeira ITR compreende ou consiste em a sequência de nucleotídeos apresentada na SEQ ID NO: 181. Em algumas modalida- des, a primeira ITR compreende ou consiste em a sequência de nu- cleotídeos apresentada na SEQ ID NO: 185. Em algumas modalida- des, a primeira ITR compreende ou consiste em a sequência de nu- cleotídeos apresentada na SEQ ID NO: 186. Em algumas modalida- des, a segunda ITR compreende ou consiste em a sequência de nu- cleotídeos apresentada na SEQ ID NO: 180. Em algumas modalida- des, a segunda ITR compreende ou consiste em a sequência de nu- cleotídeos apresentada na SEQ ID NO: 181. Em algumas modalida- des, a segunda ITR compreende ou consiste em a sequência de nu-
cleotídeos apresentada na SEQ ID NO: 185. Em algumas modalida- des, a segunda ITR compreende ou consiste em a sequência de nu- cleotídeos apresentada na SEQ ID NO: 186.
[00212] Em algumas modalidades, a primeira ITR compreende ou consiste em a sequência de nucleotídeos apresentada na SEQ ID NO:180, e a segunda ITR compreende ou consiste em a sequência de nucleotídeos apresentada na SEQ ID NO: 181. Em algumas modalida- des, a primeira ITR compreende ou consiste em a sequência de nu- cleotídeos apresentada na SEQ ID NO:181, e a segunda ITR compre- ende ou consiste em a sequência de nucleotídeos apresentada na SEQ ID NO: 180. Em algumas modalidades, a primeira ITR compre- ende ou consiste em a sequência de nucleotídeos apresentada na SEQ ID NO:185, e a segunda ITR compreende ou consiste em a se- quência de nucleotídeos apresentada na SEQ ID NO: 186. Em algu- mas modalidades, a primeira ITR compreende ou consiste em a se- quência de nucleotídeos apresentada na SEQ ID NO:186, e a segunda ITR compreende ou consiste em a sequência de nucleotídeos apre- sentada na SEQ ID NO: 185.
[00213] Em algumas modalidades, a primeira ITR é derivada de um genoma de AAV, e a segunda ITR é derivada de GPV. Em outras mo- dalidades, a segunda ITR é derivada de um genoma de AAV, e a pri- meira ITR é derivada de GPV.
[00214] Em certas modalidades, a primeira ITR e/ou a segunda ITR compreende uma sequência de nucleotídeos pelo menos cerca de 50%, pelo menos cerca de 55%, pelo menos cerca de 60%, pelo me- nos cerca de 65%, pelo menos cerca de 65%, pelo menos cerca de 70%, pelo menos cerca de 75%, pelo menos cerca de 80%, pelo me- nos cerca de 85%, pelo menos cerca de 90%, pelo menos cerca de 95%, pelo menos cerca de 96%, pelo menos cerca de 97%, pelo me- nos cerca de 98%, pelo menos cerca de 99%, ou 100% idêntica à se-
quência de nucleotídeos apresentada na SEQ ID NO: 172. Em certas modalidades, a primeira ITR e/ou a segunda ITR consiste em SEQ ID NO: 172. Em certas modalidades, a primeira ITR e/ou a segunda ITR compreende uma sequência de nucleotídeos pelo menos cerca de 50%, pelo menos cerca de 55%, pelo menos cerca de 60%, pelo me- nos cerca de 65%, pelo menos cerca de 65%, pelo menos cerca de 70%, pelo menos cerca de 75%, pelo menos cerca de 80%, pelo me- nos cerca de 85%, pelo menos cerca de 90%, pelo menos cerca de 95%, pelo menos cerca de 96%, pelo menos cerca de 97%, pelo me- nos cerca de 98%, pelo menos cerca de 99%, ou 100% idêntica à se- quência de nucleotídeos apresentada na SEQ ID NO: 173. Em certas modalidades, a primeira ITR e/ou a segunda ITR consiste em SEQ ID NO: 173. Em certas modalidades, a primeira ITR e/ou a segunda ITR compreende ou consiste em todos ou uma parte de uma ITR derivada de GPV.
Em algumas modalidades, a primeira ITR e/ou a segunda ITR compreende ou consiste em uma sequência de nucleotídeos pelo me- nos cerca de 50%, pelo menos cerca de 55%, pelo menos cerca de 60%, pelo menos cerca de 65%, pelo menos cerca de 65%, pelo me- nos cerca de 70%, pelo menos cerca de 75%, pelo menos cerca de 80%, pelo menos cerca de 85%, pelo menos cerca de 90%, pelo me- nos cerca de 95%, pelo menos cerca de 96%, pelo menos cerca de 97%, pelo menos cerca de 98%, pelo menos cerca de 99%, ou 100% idêntica a uma sequência de nucleotídeos selecionada dentre as SEQ ID NOs: 172, 173, 174, 175, e 176, onde a primeira ITR e/ou a segun- da ITR conserva uma propriedade funcional da GPV ITR da qual ela deriva.
Em algumas modalidades, a primeira ITR e/ou a segunda ITR compreende ou consiste em toda uma ITR derivada de GPV ou uma porção da mesma.
Em algumas modalidades, a primeira ITR e/ou a segunda ITR compreende ou consiste em uma sequência de nucleotí- deos pelo menos cerca de 50%, pelo menos cerca de 55%, pelo me-
nos cerca de 60%, pelo menos cerca de 65%, pelo menos cerca de 65%, pelo menos cerca de 70%, pelo menos cerca de 75%, pelo me- nos cerca de 80%, pelo menos cerca de 85%, pelo menos cerca de 90%, pelo menos cerca de 95%, pelo menos cerca de 96%, pelo me- nos cerca de 97%, pelo menos cerca de 98%, pelo menos cerca de 99%, ou 100% idêntica a uma sequência de nucleotídeos selecionada dentre as SEQ ID NOs: 172, 173, 174, 175, e 176, onde a primeira ITR e/ou a segunda ITR é capaz de formar uma estrutura do tipo grampo de cabelo. Em certas modalidades, a estrutura do tipo grampo de ca- belo não compreende um grampo de cabelo em forma de T. Em algu- mas modalidades, a primeira ITR e/ou a segunda ITR compreende ou consiste em uma sequência de nucleotídeos selecionada dentre as SEQ ID NOs: 172, 173, 174, 175, e 176. Em algumas modalidades, a primeira ITR e/ou a segunda ITR compreende ou consiste em a se- quência de nucleotídeos apresentada na SEQ ID NO: 172. Em algu- mas modalidades, a primeira ITR e/ou a segunda ITR compreende ou consiste em a sequência de nucleotídeos apresentada na SEQ ID NO:
173. Em algumas modalidades, a primeira ITR e/ou a segunda ITR compreende ou consiste em a sequência de nucleotídeos apresentada na SEQ ID NO: 174. Em algumas modalidades, a primeira ITR e/ou a segunda ITR compreende ou consiste em a sequência de nucleotídeos apresentada na SEQ ID NO: 175. Em algumas modalidades, a primei- ra ITR e/ou a segunda ITR compreende ou consiste em a sequência de nucleotídeos apresentada na SEQ ID NO: 176.
[00215] Em certas modalidades, a primeira ITR e/ou a segunda ITR compreende uma sequência de nucleotídeos, onde a sequência de nucleotídeos compreende a sequência de nucleotídeos mínima apre- sentada na SEQ ID NO: 174, e onde a sequência de nucleotídeos é a pelo menos cerca de 50%, pelo menos cerca de 55%, pelo menos cer- ca de 60%, pelo menos cerca de 65%, pelo menos cerca de 65%, pelo menos cerca de 70%, pelo menos cerca de 75%, pelo menos cerca de 80%, pelo menos cerca de 85%, pelo menos cerca de 90%, pelo me- nos cerca de 95%, pelo menos cerca de 96%, pelo menos cerca de 97%, pelo menos cerca de 98%, pelo menos cerca de 99%, ou 100% idêntica à sequência de nucleotídeos apresentada na SEQ ID NO: 172, onde a primeira ITR e/ou a segunda ITR conserva uma proprie- dade funcional da GPV ITR da qual ela deriva. Em algumas modalida- des, a primeira ITR e/ou a segunda ITR compreende uma sequência de nucleotídeos, onde a sequência de nucleotídeos compreende a se- quência de nucleotídeos mínima apresentada na SEQ ID NO: 174, e onde a sequência de nucleotídeos é a pelo menos cerca de 50%, pelo menos cerca de 55%, pelo menos cerca de 60%, pelo menos cerca de 65%, pelo menos cerca de 65%, pelo menos cerca de 70%, pelo me- nos cerca de 75%, pelo menos cerca de 80%, pelo menos cerca de 85%, pelo menos cerca de 90%, pelo menos cerca de 95%, pelo me- nos cerca de 96%, pelo menos cerca de 97%, pelo menos cerca de 98%, pelo menos cerca de 99%, ou 100% idêntica à sequência de nu- cleotídeos apresentada na SEQ ID NO: 172, onde a primeira ITR e/ou a segunda ITR é capaz de formar uma estrutura do tipo grampo de ca- belo. Em certas modalidades, a estrutura do tipo grampo de cabelo não compreende um grampo de cabelo em forma de T.
[00216] Em certas modalidades, a primeira ITR e/ou a segunda ITR compreende uma sequência de nucleotídeos, onde a sequência de nucleotídeos compreende a sequência de nucleotídeos mínima apre- sentada na SEQ ID NO: 176, e onde a sequência de nucleotídeos é a pelo menos cerca de 50%, pelo menos cerca de 55%, pelo menos cer- ca de 60%, pelo menos cerca de 65%, pelo menos cerca de 65%, pelo menos cerca de 70%, pelo menos cerca de 75%, pelo menos cerca de 80%, pelo menos cerca de 85%, pelo menos cerca de 90%, pelo me- nos cerca de 95%, pelo menos cerca de 96%, pelo menos cerca de
97%, pelo menos cerca de 98%, pelo menos cerca de 99%, ou 100% idêntica à sequência de nucleotídeos apresentada na SEQ ID NO: 172, onde a primeira ITR e/ou a segunda ITR conserva uma proprie- dade funcional da GPV ITR da qual ela deriva. Em algumas modalida- des, a primeira ITR e/ou a segunda ITR compreende uma sequência de nucleotídeos, onde a sequência de nucleotídeos compreende a se- quência de nucleotídeos mínima apresentada na SEQ ID NO: 176, e onde a sequência de nucleotídeos é a pelo menos cerca de 50%, pelo menos cerca de 55%, pelo menos cerca de 60%, pelo menos cerca de 65%, pelo menos cerca de 65%, pelo menos cerca de 70%, pelo me- nos cerca de 75%, pelo menos cerca de 80%, pelo menos cerca de 85%, pelo menos cerca de 90%, pelo menos cerca de 95%, pelo me- nos cerca de 96%, pelo menos cerca de 97%, pelo menos cerca de 98%, pelo menos cerca de 99%, ou 100% idêntica à sequência de nu- cleotídeos apresentada na SEQ ID NO: 172, onde a primeira ITR e/ou a segunda ITR é capaz de formar uma estrutura do tipo grampo de ca- belo. Em certas modalidades, a estrutura do tipo grampo de cabelo não compreende um grampo de cabelo em forma de T.
[00217] Em certas modalidades, a primeira ITR e/ou a segunda ITR compreende ou consiste em toda uma ITR derivada de GPV ou uma porção da mesma. Em algumas modalidades, a segunda ITR é um complemento reverso da primeira ITR. Em algumas modalidades, a primeira ITR é um complemento reverso da segunda ITR. Em algumas modalidades, a primeira ITR e/ou a segunda ITR compreende ou con- siste em uma sequência de nucleotídeos pelo menos cerca de 50%, pelo menos cerca de 55%, pelo menos cerca de 60%, pelo menos cer- ca de 65%, pelo menos cerca de 65%, pelo menos cerca de 70%, pelo menos cerca de 75%, pelo menos cerca de 80%, pelo menos cerca de 85%, pelo menos cerca de 90%, pelo menos cerca de 95%, pelo me- nos cerca de 96%, pelo menos cerca de 97%, pelo menos cerca de
98%, pelo menos cerca de 99%, ou 100% idêntica a uma sequência de nucleotídeos selecionada dentre as SEQ ID NOs: 183, 184, 187 e 188, ou um derivado funcional da mesma. Em algumas modalidades, o derivado funcional conserva uma propriedade funcional of the GPV ITR da qual ela deriva. Em algumas modalidades, a primeira ITR e/ou a segunda ITR compreende ou consiste em uma sequência de nucleo- tídeos pelo menos cerca de 50%, pelo menos cerca de 55%, pelo me- nos cerca de 60%, pelo menos cerca de 65%, pelo menos cerca de 65%, pelo menos cerca de 70%, pelo menos cerca de 75%, pelo me- nos cerca de 80%, pelo menos cerca de 85%, pelo menos cerca de 90%, pelo menos cerca de 95%, pelo menos cerca de 96%, pelo me- nos cerca de 97%, pelo menos cerca de 98%, pelo menos cerca de 99%, ou 100% idêntica a uma sequência de nucleotídeos selecionada dentre as SEQ ID NOs: 183, 184, 187 e 188, ou um derivado funcional da mesma. Em algumas modalidades, o derivado funcional é capaz de formar uma estrutura do tipo grampo de cabelo. Em certas modalida- des, a estrutura do tipo grampo de cabelo não compreende um gram- po de cabelo em forma de T.
[00218] Em certas modalidades, a primeira ITR e/ou a segunda ITR compreende uma sequência de nucleotídeos pelo menos cerca de 50%, pelo menos cerca de 55%, pelo menos cerca de 60%, pelo me- nos cerca de 65%, pelo menos cerca de 65%, pelo menos cerca de 70%, pelo menos cerca de 75%, pelo menos cerca de 80%, pelo me- nos cerca de 85%, pelo menos cerca de 90%, pelo menos cerca de 95%, pelo menos cerca de 96%, pelo menos cerca de 97%, pelo me- nos cerca de 98%, pelo menos cerca de 99%, ou 100% idêntica à se- quência de nucleotídeos apresentada na SEQ ID NO: 183. Em certas modalidades, a primeira ITR e/ou a segunda ITR consiste em SEQ ID NO: 183. Em certas modalidades, a primeira ITR e/ou a segunda ITR compreende uma sequência de nucleotídeos pelo menos cerca de
50%, pelo menos cerca de 55%, pelo menos cerca de 60%, pelo me- nos cerca de 65%, pelo menos cerca de 65%, pelo menos cerca de 70%, pelo menos cerca de 75%, pelo menos cerca de 80%, pelo me- nos cerca de 85%, pelo menos cerca de 90%, pelo menos cerca de 95%, pelo menos cerca de 96%, pelo menos cerca de 97%, pelo me- nos cerca de 98%, pelo menos cerca de 99%, ou 100% idêntica à se- quência de nucleotídeos apresentada na SEQ ID NO: 184. Em certas modalidades, a primeira ITR e/ou a segunda ITR consiste em SEQ ID NO: 184. Em certas modalidades, a primeira ITR e/ou a segunda ITR compreende uma sequência de nucleotídeos pelo menos cerca de 50%, pelo menos cerca de 55%, pelo menos cerca de 60%, pelo me- nos cerca de 65%, pelo menos cerca de 65%, pelo menos cerca de 70%, pelo menos cerca de 75%, pelo menos cerca de 80%, pelo me- nos cerca de 85%, pelo menos cerca de 90%, pelo menos cerca de 95%, pelo menos cerca de 96%, pelo menos cerca de 97%, pelo me- nos cerca de 98%, pelo menos cerca de 99%, ou 100% idêntica à se- quência de nucleotídeos apresentada na SEQ ID NO: 187. Em certas modalidades, a primeira ITR e/ou a segunda ITR consiste em SEQ ID NO: 187. Em certas modalidades, a primeira ITR e/ou a segunda ITR compreende uma sequência de nucleotídeos pelo menos cerca de 50%, pelo menos cerca de 55%, pelo menos cerca de 60%, pelo me- nos cerca de 65%, pelo menos cerca de 65%, pelo menos cerca de 70%, pelo menos cerca de 75%, pelo menos cerca de 80%, pelo me- nos cerca de 85%, pelo menos cerca de 90%, pelo menos cerca de 95%, pelo menos cerca de 96%, pelo menos cerca de 97%, pelo me- nos cerca de 98%, pelo menos cerca de 99%, ou 100% idêntica à se- quência de nucleotídeos apresentada na SEQ ID NO: 188. Em certas modalidades, a primeira ITR e/ou a segunda ITR consiste em SEQ ID NO: 188.
[00219] Em algumas modalidades, a primeira ITR e/ou a segunda
ITR compreende ou consiste em uma sequência de nucleotídeos se- lected from SEQ ID NOs: 183, 184, 187 and 188. Em algumas modali- dades, a primeira ITR compreende ou consiste em a sequência de nu- cleotídeos apresentada na SEQ ID NO: 183. Em algumas modalida- des, a primeira ITR compreende ou consiste em a sequência de nu- cleotídeos apresentada na SEQ ID NO: 184. Em algumas modalida- des, a primeira ITR compreende ou consiste em a sequência de nu- cleotídeos apresentada na SEQ ID NO: 187. Em algumas modalida- des, a primeira ITR compreende ou consiste em a sequência de nu- cleotídeos apresentada na SEQ ID NO: 188. Em algumas modalida- des, a segunda ITR compreende ou consiste em a sequência de nu- cleotídeos apresentada na SEQ ID NO: 183. Em algumas modalida- des, a segunda ITR compreende ou consiste em a sequência de nu- cleotídeos apresentada na SEQ ID NO: 184. Em algumas modalida- des, a segunda ITR compreende ou consiste em a sequência de nu- cleotídeos apresentada na SEQ ID NO: 187. Em algumas modalida- des, a segunda ITR compreende ou consiste em a sequência de nu- cleotídeos apresentada na SEQ ID NO: 188.
[00220] Em algumas modalidades, a primeira ITR compreende ou consiste em a sequência de nucleotídeos apresentada na SEQ ID NO:183, e a segunda ITR compreende ou consiste em a sequência de nucleotídeos apresentada na SEQ ID NO: 184. Em algumas modalida- des, a primeira ITR compreende ou consiste em a sequência de nu- cleotídeos apresentada na SEQ ID NO:184, e a segunda ITR compre- ende ou consiste em a sequência de nucleotídeos apresentada na SEQ ID NO: 183. Em algumas modalidades, a primeira ITR compre- ende ou consiste em a sequência de nucleotídeos apresentada na SEQ ID NO:187, e a segunda ITR compreende ou consiste em a se- quência de nucleotídeos apresentada na SEQ ID NO: 188. Em algu- mas modalidades, a primeira ITR compreende ou consiste em a se-
quência de nucleotídeos apresentada na SEQ ID NO:188, e a segunda ITR compreende ou consiste em a sequência de nucleotídeos apre- sentada na SEQ ID NO: 187.
[00221] Em certas modalidades, uma dentre a primeira ITR ou a segunda ITR compreende ou consiste em toda uma ITR derivada de AAV2 ou uma porção da mesma. Em algumas modalidades, a primeira ITR ou a segunda ITR compreende ou consiste em uma sequência de nucleotídeos pelo menos cerca de 50%, pelo menos cerca de 55%, pelo menos cerca de 60%, pelo menos cerca de 65%, pelo menos cer- ca de 65%, pelo menos cerca de 70%, pelo menos cerca de 75%, pelo menos cerca de 80%, pelo menos cerca de 85%, pelo menos cerca de 90%, pelo menos cerca de 95%, pelo menos cerca de 96%, pelo me- nos cerca de 97%, pelo menos cerca de 98%, pelo menos cerca de 99%, ou 100% idêntica a uma sequência de nucleotídeos apresentada na SEQ ID NOs: 177 ou 178, onde a primeira ITR e/ou a segunda ITR conserva uma propriedade funcional da AAV2 ITR da qual ela deriva. Em algumas modalidades, a primeira ITR ou a segunda ITR compre- ende ou consiste em uma sequência de nucleotídeos pelo menos cer- ca de 50%, pelo menos cerca de 55%, pelo menos cerca de 60%, pelo menos cerca de 65%, pelo menos cerca de 65%, pelo menos cerca de 70%, pelo menos cerca de 75%, pelo menos cerca de 80%, pelo me- nos cerca de 85%, pelo menos cerca de 90%, pelo menos cerca de 95%, pelo menos cerca de 96%, pelo menos cerca de 97%, pelo me- nos cerca de 98%, pelo menos cerca de 99%, ou 100% idêntica a uma sequência de nucleotídeos apresentada na SEQ ID NOs: 177 ou 178, onde a primeira ITR e/ou a segunda ITR é capaz de formar uma estru- tura do tipo grampo de cabelo. Em certas modalidades, a estrutura do tipo grampo de cabelo não compreende um grampo de cabelo em for- ma de T. Em algumas modalidades, a primeira ITR e/ou a segunda ITR compreende ou consiste em uma sequência de nucleotídeos apresentada na SEQ ID NOs: 177 ou 178. Em algumas modalidades, a primeira ITR e/ou a segunda ITR compreende ou consiste na se- quência de nucleotídeos apresentada na SEQ ID NO: 177. Em algu- mas modalidades, a primeira ITR e/ou a segunda ITR compreende ou consiste em a sequência de nucleotídeos apresentada na SEQ ID NO:
178.
[00222] Em algumas modalidades, a primeira ITR é derivada de um genoma de AAV, e a segunda ITR é derivada de uma cepa de parvoví- rus de pato-do-mato (MDPV). Em outras modalidades, a segunda ITR é derivada de um genoma de AAV, e a primeira ITR é derivada de uma cepa de parvovírus de pato-do-mato (MDPV). Em certas modalidades, a cepa de MDPV é atenuada, por exemplo, a cepa FZ91-30 de MDPV. Em outras modalidades, a cepa de MDPV é patogênica, por exemplo, a cepa YY de MDPV.
[00223] Em algumas modalidades, a primeira ITR é derivada de um genoma de AAV, e a segunda ITR é derivada de um Dependoparvovi- rus. Em algumas modalidades, a segunda ITR é derivada de um ge- noma de AAV, e a primeira ITR é derivada de um Dependoparvovirus. Em outras modalidades, a primeira ITR é derivada de um genoma de AAV, e a segunda ITR é derivada de uma cepa de parvovírus de gan- so (GPV) Dependovirus. Em outras modalidades, a segunda ITR é de- rivada de um genoma de AAV, e a primeira ITR é derivada de uma ce- pa de GPV Dependovirus. Em certas modalidades, a cepa de GPV é atenuada, por exemplo, a cepa 82-0321V de GPV. Em outras modali- dades, a cepa de GPV é patogênica, por exemplo, a cepa B de GPV.
[00224] Em certas modalidades, a primeira ITR é derivada de um genoma de AAV, e a segunda ITR é derivada de um genoma selecio- nado do grupo que consiste em parvovírus suíno, por exemplo, parvo- vírus suíno cepa U44978; vírus minuto de camundongo, por exemplo, vírus minuto de camundongo cepa U34256; parvovírus canino, por exemplo, parvovírus canino cepa M19296; vírus da enterite de visão, por exemplo, vírus da enterite de visão cepa D00765; e qualquer com- binação dos mesmos. Em outras modalidades, a segunda ITR é deri- vada de um genoma de AAV, e a primeira ITR é derivada de um ge- noma selecionado do grupo que consiste em parvovírus suíno, por exemplo, parvovírus suíno cepa U44978; vírus minuto de camundon- go, por exemplo, vírus minuto de camundongo cepa U34256; parvoví- rus canino, por exemplo, parvovírus canino cepa M19296; vírus da en- terite de visão, por exemplo, vírus da enterite de visão cepa D00765; e qualquer combinação dos mesmos.
[00225] Em uma modalidade particular, a ITR é uma sequência ge- neticamente modificada para incluir em suas extremidades 5′ e 3′ ITRs não derivadas de um genoma de AAV. Em uma outra modalidade par- ticular, a ITR é uma sequência geneticamente modificada para incluir em suas extremidades 5′ e 3′ ITRs derivadas de um ou mais genomas não-AAV. As duas ITRs presentes na molécula de ácido nucleico da invenção podem ser os mesmos genomas não-AAV ou genomas não- AAV diferentes. Em particular, as ITRs podem ser derivadas do mes- mo genoma não-AAV. Em uma modalidade específica, as duas ITRs presentes na molécula de ácido nucleico da invenção são as mesmas, e podem, em particular, ser AAV2 ITRs.
[00226] Em algumas modalidades, a sequência de ITR compreende uma ou mais sequências palindrômicas. Uma sequência palindrômica de uma ITR revelada neste pedido inclui, porém sem limitação, se- quências palindrômicas nativas (i.e., sequências encontradas na natu- reza), sequências sintéticas (i.e., sequências não encontradas na natu- reza), tais como sequências pseudo palindrômicas, e combinações ou formas modificadas das mesmas. Uma "sequência pseudo palindrômi- ca" é uma sequência de DNA palindrômica, incluindo uma sequência palindrômica imperfeita, que compartilha menos de 80% incluindo me-
nos de 70%, 60%, 50%, 40%, 30%, 20%, 10%, ou 5%, ou nenhuma, identidade de sequência de ácidos nucleicos com sequências em uma sequência palindrômica AAV ou não-AAV nativa que formam uma es- trutura secundária. As sequências palindrômicas nativas podem ser obtidas ou derivadas de qualquer genoma revelado neste pedido. A sequência palindrômica sintética pode ser baseada em qualquer ge- noma revelado neste pedido.
[00227] A sequência palindrômica pode ser contínua ou interrompi- da. Em algumas modalidades, a sequência palindrômica é interrompi- da, onde a sequência palindrômica compreende uma inserção de uma segunda sequence. Em algumas modalidades, a segunda sequência compreende um promotor, um melhorador, um sítio de integração para uma integrase (por exemplo, sítios para Cre ou Flp recombinase), uma fase de leitura aberta para um produto genético, ou uma combinação dos mesmos.
[00228] Em algumas modalidades, as ITRs formam estruturas do tipo alça de grampo de cabelo. Em uma modalidade, a primeira ITR forma uma estrutura do tipo alça de grampo de cabelo. Em uma outra modalidade, a segunda ITR forma uma estrutura do tipo alça de gram- po de cabelo. Em ainda uma outra modalidade, tanto a primeira ITR quanto a segunda ITR formam estruturas do tipo alça de grampo de cabelo. Em algumas modalidades, a primeira ITR e/ou a segunda ITR não forma uma estrutura tipo grampo de cabelo em forma de T. Em certas modalidades, a primeira ITR e/ou a segunda ITR formam forma uma estrutura tipo grampo de cabelo não em forma de T. Em algumas modalidades, a estrutura tipo grampo de cabelo não em forma de T compreende uma estrutura tipo grampo de cabelo em forma de U.
[00229] Em algumas modalidades, uma ITR em uma molécula de ácido nucleico descrita neste pedido pode ser uma ITR ativada trans- cricionalmente. Uma ITR ativada transcricionalmente pode compreen-
der toda ou uma porção de uma ITR do tipo selvagem que fora ativada por transcrição por inclusão de pelo menos um elemento transcricio- nalmente ativo. Vários tipos de elementos transcricionalmente ativos são adequados para uso neste contexto. Em algumas modalidades, o elemento transcricionalmente ativo é um elemento transcricionalmente ativo constitutivo. Elementos transcricionalmente ativos constitutivos proporcionam um nível contínuo de transcrição gênica, e são preferi- dos quando se deseja que o transgene seja expresso continuamente. Em outras modalidades, o elemento transcricionalmente ativo é um o elemento transcricionalmente ativo induzível. Os elementos transcrici- onalmente ativos induzíveis apresentam baixa atividade na ausência de um indutor (ou condição indutora), e são supra-regulados na pre- sença do indutor (ou mudança para uma condição indutora). Elemen- tos transcricionalmente ativos induzíveis podem ser preferidos quando se deseja a expressão em apenas determinados instantes ou em de- terminadas localizações, ou quando se deseja titular o nível de ex- pressão usando um agente indutor. Os elementos transcricionalmente ativos também podem ser tecido-específicos, isto é, eles apresentam atividade somente em determinados tecidos ou tipos de célula.
[00230] Os elementos transcricionalmente ativos podem ser incor- porados em uma ITR de diversas maneiras. Em algumas modalidades, um elemento transcricionalmente ativo é incorporado 5’ em relação a qualquer porção de uma ITR ou 3′ em relação a qualquer porção de uma ITR. Em outras modalidades, elemento transcricionalmente ativo de uma ITR ativada transcricionalmente fica entre duas sequências de ITR. Caso o elemento transcricionalmente ativo compreenda dois ou mais elementos que devem ficar afastados, esses elementos podem alternar-se com porções da ITR. Em algumas modalidades, uma estru- tura tipo grampo de cabelo de uma ITR é deltada e substituída por re- petições invertidas de um elemento transcricional. Este último arranjo criar um grampo de cabelo mimetizando a porção deletada na estrutu- ra. Múltipos elementos transcricionalmente ativos em tandem também podem estar presentes em uma ITR ativada transcricionalmente, e es- tes podem ser adjacentes ou estar afastados. Além disso, sítios de li- gação à proteínas (por exemplo, sítios de ligação à Rep) podem ser introduzidos nos elementos transcricionalmente ativos das ITRs ativa- das transcricionalmente. Um elemento transcricionalmente pode com- preender qualquer que permita a transcrição controlada do DNA pela RNA polimerase para formar RNA, e pode compreender, por exemplo, um elemento transcricionalmente ativo, definido abaixo.
[00231] As ITRs ativadas transcricionalmente proporcionam ativa- ção transcricional e funções de ITR para a molécula de ácido nucleico em um comprimento relativamente limitado de uma sequência de nu- cleotídeos que maximiza de forma eficaz o comprimento de um trans- gene que pode ser transportado e expresso a partir da molécula de ácido nucleico. A incorporação de um elemento transcricionalmente ativo em uma ITR pode ser efetuada de diversas maneiras. Uma com- paração da sequência de ITR com as necessidades de sequência do elemento transcricionalmente ativo pode oferecer uma visão sobre as maneiras de codificar o elemento em uma ITR. Por exemplo, atividade transcricional pode ser adicionada a uma ITR através da introdução de alterações específicas na sequência de ITR que replica os elementos funcionais do elemento transcricionalmente ativo. Existem na literatura inúmeras técnicas para adicionar, deletar, e/ou alterar de forma efici- ente sequências de nucleotídeos particulares em sítios específicos (vi- de, por exemplo, Deng and Nickoloff (1992) Anal. Biochem. 200:81- 88). Uma outra maneira de criar ITRs ativadas transcricionalmente en- volve a introdução de um sítio de restrição em uma localização dese- jada na ITR. Além disso, múltiplos elementos transcricionalmente ati- vos podem ser incorporados em uma ITR ativada transcricionalmente,
por meio de métodos conhecidos na literatura.
[00232] A título de ilustracão, ITRs ativadas transcricionalmente po- dem ser geradas por inclusão de um ou mais elementos transcricio- nalmente ativos tais como: caixa TATA, caixa GC, caixa CCAAT, sítio Sp1, região Inr, sítio CRE (elemento regulador cAMP), sítio ATF- 1/CRE, caixa APBβ, caixa APBα, caixa CArG, caixa CCAC, ou qual- quer outro elemento envolvido na transcrição conhecido na literatura.
[00233] Aspectos da presente invenção apresentam um método pa- ra a clonagem de uma molécula de ácido nucleico descrita neste pedi- do, compreendendo inserir uma molécula de ácido nucleico capaz de complexar estruturas secundárias em um vetor adequado, e introdzir o vetor resultante em uma cepa hospedeira bacteriana adequada. Como sabido na literatura, as estruturas secundárias complexas (por exem- plo, regiões palindrômicas compridas) de ácidos nucleicos podem ser instáveis e difíceis de clonar em cepas hospedeiras bacterianas. Por exemplo, moléculas de ácido nucleico compreendendo uma primeira ITR e uma segunda ITR (por exemplo, ITRs parvovirais não-AAV, por exemplo, B19 ou GPV ITRs) da presente invenção podem ser difíceis de clonar por metodologias conventionais. Palíndromos de DNA com- pridos inibem a replicação de DNA e são instáveis nos genomas de E. coli, Bacillus, Steptococcus, Streptomyces, S. cerevisiae, camudongos, e seres humanos. Estes efeitos são resultado da formação de estrutu- ras do tipo grampo de cabelo ou cruciformes pelo pareamento de ba- ses intracordões. Em E. coli a inibição da replicação de DNA pode ser significativamente superada nos mutantes SbcC ou SbcD. SbcD é a subunidade nuclease, e SbcC é a subunidade ATPase do complexo SbcCD. O complexo E. coli SbcCD é um complexo de exonuclease responsável pela prevenção da replicação de palíndromos compridos. O complexo SbcCD é um complexo nuclear com atividade de exonu- clease de DNA de cordão duplo ATP-dependento e atividade de endo-
nuclease de DNA de cordão duplo ATP-independente. O SbcCD pode reconhecer palíndromos de DNA e causar o colapso dos garfos de re- plicação atacando as estruturas do tipo grampo de cabelo que surgem.
[00234] Em certas modalidades, uma cepa hospedeira bacteriana adequada é incapaz de resolver estruturas cruciformes de DNA. Em certas modalidades, uma cepa hospedeira bacteriana adequada com- preende uma ruptura no complexo SbcCD. Em algumas modalidades, a ruptura no complexo SbcCD compreende uma ruptura genética no gene SbcC e/ou no gene SbcD. Em certas modalidades, a ruptura no complexo SbcCD compreende uma ruptura genética no gene SbcC. Várias cepas hospedeiras bacterianas que compreendem uma ruptura genética no gene SbcC são conhecidas na literatura. Por exemplo, po- rém sem limitação, a cepa hospedeira bacteriana PMC103 compreen- de o genótipo sbcC, recD, mcrA, ΔmcrBCF; a cepa hospedeira bacte- riana PMC107 compreende o genótipo recBC, recJ, sbcBC, mcrA, ΔmcrBCF; e a cepa hospedeira bacteriana SURE compreende o genó- tipo recB, recJ, sbcC, mcrA, ΔmcrBCF, umuC, uvrC. Por conseguinte, em algumas modalidades um método para a clonagem de uma molé- cula de ácido nucleico descrita neste pedido compreende inserir uma molécula de ácido nucleico capaz de complexar estruturas secundá- rias em um vetor adequado, e introduzir o vetor reulta na cepa hospe- deira PMC103, PMC107, ou SURE. Em certas modalidades, o método para a clonagem de uma molécula de ácido nucleico descrita neste pedido compreende inserir uma molécula de ácido nucleico capaz de complexar estruturas secundárias em um vetor adequado, e introduzir o vetor reulta na cepa hospedeira PMC103.
[00235] Vetores adequados são conhecidos na literatura e estão descritos em alguma parte deste relatório descritivo. Em certas moda- lidades, um vetor adequado para uso em uma metodologia de clona- gem da presente invenção é um vetor de poucas cópias. Em certas modalidades, um vetor adequado para uso em uma metodologia de clonagem da presente invenção é pBR322.
[00236] Por conseguinte, a presente invenção apresenta um méto- do para a clonagem de uma molécula de ácido nucleico, compreen- dendo inserir uma molécula de ácido nucleico capaz de complexar es- truturas secundárias em um vetor adequado, e introduzir o vetor resul- tante em uma cepa hospedeira bacteriana compreendendo uma ruptu- ra no complexo SbcCD, onde a molécula de ácido nucleico compreen- de uma primeira repetição terminal invertida (ITR) e uma segunda ITR, onde a primeira ITR e/ou a segunda ITR compreende uma sequência de nucleotídeos pelo menos cerca de 75%, pelo menos cerca de 80%, pelo menos cerca de 85%, pelo menos cerca de 90%, pelo menos cer- ca de 95%, pelo menos cerca de 96%, pelo menos cerca de 97%, pelo menos cerca de 98%, pelo menos cerca de 99%, ou 100% idêntica a uma sequência de nucleotídeos apresentada na SEQ ID NO: 180, 181, 183, 184, 185, 186, 187 ou 188, ou um derivado funcional da mesma. B. Proteínas Terapêuticas
[00237] Certos aspectos da presente invenção estão voltados para uma molécula de ácido nucleico compreendendo uma primeira ITR, uma segunda ITR, e um cassete genético codificando uma sequência alvo, onde a sequência alvo codifica uma proteína terapêutica. Em al- gumas modalidades, o cassete genético encodes uma proteína tera- pêutica. Em algumas modalidades, o cassete genético codifica mais de uma proteína terapêutica. Em algumas modalidades, o cassete ge- nético codifica duas ou mais cópias da mesma proteína terapêutica. Em algumas modalidades, o cassete genético codifica duas ou mais variantes da mesma proteína terapêutica. Em algumas modalidades, o cassete genético codifica duas ou mais proteínas terapêuticas diferen- tes.
[00238] Certas modalidades da presente invenção estão voltadas para uma molécula de ácido nucleico compreendendo uma primeira ITR, uma segunda ITR, e um cassete genético codificando uma prote- ína terapêutica, onde a proteína terapêutica compreende um fator de coagulação. Em algumas modalidades, o fator de coagulação é seleci- onado do grupo que consiste em FI, FII, FIII, FIV, FV, FVI, FVII, FVIII, FIX, FX, FXI, FXII, FXIII), VWF, precalicreína, cininogênio de alto peso molecular, fibronectina, antitrombina III, cofator de heparina II, proteína C, proteína S, proteína Z, inibidor de protease relacionada com proteí- na X (ZPI), plasminogênio, 2-antiplasmina alfa, ativador de plasmino- gênio tecidual (tPA), uroquinase, inibidor 1 do ativador de plasminogê- nio (PAI-1), inibidor 2 do ativador de plasminogênio (PAI2), qualquer zimógeno dos mesmos, qualquer forma ativa dos mesmos, e qualquer combinação dos mesmos. Em uma modalidade, o fator de coagulação compreende FVIII ou uma variante ou fragmento do mesmo. Em uma outra modalidade, o fator de coagulação compreende FIX ou uma va- riante ou fragmento do mesmo. Em uma outra modalidade, o fator de coagulação compreende FVII ou uma variante ou fragmento do mes- mo. Em uma outra modalidade, o fator de coagulação compreende VWF ou uma variante ou fragmento do mesmo.
1. Fatores de coagulação
[00239] Em algumas modalidades, a molécula de ácido nucleico compreende uma primeira ITR, uma segunda ITR, e um cassete gené- tico codificando uma sequência alvo, onde a sequência alvo codifica uma proteína terapêutica, onde a proteína terapêutica compreende um polipeptídio fator VIII. "Fator VIII", abreviado em todo o relatório descri- tivo do presente pedido por "FVIII", conforme usado neste pedido, sig- nifica polipeptídio FVIII funcional em seu papel normal na coagulação, a menos que especificado emm contrário. Aasim sendo, o termo FVIII inclui polipeptídios variantes que são funcionais. "Uma proteína FVIII" é usada intercambiavelmente com polipeptídio (ou proteína) FVIII ou
FVIII. Exemplos das funções do FVIII incluem, porém sem limitação, capacidade de ativar a coagulação, capacidade de agir como um cofa- tor para o fator IX, ou capacidade de formar um complexo tenase com o fator IX na presença de Ca2+ e fosfolipídios, que então converte o fator X na forma Xa ativada. A proteína FVIII pode ser a proteína FVIII humana, suína, canina, de rato, ou murina. Além disso, comparações entre o FVIII de seres humanos e de outras espécies identificarm resí- duos conservados que provavelmente são necessários para a função (Cameron et al., Thromb. Haemost. 79:317-22 (1998); US 6.251.632). As sequências de polipeptídios e de polinucleotídeos de comprimento total são conhecidas, assim como muitos fragmentos, mutantes e ver- sões modificadas funcionais. Várias sequências de aminoácidos e de nucleotídeos do FVIII estão apresentadas, por exemplo, nas Publica- ções US N° 2015/0158929 A1, 2014/0308280 A1, e 2014/0370035 A1 e na Publicação Internacional N° WO 2015/106052 A1. Polipeptídios FVIII incluem, por exemplo, FVIII de comprimento total, FVIII de com- primento total menos Met no terminal N, FVIII maduro (menos a se- quência sinal), FVIII maduro com Met adicional no terminal N, e/ou FVIII com uma deleção total ou parcial do domínio B. Variantes de FVIII incluem deleções do domínio B, sejam elas deleções parciais ou totais. a. Sequências de FVIII e de Polinucleotídeos Codificando a Prote- ína FVIII
[00240] Em algumas modalidades, a molécula de ácido nucleico compreende uma primeira ITR, uma segunda ITR, e um cassete gené- tico codificando uma sequência alvo, onde a sequência alvo codifica uma proteína terapêutica, onde a proteína terapêutica compreende um polipeptídio fator VIII. "Fator VIII", abreviado em todo o presente pedi- do por "FVIII", conforme usado neste pedido, significa polipeptídio FVIII funcional em seu papel normal na coagulação, a menos especifi-
cado em contrário. Assim sendo, o termo FVIII inclui polipeptídios vari- antes que são funcionais. "Uma proteína FVIII" é usada intercambia- velmente com polipeptídio (ou proteína) FVIII ou FVIII. Exemplos das funções do FVIII incluem, porém sem limitação, capacidade de ativar a coagulação, capacidade de agir como um cofator para o fator IX, ou capacidade de formar um complexo tenase com o fator IX na presença de Ca2+ e fosfolipídios, que então converte o fator X na forma Xa ati- vada. A proteína FVIII pode ser a proteína FVIII humana, suína, cani- na, de rato, ou murina. Além disso, comparações entre o FVIII de se- res humanos e de outras espécies identificarm resíduos conservados que provavelmente são necessários para a função (Cameron et al., Thromb. Haemost. 79:317-22 (1998); US 6.251.632). As sequências de polipeptídios e de polinucleotídeos de comprimento total são co- nhecidas, assim como muitos fragmentos, mutantes e versões modifi- cadas funcionais. Várias sequências de aminoácidos e de nucleotí- deos do FVIII estão apresentadas, por exemplo, nas Publicações US N° 2015/0158929 A1, 2014/0308280 A1, e 2014/0370035 A1 e na Pu- blicação Internacional N° WO 2015/106052 A1. Polipeptídios FVIII in- cluem, por exemplo, FVIII de comprimento total, FVIII de comprimento total menos Met no terminal N, FVIII maduro (menos a sequência si- nal), FVIII maduro com Met adicional no terminal N, e/ou FVIII com uma deleção total ou parcial do domínio B. Variantes de FVIII incluem deleções do domínio B, sejam elas deleções parciais ou totais.
[00241] A porção FVIII na proteína quimérica usada neste pedido tem atividade de FVIII. A atividade de FVIII pode ser medida por qual- quer método conhecido na literatura. Inúmeros testes encontram-se disposníveis para avaliação da função do sistema de coagulação: teste do tempo de tromboplastina parcial ativada (aPTT), ensaio cromogêni- co, ensaio ROTEM, teste do tempo de protrombina (PT) (também usa- do para determinar o INR), teste do fibrinogênio (geralmente pelo mé-
todo de Clauss), contagem de plaquetas, teste da função plaquetaria (geralmente pelo PFA-100), TCT, tempo de sangramento, teste da misturação (se uma anormalidade é corrigida se o plasma do paciente for misturado com plasma normal), ensaios de fatores de coagulação, anticorpos antifosfolipídios, dímero D, testes genéticos (por exemplo, fator V Leiden, mutação G20210A na protrombina), tempo de veneno de víbora de Russell diluído (dRVVT), testes mistos da função plaque- tária, tromboelastografia (TEG ou Sonoclot), tromboelastometria (TEM®, por exemplo, ROTEM®, ou tempo de lise da euglobulina (ELT).
[00242] O teste de aPTT é um indicador de desempenho que mede a eficácia das vias de coagulação "intrínsecas" (também denominadas via de ativação de contato) e das vias de coagulação comuns. Este teste é comumente usado para medir a atividade coagulante de fatores de coagulação recombinantes comercialmente disponíveis, por exem- plo, FVIII. Ele é usado junto com o tempo de protrombina (PT), que mede a via extrínseca.
[00243] A análise de ROTEM fornece informações sobre a cinética global da hemostaria: tempo de coagulação, formação de coágulos, estabilidade e lise dos coágulos. Os diferentes parâmetros na trom- boelastometria são dependentes da atividade do sistema de coagula- ção plasmático, da função plaquetária, da fibrinólise, ou de muitos fato- res que influenciam estas interações. O ensaio pode oferecer uma vi- são completa da hemostaria secundária.
[00244] O mecanismo do ensaio cromogênico baseia-se nos princí- pios da cascata de coagulação do sangue, onde o FVIII ativado acele- ra a conversão do fator X no fator Xa na presença de fator IX ativado, fosfolipídios e íons de cálcio. A atividade de fator Xa é avaliada por hidrólise de um substrato de p-nitroanilida (pNA) específico para o fa- tor Xa. A taxa de liberação inicial de p-nitroanilina medida a 405 nM é diretamente proporctional à atividade do fator Xa e, por conseguinte, à atividade do FVIII na amostra.
[00245] O ensaio cromogênico é recomendado pelo Subcomitê Ci- entífico em Fator VIII e IX do Comitê Científico e Padronização ("FVIII and Factor IX Subcommittee of the Scientific and Standardization Committee") (SSC) da Sociedade Internacional de Trombose e He- mostatsia (ISTH). Desde 1994, o ensaio cromogênico tem sido o mé- todo de referência da Farmacopeia Europeia para a atribuição da po- tência do concentrato de FVIII. Assim sendo, em uma modalidade, o polipeptídio quimérico compreendendo FVIII tem atividade de FVIII equiparável a um polipeptídio quimérico compreendendo FVIII maduto ou um BDD FVIII (por exemplo, ADVATE®, REFACTO®, ou ELOCTA- TE®).
[00246] Em uma outra modalidade, a proteína quimérica compreen- dendo FVIII desta invenção apresenta uma taxa de produção de fator Xa equiparável a uma proteína quimérica compreendendo FVIII madu- ro ou um BDD FVIII (por exemplo, ADVATE®, REFACTO®, ou ELOC- TATE®).
[00247] Para ativar o fator X em fator Xa, o fator IX ativado (fator IXa) hidrolisa uma ligação arginina-isoleucina no fator X para formar o fator Xa na presença de Ca2+, fosfolipídios membranosos, e um cofator FVIII. Portanto, a interação de FVIII com o fator IX é crítica na via de coagulação. Em certas modalidades, o polipeptídio quimérico compre- endendo FVIII pode interagir com o fator IXa a uma taxa equiparável a um polipeptídio quimérico compreendendo uma sequência do FVIII maduro ou um BDD FVIII (por exemplo, ADVATE®, REFACTO®, ou ELOCTATE®).
[00248] Além disso, o FVIII fica ligante ao fator de von Willebrand enquanto inativo na circulação. O FVIII degrada-se rapidamente quan- do não ligado ao VWF e é liberado do VWF pela ação da trombina. Em algumas modalidades, o polipeptídio quimérico compreendendo FVIII liga-se ao fator de von Willebrand Factor em um nível equiparável a um polipeptídio quimérico compreendendo uma sequência do FVIII maduro ou um BDD FVIII (por exemplo, ADVATE®, REFACTO®, ou ELOCTATE®).
[00249] O FVIII pode ser inativado pela proteína C ativada na pre- sença de cálcio e fosfolipídios. A proteína C ativada cliva a cadeia pe- sada do FVIII depois da arginina 336 no domínio A1, que rompe um sítio de interação com o substrato do fator X, e cliva a arginina 562 no domínio A2, que aumenta a dissociação do domínio A2 bem como rompe um sítio de interação com o fator IXa. Esta clivagem também o divide ao meio domínio A2 (43 kDa) e gera os domínios A2-N (18 kDa) e A2-C (25 kDa). Assim sendo, a proteína C ativada pode catalisar múltiplos sítios de clivagem na cadeia pesada. Em uma modalidade, o polipeptídio quimérico compreendendo FVIII é inativado pela proteína C ativada em um nível equiparável com um polipeptídio quimérico compreendendo uma sequência de FVIII maduro ou um BDD FVIII (por exemplo, ADVATE®, REFACTO®, ou ELOCTATE®).
[00250] Em outras modalidades, a proteína quimérica compreen- dendo FVIII tem atividde de FVIII in vivo equiparável a um polipeptídio quimérico eptide compreendendo uma sequência de FVIII maduro ou um BDD FVIII (por exemplo, ADVATE®, REFACTO®, ou ELOCTATE®). Em uma modalidade particular, o polipeptídio químico compreendendo FVIII é capaz de proteger um camundongo com HemA em um nível equiparável a um polipeptídio quimérico compreendendo compreen- dendo uma sequência de FVIII maduro ou um BDD FVIII (por exemplo, ADVATE®, REFACTO®, ou ELOCTATE®) em um modelo de transec- ção da veia caudal de camundongo com HemA.
[00251] Um "domínio B" de FVIII, conforme usado neste pedido, é igual ao domínio B conhecido na literatura que é definido por identida-
de de sequências de aminoácidos internas e sítios de clivagem proteo- lítica por trombina, por exemplo, os resíduos Ser741-Arg1648 do FVIII humano maduro. Os outros domínios do FVIII humano são definidos pelos seguintes resíduos aminoacídicos, em relação do FVIII humano maduro: A1, resíduos Ala1-Arg372; A2, resíduos Ser373-Arg740; A3, resíduos Ser1690-Ile2032; C1, resíduos Arg2033-Asn2172; C2, resí- duos Ser2173-Tyr2332 do FVIII maduro. Os números dos resíduos nas sequências usado neste pedido sem indicar qualquer SED ID Número correspondem à sequência do FVIII sem a sequência de peptídio sinal (19 aminoácidos), a menos que indicado em contrário. A sequência A3-C1-C2, também conhecida como a cadeia pesada do FVIII, inclui os resíduos Ser1690-Tyr2332. O resto da sequência, resíduos Glu1649-Arg1689, geralmente é denominado peptídio de ativação da cadeia leve do FVIII. As localizações dos limites para todos os domí- nios, incluindo os domínios B, para FVIII suíno, murino e canino tam- bém são conhecidas na literatura. Em uma modalidade, o domínio B do FVIII é deletado ("FVIII com domínio B deletado" ou "BDD FVIII"). Um exemplo de um BDD FVIII é REFACTO® (BDD FVIII recombinan- te). Em uma modalidade particular, a variante FVIII de domínio deleta- do compreende uma deleção dos resíduos aminoacídicos 746 a 1648 do FVIII maduro.
[00252] A "FVIII de domínio B deletado" pode ter as deleções totais ou parciais apresentadas nas Patentes US N° 6.316.226, 6.346.513,
7.041.635, 5.789.203, 6.060.447, 5.595.886, 6.228.620, 5.972.885,
6.048.720, 5.543.502, 5.610.278, 5.171.844, 5.112.950, 4.868.112, e
6.458.563 e na Publicação Internacional N° WO 2015106052 A1 (PCT/US2015/010738). Em algumas modalidades, uma sequência do FVIII com domínio B deletado usada nos métodos da presente inven- ção compreende qualquer uma das deleções apresentadas na coluna 4, linha 4 até a coluna 5, linha 28 e Exemplos 1-5 da Patente US N°
6.316.226 (também na patente US 6.346.513). Em uma outra modali- dade, um fator FVIII com domínio B deletado é o fator FVIII com domí- nio B deletado S743/Q1638 (SQ BDD FVIII) (por exemplo, fator VIII tendo uma deleção do aminoácido 744 ao aminoácido 1637, por exemplo fator VIII tendo os aminoácidos 1-743 e os aminoácidos 1638- 2332 do FVIII maduro). Em algumas modalidades, um fator FVIII com domínio B deletado usado nos métodos da presente invenção tem uma deleção apresentada na coluna 2, linhas 26-51 e nos exemplos 5- 8 da Patente US N° 5.789.203 (também nas patentes 6.060.447, US
5.595.886, e US 6.228.620). Em algumas modalidades, um fator FVIII com domínio B deletado tem uma deleção descrita na coluna 1, linhas 25 até coluna 2, linha 40 da Patente US N° 5.972.885; col. 6, linhas 1- 22 e exemplo 1 da Patente US N° 6.048.720; col. 2, linhas 17-46 da Patente US N° 5.543.502; col. 4, linha 22 até col. 5, linha 36 da Paten- te US N° 5.171.844; col. 2, linhas 55-68, figura 2, e exemplo 1 da Pa- tente US N° 5.112.950; col. 2, linha 2 até col. 19, linha 21 e tabela 2 da Patente US N° 4.868.112; col. 2, linha 1 até col. 3, linha 19, col. 3, li- nha 40 até col. 4, linha 67, col. 7, linha 43 até col. 8, linha 26, e col. 11, linha 5 até col. 13, linha 39 da Patente US N° 7.041.635; ou col. 4, li- nhas 25-53, da Patente US N° 6.458.563. Em algumas modalidades, um FVIII com domínio B deletado tem uma deleção da maior parte do domínio B, mas ainda contém sequências amino-terminais do domínio B que são essenciais para o processamento proteolítico in vivo do produto de translação primário em duas cadeias polipeptídicas, como descrito no documento WO 91/09122. Em algumas modalidades, um FVIII com domínio B deletado é construído com uma deleção dos ami- noácidos 747-1638, i.e., virtualmente uma deleçõ completa do domínio B. Hoeben R.C., et al. J. Biol. Chem. 265 (13): 7318-7323 (1990). Um fator FVIII com domínio B deletado também pode conter uma deleção dos aminoácidos 771–1666 ou dos aminoácidos 868-1562 do FVIII.
Meulien P., et al. Protein Eng. 2(4): 301-6 (1988). Deleções adicionais do domínio B que fazem parte da invenção incluem: deleção dos ami- noácidos 982 a 1562 ou 760 a 1639 (Toole et al., Proc. Natl. Acad. Sci. U.S.A. (1986) 83, 5939-5942)), 797 a 1562 (Eaton, et al. Biochemistry (1986) 25:8343-8347)), 741 a 1646 (Kaufman (pedido PCT publicado N° WO 87/04187)), 747-1560 (Sarver, et al., DNA (1987) 6:553-564)), 741 a 1648 (Pasek (PCT application No.88/00831)), ou 816 a 1598 ou 741 a 1648 (Lagner (Behring Inst. Mitt. (1988) No 82:16-25, EP 295597)). Em uma modalide particular, o FVIII com domínio B deletado compreende uma deleção dos resíduos aminoacídicos 746 a 1648 do FVIII maduro. Em uma outra modalidade, o FVIII com domínio B dele- tado compreende uma deleção dos resíduos aminoacídicos 745 a 1648 do FVIII maduro. Em algumas modalidades, o BDD FVIII com- preende um FVIII de cadeia única que contém uma deleção nos ami- noácidos 765 a 1652 correspondentes ao FVIII de comprmento total maduro (também conhecido como rVIII-SingleChain e AFSTYLA®). Vide Patente US N° 7.041.635.
[00253] Em outras modalidades, o BDD FVIII inclui um polipeptídio FVIII contendo fragmentos do domínio B que conservam um ou mais sítios de N-glicosilação ligados, por exemplo, os resíduos 757, 784, 828, 900, 963, ou opcionalmente 943, que correspondem à sequência de aminoácidos da sequência do FVIII de comprimento total. Exemplos dos fragmentos do domínio B incluem 226 aminoácidos ou 163 amino- ácidos do domínio B revelados em Miao, H.Z., et al., Blood 103(a): 3412-3419 (2004), Kasuda, A, et al., J. Thromb. Haemost. 6: 1352- 1359 (2008), e Pipe, S.W., et al., J. Thromb. Haemost. 9: 2235-2242 (2011) (i.e., os 226 primeiros aminoácidos ou 163 primeiros aminoáci- dos do domínio B ficam conservados). Em ainda outras modalidades, o BDD FVIII compreende ainda uma mutação pontual no resíduo 309 (de Phe para Ser) para aumentar a expressão da proteína BDD FVIII.
Vide Miao, H.Z., et al., Blood 103(a): 3412-3419 (2004). Em ainda ou- tras modalidades, o BDD FVIII inclui um polipeptídio FVIII contendo uma parte do domínio B, porém sem conter um ou mais sítios de cliva- gem de furina (por exemplo, Arg1313 e Arg 1648). Vide Pipe, S.W., et al., J. Thromb. Haemost. 9: 2235-2242 (2011). Em algumas modalida- des, o BDD FVIII compreende FVIII de caeia única que contém uma deleção nos aminoácidos 765 a 1652 correspondendo ao FVIII de comprimento total maduro (também conhecido como rVIII-SingleChain e AFSTYLA®). Vide Patente US N° 7.041.635. Cada uma das dele- ções acima pode ser feita em qualquer sequência do FVIII.
[00254] Um número bstante grande de variantes funcionais do FVIII é conhecido, como discutido acima e abaixo. Além disso, centenas de mutações não funcionais no FVIII já foram identificadas em pacientes hemofílicos, e já foi determinado que o efeito dessas mutações na fun- ção do FVIII se mais ao fato de onde elas se encontram na estrutura tridimensional do FVIII do que à natureza da substituição (Cutler et al., Hum. Mutat. 19:274-8 (2002)), cuja íntegra encontra-se aqui incorpo- rada a título de referência. Além disso, comparações entre o FVIII de seres humanos e outras espécies já identificaram resíduos conserva- dos que provavelmente são necessários para seu funcionamento (Cameron et al., Thromb. Haemost. 79:317-22 (1998); US 6.251.632), cuja íntegra encontra-se aqui incorporada a título de referência.
[00255] Em algumas modalidades, o polipeptídio FVIII compreende uma variante de FVIII ou fragmento da mesma, onde a variante de FVIII ou o fragmento da mesma tem uma atividade de FVIII. Em algu- mas modalidades, o cassete genético codifica um polipeptídio FVIII de comprimento total. Em outras modalidades, o cassete genético codifica um polipeptídio FVIII com o domínio B deletado (BDD), onde todo ou uma parte do domínio B do FVIII está deletado. Em uma modalidade particular, o cassete genético codifica um polipeptídio tendo a sequên-
cia de aminoácidos tendo pelo menos cerca de 80%, pelo menos cer- ca de 85%, pelo menos cerca de 86%, pelo menos cerca de 87%, pelo menos cerca de 88%, pelo menos cerca de 89%, pelo menos cerca de 90%, pelo menos cerca de 95%, pelo menos cerca de 96%, pelo me- nos cerca de 97%, pelo menos cerca de 98%, ou pelo menos cerca de 99% de identidade de sequência com a SEQ ID NOs: 106, 107, 109, 110, 111, ou 112. Em algumas modalidades, o cassete genético codifi- ca um polipeptídio tendo a sequência de aminoácidos de SEQ ID NO: 17 ou um fragmento da mesma. Em algumas modalidades, o cassete genético codifica um polipeptídio tendo a sequência de aminoácidos de SEQ ID NO: 106 ou um fragmento da mesma. Em algumas modali- dades, o cassete genético compreende uma sequência de nucleotí- deos que tem pelo menos 85%, pelo menos 90%, pelo menos 95%, pelo menos 96%, pelo menos 97%, pelo menos 98%, ou pelo menos 99% de identidade de sequência com a SEQ ID NO: 107. Em algumas modalidades, o cassete genético codifica um polipeptídio tendo a se- quência de aminoácidos de SEQ ID NO: 109 ou um fragmento da mesma. Em algumas modalidades, o cassete genético compreende uma sequência de nucleotídeos que tem pelo menos 85%, pelo menos 90%, pelo menos 95%, pelo menos 96%, pelo menos 97%, pelo me- nos 98%, ou pelo menos 99% de identidade de sequência com a SEQ ID NO: 16. Em algumas modalidades, o cassete genético compreende uma sequência de nucleotídeos que tem pelo menos 85%, pelo menos 90%, pelo menos 95%, pelo menos 96%, pelo menos 97%, pelo me- nos 98%, ou pelo menos 99% de identidade de sequência com a SEQ ID NO: 109.
[00256] Em algumas modalidades, o cassete genético da invenção codifica um polipeptídio FVIII compreendendo um peptídio sinal ou um fragmento do mesmo. Em outras modalidades, o cassete genético en- codes um polipeptídio FVIII ao qual falta um peptídio sinal. Em algu-
mas modalidades, o peptídio sinal compreende os aminoácidos 1-19 de SEQ ID NO: 17.
[00257] Em algumas modalidades, o cassete genético compreende uma sequência de nucleotídeos codificando um polipeptídio FVIII, on- de a sequência de nucleotídeos é códon-otimizada. Em certas modali- dades, o cassete genético compreende uma sequência de nucleotí- deos revelada no Peido Internacional N° PCT/US2017/015879, cuja íntegra encontra-se aqui incorporada a título de referência. Em algu- mas modalidades, o cassete genético compreende uma sequência de nucleotídeos codificando um polipeptídio FVIII, onde a sequência de nucleotídeos é códon-otimizada. Em certas modalidades, o cassete genético compreende uma sequência de nucleotídeos que tem pelo menos 85%, pelo menos 90%, pelo menos 95%, pelo menos 96%, pe- lo menos 97%, pelo menos 98%, ou pelo menos 99% de identidade de sequência com uma sequência de nucleotídeos selecionada dentre as SEQ ID NOs: 1-14. Em algumas modalidades, o cassete genético compreende uma sequência de nucleotídeos que tem pelo menos 85%, pelo menos 90%, pelo menos 95%, pelo menos 96%, pelo me- nos 97%, pelo menos 98%, ou pelo menos 99% de identidade de se- quência com a SEQ ID NO: 71. Em algumas modalidades, o cassete genético compreende uma sequência de nucleotídeos que tem pelo menos 85%, pelo menos 90%, pelo menos 95%, pelo menos 96%, pe- lo menos 97%, pelo menos 98%, ou pelo menos 99% de identidade de sequência com a SEQ ID NO: 19. i. Sequências de Nucleotídeos Códon-Otimizdas Codificando Po- lipeptídios FVIII
[00258] Em algumas modalidades, uma molécula de ácido nucleico da presente invenção compreende uma primeira ITR, uma segunda ITR, e um cassete genético codificando uma sequência alvo, onde a sequência alvo codifica uma proteína terapêutica, onde a primeira ITR e a segunda ITR são derivadas de um genoma de AAV, e onde o cas- sete genético compreende uma sequência de nucleotídeos códon- otimizada codificando um polipeptídio FVIII. Em algumas modalidades, a sequência de nucleotídeos códon-otimizada codifica um polipeptídio FVIII de comprimento total. Em outras modalidades, a sequência de nucleotídeos códon-otimizada codifica um polipeptídio FVIII com o domínio deletado (BDD), onde todo ou uma parte do domínio B do FVIII é deletado. Em uma modalidade particular, a sequência de nu- cleotídeos códon-otimizada codifica um polipeptídio tendo a sequência de aminoácidos tendo pelo menos cerca de 80%, pelo menos cerca de 85%, pelo menos cerca de 86%, pelo menos cerca de 87%, pelo me- nos cerca de 88%, pelo menos cerca de 89%, pelo menos cerca de 90%, pelo menos cerca de 95%, pelo menos cerca de 96%, pelo me- nos cerca de 97%, pelo menos cerca de 98%, ou pelo menos cerca de 99% de identidade de sequência com a SEQ ID NO: 17 ou um frag- mento da mesma. Em uma modalidade, a sequência de nucleotídeos códon-otimizada codifica um polipeptídio tendo a sequência de amino- ácidos de SEQ ID NO: 17 ou um fragmento da mesma.
[00259] Em algumas modalidades, a sequência de nucleotídeos có- don-otimizada codifica um polipeptídio FVIII compreendendo um pep- tídio sinal ou um fragmento do mesmo. Em outras modalidades, a se- quência códon-otimizada codifica um polipeptídio FVIII ao qual falta um peptídio sinal. Em algumas modalidades, o peptídio sinal compre- ende os aminoácidos 1-19 da SEQ ID NO: 17.
[00260] Em algumas modalidades, a sequência de nucleotídeos có- don-otimizada codificando um polipeptídio FVIII compreende uma se- quência de nucleotídeos que compreende uma primeira sequência de ácidos nucleicos codificando uma porção N-terminal de um polipeptídio FVIII e uma segunda sequência de ácidos nucleicos codificando uma porção C-terminal de um polipeptídio FVIII; onde a primeira sequência de ácidos nucleicos tem pelo menos 85%, pelo menos 90%, pelo me- nos 95%, pelo menos 96%, pelo menos 97%, pelo menos 98%, ou pe- lo menos 99% de identidade de sequência com os (i) nucleotídeos 58- 1791 da SEQ ID NO: 3 ou (ii) nucleotídeos 58-1791 da SEQ ID NO: 4; e onde a porção N-terminal e a porção C-terminal juntas têm uma ati- vidade de polipeptídio FVIII. Em uma modalidade particular, a primeira sequência de ácidos nucleicos tem pelo menos 85%, pelo menos 90%, pelo menos 95%, pelo menos 96%, pelo menos 97%, pelo menos 98%, ou pelo menos 99% de identidade de sequência com os nucleo- tídeos 58-1791 da SEQ ID NO: 3. Em uma outra modalidade, a primei- ra sequência de ácidos nucleicos tem pelo menos 85%, pelo menos 90%, pelo menos 95%, pelo menos 96%, pelo menos 97%, pelo me- nos 98%, ou pelo menos 99% de identidade de sequência com os nu- cleotídeos 58-1791 da SEQ ID NO: 4. Em outras modalidades, a pri- meira sequência de nucleotídeos compreende nucleotídeos 58-1791 da SEQ ID NO: 3 ou os nucleotídeos 58-1791 da SEQ ID NO: 4.
[00261] Em outras modalidades, a sequência de nucleotídeos có- don-otimizada codificando um polipeptídio FVIII compreende uma se- quência de nucleotídeos que compreende uma primeira sequência de ácidos nucleicos codificando uma porção N-terminal de um polipeptídio FVIII e uma segunda sequência de ácidos nucleicos codificando uma porção C-terminal de um polipeptídio FVIII; onde a primeira sequência de ácidos nucleicos tem pelo menos 85%, pelo menos 90%, pelo me- nos 95%, pelo menos 96%, pelo menos 97%, pelo menos 98%, ou pe- lo menos 99% de identidade de sequência com os (i) nucleotídeos 1- 1791 da SEQ ID NO: 3 ou (ii) nucleotídeos 1-1791 da SEQ ID NO: 4; e onde a porção N-terminal e a porção C-terminal juntas têm uma ativi- dade de polipeptídio FVIII. Em uma modalidade, a primeira sequência de nucleotídeos compreende os nucleotídeos 1-1791 da SEQ ID NO: 3 ou os nucleotídeos 1-1791 da SEQ ID NO: 4. Em uma outra modalida-
de, a segunda sequência de nucleotídeos tem pelo menos 60%, pelo menos 70%, pelo menos 80%, pelo menos 90%, pelo menos 95%, pe- lo menos 96%, pelo menos 97%, pelo menos 98%, ou pelo menos 99% de identidade de sequência com os nucleotídeos 1792-4374 da SEQ ID NO: 3 ou 1792-4374 da SEQ ID NO: 4. Em uma modalidade particular, a segunda sequência de nucleotídeos compreende os nu- cleotídeos 1792-4374 da SEQ ID NO: 3 ou 1792-4374 da SEQ ID NO:
4. Em ainda uma outra modalidade, a segunda sequência de nucleotí- deos tem pelo menos 60%, pelo menos 70%, pelo menos 80%, pelo menos 90%, pelo menos 95%, pelo menos 96%, pelo menos 97%, pe- lo menos 98%, ou pelo menos 99% de identidade de sequência com os nucleotídeos 1792-2277 e 2320-4374 da SEQ ID NO: 3 ou 1792- 2277 e 2320-4374 da SEQ ID NO: 4 (i.e., nucleotídeos 1792-4374 da SEQ ID NO: 3 ou 1792-4374 da SEQ ID NO: 4 sem os nucleotídeos codificando o domínio B ou um fragmento do domínio B). Em uma mo- dalidade particular, a segunda sequência de nucleotídeos compreende os nucleotídeos 1792-2277 e 2320-4374 da SEQ ID NO: 3 ou 1792- 2277 e 2320-4374 da SEQ ID NO: 4 (i.e., nucleotídeos 1792-4374 da SEQ ID NO: 3 ou 1792-4374 da SEQ ID NO: 4 sem os nucleotídeos codificando o domínio B ou um fragmento do domínio B).
[00262] Em algumas modalidades, a sequência de nucleotídeos có- don-otimizada codificando um polipeptídio FVIII compreende uma se- quência de nucleotídeos que compreende uma primeira sequência de ácidos nucleicos codificando uma porção N-terminal de um polipeptídio FVIII e uma segunda sequência de ácidos nucleicos codificando uma porção C-terminal de um polipeptídio FVIII; onde a segunda sequência de ácidos nucleicos tem pelo menos 85%, pelo menos 90%, pelo me- nos 95%, pelo menos 96%, pelo menos 97%, pelo menos 98%, ou pe- lo menos 99% de identidade de sequência com os (i) nucleotídeos 1792-4374 da SEQ ID NO: 5 ou (ii) 1792-4374 da SEQ ID NO: 6; e on-
de a porção N-terminal e a porção C-terminal juntas têm uma atividade de polipeptídio FVIII. Em certas modalidades, a segunda sequência de ácidos nucleicos tem pelo menos 85%, pelo menos 90%, pelo menos 95%, pelo menos 96%, pelo menos 97%, pelo menos 98%, ou pelo menos 99% de identidade de sequência com os nucleotídeos 1792- 4374 da SEQ ID NO: 5. Em outras modalidades, a segunda sequência de ácidos nucleicos tem pelo menos 85%, pelo menos 90%, pelo me- nos 95%, pelo menos 96%, pelo menos 97%, pelo menos 98%, ou pe- lo menos 99% de identidade de sequência com os nucleotídeos 1792- 4374 da SEQ ID NO: 6. Em uma modalidade particular, a segunda se- quência de ácidos nucleicos compreende os nucleotídeos 1792-4374 da SEQ ID NO: 5 ou 1792-4374 da SEQ ID NO: 6. Em algumas moda- lidades, a primeira sequência de ácidos nucleicos ligada à segunda sequência de ácidos nucleicos listada acima tem pelo menos 60%, pe- lo menos 70%, pelo menos 80%, pelo menos 90%, pelo menos 95%, pelo menos 96%, pelo menos 97%, pelo menos 98%, ou pelo menos 99% de identidade de sequência com os nucleotídeos 58-1791 da SEQ ID NO: 5 ou os nucleotídeos 58-1791 da SEQ ID NO: 6. Em ou- tras modalidades, a primeira sequência de ácidos nucleicos ligada à segunda sequência de ácidos nucleicos listada acima tem pelo menos 60%, pelo menos 70%, pelo menos 80%, pelo menos 90%, pelo me- nos 95%, pelo menos 96%, pelo menos 97%, pelo menos 98%, ou pe- lo menos 99% de identidade de sequência com os nucleotídeos 1- 1791 da SEQ ID NO: 5 ou os nucleotídeos 1-1791 da SEQ ID NO: 6.
[00263] Em outras modalidades, a sequência de nucleotídeos có- don-otimizada codificando um polipeptídio FVIII compreende uma se- quência de nucleotídeos que compreende uma primeira sequência de ácidos nucleicos codificando uma porção N-terminal de um polipeptídio FVIII e uma segunda sequência de ácidos nucleicos codificando uma porção C-terminal de um polipeptídio FVIII; onde a segunda sequência de ácidos nucleicos tem pelo menos 85%, pelo menos 90%, pelo me- nos 95%, pelo menos 96%, pelo menos 97%, pelo menos 98%, ou pe- lo menos 99% de identidade de sequência com os (i) nucleotídeos 1792-2277 e 2320-4374 da SEQ ID NO: 5 (i.e., nucleotídeos 1792- 4374 da SEQ ID NO: 5 sem os nucleotídeos codificando o domínio B ou um fragmento do domínio B) ou (ii) 1792-2277 e 2320-4374 da SEQ ID NO: 6 (i.e., nucleotídeos 1792-4374 da SEQ ID NO: 6 sem os nu- cleotídeos codificando o domínio B ou um fragmento do domínio B); e onde a porção N-terminal e a porção C-terminal juntas têm uma ativi- dade de polipeptídio FVIII.
Em certas modalidades, a segunda se- quência de ácidos nucleicos tem pelo menos 85%, pelo menos 90%, pelo menos 95%, pelo menos 96%, pelo menos 97%, pelo menos 98%, ou pelo menos 99% de identidade de sequência com os nucleo- tídeos 1792-2277 e 2320-4374 da SEQ ID NO: 5 (i.e., nucleotídeos 1792-4374 da SEQ ID NO: 5 sem os nucleotídeos codificando o domí- nio B ou um fragmento do domínio B). Em outras modalidades, a se- gunda sequência de ácidos nucleicos tem pelo menos 85%, pelo me- nos 90%, pelo menos 95%, pelo menos 96%, pelo menos 97%, pelo menos 98%, ou pelo menos 99% de identidade de sequência com os nucleotídeos 1792-2277 e 2320-4374 da SEQ ID NO: 6 (i.e., nucleotí- deos 1792-4374 da SEQ ID NO: 6 sem os nucleotídeos codificando o domínio B ou um fragmento do domínio B). Em uma modalidade parti- cular, a segunda sequência de ácidos nucleicos compreende os nu- cleotídeos 1792-2277 e 2320-4374 da SEQ ID NO: 5 ou 1792-2277 e 2320-4374 da SEQ ID NO: 6 (i.e., nucleotídeos 1792-4374 da SEQ ID NO: 5 ou 1792-4374 da SEQ ID NO: 6 sem os nucleotídeos codifican- do o domínio B ou um fragmento do domínio B). Em algumas modali- dades, a primeira sequência de ácidos nucleicos ligada à segunda se- quência de ácidos nucleicos listada acima tem pelo menos 60%, pelo menos 70%, pelo menos 80%, pelo menos 90%, pelo menos 95%, pe-
lo menos 96%, pelo menos 97%, pelo menos 98%, ou pelo menos 99% de identidade de sequência com os nucleotídeos 58-1791 da SEQ ID NO: 5 ou os nucleotídeos 58-1791 da SEQ ID NO: 6. Em ou- tras modalidades, a primeira sequência de ácidos nucleicos ligada à segunda sequência de ácidos nucleicos listada acima tem pelo menos 60%, pelo menos 70%, pelo menos 80%, pelo menos 90%, pelo me- nos 95%, pelo menos 96%, pelo menos 97%, pelo menos 98%, ou pe- lo menos 99% de identidade de sequência com os nucleotídeos 1- 1791 da SEQ ID NO: 5 ou os nucleotídeos 1-1791 da SEQ ID NO: 6.
[00264] Em algumas modalidades, a sequência de nucleotídeos có- don-otimizada codificando um polipeptídio FVIII compreende uma se- quência de nucleotídeos que compreende uma primeira sequência de ácidos nucleicos codificando uma porção N-terminal de um polipeptídio FVIII e uma segunda sequência de ácidos nucleicos codificando uma porção C-terminal de um polipeptídio FVIII; onde a primeira sequência de ácidos nucleicos tem pelo menos 90%, pelo menos 95%, pelo me- nos 96%, pelo menos 97%, pelo menos 98%, ou pelo menos 99% de identidade de sequência com os (i) nucleotídeos 58-1791 da SEQ ID NO: 1, (ii) nucleotídeos 58-1791 da SEQ ID NO: 2, (iii) nucleotídeos 58-1791 da SEQ ID NO: 70, ou (iv) nucleotídeos 58-1791 da SEQ ID NO: 71; e onde a porção N-terminal e a porção C-terminal juntas têm uma atividade de polipeptídio FVIII. Em outras modalidades, a primeira sequência de nucleotídeos compreende nucleotídeos 58-1791 da SEQ ID NO: 1, nucleotídeos 58-1791 da SEQ ID NO: 2, (iii) nucleotídeos 58- 1791 da SEQ ID NO: 70, ou (iv) nucleotídeos 58-1791 da SEQ ID NO:
71.
[00265] Em outras modalidades, a sequência de nucleotídeos có- don-otimizada codificando um polipeptídio FVIII compreende uma se- quência de nucleotídeos que compreende uma primeira sequência de ácidos nucleicos codificando uma porção N-terminal de um polipeptídio
FVIII e uma segunda sequência de ácidos nucleicos codificando uma porção C-terminal de um polipeptídio FVIII; onde a primeira sequência de ácidos nucleicos tem pelo menos 90%, pelo menos 95%, pelo me- nos 96%, pelo menos 97%, pelo menos 98%, ou pelo menos 99% de identidade de sequência com os (i) nucleotídeos 1-1791 da SEQ ID NO: 1, (ii) nucleotídeos 1-1791 da SEQ ID NO: 2, (iii) nucleotídeos 1- 1791 da SEQ ID NO: 70, ou (iv) nucleotídeos 1-1791 da SEQ ID NO: 71; e onde a porção N-terminal e a porção C-terminal juntas têm uma atividade de polipeptídio FVIII. Em uma modalidade, a primeira se- quência de nucleotídeos compreende os nucleotídeos 1-1791 da SEQ ID NO: 1, nucleotídeos 1-1791 da SEQ ID NO: 2, (iii) nucleotídeos 1- 1791 da SEQ ID NO: 70, ou (iv) nucleotídeos 1-1791 da SEQ ID NO:
71. Em uma outra modalidade, a segunda sequência de nucleotídeos ligada à primeira sequência de nucleotídeos tem pelo menos 60%, pe- lo menos 70%, pelo menos 80%, pelo menos 90%, pelo menos 95%, pelo menos 96%, pelo menos 97%, pelo menos 98%, ou pelo menos 99% de identidade de sequência com os nucleotídeos 1792-4374 da SEQ ID NO: 1, 1792-4374 da SEQ ID NO: 2, (iii) nucleotídeos 1792- 4374 da SEQ ID NO: 70, ou (iv) nucleotídeos 1792-4374 da SEQ ID NO: 71. Em uma modalidade particular, a segunda sequência de nu- cleotídeos ligada à primeira sequência de nucleotídeos compreende os (i) nucleotídeos 1792-4374 da SEQ ID NO: 1, (ii) nucleotídeos 1792- 4374 da SEQ ID NO: 2, (iii) nucleotídeos 1792-4374 da SEQ ID NO: 70, ou (iv) nucleotídeos 1792-4374 da SEQ ID NO: 71. Em outras mo- dalidades, a segunda sequência de nucleotídeos ligada à primeira se- quência de nucleotídeos tem pelo menos 60%, pelo menos 70%, pelo menos 80%, pelo menos 90%, pelo menos 95%, pelo menos 96%, pe- lo menos 97%, pelo menos 98%, ou pelo menos 99% de identidade de sequência com os (i) nucleotídeos 1792-2277 e 2320-4374 da SEQ ID NO: 1, (ii) nucleotídeos 1792-2277 e 2320-4374 da SEQ ID NO: 2, (iii)
nucleotídeos 1792-2277 e 2320-4374 da SEQ ID NO: 70, ou (iv) nu- cleotídeos 1792-2277 e 2320-4374 da SEQ ID NO: 71. Em uma moda- lidade, a segunda sequência de nucleotídeos compreende os (i) nu- cleotídeos 1792-2277 e 2320-4374 da SEQ ID NO: 1, (ii) nucleotídeos 1792-2277 e 2320-4374 da SEQ ID NO: 2, (iii) nucleotídeos 1792-2277 e 2320-4374 da SEQ ID NO: 70, ou (iv) nucleotídeos 1792-2277 e 2320-4374 da SEQ ID NO: 71.
[00266] Em uma outra modalidade, a sequência de nucleotídeos códon-otimizada codificando um polipeptídio FVIII compreende uma sequência de nucleotídeos que compreende uma primeira sequência de ácidos nucleicos codificando uma porção N-terminal de um polipep- tídio FVIII e uma segunda sequência de ácidos nucleicos codificando uma porção C-terminal de um polipeptídio FVIII; onde a segunda se- quência de ácidos nucleicos tem pelo menos 90%, pelo menos 95%, pelo menos 96%, pelo menos 97%, pelo menos 98%, ou pelo menos 99% de identidade de sequência com os (i) nucleotídeos 1792-4374 da SEQ ID NO: 1, (ii) nucleotídeos 1792-4374 da SEQ ID NO: 2, (iii) nu- cleotídeos 1792-4374 da SEQ ID NO: 70, ou (iv) nucleotídeos 1792- 4374 da SEQ ID NO: 71; e onde a porção N-terminal e a porção C- terminal juntas têm uma atividade de polipeptídio FVIII. Em uma moda- lidade particular, a segunda sequência de ácidos nucleicos compreen- de os (i) nucleotídeos 1792-4374 da SEQ ID NO: 1, (ii) nucleotídeos 1792-4374 da SEQ ID NO: 2, (iii) nucleotídeos 1792-4374 da SEQ ID NO: 70, ou (iv) nucleotídeos 1792-4374 da SEQ ID NO: 71. Em algu- mas modalidades, the codon optimized sequence codificando um poli- peptídio FVIII compreende uma sequência de nucleotídeos que com- preende uma primeira sequência de ácidos nucleicos codificando uma porção N-terminal de um polipeptídio FVIII e uma segunda sequência de ácidos nucleicos codificando uma porção C-terminal de um polipep- tídio FVIII; onde a segunda sequência de ácidos nucleicos tem pelo menos 90%, pelo menos 95%, pelo menos 96%, pelo menos 97%, pe- lo menos 98%, ou pelo menos 99% de identidade de sequência com os (i) nucleotídeos 1792-2277 e 2320-4374 da SEQ ID NO: 1, (ii) nu- cleotídeos 1792-2277 e 2320-4374 da SEQ ID NO: 2, (iii) nucleotídeos 1792-2277 e 2320-4374 da SEQ ID NO: 70, ou (iv) nucleotídeos 1792- 2277 e 2320-4374 da SEQ ID NO: 71 (i.e., nucleotídeos 1792-4374 da SEQ ID NO: 1, nucleotídeos 1792-4374 da SEQ ID NO: 2, nucleotí- deos 1792-4374 da SEQ ID NO: 70, ou os nucleotídeos 1792-4374 da SEQ ID NO: 71 sem os nucleotídeos codificando o domínio B ou um fragmento do domínio B); e onde a porção N-terminal e a porção C- terminal juntas têm uma atividade de polipeptídio FVIII. Em uma moda- lidade, a segunda sequência de ácidos nucleicos compreende os (i) nucleotídeos 1792-2277 e 2320-4374 da SEQ ID NO: 1, (ii) nucleotí- deos 1792-2277 e 2320-4374 da SEQ ID NO: 2, (iii) nucleotídeos 1792-2277 e 2320-4374 da SEQ ID NO: 70, ou (iv) nucleotídeos 1792- 2277 e 2320-4374 da SEQ ID NO: 71 (i.e., nucleotídeos 1792-4374 da SEQ ID NO: 1, nucleotídeos 1792-4374 da SEQ ID NO: 2, nucleotí- deos 1792-4374 da SEQ ID NO: 70, ou os nucleotídeos 1792-4374 da SEQ ID NO: 71 sem os nucleotídeos codificando o domínio B ou um fragmento do domínio B).
[00267] Em algumas modalidades, a sequência de nucleotídeos có- don-otimizada codificando um polipeptídio FVIII compreende uma se- quência de nucleotídeos codificando um polipeptídio com atividade de FVIII, onde a sequência de nucleotídeos compreende uma sequência de ácidos nucleicos tendo pelo menos 90%, pelo menos 91%, pelo menos 92%, pelo menos 93%, pelo menos 94%, pelo menos 95%, pe- lo menos 96%, pelo menos 97%, pelo menos 98%, ou pelo menos 99% de identidade de sequência com os nucleotídeos 58 a 4374 da SEQ ID NO: 1. Em outras modalidades, a sequência de nucleotídeos compreende uma sequência de ácidos nucleicos tendo pelo menos
90%, pelo menos 91%, pelo menos 92%, pelo menos 93%, pelo me- nos 94%, pelo menos 95%, pelo menos 96%, pelo menos 97%, pelo menos 98%, ou pelo menos 99% de identidade de sequência com os nucleotídeos 58-2277 e 2320-4374 da SEQ ID NO: 1 (i.e., nucleotí- deos 58-4374 da SEQ ID NO: 1 sem os nucleotídeos codificando o domínio B ou um fragmento do domínio B). Em outras modalidades, a sequência de ácidos nucleicos tem pelo menos 90%, pelo menos 91%, pelo menos 92%, pelo menos 93%, pelo menos 94%, pelo menos 95%, pelo menos 96%, pelo menos 97%, pelo menos 98%, ou pelo menos 99% de identidade de sequência com a SEQ ID NO: 1. Em ou- tras modalidades, a sequência de nucleotídeos compreende nucleotí- deos 58-2277 e 2320-4374 da SEQ ID NO: 1 (i.e., nucleotídeos 58- 4374 da SEQ ID NO: 1 sem os nucleotídeos codificando o domínio B ou um fragmento do domínio B) ou os nucleotídeos 58 a 4374 da SEQ ID NO: 1. Em ainda outras modalidades, a sequência de nucleotídeos compreende os nucleotídeos 1-2277 e 2320-4374 da SEQ ID NO: 1 (i.e., nucleotídeos 1-4374 da SEQ ID NO: 1 sem os nucleotídeos codi- ficando o domínio B ou um fragmento do domínio B) ou os nucleotí- deos 1 a 4374 da SEQ ID NO: 1.
[00268] Em algumas modalidades, a sequência de nucleotídeos có- don-otimizada codificando um polipeptídio FVIII compreende uma se- quência de nucleotídeos codificando um polipeptídio com atividade de FVIII, onde a sequência de nucleotídeos compreende uma sequência de ácidos nucleicos tendo pelo menos 94%, pelo menos 95%, pelo menos 96%, pelo menos 97%, pelo menos 98%, ou pelo menos 99% de identidade de sequência com os nucleotídeos 58 a 4374 da SEQ ID NO: 2. Em outras modalidades, a sequência de nucleotídeos compre- ende uma sequência de ácidos nucleicos tendo pelo menos 94%, pelo menos 95%, pelo menos 96%, pelo menos 97%, pelo menos 98%, ou pelo menos 99% de identidade de sequência com os nucleotídeos 58-
2277 e 2320-4374 da SEQ ID NO: 2. Em outras modalidades, a se- quência de ácidos nucleicos tem pelo menos 94%, pelo menos 95%, pelo menos 96%, pelo menos 97%, pelo menos 98%, ou pelo menos 99% de identidade de sequência com a SEQ ID NO: 2. Em outras mo- dalidades, a sequência de nucleotídeos compreende nucleotídeos 58- 2277 e 2320-4374 da SEQ ID NO: 2 (i.e., nucleotídeos 58-4374 da SEQ ID NO: 2 sem os nucleotídeos codificando o domínio B ou um fragmento do domínio B) ou os nucleotídeos 58 a 4374 da SEQ ID NO:
2. Em ainda outras modalidades, a sequência de nucleotídeos com- preende os nucleotídeos 1-2277 e 2320-4374 da SEQ ID NO: 2 (i.e., nucleotídeos 1-4374 da SEQ ID NO: 2 sem os nucleotídeos codifican- do o domínio B ou um fragmento do domínio B) ou os nucleotídeos 1 a 4374 da SEQ ID NO: 2.
[00269] Em algumas modalidades, a sequência de nucleotídeos có- don-otimizada codificando um polipeptídio FVIII compreende uma se- quência de nucleotídeos codificando um polipeptídio com atividade de FVIII, onde a sequência de nucleotídeos compreende uma sequência de ácidos nucleicos tendo pelo menos 85%, pelo menos 86%, pelo menos 87%, pelo menos 88%, pelo menos 89%, pelo menos 90%, pe- lo menos 91%, pelo menos 95%, pelo menos 96%, pelo menos 97%, pelo menos 98%, ou pelo menos 99% de identidade de sequência com os nucleotídeos 58 a 4374 da SEQ ID NO: 70. Em outras modalidades, a sequência de nucleotídeos compreende uma sequência de ácidos nucleicos tendo pelo menos 85%, pelo menos 86%, pelo menos 87%, pelo menos 88%, pelo menos 89%, pelo menos 90%, pelo menos 91%, pelo menos 95%, pelo menos 96%, pelo menos 97%, pelo me- nos 98%, ou pelo menos 99% de identidade de sequência com os nu- cleotídeos 58-2277 e 2320-4374 da SEQ ID NO: 70 (i.e., nucleotídeos 58-4374 da SEQ ID NO: 70 sem os nucleotídeos codificando o domí- nio B ou um fragmento do domínio B). Em outras modalidades, a se-
quência de ácidos nucleicos tem pelo menos 85%, pelo menos 86%, pelo menos 87%, pelo menos 88%, pelo menos 89%, pelo menos 90%, pelo menos 91%, pelo menos 95%, pelo menos 96%, pelo me- nos 97%, pelo menos 98%, ou pelo menos 99% de identidade de se- quência com a SEQ ID NO: 70. Em outras modalidades, a sequência de nucleotídeos compreende nucleotídeos 58-2277 e 2320-4374 da SEQ ID NO: 70 (i.e., nucleotídeos 58-4374 da SEQ ID NO: 70 sem os nucleotídeos codificando o domínio B ou um fragmento do domínio B) ou os nucleotídeos 58 a 4374 da SEQ ID NO: 70. Em ainda outras modalidades, a sequência de nucleotídeos compreende os nucleotí- deos 1-2277 e 2320-4374 da SEQ ID NO: 70 (i.e., nucleotídeos 1-4374 da SEQ ID NO: 70 sem os nucleotídeos codificando o domínio B ou um fragmento do domínio B) ou os nucleotídeos 1 a 4374 da SEQ ID NO: 70.
[00270] Em algumas modalidades, a sequência de nucleotídeos có- don-otimizada codificando um polipeptídio FVIII compreende uma se- quência de nucleotídeos codificando um polipeptídio com atividade de FVIII, onde a sequência de nucleotídeos compreende uma sequência de ácidos nucleicos tendo pelo menos 85%, pelo menos 86%, pelo menos 87%, pelo menos 88%, pelo menos 89%, pelo menos 90%, pe- lo menos 91%, pelo menos 95%, pelo menos 96%, pelo menos 97%, pelo menos 98%, ou pelo menos 99% de identidade de sequência com os nucleotídeos 58 a 4374 da SEQ ID NO: 71. Em outras modalidades, a sequência de nucleotídeos compreende uma sequência de ácidos nucleicos tendo pelo menos 85%, pelo menos 86%, pelo menos 87%, pelo menos 88%, pelo menos 89%, pelo menos 90%, pelo menos 91%, pelo menos 95%, pelo menos 96%, pelo menos 97%, pelo me- nos 98%, ou pelo menos 99% de identidade de sequência com os nu- cleotídeos 58-2277 e 2320-4374 da SEQ ID NO: 71 (i.e., nucleotídeos 58-4374 da SEQ ID NO: 71 sem os nucleotídeos codificando o domí-
nio B ou um fragmento do domínio B). Em outras modalidades, a se- quência de ácidos nucleicos tem pelo menos 85%, pelo menos 86%, pelo menos 87%, pelo menos 88%, pelo menos 89%, pelo menos 90%, pelo menos 91%, pelo menos 95%, pelo menos 96%, pelo me- nos 97%, pelo menos 98%, ou pelo menos 99% de identidade de se- quência com a SEQ ID NO: 71. Em outras modalidades, a sequência de nucleotídeos compreende nucleotídeos 58-2277 e 2320-4374 da SEQ ID NO: 71 (i.e., nucleotídeos 58-4374 da SEQ ID NO: 71 sem os nucleotídeos codificando o domínio B ou um fragmento do domínio B) ou os nucleotídeos 58 a 4374 da SEQ ID NO: 71. Em ainda outras modalidades, a sequência de nucleotídeos compreende os nucleotí- deos 1-2277 e 2320-4374 da SEQ ID NO: 71 (i.e., nucleotídeos 1-4374 da SEQ ID NO: 71 sem os nucleotídeos codificando o domínio B ou um fragmento do domínio B) ou os nucleotídeos 1 a 4374 da SEQ ID NO: 71.
[00271] Em algumas modalidades, a sequência de nucleotídeos có- don-otimizada codificando um polipeptídio FVIII compreende uma se- quência de nucleotídeos codificando um polipeptídio com atividade de FVIII, onde a sequência de nucleotídeos compreende uma sequência de ácidos nucleicos tendo pelo menos 92%, pelo menos 93%, pelo menos 94%, pelo menos 95%, pelo menos 96%, pelo menos 97%, pe- lo menos 98%, ou pelo menos 99% de identidade de sequência com os nucleotídeos 58 a 4374 da SEQ ID NO: 3. Em outras modalidades, a sequência de nucleotídeos compreende uma sequência de ácidos nucleicos tendo pelo menos 92%, pelo menos 93%, pelo menos 94%, pelo menos 95%, pelo menos 96%, pelo menos 97%, pelo menos 98%, ou pelo menos 99% de identidade de sequência com os nucleo- tídeos 58-2277 e 2320-4374 da SEQ ID NO: 3 (i.e., nucleotídeos 58- 4374 da SEQ ID NO: 3 sem os nucleotídeos codificando o domínio B ou um fragmento do domínio B). Em certas modalidades, a sequência de ácidos nucleicos tem pelo menos 92%, pelo menos 93%, pelo me- nos 94%, pelo menos 95%, pelo menos 96%, pelo menos 97%, pelo menos 98%, ou pelo menos 99% de identidade de sequência com a SEQ ID NO: 3. Em algumas modalidades, a sequência de nucleotí- deos compreende nucleotídeos 58-2277 e 2320-4374 da SEQ ID NO: 3 (i.e., nucleotídeos 58-4374 da SEQ ID NO: 3 sem os nucleotídeos codificando o domínio B ou um fragmento do domínio B) ou os nucleo- tídeos 58 a 4374 da SEQ ID NO: 3. Em ainda outras modalidades, a sequência de nucleotídeos compreende nucleotídeos 58-2277 e 2320- 4374 da SEQ ID NO: 3 (i.e., nucleotídeos 1-4374 da SEQ ID NO: 3 sem os nucleotídeos codificando o domínio B ou um fragmento do do- mínio B) ou os nucleotídeos 1 a 4374 da SEQ ID NO: 3.
[00272] Em algumas modalidades, a sequência de nucleotídeos có- don-otimizada codificando um polipeptídio FVIII compreende uma se- quência de nucleotídeos codificando um polipeptídio com atividade de FVIII, onde a sequência de nucleotídeos compreende uma sequência de ácidos nucleicos tendo pelo menos 91%, pelo menos 92%, pelo menos 93%, pelo menos 94%, pelo menos 95%, pelo menos 96%, pe- lo menos 97%, pelo menos 98%, ou pelo menos 99% de identidade de sequência com os nucleotídeos 58 a 4374 da SEQ ID NO: 4. Em ou- tras modalidades, a sequência de nucleotídeos compreende uma se- quência de ácidos nucleicos tendo pelo menos 91%, pelo menos 92%, pelo menos 93%, pelo menos 94%, pelo menos 95%, pelo menos 96%, pelo menos 97%, pelo menos 98%, ou pelo menos 99% de iden- tidade de sequência com os nucleotídeos 58-2277 e 2320-4374 da SEQ ID NO: 4 (i.e., nucleotídeos 58-4374 da SEQ ID NO: 4 sem os nucleotídeos codificando o domínio B ou um fragmento do domínio B). Em outras modalidades, a sequência de ácidos nucleicos tem pelo menos 91%, pelo menos 92%, pelo menos 93%, pelo menos 94%, pe- lo menos 95%, pelo menos 96%, pelo menos 97%, pelo menos 98%,
ou pelo menos 99% de identidade de sequência com a SEQ ID NO: 4. Em outras modalidades, a sequência de nucleotídeos compreende os nucleotídeos 58-2277 e 2320-4374 da SEQ ID NO: 4 (i.e., nucleotí- deos 58-4374 da SEQ ID NO: 4 sem os nucleotídeos codificando o domínio B ou um fragmento do domínio B) ou os nucleotídeos 58 a 4374 da SEQ ID NO: 4. Em ainda outras modalidades, a sequência de nucleotídeos compreende os nucleotídeos 1-2277 e 2320-4374 da SEQ ID NO: 4 (i.e., nucleotídeos 1-4374 da SEQ ID NO: 4 sem os nu- cleotídeos codificando o domínio B ou um fragmento do domínio B) ou os nucleotídeos 1 a 4374 da SEQ ID NO: 4.
[00273] Em algumas modalidades, a sequência de nucleotídeos có- don-otimizada codificando um polipeptídio FVIII compreende uma se- quência de nucleotídeos codificando um polipeptídio com atividade de FVIII, onde a sequência de nucleotídeos compreende uma sequência de ácidos nucleicos tendo pelo menos 89%, pelo menos 90%, pelo menos 91%, pelo menos 92%, pelo menos 93%, pelo menos 94%, pe- lo menos 95%, pelo menos 96%, pelo menos 97%, pelo menos 98%, ou pelo menos 99% de identidade de sequência com os nucleotídeos 58 a 4374 da SEQ ID NO: 5. Em outras modalidades, a sequência de nucleotídeos compreende uma sequência de ácidos nucleicos tendo pelo menos 89%, pelo menos 90%, pelo menos 91%, pelo menos 92%, pelo menos 93%, pelo menos 94%, pelo menos 95%, pelo me- nos 96%, pelo menos 97%, pelo menos 98%, ou pelo menos 99% de identidade de sequência com os nucleotídeos 58-2277 e 2320-4374 da SEQ ID NO: 5 (i.e., nucleotídeos 58-4374 da SEQ ID NO: 5 sem os nucleotídeos codificando o domínio B ou um fragmento do domínio B). Em certas modalidades, a sequência de ácidos nucleicos tem pelo menos 89%, pelo menos 90%, pelo menos 91%, pelo menos 92%, pe- lo menos 93%, pelo menos 94%, pelo menos 95%, pelo menos 96%, pelo menos 97%, pelo menos 98%, ou pelo menos 99% de identidade de sequência com a SEQ ID NO: 5. Em algumas modalidades, a se- quência de nucleotídeos compreende nucleotídeos 58-2277 e 2320- 4374 da SEQ ID NO: 5 (i.e., nucleotídeos 58-4374 da SEQ ID NO: 5 sem os nucleotídeos codificando o domínio B ou um fragmento do do- mínio B) ou os nucleotídeos 58 a 4374 da SEQ ID NO: 5. Em ainda outras modalidades, a sequência de nucleotídeos compreende os nu- cleotídeos 1-2277 e 2320-4374 da SEQ ID NO: 5 (i.e., nucleotídeos 1- 4374 da SEQ ID NO: 5 sem os nucleotídeos codificando o domínio B ou um fragmento do domínio B) ou os nucleotídeos 1 a 4374 da SEQ ID NO: 5.
[00274] Em algumas modalidades, a sequência de nucleotídeos có- don-otimizada codificando um polipeptídio FVIII compreende uma se- quência de nucleotídeos codificando um polipeptídio com atividade de FVIII, onde a sequência de nucleotídeos compreende uma sequência de ácidos nucleicos tendo pelo menos 89%, pelo menos 90%, pelo menos 91%, pelo menos 92%, pelo menos 93%, pelo menos 94%, pe- lo menos 95%, pelo menos 96%, pelo menos 97%, pelo menos 98%, ou pelo menos 99% de identidade de sequência com os nucleotídeos 58 a 4374 da SEQ ID NO: 6. Em outras modalidades, a sequência de nucleotídeos compreende uma sequência de ácidos nucleicos tendo pelo menos 89%, pelo menos 90%, pelo menos 91%, pelo menos 92%, pelo menos 93%, pelo menos 94%, pelo menos 95%, pelo me- nos 96%, pelo menos 97%, pelo menos 98%, ou pelo menos 99% de identidade de sequência com os nucleotídeos 58-2277 e 2320-4374 da SEQ ID NO: 6 (i.e., nucleotídeos 58-4374 da SEQ ID NO: 6 sem os nucleotídeos codificando o domínio B ou um fragmento do domínio B). Em certas modalidades, a sequência de ácidos nucleicos tem pelo menos 89%, pelo menos 90%, pelo menos 91%, pelo menos 92%, pe- lo menos 93%, pelo menos 94%, pelo menos 95%, pelo menos 96%, pelo menos 97%, pelo menos 98%, ou pelo menos 99% de identidade de sequência com a SEQ ID NO: 6. Em algumas modalidades, a se- quência de nucleotídeos compreende nucleotídeos 58-2277 e 2320- 4374 da SEQ ID NO: 6 (i.e., nucleotídeos 58-4374 da SEQ ID NO: 6 sem os nucleotídeos codificando o domínio B ou um fragmento do do- mínio B) ou os nucleotídeos 58 a 4374 da SEQ ID NO: 6. Em ainda outras modalidades, a sequência de nucleotídeos compreende os nu- cleotídeos 1-2277 e 2320-4374 da SEQ ID NO: 6 (i.e., nucleotídeos 1- 4374 da SEQ ID NO: 6 sem os nucleotídeos codificando o domínio B ou um fragmento do domínio B) ou os nucleotídeos 1 a 4374 da SEQ ID NO: 6.
[00275] Em algumas modalidades, a sequência de nucleotídeos có- don-otimizada codificando um polipeptídio FVIII compreende a se- quência de ácidos nucleicos codificando um peptídio sinal. Em certas modalidades, o peptídio sinal é um peptídio sinal FVIII. Em algumas modalidades, a sequência de ácidos nucleicos codificando a signal peptide é códon-otimizada. Em uma modalidade particular, a sequên- cia de ácidos nucleicos codificando um peptídio sinal tem pelo menos 60%, pelo menos 70%, pelo menos 80%, pelo menos 90%, pelo me- nos 95%, pelo menos 96%, pelo menos 97%, pelo menos 98%, pelo menos 99%, ou 100% de identidade de sequência com os (i) nucleotí- deos 1 a 57 da SEQ ID NO: 1; (ii) nucleotídeos 1 a 57 da SEQ ID NO: 2; (iii) nucleotídeos 1 a 57 da SEQ ID NO: 3; (iv) nucleotídeos 1 a 57 da SEQ ID NO: 4; (v) nucleotídeos 1 a 57 da SEQ ID NO: 5; (vi) nucle- otídeos 1 a 57 da SEQ ID NO: 6; (vii) nucleotídeos 1 a 57 da SEQ ID NO: 70; (viii) nucleotídeos 1 a 57 da SEQ ID NO: 71; ou (ix) nucleotí- deos 1 a 57 da SEQ ID NO: 68.
[00276] SEQ ID NOs: 1-6, 70, e 71 são versões otimizadas da SEQ ID NO: 16, a sequência de nucleotídeos de FVIII "parental" ou "do tipo selvagem". A SEQ ID NO: 16 codifica um FVIII humano com o domínio B deltado. Embora as SEQ ID NOs: 1-6, 70, e 71 sejam derivadas de uma forma específica de FVIII com o domínio B deletado (SEQ ID NO: 16), deve ficar entendido que a presente invenção também inclui ver- sões otimizados de ácidos nucleicos codificando outras versões de FVIII. Por exemplo, outras versões de FVIII podem incluir FVIII de comprimento total, outras deleções do domínio B do FVIII (descritas neste pedido), ou outros fragmentos de FVIII que conservam a ativida- de de FVIII.
[00277] Em uma modalidade, o cassete genético compreende um construto de FVIII, que inclui uma sequência de polinucleotídeos lista- da nas Tabelas 2A-2F. Em uma modalidade, o cassete genético com- preende um construto de FVIII, que inclui uma sequência de polinucle- otídeos listada na Tabela 2A. Em uma modalidade, o cassete genético compreende um construto de FVIII, que inclui uma sequência de poli- nucleotídeos listada na Tabela 2B. Em uma modalidade, o cassete ge- nético compreende um construto de FVIII, que inclui uma sequência de polinucleotídeos listada na Tabela 2C. Em uma modalidade, o cassete genético compreende um construto de FVIII, que inclui uma sequência de polinucleotídeos listada na Tabela 2D. Em uma modalidade, o cas- sete genético compreende um construto de FVIII, que inclui uma se- quência de polinucleotídeos listada na Tabela 2E. Em uma modalida- de, o cassete genético compreende um construto de FVIII, que inclui uma sequência de polinucleotídeos listada na Tabela 2F
[00278] Em certas modalidades, a molécula de ácido nucleico iso- lada compreende uma sequência de nucleotídeos tendo pelo menos cerca de 60%, pelo menos cerca de 65%, pelo menos cerca de 70%, pelo menos cerca de 75%, pelo menos cerca de 80%, pelo menos cer- ca de 85%, pelo menos cerca de 90%, pelo menos cerca de 95%, pelo menos cerca de 96%, pelo menos cerca de 97%, pelo menos cerca de 98%, pelo menos cerca de 99%, ou cerca de 100% de identidade de sequência com a sequência de nucleotídeos de SEQ ID NO: 179, 182,
189, ou 194. Em algumas modalidades, a molécula de ácido nucleico isolada compreende uma sequência de nucleotídeos tendo pelo me- nos cerca de 60%, pelo menos cerca de 65%, pelo menos cerca de 70%, pelo menos cerca de 75%, pelo menos cerca de 80%, pelo me- nos cerca de 85%, pelo menos cerca de 90%, pelo menos cerca de 95%, pelo menos cerca de 96%, pelo menos cerca de 97%, pelo me- nos cerca de 98%, pelo menos cerca de 99%, ou cerca de 100% de identidade de sequência com a sequência de nucleotídeos de SEQ ID NO: 179. Em algumas modalidades, a molécula de ácido nucleico iso- lada compreende uma sequência de nucleotídeos tendo pelo menos cerca de 60%, pelo menos cerca de 65%, pelo menos cerca de 70%, pelo menos cerca de 75%, pelo menos cerca de 80%, pelo menos cer- ca de 85%, pelo menos cerca de 90%, pelo menos cerca de 95%, pelo menos cerca de 96%, pelo menos cerca de 97%, pelo menos cerca de 98%, pelo menos cerca de 99%, ou cerca de 100% de identidade de sequência com a sequência de nucleotídeos de SEQ ID NO: 182. Em algumas modalidades, a molécula de ácido nucleico isolada compre- ende uma sequência de nucleotídeos tendo pelo menos cerca de 60%, pelo menos cerca de 65%, pelo menos cerca de 70%, pelo menos cer- ca de 75%, pelo menos cerca de 80%, pelo menos cerca de 85%, pelo menos cerca de 90%, pelo menos cerca de 95%, pelo menos cerca de 96%, pelo menos cerca de 97%, pelo menos cerca de 98%, pelo me- nos cerca de 99%, ou cerca de 100% de identidade de sequência com a sequência de nucleotídeos de SEQ ID NO: 189. Em algumas moda- lidades, a molécula de ácido nucleico isolada compreende uma se- quência de nucleotídeos tendo pelo menos cerca de 60%, pelo menos cerca de 65%, pelo menos cerca de 70%, pelo menos cerca de 75%, pelo menos cerca de 80%, pelo menos cerca de 85%, pelo menos cer- ca de 90%, pelo menos cerca de 95%, pelo menos cerca de 96%, pelo menos cerca de 97%, pelo menos cerca de 98%, pelo menos cerca de
99%, ou cerca de 100% de identidade de sequência com a sequência de nucleotídeos de SEQ ID NO: 194. Em algumas modalidades, a mo- lécula de ácido nucleico isolada conserva a capacidade de expressar uma proteína FVIII funcional. Tabela 2A: Exemplo do construto AAV-FVIII (nucleotídeos 1-6526; SEQ ID NO: 110) Descrição Sequência 5’ITR (repetição 1 -- terminal inverti- CTGCGCGCTCGCTCGCTCACTGAGGCCGCCC da de AAV2 de GGGCAAAGCCCGGGCGTCGGGCGACCTTTGG extremidade 5’) TCGCCCGGCCTCAGTGAGCGAGCGAGCGCGC (SEQ ID AGAGAGGGAGTGGCCAACTCCATCACTAGGGG NO:111) TTCCT -- 130 Sequência de 131 -- esqueleto plas- GCGGCAATTCAGTCGATAACTATAACGGTCCTA mídico (PBS)-1 AGGTAGCGATTTAAATACGCGCTCTCTTAAGGT (SEQ ID AGCCCCGGGACGCGTCAATTGAGATCTGGATC NO:112) CGGTACCGAATTCGCGGCCGCCTCGACGACTA GCGTTTAATTAA -- 272 TTPp (promotor 273 -- fígado- ACGCGTGTCTGTCTGCACATTTCGTAGAGCGA específico) (SEQ GTGTTCCGATACTCTAATCTCCCTAGGCAAGGT ID NO:113) TCATATTTGTGTAGGTTACTTATTCTCCTTTTGT
TGACTAAGTCAATAATCAGAATCAGCAGGTTTG GAGTCAGCTTGGCAGGGATCAGCAGCCTGGGT TGGAAGGAGGGGGTATAAAAGCCCCTTCACCA
GGAGAAGCCGTCACACAGATCCACAAGCTCCT G -- 501 PBS-2 (SEQ ID 502 -- AG -- 503 NO:114) Íntron sintético 504 -- (SEQ ID GTAAGTGCCGTGTGTGGTTCCCGCGGGCCTG NO:115) GCCTCTTTACGGGTTATGGCCCTTGCGTGCCT
TGAATTACTGACACTGACATCCACTTTTTCTTTT TCTCCACAG --609
Descrição Sequência PBS-3 (SEQ ID 610 -- CTAGCGCCACC -- 620 NO:116) FVIIIco6XTEN 621 -- (SEQ ID ATGCAGATTGAGCTGTCCACTTGTTTCTTCCTG NO:117) (fase TGCCTCCTGCGCTTCTGTTTCTCCGCCACTCG de leitura aberta CCGGTACTACCTTGGAGCCGTGGAGCTTTCAT para FVIII có- GGGACTACATGCAGAGCGACCTGGGCGAACTC don-otimizado CCCGTGGATGCCAGATTCCCCCCCCGCGTGCC versão 6 con- AAAGTCCTTCCCCTTTAACACCTCCGTGGTGTA tendo XTEN144; CAAGAAAACCCTCTTTGTCGAGTTCACTGACCA a sequência de CCTGTTCAACATCGCCAAGCCGCGCCCACCTT XTEN está assi- GGATGGGCCTCCTGGGACCGACCATTCAAGCT nalada com sub- GAAGTGTACGACACCGTGGTGATCACCCTGAA linhado duplo GAACATGGCGTCCCACCCCGTGTCCCTGCATG (SEQ ID CGGTCGGAGTGTCCTACTGGAAGGCCTCCGAA NO:118)) GGAGCTGAGTACGACGACCAGACTAGCCAGC
GGGAAAAGGAGGACGATAAAGTGTTCCCGGGC GGCTCGCATACTTACGTGTGGCAAGTCCTGAA GGAAAACGGACCTATGGCATCCGATCCTCTGT GCCTGACTTACTCCTACCTTTCCCATGTGGACC TCGTGAAGGACCTGAACAGCGGGCTGATTGGT GCACTTCTCGTGTGCCGCGAAGGTTCGCTCGC TAAGGAAAAGACCCAGACCCTCCATAAGTTCAT CCTTTTGTTCGCTGTGTTCGATGAAGGAAAGTC ATGGCATTCCGAAACTAAGAACTCGCTGATGCA GGACCGGGATGCCGCCTCAGCCCGCGCCTGG CCTAAAATGCATACAGTCAACGGATACGTGAAT CGGTCACTGCCCGGGCTCATCGGTTGTCACAG AAAGTCCGTGTACTGGCACGTCATCGGCATGG GCACTACGCCTGAAGTGCACTCCATCTTCCTG GAAGGGCACACCTTCCTCGTGCGCAACCACCG CCAGGCCTCTCTGGAAATCTCCCCGATTACCTT TCTGACCGCCCAGACTCTGCTCATGGACCTGG GGCAGTTCCTTCTCTTCTGCCACATCTCCAGCC ATCAGCACGACGGAATGGAGGCCTACGTGAAG GTGGACTCATGCCCGGAAGAACCTCAGTTGCG
Descrição Sequência
GATGAAGAACAACGAGGAGGCCGAGGACTATG ACGACGATTTGACTGACTCCGAGATGGACGTC GTGCGGTTCGATGACGACAACAGCCCCAGCTT CATCCAGATTCGCAGCGTGGCCAAGAAGCACC CCAAAACCTGGGTGCACTACATCGCGGCCGAG GAAGAAGATTGGGACTACGCCCCGTTGGTGCT GGCACCCGATGACCGGTCGTACAAGTCCCAGT ATCTGAACAATGGTCCGCAGCGGATTGGCAGA AAGTACAAGAAAGTGCGGTTCATGGCGTACAC TGACGAAACGTTTAAGACCCGGGAGGCCATTC AACATGAGAGCGGCATTCTGGGACCACTGCTG TACGGAGAGGTCGGCGATACCCTGCTCATCAT CTTCAAAAACCAGGCCTCCCGGCCTTACAACAT CTACCCTCACGGAATCACCGACGTGCGGCCAC TCTACTCGCGGCGCCTGCCGAAGGGCGTCAA GCACCTGAAAGACTTCCCTATCCTGCCGGGCG AAATCTTCAAGTATAAGTGGACCGTCACCGTGG AGGACGGGCCCACCAAGAGCGATCCTAGGTGT CTGACTCGGTACTACTCCAGCTTCGTGAACATG GAACGGGACCTGGCATCGGGACTCATTGGACC GCTGCTGATCTGCTACAAAGAGTCGGTGGATC AACGCGGCAACCAGATCATGTCCGACAAGCGC AACGTGATCCTGTTCTCCGTGTTTGATGAAAAC AGATCCTGGTACCTCACTGAAAACATCCAGAG GTTCCTCCCAAACCCCGCAGGAGTGCAACTGG AGGACCCTGAGTTTCAGGCCTCGAATATCATG CACTCGATTAACGGTTACGTGTTCGACTCGCTG CAACTGAGCGTGTGCCTCCATGAAGTCGCTTA CTGGTACATTCTGTCCATCGGCGCCCAGACTG ACTTCCTGAGCGTGTTCTTTTCCGGTTACACCT TTAAGCACAAGATGGTGTACGAAGATACCCTGA CCCTGTTCCCTTTCTCCGGCGAAACGGTGTTC ATGTCGATGGAGAACCCGGGTCTGTGGATTCT GGGATGCCACAACAGCGACTTTCGGAACCGCG GAATGACTGCCCTGCTGAAGGTGTCCTCATGC GACAAGAACACCGGAGACTACTACGAGGACTC CTACGAGGATATCTCAGCCTACCTCCTGTCCAA
Descrição Sequência
GAACAACGCGATCGAGCCGCGCAGCTTCAGCC AGAACGGCGCGCCAACATCAGAGAGCGCCAC CCCTGAAAGTGGTCCCGGGAGCGAGCCAGCC ACATCTGGGTCGGAAACGCCAGGCACAAGTGA GTCTGCAACTCCCGAGTCCGGACCTGGCTCCG AGCCTGCCACTAGCGGCTCCGAGACTCCGGG AACTTCCGAGAGCGCTACACCAGAAAGCGGAC CCGGAACCAGTACCGAACCTAGCGAGGGCTCT GCTCCGGGCAGCCCAGCCGGCTCTCCTACATC CACGGAGGAGGGCACTTCCGAATCCGCCACC CCGGAGTCAGGGCCAGGATCTGAACCCGCTAC CTCAGGCAGTGAGACGCCAGGAACGAGCGAG TCCGCTACACCGGAGAGTGGGCCAGGGAGCC CTGCTGGATCTCCTACGTCCACTGAGGAAGGG TCACCAGCGGGCTCGCCCACCAGCACTGAAGA AGGTGCCTCGAGCCCGCCTGTGCTGAAGAGG CACCAGCGAGAAATTACCCGGACCACCCTCCA ATCGGATCAGGAGGAAATCGACTACGACGACA CCATCTCGGTGGAAATGAAGAAGGAAGATTTC GATATCTACGACGAGGACGAAAATCAGTCCCC TCGCTCATTCCAAAAGAAAACTAGACACTACTT TATCGCCGCGGTGGAAAGACTGTGGGACTATG GAATGTCATCCAGCCCTCACGTCCTTCGGAAC CGGGCCCAGAGCGGATCGGTGCCTCAGTTCAA GAAAGTGGTGTTCCAGGAGTTCACCGACGGCA GCTTCACCCAGCCGCTGTACCGGGGAGAACTG AACGAACACCTGGGCCTGCTCGGTCCCTACAT CCGCGCGGAAGTGGAGGATAACATCATGGTGA CCTTCCGTAACCAAGCATCCAGACCTTACTCCT TCTATTCCTCCCTGATCTCATACGAGGAGGACC AGCGCCAAGGCGCCGAGCCCCGCAAGAACTT CGTCAAGCCCAACGAGACTAAGACCTACTTCT GGAAGGTCCAACACCATATGGCCCCGACCAAG GATGAGTTTGACTGCAAGGCCTGGGCCTACTT CTCCGACGTGGACCTTGAGAAGGATGTCCATT CCGGCCTGATCGGGCCGCTGCTCGTGTGTCAC ACCAACACCCTGAACCCAGCGCATGGACGCCA
Descrição Sequência
GGTCACCGTCCAGGAGTTTGCTCTGTTCTTCAC CATTTTTGACGAAACTAAGTCCTGGTACTTCAC CGAGAATATGGAGCGAAACTGTAGAGCGCCCT GCAATATCCAGATGGAAGATCCGACTTTCAAG GAGAACTATAGATTCCACGCCATCAACGGGTA CATCATGGATACTCTGCCGGGGCTGGTCATGG CCCAGGATCAGAGGATTCGGTGGTACTTGCTG TCAATGGGATCGAACGAAAACATTCACTCCATT CACTTCTCCGGTCACGTGTTCACTGTGCGCAA GAAGGAGGAGTACAAGATGGCGCTGTACAATC TGTACCCCGGGGTGTTCGAAACTGTGGAGATG CTGCCGTCCAAGGCCGGCATCTGGAGAGTGG AGTGCCTGATCGGAGAGCACCTCCACGCGGG GATGTCCACCCTCTTCCTGGTGTACTCGAATAA GTGCCAGACCCCGCTGGGCATGGCCTCGGGC CACATCAGAGACTTCCAGATCACAGCAAGCGG ACAATACGGCCAATGGGCGCCGAAGCTGGCC CGCTTGCACTACTCCGGATCGATCAACGCATG GTCCACCAAGGAACCGTTCTCGTGGATTAAGG TGGACCTCCTGGCCCCTATGATTATCCACGGA ATTAAGACCCAGGGCGCCAGGCAGAAGTTCTC CTCCCTGTACATCTCGCAATTCATCATCATGTA CAGCCTGGACGGGAAGAAGTGGCAGACTTACA GGGGAAACTCCACCGGCACCCTGATGGTCTTT TTCGGCAACGTGGATTCCTCCGGCATTAAGCA CAACATCTTCAACCCACCGATCATAGCCAGATA TATTAGGCTCCACCCCACTCACTACTCAATCCG CTCAACTCTTCGGATGGAACTCATGGGGTGCG ACCTGAACTCCTGCTCCATGCCGTTGGGGATG GAATCAAAGGCTATTAGCGACGCCCAGATCAC CGCGAGCTCCTACTTCACTAACATGTTCGCCAC CTGGAGCCCCTCCAAGGCCAGGCTGCACTTGC AGGGACGGTCAAATGCCTGGCGGCCGCAAGT GAACAATCCGAAGGAATGGCTTCAAGTGGATTT CCAAAAGACCATGAAAGTGACCGGAGTCACCA CCCAGGGAGTGAAGTCCCTTCTGACCTCGATG TATGTGAAGGAGTTCCTGATTAGCAGCAGCCA
Descrição Sequência
GGACGGGCACCAGTGGACCCTGTTCTTCCAAA ACGGAAAGGTCAAGGTGTTCCAGGGGAACCAG GACTCGTTCACACCCGTGGTGAACTCCCTGGA CCCCCCACTGCTGACGCGGTACTTGAGGATTC ATCCTCAGTCCTGGGTCCATCAGATTGCATTGC
GAATGGAAGTCCTGGGCTGCGAGGCCCAGGA CCTGTACTGA -- 5444 PBS-4 (SEQ ID 5445 -- ATCAGCCTGAGCTCGCTGA -- 5463 NO:119) WPRE (elemen- 5464 -- to regulador pós- TCATAATCAACCTCTGGATTACAAAATTTGTGAA transcricional do AGATTGACTGGTATTCTTAACTATGTTGCTCCTT vírus mutado da TTACGCTATGTGGATACGCTGCTTTAATGCCTT hepatite de TGTATCATGCTATTGCTTCCCGTATGGCTTTCA marmota) (SEQ TTTTCTCCTCCTTGTATAAATCCTGGTTGCTGTC ID NO:120) TCTTTATGAGGAGTTGTGGCCCGTTGTCAGGC
AACGTGGCGTGGTGTGCACTGTGTTTGCTGAC GCAACCCCCACTGGTTGGGGCATTGCCACCAC CTGTCAGCTCCTTTCCGGGACTTTCGCTTTCCC CCTCCCTATTGCCACGGCGGAACTCATCGCCG CCTGCCTTGCCCGCTGCTGGACAGGGGCTCG GCTGTTGGGCACTGACAATTCCGTGGTGTTGT CGGGGAAATCATCGTCCTTTCCTTGGCTGCTC GCCTGTGTTGCCACCTGGATTCTGCGCGGGAC GTCCTTCTGCTACGTCCCTTCGGCCCTCAATCC AGCGGACCTTCCTTCCCGCGGCCTGCTGCCG GCTCTGCGGCCTCTTCCGCGTCTTCGCCTTCG
CCCTCAGACGAGTCGGATCTCCCTTTGGGCCG CCTCCCCGCTG -- 6058 PBS-5 (SEQ ID 6059 -- ATCAGCCT -- 6066 NO:121) bGHpA (sinal de 6067 -- poliadenilação CGACTGTGCCTTCTAGTTGCCAGCCATCTGTTG do hormônio de TTTGCCCCTCCCCCGTGCCTTCCTTGACCCTG crescimento bo- GAAGGTGCCACTCCCACTGTCCTTTCCTAATAA vino) (SEQ ID AATGAGGAAATTGCATCGCATTGTCTGAGTAGG
Descrição Sequência NO:122) TGTCATTCTATTCTGGGGGGTGGGGTGGGGCA
GGACAGCAAGGGGGAGGATTGGGAAGACAAT AGCAGGCATGCTGGGGA --6277 PBS-6 (SEQ ID 6278 -- NO:123) TGCGGTGGGCTCTATGGCTTCTGAGGCGGAAA
GAACGGGCTCGAGAAGCTTCTAGATATCCTCT
CTTAAGGTAGCATCGAGATTTAAATTAGGGATA ACAGGGTAATGGCGCGGGCCGC -- 6396 3’ITR (repetição 6397 -- terminal inverti- AGGAACCCCTAGTGATGGAGTTGGCCACTCCC da de AAV2 de TCTCTGCGCGCTCGCTCGCTCACTGAGGCCGG extremidade 3’) GCGACCAAAGGTCGCCCGACGCCCGGGCTTT (SEQ ID GCCCGGGCGGCCTCAGTGAGCGAGCGAGCGC NO:124) GCAG -- 6526 Tabela 2B: Exemplo do construto B19-FVIII transportando B19d135 ITRs (nucleotídeos 1-6762; SEQ ID NO: 179) Descrição Sequência 5'ITR (SEQ ID 1– NO: 180) CTCTGGGCCAGCTTGCTTGGGGTTGCCTTGAC
ACTAAGACAAGCGGCGCGCCGCTTGATCTTAG TGGCACGTCAACCCCAAGCGCTGGCCCAGAG CCAACCCTAATTCCGGAAGTCCCGCCCACCGG AAGTGACGTCACAGGAAATGACGTCACAGGAA ATGACGTAATTGTCCGCCATCTTGTACCGGAAG
TCCCGCCTACCGGCGGCGACCGGCGGCATCT GATTTGGTGTCTTCTTTTAAATTTT -- 248 TTPp (promotor 391 – fígado- ACGCGTGTCTGTCTGCACATTTCGTAGAGCGA específico) (SEQ GTGTTCCGATACTCTAATCTCCCTAGGCAAGGT ID NO:113) TCATATTTGTGTAGGTTACTTATTCTCCTTTTGT
TGACTAAGTCAATAATCAGAATCAGCAGGTTTG GAGTCAGCTTGGCAGGGATCAGCAGCCTGGGT TGGAAGGAGGGGGTATAAAAGCCCCTTCACCA GGAGAAGCCGTCACACAGATCCACAAGCTCCT
Descrição Sequência G -- 619 Íntron sintético 622 – (SEQ ID GTAAGTGCCGTGTGTGGTTCCCGCGGGCCTG NO:115) GCCTCTTTACGGGTTATGGCCCTTGCGTGCCT
TGAATTACTGACACTGACATCCACTTTTTCTTTT TCTCCACAG --727 FVIIIco6XTEN 739 – (SEQ ID ATGCAGATTGAGCTGTCCACTTGTTTCTTCCTG NO:117) (fase TGCCTCCTGCGCTTCTGTTTCTCCGCCACTCG de leitura aberta CCGGTACTACCTTGGAGCCGTGGAGCTTTCAT para FVIII có- GGGACTACATGCAGAGCGACCTGGGCGAACTC don-otimizado CCCGTGGATGCCAGATTCCCCCCCCGCGTGCC versão 6 con- AAAGTCCTTCCCCTTTAACACCTCCGTGGTGTA tendo XTEN144; CAAGAAAACCCTCTTTGTCGAGTTCACTGACCA a sequência de CCTGTTCAACATCGCCAAGCCGCGCCCACCTT XTEN está assi- GGATGGGCCTCCTGGGACCGACCATTCAAGCT nalada com sub- GAAGTGTACGACACCGTGGTGATCACCCTGAA linhado duplo GAACATGGCGTCCCACCCCGTGTCCCTGCATG (SEQ ID CGGTCGGAGTGTCCTACTGGAAGGCCTCCGAA NO:118)) GGAGCTGAGTACGACGACCAGACTAGCCAGC
GGGAAAAGGAGGACGATAAAGTGTTCCCGGGC GGCTCGCATACTTACGTGTGGCAAGTCCTGAA GGAAAACGGACCTATGGCATCCGATCCTCTGT GCCTGACTTACTCCTACCTTTCCCATGTGGACC TCGTGAAGGACCTGAACAGCGGGCTGATTGGT GCACTTCTCGTGTGCCGCGAAGGTTCGCTCGC TAAGGAAAAGACCCAGACCCTCCATAAGTTCAT CCTTTTGTTCGCTGTGTTCGATGAAGGAAAGTC ATGGCATTCCGAAACTAAGAACTCGCTGATGCA GGACCGGGATGCCGCCTCAGCCCGCGCCTGG CCTAAAATGCATACAGTCAACGGATACGTGAAT CGGTCACTGCCCGGGCTCATCGGTTGTCACAG AAAGTCCGTGTACTGGCACGTCATCGGCATGG GCACTACGCCTGAAGTGCACTCCATCTTCCTG GAAGGGCACACCTTCCTCGTGCGCAACCACCG CCAGGCCTCTCTGGAAATCTCCCCGATTACCTT
Descrição Sequência
TCTGACCGCCCAGACTCTGCTCATGGACCTGG GGCAGTTCCTTCTCTTCTGCCACATCTCCAGCC ATCAGCACGACGGAATGGAGGCCTACGTGAAG GTGGACTCATGCCCGGAAGAACCTCAGTTGCG GATGAAGAACAACGAGGAGGCCGAGGACTATG ACGACGATTTGACTGACTCCGAGATGGACGTC GTGCGGTTCGATGACGACAACAGCCCCAGCTT CATCCAGATTCGCAGCGTGGCCAAGAAGCACC CCAAAACCTGGGTGCACTACATCGCGGCCGAG GAAGAAGATTGGGACTACGCCCCGTTGGTGCT GGCACCCGATGACCGGTCGTACAAGTCCCAGT ATCTGAACAATGGTCCGCAGCGGATTGGCAGA AAGTACAAGAAAGTGCGGTTCATGGCGTACAC TGACGAAACGTTTAAGACCCGGGAGGCCATTC AACATGAGAGCGGCATTCTGGGACCACTGCTG TACGGAGAGGTCGGCGATACCCTGCTCATCAT CTTCAAAAACCAGGCCTCCCGGCCTTACAACAT CTACCCTCACGGAATCACCGACGTGCGGCCAC TCTACTCGCGGCGCCTGCCGAAGGGCGTCAA GCACCTGAAAGACTTCCCTATCCTGCCGGGCG AAATCTTCAAGTATAAGTGGACCGTCACCGTGG AGGACGGGCCCACCAAGAGCGATCCTAGGTGT CTGACTCGGTACTACTCCAGCTTCGTGAACATG GAACGGGACCTGGCATCGGGACTCATTGGACC GCTGCTGATCTGCTACAAAGAGTCGGTGGATC AACGCGGCAACCAGATCATGTCCGACAAGCGC AACGTGATCCTGTTCTCCGTGTTTGATGAAAAC AGATCCTGGTACCTCACTGAAAACATCCAGAG GTTCCTCCCAAACCCCGCAGGAGTGCAACTGG AGGACCCTGAGTTTCAGGCCTCGAATATCATG CACTCGATTAACGGTTACGTGTTCGACTCGCTG CAACTGAGCGTGTGCCTCCATGAAGTCGCTTA CTGGTACATTCTGTCCATCGGCGCCCAGACTG ACTTCCTGAGCGTGTTCTTTTCCGGTTACACCT TTAAGCACAAGATGGTGTACGAAGATACCCTGA CCCTGTTCCCTTTCTCCGGCGAAACGGTGTTC
Descrição Sequência
ATGTCGATGGAGAACCCGGGTCTGTGGATTCT GGGATGCCACAACAGCGACTTTCGGAACCGCG GAATGACTGCCCTGCTGAAGGTGTCCTCATGC GACAAGAACACCGGAGACTACTACGAGGACTC CTACGAGGATATCTCAGCCTACCTCCTGTCCAA GAACAACGCGATCGAGCCGCGCAGCTTCAGCC AGAACGGCGCGCCAACATCAGAGAGCGCCAC CCCTGAAAGTGGTCCCGGGAGCGAGCCAGCC ACATCTGGGTCGGAAACGCCAGGCACAAGTGA GTCTGCAACTCCCGAGTCCGGACCTGGCTCCG AGCCTGCCACTAGCGGCTCCGAGACTCCGGG AACTTCCGAGAGCGCTACACCAGAAAGCGGAC CCGGAACCAGTACCGAACCTAGCGAGGGCTCT GCTCCGGGCAGCCCAGCCGGCTCTCCTACATC CACGGAGGAGGGCACTTCCGAATCCGCCACC CCGGAGTCAGGGCCAGGATCTGAACCCGCTAC CTCAGGCAGTGAGACGCCAGGAACGAGCGAG TCCGCTACACCGGAGAGTGGGCCAGGGAGCC CTGCTGGATCTCCTACGTCCACTGAGGAAGGG TCACCAGCGGGCTCGCCCACCAGCACTGAAGA AGGTGCCTCGAGCCCGCCTGTGCTGAAGAGG CACCAGCGAGAAATTACCCGGACCACCCTCCA ATCGGATCAGGAGGAAATCGACTACGACGACA CCATCTCGGTGGAAATGAAGAAGGAAGATTTC GATATCTACGACGAGGACGAAAATCAGTCCCC TCGCTCATTCCAAAAGAAAACTAGACACTACTT TATCGCCGCGGTGGAAAGACTGTGGGACTATG GAATGTCATCCAGCCCTCACGTCCTTCGGAAC CGGGCCCAGAGCGGATCGGTGCCTCAGTTCAA GAAAGTGGTGTTCCAGGAGTTCACCGACGGCA GCTTCACCCAGCCGCTGTACCGGGGAGAACTG AACGAACACCTGGGCCTGCTCGGTCCCTACAT CCGCGCGGAAGTGGAGGATAACATCATGGTGA CCTTCCGTAACCAAGCATCCAGACCTTACTCCT TCTATTCCTCCCTGATCTCATACGAGGAGGACC AGCGCCAAGGCGCCGAGCCCCGCAAGAACTT
Descrição Sequência
CGTCAAGCCCAACGAGACTAAGACCTACTTCT GGAAGGTCCAACACCATATGGCCCCGACCAAG GATGAGTTTGACTGCAAGGCCTGGGCCTACTT CTCCGACGTGGACCTTGAGAAGGATGTCCATT CCGGCCTGATCGGGCCGCTGCTCGTGTGTCAC ACCAACACCCTGAACCCAGCGCATGGACGCCA GGTCACCGTCCAGGAGTTTGCTCTGTTCTTCAC CATTTTTGACGAAACTAAGTCCTGGTACTTCAC CGAGAATATGGAGCGAAACTGTAGAGCGCCCT GCAATATCCAGATGGAAGATCCGACTTTCAAG GAGAACTATAGATTCCACGCCATCAACGGGTA CATCATGGATACTCTGCCGGGGCTGGTCATGG CCCAGGATCAGAGGATTCGGTGGTACTTGCTG TCAATGGGATCGAACGAAAACATTCACTCCATT CACTTCTCCGGTCACGTGTTCACTGTGCGCAA GAAGGAGGAGTACAAGATGGCGCTGTACAATC TGTACCCCGGGGTGTTCGAAACTGTGGAGATG CTGCCGTCCAAGGCCGGCATCTGGAGAGTGG AGTGCCTGATCGGAGAGCACCTCCACGCGGG GATGTCCACCCTCTTCCTGGTGTACTCGAATAA GTGCCAGACCCCGCTGGGCATGGCCTCGGGC CACATCAGAGACTTCCAGATCACAGCAAGCGG ACAATACGGCCAATGGGCGCCGAAGCTGGCC CGCTTGCACTACTCCGGATCGATCAACGCATG GTCCACCAAGGAACCGTTCTCGTGGATTAAGG TGGACCTCCTGGCCCCTATGATTATCCACGGA ATTAAGACCCAGGGCGCCAGGCAGAAGTTCTC CTCCCTGTACATCTCGCAATTCATCATCATGTA CAGCCTGGACGGGAAGAAGTGGCAGACTTACA GGGGAAACTCCACCGGCACCCTGATGGTCTTT TTCGGCAACGTGGATTCCTCCGGCATTAAGCA CAACATCTTCAACCCACCGATCATAGCCAGATA TATTAGGCTCCACCCCACTCACTACTCAATCCG CTCAACTCTTCGGATGGAACTCATGGGGTGCG ACCTGAACTCCTGCTCCATGCCGTTGGGGATG GAATCAAAGGCTATTAGCGACGCCCAGATCAC
Descrição Sequência
CGCGAGCTCCTACTTCACTAACATGTTCGCCAC CTGGAGCCCCTCCAAGGCCAGGCTGCACTTGC AGGGACGGTCAAATGCCTGGCGGCCGCAAGT GAACAATCCGAAGGAATGGCTTCAAGTGGATTT CCAAAAGACCATGAAAGTGACCGGAGTCACCA CCCAGGGAGTGAAGTCCCTTCTGACCTCGATG TATGTGAAGGAGTTCCTGATTAGCAGCAGCCA GGACGGGCACCAGTGGACCCTGTTCTTCCAAA ACGGAAAGGTCAAGGTGTTCCAGGGGAACCAG GACTCGTTCACACCCGTGGTGAACTCCCTGGA CCCCCCACTGCTGACGCGGTACTTGAGGATTC ATCCTCAGTCCTGGGTCCATCAGATTGCATTGC
GAATGGAAGTCCTGGGCTGCGAGGCCCAGGA CCTGTACTGA -- 5562 WPRE (elemen- 5582 – to regulador pós- TCATAATCAACCTCTGGATTACAAAATTTGTGAA transcricional do AGATTGACTGGTATTCTTAACTATGTTGCTCCTT vírus mutado da TTACGCTATGTGGATACGCTGCTTTAATGCCTT hepatite de TGTATCATGCTATTGCTTCCCGTATGGCTTTCA marmota) (SEQ TTTTCTCCTCCTTGTATAAATCCTGGTTGCTGTC ID NO:120) TCTTTATGAGGAGTTGTGGCCCGTTGTCAGGC
AACGTGGCGTGGTGTGCACTGTGTTTGCTGAC GCAACCCCCACTGGTTGGGGCATTGCCACCAC CTGTCAGCTCCTTTCCGGGACTTTCGCTTTCCC CCTCCCTATTGCCACGGCGGAACTCATCGCCG CCTGCCTTGCCCGCTGCTGGACAGGGGCTCG GCTGTTGGGCACTGACAATTCCGTGGTGTTGT CGGGGAAATCATCGTCCTTTCCTTGGCTGCTC GCCTGTGTTGCCACCTGGATTCTGCGCGGGAC GTCCTTCTGCTACGTCCCTTCGGCCCTCAATCC AGCGGACCTTCCTTCCCGCGGCCTGCTGCCG GCTCTGCGGCCTCTTCCGCGTCTTCGCCTTCG
CCCTCAGACGAGTCGGATCTCCCTTTGGGCCG CCTCCCCGCTG -- 6176 bGHpA (sinal de 6185 – poliadenilação CGACTGTGCCTTCTAGTTGCCAGCCATCTGTTG
Descrição Sequência do hormônio de TTTGCCCCTCCCCCGTGCCTTCCTTGACCCTG crescimento bo- GAAGGTGCCACTCCCACTGTCCTTTCCTAATAA vino) (SEQ ID AATGAGGAAATTGCATCGCATTGTCTGAGTAGG NO:122) TGTCATTCTATTCTGGGGGGTGGGGTGGGGCA
GGACAGCAAGGGGGAGGATTGGGAAGACAAT AGCAGGCATGCTGGGGA -- 6395 Repetição termi- 6515 – nal invertida 3' AAAATTTAAAAGAAGACACCAAATCAGATGCCG ITR (SEQ ID CCGGTCGCCGCCGGTAGGCGGGACTTCCGGT NO: 181) ACAAGATGGCGGACAATTACGTCATTTCCTGTG
ACGTCATTTCCTGTGACGTCACTTCCGGTGGG CGGGACTTCCGGAATTAGGGTTGGCTCTGGGC CAGCGCTTGGGGTTGACGTGCCACTAAGATCA
AGCGGCGCGCCGCTTGTCTTAGTGTCAAGGCA ACCCCAAGCAAGCTGGCCCAGAG -- 6762 Sequência de comprimento total (SEQ ID NO: 179)
CTCTGGGCCAGCTTGCTTGGGGTTGCCTTGACACTAAGACAAGC GGCGCGCCGCTTGATCTTAGTGGCACGTCAACCCCAAGCGCTG GCCCAGAGCCAACCCTAATTCCGGAAGTCCCGCCCACCGGAAG TGACGTCACAGGAAATGACGTCACAGGAAATGACGTAATTGTCC GCCATCTTGTACCGGAAGTCCCGCCTACCGGCGGCGACCGGCG GCATCTGATTTGGTGTCTTCTTTTAAATTTTGCGGCAATTCAGTC GATAACTATAACGGTCCTAAGGTAGCGATTTAAATACGCGCTCTC TTAAGGTAGCCCCGGGACGCGTCAATTGAGATCTGGATCCGGTA CCGAATTCGCGGCCGCCTCGACGACTAGCGTTTAATTAAACGCG TGTCTGTCTGCACATTTCGTAGAGCGAGTGTTCCGATACTCTAAT CTCCCTAGGCAAGGTTCATATTTGTGTAGGTTACTTATTCTCCTTT TGTTGACTAAGTCAATAATCAGAATCAGCAGGTTTGGAGTCAGCT TGGCAGGGATCAGCAGCCTGGGTTGGAAGGAGGGGGTATAAAA GCCCCTTCACCAGGAGAAGCCGTCACACAGATCCACAAGCTCCT GAGGTAAGTGCCGTGTGTGGTTCCCGCGGGCCTGGCCTCTTTA CGGGTTATGGCCCTTGCGTGCCTTGAATTACTGACACTGACATC CACTTTTTCTTTTTCTCCACAGCTAGCGCCACCATGCAGATTGAG CTGTCCACTTGTTTCTTCCTGTGCCTCCTGCGCTTCTGTTTCTCC GCCACTCGCCGGTACTACCTTGGAGCCGTGGAGCTTTCATGGG ACTACATGCAGAGCGACCTGGGCGAACTCCCCGTGGATGCCAG
Descrição Sequência
ATTCCCCCCCCGCGTGCCAAAGTCCTTCCCCTTTAACACCTCCG TGGTGTACAAGAAAACCCTCTTTGTCGAGTTCACTGACCACCTGT TCAACATCGCCAAGCCGCGCCCACCTTGGATGGGCCTCCTGGG ACCGACCATTCAAGCTGAAGTGTACGACACCGTGGTGATCACCC TGAAGAACATGGCGTCCCACCCCGTGTCCCTGCATGCGGTCGG AGTGTCCTACTGGAAGGCCTCCGAAGGAGCTGAGTACGACGAC CAGACTAGCCAGCGGGAAAAGGAGGACGATAAAGTGTTCCCGG GCGGCTCGCATACTTACGTGTGGCAAGTCCTGAAGGAAAACGGA CCTATGGCATCCGATCCTCTGTGCCTGACTTACTCCTACCTTTCC CATGTGGACCTCGTGAAGGACCTGAACAGCGGGCTGATTGGTG CACTTCTCGTGTGCCGCGAAGGTTCGCTCGCTAAGGAAAAGACC CAGACCCTCCATAAGTTCATCCTTTTGTTCGCTGTGTTCGATGAA GGAAAGTCATGGCATTCCGAAACTAAGAACTCGCTGATGCAGGA CCGGGATGCCGCCTCAGCCCGCGCCTGGCCTAAAATGCATACA GTCAACGGATACGTGAATCGGTCACTGCCCGGGCTCATCGGTTG TCACAGAAAGTCCGTGTACTGGCACGTCATCGGCATGGGCACTA CGCCTGAAGTGCACTCCATCTTCCTGGAAGGGCACACCTTCCTC GTGCGCAACCACCGCCAGGCCTCTCTGGAAATCTCCCCGATTAC CTTTCTGACCGCCCAGACTCTGCTCATGGACCTGGGGCAGTTCC TTCTCTTCTGCCACATCTCCAGCCATCAGCACGACGGAATGGAG GCCTACGTGAAGGTGGACTCATGCCCGGAAGAACCTCAGTTGC GGATGAAGAACAACGAGGAGGCCGAGGACTATGACGACGATTT GACTGACTCCGAGATGGACGTCGTGCGGTTCGATGACGACAAC AGCCCCAGCTTCATCCAGATTCGCAGCGTGGCCAAGAAGCACC CCAAAACCTGGGTGCACTACATCGCGGCCGAGGAAGAAGATTG GGACTACGCCCCGTTGGTGCTGGCACCCGATGACCGGTCGTAC AAGTCCCAGTATCTGAACAATGGTCCGCAGCGGATTGGCAGAAA GTACAAGAAAGTGCGGTTCATGGCGTACACTGACGAAACGTTTA AGACCCGGGAGGCCATTCAACATGAGAGCGGCATTCTGGGACC ACTGCTGTACGGAGAGGTCGGCGATACCCTGCTCATCATCTTCA AAAACCAGGCCTCCCGGCCTTACAACATCTACCCTCACGGAATC ACCGACGTGCGGCCACTCTACTCGCGGCGCCTGCCGAAGGGCG TCAAGCACCTGAAAGACTTCCCTATCCTGCCGGGCGAAATCTTC AAGTATAAGTGGACCGTCACCGTGGAGGACGGGCCCACCAAGA GCGATCCTAGGTGTCTGACTCGGTACTACTCCAGCTTCGTGAAC ATGGAACGGGACCTGGCATCGGGACTCATTGGACCGCTGCTGA
Descrição Sequência
TCTGCTACAAAGAGTCGGTGGATCAACGCGGCAACCAGATCATG TCCGACAAGCGCAACGTGATCCTGTTCTCCGTGTTTGATGAAAA CAGATCCTGGTACCTCACTGAAAACATCCAGAGGTTCCTCCCAA ACCCCGCAGGAGTGCAACTGGAGGACCCTGAGTTTCAGGCCTC GAATATCATGCACTCGATTAACGGTTACGTGTTCGACTCGCTGCA ACTGAGCGTGTGCCTCCATGAAGTCGCTTACTGGTACATTCTGT CCATCGGCGCCCAGACTGACTTCCTGAGCGTGTTCTTTTCCGGT TACACCTTTAAGCACAAGATGGTGTACGAAGATACCCTGACCCT GTTCCCTTTCTCCGGCGAAACGGTGTTCATGTCGATGGAGAACC CGGGTCTGTGGATTCTGGGATGCCACAACAGCGACTTTCGGAAC CGCGGAATGACTGCCCTGCTGAAGGTGTCCTCATGCGACAAGAA CACCGGAGACTACTACGAGGACTCCTACGAGGATATCTCAGCCT ACCTCCTGTCCAAGAACAACGCGATCGAGCCGCGCAGCTTCAG CCAGAACGGCGCGCCAACATCAGAGAGCGCCACCCCTGAAAGT GGTCCCGGGAGCGAGCCAGCCACATCTGGGTCGGAAACGCCAG GCACAAGTGAGTCTGCAACTCCCGAGTCCGGACCTGGCTCCGA GCCTGCCACTAGCGGCTCCGAGACTCCGGGAACTTCCGAGAGC GCTACACCAGAAAGCGGACCCGGAACCAGTACCGAACCTAGCG AGGGCTCTGCTCCGGGCAGCCCAGCCGGCTCTCCTACATCCAC GGAGGAGGGCACTTCCGAATCCGCCACCCCGGAGTCAGGGCCA GGATCTGAACCCGCTACCTCAGGCAGTGAGACGCCAGGAACGA GCGAGTCCGCTACACCGGAGAGTGGGCCAGGGAGCCCTGCTG GATCTCCTACGTCCACTGAGGAAGGGTCACCAGCGGGCTCGCC CACCAGCACTGAAGAAGGTGCCTCGAGCCCGCCTGTGCTGAAG AGGCACCAGCGAGAAATTACCCGGACCACCCTCCAATCGGATCA GGAGGAAATCGACTACGACGACACCATCTCGGTGGAAATGAAGA AGGAAGATTTCGATATCTACGACGAGGACGAAAATCAGTCCCCT CGCTCATTCCAAAAGAAAACTAGACACTACTTTATCGCCGCGGT GGAAAGACTGTGGGACTATGGAATGTCATCCAGCCCTCACGTCC TTCGGAACCGGGCCCAGAGCGGATCGGTGCCTCAGTTCAAGAA AGTGGTGTTCCAGGAGTTCACCGACGGCAGCTTCACCCAGCCG CTGTACCGGGGAGAACTGAACGAACACCTGGGCCTGCTCGGTC CCTACATCCGCGCGGAAGTGGAGGATAACATCATGGTGACCTTC CGTAACCAAGCATCCAGACCTTACTCCTTCTATTCCTCCCTGATC TCATACGAGGAGGACCAGCGCCAAGGCGCCGAGCCCCGCAAGA ACTTCGTCAAGCCCAACGAGACTAAGACCTACTTCTGGAAGGTC
Descrição Sequência
CAACACCATATGGCCCCGACCAAGGATGAGTTTGACTGCAAGGC CTGGGCCTACTTCTCCGACGTGGACCTTGAGAAGGATGTCCATT CCGGCCTGATCGGGCCGCTGCTCGTGTGTCACACCAACACCCT GAACCCAGCGCATGGACGCCAGGTCACCGTCCAGGAGTTTGCT CTGTTCTTCACCATTTTTGACGAAACTAAGTCCTGGTACTTCACC GAGAATATGGAGCGAAACTGTAGAGCGCCCTGCAATATCCAGAT GGAAGATCCGACTTTCAAGGAGAACTATAGATTCCACGCCATCA ACGGGTACATCATGGATACTCTGCCGGGGCTGGTCATGGCCCA GGATCAGAGGATTCGGTGGTACTTGCTGTCAATGGGATCGAACG AAAACATTCACTCCATTCACTTCTCCGGTCACGTGTTCACTGTGC GCAAGAAGGAGGAGTACAAGATGGCGCTGTACAATCTGTACCCC GGGGTGTTCGAAACTGTGGAGATGCTGCCGTCCAAGGCCGGCA TCTGGAGAGTGGAGTGCCTGATCGGAGAGCACCTCCACGCGGG GATGTCCACCCTCTTCCTGGTGTACTCGAATAAGTGCCAGACCC CGCTGGGCATGGCCTCGGGCCACATCAGAGACTTCCAGATCAC AGCAAGCGGACAATACGGCCAATGGGCGCCGAAGCTGGCCCGC TTGCACTACTCCGGATCGATCAACGCATGGTCCACCAAGGAACC GTTCTCGTGGATTAAGGTGGACCTCCTGGCCCCTATGATTATCC ACGGAATTAAGACCCAGGGCGCCAGGCAGAAGTTCTCCTCCCT GTACATCTCGCAATTCATCATCATGTACAGCCTGGACGGGAAGA AGTGGCAGACTTACAGGGGAAACTCCACCGGCACCCTGATGGT CTTTTTCGGCAACGTGGATTCCTCCGGCATTAAGCACAACATCTT CAACCCACCGATCATAGCCAGATATATTAGGCTCCACCCCACTC ACTACTCAATCCGCTCAACTCTTCGGATGGAACTCATGGGGTGC GACCTGAACTCCTGCTCCATGCCGTTGGGGATGGAATCAAAGGC TATTAGCGACGCCCAGATCACCGCGAGCTCCTACTTCACTAACA TGTTCGCCACCTGGAGCCCCTCCAAGGCCAGGCTGCACTTGCA GGGACGGTCAAATGCCTGGCGGCCGCAAGTGAACAATCCGAAG GAATGGCTTCAAGTGGATTTCCAAAAGACCATGAAAGTGACCGG AGTCACCACCCAGGGAGTGAAGTCCCTTCTGACCTCGATGTATG TGAAGGAGTTCCTGATTAGCAGCAGCCAGGACGGGCACCAGTG GACCCTGTTCTTCCAAAACGGAAAGGTCAAGGTGTTCCAGGGGA ACCAGGACTCGTTCACACCCGTGGTGAACTCCCTGGACCCCCCA CTGCTGACGCGGTACTTGAGGATTCATCCTCAGTCCTGGGTCCA TCAGATTGCATTGCGAATGGAAGTCCTGGGCTGCGAGGCCCAG GACCTGTACTGAATCAGCCTGAGCTCGCTGATCATAATCAACCT
Descrição Sequência
CTGGATTACAAAATTTGTGAAAGATTGACTGGTATTCTTAACTATG TTGCTCCTTTTACGCTATGTGGATACGCTGCTTTAATGCCTTTGT ATCATGCTATTGCTTCCCGTATGGCTTTCATTTTCTCCTCCTTGTA TAAATCCTGGTTGCTGTCTCTTTATGAGGAGTTGTGGCCCGTTGT CAGGCAACGTGGCGTGGTGTGCACTGTGTTTGCTGACGCAACC CCCACTGGTTGGGGCATTGCCACCACCTGTCAGCTCCTTTCCGG GACTTTCGCTTTCCCCCTCCCTATTGCCACGGCGGAACTCATCG CCGCCTGCCTTGCCCGCTGCTGGACAGGGGCTCGGCTGTTGGG CACTGACAATTCCGTGGTGTTGTCGGGGAAATCATCGTCCTTTC CTTGGCTGCTCGCCTGTGTTGCCACCTGGATTCTGCGCGGGAC GTCCTTCTGCTACGTCCCTTCGGCCCTCAATCCAGCGGACCTTC CTTCCCGCGGCCTGCTGCCGGCTCTGCGGCCTCTTCCGCGTCT TCGCCTTCGCCCTCAGACGAGTCGGATCTCCCTTTGGGCCGCCT CCCCGCTGATCAGCCTCGACTGTGCCTTCTAGTTGCCAGCCATC TGTTGTTTGCCCCTCCCCCGTGCCTTCCTTGACCCTGGAAGGTG CCACTCCCACTGTCCTTTCCTAATAAAATGAGGAAATTGCATCGC ATTGTCTGAGTAGGTGTCATTCTATTCTGGGGGGTGGGGTGGGG CAGGACAGCAAGGGGGAGGATTGGGAAGACAATAGCAGGCATG CTGGGGATGCGGTGGGCTCTATGGCTTCTGAGGCGGAAAGAAC GGGCTCGAGAAGCTTCTAGATATCCTCTCTTAAGGTAGCATCGA GATTTAAATTAGGGATAACAGGGTAATGGCGCGGGCCGCAAAAT TTAAAAGAAGACACCAAATCAGATGCCGCCGGTCGCCGCCGGTA GGCGGGACTTCCGGTACAAGATGGCGGACAATTACGTCATTTCC TGTGACGTCATTTCCTGTGACGTCACTTCCGGTGGGCGGGACTT CCGGAATTAGGGTTGGCTCTGGGCCAGCGCTTGGGGTTGACGT GCCACTAAGATCAAGCGGCGCGCCGCTTGTCTTAGTGTCAAGGC
AACCCCAAGCAAGCTGGCCCAGAG Tabela 2C: Exemplo do construto GPV-FVIII transportando GPVd162 ITRs (nucleotídeos 1-6830; SEQ ID NO: 182) Descrição Sequência 5' ITR (SEQ 1– ID NO: 183) CGGTGACGTGTTTCCGGCTGTTAGGTTGACCACG
CGCATGCCGCGCGGTCAGCCCAATAGTTAAGCC GGAAACACGTCACCGGAAGTCACATGACCGGAA
Descrição Sequência
GTCACGTGACCGGAAACACGTGACAGGAAGCAC GTGACCGGAACTACGTCACCGGATGTGCGTCAC CGGAAGCATGTGACCGGAACTTGCGTCACTTCCC CCTCCCCTGATTGGCTGGTTCGAACGAACGAACC
CTCCAATGAGACTCAAGGACAAGAGGATATTTTG CGCGCCAGGAAGTG -- 282 TTPp (promo- 425 – tor fígado- ACGCGTGTCTGTCTGCACATTTCGTAGAGCGAGT específico) GTTCCGATACTCTAATCTCCCTAGGCAAGGTTCA (SEQ ID TATTTGTGTAGGTTACTTATTCTCCTTTTGTTGACT NO:113) AAGTCAATAATCAGAATCAGCAGGTTTGGAGTCA
GCTTGGCAGGGATCAGCAGCCTGGGTTGGAAGG
AGGGGGTATAAAAGCCCCTTCACCAGGAGAAGC CGTCACACAGATCCACAAGCTCCTG -- 653 Íntron sintético 656 – (SEQ ID GTAAGTGCCGTGTGTGGTTCCCGCGGGCCTGGC NO:115) CTCTTTACGGGTTATGGCCCTTGCGTGCCTTGAA
TTACTGACACTGACATCCACTTTTTCTTTTTCTCC ACAG -- 761 FVIIIco6XTEN 773 – (SEQ ID ATGCAGATTGAGCTGTCCACTTGTTTCTTCCTGTG NO:117) (fase CCTCCTGCGCTTCTGTTTCTCCGCCACTCGCCGG de leitura TACTACCTTGGAGCCGTGGAGCTTTCATGGGACT aberta para ACATGCAGAGCGACCTGGGCGAACTCCCCGTGG FVIII códon- ATGCCAGATTCCCCCCCCGCGTGCCAAAGTCCTT otimizado ver- CCCCTTTAACACCTCCGTGGTGTACAAGAAAACC são 6 conten- CTCTTTGTCGAGTTCACTGACCACCTGTTCAACAT do XTEN144; CGCCAAGCCGCGCCCACCTTGGATGGGCCTCCT a sequência GGGACCGACCATTCAAGCTGAAGTGTACGACAC de XTEN está CGTGGTGATCACCCTGAAGAACATGGCGTCCCA assinalada CCCCGTGTCCCTGCATGCGGTCGGAGTGTCCTA com sublinha- CTGGAAGGCCTCCGAAGGAGCTGAGTACGACGA do duplo CCAGACTAGCCAGCGGGAAAAGGAGGACGATAA (SEQ ID AGTGTTCCCGGGCGGCTCGCATACTTACGTGTG NO:118)) GCAAGTCCTGAAGGAAAACGGACCTATGGCATCC
GATCCTCTGTGCCTGACTTACTCCTACCTTTCCCA
Descrição Sequência
TGTGGACCTCGTGAAGGACCTGAACAGCGGGCT GATTGGTGCACTTCTCGTGTGCCGCGAAGGTTCG CTCGCTAAGGAAAAGACCCAGACCCTCCATAAGT TCATCCTTTTGTTCGCTGTGTTCGATGAAGGAAA GTCATGGCATTCCGAAACTAAGAACTCGCTGATG CAGGACCGGGATGCCGCCTCAGCCCGCGCCTG GCCTAAAATGCATACAGTCAACGGATACGTGAAT CGGTCACTGCCCGGGCTCATCGGTTGTCACAGA AAGTCCGTGTACTGGCACGTCATCGGCATGGGC ACTACGCCTGAAGTGCACTCCATCTTCCTGGAAG GGCACACCTTCCTCGTGCGCAACCACCGCCAGG CCTCTCTGGAAATCTCCCCGATTACCTTTCTGAC CGCCCAGACTCTGCTCATGGACCTGGGGCAGTT CCTTCTCTTCTGCCACATCTCCAGCCATCAGCAC GACGGAATGGAGGCCTACGTGAAGGTGGACTCA TGCCCGGAAGAACCTCAGTTGCGGATGAAGAAC AACGAGGAGGCCGAGGACTATGACGACGATTTG ACTGACTCCGAGATGGACGTCGTGCGGTTCGAT GACGACAACAGCCCCAGCTTCATCCAGATTCGCA GCGTGGCCAAGAAGCACCCCAAAACCTGGGTGC ACTACATCGCGGCCGAGGAAGAAGATTGGGACT ACGCCCCGTTGGTGCTGGCACCCGATGACCGGT CGTACAAGTCCCAGTATCTGAACAATGGTCCGCA GCGGATTGGCAGAAAGTACAAGAAAGTGCGGTT CATGGCGTACACTGACGAAACGTTTAAGACCCGG GAGGCCATTCAACATGAGAGCGGCATTCTGGGA CCACTGCTGTACGGAGAGGTCGGCGATACCCTG CTCATCATCTTCAAAAACCAGGCCTCCCGGCCTT ACAACATCTACCCTCACGGAATCACCGACGTGCG GCCACTCTACTCGCGGCGCCTGCCGAAGGGCGT CAAGCACCTGAAAGACTTCCCTATCCTGCCGGGC GAAATCTTCAAGTATAAGTGGACCGTCACCGTGG AGGACGGGCCCACCAAGAGCGATCCTAGGTGTC TGACTCGGTACTACTCCAGCTTCGTGAACATGGA ACGGGACCTGGCATCGGGACTCATTGGACCGCT GCTGATCTGCTACAAAGAGTCGGTGGATCAACGC
Descrição Sequência
GGCAACCAGATCATGTCCGACAAGCGCAACGTG ATCCTGTTCTCCGTGTTTGATGAAAACAGATCCTG GTACCTCACTGAAAACATCCAGAGGTTCCTCCCA AACCCCGCAGGAGTGCAACTGGAGGACCCTGAG TTTCAGGCCTCGAATATCATGCACTCGATTAACG GTTACGTGTTCGACTCGCTGCAACTGAGCGTGTG CCTCCATGAAGTCGCTTACTGGTACATTCTGTCC ATCGGCGCCCAGACTGACTTCCTGAGCGTGTTCT TTTCCGGTTACACCTTTAAGCACAAGATGGTGTA CGAAGATACCCTGACCCTGTTCCCTTTCTCCGGC GAAACGGTGTTCATGTCGATGGAGAACCCGGGT CTGTGGATTCTGGGATGCCACAACAGCGACTTTC GGAACCGCGGAATGACTGCCCTGCTGAAGGTGT CCTCATGCGACAAGAACACCGGAGACTACTACGA GGACTCCTACGAGGATATCTCAGCCTACCTCCTG TCCAAGAACAACGCGATCGAGCCGCGCAGCTTC AGCCAGAACGGCGCGCCAACATCAGAGAGCGCC ACCCCTGAAAGTGGTCCCGGGAGCGAGCCAGCC ACATCTGGGTCGGAAACGCCAGGCACAAGTGAG TCTGCAACTCCCGAGTCCGGACCTGGCTCCGAG CCTGCCACTAGCGGCTCCGAGACTCCGGGAACT TCCGAGAGCGCTACACCAGAAAGCGGACCCGGA ACCAGTACCGAACCTAGCGAGGGCTCTGCTCCG GGCAGCCCAGCCGGCTCTCCTACATCCACGGAG GAGGGCACTTCCGAATCCGCCACCCCGGAGTCA GGGCCAGGATCTGAACCCGCTACCTCAGGCAGT GAGACGCCAGGAACGAGCGAGTCCGCTACACCG GAGAGTGGGCCAGGGAGCCCTGCTGGATCTCCT ACGTCCACTGAGGAAGGGTCACCAGCGGGCTCG CCCACCAGCACTGAAGAAGGTGCCTCGAGCCCG CCTGTGCTGAAGAGGCACCAGCGAGAAATTACC CGGACCACCCTCCAATCGGATCAGGAGGAAATC GACTACGACGACACCATCTCGGTGGAAATGAAGA AGGAAGATTTCGATATCTACGACGAGGACGAAAA TCAGTCCCCTCGCTCATTCCAAAAGAAAACTAGA CACTACTTTATCGCCGCGGTGGAAAGACTGTGGG
Descrição Sequência
ACTATGGAATGTCATCCAGCCCTCACGTCCTTCG GAACCGGGCCCAGAGCGGATCGGTGCCTCAGTT CAAGAAAGTGGTGTTCCAGGAGTTCACCGACGG CAGCTTCACCCAGCCGCTGTACCGGGGAGAACT GAACGAACACCTGGGCCTGCTCGGTCCCTACAT CCGCGCGGAAGTGGAGGATAACATCATGGTGAC CTTCCGTAACCAAGCATCCAGACCTTACTCCTTCT ATTCCTCCCTGATCTCATACGAGGAGGACCAGCG CCAAGGCGCCGAGCCCCGCAAGAACTTCGTCAA GCCCAACGAGACTAAGACCTACTTCTGGAAGGTC CAACACCATATGGCCCCGACCAAGGATGAGTTTG ACTGCAAGGCCTGGGCCTACTTCTCCGACGTGG ACCTTGAGAAGGATGTCCATTCCGGCCTGATCGG GCCGCTGCTCGTGTGTCACACCAACACCCTGAAC CCAGCGCATGGACGCCAGGTCACCGTCCAGGAG TTTGCTCTGTTCTTCACCATTTTTGACGAAACTAA GTCCTGGTACTTCACCGAGAATATGGAGCGAAAC TGTAGAGCGCCCTGCAATATCCAGATGGAAGATC CGACTTTCAAGGAGAACTATAGATTCCACGCCAT CAACGGGTACATCATGGATACTCTGCCGGGGCT GGTCATGGCCCAGGATCAGAGGATTCGGTGGTA CTTGCTGTCAATGGGATCGAACGAAAACATTCAC TCCATTCACTTCTCCGGTCACGTGTTCACTGTGC GCAAGAAGGAGGAGTACAAGATGGCGCTGTACA ATCTGTACCCCGGGGTGTTCGAAACTGTGGAGAT GCTGCCGTCCAAGGCCGGCATCTGGAGAGTGGA GTGCCTGATCGGAGAGCACCTCCACGCGGGGAT GTCCACCCTCTTCCTGGTGTACTCGAATAAGTGC CAGACCCCGCTGGGCATGGCCTCGGGCCACATC AGAGACTTCCAGATCACAGCAAGCGGACAATACG GCCAATGGGCGCCGAAGCTGGCCCGCTTGCACT ACTCCGGATCGATCAACGCATGGTCCACCAAGGA ACCGTTCTCGTGGATTAAGGTGGACCTCCTGGCC CCTATGATTATCCACGGAATTAAGACCCAGGGCG CCAGGCAGAAGTTCTCCTCCCTGTACATCTCGCA ATTCATCATCATGTACAGCCTGGACGGGAAGAAG
Descrição Sequência
TGGCAGACTTACAGGGGAAACTCCACCGGCACC CTGATGGTCTTTTTCGGCAACGTGGATTCCTCCG GCATTAAGCACAACATCTTCAACCCACCGATCAT AGCCAGATATATTAGGCTCCACCCCACTCACTAC TCAATCCGCTCAACTCTTCGGATGGAACTCATGG GGTGCGACCTGAACTCCTGCTCCATGCCGTTGG GGATGGAATCAAAGGCTATTAGCGACGCCCAGAT CACCGCGAGCTCCTACTTCACTAACATGTTCGCC ACCTGGAGCCCCTCCAAGGCCAGGCTGCACTTG CAGGGACGGTCAAATGCCTGGCGGCCGCAAGTG AACAATCCGAAGGAATGGCTTCAAGTGGATTTCC AAAAGACCATGAAAGTGACCGGAGTCACCACCCA GGGAGTGAAGTCCCTTCTGACCTCGATGTATGTG AAGGAGTTCCTGATTAGCAGCAGCCAGGACGGG CACCAGTGGACCCTGTTCTTCCAAAACGGAAAGG TCAAGGTGTTCCAGGGGAACCAGGACTCGTTCAC ACCCGTGGTGAACTCCCTGGACCCCCCACTGCT GACGCGGTACTTGAGGATTCATCCTCAGTCCTGG
GTCCATCAGATTGCATTGCGAATGGAAGTCCTGG GCTGCGAGGCCCAGGACCTGTACTGA --5596 WPRE (ele- 5616 – mento regula- TCATAATCAACCTCTGGATTACAAAATTTGTGAAA dor pós- GATTGACTGGTATTCTTAACTATGTTGCTCCTTTT transcricional ACGCTATGTGGATACGCTGCTTTAATGCCTTTGTA do vírus mu- TCATGCTATTGCTTCCCGTATGGCTTTCATTTTCT tado da hepa- CCTCCTTGTATAAATCCTGGTTGCTGTCTCTTTAT tite de marmo- GAGGAGTTGTGGCCCGTTGTCAGGCAACGTGGC ta) (SEQ ID GTGGTGTGCACTGTGTTTGCTGACGCAACCCCCA NO:120) CTGGTTGGGGCATTGCCACCACCTGTCAGCTCCT
TTCCGGGACTTTCGCTTTCCCCCTCCCTATTGCC ACGGCGGAACTCATCGCCGCCTGCCTTGCCCGC TGCTGGACAGGGGCTCGGCTGTTGGGCACTGAC AATTCCGTGGTGTTGTCGGGGAAATCATCGTCCT TTCCTTGGCTGCTCGCCTGTGTTGCCACCTGGAT TCTGCGCGGGACGTCCTTCTGCTACGTCCCTTCG GCCCTCAATCCAGCGGACCTTCCTTCCCGCGGC
Descrição Sequência
CTGCTGCCGGCTCTGCGGCCTCTTCCGCGTCTT
CGCCTTCGCCCTCAGACGAGTCGGATCTCCCTTT GGGCCGCCTCCCCGCTG -- 6210 bGHpA (sinal 6219 – de poliadeni- CGACTGTGCCTTCTAGTTGCCAGCCATCTGTTGT lação do hor- TTGCCCCTCCCCCGTGCCTTCCTTGACCCTGGAA mônio de GGTGCCACTCCCACTGTCCTTTCCTAATAAAATG crescimento AGGAAATTGCATCGCATTGTCTGAGTAGGTGTCA bovino) (SEQ TTCTATTCTGGGGGGTGGGGTGGGGCAGGACAG ID NO:122) CAAGGGGGAGGATTGGGAAGACAATAGCAGGCA TGCTGGGGA -- 6429 Repetição 6549 -- terminal inver- CACTTCCTGGCGCGCAAAATATCCTCTTGTCCTT tida 3' ITR GAGTCTCATTGGAGGGTTCGTTCGTTCGAACCAG (SEQ ID NO: CCAATCAGGGGAGGGGGAAGTGACGCAAGTTCC 184) GGTCACATGCTTCCGGTGACGCACATCCGGTGA
CGTAGTTCCGGTCACGTGCTTCCTGTCACGTGTT TCCGGTCACGTGACTTCCGGTCATGTGACTTCCG GTGACGTGTTTCCGGCTTAACTATTGGGCTGACC
GCGCGGCATGCGCGTGGTCAACCTAACAGCCGG AAACACGTCACCG -- 6830 Sequência de comprimento total (SEQ ID NO: 182)
CGGTGACGTGTTTCCGGCTGTTAGGTTGACCACGCGCATGCCG CGCGGTCAGCCCAATAGTTAAGCCGGAAACACGTCACCGGAAG TCACATGACCGGAAGTCACGTGACCGGAAACACGTGACAGGAA GCACGTGACCGGAACTACGTCACCGGATGTGCGTCACCGGAAG CATGTGACCGGAACTTGCGTCACTTCCCCCTCCCCTGATTGGCT GGTTCGAACGAACGAACCCTCCAATGAGACTCAAGGACAAGAGG ATATTTTGCGCGCCAGGAAGTGGCGGCAATTCAGTCGATAACTA TAACGGTCCTAAGGTAGCGATTTAAATACGCGCTCTCTTAAGGTA GCCCCGGGACGCGTCAATTGAGATCTGGATCCGGTACCGAATTC GCGGCCGCCTCGACGACTAGCGTTTAATTAAACGCGTGTCTGTC TGCACATTTCGTAGAGCGAGTGTTCCGATACTCTAATCTCCCTAG GCAAGGTTCATATTTGTGTAGGTTACTTATTCTCCTTTTGTTGACT AAGTCAATAATCAGAATCAGCAGGTTTGGAGTCAGCTTGGCAGG GATCAGCAGCCTGGGTTGGAAGGAGGGGGTATAAAAGCCCCTT
Descrição Sequência
CACCAGGAGAAGCCGTCACACAGATCCACAAGCTCCTGAGGTAA GTGCCGTGTGTGGTTCCCGCGGGCCTGGCCTCTTTACGGGTTAT GGCCCTTGCGTGCCTTGAATTACTGACACTGACATCCACTTTTTC TTTTTCTCCACAGCTAGCGCCACCATGCAGATTGAGCTGTCCACT TGTTTCTTCCTGTGCCTCCTGCGCTTCTGTTTCTCCGCCACTCGC CGGTACTACCTTGGAGCCGTGGAGCTTTCATGGGACTACATGCA GAGCGACCTGGGCGAACTCCCCGTGGATGCCAGATTCCCCCCC CGCGTGCCAAAGTCCTTCCCCTTTAACACCTCCGTGGTGTACAA GAAAACCCTCTTTGTCGAGTTCACTGACCACCTGTTCAACATCGC CAAGCCGCGCCCACCTTGGATGGGCCTCCTGGGACCGACCATT CAAGCTGAAGTGTACGACACCGTGGTGATCACCCTGAAGAACAT GGCGTCCCACCCCGTGTCCCTGCATGCGGTCGGAGTGTCCTAC TGGAAGGCCTCCGAAGGAGCTGAGTACGACGACCAGACTAGCC AGCGGGAAAAGGAGGACGATAAAGTGTTCCCGGGCGGCTCGCA TACTTACGTGTGGCAAGTCCTGAAGGAAAACGGACCTATGGCAT CCGATCCTCTGTGCCTGACTTACTCCTACCTTTCCCATGTGGACC TCGTGAAGGACCTGAACAGCGGGCTGATTGGTGCACTTCTCGTG TGCCGCGAAGGTTCGCTCGCTAAGGAAAAGACCCAGACCCTCC ATAAGTTCATCCTTTTGTTCGCTGTGTTCGATGAAGGAAAGTCAT GGCATTCCGAAACTAAGAACTCGCTGATGCAGGACCGGGATGC CGCCTCAGCCCGCGCCTGGCCTAAAATGCATACAGTCAACGGAT ACGTGAATCGGTCACTGCCCGGGCTCATCGGTTGTCACAGAAAG TCCGTGTACTGGCACGTCATCGGCATGGGCACTACGCCTGAAGT GCACTCCATCTTCCTGGAAGGGCACACCTTCCTCGTGCGCAACC ACCGCCAGGCCTCTCTGGAAATCTCCCCGATTACCTTTCTGACC GCCCAGACTCTGCTCATGGACCTGGGGCAGTTCCTTCTCTTCTG CCACATCTCCAGCCATCAGCACGACGGAATGGAGGCCTACGTG AAGGTGGACTCATGCCCGGAAGAACCTCAGTTGCGGATGAAGAA CAACGAGGAGGCCGAGGACTATGACGACGATTTGACTGACTCC GAGATGGACGTCGTGCGGTTCGATGACGACAACAGCCCCAGCT TCATCCAGATTCGCAGCGTGGCCAAGAAGCACCCCAAAACCTGG GTGCACTACATCGCGGCCGAGGAAGAAGATTGGGACTACGCCC CGTTGGTGCTGGCACCCGATGACCGGTCGTACAAGTCCCAGTAT CTGAACAATGGTCCGCAGCGGATTGGCAGAAAGTACAAGAAAGT GCGGTTCATGGCGTACACTGACGAAACGTTTAAGACCCGGGAG GCCATTCAACATGAGAGCGGCATTCTGGGACCACTGCTGTACGG
Descrição Sequência
AGAGGTCGGCGATACCCTGCTCATCATCTTCAAAAACCAGGCCT CCCGGCCTTACAACATCTACCCTCACGGAATCACCGACGTGCGG CCACTCTACTCGCGGCGCCTGCCGAAGGGCGTCAAGCACCTGA AAGACTTCCCTATCCTGCCGGGCGAAATCTTCAAGTATAAGTGG ACCGTCACCGTGGAGGACGGGCCCACCAAGAGCGATCCTAGGT GTCTGACTCGGTACTACTCCAGCTTCGTGAACATGGAACGGGAC CTGGCATCGGGACTCATTGGACCGCTGCTGATCTGCTACAAAGA GTCGGTGGATCAACGCGGCAACCAGATCATGTCCGACAAGCGC AACGTGATCCTGTTCTCCGTGTTTGATGAAAACAGATCCTGGTAC CTCACTGAAAACATCCAGAGGTTCCTCCCAAACCCCGCAGGAGT GCAACTGGAGGACCCTGAGTTTCAGGCCTCGAATATCATGCACT CGATTAACGGTTACGTGTTCGACTCGCTGCAACTGAGCGTGTGC CTCCATGAAGTCGCTTACTGGTACATTCTGTCCATCGGCGCCCA GACTGACTTCCTGAGCGTGTTCTTTTCCGGTTACACCTTTAAGCA CAAGATGGTGTACGAAGATACCCTGACCCTGTTCCCTTTCTCCG GCGAAACGGTGTTCATGTCGATGGAGAACCCGGGTCTGTGGATT CTGGGATGCCACAACAGCGACTTTCGGAACCGCGGAATGACTG CCCTGCTGAAGGTGTCCTCATGCGACAAGAACACCGGAGACTAC TACGAGGACTCCTACGAGGATATCTCAGCCTACCTCCTGTCCAA GAACAACGCGATCGAGCCGCGCAGCTTCAGCCAGAACGGCGCG CCAACATCAGAGAGCGCCACCCCTGAAAGTGGTCCCGGGAGCG AGCCAGCCACATCTGGGTCGGAAACGCCAGGCACAAGTGAGTC TGCAACTCCCGAGTCCGGACCTGGCTCCGAGCCTGCCACTAGC GGCTCCGAGACTCCGGGAACTTCCGAGAGCGCTACACCAGAAA GCGGACCCGGAACCAGTACCGAACCTAGCGAGGGCTCTGCTCC GGGCAGCCCAGCCGGCTCTCCTACATCCACGGAGGAGGGCACT TCCGAATCCGCCACCCCGGAGTCAGGGCCAGGATCTGAACCCG CTACCTCAGGCAGTGAGACGCCAGGAACGAGCGAGTCCGCTAC ACCGGAGAGTGGGCCAGGGAGCCCTGCTGGATCTCCTACGTCC ACTGAGGAAGGGTCACCAGCGGGCTCGCCCACCAGCACTGAAG AAGGTGCCTCGAGCCCGCCTGTGCTGAAGAGGCACCAGCGAGA AATTACCCGGACCACCCTCCAATCGGATCAGGAGGAAATCGACT ACGACGACACCATCTCGGTGGAAATGAAGAAGGAAGATTTCGAT ATCTACGACGAGGACGAAAATCAGTCCCCTCGCTCATTCCAAAA GAAAACTAGACACTACTTTATCGCCGCGGTGGAAAGACTGTGGG ACTATGGAATGTCATCCAGCCCTCACGTCCTTCGGAACCGGGCC
Descrição Sequência
CAGAGCGGATCGGTGCCTCAGTTCAAGAAAGTGGTGTTCCAGGA GTTCACCGACGGCAGCTTCACCCAGCCGCTGTACCGGGGAGAA CTGAACGAACACCTGGGCCTGCTCGGTCCCTACATCCGCGCGG AAGTGGAGGATAACATCATGGTGACCTTCCGTAACCAAGCATCC AGACCTTACTCCTTCTATTCCTCCCTGATCTCATACGAGGAGGAC CAGCGCCAAGGCGCCGAGCCCCGCAAGAACTTCGTCAAGCCCA ACGAGACTAAGACCTACTTCTGGAAGGTCCAACACCATATGGCC CCGACCAAGGATGAGTTTGACTGCAAGGCCTGGGCCTACTTCTC CGACGTGGACCTTGAGAAGGATGTCCATTCCGGCCTGATCGGG CCGCTGCTCGTGTGTCACACCAACACCCTGAACCCAGCGCATG GACGCCAGGTCACCGTCCAGGAGTTTGCTCTGTTCTTCACCATT TTTGACGAAACTAAGTCCTGGTACTTCACCGAGAATATGGAGCG AAACTGTAGAGCGCCCTGCAATATCCAGATGGAAGATCCGACTT TCAAGGAGAACTATAGATTCCACGCCATCAACGGGTACATCATG GATACTCTGCCGGGGCTGGTCATGGCCCAGGATCAGAGGATTC GGTGGTACTTGCTGTCAATGGGATCGAACGAAAACATTCACTCC ATTCACTTCTCCGGTCACGTGTTCACTGTGCGCAAGAAGGAGGA GTACAAGATGGCGCTGTACAATCTGTACCCCGGGGTGTTCGAAA CTGTGGAGATGCTGCCGTCCAAGGCCGGCATCTGGAGAGTGGA GTGCCTGATCGGAGAGCACCTCCACGCGGGGATGTCCACCCTC TTCCTGGTGTACTCGAATAAGTGCCAGACCCCGCTGGGCATGGC CTCGGGCCACATCAGAGACTTCCAGATCACAGCAAGCGGACAAT ACGGCCAATGGGCGCCGAAGCTGGCCCGCTTGCACTACTCCGG ATCGATCAACGCATGGTCCACCAAGGAACCGTTCTCGTGGATTA AGGTGGACCTCCTGGCCCCTATGATTATCCACGGAATTAAGACC CAGGGCGCCAGGCAGAAGTTCTCCTCCCTGTACATCTCGCAATT CATCATCATGTACAGCCTGGACGGGAAGAAGTGGCAGACTTACA GGGGAAACTCCACCGGCACCCTGATGGTCTTTTTCGGCAACGTG GATTCCTCCGGCATTAAGCACAACATCTTCAACCCACCGATCATA GCCAGATATATTAGGCTCCACCCCACTCACTACTCAATCCGCTCA ACTCTTCGGATGGAACTCATGGGGTGCGACCTGAACTCCTGCTC CATGCCGTTGGGGATGGAATCAAAGGCTATTAGCGACGCCCAGA TCACCGCGAGCTCCTACTTCACTAACATGTTCGCCACCTGGAGC CCCTCCAAGGCCAGGCTGCACTTGCAGGGACGGTCAAATGCCT GGCGGCCGCAAGTGAACAATCCGAAGGAATGGCTTCAAGTGGA TTTCCAAAAGACCATGAAAGTGACCGGAGTCACCACCCAGGGAG
Descrição Sequência
TGAAGTCCCTTCTGACCTCGATGTATGTGAAGGAGTTCCTGATTA GCAGCAGCCAGGACGGGCACCAGTGGACCCTGTTCTTCCAAAA CGGAAAGGTCAAGGTGTTCCAGGGGAACCAGGACTCGTTCACA CCCGTGGTGAACTCCCTGGACCCCCCACTGCTGACGCGGTACT TGAGGATTCATCCTCAGTCCTGGGTCCATCAGATTGCATTGCGA ATGGAAGTCCTGGGCTGCGAGGCCCAGGACCTGTACTGAATCA GCCTGAGCTCGCTGATCATAATCAACCTCTGGATTACAAAATTTG TGAAAGATTGACTGGTATTCTTAACTATGTTGCTCCTTTTACGCTA TGTGGATACGCTGCTTTAATGCCTTTGTATCATGCTATTGCTTCC CGTATGGCTTTCATTTTCTCCTCCTTGTATAAATCCTGGTTGCTGT CTCTTTATGAGGAGTTGTGGCCCGTTGTCAGGCAACGTGGCGTG GTGTGCACTGTGTTTGCTGACGCAACCCCCACTGGTTGGGGCAT TGCCACCACCTGTCAGCTCCTTTCCGGGACTTTCGCTTTCCCCC TCCCTATTGCCACGGCGGAACTCATCGCCGCCTGCCTTGCCCG CTGCTGGACAGGGGCTCGGCTGTTGGGCACTGACAATTCCGTG GTGTTGTCGGGGAAATCATCGTCCTTTCCTTGGCTGCTCGCCTG TGTTGCCACCTGGATTCTGCGCGGGACGTCCTTCTGCTACGTCC CTTCGGCCCTCAATCCAGCGGACCTTCCTTCCCGCGGCCTGCTG CCGGCTCTGCGGCCTCTTCCGCGTCTTCGCCTTCGCCCTCAGAC GAGTCGGATCTCCCTTTGGGCCGCCTCCCCGCTGATCAGCCTC GACTGTGCCTTCTAGTTGCCAGCCATCTGTTGTTTGCCCCTCCC CCGTGCCTTCCTTGACCCTGGAAGGTGCCACTCCCACTGTCCTT TCCTAATAAAATGAGGAAATTGCATCGCATTGTCTGAGTAGGTGT CATTCTATTCTGGGGGGTGGGGTGGGGCAGGACAGCAAGGGGG AGGATTGGGAAGACAATAGCAGGCATGCTGGGGATGCGGTGGG CTCTATGGCTTCTGAGGCGGAAAGAACGGGCTCGAGAAGCTTCT AGATATCCTCTCTTAAGGTAGCATCGAGATTTAAATTAGGGATAA CAGGGTAATGGCGCGGGCCGCCACTTCCTGGCGCGCAAAATAT CCTCTTGTCCTTGAGTCTCATTGGAGGGTTCGTTCGTTCGAACCA GCCAATCAGGGGAGGGGGAAGTGACGCAAGTTCCGGTCACATG CTTCCGGTGACGCACATCCGGTGACGTAGTTCCGGTCACGTGCT TCCTGTCACGTGTTTCCGGTCACGTGACTTCCGGTCATGTGACT TCCGGTGACGTGTTTCCGGCTTAACTATTGGGCTGACCGCGCGG CATGCGCGTGGTCAACCTAACAGCCGGAAACACGTCACCG
Tabela 2D: Exemplo do construto B19-FVIII transportando B19 ITRs de comprimento total (nucleotídeos 1-7032; SEQ ID NO: 189) Descrição Sequência 5' ITR (SEQ CCAAATCAGATGCCGCCGGTCGCCGCCGGTAGG ID NO: 185) CGGGACTTCCGGTACAAGATGGCGGACAATTAC
GTCATTTCCTGTGACGTCATTTCCTGTGACGTCA CTTCCGGTGGGCGGGACTTCCGGAATTAGGGTT GGCTCTGGGCCAGCTTGCTTGGGGTTGCCTTGA CACTAAGACAAGCGGCGCGCCGCTTGATCTTAGT GGCACGTCAACCCCAAGCGCTGGCCCAGAGCCA ACCCTAATTCCGGAAGTCCCGCCCACCGGAAGT GACGTCACAGGAAATGACGTCACAGGAAATGAC GTAATTGTCCGCCATCTTGTACCGGAAGTCCCGC CTACCGGCGGCGACCGGCGGCATCTGATTTGGT
GTCTTCTTTTAAATTTT TTPp (promo- ACGCGTGTCTGTCTGCACATTTCGTAGAGCGAGT tor fígado- GTTCCGATACTCTAATCTCCCTAGGCAAGGTTCA específico) TATTTGTGTAGGTTACTTATTCTCCTTTTGTTGACT (SEQ ID AAGTCAATAATCAGAATCAGCAGGTTTGGAGTCA NO:113) GCTTGGCAGGGATCAGCAGCCTGGGTTGGAAGG
AGGGGGTATAAAAGCCCCTTCACCAGGAGAAGC
CGTCACACAGATCCACAAGCTCCTG Íntron sintético GTAAGTGCCGTGTGTGGTTCCCGCGGGCCTGGC (SEQ ID CTCTTTACGGGTTATGGCCCTTGCGTGCCTTGAA NO:115) TTACTGACACTGACATCCACTTTTTCTTTTTCTCC
ACAG FVIIIco6XTEN ATGCAGATTGAGCTGTCCACTTGTTTCTTCCTGTG (SEQ ID CCTCCTGCGCTTCTGTTTCTCCGCCACTCGCCGG NO:117) (fase TACTACCTTGGAGCCGTGGAGCTTTCATGGGACT de leitura ACATGCAGAGCGACCTGGGCGAACTCCCCGTGG aberta para ATGCCAGATTCCCCCCCCGCGTGCCAAAGTCCTT FVIII códon- CCCCTTTAACACCTCCGTGGTGTACAAGAAAACC otimizado ver- CTCTTTGTCGAGTTCACTGACCACCTGTTCAACAT são 6 conten- CGCCAAGCCGCGCCCACCTTGGATGGGCCTCCT do XTEN144; GGGACCGACCATTCAAGCTGAAGTGTACGACAC a sequência CGTGGTGATCACCCTGAAGAACATGGCGTCCCA
Descrição Sequência de XTEN está CCCCGTGTCCCTGCATGCGGTCGGAGTGTCCTA assinalada CTGGAAGGCCTCCGAAGGAGCTGAGTACGACGA com sublinha- CCAGACTAGCCAGCGGGAAAAGGAGGACGATAA do duplo AGTGTTCCCGGGCGGCTCGCATACTTACGTGTG (SEQ ID GCAAGTCCTGAAGGAAAACGGACCTATGGCATCC NO:118)) GATCCTCTGTGCCTGACTTACTCCTACCTTTCCCA
TGTGGACCTCGTGAAGGACCTGAACAGCGGGCT GATTGGTGCACTTCTCGTGTGCCGCGAAGGTTCG CTCGCTAAGGAAAAGACCCAGACCCTCCATAAGT TCATCCTTTTGTTCGCTGTGTTCGATGAAGGAAA GTCATGGCATTCCGAAACTAAGAACTCGCTGATG CAGGACCGGGATGCCGCCTCAGCCCGCGCCTG GCCTAAAATGCATACAGTCAACGGATACGTGAAT CGGTCACTGCCCGGGCTCATCGGTTGTCACAGA AAGTCCGTGTACTGGCACGTCATCGGCATGGGC ACTACGCCTGAAGTGCACTCCATCTTCCTGGAAG GGCACACCTTCCTCGTGCGCAACCACCGCCAGG CCTCTCTGGAAATCTCCCCGATTACCTTTCTGAC CGCCCAGACTCTGCTCATGGACCTGGGGCAGTT CCTTCTCTTCTGCCACATCTCCAGCCATCAGCAC GACGGAATGGAGGCCTACGTGAAGGTGGACTCA TGCCCGGAAGAACCTCAGTTGCGGATGAAGAAC AACGAGGAGGCCGAGGACTATGACGACGATTTG ACTGACTCCGAGATGGACGTCGTGCGGTTCGAT GACGACAACAGCCCCAGCTTCATCCAGATTCGCA GCGTGGCCAAGAAGCACCCCAAAACCTGGGTGC ACTACATCGCGGCCGAGGAAGAAGATTGGGACT ACGCCCCGTTGGTGCTGGCACCCGATGACCGGT CGTACAAGTCCCAGTATCTGAACAATGGTCCGCA GCGGATTGGCAGAAAGTACAAGAAAGTGCGGTT CATGGCGTACACTGACGAAACGTTTAAGACCCGG GAGGCCATTCAACATGAGAGCGGCATTCTGGGA CCACTGCTGTACGGAGAGGTCGGCGATACCCTG CTCATCATCTTCAAAAACCAGGCCTCCCGGCCTT ACAACATCTACCCTCACGGAATCACCGACGTGCG GCCACTCTACTCGCGGCGCCTGCCGAAGGGCGT
Descrição Sequência
CAAGCACCTGAAAGACTTCCCTATCCTGCCGGGC GAAATCTTCAAGTATAAGTGGACCGTCACCGTGG AGGACGGGCCCACCAAGAGCGATCCTAGGTGTC TGACTCGGTACTACTCCAGCTTCGTGAACATGGA ACGGGACCTGGCATCGGGACTCATTGGACCGCT GCTGATCTGCTACAAAGAGTCGGTGGATCAACGC GGCAACCAGATCATGTCCGACAAGCGCAACGTG ATCCTGTTCTCCGTGTTTGATGAAAACAGATCCTG GTACCTCACTGAAAACATCCAGAGGTTCCTCCCA AACCCCGCAGGAGTGCAACTGGAGGACCCTGAG TTTCAGGCCTCGAATATCATGCACTCGATTAACG GTTACGTGTTCGACTCGCTGCAACTGAGCGTGTG CCTCCATGAAGTCGCTTACTGGTACATTCTGTCC ATCGGCGCCCAGACTGACTTCCTGAGCGTGTTCT TTTCCGGTTACACCTTTAAGCACAAGATGGTGTA CGAAGATACCCTGACCCTGTTCCCTTTCTCCGGC GAAACGGTGTTCATGTCGATGGAGAACCCGGGT CTGTGGATTCTGGGATGCCACAACAGCGACTTTC GGAACCGCGGAATGACTGCCCTGCTGAAGGTGT CCTCATGCGACAAGAACACCGGAGACTACTACGA GGACTCCTACGAGGATATCTCAGCCTACCTCCTG TCCAAGAACAACGCGATCGAGCCGCGCAGCTTC AGCCAGAACGGCGCGCCAACATCAGAGAGCGCC ACCCCTGAAAGTGGTCCCGGGAGCGAGCCAGCC ACATCTGGGTCGGAAACGCCAGGCACAAGTGAG TCTGCAACTCCCGAGTCCGGACCTGGCTCCGAG CCTGCCACTAGCGGCTCCGAGACTCCGGGAACT TCCGAGAGCGCTACACCAGAAAGCGGACCCGGA ACCAGTACCGAACCTAGCGAGGGCTCTGCTCCG GGCAGCCCAGCCGGCTCTCCTACATCCACGGAG GAGGGCACTTCCGAATCCGCCACCCCGGAGTCA GGGCCAGGATCTGAACCCGCTACCTCAGGCAGT GAGACGCCAGGAACGAGCGAGTCCGCTACACCG GAGAGTGGGCCAGGGAGCCCTGCTGGATCTCCT ACGTCCACTGAGGAAGGGTCACCAGCGGGCTCG CCCACCAGCACTGAAGAAGGTGCCTCGAGCCCG
Descrição Sequência
CCTGTGCTGAAGAGGCACCAGCGAGAAATTACC CGGACCACCCTCCAATCGGATCAGGAGGAAATC GACTACGACGACACCATCTCGGTGGAAATGAAGA AGGAAGATTTCGATATCTACGACGAGGACGAAAA TCAGTCCCCTCGCTCATTCCAAAAGAAAACTAGA CACTACTTTATCGCCGCGGTGGAAAGACTGTGGG ACTATGGAATGTCATCCAGCCCTCACGTCCTTCG GAACCGGGCCCAGAGCGGATCGGTGCCTCAGTT CAAGAAAGTGGTGTTCCAGGAGTTCACCGACGG CAGCTTCACCCAGCCGCTGTACCGGGGAGAACT GAACGAACACCTGGGCCTGCTCGGTCCCTACAT CCGCGCGGAAGTGGAGGATAACATCATGGTGAC CTTCCGTAACCAAGCATCCAGACCTTACTCCTTCT ATTCCTCCCTGATCTCATACGAGGAGGACCAGCG CCAAGGCGCCGAGCCCCGCAAGAACTTCGTCAA GCCCAACGAGACTAAGACCTACTTCTGGAAGGTC CAACACCATATGGCCCCGACCAAGGATGAGTTTG ACTGCAAGGCCTGGGCCTACTTCTCCGACGTGG ACCTTGAGAAGGATGTCCATTCCGGCCTGATCGG GCCGCTGCTCGTGTGTCACACCAACACCCTGAAC CCAGCGCATGGACGCCAGGTCACCGTCCAGGAG TTTGCTCTGTTCTTCACCATTTTTGACGAAACTAA GTCCTGGTACTTCACCGAGAATATGGAGCGAAAC TGTAGAGCGCCCTGCAATATCCAGATGGAAGATC CGACTTTCAAGGAGAACTATAGATTCCACGCCAT CAACGGGTACATCATGGATACTCTGCCGGGGCT GGTCATGGCCCAGGATCAGAGGATTCGGTGGTA CTTGCTGTCAATGGGATCGAACGAAAACATTCAC TCCATTCACTTCTCCGGTCACGTGTTCACTGTGC GCAAGAAGGAGGAGTACAAGATGGCGCTGTACA ATCTGTACCCCGGGGTGTTCGAAACTGTGGAGAT GCTGCCGTCCAAGGCCGGCATCTGGAGAGTGGA GTGCCTGATCGGAGAGCACCTCCACGCGGGGAT GTCCACCCTCTTCCTGGTGTACTCGAATAAGTGC CAGACCCCGCTGGGCATGGCCTCGGGCCACATC AGAGACTTCCAGATCACAGCAAGCGGACAATACG
Descrição Sequência
GCCAATGGGCGCCGAAGCTGGCCCGCTTGCACT ACTCCGGATCGATCAACGCATGGTCCACCAAGGA ACCGTTCTCGTGGATTAAGGTGGACCTCCTGGCC CCTATGATTATCCACGGAATTAAGACCCAGGGCG CCAGGCAGAAGTTCTCCTCCCTGTACATCTCGCA ATTCATCATCATGTACAGCCTGGACGGGAAGAAG TGGCAGACTTACAGGGGAAACTCCACCGGCACC CTGATGGTCTTTTTCGGCAACGTGGATTCCTCCG GCATTAAGCACAACATCTTCAACCCACCGATCAT AGCCAGATATATTAGGCTCCACCCCACTCACTAC TCAATCCGCTCAACTCTTCGGATGGAACTCATGG GGTGCGACCTGAACTCCTGCTCCATGCCGTTGG GGATGGAATCAAAGGCTATTAGCGACGCCCAGAT CACCGCGAGCTCCTACTTCACTAACATGTTCGCC ACCTGGAGCCCCTCCAAGGCCAGGCTGCACTTG CAGGGACGGTCAAATGCCTGGCGGCCGCAAGTG AACAATCCGAAGGAATGGCTTCAAGTGGATTTCC AAAAGACCATGAAAGTGACCGGAGTCACCACCCA GGGAGTGAAGTCCCTTCTGACCTCGATGTATGTG AAGGAGTTCCTGATTAGCAGCAGCCAGGACGGG CACCAGTGGACCCTGTTCTTCCAAAACGGAAAGG TCAAGGTGTTCCAGGGGAACCAGGACTCGTTCAC ACCCGTGGTGAACTCCCTGGACCCCCCACTGCT GACGCGGTACTTGAGGATTCATCCTCAGTCCTGG GTCCATCAGATTGCATTGCGAATGGAAGTCCTGG
GCTGCGAGGCCCAGGACCTGTACTGA WPRE (ele- TCATAATCAACCTCTGGATTACAAAATTTGTGAAA mento regula- GATTGACTGGTATTCTTAACTATGTTGCTCCTTTT dor pós- ACGCTATGTGGATACGCTGCTTTAATGCCTTTGTA transcricional TCATGCTATTGCTTCCCGTATGGCTTTCATTTTCT do vírus mu- CCTCCTTGTATAAATCCTGGTTGCTGTCTCTTTAT tado da hepa- GAGGAGTTGTGGCCCGTTGTCAGGCAACGTGGC tite de marmo- GTGGTGTGCACTGTGTTTGCTGACGCAACCCCCA ta) (SEQ ID CTGGTTGGGGCATTGCCACCACCTGTCAGCTCCT NO:120) TTCCGGGACTTTCGCTTTCCCCCTCCCTATTGCC
ACGGCGGAACTCATCGCCGCCTGCCTTGCCCGC
Descrição Sequência
TGCTGGACAGGGGCTCGGCTGTTGGGCACTGAC AATTCCGTGGTGTTGTCGGGGAAATCATCGTCCT TTCCTTGGCTGCTCGCCTGTGTTGCCACCTGGAT TCTGCGCGGGACGTCCTTCTGCTACGTCCCTTCG GCCCTCAATCCAGCGGACCTTCCTTCCCGCGGC CTGCTGCCGGCTCTGCGGCCTCTTCCGCGTCTT CGCCTTCGCCCTCAGACGAGTCGGATCTCCCTTT
GGGCCGCCTCCCCGCTG bGHpA (sinal CGACTGTGCCTTCTAGTTGCCAGCCATCTGTTGT de poliadeni- TTGCCCCTCCCCCGTGCCTTCCTTGACCCTGGAA lação do fator GGTGCCACTCCCACTGTCCTTTCCTAATAAAATG de crescimen- AGGAAATTGCATCGCATTGTCTGAGTAGGTGTCA to bovino) TTCTATTCTGGGGGGTGGGGTGGGGCAGGACAG (SEQ ID CAAGGGGGAGGATTGGGAAGACAATAGCAGGCA NO:122) TGCTGGGGA Repetição AAAATTTAAAAGAAGACACCAAATCAGATGCCGC terminal inver- CGGTCGCCGCCGGTAGGCGGGACTTCCGGTACA tida3' ITR AGATGGCGGACAATTACGTCATTTCCTGTGACGT (SEQ ID NO: CATTTCCTGTGACGTCACTTCCGGTGGGCGGGA 186) CTTCCGGAATTAGGGTTGGCTCTGGGCCAGCGC
TTGGGGTTGACGTGCCACTAAGATCAAGCGGCG CGCCGCTTGTCTTAGTGTCAAGGCAACCCCAAGC AAGCTGGCCCAGAGCCAACCCTAATTCCGGAAGT CCCGCCCACCGGAAGTGACGTCACAGGAAATGA CGTCACAGGAAATGACGTAATTGTCCGCCATCTT GTACCGGAAGTCCCGCCTACCGGCGGCGACCGG
CGGCATCTGATTTGG Sequência de comprimento total (SEQ ID NO: 189)
CCAAATCAGATGCCGCCGGTCGCCGCCGGTAGGCGGGACTTCC GGTACAAGATGGCGGACAATTACGTCATTTCCTGTGACGTCATTT CCTGTGACGTCACTTCCGGTGGGCGGGACTTCCGGAATTAGGG TTGGCTCTGGGCCAGCTTGCTTGGGGTTGCCTTGACACTAAGAC AAGCGGCGCGCCGCTTGATCTTAGTGGCACGTCAACCCCAAGC GCTGGCCCAGAGCCAACCCTAATTCCGGAAGTCCCGCCCACCG GAAGTGACGTCACAGGAAATGACGTCACAGGAAATGACGTAATT GTCCGCCATCTTGTACCGGAAGTCCCGCCTACCGGCGGCGACC
Descrição Sequência
GGCGGCATCTGATTTGGTGTCTTCTTTTAAATTTTGCGGCAATTC AGTCGATAACTATAACGGTCCTAAGGTAGCGATTTAAATACGCGC TCTCTTAAGGTAGCCCCGGGACGCGTCAATTGAGATCTGGATCC GGTACCGAATTCGCGGCCGCCTCGACGACTAGCGTTTAATTAAA CGCGTGTCTGTCTGCACATTTCGTAGAGCGAGTGTTCCGATACT CTAATCTCCCTAGGCAAGGTTCATATTTGTGTAGGTTACTTATTCT CCTTTTGTTGACTAAGTCAATAATCAGAATCAGCAGGTTTGGAGT CAGCTTGGCAGGGATCAGCAGCCTGGGTTGGAAGGAGGGGGTA TAAAAGCCCCTTCACCAGGAGAAGCCGTCACACAGATCCACAAG CTCCTGAGGTAAGTGCCGTGTGTGGTTCCCGCGGGCCTGGCCT CTTTACGGGTTATGGCCCTTGCGTGCCTTGAATTACTGACACTGA CATCCACTTTTTCTTTTTCTCCACAGCTAGCGCCACCATGCAGAT TGAGCTGTCCACTTGTTTCTTCCTGTGCCTCCTGCGCTTCTGTTT CTCCGCCACTCGCCGGTACTACCTTGGAGCCGTGGAGCTTTCAT GGGACTACATGCAGAGCGACCTGGGCGAACTCCCCGTGGATGC CAGATTCCCCCCCCGCGTGCCAAAGTCCTTCCCCTTTAACACCT CCGTGGTGTACAAGAAAACCCTCTTTGTCGAGTTCACTGACCAC CTGTTCAACATCGCCAAGCCGCGCCCACCTTGGATGGGCCTCCT GGGACCGACCATTCAAGCTGAAGTGTACGACACCGTGGTGATCA CCCTGAAGAACATGGCGTCCCACCCCGTGTCCCTGCATGCGGT CGGAGTGTCCTACTGGAAGGCCTCCGAAGGAGCTGAGTACGAC GACCAGACTAGCCAGCGGGAAAAGGAGGACGATAAAGTGTTCC CGGGCGGCTCGCATACTTACGTGTGGCAAGTCCTGAAGGAAAA CGGACCTATGGCATCCGATCCTCTGTGCCTGACTTACTCCTACC TTTCCCATGTGGACCTCGTGAAGGACCTGAACAGCGGGCTGATT GGTGCACTTCTCGTGTGCCGCGAAGGTTCGCTCGCTAAGGAAAA GACCCAGACCCTCCATAAGTTCATCCTTTTGTTCGCTGTGTTCGA TGAAGGAAAGTCATGGCATTCCGAAACTAAGAACTCGCTGATGC AGGACCGGGATGCCGCCTCAGCCCGCGCCTGGCCTAAAATGCA TACAGTCAACGGATACGTGAATCGGTCACTGCCCGGGCTCATCG GTTGTCACAGAAAGTCCGTGTACTGGCACGTCATCGGCATGGGC ACTACGCCTGAAGTGCACTCCATCTTCCTGGAAGGGCACACCTT CCTCGTGCGCAACCACCGCCAGGCCTCTCTGGAAATCTCCCCG ATTACCTTTCTGACCGCCCAGACTCTGCTCATGGACCTGGGGCA GTTCCTTCTCTTCTGCCACATCTCCAGCCATCAGCACGACGGAA TGGAGGCCTACGTGAAGGTGGACTCATGCCCGGAAGAACCTCA
Descrição Sequência
GTTGCGGATGAAGAACAACGAGGAGGCCGAGGACTATGACGAC GATTTGACTGACTCCGAGATGGACGTCGTGCGGTTCGATGACGA CAACAGCCCCAGCTTCATCCAGATTCGCAGCGTGGCCAAGAAGC ACCCCAAAACCTGGGTGCACTACATCGCGGCCGAGGAAGAAGA TTGGGACTACGCCCCGTTGGTGCTGGCACCCGATGACCGGTCG TACAAGTCCCAGTATCTGAACAATGGTCCGCAGCGGATTGGCAG AAAGTACAAGAAAGTGCGGTTCATGGCGTACACTGACGAAACGT TTAAGACCCGGGAGGCCATTCAACATGAGAGCGGCATTCTGGGA CCACTGCTGTACGGAGAGGTCGGCGATACCCTGCTCATCATCTT CAAAAACCAGGCCTCCCGGCCTTACAACATCTACCCTCACGGAA TCACCGACGTGCGGCCACTCTACTCGCGGCGCCTGCCGAAGGG CGTCAAGCACCTGAAAGACTTCCCTATCCTGCCGGGCGAAATCT TCAAGTATAAGTGGACCGTCACCGTGGAGGACGGGCCCACCAA GAGCGATCCTAGGTGTCTGACTCGGTACTACTCCAGCTTCGTGA ACATGGAACGGGACCTGGCATCGGGACTCATTGGACCGCTGCT GATCTGCTACAAAGAGTCGGTGGATCAACGCGGCAACCAGATCA TGTCCGACAAGCGCAACGTGATCCTGTTCTCCGTGTTTGATGAA AACAGATCCTGGTACCTCACTGAAAACATCCAGAGGTTCCTCCC AAACCCCGCAGGAGTGCAACTGGAGGACCCTGAGTTTCAGGCC TCGAATATCATGCACTCGATTAACGGTTACGTGTTCGACTCGCTG CAACTGAGCGTGTGCCTCCATGAAGTCGCTTACTGGTACATTCT GTCCATCGGCGCCCAGACTGACTTCCTGAGCGTGTTCTTTTCCG GTTACACCTTTAAGCACAAGATGGTGTACGAAGATACCCTGACC CTGTTCCCTTTCTCCGGCGAAACGGTGTTCATGTCGATGGAGAA CCCGGGTCTGTGGATTCTGGGATGCCACAACAGCGACTTTCGGA ACCGCGGAATGACTGCCCTGCTGAAGGTGTCCTCATGCGACAA GAACACCGGAGACTACTACGAGGACTCCTACGAGGATATCTCAG CCTACCTCCTGTCCAAGAACAACGCGATCGAGCCGCGCAGCTTC AGCCAGAACGGCGCGCCAACATCAGAGAGCGCCACCCCTGAAA GTGGTCCCGGGAGCGAGCCAGCCACATCTGGGTCGGAAACGCC AGGCACAAGTGAGTCTGCAACTCCCGAGTCCGGACCTGGCTCC GAGCCTGCCACTAGCGGCTCCGAGACTCCGGGAACTTCCGAGA GCGCTACACCAGAAAGCGGACCCGGAACCAGTACCGAACCTAG CGAGGGCTCTGCTCCGGGCAGCCCAGCCGGCTCTCCTACATCC ACGGAGGAGGGCACTTCCGAATCCGCCACCCCGGAGTCAGGGC CAGGATCTGAACCCGCTACCTCAGGCAGTGAGACGCCAGGAAC
Descrição Sequência
GAGCGAGTCCGCTACACCGGAGAGTGGGCCAGGGAGCCCTGCT GGATCTCCTACGTCCACTGAGGAAGGGTCACCAGCGGGCTCGC CCACCAGCACTGAAGAAGGTGCCTCGAGCCCGCCTGTGCTGAA GAGGCACCAGCGAGAAATTACCCGGACCACCCTCCAATCGGAT CAGGAGGAAATCGACTACGACGACACCATCTCGGTGGAAATGAA GAAGGAAGATTTCGATATCTACGACGAGGACGAAAATCAGTCCC CTCGCTCATTCCAAAAGAAAACTAGACACTACTTTATCGCCGCGG TGGAAAGACTGTGGGACTATGGAATGTCATCCAGCCCTCACGTC CTTCGGAACCGGGCCCAGAGCGGATCGGTGCCTCAGTTCAAGA AAGTGGTGTTCCAGGAGTTCACCGACGGCAGCTTCACCCAGCC GCTGTACCGGGGAGAACTGAACGAACACCTGGGCCTGCTCGGT CCCTACATCCGCGCGGAAGTGGAGGATAACATCATGGTGACCTT CCGTAACCAAGCATCCAGACCTTACTCCTTCTATTCCTCCCTGAT CTCATACGAGGAGGACCAGCGCCAAGGCGCCGAGCCCCGCAAG AACTTCGTCAAGCCCAACGAGACTAAGACCTACTTCTGGAAGGT CCAACACCATATGGCCCCGACCAAGGATGAGTTTGACTGCAAGG CCTGGGCCTACTTCTCCGACGTGGACCTTGAGAAGGATGTCCAT TCCGGCCTGATCGGGCCGCTGCTCGTGTGTCACACCAACACCC TGAACCCAGCGCATGGACGCCAGGTCACCGTCCAGGAGTTTGC TCTGTTCTTCACCATTTTTGACGAAACTAAGTCCTGGTACTTCAC CGAGAATATGGAGCGAAACTGTAGAGCGCCCTGCAATATCCAGA TGGAAGATCCGACTTTCAAGGAGAACTATAGATTCCACGCCATC AACGGGTACATCATGGATACTCTGCCGGGGCTGGTCATGGCCC AGGATCAGAGGATTCGGTGGTACTTGCTGTCAATGGGATCGAAC GAAAACATTCACTCCATTCACTTCTCCGGTCACGTGTTCACTGTG CGCAAGAAGGAGGAGTACAAGATGGCGCTGTACAATCTGTACCC CGGGGTGTTCGAAACTGTGGAGATGCTGCCGTCCAAGGCCGGC ATCTGGAGAGTGGAGTGCCTGATCGGAGAGCACCTCCACGCGG GGATGTCCACCCTCTTCCTGGTGTACTCGAATAAGTGCCAGACC CCGCTGGGCATGGCCTCGGGCCACATCAGAGACTTCCAGATCA CAGCAAGCGGACAATACGGCCAATGGGCGCCGAAGCTGGCCCG CTTGCACTACTCCGGATCGATCAACGCATGGTCCACCAAGGAAC CGTTCTCGTGGATTAAGGTGGACCTCCTGGCCCCTATGATTATC CACGGAATTAAGACCCAGGGCGCCAGGCAGAAGTTCTCCTCCCT GTACATCTCGCAATTCATCATCATGTACAGCCTGGACGGGAAGA AGTGGCAGACTTACAGGGGAAACTCCACCGGCACCCTGATGGT
Descrição Sequência
CTTTTTCGGCAACGTGGATTCCTCCGGCATTAAGCACAACATCTT CAACCCACCGATCATAGCCAGATATATTAGGCTCCACCCCACTC ACTACTCAATCCGCTCAACTCTTCGGATGGAACTCATGGGGTGC GACCTGAACTCCTGCTCCATGCCGTTGGGGATGGAATCAAAGGC TATTAGCGACGCCCAGATCACCGCGAGCTCCTACTTCACTAACA TGTTCGCCACCTGGAGCCCCTCCAAGGCCAGGCTGCACTTGCA GGGACGGTCAAATGCCTGGCGGCCGCAAGTGAACAATCCGAAG GAATGGCTTCAAGTGGATTTCCAAAAGACCATGAAAGTGACCGG AGTCACCACCCAGGGAGTGAAGTCCCTTCTGACCTCGATGTATG TGAAGGAGTTCCTGATTAGCAGCAGCCAGGACGGGCACCAGTG GACCCTGTTCTTCCAAAACGGAAAGGTCAAGGTGTTCCAGGGGA ACCAGGACTCGTTCACACCCGTGGTGAACTCCCTGGACCCCCCA CTGCTGACGCGGTACTTGAGGATTCATCCTCAGTCCTGGGTCCA TCAGATTGCATTGCGAATGGAAGTCCTGGGCTGCGAGGCCCAG GACCTGTACTGAATCAGCCTGAGCTCGCTGATCATAATCAACCT CTGGATTACAAAATTTGTGAAAGATTGACTGGTATTCTTAACTATG TTGCTCCTTTTACGCTATGTGGATACGCTGCTTTAATGCCTTTGT ATCATGCTATTGCTTCCCGTATGGCTTTCATTTTCTCCTCCTTGTA TAAATCCTGGTTGCTGTCTCTTTATGAGGAGTTGTGGCCCGTTGT CAGGCAACGTGGCGTGGTGTGCACTGTGTTTGCTGACGCAACC CCCACTGGTTGGGGCATTGCCACCACCTGTCAGCTCCTTTCCGG GACTTTCGCTTTCCCCCTCCCTATTGCCACGGCGGAACTCATCG CCGCCTGCCTTGCCCGCTGCTGGACAGGGGCTCGGCTGTTGGG CACTGACAATTCCGTGGTGTTGTCGGGGAAATCATCGTCCTTTC CTTGGCTGCTCGCCTGTGTTGCCACCTGGATTCTGCGCGGGAC GTCCTTCTGCTACGTCCCTTCGGCCCTCAATCCAGCGGACCTTC CTTCCCGCGGCCTGCTGCCGGCTCTGCGGCCTCTTCCGCGTCT TCGCCTTCGCCCTCAGACGAGTCGGATCTCCCTTTGGGCCGCCT CCCCGCTGATCAGCCTCGACTGTGCCTTCTAGTTGCCAGCCATC TGTTGTTTGCCCCTCCCCCGTGCCTTCCTTGACCCTGGAAGGTG CCACTCCCACTGTCCTTTCCTAATAAAATGAGGAAATTGCATCGC ATTGTCTGAGTAGGTGTCATTCTATTCTGGGGGGTGGGGTGGGG CAGGACAGCAAGGGGGAGGATTGGGAAGACAATAGCAGGCATG CTGGGGATGCGGTGGGCTCTATGGCTTCTGAGGCGGAAAGAAC GGGCTCGAGAAGCTTCTAGATATCCTCTCTTAAGGTAGCATCGA GATTTAAATTAGGGATAACAGGGTAATGGCGCGGGCCGCAAAAT
Descrição Sequência
TTAAAAGAAGACACCAAATCAGATGCCGCCGGTCGCCGCCGGTA GGCGGGACTTCCGGTACAAGATGGCGGACAATTACGTCATTTCC TGTGACGTCATTTCCTGTGACGTCACTTCCGGTGGGCGGGACTT CCGGAATTAGGGTTGGCTCTGGGCCAGCGCTTGGGGTTGACGT GCCACTAAGATCAAGCGGCGCGCCGCTTGTCTTAGTGTCAAGGC AACCCCAAGCAAGCTGGCCCAGAGCCAACCCTAATTCCGGAAGT CCCGCCCACCGGAAGTGACGTCACAGGAAATGACGTCACAGGA AATGACGTAATTGTCCGCCATCTTGTACCGGAAGTCCCGCCTAC
CGGCGGCGACCGGCGGCATCTGATTTGG Tabela 2E: Exemplo do construto AAV-FVIII (nucleotídeos 1-6824; SEQ ID NO: 190) Descrição Sequência 5' ITR (SEQ CTGCGCGCTCGCTCGCTCACTGAGGCCGCCCGG ID NO: 111) GCAAAGCCCGGGCGTCGGGCGACCTTTGGTCGC
CCGGCCTCAGTGAGCGAGCGAGCGCGCAGAGA
GGGAGTGGCCAACTCCATCACTAGGGGTTCCT CAGp (promo- TCGAGGTGAGCCCCACGTTCTGCTTCACTCTCCC tor ubíquo) CATCTCCCCCCCCTCCCCACCCCCAATTTTGTAT (SEQ ID TTATTTATTTTTTAATTATTTTGTGCAGCGATGGG NO:191) GGCGGGGGGGGGGGGGGGGCGCGCGCCAGGC
GGGGCGGGGCGGGGCGAGGGGCGGGGCGGGG CGAGGCGGAGAGGTGCGGCGGCAGCCAATCAG AGCGGCGCGCTCCGAAAGTTTCCTTTTATGGCGA GGCGGCGGCGGCGGCGGCCCTATAAAAAGCGA
AGCGCGCGGCGGGCG Íntron sintético GTGAGCGGGCGGGACGGCCCTTCTCCTTCGGGC (SEQ ID TGTAATTAGCGCTTGGTTTAATGACGGCTTGTTTC NO:192) TTTTCTGTGGCTGCGTGAAAGCCTTGAGGGGCTC
CGGGAGGGCCCTTTGTGCGGGGGGAGCGGCTC GGGGCTGTCCGCGGGGGGACGGCTGCCTTCGG GGGGGACGGGGCAGGGCGGGGTTCGGCTTCTG GCGTGTGACCGGCGGCTCTAGAGCCTCTGCTAA
CCATGTTCATGCCTTCTTCTTTTTCCTACAG FVIIIco6XTEN ATGCAGATTGAGCTGTCCACTTGTTTCTTCCTGTG
Descrição Sequência (SEQ ID CCTCCTGCGCTTCTGTTTCTCCGCCACTCGCCGG NO:117) (fase TACTACCTTGGAGCCGTGGAGCTTTCATGGGACT de leitura ACATGCAGAGCGACCTGGGCGAACTCCCCGTGG aberta para ATGCCAGATTCCCCCCCCGCGTGCCAAAGTCCTT FVIII códon- CCCCTTTAACACCTCCGTGGTGTACAAGAAAACC otimizado ver- CTCTTTGTCGAGTTCACTGACCACCTGTTCAACAT são 6 conten- CGCCAAGCCGCGCCCACCTTGGATGGGCCTCCT do XTEN144; GGGACCGACCATTCAAGCTGAAGTGTACGACAC a sequência CGTGGTGATCACCCTGAAGAACATGGCGTCCCA de XTEN está CCCCGTGTCCCTGCATGCGGTCGGAGTGTCCTA assinlada com CTGGAAGGCCTCCGAAGGAGCTGAGTACGACGA sublinhado CCAGACTAGCCAGCGGGAAAAGGAGGACGATAA duplo (SEQ ID AGTGTTCCCGGGCGGCTCGCATACTTACGTGTG NO:118)) GCAAGTCCTGAAGGAAAACGGACCTATGGCATCC
GATCCTCTGTGCCTGACTTACTCCTACCTTTCCCA TGTGGACCTCGTGAAGGACCTGAACAGCGGGCT GATTGGTGCACTTCTCGTGTGCCGCGAAGGTTCG CTCGCTAAGGAAAAGACCCAGACCCTCCATAAGT TCATCCTTTTGTTCGCTGTGTTCGATGAAGGAAA GTCATGGCATTCCGAAACTAAGAACTCGCTGATG CAGGACCGGGATGCCGCCTCAGCCCGCGCCTG GCCTAAAATGCATACAGTCAACGGATACGTGAAT CGGTCACTGCCCGGGCTCATCGGTTGTCACAGA AAGTCCGTGTACTGGCACGTCATCGGCATGGGC ACTACGCCTGAAGTGCACTCCATCTTCCTGGAAG GGCACACCTTCCTCGTGCGCAACCACCGCCAGG CCTCTCTGGAAATCTCCCCGATTACCTTTCTGAC CGCCCAGACTCTGCTCATGGACCTGGGGCAGTT CCTTCTCTTCTGCCACATCTCCAGCCATCAGCAC GACGGAATGGAGGCCTACGTGAAGGTGGACTCA TGCCCGGAAGAACCTCAGTTGCGGATGAAGAAC AACGAGGAGGCCGAGGACTATGACGACGATTTG ACTGACTCCGAGATGGACGTCGTGCGGTTCGAT GACGACAACAGCCCCAGCTTCATCCAGATTCGCA GCGTGGCCAAGAAGCACCCCAAAACCTGGGTGC ACTACATCGCGGCCGAGGAAGAAGATTGGGACT
Descrição Sequência
ACGCCCCGTTGGTGCTGGCACCCGATGACCGGT CGTACAAGTCCCAGTATCTGAACAATGGTCCGCA GCGGATTGGCAGAAAGTACAAGAAAGTGCGGTT CATGGCGTACACTGACGAAACGTTTAAGACCCGG GAGGCCATTCAACATGAGAGCGGCATTCTGGGA CCACTGCTGTACGGAGAGGTCGGCGATACCCTG CTCATCATCTTCAAAAACCAGGCCTCCCGGCCTT ACAACATCTACCCTCACGGAATCACCGACGTGCG GCCACTCTACTCGCGGCGCCTGCCGAAGGGCGT CAAGCACCTGAAAGACTTCCCTATCCTGCCGGGC GAAATCTTCAAGTATAAGTGGACCGTCACCGTGG AGGACGGGCCCACCAAGAGCGATCCTAGGTGTC TGACTCGGTACTACTCCAGCTTCGTGAACATGGA ACGGGACCTGGCATCGGGACTCATTGGACCGCT GCTGATCTGCTACAAAGAGTCGGTGGATCAACGC GGCAACCAGATCATGTCCGACAAGCGCAACGTG ATCCTGTTCTCCGTGTTTGATGAAAACAGATCCTG GTACCTCACTGAAAACATCCAGAGGTTCCTCCCA AACCCCGCAGGAGTGCAACTGGAGGACCCTGAG TTTCAGGCCTCGAATATCATGCACTCGATTAACG GTTACGTGTTCGACTCGCTGCAACTGAGCGTGTG CCTCCATGAAGTCGCTTACTGGTACATTCTGTCC ATCGGCGCCCAGACTGACTTCCTGAGCGTGTTCT TTTCCGGTTACACCTTTAAGCACAAGATGGTGTA CGAAGATACCCTGACCCTGTTCCCTTTCTCCGGC GAAACGGTGTTCATGTCGATGGAGAACCCGGGT CTGTGGATTCTGGGATGCCACAACAGCGACTTTC GGAACCGCGGAATGACTGCCCTGCTGAAGGTGT CCTCATGCGACAAGAACACCGGAGACTACTACGA GGACTCCTACGAGGATATCTCAGCCTACCTCCTG TCCAAGAACAACGCGATCGAGCCGCGCAGCTTC AGCCAGAACGGCGCGCCAACATCAGAGAGCGCC ACCCCTGAAAGTGGTCCCGGGAGCGAGCCAGCC ACATCTGGGTCGGAAACGCCAGGCACAAGTGAG TCTGCAACTCCCGAGTCCGGACCTGGCTCCGAG CCTGCCACTAGCGGCTCCGAGACTCCGGGAACT
Descrição Sequência
TCCGAGAGCGCTACACCAGAAAGCGGACCCGGA ACCAGTACCGAACCTAGCGAGGGCTCTGCTCCG GGCAGCCCAGCCGGCTCTCCTACATCCACGGAG GAGGGCACTTCCGAATCCGCCACCCCGGAGTCA GGGCCAGGATCTGAACCCGCTACCTCAGGCAGT GAGACGCCAGGAACGAGCGAGTCCGCTACACCG GAGAGTGGGCCAGGGAGCCCTGCTGGATCTCCT ACGTCCACTGAGGAAGGGTCACCAGCGGGCTCG CCCACCAGCACTGAAGAAGGTGCCTCGAGCCCG CCTGTGCTGAAGAGGCACCAGCGAGAAATTACC CGGACCACCCTCCAATCGGATCAGGAGGAAATC GACTACGACGACACCATCTCGGTGGAAATGAAGA AGGAAGATTTCGATATCTACGACGAGGACGAAAA TCAGTCCCCTCGCTCATTCCAAAAGAAAACTAGA CACTACTTTATCGCCGCGGTGGAAAGACTGTGGG ACTATGGAATGTCATCCAGCCCTCACGTCCTTCG GAACCGGGCCCAGAGCGGATCGGTGCCTCAGTT CAAGAAAGTGGTGTTCCAGGAGTTCACCGACGG CAGCTTCACCCAGCCGCTGTACCGGGGAGAACT GAACGAACACCTGGGCCTGCTCGGTCCCTACAT CCGCGCGGAAGTGGAGGATAACATCATGGTGAC CTTCCGTAACCAAGCATCCAGACCTTACTCCTTCT ATTCCTCCCTGATCTCATACGAGGAGGACCAGCG CCAAGGCGCCGAGCCCCGCAAGAACTTCGTCAA GCCCAACGAGACTAAGACCTACTTCTGGAAGGTC CAACACCATATGGCCCCGACCAAGGATGAGTTTG ACTGCAAGGCCTGGGCCTACTTCTCCGACGTGG ACCTTGAGAAGGATGTCCATTCCGGCCTGATCGG GCCGCTGCTCGTGTGTCACACCAACACCCTGAAC CCAGCGCATGGACGCCAGGTCACCGTCCAGGAG TTTGCTCTGTTCTTCACCATTTTTGACGAAACTAA GTCCTGGTACTTCACCGAGAATATGGAGCGAAAC TGTAGAGCGCCCTGCAATATCCAGATGGAAGATC CGACTTTCAAGGAGAACTATAGATTCCACGCCAT CAACGGGTACATCATGGATACTCTGCCGGGGCT GGTCATGGCCCAGGATCAGAGGATTCGGTGGTA
Descrição Sequência
CTTGCTGTCAATGGGATCGAACGAAAACATTCAC TCCATTCACTTCTCCGGTCACGTGTTCACTGTGC GCAAGAAGGAGGAGTACAAGATGGCGCTGTACA ATCTGTACCCCGGGGTGTTCGAAACTGTGGAGAT GCTGCCGTCCAAGGCCGGCATCTGGAGAGTGGA GTGCCTGATCGGAGAGCACCTCCACGCGGGGAT GTCCACCCTCTTCCTGGTGTACTCGAATAAGTGC CAGACCCCGCTGGGCATGGCCTCGGGCCACATC AGAGACTTCCAGATCACAGCAAGCGGACAATACG GCCAATGGGCGCCGAAGCTGGCCCGCTTGCACT ACTCCGGATCGATCAACGCATGGTCCACCAAGGA ACCGTTCTCGTGGATTAAGGTGGACCTCCTGGCC CCTATGATTATCCACGGAATTAAGACCCAGGGCG CCAGGCAGAAGTTCTCCTCCCTGTACATCTCGCA ATTCATCATCATGTACAGCCTGGACGGGAAGAAG TGGCAGACTTACAGGGGAAACTCCACCGGCACC CTGATGGTCTTTTTCGGCAACGTGGATTCCTCCG GCATTAAGCACAACATCTTCAACCCACCGATCAT AGCCAGATATATTAGGCTCCACCCCACTCACTAC TCAATCCGCTCAACTCTTCGGATGGAACTCATGG GGTGCGACCTGAACTCCTGCTCCATGCCGTTGG GGATGGAATCAAAGGCTATTAGCGACGCCCAGAT CACCGCGAGCTCCTACTTCACTAACATGTTCGCC ACCTGGAGCCCCTCCAAGGCCAGGCTGCACTTG CAGGGACGGTCAAATGCCTGGCGGCCGCAAGTG AACAATCCGAAGGAATGGCTTCAAGTGGATTTCC AAAAGACCATGAAAGTGACCGGAGTCACCACCCA GGGAGTGAAGTCCCTTCTGACCTCGATGTATGTG AAGGAGTTCCTGATTAGCAGCAGCCAGGACGGG CACCAGTGGACCCTGTTCTTCCAAAACGGAAAGG TCAAGGTGTTCCAGGGGAACCAGGACTCGTTCAC ACCCGTGGTGAACTCCCTGGACCCCCCACTGCT GACGCGGTACTTGAGGATTCATCCTCAGTCCTGG GTCCATCAGATTGCATTGCGAATGGAAGTCCTGG
GCTGCGAGGCCCAGGACCTGTACTGA WPRE (ele- TCATAATCAACCTCTGGATTACAAAATTTGTGAAA
Descrição Sequência mento regula- GATTGACTGGTATTCTTAACTATGTTGCTCCTTTT dor pós- ACGCTATGTGGATACGCTGCTTTAATGCCTTTGTA transcricional TCATGCTATTGCTTCCCGTATGGCTTTCATTTTCT do vírus mu- CCTCCTTGTATAAATCCTGGTTGCTGTCTCTTTAT tado da hepa- GAGGAGTTGTGGCCCGTTGTCAGGCAACGTGGC tite de marmo- GTGGTGTGCACTGTGTTTGCTGACGCAACCCCCA ta) (SEQ ID CTGGTTGGGGCATTGCCACCACCTGTCAGCTCCT NO:120) TTCCGGGACTTTCGCTTTCCCCCTCCCTATTGCC
ACGGCGGAACTCATCGCCGCCTGCCTTGCCCGC TGCTGGACAGGGGCTCGGCTGTTGGGCACTGAC AATTCCGTGGTGTTGTCGGGGAAATCATCGTCCT TTCCTTGGCTGCTCGCCTGTGTTGCCACCTGGAT TCTGCGCGGGACGTCCTTCTGCTACGTCCCTTCG GCCCTCAATCCAGCGGACCTTCCTTCCCGCGGC CTGCTGCCGGCTCTGCGGCCTCTTCCGCGTCTT CGCCTTCGCCCTCAGACGAGTCGGATCTCCCTTT
GGGCCGCCTCCCCGCTG bGHpA (sinal CGACTGTGCCTTCTAGTTGCCAGCCATCTGTTGT de poliadeni- TTGCCCCTCCCCCGTGCCTTCCTTGACCCTGGAA lação do fator GGTGCCACTCCCACTGTCCTTTCCTAATAAAATG de crescimen- AGGAAATTGCATCGCATTGTCTGAGTAGGTGTCA to bovino) TTCTATTCTGGGGGGTGGGGTGGGGCAGGACAG (SEQ ID CAAGGGGGAGGATTGGGAAGACAATAGCAGGCA NO:122) TGCTGGGGA Repetição AGGAACCCCTAGTGATGGAGTTGGCCACTCCCTC terminal inver- TCTGCGCGCTCGCTCGCTCACTGAGGCCGGGCG tida 3' ITR ACCAAAGGTCGCCCGACGCCCGGGCTTTGCCCG (SEQ ID NO: GGCGGCCTCAGTGAGCGAGCGAGCGCGCAG 193) Sequência de comprimento total (SEQ ID NO: 190)
CTGCGCGCTCGCTCGCTCACTGAGGCCGCCCGGGCAAAGCCCG GGCGTCGGGCGACCTTTGGTCGCCCGGCCTCAGTGAGCGAGC GAGCGCGCAGAGAGGGAGTGGCCAACTCCATCACTAGGGGTTC CTGCGGCAATTCAGTCGATAACTATAACGGTCCTAAGGTAGCGA TTTAAATACGCGCTCTCTTAAGGTAGCCCCGGGACGCGTCAATT GAGATCTGGATCCGGTACCGAATTCGCGGCCGCCTCGACGACT
Descrição Sequência
AGCGTTTAATTAAATCGAGGTGAGCCCCACGTTCTGCTTCACTCT CCCCATCTCCCCCCCCTCCCCACCCCCAATTTTGTATTTATTTAT TTTTTAATTATTTTGTGCAGCGATGGGGGCGGGGGGGGGGGGG GGGCGCGCGCCAGGCGGGGCGGGGCGGGGCGAGGGGCGGG GCGGGGCGAGGCGGAGAGGTGCGGCGGCAGCCAATCAGAGCG GCGCGCTCCGAAAGTTTCCTTTTATGGCGAGGCGGCGGCGGCG GCGGCCCTATAAAAAGCGAAGCGCGCGGCGGGCGGGAGTCGC TGCGCGCTGCCTTCGCCCCGTGCCCCGCTCCGCCGCCGCCTCG CGCCGCCCGCCCCGGCTCTGACTGACCGCGTTACTCCCACAGG TGAGCGGGCGGGACGGCCCTTCTCCTTCGGGCTGTAATTAGCG CTTGGTTTAATGACGGCTTGTTTCTTTTCTGTGGCTGCGTGAAAG CCTTGAGGGGCTCCGGGAGGGCCCTTTGTGCGGGGGGAGCGG CTCGGGGCTGTCCGCGGGGGGACGGCTGCCTTCGGGGGGGAC GGGGCAGGGCGGGGTTCGGCTTCTGGCGTGTGACCGGCGGCT CTAGAGCCTCTGCTAACCATGTTCATGCCTTCTTCTTTTTCCTAC AGGCTAGCGCCACCATGCAGATTGAGCTGTCCACTTGTTTCTTC CTGTGCCTCCTGCGCTTCTGTTTCTCCGCCACTCGCCGGTACTA CCTTGGAGCCGTGGAGCTTTCATGGGACTACATGCAGAGCGAC CTGGGCGAACTCCCCGTGGATGCCAGATTCCCCCCCCGCGTGC CAAAGTCCTTCCCCTTTAACACCTCCGTGGTGTACAAGAAAACCC TCTTTGTCGAGTTCACTGACCACCTGTTCAACATCGCCAAGCCG CGCCCACCTTGGATGGGCCTCCTGGGACCGACCATTCAAGCTG AAGTGTACGACACCGTGGTGATCACCCTGAAGAACATGGCGTCC CACCCCGTGTCCCTGCATGCGGTCGGAGTGTCCTACTGGAAGG CCTCCGAAGGAGCTGAGTACGACGACCAGACTAGCCAGCGGGA AAAGGAGGACGATAAAGTGTTCCCGGGCGGCTCGCATACTTACG TGTGGCAAGTCCTGAAGGAAAACGGACCTATGGCATCCGATCCT CTGTGCCTGACTTACTCCTACCTTTCCCATGTGGACCTCGTGAA GGACCTGAACAGCGGGCTGATTGGTGCACTTCTCGTGTGCCGC GAAGGTTCGCTCGCTAAGGAAAAGACCCAGACCCTCCATAAGTT CATCCTTTTGTTCGCTGTGTTCGATGAAGGAAAGTCATGGCATTC CGAAACTAAGAACTCGCTGATGCAGGACCGGGATGCCGCCTCA GCCCGCGCCTGGCCTAAAATGCATACAGTCAACGGATACGTGAA TCGGTCACTGCCCGGGCTCATCGGTTGTCACAGAAAGTCCGTGT ACTGGCACGTCATCGGCATGGGCACTACGCCTGAAGTGCACTC CATCTTCCTGGAAGGGCACACCTTCCTCGTGCGCAACCACCGCC
Descrição Sequência
AGGCCTCTCTGGAAATCTCCCCGATTACCTTTCTGACCGCCCAG ACTCTGCTCATGGACCTGGGGCAGTTCCTTCTCTTCTGCCACAT CTCCAGCCATCAGCACGACGGAATGGAGGCCTACGTGAAGGTG GACTCATGCCCGGAAGAACCTCAGTTGCGGATGAAGAACAACGA GGAGGCCGAGGACTATGACGACGATTTGACTGACTCCGAGATG GACGTCGTGCGGTTCGATGACGACAACAGCCCCAGCTTCATCCA GATTCGCAGCGTGGCCAAGAAGCACCCCAAAACCTGGGTGCAC TACATCGCGGCCGAGGAAGAAGATTGGGACTACGCCCCGTTGG TGCTGGCACCCGATGACCGGTCGTACAAGTCCCAGTATCTGAAC AATGGTCCGCAGCGGATTGGCAGAAAGTACAAGAAAGTGCGGTT CATGGCGTACACTGACGAAACGTTTAAGACCCGGGAGGCCATTC AACATGAGAGCGGCATTCTGGGACCACTGCTGTACGGAGAGGT CGGCGATACCCTGCTCATCATCTTCAAAAACCAGGCCTCCCGGC CTTACAACATCTACCCTCACGGAATCACCGACGTGCGGCCACTC TACTCGCGGCGCCTGCCGAAGGGCGTCAAGCACCTGAAAGACT TCCCTATCCTGCCGGGCGAAATCTTCAAGTATAAGTGGACCGTC ACCGTGGAGGACGGGCCCACCAAGAGCGATCCTAGGTGTCTGA CTCGGTACTACTCCAGCTTCGTGAACATGGAACGGGACCTGGCA TCGGGACTCATTGGACCGCTGCTGATCTGCTACAAAGAGTCGGT GGATCAACGCGGCAACCAGATCATGTCCGACAAGCGCAACGTG ATCCTGTTCTCCGTGTTTGATGAAAACAGATCCTGGTACCTCACT GAAAACATCCAGAGGTTCCTCCCAAACCCCGCAGGAGTGCAACT GGAGGACCCTGAGTTTCAGGCCTCGAATATCATGCACTCGATTA ACGGTTACGTGTTCGACTCGCTGCAACTGAGCGTGTGCCTCCAT GAAGTCGCTTACTGGTACATTCTGTCCATCGGCGCCCAGACTGA CTTCCTGAGCGTGTTCTTTTCCGGTTACACCTTTAAGCACAAGAT GGTGTACGAAGATACCCTGACCCTGTTCCCTTTCTCCGGCGAAA CGGTGTTCATGTCGATGGAGAACCCGGGTCTGTGGATTCTGGGA TGCCACAACAGCGACTTTCGGAACCGCGGAATGACTGCCCTGCT GAAGGTGTCCTCATGCGACAAGAACACCGGAGACTACTACGAG GACTCCTACGAGGATATCTCAGCCTACCTCCTGTCCAAGAACAA CGCGATCGAGCCGCGCAGCTTCAGCCAGAACGGCGCGCCAACA TCAGAGAGCGCCACCCCTGAAAGTGGTCCCGGGAGCGAGCCAG CCACATCTGGGTCGGAAACGCCAGGCACAAGTGAGTCTGCAACT CCCGAGTCCGGACCTGGCTCCGAGCCTGCCACTAGCGGCTCCG AGACTCCGGGAACTTCCGAGAGCGCTACACCAGAAAGCGGACC
Descrição Sequência
CGGAACCAGTACCGAACCTAGCGAGGGCTCTGCTCCGGGCAGC CCAGCCGGCTCTCCTACATCCACGGAGGAGGGCACTTCCGAAT CCGCCACCCCGGAGTCAGGGCCAGGATCTGAACCCGCTACCTC AGGCAGTGAGACGCCAGGAACGAGCGAGTCCGCTACACCGGAG AGTGGGCCAGGGAGCCCTGCTGGATCTCCTACGTCCACTGAGG AAGGGTCACCAGCGGGCTCGCCCACCAGCACTGAAGAAGGTGC CTCGAGCCCGCCTGTGCTGAAGAGGCACCAGCGAGAAATTACC CGGACCACCCTCCAATCGGATCAGGAGGAAATCGACTACGACG ACACCATCTCGGTGGAAATGAAGAAGGAAGATTTCGATATCTAC GACGAGGACGAAAATCAGTCCCCTCGCTCATTCCAAAAGAAAAC TAGACACTACTTTATCGCCGCGGTGGAAAGACTGTGGGACTATG GAATGTCATCCAGCCCTCACGTCCTTCGGAACCGGGCCCAGAG CGGATCGGTGCCTCAGTTCAAGAAAGTGGTGTTCCAGGAGTTCA CCGACGGCAGCTTCACCCAGCCGCTGTACCGGGGAGAACTGAA CGAACACCTGGGCCTGCTCGGTCCCTACATCCGCGCGGAAGTG GAGGATAACATCATGGTGACCTTCCGTAACCAAGCATCCAGACC TTACTCCTTCTATTCCTCCCTGATCTCATACGAGGAGGACCAGCG CCAAGGCGCCGAGCCCCGCAAGAACTTCGTCAAGCCCAACGAG ACTAAGACCTACTTCTGGAAGGTCCAACACCATATGGCCCCGAC CAAGGATGAGTTTGACTGCAAGGCCTGGGCCTACTTCTCCGACG TGGACCTTGAGAAGGATGTCCATTCCGGCCTGATCGGGCCGCT GCTCGTGTGTCACACCAACACCCTGAACCCAGCGCATGGACGC CAGGTCACCGTCCAGGAGTTTGCTCTGTTCTTCACCATTTTTGAC GAAACTAAGTCCTGGTACTTCACCGAGAATATGGAGCGAAACTG TAGAGCGCCCTGCAATATCCAGATGGAAGATCCGACTTTCAAGG AGAACTATAGATTCCACGCCATCAACGGGTACATCATGGATACTC TGCCGGGGCTGGTCATGGCCCAGGATCAGAGGATTCGGTGGTA CTTGCTGTCAATGGGATCGAACGAAAACATTCACTCCATTCACTT CTCCGGTCACGTGTTCACTGTGCGCAAGAAGGAGGAGTACAAGA TGGCGCTGTACAATCTGTACCCCGGGGTGTTCGAAACTGTGGAG ATGCTGCCGTCCAAGGCCGGCATCTGGAGAGTGGAGTGCCTGA TCGGAGAGCACCTCCACGCGGGGATGTCCACCCTCTTCCTGGT GTACTCGAATAAGTGCCAGACCCCGCTGGGCATGGCCTCGGGC CACATCAGAGACTTCCAGATCACAGCAAGCGGACAATACGGCCA ATGGGCGCCGAAGCTGGCCCGCTTGCACTACTCCGGATCGATC AACGCATGGTCCACCAAGGAACCGTTCTCGTGGATTAAGGTGGA
Descrição Sequência
CCTCCTGGCCCCTATGATTATCCACGGAATTAAGACCCAGGGCG CCAGGCAGAAGTTCTCCTCCCTGTACATCTCGCAATTCATCATCA TGTACAGCCTGGACGGGAAGAAGTGGCAGACTTACAGGGGAAA CTCCACCGGCACCCTGATGGTCTTTTTCGGCAACGTGGATTCCT CCGGCATTAAGCACAACATCTTCAACCCACCGATCATAGCCAGA TATATTAGGCTCCACCCCACTCACTACTCAATCCGCTCAACTCTT CGGATGGAACTCATGGGGTGCGACCTGAACTCCTGCTCCATGC CGTTGGGGATGGAATCAAAGGCTATTAGCGACGCCCAGATCACC GCGAGCTCCTACTTCACTAACATGTTCGCCACCTGGAGCCCCTC CAAGGCCAGGCTGCACTTGCAGGGACGGTCAAATGCCTGGCGG CCGCAAGTGAACAATCCGAAGGAATGGCTTCAAGTGGATTTCCA AAAGACCATGAAAGTGACCGGAGTCACCACCCAGGGAGTGAAG TCCCTTCTGACCTCGATGTATGTGAAGGAGTTCCTGATTAGCAG CAGCCAGGACGGGCACCAGTGGACCCTGTTCTTCCAAAACGGA AAGGTCAAGGTGTTCCAGGGGAACCAGGACTCGTTCACACCCGT GGTGAACTCCCTGGACCCCCCACTGCTGACGCGGTACTTGAGG ATTCATCCTCAGTCCTGGGTCCATCAGATTGCATTGCGAATGGAA GTCCTGGGCTGCGAGGCCCAGGACCTGTACTGAATCAGCCTGA GCTCGCTGATCATAATCAACCTCTGGATTACAAAATTTGTGAAAG ATTGACTGGTATTCTTAACTATGTTGCTCCTTTTACGCTATGTGGA TACGCTGCTTTAATGCCTTTGTATCATGCTATTGCTTCCCGTATG GCTTTCATTTTCTCCTCCTTGTATAAATCCTGGTTGCTGTCTCTTT ATGAGGAGTTGTGGCCCGTTGTCAGGCAACGTGGCGTGGTGTG CACTGTGTTTGCTGACGCAACCCCCACTGGTTGGGGCATTGCCA CCACCTGTCAGCTCCTTTCCGGGACTTTCGCTTTCCCCCTCCCT ATTGCCACGGCGGAACTCATCGCCGCCTGCCTTGCCCGCTGCT GGACAGGGGCTCGGCTGTTGGGCACTGACAATTCCGTGGTGTT GTCGGGGAAATCATCGTCCTTTCCTTGGCTGCTCGCCTGTGTTG CCACCTGGATTCTGCGCGGGACGTCCTTCTGCTACGTCCCTTCG GCCCTCAATCCAGCGGACCTTCCTTCCCGCGGCCTGCTGCCGG CTCTGCGGCCTCTTCCGCGTCTTCGCCTTCGCCCTCAGACGAGT CGGATCTCCCTTTGGGCCGCCTCCCCGCTGATCAGCCTCGACT GTGCCTTCTAGTTGCCAGCCATCTGTTGTTTGCCCCTCCCCCGT GCCTTCCTTGACCCTGGAAGGTGCCACTCCCACTGTCCTTTCCT AATAAAATGAGGAAATTGCATCGCATTGTCTGAGTAGGTGTCATT CTATTCTGGGGGGTGGGGTGGGGCAGGACAGCAAGGGGGAGG
Descrição Sequência
ATTGGGAAGACAATAGCAGGCATGCTGGGGATGCGGTGGGCTC TATGGCTTCTGAGGCGGAAAGAACGGGCTCGAGAAGCTTCTAGA TATCCTCTCTTAAGGTAGCATCGAGATTTAAATTAGGGATAACAG GGTAATGGCGCGGGCCGCAGGAACCCCTAGTGATGGAGTTGGC CACTCCCTCTCTGCGCGCTCGCTCGCTCACTGAGGCCGGGCGA CCAAAGGTCGCCCGACGCCCGGGCTTTGCCCGGGCGGCCTCA
GTGAGCGAGCGAGCGCGCAG Tabela 2F: Exemplo do construto GPV-FVIII transportando GPV ITRs de comprimento total (nucleotídeos 1-7154; SEQ ID NO: 194) Descrição Sequência 5' ITR (SEQ CTCATTGGAGGGTTCGTTCGTTCGAACCAGCCAA ID NO: 187) TCAGGGGAGGGGGAAGTGACGCAAGTTCCGGTC
ACATGCTTCCGGTGACGCACATCCGGTGACGTA GTTCCGGTCACGTGCTTCCTGTCACGTGTTTCCG GTCACGTGACTTCCGGTCATGTGACTTCCGGTGA CGTGTTTCCGGCTGTTAGGTTGACCACGCGCATG CCGCGCGGTCAGCCCAATAGTTAAGCCGGAAAC ACGTCACCGGAAGTCACATGACCGGAAGTCACG TGACCGGAAACACGTGACAGGAAGCACGTGACC GGAACTACGTCACCGGATGTGCGTCACCGGAAG CATGTGACCGGAACTTGCGTCACTTCCCCCTCCC CTGATTGGCTGGTTCGAACGAACGAACCCTCCAA TGAGACTCAAGGACAAGAGGATATTTTGCGCGCC
AGGAAGTG TTPp (promo- ACGCGTGTCTGTCTGCACATTTCGTAGAGCGAGT tor fígado- GTTCCGATACTCTAATCTCCCTAGGCAAGGTTCA específico) TATTTGTGTAGGTTACTTATTCTCCTTTTGTTGACT (SEQ ID AAGTCAATAATCAGAATCAGCAGGTTTGGAGTCA NO:113) GCTTGGCAGGGATCAGCAGCCTGGGTTGGAAGG
AGGGGGTATAAAAGCCCCTTCACCAGGAGAAGC
CGTCACACAGATCCACAAGCTCCTG Íntron sintético GTAAGTGCCGTGTGTGGTTCCCGCGGGCCTGGC (SEQ ID CTCTTTACGGGTTATGGCCCTTGCGTGCCTTGAA NO:115) TTACTGACACTGACATCCACTTTTTCTTTTTCTCC
Descrição Sequência
ACAG FVIIIco6XTEN ATGCAGATTGAGCTGTCCACTTGTTTCTTCCTGTG (SEQ ID CCTCCTGCGCTTCTGTTTCTCCGCCACTCGCCGG NO:117) (fase TACTACCTTGGAGCCGTGGAGCTTTCATGGGACT de leitura ACATGCAGAGCGACCTGGGCGAACTCCCCGTGG aberta para ATGCCAGATTCCCCCCCCGCGTGCCAAAGTCCTT FVIII códon- CCCCTTTAACACCTCCGTGGTGTACAAGAAAACC otimizado ver- CTCTTTGTCGAGTTCACTGACCACCTGTTCAACAT são 6 conten- CGCCAAGCCGCGCCCACCTTGGATGGGCCTCCT do XTEN144; GGGACCGACCATTCAAGCTGAAGTGTACGACAC a sequência CGTGGTGATCACCCTGAAGAACATGGCGTCCCA de XTEN está CCCCGTGTCCCTGCATGCGGTCGGAGTGTCCTA assinalada CTGGAAGGCCTCCGAAGGAGCTGAGTACGACGA com sublinha- CCAGACTAGCCAGCGGGAAAAGGAGGACGATAA do duplo AGTGTTCCCGGGCGGCTCGCATACTTACGTGTG (SEQ ID GCAAGTCCTGAAGGAAAACGGACCTATGGCATCC NO:118)) GATCCTCTGTGCCTGACTTACTCCTACCTTTCCCA
TGTGGACCTCGTGAAGGACCTGAACAGCGGGCT GATTGGTGCACTTCTCGTGTGCCGCGAAGGTTCG CTCGCTAAGGAAAAGACCCAGACCCTCCATAAGT TCATCCTTTTGTTCGCTGTGTTCGATGAAGGAAA GTCATGGCATTCCGAAACTAAGAACTCGCTGATG CAGGACCGGGATGCCGCCTCAGCCCGCGCCTG GCCTAAAATGCATACAGTCAACGGATACGTGAAT CGGTCACTGCCCGGGCTCATCGGTTGTCACAGA AAGTCCGTGTACTGGCACGTCATCGGCATGGGC ACTACGCCTGAAGTGCACTCCATCTTCCTGGAAG GGCACACCTTCCTCGTGCGCAACCACCGCCAGG CCTCTCTGGAAATCTCCCCGATTACCTTTCTGAC CGCCCAGACTCTGCTCATGGACCTGGGGCAGTT CCTTCTCTTCTGCCACATCTCCAGCCATCAGCAC GACGGAATGGAGGCCTACGTGAAGGTGGACTCA TGCCCGGAAGAACCTCAGTTGCGGATGAAGAAC AACGAGGAGGCCGAGGACTATGACGACGATTTG ACTGACTCCGAGATGGACGTCGTGCGGTTCGAT GACGACAACAGCCCCAGCTTCATCCAGATTCGCA
Descrição Sequência
GCGTGGCCAAGAAGCACCCCAAAACCTGGGTGC ACTACATCGCGGCCGAGGAAGAAGATTGGGACT ACGCCCCGTTGGTGCTGGCACCCGATGACCGGT CGTACAAGTCCCAGTATCTGAACAATGGTCCGCA GCGGATTGGCAGAAAGTACAAGAAAGTGCGGTT CATGGCGTACACTGACGAAACGTTTAAGACCCGG GAGGCCATTCAACATGAGAGCGGCATTCTGGGA CCACTGCTGTACGGAGAGGTCGGCGATACCCTG CTCATCATCTTCAAAAACCAGGCCTCCCGGCCTT ACAACATCTACCCTCACGGAATCACCGACGTGCG GCCACTCTACTCGCGGCGCCTGCCGAAGGGCGT CAAGCACCTGAAAGACTTCCCTATCCTGCCGGGC GAAATCTTCAAGTATAAGTGGACCGTCACCGTGG AGGACGGGCCCACCAAGAGCGATCCTAGGTGTC TGACTCGGTACTACTCCAGCTTCGTGAACATGGA ACGGGACCTGGCATCGGGACTCATTGGACCGCT GCTGATCTGCTACAAAGAGTCGGTGGATCAACGC GGCAACCAGATCATGTCCGACAAGCGCAACGTG ATCCTGTTCTCCGTGTTTGATGAAAACAGATCCTG GTACCTCACTGAAAACATCCAGAGGTTCCTCCCA AACCCCGCAGGAGTGCAACTGGAGGACCCTGAG TTTCAGGCCTCGAATATCATGCACTCGATTAACG GTTACGTGTTCGACTCGCTGCAACTGAGCGTGTG CCTCCATGAAGTCGCTTACTGGTACATTCTGTCC ATCGGCGCCCAGACTGACTTCCTGAGCGTGTTCT TTTCCGGTTACACCTTTAAGCACAAGATGGTGTA CGAAGATACCCTGACCCTGTTCCCTTTCTCCGGC GAAACGGTGTTCATGTCGATGGAGAACCCGGGT CTGTGGATTCTGGGATGCCACAACAGCGACTTTC GGAACCGCGGAATGACTGCCCTGCTGAAGGTGT CCTCATGCGACAAGAACACCGGAGACTACTACGA GGACTCCTACGAGGATATCTCAGCCTACCTCCTG TCCAAGAACAACGCGATCGAGCCGCGCAGCTTC AGCCAGAACGGCGCGCCAACATCAGAGAGCGCC ACCCCTGAAAGTGGTCCCGGGAGCGAGCCAGCC ACATCTGGGTCGGAAACGCCAGGCACAAGTGAG
Descrição Sequência
TCTGCAACTCCCGAGTCCGGACCTGGCTCCGAG CCTGCCACTAGCGGCTCCGAGACTCCGGGAACT TCCGAGAGCGCTACACCAGAAAGCGGACCCGGA ACCAGTACCGAACCTAGCGAGGGCTCTGCTCCG GGCAGCCCAGCCGGCTCTCCTACATCCACGGAG GAGGGCACTTCCGAATCCGCCACCCCGGAGTCA GGGCCAGGATCTGAACCCGCTACCTCAGGCAGT GAGACGCCAGGAACGAGCGAGTCCGCTACACCG GAGAGTGGGCCAGGGAGCCCTGCTGGATCTCCT ACGTCCACTGAGGAAGGGTCACCAGCGGGCTCG CCCACCAGCACTGAAGAAGGTGCCTCGAGCCCG CCTGTGCTGAAGAGGCACCAGCGAGAAATTACC CGGACCACCCTCCAATCGGATCAGGAGGAAATC GACTACGACGACACCATCTCGGTGGAAATGAAGA AGGAAGATTTCGATATCTACGACGAGGACGAAAA TCAGTCCCCTCGCTCATTCCAAAAGAAAACTAGA CACTACTTTATCGCCGCGGTGGAAAGACTGTGGG ACTATGGAATGTCATCCAGCCCTCACGTCCTTCG GAACCGGGCCCAGAGCGGATCGGTGCCTCAGTT CAAGAAAGTGGTGTTCCAGGAGTTCACCGACGG CAGCTTCACCCAGCCGCTGTACCGGGGAGAACT GAACGAACACCTGGGCCTGCTCGGTCCCTACAT CCGCGCGGAAGTGGAGGATAACATCATGGTGAC CTTCCGTAACCAAGCATCCAGACCTTACTCCTTCT ATTCCTCCCTGATCTCATACGAGGAGGACCAGCG CCAAGGCGCCGAGCCCCGCAAGAACTTCGTCAA GCCCAACGAGACTAAGACCTACTTCTGGAAGGTC CAACACCATATGGCCCCGACCAAGGATGAGTTTG ACTGCAAGGCCTGGGCCTACTTCTCCGACGTGG ACCTTGAGAAGGATGTCCATTCCGGCCTGATCGG GCCGCTGCTCGTGTGTCACACCAACACCCTGAAC CCAGCGCATGGACGCCAGGTCACCGTCCAGGAG TTTGCTCTGTTCTTCACCATTTTTGACGAAACTAA GTCCTGGTACTTCACCGAGAATATGGAGCGAAAC TGTAGAGCGCCCTGCAATATCCAGATGGAAGATC CGACTTTCAAGGAGAACTATAGATTCCACGCCAT
Descrição Sequência
CAACGGGTACATCATGGATACTCTGCCGGGGCT GGTCATGGCCCAGGATCAGAGGATTCGGTGGTA CTTGCTGTCAATGGGATCGAACGAAAACATTCAC TCCATTCACTTCTCCGGTCACGTGTTCACTGTGC GCAAGAAGGAGGAGTACAAGATGGCGCTGTACA ATCTGTACCCCGGGGTGTTCGAAACTGTGGAGAT GCTGCCGTCCAAGGCCGGCATCTGGAGAGTGGA GTGCCTGATCGGAGAGCACCTCCACGCGGGGAT GTCCACCCTCTTCCTGGTGTACTCGAATAAGTGC CAGACCCCGCTGGGCATGGCCTCGGGCCACATC AGAGACTTCCAGATCACAGCAAGCGGACAATACG GCCAATGGGCGCCGAAGCTGGCCCGCTTGCACT ACTCCGGATCGATCAACGCATGGTCCACCAAGGA ACCGTTCTCGTGGATTAAGGTGGACCTCCTGGCC CCTATGATTATCCACGGAATTAAGACCCAGGGCG CCAGGCAGAAGTTCTCCTCCCTGTACATCTCGCA ATTCATCATCATGTACAGCCTGGACGGGAAGAAG TGGCAGACTTACAGGGGAAACTCCACCGGCACC CTGATGGTCTTTTTCGGCAACGTGGATTCCTCCG GCATTAAGCACAACATCTTCAACCCACCGATCAT AGCCAGATATATTAGGCTCCACCCCACTCACTAC TCAATCCGCTCAACTCTTCGGATGGAACTCATGG GGTGCGACCTGAACTCCTGCTCCATGCCGTTGG GGATGGAATCAAAGGCTATTAGCGACGCCCAGAT CACCGCGAGCTCCTACTTCACTAACATGTTCGCC ACCTGGAGCCCCTCCAAGGCCAGGCTGCACTTG CAGGGACGGTCAAATGCCTGGCGGCCGCAAGTG AACAATCCGAAGGAATGGCTTCAAGTGGATTTCC AAAAGACCATGAAAGTGACCGGAGTCACCACCCA GGGAGTGAAGTCCCTTCTGACCTCGATGTATGTG AAGGAGTTCCTGATTAGCAGCAGCCAGGACGGG CACCAGTGGACCCTGTTCTTCCAAAACGGAAAGG TCAAGGTGTTCCAGGGGAACCAGGACTCGTTCAC ACCCGTGGTGAACTCCCTGGACCCCCCACTGCT GACGCGGTACTTGAGGATTCATCCTCAGTCCTGG GTCCATCAGATTGCATTGCGAATGGAAGTCCTGG
Descrição Sequência
GCTGCGAGGCCCAGGACCTGTACTGA WPRE (ele- TCATAATCAACCTCTGGATTACAAAATTTGTGAAA mento regula- GATTGACTGGTATTCTTAACTATGTTGCTCCTTTT dor pós- ACGCTATGTGGATACGCTGCTTTAATGCCTTTGTA transcricional TCATGCTATTGCTTCCCGTATGGCTTTCATTTTCT do vírus mu- CCTCCTTGTATAAATCCTGGTTGCTGTCTCTTTAT tado da hepa- GAGGAGTTGTGGCCCGTTGTCAGGCAACGTGGC tite de marmo- GTGGTGTGCACTGTGTTTGCTGACGCAACCCCCA ta) (SEQ ID CTGGTTGGGGCATTGCCACCACCTGTCAGCTCCT NO:120) TTCCGGGACTTTCGCTTTCCCCCTCCCTATTGCC
ACGGCGGAACTCATCGCCGCCTGCCTTGCCCGC TGCTGGACAGGGGCTCGGCTGTTGGGCACTGAC AATTCCGTGGTGTTGTCGGGGAAATCATCGTCCT TTCCTTGGCTGCTCGCCTGTGTTGCCACCTGGAT TCTGCGCGGGACGTCCTTCTGCTACGTCCCTTCG GCCCTCAATCCAGCGGACCTTCCTTCCCGCGGC CTGCTGCCGGCTCTGCGGCCTCTTCCGCGTCTT CGCCTTCGCCCTCAGACGAGTCGGATCTCCCTTT
GGGCCGCCTCCCCGCTG bGHpA (sinal CGACTGTGCCTTCTAGTTGCCAGCCATCTGTTGT de poliadeni- TTGCCCCTCCCCCGTGCCTTCCTTGACCCTGGAA lação do hor- GGTGCCACTCCCACTGTCCTTTCCTAATAAAATG mônio de AGGAAATTGCATCGCATTGTCTGAGTAGGTGTCA crescimento TTCTATTCTGGGGGGTGGGGTGGGGCAGGACAG bovino) (SEQ CAAGGGGGAGGATTGGGAAGACAATAGCAGGCA ID NO:122) TGCTGGGGA Repetição CACTTCCTGGCGCGCAAAATATCCTCTTGTCCTT terminal inver- GAGTCTCATTGGAGGGTTCGTTCGTTCGAACCAG tida 3' ITR CCAATCAGGGGAGGGGGAAGTGACGCAAGTTCC (SEQ ID NO: GGTCACATGCTTCCGGTGACGCACATCCGGTGA 188) CGTAGTTCCGGTCACGTGCTTCCTGTCACGTGTT
TCCGGTCACGTGACTTCCGGTCATGTGACTTCCG GTGACGTGTTTCCGGCTTAACTATTGGGCTGACC GCGCGGCATGCGCGTGGTCAACCTAACAGCCGG AAACACGTCACCGGAAGTCACATGACCGGAAGTC ACGTGACCGGAAACACGTGACAGGAAGCACGTG
Descrição Sequência
ACCGGAACTACGTCACCGGATGTGCGTCACCGG AAGCATGTGACCGGAACTTGCGTCACTTCCCCCT CCCCTGATTGGCTGGTTCGAACGAACGAACCCTC
CAATGAG Sequência de comprimento total (SEQ ID NO: 194)
CTCATTGGAGGGTTCGTTCGTTCGAACCAGCCAATCAGGGGAGG GGGAAGTGACGCAAGTTCCGGTCACATGCTTCCGGTGACGCAC ATCCGGTGACGTAGTTCCGGTCACGTGCTTCCTGTCACGTGTTT CCGGTCACGTGACTTCCGGTCATGTGACTTCCGGTGACGTGTTT CCGGCTGTTAGGTTGACCACGCGCATGCCGCGCGGTCAGCCCA ATAGTTAAGCCGGAAACACGTCACCGGAAGTCACATGACCGGAA GTCACGTGACCGGAAACACGTGACAGGAAGCACGTGACCGGAA CTACGTCACCGGATGTGCGTCACCGGAAGCATGTGACCGGAAC TTGCGTCACTTCCCCCTCCCCTGATTGGCTGGTTCGAACGAACG AACCCTCCAATGAGACTCAAGGACAAGAGGATATTTTGCGCGCC AGGAAGTGGCGGCAATTCAGTCGATAACTATAACGGTCCTAAGG TAGCGATTTAAATACGCGCTCTCTTAAGGTAGCCCCGGGACGCG TCAATTGAGATCTGGATCCGGTACCGAATTCGCGGCCGCCTCGA CGACTAGCGTTTAATTAAACGCGTGTCTGTCTGCACATTTCGTAG AGCGAGTGTTCCGATACTCTAATCTCCCTAGGCAAGGTTCATATT TGTGTAGGTTACTTATTCTCCTTTTGTTGACTAAGTCAATAATCAG AATCAGCAGGTTTGGAGTCAGCTTGGCAGGGATCAGCAGCCTG GGTTGGAAGGAGGGGGTATAAAAGCCCCTTCACCAGGAGAAGC CGTCACACAGATCCACAAGCTCCTGAGGTAAGTGCCGTGTGTGG TTCCCGCGGGCCTGGCCTCTTTACGGGTTATGGCCCTTGCGTGC CTTGAATTACTGACACTGACATCCACTTTTTCTTTTTCTCCACAGC TAGCGCCACCATGCAGATTGAGCTGTCCACTTGTTTCTTCCTGTG CCTCCTGCGCTTCTGTTTCTCCGCCACTCGCCGGTACTACCTTG GAGCCGTGGAGCTTTCATGGGACTACATGCAGAGCGACCTGGG CGAACTCCCCGTGGATGCCAGATTCCCCCCCCGCGTGCCAAAG TCCTTCCCCTTTAACACCTCCGTGGTGTACAAGAAAACCCTCTTT GTCGAGTTCACTGACCACCTGTTCAACATCGCCAAGCCGCGCCC ACCTTGGATGGGCCTCCTGGGACCGACCATTCAAGCTGAAGTGT ACGACACCGTGGTGATCACCCTGAAGAACATGGCGTCCCACCC CGTGTCCCTGCATGCGGTCGGAGTGTCCTACTGGAAGGCCTCC GAAGGAGCTGAGTACGACGACCAGACTAGCCAGCGGGAAAAGG
Descrição Sequência
AGGACGATAAAGTGTTCCCGGGCGGCTCGCATACTTACGTGTGG CAAGTCCTGAAGGAAAACGGACCTATGGCATCCGATCCTCTGTG CCTGACTTACTCCTACCTTTCCCATGTGGACCTCGTGAAGGACC TGAACAGCGGGCTGATTGGTGCACTTCTCGTGTGCCGCGAAGG TTCGCTCGCTAAGGAAAAGACCCAGACCCTCCATAAGTTCATCC TTTTGTTCGCTGTGTTCGATGAAGGAAAGTCATGGCATTCCGAAA CTAAGAACTCGCTGATGCAGGACCGGGATGCCGCCTCAGCCCG CGCCTGGCCTAAAATGCATACAGTCAACGGATACGTGAATCGGT CACTGCCCGGGCTCATCGGTTGTCACAGAAAGTCCGTGTACTGG CACGTCATCGGCATGGGCACTACGCCTGAAGTGCACTCCATCTT CCTGGAAGGGCACACCTTCCTCGTGCGCAACCACCGCCAGGCC TCTCTGGAAATCTCCCCGATTACCTTTCTGACCGCCCAGACTCTG CTCATGGACCTGGGGCAGTTCCTTCTCTTCTGCCACATCTCCAG CCATCAGCACGACGGAATGGAGGCCTACGTGAAGGTGGACTCA TGCCCGGAAGAACCTCAGTTGCGGATGAAGAACAACGAGGAGG CCGAGGACTATGACGACGATTTGACTGACTCCGAGATGGACGTC GTGCGGTTCGATGACGACAACAGCCCCAGCTTCATCCAGATTCG CAGCGTGGCCAAGAAGCACCCCAAAACCTGGGTGCACTACATC GCGGCCGAGGAAGAAGATTGGGACTACGCCCCGTTGGTGCTGG CACCCGATGACCGGTCGTACAAGTCCCAGTATCTGAACAATGGT CCGCAGCGGATTGGCAGAAAGTACAAGAAAGTGCGGTTCATGG CGTACACTGACGAAACGTTTAAGACCCGGGAGGCCATTCAACAT GAGAGCGGCATTCTGGGACCACTGCTGTACGGAGAGGTCGGCG ATACCCTGCTCATCATCTTCAAAAACCAGGCCTCCCGGCCTTACA ACATCTACCCTCACGGAATCACCGACGTGCGGCCACTCTACTCG CGGCGCCTGCCGAAGGGCGTCAAGCACCTGAAAGACTTCCCTA TCCTGCCGGGCGAAATCTTCAAGTATAAGTGGACCGTCACCGTG GAGGACGGGCCCACCAAGAGCGATCCTAGGTGTCTGACTCGGT ACTACTCCAGCTTCGTGAACATGGAACGGGACCTGGCATCGGGA CTCATTGGACCGCTGCTGATCTGCTACAAAGAGTCGGTGGATCA ACGCGGCAACCAGATCATGTCCGACAAGCGCAACGTGATCCTGT TCTCCGTGTTTGATGAAAACAGATCCTGGTACCTCACTGAAAACA TCCAGAGGTTCCTCCCAAACCCCGCAGGAGTGCAACTGGAGGA CCCTGAGTTTCAGGCCTCGAATATCATGCACTCGATTAACGGTTA CGTGTTCGACTCGCTGCAACTGAGCGTGTGCCTCCATGAAGTCG CTTACTGGTACATTCTGTCCATCGGCGCCCAGACTGACTTCCTG
Descrição Sequência
AGCGTGTTCTTTTCCGGTTACACCTTTAAGCACAAGATGGTGTAC GAAGATACCCTGACCCTGTTCCCTTTCTCCGGCGAAACGGTGTT CATGTCGATGGAGAACCCGGGTCTGTGGATTCTGGGATGCCACA ACAGCGACTTTCGGAACCGCGGAATGACTGCCCTGCTGAAGGT GTCCTCATGCGACAAGAACACCGGAGACTACTACGAGGACTCCT ACGAGGATATCTCAGCCTACCTCCTGTCCAAGAACAACGCGATC GAGCCGCGCAGCTTCAGCCAGAACGGCGCGCCAACATCAGAGA GCGCCACCCCTGAAAGTGGTCCCGGGAGCGAGCCAGCCACATC TGGGTCGGAAACGCCAGGCACAAGTGAGTCTGCAACTCCCGAG TCCGGACCTGGCTCCGAGCCTGCCACTAGCGGCTCCGAGACTC CGGGAACTTCCGAGAGCGCTACACCAGAAAGCGGACCCGGAAC CAGTACCGAACCTAGCGAGGGCTCTGCTCCGGGCAGCCCAGCC GGCTCTCCTACATCCACGGAGGAGGGCACTTCCGAATCCGCCA CCCCGGAGTCAGGGCCAGGATCTGAACCCGCTACCTCAGGCAG TGAGACGCCAGGAACGAGCGAGTCCGCTACACCGGAGAGTGGG CCAGGGAGCCCTGCTGGATCTCCTACGTCCACTGAGGAAGGGT CACCAGCGGGCTCGCCCACCAGCACTGAAGAAGGTGCCTCGAG CCCGCCTGTGCTGAAGAGGCACCAGCGAGAAATTACCCGGACC ACCCTCCAATCGGATCAGGAGGAAATCGACTACGACGACACCAT CTCGGTGGAAATGAAGAAGGAAGATTTCGATATCTACGACGAGG ACGAAAATCAGTCCCCTCGCTCATTCCAAAAGAAAACTAGACACT ACTTTATCGCCGCGGTGGAAAGACTGTGGGACTATGGAATGTCA TCCAGCCCTCACGTCCTTCGGAACCGGGCCCAGAGCGGATCGG TGCCTCAGTTCAAGAAAGTGGTGTTCCAGGAGTTCACCGACGGC AGCTTCACCCAGCCGCTGTACCGGGGAGAACTGAACGAACACC TGGGCCTGCTCGGTCCCTACATCCGCGCGGAAGTGGAGGATAA CATCATGGTGACCTTCCGTAACCAAGCATCCAGACCTTACTCCTT CTATTCCTCCCTGATCTCATACGAGGAGGACCAGCGCCAAGGCG CCGAGCCCCGCAAGAACTTCGTCAAGCCCAACGAGACTAAGAC CTACTTCTGGAAGGTCCAACACCATATGGCCCCGACCAAGGATG AGTTTGACTGCAAGGCCTGGGCCTACTTCTCCGACGTGGACCTT GAGAAGGATGTCCATTCCGGCCTGATCGGGCCGCTGCTCGTGT GTCACACCAACACCCTGAACCCAGCGCATGGACGCCAGGTCAC CGTCCAGGAGTTTGCTCTGTTCTTCACCATTTTTGACGAAACTAA GTCCTGGTACTTCACCGAGAATATGGAGCGAAACTGTAGAGCGC CCTGCAATATCCAGATGGAAGATCCGACTTTCAAGGAGAACTATA
Descrição Sequência
GATTCCACGCCATCAACGGGTACATCATGGATACTCTGCCGGGG CTGGTCATGGCCCAGGATCAGAGGATTCGGTGGTACTTGCTGTC AATGGGATCGAACGAAAACATTCACTCCATTCACTTCTCCGGTCA CGTGTTCACTGTGCGCAAGAAGGAGGAGTACAAGATGGCGCTG TACAATCTGTACCCCGGGGTGTTCGAAACTGTGGAGATGCTGCC GTCCAAGGCCGGCATCTGGAGAGTGGAGTGCCTGATCGGAGAG CACCTCCACGCGGGGATGTCCACCCTCTTCCTGGTGTACTCGAA TAAGTGCCAGACCCCGCTGGGCATGGCCTCGGGCCACATCAGA GACTTCCAGATCACAGCAAGCGGACAATACGGCCAATGGGCGC CGAAGCTGGCCCGCTTGCACTACTCCGGATCGATCAACGCATG GTCCACCAAGGAACCGTTCTCGTGGATTAAGGTGGACCTCCTGG CCCCTATGATTATCCACGGAATTAAGACCCAGGGCGCCAGGCAG AAGTTCTCCTCCCTGTACATCTCGCAATTCATCATCATGTACAGC CTGGACGGGAAGAAGTGGCAGACTTACAGGGGAAACTCCACCG GCACCCTGATGGTCTTTTTCGGCAACGTGGATTCCTCCGGCATT AAGCACAACATCTTCAACCCACCGATCATAGCCAGATATATTAGG CTCCACCCCACTCACTACTCAATCCGCTCAACTCTTCGGATGGA ACTCATGGGGTGCGACCTGAACTCCTGCTCCATGCCGTTGGGG ATGGAATCAAAGGCTATTAGCGACGCCCAGATCACCGCGAGCTC CTACTTCACTAACATGTTCGCCACCTGGAGCCCCTCCAAGGCCA GGCTGCACTTGCAGGGACGGTCAAATGCCTGGCGGCCGCAAGT GAACAATCCGAAGGAATGGCTTCAAGTGGATTTCCAAAAGACCA TGAAAGTGACCGGAGTCACCACCCAGGGAGTGAAGTCCCTTCTG ACCTCGATGTATGTGAAGGAGTTCCTGATTAGCAGCAGCCAGGA CGGGCACCAGTGGACCCTGTTCTTCCAAAACGGAAAGGTCAAG GTGTTCCAGGGGAACCAGGACTCGTTCACACCCGTGGTGAACTC CCTGGACCCCCCACTGCTGACGCGGTACTTGAGGATTCATCCTC AGTCCTGGGTCCATCAGATTGCATTGCGAATGGAAGTCCTGGGC TGCGAGGCCCAGGACCTGTACTGAATCAGCCTGAGCTCGCTGAT CATAATCAACCTCTGGATTACAAAATTTGTGAAAGATTGACTGGT ATTCTTAACTATGTTGCTCCTTTTACGCTATGTGGATACGCTGCTT TAATGCCTTTGTATCATGCTATTGCTTCCCGTATGGCTTTCATTTT CTCCTCCTTGTATAAATCCTGGTTGCTGTCTCTTTATGAGGAGTT GTGGCCCGTTGTCAGGCAACGTGGCGTGGTGTGCACTGTGTTT GCTGACGCAACCCCCACTGGTTGGGGCATTGCCACCACCTGTC AGCTCCTTTCCGGGACTTTCGCTTTCCCCCTCCCTATTGCCACG
Descrição Sequência
GCGGAACTCATCGCCGCCTGCCTTGCCCGCTGCTGGACAGGGG CTCGGCTGTTGGGCACTGACAATTCCGTGGTGTTGTCGGGGAAA TCATCGTCCTTTCCTTGGCTGCTCGCCTGTGTTGCCACCTGGATT CTGCGCGGGACGTCCTTCTGCTACGTCCCTTCGGCCCTCAATCC AGCGGACCTTCCTTCCCGCGGCCTGCTGCCGGCTCTGCGGCCT CTTCCGCGTCTTCGCCTTCGCCCTCAGACGAGTCGGATCTCCCT TTGGGCCGCCTCCCCGCTGATCAGCCTCGACTGTGCCTTCTAGT TGCCAGCCATCTGTTGTTTGCCCCTCCCCCGTGCCTTCCTTGAC CCTGGAAGGTGCCACTCCCACTGTCCTTTCCTAATAAAATGAGG AAATTGCATCGCATTGTCTGAGTAGGTGTCATTCTATTCTGGGGG GTGGGGTGGGGCAGGACAGCAAGGGGGAGGATTGGGAAGACA ATAGCAGGCATGCTGGGGATGCGGTGGGCTCTATGGCTTCTGA GGCGGAAAGAACGGGCTCGAGAAGCTTCTAGATATCCTCTCTTA AGGTAGCATCGAGATTTAAATTAGGGATAACAGGGTAATGGCGC GGGCCGCCACTTCCTGGCGCGCAAAATATCCTCTTGTCCTTGAG TCTCATTGGAGGGTTCGTTCGTTCGAACCAGCCAATCAGGGGAG GGGGAAGTGACGCAAGTTCCGGTCACATGCTTCCGGTGACGCA CATCCGGTGACGTAGTTCCGGTCACGTGCTTCCTGTCACGTGTT TCCGGTCACGTGACTTCCGGTCATGTGACTTCCGGTGACGTGTT TCCGGCTTAACTATTGGGCTGACCGCGCGGCATGCGCGTGGTC AACCTAACAGCCGGAAACACGTCACCGGAAGTCACATGACCGGA AGTCACGTGACCGGAAACACGTGACAGGAAGCACGTGACCGGA ACTACGTCACCGGATGTGCGTCACCGGAAGCATGTGACCGGAA CTTGCGTCACTTCCCCCTCCCCTGATTGGCTGGTTCGAACGAAC GAACCCTCCAATGAG
[00279] Em uma modalidade, o cassete genético compreende um construto de fenilalanina hidroxilase (PAH), que inclui uma sequência de polinucleotídeos listada nas Tabelas 10A e 10B. Em uma modali- dade, o cassete genético compreende um construto de PAH, que inclui uma sequência de polinucleotídeos listada na Tabela 10A. Em uma modalidade, o cassete genético compreende um construto de PAH, que inclui uma sequência de polinucleotídeos listada na Tabela 10B.
[00280] Em certas modalidades, a molécula de ácido nucleico iso- lada compreende uma sequência de nucleotídeos tendo pelo menos cerca de 60%, pelo menos cerca de 65%, pelo menos cerca de 70%, pelo menos cerca de 75%, pelo menos cerca de 80%, pelo menos cer- ca de 85%, pelo menos cerca de 90%, pelo menos cerca de 95%, pelo menos cerca de 96%, pelo menos cerca de 97%, pelo menos cerca de 98%, pelo menos cerca de 99%, ou cerca de 100% de identidade de sequência com a sequência de nucleotídeos de SEQ ID NO: 197 ou
198. Em algumas modalidades, a molécula de ácido nucleico isolada compreende uma sequência de nucleotídeos tendo pelo menos cerca de 60%, pelo menos cerca de 65%, pelo menos cerca de 70%, pelo menos cerca de 75%, pelo menos cerca de 80%, pelo menos cerca de 85%, pelo menos cerca de 90%, pelo menos cerca de 95%, pelo me- nos cerca de 96%, pelo menos cerca de 97%, pelo menos cerca de 98%, pelo menos cerca de 99%, ou cerca de 100% de identidade de sequência com a sequência de nucleotídeos de SEQ ID NO: 197. Em algumas modalidades, a molécula de ácido nucleico isolada compre- ende uma sequência de nucleotídeos tendo pelo menos cerca de 60%, pelo menos cerca de 65%, pelo menos cerca de 70%, pelo menos cer- ca de 75%, pelo menos cerca de 80%, pelo menos cerca de 85%, pelo menos cerca de 90%, pelo menos cerca de 95%, pelo menos cerca de 96%, pelo menos cerca de 97%, pelo menos cerca de 98%, pelo me- nos cerca de 99%, ou cerca de 100% de identidade de sequência com a sequência de nucleotídeos de SEQ ID NO: 198. Em algumas moda- lidades, a molécula de ácido nucleico isolada conserva a capacidade de expressar uma fenilalanina hidroxilase funcional. A. Índice de Adaptação do Códon
[00281] Em uma modalidade, o cassete genético compreende uma sequência de nucleotídeos códon-otimizada codificando um polipeptí- dio FVIII, onde o índice de adaptação do códon humano da sequência de nucleotídeos códon-otimizada é mais alto em relação à SEQ ID NO:
16. Por exemplo, a sequência de nucleotídeos códon-otimizada pode ser um índice de adaptação do códon humano que é pelo menos cerca de 0,75 (75%), pelo menos cerca de 0,76 (76%), pelo menos cerca de 0,77 (77%), pelo menos cerca de 0,78 (78%), pelo menos cerca de 0,79 (79%), pelo menos cerca de 0,80 (80%), pelo menos cerca de 0,81 (81%), pelo menos cerca de 0,82 (82%), pelo menos cerca de 0,83 (83%), pelo menos cerca de 0,84 (84%), pelo menos cerca de 0,85 (85%), pelo menos cerca de 0,86 (86%), pelo menos cerca de 0,87 (87%), pelo menos cerca de 0,88 (88%), pelo menos cerca de 0,89 (89%), pelo menos cerca de 0,90 (90%), pelo menos cerca de 0,91 (91%), pelo menos cerca de 0,92 (92%), pelo menos cerca de 0,93 (93%), pelo menos cerca de 0,94 (94%), pelo menos cerca de 0,95 (95%), pelo menos cerca de 0,96 (96%), pelo menos cerca de 0,97 (97%), pelo menos cerca de 0.98 (98%), ou pelo menos cerca de
0.99 (99%). Em algumas modalidades, a sequência de nucleotídeos códon-otimizada em um índice de adaptação do códon humano que é pelo menos cerca de 0,88 (88%). Em outras modalidades, a sequência de nucleotídeos códon-otimizada em um índice de adaptação do có- don humano que é pelo menos cerca de 0,91 (91%). Em outras moda- lidades, a sequência de nucleotídeos códon-otimizada em um índice de adaptação do códon humano que é pelo menos cerca de 0,91 (97%).
[00282] Em uma modalidade particular, a sequência de nucleotí- deos códon-otimizada em um índice de adaptação do códon humano codificando um polipeptídio FVIII compreende uma sequência de nu- cleotídeos que compreende uma primeira sequência de nucleotídeos codificando uma porção N-terminal de um polipeptídio FVIII e uma se- gunda sequência de nucleotídeos codificando uma porção C-terminal de um polipeptídio FVIII; onde a primeira sequência de nucleotídeos tem pelo menos cerca de 80%, pelo menos cerca de 85%, pelo menos cerca de 86%, pelo menos cerca de 87%, pelo menos cerca de 88%,
pelo menos cerca de 89%, pelo menos cerca de 90%, pelo menos cer- ca de 91%, pelo menos cerca de 92%, pelo menos cerca de 93%, pelo menos cerca de 94%, pelo menos cerca de 95%, pelo menos cerca de 96%, pelo menos cerca de 97%, pelo menos cerca de 98%, ou pelo menos cerca de 99% de identidade de sequência com os (i) nucleotí- deos 58-1791 da SEQ ID NO: 3; (ii) nucleotídeos 1-1791 da SEQ ID NO: 3; (iii) nucleotídeos 58-1791 da SEQ ID NO: 4; ou (iv) nucleotí- deos 1-1791 da SEQ ID NO: 4; onde a porção N-terminal e a porção C-terminal juntas tem uma atividade de polipeptídio FVIII; e onde o ín- dice de adaptação do códon humano da sequência de nucleotídeos é mais alto em relação à SEQ ID NO: 16. Em algumas modalidades, a sequência de nucleotídeos tem um índice de adaptação do códon hu- mano que é pelo menos cerca de 0,75 (75%), pelo menos cerca de 0,76 (76%), pelo menos cerca de 0,77 (77%), pelo menos cerca de 0,78 (78%), pelo menos cerca de 0,79 (79%), pelo menos cerca de 0,80 (80%), pelo menos cerca de 0,81 (81%), pelo menos cerca de 0,82 (82%), pelo menos cerca de 0,83 (83%), pelo menos cerca de 0,84 (84%), pelo menos cerca de 0,85 (85%), pelo menos cerca de 0,86 (86%), pelo menos cerca de 0,87 (87%), pelo menos cerca de 0,88 (88%), pelo menos cerca de 0,89 (89%), pelo menos cerca de 0,90 (90%), ou pelo menos cerca de 0,91 (91%), Em uma modalidade particular, a sequência de nucleotídeos tem um índice de adaptação do códon humano que é pelo menos cerca de 0,88 (88%). Em uma outra modalidade, a sequência de nucleotídeos tem um índice de adaptação do códon humano que é pelo menos cerca de 0,91 (91%).
[00283] Em uma outra modalidade, a sequência de nucleotídeos códon-otimizada codificando um polipeptídio FVIII compreende uma sequência de nucleotídeos que compreende uma primeira sequência de ácidos nucleicos codificando uma porção N-terminal de um polipep- tídio FVIII e uma segunda sequência de ácidos nucleicos codificando uma porção C-terminal de um polipeptídio FVIII; onde a segunda se- quência de ácidos nucleicos tem pelo menos cerca de 80%, pelo me- nos cerca de 85%, pelo menos cerca de 86%, pelo menos cerca de 87%, pelo menos cerca de 88%, pelo menos cerca de 89%, pelo me- nos cerca de 90%, pelo menos cerca de 91%, pelo menos cerca de 92%, pelo menos cerca de 93%, pelo menos cerca de 94%, pelo me- nos cerca de 95%, pelo menos cerca de 96%, pelo menos cerca de 97%, pelo menos cerca de 98%, ou pelo menos cerca de 99% de iden- tidade de sequência com os (i) nucleotídeos 1792-2277 e 2320-4374 da SEQ ID NO: 5 ou (ii) 1792-2277 e 2320-4374 da SEQ ID NO: 6; on- de a porção N-terminal e a porção C-terminal juntas têm uma atividade de polipeptídio FVIII; e onde o índice de adaptação do códon humano da sequência de nucleotídeos é mais alto em relação à SEQ ID NO:
16. Em algumas modalidades, a sequência de nucleotídeos tem um índice de adaptação do códon humano que é pelo menos cerca de 0,75 (75%), pelo menos cerca de 0,76 (76%), pelo menos cerca de 0,77 (77%), pelo menos cerca de 0,78 (78%), pelo menos cerca de 0,79 (79%), pelo menos cerca de 0,80 (80%), pelo menos cerca de 0,81 (81%), pelo menos cerca de 0,82 (82%), pelo menos cerca de 0,83 (83%), pelo menos cerca de 0,84 (84%), pelo menos cerca de 0,85 (85%), pelo menos cerca de 0,86 (86%), pelo menos cerca de 0,87 (87%), ou pelo menos cerca de 0,88 (88%). Em uma modalidade particular, a sequência de nucleotídeos tem um índice de adaptação do códon humano que é pelo menos cerca de 0,83 (83%). Em uma outra modalidade, a sequência de nucleotídeos tem um índice de adaptação do códon humano que é pelo menos cerca de 0,88 (88%).
[00284] Em outras modalidades, a sequência de nucleotídeos có- don-otimizada codificando um polipeptídio FVIII compreende uma se- quência de nucleotídeos codificando um polipeptídio com atividade e FVIII, onde a sequência de nucleotídeos compreende uma sequência de ácidos nucleicos tendo pelo menos cerca de 80%, pelo menos cer- ca de 85%, pelo menos cerca de 89%, pelo menos cerca de 90%, pelo menos cerca de 91%, pelo menos cerca de 92%, pelo menos cerca de 93%, pelo menos cerca de 94%, pelo menos cerca de 95%, pelo me- nos cerca de 96%, pelo menos cerca de 97%, pelo menos cerca de 98%, ou pelo menos cerca de 99% de identidade de sequência com os nucleotídeos 58-2277 de 2320-4374 de uma sequência de aminoáci- dos selecionada dentre as SEQ ID NOs: 1, 2, 3, 4, 5, 6, 70, e 71 (i.e., os nucleotídeos 58-4374 da SEQ ID NO: 1, 2, 3, 4, 5, 6, 70, ou 71 sem os nucleotídeos codificando o domínio B ou um fragmento do domínio B); e onde o índice de adaptação do códon humano da sequência de nucleotídeos é increased em relação à SEQ ID NO: 16. Em algumas modalidades, a sequência de nucleotídeos tem um índice de adapta- ção do códon humano que é pelo menos cerca de 0,75 (75%), pelo menos cerca de 0,76 (76%), pelo menos cerca de 0,77 (77%), pelo menos cerca de 0,78 (78%), pelo menos cerca de 0,79 (79%), pelo menos cerca de 0,80 (80%), pelo menos cerca de 0,81 (81%), pelo menos cerca de 0,82 (82%), pelo menos cerca de 0,83 (83%), pelo menos cerca de 0,84 (84%), pelo menos cerca de 0,85 (85%), pelo menos cerca de 0,86 (86%), pelo menos cerca de 0,87 (87%), ou pelo menos cerca de 0,88 (88%). Em uma modalidade particular, a sequên- cia de nucleotídeos tem um índice de adaptação do códon humano que é pelo menos cerca de 0,75 (75%). Em uma outra modalidade, a sequência de nucleotídeos tem um índice de adaptação do códon hu- mano que é pelo menos cerca de 0,83 (83%). Em uma outra modali- dade, a sequência de nucleotídeos tem um índice de adaptação do códon humano que é pelo menos cerca de 0.88 (88%). Em uma outra modalidade, a sequência de nucleotídeos tem um índice de adaptação do códon humano que é pelo menos cerca de 0.91 (91%). Em uma outra modalidade, a sequência de nucleotídeos tem um índice de adaptação do códon humano que é pelo menos cerca de 0.97 (97%).
[00285] Em algumas modalidades, a sequência de nucleotídeos có- don-otimizada codificando um polipeptídio FVIII da presente invenção tem uma frequência mais alta de códons ótimos (FOP) em relação à sequência SEQ ID NO: 16. Em certas modalidades, a FOP da sequên- cia de nucleotídeos códon-otimizada codificando um polipeptídio FVIII é pelo menos cerca de 40, pelo menos cerca de 45, pelo menos cerca de 50, pelo menos cerca de 55, pelo menos cerca de 60, pelo menos cerca de 64, pelo menos cerca de 65, pelo menos cerca de 70, pelo menos cerca de 75, pelo menos cerca de 79, pelo menos cerca de 80, pelo menos cerca de 85, ou pelo menos cerca de 90.
[00286] Em outras modalidades, a sequência de nucleotídeos có- don-otimizada codificando um polipeptídio FVIII da presente invenção tem uma utilização relativa de códons sinônimos (RCSU) mais alta em relação à SEQ ID NO: 16. Em algumas modalidades, a RCSU da mo- lécula de ácido nucleico isolada é maior que 1,5. Em outras modalida- des, a RCSU da molécula de ácido nucleico isolada é maior que 2,0. Em certas modalidades, a RCSU da molécula de ácido nucleico isola- da é pelo menos cerca de 1,5, pelo menos cerca de 1,6, pelo menos cerca de 1,7, pelo menos cerca de 1,8, pelo menos cerca de 1,9, pelo menos cerca de 2,0, pelo menos cerca de 2,1, pelo menos cerca de 2,2, pelo menos cerca de 2,3, pelo menos cerca de 2,4, pelo menos cerca de 2,5, pelo menos cerca de 2,6, ou pelo menos cerca de 2,7.
[00287] Em ainda outras modalidades, a sequência de nucleotídeos códon-otimizada codificando um polipeptídio FVIII da presente inven- ção tem um número efetivo reduzido de códons em relação à SEQ ID NO: 16. Em algumas modalidades, a sequência de nucleotídeos có- don-otimizada codificando um polipeptídio FVIII tem um número efetivo de códons inferior a cerca de 50, inferior a cerca de 45, inferior a cerca de 40, inferior a cerca de 35, inferior a cerca de 30, ou inferior a cerca de 25. Em uma modalidade particular, a molécula de ácido nucleico isolada tem um número efetivo de códons de cerca de 40, cerca de 35, cerca de 30, cerca de 25, ou cerca de 20. B. Otimização do Teor de G/C
[00288] Em algumas modalidades, o cassete genético compreende uma sequência de nucleotídeos códon-otimizada codificando um poli- peptídio FVIII, onde a sequência de nucleotídeos códon-otimizada con- tém uma percentagem mais alta dos nucleotídeos G/C em relação à percentagem dos nucleotídeos G/C na SEQ ID NO: 16. Em outras mo- dalidades, a sequência de nucleotídeos códon-otimizada codificando um polipeptídio FVIII tem um teor de G/C que é pelo menos cerca de 45%, pelo menos cerca de 46%, pelo menos cerca de 47%, pelo me- nos cerca de 48%, pelo menos cerca de 49%, pelo menos cerca de 50%, pelo menos cerca de 51%, pelo menos cerca de 52%, pelo me- nos cerca de 53%, pelo menos cerca de 54%, pelo menos cerca de 55%, pelo menos cerca de 56%, pelo menos cerca de 57%, pelo me- nos cerca de 58%, pelo menos cerca de 59%, ou pelo menos cerca de 60%.
[00289] Em uma modalidade particular, a sequência de nucleotí- deos códon-otimizada codificando um polipeptídio FVIII compreende uma primeira sequência de ácidos nucleicos codificando uma porção N-terminal de um polipeptídio FVIII e uma segunda sequência de áci- dos nucleicos codificando uma porção C-terminal de um polipeptídio FVIII; onde a primeira sequência de ácidos nucleicos tem pelo menos cerca de 80%, pelo menos cerca de 85%, pelo menos cerca de 86%, pelo menos cerca de 87%, pelo menos cerca de 88%, pelo menos cer- ca de 89%, pelo menos cerca de 90%, pelo menos cerca de 91%, pelo menos cerca de 92%, pelo menos cerca de 93%, pelo menos cerca de 94%, pelo menos cerca de 95%, pelo menos cerca de 96%, pelo me- nos cerca de 97%, pelo menos cerca de 98%, ou pelo menos cerca de
99% de identidade de sequência com os (i) nucleotídeos 58-1791 da SEQ ID NO: 3; (ii) nucleotídeos 1-1791 da SEQ ID NO: 3; (iii) nucleotí- deos 58-1791 da SEQ ID NO: 4; ou (iv) nucleotídeos 1-1791 da SEQ ID NO: 4; onde a porção N-terminal e a porção C-terminal juntas têm uma atividade de polipeptídio FVIII; e onde a sequência de nucleotí- deos contém uma percentagem mais alta dos nucleotídeos G/C em relação à percentagem dos nucleotídeos G/C na SEQ ID NO: 16. Em algumas modalidades, a sequência de nucleotídeos códon-otimizada codificando um polipeptídio FVIII compreende tem um teor de G/C que é pelo menos cerca de 45%, pelo menos cerca de 46%, pelo menos cerca de 47%, pelo menos cerca de 48%, pelo menos cerca de 49%, pelo menos cerca de 50%, pelo menos cerca de 51%, pelo menos cer- ca de 52%, pelo menos cerca de 53%, pelo menos cerca de 54%, pelo menos cerca de 55%, pelo menos cerca de 56%, pelo menos cerca de 57%, ou pelo menos cerca de 58%. Em uma modalidade particular, a sequência de nucleotídeos que codifica um polipeptídio com atividade de FVIII tem um teor de G/C que é pelo menos cerca de 58%.
[00290] Em uma outra modalidade, a sequência de nucleotídeos códon-otimizada codificando um polipeptídio FVIII compreende uma primeira sequência de ácidos nucleicos codificando uma porção N- terminal de um polipeptídio FVIII e uma segunda sequência de ácidos nucleicos codificando uma porção C-terminal de um polipeptídio FVIII; onde a segunda sequência de ácidos nucleicos tem pelo menos cerca de 80%, pelo menos cerca de 85%, pelo menos cerca de 86%, pelo menos cerca de 87%, pelo menos cerca de 88%, pelo menos cerca de 89%, pelo menos cerca de 90%, pelo menos cerca de 91%, pelo me- nos cerca de 92%, pelo menos cerca de 93%, pelo menos cerca de 94%, pelo menos cerca de 95%, pelo menos cerca de 96%, pelo me- nos cerca de 97%, pelo menos cerca de 98%, ou pelo menos cerca de 99% de identidade de sequência com os (i) nucleotídeos 1792-4374 da
SEQ ID NO: 5; (ii) nucleotídeos 1792-4374 da SEQ ID NO: 6; (iii) nu- cleotídeos 1792-2277 e 2320-4374 da SEQ ID NO: 5 (i.e., nucleotí- deos 1792-4374 da SEQ ID NO: 5 sem os nucleotídeos codificando o domínio B ou um fragmento do domínio B), ou (iv) 1792-2277 e 2320- 4374 da SEQ ID NO: 6 (i.e., nucleotídeos 1792-4374 da SEQ ID NO: 6 sem os nucleotídeos codificando o domínio B ou um fragmento do do- mínio B); onde a porção N-terminal e a porção C-terminal juntas têm uma atividade de polipeptídio FVIII; e onde a sequência de nucleotí- deos códon-otimizada contém uma percentagem mais alta dos nucleo- tídeos G/C em relação à percentagem dos nucleotídeos G/C na SEQ ID NO: 16. Em outras modalidades, a sequência de nucleotídeos có- don-otimizada codificando um polipeptídio FVIII tem um teor de G/C que é pelo menos cerca de 45%, pelo menos cerca de 46%, pelo me- nos cerca de 47%, pelo menos cerca de 48%, pelo menos cerca de 49%, pelo menos cerca de 50%, pelo menos cerca de 51%, pelo me- nos cerca de 52%, pelo menos cerca de 53%, pelo menos cerca de 54%, pelo menos cerca de 55%, pelo menos cerca de 56%, ou pelo menos cerca de 57%. Em uma modalidade particular, a sequência de nucleotídeos códon-otimizada codificando um polipeptídio FVIII tem um teor de G/C que é pelo menos cerca de 52%. Em uma outra moda- lidade, a sequência de nucleotídeos códon-otimizada codificando um polipeptídio FVIII tem um teor de G/C que é pelo menos cerca de 55%. Em uma outra modalidade, a sequência de nucleotídeos códon- otimizada codificando um polipeptídio FVIII tem um teor de G/C que é pelo menos cerca de 57%.
[00291] Em outras modalidades, o cassete genético compreende uma sequência de nucleotídeos códon-otimizada codificando um poli- peptídio FVIII, onde a sequência de nucleotídeos códon-otimizada compreende uma sequência de ácidos nucleicos tendo pelo menos cerca de 80%, pelo menos cerca de 85%, pelo menos cerca de 89%,
pelo menos cerca de 90%, pelo menos cerca de 91%, pelo menos cer- ca de 92%, pelo menos cerca de 93%, pelo menos cerca de 94%, pelo menos cerca de 95%, pelo menos cerca de 96%, pelo menos cerca de 97%, pelo menos cerca de 98%, ou pelo menos cerca de 99% de iden- tidade de sequência com os (i) nucleotídeos 58-4374 ou (ii) nucleotí- deos 58-2277 e 2320-4374 de uma sequência de aminoácidos seleci- onada dentre as SEQ ID NOs: 1, 2, 3, 4, 5, 6, 70, e 71 (i.e., nucleotí- deos 58-4374 da SEQ ID NO: 1, 2, 3, 4, 5, 6, 70, ou 71 sem os nucleo- tídeos codificando o domínio B ou um fragmento do domínio B); e on- de a sequência de nucleotídeos contém uma percentagem mais alta dos nucleotídeos G/C em relação à percentagem dos nucleotídeos G/C na SEQ ID NO: 16. Em outras modalidades, a sequência de nu- cleotídeos códon-otimizada codificando um polipeptídio FVIII tem um teor de G/C que é pelo menos cerca de 45%. Em uma modalidade par- ticular, a sequência de nucleotídeos códon-otimizada codificando um polipeptídio FVIII tem um teor de G/C que é pelo menos cerca de 52%. Em uma outra modalidade, a sequência de nucleotídeos códon- otimizada codificando um polipeptídio FVIII tem um teor de G/C que é pelo menos cerca de 55%. Em uma outra modalidade, a sequência de nucleotídeos códon-otimizada codificando um polipeptídio FVIII tem um teor de G/C que é pelo menos cerca de 57%. Em uma outra moda- lidade, a sequência de nucleotídeos códon-otimizada codificando um polipeptídio FVIII tem um teor de G/C que é pelo menos cerca de 58%. Em ainda uma outra modalidade, a sequência de nucleotídeos n có- dons-otimizada codificando um polipeptídio FVIII tem um teor de G/C que é pelo menos cerca de 60%.
[00292] "Teor de G/C" (ou teor de guanina-citosina), ou "percenta- gem de nucleotídeos G/C", refere-se à percentagem de bases nitroge- nodas em uma molécula de DNA que são ou guanina ou citosina. O teor de G/C pode ser calculado pela seguinte fórmula:
(III)
[00293] Os genes humanos são bastante heterogêneos em seu teor de G/C, com alguns genes tendo um teor de G/C tão baixo quanto 20%, e outros genes tendo um teor de G/C tão alto quanto 95%. Ge- ralmente, os genes ricos em G/C rich são mais altamente expressos. Na verdade, já foi demonstrado que o aumento do teor de G/C de um gene pode levar à maior expressão do gene, devido principalmente a um aumento na transcrição e níveis mais de mRNA no estado estacio- nário. Vide Kudla et al., PLoS Biol., 4(6): e180 (2006). C. Sequências Semelhantes à Região de Ligação da Matriz
[00294] Em algumas modalidades, o cassete genético compreende uma sequência de nucleotídeos códon-otimizada codificando um poli- peptídio FVIII, onde a sequência de nucleotídeos códon-otimizada con- tém menos sequências de MARS/ARS em relação à SEQ ID NO: 16. Em outras modalidades, a sequência de nucleotídeos códon-otimizada codificando um polipeptídio FVIII contém no máximo 6, no máximo 5, no máximo 4, no máximo 3, ou no máximo 2 sequências de MARS/ARS. Em outras modalidades, a sequência de nucleotídeos có- don-otimizada codificando um polipeptídio FVIII contém no máximo 1 sequência de MARS/ARS. Em ainda outras modalidades, a sequência de nucleotídeos códon-otimizada codificando um polipeptídio FVIII não contém uma sequência de MARS/ARS.
[00295] Em uma modalidade particular, a sequência de nucleotí- deos códon-otimizada codificando um polipeptídio FVIII compreende uma primeira sequência de ácidos nucleicos codificando uma porção N-terminal de um polipeptídio FVIII e uma segunda sequência de áci- dos nucleicos codificando uma porção C-terminal de um polipeptídio FVIII; onde a primeira sequência de ácidos nucleicos tem pelo menos cerca de 80%, pelo menos cerca de 85%, pelo menos cerca de 86%,
pelo menos cerca de 87%, pelo menos cerca de 88%, pelo menos cer- ca de 89%, pelo menos cerca de 90%, pelo menos cerca de 91%, pelo menos cerca de 92%, pelo menos cerca de 93%, pelo menos cerca de 94%, pelo menos cerca de 95%, pelo menos cerca de 96%, pelo me- nos cerca de 97%, pelo menos cerca de 98%, ou pelo menos cerca de 99% de identidade de sequência com os (i) nucleotídeos 58-1791 da SEQ ID NO: 3; (ii) nucleotídeos 1-1791 da SEQ ID NO: 3; (iii) nucleotí- deos 58-1791 da SEQ ID NO: 4; ou (iv) nucleotídeos 1-1791 da SEQ ID NO: 4; onde a porção N-terminal e a porção C-terminal juntas têm uma atividade de polipeptídio FVIII; e onde a sequência de nucleotí- deos códon-otimizada contém menos sequências de MARS/ARS em relação à SEQ ID NO: 16. Em outras modalidades, a sequência de nu- cleotídeos que codifica um polipeptídio com atividade de FVIII contém no máximo 6, no máximo 5, no máximo 4, no máximo 3, ou no máximo 2 sequências de MARS/ARS. Em outras modalidades, a sequência de nucleotídeos códon-otimizada codificando um polipeptídio FVIII con- tém no máximo 1 sequência de MARS/ARS. Em ainda outras modali- dades, a sequência de nucleotídeos códon-otimizada codificando um polipeptídio FVIII não contém uma sequência de MARS/ARS.
[00296] Em uma outra modalidade, a sequência de nucleotídeos códon-otimizada codificando um polipeptídio FVIII compreende uma primeira sequência de ácidos nucleicos codificando uma porção N- terminal de um polipeptídio FVIII e uma segunda sequência de ácidos nucleicos codificando uma porção C-terminal de um polipeptídio FVIII; onde a segunda sequência de ácidos nucleicos tem pelo menos cerca de 80%, pelo menos cerca de 85%, pelo menos cerca de 86%, pelo menos cerca de 87%, pelo menos cerca de 88%, pelo menos cerca de 89%, pelo menos cerca de 90%, pelo menos cerca de 91%, pelo me- nos cerca de 92%, pelo menos cerca de 93%, pelo menos cerca de 94%, pelo menos cerca de 95%, pelo menos cerca de 96%, pelo me-
nos cerca de 97%, pelo menos cerca de 98%, ou pelo menos cerca de 99% de identidade de sequência com os (i) nucleotídeos 1792-4374 da SEQ ID NO: 5; (ii) nucleotídeos 1792-4374 da SEQ ID NO: 6; (iii) nu- cleotídeos 1792-2277 e 2320-4374 da SEQ ID NO: 5 (i.e., nucleotí- deos 1792-4374 da SEQ ID NO: 5 sem os nucleotídeos codificando o domínio B ou um fragmento do domínio B); ou (iv) nucleotídeos 1792- 2277 e 2320-4374 da SEQ ID NO: 6 (i.e., nucleotídeos 1792-4374 da SEQ ID NO: 6 sem os nucleotídeos codificando o domínio B ou um fragmento do domínio B); onde a porção N-terminal e a porção C- terminal juntas têm uma atividade de polipeptídio FVIII; e onde a se- quência de nucleotídeos contém menos sequências de MARS/ARS em relação à SEQ ID NO: 16. Em outras modalidades, a sequência de nu- cleotídeos códon-otimizada codificando um polipeptídio FVIII contém no máximo 6, no máximo 5, no máximo 4, no máximo 3, ou no máximo 2 seqwuências de MARS/ARS. Em outras modalidades, a sequência de nucleotídeos códon-otimizada codificando um polipeptídio FVIII contém no máximo 1 sequência de MARS/ARS. Em ainda outras mo- dalidades, a sequência de nucleotídeos códon-otimizada codificando um polipeptídio FVIII não contém uma sequência de MARS/ARS.
[00297] Em outras modalidades, o cassete genético compreende uma sequência de nucleotídeos códon-otimizada codificando um poli- peptídio FVIII, onde a sequência de nucleotídeos códon-otimizada compreende uma sequência de ácidos nucleicos tendo pelo menos cerca de 80%, pelo menos cerca de 85%, pelo menos cerca de 89%, pelo menos cerca de 90%, pelo menos cerca de 91%, pelo menos cer- ca de 92%, pelo menos cerca de 93%, pelo menos cerca de 94%, pelo menos cerca de 95%, pelo menos cerca de 96%, pelo menos cerca de 97%, pelo menos cerca de 98%, ou pelo menos cerca de 99% de iden- tidade de sequência com os (i) nucleotídeos 58-4374 da SEQ ID NOs: 1, 2, 3, 4, 5, 6, 70, ou 71 ou (ii) nucleotídeos 58-2277 e 2320-4374 da
SEQ ID NOs: 1, 2, 3, 4, 5, 6, 70, ou 71 (i.e., nucleotídeos 58-4374 da SEQ ID NO: 1, 2, 3, 4, 5, 6, 70, ou 71 sem os nucleotídeos codificando o domínio B ou um fragmento do domínio B); e onde a sequência de nucleotídeos códon-otimizada contém menos sequências de MARS/ARS em relação à SEQ ID NO: 16. Em outras modalidades, a sequência de nucleotídeos códon-otimizada codificando um polipeptí- dio FVIII contém no máximo 6, no máximo 5, no máximo 4, no máximo 3, ou no máximo 2 sequências de MARS/ARS. Em outras modalida- des, a sequência de nucleotídeos códon-otimizada codificando um po- lipeptídio FVIII contém no máximo 1 sequência de MARS/ARS. Em ainda outras modalidades, a sequência de nucleotídeos códon- otimizada codificando um polipeptídio FVIII não contém uma sequên- cia de MARS/ARS.
[00298] Os elementos ricos em AT na sequência de nucleotídeos do FVIII humano que compartilham similaridade de sequência com se- quências de replicação autônoma (ARSs) de Saccharomyces cerevisi- ae e regiões de ligação da matriz nuclear (MARs) já foram identifica- dos. (Fallux et al., Mol. Cell. Biol. 16:4264-4272 (1996). Foi demons- trado que um desses elementos se liga a fatores nucleares in vitro e reprimem a expressão de um gene repórter de cloranfenicol acetil- transferase (CAT). Id. Já foi demonstrado que essas sequências po- dem contribuir para a repressão transcricional do gene de FVIII huma- no. Assim sendo, em uma modalidade, todas as sequências de MAR/ARS estão suprimidas na sequência de nucleotídeos códon- otimizada codificando um polipeptídio FVIII da presente invenção. Existem quatro sequências de MAR/ARS ATATTT (SEQ ID NO: 21) e três sequências de MAR/ARS AAATAT (SEQ ID NO: 22) na sequência do FVIII parental (SEQ ID NO: 16). Todos estes sitios foram mutados para destruir as sequências de MAR/ARS nas sequências otimizadas do FVIII (SEQ ID NOs: 1-6). A localização de cada um desses elemen-
tos, e a sequência dos nucleotídeos correspondentes nas sequências otimizadas estão mostrados na Tabela 3, abaixo. Tabela 3: Resumo das Alterações Feitas nos Elementos Repressivos Locali- Sequência Sequência otimizada do BDD FVIII zação inicial do SEQ ID SEQ ID SEQ ID SEQ ID SEQ ID SEQ ID SEQ ID SEQ ID do Ele- BDD FVIII NO: 1 NO: 2 NO: 3 NO: 4 NO: 5 NO: 6 NO: 70 NO: 71 mento (SEQ ID NO: 16) Sequências Desestabilizantes 639 ATTTA GTTTA GTTCA GTTCA GTTCA GTTCA GTTCA GTTCA GTTCA 1338 ATTTA GTTTA GTTCA CTTCA GTTCA GTTCA GTTCA CTTCA GTTCA 1449 ATTTA CTTTA CTTCA CTTCA CTTCA CTTCA CTTCA CTTCA CTTCA 1590 TAAAT TAAAT CAAGT CAAGT TAAGT CAAGT CAAGT CAAGT TAAGT 1623 TAAAT CAAAA GAAGA CTAAG CAAGA CAAGA CAAGA TAAGT CAAGA 2410 ATTTA ATCTA ATCTA ATCTA ATCTA ATCTA ATCTA ATCTA ATCTA 2586 ATTTA GTTTA GTTCA GTTCA GTTCA GTTCA GTTCA GTTCA GTTCA 2630 TAAAT TGAAT TGAAC TGAAC TGAAC TCAAT TGAAC TCAAT TGAAC 3884 ATTTA ATCTG ACCTG ACCTG ACCTG ATCTG ACCTG ATCTG ACCTG 3887 TAAAT TGAAC TGAAC TGAAC TGAAC TGAAC TGAAC TGAAC TGAAC Potenciais Sítios Promotores de Ligação 641 TTATA TTATC TCATC TCATT TCATC TCATC TCATC TCATT TCATC 1275 TATAA CTATA TTACA CTACA GTACA CTACA CTACA CTACA GTACA 1276 TTATA TATAA TACAA TACAA TACAA TACAA TACAA TACAA TACAA 1445 TTATA TCATC TCATC TTATC TCATC TCATC TCATC TTATC TCATC 1474 TATAA TATAA TACAA TACAA TACAA TACAA TACAA TACAA TACAA 1588 TATAA TATAA TACAA TACAA TATAA TACAA TACAA TACAA TATAA 2614 TTATA CTGTA CTGTA CTGTA CTGTA TTGTA CTGTA TTGTA CTGTA 2661 TATAA CATCA CATCA CATCA CATCA CATCA CATCC CATCA CATCC 3286 TATAA TATAA TACAA TACAA TACAA TACAA TACAA TACAA TACAA 3840 TTATA TTATA TTACT CTACA CTACA CTACA CTACT CTACA CTACT Sequências Semelhantes à Ligação de Matrizes (MARS/ARS) 1287 ATATTT GTATCT GTACCT GTACCT GTATCT GTACCT GTACCT GTACCT GTATCT 1447 ATATTT ATCTTT ATCTTC ATCTTC ATCTTC ATCTTC ATCTTC ATCTTC ATCTTC 1577 AAATAT AAATCT AGATCT AAATCT AAATCT AGATCT AGATCT AAATCT AAATCT 1585 AAATAT AAGTAT AAGTAC AAGTAC AAGTAT AAGTAC AAGTAC AAGTAC AAGTAT 2231 ATATTT ACATCA ATATCA ACATCA ACATCA ACATCT ATATCT ACATCT ATATCT 3054 AAATAT AAACAT GAATAT GAACAT GAACAT GAACAT GAATAT GAACAT GAATAT 3788 ATATTT ATATCT ATATCT ACATCT ACATCT ACATCT ACATCT ACATCT ACATCT Elementos de Sequência Ricos em AU (AREs) 2468 ATTTTATT ACTTCA ACTTCA ACTTCA ACTTCA ACTTTA ACTTTA ACTTTA ACTTTA
TC TC TT TT TT TC TT TC 3790 ATTTTTAA ATCTTT ATCTTC ATCTTC ATCTTC ATCTTC ATCTTC ATCTTC ATCTTC
AA AA AA AA AA AA AA AA Sequências de Poli A/Poli T
Locali- Sequência Sequência otimizada do BDD FVIII zação inicial do SEQ ID SEQ ID SEQ ID SEQ ID SEQ ID SEQ ID SEQ ID SEQ ID do Ele- BDD FVIII NO: 1 NO: 2 NO: 3 NO: 4 NO: 5 NO: 6 NO: 70 NO: 71 mento (SEQ ID NO: 16) 3273 AAAAAAA GAAAAA GAAGAA GAAGAA GAAGAA GAAGAA CAAGAA GAAGAA CAAGAA
A G G G G G G G 4195 TTTTTT TTCTTT TTCTTC TTCTTC TTCTTC TTCTTC TTCTTC TTCTTC TTCTTC
C C Sítios de União 2203 GGTGAT GGGGA GGCGAC GGGGA GGGGA GGAGAC GGAGAC GGAGAC GGAGAC
C C C D. Sequências Desestabilizantes
[00299] Em algumas modalidades, o cassete genético compreende uma sequência de nucleotídeos códon-otimizada codificando um poli- peptídio FVIII, onde a sequência de nucleotídeos códon-otimizada con- tém menos elementos desestabilizantes em relação à SEQ ID NO: 16. Em outras modalidades, a sequência de nucleotídeos códon-otimizada codificando um polipeptídio FVIII contém no máximo 9, no máximo 8, no máximo 7, no máximo 6, ou no máximo 5 elementos desestabilizan- tes. Em outras modalidades, a sequência de nucleotídeos códon- otimizada codificando um polipeptídio FVIII contém no máximo 4, no máximo 3, no máximo 2, ou no máximo 1 elemento desestabilizante. Em ainda outras modalidades, a sequência de nucleotídeos códon- otimizada codificando um polipeptídio FVIII não contém um elemento desestabilizante.
[00300] Em uma modalidade particular, a sequência de nucleotí- deos códon-otimizada codificando um polipeptídio FVIII compreende uma primeira sequência de ácidos nucleicos codificando uma porção N-terminal de um polipeptídio FVIII e uma segunda sequência de áci- dos nucleicos codificando uma porção C-terminal de um polipeptídio FVIII; onde a primeira sequência de ácidos nucleicos tem pelo menos cerca de 80%, pelo menos cerca de 85%, pelo menos cerca de 86%, pelo menos cerca de 87%, pelo menos cerca de 88%, pelo menos cer- ca de 89%, pelo menos cerca de 90%, pelo menos cerca de 91%, pelo menos cerca de 92%, pelo menos cerca de 93%, pelo menos cerca de 94%, pelo menos cerca de 95%, pelo menos cerca de 96%, pelo me- nos cerca de 97%, pelo menos cerca de 98%, ou pelo menos cerca de 99% de identidade de sequência com os (i) nucleotídeos 58-1791 da SEQ ID NO: 3; (ii) nucleotídeos 1-1791 da SEQ ID NO: 3; (iii) nucleotí- deos 58-1791 da SEQ ID NO: 4; ou (iv) nucleotídeos 1-1791 da SEQ ID NO: 4; onde a porção N-terminal e a porção C-terminal juntas têm uma atividade de polipeptídio FVIII; e onde a sequência de nucleotí- deos códon-otimizada contém menos elementos desestabilizantes em relação à SEQ ID NO: 16. Em outras modalidades, a sequência de nu- cleotídeos que codifica um polipeptídio com atividade de FVIII contém no máximo 9, no máximo 8, no máximo 7, no máximo 6, ou no máximo 5 elementos desestabilizantes. Em outras modalidades, a sequência de nucleotídeos códon-otimizada codificando um polipeptídio FVIII contém no máximo 4, no máximo 3, no máximo 2, ou no máximo 1 elemento desestabilizante. Em ainda outras modalidades, a sequência de nucleotídeos códon-otimizada codificando um polipeptídio FVIII não contém um elemento desestabilizante.
[00301] Em uma outra modalidade, a sequência de nucleotídeos códon-otimizada codificando um polipeptídio FVIII compreende uma primeira sequência de ácidos nucleicos codificando uma porção N- terminal de um polipeptídio FVIII e uma segunda sequência de ácidos nucleicos codificando uma porção C-terminal de um polipeptídio FVIII; onde a segunda sequência de ácidos nucleicos tem pelo menos cerca de 80%, pelo menos cerca de 85%, pelo menos cerca de 86%, pelo menos cerca de 87%, pelo menos cerca de 88%, pelo menos cerca de 89%, pelo menos cerca de 90%, pelo menos cerca de 91%, pelo me- nos cerca de 92%, pelo menos cerca de 93%, pelo menos cerca de 94%, pelo menos cerca de 95%, pelo menos cerca de 96%, pelo me- nos cerca de 97%, pelo menos cerca de 98%, ou pelo menos cerca de
99% de identidade de sequência com os (i) nucleotídeos 1792-4374 da SEQ ID NO: 5; (ii) nucleotídeos 1792-4374 da SEQ ID NO: 6; (iii) nu- cleotídeos 1792-2277 e 2320-4374 da SEQ ID NO: 5 (i.e., nucleotí- deos 1792-4374 da SEQ ID NO: 5 sem os nucleotídeos codificando o domínio B ou um fragmento do domínio B); ou (iv) nucleotídeos 1792- 2277 e 2320-4374 da SEQ ID NO: 6 (i.e., nucleotídeos 1792-4374 da SEQ ID NO: 6 sem os nucleotídeos codificando o domínio B ou um fragmento do domínio B); onde a porção N-terminal e a porção C- terminal juntas têm uma atividade de polipeptídio FVIII; e onde a se- quência de nucleotídeos códon-otimizada contém menos elementos desestabilizantes em relação à SEQ ID NO: 16. Em outras modalida- des, a sequência de nucleotídeos que codifica um polipeptídio com atividade de FVIII contém no máximo 9, no máximo 8, no máximo 7, no máximo 6, ou no máximo 5 elementos desestabilizantes. Em outras modalidades, a sequência de nucleotídeos códon-otimizada codifican- do um polipeptídio FVIII contém no máximo 4, no máximo 3, no máxi- mo 2, ou no máximo 1 elementos desestabilizantes. Em ainda outras modalidades, a sequência de nucleotídeos códon-otimizada codifican- do um polipeptídio FVIII não contém um elemento desestabilizante.
[00302] Em outras modalidades, o cassete genético compreende uma sequência de nucleotídeos códon-otimizada codificando um poli- peptídio FVIII, onde a sequência de nucleotídeos códon-otimizada compreende uma sequência de ácidos nucleicos tendo pelo menos cerca de 80%, pelo menos cerca de 85%, pelo menos cerca de 89%, pelo menos cerca de 90%, pelo menos cerca de 91%, pelo menos cer- ca de 92%, pelo menos cerca de 93%, pelo menos cerca de 94%, pelo menos cerca de 95%, pelo menos cerca de 96%, pelo menos cerca de 97%, pelo menos cerca de 98%, ou pelo menos cerca de 99% de iden- tidade de sequência com os (i) nucleotídeos 58-4374 de uma sequên- cia de aminoácidos selecionada dentre as SEQ ID NOs: 1, 2, 3, 4, 5, 6,
70, e 71 ou (ii) nucleotídeos 58-2277 e 2320-4374 de uma sequência de aminoácidos selecionada dentre as SEQ ID NOs: 1, 2, 3, 4, 5, 6, 70, e 71 (i.e., nucleotídeos 58-4374 da SEQ ID NO: 1, 2, 3, 4, 5, 6, 70, ou 71 sem os nucleotídeos codificando o domínio B ou um fragmento do domínio B); e onde a sequência de nucleotídeos códon-otimizada contém menos elementos desestabilizantes em relação à SEQ ID NO:
16. Em outras modalidades, a sequência de nucleotídeos códon- otimizada codificando um polipeptídio FVIII contém no máximo 9, no máximo 8, no máximo 7, no máximo 6, ou no máximo 5 elementos de- sestabilizantes. Em outras modalidades, a sequência de nucleotídeos códon-otimizada codificando um polipeptídio FVIII contém no máximo 4, no máximo 3, no máximo 2, ou no máximo 1 elemento desestabili- zante. Em ainda outras modalidades, a sequência de nucleotídeos có- don-otimizada codificando um polipeptídio FVIII não contém um ele- mento desestabilizante.
[00303] Existem dez elementos desestabilizantes na sequência do FVIII parental (SEQ ID NO: 16): seis sequências ATTTA (SEQ ID NO: 23) e quatro sequências TAAAT (SEQ ID NO: 24). Em uma modalida- de, as sequências desses sítios foram mutadas para destruir os ele- mentos desestabilizantes nas SEQ ID NOs: 1-6, 70, e 71 optimizadas do FVIII. A localização de cada desses elementos, e a sequência dos nucleotídeos correspondentes nas sequências otimizadas estão mos- tradas na Tabela 3. E. Potenciais sítios promotores de ligação
[00304] Em algumas modalidades, o cassete genético compreende uma sequência de nucleotídeos códon-otimizada codificando um poli- peptídio FVIII, onde a sequência de nucleotídeos contém menos po- tenciais sítios promotores de ligação em relação à SEQ ID NO: 16. Em outras modalidades, a sequência de nucleotídeos códon-otimizada co- dificando um polipeptídio FVIII contém no máximo 9, no máximo 8, no máximo 7, no máximo 6, ou no máximo 5 potenciais sítios promotores de ligação. Em outras modalidades, a sequência de nucleotídeos có- don-otimizada codificando um polipeptídio FVIII contém no máximo 4, no máximo 3, no máximo 2, ou no máximo 1 potencial sítio promotor de ligação. Em ainda outras modalidades, a sequência de nucleotí- deos códon-otimizada codificando um polipeptídio FVIII não contém um potencial sítio promotor de ligação.
[00305] Em uma modalidade particular, a sequência de nucleotí- deos códon-otimizada codificando um polipeptídio FVIII compreende uma primeira sequência de ácidos nucleicos codificando uma porção N-terminal de um polipeptídio FVIII e uma segunda sequência de áci- dos nucleicos codificando uma porção C-terminal de um polipeptídio FVIII; onde a primeira sequência de ácidos nucleicos tem pelo menos cerca de 80%, pelo menos cerca de 85%, pelo menos cerca de 86%, pelo menos cerca de 87%, pelo menos cerca de 88%, pelo menos cer- ca de 89%, pelo menos cerca de 90%, pelo menos cerca de 91%, pelo menos cerca de 92%, pelo menos cerca de 93%, pelo menos cerca de 94%, pelo menos cerca de 95%, pelo menos cerca de 96%, pelo me- nos cerca de 97%, pelo menos cerca de 98%, ou pelo menos cerca de 99% de identidade de sequência com os (i) nucleotídeos 58-1791 da SEQ ID NO: 3; (ii) nucleotídeos 1-1791 da SEQ ID NO: 3; (iii) nucleotí- deos 58-1791 da SEQ ID NO: 4; ou (iv) nucleotídeos 1-1791 da SEQ ID NO: 4; onde a porção N-terminal e a porção C-terminal juntas têm uma atividade de polipeptídio FVIII; e onde a sequência de nucleotí- deos códon-otimizada contém menos potenciais sítios promotores de ligação em relação à SEQ ID NO: 16. Em outras modalidades, a se- quência de nucleotídeos códon-otimizada codificando um polipeptídio FVIII contém no máximo 9, no máximo 8, no máximo 7, no máximo 6, ou no máximo 5 potenciais sítios promotores de ligação. Em outras modalidades, a sequência de nucleotídeos códon-otimizada codifican-
do um polipeptídio FVIII contém no máximo 4, no máximo 3, no máxi- mo 2, ou no máximo 1 potencial sítio promotor de ligação. Em ainda outras modalidades, a sequência de nucleotídeos códon-otimizada co- dificando um polipeptídio FVIII não contém um potencial sítio promotor de ligação.
[00306] Em uma outra modalidade, a sequência de nucleotídeos códon-otimizada codificando um polipeptídio FVIII compreende uma primeira sequência de ácidos nucleicos codificando uma porção N- terminal de um polipeptídio FVIII e uma segunda sequência de ácidos nucleicos codificando uma porção C-terminal de um polipeptídio FVIII; onde a segunda sequência de ácidos nucleicos tem pelo menos cerca de 80%, pelo menos cerca de 85%, pelo menos cerca de 86%, pelo menos cerca de 87%, pelo menos cerca de 88%, pelo menos cerca de 89%, pelo menos cerca de 90%, pelo menos cerca de 91%, pelo me- nos cerca de 92%, pelo menos cerca de 93%, pelo menos cerca de 94%, pelo menos cerca de 95%, pelo menos cerca de 96%, pelo me- nos cerca de 97%, pelo menos cerca de 98%, ou pelo menos cerca de 99% de identidade de sequência com os (i) nucleotídeos 1792-4374 da SEQ ID NO: 5; (ii) nucleotídeos 1792-4374 da SEQ ID NO: 6; (iii) nu- cleotídeos 1792-2277 e 2320-4374 da SEQ ID NO: 5 (i.e., nucleotí- deos 1792-4374 da SEQ ID NO: 5 sem os nucleotídeos codificando o domínio B ou um fragmento do domínio B); ou (iv) nucleotídeos 1792- 2277 e 2320-4374 da SEQ ID NO: 6 (i.e., nucleotídeos 1792-4374 da SEQ ID NO: 6 sem os nucleotídeos codificando o domínio B ou um fragmento do domínio B); onde a porção N-terminal e a porção C- terminal juntas têm uma atividade de polipeptídio FVIII; e onde a se- quência de nucleotídeos códon-otimizada contém menos potenciais sítios promotores de ligação em relação à SEQ ID NO: 16. Em outras modalidades, a sequência de nucleotídeos códon-otimizada codifican- do um polipeptídio FVIII contém no máximo 9, no máximo 8, no máxi-
mo 7, no máximo 6, ou no máximo 5 potenciais sítios promotores de ligação. Em outras modalidades, a sequência de nucleotídeos códon- otimizada codificando um polipeptídio FVIII contém no máximo 4, no máximo 3, no máximo 2, ou no máximo 1 potencial sítio promotor de ligação. Em ainda outras modalidades, a sequência de nucleotídeos códon-otimizada codificando um polipeptídio FVIII não contém um po- tencial sítio promotor de ligação.
[00307] Em outras modalidades, o cassete genético compreende uma sequência de nucleotídeos códon-otimizada codificando um poli- peptídio FVIII, onde a sequência de nucleotídeos compreende uma sequência de ácidos nucleicos tendo pelo menos cerca de 80%, pelo menos cerca de 85%, pelo menos cerca de 89%, pelo menos cerca de 90%, pelo menos cerca de 91%, pelo menos cerca de 92%, pelo me- nos cerca de 93%, pelo menos cerca de 94%, pelo menos cerca de 95%, pelo menos cerca de 96%, pelo menos cerca de 97%, pelo me- nos cerca de 98%, ou pelo menos cerca de 99% de identidade de se- quência com os (i) nucleotídeos 58-4374 de uma sequência de amino- ácidos selecionada dentre as SEQ ID NOs: 1, 2, 3, 4, 5, 6, 70, e 71 ou (ii) nucleotídeos 58-2277 e 2320-4374 de uma sequência de aminoáci- dos selecionada dentre as SEQ ID NOs: 1, 2, 3, 4, 5, 6, 70, e 71 (i.e., nucleotídeos 58-4374 da SEQ ID NO: 1, 2, 3, 4, 5, 6, 70, ou 71 sem os nucleotídeos codificando o domínio B ou um fragmento do domínio B); e onde a sequência de nucleotídeos códon-otimizada contém menos potenciais sítios promotores de ligação em relação à SEQ ID NO: 16. Em outras modalidades, a sequência de nucleotídeos códon-otimizada codificando um polipeptídio FVIII contém no máximo 9, no máximo 8, no máximo 7, no máximo 6, ou no máximo 5 potenciais sítios promoto- res de ligação. Em outras modalidades, a sequência de nucleotídeos códon-otimizada codificando um polipeptídio FVIII contém no máximo 4, no máximo 3, no máximo 2, ou no máximo 1 potencial sítio promotor de ligação. Em ainda outras modalidades, a sequência de nucleotí- deos códon-otimizada codificando um polipeptídio FVIII não contém um potencial sítio promotor de ligação.
[00308] Caixas TATA são sequências reguladoras normalmente en- contradas nas regiões promotoras de eucariotas. Elas servem como o sítio de ligação da proteína de ligação à TATA (TBP), um fator de transcrição genérico. As caixas TATA normalmente compreendem a sequência TATAA (SEQ ID NO: 28) ou uma variante próxima. As cai- xas TATA em uma sequência codificadora, no entanto, podem inibir a translação da proteína de comprimento total. Existem dez potenciais sequências promotoras de ligação na sequência do BDD FVIII do tipo selvagem (SEQ ID NO: 16): cinco sequências TATAA (SEQ ID NO: 28) e cinco sequências TTATA (SEQ ID NO: 29). Em algumas modalida- des, pelo menos 1, pelo menos 2, pelo menos 3, ou pelo menos 4 dos sítios promotores de ligação estão suprimidos nos genes de FVIII da presente invenção. Em algumas modalidades, pelo menos 5 dos sítios promotores de ligação estão suprimidos nos genes de FVIII da presen- te invenção. Em outras modalidades, pelo menos 6, pelo menos 7, ou pelo menos 8 dos sítios promotores de ligação estão suprimidos nos genes de FVIII da presente invenção. Em uma modalidade, pelo me- nos 9 dos sítios promotores de ligação estão suprimidos nos genes de FVIII da presente invenção. Em uma modalidade particular, todos os sítios promotores de ligação estão suprimidos nos genes de FVIII da presente invenção. A localização de cada potencial sítio promotor de ligação e a sequência dos nucleotídeos correspondentes nas sequên- cias otimizadas estão mostradas na Tabela 3. F. Outros Elementos Reguladores Cis Atuantes Negativos
[00309] Além das sequências de MAR/ARS, elementos desestabili- zantes, e dos potenciais sítios promotores descritos acima, diversas sequências potencialmente inibitórias adicionais podem ser identifica-
das na sequência do BDD FVIII do tipo selvagem (SEQ ID NO: 16). Dois elementos de sequência ricos em AU (AREs) podem ser identifi- cados (ATTTTATT (SEQ ID NOs: 30); e ATTTTTAA (SEQ ID NO: 31), junto com um sítio de poli-A (AAAAAAA; SEQ ID NO: 26), um sítio de poli-T (TTTTTT; SEQ ID NO: 25), e um sítio de união (GGTGAT; SEQ ID NO: 27) na sequência não otimizada do BDD FVIII. Um ou mais destes elementos podem ser removidos das sequências otimizadas do FVIII. A localização de cada um desses sítios e a sequência dos nu- cleotídeos correspondentes nas sequências otimizadas estão mostra- das na Tabela 3.
[00310] Em certas modalidades, a sequência de nucleotídeos có- don-otimizada codificando um polipeptídio FVIII compreende uma pri- meira sequência de ácidos nucleicos codificando uma porção N- terminal de um polipeptídio FVIII e uma segunda sequência de ácidos nucleicos codificando uma porção C-terminal de um polipeptídio FVIII; onde a primeira sequência de ácidos nucleicos tem pelo menos cerca de 80%, pelo menos cerca de 85%, pelo menos cerca de 86%, pelo menos cerca de 87%, pelo menos cerca de 88%, pelo menos cerca de 89%, pelo menos cerca de 90%, pelo menos cerca de 91%, pelo me- nos cerca de 92%, pelo menos cerca de 93%, pelo menos cerca de 94%, pelo menos cerca de 95%, pelo menos cerca de 96%, pelo me- nos cerca de 97%, pelo menos cerca de 98%, ou pelo menos cerca de 99% de identidade de sequência com os (i) nucleotídeos 58-1791 da SEQ ID NO: 3; (ii) nucleotídeos 1-1791 da SEQ ID NO: 3; (iii) nucleotí- deos 58-1791 da SEQ ID NO: 4; ou (iv) nucleotídeos 1-1791 da SEQ ID NO: 4; onde a porção N-terminal e a porção C-terminal juntas têm uma atividade de polipeptídio FVIII; e onde a sequência de nucleotí- deos códon-otimizada não contém um ou mais elementos regulatórios cis-atuantes negativos, por exemplo, um sítio de união, uma sequência de poli-T, uma sequência de poli-A, uma sequência de ARE, ou quais-
quer combinações das mesmas.
[00311] Em uma outra modalidade, a sequência de nucleotídeos códon-otimizada codificando um polipeptídio FVIII compreende uma primeira sequência de ácidos nucleicos codificando uma porção N- terminal de um polipeptídio FVIII e uma segunda sequência de ácidos nucleicos codificando uma porção C-terminal de um polipeptídio FVIII; onde a segunda sequência de ácidos nucleicos tem pelo menos cerca de 80%, pelo menos cerca de 85%, pelo menos cerca de 86%, pelo menos cerca de 87%, pelo menos cerca de 88%, pelo menos cerca de 89%, pelo menos cerca de 90%, pelo menos cerca de 91%, pelo me- nos cerca de 92%, pelo menos cerca de 93%, pelo menos cerca de 94%, pelo menos cerca de 95%, pelo menos cerca de 96%, pelo me- nos cerca de 97%, pelo menos cerca de 98%, ou pelo menos cerca de 99% de identidade de sequência com os (i) nucleotídeos 1792-4374 da SEQ ID NO: 5; (ii) nucleotídeos 1792-4374 da SEQ ID NO: 6; (iii) nu- cleotídeos 1792-2277 e 2320-4374 da SEQ ID NO: 5 (i.e., nucleotí- deos 1792-4374 da SEQ ID NO: 5 sem os nucleotídeos codificando o domínio B ou um fragmento do domínio B); ou (iv) nucleotídeos 1792- 2277 e 2320-4374 da SEQ ID NO: 6(i.e., nucleotídeos 1792-4374 da SEQ ID NO: 6 sem os nucleotídeos codificando o domínio B ou um fragmento do domínio B); onde a porção N-terminal e a porção C- terminal juntas têm uma atividade de polipeptídio FVIII; e onde a se- quência de nucleotídeos códon-otimizada não contém um ou mais elementos regulatórios cis-atuantes negativos, por exemplo, um sítio de união, uma sequência de poli-T, uma sequência de poli-A, uma se- quência de ARE, ou quaisquer combinações das mesmas.
[00312] Em outras modalidades, o cassete genético compreende uma sequência de nucleotídeos códon-otimizada codificando um poli- peptídio FVIII, onde a sequência de nucleotídeos compreende uma sequência de ácidos nucleicos tendo pelo menos cerca de 80%, pelo menos cerca de 85%, pelo menos cerca de 89%, pelo menos cerca de 90%, pelo menos cerca de 91%, pelo menos cerca de 92%, pelo me- nos cerca de 93%, pelo menos cerca de 94%, pelo menos cerca de 95%, pelo menos cerca de 96%, pelo menos cerca de 97%, pelo me- nos cerca de 98%, ou pelo menos cerca de 99% de identidade de se- quência com os (i) nucleotídeos 58-4374 de uma sequência de amino- ácidos selecionada dentre as SEQ ID NOs: 1, 2, 3, 4, 5, 6, 70, e 71 ou (ii) nucleotídeos 58-2277 e 2320-4374 de uma sequência de aminoáci- dos selecionada dentre as SEQ ID NOs: 1, 2, 3, 4, 5, 6, 70, e 71 (i.e., nucleotídeos 58-4374 da SEQ ID NO: 1, 2, 3, 4, 5, 6, 70, ou 71 sem os nucleotídeos codificando o domínio B ou um fragmento do domínio B); e onde a sequência de nucleotídeos códon-otimizada não contém um ou mais elementos regulatórios cis-atuantes negativos, por exemplo, um sítio de união, uma sequência de poli-T, uma sequência de poli-A, uma sequência de ARE, ou quaisquer combinações das mesmas.
[00313] Em algumas modalidades, a sequência de nucleotídeos có- don-otimizada codificando um polipeptídio FVIII compreende uma pri- meira sequência de ácidos nucleicos codificando uma porção N- terminal de um polipeptídio FVIII e uma segunda sequência de ácidos nucleicos codificando uma porção C-terminal de um polipeptídio FVIII; onde a primeira sequência de ácidos nucleicos tem pelo menos cerca de 80%, pelo menos cerca de 85%, pelo menos cerca de 86%, pelo menos cerca de 87%, pelo menos cerca de 88%, pelo menos cerca de 89%, pelo menos cerca de 90%, pelo menos cerca de 91%, pelo me- nos cerca de 92%, pelo menos cerca de 93%, pelo menos cerca de 94%, pelo menos cerca de 95%, pelo menos cerca de 96%, pelo me- nos cerca de 97%, pelo menos cerca de 98%, ou pelo menos cerca de 99% de identidade de sequência com os (i) nucleotídeos 58-1791 da SEQ ID NO: 3; (ii) nucleotídeos 1-1791 da SEQ ID NO: 3; (iii) nucleotí- deos 58-1791 da SEQ ID NO: 4; ou (iv) nucleotídeos 1-1791 da SEQ
ID NO: 4; onde a porção N-terminal e a porção C-terminal juntas têm uma atividade de polipeptídio FVIII; e onde a sequência de nucleotí- deos códon-otimizada não contém o sítio de união GGTGAT (SEQ ID NO: 27). Em algumas modalidades, a sequência de nucleotídeos có- don-otimizada codificando um polipeptídio FVIII compreende uma pri- meira sequência de ácidos nucleicos codificando uma porção N- terminal de um polipeptídio FVIII e uma segunda sequência de ácidos nucleicos codificando uma porção C-terminal de um polipeptídio FVIII; onde a primeira sequência de ácidos nucleicos tem pelo menos cerca de 80%, pelo menos cerca de 85%, pelo menos cerca de 86%, pelo menos cerca de 87%, pelo menos cerca de 88%, pelo menos cerca de 89%, pelo menos cerca de 90%, pelo menos cerca de 91%, pelo me- nos cerca de 92%, pelo menos cerca de 93%, pelo menos cerca de 94%, pelo menos cerca de 95%, pelo menos cerca de 96%, pelo me- nos cerca de 97%, pelo menos cerca de 98%, ou pelo menos cerca de 99% de identidade de sequência com os (i) nucleotídeos 58-1791 da SEQ ID NO: 3; (ii) nucleotídeos 1-1791 da SEQ ID NO: 3; (iii) nucleotí- deos 58-1791 da SEQ ID NO: 4; ou (iv) nucleotídeos 1-1791 da SEQ ID NO: 4; onde a porção N-terminal e a porção C-terminal juntas têm uma atividade de polipeptídio FVIII; e onde a sequência de nucleotí- deos códon-otimizada não contém uma sequência de poli T (SEQ ID NO: 25). Em algumas modalidades, a sequência de nucleotídeos có- don-otimizada codificando um polipeptídio FVIII compreende uma pri- meira sequência de ácidos nucleicos codificando uma porção N- terminal de um polipeptídio FVIII e uma segunda sequência de ácidos nucleicos codificando uma porção C-terminal de um polipeptídio FVIII; onde a primeira sequência de ácidos nucleicos tem pelo menos cerca de 80%, pelo menos cerca de 85%, pelo menos cerca de 86%, pelo menos cerca de 87%, pelo menos cerca de 88%, pelo menos cerca de 89%, pelo menos cerca de 90%, pelo menos cerca de 91%, pelo me-
nos cerca de 92%, pelo menos cerca de 93%, pelo menos cerca de 94%, pelo menos cerca de 95%, pelo menos cerca de 96%, pelo me- nos cerca de 97%, pelo menos cerca de 98%, ou pelo menos cerca de 99% de identidade de sequência com os (i) nucleotídeos 58-1791 da SEQ ID NO: 3; (ii) nucleotídeos 1-1791 da SEQ ID NO: 3; (iii) nucleotí- deos 58-1791 da SEQ ID NO: 4; ou (iv) nucleotídeos 1-1791 da SEQ ID NO: 4; onde a porção N-terminal e a porção C-terminal juntas têm uma atividade de polipeptídio FVIII; e onde a sequência de nucleotí- deos códon-otimizada não contém uma sequência de poli-A (SEQ ID NO: 26). Em algumas modalidades, a sequência de nucleotídeos có- don-otimizada codificando um polipeptídio FVIII compreende uma pri- meira sequência de ácidos nucleicos codificando uma porção N- terminal de um polipeptídio FVIII e uma segunda sequência de ácidos nucleicos codificando uma porção C-terminal de um polipeptídio FVIII; onde a primeira sequência de ácidos nucleicos tem pelo menos cerca de 80%, pelo menos cerca de 85%, pelo menos cerca de 86%, pelo menos cerca de 87%, pelo menos cerca de 88%, pelo menos cerca de 89%, pelo menos cerca de 90%, pelo menos cerca de 91%, pelo me- nos cerca de 92%, pelo menos cerca de 93%, pelo menos cerca de 94%, pelo menos cerca de 95%, pelo menos cerca de 96%, pelo me- nos cerca de 97%, pelo menos cerca de 98%, ou pelo menos cerca de 99% de identidade de sequência com os (i) nucleotídeos 58-1791 da SEQ ID NO: 3; (ii) nucleotídeos 1-1791 da SEQ ID NO: 3; (iii) nucleotí- deos 58-1791 da SEQ ID NO: 4; ou (iv) nucleotídeos 1-1791 da SEQ ID NO: 4; onde a porção N-terminal e a porção C-terminal juntas têm uma atividade de polipeptídio FVIII; e onde a sequência de nucleotí- deos códon-otimizada não contém um elemento ARE (SEQ ID NO: 30 ou SEQ ID NO: 31).
[00314] Em algumas modalidades, o cassete genético compreende uma sequência de nucleotídeos códon-otimizada codificando um poli-
peptídio FVIII, onde a sequência de nucleotídeos códon-otimizada compreende uma sequência de ácidos nucleicos tendo pelo menos cerca de 80%, pelo menos cerca de 85%, pelo menos cerca de 89%, pelo menos cerca de 90%, pelo menos cerca de 91%, pelo menos cer- ca de 92%, pelo menos cerca de 93%, pelo menos cerca de 94%, pelo menos cerca de 95%, pelo menos cerca de 96%, pelo menos cerca de 97%, pelo menos cerca de 98%, ou pelo menos cerca de 99% de iden- tidade de sequência com os (i) nucleotídeos 58-4374 de uma sequên- cia de aminoácidos selecionada dentre as SEQ ID NOs: 1, 2, 3, 4, 5, 6, 70, e 71 ou (ii) nucleotídeos 58-2277 e 2320-4374 de uma sequência de aminoácidos selecionada dentre as SEQ ID NOs: 1, 2, 3, 4, 5, 6, 70, e 71 (i.e., nucleotídeos 58-4374 da SEQ ID NO: 1, 2, 3, 4, 5, 6, 70, ou 71 sem os nucleotídeos codificando o domínio B ou um fragmento do domínio B); e onde a sequência de nucleotídeos códon-otimizada não contém o sítio de união GGTGAT (SEQ ID NO: 27). Em algumas modalidades, o cassete genético compreende uma sequência de nu- cleotídeos códon-otimizada codificando um polipeptídio FVIII, onde a sequência de nucleotídeos códon-otimizada compreende uma se- quência de ácidos nucleicos tendo pelo menos cerca de 80%, pelo menos cerca de 85%, pelo menos cerca de 89%, pelo menos cerca de 90%, pelo menos cerca de 91%, pelo menos cerca de 92%, pelo me- nos cerca de 93%, pelo menos cerca de 94%, pelo menos cerca de 95%, pelo menos cerca de 96%, pelo menos cerca de 97%, pelo me- nos cerca de 98%, ou pelo menos cerca de 99% de identidade de se- quência com os (i) nucleotídeos 58-4374 de uma sequência de amino- ácidos selecionada dentre as SEQ ID NOs: 1, 2, 3, 4, 5, 6, 70, e 71 ou (ii) nucleotídeos 58-2277 e 2320-4374 de uma sequência de aminoáci- dos selecionada dentre as SEQ ID NOs: 1, 2, 3, 4, 5, 6, 70, e 71 (i.e., nucleotídeos 58-4374 da SEQ ID NO: 1, 2, 3, 4, 5, 6, 70, ou 71 sem os nucleotídeos codificando o domínio B ou um fragmento do domínio B);
e onde a sequência de nucleotídeos códon-otimizada não contém uma sequência de poli-T (SEQ ID NO: 25). Em algumas modalidades, o cassete genético compreende uma sequência de nucleotídeos códon- otimizada codificando um polipeptídio FVIII, onde a sequência de nu- cleotídeos códon-otimizada compreende uma sequência de ácidos nu- cleicos tendo pelo menos cerca de 80%, pelo menos cerca de 85%, pelo menos cerca de 89%, pelo menos cerca de 90%, pelo menos cer- ca de 91%, pelo menos cerca de 92%, pelo menos cerca de 93%, pelo menos cerca de 94%, pelo menos cerca de 95%, pelo menos cerca de 96%, pelo menos cerca de 97%, pelo menos cerca de 98%, ou pelo menos cerca de 99% de identidade de sequência com os (i) nucleotí- deos 58-4374 de uma sequência de aminoácidos selecionada dentre as SEQ ID NOs: 1, 2, 3, 4, 5, 6, 70, e 71 ou (ii) nucleotídeos 58-2277 e 2320-4374 de uma sequência de aminoácidos selecionada dentre as SEQ ID NOs: 1, 2, 3, 4, 5, 6, 70, e 71 (i.e., nucleotídeos 58-4374 da SEQ ID NO: 1, 2, 3, 4, 5, 6, 70, ou 71 sem os nucleotídeos codificando o domínio B ou um fragmento do domínio B); e onde a sequência de nucleotídeos códon-otimizada não contém uma sequência de poli-A (SEQ ID NO: 26). Em algumas modalidades, o cassete genético com- preende uma sequência de nucleotídeos códon-otimizada codificando um polipeptídio FVIII, onde a sequência de nucleotídeos códon- otimizada compreende uma sequência de ácidos nucleicos tendo pelo menos cerca de 80%, pelo menos cerca de 85%, pelo menos cerca de 89%, pelo menos cerca de 90%, pelo menos cerca de 91%, pelo me- nos cerca de 92%, pelo menos cerca de 93%, pelo menos cerca de 94%, pelo menos cerca de 95%, pelo menos cerca de 96%, pelo me- nos cerca de 97%, pelo menos cerca de 98%, ou pelo menos cerca de 99% de identidade de sequência com os (i) nucleotídeos 58-4374 de uma sequência de aminoácidos selecionada dentre as SEQ ID NOs: 1, 2, 3, 4, 5, 6, 70, e 71 ou (ii) nucleotídeos 58-2277 e 2320-4374 de uma sequência de aminoácidos selecionada dentre as SEQ ID NOs: 1, 2, 3, 4, 5, 6, 70, e 71 (i.e., nucleotídeos 58-4374 da SEQ ID NO: 1, 2, 3, 4, 5, 6, 70, ou 71 sem os nucleotídeos codificando o domínio B ou um fragmento do domínio B); e onde a sequência de nucleotídeos códon- otimizada não contém um elemento ARE (SEQ ID NO: 30 ou SEQ ID NO: 31).
[00315] Em outras modalidades, uma sequência otimizada de FVIII da invenção não compreende um ou mais motivos antivirais, estruturas do tipo tronco-alça, e sequências de repetição.
[00316] Em ainda outras modalidades, os nucleotídeos que circun- dam o sítio de início de transcrição são alterados para uma sequência de consenso de kozak (GCCGCCACCATGC (SEQ ID NO: 32), onde os nucleotídeos sublinhados são o códon inicial). Em outras modalida- des, sítios de restrição podem adicionados ou removidos para facilitr o processo de clonagem. b. Sequências de FIX e de Polinucleotídeos Codificando a Proteí- na FIX
[00317] Em algumas modalidades, a molécula de ácido nucleico compreende uma primeira ITR, uma segunda ITR, e um cassete gené- tico codificando uma sequência alvo, onde a sequência alvo codifica uma proteína terapêutica, onde a proteína terapêutica compreende um polipeptídio FIX. Em algumas modalidades, o polipeptídio FIX compre- ende FIX ou uma variante ou fragmento do mesmo, onde o FIX ou a variante ou fragmento do mesmo tem uma atividade de FIX.
[00318] FIX humano é uma serina protease que é um componente importante da via intrínseca da cascata de coagulação do sangue. "Fa- tor IX" ou "FIX," conforme usado neste pedido, refere-se a uma proteí- na fator de coagulação e variantes em espécie e sequência da mes- ma, e inclui, porém sem limitação, a sequência de 461 aminoácidos de cadeia única do polipeptídio precursor de FIX humano ("prepro"), a se-
quência de 415 aminoácidos de cadeia única do FIX humano maduro (SEQ ID NO: 125), e a R338L variante de FIX (Padua) (SEQ ID NO: 126). O FIX inclui qualquer forma de molécula de FIX com as caracte- rísticas típicas do FIX de coagulação do sangue FIX. Conforme usado neste pedido "Fator IX" e "FIX" destinam-se a abranger polipeptídios que compreendem os domínios Gla (região contendo resíduos ácido γ- carboxiglutâmico), EGF1 e EGF2 (regiões contendo sequências homó- logas ao fator de crescimento epidérmico humano), peptídio de ativa- ção ("AP," formado pelos resíduos R136-R180 do FIX maduro), e o domínio de protease C-terminal ("Pro"), ou sinônimos destes domínios conhecidos na literatura, ou pode ser um fragmento truncado ou uma variante em sequência que conserva pelo menos uma parte da ativi- dade biológica da proteína nativa. FIX ou variantes em sequência já foram clonados, como descrito nas Patentes US N° 4.770.999 e
7.700.734, e cDNA codificando FIX humano já foi isolado, caracteriza- do, em clonado em vetores de expressão (vide, por exemplo, Choo et al., Nature 299:178-180 (1982); Fair et al., Blood 64:194-204 (1984); e Kurachi et al., Proc. Natl. Acad. Sci., U.S.A. 79:6461-6464 (1982)). Uma variante particular de FIX, a variante R338L de FIX (Padua) (SEQ ID NO: 2), caracterizada por Simioni et al, 2009, compreende uma mu- tação de ganho de função, que está correlacionada com um aumento de quase 8 vezes na atividade da variante Padua em relação ao FIX nativo (Tabela 4). Variantes de FIX também podem incluir qualquer polipeptídio FIX tendo uma ou mais substituições aminoacídicas con- servativas, que não afetam a atividade de FIX do polipeptídio FIX. Em algumas modalidades, a variante de FIX compreende rFIX-albumina fusionada por um ligante clivável, por exemplo, IDELVION®. Vide o documento US 7.939.632, cuja íntegra encontra-se aqui incorporada a título de referência.
Tabela 4: Exemplos de Sequências de FIX SEQ ID NO: 125 (polipeptídio FIX maduro) 1:YNSGKLEEFV QGNLERECME EKCSFEEARE VFENTERTTE FWKQYVDGDQ CESNPCLNGG 61:SCKDDINSYE CWCPFGFEGK NCELDVTCNI KNGRCEQFCK NSADNKVVCS CTEGYRLAEN 121:QKSCEPAVPF PCGRVSVSQT SKLTRAETVF PDVDYVNSTE AETILDNITQ STQSFNDFTR 181:VVGGEDAKPG QFPWQVVLNG KVDAFCGGSI VNEKWIVTAA HCVETGVKIT VVAGEHNIEE 241:TEHTEQKRNV IRIIPHHNYN AAINKYNHDI ALLELDEPLV LNSYVTPICI ADKEYTNIFL 301:KFGSGYVSGW GRVFHKGRSA LVLQYLRVPL VDRATCLRST KFTIYNNMFC AGFHEGGRDS 361:CQGDSGGPHV TEVEGTSFLT GIISWGEECA MKGKYGIYTK VSRYVNWIKE KTKLT
SEQ ID NO: 126 (polipeptídio Padua(R338L)FIX maduro) 1:YNSGKLEEFV QGNLERECME EKCSFEEARE VFENTERTTE FWKQYVDGDQ CESNPCLNGG 61:SCKDDINSYE CWCPFGFEGK NCELDVTCNI KNGRCEQFCK NSADNKVVCS CTEGYRLAEN 121:QKSCEPAVPF PCGRVSVSQT SKLTRAETVF PDVDYVNSTE AETILDNITQ STQSFNDFTR 181:VVGGEDAKPG QFPWQVVLNG KVDAFCGGSI VNEKWIVTAA HCVETGVKIT VVAGEHNIEE 241:TEHTEQKRNV IRIIPHHNYN AAINKYNHDI ALLELDEPLV LNSYVTPICI ADKEYTNIFL 301:KFGSGYVSGW GRVFHKGRSA LVLQYLRVPL VDRATCLLST KFTIYNNMFC AGFHEGGRDS 361:CQGDSGGPHV TEVEGTSFLT GIISWGEECA MKGKYGIYTK VSRYVNWIKE KTKLT
SEQ ID NO: 127 (polipeptídio sinal e propeptídio FIX) 1: MQRVNMIMAE SPGLITICLL GYLLSAECTV FLDHENANKI LNRPKR
SEQ ID NO: 160 (FIX-Ligante-Albumina) YNSGKLEEFV QGNLERECME EKCSFEEARE VFENTERTTE FWKQYVDGDQ 50 CESNPCLNGG SCKDDINSYE CWCPFGFEGK NCELDVTCNI KNGRCEQFCK 100 NSADNKVVCS CTEGYRLAEN QKSCEPAVPF PCGRVSVSQT SKLTRAETVF 150 PDVDYVNSTE AETILDNITQ STQSFNDFTR VVGGEDAKPG QFPWQVVLNG 200 KVDAFCGGSI VNEKWIVTAA HCVETGVKIT VVAGEHNIEE TEHTEQKRNV 250 IRIIPHHNYN AAINKYNHDI ALLELDEPLV LNSYVTPICI ADKEYTNIFL 300 KFGSGYVSGW GRVFHKGRSA LVLQYLRVPL VDRATCLRST KFTIYNNMFC 350 AGFHEGGRDS CQGDSGGPHV TEVEGTSFLT GIISWGEECA MKGKYGIYTK 400 VSRYVNWIKE KTKLTPVSQT SKLTRAETVF PDVDAHKSEV AHRFKDLGEE 450 NFKALVLIAF AQYLQQCPFE DHVKLVNEVT EFAKTCVADE SAENCDKSLH 500 TLFGDKLCTV ATLRETYGEM ADCCAKQEPE RNECFLQHKD DNPNLPRLVR 550 PEVDVMCTAF HDNEETFLKK YLYEIARRHP YFYAPELLFF AKRYKAAFTE 600 CCQAADKAAC LLPKLDELRD EGKASSAKQR LKCASLQKFG ERAFKAWAVA 650 RLSQRFPKAE FAEVSKLVTD LTKVHTECCH GDLLECADDR ADLAKYICEN 700 QDSISSKLKE CCEKPLLEKS HCIAEVENDE MPADLPSLAA DFVESKDVCK 750 NYAEAKDVFL GMFLYEYARR HPDYSVVLLL RLAKTYETTL EKCCAAADPH 800 ECYAKVFDEF KPLVEEPQNL IKQNCELFEQ LGEYKFQNAL LVRYTKKVPQ 850 VSTPTLVEVS RNLGKVGSKC CKHPEAKRMP CAEDYLSVVL NQLCVLHEKT 900 PVSDRVTKCC TESLVNRRPC FSALEVDETY VPKEFNAETF TFHADICTLS 950 EKERQIKKQT ALVELVKHKP KATKEQLKAV MDDFAAFVEK CCKADDKETC 1000 FAEEGKKLVA ASQAALGL 1018
SEQ ID NO: 161 (FIX)
YNSGKLEEFVQGNLERECMEEKCSFEEAREVFENTERTTEFWKQYVDGDQCESNPCLNGGSCKDDINSYECWCP FGFEGKNCELDVTCNIKNGRCEQFCKNSADNKVVCSCTEGYRLAENQKSCEPAVPFPCGRVSVSQTSKLTRAET VFPDVDYVNSTEAETILDNITQSTQSFNDFTRVVGGEDAKPGQFPWQVVLNGKVDAFCGGSIVNEKWIVTAAHC VETGVKITVVAGEHNIEETEHTEQKRNVIRIIPHHNYNAAINKYNHDIALLELDEPLVLNSYVTPICIADKEYT NIFLKFGSGYVSGWGRVFHKGRSALVLQYLRVPLVDRATCLRSTKFTIYNNMFCAGFHEGGRDSCQGDSGGPHV
TEVEGTSFLTGIISWGEECAMKGKYGIYTKVSRYVNWIKEKTKLTPVSQTSKLT SEQ ID NO: 162 (Ligante)
RAETVFPDV SEQ ID NO: 163 (Albumina)
DAHKSEVAHRFKDLGEENFKALVLIAFAQYLQQCPFEDHVKLVNEVTEFAKTCVADESAENCDKSLHTLFGDKL CTVATLRETYGEMADCCAKQEPERNECFLQHKDDNPNLPRLVRPEVDVMCTAFHDNEETFLKKYLYEIARRHPY FYAPELLFFAKRYKAAFTECCQAADKAACLLPKLDELRDEGKASSAKQRLKCASLQKFGERAFKAWAVARLSQR FPKAEFAEVSKLVTDLTKVHTECCHGDLLECADDRADLAKYICENQDSISSKLKECCEKPLLEKSHCIAEVEND EMPADLPSLAADFVESKDVCKNYAEAKDVFLGMFLYEYARRHPDYSVVLLLRLAKTYETTLEKCCAAADPHECY AKVFDEFKPLVEEPQNLIKQNCELFEQLGEYKFQNALLVRYTKKVPQVSTPTLVEVSRNLGKVGSKCCKHPEAK RMPCAEDYLSVVLNQLCVLHEKTPVSDRVTKCCTESLVNRRPCFSALEVDETYVPKEFNAETFTFHADICTLSE
KERQIKKQTALVELVKHKPKATKEQLKAVMDDFAAFVEKCCKADDKETCFAEEGKKLVAASQAALGL SEQ ID NO: 164 (FIX(XTEN)-Fc)*
MQRVNMIMAESPGLITICLLGYLLSAECTVFLDHENANKILNRPKRYNSGKLEEFVQGNLERECMEEKCSFEEA REVFENTERTTEFWKQYVDGDQCESNPCLNGGSCKDDINSYECWCPFGFEGKNCELDVTCNIKNGRCEQFCKNS ADNKVVCSCTEGYRLAENQKSCEPAVPFPCGRVSVSQTSKLTRAETVFPDVDYVNSTEAETILDGPSPGSPTST EEGTSESATPESGPGSEPATSGSETPGTSESATPESGPGTSTEPSEGSAPGTSTEPSEGSAPGASSNITQSTQS FNDFTRVVGGEDAKPGQFPWQVVLNGKVDAFCGGSIVNEKWIVTAAHCVETGVKITVVAGEHNIEETEHTEQKR NVIRIIPHHNYNAAINKYNHDIALLELDEPLVLNSYVTPICIADKEYTNIFLKFGSGYVSGWGRVFHKGRSALV LQYLRVPLVDRATCLLSTKFTIYNNMFCAGFHEGGRDSCQGDSGGPHVTEVEGTSFLTGIISWGEECAMKGKYG IYTKVSRYVNWIKEKTKLTDKTHTCPPCPAPELLGGPSVFLFPPKPKDTLMISRTPEVTCVVVDVSHEDPEVKF NWYVDGVEVHNAKTKPREEQYNSTYRVVSVLTVLHQDWLNGKEYKCKVSNKALPAPIEKTISKAKGQPREPQVY TLPPSRDELTKNQVSLTCLVKGFYPSDIAVEWESNGQPENNYKTTPPVLDSDGSFFLYSKLTVDKSRWQQGNVF
SCSVMHEALHNHYTQKSLSLSPG SEQ ID NO: 165 (FIX-FXIa-AE288)*
YNSGKLEEFVQGNLERECMEEKCSFEEAREVFENTERTTEFWKQYVDGDQCESNPCLNGGSCKDDINSYECWCP FGFEGKNCELDVTCNIKNGRCEQFCKNSADNKVVCSCTEGYRLAENQKSCEPAVPFPCGRVSVSQTSKLTRAET VFPDVDYVNSTEAETILDNITQSTQSFNDFTRVVGGEDAKPGQFPWQVVLNGKVDAFCGGSIVNEKWIVTAAHC VETGVKITVVAGEHNIEETEHTEQKRNVIRIIPHHNYNAAINKYNHDIALLELDEPLVLNSYVTPICIADKEYT NIFLKFGSGYVSGWGRVFHKGRSALVLQYLRVPLVDRATCLRSTKFTIYNNMFCAGFHEGGRDSCQGDSGGPHV TEVEGTSFLTGIISWGEECAMKGKYGIYTKVSRYVNWIKEKTKLTGKLTRAETGGTSESATPESGPGSEPATSG SETPGTSESATPESGPGSEPATSGSETPGTSESATPESGPGTSTEPSEGSAPGSPAGSPTSTEEGTSESATPES GPGSEPATSGSETPGTSESATPESGPGSPAGSPTSTEEGSPAGSPTSTEEGTSTEPSEGSAPGTSESATPESGP GTSESATPESGPGTSESATPESGPGSEPATSGSETPGSEPATSGSETPGSPAGSPTSTEEGTSTEPSEGSAPGT
STEPSEGSAPGSEPATSGSETPGTSESATPESGPGTSTEPSEGSAP SEQ ID NO: 166 (FIX-Fc-Fc)**
MQRVNMIMAESPGLITICLLGYLLSAECTVFLDHENANKILNRPKRYNSGKLEEFVQGNLERECMEEKCSFEEA REVFENTERTTEFWKQYVDGDQCESNPCLNGGSCKDDINSYECWCPFGFEGKNCELDVTCNIKNGRCEQFCKNS ADNKVVCSCTEGYRLAENQKSCEPAVPFPCGRVSVSQTSKLTRAETVFPDVDYVNSTEAETILDNITQSTQSFN DFTRVVGGEDAKPGQFPWQVVLNGKVDAFCGGSIVNEKWIVTAAHCVETGVKITVVAGEHNIEETEHTEQKRNV IRIIPHHNYNAAINKYNHDIALLELDEPLVLNSYVTPICIADKEYTNIFLKFGSGYVSGWGRVFHKGRSALVLQ YLRVPLVDRATCLRSTKFTIYNNMFCAGFHEGGRDSCQGDSGGPHVTEVEGTSFLTGIISWGEECAMKGKYGIY TKVSRYVNWIKEKTKLTDKTHTCPPCPAPELLGGPSVFLFPPKPKDTLMISRTPEVTCVVVDVSHEDPEVKFNW YVDGVEVHNAKTKPREEQYNSTYRVVSVLTVLHQDWLNGKEYKCKVSNKALPAPIEKTISKAKGQPREPQVYTL PPSRDELTKNQVSLTCLVKGFYPSDIAVEWESNGQPENNYKTTPPVLDSDGSFFLYSKLTVDKSRWQQGNVFSC SVMHEALHNHYTQKSLSLSPGKRRRRSGGGGSGGGGSGGGGSGGGGSRRRRDKTHTCPPCPAPELLGGPSVFLF PPKPKDTLMISRTPEVTCVVVDVSHEDPEVKFNWYVDGVEVHNAKTKPREEQYNSTYRVVSVLTVLHQDWLNGK EYKCKVSNKALPAPIEKTISKAKGQPREPQVYTLPPSRDELTKNQVSLTCLVKGFYPSDIAVEWESNGQPENNY
KTTPPVLDSDGSFFLYSKLTVDKSRWQQGNVFSCSVMHEALHNHYTQKSLSLSPGK * Sombreamento cinza = polipeptídio; sublinhado = sequência de XTEN; negrito = Fc. ** SEQ ID NO: 67 da Patente US N°. 9.856.468, cuja íntegra encontra- se aqui incorporada a título de referência.
[00319] O polipeptídio FIX tem 55 kDa, e é sintetizado como uma cadeia prepropolipeptídica (SEQ ID NO: 125) composta de três regi- ões: um peptídio sinal de 28 aminoácidos (aminoácidos 1 a 28 da SEQ ID NO: 127), um propeptídio de 18 aminoácidos (aminoácidos 29 a 46), que é necessária para a gama-carboxilação de resíduos ácido glu- tâmico, e um fator IX maduro de 415 aminoácidos (SEQ ID NO: 125 ou 126). O propeptídio é uma sequência de 18 resíduos aminoacídicos N- terminal em relação ao domínio gama-carboxiglutamato. O propeptídio se liga à gama carboxilase vitamina K-dependente e é então clivado a partir do polipeptídio precursor de FIX por uma protease endógena, mais provalmene PACE (enzima de clivagem de aminoácidos básicos pareados), também conhecida como furina ou PCSK3. Sem a gama carboxilação, o domínio Gla é incapaz de ligar o cálcio para assumir a conformação correta necessária para ancorar a proteína em superfí- cies fosfolipídicas com carga negativa, deixando assim o fator IX não funcional. Mesmo que seja carboxilado, o domínio Gla também depen- de da clivagem do propeptídio para funcionar de forma apropriada, já que o propeptídio retido interfere nas mundaças conformacionais do domínio Gla necessário para ligação ótima ao cálcio e ao fosfolipídio. Nos seres humanos, o fator IX maduro resultante é secretad pelas cé-
lulas hepáticas na corrente sanguínea como um zimógeno inativo, uma proteína de cadeia única de 415 resíduos aminoacídicos que contém aproximadamente 17% em peso de carboidratos (Schmidt, A. E., et al. (2003) Trends Cardiovasc Med, 13: 39).
[00320] O FIX maduro é composto de vários domínios que em uma configuração N- para C-terminal são: um domínio GLA, um domínio EGF1, um domínio EGF2, um domínio peptídio de ativação (AP), e um domínio protease (ou catalítico). Um ligante curto conecta o domínio EGF2 ao domínio AP. o FIX contém dois peptídios de ativação forma- dos por R145-A146 e R180-V181, respectivamente. Subsequente à ativação, o FIX de cadeia única torna-se uma molécula de 2 cadeias, na qual as duas cadeias estão ligadas por uma ligação dissulfeto. Os fatores de coagulação podem sere geneticamente modificados por substituição de seus peptídios de ativação resultando em especificida- de de ativação alterada. Nos mamíferos, o FIX maduro deve ser ativa- do pelo fator XI ativado para produzir o fator IXa. O domínio protease proporciona, mediante ativação do FIX para FIXa, a atividade catalítica do FIX. O fator VIII ativado (FVIIIa) é o cofator específico para a ex- pressão completa da atividade de FIXa.
[00321] Em certas modalidades, um polipeptídio FIX compreende uma forma alélica Thr148 de FIX derivado do plasma e tem caracterís- ticas estruturais e funcionais semelhantes do FIX endógeno.
[00322] Muitas variantes funcionais do FIX são conhecidas na litera- tura. A publicação internacional número WO 02/040544 A3 revela mu- tantes que apresentam maior resistência à inibição pela heparina na página 4, linhas 9-30 e na página 15, linhas 6-31. A publicação inter- nacional número WO 03/020764 A2 revela mutantes de FIX com imu- nogenicidade de células T reduzidas nas Tabelas 2 e 3 (nas páginas 14-24), e na página 12, linhas 1-27. A publicação internacional número WO 2007/149406 A2 revela moléculas funcionais de FIX mutante que apresentam maior estabilidade das proteínas, meia-vida in vivo e in vitro aumentada, e maior resistência a proteases na página 4, linha 1 até página 19, linha 11. O documento WO 2007/149406 A2 também revela moléculas quiméricas e outras moléculas de FIX variante na página 19, linha 12 até a página 20, linha 9. A publicação internacional número WO 08/118507 A2 revela mutantes de FIX que apresentam maior atividade coagulante na página 5, linha 14 até a página 6, linha
5. A publicação internacional número WO 09/051717 A2 apresenta mutantes de FIX tendo um número maior de sítios de glicosilação N- ligados e/ou O-ligados, o que resulta em uma meia-vida e/ou recupe- ração aumentadas na página 9, linha 11 até a página 20, linha 2. A publicação internacional número WO 09/137254 A2 também revela mutantes do fator IX com números aumentados de sítios de glicosila- ção na página 2, parágrafo [006] até a página 5, parágrafo [011] e pá- gina 16, parágrafo [044] até a página 24, parágrafo [057]. A publicação internacional número WO 09/130198 A2 revela molélulas funcionais de FIX mutante que têm um número maior de sítios de glicosilação, o que resulta em uma meia-vida aumentada, na página 4, linha 26 até a pá- gina 12, linha 6. A publicação internacional número WO 09/140015 A2 revela mutantes funcionais de FIX que têm um número maior de resí- duos Cys, que podem ser usados para conjugação de polímeros (por exemplo, PEG), na página 11, parágrafo [0043] até a página 13, pará- grafo [0053]. Os polipeptídios FIX descritos na Publicação Internacio- nal N° PCT/US2011/043569 depositada em 11 de julho de 2011 e pu- blicada como WO 2012/006624 em 12 de janeiro de 2012 também se encontram aqui incorporados em sua íntegra a título de referência. Em algumas modalidades, o polipeptídio FIX compreende um polipeptídio FIX fusionado a uma albumina, por exemplo, FIX-albumina. Em certas modalidades, o polipeptídio FIX é IDELVION® ou rIX-FP.
[00323] Além disso, centenas de mutações não funcionais no FIX já foram identificadas em indivíduos hemofílicos, muitas das quais estão apresentadas na Tabela 6, nas páginas 11-14 da publicação internaci- onal número WO 09/137254 A2. Estas mutações não funcionais não estão incluídas na invenção, mas oferecem um guia adicional para quais são as mutações que mais provavelmente ou menos provavel- mente resultariam em um polipeptídio FIX funcional.
[00324] Em uma modalidade, o polipeptídio FIX (ou porção fator IX de um polipeptídio de fusão) compreende uma sequência de aminoá- cidos pelo menos 70%, pelo menos 80%, pelo menos 85%, pelo me- nos 90%, pelo menos 95%, pelo menos 96%, pelo menos 97%, pelo menos 98%, pelo menos 99%, ou 100% idêntica à sequência apresen- tada na SEQ ID NO: 1 ou 2 (aminoácidos 1 a 415 da SEQ ID NO: 125 ou 126), ou alternativamente, uma com uma sequência de propeptí- dios, ou com uma sequência de propeptídios ou sequêncial sinal (FIX de comprimento total). Em uma outra modalidade, o polipeptídio FIX compreende uma sequência de aminoácidos pelo menos 70%, pelo menos 80%, pelo menos 85%, pelo menos 90%, pelo menos 95%, pe- lo menos 96%, pelo menos 97%, pelo menos 98%, pelo menos 99%, ou 100% idêntica à sequência apresentada na SEQ ID NO: 2.
[00325] A atividade coagulante de FIX é expressa como Unidades Internacionais (IU). Uma IU de atividade de FIX corresponde aproxi- madamente à quantidade de FIX em um mililitro de plasma humano normal. Diversos ensaios encontram-se disponíveis para a medição da atividade de FIX, incluindo o ensaio de coagulação em um estágio (tempo de tromboplastina parcial ativada; aPTT), tempo de geração de trombina (TGA) e tromboelastometria rotacional (ROTEM®). A inven- ção contempla sequências que possuem homologia com sequências de FIX, fragmentos de sequências que são naturais, tais como de se- res humanos, primatas não humanos, mamíferos (incluindo animais domésticos), e variantes de sewquências não naturais que conservam pelo menos uma porção da atividade biológica ou função biológica de FIX e/ou que são úteis para prevenir, tratar, mediar, ou melhorar uma doença, deficiência, distúrbio ou condição relacionada com o fator de coagulação (por exemplo, episódios de sangramento relacionados a trauma, cirurgia, ou deficiência de um fator de coagulação). Sequên- cias com homologia com o FIX humano podem ser encontradas por técnicas tradicionais de busca por homologia, tais como NCBI BLAST.
[00326] Em certas modalidades, a sequência de FIX é códon- otimizada. Exemplos de sequências de FIX códon-otimizadas incluem, porém sem limitação, as SEQ ID NOs: 1 e 54-58 da Publicação Inter- nacional N° WO 2016/004113 A1, cuja íntegra encontra-se aqui incor- porada a título de referência. c. sequências de FVII e de Polinucleotídeo Codificando a Proteína
FVII
[00327] Em algumas modalidades, a molécula de ácido nucleico compreende uma primeira ITR, uma segunda ITR, e um cassete gené- tico codificando uma sequência alvo, onde a sequência alvo codifica uma proteína terapêutica, onde a proteína terapêutica compreende um polipeptídio fator VII. Em algumas modalidades, o polipeptídio FVII compreende FVII ou uma variante ou fragmento do mesmo, onde a variante ou fragmento mesmo tem atividade de FVII.
[00328] "Fator VII" ("FVII," ou "F7"; também denominado Fator 7, fator de coagulação VII, fator sérico VII, acelerador da conversão de protrombina sérica, SPCA, proconvertina e eptacog alfa) é uma serina protease que faz parte da cascata de coagulação. Em uma modalida- de, o fator de coagulação no ácido nucleico descrito neste pedido é FVII. O Fator VII ativado recombinante ("FVII") passou a ser ampla- mente usado para o tratamento de sangramento importante, tal como aquele que ocorre em pacientes com hemofilia A ou B, deficiência de fator de coagulação XI, FVII, função plaquetária defeituos, trombocito-
penia, ou doença de von Willebrand.
[00329] FVII ativado recombinante (rFVIIa; NOVOSEVEN®) é usado para tratar episódios de sangramento em (i) pacientes com hemofilia com anticorpos neutralizantes contra FVIII ou FIX (inibidores), (ii) paci- entes com deficiência de FVII, ou (iii) pacientes com hemofilia A ou B com inibidores passando por procedimentos cirúrgicos. No entanto, o NOVOSEVEN® apresenta pouca eficácia. Repetidas doses de FVIIa em alta concentração são frequentemente necessárias para controlar um sangramento, devido a sua baixa afinidade para plaquetas ativadas, meia-vida curta, e atividade enzimática pobre na ausência de fator te- cidual. Por conseguinte, há uma necessidade médica ainda não satis- feita de melhores opções de tratamento e prevenção com inibidores de FVIII e de FIX para pacientes hemofílicos e/ou com deficiência de FVII.
[00330] Em uma modalidade, o cassete genético codifica uma for- ma madura do FVII ou uma variante da mesma. O FVII inclui um do- mínio Gla, dois domínios EGF (EGF-1 e EGF-2), e um domínio serina protease (ou domínio peptidase S1) que é altamente conservado entre todos os membros da família da peptidase S1 de serina proteases, tal como, por exemplo, com quimiotripsina. O FVII ocorre como um zimó- geno de cadeia única (i.e., FVII ativável) e uma forma de duas cadeias totalmente ativável. C. Fatores de Crescimento
[00331] Em algumas modalidades, a molécula de ácido nucleico compreende uma primeira ITR, uma segunda ITR, e um cassete gené- tico codificando uma sequência alvo, onde a sequência alvo codifica uma proteína terapêutica, e onde a proteína terapêutica compreende um fator de crescimento. O fator de crescimento pode ser selecionado dentre qualquer fator de crescimento conhecido na literatura. Em al- gumas modalidades, o fator de crescimento é um hormônio. Em outras modalidades, o fator de crescimento é uma citocina. Em algumas mo-
dalidades, o fator de crescimento é uma quimiocina.
[00332] Em algumas modalidades, o fator de crescimento é adre- nomedullina(AM). Em algumas modalidades, o fator de crescimento é angiopoietina (Ang). Em algumas modalidades, o fator de crescimento é fator de motilidade autócrina. Em algumas modalidades, o fator de crescimento é uma proteína morfogenético óssea (BMP). Em algumas modalidades, a BMP é selecionada dentre BMP2, BMP4, BMP5, e BMP7. Em algumas modalidades, o fator de crescimento é um mem- bro da família de fatores neutrotróficos ciliares. Em algumas modalida- des, o membro da família de fatores neutrotróficos ciliares é selecio- nado dentre fator neurotrófico ciliar (CNTF), fator inibitória de leucemia (LIF), interleucina-6 (IL-6). Em algumas modalidades, o fator de cres- cimento é um fator estimulante de colônias. Em algumas modalidades, o fator estimulante de colônias é selecionado dentre fator estimulante de colônias de macrófagos (m-CSF), fator estimulante de colônias de granulócitos (G-CSF), e fator estimulante de colônias de granulócitos e macrófagos (GM-CSF). Em algumas modalidades, o fator de cresci- mento é um fator de crescimento epidérmico (EGF). Em algumas mo- dalidades, o fator de crescimento é uma efrina. Em algumas modalida- des, a efrina é selecionada dentre efrina A1, efrina A2, efrina A3, efrina A4, efrina A5, efrina B1, efrina B2, e efrina B3. Em algumas modalida- des, o fator de crescimento é eritropoietina (EPO). Em algumas moda- lidades, o fator de crescimento é um fator de crescimento de fibroblas- tos (FGF). Em algumas modalidades, o FGF é selecionado dentre FGF1, FGF2, FGF3, FGF4, FGF5, FGF6, FGF7, FGF8, FGF9, FGF10, FGF11, FGF12, FGF13, FGF14, FGF15, FGF16, FGF17, FGF18, FGF19, FGF20, FGF21, FGF22, e FGF23. Em algumas modalidades, o fator de crescimento é somatotrofina bovina fetal (FBS). Em algumas modalidades, o fator de crescimento é um membro da família de GDNF. Em algumas modalidades, membro da família de GDNF é se-
lecionado dentre fator neurotrófico derivado da linhagem de células gliais (GDNF), neurturina, persefina, e artemina.
Em algumas modali- dades, o fator de crescimento é fator de diferenciação de crescimento tipo 9 (GDF9). Em algumas modalidades, o fator de crescimento é fa- tor de crescimento de hepatócitos (HGF). Em algumas modalidades, o fator de crescimento é fator de crescimento derivado do hepatoma (HDGF). Em algumas modalidades, o fator de crescimento é insulina.
Em algumas modalidades, o fator de crescimento é um fator de cres- cimento semelhante à insulina.
Em algumas modalidades, o fator de crescimento semelhante à insulina é fator de crescimento semelhante à insulina tipo 1 (IGF-1) ou IGF-2. Em algumas modalidades, o fator de crescimento é uma interleucina (IL). Em algumas modalidades, a IL é selecionada dentre IL-1, IL-2, IL-3, IL-4, IL-5, IL-6, e IL-7. Em algumas modalidades, o fator de crescimento é fator de crescimento de cerati- nócitos (KGF). Em algumas modalidades, o fator de crescimento é fa- tor estimulante de migração (MSF). Em algumas modalidades, o fator de crescimento é proteína estimulante de macrófagos (MSP ou proteí- na semelhante ao fator de crescimento de hepatócitos (HGFLP)). Em algumas modalidades, o fator de crescimento é miostatina (GDF-8). Em algumas modalidades, o fator de crescimento é a neuregulina.
Em algumas modalidades, a neuregulina é selecionada dentre neuregulina 1 (NRG1), NRG2, NRG3, e NRG4. Em algumas modalidades, o fator de crescimento é uma neurotrofina.
Em algumas modalidades, o fator de crescimento é fator neurotrófico derivado do cérebro (BDNF). Em algumas modalidades, o fator de crescimento é fator de crescimento nervoso (NGF). Em algumas modalidades, o NGF é neurotrofina-3 (NT-3) ou NT-4. Em algumas modalidades, o fator de crescimento é fator de crescimento placentário (PGF). Em algumas modalidades, o fator de crescimento é fator de crescimento de derivados plaquetários (PDGF). Em algumas modalidades, o fator de crescimento é renalase
(RNLS). Em algumas modalidades, o fator de crescimento é fator de crescimento de células T (TCGF). Em algumas modalidades, o fator de crescimento é trombopoietina (TPO). Em algumas modalidades, o fator de crescimento é um fator transformante de crescimento. Em algumas modalidades, o fator transformante de crescimento é fator transfor- mante de crescimento alfa (TGF-α) ou TGF-β. Em algumas modalida- des, o fator de crescimento é fator de necrose tumoral alfa (TNF-α). Em algumas modalidades, o fator de crescimento é fator de cresci- mento endotelial vascular (VEGF). D. Micro RNAs (miRNAs)
[00333] MicroRNAs (miRNAs) são moléculas de RNA não codifica- doras pequenas (cerca de 18-22 nucleotídeos) que regulam negativa- tivamente a expressão gênica inibindo a translação ou a indução de degradação do RNA mensageiro (mRNA). Desde sua descoberta, os miRNAs já foram implicados em vários processos celulares incluindo apoptose, diferenciação e proliferação celular e já foi mostrado que eles desempanham um papel na carcinogênse. A capacidade dos miRNAs de regular a expressão gênica faz da expressão de miRNAs in vivo uma ferramenta valiosa em terapia genética.
[00334] Certos aspectos da presente invenção estão voltados para moléculas de ácido nucleico semelhantes a plasmídios compreenden- do uma primeira ITR, uma segunda ITR, e um cassete genético codifi- cando uma sequência alvo, onde a sequência alvo encodes a miRNA, e onde a primeira ITR e/ou a segunda ITR são uma ITR de um vírus não adeno-associado (por exemplo, a primeira ITR e/ou a segunda ITR são de um não-AAV). O miRNA pode ser qualquer miRNA conhe- cido na literatura. Em algumas modalidades, o miRNA infra-regula a expressão de um gene alvo. Em certas modalidades, o gene alvo é selecionado dentre SOD1, HTT, RHO, ou qualquer combinação das mesmas.
[00335] Em algumas modalidades, o cassete genético codifica um miRNA. Em algumas modalidades, o cassete genético codifica mais de um miRNA. Em algumas modalidades, o cassete genético codifica dois ou masi miRNAs diferentes. Em algumas modalidades, o cassete ge- nético codifica duas ou mais cópias do mesmo miRNA. Em algumas modalidades, o cassete genético codifica duas ou mais variantes da mesma proteína terapêutica. Em certas modalidades, o cassete gené- tico codifica um ou mais miRNAs e uma ou mais proteínas terapêuti- cas.
[00336] Em algumas modalidades, o miRNA é um miRNA de ocor- rência natural. Em algumas modalidades, o miRNA é um miRNA gene- ticamente modificado. Em algumas modalidades, o miRNA é um miR- NA artificial. Em certas modalidades, o miRNA compreende o miRNA geneticamente modificado com miHTT revelado por Evers et al., Mole- cular Therapy 26(9):1-15 (epub ahead of print June 2018). Em certas modalidades, o miRNA compreende o artificial miRNA miR SOD1 re- velado por Dirren et al., Annals of Clinical and Translational Neurology 2(2):167-84 (February 2015). Em certas modalidades, o miRNA com- preende miR-708, que direciona a RHO (vide Behrman et al., JCB 192(6):919-27 (2011).
[00337] Em algumas modalidades, o miRNA supra-regula a expres- são de um gene infra-regulando a expressão de um inibidor do gene. Em algumas modalidades, o inibidor é um inibidor natural, por exem- plo, do tipo selvagem. Em algumas modalidades, o inibidor resulta de um gene mutado, heterólogo, e/ou mal expresso. E. Porções Heterólogas
[00338] Em algumas modalidades, a molécula de ácido nucleico compreende uma primeira ITR, uma segunda ITR, e um cassete gené- tico codificando uma sequência alvo, onde a sequência alvo codifica uma proteína terapêutica, e onde a proteína terapêutica compreende pelo menos uma porção heteróloga. Em algumas modalidades, a por- ção heteróloga é fusionada ao terminal N ou ao terminal C da proteína terapêutica. Em outras modalidades, a porção heteróloga é inserida entre dois aminoácidos na proteína terapêutica.
[00339] Em algumas modalidades, a proteína terapêutica compre- ende um polipeptídio FVIII e uma porção heteróloga, que é inserida entre dois aminoácidos no polipeptídio FVIII. Em algumas modalida- des, a porção heteróloga é inserida no polipeptídio FVIII em um ou mais sítios inserção selecionados dentre aqueles da Tabela 5. Em al- gumas modalidades, a sequência de aminoácidos heteróloga pode ser inserida no polipeptídio fator de coagulação codificado pela molécula de ácido nucleico da invenção em qualquer sítio revelado na Publica- ção Internacional N° WO 2013/123457 A1, WO 2015/106052 A1 ou Publicação US N° 2015/0158929 A1, cujas íntegras encontram-se aqui incorporadas a título de referência. Em uma modalidade particular, a proteína terapêutica compreende um FVIII e uma porção heteróloga, onde a porção heteróloga é inserida no FVIII imediatamente a jusante do aminoácido 745 em relação ao FVIII maduro. Em uma modalidade particular, a proteína terapêutica compreende um FVIII e um XTEN onde o XTEN é inserido no FVIII imediatamente a jusante do aminoá- cido 745 em relação ao FVIII maduro. Em uma modalidade particular, o FVIII compreende uma deleção dos aminoácidos 746-1646, corres- pondendo ao FVIII humano maduro (SEQ ID NO:15), e a porção hete- róloga é inserida imediatamente a jusante do aminoácido 745, corres- pondendo ao FVIII humano maduro (SEQ ID NO:15). Tabela 5: Sítios de Inserção de Porções Heterólogas de FVIII Sítio de Domínio Sítio de Domínio Sítio de Domínio inserção inserção inserção 3 A1 375 A2 1749 A3 18 A1 378 A2 1796 A3 22 A1 399 A2 1802 A3
Sítio de Domínio Sítio de Domínio Sítio de Domínio inserção inserção inserção 26 A1 403 A2 1827 A3 40 A1 409 A2 1861 A3 60 A1 416 A2 1896 A3 65 A1 442 A2 1900 A3 81 A1 487 A2 1904 A3 116 A1 490 A2 1905 A3 119 A1 494 A2 1910 A3 130 A1 500 A2 1937 A3 188 A1 518 A2 2019 A3 211 A1 599 A2 2068 C1 216 A1 603 A2 2111 C1 220 A1 713 A2 2120 C1 224 A1 745 B 2171 C2 230 A1 1656 região a3 2188 C2 333 A1 1711 A3 2227 C2 336 A1 1720 A3 2332 CT 339 A1 1725 A3
[00340] Em algumas modalidades, a proteína terapêutica compre- ende um polipeptídio FIX e uma porção heteróloga, que é inserida en- tre dois aminoácidos no polipeptídio FIX. Em algumas modalidades, a porção heteróloga é inserida no polipeptídio FIX em um ou mais sítios de inserção selecionados dentre aqueles da Tabela 5. Em algumas modalidades, a sequência de aminoácidos heteróloga pode ser inseri- da no polipeptídio fator de coagulação codifica pela molécula de ácido nucleico da invenção em qualquer sítio revelado no Pedido Internacio- nal N° PCT/US2017/015879, cuja íntegra encontra-se aqui incorporada a título de referência. Em uma modalidade particular, a proteína tera- pêutica compreende um polipeptídio FIX e uma porção heteróloga, on- de a porção heteróloga é inserida no polipeptídio FIX imediatamente a jusante do aminoácido 166 em relação ao FIX maduro. Em uma moda-
lidade particular, a proteína terapêutica compreende um polipeptídio FIX e um XTEN, onde o XTEN é inserido no FIX imediatamente a ju- sante do aminoácido 166 em relação ao FVIII maduro. Tabela 6: Sítios de Inserção da Porção Heteróloga FIX Sítio de Domínio Sítio de Domínio Sítio de Domínio inserção inserção inserção 52 EGF1 149 AP 257 Catalítico 59 EGF1 162 AP 265 Catalítico 66 EGF1 166 AP 277 Catalítico 80 EGF1 174 AP 283 Catalítico 85 EGF2 188 Catalítico 292 Catalítico 89 EGF2 202 Catalítico 316 Catalítico 103 EGF2 224 Catalítico 341 Catalítico 105 EGF2 226 Catalítico 354 Catalítico 113 EGF2 228 Catalítico 392 Catalítico 129 Ligantes 230 Catalítico 403 Catalítico 142 Ligantes 240 Catalítico 413 Catalítico
[00341] Em outras modalidades, as proteínas terapêuticas da in- venção compreendem ainda duas, três, quatro, cinco, seis, sete ou oito sequências de nucleotídeos heterólogos. Em algumas modalida- des, todas as porções heterólogas são idênticas. Em algumas modali- dades, pelo menos uma porção heteróloga é diferente das outras por- ções heterólogas. Em algumas modalidades, a invenção pode com- preender duas, três, quatro, cinco, seis, ou mais de sete porções hete- rólogas in tandem.
[00342] Em algumas modalidades, a porção heteróloga aumenta a meia-vida (é um "prolongador de meia-vida") da proteína terapêutica.
[00343] Em algumas modalidades, a porção heteróloga é um peptí- dio ou um polipeptídio com características não estruturadas ou estrutu- radas que estão associadas ao prolongamento da meia-vida in vivo quando incorporado em uma proteína da invenção. Exemplos não limi- tativos inluem albumina, fragmentos de albumina, fragmentos Fc de imunoglobulinas, o peptídeio C-terminal (CTP) da subunidade β da go- nadotropina coriônica humana, uma sequência de HAP, uma sequên- cia de XTEN, uma transferrina ou um fragmento da mesma, um poli- peptídio PAS, ligantes de poliglicina, ligantes de polisserina, porções de ligação à albumina, ou quaisquer fragmentos, derivados, variantes, ou combinações desses polipeptídios. Em uma modalidade particular, a sequência de aminoácidos heterólogos é uma região constante da imunoglobulina ou uma porção da mesma, transferrina, albumina, ou uma sequência de PAS. Em alguns aspectos, uma porção heteróloga incluir o fatr de von Willebrand ou um fragmento do mesmo. Em outros aspectos relacionados, uma porção heteróloga pode incluir um sítio de ligação (por exemplo, um aminoácido cisteína) para uma porção não polipeptídica tal como polietileno glicol (PEG), hidroxietil amido (HES), ácido polissiálico, ou quaisquer derivados, variantes, ou combinações destes elementos. Em alguns aspectos, uma porção heteróloga com- preende um aminoácido cisteína que funciona como um sítio de liga- ção para uma porção não polipeptídica tal como polietileno glicol (PEG), hidroxietil amido (HES), ácido polissiálico, ou quaisquer deriva- dos, variantes, ou combinações destes elementos.
[00344] Em uma modalidade específica, uma primeira porção hete- róloga é uma molécula prolongadora da meia-vida que é conhecida na literatura, e uma segunda porção heteróloga é uma molécula prolon- gadora da meia-vida que é conhecida na literatura. Em certas modali- dades, a primeira porção heteróloga (por exemplo, uma primeira por- ção Fc) e a segunda porção heteróloga (por exemplo, uma segunda porção Fc) são associadas uma à outra para formar um dímero. Em uma modalidade, a segunda porção heteróloga é uma segunda porção Fc, onde a segunda porção Fc é ligada ou associada à primeira porção heteróloga, por exemplo, a primeira porção Fc. Por exemplo, a segun- da porção heteróloga (por exemplo, a segunda porção Fc) pode ser ligada à primeira porção heteróloga (por exemplo, a primeira porção Fc) por um ligante ou pode ser associada à primeira porção heteróloga por uma ligação covalente ou não covalente.
[00345] Em algumas modalidades, a porção heteróloga é um poli- peptídio compreendendo, consistindo essencialmente em, ou consis- tindo em pelo menos cerca de 10, pelo menos cerca de 100, pelo me- nos cerca de 200, pelo menos cerca de 300, pelo menos cerca de 400, pelo menos cerca de 500, pelo menos cerca de 600, pelo menos cerca de 700, pelo menos cerca de 800, pelo menos cerca de 900, pelo me- nos cerca de 1000, pelo menos cerca de 1100, pelo menos cerca de 1200, pelo menos cerca de 1300, pelo menos cerca de 1400, pelo me- nos cerca de 1500, pelo menos cerca de 1600, pelo menos cerca de 1700, pelo menos cerca de 1800, pelo menos cerca de 1900, pelo me- nos cerca de 2000, pelo menos cerca de 2500, pelo menos cerca de 3000, ou pelo menos cerca de 4000 aminoácidos. Em outras modali- dades, a porção heteróloga é um polipeptídio compreendendo, consis- tindo essencialmente em, ou consistindo em cerca de 100 a cerca de 200 aminoácidos, cerca de 200 a cerca de 300 aminoácidos, cerca de 300 a cerca de 400 aminoácidos, cerca de 400 a cerca de 500 amino- ácidos, cerca de 500 a cerca de 600 aminoácidos, cerca de 600 a cer- ca de 700 aminoácidos, cerca de 700 a cerca de 800 aminoácidos, cerca de 800 a cerca de 900 aminoácidos, ou cerca de 900 a cerca de 1000 aminoácidos.
[00346] Em certas modalidades, uma porção heteróloga melhora uma ou mais propriedades farmacocinéticas da proteína terapêutica sem afetar de forma significativa sua atividade ou função biológica.
[00347] Em certas modalidades, uma porção heteróloga aumenta a meia-vida in vivo e/ou in vitro da proteína terapêutica da invenção. Em outras modalidades, uma porção heteróloga facilita a visualização ou localização da proteína terapêutica da invenção ou de um fragmento da mesma (por exemplo, um fragmento compreendendo uma porção heteróloga depois da clivagem proteolítica da proteína FVIII). A visuali- zação e/ou localização da proteína terapêutica da invenção ou de um fragmento da mesma pode ser in vivo, in vitro, ex vivo, ou combina- ções das mesmas.
[00348] Em outras modalidades, uma porção heteróloga aumenta a estabilidade da proteína terapêutica da invenção ou de um fragmento da mesma (por exemplo, um fragmento compreendendo uma porção heteróloga depois da clivagem proteolítica da proteína terapêutica, por exemplo, um fator de coagulação). Conforme usado neste pedido, o termo "estabilidade" refere-se a uma medida reconhecida na literatura da manutenção de uma ou mais propriedades físicas da proteína tera- pêutica em resposta a uma condição ambiental (por exemplo, uma temperatura elevada ou baixa). Em certos aspectos, a propriedade fí- sica pode ser a manutenção da estrutura covalente da proteína tera- pêutica (por exemplo, a ausência de clivagem proteolítica, oxidação ou deamidação indesejada). Em outros aspectos, a propriedade física também pode ser a presença da proteína terapêutica em um estado apropriadamente enrolado (por exemplo, a ausência de agregados ou precipitados solúveis ou insolúveis). Em um aspecto, a estabilidade da proteína terapêutica é medida por análise de uma propriedade biofísi- ca da proteína terapêutica, por exemplo, estabilidade térmica, perfil de desdobramento do pH, remoção estável da glicosilação, solubilidade, função bioquímica (por exemplo, capacidade de se ligar a uma proteí- na, receptor ou ligante), etc., e/ou combinações dos mesmos. Em um outro aspecto, a função bioquímica é demonstrada pela afinidade de ligação da interação. Em um aspecto, uma medida da estabilidade da proteína é a estabilidade térmica, i.e., a resistência ao desafio térmico. A estabilidade pode ser medida por métodos conhecidos na literatura, tais como HPLC (cromatografia líquida de alta eficiência), SEC (croma-
tografia de exclusão por tamanho), DLS (espalhamento de luz dinâmi- co), etc. Métodos para medir a estabilidade térmica incluem, peptídio sinal, calorimetra diferencial de varredura (DSC), fluorimetrial diferen- cial de varredura (DSF), dicroismo circular (CD), e ensaio do desafio térmico.
[00349] Em certos aspectos, uma proteína terapêutica codificada pela molécula de ácido nucleico da invenção compreende pelo menos um prolongador de meia-vida, i.e., uma porção heteróloga que aumen- ta a meia-vida in vivo da proteína terapêutica em relação à meia-vida in vivo da proteína terapêutica correspondente sem tal porção heteró- loga. A meia-vida in vivo de uma proteína terapêutica pode ser deter- minada por qualquer método conhecido pelos especialistas na técnica, por exemplo, ensaios de atividade (por exemplo, ensaio cromogênica ou um ensaio de aPTT coagulante em um estágio onde a proteína te- rapêutica compreende um polipeptídio FVIII), ELISA, ROTEM®, etc.
[00350] Em algumas modalidades, a presença de um ou mais pro- longadores de meia-vida resulta no aumento da meia-vida da proteína terapêutica em relação à meia-vida da proteína correspondente sem tal um ou mais prolongadores de meia-vida. A meia-vida da proteína terapêutica compreendendo um prolongador de meia-vida é pelo me- nos cerca de 1,5 vez, pelo menos cerca de 2 vezes, pelo menos cerca de 2,5 vezes, pelo menos cerca de 3 vezes, pelo menos cerca de 4 vezes, pelo menos cerca de 5 vezes, pelo menos cerca de 6 vezes, pelo menos cerca de 7 vezes, pelo menos cerca de 8 vezes, pelo me- nos cerca de 9 vezes, pelo menos cerca de 10 vezes, pelo menos cer- ca de 11 vezes, ou pelo menos cerca de 12 vezes maior que a meia- vida in vivo da proteína terapêutica correspondente sem tal prolonga- dor de meia-vida.
[00351] Em uma modalidade, a meia-vida da proteína terapêutica compreendendo um prolongador de meia-vida é cerca de 1,5 vez a cerca de 20 vezes, cerca de 1.5 vezes a cerca de 15 vezes, ou cerca de 1.5 vezes a cerca de 10 vezes maior que a meia-vida in vivo da proteína terapêutica correspondente sem tal prolongador de meia-vida. Em uma outra modalidade, a meia-vida da proteína terapêutica com- preendendo um prolongador de meia-vida é aumentada cerca de 2 ve- zes a cerca de 10 vezes, cerca de 2 vezes a cerca de 9 vezes, cerca de 2 vezes a cerca de 8 vezes, cerca de 2 vezes a cerca de 7 vezes, cerca de 2 vezes a cerca de 6 vezes, cerca de 2 vezes a cerca de 5 vezes, cerca de 2 vezes a cerca de 4 vezes, cerca de 2 vezes a cerca de 3 vezes, cerca de 2,5 vezes a cerca de 10 vezes, cerca de 2,5 ve- zes a cerca de 9 vezes, cerca de 2,5 vezes a cerca de 8 vezes, cerca de 2,5 vezes a cerca de 7 vezes, cerca de 2,5 vezes a cerca de 6 ve- zes, cerca de 2,5 vezes a cerca de 5 vezes, cerca de 2,5 vezes a cer- ca de 4 vezes, cerca de 2,5 vezes a cerca de 3 vezes, cerca de 3 ve- zes a cerca de 10 vezes, cerca de 3 vezes a cerca de 9 vezes, cerca de 3 vezes a cerca de 8 vezes, cerca de 3 vezes a cerca de 7 vezes, cerca de 3 vezes a cerca de 6 vezes, cerca de 3 vezes a cerca de 5 vezes, cerca de 3 vezes a cerca de 4 vezes, cerca de 4 vezes a cerca de 6 vezes, cerca de 5 vezes a cerca de 7 vezes, ou cerca de 6 vezes a cerca de 8 vezes em relação à meia-vida in vivo da proteína terapêu- tica correspondente sem tal prolongador de meia-vida.
[00352] Em outras modalidades, a meia-vida da proteína terapêuti- ca compreendendo um prolongador de meia-vida é pelo menos cerca de 17 horas, pelo menos cerca de 18 horas, pelo menos cerca de 19 horas, pelo menos cerca de 20 horas, pelo menos cerca de 21 horas, pelo menos cerca de 22 horas, pelo menos cerca de 23 horas, pelo menos cerca de 24 horas, pelo menos cerca de 25 horas, pelo menos cerca de 26 horas, pelo menos cerca de 27 horas, pelo menos cerca de 28 horas, pelo menos cerca de 29 horas, pelo menos cerca de 30 horas, pelo menos cerca de 31 horas, pelo menos cerca de 32 horas,
pelo menos cerca de 33 horas, pelo menos cerca de 34 horas, pelo menos cerca de 35 horas, pelo menos cerca de 36 horas, pelo menos cerca de 48 horas, pelo menos cerca de 60 horas, pelo menos cerca de 72 horas, pelo menos cerca de 84 horas, pelo menos cerca de 96 horas, ou pelo menos cerca de 108 horas.
[00353] Em ainda outras modalidades, a meia-vida da proteína te- rapêutica compreendendo um prolongador de meia-vida é cerca de 15 horas a cerca de duas semanas, cerca de 16 horas a cerca de uma semana, cerca de 17 horas a cerca de uma semana, cerca de 18 ho- ras a cerca de uma semana, cerca de 19 horas a cerca de uma sema- na, cerca de 20 horas a cerca de uma semana, cerca de 21 horas a cerca de uma semana, cerca de 22 horas a cerca de uma semana, cerca de 23 horas a cerca de uma semana, cerca de 24 horas a cerca de uma semana, cerca de 36 horas a cerca de uma semana, cerca de 48 horas a cerca de uma semana, cerca de 60 horas a cerca de uma semana, cerca de 24 horas a cerca de seis dias, cerca de 24 horas a cerca de cinco dias, cerca de 24 horas a cerca de quatro dias, cerca de 24 horas a cerca de três dias, ou cerca de 24 horas a cerca de dois dias.
[00354] Em algumas modalidades, a meia-vida média por indivíduo da proteína terapêutica compreendendo um prolongador de meia-vida é cerca de 15 horas, cerca de 16 horas, cerca de 17 horas, cerca de 18 horas, cerca de 19 horas, cerca de 20 horas, cerca de 21 horas, cerca de 22 horas, cerca de 23 horas, cerca de 24 horas (1 dia), cerca de 25 horas, cerca de 26 horas, cerca de 27 horas, cerca de 28 horas, cerca de 29 horas, cerca de 30 horas, cerca de 31 horas, cerca de 32 horas, cerca de 33 horas, cerca de 34 horas, cerca de 35 horas, cerca de 36 horas, cerca de 40 horas, cerca de 44 horas, cerca de 48 horas (2 dias), cerca de 54 horas, cerca de 60 horas, cerca de 72 horas (3 dias), cerca de 84 horas, cerca de 96 horas (4 dias), cerca de 108 ho-
ras, cerca de 120 horas (5 dias), cerca de six dias, cerca de seven dias (one semana), cerca de eight dias, cerca de nine dias, cerca de 10 di- as, cerca de 11 dias, cerca de 12 dias, cerca de 13 dias, ou cerca de 14 dias.
[00355] Um ou mais prolongadores de meia-vida podem ser fusio- nados ao terminal C ou al terminal N da proteína terapêutica ou inseri- dos na proteína terapêutica.
1. Uma Região Constante de Imunoglobulina ou uma Porção da Mesma
[00356] Em um outro aspecto, uma porção heteróloga compreende uma ou mais regiões constantes de imunoglobulina ou porções das mesmas (por exemplo, uma região Fc). Em uma modalidade, uma mo- lécula de ácido nucleico isolada da invenção compreende ainda uma sequência de aminoácidos heterólogos que codifica uma região cons- tante de imunoglobulina ou uma porção da mesma. Em algumas mo- dalidades, região constante de imunoglobulina ou porção da mesma é uma região Fc.
[00357] Uma região constante de imunoglobulina é compreendida de dois domínios denotados domínios CH (cadeia constante) (CH1, CH2, etc.). Dependendo do isótipo, (i.e., IgG, IgM, IgA IgD, ou IgE), a região constante pode ser compreendia de três ou quatro domínios CH. Alguns isótipos (por exemplo, IgG) de regiõies constantes também contêm uma região de dobradiça. Vide Janeway et al. 2001, Immuno- biology, Garland Publishing, N.Y., N.Y.
[00358] Uma região constante de imunoglobulina ou uma porção da mesma da presente invenção pode ser obtida de inúmeras fontes dife- rentes. Em uma modalidade, uma região constante de imunoglobulina ou uma porção da mesma é derivada de uma imunoglobulina humana. Entende-se, no entanto, que a região constante de imunoglobulina ou uma porção da mesma pode ser derivada de uma imunoglobulina de uma outra espécie de mamífero, incluindo, por exemplo, um roedor (por exemplo, um camundongo, rato, coelho, porquinho-da-índia) ou uma espécie de primata não humano (por exemplo, chimpanzé, maca- co). Além disso, a região constante de imunoglobulina ou uma porção da mesma pode ser derivada de qualquer classe de imunoglobulina, incluindo IgM, IgG, IgD, IgA e IgE, e qualquer isótipo de imunoglobuli- na, incluindo IgG1, IgG2, IgG3 e IgG4. Em uma modalidade, o isótipo humano IgG1 é usado.
[00359] Uma variedade de sequências gênicas da região constante de imunoglobulina (por exemplo, sequências gênicas da região cons- tante humana) encontra-se disponível na forma de depósitos abertos ao público. É possível selecionar sequências de domínios de região constante tendo uma função efetora particular (ou sem uma função efetora particular) ou com uma modificação particular para reduzir a imunogenicidade. Muitas sequências de anticorpos e genes codifica- dores de anticorpos já foram publicadas e sequências da região cons- tante de Ig adequadas (por exemplo, sequências de dobradiça, CH2, e/ou CH3, ou porções das mesmas) podem ser derivadas dessas se- quências por técnicas reconhecidas na literatura. O material genético obtido por qualquer um dos métodos acima pode ser então alterado ou sintetizado para obter os polipeptídios da presente invenção. Será ain- da observado que o escopo desta invenção abrange alelos, variantes e mutações de sequências de DNA da região constante.
[00360] As sequências da região constante de imunoglobulina ou uma porção da mesma podem ser clonadas, por exemplo, pela reação em cadeia da polimerase e iniciadores que são selecionados para am- plificar o domínio de interesse. Para clonar uma sequência da região constante de imunoglobulina ou uma porção da mesma a partir de um anticorpo, o mRNA pode ser isolado do hibridoma, baço, ou células linfáticas, transcrito de forma reversa no DNA, e genes do anticorpo amplificados por PCR. Métodos de amplificação por PCR estão descri- tos nas Patentes US N° 4.683.195; 4.683.202; 4.800.159; 4.965.188; e, por exemplo, em "PCR Protocols: A Guide to Methods and Applica- tions" Innis et al. eds., Academic Press, San Diego, CA (1990); Ho et al. 1989. Gene 77:51; Horton et al. 1993. Methods Enzymol. 217:270). A PCR pode ser iniciada por iniciadores de consenso da região cons- tante ou por iniciadores mais específicos baseados nas sequências publicadas de DNA e de aminoácidos da cadeia pesada e da cadeia leve. PCR também pode ser usada para isolar clones de DNA codifi- cando as cadeias pesadas e leves do anticorpo. Neste caso, é possí- vel buscar nas bibliotecas iniciadores de consenso ou sondas homólo- gas maiores, tais como sondas da região constante de camundongos. Inúmeros conjutos de iniciadores adequados para amplificação de ge- nes de anticorpos são conhecidos na literatura (por exemplo, iniciado- res 5’ baseados na sequência N-terminal de anticorpos purificados (Benhar and Pastan. 1994. Protein Engineering 7:1509); amplificação rápida das extremidades do cDNA (Ruberti, F. et al. 1994. J. Immunol. Methods 173:33); sequências condutoras do anticorpo (Larrick et al. 1989 Biochem. Biophys. Res. Commun. 160:1250). A clonagem de sequências de anticorpos está descrita ainda em Newman et al., Pa- tente US N° 5.658.570, depositada em 25 de janeiro de 1995, aqui in- corporada a título de referência.
[00361] Uma região constante de imunoglobulina usada neste pedi- do pode incluir todos os domínios e a região de dobradiça ou porções da mesma. Em uma modalidade, a região constante de imunoglobulina ou uma porção da mesma compreende o domínio CH2, o domínio CH3, e uma região de dobradiça, i.e., uma região Fc ou um parceiro de ligação ao FcRn.
[00362] Conforme usado neste pedido, o termo "região Fc" é defini- do como a porção de um polipeptídio que corresponde à porção Fc da ig nativa, i.e., formada pela associação dimérica dos respectivos do- mínios Fc de suas duas caeias pesadas. Uma região Fc nativa forma um homodímero com uma outra região Fc. Em contraste, o termo "re- gião Fc fusionada geneticamente" ou "região Fc de cadeia única" (re- gião (scFc), conforme usado neste pedido, refere-se a uma região Fc dimérica sintética compreendida de domínios Fc geneticamente liga- dos em uma única cadeia polipeptídica (i.e., codificda em uma única sequência gênica contígua). Vide Publicação Internacional N° WO 2012/006635, cuja íntegra encontra-se aqui incorporada a título de re- ferência.
[00363] Em uma modalidade, uma "região Fc" refere-se à porção de uma única cadeia pesada da Ig que começa na região de dobradiça imediatamente a montante do sítio de clivagem da papaína (i.e. resí- duo 216 na IgG, considerando o primeiro resíduo da região constante da cadeia pesada como sendo o 114) e que termina no terminal C do anticorpo. Por conseguinte, uma região Fc completa compreende pelo menos um domínio de dobradiça, um domínio CH2, e um domínio CH3.
[00364] Uma região constante de imunoglobulina ou uma porção da mesma pode ser um parceiro de ligação ao FcRn. O FcRn é ativo em células endoteliais adultas e expresso no lúmen dos intestinos, das vias aéreas pulmonares, das superfícies nasais, das superfícies vagi- nais, e das superfícies do cólon e do reto (Patente US N° 6.485.726). Um parceiro de ligação ao FcRn é uma porção de uma imunoglobulina que se liga ao FcRn.
[00365] O receptor de FcRn foi isolado de diversas espécies de mamíferos, inclusive seres humanos. As sequências do FcRn humano, do FcRn de macaco, do FcRn de rato, e do FcRn de camundongo são conhecidas (Story et al. 1994, J. Exp. Med. 180:2377). O receptor de FcRn liga a IgG (mas não outras classes de imunoglobulina tais como
IgA, IgM, IgD, e IgE) em um pH relativamente baixo, transporta ativa- mente a IgG transcelularmente em uma direção luminal para a serosa, e então libera a IgG em um pH relativamente mais alto encontrado nos fluidos intersticiais. Ele é expresso no tecido epitelial adulto (Patentes US N° 6.485.726, 6,030,613, 6,086,875; WO 03/077834; US2003- 0235536A1) incluindo o epitélio pulmonar e intestinal (Israel et al. 1997, Immunology 92:69), o epitélio tubular renal proximal (Kobayashi et al. 2002, Am. J. Physiol. Renal Physiol. 282:F358) assim como o epitélio nasal, superfícies vaginais, e superfícies da árvore biliar.
[00366] Parceiros de ligação ao FcRn úteis na presente invenção abrangem moléculas que podem ser especificamente ligadas pelo re- ceptor de FcRn incluindo IgG total, o fragmento Fc da IgG, e outros fragmentos que incluem a região de ligação completa do receptor de FcRn. A região da porção Fc da iff que se liga ao receptor de FcRn foi descrita com base na cristalografia de raios X (Burmeister et al. 1994, Nature 372:379). A principal área de contato da Fc com o FcRn fica próxima à junção dos domínios CH2 e CH3. Todos os contatos Fc- FcRn se encontram em uma única cadeia pesada da Ig. Os parceiros de ligação ao FcRn incluem IgG total, o fragmento Fc da iff, e outros fragmentos da IgG que incluem a região de ligação completa do FcRn. Os principais sítios de contato incluem os resíduos aminoacídicos 248, 250-257, 272, 285, 288, 290-291, 308-311, e 314 do domínio CH2 e os resíduos aminoacídicos 385-387, 428, e 433-436 do domínio CH3. To- das as referências feitas à numeração dos aminoácidos ou aos frag- mentos de imunoglobulina, ou regiões, baseiam-se em Kabat et al. 1991, Sequences of Proteins of Immunological Interest, U.S. De- partment of Public Health, Bethesda, Md.
[00367] Regiões Fc ou parceiros de ligação ao FcRn ligados ao FcRn podem ser efetivamente deslocados atráves das barreiras epite- liais pelo FcRn, proporcionando assim um meio não -invasivo para administrar sistemicamente uma molécula terapêutica desejada. Adici- onalmente, proteínas de fusão compreendendo uma região Fc ou um parceiro de ligação ao FcRn sofrem endocitose pelas células que ex- pressam o FcRn. Mas em vez de serem marcadas para degradação, essas proteínas de fusão são novamente recicladas para a circulação, aumentando assim a meia-vida in vivo dessas proteínas. Em certas modalidades, as porções de reigões constantes da imunoglobulina são uma região Fc ou um parceiro de ligação ao FcRn que tipicamente se associa, via ligações dissulfeto e outras interações inespecíficas, a uma outra região Fc ou a um outro parceiro de ligação ao FcRn para formar dímeros e multímeros de ordens mais altas.
[00368] Dois receptores de FcRn podem ligar uma única molécula de Fc. Os dados cristalográficos sugerem que cada molécula de FcRn liga um único polipeptídio do homodímero Fc. Em uma modalidade, a ligação do parceiro de ligação FcRn, por exemplo, um fragmento Fc de uma IgG, a uma molécula biologicamente ativa proporciona um meio para a distribuição da molécula biologicamente ativa por via oral, bu- cal, sublingual, retal, vaginal, como um aerossol administrado por via nasal ou por uma pulmonar, ou por uma via ocular. Em uma outra mo- dalidade, a proteína fator de coagulação pode ser adminihstrada de forma invasiva, por exemplo, por via subcutânea, por via intravenosa.
[00369] Uma região do parceiro de ligação ao FcRn é uma molécula ou porção da mesma que pode ser especificamente ligada pelo recep- tor de FcRn com o consequente transporte ativo pelo receptor de FcRn da região Fc. Ligado especificamente refere-se a duas moléculas for- mando um complexo que é relativamente estável em condições fisio- lógicas. A ligação específica caracteriza-se por uma afinidade alta e uma capacidade baixa a moderada, diferentemente da ligação inespe- cífica que geralmente tem uma afinidade baixa com uma capacidade moderada a alta. Tipicamente, a ligação é considerada específica quando a constante de afinidade KA é maior que 106 M-1, ou maior que 108 M-1. Se necessário, a ligação inespecífica pode ser reduzida sem afetar substancialmente a ligação específica variando-se as condições de ligação. As condições de ligação apropriadas tais como concentra- ção das moléculas, força iônica solução, temperatura, tempo permitido para a ligação, concentração de um agente bloqueador (por exemplo, albumina sérica, caseína de leite), etc., podem ser otimizadas pelo es- pecialista na técnica por meio de técnicas de rotina.
[00370] Em certas modalidades, uma proteína terapêutica codifica- da pela molécula de ácido nucleico da invenção compreende uma ou mais regiões Fc truncadas que mesmo assim são suficientes para con- ferir para conferior propriedades de ligação ao receptor de Fc (FcR) à região Fc. Por exemplo, a porção de uma região Fc que se liga ao FcRn (i.e., a porção de ligação ao FcRn) compreende cerca de amino- ácidos 282-438 de IgG1, numeração EU (com os sítios de contato pri- mário sendo os aminoácidos 248, 250-257, 272, 285, 288, 290-291, 308-311, e 314 do domínio CH2 e os resíduos aminoacídicos 385-387, 428, e 433-436 do domínio CH3). Assim sendo, uma região Fc da in- venção pode compreender ou consistir em uma porção de ligação ao FcRn. As porções de ligação ao FcRn podem ser derivadas de cadeias pesadas de qualquer isótipo, incluindo IgGl, IgG2, IgG3 e IgG4. Em uma modalidade, é usada uma porção de ligação ao FcRn de um anti- corpo do isótipo humano IgG1. Em uma outra modalidade, é usada uma porção de ligação ao FcRn de um anticorpo do isótipo humano IgG4.
[00371] A região Fc pode ser obtida de inúmeras fontes diferentes. Em uma modalidade, uma região Fc do polipeptídio é derivada de uma imunoglobulina humana. Fica entendido, no entanto, que uma porção Fc pode ser derivada de uma imunoglobulina de outra espécie de ma- mífero, incluindo, por exemplo, um roedor (por exemplo, um camun-
dongo, rato, coelho, porquinho-da-índia) ou uma espécie primata não humano (por exemplo, chimpanzé, macaco). Além disso, o polipeptídio dos domínios Fc ou porções dos mesmos pode ser derivado de qual- quer classe de imunoglobulina, incluindo IgM, IgG, IgD, IgA e IgE, e qualquer isótipo de imunoglobulina, incluindo IgG1, IgG2, IgG3 e IgG4. Em uma outra modalidade, o isótipo humano IgG1 é usado.
[00372] Em certas modalidades, a variante de Fc confere uma alte- ração em pelo menos uma função efetora conferida por uma porção Fc compreendendo o referido domínio Fc do tipo selvagem (por exemplo, um aumento ou redução na capacidade da região Fc de se ligar a re- ceptores de Fc (por exemplo, FcγRI, FcγRII, ou FcγRIII) ou a proteínas do complemento (por exemplo, C1q), ou de desencadear citotoxicida- de anticorpo-dependente (ADCC), fagocitocse, ou citotoxicidade com- plemento-dependente (CDCC)). Em outras modalidades, a variante de Fc oferece um resíduo cisteína geneticamente modificado.
[00373] A região Fc da invenção pode empregar variantes de Fc reconhecidas na literatura que sabidamente conferem uma alteração (por exemplo, um aumento ou redução) na função efetora e/ou na liga- ção ao FcR ou ao FcRn. Especificamente, uma região Fc da invenção pode incluir, por exemplo, uma alteração (por exemplo, uma substitui- ção) em uma ou mais das posições aminoacídicas apresentadas nas Publicações PCT Internacionais WO88/07089A1, WO96/14339A1, WO98/05787A1, WO98/23289A1, WO99/51642A1, WO99/58572A1, WO00/09560A2, WO00/32767A1, WO00/42072A2, WO02/44215A2, WO02/060919A2, WO03/074569A2, WO04/016750A2, WO04/029207A2, WO04/035752A2, WO04/063351A2, WO04/074455A2, WO04/099249A2, WO05/040217A2, WO04/044859, WO05/070963A1, WO05/077981A2, WO05/092925A2, WO05/123780A2, WO06/019447A1, WO06/047350A2, and WO06/085967A2; Publicações de Patente US N° US2007/0231329,
US2007/0231329, US2007/0237765, US2007/0237766, US2007/0237767, US2007/0243188, US20070248603, US20070286859, US20080057056; ou Patentes US 5.648.260;
5.739.277; 5.834.250; 5.869.046; 6.096.871; 6.121.022; 6.194.551;
6.242.195; 6.277.375; 6.528.624; 6.538.124; 6.737.056; 6.821.505;
6.998.253; 7.083.784; 7.404.956, e 7.317.091, todas aqui incorporadas a título de referência. Em uma modalidade, a alteração específica (por exemplo, a substituição específica de um ou mais aminoácidos revela- dos no estado da técnica) pode ser feita em uma ou mais das posições aminoacídicas descritas. Em uma outra modalidade, é possível fazer uma alteração diferente em uma ou mais das posições aminoacídicas descritas (por exemplo, a substituição diferente de uma ou mais das posições aminoacídicas descritas descritas no estado da técnica).
[00374] A região Fc ou parceiro de ligação ao FcRn da IgG pode ser modificado de acordo com os procedimentos bastante conhecidos tal como mutagênese sítio-direcionada, entre outros, para produzir fra- gmentos modificados de IgG ou Fc ou porções dos mesmos que serão ligados pelo FcRn. Tais modificações incluem modificações remotas dos sítios de contato do FcRn assim como modificações nos sítios de contato que preservam ou mesmo aumentam a ligação ao FcRn. Por exemplo, os seguintes resíduos aminoacídicos únicos na Fc da IgG1 humana (Fc γ1) podem ser substituídos em perda significativa da afi- nidade de ligação ao Fc para FcRn: P238A, S239A, K246A, K248A, D249A, M252A, T256A, E258A, T260A, D265A, S267A, H268A, E269A, D270A, E272A, L274A, N276A, Y278A, D280A, V282A, E283A, H285A, N286A, T289A, K290A, R292A, E293A, E294A, Q295A, Y296F, N297A, S298A, Y300F, R301A, V303A, V305A, T307A, L309A, Q311A, D312A, N315A, K317A, E318A, K320A, K322A, S324A, K326A, A327Q, P329A, A330Q, P331A, E333A, K334A, T335A, S337A, K338A, K340A, Q342A, R344A, E345A,
Q347A, R355A, E356A, M358A, T359A, K360A, N361A, Q362A, Y373A, S375A, D376A, A378Q, E380A, E382A, S383A, N384A, Q386A, E388A, N389A, N390A, Y391F, K392A, L398A, S400A, D401A, D413A, K414A, R416A, Q418A, Q419A, N421A, V422A, S424A, E430A, N434A, T437A, Q438A, K439A, S440A, S444A, e K447A, onde, por exemplo, P238A representa prolina do tipo selvagem substituída por alanina na posição número 238. Como um exemplo, uma modalidade específica incorpora a mutação N297A, removendo um sítio de N-glicosilação altamente conservado. Além da alanina, ou- tros aminoácidos podem substituir os aminoácidos do tipo selvagem nas posições especificadas acima. As mutações podem ser introduzi- das individualmente em Fc dando origem a mais de cem regiões Fc distintas da Fc nativa. Adicionalmente, combinações de duas, três, ou mais dessas mutações individuais podem ser introduzidas ao mesmo tempo, dando origem a mais centenas de regiões Fc.
[00375] Algumas das mutações acima podem conferir nova funcio- nalidade à região Fc ou ao parceiro de ligação ao FcRn. Por exemplo, uma modalidade incorpora N297A, removendo um sítio de N- glicosilação altamente conservado. O efeito desta mutação é reduzir a imunogenicidade, aumentando assim a meia-vida circulante da região Fc, e deixar a região Fc incapaz de se ligar ao FcγRI, FcγRIIA, FcγRIIB, e FcγRIIIA, sem comprometer a afinidade para FcRn (Routle- dge et al. 1995, Transplantation 60:847; Friend et al. 1999, Transplan- tation 68:1632; Shields et al. 1995, J. Biol. Chem. 276:6591). Como um outro exemplo de nova funcionalidade que surge a partir das mutações descritas acima, em alguns casos a afinidade para FcRn pode ser au- mentada além daquela do tipo selvagem. Esta afinidade aumentada pode refletir uma taxa "on" aumenta, uma taxa "off" reduzida ou tanto uma taxa "on" aumentada quanto uma taxa "off" reduzida. Exemplos de mutações que se acredita conferirem uma afinidade aumentada pa-
ra FcRn incluem, porém sem limitação, T256A, T307A, E380A, e N434A (Shields et al. 2001, J. Biol. Chem. 276:6591).
[00376] Adicionalmente, três receptores humanos de Fc gama pa- recem reconhecer um sítio de ligação na IgG na região de dobradiça inferior, geralmente os aminoácidos 234-237. Portanto, um outro exemplo de nova funcionalidade e potencial imunogenicidade reduzida pode derivar das mutações dessa região, como, por exemplo, pela substituição dos aminoácidos 233-236 da IgG1 humana "ELLG" (SEQ ID NO: 45) pela sequência correspondente da IgG2 "PVA" (com dele- ção de um aminoácido). Já foi mostrado que FcγRI, FcγRII, e FcγRIII, que medeiam várias funções efetoras, não se ligam à IgG1 quando tais mutações são introduzidas. Ward and Ghetie 1995, Therapeutic Immunology 2:77 e Armour et al. 1999, Eur. J. Immunol. 29:2613.
[00377] Em uma outra modalidade, a região constante de imuno- globulina ou uma porção da mesma compreende uma sequência de aminoácidos na região de dobradiça ou uma porção da mesma que forma uma ou mais ligações dissulfeto com uma segunda região cons- tante de imunoglobulina ou uma porção da mesma. A segunda região constante de imunoglobulina ou uma porção da mesma pode ser liga- da a um segundo polipeptídio, unindo a proteína terapêutica e o se- gundo polipeptídio. Em algumas modalidades, o segundo polipeptídio é uma porção melhoradora. Conforme usado neste pedido, o termo "porção melhoradora" refere-se a uma molécula, um fragmento da mesma ou um componente de um polipeptídio que é capaz de aumen- tar a atividade da proteína terapêutica. A porção melhoradora pode ser um cofator, tal como, onde a proteína terapêutica é um fator de coagu- lação, um fator tecidual solúvel (sTF), ou um peptídio procoagulante. Assim, com a ativação do fator de coagulação, a porção melhoradora fica disponível para aumentar a atividade do fator de coagulação.
[00378] Em certas modalidades, uma proteína terapêutica codifica-
da por uma molécula de ácido nucleico da invenção compreende uma substituição aminoacídica em uma região constante de imunoglobulina ou uma porção da mesma (por exemplo, variantes de Fc), que altera as funções efetoras antígeno-independentes da região constante da Ig, em particular a meia-vida circulante da proteína.
2. Regiões scFc
[00379] Em ou outro aspecto, uma porção heteróloga compreende uma região scFc (Fc de cadeia única). Em uma modalidade, uma mo- lécula de ácido nucleico isolada da invenção compreende ainda uma sequência de nucleotídeos heterólogos que codifica uma região scFc. A região scFc compreende pelo menos duas regiões constantes de imunoglobulina ou porções das memas (por exemplo, porções ou do- mínios Fc (por exemplo, 2, 3, 4, 5, 6, ou mais porções ou domínios Fc)) na mesma cadeia polipeptídica linear que são capazes de se en- rolar (por exemplo, enrolamento intramolecular ou intermolecular) para formar uma região scFc funcional que é ligada por um ligante peptídico Fc. Por exemplo, em uma modalidade, um polipeptídio da invenção é capaz de se ligar, via sua região scFc, a pelo menos um receptor de Fc (por exemplo, um receptor de FcRn, um receptor de FcR (por exemplo, FcRIII), ou uma proteína do complemento (por exemplo, C1q)) para aumentar a meia-vida ou desencadeia uma função efetora imune (por exemplo, citotoxicidade anticorpo-dependente (ADCC), fa- gocitose,, ou citotoxicidade complemento-dependente (CDCC) e/ou aumentar a capacidade de produção).
3. CTP
[00380] Em um outro aspecto, uma porção heteróloga compreende um peptídio C-terminal (CTP) da subunidade β da gonadotropina cori- ônica humana ou fragmento, variante, ou derivado da mesma. Sabe-se que um ou mais peptídios CTP inseridos em uma proteína recombi- nante aumenta a meia-vida in vivo half-life daquela proteína. Vide, por exemplo, Patente US N° 5.712.122, cuja íntegra encontra-se aqui in- corporada a título de referência.
[00381] Ppetídios CTP exemplificativos incluem DPRFQDSSSSKAPPPSLPSPSRLPGPSDTPIL (SEQ ID NO: 33) ou SSSSKAPPPSLPSPSRLPGPSDTPILPQ (SEQ ID NO: 34). Vide, por exemplo, Publicação do Pedido de Patente US N° US 2009/0087411 A1, aqui incorporada a título de referência.
4. Sequência de XTEN
[00382] Em algumas modalidades, uma porção heteróloga compre- ende uma ou mais sequências de XTEN, fragmentos, variantes, ou derivados das mesmas. Conforme usado neste pedido, "sequência de XTEN" refere-se a polipeptídios de comprimento estendido com se- quências substancialmente não repetitivas de ocorrência não natural, que são compostas principalmente de aminoácidos hidrofílicos peque- nos, com a sequência de um grau baixo de estruturas secundárias ou terciárias ou nenhuma estrutura secundária ou terciária em condições fisiológicas. Como uma porção heteróloga, as XTENs pode servir co- mo uma porção prolongadora da meia-vida. Além disso, a XTEN pode proporcionar propriedades desejáveis incluindo, porém sem limitação, parâmetros farmacinéticos e características de solubilidade melhora- dos.
[00383] A incorporação de uma porção heteróloga compreendendo uma sequência de XTEN em uma proteína da invenção pode conferir à proteína uma ou mais das seguintes propriedades vantajosas: flexibili- dade conformacional, solubilidade em água melhorada, alto grau de resistência à protease, baixa imunogenicidade, baixa ligação a recep- tores de mamíferos, ou raios hidrodinâmicos (ou Stokes) aumentados.
[00384] Em certos aspectos, uma sequência de XTEN pode aumen- tar propriedades farmacocinéticas tais como meia-vida in vivo mais longa iy área sob a curva aumentada (AUC), para que uma proteína da invenção permaneça in vivo e tenha atividade procoagulante por um período de tempo mais longo em comparação com uma proteína com a mesma, porém sem a porção heteróloga XTEN.
[00385] Em algumas modalidades, a sequência de XTEN útil para a invenção é um peptídio ou um polipeptídio tendo mais de cerca de 20, 30, 40, 50, 60, 70, 80, 90, 100, 150, 200, 250, 300, 350, 400, 450, 500, 550, 600, 650, 700, 750, 800, 850, 900, 950, 1000, 1200, 1400, 1600, 1800, ou 2000 resíduos aminoacídicos. Em certas modalidades, XTEN é um peptídio ou um polipeptídio tendo mais de cerca de 20 a cerca de 3000 resíduos aminoacídicos, mais de 30 a cerca de 2500 resíduos, mais de 40 a cerca de 2000 resíduos, mais de 50 a cerca de 1500 re- síduos, mais de 60 a cerca de 1000 resíduos, mais de 70 a cerca de 900 resíduos, mais de 80 a cerca de 800 resíduos, mais de 90 a cerca de 700 resíduos, mais de 100 a cerca de 600 resíduos, mais de 110 a cerca de 500 resíduos, ou mais de 120 a cerca de 400 resíduos. Em uma modalidade particular, a XTEN compreende uma sequência de aminoácidos de mais de 42 aminoácidos e menos de 144 aminoácidos de comprimento.
[00386] A sequência de XTEN da invenção pode compreender um ou mais motivos de sequência de 5 a 14 (por exemplo, 9 a 14) resí- duos aminoacídicos ou uma sequência de aminoácidos pelo menos 80%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, ou 99% idên- tica ao motivo de sequência, onde o motivo compreende, consiste es- sencialmente em, ou consiste em 4 a 6 tipos de aminoácidos (por exemplo, 5 aminoácidos) selecionados do grupo que consiste em glici- na (G), alanina (A), serina (S), treonina (T), glutamato (E) e prolina (P). Vide o documento US 2010-0239554 A1.
[00387] Em algumas modalidades, a XTEN compreende motivos de sequência não sobrepostos nos quais cerca de 80%, ou pelo menos cerca de 85%, ou pelo menos cerca de 90%, ou cerca de 91%, ou cer-
ca de 92%, ou cerca de 93%, ou cerca de 94%, ou cerca de 95%, ou cerca de 96%, ou cerca de 97%, ou cerca de 98%, ou cerca de 99% ou cerca de 100% da sequência consiste em múltiplas unidades de sequências não sobrepostas selecionadas de uma única família de motivos selecionados dentre aqueles apresentados na Tabela 7, resul- tando em uma sequência de família. Conforme usado neste pedido, "família" significa que a XTEN tem motivos selecionados apenas de uma única categoria de motivos da Tabela 7; i.e., AD, AE, AF, AG, AM, AQ, BC, ou BD XTEN, e que quaisquer outros aminoácidos na XTEN que não faça parte de um motivo de família são selecionados de forma a alcançar uma propriedade necessária, tal como permitir a incorpora- ção de um sítio de restrição pelos nucleotídeos codificadores, incorpo- ração de uma sequência de clivagem, ou para obter uma ligação me- lhor à proteína terapêutica. Em algumas modalidades de famílias de XTEN, uma sequência de XTEN compreende múltiplas unidades de motivos de sequência não sobrepostos da família de motivos AD, ou da família de motivos AE, ou da família de motivos AF, ou da família de motivos AG, ou da família de motivos AM, ou da família de motivos AQ, ou da família de motivos BC, ou da família de motivos BD, com a XTEN resultante apresenta a faixa de homologia descrita acima. Em outras modalidades, a XTEN compreende múltiplas unidades de se- quências de motivo de duas ou mais das famílias de motivo da Tabela
7. Estas sequências são selecionadas de forma a alcançar caracterís- ticas físicas/químicas desejadas, incluindo propriedades tais como carga líquida, hidrofilicidade, ausência de estrutura secundária, ou au- sência de repetitividade que são conferidas pela composição aminoa- cídica dos motivos, descritos mais detalhadamente abaixo. Nas moda- lidades descritas acima neste parágrafo, os motivos incorporados na XTEN pode ser selecionados e montados pelos métodos descritos neste pedido para obter uma XTEN de cerca de 36 a cerca de 3000 resíduos aminoacídicos.
Tabela 7. Motivos da Sequência de XTEN de 12 Aminoácidos e Famí- lias de Motivos Família do motivo* SEQUÊNCIA DO MOTIVO SEQ ID NO: AD GESPGGSSGSES 73 AD GSEGSSGPGESS 74 AD GSSESGSSEGGP 75 AD GSGGEPSESGSS 76 AE, AM GSPAGSPTSTEE 77 AE, AM, AQ GSEPATSGSETP 78 AE, AM, AQ GTSESATPESGP 79 AE, AM, AQ GTSTEPSEGSAP 80 AF, AM GSTSESPSGTAP 81 AF, AM GTSTPESGSASP 82 AF, AM GTSPSGESSTAP 83 AF, AM GSTSSTAESPGP 84 AG, AM GTPGSGTASSSP 85 AG, AM GSSTPSGATGSP 86 AG, AM GSSPSASTGTGP 87 AG, AM GASPGTSSTGSP 88 AQ GEPAGSPTSTSE 89 AQ GTGEPSSTPASE 90 AQ GSGPSTESAPTE 91 AQ GSETPSGPSETA 92 AQ GPSETSTSEPGA 93 AQ GSPSEPTEGTSA 94 BC GSGASEPTSTEP 95 BC GSEPATSGTEPS 96 BC GTSEPSTSEPGA 97 BC GTSTEPSEPGSA 98 BD GSTAGSETSTEA 99 BD GSETATSGSETA 100 BD GTSESATSESGA 101 BD GTSTEASEGSAS 102 * Denota sequências de motivos individuais que, quando usadas juntas em várias permutações, resulta em uma "sequência de família"
[00388] Exemplos de sequências de XTEN que podem ser usadas como porções heterólogas nas proteínas terapêuticas da invenção es- tão descritos, por exemplo, na Publicação de Patente US N° 2010/0239554 A1, 2010/0323956 A1, 2011/0046060 A1, 2011/0046061 A1, 2011/0077199 A1, ou 2011/0172146 A1, ou na Pu- blicação de Patente Internacional N° WO 2010091122 A1, WO 2010144502 A2, WO 2010144508 A1, WO 2011028228 A1, WO 2011028229 A1, ou WO 2011028344 A2, todas aqui incorporadas em sua íntegra a título de referência.
[00389] XTEN pode ter comprimentos variáveis para inserção ou ligação a uma proteína terapêutica. Em uma modalidade, o compri- mento da sequência de XTEN é escolhido com base na propriedade ou função a ser obtida na proteína de fusão. Dependendo da proprie- dade ou função desejadas, a XTEN pode ser uma sequência de pe- queno comprimento ou de comprimento intermediário ou uma sequên- cia mais comprida que servir como carreador. Em certas modalidades, a XTEN inclui segmentos curtos de cerca de 6 a cerca de 99 resíduos aminoacídicos, de comprimento intermediário de cerca de 100 a cerca de 399 resíduos aminoacídicos, e mais compridos de cerca de 400 a cerca de 1000 e até cerca de 3000 resíduos aminoacídicos. Assim sendo, a XTEN inserida ou ligada a uma proteína terapêutica pode ter comprimentos de cerca de 6, cerca de 12, cerca de 36, cerca de 40, cerca de 42, cerca de 72, cerca de 96, cerca de 144, cerca de 288, cerca de 400, cerca de 500, cerca de 576, cerca de 600, cerca de 700, cerca de 800, cerca de 864, cerca de 900, cerca de 1000, cerca de 1500, cerca de 2000, cerca de 2500, ou até cerca de 3000 resíduos aminoacídicos de comprimento. Em outras modalidades, as sequên- cias de XTEN têm cerca de 6 a cerca de 50, cerca de 50 a cerca de 100, cerca de 100 a 150, cerca de 150 a 250, cerca de 250 a 400, cer- ca de 400 a cerca de 500, cerca de 500 a cerca de 900, cerca de a to
1500, cerca de a to 2000, ou cerca de 2000 a cerca de 3000 resíduos aminoacídicos de comprimento. O comprimento exato de uma XTEN inserida ou ligada a uma proteína terapêutica pode variar sem afetar negativamente a atividade da proteína terapêutica. Em uma modalida- de, uma ou mais das XTENs usadas neste pedido têm 42 aminoáci- dos, 72 aminoácidos, 144 aminoácidos, 288 aminoácidos, 576 amino- ácidos, ou 864 aminoácidos de comprimento e podem ser seleciona- das de uma ou mais das sequências de família XTEN; i.e., AD, AE, AF, AG, AM, AQ, BC ou BD.
[00390] Em algumas modalidades, a proteína terapêutica compre- ende um polipeptídio FVIII e uma XTEN, onde a XTEN compreende 288 aminoácidos. Em uma modalidade, a proteína terapêutica com- preende um polipeptídio FVIII e uma XTEN, onde a XTEN compreende 288 aminoácidos, e a XTEN é inserida no domínio B do polipeptídio FVIII. Em uma modalidade particular, a proteína terapêutica compre- ende um polipeptídio FVIII e uma XTEN compreendendo SEQ ID NO:109, e a XTEN é inserida no domínio B do polipeptídio FVIII. Em uma modalidade particular, a proteína terapêutica compreende um po- lipeptídio FVIII e uma XTEN compreendendo SEQ ID NO:109, e a XTEN é inserida no polipeptídio FVIII imediatamente a jusante do ami- noácido 745 do FVIII maduro.
[00391] Em algumas modalidades, a proteína terapêutica compre- ende um polipeptídio FIX e uma XTEN, onde a XTEN compreende 72 aminoácidos. Em uma modalidade, a proteína terapêutica compreende um polipeptídio FIX e uma XTEN, onde a XTEN compreende 72 ami- noácidos, e a XTEN é inserida no polipeptídio FIX imediatamente a jusante do aminoácido 166 do FIX maduro.
[00392] Em algumas modalidades, a sequência de XTEN usada na invenção é pelo menos 60%, 70%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, ou 100% idêntica a uma seleciona-
da do grupo que consiste em AE42, AG42, AE48, AM48, AE72, AG72, AE108, AG108, AE144, AF144, AG144, AE180, AG180, AE216, AG216, AE252, AG252, AE288, AG288, AE324, AG324, AE360, AG360, AE396, AG396, AE432, AG432, AE468, AG468, AE504, AG504, AF504, AE540, AG540, AF540, AD576, AE576, AF576, AG576, AE612, AG612, AE624, AE648, AG648, AG684, AE720, AG720, AE756, AG756, AE792, AG792, AE828, AG828, AD836, AE864, AF864, AG864, AM875, AE912, AM923, AM1318, BC864, BD864, AE948, AE1044, AE1140, AE1236, AE1332, AE1428, AE1524, AE1620, AE1716, AE1812, AE1908, AE2004A, AG948, AG1044, AG1140, AG1236, AG1332, AG1428, AG1524, AG1620, AG1716, AG1812, AG1908, AG2004, e qualquer combinação dos mesmos. Vide documento US 2010-0239554 A1. Em uma modalidade particular, a XTEN compreende AE42, AE72, AE144, AE288, AE576, AE864, AG 42, AG72, AG144, AG288, AG576, AG864, ou qualquer combinação das mesmas.
[00393] Sequências de XTEN exemplificativas que podem ser usa- das como porções heterólogas na proteína terapêutica da invenção incluem XTEN AE42-4 (SEQ ID NO: 46, codificada pela SEQ ID NO: 47), XTEN AE144-2A (SEQ ID NO: 48, codificada pela SEQ ID NO: 49 ), XTEN AE144-3B (SEQ ID NO: 50, codificada pela SEQ ID NO: 51), XTEN AE144-4A (SEQ ID NO: 52, codificada pela SEQ ID NO: 53), XTEN AE144-5A (SEQ ID NO: 54, codificada pela SEQ ID NO: 55), XTEN AE144-6B (SEQ ID NO: 56, codificada pela SEQ ID NO: 57), XTEN AG144-1 (SEQ ID NO: 58, codificada pela SEQ ID NO: 59), XTEN AG144-A (SEQ ID NO: 60, codificada pela SEQ ID NO: 61), XTEN AG144-B (SEQ ID NO: 62, codificada pela SEQ ID NO: 63), XTEN AG144-C (SEQ ID NO: 64, codificada pela SEQ ID NO: 65), and XTEN AG144-F (SEQ ID NO: 66, codificada pela SEQ ID NO: 67). Em uma modalidade particular, a XTEN é codificada pela SEQ ID NO:18.
[00394] Em uma outra modalidade, a sequência de XTEN é seleci- onada do grupo que consiste em AE36 (SEQ ID NO: 130), AE42 (SEQ ID NO: 131), AE72 (SEQ ID NO: 132), AE78 (SEQ ID NO: 133), AE144 (SEQ ID NO: 134), AE144_2A (SEQ ID NO: 48), AE144_3B (SEQ ID NO: 50), AE144_4A (SEQ ID NO: 52), AE144_5A (SEQ ID NO: 54), AE144_6B (SEQ ID NO: 135), AG144 (SEQ ID NO: 136), AG144_A (SEQ ID NO: 137), AG144_B (SEQ ID NO: 62), AG144_C (SEQ ID NO: 64), AG144_F (SEQ ID NO: 66), AE288 (SEQ ID NO: 138), AE288_2 (SEQ ID NO: 139), AG288 (SEQ ID NO: 140), AE576 (SEQ ID NO: 141), AG576 (SEQ ID NO: 142), AE864 (SEQ ID NO: 143), AG864 (SEQ ID NO: 144), XTEN_AE72_2A_1 (SEQ ID NO:145), XTEN_AE72_2A_2 (SEQ ID NO: 146), XTEN_AE72_3B_1 (SEQ ID NO: 147), XTEN_AE72_3B_2 (SEQ ID NO: 148), XTEN_AE72_4A_2 (SEQ ID NO: 149), XTEN_AE72_5A_2 (SEQ ID NO: 150), XTEN_AE72_6B_1 (SEQ ID NO: 151), XTEN_AE72_6B_2 (SEQ ID NO: 152), XTEN_AE72_1A_1 (SEQ ID NO: 153), XTEN_AE72_1A_2 (SEQ ID NO: 154), XTEN_AE144_1A (SEQ ID NO: 155), AE150 (SEQ ID NO: 156), AG150 (SEQ ID NO: 157), AE294 (SEQ ID NO: 158), AG294 (SEQ ID NO: 159), e qualquer combinação das mesmas. Em uma modalidade específica, a sequência de XTEN é selecionada do grupo que consiste em AE72, AE144, and AE288. As sequências de aminoácidos para determinadas sequências de XTEN da invenção es- tão apresentadas na Tabela 8. Tabela 8. Sequências de XTEN XTEN Sequência de Aminoácidos AE42-4 (SEQ ID GAPGSPAGSPTSTEEGTSESATPESGPGSEPAT NO: 46) SGSETPASS AE144-2A (SEQ TSTEPSEGSAPGSPAGSPTSTEEGTSTEPSEGSA ID NO: 48) PGTSTEPSEGSAPGTSESATPESGPGTSTEPSE
GSAPGTSESATPESGPGSEPATSGSETPGTSTE PSEGSAPGTSTEPSEGSAPGTSESATPESGPGT
XTEN Sequência de Aminoácidos
SESATPESGPG A144-3B (SEQ SPAGSPTSTEEGTSESATPESGPGSEPATSGSET ID NO: 50) PGTSESATPESGPGTSTEPSEGSAPGTSTEPSE
GSAPGTSTEPSEGSAPGTSTEPSEGSAPGTSTE PSEGSAPGTSTEPSEGSAPGSPAGSPTSTEEGT
STEPSEGSAPG AE144-4A (SEQ TSESATPESGPGSEPATSGSETPGTSESATPESG ID NO: 52) PGSEPATSGSETPGTSESATPESGPGTSTEPSE
GSAPGTSESATPESGPGSPAGSPTSTEEGSPAG SPTSTEEGSPAGSPTSTEEGTSESATPESGPGTS
TEPSEGSAPG AE144-5A (SEQ TSESATPESGPGSEPATSGSETPGTSESATPESG ID NO: 54) PGSEPATSGSETPGTSESATPESGPGTSTEPSE
GSAPGSPAGSPTSTEEGTSESATPESGPGSEPA TSGSETPGTSESATPESGPGSPAGSPTSTEEGS
PAGSPTSTEEG AE144-6B (SEQ TSTEPSEGSAPGTSESATPESGPGTSESATPESG ID NO: 56) PGTSESATPESGPGSEPATSGSETPGSEPATSG
SETPGSPAGSPTSTEEGTSTEPSEGSAPGTSTEP SEGSAPGSEPATSGSETPGTSESATPESGPGTS
TEPSEGSAPG AG144-1 (SEQ PGSSPSASTGTGPGSSPSASTGTGPGTPGSGTA ID NO: 58) SSSPGSSTPSGATGSPGSSPSASTGTGPGASPG
TSSTGSPGTPGSGTASSSPGSSTPSGATGSPGT PGSGTASSSPGASPGTSSTGSPGASPGTSSTGS
PGTPGSGTASSS AG144-A (SEQ GASPGTSSTGSPGSSPSASTGTGPGSSPSASTG ID NO: 60) TGPGTPGSGTASSSPGSSTPSGATGSPGSSPSA
STGTGPGASPGTSSTGSPGTPGSGTASSSPGSS TPSGATGSPGTPGSGTASSSPGASPGTSSTGSP
GASPGTSSTGSP AG144-B (SEQ GTPGSGTASSSPGSSTPSGATGSPGASPGTSST ID NO: 62) GSPGTPGSGTASSSPGSSTPSGATGSPGSSPSA
STGTGPGSSPSASTGTGPGSSTPSGATGSPGSS TPSGATGSPGASPGTSSTGSPGASPGTSSTGSP GASPGTSSTGSP
XTEN Sequência de Aminoácidos AG144-C (SEQ GTPGSGTASSSPGASPGTSSTGSPGASPGTSST ID NO: 64) GSPGASPGTSSTGSPGSSPSASTGTGPGTPGSG
TASSSPGASPGTSSTGSPGASPGTSSTGSPGAS PGTSSTGSPGSSTPSGATGSPGSSTPSGATGSP
GASPGTSSTGSP XTEN AG144-F GSSPSASTGTGPGSSPSASTGTGPGASPGTSST (SEQ ID NO: GSPGASPGTSSTGSPGSSTPSGATGSPGSSPSA 66) STGTGPGASPGTSSTGSPGSSPSASTGTGPGTP
GSGTASSSPGSSTPSGATGSPGSSTPSGATGSP
GASPGTSSTGSP AE36 GSPAGSPTSTEEGTSESATPESGPGSEPATSGS (SEQ ID NO: ETP 130) AE42 GAPGSPAGSPTSTEEGTSESATPESGPGSEPAT (SEQ ID NO: SGSETPASS 131) AE72 GAPTSESATPESGPGSEPATSGSETPGTSESATP (SEQ ID NO: ESGPGSEPATSGSETPGTSESATPESGPGTSTE 132) PSEGSAPGASS AE78 GAPTSESATPESGPGSEPATSGSETPGTSESATP (SEQ ID NO: ESGPGSEPATSGSETPGTSESATPESGPGTSTE 133) PSEGSAPGASS AE144 GSEPATSGSETPGTSESATPESGPGSEPATSGS (SEQ ID NO: ETPGSPAGSPTSTEEGTSTEPSEGSAPGSEPATS 134) GSETPGSEPATSGSETPGSEPATSGSETPGTSTE
PSEGSAPGTSESAPESGPGSEPATSGSETPGTS
TEPSEGSAP AE144_6B TSTEPSEGSAPGTSESATPESGPGTSESATPESG (SEQ ID NO: PGTSESATPESGPGSEPATSGSETPGSEPATSG 135) SETPGSPAGSPTSTEEGTSTEPSEGSAPGTSTEP
SEGSAPGSEPATSGSETPGTSESATPESGPGTS
TEPSEGSAPG AG144 GTPGSGTASSSPGSSTPSGATGSPGSSPSASTG (SEQ ID TGPGSSPSASTGTGPGASPGTSSTGSPGASPGT NO:136) SSTGSPGSSTPSGATGSPGSSPSASTGTGPGAS
XTEN Sequência de Aminoácidos
PGTSSTGSPGSSPSASTGTGPGTPGSGTASSSP
GSSTPSGATGSP AG144_A GASPGTSSTGSPGSSPSASTGTGPGSSPSASTG (SEQ ID NO: TGPGTPGSGTASSSPGSSTPSGATGSPGSSPSA 137) STGTGPGASPGTSSTGSPGTPGSGTASSSPGSS
TPSGATGSPGTPGSGTASSSPGASPGTSSTGSP
GASPGTSSTGSP AE288 GTSESATPESGPGSEPATSGSETPGTSESATPES (SEQ ID NO: GPGSEPATSGSETPGTSESATPESGPGTSTEPS 138) EGSAPGSPAGSPTSTEEGTSESATPESGPGSEP
ATSGSETPGTSESATPESGPGSPAGSPTSTEEG SPAGSPTSTEEGTSTEPSEGSAPGTSESATPESG PGTSESATPESGPGTSESATPESGPGSEPATSG SETPGSEPATSGSETPGSPAGSPTSTEEGTSTEP SEGSAPGTSTEPSEGSAPGSEPATSGSETPGTS
ESATPESGPGTSTEPSEGSAP AE288_2 GSPAGSPTSTEEGTSESATPESGPGSEPATSGS (SEQ ID NO: ETPGTSESATPESGPGTSTEPSEGSAPGTSTEPS 139) EGSAPGTSTEPSEGSAPGTSTEPSEGSAPGTST
EPSEGSAPGTSTEPSEGSAPGSPAGSPTSTEEG TSTEPSEGSAPGTSESATPESGPGSEPATSGSET PGTSESATPESGPGSEPATSGSETPGTSESATPE SGPGTSTEPSEGSAPGTSESATPESGPGSPAGS PTSTEEGSPAGSPTSTEEGSPAGSPTSTEEGTSE
SATPESGPGTSTEPSEGSAP AG288 PGASPGTSSTGSPGASPGTSSTGSPGTPGSGTA (SEQ ID NO: SSSPGSSTPSGATGSPGTPGSGTASSSPGSSTP 140) SGATGSPGTPGSGTASSSPGSSTPSGATGSPGS
STPSGATGSPGSSPSASTGTGPGSSPSASTGTG PGASPGTSSTGSPGTPGSGTASSSPGSSTPSGA TGSPGSSPSASTGTGPGSSPSASTGTGPGASPG TSSTGSPGASPGTSSTGSPGSSTPSGATGSPGS SPSASTGTGPGASPGTSSTGSPGSSPSASTGTG
PGTPGSGTASSSPGSSTPSGATGS AE576 GSPAGSPTSTEEGTSESATPESGPGTSTEPSEG (SEQ ID NO: SAPGSPAGSPTSTEEGTSTEPSEGSAPGTSTEPS
XTEN Sequência de Aminoácidos 141) EGSAPGTSESATPESGPGSEPATSGSETPGSEP
ATSGSETPGSPAGSPTSTEEGTSESATPESGPGT STEPSEGSAPGTSTEPSEGSAPGSPAGSPTSTEE GTSTEPSEGSAPGTSTEPSEGSAPGTSESATPES GPGTSTEPSEGSAPGTSESATPESGPGSEPATS GSETPGTSTEPSEGSAPGTSTEPSEGSAPGTSE SATPESGPGTSESATPESGPGSPAGSPTSTEEG TSESATPESGPGSEPATSGSETPGTSESATPESG PGTSTEPSEGSAPGTSTEPSEGSAPGTSTEPSE GSAPGTSTEPSEGSAPGTSTEPSEGSAPGTSTE PSEGSAPGSPAGSPTSTEEGTSTEPSEGSAPGT SESATPESGPGSEPATSGSETPGTSESATPESGP GSEPATSGSETPGTSESATPESGPGTSTEPSEG SAPGTSESATPESGPGSPAGSPTSTEEGSPAGS PTSTEEGSPAGSPTSTEEGTSESATPESGPGTST
EPSEGSAP AG576 PGTPGSGTASSSPGSSTPSGATGSPGSSPSAST (SEQ ID NO: GTGPGSSPSASTGTGPGSSTPSGATGSPGSSTP 142) SGATGSPGASPGTSSTGSPGASPGTSSTGSPGA
SPGTSSTGSPGTPGSGTASSSPGASPGTSSTGS PGASPGTSSTGSPGASPGTSSTGSPGSSPSAST GTGPGTPGSGTASSSPGASPGTSSTGSPGASPG TSSTGSPGASPGTSSTGSPGSSTPSGATGSPGS STPSGATGSPGASPGTSSTGSPGTPGSGTASSS PGSSTPSGATGSPGSSTPSGATGSPGSSTPSGA TGSPGSSPSASTGTGPGASPGTSSTGSPGASPG TSSTGSPGTPGSGTASSSPGASPGTSSTGSPGA SPGTSSTGSPGASPGTSSTGSPGASPGTSSTGS PGTPGSGTASSSPGSSTPSGATGSPGTPGSGTA SSSPGSSTPSGATGSPGTPGSGTASSSPGSSTP SGATGSPGSSTPSGATGSPGSSPSASTGTGPGS SPSASTGTGPGASPGTSSTGSPGTPGSGTASSS PGSSTPSGATGSPGSSPSASTGTGPGSSPSAST
GTGPGASPGTSSTGS AE864 GSPAGSPTSTEEGTSESATPESGPGTSTEPSEG (SEQ ID NO: SAPGSPAGSPTSTEEGTSTEPSEGSAPGTSTEPS
XTEN Sequência de Aminoácidos 143) EGSAPGTSESATPESGPGSEPATSGSETPGSEP
ATSGSETPGSPAGSPTSTEEGTSESATPESGPGT STEPSEGSAPGTSTEPSEGSAPGSPAGSPTSTEE GTSTEPSEGSAPGTSTEPSEGSAPGTSESATPES GPGTSTEPSEGSAPGTSESATPESGPGSEPATS GSETPGTSTEPSEGSAPGTSTEPSEGSAPGTSE SATPESGPGTSESATPESGPGSPAGSPTSTEEG TSESATPESGPGSEPATSGSETPGTSESATPESG PGTSTEPSEGSAPGTSTEPSEGSAPGTSTEPSE GSAPGTSTEPSEGSAPGTSTEPSEGSAPGTSTE PSEGSAPGSPAGSPTSTEEGTSTEPSEGSAPGT SESATPESGPGSEPATSGSETPGTSESATPESGP GSEPATSGSETPGTSESATPESGPGTSTEPSEG SAPGTSESATPESGPGSPAGSPTSTEEGSPAGS PTSTEEGSPAGSPTSTEEGTSESATPESGPGTST EPSEGSAPGTSESATPESGPGSEPATSGSETPG TSESATPESGPGSEPATSGSETPGTSESATPESG PGTSTEPSEGSAPGSPAGSPTSTEEGTSESATPE SGPGSEPATSGSETPGTSESATPESGPGSPAGS PTSTEEGSPAGSPTSTEEGTSTEPSEGSAPGTSE SATPESGPGTSESATPESGPGTSESATPESGPG SEPATSGSETPGSEPATSGSETPGSPAGSPTSTE EGTSTEPSEGSAPGTSTEPSEGSAPGSEPATSG
SETPGTSESATPESGPGTSTEPSEGSAP AG864 GASPGTSSTGSPGSSPSASTGTGPGSSPSASTG (SEQ ID NO: TGPGTPGSGTASSSPGSSTPSGATGSPGSSPSA 144) STGTGPGASPGTSSTGSPGTPGSGTASSSPGSS
TPSGATGSPGTPGSGTASSSPGASPGTSSTGSP GASPGTSSTGSPGTPGSGTASSSPGSSTPSGAT GSPGASPGTSSTGSPGTPGSGTASSSPGSSTPS GATGSPGSSPSASTGTGPGSSPSASTGTGPGSS TPSGATGSPGSSTPSGATGSPGASPGTSSTGSP GASPGTSSTGSPGASPGTSSTGSPGTPGSGTAS SSPGASPGTSSTGSPGASPGTSSTGSPGASPGT SSTGSPGSSPSASTGTGPGTPGSGTASSSPGAS PGTSSTGSPGASPGTSSTGSPGASPGTSSTGSP
XTEN Sequência de Aminoácidos
GSSTPSGATGSPGSSTPSGATGSPGASPGTSST GSPGTPGSGTASSSPGSSTPSGATGSPGSSTPS GATGSPGSSTPSGATGSPGSSPSASTGTGPGAS PGTSSTGSPGASPGTSSTGSPGTPGSGTASSSP GASPGTSSTGSPGASPGTSSTGSPGASPGTSST GSPGASPGTSSTGSPGTPGSGTASSSPGSSTPS GATGSPGTPGSGTASSSPGSSTPSGATGSPGTP GSGTASSSPGSSTPSGATGSPGSSTPSGATGSP GSSPSASTGTGPGSSPSASTGTGPGASPGTSST GSPGTPGSGTASSSPGSSTPSGATGSPGSSPSA STGTGPGSSPSASTGTGPGASPGTSSTGSPGAS PGTSSTGSPGSSTPSGATGSPGSSPSASTGTGP GASPGTSSTGSPGSSPSASTGTGPGTPGSGTAS SSPGSSTPSGATGSPGSSTPSGATGSPGASPGT
SSTGSP XTEN_AE72_2 TSTEPSEGSAPGSPAGSPTSTEEGTSTEPSEGSA A_1 PGTSTEPSEGSAPGTSESATPESGPGTSTEPSE (SEQ ID NO: GSAPG 145) XTEN_AE72_2 TSESATPESGPGSEPATSGSETPGTSTEPSEGSA A_2 PGTSTEPSEGSAPGTSESATPESGPGTSESATPE (SEQ ID NO: SGPG 146) XTEN_AE72_3 SPAGSPTSTEEGTSESATPESGPGSEPATSGSET B_1 PGTSESATPESGPGTSTEPSEGSAPGTSTEPSE (SEQ ID GSAPG NO:147) XTEN_AE72_3 TSTEPSEGSAPGTSTEPSEGSAPGTSTEPSEGSA B_2 PGTSTEPSEGSAPGSPAGSPTSTEEGTSTEPSE (SEQ ID NO: GSAPG 148) XTEN_AE72_4 TSESATPESGPGSPAGSPTSTEEGSPAGSPTSTE A_2 EGSPAGSPTSTEEGTSESATPESGPGTSTEPSE (SEQ ID NO: GSAPG 149)
XTEN Sequência de Aminoácidos XTEN_AE72_5 SPAGSPTSTEEGTSESATPESGPGSEPATSGSET A_2 PGTSESATPESGPGSPAGSPTSTEEGSPAGSPT (SEQ ID NO: STEEG 150) XTEN_AE72_6 TSTEPSEGSAPGTSESATPESGPGTSESATPESG B_1 (SEQ ID PGTSESATPESGPGSEPATSGSETPGSEPATSG NO: 151) SETPG XTEN_AE72_6 SPAGSPTSTEEGTSTEPSEGSAPGTSTEPSEGSA B_2 PGSEPATSGSETPGTSESATPESGPGTSTEPSE (SEQ ID NO: GSAPG 152) XTEN_AE72_1 SPAGSPTSTEEGTSESATPESGPGTSTEPSEGSA A_1 PGSPAGSPTSTEEGTSTEPSEGSAPGTSTEPSE (SEQ ID NO: GSAPG 153) XTEN_AE72_1 TSESATPESGPGSEPATSGSETPGSEPATSGSET A_2 PGSPAGSPTSTEEGTSESATPESGPGTSTEPSE (SEQ ID NO: GSAPG 154) XTEN_AE144_1 SPAGSPTSTEEGTSESATPESGPGTSTEPSEGSA
A PGSPAGSPTSTEEGTSTEPSEGSAPGTSTEPSE (SEQ ID NO: GSAPGTSESATPESGPGSEPATSGSETPGSEPA 155) TSGSETPGSPAGSPTSTEEGTSESATPESGPGTS
TEPSEGSAPG AE150 GAPGSEPATSGSETPGTSESATPESGPGSEPAT (SEQ ID NO: SGSETPGSPAGSPTSTEEGTSTEPSEGSAPGSE 156) PATSGSETPGSEPATSGSETPGSEPATSGSETP
GTSTEPSEGSAPGTSESATPESGPGSEPATSGS
ETPGTSTEPSEGSAPASS G150 GAPGTPGSGTASSSPGSSTPSGATGSPGSSPSA (SEQ ID NO: STGTGPGSSPSASTGTGPGASPGTSSTGSPGAS 157) PGTSSTGSPGSSTPSGATGSPGSSPSASTGTGP
GASPGTSSTGSPGSSPSASTGTGPGTPGSGTAS
SSPGSSTPSGATGSPASS AE294 GAPGTSESATPESGPGSEPATSGSETPGTSESA
XTEN Sequência de Aminoácidos (SEQ ID NO: TPESGPGSEPATSGSETPGTSESATPESGPGTST 158) EPSEGSAPGSPAGSPTSTEEGTSESATPESGPG
SEPATSGSETPGTSESATPESGPGSPAGSPTSTE EGSPAGSPTSTEEGTSTEPSEGSAPGTSESATPE SGPGTSESATPESGPGTSESATPESGPGSEPAT SGSETPGSEPATSGSETPGSPAGSPTSTEEGTST EPSEGSAPGTSTEPSEGSAPGSEPATSGSETPG
TSESATPESGPGTSTEPSEGSAPASS AG294 GAPPGASPGTSSTGSPGASPGTSSTGSPGTPGS (SEQ ID NO: GTASSSPGSSTPSGATGSPGTPGSGTASSSPGS 159) STPSGATGSPGTPGSGTASSSPGSSTPSGATGS
PGSSTPSGATGSPGSSPSASTGTGPGSSPSAST GTGPGASPGTSSTGSPGTPGSGTASSSPGSSTP SGATGSPGSSPSASTGTGPGSSPSASTGTGPGA SPGTSSTGSPGASPGTSSTGSPGSSTPSGATGS PGSSPSASTGTGPGASPGTSSTGSPGSSPSAST GTGPGTPGSGTASSSPGSSTPSGATGSASS
[00395] Em algumas modalidades, menos de 100% dos aminoáci- dos de uma XTEN são selecionados dentre glicina (G), alanina (A), serina (S), treonina (T), glutamato (E) w prolina (P), ou menos de 100% da sequência consiste nos motivos de sequência da Tabela 7 ou de uma sequência de XTEN apresentada neste pedido. Em tais moda- lidades, os outros resíduos aminoacídicos da XTEN são selecionados dentre qualquer um dos outros 14 L-aminoácidos naturais, mas podem ser de preferência selecionados dentre aminoácidos hidrofílicos para que a sequência de XTEN contenha pelo menos cerca de 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, ou pelo menos cerca de 99% de aminoácidos hidrofílicos. O teor de aminoácidos hidrofílicos na XTEN utilizada nos construtos de conjugação pode ser inferior a 5%, ou inferior a 2%, ou inferior a 1% do teor de aminoácidos hidrófobos. Resíduos hidrófobos que são menos favorecidos na construçãode XTEN incluem triptofano, fenilalanina, tirosina, leucina, isoleucina, vali- na, e metionina. Adicionalmente, as sequências de XTEN podem con-
ter menos de 5% ou menos de 4% ou menos de 3% ou menos de 2% ou menos de 1% ou nenhum dos seguintes aminoácidos: metionina (por exemplo, para evitar oxidação), ou asparagina e glutamina (para evitar desamidação).
[00396] A uma ou mais sequências de XTEN podem ser inseridas no terminal C ou no terminal N da proteína terapêutica ou inseridas entre dois aminoácidos na sequência de aminoácidos da proteína te- rapêutica. Por exemplo, onde a proteína terapêutica compreende um polipeptídio FVIII, a XTEN pode ser inserida entre dois aminoácidos em um ou mais sítios de inserção selecionados dentre aqueles mos- trados na Tabela 5. Onde a proteína terapêutica compreende um poli- peptídio FIX, a XTEN pode ser inserida entre dois aminoácidos em um ou mais sítios de inserção selecionados dentre aqueles mostrados na Tabela 5.
[00397] Exemplos adicionais de sequências de XTEN que podem ser usadas de acordo com a presente invenção estão descritos na Pu- blicação de Patente US N° 2010/0239554 A1, 2010/0323956 A1, 2011/0046060 A1, 2011/0046061 A1, 2011/0077199 A1, ou 2011/0172146 A1, ou Publicação de Patente Internacional N° WO 2010091122 A1, WO 2010144502 A2, WO 2010144508 A1, WO 2011028228 A1, WO 2011028229 A1, WO 2011028344 A2, WO 2014/011819 A2, ou WO 2015/023891.
5. Albumina ou Fragmento, Derivado, ou Variante da Mesma
[00398] Em algumas modalidades, uma porção heteróloga compre- ende albumina ou um fragmento funcional da mesma. A albumina séri- ca humana (HSA, ou HA), uma proteína de 609 aminoácidos em sua forma de comprimento total, é responsável por uma proporção signifi- cativa da pressão osmótica do soro e também funciona como um car- reador de ligantes endógenos e exógenos. O termo "albumina", con- forme usado neste pedido, inclui albumina de comprimento total ou um fragmento funcional, variante, derivado, ou análogo da mesma. Exem- plos de albumina ou dos fragmentos ou variantes da mesma estão descritos na Publicação de Patente US N° 2008/0194481A1, 2008/0004206 A1, 2008/0161243 A1, 2008/0261877 A1, ou 2008/0153751 A1 ou na Publicação de Pedido PCT N° 2008/033413 A2, 2009/058322 A1, ou 2007/021494 A2, cujas íntegras encontram-se aqui incorporadas a título de referência.
[00399] Em uma modalidade, a proteína terapêutica da invenção compreende albumina, um fragmento, ou uma variante da mesma que é ainda ligada a uma segunda porção heteróloga selecionada do grupo que consiste em em uma região constante de imunoglobulina ou uma porção da mesma (por exemplo, uma região Fc), uma sequência de PAS, HES, PEG e qualquer combinação dos mesmos .
6. Porção de ligação à lbumina
[00400] Em certas modalidades, a porção heteróloga é uma porção de ligação à albumina, que compreende um peptídio de ligação à al- bumina, um domínio de ligação à albumina bacteriano, um fragmento de anticorpo de ligação à albumina, ou qualquer combinação dos mesmos.
[00401] Por exemplo, a proteína de ligação à albumina pode ser uma proteína de ligação à albumina bacteriana, um anticorpo ou um fragmento de anticorpo incluindo anticorpos de domínio (vide Patente US N° 6.696.245). Uma proteína de ligação à albumina pode ser, por exemplo, um domínio de ligação à albumina bacteriano, tal como aquele da proteína G estreptocócica G (Konig, T. and Skerra, A. (1998) J. Immunol. Methods 218, 73-83). Outros exemplos de peptí- dios de ligação à albumina que podem ser usados como parceiro de conjugação são, por exemplo, aqueles tendo uma sequência de con- senso Cys-Xaa 1 -Xaa 2 -Xaa 3 -Xaa 4 -Cys, onde Xaa 1 é Asp, Asn, Ser, Thr, ou Trp; Xaa 2 é Asn, Gln, H is, Ile, Leu, ou Lys; Xaa 3 é Ala, Asp,
Phe, Trp, ou Tyr; e Xaa 4 é Asp, Gly, Leu, Phe, Ser, ou Thr descritos no pedido de patente US 2003/0069395 ou em Dennis et al. (Dennis et al. (2002) J. Biol. Chem. 277, 35035-35043).
[00402] O domínio 3 da proteína G estreptocácica, divulgado por Kraulis et al., FEBS Lett. 378:190-194 (1996) e Linhult et al., Protein Sci. 11:206-213 (2002) é um exemplo de uma proteína de ligação à albumina bacteriana. Exemplos de peptídios de ligação à albumina in- cluem uma série de peptídios tendo a sequência de núcleo DICLPR- WGCLW (SEQ ID NO: 35). Vide, por exemplo, Dennis et al., J. Biol. Chem. 2002, 277: 35035-35043 (2002). Exemplos de fragmentos de anticorpo de ligação à albumina estão revelados em Muller and Kon- termann, Curr. Opin. Mol. Ther. 9:319-326 (2007); Roovers et al., Can- cer Immunol. Immunother. 56:303-317 (2007), e Holt et al., Prot. Eng. Design Sci., 21:283-288 (2008), cuja íntegra encontra-se aqui incorpo- rada a título de referência. Um exemplo de tal porção de ligação à al- bumina é 2-(3-maleimidopropanamido)-6-(4-(4-iodofenil)butanamido) hexanoato ("Albu" tag) revelado por Trussel et al., Bioconjugate Chem. 20:2286-2292 (2009).
[00403] Ácidos graxos, em particular ácidos graxos de cadeia longa (LCFA) e compostos de ligação à albumina semelhantes a ácidos gra- xos de cadeia longa podem ser usados para ampliar a meia-vida in vivo das proteínas tipo fator de coagulação da invenção. Um exemplo de um composto de ligação à albumina semelhante a LCFA-like é o ácido 16-(1-(3-(9-(((2,5-dioxopirrolidin-1-iloxi) carboniloxi)-metil)-7- sulfo-9H-fluoren-2-ilamino)-3-oxopropil)-2,5-dioxopirrolidin-3-iltio) he- xadecanoico (vide, por exemplo, WO 2010/140148).
7. Sequências de PAS
[00404] Em outras modalidades, a porção heteróloga é uma se- quência de PAS. Sequência de PAS, conforme usado neste pedido, significa uma sequência de aminoácidos compreendendo principal-
mente resíduos alanina e resíduos serina ou compreendendo princi- palmente resíduos alanina, serina, e prolina residues, sendo que a se- quência de aminoácidos forma uma conformação espiralada aleatória em condições fisiológicas. Por conseguinte, a sequência de PAS é um bloco de construção, um polímero aminoacídico, ou um cassete de se- quência compreendendo, consistindo essencialmente em, ou consisi- tindo em alanina, serina, e prolina que pode ser usado como parte da porção heteróloga na proteína quimérica. Ainda, o especialista na téc- nica sabe que um polímero aminoacídico também pode formar uma conformação espiralada aleatório quando resíduos difeentes de alani- na, serina, e prolina são adicionados como um constituinte secundário na sequência de PAS. O termo "constituinte secundário", conforme usado neste pedido, significa que aminoácidos diferentes de alanina, serina, e prolina podem ser adicionadas na sequência de PAS até cer- to ponto, por exemplo, até cerca de 12%, i.e., cerca de 12 de 100 ami- noácidos de the PAS sequence, up a cerca de 10%, i.e., cerca de 10 de 100 aminoácidos da sequência de PAS, até cerca de 9%, i.e., cerca de 9 de 100 aminoácidos, até cerca de 8%, i.e., cerca de 8 de 100 aminoácidos, cerca de 6%, i.e., cerca de 6 de 100 aminoácidos, cerca de 5%, i.e., cerca de 5 de 100 aminoácidos, cerca de 4%, i.e., cerca de 4 de 100 aminoácidos, cerca de 3%, i.e., cerca de 3 de 100 aminoáci- dos, cerca de 2%, i.e., cerca de 2 de 100 aminoácidos, cerca de 1%, i.e., cerca de 1 de 100 dos aminoácidos. Os aminoácidos difeentes de alanina, serina e prolina podem ser selecionados do grupo que consis- te em Arg, Asn, Asp, Cys, Gln, Glu, Gly, His, Ile, Leu, Lys, Met, Phe, Thr, Trp, Tyr, e Val.
[00405] Em condições fisiológicas, o trecho da sequência de PAS forma uma conformação espiralada aleatória e assim pode mediar uma maior estabilidade in vivo e/ou in vitro para a proteína tipo fator de coagulação. Como o domínio espiralado aleatório não adota uma es-
trutura ou função estável por si só, a atividade biológica mediada pela proteína tipo fator de coagulação é essencialmente preservada. Em outras modalidades, as sequências de PAS que formam o domínio es- piralado aleatória são biologicamente inertes, especialmente em rela- ção à proteólise no plasma sanguíneo, imunogenicidade, ponto isoelé- trico/comportamento eletrostático, ligação a receptores da superfície celular ou internalização, mas ainda continuam biodegradáveis, o que oferece nítidas vantagens em relação a polímeros sintéticos tal como PEG.
[00406] Exemplos não limitativos de sequências de PAS formando uma conformação espiralada aleatória compreendem uma sequência de aminoácidos selecionada do grupo que consiste em ASPAAPA- PASPAAPAPSAPA (SEQ ID NO: 36), AAPASPAPAAPSAPAPAAPS (SEQ ID NO: 37), APSSPSPSAPSSPSPASPSS (SEQ ID NO: 38), APSSPSPSAPSSPSPASPS (SEQ ID NO: 39), SSPSAPSPSSPAS- PSPSSPA (SEQ ID NO: 40), AASPAAPSAPPAAASPAAPSAPPA (SEQ ID NO: 41), ASAAAPAAASAAASAPSAAA (SEQ ID NO: 42) e quaisquer combinações das mesmas. Exemplos adicionais de se- quências de PAS são conhecidos, por exemplo, a partir da Publicação de Patente US N° 2010/0292130 A1 e da Publicação do Pedido PCT N° WO 2008/155134 A1.
8. Sequência de HAP
[00407] Em certas modalidades, a porção heteróloga é um polímero de homo-aminoácido rico em glicina (HAP). A sequência de HAP pode compreender uma sequência repetitiva de glicina, que tem pelo menos 50 aminoácidos, pelo menos 100 aminoácidos, 120 aminoácidos, 140 aminoácidos, 160 aminoácidos, 180 aminoácidos, 200 aminoácidos, 250 aminoácidos, 300 aminoácidos, 350 aminoácidos, 400 aminoáci- dos, 450 aminoácidos, ou 500 aminoácidos de comprimento. Em uma modalidade, a sequência de HAP é capaz de estender a meia-vida de uma porção fusionada ou ligada à sequência de HAP. Exemplos não limitativos da sequência de HAP incluem, porém sem limitação, (Gly)n, (Gly4Ser)n ou S(Gly4Ser)n, onde n é 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, ou 20. Em uma modalidade, n é 20, 21, 22, 23, 24, 25, 26, 26, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, ou 40. Em uma outra modalidade, n é 50, 60, 70, 80, 90, 100, 110, 120, 130, 140, 150, 160, 170, 180, 190, ou 200.
9. Transferrina ou Fragmento da mesma
[00408] Em certas modalidades, a porção heteróloga é transferrina ou um fragmento da mesma. Qualquer transferrina pode ser usada pa- ra fazer as proteínas tipo fator de coagulação da invenção. Como um exemplo, TF humano do tipo selvagem (TF) é uma proteína de 679 aminoácidos, de aproximadamente 75 KDa (não responsável pela gli- cosilação), com dois domínios principais, N (cerca de 330 aminoáci- dos) e C (cerca de 340 aminoácidos), que parecem ter origem na du- plicação de um gene. Vide números de acesso GenBank NM001063, XM002793, M12530, XM039845, XM 039847 e S95936 (www.ncbi.nlm.nih.gov/), todos aqui incorporados em sua íntegra a tí- tulo de referência. A transferrina compreende dois domínios, o domínio N e o domínio C. O domínio N compreende doissubdomínios, o domí- nio N1 e o domínio N2, e o domínio C compreende dois subdomínios, o domínio C1 e o domínio C2.
[00409] Em uma modalidade, a porção heteróloga da transferrina inlcui uma variante de união da transferria. Em uma modalidade, one example, a variante de união da transferria pode ser uma variante de união da transferrina humana, por exemplo, acesso Genbank AAA61140. Em uma outra modalidade, a porção transferrina da prote- ína quimérica inclui um ou mais domínios da sequência da transferrina, domínio N, domínio C, domínio N1, domínio N2, domínio C1, domínio C2 ou quaisquer combinações dos mesmos.
10. Receptores de Depuração
[00410] Em certas modalidades, a porção heteróloga é um receptor de depuração, fragmento, variante, ou derivado do mesmo. LRP1 é uma proteína integral de membrano de 600 kDa que está envolvida na depuração mediada por receptores de uma variedade de proteínas tal como o Fator X. vide, por exemplo, Narita et al., Blood 91:555-560 (1998).
11. Fator de von Willebrand ou Fragmentos do mesmos
[00411] Em certas modalidades, a porção heteróloga é o fator de von Willebrand (VWF) ou um ou mais fragmentos do mesmo.
[00412] VWF (também conhecido como F8VWF) é uma glicoproteí- na multimérica grande presente no plasma sanguíneo e produzido de forma constitutiva no endotélio (nos corpos de Weibel-Palade), mega- cariócitos (grânulos α de plaquetas), e tecido conjuntivo do subendoté- lio. O monômero VWF básico é uma proteína de 2813 aminoácidos. Todo monômero contém um número de domínios específicos com uma função específica, os domínios D' e D3 (que juntos se ligam ao fator VIII), o domínio A1 (que se liga ao receptor GPIb para plaquetas, heparina, e/ou possivelmente colágeno), o domínio A3 (que se liga ao colágeno), o domínio C1 (no qual o domínio RGD liga-se à integrina plaquetária αIIbβ3 quando esta é ativada), e o domínio "cisteína knot" na extremidade C-terminal da proteína (cujo VWF é compartilhado com o fator de crescimento de derivados plaquetários (PDGF), fator transformantes de crescimento β (TGFβ) e gonadotropina coriônico humana  (βHCG)).
[00413] A sequência de 2813 aminoácidos monoméricos para o VWF humano está apresentada como Número de Acesso NP000543.2 no Genbank. A sequência de nucleotídeos codificando o VWF humano é está apresentada como Número de Acesso NM000552.3 no Gen- bank. SEQ ID NO: 129 é a sequência de aminoácidos codificada pela
SEQ ID NO: 128. O domínio D’ inclui os aminoácidos 764 a 866 da SEQ ID NO: 129. O domínio D3 inclui os aminoácidos 867 a 1240 da SEQ ID NO: 44.
[00414] No plasma, 95-98% do FVIII circula em um complexo não covalente compacto com VWF de comprimento total. A formação deste complexo é importante para a manutenção de níveis plasmáticos apropriados de FVIIII in vivo. Lenting et al., Blood. 92(11): 3983-96 (1998); Lenting et al., J. Thromb. Haemost. 5(7): 1353-60 (2007). Quando o FVIII é ativado devido à proteólise nas posições 372 e 740 na cadeia pesada e na posição 1689 na cadeia leve, o VWF ligado ao FVIII é removido do FVIII ativado.
[00415] Em certas modalidades, a porção heteróloga é o fator de von Willebrand de comprimento total. Em outras modalidades, a por- ção heteróloga é um fragmento do fator de von Willebrand. Conforme usado neste pedido, o termo "fragmento de VWF" ou "fragmentos de VWF" usado neste pedido, significa todos os fragmentos de VWF que interagem com o FVIII e conservam pelo menos uma ou mais proprie- dades que normalmente são transmitidas ao FVIII pelo VWF de com- primento total, por exemplo, prevenção de ativação prematura para FVIIIa, prevenção de proteólise prematura, prevenção de associação a membranas fosfolipídicas que poderiam levar à depuração prematura, prevenção de ligação a receptores da depuração de FVIII que podem ligar o FVIII nu, mas não o FVIII ligado ao VWF, e/ou estabilização das interações entre a cadeia pesada e a cadeia leve do FVIII. Em uma modalidade específica, a porção heteróloga é um fragmento (VWF) compreendendo um domínio D’ e um domínio D3 do VWF. O fragmen- to de VWF compreendendo o domínio D’ e o domínio D3 pode com- preender ainda um domínio VWF selecionado do grupo que consiste em um domínio A1, um domínio A2, um domínio A3, um domínio D1, um domínio D2, um domínio D4, um domínio B1, um domínio B2, um domínio B3, um domínio C1, um domínio C2, um domínio CK, um ou mais fragmento dos mesmos, ee quaisquer combinações dos mesmos. Exemplos adicionais do polipeptídio tendo atividade de FVIII fusionado ao fragmento de VWF estão revelados no pedido de patente provisória US n° 61/667.901, depositado em 3 de julho de 2012, e na Publicação US N° 2015/0023959 A1, ambos aqui incorporados a título de referên- cia,
12. Porções Ligantes
[00416] Em certas modalidades, a porção heteróloga é um ligante peptídico.
[00417] Conforme usado neste pedido, os termos "ligantes peptídi- cos" ou "porções ligantes" referem-se a uma sequência de peptídios ou de polipeptídios (por exemplo, uma sequência de peptídios ou de polipeptídios sintéticos) que conecta dois domínios em uma sequência de aminoácidos linear de uma cadeia polipeptídica.
[00418] Em algumas modalidades, ligantes peptídicos podem ser inseridos entre a proteína terapêutica da invenção e uma porção hete- róloga descrita acima, tal como albumina. Ligantes peptídicos podem proporcionar flexibilidade para a molécula de polipeptídio quimérica. Os ligantes tipicamente não são clivados, no entanto, tal como pode ser desejável. Em uma modalidade, estes ligados não são removidos durante o processamento.
[00419] Um tipo de ligante que pode estar presente em uma proteí- na quimérica da invenção é um ligante clivável por protease que com- preende um sítio de clivagem (i.e., um substrato para o sítio de cliva- gem de protease, por exemplo, um sítio de clivagem de fator XIa, Xa, ou trombina) e que pode incluir ligantes adicionais seja no terminal N ou no terminal C ou em ambos os lados do sítio de clivagem. Esses ligantes cliváveis quando incorporados em um construto da invenção resultam em uma molécula quimérica tendo um sítio de clivagem hete-
rólogo.
[00420] Em uma modalidade, uma proteína terapêutica codificada por uma molécula de ácido nucleico da presente invenção compreen- de dois ou domínios ou porções Fc ligadas via um ligante cscFc para formar uma região Fc constituída por uma única cadeia polipeptídica. O ligante cscFc é flanqueado por pelo menos um sítio de processa- mento intracelular, i.e., um sítio clivado por enzima intracelular. Cliva- gem do polipeptídio no pelo menos um sítio de processamento intrace- lular resulta em um polipeptídio que compreende pelo menos duas ca- deias polipeptídicas.
[00421] Outros ligantes peptídicos podem ser opcionalmente usa- dos em um construto da invenção, por exemplo, para conectar uma proteína tipo fator de coagulação a uma região Fc. Alguns ligantes exemplificativos que podem usados junto com a invenção incluem, por exemplo, polipeptídios compreendendo os aminoácidos GlySer descri- tos mais detalhadamente abaixo.
[00422] Em uma modalidade, o ligante peptídico é sintético, i.e. de ocorrência não natural. Em uma modalidade, um ligante peptídico in- clui peptídios (ou polipeptídios) (que podem ser de ocorrência natural ou não) que compreendem uma sequência de aminoácidos que liga ou fusiona geneticamente uma primeira sequência linear de aminoácidos a uma segunda sequência linear de aminoácidos à qual ela não está naturalmente ligada ou geneticamente fusionada na natureza. Por exemplo. em uma modalidade o ligante peptídico pode compreender polipeptídios de ocorrência não natural que são formas modificadas de polipeptídios de ocorrência natural (por exemplo, compreendendo uma mutação tal como uma adição, substituição ou deleção). Em uma outra modalidade, o ligante peptídico pode compreender aminoácidos de ocorrência não natural. Em uma outra modalidade, o ligante peptídico pode compreender aminoácidos de ocorrência natural em uma se-
quência linear que não ocorre na natureza. Em ainda uma outra moda- lidade, o ligante peptídico pode compreender uma sequência de poli- peptídios de ocorrência natural.
[00423] Por exemplo, em certas modalidades, um ligante peptídico pode ser usado para fusionar porções Fc idênticas, formando assim uma região scFc homodimérica. Em outras modalidades, um ligante peptídico pode ser usado para fusionar porções Fc diferentes (por exemplo, uma porção Fc do tipo selvagem e uma porção Fc variante), formando assim uma região scFc heterodimérica.
[00424] Em uma outra modalidade, um ligante peptídico compreen- de ou consiste em um ligante gly-ser. Em uma modalidade, um ligdor scFc ou cscFc compreende pelo menos uma porção de uma articula- ção da imunoglobulina e um ligante gly-ser. Conforme usado neste pedido, o termo "ligante gly-ser" refere-se a um peptídio que consiste em resíduos glicina e serina. Em certas modalidades, o referido ligante gly-ser pode ser inserido entre duas outras sequências do peptídio li- gante. Em outras modalidades, um ligante gly-ser é preso a uma ou ambas as extremidades de uma sequência do ligante peptídico. Em ainda outras modalides, dois ou mais ligantes gly-ser são incorporados em série em um ligante peptídico. Em uma modalidade, um ligante peptídico da invenção compreende pelo menos uma porção de uma região de dobradiça superior (por exemplo, derivada de uma molécula de IgG1, IgG2, IgG3, ou IgG4), pelo menos uma porção de uma região de dobradiça intermediária (por exemplo, derivada de uma molécula IgG1, IgG2, IgG3, ou IgG4) e uma série dos resíduos aminoácidos gly/ser.
[00425] Os ligantes peptídicos da invenção têm pelo menos um aminoácido de comprimento e podem ser de comprimentos váriáveis. Em uma modalidade, um ligante peptídico da invenção tem de cerca de 1 a cerca de 50 aminoácidos de comprimento. Conforme usado neste contexto, o termo "cerca de" indica +/- dois resíduos aminoacídi- cos. Como o comprimento do ligante deve ser um número inteiro posi- tivo, o comprimento de cerca de 1 a cerca de 50 aminoácidos de com- primento significa um comprimento de 1-3 a 48-52 aminoácidos de comprimento. Em uma outra modalidade, um ligante peptídico da des- crição é de cerca de 10 a cerca de 20 aminoácidos de comprimento. Em uma outra modalidade, um ligante peptídico da invenção tem de cerca de 15 a cerca de 50 aminoácidos de comprimento. Em uma ou- tra modalidade, um ligante peptídico da invenção tem de cerca de 20 a cerca de 45 aminoácidos de comprimento. Em uma outra modalidade, um ligante peptídico da invenção tem de cerca de 15 a cerca de 35 ou cerca de 20 a cerca de 30 aminoácidos de comprimento. Em uma ou- tra modalidade, um ligante peptídico da invenção tem de cerca de 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 40, 50, 60, 70, 80, 90, 100, 500, 1000, ou 2000 aminoácidos de comprimento. Em uma modalidade, um ligante peptídico da invenção tem de 20 ou 30 aminoácidos de comprimento.
[00426] Em algumas modalidades, o ligante peptídico pode com- preender pelo menos dois, pelo menos três, pelo menos quatro, pelo menos cinco, pelo menos 10, pelo menos 20, pelo menos 30, pelo menos 40, pelo menos 50, pelo menos 60, pelo menos 70, pelo menos 80, pelo menos 90, ou pelo menos 100 aminoácidos. Em outras moda- lidades, o ligante peptídico pode compreender pelo menos 200, pelo menos 300, pelo menos 400, pelo menos 500, pelo menos 600, pelo menos 700, pelo menos 800, pelo menos 900, ou pelo menos 1.000 aminoácidos. Em algumas modalidades, o ligante peptídico pode com- preender pelo menos cerca de 10, 20, 30, 40, 50, 60, 70, 80, 90, 100, 150, 200, 300, 400, 500, 600, 700, 800, 900, 1000, 1100, 1200, 1300, 1400, 1500, 1600, 1700, 1800, 1900, ou 2000 aminoácidos. O ligante peptídico pode compreender 1-5 aminoácidos, 1-10 aminoácidos, 1-20 aminoácidos, 10-50 aminoácidos, 50-100 aminoácidos, 100-200 ami- noácidos, 200-300 aminoácidos, 300-400 aminoácidos, 400-500 ami- noácidos, 500-600 aminoácidos, 600-700 aminoácidos, 700-800 ami- noácidos, 800-900 aminoácidos, ou 900-1000 aminoácidos.
[00427] Ligantes peptídicos podem ser introduzidos em sequências de polipeptídios por meio de técnicas conhecidas na literatura. As mo- dificações podem ser confirmadas por análise das sequências de DNA. DNA plasmídico pode ser usado para transformar células hos- pedeiras para a produção estável dos polipeptídios produzidos.
13. Híbridos de Monômero-Dímero
[00428] Em algumas modalidades, a proteína terapêutica da inven- ção compreende uma molécula híbrida de monômero-dímero compre- endendo um fator de coagulação.
[00429] O termo "híbrido de monômero-dímero" usado neste pedido refere-se a uma proteína quimérica compreendendo uma primeira ca- deia polipeptídica e uma segunda cadeia polipeptídica, que estão as- sociadas entre sistema imunológico por uma ligação dissulfeto, onde a primeira cadeia chain compreende um fator de coagulação, por exem- plo, FVIII, e uma primeira região Fc e a segunda cadeia compreende, consiste essencialmente em, ou consiste em uma segunda região Fc sem o fator de coagulação. O construto híbrido de monômero-dímero é, portanto, um híbrido compreendendo um aspecto monomérico tendo apenas um fator de coagulação e um aspecto dimérico tendo duas re- giões Fc.
14. Sequências de Controle de Expressão
[00430] Em algumas modalidades, a molécula de ácido nucleico da invenção compreende ainda pelo menos uma sequência de controle de expressão. Uma sequência de controle de expressão, conforme usado neste pedido, é qualquer sequência de nucleotídeos reguladora, tal como uma sequência promotora ou uma combinação de promotor-
melhorador, que facilita a transcrição e a translação eficientes do ácido nucleico codificador ao qual ela está operacionalmente ligada. Por exemplo, a molécula de ácido nucleico da invenção pode estar opera- cionalmente a pelo menos uma sequência de controle de transcrição. A sequência de controle de expressão gênica pode ser, por exemplo, um promotor de mamífero ou um promotor viral, tal como um promotor constitutivo ou induzível.
[00431] Promotores constitutivos de mamíferos incluem, porém sem limitação, promotres os seguintes genes: hipoxantina fosforibosil trans- ferase (HPRT), adenosina deaminase, piruvato quinase, promotor be- ta-actina, e outros promotores constitutivos. Promotores virais exempli- ficativos que funcionam constitutivamente em células eucarióticas in- cluem, por exemplo, promotores oriundos do citomegalovírus (CMV), vírus símio (por exemplo, SV40), vírus do papiloma, adenovírus, vírus da imunodeficiência humana (HIV), vírus do sarcoma de Rous, cito- megalovírus, as repetições terminais longas (LTR) do vírus da leuce- mia de Moloney, e outros retrovírus, e o promotor timidina quinase do vírus do herpes simples. Outros promotores constitutivos são conheci- dos pelos especialistas na técnica. Os promotores úteis como sequên- cias de expressão gênica da invenção também incluem promotores induzíveis. Os promotores induzíveis são expressos na presença de um agente indutor. Por exemplo, o promotor metalotioneína é unduzi- do para promover transcrição e translação na presença de determina- dos íons metálicos. Outros promotores induzíveis são conhecidos pe- los especialistas na técnica.
[00432] Em uma modalidade, a invenção inclui a expressãoa de um transgene sob o controle de um promotor e/ou melhorador tecido- específico. Em uma outra modalidade, o promotor ou outra sequência de controle de expressão aumenta seletivamente a expressão do transgene em células hepáticas. Em certas modalidades, o promotor ou outra sequência de controle de expressão aumenta seletivamente a expressão do transgene em hepatócitos, células sinusoidais, e/ou cé- lulas endoteliais. Em uma modalidade particular, o promotor ou outra sequência de controle de expressão aumenta seletivamente a expres- são do transgene em células endoteliais. Em certas modalidades, o promotor ou outra sequência de controle de expressão aumenta seleti- vamente a expressão do transgene em células musculares, no sistema nervoso central, nos olhos, no fígado, no coração, ou qualquer combi- nação das mesmas. Exemplos de promotores fígado-específicos in- cluem, porém sem limitação, um promotor para tiretina de camundon- go (mTTR), um promotor para fator VIII humano endógeno (F8), um promotor para alfa-1-antitripsina humana (hAAT), um promotor mínimo para albumina humana, um promotor para albumina de camundongo. Em uma modalidade particular, o promotor compreende um promotor para mTTR. O promotor para mTTR está descrito em R. H. Costa et al., 1986, Mol. Cell. Biol. 6:4697. O promotor para F8 está descrito em Figueiredo and Brownlee, 1995, J. Biol. Chem. 270:11828-11838. Em algumas modalidades, o promotor é selecionado dentre um promotor fígado-específico (por exemplo, α1-antitripsina (AAT)), um promotor músculo-específico (por exemplo, creatina quinase muscular (MCK), cadeia pesada alfa da miosina (αMHC), mioglobina (MB), e desmina (DES)), um promotor sintético (por exemplo, SPc5-12, 2R5Sc5-12, dMCK, e tMCK), e qualquer combinação dos mesmos .
[00433] Em uma modalidade, o promotor é selecionado do grupo que consiste em um promotor para tiretina de camundongo (mTTR), um promotor para o fator VIII humano endógeno (F8), um promotor para alfa-1-antitripsina humana (hAAT), um promotor mínimo para al- bumina humana, um promotor para albumina de camundong, TTPp, um promotor para CASI, um promotor para CAG, um promotor para citomegalovírus (CMV), α1-antitripsina (AAT), creatina quinase muscu-
lar (MCK), cadeia alfa pesada da miosina (αMHC), mioglobina (MB), desmina (DES), SPc5-12, 2R5Sc5-12, dMCK, e tMCK, um promotor para fosfoglicerato quinase (PGK) e qualquer combinação dos mes- mos .
[00434] Os níveis de expressão podem ser ainda aumentados para atingir eficácia terapêutica usando um ou mais melhoradores. Um ou mais melhoradores podem ser apresentados isolados ou junto com um ou mais elementos promotores. Tipicamente, a sequência de controle de expressão compreende uma pluralidade de elementos melhorado- res e um promotor tecido-específico. Em uma modalidade, um melho- rador compreende uma ou mais cópias do melhorador α-1- microglobulina/bicunina (Rouet et al., 1992, J. Biol. Chem. 267:20765- 20773; Rouet et al., 1995, Nucleic Acids Res. 23:395-404; Rouet et al., 1998, Biochem. J. 334:577-584; Ill et al., 1997, Blood Coagulation Fi- brinolysis 8:S23-S30). Em uma outra modalidade, um melhorador é derivado de sítios de ligação ao fator de transcrição fígado-específico, tal como EBP, DBP, HNF1, HNF3, HNF4, HNF6, com Enh1, compre- endendo HNF1, (sentido)-HNF3, (sentido)-HNF4, (antissentido)-HNF1, (antissentido)-HNF6, (sentido)-EBP, (antissentido)-HNF4 (antissenti- do).
[00435] Em um exemplo particular, um promotor útil para a inven- ção compreende a SEQ ID NO: 69 (i.e., promotor ET), que também é conhecido como GenBank No. AY661265. Vide também Vigna et al., Molecular Therapy 11(5):763 (2005). Exemplos de outros vetores e elementos reguladores de genes estão descritos nos documentos WO 02/092134, EP1395293, ou Patentes US N° 6.808.905, 7.745.179, ou
7.179.903, cujas íntegras encontram-se aqui incorporada a título de referência .
[00436] Em uma modalidade, as moléculas de ácido nucleico da presente invenção compreendem ainda uma sequência intrônica. Em algumas modalidades, a sequência intrônica está posicionada 5' em relação à sequência de ácidos nucleicos codificando o FVIII polypepti- de. Em algumas modalidades, a sequência intrônica é uma sequência intrônica de ocorrência natural. Em algumas modalidades, a sequência intrônica é uma sequência sintética. Em algumas modalidades, a se- quência intrônica é derivada de uma sequência intrônica de ocorrência natural. Em certas modalidades, a sequência intrônica compreende o íntron T pequeno de SV40. Em uma modalidade, a sequência intrônica compreende a SEQ ID NO: 115.
[00437] Em algumas modalidades, a molécula de ácido nucleico compreende ainda um elemento regulador pós-transcricional. Em cer- tas modalidades, o elemento regulador pós-transcricional compreende um elemento regulador pós-transcricional do vírus mutado da hepatite de marmota (WPRE). Em uma modalidade particular, o elemento regu- lador pós-transcricional compreende a SEQ ID NO: 120.
[00438] Em algumas modalidades, a molécula de ácido nucleico compreende um sítio de ligação a microRNA (miRNA). Em uma moda- lidade, o sítio de ligação a miRNA é um sítio de ligação a miRNA para miR-142-3p. Em outras modalidades, o sítio de ligação a miRNA é se- lecionado dentre um sítio de ligação a miRNA revelado por Rennie et al., RNA Biol. 13(6):554-560 (2016), e STarMirDB, disponível no ende- reço http://sfold.wadsworth.org/starmirDB.php, cuja íntegra encontra- se aqui incorporada a título de referência.
[00439] Em algumas modalidades, a molécula de ácido nucleico compreende uma ou mais sequências de direcionamento de DNA nu- clear (DTSs). Uma DTS promove a translocação de moléculas de DNA contendo tais sequência para o núcleo. Em certas modalidades, a DTS compreende uma sequência melhoradora de SV40. Em certas modali- dades, a DTS compreende uma sequência melhoradora de c-Myc. Em algumas modalidades, as DTSs estão entre a primeira ITR e a segun-
da ITR. Em algumas modalidades, a DTS é 3' em relação à primeira ITR e 5' em relação à proteína terapêutica. Em outras modalidades, a DTS é 3' em relação à proteína terapêutica e 5' em relação à segunda ITR.
[00440] Em algumas modalidades, a molécula de ácido nucleico compreende ainda uma sequência de cauda de 3’UTR poli(A). Em uma modalidade, a sequência de cauda de 3’UTR poli(A) compreende bGH poli(A). Em uma modalidade, a cauda de 3'UTR poli(A) compre- ende um sítio de poli(A) de actina. Em uma modalidade, a cauda de 3'UTR poli(A) compreende um sítio de poli(A) de hemoglobina.
[00441] Em uma modalidade particular, a sequência de cauda de 3’UTR poli(A) compreende a SEQ ID NO: 122. III. Expressão Tecido-Específica
[00442] Em certas modalidades, será útil incluir no vetor uma ou mais sequências alvo de miRNA que, por exemplo, estão operacio- nalmente ligadas ao transgene do fator de coagulação. Assim sendo, a invenção também apresenta pelo menos uma sequência alvo de miR- NA operacionalmente ligada à sequência de nucleotídeos do fator de coagulação nucleotídeo ou de alguma forma inserida em um vetor. Mais de uma cópia de uma sequência alvo de miRNA incluída no vetor pode aumentar a eficácia do sistema. Também são incluídas diferen- tes sequências alvo de miRNA. Por exemplo, vetores que expressam mais de um transgene podem ter o transgene sob o controle de mais de uma sequência alvo de miRNA, que podem as mesmas ou diferen- tes. As sequências alvo de miRNA podem estar dispostas em tandem, mas outros arranjos também estão incluídos. O cassete de expressão de transgene, contendo sequências alvo de miRNA, também podem ser inseridos no vetor na orientação antissentido. A orientação antis- sentido pode ser útil na produção de partículas virais para evitar a ex- pressão de produtos genéticos que de alguma forma possam ser tóxi-
cos para as células produtoras. Em outras modalidades, o vetor com- preende 1, 2, 3, 4, 5 ,6, 7 ou 8 cópias da mesma sequência alvo de miRNA ou de sequências alvo de miRNA diferentes. No entanto, em determinas outras modalidades, o vetor não incluirá nenhuma sequên- cia alvo de miRNA. A decisão de incluir ou não uma sequência alvo de miRNA (e quantas) será ditada por parâmetros conhecidos tais como o tecido alvo desejado, o nível de expressão necessária etc.
[00443] Em uma modalidade, a sequência alvo é um alvo de miR- 223 que segundo informado bloqueia a expressão de forma mais efi- caz em progenitores comprometidos com a produção de mieloides e pelo menos parcialmente na HSPC mais primitiva. O alvo de miR-223 pode bloquear a expressão em células mieloides diferenciadas incluin- do granulócito, monócitos, macrófagos, células dendríticas mieloides. O alvo de miR-223 também pode ser adequado para aplicações de terapia genética que contam com a expressão transgênica robusta na linhagem linfoide ou eritroite. O alvo de miR-223 também pode blo- quear de forma muito eficiente a expressão em HSC humanas.
[00444] Em uma outra modalidade, a sequência alvo é um alvo de miR142 (tccataaagt aggaaacact aca (SEQ ID NO: 43)). Em uma moda- lidade, o vetor compreende 4 cópias de sequências alvo de miR-142. Em certas modalidades, a sequência complementar de microRNAs hematopoiéticos-específicos, tal como miR-142 (142T), é incorporada na região não transladada 3' de um vetor, por exemplo, vetores lentivi- rais (LV), deixando o transcrito codificador de transgenes suscetível à infra-regulação mediada por miRNA. Por este método, é possível pre- venir a expressão transgênica em células apresentadoras de antíge- nos da linhagem hematopoietica (APC), porém sendo mantida em cé- lulas não hematopoiéticas (Brown et al., Nat Med 2006). Esta estraté- gia pode impor um rigoroso controle pós-transcricional sobre a expres- são transgênica e dessa forma permite a distribuição estável e a ex-
pressão de longo prazo de transgenes. Em algumas modalidades, a regulação do miR-142 previne a depuração imunomediada de células transduzidas e/ou induzem células T reguladoras antígeno-específicas (T regs) e medeia a tolerância imunológica robusta para o antígeno codificado pelo transgene.
[00445] Em algumas modalidades, a sequência alvo é um alvo de miR181. Chen C-Z and Lodish H, Seminars in Immunology (2005) 17(2):155-165 revelam o miR-181, um miRNA expresso especifica- mente em células B na medula óssea de camundongos (Chen and Lo- dish, 2005). Ele também revela que algums miRNAs humanos estão associados a leucemias.
[00446] A sequência pode ser completamente ou parcialmente complementar ao miRNA. O termo "completamente complementar" significa que a sequência alvo tem uma sequência de nucleotídeos que é 100 % complementar à sequência do miRNA que reconhece a mesma. O termo "parcialmente complementar" significa que a sequên- cia alvo é apenas em parte complementar à sequência do miRNA que reconhece a mesma, e com isso a sequência parcialmente comple- mentar ainda é recohecida pelo miRNA. Em outras palavras, uma se- quência alvo parcialmente complementar no contexto da presente in- venção é eficaz para o reconhecimento do miRNA correspondente e na prevenção ou redução de expressão transgênica em células que expressam aquela miRNA. Exemplos das sequências alvo de miRNA estão descritos nos documentos WO2007/000668, WO2004/094642, WO2010/055413, ou WO2010/125471, cujas íntegras encontram-se aqui incorporadas a título de referência.
[00447] Em algumas modalidades, a expressão transgênica é dire- cionada para o fígado. Em certas modalidades, a expressão transgêni- ca é direcionada para os hepatócitos. Em outras modalidades, a ex- pressão transgênica é direcionada para as células endoteliais. Em uma modalidade particular, a expressão transgênica é direcionada pa- ra qualquer tecido que expresse naturalmente FVIII endógeno.
[00448] Em algumas modalidades, a expressão transgênica é dire- cionada para o sistema nervoso central. Em certas modalidades, a ex- pressão transgênica é direcionada para os neurônios. Em algumas modalidades, a expressão transgênica é direcionada para os neurô- nios aferentes. Em algumas modalidades, a expressão transgênica é direcionada para os neurônios eferentes. Em algumas modalidades, a expressão transgênica é direcionada para os interneurônios. Em al- gumas modalidades, a expressão transgênica é direcionada para as células gliais. Em algumas modalidades, a expressão transgênica é direcionada para os astrócitos. Em algumas modalidades, a expressão transgênica é direcionada para os oligodendrócitos. Em algumas mo- dalidades, a expressão transgênica é direcionada para a microglia. Em algumas modalidades, a expressão transgênica é direcionada para as células ependimárias. Em algumas modalidades, a expressão trans- gênica é direcionada para as células de Schwann. Em algumas moda- lidades, a expressão transgênica é direcionada para as células satéli- tes.
[00449] Em algumas modalidades, a expressão transgênica é dire- cionada para o tecido muscular. Em algumas modalidades, a expres- são transgênica é direcionada para o músculo liso. Em algumas moda- lidades, a expressão transgênica é direcionada para o músculo cardía- co. Em algumas modalidades, a expressão transgênica é direcionada para o músculo esquelético.
[00450] Em algumas modalidades, a expressão transgênica é dire- cionada para os olhos. Em algumas modalidades, a expressão trans- gênica é direcionada para uma célula fotorreceptora. Em algumas mo- dalidades, a expressão transgênica é direcionada para as células dos gânglios retinianos.
IV. Células Hospedeiras
[00451] A invenção também apresenta uma célula hospedeira com- preendendo uma molécula de ácido nucleico ou vetor da invenção. Conforme usado neste pedido, o termo "transformação" deve ser usa- do em sentido amplo para indicar a introdução de DNA em uma célula hospedeira receptora que altera o genótipo e consequentemente resul- ta em uma alteração na célula receptora.
[00452] "Células hospedeiras" referem-se a células que foram transformadas com vetores construídos por técnicas de DNA recombi- nante e codificando pelo menos um gene heterólogo. As células hos- pedeiras da presente invenção são de preferência oriundas de mamí- feros; mais preferivelmente oriundas de seres humanos ou camundon- gos. Acredita-se que os especialistas na técnica tenham conhecimento para determinar preferivelmente as linhagens de células hospedeiras particulares que sejam mais adequadas aos seus propósitos. Linha- gens de células hospedeiras exemplificativas incluem, porém sem limi- tação, CHO, DG44 e DUXB11 (linhagfens de ovário de hamster chi- nês, DHFR minus), HELA (carcinoma cervical humano), CVI (linhagem de rim de macado), COS (um derivado de CVI com antígeno T de SV40), R1610 (fibroblasto de hamster chinês) BALBC/3T3 (fibroblasto de camundongo), HAK (linhagem de rim de hamster), SP2/O (mieloma de camundongo), P3.times.63-Ag3.653 (mieloma de camundongo), BFA-1c1BPT (células endoteliais bovinas), RAJI (linfócito humano), PER.C6®, NS0, CAP, BHK21, e HEK 293 (rim humano). Em uma mo- dalidade particular, a célula hospedeira é selecionada do grupo que consiste em: uma célula CHO, uma célula HEK293, uma célula BHK21, uma célula PER.C6®, uma célula NS0, uma célula CAP e qualquer combinação das mesmas. Em algumas modalidades, as cé- lulas hospedeiras da presente invenção são células oriundas de inse- tos. Em uma modalidade particular, as células hospedeiras são células
SF9. Linhagens de células hospedeiras encontram-se tipicamente dis- poníveis em serviços comerciais, no American Tissue Culture Collec- tion, ou na literatura publicada.
[00453] A introdução de moléculas de ácido nucleico ou vetores da invenção na célula hospedeira pode ser efetuada por várias técnicas bastante conhecidas pelos especialistas na técnica. Estas incluem, porém sem limitação, transfecção (incluindo eletroforese e eletropora- ção), fusão de protoplastos, precipitação em fosfato de cálcio, fusão de células com DNA envelopado, microinjeção, e infecção com vírus in- tacto. Vide, Ridgway, A. A. G. "Mammalian Expression Vectors" Chap- ter 24.2, pp. 470-472 Vectors, Rodriguez and Denhardt, Eds. (Butter- worths, Boston, Mass. 1988). Mais preferivelmente, a introdução de plasmídeos no hospedeiro se dá via eletroporação. As células trans- formadas são cultivadas em condições apropriadas para a produção das cadeias leves e das cadeias pesadas, e avaliadas quanto à sínte- se de proteínas das cadeias pesadas e/ou das cadeias leves. Técnicas de ensaio exemplificativas incluem ensaio imunoabsorvente ligado a enzimas (ELISA), radioimunoensaio (RIA), ou análise da separação de células ativadas por fluorescência (FACS), imuno-histoquímica, entre outras.
[00454] Células hospedeiras compreendendo as moléculas de áci- do nucleico isoladas ou vetores da invenção são cultivadas em um meio de crescimento apropriado. Conforme usado neste pedido, o termo "meio de crescimento apropriado" significa um meio contendo nutrientes necessários para o crescimento de células. Nutrientes ne- cessários para o crescimento de células incluem uma fonte de carbo- no, uma fonte de nitrogênio, aminoácidos essenciais, vitaminas, mine- rais, e fatores de crescimento. Opcionalmente, o meio pode conter um ou mais fatores de seleção. Opcionalmente, o meio pode conter soro de bezerro ou soro de bezerro fetal (FCS). Em uma modalidade, o meio substancialmente não contém IgG. O meio de crescimento ge- ralmente selecionará as células contendo o construto de DNA por, por exemplo, seleção de drogas ou deficiência de um nutriente essencial que é completado pelo marcador selecionável no construto de DNA ou co-transfectado com o construto de DNA. Células de mamífero cultiva- das geralmente crescerão em meios comercialmente disponíveis con- tendo soro ou livres de soro (por exemplo, MEM, DMEM, DMEM/F12). Em uma modalidade, o meio é CDoptiCHO (Invitrogen, Carlsbad, CA.). Em uma outra modalidade, o meio é CD17 (Invitrogen, Carlsbad, CA.). A seleção de um meio apropriado para a linhagem celular particular usada se dá no nível de conhecimento dos especialistas na técnica. V. Preparação de Polipeptídios
[00455] A invenção também apresenta um polipeptídio codificado por uma molécula de ácido nucleico da invenção. Em outras modali- dades, o polipeptídio da invenção é codificado por um vetor compre- endendo as moléculas de ácido nucleico da invenção. Em ainda outras modalidades, o polipeptídio da invenção é produzido por uma célula hospedeira compreendendo as moléculas de ácido nucleico da inven- ção.
[00456] Em outras modalidades, a invenção também apresenta um método para a produção de um com atividade de fator de coagulação, por exemplo, atividade de FVIII, compreendendo cultivar uma célula hospedeira da invenção em condições nas quais é produzido um poli- peptídio com atividade de fator de coagulação, por exemplo, atividade de FVIII, e recuperar o polipeptídio com atividade de fator de coagula- ção, por exemplo, atividade de FVIII. Em algumas modalidades, a ex- pressão do polipeptídio com atividade de fator de coagulação, por exemplo, atividade de FVIII, é aumentada em relação a uma célula hospedeira cultivada nas mesmas condições, porém compreendendo uma sequência de nucleotídeos de referência (por exemplo, SEQ ID
NO: 16, a sequência de genes do FVIII parental).
[00457] Em outras modalidades, a invenção apresenta um método para o aumento da expressão de um polipeptídio com atividade de fa- tor de coagulação, por exemplo, atividade de FVIII, compreendendo cultivar uma célula hospedeira da invenção em condições nas quais um polipeptídio com atividade de fator de coagulação, por exemplo, atividade de FVIII, é expresso pela molécula de ácido nucleico, onde a expressão do polipeptídio com atividade de fator de coagulação, por exemplo, atividade de FVIII, é aumentada em relação a uma célula hospedeira cultivada nas mesmas condições compreendendo uma molécula de ácido nucleico de referência (por exemplo, SEQ ID NO: 16, a sequência de genes do FVIII parental).
[00458] Em outras modalidades, a invenção apresenta um método para o aumento do rendimento de um polipeptídio com atividade de fator de coagulação, por exemplo, por exemplo, atividade de FVIII, compreendendo cultivar uma célula hospedeira em condições nas quais um polipeptídio com atividade de fator de coagulação, por exemplo, atividade de FVIII, é produzido pela molécula de ácido nu- cleico revelada neste pedido, onde o rendimento do polipeptídio com atividade de fator de coagulação, por exemplo, atividade de FVIII, é aumentada em relação a uma célula hospedeira cultivada nas mesmas condições compreendendo uma sequência de aminoácidos de refe- rência (por exemplo, SEQ ID NO: 16, a sequência de genes do FVIII parental).
[00459] A proteína terapêutica, por exemplo, o fator de coagulação, da invenção pode ser sintetizada em um animal transgênico, tal como um roedor, cabra, ovelha, porco, ou vaca. O termo "animais transgêni- cos" refere-se a animais não humanos que tiveram incorporado em seu genoma um gene estranho. Como este gene está presente em tecidos da linhagem germinativa, ele é passado da matriz para seus descendentes. Genes exógenos são introduzidos em embriões de uma única célula (Brinster et al. 1985, Proc. Natl. Acad.Sci. USA 82:4438). Métodos para a produção de animais transgênicos são conhecidos na literatura e incluem transgênicos que produzem moléculas de imuno- globulina (Wagner et al. 1981, Proc. Natl. Acad. Sci. USA 78: 6376; McKnight et al. 1983, Cell 34 : 335; Brinster et al. 1983, Nature 306: 332; Ritchie et al. 1984, Nature 312: 517; Baldassarre et al. 2003, The- riogenology 59 : 831 ; Robl et al. 2003, Theriogenology 59: 107; Ma- lassagne et al. 2003, Xenotransplantation 10 (3): 267). VII. Composição Farmacêutica
[00460] As composições contendo uma molécula de ácido nucleico, um polipeptídio codificado pela molécula de ácido nucleico, um vetor, ou uma célula hospedeira da presente invenção podem conter um car- reador farmaceuticamente aceitável adequado. Por exemplo, elas po- dem conter excipientes e/ou auxiliares que facilitam o processamento dos compostos ativos como preparações desenhadas para distribuição para o sítio de ação.
[00461] Em uma modalidade, a presente invenção está voltada uma composição farmacêutica compreendendo (a) uma molécula de ácido nucleico, um vetor, um polipeptídio, ou uma célula hospedeira revelada neste pedido; e (b) um excipiente farmaceuticamente aceitável.
[00462] Em algumas modalidades, a composição farmacêutica compreende ainda um agente de distribuição. Em certas modalidades, o agente de distribuição compreende uma nanopartícula lipídica (LNP). Em outras modalidades, a composição compreende ainda lipossomas, outras moléculas poliméricas, e exossomas.
[00463] Conforme usado neste pedido uma "nanopartícula lipídica" refere-se a uma nanopartícula que compreende uma pluralidade de moléculas de lipídio fisicamente associadas entre si por forças inter- moleculares. As nanopartículas lipídicas podem ser, por exemplo, mi-
croesferas (incluindo vesídulas unilamelares e multilamelares, por exemplo, lipossomas), uma fase dispersada em uma emulsão, micelas ou uma fase interna em uma suspensão.
[00464] Em algumas modalidades, a presente invenção apresenta uma composição de molécula de ácido nucleico encapsulada que po- de incluir uma nanopartícula lipídica hospedeira encapsulando a molé- cula de ácido nucleico da invenção. A nanopartícula lipídica pode compreender um ou mais lipídios (por exemplo, lipídios catiônicos, li- pídios não catiônicos, e lipídios modificados com PEG). Em certas modalidades, as nanopartículas lipídicas da presente invenção são formuladas para distribuirem uma ou mais moléculas de ácido nucleico da invenção para uma ou mais células alvo. Exemplos de lipídios ade- quados incluem, porém sem limitação, compostos fosfatidílicos (por exemplo, fosfatidiletanolamina, esfingolipídios, fosfatidilcolina, fosfati- dilserina, fosfatidilglicerol, gangliosídeos, e cerebrosídeos). Um "lipídio catiônico" refere-se a qualquer espécie de lipídio que transporta uma carga líquida positiva a um determinado pH (por exemplo, pH fisiológi- co).
[00465] Em certas modalidades, as nanopartículas lipídicas da pre- sente invenção têm uma determinada razão N/P. Conforme usado neste pedido "razão N/P" ou "razão NP" refere-se à razão de grupos amina do polímero carregado positivamente para os grupos fosfato de ácido nucleico carregados negativamente. O caráter N/P de um com- plexo nanopartícula lipídica/molécula de ácido nucleico pode influenci- ar propriedades tais como carga superficial líquida, estabilidade, e ta- manho. A razão NP das nanopartículas lipídicas descritas neste pedi- do pode ser cerca de 1, cerca de 2, cerca de 3, cerca de 4, cerca de 5, cerca de 6, cerca de 7, cerca de 8, cerca de 9, cerca de 10, cerca de 15, cerca de 20, cerca de 25, cerca de 30, cerca de 35, cerca de 40, cerca de 45, cerca de 50, cerca de 55, cerca de 60, cerca de 65, cerca de 70, cerca de 75, cerca de 80, cerca de 85, cerca de 90, cerca de 95, cerca de 100, e qualquer razão entre estas. Por exemplo, a razão NP das nanopartículas lipídicas descritas neste pedido pode ser de cerca de 18, cerca de 36, ou cerca de 72.
[00466] Por conseguinte, em certas modalidades, uma composição farmacêutica compreende uma molécula de ácido nucleico da presen- te invenção encapsulada em uma nanopartícula lipídica, e um excipi- ente farmaceuticamente aceitável.
[00467] A composição farmacêutica pode ser formulada para admi- nistração parenteral (i.e., intravenosa, subcutânea, ou intramuscular) por injeção de bolo. As formulações para injeção podem ser apresen- tadas em uma forma de dosagem unitária, por exemplo, em ampolas ou em recipientes com múltiplas doses com um conservante adiciona- do. As composições podem adquirir formas tais como suspensões, so- luções, ou emulsões em veículos oleosos ou aquosos, e conter agen- tes de formulação tais como agentes de suspensão, estabilizantes e/ou dispersantes. Alternativamente, o princípio ativo pode estar na forma de pó para reconstituição com um veículo adequado, por exem- plo, água livre de pirogênio.
[00468] Formulações adequadas para administração parenteral também incluem soluções aquosas dos compostos ativos em uma forma solúvel em água, por exemplo, sais solúveis em água. Além dis- so, podem administradas suspensões dos compostos ativos como suspensões oleosas apropriadas para injeção. Solventes ou veículos lipofílicos adequados incluem óleos graxos, por exemplo, óleo de ger- gelim, ou ésteres de ácidos graxos sintéticos, por exemplo, oleato de etila ou triglicerídeos. As suspensões aquosas para injeção podem conter substâncias que aumentam a viscosidade da suspensão, inclu- indo, por exemplo, carboximetil celulose sódica, sorbitol e dextrana. Opcionalmente, a suspensão também pode conter estabilizantes. Li-
possomas também podem ser usados para encapsular as moléculas da invenção para distribuição para células ou espaços intersticiais. Carreadores farmaceuticamente aceitáveis exemplificativos são sol- ventes fisiologicamente compatíveis, meios de dispersão, revestimen- tos, agentes antibacterianos e antifúngicos, agentes isotônicos e retar- dadores da absorção, água, solução salina, solução salina tamponada com fosfato, dextrose, glicerol, etanol entre outros. Em algumas moda- lidades, a composição compreende agentes isotônicos, por exemplo, açúcares, poliálcoois, tais como manitol, sorbitol, ou cloreto de sódio. Em outras modalidades, as composições compreendem substâncias farmaceuticamente aceitáveis tais como agentes umectantes ou pe- quenas quantidades de substâncias auxiliares tais como agentes umectantes ou emulsificantes, conservantes ou tampões, que aumen- tam a vida de prateleira ou a eficácia dos princípios ativos.
[00469] As composições da invenção podem ter uma variedade de formas, incluindo, por exemplo, formas de dosagem líquidas (por exemplo, soluções injetáveis e infusíveis), dispersões, suspensões, formas de dosagem semissólidas e sólidas. A forma preferida depende do modo de administração e da aplicação terapêutica.
[00470] A composição pode ser formulada como uma solução, mi- croemulsão, dispersão, lipossoma, ou outra estrutura ordenada ade- quada para alta concentração da droga. Soluções injetáveis estéreis podem ser preparadas por incorporação do princípio ativo na quanti- dade necessária em um solvente apropriado com um dos ingredientes ou uma combinação de ingredientes elencados acima, conforme ne- cessário, seguido por esterilização com filtração. Em geral, as disper- sões são preparadas por incorporação do princípio ativo em um veícu- lo estéril que contém um meio de dispersão básico e os outros ingredi- entes necessários dentre aqueles elencados acima. No caso de pós estéreis para a preparação de soluções injetáveis estéreis, os métodos de preparação preferidos são secagem a vácuo e secagem por conge- lamento que produzem um pó do princípio ativo mais qualquer ingredi- ente adicional desejado de uma solução previamente filtrada estéril. A fluidez própria de uma solução pode ser mantida, por exemplo, pelo uso de um revestimento tal como lecitina, pela manutenção do tama- nho de partícula necessário no caso de dispersão e pelo uso de ten- soativos. A absorção prolongada das composições injetáveis pode ser causada pela inclusão, na composição, de uma agente que retarda a absorção, por exemplo, sais de monoestearato e gelatina.
[00471] O princípio ativo pode ser formulado com uma formulação ou dispositivo de liberação controlada. Exemplos de tais formulações e dispositivos incluem implantes, compressas transdérmicas, e sistemas de distribuição microencapsulados. Polímeros biodegrdáveis e bio- compatíveis podem ser usados, por exemplo, vinil acetato de etileno, polianidridos, ácido poliglicólido, colágeno, poliortoésteres, e ácido po- liláctico. Métodos para a preparação de tais formulações e dispositivos são conhecidos na literatura. Vide, por exemplo, Sustained and Con- trolled Release Drug Delivery Systems, J. R. Robinson, ed., Marcel Dekker, Inc., New York, 1978.
[00472] Formulações de depósito injetáveis podem ser feitas por formação de matrizes microencapsuladas da droga em polímeros bio- degradáveis tal como polilactídeo-poliglicolídeo. Dependendo da razão de droga para polímero, e da natureza do polímero empregado, a taxa de liberaçãoa da droga pode ser controlada. Outros polímeros biode- gradáveis exemplificativos são poliortoésteres e polianidridos. As for- mulações de depósito injetáveis também podem ser preparadas por aprisionamento na droga em lipossomas ou microemulsões.
[00473] Compostos ativos suplementares podem ser incorpordos nas composições. Em uma modalidade, a molécula de ácido nucleico da invenção é formulada com um fator de coagulação, ou uma varian-
te, fragmento, análogo ou derivado do mesmo. Por exemplo, o fator de coagulação inclui, porém sem limitação fator V, fator VII, fator VIII, fa- tor IX, fator X, fator XI, fator XII, fator XIII, protrombina, fibrinogênio, de fator von Willebrand ou fator de tecido solúvel recombinante (rsTF) ou formas ativadas de qualquer um destes. O fator de coagulação do agente hemostático também pode incluir drogas anti-fibrinolílicas, por exemplo, ácido epsilon-amino-caproico, ácido tranexâmico.
[00474] Os regimes de dosagem podem ser ajustados para propor- cionar a resposta desejada ótima. Por exemplo, um único bolo pode ser administrado, várias doses fracionadas podem ser administradas ao longo do tempo, ou a dose pode ser proporcionalmente reduzida ou aumentada segundo indicado pelas exigências da situação terapêuti- ca. É vantajoso formular composições parenterais em uma forma uni- tária de dosagem para facilitar a administração e a uniformidade da dosagem. Vide, por exemplo, Remington's Pharmaceutical Sciences (Mack Pub. Co., Easton, Pa. 1980).
[00475] Além do composto ativo, a forma de dosagem líquida pode conter ingredientes inertes tais como água, água, álcool etílico, carbo- nato de etila, acetato de etila, álcool benzílico, benzoato de benzila, propileno glicol, 1,3-butileno glicol, dimetilformamida, óleos, glicerol, álcool tetra-hidrofurfurílico, polietieno glicóis, e ésteres de ácidos de sorbitan.
[00476] Exemplos não limitativos de carreadores farmacêuticos adequados também estão descritos em Remington's Pharmaceutical Sciences de E. W. Martin. Alguns exemplos de excipientes incluem amido, glicose, lactose, sacarose, gelatina, malte, arroz, farinha, giz, sílica gel, estearato de sódio, monoestearato de glicerol, talco, cloreto de sódio, leite desnatado em pó, glicerol, propileno, glicol, água, eta- nol, entre outros. A composição também pode conter reagentes tam- ponantes de pH, e agentes umectantes ou emulsificantes.
[00477] Para administração oral, a composição farmacêutica pode adquirir a forma de comprimidos ou cápsulas preparadas por meios convencionais. A composição também pode ser preparada como um líquido, por exemplo, um xarope ou uma suspensão. O líquido pode incluir agentes de suspensão (por exemplo, xaropes de sorbitol, deri- vados de celulose ou gorduras comestíveis hidrogenadas), agentes emulsificantes (lecitina ou acácia), veículos não aquosos (por exemplo, óleo de amêndoa, ésteres oleosos, álcool etílico, ou óleos vegetais fracionados), e conservantes (por exemplo, p-hidroxibenzoatos de me- tila ou de propila ou ácido sórbico). As preparações também podem incluir agentes flavorizantes, colorantes e adoçantes. Alternativamente, a composição pode ser apresentada como um produto seco para re- constituição com água ou outro veículo adequado.
[00478] Para administração bucal, a composição pode adquirir a forma de comprimidos ou patilhadas de acordo com protocolos con- vencionais.
[00479] Para administração por inalação, os compostos para uso de acordo com a presente invenção são convenientemente distribuídos na forma de um aerossol nebulizado com ou sem excipientes ou na forma de um spray aerossol a partir de uma embalagem pressurizada ou nebulizador, opcionalmente com um propelente, por exemplo, diclo- rofluorometano, triclorofluorometano, diclorotetrafluorometano, dióxido de carbono ou outro gás adequado. No caso de um aerossol pressuri- zado a unidade de dosagem pode ser determinada por meio da apre- sentação de uma válvula para distribuir uma quantidade regulada. Cápsulas e cartuchos de, por exemplo, gelatina para uso em um inala- dor ou insuflador podem ser formuladas contendo uma mistura em pó do composto e uma base para pó adequada tal como lactose ou ami- do.
[00480] A composição farmacêutica também pode ser formulada para administração retal como um supositório ou enema de retenção, por exemplo, contendo bases para supositório convencionais tais co- mo manteiga de cacau ou outros glicerídeos.
[00481] Em algumas modalidades, a composição é administrada por uma via selecionada do grupo que consiste em administração tópi- ca, administração intraocula, administração parenteral, administração intratecal, administração subdural e administração oral. A administra- ção parenteral pode ser administração intravenosa ou subcutânea. VIII. Métodos de Tratamento
[00482] Em alguns aspectos, a presente invenção está voltada para métodos para o tratamento de uma doença ou condição em um indiví- duo com necessidade do mesmo, compreendendo administar uma mo- lécula de ácido nucleico, um vetor, um polipeptídio, ou uma composi- ção farmacêutica revelada neste pedido.
[00483] Em algumas modalidades, a molécula de ácido nucleico compreende uma primeira ITR, uma segunda ITR, e um cassete gené- tico, onde o cassete genético codifica uma sequência alvo onde a se- quência alvo codifica uma proteína terapêutica, e onde a molécula de ácido nucleico é usada para tratar uma doença ou condição em um indivíduo com necessidade do mesmo. Em algumas modalidades, a doença ou condição afeta um órgão selecionado dentre músculo, sis- tema nervoso central (SNC), olhos, fígado, coração, rins, pâncreas, pulmões, pele, bexiga, trato urinário, e qualquer combinação dos mesmos. Em algumas modalidades, o indivíduo tem uma doença ou condição selecionada do grupo que consiste em DMD (distrofia mus- cular de Duchenne), XLMTM (miopatia miotubular ligada ao X), Par- kinson, SMA (atrofia muscular espinhal), ataxia de Friedreich, GUCY2D-LCA (amaurose congênita de Leber), XLRS (retinosquise ligada ao X), AMD (degeneração macular relacionada com a idade), ACHM (acromatopsia), IRD mediada por RPF65, e qualquer combina-
ção das mesmas.
[00484] Em algumas modalidades, a molécula de ácido nucleico compreende uma primeira ITR, uma segunda ITR, e um cassete gené- tico, onde o cassete genético codifica uma sequência alvo, onde a se- quência alvo codifica um miRNA, e onde a molécula de ácido nucleico é usada para tratar uma doença ou condição em um indivíduo com ne- cessidade do mesmo. Em algumas modalidades, a doença ou condi- ção compreende esclerose lateral amiotrófica (ALS), doença de Hun- tington, e/ou retinite pigmentosa dominante autossômica.
[00485] Em algumas modalidades, a molécula de ácido nucleico compreende uma primeira ITR, uma segunda ITR, e um cassete gené- tico, onde o cassete genético codifica uma sequência alvo, onde a se- quência alvo codifica um fator de coagulação, e onde a molécula de ácido nucleico é usada para tratar uma doença ou condição de san- gramento em um indivíduo com necessidade do mesmo. A doença ou condição de sangramento é selecionada do grupo que consiste em distúrbio de coagulação do sangue, hemartrose, sangramento muscu- lar, sangramento oral, hemorragia, hemorragia nos músculos, hemor- ragia oral, trauma, trauma capitis, sangramento gastrointestinal, san- gramento intracraniano, hemorragia intra-abdominal, hemorragia intra- torácica, fratura de osso, sangramento no sistema nervoso central, sangramento no espaço retrofarígeno, sangramento no espaço retro- peritoneal, sangramento na bainha iliopsoas e qualquer combinação das mesmas. Em ainda outras modalidades, o indivíduo está agenda- do para uma cirurgia. Em ainda outras modalidades, o tratamento é profilático ou a pedido.
[00486] A invenção apresenta um método para o tratamento de um distúrbio de sangramento compreendendo administrar a um indivíduo com necessidade da mesma uma molécula de ácido nucleico, vetor, ou polipeptídio da invenção. Em algumas modalidades, o distúrbio de sangramento caracteriza-se por uma deficiência de um fator de coagu- lação, por exemplo, FVIII. Em algumas modalidades, o distúrbio de sangramento é hemofilia. Em algumas modalidades, o distúrbio de sangramento é hemoflia A. Em algumas modalidades do método para o tratamento de um distúrbio de sangramento, a atividade plasmática de um fator de coagulação, por exemplo, FVIII, 24 horas depois da administração é aumentada em relação a um indivíduo que recebeu uma molécula de ácido nucleico de referência (por exemplo, SEQ ID NO: 16, a sequência de genes do FVIII parental), um vetor compreen- dendo uma molécula de ácido nucleico de referência, ou um polipeptí- dio codificado por uma molécula de ácido nucleico de referência.
[00487] A invenção também se refere a um método para o trata- mento, a melhora, ou a prevenção de um distúrbio hemostático em um indivíduo compreendendo administrar uma quantidade terapeutica- mente eficaz de uma molécula de ácido nucleico isolada da invenção ou de um polipeptídio tendo atividade de fator de coagulação, por exemplo, atividade de FVIII, codificado pela molécula de ácido nuclei- co da invenção. O tratamento, a melhora, e a prevenção pela molécula de ácido nucleico isolada ou pelo polipeptídio codificado pode ser uma terapia de bypass. O indivíduo que recebe a terapia de bypass pode já ter desenvolvido um inhibidor para um fator de coagulação, por exem- plo, FVIII, ou está sujeito a desenvolver um inibidor para um fator de coagulação.
[00488] As moléculas de ácido nucleico, os vetores, ou os polipep- tídios da invenção tratam ou previnem um distúrbio hemostático pro- movendo a formação de um coágulo de fibrina. O polipeptídio tendo atividade de fator de coagulação, por exemplo, atividade de FVIII, codi- ficado pela molécula de ácido nucleico da invenção pode ativar um membro de uma cascata de coagulação. O fator de coagulação pode ser um participante da via extrínseca, da via intrínseca ou de ambas.
[00489] As moléculas de ácido nucleico, os vetores, ou os polipep- tídios da invenção podem ser usados para tratar distúrbios hemostáti- cos sabidamente tratáveis com um fator de coagulação. Os distúrbios hemostáticos que podem ser tratados com os métodos da invenção incluem, porém sem limitação, hemofilia A, hemofilia B, doença de von Willebrand, deficiência de fator XI (deficiência de PTA), deficiência de fator XII, assim como deficiências ou anormalidades estruturais no fi- brinogênio, protrombina, facor V, fator VII, fator X, ou fator XIII, hemar- trose, sangramento muscular, sangramento oral, hemorragia, hemor- ragia nos músculos, hemorragia oral, trauma, trauma capitis, sangra- mento gastrointestinal, hemorragia intracraniana, hemorragia intra- abdominal, hemorragia intratorácica, fratura de osso, sangramento no sistema nervoso central, sangramento no espaço retrofaríngeo, san- gramento no espaço retroperitoneal, e sangramento na bainha illiop- soas.
[00490] Em algumas modalidades, o distúrbio hemostático é um distúrbio hereditário. Em uma modalidade, o indivíduo tem hemophilia A. Em outras modalidades, o distúrbio hemostático é o resultado de uma deficiência de um fator de coagulação. Em outras modalidades, o distúrbio hemostático é o resultado de uma deficiência de FVIII. Em outras modalidades, o distúrbio hemostático pode ser o resultado de fator de coagulação FVIII defeituoso.
[00491] Em uma outra modalidade, o distúrbio hemostático pode ser um distúrbio adquirido. O distúrbio adquirido pode ser resultado de uma doença ou condição secundária subjacente. A condição não rela- cionada pode ser, por exemplo, porém sem limitação, câncer, uma do- ença autoimune, ou gravidez. O distúrbio adquirido pode resultado de idade avançada ou de medicamento para tratar um distúrbio secundá- rio subjacente (por exemplo, quimioterapia contra câncer).
[00492] A invenção também se refere a métodos para o tratamento de um indivíduo que não tem um distúrbio hemostático nem uma do- ença ou condição secundária que resulte na aquisição de um distúrbio hemostático. A invenção refere-se assim a um método para o trata- mento de um indivíduo com necessidade de um agente hemostático genérico compreendendo administrar uma quantidade terapeuticamen- te eficaz da molécula de ácido nucleico isolada, vetor, ou polipeptídio da invenção. Por exemplo, em uma modalidade, o indivíduo com ne- cessidade de um agente hemostático genérico está passando, ou está a passar, por uma cirurgia. A molécula de ácido nucleico isolada, ve- tor, ou polipeptídio da invenção pode ser administrado antes ou depois da cirurgia como um profilático. A molécula de ácido nucleico isolada, vetor, ou polipeptídio da invenção pode ser administrado antes ou de- pois da cirurgia para controlar um episódio de sangramento agudo. A cirurgia pode incluir, porém sem limitação, transplante de fígado, res- secção do fígado, ou transplante de células-tronco.
[00493] Em uma outra modalidade, a molécula de ácido nucleico isolada, vetor, ou polipeptídio da invenção pode ser usada para tratar um indivíduo tendo um episódio de sangramento agudo que não apre- senta um distúrbio hemostático. O episódio de sangramento agudo pode resultar de trauma severo, por exemplo, cirurgia, um acidente de automóvel, ferimento, tiro lacerante, ou qualquer outro evento traumá- tico que resulte em sangramento descontrolado.
[00494] A molécula de ácido nucleico isolada, vetor, ou proteína pode ser usada para tratar profilaticamente um indivíduo com um dis- túrbio hemostático. A molécula de ácido nucleico isolada, vetor, ou proteína pode ser usada para tratar um episódio de sangramento agu- do em um indivíduo com um distúrbio hemostático.
[00495] Em uma outra modalidade, a expressão da proteína tipo fator de coagulação devido à administração da molécula de ácido nu- cleico ou vetor da invenção não induz uma resposta imunológica em um indivíduo. Em algumas modalidades, a resposta imunológica com- preende o desenvolvimento de anticorpos contra um fator de coagula- ção. Em uma modalidade, a resposta imunológica compreende o de- senvolvimento de anticorpos contra FVIII. Em algumas modalidades, a resposta imunológica compreende secreção de citocinas. Em algumas modalidades, a resposta imunológica compreende ativação de células B, células T, ou células B e células T. Em algumas modalidades, a resposta imunológica é uma resposta imunológica inibitória, onde a resposta imunológica no indivíduo reduz a atividade de uma proteína tipo fator de coagulação em relação à atividade do fator de coagulação em um indivíduo que não desenvolvera uma resposta imunológica. Em certas modalidades, a expressão de uma proteína tipo fator de coagu- lação devido à administração da molécula de ácido nucleico ou vetor da invenção previne uma resposta imunológica contra a proteína tipo fator de coagulação ou a proteína tipo fator de coagulação expressa a parit da molécula de ácido nucleico isolada ou vetor.
[00496] Em algumas modalidades, uma composição da molécula de ácido nucleico isolada, vetor ou proteína da invenção é administrada em combinação com pelo menos um outro agente que promove he- mostasia. O referido outro agente promove hemostasia em um terápi- co com atividade coagulante demonstrada. Como um exemplo, porém sem limitação, o agente hemostático pode incluir FV, FVII, FIX, FX, FXI, FXII, FXIII, protrombina, ou fibrinogênio ou formas ativadas de qualquer um dos precedentes. O fator de coagulação ou agente he- mostático também inclui fármacos anti-fibrinolíticos, por exemplo, epsi- lon-aminoácido caproico, ácido tranexâmico.
[00497] Em uma modalidade da invenção, a composição (por exemplo, molécula de ácido nucleico isolada, vetor, ou polipeptídio) é aquela na qual o fator de coagulação está presente em uma forma ati- vável quando administrado a um indivíduo. Tal molécula ativável pode ser ativada in vivo no sítio de coagulação depois de administrada a um indivíduo.
[00498] Por conseguinte, em algumas modalidades, a presente in- venção apresenta um método para o tratamento de um distúrbio de sangramento em um indivíduo com necessidade do mesmo, compre- endendo administrar ao indivíduo uma molécula de ácido nucleico compreendendo uma primeira repetição terminal invertida (ITR) e uma segunda ITR flanqueando um cassete genético compreendendo uma sequência de polinucleotídeos heterólogos codificando um fator de co- agulação, onde a primeira ITR e/ou a segunda ITR são uma ITR de um vírus não adeno-associado (não-AAV). Em algumas modalidades, a presente invenção apresenta um método para o tratamento de um dis- túrbio de sangramento em um indivíduo com necessidade do mesmo, compreendendo administrar ao indivíduo uma molécula de ácido nu- cleico compreendendo uma primeira repetição terminal invertida (ITR) e uma segunda ITR flanqueando um cassete genético compreendendo uma sequência de polinucleotídeos heterólogos codificando um fator de coagulação, onde a primeira ITR e/ou a segunda ITR compreende uma sequência de nucleotídeos apresentada na SEQ ID NO: 180, 181, 183, 184, 185, 186, 187 ou 188. Em algumas modalidades, a presente invenção apresenta um método para o tratamento de um distúrbio de sangramento em um indivíduo com necessidade do mesmo, compre- endendo administrar ao indivíduo uma molécula de ácido nucleico compreendendo uma primeira repetição terminal invertida (ITR) e uma segunda ITR flanqueando um cassete genético compreendendo uma sequência de polinucleotídeos heterólogos codificando um fator de co- agulação, onde a primeira ITR e/ou a segunda ITR compreende uma sequência de nucleotídeos pelo menos cerca de 75%, pelo menos cerca de 80%, pelo menos cerca de 85%, pelo menos cerca de 90%, pelo menos cerca de 95%, pelo menos cerca de 96%, pelo menos cer-
ca de 97%, pelo menos cerca de 98%, pelo menos cerca de 99%, ou 100% idêntica a uma sequência de nucleotídeos apresentada na SEQ ID NO: 180, 181, 183, 184, 185, 186, 187 ou 188, ou um derivado fun- cional da mesma.
[00499] Por conseguinte, em algumas modalidades, a presente in- venção apresenta um método para o tratamento de hemofilia A em um indivíduo com necessidade do mesmo, compreendendo administrar ao indivíduo uma molécula de ácido nucleico compreendendo uma primei- ra repetição terminal invertida (ITR) e uma segunda ITR flanqueando um cassete genético compreendendo uma sequência de polinucleotí- deos heterólogos codificando o fator VIII, onde a primeira ITR e/ou a segunda ITR são uma ITR de um vírus não adeno-associado (não- AAV). Em algumas modalidades, a presente invenção apresenta um método para o tratamento de hemofilia A em um indivíduo com neces- sidade do mesmo, compreendendo administrar ao indivíduo uma mo- lécula de ácido nucleico compreendendo uma primeira repetição ter- minal invertida (ITR) e uma segunda ITR flanqueando um cassete ge- nético compreendendo uma sequência de polinucleotídeos heterólo- gos codificando o fator VIII, onde a primeira ITR e/ou a segunda ITR compreende uma sequência de nucleotídeos apresentada na SEQ ID NO: 180, 181, 183, 184, 185, 186, 187 ou 188. Em algumas modalida- des, a presente invenção apresenta um método para o tratamento de hemofilia A em um indivíduo com necessidade do mesmo, compreen- dendo administrar ao indivíduo uma molécula de ácido nucleico com- preendendo uma primeira repetição terminal invertida (ITR) e uma se- gunda ITR flanqueando um cassete genético compreendendo uma se- quência de polinucleotídeos heterólogos codificando o fator VIII, onde a primeira ITR e/ou a segunda ITR compreende uma sequência de nu- cleotídeos pelo menos cerca de 75%, pelo menos cerca de 80%, pelo menos cerca de 85%, pelo menos cerca de 90%, pelo menos cerca de
95%, pelo menos cerca de 96%, pelo menos cerca de 97%, pelo me- nos cerca de 98%, pelo menos cerca de 99%, ou 100% idêntica a uma sequência de nucleotídeos apresentada na SEQ ID NO: 180, 181, 183, 184, 185, 186, 187 ou 188, ou um derivado funcional da mesma.
[00500] A invenção também apresenta um método para o tratamen- to de um distúrbio metabólico do fígado compreendendo administrar a um indivíduo com necessidade da mesma uma molécula de ácido nu- cleico, vetor, ou polipeptídio da invenção. Em algumas modalidades, o distúrbio metabólico do fígado é selecionado do grupo que consiste em fenilcetonuria (
[00501] A FIG. 7E mostra uma análise da mancha ocidental de lisa- dos do fígado de camundongos PKU tratados com ssDNA contendo o transgene PAH murino e ou B19d135 ou GPCd165 ITRs. Os fígados foram coletados 81 dias após o tratamento e lisados proteicos foram extraídos. Cada poço representa um único animal. A proteína PAH murina marcada com FLAG foi detectada usando o anticorpo anti- FLAG M2 e um controle de carga GAPDH foi incluído para compara- ção.
[00502] Uma doença do ciclo da ureia (por exemplo, um deficiência de transcarbamilase (OTC), ou argininosuccinato sintetase (ASS)), um distúrbio de armazenamento lisossômico (por exemplo, mucopolissa- caridoses), e uma doença de armazenamento de glicogênio (por exemplo, doença de armazenamento de glicogênio tipo I, II, III, IV). Outros distúrbios metabólicos do fígado incluem, porém sem limitação, doença de Wilson, deficiência de alfa-1 antitripsina, doença hepática aloimune gestacional (GALD), defeitos de oxidação de ácidos graxos, galactosemia, doenças de armazenamento de lipídios, tirosinamia, e distúrbios peroxissomais.
[00503] Em algumas modalidades, a presente invenção apresenta um método para o tratamento de um distúrbio metabólico do fígado em um indivíduo com necessidade do mesmo, compreendendo adminis- trar ao indivíduo uma molécula de ácido nucleico compreendendo uma primeira repetição terminal invertida (ITR) e uma segunda ITR flan- queando um cassete genético compreendendo uma sequência de po- linucleotídeos heterólogos codificando uma enzima metabólica associ- ada ao fígado que é deficiente no indivíduo, onde a primeira ITR e/ou a segunda ITR são uma ITR de um vírus não adeno-associado (não- AAV). Em algumas modalidades, a presente invenção apresenta um método para o tratamento de um distúrbio metabólico do fígado em um indivíduo com necessidade do mesmo, compreendendo administrar ao indivíduo uma molécula de ácido nucleico compreendendo uma primei- ra repetição terminal invertida (ITR) e uma segunda ITR flanqueando um cassete genético compreendendo uma sequência de polinucleotí- deos heterólogos codificando uma proteína terapêutica (por exemplo, uma proteína necessária para a função metabólica adequada do fíga- do), onde a primeira ITR e/ou a segunda ITR compreende uma se- quência de nucleotídeos apresentada na SEQ ID NO: 180, 181, 183, 184, 185, 186, 187 ou 188. Em algumas modalidades, a presente in- venção apresenta um método para o tratamento de um distúrbio meta- bólico do fígado em um indivíduo com necessidade do mesmo, com- preendendo administrar ao indivíduo uma molécula de ácido nucleico compreendendo uma primeira repetição terminal invertida (ITR) e uma segunda ITR flanqueando um cassete genético compreendendo uma sequência de polinucleotídeos heterólogos codificando uma proteína terapêutica (por exemplo, uma proteína necessária para a função me- tabólica adequada do fígado), onde a primeira ITR e/ou a segunda ITR compreende uma sequência de nucleotídeos pelo menos cerca de 75%, pelo menos cerca de 80%, pelo menos cerca de 85%, pelo me- nos cerca de 90%, pelo menos cerca de 95%, pelo menos cerca de 96%, pelo menos cerca de 97%, pelo menos cerca de 98%, pelo me-
nos cerca de 99%, ou 100% idêntica a uma sequência de nucleotídeos apresentada na SEQ ID NO: 180, 181, 183, 184, 185, 186, 187 ou 188, ou um derivado funcional da mesma.
[00504] Em algumas modalidades, a presente invenção apresenta um método para o tratamento de a fenilcetonúria (PKU) em um indiví- duo com necessidade do mesmo, compreendendo administrar ao indi- víduo uma molécula de ácido nucleico compreendendo uma primeira repetição terminal invertida (ITR) e uma segunda ITR flanqueando um cassete genético compreendendo uma sequência de polinucleotídeos heterólogos codificando fenilalanina hidroxilase (PAH), onde a primeira ITR e/ou a segunda ITR são uma ITR de um vírus não adeno- associado (não-AAV). Em algumas modalidades, a presente invenção apresenta um método para o tratamento de fenilketonuria (PKU) em um indivíduo com necessidade do mesmo, compreendendo adminis- trar ao indivíduo uma molécula de ácido nucleico compreendendo uma primeira repetição terminal invertida (ITR) e uma segunda ITR flan- queando um cassete genético compreendendo uma sequência de po- linucleotídeos heterólogos codificando fenilalanina hidroxilase (PAH), onde a primeira ITR e/ou a segunda ITR compreende uma sequência de nucleotídeos apresentada na SEQ ID NO: 180, 181, 183, 184, 185, 186, 187 ou 188. Em algumas modalidades, a presente invenção apresenta um método para o tratamento de fenilcetonúria (PKU) em um indivíduo com necessidade do mesmo, compreendendo adminis- trar ao indivíduo uma molécula de ácido nucleico compreendendo uma primeira repetição terminal invertida (ITR) e uma segunda ITR flan- queando um cassete genético compreendendo uma sequência de po- linucleotídeos heterólogos codificando fenilalanina hidroxilase, onde a primeira ITR e/ou a segunda ITR compreende uma sequência de nu- cleotídeos pelo menos cerca de 75%, pelo menos cerca de 80%, pelo menos cerca de 85%, pelo menos cerca de 90%, pelo menos cerca de
95%, pelo menos cerca de 96%, pelo menos cerca de 97%, pelo me- nos cerca de 98%, pelo menos cerca de 99%, ou 100% idêntica a uma sequência de nucleotídeos apresentada na SEQ ID NO: 180, 181, 183, 184, 185, 186, 187 ou 188, ou um derivado funcional da mesma.
[00505] A molécula de ácido nucleico isolada, vetor, ou polipeptídio pode ser administrado por via intravenosa, subcutânea, intramuscular, ou via qualquer superfície mucosa, por exemplo, por via oral, sublin- gual, bucal, sublingual, nasal, retal, vaginal ou via pulmonar. A proteí- na tipo fator de coagulação pode ser implantada ou ligada em um su- porte sólido biopolimérico que possibilita a liberação lenta da proteína quimérica para o sítio desejado.
[00506] Para administração oral, a composição farmacêutica pode adquirir a forma de comprimidos ou cápsulas preparados por meios convencionais. A composição também pode ser preparada como um líquido, por exemplo, um xarope ou uma suspensão. O líquido pode incluir agentes de suspensão (por exemplo, xarope de sorbitol, deriva- dos de celulose ou gorduras comestíveis hidrogenadas), agentes emulsificante (lecitina ou acácia), veículo não aquosos (por exemplo, óleo de amêndoa, ésteres oleosos, álcool etílico, ou óleos vegetais fracionados), e conservados, (por exemplo, metil ou propil-p- hidroxibenzoatos ou ácido sórbico). As preparações também podem incluir agentes flavorizantes, colorantes e adoçantes. Alternativamente, a composição pode ser apresentada como um produto seco para re- constituição com água ou outro veículo adequado.
[00507] Para administração bucal e sublingual, a composição pode adqurir a forma de comprimidos, pastilhas ou filmes de dissolução rá- pida de acordo com protcocolos convencionais.
[00508] Para administração por inalação, o polipeptídio tendo ativi- dade de fator de coagulação para uso de acordo com a presente in- venção é convenientemente distribuído na forma de um spray aerossol a partir uma embalagem pressurizada ou nebulizador (por exemplo, em PBS), com um propelente adequado, por exemplo, diclorodifluoro- metano, triclorofluorometano, diclorotetrafluorometano, dióxido de car- bono ou outro gás adequado. No caso de um aerossol pressurizado a forma unidade de dosagem pode ser determinada por meio de uma válcula para distribuir uma quantidade reulada. Cápsulas e cartuchos de, por exemplo, gelatina para uso em um inalador ou insuflador po- dem ser formulados contendo mistura em pó do composto e um base para pó adequada tal como lactose ou amido.
[00509] Em uma modalidade, a via de administração da molécula de ácido nucleico isolada, vetor ou polipeptídio é parenteral. O termo parenteral conforme usado neste pedido incluir administração intrave- nosa, intra-arterial, intraperitoneal, intramuscular, subcutânea, retal ou vaginal. A forma intravenosa de administração parenteral é preferida. Embora todas estas formas de administração sejam claramente con- templadas dentro do escopo da invenção, uma forma de administração seria uma solução para injeção, em particular para injeção ou goteja- mento intravenoso ou intra-arterial. Usualmente, uma composição far- macêutica adequada para injeção pode compreender um tamão (por exemplo, tampão acetato, fosfato ou citrato), um tensoativo (por exemplo, polissorbato), opcionalmente um agente estabilizante (por exemplo, albumina humana), etc. No entanto, em outros métodos compatíveis com os ensinamentos deste pedido, a molécula de ácido nucleico, vetor, ou polipeptídio pode ser distribuído diretamente para o sítio da população celular adversa, aumentando assim a exposição do tecido doente ao agente terapêutico.
[00510] Preparações para administração parenteral incluem solu- ções, suspensões e emulsões aquosas ou não aquosas estéreis. Exemplos de solventes não aquosos são propileno glicol, polietileno glicol, óleos vegetais tal como óleo de oliva, e ésteres orgânicos inje-
táveis tal como oleato de etila. Carreadores aquosos incluem água, soluções, emulsões ou suspensões alcoólicas/aquosas, incluindo so- lução salina e meios tamponados. Na presente invenção, carreadores farmaceuticamente aceitáveis incluem, porém sem limitação, tampão fosfato 0,01-0,1 M e de preferência 0,05 M ou solução salina 0,8%. Outros veículos parenterais comuns incluem soluções em fosfato de sódio, dextrose de Ringer, dextrose e cloreto de sódio, dextrose de Ringer lactada, ou óleos fixos. Veículos intravenosos incluem reposito- res de fluidos e nutrientes, reposistores eletrolíticos, tais como aqueles à base de dextrose de Ringer, entre outros. Conservantes e outros adi- tivos também podem estar presentes, tais como, por exemplo, antimi- crobianos, antioxidantes, agentes quelantes, e gases inertes, entre ou- tros.
[00511] Mais particularmente, composições farmacêuticas adequa- das para uso inejtável incluem soluções aquosas estéreis (onde solú- vel em água) ou dispersões estéreis e pós estéreis para a preparação extemporânea de soluções ou dispersões injetáveis estéreis. Nestes casos, a composição deve ser estéril e deve ser dluida na medida em haja fácil seringabilidade. Ela deve ser estável nas condições de podu- ção e armazenamento e de preferência será conservada contra a ação contaminante de micro-organismos, tais como bactérias e fungos. O carreador pode ser um solvente ou meio de dispersão contendo, por exemplo, água, etanol, poliol (por exemplo, glicerol, propileno glicol, e polietileno glicol líquido, entre outros) e misturas adequadas dos mes- mos. A fluidez adequada pode ser mantida, por exemplo, pelo uso de um revestimento tal como lecitina, pela manutenção do tamanho de partícula requerido no caso de dispersão, e pelo uso de tensoativos.
[00512] A composição farmacêutica também pode ser formulada para administração retal como um supositório ou enema de retenção, por exemplo, contendo bases convencionais para supositórios, tais como manteiga de cacau ou outros glicerídeos.
[00513] As doses eficazes das composições da presente invenção para o tratamento de condições variam dependendo de muitos fatores difeentes, incluindo o meio de administração, o sítio alvo, o estado fisi- ológico do paciente, se o paciente é um ser humano ou um animal, outros medicamentos administrados, e se o tratamento é profilático ou terapêutico. Usualmente, o paciente é um ser humano, mas mamíferos não humanos incluindo mamíferos transgênicos também podem ser tratados. As dosagens de tratamento podem ser tituladas por métodos rotineiros conhecidos pelos especialistas na técnica para otimizar a segurança e a eficácia.
[00514] A molécula de ácido nucleico, vetor, ou polipeptídios da in- venção podem ser opcionalmente administrados em combinação com outros agentes que sejam eficazes no tratamento do distúrbio ou con- dição com necessidade de tratamento (por exemplo, profilático ou te- rapêutico).
[00515] Conforme usado neste pedido, a administração das molé- culas de ácido nucleico, vetores ou polipeptídios da invenção em con- junto ou em combinação com uma terapia adjuvante significa a admi- nistração ou aplicação sequencial, simultânea, coextensiva, concorren- te, concomitante ou contemporânea da terapia e dos polipeptídios re- velados. Os especialistas na técnica vão perceber que a administração ou aplicação dos vários componentes do regime terapêutico combina- do pode ser cronometrada para aumentar a eficácia global do trata- mento. Um especialista na técnica (por exemplo, um médico) identifi- caria com facilidade, com base na terapia adjuvante selecionada e nos ensinamentos do presente relatório descritivo e sem experimentação indevida, regimes terapêuticos combinados.
[00516] Será ainda apreciado que a molécula de ácido nucleico iso- lada, vetor, ou polipeptídio da presente invenção pode ser usado em conjunto ou em combinação com um agente ou agentes (por exemplo, para oferecer um regime terapêutico combinado). Agentes exemplos com os quais um polipeptídio ou polinucleotídeo da invenção podem ser combinados incluem agentes que representam o atual padrão de cuidado para um distrúbiro particular sendo tratado. Tais agentes po- dem ser de natureza química ou biológica. O termo "biológico" ou "agente biológico" refere-se aminoácido qualquer agente farmaceuti- camente ativo feito a partir de organismos vivos e/ou seus produtos que seja destinado para uso como um terápico.
[00517] A quantidade de agente a ser usada em combinação com os polinucleotídeos ou polipeptídios da presente invenção pode variar conforme o indivíduo ou pode ser administrada de acordo com o co- nhecido no estado da técnica. Vide, por exemplo, Bruce A Chabner et al., Antineoplastic Agents, in GOODMAN & GILMAN'S THE PHARMACOLO- GICAL BASIS OF THERAPEUTICS 1233-1287 ((Joel G. Hardman et al., eds., 9th ed. 1996). Em uma outra modalidade, é administrada uma quantidade de tal agente consistente com o padrão de cuidado.
[00518] Em uma modalidade, também é revelado neste pedido um kit compreendendo a molécula de ácido nucleico revelada neste pedi- do e instruções para a administração da molécula de ácido nucleico a um indivíduo com necessidade da mesma. Em uma outra modalidade, também é revelado neste pedido um sistema de baculovírus para a produção da molécula de ácido nucleico apresentada neste pedido. A molécula de ácido nucleico é produzida em células de inseto. Em uma outra modalidade, é apresentado um sistema de distribuição de nano- partículaspara construtos de expressão. O construto de expressão compreende a molécula de ácido nucleico apresentada neste pedido. IX. Terapia Genética
[00519] Certos aspectos da presente invenção apresentam um mé- todo para a expressão de um construto genético em um indivíduo,
compreendendo a administração da molécula de ácido nucleico isola- da da invenção a um indivíduo com necessidade da mesma. Em al- guns aspectos, a invenção apresenta um método para aumentar a ex- pressão de um polipeptídio em um indivíduo compreendendo a admi- nistração da molécula de ácido nucleico isolada da invenção a um in- divíduo com necessidade da mesma. Em outros aspectos, a invenção apresenta um método para modular a expressão de um polipeptídio em um indivíduo com necessidade do mesmo compreendendo a ad- ministração de uma molécula de ácido nucleico isolada da invenção, por exemplo, uma sequência de nucleotídeos compreendendo um miRNA, ao indivíduo. Em alguns aspectos, a invenção apresenta um método para infra-regular a expressão de um gene alvo em um indiví- duo com necessidade do mesmo compreendendo a administração de uma molécula de ácido nucleico isolada da invenção, por exemplo, uma sequência de nucleotídeos compreendendo um miRNA, ao indiví- duo.
[00520] Terapia genética somática fora explorada como um possí- vel tratamento para uma variedade de condições, incluindo, porém sem limitação, hemofilia A. A terapia genética é um tratamento particu- larmente atraente para hemofilia devido ao seu potencial de cura da doença através da produção endógena contínua de um fator de coagu- lação, por exemplo, FVIII, após uma única administração do vetor. A hemofilia A é bastante adequada para uma abordagem de reposição genética porque suas manifestações clínicas são inteiramente atribuí- das à falta de um único produto genético (por exemplo, FVIII) que cir- cula em quantidades mínimas (200ng/ml) no plasma.
[00521] Já foi demonstrado que o uso de distrubição gênica viral convencional induz uma resposta imunológica em seres humanos. As proteínas capsídicas virais podem desencadear vários componentes do sistema imunológico humano. A distribuição gênica à base de AAV é atrativa porque o AAV é um vírus comum na população humana, a maioria das pessoas já foi exposta ao AAV, e o AAV se mostrou me- nos imunogênico que, por exemplo, o adenovírus. Assim sendo, a maioria das pessoas já desenvolveu uma resposta imunológica contra variantes particulares às quais já foram anteriormente expostas. Esta resposta adaptativa pré-existente pode incluir NaBs e células T que poderiam diminuir a eficácia clínica de subsequentes reinfecções com o AAV e/ou a eliminação de células que foram transduzidas, o que desqualificaria pacientes com imunidade anti-AAV pré-existente para tratamento com terapia genética à base de AAV. As moléculas de áci- do nucleico da presente invenção encontram uso na terapia genética não viral. Como os capsídeos virais não são necessários para a distri- buição gênica usando as moléculas de ácido nucleico da presente in- venção, não será desenvolvida imunidade para os componentes virais impedindo uma subsequente readministração (ou nova dosagem) a um indivíduo. Assim sendo, as moléculas de ácido nucleico da presen- te invenção permitem uma nova dosagem para estratégicas de distri- buição gênica de longo prazo.
[00522] Além disso, conforme descrito neste pedido, as moléculas de ácido nucleico da presente invenção compreendem ITRs parvovi- rais não-AAV flanqueando um cassete genético para induzir a expres- são transgênica estável depois da administração. A presença das ITRs são necessárias para expressão transgênica estável, como mostrado na FIG. 5, onde os ácidos nucleicos sem ITRs foram incapazes de efe- tuar expressão transgênica estável (vide "dsDNA no ITR" e "minicírcu- lo").
[00523] Uma proteína tipo fator de coagulação da invenção pode ser produzida in vivo em um mamífero, por exemplo, um paciente hu- mano, usando uma abordagem de terapia genética para o tratamento de uma doença ou distúrbio de sangramento selecionado do grupo que consiste em um distúrbio de coagulação do sangue, hemartrose, sangue nos músculos, sangue oral, hemorragia, hemorragia nos mús- culos, hemorragia oral, trauma, trauma capitis, sangramento gastroin- testinal, sangramento intracraniano, hemorragia intra-abdominal, he- morragia intratórica, fratura óssea, sangramento no sistema nervoso central, sangramento no espaço retrofaríngeo, sangramento no espaço retroperitoneal, e sangramento na bainha do músculo iliopsoas seria terapeuticamente benéfica. Em uma modalidade, a doença ou distúr- bio de sangramento é hemofilia. Em uma outra modalidade, a doença ou distúrbio de sangramento é hemofilia.A.
[00524] Outras condições também são adequadas para o tratamen- to com as moléculas de ácido nucleico reveladas neste pedido. Em certas modalidades, os métodos descritos neste pedido são usados para tratar uma doença ou condição que afeta um órgão alvo selecio- nado dentre músculo, sistema nervoso central (SNC), olhos, fígado, coração, rins, pâncreas, pulmões, pele, bexiga, trato urinário, ou qual- quer combinação dos mesmos. Em certas modalidades, os métodos descritos neste pedido são usados para tratar uma doença ou condi- ção selecionada dentre DMD (distrofia muscular de Duchenne), XLMTM (miopatia miotubular ligada ao X), mal de Parkinson, SMA (atrofia muscular espinhal), ataxia de Friedreich, GUCY2D-LCA (amau- rose congênita de Leber), XLRS (retinosquise ligada ao X), AMD (de- generação macular relacionada à idade), ACHM (acromatopsia), IRD mediada por RPF65 (Tabela 9). Tabela 9. Doenças e distúribos passíveis de tratamento pelos métodos revelados neste pedido.
Doença Órgão alvo Gene defeituoso Terapia genética DMD Músculo Distrofina ligada Introdução de ge- (distrofia muscular ao X nes de Duchenne) XLMTM Músculo MTM1 (miotubula- Introdução de ge- (miopatia miotubular rina) nes ligada ao X) Parkinson SNC Tirosina Introdução de ge- hidroxilase, nes AADC, ciclo- hidrolase SMA SNC SMN1 Introdução de ge- (atrofia muscular nes espinhal) Ataxia de Friedreich SNC FXN (Frataxina) Introdução de ge- nes GUCY2D-LCA Olhos GUCY2D Introdução de ge- Amaurose congênti- nes ca de Leber XLRS Olhos RS1 Introdução de ge- Retinosquise ligada nes ao X AMD Olhos CFH Introdução de ge- Degeneração Ma- HTRA nes cular relacionada ARMS com a idade CFB/CC2 ACHM Olhos CNGA/CNGB Introdução de ge- Achromatopsia nes IRD mediada por Olhos Prf65 Introdução de ge- RPF65 nes Distúrbios de ar- Órgão alvo Gene defeituoso Terapia genética mazenamento li- sossômico
MLD SNC ARSA Introdução de ge- leucodistrofia PSAP nes metacromática (distúribo de arma- zenamento lisossô- mico) MPS Fígado IDUA (MPS I) Introdução de ge- Mucopolissacarido- IDS (MPS II) nes ses (distúribo de armazenamento li- sossômico) PKU Fígado PAH Introdução de ge- Fenilcetonúria nes (distúribo de arma- zenamento lisossô- mico) Bomba Coração, GAA Introdução de ge- Doença de armaze- fígado, mús- (acid alfa- nes namento de glico- culo, SNC glucosidase) gênio tipo II Terapias com Mi- Órgão alvo Gene defeituoso Terapia genética cro RNA ALS SNC SOD11 miRNA Esclerose lateral amiotrófica Doença de Hunting- SNC HTT2 miRNA ton AdRP Olhos RHO3 miRNA Retinite pigmentosa (Rodopsina) dominante autos- sômica 1: Mutação do gene SOD1 responsável por 20% dos casos de ALS hereditária.
SOD1 do tipo selvagem demonstrou propriedades antia- poptóticas em culturas neurais, enquanto foi observado que o SOD1 mutante promovia apoptose na mitocôndia do cordão espinhal, mas não na mitocôndria do fígado, embora seja igualmente expresso em ambas.
A expressão infra-regulada do SOD1 mutado pode inibir a de- generação dos neurônios motores na ALS. 2: HD é um dos vários dis-
túrbios de repetição de trinucleotídeos que são causados pelo com- primento de uma seção repetida e um gene que ultrapassa a faixa normal. HTT contém uma sequência de três bases de DNA — citosina- adenina-guanina (CAG) — repetidas múltiplas vezes (i.e., ... CAGCA- GCAG ...), conhecida como uma repetição trinucleotídica. CAG é o có- gido genético (códon) de 3 letras para o aminoácido glutamina, e as- sim uma série das mesmas resulta na produção de uma cadeia de glu- tamina conhecida como trato polglutamínco (ou trato poliQ), e a parte repetida do gene, a região PoliQ. Geralmente, as pessoas possuem menos de 36 glutaminas repetidas na região poliQ que resulta na pro- dução da proteína citoplasmática Huntingtin. No entanto, uma se- queência de 36 ou mais glutaminas resulta na produção de uma prote- ína que tem características diferentes. Esta forma alterada, chamada huntingtin mutante (mHTT), aumenta a taxa de decaimento de certos tipos de neurônios. Geralmente, o número de repetições de CAG está relacionado a quanto este processo é afetado, e responde por cerca de 60% da variação da idade do início dos sintomas. A variação res- tante é atribuída ao ambiente e outros genes que modificm o meca- nismo da HD. 36–39 repetições resultam em uma forma de penetrân- cia reduzida da doença, com um início muito mais tardio e progressão mais lenta dos sintomas. Em alguns casos, o início pode se dar tão tarde que os sintomas nunca são percebidos. Com contagens muito alta de repetições, a HD apresenta penetrância total e pode ocorrer aos 20 anos, quando é então chamada de HD juvenil, acinética-rígida ou variante de Westphal. Esta responde por cerca de 7% dos portado- res de HD. 3: A maioria das mutações no gene RHO responsáveis por retinite pigmentosa altera o enrolamento ou transporte da proteína ro- dopsina. Poucas mutações fazem com que a rodopsina seja constituti- vamente ativada em vez de ser ativada em resposta à luz. Os estudos sugerem que versões alteradas da rodopsina interferem nas funções essenciais das células, fazendo com que os bastonetes se auto- destruam (sofram apoptose). Como bastonetes são essenciais para a visão em condições de pouca luz, a perda destas células leva à ce- gueira noturna progressiva nas pessoas com retinite pigmentosa.
[00525] Em algumas modalidades, os métodos apresentados neste pedido são usados para o tratamento de um distúrbio de armazena- mento lisossômico. Em algumas modalidades, o distúrbio de armaze- namento lisossômico é selecionado dentre MLD (leucodistrofia meta- criomática), MPS (mucopolissacaridoses), PKU (fenilcetonúria), doen- ça de armazenamento de glicogênio de Pompe tipo II, ou qualquer combinação das mesmas.
[00526] Em algumas modalidades, os métodos apresentados neste pedido são usados em uma terapia com microRNA (miRNA). Em al- gumas modalidades, o miRNA trata uma condição causada pela supe- rexpressão de um gene ou de uma proteína. Em algumas modalida- des, o miRNA trata uma condição causada pelo acúmulo de uma pro- teína. Em algumas modalidades, o miRNA trata uma condição causa- da expressão errada de um gene ou proteína. Em algumas modalida- des, o miRNA trata uma condição causada pela expressão de um ge- ne mutante. Em algumas modalidades, o miRNA trata uma condição causada pela expressão de um gene heterólogo. Em certas modalida- des, o miRNA trata uma condição selecionada dentre ALS (esclerose lateral amiotrófica), doença de Huntington, AdRP (retinite pigmentosa dominante autossômica), e qualquer combinação dos mesmos . Em certas modalidades, os métodos da presente invenção compreendem direcionar o tratamento de ALS pela administração de uma molécula de ácido nucleico revelada neste pedido, onde a molécula de ácido nucleico compreende um cassete genético codificando um miRNA, onde o miRNA direciona a expressão de SOD1. Em certas modalida- des, o miRNA compreende o miRNA artificial miR SOD1 revelado por Dirren et al., Annals of Clinical and Translational Neurology 2(2):167- 84 (February 2015). A mutação do gene SOD1 responde por 20% dos casos de ALS hereditária. SOD1 do tipo selvagem demonstrou propri- edades antiapoptóticas em culturas neurais, enquanto foi observado que SOD1 mutante promove a apoptose na mitocôndria do cordão es- pinhal, mas não na mitocôndria do fígado, embora seja igualmente ex- presso em ambas. A infra-regulação da expressão de SOD1 mutado pode inibir a degeneração dos neurônios motores na ALS.
[00527] Em certas modalidades, os métodos da presente invenção compreendem direcionar o tratamento da doença de Huntington pela administração de uma molécula de ácido nucleico relvelada neste pe-
dido, onde a molécula de ácido nucleico compreende um cassete ge- nético codificando um miRNA, onde o miRNA direciona a expressão de HTT.
Em certas modalidades, o miRNA compreende o miRNA ge- neticamente modificado miHTT revelado por Evers et al., Molecular Therapy 26(9):1-15 (epub ahead of print June 2018). A doença de Huntington é um dos vários distúrbios de repetição de trinucleotídeos que são causados pelo comprimento de uma seção repetida de um gene que ultrapassa uma faixa normal.
O HTT contém uma sequência de três bases de DNA — citosina-adenina-guanina (CAG) — repetida múltiplas vezes (i.e., ... CAGCAGCAG ...), que é conhecida como uma repetição trinucleotídícaa.
CAG é o código genético (códon) de três letras para o aminoácido glutamina, e assim uma série destas repeti- ções resulta na produção de uma cadeia de glutamina conhecida co- mo trato poliglutamínico (ou trato poliQ), e a parte repetido do gene, a região PoliQ.
Geralmente, as pessoas possuem menos de 36 glutami- nas repetidas na região poliQ o que resulta na produção da proteína citoplasmática huntingtin.
No entanto, uma sequência de 36 ou mais glutaminas resulta na produção de uma proteína que possui caracte- rísticas diferentes.
Esta forma alterada, chamada de huntingtin mutan- te (mHTT), aumenta a taxa de decaimento de certos tipos de neurô- nios.
Geralmente, o número de repetições de CAG está relacionado a quanto este processo é afetado, e responde por cerca de 60% da vari- ação da idade do início dos sintomas.
A variação restante é atribuída ao ambiente e outros genes que modificam o mecanismo da doença de Huntington. 36-39 variações resultam em uma forma de penetrên- cia reduzida da doença, com um início muito mais tardio e progressão mais lenta dos sintomas.
Em alguns casos o início pode se dar tão tar- de que os sintomas nunca são percebidos.
Com contagens muito altas de repetições, a doença de Huntington apresenta penetrância total e pode ocorrer aos 20 anos, quando é então chamada de doença de
Huntington juvenil, ou acinética-rígida, ou variante de Westphal. Esta responde por cerca de 7& dos portadores da doença de Huntington.
[00528] Em certas modalidades, os métodos da presente invenção compreendem diecionar o tratamento de retinite pigmentosa dominan- te autossômica (AdRP) pela administração de uma molécula de ácido nucleico relevada neste pedido, onde a molécula de ácido nucleico compreende um cassete genético codificando um miRNA, onde o miRNA direciona a expressão de RHO (rodopsina). Em certas modali- dades, o miRNA compreende miR-708 (vide Behrman et al., JCB 192(6):919-27 (2011). A maioria das mutações no gene RHO respon- sáveis pela retinite pigmentosa altera o enrolamento ou transporte da proteína rodopsina. Algumas mutações fazem com que a rodopsina seja constitutivamente ativa em vez de ser ativada em resposta à luz. Os estudos sugerem que versões alteradas de rdopsina interferem nas funções essenciais das células, fazem com que os bastonetes se auto- destruam (sofram apoptose). Como os bastonetes são essenciais para a visão em condições de pouca luz, a perda destas células leva à ce- gueira noturna progressiva nas pessoas com retinite pigmentosa.
[00529] Todos os vários aspectos, modalidades, e opções descritas neste relatório podem ser combinados com toda e qualquer variação.
[00530] Todas as publicações, patentes, e pedidos de patente men- cionados neste relatório descritivo estão aqui incorporados a título de referência como se cada publicação, patente, ou pedido de patente estivesse especificamente e individualmente indicado como incorpora- do a título de referência.
[00531] Tendo descrito esta invenção de forma geral, ela pode ser melhor compreendida com referência aos exemplos aqui apresenta- dos. Estes exemplos são dados a título ilustrativo apenas e não se destinam a ser limitativos.
EXEMPLOS
Exemplo 1. Geração de construtos de expressão de FVIII conten- do ITRs parvovirais de AAV e não-AAV. Exemplo 1a. Clonagem do gene de FVIII códon-otimizado e regiões de repetições terminais invertidas (ITR) de AAV em cassetes genéticos.
[00532] Um cassete genético de FVIII foi gerado com base no ge- noma de AAV sorotipo 2. No entanto, as regiões de ITR originadas de qualquer sorotipo (inclusive sintético) podem ser usadas nesta abor- dagem (Fig. 1A).
[00533] O plasmídeo de expressão AAV2-FVIIIco6XTEN codifican- do uma sequência codificadora de FVIII códon-otimizada sob a regula- ção de um promotor fígado-específico (TTPp) ou um promotor ubíquo (CAGp, FIGs. 1A e 1B) flanqueada por regiões de repetições terminais invertidas (ITR) de AAV (AAV-FVIII) foi desenhada para expressão in vitro e in vivo, como mostrado na FIG. 1C. O cassete genético também contém os elementos WPRE e bGHpA para expressão ótima do trans- gene (FIGs. 1A-1C). A sequência codificadora de FVIII códon- otimizada flanqueada por ITR foi clonada em um esqueleto plasmídico compreendendo uma origem de replicação ColE1 e um cassete de ex- pressão para beta-lactamase, que confere resistência à ampicilina (FIG. 1C). Sítios de reconhecimento para a endonuclease de restrição PvuII flanqueando o cassete de expressão foram geneticamente modi- ficados para permitir a excisão precisa do construto AAV-FVIII median- te digestão de PvuII (FIG. 1C). Exemplo 1b. Clonagem do gene de FVIII códon-otimizado e regiões terminais invertidas (ITR) de parvovírus não-AAV em cassetes genéti- cos.
[00534] Com base na relação filogênica entre os membros da famí- lia viral Parvoviridae, à qual pertence o AAV (FIG. 2A), foi lançada a hipótese de que outros membros não-AAV do gênero Dependovirus e os membros do gênero Erythrovirus utilizam mecanismos celulares similares para a manutenção do ciclo de vida viral e o estabelecimento de infecção latente e persistente. Portanto uma região ITR originada dos genomas desses vírus poderia ser utilizada para o desenvolvimen- to de cassetes de expressão genéticos semelhantes ao AAV (porém não baseados no AAV). Os parvovírus a seguir foram testados quanto à adequabilidade de suas regiões ITR para o desenvolvimento de construtos genéticos para aplicações em terapia genética: dependoví- rus parvovírus de ganso (GPV) cepa B e eritrovírus B19 parvovírus (Fig. 2A).
[00535] A instabilidade das regiões ITR parvovirais durante a pro- pagação de vetores plasmídicas em células bacterianas represent um desafio para a produção e manipulação de construtos genéticos. Al- guns construtos genéticos contendo as AAV2 ITRs de comprimento total (145 nt) foram gerados com sucesso, mas esses construtos são altamente instáveis e a maioria dos plasmídeos à base de AAV2 ITR contêm uma versão 130 (n. do t. vide estrutura na página 70 do docu- mento original.) truncada de uma região ITR (exemplificada na Tabela 1). De maneira similar, os construtos plasmídicos portadores de se- quências de comprimento total de ambas as B19 e GPV ITRs que fo- ram geradas apresentaram um alto grau de instabilidade no hospedei- ro bacteriano (dados não mostrados), o que limita significativamente a utilidade dessas ITRs para o desenvolvimento de vetores genéticos para aplicações em terapia genética.
[00536] Anteriormente foi desenvolvido um sistema de genética re- versa para o resgate do vírus B19 recombinante contendo uma versão truncada de uma ITR (Manaresi, et al. Virology 508 (2017): 54-62) (Tabela 2B, ITR ID: B19d135). Dessa forma, B19d135 ITR foi utilizada para gerar um plasmídeo de expressão de FVIII geneticamente estável B19-FVIIIco6XTEN (FIG. 1D). Para usar ainda esta abordagem para a síntese do construto à base de GPV ITR, sequências do tipo selvagem de comprimento total de B19, GPV, e AAV2 ITRs foram comparadas (FIG. 3A). Com base na homologia com os 135 e 15 primeiros nucleo- tídeos das sequências de B19 e AVV2 ITR, respectivamente, que são dispensáveis para a função das ITR, foi lançada a hipótese de que os 162 primeiros nucleotídeos da GPV ITR poderiam ser removidos para sintetizar construtos genéticos estáveis com ITRs completamente fun- cionais (FIG. 3A, sequências envolvidas por caixas). Portanto, de for- ma similar aos construtos AAV2-FVIIIco6XTEN e B19-FVIIIco6XTEN que contêm versões truncadas de suas ITRs correspondentes, o GPVd162 foi usado (Tabela 2C) para gerar um construto plasmídico de expressão de FVIII estável GPV-FVIIIco6XTEN (FIG. 1E). Extraor- dinariamente, ambas as B19 e GPV ITRs de comprimento total são muito mais compridas que a AAV2 ITR de comprimento total (Tabela 1) e não formam a estrutura do tipo grampo de cabelo em forma de T distintiva das AAV ITRs (FIG. 2B).
[00537] Os plasmídeos contendo sequências de B19 ITR de com- primento total apresentaram um alto grau de instabilidade nas células hospedeiras bacterianas uma vez que poderia ser gerado um constru- to de expressão de FVIIIco6XTEN contendo apenas a 3’ITR. Com o uso de técnicas de clonagem molecular tradicionais, não foi possível ober nenhum clone positivo que contivesses ambas as 5’ e 3’ B19 ITRs de comprimento total. Para produzir um construto de expressão de FVIIIco6XTEN, B19wt-FVIIIco6XTEN, flanqueado pelas B19 ITRs de comprimento total (FIG. 1F), foi usada a cepa hospedeira específica PMC103 de E. coli. A PMC103 contém uma deleção no gene sbcC, que codifica uma exonuclease que reconhece e elimina estruturas cru- ciformes de DNA. Sem nos atermos à teoria, imaginamos que o uso da cepa PMC103, sem sbcC, pudesse permitir a replicação de palíndro- mos compridos (i.e., sequências que contêm uma estutura secundária complexa) e a clonagem bem-sucedida de B19wt-FVIIIco6XTEN assim como de GPVwt-FVIIIco6XTEN. O plasmídeo resultante codifica a se- quência de 5’ e 3’ ITR de B19 do tipo selvagem de 383 pares de bases (Tabela 2D) e um outro plasmídeo codifica a sequência de 5’ e 3’ ITR de GPV do tipo selvagem de 444 pares de bases (Tabela 2F).
[00538] Os plasmídeos B19-FVIIIco6XTEN (FIG. 1D; Table 2B), GPV-FVIIIco6XTEN (FIG. 1E; Tabela 2C) e B19wt-FVIIIco6XTEN (FIG. 1F, Tabela 2D) contendo cassetes de expressão de FVIII flanqueados pelas ITRs parvovirais não-AAV ITRs (B19d135, GPVd162, e B19wt) foram produzidos da maneira descrita no Exemplo 1a. Os sítios de re- conhecimento da endonuclease de restrição LguI foram usdaos para flanquear todos os cassetes de expressão de FVIII (FIGs. 1D-1F). Exemplo 1c. Preparação de fragmentos de DNA de cordão simples contendo cassetes de expressão de FVIII flanqueados com ITRs par- vovirais AAV e não-AAV.
[00539] Foi lançada a hipótese de que a formação de estruturas o cassete de expressão de FVIII induziriam a transdução persistente de células alvo. Para estudos de comprovação do conceito, o plasmídeo à base de AAV ITR AAV2-FVIIIco6XTEN e os plasmídeos à base de não-AAV ITR B19-FVIIIco6XTEN e GPV-FVIIIco6XTEN foram digeri- dos com PvuII e LguI, respectivamente. Fragmentos de AAV-FVIII, B19-FVIII, ou GPV-FVIII de cordão simples (ss) com estruturas de ITR do tipo grampo de cabelo formadas foram geradas por desnaturação dos fragmentos de DNA de cordão duplo (cassete de expressão e es- trutura plasmídica de FVIII) da digestão com PvuII ou LguI a 95°C e em seguida resfriamento a 4°C para permitir que as sequências de ITR palindrômicas se enrolassem (FIG. 1A-1B). Os ssAAV-FVIII, ssB19- FVIII, ou ssGPV-FVIII resultantes foram testados no modelo de ca- mundongo com HemA (hemofilia A) quanto à capacidade de estabele- cer a transdução persistente de hepatócitos. Exemplo 1d. Uso de um sistema de expressão de baculovírus para produzir construtos de expressão de FVIII
[00540] Será utilizado um sistema de expressão de baculovírus de- crito em Li et al., PLoS ONE 8(8): e69879 (2013) para produção dos construtos AAV-FVIII, B19-FVIII, GPV-FVIII na forma de moléculas de DNA de extremidade fechada (ceDNA) em células de inseto. Já foi demonstrando que a distribuição sistêmica de cassetes de expressão de ceDNA estabelece a transdução persistente de hepatócitos e induz expressão transgênica de longo prazo estável no fígado. Exemplo 2. Injeção sistêmica de construtos genéticos compreen- dendo cassetes de expressão de FVIII flanqueados por ITRs par- vovirais AAV e não-AAV resulta em expressão de FVIII de longo prazo em camundongos HemA. Exemplo 2a. Avaliação in vivo da expressão de FVIII mediada por ssAAV-FVIII.
[00541] Para validar a capacidade de ssAAV-FVIII contendo regiões AAV ITR para mediar a expressão transgênica persistente in vivo, o cassete de expressão genético foi distribuído sistemicamente via inje- ção hidrodinâmico (HDI) a camundongos de 5-12 semanas de idade com hemofilia A (HemA) (4 animais/grupo) a 5 µg, 10 µg, 20 µg do cassete de expressão genética de ssDNA (ssAAV-FVIII) (FIG. 4A). HDI resulta em distribuição primária do material injetado no fígado dos animais experimentais. Amostras de plasma foram coletadas dos ani- mais experimentais 18 horas, 3 dias, 2 semanas, 3 semanas, 1 mês, 2 meses, 3 meses e 4 meses depois de uma única injeção hidrodinâmi- ca de ssAAV-FVIII. A atividade plasmática do FVIII no sangue foi ana- lisada pelo ensaio cromogênico de atividade de FVIII. Os animais de controle que receberam uma injeção de 5 µg/camundongo do plasmí- deo de expressão parental apresentaram níveis altos de atividade plasmática de FVIII logo depois da administração. No entanto, o nível de FVIII circulante caiu rapidamente e ficou indetectável durante 15 dias após a injeção (p.i.). Em contraste, os animais experimentais que receberam uma injeção de 5, 10, e 20 µg/camundongo de ssAAV-FVIII desenvolveram expressão de longo prazo do transgene com níveis estáveis de FVIII circulante cerca de 8, 16, e 32% do nível normal de FVIII, respectivamente (Fig. 4A). Uma dose resposta forte foi observa- da sugerindo um alto grau de correlação entre a dose injetada e o des- fecho do tratamento. Exemplo 2b. Avaliação in vivo da expressão de FVIII mediada por ssB19-FVIII- e ssGPV-FVIII.
[00542] Para avaliar a expressão in vivo de FVIII a partir de ssB19- FVIII e ssGPV-FVIII que contêm as regiões ITR parvovirais não-AAV B19d135 e GPVd162, respectivamente, 10 ou 20 µg/camundongo de ssB19-FVIII, e 10 ou 50 µg/camundongo do cassete de expressão ge- nética ssGPV-FVIII foram distribuídos sistemicamente via HDI a ca- mundongos de 5-12 semanas de idade com hemofilia A (HemA). Amostras de sangue foram coletadas 1, 3, 7, 14, 21, 28, 42, 56, 84, 112, 140, e 168 dias p.i. e a atividade de FVIII foi analisada pelo en- saio cromogênico de atividade de FVIII. Como observado no construto AAV-FVIII, os animais de controle que receberam uma injeção de 5 µg/camundongo do plasmídeo de expressão parental de FVIII apre- sentaram níveis altos de atividade plasmática de FVIII em 24 horas p.i., que caíram rapidamente e ficarm indetectáveis durante 14 dias p.i. Os animais experimentais que receberam uma injeção de ssB19-FVIII apresentaram atividade plasmática máxima de FVIII em 3 dias p.i., que em seguida caiu gradualmente durante o período de 21 dias e estabili- zou em torno de 28 dias p.i. (FIG. 4B). Os camundongos com HemA receberam uma injeção de ssGPV-FVIII, por outro lado, os níveis está- veis de atividade plasmática de FVIII desenvolvidos por volta do dia 112 foram mantidos durante o resto do período de observação (Fig. 4C). Extraordinariamente, os animais que receberam uma injeção de
10 µg/camundongo seja de ssAAV-FVIII (FIG. 4A) ou de ssGPV-FVIII (FIG. 4C) desenvolveram níveis estáveis bastante similares de ativida- de plasmática de FVIII, sugerindo que ambas as regiões AAV2 e GPV ITR compreendem fatres genéticos necessários para o estabelecimen- to eficiente de transdução persistente de células alvo. Exemplo 2c. Avaliação in vivo da necessidade de ITR e grampo de ca- belo para expressão estável de longo prazo de FVIII em camundongos com hemA.
[00543] Para comparar a estabilidade e a expressão de longo prazo de cassetes de DNA de cordão simples com terápicos alternativos à base de ácido nucleico, o construto plasmídico FVIIIco6XTEN (FIG. 1A) foi digerido com PvuII ou AflII para criar DNA linear de cordão du- plo com ou sem as sequências de AAV ITR. O DNA de cordão duplo linear sem ITRs foi purificado para gerar o construto ‘dsDNA No ITR’. Por fim, a ligação dsDNA purificado sem ITRs via os sítios de reco- nhecimento AfIII sobrepostos resultou na formação de DNA minicírcu- lo. Este construto de DNA semelhante a plasmídeo, circular e peque- no, é destituído de qualquer sequência bacteriana e/ou sequência de ITR. Os camundongos com HemA receberam uma injeções com con- centrações equimolares de DNA via injeção hidrodinâmica e os níveis de atividde de FVIII foram determinados a partir de coletas de plasma durante 2-4 meses. Todos os construtos de DNA produziram níveis terapêuticos iniciais de FVIII na faixa normal de 30-60%, no entanto, somente o DNA de cordão simples demonstrou persistência estável de expressão transgenênica em 32% por 4 meses após a injeção (FIG. 5). Todos os DNA de cordão duplo e DNA minicírculos atingiram níveis de expressão estáveis em 6-10% normal nos dias 14-42, no entanto, estes platôs representam apenas 10% da atividade inicial de FVIII ob- servada. Como níveis transitórios e elevados de expressão de FVIII podem resultar na formação de anticorpos neutralizantes anti-drogas,
a expressão estável é necessária para tolerância imunológica em um cenário de hemofilia A. Exemplo 2d. Comparação in vivo de B19 ITRs do tipo selvagem e de- rivadas.
[00544] Para comparar o efeito de uma B19 ITR derivada ITR (B19d135, FIG. 1D, Tabela 2C) com a B19 ITR de comprimento total (Table 2C), foi gerado o cassete de expressão FVIIIco6XTEN flanque- ado pelas ITRs de 248 pares de bases (FIG. 1F). Camundongos com hemofilia A receberam uma injeção hidrodinâmica de 30 µg FVIII-DNA de cordão simples flanqueado pelas B19 ITRs B19d135 (FIG. 1D), GPVd165 (FIG. 1E), ou do tipo selvagem (FIG. 1F). Plasma foi coleta- do 3, 7, 14, 21, 28, e 35 dias após a injeção em todas as coortes, com amostras adicionais tiradas nos dias 42, 55, e 84 para os construtos B19d135 e GPVd165 e analisado quanto à atividade de FVIII pelo en- saio cromogênico (FIG. 6). Comparado com a B19 ITR derivada, a ITR de comprimento total resultou em um aumento de aproximadamente 2,5 vezes na expressão de FVIII. Além disso, a expressão de FVIII a partir da ITR do tipo selvagem permaneceu estável no início. Exemplo 2e. Avaliação da readministração de DNA nu de cordão sim- ples in vivo.
[00545] Uma limitação crítica nas atuais modalidades de terapia genética é a impossibilidade de readministrar o terápico devido à for- mação de anticorpos anti-drogas contra o capsídeo viral do vetor da terapia genética. No entanto, sistemas de terapia genética ausentes nas proteínas imunogênicas poderiam ser reaplicados para titular o paciente em um nível terapêutico desejado. Para avaliar se nossos cassetes de cordão simples flanqueados por não-AAV ITRs poderiam ser readministrados, camundongos com hemA receberam uma injeção de 30 µg de ssDNA contendo as ITRs B19d135 e GPVd165 nos dias 0 e 35 (FIG. 6). Os camundongos que receberam GPVd165-FVIII atingi-
ram níveis estáveis de FVIII de aproximadamente 5% normal durante o primeiro mês de observação. Depois de uma segunda dose de ssDNA, os níveis de FVIII aumentaram até 10% antes de diminuírem ligeira- mente, demonstrando um aumento de 2 vezes nos níveis de FVIII. Os camundongos que receberam B19d135-FVIII atingiram níveis estáveis de FVIII de aproximadamente 8% durante a primeira semana, que au- mentaram aproximadamente 3,5 vezes para 30% antes de diminuírem para 25%. Estes dados demonstram que a readministração de DNA de cordão simples com não-AAV ITRs pode aumentar os níveis de ex- pressão estável de FVIII em camundongos com hemofilia A. Exemplo 3. Produção e avaliação in vivo de construtos de ex- pressão de FVIII contendo derivados das ITRs parvovirais não- AAV B19d135 e GPVd162. Exemplo 3a. Determinação das sequências essenciais mínimas das B19 e GPV ITRs.
[00546] Baseado na comparação entre as sequências de ITR dos dependovírus AAV2 e GPV, e eritrovírus B19 (números de acesso Ge- ne Bank NC_001401.2, U25749.1, e KY940273.1, respectivamente), foram desenhadas as sequências mínimas das ITRs dos parvovírus GPV e B19 que seriam necessárias com ou sem sequências adicio- nais (espaçadores, inserções, inversões, adições, e/ou recombinação com sequências do tipo selvagem outras ITRs parvovirais) para a transdução persistente de células eucarióticas com construtos genéti- cos contendo tais ITRs (FIGs. 3A e 3B). O alinhamento de sequências das AAV2, GPV, e B19 ITRs reveou as regiões conservadas B19v1 e GPVv1 entre todas as três espécies virais (apresentadas nas Tabelas 2A-2C) como sequências contínuas sem regiões espaçadoras de se- quência variável. Da mesma forma, as variantes B19v3 e GPVv3 da sequência essencialmente mínima foram desenhadas com base na comparação de sequências entre as B19 e GPV ITRs. Como os cons-
trutos de expressão de FVIII contendo GPVd162 ITRs tiveram um de- sempenho nos experimentos in vivo melhor que os construtos genéti- cos contendo B19d135 ITRs, foi lançada a hipótese de que a sequên- cia de B19v3 compreende regiões da sequência mínima da B19 ITR que são conservadas entre as sequências das B19 e GPV ITRs, e a sequência GPVv3 compreende regiões da sequência mínima da GPV ITR que estão presentes na sequência daGPV ITR e ausentes na se- quência da B19 ITR (Tabelas 2B e 2C). As sequências B19v2 e GPVv2 foram gerados por exclusão dos 135 e 162 primeiros nucleotí- deos e dos 135 e 162 nucleotídeos complementares correspondentes nas regiões palindrômicas das ITRs das sequências das B19 e GPV ITR, respectivamente (Tabelas 2B e 2C). Exemplo 3b. Orientação das regiões palindrômicas das B19 e GPV ITRs e seus derivados em construtos genéticos funcionais.
[00547] Parte das ITRs parvovirais consiste em uma região palin- drômica auto-complimentar. Já foi demonstrado para parvovírus B19 infecciosos recombinantes que os vírus resgatados contendo regiões palindrômicas nas orientações direta e reversa apresentam proprieda- des de crescimento semelhantes (Manaresi, et al. Virology 508 (2017): 54-62). Por conseguinte, foi proposto que construtos de expressão ge- néticos contendo B19 e GPV ITRs e seus derivados continuam funcio- nais independente do fato de as regiões palindrômicais de tais ITRs estarem em uma combinação direta, reversa, ou qualquer combinação possível de 5’ e 3’ ITRs em relação ao cassete de expressão genético. Para validar esta hipótese, B19d135 e GPVd162 ITRs, assim como B19 e GPV ITRs do tipo selvagem serão incorporadas no cassete de expressão FVIIIco6XTEN na orientação normal, reversa, e invertida por meio do uso de sequências complementares idênticas assim como reversas para ITRs da mesma espécie. O DNA de cordão simples desses plasmídeos será gerado e testado em camundongos com he-
mofilia A para expressão de FVIII direcionada para o fígado induzida pelo promotor TTPp descrito no Exemplo 2a, 2b, e 2d. Além de inves- tigar todas as orientações das ITRs da mesma espécie, combinações da GPV e B19 ITR do tipo selvagem e derivados das mesmas também serão geradas e testadas quanto à expressão de FVIII em camundon- gos com hemofilia A. Estes cassetes de expressão conterão uma ITR de origem B19 e uma ITR de origem GPV para determinar se sequên- cias de ITR não homólogas podem aumentar a concatemerização epissômica e a expressão de longo prazo do transgene desejado. Ca- mundongos com hemofilia A receberão uma injeção via injeção hidro- diâmica de 10, 20, ou 50 µg de ssDNA contendo os cassetes de ex- pressão mencionados acima e o FVIII será medido a partir do plasma murino coletado em intervalos de uma semana após a injeção. O efeito da expressão de FVIII e a longevidade dos camundongos que recebe- ram esses cassetes de expressão serão diretamente comparados com a expressão de FVIII e a longevidade dos camundongos que recebe- ram B19d135, GPVd162, e os cassetes de expressão do tipo selva- gem correspondentes (Tabelas 2B, 2C, 2D, and 2F). Exemplo 3c. Injeção sistêmica de construtos genéticos contendo deri- vados de B19d135 e GPVd162 ITRs parvovirais não-AAV em camun- dongos com HemA.
[00548] Para avaliar a expressão in vivo de FVIII a partir de constru- tos de ssDNA que contêm derivados de B19d135 e GPVd162 ITRs parvovirais não-AAV, 5, 10, 20, ou 50 µg/camundongo de cada casse- te de expressão genética de ssDNA será distribuído sistematicamente via HDI a camundongos de 5-12 semanas de idade com HemA. Amos- tras de sangue serão coletadas em 1, 3, 7, 14, 21, e 28 dias p.i., e en- tão uma vez por mês por um período de 4 meses. A atividade de FVIII no sangue será analisada pelo ensaio cromogênico de atividade de FVIII.
Exemplo 4. Produção e avaliação in vivo de construtos de ex- pressão de ceDNA contendo os derivados de B19d135 e GPVd162 ITRs parvovirais não-AAV em células de inseto Exemplo 4a. Uso de um sistema de expressão de baculovírus para gerar construtos de expressão de ceDNA contendo derivados de B19d135 e GPVd162 ITRs
[00549] De maneira similar aos construtos AAV-FVIII, B19-FVIII, e GPV-FVIII descritos no Exemplo 1d, o sistema de expressão de bacu- lovírus será usado para a produção de expressão de FVIII para cons- trutos genéticos contendo os derivados de B19d135 e GPVd162 ITRs parvovirais não-AAV na forma de ceDNA em células de inseto. Exemplo 4b. Injeção sistêmica de construtos de expressão de ceDNA contendo os derivados de B19d135 e GPVd162 ITRs parvovirais não- AAV em camundongos com HemA.
[00550] Para avaliar a expressão in vivo de FVIII a partir de constru- tos de ceDNA que contêm derivados de B19d135 e GPVd162 ITRs parvovirais não-AAV, 5, 10, 20, ou 50 µg/camundongo de cada casse- te de expressão genética de ceDNA será distribuído sistemicamente via HDI a camundongos de 5-12 semanas de idade com HemA. Amos- tras de sangue serão coletadas em 1, 3, 7, 14, 21, e 28 dias p.i., e en- tão uma vez por mês por um período de 4 meses. A atividade de FVIII no sangue será analisada pelo ensaio cromogênico de atividade de FVIII. Exemplo 5. Produção de formulações de nanopartículas lipídicas de construtos de expressão de ssDNA e ceDNA FVIII
[00551] Depois de cada ssDNA ou ceDNA ser produzido da manei- ra descrita nos Exemplos 1 e 4, cada construto genético será formula- do como nanopartículas lipídicas (LNPs) usando composições de lipí- dios apropriadas por misturação microfluídica (LNP-ssDNA e LNP- ceDNA). A razão de lipídio para DNA (N/P) será ajustada de forma a otimizar a transdução celular e a expessão de FVIII. Os plasmídeos parentais codificando cassetes de expressão de FVIII flanqueados por ITRs parvovirais AAV ou não-AAV formulados em LNPs serão usados como controles para eficiência de transdução. Exemplo 6. Avaliação in vitro e in vivo de LNP-ssDNA e LNP- ceDNA Exemplo 6a. Avaliação in vitro da expressão de FVIII mediada por ssDNA e ceDNA em hepatócitos cultivados.
[00552] Construtos genéticos de expressão de ssDNA ou ceDNA FVIII plasmídeos controle parentais correspondentes foram formulados como LNPs, como descrito no Exemplo 5, para distribuição genética direcionada. Células Huh7 foram semeadas em placas de cultura de tecido de 24 poços a 1 x 105 células/poço e incubadas por uma noite. No dia seguinte, LNP-ssDNA ou formulações foram adicionadas às células a 1000, 500, 250, 125 e 62.5 ng/poço. O meio de cultura foi recolhido 48 horas após a transdução após uma troca de meio 24 ho- ras após a transdução. A atividade de FVIII no meio de cultura foi pelo ensaio cromatográfico de atividade de FVIII em relação a um padrão de FACT plasmático humano. O plasmídeo contendo o cassete FVIIIco6XTEN sob o promotor CAGp e flanqueado por AAV ITRs foi encapsulado em nanopartículas lipídicas a razões de N/P de 72, 36, e 18 (FIG. 8A). Subsequente à transdução de células Huh7, o FVIII foi medido no meio condicionado. A transdução de células com a razão N/P de 18 gerou níveis aumentados de FVIII em relação às razões de 36 e 72, com uma dose máxima de 1 µg/ml resultando em mais de 2 IU/ml. Estes dados sugerem a utilidade da distribuição de LNP em cé- lulas alvo do fígado. Para investigar a eficiência de transdução do ssDNA sob um promotor fígado-específico dia distriuição de LNP, o cassete FVIIIco6XTEN sob o promotor TTPp foi encapsulado em 2 ra- zões N/p e células Huh7 foram transduzidas (FIG.8B). Consistentes com nossos dados anteriores (FIG. 8A), a razão N/P de 18 resultou em níveis aumentados de atividade de FVIII em relação à razão de 36. Adicionalmente, estes dados demonstraram a comprovação do concei- to de distribuição de LNP de FVIII ssDNA em células hepáticas. De- pois de 24 horas, aproximadamente 2 x 105 células Huh7 transduzidas com 2 µg/ml FVIIIco6XTEN-AAV de cordão simples produziram 0,33 IU/ml de FVIII.
[00553] Além disso, já foi mostrado na literatura que histonas celu- lares ficam regularmente posicionadas ao longo dos epissomas rAAV, criando uma estrutura semelhante à cromatina que é similar ao padrão nucleossômico do DNA cromossômica celular. Portanto, a capacidade desses construtos para estabelecer estruturas nucleossômicas seme- lhantes à cromativa necessárias para transdução persistente também será avaliada por análise da mancha do sul. Exemplo 6b. Avaliação da expressão de FVIII de longo prazo mediada por ssDNA e ceDNA formulado em LNP em camundongos com HemA depois de administração intravenosa.
[00554] Camundongos com Hem de 5-12 semanas de idade rece- berão LNP-ssDNA, LNP-ceDNA, ou LNP-pDNA (plasmídeo controle) a 5, 10, 20, 40, 100 ug/camundongo via injeção IV, N=4/grupo. Amostras de sangue serão coletadas em instantes selecionado iniciando 48 ho- ras após a injeção por até 6 meses e atividade de FVIII no sangue se- rá analisada pelo ensaio cromogênico de atividade de FVIII. O perfil de expressão de FVIII nos camundongos tratados com LNP-ssDNA ou com LNP-ceDNA será comparado com aquele dos camundongos tra- tados com LNP-pDNA para cada construto genético descrito nos Exemplos 1 e 4. Exemplo 6c. Avaliação in vivo da expressão de FVIII mediada por ssDNA ou ceDNA depois de uma injeção de reforço.
[00555] Um subconjunto de camundongos tratados com LNP-
ssDNA ou LNP-ceDNA no Exemplo 6b receberá uma injeção IV de re- forço das LNPs correspondentes na mesma dose 2 meses depois da injeção inicial. Amostras de sangue serão coletadas em instantes sele- cionados iniciando 48 horas depois da injeção de reforço por até 6 meses. A atividade de FVIII no sangue será analisada pelo ensaio cromogênico de atividade de FVIII. O perfil da expressão de FVIII nos camundongos tratados com LNP-ssDNA ou LNP-ceDNA será compa- rado com aquele dos camundongos tratados com LNP-pDNA corre- sondente. Exemplo 7. Utilidade dos construtos de expressão genética con- tendo ITRs de origem de B19 ou GPV para uso geral em terapia genética. Exemplo 7a. Produção de construtos genéticos repórteres contendo irts de origem de B19 ou GPV.
[00556] Para demonstrar a utilidade dos sistemas de expressão ge- nética à base de não-AAV ITR como uma plataforma para uso geral em aplicações de terapia genética, construtos repórteres compreen- dendo um cassete de expressão foram gerados com proteína fluores- cente verde (GFP) ou luciferase (luc) flanquada por B19d135 ou GPVd162 ITRs baseadas nos construtos descritos no Exemplo 1b. As- sim sendo, a fase de leitura aberta (ORF) do FVIII em B19- FVIIIco6XTEN (FIG. 1C) e GPV-FVIIIco6XTEN (FIG. 1D) foi substituí- da por ORF de GFP ou luc por técnicas convencionais de clonagem molecular.
[00557] Também foram gerados cassetes de expressão flanquea- dos por B19d135 ou GPVd162 ITRs contendo o transgene de fenilala- nina hidroxilase murina (PAH) (FIG. 7A), que foram usados para a ex- pressão de PAH e redução das concentrações de fenilalanina sanguí- nea em um modelo de camundongo relevante de fenilcetonúria. Com o uso deste modelo, camundongos PKU (n = 3) receberam 200 µg de ssDNA flanquado por não-AAV ITRs via injeção hidrodinâmica para expressão no fígado. Amostras de sangue foram coletadas nos dias 3, 7, 14, 28, 42, 56, 70, e 81 e o plasma foi ilado para determinação da concentração de fenilalanina (FIG. 7B-7C). Os camundongos que re- ceberam o cassete de expressão contendo a B19d135 ITR apresen- tam uma redução nos níveis de fenilalanina de 370 µg/ml para 210 µg/ml no dia 3 que foi mantida estável até o dia 81 (FIG. 7B). Os ca- mundongos que o cassete GPVd162 ITR apresenta redução nos ní- veis de fenilalanina sanguínea de 350 µg/ml para 310 µg/ml no dia 14 que continuou caindo até um nível estável de 250 µg/ml no dia 42 (FIG. 7C). Estas diminuições nas concentrações de fenilalanina san- guínea representam uma redução de 45% e 30% em relação às con- centrações anteriores à injeção (FIG. 7D). Para confirmar a presen- ça da proteína PAH murina no fígado, uma análise da mancha ociden- tal foi realizada em lisados hepáticos retirados dos camundongos tra- tados no dia 81 após a injeção. Usando o anticorpo tag anti-FLAG pa- ra detectar a proteína PAH murina, a FIG. 7E mostra a proteína PAH murina detectável em 5 dos 6 animais tratados, com níveis significati- vamente mais altos de proteína do que aqueles observados nos ca- mundongos tratados com ssDNA contendo as B19d135 ITRs. Estes dados são consistentes com as reduções de fenilalanina sanguínea observadas nas FIGs. 7B-7D. Juntos, eles demonstraram que a distri- buição de DNA de cordão simples pode resultar em expressão de lon- go prazo de enzimas hepáticas funtionais.
[00558] Sequências dos vários construtos de PAH usados no expe- rimento são mostrados nas tabelas 10A e 10B.
Tabela 10A: Construto B19-PAH transportando B19d135 ITRs (nu- cleotídeos 1-4146; SEQ ID NO: 197) Descrição Sequência 5' ITR (SEQ ID CTCTGGGCCAGCTTGCTTGGGGTTGCCTTGAC NO: 180) ACTAAGACAAGCGGCGCGCCGCTTGATCTTAG
TGGCACGTCAACCCCAAGCGCTGGCCCAGAG CCAACCCTAATTCCGGAAGTCCCGCCCACCGG AAGTGACGTCACAGGAAATGACGTCACAGGAA ATGACGTAATTGTCCGCCATCTTGTACCGGAAG TCCCGCCTACCGGCGGCGACCGGCGGCATCT
GATTTGGTGTCTTCTTTTAAATTTT Promotor CAGp CTAGTTATTAATAGTAATCAATTACGGGGTCATT (SEQ ID AGTTCATAGCCCATATATGGAGTTCCGCGTTAC NO:195) ATAACTTACGGTAAATGGCCCGCCTGGCTGAC
CGCCCAACGACCCCCGCCCATTGACGTCAATA ATGACGTATGTTCCCATAGTAACGCCAATAGGG ACTTTCCATTGACGTCAATGGGTGGAGTATTTA CGGTAAACTGCCCACTTGGCAGTACATCAAGT GTATCATATGCCAAGTACGCCCCCTATTGACGT CAATGACGGTAAATGGCCCGCCTGGCATTATG CCCAGTACATGACCTTATGGGACTTTCCTACTT GGCAGTACATCTACGTATTAGTCATCGCTATTA CCATGCATGGTCGAGGTGAGCCCCACGTTCTG CTTCACTCTCCCCATCTCCCCCCCCTCCCCAC CCCCAATTTTGTATTTATTTATTTTTTAATTATTT TGTGCAGCGATGGGGGCGGGGGGGGGGGGG GGGCGCGCGCCAGGCGGGGCGGGGCGGGGC GAGGGGCGGGGCGGGGCGAGGCGGAGAGGT GCGGCGGCAGCCAATCAGAGCGGCGCGCTCC GAAAGTTTCCTTTTATGGCGAGGCGGCGGCGG CGGCGGCCCTATAAAAAGCGAAGCGCGCGGC
GGGCG Íntron sintético GTGAGCGGGCGGGACGGCCCTTCTCCTTCGG (SEQ ID GCTGTAATTAGCGCTTGGTTTAATGACGGCTTG NO:192) TTTCTTTTCTGTGGCTGCGTGAAAGCCTTGAGG
GGCTCCGGGAGGGCCCTTTGTGCGGGGGGAG CGGCTCGGGGCTGTCCGCGGGGGGACGGCTG
Descrição Sequência
CCTTCGGGGGGGACGGGGCAGGGCGGGGTTC GGCTTCTGGCGTGTGACCGGCGGCTCTAGAG CCTCTGCTAACCATGTTCATGCCTTCTTCTTTTT
CCTACAG Sequência de ATGGACTACAAAGACCATGACGGTGATTATAAA PAH murina GATCATGATATCGATTACAAGGATGACGATGAC (SEQ ID AAGGCTGCTGTGGTTCTGGAAAATGGCGTGCT NO:196) GAGCCGGAAGCTGAGCGACTTCGGACAAGAG
ACAAGCTACATCGAGGACAACAGCAACCAGAA TGGCGCCGTGTCTCTGATCTTCAGCCTGAAAG AAGAAGTGGGCGCCCTGGCCAAGGTGCTGAG ACTGTTCGAGGAAAACGAGATCAATCTGACCC ACATCGAGAGCAGACCCAGCAGACTGAACAAG GACGAGTACGAGTTCTTCACCTACCTGGACAA GCGGAGCAAGCCTGTGCTGGGCAGCATCATCA AGAGCCTGAGAAACGACATCGGCGCCACCGTG CACGAGCTGAGCAGAGACAAAGAAAAGAACAC CGTGCCATGGTTCCCCAGGACCATCCAAGAGC TGGACAGATTCGCCAACCAGATCCTGAGCTAT GGCGCCGAGCTGGACGCTGATCACCCTGGCTT TAAGGACCCCGTGTACCGGGCCAGAAGAAAGC AGTTTGCCGATATCGCCTACAACTACCGGCAC GGCCAGCCTATTCCTCGGGTCGAGTACACCGA GGAAGAGAGAAAGACCTGGGGCACCGTGTTCA GAACCCTGAAGGCCCTGTACAAGACCCACGCC TGCTACGAGCACAACCACATCTTCCCACTGCT GGAAAAGTACTGCGGCTTCCGCGAGGACAATA TCCCTCAGCTCGAAGACGTGTCCCAGTTCCTG CAGACCTGCACCGGCTTTAGACTGAGGCCTGT TGCCGGACTGCTGAGCAGCAGAGATTTTCTCG GCGGCCTGGCCTTCAGAGTGTTCCACTGTACC CAGTACATCAGACACGGCAGCAAGCCCATGTA CACCCCTGAGCCTGATATCTGCCACGAGCTGC TGGGACATGTGCCCCTGTTCAGCGATAGAAGC TTCGCCCAGTTCAGCCAAGAGATCGGACTGGC TTCTCTGGGAGCCCCTGACGAGTACATTGAGA
Descrição Sequência
AGCTGGCCACCATCTACTGGTTCACCGTGGAA TTCGGCCTGTGCAAAGAGGGCGACAGCATCAA GGCTTATGGCGCTGGACTGCTGTCTAGCTTCG GCGAGCTGCAGTACTGTCTGAGCGACAAGCCT AAGCTGCTGCCCCTGGAACTGGAAAAGACCGC CTGCCAAGAGTACACAGTGACCGAGTTCCAGC CTCTGTACTACGTGGCCGAGAGCTTCAACGAC GCCAAAGAAAAAGTGCGGACCTTCGCCGCCAC CATTCCTCGGCCTTTTAGCGTCAGATACGACCC CTACACACAGCGCGTGGAAGTGCTGGACAACA CACAGCAGCTGAAGATTCTGGCCGACTCCATC AACAGCGAAGTGGGCATTCTGTGTCACGCCCT
GCAGAAGATCAAGAGCTGA WPRE (elemen- TCATAATCAACCTCTGGATTACAAAATTTGTGAA to regulador pós- AGATTGACTGGTATTCTTAACTATGTTGCTCCTT transcricional do TTACGCTATGTGGATACGCTGCTTTAATGCCTT vírus mutado da TGTATCATGCTATTGCTTCCCGTATGGCTTTCA hepatite de TTTTCTCCTCCTTGTATAAATCCTGGTTGCTGTC marmota) (SEQ TCTTTATGAGGAGTTGTGGCCCGTTGTCAGGC ID NO:120) AACGTGGCGTGGTGTGCACTGTGTTTGCTGAC
GCAACCCCCACTGGTTGGGGCATTGCCACCAC CTGTCAGCTCCTTTCCGGGACTTTCGCTTTCCC CCTCCCTATTGCCACGGCGGAACTCATCGCCG CCTGCCTTGCCCGCTGCTGGACAGGGGCTCG GCTGTTGGGCACTGACAATTCCGTGGTGTTGT CGGGGAAATCATCGTCCTTTCCTTGGCTGCTC GCCTGTGTTGCCACCTGGATTCTGCGCGGGAC GTCCTTCTGCTACGTCCCTTCGGCCCTCAATCC AGCGGACCTTCCTTCCCGCGGCCTGCTGCCG GCTCTGCGGCCTCTTCCGCGTCTTCGCCTTCG CCCTCAGACGAGTCGGATCTCCCTTTGGGCCG
CCTCCCCGCTG bGHpA (sinal de CGACTGTGCCTTCTAGTTGCCAGCCATCTGTTG poliadenilação TTTGCCCCTCCCCCGTGCCTTCCTTGACCCTG do hormônio de GAAGGTGCCACTCCCACTGTCCTTTCCTAATAA crescimento bo- AATGAGGAAATTGCATCGCATTGTCTGAGTAGG
Descrição Sequência vino) (SEQ ID TGTCATTCTATTCTGGGGGGTGGGGTGGGGCA NO:122) GGACAGCAAGGGGGAGGATTGGGAAGACAAT
AGCAGGCATGCTGGGGA Repetição termi- AAAATTTAAAAGAAGACACCAAATCAGATGCCG nal invertida 3' CCGGTCGCCGCCGGTAGGCGGGACTTCCGGT (SEQ ID NO: ACAAGATGGCGGACAATTACGTCATTTCCTGTG 181) ACGTCATTTCCTGTGACGTCACTTCCGGTGGG
CGGGACTTCCGGAATTAGGGTTGGCTCTGGGC CAGCGCTTGGGGTTGACGTGCCACTAAGATCA AGCGGCGCGCCGCTTGTCTTAGTGTCAAGGCA
ACCCCAAGCAAGCTGGCCCAGAG Sequência de comprimento total (SEQ ID NO: 197)
CTCTGGGCCAGCTTGCTTGGGGTTGCCTTGACACTAAGACAAGC GGCGCGCCGCTTGATCTTAGTGGCACGTCAACCCCAAGCGCTG GCCCAGAGCCAACCCTAATTCCGGAAGTCCCGCCCACCGGAAG TGACGTCACAGGAAATGACGTCACAGGAAATGACGTAATTGTCC GCCATCTTGTACCGGAAGTCCCGCCTACCGGCGGCGACCGGCG GCATCTGATTTGGTGTCTTCTTTTAAATTTTGCGGCAATTCAGTC GATAACTATAACGGTCCTAAGGTAGCGATTTAAATACGCGCTCTC TTAAGGTAGCCCCGGGACGCGTCAATTGAGATCTGGATCCGGTA CCGAATTCGCGGCCGCCTCGACGACTAGCGTTTAGTAATGAGAC GCACAAACTAATATCACAAACTGGAAATGTCTATCAATATATAGTT GCTCTAGTTATTAATAGTAATCAATTACGGGGTCATTAGTTCATA GCCCATATATGGAGTTCCGCGTTACATAACTTACGGTAAATGGC CCGCCTGGCTGACCGCCCAACGACCCCCGCCCATTGACGTCAA TAATGACGTATGTTCCCATAGTAACGCCAATAGGGACTTTCCATT GACGTCAATGGGTGGAGTATTTACGGTAAACTGCCCACTTGGCA GTACATCAAGTGTATCATATGCCAAGTACGCCCCCTATTGACGTC AATGACGGTAAATGGCCCGCCTGGCATTATGCCCAGTACATGAC CTTATGGGACTTTCCTACTTGGCAGTACATCTACGTATTAGTCAT CGCTATTACCATGCATGGTCGAGGTGAGCCCCACGTTCTGCTTC ACTCTCCCCATCTCCCCCCCCTCCCCACCCCCAATTTTGTATTTA TTTATTTTTTAATTATTTTGTGCAGCGATGGGGGCGGGGGGGGG GGGGGGGCGCGCGCCAGGCGGGGCGGGGCGGGGCGAGGGG CGGGGCGGGGCGAGGCGGAGAGGTGCGGCGGCAGCCAATCAG AGCGGCGCGCTCCGAAAGTTTCCTTTTATGGCGAGGCGGCGGC
Descrição Sequência
GGCGGCGGCCCTATAAAAAGCGAAGCGCGCGGCGGGCGGGAG TCGCTGCGCGCTGCCTTCGCCCCGTGCCCCGCTCCGCCGCCGC CTCGCGCCGCCCGCCCCGGCTCTGACTGACCGCGTTACTCCCA CAGGTGAGCGGGCGGGACGGCCCTTCTCCTTCGGGCTGTAATT AGCGCTTGGTTTAATGACGGCTTGTTTCTTTTCTGTGGCTGCGTG AAAGCCTTGAGGGGCTCCGGGAGGGCCCTTTGTGCGGGGGGA GCGGCTCGGGGCTGTCCGCGGGGGGACGGCTGCCTTCGGGGG GGACGGGGCAGGGCGGGGTTCGGCTTCTGGCGTGTGACCGGC GGCTCTAGAGCCTCTGCTAACCATGTTCATGCCTTCTTCTTTTTC CTACAGCTCCTGGGCAACGTGCTGGTTATTGTGCTGTCTCATCA TTTTGGCAAAGAATTGGATCGCGAAGCCGCCACCATGGACTACA AAGACCATGACGGTGATTATAAAGATCATGATATCGATTACAAGG ATGACGATGACAAGGCTGCTGTGGTTCTGGAAAATGGCGTGCTG AGCCGGAAGCTGAGCGACTTCGGACAAGAGACAAGCTACATCG AGGACAACAGCAACCAGAATGGCGCCGTGTCTCTGATCTTCAGC CTGAAAGAAGAAGTGGGCGCCCTGGCCAAGGTGCTGAGACTGT TCGAGGAAAACGAGATCAATCTGACCCACATCGAGAGCAGACCC AGCAGACTGAACAAGGACGAGTACGAGTTCTTCACCTACCTGGA CAAGCGGAGCAAGCCTGTGCTGGGCAGCATCATCAAGAGCCTG AGAAACGACATCGGCGCCACCGTGCACGAGCTGAGCAGAGACA AAGAAAAGAACACCGTGCCATGGTTCCCCAGGACCATCCAAGAG CTGGACAGATTCGCCAACCAGATCCTGAGCTATGGCGCCGAGCT GGACGCTGATCACCCTGGCTTTAAGGACCCCGTGTACCGGGCC AGAAGAAAGCAGTTTGCCGATATCGCCTACAACTACCGGCACGG CCAGCCTATTCCTCGGGTCGAGTACACCGAGGAAGAGAGAAAG ACCTGGGGCACCGTGTTCAGAACCCTGAAGGCCCTGTACAAGA CCCACGCCTGCTACGAGCACAACCACATCTTCCCACTGCTGGAA AAGTACTGCGGCTTCCGCGAGGACAATATCCCTCAGCTCGAAGA CGTGTCCCAGTTCCTGCAGACCTGCACCGGCTTTAGACTGAGGC CTGTTGCCGGACTGCTGAGCAGCAGAGATTTTCTCGGCGGCCT GGCCTTCAGAGTGTTCCACTGTACCCAGTACATCAGACACGGCA GCAAGCCCATGTACACCCCTGAGCCTGATATCTGCCACGAGCTG CTGGGACATGTGCCCCTGTTCAGCGATAGAAGCTTCGCCCAGTT CAGCCAAGAGATCGGACTGGCTTCTCTGGGAGCCCCTGACGAG TACATTGAGAAGCTGGCCACCATCTACTGGTTCACCGTGGAATT CGGCCTGTGCAAAGAGGGCGACAGCATCAAGGCTTATGGCGCT
Descrição Sequência
GGACTGCTGTCTAGCTTCGGCGAGCTGCAGTACTGTCTGAGCGA CAAGCCTAAGCTGCTGCCCCTGGAACTGGAAAAGACCGCCTGC CAAGAGTACACAGTGACCGAGTTCCAGCCTCTGTACTACGTGGC CGAGAGCTTCAACGACGCCAAAGAAAAAGTGCGGACCTTCGCC GCCACCATTCCTCGGCCTTTTAGCGTCAGATACGACCCCTACAC ACAGCGCGTGGAAGTGCTGGACAACACACAGCAGCTGAAGATT CTGGCCGACTCCATCAACAGCGAAGTGGGCATTCTGTGTCACGC CCTGCAGAAGATCAAGAGCTGAGCAAGTAATGAGCGCTGATCAT AATCAACCTCTGGATTACAAAATTTGTGAAAGATTGACTGGTATT CTTAACTATGTTGCTCCTTTTACGCTATGTGGATACGCTGCTTTA ATGCCTTTGTATCATGCTATTGCTTCCCGTATGGCTTTCATTTTCT CCTCCTTGTATAAATCCTGGTTGCTGTCTCTTTATGAGGAGTTGT GGCCCGTTGTCAGGCAACGTGGCGTGGTGTGCACTGTGTTTGC TGACGCAACCCCCACTGGTTGGGGCATTGCCACCACCTGTCAG CTCCTTTCCGGGACTTTCGCTTTCCCCCTCCCTATTGCCACGGC GGAACTCATCGCCGCCTGCCTTGCCCGCTGCTGGACAGGGGCT CGGCTGTTGGGCACTGACAATTCCGTGGTGTTGTCGGGGAAATC ATCGTCCTTTCCTTGGCTGCTCGCCTGTGTTGCCACCTGGATTCT GCGCGGGACGTCCTTCTGCTACGTCCCTTCGGCCCTCAATCCAG CGGACCTTCCTTCCCGCGGCCTGCTGCCGGCTCTGCGGCCTCT TCCGCGTCTTCGCCTTCGCCCTCAGACGAGTCGGATCTCCCTTT GGGCCGCCTCCCCGCTGATCAGCCTCGACTGTGCCTTCTAGTTG CCAGCCATCTGTTGTTTGCCCCTCCCCCGTGCCTTCCTTGACCC TGGAAGGTGCCACTCCCACTGTCCTTTCCTAATAAAATGAGGAAA TTGCATCGCATTGTCTGAGTAGGTGTCATTCTATTCTGGGGGGT GGGGTGGGGCAGGACAGCAAGGGGGAGGATTGGGAAGACAAT AGCAGGCATGCTGGGGATGCGGTGGGCTCTATGGCTTCTGAGG CGGAAAGAACGGGCTCGAGAAGCTTCTAGATATCCTCTCTTAAG GTAGCATCGAGATTTAAATTAGGGATAACAGGGTAATGGCGCGG GCCGCAAAATTTAAAAGAAGACACCAAATCAGATGCCGCCGGTC GCCGCCGGTAGGCGGGACTTCCGGTACAAGATGGCGGACAATT ACGTCATTTCCTGTGACGTCATTTCCTGTGACGTCACTTCCGGTG GGCGGGACTTCCGGAATTAGGGTTGGCTCTGGGCCAGCGCTTG GGGTTGACGTGCCACTAAGATCAAGCGGCGCGCCGCTTGTCTTA GTGTCAAGGCAACCCCAAGCAAGCTGGCCCAGAG
Tabela 10B: Construto GPV-PAH transportando GPVd162 ITRs (nu- cleotídeos 1-4214; SEQ ID NO: 198) Descrição Sequência 5' ITR (SEQ ID CGGTGACGTGTTTCCGGCTGTTAGGTTGACCAC NO: 183) GCGCATGCCGCGCGGTCAGCCCAATAGTTAAGC
CGGAAACACGTCACCGGAAGTCACATGACCGGA AGTCACGTGACCGGAAACACGTGACAGGAAGCA CGTGACCGGAACTACGTCACCGGATGTGCGTCA CCGGAAGCATGTGACCGGAACTTGCGTCACTTC CCCCTCCCCTGATTGGCTGGTTCGAACGAACGA ACCCTCCAATGAGACTCAAGGACAAGAGGATATT
TTGCGCGCCAGGAAGTG Promotor CTAGTTATTAATAGTAATCAATTACGGGGTCATTA CAGp (SEQ ID GTTCATAGCCCATATATGGAGTTCCGCGTTACAT NO:195) AACTTACGGTAAATGGCCCGCCTGGCTGACCGC
CCAACGACCCCCGCCCATTGACGTCAATAATGA CGTATGTTCCCATAGTAACGCCAATAGGGACTTT CCATTGACGTCAATGGGTGGAGTATTTACGGTAA ACTGCCCACTTGGCAGTACATCAAGTGTATCATA TGCCAAGTACGCCCCCTATTGACGTCAATGACG GTAAATGGCCCGCCTGGCATTATGCCCAGTACA TGACCTTATGGGACTTTCCTACTTGGCAGTACAT CTACGTATTAGTCATCGCTATTACCATGCATGGT CGAGGTGAGCCCCACGTTCTGCTTCACTCTCCC CATCTCCCCCCCCTCCCCACCCCCAATTTTGTAT TTATTTATTTTTTAATTATTTTGTGCAGCGATGGG GGCGGGGGGGGGGGGGGGGCGCGCGCCAGG CGGGGCGGGGCGGGGCGAGGGGCGGGGCGG GGCGAGGCGGAGAGGTGCGGCGGCAGCCAATC AGAGCGGCGCGCTCCGAAAGTTTCCTTTTATGG CGAGGCGGCGGCGGCGGCGGCCCTATAAAAAG
CGAAGCGCGCGGCGGGCG Íntron sintético GTGAGCGGGCGGGACGGCCCTTCTCCTTCGGG (SEQ ID CTGTAATTAGCGCTTGGTTTAATGACGGCTTGTT NO:192) TCTTTTCTGTGGCTGCGTGAAAGCCTTGAGGGG
CTCCGGGAGGGCCCTTTGTGCGGGGGGAGCGG CTCGGGGCTGTCCGCGGGGGGACGGCTGCCTT
Descrição Sequência
CGGGGGGGACGGGGCAGGGCGGGGTTCGGCT TCTGGCGTGTGACCGGCGGCTCTAGAGCCTCTG
CTAACCATGTTCATGCCTTCTTCTTTTTCCTACAG Sequência de ATGGACTACAAAGACCATGACGGTGATTATAAAG PAH (SEQ ID ATCATGATATCGATTACAAGGATGACGATGACAA NO:196) GGCTGCTGTGGTTCTGGAAAATGGCGTGCTGAG
CCGGAAGCTGAGCGACTTCGGACAAGAGACAAG CTACATCGAGGACAACAGCAACCAGAATGGCGC CGTGTCTCTGATCTTCAGCCTGAAAGAAGAAGTG GGCGCCCTGGCCAAGGTGCTGAGACTGTTCGA GGAAAACGAGATCAATCTGACCCACATCGAGAG CAGACCCAGCAGACTGAACAAGGACGAGTACGA GTTCTTCACCTACCTGGACAAGCGGAGCAAGCC TGTGCTGGGCAGCATCATCAAGAGCCTGAGAAA CGACATCGGCGCCACCGTGCACGAGCTGAGCA GAGACAAAGAAAAGAACACCGTGCCATGGTTCC CCAGGACCATCCAAGAGCTGGACAGATTCGCCA ACCAGATCCTGAGCTATGGCGCCGAGCTGGACG CTGATCACCCTGGCTTTAAGGACCCCGTGTACC GGGCCAGAAGAAAGCAGTTTGCCGATATCGCCT ACAACTACCGGCACGGCCAGCCTATTCCTCGGG TCGAGTACACCGAGGAAGAGAGAAAGACCTGGG GCACCGTGTTCAGAACCCTGAAGGCCCTGTACA AGACCCACGCCTGCTACGAGCACAACCACATCT TCCCACTGCTGGAAAAGTACTGCGGCTTCCGCG AGGACAATATCCCTCAGCTCGAAGACGTGTCCC AGTTCCTGCAGACCTGCACCGGCTTTAGACTGA GGCCTGTTGCCGGACTGCTGAGCAGCAGAGATT TTCTCGGCGGCCTGGCCTTCAGAGTGTTCCACT GTACCCAGTACATCAGACACGGCAGCAAGCCCA TGTACACCCCTGAGCCTGATATCTGCCACGAGC TGCTGGGACATGTGCCCCTGTTCAGCGATAGAA GCTTCGCCCAGTTCAGCCAAGAGATCGGACTGG CTTCTCTGGGAGCCCCTGACGAGTACATTGAGA AGCTGGCCACCATCTACTGGTTCACCGTGGAAT TCGGCCTGTGCAAAGAGGGCGACAGCATCAAGG
Descrição Sequência
CTTATGGCGCTGGACTGCTGTCTAGCTTCGGCG AGCTGCAGTACTGTCTGAGCGACAAGCCTAAGC TGCTGCCCCTGGAACTGGAAAAGACCGCCTGCC AAGAGTACACAGTGACCGAGTTCCAGCCTCTGT ACTACGTGGCCGAGAGCTTCAACGACGCCAAAG AAAAAGTGCGGACCTTCGCCGCCACCATTCCTC GGCCTTTTAGCGTCAGATACGACCCCTACACAC AGCGCGTGGAAGTGCTGGACAACACACAGCAGC TGAAGATTCTGGCCGACTCCATCAACAGCGAAG TGGGCATTCTGTGTCACGCCCTGCAGAAGATCA
AGAGCTGA WPRE (ele- TCATAATCAACCTCTGGATTACAAAATTTGTGAAA mento regula- GATTGACTGGTATTCTTAACTATGTTGCTCCTTTT dor pós- ACGCTATGTGGATACGCTGCTTTAATGCCTTTGT transcricional ATCATGCTATTGCTTCCCGTATGGCTTTCATTTTC do vírus muta- TCCTCCTTGTATAAATCCTGGTTGCTGTCTCTTTA do da hepatite TGAGGAGTTGTGGCCCGTTGTCAGGCAACGTGG de marmota) CGTGGTGTGCACTGTGTTTGCTGACGCAACCCC (SEQ ID CACTGGTTGGGGCATTGCCACCACCTGTCAGCT NO:120) CCTTTCCGGGACTTTCGCTTTCCCCCTCCCTATT
GCCACGGCGGAACTCATCGCCGCCTGCCTTGCC CGCTGCTGGACAGGGGCTCGGCTGTTGGGCAC TGACAATTCCGTGGTGTTGTCGGGGAAATCATC GTCCTTTCCTTGGCTGCTCGCCTGTGTTGCCAC CTGGATTCTGCGCGGGACGTCCTTCTGCTACGT CCCTTCGGCCCTCAATCCAGCGGACCTTCCTTC CCGCGGCCTGCTGCCGGCTCTGCGGCCTCTTC CGCGTCTTCGCCTTCGCCCTCAGACGAGTCGGA
TCTCCCTTTGGGCCGCCTCCCCGCTG bGHpA (sinal CGACTGTGCCTTCTAGTTGCCAGCCATCTGTTGT de poliadenila- TTGCCCCTCCCCCGTGCCTTCCTTGACCCTGGA ção do hormô- AGGTGCCACTCCCACTGTCCTTTCCTAATAAAAT nio de cresci- GAGGAAATTGCATCGCATTGTCTGAGTAGGTGT mento bovino) CATTCTATTCTGGGGGGTGGGGTGGGGCAGGA (SEQ ID CAGCAAGGGGGAGGATTGGGAAGACAATAGCA NO:122) GGCATGCTGGGGA
Descrição Sequência Repetição ter- CACTTCCTGGCGCGCAAAATATCCTCTTGTCCTT minal invertida GAGTCTCATTGGAGGGTTCGTTCGTTCGAACCA 3' ITR (SEQ ID GCCAATCAGGGGAGGGGGAAGTGACGCAAGTT NO: 184) CCGGTCACATGCTTCCGGTGACGCACATCCGGT
GACGTAGTTCCGGTCACGTGCTTCCTGTCACGT GTTTCCGGTCACGTGACTTCCGGTCATGTGACTT CCGGTGACGTGTTTCCGGCTTAACTATTGGGCT GACCGCGCGGCATGCGCGTGGTCAACCTAACA
GCCGGAAACACGTCACCG Sequência de comprimento total (SEQ ID NO: 198)
CGGTGACGTGTTTCCGGCTGTTAGGTTGACCACGCGCATGCCGC GCGGTCAGCCCAATAGTTAAGCCGGAAACACGTCACCGGAAGTC ACATGACCGGAAGTCACGTGACCGGAAACACGTGACAGGAAGCA CGTGACCGGAACTACGTCACCGGATGTGCGTCACCGGAAGCAT GTGACCGGAACTTGCGTCACTTCCCCCTCCCCTGATTGGCTGGT TCGAACGAACGAACCCTCCAATGAGACTCAAGGACAAGAGGATA TTTTGCGCGCCAGGAAGTGGCGGCAATTCAGTCGATAACTATAA CGGTCCTAAGGTAGCGATTTAAATACGCGCTCTCTTAAGGTAGCC CCGGGACGCGTCAATTGAGATCTGGATCCGGTACCGAATTCGCG GCCGCCTCGACGACTAGCGTTTAGTAATGAGACGCACAAACTAA TATCACAAACTGGAAATGTCTATCAATATATAGTTGCTCTAGTTAT TAATAGTAATCAATTACGGGGTCATTAGTTCATAGCCCATATATG GAGTTCCGCGTTACATAACTTACGGTAAATGGCCCGCCTGGCTG ACCGCCCAACGACCCCCGCCCATTGACGTCAATAATGACGTATG TTCCCATAGTAACGCCAATAGGGACTTTCCATTGACGTCAATGGG TGGAGTATTTACGGTAAACTGCCCACTTGGCAGTACATCAAGTGT ATCATATGCCAAGTACGCCCCCTATTGACGTCAATGACGGTAAAT GGCCCGCCTGGCATTATGCCCAGTACATGACCTTATGGGACTTT CCTACTTGGCAGTACATCTACGTATTAGTCATCGCTATTACCATG CATGGTCGAGGTGAGCCCCACGTTCTGCTTCACTCTCCCCATCT CCCCCCCCTCCCCACCCCCAATTTTGTATTTATTTATTTTTTAATT ATTTTGTGCAGCGATGGGGGCGGGGGGGGGGGGGGGGCGCGC GCCAGGCGGGGCGGGGCGGGGCGAGGGGCGGGGCGGGGCGA GGCGGAGAGGTGCGGCGGCAGCCAATCAGAGCGGCGCGCTCC GAAAGTTTCCTTTTATGGCGAGGCGGCGGCGGCGGCGGCCCTA TAAAAAGCGAAGCGCGCGGCGGGCGGGAGTCGCTGCGCGCTG
Descrição Sequência
CCTTCGCCCCGTGCCCCGCTCCGCCGCCGCCTCGCGCCGCCCG CCCCGGCTCTGACTGACCGCGTTACTCCCACAGGTGAGCGGGC GGGACGGCCCTTCTCCTTCGGGCTGTAATTAGCGCTTGGTTTAA TGACGGCTTGTTTCTTTTCTGTGGCTGCGTGAAAGCCTTGAGGG GCTCCGGGAGGGCCCTTTGTGCGGGGGGAGCGGCTCGGGGCT GTCCGCGGGGGGACGGCTGCCTTCGGGGGGGACGGGGCAGGG CGGGGTTCGGCTTCTGGCGTGTGACCGGCGGCTCTAGAGCCTC TGCTAACCATGTTCATGCCTTCTTCTTTTTCCTACAGCTCCTGGG CAACGTGCTGGTTATTGTGCTGTCTCATCATTTTGGCAAAGAATT GGATCGCGAAGCCGCCACCATGGACTACAAAGACCATGACGGT GATTATAAAGATCATGATATCGATTACAAGGATGACGATGACAAG GCTGCTGTGGTTCTGGAAAATGGCGTGCTGAGCCGGAAGCTGA GCGACTTCGGACAAGAGACAAGCTACATCGAGGACAACAGCAAC CAGAATGGCGCCGTGTCTCTGATCTTCAGCCTGAAAGAAGAAGT GGGCGCCCTGGCCAAGGTGCTGAGACTGTTCGAGGAAAACGAG ATCAATCTGACCCACATCGAGAGCAGACCCAGCAGACTGAACAA GGACGAGTACGAGTTCTTCACCTACCTGGACAAGCGGAGCAAGC CTGTGCTGGGCAGCATCATCAAGAGCCTGAGAAACGACATCGGC GCCACCGTGCACGAGCTGAGCAGAGACAAAGAAAAGAACACCGT GCCATGGTTCCCCAGGACCATCCAAGAGCTGGACAGATTCGCCA ACCAGATCCTGAGCTATGGCGCCGAGCTGGACGCTGATCACCCT GGCTTTAAGGACCCCGTGTACCGGGCCAGAAGAAAGCAGTTTGC CGATATCGCCTACAACTACCGGCACGGCCAGCCTATTCCTCGGG TCGAGTACACCGAGGAAGAGAGAAAGACCTGGGGCACCGTGTT CAGAACCCTGAAGGCCCTGTACAAGACCCACGCCTGCTACGAGC ACAACCACATCTTCCCACTGCTGGAAAAGTACTGCGGCTTCCGC GAGGACAATATCCCTCAGCTCGAAGACGTGTCCCAGTTCCTGCA GACCTGCACCGGCTTTAGACTGAGGCCTGTTGCCGGACTGCTGA GCAGCAGAGATTTTCTCGGCGGCCTGGCCTTCAGAGTGTTCCAC TGTACCCAGTACATCAGACACGGCAGCAAGCCCATGTACACCCC TGAGCCTGATATCTGCCACGAGCTGCTGGGACATGTGCCCCTGT TCAGCGATAGAAGCTTCGCCCAGTTCAGCCAAGAGATCGGACTG GCTTCTCTGGGAGCCCCTGACGAGTACATTGAGAAGCTGGCCAC CATCTACTGGTTCACCGTGGAATTCGGCCTGTGCAAAGAGGGCG ACAGCATCAAGGCTTATGGCGCTGGACTGCTGTCTAGCTTCGGC GAGCTGCAGTACTGTCTGAGCGACAAGCCTAAGCTGCTGCCCCT
Descrição Sequência
GGAACTGGAAAAGACCGCCTGCCAAGAGTACACAGTGACCGAGT TCCAGCCTCTGTACTACGTGGCCGAGAGCTTCAACGACGCCAAA GAAAAAGTGCGGACCTTCGCCGCCACCATTCCTCGGCCTTTTAG CGTCAGATACGACCCCTACACACAGCGCGTGGAAGTGCTGGACA ACACACAGCAGCTGAAGATTCTGGCCGACTCCATCAACAGCGAA GTGGGCATTCTGTGTCACGCCCTGCAGAAGATCAAGAGCTGAGC AAGTAATGAGCGCTGATCATAATCAACCTCTGGATTACAAAATTT GTGAAAGATTGACTGGTATTCTTAACTATGTTGCTCCTTTTACGCT ATGTGGATACGCTGCTTTAATGCCTTTGTATCATGCTATTGCTTCC CGTATGGCTTTCATTTTCTCCTCCTTGTATAAATCCTGGTTGCTGT CTCTTTATGAGGAGTTGTGGCCCGTTGTCAGGCAACGTGGCGTG GTGTGCACTGTGTTTGCTGACGCAACCCCCACTGGTTGGGGCAT TGCCACCACCTGTCAGCTCCTTTCCGGGACTTTCGCTTTCCCCCT CCCTATTGCCACGGCGGAACTCATCGCCGCCTGCCTTGCCCGCT GCTGGACAGGGGCTCGGCTGTTGGGCACTGACAATTCCGTGGT GTTGTCGGGGAAATCATCGTCCTTTCCTTGGCTGCTCGCCTGTG TTGCCACCTGGATTCTGCGCGGGACGTCCTTCTGCTACGTCCCT TCGGCCCTCAATCCAGCGGACCTTCCTTCCCGCGGCCTGCTGCC GGCTCTGCGGCCTCTTCCGCGTCTTCGCCTTCGCCCTCAGACGA GTCGGATCTCCCTTTGGGCCGCCTCCCCGCTGATCAGCCTCGAC TGTGCCTTCTAGTTGCCAGCCATCTGTTGTTTGCCCCTCCCCCGT GCCTTCCTTGACCCTGGAAGGTGCCACTCCCACTGTCCTTTCCTA ATAAAATGAGGAAATTGCATCGCATTGTCTGAGTAGGTGTCATTC TATTCTGGGGGGTGGGGTGGGGCAGGACAGCAAGGGGGAGGAT TGGGAAGACAATAGCAGGCATGCTGGGGATGCGGTGGGCTCTA TGGCTTCTGAGGCGGAAAGAACGGGCTCGAGAAGCTTCTAGATA TCCTCTCTTAAGGTAGCATCGAGATTTAAATTAGGGATAACAGGG TAATGGCGCGGGCCGCCACTTCCTGGCGCGCAAAATATCCTCTT GTCCTTGAGTCTCATTGGAGGGTTCGTTCGTTCGAACCAGCCAAT CAGGGGAGGGGGAAGTGACGCAAGTTCCGGTCACATGCTTCCG GTGACGCACATCCGGTGACGTAGTTCCGGTCACGTGCTTCCTGT CACGTGTTTCCGGTCACGTGACTTCCGGTCATGTGACTTCCGGT GACGTGTTTCCGGCTTAACTATTGGGCTGACCGCGCGGCATGCG
CGTGGTCAACCTAACAGCCGGAAACACGTCACCG Exemplo 7b. Preparação de construtos genéticos repórteres de ssDNA contendo ITRs de origem de B19 ou GPV origin.
[00559] Construtos de ssDNA repórter/PAH serão preparados da maneira descrita no Exemplo 1c. Em resumo, os plasmídeos serão digeridos com LguI. Fragmentos de ssDNA com estruturas de ITR tipo grampo de cabelo formadas serão geradas por desnaturação de frag- mentos de DNA de cordão duplo (cassete de expressão repórter e es- trutura plasmídica) de digestão com LguI a 95°C e em seguida resfri- amento a 4°C para permitir que as sequências de ITR palindrômicas se enrolassem (FIG. 1A). Os construtos de ssDNA resultantes serão testados em camundongos quanto à capacidade de estabelecer a transdução de fígado, tecido muscular, fotorreceptores nos olhos, e sistema nervoso central (SNC). Exemplo 7c. Avalição in vivo da expressão de repórter mediada por ssDNA.
[00560] Para validar a capacidade dos construtos repórteres de ssDNA descritos no Exemplo 7b para mediar a expressão transgênica persistente in vivo, camundongos de 5-12 semanas de idade (4 ani- mais/grupo receberão uma injeção de 5, 10, ou 20 µg/camundongo de ssDNA repórter sistemicamente, localmente no tecido muscular alvo e nas células do SNC, e/ou por via subretiniana nas células fotorrecepto- ras alvo.
[00561] Para avaliar a expressão de PAH a partir de construtos de expressão à base de B19 e GPV ITR, será usado um modelo de ca- mundongo de uma doença relevante. Estes construtos genéticos serão distribuídos sistemicamente por HDI para o alvo no fígado.

Claims (1)

  1. REIVINDICAÇÕES
    1. Molécula de ácido nucleico, compreendendo uma primei- ra repetição terminal invertida (ITR) e uma segunda ITR flanqueando um cassete genético compreendendo uma sequência de polinucleotí- deos heterólogos, caracterizada pelo fato de que a primeira ITR e/ou a segunda ITR compreende uma sequência de nucleotídeos pelo menos cerca de 75%, pelo menos cerca de 80%, pelo menos cerca de 85%, pelo menos cerca de 90%, pelo menos cerca de 95%, pelo menos cer- ca de 96%, pelo menos cerca de 97%, pelo menos cerca de 98%, pelo menos cerca de 99%, ou 100% idêntica a uma sequência de nucleotí- deos apresentada na SEQ ID NO: 180, 181, 183, 184, 185, 186, 187 ou 188, ou um derivado funcional da mesma.
    2. Molécula de ácido nucleico de acordo com a reivindica- ção 1, caracterizada pelo fato de que a primeira ITR compreende a sequência de nucleotídeos apresentada na SEQ ID NO: 180 e a se- gunda ITR compreende a sequência de nucleotídeos apresentada na SEQ ID NO: 181.
    3. Molécula de ácido nucleico de acordo com a reivindica- ção 1, caracterizada pelo fato de que a primeira ITR compreende a sequência de nucleotídeos apresentada na SEQ ID NO: 183 e a se- gunda ITR compreende a sequência de nucleotídeos apresentada na SEQ ID NO: 184.
    4. Molécula de ácido nucleico de acordo com a reivindica- ção 1, caracterizada pelo fato de que a primeira ITR compreende a sequência de nucleotídeos apresentada na SEQ ID NO: 185 e a se- gunda ITR compreende a sequência de nucleotídeos apresentada na SEQ ID NO: 186.
    5. Molécula de ácido nucleico de acordo com a reivindica- ção 1, caracterizada pelo fato de que a primeira ITR compreende a sequência de nucleotídeos apresentada na SEQ ID NO: 187 e a se-
    gunda ITR compreende a sequência de nucleotídeos apresentada na SEQ ID NO: 188.
    6. Molécula de ácido nucleico de acordo com a reivindica- ção 1, caracterizada pelo fato de que a primeira ITR e/ou a segunda ITR consiste em uma sequência de nucleotídeos apresentada na SEQ ID NO: 180, 181, 183, 184, 185, 186, 187 ou 188.
    7. Molécula de ácido nucleico de acordo com a reivindica- ção 1, caracterizada pelo fato de que a primeira ITR e a segunda ITR são complementos reversos um do outro.
    8. Molécula de ácido nucleico de acordo com qualquer uma das reivindicações 1 a 7, caracterizada pelo fato de que compreende ainda um promotor.
    9. Molécula de ácido nucleico de acordo com a reivindica- ção 8, caracterizada pelo fato de que o promotor é um promotor teci- do-específico.
    10. Molécula de ácido nucleico de acordo com a reivindica- ção 8 ou 9, caracterizada pelo fato de que o promotor induz a expres- são da sequência de polinucleotídeos heterólogos em um órgão sele- cionado dentre músculo, sistema nervoso central (SNC), olho, fígado, coração, rim, pâncreas, pulmão, pele, bexiga, trato urinário, ou qual- quer combinação dos mesmos.
    11. Molécula de ácido nucleico de acordo com qualquer uma das reivindicações 8 a 10, caracterizada pelo fato de que o pro- motor induz a expressão da sequência de polinucleotídeos heterólogos em hepatócitos, células endoteliais, células do músculo cardíaco, célu- las do músculo esquelético, células sinusoidais, neurônios aferentes, neurônios eferentes, interneurônios, células gliais, astrócitos, oligo- dendrócitos, micróglia, células ependimárias, células epiteliais pulmo- nares, células de Schwann, células satélites, células fotorreceptoras, células ganglionares retinianas, ou qualquer combinação das mesmas.
    12. Molécula de ácido nucleico de acordo com qualquer uma das reivindicações 8 a 11, caracterizada pelo fato de que o pro- motor está posicionada 5' em relação à sequência de polinucleotídeos heterólogos.
    13. Molécula de ácido nucleico de acordo com qualquer uma das reivindicações 8 a 12, caracterizada pelo fato de que o pro- motor é selecionado do grupo que consiste em um promotor de tiretina de camundongo (mTTR), um promotor de fator VIII humano endógeno (F8), um promotor de alfa-1-antitripsina humana (hAAT), um promotor mínimo de albumina humana, um promotor de albumina de camun- dongo, um promotor de tristetraprolina (TTP), um promotor de CASI, um promotor de CAG, um promotor de citomegalovírus (CMV), α1- antitripsina (AAT), creatina quinase muscular (MCK), cadeia pesada alfa de miosina (αMHC), mioglobina (MB), desmina (DES), SPc5-12, 2R5Sc5-12, dMCK, tMCK, e um promotor de fosfoglicerato quinase (PGK).
    14. Molécula de ácido nucleico de acordo com qualquer uma das reivindicações 1 a 13, caracterizada pelo fato de que a se- quência de polinucleotídeos heterólogos compreende ainda uma se- quência intrônica.
    15. Molécula de ácido nucleico de acordo com a reivindica- ção 14, caracterizada pelo fato de que a sequência intrônica está posi- cionada 5’ em relação à sequência de polinucleotídeos heterólogos.
    16. Molécula de ácido nucleico de acordo com a reivindica- ção 14 ou 15, caracterizada pelo fato de que a sequência intrônica es- tá posicionada 3' em relação ao promotor.
    17. Molécula de ácido nucleico de acordo com qualquer uma das reivindicações 14 a 16, caracterizada pelo fato de que a se- quência intrônica compreende uma sequência intrônica sintética.
    18. Molécula de ácido nucleico de acordo com qualquer uma das reivindicações 14 a 17, caracterizada pelo fato de que a se- quência intrônica compreende SEQ ID NO: 115 ou 192.
    19. Molécula de ácido nucleico de acordo com qualquer uma das reivindicações 1 a 18, caracterizada pelo fato de que o casse- te genético compreende ainda um elemento regulador pós- transcricional.
    20. Molécula de ácido nucleico de acordo com a reivindica- ção 19, caracterizada pelo fato de que o elemento regulador pós- transcricional está posicionado 3' em relação à sequência de polinu- cleotídeos heterólogos.
    21. Molécula de ácido nucleico de acordo com a reivindica- ção 19 ou 20, caracterizada pelo fato de que o elemento regulador pós-transcricional compreende um elemento regulador pós- transcricional do vírus da hepatite de marmota mutado (WPRE), um sítio de ligação a microRNA, uma sequência direcionadora de DNA nuclear, ou qualquer combinação dos mesmos.
    22. Molécula de ácido nucleico de acordo com a reivindica- ção 21, caracterizada pelo fato de que o sítio de ligação a microRNA compreende um sítio de ligação ao miR142-3p.
    23. Molécula de ácido nucleico de acordo com qualquer uma das reivindicações 1 a 22, caracterizada pelo fato de que o casse- te genético compreende ainda uma sequência de cauda de 3'UTR po- li(A).
    24. Molécula de ácido nucleico de acordo com a reivindica- ção 23, caracterizada pelo fato de que a sequência de cauda de 3'UTR poli(A) é selecionada do grupo que consiste em bGH poli(A), actina poli(A), hemoglobina poli(A), e qualquer combinação das mesmas.
    25. Molécula de ácido nucleico de acordo com a reivindica- ção 23 ou 24, caracterizada pelo fato de que a sequência de cauda de 3’UTR poli(A) compreende bGH poli(A).
    26. Molécula de ácido nucleico de acordo com qualquer uma das reivindicações 1 a 25, caracterizada pelo fato de que o casse- te genômico compreende ainda uma sequência melhoradora.
    27. Molécula de ácido nucleico de acordo com a reivindica- ção 26, caracterizada pelo fato de que a sequência melhoradora fica posicionada entre a primeira ITR e a segunda ITR.
    28. Molécula de ácido nucleico de acordo com qualquer uma das reivindicações 1 a 27, caracterizada pelo fato de que com- preende de 5’ para 3’: a primeira ITR, o cassete genético, e a segunda ITR; onde o cassete genético compreende uma sequência promotora tecido-específica , uma sequência intrônica, a sequência de polinu- cleotídeos heterólogos, um elemento regulador pós-transcricional, e uma sequência de cauda de 3’UTR poli(A).
    29. Molécula de ácido nucleico de acordo com a reivindica- ção 28, caracterizada pelo fato de que o cassete genético compreende de 5’ para 3’: uma sequência promotora tecido-específica , uma se- quência intrônica, a sequência de polinucleotídeos heterólogos, um elemento regulador pós-transcricional, e uma sequência de cauda de 3’UTR poli(A).
    30. Molécula de ácido nucleico de acordo com a reivindica- ção 28 ou 29, caracterizada pelo fato de que: (a) a sequência promotora tecido-específica compreende um promotor TTT; (b) o íntron é um íntron sintético; (c) o elemento regulador pós-transcricional compreende WPRE; e (d) a sequência de cauda de 3’UTR poli(A) compreende bGHpA.
    31. Molécula de ácido nucleico de acordo com qualquer uma das reivindicações 1 a 30, caracterizada pelo fato de que o casse-
    te genético compreende um ácido nucleico de cordão simples.
    32. Molécula de ácido nucleico de acordo com qualquer uma das reivindicações 1 a 30, caracterizada pelo fato de que o casse- te genético compreende um ácido nucleico de cordão duplo.
    33. Molécula de ácido nucleico de acordo com qualquer uma das reivindicações 1 a 32, caracterizada pelo fato de que a se- quência de polinucleotídeos heterólogos codifica um fator de coagula- ção, um fator de crescimento, um hormônio, uma citocina, um anticor- po, um fragmento do mesmo, ou qualquer combinação dos mesmos.
    34. Molécula de ácido nucleico de acordo com a reivindica- ção 33, caracterizada pelo fato de que a sequência de polinucleotídeos heterólogos codifica um fator de crescimento selecionado do grupo que consiste em adrenomedulina (AM), angiopoietina (Ang), fator de motilidade endócrina, um proteína morfogenética óssea (BMP) (por exemplo, BMP2, BMP4, BMP5, BMP7), um membro da família de fato- res neurotróficos ciliares (por exemplo, fator neurotrófico ciliar (CNTF), fator inibitório de leucemia (LIF), interleucina-6 (IL-6)), um fator estimu- lante de colônias (por exemplo, fator estimulante de colônias de ma- crófagos (m-CSF), fator estimulante de colônias de granulócitos (G- CSF), fator estimulante de colônias de granulócitos e macrófagos (GM- CSF)), um fator de crescimento epidérmico (EGF), uma efrina (por exemplo, efrina A1, efrina A2, efrina A3, efrina A4, efrina A5, efrina B1, efrina B2, efrina B3), eritropoietina (EPO), um fator de crescimento de fibroblastos (FGF) (por exemplo, FGF1, FGF2, FGF3, FGF4, FGF5, FGF6, FGF7, FGF8, FGF9, FGF10, FGF11, FGF12, FGF13, FGF14, FGF15, FGF16, FGF17, FGF18, FGF19, FGF20, FGF21, FGF22, FGF23), somatotrofina bovina fetal (FBS), um membro da família de GDNF (por exemplo, fator neurotrófico derivado da linhagem de célu- las gliais (GDNF), neurturina, persefina, artemina), fator de diferencia- ção de crescimento tipo 9 (GDF9), fator de crescimento de hepatócitos
    (HGF), fator de crescimento derivado de hepatoma (HDGF), insulina, fatores de crescimento semelhantes à insulina (por exemplo, fator de crescimento semelhante à insulina tipo 1 (IGF-1) ou IGF-2, uma inter- leucina (IL) (por exemplo, IL-1, IL-2, IL-3, IL-4, IL-5, IL-6, IL-7), fator de crescimento de queratinóticos (KGF), fator estimulante de migração (MSF), proteína estimulante de macrófagos (MSP ou proteína seme- lhante ao fator de crescimento de hepatócitos (HGFLP)), miostatina (GDF-8), uma neuregulina (por exemplo, neuregulina 1 (NRG1), NRG2, NRG3, NRG4), uma neurotropina (por exemplo, fator neurotró- fico derivado do cérebro (BDNF), fator de crescimento nervoso (NGF), uma neurotrofina-3 (NT-3), NT-4, fator de crescimento placentário (PGF), fator de crescimento de derivados plaquetários (PDGF), rena- lase (RNLS), fator de crescimento de células T (TCGF), trombopoietina (TPO), um fator de transformação do crescimento (por exemplo, fator de transformação do crescimento alfalpha (TGF-α), TGF-β, fator de necrose tumoral alfa (TNF-α), e fator de crescimento endotelial vascu- lar (VEGF), e qualquer combinação dos mesmos.
    35. Molécula de ácido nucleico de acordo com a reivindica- ção 33, caracterizada pelo fato de que a sequência de polinucleotídeos heterólogos codifica um hormônio.
    36. Molécula de ácido nucleico de acordo com a reivindica- ção 33, caracterizada pelo fato de que a sequência de polinucleotídeos heterólogos codifica uma citocina.
    37. Molécula de ácido nucleico de acordo com a reivindica- ção 33, caracterizada pelo fato de que a sequência de polinucleotídeos heterólogos codifica um anticorpo ou um fragmento do mesmo.
    38. Molécula de ácido nucleico de acordo com qualquer uma das reivindicações 1 a 32, caracterizada pelo fato de que a se- quência de polinucleotídeos heterólogos codifica um gene selecionado dentre distrofina ligada ao X, MTM1 (miotubularina), tirosina hidroxila-
    se, AADC, ciclo-hidrolase, SMN1, FXN (frataxina), GUCY2D, RS1, CFH, HTRA, ARMS, CFB/CC2, CNGA/CNGB, Prf65, ARSA, PSAP, IDUA (MPS I), IDS (MPS II), PAH, GAA (alfa-glicosidase ácida), e qualquer combinação dos mesmos.
    39. Molécula de ácido nucleico de acordo com qualquer uma das reivindicações 1 a 32, caracterizada pelo fato de que a se- quência de polinucleotídeos heterólogos codifica um microRNA (miR- NA).
    40. Molécula de ácido nucleico de acordo com a reivindica- ção 39, caracterizada pelo fato de que o miRNA infra-regula a expres- são de um gene alvo selecionado dentre SOD1, HTT, RHO, e qualquer combinação dos mesmos
    41. Molécula de ácido nucleico de acordo com qualquer uma das reivindicações 1 a 32, caracterizada pelo fato de que a se- quência de polinucleotídeos heterólogos codifica um fator de coagula- ção selecionado do grupo que consiste em fator I (FI), fator II (FII), fa- tor III (FIII), fator IV (FVI), fator V (FV), fator VI (FVI), fator VII (FVII), fator VIII (FVIII), fator IX (FIX), fator X (FX), fator XI (FXI), fator XII (FXII), fator XIII (FVIII), fator de Von Willebrand (VWF), precalicreína, cininogênio de alto peso molecular, fibronectina, antitrombina III, cofa- tor de heparina tipo II, proteína C, proteína S, proteína Z, inibidor da protease relacionada à Proteína Z (ZPI), plasminogênio, 2- antiplasmina alfa, ativador de plasminogênio tecidual (tPA), uroqui- nase, inibidor-1 de ativador de plasminogênio (PAI-1), inibidor-2 de ati- vador de plasminogênio (PAI2), e qualquer combinação dos mesmos.
    42. Molécula de ácido nucleico de acordo com a reivindica- ção 41, caracterizada pelo fato de que o fator de coagulação é FVIII.
    43. Molécula de ácido nucleico de acordo com a reivindica- ção 42, caracterizada pelo fato de que o FVIII compreende FVIII madu- ro de comprimento total.
    44. Molécula de ácido nucleico de acordo com a reivindica- ção 43, caracterizada pelo fato de que o FVIII compreende uma se- quência de aminoácidos pelo menos cerca de 70%, pelo menos cerca de 75%, pelo menos cerca de 80%, pelo menos cerca de 85%, pelo menos cerca de 90%, pelo menos cerca de 95%, pelo menos cerca de 96%, pelo menos cerca de 97%, pelo menos cerca de 98%, pelo me- nos cerca de 99%, ou 100% idêntica a uma sequência de aminoácidos tendo a SEQ ID NO: 106.
    45. Molécula de ácido nucleico de acordo com a reivindica- ção 42, caracterizada pelo fato de que o FVIII compreende domínio A1, domínio A2, domínio A3, domínio C1, domínio C2, e um domínio B parcial ou nenhum domínio B.
    46. Molécula de ácido nucleico de acordo com a reivindica- ção 45, caracterizada pelo fato de que o FVIII compreende uma se- quência aminoacídica pelo menos cerca de 70%, pelo menos cerca de 75%, pelo menos cerca de 80%, pelo menos cerca de 85%, pelo me- nos cerca de 90%, pelo menos cerca de 95%, pelo menos cerca de 96%, pelo menos cerca de 97%, pelo menos cerca de 98%, pelo me- nos cerca de 99%, ou 100% idêntica à sequência de aminoácidos de SEQ ID NO:109.
    47. Molécula de ácido nucleico de acordo com qualquer uma das reivindicações 41 a 46, caracterizada pelo fato de que o fator de coagulação compreende uma porção heteróloga.
    48. Molécula de ácido nucleico de acordo com a reivindica- ção 47, caracterizada pelo fato de que a porção heteróloga é selecio- nada do grupo que consiste em albumina ou um fragmento da mesma, uma região Fc de imunoglobulina, o peptídio C-terminal (CTP) da su- bunidade β da gonadotropina coriônica humana, uma sequência PAS, uma sequência HAP, uma transferrina ou um fragmento da mesma, uma porção de ligação à albumina, um derivado da mesma, ou qual-
    quer combinação das mesmas.
    49. Molécula de ácido nucleico de acordo com a reivindica- ção 47 ou 48, caracterizada pelo fato de que a porção heteróloga é ligada ao terminal N ou ao terminal C do FVIII ou inserida entre dois aminoácidos no FVIII.
    50. Molécula de ácido nucleico de acordo com a reivindica- ção 49, caracterizada pelo fato de que a porção heteróloga é inserida entre dois aminoácidos em um ou mais sítios de inserção selecionados dentre os sítios de inserção relacionados na Tabela 4.
    51. Molécula de ácido nucleico de acordo com qualquer uma das reivindicações 42 a 50, caracterizada pelo fato de que o FVIII compreende ainda domínio A1, domínio A2, domínio C1, domínio C2, um domínio B opcional, e uma porção heteróloga, onde a porção hete- róloga é inserida imediatamente a jusante do aminoácido 745 corres- pondente ao FVIII maduro (SEQ ID NO:106).
    52. Molécula de ácido nucleico de acordo com qualquer uma das reivindicações 49 a 51, caracterizada pelo fato de que o FVIII compreende ainda um parceiro de ligação ao FcRn.
    53. Molécula de ácido nucleico de acordo com a reivindica- ção 52, caracterizada pelo fato de que o parceiro de ligação ao FcRn compreende uma região Fc de um domínio constante de imunoglobuli- na.
    54. Molécula de ácido nucleico de acordo com qualquer uma das reivindicações 42 a 53, caracterizada pelo fato de que a se- quência de ácidos nucleicos codificando o FVIII é códon-otimizada.
    55. Molécula de ácido nucleico de acordo com qualquer uma das reivindicações 42 a 54, caracterizada pelo fato de que a se- quência de ácidos nucleicos codificando o FVIII é códon-otimizada pa- ra expressão em um ser humano.
    56. Molécula de ácido nucleico de acordo com a reivindica-
    ção 55, caracterizada pelo fato de que a sequência de ácidos nuclei- cos codificando o FVIII compreende uma sequência de nucleotídeos pelo menos cerca de 60%, pelo menos cerca de 65%, pelo menos cer- ca de 70%, pelo menos cerca de 75%, pelo menos cerca de 80%, pelo menos cerca de 85%, pelo menos cerca de 90%, pelo menos cerca de 95%, pelo menos cerca de 96%, pelo menos cerca de 97%, pelo me- nos cerca de 98%, pelo menos cerca de 99%, ou cerca de 100% idên- tica a uma sequência de nucleotídeos de SEQ ID NO: 107.
    57. Molécula de ácido nucleico de acordo com a reivindica- ção 55, caracterizada pelo fato de que a sequência de ácidos nuclei- cos codificando o FVIII compreende uma sequência de nucleotídeos pelo menos cerca de 60%, pelo menos cerca de 65%, pelo menos cer- ca de 70%, pelo menos cerca de 75%, pelo menos cerca de 80%, pelo menos cerca de 85%, pelo menos cerca de 90%, pelo menos cerca de 95%, pelo menos cerca de 96%, pelo menos cerca de 97%, pelo me- nos cerca de 98%, pelo menos cerca de 99%, ou cerca de 100% idên- tica à sequência de nucleotídeos de SEQ ID NO: 71.
    58. Molécula de ácido nucleico de acordo com qualquer uma das reivindicações 1 a 53, caracterizada pelo fato de que a se- quência de polinucleotídeos heterólogos é códon-otimizada.
    59. Molécula de ácido nucleico de acordo com a reivindica- ção 58, caracterizada pelo fato de que a sequência de polinucleotídeos heterólogos é códon-otimizada para expressão em um ser humano.
    60. Molécula de ácido nucleico de acordo com qualquer uma das reivindicações 1 a 59, caracterizada pelo fato de que é formu- lada com um agente de distribuição.
    61. Molécula de ácido nucleico de acordo com a reivindica- ção 60, caracterizada pelo fato de que o agente de distribuição com- preende uma nanopartícula lipídica.
    62. Molécula de ácido nucleico de acordo com a reivindica-
    ção 60, caracterizada pelo fato de que o agente de distribuição é sele- cionado do grupo que consiste em lipossomas, moléculas poliméricas não lipídicas, e endossomas, e qualquer combinação dos mesmos.
    63. Molécula de ácido nucleico de acordo com qualquer uma das reivindicações 1 a 62, caracterizada pelo fato de que é formu- lada para distribuição intravenosa, transdérmica, intradérmica, subcu- tânea, pulmonar, ou oral, ou qualquer combinação das mesmas.
    64. Molécula de ácido nucleico de acordo com a reivindica- ção 63, caracterizada pelo fato de que é formulada para distribuição intravenosa.
    65. Vetor, caracterizado pelo fato de que compreende uma molécula de ácido nucleico como definida em qualquer uma das rei- vindicações 1 a 59.
    66. Célula hospedeira, caracterizada pelo fato de que compreende uma molécula de ácido nucleico como definida em qual- quer uma das reivindicações 1 a 59.
    67. Composição farmacêutica, caracterizada pelo fato de que compreende o ácido nucleico de qualquer uma das reivindicações 1 a 59 ou o vetor da reivindicação 65, e um excipiente farmaceutica- mente aceitável.
    68. Composição farmacêutica, caracterizada pelo fato de que compreende a célula hospedeira como definida na reivindicação 66 e um excipiente farmaceuticamente aceitável
    69. Kit, caracterizado pelo fato de que compreende uma molécula de ácido nucleico como definida em qualquer uma das rei- vindicações 1 a 59 e instruções de administração da molécula de ácido nucleico a um indivíduo com necessidade da mesma.
    70. Sistema de baculovírus, caracterizado pelo fato de que é para a produção de uma molécula de ácido nucleico como definida em qualquer uma das reivindicações 1 a 59.
    71. Sistema de baculovírus de acordo com a reivindicação 70, caracterizado pelo fato de que uma molécula de ácido nucleico como definida em qualquer uma das reivindicações 1 a 59 é produzida em células de inseto.
    72. Sistema de distribuição de nanopartículas, caracteriza- do pelo fato de que compreende uma molécula de ácido nucleico co- mo definida em qualquer uma das reivindicações 1 a 59.
    73. Método para a produção de um polipeptídio, caracteri- zado pelo fato de que compreende cultivar a célula hospedeira como definida na reivindicação 66 em condições adequadas e recuperar o polipeptídio.
    75. Método para a produção de um polipeptídio com ativi- dade coagulante, caracterizado pelo fato de que compreende: cultivar uma célula hospedeira como definida na reivindicação 66 em condi- ções adequadas e recuperar o polipeptídio com atividade coagulante.
    76. Método para a expressão de uma sequência de polinu- cleotídeos heterólogos em um indivíduo com necessidade da mesma, caracterizado pelo fato de que compreende administrar ao indivíduo uma molécula de ácido nucleico como definida em qualquer uma das reivindicações 1 a 59, o vetor como definido na reivindicação 65, ou a composição farmacêutica como definida na reivindicação 67.
    77. Método para a expressão de um fator de coagulação em um indivíduo com necessidade do mesmo, caracterizado pelo fato de que compreende administrar ao indivíduo uma molécula de ácido nucleico como definida em qualquer uma das reivindicações 41 a 57, o vetor como definido na reivindicação 65, o polipeptídeo como definido na reivindicação 75, ou a composição farmacêutica como definida na reivindicação 67.
    78. Método para o tratamento de uma doença ou distúrbio em um indivíduo com necessidade do mesmo, caracterizado pelo fato de que compreende administrar ao indivíduo uma molécula de ácido nucleico como definida em qualquer uma das reivindicações 1 a 59, o vetor como definido na reivindicação 65, ou a composição farmacêuti- ca como definida na reivindicação 67.
    79. Método para o tratamento de um indivíduo com uma deficiência do fator de colagulação, caracterizado pelo fato de que compreende administrar ao indivíduo uma molécula de ácido nucleico como definida em qualquer uma das reivindicações 41 a 57, o vetor como definido na reivindicação 65, o polipeptídeo como definido na reivindicação 75, ou a composição farmacêutica como definida na rei- vindicação 67.
    80. Método para o tratamento de uma deficiência do fator de coagulação em um indivíduo com necessidade do mesmo, caracte- rizado pelo fato de que compreende administrar ao indivíduo uma mo- lécula de ácido nucleico como definida em qualquer uma das reivindi- cações 41 a 57, o vetor como definido na reivindicação 65, o polipeptí- deo como definido na reivindicação 75, ou a composição farmacêutica como definida na reivindicação 67.
    81. Método de acordo com a reivindicação 79 ou 80, carac- terizado pelo fato de que a molécula de ácido nucleico é administrada por via intravenosa, transdérmica, intradérmica, subcutânea, oral, pul- monar, ou qualquer combinação das mesmas.
    82. Método de acordo com a reivindicação 81, caracteriza- do pelo fato de que a molécula de ácido nucleico é administrada por via intravenosa.
    83. Método de acordo com qualquer uma das reivindica- ções 79 a 82, caracterizado pelo fato de que compreende ainda admi- nistrar ao indivíduo um segundo agente.
    84. Método de acordo com qualquer uma das reivindica- ções 79 a 83, caracterizado pelo fato de que o indivíduo é um mamífe-
    ro.
    85. Método de acordo com qualquer uma das reivindica- ções 79 a 84, caracterizado pelo fato de que o indivíduo é um ser hu- mano.
    86. Método de acordo com qualquer uma das reivindica- ções 79 a 85, caracterizado pelo fato de que a administração da molé- cula de ácido nucleico ao indivíduo resulta em uma atividade aumen- tada de FVIII em relação a uma atividade de FVIII no indivíduo antes da administração, onde a atividade de FVIII é aumentada em pelo me- nos cerca de 2 vezes, pelo menos cerca de 3 vezes, pelo menos cerca de 4 vezes, pelo menos cerca de 5 vezes, pelo menos cerca de 6 ve- zes, pelo menos cerca de 7 vezes, pelo menos cerca de 8 vezes, pelo menos cerca de 9 vezes, pelo menos cerca de 10 vezes, pelo menos cerca de 11 vezes, pelo menos cerca de 12 vezes, pelo menos cerca de 13 vezes, pelo menos cerca de 14 vezes, pelo menos cerca de 15 vezes, pelo menos cerca de 20 vezes, pelo menos cerca de 25 vezes, pelo menos cerca de 30 vezes, pelo menos cerca de 35 vezes, pelo menos cerca de 40 vezes, pelo menos cerca de 50 vezes, pelo menos cerca de 60 vezes, pelo menos cerca de 70 vezes, pelo menos cerca de 80 vezes, pelo menos cerca de 90 vezes, ou pelo menos cerca de 100 vezes.
    87. Método de acordo com qualquer uma das reivindica- ções 79 a 86, caracterizado pelo fato de que o indivíduo tem um dis- túrbio hemorrágico.
    88. Método de acordo com a reivindicação 87, caracteriza- do pelo fato de que o distúrbio hemorrágico é uma hemofilia.
    89. Método de acordo com a reivindicação 87 ou 88, carac- terizado pelo fato de que o distúrbio hemorrágico é hemofilia A.
    90. Método para o tratamento de um distúrbio hemorrágico em um indivíduo com necessidade do mesmo, caracterizado pelo fato de que compreende administrar ao indivíduo uma molécula de ácido nucleico compreendendo uma primeira repetição terminal invertida (ITR) e uma segunda ITR flanqueando um cassete genético compre- endendo uma sequência de polinucleotídeos heterólogos codificando um fator de coagulação, onde a primeira ITR e/ou a segunda ITR compreende uma sequência de nucleotídeos pelo menos cerca de 75%, pelo menos cerca de 80%, pelo menos cerca de 85%, pelo me- nos cerca de 90%, pelo menos cerca de 95%, pelo menos cerca de 96%, pelo menos cerca de 97%, pelo menos cerca de 98%, pelo me- nos cerca de 99%, ou 100% idêntica a uma sequência de nucleotídeos apresentada na SEQ ID NO: 180, 181, 183, 184, 185, 186, 187 ou 188, ou um derivado funcional da mesma.
    91. Método para o tratamento de hemofilia A em um indiví- duo com necessidade do mesmo, caracterizado pelo fato de que com- preende administrar ao indivíduo uma molécula de ácido nucleico compreendendo uma primeira repetição terminal invertida (ITR) e uma segunda ITR flanqueando um cassete genético compreendendo uma sequência de polinucleotídeos heterólogos encoding factor VIII (FVIII), onde a primeira ITR e/ou a segunda ITR compreende uma sequência de nucleotídeos pelo menos cerca de 75%, pelo menos cerca de 80%, pelo menos cerca de 85%, pelo menos cerca de 90%, pelo menos cer- ca de 95%, pelo menos cerca de 96%, pelo menos cerca de 97%, pelo menos cerca de 98%, pelo menos cerca de 99%, ou 100% idêntica a uma sequência de nucleotídeos apresentada na SEQ ID NO: 180, 181, 183, 184, 185, 186, 187 ou 188, ou um derivado funcional da mesma.
    92. Método para o tratamento de um distúrbio metabólico do fígado em um indivíduo com necessidade do mesmo, caracterizado pelo fato de que compreende administrar ao indivíduo uma molécula de ácido nucleico compreendendo uma primeira repetição terminal in- vertida (ITR) e uma segunda ITR flanqueando um cassete genético compreendendo uma sequência de polinucleotídeos heterólogos codi- ficando uma enzima metabólica associada ao fígado que é deficiente no indivíduo, onde a primeira ITR e/ou a segunda ITR são uma ITR de um vírus não adeno-associado (não-AAV).
    93. Método de acordo com a reivindicação 92, caracteriza- do pelo fato de que a primeira ITR e/ou a segunda ITR compreende uma sequência de nucleotídeos pelo menos cerca de 75%, pelo me- nos cerca de 80%, pelo menos cerca de 85%, pelo menos cerca de 90%, pelo menos cerca de 95%, pelo menos cerca de 96%, pelo me- nos cerca de 97%, pelo menos cerca de 98%, pelo menos cerca de 99%, ou 100% idêntica a uma sequência de nucleotídeos apresentada na SEQ ID NO: 180, 181, 183, 184, 185, 186, 187 ou 188, ou um deri- vado funcional da mesma.
    94. Método para o tratamento de um distúrbio metabólico do fígado em um indivíduo com necessidade do mesmo, caracterizado pelo fato de que compreende administrar ao indivíduo uma molécula de ácido nucleico compreendendo uma primeira repetição terminal in- vertida (ITR) e uma segunda ITR flanqueando um cassete genético compreendendo uma sequência de polinucleotídeos heterólogos codi- ficando uma enzima metabólica associada ao fígado que é deficiente no indivíduo, onde a primeira ITR e/ou a segunda ITR compreende uma sequência de nucleotídeos pelo menos cerca de 75%, pelo me- nos cerca de 80%, pelo menos cerca de 85%, pelo menos cerca de 90%, pelo menos cerca de 95%, pelo menos cerca de 96%, pelo me- nos cerca de 97%, pelo menos cerca de 98%, pelo menos cerca de 99%, ou 100% idêntica a uma sequência de nucleotídeos apresentada na SEQ ID NO: 180, 181, 183, 184, 185, 186, 187 ou 188, ou um deri- vado funcional da mesma.
    95. Método de acordo com qualquer uma das reivindica- ções 92 a 94, caracterizado pelo fato de que o cassete genético com-
    preende um ácido nucleico de cordão simples.
    96. Método de acordo com qualquer uma das reivindica- ções 92 a 94, caracterizado pelo fato de que o cassete genético com- preende um ácido nucleico de cordão duplo.
    97. Método de acordo com qualquer uma das reivindica- ções 92 a 96, caracterizado pelo fato de que o distúrbio metabólico do fígado é selecionado do grupo que consiste em fenilcetonúria (PKU), uma doença do ciclo da ureia, um distúrbio de armazenamento lisos- sômico, e uma doença de armazenamento de glicogênio.
    98. Método de acordo com a reivindicação 97, caracteriza- do pelo fato de que o distúrbio metabólico do fígado é fenilcetonúria (PKU).
    99. Método de acordo com qualquer uma das reivindica- ções 92 a 98, caracterizado pelo fato de que a molécula de ácido nu- cleico é administrada por via intravenosa, transdérmica, intradérmica, subcutânea, oral, pulmonar, ou qualquer combinação das mesmas.
    100. Método de acordo com a reivindicação 99, caracteri- zado pelo fato de que a molécula de ácido nucleico é administrada por via intravenosa.
    101. Método de acordo com qualquer uma das reivindica- ções 92 a 100, caracterizado pelo fato de que compreende ainda ad- ministrar ao indivíduo um segundo agente.
    102. Método de acordo com qualquer uma das reivindica- ções 92 a 101, caracterizado pelo fato de que o indivíduo é um mamí- fero.
    103. Método de acordo com qualquer uma das reivindica- ções 92 a 102, caracterizado pelo fato de que o indivíduo é um ser humano.
    104. Método para o tratamento de fenilcetonúria (PKU) em um indivíduo com necessidade do mesmo, caracterizado pelo fato de que compreende administrar ao indivíduo uma molécula de ácido nu- cleico compreendendo uma primeira repetição terminal invertida (ITR) e uma segunda ITR flanqueando um cassete genético compreendendo uma sequência de polinucleotídeos heterólogos codificando fenilalani- na hidroxilase, onde a primeira ITR e/ou a segunda ITR compreende uma sequência de nucleotídeos pelo menos cerca de 75%, pelo me- nos cerca de 80%, pelo menos cerca de 85%, pelo menos cerca de 90%, pelo menos cerca de 95%, pelo menos cerca de 96%, pelo me- nos cerca de 97%, pelo menos cerca de 98%, pelo menos cerca de 99%, ou 100% idêntica a uma sequência de nucleotídeos apresentada na SEQ ID NO: 180, 181, 183, 184, 185, 186, 187 ou 188, ou um deri- vado funcional da mesma.
    105. Método de acordo com a reivindicação 104, caracteri- zado pelo fato de que o cassete genético compreende um ácido nu- cleico de cordão simples.
    106. Método de acordo com a reivindicação 104, caracteri- zado pelo fato de que o cassete genético compreende um ácido nu- cleico de cordão duplo.
    107. Método de acordo com qualquer uma das reivindica- ções 104 a 106, caracterizado pelo fato de que a molécula de ácido nucleico é formulada com um agente de distribuição.
    108. Método de acordo com a reivindicação 107, caracteri- zado pelo fato de que o agente de distribuição compreende uma na- nopartícula lipídica.
    109. Método para a clonagem de uma molécula de ácido nucleico, caracterizado por inserir uma molécula de ácido nucleico ca- paz de complexar estruturas secundárias em um vetor adequado, e introduzir o vetor resultante em uma cepa hospedeira bacteriana com- preendendo uma ruptura no complexo SbcCD.
    110. Método de acordo com a reivindicação 109, caracteri-
    zado pelo fato de que a ruptura no complexo SbcCD compreende uma ruptura genética no gene SbcC e/ou no gene SbcD.
    111. Método de acordo com a reivindicação 109 ou 110, caracterizado pelo fato de que a ruptura no complexo SbcCD compre- ende uma ruptura genética no gene SbcC.
    112. Método de acordo com a reivindicação 109 ou 110, caracterizado pelo fato de que a ruptura no complexo SbcCD compre- ende uma ruptura genética no gene SbcD.
    113. Método de acordo com qualquer uma das reivindica- ções 109 a 112, caracterizado pelo fato de que a molécula de ácido nucleico compreende uma primeira repetição terminal invertida (ITR) e uma segunda ITR, onde a primeira e/ou a segunda ITR é um vírus não adeno-associado (não-AAV) ITR.
    114. Método de acordo com qualquer uma das reivindica- ções 109 a 113, caracterizado pelo fato de que a primeira ITR e/ou a segunda ITR compreende uma sequência de nucleotídeos pelo menos cerca de 75%, pelo menos cerca de 80%, pelo menos cerca de 85%, pelo menos cerca de 90%, pelo menos cerca de 95%, pelo menos cer- ca de 96%, pelo menos cerca de 97%, pelo menos cerca de 98%, pelo menos cerca de 99%, ou 100% idêntica a uma sequência de nucleotí- deos apresentada na SEQ ID NO: 180, 181, 183, 184, 185, 186, 187 ou 188, ou um derivado funcional da mesma.
    115. Método de acordo com qualquer uma das reivindica- ções 109 a 114, caracterizado pelo fato de que a molécula de ácido nucleico compreende ainda um cassete genético, onde o cassete ge- nético é flanqueado pela primeira ITR e pela segunda ITR.
    116. Método de acordo com a reivindicação 115, caracteri- zado pelo fato de que o cassete genético compreende uma sequência de polinucleotídeos heterólogos.
    117. Método de acordo com qualquer uma das reivindica-
    ções 109 a 116, caracterizado pelo fato de que o vetor adequado é um vetor de poucas cópias.
    118. Método de acordo com qualquer uma das reivindica- ções 109 a 116, caracterizado pelo fato de que o vetor adequado é pBR322.
    119. Método de acordo com qualquer uma das reivindica- ções 109 a 118, caracterizado pelo fato de que a cepa hospedeira bac- teriana é incapaz de resolver estruturas de DNA cruciformes.
    120. Método de acordo com qualquer uma das reivindica- ções 109 a 118, caracterizado pelo fato de que a cepa hospedeira bac- teriana é PMC103, compreendendo o genótipo sbcC, recD, mcrA, ΔmcrBCF.
    121. Método de acordo com qualquer uma das reivindica- ções 109 a 118, caracterizado pelo fato de que a cepa hospedeira bac- teriana é PMC107, compreendendo o genótipo recBC, recJ, sbcBC, mcrA, ΔmcrBCF.
    122. Método de acordo com qualquer uma das reivindica- ções 109 a 118, caracterizado pelo fato de que a cepa hospedeira bac- teriana é SURE, compreendendo o genótipo recB, recJ, sbcC, mcrA, ΔmcrBCF, umuC, uvrC.
    123. Método para a clonagem de uma molécula de ácido nucleico, caracterizado pelo fato de que compreende inserir uma mo- lécula de ácido nucleico capaz de complexar estruturas secundárias em um vetor adequado, e introduzir o vetor resultante em uma cepa hospedeira bcteriana compreendendo uma ruptura no complexo SbcCD, onde a molécula de ácido nucleico compreende uma primeira repetição terminal invertida (ITR) e uma segunda ITR, onde a primeira ITR e/ou a segunda ITR compreende uma sequência de nucleotídeos pelo menos cerca de 75%, pelo menos cerca de 80%, pelo menos cer- ca de 85%, pelo menos cerca de 90%, pelo menos cerca de 95%, pelo menos cerca de 96%, pelo menos cerca de 97%, pelo menos cerca de 98%, pelo menos cerca de 99%, ou 100% idêntica a uma sequência de nucleotídeos apresentada na SEQ ID NO: 180, 181, 183, 184, 185, 186, 187 ou 188, ou um derivado funcional da mesma.
BR112021002017-9A 2018-08-09 2019-08-09 moléculas de ácido nucleico e usos das mesmas para terapia genética não viral BR112021002017A2 (pt)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201862716826P 2018-08-09 2018-08-09
US62/716,826 2018-08-09
PCT/US2019/045957 WO2020033863A1 (en) 2018-08-09 2019-08-09 Nucleic acid molecules and uses thereof for non-viral gene therapy

Publications (1)

Publication Number Publication Date
BR112021002017A2 true BR112021002017A2 (pt) 2021-05-11

Family

ID=67766358

Family Applications (1)

Application Number Title Priority Date Filing Date
BR112021002017-9A BR112021002017A2 (pt) 2018-08-09 2019-08-09 moléculas de ácido nucleico e usos das mesmas para terapia genética não viral

Country Status (15)

Country Link
US (1) US20200069817A1 (pt)
EP (1) EP3833766A1 (pt)
JP (1) JP2021533753A (pt)
KR (1) KR20210042128A (pt)
CN (1) CN113227385A (pt)
AU (1) AU2019319984A1 (pt)
BR (1) BR112021002017A2 (pt)
CA (1) CA3108799A1 (pt)
CO (1) CO2021002965A2 (pt)
IL (1) IL280652A (pt)
MX (1) MX2021001599A (pt)
PH (1) PH12021500010A1 (pt)
SG (1) SG11202101157VA (pt)
TW (1) TW202023630A (pt)
WO (1) WO2020033863A1 (pt)

Families Citing this family (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10842885B2 (en) 2018-08-20 2020-11-24 Ucl Business Ltd Factor IX encoding nucleotides
CN111334528B (zh) * 2020-03-20 2022-02-18 山东农业大学 水貂肠炎细小病毒全基因组感染性克隆及其构建方法和应用
JP2023535632A (ja) 2020-07-27 2023-08-18 アンジャリウム バイオサイエンシズ エージー Dna分子の組成物、その作製方法、及びその使用方法
BR112023002395A2 (pt) * 2020-08-23 2023-03-21 Bioverativ Therapeutics Inc Sistema de baculovírus modificado para produção aprimorada de dna com extremidades fechadas (cedna)
CN112704729A (zh) * 2020-12-28 2021-04-27 江苏纳迪芯生命科技研究院有限公司 一种细胞因子颗粒
CA3211687A1 (en) * 2021-03-19 2022-09-22 Ozan ALKAN Non-viral dna vectors and uses thereof for expressing pfic therapeutics
CN113325181A (zh) * 2021-04-25 2021-08-31 苏州市立医院(北区) 丝氨酸蛋白酶抑制剂在用于脓毒症早期预警的标志物中的应用
WO2022232029A2 (en) * 2021-04-26 2022-11-03 University Of Florida Research Foundation, Incorporated Synthetic aav vectors for repeated delivery of therapeutic genes
WO2022272056A2 (en) * 2021-06-24 2022-12-29 University Of Utah Research Foundation Compositions and methods for treating pgm1 deficiency
IL310879A (en) 2021-08-23 2024-04-01 Bioverativ Therapeutics Inc Expression system in colovirus
WO2023028441A1 (en) 2021-08-23 2023-03-02 Bioverativ Therapeutics Inc. Engineered itr sequences and methods of use
WO2023056331A1 (en) * 2021-09-30 2023-04-06 Bioverativ Therapeutics Inc. Nucleic acids encoding factor viii polypeptides with reduced immunogenicity
CN114250224B (zh) * 2021-12-16 2024-02-27 福建和瑞基因科技有限公司 一种用于提取或检测样本中小分子rna的核酸组合物及其试剂盒和方法
WO2023135273A2 (en) * 2022-01-14 2023-07-20 Anjarium Biosciences Ag Compositions of dna molecules encoding factor viii, methods of making thereof, and methods of use thereof
CN116064673A (zh) * 2022-10-19 2023-05-05 河南省人民医院 表达rs1的重组腺相关病毒载体及其应用

Family Cites Families (131)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4965188A (en) 1986-08-22 1990-10-23 Cetus Corporation Process for amplifying, detecting, and/or cloning nucleic acid sequences using a thermostable enzyme
US4683202A (en) 1985-03-28 1987-07-28 Cetus Corporation Process for amplifying nucleic acid sequences
US4683195A (en) 1986-01-30 1987-07-28 Cetus Corporation Process for amplifying, detecting, and/or-cloning nucleic acid sequences
US4868112A (en) 1985-04-12 1989-09-19 Genetics Institute, Inc. Novel procoagulant proteins
US4770999A (en) 1985-04-22 1988-09-13 Genetics Institute, Inc. High yield production of active Factor IX
KR910006424B1 (ko) 1985-08-21 1991-08-24 인코텍스 비.브이 편성브리프(brief) 제조방법
ATE87663T1 (de) 1986-01-03 1993-04-15 Genetics Inst Verfahren zur herstellung von faktor-viii:c-typ- proteinen.
US5595886A (en) 1986-01-27 1997-01-21 Chiron Corporation Protein complexes having Factor VIII:C activity and production thereof
US4800159A (en) 1986-02-07 1989-01-24 Cetus Corporation Process for amplifying, detecting, and/or cloning nucleic acid sequences
US5543502A (en) 1986-06-24 1996-08-06 Novo Nordisk A/S Process for producing a coagulation active complex of factor VIII fragments
WO1988007089A1 (en) 1987-03-18 1988-09-22 Medical Research Council Altered antibodies
US6060447A (en) 1987-05-19 2000-05-09 Chiron Corporation Protein complexes having Factor VIII:C activity and production thereof
US5171844A (en) 1987-06-12 1992-12-15 Gist-Brocades N.W. Proteins with factor viii activity: process for their preparation using genetically-engineered cells and pharmaceutical compositions containing them
US6346513B1 (en) 1987-06-12 2002-02-12 Baxter Trading Gmbh Proteins with factor VIII activity: process for their preparation using genetically-engineered cells and pharmaceutical compositions containing them
DE3720246A1 (de) 1987-06-19 1988-12-29 Behringwerke Ag Faktor viii:c-aehnliches molekuel mit koagulationsaktivitaet
FR2619314B1 (fr) 1987-08-11 1990-06-15 Transgene Sa Analogue du facteur viii, procede de preparation et composition pharmaceutique le contenant
US6780613B1 (en) 1988-10-28 2004-08-24 Genentech, Inc. Growth hormone variants
AU648020B2 (en) 1989-02-21 1994-04-14 Washington University Modified forms of reproductive hormones
SE465222C5 (sv) 1989-12-15 1998-02-10 Pharmacia & Upjohn Ab Ett rekombinant, humant faktor VIII-derivat och förfarande för dess framställning
MX9204374A (es) 1991-07-25 1993-03-01 Idec Pharma Corp Anticuerpo recombinante y metodo para su produccion.
SE504074C2 (sv) 1993-07-05 1996-11-04 Pharmacia Ab Proteinberedning för subkutan, intramuskulär eller intradermal administrering
GB9422383D0 (en) 1994-11-05 1995-01-04 Wellcome Found Antibodies
US6086875A (en) 1995-01-17 2000-07-11 The Brigham And Women's Hospital, Inc. Receptor specific transepithelial transport of immunogens
US6030613A (en) 1995-01-17 2000-02-29 The Brigham And Women's Hospital, Inc. Receptor specific transepithelial transport of therapeutics
US6485726B1 (en) 1995-01-17 2002-11-26 The Brigham And Women's Hospital, Inc. Receptor specific transepithelial transport of therapeutics
US6096871A (en) 1995-04-14 2000-08-01 Genentech, Inc. Polypeptides altered to contain an epitope from the Fc region of an IgG molecule for increased half-life
US5739277A (en) 1995-04-14 1998-04-14 Genentech Inc. Altered polypeptides with increased half-life
US5869046A (en) 1995-04-14 1999-02-09 Genentech, Inc. Altered polypeptides with increased half-life
US6121022A (en) 1995-04-14 2000-09-19 Genentech, Inc. Altered polypeptides with increased half-life
SE9503380D0 (sv) 1995-09-29 1995-09-29 Pharmacia Ab Protein derivatives
US6458563B1 (en) 1996-06-26 2002-10-01 Emory University Modified factor VIII
AU3968897A (en) 1996-08-02 1998-02-25 Bristol-Myers Squibb Company A method for inhibiting immunoglobulin-induced toxicity resulting from the use of immunoglobulins in therapy and in vivo diagnosis
WO1998023289A1 (en) 1996-11-27 1998-06-04 The General Hospital Corporation MODULATION OF IgG BINDING TO FcRn
US6277375B1 (en) 1997-03-03 2001-08-21 Board Of Regents, The University Of Texas System Immunoglobulin-like domains with increased half-lives
CA2225189C (en) 1997-03-06 2010-05-25 Queen's University At Kingston Canine factor viii gene, protein and methods of use
GB9722131D0 (en) 1997-10-20 1997-12-17 Medical Res Council Method
US6528624B1 (en) 1998-04-02 2003-03-04 Genentech, Inc. Polypeptide variants
US6242195B1 (en) 1998-04-02 2001-06-05 Genentech, Inc. Methods for determining binding of an analyte to a receptor
DK1068241T3 (da) 1998-04-02 2008-02-04 Genentech Inc Antistofvarianter og fragmenter deraf
US6194551B1 (en) 1998-04-02 2001-02-27 Genentech, Inc. Polypeptide variants
GB9809951D0 (en) 1998-05-08 1998-07-08 Univ Cambridge Tech Binding molecules
CA2341029A1 (en) 1998-08-17 2000-02-24 Abgenix, Inc. Generation of modified molecules with increased serum half-lives
EP1006183A1 (en) 1998-12-03 2000-06-07 Max-Planck-Gesellschaft zur Förderung der Wissenschaften e.V. Recombinant soluble Fc receptors
US6737056B1 (en) 1999-01-15 2004-05-18 Genentech, Inc. Polypeptide variants with altered effector function
ES2694002T3 (es) 1999-01-15 2018-12-17 Genentech, Inc. Polipéptido que comprende una región Fc de IgG1 humana variante
CA2405709A1 (en) 2000-04-12 2001-10-25 Human Genome Sciences, Inc. Albumin fusion proteins
AU2002226028A1 (en) 2000-11-14 2002-05-27 Board Of Regents, Unversity Of Texas Systems Mutant human factor ix with an increased resistance to inhibition by heparin
GB0029407D0 (en) 2000-12-01 2001-01-17 Affitech As Product
ES2649037T3 (es) 2000-12-12 2018-01-09 Medimmune, Llc Moléculas con semividas prolongadas, composiciones y usos de las mismas
EP1377306A1 (en) 2001-03-09 2004-01-07 Dyax Corp. Serum albumin binding moieties
DE60233047D1 (de) 2001-05-14 2009-09-03 Gbp Ip Llc Lentivirale vektoren kodierend für gerinnungsfaktoren für die gentherapie
MXPA04001982A (es) 2001-09-04 2004-06-07 Merck Patent Gmbh Factor ix modificado.
KR101271635B1 (ko) 2001-12-21 2013-06-12 휴먼 게놈 사이언시즈, 인코포레이티드 알부민 융합 단백질
US20080194481A1 (en) 2001-12-21 2008-08-14 Human Genome Sciences, Inc. Albumin Fusion Proteins
CA2471363C (en) 2001-12-21 2014-02-11 Human Genome Sciences, Inc. Albumin fusion proteins
US20040002587A1 (en) 2002-02-20 2004-01-01 Watkins Jeffry D. Fc region variants
US20040018557A1 (en) 2002-03-01 2004-01-29 Immunomedics, Inc. Bispecific antibody point mutations for enhancing rate of clearance
US7317091B2 (en) 2002-03-01 2008-01-08 Xencor, Inc. Optimized Fc variants
US20040132101A1 (en) 2002-09-27 2004-07-08 Xencor Optimized Fc variants and methods for their generation
CN100343393C (zh) 2002-03-15 2007-10-17 布赖汉姆妇女医院 适合治疗剂全身性递送的中央气道给药
CA2495251C (en) 2002-08-14 2018-03-06 Macrogenics, Inc. Fc.gamma.riib-specific antibodies and methods of use thereof
DK2345671T3 (en) 2002-09-27 2016-02-15 Xencor Inc Optimized Fc variants and methods for their formation
AU2003286467B2 (en) 2002-10-15 2009-10-01 Abbvie Biotherapeutics Inc. Alteration of FcRn binding affinities or serum half-lives of antibodies by mutagenesis
GB2395337B (en) 2002-11-14 2005-12-28 Gary Michael Wilson Warning Unit
JP2006524039A (ja) 2003-01-09 2006-10-26 マクロジェニクス,インコーポレーテッド 変異型Fc領域を含む抗体の同定および作製ならびにその利用法
US7041635B2 (en) 2003-01-28 2006-05-09 In2Gen Co., Ltd. Factor VIII polypeptide
US8388955B2 (en) 2003-03-03 2013-03-05 Xencor, Inc. Fc variants
US20090010920A1 (en) 2003-03-03 2009-01-08 Xencor, Inc. Fc Variants Having Decreased Affinity for FcyRIIb
JP2006524051A (ja) 2003-04-24 2006-10-26 フォンダッチォーネ・セントロ・サン・ラファエル・デル・モンテ・タボール 両方向性合成プロモーターを備えたレンチウイルスベクターおよびその使用
TWI353991B (en) 2003-05-06 2011-12-11 Syntonix Pharmaceuticals Inc Immunoglobulin chimeric monomer-dimer hybrids
GB0324368D0 (en) 2003-10-17 2003-11-19 Univ Cambridge Tech Polypeptides including modified constant regions
EP1697520A2 (en) 2003-12-22 2006-09-06 Xencor, Inc. Fc polypeptides with novel fc ligand binding sites
US20080089892A1 (en) 2004-01-12 2008-04-17 Eli Lilly And Co. Fc Region Variants
EP1737890A2 (en) 2004-03-24 2007-01-03 Xencor, Inc. Immunoglobulin variants outside the fc region
WO2005123780A2 (en) 2004-04-09 2005-12-29 Protein Design Labs, Inc. Alteration of fcrn binding affinities or serum half-lives of antibodies by mutagenesis
US7598071B2 (en) * 2004-07-09 2009-10-06 The United States Of America As Represented By The Department Of Health And Human Services Infectious clone of human parvovirus B19 and methods
WO2006085967A2 (en) 2004-07-09 2006-08-17 Xencor, Inc. OPTIMIZED ANTI-CD20 MONOCONAL ANTIBODIES HAVING Fc VARIANTS
EP2471813B1 (en) 2004-07-15 2014-12-31 Xencor, Inc. Optimized Fc variants
WO2006047350A2 (en) 2004-10-21 2006-05-04 Xencor, Inc. IgG IMMUNOGLOBULIN VARIANTS WITH OPTIMIZED EFFECTOR FUNCTION
CA2591544A1 (en) * 2004-12-15 2006-06-22 The University Of North Carolina At Chapel Hill Chimeric vectors
US20080213233A1 (en) * 2005-05-27 2008-09-04 Shu Wang Method of Delivering Nucleic Acid Molecules Into Embryonic Stem Cells Using Baculoviral Vectors
KR20130114758A (ko) 2005-05-27 2013-10-17 오스페달레 산 라파엘 에스.알.엘. Mi-rna를 포함하는 유전자 벡터
JP2009504157A (ja) 2005-08-12 2009-02-05 ヒューマン ジノーム サイエンシーズ, インコーポレイテッド アルブミン融合タンパク質
EP1979485A2 (en) * 2006-01-31 2008-10-15 The Board Of Trustees Of The Leland Stanford Junior University Self-complementary parvoviral vectors, and methods for making and using the same
US8048848B2 (en) 2006-02-03 2011-11-01 Prolor Biotech Ltd. Long-acting interferons and derivatives thereof and methods thereof
US7939632B2 (en) 2006-06-14 2011-05-10 Csl Behring Gmbh Proteolytically cleavable fusion proteins with high molar specific activity
WO2007149406A2 (en) 2006-06-19 2007-12-27 Nautilus Technology Llc Modified coagulation factor ix polypeptides and use thereof for treatment
GB0614780D0 (en) 2006-07-25 2006-09-06 Ucb Sa Biological products
BRPI0716744A2 (pt) 2006-09-14 2016-10-04 Human Genome Sciences Inc proteínas de fusão de albumina
US7700734B2 (en) 2007-01-09 2010-04-20 Shu-Wha Lin Recombinant human factor IX and use thereof
EP2144930A1 (en) 2007-04-18 2010-01-20 ZymoGenetics, Inc. Single chain fc, methods of making and methods of treatment
NZ581395A (en) 2007-05-14 2012-08-31 Biogen Idec Inc Single-chain fc (scfc) regions, binding polypeptides comprising same, and methods related thereto
CN101970678B (zh) 2007-06-21 2014-08-20 慕尼黑科技大学 具有增加的体内和/或体外稳定性的生物学活性蛋白
CA2702363A1 (en) 2007-10-15 2009-04-23 The University Of North Carolina At Chapel Hill Human factor ix variants with an extended half life
AU2009244633A1 (en) 2008-04-16 2009-11-12 Bayer Healthcare Llc Modified Factor IX polypeptides and uses thereof
KR20110015551A (ko) 2008-04-16 2011-02-16 바이엘 헬스케어 엘엘씨 제ix인자의 부위-지정 변형
EP2268807A2 (en) 2008-04-21 2011-01-05 Novo Nordisk A/S Hyperglycosylated human coagulation factor ix
DK2364362T3 (en) 2008-11-12 2016-01-25 Ospedale San Raffaele Srl Gene vector FOR INDUCTION OF IMMUNE TOLERANCE transgene
US8680050B2 (en) 2009-02-03 2014-03-25 Amunix Operating Inc. Growth hormone polypeptides fused to extended recombinant polypeptides and methods of making and using same
CN102348715B (zh) 2009-02-03 2017-12-08 阿穆尼克斯运营公司 延伸重组多肽和包含该延伸重组多肽的组合物
US8716448B2 (en) 2009-02-03 2014-05-06 Amunix Operating Inc. Coagulation factor VII compositions and methods of making and using same
US8703717B2 (en) 2009-02-03 2014-04-22 Amunix Operating Inc. Growth hormone polypeptides and methods of making and using same
ES2786039T3 (es) 2009-04-30 2020-10-08 Ospedale San Raffaele Srl Vector génico
WO2010140148A1 (en) 2009-06-01 2010-12-09 Yeda Research And Development Co . Ltd Prodrugs containing albumin binding probe
PT2440228T (pt) 2009-06-08 2018-12-24 Amunix Operating Inc Polipéptidos de regulação da glicose e métodos de preparação e utilização dos mesmos
EP2440241B1 (en) 2009-06-08 2017-08-09 Amunix Operating Inc. Growth hormone polypeptides and methods of making and using same
GB0911870D0 (en) * 2009-07-08 2009-08-19 Ucl Business Plc Optimised coding sequence and promoter
WO2011028344A2 (en) 2009-08-25 2011-03-10 Amunix Operating Inc. Interleukin-1 receptor antagonist compositions and methods of making and using same
WO2011088081A1 (en) * 2010-01-12 2011-07-21 The University Of North Carolina At Chapel Hill Restrictive inverted terminal repeats for viral vectors
US20130052226A1 (en) * 2010-02-12 2013-02-28 The Government Of The Usa, As Represented By The Secretary, Department Of Health & Human Services Compositions and methods for preventing or treating a human parvovirus infection
KR20230156435A (ko) 2010-07-09 2023-11-14 바이오버라티브 테라퓨틱스 인크. 인자 ix 폴리펩티드 및 이들의 사용 방법
EP2591006B1 (en) 2010-07-09 2019-04-24 Bioverativ Therapeutics Inc. Processable single chain molecules and polypeptides made using same
EP2500434A1 (en) * 2011-03-12 2012-09-19 Association Institut de Myologie Capsid-free AAV vectors, compositions, and methods for vector production and gene delivery
NZ626945A (en) 2012-01-12 2016-10-28 Biogen Ma Inc Chimeric factor viii polypeptides and uses thereof
CA2863329C (en) 2012-01-12 2023-01-03 Biogen Idec Ma Inc. Methods of reducing immunogenicity against factor viii in individuals undergoing factor viii therapy
KR20190094480A (ko) 2012-02-15 2019-08-13 바이오버라티브 테라퓨틱스 인크. 재조합 인자 viii 단백질
CN111548418A (zh) 2012-02-15 2020-08-18 比奥贝拉蒂治疗公司 因子viii组合物及其制备和使用方法
PT2882450T (pt) 2012-07-11 2020-02-19 Bioverativ Therapeutics Inc Complexo de fator viii com xten e a proteína fator de von willebrand, e utilizações do mesmo
HUE047933T2 (hu) 2013-03-15 2020-05-28 Bioverativ Therapeutics Inc Faktor VIII polipeptid készítmények
EP2970966A4 (en) * 2013-03-15 2016-10-26 Univ North Carolina SYNTHETIC ADENOASSOZED VIRUS INVERTED REPEAT SEQUENCES
TW202003554A (zh) 2013-08-14 2020-01-16 美商百歐維拉提夫治療公司 因子viii-xten融合物及其用途
EP4108254A1 (en) * 2013-08-14 2022-12-28 Bioverativ Therapeutics Inc. Recombinant factor viii proteins
SI3091997T1 (sl) 2014-01-10 2022-10-28 Bioverativ Therapeutics Inc. Himerni proteini faktorja VIII in njihova uporaba
MY186389A (en) * 2014-05-13 2021-07-22 Univ Pennsylvania Compositions comprising aav expressing dual antibody constructs and uses thereof
WO2015191508A1 (en) * 2014-06-09 2015-12-17 Voyager Therapeutics, Inc. Chimeric capsids
WO2016004113A1 (en) 2014-06-30 2016-01-07 Biogen Ma Inc. Optimized factor ix gene
EP3221456B1 (en) * 2014-11-21 2021-09-22 University of Florida Research Foundation, Inc. Genome-modified recombinant adeno-associated virus vectors
US10308705B2 (en) * 2015-02-06 2019-06-04 The University Of North Carolina At Chapel Hill Optimized human clotting factor VIII gene expression cassettes and their use
WO2016134338A1 (en) * 2015-02-19 2016-08-25 University Of Florida Research Foundation, Inc. Recombinant aav vectors for gene therapy of human hematopoietic disorders
JP7217630B2 (ja) * 2016-02-01 2023-02-03 バイオベラティブ セラピューティクス インコーポレイテッド 最適化第viii因子遺伝子
KR20200035130A (ko) * 2017-08-09 2020-04-01 바이오버라티브 테라퓨틱스 인크. 핵산 분자 및 이의 용도

Also Published As

Publication number Publication date
CN113227385A (zh) 2021-08-06
CA3108799A1 (en) 2020-02-13
TW202023630A (zh) 2020-07-01
MX2021001599A (es) 2021-07-02
WO2020033863A1 (en) 2020-02-13
US20200069817A1 (en) 2020-03-05
SG11202101157VA (en) 2021-03-30
AU2019319984A1 (en) 2021-03-04
JP2021533753A (ja) 2021-12-09
PH12021500010A1 (en) 2021-10-11
KR20210042128A (ko) 2021-04-16
EP3833766A1 (en) 2021-06-16
IL280652A (en) 2021-03-25
CO2021002965A2 (es) 2021-03-19

Similar Documents

Publication Publication Date Title
BR112021002017A2 (pt) moléculas de ácido nucleico e usos das mesmas para terapia genética não viral
JP7374883B2 (ja) 核酸分子およびその使用
US20240124555A1 (en) Optimized factor viii genes
US20210115425A1 (en) Optimized factor ix gene
JP7237903B2 (ja) 止血疾患を治療するための変異因子viiiのゲノム組込及び発現のための改良された発現カセット
CN111163796A (zh) 因子viii(fviii)基因治疗方法
BR112021010047A2 (pt) Uso de vetores lentivirais expressando o fator ix
US20220243201A1 (en) Engineered itr sequences and methods of use
US20230084036A1 (en) Optimized factor viii genes
WO2023028441A1 (en) Engineered itr sequences and methods of use
TW202346327A (zh) 編碼具有降低免疫原性的因子viii多肽之核酸
CN118019758A (en) Nucleic acids encoding reduced immunogenicity factor VIII polypeptides