BRPI0817560B1 - Proteínas de dedo de zinco (zfp) engenheiradas que têm como alvo genes de 5-enolpiruvil shiquimato-3-fosfato sintase, nuclease de dedo de zinco (zfn), vetor, bem como métodos para introdução de um transgene no genoma de uma célula de planta, para expressar o produto de um transgene em uma célula de planta, para deleção de uma sequência de gene de epsps a partir de um locus de gene epsps no genoma de uma célula de planta, e para modular expressão de um gene de epsps - Google Patents

Proteínas de dedo de zinco (zfp) engenheiradas que têm como alvo genes de 5-enolpiruvil shiquimato-3-fosfato sintase, nuclease de dedo de zinco (zfn), vetor, bem como métodos para introdução de um transgene no genoma de uma célula de planta, para expressar o produto de um transgene em uma célula de planta, para deleção de uma sequência de gene de epsps a partir de um locus de gene epsps no genoma de uma célula de planta, e para modular expressão de um gene de epsps Download PDF

Info

Publication number
BRPI0817560B1
BRPI0817560B1 BRPI0817560-8A BRPI0817560A BRPI0817560B1 BR PI0817560 B1 BRPI0817560 B1 BR PI0817560B1 BR PI0817560 A BRPI0817560 A BR PI0817560A BR PI0817560 B1 BRPI0817560 B1 BR PI0817560B1
Authority
BR
Brazil
Prior art keywords
seq
sequence
gene
epsps
cleavage
Prior art date
Application number
BRPI0817560-8A
Other languages
English (en)
Inventor
Manju Gupta
Asha M. Palta
Stephen Novak
Fyodor Urnov
Sunita Gopalan
Original Assignee
Dow Agrosciences Llc
Sangamo Biosciences, Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Family has litigation
First worldwide family litigation filed litigation Critical https://patents.darts-ip.com/?family=40243886&utm_source=***_patent&utm_medium=platform_link&utm_campaign=public_patent_search&patent=BRPI0817560(B1) "Global patent litigation dataset” by Darts-ip is licensed under a Creative Commons Attribution 4.0 International License.
Application filed by Dow Agrosciences Llc, Sangamo Biosciences, Inc filed Critical Dow Agrosciences Llc
Publication of BRPI0817560A2 publication Critical patent/BRPI0817560A2/pt
Publication of BRPI0817560B1 publication Critical patent/BRPI0817560B1/pt

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8201Methods for introducing genetic material into plant cells, e.g. DNA, RNA, stable or transient incorporation, tissue culture methods adapted for transformation
    • C12N15/8213Targeted insertion of genes into the plant genome by homologous recombination
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8241Phenotypically and genetically modified plants via recombinant DNA technology
    • C12N15/8242Phenotypically and genetically modified plants via recombinant DNA technology with non-agronomic quality (output) traits, e.g. for industrial processing; Value added, non-agronomic traits
    • C12N15/8243Phenotypically and genetically modified plants via recombinant DNA technology with non-agronomic quality (output) traits, e.g. for industrial processing; Value added, non-agronomic traits involving biosynthetic or metabolic pathways, i.e. metabolic engineering, e.g. nicotine, caffeine
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8241Phenotypically and genetically modified plants via recombinant DNA technology
    • C12N15/8261Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield
    • C12N15/8271Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield for stress resistance, e.g. heavy metal resistance
    • C12N15/8274Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield for stress resistance, e.g. heavy metal resistance for herbicide resistance
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/10Transferases (2.)
    • C12N9/1085Transferases (2.) transferring alkyl or aryl groups other than methyl groups (2.5)
    • C12N9/10923-Phosphoshikimate 1-carboxyvinyltransferase (2.5.1.19), i.e. 5-enolpyruvylshikimate-3-phosphate synthase
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/80Fusion polypeptide containing a DNA binding domain, e.g. Lacl or Tet-repressor
    • C07K2319/81Fusion polypeptide containing a DNA binding domain, e.g. Lacl or Tet-repressor containing a Zn-finger domain for DNA binding

Landscapes

  • Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Chemical & Material Sciences (AREA)
  • Biotechnology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Organic Chemistry (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Biomedical Technology (AREA)
  • General Engineering & Computer Science (AREA)
  • Molecular Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Microbiology (AREA)
  • Biochemistry (AREA)
  • Biophysics (AREA)
  • Cell Biology (AREA)
  • Plant Pathology (AREA)
  • Physics & Mathematics (AREA)
  • Nutrition Science (AREA)
  • Medicinal Chemistry (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Breeding Of Plants And Reproduction By Means Of Culturing (AREA)
  • Enzymes And Modification Thereof (AREA)
  • Peptides Or Proteins (AREA)

Abstract

PROTEÍNAS DE GARRA DE ZINCO (PROTEÍNAS ZINC FINGER) PROJETADAS QUE TÊM COMO ALVO GENES DE 5- ENOLPIRUVIL SHIQUIMATO-3-FOSFATO SINTASE. A presente invenção refere-se a proteínas de garra de zinco projetadas que têm como alvo genes de 5-enolpiruvil shiquimato-3-fosfato sintase (EPSPS) em plantas e métodos de uso de tais proteínas de garra de zinco na modulação de expressão de gene, inativação de gene e modificação de gene-alvo. Em particular, a descrição pertence a nucleases de garra de zinco para clivagem-alvo e alteração de genes de EPSPS.

Description

CAMPO TÉCNICO
[001] A presente invenção refere-se geralmente aos campos de engenharia de genoma, direcionamento de gene, integração cromos- somal-alvo, e expressão de proteína em plantas. Em particular, a presente descrição refere-se a proteínas de dedo de zinco engenheiradas que têm como alvo genes de 5-enolpiruvil shiquimato-3-fosfato sintase (EPSPS) e métodos de uso de tais proteínas de dedo de zinco na modulação de expressão de gene, inativação de gene, e modificação de gene-alvo. Mais particularmente, a descrição pertence às nucleases de dedo de zinco engenheiradas para clivagem e alteração-alvos de gene de EPSPS.
ANTECEDENTES
[002] Uma área maior de interesse na agricultura, especialmente a luz da determinação das sequências de nucleotídeo completas de um número de genomas de planta, é a regulação-alvo de expressão de gene e alteração de sequências de gene. Em particular, a capacidade de modular expressão de gene ou modificar sequências de planta endógenas facilitaria aplicações numerosas tais como, por exemplo, a otimização de traços de colheita que afetam valor nutricional, rendimento, tolerância a estresse, resistência à patogenia, qualidade de óleo e resistência a agroquímicos e/ou a adaptação de plantas para uso como fábricas biológicas para a produção de compostos farmacêuticos ou químicos industriais.
[003] Proteínas de dedo de zinco engenheiradas (ZFPs) têm sido usadas vantajosamente para modular seletivamente expressão de gene e para alteração-alvo de sequências de gene em plantas (vide, por exemplo, Patentes U.S. N°s 7.262.054, 7.235.354, 7.220.719, 7.001.768, e 6.534.261; e N° de Série U.S. 60/874.,911). Proteínas de dedo de zinco (ZFPs) são proteínas que se ligam a DNA, RNA e/ou proteína, em uma maneira específica de sequência, em virtude de um domínio estabilizado de metal conhecido como um dedo de zinco. Vide, por exemplo, Miller et al. (1985) EMBO J. 4:1609-1614; Rhodes et al. (1993) Sci. Amer. 268(2):56-65; e Klug (1999) J. Mol. Biol. 293:215218. ZFPs são comumente encontradas em fatores de transcrição, e até aqui, mais de 10.000 sequências de dedo de zinco foram identificadas em vários milhares de fatores conhecidos ou de transcrição putativos.
[004] A regulação e alteração de alvos de gene selecionados podem teoricamente ser alcançadas pelo desenho de ZFPs de especificidade de sequência de DNA predeterminada tendo atividades biológicas desejadas. Os domínios de dedo de zinco foram combinados, por exemplo, em proteínas de fusão com domínios regulatórios para produzir fatores de transcrição de dedo de zinco engenheiradas para controle de regulação de gene (vide, por exemplo, Patente U.S. N° 6.534.261). Domínios de dedo de zinco têm também sido combinados com domínios de clivagem de nuclease para produzir nucleases de dedo de zinco (ZFNs) para alvo específico de um breque de fita dupla para a região de um genoma onde modificação (por exemplo, deleção, mutação, recombinação homóloga, ou inserção de uma sequência exógena) é desejado (vide, por exemplo, Publicação de Pedido de Patente U.S. Nos 2007/0134796 e 2005/0064474). ZFPs engenheiradas facilitam grandemente a inserção de sequências exógenas ou modificação de sequências endógenas em locais-alvo específicos em plantas e proporcionam alteração-alvo de genomas de planta com eficiências maiores do que métodos convencionais (vide, por exemplo, Patentes U.S. Nos 7.262.054, 7.235.354, 7.220.719, 7.001.768, e 6.534.261).
[005] Contudo, duplicação de genoma é comum em plantas e permanece uma necessidade para composições e métodos para alteração-alvo de tais genes paralogos, em genomas de planta e modulação de expressão de genes paralogos em plantas.
SUMÁRIO
[006] A presente descrição proporciona composições e métodos para modulação de expressão e para alteração-alvo de um ou mais genes paralogos (por exemplo, genes de EPSPS) em célula de plantas. As células de planta podem ser de espécie de planta monocotile- dônea (monocotiledôneas) ou dicotiledônea (dicotiledôneas) e também incluem células cultivadas, células em uma planta em qualquer estágio de desenvolvimento, e células de planta que foram removidas de uma planta completa e cujas células (ou seus descendentes) serão retornadas para a planta. As células de planta podem conter uma ou mais sequências de gene homólogas ou paralogas, qualquer número das quais ou todas das quais podem ser direcionadas à modificação pelos métodos aqui descritos.
[007] Em um aspecto, aqui descrita é uma proteína de dedo de zinco (ZFP) que se liga a uma região genômica-alvo de EPSPS de interesse, no qual a ZFP compreende um ou mais domínios de ligação de dedo de zinco engenheirada. Em certas concretizações, os domí- nios de ligação de dedo de zinco compreendem uma sequência conforme mostrada na tabela A. Em certas concretizações, o gene de EPSPS direcionado pela ZFP compreende uma sequência de nucleo- tídeo selecionada a partir do grupo consistindo em SEQ ID NOS:10-14 ou uma sequência tendo pelo menos cerca de 80-100% de identidade de sequência, incluindo qualquer percentagem de identidade dentro destas faixas, tais como 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99% de identidade de sequência. Em certas concretizações, a ZFP é uma proteína de fusão compreendendo um ou mais domínios regulatórios. Em uma concretização, um ou mais domínios regulatórios são selecionados a partir do grupo consistindo em um repressor transcricional, uma endonuclease, uma metil transferase, uma histona desacetilase, um ativador transcricional, e uma his- tona acetiltransferase. Em uma concretização, a ZFP se liga a uma sequência-alvo do gene de EPSPS, no qual expressão de EPSPS é aumentada ou diminuída. Em uma concretização, a ZFP se liga a uma sequência regulatória transcricional do gene de EPSPS. Em outra concretização, a ZFP se liga a montante de um local de iniciação de transcrição do gene de EPSPS. Em outra concretização, a ZFP se liga adjacente a um local de iniciação de transcrição do gene de EPSPS. Em outra concretização, a ZFP se liga a jusante de um local de iniciação de transcrição do gene de EPSPS. Em uma concretização, a ZFP se liga adjacente a um local de pausa de RNA polimerase a jusante de um local de iniciação de transcrição do gene de EPSPS.
[008] Em uma concretização, a ZFP é uma nuclease de dedo de zinco (ZFN) que cliva uma região genômica-alvo de EPSPS de interesse, no qual a ZFN compreende um ou mais domínios de ligação de dedo de zinco engenheirada e um domínio de clivagem de nuclease. Em certas concretizações, a ZFN compreende um polipeptídeo de fusão compreendendo um domínio de ligação de dedo de zinco enge- nheirada tendo especificidade par uma sequência de gene de EPSPS e um domínio de clivagem, e/ou um ou mais polipeptídeos de fusão compreendendo um domínio de ligação de dedo de zinco engenheira- da e um meio-domínio de clivagem. Em certas concretizações, os domínios de ligação de dedo de zinco compreendem uma sequência selecionada a partir do grupo consistindo em proteínas de dedo de zinco compreendendo os domínios de reconhecimento mostrados na tabela A. Domínios de clivagem e meio-domínios de clivagem podem ser obtidos, por exemplo, de várias endonucleases de restrição e/ou endonucleases autodirecionais. Em uma concretização, os meio-domínios de clivagem são derivados de uma endonuclease de restrição Tipo IIS (por exemplo, Fok I). A ZFN pode especificamente clivar uma sequência de gene de EPSPS particular. Alternativamente, a ZFN pode clivar duas ou mais sequências de gene de EPSPS homólogas, que podem incluir sequências de gene paraloga ou ortóloga de EPSPS.
[009] Em certas concretizações, o gene de EPSPS direcionado pela ZFN compreende uma sequência de nucleotídeo selecionada a partir do grupo consistindo em SEQ ID NOS:10-14 ou uma sequência tendo pelo menos cerca de 80-100% de identidade de sequência, incluindo qualquer percentagem de identidade dentro destas faixas, tais como 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99% de identidade de sequência.
[0010] A ZFN pode se ligar a e/ou clivar um gene de EPSPS dentro da região de codificação do gene ou em uma sequência de não- codificação dentro de ou adjacente ao gene, tais como, por exemplo, uma sequência condutora, uma sequência de reboque ou íntron, ou dentro de uma região não-transcrita, ou à montante ou à jusante da região de codificação . Em certas concretizações, a ZFN se liga a e/ou cliva uma sequência de codificação ou uma sequência regulatória do gene de EPSPS. Em certas concretizações, a ZFN se liga a e cliva um gene de EPSPS dentro de uma região consistindo em uma sequência de nucleotídeo selecionada a partir do grupo consistindo em SEQ ID NOS:10-14.
[0011] Em outro aspecto, aqui descritas são composições compreendendo uma ou mais ZFPs, que podem incluir uma ou mais ZFNs. Células de planta podem conter um gene de EPSPS único ou genes de EPSPS paralogos múltiplos. Desse modo, composições podem compreender uma ou mais ZFPs que direcionam um ou mais genes de EPSPS em uma célula de planta, por exemplo, 1, 2, 3, 4, 5, ou até qualquer número de paralogos de EPSPS ou todos os paralogos de EPSPS presentes em uma célula de planta. Em uma concretização, a composição compreende uma ou mais ZFPs que direcionam todos os genes paralogos de EPSPS em uma célula de planta. Em outra con-cretização, a composição compreende uma ZFP que especificamente direciona um gene paralogo de EPSPS particular em uma célula de planta. Por exemplo, a composição pode compreender uma ZFN que se liga especificamente a e cliva um gene paralogo de EPSPS particular em uma célula de planta, ou ZFNs múltiplas que se ligam a e clivam dois ou mais genes paralogos de EPSPS em uma célula de planta. Adicionalmente, composições podem conter ZFPs de não-nuclease que alteram regulação transcricional de um ou mais genes paralogos de EPSPS.
[0012] Em outro aspecto, aqui descrito é um polinucleotídeo que codifica uma ou mais ZFPs aqui descritas. Em uma concretização, o polinucleotídeo codifica pelo menos uma ZFN. Polinucleotídeos exemplares compreendem uma sequência de nucleotídeo que codifica qualquer das proteínas de dedo de zinco conforme mostrado na tabela A.
[0013] Em outro aspecto, aqui descrito é um vetor de expressão de ZFP compreendendo um polinucleotídeo, que codifica uma ou mais ZFPs aqui descritas, operavelmente ligado a um promotor. Em uma concretização, uma ou mais das ZFPS são ZFNs.
[0014] Em outro aspecto, aqui descrita é uma célula hospedeira de planta compreendendo um ou mais vetores de expressão de ZFP. A célula hospedeira de planta pode ser estavelmente transformada ou transientemente transfectada ou uma combinação destas com um ou mais vetores de expressão de ZFP. Em uma concretização, o um ou mais vetores de expressão de ZFP expressam uma ou mais ZFNs na célula hospedeira de planta.
[0015] Em outro aspecto, aqui descrito é um método para clivagem de uma ou mais genes paralogos em uma célula de planta, o método compreendendo: (a) introduzir, na célula de planta, um ou mais vetores de expressão que codificam uma ou mais ZFNs que se ligam a um local-alvo nos um ou mais genes paralogos sob condições tais que o(s) ZFN(s) é (são) expressos e o um ou mais genes paralogos são clivados. Em certas concretizações, o local-alvo está em um gene de EPSPS. Em uma concretização, um gene paralogo de EPSPS particular em uma célula de planta é clivado. Em outra concretização, mais do que um paralogo de EPSPS é clivado, por exemplo, 2, 3, 4, 5, ou até qualquer número de paralogos de EPSPS ou todos os paralogos de EPSPS presentes em uma célula de planta são clivados.
[0016] Em outro aspecto, aqui descrito é um vetor doador compreendendo primeira e segunda sequências de DNA, no qual (i) a primeira sequência é homóloga a uma terceira sequência e a segunda sequência é homóloga a uma quarta sequência; e (ii) as terceira e quarta sequências são sequências de DNA cromossomal. Em certas concretizações, as bordas próximas de terceira e quarta sequências são separadas por pelo menos 1 par de nucleotídeos. Em uma concretização, as terceira e quarta sequências são sequências endógenas. Em outra concretização, as terceira e quarta sequências são sequências exóge- nas. Em qualquer dos vetores doadores, as sequências de DNA cro- mossomal-alvo podem ser sequências de EPSPS. Em certas concretizações, as sequências de DNA de EPSPS cromossomais pertencem a um gene de EPSPS compreendendo uma sequência de nucleotídeo selecionada a partir do grupo consistindo em SEQ ID NOS:10-14, ou uma sequência tendo pelo menos cerca de 80-100% de identidade de sequência, incluindo qualquer percentagem de identidade dentro destas faixas, tais como 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99% de identidade de sequência.
[0017] Em certas concretizações, pelo menos uma das primeira ou segunda sequências no vetor doador tem um comprimento de 100 nu- cleotídeos ou menos. Em adição, qualquer dos vetores aqui descritos pode adicionalmente compreender uma quinta sequência, em que a quinta sequência: (a) é interposta entre as primeira e segunda sequências; e (b) é uma sequência exógena. Em certas concretizações, a quinta sequência tem um tamanho de pelo menos 1 par base, mas pode ser maior do 22 kilobases de pares ou mais.
[0018] Os vetores doadores (por exemplo, a quinta sequência) pode também compreender sequências que codificam uma proteína ou porções de uma proteína. Em certas concretizações, a sequência que codifica proteína codifica um marcador selecionável (por exemplo, proteína fluorescente verde (GFP), β-glucuronidase (GUS), fosfinotricina N-acetil transferase (PAT, BAR), neomicina fosfotransferase, higromi- cin fosfotransferase, β-lactamase, catecol dioxigenase, α-amilase, tiro- sinase, β-galactosidase, luciferase, aequorina, EPSP sintase, nitrilase, acetolactato sintase (ALS), di-hidrofolato reductase (DHFR), dalapon dehalogenase e antranilato sintase). Em outras concretizações, a sequência que codifica proteína (por exemplo, a quinta sequência) codifica uma proteína ou porção de proteína, por exemplo, uma sequência que é homóloga às sequências cromossomais.
[0019] Em ainda outras concretizações, os vetores doadores (por exemplo, a quinta sequência) compreendem uma ou mais sequências regulatórias transcricionais. Por exemplo, um vetor doador pode compreender uma ou mais sequências regulatórias transcricionais que aumentam ou diminuem expressão do gene paralogo exemplo, EPSPS). Em certas concretizações, o vetor doador compreende uma ou mais sequências de direcionamento de proteína que aumentam ou diminuem transporte de proteína.
[0020] Em ainda outras concretizações, os vetores doadores (por exemplo, quinta sequência) podem compreender uma contraparte do tipo selvagem de uma sequência cromossomal mutante (por exemplo, EPSPS) ou, alternativamente, uma contraparte mutante de uma sequência cromossomal tipo selvagem (por exemplo, EPSPS). Em certas concretizações, a sequência cromossomal mutante compreende uma ou mais mutações selecionadas a partir do grupo consistindo em uma mutação de ponto, uma substituição, uma deleção, e uma inserção. Em uma concretização, o vetor doador compreende uma sequência cromossomal de EPSPS mutante que aumenta a tolerância de uma planta ao glifosato de herbicida.
[0021] Em qualquer dos vetores doadores aqui descritos, a primeira sequência pode ter pelo menos 35% de homologia à terceira sequência. Similarmente, em qualquer dos vetores aqui descritos, a segunda sequência pode ter pelo menos 35% de homologia à quarta sequência. Em algumas concretizações, a primeira sequência tem pelo menos 35% a 50%, pelo menos 50% a 70%, pelo menos 70% a 80%, pelo menos 80% a 85%, pelo menos 85% a 90%, pelo menos 90% a 95%, pelo menos 95%, 96%, 97%, 98%, 99% ou 100% de homologia à terceira sequência. Em algumas concretizações, a segunda sequência tem pelo menos 35% a 50%, pelo menos 50% a 70%, pelo menos 70% a 80%, pelo menos 80% a 85%, pelo menos 85% a 90%, pelo menos 90% a 95%, pelo menos 95%, 96%, 97%, 98%, 99% ou 100% de homologia à quarta sequência.
[0022] Em ainda outro aspecto, aqui descrito é um método para introduzir uma sequência exógena no genoma de uma célula de planta, o método compreendendo as etapas de: (a) contactar a célula com qualquer dos vetores doadores aqui descritos; e (b) expressar uma ou mais nucleases de dedo de zinco na célula, no qual a uma ou mais nucleases de dedo de zinco clivam DNA cromossomal dentro de entre 0,4 e 3 quilobase de pares de ou das terceira ou quarta sequências; tal que clivagem de DNA cromossomal na etapa (b) estimula incorporação do vetor doador no genoma por recombinação homóloga. Em certas concretizações, a uma ou mais nucleases são fusões entre o domínio de clivagem de uma endonuclease de restrição Tipo IIS e um domínio de ligação de dedo de zinco engenheirada.
[0023] Em certas concretizações, as nucleases de dedo de zinco clivam um gene de EPSPS compreendendo uma sequência de nucleo- tídeo selecionada a partir do grupo consistindo em SEQ ID NOS:10-14 ou uma sequência tendo pelo menos cerca de 80-100% de identidade de sequência, incluindo qualquer percentagem de identidade dentro destas faixas, tais como 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99% de identidade de sequência.
[0024] Em outro aspecto, aqui descrito é um método para expressar o produto de uma sequência de ácido nucleico exógena em uma célula de planta, o método compreendendo as etapas de: (a) contactar a célula com um vetor doador compreendendo uma sequência de ácido nucleico exógena; e (b) expressar uma nuclease de dedo de zinco (ZFN) na célula, no qual a ZFN cliva um ou mais gene paralogos (por exemplo, um ou mais genes de EPSPS) em DNA cromossomal dentro de 3 quilobase de pares de ou das terceira ou quarta sequências. A clivagem do DNA cromossomal na etapa (b) resulta na incorporação do vetor doador no genoma por recombinação homóloga e expressão do produto da sequência de ácido nucleico exógena.
[0025] Em certas concretizações, a nuclease de dedo de zinco cliva um gene de EPSPS compreendendo uma sequência de nucleotí- deo selecionada a partir do grupo consistindo em SEQ ID NOS:10-14, ou uma sequência tendo pelo menos cerca de 80-100% de identidade de sequência, incluindo qualquer percentagem de identidade dentro destas faixas, tais como 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99% de identidade de sequência.
[0026] Em outro aspecto, aqui descrito é um método para recom- binação homóloga intramolecular no genoma de uma célula de planta, o método compreendendo as etapas de: (a) proporcionar um segmento de DNA compreendendo uma sequência de um gene-alvo e adicionalmente compreendendo uma primeira sequência que é homóloga a uma segunda sequência; e (b) contactar referido segmento de DNA com a ZFN conforme aqui descrito, no qual a ZFN cliva o segmento de DNA em uma sequência de gene-alvo estimulando, desse modo, re- combinação homóloga intramolecular. Em certas concretizações, o segmento de DNA é endógeno à célula. Em outras concretizações, o segmento de DNA é exógeno à célula. Em certas concretizações, o gene-alvo é único à célula. Em outras concretizações, o gene-alvo é um gene paralogo. Em qualquer destes métodos o gene-alvo pode compreender um gene de EPSPS único e paralogo e a ZFN compreende qualquer das sequências mostradas na tabela A. Em certas concretizações, recombinação homóloga pode ocorrer em um cromossomo. Em uma concretização, o DNA entre as primeira e segunda sequências é deletado dos cromossomos. Em uma concretização, as sequências deletadas do cromossomo podem codificar toda ou parte do gene-alvo. Em outra concretização, as sequências deletadas do cromossomo podem codificar todo ou parte de um marcador selecionável, por exemplo, proteína fluorescente verde (GFP), β-glucuronidase (GUS), fosfinotricina N-acetil transferase (PAT, BAR), neomicina fosfo- transferase, higromicin fosfotransferase, β-lactamase, catecol dioxige- nase, α-amilase, tiyrosinase, β-galactosidase, luciferase, aequorina, EPSP sintase, nitrilase, acetolactato sintase (ALS), di-hidrofolato reductase (DHFR), dalapon dehalogenase e antranilato sintase.
[0027] Em certas concretizações, o DNA deletado é substituído por uma sequência exógena, o método adicionalmente compreendendo introduzir um polinucleotídeo na célula, no qual o polinucleotídeo compreende (i) quarta e quinta sequências, no qual a quarta sequência é homóloga a sequências não-deletadas em proximidade à primeira sequência e a quinta sequência é homóloga às sequências não- deletadas em proximidade à segunda sequência; e (ii) a sequência exógena.
[0028] Em certas concretizações, o DNA deletado é substituído por uma sequência de gene, que pode compreender uma contraparte mutante de uma sequência de gene do tipo selvagem. Em certas concretizações, a sequência de gene mutante compreende uma ou mais mutações selecionadas a partir do grupo consistindo em uma mutação de ponto, uma substituição, uma deleção, e uma inserção. Em uma concretização, o DNA deletado é substituído por uma sequência de gene de EPSPS, por exemplo, uma sequência de gene de EPSPS compreende uma mutação que aumenta a tolerância de uma planta ao glifosato de herbicida.
[0029] Em outra concretização, a sequência exógena pode ser um marcador selecionável, por exemplo, proteína fluorescente verde (GFP), β-glucuronidase (GUS), fosfinothricina N-acetil transferase (PAT, BAR), neomicina fosfotransferase, higromicin fosfotransferase, β-lactamase, catecol dioxigenase, α-amilase, tirosinase, β- galactosidase, luciferase, aequorina, EPSP sintase, nitrilase, acetolac- tato sintase (ALS), di-hidrofolato reductase (DHFR), dalapon dehalo- genase e antranilato sintase.
[0030] Em outra concretização, aqui descrito é um método para deletar uma sequência de gene a partir do genoma de uma célula de planta, o método compreendendo (a) proporcionar uma célula de planta compreendendo uma sequência de gene; e (b) expressar primeira e segunda nucleases de dedo de zinco (ZFNs) na célula, no qual a primeira ZFN cliva em um primeiro local de clivagem e a segunda ZFN cliva em um segundo local de clivagem, no qual a sequência de gene está localizada entre o primeiro local de clivagem e o segundo local de clivagem, no qual clivagem dos primeiro e segundo locais de clivagem resulta na deleção da sequência de gene. Em certas concretizações, a sequência de gene é um gene de EPSPS. O tamanho da deleção na sequência de gene é determinado pela distância entre os primeiro e segundo locais de clivagem. Consequentemente, deleções de qualquer tamanho, em qualquer região genômica de interesse podem ser obtidas. Deleções de 25, 50, 100, 200, 300, 400, 500, 600, 700, 800, 900, 1,000 pares de nucleotídeos, ou qualquer valor integral de pares de nucleotídeo dentro desta faixa, podem ser obtidos. Em adição, de- leções de uma sequência de qualquer valor integral de pares de nu- cleotídeos maior do que 1.000 pares de nucleotídeo podem ser obtidas usando os métodos e composições aqui descritos. Em uma concretização, os primeiro e segundo locais de clivagem são separados por pelo menos 100 nucleotídeos. Em uma concretização, um gene total (por exemplo, EPSPS) é deletado. Em outra concretização, uma porção de um gene (por exemplo, EPSPS) é deletado. Em uma concretização, a sequência de gene (por exemplo, sequência de gene de EPSPS) é deletada de uma célula de planta transgênica. A sequência de gene (por exemplo, EPSPS) pode ser uma sequência endógena ou uma sequência exógena.
[0031] Em outro aspecto, aqui descrito é um método para modulação da regulação de um gene de planta gene, o método compreendendo (a) proporcionar uma célula de planta compreendendo uma sequência de gene-alvo; e (b) expressar uma ZFP na célula, no qual a ZFP se liga a uma sequência regulatória do gene-alvo, modulando, desse modo, a regulação do gene-alvo. Em certas concretizações, a sequência de gene é um gene de EPSPS. A ligação da ZFP à sequência regulatória pode aumentar ou diminuir a transcrição do gene-alvo (por exemplo, EPSPS). Em certas concretizações, a ZFP também aumenta ou diminui a tolerância de uma planta ao glifosato de herbicida.
[0032] Em um ainda outro aspecto, a célula de planta transgênica obtida de acordo com qualquer dos métodos aqui descritos é também provida.
[0033] Em outro aspecto, aqui provida é uma planta compreendendo uma célula de planta transgênica obtida conforme aqui descrito.
[0034] Em qualquer dos métodos aqui descritos, a modificação das sequências de gene de planta alvo (por exemplo, sequências re- gulatórias transcricionais ou sequências que codificam EPSPS) pode ser usada para aumentar ou diminuir a tolerância de uma planta ao glifosato de herbicida.
[0035] Desse modo, a presente descrição envolve, mas não é limitada a, as seguintes concretizações numeradas:
[0036] 1. uma proteína de dedo de zinco (ZFP) que se liga a uma região genômica-alvo de EPSPS de interesse, referida ZFP compreendendo um ou mais domínios de ligação de dedo de zinco engenhei- rada.
[0037] 2. a ZFP da concretização 1, em que a região genômica- alvo está na célula de uma planta dicotiledônea.
[0038] 3. a ZFP da concretização 2, em que a região genômica- alvo está em uma célula de uma planta de canola.
[0039] 4. a ZFP da concretização 2, em que a região genômica- alvo está em uma célula de planta Brassica.
[0040] 5. a ZFP da concretização 1, em que a região genômica- alvo de EPSPS de interesse pertence a um gene de EPSPS compreendendo uma sequência de nucleotídeo selecionada a partir do grupo consistindo em SEQ ID NOS:10-14 ou uma sequência pelo menos 95% idêntica.
[0041] 6. a ZFP da concretização 1, em que a ZFP é uma proteína de fusão compreendendo um ou mais domínios funcionais.
[0042] 7. a ZFP da concretização 6, compreendendo um ou mais domínios funcionais selecionados a partir do grupo consistindo em um repressor transcricional, uma endonuclease, uma metil transferase, uma histona desacetilase, um ativador transcricional, e uma histona acetiltransferase.
[0043] 8. a ZFP de qualquer das concretizações 1-7, em que a ZFP se liga a uma sequência regulatória transcricional do gene de EPSPS.
[0044] 9. a ZFP de qualquer das concretizações 1-7, em que a ZFP se liga a montante de um local de iniciação de transcrição do gene de EPSPS.
[0045] 10. a ZFP de qualquer das concretizações 1-7, em que a ZFP se liga adjacente a um local de iniciação de transcrição do gene de EPSPS.
[0046] 11. a ZFP de qualquer das concretizações 1-10, em que a ZFP aumenta a transcrição do gene de EPSPS.
[0047] 12. a ZFP de qualquer das concretizações 1-10, em que a ZFP diminui a transcrição do gene de EPSPS.
[0048] 13. a ZFP da concretização 1, em que a ZFP é uma nu clease de dedo de zinco (ZFN) que cliva a região genômica-alvo de EPSPS de interesse, referida ZFN compreendendo um ou mais domí- nios de ligação de dedo de zinco engenheirada e um domínio de clivagem de nuclease.
[0049] 14. a ZFN da concretização 13, em que o domínio de cliva gem compreende dois meio-domínios de clivagem.
[0050] 15. a ZFN da concretização 14 no qual os meio-domínios de clivagem são derivados da mesma nuclease.
[0051] 16. a ZFN da concretização 15, em que os meios domínios de clivagem são derivados de um endonuclease de restrição Tipo IIS.
[0052] 17. a ZFN da concretização 16, em que a endonuclease de restrição Tipo IIS é Fok I.
[0053] 18. a ZFN da concretização 13, em que a região genômica- alvo de EPSPS de interesse pertence a um gene de EPSPS compreendendo uma sequência de nucleotídeo selecionada a partir do grupo consistindo em SEQ ID NOS:10-14, ou uma sequência pelo menos 95% idêntica.
[0054] 19. a ZFN da concretização 13, em que a ZFN se liga a uma sequência na região de codificação de um gene de EPSPS.
[0055] 20. a ZFN da concretização 13, em que a ZFN se liga a uma sequência na região de não-codificação de um gene de EPSPS.
[0056] 21. a ZFN da concretização 20, em que a ZFN se liga a uma sequência regulatória do gene de EPSPS.
[0057] 22. a ZFN da concretização 13, em que a ZFN cliva um ou mais paralogos de EPSPS ou sequências de gene ortólogas.
[0058] 23. a ZFN da concretização 13, em que a ZFN cliva especi ficamente um paralogo de EPSPS ou sequência de gene ortóloga.
[0059] 24 .a ZFN da concretização 13 compreendendo um domínio de ligação de dedo de zinco compreendendo uma sequência conforme mostrada na tabela A.
[0060] 25. a ZFN da concretização 13, em que a ZFN se liga a e cliva um gene de EPSPS dentro de uma região consistindo em uma sequência de nucleotídeo selecionada a partir do grupo consistindo em SEQ ID NOS:10-14.
[0061] 26. a ZFN da concretização 13, em que a ZFN compreen de:
[0062] (a) uma primeira proteína de fusão compreendendo um primeiro domínio de ligação de dedo de zinco e um primeiro meio- domínio de clivagem, em que o primeiro domínio de ligação de dedo de zinco se liga a uma primeira sequência de nucleotídeo; e
[0063] (b) uma segunda proteína de fusão compreendendo um se gundo domínio de ligação de dedo de zinco e um segundo meio- domínio de clivagem, em que o segundo domínio de ligação de dedo de zinco se liga a uma segunda sequência de nucleotídeo.
[0064] 27. A ZFN da concretização 26, em que a segunda sequên cia de nucleotídeo está localizada entre 2 e 50 nucleotídeos da primeira sequência de nucleotídeo.
[0065] 28. A ZFN da concretização 26, em que clivagem ocorre entre as primeira e segunda sequências de nucleotídeo.
[0066] 29. A composição compreendendo uma ou mais proteínas de dedo de zinco (ZFPs) de acordo com qualquer das concretizações 1-28.
[0067] 30. A composição da concretização 29, em que uma ou mais das ZFPs são nucleases de dedo de zinco (ZFNs).
[0068] 31. A composição da concretização 29, compreendendo uma ou mais ZFPs que tem como alvo um ou mais genes de EPSPS em uma célula de planta.
[0069] 32. A composição da concretização 29, compreendendo duas ou mais ZFPs que em combinação tem como alvo todos os genes paralogos de EPSPS em uma célula de planta.
[0070] 33. A composição da concretização 30, compreendendo uma ZFN que se liga especificamente a e cliva um gene paralogo de EPSPS em uma célula de planta.
[0071] 34. A composição da concretização 30, compreendendo duas ou mais ZFNs que se ligam a e clivam dois ou mais genes paralogos de EPSPS em uma célula de planta.
[0072] 35. A composição da concretização 30, compreendendo uma ou mais ZFNs que se ligam a e clivam todos os genes paralogos de EPSPS em uma célula de planta.
[0073] 36. Um polinucleotídeo que codifica uma ou mais proteínas de dedo de zinco (ZFPs) de acordo com qualquer das concretizações 1 a 28.
[0074] 37. O polinucleotídeo da concretização 36 compreendendo uma sequência de nucleotídeo que codifica uma proteína de dedo de zinco conforme mostrada na tabela A.
[0075] 38. Um vetor de expressão de ZFP compreendendo o poli- nucleotídeo de qualquer das concretizações 36 ou 37 operavelmente ligado a um promotor.
[0076] 39. Uma célula hospedeira de planta compreendendo um ou mais vetores de expressão de ZFP de acordo com a concretização 38.
[0077] 40. A célula hospedeira de planta da concretização 39, em que a célula é estavelmente transfectada com um ou mais vetores de expressão de ZFP.
[0078] 41. A célula hospedeira de planta da concretização 39, em que a célula é transientemente transfectada com um ou mais vetores de expressão de ZFP.
[0079] 42. Um método para clivar um ou mais genes de EPSPS em uma célula de planta, o método compreendendo:
[0080] (a) transfectar a célula de planta com um ou mais vetores de expressão de ZFP que codifica uma ou mais ZFNs de acordo com a concretização 10; e
[0081] (b) expressar as uma ou mais ZFNs na célula, em que as ZFNs clivam um ou mais genes de EPSPS.
[0082] 43. O método da concretização 42, em que pelo menos um vetor de expressão de ZFP é estavelmente transfectado na célula de planta.
[0083] 44. O método da concretização 42, em que pelo menos um vetor de expressão de ZFP é transientemente transfectado na célula de planta.
[0084] 45. O método das concretizações 42-44 no qual pelo me nos dois vetores de expressão de ZFP são transfectados na célula.
[0085] 46. O método da concretização 45, em que os pelo menos dois vetores de expressão de ZFP são cotransfectados na célula.
[0086] 47. O método da concretização 45, em que os pelo menos dois vetores de expressão de ZFP são transfectados sequencialmente na célula.
[0087] 48. O método de qualquer das concretizações 42 a 47, em que todos os genes paralogos de EPSPS na célula de planta são clivados.
[0088] 49. O método de qualquer das concretizações 42 a 47, em que um gene paralogo de EPSPS na célula de planta é clivado.
[0089] 50. O método de qualquer das concretizações 42 a 47, em que pelo menos dois genes paralogos de EPSPS na célula de planta são clivados.
[0090] 51. Um vetor doador compreendendo primeira e segunda sequências de DNA;
[0091] no qual a primeira sequência é homóloga a uma terceira sequência e a segunda sequência é homóloga a uma quarta sequência; e
[0092] no qual as terceira e quarta sequências são sequências de DNA de EPSPS cromossomais.
[0093] 52. O vetor doador da concretização 51, em que as bordas próximas das terceira e quarta sequências são contíguas.
[0094] 53. O vetor doador da concretização 51, em que as bordas próximas das terceira e quarta sequências são separadas por pelo menos 1 par de nucleotídeos.
[0095] 54. O vetor de qualquer das concretizações concretização 51 a 53, em que as sequências de DNA de EPSPS cromossomais pertencem a um gene de EPSPS compreendendo uma sequência de nu- cleotídeo selecionada a partir do grupo consistindo em SEQ ID NOS:10-14, ou uma sequência pelo menos 95% idêntica.
[0096] 55. O vetor de qualquer das concretizações 51 a 54, em que as terceira e quarta sequências são sequências exógenas.
[0097] 56. O vetor de qualquer das concretizações 51 a 54, em que as terceira e quarta sequências são sequências endógenas.
[0098] 57. O vetor de qualquer das concretizações 51 a 56, em que pelo menos uma das primeira ou segunda sequências tem um comprimento de 100 nucleotídeos ou menos.
[0099] 58. O vetor de qualquer das concretizações 51 a 57, com preendendo adicionalmente uma quinta sequência, em que a quinta sequência:
[00100] (a) é interposta entre as primeira e segunda sequências; e
[00101] (b) é uma sequência de ácido nucleico exógena.
[00102] 59. O vetor da concretização 58, em que a quinta sequên cia tem um tamanho de pelo menos 1 par base.
[00103] 60. O vetor da concretização 58 ou 59, em que a quinta se quência compreende sequências que codificam um marcador selecio- nável.
[00104] 61. O vetor da concretização 60, em que o marcador sele- cionável é selecionado a partir do grupo consistindo em proteína fluorescente verde (GFP), β-glucuronidase (GUS), fosfinotricina N-acetil transferase (PAT, BAR), neomicina fosfotransferase, higromicin fosfo- transferase, β-lactamase, catecol dioxigenase, α-amilase, tirosinase, β- galactosidase, luciferase, aequorina, EPSP sintase, nitrilase, acetolac- tato sintase (ALS), di-hidrofolato reductase (DHFR), dalapon dehalo- genase e anthranilato sintase.
[00105] 62. O vetor da concretização 58, em que a quinta sequên cia compreende sequências que codificam uma proteína outra do que um marcador selecionável.
[00106] 63. O vetor de qualquer das concretizações 58 a 62, em que a quinta sequência compreende uma ou mais sequências regula- tórias transcricionais.
[00107] 64. O vetor de qualquer das concretizações 58 a 63, em que a quinta sequência compreende uma ou mais sequências que aumentam ou diminuem o direcionamento da proteína.
[00108] 65. O vetor da concretização 63, em que as uma ou mais sequências regulatórias transcricionais aumentam expressão de EPSPS.
[00109] 66. O vetor da concretização 63, em que as uma ou mais sequências regulatórias transcricionais diminuem expressão de EPSPS.
[00110] 67. O vetor de qualquer das concretizações 58 a 66, em que a quinta sequência compreende uma ou mais sequências que codificam uma porção de uma proteína ou um RNA de pequena interferência ou um micro RNA.
[00111] 68. O vetor da concretização 67, em que as sequências que codificam a porção da proteína compreendem sequências homólogas às sequências cromossomais de EPSPS.
[00112] 69. O vetor da concretização 58, em que a quinta sequên cia compreende uma contraparte do tipo selvagem de uma sequência cromossomal de EPSPS mutante.
[00113] 70. O vetor da concretização 58, em que a quinta sequên cia compreende uma contraparte mutante de uma sequência cromos- somal de EPSPS tipo selvagem.
[00114] 71. O vetor da concretização 70, em que a sequência cro- mossomal de EPSPS mutante aumenta a tolerância de uma planta ao glifosato de herbicida.
[00115] 72. O vetor de qualquer das concretizações 51 a 71, em que a primeira sequência tem pelo menos 35% de homologia à terceira sequência.
[00116] 73. O vetor de qualquer das concretizações 51 a 72, em que a segunda sequência tem pelo menos 35% de homologia à quarta sequência.
[00117] 74. Um método para introduzir uma sequência de ácido nu- cleico exógena no genoma de uma célula de planta, o método compreendendo as etapas de:
[00118] (a) contactar a célula com um vetor doador de acordo com qualquer das concretizações 51 a 73; e
[00119] (b) expressar uma nuclease de dedo de zinco (ZFN) na cé lula, em que a ZFN cliva um gene de EPSPS no DNA cromossomal dentro de 3 quilobase de pares de terceira ou quarta sequências;
[00120] tal que clivagem do DNA cromossomal na etapa (b) estimula incorporação do vetor doador no genoma por recombinação homóloga.
[00121] 75. O método da concretização 74, em que o gene de EPSPS compreende uma sequência de nucleotídeo selecionada a partir do grupo consistindo em SEQ ID NOS:10-14, ou uma sequência pelo menos 95% idêntica.
[00122] 76. Um método para expressar o produto de uma sequên cia de ácido nucleico exógena em uma célula de planta, o método compreendendo as etapas de:
[00123] (a) contactar a célula com o vetor doador da concretização 58-73; e
[00124] (b) expressar uma nuclease de dedo de zinco (ZFN) na cé lula, em que a ZFN cliva um gene de EPSPS no DNA cromossomal dentro de 3 quilobase de pares de ou das terceira ou quarta sequências;
[00125] tal que clivagem do DNA cromossomal na etapa (b) resulta na incorporação do vetor doador no genoma por recombinação homóloga e expressão do produto da sequência de ácido nucleico exógena.
[00126] 77. O método da concretização 76, em que o gene de EPSPS compreende uma sequência de nucleotídeo selecionada a partir do grupo consistindo em SEQ ID NOS:10-14, ou uma sequência pelo menos 95% idêntica.
[00127] 78. Uma célula de planta transgênica obtida de acordo com o método de qualquer das concretizações 74 ou 75.
[00128] 79. Uma planta compreendendo uma célula de planta transgênica de acordo com a concretização 78.
[00129] 80. Um método para recombinação homóloga intramolecu lar no genoma de uma célula de planta, o método compreendendo as etapas de:
[00130] (a) proporcionar um segmento de DNA compreendendo um gene de EPSPS e compreendendo adicionalmente uma primeira sequência que é homóloga a uma segunda sequência; e
[00131] (b) contactar referido segmento de DNA com a ZFN de qualquer das concretizações 14 a 28, em que a ZFN cliva o segmento de DNA em uma sequência de gene de EPSPS estimulando, desse modo, recombinação homóloga intramolecular.
[00132] 81. O método da concretização 80, em que o segmento de DNA é endógeno à célula.
[00133] 82. O método da concretização 80 ou 81, em que a recom- binação homóloga ocorre em um cromossomo.
[00134] 83. O método da concretização 82, em que DNA entre as primeira e segunda sequências é deletado a partir do cromossomo.
[00135] 84. O método de qualquer das concretizações 80 a 83, em que o gene de EPSPS é único no genoma.
[00136] 85. O método de qualquer das concretizações 80 a 83, em que um ou mais paralogos do gene de EPSPS estão presentes no ge- noma.
[00137] 86. O método de qualquer das concretizações 80 a 85, em que a ZFN compreende um par de proteínas de fusão, em que cada proteína de fusão é uma fusão entre o domínio de clivagem de uma endonuclease de restrição Tipo IIS e um domínio de ligação de dedo de zinco engenheirada.
[00138] 87. O método de qualquer das concretizações 80 a 86, em que a segunda sequência é pelo menos 100 pares de base da primeira sequência.
[00139] 88. O método de qualquer das concretizações 80 a 86, em que a sequência de gene de EPSPS é pelo menos 100 pares de base da primeira ou segunda sequência.
[00140] 89. O método de qualquer das concretizações 80 a 86, em que a sequência de gene de EPSPS assenta entre as primeira e segunda sequências.
[00141] 90. O método de qualquer das concretizações 80 a 89, em que uma da primeira ou segunda sequências é exógena ao organismo.
[00142] 91. O método de qualquer das concretizações 80 a 90, em que ambas da primeira e segunda sequências são exógenas ao organismo.
[00143] 92. O método da concretização 83, em que as sequências deletadas do cromossomo codificam todo ou parte de um gene de EPSPS.
[00144] 93. O método da concretização 83, em que as sequências deletadas do cromossomo codificam todo ou parte de um marcador selecionável.
[00145] 94. O método da concretização 93, em que o marcador se- lecionável é selecionado a partir do grupo consistindo em proteína flu-orescente verde (GFP), β-glucuronidase (GUS), fosfinotricina N-acetil transferase (PAT, BAR), neomicina fosfotransferase, higromicin fosfo- transferase, β-lactamase, catecol dioxigenase, α-amilase, tirosinase, β- galactosidase, luciferase, aequorina, EPSP sintase, nitrilase, acetolac- tato sintase (ALS), di-hidrofolato reductase (DHFR), dalapon dehalo- genase e antranilato sintase.
[00146] 95. O método da concretização 83, em que o DNA deletado é substituído por uma sequência exógena, o método compreendendo adicionalmente:
[00147] introduzir um polinucleotídeo na célula, em que o polinucle- otídeo compreende:
[00148] (a) quarta e quinta sequências, em que a quarta sequência é homóloga a sequências não-deletadas em proximidade à primeira sequência e a quinta sequência é homóloga às sequências não- deletadas em proximidade à segunda sequência; e
[00149] (b) a sequência exógena.
[00150] 96. O método da concretização 95, em que a sequência exógena é um marcador selecionável.
[00151] 97. O método da concretização 96, em que o marcador se- lecionável é selecionado a partir do grupo consistindo em proteína flu-orescente verde (GFP), β-glucuronidase (GUS), fosfinothricina N-acetil transferase (PAT, BAR), neomicina fosfotransferase, higromicin fosfo- transferase, β-lactamase, catecol dioxigenase, α-amilase, tirosinase, β- galactosidase, luciferase, aequorina, EPSP sintase, nitrilase, acetolac- tato sintase (ALS), di-hidrofolato reductase (DHFR), dalapon dehalo- genase e antranilato sintase.
[00152] 98. O método da concretização 95, em que a sequência exógena é uma sequência de gene de EPSPS.
[00153] 99. O método da concretização 98, em que a sequência de gene de EPSPS compreende uma mutação.
[00154] 100. O método da concretização 99, em que a mutação aumenta a tolerância de uma planta ao glifosato de herbicida.
[00155] 101. Um método para deletar uma sequência de gene de EPSPS do genoma de uma célula de planta, o método compreendendo:
[00156] (a) proporcionar uma célula de planta compreendendo uma sequência de gene de EPSPS; e
[00157] (b) expressar primeira e segunda nucleases de dedo de zinco (ZFNs) na célula, em que a primeira ZFN cliva em um primeiro local de clivagem e a segunda ZFN cliva em um segundo local de clivagem, em que a sequência de gene de EPSPS está localizada entre o primeiro local de clivagem e o segundo local de clivagem, em que clivagem dos primeiro e segundo locais de clivagem resulta na deleção da sequência de gene de EPSPS.
[00158] 102. O método da concretização 101, em que a sequência de gene de EPSPS é deletada por união terminal não-homóloga do primeiro e segundo locais de clivagem.
[00159] 103. O método da concretização 101 ou 102, em que os primeiro e segundo locais de clivagem são separados por pelo menos 100 nucleotídeos.
[00160] 104. O método da concretização 101 ou 102, em que a cé lula de planta é uma célula de planta transgênica.
[00161] 105. O método da concretização 101 ou 102, em que a se quência de gene de EPSPS é uma sequência exógena.
[00162] 106. O método da concretização 101 ou 102, em que a se- quência de gene de EPSPS é uma sequência endógena.
[00163] 107. Um método para modular regulação de um gene de EPSPS, o método compreendendo:
[00164] (a) proporcionar uma célula de planta compreendendo uma sequência de gene de EPSPS; e
[00165] (b) expressar uma ZFP na célula , em que referida ZFP se liga a um local-alvo no gene de EPSPS, modulando, desse modo, regulação do gene de EPSPS.
[00166] 108. O método da concretização 107, em que o local-alvo é uma sequência regulatória do gene de EPSPS.
[00167] 109. O método da concretização 107, em que o local-alvo está a montante de um local de iniciação de transcrição do gene de EPSPS.
[00168] 110. O método da concretização 107, em que o local-alvo é adjacente a um local de iniciação de transcrição do gene de EPSPS.
[00169] 111. O método da concretização 107, em que o local-alvo está a jusante de um local de iniciação de transcrição do gene de EPSPS.
[00170] 112. O método da concretização 107, em que a ZFP au menta transcrição do gene de EPSPS.
[00171] 113. O método da concretização 112, em que a ZFP au menta a tolerância de uma planta ao glifosato de herbicida.
[00172] 114. O método da concretização 107, em que a ZFP dimi nui a transcrição do gene de EPSPS.
[00173] 115. O método da concretização 114, em que a ZFP dimi nui a tolerância de uma planta ao glifosato de herbicida.
[00174] Estas e outras concretizações da presente descrição ocorrerão prontamente àqueles versados na técnica da descrição aqui.
BREVE DESCRIÇÃO DOS DESENHOS
[00175] Figura 1 mostra uma mancha Southern blot proporcionando uma estimativa do número de genes de EPSPS nos genomas de B. napus variedade Nex710, B. rapa e B. oleracea. (Marcadores-padrão são marcadores de faixa ampla de DNA analítico Promega).
[00176] Figuras 2A-2E mostram uma representação esquemática da estratégia de clonagem usada para gerar construções de expressão de ZFN. Uma estratégia de clonagem de etapa foi usada: Genes que codifica ZFN individual foram clonados em vetores e pVAX-C2A- NLSop2-EGFP-FokMono (figura 2A) e pVAX-N2A-NLSop2-EGFP- FokMono (figura 2B) para criar um cassete de proteína duplo (figura 2C). Este cassete foi ligado em pDAB3731 para gerar um plasmídeo final (figura 2D) para expressão do heterodímero de ZFN. O cassete de ZFN foi então transferido em um vetor binário com a tecnologia Gateway para criar uma construção (figura 2E) para transformação de Agrobacterium-mediado B. napus. ZFN d2 = 10654-CH3-v2; ZFN rb2 = 10657-CH3-v2.
[00177] Figuras 3A-3D mostram amplificação específica de paralogo de genes de EPSPS. As figuras 3A-3D representam ensaios de PCR específicos de paralogos A, B, C e D respectivamente. As raias 1-6 contêm o seguinte DNA. Raia 1: Nenhum controle de PCR de DNA; raia 2: B. napus variedade Nex710 DNA (10 ng/μl); raias 3, 4, 5 e 6 contêm DNA amplificado de paralogos D, C, B e A (1570 pb) como controles positivos a concentração de ng/μl. Produtos de PCR foram operados em um 2% E-GEL 96 (Invitrogen, Carlsbad, CA) e visualizados usando o sistema de documentação de GEL DOC 2000 gel (Bio-Rad, Hercules, CA). A imagem foi capturada e analisada usando software QUANTITY ONE (Bio-Rad, Hercules, CA) e adicionalmente processada usando-se software E-EDITOR (Invitrogen, Carlsbad, CA). Os tamanhos do fragmento são mostrados em pares de base (pb).
[00178] Figura 4 mostra a ligação e locais de clivagem de ZFNs para os paralogos de EPSPS de B. napus. Duas proteínas de ZFN são requeridas para efetuar ciclagem de fita dupla (ds) de DNA. A montante do local de clivagem, indicado com uma série descendente, uma proteína (10657 ou 10658) foi ligada a nucleotídeos conforme sublinhado, onde outra proteína (10654) ligada a jusante à sequência sublinhada conforme mostrado. Somente quando ambas as proteínas foram ligadas a seus locais respectivos clivagem ocorreu. Diferenças de sequência menores (sublinhadas) nos locais de ligação de uma ou ambas ZFNs de um par entre os paralogos 5 (conforme mostrado abaixo) proporcionaram especificidade de sequência e resultaram em clivagem de fita dupla seletiva dos paralogos.
[00179] Figura 5 mostra uma deleção mediada por ZFN no paralogo D de EPSPS. Uma deleção de 2 pb resultou a partir do reparo de união terminal não-homóloga (NHEJ) de um breque de DNA de fita dupla mediado por ZFN presente no paralogo D de EPSPS B. napus. O alvo de clivagem para o ZFN pDAB7151 foi CAGTT, que corresponde a de- leção de 2 pb GT. Fundo: sequência tipo selvagem prognosticada. Topo: alinhamento de 26 sequências de clones de paralogo D com software SEQUENCHER mostrando a deleção de 2 pb. Estas sequências foram obtidas de ambos sequenciamento de iniciador de avanço e reverso de 13 clones.
[00180] Figura 6 mostra quebras de fita dupla mediada por ZFN resultando em NHEJs em Alinhamento de paralogo D de EPSPS de B. napus de deleções de NHEJ múltiplas com relação ao local de clivagem prognosticado (topo) no DNA tipo selvagem é mostrado. Os números nos colchetes no lado direito mostram o número de moléculas idênticas observado no alinhamento.
[00181] Figura 7 mostra quebras de fita dupla mediados por ZFN resultando em NHEJs em paralogos de EPSPS C e D de B. napus. O alinhamento de deleções de NHEJ múltiplas com relação ao local de clivagem prognosticado (topo) nas amostras tipo selvagem e tratadas é mostrado. Os números de amostra correspondem àqueles mostrados na tabela 5.
[00182] Figuras 8A-8C mostram quebras de fita dupla mediados por ZFN resultando em NHEJs nos paralogos de EPSPS A e B de B. na- pus. O alinhamento de deleções de NHEJ múltiplos com relação ao local de clivagem prognosticado (topo) nas amostras tipo selvagem e transgênicas é mostrado. Os números de amostra correspondem àqueles mostrados na tabela 6.
[00183] Figura 9 (SEQ ID NO:10) mostra a sequência de nucleotí- deo de sequência de Paralogo A de EPSPS de B. napus.
[00184] Figura 10 (SEQ ID NO:11) mostra a sequência de nucleotí- deo de sequência de Paralogo B de EPSPS de B. napus.
[00185] Figuras 11A-11B (SEQ ID NO:12) mostram a sequência de nucleotídeo sequência de Paralogo C de EPSPS de B. napus.
[00186] Figuras 12A-12B (SEQ ID NO:13) mostra a sequência de nucleotídeo de sequência de Paralogo D de EPSPS de B. napus.
[00187] Figuras 13A-13C (SEQ ID NO:14) mostra a sequência de nucleotídeo de sequência de Paralogo E de EPSPS de B. napus.
[00188] Figura 14, painéis A a E são gráficos representando atividade de correção de gene de ZFNs de EPSPS exemplares(vide também Exemplo 3) em 293 células repórteres de rim. figura 14A mostra correção de gene usando par de ZFN 10654 e 10658. figura 14B mostra atividade de correção de gene de par de ZFN 10654 e 10658. figura 14C mostra atividade de correção de gene de par de ZFN 9875 e 10275. figura 14D mostra atividade de correção de gene para pares de ZFN 10740/10741 e 10749/10742. figura 14E mostra atividade de correção de gene para os pares de ZFN indicados abaixo de cada barra.
DESCRIÇÃO DETALHADA
[00189] Aqui descritos são composições e métodos úteis para modulação de expressão e clivagem-alvo e alteração de genes em plan- tas, particularmente genes de paralogos em plantas. A regulação de um gene de paralogo pode ser modulada, por exemplo, pelo uso de fatores de transcrição de ZFP ou modificação de regiões regulatórias de gene. Os genes podem ser alterados, por exemplo, por clivagem- alvo seguida por recombinação homóloga intracromossomal ou por clivagem-alvo seguida por recombinação homóloga entre um polinu- cleotídeo exógeno (compreendendo uma ou mais regiões de homolo- gia com a sequência de nucleotídeo de gene) e uma sequência genô- mica. Um exemplo não-limitativo de um gene paralogo em plantas é o gene de EPSPS.
[00190] Sequências genômicas incluem aquelas presentes nos cromossomos, epissomos, genomas organelar (por exemplo, mitocôn- dria, cloroplastos), cromossomos artificiais e qualquer outro tipo de ácido nucleico presente em uma célula tais como, por exemplo, sequências amplificadas, cromossomos duplos e os genomas de bactérias endógena ou infectantes e vírus. As sequências genômicas podem ser normais (isto é, tipo selvagem) ou mutantes; sequências mu- tantes podem compreender, por exemplo, inserções, deleções, trans- locações, rearranjos, e/ou mutações de ponto. Uma sequência genô- mica pode também compreender um de um número de alelos diferentes.
[00191] As composições aqui descritas compreendem uma ou mais ZFPs compreendendo domínios de ligação de dedo de zinco enge- nheirada, polinucleotídeos que codificam estes polipeptídeos, e combinações de ZFPs e polinucleotídeos que codificam ZFP. Um domínio de ligação de dedo de zinco pode compreender uma ou mais dedos de zinco (por exemplo, 2, 3, 4, 5, 6, 7, 8, 9 ou mais dedos de zinco), e podem ser engenheiradas para se ligarem a qualquer sequência genômi- ca de EPSPS.
[00192] ZFPs conforme aqui descrito podem ser usadas para regu lar expressão de gene de EPSPS, ou através de ativação ou repressão da transcrição de gene. ZFPs compreendendo fusões de domínios de dedo de zinco ligados a domínios regulatórios podem ser construídas para criar fatores de transcrição quiméricos que ativam ou reprimem transcrição. ZFPs podem também serem usadas para clivagem- alvo de uma região genômica de EPSPS de interesse por ligação de domínios de dedo de zinco com domínio de clivagem de nucleases (ou meio-domínios de clivagem) para produzir nucleases de dedo de zinco. Desse modo, pela identificação de uma região genômica de EPSPS de interesse em que regulação de gene, clivagem, ou recom- binação é desejado, pode-se, de acordo com métodos aqui descritos, construir uma proteína de dedo de zinco compreendendo uma ou mais proteínas de fusão compreendendo um ou mais domínios regulatórios e/ou domínios de clivagem (ou meio-domínios de clivagem) ligados a um domínio de dedo de zinco engenheirada para reconhecer uma se-quência de gene de EPSPS em naquela região genômica. A presença de tal ZFP compreendendo uma proteína de fusão (ou proteínas) em uma célula resultará na ligação da(s) proteína(s) de fusão a SUS(s) local(is) de ligação e regulação alterada ou clivagem dentro de ou próximo à região genômica. Adicionalmente, se uma região genômica de EPSPS é clivada e um polinucleotídeo homóloga exógeno àquela região genômica de EPSPS está também presente na célula, recombi- nação homóloga ocorre a uma alta taxa entre a região genômica de EPSPS e o polinucleotídeo exógeno.
[00193] Células de planta podem conter uma ou mais sequências de gene de EPSPS homólogas ou paralogos, qualquer número do qual ou todo do qual pode ser direcionado para modificação pelos métodos aqui descritos. Desse modo, composições aqui descritas podem direcionar um ou mais genes de EPSPS em uma célula de planta, por exemplo, 1, 2, 3, 4, 5, ou até qualquer número de paralogos de EPSPS ou todos os paralogos de EPSPS presentes em uma célula de planta. Algumas ZFPs podem se ligar especificamente a um gene de paralogo de EPSPS particulares em uma célula de planta. Outras ZFPs podem se ligar a genes paralogos de EPSPS múltiplos em uma célula de planta. Portanto, uma ou mais ZFPs ou vetores expressão que codificam ZFPs de especificidades diferentes podem ser combinadas para direcionar os genes de EPSPS desejados de interesse em uma planta.
Geral
[00194] A prática dos métodos, bem como preparação e uso das composições aqui descritas empregam, a menos que de outro modo indicado, técnicas convencionais em biologia molecular, bioquímica, estrutura e análise de cromatina, química computacional, cultura de célula, DNA recombinante e campos relacionados conforme estão dentro dos versados na técnica. Estas técnicas são totalmente explanadas na literatura. Vide, por exemplo, Sambrook et al. MOLECULAR CLONING: A LABORATORY MANUAL, Segunda edição, Cold Spring Harbor Laboratory Press, 1989 e Terceira edição, 2001; Ausubel et al., CURRENT PROTOCOLS IN MOLECULAR BIOLOGY, John Wiley & Sons, New York, 1987 e atualizações periódicas; a série METHODS IN ENZYMOLOGY, Academic Press, San Diego; Wolffe, CHROMATIN STRUCTURE AND FUNCTION, Terceira edição, Academic Press, San Diego, 1998; METHODS IN ENZYMOLOGY, Vol. 304, "Chromatin" (P.M. Wassarman e A. P. Wolffe, eds.), Academic Press, San Diego, 1999; e METHODS IN MOLECULAR BIOLOGY, Vol. 119, "Chromatin Protocols" (P.B. Becker, ed.) Humana Press, Totowa, 1999.
Definições
[00195] Os termos "ácido nucleico", "polinucleotídeo", e "oligonu- cleotídeo" são usados permutavelmente e refere-sem a um polímero de deoxirribonucleotídeo ou ribonucleotídeo, em conformação linear ou circular, e na forma ou de trançado única ou duplo. Para as propostas da presente descrição, estes termos não são para serem construídos como limitantes com relação ao comprimento de um polímero. Os termos podem envolver análogos conhecidos de nucleotídeos naturais, bem como nucleotídeos que são modificados na base, porções de açúcar e/ou fosfato (por exemplo, suportes de fosfotioato). Em geral, um análogo de um nucleotídeo particular tem a mesma especificidade de emparelhamento base; isto é, um análogo de A emparelhará base com T.
[00196] Os termos "polipeptídeo", "peptídeo" e "proteína" são usados permutavelmente para se referir a um polímero de resíduos de aminoácido. O termo também se aplica a polímeros de aminoácido em que um ou mais aminoácidos são análogos químicos ou derivados modificados de aminoácidos que ocorrem naturalmente.
[00197] "Ligação" refere-se a uma interação não-covalente específica de sequência entre macromoléculas (por exemplo, entre uma proteína e um ácido nucleico). Nem todos os componentes de uma interação de ligação necessita ser específica de sequência (por exemplo, contatos com resíduos de fosfato em um suporte de DNA), condide- rando-se que a interação como um todo específica de sequência. Tais interações são geralmente caracterizadas por uma constante de dissociação (Kd) de 10-6 M-1 ou inferior. "Afinidade" refere-se a resistência de ligação: afinidade de ligação aumentada estando correlacionada com uma Kd inferior.
[00198] Uma "proteína de ligação" é uma proteína que é capaz de se ligar não-covalentemente a outra molécula. Uma proteína de ligação pode se ligar a, por exemplo, uma molécula de DNA (uma proteína de ligação de DNA), uma molécula de RNA (uma proteína de ligação de RNA) e/ou uma molécula de proteína (uma proteína de ligação de proteína). No caso de uma proteína de ligação de proteína, ela pode se ligar a si própria (para formar homodímeros, homotrímeros, etc.) e/ou ela pode se ligar a uma ou mais moléculas de uma proteína diferente ou proteínas. Uma proteína de ligação pode ter mais do que um tipo de atividade de ligação. Por exemplo, proteínas de dedo de zinco têm atividade de ligação de DNA, atividade de ligação de RNA e atividade de ligação de proteína.
[00199] Uma "proteína de ligação de DNA de dedo de zinco" (ou domínio de ligação) é uma proteína, ou um domínio dentro de uma proteína maior, que se liga a DNA em uma maneira específica de sequência através de uma ou mais dedos de zinco, que são regiões de sequência de aminoácido dentro do domínio de ligação cuja estrutura é estabilizada através da coordenação de um íon de zinco. O termo proteína de ligação de DNA de dedo de zinco é frequentemente abreviado como proteína de dedo de zinco ou ZFP.
[00200] Domínios de ligação de dedo de zinco podem ser "enge- nheirados" para se ligar a uma sequência de nucleotídeo predeterminada (por exemplo, uma sequência de gene de EPSPS). Exemplos não-limitativos de métodos para engenheirar proteínas de dedo de zinco são desenho e seleção. Uma proteína de dedo de zinco designada é uma proteína que não ocorre na natureza cujo desenho/composição resulta principalmente de critérios racionais. Critérios racionais para desenho incluem aplicação de regras de substituição e algoritmos computadorizados para processamento de informação em uma informação de armazenamento de base de dados de desenhos de ZFP existentes e dados de ligação. Vide, por exemplo, Patentes U.S. 6.140.081; 6.453.242; 6.534.261; e 6.785.613; ver, também WO 98/53058; WO 98/53059; WO 98/53060; WO 02/016536 e WO 03/016496; e Patentes U.S. 6.746.838; 6.866.997; e 7.030.215. Desse modo, uma proteína de dedo de zinco "engenheirada" ou proteína de dedo de zinco que "não ocorre naturalmente" é uma em que um ou mais dos domínios de ligação de DNA de dedo de zinco de componen- te (helicoidais de reconhecimento) não estão ocorrendo naturalmente e foram engenheiradas para se ligarem a um local-alvo pré- selecionado.
[00201] Uma proteína de dedo de zinco "selecionada" é uma proteína não encontrada na natureza cuja produção resulta principalmente de um processo empírico tal como descrição de fago, armadilha de interação ou seleção de híbrido. Vide, por exemplo, US 5.789.538; US 5.925.523; US 6.007.988; US 6.013.453; US 6.200.759; US 6.733.970; US RE39,229; e WO 95/19431; WO 96/06166; WO 98/53057; WO 98/54311; WO 00/27878; WO 01/60970; WO 01/88197 e WO 02/099084.
[00202] O termo "sequência" refere-se a uma sequência de nucleo- tídeo de qualquer comprimento, que pode ser DNA ou RNA; pode ser linear, circular ou ramificada e pode ser ou de trançado única ou de fita dupla. O termo "sequência doadora" refere-se a uma sequência de nu- cleotídeo que é inserida em um genoma. Uma sequência doadora pode ser de qualquer comprimento, por exemplo, entre 2 e 25.000 nucle- otídeos de comprimento (ou qualquer valor inteiro entre estes ou acima destes), preferivelmente entre cerca de 100 e 5.000 nucleotídeos de comprimento (ou qualquer inteiro entre estes), mais preferivelmente entre cerca de 200 e 2.500 nucleotídeos de comprimento.
[00203] Uma "sequência homóloga" refere-se a uma primeira sequência que compartilha um grau de identidade de sequência com uma segunda sequência, e cuja sequência pode ser idêntica àquela da segunda sequência. Uma "sequência homóloga, não-idêntica" refere- se a uma primeira sequência que compartilha um grau de identidade de sequência com uma segunda sequência, mas cuja sequência não é idêntica àquela da segunda sequência. Por exemplo, um polinucleotí- deo compreendendo a sequência tipo selvagem de um gene mutante é homóloga e não-idêntica à sequência do gene mutante. Em certas concretizações, o grau de homologia entre as duas sequências é suficiente para permitir recombinação homóloga entre estas, utilizando mecanismos celulares normais. Duas sequências não-idênticas homólogas podem ser qualquer comprimento e seu grau de não-homologia pode ser tão pequeno quanto nucleotídeo único (por exemplo, para correção de uma mutação de ponto genômico por recombinação homóloga alvo) ou tão grande quanto 10 ou mais kilobases (por exemplo, para inserção de um gene a um local predeterminado em um cromossomo). Dois polinucleotídeos compreendendo as sequências não- idênticas homólogas não necessitam serem do mesmo comprimento. Por exemplo, um polinucleotídeo exógeno (isto é, polinucleotídeo doador) de entre 20 e 10.000 nucleotídeos ou pares de nucleotídeos podem ser usadas.
[00204] Técnicas para determinação de identidade de sequência de ácido nucleico e aminoácido são conhecidas na técnica. Tipicamente, tais técnicas incluem determinação da sequência de nucleotídeo do mRNA para um gene e/ou determinação da sequência de aminoácido codificada desse modo, e comparando-se estas sequências a um segundo nucleotídeo ou sequência de aminoácido. Sequências genômi- cas podem também ser determinadas e comparadas desse modo. Em geral, identidade refere-se a correspondência exata de nucleotídeo a nucleotídeo ou aminoácido a aminoácido de dois polinucleotídeos ou sequências de polipeptídeo, respectivamente. Duas ou mais sequências (polinucleotídeo ou aminoácido) podem ser comparadas por determinação de sua percentagem de identidade. A percentagem de identidade de duas sequências, se ácido nucleico ou sequências de aminoácido, é o número de equiparações exatas entre duas sequências alinhadas dividido pelo comprimento das sequências mais curtas, e multiplicado por 100. Um alinhamento aproximado para sequências de ácido nucleico é provido pelo algoritmo de homologia local de Smith e Waterman, Advances in Applied Mathematics 2:482-489 (1981). Este algoritmo pode ser aplicado a sequências de aminoácido pelo uso de matriz de classificação desenvolvida por Dayhoff, Atlas of Protein Sequences and Structure, M.O. Dayhoff ed., 5 suppl. 3:353-358, National Biomedical Research Foundation, Washington, D.C., USA, e normalizado por Gribskov, Nucl. Acids Res. 14(6):6745-6763 (1986). Uma implementação exemplar deste algoritmo para determinar percentagem de identidade de uma sequência é provida por Genetics Computer Group (Madison, WI) na aplicação de utilidade "BestFit". Os parâmetros de falta para este método são descritos em Wisconsin Sequence Analysis Package Program Manual, Videsão 8 (1995) (disponível de Genetics Computer Group, Madison, WI). Um método de estabelecer percentagem de identidade no contexto da presente descrição é usar o pacote MPSRCH de programas com direito reservados pela University of Edinburgh, desenvolvido por John F. Collins e Shane S. Sturrok, e distribuído por IntelliGenetics, Inc. (Mountain View, CA). A partir deste conjunto de pacotes de Smith-Waterman pode ser empregado onde parâmetros de falta são usados para a tabela de classificação (por exemplo, penalidade aberta de folga de 12, penalidade de extensão de folga de um, e uma folga de seis). A partir dos dados gerados, o valor de "Equiparação" reflete identidade de sequência. Outros programas adequados para cálculo da percentagem de identidade ou similaridade entre sequências são geralmente conhecidos na técnica, por exemplo, outro programa de alinhamento é BLAST, usado com parâmetros de falta. Por exemplo, BLASTN e BLASTP podem ser usados usando-se os seguintes parâmetros de falta: código genético = padrão; filtro = nenhum; trançado = ambos; corte = 60; espera = 10; Matriz = BLO- SUM62; Descrições = 50 sequências; classificação por = ALTA CLASSIFICAÇÃO; Base de dados = não-redundante, GenBank + EMBL + DDBJ + PDB + GenBank CDS translações + proteína Suiça+ Spupda- te + PIR. Detalhes destes programas podem ser encontrados na internet. Com relação às sequências aqui descritas, a faixa de graus desejados de identidade de sequência é aproximadamente 35% a 100% e qualquer valor inteiro entre estes. Tipicamente, a percentagem de identidades entre sequências são pelo menos 35%-40%; 40%-45%; 45%-50%; 50%-60%; 60%-70%; 70-75%, preferivelmente 80-82%, mais preferivelmente 85-90%, ainda mais preferivelmente 92%, ainda mais preferivelmente 95%, e mais preferivelmente 98% de identidade de sequência.
[00205] Alternativamente, o grau de similaridade de sequência entre polinucleotídeos pode ser determinado por hibridização de polinucleo- tídeos sob condições que permitem formação de dúplexes estáveis entre regiões homólogas, seguido por digestão com nuclease(s) específica de fita dupla, e determinação de tamanho dos fragmentos digeridos. Dois ácidos nucleicos, ou duas sequências de polipeptídeo são substancialmente homólogas entre si quando as sequências exibem pelo menos cerca de 70%-75%, preferivelmente 80%-82%, mais preferivelmente 85%-90%, ainda mais preferivelmente 92%, ainda mais preferivelmente 95%, e, mais preferivelmente 98% de identidade de sequência sobre um comprimento definido das moléculas, conforme de-terminado usando-se os métodos acima. Conforme aqui usado, subs-tancialmente homólogo também refere-se a sequências mostrando identidade completa a um DNA especificado ou sequência de polipep- tídeo. As sequências de DNA que são substancialmente homólogas podem ser identificadas em um experimento de hibridização Southern sob, por exemplo, condições estringentes, conforme definido para aquele sistema particular. A definição das condições de hibridização apropriadas está dentro da técnica do assunto. Vide, por exemplo, Sambrook et al., supra; Acid nucleic Hibridização: A Practical Approach, editors B.D. Hames e S.J. Higgins, (1985) Oxford; Washington, DC; IRL Press).
[00206] A hibridização seletiva de dois fragmentos de ácido nuclei- co pode ser determinada conforme segue. O grau de identidade de sequência entre duas moléculas de ácido nucleico afeta a eficiência e resistência de eventos de hibridização entre tais moléculas. Uma sequência de ácido nucleico parcialmente idêntica inibirá pelo menos parcialmente a hibridização de uma sequência completamente idêntica a uma molécula-alvo. A inibição de hibridização da sequência completamente idêntica pode ser avaliada usando-se ensaios de hibridização que são bem-conhecidos na técnica (por exemplo, mancha Southern blot (DNA), mancha Northern blot(RNA), hibridização de solução, ou similares, vide Sambrook, et al., Molecular Cloning: A Laboratory Manual, Segunda Edição, (1989) Cold Spring Harbor, N.Y.). Tais ensaios podem ser conduzidos usando-se graus variantes de seletividade, por exemplo, usando-se condições de baixa a alta estringência. Se condições de baixa estringência são empregadas, a ausência de ligação não-específica pode ser avaliada usando-se uma sonda secundária que carece ainda de um grau parcial de identidade de sequência (por exemplo, uma sonda tendo menos do que cerca de 30% de identidade de sequência com a molécula-alvo), tal que, na ausência de eventos de ligação não-específicos, a sonda secundária não hibridizará para o alvo.
[00207] Quando se utilize um sistema de reação baseado em hibri- dização, uma sonda de ácido nucleico é escolhida que é complementar a uma sequência de ácido nucleico de referência, e então por seleção de condições apropriadas a sonda e a sequência de referência hibridiza seletivamente, ou se ligam, entre si, para formar uma molécula dúplex. Uma molécula de ácido nucleico que é capaz de hibridizar seletivamente para uma sequência de referência sob condições de hi- bridização moderadamente estringentes tipicamente hibridiza sob con- dições que permitem detecção de uma sequência de ácido nucleico alvo de pelo menos cerca de 10-14 nucleotídeos de comprimento tendo pelo menos aproximadamente 70% de identidade de sequência com a sequência da sonda de ácido nucleico selecionada. As condições de hibridização estringentes tipicamente permitem detecção de sequências de ácido nucleico alvos de pelo menos cerca de 10-14 nu- cleotídeos de comprimento tendo uma identidade de sequência de mais do que cerca de 90-95% com a sequência da sonda de ácido nu- cleico selecionada. As condições de hibridização úteis para sequência de hibridização de sonda/referência, onde a sonda e a sequência de referência têm um grau específico de identidade de sequência, podem ser determinadas conforme é conhecido na técnica (vide, por exemplo, Acid nucleic Hibridização: A Practical Approach, editors B.D. Hames e S.J. Higgins, (1985) Oxford; Washington, DC; IRL Press).
[00208] Condições para hibridização são bem-conhecidas àqueles versados na técnica. A estringência de hibridização refere-se ao grau ao qual as condições de hibridização desfavorecem a formação de híbridos contendo nucleotídeos desequiparados, com estringência mais alta correlacionada com uma tolerância inferior para híbridos desequiparados. Os fatores que afetam a estringência de hibridização são bem-conhecidos àqueles versados na técnica e incluem, mas não estão limitados a, temperatura, pH, resistência iônica, e concentração de solventes orgânicos tais como, por exemplo, formamida e dimetilsulfó- xido. Conforme é conhecido àqueles versados na técnica, estringência de hibridização é aumentada por temperaturas mais altas, resistência iônica mais baixa e concentrações de solvente mais baixas.
[00209] Com relação às condições de estringência para hibridiza- ção, é bem-conhecido na técnica que numerosas condições equivalentes podem ser empregadas para estabelecer uma estringência particular variando-se, por exemplo, os seguintes fatores: o comprimento e natureza das sequências, composição de base das várias sequências, concentrações de sais e outros componentes de solução de hibridiza- ção, a presença ou ausência de agentes de bloqueio nas soluções de hibridização (por exemplo, sulfato de dextrano, e polietileno glicol), temperatura de reação de hibridização e parâmetros de tempo, bem como, variação das condições de lavagem. A seleção de um conjunto particular de condições de hibridização é selecionada seguindo métodos padrões na técnica (vide, por exemplo, Sambrook, et al., Molecular Cloning: A Laboratory Manual, Segunda Edition, (1989) Cold Spring Harbor, N.Y.).
[00210] "Recombinação" refere-se a um processo de troca de informação genética entre dois polinucleotídeos. Para a proposta desta descrição, "recombinação homóloga (HR)" refere-se a forma especializada de qual mudança que ocorre, por exemplo, durante reparo de quebras de fita dupla em células. Este processo requer homologia de sequência de nucleotídeo, uso de uma molécula "doadora" para reparo de modelo de uma molécula "alvo" (isto é, a molécula que experimentou a quebra de fita dupla), e é variavelmente conhecido como "conversão de gene de não-intersecção" ou "conversão de gene de trato curto", porque ela conduz a transferência de informação genética do doador para o alvo. Sem desejar estar ligado por qualquer teoria particular, tal transferência pode envolver correlação de desequiparação de DNA heteroduplex que se forma entre o alvo quebrado e o doador, e/ou "reforço de fita dependente de síntese", em que o doador é usado para ressintetizar informação genética que se tornará parte do alvo, e/ou processos relacionados. Tal HR especializado resulta em uma alteração da sequência da molécula-alvo tal que parte ou toda da sequência do polinucleotídeo doador é incorporada no polinucleotídeo alvo.
[00211] "Clivagem" refere-se a quebra do suporte covalente de uma molécula de DNA. Clivagem pode ser iniciada por uma variedade de métodos incluindo, mas não limitado a, hidrólise enzimática ou hidrólise química de uma ligação de fosfodiéster. Ambas clivagem de fita única e clivagem de fita dupla são possíveis, e clivagem de fita dupla pode ocorrer como um resultado de dois eventos de clivagem de fita única distintos. Clivagem de DNA pode resultar na produção de ou extremidades cegas ou extremidades cambaleantes. Em certas concretizações, polipeptídeos de fusão são usados para clivagem de DNA de fita dupla alvo.
[00212] Um "domínio de clivagem" compreende uma ou mais sequências de polipeptídeo que possuem atividade catalítica para clivagem de DNA. Um domínio de clivagem pode estar contido em uma cadeia de polipeptídeo simples ou atividade de clivagem pode resultar da associação de dois (ou mais) polipeptídeos.
[00213] Um "meio-domínio de clivagem" é uma sequência de poli- peptídeo, que em conjunto com um segundo polipeptídeo (ou idêntico ou diferente) forma um complexo tendo atividade de clivagem (preferivelmente atividade de clivagem de fita dupla).
[00214] "Cromatina" é a estrutura de nucleoproteína compreendendo o genoma celular. A cromatina celular compreende ácido nucleico, principalmente DNA, e proteína, incluindo histonas e proteínas cro- mossomais de não-histona. A maioria de cromatina celular eucariótica existe na forma de nucleossomas, no qual um núcleo de nucleossoma compreende aproximadamente 150 pares de base de DNA associado com um octâmero compreendendo dois cada de histonas H2A, H2B, H3 e H4; e DNA ligante DNA (de comprimento variável dependendo do organismo) se estende entre núcleos de nucleossoma. Uma molécula de histona H1 é geralmente associada com o DNA ligante. Para a proposta da presente descrição, o termo "cromatina" é significativo para envolver todos os tipos de nucleoproteína celular, ambas procariótica e eucariótica. A cromatina celular inclui ambas cromatina cromossomal e epissomal.
[00215] Um "cromossomo", é uma cromatina complexa compreendendo todo ou uma porção do genoma de uma célula. O genoma de uma célula é frequentemente caracterizado por seu cariótipo, que é a coleção de todos os cromossomos que compreendem o genoma da célula. O genoma de uma célula pode compreender um ou mais cromossomos.
[00216] Um "epissoma" é um ácido nucleico de replicação, nucleo- proteína complexa ou outra estrutura compreendendo um ácido nu- cleico que não é parte do cariótipo cromossomal de uma célula. Exemplos de epissomas incluem plasmídeos e certos genomas virais.
[00217] Uma "região acessível" é uma cromatina celular local em que um local-alvo presente no ácido nucleico pode ser ligado por uma molécula exógena que reconhece o local-alvo. Sem desejar estar ligado por qualquer teoria particular, acredita-se que uma região acessível é uma que não é acondicionada em uma estrutura nucleossomal. A estrutura distinta de uma região acessível pode frequentemente ser detectada por sua sensibilidade a sondas químicas e enzimáticas, por exemplo, nucleases.
[00218] Um "local-alvo" ou "sequência-alvo" é uma sequência de ácido nucleico que define uma porção de um ácido nucleico a qual uma molécula de ligação se ligará, provido que condições suficientes para ligação existem. Por exemplo, a sequência 5'-GAATTC-3' é um local-alvo para a endonuclease de restrição Eco RI.
[00219] Uma molécula "exógena" é uma molécula que não está normalmente presente em uma célula, mas pode ser introduzida em uma célula por um ou mais métodos genéticos, bioquímicos ou outros métodos. "Presença normal na célula" é determinada com relação ao estágio de desenvolvimento particular e condições ambientais da célu- la. Desse modo, por exemplo, uma molécula que está presente somente durante desenvolvimento embriônico de músculo é uma molécula exógena com relação a uma célula de músculo adulta. Similarmente, uma molécula induzida por choque de calor é uma molécula exógena com relação a uma célula sem choque de calor. Uma molécula exógena pode compreender, por exemplo, uma versão de funcionamento de uma molécula endógena de mal-funcionamento ou uma versão de mal-funcionamento de uma molécula endógena que funciona normalmente.
[00220] Uma molécula exógena pode ser, entre outras coisas, uma molécula pequena, tal como é gerada por um processo de química combinatorial, ou uma macromolécula tal como uma proteína, ácido nucleico, carboidrato, lipídeo, glicoproteína, lipoproteína, polissacarí- deo, qualquer derivado modificado das moléculas acima, ou qualquer complexo compreendendo uma ou mais das moléculas acima. Ácidos nucleicos incluem DNA e RNA, podem ser de trançado única ou duplo; podem ser lineares, ramificados ou circulares; e podem ser de qualquer comprimento. Ácidos nucleicos incluem aqueles capazes de formar dúplexes, bem como ácido nucleicos de formação de tríplex. Vide, por exemplo, Patentes U.S. N— 5.176.996 e 5.422.251. Proteínas incluem, mas não estão limitados a, proteínas de inibição de DNA, fatores de transcrição, fatores de remodelagem de cromatina, proteínas de ligação de DNA metilatadas, polimerases, metilases, desmetilases, acetilases, desacetilases, quinases, fosfatases, integrases, recombinases, ligases, topoisomerases, girases e helicases.
[00221] Uma molécula exógena pode ser o mesmo tipo de molécula como uma molécula endógena, por exemplo, uma proteína exógena ou ácido nucleico. Por exemplo, um ácido nucleico exógeno pode compreender um genoma viral de infecção, uma cepa-T de Agrogacte- rium tumefacians, um plasmídeo ou epissoma introduzida em uma cé- lula, ou um cromossomo que não está normalmente presente na célula. Métodos para a introdução de moléculas exógenas nas células são conhecidos àqueles versados na técnica e incluem, mas não estão limitadas a, transferência mediada por lipídeo (isto é, lipossomas, incluindo lipídeos neutros e catiônicos), eletroporação, injeção direta, fusão de célula, bombardeio de partícula, coprecipitação de fosfato de cálcio, transferência mediada por DEAE-dextrano e transferência mediada por vetor viral. A molécula exógena, molécula de não-planta, por exemplo, um anticorpo de mamífero (por exemplo, humano ou humanizado).
[00222] Por contraste, uma molécula "endógena" é uma que está normalmente presente em uma célula particular em um estágio de desenvolvimento particular sob condições ambientais particulares. Por exemplo, um ácido nucleico endógeno pode compreender um cromossomo, o genoma de uma mitocôndria, cloroplasto ou outra organela, ou um ácido nucleico epissomal que ocorre naturalmente. Moléculas endógenas adicionais podem incluir proteínas, por exemplo, fatores transcricionais e enzimas.
[00223] Uma molécula de "fusão" é uma molécula em que duas ou mais moléculas de subunidade são ligadas, preferivelmente covalen- temente. As moléculas de subunidade podem ser o mesmo tipo químico de molécula, ou pode ser tipo químico diferente de moléculas. Exemplos do primeiro tipo de molécula de fusão incluem, mas não estão limitados a, proteínas de fusão (por exemplo, uma ZFN compreendendo uma fusão entre um domínio de ligação de DNA de ZFP e um domínio de clivagem) e ácidos nucleicos de fusão (por exemplo, um ácido nucleico que codifica a proteína de fusão descrita supra). Exemplos do segundo tipo de molécula de fusão incluem, mas não estão limitados a, uma fusão entre um ácido nucleico de formação de tríplex e um polipeptídeo, e uma fusão entre um ligante de ranhura menor e um ácido nucleico.
[00224] Expressão de uma proteína de fusão em uma célula pode resultar de distribuição da proteína de fusão para a célula ou por distribuição de um polinucleotídeo que codifica a proteína de fusão a uma célula, no qual o polinucleotídeo é transcrito, e a transcrição é transladada, para gerar a proteína de fusão. Transunião, clivagem de polipep- tídeo e ligação de polipeptídeo podem também estar envolvidos na expressão de uma proteína em uma célula. Métodos para distribuição de polinucleotídeo e polipeptídeo para células são apresentados em qualquer lugar nesta descrição.
[00225] Um "gene", para a proposta da presente descrição, inclui uma região de DNA que codifica um produto de gene (vide infra), bem como regiões de DNA que regulam a produção do produto de gene, se ou não tais sequências regulatórias forem adjacentes a codificação e/ou sequências transcritas. Consequentemente, um gene inclui, mas não é necessariamente limitado a, sequências promotoras, terminado- res, sequências regulatórias translacionais tais como locais de ligação de ribossomo e locais de entrada de ribossomo internos, intensificado- res, silenciadores, isoladores, elementos de limitação, origens de repli- cação, locais de fixação de matriz e regiões de controle de local.
[00226] "Expressão de gene" refere-se a conversão da informação contida em um gene, em um produto de gene. Um produto de gene pode ser o produto transcricional direto de um gene (por exemplo, mRNA, tRNA, rRNA, RNA de antissenso, ribozima, shRNA, micro RNA, RNA estrutural ou qualquer outro tipo de RNA) ou uma proteína produzida por translação de um mRNA. Os produtos de genes também incluem RNAs que são modificados, por processos tais como capea- mento, poliadenilação, metilação, e edição, e proteínas modificadas por, por exemplo, metilação, acetilação, fosforilação, ubiquitinação, ADP-ribosilação, miristilação, e glicosilação.
[00227] "Modulação" de expressão de gene refere-se a uma mu- dança na atividade de um gene. Modulação de expressão pode incluir, mas não é limitado a, ativação de gene e repressão de gene.
[00228] Células de "planta" incluem, mas não estão limitados a, células de plantas monocotiledônea (monocotiledôneas) ou dicotiledônea (dicotiledôneas). Exemplos não-limitativos de monocotiledôneas incluem plantas de cereais tais como milho, arroz, cevada, aveias, sorgo, centeio, cana de açúcar, ananás, cebola, banana, e côco. Exemplos não-limitativos de dicotiledôneas incluem tabaco, tomate, girassol, algodão, beterraba, batata, alface, melão, soja, canola (óleo de colza), e alfafa. Células de planta podem ser de qualquer parte da planta e/ou de qualquer estágio de desenvolvimento de planta.
[00229] Uma "região de interesse" é qualquer região de cromatina celular, tal como, por exemplo, um gene ou uma sequência de não- codificação dentro de ou adjacente a um gene, em que é desejável se ligar a uma molécula exógena (por exemplo, uma região genômica de EPSPS de interesse inclui uma região dentro de ou adjacente a um gene de EPSPS). A ligação pode ser para a proposta de clivagem de DNA-alvo e/ou recombinação-alvo. Uma região de interesse pode estar presente em um cromossomo, um epissomo, um genoma organelar (por exemplo, mitocôndria, cloroplasto), ou um genoma vital de infecção, por exemplo. Uma região de interesse estar dentro da região de codificação de um gene, dentro de regiões de não-codificação transcritas tais como, por exemplo, sequências condutoras, sequências de reboque ou íntrons, ou dentro de regiões não-transcritas, ou à montante ou à jusante da região de codificação. Uma região de interesse pode ser tão pequena quanto um par simples de nucleotídeos ou até 25.000 pares de nucleotídeos de comprimento, ou qualquer valor integral de pares de nucleotídeos.
[00230] Os termos "ligação operativa" e "operativamente ligado" (ou "operavelmente ligado") são usados permutavelmente com referência a uma justaposição de dois ou mais componentes (tais como elementos de sequência), em que os componentes são dispostos tal que ambos componentes funcionam normalmente e permitem a possibilidade que pelo menos um dos componentes pode mediar uma função que é exercida sob pelo menos um dos outros componentes. Por meio de ilustração, uma sequência regulatória transcricional, tal como um promotor, é operativamente ligada a uma sequência de codificação se a sequência regulatória transcricional controlar o nível de transcrição da sequência de codificação em resposta à presença ou ausência de um ou mais fatores regulatórios transcricionais. Uma sequência regulatória transcricional é geralmente operativamente ligada em cis com uma sequência de codificação, mas não necessita ser diretamente adjacente a ela. Por exemplo, um intensificador é uma sequência regulatória transcricional que é operativamente ligada a uma sequência de codificação, mesmo embora elas não sejam contíguas.
[00231] Com relação a polipeptídeos de fusão, o termo "operativamente ligado" pode referir-se ao fato que cada um dos componentes realiza a mesma função na ligação ao outro componente à medida que ele seria se não fossem desse modo ligados. Por exemplo, com relação a um polipeptídeo de fusão em que um domínio de ligação de DNA de ZFP é fundido a um domínio de clivagem, um domínio de ligação de DNA de ZFP e o domínio de clivagem estão em ligação operativa se, no polipeptídeo de fusão, uma porção de domínio de ligação de DNA de ZFP for capaz de se ligar a seu local-alvo e/ou seu local de ligação, enquanto o domínio de clivagem é capaz de clivar DNA na vizinhança do local-alvo.
[00232] Um "fragmento funcional" de uma proteína, polipeptídeo ou ácido nucleico é uma proteína, polipeptídeo ou ácido nucleico cuja sequência não é idêntica a proteína de comprimento total, polipeptídeo ou ácido nucleico, ainda retém a mesma função como a proteína de comprimento total, polipeptídeo ou ácido nucleico. Um fragmento funcional pode possuir mais, pouco, ou o mesmo número de resíduos como a molécula nativa correspondente, e/ou pode conter uma ou mais substituições de aminoácido ou substituições de nucleotídeo. Métodos para determinação da função de um ácido nucleico (por exemplo, função de codificação, capacidade de hibridizar a outro ácido nu- cleico) são bem-conhecidos na técnica. Similarmente, métodos para determinação de função de proteína são bem-conhecidos. Por exemplo, a função de ligação de DNA de um polipeptídeo pode ser determinada, por exemplo, ligação de filtro, alteração de mobilidade eletroforé- tica, ou ensaios de imunoprecipitação. A clivagem de DNA pode ser ensaiada por eletroforese de gel. Vide Ausubel et al., supra. A capacidade de uma proteína interagir com outra proteína pode ser determinada, por exemplo, por coimunoprecipitação, dois ensaios híbridos ou complementação, ambos genéticos e bioquímicos. Vide, por exemplo, Fields et al. (1989) Nature 340:245-246; Patente U.S. N° 5.585.245 e PCT WO 98/44350.
Locais Alvos
[00233] Os métodos e composições descritos incluem ZFPs compreendendo proteínas de fusão compreendendo um domínio regulató- rio ou domínio de clivagem (ou um meio-domínio de clivagem) e um domínio de dedo de zinco, em que o domínio de dedo de zinco, por ligação a uma sequência em cromatina celular (por exemplo, um local- alvo de gene de EPSPS ou local de ligação), direciona a atividade do domínio regulatório ou domínio de clivagem (ou meio-domínio de clivagem) para a vizinhança da sequência e, consequentemente, modula transcrição ou induz clivagem na vizinhança da sequência-alvo. Conforme colocado em qualquer lugar nesta descrição, um domínio de dedo de zinco pode ser engenheirado para se ligar a virtualmente qualquer sequência desejada. Consequentemente, após identificação de uma região de interesse contendo uma sequência na qual regulação de gene, clivagem, ou recombinação é desejado, um ou mais domínios de ligação de dedo de zinco podem ser engenheirados para se ligar a uma ou mais sequências na região de interesse.
[00234] A seleção de uma região genômica de EPSPS de interesse em cromatina celular para ligação por um domínio de dedo de zinco (por exemplo, um local-alvo) pode ser acompanhada, por exemplo, de acordo com os métodos descritos da Patente U.S. do mesmo proprietário N° 6.453.242 (17 de setembro de 2002), que também descreve métodos para designação de ZFPs que se ligam a uma sequência selecionada. Será claro àqueles versados na técnica que inspeção visual viral de uma sequência de nucleotídeo pode também ser usada para seleção de um local-alvo. Consequentemente, qualquer meio para seleção de local-alvo pode ser usado nos métodos reivindicados.
[00235] Os locais-alvo são geralmente compostos de uma pluralidade de sublocais-alvo adjacentes. Um sublocal-alvo refere-se à sequência (usualmente ou um trio de nucleotídeo, ou uma quadra de nu- cleotídeo que pode sobrepor por um nucleotídeo com uma quadra adjacente) ligada por uma dedo de zinco individual. Vide, por exemplo, WO 02/077227. Se a fita com a qual uma proteína de dedo de zinco faz mais contatos é designada a "fita de reconhecimento primário", ou "fita de contato primário", algumas proteínas de dedo de zinco se ligam a um trio de três bases na fita-alvo e uma quarta base na fita de não- alvo. Um local-alvo geralmente tem um comprimento de pelo menos 9 nucleotídeos e, consequentemente, é ligado por um domínio de liga-ção de dedo de zinco compreendendo pelo menos três dedos de zinco. Contudo, ligação de, por exemplo, um domínio de ligação de dedo- 4 a um 12-local-alvo de nucleotídeo, um 5-domínio de ligação de dedo a um 15-local-alvo de nucleotídeo ou um 6-domínio de ligação de dedo a um 18-local-alvo de nucleotídeo, é também possível. Conforme será aparente, ligação de domínios de ligação maiores (por exemplo, 7-, 8-, 9-dedo e mais) a locais-alvo mais longos é também possível.
[00236] Não é necessário para um local-alvo ser um múltiplo de três nucleotídeos. Por exemplo, em casos em que interações de fita cruzada ocorrem (vide, por exemplo, Patente U.S. 6.453.242 e WO 02/077227), uma ou mais das dedos de zinco individuais de um domínio de ligação de multidedo podem se ligar a sublocais de quadra de sobreposição. Como um resultado, uma proteína de três dedos pode se ligar a uma 10-sequência de nucleotídeo, no qual o décimo nucleo- tídeo é parte de uma quadra ligada por uma dedo terminal, uma proteína de quatro dedos pode se ligar a uma 13-sequência de nucleotídeo, no qual o décimo terceiro nucleotídeo é parte de uma quadra ligada por uma dedo terminal, etc..
[00237] O comprimento e natureza de sequências liganteas de ami- noácido entre dedos de zinco individuais em um domínio de ligação de multidedo também afeta a ligação a uma sequência-alvo. Por exemplo, a presença de um assim denominado "ligante não-canônico", "ligante longo" ou "ligante estruturado" entre dedos de zinco adjacentes em um domínio de ligação de multidedo pode permitir que aquelas dedos se liguem a sublocais que não são imediatamente adjacentes. Exemplos não-limitativos de tais ligantes são descritos, por exemplo, na Patente U.S. N° 6.479.626 e WO 01/53480. Consequentemente, um ou mais sublocais, em um local-alvo para um domínio de ligação de dedo de zinco, podem ser separados entre si por 1, 2, 3, 4, 5 ou mais nucleotí- deos. Para proporcionar, mas um exemplo, um domínio de ligação de quatro dedos pode ligar a um 13-local-alvo de nucleotídeo compreendendo, em sequência, dois 3-sublocais de nucleotídeo contíguos, um nucleotídeo de intervenção, e dois sublocais de trio contíguos. Vide, também, Pedido U.S. N° 61/130.099 para composições e métodos para ligação de nucleases artificiais que se ligam a locais-alvo separados por números diferentes de nucleotídeos.
[00238] Distância entre sequências (por exemplo, locais-alvo) refere-se ao número de nucleotídeos ou par de nucleotídeos que intervém entre duas sequências, conforme medido a partir das bordas das sequências mais próximas entre si.
[00239] Em certas concretizações, ZFPs com função de fator de transcrição são designadas. Para função de fator de transcrição, ligação simples e proximidade suficiente ao promotor são todas que são geralmente necessárias. Posicionamento exato relativo ao promotor, orientação, e dentro de limites, de uma distância não ocorre grandemente. Esta característica permite flexibilidade considerável na escolha de locais-alvo para construção de fatores de transcrição artificiais. O local-alvo reconhecido por uma ZFP, portanto, pode ser qualquer local adequado no gene-alvo que permitirá ativação ou repressão de expressão de gene por uma ZFP, opcionalmente ligada a um domínio regulatório. Locais-alvo preferidos incluem regiões adjacentes a, à jusante a, ou à montante do local de partida de transcrição. Em adição, locais-alvo que são localizados em regiões intensificadoras, locais re- pressores, locais de pausa de RNA polimerase, e locais regulatórios específicos (por exemplo, locais SP-1, elementos de resposta de hipo- xia, elementos de reconhecimento de receptor nuclear, locais de ligação de p53), locais no cDNA que codifica região ou em uma região de codificação de etiqueta de sequência (EST).
[00240] Em outras concretizações, ZFPs com atividade de nuclease são designadas. Expressão de uma ZFN compreendendo uma proteína de fusão compreendendo um domínio de ligação de dedo de zinco e um domínio de clivagem (ou de duas proteínas de fusões, cada uma compreendendo um domínio de ligação de dedo de zinco e um meio- domínio de clivagem), em uma célula, efetuam clivagem na vizinhança da sequência-alvo. Em certas concretizações, a clivagem depende da ligação de duas moléculas de fusão de domínio de dedo de zin- co/meio-domínio de clivagem para separar locais-alvo. Os dois locais- alvo podem estar em fitas de DNA opostas, ou alternativamente, ambos locais-alvo podendo estar na mesma fita de DNA.
Domínios de Ligação de Dedo de Zinco
[00241] Um domínio de ligação de dedo de zinco compreende uma ou mais dedos de zinco. Miller et al. (1985) EMBO J. 4:1609-1614; Rhodes (1993) Scientific American Feb.:56-65; Patente U.S. N° 6.453.242. Tipicamente, um domínio de dedo de zinco simples é de cerca de 30 aminoácidos de comprimento. Estudos estruturais têm demonstrado que cada domínio de dedo de zinco (motivo) contém duas beta-folhas (mantidas em um giro beta que contém os dois resíduos de cisteína invariantes) e um alfa espiral (contendo os dois resíduos de histidina invariantes), que são mantidos em uma conformação particular através da coordenação de um átomo de zinco pelas duas cisteínas e as duas histidinas.
[00242] Dedos de zinco incluem ambas dedos de zinco C2H2 canônicas (isto é, aquelas em que o íon zinco é coordenado pelos dois resíduos de cisteínas e histidina) e dedos de zinco não-canônicas tais como, por exemplo, dedos de zinco C3H (aquelas em que o íon zinco é coordenado por três resíduos de cisteína e um resíduo de histidina) e dedos de zinco C4 (aquelas em que íon zinco é coordenado por quatro resíduos de cisteína). Vide também WO 02/057293.
[00243] Domínios de ligação de dedo de zinco podem ser engenhei- rados para se ligarem a uma sequência de escolha. Vide, por exemplo, Beerli et al. (2002) Nature Biotechnol. 20:135-141; Pabo et al. (2001) Ann. Rev. Biochem. 70:313-340; Isalan et al. (2001) Nature Biotechnol. 19:656-660; Segal et al. (2001) Curr. Opin. Biotechnol. 12:632-637; Choo et al. (2000) Curr. Opin. Struct. Biol. 10:411-416. Um domínio de ligação de dedo de zinco engenheirada pode ter uma nova especifici- dade de ligação, comparado a uma proteína de dedo de zinco que ocorre naturalmente. Métodos de engenharia incluem, mas não estão limitados a, desenho racional e vários tipos de seleção. O desenho racional inclui, por exemplo, uso de bases de dados compreendendo trio (ou quadra) de sequências de nucleotídeo e sequências de aminoáci- do de dedo de zinco individuais, em que cada trio ou quadra de sequência de nucleotídeo é associado com uma ou mais sequências de aminoácido de dedos de zinco que se ligam ao trio ou quadra de sequência individual. Vide, por exemplo, Patente U.S. de propriedade da mesma Requerente 6.453.242 e 6.534.261. Métodos de desenho adicionais são descritos, por exemplo, na Patente U.S. 6.746.838; 6.785.613; 6.866.997; e 7.030.215.
[00244] Métodos de seleção exemplares, incluindo mostrador de fago e dois sistemas híbridos, são descritos nas Patentes U.S. 5.789.538; 5.925.523; 6.007.988; 6.013.453; 6.410.248; 6.140.466; 6.200.759; e 6.242.568; bem como WO 98/37186; WO 98/53057; WO 00/27878; WO 01/88197 e GB 2.338.237.
[00245] A intensificação de especificidade de ligação para domínios de ligação de dedo de zinco foram descritos, por exemplo, na Patente U.S. N° de propriedade da mesma Requerente 6.794.136.
[00246] Desde que uma dedo de zinco individual se liga a uma sequência de três nucleotídeos (isto é, trio) (ou uma sequência de quatro nucleotídeos que podem sobrepor, por um nucleotídeo, com o local de ligação de quatro nucleotídeos de uma dedo de zinco adjacente), o comprimento de uma sequência a qual um domínio de ligação de dedo de zinco é engenheirado para se ligar (por exemplo, uma sequência- alvo) determinará o número de dedos de zinco em um domínio de ligação de dedo de zinco engenheirada. Por exemplo, para ZFPs em que os motivos de dedo não se ligam a sublocais de sobreposição, uma sequência-alvo de seis nucleotídeos é ligada por um domínio de liga ção de duas dedos; uma sequência-alvo de nove nucleotídeos é ligada por um domínio de ligação de três dedos, etc.. Conforme notado acima, locais de ligação para dedos de zinco individuais (isto é, sublo- cais) em um local-alvo não necessitam serem contíguos, mas podem ser separados por um ou vários nucleotídeos, dependendo do comprimento e natureza das sequências de aminoácidos entre as dedos de zinco (isto é, os ligantes de interdedo) em um domínio de ligação de multidedos.
[00247] Em um domínio de ligação de dedo de zinco de multidedos, dedos de zinco adjacentes podem ser separadas por sequências ligan- teas de aminoácido de aproximadamente 5 aminoácidos (assim denominadas ligantes interdedo "canônicos") ou, alternativamente, por um ou mais ligantes não-canônicos. Vide, por exemplo, Patentes U.S. de propriedade da mesma Requerente N— 6.453.242 e 6.534.261. Para domínios de ligação de dedo de zinco engenheirada compreendendo mais do que três dedos, inserção de ligantes interdedo mais longos ("não-canônicos") entre certas das dedos de zinco pode ser preferida conforme pode aumentar a afinidade e/ou especificidade de ligação pelo domínio de ligação. Vide, por exemplo, Patente U.S. N° 6.479.626 e WO 01/53480. Consequentemente, domínios de multidedo de ligação de dedo de zinco podem também ser caracterizados com relação a presença e localização de ligantes de interdedo não-canônicos. Por exemplo, um domínio de ligação de dedo de zinco de seis dedos compreendendo três dedos (unidas por dois ligantes interdedo canônicos), um ligante longo e três dedos adicionais (unidas por dois ligantes in- terdedo canônicos) é denotado uma configuração 2x3. Similarmente, um domínio de ligação compreendendo duas dedos (com um ligante canônico entre elas), um ligante longo e duas dedos adicionais (unidas por um ligante canônico) é denotado uma proteína 2x2. Uma proteína compreendendo três unidades de duas dedos (em cada uma da qual as duas dedos são unidas por um ligante canônico), e em que cada unidade de duas dedos é unida às duas unidades de dedo adjacentes por um ligante longo, é referida como uma proteína 3x2.
[00248] A presença de um ligador interdedo longo ou não-canônico entre duas dedos de zinco adjacentes em um domínio de ligação de multidedo frequentemente permite que as duas dedos se liguem a sub- locais que não são imediatamente contíguos na sequência-alvo. Consequentemente, podem ser folgas de um ou mais nucleotídeos entre sublocais em um local-alvo; isto é, um local-alvo pode conter um ou mais nucleotídeos que não são contactados pela dedo de zinco. Por exemplo, um domínio de ligação de dedo de zinco 2x2 pode se ligar a duas seis-sequências de nucleotídeo separadas por um nucleotídeo, isto é, ela se liga a um local-alvo de 13-nucleotídeos. Vide também Moore et al. (2001a) Proc. Natl. Acad. Sci. USA 98:1432-1436; Moore et al. (2001b) Proc. Natl. Acad. Sci. USA 98:1437-1441 e WO 01/53480.
[00249] Conforme mencionado anteriormente, um sublocal-alvo é três ou quatro sequências de nucleotídeo que são ligadas por uma dedo de zinco simples. Para certas propostas, uma unidade de duas dedos é denotada um módulo de ligação. Um módulo de ligação pode ser obtido por, por exemplo, seleção de duas dedos adjacentes no contexto de uma proteína de multidedo (geralmente três dedos) que se ligam a uma sequência-alvo de seis nucleotídeos particular. Alternativamente, os módulos podem ser construídos por conjunto de dedos de zinco individuais. Vide também WO 98/53057 e WO 01/53480.
[00250] Um domínio de ligação de dedo de zinco pode ser designado para se ligar a uma ou mais sequências genômicas alvo de EPSPS homólogas (por exemplo, ortóloga ou paraloga). Por exemplo, um domínio de ligação de dedo de zinco pode ser designado para se ligar especificamente a uma sequência-alvo de EPSPS única. Alternativa- mente, um domínio de ligação de dedo de zinco pode ser designado para se ligar a sequências genômicas de EPSPS ortóloga ou parologa múltiplas.
[00251] Em uma concretização, aqui é descrito um domínio de ligação de dedo de zinco compreendendo uma sequência de aminoácido conforme mostrada na tabela A. Em outra concretização, a descrição proporciona um polinucleotídeo que codifica um domínio de ligação de dedo de zinco, no qual o domínio de ligação de dedo de zinco compreende uma sequência de aminoácido conforme mostrado na tabela A.
Domínios Regulatórios
[00252] ZFPs aqui descritas podem opcionalmente estar associadas com domínios regulatórios para modulação de expressão de gene. Uma ZFP pode ser covalentemente ou não-covalentemente associada com um ou mais domínios regulatórios, alternativamente dois ou mais domínios regulatórios, com os dois ou mais domínios regulatórios sendo duas cópias do mesmo domínio, ou dois domínios diferentes. Os domínios regulatórios podem ser covalentemente ligados a uma ZFP, por exemplo, através de um ligante de aminoácido, como parte de uma proteína de fusão. ZFPs podem também estar associadas com um domínio regulatório através de um domínio de dimerização não- covalente, por exemplo, um zipper de leucina, um domínio de terminal- N de proteína STAT, ou uma proteína de ligação FK506 (vide, por exemplo, O'Shea, Science 254: 539 (1991), Barahmand-Pour et al, Curr. Top. Microbiol. Immunol. 211:121-128 (1996); Klemm et al., An- nu. Rev. Immunol. 16:569-592 (1998); Klemm et al., Annu. Rev. Immunol. 16:569-592 (1998); Ho et al., Nature 382:822-826 (1996); e Pomeranz et al., Biochem. 37:965 (1998)). O domínio regulatório pode estar associado com a ZFP em qualquer posição adequada, incluindo o ter- minal-N ou -C de uma ZFP.
[00253] Domínios regulatórios comuns para adição a uma ZFP incluem, por exemplo, domínios efetuadores de fatores de transcrição (ativadores, repressores, coativadores, correpressores), silenciadores, receptores de hormônio nuclear, fatores de transcrição de oncogene (por exemplo, myc, jun, fos, myb, max, mad, rel, ets, bcl, myb, mos membros de família, etc.); enzimas de reparo de DNA e seus fatores associados e modificadores; enzimas de rearranjo de DNA e seus fatores associados e modificadores; proteínas associadas à cromatina e seus modificadores (por exemplo, quinases, acetilases e desacetila- ses); e enzimas de modificação de DNA (por exemplo, metiltransfera- ses, topoisomerases, helicases, ligases, quinases, fosfatases, polime- rases, endonucleases) e seus fatores associados e modificadores.
[00254] Os polipeptídeos de fator de transcrição dos quais pode-se obter um domínio regulatório incluem aqueles que são envolvidos em transcrição regulada e basal. Tais polipeptídeos incluem fatores de transcrição, seus domínios efetuadores, coativadores, silenciadores, receptores de hormônio nucleares (vide, por exemplo, Goodrich et al., Célula 84:825-30 (1996) para uma revisão de proteínas e elementos de ácido nucleico envolvidos na transcrição; fatores de transcrição em geral são revistos em Barnes & Adcock, Clin. Exp. Allergy 25 Suppl. 2:46-9 (1995) e Roeder, Methods Enzymol. 273:165-71(1996)). Bases de dados dedicadas para fatores de transcrição são conhecidas (vide, por exemplo, Science 269:630 (1995)). Fatores de transcrição de receptor de hormônio nuclear são descritos em, por exemplo, Rosen et al., J Med. Chem. 38:4855-74 (1995). A família C/EBP de fatores de transcrição é revista em Wedel et al., Immunobiology 193:171-85 (1995). Coativadores e correpressores que mediam regulação de transcrição por receptores de hormônio nucleares são revistos em, por exemplo, Meier, Eur. J Endocrinol. 134(2):158-9 (1996); Kaiser et al., Trends Biochem. Sci. 21:342-5 (1996); e Utley et al., Nature 394:498- 502 (1998)). Fatores de transcrição GATA, que são envolvidos na regulação de hematopoiese, são descritos em, por exemplo, Simon, Nat. Genet. 11:9-11 (1995); Weiss et al., Exp. Hematol. 23:99-107. A proteína de ligação de caixa TATA (TBP) e seus polipeptídeos TAP associados (que incluem TAF30, TAF55, TAF80, TAF 10, TAFI 50, e TAF250) são descritos em Goodrich & Tjian, Curr. Opin. Cell Biol. 6:403-9 (1994) e Hurley, Curr. Opin. Struct. Biol. 6:69-75 (1996). A família STAT de fatores de transcrição é revista em, por exemplo, Ba- rahmand-Pour et al., Curr. Top. Microbiol. Immunol. 211:121-8 (1996). Fatores de transcrição envolvidos em doença são revistos em Aso et al., J Clin. Invest. 97:1561-9 (1996).
[00255] Em uma concretização, o domínio de repressão de KRAB a partir da proteína KOX-1 humana é usado como um repressor transcri- cional (Thiesen et al., New Biologist 2:363-374 (1990); Margolin et al., PNAS 91:4509-4513 (1994); Pengue et al., Nucl. Acids Res. 22:29082914 (1994); Witzgall et al., PNAS 91:4514-4518 (1994)). Em outra concretização, KAP-1, um correpressor KRAB, é usado com KRAB (Friedman et al., Genes Dev. 10:2067-2078 (1996)). Alternativamente, KAP-1 pode ser usado sozinho com uma ZFP. Outros fatores de transcrição preferidos e domínios de fator de transcrição que agem como repressores transcricionais incluem MAD (vide, por exemplo, Sommer et al., J. Biol. Chem. 273:6632-6642 (1998); Gupta et al., Oncogene 16:1149-1159 (1998); Queva et al., Oncogene 16:967-977 (1998); Larsson et al., Oncogene 15:737-748 (1997); Laherty et al., Célula 89:349-356 (1997); e Cultraro et al, Mol Célula . Biol. 17:23532359 (19977)); FKHR (forquilha superior em gene rhapdosarcoma; Ginsberg et al., Cancer Res. 15:3542-3546 (1998); Epstein et al, Mol. Cell. Biol. 18:4118-4130 (1998)); EGR-1 (produto de gene-1 de resposta de crescimento anterior; Yan et al., PNAS 95:8298-8303 (1998); e Liu et al., Cancer Gene Ther. 5:3-28 (1998)); o domínio de repressor de fator ets2 (ERD; Sgouras et al., EMBO J 14:4781-4793 ((19095)); e o domínio de interação MAD smSIN3 (SID; Ayer et al., Mol. Cell. Biol. 16:5772-5781 (1996)).
[00256] Em uma concretização, o domínio de ativação de HSV VP16 é usado como um ativador transcricional (vide, por exemplo, Hagmann et al., J. Virol. 71:5952-5962 (1997)). Outros fatores de transcrição preferidos que podem suprir domínios de ativação incluem o domínio de ativação VP64 (Seipel et al., EMBO J. 11:4961-4968 (1996)); receptores de hormônio nucleares (vide, por exemplo, Torchia et al., Curr. Opin. Cell. Biol. 10:373-383 (1998)); a subunidade p65 de fator nuclear kappa B (Bitko & Barik, J. Virol. 72:5610-5618 (1998) e Doyle & Hunt, Neuroreport 8:2937-2942 (1997)); e EGR-1 (produto de gene-1 de resposta de crescimento anterior; Yan et al., PNAS 95:8298-8303 (1998); e Liu et al., Cancer Gene Ther. 5:3-28 (1998)).
[00257] Quinases, fosfatases, e outras proteínas que modificam po- lipeptídeos envolvidos na regulação de gene são também úteis como domínios regulatórios para ZFPs. Tais modificadores são frequentemente envolvidos na comutação dentro ou fora de transcrição mediada por, por exemplo, hormônios. Quinases envolvidas na regulação trans- cricional são revistas em Davis, Mol. Reprod. Dev. 42:459-67 (1995), Jackson et al., Adv. Second Messenger Phosphoproteína Res. 28:27986 (1993), e Boulikas, Crit. Rev. Eukaryot. Gene Expr. 5:1-77 (1995), enquanto fosfatases são revistas em, por exemplo, Schonthal & Semin, Cancer Biol. 6:239-48 (1995). Quinases tirosina nucleares são descritas em Wang, Trends Biochem. Sci. 19:373-6 (1994).
[00258] Conforme descrito, domínios úteis podem também ser obtidos a partir dos produtos de gene de oncogenes (por exemplo, myc, jun, fos, myb, max, mad, rel, ets, bcl, myb, membros de família mos), e seus fatores associados e modificadores. Oncogenes são descritos em, por exemplo, Cooper, Oncogenes, 2nd ed., The Jones e Bartlett Series in Biology, Boston, Mass., Jones e Bartlett Publishers, 1995. Os fatores de transcrição ets são revistos em Waslylk et al., Eur. J. Bio- chem. 211:7-18 (1993) e Crepieux et al., Crit. Rev. Oncog. 5:615-38 (1994). Oncogenes myc são revistos em, por exemplo, Ryan et al., Bi- ochem. J. 314:713-21 (1996). Os fatores de transcrição jun e fos são descritos em, por exemplo, As Famílias Fos e Jun de Fatores de Transcrição, Angel & Herrlich, eds. (1994). O oncogene max é revisto em Hurlin et al., Cold Spring Harb. Symp. Quant. Biol. 59:109-16. A família de gene myb é revista em Kanei-Ishii et al., Curr. Top. Microbiol. Immunol. 211:89-98 (1996). A família mos é revista em Yew et al., Curr. Opin. Genet. Dev. 3:19-25 (1993).
[00259] ZFPs podem incluir domínios regulatórios obtidos de enzimas de reparo de DNA e seus fatores associados e modificadores. Sistemas de reparo de DNA são revistos em, por exemplo, Vos, Curr. Opin. Cell Biol. 4:385-95 (1992); Sancar, Ann. Rev. Genet. 29:69-105 (1995); Lehmann, Genet. Eng. 17:1-19 (1995); e Wood, Ann. Rev. Bio- chem. 65:135-67 (1996). Enzimas de rearranjo de DNA e seus fatores associados e modificadores podem também ser usados como domínios regulatórios (vide, por exemplo, Gangloffet al., Experientia 50:2619 (1994); Sadowski, FASEB J. 7:760-7 (1993)).
[00260] Similarmente, domínios regulatórios podem ser derivados de enzimas de modificação de DNA (por exemplo, DNA metiltransfera- ses, topoisomerases, helicases, ligases, quinases, fosfatases, polime- rases) e seus fatores associados e modificadores. Helicases são revistas em Matson et al., Bioessays, 16:13-22 (1994), e metiltransferases são descritas em Cheng, Curr. Opin. Struct. Biol. 5:4-10 (1995). Proteínas associadas à cromatina e a seus modificadores (por exemplo, quinases, acetilases e desacetilases), tal como histona desacetilase (Wolffe, Science 272:371-2 (1996)) são também úteis como domínios para adição a uma ZFP de escolha. Em uma concretização preferida, o domínio regulatório é um metil transferase de DNA que age como um repressor transcricional (vide, por exemplo, Van den Wyngaert et al., FEBS Lett. 426:283-289 (1998); Flynn et al., J. Mol. Biol. 279:101116 (1998); Okano et al., Acid nucleics Res. 26:2536-2540 (1998); e Zardo & Caiafa, J. Biol. Chem. 273:16517-16520 (1998)). Em outra concretização preferida, endonucleases tais como Fok1 são usadas como repressores transcricionais, que agem via clivagem de gene (vide, por exemplo, WO95/09233; e PCT/US94/01201).
[00261] Fatores que controlam cromatina e estrutura de DNA, movimento e localização e seus fatores associados e modificadores; fatores derivados de micróbios (por exemplo, procariotes, eucariotes e vírus) e fatores que se os associam com ou os modificam podem também serem usados para obter proteínas quiméricas. Em uma concretização, recombinases e integrases são usadas como domínios regula- tórios. Em uma concretização, histona acetiltransferase é usada como um ativador transcricional (vide, por exemplo, Jin & Scotto, Mol. Cell. Biol. 18:4377-4384 (1998); Wolffe, Science 272:371-372 (1996); Taunton et al., Science 272:408-411 (1996); e Hassig et al., PNAS 95:35193524 (1998)). Em outra concretização, histona desacetilase é usada como um repressor transcricional (vide, por exemplo, Jin & Scotto, Mol. Cell. Biol. 18:4377-4384 (1998); Syntichaki & Thireos, J. Biol. Chem. 273:24414-24419 (1998); Sakaguchi et al., Genes Dev. 12:2831-2841 (1998); e Martinez et al, J. Biol. Chem. 273:2378123785 (1998)).
[00262] Domínios ligantes entre domínios de polipeptídeo, por exemplo, entre duas ZFPs ou entre uma ZFP e um domínio regulató- rio, podem ser incluídos. Tais ligantes são tipicamente sequências de polipeptídeo, tais como sequências poly gly de entre cerca de 5 e 200 aminoácidos. Ligadores preferidos são tipicamente subsequências de aminoácido flexíveis que são sintetizadas como parte de uma proteína de fusão recombinante. Vide, por exemplo, Patente U.S. N° 6.534.261; Liu et al., Proc. Nat. Acad. Sci. USA, 95:5525-5530 (1997); Pomerantz et al., Proc. Nat. Acad. Sci. USA 92:9752-9756 (1995); Kim et al., Proc. Nat. Acad. Sci. USA 93:1156-1160 (1996); aqui incorporados por referência em suas totalidades. Alternativamente, ligantes flexíveis podem ser racionalmente designados usando-se programa de computador capaz de modelar ambos locais de ligação de DNA e os peptídeos (Desjarlais & Berg, Proc. Nat. Acad. Sci. USA 90:2256-2260 (1993), Proc. Nat. Acad. Sci. USA 91:11099-11103 (1994), ou por métodos de descrição de fago.
[00263] Em outras concretizações, um ligante químico é usado para conectar sinteticamente ou recombinantemente sequências de domínio produzidas. Tais ligantes flexíveis são conhecidos aos versados na técnica. Por exemplo, ligantes de poli(etileno glicol) são disponíveis de Shearwater Polymers, Inc. Huntsville, Ala. Estes ligantes opcionalmente têm ligações de amido, ligações de sulfidril, ou ligações heterofunci- onais. Em adição a ligação covalente de ZFPs a domínios regulatórios, métodos não-covalentes podem ser usados para produzir moléculas com ZFPs associadas com domínios regulatórios.
Domínios de Clivagem
[00264] A porção de domínio de clivagem das proteínas de fusão aqui descritas pode ser obtida de qualquer endonuclease ou éxonu- clease. Endonucleases exemplares da qual um domínio de clivagem pode ser derivado incluem, mas não estão limitadas a, endonucleases de restrição e endonucleases de residência. Vide, por exemplo, 20022003 Catalogue, New England Biolabs, Beverly, MA; e Belfort et al. (1997) Acid nucleics Res. 25:3379-3388. Enzimas adicionais que clivam DNA são conhecidas (por exemplo, S1 Nuclease; mung bean nuclease; DNase I pancreático; micrococcal nuclease; levedura HO endonuclease; vide também Linn et al. (eds.) Nucleases, Cold Spring Harbor Laboratory Press,1993). Uma ou mais destas enzimas (ou fragmentos funcionais destas) podem ser usadas como uma fonte de domínios de clivagem e meio-domínios de clivagem.
[00265] Similarmente, um meio-domínio de clivagem (por exemplo, proteínas de fusão compreendendo um domínio de ligação de dedo de zinco e um meio-domínio de clivagem) pode ser derivado de qualquer nuclease ou porção desta, conforme colocado acima, que requer dime- rização para atividade de clivagem. Em geral, duas proteínas de fusão são requeridas para clivagem se as proteínas de fusão compreendem meio-domínios de clivagem. Alternativamente, uma proteína simples compreendendo dois meio-domínios de clivagem pode ser usada. Os dois meio-domínios de clivagem podem ser derivados da mesma endonuclease (ou fragmentos funcionais destes), ou cada meio-domínio de clivagem pode ser derivado de uma endonuclease diferente (ou fragmentos funcionais desta). Em adição, os locais-alvo para as duas proteínas de fusão são preferivelmente dispostos, com relação entre si, tal que ligação das duas proteínas de fusão a seus respectivos locais-alvo colocam os meio-domínios de clivagem em uma orientação espacial entre si que permite que os meio-domínios de clivagem formem um domínio de clivagem funcional, por exemplo, por dimeriza- ção. Desse modo, em certas concretizações, as bordas próximas dos locais-alvo são separadas por 5-8 nucleotídeos ou por 15-18 nucleotí- deos. Contudo, qualquer número integral de nucleotídeos ou par de nucleotídeos pode intervir entre dois locais-alvo (por exemplo, de 2 a 50 nucleotídeos ou mais). Em geral, o ponto de clivagem ocorre entre os locais-alvo.
[00266] Endonucleases de restrição (enzimas de restrição) estão presentes em qualquer espécie e são capazes de ligação específica de sequência a DNA (em um local de reconhecimento), e clivagem de DNA em ou perto do local de ligação. Certas enzimas de restrição (por exemplo, Tipo IIS) clivam DNA em locais removidos a partir do local de reconhecimento e têm ligação separável e domínios de clivagem. Por exemplo, a enzima Tipo IIS Fok I catalisa clivagem de fita dupla de DNA, em 9 nucleotídeos de eu local de reconhecimento em um trançado e 13 nucleotídeos de eu local de reconhecimento no outro. Vide, por exemplo, Patentes U.S. 5.356.802; 5.436.150 e 5.487.994; bem como Li et al. (1992) Proc. Natl. Acad. Sci. USA 89:4275-4279; Li et al. (1993) Proc. Natl. Acad. Sci. USA 90:2764-2768; Kim et al. (1994a) Proc. Natl. Acad. Sci. USA 91:883-887; Kim et al. (1994b) J. Biol. Chem. 269:31,978-31,982. Desse modo, em uma concretização, proteínas de fusão compreendem os domínios de clivagem (ou meio- domínio de clivagem) de pelo menos uma enzima de restrição Tipo IIS e um ou mais domínios de ligação de dedo de zinco, que podem ou não podem ser engenheirados.
[00267] Uma enzima de restrição Tipo IIS exemplares, cujo domínio de clivagem é separável do domínio den ligação, é Fok I. Esta enzima particular é ativa como um dímero (Bitinaite et al. (1998) Proc. Natl. Acad. Sci. USA 95: 10,570-10,575). Consequentemente, para a proposta da presente descrição, a porção da enzima Fok I usada nas proteínas de fusão descritas é considerada um meio-domínio de clivagem. Desse modo, para clivagem de fita dupla alvo e/ou substituição-alvo de sequências celulares usando fusões Fok I de dedo de zinco, duas proteínas de fusão, cada compreendendo um FokI meio-domínio de clivagem, pode ser usado para reconstituir uma domínio de clivagem catali- ticamente ativo. Alternativamente, uma molécula de polipeptídeo simples contendo um domínio de ligação de dedo de zinco e dois Fok I meio-domínios de clivagem pode também ser usada. Parâmetros para clivagem-alvo e alteração de sequência-alvo usando fusões de dedo de zinco-Fok I são providos em qualquer lugar nesta descrição.
[00268] Um domínio de clivagem ou meio-domínio de clivagem po- de ser qualquer porção de uma proteína que retém atividade de clivagem, ou que retém a capacidade de multimerizar (por exemplo, dime- rizar) para formar um domínio de clivagem funcional.
[00269] Enzimas de restrição Tipo IIS exemplares são listadas na tabela 1. Enzimas de restrição adicionais também contêm ligação separável e domínios de clivagem, e estas são contempladas pela presente descrição. Vide, por exemplo, Roberts et al. (2003) Acid nucleics Res. 31:418-420.
Figure img0001
Figure img0002
Proteínas de Fusão de Dedo de Zinco
[00270] Métodos para desenho e construção de proteínas de fusão (e polinucleotídeos que codifica as mesmas) são conhecidos àqueles versados na técnica. Por exemplo, métodos para o desenho e construção de proteínas de fusão compreendendo domínios de dedo de zinco e regulatório ou domínios de clivagem (ou meio-domínios de clivagem), e polinucleotídeos que codificam tais proteínas de fusão, são descritos nas Patentes U.S. de propriedade da mesma requerente 6.453.242 e 6.534.261 e Publicações de Pedidos de Patente U.S. 2007/0134796 e 2005/0064474; aqui incorporadas por referência em suas totalidades. Em certas concretizações, polinucleotídeos que codi-ficam as proteínas de fusão são construídos. Estes polinucleotídeos podem ser inseridos em um vetor e o vetor pode ser introduzido em uma célula (vide abaixo para descrição adicional com relação a vetores e métodos para introdução de polinucleotídeos em células).
[00271] Em certas concretizações dos métodos aqui descritos, uma nuclease de dedo de zinco compreende uma proteína de fusão compreendendo um domínio de ligação de dedo de zinco e um meio- domínio de clivagem a partir da enzima de restrição Fok I, e duas tais proteínas de fusão são expressas em uma célula. A expressão de duas proteínas de fusão em uma célula pode resultar da distribuição das duas proteínas para a célula; distribuição de uma proteína e um ácido nucleico que codifica uma das proteínas para a célula; distribuição de dois ácidos nucleicos, cada que codifica uma das proteínas, para a célula ; ou por distribuição de um ácido nucleico simples, que codifica ambas proteínas, para a célula. Em concretizações adicionais, uma proteína de fusão compreende uma cadeia de polipeptídeo simples compreendendo dois meio-domínios de clivagem e um domínio de ligação de dedo de zinco. Neste caso, uma proteína de fusão simples é expressa em uma célula e, sem desejar estar ligado pela teoria, é acreditado clivar DNA como um resultado de formação de um dímero intramolecular dos meio-domínios de clivagem.
[00272] Em certas concretizações, os componentes das proteínas de fusão (por exemplo, ZFP-fusões Fok I) são dispostos tal que o domínio de dedo de zinco é mais próximo ao amino terminal da proteína de fusão, e o meio-domínio de clivagem é mais próximo ao carbóxi- término. Os espelhos da orientação relativa do domínio de clivagem em domínios de clivagem de dimerização que ocorrem naturalmente tais como aqueles derivados da enzima Fok I, em que o domínio de ligação de DNA é mais próximo ao amino terminal e o meio-domínio de clivagem é mais próximo ao carboxi terminal. Nestas concretizações, dimerização dos meio-domínios de clivagem para formar uma nuclease funcional é determinada pela ligação das proteínas de fusão em locais nos trançados de DNA opostos, com as extremidades 5' dos locais de ligação estando próximos entre si.
[00273] Em concretizações adicionais, os componentes das proteínas de fusão (por exemplo, fusões ZFP-Fok I) são dispostos tal que o meio-domínio de clivagem é mais próximo ao amino terminal da proteína de fusão, e o domínio de dedo de zinco é mais próximo ao carbóxi- término. Nestas concretizações, dimerização dos meio-domínios de clivagem para formar uma nuclease funcional é determinada por ligação das proteínas de fusão a locais nos trançados de DNA opostos, com as extremidades 3' dos locais de ligação estando próximas entre si.
[00274] Em ainda concretizações adicionais, uma primeira proteína de fusão contém o meio-domínio de clivagem mais próximo ao terminal da proteína de fusão, e o domínio de dedo de zinco mais próximo ao carbóxi-término, e uma segunda proteína de fusão é disposta tal que o domínio de dedo de zinco é mais próximo ao amino terminal da proteína de fusão, e o meio-domínio de clivagem é mais próximo ao carbóxi-término. Nestas concretizações, ambas proteínas de fusão e ligam ao mesmo trançado de DNA, com local de ligação da primeira proteína de fusão contendo o domínio de dedo de zinco próximo ao carboxi terminal localizado na lateral 5' do local de ligação da segunda proteína de fusão contendo o domínio de dedo de zinco próximo ao amino terminal.
[00275] Em certas concretizações, as proteínas de fusão revelam a sequência de aminoácido entre o domínio de dedo de zinco e o domínio de clivagem (ou meio-domínio de clivagem) é denotado o "ligante ZC". O ligante ZC é para ser distinguido dos ligantes interdedo acima discutidos. Vide, por exemplo, Publicações de Patente U.S. 20050064474A1 e 20030232410, e Publicação de Patente Internacional WO05/084190, para detalhes na obtenção de ligantes ZC que otimizam clivagem.
[00276] Em uma concretização, a descrição proporciona uma ZFN compreendendo uma proteína de dedo de zinco tendo as sequências de aminoácido de espiral de reconhecimento mostradas na tabela A. Em outra concretização, é aqui provido um vetor de expressão de ZFP compreendendo uma sequência de nucleotídeo que codifica uma ZFP tendo as espirais de reconhecimento mostradas na tabela A.
Regulação de Expressão de Gene
[00277] Uma variedade de ensaios pode ser usada para determinar se uma ZFP modula expressão de gene. A atividade de uma ZFP particular pode ser avaliada usando-se uma variedade de ensaios in vitro e in vivo, por medição, por exemplo, da proteína ou níveis de mRNA, níveis de produto, atividade de enzima; ativação transcricional ou repressão de um relator, usando-se, por exemplo, imunoensaios (por exemplo, ELISA e ensaios de imunohistoquímica com anticorpos), ensaios de hibridização (por exemplo, proteção de RNase, northerns, hi- bridização in situ, estudos de série de oligonucleotídeo), ensaios colo- rimétricos, ensaios de amplificação, ensaios de atividade de enzima, ensaios fenotípicos, e similares.
[00278] ZFPs são tipicamente primeiro testadas para atividade in vitro usando-se ensaios ELISA e em seguida usando-se células de rim. Uma ZFP é frequentemente primeiro testada usando-se um sistema de expressão transiente com um gene relator, e em seguida regulação do gene endógeno-alvo é testado em células e em plantas totais, ambos in vivo e ex vivo. Uma ZFP pode ser recombinantemente expressa em uma célula, recombinantemente expressa em células transplantadas em uma planta, ou recombinantemente expressa em uma planta transgênica, bem como administrada como uma proteína para planta ou célula usando veículos de distribuição descritos abaixo. As células podem ser imobilizadas, estarem em solução, serem injetadas em uma planta, ou estarem naturalmente ocorrendo em uma planta transgênica ou planta não-transgênica.
[00279] A modulação de expressão de gene é testada usando-se um dos ensaios in vitro ou in vivo aqui descritos. As amostras ou ensaios são tratados com uma ZFP e comparados a amostras de controle sem o composto de teste, para examinar a extensão de modulação. Para regulação de expressão de gene endógena, uma ZFP tipicamente tem uma Kd de 200 nM ou menos, mais preferivelmente 100 nM ou menos, mais preferivelmente 50 nM, mais preferivelmente 25 nM ou menos.
[00280] Os efeitos de ZFPs podem ser medidos pelo exame de qualquer dos parâmetros descrito acima. Qualquer expressão de gene adequada, mudança fenotípica ou fisiológica podem ser usadas para avaliar a influência de uma ZFP. Quando as consequências funcionais são determinadas usando-se células intactas ou plantas, pode-se também medir uma variedade de efeitos tais como crescimento de planta, mudanças transcricionais a ambos marcadores conhecidos e não- caracterizados (por exemplo, manchas northern blots ou estudos de série de oligonucleotídeo), mudanças no metabolismo da célula tais como crescimento de célula ou mudanças de pH, e mudanças nos segundos mensageiros intracelulares tais como cGMP.
[00281] Ensaios preferidos para regulação de ZFP de expressão de gene endógena podem ser realizados in vitro. Em um formato de ensaio in vitro preferido, a regulação de ZFP de expressão de gene endógena nas células cultivadas é medida pelo exame da produção de proteína usando um ensaio ELISA. A amostra teste é comparada a células de controle tratadas com um vetor vazio ou uma ZFP não- relacionada que é direcionada para outro gene.
[00282] Em outra concretização, a regulação de ZFP de expressão de gene endógena é determinada in vitro por medição do nível de expressão de mRNA de gene-alvo. O nível de expressão de gene é medido usando-se amplificação, por exemplo, usando PCR, LCR, ou en- saios de hibridização, por exemplo, hibridização northern, proteção de RNase, manchamento de ponto. A proteção de RNase é usada em uma concretização. O nível de proteína ou mRNA é detectado usando- se agentes de detecção etiquetados diretamente ou indiretamente, por exemplo, ácidos nucleicos etiquetados fluorescentemente ou radioativamente, anticorpos etiquetados radioativamente ou enzimaticamente, e similares, conforme aqui descrito.
[00283] Alternativamente, um sistema de gene relator pode ser planejado usando-se o promotor de gene-alvo operavelmente ligado a um gene relator tal como luciferase, proteína fluorescente verde, CAT, ou -gal. A construção repórter é tipicamente cotransfectada em uma célula cultivada. Após tratamento com A ZFP de escolha, a quantidade de transcrição de gene relator, translação, ou atividade é medida de acordo com técnicas padrão conhecidas àqueles versados na técnica.
[00284] Plantas transgênicas e plantas não-transgênicas são também usadas como uma concretização preferida para exame de regulação de expressão de gene endógena in vivo. Plantas transgênicas podem expressar estavelmente uma ZFP de escolha. Alternativamente, plantas que expressam transientemente uma ZFP de escolha, ou a qual uma ZFP foi administrada em um veículo de distribuição, podem ser usadas. A regulação de expressão de gene endógena é testada usando-se qualquer um dos ensaios aqui descritos.
Métodos para Clivagem-alvo
[00285] Os métodos e composições descritos podem ser usados para clivar DNA em uma região de interesse em cromatina celular (por exemplo, em um local desejado ou predeterminado em um genoma, por exemplo, dentro de ou adjacente a um gene de EPSPS, ou mutante ou tipo selvagem). Para tal clivagem de DNA-alvo, um domínio de ligação de dedo de zinco é engenheirado para se ligar a um local-alvo em ou perto do local de clivagem predeterminado, e uma proteína de fusão compreendendo o domínio de ligação de dedo de zinco enge- nheirada e um domínio de clivagem é expressa em uma célula. Após ligação da porção de dedo de zinco da proteína de fusão ao local-alvo, o DNA é clivado próximo ao local-alvo pelo domínio de clivagem. O local exato de clivagem pode depender do comprimento do ligante ZC.
[00286] Alternativamente, duas proteínas de fusão, cada uma compreendendo um domínio de ligação de dedo de zinco e um meio- domínio de clivagem, são expressas em uma célula, e se ligam a locais-alvo que são justapostos de tal modo que um domínio de cliva-gem funcional seja reconstituído e DNA é clivado na vizinhança dos locais-alvo. Em uma concretização, clivagem ocorre entre os locais- alvo dos dois domínios de ligação de dedo de zinco. Um ou ambos dos domínios de ligação de dedo de zinco podem ser engenheirados.
[00287] Para clivagem-alvo usando um domínio de ligação de dedo de zinco - polipeptídeo de fusão de domínio de clivagem, o local de ligação pode envolver o local de clivagem, ou a borda próxima do local de ligação pode ser 1, 2, 3, 4, 5, 6, 10, 25, 50 ou mais nucleotídeos (ou qualquer valor integral entre 1 e 50 nucleotídeos) a partir do local de clivagem. A localização exata do local de ligação, com relação ao local de clivagem, dependerá do domínio de clivagem particular, e do comprimento do ligante ZC. Para métodos em que dois polipeptídeos de fusão, cada um compreendendo um domínio de ligação de dedo de zinco e um meio-domínio de clivagem, são usados, o local de ligações geralmente escarrancha o local de clivagem. Desse modo, a borda próxima do primeiro local de ligação pode ser 1, 2, 3, 4, 5, 6, 10, 25 ou mais nucleotídeos (ou qualquer valor integral entre 1 e 50 nucleotí- deos) em um lado do local de clivagem, e a borda próxima do segundo local de ligação pode ser 1, 2, 3, 4, 5, 6, 10, 25 ou mais nucleotídeos (ou qualquer valor integral entre 1 e 50 nucleotídeos) no outro lado do local de clivagem. Métodos para mapeamento dos locais de clivagem in vitro e in vivo são conhecidos àqueles versados na técnica.
[00288] Desse modo, os métodos aqui descritos podem empregar um domínio de ligação de dedo de zinco engenheirado fundido a um domínio de clivagem. Nestes casos, o domínio de ligação é engenhei- rado para se ligar a uma sequência-alvo, em ou próximo onde clivagem é desejada. A proteína de fusão, ou um polinucleotídeo que codifica a mesma, é introduzida em uma célula de planta. Uma vez introduzida em, ou expressa na célula, a proteína de fusão se liga a sequência-alvo e cliva em ou próximo a sequência-alvo. O local exato de clivagem depende da natureza do domínio de clivagem e/ou a presença e/ou natureza de sequências liganteas entre a ligação e domínios de clivagem. Nos casos onde duas proteínas de fusão, cada uma compreendendo um meio-domínio de clivagem, são usadas, a distância entre as bordas próximas dos locais de ligação pode ser 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 25 ou mais nucleotídeos (ou qualquer valor integral entre 1 e 50 nucleotídeos). Níveis ótimos de clivagem podem também depender de ambas a distância entre os locais de ligação das duas proteínas de fusão (vide, por exemplo, Smith et al. (2000) Acid nu- cleics Res. 28:3361-3369; Bibikova et al. (2001) Mol. Cell . Biol. 21:289-297) e o comprimento do ligante ZC em cada proteína de fusão. Vide, também, Publicação de Patente U.S. 20050064474A1 e Publicações de Patente Internacional WO05/084190, WO05/014791 e WO03/080809.
[00289] Em certas concretizações, o domínio de clivagem compreende dois meio-domínios de clivagem, ambos dos quais são parte de um polipeptídeo simples compreendendo um domínio de ligação, um primeiro meio-domínio de clivagem e um segundo meio-domínio de clivagem. Os meio-domínios de clivagem podem ter a mesma sequência de aminoácido ou sequências de aminoácido diferentes, considerando-se que elas funcionam para clivar o DNA.
[00290] Meio-domínios de clivagem podem também serem providos em moléculas separadas. Por exemplo, dois polipeptídeos de fusão podem ser introduzidos em uma célula, no qual cada polipeptídeo compreende um domínio de ligação e um meio-domínio de clivagem. Os meio-domínios de clivagem podem ter a mesma sequência de ami- noácido ou sequências de aminoácido diferentes, considerando-se que elas funcionam para clivar o DNA. Adicionalmente, os domínios de ligação se ligam a sequências-alvo que são tipicamente dispostas de tal modo que, após ligação dos polipeptídeos de fusão, os dois meio- domínios de clivagem são apresentados em uma orientação espacial entre si que permite reconstituição de um domínio de clivagem (por exemplo, por dimerização dos meio-domínios), posicionando, desse modo, os meio-domínios relativos entre si para formar um domínio de clivagem funcional, resultando em clivagem de cromatina celular em uma região de interesse. Geralmente, clivagem por domínio de clivagem reconstituído ocorre em um local localizado entre as duas sequências-alvo. Uma ou ambas das proteínas podem ser engenheira- das para se ligarem a seu local-alvo.
[00291] As duas proteínas de fusão podem se ligar na região de interesse na mesma ou polaridade oposta, e seus locais de ligações (isto é, locais-alvo) podem ser separados por qualquer número de nu- cleotídeos, por exemplo, de 0 a 200 nucleotídeos ou qualquer valor integral entre estes. Em certas concretizações, os locais de ligações para duas proteínas de fusão, cada uma compreendendo um domínio de ligação de dedo de zinco e um meio-domínio de clivagem, podem estar localizados entre 5 e 18 nucleotídeos à parte, por exemplo, 5-8 nucleotídeos à parte, ou 15-18 nucleotídeos à parte, ou 6 nucleotídeos à parte, ou 16 nucleotídeos à parte, conforme medido a partir da borda de cada local de ligação mais próximo do outro local de ligação, e cli-vagem ocorre entre locais de ligação.
[00292] O local no qual o DNA é clivado geralmente ocorre entre os locais de ligação para as duas proteínas de fusão. A quebra de fita dupla de DNA frequentemente resulta de duas quebras de trançado simples, ou "entalhes" afastados por 1, 2, 3, 4, 5, 6 ou mais nucleotídeos, (por exemplo, clivagem de DNA de fita dupla por Fok I nativo resulta de quebras de trançado única afastadas por 4 nucleotídeos). Desse modo, clivagem não ocorre necessariamente nos lado exatamente opostos em cada trançado de DNA. Em adição, a estrutura das proteínas de fusão e a distância entre os locais-alvo pode influenciar se clivagem ocorre adjacente a um par simples de nucleotídeos, ou se clivagem ocorre em vários locais. Contudo, para quaisquer aplicações, incluindo recombinação-alvo e mutagênese-alvo (vide infra), clivagem dentro de uma faixa de nucleotídeos é geralmente suficiente, e clivagem entre pares de base particulares não é requerida.
[00293] Conforme notado acima, a(s) proteína(s) de fusão pode(m) ser introduzida(s) como polipeptídeos e/ou polinucleotídeos. Por exemplo, dois polinucleotídeos, cada um compreendendo sequências que codificam um dos polipeptídeos antes mencionados, podem ser introduzidos em uma célula, e quando os polipeptídeos são expressos e cada um se liga a sua sequência-alvo, clivagem ocorre em ou próximo a sequência-alvo. Alternadamente, um polinucleotídeo único compreendendo sequências que codificam ambos polipeptídeos de fusão é introduzido em uma célula. Polinucleotídeos podem ser DNA, RNA ou quaisquer formas modificadas ou análogos ou DNA e/ou RNA.
[00294] Para intensificar especificidade de clivagem, composições adicionais podem também ser empregadas nos métodos aqui descritos. Por exemplo, meio-domínios de clivagem simples podem exibir atividade de clivagem de fita dupla. Nos métodos em que duas proteínas de fusão, cada uma contendo um domínio de dedo de zinco de três dedos e um meio-domínio de clivagem, são introduzidas na célula, ou proteína especifica um local-alvo de aproximadamente 9- nucleotídeos. Embora a sequência-alvo agregada de 18 nucleotídeos seja provavelmente para ser única em um genoma de mamífero, qualquer dado local-alvo de 9-nucleotídeos ocorre, em média, aproximadamente 23.000 vezes no genoma humano. Desse modo, clivagem não-específica, devido a ligação específica de local de um meio- domínio simples, pode ocorrer. Consequentemente, os métodos aqui descritos contemplam o uso de um mutante negativo dominante de um meio-domínio de clivagem tal como Fok I (ou um ácido nucleico que codifica o mesmo) que é expresso em uma célula junto com as duas proteínas de fusão. O mutante negativo dominante é capaz de dimeri- zar, mas é incapaz de clivar, e também bloquear a atividade de clivagem de um meio-domínio ao qual ele é dimerizado. Pela provisão do mutante negativo dominante em excesso molar para as proteínas de fusão, somente regiões em que ambas proteínas de fusões são ligadas terão uma concentração local alta bastante de meio-domínios de clivagem funcionais para dimerização e clivagem ocorrerem. Nos locais onde somente uma das duas proteínas de fusão é ligada, seu meio-domínio de clivagem forma um dímero com o mutante negativo dominante, e indesejavelmente, clivagem não-específica não ocorreu.
[00295] Três resíduos de aminoácido catalíticos no Fok I meio- domínio de clivagem foram identificados: Asp 450, Asp 467 e Lys 469. Bitinaite et al. (1998) Proc. Natl. Acad. Sci. USA 95: 10,570-10,575. Desse modo, uma ou mais mutações em um destes resíduos podem ser usadas para gerar uma mutação negativa dominante. Adicionalmente, muitos dos resíduos de aminoácido catalíticos de outras endonucleases Tipo IIS são conhecidos e/ou podem ser determinados, por exemplo, por alinhamento com Fok I sequências e/ou pela geração e teste de mutantes para atividade catalítica.
Mutações de Domínio de Dimerização no Meio-domínio de Clivagem
[00296] Métodos para clivagem-alvo que envolvem o uso de fusões entre uma ZFP e um meio-domínio de clivagem (tal como, por exemplo, uma fusão ZFP/FokI) requer o uso de duas tais moléculas de fusão, cada uma geralmente direcionada a uma sequência-alvo distinta. As sequências-alvo para as duas proteínas de fusão podem ser escolhidas de modo que clivagem-alvo é direcionada a um local único em um genoma, conforme discutido acima. Uma fonte potencial de especificidade de clivagem reduzida pode resultar de homodimerização de um das duas fusões de ZFP/meio-domínio de clivagem. Isto pode ocorrer, por exemplo, devido a presença, em um genoma, de repeti-ções invertidas das sequências-alvo para uma das duas fusões de ZFP/meio-domínio de clivagem, localizadas de modo a permitir que duas cópias da mesma proteína de fusão se ligue com uma orientação e espaçamento que permite formação de um dímero funcional.
[00297] Uma aproximação para redução da probabilidade deste tipo de clivagem aberrante em sequências de outras do que o local-alvo pretendido envolve geração de variantes do meio-domínio de clivagem que minimiza ou previne homodimerização. Preferivelmente, um ou mais aminoácidos na região do meio-domínio envolvidos em sua dime- rização são alterados. Na estrutura de cristal do dímero de FokI proteína, a estrutura dos meio-domínios de clivagem é reportada para ser similar ao arranjo dos meio-domínios de clivagem durante clivagem de DNA por FokI. Wah et al. (1998) Proc. Natl. Acad. Sci. USA 95:1056410569. Esta estrutura indica que os resíduos de aminoácido nas posições 483 e 487 desempenham um papel na dimerização dos FokI meio-domínios de clivagem. A estrutura também indica que resíduos de aminoácido nas posições 446, 447, 479, 483, 484, 486, 487, 490, 491, 496, 498, 499, 500, 531, 534, 537, e 538 estão todos perto o bastante a interface de dimerização para influenciar dimerização. Consequentemente, alterações de sequência de aminoácido em uma ou mais das posições antes mencionadas provavelmente alterarão as propriedades de dimerização do meio-domínio de clivagem. Tais mudanças podem ser introduzidas, por exemplo, pela construção de uma biblioteca contendo (ou que codifica) resíduos de aminoácido diferentes nestas posições e seleção de variantes com as propriedades desejadas, ou por designação racionalmente mutantes individuais. Em adição para prevenir homodimerização, é também possível que algumas destas mutações podem aumentar a eficiência de clivagem acima daquela obtida com dois meio-domínios de clivagem tipo selvagem.
[00298] Consequentemente, alteração de um FokI meio-domínio de clivagem em qualquer resíduo de aminoácido que afeta dimerização pode ser usada para prevenir um de um par de fusões de ZFP/FokI de suportar homodimerização que pode conduzir a clivagem em sequências indesejadas. Desse modo, para clivagem-alvo usando um par de fusões de ZFP/FokI, uma ou ambas das proteínas de fusão podem compreender uma ou mais alterações de amino que inibe auto- dimerização, mas permite que heterodimerização das duas proteínas de fusão ocorra, tal que clivagem ocorre no local-alvo desejado. Em certas concretizações, alterações estão presentes em ambas proteínas de fusão, e as alterações têm efeitos aditivos; isto é, homodimeri- zação de qualquer fusão, conduzindo a clivagem aberrante, é minimizada ou abolida, enquanto heterodimerização das duas proteínas de fusão é facilitada comparado àquela obtida com meio-domínios de clivagem tipo selvagem.
Métodos para Alteração-alvo de Sequências Genômicas Paralogas e Recombinação-alvo
[00299] Também aqui descritos são métodos de substituição de uma sequência genômica, por exemplo, de um ou mais genes paralogos (por exemplo, uma região genômica-alvo de interesse de EPSPS em cromatina celular) com uma sequência não-idêntica homóloga (isto é, recombinação-alvo). Tentativas anteriores de substituir sequências particulares têm envolvido contactar uma célula com um polinucleotí- deo compreendendo sequências que suportam homologia a uma região cromossomal (isto é, um DNA doador), seguido por seleção de células em que a molécula de DNA doadora tenha suportado recombina- ção homóloga no genoma. A taxa de sucesso destes métodos é baixa, devido a pobre eficiência de recombinação homóloga e uma alta frequência de inserção não-específica do DNA doador em regiões do ge- noma outras do que o local-alvo.
[00300] A presente descrição proporciona métodos de alteração de sequência-alvo caracterizada por uma maior eficiência de recombina- ção-alvo e uma frequência inferior de eventos de inserção não- específicos. Os métodos envolvem produção e uso de domínios de ligação de dedo de zinco engenheirada, que se ligam a ou próximos da sequência de gene paraloga (por exemplo, sequência(s) de gene de EPSPS), fundidos a domínios de clivagem (ou meio-domínios de clivagem) para produzir uma ou mais quebras de fita dupla-alvos em DNA celular. Devido a quebras de fita dupla no DNA celular estimular mecanismos de reparos celulares, vários milhares de dobra na vizinhança do local de clivagem, tal como clivagem-alvo permite a altera-ção ou substituição (via reparo direcionado por homologia) de sequências de gene (por exemplo, EPSPS) em virtualmente qualquer local no genoma.
[00301] Os métodos aqui descritos são aplicáveis a qualquer sequência de gene paraloga (por exemplo, EPSPS) de qualquer organismo ou espécie. Em certas concretizações, a região genômica-alvo de EPSPS que é alterada pertence a um gene de EPSPS compreendendo uma sequência de nucleotídeo selecionada a partir do grupo consistindo em SEQ ID NOS:10-14, ou uma sequência tendo pelo menos cerca de 80-100% de identidade de sequência, incluindo qualquer percentagem de identidade dentro destas faixas, tais como 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99% de identidade de sequência.
[00302] Em adição às moléculas de fusão aqui descritas, substituição-alvo de uma sequência genômica selecionada também requer a introdução da sequência de substituição (ou doadora). A sequência doadora pode ser introduzida na célula antes de, concorrentemente com, ou subsequente a expressão da(s) proteína(s) de fusão. O poli- nucleotídeo doador contém homologia suficiente a uma sequência ge- nômica (por exemplo, EPSPS) para suportar recombinação homóloga (ou reparo direcionado por homologia) entre ela e a sequência genô- mica de EPSPS a qual ela suporta homologia. Aproximadamente 25, 50 100, 200, 500, 750, 1.000, 1.500, 2.000 nucleotídeos ou mais de homologia de sequência entre uma sequência doadora e genômica (ou qualquer valor integral entre 10 e 2.000 nucleotídeos, ou mais) suportarão recombinação homóloga entre estes. As sequências doadoras podem variar de comprimento de 10 a 5.000 nucleotídeos (ou qualquer valor integral de nucleotídeos entre estes) ou mais longo. Será prontamente aparente que a sequência doadora não é tipicamente idêntica à sequência genômica que ela substitui. Por exemplo, a sequência do polinucleotídeo doador pode conter uma ou mais mudanças de base simples, inserções, deleções, inversões ou rearranjos com relação a sequência genômica, condiderando-se que homologia suficiente com sequências cromossomais está presente. Alternativamente, uma sequência doadora pode conter uma sequência não-homóloga flanqueada por duas regiões de homologia. Adicionalmente, sequências doadoras podem compreender uma molécula de vetor contendo sequências que não são homólogas à região de interesse em cromatina celular. Geralmente, a(s) região(ões) homóloga(s) de uma sequência doadora terá pelo menos 50% de identidade de sequência a uma sequência genômica com a qual recombinação é desejada. Em certas concretizações, 60%, 70%, 80%, 90%, 95%, 98%, 99%, ou 99,9% de identidade de sequência está presente. Qualquer valor entre 1% e 100% de identidade de sequência pode estar presente, dependendo do comprimento do polinucleotídeo doador.
[00303] Uma molécula doadora pode conter várias regiões descontínuas de homologia a cromatina celular. Por exemplo, a inserçãoalvo de sequências não-normalmente presentes em uma região de interesse, referidas sequências podendo estar presentes em uma molécula de ácido nucleico doadora e flanqueadas por regiões de homologia a uma sequência de gene na região de interesse.
[00304] Para simplificar ensaios (por exemplo, hibridização, PCR, digestão de enzima de restrição) para determinação de inserção bem- sucedida da sequência doadora, certas diferenças de sequência podem estar presentes na sequência doadora conforme comparada à sequência genômica de EPSPS. Preferivelmente, se localizadas em uma região de codificação, tais diferenças de sequência de nucleotí- deo não mudarão a sequência de aminoácido, ou produzirá mudanças mudas no aminoácido (isto é, mudanças que não afetam a estrutura ou função da proteína). O polinucleotídeo doador pode opcionalmente conter mudanças em sequências correspondentes ao domínio de dedo de ligações locais de zinco na região de interesse, para prevenir clivagem de sequências doadoras que foram introduzidas na cromatina celular por recombinação homóloga.
[00305] O polinucleotídeo doador pode ser DNA ou RNA, de trançado única ou de fita dupla e pode ser introduzido em uma célula na forma linear ou circular. Se introduzidas na forma linear, as extremidades da sequência doadora pode ser protegida (por exemplo, de degradação éxonucleolítica) por métodos conhecidos àqueles versados na técnica. Por exemplo, um ou mais resíduos de dideoxinucleotídeo são adicionados ao 3' terminal de uma molécula linear e/ou oligonucleotí- deos autocomplementares são ligados a uma ou ambas extremidades. Vide, por exemplo, Chang et al. (1987) Proc. Natl. Acad. Sci. USA 84:4959-4963; Nehls et al. (1996) Science 272:886-889. Métodos adicionais para proteção de polinucleotídeos exógenos de degradação incluem, mas não estão limitados a, adição de grupo(s) amino terminal e o uso de ligações de internucleotídeo modificadas tais como, por exemplo, fosforotioatos, fosforamidatos, e resíduos de O-metil ribose ou deoxirribose.
[00306] Um polinucleotídeo pode ser introduzido em uma célula como parte de uma molécula de vetor tendo sequências adicionais tais como, por exemplo, origens de replicação, promotores e genes que codificam resistência ao antibiótico. Além disso, polinucleotídeos doadores podem ser introduzidos como ácido nucleico não-revestido, como ácido nucleico complexado com um agente tal como um lipossomo ou poloxâmero, ou pode ser distribuído por bactérias ou vírus (por exemplo, Agrobacterium, Rhizobium sp. NGR234, Sinorhizoboium meliloti, Mesorhizobium loti, vírus de mosaico do tabaco, vírus X da batata, vírus de mosaico de couve-flor e vírus de mosaico de veia de mandioca. Vide, por exemplo, Chung et al. (2006) Trends Plant Sci. 11(1):1-4.
[00307] Sem estar ligado pela teoria, parece que a presença de uma quebra de fita dupla em uma sequência celular, acoplada com a presença de uma molécula de DNA exógena tendo homologia a uma região adjacente a ou circundando a quebra, ativa mecanismos celulares que reparam a quebra por transferência de informação de sequência a partir da molécula doadora na sequência celular (por exemplo, genômica ou cromossomal); isto é, por um processo de reparo direcionado por homologia, também conhecido como "conversão de gene". Os métodos da requerente vantajosamente combinam as capacidades de alvo ponderosas de ZFPs engenheiradas com um domínio de clivagem (ou meio-domínio de clivagem) a genes parologos especificamente alvos tais como genes de EPSPS tal que clivagem da sequência- alvo produz uma quebra de fita dupla na região do genoma onde inserção de sequências exógenas é desejada.
[00308] Para alteração de uma sequência cromossomal, não é necessário para a sequência total do doador ser copiada no cromossomo, considerando-se que bastante da sequência doadora é copiada para efetuar a alteração de sequência desejada.
[00309] A eficiência de inserção de sequências doadoras por re- combinação homóloga é inversamente relacionada à distância, no DNA celular, entre a quebra de fita dupla e o local no qual recombina- ção é desejada. Em outras palavras, eficiências de recombinação homóloga mais altas são observadas quando a quebra de fita dupla está mais próxima ao local no qual recombinação é desejada. Em casos em que um local preciso de recombinação não é predeterminado (por exemplo, o evento de recombinação desejado pode ocorrer sobre um intervalo de sequência genômica), o comprimento e sequência do ácido nucleico doador, junto com o(s) local(is) de clivagem, são selecionados para obter o evento de recombinação desejado. Em casos em que o evento desejado é designado para mudar a sequência de um par de nucleotídeos simples em uma sequência genômica, cromatina celular é clivada dentro de 10.000 nucleotídeos em qualquer lado daquele par de nucleotídeos. Em certas concretizações, clivagem ocorre dentro de 1000, 500, 200, 100, 90, 80, 70, 60, 50, 40, 30, 20, 10, 5, ou 2 nucleotídeos, ou qualquer valor integral entre 2 e 1,000 nucleotídeos, em qualquer lado do par de nucleotídeos cuja sequência é para ser mudada.
[00310] Conforme detalhado acima, os locais de ligação para duas proteínas de fusão, cada uma compreendendo um domínio de ligação de dedo de zinco e um meio-domínio de clivagem, podem estar localizados 5-8 ou 15-18 nucleotídeos à parte, conforme medido a partir da borda de cada local de ligação mais próximo do outro local de ligação, e clivagem ocorre entre os locais de ligações. Se clivagem ocorre em um local simples ou em locais múltiplos entre os locais de ligação é imaterial, visto que as sequências genômicas clivadas são substituídas pelas sequências doadoras. Desse modo, para alteração eficiente da sequência de um par de nucleotídeos simples por recombinação-alvo, o ponto médio da região entre os locais de ligação é dentro de 10.000 nucleotídeos de par de nucleotídeos, preferivelmente dentro de 1.000 nucleotídeos, ou 500 nucleotídeos, ou 200 nucleotídeos, ou 100 nu- cleotídeos, ou 50 nucleotídeos, ou 20 nucleotídeos, ou 10 nucleotí- deos, ou 5 nucleotídeos, ou 2 nucleotídeos, ou um nucleotídeo, ou no par de nucleotídeos de interesse.
[00311] Em certas concretizações, um cromossomo homólogo pode servir como o polinucleotídeo doador. Desse modo, por exemplo, correção de uma mutação em um heterozigoto pode ser alcançada por projeto de proteínas de fusão que se ligam a e clivam a sequência mutante em um cromossomo, mas não clivam a sequência tipo selvagem no cromossomo homólogo. A quebra de fita dupla no cromossomo suportando mutação estimula um processo de "conversão de gene" baseado em homologia em que a sequência tipo selvagem a partir do cromossomo homólogo é copiada no cromossomo clivado, restaurando, desse modo, duas cópias da sequência tipo selvagem.
[00312] Métodos e composições são também providos que podem aumentar níveis de recombinação-alvo incluindo, mas não limitados ao uso de fusões de domínio funcional de ZFP adicional par ativar expressão de genes envolvida em recombinação homóloga, tal como, por exemplo, membros do grupo RAD52 epistasis (por exemplo, Rad50, Rad51, Rad51B, Rad51C, Rad51D, Rad52, Rad54, Rad54B, Mre11, XRCC2, XRCC3), genes cujos produtos interagem com os produtos de gene antes mencionados (por exemplo, BRCA1, BRCA2) e/ou genes no complexo NBS1. Vide, por exemplo, Boyko et al. (2006) Plant Physiology 141:488-497 e LaFarge et al. (2003) Acid nucleics Res 31(4): 1148-1155. Similarmente fusões de domínio funcional de ZFP podem ser usadas, em combinação com os métodos e composições aqui descritos, para repressar expressão de genes envolvida em união terminal não-homóloga (por exemplo, Ku70/80, XRCC4, poly(ADP ribose) polimerase, DNA ligase 4). Vide, por exemplo, Riha et al. (2002) EMBO 21:2819-2826; Freisner et al. (2003) Plant J. 34:427-440; Chen et al. (1994) European Journal of Biochemistry 224:135-142. Métodos para ativação e repressão de expressão de gene usando fusões entre um domínio de ligação de dedo de zinco e um domínio funcional são descritos, por exemplo, nas Patente U.S. 6.534.261; 6.824.978 e 6.933.113 de propriedade da mesma requerente. Métodos de repressão adicionais incluem o uso de oligonucleotí- deos de antissenso e/ou RNA de pequena interferência RNA (siRNA ou RNAi) ou shRNAs alvos para a sequência do gene a ser repressa- da.
[00313] Como uma alternativa a ou, em adição a, ativação de expressão de produtos de gene envolvida na recombinação homóloga, fusões destas proteínas (ou fragmentos funcionais destas) com um domínio de ligação de dedo de zinco-alvo para a região genômica de interesse (por exemplo, EPSPS), podem ser usadas para recrutar estas proteínas (proteínas de recombinação) para a região de interesse, aumentando, desse modo, sua concentração local e estimulando adicionalmente processos de recombinação homóloga. Alternativamente, um polipeptídeo envolvido na recombinação homóloga conforme descrito acima (ou um fragmento funcional deste) pode ser parte de uma proteína de fusão tripla compreendendo um domínio de ligação de de- do de zinco, um domínio de clivagem (ou meio-domínio de clivagem) e a proteína de recombinação (ou fragmento funcional desta). Proteínas adicionais envolvidas na conversão de gene e remodelagem de cro- matina relacionada à conversão, que podem ser usadas nos métodos e composições antes mencionados, incluem histona acetiltransferases (por exemplo, Esa1p, Tip60), histona metiltransferases (por exemplo, Dot1p), histona quinases e histona fosfatases. Vide, também, Bhat et al. (1999) Plant J. 33:455-469
[00314] Aumentos adicionais na eficiência de recombinação-alvo, em células compreendendo uma molécula de fusão de dedo de zin- co/nuclease e uma molécula de DNA doadora, são alcançados por bloqueio das células na fase G2 do ciclo de célula, quando processos de reparo acionados por homologia são maximamente ativos. Tal impedimento pode ser alcançado em um número de modos. Por exemplo, células podem ser tratadas com, por exemplo, fármacos, compostos e/ou moléculas pequenas que influenciam a progressão do ciclo de célula de modo a impedir as células na fase G2. Moléculas exemplares deste tipo incluem, mas não estão limitadas a, compostos que afetam polimerização de microtúbulo (por exemplo, vinblastina, nocodazole, Taxol), compostos que interagem com DNA (por exemplo, cis- platina(II) diamina dicloreto, Cisplatin, doxorubicin) e/ou compostos que afetam síntese de DNA (por exemplo, timidina, hidroxiuréia, L- mimosina, etoposide, 5-fluorouracil). Aumentos adicionais na recombi- nação de eficiência são alcançados pelo uso de inibidores de histona desacetilase (HDAC) (por exemplo, butirato de sódio, trichostatin A) que alteram a estrutura da cromatina para produzir DNA genômico mais acessível a maquinaria de recombinação celular.
[00315] Métodos adicionais para impedimento de ciclo de célula incluem sobre expressão de proteínas que inibem a atividade da célula CDK-ciclo de quinases, por exemplo, pela introdução de um cDNA que codifica a proteína na célula ou pela introdução na célula de uma ZFP engenheirada que ativa expressão do gene que codifica a proteína. Impedimento de ciclo de célula é também alcançado pela inibição da atividade de ciclinas e CDKs, por exemplo, usando métodos de RNAi (por exemplo, Patente U.S. N° 6.506.559) ou por introdução na célula de uma ZFP engenheirada que repressa expressão de um ou mais genes envolvidos na progressão de ciclo de célula tal como, por exemplo, ciclina e/ou genes CDK. Vide, por exemplo, Patente U.S. N° 6.534.261 de propriedade da mesma requerente para métodos para a síntese de proteínas de dedo de zinco engenheiradas para regulação de expressão de gene.
[00316] Alternativamente, em certas casos, clivagem-alvo é conduzida na ausência de um polinucleotídeo doador (preferivelmente na fase S ou G2), e recombinação ocorre entre cromossomos homólogos.
Vetores de Expressão
[00317] Um ácido nucleico que codifica uma ou mais ZFPs pode ser clonado em um vetor para transformação em células procariótica ou eucariótica para replicação e/ou expressão. Vetores podem ser vetores procarióticos, por exemplo, plasmídeos, ou vetores de lançadeira, vetores de inseto, ou vetores eucarióticos. Um ácido nucleico que codifica uma ZFP pode também ser clonado em um vetor de expressão, para administração a uma célula de planta.
[00318] Para expressar ZFPs, sequências que codificam ZFPs são tipicamente subclonados em um vetor de expressão que contém um promotor para direcionar transcrição. Promotores bacteriais e eucarió- tico adequados são bem-conhecidos na técnica e descritos, por exemplo, em Sambrook et al., Molecular Cloning, A Laboratory Manual (2nd ed. 1989; 3a ed., 2001); Kriegler, Gene Transfer e Expression: A Laboratory Manual (1990); e Current Protocols in Molecular Biology (Ausu- bel et al., supra. Sistemas de expressão bacteriais para expressar uma ZFP são disponíveis em, por exemplo, E. coli, Bacillus sp., e Salmonella (Palva et al., Gene 22:229-235 (1983)). Kits para tais sistemas de expressão são comercialmente disponíveis. Sistemas de expressão eucarióticos para células de mamífero, levedura, e células de inseto são bem-conhecidos por aqueles versados na técnica e são também comercialmente disponíveis.
[00319] O promotor usado para direcionar expressão de uma ZFP que codifica ácido nucleico depende da aplicação particular. Por exemplo, um promotor constitutivo forte adequado à célula hospedeira é tipicamente usado para expressão e purificação de ZFPs.
[00320] Em contraste, quando uma ZFP é administrada in vivo para regulação de um gene de planta (vide, "Acid nucleic Delivery to Plant Cell" seção abaixo), ou um promotor constitutivo ou um promotor indu- zível é usado, dependendo do uso particular de uma ZFP. Exemplos não-limitativos de promotores de planta incluem sequências de promotor derivadas de A. thaliana ubiquitin-3 (ubi-3) (Callis, et al., 1990, J. Biol. Chem. 265-12486-12493); A. tumifaciens mannopine synthase (Δmas) (Petolino et al., Patente U.S. N° 6.730.824); e/ou Vírus de Mosaico de Veia de Mandioca (CsVMV) (Verdaguer et al., 1996, Planta Molecular Biology 31:1129-1139). Vide, também, Exemplos.
[00321] Em adição ao promotor, o vetor de expressão tipicamente contém uma unidade de transcrição ou cassete de expressão que contém todos os elementos adicionais requeridos para a expressão do ácido nucleico em células hospedeiras, ou procarióticas ou eucarióti- cas. Um cassete de expressão típico desse modo contém um promotor operavelmente ligado, por exemplo, a uma sequência de ácido nuclei- co que codifica uma ZFP, e sinais requeridos, por exemplo, para polia- denilação eficiente da transcrição, terminação transcricional, locais de ligação de ribossoma, ou terminação de translação. Elementos adicionais do cassete podem incluir, por exemplo, intensificadores, e sinais de união heterólogos.
[00322] O vetor de expressão particular usado para transportar a informação genética na célula é selecionado com relação ao uso pretendido de uma ZFP, por exemplo, expressão em plantas, animais, bactéria, fungos, protozoários etc. (vide vetores de expressão descrito abaixo). Vetores de expressão bacterial e animal padrão são conhecidos na técnica e são descritos em detalhe, por exemplo, Publicação de Patente U.S. 20050064474A1 e Publicações de Patente Internacional WO05/084190, WO05/014791 e WO03/080809.
[00323] Métodos de transfecção padrão podem ser usados para produzir linhagens celulares bacteriais, de mamífero, levedura ou de inseto que expressam grandes quantidades de proteína, que podem então serem purificadas usando-se técnicas padrão (vide, por exemplo, Colley et al., J. Biol. Chem. 264:17619-17622 (1989); Guide to Protein Purification, in Methods in Enzymology, vol. 182 (Deutscher, ed., 1990)). As transformações de células eucarióticas e procarióticas são realizadas de acordo com técnicas padrão (vide, por exemplo, Morrison, J. Bact. 132:349-351 (1977); Clark-Curtiss & Curtiss, Methods in Enzymology 101:347-362 (Wu et al., eds., 1983).
[00324] Quaisquer dos procedimentos bem-conhecidos para introdução de sequência estranha de nucleotídeos em tais células hospedeiras podem ser usados. Estes incluem o uso de transfecção de fosfato de cálcio, polibreno, fusão de protoplasto, eletroporação, métodos ultrassônicos (por exemplo, sonoporação), lipossomas, microinjeção, DNA não-revestido, vetores de plasmídeo, vetores virais, ambos epis- somal e integrativo, e qualquer dos outros métodos bem-conhecidos para introdução de DNA genômico clonado, cDNA, DNA sintético ou outro material genético estranho em uma célula hospedeira (vide, por exemplo, Sambrook et al., supra). É somente necessário que o procedimento de engenharia genética particular usado seja capaz de intro- duzir bem-sucedidamente pelo menos um gene na célula hospedeira capaz de expressar a proteína de escolha.
Distribuição de Ácidonucléico a Células de Planta
[00325] Conforme notado acima, construções de DNA podem ser introduzidas em (por exemplo, no genoma de) um hospedeiro de planta desejado por uma variedade de técnicas convencionais. Para revisões de tais técnicas ver, por exemplo, Weissbach & Weissbach Methods for Plant Molecular Biology (1988, Academic Press, N.Y.) Seção VIII, pp. 421-463; e Grierson & Corey, Plant Molecular Biology (1988, 2d Ed.), Blackie, London, Ch. 7-9.
[00326] Por exemplo, a construção de DNA pode ser introduzida diretamente no DNA genômico da célula de planta usando técnicas tais como eletroporação e microinjeção de protoplastos de célula de planta, ou as construções de DNA podem ser introduzidas diretamente ao tecido de planta usando-se métodos biolísticos, tais como bombardeio de partícula de DNA (vide, por exemplo, Klein et al (1987) Nature 327:70-73). Alternativamente, as construções de DNA podem ser combinadas com regiões de flanqueamento de T-DNA adequadas e introduzidas em um vetor hospedeiro de Agrobacterium tumefaciens convencional. Técnicas de transformação mediadas por Agrobacterium tumefaciens, incluindo desarmamento e uso de vetores binários, são bem-descritas na literatura científica. Vide, por exemplo, Horsch et al (1984) Science 233:496-498, e Fraley et al (1983) Proc. Nat'l. Acad. Sci. USA 80:4803.
[00327] Em adição, a transferência de gene pode ser alcançada usando-se bactérias não-Agrobacterium ou vírus tais como Rhizobium sp. NGR234, Sinorhizoboium meliloti, Mesorhizobium loti, vírus X de batata, vírus de mosaico de couve-flor e vírus de mosaico de veia de mandioca e/ou vírus de mosaico de tabaco, Vide, por exemplo, Chung et al. (2006) Trends Plant Sci. 11(1):1-4.
[00328] As funções de virulência do hospedeiro Agrobacterium tu- mefaciens direcionará a inserção da construção e marcador adjacente no DNA de célula de planta quando a célula é infectada pela bactéria usando vetor de DNA T binário (Bevan (1984) Nuc. Acid Res. 12:8711-8721), ou o procedimento de cocultivo (Horsch et al (1985) Science 227:1229-1231). Geralmente, o sistema de transformação de Agrobacterium é usado para engenheirar plantas dicotiledôneas (Bevan et al (1982) Ann. Rev. Genet 16:357-384; Rogers et al (1986) Methods Enzymol. 118:627-641). O sistema de transformação de Agrobacterium pode também ser usado para transformar, bem como transferir, DNA para plantas monocotiledôneas e células de planta. Vide Patente U.S. N° 5.591.616; Hernalsteen et al (1984) EMBO J 3:3039-3041; Hooykass-Van Slogteren et al (1984) Nature 311:763-764; Grimsley et al (1987) Nature 325:1677-179; Boulton et al (1989) Planta Mol. Biol. 12:31-40.; e Gould et al (1991) Plant Physiol. 95:426-434.
[00329] Métodos alternativos de transferência de gene e de transformação incluem, mas não estão limitados a, transformação de proto- plasto através de cálcio-, polietileno glicol (PEG)- ou entendimento mediado por eletroporação de DNA não-revestido (vide Paszkowski et al. (1984) EMBO J 3:2717-2722, Potrykus et al. (1985) Molec. Gen. Genet. 199:169-177; Fromm et al. (1985) Proc. Nat. Acad. Sci. USA 82:5824-5828; e Shimamoto (1989) Nature 338:274-276), e eletropo- ração de tecidos de planta (D'Halluin et al. (1992) Plant cell 4:1495-1505). Métodos adicionais para transformação de célula de planta incluem microinjeção, entendimento de DNA mediado por car- beto de silício (Kaeppler et al. (1990) Plant Cell Reporter 9:415-418), e bombardeio de microprojétil (vide Klein et al. (1988) Proc. Nat. Acad. Sci. USA 85:4305-4309; e Gordon-Kamm et al. (1990) Plant cell 2:603-618).
[00330] Os métodos e composições descritos podem ser usados para inserir sequências exógenas em uma localização predeterminada em um genoma de célula de planta. Isto é útil visto que conforme expressão de um transgene introduzido em um genoma de planta depende criticamente de seu local de integração. Consequentemente, genes que codificam, por exemplo, nutrientes, antibióticos ou moléculas terapêuticas podem ser inseridos por recombinação-alvo nas regiões de um genoma de planta favoráveis a sua expressão.
[00331] Células de planta transformadas que são produzidas por qualquer das técnicas de transformação acima podem ser cultivadas para regenerar uma planta total que possui o genótipo transformado e, desse modo, o fenótipo desejado. As técnicas de regeneração ocorrem na manipulação de certos fito-hormônios em um meio de crescimento de cultura de tecido, tipicamente ocorrendo em um marcador de biocida e/ou herbicida que foi introduzido junto com as sequências de nucleotídeo desejadas. A regeneração de planta de protoplastos cultivados é descrita em Evans, et al., "Protoplasts Isolation e Culture" in Handbook of Plant Cell Culture, pp. 124-176, Macmillian Publishing Compqualquer, New York, 1983; e Binding, Regeneration of Plants, Plant Protoplasts, pp. 21-73, CRC Press, Boca Raton, 1985. A regeneração pode também ser obtida de calo de planta, explante, órgãos, pó- lens, embriões ou partes destes. Tais técnicas de regeneração são descritas geralmente em Klee et al (1987) Ann. Rev. of Planta Phys. 38:467-486.
[00332] Ácidos nucleicos introduzidos em uma célula de planta podem ser usados para conferir traços desejados em essencialmente qualquer planta. Uma ampla variedade de plantas e sistemas de célula de planta pode ser engenheirada para as características fisiológicas e agronômicas desejadas aqui descritas usando-se as construções de ácido nucleico da presente descrição e os vários métodos de transfor- mação acima mencionados. Em concretizações preferidas, plantasalvo e células de planta para engenharia incluem, mas não estão limitados, àquelas plantas monocotiledôneas e dicotiledôneas, tais como colheitas incluindo colheitas de grão (por exemplo, trigo, painço, cevada), colheitas de fruto (por exemplo, tomate, maçã, pêra, morango, laranja), colheitas de forragem (por exemplo, alfalfa), colheitas de vegetais de raiz (por exemplo, cenoura, batata, beterrabas, inhame), colheitas de vegetal folhoso (por exemplo, alface, espinafre); plantas de florescimento (por exemplo, petúnia, rosa, crisântemo), coníferas e árvores de pinho (por exemplo, abeto de pinho, abeto vermelho); plantas usadas em fitoremediação (por exemplo, plantas de acúmulo de metal pesado); colheitas de óleo (por exemplo, girassol, semente de colza) e plantas usadas para proposta experimental (por exemplo, Arabi- dopsis). Desse modo, os métodos e composições descritos têm uso dobre uma ampla faixa de plantas, incluindo, mas não limitadas a, espécies do gênero Asparagus, Avena, Brassica, Citrus, Citrullus, Capsicum, Cucurbita, Daucus, Erigeron, Glycine, Gossypium, Hordeum, Lactuca, Lolium, Lycopersicon, Malus, Manihot, Nicotiana, Orycho- phragmus, Oryza, Persea, Phaseolus, Pisum, Pyrus, Prunus, Ra- phanus, Secale, Solanum, Sorghum, Triticum, Vitis, Vigna, e Zea.
[00333] Um versado na técnica reconhecerá que após o cassete de expressão ser estavelmente incorporado em plantas transgênicas e confirmado ser operável, ele pode ser introduzido em outras plantas por cruzamento sexual. Qualquer de um número de técnicas de geração-padrão pode ser usado, dependendo da espécie a ser cruzada.
[00334] Uma célula de planta transformada, calo, tecido ou planta podem ser identificados e isolados por seleção ou classificação do material de planta engenheirado para traços codificados pelos genes marcadores presentes no DNA de transformação. Por exemplo, a seleção pode ser realizada pelo crescimento do material de planta enge- nheirado no meio contendo uma quantidade inibitória do antibiótico ou herbicida ao qual a construção de gene de transformação confere resistência. Adicionalmente, plantas transformadas e células de planta podem também serem identificadas por classificação das atividades de quaisquer genes marcadores visíveis (por exemplo, a β-glucuronidase, luciferase, genes B ou C1) que podem estar presente nas construções de ácido nucleico recombinante. Tais metodologias de seleção e classificação são bem-conhecidas àqueles versados na técnica.
[00335] Métodos físicos e bioquímicos também podem ser usados para identificar planta ou transformantes de célula de planta contendo construções de gene inseridas. Estes métodos incluem, mas não estão limitados a: 1) análise de Southern ou amplificação de PCR para detecção e determinação da estrutura do inserto de DNA recombinante; 2) Northern blot, proteção de S1 RNase, amplificação de PCR- extensão de iniciador ou transcriptase reversa para detecção e exame de transcrições de RNA das construções de gene; 3) ensaios enzimá- ticos para detecção de enzima ou atividade de ribozima, onde tais produtos de gene são codificados pela construção de gene; 4) eletroforese de gel de proteína, técnicas de mancha de Western, imunoprecipi- tação, ou imunoensaios ligados à enzima, onde os produtos de construção de gene são proteínas. Técnicas adicionais, tais como hibridi- zação in situ, manchamento de enzima, e imunomanchamento, também podem ser usadas para detectar a presença ou expressão da construção recombinante em órgãos de planta específicos e tecidos. Os métodos para e fazer estes ensaios bem-conhecidos àqueles versados na técnica.
[00336] Efeitos de manipulação de gene usando os métodos aqui descritos podem ser observados por, por exemplo, manchas de northern blot do RNA (por exemplo, mRNA) isoladas a partir dos tecidos de interesse. Tipicamente, se a quantidade de mRNA aumentou, pode ser assumido que o gene endógeno correspondente está sendo expresso a uma taxa maior do que antes. Outros métodos de medição de gene e/ou atividade de CYP74B podem ser usados. Tipos diferentes de ensaios enzimáticos podem ser usados, dependendo do substrato usado e do método de detecção do aumento ou diminuição de um produto de reação ou subproduto. Em adição, os níveis de e/ou proteína de CYP74B expressos podem ser medidos imunoquimicamente, isto é, ELISA, RIA, EIA e outros ensaios baseados em anticorpo bem- conhecidos àqueles versados na técnica, tais como por ensaios de detecção eletroforéticos (ou com manchamento ou western blot). O transgene pode ser seletivamente expresso em alguns tecidos da planta ou em alguns estágios de desenvolvimento, ou o transgene pode ser expresso em substancialmente todos os tecidos de planta, substancialmente ao longo de seu ciclo de vida total. Contudo, qualquer modo de expressão combinatorial é também aplicável.
[00337] A presente descrição também envolve sementes das plantas transgênicas descritas acima no qual a semente tem o transgene ou construção de gene. A presente descrição envolve adicionalmente a progenia, clones, linhagens celulares ou células das plantas trans- gênicas descritas acima no qual referida progenia, clone, linhagem celular ou célula tem o transgene ou construto de gene.
[00338] ZFPs e vetores de expressão que codificam ZFPs podem ser administrados diretamente à planta para regulação de gene, clivagem-alvo, e/ou recombinação. Em certas concretizações, a planta contém genes-alvo paralogos múltiplos. É conhecido que plantas podem conter genes paralogos múltiplos, por exemplo, B. napus tem 5 genes de EPSPS paralogos (SEQ ID NOS:10-14), que podem ser direcionados por uma ou mais ZFPs (vide Exemplos). Desse modo, uma ou mais ZFPs diferentes ou vetores de expressão que codificam ZFPs podem ser administrados a uma planta de modo a direcionar um ou mais genes de EPSPS na planta. Por exemplo, 1, 2, 3, 4, 5, ou até qualquer número de paralogos (por exemplo, paralogos de EPSPS paralogos) ou todos os paralogos (por exemplo, paralogos de EPSPS) presentes em uma planta podem ser direcionados.
[00339] Em certas concretizações, o gene de EPSPS direcionado compreende uma sequência de nucleotídeo selecionada a partir do grupo consistindo em SEQ ID NOS:10-14 ou uma sequência tendo pelo menos cerca de 80-100% de identidade de sequência, incluindo qualquer percentagem de identidade dentro destas fixas, tais como 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99% de identidade de sequência.
[00340] A administração de quantidades eficazes é por qualquer das rotas normalmente usadas para introdução de ZFPs em contato final com a célula de planta a ser tratada. ZFPs são administradas em qualquer maneira adequada, preferivelmente com veículos farmaceuti- camente aceitáveis. Métodos adequados de administração de tais mo- duladores são disponíveis e bem-conhecidos àqueles versados na técnica, e, embora mais do que uma rota possa ser usada para administrar uma composição particular, um rota particular pode frequentemente proporcionar uma reação mais imediata e mais eficaz do que outra rota.
[00341] Veículos podem também serem usados e são determinados em parte pela composição particular sendo administrada, bem como pelo método particular usado para administrar a composição. Consequentemente, existe uma ampla variedade de formulações de composições farmacêuticas que são disponíveis (vide, por exemplo, Remington's Pharmaceutical Sciences, 17th ed. 1985).
Aplicações
[00342] Uma área particular de interesse na agricultura é o aperfeiçoamento genético de plantas para conferir resistência ao herbicida. Muitos herbicidas agem por inibição de uma enzima de planta chave ou proteína necessária para crescimento. Por exemplo, o glifosato de herbicida destrói plantas por inibição da atividade da enzima 5- enolpiruvil-3-fosfoshiquimato síntese (EPSPS), que sintetiza aminoáci- dos automáticos. Plantas tolerantes ao glifosato foram produzidas por inserção de transgenes de EPSPS em genomas de planta, sobre expressão de EPSPS, e mutação seletiva de EPSPS para produzir mu- tantes resistentes à glifosato (vide, por exemplo, Patentes U.S. N— 5.312.910 e 6.987.213; e Papanikou et al. (2004) Plant 218(4):589- 598).
[00343] Por exemplo, os métodos e composições descritos podem ser usados para modular expressão e para alteração-alvo de genes de EPSPS. Em um aspecto, ZFPs engenheirados são usados para expressão regulada ascendente e descendente de EPSPS em uma planta. ZFPs estão opcionalmente associadas aos domínios regulatórios para modulação de expressão de gene, que pode ser covalentemente ou não-covalentemente associada, e ativa ou reprime transcrição de gene de EPSPS. Tais ZFPs podem ser usadas para aumentar ou diminuir a produção da enzima de EPSPS, controlar biossíntese de ami- noácidos aromáticos em plantas, ou aumentar ou diminuir tolerância de uma planta ao glifosato de herbicida, por exemplo, para produzir colheitas resistentes ao glifosato de herbicida, aumentar rendimentos de colheita, ou reverter resistência ao glifosato em plantas de erva- daninhas ou selvagens.
[00344] Composições compreendendo uma ou mais ZFPs, ou poli- nucleotídeos que codifica as mesmas, podem ser administradas a uma célula de planta. Em uma concretização, pelo menos duas ZFPs que reconhecem ou a mesma sequência-alvo de um gene de EPSPS ou uma sequência-alvo diferente, ou polinucleotídeos que codificam tais ZFPs, são administrados a uma célula. A primeira ZFP opcionalmente é associada à segunda ZFP, ou covalentemente ou não- covalentemente. O reconhecimento de locais-alvo adjacentes por ZFPs ou associadas ou individuais pode ser usado para produzir ligação cooperativa de ZFPs, resultando em afinidades que são maiores do que as afinidades de ZFPs quando individualmente ligadas a seus respectivos locais-alvo.
[00345] Para repressão de expressão de gene, tipicamente a expressão do gene é reduzida por cerca de 20% (isto é, 80% de uma expressão modulada de não-ZFP), mais preferivelmente por cerca de 50% (isto é, 50% de expressão modulada não-ZFP), mais preferivelmente por cerca de 75-100% (isto é, 25% a 0% de uma expressão modulada não-ZFP). Para ativação de expressão de gene, tipicamente expressão é ativada por cerca de 1,5 vezes (isto é, 150% de expressão modulada não-ZFP), preferivelmente 2 vezes (isto é, 200% de expressão modulada não-ZFP), mais preferivelmente 5-10 vezes (isto é, 500-1000% de expressão modulada não-ZFP), até pelo menos 100 vezes ou mais.
[00346] A expressão de ativadores de ZFP engenheirados e ativa- dores e repressores pode também ser controlada por sistemas regula- tórios de molécula pequena, tais como tet-sistemas regulados e o sistema RU-486 (vide, por exemplo, Gossen & Bujard, PNAS 89:5547 (1992); Oligino et al., Gene Ther. 5:491-496 (1998); Wang et al., Gene Ther. 4:432-441 (1997); Neering et al, Blood 88:1147-1155 (1996); e Rendahl et al., Nat. Biotechnol. 16:757-761 (1998)). Estes sistemas regulatórios concedem controle de molécula pequena na expressão de ativadores e repressores de ZFP e impõem um nível adicional de controle do(s) gene(s)-alvo(s) de interesse (por exemplo, EPSPS).
[00347] Em outro aspecto, ZFNs são usadas para induzir mutações em uma sequência genômica de EPSPS, por exemplo, por clivagem em dois locais e deletando sequências, por clivagem em um local sim ples, seguido por união terminal não-homóloga, clivando em um ou dois locais com inserção de uma sequência exógena entre as quebras e/ou por clivagem em um local de modo a remover um ou dois ou uns poucos nucleotídeos. A clivagem-alvo pode também ser usada para criar eliminações de gene (por exemplo, para genômicos funcionais ou validação-alvo) e para facilitar inserçãoalvo de uma sequência em um genoma (isto é, eliminação de gene); por exemplo, para proposta de projeto de célula ou sobre expressão de proteína. A inserção pode ser por meio de substituições de sequências cromossomais através de recombinação homóloga ou por integração-alvo, em que uma nova sequência (isto é, uma sequência não-presente na região de interesse), flanqueada por sequências homólogas para a região de interesse no cromossomo, é inserida em um local-alvo predeterminado. Os mesmos métodos podem também serem usados para substituir uma sequência de gene de EPSPS tipo selvagem com uma sequência de gene de EPSPS mutante, ou para converter um alelo a um alelo diferente. As composições e métodos aqui descritos podem também serem usados para gerar linhas de planta que têm ZFPs induzíveis e/ou ZFNs estavelmente integradas no genoma. Consequentemente, as sequências estavelmente integradas que codificam as proteínas contendo dedo de zinco podem ser expressas sob indução apropriada para alcançar o efeito desejado na planta sobre gerações de planta múltiplas e em qualquer estágio de desenvolvimento de planta.
[00348] Em adição, clivagem-alvo de patogenias de planta infectan- tes ou integradas pode ser usada para tratar infecções patogênicas em um hospedeiro de planta, por exemplo, por clivagem do genoma da patogenia tal que sua patogenicidade é reduzida ou eliminada. Adicionalmente, a clivagem-alvo de genes que codifica receptores para vírus de planta pode ser usada para bloquear expressão de tais receptores, prevenindo, desse modo, infecção viral e/ou difusão viral na planta.
[00349] Patogenias de planta exemplares incluem, mas não estão limitadas a, vírus de planta tais como Alfamoviruses, Alphacryptoviruses, Badnaviruses, Betacryptoviruses, Bigeminiviruses, Bromoviruses, Bymoviruses, Capilloviruses, Carlaviruses, Carmoviruses, Caulimovi- ruses, Closteroviruses, Comoviruses, Cucumoviruses, Cytorhabdoviru- ses, Dianthoviruses, Enamoviruses, Fabaviruses, Fijiviruses, Furoviru- ses, Hordeiviruses, Hybrigeminiviruses, Idaeoviruses, Ilarviruses, Ipo- moviruses, Luteoviruses, Machlomoviruses, Macluraviruses, Marafivi- ruses, Monogeminiviruses, Nanaviruses, Necroviruses, Nepoviruses, Nucleorhabdoviruses, Oryzaviruses, Ourmiaviruses, Phytoreoviruses, Potexviruses, Potyviruses, Rymoviruses, satellite RNAs, satelliviruses, Sequiviruses, Sobemoviruses, Tenuiviruses, Tobamoviruses, Tobravi- ruses, Tombusviruses, Tospoviruses, Trichoviruses, Tymoviruses, Umbraviruses, Varicosaviruses e Waikaviruses; patogenias fungais tais como ferrugens (por exemplo, Ustilaginales), ferrugens (Uredina- les), ferrugens das gramíneas (Clavicepts pupurea) e míldio; matrizes (Oomycetes) tais como Phytophthora infestans (ferrugem da batata); patogenias bacteriais tais como Erwinia (por exemplo, E. herbicola), Pseudomonas (por exemplo, P. aeruginosa, P. syringae, P. fluores- cense e P. putida), Ralstonia (por exemplo, R. solanacearum), Agrobacterium e Xanthomonas; vermes redondos (Nematoda); e Phytomyxea (Polymyxa e Plasmodiophora).
[00350] Os métodos descritos para recombinação-alvo podem ser usados para substituir uma ou mais sequências genômicas de EPSPS com sequências homólogas, não-idênticas. Por exemplo, uma sequência genômica mutante pode ser substituída por uma sequência tipo selvagem, ou alternativamente, uma sequência genômica tipo selvagem pode ser substituída por uma sequência mutante, de modo a, por exemplo, produzir colheitas resistentes ao glifosato de herbicida, aumentar rendimentos da colheita, resistência reversa ao glifosato em ervas-daninhas ou plantas selvagens, etc. De modo similar, um alelo de um gene pode ser substituído por um alelo diferente usando os métodos de recombinação-alvos aqui descritos.
[00351] Em muitos destes casos, uma região genômica de EPSPS de interesse compreende uma mutação, e o polinucleotídeo doador compreende a sequência tipo selvagem correspondente. Similarmente, uma sequência genômica tipo selvagem pode ser substituída por uma sequência mutante, se tal é desejável. Por exemplo, resistência ao gli- fosato pode ser revertida ou reduzida em uma planta por substituição de um gene de EPSPS que sofreu mutação ou exógeno um gene do tipo selvagem, removendo um gene de EPSPS exógeno, mudando um gene de EPSPS para resistência inferior a glifosato, ou substituindo as sequências de controle de um gene de EPSPS com sequências que suportam um nível inferior de expressão de EPSPS. Alternativamente, uma mutação pode ser introduzida em um gene de EPSPS que confere resistência a glisosato em uma planta ou por mutação do gene de EPSPS para produzir uma enzima de EPSPS tolerante a glifosato, ou por substituição de sequências de controle do gene de EPSPS com sequências que aumentam o nível de expressão de EPSPS. As modi- ficações de gene de EPSPS e enzimas de EPSPS mutantes que aumentam tolerância ao glifosato de herbicida são conhecidas na técnica (vide, por exemplo, 7.141.722, 7.045.684, 6.040.497, 5.866.775, 5.554.798, 5.463.175, Patentes U.S. Nos 6.803.501, 6.750.377, 5.804.425, 5.776.760, 5.312.910, 5.310.667, 7.238.508, 7.214.535, 6.248.876, 6.225.114, 5.633.435, 5.627.061, 5.188.642, 5.145.783, 4.971.908, e 4.940.835, e WO 00/66748; aqui incorporadas por refe-rência).
[00352] Clivagem-alvo e recombinação-alvo podem também serem usadas para alterar sequências de não-codificação (por exemplo, se-quência regulatórias tais como promotores, intensificadores, iniciado- res, terminadores, locais de união) para alterar os níveis de expressão de um produto de gene de EPSPS. Tais métodos podem ser usados, por exemplo, para aumentar a expressão de uma variante de EPSPS tolerante a glifosato em uma colheita.
[00353] A inativação de um gene de EPSPS pode ser alcançada, por exemplo, por um evento de clivagem simples, por clivagem seguida por união terminal não-homóloga, por clivagem em dois locais seguido por união de modo a deletar a sequência entre os dois locais de clivagem, por recombinação-alvo de um códon sem sentido ou códon de não-sentido na região de codificação, ou por recombinação-alvo de uma sequência irrelevante (isto é, uma sequência "stuffer") no gene ou sua região regulatória, de modo a romper o gene ou região regulatória.
[00354] Modificação-alvo de estrutura de cromatina, conforme descrito em WO 01/83793 de propriedade da mesma requerente, pode ser usada para facilitar a ligação de proteínas de fusão à cromatina celular.
[00355] Em concretizações adicionais, uma ou mais fusões entre um domínio de ligação de dedo de zinco e uma recombinase (ou fragmento funcional destas) podem ser usadas, em adição a ou invés do domínio de dedo de zinco de fusões de clivagem aqui descritos, para facilitar recombinação-alvo. Vide, por exemplo, Patente U.S. N° 6.534.261 de propriedade da mesma requerente e Akopian et al. (2003) Proc. Natl. Acad. Sci. USA 100:8688-8691.
[00356] Em concretizações adicionais, os métodos e composições descritos são usados para proporcionar fusões de domínios de ligação de ZFP com ativação transcricional ou domínios de repressão que requerem dimerização (ou homodimerização ou heterodimerização) para sua atividade. Nestes casos, um polipeptídeo de fusão compreende um domínio de ligação de dedo de zinco e um monômero de domínio funcional (por exemplo, um monômero de uma ativação transcricional dimérica ou domínio de repressão). A ligação de dois tais polipeptí- deos de fusão a locais-alvo corretamente situados permite dimerização de modo a reconstituir uma ativação de transcrição funcional ou domínio de repressão.
[00357] Além disso, conforme descrito acima, os métodos e composições aqui colocados podem ser usados para integração-alvo de sequências exógenas em uma região de interesse no genoma de uma célula (por exemplo, uma sequência regulatória ou de codificação de um gene de EPSPS), por exemplo, em que clivagem aumenta inserção via mecanismos dependentes de homologia (por exemplo, inserção de uma sequência doadora compreendendo uma sequência exógena junto com uma ou mais sequências que são ou idênticas, ou homólogas, mas não-idênticas, com uma sequência genômica predeterminada (isto é, um local-alvo)).
[00358] Conforme notado acima, em certas concretizações, integração-alvo por ambos mecanismos dependentes de homologia e mecanismos independentes de homologia envolvem inserção de uma sequência exógena entre as extremidades geradas por clivagem. A sequência exógena inserida pode ser qualquer comprimento, por exemplo, uma sequência de "correção" relativamente curta de entre 1 e 50 nucleotídeos de comprimento (por exemplo, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 35, 40, 45 ou 50 sequências de nucleotídeo).
[00359] Em casos em que integração-alvo é dependente da homo- logia, um ácido nucleico doador ou sequência doadora compreende uma sequência exógena junto com uma ou mais sequências que são ou idênticas, ou homólogas, mas não-idênticas, com uma sequência genômica predeterminada (isto é, um local-alvo). Em certas concreti-zações, duas das sequências idênticas ou duas das sequências homó-logas, mas não-idênticas (ou uma de cada) estão presentes, flanque- ando a sequência exógena. Uma sequência exógena (ou ácido nuclei- co exógeno ou polinucleotídeo exógeno) é uma que contém uma sequência de nucleotídeo que não está normalmente presente na região de interesse.
[00360] Sequências exógenas exemplares incluem, mas não estão limitadas a, cDNAs, sequências promotoras, sequências intensificado- ras, etiquetas de epitopo, genes marcadores, locais de reconhecimento de enzima de clivagem e vários tipos de construções de expressão. Genes marcadores incluem, mas não estão limitados a, sequências que codificam proteínas que mediam resistência química ou antibiótica (por exemplo, resistência à ampicilina, resistência à canamicina, resistência a G418, resistência à higromicina B, resistência à puromicina, resistência a herbiace), sequências que codificam proteínas coloridas ou fluorescentes ou luminescentes (por exemplo, proteína fluorescente verde, proteína fluorescente verde intensificada, proteína fluorescente vermelha, luciferase), e proteínas que mediam crescimento de célula intensificado e/ou amplificação de gene (por exemplo, di-hidrofolato reductase). Etiquetas de epitopo incluem, por exemplo, uma ou mais cópias de FLAG, His, myc, Tap, HA ou qualquer sequência de amino- ácido detectável.
[00361] Construtos de expressão de proteína incluem, mas não estão limitados a, cDNAs e sequências de controle transcricional em ligação operativa com sequências de cDNA. Sequências de controle transcricional incluem promotores, intensificadores e isoladores. Se-quências regulatórias adicionais transcricionais e translacionais que podem ser incluídas em construções de expressão incluem, por exemplo, locais de entrada de ribossomo internos, sequências que codificam sinais de 2A peptídeos e poliadenilação. Uma construção de expressão de proteína exemplar é uma construção de expressão de anticorpo compreendendo uma sequência que codifica uma cadeia pesa- da de anticorpo e uma sequência que codifica uma cadeia leve de an-ticorpo, cada sequência operativamente ligada a um promotor (os promotores sendo os mesmos ou diferentes) e quaisquer ou ambas sequências opcionalmente operativamente ligadas a um intensificador (e, no caso de ambas sequências de codificação sendo ligadas a in- tensificadores, a intensificadores sendo os mesmos ou diferentes).
[00362] Os locais de reconhecimento de enzima de clivagem incluem, por exemplo, sequências reconhecidas por endonucleases de restrição, endonucleases autodirecionais e/ou meganucleases. Integração-alvo de um local de reconhecimento de enzima de clivagem (por ou mecanismos dependentes de homologia ou independentes de ho- mologia) é útil para geração de células cujo genoma contém somente um local simples que pode ser clivado por uma enzima particular. O contato de tais células com uma enzima que reconhece e cliva o local simples facilita integração-alvo subsequente de sequências exógenas (por ou mecanismos dependentes de homologia ou mecanismos independentes de homologia) e/ou mutagênese-alvo no local que é clivado.
[00363] Endonucleases autodirecionais exemplares incluem I-CeuI, PI-PspI, PI-Sce, I-SceIV, I-CsmI, I-PanI, I-SceI, I-SceII, I-PpoI, I-SceIII, I-CreI, I-TevI, I-TevII e I-TevIII. Suas sequências de reconhecimento são conhecidas. Vide também Patente U.S. N° 6.833.252, Patente U.S. N° 5.420.032; Belfort et al. (1997) Acid nucleics Res. 25:33793388; Dujon et al. (1989) Gene 82:115-118; Perler et al. (1994) Acid nucleics Res. 22, 1125-1127; Jasin (1996) Trends Genet. 12:224-228; Gimble et al. (1996) J. Mol. Biol. 263:163-180; Argast et al. (1998) J. Mol. Biol. 280:345-353 e the New England Biolabs catalogue.
[00364] Embora a especificidade de clivagem de muitas endonucleases autodirecionais não seja absoluta com relação a seus locais de reconhecimento, os locais são de comprimento suficiente que um evento de clivagem simples por genoma dimensionado de mamífero podem ser obtidos por expressão de uma endonuclease autodirecional em uma célula contendo uma cópia simples de seu local de reconhe-cimento. Foi também reportado que enzimas de clivagem podem ser engenheiradas para se ligarem a locais-alvo não-naturais. Vide, por exemplo, Chevalier et al. (2002) Molec. Cell 10:895-905; Epinat et al. (2003) Acid nucleics Res. 31:2952-2962; Ashworth et al. (2006) Nature 441:656-659.
[00365] Métodos anteriores para obtenção de recombinação-alvo e integração usando endonucleases autodirecionais sofrem do problema que inserçãoalvo do local de reconhecimento é extremamente ineficiente, requerendo classificação de laboratório para identificar células que contêm o local de reconhecimento inserido na localização desejada. Os presentes métodos sobrepujam estes problemas por permitir integração-alvo altamente eficiente (ou dependente de homologia ou independente de homologia) de um local de reconhecimento para uma enzima de clivagem de DNA.
[00366] Em certas concretizações, integração-alvo é usada para inserir uma construção de expressão de RNA, por exemplo, sequências responsáveis por expressão regulada de micro RNA, shRNA ou siRNA. Promotores, intensificadores e sequências regulatórias de transcrição adicionais, conforme descrito acima, podem também serem incorporados em uma construção de expressão de RNA.
[00367] Em concretizações em que integração-alvo ocorre por um mecanismo dependente de homologia, a sequência doadora contém homologia suficiente nas regiões que flanqueiam a sequência exógena, para suportar reparo direcionado de homologia de uma quebra de fita dupla em uma sequência genômica, inserindo, desse modo, a sequência exógena no local-alvo genômico. Portanto, o ácido nucleico doador pode ser de qualquer tamanho suficiente para suportar integra- ção da sequência exógena por mecanismos de reparo dependente de homologia (por exemplo, recombinação homóloga). Sem desejar estar ligado por qualquer teoria particular, as regiões de homologia que flan-queiam a sequência exógena são pensadas proporcionar as extremi-dades de cromossomo quebradas com um modelo para re-síntese da informação genética no local da quebra de fita dupla.
[00368] Integração-alvo de sequências exógenas, conforme descrito aqui, pode ser usada para gerar células e linhagens celulares para expressão de proteína. Vide, por exemplo, Pedido de Patente U.S. de propriedade da mesma requerente N° 2006/0063231 (a descrição do qual é desse modo incorporado por referência aqui, em sua totalidade para todas as propostas). Para expressão ótima de uma ou mais proteínas codificadas por sequências exógenas integradas em um ge- noma, o local de integração cromossomal deve ser compatível com transcrição de alto nível das sequências integradas, preferivelmente em uma ampla faixa de tipos de célula e estados de desenvolvimento. Contudo, tem sido observado que transcrição de sequências integradas varia dependendo do local de integração devido a, entre outras coisas, a estrutura de cromatina do genoma no local de integração. Consequentemente, locais-alvo genômicos que suportam transcrição de alto nível de sequências integradas são desejáveis. Em certas concretizações, também será desejável que integração de sequências exógenas não resulte em ativação ectópica de um ou mais genes celulares (por exemplo, oncogenes). Por outro lado, no caso de integração de sequências promotoras e/ou intensificadoras, expressão ectópica pode ser desejada.
[00369] Para certas concretizações, é desejável que um local de integração não esteja presente em um gene essencial (por exemplo, um gene essencial para viabilidade de célula), de modo que inativação de referido gene essencial não resulte da integração das sequências exógenas. Por outro lado, se o intento é integração-alvo de função de gene inabilitada (isto é, criar uma "eliminação" de gene) de uma se-quência exógena para romper um gene endógeno é um método eficaz. Nestes casos, a sequência exógena pode ser qualquer sequência capaz de bloquear transcrição do gene endógeno ou de gerar um produto de translação não-funcional, por exemplo, um remendo curto de sequência de aminoácido, que é opcionalmente detectável (vide cima). Em certas concretizações, as sequências exógenas podem compreender um gene marcador (descrito acima), permitindo seleção de células que suportam integração-alvo.
[00370] Locais-alvo genômicos adicionais que suportam transcrição de alto nível de sequências integradas podem ser identificados como regiões de cromatina aberta ou "regiões acessíveis", conforme descrito, por exemplo, nas Publicações de Pedido de Patente U.S. de propriedade da mesma requerente 2002/0064802 (30 de maio de 2002) e 2002/0081603 (27 de junho de 2002).
[00371] A presença de uma quebra de fita dupla em uma sequência genômica não facilita somente integração dependente de homologia de sequências exógenas (isto é, recombinação homóloga), mas também integração independente de homologia de sequências exógenas no genoma no local da quebra de fita dupla. Consequentemente, as composições e métodos aqui descritos podem ser usados para clivagem-alvo de uma sequência genômica, seguido por integração dependente de não-homologia de uma sequência exógena em ou próximo ao local de clivagem-alvo. Por exemplo, uma célula pode ser contactada com uma ou mais ZFP-domínio de clivagem (ou meio-domínio de clivagem), proteínas de fusão engenheiradas para clivar em uma região de interesse em um genoma conforme aqui descrito (ou um ou mais polinucleotídeos que codificam tais proteínas de fusão), e um po- linucleotídeo compreendendo uma sequência exógena carecendo de homologia para a região de interesse, para obter uma célula em que toda ou uma porção da sequência exógena é integrada na região de interesse.
[00372] Os métodos de integração-alvo (isto é, inserção de uma sequência exógena em um genoma), ambas dependente e independente da homologia, aqui descritos podem ser usados para um número de propostas. Estas incluem, mas não estão limitadas a, inserção de um gene ou sequência de cDNA no genoma de uma célula para capacitar expressão dos produtos de transcrição e/ou translação do gene ou cDNA pela célula. Para situações em que uma doença ou patologia podem resultar de uma de uma pluralidade de mutações (por exemplo, mutações de ponto múltiplo difundidas através da sequência do gene), integração-alvo (ou dependente de homologia ou independente de homologia) de uma cópia de cDNA do gene do tipo selvagem é particularmente eficaz. Por exemplo, tal cDNA tipo selvagem é inserido em uma sequência condutora não-tranduzida ou no primeiro éxon de um gene a montante de todas as mutações conhecidas. Em certos integrantes, em que estrutura de leitura translacional é preservada, o resultado é que o cDNA tipo selvagem é expresso e sua expressão é regulada por sequências regulatórias endógenas transcricionais apropriadas. Em concretizações adicionais, tais sequências de cDNA integradas podem incluir sinais de terminação transcricionais (e/ou trans- lacionais) dispostos a jusante do cDNA tipo selvagem e a montante do gene endógeno mutante. Desse modo, uma cópia tipo selvagem do gene que causa doença é expressa, e o gene endógeno mutante não é expresso. Em outras concretizações, uma porção de um cDNA tipo selvagem é inserida na região apropriada de um gene (por exemplo, um gene em que mutações que causam doença são agrupados).
EXEMPLOS
[00373] Abaixo estão exemplos de concretizações específicas para efetuar a presente descrição. Os exemplos são oferecidos para proposta ilustrativa somente, e não são pretendidos para limitar o escopo da presente descrição de qualquer modo.
[00374] Esforços têm sido feitos para assegurar precisão com relação a números usados (por exemplo, quantidades, temperaturas, etc.), mas algum erro experimental e desvio devem, naturalmente, ser permitido.
Exemplo 1: Identificação de Sequência Alvo em B. napus A. Identificação de Sequência
[00375] Sequências de DNA para gene de canola nativos de função conhecida foram selecionadas como alvos para edição de genoma usando nucleases de dedo de zinco engenheirada. As sequências destes genes, referidas como genes de 5-enolpiruvil shiquimato-3- fosfato sintase (EPSPS), foram derivadas de Brassica napus L, Nex710. O EPSPS de enzima é a sexta enzima da trajetória de shi- quimato, que é essencial para a síntese de aminoácidos aromáticos e muitos metabólitos aromáticos em plantas (Bentley (1990) Crit. Rev. Biochem. Mol Biol. 25:307-384). Ele catalisa a transferência da porção de enolpiruvil de fosfoenol piruato (PEP) para o 5-hidroxil de shiquima- to 3-fosfato (S3P). Desde que B. napus é uma espécie anfidiplóide resultante de combinação dos conjuntos de cromossomo de B. rapa (2n = 20, AA) e B. oleracea (2n = 18, CC) (Morinaga, 1934; U, 1935), é esperado que seria mais do que um gene de EPSPS nesta espécie.
B. Isolamento de DNA
[00376] Sementes de B. napus variedade Nex710 foram plantadas na estufa. As amostras foram coletadas no 13° dia após plantação, congeladas instantâneas em nitrogênio líquido, e armazenadas a - 80°C até uso.
[00377] DNA genômico foi isolado pelo uso de ou precipitação de cetil-trimetilamônio cloreto (CTAB) ou o kit de extração PLANT DNEASY para isolamento de DNA de planta (Qiagen, Valencia, CA). Para o procedimento usando CTAB, 1 g de tecido de folha (grupos de 6 plantas) foi moído em nitrogênio líquido. O DNA foi isolado conforme descrito por Permingeat et al. (Plant Mol. Biol. Reptr. (1998) 16:1-6; aqui incorporado por referência), exceto que o tampão de extração foi modificado. O tampão de extração modificado continha 00 mM de Tris- HCl (pH 8,0), NaCl 2 M, 25 mM de EDTA, 2,5% de CTAB (Sigma Catalog N° H-5882) e 1,5% de polivinil pirrolidona - 40 (PVP-40). O DNA genômico total foi isolado com o kit de extração PLANT DNEASY (Qi-agen, Valencia, CA) de acordo com s recomendações do fabricante com uma modificação. PVP- 40 foi adicionado ao tampão AP1 (Qiagen) a uma concentração final de 1%. Quando DNA foi para ser digerido com enzimas de restrição, ele foi adicionalmente purificado por duas etapas de precipitação de polietileno glicol (PEG, MW 8.000) conforme se segue. Um volume igual de 1,2 M de NaCl/13% PEG foi adicionado ao DNA e incubado em gelo por 2 horas. As amostras foram então centrifugadas a 5.000xg por 10 minutos, o sobrenadante foi descartado e o pélete foi lavado com 70% de etanol. O etanol foi completamente removido por liofilização, e o pélete de DNA foi ressuspen- sa em tampão EB (Qiagen).
[00378] DNA foi então medido usando mancha de ácido nucleico fluorescente PICOGREEN para quantificação de DNA de fita dupla de acordo com as instruções do vendedor (Molecular Probes, Eugene, OU) e por leituras de absorvência a 260 e 280 nm. A qualidade do DNA foi verificada por operação de amostras de DNA em 0,8% de gel de agarose usando tampão Tris-acetato-EDTA (TAE) (Sambrook et al. (1989) Gel electrophoresis of DNA, Molecular Cloning. Cold Spring Harbor Laboratory Press, p. 6.7).
C. Estimativa de Número de Cópia de Gene de EPSPS por Análise de Southern
[00379] Uma estimativa do número de cópia de gene de EPSPS foi realizada por análise de Southern antes da amplificação de gene, clo-nagem, e sequenciamento do DNA genômico de B. napus. Enzimas de restrição para digestão do DNA genômico foram selecionadas para cortar o DNA uma vez no gene (Gasser e Klee (1990) Acid nucleic Research 18:2821) e uma segunda vez no flanqueamento de sequências genômicas tais que um fragmento de DNA genômico de um tamanho único foi criado para cada um dos genes de EPSPS na hibridização com uma sonda de gene de EPSPS. A maioria das enzimas de restrição que foram selecionadas (Pvu II, Nde I, Bsr BI, Bsa I, Bcl I, Bsm I, Afl II) cortam ou em direção a extremidade 5' ou a parte média do gene, exceto para Bcl I, que corta na extremidade 3'do gene onde a sonda hibridizou (vide abaixo).
[00380] Amostras de DNA (5 μg cada para Nex710, 4 μg cada para B. rapa, e 3 μg cada para B. oleracea) foram digeridas durante a noite com 30 unidades de cada enzima de restrição, Pvu II, Nde I, Bsr BI, Bsa I, Bcl I, Bsm I, e Afl II, separadamente em tubos eppendorf de acordo com as instruções do fabricante (New England BioLabs). As amostras de DNA digeridas foram então submetidas a uma precipitação de etanol, e as pelotas foram liofilizadas.
[00381] Os péletes secos foram ressuspensos em 2x de tampão de carregamento, carregados em 0,85% de gel de agarose, e submetidos a eletroforese em 0,4x de tampão Tris-acetato a pH 8,0 (Sambrook et al. (1989) Gel electrophoresis of DNA, Molecular Cloning, Cold Spring Harbor Laboratory Press, p. 6.7). O gel foi então manchado com brometo de etidium e bandas de DNA foram visualizadas por UV. DNA foi subsequentemente transferido em uma membrana de transferência de hibridização GENESCREEN PLUS (DuPont NEN, Boston, MA, USA) em 25 mM de tampão Na pirofosfato (Murray et al. (1992) Plant Mol. Biol. Reptr. 10:173-177). Pré-hibridização foi efetuada por um mínimo de 2 horas a 65°C em tampão de hibridização SIGMA P ERFECT HYB PLUS (Sigma, St. Louis, MO). Hibridização foi efetuada no tampão du-rante a noite após adição de uma sonda radioativa (vide abaixo). Um forno de hibridização (Robbins Scientific Corp, Sunnyvale, CA, USA) foi usado para ambas as etapas de pré-hibridização e hibridização. A membrana foi lavada em uma diluição 20 vezes do tampão de lavagem compreendendo 200 mM de fosfato de sódio pH 7,8, 50 mM de pirofosfato de sódio, 10 mM de EDTA, e 2% SDS (Murray et al., supra). Um enxaguamento inicial de 5 minutos foi usado seguido por duas lavagens de 15 minutos cada. A mancha foi então exposta a um tela de fosforoimagem à temperatura ambiente por 12 horas ante de escaneamento em um aparelho de fosforoimagem BIORAD PERSONAL FX (Bio-Rad, Hercules, CA).
[00382] A sonda de EPSPS para hibridização de mancha Southern blot foi gerada por PCR usando B. napus var. Nex710 como o modelo de DNA genômico. Iniciadores foram designados a partir da sequência éxon-8 baseada na sequência de DNA genômico B. napus publicada (Gasser e Klee, supra.) com software VETORNTI (Invitrogen, Carlsbad, CA), e sintetizada por MWG BIOTECH, Inc. (High Pint, NC, USA). As sequências dos iniciadores de orientação de avanço e reversa foram TTGGAGCTACAGTGGAAGAAGGTT (SEQ ID NO:1) e CGATTGCATCTCACTCAGTTCATTA (SEQ ID NO:2), respectivamente. As reações de PCR continham 5 μl de 10X tampão HOT START PCR (Qiagen, Valencia, CA, USA), 2 μl 25 mM de MgCl2, 4 μl 10 mM de mistura de nucleotídeo, 1 μl de cada iniciador (20 μM), 1,5 unidades de HOT START Taq DNA polimerase (Qiagen, Valencia, CA), 5 μl de DNA de modelo Nex710, e água estéril em um volume total de 50 μl. Amplificação foi executada em um instrumento de PCR de tempo real ICYCLER IQ (Bio-Rad, Hercules, CA) usando os seguintes parâmetros: desnaturação inicial por 15 minutos a 95°C, s eguido por 35 ciclos de 30 segundos a 95°C, fortalecimento a 55,5°C e 52 ,9°C por 30 se-gundos, e 30 segundos a 72°C. Um produto de PCR de 350 pares de base foi purificado com um kit de remoção de nucleotídeo QIAQUICK (Qiagen, Valencia, CA). O tamanho e integridade do DNA foi verificado por eletroforese em 2,0% de E-GEL gel de agarose (Invitrogen, Carlsbad, CA). A quantidade de fragmento foi determinada usando-se o reagente de quantificação de DNA PICOGREEN (Invitrogen, Carlsbad, CA). As sondas de DNA foram etiquetadas usando-se contas de etiqueta READY-TO-GO (-dCTP) (Amersham Biosciences, Piscataway, NJ).
[00383] Análise de mancha Southern blot mostrou que bandas es-pecíficas de B. napus EPSPS múltiplas (quatro ou mais) estavam pre-sentes e potencialmente como muitos genes (figura 1). O DNA hibridi- zado de B. rapa e B. oleracea para poucas bandas, e seus números e posições não se adicionam nos modelos de B. napus, indicando que diversidade de sequência elevou-se nos genomas parentais e B. na- pus desde anfidiploidia. Bandas menores podem ser devido a hibridi- zação cruzada com outros genes de B. napus com homologia de sequência limitada.
D. Amplificação de Gene e Análise de Sequência
[00384] No presente estudo, a sequência de cDNA de EPSPS de B. rapa (Acesso no Banco de Gene N° AY512663, SEQ ID NO:3) foi usada para questionar a base de dados de TIGR Brassica napus EST (disponível na internet em tigrblast.tigr.org/tgi/) usando algoritmos BLAST. Duas sequências, TC1307 (parcial e não-anotada) e TC1308 (total-comprimento EPSPS) foram identificadas. A sequência TC1307 foi uma sequência de gene de EPSPS. Sequências do AY512663 e TC1307 foram usadas para designar oligonucleotídeos curtos múltiplos para uso como iniciadores de PCR, incluindo os seguintes oligonucleo- tídeos de orientação de avanço: 5'- ATGGCGCAAGCTAGCAGAATCTGCC -3' (SEQ ID NO:4) 5' - ATGGCGCAAGCTAGCAGAATC - 3' (SEQ ID NO:5) 5' - CCAGCAGCAGCGTGGAGCTTATCAGATA - 3' (SEQ ID NO:6), e os seguintes oligonucleotídeos de orientação reversa: 5'- GGCCCAAAACTGATTCAACGATTGC -3' (SEQ ID NO:7) 5' - CGTTGCCACCAGCAGCAGTA - 3' (SEQ ID NO:8) 5' - GATGGTCCAGTCACAGTCACACTGTTCTCTGT - 3' (SEQ ID NO:9).
[00385] Todos dos iniciadores de oligonucleotídeo foram sintetizados por e comprados de Integrated DNA Technologies (IDT, Coralville, IA).
[00386] Para análise baseada em PCR, amplificação de DNA foi efetuada em uma mistura de reação de PCR contendo 2,5 μl de 10X LA de tampão de PCR II (Mg2+plus) (Takara Bio Inc., Otsu, Shiga, Japan), 0,7 μl de 25 mM de MgCl2, 4 μl de 10 mM de mistura de nucleo- tídeo, 0,5 μl de cada iniciador (20 M), 1,25 unidades de TAKARA LA Taq polimerase (Takara Bio Inc.), 1 μl de modelo de B. napus variedade Nex710 DNA (3-10 ng DNA), e água estéril a um volume total de 25 μl. Amplificação foi realizada ou em um termociclizador MJ (Bio-Rad, Hercules, CA) ou um sistema de GENEAMP PCR 9700 (Applied Biosystems, Foster City, CA) usando os seguintes parâmetros: desnaturação inicial por 1 minuto a 94°C seguido por 30 ciclos de 20 segundos a 94°C, 30 segundos a 59°C, e 2 minutos a 72°C. O tamanho e integridade de produtos de PCR foram verificados por eletroforese.
[00387] Quando PCR foi realizado com iniciadores SR130 e SR131 (SEQ ID NOS 4 e 7, respectivamente), fragmentos de DNA de tamanho de 2,6 kb - 3 kb foram amplificados. Estes fragmentos foram diretamente clonados no vetor pCR2.1 (Invitrogen, Carlsbad, CA) usando o kit de clonagem TA de Invitrogen (Carlsbad, CA) como por as recomendações do fabricante. Os fragmentos clonados foram sequencia- dos em DAS com o kit de sequenciamento de ciclo de terminador de corante CEQ (Beckman Coulter, Fullerton, CA) como pelas recomen-dações do fabricante ou serviços de sequenciamento foram contratados a Cogenics (anteriormente Lark Technologies, Inc. Houston, TX). A análise de sequência de clones múltiplos revelaram 3 fragmentos de gene distintos. Estes fragmentos de gene foram denominados paralogos de EPSPS C, D e E (SEQ ID NOS:12-14).
[00388] De modo a identificar outras variantes dos genes que podem existir no genoma de B. napus, PCR foi operado com um gradiente de temperatura sob as mesmas condições de PCR conforme descrito acima. A amplificação foi realizada no instrument de PCR de tempo real ICYCLER IQ (Bio-Rad, Hercules, CA) usando os seguintes parâmetros: desnaturação inicial por 1 minuto a 94°C seguido por 30 ciclos de 20 segundos a 94°C, 30 segundos a temperatu ras de gradiente entre 40°C to 60°C, e 4 minutos a 72°C. Uma exte nsão final de 30 minutos a 72°C foi efetuada seguido por uma retençã o indefinida a 4°C. Sob estas condições, uma banda específica correspondente a cerca de 2,5 kb de DNA amplificado foi produzida a 52,5°C. O DNA amplificado foi clonado no vetor pCR2.1 e sequenciado conforme descrito previamente. Análise de sequência de clones múltiplos indica claramente que este produto de PCR representou um gene diferente, que foi identificado como paralogo B de EPSPS (SEQ ID NO:11).
[00389] Os iniciadores 1307F (SEQ ID NO:5) e 1307R (SEQ ID NO:8), correspondentes ao fragmento TC1307, foram usados em reação de PCR da seguinte composição: 5 μl de 10X tampão Hot Start PCR (Qiagen, Valencia, CA), 3 μl de 25 mM de MgCl2, 4 μl de 10 mM de mistura de nucleotídeo, 1 μl de cada iniciador (20 μM), 1,5 unidades de HOT START Taq DNA polimerase (Qiagen, Valencia, CA), 5 μl (20 ng) de modelo Nex710 de DNA, e água estéril em um volume total de 50 μl. A amplificação foi executada em um instrumento ICYCLER IQ PCR (Bio-Rad, Hercules, CA) usando os seguintes parâmetros: desna-turação inicial por 15 minutos a 95°C seguido por 3 5 ciclos de 30 se-gundos a 95°C, 30 segundos a um gradiente de temperatura de 40°C a 60°C, e 1 minuto a 72°C. Uma extensão final de 10 minutos a 72°C foi efetuada seguido por uma retenção indefinida a 4°C. Sob estas condições, uma banda de 700 pb de DNA amplificado foi produzida a 41,4°C. Este fragmento foi clonado no vetor TOPO PC R2.1 e sequen- ciado conforme descrito anteriormente. Alinhamento de clone múltiplo resultou em uma sequência de 669 pb, que foi identificada como paralogo A de EPSPS (SEQ ID NO:10).
[00390] Reações de PCR adicionais foram realizadas com os iniciadores 4°_Gene_F2 (SEQ ID NO:6) e EPSP_cDNA_R9 (SEQ ID NO:9) para amplificar a sequência mais longa de paralogo A. A mistura de reação de PCR foi da seguinte composição: 10,0 μl de reagentes ACCUPRIME SUPERMIX II par amplificação de PCR (Invitrogen, Carlsbad, CA), 0,5 μl de cada iniciador (20 μM), 3 μl de DNA de modelo Nex710, e água estéril em um volume total de 20 μl. A amplificação foi executada usando os seguintes parâmetros: 95°C por 3 minutos, seguido por 10 ciclos de 95°C por 30 segundos, 73°C ( -0,5°C/ciclo) por 30 segundos e 68°C por 3 minutos, seguido por 30 ci clos de 95°C por 30 segundos, 68°C por 30 segundos e 68°C por 3 minu tos. Isto foi seguido por uma extensão final de 68°C por 30 minutos . Um fragmento amplificado de cerca de 2 kb foi clonado no vetor TOPO PCR2.1 e então sequenciado conforme anteriormente descrito. O alinhamento de clones múltiplos resultou na sequência de 1571 pb de paralogo A.
[00391] Uma comparação de cDNA de B. rapa (SEQ ID NO: 3) e DNA genômico de B. napus (SEQ ID NO: 14) mostrou a presença de 8 éxons e 7 íntrons no gene de EPSPS. Baseado nesta comparação, alinhamento de todos os 5 paralogos de gene isolados de B. napus var. Nex710 DNA indicou que pequenas diferenças, tais como polimor- fismos de nucleotídeo único (SNPs) existiram entre os genes nas regiões de codificação prognosticadas, pelo que as sequências de íntron variaram significantemente mais no nível de nucleotídeo. Além de tudo, existe 84% ou mais de homologia de sequência entre os 5 paralogos de EPSPS (vide tabela 2). Tabela 2: Homologia de sequência (%) entre paralogos A-E de EPSPS (SEQ ID NOS:10-14)
Figure img0003
[00392] Estas diferenças entre os 5 paralogos foram notadas porque elas realçam regiões das sequências que podem ser discriminadas por uma proteína de ligação de DNA dependente de sequência tal como uma proteína de dedo de zinco. É desejável designar um domínio de ligação de DNA de dedo de zinco que se liga a uma sequência de gene e não outro, mesmo se a sequência é altamente similar. Sequências de gene de comprimento total mais próxima para quatro dos paralogos, B, C, D e E (SEQ ID NOS:11-14) e uma sequência de gene parcial para o paralogo A de 1575 kb (SEQ ID NO:10) foram selecionadas como alvos para o desenho de nucleases de dedo de zinco, conforme descrito abaixo.
Exemplo 2: Desenho de Domínios de ligação de DNA de Dedo de Zinco
[00393] Usando-se locais-alvo identificados de dentro de paralogos A-E de EPSPS de B. napus (Exemplo 1, figuras 9-13), espirais de re-conhecimento foram selecionadas para dedos de zinco de EPSPS. As espirais de reconhecimento para desenhos de dedo de zinco de EPSPS representativos são mostradas abaixo na tabela A. Tabela A: Desenhos de Dedo de Zinco de EPSPS
Figure img0004
Figure img0005
Figure img0006
(*Note- as ZNFs 10657 e 10658, 12202, 14318 e 14320, 10740 e 11034, 10741 e 11036, e o 10742 e 11037 diferem entre si por muta- ções que não são localizadas nas espirais de reconhecimento).
[00394] Locais-alvo de desenhos de dedo de zinco são mostrados abaixo na tabela B. ZFPs 10654 e 10658 foram designados para locais em paralogos C e D; ZFPs 9875 e 10275 foram designados para locais-alvo em paralogo D; e ZFPs 10740, 10741 e 10742 foram designados para se ligar a locais-alvo em paralogos A e B. Tabela B: Locais-alvo de Dedos de zinco de EPSPS
Figure img0007
Figure img0008
[00395] Os desenhos de EPSPS foram incorporados em vetores de expressão de dedo de zinco que codificam uma proteína tendo pelo menos uma dedo com uma estrutura de CCHC. Vide, Pedido de Patente U.S. Nº de Série 60/874.911. Em particular, a última dedo em cada proteína tinha um suporte de CCHC. As sequências que codificam dedo de zinco foram então fundidas ao domínio de nuclease da enzima de restrição tipo IIS FokI (aminoácidos 384-579 da sequência de Wah et al. (1998) Proc. Natl. Acad. Sci. USA 95:10564-10569, através de um ligante ZC de quatro aminoácidos) para formar ZNFs de EPSPS. Várias ZFNs foram ensaiadas para atividade biológica e/ou toxicidade conforme descrito no Pedido de Patente U.S. Nº60/995.566.
Exemplo 3: Validação Funcional de ZFNs Específicas de EPSPS em células HEK293
[00396] A capacidade de ZNFs de EPSPS conforme aqui descrito para facilitar recombinação homóloga foi testada no sistema de GFP descrito em Urnov (2005) Nature 435(7042):646-51 e Publicação de Patente U.S. N° 20050064474 (por exemplo, Exemplos 6-11). Brevemente, linhagens celularess repórteres HEK 293 abrigando a região de gene de EPSP de interesse foram geradas conforme segue. A região de gene de EPSPS de interesse foi amplificada por PCR e subsequentemente clonada em pcDNA4TO- GIF. Células HEK 293 foram trans- fectadas com o plasmídeo acima e subsequentemente selecionadas 48 horas pós-transfecção, na presença de 400 μg/ml de Zeocina.
[00397] Grupos de clones estáveis obtidos foram então testados com as ZFNs direcionadas em direção a região de interesse específica do gene de EPSP nas linhagens celulares repórteres geradas acima conforme segue. Linhas de célula repórteres foram semeadas a 350.000 células/cavidade em 12 placas de cavidade em 1 mL de DMEM, 10% de meio de FBS (nenhum PSG) e transfectadas com 50 ou 100 ng de cada ZFN e 500 ng do doador de GFP sem promotor (Urnov (2005) Nature) foram transfectados em 500.000 células repórteres usando 2 μL de Lipofectamina 2000 (Invitrogen) por amostra, como por o protocolo de Invitrogen Lipofectamina 2000. Transfecções para cada par de ZFN foi feita em triplicatas. Um dia após transfecção, 1 mL de meio DMEM foi adicionado com 1,5 μL de Vinblastina a uma concentração final de 0,2 μM a 1mM para cada cavidade e foi removido 72 horas pós-transfecção. As células foram ensaiadas para expressão de GFP 5 dias pós-transfecção por medição de 40.000 células por transfecção no analisador FACS de bancada superior Guava. Os resultados exemplares são mostrados na figura 14, painéis A a E.
Exemplo 4: Uma ZFN Pode Clivar Dois ou Mais Paralogos de EPSPS em B. napus var. Nex710
[00398] De modo a avaliar a funcionalidade de proteínas de nuclease de dedo de zinco designadas em células de planta, métodos para a expressão de tais proteínas em células de planta vivas foram utilizados. As proteínas de nuclease de dedo de zinco que codifica DNA podem ser distribuídas em células de planta sob condições onde o DNA não é incorporado no genoma de célula de planta. Desse modo, a molécula de DNA é transientemente mantida em células de planta e agem como um modelo para expressão de gene. Alternativamente, proteínas de nucloease de dedo de zinco que codificam DNA podem ser distribuídas em células de planta sob condições que permitem que o DNA seja incorporado no genoma de célula de planta, resultando em transgênese da nuclease de dedo de zinco que codifica genes tais como a molécula de DNA é estavelmente mantida nas células de planta e agem como um modelo para expressão de gene. Um versado na técnica pode utilizar expressão ou transiente ou transgênica de nucleases de dedo de zinco que codificam DNAs de modo a avaliar a funcionalidade destas proteínas em células de planta vivas.
Desenho do Vetor
[00399] Vetores de plasmídeo para a expressão de proteínas de ZFN em células de B. napus foram construídos. De modo a otimizar a expressão e estequiometria relativa das 2 proteínas distintas requeridas para formar um heterodímero de nuclease de dedo de zinco funcional, uma estratégia de expressão foi adotada que resultou na inserção das estruturas de leitura abertas de ambos monômeros de ZFNs em um vetor simples, acionado por um promotor simples. Esta estratégia explorou a funcionalidade de uma 2A sequência (Mattion, et al. (1996) J. Virol. 70, 8124-8127) derivada do vírus Thesoa assigna, ou um sinal de localização nuclear de vírus SMV (NLS) (PKKKRKV (SEQ ID NO:15); Kalderon et al. (1984a) Nature 311: 33-38; Kalderon et al. (1984b) Cell 39: 499-509), ou uma NLS de milho a partir do gene opaque-2 (op-2; Maddaloni et al. (1989) Acid nucleics Research 17:7532; Van Eenennaam et al. (2004) Metabolic Engineering 6:101-108) e um promotor derivado do promotor de vírus de mosaico de veia de mandioca ou CsVMV (vide tabela 3). Tabela 3: Descrição de pares de ZFN e elementos de expressão pre-sentes em várias construções que foram usadas para transformação de B. napus.
Figure img0009
CsVMV = Promotor de vírus de mosaico de veia de mandioca e se-quência repórter de 517 pb (Verdaguer et al. (1998) Plant Mol. Biol. 37:1055-1067); AtuORF23 = Agrobacterium tumefacians ORF23 3' UTR; AtUbi10 = promotor 10 de gene de ubiquitina Arabidopsis thalia- na; Pat = Gene fosfinothricina acetil transferase de Streptomyces viri- dochromogenes. Ele é um gene reconstruído do que é reportado na Patente U.S. 5633434); AtuORF1 = Agrobacterium tumefacians ORF1 3' UTR (Acesso no Banco de Gene número X00493, NC_002377); RB7 MAR = região de fixação de matriz de tabaco; 4OCS delta mas 2'= um promotor de sintase de manopina modificada que contém 4X elementos de OCS para intensificar expressão; Interrompido ipt (onc 4) gene Orf = gene de Agrobacterium tumefaciens rompiso ipt (sequência do banco de gene ID ATTMRPTI foi usada para desenho).
[00400] Um esquema de clonagem modular em etapa foi planejado para desenvolver estes vetores de expressão para qualquer dado par de genes que codificam ZFN selecionados a partir do arquivo da biblioteca ou sintetizado de novo. Primeiro, um vetor pVAX (vide, por exemplo, Publicação de Patente U.S. 2005-0267061; a descrição da qual é incorporada por referência) foi modificado para envolver o domínio de expressão N-terminal conforme mostrado nas figuras 2A-2E. As carac-terísticas deste plasmídeo modificado (pVAX-N2A-NLSop2-EGFP- FokMono) (figura 2A) incluem um segmento redesenhado e sintetizado que codifica a NLS, e um segmento redesenhado e sintetizado que codifica o domínio de nuclease FokI utilizando inclinação de códon dicot. Adicionalmente, uma inserção de nucleotídeo único (C) a jusante do local Xho I único criou um local Sac I extra para conveniência de clonagem.
[00401] Segundo, um vetor pVAX (vide, por exemplo, Publicação de Patente U.S. 2005-0267061) foi também modificado para envolver o domínio de expressão C-terminal. As características deste plasmídeo modificado (pVAX-C2A-NLSop2-EGFP-FokMono) (figura 2B) incluem um segmento redesenhado e sintetizado que codifica um NLS e um segmento redesenhado e sintetizado que codifica o domínio de nuclease FokI utilizando a inclinação de códon dicot. Adicionalmente, a 2A sequência de vírus Thosea asigna (EGRGSLLTCGDVEENPGP, SEQ ID NO:16) foi introduzida no N-terminal da ZFN ORF para a proposta de ligação subsequente dos dois domínios que codificam proteína.
[00402] Os cassetes de gene que codificam as ORFs de proteínas de dedo de zinco individuais foram clonados em ou o vetor N2A ou C2A por ligação usando as enzimas de restrição Kpn I e BamH I para criar extremidades compatíveis. Em seguida, o fragmento Bgl II/Xho I do vetor C2A foi inserido no vetor N2A usando os mesmos locais de restrição, produzindo uma construção intermediária que continha um cassete incluindo 2 domínios que codificam ZFN flanqueados por locais de restrição Nco I e Sac I (figura 2C).
[00403] Finalmente, o cassete Nco I/Sac I a partir desta construção intermediária (figura 2C), contendo ambos genes de ZFN, foi excisado usando-se aquelas enzimas de restrição e ligados em um suporte de plasmídeo pDAB3731. Os plasmídeos resultantes, tais como pDAB7151 (figura 2D), incluem os genes de ZFN mais o promoter relevante e sequências terminadoras, mais marcadores selecionáveis para manutenção de plasmídeo (tabela 2). As sequências foram confirmadas por digestão e sequenciamento de enzima de restrição. Nest construto, o cassete de expressão de ZFN (incluindo elementos promotores e terminadores) é flanqueado por locais attL para manipulação conveniente usando o sistema GATEWAY de Invitrogen (Carlsbad, CA). Cada um dos construtos de ZFN gerados usando-se este esquema de clonagem foram transformados em células de E. coli DH5α (Invitrogen, Carlsbad, CA) e subsequentemente mantidos sob seleção apropriada.
[00404] Para transformação de planta mediada por Agrobacterium, os cassetes de ZFN foram clonados em uma construção binária usando-se a reação de GATEWAY LR CLONASE (Invitrogen, cat N° 11791- 019). O construto binárit resultante (figura 2E) foi confirmado via digestão de enzima de restrição e então transformado em cepa de Agrobacterium tumefaciens Z707s. Colônias contendo o clone foram confirmadas via digestão de enzima de restrição e reação de sequenciamento.
B. Sistemas de Expressão Transientes e Estáveis
[00405] Preparações de plasmídeo de construções de expressão de ZFN, tal como pDAB 7151, conforme representado na figura 2, foram geradas de 2 L de culturas de E. coli crescidas em meio de LB contendo antibióticos usando-se um kit de endonuclease-livre GIGAPREP kit (Qiagen, Valencia, CA) como pelas recomendações do fabricante. O DNA de plasmídeo foi distribuído diretamente para células hipocotila de B. napus usando-se uma variedade de métodos.
[00406] Em um exemplo de distribuição de ZNF transiente, segmentos de hipocotila de canola foram submetidos à distribuição de DNA por transformação transiente mediada por "whiskers" de segmentos de hipocotila. Sementes de B. napus, var. Nex710 foram esterilizadas na superfície com 10% (v/v) de CLOROX (5,25% de hipoclorito de sódio) por 10 minutos e enxaguadas 3 vezes com água destilada estéril. Subsequentemente, sementes foram germinadas em meio de MS de concentração ^ (1/2 de sais de MS basal com vitaminas, 1% de saca-rose, 0,8% de ágar, pH 5,8) contidos em Phytatrays com 25 sementes por Phytatray. As sementes foram colocadas em um ambiente de cultura para germinarem por 5 dias a 23°C com um fotop eríodo de 16 horas de luz, 8 horas de escuro. No dia 5, segmentos de hipocotila, 3 mm de comprimento, foram assepticamente excisados e colocados em água estéril para prevenir secagem enquanto segmentos adicionais foram cortados. As seções de broto e raiz foram descartadas. As seções foram colocadas horizontalmente no topo de uma peça de papel de filtro estéril, repousando na superfície de meio MSK1D1 (sais de MS basal com vitaminas, 1 mg/L de cinetina, 1 mg/L 2,4, ácido dicloro- fenoxiacético [2,4-D], 30 g/L de sacarose, 7 g/L de TC ágar, pH 5,8). Os segmentos foram cultivados por 3 dias a 23°C e 1 6 horas de luz.
[00407] No dia de tratamento de "whiskers", 300 segmentos de hi- pocotila parcialmente com calos foram colocados em uma dedofa de Sorvall com 30 ml de 'meio osmótico alto' (sais de MS com vitaminas B5, 4,42 mg/L 2,4-D, e 12% de sacarose) para uma hora de pré- tratamento à temperatura ambiente. Este pré-tratamento é um meio de plasmolizar parcialmente o tecido em uma tentativa de melhorar dano celular quando a parede de célula é rompida durante tratamento de "whiskers" subsequente. Subsequentemente, 8,1 ml de 5% de solução de "whisker" de carbeto de silício Silar SO-9 (Advanced Composite Materials, LLC Greer, SC) e 170 μg do DNA de plasmídeo de ZNF não-binário (tabela 2) preparado como descrito acima, foram adicionados à dedofa de Sorval. A dedofa foi então agitada vigorosamente por 30 segundos em um misturador de tinta (Red Devil Equipment Co., Minneapolis, MN) em que a tinta pode prender o conjunto que foi retro ajustado para manter uma dedofa de Sorval. Após agitação, 100 ml de 'meio osmótico alto' foi imediatamente adicionado à dedofa que é então deixada recuperar por 20 minutos è temperatura ambiente. Segmentos foram então recuperados por derramamento dos conteúdos da dedofa através de uma malha de arame apropriadamente dimensionada para separar os segmentos a partir dos "whiskers" e conteúdos líquidos da dedofa. Finalmente, os segmentos foram colocados de volta em uma placa fresca de meio MSK1D1 com papel de filtro. Amostras de cerca de 100 mg foram tomadas para análise de expressão transiente nos dias 1, 2, 3 e 7 após tratamento com "whiskers".
[00408] Em outro exemplo, o sistema de distribuição transiente usou transformação mediada por polietileno glicol (PEG) de protoplas- tos de hipocotila. Os protoplastos foram preparados a partir de tecidos de hipocotila de mudas de B. napus, var. Nex710 usando-se os méto- dos descritos por Sun et al. (Can. J. Bot. (1998) 76: 530-541) com mo-dificações. As sementes foram esterilizadas na superfície e germinadas por 7 dias no meio % MS Canola conforme descrito acima. Um grama de hipocotilas foi coletado para cada tratamento. Os hipocotis foram cortados em seções delgadas de <1 mm de tamanho e colocados em meio MS9m (9% de manitol, 5 mM de MES, 10 mM de argini- na, 0,3% de polivinilpirrolidona-40 (PVP-40)) contidos em 100 mm de placas petri. Após todas as seções de hipocotila serem colocadas no prato petri, o meio líquido foi removido com uma pipeta e substituído com 6 ml de solução de enzima (MS9m contendo 0,1% de Macerozi- ma-R10 (Yakult Honsha Co. Ltd, Tokyo, Japan), 1% de Celulase-R10 (Yakult Honsha Co. Ltd, Tokyo, Japan), 1% de Pectinase (Sigma Chemical Co.).
[00409] Os tecidos foram colocados no escuro a 25°C por 16 horas com sacudimento brando em um oscilador rotativo a 40 rpm para digerir as paredes de célula. Após incubação, a solução de enzima - proto- plasto foi filtrada sob condições assépticas através de um "strainer" de célula de 100 μm (Sigma Chemical Co.) colocado no topo de um tubo centrífugo de 50 ml disponível. A solução foi centrifugada a 50 x g por 5 minutos. Após descarte do sobrenadante, o pélete de protoplasto foi re-suspensa em 4 ml de meio MS9m. A suspensão de protoplasto foi brandamente assentada no topo de 4,5 ml de MS com solução de sacarose 0,5 M em um tubo centrífugo de 15 ml e centrifugada a 50 x g. Os protoplastos foram retirados com uma micropipeta de uma banda espessa localizada na interfase e lavados com 5 ml de meio MS9m por centrifugação a 50 x g por 5 minutos.
[00410] Para tratamento de DNA, o pélete de protoplasto foi res- suspenso em 200 μl de solução de Mg-manitol a uma concentração final de 1 x 105 protoplastos/ml. Uma amostra de 50 de um DNA de plasmídeo não-binário, tal como pDAB7151 (tabela 2), foi adicionada a 200 μl de solução de protoplasto contida em um tubo centrífugo estéril disponível de 15 ml e misturada. Um volume igual de 40% de solução de PEG-3350 (Sigma Chemical Co) foi adicionado a solução de proto- plasto e incubado à temperatura ambiente por 20 minutos. Subsequentemente, 0,8 ml de meio W5 (125 mM de CaCl2.H2O, 154 mM de NaCl, 5 mM de KCl e 5 mM de glicose) foi adicionado e incubado por um adicional de 10 minutos, seguido por centrifugação a 180 x g por 3 minutos. A solução de PEG foi removida com uma pipeta e os proto- plastos ressuspensos em 1 ml de solução de WI. Os tubos foram então incubados no escuro por cerca de 18 horas, seguido por centrifugação a 180 x g por 3 minutos. O sobrenadante foi removido, e 100 μl de suspensão de protoplasto foram transferidos para um tubo Eppen- dorf de 2 ml. Os protoplastos (105/ml) foram coletados a 0, 1, 2, 3 dias pós-tratamento de DNA e armazenados a -80°C até análise. Uma amostra de 10 μl da suspensão de protoplasto foi misturada com mancha de fluoresceína diacetato, e protoplastos viáveis foram contados em um hemocitômetro.
[00411] Em outro exemplo, o sistema de distribuição transiente usou transformação mediada por Agrobacterium dos segmentos de hipocotila. Os segmentos foram cultivados em filtro de papel estéril em meio de indução de calo MSK1D1, e foram dados um pré-tratamento de 3 dias conforme descrito acima para o protocolo de "whiskers". O dia antes do tratamento com Agrobacterium, cultura bacterial (1 volta) de um plasmídeo binário tal como pDAB7147 (tabela 2) foi inoculada em um frasco contendo 35 ml de meio YEP contendo os antibióticos apropriados. A cultura bacterial foi permitida crescer durante a noite por ~16 horas no escuro a 28° C com oscilação constante a 200 rpm. O próximo dia, solução de Agrobacterium foi preparada a uma concentração final de Klett 50 em meio M líquido. Os segmentos de hipocotila foram transferidos a partir do papel de filtro para prato petri de 100 x 25 mm contendo 40 ml de suspensão de Agrobacterium e incubados por 30 min à temperatura ambiente com redemoinho periódico de 10 em 10 minutos. No final do período de tratamento, a solução de Agrobacterium foi removida e os segmentos de hipocotila foram transferidos de volta para as placas originais contendo meio MSK1D1 com papel de filtro. Os segmentos foram cocultivados por 3 dias em Percival ou ambiente de cultura sob intensidade de luz reduzida por cobertura das placas com folha de alumínio.
[00412] Após 3 dias de cocultivo, os segmentos foram transferidos no meio de indução de calo MSK1D1TC (MS, 1 mg/l de cinetina, 1 mg/l 2,4-D, 0,5 gm/l MES, 5 mg/l de AgNO3, 300 mg/l de Timentin, 200 mg/l de Carbenicilina, 3% de sacarose, 0,7% de Phytagar). Cerca de 100 mg de tecidos de hipocotila foram tomados 0, 2, 3, 4, e 7 dias pós- tratamento com Agrobacterium e armazenados a -80°C até análise.
[00413] Em um exemplo de distribuição de ZFN usando-se um sistema de expressão transgênica estável, sementes de Brassica napus var. Nex710 foram esterilizadas na superfície, germinadas por 5 dias, preparadas <1 mm de segmento de hipocotila, e pré-tratadas por 3 dias conforme descrito para o tratamento com "whiskers". Após 3 dias, os segmentos de hipocotila foram tratados com qualquer das cepas de Agrobacterium binárias (tabela 2) e cocultivados por 3 dias conforme descrito para sistema de expressão transiente mediado por Agrobacterium conforme descrito acima.
[00414] Após 3 dias de cocultivo, 300 segmentos de hipocotila foram transferidos no meio de indução de calo MSK1D1H1 (MS, 1 mg/l de cinetina, 1 mg/l 2,4-D, 0,5 gm/l de MES, 5 mg/l de AgNO3, 300 mg/l de Timentina, 200 mg/l de Carbenicilina, 1 mg/l de Herbiace, 3% de sacarose, 0,7% de Phytagar) com um baixo nível de seleção de herbicida por 7 dias. Os segmentos de hipocotila foram então transferidos para meio MSK1D1H3 contendo níveis mais altos de seleção (MS, 1 mg/l de cinetina, 1 mg/l de 2,4-D, 0,5 gm/l de MES, 5 mg/l de AgNO3, 300 mg/l de Timentin, 200 mg/l de Carbenicilina, 3 mg/l de Herbiace, 3% de sacarose, 0,7% de Phytagar) por 2 semanas e subsequentemente transferidos para meio MSK1D1H5 (MS, 1 mg/l de cinetina, 1 mg/l de 2,4-D, 0,5 gm/l de MES, 5 mg/l de AgNO3, 300 mg/l de Timen- tina, 200 mg/l de Carbenicilina, 5 mg/l de Herbiace, 3% de sacarose, 0,7% de Phytagar) por outras 2 semanas. Um total de 203 e 227 linhas de calo foram obtidos para cada um ads construções binárias (tabela 2), dando frequência de calo de 67,6% e 75,5% respectivamente. Cinquenta linhas de calo aleatórias foram então submetidas a análise de DNA seguindo 5-7 semanas pós-tratamento com Agrobacterium.
C: Análise de Paralogo de EPSPS para Clivagem de Trançado Duplo Mediada por ZFN alvo
[00415] A funcionalidade de uma ZFN neste exemplo é compreendida para incluir (mas não limitado a) a capacidade de uma ZFN expressar em células de uma espécie de colheita, e para que ZFN medie uma quebra de fita dupla (ds) no genoma endógeno daquela colheita através de reconhecimento de, ligação a e clivagem de seu alvo desejado. É também compreendido que, neste exemplo, o alvo da ZFN é um gene em um local endógeno e sua conformação dentro do genoma de colheita. De modo a avaliar se ZFNs engenheiradas têm funcionalidade contra o gene-alvo prognosticado em um contexto genômico, ensaios baseados em sequência de DNA foram desdobrados. Quebras ds induzidas por ZNF em DNA são prognosticadas para induzir mecanismos de reparo tal como união terminal não-homóloga (NHEJ) (revista por Cahill et al. (2006) Front Biosci. 1:1958-1976). Um resultado de NHEJ é que uma proporção dos trançados de DNA quebrados será reparada em uma maneira imperfeita, resultando em pequenas dele- ções, inserções ou substituições no local de clivagem. Um versado na técnica pode detectar estas mudanças na sequência de DNA através de uma variedade de métodos.
[00416] Para identificação de NHEJs nos paralogos de EPSPS, ensaios específicos de gene foram desenvolvidos com aproximações baseadas em PCR. Diferenças de sequência suficientes em quatro dos cinco paralogos de EPSPS A, B, C e D permitiram o desenvolvimento de ensaios específicos de paralogo. Sequências de paralogos D e E não podem ser suficientemente diferenciadas no local-alvo, que resultam no desenvolvimento somente de um ensaio representando ambos os paralogos. A amplificação de PCR foi efetuada usando-se iniciadores de oligonucleotídeo específicos para o gene-alvo e flanqueando o local de clivagem prognosticado da ZFN. Os iniciadores de PCR específicos de paralogo foram conforme segue: Paralogo A: Iniciador de orientação de avanço: 5'-TCCCAGCTTCTTTAGATTCTAAGG-3' (SEQ ID NO:17) Iniciador de orientação reversa: 5'-CTGCAACTTTTCACATAGCAA-3' (SEQ ID NO:18) Paralogo B: Iniciador de orientação de avanço: 5'-CAAGAGTGATATCGAGTTGTACCTTGGGAATGCT-3') (SEQ ID NO:19) Iniciador de orientação de reversa: 5'-AGGCCATCATATCGAGCAAACGCAGT-3' (SEQ ID NO: 20) Paralogo C: Iniciador de orientação de avanço: 5'-GGGTAAACAACCGTGCTGTA- 3' (SEQ ID NO:21) Iniciador de orientação de reversa: 5'-AAAGACTGCTGCAAACAAGATC-3' (SEQ ID NO:22) Paralogo D/E: Iniciador de orientação de avanço: 5'-GGTTGTTGAAGGATGCGGT-3' (SEQ ID NO: 23) Iniciador de orientação de reversa: 5'-GCAAACAATTCATAGAGTAAATGTG-3' (SEQ ID NO:24)
[00417] Todos os iniciadores de PCR de orientação de avanço e reversa foram usados em combinações para um dado paralogo para amplificar ou DNA genômico purificado ou DNA de plasmídeo de controle positivo contendo cada um dos paralogos sob as seguintes condições: 25 μl de volume de reação contendo 2,5 μl de modelo de DNA (10 ng/μl) ou controle positivo de DNA de plasmídeo (1 ng/μl), 0,625 μl de cada iniciador (a 10 μM cada), 2,5 μl de 10x de tampão ACCUPRI- ME PCR II, e 0,15 μl (0,75 unidades) ACCUPRIME Taq DNA polime- rase (Invitrogen, Carlsbad, CA) no tampão produtor de enzima. A amplificação foi executada no ICYCLER IQ (Bio-Rad, Hercules, CA) usando-se os seguintes parâmetros: 94° C por 2 minutos, 35 ciclos de (94° C por 30 segundos, fortalecimento (vide gradiente abaixo) por 30 segundos, 68° C por 1 minuto), 68° C por 10 minutos, 4° C mantido indefinidamente.
[00418] Um gradiente foi operado para determinar as condições de reação ótimas. A temperatura de gradiente foi entre 65,0° C e 50,0° C. Paralogo A, B, C e D/E mostrou a melhor amplificação a 62,1°C, 65,0°C, 65,0° C, e 59,3° C de temperaturas de fortalecimento respectivamente (figuras 3A-3D), e estas temperaturas foram usadas em estudos subsequentes. Os produtos de PCR para todos os 4 paralogos foram clonados no vetor TOPO pCR 2.1 (Invitrogen, Carlsbad, CA) e confirmados por sequenciamento de amplificação específica de paralogo.
[00419] Os três métodos transientes e tem método estável de distribuição de ZFN para células de hipocotila, conforme descrito acima, foram comparados para identificar o método mais eficaz para avaliar a eficácia da ZFN (determinada pela presença do número mais alto de NHEJs). ZFNs específicas de paralogo D que foram comprovadas efi-cientes em 293 células de rim foram usadas neste estudo. Estas prote-ínas de ZFN foram prognosticadas para se ligarem a 2 sequências es-pecíficas de gene de EPSPS curtas de paralogo D para criar uma nu-clease heterodimérica que cliva o DNA de fita dupla (figura 4). Estes genes de ZFN estavam presentes em quatro construções; duas cons-truções binárias, pDAB7147 e pDAB7150, que foram específicas para transformação mediada por Agrobacterium e os dois construtos rema-nescentes, pDAB7151 e pDAB7154, para transformação transiente, (tabela 2). O tecido de calo estavelmente transformado foi adicionalmente categorizado em amostras "verde" e "marrom", com a possibilidade de expressão de ZFN mais alta no tecido "marrom" e, consequentemente, a chance de frequências mais altas de NHEJs. O último pode ter conduzido a toxicidade de célula fazendo com que os tecidos tornem-se "marrom." Todas as amostras foram coletadas (vide seção 4B), incluindo controles não-tratados, congelados, e liofilizados, exceto para as amostras de protoplasto, que foram usadas diretamente para isolamento de DNA. DNA genômico foi isolado pelo método de Qiagen conforme descrito acima. 3 μg de todo o DNA genômico foi digerido com 5 unidades de Mae III endonuclease de restrição (Roche Applied Science, Indianapolis, IN) durante a noite pelas recomendações do fabricante.
[00420] O DNA foi então purificado por precipitação de etanol pela adição de 0,1 volume de acetato de sódio a 3 M, pH 5,2 e 2 volumes de 100% de etanol, seguido por centrifugação em uma centrífuga por 5 minutos a 10.000 g. O DNA foi então lavado com 70% de etanol, e o pélete foi secado em um evaporador SPEEDVAC (Savant) e ressus- penso em água. O DNA foi então submetido a uma segunda digestão Mae III durante a noite e precipitado com etanol conforme notado antes. O local de enzima de restrição está localizado entre as duas loca- lizações de ligação de ZFN monoméricas de um par (figura 4), e próximo a onde os domínios Fok1 dimerizam e induzem quebras de fita dupla no DNA genômico. Consequentemente, a digestão de enzima de restrição enriquece os fragmentos que suportaram NHEJs resultando na perda dos locais de reconhecimento de enzima de restrição.
[00421] Amplificação de PCR foi então efetuada usando-se iniciadores de oligonucleotídeo específicos a paralogo D e flanqueando o local de clivagem prognosticado da ZFN. O iniciador de PCR de orientação de avanço (5'-GGTTGTTGAAGGATGCGGT-3') (SEQ ID NO:23) e iniciador de PCR de orientação reversa (5'- GCAAACAATTCATAGAGTAAATGTG-3') (SEQ ID NO:24) específico para o paralogo D de EPSPS alvo foram usados em combinação para amplificar DNA genômico purificado sob as seguintes condições: 55 μl de volume de reação contendo 10 μl de gDNA digerido por Mae III (26,4 ng) modelo, 1,25 μl de cada iniciador (a 10 μM cada), 5 μl de 10x tampão de PCR II ACCUPRIME, 5 μl de 10% de PVP-40 e 1 μl (5 unidades) de ACCUPRIME TaqDNA polimerase (Invitrogen, Carlsbad, CA). Os produtos de amplificação do tamanho esperado resultou de ciclos de amplificação consistindo em 94°C por 2 mi nutos, 40 ciclos de (94°C por 30 segundos, 59,3°C por 30 segundos, 68°C por 1 minuto), 68°C por 10 minutos, e 4°C mantido indefinidamente. Os fragmentos amplificados foram diretamente clonados no vetor pCR2.1 usando-se o kit de clonagem de TA de Invitrogen (Carlsbad, CA).
[00422] Aproximadamente 90 fragmentos clonados individuais por ponto de tempo por tratamento foram sequenciados usando-se os locais de revestimento M13 de Avanço e M13 Reverso presentes no vetor pCR 2.1. Controles não-tratados foram incluídos para um dado tratamento. Aproximadamente 3000 clones foram sequenciados desse modo.
[00423] A análise de todos o resultados de sequenciamento através de dois tratamentos de ZFN diferentes revelou 13 clones (confirmados por ambos iniciadores de sequenciamento de avanço e reverso) contendo uma pequena deleção no local de clivagem precisamente prognosticado da ZFN presente em pDAB7151, indicando que o mecanismo de NHEJ tinha mediado um reparo imperfeito da sequência de DNA naquele local (figura 5). Estes clones particular foram obtidos a partir das amostras de DNA de protoplasto 3 dias pós-transformação de ZFN. Estes resultados demonstram a capacidade das ZFNs enge- nheiradas induzirem quebras de fita dupla alvo em uma maneira específica em um local de gene endógeno dentro de uma espécie de colheita. Nenhum NHEJ foi observado em qualquer outro método de tratamento de ZFN com este tipo de sequenciamento.
D. Análise de Sequenciamento Massivamente Paralelo
[00424] Em outro exemplo, uma combinação de PCR e métodos de pirossequenciamento massivamente paralelos foram aplicados para interrogar paralogo D nas amostras conforme obtidas acima. O mesmo conjunto de iniciadores específicos de paralogo D de avanço e reverso (SEQ ID NO:23 e SEQ ID NO:24) foram usados para amplificar o DNA de todas as amostras representando os 3 transientes e um método estável de transformação de ZFN em células de hipocotila de canola. As condições de amplificação foram conforme descrito acima.
[00425] Este produto de amplificação primário foi então purificado usando-se o kit de purificação de PCR MINELUTE (Qiagen, Valencia, CA), e elui o DNA em 10 μl. Um segundo conjunto de iniciadores em-butidos foi designado para amplificar um fragmento de aproximadamente 100 pb adequado para sequenciamento massivamente paralelo. Seis variantes do iniciador de PCR de orientação de avanço (5'-XXX AGTTGTACCTTGGGAATG-3') (SEQ ID NO:25) em que XXX = GGC, CGC, GGC, CGG, CCG, ou GCG, e seis variantes do iniciador de PCR de orientação reversa (5'-XXX ATCAATTTCTTGACAATAACA-3') (SEQ ID NO:26) em que XXX = GGC, CGC, GGC, CGG, CCG, ou GCG, foram sintetizados e purificados por HPLC (IDT, Coralville, IA). Os tags de 3-pb na extremidade 5' de cada iniciador serviram como um identificador-chave e indicou que amostra de célula do amplicon originado. Pares de iniciador com equiparação de tags identificadores (chaves) foram usados em combinação para amplificar amplicon de PCR primário purificado derivado de amostras descritas acima sob as seguintes condições: 50 μl de volume de reação contendo 10 μl de amplicon de PCR purificado diluído 1:10, 1,25 μl de cada iniciador (10 μM cada), 5 μl 10x de tampão de PCR ACCUPRIME I e 0,3 μl (1,5 unidades) de polimerase ACCUPRIME TaqDNA de alta fidelidade (In- vitrogen, Carlsbad, CA) no tampão do fabricante de enzima. Os produtos de amplificação do tamanho expresso resultou de ciclos de amplificação consistindo em 94°C por 2 minutos, 30 ciclos de (94°C por 30 segundos, 62°C por 30 segundos, de 68°C por 30 segu ndos), 68°C por 5 minutos, e 4°C mantido indefinidamente e foram pu rificados usando- se o kit de purificação de PCR MINELUTE (Qiagen, Valencia, CA) como por recomendações do fabricante.
[00426] Reações de pirossequenciamento massivamente paralelas (também conhecidas como sequenciamento 454) foram realizadas di-retamente em produtos de PCR conforme descrito em (Margulies et al. (2005) Nature 437:376-380). A análise de 454 resultados de sequenci- amento foi efetuada por identificação de leituras de sequência contendo deleções do tamanho esperado e posição dentro da molécula de DNA. Os resultados destas análises indicaram a presença de deleções pequenas múltiplas de 9-12 pb no local de clivagem esperado para estas ZFNs, conforme mostrado na figura 6. Quarenta e seis das quarenta e oito deleções foram observadas nas leituras de sequência obtidas dos calos verdes estavelmente transformados com o construto de ZFN, pDAB7147 (tabela 3). Duas deleções adicionais com o mesmo par de ZFN foram obtidas, uma a partir do DNA de protoplasto transi-entemente tratado (pDAB7151) e outra a partir do tecido de hipocotila transientemente tratado com Agrobacterium (pDAB7147). Estas dele- ções foram precisamente localizadas no local-alvo de ZNF e indicaram que quebras ds induzidas pela ZFN foram geradas, que foram subse-quentemente reparadas pelo mecanismo de NHEJ.
[00427] Desde que os paralogos D e E foram indistinguíveis pelo ensaio de PCR usado neste exemplo, é possível que qualquer ou ambos dos paralogos foram clivados pela ZFN. Estes resultados demonstram adicionalmente a capacidade das ZFNs engenheiradas induzirem quebras de fita dupla alvo em uma maneira específica em um local de gene endógeno dentro de uma espécie de colheita. Comprovou-se adicionalmente que o método estável de transformação de ZNF foi o método mais eficaz para classificação de NHEJs sob as condições ex-perimentais atuais. As ZFNs presentes nos construtos pDAB7150 e pDAB7154 não mostraram quaisquer deleções através das amostras múltiplas tratadas com os métodos de transformação diferentes (vide tabela 4). Tabela 4: Os resultados de sequenciamento massivamente paralelo mostrando NHEJs nas sequências-alvo do paralogo D de EPSPS obtido de transformação transiente e estável de segmentos de hipocotila de B. napus com ZFNs pDAB7147 e pDAB7151. A amostra de controle foi compreendida de tecidos não tratados com as ZFNs.
Figure img0010
Figure img0011
[00428] Em um esforço para analisar quebras de fita dupla induzidas por ZNF em outros paralogos de EPSPS, uma combinação de PCR e pirossequenciamento massivamente paralelo foram realizadas para interrogar o DNA dos paralogos de EPSPS remanescentes para quebras de fita dupla induzidas por ZNF. O DNA digerido com MaeIIII dos mesmos calos estáveis "Verdes" transformados com cepa de Agrobacterium contendo pDAB7147 e pDAB7150, conforme descrito nas seções 4D-E, foram empregados. A amplificação de PCR foi então efetuada com iniciadores de oligonucleotídeo específicos para os para-logos de EPSPS A, B, C e D que ancorados no DNA genômico flan-queando o local de clivagem prognosticado da ZFN. Um iniciador de PCR de orientação de avanço para paralogo A (5'- TCCCAGCTTCTTTAGATTCTAAGG-3') (SEQ ID NO:17) e iniciador de PCR de orientação de reversa (5'-CTGCAACTTTTCACATAGCAA -3') (SEQ ID NO:18), um iniciador de PCR de orientação de avanço para paralogo B (5'-CAAGAGTGATATCGAGTTGTACCTTGGGAATGCT-3') (SEQ ID NO:19) e iniciador de PCR de orientação de reversa (5'- AGGCCATCATATCGAGCAAACGCAGT-3') (SEQ ID NO:20), iniciador de PCR de orientação de avanço para paralogo C (5'- GGGTAAA- CAACCGTGCTGTA-3') (SEQ ID NO:21) e iniciador de PCR de orien-tação de reversa (5'-AAAGACTGCTGCAAACAAGATC -3') (SEQ ID NO:22) e o mesmo conjunto de iniciadores de avanço e reverso para paralogo D (SEQ ID NO:23 e SEQ ID NO:24), conforme descrito nas seções 4 D-E, foram usados em combinação para amplificar o DNA genômico para cada um dos paralogos separadamente sob as seguintes condições: 50 μl de volume de reação contendo 200 ng de modelo de gDNA digerido com Mae III (10 μl), 1,25 μl de cada iniciador (em 10 μM cada), 5 μl de 10x tampão de PCR II de Accuprime , 5 μl de 10% de PVP-40 e 0,3 μl (1,5 unidades) de polimerase de alta fidelidade ACCUPRIME TaqDNA (Invitrogen, Carlsbad, CA) no tampão de fabricante de enzima. Os produtos de amplificação foram gerados de ciclos de amplificação consistindo em 94°C por 2 minutos, 25 ciclos de (94°C por 30 segundos, fortalecimento por 30 segundos, 68°C por 1 minuto), 68°C por 5 minutos, 4°C mantido indefinidamente. As temperaturas de fortalecimento foram conforme segue para os seguintes paralogos A=62,1°C B=65°C, C=65°C e D = 59,3°C.
[00429] Este produto de amplificação primário foi então purificado usando-se o Kit de Purificação de PCR Qiagen MinElute (Qiagen, Va-lencia, CA) e eluído em 10 μl de tampão EB. Três variantes de um ini-ciador de PCR de orientação de avanço de Paralogo A (5'-XXX ATCGAGTTGTACCTTGGGAATG -3') (SEQ ID NO:27) em que XXX = GGC, CGG, ou GCC e três variantes de um iniciador de PCR de orien-tação de reversa de Paralog A (5'-XXX AATAAGTCCTTAACCTTAC- CTT-3') (SEQ ID NO:28) em que XXX = GGC, CGG, ou GCC foram sintetizados e purificados por HPLC (IDT, Coralville, IA). Três variantes de um iniciador de PCR de orientação de avanço de Paralogo B (5'- XXX AGAGTGATATCGAGTTGTACCTTG -3') (SEQ ID NO:29) em eu XXX = CGG, CGC, ou GCC e três variantes de iniciador de PCR de orientação de reversa de Paralogo B (5'-XXX ACACTCCTTAACCT- TACCTT -3') (SEQ ID NO:30) em que XXX = CGG, CGC, ou GCC foram sintetizados e purificados com HPLC (IDT, Coralville, IA). Três variantes de um iniciador de PCR de orientação de avanço de Paralogo C (5'-XXX AGAGTGATATTGAGTTGTACCTTG-3') (SEQ ID NO:31) em que XXX = CGG, GGC, ou GCC e três variantes de um iniciador de PCR de orientação reversa de Paralogo C (5'-XXX AAAGCTCCT- TAACCTTTACCT -3') (SEQ ID NO:32) em que XXX = CGG, GGC, ou GCC foram sintetizados e purificados com HPLC (IDT, Coralville, IA). Os iniciadores para a amplificação de PCR secundária (SEQ ID NO:25 e SEQ ID NO:26) para paralogo D são descritos na seção 4D. As etiquetas de 3 pb na extremidade 5'de cada iniciador serviu como uma chave identificadora e indicou que amostra de B. napus do amplicon se originou. Pares de iniciador com equiparação de tags identificadores (chaves) foram usados em combinação para amplificar amplicon de PCR primário purificado derivado das amostras descritas acima sob as seguintes condições: 50 μl de volume de reação contendo 10 μl de amplicon de PCR purificado diluído 1:10, 1,25 μl cada iniciador (10 μM cada), 5 μl 10x de tampão de PCR I ACCUPRIME e 0,3 μl (1,5 unidade) de polimerse de alta fidelidade de ACCUPRIME TaqDNA (Invitro- gen, Carlsbad, CA) no tampão do fabricante de enzima. Os produtos de amplificação do tamanho esperado resultou de ciclos de amplificação consistindo em 94°C por 2 minutos, 33 ciclos de (94°C por 30 segundos, 62°C por 30 segundos, 68°C por 30 segundos) , 68°C por 5 minutos, e 4°C mantido indefinidamente, e foram purificados usando- se Qiagen's (Valencia, CA) kit de purificação de PCR MINELUTE pelas recomendações do fabricante.
[00430] Reações de pirossequenciamento massivamente paralelas foram realizadas diretamente nos produtos de PCR conforme descrito na seção 4D. A análise dos resultados do sequenciamento foi efetuada por identificação de leituras de sequência contendo deleções do tama- nho esperado e posição dentro da molécula de DNA.
[00431] Os resultados destas análises indicaram a presença de de- leções pequenas múltiplas no local de clivagem de ZNF esperado nos paralogos C e D (figura 7). pDAB7147 ZFN foi novamente eficiente na clivagem de dois paralogos, C e D (e E). Estas deleções de 5 - 32 pb foram precisamente localizadas no local-alvo de ZFN e demonstraram a clivagem de 2 ou mais paralogos de EPSPS pelo ZFN de FpDAB7147. Estes resultados demonstraram adicionalmente a capacidade destas ZFNs engenheiradas induzirem quebras de fita dupla- alvos em uma maneira específica em um local de gene endógeno dentro de uma espécie de colheita.
[00432] Um NHEJ cada foi também observado nos paralogos A e B das amostras 5, 6 e 9 tratadas com pDAB7147 e pDAB7150 (tabela 5). Estes NHEJs foram observados nas localizações esperadas. Contudo, desde que algumas das amostras de controle também contêm um NHEJ (amostras 2, 7 e 13 na tabela 5), as ZFNs não foram consideradas eficientes na clivagem destes paralogos. Tabela 5: Os resultados de sequenciamento massivamente paralelo mostrando moléculas de DNA que têm suportado quebras de fita dupla mediadas por ZFN seguido por reparo de NHEJ nas sequências-alvo dos quatro paralogos de EPSPS em B. napus. AS amostras de controle representam calos transgênicos não-tratados com ZFNs.
Figure img0012
Figure img0013
Exemplo 5: Uma segunda ZFN c iva os dois paralogos remanescentes dos cinco em B. napus
[00433] Em, seguida, clivagem de fita dupla mediada por ZFN, focalizada na indução de quebras de fita dupla nos dois paralogos remanescentes A e B, foi tentada. Duas novas ZFNs engenheiradas com sequências diferentes alvo, localizadas cerca de 350 pb 5' a partir da primeira localização de ligação de ZFN, foram usadas (figura 4). Estes construtos de ZFN particulares, pDAB7185 e pDAB7186 (tabela 3), foram usados na transformação estável de segmentos de hipocotila de B. napus, conforme descrito no Exemplo 4, seção B. Os calos esta- velmente transformados com ZFNs foram congelados, liofilizados e extraídos com DNA conforme descrito anteriormente no Exemplo 4, seção C. O DNA foi então digerido com ou BsoB1 (New England Biolabs, Ipswich, MA) ou Lwe I (Fermentas, Inc., Hanover, MD) para enriquecer os fragmentos que tinham suportado NHEJs (figura 4). As digestões foram efetuadas como pelas instruções do fabricante e purificadas por precipitação de etanol conforme descrito anteriormente. A amplificação de PCR foi então efetuada usando-se iniciadores de oli- gonucleotídeo específicos para os genes-alvo e flanqueando o local de clivagem prognosticado da ZFN. Um iniciador de PCR de orientação de avanço para paralogo A (5'-CAGCGTGGAGCTTATCAGA-3') (SEQ ID NO:33) e iniciador de PCR de orientação reverso (5'- AAACGCAA- CACTAAGCAAAC-3') (SEQ ID NO:35), um iniciador de PCR de orien-tação de avanço para paralog B (5'- GAAGAGTAACAACGGCTCTGTG -3') (SEQ ID NO:34) e um iniciador de PCR de orientação reversa (5'- GAAAGAAAGAAGCAAACCGAC-3') (SEQ ID NO:90), específicos para os paralogos de gene de EPSPS alvo foram usados em combinação para amplificar DNA genômico purificado sob as seguintes condições.
[00434] Para Paralogo A, 50 μl de volume de reação contendo 420700 ng de modelo de DNA genômico digerido BsoBI (10 μl), 1,25 μl de cada iniciador (a 10 μM cada), 5 μl de 10x de tampão de PCR II de ACCUPRIME, 5 μl de 10% de PVP-40 e 0,3 μl (1,5 unidades) de AC- CUPRIME TaqDNA de polimerase de alta fidelidade (Invitrogen, Carls-bad, CA) no tampão do fbricante de enzima. Os produtos de amplificação foram gerados de ciclos de amplificação consistindo em 94°C por 2 minutos, 28 ciclos de (94°C por 30 segundos, 60°C por 30 segundos, 68°C por 1 minuto), 68°C por 5 minutos, 4°C mantido indefinidamente.
[00435] Para Paralogo B, 50 μl de volume de reação contendo 420 - 700 ng de modelo de gDNA digerido de BsoBI (10 μl), 1,25 μl de cada iniciador (a 10 μM cada), 5 μl de 10x de tampão de PCR de Accuprime II, 5 μl de 10% de PVP-40 e 0,3 μl (1,5 unidades) de polimerase de alta fidelidade (Invitrogen, Carlsbad, CA) no tampão do fabricante de enzima. Os produtos de amplificação foram gerados de ciclos de amplificação consistindo em 94°C por 2 minutos, 28 ci clos de (94°C por 30 segundos, 58 °C por 30 segundos, 68°C por 1 minuto), 68°C por 5 minutos, 4°C mantido indefinidamente. Este produto de amplificação primário foi então isolado usando-se o kit de purificação de PCR MI NELUTE (Qiagen, Valencia, CA) eluindo em 10 μl de tampão EB. Três variantes de um Paralogo A de iniciador de PCR de orientação de avanço (5'-XXX TCTGTTTCCACGGCGGAG -3') (SEQ ID NO:36) em que XXX = CCG, GCG, ou CGC e três variantes de um iniciador de PCR de orientação reversa de Paralogo A (5'-XXX AAGCGG- CAAGAAGAAGAATC -3') (SEQ ID NO:37) em que XXX = CCG, GCG, ou CGC foram sintetizados e purificados com HPLC (IDT, Coralville, IA). Três variantes de um iniciador de PCR de orientação de avanço de Paralogo B (5'-XXX TCTGTTTCCACGGCTGAG -3') (SEQ ID NO:38) em que XXX = GGC, GCC, ou CGG e três variantes de um iniciador de PCR de orientação reversa de Paralogo B (5'-XXX ATTG- GACAGAGATTTGGGTC -3') (SEQ ID NO:39) em que XXX = GGC, GCC, ou CGG, foram sintetizados e purificados com HPLC (IDT, Co-ralville, IA). Os tags 3-pb na extremidade 5' de cada iniciador servem como uma chave identificadora e indicaram que amostra dos fragmentos amplificados se originou. Pares de iniciador com equiparação de tags identificadores (chaves) foram usados em combinação para amplificar amplicon de PCR primário purificado derivado de amostras descritas acima sob as seguintes condições: 50 μl de volume de reação contendo 10 μl de amplicon de PCR purificado diluído 1:10, 1,25 μl de cada iniciador (10 μM cada), 5 μl de 10x tampão I de PCR de AC- CUPRIME e 0,3 μl (1,5 unidade) de polimerase de alta fidelidade de ACCUPRIME TaqDNA (Invitrogen, Carlsbad, CA) no tampão do fabricante de enzima.
[00436] Os produtos de amplificação do tamanho esperado resultaram de ciclos de amplificação consistindo em 94°C p or 2 minutos, 25 ciclos de (94°C por 30 segundos, fortalecimento por 30 segundos, 68°C por 30 segundos), 68°C por 5 minutos, 4°C mant ido indefinidamente, e foram purificados usando-se Qiagen's (Valencia, CA) kit de purificação de PCR de MINELUTE conforme recomendações do fabri- cante. As temperaturas de fortalecimento par reação de PCR secundária listadas acima foram conforme segue: Paralogo A a 66°C e Paralogo B a 64°C.
[00437] Reações de pirossequenciamento massivamente paralelas foram realizadas diretamente nos produtos de PCR. A análise dos resultados do sequenciamento foi efetuada por identificação das leituras de sequência contendo deleções do tamanho esperado e posição dentro da molécula de DNA.
[00438] Os resultados destas análises indicam a presença de dele- ções pequenas múltiplas no local esperado de clivagem (figura 8, tabela 6). Novamente, estas deleções foram precisamente localizadas no local-alvo de ZFN e indicou que quebras de fita dupla, induzidas pela ZFN, foram geradas no genoma e subsequentemente reparadas por NHEJ. ZFN clonada em pDAB7185 foi além de tudo mais efetiva em causar quebras de fita dupla do que ZFN pDAB7186.
[00439] Estes resultados demonstram adicionalmente a capacidade destas ZFNs engenheiradas induzirem quebras de fita dupla-alvos em uma maneira específica em num local de gene dentro de uma espécie de colheita. Os resultados também demonstraram a capacidade da mesma ZFN clivar dois paralogos de EPSPS A e B. Tabela 6: Os resultados de sequenciamento massivamente paralelo mostrando moléculas de DNA que têm suportado quebras de fita dupla mediadas por ZFNs, seguido por reparo de NHEJ nas sequências-alvo dos paralogos de EPSPS A e B, em B. napus. As amostras de controle representam calos transgênicos não-tratados com ZFNs.
Figure img0014
Figure img0015
Exemplo 6: Dois ZFNs Podem Clivar Todos os Paralogos de EPSPS
[00440] Em outro exemplo, segmentos de hipocotila de B. napus foram cotransformados com duas ZFNs e eventos transgênicos estáveis foram criados contendo ambas as ZFNs, que demonstraram NHEJs em todos os paralogos de EPSPS. As construções de ZFN específicas usadas para cotransformação neste experimento foram pDAB7147 e pDAB7185 (tabela 3). Eventos de calo transgênico estável foram gerados, DNA isolado e analisado conforme descrito nos Exemplos 4 e 5. NHEJs em todos os quatro paralogos de EPSPS A, B, C e D, similares àqueles descritos nas seções 4 e 5, foram identificados. Novamente, NHEJs nos paralogos D e E não podem ser diferenciados devido a similaridade de sequência. Todos os NHEJs foram localizados nas sequências-alvo prognosticadas dos vários paralogos.
[00441] Estes resultados validam dois pontos: 1. ZFNs podem ser designados contra sequências diferenciadas de uma família de multigene para clivar especificamente 1-2 gene/paralogo. 2. ZFNs múltiplas podem ser usadas, se necessário, para clivar todos os paralogos de gene simultaneamente.
[00442] Informação adicional relacionada a clivagem-alvo, recombi- nação-alvo e integração-alvo podem ser encontradas nas publicações de Pedido de Patente U.S. US-2003-0232410; US-2005-0026157; US- 2005-0064474; US-2005-0208489 e US-2007-0134796, as descrições das quais são incorporadas por referência em suas totalidades para todas as propostas.
[00443] Todas as patentes, pedidos de patente e publicações aqui mencionados são, desse modo, incorporados por referência, em suas totalidades, para todas as propostas.
[00444] Embora descrição tenha sido provida em algum detalhe por meio de ilustração e exemplo para a proposta de clareza de compreensão, será aparente àqueles versados na técnica que várias mudanças e modificações podem ser praticadas sem fugir do espírito ou escopo da descrição. Consequentemente, as descrições e exemplos precedentes não devem ser construídos como limitantes.

Claims (19)

1. Proteína de dedo de zinco (ZFP) que ocorre não- naturalmente que se liga a uma região genômica-alvo de EPSPS de interesse, caracterizada pelo fato de que compreende um ou mais do-mínios de ligação de dedo de zinco engenheirados, em que a ZFP é engenheirada para se ligar a um sítio alvo na região genômica alvo EPSPS de interesse e é selecionada dentre as ZFPs que apresentam as regiões hélice de reconhecimento a seguir: SEQ ID NO:91; SEQ ID NO:93; SEQ ID NO:94 e SEQ ID NO:95; ou SEQ ID NO:96, SEQ ID NO:97, SEQ ID NO:98, SEQ ID NO:99 e SEQ ID NO:100; ou SEQ ID NO:94, SEQ ID NO:101, SEQ ID NO:102; SEQ ID NO:103; e SEQ ID NO:103; ou SEQ ID NO:94, SEQ ID NO:101, SEQ ID NO:102, SEQ ID NO:103, SEQ ID NO:103; ou SEQ ID NO:104 SEQ ID NO:105, SEQ ID NO:106, SEQ ID NO:107, SEQ ID NO:106 e SEQ ID NO:108; SEQ ID NO:109, SEQ ID NO:110, SEQ ID NO:111; e SEQ ID NO:12; ou SEQ ID NO:113, SEQ ID NO:114, SEQ ID NO:115 e SEQ ID NO:116; ou SEQ ID NO:113, SEQ ID NO:114, SEQ ID NO:117, e SEQ ID NO:118; ou SEQ ID NO:103, SEQ ID NO:114, SEQ ID NO:115 e SEQ ID NO:116; ou SEQ ID NO:109, SEQ ID NO:110, SEQ ID NO:111 e SEQ ID NO:112; ou SEQ ID NO:113, SEQ ID NO:114, SEQ ID NO:115 e SEQ ID NO:116; ou SEQ ID NO:113, SEQ ID NO:114, SEQ ID NO:117 e SEQ ID NO:118.
2. ZFP, de acordo com a reivindicação 1, caracterizada pelo fato de que é uma proteína de fusão compreendendo um ou mais do-mínios funcionais.
3. ZFP, de acordo com a reivindicação 2, caracterizada pelo fato de que compreende um ou mais domínios funcionais selecionados dentre o grupo consistindo em um repressor transcricional, uma endo-nuclease, uma metiltransferase, uma histona desacetilase, um ativador transcricional e uma histona acetiltransferase.
4. Nuclease de dedo de zinco (ZFN), caracterizada pelo fato de que cliva a região genômica alvo EPSPS de interesse, a referida ZFN compreendendo uma ZFP como definida na reivindicação 3 e um domínio de clivagem de nuclease.
5. ZFN, de acordo com a reivindicação 4, caracterizada pelo fato de que a ZFN cliva uma ou mais sequências de gene parálogas ou ortólogas de EPSPS.
6. Vetor doador, caracterizado pelo fato de que compreende primeira, segunda e terceira sequências de DNA; no qual (i) a primeira sequência e a segunda sequência são homó-logas às sequências de DNA de EPSPS cromossomal; (ii) as primeira e segunda sequências e a sequência de DNA de EPSPS cromossomal compreendem uma sequência como apresentada em uma dentre SEQ ID NO: 141, 142 e 144-153; e (iii) a terceira sequência está interposta entre a primeira e a segunda sequências e compreende um transgene.
7. Vetor, de acordo com a reivindicação 6, caracterizado pelo fato de que o transgene codifica um marcador selecionável.
8. Vetor, de acordo com a reivindicação 7, caracterizado pelo fato de que o marcador selecionável é selecionado dentre o grupo consistindo em proteína fluorescente verde (GFP), β-glucuronidase (GUS), fosfinotricina N-acetil transferase (PAT), neomicina fosfotrans- ferase, higromicin fosfotransferase, β-lactamase, catecol dioxigenase, α-amilase, tirosinase, β-galactosidase, luciferase, aequorina, EPSP sintase, nitrilase, acetolactato sintase (ALS), di-hidrofolato reductase (DHFR), dalapon desalogenase e antranilato sintase.
9. Método para introdução de um transgene no genoma de uma célula de planta, caracterizado pelo fato de que compreende a etapa de: expressar uma ou mais nucleases de dedo de zinco (ZFN) na célula, na presença do vetor doador, como definido em qualquer uma das reivindicações 6 a 8, a ZFN compreendendo um domínio de ligação de DNA de dedo de zinco que se liga a um sítio alvo em um gene EPSPS e um domínio nuclease; no qual a ZFN cliva um gene de EPSPS no DNA cromos- somal; tal que a clivagem do DNA cromossomal na etapa (b) esti-mula incorporação do transgene no gene de EPSPS por recombinação homóloga.
10. Método para expressar o produto de um transgene em uma célula de planta, caracterizado pelo fato de que compreende as etapas de: introduzir o transgene em uma célula de planta de acordo com o método como definido na reivindicação 9, tal que o produto do transgene é expresso na célula de planta.
11. Método para deleção de uma sequência de gene de EPSPS a partir de um locus de gene EPSPS no genoma de uma célula de planta, caracterizado pelo fato de que compreende: expressar primeiro e segundo pares de nucleases de dedo de zinco (ZFNs) como definidas na reivindicação 4, na célula, em que a primeira ZFN se liga a um sítio alvo como apresentado em qualquer uma dentre SEQ ID NO: 141 a 151 e cliva um primeiro local de clivagem em um gene de ESPS e a segunda ZFN cliva um segundo local de clivagem no gene de ESPS, em que a sequência de gene de EPSPS está localizada entre o primeiro local de clivagem e o segundo local de clivagem, em que a clivagem dos primeiro e segundo locais de clivagem resulta na deleção da sequência de gene de EPSPS.
12. Método, de acordo com a reivindicação 11, caracterizado pelo fato de que a sequência de gene de EPSPS é deletada por união terminal não-homóloga dos primeiro e segundo locais de clivagem.
13. Método, de acordo com a reivindicação 11 ou 12, carac-terizado pelo fato de que os primeiro e segundo locais de clivagem são separados por pelo menos 100 nucleotídeos.
14. Método, de acordo com a reivindicação 11, caracterizado pelo fato de que a célula de planta é uma célula de planta transgê- nica compreendendo uma sequência de ESPS exógena.
15. Método para modular expressão de um gene de EPSPS, caracterizado pelo fato de que compreende: expressar uma ZFP na célula como definida em qualquer uma das reivindicações 1 a 3, no qual a referida ZFP se liga a um sítio- alvo no gene de EPSPS, modulando, desse modo, expressão do gene de EPSPS.
16. Método, de acordo com a reivindicação 15, caracterizado pelo fato de que a ZFP aumenta transcrição do gene de EPSPS.
17. Método, de acordo com a reivindicação 16, caracterizado pelo fato de que a ZFP aumenta a tolerância de uma planta ao herbicida glifosato.
18. Método, de acordo com a reivindicação 15, caracterizado pelo fato de que a ZFP diminui transcrição do gene de EPSPS.
19. Método, de acordo com a reivindicação 18, caracterizado pelo fato de que a ZFP diminui a tolerância de uma planta ao herbicida glifosato.
BRPI0817560-8A 2007-09-27 2008-09-25 Proteínas de dedo de zinco (zfp) engenheiradas que têm como alvo genes de 5-enolpiruvil shiquimato-3-fosfato sintase, nuclease de dedo de zinco (zfn), vetor, bem como métodos para introdução de um transgene no genoma de uma célula de planta, para expressar o produto de um transgene em uma célula de planta, para deleção de uma sequência de gene de epsps a partir de um locus de gene epsps no genoma de uma célula de planta, e para modular expressão de um gene de epsps BRPI0817560B1 (pt)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US99555707P 2007-09-27 2007-09-27
US60/995,557 2007-09-27
PCT/US2008/011089 WO2009042164A1 (en) 2007-09-27 2008-09-25 Engineered zinc finger proteins targeting 5-enolpyruvyl shikimate-3-phosphate synthase genes

Publications (2)

Publication Number Publication Date
BRPI0817560A2 BRPI0817560A2 (pt) 2015-07-14
BRPI0817560B1 true BRPI0817560B1 (pt) 2022-09-20

Family

ID=40243886

Family Applications (1)

Application Number Title Priority Date Filing Date
BRPI0817560-8A BRPI0817560B1 (pt) 2007-09-27 2008-09-25 Proteínas de dedo de zinco (zfp) engenheiradas que têm como alvo genes de 5-enolpiruvil shiquimato-3-fosfato sintase, nuclease de dedo de zinco (zfn), vetor, bem como métodos para introdução de um transgene no genoma de uma célula de planta, para expressar o produto de um transgene em uma célula de planta, para deleção de uma sequência de gene de epsps a partir de um locus de gene epsps no genoma de uma célula de planta, e para modular expressão de um gene de epsps

Country Status (16)

Country Link
US (3) US8399218B2 (pt)
EP (2) EP3072973B1 (pt)
JP (3) JP5702144B2 (pt)
CN (1) CN101878307B (pt)
AR (1) AR068559A1 (pt)
AU (1) AU2008305568B2 (pt)
BR (1) BRPI0817560B1 (pt)
CA (2) CA2699769C (pt)
DK (1) DK2205749T3 (pt)
ES (1) ES2585157T3 (pt)
HR (1) HRP20161004T1 (pt)
HU (1) HUE029916T2 (pt)
PT (1) PT2205749T (pt)
SI (1) SI2205749T1 (pt)
TW (1) TWI424062B (pt)
WO (1) WO2009042164A1 (pt)

Families Citing this family (120)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
BRPI0307383B1 (pt) 2002-01-23 2019-12-31 The Univ Of Utah Research Foundation método de recombinação genética direcionada em célula de planta hospedeira
ES2627552T3 (es) 2008-12-04 2017-07-28 Sigma Aldrich Company Edición de genoma en ratas usando nucleasas con dedos de cinc
AU2009333863B2 (en) * 2008-12-17 2015-02-05 Corteva Agriscience Llc Targeted integration into the Zp15 locus
KR20100133319A (ko) * 2009-06-11 2010-12-21 주식회사 툴젠 표적 특이적인 게놈의 재배열을 위한 표적 특이적 뉴클레아제 및 이의 용도
US8586526B2 (en) 2010-05-17 2013-11-19 Sangamo Biosciences, Inc. DNA-binding proteins and uses thereof
NZ599351A (en) 2009-10-22 2014-02-28 Dow Agrosciences Llc Engineered zinc finger proteins targeting plant genes involved in fatty acid biosynthesis
US9457077B2 (en) 2009-11-18 2016-10-04 Katherine Rose Kovarik Method and system for targeting the microbiome to promote health and treat allergic and inflammatory diseases
US9585920B2 (en) 2011-02-04 2017-03-07 Katherine Rose Kovarik Method and system for treating cancer cachexia
UA113493C2 (xx) * 2010-01-22 2017-02-10 Спосіб видалення ділянки днк в рослині
GEP20176628B (en) 2010-01-22 2017-02-27 Sangamo Biosciences Inc Targeted genomic alteration
CN103025866A (zh) * 2010-03-22 2013-04-03 菲利普莫里斯生产公司 修饰植物中酶的活性
EP2659411A1 (en) * 2010-12-29 2013-11-06 Dow AgroSciences LLC Data analysis of dna sequences
US20120252122A1 (en) * 2011-01-05 2012-10-04 Sangamo Biosciences, Inc. Methods and compositions for increasing production of induced pluripotent stem cells (ipscs)
CN102174649B (zh) * 2011-01-18 2013-06-12 陕西师范大学 快速检测锌指核酸酶介导基因定点整合的方法
US11951140B2 (en) 2011-02-04 2024-04-09 Seed Health, Inc. Modulation of an individual's gut microbiome to address osteoporosis and bone disease
US10314865B2 (en) 2011-02-04 2019-06-11 Katherine Rose Kovarik Method and system for treating cancer and other age-related diseases by extending the healthspan of a human
US10687975B2 (en) 2011-02-04 2020-06-23 Joseph E. Kovarik Method and system to facilitate the growth of desired bacteria in a human's mouth
US10085938B2 (en) 2011-02-04 2018-10-02 Joseph E. Kovarik Method and system for preventing sore throat in humans
US10583033B2 (en) 2011-02-04 2020-03-10 Katherine Rose Kovarik Method and system for reducing the likelihood of a porphyromonas gingivalis infection in a human being
US10548761B2 (en) 2011-02-04 2020-02-04 Joseph E. Kovarik Method and system for reducing the likelihood of colorectal cancer in a human being
US11523934B2 (en) 2011-02-04 2022-12-13 Seed Health, Inc. Method and system to facilitate the growth of desired bacteria in a human's mouth
US11844720B2 (en) 2011-02-04 2023-12-19 Seed Health, Inc. Method and system to reduce the likelihood of dental caries and halitosis
US11273187B2 (en) 2015-11-30 2022-03-15 Joseph E. Kovarik Method and system for reducing the likelihood of developing depression in an individual
US10842834B2 (en) 2016-01-06 2020-11-24 Joseph E. Kovarik Method and system for reducing the likelihood of developing liver cancer in an individual diagnosed with non-alcoholic fatty liver disease
US11419903B2 (en) 2015-11-30 2022-08-23 Seed Health, Inc. Method and system for reducing the likelihood of osteoporosis
US10835560B2 (en) 2013-12-20 2020-11-17 Joseph E. Kovarik Reducing the likelihood of skin cancer in an individual human being
US11951139B2 (en) 2015-11-30 2024-04-09 Seed Health, Inc. Method and system for reducing the likelihood of osteoporosis
US10245288B2 (en) 2011-02-04 2019-04-02 Joseph E. Kovarik Method and system for reducing the likelihood of developing NASH in an individual diagnosed with non-alcoholic fatty liver disease
US9987224B2 (en) 2011-02-04 2018-06-05 Joseph E. Kovarik Method and system for preventing migraine headaches, cluster headaches and dizziness
US11998479B2 (en) 2011-02-04 2024-06-04 Seed Health, Inc. Method and system for addressing adverse effects on the oral microbiome and restoring gingival health caused by sodium lauryl sulphate exposure
US10512661B2 (en) 2011-02-04 2019-12-24 Joseph E. Kovarik Method and system for reducing the likelihood of developing liver cancer in an individual diagnosed with non-alcoholic fatty liver disease
US10940169B2 (en) 2015-11-30 2021-03-09 Joseph E. Kovarik Method for reducing the likelihood of developing cancer in an individual human being
US9730967B2 (en) 2011-02-04 2017-08-15 Katherine Rose Kovarik Method and system for treating cancer cachexia
US10010568B2 (en) 2011-02-04 2018-07-03 Katherine Rose Kovarik Method and system for reducing the likelihood of a spirochetes infection in a human being
US11357722B2 (en) 2011-02-04 2022-06-14 Seed Health, Inc. Method and system for preventing sore throat in humans
US10086018B2 (en) 2011-02-04 2018-10-02 Joseph E. Kovarik Method and system for reducing the likelihood of colorectal cancer in a human being
US11191665B2 (en) 2011-02-04 2021-12-07 Joseph E. Kovarik Method and system for reducing the likelihood of a porphyromonas gingivalis infection in a human being
US10111913B2 (en) 2011-02-04 2018-10-30 Joseph E. Kovarik Method of reducing the likelihood of skin cancer in an individual human being
US10030245B2 (en) * 2011-03-23 2018-07-24 E I Du Pont De Nemours And Company Methods for producing a complex transgenic trait locus
BR112013025567B1 (pt) * 2011-04-27 2021-09-21 Amyris, Inc Métodos para modificação genômica
WO2013050611A1 (en) 2011-10-07 2013-04-11 Basf Plant Science Company Gmbh Method of producing plants having increased resistance to pathogens
WO2013050318A1 (en) 2011-10-07 2013-04-11 Basf Plant Science Company Gmbh Method of producing plants having increased resistance to pathogens
WO2013050593A1 (en) 2011-10-07 2013-04-11 Basf Plant Science Company Gmbh Method of producing plants having increased resistance to pathogens
WO2013053711A1 (en) 2011-10-10 2013-04-18 Basf Plant Science Company Gmbh Method of producing plants having increased resistance to pathogens
WO2013053686A1 (en) 2011-10-10 2013-04-18 Basf Plant Science Company Gmbh Method of producing plants having increased resistance to pathogens
WO2013074999A1 (en) 2011-11-16 2013-05-23 Sangamo Biosciences, Inc. Modified dna-binding proteins and uses thereof
BR112014014029B1 (pt) * 2011-12-30 2021-12-14 Dow Agrosciences Llc Polinucleotídeo compreendendo um promotor bidirecional
JP6220794B2 (ja) * 2011-12-30 2017-10-25 ダウ アグロサイエンシィズ エルエルシー 合成二方向植物プロモーターubi1のための構築物および方法
EP2612918A1 (en) 2012-01-06 2013-07-10 BASF Plant Science Company GmbH In planta recombination
JP6352250B2 (ja) 2012-05-02 2018-07-04 ダウ アグロサイエンシィズ エルエルシー リンゴ酸デヒドロゲナーゼの標的改変
CN104540951B (zh) 2012-06-07 2017-07-04 美国陶氏益农公司 使用芸苔属双向组成型启动子表达转基因的构建体和方法
UA118090C2 (uk) 2012-09-07 2018-11-26 ДАУ АГРОСАЙЄНСІЗ ЕлЕлСі Спосіб інтегрування послідовності нуклеїнової кислоти, що представляє інтерес, у ген fad2 у клітині сої та специфічний для локусу fad2 білок, що зв'язується, здатний індукувати спрямований розрив
UA119135C2 (uk) 2012-09-07 2019-05-10 ДАУ АГРОСАЙЄНСІЗ ЕлЕлСі Спосіб отримання трансгенної рослини
KR102147007B1 (ko) 2012-09-07 2020-08-21 다우 아그로사이언시즈 엘엘씨 Fad3 성능 유전자좌 및 표적화 파단을 유도할 수 있는 상응하는 표적 부위 특이적 결합 단백질
CN110643600A (zh) 2012-10-23 2020-01-03 基因工具股份有限公司 用于切割靶dna的***及其用途
CA2890160A1 (en) * 2012-10-31 2014-05-08 Cellectis Coupling herbicide resistance with targeted insertion of transgenes in plants
BR102013032200A2 (pt) * 2012-12-13 2015-11-24 Dow Agrosciences Llc direcionamento preciso de um gene para um locus específico em milho
CA2901676C (en) 2013-02-25 2023-08-22 Sangamo Biosciences, Inc. Methods and compositions for enhancing nuclease-mediated gene disruption
CA2908512C (en) 2013-04-05 2023-10-24 Dow Agrosciences Llc Methods and compositions for integration of an exogenous sequence within the genome of plants
WO2014165769A1 (en) * 2013-04-05 2014-10-09 Mo Bio Laboratories, Inc. Kits and methods for isolating protein from biological and environmental samples
CN116083487A (zh) * 2013-05-15 2023-05-09 桑格摩生物治疗股份有限公司 用于治疗遗传病状的方法和组合物
WO2015026887A1 (en) * 2013-08-22 2015-02-26 E. I. Du Pont De Nemours And Company A soybean u6 polymerase iii promoter and methods of use
CA2920899C (en) 2013-08-28 2023-02-28 Sangamo Biosciences, Inc. Compositions for linking dna-binding domains and cleavage domains
US10167466B2 (en) * 2013-09-04 2019-01-01 Csir Site-specific nuclease single-cell assay targeting gene regulatory elements to silence gene expression
RU2668819C2 (ru) 2013-09-04 2018-10-02 ДАУ АГРОСАЙЕНСИЗ ЭлЭлСи Быстрый направленный анализ сельскохозяйственных культур для определения донорной вставки
WO2015034872A2 (en) * 2013-09-05 2015-03-12 Massachusetts Institute Of Technology Tuning microbial populations with programmable nucleases
ES2881473T3 (es) 2013-10-17 2021-11-29 Sangamo Therapeutics Inc Métodos de suministro y composiciones para la modificación por ingeniería genética del genoma mediada por nucleasas
EP3057432B1 (en) 2013-10-17 2018-11-21 Sangamo Therapeutics, Inc. Delivery methods and compositions for nuclease-mediated genome engineering in hematopoietic stem cells
CN106164085A (zh) 2013-11-04 2016-11-23 美国陶氏益农公司 最优玉米座位
AU2014341929B2 (en) 2013-11-04 2017-11-30 Corteva Agriscience Llc Optimal maize loci
KR102269377B1 (ko) 2013-11-04 2021-06-28 코르테바 애그리사이언스 엘엘씨 최적 대두 유전자좌
JP6560205B2 (ja) 2013-11-04 2019-08-14 ダウ アグロサイエンシィズ エルエルシー 最適なダイズ遺伝子座
US11826388B2 (en) 2013-12-20 2023-11-28 Seed Health, Inc. Topical application of Lactobacillus crispatus to ameliorate barrier damage and inflammation
US11998574B2 (en) 2013-12-20 2024-06-04 Seed Health, Inc. Method and system for modulating an individual's skin microbiome
US11642382B2 (en) 2013-12-20 2023-05-09 Seed Health, Inc. Method for treating an individual suffering from bladder cancer
US11213552B2 (en) 2015-11-30 2022-01-04 Joseph E. Kovarik Method for treating an individual suffering from a chronic infectious disease and cancer
US12005085B2 (en) 2013-12-20 2024-06-11 Seed Health, Inc. Probiotic method and composition for maintaining a healthy vaginal microbiome
US11529379B2 (en) 2013-12-20 2022-12-20 Seed Health, Inc. Method and system for reducing the likelihood of developing colorectal cancer in an individual human being
US11969445B2 (en) 2013-12-20 2024-04-30 Seed Health, Inc. Probiotic composition and method for controlling excess weight, obesity, NAFLD and NASH
US11980643B2 (en) 2013-12-20 2024-05-14 Seed Health, Inc. Method and system to modify an individual's gut-brain axis to provide neurocognitive protection
US11833177B2 (en) 2013-12-20 2023-12-05 Seed Health, Inc. Probiotic to enhance an individual's skin microbiome
US11839632B2 (en) 2013-12-20 2023-12-12 Seed Health, Inc. Topical application of CRISPR-modified bacteria to treat acne vulgaris
US11026982B2 (en) 2015-11-30 2021-06-08 Joseph E. Kovarik Method for reducing the likelihood of developing bladder or colorectal cancer in an individual human being
US11672835B2 (en) 2013-12-20 2023-06-13 Seed Health, Inc. Method for treating individuals having cancer and who are receiving cancer immunotherapy
US10774338B2 (en) 2014-01-16 2020-09-15 The Regents Of The University Of California Generation of heritable chimeric plant traits
EP3166964A1 (en) 2014-07-08 2017-05-17 Vib Vzw Means and methods to increase plant yield
US10676754B2 (en) 2014-07-11 2020-06-09 E I Du Pont De Nemours And Company Compositions and methods for producing plants resistant to glyphosate herbicide
US9616090B2 (en) 2014-07-30 2017-04-11 Sangamo Biosciences, Inc. Gene correction of SCID-related genes in hematopoietic stem and progenitor cells
CN108064129A (zh) 2014-09-12 2018-05-22 纳幕尔杜邦公司 玉米和大豆中复合性状基因座的位点特异性整合位点的产生和使用方法
DK3252162T3 (da) 2015-01-27 2023-06-06 Inst Genetics & Developmental Biology Cas Fremgangsmåde til foretagelse af stedsspecifik modifikation på hel plante via transient genekspression
CN107567499A (zh) 2015-03-27 2018-01-09 纳幕尔杜邦公司 大豆u6核小rna基因启动子及其在植物小rna基因的组成型表达中的用途
EP3095870A1 (en) 2015-05-19 2016-11-23 Kws Saat Se Methods for the in planta transformation of plants and manufacturing processes and products based and obtainable therefrom
CA2994883A1 (en) 2015-08-14 2017-02-23 Institute Of Genetics And Developmental Biology, Chinese Academy Of Scnces Method for obtaining glyphosate-resistant rice by site-directed nucleotide substitution
WO2017040992A1 (en) 2015-09-04 2017-03-09 Mo Bio Laboratories, Inc. Methods for co-isolation of nucelic acids and proteins
US10675347B2 (en) 2015-11-30 2020-06-09 Joseph E. Kovarik Method and system for protecting honey bees from fipronil pesticides
US11529412B2 (en) 2015-11-30 2022-12-20 Seed Health, Inc. Method and system for protecting honey bees from pesticides
US10086024B2 (en) 2015-11-30 2018-10-02 Joseph E. Kovarik Method and system for protecting honey bees, bats and butterflies from neonicotinoid pesticides
US10933128B2 (en) 2015-11-30 2021-03-02 Joseph E. Kovarik Method and system for protecting honey bees from pesticides
US10568916B2 (en) 2015-11-30 2020-02-25 Joseph E. Kovarik Method and system for protecting honey bees, bats and butterflies from neonicotinoid pesticides
CA3025171A1 (en) 2016-05-24 2017-11-30 Indiana University Research And Technology Corporation Ku inhibitors and their use for gene editing
CN105925590B (zh) * 2016-06-18 2019-05-17 北京大北农生物技术有限公司 除草剂抗性蛋白质、其编码基因及用途
US11193136B2 (en) 2016-08-09 2021-12-07 Vib Vzw Cellulose synthase inhibitors and mutant plants
WO2018081775A1 (en) 2016-10-31 2018-05-03 Sangamo Therapeutics, Inc. Gene correction of scid-related genes in hematopoietic stem and progenitor cells
CN106434635A (zh) * 2016-11-03 2017-02-22 云南省热带作物科学研究所 一种提高琴叶风吹楠dna提取质量的方法
EP3619322A4 (en) 2017-05-03 2021-06-30 Sangamo Therapeutics, Inc. METHODS AND COMPOSITIONS FOR MODIFICATION OF A TRANSMEMBRANARY CONDUCTANCE REGULATORY GENE IN MUCOVISCIDOSIS (CFTR)
WO2019094725A2 (en) 2017-11-09 2019-05-16 Sangamo Therapeutics, Inc. Genetic modification of cytokine inducible sh2-containing protein (cish) gene
CN112313246A (zh) 2018-04-18 2021-02-02 桑格摩生物治疗股份有限公司 用于调节亨廷顿蛋白(htt)的锌指蛋白组合物
US11690921B2 (en) 2018-05-18 2023-07-04 Sangamo Therapeutics, Inc. Delivery of target specific nucleases
GB201809273D0 (en) 2018-06-06 2018-07-25 Vib Vzw Novel mutant plant cinnamoyl-coa reductase proteins
GB201820109D0 (en) 2018-12-11 2019-01-23 Vib Vzw Plants with a lignin trait and udp-glycosyltransferase mutation
EP3894550A4 (en) 2018-12-14 2023-01-04 Pioneer Hi-Bred International, Inc. NEW CRISPR-CAS SYSTEMS FOR GENOME EDITING
CN110904143A (zh) * 2019-09-12 2020-03-24 黑龙江省农业科学院耕作栽培研究所 一种多功能抗草甘膦水稻转化载体pCDMAR-epsps及其构建方法和应用
US20230183750A1 (en) 2020-05-21 2023-06-15 Oxford Genetics Limited Hdr enhancers
GB202007577D0 (en) 2020-05-21 2020-07-08 Oxford Genetics Ltd Hdr enhancers
WO2021234389A1 (en) 2020-05-21 2021-11-25 Oxford Genetics Limited Hdr enhancers
GB202007578D0 (en) 2020-05-21 2020-07-08 Univ Oxford Innovation Ltd Hdr enhancers
WO2022204155A1 (en) 2021-03-23 2022-09-29 Iovance Biotherapeutics, Inc. Cish gene editing of tumor infiltrating lymphocytes and uses of same in immunotherapy
WO2023131616A1 (en) 2022-01-05 2023-07-13 Vib Vzw Means and methods to increase abiotic stress tolerance in plants
WO2023131637A1 (en) 2022-01-06 2023-07-13 Vib Vzw Improved silage grasses
WO2023144199A1 (en) 2022-01-26 2023-08-03 Vib Vzw Plants having reduced levels of bitter taste metabolites

Family Cites Families (80)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0218571B1 (en) 1985-08-07 1993-02-03 Monsanto Company Glyphosate-resistant plants
US4940835A (en) 1985-10-29 1990-07-10 Monsanto Company Glyphosate-resistant plants
US5422251A (en) 1986-11-26 1995-06-06 Princeton University Triple-stranded nucleic acids
US5145783A (en) 1987-05-26 1992-09-08 Monsanto Company Glyphosate-tolerant 5-endolpyruvyl-3-phosphoshikimate synthase
US4971908A (en) 1987-05-26 1990-11-20 Monsanto Company Glyphosate-tolerant 5-enolpyruvyl-3-phosphoshikimate synthase
US5312910A (en) 1987-05-26 1994-05-17 Monsanto Company Glyphosate-tolerant 5-enolpyruvyl-3-phosphoshikimate synthase
US5176996A (en) 1988-12-20 1993-01-05 Baylor College Of Medicine Method for making synthetic oligonucleotides which bind specifically to target sites on duplex DNA molecules, by forming a colinear triplex, the synthetic oligonucleotides and methods of use
US5310667A (en) 1989-07-17 1994-05-10 Monsanto Company Glyphosate-tolerant 5-enolpyruvyl-3-phosphoshikimate synthases
US5484956A (en) 1990-01-22 1996-01-16 Dekalb Genetics Corporation Fertile transgenic Zea mays plant comprising heterologous DNA encoding Bacillus thuringiensis endotoxin
AU655197B2 (en) 1990-06-25 1994-12-08 Monsanto Technology Llc Glyphosate tolerant plants
US5633435A (en) 1990-08-31 1997-05-27 Monsanto Company Glyphosate-tolerant 5-enolpyruvylshikimate-3-phosphate synthases
US5866775A (en) 1990-09-28 1999-02-02 Monsanto Company Glyphosate-tolerant 5-enolpyruvyl-3-phosphoshikimate synthases
US5420032A (en) 1991-12-23 1995-05-30 Universitge Laval Homing endonuclease which originates from chlamydomonas eugametos and recognizes and cleaves a 15, 17 or 19 degenerate double stranded nucleotide sequence
US5487994A (en) 1992-04-03 1996-01-30 The Johns Hopkins University Insertion and deletion mutants of FokI restriction endonuclease
US5436150A (en) 1992-04-03 1995-07-25 The Johns Hopkins University Functional domains in flavobacterium okeanokoities (foki) restriction endonuclease
US5356802A (en) 1992-04-03 1994-10-18 The Johns Hopkins University Functional domains in flavobacterium okeanokoites (FokI) restriction endonuclease
US5792632A (en) 1992-05-05 1998-08-11 Institut Pasteur Nucleotide sequence encoding the enzyme I-SceI and the uses thereof
WO1994000977A1 (en) 1992-07-07 1994-01-20 Japan Tobacco Inc. Method of transforming monocotyledon
ATE513037T1 (de) 1993-02-12 2011-07-15 Univ Johns Hopkins Funktionelle domänen der restriktionsendonukleasen aus flavobakterium okeanokoites (foki)
US6242568B1 (en) 1994-01-18 2001-06-05 The Scripps Research Institute Zinc finger protein derivatives and methods therefor
CA2681922C (en) 1994-01-18 2012-05-15 The Scripps Research Institute Zinc finger protein derivatives and methods therefor
US6140466A (en) 1994-01-18 2000-10-31 The Scripps Research Institute Zinc finger protein derivatives and methods therefor
US5585245A (en) 1994-04-22 1996-12-17 California Institute Of Technology Ubiquitin-based split protein sensor
GB9824544D0 (en) * 1998-11-09 1999-01-06 Medical Res Council Screening system
JP4118327B2 (ja) 1994-08-20 2008-07-16 ゲンダック・リミテッド Dna認識のための結合タンパク質におけるまたはそれに関連する改良
US7262055B2 (en) * 1998-08-25 2007-08-28 Gendaq Limited Regulated gene expression in plants
US5789538A (en) 1995-02-03 1998-08-04 Massachusetts Institute Of Technology Zinc finger proteins with high affinity new DNA binding specificities
US5925523A (en) 1996-08-23 1999-07-20 President & Fellows Of Harvard College Intraction trap assay, reagents and uses thereof
GB2338237B (en) 1997-02-18 2001-02-28 Actinova Ltd In vitro peptide or protein expression library
GB9703369D0 (en) 1997-02-18 1997-04-09 Lindqvist Bjorn H Process
US6342345B1 (en) 1997-04-02 2002-01-29 The Board Of Trustees Of The Leland Stanford Junior University Detection of molecular interactions by reporter subunit complementation
US6040497A (en) 1997-04-03 2000-03-21 Dekalb Genetics Corporation Glyphosate resistant maize lines
GB9710809D0 (en) 1997-05-23 1997-07-23 Medical Res Council Nucleic acid binding proteins
GB9710807D0 (en) 1997-05-23 1997-07-23 Medical Res Council Nucleic acid binding proteins
US6506559B1 (en) 1997-12-23 2003-01-14 Carnegie Institute Of Washington Genetic inhibition by double-stranded RNA
US6303848B1 (en) 1998-01-16 2001-10-16 Large Scale Biology Corporation Method for conferring herbicide, pest, or disease resistance in plant hosts
AR014491A1 (es) 1998-01-29 2001-02-28 Dow Agrosciences Llc Metodo para obtener plantas transgenicas fertiles de gossypium hirsutum.
US6410248B1 (en) 1998-01-30 2002-06-25 Massachusetts Institute Of Technology General strategy for selecting high-affinity zinc finger proteins for diverse DNA target sites
WO1999045132A1 (en) 1998-03-02 1999-09-10 Massachusetts Institute Of Technology Poly zinc finger proteins with improved linkers
ATE336578T1 (de) * 1998-03-17 2006-09-15 Gendaq Ltd Nukleinsäurebindungsproteine
US6750377B1 (en) 1998-06-19 2004-06-15 Advanta Technology Ltd. Method of breeding glyphosate resistant plants
US6140081A (en) 1998-10-16 2000-10-31 The Scripps Research Institute Zinc finger binding domains for GNN
US6503717B2 (en) * 1999-12-06 2003-01-07 Sangamo Biosciences, Inc. Methods of using randomized libraries of zinc finger proteins for the identification of gene function
US6599692B1 (en) 1999-09-14 2003-07-29 Sangamo Bioscience, Inc. Functional genomics using zinc finger proteins
US6453242B1 (en) 1999-01-12 2002-09-17 Sangamo Biosciences, Inc. Selection of sites for targeting by zinc finger proteins and methods of designing zinc finger proteins to bind to preselected sites
US6534261B1 (en) 1999-01-12 2003-03-18 Sangamo Biosciences, Inc. Regulation of endogenous gene expression in cells using zinc finger proteins
US6794136B1 (en) 2000-11-20 2004-09-21 Sangamo Biosciences, Inc. Iterative optimization in the design of binding proteins
US7030215B2 (en) 1999-03-24 2006-04-18 Sangamo Biosciences, Inc. Position dependent recognition of GNN nucleotide triplets by zinc fingers
CN1360634A (zh) 1999-04-29 2002-07-24 辛甄塔有限公司 抗除草剂植物
AU782697B2 (en) 1999-12-16 2005-08-18 Monsanto Technology Llc DNA constructs for expression of heterologous polypeptides in plants
DE60126913T2 (de) 2000-01-24 2007-06-28 Gendaq Ltd. Nucleinsäure bindende polypeptide gekennzeichnet durch flexible linker verbundene nucleinsäuredomäne
US6689558B2 (en) * 2000-02-08 2004-02-10 Sangamo Biosciences, Inc. Cells for drug discovery
US20020061512A1 (en) 2000-02-18 2002-05-23 Kim Jin-Soo Zinc finger domains and methods of identifying same
CA2401093A1 (en) 2000-03-09 2001-09-13 Monsanto Technology Llc Methods for making plants tolerant to glyphosate and compositions thereof
AU5574801A (en) 2000-04-28 2001-11-12 Sangamo Biosciences Inc Methods for binding an exogenous molecule to cellular chromatin
EP1276860B1 (en) 2000-04-28 2007-09-26 Sangamo Biosciences Inc. Databases of regulatory sequences; methods of making and using same
DE60126483T2 (de) 2000-04-28 2007-12-06 Sangamo BioSciences, Inc., Richmond Gezielte Modifikation der Chromatinstruktur
US20030044787A1 (en) 2000-05-16 2003-03-06 Joung J. Keith Methods and compositions for interaction trap assays
CA2416664A1 (en) * 2000-07-21 2002-01-31 Syngenta Participations Ag Zinc finger domain recognition code and uses thereof
JP2002060786A (ja) 2000-08-23 2002-02-26 Kao Corp 硬質表面用殺菌防汚剤
JP2004528808A (ja) * 2000-09-29 2004-09-24 シンジェンタ リミテッド 除草剤抵抗性植物
US7273923B2 (en) * 2001-01-22 2007-09-25 Sangamo Biosciences, Inc. Zinc finger proteins for DNA binding and gene regulation in plants
GB0108491D0 (en) 2001-04-04 2001-05-23 Gendaq Ltd Engineering zinc fingers
US20040224385A1 (en) * 2001-08-20 2004-11-11 Barbas Carlos F Zinc finger binding domains for cnn
US7262054B2 (en) 2002-01-22 2007-08-28 Sangamo Biosciences, Inc. Zinc finger proteins for DNA binding and gene regulation in plants
BRPI0307383B1 (pt) 2002-01-23 2019-12-31 The Univ Of Utah Research Foundation método de recombinação genética direcionada em célula de planta hospedeira
JP3873771B2 (ja) 2002-02-22 2007-01-24 ソニー株式会社 半導体装置の製造方法
WO2003080809A2 (en) 2002-03-21 2003-10-02 Sangamo Biosciences, Inc. Methods and compositions for using zinc finger endonucleases to enhance homologous recombination
CN1330762C (zh) 2002-05-10 2007-08-08 北京大学 新的草甘膦耐受型5-烯醇丙酮酰莽草酸-3-磷酸合酶及其编码基因
US7045684B1 (en) 2002-08-19 2006-05-16 Mertec, Llc Glyphosate-resistant plants
WO2004037977A2 (en) 2002-09-05 2004-05-06 California Institute Of Thechnology Use of chimeric nucleases to stimulate gene targeting
AU2004213818B2 (en) * 2003-02-18 2008-06-05 Monsanto Technology Llc Glyphosate resistant class I 5-enolpyruvylshikimate-3-phosphate synthase (EPSPS)
DK2927318T3 (da) 2003-08-08 2020-08-03 Sangamo Therapeutics Inc Fremgangsmåde og sammensætninger til målrettet spaltning og rekombination
US7888121B2 (en) 2003-08-08 2011-02-15 Sangamo Biosciences, Inc. Methods and compositions for targeted cleavage and recombination
AU2003255106A1 (en) 2003-08-08 2005-02-25 Biotechnology Research Institute, Chinese Academy of Agricultural Science 5-enolpyruvyl-3-phosphoshikimate synthase of high glyphosate-bioresistance and coding sequence
CA2561714A1 (en) 2004-04-08 2005-10-27 Sangamo Biosciences, Inc. Methods and compositions for treating neuropathic and neurodegenerative conditions
WO2006033859A2 (en) 2004-09-16 2006-03-30 Sangamo Biosciences, Inc. Compositions and methods for protein production
SG10201508995QA (en) 2005-07-26 2015-11-27 Sangamo Biosciences Inc Targeted integration and expression of exogenous nucleic acid sequences
EP1963499A4 (en) * 2005-11-28 2009-04-08 Scripps Research Inst ZINCFINGER BINDING DOMAIN FOR TNN
BRPI0720048A8 (pt) 2006-12-14 2023-02-07 Dow Agrosciences Llc Proteínas de dedo de zinco não-canônicas otimizadas

Also Published As

Publication number Publication date
BRPI0817560A2 (pt) 2015-07-14
HUE029916T2 (en) 2017-04-28
PT2205749T (pt) 2016-07-20
EP2205749A1 (en) 2010-07-14
US10344289B2 (en) 2019-07-09
DK2205749T3 (en) 2016-08-22
US20130145503A1 (en) 2013-06-06
EP3072973B1 (en) 2018-11-28
EP3072973A1 (en) 2016-09-28
WO2009042164A1 (en) 2009-04-02
AU2008305568A1 (en) 2009-04-02
EP2205749B1 (en) 2016-05-18
JP6382890B2 (ja) 2018-08-29
US20150064790A1 (en) 2015-03-05
SI2205749T1 (sl) 2016-09-30
TW200925276A (en) 2009-06-16
JP2016187351A (ja) 2016-11-04
US8399218B2 (en) 2013-03-19
HRP20161004T1 (hr) 2016-10-21
JP2015037406A (ja) 2015-02-26
CA2699769A1 (en) 2009-04-02
TWI424062B (zh) 2014-01-21
CN101878307A (zh) 2010-11-03
US8889390B2 (en) 2014-11-18
JP2010539930A (ja) 2010-12-24
AU2008305568B2 (en) 2013-11-21
ES2585157T3 (es) 2016-10-04
CN101878307B (zh) 2017-07-28
JP5702144B2 (ja) 2015-04-15
AR068559A1 (es) 2009-11-18
CA2937438C (en) 2020-07-07
CA2699769C (en) 2020-08-18
CA2937438A1 (en) 2009-04-02
JP6046677B2 (ja) 2016-12-21
US20090205083A1 (en) 2009-08-13

Similar Documents

Publication Publication Date Title
US10344289B2 (en) Engineered zinc finger proteins targeting 5-enolpyruvyl shikimate-3-phosphate synthase genes
JP6652952B2 (ja) ジンクフィンガーヌクレアーゼ媒介相同組換え
AU2017216446B2 (en) Zinc finger nuclease-mediated homologous recombination
AU2013216688B2 (en) Zinc finger nuclease-mediated homologous recombination
BRPI0716427B1 (pt) Method for introducing an exogenous sequence in the genome of a plant cell

Legal Events

Date Code Title Description
B06F Objections, documents and/or translations needed after an examination request according [chapter 6.6 patent gazette]
B06F Objections, documents and/or translations needed after an examination request according [chapter 6.6 patent gazette]
B07A Application suspended after technical examination (opinion) [chapter 7.1 patent gazette]
B09B Patent application refused [chapter 9.2 patent gazette]
B12B Appeal against refusal [chapter 12.2 patent gazette]
B16A Patent or certificate of addition of invention granted [chapter 16.1 patent gazette]

Free format text: PRAZO DE VALIDADE: 20 (VINTE) ANOS CONTADOS A PARTIR DE 25/09/2008, OBSERVADAS AS CONDICOES LEGAIS. PATENTE CONCEDIDA CONFORME ADI 5.529/DF, QUE DETERMINA A ALTERACAO DO PRAZO DE CONCESSAO.