BR112016003578B1 - Método para produzir uma semente ou planta progênie, método para obter uma planta progênie, métodos para modificar um sítio-alvo, método para modificar uma sequência de dna alvo, método para editar uma sequência de nucleotídeos, métodos para produzir uma planta epsps-mutante, método para editar uma sequência de nucleotídeo e método para produzir em uma planta um locus de característica complexa - Google Patents

Método para produzir uma semente ou planta progênie, método para obter uma planta progênie, métodos para modificar um sítio-alvo, método para modificar uma sequência de dna alvo, método para editar uma sequência de nucleotídeos, métodos para produzir uma planta epsps-mutante, método para editar uma sequência de nucleotídeo e método para produzir em uma planta um locus de característica complexa Download PDF

Info

Publication number
BR112016003578B1
BR112016003578B1 BR112016003578-0A BR112016003578A BR112016003578B1 BR 112016003578 B1 BR112016003578 B1 BR 112016003578B1 BR 112016003578 A BR112016003578 A BR 112016003578A BR 112016003578 B1 BR112016003578 B1 BR 112016003578B1
Authority
BR
Brazil
Prior art keywords
plant
sequence
cell
target
target site
Prior art date
Application number
BR112016003578-0A
Other languages
English (en)
Other versions
BR112016003578A2 (pt
Inventor
Zhongsen Li
Andrew Cigan
Saverio Carl Falco
Huirong Gao
Zhan-Bin Liu
L. Aleksander Lyznik
Jinrui Shi
Sergei Svitashev
Joshua K. Young
Original Assignee
E. I. Du Pont De Nemours And Company
Pioneer Hi-Bred International, Inc.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by E. I. Du Pont De Nemours And Company, Pioneer Hi-Bred International, Inc. filed Critical E. I. Du Pont De Nemours And Company
Priority claimed from PCT/US2014/051778 external-priority patent/WO2015026883A1/en
Publication of BR112016003578A2 publication Critical patent/BR112016003578A2/pt
Publication of BR112016003578B1 publication Critical patent/BR112016003578B1/pt

Links

Abstract

MÉTODO PARA PRODUZIR UMA SEMENTE OU PLANTA PROGÊNIE, MÉTODO PARA CULTIVAR UMA PLANTA PROGÊNIE, MÉTODOS PARA MODIFICAR UM SÍTIO-ALVO, MÉTODO PARA MODIFICAR UMA SEQUÊNCIA DE DNA ALVO, CONSTRUÇÃO DE DNA RECOMBINANTE, MÉTODO PARA EDITAR UMA SEQUÊNCIA DE NUCLEOTÍDEOS, MÉTODOS PARA PRODUZIR UMA PLANTA EPSPS-MUTANTE, MÉTODO PARA EDITAR UMA SEQUÊNCIA DE NUCLEOTÍDEO E MÉTODO PARA PRODUZIR EM UMA PLANTA UM LOCUS DE CARACTERÍSTICA COMPLEXA. A presente invenção provê composições e métodos para a modificação genômica de uma sequência-alvo no genoma de uma planta ou célula vegetal. Os métodos e composições empregam um sistema RNA guia/ endonuclease de Cas para fornecer um sistema eficaz para modificar ou alterar sítios-alvo dentro do genoma de uma planta, célula vegetal ou semente, composições e métodos que empregam um sistema de polinucleotídeo guia/endonuclease Cas para a modificação genômica de uma sequência de nucleotídeos no genoma de uma célula ou organismo, para a edição gênica e/ou para a introdução ou eliminação de um polinucleotídeo de interesse no genoma de uma célula ou organismo. Uma vez que um sítio genômico alvo é identificado, uma variedade de métodos para modificar ainda mais os sítios-alvo pode ser empregada a fim de que tais (...).

Description

[0001] Este pedido reivindica o benefício do Pedido Provisório US 61/868706 depositado em 22 de agosto de 2013, Pedido Provisório US 61/882532 depositado em 25 de setembro de 2013, Pedido Provisório US 61/937045 depositado em 07 de fevereiro de 2014, Pedido Provisório US 61/953090 depositado em 14 de março de 2014, e Pedido Provisório US 62/023239 depositado em 11 de julho de 2014; todos os quais são integralmente incorporados ao presente pela referência.
CAMPO DA INVENÇÃO
[0002] A divulgação diz respeito ao campo da biologia molecular vegetal, em particular, aos métodos para alterar o genoma de uma célula vegetal.
LISTAGEM DE SEQUÊNCIAS SUBMETIDA ELETRONICAMENTE
[0003] A cópia oficial da listagem de sequências é submetida por via eletrônica via EFS-Web como uma listagem de sequências em formato ASCII em um arquivo denominado 20140814_BB2284PCT_ST25_SequenceListing criado em 14 de agosto de 2014, com um tamanho de 560 kilobytes e depositado simultaneamente com o relatório descritivo. A listagem de sequências contidas neste documento em formato ASCII é parte do relatório descritivo e é integralmente incorporado ao presente pela referência.
ANTECEDENTES DA INVENÇÃO
[0004] Tecnologia de DNA recombinante tornou possível inserir sequências de DNA exógeno no genoma de um organismo, alterar dessa maneira o fenótipo do organismo. Os métodos de transformação de plantas mais comumente utilizados são a infecção por Agrobacterium e bombardeamento de partículas por biobalística em que transgenes se integram no genoma de uma planta de forma aleatória e em um número de cópias imprevisível. Assim, esforços são realizados para controlar a integração do transgene nas plantas.
[0005] Um método para a introdução ou modificação de uma sequência de DNA envolve a recombinação homóloga do DNA através da introdução de uma sequência de DNA transgênica flanqueada por sequências homólogas ao alvo genômico. A Patente US 5.527.695 descreve a transformação de células eucarióticas com sequências de DNA que são direcionadas a uma sequência pré-determinada do DNA da célula eucariótica. Especificamente, é discutida a utilização de recombinação sítio-específica. As células transformadas são identificadas pelo uso de um marcador de seleção incluído como parte das sequências de DNA introduzidas.
[0006] Foi demonstrado que quebras sítio-específicas de dupla- fita no genoma induzidas artificialmente em células vegetais foram reparadas pela recombinação homóloga com DNA exogenamente fornecido por meio de dois caminhos diferentes. (Puchta et al., (1996) Proc. Natl. Acad. Sci. USA 93:5055-5060; Pedido de Patente US 2005/0172365A1 publicado em 4 de agosto de 2005; Pedido de Patente US 2006/0282914 publicado em 14 de dezembro de 2006, documento WO 2005/028942 publicado em 2 de junho de 2005).
[0007] Uma vez que o isolamento, clonagem, transferência e recombinação de segmentos de DNA, incluindo as sequências codificantes e sequências não codificantes, é mais convenientemente conduzida utilizando enzimas endonucleases de restrição. Muita investigação tem-se centrado no estudo e concepção de endonucleases, como o documento WO 2004/067736 publicado em 12 de agosto de 2004; Patente US 5.792.632, concedida a Dujon et al em 11 de agosto de 1998; Patente US 6610545 B2, concedida a Dujon et al em 26 de agosto de 2003; Chevalier et al, (2002) Mol Cell. 10: 895-905; Chevalier et al, (2001) Nucleic Acids Res. 29:3757-3774; Seligman et al, (2002) Nucleic Acids Res. 30: 3.870-3879.
[0008] Embora diversas tenham sido desenvolvidas diversas abordagens de modificação do genoma vegetal com direcionamento a um sítio específico, continua existir a necessidade de processos mais eficientes e eficazes para a produção de uma planta fértil, possuindo um genoma alterado que compreende modificações específicas em uma região definida do genoma vegetal.
DESCRIÇÃO RESUMIDA DA INVENÇÃO
[0009] São fornecidas composições e métodos empregando um sistema de RNA guia/endonuclease Cas em plantas para a modificação do genoma de uma sequência-alvo no genoma de uma célula vegetal ou planta, para a seleção de plantas, para a edição de genes, e para a inserção de um polinucleotídeo de interesse no genoma de uma planta. Os métodos e composições empregam um sistema RNA guia/endonuclease de Cas para um sistema eficaz de modificar ou alterar sítios-alvo e nucleotídeos de interesse dentro do genoma de uma planta, célula vegetal ou semente. Uma vez que um sítio genômico alvo é identificado, uma variedade de métodos para modificar ainda mais os sítios-alvo pode ser empregada a fim de que tais sítios contenham uma variedade de polinucleotídeos de interesse. Também são divulgados métodos de melhoramento e seleção de plantas utilizando um sistema de dois componentes com RNA guia e endonuclease Cas. Também são fornecidas construções de ácido nucleico, plantas, células vegetais, explantes, sementes e grãos que têm o sistema de RNA guia/endonuclease CAS. Também são fornecidos composições e métodos que empregam um sistema de polinucleotídeo guia/endonuclease Cas para a modificação genômica de uma sequência alvo no genoma de uma célula ou organismo, para a edição gênica e para a introdução ou eliminação de um polinucleotídeo de interesse no genoma de uma célula ou organismo. Os métodos e composições utilizam um sistema de polinucleotídeo guia/endonuclease Cas para proporcionar um sistema eficaz para modificar ou alterar sítios-alvo e sequências de edição de nucleotídeos de interesse no genoma de uma célula, em que o polinucleotídeo guia é composto de uma sequência de RNA, sequência de DNA, ou uma combinação de sequências de DNA-RNA.
[0010] Assim, em um primeiro exemplo de realização da presente divulgação, o método compreende um método para a seleção de uma planta compreendendo um sítio alvo alterado no seu genoma, cujo método compreende: a) a obtenção de uma primeira planta compreendendo pelo menos uma endonuclease Cas capaz de introduzir uma quebra de dupla fita em um sítio alvo no genoma da planta; b) a obtenção de uma segunda planta que compreende um RNA guia capaz de formar um complexo com a endonuclease Cas de (a); c) o cruzamento da primeira planta de (a) com a segunda planta de (b); d) a avaliação da progênie de (c) para uma a presença da alteração no sítio alvo; e e) a seleção de uma planta descendente (progênie) que possui a alteração desejada do referido sítio alvo.
[0011] Em outro exemplo de realização, o método compreende um método para a seleção de uma planta compreendendo um sítio-alvo alterado em seu genoma, cujo método compreende a seleção de pelo menos uma planta descendente (progênie) que compreende uma alteração em um sítio-alvo em seu genoma, em que a referida planta descendente foi obtida pelo cruzamento de uma primeira planta que compreende pelo menos uma endonuclease Cas; com uma segunda planta que compreende um RNA guia, em que a referida endonuclease Cas é capaz de introduzir uma quebra de dupla fita no referido sítio-alvo.
[0012] Em outro exemplo de realização, o método compreende um método para a seleção de uma planta compreendendo um sítio alvo alterado no seu genoma, cujo método compreende: a) a obtenção de uma primeira planta compreendendo pelo menos uma endonuclease Cas capaz de introduzir uma quebra de dupla fita em um sítio alvo no genoma da planta; b) a obtenção de uma segunda planta que compreende um RNA guia e um DNA doador, em que o referido RNA guia é capaz de formar um complexo com a endonuclease Cas de (a), e em que o referido DNA doador compreende um polinucleotídeo de interesse; c) o cruzamento da primeira planta de (a) com a segunda planta de (b); d) a avaliação da progênie de (c) para uma alteração no sítio alvo; e e) a seleção de uma planta descendente (progênie) que possui o polinucleotídeo de interesse inserido no referido sítio alvo.
[0013] Em outro exemplo de realização, o método compreende um método para a seleção de uma planta compreendendo um sítio-alvo alterado em seu genoma, cujo método compreende a seleção de pelo menos uma planta descendente (progênie) que compreende uma alteração em um sítio-alvo em seu genoma, em que a referida planta descendente foi obtida pelo cruzamento de uma primeira planta expressando pelo menos uma endonuclease Cas com uma segunda planta compreendendo uma RNA guia e um DNA doador, em que a referida endonuclease Cas é capaz de introduzir uma quebra de dupla fita no referido sítio-alvo, em que o referido DNA doador compreende um polinucleotídeo de interesse.
[0014] Em outro exemplo de realização, o método compreende o método para a modificação de um sítio-alvo no genoma de uma célula vegetal, cujo método compreende a introdução de um RNA guia na célula vegetal que possui uma endonuclease Cas, em que o referido RNA guia e a endonuclease Cas são capazes de formar um complexo que permite que a endonuclease Cas introduza uma quebra de dupla fita no referido sítio-alvo.
[0015] Em outro exemplo de realização, o método compreende um método para a modificação de um sítio-alvo no genoma de uma célula vegetal, cujo método compreende a introdução de um RNA guia e uma endonuclease Cas na referida célula vegetal, em que o referido RNA guia e a endonuclease Cas são capazes de formar um complexo que permite que a endonuclease Cas introduza uma quebra de dupla fita no referido sítio-alvo.
[0016] Em outro exemplo de realização, o método compreende um método para a modificação de um sítio-alvo no genoma de uma célula vegetal, cujo método compreende a introdução de um RNA guia e um DNA doador em uma célula vegetal que possui uma endonuclease Cas, em que o referido RNA guia e a endonuclease Cas são capazes de formar um complexo que permite que a endonuclease Cas introduza uma quebra de dupla fita no referido sítio-alvo, e em que o referido DNA doador compreende um polinucleotídeo de interesse.
[0017] Em um exemplo de realização, o método compreende também a modificação de um sítio-alvo no genoma de uma célula vegetal, em que o método compreende: a) a introdução em uma célula vegetal de um RNA guia e uma endonuclease Cas, em que o referido RNA guia e endonuclease Cas são capazes de formar um complexo que permite que a endonuclease Cas introduza uma quebra de dupla fita no referido sítio alvo, e; b) a identificação de pelo menos uma célula vegetal que tem uma alteração no referido alvo, em que a modificação inclui pelo menos uma deleção ou substituição de um ou mais nucleotídeos no referido sítio alvo.
[0018] Em um exemplo de realização, o método compreende também a modificação de uma sequência de DNA alvo no genoma de uma célula vegetal, em que o método compreende: A) introdução em uma célula vegetal de uma primeira construção de DNA recombinante capaz de expressar um RNA guia e uma segunda construção de DNA recombinante capaz de expressar uma endonuclease Cas, em que o referido RNA guia e endonuclease Cas são capazes de formar um complexo que permite que a endonuclease Cas introduza uma quebra de dupla fita no referido sítio alvo, e; B) a identificação de pelo menos uma célula vegetal que tem uma alteração no referido alvo, em que a modificação inclui pelo menos uma deleção ou substituição de um ou mais nucleotídeos no referido sítio alvo.
[0019] Em um exemplo de realização, o método compreende um método para a introdução de um polinucleotídeo de interesse em um sítio-alvo no genoma de uma célula vegetal, em que o método compreende: a) a introdução em uma célula vegetal de uma primeira construção de DNA recombinante capaz de expressar um RNA guia e uma segunda construção de DNA recombinante capaz de expressar uma endonuclease Cas, em que o referido RNA guia e endonuclease Cas são capazes de formar um complexo que permite que a endonuclease Cas introduza uma quebra de dupla fita no referido sítio alvo; (b) o contato da célula vegetal de (a) com um DNA doador que compreende um polinucleotídeo de interesse; e, (c) a identificação de pelo menos uma célula vegetal a partir de (b) compreendendo em seu genoma o polinucleotídeo de interesse integrado no referido sítio alvo.
[0020] Em alguns destes exemplos de realização, o RNA guia pode ser introduzido diretamente por bombardeamento de partículas ou pode ser introduzido por bombardeamento de partículas ou transformação por Agrobacterium de uma construção de DNA recombinante compreendendo o DNA guia correspondente operacionalmente ligado a um promotor U6 da polimerase III vegetal.
[0021] Em alguns destes exemplos de realização, o gene da endonuclease Cas é de uma endonuclease Cas9 otimizada para plantas.
[0022] Em alguns destes exemplos de realização o gene da endonuclease Cas está operacionalmente ligado a um sinal de direcionamento nuclear SV40 a montante da região do códon Cas e a um sinal de localização nuclear VirD2 a jusante da região do códon Cas.
[0023] A planta nesses exemplos de realização é uma monocotiledônea ou uma dicotiledônea. Mais especificamente, a monocotiledônea é selecionada a partir do grupo que consiste de milho, arroz, sorgo, centeio, cevada, trigo, milho, aveia, cana de açúcar, relva (turfgrass), ou gramíneas (switchgrass). A dicotiledônea é selecionada a partir do grupo que consiste de soja, colza, alfafa, girassol, algodão, tabaco, amendoim, batata, tabaco, Arabidopsis ou cártamo.
[0024] Em alguns exemplos de realização, o sítio-alvo está localizado na sequência gênica de um gene da acetolactato-sintase (ALS), um gene da enolpiruvilchiquimato fosfato sintase (ESPSP), um gene de fertilidade masculina (MS45, MS26 ou MSCA1).
[0025] Em outros exemplos de realização a divulgação compreende uma planta compreendendo uma construção de DNA recombinante, em que a referida construção de DNA recombinante compreende um promotor operacionalmente ligado a uma sequência de nucleotídeos que codifica uma endonuclease Cas9 otimizada para planta, em que a referida endonuclease Cas9 otimizada para planta é capaz de se ligar e criar uma quebra de dupla fita em uma sequência genômica alvo no referido genoma da planta.
[0026] Em outro exemplo de realização, a planta compreende uma construção de DNA recombinante e um RNA guia, em que a referida construção de DNA recombinante compreende um promotor operacionalmente ligado a uma sequência nucleotídica que codifica uma endonuclease Cas9 otimizada para planta, em que a referida endonuclease Cas9 otimizada para planta e o RNA guia são capazes de formar um complexo e criar uma quebra de dupla fita em uma sequência genômica alvo no referido genoma da planta.
[0027] Em outro exemplo de realização, a construção de DNA recombinante compreende um promotor operacionalmente ligado a uma sequência nucleotídica que codifica uma endonuclease Cas9 otimizada para planta, em que a referida endonuclease Cas9 otimizada para planta é capaz de se ligar e criar uma quebra de dupla fita em uma sequência genômica alvo no referido genoma da planta.
[0028] Em outro exemplo de realização, a construção de DNA recombinante compreende um promotor operacionalmente ligado a uma sequência nucleotídica expressando um RNA guia, em que o referido RNA guia é capaz de formar um complexo com uma endonuclease Cas9 otimizada para planta, e em que o referido complexo é capaz de se ligar e criar uma quebra de dupla fita em uma sequência genômico alvo no referido genoma da planta.
[0029] Em outro exemplo de realização, o método compreende um método para a seleção de uma planta masculina estéril, cujo método compreende a seleção de pelo menos uma planta descendente que compreende uma alteração em um sítio genômico alvo situado em um locus do gene da fertilidade masculina, em que a referida planta descendente é obtida pelo cruzamento de uma primeira planta que expressa uma endonuclease Cas9 com uma segunda planta que compreende um RNA guia, em que a referida endonuclease Cas é capaz de introduzir uma quebra de dupla fita no referido sítio genômico alvo.
[0030] Em outro exemplo de realização, o método compreende um método para produzir uma planta masculina fértil ou masculina estéril compreendendo: a) a obtenção de uma primeira planta compreendendo pelo menos uma endonuclease Cas capaz de introduzir uma quebra de dupla fita em um sítio alvo genômico; b) a obtenção de uma segunda planta compreendendo um RNA guia que é capaz de formar um complexo com a endonuclease Cas de (a); c) o cruzamento da primeira planta de (a) com a segunda planta de (b); d) a avaliação da progênie de (c) para uma alteração no sítio-alvo; e e) a seleção de uma planta descendente (progênie) que é masculina fértil ou masculina estéril. Os genes de fertilidade masculina podem ser selecionados a partir, mas não se limitando, dos genes MS26, MS45, MSCA1.
[0031] Também são fornecidas composições e métodos para a edição de uma sequência de nucleotídeos no genoma de uma célula. Em um exemplo de realização, a divulgação descreve um método para a edição de uma sequência de nucleotídeos no genoma de uma célula vegetal, cujo método compreende o fornecimento de um RNA de guia, um molde de modificação de polinucleotídeo, e, pelo menos, uma endonuclease Cas9 milho-otimizada para uma célula vegetal, em que a endonuclease Cas9 milho-otimizada é capaz de introduzir uma quebra de dupla fita em um sítio alvo no genoma da planta, em que o referido molde de modificação de polinucleotídeo inclui a modificação de pelo menos um nucleotídeo da referida sequência de nucleotídeos. A sequência de nucleotídeos a ser editada (a sequência de nucleotídeos de interesse) pode estar localizada dentro ou fora de um sítio alvo que é reconhecido e clivado por uma endonuclease Cas. As células incluem, mas não se limitam as células humanas, de animais, bacterianas, fúngicas, de insetos, e bem como células vegetais e sementes produzidas pelos métodos descritos na presente divulgação.
[0032] Exemplos de realização adicionais dos métodos e composições da presente divulgação estão aqui descritos.
BREVE DESCRIÇÃO DAS FIGURAS E LISTAGEM SEQUÊNCIAS
[0033] A divulgação pode ser mais bem compreendida a partir da seguinte descrição detalhada e das Figuras e Listagem de Sequências anexas, que fazem parte do presente pedido. As descrições das sequências e a listagem de sequências anexa ao presente obedecem às regras que regem a divulgação de sequências de nucleotídeos e/ou aminoácidos nos pedidos de patentes, tal como estabelecido no Título 37 do CFR §1,8211,825. As descrições de sequência contêm os códigos de três letras para os aminoácidos conforme definido no título 37 CFR §§ 1,8211,825, incorporado ao presente pela referência.
BREVE DESCRIÇÃO DAS FIGURAS
[0034] A Figura 1A mostra um gene Cas9 otimizado para milho (que codifica uma endonuclease Cas9) contendo um íntron ST-LS1 de batata, uma Sequência de localização nuclear (NLS) amino-terminal do SV40, e um NLS carbóxi-terminal do VirD2, operacionalmente ligado a um promotor da ubiquitina vegetal (SEQ ID NO: 5). O gene Cas9 milho-otimizado (codificando apenas a sequência Cas9, sem NLSs) corresponde às posições de nucleotídeos 2037-2411 e 2601-6329 da SEQ ID NO: 5 com o íntron de batata nas posições 2412-2600 da SEQ ID NO: 5. A NLS de SV40 está nas posições 2010-2036 da SEQ ID NO: 5. A NLS de VirD2 está nas posições 6330-6386 da SEQ ID NO: 5. A Figura 1 B mostra um RNA guia longo operacionalmente ligado a um Promotor U6 da polimerase III de milho terminando com um terminador U6 de milho (SEQ ID NO: 12). O RNA guia longo contendo o domínio de direcionamento variável correspondente ao local-alvo LIGCas-3 do milho (SEQ ID NO: 8) é transcrito a partir de / corresponde às posições 10011094 de SEQ ID NO: 12. Figura 1C mostra cassetes de expressão com Cas9 otimizado para milho e RNA guia longo combinados em um único vetor de DNA (SEQ ID NO: 102).
[0035] A Figura 2A ilustra o complexo crRNA duplexo (SEQ ID NO: 6)-tracrRNA (SEQ ID NO: 7) / sistema de endonuclease Cas9 e DNA alvo em relação à sequência PAM apropriadamente orientada no sítio-alvo do LIGCas-3 de milho (SEQ ID NO: 18, tabela 1) com triângulos que apontam para o local de clivagem esperado nas fitas de DNA de ambos os sentidos (sense e antisense). A Figura 2 B ilustra o complexo de RNA guia/endonuclease Cas9 interagindo com o sítio-alvo genômico em relação à sequência PAM orientada de forma adequada (GGA) no sítio-alvo LIGCas-3 gênomico do milho (SEQ ID NO: 18, Tabela 1). O RNA guia (mostrado em caixa cinza-claro, SEQ ID NO: 8) é uma fusão entre um crRNA e tracrRNA e compreende um domínio de direcionamento variável que é complementar a uma fita de DNA sítio alvo do DNA genômico dupla-fita genômico. A endonuclease Cas9 é mostrada em cinza escuro. Triângulos indicam o local de clivagem do DNA previsto nas fitas de DNA de ambos os sentidos (sense e antisense).
[0036] As Figuras 3A-3B exibem um alinhamento e contagem das 10 mutações por NHEJ mais frequentes induzidas pelo sistema milho-otimizado RNA guia/endonuclease Cas descrito na presente divulgação em relação a uma endonuclease de homing LIG3-4 controle no locus Liguleless 1 genômico em milho. As mutações foram identificadas pela técnica de sequenciamento em profundidade (deep-sequencing). A sequência de referência representa o locus não modificado com cada sítio alvo sublinhado. A sequência PAM e o sítio previsto de clivagem também estão indicados. As deleções ou inserções como um resultado da NHEJ imperfeita são mostradas por um “-“ ou um nucleotídeo sublinhado e em itálico, respectivamente. A referência e mutações 1-10 do sítio alvo 1-LIGCas correspondem às SEQ ID NOs: 55-65, respectivamente. A referência e mutações 1-10 do 1-LIGCas-2 correspondem às SEQ ID NOs: 55, 65-75, respectivamente. A referência e mutações 1-10 do 1-LIGCas-3 correspondem às SEQ ID NOs: 76 -86, respectivamente. A referência e mutações 1-10 do sítio alvo da endonuclease de homing LIGC3-4 correspondem às SEQ ID NOs: 76, 87-96, respectivamente.
[0037] A Figura 4 ilustra a forma como o vetor de reparo de DNA por recombinação homóloga (HR) (SEQ ID NO: 97) foi construído. Para promover a inserção sítio-específica do transgene através de recombinação homóloga, o transgene (mostrado em cinza claro) foi flanqueado em ambos os lados por aproximadamente 1 kb de DNA com homologia com regiões genômicas do milho imediatamente adjacentes aos sítios de clivagem LIGCas3 e endonuclease de homing LIG3-4 esperados.
[0038] A Figura 5 ilustra o modo como o DNA genômico extraído a partir dos transformantes estáveis foi pesquisado quanto a inserção do transgene sítio-específica por PCR. Primers genômicos (correspondendo às SEQ ID NOs: 98 e 101) dentro do locus Liguleless foram concebidos fora das regiões utilizadas na construção do vetor de reparo do DNA por HR (SEQ ID NO: 97) e foram pareados com os primers dentro do transgene (correspondendo às SEQ ID NOs: 99 e 100) para facilitar a detecção por PCR de junções únicas do DNA genômico criadas pela integração sítio-específica apropriadamente orientada do transgene.
[0039] A Figura 6 exibe um alinhamento das mutações NHEJ induzidas pelo sistema milho-otimizado RNA guia/endonuclease Cas descrito na presente divulgação, quando o RNA guia curto foi entregue diretamente como RNA. As mutações foram identificadas pela técnica de sequenciamento em profundidade (deep-sequencing). A referência ilustra o o locus não modificado com cada sítio alvo sublinhado. A sequência PAM e o sítio previsto de clivagem também estão indicados. . As deleções ou inserções como um resultado da NHEJ imperfeita são mostradas por um “-“ ou um nucleotídeo sublinhado e em itálico, respectivamente. A referência e mutações 1-6 para 55CasRNA-1 correspondem às SEQ ID NOs: 104 -110, respectivamente.
[0040] A Figura 7 mostra o vetor QC782 compreendendo o cassete de expressão Cas9.
[0041] A Figura 7 mostra o vetor QC783 compreendendo o cassete de expressão do RNA guia. A Figura 8B mostra a sequência de DNA (sequência codificante) do domínio de direcionamento variável DD43CR1 (20 bp) do RNA guia, bem como uma sequência terminadora ligada ao RNA guia. O domínio de direcionamento variável de DD43CR1 de 20 bp está em negrito.
[0042] A Figura 9 exibe o mapa de uma construção ligada QC815 de Cas9 e RNA guia otimizada para soja.
[0043] A Figura 10A mostra o locus DD20 no cromossomo 4 da soja e os sítios-alvo genômicos DD20CR1 e DD20CR2 (indicados por setas em negrito). A Figura 10B mostra o locus DD43 no cromossomo 4 da soja e os sítios-alvo genômicos DD43CR1 e DD43CR2 (indicados por setas em negrito).
[0044] Figuras 11A-11D. Alinhamentos de sequências nos sítios alvo esperados com sequências-alvo mutantes detectadas em quatro RNA guia induzidas em experimentos de NHEJ. A Figura 11A mostra o amplicon da PCR DD20CR1 (sequência de referência, SEQ ID NO: 142, sítio-alvo genômico está sublinhado) e as 10 mutações (SEQ ID NOs: 147-156) induzidas pelo sistema RNA guia/endonuclease Cas no sítio alvo genômico DD20CR1. A Figura 11B mostra o amplicon da PCR DD20CR2 (sequência de referência, SEQ ID NO: 143) e as 10 mutações (SEQ ID NOs: 157-166) induzidas pelo sistema RNA guia/endonuclease Cas no sítio alvo genômico DD20CR2. A Figura 11C mostra o amplicon da PCR DD43CR1 (sequência de referência, SEQ ID NO: 144) e as 10 mutações (SEQ ID NOs: 167-176) induzidas pelo sistema RNA guia/endonuclease Cas no sítio alvo genômico DD43CR1. A Figura 11D mostra o amplicon da PCR DD43CR2 (sequência de referência, SEQ ID NO: 145) e as 10 mutações (SEQ ID NOs: 177-191) induzidas pelo sistema RNA guia/endonuclease Cas no sítio alvo genômico DD43CR2. As sequências alvo correspondentes com RNAs guia diferentes estão sublinhadas. Cada deleção de nucleotídeos é indicada por “-”. As sequências inseridas e substituídas estão em negrito. O número total de cada sequência mutante está listado na última coluna.
[0045] Figuras 12A-12B exibe uma representação esquemática do sistema RNA guia/endonuclease CAS utilizado para a edição de uma sequência nucleotídica de interesse. Para permitir a edição nucleotídica específica, um molde de modificação de polinucleotídeo que inclui pelo menos uma modificação de nucleotídeo (quando comparado com a sequência de nucleotídeos a ser editada) é introduzido em uma célula juntamente com os cassetes de expressão com o RNA guia e endonuclease CAS. Por exemplo, conforme mostrado na presente divulgação, a sequência de nucleotídeos a ser editada é um gene endógeno da enolpiruvilchiquimato-3-fosfato sintase (EPSPS) tipo selvagem em células de milho. A endonuclease Cas (círculo sombreado) é uma endonuclease Cas9 otimizada para milho que cliva uma sequência alvo moCas9 dentro do locus genômico epsps usando um RNA guia de SEQ ID NO: 194. A Figura 12-A mostra um molde de modificação de polinucleotídeo que inclui três alterações de nucleotídeos (quando comparado com o locus epsps tipo selvagem representado na Figura 12-B) flanqueadas por duas regiões de homologia HR-1 e HR-2. A Figura 12 B mostra o complexo RNA guia /endonuclease Cas9 milho-otimizada interagindo com o locus epsps. Os códons de nucleotídeos originais do gene EPSPS que precisavam ser editados são mostrados como aCT e Cca (Figura 12-B). Os códons de nucleotídeos com nucleotídeos modificados (mostrados em maiúsculas) são exibidos como aTC e Tca (Figura 12-B).
[0046] A Figura 13 mostra um diagrama de um cassete de expressão da endonuclease Cas9 milho-otimizada. A sequência codificante de cas9 bacteriana foi códon-otimizada para a expressão em células de milho e suplementada com o íntron ST-LS1 de batata (sequência codificante moCas9, SEQ ID NO: 193). Um fragmento de DNA codificante do sinal de localização nuclear (NLS) SV40 foi fundido com a extremidade 5' da sequência codificante de moCas9. Um promotor de ubiquitina de milho (promotor Ubi) e seu íntron cognato (íntron ubi) forneceram elementos de controle para a expressão de moCas9 em células de milho. A sequência de terminação da transcrição pinll (pinll) completou o desenho do gene moCAS9 de milho.
[0047] A Figura 14 mostra alguns exemplos das sequências moCas9 alvo (sublinhadas), localizadas em fragmentos de DNA EPSPS, mutagenizadas pela introdução de quebras de dupla fita no sítio de clivagem pela endonuclease moCas9 (seta grossa) em células de milho. Na SEQ ID NO: 206, três nucleotídeos foram eliminados (traços) ao lado do sítio de clivagem moCas9. As SEQ ID NOs: 207- 208 indicam que a deleção de nucleotídeos pode expandir para além do sítio de clivagem da moCAs9.
[0048] A Figura 15 representa um vetor molde EPSPS utilizado para a entrega do molde de modificação de polinucleotídeo EPSPS contendo as três modificações de nucleotídeos TIPS. O molde de modificação de polinucleotídeo EPSP inclui um fragmento parcial do gene EPSPS. O vetor tinha 6475 bp de comprimento e consistia de duas regiões de homologia com o locus epsps (epsps-HR1 e epsps-HR2). Dois sítios de clonagem Gateway (ATTL4 e ATTL3), um gene de resistência a antibiótico (KAN), e a origem de replicação pUC (PUC ORI) completaram a síntese do vetor1 molde EPSPS.
[0049] A Figura 16 ilustra a estratégia de triagem baseada em PCR para identificação de eventos de milho com modificações de nucleotídeos TIPS em células de milho. Dois pares de primers de PCR foram utilizados para amplificar os fragmentos genômicos do locus epsps (seção superior). Ambos continham os primers TIPS específicos (uma seta com um ponto indicando o local das três modificações TIPS). O fragmento mais curto (780 bp F-E2) foi produzido pela amplificação do fragmento molde de modificação de polinucleotídeo EPSPS (molde de detecção). O fragmento molde de modificação de polinucleotídeo EPSPS amplificado foi encontrado em todos, menos em 4 eventos analisados (painel F-E2). O fragmento mais longo (839 bp H-T) foi produzido pela amplificação da sequência EPSPS genômica contanto que o locus EPSPS contivesse as três alterações de nucleotídeos responsáveis pelas modificações TIPS. Seis eventos foram identificados como contendo as três alterações de nucleotídeos (painel H-T). As setas brancas indicam os eventos que contêm o molde de modificação de polinucleotídeo EPSPS amplificado e as modificações de nucleotídeos responsáveis pela modificação TIPS.
[0050] A Figura 17A mostra um diagrama esquemático do protocolo de PCR utilizados para identificar fragmentos de DNA de EPSPS editados em eventos selecionados. Um fragmento genômico parcial, que compreende partes do Éxon1, Íntron 1 e éxon2 do locus epsps, foi amplificado independentemente do produto de edição (painel A, 1050 bp F-E3). Os produtos de amplificação que representam apenas as sequências parciais de genes EPSPS possuindo uma ou mais mutações, foram clonados e sequenciados. A Figura 17B mostra 2 exemplos de produtos de amplificação sequenciados. Em alguns produtos de amplificação, os nucleotídeos epsps e a sequência alvo moCas9 (sublinhada) estavam inalterados, indicando que um alelo EPSPS não foi editado (alelo de tipo selvagem, SEQ ID NO: 210). Em outros produtos de amplificação, três substituições de nucleotídeos específicas (representando as modificações TIPS) foram identificadas sem mutações na sequência alvo moCas9 (sublinhada) (SEQ ID NO: 209).
[0051] A Figura 18 mostra a localização dos loci MHP14, TS8, TS9 e TS10 compreendendo sítios-alvo para o sistema RNA guia/ endonuclease Cas próximo ao traço A (localizado a 53,14 cM) no cromossomo 1 do milho.
[0052] A Figura 19A mostra a localização da sequência alvo genômica MHP14Cas1 de milho (SEQ ID NO: 229) e a sequência alvo genômica MSP14Cas-3 de milho (SEQ ID NO: 230) no locus de DNA genômico MHP14 de milho no cromossomo 1. A sequência 5' para 3'. A Figura 19B mostra a localização das sequências genômicas alvo de milho TS8Cas-1 (SEQ ID NO: 231) e TS8Cas-2 (SEQ ID NO 232) localizadas no locus TS8. A Figura 19C mostra a localização das sequências genômicas alvo de milho TS9Cas-2 (SEQ ID NO: 233) e TS9Cas-3 (SEQ ID NO 234) localizadas no locus TS8. A Figura 19D mostra a localização das sequências genômicas alvo de milho TS10Cas-1 (SEQ ID NO: 235) e TS10Cas-3 (SEQ ID NO 236) localizadas no locus TS10. Todos estes sítios-alvo genômicos de milho são reconhecidos e clivados por um sistema RNA guia/endonuclease Cas descrito na presente divulgação. Cada sequência-alvo genômica de milho (indicada por uma seta) é destacada em negrito e seguido pelas sequências NGG PAM mostradas em caixas.
[0053] A Figura 20 exibe um esquema de um DNA doador (também referido como DNA de reparação por HR), que compreende um cassete transgênico com um marcador selecionável (fosfomanose isomerase, ilustrada em cinza), flanqueada por sequências de recombinação homóloga (HR1 e HR2) de cerca de 0,5 a 1 kb de comprimento, utilizadas para introduzir o cassete transgênico em um sítio alvo genômico para o sistema RNA guia/CAS endonuclease. As setas indicam as seções da sequência de DNA genômico em ambos os lados do sítio de clivagem por endonuclease que corresponde às regiões homólogas do DNA doador. Este esquema é representativo para a recombinação homóloga que ocorre em qualquer um dos 8 sítios-alvo (4 loci) localizados no cromossomo 1 de 51,54 cM a 54,56 cM no genoma do milho.
[0054] A Figura 21 mostra a seleção por PCR de junção para a identificação de eventos de inserção. Os primers 1 e 2 localizados no transgene doador são comuns para todos os sítios-alvo. O primer TSHR1f está localizado na região genômica do lado de fora da sequência HR1 homóloga. A combinação do primer THR1f/primer1 amplificação junção 1. O primer TSHR2r está localizado região genômica fora da região HR2. Primer de combinação primer2/THR2r amplificação junção 2.
[0055] A Figura 22 mostra a seleção por PCR de junção para identificação de eventos de inserção no locus TS10Cas10. Uma imagem do gel indica a presença de eventos de inserção no sítio-alvo do TS10Cas10-1 (pista 02 A1). A reação de PCR da junção HR1 e HR2 carregadas uma ao lado da outra (pista 02 com branco e pista 02 marcador cinza), com o marcador branco representando a PCR de junção HR1, e o marcador cinza representando a PCR de junção HR2.
[0056] Figuras 23 A-B. Cassetes de expressão de DNA usados nos experimentos de modificação do genoma mediada por gRNA/Cas9. A) O cassete da endonuclease Cas9 (EF1A2:CAS9) que compreende um promotor EF1A2 de soja (GM-EF1A2 PRO) controlando o códon da endonucleases Cas9 otimizado para soja (CAS9 (SO), um sinal de localização nuclear SV40 otimizado para soja (SV40 NLS(SO)) e um terminador pinll (term pinll) foi ligado a um cassete de expressão do RNA guia (U6-9.1:DD20CR1, compreendendo um promotor U6 de soja controlando o RNA guia DD20CR1) usado no experimento U6-9.1DD20CR1 (Tabela 27). Outros cassetes RNA guia/Cas9 listados na Tabela 27 são idênticos, exceto para os domínios de direcionamento variável de 20 bp do RNA guia visando os sítios alvo genômicos DD20CR2, DD43CR1 ou DD43CR2. B) O cassete de DNA doador (DD20HR1-SAMS:HPT-DD20HR2) usado no experimento U6-9.1DD20CR1 (Tabela 27). Regiões de DNA homólogo DD20HR1 e DD20HR2 entre o cassete de DNA doador e as sequências de DNA genômico que flanqueiam o sítio alvo DD20. Outros cassetes de DNA doadores listados na Tabela 27 são idênticos, exceto para as regiões DD43HR1 e DD43HR2 em dois deles.
[0057] Figuras 24 A-C. Locais dos sítios alvo genômicos DD20 e DD43 de soja e amplicons de qPCR. A) Diagrama do cromossomo 04 de Glycine max que indica posições relativas dos sítios-alvo DD20 e DD43. Posições pelo mapeamento genético dos sítios DD20 e DD43 estão em posições gênicas próximas ao Glyma04g39780.1 e Glyma04g39550.1. B) amplicon DD20 de 64 bp por qPCR 45936307-45.936.370 do cromossomo 04 (SEQ ID NO: 304). Posições relativas dos sítios-alvo DD20-CR1 e DD20-CR2, primers da qPCR e sonda DD20-F, DD20-R, e DD20-T estão marcadas. C) amplicon DD43 de 115 bp por qPCR 45731879-45731993 a partir do cromossomo 04 (SEQ ID NO: 305). Posições relativas dos sítios-alvo DD43- CR1 e DD43-CR2, primers da qPCR e sonda DD43-F2, DD43-F, DD43-R e DD43-T estão marcadas.
[0058] Figuras 25 A-C. Esquema da junção de extremidades não homólogas (NHEJ) sítio-específica mediada pelo sistema RNA guia/Cas9 e inserção do transgene por recombinação homóloga (HR) no local DD20CR1. A) Plantas de soja são cotransformadas com RNA guia/Cas9 e cassetes de DNA doador conforme listado na Tabela 27. O complexo RNA guia/Cas9 DD20CR1 transcrito a partir do cassete de DNA ligado ao RNA guia/Cas9 irá clivar especificamente o sítio alvo DD20CR1 no cromossomo 04 para produzir quebras de dupla fita do DNA. As quebras podem ser reparadas de forma espontânea, como por NHEJs, ou podem ser reparadas como um evento de HR pelo DNA doador facilitado pelas regiões homólogas flanqueadoras DD20- HR1 e DD20HR2. B) NHEJs são detectadas por qPCR DD20-específica e as sequências mutadas são avaliadas por sequenciamento de fragmentos de PCR HR1-HR2 clonados. C) Eventos de HR são revelados por duas análises por PCR borda-específica HR1-SAMS e NOS-HR2, observando que os primers só são capazes de amplificar o DNA recombinado entre a região DD20CR1 do cromossomo 04 e o DNA doador. NHEJ mediada por RNA guia/Cas9 e HR no sítio DD20-CR2 após o mesmo processo exceto que se utilizou o RNA guia DD20-CR2. NHEJ sítio-específica mediada por RNA guia/Cas9 nos sítios DD43CR1 e DD43CR2 após o mesmo processo exceto a utilização do RNA guia e regiões homólogas específica para os sítios DD43.
[0059] Figuras 26 A-C. Sequências das NHEJs mediadas pelo sistema gRNA/Cas9. Apenas sequências de 60 bp que flanqueiam o sítio-alvo genômico mostradas em negrito estão alinhadas para mostrar as mutações. A sequência PAM é mostrada em caixas. As sequências de inserção estão indicadas pelo símbolo A marcando a posição de inserção, seguido pelo tamanho da inserção. As sequências de inserção reais estão listadas na listagem de sequências. A) Sequências U6-9.1DD20CR1. Três colônias foram sequenciadas para cada um dos 54 eventos a partir do experimento U6- 9.1DD20CR1. Um total de 150 sequências retornou, das quais 26 foram consideradas como deleções únicas curtas, enquanto 2 eventos continham pequenas inserções. B) Sequências U6-9.1DD20CR2. Três colônias foram sequenciadas para cada um dos 28 eventos a partir do experimento U6- 9.1DD20CR2. Um total de 84 sequências retornou, das quais 20 foram consideradas como deleções únicas curtas, enquanto 1 evento continha uma inserção de um único bp. C) Sequências U6-9.1DD43CR1 . Três colônias foram sequenciadas para cada um dos 46 eventos a partir do experimento U6- 9.1DD43CR1. Um total de 132 sequências retornou, das quais 18 foram consideradas como deleções únicas curtas, enquanto 10 eventos continham pequenas inserções. D) Sequências U6-9.1DD43CR2.
[0060] As Figuras 27 A-C mostram os dez tipos mais prevalecentes de mutações NHEJ recuperadas com base no sistema crRNA/tracrRNA/endonuclease CAS. A Figura 27A mostra mutações NHEJ para o sítio-alvo LIGCas-1, correspondendo às SEQ ID NOS: 415-424), a Figura 27B mostra mutações NHEJ para o sítio-alvo LIGCas-2 correspondente às SEQ ID NOs: 425-434) e a Figura 27V mostra mutações NHEJ (para o sítio- alvo LIGCas-3 correspondente às SEQ ID NOs: 435-444).
[0061] Figura 28. Representação esquemática da inserção Zm- GOS2 PRO:GOS2 INTRON na 5'-UTR do gene ARGOS8 de milho pelo direcionamento do RNA guia/Cas9 sequência alvo 1 (CTS1, SEQ ID NO: 1) com o sistema gRNA1/endonuclease Cas9, descrito na presente divulgação. HR1 e HR2 indicam regiões de recombinação homóloga.
[0062] Figuras 29 A-C. Identificação e análise de eventos de inserção Zm-GOS2 PRO:GOS2 INTRON em plantas de milho. (A) Representação esquemática da inserção Zm-GOS2 PRO:GOS2 INTRON na 5'- UTR de Zm-ARGOS8. CTS1 foi orientada com o sistema gRNA1/endonuclease Cas9, descrito na presente divulgação. HR1 e HR2 indicam regiões de recombinação homóloga. P1 a P4 indicam primers de PCR. (B) triagem por PCR de calos resistentes à PMI para identificar eventos de inserção. Os resultados da PCR são mostrados para 13 calos representativos. As PCRs de junção esquerda e direita foram realizadas com o par de primers P1+P2 e P3+P4, respectivamente. (C) Análise por PCR de uma planta T0. Um produto da PCR com o tamanho esperado (2,4 kb, pista T0) foi amplificado com o primer P3 e P4.
[0063] Figura 30. Representação esquemática de substituição do promotor Zm-ARGOS8 pelo Zm-GOS2 PRO:GOS2 INTRON por direcionamento CTS3 (SEQ ID NO: 3) e CTS2 (SEQ ID NO: 2). HR1 e HR2 indicam regiões de recombinação homóloga.
[0064] Figuras 31 A-D. A substituição do promotor nativo do gene ARGOS8 pelo Zm-GOS2 PRO:GOS2 INTRON em plantas de milho. (A) Representação esquemática do alelo Zm-GOS2 PRO:GOS2 INTRON:ARGOS8 gerado pela troca do promotor. Dois sítios-alvo RNA guia/Cas9, CTS3 (SEQ ID NO: 3) e CTS2 (SEQ ID NO: 2), foram direcionados com um sistema gRNA3/gRNA2/Cas9. HR1 e HR2 indicam regiões de recombinação homóloga. P1 a P5 indicam primers de PCR. (B) triagem por PCR de calos resistentes à PMI para identificar eventos de troca. Os resultados da PCR são mostrados para 10 calos representativos. Uma amostra de calos, 12A09, é positiva para a PCR de junção esquerda (L, primer P1+P2) e junção direita (R, primer P5+P4), indicando que 12A09 é um evento de troca. (C) análise de PCR dos eventos de calo identificados na triagem primária. Os produtos da PCR com o tamanho esperado (2,4 kb) foram amplificados utilizando o primer P3 e P4 a partir do evento #3, 4, 6, 8 e 9, indicando a presença do alelo Zm-GOS2 PRO:GOS2 INTRON:ARGOS8. (D) Análise por PCR de uma planta T0. Um produto da PCR com o tamanho esperado (2,4 kb, pista T0) foi amplificado com o primer P3 e P4.
[0065] Figuras 32 A-B. Deleção do promotor nativo do gene ARGOS8 em plantas de milho. (A) Representação esquemática da deleção do promotor. Um sistema de dois RNAs-guia e uma endonuclease Cas9, referido como sistema gRNA3/gRNA2/Cas9, foram usados para direcionado os sítios CTS3 e CTS2 no Zm-ARGOS8. P1 e P4 indicam os primers de PCR para rastreio do evento de deleção. (B) triagem por PCR de calos resistentes à PMI para identificar eventos de deleção. Os resultados da PCR são mostrados para 15 calos representativos. Um produto da PCR de 1,1 kp indica a deleção do fragmento CTS3/CTS2.
[0066] Figura 33. Representação esquemática das deleções do elemento facilitador (enhancer) usando a sequência alvo RNA guia/Cas9. O elemento facilitador (enhancer) a ser deletado pode ser, mas não está limitado a um elemento enhancer 35S.
[0067] Figuras 34 A-C. Modificação de um sítio de poliubiquitinação EPSPS de milho. (A) O sítio de poliubiquitinação EPSPS de milho selecionado é comparado com sítios análogos de outras espécies vegetais. (B) Nucleotídeos a serem editados na sequência codificante de EPSPS de milho (sublinhados, aminoácido codificado mostrado em negrito). (C) A sequência codificante de EPSPS editada identificada na planta T0 selecionada.
[0068] Figuras 35 A-C. O elemento enhancer mediado pelo íntron (A). A seção 5' do primeiro íntron do gene EPSPS (edição: substituições e deleções sublinhadas representadas por pontos) (B) e sua versão editada conferindo três elementos IME (sublinhados). Os nucleotídeos editados são exibidos em negrito (C).
[0069] Figuras 36 A-B. Splicing alternativo de mRNA EPSPS em células de milho. (A) O painel da esquerda representa a análise do cDNA de EPSPS. A pista I4 na Figura 36A mostra a amplificação do pré-mRNA EPSPS contendo o 3° íntron não excisado (fragmento diagnóstico de 804 bp, conforme mostrado na Fig. 36 B que indica um evento que sofreu splicing alternativo). As pistas E3 e F8 mostram fragmentos EPSPS amplificados por PCR com íntrons que sofreram splicing. Estes fragmentos diagnósticos não são amplificados a menos que o cDNA seja sintetizado (como é evidenciado pela ausência de bandas nas pistas E3, E4, e F8 compreendendo RNA total (mostrado no painel RNA total ao lado direito da figura 36A). As caixas em cinza na Fig. 36 B representam os oito éxons EPSPS (suas dimensões são indicadas acima de cada um deles).
[0070] Figura 37. Sítio de splicing na junção entre o segundo íntron EPSPS e o terceiro éxon (em negrito). O nucleotídeo a ser editado está sublinhado.
[0071] Figura 38. Representação esquemática da análise de hibridização Southern de plantas T0 e T1 de milho.
SEQUÊNCIAS
[0072] SEQ ID NO: 1 é a sequência de nucleotídeos do gene Cas9 a partir do Streptococcus pyogenes M1 GÁS (SF370).
[0073] SEQ ID NO: 2 é a sequência de nucleotídeos do íntron ST- LS1 da batata.
[0074] SEQ ID NO: 3 é a sequência de aminoácido de SV40 amino N-terminal.
[0075] SEQ ID NO: 4 é a sequência de aminoácidos da porção carbóxi-terminal da endonuclease para bordas do T-DNA do VirD2 bipartido de Agrobacterium tumefaciens.
[0076] SEQ ID NO: 5 é a sequência de nucleotídeos de um cassete de expressão que expressa Cas9 milho-otimizada.
[0077] SEQ ID NO: 6 é a sequência nucleotídica de crRNA contendo a sequência alvo LIGCas-3 no domínio de direcionamento variável.
[0078] SEQ ID NO: 7 é a sequência nucleotídica do tracrRNA.
[0079] SEQ ID NO: 8 é a sequência nucleotídica de um RNA guia longo contendo a sequência alvo LIGCas-3 no domínio de direcionamento variável.
[0080] SEQ ID NO: 9 é a sequência de nucleotídeos do promotor U6 da polimerase III no cromossomo 8 de milho.
[0081] SEQ ID NO: 10, lista duas cópias da sequência nucleotídica do terminador U6 da polimerase III de milho.
[0082] SEQ ID NO: 11 é a sequência de nucleotídeos do RNA guia curto milho-otimizado contendo o domínio de direcionamento variável LIGCas-3.
[0083] SEQ ID NO: 12 é a sequência de nucleotídeos do cassete de expressão do RNA guia longo milho-otimizado contendo o domínio de direcionamento variável LIGCas-3.
[0084] SEQ ID NO: 13 é a sequência nucleotídica do sítio alvo genômico do Milho MS26Cas-1 mais a sequência PAM.
[0085] SEQ ID NO: 14 é a sequência nucleotídica do sítio alvo genômico do Milho MS26Cas-2 mais a sequência PAM.
[0086] SEQ ID NO: 15 é a sequência nucleotídica do sítio alvo genômico do Milho MS26Cas-3 mais a sequência PAM.
[0087] SEQ ID NO: 16 é a sequência nucleotídica do sítio alvo genômico do Milho LIGCas-2 mais a sequência PAM.
[0088] SEQ ID NO: 17 é a sequência nucleotídica do sítio alvo genômico do Milho LIGCas-3 mais a sequência PAM.
[0089] SEQ ID NO: 18 é a sequência nucleotídica do sítio alvo genômico do Milho LIGCas-4 mais a sequência PAM.
[0090] SEQ ID NO: 19 é a sequência nucleotídica do sítio alvo genômico do Milho MS45Cas-1 mais a sequência PAM.
[0091] SEQ ID NO: 20 é a sequência nucleotídica do sítio alvo genômico do Milho MS45Cas-2 mais a sequência PAM.
[0092] SEQ ID NO: 21 é a sequência nucleotídica do sítio alvo genômico do Milho MS45Cas-3 mais a sequência PAM.
[0093] SEQ ID NO: 22 é a sequência nucleotídica do sítio alvo genômico do Milho ALSCas-1 mais a sequência PAM.
[0094] SEQ ID NO: 23 é a sequência nucleotídica do sítio alvo genômico do Milho ALSCas-2 mais a sequência PAM.
[0095] SEQ ID NO: 24 é a sequência nucleotídica do sítio alvo genômico do Milho ALSCas-3 mais a sequência PAM.
[0096] SEQ ID NO: 25 é a sequência nucleotídica do sítio alvo genômico do Milho EPSPSCas-1 mais a sequência PAM.
[0097] SEQ ID NO: 26 é a sequência nucleotídica do sítio alvo genômico do Milho EPSPSCas-2 mais a sequência PAM.
[0098] SEQ ID NO: 27 é a sequência nucleotídica do sítio alvo genômico do Milho EPSPSCas-3 mais a sequência PAM.
[0099] SEQ ID NOs: 28-52 são sequências nucleotídicas dos primers diretos (forward) sítio-específicos para a PCR primária conforme mostrado na Tabela 2.
[00100] SEQ ID NO: 53 é a sequência nucleotídica do primer direto (forward) para a PCR secundária.
[00101] SEQ ID NO: 54 é a sequência nucleotídica do primer reverso (reverse) para a PCR secundária.
[00102] SEQ ID NO: 55 é a sequência de nucleotídeos da sequência de referência não modificada para os locus LIGCas-1 e LIGCas-2.
[00103] SEQ ID NOs: 56 -65 são as sequências nucleotídicas de mutações 1-10 para LIGCas-1.
[00104] SEQ ID NOs: 66 -75 são as sequências nucleotídicas de mutações 1-10 para LIGCas-2.
[00105] SEQ ID NO: 76 é a sequência de nucleotídeos da sequência de referência não modificada para o locu de LIGCas-3 e endonuclease de homing LIG3-4.
[00106] SEQ ID NOs: 77 -86 são as sequências nucleotídicas de mutações 1-10 para LIGCas-3.
[00107] SEQ ID NOs: 88 -96 são as sequências nucleotídicas de mutações 1-10 para o locus da endonuclease de homing LIG3-4.
[00108] SEQ ID NO: 97 é a sequência de nucleotídeos de um vetor doador referido como DNA de reparação por HR.
[00109] SEQ ID NO: 98 é a sequência nucleotídica do primer direto de PCR para a inserção sítio-específica do transgene na junção 1.
[00110] SEQ ID NO: 99 é a sequência nucleotídica do primer reverso de PCR para a inserção sítio-específica do transgene na junção 1.
[00111] SEQ ID NO: 100 é a sequência nucleotídica do primer direto de PCR para a inserção sítio-específica do transgene na junção 2.
[00112] SEQ ID NO: 101 é a sequência nucleotídica do primer reverso de PCR para a inserção sítio-específica do transgene na junção 2.
[00113] SEQ ID NO: 102 é a sequência de nucleotídeos da endonuclease Cas9 ligada e cassetes de expressão de RNA guia longo LIGCas-3.
[00114] SEQ ID NO: 103 é a sequência nucleotídica do sítio alvo genômico do Milho 55CasRNA-1 mais a sequência PAM.
[00115] SEQ ID NO: 104 é a sequência de nucleotídeos da sequência de referência não modificada para o locus 55CasRNA-1.
[00116] SEQ ID NOs: 105-110 são as sequências nucleotídicas de mutações 1-6 para 55CasRNA-1.
[00117] SEQ ID NO: 111 é a sequência de nucleotídeos do sítio- alvo da endonuclease de homing LIG3-4.
[00118] SEQ ID NO: 112 é a sequência de nucleotídeos da sequência codificante da endonuclease de homing LIG3-4.
[00119] SEQ ID NO: 113 é a sequência de nucleotídeos do sítio- alvo da endonuclease de homing MS26++.
[00120] SEQ ID NO: 114 é a sequência de nucleotídeos da sequência codificante da endonuclease de homing MS26++.
[00121] SEQ ID NO: 115 é a sequência de nucleotídeos do gene Cas9 códon-otimizado para soja.
[00122] SEQ ID NO: 116 é a sequência de nucleotídeos do promotor constitutivo da soja GM-EF1A2.
[00123] SEQ ID NO: 117 é a sequência de nucleotídeos do ligante NLS SV40.
[00124] SEQ ID NO: 118 é a sequência de aminoácidos Cas9 otimizada para soja com um NLS SV40.
[00125] SEQ ID NO: 119 é a sequência nucleotídica do vetor QC782.
[00126] SEQ ID NO: 120 é a sequência nucleotídica do promotor U6 da polimerase III de soja descrita na presente divulgação, GM-U6-13.1 PRO.
[00127] SEQ ID NO: 121 é a sequência de nucleotídeos do RNA guia na Figura 8B.
[00128] SEQ ID NO: 122 é a sequência nucleotídica do vetor QC783.
[00129] SEQ ID NO: 123 é a sequência nucleotídica do vetor QC815.
[00130] SEQ ID NO: 124 é a sequência nucleotídica de uma endonuclease Cas9 (cas9-2) de S. pyogenes.
[00131] SEQ ID NO: 125 é a sequência de nucleotídeos do sítio- alvo DD20CR1 de soja.
[00132] SEQ ID NO: 126 é a sequência de nucleotídeos do sítio- alvo DD20CR2 de soja.
[00133] SEQ ID NO: 127 é a sequência de nucleotídeos do sítio- alvo DD43CR1 de soja.
[00134] SEQ ID NO: 128 é a sequência de nucleotídeos do sítio- alvo DD43CR2 de soja.
[00135] SEQ ID NO: 129 é a sequência de nucleotídeos da sequência DD20 na Figura 10A.
[00136] SEQ ID NO: 130 é a sequência de nucleotídeos da sequência complementar de DD20 na Figura 10A.
[00137] A SEQ ID NO: 131 é a sequência nucleotídica da sequência DD43.
[00138] A SEQ ID NO: 132 é a sequência nucleotídica da sequência complementar de DD43.
[00139] SEQ ID NO: 133- 141 são sequências de primers.
[00140] A SEQ ID NO: 142 é a sequência nucleotídica do amplicon da PCR DD20CR1.
[00141] A SEQ ID NO: 143 é a sequência nucleotídica do amplicon da PCR DD20CR2.
[00142] A SEQ ID NO: 144 é a sequência nucleotídica do amplicon da PCR DD43CR1.
[00143] A SEQ ID NO: 145 é a sequência nucleotídica do amplicon da PCR DD43CR2.
[00144] A SEQ ID NO: 146 é a sequência nucleotídica do amplicon da PCR DD43CR2.
[00145] SEQ ID NOs: 147- 156 são as sequências nucleotídicas das mutações de 1 a 10 para o sítio-alvo DD20CR1.
[00146] SEQ ID NOs: 157- 166 são as sequências nucleotídicas das mutações de 1 a 10 para o sítio-alvo DD20CR2.
[00147] SEQ ID NO: 167- 176 são as sequências nucleotídicas das mutações de 1 a 10 para o sítio-alvo DD43CR1.
[00148] SEQ ID NO: 177- 191 são as sequências nucleotídicas das mutações de 1 a 10 para o sítio-alvo DD43CR2.
[00149] SEQ ID NO: 192 é a sequência de aminoácidos de uma versão otimizada para milho da proteína Cas9.
[00150] SEQ ID NO: 193 é a sequência de nucleotídeos da versão milho-otimizada do gene Cas9 de SEQ ID NO: 192.
[00151] SEQ ID NO: 194 é a versão em DNA do RNA guia (EPSPS sgRNA).
[00152] SEQ ID NO: 195 é o molde de modificação de polinucleotídeo EPSPS.
[00153] SEQ ID NO: 196 é um fragmento de nucleotídeos compreendendo as modificações de nucleotídeos TIPS.
[00154] SEQ ID NOs : 197-204 são as sequências de primers mostradas na Tabela 15.
[00155] SEQ ID NOs: 205-208 são fragmentos de nucleotídeos mostrados na Tabela 14.
[00156] SEQ ID NO: 209 é um exemplo de um fragmento da sequência de nucleotídeos EPSPS TIPS-editada apresentado na Figura 17.
[00157] SEQ ID NO: 210 é um exemplo de um fragmento da sequência de nucleotídeos EPSPS tipo selvagem apresentado na Figura 17.
[00158] SEQ ID NO: 211 é a sequência de nucleotídeos de um locus da enolpiruvilchiquimato-3-fosfato sintase (EPSPS) de milho.
[00159] SEQ ID NO: 212 é a sequência nucleotídica de uma endonuclease Cas9 (Genbank CS571758.1) de S. thermophiles.
[00160] SEQ ID NO: 213 é a sequência nucleotídica de uma endonuclease Cas9 (Genbank CS571770.1) de S. thermophiles.
[00161] SEQ ID NO: 214 é a sequência nucleotídica de uma endonuclease Cas9 (Genbank CS571785.1) de S. agalactiae.
[00162] SEQ ID NO: 215 é a sequência nucleotídica de uma endonuclease Cas9 (Genbank CS571790.1) de S. agalactiae.
[00163] SEQ ID NO: 216 é a sequência nucleotídica de uma endonuclease Cas9 (Genbank CS571790.1) de S. mutant.
[00164] SEQ ID NOs: 217-228 são sequências nucleotídicas dos primers e sondas descritos no Exemplo 17.
[00165] SEQ ID NO: 229 é a sequência de nucleotídeos do sítio- alvo MHP14Cas1.
[00166] SEQ ID NO: 230 é a sequência de nucleotídeos do sítio- alvo MHP14Cas3.
[00167] SEQ ID NO: 231 é a sequência de nucleotídeos do sítio- alvo TS8Cas1.
[00168] SEQ ID NO: 232 é a sequência de nucleotídeos do sítio- alvo TS8Cas2 .
[00169] Seq Id No: 233 É A Sequência De Nucleotídeos Do Sítio- Alvo Ts9cas2.
[00170] SEQ ID NO: 234 é a sequência de nucleotídeos do sítio- alvo TS9Cas3.
[00171] SEQ ID NO: 235 é a sequência de nucleotídeos do sítio- alvo TS10Cas1.
[00172] SEQ ID NO: 236 é a sequência de nucleotídeos do sítio- alvo TS10Cas3.
[00173] SEQ ID NOs: 237-244 são as sequências nucleotídicas exibidas nas Figuras 19A-D.
[00174] SEQ ID NOs: 245-252 são sequências nucleotídicas dos cassetes de expressão do RNA guia descritos no Exemplo 18.
[00175] SEQ ID NOs: 253-260 são sequências nucleotídicas dos cassetes de expressão do DNA doador descrito no Exemplo 18.
[00176] SEQ ID NOs:261-270 são sequências de nucleotídeos dos primers descritos no Exemplo 18.
[00177] SEQ ID NOs:271-294 são sequências de nucleotídeos dos primers e sondas descritos no Exemplo 18.
[00178] SEQ ID NO: 295 é a sequência nucleotídica do GM-U6- 13.1 PRO, um promotor U6 da polimerase III de soja descrito na presente divulgação.
[00179] SEQ ID NOs: 298, 300, 301 e 303 são sequências nucleotídicas dos cassetes de expressão RNA guia/Cas9 ligados.
[00180] SEQ ID NOs: 299 e 302 são as sequências de nucleotídeos dos cassetes de expressão do DNA doador.
[00181] SEQ ID NOs:271-294 são sequências de nucleotídeos dos primers e sondas descritos no Exemplo 18.
[00182] A SEQ ID NO: 304 é a sequência nucleotídica do amplicon da qPCR DD20.
[00183] A SEQ ID NO: 305 é a sequência nucleotídica do amplicon da qPCR DD43.
[00184] SEQ ID NOs:306-328 são sequências de nucleotídeos dos primers e sondas descritos na presente divulgação.
[00185] SEQ ID NOs: 329- 334 são as sequências nucleotídicas dos amplicons da PCR descrita na presente divulgação.
[00186] SEQ ID NO: 335 é a sequência nucleotídica de uma região genômica da soja compreendendo o sítio alvo DD20CR1.
[00187] SEQ ID NO: 364 é a sequência nucleotídica de uma região genômica da soja compreendendo o sítio alvo DD20CR2.
[00188] SEQ ID NO: 386 é a sequência nucleotídica de uma região genômica da soja compreendendo o sítio-alvo DD43CR1.
[00189] As SEQ ID NO: 336-363, 365-385 e 387-414 são as sequências de nucleotídeos apresentadas na Figura 26 AC.
[00190] SEQ ID NOs: 415-444 são sequências nucleotídicas de mutações NHEJ recuperadas com base no sistema crRNA/tracrRNA/endonuclease Cas mostrado na Figura 27A-C.
[00191] SEQ ID NO: 445-447 são sequências nucleotídicas dos cassetes de expressão de crRNA LIGCas-1, LIGCas2 e LIGCas3, respectivamente.
[00192] SEQ ID NO: 448 é a sequência nucleotídica do cassete de expressão tracrRNA.
[00193] SEQ ID NO: 449 é a sequência nucleotídica do primer direto (forward) LIGCas-2 para a PCR primária.
[00194] SEQ ID NO: 450 é a sequência nucleotídica do primer direto (forward) LIGCas-3 para a PCR primária.
[00195] SEQ ID NO: 451 é a sequência nucleotídica do sítio-alvo da endonuclease Cas9 genômica de milho ZM-ARGOS8-CTS1.
[00196] SEQ ID NO: 452 é a sequência nucleotídica do sítio-alvo da endonuclease Cas9 genômica de milho ZM-ARGOS8-CTS2.
[00197] SEQ ID NO: 453 é a sequência nucleotídica do sítio-alvo da endonuclease Cas9 genômica de milho Zm-ARGOS8-CTS3.
[00198] SEQ ID NOs: 454-458 são sequências nucleotídicas dos primers P1, P2, P3, P4, P5, respectivamente.
[00199] SEQ ID NO: 459 é a sequência nucleotídica de um Sítio de Ligação do Primer (PBS), uma sequência para facilitar a triagem de eventos.
[00200] SEQ ID NO: 460 é a sequência nucleotídica do Zm-GOS2 PRO-GOS2 ÍNTRON, promotor GOS2 de milho e íntron1 GOS2 incluindo o promotor, 5'-UTR1, INTRON1 e 5'-UTR2.
[00201] SEQ ID NO: 461 é a sequência nucleotídica do promotor Zm-ARGOS8.
[00202] SEQ ID NO: 462 é a sequência nucleotídica do promotor Zm-ARGOS8 5'-UTR de milho.
[00203] SEQ ID NO: 463 é a sequência nucleotídica da sequência de códon Zm-ARGOS8 de milho.
[00204] SEQ ID NO: 464 é a sequência nucleotídica do gene Zm- GOS2 de milho, incluindo o promotor, 5'-UTR, CDS, 3'-UTR e íntrons.
[00205] SEQ ID NO: 465 é a sequência nucleotídica do promotor Zm-GOS2 PRO de milho.
[00206] SEQ ID NO: 466 é a sequência de nucleotídeos do milho GOS2 ÍNTRON, milho GOS2 5'-UTR1 e íntron1 e 5'-UTR2.
[00207] SEQ ID NOs: 467-468, 490-491, 503-504 são sequências nucleotídicas de sequências alvo genômicas da endonuclease Cas EPSPS- CR1 de soja, EPSPS-CR2 de soja, EPSPS-CR4 de soja, EPSPS-CR5 de soja, EPSPS-CR6 de soja e EPSPS-CR7 de soja, respectivamente
[00208] SEQ ID NO: 469 é a sequência nucleotídica do promotor RNA nuclear pequeno U6 de soja, GM-U6-13.1.
[00209] SEQ ID NOs: 470, 471 são sequências nucleotídicas dos plasmídeos QC868 e QC879, respectivamente.
[00210] SEQ ID NOs: 472, 473, 492, 493, 494, 505, 506, 507 são sequências nucleotídicas do RTW1013A, RTW1012A, RTW1199, RTW1200, RTW1190A, RTW1201, RTW1202, RTW1192A, respectivamente.
[00211] SEQ ID NOs: 474-488, 495-402, 508-512 são as sequências nucleotídicas de primers e sondas.
[00212] SEQ ID NO: 489 é a sequência nucleotídica da Cas9 códon-otimizada para soja.
[00213] SEQ ID NO: 513 é a sequência nucleotídica do enhancer 35S.
[00214] SEQ ID NO : 514 é a sequência nucleotídica do 35S- CRTS para gRNA1 em 163-181 (incluindo pam na extremidade 3').
[00215] SEQ ID NO: 515 é a sequência nucleotídica do 35S- CRTS para gRNA2 em 295-319 (incluindo pam na extremidade 3').
[00216] SEQ ID NO: 516 é a sequência nucleotídica do 35S-CRT para gRNA3 em 331-350 (incluindo pam na extremidade 3').
[00217] A SEQ ID NO: 517 é a sequência nucleotídica do molde EPSPS-K90R.
[00218] A SEQ ID NO: 518 é a sequência nucleotídica do molde EPSPS-IME.
[00219] A SEQ ID NO: 519 é a sequência nucleotídica do molde que sofreu splicing EPSPS-T.
[00220] SEQ ID NO: 520 é a sequência de aminoácidos do peptídeo ZM-RAP2.7.
[00221] SEQ ID NO: 521 é a sequência nucleotídica da sequência de DNA codificante de Zm -RAP2.7.
[00222] SEQ ID NO: 522 é a sequência de aminoácidos do peptídeo ZM-NPK1B.
[00223] SEQ ID NO: 523 é a sequência nucleotídica da sequência de DNA codificante de Zm -NPK1B.
[00224] A SEQ ID NO: 524 é a sequência nucleotídica do promotor RAB17.
[00225] SEQ ID NO: 525 é a sequência de aminoácidos do FTM1 de Milho.
[00226] SEQ ID NO: 526 é a sequência nucleotídica da sequência de DNA codificante de FTM1 de milho.
[00227] SEQ ID NOs: 527-532 são as sequências nucleotídicas exibidas nas Figuras 34, 35.
[00228] SEQ ID NOs: 533-534 são as sequências nucleotídicas da sonda genômica para Southern e sonda MoPAT para Southern da Figura 38, respectivamente. SEQ ID NOs: 535-541 são as sequências nucleotídicas de RF-FPCas-1, Rf-FPCas-2, ALSCas-4, molde de reparação de modificação ALS 804, molde de reparação de modificação ALS 127, primer direto ALS (ALS Forward_primer) e primer reverso ALS (ALS Reverse_primer), respectivamente.
[00229] SEQ ID NOs: 542-549 são as sequências nucleotídicas da ALS1-CR1 de soja, sequência-alvo Cas9, ALS2-CR2 de soja, sequência- alvo Cas9, QC880, QC881, RTW1026A, WOL900, Forward_primer, WOL578, Reverse_primer e WOL573, Forward_primer, respectivamente.
[00230] A SEQ ID NO: 550 é a sequência nucleotídica da proteína ALS de milho.
DESCRIÇÃO DETALHADA DA INVENÇÃO
[00231] A presente divulgação inclui composições e métodos para a modificação genômica de uma sequência-alvo no genoma de uma célula vegetal ou planta, para a seleção de plantas, para a edição gênica, e para a inserção de um polinucleotídeo de interesse no genoma de uma planta. Os métodos utilizam um sistema RNA guia/endonuclease Cas, em que a endonuclease CAS é guiada pelo RNA guia para reconhecer e, opcionalmente, introduzir uma quebra de dupla fita em um sítio alvo específico no genoma de uma célula. O sistema RNA guia/endonuclease Cas provê um sistema eficaz para modificar sítios-alvo dentro do genoma de uma célula vegetal ou planta ou semente. São fornecidos ainda métodos e composições que empregam um sistema polinucleotídeo guia/endonuclease Cas para proporcionar um sistema eficaz de modificação de sítios alvo no interior do genoma de uma célula e para editar de uma sequência de nucleotídeos no genoma de uma célula. Uma vez que um sítio genômico alvo é identificado, uma variedade de métodos para modificar ainda mais os sítios-alvo pode ser empregada a fim de que tais sítios contenham uma variedade de polinucleotídeos de interesse. Também são divulgados métodos de melhoramento que utilizam um sistema RNA guia/endonuclease Cas de dois componentes. Também são fornecidas composições e métodos para a edição de uma sequência de nucleotídeos no genoma de uma célula. A sequência de nucleotídeos a ser editada (a sequência de nucleotídeos de interesse) pode estar localizada dentro ou fora de um sítio-alvo que é reconhecido pela endonuclease CAS.
[00232] loci CRISPR (Repetições Palindrômicas Curtas Agrupadas e Regularmente Espaçadas) (também conhecidos como SPIDRs - Repetições Diretas Interespaçadas com Espaçadores) constituem uma família de loci de DNA descritos recentemente. Os loci CRISPR consistem de repetições de DNA curtas e altamente conservadas (tipicamente 24 a 40 bp, repetidas de 1 a 140 vezes, também referidas como unidades de repetição CRISPR), que são parcialmente palindrômicas. As sequências repetidas (geralmente específicas para uma espécie) são intercaladas por sequências variáveis de comprimento constante (tipicamente de 20 a 58 dependendo do locus CRISPR (WO2007/025097 publicado em 01 de março de 2007).
[00233] Os loci CRISPR foram reconhecidos pela primeira vez em E. coli (Ishino et al. (1987) J. Bacterial. 169:5429-5433; Nakata et al. (1989) J. Bacterial. 171:3553-3556). Repetições de sequências curtas intercaladas semelhantes foram identificadas em Haloferax mediterranei, Streptococcus pyogenes, Anabaena e Mycobacterium tuberculosis (Groenen et al. (1993) Mol. Microbiol. 10:1057-1065; Hoe et al. (1999) Emerg. Infect. Dis. 5:254-263; Masepohl et al. (1996) Biochim. Biophys. Acta 1307:26-30; Mojica et al. (1995) Mol. Microbiol. 17:85-93). Os loci CRISPR diferem de outros SSRs pela estrutura das repetições, que foram denominadas repetições curtas regularmente espaçadas (SRSRs) (Janssen et al. (2002) OMICS J. Integ. Biol. 6:23-33; Mojica et al. (2000) Mol. Microbiol. 36:244-246). As repetições são elementos curtos que ocorrem em aglomerados, que sempre são regularmente espaçados por sequências variáveis de comprimento constante (Mojica et al. (2000) Mol. Microbiol. 36:244-246.
[00234] Gene cas inclui um gene que geralmente está acoplado, associado ou próximo ou na vizinhança dos loci CRISPR flanqueadores. Os termos “gene Cas”, “gene (CAS) associado com CRISPR” são utilizados de modo indiferente na presente divulgação. Uma ampla revisão da família de proteínas Cas é apresentada em Haft et al. (2005) Computational Biology, PLoS Comput Biol 1(6):e60. doi:10.1371/journal.pcbi.0010060.
[00235] Conforme descrito no artigo supracitado, 41 famílias de genes (CAS) associados com CRISPR são descritas, além das quatro famílias de genes anteriormente conhecidas. Isso mostra que os sistemas CRISPR pertencem a classes diferentes, com diferentes padrões de repetição, conjuntos de genes, e gamas de espécies. O número de genes Cas em determinado locus CRISPR pode variar entre as espécies.
[00236] A endonuclease Cas refere-se a uma proteína Cas codificada por um gene Cas, em que a referida proteína Cas é capaz de introduzir uma quebra de dupla fita na sequência-alvo de DNA. A endonuclease Cas é guiada pelo polinucleotídeo guia para reconhecer e, opcionalmente, introduzir uma quebra de dupla fita em um sítio-alvo específico no genoma de uma célula. Conforme utilizado no presente, o termo “sistema polinucleotídeo guia/endonuclease Cas” inclui um complexo de uma endonuclease Cas e um polinucleotídeo guia que é capaz de introduzir uma quebra de dupla fita em uma sequência-alvo de DNA. A endonuclease Cas desenrola o DNA duplexo em grande proximidade do sítio-alvo genômico e cliva ambas as fitas de DNA mediante o reconhecimento de uma sequência-alvo através de um RNA guia, mas apenas se o Motivo Adjacente ao Protoespaçador (PAM) correto estiver aproximadamente orientado na extremidade 3' da sequência alvo (Figura 2A, Figura 2B).
[00237] Em um exemplo de realização, o gene da endonuclease Cas é uma endonuclease Cas9, tal como, mas não se limitando, os genes Cas9 listados nas SEQ ID NOs: 462, 474, 489, 494, 499, 505, e 518 do documento WO2007/025097 publicado em 1 de março de 2007, e incorporada ao presente pela. Em outro exemplo de realização, o gene da endonuclease CAS é uma endonucleases Cas9 otimizada para planta, de milho ou soja (Figura 1 A). Em outro exemplo de realização, o gene da endonuclease Cas está operacionalmente ligado a um sinal de direcionamento nuclear SV40 a montante da região de códon Cas e um sinal de localização nuclear bipartido VirD2 (Tinland et al.(1992) Proc. Natl. Acad. Sci. USA 89: 7442-6) a jusante da região de códon Cas.
[00238] Em um exemplo de realização, o gene da endonuclease Cas é um gene da endonuclease Cas9 de SEQ ID NO: 1, 124, 212, 213, 214, 215, 216, 193 ou os nucleotídeos 2037-6329 da SEQ ID NO: 5, ou qualquer fragmento funcional ou variante dos mesmos.
[00239] Os termos “fragmento funcional” “fragmento que é funcionalmente equivalente” e “fragmento funcionalmente equivalente” são usados na presente divulgação de maneira alternada. Estes termos referem-se a uma porção ou subsequência da sequência de endonuclease Cas da presente divulgação, em que a capacidade para criar uma quebra de dupla fita é mantida.
[00240] Os termos “variante funcional” “variante que é funcionalmente equivalente” e “variante funcionalmente equivalente” são usados na presente divulgação de maneira alternada. Estes termos referem-se a uma forma variante endonuclease Cas da presente divulgação em que a capacidade de criar uma quebra de dupla fita é mantida. Os fragmentos e variantes podem ser obtidos por meio de métodos como mutagênese sítio- dirigida e construção sintética.
[00241] Em um exemplo de realização, o gene da endonuclease Cas é um gene Cas9 de Streptococcus pyogenes códon-otimizado para planta que pode reconhecer qualquer sequência genômica da forma N(12-30)NGG pode, em princípio, ser visado.
[00242] Em um exemplo de realização, a endonuclease Cas é introduzida diretamente em uma célula através de qualquer método conhecido no estado da técnica, por exemplo, mas não se limitando a, os métodos de introdução transitória, transfecção e/ou aplicação tópica.
[00243] Endonucleases são enzimas que clivam a ligação fosfodiéster dentro de uma cadeia de polinucleotídeo, e incluem enzimas de restrição que clivam o DNA em sítios específicos, sem danificar as bases. As endonucleases de restrição incluem endonucleases Tipo I, Tipo II, Tipo III, e tipo IV, que incluem ainda subtipos. Nos sistemas Tipo I e tipo III, ambas as atividades de metilase e de restrição estão contidas em um único complexo. Endonucleases também incluem meganucleases, também conhecidas como endonucleases de homing (HEases), que, como enzimas de restrição, ligam-se e cortam em um sítio de reconhecimento específico, porém os sítios de reconhecimento para as meganucleases são tipicamente maiores, cerca de 18 bp ou mais. (Pedido de Patente WO-PCT PCT/US12/30061 depositado em 22 de março de 2012). As meganucleases foram classificadas em quatro famílias com base nos motivos de sequências conservadas, as famílias são LAGLIDADG, GIY-YIG, H-N-H, e famílias box His-Cis. Estes motivos participam na coordenação de íons metálicos e hidrólise de ligações fosfodiéster. As HEases são notáveis para seus longos sítios de reconhecimento, e por tolerarem alguns polimorfismos de sequência nos seus DNAs substratos. A convenção de nomenclatura para as meganuclease é similar à convenção para outras endonucleases de restrição. As meganucleases também são caracterizadas pelo prefixo F-, I-, ou PI- para enzimas codificadas pelas ORFs autônomas, íntrons, e inteínas, respectivamente. Uma etapa do processo de recombinação do polinucleotídeo envolve a clivagem no sitio ou próximo do sítio de reconhecimento. Esta atividade de clivagem pode ser usada para produzir uma quebra de dupla fita. Para revisões sobre recombinases sítio- específicas e seus sítios de reconhecimento, vide, Sauer (1994) Curr Op Biotechnol 5:521-7; e Sadowski (1993) FASEB 7:760-7. Em alguns exemplos, a recombinase é a das famílias Integrase ou Resolvase.
[00244] Nucleases efetoras TAL são uma nova classe de nucleases sequência-específicas que podem ser usadas para produzir quebras de dupla fita em sequências-alvo específicas no genoma de uma planta ou outro organismo. (Miller et al. (2011) Nature Biotechnology 29:143-148). As nucleases dedo de zinco (ZFNs) são agentes projetados que induzem a quebra de dupla fita e compreendem um domínio de ligação ao DNA dedo de zinco e um domínio do agente que induz a quebra de dupla fita. A especificidade do sítio de reconhecimento é conferida pelo domínio dedo de zinco, que tipicamente compreende dois, três, ou quatro dedos de zinco, por exemplo, possuindo uma estrutura C2H2, entretanto, outras estruturas de dedo de zinco são conhecidas e foram manipuladas. Os domínios dedo de zinco são propícios para a concepção de polipeptídeo que se ligam especificamente a uma sequência de reconhecimento de polinucleotídeo selecionado. ZFNs incluem um domínio modificado dedo de zinco de ligação ao DNA ligado a um domínio endonuclease não específica, por exemplo, domínio nuclease a partir de uma endonuclease Tipo II, tal como Fokl. Funcionalidades adicionais podem ser fundidas com o domínio ligação dedo de zinco, incluindo domínios ativadores da transcrição, domínios repressores da transcrição e metilases. Em alguns exemplos, a dimerização de domínio nuclease é necessária para a atividade de clivagem. Cada dedo de zinco reconhece três pares de bases consecutivos no DNA alvo. Por exemplo, um domínio de três dedos reconhece uma sequência de 9 nucleotídeos contíguos, com um requisito de dimerização da nuclease, dois conjuntos de tripletos de dedos de zinco são utilizados para ligar a uma sequência de reconhecimento de 18 nucleotídeos.
[00245] Bactérias e archaea evoluíram defesas imune adaptativas denominadas Repetições Palindrômicas Curtas Agrupadas e Regularmente Espaçadas (CRISPR)/ sistemas (Cas) associados às CRISPR que usam RNA curto para a degradação direta de ácidos nucleicos estranhos ((WO2007/025097 publicado em 01 de março de 2007). O sistema CRISPR tipo II/Cas de bactérias emprega crRNA e tracrRNA para orientar a endonuclease Cas ao seu DNA alvo. O crRNA (RNA CRISPR) contém a região complementar para uma fita de uma cadeia do DNA dupla-fita alvo e o pareamento de bases com o tracrRNA (RNA CRISPR trans-atuante) formando um duplexo de RNA que direciona a endonuclease Cas para clivar o DNA alvo (Figura 2 B).
[00246] Tal como utilizado na presente divulgação, o termo “RNA guia” está relacionado a uma fusão sintética de duas moléculas de RNA, um crRNA (RNA CRISPR), que compreende um domínio de direcionamento variável, e um tracrRNA (Figura 2 B). Em um exemplo de realização, o RNA guia de compreende um domínio de direcionamento variável de sequências de 12 a 30 nucleotídeos e um fragmento de RNA que pode interagir com uma endonuclease Cas.
[00247] Conforme utilizado no presente, o termo “polinucleotídeo guia”, refere-se a uma sequência de polinucleotídeos que pode formar um complexo com uma endonuclease Cas e permite que a endonuclease Cas reconheça e opcionalmente clive um sítio-alvo de DNA. O polinucleotídeo guia pode ser uma molécula única ou uma molécula dupla. A sequência do polinucleotídeo guia pode ser uma sequência de RNA, uma sequência de DNA, ou uma combinação destas (uma sequência da combinação RNA-DNA). Opcionalmente, o polinucleotídeo guia pode compreender, pelo menos, um nucleotídeo, ligação fosfodiéster ou modificação de ligação como, mas não se limitando a, ácido nucleico bloqueado (LNA), 5-metil dC, 2,6-diaminopurina, 2'- Fluoro A, 2'-Fluoro U, 2'-O-metil RNA, ligação de fosforotioato, ligação a uma molécula de colesterol, ligação a uma molécula de polietileno glicol, ligação a uma molécula espaçadora 18 (cadeia de hexaetileno glicol), ou ligação covalente 5' para 3' resultando em circularização. Um polinucleotídeo guia que compreende unicamente os ácidos ribonucleicos também é referido como um “RNA guia”.
[00248] O polinucleotídeo guia pode ser uma molécula dupla (também referida polinucleotídeo guia duplexo), que compreende um primeiro domínio de sequência nucleotídica (referido como domínio de Direcionamento Variável ou domínio VT), que é complementar a uma sequência nucleotídica de um DNA alvo; e um segundo domínio de sequência nucleotídica (designada como domínio de Reconhecimento da Endonuclease Cas ou domínio CER) que interage com um polipeptídeo endonuclease Cas. O domínio CER da dupla molécula de polinucleotídeo guia compreende duas moléculas separadas que são hibridizadas ao longo de uma região de complementaridade. As duas moléculas separadas podem ser RNA, DNA, e/ou sequências de combinação RNA-DNA. Em algumas exemplos de realização, a primeira molécula de polinucleotídeo guia duplex compreendendo um domínio VT ligado a um domínio CER é referida como “crDNA” (quando composta de um trecho contíguo de nucleotídeos de DNA) ou “crRNA” (quando composta por um trecho contíguo de nucleotídeos de RNA), ou “crDNA-RNA” (quando composta de uma combinação de nucleotídeos de DNA e RNA). O crNucleotídeo pode compreender um fragmento de cRNA que ocorre naturalmente em bactérias e Archaea. Em um exemplo de realização, o tamanho do fragmento do cRNA de ocorrência natural em bactérias e Archaea que está presente em um crNucleotídeo divulgado na presente invenção pode variar entre, mas não está limitado a, 2, 3, 4, 5, 6, 7, 8, 9,10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20 ou mais nucleotídeos. Em alguns exemplos de realização a segunda molécula de polinucleotídeo guia duplexo compreendendo um domínio CER é referida como “tracrRNA” (quando composta de um trecho contíguo de nucleotídeos de RNA) ou “tracrDNA” (quando composta de um trecho contíguo de nucleotídeos de DNA) ou “tracrDNA-RNA “(quando composta de um trecho contíguo da combinação de DNA e RNA. Em um exemplo de realização, o RNA que guia o complexo RNA/endonuclease Cas9, é um RNA em duplexo compreendendo um duplexo crRNA-tracrRNA.
[00249] O polinucleotídeo guia também pode ser uma molécula única que compreende um primeiro domínio de sequência nucleotídica (referido como domínio de Direcionamento Variável ou domínio VT), que é complementar a uma sequência nucleotídica de um DNA alvo; e um segundo domínio de sequência nucleotídica (designada como domínio de Reconhecimento da Endonuclease Cas ou domínio CER) que interage com um polipeptídeo endonuclease Cas. Por “domínio” pretende-se significar uma extensão contígua de nucleotídeos que pode ser de RNA, DNA, e/ou a combinação RNA-DNA. O domínio VT e/ou o domínio CER de um polinucleotídeo guia simples (de fita única) pode compreender uma sequência de RNA, uma sequência de DNA, ou uma sequência da combinação RNA- DNA. Em alguns exemplos de realização o polinucleotídeo guia simples compreende um crNucleotídeo (compreendendo um domínio VT ligado a um domínio CER) ligado a um tracrNucleotídeo (compreendendo um domínio CER), em que a ligação é uma sequência de nucleotídeos que compreende uma sequência de RNA, uma sequência de DNA, ou uma sequência da combinação RNA-DNA. O polinucleotídeo guia simples (de fita única) compreendido pelas sequências do crNucleotídeo e tracrNucleotídeo pode ser referido como “RNA guia” (quando composto de uma extensão contígua de nucleotídeos de RNA) ou “DNA guia único” (quando composto de uma extensão contígua de nucleotídeos de DNA ) ou “RNA-DNA guia” (quando composto de uma combinação de nucleotídeos de RNA e DNA). Em um exemplo de realização, o RNA guia simples compreende um cRNA ou fragmento de cRNAc e um tracrRNA ou fragmento tracrRNA do sistema CRISPR tipo II/Cas que pode formar um complexo com uma endonuclease Cas tipo II, em que o referido complexo RNA guia/endonuclease Cas pode direcionar a endonuclease Cas para um sítio-alvo genômico vegetal, permitindo que a endonuclease Cas introduza uma quebra de dupla fita no sítio alvo genômico. Um aspecto do uso de um guia simples (de fita única) versus um polinucleotídeo guia duplexo é que apenas um cassete de expressão precisa ser produzido para expressar o polinucleotídeo guia único (de fita única).
[00250] O termo “domínio de direcionamento variável” ou “domínio VT” é usado alternadamente na presente divulgação e inclui uma sequência de nucleotídeos que é complementar a uma fita (sequência nucleotídica) de um sítio-alvo de DNA dupla fita (Figura 2 A e 2 B). A % de complementação entre o primeiro domínio de sequência nucleotídica (domínio VT) e a sequência alvo pode ser de, pelo menos, 50%, 51%, 52%, 53%, 54%, 55%, 56%, 57%, 58%, 59%, 60%, 61%, 62%, 63%, 63%, 65%, 66%, 67%, 68%, 69%, 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% ou 100%. O domínio de direcionamento variável pode ser de, pelo menos, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29 ou 30 nucleotídeos de comprimento. Em alguns exemplos de realização, o domínio de direcionamento variável compreende uma extensão contígua de 12 a 30 nucleotídeos. O domínio de direcionamento variável pode ser composto por uma sequência de DNA, uma sequência de RNA, uma sequência de DNA modificada, uma sequência de RNA modificada, ou qualquer combinação destas sequências.
[00251] O termo “domínio de reconhecimento da endonuclease Cas” ou “domínio CER” de um polinucleotídeo guia é usado de maneira alternada na presente divulgação, e inclui uma sequência de nucleotídeos (como um segundo domínio sequência nucleotídica de um polinucleotídeo guia), que interage com um polipeptídeo endonuclease Cas. O domínio CER pode ser composto por uma sequência de DNA, uma sequência de RNA, uma sequência de DNA modificada, uma sequência de RNA modificada (vide, por exemplo, as modificações descritas na presente divulgação), ou qualquer combinação destas sequências.
[00252] A sequência de nucleotídeos que liga ao crNucleotídeo e o tracrNucleotídeo de um polinucleotídeo guia pode compreender uma sequência de RNA, uma sequência de DNA, ou uma sequência da combinação de RNA-DNA. Em um exemplo de realização, a sequência nucleotídica que se liga ao crNucleotídeo e tracrNucleotídeo de um polinucleotídeo guia pode ser de pelo menos 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75, 76, 77, 78, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99 ou 100 nucleotídeos de comprimento. Em outro exemplo de realização, a sequência nucleotídica ligando o crNucleotídeo e tracrNucleotídeo de um polinucleotídeo guia pode compreender uma sequência tetraloop, tal como, mas não se limitando a, uma sequência tetraloop GAAA.
[00253] A modificação da sequência nucleotídica do polinucleotídeo guia, domínio VT e/ou domínio CER pode ser selecionada a partir, mas não se limitando, do grupo que consiste em um cap 5', cauda poliadenilada a 3', sequência riboswitch, uma sequência de controle da estabilidade, uma sequência que forma um duplexo dsRNA, uma modificação ou uma sequência que tem como alvo o polinucleotídeo guia para uma localização subcelular, uma modificação ou sequência que permite o rastreio, uma modificação ou sequência que proporciona um sítio de ligação para as proteínas, um ácido nucleico bloqueado (LNA - Locked Nucleic Acid), um nucleotídeo 5-metil dC, um nucleotídeo 2,6-diaminopurina, um nucleotídeo 2'- Fluoro A, um nucleotídeo 2'-Fluoro U; um nucleotídeo 2'-O-metil RNA, ligação fosforotioato, ligação a uma molécula de colesterol, ligação a uma molécula de polietileno-glicol, ligação a uma molécula espaçadora 18, ligação covalente 5' para 3', ou qualquer combinação dos mesmos. Estas modificações podem resultar em, pelo menos, uma característica benéfica adicional, em que a característica benéfica adicional é selecionada a partir do grupo de uma estabilidade modificada ou regulada, um direcionamento subcelular, rastreio, marcador fluorescente, sítio de ligação para uma proteína ou complexo de proteína, afinidade de ligação modificada para a sequência alvo complementar, resistência à degradação celular modificado e aumento da permeabilidade celular.
[00254] Em um exemplo de realização, o RNA guia e endonuclease Cas são capazes de formar um complexo que permite que a endonuclease Cas introduza uma quebra de dupla fita em um sítio-alvo do DNA
[00255] Em um exemplo de realização da presente divulgação p domínio de direcionamento variável é de 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29 ou 30 nucleotídeos de comprimento.
[00256] Em um exemplo de realização, o RNA guia compreende um cRNA ou fragmento de cRNAc e um tracrRNA ou fragmento tracrRNA do sistema CRISPR tipo II/Cas que pode formar um complexo com uma endonuclease Cas tipo II, em que o referido complexo RNA guia/endonuclease Cas pode direcionar a endonuclease Cas para um sítio-alvo genômico vegetal, permitindo que a endonuclease Cas introduza uma quebra de dupla fita no sítio alvo genômico.
[00257] Em um exemplo de realização, o RNA guia pode ser introduzido em uma célula vegetal ou planta utilizando diretamente de qualquer método conhecido no estado da técnica, tal como, mas não se limitando a, bombardeamento de partículas ou aplicações tópicas.
[0100] Em outro exemplo de realização o RNA guia pode ser introduzido indiretamente pela introdução de uma molécula de DNA recombinante compreendendo a sequência de DNA guia correspondente operacionalmente ligada a um promotor específico para plantas (conforme mostrado na Figura 1 B) que é capaz de transcrever o RNA guia na referida célula vegetal. O termo “DNA guia correspondente” inclui uma molécula de DNA que é idêntica à molécula de RNA, mas tem um “T” substituído para cada “U” da molécula de RNA.
[0101] Em alguns exemplos de realização, o RNA guia é introduzido por bombardeamento de partículas ou transformação por Agrobacterium de uma construção de DNA recombinante compreendendo o DNA guia correspondente operacionalmente ligado a um promotor U6 da polimerase III vegetal.
[0102] Em um exemplo de realização, o RNA que guia o complexo RNA/endonuclease Cas9, é um RNA em duplexo compreendendo um duplexo crRNA-tracrRNA (conforme exibido na Figura 2B). Uma vantagem de utilizar um RNA guia versus um duplexo crRNA-tracrRNA é que apenas um cassete de expressão precisa ser produzido para expressar o RNA guia fundido.
[0103] Os termos “sítio alvo”, “sequência alvo”, “DNA alvo”, “locus alvo”, “sítio alvo genômico”, “sequência alvo genômica”, e “locus alvo genômico” são utilizados de forma indiferente e referem-se a uma sequência polinucleotídica no genoma (incluindo DNA cloroplástico e DNA mitocondrial) de uma célula vegetal em que uma quebra de dupla fita é induzida no genoma da célula vegetal por uma endonuclease Cas. O sítio alvo pode ser um local endógeno no genoma da planta, ou, alternativamente, o sítio alvo pode ser heterólogo em relação à planta e, portanto, não ocorre naturalmente no genoma, ou o sítio alvo pode ser encontrado em um local genômico heterólogo em relação ao de ocorrência natural. Conforme utilizado no presente, os termos “sequência alvo endógena” e “sequência alvo nativa” são utilizados de forma alternada para se referirem a uma sequência alvo que é endógena ou nativa em relação ao genoma de uma planta e está na posição endógena ou nativa dessa sequência alvo no genoma da planta.
[0104] Em um exemplo de realização, o sítio alvo pode ser semelhante a um local de reconhecimento do DNA ou sítio alvo que é especificamente reconhecido e/ou ligado por um agente indutor da quebra de dupla fita, tal como uma endonuclease LIG3-4 (publicação da patente US 20090133152 A1 (publicada em 21 de maio de 2009) ou uma meganuclease MS26++ (pedido de patente US 13/526912 depositado em 19 de junho de 2012).
[0105] Um “sítio alvo artificial” ou “sequência alvo artificial” são termos utilizados de modo alternado e referem-se a uma sequência alvo que foi introduzida no genoma de uma planta. Tal sequência alvo artificial pode ser idêntica na sequência com uma sequência alvo endógena ou nativa no genoma de uma planta, mas situa-se em uma posição diferente (ou seja, uma posição não endógena ou não nativa) no genoma da planta.
[0106] Os termos “sítio alvo alterado”, “sequência alvo alterada”, “sítio alvo modificado”, “sequência alvo modificada” são utilizados de modo alternado na presente divulgação e referem-se a uma sequência alvo, tal como descrito na presente divulgação e compreende pelo menos uma alteração quando comparada com uma sequência alvo não alterada. Tais “alterações” incluem, por exemplo: (i) substituição de pelo menos um nucleotídeo, (ii) deleção de pelo menos um nucleotídeo, (iii) inserção de pelo menos um nucleotídeo, ou (iv) qualquer combinação de (i) - (iii).
[0107] São divulgados métodos para a modificação de um sítio alvo genômico vegetal.
[0108] Em um exemplo de realização, um método para a modificação de um sítio alvo no genoma de uma célula vegetal compreende a introdução de um RNA guia em uma célula vegetal que possui uma endonuclease Cas, em que o RNA guia e a endonuclease CAS são capazes de formar um complexo que permite que a endonuclease Cas introduza uma quebra de dupla fita no referido sítio alvo.
[0109] Também é fornecido um método para a modificação de um sítio-alvo no genoma de uma célula vegetal, cujo método compreende a introdução de um RNA guia e uma endonuclease Cas em uma referida planta, em que o referido RNA guia e a endonuclease Cas são capazes de formar um complexo que permite que a endonuclease Cas introduza uma quebra de dupla fita no referido sítio-alvo.
[0110] Também é fornecido um método para a modificação de um sítio-alvo no genoma de uma célula vegetal, cujo método compreende a introdução de um RNA guia e um DNA doador em uma célula vegetal possuindo uma endonuclease Cas, em que o referido RNA guia e a endonuclease Cas são capazes de formar um complexo que permite que a endonuclease Cas introduza uma quebra de dupla fita no referido sítio-alvo, e em que o referido DNA doador compreende um polinucleotídeo de interesse.
[0111] Também é fornecido um método para a modificação de um sítio-alvo no genoma de uma célula vegetal, compreendendo: a) a introdução em uma célula vegetal de um RNA guia que compreende um domínio de direcionamento variável e uma endonuclease Cas, em que o referido RNA guia e endonuclease Cas são capazes de formar um complexo que permite que a endonuclease Cas introduza uma quebra de dupla fita no referido sítio alvo, e; b) a identificação de pelo menos uma célula vegetal que tem uma alteração no referido alvo, em que a modificação inclui pelo menos uma deleção ou substituição de um ou mais nucleotídeos no referido sítio alvo. Também é fornecido um método para a modificação de uma sequência e DNA alvo no genoma de uma célula vegetal, cujo método compreende: a) introdução em uma célula vegetal de uma primeira construção de DNA recombinante capaz de expressar um RNA guia e uma segunda construção de DNA recombinante capaz de expressar uma endonuclease Cas, em que o referido RNA guia e endonuclease Cas são capazes de formar um complexo que permite que a endonuclease Cas introduza uma quebra de dupla fita no referido sítio alvo, e; b) a identificação de pelo menos uma célula vegetal que tem uma alteração no referido alvo, em que a modificação inclui pelo menos uma deleção ou substituição de um ou mais nucleotídeos no referido sítio alvo.
[0112] O comprimento do sítio alvo pode variar, e inclui, por exemplo, sítios-alvo que são de, pelo menos, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30 ou mais nucleotídeos de comprimento. É ainda possível que o sítio alvo possa ser palindrômico, ou seja, a sequência de uma fita tem a mesma leitura no sentido oposto da fita complementar. O sítio corte/clivagem pode estar dentro da sequência alvo ou o sítio de corte/clivagem pode estar fora de sequência alvo. Em outra variação, a clivagem pode ocorrer nas posições de nucleotídeo imediatamente oposta entre si para produzir um corte de extremidade abrupta ou cega (blunt), em outros casos, os cortes podem ser escalonados para produzir saliências (overhangs) em fita simples, também chamadas de “extremidades coesivas (sticky ends)”, que podem ser saliências tanto 5' como 3'.
[0113] Em alguns exemplos de realização, o sítio alvo genômico capaz de ser clivado por uma endonuclease Cas compreende um fragmento de 12 a 30 nucleotídeos de um gene de fertilidade masculina, tal como MS26 (vide, por exemplo, as Patentes US 7.098.388, US 7.517.975, US 7.612.251), MS45 (vide, por exemplo, as patentes US 5.478.369, US 6.265.640) ou MSCA1 (vide, por exemplo, a patente US 7.919.676), genes ALS ou ESP.
[0114] Variantes ativas de sítios-alvo genômicos também podem ser utilizadas. Tais variantes ativas podem compreender pelo menos 65%, 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% ou mais de identidade de sequência com o determinado sítio-alvo, em que as variantes ativas retêm atividade biológica e são, consequentemente, capazes de ser reconhecidas e clivadas por uma endonuclease Cas. Os ensaios para mensurar a quebra de dupla fita de um sítio alvo de uma endonuclease são conhecidos no estado da técnica e, geralmente, medem a atividade global e a especificidade do agente sobre substratos de DNA contendo sítios de reconhecimento.
[0115] Vários métodos e composições podem ser empregados para se obter uma planta com um polinucleotídeo de interesse inserido em um sítio alvo por uma endonuclease Cas. Tais métodos podem empregar a recombinação homóloga para proporcionar a integração do polinucleotídeo de interesse no sítio alvo. Em um método fornecido, é fornecido um polinucleotídeo de interesse para a célula vegetal em uma construção de DNA doador. Conforme utilizado na presente divulgação, “DNA doador” é uma construção de DNA que compreende um polinucleotídeo de interesse a ser inserido no sítio-alvo de uma endonuclease Cas. A construção de DNA doadora compreende ainda uma primeira e uma segunda região de homologia que flanqueiam o polinucleotídeo de interesse. A primeira e segunda região de homologia do DNA doador compartilha homologia com uma primeira e segunda região genômica, respectivamente, presentes no interior ou flanqueando o sítio alvo do genoma vegetal. Por “homologia” entende-se sequências de DNA que são similares. Por exemplo, uma “região de homologia com uma região genômica”, que é encontrada no DNA doador é uma região de DNA que tem uma sequência semelhante a uma determinada “região genômica” no genoma da planta. Uma região de homologia pode ser de qualquer comprimento desde que seja suficiente para promover a recombinação homóloga no sítio alvo clivado. Por exemplo, a região de homologia pode compreender, pelo menos, 5-10, 5-15, 5-20, 5-25, 5-30, 5-35, 5-40, 5-45, 5- 50, 5-55, 5-60, 5-65, 5- 70, 575, 5-80, 5-85, 5-90, 5-95, 5-100, 5-200, 5-300, 5-400, 5-500, 5-600, 5-700, 5800, 5-900, 5-1000, 5-1100, 5-1200, 5-1300, 5-1400, 5-1500, 5-1600, 5-1700, 5-1800, 5-1900, 5-2000, 5-2100, 5-2200, 5-2300, 5-2400, 5-2500, 5-2600, 52700, 5-2800, 5-2900, 5-3000, 5-3100 ou mais bases de comprimento de modo que a região de homologia tenha homologia suficiente para submeter à recombinação homóloga com a região genômica correspondente. “Homologia suficiente” significa que duas sequências de polinucleotídeos têm semelhanças estruturais suficientes para atuarem como substratos para uma reação de recombinação homóloga. A semelhança estrutural inclui comprimento total de cada fragmento de polinucleotídeo, assim como a similaridade das sequências dos polinucleotídeos. A similaridade das sequências pode ser descrita pela percentagem de identidade de sequência ao longo de todo o comprimento das sequências, e/ou por regiões conservadas compreendendo similaridades localizadas, como nucleotídeos contíguos que têm 100% de identidade de sequência, e a percentagem de identidade de sequência sobre uma parte do comprimento das sequências.
[0116] A quantidade de homologia ou identidade de sequência compartilhada por um alvo e um polinucleotídeo doador pode variar e inclui comprimentos totais e/ou regiões com valores integrais de unidades em intervalos de cerca de 1-20 bp, 20-50 bp, 50-100 bp, 75-150 bp, 100-250 bp, 150-300 bp, 200-400 bp, 250-500 bp, 300-600 bp, 350-750 bp, 400-800 bp, 450-900 bp, 500-1000 bp, 600-1250 bp, 700-1500 bp, 800-1750 bp, 900-2000 bp, 1-2.5 kb, 1.5-3 kb, 2-4 kb, 2.5-5 kb, 3-6 kb, 3.5-7 kb, 4-8 kb, 5-10 kb, ou até a inclusão do comprimento total do sítio alvo. Estas faixas incluem cada número inteiro dentro do intervalo, por exemplo, na faixa de 1-20 bp inclui 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19 e 20 bp. A quantidade de homologia também pode ser descrita como a percentagem de identidade de sequência ao longo do comprimento alinhado completo dos dois polinucleotídeos que inclui a a percentagem de identidade de sequência de cerca de, pelo menos, 50%, 55%, 60%, 65%, 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% ou 100%. Homologia suficiente inclui qualquer combinação de comprimento de polinucleotídeo, percentagem de identidade de sequência global, e opcionalmente regiões conservadas dos nucleotídeos contíguos ou percentagem identidade de sequência local, por exemplo, homologia suficiente pode ser descrita como uma região de 75-150 bp, possuindo pelo menos 80% de identidade de sequência a uma região do locus alvo. Homologia suficiente também pode ser descrita pela capacidade prevista de dois polinucleotídeos de hibridizarem especificamente sob condições de elevada estringência, vide, por exemplo, Sambrook et al., (1989) Molecular Cloning: A Laboratory Manual, (Cold Spring Harbor Laboratory Press, NY); Current Protocols in Molecular Biology, Ausubel et al., Eds (1994) Current Protocols, (Greene Publishing Associates, Inc. e John Wiley & Sons, Inc); e, Tijssen (1993) Laboratory Techniques in Biochemistry and Molecular Biology--Hybridization with Nucleic Acid Probes, (Elsevier, Nova Iorque).
[0117] Conforme utilizado no presente, uma “região genômica” é um segmento de um cromossomo no genoma de uma célula vegetal que está presente em ambos os lados do sítio alvo ou, alternativamente, também compreende uma parte do sítio alvo. A região genômica pode compreender pelo menos 5-10, 5-15, 5-20, 5-25, 5-30, 5-35, 5-40, 5-45, 5- 50, 5-55, 5-60, 565, 5- 70, 5-75, 5-80, 5-85, 5-90, 5-95, 5-100, 5-200, 5-300, 5-400, 5-500, 5600, 5-700, 5-800, 5-900, 5-1000, 5-1100, 5-1200, 5-1300, 5-1400, 5-1500, 51600, 5-1700, 5-1800, 5-1900, 5-2000, 5-2100, 5-2200, 5-2300, 5-2400, 5- 2500, 5-2600, 5-2700, 5-2800, 5-2900, 5-3000, 5-3100 ou mais bases de modo que a região genômica tenha homologia suficiente para se submeter à recombinação homóloga com a região correspondente de homologia.
[0118] Os polinucleotídeos de interesse e/ou características podem ser piramidadas em conjunto em um locus de característica complexa conforme descrito no Pedido US-2013-0263324-A1 publicado em 03 de outubro de 2013 e PCT/US13/22891 publicado em 24 de janeiro de 2013, sendo ambos os pedidos incorporados ao presente pela referência. O sistema polinucleotídeo guia/endonuclease Cas9 descrito no presente provê um sistema eficiente para gerar quebra de dupla fita e permite que traços ou características sejam piramidados em um locus de característica complexa.
[0119] Em um exemplo de realização, o sistema polinucleotídeo guia/endonuclease Cas é utilizado para a introdução de um ou mais polinucleotídeos de interesse ou uma ou mais características de interesse em um ou mais sítios-alvo, pelo fornecimento de um ou mais polinucleotídeos guia, endonuclease Cas, e opcionalmente um ou mais DNAs doadores para uma célula vegetal. Uma planta fértil pode ser produzida a parti da célula vegetal que compreende uma alteração nos referidos um ou mais sítios-alvo, em que a alteração é selecionada a partir do grupo que consiste de (i) substituição de pelo menos um nucleotídeo, (ii) deleção de pelo menos um nucleotídeo, (iii) inserção de pelo menos um nucleotídeo, e (iv) qualquer combinação de (i) - (iii). As plantas que compreendem estes sítios-alvo alterados podem ser cruzadas com plantas que compreendem pelo menos um gene ou característica de interesse no mesmo locus da característica complexa, e dessa forma promovendo ainda mais a piramidação de características no referido locus de características complexa. (vide também o pedido US-2013-0.263.324-A1, publicado em 3 de outubro de 2013 e PCT/US13/22891 publicado em 24 de janeiro de 2013).
[0120] Em um exemplo de realização, o método compreende um método para a produção em uma planta de um locus de característica complexa que compreende pelo menos duas sequências alvo alteradas em uma região genômica de interesse, em que o referido método compreende: (a) a seleção de uma região genômica em uma planta, em que a região genômica que compreende uma primeira sequência alvo e uma segunda sequência alvo; (B) o contato de pelo menos uma célula vegetal com pelo menos um primeiro polinucleotídeo guia, um segundo polinucleotídeo guia, e, opcionalmente, pelo menos um DNA doador, e uma endonuclease Cas, em que o primeiro e segundo polinucleotídeos-guia e a endonuclease Cas podem formar um complexo que permite que a endonuclease Cas introduza uma quebra de dupla fita em pelo menos uma primeira e uma segunda sequência alvo; (C) a identificação de uma célula a partir de (b) que compreende uma primeira alteração na primeira sequência alvo e uma segunda alteração na segunda sequência alvo; e (d) a recuperação de uma primeira planta fértil a partir da célula de (c), em que referida planta fértil compreende a primeira alteração e a segunda alteração, em que a primeira alteração e a segunda alteração estão fisicamente ligadas.
[0121] Em um exemplo de realização, o método compreende um método para a produção em uma planta de um locus de característica complexa que compreende pelo menos duas sequências alvo alteradas em uma região genômica de interesse, em que o referido método compreende: (a) seleção de uma região genômica em uma planta, em que a região genômica compreende uma primeira sequência alvo e uma segunda sequência alvo; (b) o contato de pelo menos uma célula vegetal com um primeiro polinucleotídeo guia, uma endonuclease Cas, e, opcionalmente, um primeiro DNA doador, em que o primeiro polinucleotídeo guia e a endonuclease Cas podem formar um complexo que permite que a endonuclease Cas introduza uma quebra de dupla fita na primeira sequência alvo; (c) a identificação de uma célula a partir de (b) que compreende uma primeira alteração na primeira sequência alvo; (d) a recuperação de uma primeira planta fértil a partir da célula de (c), em que a referida primeira planta fértil compreende a primeira alteração; (e) o contato de pelo menos uma célula vegetal com um segundo polinucleotídeo guia, uma endonuclease Cas e, opcionalmente, um segundo DNA Doador; (f) a identificação de uma célula a partir de (e) compreendendo uma segunda alteração na segunda sequência alvo; (g) a recuperação de uma segunda planta fértil a partir da célula de (f), em que a referida segunda planta fértil compreende a segunda alteração; e, (h) a obtenção de uma progênie vegetal fértil a partir da segunda planta fértil de (g), em que a referida progênie vegetal fértil compreende a primeira alteração e a segunda alteração, e em que a primeira alteração e a segunda alteração estão fisicamente ligadas.
[0122] A semelhança estrutural entre uma determinada região genômica e a região de homologia correspondente encontrada no DNA doador pode ser de qualquer grau de identidade de sequência que permita a ocorrência da recombinação homóloga. Por exemplo, a quantidade de homologia ou identidade de sequência partilhada pela “região de homologia” do DNA doador e a “região genômica” do genoma vegetal pode ser de, pelo menos, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% ou 100% de identidade de sequência, de tal modo que as sequências sofrem recombinação homóloga.
[0123] A região de homologia do DNA doador pode ter qualquer homologia com a sequência que flanqueia o sítio alvo. Embora em alguns exemplos de realização as regiões de homologia partilham homologia de sequência significativa com a sequência genômica flanqueando imediatamente o sítio alvo, reconhece-se que as regiões de homologia podem ser concebidas para ter homologia suficiente com as regiões que podem estar mais a 5' ou 3' do sítio alvo. Ainda em outros exemplos de realização, as regiões de homologia também podem ter homologia com um fragmento do sítio alvo, juntamente com regiões genômicas a jusante. Em um exemplo de realização, a primeira região de homologia compreende ainda um primeiro fragmento do sítio alvo e a segunda região de homologia compreende um segundo fragmento do sítio alvo, em que o primeiro e o segundo fragmentos são distintos.
[0124] Conforme utilizado na presente divulgação, “recombinação homóloga” inclui a troca de fragmentos de DNA entre duas moléculas de DNA nos sítios de homologia. A frequência de recombinação homóloga é influenciada por diversos fatores. Diferentes organismos variam no que diz respeito à quantidade de recombinação homóloga e a proporção relativa de recombinação homóloga para não homóloga. De modo geral, o comprimento da região de homologia afeta a frequência de acontecimentos de eventos de recombinação homóloga: quanto maior o comprimento da região de homologia, maior é a frequência. O comprimento da região de homologia necessário para observar a recombinação homóloga é também variável de acordo com a espécie. Em muitos casos, tem sido utilizada pelo menos 5 kb de homologia, mas a recombinação homóloga tem sido observada em tamanhos tão pequenos quanto 25-50 bp de homologia. Vide, por exemplo, Singer et al., (1982) Cell 31:25-33; Shen e Huang, (1986) Genetics 112:441-57; Watt et al., (1985) Proc. Natl. Acad. Sci. USA 82:4768-72, Sugawara e Haber, (1992) Mol Cell Biol 12:563-75, Rubnitz e Subramani, (1984) Mol Cell Biol 4:2253-8; Ayares et al., (1986) Proc. Natl. Acad. Sci. USA 83:5199-203; Liskay et al., (1987) Genetics 115:161-7.
[0125] Reparação dirigida homologia (HDR) é um mecanismo em células para reparar quebras de DNA de dupla fita e fita simples. A reparação dirigida por homologia inclui recombinação homóloga (HR) e anelamento de fita simples (SSA) (Lieber. 2010 Annu. Rev. Biochem. 79:181-211). A forma mais comum de HDR é chamada de recombinação homóloga (HR), que tem requisitos de homologia de sequência mais longos entre o DNA doador e aceptor. Outras formas de HDR incluem anelamento de fita simples (SSA) e replicação induzida por quebra, e estes necessitam de sequência de homologia mais curta em relação à HR. A reparação dirigida por homologia nos cortes (nicks - quebras de fita simples) pode ocorrer através de um mecanismo distinto da HDR nas quebras de dupla fita (Davis e Maizels. PNAS (0027-8424), 111 (10), p. E924-E932.
[0126] A alteração do genoma de uma célula vegetal, por exemplo, através da recombinação homóloga (HR), é uma ferramenta poderosa para a engenharia genética. Apesar da baixa frequência de recombinação homóloga nas plantas superiores, existem alguns exemplos bem-sucedidos de recombinação homóloga de genes endógenos de plantas. Os parâmetros para a recombinação homóloga nas plantas têm sido principalmente investigados pelo resgate de genes marcadores selecionáveis truncados introduzidos. Nestes experimentos, os fragmentos de DNA homólogos estavam tipicamente entre 0,3 kb a 2 kb. As frequências observadas para recombinação homóloga eram da ordem de 10-4 a 10-5. Vide, por exemplo, Halfter et al., (1992) Mol Gen Genet 231:186-93; Offringa et al., (1990) EMBO J 9:3077-84; Offringa et al., (1993) Proc. Natl. Acad. Sci. USA 90:7346-50; Paszkowski et al., (1988) EMBO J 7:4021-6; Hourda e Paszkowski, (1994) Mol Gen Genet 243:106-11; e Risseeuw et al., (1995) Plant J 7:109-19.
[0127] A recombinação homóloga foi demonstrada em insetos. Em Drosophila, Dray e Gloor descobriram que menos de 3 kb de molde total: homologia alvo é suficiente para copiar um grande segmento não homólogo de DNA no alvo com razoável eficiência (Dray e Gloor, (1997) Genetics 147: 68999). Utilizando a integração de DNA mediada por FLP em um FRT alvo em Drosophila, Golic et al., demonstraram que a integração era aproximadamente 10 vezes mais eficiente quando o doador e o alvo compartilhavam 4,1 kb de homologia em comparação com 1,1 kb de homologia (Golic et al., (1997) Nucleic Acids Res 25: 3665). Dados a partir da Drosophila indicam que 2-4 kb de homologia é suficiente para direcionamento eficiente, mas existem algumas evidências que muito menos homologia pode ser suficiente, na ordem de cerca de 30 bp até cerca de 100 bp (Nassif e Engels, (1993) Proc. Natl. Acad. Sci. USA 90: 1262-6; Keeler e Gloor, (1997) Mol Cell Biol 17: 627-34).
[0128] A recombinação homóloga também foi realizada em outros organismos. Por exemplo, foi necessário pelo menos 150-200 bp de homologia para a recombinação homóloga no protozoário parasita Leishmania (Papadopoulou e Dumas, (1997) Nucleic Acids Res 25: 4278-86). Nos fungos filamentosos Aspergillus nidulans, a substituição de gene foi realizada com menos de 50 bp de homologia de flanqueamento (Chaveroche et al, (2000) Nucleic Acids Res. 28: E97). A substituição do gene alvo também foi demonstrada no ciliado Tetrahymena thermophila (Gaertig et al, (1994) Nucleic Acids Res. 22: 5391-8). Nos mamíferos, a recombinação homóloga foi mais bem-sucedida em camundongo usando linhagens de células-tronco embrionárias (ES) pluripotentes que podem crescer em cultura, serem transformadas, selecionadas e introduzidas em um embrião de camundongo. Embriões portadores de células ES transgênicas desenvolvem descendentes geneticamente. Pelo cruzamento entre irmãos podem ser obtidos camundongo homozigóticos que portam os genes selecionados. Uma visão geral do processo é fornecida em Watson et al., (1992) Recombinant DNA, 2a Ed., (Scientific American Books, distribuído por WH Freeman & Co.); Capecchi, (1989) Trends Genet 5:70-6; e Bronson, (1994) J Biol Chem 269:27155-8. A recombinação homóloga em outros mamíferos além do camundongo tem sido limitada pela falta de células tronco capazes de serem transplantadas para oócitos ou embriões em desenvolvimento. Entretanto, McCreath et al, Nature 405:1066-9 (2000) relataram a recombinação homóloga bem-sucedida em ovelhas pela transformação e seleção em células de fibroblastos de embrião primário.
[0129] Os mecanismos de reparo do DNA sujeito erros podem produzir mutações nos sítios de quebra de dupla fita. As vias da junção de extremidades não homólogas (NHEJ) são o mecanismo de reparo mais comum para unir as extremidades (Bleuyard et al, (2006) DNA Repair. 5: 1-12). A integridade estrutural dos cromossomos é tipicamente conservada pela reparação, mas deleções, inserções ou outros rearranjos são possíveis. As duas extremidades de uma quebra de dupla fita são os substratos mais prevalentes da NHEJ (Kirik et al, (2000) EMBO J. 19: 5562-6), no entanto, se duas quebra de dupla fita diferentes ocorrerem, as extremidades livres de diferentes quebras podem ser ligadas e resultam em deleções cromossômicas (Siebert e Puchta, (2002) Plant Cell 14:1121-1131), ou translocações cromossômicas entre diferentes cromossomos (Pacher et al, (2007) Genetics 175: 21-9).
[0130] Moléculas de DNA epissomal também podem ser ligadas na quebra de dupla fita, por exemplo, integração de T-DNAs em quebras de dupla fita cromossômicas (Chilton e Que, (2003) Plant Physiol 133: 956-65; Salomon e Puchta, (1998) EMBO J 17: 6086-95). Uma vez que a sequência em torno das quebras de dupla fita é alterada, por exemplo, pelas atividades de exonuclease envolvidas na maturação de quebras de dupla fita, as vias de conversão de genes podem restaurar a estrutura original, se uma sequência homóloga está disponível, tal como um cromossomo homólogo em células somáticas que não estão em divisão, ou uma cromátide irmã após a replicação do DNA (Molinier et al, (2004) Plant Cell 16: 342-52). As sequências de DNA ectópica e/ou epigenética também pode servir como um modelo de reparação de DNA por recombinação homóloga (Puchta, (1999) Genetics 152: 11731181).
[0131] Uma vez que uma ruptura de fita dupla é induzida no DNA, o mecanismo de reparo do DNA da célula é ativado para reparar a ruptura. Os mecanismos de reparo do DNA sujeito erros podem produzir mutações nos sítios de quebra de dupla fita. O mecanismo de reparo mais comum para unir as extremidades é a via da junção de extremidades não homóloga (NHEJ) (Bleuyard et al, (2006) DNA Repair. 5: 1-12). A integridade estrutural dos cromossomos é tipicamente conservada pela reparação, mas deleções, inserções, ou outros rearranjos são possíveis (Siebert e Puchta, (2002) Plant Cell 14:1121-1131; Pacher et al, (2007) Genetics 175: 21 -9).
[0132] Alternativamente, a quebra de dupla fita pode ser reparada pela recombinação homóloga entre sequências de DNA homólogas. Uma vez que a sequência em torno da quebra de dupla fita é alterada, por exemplo, pelas atividades de exonuclease envolvidas na maturação de quebras de dupla fita, as vias de conversão de genes podem restaurar a estrutura original, se uma sequência homóloga está disponível, tal como um cromossomo homólogo em células somáticas que não estão em divisão, ou uma cromátide irmã após a replicação do DNA (Molinier et al, (2004) Plant Cell 16: 342-52). As sequências de DNA ectópica e/ou epigenética também pode servir como um modelo de reparação de DNA por recombinação homóloga (Puchta, (1999) Genetics 152: 1173-1181).
[0133] As quebras de dupla fita de DNA parecem ser um fator eficaz para estimular as vias de recombinação homóloga (Puchta et al, (1995) Plant Mol Biol 28: 281-92; Tzfira e White, (2005) Trends Biotechnol 23: 567-9; Puchta, (2005) J Exp Bot 56: 1-14). Utilizando agentes de quebra de DNA, foi observado um aumento de duas a nove vezes da recombinação homóloga entre as repetições de DNA homólogas artificialmente construídas em plantas (Puchta et al, (1995) Plant Mol Biol. 28: 281-92). Em protoplastos de milho, experimentos com moléculas de DNA linear demonstraram recombinação homóloga melhorada entre plasmídeos (Lyznik et al, (1991) Mol Gen Genet 230: 209-18).
[0134] Em um exemplo de realização provido na presente divulgação, o método compreende o contato de uma célula vegetal com o DNA doador e a endonuclease. Uma vez que uma quebra de dupla fita é introduzida no sítio alvo pela endonuclease, a primeira e segunda regiões de homologia do DNA doador podem sofrer recombinação homóloga com as suas regiões genômicas de homologia correspondentes resultando na troca de DNA entre o doador e o genoma. Dessa forma, os métodos fornecidos resultam na integração do polinucleotídeo de interesse do DNA doador na quebra de dupla fita do sítio alvo no genoma da planta, alterando, assim, o sítio alvo original e produzindo um sítio alvo genômico alterado.
[0135] O DNA doador pode ser introduzido por quaisquer meios conhecidos no estado da técnica. Por exemplo, é fornecida uma planta possuindo um sítio alvo. O DNA doador pode ser fornecido por qualquer método de transformação conhecido no estado da técnica, incluindo, por exemplo, a transformação mediada por Agrobacterium ou bombardeamento de partículas por biolística. O DNA doador pode estar presente de maneira transitória na célula ou pode ser introduzido por um replicon viral. Na presença da endonuclease Cas e do sítio alvo, o DNA doador é inserido no genoma da planta transformada.
[0136] Outra abordagem usa a modificação de proteínas de endonucleases de homing existentes para alterar as especificidades destas ao alvo. As endonucleases de homing, como a I-SceI ou I-CreI, ligam-se e unem- se às sequências de reconhecimento de DNA relativamente longas (18 bp e 22 bp, respectivamente). Estas sequências estão previstas para raramente ocorrem de forma natural em um genoma, tipicamente apenas 1 ou 2 sítios/genoma. A especificidade de clivagem de uma endonuclease de homing pode ser alterada pelo desenho racional de substituições de aminoácidos no domínio de ligação ao DNA e/ou montagem combinatória e seleção de monômeros mutados (vide, por exemplo, Arnould et al., (2006) J Mol Biol 355:443-58; Ashworth et al., (2006) Nature 441:656-9; Doyon et al., (2006) J Am Chem Soc 128:2477-84; Rosen et al., (2006) Nucleic Acids Res 34:4791800; e Smith et al., (2006) Nucleic Acids Res 34:e149; Lyznik et al., (2009) Pedido de Patente US 20090133152A1; Smith et al., (2007) Pedido de Patente US 20070117128A1). Foi demonstrado que meganucleases modificadas podem clivar sítios mutantes cognatos sem alargar suas especificidades. Um sítio de reconhecimento artificial específico para a nuclease de homing I-SceI tipo selvagem de levedura foi introduzido no genoma de milho e mutações da sequência de reconhecimento foram detectadas em 1% das plantas F1 analisadas quando um I-Scel transgênico foi introduzido por cruzamento e ativado pela excisão do gene (Yang et al, (2009) Plant Mol Biol 70:669-79). Mais praticamente, o locus liguleless de milho foi usado como alvo usando uma endonuclease de fita simples tecnicamente desenhada com base na sequência da meganuclease I-CreI. As mutações da sequência de reconhecimento do locus liguleless selecionada foram detectadas em 3% das plantas transgênicas T0 quando a nuclease de homing desenvolvida foi introduzida pela transformação mediada por Agrobacterium de embriões imaturos (Gao, et al., (2010) Plant J. 61: 176-87).
[0137] Polinucleotídeo de interesse são adicionalmente descritos na presente divulgação e são reflexo dos mercados comerciais e interesses daqueles envolvidos no desenvolvimento da cultura. As culturas e mercados de interesse mudam, e com a abertura aos mercados mundiais de nações em desenvolvimento, novas culturas e tecnologias também surgem. Além disso, na nossa compreensão de características e traços agronômicos, tais como o aumento de rendimento e heterose, a escolha de genes para modificação genética irá mudar em conformidade.
EDIÇÃO DO GENOMA USANDO O SISTEMA RNA GUIA/ENDONUCLEASE CAS
[0138] Tal como descrito na presente divulgação, o sistema RNA guia/endonuclease Cas pode ser utilizado em combinação com um molde de modificação de polinucleotídeo coentregue para permitir a edição de uma sequência de nucleotídeo genômica de interesse. Além disso, conforme descrito na presente divulgação, para cada exemplo de realização que utiliza um sistema RNA guia/endonuclease Cas, um sistema semelhante de polinucleotídeo guia/endonuclease Cas pode ser implantado, onde o polinucleotídeo guia não compreende unicamente ácidos ribonucleicos, mas compreende uma combinação de moléculas de RNA-DNA ou compreende unicamente moléculas de DNA.
[0139] Embora existam numerosos sistemas para a produção de quebras de dupla fita, as aplicações práticas destes sistemas para a edição gênica podem ser restringidas devido à frequência relativamente baixa das quebras de dupla fita (DSBs) induzidas. Até à data, muitos métodos de modificação do genoma contam com o sistema de recombinação homóloga. A recombinação homóloga (HR) pode proporcionar meios moleculares para encontrar sequências de DNA genômicos de interesse e modificá-los de acordo com as especificações experimentais. A recombinação homóloga ocorre em baixa frequência nas células somáticas vegetais. O processo pode ser aumentado para um nível prático pela engenharia do genoma por meio de introdução de quebras de dupla fita (DSBs) nos sítios-alvo das endonuclease selecionadas. O desafio foi produzir eficientemente DSBs em sítios genômicos de interesse uma vez que existe um viés na direcionalidade da transferência de informação entre duas moléculas de DNA que interagem (uma quebra atua como um receptor de informação genética). Descreve-se na presente divulgação o uso de um sistema de RNA guia/Cas que fornece uma clivagem no genoma flexível com especificidade e resulta em uma quebra de dupla fita de alta frequência em um sítio-alvo do DNA, permitindo assim a edição gênica eficiente em uma sequência de nucleotídeos de interesse, em que a sequência nucleotídica de interesse a ser editada pode estar localizada dentro ou fora do sítio alvo reconhecido e clivado por uma endonuclease Cas.
[0140] Um “nucleotídeo modificado” ou “nucleotídeo editado” refere-se a uma sequência de nucleotídeos de interesse que compreende pelo menos uma alteração quando comparada com a sua sequência nucleotídica não modificada. Tais “alterações” incluem, por exemplo: (i) substituição de pelo menos um nucleotídeo, (ii) deleção de pelo menos um nucleotídeo, (iii) inserção de pelo menos um nucleotídeo, ou (iv) qualquer combinação de (i) - (iii).
[0141] O termo “molde de modificação de polinucleotídeo” inclui um polinucleotídeo que compreende pelo menos uma modificação de nucleotídeos quando comparada com a sequência de nucleotídeos a ser editada. Uma modificação de nucleotídeos pode ser pelo menos uma substituição, adição ou deleção de nucleotídeos. Opcionalmente, o molde de modificação de polinucleotídeo pode compreender ainda sequências de nucleotídeos homólogas que flanqueiam pelo menos uma modificação de nucleotídeos, em que as sequências de nucleotídeos homólogas que flanqueiam fornecem homologia suficiente com a sequência de nucleotídeos que se desejada editar.
[0142] Em um exemplo de realização, a divulgação descreve um método para a edição de uma sequência de nucleotídeos no genoma de uma célula, cujo método compreende o fornecimento de um RNA guia, um molde de modificação de polinucleotídeo, e pelo menos uma endonuclease de Cas para uma célula, em que a endonuclease Cas é capaz introduzir uma quebra de dupla fita em uma sequência alvo no genoma da referida célula, e em que o referido molde de modificação de polinucleotídeo inclui pelo menos uma modificação nucleotídica da referida sequência de nucleotídeos. As células incluem, mas não se limitam as células humanas, de animais, bacterianas, fúngicas, de insetos, e bem como células vegetais e sementes produzidas pelos métodos descritos na presente divulgação. O nucleotídeo a ser editado pode estar localizado dentro ou fora de um sítio alvo reconhecido e clivado por uma endonuclease Cas. Em um exemplo de realização, pelo menos uma modificação de nucleotídeos não é uma modificação em um sítio alvo reconhecido e clivada por uma endonuclease Cas. Em outro exemplo de realização existem, pelo menos, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 30, 40, 50, 100, 200, 300, 400, 500, 600, 700, 900 ou 1000 nucleotídeos entre o pelo menos um nucleotídeo a ser editado e o sítio alvo genômico.
[0143] Em outro exemplo de realização, a divulgação descreve um método para a edição de uma sequência de nucleotídeos no genoma de uma célula vegetal, cujo método compreende o fornecimento de um RNA de guia, um molde de modificação de polinucleotídeo, e, pelo menos, uma endonuclease Cas9 milho-otimizada para uma célula vegetal, em que a endonuclease Cas9 milho-otimizada é capaz de fornecer uma quebra de dupla fita em uma sequência alvo da endonuclease moCas9 no genoma da planta, em que o referido molde de modificação de polinucleotídeo inclui a modificação de pelo menos um nucleotídeo da referida sequência de nucleotídeos.
[0144] Em outro exemplo de realização, a divulgação descreve um método para a edição de uma sequência de nucleotídeos no genoma de uma célula, cujo método compreende o fornecimento para uma célula de um RNA guia, um molde de modificação de polinucleotídeo e pelo menos uma endonuclease Cas, em que o referido RNA guia e a endonuclease Cas são capazes de formar um complexo que permite que a endonuclease Cas introduza uma quebra de dupla fita em um sítio-alvo, e em que o referido molde de modificação de polinucleotídeo compreende pelo menos uma modificação de nucleotídeo da referida sequência de nucleotídeos.
[0145] Em outro exemplo de realização da edição do genoma, é divulgada a edição do gene enolpiruvilchiquimato-3-fosfato sintase (EPSPS) endógeno (Exemplo 16). Neste exemplo de realização, o molde de modificação de polinucleotídeo (molde de modificação de polinucleotídeo EPSPS) inclui um fragmento parcial do gene EPSPS (e, portanto, não codifica um polipeptídeo PEPSPS totalmente funcional sozinho). O molde de modificação polinucleotídeo EPSPS continha três mutações pontuais que foram responsáveis pela criação do mutante duplo T102I/P106S (TIPS) (Funke, T et al., J. Biol. Chem. 2009, 284: 9854-9860), que fornece tolerância ao glifosato em plantas transgênicas expressando EPSPS como transgene mutante duplo.
[0146] Conforme definido na presente divulgação, “glifosato” inclui qualquer forma eficaz de herbicida N-fosfonometilglicina (incluindo qualquer sal do mesmo), outras formas que resultam na produção do ânion glifosato em plantas e quaisquer outros herbicidas da família das fosfonometilglicinas.
[0147] Em um exemplo de realização da divulgação, uma planta epsps mutante é produzida pelo método aqui descrito, em que o referido método compreende: a) o fornecimento de um RNA guia, um molde de modificação de polinucleotídeo e pelo menos uma endonuclease Cas para uma célula vegetal, em que a endonuclease Cas introduz uma quebra de dupla fita em um sítio alvo dentro de uma sequência genômica do epsps (enolpiruvilchiquimato-3-fosfato sintase) no genoma da planta, em que o referido molde de modificação de polinucleotídeo compreende pelo menos uma modificação de nucleotídeos da referida sequência genômica de epsps; b) a obtenção de uma planta a partir da célula vegetal de (a); c) a avaliação da planta de (b) quanto à presença da referida modificação de pelo menos um nucleotídeo; e d) a seleção de uma planta descendente que exibe a resistência ao glifosato.
[0148] O aumento da resistência a um herbicida é demonstrado quando as plantas que exibem o aumento da resistência a um herbicida são submetidas ao herbicida e uma curva dose/resposta é deslocada para a direita, quando comparada com uma planta de controle apropriada. Tais curvas de dose/resposta tem a “dose” representada graficamente no eixo X e o “percentual de lesão”, “efeito do herbicida”, etc. representado no eixo y. As plantas que são substancialmente resistentes ao herbicida exibem poucas, se alguma, lesões branqueadas, necróticas, líticos, clorose ou outras lesões e não são atrofiadas, murchas ou deformadas quando submetidas ao herbicida nas concentrações e taxas que são tipicamente utilizadas pela comunidade agrícola para matar ervas daninhas no campo. Os termos resistência e tolerância podem ser usados de maneira alternada.
[0149] A Figura 12 mostra uma representação esquemática de componentes usados no procedimento de edição do genoma. Uma endonuclease Cas milho-otimizada, um RNA guia e um molde de modificação de polinucleotídeo foram fornecidos a uma célula vegetal. Por exemplo, conforme mostrado na Figura 12, o molde de modificação de polinucleotídeo inclui três alterações de nucleotídeos (indicadas por setas), quando comparado com a sequência genômica do EPSPS a ser editado. Estas três alterações de nucleotídeos são referidas como mutações TIPS, pois estas modificações de nucleotídeos resultam na alteração de aminoácidos T-102 a I-102 e P-106 a S- 106. A primeira mutação pontual resulta da substituição do nucleotídeo C na sequência do códon ACT por um nucleotídeo T, a segunda mutação resulta da substituição do nucleotídeo T na mesma sequência do códon ACT por um nucleotídeo C para formar o códon de isoleucina ATC, a terceira mutação pontual resulta da substituição do primeiro nucleotídeo C na sequência do códon CCA por um nucleotídeo T, a fim de formar um códon de serina TCA (Figura 12).
[0150] Em um exemplo de realização, a divulgação descreve um método para produzir uma planta epsps (enolpiruvilchiquimato-3-fosfatosintase ) -mutante, cujo método compreende: a) o fornecimento de um RNA guia, um molde de modificação de polinucleotídeo e pelo menos uma endonuclease Cas para uma célula vegetal, em que a endonuclease Cas introduz uma quebra de dupla fita em um sítio alvo dentro de uma sequência genômica do epsps (enolpiruvilchiquimato-3-fosfato sintase) no genoma da planta, em que o referido molde de modificação de polinucleotídeo compreende pelo menos uma modificação de nucleotídeos da referida sequência genômica de epsps; b) a obtenção de uma planta a partir da célula vegetal de (a); c) a avaliação da planta de (b) quanto à presença da referida modificação de pelo menos um nucleotídeo; e d) a triagem de uma progênie vegetal de (c) que é desprovida do referido RNA guia e endonuclease Cas.
[0151] A sequência de nucleotídeos a ser editada pode ser uma sequência que é endógena, artificial, pré-existente, ou transgênica para a célula que está sendo editada. Por exemplo, a sequência de nucleotídeos no genoma de uma célula pode ser um gene nativo, um gene mutado, um gene não nativo, um gene estranho, ou um transgene que é incorporado de forma estável no genoma de uma célula. A edição de tais nucleotídeos pode resultar em um fenótipo ou genótipo desejado.
MODIFICAÇÕES DE SEQUÊNCIAS REGULADORAS UTILIZANDO O SISTEMA POLINUCLEOTÍDEO GUIA/ENDONUCLEASE CAS
[0152] Em um exemplo de realização a sequência de nucleotídeos a ser modificada pode ser uma sequência reguladora, tal como um promotor, em que a edição do promotor compreende a substituição do promotor (também referida como “troca de promotor” ou “substituição de promotor”) ou fragmento do promotor por um promotor diferente (também referido como promotor de substituição) ou fragmento do promotor diferente (também referido como fragmento de promotor de substituição), em que a substituição do promotor resulta em qualquer uma das seguintes características ou qualquer combinação dos seguintes: um aumento da atividade do promotor, um aumento da especificidade tecidual do promotor, uma diminuição da atividade do promotor, uma diminuição da especificidade tecidual do promotor, uma nova atividade do promotor, uma atividade induzível do promotor, uma janela de expressão gênica ampliada, uma modificação no tempo ou progresso do desenvolvimento da expressão gênica na mesma camada de células ou em outra camada de células (tal como, mas não se limitando a, ampliação do tempo de expressão do gene das células do tapete das anteras de milho (US 5.837.850 publicada em 17 de novembro de 1998), uma mutação de elementos de ligação ao DNA e/ou uma deleção ou adição de elementos de ligação ao DNA. O promotor (ou fragmento do promotor) a ser modificado pode ser um promotor (ou fragmento do promotor) que é endógeno, artificial, pré-existente, ou transgênico para a célula que está sendo editada. O promotor de substituição (ou fragmento do promotor de substituição) pode ser um promotor (ou fragmento do promotor) que é endógeno, artificial, pré- existente, ou transgênico para a célula que está sendo editada.
[0153] Em um exemplo de realização a sequência de nucleotídeos pode ser um promotor, em que a edição do promotor compreende a substituição de um promotor ARGOS 8 por um promotor Zea mays GOS2 PRO:GOS2-INTRON.
[0154] Em um exemplo de realização a sequência de nucleotídeos pode ser um promotor, em que a edição do promotor compreende a substituição de um promotor EPSPS1 nativo a partir de um promotor da ubiquitina vegetal.
[0155] Em um exemplo de realização a sequência de nucleotídeos pode ser um promotor, em que a edição do promotor compreende a substituição de um promotor NPK1 endógeno de milho por um promotor RAB17 de milho induzível por estresse.
[0156] Em um exemplo de realização a sequência de nucleotídeos pode ser um promotor, em que o promotor a ser editado é selecionado a partir do grupo que compreende o promotor PEPC1 de Zea mays (Kausch et al, Plant Molecular Biology, 45: 1-15, 2001), promotor da ubiquitina de Zea mays (UBI1ZM PRO, Christensen et al, Plant Molecular Biology 18: 675-689, 1992), promotor Rootmet2 de Zea mays (US 7.214.855), promotor da actina do arroz (OS-ACTIN PRO, US 5.641.876; McElroy et al, The Plant Cell, Vol 2, 163-171, fevereiro de 1990), promotor RCC3 de sorgo (US 2012/0210463 depositado em 13 de fevereiro de 2012), promotor GOS2 de Zea mays (US 6,504,083), promotor ACO2 de Zea mays (Pedido US 14/210;711 depositado em 14 de março de 2014) ou promotor da oleosina de Zea mays (US 8.466.341 B2).
[0157] Em outro exemplo de realização, o sistema polinucleotídeo guia/endonuclease Cas pode ser usado em combinação com a coentrega de molde de modificação de polinucleotídeo ou sequência de DNA doador para permitir a inserção de um promotor ou elemento promotor em uma sequência de nucleotídeos genômica de interesse, em que a inserção do promotor (ou inserção do elemento promotor) resulta em qualquer uma das seguintes características ou qualquer combinação das seguintes características: uma atividade do promotor aumentada (força do promotor aumentada), uma especificidade tecidual do promotor aumentada, uma atividade do promotor diminuída, uma especificidade tecidual do promotor diminuída, uma nova atividade do promotor, uma atividade induzível do promotor, uma janela de expressão gênica aumentada, ou uma modificação no tempo ou progresso do desenvolvimento da expressão gênica, uma mutação de elementos de ligação ao DNA, ou a adição de elementos de ligação ao DNA. Elementos promotores a serem inseridos podem ser, mas não se limitam a, elementos de núcleo promotor (como, mas não se limitando a, CAAT box, CCAAT box, Pribnow box, e/ou TATA box, sequências e regulação de tradução/ou sistema repressor para a expressão induzível (tal como elementos operador TET repressor/operador/indutor, ou elementos sulfonilureia (SU) repressor/operador/indutor. O elemento responsivo à desidratação (DRE) foi identificado pela primeira vez como um elemento promotor cis-atuante no promotor do gene responsivo à seca rd29A, que contém uma sequência núcleo de 9 bp conservada, TACCGACAT (Yamaguchi-Shinozaki, K., e Shinozaki, K. (1994) Plant Cell 6, 251-264). Inserção de DRE em um promotor endógeno pode conferir uma expressão indutível pela seca do gene a jusante. Outro exemplo são elementos ABA responsivos (ABREs), que contêm uma sequência consenso (C/T)ACGTGGC encontrada para estar presente em numerosos genes ABA e/ou genes regulados pelo estresse (Busk P.K., Pages M. (1998) Plant Mol. Biol. 37:425-435). A inserção do facilitador (enhancer) 35S ou enhancer MMV em uma região promotora endógena irá aumentar a expressão do gene (patente US 5.196.525). O promotor (ou elemento promotor) a ser modificado pode ser um promotor (ou elemento promotor) que é endógena, artificial, pré-existente, ou transgênico para a célula que está sendo editada.
[0158] Em um exemplo de realização, o sistema polinucleotídeo guia/endonuclease Cas pode ser usado para inserir um elemento facilitador (enhancer), tal como, mas não se limitando a um enhancer 35S do vírus do mosaico da couve, na frente de um promotor endógeno FMT1 para aumentar a expressão de FTM1.
[0159] Em um exemplo de realização, o sistema polinucleotídeo guia/endonuclease Cas pode ser usado para inserir um componente do sistema operador TET repressor/operador/indutor, ou um componente do sistema operador sulfonilureia (SU) repressor/operador/indutor no genoma da planta para gerar ou controlar sistemas de expressão induzíveis.
[0160] Em outro exemplo de realização, o sistema polinucleotídeo guia/endonuclease Cas pode ser utilizado para permitir a deleção de um promotor ou elemento promotor, em que a deleção do promotor (ou elemento promotor) resulta em qualquer uma das seguintes características ou qualquer combinação destas: um locus do gene é permanentemente inativado, uma atividade do promotor aumentada (força do promotor aumentada), uma especificidade tecidual do promotor aumentada, uma atividade do promotor diminuída, uma especificidade tecidual do promotor diminuída, uma nova atividade do promotor, uma atividade induzível do promotor, uma janela de expressão gênica aumentada, ou uma modificação no tempo ou progresso do desenvolvimento da expressão gênica, uma mutação de elementos de ligação ao DNA, ou a adição de elementos de ligação ao DNA. Elementos promotores a serem deletados podem ser, mas não se limitam a, elementos de núcleo promotor, elementos promotores facilitadores (enhancers) ou elementos estimuladores 35S (tal como descrito no Exemplo 32). O promotor ou fragmento do promotor a ser deletado pode ser endógeno, artificial, pré- existente ou transgênico para a célula que está sendo editada.
[0161] Em um exemplo de realização, o sistema polinucleotídeo guia/endonuclease Cas pode ser utilizado para deletar o promotor ARGOS 8 presente no genoma do milho, tal como descrito na presente divulgação.
[0162] Em um exemplo de realização, o sistema polinucleotídeo guia/endonuclease Cas pode ser utilizado para deletar um elemento facilitador (enhancer) 35S presente no genoma de uma planta, tal como descrito na presente divulgação.
MODIFICAÇÕES DE TERMINADORES UTILIZANDO O SISTEMA POLINUCLEOTÍDEO GUIA/ENDONUCLEASE CAS
[0163] Em um exemplo de realização a sequência de nucleotídeos a ser modificada pode ser um terminador (sequência terminadora) compreendendo a substituição do terminador (também referida como “troca de terminador” ou “substituição do terminador”) ou fragmento do terminador por um terminador diferente (também referido como terminador de substituição) ou fragmento do terminador diferente (também referido como fragmento do terminador de substituição), em que a substituição do terminador resulta em qualquer uma das seguintes características ou qualquer combinação das seguintes: uma atividade do terminador aumentada, uma especificidade tecidual do terminador aumentada, uma atividade do terminador diminuída, uma especificidade tecidual do terminador diminuída, uma mutação de elementos de ligação ao DNA e/ou uma deleção ou adição de elementos de ligação ao DNA. O terminador (ou fragmento do terminador) a ser modificado pode ser um terminador (ou fragmento do terminador) que é endógeno, artificial, pré-existente, ou transgênico para a célula que está sendo editada. O promotor terminador de substituição (ou fragmento do terminador de substituição) pode ser um terminador (ou fragmento do terminador) que é endógeno, artificial, pré-existente, ou transgênico para a célula que está sendo editada.
[0164] Em um exemplo de realização a sequência de nucleotídeos a ser modificada pode ser um terminador em que o terminador de ser editado é selecionado a partir do grupo que compreende os terminadores de milho dos genes Argos 8 ou SRTF18, ou outros terminadores, como terminador Pinll de batata, terminador da actina de sorgo (SB-ACTIN TERM, WO 2013/184537 A1 publicado em dezembro de 2013), SB-GKAF TERM de sorgo (WO2013019461), terminador T28 de arroz (OS-T28 TERM,WO 2013/012729 A2), AT-T9 TERM (WO 2013/012729 A2) ou GZ-W64A TERM (US7053282).
[0165] Em um exemplo de realização, o sistema polinucleotídeo guia/endonuclease Cas pode ser usado em combinação com um molde de modificação de polinucleotídeo ou sequência de DNA doador coentregue para permitir a inserção de um terminador ou elemento terminador em uma sequência de nucleotídeos genômica de interesse, em que a inserção do terminador (ou inserção do elemento terminador) resulta em qualquer uma das seguintes características ou qualquer combinação das seguintes: uma atividade do terminador aumentada (força do terminado aumentada), uma especificidade tecidual do terminador aumentada, uma atividade do terminador diminuída, uma especificidade tecidual do terminador diminuída, uma mutação de elementos de ligação ao DNA e/ou uma adição de elementos de ligação ao DNA.
[0166] O terminador (ou elemento terminador) a ser inserido pode ser um terminador (ou elemento terminador) que é endógeno, artificial, pré- existente, ou transgênico para a célula que está sendo editada.
[0167] Em outro exemplo de realização, o sistema polinucleotídeo guia/endonuclease Cas pode ser utilizado para permitir a deleção de um terminador ou elemento terminador, em que a deleção do terminador (ou deleção do elemento terminador) resulta em qualquer uma das seguintes características ou qualquer combinação destas: uma atividade do terminador aumentada (força do terminado aumentada), uma especificidade tecidual do terminador aumentada, uma atividade do terminador diminuída, uma especificidade tecidual do terminador diminuída, uma mutação de elementos de ligação ao DNA e/ou uma adição de elementos de ligação ao DNA. O terminador ou fragmento do terminador a ser deletado pode ser endógeno, artificial, pré-existente ou transgênico para a célula que está sendo editada.
MODIFICAÇÕES DE SEQUÊNCIAS REGULADORAS ADICIONAIS UTILIZANDO O SISTEMA POLINUCLEOTÍDEO GUIA/ENDONUCLEASE CAS
[0168] Em um exemplo de realização, o sistema polinucleotídeo guia/endonuclease Cas pode ser usado em combinação com uma sequência reguladora no genoma de uma célula. Uma sequência reguladora é um segmento de uma molécula de ácido nucleico que é capaz de aumentar ou diminuir a expressão de genes específicos dentro de um organismo e/ou é capaz de alterar a expressão de genes específica em determinado tecido dentro de um organismo. Exemplos de sequências reguladoras incluem, mas não estão limitadas a, região 3' UTR (região não traduzida), região 5' UTR, ativadores da transcrição, facilitadores da transcrição e repressores da transcrição, repressores traducionais, fatores de splicing, miRNAs, siRNA, miRNAs artificiais, elementos promotores, enhancer CAMV 35S, elementos enhancers MMV (PCT/US14/23451 depositado em 11 de março de 2013), elementosSECIS, sinais de poliadenilação e sítios de poliubiquitinação. Em alguns exemplos de realização a edição (modificação) ou substituição de um elemento regulador resulta na tradução da proteína alterada, clivagem do RNA, splicing do RNA, terminação da transcrição ou modificação pós traducional. Em um exemplo de realização, os elementos reguladores podem ser identificados dentro de um promotor e estes elementos reguladores podem ser editados ou modificados para otimizar estes elementos reguladores para a regulação positiva ou negativa do promotor.
[0169] Em um exemplo de realização, a sequência genômica de interesse a ser modificada é um sítio de poliubiquitinação, em que a modificação dos sítios de poliubiquitinação resulta em uma taxa de degradação de proteína modificada. A marcação pela ubiquitina condena proteínas a serem degradadas por proteossomas ou autofagia. Os inibidores do proteossoma são conhecidos por causarem um excesso de produção de proteína. As modificações feitas em uma sequência de DNA que codifica uma proteína de interesse podem resultar em pelo menos uma modificação de aminoácido da proteína de interesse, em que a referida modificação permite a a poliubiquitinação da proteína (uma modificação pós-tradução), resultando em uma alteração na degradação das proteínas.
[0170] Em um exemplo de realização, a sequência genômica de interesse a ser modificada é um sítio de poliubiquitinação em um gene EPSPS de milho, em que o sítio de poliubiquitinação modificado resulta em um teor de proteína aumentado devido a uma taxa mais lenta de degradação da proteína EPSPS.
[0171] Em um exemplo de realização, a sequência genômica de interesse a ser modificada é um sítio intrônico, em que a modificação consiste na inserção de um motivo de potencialização do íntron que resulta na modulação da atividade de transcrição do gene compreendendo o referido íntron.
[0172] Em um exemplo de realização, a sequência genômica de interesse a ser modificada é um sítio intrônico em que a modificação consiste em substituir um íntron EPSP1 de soja por um íntron 1 da ubiquitina de soja, tal como descrito na presente divulgação (Exemplo 25).
[0173] Em um exemplo de realização, a sequência genômica de interesse a ser modificada é um sítio intrônico ou UTR, em que a modificação consiste em inserir pelo menos um microRNA para dentro do referido íntron ou sítio UTR, em que a expressão do gene que compreende o sítio intrônico ou UTR também resulta na expressão do referido microRNA, que por sua vez pode silenciar qualquer gene alvo pelo microRNA sem interromper a expressão gênica do gene nativo/transgene compreendendo o referido íntron.
[0174] Em um exemplo de realização, o sistema polinucleotídeo guia/endonuclease Cas pode ser utilizado para permitir a deleção ou mutação de um elemento de um fator de transcrição dedo de zinco, em que a deleção ou mutação do fator de transcrição dedo de zinco resulta ou permite a criação de um fator de transcrição dedo de zinco dominante negativo mutante (Li et al 2013, Rice zinc finger protein DST enhances grain production through controlling Gn1a/OsCKX2 expression, PNAS 110: 3167-3172). A inserção de um domínio de dedo de zinco de par de bases único a jusante irá resultar no deslocamento do quadro de leitura e produzirá uma nova proteína que ainda pode se ligar ao DNA sem atividade de transcrição. A proteína mutante irá competir pela ligação aos promotores do gene da citoquinina oxidase e bloquear a expressão gênica da citoquinina oxidase. A redução da expressão do gene citoquinina oxidase irá aumentar o nível de citoquinina e promover o crescimento da panícula no arroz e crescimento da espiga no milho, aumentando o rendimento em condições normais e condições de estresse.
MODIFICAÇÕES DE SÍTIOS DE SPLICING E/OU INTRODUÇÃO DE SÍTIOS DE SPLICING UTILIZANDO O SISTEMA POLINUCLEOTÍDEO GUIA/ENDONUCLEASE CAS
[0175] A síntese de proteínas utiliza moléculas de mRNA que emergem de moléculas de pré-mRNA submetidas ao processo de maturação. As moléculas de pré-mRNA são encapadas (capped), submetidas ao splicing e estabilizadas pela adição de caudas poli-A. As células eucarióticas desenvolveram um processo complexo de splicing que resulta em variantes alternativas das moléculas de pré-mRNA originais. Algumas delas podem não produzir moldes funcionais para a síntese de proteínas. Em células de milho, o processo de splicing é afetado por sítios de splicing nos locais de junção éxon- íntron. Um exemplo de um sítio splicing canônico é AGGT. As sequências codificantes do gene pode conter um número de sítios de splicing alternativo que poderá afetar a eficiência global do processo de maturação do pré-mRNA e, dessa forma, pode limitar o acúmulo de proteínas nas células. O sistema de polinucleotídeo guia/endonuclease Cas pode ser utilizado em combinação com um molde de modificação de polinucleotídeo coentregue para editar um gene de interesse para introduzir um sítio de splicing canônico em uma junção descrita ou qualquer variante de um sítio de splicing que altera o padrão de splicing das moléculas pré-mRNA.
[0176] Em um exemplo de realização, a sequência de nucleotídeos de interesse a ser modificada é um gene EPSPS do milho, em que a modificação do gene consiste em modificar sítios de splicing alternativo, resultando na produção melhorada dos transcritos de genes funcionais e produtos de genes (proteínas).
[0177] Em um exemplo de realização, a sequência de nucleotídeos de interesse a ser modificada é um gene, em que a modificação do gene consiste em editar as bordas de íntrons de genes que sofreram splicing alternativo para alterar o acúmulo de variantes de splicing.
MODIFICAÇÕES DE SEQUÊNCIAS DE NUCLEOTÍDEOS QUE CODIFICAM UMA PROTEÍNA DE INTERESSE USANDO O SISTEMA POLINUCLEOTÍDEO GUIA/ENDONUCLEASE CAS
[0178] Em um exemplo de realização, o sistema polinucleotídeo guia/endonuclease Cas pode ser utilizado para modificar ou substituir uma sequência codificante no genoma de uma célula, em que a modificação ou substituição resulta em qualquer uma das seguintes características, ou qualquer combinação das seguintes característica: atividade de uma proteína (enzima) aumentada, funcionalidade da proteína aumentada, atividade da proteína diminuída, funcionalidade da proteína diminuída, mutação sítio- específica, troca de domínio da proteína, nocaute da proteína, nova funcionalidade da proteína, funcionalidade da proteína modificada.
[0179] Em um exemplo de realização o nocaute da proteína é devido à introdução de um códon de parada na sequência codificante de interesse.
[0180] Em um exemplo de realização o nocaute da proteína é devido à deleção de um códon de inicio na sequência codificante de interesse.
FUSÕES DE AMINOÁCIDOS E/OU PROTEÍNAS USANDO O SISTEMA POLINUCLEOTÍDEO GUIA/ENDONUCLEASE CAS
[0181] Em um exemplo de realização, o sistema polinucleotídeo guia/endonuclease Cas pode ser usado com ou sem uma sequência de polinucleotídeo coentregue para fundir uma primeira sequência codificante que codifica uma primeira proteína a uma segunda sequência codificante que codifica uma segunda proteína no genoma de uma célula, em que a fusão de proteína resulta em qualquer uma das seguintes características ou qualquer combinação das seguintes características: atividade da proteína (enzima) aumentada, funcionalidade da proteína aumentada, atividade da proteína diminuída, funcionalidade da proteína diminuída, nova a funcionalidade da proteína, funcionalidade da proteína modificada, nova localização da proteína, novo momento de expressão da proteína, padrão de expressão da proteína modificado, uma proteína quimérica, ou uma proteína modificada com funcionalidade de fenótipo dominante.
[0182] Em um exemplo de realização, o sistema polinucleotídeo guia/endonuclease Cas pode ser usado com ou sem uma sequência de polinucleotídeo coentregue para fundir uma primeira sequência codificante que codifica um sinal de localização para o cloroplasto a uma segunda sequência codificante que codifica uma proteína de interesse, em que a fusão resulta no direcionamento da proteína de interesse para o cloroplasto.
[0183] Em um exemplo de realização, o sistema polinucleotídeo guia/endonuclease Cas pode ser usado com ou sem uma sequência de polinucleotídeo coentregue para fundir uma primeira sequência codificante que codifica um sinal de localização para o cloroplasto a uma segunda sequência codificante que codifica uma proteína de interesse, em que a fusão resulta no direcionamento da proteína de interesse para o cloroplasto.
[0184] Em um exemplo de realização, o sistema polinucleotídeo guia/endonuclease Cas pode ser usado com ou sem uma sequência de polinucleotídeo coentregue para fundir uma primeira sequência codificante que codifica um sinal de localização para o cloroplasto (por exemplo, um peptídeo de trânsito para o cloroplasto) a uma segunda sequência codificante, em que fusão das proteínas resulta em uma proteína modificada com funcionalidade de fenótipo dominante.
SiLENCIAMENTO GÊNICO PELA EXPRESSÃO DE UMA REPETIÇÃO INVERTIDA EM UM GENE DE INTERESSE UTILIZANDO O SISTEMA POLINUCLEOTÍDEO GUIA/ ENDONUCLEASE CAS
[0185] Em um exemplo de realização, o sistema polinucleotídeo guia/endonuclease Cas pode ser usado em combinação com uma sequência polinucleotídica coentregue para inserir um fragmento gênico invertido em um gene de interesse no genoma de um organismo, em que a inserção do fragmento do gene invertido pode permitir uma criação in vivo de uma repetição invertida (hairpin) e resulta no silenciamento do referido gene endógeno.
[0186] Em um exemplo de realização a inserção do fragmento do gene invertido pode resultar na formação de uma repetição invertida criada in vivo (hairpin) em um promotor nativo (ou alterado) de um gene e/ou em uma extremidade 5' nativa do gene nativo. O fragmento do gene invertido pode ainda compreender um íntron que pode resultar no silenciamento melhorado do gene alvo.
DELEÇÃO GÊNOMICA PARA A CARACTERIZAÇÃO DE LOCUS DE CARACTERÍSTICA
[0187] Mapeamento de característica no melhoramento de plantas muitas vezes resulta na detecção de regiões cromossômicas abrigando um ou mais genes que controlam a expressão de uma característica de interesse. Para uma característica qualitativa, o sistema polinucleotídeo guia/endonuclease Cas pode ser utilizado para eliminar os genes candidatos nas regiões cromossômicas identificadas para determinar se a deleção do gene afeta a expressão da característica. Para características quantitativas, a expressão de uma característica de interesse é governada por múltiplos loci de característica quantitativa (QTL) de efeitos de tamanho, complexidade e significância estatística diferentes em um ou mais cromossomos. Em casos de regiões de QTL de efeito negativo ou deletério que afetam uma característica complexa, o sistema polinucleotídeo guia/endonuclease Cas pode ser usado para eliminar regiões inteiras delimitadas pelo mapeamento fino assistido por marcadores, tendo como alvo regiões específicas para a sua deleção ou rearranjo seletivo. Da mesma forma, a variação presença/ausência (PAV) ou variação do número cópias (CNV) pode ser manipulada com a deleção genômica seletiva usando o sistema polinucleotídeo guia/ endonuclease CAS.
[0188] Em um exemplo de realização, a região de interesse pode ser flanqueada por duas sequências-alvo polinucleotídeo guia/endonuclease Cas independentes. O corte seria feito simultaneamente. O evento de deleção seria a reparação das duas extremidades cromossômicas sem a região de interesse. Resultados alternativos incluiriam inversões da região de interesse, mutações nos locais de corte e duplicação da região de interesse.
MÉTODOS PARA A IDENTIFICAÇÃO DE PELO MENOS UMA CÉLULA VEGETAL COMPREENDENDO EM SEU GENOMA O POLINUCLEOTÍDEO DE INTERESSE INTEGRADO NO REFERIDO SÍTIO-ALVO.
[0189] São fornecidos métodos para a identificação de pelo menos uma célula vegetal compreendendo em seu genoma o polinucleotídeo de interesse integrado no referido sítio-alvo. Uma variedade de métodos está disponível para a identificação de células vegetais com estas inserções no genoma próximo ao sítio alvo sem utilizar um fenótipo marcador detectável. Tais métodos podem ser vistos como a análise direta de uma sequência-alvo para detectar qualquer alteração na sequência alvo, incluindo, mas não se limitando a, os métodos de PCR, métodos de sequenciamento, digestão por nucleases, Southern blot, e qualquer combinação dos mesmos. Vide, por exemplo, Pedido de Patente US 12/147.834, incorporado ao presente pela referência na medida do necessário para os métodos descritos. O método também compreende a recuperação de uma planta a partir da célula vegetal que compreende um polinucleotídeo de interesse integrado em seu genoma. A planta pode ser estéril ou fértil. Reconhece-se que qualquer polinucleotídeo de interesse pode ser fornecido, integrado ao genoma da planta no sítio alvo, e expresso em uma planta.
[0190] Os polinucleotídeos/polipeptídeos de interesse incluem, mas não estão limitados a sequências codificantes de resistência aos herbicidas, sequências codificantes de inseticidas, sequências codificantes de nematicidas, sequências codificantes de antimicrobianos, sequências codificantes de antifúngicos, sequências codificantes de antivirais, sequências codificantes de tolerância ao estresse abiótico e biótico, ou sequências que modificam características de plantas, tais como rendimento, qualidade do grão, teor de nutrientes, qualidade e quantidade de amido, fixação e/ou utilização de nitrogênio, e teor e/ou composição de óleo. Polinucleotídeos mais específicos de interesse incluem, mas não estão limitados a, genes que melhoram o rendimento das culturas, polipeptídeos que melhoram a conveniência de culturas, genes que codificam proteínas que conferem resistência ao estresse abiótico, como a seca, nitrogênio, temperatura, salinidade, metais tóxicos ou oligoelementos, ou que conferem resistência às toxinas como pesticidas e herbicidas, ou ao estresse biótico, tais como ataques por fungos, vírus, bactérias, insetos e nematoides, e desenvolvimento de doenças associadas com estes organismos. As categorias gerais de genes de interesse incluem, por exemplo, genes implicados na informação, tais como dedos de zinco, aqueles envolvidos na comunicação, como quinases, e aqueles que estão envolvidos na manutenção, tais como proteínas de choque térmico. Categorias mais específicas de transgenes, por exemplo, incluem, mas não estão limitadas a, genes que codificam características importantes para a agronomia, resistência aos insetos, resistência às doenças, resistência aos herbicidas, fertilidade ou esterilidade, características de grãos e produtos comerciais. Os genes de interesse incluem, geralmente, aqueles envolvidos no metabolismo de óleo, amido, carboidratos, ou nutrientes, bem como genes que afetam o tamanho dos grãos, teor de sacarose, e outros genes similares que podem ser piramidados ou utilizados em combinação com outras características, tal como, mas não se limitando, a resistência descrita na presente divulgação.
[0191] Características agronomicamente importantes, tais como teor de óleo, amido, e proteína, podem ser geneticamente alteradas utilizando adicionalmente métodos tradicionais de melhoramento por reprodução. As modificações incluem um aumento crescente no teor de ácido oleico, óleos saturados e insaturados, níveis crescentes de lisina e enxofre, fornecendo os aminoácidos essenciais e também a modificação do amido. Modificações da proteína hordotionina são descritas nas Patentes US 5.703.049, US 5.885.801, US 5.885.802, e US 5.990.389, incorporadas ao presente pela referência. Outro exemplo é a proteína de semente rica em lisina e/ou enxofre codificada pela albumina 2S de soja descrita na Patente US 5.850.016, e o inibidor da quimotripsina da cevada, descrito em Williamson et al. (1987) Eur.J. Biochem 165:99-106, cujas descrições são incorporadas ao presente pela referência.
[0192] Características comerciais também podem ser codificadas em um polinucleotídeo de interesse que pode aumentar, por exemplo, o teor de amido para a produção de etanol, ou proporcionar a expressão de proteínas. Outro uso comercial importante de plantas transformadas é a produção de polímeros e bioplásticos, tais como aqueles descritos na Patente US 5.602.321. Genes como β-cetotiolase, PHBase (polihidroxibutirato sintase) e acetoacetil- CoA redutase (vide Schubert et al. (1988) J. Bacteriol. 170: 5837-5847) facilitam a expressão de polihidroxialcanoatos (PHAs).
[0193] Derivados das sequências codificantes podem ser feitos por mutagênese sítio-dirigida para aumentar o nível de aminoácidos pré- selecionados no polipeptídeo codificado. Por exemplo, o gene que codifica o polipeptídeo com alto teor de lisina da cevada (BHL) é obtido a partir de inibidor da quimotripsina de cevada, Pedido US 08/740.682, depositado a 1 de novembro de 1996, e publicação WO 98/20133, cujas revelações são incorporadas ao presente pela referência. Outras proteínas incluem proteínas de plantas ricas em metionina, tais como a partir de sementes de girassol (Lilley et al. (1989) Proceedings of the World Congress on Vegetable Protein Utilization in Human Foods and Animal Feedstuffs, ed. Applewhite (American Oil Chemists Society, Champaign, Illinois), págs. 497-502; incorporado ao presente pela referência); milho (Pedersen et al. (1986) J. Biol. Chem. 261:6279; Kirihara et al. (1988) Gene 71:359; ambas publicações incorporadas ao presente pela referência); e arroz (Musumura et al. (1989) Plant Mol. Biol. 12:123, incorporado ao presente pela referência). Outros genes agronomicamente importantes codificam látex, Floury 2, fatores de crescimento, fatores de armazenamento de sementes e fatores de transcrição.
[0194] Os polinucleotídeo que melhoram o rendimento de culturas incluem genes de nanismo, como Rht1 e Rht2 (Peng et al. (1999) Nature 400: 256-261), e aqueles que aumentam o crescimento de plantas, como genes da glutamato desidrogenase indutível por amônio. Os polinucleotídeos que melhoram a conveniência de culturas incluem, por exemplo, aqueles que permitem que as plantas tenham teor de gordura saturada reduzido, aqueles que aumentam o valor nutricional das plantas, e aqueles que aumentam a proteína do grão. Os polinucleotídeos que melhoram a tolerância ao sal são aqueles que aumentam ou permitem o crescimento de plantas em ambiente com maior salinidade do que o ambiente nativo da planta na qual o(s) gene(s) de tolerância ao sal foi(foram) introduzido(s).
[0195] Os polinucleotídeos/polipeptídeos que influenciam a biossíntese de aminoácidos incluem, por exemplo, antranilato sintase (AS; CE 4.1.3.27), que catalisa a primeira reação de ramificação da via de aminoácidos aromáticos para a biossíntese de triptofano em plantas, fungos e bactérias. Em plantas, os processos químicos para a biossíntese de triptofano são compartimentados no cloroplasto. Vide, por exemplo, a publicação US 20080050506, incorporada ao presente pela referência. As sequências adicionais de interesse incluem Corismato Piruvato Liase (CPL) que se refere a um gene que codifica uma enzima que catalisa a conversão de corismato em piruvato e pHBA. O gene CPL mais bem caracterizado foi isolado a partir de E. coli e tem o número de acesso GenBank M96268. Vide a Patente US 7.361.811, incorporada ao presente pela referência.
[0196] A sequência polinucleotídica de interesse pode codificar proteínas envolvidas no fornecimento de doença ou resistência à praga. Os termos “resistência à doença” ou “resistência à praga” indicam que as plantas evitam os sintomas nocivos que são resultantes das interações planta- patógeno. Genes de resistência à praga podem codificar resistência às pragas que têm grande impacto no efeito de diminuição do rendimento (yield drag), tais como a larva das raízes, gramiola, broca de colmo-de-milho, e similares. Genes de resistência às doenças e de resistência aos insetos, tais como lisozimas ou cecropinas para proteção antibacteriana, ou proteínas como defensinas, glucanases ou quitinases para a proteção antifúngica, ou endotoxinas de Bacillus thuringiensis, inibidores da protease, colagenases, lectinas, ou glicosidases para controlar nematoides ou insetos, são exemplos de produtos gênicos úteis. Os genes que codificam características de resistência às doenças incluem genes de desintoxicação, como contra fumonisina (Patente US 5.792.931); genes de avirulência (avr) e resistência à doença (R) (Jones et al. (1994) Science 266: 789; Martin et al. (1993) Science 262: 1432; e Mindrinos et al. (1994) Cell 78: 1089); e similares. Genes de resistência aos insetos podem codificar resistência às pragas que têm grande impacto no efeito de diminuição do rendimento (yield drag), tais como a larva das raízes, gramiola, broca de colmo-de-milho, e similares. Tais genes incluem, por exemplo, genes de proteína tóxica de Bacillus thuringiensis (Patentes US 5.366.892; US 5.747.450; US 5.736.514; US 5.723.756; US 5.593.881; e Geiser et al. (1986) Gene 48:109); e similares.
[0197] Uma “proteína de resistência aos herbicidas” ou proteína resultante da expressão de uma “molécula de ácido nucleico que codifica a resistência aos herbicidas” inclui proteínas que conferem a uma célula a capacidade de tolerar uma concentração mais elevada de um herbicida do que as células que não expressam tal proteína, ou de tolerar uma determinada concentração de um herbicida durante um período mais longo de tempo do que as células que não expressam tal proteína. Características de resistência aos herbicidas podem ser introduzidas em plantas por genes que codificam resistência aos herbicidas que atuam para inibir a ação da acetolactato sintase (ALS), particularmente os herbicidas do tipo sulfonilureia, genes que codificam resistência aos herbicidas que atuam para inibir a ação da glutamina sintetase, tal como fosfinotricina ou basta (por exemplo, o gene bar), glifosato (por exemplo, o gene EPSP sintase e gene GAT), inibidores de HPPD (por exemplo, gene HPPD) ou outros genes conhecidos no estado da técnica. Vide, por exemplo, as Patentes US 7626077, US 5310667, US 5866775, US 6225114, US 6248876, US 7169970, US 6867293, e Pedido Provisório US 61/401.456, cada uma incorporada ao presente pela referência. O gene bar codifica a resistência ao herbicida basta, o gene nptII codifica a resistência aos antibióticos canamicina e geneticina, e formas mutantes do gene ALS codificam resistência ao herbicida Clorsulfuron.
[0198] Genes de esterilidade também podem ser codificados em um cassete de expressão e proporcionar uma alternativa à remoção física do pendão. Exemplos de genes usados incluem genes da fertilidade masculina, como MS26 (vide, por exemplo, as Patentes US 7.098.388, 7.517.975, 7.612.251), MS45 (vide, por exemplo, as Patentes US 5.478.369, US 6.265.640) ou MSCA1 (vide, por exemplo, a Patente US 7.919.676). Plantas de milho (Zea mays L.) podem ser produzidas pelas técnicas de autopolinização e polinização cruzada. O milho possui flores masculinas, localizadas no pendão, e flores femininas, localizadas na espiga, na mesma planta. Ela pode se autopolinizar (“autofecundação”) ou realiza a polinização cruzada. A polinização natural ocorre no milho quando o vento sopra o pólen a partir dos pendões para os cabelos do milho que se projetam a partir do topo das espigas incipientes. A polinização pode ser facilmente controlada por técnicas conhecidas pelos técnicos hábeis no assunto. O desenvolvimento de híbridos de milho requer o desenvolvimento de linhagens homozigóticas, o cruzamento destas linhagens, e a avaliação dos cruzamentos. O estabelecimento de criação e as seleções recorrentes são dois dos métodos de melhoramento utilizados para desenvolver linhagens puras a partir de populações. Os programas de melhoramento combinam traços desejáveis de duas ou mais linhas endogâmicas ou diversas fontes de base ampla em pools de reprodução a partir dos quais novas linhagens endogâmicas são desenvolvidas por autocruzamento e seleção dos fenótipos desejados. Uma variedade de milho híbrida é o cruzamento de duas linhagens puras, cada uma das quais pode ter uma ou mais características desejáveis ausentes ou que se complementam entre si. As novas linhagens endogâmicas (puras) são cruzadas com outras linhas endogâmicas e os híbridos destes cruzamentos são avaliados para determinar quais possuem potencial comercial. A progênie híbrida da primeira geração é designada F1. O híbrido F1 é mais vigoroso do que os seus pais consanguíneos. Este vigor híbrido, ou heterose, pode se manifestar de várias maneiras, incluindo o aumento do crescimento vegetativo e maior rendimento.
[0199] Sementes de milho híbridas podem ser produzidas por um sistema de esterilidade masculina que incorpora a remoção manual do pendão. Para produzir semente híbrida, o pendão macho é removido da fêmea em crescimento parental endogâmica, que pode ser plantada em vários padrões de linha alternada com o macho progenitor consanguíneo. Por conseguinte, contanto que haja isolamento suficiente a partir de fontes exógenas de pólen de milho, as espigas da planta feminina endogâmica serão fertilizadas apenas com pólen das plantas machos consanguíneas. Portanto, as sementes resultantes são híbridas (F1) e formarão plantas híbridas.
[0200] A variação no campo impactando o desenvolvimento da planta pode resultar em plantas desenvolvendo pendão após a conclusão do despendoamento manual da progenitora feminina. Ou, um pendão da planta fêmea consanguínea pode não ser completamente removido durante o processo de remoção do pendão. Em qualquer caso, o resultado é que a planta fêmea irá dispersar o pólen (antese) com sucesso e algumas plantas femininas serão autopolinizadas. Isto fará com que sementes da fêmea puras sejam colhidas juntamente com as sementes híbridas, que são normalmente produzidas. As sementes das linhagens femininas puras não apresentam heterose e, portanto, não são tão produtivas como as sementes F1. Além disso, a presença de sementes de plantas femininas puras (endogâmicas) pode representar um risco de segurança do germoplasma para a empresa que produz o híbrido.
[0201] Alternativamente, as linhagens endogâmicas fêmeas podem ser submetidas ao despendoamento mecânico com o auxilio de máquinas. O despendoamento mecânico é aproximadamente tão fiável quanto o despendoamento manual, mas é mais rápido e menos dispendioso. Entretanto, a maioria das máquinas de despendoamento produz mais danos às plantas do que despendoamento manual. Assim, atualmente nenhuma forma de remoção do pendão (despendoamento) é completamente satisfatória, e há uma necessidade continua de alternativas para reduzir ainda mais os custos da produção e eliminar a autopolinização das plantas progenitoras femininas na produção de sementes híbridas.
[0202] As mutações que causam esterilidade masculina em plantas têm o potencial de ser úteis em métodos para a produção de sementes híbridas nas plantas de cultivo, tal como o milho, e podem reduzir os custos de produção, eliminando a necessidade do trabalho intensivo na remoção do pendão a partir das flores masculinas (também conhecido como despendoamento) a partir de plantas progenitoras maternas utilizadas como um híbrido parental. As mutações que causam esterilidade masculina no milho foram produzidas por uma variedade de métodos, como raios-X ou irradiações UV, tratamentos químicos ou inserções de elemento transponíveis (ms23, ms25, ms26, ms32) (Chaubal et al. (2000) Am J Bot 87: 1193-1201). A regulação condicional de genes de fertilidade através da fertilidade/esterilidade “interruptores moleculares” poderia aumentar as opções para a concepção de novos sistemas de esterilidade masculina para melhoramento das culturas (Unger et al. (2002) Transgenic Res 11: 455-465).
[0203] Além da identificação de novos genes que impactam a fertilidade masculina, continua a haver a necessidade de proporcionar um sistema genético fiável de produção de esterilidade masculina.
[0204] Na Patente US 5.478.369 é descrito um método em que o gene da fertilidade masculina, Ms45 foi identificado e clonado no cromossomo 9 do milho. Anteriormente, não havia sido descrito um gene da fertilidade masculina no cromossomo 9, ms2, que nunca tinha sido clonado e sequenciado. Isto não é alélico ao gene referido na patente '369. Vide, Albertsen, M. e Phillips, R.L., “Developmental Cytology of 13 Genetic Male Sterile Loci in Maize” Canadian Journal of Genetics & Cytology 23:195-208 (Jan. 1981). O único gene de fertilidade clonado antes foi o gene da Arabidopsis descrito em Aarts et al., supra.
[0205] Exemplos de genes que foram descobertos posteriormente que são importantes para a fertilidade masculina são numerosos e incluem o gene ABORTED MICROSPORES (AMS) de Arabidopsis, Sorensen et al., The Plant Journal (2003) 33(2):413-423); o gene MS1 de Arabidopsis (Wilson et al., The Plant Journal (2001) 39(2):170-181); o gene NEF1 (Ariizumi et al., The Plant Journal ( 2004) 39(2):170-181); o gene AtGPAT1 de Arabidopsis (Zheng et al., The Plant Cell (2003) 15:1872-1887); a mutação dde2-2 de Arabidopsis mostrou ser defeituosa no gene de óxido aleno sintase (Malek et al., Planta (2002)216:187-192); o gene faceless pollen-1 (flp1) de Arabidopsis (Ariizumi et al, Plant Mol. Biol. (2003) 53:107-116); gene MALE MEIOCYTE DEATH1 de Arabidopsis (Yang et al., The Plant Cell (2003) 15:1281-1295); gene dedod de zinco tapete-específico, TAZ1 (Kapoor et al., The Plant Cell (2002) 14:23532367); e o gene TAPETUM DETERMINANT1 (Lan et al, The Plant Cell (2003) 15:2792-2804).
[0206] Outros mutantes ou genes de fertilidade masculina conhecidos da Zea mays estão listados na patente US 7.919.676 incorporada ao presente pela referência.
[0207] Outros genes incluem quinases e aqueles que codificam compostos tóxicos para o desenvolvimento gametofítico do sexo masculino ou feminino.
[0208] Além disso, reconhece-se que o polinucleotídeo de interesse também pode incluir sequências antisense complementares a pelo menos uma porção do RNA mensageiro (mRNA) de uma sequência gênica alvo de interesse. Os nucleotídeos antisense são construídos para hibridizar com o mRNA correspondente. As modificações das sequências antisense podem ser feitas, desde que as sequências hibridizam e interfiram com a expressão dos mRNA correspondentes. Desta maneira, podem ser usadas construções antisense possuindo 70%, 80%, ou 85% de identidade de sequência com as sequências antisense correspondentes. Além disso, porções dos nucleotídeos antisense podem ser utilizadas para interromper a expressão do gene alvo. De modo geral, podem ser usadas sequências de pelo menos 50 nucleotídeos, 100 nucleotídeos, 200 nucleotídeos, ou mais.
[0209] Além disso, o polinucleotídeo de interesse também pode ser utilizado na orientação sense para suprimir a expressão de genes endógenos em plantas. Os métodos para suprimir a expressão gênica em plantas utilizando polinucleotídeos na orientação sense são conhecidos no estado da técnica. Os métodos geralmente envolvem a transformação de plantas com uma construção de DNA compreendendo um promotor que controla a expressão em uma planta operacionalmente ligado a pelo menos uma porção de uma sequência nucleotídica que corresponde ao transcrito do gene endógeno. Tipicamente, tal sequência nucleotídica possui identidade de sequências substancial com a sequência do transcrito do gene endógeno, geralmente maior do que cerca de 65% de identidade de sequência, cerca de 85% de identidade de sequência, ou mais do que cerca de 95% de identidade de sequência. Vide as Patentes US 5.283.184 e US 5.034.323, incorporadas ao presente pela referência.
[0210] O polinucleotídeo de interesse também pode ser um marcador fenotípico. Um marcador fenotípico é um marcador detectável ou selecionável, que inclui os marcadores visuais e marcadores selecionáveis se ele é um marcador de seleção positivo ou negativo. Qualquer marcador fenotípico pode ser utilizado. Especificamente, um marcador selecionável ou detectável compreende um segmento de DNA que permite identificar ou selecionar para, ou contra, uma molécula ou célula que a contenha, frequentemente sob condições específicas. Estes marcadores podem codificar uma atividade, tal como, mas não se limitando a, a produção de RNA, peptídeo ou proteína, ou podem proporcionar um sítio de ligação para RNA, peptídeos, proteínas, compostos ou composições inorgânicas e orgânicas e similares.
[0211] Exemplos de marcadores selecionáveis incluem, mas não estão limitados a, segmentos de DNA que compreendem sítios para enzimas de restrição; segmentos de DNA que codificam produtos que proporcionam resistência contra compostos de outro modo tóxicos, incluindo antibióticos, como espectinomicina, ampicilina, canamicina, tetraciclina, basta, neomicina fosfotransferase II (NEO) e higromicina fosfotransferase (HPT)); segmentos de DNA que codificam produtos que de outro modo estão ausentes na célula receptora (por exemplo, genes de tRNA, marcadores auxotróficos); segmentos de DNA que codificam produtos que podem ser prontamente identificados (por exemplo, marcadores fenotípicos como β-galactosidase, GUS, proteínas fluorescentes, tal como a proteína fluorescente verde (GFP), ciano (CFP), amarela (YFP), vermelha (RFP), e proteínas de superfície celular); produção de novos locais para primers de PCR (por exemplo, justaposição de duas sequência de DNA não anteriormente justapostas), inclusão de sequências de DNA não atuante ou atuantes por uma endonuclease de restrição ou outra enzima modificadora de DNA, químicos, etc.; e a inclusão de uma sequência de DNA necessária para uma modificação específica (por exemplo, metilação) que permite a sua identificação.
[0212] Os marcadores selecionáveis incluem genes que conferem resistência a compostos herbicidas, como glufosinato de amônio, bromoxinila, imidazolinonas, e 2,4-diclorofenoxiacetato (2,4-D). Vide, por exemplo, Yarranton, (1992) Curr Opin Biotech 3:506-11; Christopherson et al., (1992) Proc. Natl. Acad. Sci. USA 89:6314-8; Yao et al., (1992) Cell 71:63-72; Reznikoff, (1992) Mol Microbiol 6:2419-22; Hu et al., (1987) Cell 48:555-66; Brown et al., (1987) Cell 49:603-12; Figge et al., (1988) Cell 52:713-22; Deuschle et al., (1989) Proc. Natl. Acad. Sci. USA 86:5400-4; Fuerst et al., (1989) Proc. Natl. Acad. Sci. USA 86:2549-53; Deuschle et al., (1990) Science 248:480-3; Gossen, (1993) tese para obtenção de Ph.D., University of Heidelberg; Reines et al., (1993) Proc. Natl. Acad. Sci. USA 90:1917-21; Labow et al., (1990) Mol Cell Biol 10:3343-56; Zambretti et al., (1992) Proc. Natl. Acad. Sci. USA 89:3952-6; Baim et al., (1991) Proc. Natl. Acad. Sci. USA 88:5072-6; Wyborski et al., (1991) Nucleic Acids Res 19:4647-53; Hillen e Wissman, (1989) Topics Mol Struc Biol 10:143-62; Degenkolb et al., (1991) Antimicrob Agents Chemother 35:1591-5; Kleinschnidt et al., (1988) Biochemistry 27:1094-104; Bonin, (1993) tese para obtenção de Ph.D., University of Heidelberg; Gossen et al., (1992) Proc. Natl. Acad. Sci. USA 89:5547-51; Oliva et al., (1992) Antimicrob Agents Chemother 36:913-9; Hlavka et al., (1985) Handbook of Experimental Pharmacology, Vol. 78 (Springer-Verlag, Berlin); Gill et al., (1988) Nature 334:721-4. Características comerciais também podem ser codificadas em um gene ou genes que pode(m) aumentar, por exemplo, o teor de amido para a produção de etanol, ou proporcionar a expressão de proteínas. Outro uso comercial importante de plantas transformadas é a produção de polímeros e bioplásticos, tais como aqueles descritos na Patente US 5.602.321. Genes como β-cetotiolase, PHBase (polihidroxibutirato sintase) e acetoacetil-CoA redutase (vide Schubert et al. (1988) J. Bacteriol. 170: 5837-5847) facilitam a expressão de polihidroxialcanoatos (PHAs).
[0213] Produtos exógenos incluem enzimas e produtos vegetais, bem como aqueles de outras fontes, incluindo procariotas e outros eucariotas. Tais produtos incluem enzimas, cofatores, hormônios e similares. O nível de proteínas, em particular proteínas modificadas possuindo distribuição de aminoácidos melhorada para melhorar o valor nutritivo da planta, pode estar aumentado. Isto é conseguido pela expressão de tais proteínas que possuem o conteúdo de aminoácidos melhorado.
[0214] Os transgenes, moléculas de DNA recombinante, sequências de DNA de interesse e polinucleotídeos de interesse podem compreender uma ou mais sequências de DNA para o silenciamento gênico. Os métodos para o silenciamento de genes envolvendo a expressão de sequências de DNA em plantas são conhecidos no estado da técnica e incluem, mas não estão limitados a, cosupressão, supressão antisense, RNA de interferência de dupla fita (cdRNA), RNA de interferência em hairpin (hpRNA), RNA de interferência em hairpin contendo íntron (ihpRNA), silenciamento gênico transcricional e micro RNA de interferência (miRNA)
[0215] Do modo com é utilizado na presente divulgação, “ácidos nucleicos”, significa um polinucleotídeo e inclui um polímero fita simples ou fita dupla de bases desoxirribonucleotídeo ou ribonucleotídeo. Os ácidos nucleicos podem também incluir fragmentos e nucleotídeos modificados. Assim, os termos “polinucleotídeo”, “sequência de ácido nucleico”, “sequência de nucleotídeos” e “fragmento de ácido nucleico” são utilizados de maneira alternada e é um polímero de RNA e/ou DNA, que é de fita simples ou fita dupla, opcionalmente contendo bases nucleotídicas sintéticas, não naturais ou alteradas. Os nucleotídeos (geralmente encontrados na forma 5'-monofosfato) são referidos pela sua designação de uma letra da seguinte forma: “A” para adenosina ou deoxiadenosina (para RNA ou DNA, respectivamente), “C” para citosina ou deoxicitosina, “G” para guanosina ou deoxiguanosina, “U” para uridina, “T” para deoxitimidina, “R” para purinas (A ou G), “Y” para pirimidinas (C ou T), “K” para G ou T, “H” para A ou C ou T, “I” para inosina e “N” para qualquer nucleotídeo.
[0216] “Quadro de leitura aberto” é abreviado como ORF.
[0217] Os termos “subfragmento que é funcionalmente equivalente” e “subfragmento funcionalmente equivalente” são usados no presente de maneira intercambiável. Esses termos se referem a uma porção ou subsequência de um fragmento de ácido nucleico isolado na qual a capacidade de alterar a expressão gênica ou produzir um determinado fenótipo é mantida se o fragmento ou subfragmento codifica ou não uma enzima ativa. Por exemplo, o fragmento ou subfragmento pode ser usado no desenvolvimento de genes para produzir o fenótipo desejado em uma planta transformada. Genes podem ser projetados para uso na supressão pela ligação de um fragmento de ácido nucleico ou subfragmento deste, se este codifica ou não uma enzima ativa, no sentido sense ou antisense em relação a uma sequência promotora da planta.
[0218] O termo “domínio conservado” ou “motivo” refere-se a um conjunto de aminoácidos conservados em posições específicas ao longo de uma sequência alinhada de proteínas evolutivamente relacionadas. Embora aminoácidos em outras posições possam variar entre duas proteínas homólogas, aminoácidos que são altamente conservados em posições específicas indicam aminoácidos que são essenciais para estrutura, estabilidade ou atividade de uma proteína. Pelo fato deles serem identificados por alto grau de conservação nas sequências alinhadas de uma família de proteínas homólogas, eles podem ser usados como identificadores, ou “assinaturas” para determinar se uma proteína com uma sequência recém determinada pertence a uma família de proteínas identificada anteriormente.
[0219] Sequencias de polinucleotídeos e polipeptídeos, variantes destas, e as relações estruturais destas sequências, podem ser descritas pelos termos “homologia”, “homólogo”, “substancialmente idêntica”, “substancialmente semelhante” e “substancialmente correspondente”, que são utilizados de modo alternado na presente divulgação. Estes se referem a fragmentos de polipeptídeo ou ácido nucleico em que as alterações em um ou mais amino ácidos ou bases nucleotídicas não afetam a função da molécula, tal como a capacidade de mediar a expressão do gene ou de produzir um determinado fenótipo. Estes termos também se referem a(s) modificação(ões) de fragmentos de ácido nucleico que não alteram substancialmente as propriedades funcionais do fragmento de ácido nucleico resultante em relação ao fragmento inicial, não modificado. Estas modificações incluem a supressão, substituição e/ou inserção de um ou mais nucleotídeos no fragmento de ácido nucleico.
[0220] Sequências de ácido nucleico substancialmente similares abrangidas podem ser definidas pela capacidade de hibridizar (sob condições de estringência moderada, por exemplo, 0,5 X SSC, 0,1% SDS, 60 °C) com as sequências exemplificadas na presente divulgação, ou em qualquer porção da sequência de nucleotídeo divulgada na presente divulgação, e que é funcionalmente equivalente a qualquer ácido nucleico divulgado no presente. Condições de estringência podem ser ajustadas para selecionar fragmentos moderadamente similares, tais como sequências homólogas a partir de organismos distantemente relacionados, a fragmentos muito similares, tais como genes que duplicam enzimas funcionais a partir de organismos estreitamente relacionados. A lavagem pós-hibridização determina as condições de estringência.
[0221] O termo “hibridiza seletivamente” refere-se a hibridização de uma sequência de ácido nucleico sob condições estringentes de hibridização à uma sequência ácido nucleico alvo especificada em um grau detectável maior (por exemplo, pelo menos 2 vezes sobre a marcação de fundo (background)) do que a sua hibridação a uma sequência de ácidos nucleicos não alvo e até a exclusão significativa dos ácidos nucleicos não alvo. As sequências que hibridizam seletivamente têm normalmente cerca de pelo menos 80% de identidade de sequência, ou 90% de identidade de sequência, e até inclusive 100% de identidade de sequência (ou seja, as sequências são totalmente complementares entre si).
[0222] O termo “condições estringentes” ou “condições estringentes de hibridização” faz referência às condições sob as quais uma sonda irá hibridizar seletivamente a sua sequência alvo em um ensaio de hibridização in vitro. Condições estringentes são dependentes da sequencia e serão diferentes em circunstâncias diferentes. Ao controlar a estringência da hibridização e/ou condições de lavagem, as sequências alvo que são 100% complementares a sonda, podem ser identificadas (sondagem homóloga). Alternativamente, as condições de estringência podem ser ajustadas para permitir algumas discrepâncias nas sequências de modo que graus menores de similaridade sejam detectados (sondagem heteróloga). Geralmente, uma sonda é menor do que cerca de 1000 nucleotídeos em comprimento, e opcionalmente menor do que 500 nucleotídeos em comprimento.
[0223] Normalmente, condições estringentes serão aquelas em que a concentração de sal é inferior a cerca de 1,5 M de íons de Na, normalmente em torno de 0,01 a 1,0 M de concentração de íons Na (ou outros sais) em pH de 7,0 a 8,3 e temperatura de pelo menos cerca de 30 °C para sondas curtas (por exemplo, 10 a 50 nucleotídeos) e pelo menos cerca de 60 °C para sondas longas (por exemplo, maiores que 50 nucleotídeos). Condições estringentes também podem ser obtidas pela adição de agentes de desestabilização, tal como a formamida. Exemplos de condições de baixa estringência incluem a hibridação com uma solução-tampão de 30 a 35% de formamida, NaCl 1 M, 1% de SDS (dodecil sulfato de sódio) a 37 °C, e uma lavagem em SSC 1X a 2X (SSC 20X = 3,0 M de NaCl / 0,3 M de citrato trissódico) entre 50 a 55 °C. Exemplos de condições de estringência moderada inclui a hibridização em 40 a 45% de formamida, 1 M de NaCl, 1% de SDS a 37 T, e uma lavagem em SSC 0,5X a 1X entre 55 a 60 T. Exemplos de condições de alta estringência inclui a hibridização em formamida 50%, NaCl 1 M, 1% de SDS a 37 T, e uma lavagem em SSC 0,1X entre 60 a 65 T.
[0224] “Identidade de sequência” e “identidade” no contexto de ácidos nucleicos ou sequências de polipeptídeos refere-se às bases de ácidos nucleicos ou resíduos de aminoácidos em duas sequências que são iguais quando alinhadas para uma correspondência máxima sobre uma janela de comparação especificada.
[0225] O termo “percentual de identidade da sequência” refere-se a valor determinado pela comparação de duas sequências otimamente alinhadas ao longo de uma janela de comparação, em que parte da sequência de polinucleotídeo ou polipeptídeo na janela de comparação pode conter adições ou deleções (ou seja, lacunas “gaps”) quando comparada com a sequência de referência (que não possui adições ou deleções) para o alinhamento ótimo das duas sequências. A porcentagem é calculada pela determinação do número de posições em que a mesma base de ácido nucleico ou resíduo de aminoácido ocorre em ambas às sequências para produzir o número de posições que se correspondem, dividindo o número de posições que se correspondem pelo número total de posições na janela de comparação, e multiplicando o resultado por 100 para dar a porcentagem de identidade de sequência. Exemplos úteis de percentual de identidade de sequência incluem, mas não estão limitados a, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, ou 95%, ou qualquer porcentagem inteira entre 50% e 100% de identidade de sequência. Estas identidades podem ser determinadas usando qualquer um dos programas descritos na presente divulgação.
[0226] Os alinhamentos da sequência e os cálculos da percentagem de identidade e similaridade podem ser determinados por meio de uma variedade de métodos de comparação para a detecção de sequências homólogas, incluindo, mas não se limitando ao programa Megalign®, da LASERGENE® bioinformática computação (DNASTAR® Inc., Madison, Wl). No contexto do presente pedido, é preciso entender que, quando o software de análise de sequência é utilizado para a análise, os resultados da análise serão baseados nos “valores predefinidos” ou “parâmetros predefinidos” do programa referenciado, salvo quando indicado de outra forma. Conforme utilizado no presente “valores predeterminados” (default) ou “valores-padrão” significa qualquer conjunto de valores ou parâmetros originalmente carregados com o software quando este é inicializado pela primeira vez.
[0227] O “método de alinhamento Clustal V” corresponde ao método de alinhamento classificado Clustal V (descrito por Higgins e Sharp, CABIOS 5:151-153 (1989), Higgins, D.G. et al. (1992) Comput. Appl. Biosci 8:189-191) e encontrado no programa MegAlign® da LASERGENE® bioinformática computação (DNASTAR Inc., Madison, WI). Para alinhamentos múltiplos, os valores padrão correspondem a GAP PENALTY = 10 e GAP LENGTH PENALTY = 10. Os parâmetros padrão para alinhamentos pareados e o cálculo da percentagem de identidade das sequências de proteínas utilizando o método Clustal são KTUPLE = 1, GAP PENALTY = 3, WINDOW = 5 e DIAGONALS SAVED = 5. Para ácidos nucleicos estes parâmetros são KTUPLE = 2, GAP PENALTY=5, WINDOW=4 e DIAGONALS SAVED=4. Após o alinhamento das sequências utilizando o programa Clustal V, é possível obter uma “percentagem de identidade” pela visualização da tabela “distâncias de sequência” no mesmo programa.
[0228] O “método de alinhamento Clustal W” corresponde ao método de alinhamento Clustal W marcado (descrito por Higgins e Sharp, (1989) CABIOS 5:151-153;. Higgins, D.G. et al, Comput Appl Biosci. (1992) 8:189-191) e encontrado no programa MegAlign® v6.1 da Lasergene® bioinformatics computing suíte (DNASTAR Inc., Madison, WI). Os parâmetros padrão para o alinhamento múltiplo são: (GAP PENALTY=10, GAP LENGTH PENALTY=0.2, Delay Divergen Seqs (%)=30, DNA Transition Weight=0.5, Protein Weight Matrix=Gonnet Series, DNA Weight Matrix=IUB). Após o alinhamento das sequências utilizando o programa Clustal W, é possível obter uma “percentagem de identidade” pela visualização da tabela “distâncias de sequência” no mesmo programa.
[0229] Salvo indicação de outra forma, os valores de identidade/similaridade de sequências proporcionados na presente divulgação referem-se ao valor obtido usando GAP versão 10 (GCG, Accelrys, San Diego, CA) utilizando os seguintes parâmetros: % identidade e % similaridade para uma sequência de nucleotídeos utilizando um peso de penalidade pela criação de GAP de 50 e um peso de penalidade pelo comprimento do gap de 3, e a matriz de pontuação nwsgapdna.cmp; % de identidade e % similaridade para uma sequência de aminoácidos utilizando um peso de penalidade pela criação de GAP de 8 e uma penalidade pelo comprimento do gap de 2, e a matriz de pontuação BLOSUM62 (Henikoff e Henikoff, (1989) Proc. Natl. Acad. Sci. USA 89: 10915). O GAP utiliza o algoritmo de Needleman e Wünsch (1970) J. Mol. Biol. 48:443-53) para encontrar o alinhamento de duas sequências completas que maximiza o número de comparáveis e minimiza o número lacunas (gaps). GAP considera todos os alinhamentos possíveis e posições de gaps e cria o alinhamento com o maior número de bases pareadas e menor número de lacunas, usando uma penalidade de criação de gaps e uma penalidade pela extensão de gaps em unidades de bases paredas.
[0230] “BLAST” é um algoritmo de busca fornecidos pelo Centro Nacional de Informações sobre Biotecnologia (NCBI) usado para localizar regiões de similaridade entre sequências biológicas. O programa compara as sequências de nucleotídeos ou bases de dados de sequências de proteínas e calcula a significância estatística dos resultados para identificar sequências com similaridade suficiente com uma sequência de pesquisa de modo que a similaridade não seria prevista como ocorrendo de forma aleatória. O BLAST divulga as sequências identificadas e seu alinhamento local para a sequência de consulta.
[0231] É bem compreendido por um técnico no assunto que muitos níveis de identidade da sequência são úteis na identificação de polipeptídeos, a partir de outras espécies ou naturalmente ou sinteticamente modificadas, onde tais polipeptídeos têm a mesma ou similar função ou atividade. Exemplos úteis de porcentagem de identidade incluem, mas não estão limitados a, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90% ou 95%, ou qualquer percentual inteiro de 50% a 100%. De fato qualquer numero inteiro de identidade de aminoácido de 50% a 100% pode ser útil na descrição da presente divulgação, tal como 51%, 52%, 53%, 54%, 55%, 56%, 57%, 58%, 59%, 60%, 61%, 62%, 63%, 64%, 65%, 66%, 67%, 68%, 69%, 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% ou 99%.
[0232] “Gene” inclui um fragmento de ácido nucleico que expressa uma molécula funcional, tal como, mas não se limitando a, uma proteína específica, incluindo sequências regulatórias anteriores (sequências não codificantes 5’) e posteriores (sequências não codificantes 3') a sequência codificante. “Gene nativo” se refere a um gene como encontrado na natureza, com as suas próprias sequências regulatórias.
[0233] Um “gene mutado” é um gene que foi alterado por meio da intervenção humana. Tal “gene mutado” possui uma sequência que difere da sequência do gene não mutado correspondente pela adição, deleção ou substituição em pelo menos um nucleotídeo. Em determinados exemplos de realização da presente descrição, o gene mutado compreende uma alteração que resulta de um sistema de polinucleotídeo guia/endonuclease CAS, tal como revelado na presente divulgação. Uma planta mutada é uma planta que compreende um gene mutado.
[0234] Conforme utilizando na presente divulgação, uma “mutação direcionada” é uma mutação em um gene nativo que foi feita por alteração de uma sequência alvo no interior do gene nativo usando um método que envolva um agente de indução de quebra de dupla fita capaz de induzir uma quebra de dupla fita no DNA da sequência alvo, tal como divulgado na presente invenção ou como conhecido no estado da técnica.
[0235] Em um exemplo de realização, a mutação direcionada é o resultado da adição de um gene induzida pelo RNA guia/endonuclease Cas, conforme descrito na presente divulgação. A mutação direcionada induzida pelo RNA guia/endonuclease Cas pode ocorrer em uma sequência de nucleotídeos que está localizada dentro ou fora de um sítio alvo genômico que é reconhecido e clivado por uma endonuclease Cas.
[0236] O termo “genoma” da forma como é utilizado no presente quando este se refere a uma célula vegetal, abrange não só o DNA cromossômico encontrado dentro do núcleo, mas também o DNA de organelas encontrado dentro dos componentes subcelulares (por exemplo, nas mitocôndrias ou plastídeos) das células.
[0237] Um “gene códon-modificado” ou “gene códon-preferido” ou “gene códon-otimizado” é um gene possuindo a sua frequência de utilização de códons projetada para mimetizar a frequência de utilização de códons preferida da célula hospedeira.
[0238] Um “alelo” é uma das várias formas alternativas de um gene ocupando um dado locus em um cromossomo. Quando todos os alelos presentes em um determinado locus de um cromossomo são os mesmos, diz- se que a planta é homozigota naquele locus. Se os alelos presentes em um determinado locus de um cromossomo diferem, diz-se que a planta é heterozigota naquele locus.
[0239] “Sequência codificante” refere-se a uma sequência de polinucleotídeo que codifica uma sequência de aminoácido específica. “Sequências de regulação” ou “sequências regulatória” referem-se a sequências de nucleotídeos localizadas a montante (sequência 5’ não codificante), no interior, ou a jusante (sequência 3’ não codificante) de uma sequência codificante, e que influenciam a transcrição, processamento ou estabilidade do RNA, ou tradução da sequência codificante associada. As sequências reguladoras podem incluir, mas não estão limitadas a: promotores, sequências líderes de tradução, sequências 5’ não traduzidas, sequências 3’ não traduzidas, íntrons, sequências alvo de poliadenilação, sítios de processamento de RNA, sítio de ligação efetora e estrutura stem-loop.
[0240] “Uma sequência de nucleotídeos otimizada para planta (ou planta-otimizada)” é uma sequência nucleotídica que foi otimizada para a expressão aumentada em plantas, em particular para o aumento da expressão em plantas ou em uma ou mais plantas de interesse. Por exemplo, uma sequência de nucleotídeos planta-otimizada pode ser sintetizada pela modificação de uma sequência de nucleotídeos que codifica uma proteína, tal como, por exemplo, agente indutor de quebra de dupla fita (por exemplo, uma endonuclease), tal como revelado no presente, utilizando um ou mais códons preferidos da planta para a expressão melhorada. Vide, por exemplo, Campbell e Gowri (1990) Plant Physiol 92:1-11 para uma discussão da utilização de códons preferidos para o hospedeiro.
[0241] Métodos estão disponíveis no estado da técnica para a síntese de genes preferida em plantas. Vide, por exemplo, as Patentes US 5.380.831, e US 5.436.391, e Murray et al. (1989) Nucleic Acids Res. 17:477498, incorporado ao presente pela referência. Modificações de sequências adicionais são conhecidas por aumentar a expressão do gene em uma planta hospedeira. Estes incluem, por exemplo, a eliminação de: uma ou mais sequências codificantes de sinais de poliadenilação espúrios, um ou mais sinais de sítio de junção éxon-íntron, uma ou mais repetições semelhantes a transposon, e outras dessas sequências bem caracterizadas que podem ser deletérias para a expressão gênica. O teor de G-C da sequência pode ser ajustado para a média dos níveis para um dado hospedeiro celular, conforme calculado pela referência a genes conhecidos expressos na célula hospedeira. Quando possível, a sequência é modificada para evitar estruturas de mRNA secundárias em hairpin previstas. Assim, “uma sequência de nucleotídeos planta-otimizada” da presente divulgação compreende um ou mais de tais modificações na sequência.
[0242] O termo “promotor” refere-se a uma sequência de DNA capaz de controlar a expressão de uma sequência codificante ou RNA funcional. A sequência promotora consiste de elementos proximais e distais a montante, os últimos elementos, são muitas vezes referidos como facilitadores (enhancers). Um “facilitador” (enhancer) é uma sequência de DNA que pode estimular a atividade do promotor, e pode ser um elemento inato do promotor ou um elemento heterólogo inserido para aumentar o nível ou especificidade tecidual de um promotor. Os promotores podem ser obtidos em sua totalidade a partir de um gene nativo, ou podem ser compostos por diversos elementos provenientes de diferentes promotores encontrados na natureza, e/ou mesmo compreender segmentos de DNA sintético. É compreendido pelos técnicos no assunto que diferentes promotores podem direcionar a expressão de um gene em diferentes tecidos ou tipos celulares, ou em diferentes estágios de desenvolvimento, ou em resposta a diferentes condições ambientais. É ainda reconhecido que, como na maioria dos casos, os limites exatos das sequências reguladoras não foram completamente definidos, e os fragmentos de DNA com algumas variações podem ter atividade promotora idêntica. Promotores que fazem com que um gene seja expresso na maioria dos tipos celulares são na maioria das vezes comumente referidos como “promotores constitutivos”.
[0243] Demonstrou-se que certos promotores são capazes de controlar a síntese de RNA a uma taxa mais elevada do que outros. Estes são chamados de “promotores fortes”. Foi demonstrado que certos promotores controlam a síntese de RNA em níveis elevados apenas em determinados tipos de células ou tecidos e são frequentemente referidos como “promotores tecido- específicos” ou “promotores tecido-preferidos”, se os promotores direcionam a síntese de RNA preferencialmente em determinados tecidos, mas em níveis reduzidos em outros tecidos. Uma vez que os padrões de expressão de um gene quimérico (ou genes) introduzidos em uma planta são controlados usando promotores, existe um interesse contínuo no isolamento de novos promotores que são capazes de controlar a expressão de um gene (ou genes) quimérico em determinados níveis em tipos de tecido específicos ou em estágios de desenvolvimento vegetal específicos.
[0244] Alguns exemplos de realização das divulgações se relacionam com os recém-descobertos promotores U6 da RNA polimerase III, GM-U6-13.1 (SEQ ID NO: 120), tal como descrito no Exemplo 12 e GM-U6-9.1 (SEQ ID NO: 295) tal como descrito no Exemplo 19.
[0245] Exemplos composições e métodos não limitativos relacionados com os promotores de soja descritos no presente são os seguintes: A1. Uma construção de DNA recombinante compreendendo uma sequência de nucleotídeos que compreende qualquer uma das sequências apresentada na SEQ ID NO: 120 ou SEQ ID NO: 295, ou um fragmento funcional destas sequências, operacionalmente ligada a pelo menos uma sequência heteróloga, em que a referida sequência de nucleotídeos é um promotor. A2. A construção de DNA recombinante, de acordo com o exemplo de realização A1, em que a sequência de nucleotídeos de possui pelo menos 95% de identidade, com base no método de alinhamento Clustal V com parâmetros-padrão de alinhamento aos pares (KTUPLE=2, GAP PENALTY=5, WINDOW=4 e DIAGONALS SAVED=4), quando comparada com a sequência descrita na SEQ ID NO: 120 ou SEQ ID NO: 295. A3. Um vetor compreendendo uma construção de DNA recombinante do exemplo de realização A1. A4. Uma célula compreendendo a construção de DNA recombinante do exemplo de realização A1. A5. A célula do exemplo de realização A4, em que a célula é uma célula vegetal. A6. planta transgênica possuindo uma construção de DNA recombinante estavelmente incorporada em seu genoma, de acordo com o exemplo de realização A1. A7. A planta transgênica de acordo com o exemplo de realização A6, em que a referida planta é uma planta dicotiledônea. A8. A planta transgênica de acordo com o exemplo de realização A7, em que a planta é soja. A9. Uma semente transgênica produzida pela planta transgênica do exemplo de realização A7, em que a semente transgênica compreende a construção de DNA recombinante. A10. A construção de DNA recombinante, de acordo com o exemplo de realização A1, em que a pelo menos uma sequência nucleotídica heteróloga codifica um gene selecionado a partir do grupo que consiste de: um gene repórter, um marcador de seleção, um gene que confere resistência à doença, um gene que confere resistência a herbicida, um gene que confere resistência a inseto; um gene envolvido no metabolismo de carboidratos, um gene envolvido no metabolismo de ácido graxo, um gene envolvido no metabolismo de aminoácidos, um gene envolvido no desenvolvimento da planta, um gene envolvido na regulação do crescimento da planta, um gene envolvido na melhora de rendimento, um gene envolvido com a resistência à seca, um gene envolvido com a resistência ao frio, um gene envolvido com a resistência ao calor e um gene envolvido com a resistência ao sal em plantas. A11. A construção de DNA recombinante, de acordo com o exemplo de realização A1, em que a pelo menos uma sequência heteróloga codifica uma proteína selecionada a partir do grupo que consiste de: uma proteína repórter, um marcador de seleção, uma proteína que confere resistência às doenças, uma proteína que confere resistência a herbicida, uma proteína que confere resistência a inseto; uma proteína envolvida no metabolismo de carboidratos, uma proteína envolvida no metabolismo dos ácidos graxos, uma proteína envolvida no metabolismo de aminoácidos, uma proteína envolvida no desenvolvimento da planta, uma proteína envolvida na regulação do crescimento da planta, uma proteína envolvidas no melhoramento do rendimento da planta, uma proteína envolvida na resistência à seca, uma proteína envolvida na resistência ao frio,uma proteína envolvida na resistência ao calor e uma proteína envolvida na resistência ao sal em plantas. A12. Um método de expressão de uma sequência codificante ou um RNA funcional em uma planta, compreendendo: a) a introdução da construção de DNA recombinante de acordo com o exemplo de realização A1 na planta, em que a pelo menos uma sequência heteróloga compreende uma sequência codificante ou codifica um RNA funcional; b) o cultivo da planta da etapa a); e c) a seleção de uma planta que exibe expressão da sequência codificante ou o RNA funcional da construção de DNA recombinante. d) 3. método de alterar transgenicamente uma característica vegetal comercial, compreendendo: a) ) introdução da construção de DNA recombinante de acordo com o exemplo de realização A1 na planta; b) cultivar uma planta fértil, madura resultante da etapa a); e c) a seleção de uma planta que expressa a pelo menos uma sequência heteróloga em pelo menos um tecido vegetal com base na característica comercial alterada. A14. O método de acordo com o exemplo de realização A13, caracterizado pelo fato de que a característica comercial é selecionada a partir do grupo consistindo de: resistência às doenças, resistência a herbicida, metabolismo de carboidratos, resistência aos insetos, metabolismo de ácidos graxos, metabolismo de aminoácidos, desenvolvimento da planta, regulação do crescimento da planta, melhora do rendimento, resistência à seca, resistência ao frio, resistência ao calor, e resistência ao sal. d) 5. Um método para alterar a expressão de pelo menos uma sequência heteróloga em uma planta, compreendendo: (a) a transformação de uma célula vegetal com a construção de DNA recombinante do exemplo de realização A1; (b) o cultivo das plantas maduras férteis a partir da célula vegetal transformada da etapa (a); e (c) seleção de plantas contendo a célula vegetal transformada, em que a expressão da sequência heteróloga está aumentada ou diminuída. A16. O método de acordo com o exemplo de realização A15, em que a planta é uma planta de soja. A17. Uma planta estavelmente transformada com uma construção de DNA recombinante que compreende um promotor de soja e um fragmento de ácido nucleico heterólogo operacionalmente ligado ao referido promotor, em que o referido promotor é capaz de controlar a expressão do referido fragmento de ácido nucleico heterólogo em uma célula vegetal, e ainda o referido promotor compreende qualquer uma das sequências expostas nas SEQ ID NOs: 120 ou 295.
[0246] Novos promotores de diversos tipos úteis em células vegetais estão sendo constantemente descobertos; inúmeros exemplos podem ser encontrados na compilação de Okamuro, e Goldberg, (1989) em: The Biochemistry of Plants, Vol 115 Stumpf e Conn, eds (Nova Iorque, NY: Academic Press), págs. 1-82.
[0247] A “sequência líder de tradução” refere-se a uma sequência nucleotídica localizada entre a sequência do promotor de um gene e a sequência codificante. A sequência líder de tradução está presente no mRNA a montante da sequência de inicio da tradução. A sequência líder de tradução pode afetar o processamento do transcrito primário em mRNA, estabilidade do mRNA e/ou eficiência da tradução. Exemplos de sequências líderes de tradução foram descritos (por exemplo, Turner e Foster, (1995) Mol Biotechnol 3:225-236).
[0248] As “sequências 3’ não codificantes”“, “terminador de transcrição” ou “sequência de terminação” referem-se às sequências de DNA localizadas a jusante de uma sequência codificante e inclui uma sequência de reconhecimento de poliadenilação e outras sequências que codificam sinais reguladores da codificação capazes de afetar o processamento do mRNA ou a expressão gênica. O sinal de poliadenilação é normalmente caracterizado por afetar a adição de tratos de ácido poliadenílico na extremidade 3' do mRNA precursor. A utilização de diferentes sequências não codificantes 3’ é exemplificada por Ingelbrecht I. L. et al. (1989) Plant Cell 1:671-680.
[0249] “Transcrito de RNA” refere-se ao produto resultante a partir da transcrição catalisada pela RNA polimerase de uma sequência de DNA. Quando o transcrito de RNA é uma cópia complementar perfeita da sequência de DNA, ele é referido como transcrito primário ou pré-RNA. Um transcrito de RNA é referido como RNA maduro quando ele é uma sequência de RNA derivada do processamento pós-transcricional do transcrito primário pré-RNAt. O “RNA mensageiro” ou “mRNA” refere-se ao RNA que está sem os íntrons e que pode ser traduzido em proteína pela célula. “cDNA” refere-se a um DNA que é complementar a, sintetizados a partir de, um mRNA molde usando a enzima transcriptase reversa. O cDNA pode ser de fita simples ou convertido na forma de fita-dupla usando o fragmento Klenow da DNA polimerase I. RNA “sense” refere-se ao RNA transcrito que inclui o mRNA e pode ser traduzido em proteína dentro de uma célula ou in vitro. RNA “antisense” refere-se a uma transcrição de RNA que é complementar a totalidade ou parte da transcrição primaria alvo ou mRNA, e que bloqueia a expressão de um gene alvo (vide, por exemplo a Patente US 5.107.065). A complementaridade de um RNA antisense pode estar em qualquer parte do gene transcrito específico, ou seja, na sequência não codificante 5’, sequência não codificante 3', íntrons ou sequência codificante. "RNA funcional" refere-se a RNA antisense, RNA ribozima, ou outro RNA que não pode ser traduzidos, mas ainda tem um efeito sobre os processos celulares. Os termos “complemento” e “complemento reverso” são utilizados no presente de modo indiferente em relação aos mRNAs transcritos, e destinam-se a definir o RNA antisense da mensagem.
[0250] O termo “operacionalmente ligado” refere-se a associação de sequências de ácidos nucleicos em um único fragmento de ácido nucleico, de modo que a função de uma é regulada pelo outra. Por exemplo, um promotor é operacionalmente ligado a uma sequência codificadora quando esta é capaz de regular a expressão da sequência codificadora (ou seja, a sequência codificadora está sob o controle transcricional do promotor). As sequências codificantes podem estar operacionalmente ligadas às sequências reguladoras em uma orientação sense ou antisense. Em outro exemplo, as regiões de RNA complementares da podem estar operacionalmente ligadas, direta ou indiretamente, a 5' do mRNA alvo, ou a 3' do mRNA alvo, ou dentro do mRNA alvo, ou uma primeira região complementar está 5' e seu complemento está a 3' do mRNA alvo.
[0251] Técnicas-padrão de DNA recombinante e de clonagem molecular utilizadas na presente divulgação são bem conhecidas no estado da técnica e estão descritas mais detalhadamente em Sambrook, e al., Molecular Cloning: A Laboratory Manual, Cold Spring Harbor Laboratory: Cold Spring Harbor, NY 1989. Os métodos de transformação são bem conhecidos pelos técnicos hábeis no assunto e estão descritos abaixo.
[0252] “PCR” ou “reação em cadeia da polimerase” é uma técnica para a síntese de segmentos específicos de DNA e consiste de uma série de ciclos repetitivos de desnaturação, anelamento e extensão. Normalmente, um DNA dupla fita é desnaturado pelo calor, os dois primers complementares as extremidades 3’ do segmento alvo são anelados ao DNA em uma temperatura mais baixa e, em seguida, a extensão corre em uma temperatura intermediária. Um conjunto destas três etapas consecutivas é referido como um “ciclo”.
[0253] O termo “recombinante” refere-se a uma combinação artificial de dois segmentos diferentes separados de uma sequência, por exemplo, por síntese química ou manipulação de segmentos isolados de ácidos nucleicos através de técnicas de engenharia genética.
[0254] Os termos “plasmídeo”, “vetor” e “cassete” referem-se a um elemento extracromossômico que geralmente carregam genes que não fazem parte do metabolismo central da célula e, normalmente, estão sob a forma de DNA fita dupla. Tais elementos podem ser sequências que se replicam autonomamente, sequências de integração do genoma, fago ou sequências de nucleotídeos, na forma linear ou circular, de um DNA ou RNA de fita simples ou de fita-dupla, provenientes de qualquer fonte, no qual uma variedade de sequências nucleotídicas foram unidas ou recombinadas em uma única construção que é capaz de introduzir um polinucleotídeo de interesse em uma célula. “Cassete de transformação” refere-se a um vetor específico contendo um gene e possuindo elementos além do gene que facilita a transformação de uma célula hospedeira específica. Um “cassete de expressão” refere-se a um vetor específico contendo um gene e possuindo elementos além do gene que permite uma expressão melhorada daquele gene em um hospedeiro.
[0255] Os termos “molécula de DNA recombinante”, “construção recombinante” “construção de expressão”, “construção” e “construção de DNA recombinante” são utilizados de maneira alternada na presente invenção. A construção recombinante compreende uma combinação artificial de fragmentos de ácido nucleico, por exemplo, sequências regulatórias e codificantes que não são totalmente encontradas juntas na natureza. Por exemplo, uma construção pode incluir sequências regulatórias e sequências codificadoras que são provenientes de fontes diferentes, ou sequências regulatórias e sequências codificadoras derivadas da mesma origem, mas dispostas de uma maneira diferente daquela encontrada na natureza. Tais construções podem ser usadas sozinhas ou podem ser usadas em conjunto com um vetor. Se um vetor é utilizado, então a escolha do vetor é dependente do método que será usado para transformar células hospedeiras, como é bem conhecido pelos técnicos hábeis no assunto. Por exemplo, um vetor plasmidial pode ser usado. Os especialistas na técnica estão cientes dos elementos genéticos que devem estar presentes no vetor de modo a transformar com sucesso, selecionar e propagar as células hospedeiras. Os técnicos no assunto também reconhecerão que diferentes eventos de transformação independentes podem resultar em diferentes níveis e padrões de expressão (Jones et al. EMBO J. 4:2411 -2418 (1985), De Almeida et al. (1989) Mol. Gen. Genetics 218:78 -86) e, portanto, que diversos eventos são tipicamente selecionados afim de se obter linhagens exibindo o nível e o padrão de expressão desejado. Tal rastreamento pode ser conseguido por ensaios moleculares biológicos, bioquímicos, e outros ensaios padrão, incluindo a análise Southern de DNA, análise Northern da expressão de mRNA, PCR, PCR em tempo real quantitativa (qPCR), PCR com transcrição reversa (RT-PCR), análise da expressão proteica por immunoblotting, ensaios enzimáticos ou de atividade, e/ou análise fenotípica.
[0256] O termo “expressão”, conforme usado no presente, refere- se à produção de um produto final funcional (por exemplo, um mRNA, RNA guia ou uma proteína) precursora ou madura.
[0257] O termo “introduzido” significa fornecer um ácido nucleico (por exemplo, construção de expressão) ou proteína em uma célula. “Introduzido” inclui referência à incorporação de um ácido nucleico em uma célula eucariótica ou procariótica, onde o ácido nucleico pode ser incorporado no genoma da célula, e faz referência ao fornecimento transitório de um ácido nucleico ou proteína para a célula. “Introduzido” inclui a referência aos métodos de transformação estáveis ou transitórios, bem como troca sexuada de material genético. Desse modo, o termo “introduzido” no contexto de inserção de um fragmento de ácido nucleico (por exemplo, uma construção de DNA recombinante/construção de expressão) em uma célula, significa “transfecção” ou “transformação” ou “transdução” e se refere à incorporação de um fragmento de ácido nucleico em uma célula eucariótica ou procariótica, em que o fragmento de ácido nucleico pode ser incorporado ao genoma da célula (por exemplo, ao DNA cromossômico, plasmidial, plastidial ou mitocondrial), convertido em um replicon autônomo ou expresso de maneira transitória (por exemplo, o transfectado com mRNA ).
[0258] Proteína “madura” refere-se a um polipeptídeo processado pós-traducionalmente (isto é, aquele a partir do qual qualquer pré-peptídeo ou pró-peptídeo presente no produto primário da tradução foram removidos). “Proteína precursora” refere-se ao produto primário da tradução de mRNA (ou seja, com pré- e pró-peptídeos ainda presentes). Pré- e pró-peptídeos podem ser e não estão limitados a sinais de localização intracelular.
[0259] “Transformação estável” refere-se à transferência de um fragmento de ácido nucleico em um genoma de um organismo hospedeiro, incluindo tanto genomas nucleares quanto de organelas, resultando em herança geneticamente estável. Em contrapartida, “transformação transitória” refere-se à transferência de um fragmento de ácido nucleico para o núcleo ou outra organela contendo DNA de um organismo hospedeiro resultando na expressão gênica sem integração ou herança estável. Organismos hospedeiros contendo os fragmentos de ácido nucleico transformados são referidos como organismos “transgênicos”.
[0260] O desenvolvimento comercial de germoplasmas geneticamente melhorados também avançou para a fase de introdução de múltiplas características em plantas de cultivo, muitas vezes referido como uma abordagem piramidação de genes (gene stacking). Nesta abordagem, múltiplos genes que conferem diferentes características de interesse podem ser introduzidos em uma planta. A piramidação de genes (gene stacking) pode ser realizada por diversos meios, incluindo, mas não se limitando a cotransformação, retransformação, e cruzamento de linhagens com diferentes genes de interesse.
[0261] Os termos “planta” ou “vegetal” referem-se à planta inteira, órgãos de plantas, tecidos vegetais, sementes, células vegetais, sementes e progênies das mesmas. As células vegetais incluem, sem se limitar a; células de sementes, culturas em suspensão, embriões, regiões meristemáticas, tecidos de calos, folhas, raízes, brotos, gametófitos, esporófitos, pólen e micrósporos. Partes da planta incluem tecidos diferenciados e indiferenciados incluindo, mas não limitado a: raízes, caules, brotos, folhas, pólens, sementes, tecido do tumor e várias formas de células e cultura (por exemplo, células isoladas, protoplastos, embriões e tecidos de calos). O tecido vegetal pode estar na planta ou em um órgão ou tecido da planta ou cultura de célula. Os termos “órgão da planta” ou “órgão vegetal” referem-se aos tecidos vegetais ou a um grupo de tecidos que constituem uma parte morfológica e funcionalmente distinta de uma planta. O termo “genoma” refere-se a todo o conjunto de material genético (genes e sequências não codificantes) que está presente em cada célula de um organismo, ou vírus ou organela; e/ou um conjunto completo de cromossomos herdados como uma unidade (haploide) a partir de um progenitor. “Progênie” compreende toda a geração subsequente de uma planta.
[0262] Uma planta transgênica inclui, por exemplo, uma planta que compreende dentro do seu genoma um polinucleotídeo heterólogo introduzido por uma etapa de transformação. O polinucleotídeo heterólogo pode estar integrado de maneira estável no genoma de modo que o polinucleotídeo é transmitido para as gerações sucessivas. O polinucleotídeo heterólogo pode estar integrado apenas no genoma ou como parte de uma construção de DNA recombinante. Uma planta transgênica pode também compreender mais do que um polinucleotídeo heterólogo em seu genoma. Cada polinucleotídeo heterólogo pode conferir uma característica diferente para a planta transgênica. Um polinucleotídeo heterólogo pode incluir uma sequência que se origina a partir de uma espécie estranha ou, se da mesma espécie, pode ser substancialmente modificado a partir da sua forma nativa. Transgênico pode incluir qualquer célula, linhagem de célula, calos, tecidos, plantas ou parte de plantas, cujo genótipo tenha sido alterado pela presença de ácido nucleico heterólogo incluindo os transgênicos inicialmente alterados, bem como aqueles criados pela troca sexuada de material genético ou propagação assexuada dos primeiros transgênicos. As alterações do genoma (cromossômica ou extracromossômica) por meio de métodos de melhoramento de plantas convencionais, pelo procedimento de edição do genoma descrito na presente divulgação que não resulta em uma inserção de um polinucleotídeo exógeno, ou pela ocorrência natural de eventos, tal como a fertilização cruzada aleatória, infecção viral não recombinante, transformação bacteriana não recombinante, transposição não recombinante, ou mutação espontânea não são consideradas como transgênicas.
[0263] Em determinados exemplos de realização da presente divulgação, uma planta fértil é uma planta que produz gametas masculinos e femininos viáveis e é autofértil. Tal planta autofértil pode produzir uma progênie vegetal sem a contribuição de qualquer outra planta de um gameta e o material genético nela contida. Outros exemplos de realização da invenção podem envolver o uso de uma planta que não é autofértil, pois a planta não produz gametas masculinos e gametas femininos, ou ambos, que são viáveis ou de outro modo capazes de desempenhar a fertilização. Conforme utilizado na presente divulgação, uma “planta estéril masculina” é uma planta que não produz gametas masculinos que são viáveis ou de outro modo capazes de fertilização. Conforme utilizado na presente divulgação, uma “planta estéril feminina” é uma planta que não produz gametas femininos que são viáveis ou de outro modo capazes de fertilização. Reconhece-se que plantas estéreis masculinas e estéreis femininas podem ser plantas férteis femininas e férteis masculinas, respectivamente. É ainda reconhecido que uma planta fértil- masculina (mas estéril-feminina) pode produzir descendência viável quando cruzada com uma planta fértil-feminina e que uma planta fértil-feminina (mas estéril-masculina) pode produzir descendência viável quando cruzada com uma planta fértil-masculina.
[0264] Um “centimorgan” (cM) ou “unidade de mapa” é a distância entre dois genes ligados, marcadores, sítios-alvo, loci, ou qualquer par destes, em que 1% dos produtos da meiose é recombinante. Assim, um centimorgan é equivalente a uma distância igual a uma frequência de recombinação média de 1% entre dois genes, marcadores, sítios-alvo, loci, ou qualquer par dos mesmos ligados..
TAMBÉM SÃO DIVULGADOS MÉTODOS DE MELHORAMENTO E SELEÇÃO UTILIZANDO UM SISTEMA DE DOIS COMPONENTES COM RNA GUIA E ENDONUCLEASE CAS.
[0265] A presente divulgação encontra uso na criação de plantas que compreendem uma ou mais características transgênicas. De modo geral, as características transgênicas são inseridas aleatoriamente ao longo do genoma da planta como uma consequência de sistemas de transformação baseados no Agrobacterium, biolística, ou outros procedimentos comummente utilizados. Mais recentemente, protocolos de direcionamento de genes têm sido desenvolvidos, permitindo a inserção direcionada do transgene. Uma tecnologia importante, integração sítio-específica (SSI) permite o direcionamento de um transgene para a mesma localização cromossômica como um transgene inserido anteriormente. Meganucleases customizadas e meganucleases dedo de zinco customizadas permitem aos pesquisadores projetar nucleases para o direcionamento a locais cromossômicos específicos e estes reagentes permitem o direcionamento de transgenes no local cromossômico clivado por estas nucleases.
[0266] Os sistemas atualmente utilizados para a engenharia genética de precisão de genomas eucarióticos, por exemplo, genomas vegetais, dependem de endonucleases de homing, meganucleases, nucleases dedo de zinco, e nucleases efetoras similares aos ativadores da transcrição (TALENS), que exigem a modificação de proteínas de novo para cada locus alvo novo. A DNA nuclease dirigida por RNA altamente específica, sistema RNA guia/endonuclease Cas9 descrito na presente divulgação, é mais facilmente personalizável e, portanto, mais útil quando o objetivo é a modificação de diversas sequências-alvo diferentes. A presente divulgação assume a vantagem adicional da natureza de ser um sistema de dois componentes, RNA guia/Cas, com o seu componente proteína constante, a endonuclease Cas, e o seu componente de direcionamento variável facilmente reprogramável, o RNA guia ou crRNA.
[0267] O sistema de RNA guia/Cas descrito na presente divulgação é especialmente útil para a modificação do genoma, especialmente a modificação do genoma vegetal, em circunstâncias em que o corte fora do alvo pela nuclease pode ser tóxico para as células. Em um exemplo de realização o sistema RNA guia/Cas descrito na presente divulgação, o componente constante, sob a forma de um gene Cas9 com expressão otimizada, é estavelmente integrado no genoma-alvo, por exemplo, genoma vegetal. A expressão do gene Cas9 está sob o controle de um promotor, por exemplo, promotor vegetal, que pode ser um promotor constitutivo, promotor tecido-específico ou promotor induzível, por exemplo, induzível pela temperatura, induzível pelo estresse, induzível pelo estágio de desenvolvimento, ou um promotor quimicamente induzível. Na ausência do componente variável, ou seja, RNA guia ou crRNA, a proteína Cas9 não é capaz de cortar DNA e, consequentemente, a sua presença na célula vegetal deve ter pouca ou nenhuma consequência. Assim, uma vantagem chave do sistema RNA guia/Cas descrita na presente divulgação é a capacidade de criar e manter uma linhagem celular ou organismo transgênico capaz de desempenhar expressão eficaz da proteína Cas9 com pouca ou nenhuma consequência para a viabilidade celular. A fim de induzir o corte em sítios genômicos desejados para conseguir modificações genéticas direcionadas, RNAs guias ou crRNAs podem ser introduzidos por uma variedade de métodos nas células contendo o gene Cas9 estavelmente integrado e expresso. Por exemplo, RNAs guias ou crRNAs podem ser sintetizados quimicamente ou enzimaticamente, e introduzidos nas células expressando Cas9 por métodos de entrega direta, tal como o bombardeamento de partículas ou eletroporação.
[0268] Alternativamente, os genes capazes de expressar eficientemente RNAs guias ou crRNAs nas células alvo podem ser sintetizados quimicamente, enzimaticamente ou em um sistema biológico, e estes genes podem ser introduzidos nas células que expressam Cas9 por métodos de entrega direta, tal como bombardeamento de partículas, eletroporação, ou por métodos de entrega biológicos, como a entrega de DNA mediada por Agrobacterium.
[0269] Um exemplo de realização da presente divulgação é um método para a seleção de uma planta compreendendo um sítio-alvo alterado em seu genoma, cujo método compreende: a) a obtenção de uma primeira planta compreendendo pelo menos uma endonuclease Cas capaz de introduzir uma quebra de dupla fita em um sítio alvo no genoma da planta; b) a obtenção de uma segunda planta que compreende um RNA guia capaz de formar um complexo com a endonuclease Cas de (a); c) o cruzamento da primeira planta de (a) com a segunda planta de (b); d) a avaliação da progênie de (c) para uma a presença da alteração no sítio alvo; e e) a seleção de uma planta descendente (progênie) que possui a alteração desejada do referido sítio alvo.
[0270] Outro exemplo de realização da presente divulgação é um método para a seleção de uma planta compreendendo um sítio-alvo alterado em seu genoma, cujo método compreende: a) a obtenção de uma primeira planta compreendendo pelo menos uma endonuclease Cas capaz de introduzir uma quebra de dupla fita em um sítio alvo no genoma da planta; b) a obtenção de uma segunda planta que compreende um RNA guia e um DNA doador, em que o referido RNA guia é capaz de formar um complexo com a endonuclease Cas de (a), e em que o referido DNA doador compreende um polinucleotídeo de interesse; c) o cruzamento da primeira planta de (a) com a segunda planta de (b); d) a avaliação da progênie de (c) para uma alteração no sítio alvo; e e) a seleção de uma planta descendente (progênie) que possui o polinucleotídeo de interesse inserido no referido sítio alvo.
[0271] Outro exemplo de realização da presente divulgação é um método para a seleção de uma planta compreendendo um sítio-alvo alterado em seu genoma, cujo método compreende a seleção de pelo menos uma planta descendente (progênie) que compreende uma alteração em um sítio- alvo em seu genoma, em que a referida planta descendente foi obtida pelo cruzamento de uma primeira planta expressando pelo menos uma endonuclease Cas com uma segunda planta compreendendo uma RNA guia e um DNA doador, em que a referida endonuclease Cas é capaz de introduzir uma quebra de dupla fita no referido sítio-alvo, em que o referido DNA doador compreende um polinucleotídeo de interesse.
[0272] Conforme divulgado na presente invenção, um sistema RNA guia/Cas mediando o direcionamento de genes pode ser utilizado em métodos para direcionar a inserção do transgene e/ou produção de loci de características transgênicas complexos compreendendo múltiplos transgenes de uma forma semelhante ao descrito no documento WO2013/0198888 (publicado em 1 de agosto de 2013), em que ao invés de usar um agente que induz a quebra de dupla fita em um gene de interesse, é usado um sistema RNA guia/Cas ou sistema polinucleotídeo guia/Cas conforme divulgado no presente. Em um exemplo de realização, um locus de característica transgênica complexo é um locus genômico que tem múltiplos transgenes geneticamente ligados uns aos outros. Através da inserção de transgenes independentes dentro de 0,1, 0,2, 0,3, 04, 0,5, 1, 2, ou mesmo 5 centimorgans (cM) um do outro, os transgenes podem ser produzidos como um único locus genético (vide, por exemplo, Pedido de patente US 13/427.138) ou Pedido PCT/US2012/030061. Após selecionar uma planta que compreende um transgene, as plantas que contêm (pelo menos) um transgenes podem ser cruzadas para formar um F1 que contém ambos os transgenes. Na progênie desta F1 (F2 ou BC1) 1/500 progênie teria os dois transgenes diferentes recombinados no mesmo cromossomo. O locus complexo pode então ser criado como locus genético único, com ambas as características transgênicas. Este processo pode ser repetido para piramidar tantas características como desejado.
[0273] Intervalos cromossômicos que se correlacionam com um fenótipo ou característica de interesse podem ser identificados. Diversos métodos conhecidos no estado da técnica estão disponíveis para a identificação de intervalos cromossômicos. Os limites de tais intervalos cromossômicos são delineados para abranger marcadores que estarão ligados ao gene que controla as características de interesse. Em outras palavras, o intervalo cromossômico é desenhado de tal modo que qualquer marcador que se encontre dentro desse intervalo (incluindo os marcadores terminais que definem os limites do intervalo) possa ser usado como um marcador da resistência à queima das folhas do milho (northern leaf blight). Em um exemplo de realização, o intervalo cromossômico compreende pelo menos um QTL e, além disso, pode de fato compreender mais do que um QTL. A proximidade de QTLs múltiplos no mesmo intervalo pode obscurecer a correlação de um marcador particular com um QTL particular, pois um marcador pode demonstrar a ligação a mais de um QTL. Inversamente, por exemplo, se dois marcadores em estreita proximidade exibem cosegregação com a característica fenotípica desejada, isto por vezes torna-se pouco claro se cada um destes marcadores identifica o mesmo QTL ou dois QTLs diferentes. O termo “locus controlador de característica quantitativa” ou “QTL” refere-se a uma região do DNA que está associada com a expressão diferencial de uma característica fenotípica quantitativa em pelo menos uma base genética, por exemplo, em pelo menos uma população de reprodução. A região do QTL abrange ou está estreitamente ligada ao gene ou genes que afetam a característica em questão. Um “alelo de um QTL” pode compreender múltiplos genes ou outros fatores genéticos dentro de um grupo de ligação ou região genômico contígua, tal como um haplótipo. Um alelo de um QTL pode denotar um haplótipo dentro de uma janela especificada em que a referida janela é uma região genômica contígua, que pode ser definida, e rastreada, com um conjunto de um ou mais marcadores polimórficos. Um haplótipo pode ser definido pela impressão digital única de alelos em cada marcador dentro da janela especificada.
[0274] Uma variedade de métodos estão disponíveis para identificar células que possuem um genoma alterado próximo ou dentro de um sítio alvo sem utilizar um fenótipo marcador detectável. Tais métodos podem ser vistos como a análise direta de uma sequência-alvo para detectar qualquer alteração na sequência alvo, incluindo, mas não se limitando a, os métodos de PCR, métodos de sequenciamento, digestão por nucleases, Southern blot, e qualquer combinação dos mesmos.
[0275] Proteínas podem ser alteradas de diversas maneiras incluindo substituições de aminoácidos, deleções, truncamentos e inserções. Os métodos para tais manipulações são geralmente conhecidos. Por exemplo, sequências de aminoácidos variantes da(s) proteína(s) podem ser preparadas por mutações no DNA. Os métodos para a mutagênese e alterações de sequência nucleotídicas incluem, por exemplo, Kunkel, (1985) Proc. Natl. Acad. Sci. USA 82:488-92; Kunkel et al., (1987) Meth Enzymol 154:367-82; Patente US 4.873.192; Walker e Gaastra, eds. (1983) Techniques in Molecular Biology (MacMillan Publishing Company, Nova Iorque) e as referências aí citadas. Orientações sobre substituições de aminoácidos não susceptíveis de afetar a atividade biológica da proteína são encontradas, por exemplo, no modelo de Dayhoff et al., (1978) Atlas of Protein Sequence and Structure (Natl Biomed Res Found, Washington, DC). Substituições conservadoras, como a troca de um aminoácido por outro com propriedades semelhantes, podem ser preferíveis. Não é esperado que deleções, inserções e substituições de aminoácidos conservadoras produzam alterações radicais nas características da proteína, e o efeito de qualquer substituição, deleção, inserção, ou uma combinação destes pode ser avaliado por ensaios de rastreio rotineiros. Os ensaios para atividade da indução de quebra de dupla fita são conhecidos e geralmente medem a atividade global e especificidade do agente sobre substratos de DNA contendo sítios-alvo.
[0276] Uma variedade de métodos é conhecida para a introdução de sequências de nucleotídeos e polipeptídeos em um organismo, incluindo, por exemplo, a transformação, cruzamento sexual, e introdução do polipeptídeo, DNA ou mRNA na célula.
[0277] Métodos para contatar, proporcionar, e/ou introduzir uma composição em vários organismos são conhecidos e incluem, mas não estão limitados a, métodos de transformação estável, métodos de transformação transitória, métodos mediados por vírus e reprodução sexual. A transformação estável indica que o polinucleotídeo introduzido se integra no genoma do organismo e é capaz de ser herdado pela sua progênie. A transformação transitória indica que a composição introduzida é expressa apenas temporariamente ou está temporariamente presente no organismo.
[0278] Protocolos para a introdução de polinucleotídeos e polipeptídeos em plantas podem variar em função do tipo de planta ou célula vegetal alvo para a transformação, tal como monocotiledôneas ou dicotiledôneas. Métodos adequados de introdução de polipeptídeos e polinucleotídeos em células de planta incluem microinjeção (Crossway et al (1986) Biotechniques 4:320-334), eletroporação (Riggs et al., (1986) Proc. Natl. Acad. Sei. USA 83:5602-5606, transformação mediada por Agrobacterium (Patentes US 5.563.055 e US 5.981.840), transferência direta de gene (Paszkowski et al. (1984) EMBO J. 3:2717-2722) e aceleração de partículas balística (Patente US 4.945.050; US 5.879.918; US 5.886.244; US 5.932.782; Tomes et al., (1995) “Direct DNA Transfer into Intact Plant Cells via Microprojectile Bombardment” em Plant Cell, Tissue, and Organ Culture: Fundamental Methods, ed. Gamborg & Phillips (Springer-Verlag, Berlin); McCabe et al., (1988) Biotechnology 6:923-6; Weissinger et al., (1988) Ann Rev Genet 22:421-77; Sanford et al., (1987) Particulate Science and Technology 5:27-37 (cebola); Christou et al., (1988) Plant Physiol 87:671-4 (soja); Finer e McMullen, (1991) In Vitro Cell Dev Biol 27P:175-82 (soja); Singh et al., (1998) Theor Appl Genet 96:319-24 (soja); Datta et al., (1990) Biotechnology 8:736-40 (rice); Klein et al., (1988) Proc. Natl. Acad. Sci. USA 85:4305-9 (milho); Klein et al., (1988) Biotechnology 6:559-63 (milho); Patente US 5.240.855; US 5.322.783 e 5,324,646; Klein et al., (1988) Plant Physiol 91:440-4 (milho); Fromm et al., (1990) Biotechnology 8:833-9 (milho); Hooykaas-Van Slogteren et al., (1984) Nature 311:763-4; Patente US 5.736.369 (cereais); Bytebier et al., (1987) Proc. Natl. Acad. Sci. USA 84:5345-9 (Liliaceae); De Wet et al., (1985) em The Experimental Manipulation of Ovule Tissues, ed. Chapman et al., (Longman, New York), págs. 197-209 (pólen); Kaeppler et al., (1990) Plant Cell Rep 9:415-8) e Kaeppler et al., (1992) Theor Appl Genet 84:560-6 (transformação mediada por fibras (whisker)); D'Halluin et al., (1992) Plant Cell 4:1495-505 (eletroporação); Li et al., (1993) Plant Cell Rep 12:250-5; Christou e Ford (1995) Annals Botany 75:407-13 (arroz) e Osjoda et al., (1996) Nat Biotechnol 14:745-50 (milho via Agrobacterium tumefaciens).
[0279] Alternativamente as construções de nucleotídeos podem ser introduzidas em plantas através do contato das plantas com um vírus ou ácidos nucleicos virais. De modo geral, tais métodos envolvem a incorporação de um polinucleotídeo dentro de uma molécula de DNA ou RNA viral. Em alguns exemplos de um polipeptídeo de interesse podem ser inicialmente sintetizadas como parte de uma poliproteína viral, o qual é depois processada por proteólise in vivo ou in vitro para produzir a proteína recombinante desejada. Métodos para a introdução de polinucleotídeos em plantas e a expressão de uma proteína ali codificada, envolvendo moléculas de RNA ou DNA virais, são bem conhecidos no estado da técnica, vide, por exemplo, as Patentes US 5.889.191, US 5.889.190, US 5.866.785, US 5.589.367 e US5.316.931. Métodos de transformação transitória incluem, mas não estão limitados a, introdução de polipeptídeos, tal como um agente de quebra de dupla fita, diretamente para o organismo, introdução de polinucleotídeos, como polinucleotídeos de DNA e/ou RNA, e introdução do RNA transcrição, como um mRNA que codifica um agente indutor de quebra de dupla fita, no organismo. Tais métodos incluem, por exemplo, microinjeção ou bombardeamento de partículas. Vide, por exemplo Crossway et al., (1986) Mol Gen Genet 202:17985; Nomura et al., (1986) Plant Sci 44:53-8; Hepler et al., (1994) Proc. Natl. Acad. Sci. USA 91:2176-80; e Hush et al., (1994) J Cell Sci 107:775-84.
[0280] O termo “dicotiledônea” refere-se à subclasse de plantas angiospérmicas também conhecida como “Dicotyledoneae” e inclui referência às plantas inteiras, órgãos vegetais (por exemplo, folhas, caules, raízes, etc.), sementes, células vegetais, e a progênie das mesmas. Células vegetais, tal como utilizado na presente divulgação, incluem, sem se limitar; sementes, culturas em suspensão, embriões, regiões meristemáticas, tecidos de calos, folhas, raízes, brotos, gametófitos, esporófitos, pólen e micrósporos.
[0281] O termo “cruzado” ou “cruzar” ou “cruzamento” no contexto da presente divulgação significa a fusão de gametas através da polinização para produzir descendentes (ou seja, células, sementes ou plantas). O termo abrange tanto os cruzamentos sexuais (a polinização de uma planta por outra) como a autofecundação (autopolinização, ou seja, quando o pólen e óvulo (ou microesporos e megaesporos) são da mesma planta ou de plantas geneticamente idênticas).
[0282] O termo “introgressão” refere-se à transmissão de um alelo desejado de um locus genético a partir de uma base genética para outra. Por exemplo, a introgressão de um alelo desejado em um locus especificado pode ser transmitida para pelo menos uma progênie por meio de um cruzamento sexual entre duas plantas progenitoras, se pelo menos uma das plantas progenitoras possui o alelo desejado em seu genoma. Alternativamente, a transmissão de um alelo pode ocorrer, por exemplo, pela recombinação entre os dois genomas doadores, por exemplo, em um protoplasto fundido, onde pelo menos um dos protoplastos doador tem o alelo desejado em seu genoma. O alelo desejado pode ser, por exemplo, um transgene, um alelo nativo modificado (editado ou mutado), ou um alelo de um marcador selecionado ou QTL.
[0283] Os métodos padrão de isolamento de DNA, purificação, clonagem molecular, construção do vetor, e verificação/caracterização estão bem estabelecidos, vide, por exemplo, Sambrook et al, (1989) Molecular Cloning: A Laboratory Manual, (Cold Spring Harbor Laboratory Press, Nova Iorque). Os vetores e as construções incluem plasmídeos circulares, e polinucleotídeos lineares compreendendo um polinucleotídeo de interesse e, opcionalmente, outros componentes, incluindo ligantes, adaptadores, regiões reguladoras, íntrons, sítios de restrição, facilitadores, isoladores, marcadores selecionáveis, sequências nucleotídicas de interesse, promotores, e/ou outros sítios que ajudam na análise ou construção do vetor. Em alguns exemplos de um sítio de reconhecimento e/ou sítio alvo pode estar contido dentro de um íntron, sequência codificante, 5' UTR, 3' UTR, e/ou regiões reguladoras.
[0284] A presente descrição provê adicionalmente construções de expressão para a expressão de um sistema RNA guia/Cas em uma planta, célula vegetal, ou parte de planta que é capaz de se ligar a criar uma quebra de dupla fita em um sítio alvo. Em um exemplo de realização, as construções de expressão da divulgação compreendem um promotor operacionalmente ligado a uma sequência de nucleotídeos que codifica um gene Cas e um promotor operacionalmente ligado a um RNA guia da presente divulgação. O promotor é capaz de direcionar a expressão de uma sequência de nucleotídeos operacionalmente ligada em uma célula vegetal.
[0285] Um promotor é uma região de DNA envolvida no reconhecimento e ligação da RNA polimerase e outras proteínas para iniciar a transcrição. Um promotor vegetal é um promotor capaz de iniciar a transcrição em uma célula vegetal, para uma revisão sobre promotores de plantas vide Potenza et al, (2004) In Vitro Cell Dev Biol. 40: 1-22. Os promotores constitutivos incluem, por exemplo, porção principal (core) do promotor Rsyn7 e outros promotores constitutivos divulgados no documento WO 99/43838 e Patente US 6.072.050; porção principal (core) do promotor CaMV 35S (Odell et al. Nature 313:810-812 (1985)); actina do arroz (McElroy et al. Plant Cell 2:163171 (1990)); ubiquitina (Christensen et al. Plant Mol. Biol. 12:619-632 (1989 ) e Christensen et al. Plant Mol. Biol. 18:675-689 (1992)); pEMU (Last et al. Theor. Appl. Genet. 81:581-588 (1991)); MAS (Velten et al ., EMBO J. 3:2723-2730 (1984)); promotor de ALS (Patente US 5.659.026), e similares. Outros promotores constitutivos estão descritos, por exemplo, nas Patentes US 5.608.149, US 5.608.144, US 5.604.121, US 5.569.597, US 5.466.785, US 5.399.680, US 5.268.463, US 5.608.142 e US 6.177.611. Em alguns exemplos pode ser utilizado um promotor induzível. Promotores induzíveis por patogênico induzidos após a infecção por um agente patogênico incluem, mas não estão limitados, aqueles que regulam a expressão de proteínas PR, proteínas SAR, beta-1,3-glicanase, quitinase, etc.
[0286] Promotores regulados quimicamente podem ser usados para modular a expressão de um gene em uma planta por meio da aplicação de um regulador químico exógeno. O promotor pode ser um promotor quimicamente induzível, em que a aplicação do produto químico induz a expressão gênica, ou um promotor quimicamente repressor, em que a aplicação do produto químico reprime expressão gênica. Promotores induzíveis por químicos incluem, mas não estão limitados a, o promotor In2-2 de milho, ativado por fitoprotetores herbicidas benzeno sulfonamida (De Veylder et al, (1997) Plant Cell Physiol. 38: 568-77), o promotor GST de milho (GST-II-27, WO93/01294), ativado por compostos eletrófilos hidrofóbicos usados como herbicidas pré-emergentes, e o promotor do tabaco PR-1-a (Ono et al, (2004). Biosci Biotechnol Biochem 68: 803-7) ativado pelo ácido salicílico. Outros promotores quimicamente induzíveis incluem promotores que respondem a esteroides (vide, por exemplo, o promotor induzível por glicocorticoide (Schena et al. (1991) Proc. Natl. Acad. Sci. USA 88:10421-5 e McNellis et al. (1998) Plant J. 14(2):247-257) e os promotores induzíveis por tetraciclina e reprimíveis por tetraciclina (Gatz et al.(1991) Mol.Gen. Genet. 227:229-37 e Patente US 5.814.618 e 5.789.156)).
[0287] Promotores tecido-preferidos podem ser utilizados para direcionar a expressão aumentada dentro de um tecido vegetal específico. Os promotores tecido-preferidos incluem, por exemplo, Kawamata et al., (1997) Plant Cell Physiol 38:792-803; Hansen et al., (1997) Mol Gen Genet 254:33743; Russell et al., (1997) Transgenic Res 6:157-68; Rinehart et al., (1996) Plant Physiol 112:1331-41; Van Camp et al., (1996) Plant Physiol 112:525-35; Canevascini et al., (1996) Plant Physiol 112:513-524; Lam, (1994) Results Probl Cell Differ 20:181-96; e Guevara-Garcia et al., (1993) Plant J 4:495-505. promotores folha-preferidos incluem, por exemplo, Yamamoto et al., (1997) Plant J 12:255-65; Kwon et al., (1994) Plant Physiol 105:357-67; Yamamoto et al., (1994) Plant Cell Physiol 35:773-8; Gotor et al., (1993) Plant J 3:509-18; Orozco et al., (1993) Plant Mol Biol 23:1129-38; Matsuoka et al., (1993) Proc. Natl. Acad. Sci. USA 90:9586-90; Simpson et al., (1958) EMBO J 4:2723-9; Timko et al., (1988) Nature 318:57-8. promotores raíz-preferidos incluem, por exemplo, Hire et al., (1992) Plant Mol Biol 20:207-18 (gene da glutamina sintase semente-específica de soja); Miao et al., (1991) Plant Cell 3:11-22 (glutamina sintase citosólica (GS)); Keller e Baumgartner, (1991) Plant Cell 3:1051-61 (elemento de controle raíz-específico no gene GRP 1.8 de feijão frances); Sanger et al., (1990) Plant Mol Biol 14:433-43 (promoter raíz- específico da manopina sintase (MAS) de A. tumefaciens); Bogusz et al., (1990) Plant Cell 2:633-41 (promoteres raíz-específicos isolados a partir de Parasponia andersonii e Trema tomentosa); Leach e Aoyagi, (1991) Plant Sci 79:69-76 (genes induxidos na raíz rolC e rolD de A. rhizogenes); Teeri et al., (1989) EMBO J 8:343-50 (genes TR1' e TR2’ induzidos por lesões de Agrobacterium); promoter do gene VfENOD-GRP3(Kuster et al., (1995) Plant Mol Biol 29:759-72); e promotor rolB (Capana et al., (1994) Plant Mol Biol 25:681-91; gene da faseolina (Murai et al., (1983) Science 23:476-82; Sengopta-Gopalen et al., (1988) Proc. Natl. Acad. Sci. USA 82:3320-4). Vide também as Patentes US 5.837.876; 5.750.386; 5.633.363; 5.459.252; 5.401.836; 5.110.732; e 5.023.179.
[0288] Os promotores semente-preferidos incluem promotores semente-preferidos ativos durante o desenvolvimento da semente, bem como promotores ativos na germinação da semente. Vide, Thompson et al., (1989) BioEssays 10:108. promotores semente-preferidos incluem, mas não estão limitados a, Cim1 (mensagem induzida por citocinas); cZ19B1 (maize 19 kDa zein); e milps (mio-inositol-1-fosfato sintase); (WO00/11177; e patente US 6.225.529). Para dicotiledôneas, os promotores semente-preferidos incluem, mas não estão limitados a, β-faseolina, napina, β-conglicinina, lectina de soja, cruciferina, e semelhantes. Para monocotiledôneas, os promotores sementes- preferridos incluem, mas não estão limitadas a, zeína de 15 kDa, zeína de 22 kDa, gama zeína de 27 kDa de de milho, waxy, shrunken 1, shrunken 2, globulin 1, oleosin e nuc1. Vide também o documento WO00/12733, onde são divulgados promotores semente-preferidos dos genes END1 e END2.
[0289] Um marcador fenotípico é um marcador detectável ou selecionável que inclui os marcadores visuais e marcadores selecionáveis se ele é um marcador de seleção positivo ou negativo. Qualquer marcador fenotípico pode ser utilizado. Especificamente, um marcador selecionável ou detectável compreende um segmento de DNA que permite identificar ou selecionar para, ou contra, uma molécula ou célula que a contenha, frequentemente sob condições específicas. Estes marcadores podem codificar uma atividade, tal como, mas não se limitando a, a produção de RNA, peptídeo ou proteína, ou podem proporcionar um sítio de ligação para RNA, peptídeos, proteínas, compostos ou composições inorgânicas e orgânicas e similares.
[0290] Exemplos de marcadores selecionáveis incluem, mas não estão limitados a, segmentos de DNA que compreendem sítios para enzimas de restrição; segmentos de DNA que codificam produtos que proporcionam resistência contra compostos de outro modo tóxicos, incluindo antibióticos, como espectinomicina, ampicilina, canamicina, tetraciclina, basta, neomicina fosfotransferase II (NEO) e higromicina fosfotransferase (HPT)); segmentos de DNA que codificam produtos que de outro modo estão ausentes na célula receptora (por exemplo, genes de tRNA, marcadores auxotróficos); segmentos de DNA que codificam produtos que podem ser prontamente identificados (por exemplo, marcadores fenotípicos como β-galactosidase, GUS, proteínas fluorescentes, tal como a proteína fluorescente verde (GFP), ciano (CFP), amarela (YFP), vermelha (RFP), e proteínas de superfície celular); produção de novos locais para primers de PCR (por exemplo, justaposição de duas sequência de DNA não anteriormente justapostas), inclusão de sequências de DNA não atuante ou atuantes por uma endonuclease de restrição ou outra enzima modificadora de DNA, químicos, etc.; e a inclusão de uma sequência de DNA necessária para uma modificação específica (por exemplo, metilação) que permite a sua identificação.
[0291] Os marcadores selecionáveis incluem genes que conferem resistência a compostos herbicidas, como glufosinato de amônio, bromoxinila, imidazolinonas, e 2,4-diclorofenoxiacetato (2,4-D). Vide, por exemplo, Yarranton, (1992) Curr Opin Biotech 3:506-11; Christopherson et al., (1992) Proc. Natl. Acad. Sci. USA 89:6314-8; Yao et al., (1992) Cell 71:63-72; Reznikoff, (1992) Mol Microbiol 6:2419-22; Hu et al., (1987) Cell 48:555-66; Brown et al., (1987) Cell 49:603-12; Figge et al., (1988) Cell 52:713-22; Deuschle et al., (1989) Proc. Natl. Acad. Sci. USA 86:5400-4; Fuerst et al., (1989) Proc. Natl. Acad. Sci. USA 86:2549-53; Deuschle et al., (1990) Science 248:480-3; Gossen, (1993) tese para obtenção de Ph.D., University of Heidelberg; Reines et al., (1993) Proc. Natl. Acad. Sci. USA 90:1917-21; Labow et al., (1990) Mol Cell Biol 10:3343-56; Zambretti et al., (1992) Proc. Natl. Acad. Sci. USA 89:3952-6; Baim et al., (1991) Proc. Natl. Acad. Sci. USA 88:5072-6; Wyborski et al., (1991) Nucleic Acids Res 19:4647-53; Hillen e Wissman, (1989) Topics Mol Struc Biol 10:143-62; Degenkolb et al., (1991) Antimicrob Agents Chemother 35:1591-5; Kleinschnidt et al., (1988) Biochemistry 27:1094-104; Bonin, (1993) tese para obtenção de Ph.D., University of Heidelberg; Gossen et al., (1992) Proc. Natl. Acad. Sci. USA 89:5547-51; Oliva et al., (1992) Antimicrob Agents Chemother 36:913-9; Hlavka et al., (1985) Handbook of Experimental Pharmacology, Vol. 78 (Springer-Verlag, Berlin); Gill et al., (1988) Nature 334:721-4.
[0292] As células que possuem a sequência introduzida podem ser cultivadas ou regeneradas em plantas, utilizando condições convencionais, vide, por exemplo, McCormick et al, (1986) Plant Cell Rep. 5: 81-4. Estas plantas podem então ser cultivadas, e polinizadas com a mesma cepa transformada ou com uma cepa transformada diferente ou mesmo cepa não transformada, e a progênie resultante possuirá a característica desejada e/ou compreenderá o polinucleotídeo ou polipeptídeo introduzido identificado. Duas ou mais gerações podem ser cultivadas para assegurar que o polinucleotídeo é estavelmente mantido e herdado, e as sementes colhidas.
[0293] Qualquer planta pode ser usada, incluindo plantas monocotiledôneas e dicotiledôneas. Exemplos de plantas monocotiledôneas que podem ser utilizadas incluem, mas não estão limitadas a, milho (Zea mays), arroz (Oryza sativa), centeio (Secale cereale), sorgo (Sorghum bicolor, Sorghum vulgare), painço (por exemplo, milho pérola (Pennisetum glaucum), painço (Panicum miliaceum), painço foxtail (Setaria italica), capim-pé-de- galinha-gigante (Eleusine coracana)), trigo (Triticum aestivum), cana de açúcar (Saccharum spp.), aveia (Avena), cevada (Hordeum), switchgrass (Panicum virgatum), abacaxi (Ananas comosus), banana (Musa spp.), palmeiras, plantas ornamentais, relvas e outras gramíneas. Exemplos de plantas dicotiledôneas que podem ser utilizadas incluem, mas não estão limitadas a, soja (Glycine max), canola (Brassica napus e B. campestris), alfalfa (Medicago sativa), tabaco (Nicotiana tabacum), Arabidopsis (Arabidopsis thaliana), girassol (Helianthus annuus), algodão (Gossypium arboreum) e amendoim (Arachis hypogaea), tomate (Solanum lycopersicum), batata (Solanum tuberosum) etc.
[0294] Os transgenes, moléculas de DNA recombinante, sequências de DNA de interesse e polinucleotídeos de interesse podem compreender um ou mais genes de interesse. Tais genes de interesse podem codificar, por exemplo, uma proteína que proporciona vantagem agronômica para a planta.
SELEÇÃO ASSISTIDA POR MARCADOR E MELHORAMENTO DE PLANTAS
[0295] A principal motivação para o desenvolvimento de marcadores moleculares em espécies de culturas é o potencial para aumento da eficiência no melhoramento de plantas pela seleção assistida por marcadores (MAS). Alelos de marcadores genéticos, ou alternativamente, loci caracteres quantitativos (Quantitative Trait Loci (alelos QTL)) são utilizados para identificar as plantas que contêm um genótipo desejado em um ou mais loci, e os quais se espera que transfiram o genótipo desejado, juntamente com um fenótipo desejado para os descendentes. Alelos de marcadores genéticos (ou alelos QTL) podem ser usados para identificar plantas que contêm um genótipo desejado em um locus, ou em vários loci não ligados ou ligados (por exemplo, um haplótipo), e que seria esperado transferir o genótipo desejado, juntamente com um fenótipo desejado aos seus descendentes. Será compreendido que, para os propósitos da MAS, o termo marcador pode abranger marcador e loci QTL.
[0296] Após um fenótipo desejado e um locus cromossômico polimórfico, por exemplo, um locus marcador ou QTL, serem determinados como segregados em conjunto, é possível utilizar os loci polimórficos para selecionar os alelos correspondentes ao fenótipo desejado - um processo chamado seleção assistida por marcadores (MAS). Resumidamente, um ácido nucleico correspondendo ao ácido nucleico marcador é detectado em uma amostra biológica a partir de uma planta a ser selecionada. Esta detecção pode assumir a forma de hibridização de uma sonda de ácido nucleico a um marcador, por exemplo, utilizando a hibridização alelo-específica, análise de Southern blot, análise de Northern blot, hibridização in situ, hibridização de primers seguida pela amplificação por PCR de uma região do marcador ou similares. Diversos processos para detectar marcadores são bem conhecidos no estado da técnica. Após a presença (ou ausência) de um marcador particular na amostra biológica ser verificada, a planta é selecionada, ou seja, usada para produzir progênies vegetais por reprodução seletiva.
[0297] Os melhoristas de plantas precisam combinar características de interesse com genes para alta produtividade e outras características desejáveis para desenvolver variedades melhoradas de plantas. A triagem de um grande número de amostras pode ser cara, morosa, e não confiável. O uso de marcadores, e/ou ácidos nucleicos geneticamente ligados é um método eficaz para a seleção de plantas com características desejadas nos programas de melhoramento. Por exemplo, uma das vantagens da seleção assistida por marcadores em avaliações de campo é que a MAS pode ser feita em qualquer época do ano, independentemente do período de crescimento. Além disso, os efeitos ambientais são irrelevantes para a seleção assistida por marcadores.
[0298] Quando uma população é segregante para múltiplos loci que afetam uma ou mais características, a eficiência da MAS comparada à triagem fenotípica torna-se ainda maior, pois todos os loci podem ser processados em conjunto no laboratório a partir de uma única amostra de DNA.
[0299] Mecanismos de reparo do DNA de células são a base para a introdução de DNA exógeno ou indução de mutações nos genes endógenos. A recombinação homóloga do DNA é uma forma especializada de reparação do DNA em que as células reparam danos no DNA utilizando uma sequência homóloga. Em plantas, a recombinação homóloga do DNA ocorre em uma frequência muito baixa para ser utilizada rotineiramente no direcionamento de genes ou edição de genes até que foi descoberto que o processo pode ser estimulado por quebra de dupla fita do DNA.
[0300] Os significados das abreviações são os seguintes: “Sec” significa segundo(s), “min” significa minuto(s), “h” significa hora(s), “d” significa dia(s), “μL” significa microlitro(s), “mL” significa mililitro(s), “L” significa litro(s), “μM” significa micromolar, “mM” significa milimolar, “M” significa molar, “mmol” significa milimol(es), “μmole” significa micromole(s), “g” significa grama(s), “g” significa micrograma(s), “ng” significa nanograma(s), “U” significa unidade(s), “bp” significa pares de bases e “kb” significa kilobase(s).
[0301] Além disso, conforme descrito na presente divulgação, para cada exemplo de realização que cita um RNA guia, um polinucleotídeo guia similar pode ser implantado de modo que o polinucleotídeo guia não compreende unicamente ácidos ribonucleicos, mas compreende uma combinação de moléculas de RNA - DNA ou compreende unicamente moléculas de DNA.
[0302] Exemplos não limitantes de composições e métodos revelados na presente divulgação são os seguintes: 1. Um método para a seleção de uma planta compreendendo um sítio-alvo alterado em seu genoma, compreendendo: a) a obtenção de uma primeira planta compreendendo pelo menos uma endonuclease Cas capaz de introduzir uma quebra de dupla fita em um sítio-alvo no genoma da planta; b) a obtenção de uma segunda planta que compreende um RNA guia que é capaz de formar um complexo com a endonuclease Cas de (a); c) o cruzamento da primeira planta de (a) com a segunda planta de (b); d) a avaliação da progênie de (c) para uma alteração no sítio-alvo; e, e) a seleção de uma planta descendente (progênie) que possui a alteração desejada do referido sítio-alvo. 2. Um método para a seleção de uma planta compreendendo um sítio-alvo alterado em seu genoma, cujo método compreende a seleção de pelo menos uma planta descendente (progênie) que compreende uma alteração em um sítio-alvo em seu genoma, em que a referida planta descendente foi obtida pelo cruzamento de uma primeira planta que compreende pelo menos uma endonuclease Cas; com uma segunda planta que compreende um RNA guia, em que a referida endonuclease Cas é capaz de introduzir uma quebra de dupla fita no referido sítio-alvo. 3. Um método para a seleção de uma planta compreendendo um sítio-alvo alterado em seu genoma, compreendendo: a) a obtenção de uma primeira planta compreendendo pelo menos uma endonuclease Cas capaz de introduzir uma quebra de dupla fita em um sítio-alvo no genoma da planta; b) a obtenção de uma segunda planta que compreende um RNA guia e um DNA doador, em que o referido RNA é capaz de formar um complexo com a endonuclease Cas de (a), em que o referido DNA doador compreende um polinucleotídeo de interesse; c) o cruzamento da primeira planta de (a) com a segunda planta de (b); d) a avaliação da progênie de (c) para uma alteração no sítio-alvo; e, e) a seleção de uma planta descendente que compreende o polinucleotídeo de interesse inserido no referido sítio-alvo. 4. Um método para a seleção de uma planta compreendendo um sítio-alvo alterado em seu genoma, cujo método compreende a seleção de pelo menos uma planta descendente (progênie) que compreende uma alteração em um sítio-alvo em seu genoma, em que a referida planta descendente foi obtida pelo cruzamento de uma primeira planta expressando pelo menos uma endonuclease Cas com uma segunda planta compreendendo uma RNA guia e um DNA doador, em que a referida endonuclease Cas é capaz de introduzir uma quebra de dupla fita no referido sítio-alvo, em que o referido DNA doador compreende um polinucleotídeo de interesse. 5. Um método para a modificação de um sítio-alvo no genoma de uma célula vegetal, cujo método compreende a introdução de um RNA guia em uma célula vegetal possuindo uma endonuclease Cas, em que o referido RNA guia e a endonuclease Cas são capazes de formar um complexo que permite que a endonuclease Cas introduza uma quebra de dupla fita no referido sítio-alvo. 6. Um método para a modificação de um sítio-alvo no genoma de uma célula vegetal, cujo método compreende a introdução de um RNA guia e uma endonuclease Cas na referida célula vegetal, em que o referido RNA guia e a endonuclease Cas são capazes de formar um complexo que permite que a endonuclease Cas introduza uma quebra de dupla fita no referido sítio-alvo. 7. Um método para a modificação de um sítio-alvo no genoma de uma célula vegetal, cujo método compreende a introdução de um RNA guia e um DNA doador em uma célula vegetal possuindo uma endonuclease Cas, em que o referido RNA guia e a endonuclease Cas são capazes de formar um complexo que permite que a endonuclease Cas introduza uma quebra de dupla fita no referido sítio-alvo, e em que o referido DNA doador compreende um polinucleotídeo de interesse. 8. Um método para a modificação de um sítio-alvo no genoma de uma célula vegetal, compreendendo: a) a introdução de um RNA guia e uma endonuclease Cas em uma célula vegetal, em que o referido RNA guia e endonuclease Cas são capazes de formar um complexo que permite que a endonuclease de Cas introduza uma quebra de dupla fita no referido sítio-alvo; e b) a identificação de pelo menos uma célula vegetal que possui uma alteração no referido alvo, em que a modificação inclui pelo menos uma deleção ou substituição de um ou mais nucleotídeos no referido sítio-alvo. 9. Um método para a modificação de uma sequência e dna alvo no genoma de uma célula vegetal, cujo método compreende: a) a introdução em uma célula vegetal de uma primeira construção de DNA recombinante capaz de expressar um RNA guia e uma segunda construção de DNA recombinante capaz de expressar uma endonuclease Cas, em que o referido RNA guia e endonuclease Cas são capazes de formar um complexo que permite que a endonuclease Cas introduza um quebra de dupla fita no referido sítio-alvo; e b) a identificação de pelo menos uma célula vegetal que possui uma alteração no referido alvo, em que a modificação inclui pelo menos uma deleção ou substituição de um ou mais nucleotídeos no referido sítio-alvo. 10. Um método para a introdução de um polinucleotídeo de interesse em um sítio-alvo no genoma de uma célula vegetal, cujo método compreende: a) a introdução em uma célula vegetal de uma primeira construção de DNA recombinante capaz de expressar um RNA guia e uma segunda construção de DNA recombinante capaz de expressar uma endonuclease Cas, em que o referido RNA guia e endonuclease Cas são capazes de formar um complexo que permite que a endonuclease Cas introduza um quebra de dupla fita no referido sítio-alvo; b) o contato da célula vegetal de (a) com um DNA doador que compreende um polinucleotídeo de interesse; e c) identificação de pelo menos uma célula vegetal a partir de (b) compreendendo no seu genoma o polinucleotídeo de interesse integrado no referido sítio-alvo. 10-B. Um método para a introdução de um polinucleotídeo de interesse em um sítio-alvo no genoma de uma célula vegetal, cujo método compreende: d) a introdução de um RNA guia e uma endonuclease Cas em uma célula vegetal, em que o referido RNA guia e endonuclease Cas são capazes de formar um complexo que permite que a endonuclease de Cas introduza uma quebra de dupla fita no referido sítio-alvo; e) o contato da célula vegetal de (a) com um DNA doador que compreende um polinucleotídeo de interesse; e f) identificação de pelo menos uma célula vegetal a partir de (b) compreendendo no seu genoma o polinucleotídeo de interesse integrado no referido sítio-alvo. 11. O método de acordo com qualquer exemplos de realização de 5-8, em que o RNA guia é introduzido diretamente por bombardeamento de partículas. 12. O método de qualquer exemplo de realização de 5-9, em que o RNA guia é introduzido por bombardeamento de partículas ou transformação por Agrobacterium de uma construção de DNA recombinante compreendendo o DNA guia correspondente operacionalmente ligado a um promotor U6 da polimerase III vegetal. 13. O método de qualquer exemplo de realização de 1-10 em que o gene da endonuclease Cas é de uma endonuclease Cas9 otimizada para vegetais. 14. O método de qualquer exemplo de realização de 1-10, em que o gene da endonuclease Cas está operacionalmente ligado a um sinal de direcionamento nuclear SV40 a montante da região do códon Cas e a um sinal de localização nuclear VirD2 a jusante da região do códon Cas. 15. O método de qualquer exemplo de realização de 1-14 em que a planta é uma monocotiledônea ou uma dicotiledônea. 16. O método do exemplo de realização 15, em que a monocotiledônea é selecionada a partir do grupo que consiste de milho, arroz, sorgo, centeio, cevada, trigo, milho, aveia, cana de açúcar, relva (turfgrass), ou gramíneas (switchgrass). 17. O método do exemplo de realização 16, em que a dicotiledônea é selecionada a partir do grupo que consiste de soja, colza, alfafa, girassol, algodão, tabaco, amendoim, batata, tabaco, Arabidopsis ou cártamo. 18. O método de qualquer exemplo de realização de 1-17 em que o sítio-alvo está localizado na sequência gênica de um gene da acetolactato-sintase (ALS), um gene da enolpiruvilchiquimato fosfato sintase (ESPSP), um gene de fertilidade masculina (MS45, MS26 ou MSCA1). 19. Uma planta ou semente produzida por qualquer um dos exemplos de realização de 1-17. 20. Uma planta compreendendo uma construção de DNA recombinante, em que a referida construção de DNA recombinante compreende um promotor operacionalmente ligado a uma sequência de nucleotídeos que codifica uma endonuclease Cas9 otimizada para planta, em que a referida endonuclease Cas9 otimizada para planta é capaz de se ligar e criar uma quebra de dupla fita em uma sequência genômica alvo no referido genoma da planta. 21. Uma planta compreendendo uma construção de DNA recombinante e um RNA guia, em que a referida construção de DNA recombinante compreende um promotor operacionalmente ligado a uma sequência nucleotídica que codifica uma endonuclease Cas9 otimizada para planta, em que a referida endonuclease Cas9 otimizada para planta e o RNA guia são capazes de formar um complexo e criar uma quebra de dupla fita em uma sequência genômica alvo no referido genoma da planta. 22. Uma construção de DNA recombinante que compreende um promotor operacionalmente ligado a uma sequência nucleotídica que codifica uma endonuclease Cas9 otimizada para planta, em que a referida endonuclease Cas9 otimizada para planta é capaz de se ligar e criar uma quebra de dupla fita em uma sequência genômica alvo no referido genoma da planta. 23. Uma construção de DNA recombinante compreendendo um promotor operacionalmente ligado a uma sequência nucleotídica expressando um RNA guia, em que o referido RNA guia é capaz de formar um complexo com uma endonuclease Cas9 otimizada para planta, e em que o referido complexo é capaz de se ligar e criar uma quebra de dupla fita em uma sequência genômico alvo no referido genoma da planta. 24. Um método para a seleção de uma planta masculina estéril, cujo método compreendendo a seleção de pelo menos uma planta descendente que compreende uma alteração em um sítio genômico alvo situado em um locus do gene da fertilidade masculina, em que a referida planta descendente é obtida pelo cruzamento de uma primeira planta que expressa uma endonuclease Cas9 com uma segunda planta que compreende um RNA guia, em que a referida endonuclease Cas é capaz de introduzir uma quebra de dupla fita no referido sítio genômico alvo. 25. Um método para a produção de uma planta masculina estéril, em que o referido método compreende: a) a obtenção de uma primeira planta compreendendo pelo menos uma endonuclease Cas capaz de introduzir uma quebra de dupla fita em um sítio genômico alvo situado num locus do gene de fertilidade masculina no genoma da planta; b) a obtenção de uma segunda planta que compreende um RNA guia que é capaz de formar um complexo com a endonuclease Cas de (a); c) o cruzamento da primeira planta de (a) com a segunda planta de (b); d) a avaliação da progênie de (C) para uma alteração no sítio- alvo; e, e) a seleção de uma planta descendente (progênie) que é masculina estéril. 26. O método de qualquer exemplo de realização de 23-24, em que o gene da fertilidade masculina é selecionado a partir da lista que compreende MS26, MS45, MSCA1. 27. O método método de qualquer exemplo de realização 2426, caracterizado pelo fato de que a planta é uma monocotiledônea ou uma dicotiledônea. 28. O método de acordo com o exemplo de realização 27, caracterizado pelo fato de que a monocotiledônea é selecionada a partir do grupo que consiste de milho, arroz, sorgo, centeio, cevada, trigo, milho, aveia, cana de açúcar, relva (turfgrass), ou gramíneas (switchgrass). 29. Um método para a edição de uma sequência de nucleotídeos no genoma de uma célula compreendendo a introdução de pelo menos um RNA guia, um molde de modificação de polinucleotídeo e pelo menos uma endonuclease Cas em uma célula, em que a endonuclease Cas introduz uma quebra de dupla fita em um sítio-alvo no genoma da referida célula, e em que o referido molde de modificação de polinucleotídeo compreende pelo menos uma modificação nucleotídica da referida sequência de nucleotídeos. 30. O método de acordo com o exemplo de realização 29, em que a referida célula é uma célula vegetal. 31. O método de acordo com o exemplo de realização 29, caracterizada pelo fato de que a sequência de nucleotídeos é um promotor, uma sequência reguladora ou um gene de interesse. 32. O método do exemplo de realização 31, em que o gene de interesse é um gene EPSPS. 33. O método do exemplo de realização 30, em que a célula vegetal é uma célula vegetal monocotiledônea ou dicotiledônea. 34. Um método para a produção de uma planta epsps- mutante, em que o referido método compreende: a) o fornecimento de um RNA guia, um molde de modificação de polinucleotídeo e pelo menos uma endonuclease Cas para uma célula vegetal, em que a endonuclease Cas introduz uma quebra de dupla fita em um sítio- alvo dentro de uma sequência genômica de EPSPS no genoma da planta, em que o referido molde de modificação de polinucleotídeo compreende pelo menos uma modificação nucleotídica da referida sequência genômica de EPSPS; b) a obtenção de uma planta a partir da célula vegetal de (a); c) a avaliação a planta de (b) para a presença da referida pelo menos uma modificação de nucleotídeo; e, d) a seleção de uma planta descendente que exibe a tolerância ao glifosato. 35. Um método para a produção de uma planta epsps- mutante, em que o referido método compreende: a) o fornecimento de um RNA guia, um molde de modificação de polinucleotídeo e pelo menos uma endonuclease Cas em uma célula vegetal, em que a endonuclease Cas introduz uma quebra de dupla fita em um sítio- alvo dentro de uma sequência genômica de EPSPS no genoma da planta, em que o referido molde de modificação de polinucleotídeo compreende pelo menos uma modificação nucleotídica da referida sequência genômica de EPSPS; b) a obtenção de uma planta a partir da célula vegetal de (a); c) a avaliação a planta de (b) para a presença da referida pelo menos uma modificação de nucleotídeo; e, d) o rastreio de uma planta descendente de (c) que é desprovida do referido RNA guia e endonuclease Cas. 36. O método de acordo com o exemplo de realização 35 que compreende adicionalmente a seleção de uma planta que exibe resistência ao glifosato. 37. Uma planta, célula vegetal ou semente produzida por qualquer um dos exemplos de realização de 29-36. 38. O método de acordo qualquer um dos exemplos de realização de 29-36, em que a endonuclease Cas é uma endonuclease Cas9. 39. O método de acordo com o exemplo de realização 38, caracterizado pelo fato de que a endonuclease Cas9 é expressa pela SEQ ID NO: 5. 40. O método de acordo com o exemplo de realização 38, em que a endonuclease Cas9 é codificada por qualquer uma das SEQ ID NOs: 1, 124, 212, 213, 214, 215, 216, 193, ou nucleotídeos 2037-6329 da SEQ ID NO: 5, ou qualquer fragmento funcional ou variante das mesmas. 41. A planta ou célula vegetal de acordo com o exemplo de realização 37, em que a referida célula vegetal exibe resistência ao glifosato. 42. Uma célula vegetal compreendendo uma sequência de nucleotídeos modificada, em que a sequência de nucleotídeos modificada foi produzida através de um RNA guia, um molde de modificação de polinucleotídeo e pelo menos uma endonuclease Cas em uma célula vegetal, em que a endonuclease Cas é capaz de introduzir uma quebra de dupla fita em um sítio-alvo no genoma da planta, em que o referido molde de modificação de polinucleotídeo compreende pelo menos uma modificação nucleotídica da referida sequência de nucleotídeos. 43. O método de acordo com os exemplos de realização 29, 34 e 35, em que a pelo menos uma modificação de nucleotídeo não é uma modificação no referido sítio-alvo. 44. Um método para a produção de uma planta masculina estéril, em que o referido método compreende: a) a introdução de um RNA guia e uma endonuclease Cas em uma célula vegetal, em que o referido RNA guia e endonuclease Cas são capazes de formar um complexo que permite que a endonuclease de Cas introduza uma quebra de dupla fita no referido sítio-alvo localizado em um, ou próximo de um, gene de fertilidade masculina; e b) a identificação de pelo menos uma célula vegetal que possui uma modificação no referido gene de fertilidade masculina, em que a modificação inclui pelo menos uma deleção ou substituição de um ou mais nucleotídeos no referido gene de esterilidade masculina; e c) a obtenção de uma planta a partir da célula vegetal de (b). 45. O método de acordo com o exemplo de realização 43, que compreende ainda a seleção de uma planta descendente a partir da planta de (c), em que a referida planta é uma planta descendente masculina estéril. 46. O método de acordo com o exemplo de realização 43, em que o gene da fertilidade masculina é selecionado a partir do grupo que compreende MS26, MS45 e MSCA1. 47. Uma planta compreendendo pelo menos um sítio-alvo alterado, em que o pelo menos um sítio-alvo alterado originado a partir de um sítio-alvo correspondente que foi reconhecido e clivado por um sistema RNA guia/endonuclease Cas, e em que o pelo menos um sítio-alvo alterado é uma região genômica de interesse que se estende a partir da sequência alvo descrita na SEQ ID NO: 229 até o sítio-alvo estabelecido na SEQ ID NO: 235. 48. A planta de acordo com o exemplo de realização 47, em que o pelo menos um sítio-alvo alterado tem uma alteração selecionada a partir do grupo que consiste de (i) substituição de pelo menos um nucleotídeo, (ii) deleção de pelo menos um nucleotídeo, (iii) inserção de pelo menos um nucleotídeo, e (iv) qualquer combinação de (i) - (iii). 49. A planta de acordo com o exemplo de realização 47, em que o pelo menos um sítio-alvo alterado compreende uma molécula de DNA recombinante. 50. A planta de acordo com o exemplo de realização 47, em que a planta compreende pelo menos dois sítios-alvo alterados, em que cada um dos sítios-alvo alterado é originado a partir do sítio-alvo correspondente que foi reconhecido e clivado por um sistema RNA guia/endonuclease, e em que o sítio-alvo correspondente é selecionado a partir do grupo que consiste das SEQ ID NOs: 229, 230, 231, 232, 233, 234, 235 e 236. 51. Uma construção de DNA recombinante compreendendo uma sequência de nucleotídeos apresentada na SEQ ID NO: 120 ou SEQ ID NO: 295, ou um fragmento funcional destas sequências, operacionalmente ligada a pelo menos uma sequência heteróloga, em que a referida sequência de nucleotídeos é um promotor. 52. Uma planta estavelmente transformada com uma construção de DNA recombinante que compreende um promotor de soja e um fragmento de ácido nucleico heterólogo operacionalmente ligado ao referido promotor de soja, em que o referido promotor é capaz de controlar a expressão do referido fragmento de ácido nucleico heterólogo em uma célula vegetal, e ainda o referido promotor compreende qualquer uma das sequências expostas nas SEQ ID NOs: 120 ou 295. 53. Um método para a edição de uma sequência de nucleotídeos no genoma de uma célula, cujo método compreende a introdução de um polinucleotídeo guia, uma endonuclease Cas, e opcionalmente, um molde de modificação de polinucleotídeo em uma célula, em que o referido RNA guia e a endonuclease Cas são capazes de formar um complexo que permite que a endonuclease Cas introduza uma quebra de dupla fita em um sítio-alvo no genoma da referida célula, e em que o referido molde de modificação de polinucleotídeo compreende pelo menos uma modificação nucleotídica da referida sequência de nucleotídeos. 54. O método de acordo com o exemplo de realização 53, em que a sequência de nucleotídeos no genoma de uma célula é selecionada a partir do grupo que consiste de uma sequência promotora, uma sequência de terminadora, uma sequência de elemento regulador, um local de splicing, uma sequência codificante, um local de poliubiquitinação, um sítio intrônico e um motivo de reforço de íntron. 55. Um método para a edição de uma sequência promotora no genoma de uma célula, cujo método compreende a introdução de um polinucleotídeo guia, um molde de modificação de polinucleotídeo e pelo menos uma endonuclease Cas em uma célula, em que o referido RNA guia e a endonuclease Cas são capazes de formar um complexo que permite que a endonuclease Cas introduza uma quebra de dupla fita em um sítio-alvo no genoma da referida célula, e em que o referido molde de modificação de polinucleotídeo compreende pelo menos uma modificação de nucleotídeo da referida sequência de nucleotídeos. 56. Um método para a substituição de uma primeira sequência promotora em uma célula, em que o método compreende a introdução de um RNA guia, um molde de modificação de polinucleotídeo, e uma endonuclease Cas na referida célula, em que o referido RNA guia e endonuclease Cas são capazes de formar um complexo que permite que a endonuclease Cas introduza uma quebra de dupla fita em um sítio-alvo no genoma da referida célula, e em que o referido molde de modificação de polinucleotídeo compreende um segundo promotor ou fragmento de um segundo promotor que é diferente da primeira sequência promotora referida. 57. O método de acordo com o exemplo de realização 56, em que a substituição da primeira sequência promotora resulta em qualquer um dos seguintes, ou qualquer combinação dos seguintes: um aumento da atividade do promotor, um aumento da especificidade tecidual do promotor, uma diminuição da atividade do promotor, uma diminuição da especificidade tecidual do promotor, uma nova atividade do promotor, uma atividade induzível do promotor, uma janela de expressão gênica aumentada, ou uma modificação no tempo ou progresso do desenvolvimento da expressão gênica na mesma camada de células ou em outra camada de células. 58. O método de acordo com o exemplo de realização 56, em que a primeira sequência promotora é selecionada a partir do grupo que consiste do promotor ARGOS 8 de Zea mays, promotor EPSPS1 de soja, promotor EPSPS de milho, promotor NPK1 de milho, e em que a segunda sequência promotora é selecionada a partir do grupo constituído por um promotor GOS2 PRO:GOS2-intron de Zea mays, promotor da ubiquitina de soja, promotor RAB17 indutível pelo estresse do milho, promotor PEPC1 de Zea mays, promotor da ubiquitina de Zea mays, promotor Rootmet2 de Zea mays, promotor da actina de arroz, promotor RCC3 de sorgo, promotor GOS2 de Zea mays, promotor ACO2 de Zea mays, e promotor da oleosina de Zea mays. 59. Um método para deletar uma sequência promotora no genoma de uma célula, em que o método compreende a introdução de um polinucleotídeo guia, uma endonuclease Cas em uma célula, em que o referido RNA guia e endonuclease Cas são capazes de formar um complexo que permite que a endonuclease Cas introduza um quebra de dupla fita em pelo menos um sítio-alvo situado dentro ou fora da referida sequência promotora. 60. Um método para a inserção de um promotor ou um elemento promotor no genoma de uma célula, em que o método compreende a introdução de um polinucleotídeo guia, um molde de modificação de polinucleotídeo compreendendo o promotor ou o elemento promotor, e uma endonuclease Cas em uma célula, em que o referido RNA guia e endonuclease Cas são capazes de formar um complexo que permite que a endonuclease Cas introduza uma quebra de dupla fita em um sítio-alvo no genoma da referida célula. 61. O método de acordo com o exemplo de realização 60, em que a inserção do promotor ou elemento promotor resulta em qualquer um dos seguintes, ou qualquer combinação dos seguintes: um aumento da atividade do promotor, um aumento da especificidade tecidual do promotor, uma diminuição da atividade do promotor, uma diminuição da especificidade tecidual do promotor, uma nova atividade do promotor, uma atividade induzível do promotor, uma janela de expressão gênica aumentada, ou uma modificação no tempo ou progresso do desenvolvimento da expressão gênica, uma mutação de elementos de ligação ao DNA, ou a adição de elementos de ligação ao DNA. 62. Um método para a edição de um fator de transcrição dedo de zinco, em que o método compreende a introdução de um polinucleotídeo guia, uma endonuclease Cas, e, opcionalmente, um molde de modificação de polinucleotídeo em uma célula, em que a endonuclease Cas introduz uma quebra de dupla fita em um sítio-alvo no genoma da referida célula, e em que o referido molde de modificação de polinucleotídeo compreende pelo menos uma modificação ou deleção de nucleotídeos do referido fator de transcrição dedo de zinco, em que a deleção ou modificação de o referido fator de transcrição dedo de zinco resulta na criação de um fator de transcrição dedo de zinco mutante negativo dominante. 63. Um método para a criação de uma proteína de fusão, em que o método compreende a introdução de um polinucleotídeo guia, uma endonuclease Cas, e um molde de modificação de polinucleotídeo em uma célula, em que a endonuclease de Cas introduz uma quebra de dupla fita em um sítio-alvo localizado dentro ou fora de uma primeira sequência codificante no genoma da referida célula, e em que o referido molde de modificação de polinucleotídeo compreende uma segunda sequência codificante que codifica uma proteína de interesse, em que a proteína de fusão resulta em qualquer um dos seguintes, ou qualquer combinação destes: um direcionamento da proteína de fusão para o cloroplasto da referida célula, um aumento na atividade da proteína, um aumento na funcionalidade da proteína, uma diminuição na atividade da proteína, uma diminuição na funcionalidade da proteína, uma nova funcionalidade da proteína, uma funcionalidade modificada da proteína, uma nova localização da proteína, um novo momento de expressão da proteína, um padrão de expressão da proteína modificado, uma proteína quimérica, ou uma proteína modificada com uma funcionalidade de fenótipo dominante. 64. Um método para a produção de um locus de complexo de características em uma planta, que compreende pelo menos duas sequências- alvo modificadas em uma região genômica de interesse, cujo método compreende: (a) a seleção de uma região genômica em uma planta, em que a região genômica compreende uma primeira sequência-alvo e uma segunda sequência-alvo; (b) o contato de pelo menos uma célula vegetal com pelo menos um primeiro polinucleotídeo guia, um segundo polinucleotídeo guia, e, opcionalmente, pelo menos um DNA doador, e uma endonuclease Cas, em que o primeiro e o segundo polinucleotídeo guia e a endonuclease Cas podem formar um complexo que permite que a endonuclease Cas introduza uma quebra de dupla fita em pelo menos uma primeira e uma segunda sequência- alvo; (c) a identificação de uma célula a partir de (b) que compreende uma primeira alteração na primeira sequência-alvo e uma segunda alteração na segunda sequência-alvo; e (d) a recuperação de uma primeira planta fértil a partir da célula de (c), em que a referida planta fértil compreende a primeira alteração e a segunda alteração, em que a primeira alteração e a segunda alteração estão fisicamente ligadas. 65. Um método para a produção de um locus de complexo de características em uma planta, que compreende pelo menos duas sequências- alvo modificadas em uma região genômica de interesse, cujo método compreende: (a) a seleção de uma região genômica em uma planta, em que a região genômica compreende uma primeira sequência-alvo e uma segunda sequência-alvo; (b) o contato de pelo menos uma célula vegetal com um primeiro polinucleotídeo guia, uma endonuclease Cas, e, opcionalmente, um primeiro DNA doador, em que o primeiro polinucleotídeo guia e a endonuclease Cas podem formar um complexo que permite que a endonuclease Cas introduza uma quebra de dupla fita em uma primeira sequência-alvo; (c) a identificação de uma célula a partir de (b) compreendendo uma primeira alteração na primeira sequência-alvo; (d) a recuperação de uma primeira planta fértil a partir da célula de (c), em que a referida primeira planta fértil compreende a primeira alteração; (e) o contato de pelo menos uma célula vegetal com um segundo polinucleotídeo guia, uma endonuclease Cas, e opcionalmente, um segundo DNA doador; (f) a identificação de uma célula a partir de (e) compreendendo uma segunda alteração na segunda sequência-alvo; (g) a recuperação de uma segunda planta fértil a partir da célula de (f), em que a referida segunda planta fértil compreende a segunda alteração; e (h) a obtenção de uma planta descendente fértil a partir da segunda planta fértil de (g), em que a referida planta descendente fértil compreende a primeira alteração e a segunda alteração, em que a primeira alteração e a segunda alteração estão fisicamente ligadas. 66. Um método para a edição de uma sequência de nucleotídeos no genoma de uma célula, em que o método compreende a introdução de pelo menos um RNA guia, pelo menos um molde de modificação de polinucleotídeo e pelo menos uma endonuclease Cas em uma célula, em que a endonuclease Cas introduz uma quebra de dupla fita em um sítio-alvo no genoma da referida célula, e em que o referido molde de modificação de polinucleotídeo compreende pelo menos uma modificação nucleotídica da referida sequência de nucleotídeos. 67. O método de acordo com o exemplo de realização 66, em que a edição da referida sequência de nucleotídeos torna a referida sequência de nucleotídeos capaz de conferir resistência aos herbicidas para a referida célula. 68. O método de acordo com o exemplo de realização 67, em que a referida célula é uma célula vegetal. 69. O método de acordo com o exemplo de realização 66, em que a sequência de nucleotídeos é um promotor, uma sequência reguladora ou um gene de interesse. 70. O método de acordo com o exemplo de realização 69, em que o gene de interesse é um gene da enolpiruvilchiquimato-3-fosfato sintase (EPSPS) ou um gene ALS. 71. O método de acordo com o exemplo de realização 66, em que a célula vegetal é uma célula vegetal monocotiledônea ou dicotiledônea. 72. Um método para a produção de uma planta acetolactato- sintase (ALS) mutante, em que o referido método compreende: a) o fornecimento de um RNA guia, um molde de modificação de polinucleotídeo, e uma endonuclease de CAS para uma célula vegetal que compreende uma sequência de nucleotídeos ALS, em que o referido RNA guia e endonuclease Cas são capazes de formar um complexo que permite que a endonuclease Cas introduza uma quebra de dupla fita em um sítio alvo no genoma da referida célula vegetal, em que o referido molde de modificação de polinucleotídeo compreende pelo menos uma modificação nucleotídica da referida sequência de nucleotídeos ALS; b) a obtenção de uma planta a partir da célula vegetal de (a); c) a avaliação a planta de (b) para a presença da referida pelo menos uma modificação de nucleotídeo; e, d) a seleção de uma planta descendente que exibe resistência à sulfonilureia. 73. Um método para a produção de uma planta acetolactato- sintase (ALS) mutante, em que o referido método compreende: a) o fornecimento de um RNA guia e um molde de modificação de polinucleotídeo para uma célula vegetal que compreende uma endonuclease Cas e a uma sequência nucleotídica ALS, em que a referida endonuclease Cas introduz uma quebra de dupla fita em um sítio alvo no genoma da referida célula vegetal, e em que o referido molde de modificação de polinucleotídeo compreende pelo menos uma modificação nucleotídica da referida sequência de nucleotídeos ALS; b) a obtenção de uma planta a partir da célula vegetal de (a); c) a avaliação a planta de (b) para a presença da referida pelo menos uma modificação de nucleotídeo; e, d) a seleção de uma planta descendente que exibe resistência à sulfonilureia. 74. O método de qualquer um dos exemplos de realização 7273, em que o referido molde de modificação de polinucleotídeo compreende um fragmento não funcional ou parcial da sequência de nucleotídeos ALS. 75. O método de qualquer um dos exemplos de realização 7273, em que o sítio alvo está localizado dentro da sequência de nucleotídeos da ALS. 76. O método de qualquer um dos exemplos de realização 7273, compreendendo ainda a seleção de uma planta descendente que carece do referido RNA guia e endonuclease Cas. 77. UM método para a produção de uma planta acetolactato- sintase (ALS) mutante, em que o referido método compreende: a) obtenção de uma planta ou uma a semente desta, em que a planta ou sua semente compreende uma modificação em um gene ALS endógeno, sendo a modificação gerada por uma endonuclease Cas, um RNA guia e um molde de modificação de polinucleotídeo, em que a planta ou sua semente é resistente à sulfonilureia; e b) a produção de uma planta descendente que é desprovida do referido RNA guia e endonuclease Cas. 78. O método de acordo com o exemplo de realização 77 que compreende adicionalmente a seleção de uma planta que exibe resistência à sulfonilureia. 79. O método de qualquer um dos exemplos de realização 7278, em que a planta é uma monocotiledônea ou uma dicotiledônea. 80. O método do exemplo de realização 79 em que a monocotiledônea é selecionada a partir do grupo que consiste de milho, arroz, sorgo, centeio, cevada, trigo, milho, aveia, cana de açúcar, relva (turfgrass), ou gramíneas (switchgrass). 81. O método do exemplo de realização 79, em que a dicotiledônea é selecionada a partir do grupo que consiste de soja, colza, alfafa, girassol, algodão, tabaco, amendoim, batata, tabaco, Arabidopsis ou cártamo. 82. Um método para produção de uma planta resistente à sulfonilureia, em que o método compreende o fornecimento de uma célula vegetal em que seu gene ALS cromossômico endógeno foi modificado por um sistema de RNA guia/endonuclease Cas para produzir uma proteína ALS resistente à sulfonilureia e o cultivo de uma planta a partir da referida célula vegetal de milho, em que a referida planta é resistente à sulfonilureia. 83. O método do exemplo de realização 82, em que a planta é uma monocotiledônea ou uma dicotiledônea. 84. Uma planta produzida pelo método do exemplo de realização 82. 85. Uma semente produzida pela planta do exemplo de realização 84. 86. Um RNA guia, em que o domínio de direcionamento variável tem como alvo um fragmento da sequência de nucleotídeos de EPSPS ou ALS. 87. Um método para a produção de uma célula vegetal acetolactato-sintase (ALS)-mutante, em que o referido método compreende: a) o fornecimento a uma célula compreendendo uma sequência de nucleotídeos ALS de um RNA guia, um molde de modificação de polinucleotídeo, e uma endonuclease de CAS, em que o referido RNA guia e endonuclease Cas são capazes de formar um complexo que permite que a endonuclease Cas introduza uma quebra de dupla fita em um sítio alvo no genoma da referida célula, em que o referido molde de modificação de polinucleotídeo compreende pelo menos uma modificação nucleotídica da referida sequência de nucleotídeos ALS; b) a obtenção de, pelo menos, uma célula vegetal de (a) que tem pelo menos uma alteração de nucleotídeos na referida sequência de nucleotídeos da ALS, em que a modificação inclui pelo menos uma deleção, inserção ou substituição de um ou mais nucleotídeos na referida sequência de nucleotídeos da ALS. 88. Um método para a produção de uma célula vegetal acetolactato-sintase (ALS)-mutante, em que o referido método compreende: a) o fornecimento de um RNA guia e um molde de modificação de polinucleotídeo para uma célula vegetal que compreende uma endonuclease Cas e a uma sequência nucleotídica ALS, em que a referida endonuclease Cas introduz uma quebra de dupla fita em um sítio alvo no genoma da referida célula vegetal, e em que o referido molde de modificação de polinucleotídeo compreende pelo menos uma modificação nucleotídica da referida sequência de nucleotídeos ALS; e b) a identificação de pelo menos uma célula vegetal de (a) que tem pelo menos uma alteração de nucleotídeos na referida sequência de nucleotídeos da ALS, em que a modificação inclui pelo menos uma deleção, inserção ou substituição de um ou mais nucleotídeos na referida sequência de nucleotídeos da ALS. 89. Um método para a produção de uma planta acetolactato- sintase (ALS) mutante, em que o referido método compreende: a) o fornecimento para uma célula que compreende uma sequência de nucleotídeos ALS, de uma primeira construção de DNA recombinante capaz de expressar um RNA guia, uma segunda construção de DNA recombinante capaz de expressar uma endonuclease Cas, e um molde de modificação de polinucleotídeo, em que o referido RNA guia e endonuclease CAs são capazes de formar um complexo que permite que a endonuclease de Cas introduza uma quebra de dupla fita em um sítio alvo no genoma da referida célula, em que o referido molde de modificação de polinucleotídeo compreende um fragmento não funcional do gene ALS e a modificação de pelo menos um nucleotídeo na referida sequência de nucleotídeos da ALS; e b) a identificação de pelo menos uma célula de (a) que tem pelo menos uma alteração de nucleotídeos na referida sequência de nucleotídeos da ALS, em que a modificação inclui pelo menos uma deleção, inserção ou substituição de um ou mais nucleotídeos na referida sequência de nucleotídeos da ALS.
EXEMPLOS
[0303] Nos Exemplos a seguir, salvo quando indicado de outra forma, as partes e percentagens são em peso e os graus são indicados em graus Celsius. Deve ser compreendido que estes exemplos, embora indicando exemplos de realizações da presente divulgação, são dados apenas a título de ilustração. A partir da discussão acima e destes Exemplos, um especialista na técnica pode fazer diversas alterações e modificações da presente divulgação para adaptar a várias utilizações e condições. Tais modificações visam também serem abrangidas pelo escopo das reivindicações anexas.
EXEMPLO 1 CASSETES DE EXPRESSÃO OTIMIZADA PARA MILHO PARA A MODIFICAÇÃO DO GENOMA EM PLANTAS DE MILHO BASEADA EM RNA GUIA/ENDONUCLEASE CAS
[0304] Para aplicações de modificação do genoma, o sistema CRISPR tipo II/Cas exige minimamente a proteína Cas9 e uma molécula duplexada crRNA/tracrRNA ou uma molécula crRNA e tracrRNA (RNA guia) sinteticamente fundida para o reconhecimento e clivagem do sítio alvo de DNA (Gasiunas et al. (2012) Proc. Natl. Acad. Sci.USA 109:E2579-86, Jinek et al. (2012) Science 337:816-21, Mali et al. (2013) Science 339:823-26, e Cong et al. (2013) Science 339:819-23). É descrito um sistema de RNA guia/endonuclease Cas baseado no sistema CRISPR tipo II/Cas e consiste de uma endonuclease Cas e um RNA guia (ou crRNA e tracrRNA duplexado) que em conjunto podem formar um complexo que reconhece um sítio alvo no genoma de uma planta e introduz uma quebra de dupla fita no referido sítio alvo.
[0305] Para testar o sistema de RNA guia/ endonuclease Cas no milho, o gene Cas9 de Streptococcus pyogenes M1 GAS (SF370) (SEQ ID NO: 1) foi códon-otimizado para o milho por técnicas padrão conhecidas na arte e o íntron da batata ST-LS1 (SEQ ID NO: 2) foi introduzido de modo a eliminar sua expressão em E. coli e Agrobacterium (Figura 1A). Para facilitar a localização nuclear da proteína Cas9 em células de milho, o sinal de localização nuclear amino-terminal monopartido Vírus Símio 40 (SV40) (MAPKKKRKV, SEQ ID NO: 3) e o sinal de localização nuclear carbóxi-terminal da endonuclease para bordas do T-DNA do VirD2 bipartido de Agrobacterium tumefaciens (KRPRDHRDGELGGRKRAR, SEQ ID NO: 4), foram incorporadas nas extremidades amino- e carboxi-terminal do quadro de leitura aberto de Cas9 (Figura 1 a), respectivamente. O gene Cas9 otimizado para milho foi operacionalmente ligado a um promotor de milho constitutivo ou regulado por meio de técnicas de biologia molecular padrão. Um exemplo do cassete de expressão de Cas9 milho-otimizado (SEQ ID NO: 5) é ilustrado na Figura 1A. A Figura 1A mostra um gene Cas9 de otimizado para milho (milho-otimizado) contendo o íntron ST-LS1, o sinal de localização nuclear (NLS) SV40 aminoterminal e carboxi-terminal VirD2 dirigido por um promotor da ubiquitina de plantas.
[0306] O segundo componente necessário para formar um sistema RNA guia/endonuclease Cas funcional para aplicações de modificação do genoma é um duplexo das moléculas crRNA e tracrRNA ou uma fusão sintética das moléculas crRNA e tracrRNA, um RNA guia. Para conferir a expressão eficiente de RNA guia (ou expressão do crRNA e tracrRNA duplexado) na cultura de milho, o promotor U6 da polimerase III de milho (SEQ ID NO: 9) e terminador U6 da polimerase III de milho (primeiras 8 bases da SEQ ID NO: 10) residente no cromossomo 8 foram isolados e operacionalmente fundidos com as extremidades de um RNA guia (Figura 1 B), utilizando técnicas padrão de biologia molecular. Duas configurações de ‘RNA guia’ diferentes foram desenvolvidas para testes no milho, um RNA guia curto (SEQ ID NO: 11) com base em Jinek et al.(2012) Science 337: 816-21 e um RNA guia longo (SEQ ID NO: 8) com base em Mali et al.(2013) Science 339: 823-26. Um exemplo de cassete de expressão (SEQ ID NO: 12) é mostrado na Figura 1B, que ilustra um promotor U6 da polimerase III de milho controlando a expressão de um RNA guia longo terminado com um terminador U6 da polimerase III.
[0307] Conforme mostrado nas Figuras 2A e 2B, o RNA guia ou molécula crRNA contém uma região complementar para uma fita alvo de DNA de fita dupla (referida como domínio de direcionamento variável) que é cerca de 12-30 nucleotídeos de comprimento e está a montante de um sequência PAM (5'NGG3' na fita antisense da Figura 2A-2B, que corresponde a 5'CCN3' na fita sense da Figura 2A-2B) para reconhecimento e clivagem do sítio alvo (Gasiunas et al. (2012) Proc. Natl. Acad. Sci. USA 109: E2579-86, Jinek et al. (2012) Science 337: 816-21, Mali et al. (2013) Science 339: 823-26, e Cong et al. (2013) Science 339: 819-23). Para facilitar a introdução rápida de sequências alvo de DNA genômico de milho nas construções de expressão de crRNA ou RNA guia, dois sítios alvo da endonuclease de restrição BbsI Tipo IIS foram introduzidos em uma orientação tandem invertida, com clivagem orientada em uma direção para fora, tal como descrito em Cong et al.(2013) Science 339: 819-23. Após a clivagem, a endonuclease de restrição Tipo IIS excisa seus sítios alvo a partir do plasmídeo de expressão com crRNA ou RNA guia, gerando saliência que permitem a clonagem direcional no quadro de leitura de oligos em duplexo contendo o sítio alvo do DNA genômico de milho desejado no domínio direcionamento variável. Neste exemplo, apenas as sequências alvo começando com um nucleotídeo G foram usadas para promover a expressão favorável da polimerase III do RNA guia ou crRNA.
[0308] A expressão de ambos os genes, da endonuclease Cas e RNA guia, permite a formação do complexo RNA guia/Cas representado na Figura 2B (SEQ ID NO: 8). Alternativamente, a expressão do gene da endonuclease Cas, crRNA, e tracrRNA permite a formação do complexo crRNA/tracrRNA/Cas tal como representado na Figura 2A (SEQ ID NOs: 6-7).
EXEMPLO 2 O SISTEMA RNA GUIA/ENDONUCLEASE CAS CLIVA O DNA CROMOSSÔMICO EM MILHO E INTRODUZ MUTAÇÕES POR JUNÇÃO DE EXTREMIDADES NÃO HOMÓLOGAS IMPERFEITA
[0309] Para testar se o RNA guia/endonuclease Cas otimizado para de milho descrito no Exemplo 1 pode reconhecer, clivar, e mutar o DNA cromossômico de milho através das vias de reparação da junção de extremidades não homólogas (NHEJ) imprecisas, três sequências genômicas alvo diferentes em 5 loci do milho foram selecionadas para clivagem (vide a Tabela 1) e examinadas por sequenciamento em profundidade para verificar a presença de mutações NHEJ. TABELA 1 SÍTIOS-ALVO GENÔMICOS DE MILHO ALVOS DE UM SISTEMA RNA GUIA/ENDONUCLEASE CAS. MS26 = Gene da Esterilidade Masculina 26, LIG = Promotor do gene Liguleless 1, MS45 = Gene da Esterilidade Masculina 45, ALS = gene da Acetolactato Sintase, EPSPS = gene da enolpiruvilchiquimato fosfato sintase.
[0310] Os cassetes de expressão da endonuclease Cas9 milho- otimizada e RNA guia longo contendo os domínios de direcionamento variáveis específicos para milho foram coentregues a 60-90 embriões imaturos de milho Hi-II pela entrega mediada por partículas (vide o Exemplo 10) na presença dos genes BBM e WUS2 (vide o Exemplo 11). Embriões de milho Hi-II transformados com as endonucleases de homing LIG3-4 ou MS26++ (vide o Exemplo 9) com direcionamento para o mesmo locus genômico de milho como os sítios-alvo LIGCas ou MS26Cas serviram como controle positivo e os embriões transformados apenas com o cassete de expressão de Cas9 ou RNA guia serviram como controles negativos. Após 7 dias, os 20-30 embriões mais uniformemente transformados de cada tratamento foram reunidos e o DNA genômico total foi extraído. A região em torno do sítio alvo pretendido foi amplificada por PCR com o kit para PCR ‘Phusion® High Fidelity PCR Master Mix’ (New England Biolabs, M0531L) adicionando as sequências necessárias para códigos de barras e sequenciamento Illumnia amplicon-específicos usando primers “tailed” através de duas rodadas de PCR. Os primers utilizados na reação de PCR primária são apresentados na Tabela 2 e os primers utilizados na reação de PCR secundária foram AATGATACGGCGACCACCGAGATCTACACTCTTTCCCTACACG (direto, SEQ ID NO: 53) e CAAGCAGAAGACGGCATA (reverso, SEQ ID NO: 54). TABELA 2 SEQUÊNCIAS DE PRIMERS PARA PCR
[0311] As amplificações da PCR resultantes foram purificadas em uma coluna de purificação por centrifugação Qiagen PCR purification spin column, concentração foi medida por um ensaio fluorimétrico com base no corante Hoechst, combinados em uma proporção equimolar, e foi realizada uma leitura única de 100 nucleotídeos de comprimento por sequenciamento em profundidade em um sequenciador MiSeq Personal Sequencer da IIlumina um MiSeq pessoal sequenciador com um aumento 30-40% (v/v) de phiX controle v3 (Illumina, FC-110-3001) para compensar o viés de sequência. Somente aqueles reads (leituras feitas) com um nucleotídeo indel > 1 surgindo dentro da janela de 10 nucleotídeos centrado sobre o sítio de clivagem previsto e não encontrado em um nível semelhante no controle negativo foram classificados como mutações NHEJ. As leituras (ou reads) NHEJ mutantes com a mesma mutação foram contadas e caíram em um único read e as 10 principais mutações mais prevalentes foram visualmente confirmadas como surgindo dentro do sítio de clivagem previsto. O número total de mutações NHEJ visualmente confirmadas foi então usado para calcular a % de reads mutantes com base no número total de leituras (reads) de um comprimento apropriado contendo uma combinação perfeita com o código de barras e primer direto. A frequência de mutações NHEJ recuperadas pelo sequenciamento em profundidade para o sistema RNA guia/endonuclease Cas direcionada aos três alvos LIGCas (SEQ ID NOS: 16, 17, 18) em comparação com a endonuclease de homing LIG3-4 direcionada para o mesmo locus é mostrado na Tabela 3. Os dez tipos mais prevalentes de mutações NHEJ recuperados com base no sistema RNA guia/endonuclease Cas em comparação com a endonuclease de homing LIG3-4 são mostrados na Figura 3A (que corresponde as SEQ ID NOs: 55-75) e Figura 3-B (correspondendo as SEQ ID NOs: 76-96). Aproximadamente frequências de 12-23 vezes mais elevadas de mutações NHEJ foram observadas quando se utiliza um sistema RNA guia/Cas para introduzir uma quebra de dupla fita em um sítio alvo genômico no milho (sítios- alvo CAS), em relação à endonuclease de homing LIG3-4 usada como controle. Conforme mostrado na Tabela 4, observou-se uma diferença similar entre o sistema RNA guia/Cas e as tecnologias de meganuclease para quebra de dupla fita no locus MS26, com frequências de mutações NHEJ aproximadamente 14-25 vezes mais elevadas quando o sistema RNA guia/endonuclease Cas foi utilizado. As altas frequências de mutações NHEJ também foram recuperadas nos alvos de Cas; MS45, ALS e EPSPS (vide a Tabela 5) quando se utiliza um sistema de endonuclease RNA guia/Cas. Estes dados indicam que o sistema de RNA guia/endonuclease Cas descrito na presente divulgação pode ser eficazmente utilizado para introduzir uma alteração nos sítios genômicos de interesse, tais como aqueles relacionados com a fertilidade masculina, em que a alteração resulta na criação de um locus do gene estéril masculino e plantas estéreis-masculinas. A alteração do alvo EPSPS pode resultar na produção de plantas que são tolerantes e/ou resistentes contra herbicidas à base de glifosato. A alteração do sítio alvo do gene do gene da acetolactato sintase (ALS) pode resultar na produção de plantas que são tolerantes e/ou resistentes à imidazolinona e herbicidas de sulfonilureia. TABELA 3 PERCENTAGEM (%) DE LEITURAS (READS) MUTANTES NO LOCUS ALVO LIGULELESSI DE MILHO PRODUZIDO POR UM SISTEMA RNA GUIA/CAS VERSUS UM SISTEMA DE ENDONUCLEASE DE HOMING . TABELA 4 PERCENTAGEM (%) DE LEITURAS (READS) MUTANTES NO LOCUS ALVO ESTERILIDADE MASCULINA 26 DE MILHO PRODUZIDO POR UM SISTEMA RNA GUIA/CAS VERSUS UM SISTEMA DE ENDONUCLEASE DE HOMING. TABELA 5 PERCENTAGEM (%) DE LEITURAS (READS) MUTANTES NOS LOCI ALVOS DE ESTERILIDADE MASCULINA 45 DE MILHO, ACETOLACTATO SINTASE E ENOLPIRUVILCHIQUIMATO FOSFATO SINTASE PRODUZIDOS PELO SISTEMA RNA GUIA/CAS.
[0312] Em conjunto, os nossos dados indicam que o sistema de RNA guia/endonuclease Cas otimizado para milho descrito na presente divulgação utilizando um cassete de expressão de RNA guia longo cliva eficientemente o DNA cromossômico do milho e gera mutações NHEJ imperfeitas em frequências maiores que as endonucleases de homing LIG3-4 e MS26++ geneticamente modificadas.
EXEMPLO 3 O SISTEMA RNA GUIA/ENDONUCLEASE CAS OTIMIZADO PARA MILHO COM RNA GUIA LONGO CLIVA O DNA CROMOSSÔMICO DE FORMA MAIS EFICIENTE DO QUE COM RNA GUIA CURTO
[0313] Para determinar o RNA guia mais eficaz (que compreende uma fusão do crRNA e tracrRNA) para utilização no milho, a recuperação de mutações NHEJ usando um RNA guia curto (SEQ ID NO: 11) com base em Jinek et al.(2012) Science 337: 816-21 e um RNA guia longo (SEQ ID NO: 8) com base em Mali et al.(2013) Science 339: 823-26 foi examinada.
[0314] Os domínios de direcionamento variáveis do RNA guia visando os sítios alvo genômicos do milho no locus LIG (LIGCas-1, LIGCas-2 e LIGCas-3, SEQ ID NOs: 16, 17 e 18, Tabela 1) foram introduzidos em ambos os cassetes de expressão de RNA de guia longo e curto otimizados para milho, tal como descrito no Exemplo 1, e cotransformados juntamente com o cassete de expressão de endonuclease Cas9 milho-otimizada em embriões imaturos de milho e o sequenciamento em profundidade foi realizado para mutações NHEJ conforme descrito no Exemplo 2. Os embriões transformados apenas com o cassete de expressão da endonuclease Cas9 serviram como controlo negativo.
[0315] Conforme mostrado na Tabela 6 abaixo, a frequência de mutações NHEJ recuperadas com o RNA guia longo ultrapassou a frequência obtida com o RNA guia curto. Estes dados indicam que o RNA guia longo pareado com o gene da endonuclease Cas9 milho-otimizada descrito no presente documento cliva de forma mais eficiente o DNA cromossômico do milho. TABELA 6 PERCENTAGEM (%) DE LEITURAS (READS) MUTANTES NO LOCUS ALVO LIGULELESSI DE MILHO PRODUZIDO POR UM SISTEMA RNA GUIA/CAS COM UM RNA GUIA LONGO VERSUS UM RNA GUIA CURTO
EXEMPLO 4 SISTEMA RNA GUIA/ENDONUCLEASE CAS PODE SER MULTIPLEXADO PARA ATINGIR SIMULTANEAMENTE MÚLTIPLOS LOCI CROMOSSÔMICOS NO MILHO PARA A MUTAGÊNESE POR JUNÇÃO DE EXTREMIDADES NÃO HOMÓLOGAS IMPERFEITA
[0316] Para testar se múltiplos loci cromossômicos podem ser simultaneamente mutagenizados com o sistema RNA guia/endonuclease Cas milho-otimizada descrito na presente divulgação, os cassetes de expressão de RNA guia longo de direcionamento para o sítio alvo MS26Cas-2 (SEQ ID NO: 14), sítio alvo LIGCas-3 (SEQ ID NO: 18) e sítio alvo MS45Cas-2 (SEQ ID NO: 20), foram cotransformados em embriões de milho em duplexo ou triplexo juntamente com o cassete de expressão da endonuclease Cas9 e foram examinados por sequenciamento em profundidade para a presença mutações NHEJ imprecisas conforme descrito no Exemplo 2.
[0317] Embriões de milho Hi-II cotransformados com o cassete de expressão Cas9 e o cassete de expressão do RNA guia correspondente isoladamente serviram como controle positivo e os embriões transformados apenas com o cassete de expressão Cas9 serviram como controle negativo.
[0318] Conforme mostrado na Tabela 7 abaixo, as mutações resultantes da NHEJ imprecisa foram recuperadas em todos os loci relevantes quando múltiplos cassetes de expressão de RNA guia foram introduzidos simultaneamente em duplexo ou triplexo com frequências de leituras (reads) mutantes próximas àquelas obtidas no controle positivo. Demonstrando assim que o sistema RNA guia/endonuclease Cas milho-otimizado descrito na presente divulgação pode ser usado para introduzir simultaneamente mutações NHEJ imprecisas em múltiplos loci no milho. TABELA 7 PERCENTAGEM (%) DE LEITURAS (READS) MUTANTES EM LOCI ALVOS DE MILHO PRODUZIDOS POR UM SISTEMA RNA GUIA/CAS MULTIPLEXADO
EXEMPLO 5 CLIVAGEM DE DNA MEDIADA PELO RNA GUIA/ENDONUCLEASE CAS EM LOCI CROMOSSÔMICOS DE MILHO PODE ESTIMULAR A INSERÇÃO DE TRANSGENE MEDIADA PELA REPARAÇÃO POR RECOMBINAÇÃO HOMÓLOGA
[0319] Para testar a utilidade do sistema de RNA guia/Cas otimizado para milho descrito na presente divulgação para clivar um loci cromossômico no milho e estimular as vias de reparação por recombinação homóloga (HR) para a introdução sítio-específica de um transgene, um vetor de DNA de reparação por HR (também referido como DNA doador) (SEQ ID NO: 97) foi construído tal como ilustrado na Figura 4 usando o técnicas-padrão de biologia molecular e foi cotransformado com um cassete de expressão de RNA guia longo, que compreende um domínio de direcionamento variável correspondente ao sítio alvo genômico LIGCas-3, e um cassete de expressão da endonuclease Cas9 em embriões imaturos de milho conforme descrito no Exemplo 2.
[0320] Embriões de milho cotransformados com o vetor de DNA de reparação por HR a endonuclease de homing LIG3-4 (vide Exemplo 9) visando o mesmo sítio alvo genômico como a LIGCas-3 serviu como controle positivo. Um vez que a entrega bem-sucedida do vetor de DNA de reparação por HR confere resistência ao herbicida bialafos, eventos de calos contendo inserções transgênicas putativas mediada pela HR foram selecionados pela colocação dos calos em meio contendo herbicida. Após seleção, eventos de calo estáveis foram amostrados, o DNA genômico total foi extraído, e utilizando pares de primers apresentados na Figura 5 (correspondendo as SEQ ID NOs: 98101) a amplificação por PCR foi realizada em ambas as junções de DNA genômico transgênicas possíveis para identificar inserções transgênicas putativas mediadas pela HR. As amplificações resultantes foram sequenciadas para a confirmação.
[0321]As amplificações de PCR com sequência confirmada indicando a inserção do transgene sítio-específica para o sistema RNA guia/Cas foram detectadas em 37 dos 384 transformantes estáveis com 15 deles contendo amplificações em ambas junções transgênicas de DNA genômico, indicando uma inserção sítio-específica quase perfeita do transgene. A endonuclease de homing LIG3-4 de controle positivo rendeu amplificações de PCR indicando a inserção do transgene sítio- específica em 3 dos 192 transformantes estáveis, com um deles 1 contendo amplificações em ambas as junções de DNA genômico. Os dados demonstram claramente que os loci cromossômicos de milho clivados utilizando o sistema RNA guia/Cas otimizado para milho descrito na presente divulgação podem ser utilizados para estimular as vias de reparação HR para inserção sítio-específica de transgenes em frequências superiores àquelas obtidas com o uso da endonuclease de homing LIG3-4.
EXEMPLO 6 SISTEMA RNA GUIA/ENDONUCLEASE CAS TRANSFORMADO JUNTOS EM UM ÚNICO VETOR RESULTA EM MAIOR RECUPERAÇÃO DE MUTAÇÕES POR JUNÇÃO DE EXTREMIDADES NÃO HOMÓLOGAS IMPERFEITA
[0322] Para avaliar diferentes métodos de entrega para o sistema RNA guia/endonuclease Cas otimizado para milho descrito na presente divulgação, foi examinada a recuperação de mutações NHEJ quando cassetes de expressão RNA guia/Cas foram cotransformados como vetores de DNA separados, tal como nos Exemplos 2, 3, 4 e 5, ou quando foram transformados como um único vetor de DNA (contendo os cassetes de expressão de RNA guia e de endonuclease Cas, conforme mostrado na Figura 1C).
[0323] O cassete de expressão do RNA guia longa para LIGCas-3 e o cassete de expressão Cas9 foram consolidados em um único vetor de DNA (Figura 1 C, SEQ ID NO: 102) por meio de técnicas padrão de biologia molecular e foram transformados em embriões de milho imaturos Hi-II, conforme descrito nos Exemplos 10 e 11, pela entrega mediada por partículas. Embriões de milho Hi-II cotransformados com os cassetes de expressão Cas9 e RNA guia longo LIGCas-3 serviram como controle positivo e os embriões transformados apenas com o cassete de expressão Cas9 serviram como controle negativo. O sequenciamento em profundidade para mutações NHEJ foi realizado conforme descrito no Exemplo 2.
[0324] Conforme mostrados na Tabela 8 abaixo, a frequência de mutações NHEJ recuperadas quando cassetes de expressão com endonuclease Cas e RNA guia longo foram entregues juntos como um vetor de DNA único foi aproximadamente 2 vezes maior do que a frequência observada a partir do experimento de cotransformação equivalente. Isto indica que a entrega dos cassetes de expressão do sistema RNA guia/Cas juntos em um único vetor de DNA resulta em uma maior recuperação de mutações por junção de extremidades não homólogas imperfeita. TABELA 8 PERCENTUAL (%) DE LEITURAS (READS) MUTANTES NO LOCUS LIGULELESS 1 DE MILHO PRODUZIDAS POR UM SISTEMA RNA GUIA/CAS COM CASSETES DE EXPRESSÃO DE CAS9 E RNA GUIA COMBINADOS EM UM ÚNICO VETOR DE DNA VERSUS DOIS VETORES DE DNA SEPARADOS
EXEMPLO 7 MÉTODOS DE ENTREGA PARA A EDIÇÃO DO GENOMA VEGETAL USANDO O SISTEMA RNA GUIA/ENDONUCLEASE CAS
[0325] Este exemplo descreve métodos para fornecer ou manter e expressar a endonuclease Cas9 e RNA guia (ou crRNA individual e tracrRNAs) em, ou dentro de plantas, respectivamente, para permitir a modificação do DNA direcionada ou a inserção de gene por recombinação homóloga. Mais especificamente, este exemplo descreve uma variedade de métodos que incluem, mas não se limitam a, entrega da endonuclease Cas9 como um DNA, RNA (5'-encapado e poliadenilado) ou molécula de proteína. Além disso, o RNA guia pode ser entregue como uma molécula de DNA ou RNA.
[0326] Conforme o Exemplo 2, foi observada uma alta frequência de mutação quando a endonuclease Cas9 e RNA guia foram entregues como vetores de DNA por transformação utilizando a biobalística em embriões de milho imaturos. Outros exemplos de realização da presente divulgação podem fornecer a endonuclease Cas9 como DNA, RNA ou proteína e o RNA guia como uma molécula de DNA ou RNA ou como uma molécula de crRNA/tracrRNA duplexa como RNA ou DNA ou uma combinação. Várias combinações de métodos de entrega de endonucleases Cas9, RNA guia e crRNA/tracrRNA podem ser, mas não estão limitados a, os métodos mostrados na Tabela 9. TABELA 9 DIVERSAS COMBINAÇÕES DE ENTREGA DA ENDONUCLEASE CAS9, RNA GUIA OU CRNA + TRACRRNA.
[0327] A entrega do Cas9 (como vetor de DNA) e RNA guia (como um vetor de DNA) (Tabela 9, combinação 1) também pode ser conseguida pela coentrega destes cassetes de DNA em um único vetor ou múltiplos vetores de Agrobacterium e a transformação de tecidos vegetais pela transformação mediada por Agrobacterium. Além disso, um vetor contendo um gene Cas9 constitutivo, tecido-específico ou condicionalmente regulado pode ser primeiro entregue à célula vegetal para permitir a integração estável no genoma da planta e estabelecer uma linhagem vegetal que contém apenas o gene Cas9 no genoma da planta. Neste exemplo, um único RNA guia ou vários RNAs guia ou um único crRNA ou vários crRNAs, e um tracrRNA pode(m) ser entregue(s) como DNA ou RNA, ou uma combinação destes, para a linhagem de planta contendo a versão integrada no genoma do gene Cas9 com o objetivo de gerar mutações ou promover a recombinação homóloga quando vetores de DNA de reparação por HR para a integração direcionada são coentregues com os RNAs guia. Como extensão deste exemplo, também pode ser estabelecida uma linhagem de planta contendo a versão integrada no genoma do gene Cas9 e um tracrRNA como molécula de DNA. Neste exemplo moléculas de crRNA únicas ou múltiplas podem ser entregues como RNA ou DNA para promover a geração de mutações ou promover a recombinação homóloga, quando os vetores de DNA de reparação por HR para a integração direcionada são coentregues com a(s) molécula(s) de crRNA (s) que permite(m) a mutagênese ou recombinação homóloga nos sítios únicos ou múltiplos no genoma da planta.
EXEMPLO 8 COMPONENTES DO SISTEMA RNA GUIA/ENDONUCLEASE CAS ENTREGUES DIRETAMENTE COMO RNA EM PLANTAS
[0328] Este exemplo ilustra o uso de métodos, tal como descrito na Tabela 9, na configuração do Exemplo 7 [Cas9 (vetor de DNA), RNA guia (RNA)] para a modificação ou mutagênese de loci cromossômicos em plantas. A cassete de expressão da endonuclease Cas9 milho-otimizada descrito no Exemplo 1 foi coentregue por bombardeamento de partículas com biobalística, tal como descrito no Exemplo 2 juntamente com moléculas de RNA de fita simples (sintetizadas pela Integrated DNA Technologies, Inc.) que constitui uma RNA guia curto de direcionamento para o locus de milho e a sequência mostrada na Tabela 10. Os embriões transformados apenas com o cassete de expressão de Cas9 ou moléculas de RNA guia curto serviram como controles negativos. Sete dias após o bombardeamento, os embriões imaturos foram coletados e analisados pelo sequenciamento em profundidade para mutações NHEJ conforme descrito no Exemplo 2. As mutações que não estão presentes nos controles negativos foram encontradas no local (Figura 6, correspondente à SEQ ID NOs: 104-110). Estas mutações foram semelhantes às encontradas nos Exemplos 2, 3, 4 e 6. Estes dados indicam que o(s) componente(s) do sistema RNA guia/ endonuclease Cas milho-otimizado descrito na presente divulgação pode(m) ser entregue(s) diretamente como RNA. TABELA 10 SÍTIO ALVO GENÔMICO NO MILHO E LOCALIZAÇÃO PARA RNA GUIA CURTO ENTREGUE COMO RNA.
EXEMPLO 9 CRIAÇÃO DE MEGANUCLEASES MODIFICADAS DE CORTE RARO MEGANUCLEASE LIG3-4 E SEQUÊNCIA DE RECONHECIMENTO DESTINADA A LIG3-4
[0329] Um sítio alvo genômico de milho endógeno compreendendo a sequência de reconhecimento que visa LIG3-4 (SEQ ID NO: 111) foi escolhido para a concepção de um agente indutor de quebra de dupla fita de corte raro (SEQ ID NO: 112), tal como descrito na publicação de patente US 2009-0133152 A1 (publicada em 21 de maio de 2009). a sequência de reconhecimento visando LIG3-4 é um polinucleotídeo de 22 bp com a seguinte sequência: ATATACCTCACACGTACGCGTA (SEQ ID NO: 111).
MEGANUCLEASE MS 26++
[0330] Um sítio alvo genômico de milho endógeno designado “TS- MS26” (SEQ ID NO: 113) foi escolhido para a concepção de um agente de quebra de dupla fita customizado MS26++ tal como descrito no pedido de patente US 13/526912 depositado em 19 de junho de 2012). O sítio alvo TS- MS26 é um polinucleotídeo de 22 bp posicionado a 62 bp a partir da extremidade 5' do quinto éxon do gene MS26 do milho e possuindo a seguinte sequência: gatggtgacgtacAgtgccctac (SEQ ID NO: 113). O sítio de quebra de dupla fita e a região de saliência (overhang) estão sublinhados, o cortes enzimático após C13 é indicado por A. Sequências de nucleotídeos planta- otimizadas para uma endonuclease modificada (SEQ ID NO: 114) que codifica uma endonuclease geneticamente modificada MS26++ foram desenhadas para se ligarem e produzirem quebras de dupla fita no sítio alvo selecionado TS- MS26.
EXEMPLO 10 TRANSFORMAÇÃO DE EMBRIÕES DE MILHO IMATUROS
[0331] A transformação pode ser conseguida por diversos métodos conhecidos como eficazes em plantas, incluindo a entrega mediada por partículas, transformação mediada por Agrobacterium, entrega mediada por PEG, e eletroporação.
A. ENTREGA MEDIADA POR PARTÍCULAS
[0332] A transformação de embriões imaturos de milho pela entrega de partículas é realizada da seguinte forma. As receitas de meios seguem abaixo.
[0333] As espigas são descascadas e têm suas superfícies esterilizadas em 30% de Clorox mais 0,5% de Micro detergente durante 20 minutos, e são enxaguadas duas vezes com água estéril. Os embriões imaturos são isolados e colocados com o eixo do embrião voltado para baixo (o lado do escutelo para cima), 25 embriões por placa, em meio 560Y durante 4 horas e, em seguida, alinhados dentro da zona alvo de 2,5 cm, na preparação para o bombardeamento. Alternativamente, embriões isolados são colocados em 560L (meio de iniciação) e colocados no escuro, com temperaturas variando de 26 °C a 37 °C durante 8 a 24 horas antes da colocação em 560Y durante 4 horas a 26 °C antes do bombardeamento, tal como descrito acima.
[0334] Os plasmídeos contendo o agente de quebra de dupla fita e DNA doador são construídos usando técnicas de biologia molecular padrão e cobombardeado com plasmídeos contendo os genes de desenvolvimento ODP2 (domínio AP2 do fator de transcrição de ODP2 (proteína de desenvolvimento de óvulo 2); US20090328252 A1) e Wushel (US2011/0.167.516).
[0335] Os plasmídeos e DNA de interesse são precipitados em microesferas de ouro de 0,6 μm (diâmetro médio) usando um reagente de transfecção de lipídeo catiônico solúvel em água da seguinte forma. A solução de DNA é preparada em gelo utilizando 1 μg de DNA plasmidial e, opcionalmente, outras construções por cobombardeamento tal como 50 ng (0,5 μL) de cada plasmídeo contendo os genes de desenvolvimento ODP2 (domínio AP2 do fator de transcrição de ODP2 (proteína de desenvolvimento de óvulo 2); US20090328252 A1) e Wushel. Para o DNA pré-misturado, 20 μL de partículas de ouro preparadas (15 mg/mL) e 5 μL de um reagente de transfecção de lipídeo catiônico solúvel em água são adicionados em água e cuidadosamente misturados. As partículas de ouro são sedimentadas em uma microcentrífuga a 10000 rpm durante 1 min e o sobrenadante é removido. O sedimento resultante é cuidadosamente lavado com 100 ml de EtOH 100%, sem resuspensão do sedimento e o EtOH da lavagem é cuidadosamente removido. 105 μL de EtOH 100% são adicionados e as partículas são novamente suspensas por breve sonicação. Em seguida, 10 μL são colocados ao centro de cada macrocarreador e deixados secar por cerca de 2 minutos antes do bombardeamento.
[0336] Alternativamente, os plasmídeos e DNA de interesse são precipitados em pellets de tungstênio de 1,1 μm (diâmetro médio) usando um procedimento de precipitação em cloreto de cálcio (CaCl2) pela mistura de 100 μL de partículas de tungstênio preparadas em água, 10 μl (1 μg) de DNA em tampão Tris EDTA (1 μg de DNA total), 100 μL de CaCl2 2,5 M, e 10 μL de espermidina 0,1 M. Cada um dos reagentes é sequencialmente adicionado à suspensão de partículas de tungstênio, e em seguida são misturados. A mistura final é brevemente sonicada e deixada incubar sob agitação em vortex constante durante 10 minutos. Após o período de precipitação, os tubos são brevemente centrifugados, o líquido é removido e as partículas são lavadas com 500 ml de etanol a 100%, seguido de uma centrifugação de 30 segundos. Novamente, o líquido é removido e 105 μL de etanol a 100% são adicionados ao sedimento de partículas de tungstênio final. Para bombardeamento de partículas por biobalística, as partículas de tungstênio/DNA são brevemente sonicadas. 10 μL das partículas de tungstênio/DNA são colocadas ao centro de cada macrocarreador, em seguida as partículas são deixadas secar por cerca de 2 minutos antes do bombardeamento.
[0337] As placas de amostra são bombardeadas a nível #4 com o uso de um Biorad Helium Gun. Todas as amostras recebem um único tiro a 450 PSI, com um total de dez alíquotas retiradas de cada tubo de partículas/DNA preparado.
[0338] Após o bombardeamento, os embriões são incubados em 560P (meio de manutenção) durante 12 a 48 horas em temperaturas variando de 26 °C a 37 °C, e depois colocados a 26 °C. Após 5 a 7 dias, os embriões são transferidos para meio de seleção 560R contendo 3 mg/litro de Bialafos, e subcultivados a cada 2 semanas a 26 °C. Após aproximadamente 10 semanas de seleção, os clones de calos resistentes à seleção são transferidos para o meio 288J para iniciar a regeneração das plantas. Após a maturação dos embriões somáticos (2-4 semanas), os embriões somáticos bem desenvolvidos são transferidos para meio de germinação e transferidos para uma sala de cultura iluminada. Aproximadamente 7-10 dias mais tarde, as plântulas são transferidas para o meio de desenvolvimento 272V sem de hormônios em tubos durante 7-10 dias até que as plântulas estejam bem estabelecidas. As plantas são então transferidas para inserções em planos (equivalente a um vaso de 2,5’’) contendo terra para vaso e foram cultivadas durante 1 semana em câmara de crescimento, e subsequentemente cultivadas por mais 1-2 semanas em estufa, em seguida, transferidas para vasos 600 clássico (1,6 galões) e cresceram até a maturidade. As plantas são monitoradas e pontuadas de acordo com a eficiência de transformação e/ou modificação de capacidades regenerativas.
[0339] O meio de iniciação (560L) compreende 4,0 g/L de sais basais N6 (SIGMA C-1416), 1,0 mL/L de mistura de vitaminas de Eriksson (1000X SIGMA-1511), 0,5 mg/L de tiamina HCl, 20,0 g/L de sacarose, 1,0 mg/L de 2,4-D, e 2,88 g/L de L-prolina (levado a um volume com H2O D-I após o ajuste do pH para 5,8 com KOH); 2,0 g/L de Gelrite (adicionado após o ajuste do volume com H2O D-I); e 8,5 mg/L de nitrato de prata (adicionado após a esterilização do meio e arrefecimento de meio até a temperatura ambiente).
[0340] O meio de manutenção (560P) compreende 4,0 g/L de sais basais N6 (SIGMA C-1416), 1,0 mL/L de mistura de vitaminas de Eriksson (1000X SIGMA-1511), 0,5 mg/L de tiamina HCl, 30,0 g/L de sacarose, 2,0 mg/L de 2,4-D, e 0,69 g/L de L-prolina (levado a um volume com H2O D-I após o ajuste do pH para 5,8 com KOH); 3,0 g/L de Gelrite (adicionado após o ajuste do volume com H2O D-I); e 0,85 mg/L de nitrato de prata (adicionado após a esterilização do meio e arrefecimento de meio até a temperatura ambiente).
[0341] O meio bombardeamento (560Y) compreende 4,0 g/L de sais basais N6 (SIGMA C-1416), 1,0 mL/L de mistura de vitaminas de Eriksson (1000X SIGMA-1511), 0,5 mg/L de tiamina HCl, 120,0 g/L de sacarose, 1,0 mg/L de 2,4-D, e 2,88 g/L de L-prolina (levado a um volume com H2O D-I após o ajuste do pH para 5,8 com KOH); 2,0 g/L de Gelrite (adicionado após o ajuste do volume com H2O D-I); e 8,5 mg/L de nitrato de prata (adicionado após a esterilização do meio e arrefecimento de meio até a temperatura ambiente).
[0342] O meio de seleção (560R) compreende 4,0 g/L de sais basais N6 (SIGMA C-1416), 1,0 mL/L de mistura de vitaminas de Eriksson (1000X SIGMA-1511), 0,5 mg/L de tiamina HCl, 30,0 g/L de sacarose e 2,0 mg/L de 2,4-D (levado a um volume com H2O D-I após o ajuste do pH para 5,8 com KOH); 3,0 g/L de Gelrite (adicionado após o ajuste do volume com H2O D I); e 0,85 mg/L de nitrato de prata e e 3,0 mg/L de bialafos (ambos adicionado após a esterilização do meio e arrefecimento de meio até a temperatura ambiente).
[0343] Meio de regeneração de plantas (288J) compreende 4,3 g/L de sais MS (Gibco 11117-074), 5,0 mL/L de solução estoque de vitaminas MS (0,100 g de ácido nicotínico, 0,02 g/L de tiamina HCL, 0,10 g/L de piridoxina HCL, e 0,40 g/L de glicina levado a volume com H2O D-I polida) (Murashige e Skoog (1962) Physiol. Plant. 15:473), 100 mg/L de mio-inositol, 0,5 mg/L de zeatina, 60 g/L de sacarose, 1,0 ml/L de ácido abscísico 0,1 mM (levados ao volume com H2O D-I polida após ajuste a pH 5,6); 3,0 g/L de Gelrite (adicionado após ajustar ao volume com H2O D-I); e 1,0 m/L de ácido indoleacético e bialafos a 3,0 mg/L (adicionados após a esterilização do meio e arrefecimento a 60°C).
[0344] Meio sem hormônio (272V) compreende 4,3 g/L de sais MS (GIBCO 11117-074), 5,0 mL/L de solução estoque de vitaminas MS (0,100 g ácido nicotínico, 0,02 g/L de tiamina HCl, 0,10 g/L de piridoxina HCl, 0,40 g/L de glicina, ajustado ao volume com H2O D-I polida), 0,1 g/L de mioinositol, e 40,0 g/L de sacarose (ajustado ao volume com H2O D-I polida após ajuste para pH 5,6); e ágar Bacto a 6 g/L (adicionado após ajustar o volume com H2O D-I polida), esterilizado e resfriado a 60 °C.
B. TRANSFORMAÇÃO MEDIADA POR AGROBACTERIUM
[0345] A transformação mediada por Agrobacterium foi realizada essencialmente como descrito em Djukanovic et al. (2006) Plant Biotech J 4:345-57. Resumidamente, embriões imaturos com 10-12 dias de idade (0,8 - 2,5 mm de tamanho) foram dissecados a partir das sementes esterilizadas e colocados em meio líquido (4,0 g/L de Sais Básicos N6 (Sigma C-1416), 1,0 mL/L de mistura de vitamina de Eriksson (Sigma E-1511), 1,0 mg/L de tiamina HCl, 1,5 mg/L de 2, 4-D, 0,690 g/L de L-prolina, 68,5 g/L de sacarose, 36,0 g/L de glicose, pH 5,2). Após a coleta de embriões, o meio foi substituído com 1 mL de Agrobacterium, em uma concentração de 0,35-0,45 OD550. Embriões de milho foram incubados com o Agrobacterium durante 5 min à temperatura ambiente, em seguida, a mistura foi vertida sobre uma placa de meio contendo 4,0 g/L de Sais Básicos N6 (Sigma C-1416), 1,0 mL/L de mistura de vitaminas de Eriksson (Sigma E-1511), 1,0 mg/L de tiamina HCl, 1,5 mg/L de 2, 4-D, 0,690 g/L de L-prolina, 30,0 g/L de sacarose, 0,85 mg/L de nitrato de prata, 0,1 nM de acetosiringona, e 3,0 g/L de Gelrite, pH 5,8. Os embriões foram incubados com o eixo para baixo, no escuro, durante 3 dias a 20 °C, em seguida, incubados 4 dias no escuro a 28 °C, em seguida transferidos para placas com meio novo contendo 4,0 g/L de Sais Básicos N6 (Sigma C-1416), 1,0 mL/L de mistura de vitaminas de Eriksson (Sigma E-1511), 1,0 mg/L de tiamina HCl, 1,5 mg/L de 2, 4-D, 0,69 g/L de L-prolina, 30,0 g/L de sacarose, 0,5 g/L de tampão MES, 0,85 mg/L de nitrato de prata, 3,0 mg/L de bialafos, 100 mg/L de carbenicilina, e 6,0 g/L de ágar, pH 5,8. Os embriões foram subcultivados a cada três semanas, até que os eventos transgênicos foram identificados. A embriogênese somática foi induzida através da transferência de uma pequena quantidade de tecido em meio de regeneração (4,3 g/L sais MS (Gibco 11117), 5,0 mL/L de solução estoque de vitaminas MS, 100 mg/L de mio-inositol, 0,1 μM de ABA, 1 mg/g de IAA, 0,5 mg/L de zeatina, 60,0 g/L de sacarose, 1,5 mg/L de bialafos, 100 mg/L de carbenicilina, 3,0 g/L de Gelrite, pH 5,6) e incubação no escuro durante duas semanas a 28 °C. Todo o material com brotos visíveis e raízes foram transferidos para meio contendo 4,3 g/L de sais MS (Gibco 11117), 5,0 mL/L de solução estoque de Vitaminas MS, 100 mg/L de mio-inositol, 40,0 g/L de sacarose, 1,5 g/L Gelrite, pH 5,6, e incubado sob luz artificial a 28 °C. Uma semana mais tarde, as plântulas foram transferidas para tubos de vidro que continham o mesmo meio e cultivadas até que fossem amostradas e/ou transplantadas para o solo.
EXEMPLO 11 EXPRESSÃO TRANSITÓRIA DE BBM MELHORA A TRANSFORMAÇÃO
[0346] Os parâmetros do protocolo de transformação podem ser modificados para assegurar que a atividade BBM seja transitória. Tal método envolve a precipitação do plasmídeo contendo BBM de modo a permitir a transcrição e expressão, mas impedir a subsequente liberação do DNA, por exemplo, usando o químico PEI.
[0347] Em um exemplo, o plasmídeo BBM é precipitado sobre partículas de ouro com PEI, enquanto que o cassete de expressão transgênico (UBI::moPAT~GFPm::Pinll; moPAT é o gene PAT milho-otimizado) a ser integrado é precipitado sobre partículas de ouro que utilizam o método do cloreto de cálcio padrão.
[0348] Resumidamente, partículas de ouro foram revestidas com PEI da seguinte forma. Em primeiro lugar, as partículas de ouro foram lavadas. Trinta e cinco mg de partículas de ouro, 1,0 de diâmetro médio (ASI # 1620010), foram pesados em um tubo de microcentrífuga, e foi adicionado 1,2 mL de EtOH absoluto e os tubos foram agitados em vortex durante um minuto. O tubo foi incubado durante 15 minutos em temperatura ambiente e depois centrifugado em alta velocidade utilizando uma microcentrifuga por 15 minutos a 4 °C. O sobrenadante foi rejeitado e uma nova alíquota de 1,2 mL de etanol (EtOH) foi adicionada, agitada em vortex, durante um minuto, centrifugada durante um minuto, e o sobrenadante foi novamente descartado (isto é repetido por duas vezes). Uma alíquota fresca de 1,2 mL de EtOH foi adicionada, e essa suspensão (partículas de ouro em EtOH) foi armazenada a -20 °C por semanas. Para partículas revestidas com polietilimina (PEI, Sigma # P3143), 250 μL da mistura de partícula de ouro lavada/EtOH foi centrifugada e o EtOH descartado. As partículas foram lavadas uma vez com 100 μL de ddH2O para remover o etanol residual, 250 μL de PEI 0,25 mM foi adicionado, seguido por um impulso de ultrassom para suspender as partículas e, em seguida, o tubo foi mergulhado em um banho de gelo seco/EtOH para o rápido congelamento da suspensão, que em seguida foi liofilizada durante a noite. Neste ponto, partículas revestidas secas podem ser armazenadas a -80 °C durante pelo menos 3 semanas. Antes da utilização, as partículas foram lavadas 3 vezes com alíquotas de 250 mL de tampão HEPES 2,5 mM, pH 7,1, com pulso de sonicação por 1x, e, em seguida, submetidas ao vortex antes de cada centrifugação. As partículas foram então suspensas em um volume final de 250 μL de tampão HEPES. Uma alíquota de 25 μL de partículas foi adicionada em tubos frescos antes anexar o DNA. Para anexar o DNA não revestido, as partículas foram sonicadas e em seguida 1 μg de DNA (em 5 μL de água) foi adicionado, seguido pela mistura por pipetagem para cima e para baixo por algumas vezes com um Pipetteman e as partículas foram incubadas durante 10 minutos. As partículas foram centrifugadas brevemente (ou seja, por 10 segundos), o sobrenadante removido, e 60 μL de EtOH foram adicionados. As partículas com uma DNA-1 precipitado em PEI foram lavadas duas vezes em 60 mL de EtOH. As partículas foram centrifugadas, o sobrenadante descartado e as partículas foram resuspensas em 45 μL de água. Para fixar o segundo DNA (DNA-2), foi utilizada a precipitação utilizando um reagente de transfecção de lipídeo catiônico solúvel em água. Os 45 μL da suspensão de partículas/DNA-1 foram brevemente sonicados, e, em seguida, 5 μL de 100 ng/mL de DNA-2 e 2,5 μL de um reagente de transfecção lipídeo catiônico solúvel em água foram adicionados. A solução foi colocada em um agitador rotativo durante 10 minutos, centrifugada a 10.000 g durante 1 minuto. O sobrenadante foi removido, e as partículas resuspensas em 60 mL de EtOH. A solução foi colocada em macrocarreadores e as partículas de ouro sobre a qual o DNA-1 e DNA-2 estavam sequencialmente ligados foram entregues em células do escutelo de embriões imaturos Hi-II 10 DAP, utilizando um protocolo padrão para o PDS-1000. Para este experimento, o plasmídeo de DNA-1 continha um cassete de expressão UBI::RFP::pinll, e o DNA-2 continha um cassete de expressão UBI::CFP::pinll. Dois dias após o bombardeamento, foi observada a expressão transitória dos marcadores fluorescentes CFP e RFP como numerosas células vermelhas e azuis sobre a superfície do embrião imaturo. Os embriões foram então colocados em meio de cultura não seletivo e deixados crescer durante 3 semanas antes de determinar o escore de colônias estáveis. Após este período de 3 semanas, foram observadas 10 colônias azuis de expressão estável, pluricelulares, em comparação com apenas uma colônia vermelha. Isto demonstrou que a precipitação PEI pode ser usada para introduzir eficazmente o DNA para a expressão transitória, reduzindo drasticamente a integração do DNA introduzido por PEI e reduzindo, assim, a recuperação de fenômenos transgênicos que expressam RFP. Desta maneira, a precipitação em PEI pode ser usada para proporcionar expressão transitória de BBM e/ou WUS2.
[0349] Por exemplo, as partículas são primeiramente revestidas com UBI::BBM::pinll usando PEI, em seguida, revestidas com UBI::moPAT~YFP usando um reagente de transfecção de lipídeo catiônico solúvel em água, e em seguida, bombardeadas nas células do escutelo na superfície de embriões imaturos. A precipitação mediada por PEI resulta de em uma alta frequência de células que expressam transitoriamente na superfície do embrião imaturo e frequências extremamente baixas de recuperação de transformantes estáveis. Assim, espera-se que o cassete BBM precipitado em PEI expresse de forma transitória e estimule uma explosão de crescimento embriogênico na superfície do tecido bombardeado (ou seja, a superfície escutelar), mas este plasmídeo não irá se integrar. Espera-se que o plasmídeo PAT~GFP liberado a partir de Ca++/partículas de ouro integre e expresse o marcador selecionável em uma frequência que resulta em uma substancial melhoria da recuperação de eventos transgênicos. Como tratamento de controle, partículas precipitada em PEI contendo um UBI::GUS::pinll (em vez de BBM) são misturadas com as partículas PAT~GFP/Ca++. Embriões imaturos de ambos os tratamentos são movidos para meio de cultura contendo 3mg/L de bialafos. Após 6-8 semanas, espera-se que calos GFP+, resistentes ao bialafos sejam observados no tratamento PEI/BBM a uma frequência muito mais elevada em relação ao tratamento controle (PEI/GUS).
[0350] Como um método alternativo, o plasmídeo BBM é precipitado sobre partículas de ouro com PEI, e, em seguida, introduzido em células escutelares na superfície de embriões imaturos, e a subsequente expressão transitória do gene BBM provoca uma proliferação rápida de crescimento embriogênico. Durante este período de crescimento induzido, os explantes são tratados com Agrobacterium, utilizando métodos convencionais para o milho (vide o Exemplo 1), com a entrega de T-DNA pela introdução de um cassete de expressão transgênico, tal como UBI::moPAT~GFPm::pinll. Após o cocultivo, os explantes são deixados a recuperar em meio de cultura normal, e em seguida são transferidos para meio de cultura contendo 3 mg/L de bialafos. Após 6-8 semanas, espera-se que calos GFP+, resistentes ao bialafos sejam observados no tratamento PEI/BBM a uma frequência muito mais elevada em relação ao tratamento controle (PEI/GUS).
[0351] Pode ser desejável o crescimento de calos de início rápido “kick start” pela expressão transitória dos produtos de polinucleotídeos BBM e/ou WUS2. Isto pode ser feito pela entrega de RNA 5’-encapado poliadenilado de BBM e WUS2, cassetes de expressão contendo DNA de BBM e WUS2, ou proteínas BBM e/ou WUS2. Todas estas moléculas podem ser entregues utilizando a biobalística de partículas. Por exemplo, RNA de BBM e/ou WUS2 5'-encapado e poliadenilado pode ser facilmente produzido in vitro utilizando o kit mMessage mMachine da Ambion. O RNA é coentregue juntamente com DNA que contém um polinucleotídeo de interesse e um marcador de seleção usado para seleçaõ/triagem, tal como Ubi::moPAT~GFPm::Pinll. Espera-se que as células que recebem o RNA começarão imediatamente apresentar uma divisão mais rápida e uma grande parte destas células podem ter integrado o gene agronômico. Estes eventos podem ser adicionalmente validados como colônias clonais transgênicas, pois eles também irão expressar a proteína de fusão PAT~GFP (e, portanto, exibirão fluorescência verde sob iluminação apropriada). As plantas regeneradas a partir destes embriões podem então ser pesquisadas quanto à presença do polinucleotídeo de interesse.
EXEMPLO 12 CONSTRUÇÕES DE DNA PARA TESTAR O SISTEMA RNA GUIA/ENDONUCLEASE CAS PARA MODIFICAÇÕES NO GENOMA DA SOJA
[0352] Para testar se um sistema RNA guia/endonuclease Cas, semelhante ao descrito no Exemplo 1 para o milho, é funcional em uma dicotiledônea tal como a soja, um gene Cas9 (SO): códon de soja (SEQ ID NO 115) de Streptococcus pyogenes M1 GAS (SF370) códon-otimizado para soja foi expresso juntamente um promotor constitutivo forte da soja GM-EF1A2 (pedido de patente US 20090133159 (SEQ ID NO: 116). Um sinal de localização nuclear de antígeno-T grande do vírus da vacuolização de símios 40 (SV40) (SEQ ID NO: 117), representando as moléculas de aminoácidos PKKKRKV (com um ligante SRAD (SRADPKKKRKV), foi adicionada à extremidade carbóxi-terminal da Cas9 códon-otimizada para facilitar o transporte da proteína Cas9 códon-otimizada (SEQ ID NO: 118) para o núcleo. O gene Cas9 códon-otimizado foi sintetizado como duas peças pela GenScript USA Inc. (Piscataway, NJ) e clonado no quadro de leitura a jusante do promotor GM-EF1A2 para fazer a construção de DNA QC782 mostrada na Figura 7 (SEQ ID NO: 119).
[0353] Promotores U6 da RNA polimerase III de plantas foram clonados e caracterizados a partir de Arabidopsis e Medicago truncatula (Waibel e Filipowicz, NAR 18: 3451-3458 (1990); Li et al, J. Integrat. Plant Biol. 49: 222-229 (2007); Kim e Nam, Plant Mol. Biol. Rep 31: 581-593 (2013); Wang et al, RNA 14: 903-913 (2008)). Os genes de RNA nuclear pequeno (snRNA) U6 de soja foram identificados pela pesquisa na sequência genômica pública da variedade de soja Williams82 usando gene a sequência codificante da U6 de Arabidopsis. Aproximadamente 0,5 kb de sequência de DNA genômico a montante do primeiro nucleotídeo G de um gene U6 foi escolhido para ser usado como promotor da RNA polimerase III, por exemplo, promotor GM-U6- 13.1 (SEQ ID NO: 120), para expressar o RNA guia a fim de orientar a nuclease Cas 9 para sítio genômico designado. A sequência codificante do RNA guia era de 76 bp de comprimento (Figura 8B) e compreendia um domínio de direcionamento variável de 20 bp segmentação a partir de um sítio alvo genômico de soja escolhido na extremidade 5' e uma extensão de 4 ou mais resíduos de T como um terminador de transcrição na extremidade 3'. (SEQ ID NO: 121, Figura 8 B). O primeiro nucleotídeo do domínio de direcionamento variável de 20 bp era um resíduo G para ser usado pela RNA polimerase III para transcrição. O promotor do gene U6 e o RNA guia completo foram sintetizados e, em seguida, clonados em um vetor apropriado para fazer, por exemplo, a construção de DNA QC783 mostrada na Figura 8 A (SEQ ID NO: 122). Outros promotores de genes homólogos U6 da soja foram igualmente clonados e utilizados para expressão do RNA pequeno.
[0354] Uma vez que a endonuclease Cas9 e o RNA guia são necessários para formar um complexo proteína/RNA que medeia a clivagem de dupla fita do DNA do sítio específico, a endonuclease Cas9 e o RNA guia devem ser expressos na mesma célula. Para melhorar a coexpressão e a presença, cassetes de expressão da endonuclease Cas9 e RNA guia foram ligados em uma única construção de DNA, por exemplo, QC815 na Figura 9-A (SEQ ID NO: 123), que foi então usada para transformar células de soja e testar o sistema RNA guia/Cas soja-otimizado para a modificação do genoma. Construções de DNA similares foram feitas em diferentes sítios-alvo genômicos usando RNAs guia contendo diferentes sequências alvo.
EXEMPLO 13 SELEÇÃO DOS SÍTIOS GENÔMICOS DA SOJA PARA SEREM CLIVADOS PELO SISTEMA RNA GUIA/ENDONUCLEASE CAS
[0355] A região do cromossomo 4 da soja (Gm04) foi selecionada para testar se o sistema RNA guia/endonuclease Cas otimizado para a soja poderia reconhecer, quebrar, e mutar o DNA cromossômico da soja através da reparação por junção de extremidades não homólogas (NHEJ) imprecisa. Dois sítios-alvo genômicos foram selecionados um perto de um gene previsto Glyma04g39780.1 a 114.13 cM, designado a seguir de locus DD20 (Figura 10A) e outro próximo do Glyma04g39550.1 a 111,95 cM, designado a seguir de locus DD43 (Figura 10B). Cada domínio de direcionamento variável de 20 bp do RNA guia começou com um resíduo G necessário para a ação da RNA polimerase III, e foi seguido no genoma da soja por um motivo PAM de 3 bp (Tabela 11). As posições de cromossomos dos sítios-alvos genômicos da soja em estreita proximidade com as sequências PAM foram determinados pela pesquisa Blast na sequência genômica pública da variedade de soja Williams82. Os sítios-alvo genômicos da soja DD20CR1 (SEQ ID NO: 125), DD20CR2 (SEQ ID NO: 126), e DD43CR1 (SEQ ID NO: 127) foram todos identificados como únicos no genoma da soja, enquanto um segundo sítio alvo genômico de 23 bp idêntico ao DD43CR2 (SEQ ID NO: 128) foi encontrado no Gm06: 12.072.339-12072361, assim existem dois potenciais sítios de clivagem pelo RNA guia direcionado para DD43CR2. DD43CR1 e DD43CR2 são sequências de cadeias complementares indicadas por “c” após as posições. TABELA 11 SÍTIOS-ALVO GENÔMICOS DE SOJA PARA UM SISTEMA RNA GUIA/ENDONUCLEASE CAS.
[0356] O cassete de expressão de RNA guia compreendendo um domínio de direcionamento variável visando os sítios alvo genômicos DD20CR1, DD20CR2, DD43CR2 construídos de forma semelhante e ligados ao cassete de expressão Cas9 de soja para fazer as construções de DNA QC817, QC818, e QC816 que são semelhantes à construção QC815 na Figura 9 A (SEQ ID NO: 123), exceto para o domínio de direcionamento variável de 20 bp do RNA guia.
[0357] Podem ser toleradas até seis discordâncias no pareamento (mismatches) contínuas nas regiões 5’ do sítio alvo genômico (protoespaçador) com o domínio de direcionamento variável de 20 bp, ou seja, um trecho contínuo de 14 pares de bases entre o domínio de direcionamento variável e a sequência crRNA próxima ao PAM que seja necessariamente suficiente para a clivagem direcionada eficiente de qualquer sequência de DNA genômico de 23 bp após o padrão N(20)NGG pode ser selecionado como sítio alvo para o sistema RNA guia/endonuclease Cas. A última sequência NGG e a sequência PAM não devem ser incluídas no domínio de direcionamento variável de 20 bp do RNA guia. Se o primeiro N não é endogenamente um resíduo G, ele deve ser substituído por um resíduo G na sequência alvo do RNA guia para acomodar a RNA polimerase III, o qual não deve sacrificar a especificidade de reconhecimento do sítio alvo pelo RNA guia.
EXEMPLO 14 ENTREGA DE DNA DO SISTEMA RNA GUIA/ENDONUCLEASE CAS PARA A SOJA POR TRANSFORMAÇÃO TRANSITÓRIA
[0358] Os cassetes de expressão da endonuclease Cas9 soja- otimizada e RNA guia foram entregues aos embriões somáticos de soja sob a forma de culturas em suspensão embriogênicas por bombardeamento de partículas por biobalística. As culturas em suspensão embriogênicas de soja foram induzidas da seguinte forma. Os cotilédones (~ 3 mm de comprimento) foram dissecados a partir da superfície esterilizada, sementes imaturas e foram cultivadas durante 6-10 semanas, sob luz, a 26 °C em meio de Murashige e Skoog (MS) contendo 0,7% de ágar e suplementado com 10 mg/mL de 2,4-D (ácido 2,4-diclorofenoxiacético). Embriões somáticos em estágio globular, que produziram embriões secundários, foram então excisados e colocados em frascos contendo meio MS líquido suplementado com 2,4-D (10 mg/ml) e cultivados sob luz, em um agitador rotativo. Após a seleção repetida para conjuntos de embriões somáticos que se multiplicaram precocemente, embriões em estágio globular, as culturas em suspensão embriogênica de soja foram mantidas em 35 ml de meio líquido em um agitador rotativo, a 150 rpm, a 26 °C sob luzes fluorescentes em uma programação dia/noite de 16/8 horas. As culturas foram subcultivadas a cada duas semanas por inoculação de aproximadamente 35 mg de tecido em 35 ml do mesmo meio MS líquido fresco.
[0359] As culturas embriogênicas em suspensão de soja foram, então, transformadas pelo método de bombardeamento com pistola de partículas usando um instrumento DuPont Biolistic™ PDS1000/HE (Bio-Rad Laboratories, Hercules, CA). Para 50 μL de uma suspensão de partícula de ouro de 1 μm a 60 mg/mL, é acrescentado (na ordem): 30 μL de 30 ng/μL de fragmento de DNA QC815 U6-13.1:DD43CR1+EF1A2:CAS9 como um exemplo, 20 μL de espermidina 0,1 M, e 25 μL de CaCl2 5M. A preparação de partículas foi então agitada por 3 minutos, centrifugada em uma centrífuga por 10 segundos e o sobrenadante removido. As partículas revestidas de DNA foram então lavadas uma vez com 400 μL de etanol a 100% e resuspensas em 45 μL de etanol 100%. A suspensão de DNA/partícula foi sonicada três vezes durante um segundo. Em seguida, 5 μL de partículas de ouro revestidas com DNA foram carregados em cada disco macrocarreador.
[0360] Aproximadamente 100 mg de uma cultura em suspensão de duas semanas de idade foram colocados em uma placa de Petri vazia de 60x15 mm e o líquido residual removido do tecido com uma pipeta. A pressão da membrana de ruptura foi configurada para 1100 psi e a câmara colocada sob um vácuo de 28 polegadas de mercúrio. O tecido foi colocado a aproximadamente 3,5 polegadas de distância da tela de retenção e bombardeado por uma vez. O tecido foi arranjado a aproximadamente 3,5 polegadas de distância da tela de retenção e bombardeado outra vez. Uma quantidade mínima de meio MS líquido sem suplemento de 2,4-D foi adicionada ao tecido para prevenir a secagem e sobrecrescimento das culturas. A placa de Petri 60x15 mm foi selada em outra placa de Petri de 100x25 mm contendo meio MS em ágar sólido como outra medida para manter os tecidos secos. Os tecidos foram coletados sete dias após o DNA genômico ter sido extraído para análise de PCR.
EXEMPLO 15 ANÁLISE DA NHEJ SÍTIO-ESPECÍFICA MEDIADA PELO SISTEMA RNA GUIA/ENDONUCLEASE CAS POR SEQUENCIAMENTO EM PROFUNDIDADE
[0361] Para avaliar a clivagem de dupla fita do DNA em um sítio alvo genômico da soja mediada pelo sistema RNA guia/endonuclease Cas, uma região de DNA genômico de aproximadamente 100 bp em torno do sítio alvo foi amplificada por PCR e o produto da PCR foi então sequenciado para verificar as mutações no sítio alvo resultantes das NHEJs. A região foi primeiro amplificada por 20 ciclos de PCR com o kit Phusion High Fidelity mastermix (New England Biolabs) a partir de 100 ng de DNA genômico utilizando primers gene-específicos que também contêm adaptadores e sequências barcode específico do amplicon necessários para uma segunda análise de PCR (PCR secundária) e a subsequente análise de sequência. Por exemplos, a primeira PCR para os quatro experimentos listados na Tabela 2 foi realizada utilizando os primers DD20- S3 (SEQ ID NO: 133)/DD20-A (SEQ ID NO: 134), DD20-S4 (SEQ ID NO: 135)/DD20-A, DD43-S3 (SEQ ID NO: 136)/DD43-A (SEQ ID NO: 137) e DD43-S4 (SEQ ID NO: 138)/DD43-A. Um microlitro dos produtos da primeira PCR foi adicionalmente amplificado por mais 20 ciclos de PCR utilizando os primers universais (SEQ ID NOs: 140, 141) utilizando o Phusion High Fidelity Mastermix. Os produtos da PCR resultantes foram separados em gel de agarose a 1,5% e as bandas de DNA específicas foram purificadas em colunas para centrifugação de purificação em gel Qiagen. As concentrações de DNA foram mensuradas utilizando um DNA Bioanalyzer (Agilent) e quantidades equimolares de DNA para até 12 amostras diferentes, cada uma com código de barras específico, foram misturadas como uma amostra para análise de sequenciamento em profundidade Illumina. A leitura (read) única de sequenciamento em profundidade de 100 nucleotídeos de comprimento foi realizada em uma instalação central da DuPont utilizando um sequenciador MiSeq Personal Sequencer da Illumnia com 40% (v/v) aumento de PhiX controle v3 (Illumina, FC-110-3001) para compensar o viés de sequência.
[0362] Uma vez que o sítio alvo genômico está localizado no meio de ~ 100 bp do amplicon da PCR (SEQ ID NOs: 142, 143, 144, 145), o sequenciamento em profundidade 100 nucleotídeos de comprimento é suficiente para cobrir a região alvo. Uma janela de 10 nucleotídeos centrada sobre o sítio de clivagem previsto, ou seja, 3 bp a montante de PAM, foi selecionada para análise da sequência. Apenas aquelas leituras (reads) com um ou mais nucleotídeos indel surgindo dentro da janela de 10 nucleotídeos e não encontradas em um nível semelhante nos controles negativos foram classificadas como mutações NHEJ. As leituras (reads) NHEJ-mutantes de diferentes comprimentos, mas com a mesma mutação foram contadas como uma única de leitura e até 10 mutações mais prevalentes foram visualmente confirmadas como sendo mutações específicas antes serem usadas para calcular a % de leituras mutantes com base no total de leituras analisada contendo o código de barras (barcode) específico e o primer direto.
[0363] As frequências das mutações NHEJ reveladas por sequenciamento em profundidade para quatro sítios-alvo DD20CR1, DD20CR2, DD43CR1, DD43CR2 com um promotor da RNA polimerase III GM- U6-13.1 são mostrados na Tabela 2. As mutações NHEJ mais prevalentes visualmente confirmadas são mostradas nas FIG. 11A-11D. As sequências mutantes na Figura 11A-11E são listados como SEQ ID NOs: 147-201. A linha superior é a sequência de referência original com a sequência do sítio alvo sublinhada. As deleções nas sequências mutadas são indicadas por “---” enquanto que as adições e substituições são indicadas por letras em negrito. A contagem total de cada mutação de diferentes leituras é dada na última coluna. Apenas construção da nuclease Cas9, apenas a construção do RNA guia, e controles negativos sem DNA para bombardeio foram igualmente realizados e analisados, mas os dados não são mostrados uma vez que mutações não específicas não foram detectadas. Outros sítios alvos e RNAs guia também foram testados com resultados positivos semelhantes e os dados não foram mostrados. TABELA 12 MUTAÇÕES SÍTIO ESPECÍFICAS ALVO INTRODUZIDAS PELA NHEJ MEDIADA POR RNA GUIA/ENDONUCLEASE CAS ** Pelo menos as 15 primeiras leituras são mutações específicas, mas apenas as 10 primeiras são contados na tabela como sendo consistentes com outros experimentos. Se todas as 15 principais mutações são contadas, o total de leituras mutantes é de 1080 e a % de Mutantes é de 0,200%.
[0364] Em conclusão, os nossos dados indicam que o sistema RNA guia/endonuclease Cas otimizado para soja é capaz de clivar eficazmente o DNA genômico endógeno da soja e criar mutações NHEJ imperfeitas nos sítios-alvo genômicos especificados.
EXEMPLO 16 O SISTEMA RNA GUIA/ENDONUCLEASE CAS OFERECE QUEBRAS DE DUPLA FITA (DBSS) PARA O LOCUS EPSPS DE MILHO RESULTANDO EM MUTAÇÕES PONTUAIS DESEJADAS
[0365] Duas endonucleases Cas9 milho-otimizadas foram desenvolvidas e avaliadas quanto à capacidade de introduzir uma quebra de dupla fita em uma sequência alvo genômica. Uma primeira endonuclease Cas9 era como a descrita na Figura 1A (Exemplo 2 e cassete de expressão de SEQ ID NO: 5). Uma segunda endonuclease Cas9 milho-otimizada (endonuclease moCas9; SEQ ID NO: 192) foi suplementada com o sinal de localização nuclear SV40 pela adição da sequência sinal na extremidade 5' da sequência codificante da moCas9 (Figura 13). O cassete de expressão moCas9 foi posteriormente modificado pela inserção do íntron ST-LS1 dentro da sequência codificante da moCas9, a fim de aumentar a sua expressão em células de milho e eliminar a sua expressão em E. coli e Agrobacterium. O promotor da ubiquitina de milho e as sequências de terminação do gene inibidor da proteinase II de batata complementaram os desenhos do gene da endonuclease moCas9. Os elementos estruturais do cassete de expressão moCas9 são mostrados na Figura 13 e as suas sequências de aminoácidos e de nucleotídeos estão listadas como SEQ ID NOS: 192 e 193.
[0366] Um cassete de expressão de RNA guia único (sgRNA) foi essencialmente como descrito no Exemplo 1 e mostrado na Figura 1B. Ele consiste do promotor U6 da polimerase III de milho (SEQ ID NO: 9) e as suas sequências de terminação U6 da polimerase III cognata (TTTTTTTT). O RNA guia (SEQ ID NO: 194) compreendia um domínio de direcionamento variável de 20 nucleotídeos (nucleotídeos 1-20 de SEQ ID NO: 194), seguido por uma sequência de RNA capaz de interagir com a endonuclease que induz a quebra de dupla fita.
[0367] A sequência-alvo da endonuclease Cas9 milho-otimizada (sequência alvo da moCas9) dentro da sequência codônica EPSPS era complementar à sequência variável de 20 nucleotídeos do sgRNA guia determinando o sítio de clivagem da endonuclease Cas9 dentro da sequência codificante de EPSPS.
[0368] As sequências-alvo moCAS9 (nucleotídeos 25-44 da SEQ ID NO: 209) foram sintetizadas e clonadas no vetor de expressão RNA guia/Cas9 concebido para a distribuição dos componentes do sistema RNAguia/Cas9 para células BMS (Black Mexican Sweet) pela transformação mediada por Agrobacterium. O T-DNA de Agrobacterium entregou também a recombinase sítio-específica FLP de levedura e a proteína associada à replicação WDV (trigo dwarf virus) (replicase). Uma vez que as sequências alvo moCas9 eram flanqueadas pelos alvos de recombinação FLP (FRT), elas foram excisadas por FLP em células de milho formando estruturas epissomais (similares a cromossomo). Tais fragmentos de DNA circular foram replicados pela replicase WDV (a origem de replicação foi incorporada no promotor WDV) permitindo a sua recuperação em células de E. coli. Se a endonuclease Cas9 otimizada para milho fez uma quebra de fita dupla na sequência alvo da moCas9, a sua reparação pode produzir mutações. O procedimento é descrito em detalhes em: Lyznik, L.A., Djukanovic, V., Yang, M. e Jones, S. (2012) Double-strand break-induced targeted mutagenesis in plants. Em: Transgenic plants: Methods and Protocols (Dunwell, J.M. e Wetten, A.C. eds). New York Heidelberg Dordrecht London: Springer, págs. 399-416.
[0369] Os sistemas de RNA guia/endonuclease Cas usando qualquer uma das endonucleases Cas9 milho-otimizadas descritas na presente divulgação, geram quebras de dupla fita na sequência alvo da moCas9 (Tabela 13). A Tabela 13 mostra a percentagem de sequências alvo moCas9 mutagenizadas nas células BMS de milho usando a endonuclease moCas9 de SEQ ID NO: 192 ou a endonuclease cas9 milho-otimizada descrita na Figura 1A e expressa pelo cassete de expressão de SEQ ID NO: 5. Ambos os sistemas de RNA guia/endonuclease Cas geram quebras de dupla fita (tal como avaliado pelo número de eventos com mutagênese direcionada) que variam em 67 a 84%, das sequências alvo moCas9 disponíveis em moléculas de DNA epissomais em células BMS de milho. Uma amostra de sequências alvo EPSPS mutagenizadas é mostrada na Figura 14. Esta observação indica que a endonuclease Cas9 milho-otimizada descrita na presente divulgação é funcional em células de milho e gera eficientemente quebras de dupla fita na sequência alvo moCas9. TABELA 13 PERCENTAGEM DAS SEQUÊNCIAS ALVO MOCAS9 MUTAGENIZADAS EM CÉLULAS BMS DE MILHO PELA ENDONUCLEASES CAS9 MILHO-OTIMIZADA.
[0370] A fim de realizar a edição direcionada do genoma do gene EPSPS cromossômico de milho, um molde de modificação de polinucleotídeo que fornece a informação genética para editar a sequência codificante de EPSPS foi criado (SEQ ID NO: 195) e coentregue com os componentes do sistema RNA guia/Cas9.
[0371] Conforme mostrado na Figura 12, o molde de modificação de polinucleotídeo compreendia três alterações de nucleotídeos (indicadas por setas), quando comparado com a sequência genômica do EPSPS a ser editado. Estas três alterações de nucleotídeos são referidas como mutações TIPS, pois estas modificações de nucleotídeos resultam na alteração de aminoácidos T-102 a I-102 e P-106 a S-106. A primeira mutação pontual resulta da substituição do nucleotídeo C na sequência do códon ACT por um nucleotídeo T, a segunda mutação resulta da substituição do nucleotídeo T na mesma sequência do códon ACT por um nucleotídeo C para formar o códon de isoleucina (ATC), a terceira mutação pontual resulta da substituição do primeiro nucleotídeo C na sequência do códon CCA por um nucleotídeo T, a fim de formar um códon de serina TCA (Figura 12). Ambas as sequências de códons foram localizadas dentro de 9 nucleotídeos de cada uma, como mostrado na SEQ ID NO: 196: atcgcaatgcggtca. As três modificações de nucleotídeos são exibidas em negrito. Os nucleotídeos entre as duas sequências de códons eram homólogos ao gene EPSPS não editado no locus epsps. O molde de modificação de polinucleotídeo compreende ainda os fragmentos de DNA da sequência genômica EPSPS de milho que foram utilizados como sequência homóloga para a edição do gene EPSPS. O braço curto da sequência homóloga (HR1-Figura 12) era de 810 pares de bases de comprimento e o braço longo da sequência homóloga (HR2-Figura 12) era de 2.883 pares de bases de comprimento (SEQ ID NO: 195).
[0372] Neste exemplo, o molde de modificação de polinucleotídeo EPSPS foi coadministrado utilizando o bombardeamento de partículas como um plasmídeo (vide o vetor molde 1, Figura 15), juntamente com o cassete de expressão do sgRNA guia e um vetor de expressão da endonuclease Cas9 milho-otimizada que estava contida no cassete de expressão da endonuclease Cas9 milho-otimizada descrito na Figura 1A (Exemplo 1, SEQ ID NO: 5) e também continha um gene marcador selecionável moPA T. Dez a onze embriões imaturos de um dia de idade foram colocados com o eixo do embrião para baixo em placas contendo o meio N6 (Tabela 14) e incubados a 28 °C durante 4-6 horas antes do bombardeamento. As placas foram colocadas na terceira prateleira a partir do fundo no aparelho PDS-1000 e foram bombardeadas a 200 psi. Após o bombardeamento, os embriões foram incubados no escuro durante a noite a 28 °C e em seguida transferidos para placas contendo meio N6-2 durante 6-8 dias a 28 °C. Os embriões foram então transferidos para placas contendo meio N6-3 por três semanas, seguido pela transferência do calo para placas contendo meio N6-4 para uma seleção adicional de três semanas. Após seis semanas de seleção a 28 °C, uma pequena quantidade de tecido selecionado foi transferida para meio de regeneração MS e incubada durante três semanas no escuro a 28 °C. TABELA 14 COMPOSIÇÃO DOS MEIOS DE CULTURA.
[0373] O DNA foi extraído, colocando amostras de células de calos, duas esferas de aço inoxidável, e 450 μL de tampão de extração (250 mM de NaCl, Tris-HCl 200 pH 7,4, EDTA 25 mM, 4,2 M de guanidina HCl) em cada tubo de um rack “Mega titer”. O rack foi agitado no Genogrinder a 1650 rpm durante 60 segundos e centrifugado a 3000 x g durante 20 min a 4 °C. Trezentos μL de sobrenadante foram transferidos para os poços de uma microplaca de 96 poços Unifilter 96-well DNA Binding GF/F Microplate (7702810, Whatman, GE Healthcare). A placa foi colocada no topo de um coletor de placas multipoços à vácuo (5017, Pall Life Sciences). Uma pressão de vácuo foi aplicada até os poços estarem completamente secos. O procedimento de filtração a vácuo foi repetido uma vez com 100 μL de tampão de extração e duas vezes com 250 μL de tampão de lavagem (50 mM Tris-HCl pH 7,4, 200 mM de NaCl, etanol 70%). O etanol residual foi removido pela colocação do filtro de placa GF/F filter plate sobre uma placa de coleta vazia e as placas foram centrifugadas durante 10 min a 3000 x g. O DNA foi eluído em 100 μL tampão de eluição (10 mM Tris-HCl, pH 8,3) e centrifugado a 3000 x g durante 1 min. Para cada amostra, quatro reações de PCR foram executadas. Elas incluíram aproximadamente 40 ng de DNA genômico, 10 μL de mistura para PCR REDExtract-N-Amp PCR ReadyMix (R4775, Sigma-Aldrich Co.), e 5 picomoles de cada primer em um volume total de 20 μl. Combinações de primers para cada reação de PCR estão listadas na Tabela 15. TABELA 15 COMBINAÇÕES DE PRIMERS PARA REAÇÕES DE PCR.
[0374] As mesmas reações de PCR foram realizadas em cinco amostras de DNA genômico obtidas a partir de plântulas endogâmicas de milho não transformado. Após uma desnaturação inicial a 95 °C durante 5 minutos, cada amplificação por PCR foi realizada por 35 ciclos utilizando um termociclador DNA Engine Tetrad2 Thermal Cycler (BioRad Laboratories, Hercules, CA) e desnaturação a 94 °C durante 30 segundos, anelamento a 68 °C durante 30 seg, extensão a 72 °C durante 1 min. Os produtos da PCR F-E2, FT e HT foram separados em gel de agarose a 1% a 100 volts durante 45 minutos, com a escada de DNA de 100 bp (N0467S, New England Biolabs). Para o sequenciamento, os fragmentos amplificados da PCR F-F3 a partir de calos selecionados foram clonados em vetores pCR 2.1-TOPO, utilizando o kit de clonagem TOPO TA (Invitrogen Corp., Carlsbad, CA). O sequenciamento do DNA foi realizado com a química Big Dye Terminator em uma máquina de sequenciamento capilar ABI 3700 (Applied Biosystems, Foster City, CA). Cada amostra continha cerca de 0,5 μg de DNA de plasmídeo Topo e 6,4 pmol do primer E3-EPex3 Rev (ACCAAGCTGCTTCAATCCGACAAC, SEQ ID NO: 204). As sequências foram analisadas utilizando o programa Sequencer.
[0375] Uma amostra de trinta e um eventos de calos selecionados em meios contendo bialofos (gene marcador selecionável moPAT era parte do vetor de expressão do RNA guia/moCas9) foi rastreada para a presença de mutações pontuais TIPS. Vinte e quatro eventos continham as mutações pontuais TIPS integradas ao DNA genômico (Figura 16, tratamento de F-E2). Entre elas, seis eventos mostraram o produto da amplificação por PCR do gene EPSPS cromossômico com mutações TIPS (Figura 16, tratamento H-T). O par de primers de PCR (um que pode hibridizar com a sequência epsps genômica não presente no molde de modificação de polinucleotídeo EPSPS e o outro ligando com a sequência EPSPS editada presente no molde de modificação de polinucleotídeo EPSPS) distinguiu os produtos da edição EPSPS-TIPS a partir dos alelos epsps tipo selvagem ou inserções aleatórias das mutações TIPS. Se um alelo de EPSPS foi editado para incluir as substituições TIPS, ele deve ser detectado como um fragmento de DNA proveniente do locus epsps genômico, independentemente se as substituições TIPS foram selecionadas durante o processo de amplificação por PCR. O primer TIPS foi substituído com o primer EPSPS tipo selvagem (Tabela 15, par de primers F-E3) e os produtos da amplificação por PCR foram clonados nos vetores de clonagem TOPO e sequenciados. Os dados de sequenciamento representaram uma amostra aleatória das sequências de locus epsps genômicos em um dos eventos selecionados (Figura 17, calos A12 3.360,92). A Figura 17 mostra que o processo descrito na presente divulgação resultou na edição de nucleotídeos bem sucedida de três nucleotídeos (Figura 17 negrito) responsável pelas mutações TIPS sem alterar qualquer outro nucleotídeo de epsps, enquanto que a sequência alvo moCas9 (sítio de ligação do RNA guia sublinhado na Figura 17) não foi mutagenizado.
[0376] Além disso, o outro alelo EPSPS não foi editado indicando que apenas um alelo EPSPS foi editado neste evento particular (Figura 17, seção inferior).
[0377] Estes dados mostram ainda que a presente divulgação do uso do sistema RNA guia/Cas para a edição genética demonstra a capacidade de recuperação de eventos de edição gênica a uma alta eficiência de 1 a menos de 10 eventos selecionados.
EXEMPLO 17 O SISTEMA RNA GUIA/ENDONUCLEASE CAS OFERECE QUEBRAS DE DUPLA FITA NO LOCUS EPSPS DE MILHO RESULTANDO EM PLANTAS DE MILHO CONTENDO UM GENE EPSPS-TIPS EDITADO.
[0378] Os eventos de genes EPSPS editados foram produzidos e selecionados tal como descrito no Exemplo 16. O molde de modificação de polinucleotídeo EPSPS curto foi coadministrado utilizando o bombardeamento de partículas como um plasmídeo (vide o vetor molde 1, Figura 15), juntamente com o cassete de expressão do RNA guia e um vetor de expressão da endonuclease Cas9 milho-otimizada contida no cassete de expressão da endonuclease Cas9 milho-otimizada descrito na Figura 1A (Exemplo 1, SEQ ID NO: 5) e também continha um gene marcador selecionável moPAT.
[0379] Após seis semanas de seleção a 28 °C, uma pequena quantidade de tecido selecionado foi transferida para meio de regeneração MS e incubada durante três semanas no escuro a 28 °C. Em seguidas os rebentos visíveis de três semanas de incubação foram transferidos para placas contendo meio MS-1 e foram incubados a 26 °C na luz durante 1-2 semanas, até que estivessem prontos para serem enviados para uma estufa e transferidos para o solo. O meio MS-1 continha: 4,3 g/L de sais MS (Gibco 11117), 5,0 mL/L de Solução Estoque de Vitaminas MS (Sigma M3900), 100 mg/L de mio-inositol, 40,0 g/L de sacarose, e 6,0 g/L Bacto-Ágar em pH 5,6.
[0380] Utilizando os procedimentos descritos acima, 390 plantas de milho T0 foram produzidas provenientes de 3282 embriões, resultando em um rendimento global de transformação de 12%, indicando ainda que o sistema RNA guia/Cas utilizado na presente descrição resulta em baixa ou nenhuma toxicidade (Tabela 16). TABELA 16 EFICIÊNCIA DE TRANSFORMAÇÃO DA EDIÇÃO DE EPSPS.
[0381] O DNA foi extraído a partir de cada uma das plântulas T0 7-10 dias após a transferência para a estufa e os procedimentos de PCR foram realizados conforme descrito no Exemplo 16 para rastrear plantas T0 para mutações no locus epsps.
[0382] Setenta e dois por cento das plantas T0 analisadas (270/375, Tabela 17) continha alelos EPSPS mutagenizados, conforme determinado pelo procedimento de PCR final descrito no Exemplo 16. A maioria das mutações (230/375 ou 89%) foi produzida como resultado da junção de extremidades não homólogas (NHEJ) propensa a erro, enquanto quarenta plantas T0 (40/375 ou 11%) continha o alelos EPSPS com edições TIPS indicando o envolvimento de um mecanismo de reparo da quebra de dupla fita (Tabela 17). TABELA 17 MUTAÇÕES NO LOCUS EPSPS .
[0383] Um par de primers (Tabela 15, par de primers F-E3) foi usado para amplificar um fragmento nativo, o locus epsps endógeno que contém a sequência-alvo moCas6 o sítio de edição EPSPS a partir do DNA genômico de plantas T0 selecionadas. Os produtos da amplificação por PCR foram clonados nos vetores de clonagem TOPO e sequenciados tal como descrito no Exemplo 16. Os dados de sequenciamento representam uma amostra aleatória das sequências do locus epsps genômico de uma planta T0 particular (Tabela 18) e indicam o genótipo das plantas T0 selecionadas. A lista das plantas T0 contendo alelos EPSPS-TIPS transferidos para vasos é apresentada na Tabela 18 (conjunto selecionado de plantas T0 a partir dos 40 eventos contendo TIPS). TABELA 18 OS GENÓTIPOS DE LOCUS EPSPS OBSERVADOS EM PLANTAS T0. TIPS REFERE-SE A UM CLONE COMPREENDENDO A SEQUÊNCIA EPSPS TIPS-EDITADA. NHEJ REFERE-SE À PRESENÇA DE UMA MUTAÇÃO NHEJ, WT REFERE-SE À PRESENÇA DE UMA SEQUÊNCIA EPSPS TIPO SELVAGEM AMPLIFICADA A PARTIR DO LOCUS EPSPS NATIVO.
[0384] Conforme apresentado na Tabela 18, as plantas selecionadas de E1 e E3 até E9 continham a versão EPSPS-TIPS do gene EPSPS, acompanhada por um alelo EPSPS tipo selvagem (WT) ou alelo EPSPS mutagenizado por NHEJ (NHEJ). Os números antes das indicações TIPS, WT, NHEJ na Tabela 18 indicam a frequência na qual uma versão específica do alelo EPSPS foi identificada. Se todos os clones continha a sequência EPSPS TIPS-editada, a planta analisada era susceptível de ser homozigota para o alelo EPSPS-TIPS (vide, por exemplo, E2). Se apenas 50% dos clones continham uma sequência EPSPS TIPS-editada, a planta analisada provavelmente exibia hemigoze para o alelo EPSPS-TIPS (vide, por exemplo, E1). Outras plantas, como E3 ou E4, eram susceptíveis de serem quiméricas para TIPS. Em um evento, E2, a planta T0 continha apenas sequência TIPS- editadas no locus epsps indicando que o sistema RNA guia/endonuclease Cas divulgado na presente divulgação resultou na edição de nucleotídeos bem sucedida de três nucleotídeos (Figura 17 negrito) responsável pelos dois alelos EPSPS- TIPS no locus epsps em plantas de milho.
[0385] Uma análise qPCR foi realizada nas plantas T0 selecionadas para estimar o número de cópias de genes epsps tipo selvagem e as sequências de endonuclease moCas9. Amplificações por qPCR Multiplex do gene EPSPS de milho e do gene constitutivo (para housekeeping) ADH foram efetuadas nas amostras de DNA a partir de plantas T0. Os primers e sondas utilizados na reação de PCR estão apresentados na Tabela 19. TABELA 19 PRIMERS UTILIZADOS NA ANÁLISE DE QPCR DE PLANTAS T0.
[0386] Todas as análises foram realizadas utilizando um LightCycler 480 Real-Time PCR System (Roche Diagnostics). Um valor de limiar para o genótipo wtEPSPS foi fixado em 1,76. Cada amostra exibindo menos de 1,76 cópias de EPSPS, com as medições de fluorescência de ponto final até duas vezes menor do que o controle tipo selvagem, foi categorizada como genótipo de Um Alelo EPSPS (hemizigose para o alelo EPSPS tipo selvagem).
[0387] Um método qPCR foi utilizado para estimar o número de cópias da sequência TIPS. Os primers e sondas utilizados na reação de qPCR estão apresentados na Tabela 20. TABELA 20 PRIMERS UTILIZADOS NA ANÁLISE DE QPCR PARA ESTIMAR O NÚMERO DE CÓPIAS DA SEQUÊNCIA TIPS
[0388] Um método Ct comparatico com os valores Delta Ct normalizados para a delta Ct média a partir de genótipos TIPS bialélicos forneceu uma estimativa do número de cópias para a sequência TIPS detectada nas amostras das plantas analisadas. TABELA 21 GENOTIPAGEM POR QPCR E NÚMERO DE CÓPIAS DE PLANTAS T0 SELECIONADAS.
[0389] A genotipagem por qPCR indicou que não foram detectados alelos EPSPS tipo selvagem nas plantas T0 selecionadas de Eventos E1, E2, E7, E8 e E9 (Tabela 21). As sequências molde TIPS e a sequência codificante de moCas9 foram encontradas nas plantas T0 selecionadas, presumivelmente, como um resultado de inserções aleatórias associadas ao processo de transformação (Tabela 21: para sequências molde TIPS de plantas T0 E1, E7, E9) . Ambos os elementos genéticos (moldes TIPS aleatoriamente inseridos e cassete de expressão moCas9) podem ser segregados por procedimentos padrão de melhoramento para geração de descendência T1, se não ligado ao gene EPSPS-TIPS editado.
[0390] As plantas T0 cresceram bem na estufa e eram férteis. Uma amostra de plantas T0 foi pulverizada com uma dose 1X de glifosato (Roundup Powermax) no estágio V3 usando a configuração de cabine de pintura a 20 galões por acre. A dose 1X de glifosato foi preparada da seguinte forma: 2,55 mL de Powermax em 300 mL de água (ingrediente ativo: glifosato, N- (fosfonometil) glicina, sob a forma do seu sal de potássio a 48,7%). Sete dias após a aplicação do glifosato, nenhum dano ao tecido foliar foi observado em algumas das plantas T0. Essas mudas exibiam hemizigose para os alelos EPSPS-Tips, enquanto outras plântulas foram severamente danificadas. Uma planta que não exibiu dano no tecido folhar 14 dias após a aplicação do herbicida continha 21 alelos EPSPS-TIPS entre os 44 clones genômicos do locus epsps (clonada e sequenciada, tal como descrito no Exemplo 16).
[0391] Estes dados indicam que um sistema de RNA guia/Cas pode ser usado para criar um alelo EPSPS TIPS-editada em milho. Foram obtidas plantas de milho homozigotas no locus epsps-tips (dois alelos EPSPS editados) sem inserção adicional do molde TIPS (planta E2). Além disso, algumas plantas de milho com edição EPSPS-TIPS exibiram algum nível de tolerância contra uma dose 1X de glifosato.
EXEMPLO 18 CLIVAGEM DE DNA MEDIADA POR RNA GUIA/ENDONUCLEASE CAS EM LOCI CROMOSSÔMICOS DE MILHO PERMITE A INSERÇÃO DO TRANSGENE EM UMA LINHAGEM DE MILHO ELITE
[0392] Para testar se um sistema de RNA guia/Cas otimizado para milho pode clivar um locus cromossômico de milho e permitir a introdução sítio-especifica de um transgene mediada pela recombinação homóloga (HR) em uma linhagem de milho elite, foram selecionados 4 loci no cromossomo 1 do milho localizados entre 51,54 cM de 54,56 cM (Figura 18). Dois sítios-alvo para uma endonuclease Cas foram identificados em cada um dos quatro loci e são referidos como MHP14Cas-1, MHP14Cas-3, TS8Cas-1, TS8Cas2, TS9Cas-2, TS9Cas-3, TS10Cas-1 e TS10Cas-3 (Figura 19, Tabela 22, SEQ ID NOs: 229-236). TABELA 22 SÍTIOS-ALVO GENÔMICOS DE MILHO ALVOS DE UM SISTEMA RNA GUIA/ENDONUCLEASE CAS.
[0393] O cassete da endonuclease Cas milho-otimizada (SEQ ID NO: 5) foi preparado conforme descrito no Exemplo 1. Os cassetes de expressão de RNA guia longo compreendendo um domínio de direcionamento variável visando um dos 8 sítios-alvo genômicos, controlado por um promotor U6 da polimerase III de milho, e terminado por um terminador U6 da polimerase III de milho foram concebidos conforme descrito no Exemplo 1 e 3 e listados na Tabela 23. Um DNA doador (DNA reparação por HR) contendo um marcador de seleção (um cassete de expressão da fosfomanose- isomerase (PMI)) flanqueado por duas regiões homólogas foi construído utilizando técnicas padrão de biologia molecular (Figura 20). TABELA 23 LISTA DOS CASSETES DE EXPRESSÃO DE RNA GUIA (GRNA) E DNA DOADOR
[0394] Um vetor contendo o endonuclease Cas9 milho-otimizada de SEQ ID NO: 5, um vetor contendo um dos oito cassetes expressão de RNA guia longo de SEQ ID NOs: 245-252, e um vetor contendo um dos oito DNA doador de SEQ ID NOs: 253 -260 foram coentregues aos embriões imaturos de milho de linhagem elite por entrega mediada por partículas, tal como descrito no Exemplo 10. Cerca de 1000 embriões foram bombardeados para cada sítio alvo. Uma vez que o DNA doador continha um marcador selecionável, PMI, a entrega bem sucedida do DNA doador permitiu o crescimento de calos em meio manose. Inserções transgênicas putativas mediadas por HR foram selecionadas colocando o calo em meio contendo manose. Após seleção, os rebentos estáveis em placas de maturação foram amostrados, o DNA genômico total foi extraído, e utilizando pares de primers apresentados na Tabela 24 (correspondendo as SEQ ID NOs: 261-270) a amplificação por PCR foi realizada em ambas as junções de DNA genômico transgênicas possíveis para identificar inserções transgênicas putativas mediadas pela HR. TABELA 24 SEQUÊNCIAS DOS PRIMERS UTILIZADOS PARA A TRIAGEM DE EVENTOS DE INTEGRAÇÃO EM CADA SÍTIO ALVO
[0395] Os mesmos primers genômicos foram utilizados para cada um dos dois sítios-alvo em um locus. As amplificações resultantes foram sequenciadas para determinar se estes sítios foram mutados ou continham uma inserção de transgene.
[0396] A “frequência de recuperação de evento” foi calculada usando o número de eventos recuperados dividido pelo número total de embriões bombardeados, indicando assim se uma endonuclease tem algum efeito tóxico ou não (Tabela 26). Portanto, se 1000 embriões foram bombardeados e 240 foram recuperados, a frequência de recuperação de eventos é de 24%. A Tabela 26 indica que, para todos os sítios-alvo analisados a frequência de recuperação de eventos variou entre 17 e 28%, indicando que o sistema RNA guia/Cas utilizado na presente divulgação resulta em baixa ou nenhuma toxicidade. A atividade da endonuclease Cas foi medida in-planta pela determinação da “frequência de mutação no sítio alvo” (Tabela 26) que é definida como: (número de eventos com a modificação no sítio alvo / número total de eventos recuperados) * 100%. Assim, se 240 eventos foram recuperados e 180 eventos exibiram uma mutação, a frequência de mutação no sítio alvo é de 75%. A frequência de mutação no sítio alvo foi mensurada utilizando o número de cópias de alelo no sítio alvo conforme descrito no Exemplo 9 do Pedido US 13/886317, depositado em 3 de maio de 2013. Os primers e sondas para a obtenção do número de cópia no sítio alvo usando qPCR em cada sítio foram os listados na Tabela 25 (SEQ ID NOs: 271-294). TABELA 25 SEQUÊNCIAS DE PRIMERS E SONDAS UTILIZADOS PARA AVALIAR A CLIVAGEM DO DNA EM 8 SÍTIOS-ALVO GENÔMICOS DE MILHO
[0397] Conforme exibido na Tabela 26, todos os oito sistemas RNA guia/Cas9 foram muito eficientes na clivagem do DNA alvo e induziram mutações (por junção de extremidades não homólogas (NHEJ), como é evidenciado por uma frequência de mutação variando de 33-90%.
[0398] Todos os eventos também foram pesquisados quanto à presença de um transgene inserido. A triagem do evento de inserção para cada sítio alvo é ilustrada na Figura 21. Os primers utilizados para a análise da inserção por PCR em cada sítio estão listados na Tabela 24. A Figura 22 mostra um exemplo de um resultado da triagem de um evento de inserção por PCR. A frequência de inserção do transgene foi determinada calculando a “frequência de inserção”, que é definida como: (número de eventos com a inserção no sítio alvo / número total de eventos recuperados) * 100%. Assim, se 240 eventos foram recuperados e 21 eventos exibiram uma inserção do transgene, a frequência de inserção foi de 9%. TABELA 26 ATIVIDADE DO SISTEMA RNA GUIA/CAS 9 EM 8 SÍTIOS ALVO, CONFORME DETERMINADO PELA FREQUÊNCIA DE MUTAÇÃO NO SÍTIO-ALVO E A FREQUÊNCIA DE INSERÇÃO DO TRANSGENE NO SÍTIO ALVO DESEJADO EM TECIDO VEGETAL DE MILHO Número de eventos com ambas as junções, HR1 e HR2, positivas. ** Apenas a junção HR2 disponível.
[0399] As amplificações de PCR de sequência confirmada indicaram uma inserção de transgene sítio-específica para cada um dos 8 sítios-alvo, conforme mostrado na Tabela 26 (na coluna da frequência de inserção). Um cassete de transgene foi inserido em todos os 8 sítios-alvo com elevada eficiência (2-16%). Os números de eventos contendo amplificações em ambas as junções de DNA genômico transgênicas, indicando a inserção do transgene sítio-específica quase perfeita, são mostrados entre parêntesis na Tabela 26.
[0400] Em conjunto, estes dados demonstram que os loci cromossômicos de milho clivados com o sistema RNA guia/Cas milho- otimizado descrito na presente divulgação podem ser usados para introduzir os transgenes em frequências elevadas em linhagem endogâmica elite de milho.
EXEMPLO 19 ENTREGA DO DNA DO SISTEMA RNA GUIA/ENDONUCLEASE CAS9 PARA A SOJA POR TRANSFORMAÇÃO ESTÁVEL
[0401] Um promotor de RNA nuclear pequeno U6 de soja (GM- U6-9.1; SEQ ID NO: 295) foi identificado de um modo semelhante ao promotor GM-U6-13.1 de soja (SEQ ID NO: 120) descrito no Exemplo 12. O promotor GM-U6-9.1 foi utilizado para expressar o RNA guia a fim de direcionar a nuclease Cas9 para o sítio alvo genômico designado
[0402] Um cassete de expressão da endonuclease Cas9 códon- otimizado para soja (tal como, por exemplo, EF1A2:CAS9, SEQ ID NO: 296) e um cassete de expressão de RNA guia (tal como, por exemplo, U6- 9.1:DD20CR1; SEQ ID NO: 297) foram ligados (como U6-9.1:DD20CR1 + EF1A2:CAS9; SEQ ID NO: 298, Figura 23A) e integrados em um plasmídeo de DNA que foi coentregue com outro plasmídeo compreendendo um cassete de DNA doador (DNA de reparação) (tal como DD20HR1-SAMS:HPT-DD20HR2; SEQ ID NO: 299) para embriões somáticos jovens de soja, sob a forma de culturas embriogênicas em suspensão, por bombardeamento de partículas (Figura 23A e 23B). Outras construções RNA guia/DNA Cas9 visando diversos sítios genômicos da soja e construções de DNA doador para a integração do transgene sítio-específica através da recombinação homóloga foram configurados de forma semelhante e estão listados na Tabela 27. As quatro construções de gRNA/Cas9 diferem apenas no domínio de direcionamento do RNA guia (domínio de direcionamento variável) de 20 bp visando os sítios alvo genômicos da soja DD20CR1 (SEQ ID NO: 125), DD20CR2 (SEQ ID NO: 126), DD43CR1 (SEQ ID NO: 127), ou DD43CR2 (SEQ ID NO: 128). As duas construções de DNA doador diferem apenas nas regiões homólogas, tais como DD20HR1 e DD20HR (Figura 23B), ou DD43HR1 e DD43HR2. Estas construções RNA guia/DNA Cas9 e DNAs doadores foram coentregues ao genoma de uma linhagem elite (93B86) ou não elite (Jack) de soja pelo procedimento de transformação estável descrito abaixo. TABELA 27 TRANSFORMAÇÃO ESTÁVEL DE SOJA MEDIADA POR RNA GUIA/CAS9
[0403] Foram induzidas culturas em suspensão embriogênicas somáticas de soja a partir de uma cultivar elite 93B86 propriedade da DuPont Pioneer. Os cotilédones (~ 3 mm de comprimento) foram dissecados a partir da superfície esterilizada, sementes imaturas e foram cultivadas durante 6-10 semanas, sob luz, a 26 °C em meio de Murashige e Skoog (MS) contendo 0,7% de ágar e suplementado com 10 mg/mL de 2,4-D (ácido 2,4- diclorofenoxiacético). Embriões somáticos em estágio globular, que produziram embriões secundários, foram então excisados e colocados em frascos contendo meio MS líquido suplementado com 2,4-D (10 mg/ml) e cultivados sob luz, em um agitador rotativo. Após a seleção repetida para conjuntos de embriões somáticos que se multiplicaram precocemente, embriões em estágio globular, as culturas em suspensão embriogênica de soja foram mantidas em 35 ml de meio líquido em um agitador rotativo, a 150 rpm, a 26 °C sob luzes fluorescentes em uma programação dia/noite de 16/8 horas. As culturas foram subcultivadas a cada duas semanas por inoculação de aproximadamente 35 mg de tecido em 35 ml do mesmo meio MS líquido fresco.
[0404] As culturas embriogênicas em suspensão de soja foram, então, transformadas pelo método de bombardeamento com pistola de partículas usando um instrumento DuPont Biolistic™ PDS1000/HE (Bio-Rad Laboratories, Hercules, CA). Para 50 μL de uma suspensão de partícula de ouro de 1 μm a 60 mg/mL, é acrescentado (na ordem): 30 μL de uma quantidade igual (30 ng/μL) de DNA plasmidial compreendendo, por exemplo, U6-9.1:DD20CR1+EF1A2:CAS9 (SEQ ID NO: 298) e o DNA plasmidial compreendendo, por exemplo, (DD20HR1-SAMS:HPT-DD20HR2, SEQ ID NO: 299) (Experimento U6-9.1DD20CR1 listado na Tabela 27) 20 μL de espermidina 0,1 M e 25 μL de CaCl2 5 M. A preparação de partículas foi então agitada por 3 minutos, centrifugada em uma centrífuga por 10 segundos e o sobrenadante removido. As partículas revestidas de DNA foram então lavadas uma vez com 400 μL de etanol a 100% e resuspensas em 45 μL de etanol 100%. A suspensão de DNA/partícula foi sonicada três vezes durante um segundo. Em seguida, 5 μL de partículas de ouro revestidas com DNA foram carregados em cada disco macrocarreador.
[0405] Aproximadamente 300 a 400 mg de uma cultura em suspensão de duas semanas de idade foi colocada em uma placa de Petri vazia de 60x15 mm e o líquido residual removido do tecido com uma pipeta. Para cada experimento de transformação, cerca de 5 a 10 placas de tecido normalmente foram bombardeados. A pressão da membrana de ruptura foi configurada para 1100 psi e a câmara colocada sob um vácuo de 28 polegadas de mercúrio. O tecido foi colocado a aproximadamente 3,5 polegadas de distância da tela de retenção e bombardeado por uma vez. Após os bombardeamentos, o tecido foi dividido ao meio e colocado de volta ao meio líquido e cultivado conforme descrito anteriormente.
[0406] Cinco a sete dias após o bombardeamento, o meio líquido foi trocado por meio fresco contendo 30 mg/ml higromicina como agente de seleção. O meio seletivo foi trocado semanalmente. Sete a oito semanas após o bombardeio observou-se o crescimento de tecido transformado, verde, crescendo a partir de aglomerados embriogênicos necróticos não transformados. O tecido verde isolado foi removido e inoculado em frascos individuais para gerar novas culturas embriogênicas transformadas em suspensão, clonalmente propagadas. Cada cultura clonalmente propagadas foi tratada como um evento de transformação independente e subcultivada no mesmo meio MS líquido suplementado com 2,4-D (10 mg/ml) e 30 ng/ml de agente de seleção higromicina para aumentar a massa. As culturas embriogênicas em suspensão foram então transferidas para placas com meio MS em ágar sólido sem suplemento com 2,4-D para permitir que os embriões somáticos se desenvolvessem. Uma amostra de cada evento foi coletada nesta fase para análise por PCR quantitativa.
[0407] Embriões somáticos em fase de cotilédones foram secos (pela transferência para uma pequena placa de Petri vazia que estava alocada no topo de uma placa de Petri de 10 cm contendo um pouco de ágar gel para permitir a secagem lenta) para mimetizar as últimas fases de desenvolvimento das sementes de soja. Os embriões secos foram colocados em meio sólido de germinação e plântulas de soja transgênicas foram regeneradas. As plantas transgênicas foram então transferidas para o solo e mantidas em câmaras de crescimento para a produção de sementes. Os eventos transgênicos foram amostrados no estágio de embrião somático ou estágio foliar T0 para a análise molecular.
[0408] Experimentos de transformação similares (U6- 9.1DD20CR2, U6-9.1DD43CR1, U6-9.1DD43CR2) com os componentes listados na Tabela 27 e utilizando a cultivar elite 93B86 foram realizados conforme descrito acima.
[0409] Dois experimentos de transformação, U6-9.1DD20CR1 e U6-9.1DD43CR1 listados na Tabela 27, também foram realizados em uma cultivar de soja não elite “Jack” para testar o desempenho do sistema gRNA/Cas9 em diferentes genótipos de soja.
EXEMPLO 20 DETECÇÃO DA NHEJ SÍTIO-ESPECÍFICA MEDIADA PELO SISTEMA RNA GUIA/CAS9 EM SOJA TRANSFORMADAS DE FORMA ESTÁVEL
[0410] O DNA genômico foi extraído a partir de amostras de embriões somáticos e analisado por PCR quantitativa utilizando um sistema de PCR em tempo real 7500 (Applied Biosystems, Foster City, CA) com os primers sítio-específicos e sondas fluorescentes marcadas com FAM para checar a alteração no número de cópias do sítio alvo DD20 ou DD43 (Figura 24A-C). A análise de qPCR foi realizada em reações de duplexos com um gene da proteína de choque térmico (HSP) como controle endógenos e uma amostra de DNA genômico 93B86 tipo selvagem que contém uma cópia do sítio alvo com 2 alelos, como calibrador de cópia única. O controle endógeno HSP para qPCR empregou o conjunto de primers - sonda HSP-F/HSP-T/HSP-R. A qPCR específica para DD20-CR1 (SEQ ID NO: 306) e DD20-CR2 (SEQ ID NO: 307) utilizou o conjunto de primers - sonda DD20-F (SEQ ID NO: 308)/DD20-T (SEQ ID NO: 309)/DD20-R (SEQ ID NO: 310). A qPCR específica para DD43-CR1 (SEQ ID NO: 311) utilizou o conjunto de primers - sonda DD43-F(SEQ ID NO: 313)/DD43-T(SEQ ID NO: 315)/DD43-R (SEQ ID NO: 316) enquanto a A qPCR específica para DD43-DD43-CR2 (SEQ ID NO: 312) utilizou o conjunto de primers - sonda DD43-F2(SEQ ID NO: 314)/DD43-T/DD43-R. A qPCR específica para RNA guia/DNA Cas9 (SEQ ID NOs: 298, 300, 301, e 303) utilizou o conjunto de primers - sonda Cas9-F (SEQ ID NO: 317/Cas9-T(SEQ ID NO: 318)/Cas-9-R(SEQ ID NO: 319). A qPCR específica para o DNA doador (SEQ ID NOS: 299, e 302) utilizou o conjunto de primers - sonda Sams-76F (SEQ ID NO: 320)/ FRT1I63-T (SEQ ID NO: 321)/ FRT1I-41F (SEQ ID NO: 322). A sonda de controle endógeno HSP-T foi marcada com VIC e as sondas específicas para os genes DD20-T, DD43-T, Cas9-T, e FRT1I63-T foram marcadas com FAM para a detecção simultânea de ambas as sondas fluorescentes (Applied Biosystems). Os dados das reações de PCR foram capturados e analisados utilizando o software de detecção de sequência fornecido com o sistema de PCR em tempo real 7500 e o número de cópias do gene foi calculado utilizando a metodologia de quantificação relativa (Applied Biosystems).
[0411] Uma vez que o DNA genômico 93B86 tipo selvagem com dois alelos do sítio alvo foi usado como calibrador de cópia única, eventos sem qualquer alteração no sítio alvo seriam detectado como uma cópia denominada aqui como WT-Homo (valor qPCR > = 0,7), eventos com um alelo alterado, que não são detectáveis pela qPCR sítio-específica do alvo, seriam detectados como meia cópia denominada no presente de NHEJ-Hemi (valor qPCR entre 0,1 e 0,7), enquanto os eventos com alteração em ambos os alelos seriam detectado como nulo denominado no presente como NHEJ-nulo (valor qPCR = < 0,1). A grande variedade dos valores de qPCR sugere que a maioria dos eventos continha sequências tipo selvagem e mutante mistos do sítio alvo. Altas percentagens de NHEJ-Hemi (entre 10,1 e 33,5%, Tabela 28) e NHEJ- nulo (variando de 32,3 a 46,4%, Tabela 21) foram detectadas em todos os quatro experimentos com frequências médias de NHEJ combinadas acima de 60% (Tabela 28). TABELA 28 MUTAÇÕES NO SÍTIO ALVO E INTEGRAÇÃO DE GENE SÍTIO-ESPECÍFICA INDUZIDAS PELO SISTEMA RNA GUIA/CAS9 EM GERMOPLASMA DE SOJA ELITE. Os Números Indicam o Número De Eventos (Números Entre Parênteses estão em %). NA = Não Analisado. TABELA 29 MUTAÇÕES NO SÍTIO ALVO E INTEGRAÇÃO DE GENE SÍTIO-ESPECÍFICA INDUZIDAS PELO SISTEMA RNA GUIA/CAS9 EM GERMOPLASMA DE SOJA NÃO ELITE. Os Números Indicam o Número De Eventos (Números Entre Parênteses são % do Total de Eventos Analisados).
[0412] Ambos, NHEJ-Hemi e NHEJ-Nulo foram detectados nos dois experimentos U6-9.1DD20CR1-Jack e U6-9.1DD43CR1-Jack repetidas no genótipo “Jack”, embora em frequências mais baixas (Tabela 29). As diferenças entre as frequências NHEJ provavelmente foram causadas por variações entre os experimentos de transformação.
[0413] A região alvo dos eventos NHEJ-nulo foram amplificadas por PCR regular a partir das mesmas amostras de DNA genômico utilizando os primers específicos DD20-lb (SEQ ID NO: 323) e DD20-RB (SEQ ID NO: 326) respectivamente para DD20-HR1 e DD20-HR2 para o sítio alvo DD20 específico do amplicon HR1-HR2 da PCR (Figura 25 AC; SEQ ID NO: 329), ou primers específicos DD43-LB (SEQ ID NO: 327) e DD43-RB (SEQ ID NO: 328) respectivamente para DD43-HR1 e DD43-HR2 para o sítio alvo DD43 específico do amplicon HR1 HR2 da PCR (SEQ ID NO: 332). As bandas de PCR foram clonadas no vetor pCR2.1 utilizando um kit de clonagem TOPO-TA (Invitrogen) e múltiplos clones foram sequenciados para verificar as alterações de sequência no sítio alvo como resultado da NHEJ. Várias pequenas deleções no sítio de clivagem da Cas9, 3 bp a montante de PAM, foram reveladas em todos os quatro sítios-alvo testados (Figura 26 CA). Pequenas inserções também foram detectadas em algumas sequências. Sequências mutadas diferentes foram identificadas a partir de alguns dos mesmos eventos indicando a natureza quimérica destes eventos. Algumas das mesmas sequências mutadas também foram identificadas a partir de diferentes eventos sugerindo que as mesmas mutações possam ter ocorrido de forma independente ou alguns dos eventos podem ser eventos clonais. Esta análise da sequência confirmou a ocorrência de NHEJ mediada pelo sistema RNA guia/Cas9 nos sítios alvo Cas9-específicos.
EXEMPLO 21 IDENTIFICAÇÃO DA INTEGRAÇÃO DE GENE SÍTIO-ESPECÍFICA POR MEIO DE RECOMBINAÇÃO HOMÓLOGA MEDIADA PELO SISTEMA RNA GUIA/CAS9 EM SOJA TRANSFORMADAS DE FORMA ESTÁVEL
[0414] A integração do gene sítio-específica através da recombinação homóloga do DNA mediada pelo sistema RNA guia/Cas9 foi determinada pela análise de PCR borda-específica. As extremidades de borda 5’ dos eventos DD20CR1 e DD20CR2 foram amplificadas como um amplicon de PCR de 1204 bp; DD20 HR1-SAMS (SEQ ID NO: 330) com os primers DD20-LB (SEQ ID NO: 323) e Sams-A1 (SEQ ID NO: 324), enquanto que as extremidade de borda 3' dos mesmos eventos foram amplificadas como um amplicon de PCR de 1459 bp; DD20 NOS- HR2 (SEQ ID NO: 331) com os primers QC498A-S1 e DD20-RB (Figura 25 CA). Qualquer evento com ambas as bandas específicas para a borda 5’ e borda 3’ amplificadas é considerado como um evento de integração sítio-específicas através de recombinação homóloga contendo o transgene a partir do fragmento de DNA doador DD20HR1-SAMS:HPT-DD20HR2 ou a sua forma circular (FIG 23). As extremidades de borda 5’ dos eventos DD43CR1 e DD43CR2 foram amplificadas como um amplicon de PCR de 1202 bp; DD43 HR1-SAMS (SEQ ID NO: 333) com os primers DD43-LB e Sams-A1, enquanto que as extremidade de borda 3' dos mesmos eventos foram amplificadas como um amplicon de PCR de 1454 bp; DD43 NOS-HR2 (SEQ ID NO: 334) com os primers QC498A-S1 (SEQ ID NO: 325) e DD43-RB (SEQ ID NO: 328). Qualquer evento com ambas as bandas específicas para a borda 5’ e borda 3’ amplificadas é considerado como um evento de integração sítio-específicas através de recombinação homóloga contendo o transgene a partir do fragmento de DNA de reparo DD43HR1-SAMS:HPT-DD43HR2 ou a sua forma circular. Alguns dos fragmentos de PCR borda-específica foram sequenciados e todos foram confirmados como sendo sequências recombinadas, tal como esperado a partir da recombinação homóloga. Em média, a integração do gene através da recombinação homóloga mediada pelo RNA guia/Cas9 ocorreu em cerca de 4% do total de eventos transgênicos (frequência de inserção, Tabela 28 e Tabela 29). Um evento de recombinação homóloga foi identificado a partir experimento U6-9.1DD43CR1-Jack repetido no genótipo “Jack” (Tabela 29).
EXEMPLO 22 O SISTEMA CRRNA/TRACRRNA/ENDONUCLEASE CAS CLIVA O DNA CROMOSSÔMICO EM MILHO E INTRODUZ MUTAÇÕES POR JUNÇÃO DE EXTREMIDADES NÃO HOMÓLOGAS IMPERFEITA
[0415] Para testar se o sistema crRNA/tracrRNA/endonuclease Cas otimizado para de milho descrito no Exemplo 1 pode reconhecer, clivar, e mutar o DNA cromossômico de milho através das vias de reparação da junção de extremidades não homólogas (NHEJ) imprecisas, três sequências genômicas alvo diferentes foram selecionadas para clivagem (vide a Tabela 30) e examinadas por sequenciamento em profundidade para verificar a presença de mutações NHEJ. TABELA 30 SEQUÊNCIAS ALVO GENÔMICAS DE MILHO VISADAS POR UM SISTEMA CRRNA/TRACRRNA/ENDONUCLEASE CAS.LIG = promotor do gene Liguleless 1
[0416] O cassete de expressão da endonuclease Cas9 milho- otimizada, cassetes de expressão contendo os domínios de direcionamento variável crRNA específico para milho (SEQ ID NOS: 445-447) complementar comas as fitas antisense das sequências alvo genômica de milho listadas na Tabela 30 e cassete de expressão tracrRNA (SEQ ID NO : 448) foram coentregues a 60-90 embriões imaturos de milho Hi-II por entrega mediada por partículas (vide o Exemplo 5) na presença dos genes BBM e WUS2 (vide o Exemplo 6). Embriões de milho Hi-II cotransformados com os cassetes de expressão Cas9 e RNA guia longo visando o sítio alvo genômico LIGCas-3 (SEQ ID NO: 18) para clivagem serviram como controle positivo e os embriões transformados apenas com o cassete de expressão Cas9 serviram como controle negativo. Após 7 dias, os 20-30 embriões mais uniformemente transformados de cada tratamento foram reunidos e o DNA genômico total foi extraído. A região em torno do sítio alvo pretendido foi amplificada por PCR com o kit para PCR ‘Phusion® High Fidelity PCR Master Mix’ (New England Biolabs, M0531L) adicionando as sequências necessárias para códigos de barras e sequenciamento Illumnia amplicon-específicos usando primers “tailed” através de duas rodadas de PCR. Os primers utilizados na reação de PCR primária são apresentados na Tabela 31 e os primers utilizados na reação de PCR secundária foram AATGATACGGCGACCACCGAGATCTACACTCTTTCCCTACACG (direto, SEQ ID NO: 53) e CAAGCAGAAGACGGCATA (reverso, SEQ ID NO: 54). TABELA 31 SEQUÊNCIAS DE PRIMERS PARA PCR
[0417] As amplificações da PCR resultantes foram purificadas em uma coluna de purificação por centrifugação Qiagen PCR purification spin column, concentração foi medida por um ensaio fluorimétrico com base no corante Hoechst, combinados em uma proporção equimolar, e foi realizada uma leitura única de 100 nucleotídeos de comprimento por sequenciamento em profundidade em um sequenciador MiSeq Personal Sequencer da IIlumina um MiSeq pessoal sequenciador com um aumento 30-40% (v/v) de phiX controle v3 (Illumina, FC-110-3001) para compensar o viés de sequência. Somente aqueles reads (leituras feitas) com um nucleotídeo indel > 1 surgindo dentro da janela de 10 nucleotídeos centrado sobre o sítio de clivagem previsto e não encontrado em um nível semelhante no controle negativo foram classificados como mutações NHEJ. Os reads NHEJ mutantes com a mesma mutação foram contados e caíram em um único read e as 10 principais mutações mais prevalentes foram visualmente confirmadas como surgindo dentro do sítio de clivagem previsto. O número total de mutações NHEJ visualmente confirmadas foi então usado para calcular a % de reads mutantes com base no número total de leituras (reads) de um comprimento apropriado contendo uma combinação perfeita com o código de barras e primer direto.
[0418] A frequência de mutações NHEJ recuperadas pelo sequenciamento em profundidade para o sistema crRNA/tracrRNA/endonuclease Cas direcionada aos três alvos LIGCas (SEQ ID NOS: 16, 17, 18) em comparação com o sistema RNA guia longo/endonuclease Cas direcionado para o mesmo locus é mostrado na Tabela 32. TABELA 32 PERCENTAGEM (%) DE LEITURAS (READS) MUTANTES NO LOCUS ALVO LIGULELESSI DE MILHO PRODUZIDO PELO SISTEMA CRRNA/TRACRRNA/ENDONUCLEASE CAS VERSUS UM SISTEMA RNA GUIA LONGO/ENDONUCLEASE CAS
[0419] Os dez tipos mais prevalecentes de mutações NHEJ recuperadas com base no sistema crRNA/tracrRNA/endonuclease Cas estão apresentados na Figura 27A (sítio alvo LIGCas-1, correspondendo às SEQ ID NOs: 415-424), Figura 27B (sítio alvo LIGCas-2 correspondendo às SEQ ID NOs: 425-434) e na Figura 27C (sítio alvo LIGCas-3 correspondendo às SEQ ID NOs: 435-444). Aproximadamente, frequências de 9-16 vezes mais baixas de mutações NHEJ foram observadas quando se utiliza um sistema crRNA/tracrRNA/endonuclease Cas para introduzir uma quebra de dupla fita em um sítio alvo genômico no milho, em relação ao sistema RNA guia/endonuclease Cas usado como controle.
[0420] Tomados em conjunto, os nossos dados indicam que o sistema crRNA/tracrRNA/endonuclease Cas milho-otimizado descrito na presente divulgação cliva o DNA cromossômico de milho e gera mutações NHEJ imperfeitas.
EXEMPLO 23 MODIFICANDO O GENE ARGOS8 PARA MELHORAR A TOLERÂNCIA À SECA E EFICIÊNCIA NO USO DE NITROGÊNIO EM PLANTAS DE MILHO
[0421] ARGOS é um regulador negativo para as respostas ao etileno em plantas (WO 2013/066805 A1, publicada em 10 de maio de 2013). As proteínas ARGOS visam a via de transdução de sinal de etileno. Quando superexpressa em plantas de milho, a ARGOS reduz a sensibilidade da planta ao etileno e promove o crescimento de órgãos, levando a uma maior tolerância à seca (DRT) e eficiência melhorada no uso de nitrogênio (EUN) ((WO 2013/066805 A1, publicado em 10 de maio de 2013). Para atingir a sensibilidade ao etileno ótima, foram testados promotores para conduzir a superexpressão de Zm-ARGOS8 em plantas de milho transgênicas. Os ensaios de campo mostraram que um promotor de milho, Zm-GOS2 PRO: GOS2 INTRON (SEQ ID NO: 460, US 6.504.083 patente emitida em 7 de Janeiro de 2003; Zm-GOS2 é um gene homólogo de milho para o gene GOS2 de arroz. GOS2 de Arroz significa Gene de Oryza sativa 2), proporcionou um nível de expressão favorável e abrangência tecidual para Zm-ARGOS8 e as plantas transgênicas têm um maior rendimento de grãos do que as plantas controles não transgênicas sob estresse hídrico e condições de baixo teor de nitrogênio (WO 2013/066805 A1, publicado em 10 de maio de 2013). No entanto, estas plantas transgênicas contêm dois genes ARGOS8, o gene endógeno e o transgene. Os níveis de proteína ARGOS8, consequentemente, são determinados por estes dois genes. Como o gene ARGOS8 endógeno varia na sequência e no nível de expressão entre diferentes linhagens puras, o nível de proteína ARGOS8 será diferente quando o transgene é integrado em diferentes linhagens. Aqui é apresentado um método de mutagenização (edição de gene) para modificar a região promotora do gene ARGOS8 endógeno a fim de atingir padrões de expressão desejados e eliminar a necessidade de um transgene.
[0422] O promotor Zm-GOS2 PRO:GOS2 INTRON (SEQ ID NO: 460; US 6.504.083 publicada em 7 de Janeiro de 2003), foi inserido na 5'-UTR do Zm-ARGOS8 (SEQ ID NO: 462), utilizando um sistema RNA guia/Cas9. O fragmento Zm-GOS2 PRO:GOS2 INTRON também incluía um sítio de ligação do primer (SEQ ID NO: 459) na sua extremidade 5' para facilitar o rastreio dos eventos pela PCR. Nós também substituímos o promotor nativo do Zm- ARGOS8 (SEQ ID NO: 461) pelo Zm-GOS2 PRO::GOS2 INTRON (SEQ ID NO: 460). As linhagens de milho resultantes carregam um novo alelo ARGOS8 cujo nível de expressão e especificidade para o tecido será diferente da forma nativa. Esperamos que essas linhagens recapitulem o fenótipo de maior tolerância à seca e NUE melhorado, tal como observado nas plantas transgênicas Zm-GOS2 PRO:Zm-ARGOS8 (WO 2013/066805 A1, publicado em 10 de maio de 2013). Estas linhagens de milho são diferentes dos eventos transgênicos convencionais: (1) existe apenas um gene ARGOS8 no genoma; (2) esta versão modificada do Zm-ARGOS8 reside no seu locus nativo; (3) o nível de proteína ARGOS8 e a especificidade ao tecido da expressão gênica são totalmente controladas pelo alelo editado. Os reagentes DNA utilizados durante a mutagenização, tal como RNA guia, endonuclease Cas9, marcador de transformação e outros fragmentos de DNA não são necessários para a função do alelo ARGOS8 recém-gerado e podem ser eliminados a partir do genoma por segregação através de métodos de reprodução padrão. Uma vez que o promotor Zm-GOS2 PRO:INTRON GOS2 foi copiado a partir do gene GOS2 de milho (SEQ ID NO: 464) e inserido no locus ARGOS8 através da recombinação homóloga, este alelo ARGOS8 é indistinguível a partir de alelos mutantes naturais.
A. INSERÇÃO DE ZEA MAYS-GOS2 PRO: GOS2 INTRON NO PROMOTOR ARGOS 8 DE MILHO.
[0423] Para inserir o Zm-GOS2 PRO:GOS2 INTRON na 5'-UTR do gene ARGOS8 de milho, uma construção de RNA guia, gRNA1, foi feita utilizando um promotor e terminador U6 de milho, tal como descrito no presente. A extremidade 5' do RNA guia continha um domínio de direcionamento variável de 19 bp visando a sequência genômica alvo 1 (CTS1; SEQ ID NO; 451), na 5’-UTR do Zm-ARGOS8 (Figura 28). Um molde de modificação de polinucleotídeo contendo o Zm-GOS2 PRO:GOS2 INTRON que foi flanqueado pelos dois fragmentos de DNA genômico (HR1 e HR2, 370 e 430 bp de comprimento, respectivamente) foi derivado a partir da região a montante e a jusante do CTS1 (Figura 28). A construção gRNA1, o molde de modificação de polinucleotídeo, um cassete Cas9 de marcador de seleção e transformação fosfomanose isomerase (PMI) foram introduzidos em células de embriões imaturos de milho utilizando um método de bombardeamento de partículas. Calos resistentes à PMI foram rastreados com PCR para a inserção Zm-GOS2 PRO:GOS2 INTRON (Figura 29A e 29B). Vários eventos de calos foram identificados e as plantas foram regeneradas. Os eventos de inserção foram confirmados pela amplificação da região Zm-ARGOS8 em plantas T0 por PCR (Figura 29C) e sequenciamento dos produtos da PCR.
B. SUBSTITUIÇÃO DO PROMOTOR ZM-ARGOS8 PELO PROMOTOR ZM-GOS2 PRO:GOS2 INTRON (TROCA DE PROMOTOR).
[0424] Para substituir o promotor nativo Zm-ARGOS8 pelo Zm- GOS2 PRO:GOS2 INTRON, uma construção de RNA guia, gRNA3, foi feita visando o sítio alvo genômico CTS3 (SEQ ID NO: 453), situado 710 bp a montante do códon de iniciação do Zm-ARGOS8 (Figura 30). Outro RNA guia, gRNA2, foi concebido para direcionar o sítio alvo genômico CTS2 (SEQ ID NO: 452) localizado na 5'-UTR do Zm-ARGOSO8 (Figura 30). O molde de modificação de polinucleotídeo continha um fragmento de 400 bp de DNA genômico derivado da região a montante do CTS3, Zm-GOS2 PRO:GOS2 INTRON e um fragmento de DNA genômico de 360 bp derivado da região a jusante de CTS2 (Figura 30). O gRNA3 e gRNA2, o cassete Cas9, molde de modificação de polinucleotídeo e o marcador de seleção PMI foram usados para transformar células de embriões imaturos. Os eventos da troca de promotor múltipla (substituição de promotor) foram identificados pela triagem por PCR de calos resistentes à PMI (Figura 31A, 31B e 31C) e as plantas foram regeneradas. Os eventos da troca foram confirmados por análise de PCR da região Zm-ARGOS8 nas plantas T0 (Figura 31D).
C. DELEÇÃO DO PROMOTOR ZM-ARGOS 8
[0425] Para eliminar o promotor Zm-ARGOS8, nós analisamos os calos resistentes à PMI obtidos a partir do experimento gRNA3/gRNA2 acima para procurar para eventos que produzem um produto de PCR de 1,1 kb (Figura 32A). Vários eventos de deleção foram identificados (Figura 32B) e as plantas foram regeneradas. Os eventos de deleção foram confirmados pela amplificação da região Zm-ARGOS8 em plantas T0 por PCR e sequenciamento dos produtos da PCR.
EXEMPLO 24 EDIÇÃO GÊNICA DO GENE EPSPS1 DE SOJA UTILIZANDO O SISTEMA RNA GUIA/ENDONUCLEASE CAS A. DESENVOLVIMENTO DO SISTEMA RNA GUIA/ENDONUCLEASE CAS9 SÍTIO-ALVO NOS GENES EPSPS DE SOJA.
[0426] Foram identificados dois sítios-alvo do RNA guia/endonuclease Cas9 (EPSPS-CR1 e EPSPS-CR2 de soja) no éxon2 do gene EPSPS1 de soja Glyma01g33660 (Tabela 33). TABELA 33 SÍTIOS ALVO DO RNA GUIA/ ENDONUCLEASE CAS9 NO GENE EPSPS1 DE SOJA
B. CASSETES DE EXPRESSÃO DO RNA GUIA, CASSETES DE EXPRESSÃO DA ENDONUCLEASE CAS9 E MOLDES DE MODIFICAÇÃO DE POLINUCLEOTÍDEO PARA A INTRODUÇÃO DE ALTERAÇÕES DE AMINOÁCIDOS ESPECÍFICAS NO GENE EPSPS1 DE SOJA.
[0427] O promotor de RNA nuclear pequeno U6 de soja, GM-U6- 13.1 (SEQ ID NO: 469), foi utilizado para expressar RNAs guia para direcionar a nuclease Cas9 para os sítios-alvo genômicos designados (Tabela 34). Um cassete de expressão da endonuclease Cas9 códon-otimizada para soja (SEQ ID NO: 489) e um cassete de expressão de RNA guia foram ligados em um primeiro plasmídeo que foi coentregue com um molde de modificação de polinucleotídeo. O molde de modificação de polinucleotídeo continha alterações de nucleotídeos específicas que codificam alterações de aminoácidos no polipeptídeo EPSPS1 (Glyma01g33660), tal como o T183I e P187S (TIPS) no éxon2. Outras alterações de aminoácidos no polipeptídeo EPSPS1 também podem ser obtidas utilizando o sistema RNA guia/endonuclease Cas descrito na presente divulgação. As modificações de aminoácidos específicas podem ser conseguidas por recombinação homóloga entre o DNA genômico e o molde de modificação de polinucleotídeo facilitado pelo sistema RNA guia/endonuclease CAS. TABELA 34 CASSETES DE EXPRESSÃO RNA GUIA/CAS9 E MOLDE DE MODIFICAÇÃO DE POLINUCLEOTÍDEO UTILIZADOS NA TRANSFORMAÇÃO ESTÁVEL DE SOJA PARA AS MODIFICAÇÕES DE AMINOÁCIDOS ESPECÍFICAS DO GENE EPSPS1.
C. DETECÇÃO DA JUNÇÃO DE EXTREMIDADES NÃO HOMÓLOGAS (NHEJ) SÍTIOESPECÍFICA MEDIADA PELO SISTEMA RNA GUIA/CAS9 EM SOJA ESTAVELMENTE TRANSFORMADAS.
[0428] O DNA genômico foi extraído a partir de amostras de embriões somáticos e analisado por PCR quantitativa utilizando um sistema de PCR em tempo real 7500 (Applied Biosystems, Foster City, CA) com os primers sítio-específicos e sondas fluorescentes marcadas com FAM para checar a alteração no número de cópias dos sítios alvo de quebra de dupla fita. A análise de qPCR foi realizada em reações de duplexos com uma proteína induzida por siringolide (SIP) como controle endógenos e uma amostra de DNA genômico 93B86 tipo selvagem que contém uma cópia do sítio alvo com 2 alelos, como calibrador de cópia única. A presença ou ausência do cassete de expressão RNA guia-Cas9 nos eventos transgênicos também foi analisada com o primer/sondas de qPCR para RNA guia/Cas9 (SEQ IDs: 477-479) e para Pinll (SEQ ID: 480-482). Os primers e sondas de qPCR estão listados na Tabela 35. TABELA 35 PRIMERS/SONDAS UTILIZADOS NA ANÁLISE DE QPCR DE EVENTOS DE SOJA TRANSGÊNICOS.
[0429] A sonda de controle endógeno SIP-T foi marcada com VIC e as sondas gene-específicas para todos os sítios alvos foram marcadas com FAM para a detecção simultânea de ambas as sondas fluorescentes (Applied Biosystems). Os dados das reações de PCR foram capturados e analisados utilizando o software de detecção de sequência fornecido com o sistema de PCR em tempo real 7500 e o número de cópias do gene foi calculado utilizando a metodologia de quantificação relativa (Applied Biosystems).
[0430] Uma vez que o DNA genômico 93B86 tipo selvagem com dois alelos do sítio alvo de quebra de dupla fita foi usado como calibrador de cópia única, eventos sem qualquer alteração no sítio alvo seriam detectado como uma cópia denominada aqui como WT-Homo (valor qPCR > = 0,7), eventos com um alelo alterado, que não são detectáveis pela qPCR sítio-específica do alvo, seriam detectados como meia cópia denominada no presente de NHEJ-Hemi (valor qPCR entre 0,1 e 0,7), enquanto os eventos com alteração em ambos os alelos seriam detectado como nulo denominado no presente como NHEJ-nulo (valor qPCR = < 0,1). Conforme mostrado na Tabela 36, os dois sistemas de RNA guia/endonuclease de direcionamento aos sítios EPSPS-CR1 e EPSPS-CR2 de soja podem introduzir eficientemente quebra de dupla fita (DSB) no seus sítios-alvo personalizados. NHEJ-Hemi e NHEJ-Nulo foram detectadas no genótipo 93B86. As mutações NHEJ (junção de extremidades não homólogas) mediadas pelo sistema RNA guia/Cas9 nos sítios-alvo Cas9-específicos foram confirmadas por PCR/topo clonagem/sequenciamento. TABELA 36 TAXA DE MUTAÇÃO DE QUEBRA DE DUPLA FITA NOS SÍTIOS ALVO INDUZIDAS PELO SISTEMA RNA GUIA/CAS9 NO GENE EPSPS1 DE SOJA. OS NÚMEROS INDICAM O NÚMERO DE EVENTOS (NÚMEROS ENTRE PARÊNTESES ESTÃO EM %).
D. DETECÇÃO DA MUTAÇÃO TIPS NO GENE EPSPS DE SOJA
[0431] A fim de editar aminoácidos específicos no gene EPSPS nativo (tal como aqueles que resultam em uma modificação TIPS), um molde de modificação de polinucleotídeo, tal como RTW1013A ou RTW1012A (Tabela 34), foi coentregue com os cassetes de expressão RNA guia/Cas9 em células de soja.
[0432] A modificação do gene EPSPS1 nativo através da recombinação homóloga do DNA mediada pelo sistema RNA guia/Cas9 foi determinada por análise de PCR específica. Um ensaio de PCR específica com o par de primers WOL569 (SEQ ID NO: 486) e WOL876 (SEQ ID NO: 487) foi utilizado para detectar modificação TIPS perfeita no gene EPSPS1 nativo. Um segundo par de primers WOL569 (SEQ ID NO: 486) e WOL570 (SEQ ID NO: 488) foi utilizado para amplificar ambos os alelos EPSPS1, TIPS modificado e WT (tipo selvagem)/alelo mutado NHEJ. A clonagem Topo/sequenciamento foi utilizada para verificar as sequências.
EXEMPLO 25 SUBSTITUIÇÃO DE ÍNTRONS DE GENES DA SOJA UTILIZANDO O SISTEMA RNA GUIA/ENDONUCLEASE CAS A. DESENHO DO SÍTIO ALVO DO RNA GUIA/ENDONUCLEASE CAS9.
[0433] Quatro sítios alvo do RNA guia/endonuclease Cas9 foram identificados no gene EPSPS1 Glyma01g33660 de soja (Tabela 37). Foram identificados dois dos sítios-alvo (EPSPS-CR1 e EPSPS-CR2 de soja) para direcionar o éxon2 do gene EPSPS de soja, tal como descrito no Exemplo 24. Outros dois sítios-alvo (EPSPS-CR4 e EPSPS-CR5 de soja) foram desenhados próximos da extremidade 5' do íntron1 do gene EPSPS de soja. TABELA 37 SÍTIOS ALVO DO RNA GUIA/ ENDONUCLEASE CAS9 NO GENE EPSPS1 DE SOJA
B. CASSETES DE EXPRESSÃO RNA GUIA/ENDONUCLEASE CAS9 E MOLDE DE MODIFICAÇÃO DE POLINUCLEOTÍDEO UTILIZADOS NA TRANSFORMAÇÃO ESTÁVEL DE SOJA PARA A SUBSTITUIÇÃO DO ÍNTRONI DO GENE EPSPS1 DE SOJA PELO ÍNTRONI DA UBIQUITINA DE SOJA (UBQ).
[0434] O promotor de RNA nuclear pequeno U6 de soja, GM-U6- 13.1 (SEQ ID NO: 469), foi utilizado para expressar dois RNAs guia (EPSPS- CR1 e EPSPS-CR4 de soja, ou EPSPS-CR1 e EPSPS-CR5 de soja) para direcionar a nuclease Cas9 para os sítios-alvo genômicos designados (Tabela 38). Um dos sítios-alvo (soja-EPSPS-CR1) estava localizado no éxon2 conforme descrito no Exemplo 24, e um segundo sítio alvo (soja-EPSPS-CR4 ou soja-EPSPS-CR5) estava localizado próximo da extremidade 5' do íntron1 do gene EPSPS1 nativo. Um cassete de expressão de endonuclease Cas9 códon-otimizada para soja e um cassete de expressão de RNA guia foram ligados nos plasmídeos de expressão QC878/RTW1199 (SEQ ID NO: 470/492) ou QC878/RTRTW1200 W1202 (SEQ ID NO: 470/493) que foram coentregues com um molde de modificação de polinucleotídeo. O molde de modificação de polinucleotídeo, RTW1190A (SEQ ID NO: 494), continha 532 pb do íntron 1 do gene UBQ de soja e éxon2 modificado com TIPS. A substituição do pintron1 do EPSPS1 de soja pelo íntron1 da UBQ de soja pode ser conseguida com o sistema RNA guia/Cas por recombinação homóloga entre o DNA genômico e o molde de modificação de polinucleotídeo, resultando no aumento da expressão do gene EPSPS1 em soja nativa ou modificada. TABELA 38 CASSETES DE EXPRESSÃO RNA GUIA/ENDONUCLEASE CAS9 E MOLDE DE MODIFICAÇÃO DE POLINUCLEOTÍDEO UTILIZADOS NA TRANSFORMAÇÃO ESTÁVEL DE SOJA PARA A SUBSTITUIÇÃO DO ÍNTRONI DO GENE EPSPS1 DE SOJA PELO ÍNTRONI DA UBIQUITINA DE SOJA (UBQ).
C. DETECÇÃO DA NHEJ SÍTIO-ESPECÍFICA MEDIADA PELO SISTEMA RNA GUIA/CAS9 EM SOJA ESTAVELMENTE TRANSFORMADAS.
[0435] NHEJ sítio-específica foi detectada conforme descrito no Exemplo 24C, usando os primers/sondas de qPCR listados na Tabela 39. TABELA 39 PRIMERS/SONDAS UTILIZADOS NA ANÁLISE DE QPCR DE EVENTOS DE SOJA TRANSGÊNICOS.
D. DETECÇÃO DA SUBSTITUIÇÃO DO ÍNTRONI DO EPSPSI DE SOJA PELO ÍNTRONI DO UBQ DE SOJA USANDO O SISTEMA RNA GUIA/ENDONUCLEASE CAS9.
[0436] A fim de substituir o íntron1 EPSPS1 de soja pelo íntron1 UBQ de soja no gene EPSPS1 nativo, foram utilizados dois vetores de expressão RNA guia conforme mostrado na Tabela 38. O vetor QC878 (SEQ ID NO: 470) era direcionado ao éxon2 e o RTW1199 (SEQ ID NO: 492) ou RTW1200 (SEQ ID NO: 493) à extremidade 5' do íntron1. A clivagem dupla do gene EPSPS de soja com os dois sistemas RNA guia/Cas resultou na remoção do fragmento íntron1 EPSPS1 nativo/éxon2 parcial. Ao mesmo tempo, um molde de modificação de polinucleotídeo RTW1190A (SEQ ID NO: 494) foi coentregue nas células de soja e a recombinação homóloga entre o molde de modificação de polinucleotídeo e o DNA genômico resultou na substituição do íntron1 de EPSPS1 pelo íntron1 de UBQ de soja e as modificações de aminoácidos desejadas no éxon2, tal como evidenciado pela análise de PCR. Os ensaios de PCR com os pares de primers WOL1001/WOL1002 (SEQ ID NO: 499 e 500) e WOL1003/WOL1004 (SEQ ID NO: 501 e 502) foram usados para detectar os eventos de substituição de íntrons.
EXEMPLO 26 SUBSTITUIÇÃO DE PROMOTOR (TROCA DE PROMOTOR) DE GENES DA SOJA UTILIZANDO O SISTEMA RNA GUIA/ENDONUCLEASE CAS A. DESENHO DO SÍTIO ALVO DO RNA GUIA/ENDONUCLEASE CAS9.
[0437] Quatro sítios alvo do RNA guia/endonuclease Cas9 foram identificados no gene EPSPS1 Glyma01g33660 de soja (Tabela 40). Foram identificados dois dos sítios-alvo (EPSPS-CR1 e EPSPS-CR2 de soja) para direcionar o éxon2 do gene EPSPS de soja, tal como descrito no Exemplo 24. Foram identificados EPSPS-CR6 e EPSPS-CR7 de soja próximos da extremidade 5' do -798 bp do promotor nativo EPSPS. TABELA 40 SÍTIOS ALVO DO RNA GUIA/ ENDONUCLEASE CAS9 NO GENE EPSPS1 DE SOJA
B. CASSETES DE EXPRESSÃO RNA GUIA/ENDONUCLEASE CAS9 E MOLDE DE MODIFICAÇÃO DE POLINUCLEOTÍDEO UTILIZADOS NA TRANSFORMAÇÃO ESTÁVEL DE SOJA PARA A SUBSTITUIÇÃO DO PROMOTOR EPSPS1 DE SOJA DE -798 BP PELO PROMOTOR DA UBQ DE SOJA.
[0438] O promotor de RNA nuclear pequeno U6 de soja, GM-U6-13.1 (SEQ ID NO: 469), foi utilizado para expressar RNAs guia (EPSPS-CR1 e EPSPS- CR6 de soja, ou EPSPS-CR1 e EPSPS-CR7 de soja) para direcionar a nuclease Cas9 para os sítios-alvo genômicos designados (Tabela 41). Um dos sítios-alvo (soja-EPSPS-CR1) estava localizado no éxon2 conforme descrito no Exemplo 24, e um segundo sítio alvo (soja-EPSPS-CR6 ou soja-EPSPS-CR7) estava localizado próximo da extremidade 5' de -798bp do promotor EPSPS1 nativo. Um cassete de expressão de endonuclease Cas9 códon-otimizada para soja e um cassete de expressão de RNA guia foram ligados nos plasmídeos de expressão QC878/RTW1201 (SEQ ID NO: 470/505) ou QC878/RTW1202 (SEQ ID NO: 470/506) que foram coentregues com um molde de modificação de polinucleotídeo, RTW1192A (SEQ ID NO: 507). O molde de modificação de polinucleotídeo continha 1369 bp do promotor do gene UBQ de soja, 47bp 5’-UTR e íntron1 532bp do UBQ. A substituição do promotor EPSPS1 de soja específica pelo promotor UBQ de soja pode ser conseguida com o sistema RNA guia/Cas por recombinação homóloga entre o DNA genômico e o molde de modificação de polinucleotídeo, resultando no aumento da expressão do gene EPSPS1 em soja nativa ou modificada. TABELA 41 CASSETES DE EXPRESSÃO RNA GUIA/ENDONUCLEASE CAS9 E MOLDE DE MODIFICAÇÃO DE POLINUCLEOTÍDEO UTILIZADOS NA TRANSFORMAÇÃO ESTÁVEL DE SOJA PARA A SUBSTITUIÇÃO DO PROMOTOR EPSPS1 DE SOJA DE -798 PB PELO PROMOTOR DA UBQ DE SOJA.
C. DETECÇÃO DA NHEJ SÍTIO-ESPECÍFICA MEDIADA PELO SISTEMA RNA GUIA/CAS9 EM SOJA ESTAVELMENTE TRANSFORMADAS.
[0439] NHEJ sítio-específica foi detectada conforme descrito no Exemplo 24C, usando os primers/sondas de qPCR listados na Tabela 42. TABELA 42 PRIMERS/SONDAS UTILIZADOS NA ANÁLISE DE QPCR DE EVENTOS DE SOJA TRANSGÊNICOS.
D. DETECÇÃO DA SUBSTITUIÇÃO DO PROMOTOR DO PROMOTOR EPSPS1 DE SOJA PELO PROMOTOR DO UBQ DE SOJA USANDO O SISTEMA RNA GUIA/ENDONUCLEASE CAS9.
[0440] A fim de substituir o promotor EPSPS1 de soja pelo promotor UBQ de soja no gene EPSPS1 nativo, foram utilizados dois vetores de expressão RNA guia em cada experimento de transformação da soja conforme mostrado na Tabela 41. O vetor QC878 (SEQ ID NO: 470) era direcionado ao éxon2 e o RTW1201 (SEQ ID NO: 505) ou RTW1202 (SEQ ID NO: 506) era direcionado à extremidade 5' do promotor -798 bp de soja. A clivagem dupla do gene EPSPS1 de soja com os dois sistemas RNA guia/Cas resultou na remoção do fragmento promotor EPSPS1 nativo/5’-UTR- Éxon1/Íntron1/Éxon2 parcial no gene EPSPS1 nativo. Ao mesmo tempo, um molde de modificação de polinucleotídeo RTW1192A (SEQ ID NO: 507) foi coentregue nas células de soja. Este DNA RTW1192A continha 1369 bp do promotor UBQ de soja, seu 5-UTR de 47bp e íntron1 UBQ de 532bp em frente do Éxon1-Íntron1-Éxon2 modificado do EPSPS1. A recombinação homóloga entre o molde de modificação de polinucleotídeo e o DNA genômico resultou na substituição de promotor EPSPS1/5'UTR pelo promotor UBQ/5'UTR/Íntron1 de soja, e as modificações de aminoácidos desejadas foram evidenciadas pela análise de PCR. Os ensaios de PCR com o par de primers WOL1005/WOL1006 (SEQ ID NO: 511 e 512) e o par de primers WOL1003/WOL1004 (SEQ ID NO: 501 e 502) foram usados para detectar os eventos de substituição de promotores.
EXEMPLO 27 DELEÇÕES DO ELEMENTO FACILITADOR ( ENHANCER ) UTILIZANDO O SISTEMA RNA GUIA/ENDONUCLEASE CAS
[0441] O sistema RNA guia/endonuclease Cas descrito na presente divulgação pode ser utilizado para permitir a deleção de um elemento promotor a partir de um gene transgênico (pré-existente, artificial) ou gene endógeno. Elementos promotores, tal como elementos facilitadores (enhancer), são muitas vezes introduzidos em múltiplas cópias (3X = 3 cópias do elemento facilitador, Figura 33) em cassetes de expressão de genes que induzem promotores para testar genes de características ou para a produção de plantas transgênicas expressando características específicas. Elementos facilitadores (enhancers) podem ser, mas não estão limitados a, um elemento facilitador 35S (Benfey et al, EMBO J., agosto de 1989; 8 (8): 2195-2202, SEQ ID NO: 513). Em algumas plantas (eventos), os elementos facilitadores (enhancers) podem causar um fenótipo indesejado, yield drag (efeito de diminuição do rendimento em relação ao tipo convencional ou não transgênico), ou alteração no padrão de expressão da característica de interesse que não é desejada. Por exemplo, conforme mostrado na Figura 33, uma planta compreendendo múltiplos elementos facilitadores (enhancer) (3 cópias, 3X) em seu DNA genômico situado entre dois cassetes de características (característica A em característica B) foi caracterizado para mostrar um fenótipo indesejado. É desejável remover as cópias adicionais do elemento facilitador, mantendo os cassetes de genes de característica intactos em suas localizações genômicas integradas. O sistema RNA guia/endonuclease Cas descrito na presente divulgação pode ser usado para remover o elemento facilitador (enhancer) indesejado a partir do genoma da planta. Um RNA de guia pode ser concebido para conter uma região de direcionamento variável como direcionada a um sítio alvo de 12-30 bp adjacente a um facilitador (enhancer) NGG (PAM). Se uma sequência sítio alvo da endonuclease Cas está presente em todas as cópias dos elementos facilitadores (enhancers) (tal como os três sítios-alvo da endonuclease Cas 35S-CRTS1 (SEQ ID NO: 514), 35S-CRTS2 (SEQ ID NO: 515), 35S-CRTS3 (SEQ ID NO: 516)), apenas um RNA guia é necessário para guiar a endonuclease Cas para os sítios alvo e induzir uma quebra de dupla fita em todos os elementos facilitadores (enhancers) de uma só vez. A endonuclease Cas pode fazer clivagem para remover um ou vários facilitadores (enhancers). O sistema RNA guia/endonuclease Cas pode ser introduzido por Agrobacterium ou bombardeamento de partículas. Alternativamente, dois RNAs-guia diferentes (direcionados a dois sítios-alvo genômico diferentes) podem ser utilizados para remover todos os elementos facilitadores 3X a partir do genoma de um organismo, de uma maneira semelhante à remoção de um promotor (transgênico ou endógeno) descrito na presente divulgação.
EXEMPLO 28 MODIFICAÇÕES DE SEQUÊNCIAS REGULADORAS UTILIZANDO O SISTEMA RNA GUIA/ENDONUCLEASE CAS A. MODIFICAÇÃO DE SÍTIOS DE POLIUBIQUITINAÇÃO
[0442] Há sítios de ubiquitinação definidos em proteínas para serem degradadas e eles foram encontrados dentro da proteína EPSPS de milho usando programas de computador dedicados (por exemplo, CKSAAP_UbSite (Ziding Zhang's Laboratory of Protein Bioinformatics College of Biological Sciences, China Agricultural University, 100193 Pequim, China). Um dos sítios de poliubiquitinação selecionado dentro da sequência codificante de EPSPS de milho é apresentado na Figura 34A e a sua sequência de aminoácidos de assinatura é comparada com os sítios EPSPS equivalentes de outras plantas (Figura 34A). O aminoácido lisina (K) na posição 90 (altamente conservado em outras espécies de plantas) foi selecionado como um potencial sítio de poliubiquitinação da proteína EPSPS. O molde de modificação de polinucleotídeo (referido como molde K90R do polinucleotídeo EPSPS de milho) utilizado para editar o locus epsps é listados como SEQ ID NO: 517. Este molde permitiu editar o locus epsps para conter a substituição de lisina (K) por arginina (R) na posição 90 (K90R) e duas substituições TIPS adicionais nas posições 102 e 106 (Figura 34B e 34C). O DNA genômico de milho foi editado usando o sistema RNA guia/endonuclease Cas descrito na presente divulgação e as plantas T0 foram produzidas conforme descrito no presente. As plantas T0 que continham as modificações de nucleotídeos, tal como especificado pelas informações fornecidas no molde K90R (Figura 34C), foram selecionadas por métodos de genotipagem descritos no presente. Plantas F1 EPSPS-K90R podem ser selecionadas para um elevado teor de proteína devido a uma mais taxa de degradação lenta da proteína EPSPS.
B. EDIÇÃO DE ELEMENTOS ÍNTRON PARA INTRODUZIR ELEMENTOS FACILITADORES (ENHANCERS) MEDIADOS PELO ÍNTRON (IME)
[0443] A atividade transcricional do gene EPSPS nativo pode ser modulada por facilitadores (enhancers) transcricionais posicionados nas proximidades de outros elementos de controle da transcrição. Os íntrons são conhecidos por conterem elementos facilitadores (enhancers) que afetam a taxa global de transcrição a partir de promotores nativos, incluindo o promotor do EPSPS. Por exemplo, o primeiro íntron da 5'UTR da ubiquitina de milho confere um elevado nível de expressão em plantas monocotiledôneas, tal como especificado no pedido de patente WO 2011/156535 A1. Um motivo de pontecialização de íntron CATATCTG (Figura 35 A), também referido como um elemento facilitador mediado por íntron (IME) foi identificado pela análise do proprietário (WO2011/156535 A1, publicada em 15 de dezembro de 2011) e os sítios de nucleotídeos apropriados na extremidade 5’-terminal do primeiro íntron EPSPS foram selecionados para a edição de modo a introduzir os elementos facilitadores (enhancers) mediados por íntron (IME) (Figura 35B-35C). O molde de modificação de polinucleotídeo (referido como molde IME do polinucleotídeo EPSPS de milho) está listado como SEQ ID NO: 518. O modelo de modificação do polinucleotídeo permite a edição do locus epsps para conter três IMEs (dois em uma fita do DNA, e um na fita reversa) no primeiro íntron do EPSPS e as substituições TIPS nas posições 102 e 106. O DNA genômico de plantas de milho foi editado usando o sistema RNA guia/endonuclease Cas descrito na presente divulgação. As plantas de milho contendo a sequência codificante de EPSPS editada com IME podem ser selecionadas por genotipagem das plantas T0 e podem ser adicionalmente avaliadas quanto ao elevado teor de proteína EPSPS-TIPS devido à taxa de transcrição aumentada do gene EPSPS nativo.
EXEMPLO 29 MODIFICAÇÕES DE SÍTIOS DE SPLICING E/OU INTRODUÇÃO DE SÍTIOS DE SPLICING UTILIZANDO O SISTEMA RNA GUIA/ENDONUCLEASE CAS
[0444] Em células de milho, o processo de splicing é afetado por sítios de splicing nos locais de junção éxon-íntron, como ilustrado na produção de mRNA EPSPS (Figura 36A-36B). FIG. 36A mostra a análise de pré-mRNA de EPSPS amplificado (cDNA painel esquerdo). A pista I4 na Figura 36A mostra a amplificação do pré-mRNA EPSPS contendo o 3° íntron que não sofreu splicing, resultando em um fragmento diagnóstico de 804 bp indicativo para um evento que sofreu splicing alternativo. As pistas E3 e F8 mostram fragmentos EPSPS amplificados por PCR resultantes de íntrons que sofreram splicing regular. Os fragmentos de diagnóstico, tal como o fragmento de 804 bp da pista E4 não são amplificados a menos que o cDNA seja sintetizado (como é evidenciado pela ausência de bandas nas pistas E3, E4, e F8 compreendendo RNA total (mostrado no painel RNA total ao lado direito da Fig. 36A). O sítio de splicing canônico no gene EPSPS de milho e os genes a partir de outras espécies é o AGGT, enquanto outros sítios de splicing variantes (alternativos) podem levar ao processamento aberrante das moléculas de pré-mRNA. A sequência codificante de EPSPS contém diversos sítios de splicing alternativo que podem afetar a eficiência global do processo de maturação do pré-mRNA e, dessa forma, limitar o acúmulo de proteína EPSPS nas células de milho. A fim de limitar a ocorrência de eventos de splicing alternativo durante a expressão do gene EPSPS, um sistema RNA guia/endonuclease Cas, tal como descrito na presente divulgação, pode ser utilizado para editar sítios de splicing. O sítio de splicing na junção do segundo íntron EPSPS nativo e o terceiro éxon é AGTT e pode ser editado de modo a introduzir o sítio de splicing AGGT canônico nesta junção (Figura 37). A substituição T> G não afeta o quadro de leitura aberto de EPSPS nativo e não altera a sequência de aminoácidos do EPSPS. O molde de modificação de polinucleotídeo (referido como molde Tspliced do polinucleotídeo EPSPS de milho) está listado como SEQ ID NO: 519. Este molde de modificação de polinucleotídeo permite a edição do locus epsps para conter o sítio de splicing AGGT canônico no sítio de junção do 2° íntron-3° éxon e as substituições TIPS nas posições 102 e 106. Plantas de milho são editadas usando os procedimentos descritos na presente divulgação. As Plantas de milho F1 EPSPS-Tspliced podem ser avaliadas pelo aumento do teor de proteína, devido ao aumento da produção de mRNA da EPSPS funcional.
EXEMPLO 30 ENCURTANDO A MATURIDADE PELA MANIPULAÇÃO DO FENÓTIPO DE FLORAÇÃO PRECOCE COM A REGULAÇÃO NEGATIVA DE ZMRAP2.7 USANDO O SISTEMA RNA GUIA/ENDONUCLEASE CAS
[0445] A maturidade global da planta pode ser encurtada pela modulação do fenótipo de tempo de floração de plantas pela modulação do gene ZmRap2.7 de milho. O encurtamento da maturidade da planta pode ser obtido por um fenótipo de floração precoce.
[0446] RAP2.7 é um acrônimo para Relacionado à APETALA 2.7. RAPL significa RAP2.7-LIKE e RAP2.7 funciona como um fator de transcrição da família AP2 que suprime a transição floral (SEQ ID NOs: 520 e 521). O fenótipo transgênico para silenciar ou nocautear Rap2.7 resultou na floração precoce, redução da altura da planta, porem surpreendentemente desenvolveram espigas e pendão normalmente, em comparação com plantas tipo selvagem (pedido PCT/US14/26279 depositado em 13 de março de 2014). O sistema RNA guia /endonuclease Cas descrito na presente divulgação pode ser usado para direcionar e induzir uma quebra de dupla fita em um sítio alvo da endonuclease Cas localizado dentro do gene RAP2.7. As plantas que compreendem NHEJ dentro do gene RAP2.7 podem ser selecionadas e avaliadas quanto à presença de um fenótipo de maturidade encurtado.
EXEMPLO 31 MODULAÇÃO DA EXPRESSÃO DE UM GENE NPK1B DO MILHO PARA TOLERÂNCIA À GEADA MODIFICADA EM MILHO UTILIZANDO UM SISTEMA RNA GUIA/ENDONUCLEASE CAS
[0447] A Proteína Nicotiana Quinase1 (NPK1) é uma proteína quinase quinase quinase ativada por mitógeno que está envolvida na regulação da citocinese e transdução de sinal ao estresse oxidativo. O ZM-NPK1B (SEQ ID NO: 522 e SEQ ID NO: 523), que tem cerca de 70% de similaridade de aminoácidos com o NPKL3 do arroz foi testado quanto à tolerância à geada em plântulas de milho em estágio reprodutivo (Pedido PCT/US14/26279, depositado em 13 de março de 2014). As mudas de plantas transgênicas compreendendo um ZM-NPK1B conduzido por um promotor induzível Rab17, tinham tolerância à geada significativamente maior do que as mudas de controle e plantas de controle. O gene pareceu induzir após aclimatização no frio e durante o período de tratamento a -3 °C na maior parte dos eventos, mas em níveis baixos. (Pedido PCT/US14/26279 depositado em 13 de março de 2014).
[0448] Um sistema RNA guia/endonuclease Cas descrito na presente divulgação pode ser usado para substituir o promotor endógeno do gene NPK1 por um promotor induzível pelo estresse, tal como promotor de estágio RAB17 de milho (SEQ ID NO: 524; pedido PCT/US14/26279 depositado em 13 de março de 2014), modulando assim a expressão de NPK1B de uma forma responsiva ao estresse e fornecendo tolerância às geadas nas plantas de milho moduladas.
EXEMPLO 32 ENCURTANDO A MATURIDADE PELA MANIPULAÇÃO DO FENÓTIPO DE FLORAÇÃO PRECOCE COM A EXPRESSÃO DE FTM1 USANDO OS SISTEMAS RNA GUIA/ENDONUCLEASE CAS
[0449] A maturidade global da planta pode ser encurtada pela modulação do fenótipo de tempo de floração das plantas pela expressão de um transgene. Tal modificação do fenótipo também pode ser alcançada com transgenes adicionais ou por meio de uma abordagem de reprodução.
[0450] FTM1 significa fator de transcrição da Transição Floral MADS (SEQ ID NOs: 525 e 526). É um fator de transcrição MADS Box e induz a transição floral. Após a expressão de FTM1 sob um promotor constitutivo, as plantas transgênicas apresentaram florescimento precoce e maturidade mais curta, mas surpreendentemente desenvolveram normalmente espigas e pendão, em comparação com as plantas tipo selvagem (pedido PCT/US14//26279 depositado em 13 de março de 2014).
[0451] As plantas de milho que expressam FTM1 demonstraram que pela manipulação de um gene de transição floral, o tempo até à floração pode ser significativamente reduzido, levando a um prazo encurtado até a maturidade da planta. Como a maturidade pode ser geralmente descrita como o tempo a partir da semeadura até a colheita, um prazo mais curto é desejado para garantir que a colheita possa terminar no ambiente climático seco continental norte (pedido PCT/US14/26279 depositado em 13 de março de 2014).
[0452] Um sistema de RNA guia/endonuclease Cas descrito na presente divulgação pode ser usado para introduzir elementos facilitadores (enhancers), tal como os enhancers CaMV35S (Benfey et al, EMBO J, agosto de 1989; 8(8):2195-2202, SEQ ID NO: 512), especificamente direcionados em frente ao promotor endógeno de FTM1, a fim de aumentar a expressão de FTM1 preservando ao mesmo tempo a maior parte do tecido e especificidades temporal da expressão nativa, proporcionando maturidade encurtada para as plantas moduladas.
EXEMPLO 33 INSERÇÃO DE ELEMENTOS RESPONSIVOS INDUZÍVEIS EM GENOMAS VEGETAIS
[0453] Os sistemas de expressão induzíveis controlados por um estímulo externo são desejáveis para a análise funcional de proteínas celulares, bem como o desenvolvimento de característica como alterações no nível da expressão do gene de interesse que pode levar a uma modificação do fenótipo. Idealmente, tal sistema não só mediaria o estado “ligado/desligado” da expressão gênica, mas também permitiria a expressão limitada de um gene em um nível definido.
[0454] O sistema RNA guia/endonuclease Cas descrito na presente divulgação pode ser usado para introduzir componentes de sistemas repressor/operador/indutor para regular a expressão de genes de um organismo. Os sistemas repressor/operador/indutor e seus componentes são bem conhecidos no estado da técnica (US 2003/0186281 publicado em 2 de outubro de 2003; US 6.271.348). Por exemplo, mas não se limitando, componentes do sistema de resistência à tetraciclina (Tc) de E. coli foram encontrados para funcionar em células eucarióticas e têm sido utilizados para regular a expressão gênica (US 6.271.348). As sequências de nucleotídeos dos operadores tet de diferentes classes são conhecidas no estado da técnica, vide por exemplo: sequências do operador TET de classeA, classeB, classeC, classeD, classeE listados como SEQ ID NOS: 11-15 da US 6.271.348.
[0455] Os componentes de um sistema repressor responsivo à sulfonilureia (como o descrito na US 8.257.956, publicada em 4 de setembro de 2012) também podem ser introduzidos no genoma da planta para gerar um sistema repressor/operador/indutor na referida planta, onde polipeptídeos podem se ligar especificamente a um operador, em que a ligação específica é regulada por um composto sulfonilureia.
EXEMPLO 34 DELEÇÃO GÊNOMICA PARA A CARACTERIZAÇÃO DE LOCUS DE CARACTERÍSTICA
[0456] Mapeamento de característica no melhoramento de plantas muitas vezes resulta na detecção de regiões cromossômicas abrigando um ou mais genes que controlam a expressão de uma característica de interesse. Para características quantitativas, a expressão de uma característica de interesse é governada por múltiplos loci de característica quantitativa (QTL) de efeitos de tamanho, complexidade e significância estatística diferentes em um ou mais cromossomos. Um QTL ou haplótipo que está associado à supressão do número de fileiras de grãos na espiga de milho pode ser encontrado como sendo endêmico no germoplasma de reprodução elite. O efeito negativo deste QTL para o número de fileiras de grãos pode ser submetido ao mapeamento fino para uma resolução aceitável para desejar deleção seletiva deste segmento QTL negativo dentro do germoplasma receptor específico. Dois sítios de corte flanqueadores para o sistema polinucleotídeo guia/endonuclease Cas são concebidos através de haplotipos, marcador, e/ou contexto da sequência de DNA na região QTL alvo, e os dois sistemas do polinucleotídeo guia/endonuclease Cas são implantados simultaneamente ou sequencialmente para produzir o efeito desejado de duas quebras de dupla fita independentes (cortes) que liberam a região de intervenção a partir do cromossomo. As plantas que possuem o evento de deleção desejado podem resultar da reparação NHEJ das duas extremidades cromossômicas e eliminação da região de DNA interveniente. Ensaios para identificar estes indivíduos são baseados na presença das regiões marcadoras do DNA de flanqueamento, e ausência de marcadores de DNA interveniente. Foi criado um haplótipo proprietário para o ‘número de fileiras de grãos’ que não era existente no pool de germoplasma de reprodução elite previamente definido.
[0457] Uma abordagem alternativa seria a deleção de uma região contendo um gene fluorescente. A recuperação de plantas com, e sem, a fluorescência daria uma indicação aproximada da eficiência do processo de deleção.
EXEMPLO 35 TOLERÂNCIA À SECA MODIFICADA E EFICIÊNCIA DE USO DO NITROGÊNIO EM MILHO PELO SILENCIAMENTO GÊNICO OBTIDO PELA EXPRESSÃO DE UMA REPETIÇÃO INVERTIDA EM UM GENE ACS6 USANDO O SISTEMA RNA GUIA/ENDONUCLEASE CAS
[0458] Genes ACC (ácido 1-aminociclopropano-1-carboxílico) sintase (ACS) codificam enzimas que catalisam a etapa limitante na biossíntese de etileno. Uma construção contendo um dos genes ACS de milho, ZM-ACS6, em uma configuração de repetição invertida foi extensivamente testada para melhorar a tolerância ao estresse abiótico no milho (PCT/US2010/051358, depositado em 4 de outubro de 2010; PCT/US2010/031008, depositado em 14 de abril de 2010). Vários eventos de milho transgênico contendo uma sequência ZM-ACS6 RNAi conduzido por um promotor constitutivo da ubiquitina reduziu de emissão de etileno com um concomitante aumento na produtividade de grãos em relação aos controles tanto sob condições de seca quando condições de baixo teor de nitrogênio em campo (Plant Biotechnology Journal: 12 de março de 2014, DOI: 10,1111/pbi.12172).
[0459] Em um exemplo de realização, o sistema RNA guia/de endonuclease Cas pode ser utilizado em combinação com uma sequência polinucleotídica coentregue para inserir um fragmento do gene Zm-ACS6 invertido no genoma do milho, em que a inserção do fragmento do gene invertido permite a criação in vivo de uma repetição invertida (hairpin) e resulta no silenciamento do gene endógeno da biossíntese de etileno.
[0460] Em um exemplo de realização a inserção do fragmento do gene invertido pode resultar na formação de uma repetição invertida criada in vivo (hairpin) em um promotor nativo (ou alterado) de um gene ACS6 e/ou em uma extremidade 5 ' nativa do gene ACS6 nativo. O fragmento do gene invertido pode ainda compreender um íntron que pode resultar no silenciamento melhorado do gene biossintético de etileno.
EXEMPLO 36 PLANTAS T0 A PARTIR DO EXPERIMENTO RNA GUIA/CAS MULTIPLEXADO REALIZADO COM ALTA FREQUÊNCIA DE MUTAÇÕES BIALÉLICAS DEMONSTROU HERANÇA ADEQUADA DE ALELOS MUTAGENIZADOS NA POPULAÇÃO T1.
[0461] Este exemplo demonstra a elevada eficiência do sistema RNA guia/endonuclease Cas na geração de plantas de milho com múltiplos loci mutados e herança deles na(s) geração(ões) consecutiva(s).
[0462] Eventos mutantes gerados no experimento multiplexado descrito no Exemplo 4 foram utilizados para regenerar plantas T0 com mutações em 3 sítios-alvo diferentes: sítio alvo MS26Cas-2 (SEQ ID NO: 14), sítio alvo LIGCas-3 (SEQ ID NO: 18) e sítio alvo MS45Cas-2 (SEQ ID NO: 20).
[0463] Para a análise adicional, o DNA genômico total foi extraído a partir do tecido foliar de plantas T0 individuais. Os fragmentos abrangendo todos os 3 sítios-alvo foram amplificados por PCR utilizando pares de primers para os sítios alvo correspondentes, clonado no vetor de clonagem pCR2.1- TOPO (Invitrogen) e sequenciados. Tabela 43 mostra exemplos de mutações detectadas em quatro plantas T0 resultantes da NHEJ imprecisa em todos os loci relevantes quando múltiplos cassetes de expressão de RNA guia foram simultaneamente introduzidos, em duplexo (veja TS = Lig34/MS26) ou triplexo (TS = Lig34/MS26/MS45), respectivamente. TABELA 43 EXEMPLOS DE MUTAÇÕES EM LOCI ALVOS DE MILHO PRODUZIDOS POR UM SISTEMA RNA GUIA/CAS MULTIPLEXADO* NULO indica que ambos os alelos estão mutados ** INDEL indica mutação em um dos dois alelos. del = deleção, ins = inserção, bp = par de bases
[0464] Todas as plantas T0 foram cruzadas com plantas de milho tipo selvagem para produzir sementes T1. As progênies (T1) (32 plantas) da segunda planta T0 do experimento com triplexo (vide a Tabela 43, Lig34/MS26/MS45) foram analisadas por sequenciamento para avaliar frequências de segregação dos alelos mutantes. Nossos resultados demonstraram herança adequada e segregação esperada (1:1) dos alelos mutados, bem como entre alelos tipo selvagem e mutantes em todos os três sítios-alvo.
[0465] Os dados demonstram claramente que o sistema RNA guia/endonuclease Cas milho-otimizado descrito na presente divulgação pode ser utilizado para mutagenizar simultaneamente múltiplos loci cromossômicos e produzir progênies contendo os múltiplos nocautes gênicos herdados de forma estável.
EXEMPLO 37 CLIVAGEM DE DNA MEDIADA PELO RNA GUIA/ENDONUCLEASE CAS EM LOCI CROMOSSÔMICOS DE MILHO PODE ESTIMULAR A INSERÇÃO DE TRANSGENE MEDIADA PELA REPARAÇÃO POR RECOMBINAÇÃO HOMÓLOGA E AS PLANTAS DESCENDENTES T1 RESULTANTES DEMONSTRAM HERANÇA ADEQUADA DOS ALELOS MODIFICADOS.
[0466] Eventos de milho gerados no experimento descrito no Exemplo 5 foram usados para regenerar plantas T0. As plantas T0 foram regeneradas a partir de 7 calos de eventos independentes com amplificações corretas através de ambas as junções de DNA genômico transgênico e analisadas. O tecido foliar foi amostrado, o DNA genômico total extraído, e a amplificação por PCR em ambas as junções do transgene foi realizada utilizando os pares de primers (correspondendo às SEQ ID NOs: 98-101). Os produtos das amplificações resultantes foram sequenciados para a confirmação. As plantas com junções confirmadas em ambas extremidades foram adicionalmente analisados por hibridização Southern (Figura 38), utilizando duas sondas, genômica (fora da região HR1, SEQ ID: 533) e transgênica (dentro do gene MoPAT, SEQ ID: 534). A PCR, dados de sequenciamento e hibridização de Southern demonstraram que as plantas regeneradas a partir de dois dos 7 eventos (eventos 1 e 2) demonstraram integração do transgene perfeita, limpa e de cópia única no sítio alvo esperado através da recombinação homóloga. As plantas regeneradas a partir dos 5 eventos restantes continham cópias adicionais, cópias aleatoriamente integradas do transgene (eventos 4, 5 e 6) ou cópias rearranjadas do transgene integrado no sítio alvo (eventos 3 e 7).
[0467] Plantas T0 a partir dos eventos 1 e 2 foram cruzadas com plantas de milho tipo selvagem para produzir sementes T1. Noventa e seis plantas T1 a partir dos eventos 1 e 2 foram analisadas por hibridização Southern (utilizando as mesmas sondas citadas acima) para avaliar a frequência de segregação do locus transgênico. A análise Southern demonstrou herança adequada e segregação esperada (1:1) dos loci transgênico e tipo selvagem
[0468] Os dados demonstram claramente que os loci cromossômicos de milho clivados utilizando o sistema RNA guia/Cas otimizado para milho descrito na presente divulgação podem ser utilizados para estimular as vias de reparação HR para inserção sítio-específica de transgenes e produzir plantas descendentes que possuem o transgene inserido herdado de forma estável.
EXEMPLO 38 PRODUÇÃO DE LINHAGENS TRANSGÊNICAS DE MILHO COM CAS9 PRÉ-INTEGRADA PARA A ENTREGA TRANSITÓRIA DE RNA GUIA
[0469] Este exemplo descreve o racional, a produção e os testes com linhagens transgênicas de milho com um gene Cas9 integrado sob controle de promotores constitutivos e induzíveis por temperatura.
[0470] Conforme demonstrado no Exemplo 2, foi observada uma alta frequência de mutação quando a endonuclease Cas9 e RNA guia foram entregues como vetores de DNA por transformação usando a biobalística em células de embriões de milho imaturos. Quando a endonuclease Cas9 foi entregue como um vetor de DNA e o RNA guia como molécula de RNA, observou-se uma frequência de mutação reduzida (Tabela 44). TABELA 44 LEITURAS ( READS ) MUTANTES NO SÍTIO ALVO LIGCAS-3 PRODUZIDOS PELO RNA GUIA TRANSITORIAMENTE ENTREGUE.
[0471] A eficácia aumentada (aumento de leituras mutantes) pode ocorrer quando a proteína Cas9 e RNA guia estão presentes na célula ao mesmo tempo. Para facilitar a presença da endonuclease Cas9 e RNA guia na mesma célula, um vetor contendo um gene Cas9 constitutivo e condicionalmente regulado pode ser primeiro entregue para as células vegetais para permitir a integração estável no genoma da planta e estabelecer uma linhagem de planta que contém apenas o gene Cas9 no genoma. Em seguida, o RNA guia (único ou múltiplos) pode ser entregue como DNA ou RNA, ou uma combinação destes, para as células de embrião vegetal da linhagem contendo a versão integrada ao genoma do gene Cas9.
[0472] As linhagens de milho transgênicas (genótipo Hi-II) com um gene Cas9 integrado acionado por um promotor constitutivo (UBI) ou induzível (CAS) foram geradas através da transformação mediada por Agrobacterium. Além do gene Cas9, o vetor Agro também continha um marcador visível (END2:Cyan) e uma sequência de proteína fluorescente vermelha interrompida por um ligante longo de 318 bp (H2B:RF-FP) (conforme descrito na patente US 13/526.912, depositada em 19 de junho de 2012). A sequência de ligação eram flanqueadas com repetições diretas de 370 bp de comprimento para promover a recombinação e restauração de uma sequência funcional do gene RFP após a quebra de dupla fita dentro do ligante.
[0473] Linhagens com única cópia do transgene foram identificadas e utilizadas para outros experimentos. Duas construções de RNA guia visando 2 sítios diferentes (Tabela 45 na sequência ligante), foram entregues em células de embriões imaturos através de bombardeamento de partículas. A meganuclease variante LIG3-4 B65 com atividade de corte muito alta anteriormente utilizada em experimentos similares foi utilizada como controle positivo. TABELA 45 SÍTIOS ALVO NO LIGANTE RF-FP PARA O SISTEMA RNA GUIA/ENDONUCLEASE CAS.
[0474] Após a transformação, os embriões com o gene Cas9 sob controle do promotor da ubiquitina foram incubados a 28 °C enquanto os embriões com o gene Cas9 sob controle do promotor Cas induzível por temperatura foram incubados primeiro a 37 °C durante 15-20 horas e, em seguida, transferidos para 28 °C. Os embriões foram examinados 3-5 dias após o bombardeamento sob microscópio de luz. A expressão e a atividade da proteína Cas9 pré-integrada foi visualmente avaliada com base no número de células de embrião com a expressão da proteína RFP. Na maioria das linhagens, o sistema RNA guia/endonuclease Cas demonstrou reparo do RFP com frequência semelhante ou superior ao da meganuclease LIG3-4 B65, indicando um alto nível de expressão e atividade da proteína Cas9 nas linhagens transgênicas geradas.
[0475] Este exemplo descreve a produção de linhagens transgênicas com um gene Cas9 pré-integrado que podem ser usadas em experimentos adicionais para avaliar a eficiência da mutagênese em um sítio alvo após a entrega transitória de RNA guia sob a forma de moléculas de RNA.
EXEMPLO 39 O SISTEMA RNA GUIA/ENDONUCLEASE CAS OFERECE QUEBRAS DE DUPLA FITA AO LOCUS ALS DE MILHO E FACILITA A EDIÇÃO DO GENE ALS
[0476] Este exemplo demonstra que o sistema RNA guia/endonuclease Cas pode ser eficientemente utilizado para introduzir alterações específicas na sequência nucleotídica do gene ALS de milho resultando em resistência aos herbicidas da classe das sulfonilureias, especificamente, Clorsulfuron.
[0477] A proteína ALS endógena é o sítio-alvo de inibidores de herbicidas da classe sulfonilureia ALS. A expressão da versão da proteína ALS tolerante ao herbicida em culturas confere tolerância a esta classe de herbicidas. A proteína ALS contém peptídeos de trânsito N-terminais, e a proteína madura é formada após o transporte da sequência para o cloroplasto e subsequente clivagem do peptídeo de trânsito. A proteína madura começa no resíduo S41, resultando em uma proteína madura de 598 aminoácidos com um peso molecular previsto de 65 kDa (SEQ ID NO: 550). TABELA 46 SEQUÊNCIA DE AMINOÁCIDOS DEDUZIDA DE COMPRIMENTO TOTAL DA PROTEÍNA ZM- ALS (SEQ ID NO: 550)
[0478] A modificação de um único resíduo de aminoácido (P165A ou P165S, mostrado em negrito) na proteína acetoacetato sintase endógena do milho proporciona resistência a herbicidas no milho.
[0479] Existem dois genes ALS no milho, ALS1 e ALS2, localizados nos cromossomos 5 e 4, respectivamente. Conforme descrito no Exemplo 2, foram testadas construções expressando o RNA guia para 3 sítios- alvo diferentes dentro dos genes ALS. Com base no polimorfismo entre as sequências de nucleotídeos ALS1 e ALS2, sítios- alvo específicos para ALS1 e ALSCas-4 foram identificados e testados. A construção expressando o RNA guia para ALSCas-1 que visava ambos os genes ALS (ALS1 e ALS2) foi utilizada como controle (Tabela 47) TABELA 47 SÍTIOS-ALVO GENÔMICOS DA ALS DE MILHO TESTADOS. Sítio alvo no gene ALS1; nucleotídeos a negrito são diferentes no gene ALS2.
[0480] O experimento foi conduzido e frequência de mutação determinada tal como descrito no Exemplo 2 e os resultados são mostrados na Tabela 48. TABELA 48 FREQUÊNCIAS DE MUTAÇÕES NHEJ NOS DOIS SÍTIOS-ALVO DA ALS RECUPERADOS POR SEQUENCIAMENTO EM PROFUNDIDADE.
[0481] Os resultados demonstraram que o sistema RNA Guia/Cas9 para ALSCas-4 é capaz de mutar o gene ALS1 com um eficiência aproximadamente 90 vezes maior do que o gene ALS2. Portanto, o sítio alvo ALSCas-4 e o RNA guia correspondente foram selecionados para o experimento de edição do gene ALS.
[0482] Para produzir eventos editados, o molde de reparação de modificação do polinucleotídeo ALS foi coentregue usando bombardeamento de partículas como um plasmídeo com; uma região homóloga longa de 804 bp (SEQ ID NO: 538) ou como um fragmento de DNA de fita simples de 127 bp (SEQ ID NO: 539), o vetor de expressão com a endonuclease Cas9 milho- otimizada descrito no Exemplo 1, o cassete de expressão do RNA guia (direcionada para o sítio ALSCas-4), uma fusão moPAT-DsRed usada como marcador selecionável e visível, e genes de desenvolvimento (ODP-2 e WUS). Aproximadamente 1.000 embriões imaturos Hi-II foram bombardeadas com cada um dos dois moldes de reparação descritos acima. Quarenta dias após o bombardeamento, 600 eventos de calo jovens (300 para cada molde de reparação), foram coletados e transferidos para o meio de seleção com bialafos. Os embriões com eventos restantes foram transferidos para meio com 100 ppm de Clorsulfuron para seleção. Após um mês, os eventos que continuaram a crescer no meio de seleção com Clorsulfuron foram coletados e utilizados para a análise.
[0483] Uma pequena quantidade de tecido de calo de cada evento selecionado foi usada para extração do DNA total. Um par de primers genômicos fora do fragmento de DNA de reparação/doador (SEQ ID NO: 540 e SEQ ID NO: 541) foi usado para amplificar um fragmento do locus endógeno de ALS1 contendo a sequência alvo ALSCas4. Os produtos de amplificação da PCR foram purificados em gel, clonados no vetor de clonagem pCR2.1 TOPO (Invitrogen) e sequenciados. Um total de 6 eventos demonstrou a presença do alelo ALS1 especificamente editado, bem como um segundo alelo tipo selvagem ou mutado.
[0484] Estes dados indicam que um sistema de RNA guia/Cas pode ser usado com sucesso para criar um alelo ALS editado em milho. Os dados demonstram ainda que o sistema RNA guia/endonuclease Cas milho- otimizado descrito na presente divulgação pode ser utilizado para produzir plantas descendentes contendo edições de genes que são herdados de forma estável.
EXEMPLO 40 EDIÇÃO GÊNICA DO GENE ALS1 DE SOJA E O USO COMO UM MARCADOR DE TRANSFORMAÇÃO SELECIONÁVEL PARA A TRANSFORMAÇÃO DE SOJA COM O SISTEMA RNA GUIA/ENDONUCLEASE CAS A. DESENVOLVIMENTO DO SISTEMA RNA GUIA/ENDONUCLEASE CAS9 SÍTIO-ALVO NO GENE ALS1 DE SOJA.
[0485] Existem quatro genes ALS na soja (Glyma04g37270, Glyma06g17790, Glyma13g31470 e Glyma15g07860). Dois sítios-alvo do RNA guia/endonuclease Cas9 (ALS1-CR1 e ALS1-CR2 de soja) foram projetados próximo da prolina 178 do gene ALS1 de soja Glyma04g37270 (Tabela 49). TABELA 49 SÍTIOS ALVO DO RNA GUIA/ ENDONUCLEASE CAS9 NO GENE ALS1 DE SOJA
B. CASSETES DE EXPRESSÃO DO RNA GUIA, CASSETES DE EXPRESSÃO DA ENDONUCLEASE CAS9, MOLDES DE MODIFICAÇÃO DE POLINUCLEOTÍDEO PARA A INTRODUÇÃO DE ALTERAÇÕES DE AMINOÁCIDOS ESPECÍFICAS E USO DO ALELO ALS1 MODIFICADO P178S COMO MARCADOR SELECIONÁVEL DA TRANSFORMAÇÃO DE SOJA
[0486] O promotor de RNA nuclear pequeno U6 de soja, GM-U6- 13.1 (SEQ ID NO: 469), foi utilizado para expressar RNAs guia para direcionar a nuclease Cas9 para os sítios-alvo genômicos designados (Tabela 50). Um cassete de expressão da endonuclease Cas9 códon-otimizada para soja (SEQ ID NO: 489) e um cassete de expressão de RNA guia foram ligados em um primeiro plasmídeo que foi coentregue com um molde de modificação de polinucleotídeo. O molde de modificação de polinucleotídeo continha alterações de nucleotídeos específicas que codificam as alterações de aminoácidos no polipeptídeo ALS1 da soja (Glyma04g37270), tal como o P178S. Outras alterações de aminoácidos no polipeptídeo ALS1 também podem ser obtidas utilizando o sistema RNA guia/endonuclease Cas descrito na presente divulgação. As modificações de aminoácidos específicas podem ser conseguidas por recombinação homóloga entre o DNA genômico e o molde de modificação de polinucleotídeo facilitado pelo sistema RNA guia/endonuclease CAS. TABELA 50 CASSETES DE EXPRESSÃO RNA GUIA/CAS9 E MOLDE DE MODIFICAÇÃO DE POLINUCLEOTÍDEO UTILIZADOS NA TRANSFORMAÇÃO ESTÁVEL DE SOJA PARA AS MODIFICAÇÕES DE AMINOÁCIDOS ESPECÍFICAS DO GENE ALS1.
C. DETECÇÃO DA MUTAÇÃO P178S NO GENE ALS1 DE SOJA NO EVENTO SELECIONADO POR CLORSULFURON
[0487] A fim de editar aminoácidos específicos no gene ALS1 nativo (tal como a modificação P178S), um molde de modificação de polinucleotídeo, tal como RTW1026A (Tabela 50), foi coentregue com os cassetes de expressão RNA guia/Cas9 em células de soja. O Clorsulfuron (100 ppb) foi usado para selecionar os eventos com a edição P178S no gene ALS1 no processo de transformação da soja.
[0488] A modificação do gene ALS1 nativo através da recombinação homóloga do DNA mediada pelo sistema RNA guia/Cas9 foi determinada por análise de PCR específica. Um ensaio de PCR específica com o par de primers WOL900 (SEQ ID NO: 547) e WOL578 (SEQ ID NO: 548) foi utilizado para detectar modificação a P178S perfeita no gene ALS1 nativo. Um segundo par de primers WOL573 (SEQ ID NO: 549) e WOL578 (SEQ ID NO: 548) foi utilizado para amplificar alelos ALS1 da soja com a modificação P178S e NHEJ mutado. Um evento tolerante ao Clorsulfuron (MSE3772 -18) foi gerado a partir do experimento ALS1-CR2. O evento continha um alelo P178S modificado perfeito e um segundo alelo com uma deleção de 5 bp no sítio de clivagem ALS1-CR2 da soja. A clonagem Topo/sequenciamento foi utilizada para verificar as sequências. Nossos resultados demonstraram que um alelo ALS1 P178S modificado é suficiente para proporcionar seleção por Clorsulfuron no processo de transformação da soja.

Claims (14)

1. Método para modificar um sítio-alvo, no genoma de uma célula vegetal, cujo método é caracterizado por compreender o fornecimento de um RNA guia para uma célula vegetal possuindo uma endonuclease Cas9 estavelmente integrada, em que o referido RNA guia e a endonuclease Cas9 são capazes de formar um complexo que permite que a endonuclease Cas9 introduza uma quebra de dupla fita no referido sítio-alvo; em que a célula vegetal é uma célula de milho ou uma célula de soja.
2. Método, de acordo com a reivindicação 1, caracterizado por compreender, adicionalmente, o fornecimento de um molde de modificação de polinucleotídeo ou um DNA doador, para a planta em que o sítio alvo no genoma da célula vegetal é modificado pela adição de pelo menos um nucleotídeo, pela deleção de pelo menos um nucleotídeo, pela substituição de pelo menos um nucleotídeo ou qualquer combinação dos anteriores.
3. Método para modificar um sítio-alvo, no genoma de uma célula vegetal, caracterizado por compreender: a) o fornecimento um RNA guia para uma célula vegetal que possui uma endonuclease Cas9 estavelmente integrada, em que o referido RNA guia e endonuclease Cas9 são capazes de formar um complexo que permite que a endonuclease de Cas9 introduza uma quebra de dupla fita no referido sítio-alvo; e, b) a identificação de pelo menos uma célula vegetal que possui uma alteração no referido alvo, em que a modificação inclui pelo menos uma deleção ou substituição de um ou mais nucleotídeos no referido sítio-alvo; em que a célula vegetal é uma célula de milho ou uma célula de soja.
4. Método, de acordo com a reivindicação 2, caracterizado pelo RNA guia ser introduzido diretamente por bombardeamento de partículas ou transformação mediada por Agrobacterium.
5. Método, de acordo com a reivindicação 1, caracterizado pela endonuclease Cas9 ser otimizada para vegetal.
6. Método, de acordo com a reivindicação 1, caracterizado pelo sítio-alvo estar localizado na sequência gênica de um gene da acetolactato-sintase (ALS) e um gene da enolpiruvilchiquimato fosfato sintase (ESPSP).
7. Método para editar uma sequência de nucleotídeos, no genoma de uma célula vegetal, caracterizado pelo método compreender a introdução de pelo menos um RNA guia e pelo menos um molde de modificação de polinucleotídeo em uma célula vegetal que possui uma endonuclease Cas9 estavelmente integrada, em que a endonuclease Cas9 introduz uma quebra de dupla fita em um sítio-alvo no genoma da referida célula vegetal, e em que o referido molde de modificação de polinucleotídeo compreende pelo menos uma modificação nucleotídica da referida sequência de nucleotídeos; em que a célula vegetal é uma célula de milho ou uma célula de soja.
8. Método, de acordo com a reivindicação 7, caracterizado pela sequência de nucleotídeos ser um promotor, uma sequência reguladora, ou um gene de interesse.
9. Método para produzir uma planta EPSPS-mutante, caracterizado pelo referido método compreender: a) o fornecimento de um RNA guia e de um molde de modificação de polinucleotídeo a uma célula vegetal que possui uma endonuclease Cas9 estavelmente integrada, em que a endonuclease Cas9 introduz uma quebra de dupla fita em um sítio-alvo dentro de uma sequência genômica de EPSPS no genoma da planta, em que o referido molde de modificação de polinucleotídeo compreende pelo menos uma modificação nucleotídica da referida sequência genômica de EPSPS; b) a obtenção de uma planta a partir da célula vegetal de (a); c) a avaliação a planta de (b) para a presença da referida pelo menos uma modificação de nucleotídeo; e, d) a seleção de uma planta progênie que exibe a tolerância ao glifosato.
10. Método para produzir uma planta EPSPS-mutante, caracterizado pelo referido método compreender: a) o fornecimento de um RNA guia e de um molde de modificação de polinucleotídeo a uma célula vegetal que possui uma endonuclease Cas9 estavelmente integrada, em que a endonuclease Cas9 introduz uma quebra de dupla fita em um sítio-alvo dentro de uma sequência genômica de EPSPS no genoma da planta, em que o referido molde de modificação de polinucleotídeo compreende pelo menos uma modificação nucleotídica da referida sequência genômica de EPSPS; b) a obtenção de uma planta a partir da célula vegetal de (a); c) a avaliação a planta de (b) para a presença da referida pelo menos uma modificação de nucleotídeo; d) o rastreio de uma planta progênie de (c) que é desprovida do referido RNA guia e endonuclease Cas9; e opcionalmente, e) a seleção de uma planta que apresente resistência ao glifosato.
11. Método, de acordo com a reivindicação 7, caracterizado por pelo menos uma modificação de nucleotídeo não ser uma modificação no referido sítio-alvo.
12. Método para editar uma sequência de nucleotídeo, no genoma de uma célula vegetal, caracterizado pelo método compreender o fornecimento de um polinucleotídeo guia e opcionalmente, um molde de modificação de polinucleotídeo para uma célula vegetal que possui uma endonuclease Cas9 estavelmente integrada, em que o referido RNA guia e a endonuclease Cas9 são capazes de formar um complexo que permite que a endonuclease Cas9 introduza uma quebra de dupla fita em um sítio-alvo no genoma da referida célula, e em que o referido molde de modificação de polinucleotídeo compreende pelo menos uma modificação nucleotídica da referida sequência de nucleotídeos, em que a sequência de nucleotídeos no genoma de uma célula é selecionada a partir do grupo que consiste em uma sequência promotora, uma sequência terminadora, uma sequência de elemento regulador, um local de splicing, uma sequência codificante, um local de poliubiquitinação, um sítio intrônico e um motivo de reforço de íntron; em que a célula é uma célula de milho ou célula de soja.
13. Método para produzir em uma planta um locus de característica complexa, que compreende pelo menos duas sequências-alvo modificadas em uma região genômica de interesse, caracterizado por compreender: a) a seleção de uma região genômica em uma planta, em que a região genômica compreende uma primeira sequência-alvo e uma segunda sequência-alvo; b) o contato de pelo menos uma célula vegetal que possui uma endonuclease Cas9 estavelmente integrada com pelo menos um primeiro polinucleotídeo guia, um segundo polinucleotídeo guia, e, opcionalmente, pelo menos um DNA doador, em que o primeiro e o segundo polinucleotídeo guia e a endonuclease Cas9 podem formar um complexo que permite que a endonuclease Cas9 introduza uma quebra de dupla fita em pelo menos uma primeira e uma segunda sequência-alvo; c) a identificação de uma célula a partir de (b) que compreende uma primeira alteração na primeira sequência-alvo e uma segunda alteração na segunda sequência-alvo; e d) a recuperação de uma primeira planta fértil a partir da célula de (c), em que a referida planta fértil compreende a primeira alteração e a segunda alteração, em que a primeira alteração e a segunda alteração estão fisicamente ligadas.
14. Método, de acordo com a reivindicação 7, caracterizado pela edição da referida sequência de nucleotídeos tornar a referida sequência de nucleotídeos capaz de conferir resistência aos herbicidas para a referida célula.
BR112016003578-0A 2013-08-22 2014-08-20 Método para produzir uma semente ou planta progênie, método para obter uma planta progênie, métodos para modificar um sítio-alvo, método para modificar uma sequência de dna alvo, método para editar uma sequência de nucleotídeos, métodos para produzir uma planta epsps-mutante, método para editar uma sequência de nucleotídeo e método para produzir em uma planta um locus de característica complexa BR112016003578B1 (pt)

Applications Claiming Priority (11)

Application Number Priority Date Filing Date Title
US201361868706P 2013-08-22 2013-08-22
US61/868,706 2013-08-22
US201361882532P 2013-09-25 2013-09-25
US61/882,532 2013-09-25
US201461937045P 2014-02-07 2014-02-07
US61/937,045 2014-02-07
US201461953090P 2014-03-14 2014-03-14
US61/953,090 2014-03-14
US201462023239P 2014-07-11 2014-07-11
US62/023,239 2014-07-11
PCT/US2014/051778 WO2015026883A1 (en) 2013-08-22 2014-08-20 Plant genome modification using guide rna/cas endonuclease systems and methods of use

Publications (2)

Publication Number Publication Date
BR112016003578A2 BR112016003578A2 (pt) 2017-12-05
BR112016003578B1 true BR112016003578B1 (pt) 2024-05-07

Family

ID=

Similar Documents

Publication Publication Date Title
US10870859B2 (en) U6 polymerase III promoter and methods of use
US20220364107A1 (en) Agronomic trait modification using guide rna/cas endonuclease systems and methods of use
CA2954626A1 (en) Compositions and methods for producing plants resistant to glyphosate herbicide
US20230407417A1 (en) Marker assisted selection of traits for producing meal from brassica napus
US20230193304A1 (en) U6 polymerase iii promoter and methods of use
BR112016003578B1 (pt) Método para produzir uma semente ou planta progênie, método para obter uma planta progênie, métodos para modificar um sítio-alvo, método para modificar uma sequência de dna alvo, método para editar uma sequência de nucleotídeos, métodos para produzir uma planta epsps-mutante, método para editar uma sequência de nucleotídeo e método para produzir em uma planta um locus de característica complexa