FR3079832A1 - CHIMERIC PROTEIN HAVING PHOTOACTIVABLE RECOMBINASE ACTIVITY - Google Patents

CHIMERIC PROTEIN HAVING PHOTOACTIVABLE RECOMBINASE ACTIVITY Download PDF

Info

Publication number
FR3079832A1
FR3079832A1 FR1853046A FR1853046A FR3079832A1 FR 3079832 A1 FR3079832 A1 FR 3079832A1 FR 1853046 A FR1853046 A FR 1853046A FR 1853046 A FR1853046 A FR 1853046A FR 3079832 A1 FR3079832 A1 FR 3079832A1
Authority
FR
France
Prior art keywords
domain
recombinase
fusion protein
nucleic acid
activity
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
FR1853046A
Other languages
French (fr)
Inventor
Gael Yvert
Helene Duplus
Martin Spichty
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Centre National de la Recherche Scientifique CNRS
Universite Claude Bernard Lyon 1 UCBL
Ecole Normale Superieure de Lyon
Original Assignee
Centre National de la Recherche Scientifique CNRS
Universite Claude Bernard Lyon 1 UCBL
Ecole Normale Superieure de Lyon
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Centre National de la Recherche Scientifique CNRS, Universite Claude Bernard Lyon 1 UCBL, Ecole Normale Superieure de Lyon filed Critical Centre National de la Recherche Scientifique CNRS
Priority to FR1853046A priority Critical patent/FR3079832A1/en
Priority to PCT/EP2019/058829 priority patent/WO2019193205A1/en
Publication of FR3079832A1 publication Critical patent/FR3079832A1/en
Withdrawn legal-status Critical Current

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/62DNA sequences coding for fusion proteins
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/415Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from plants
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/102Mutagenizing nucleic acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/87Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
    • C12N15/90Stable introduction of foreign DNA into chromosome
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/10Transferases (2.)
    • C12N9/12Transferases (2.) transferring phosphorus containing groups, e.g. kinases (2.7)
    • C12N9/1241Nucleotidyltransferases (2.7.7)

Landscapes

  • Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Organic Chemistry (AREA)
  • Biomedical Technology (AREA)
  • Zoology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Wood Science & Technology (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • Molecular Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Biochemistry (AREA)
  • Microbiology (AREA)
  • Biophysics (AREA)
  • Plant Pathology (AREA)
  • Physics & Mathematics (AREA)
  • Medicinal Chemistry (AREA)
  • Mycology (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Botany (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Peptides Or Proteins (AREA)

Abstract

La présente invention concerne une protéine chimérique dont l'activité recombinase est photo-inductible. Elle concerne également l'utilisation d'une telle protéine pour contrôler, via une exposition à la lumière, des évènements de recombinaison dans une cellule hôte ou in vitro.The present invention relates to a chimeric protein whose recombinase activity is photoinducible. It also relates to the use of such a protein for controlling, via light exposure, recombination events in a host cell or in vitro.

Description

La présente invention concerne une protéine chimérique dont l’activité recombinase est photo-inductible. Elle concerne également l’utilisation d’une telle protéine pour contrôler, via une exposition à la lumière, des évènements de recombinaison dans une cellule hôte ou in vitro.The present invention relates to a chimeric protein whose recombinase activity is photo-inducible. It also relates to the use of such a protein to control, via exposure to light, recombination events in a host cell or in vitro.

Arriere-plan technologique de l’inventionTechnological background of the invention

L’essor des biotechnologies est largement basé sur la capacité à contrôler et modifier le patrimoine génétique des cellules. A cet effet, les recombinases comptent parmi les outils les plus efficaces en génie génétique, que ce soit pour manipuler des transgènes dans des cellules eucaryotes ou procaryotes.The development of biotechnology is largely based on the ability to control and modify the genetic heritage of cells. To this end, recombinases are among the most effective tools in genetic engineering, whether for manipulating transgenes in eukaryotic or prokaryotic cells.

Parmi les recombinases disponibles, la recombinase CRE est très largement utilisée dans différents modèles procaryotes et eucaryotes comme outil de manipulation de l’ADN in vitro et in vivo. Cette recombinase est issue du bactériophage PI et catalyse la réaction de recombinaison entre deux sites spécifiques LoxP. Le site LoxP, long de 34 paires de bases, comprend à ses extrémités deux régions palindromiques de 13 paires de bases chacune appelées RBE (Recombinase Binding Elément) qui encadrent une région orientée de 8 paires de bases, laquelle détermine la direction du site LoxP. Si les deux sites LoxP sont orientés dans le même sens, la recombinase provoque l’excision irréversible de la région se trouvant entre les deux sites. A contrario, si les deux sites LoxP sont orientés en sens inverse, la recombinase induit l’inversion réversible de la séquence se trouvant entre les deux sites.Among the available recombinases, CRE recombinase is very widely used in different prokaryotic and eukaryotic models as a tool for manipulating DNA in vitro and in vivo. This recombinase comes from the bacteriophage PI and catalyzes the recombination reaction between two specific LoxP sites. The LoxP site, 34 base pairs long, comprises at its ends two palindromic regions of 13 base pairs each called RBE (Recombinase Binding Element) which surround an oriented region of 8 base pairs, which determines the direction of the LoxP site. If the two LoxP sites are oriented in the same direction, the recombinase causes irreversible excision of the region between the two sites. Conversely, if the two LoxP sites are oriented in opposite directions, the recombinase induces the reversible inversion of the sequence located between the two sites.

De nombreuses techniques permettant l’activation conditionnelle du système CRE-LoxP ont été développées au cours des dernières décennies.Many techniques allowing the conditional activation of the CRE-LoxP system have been developed in recent decades.

L’une de ces techniques permet notamment la mutagénèse conditionnelle in vivo chez la souris et ainsi d’étudier l’effet de mutations qui seraient létales si elles étaient non tissu-spécifiques. Brièvement, les sites LoxP sont tout d’abord intégrés de part et d’autre d’un allèle du gène d’intérêt par recombinaison homologue dans des cellules souches embryonnaires. Ces cellules sont ensuite injectées dans un blastocyte de souris pour obtenir une lignée cellulaire qui sera croisée avec une autre lignée de souris transgéniques exprimant la recombinase CRE sous le contrôle d’un promoteur tissu-spécifique. Les animaux issus de ce croisement sont « doublement » transgéniques et présentent la mutation souhaitée uniquement dans le tissu cible. Ces animaux sont dit « mosaïques » en ce sens que leur patrimoine génétique n’est pas unitaire et diffère selon les cellules (Babinet and Cohen-Tannoudji, 2000, Med Sci (Paris), 16, 1, 31-42).One of these techniques allows in particular conditional mutagenesis in vivo in mice and thus to study the effect of mutations which would be lethal if they were not tissue-specific. Briefly, the LoxP sites are firstly integrated on both sides of an allele of the gene of interest by homologous recombination in embryonic stem cells. These cells are then injected into a mouse blastocyte to obtain a cell line which will be crossed with another line of transgenic mice expressing CRE recombinase under the control of a tissue-specific promoter. The animals resulting from this crossing are “doubly” transgenic and present the desired mutation only in the target tissue. These animals are called "mosaics" in the sense that their genetic heritage is not unitary and differs depending on the cells (Babinet and Cohen-Tannoudji, 2000, Med Sci (Paris), 16, 1, 31-42).

L’activation conditionnelle du système CRE-LoxP a également été utilisée chez la levure, et notamment S. cerevisae (Sauer, 1987, Mol. Cell. Biol. 7, 2087-2096). Le gène codant pour la recombinase CRE a été placé sous le contrôle du promoteur GAL1 dont l’activité est réprimée en présence de glucose et stimulée en présence de galactose. Il a été démontré que l’ajout de galactose dans le milieu de culture induisait l’excision du gène cible LEU2 encadré par deux sites LoxP de même orientation et préalablement intégrés dans le génome. La cinétique d’apparition de l’auxotrophie à la leucine montre que l’activité recombinase de la CRE dans la levure débute après huit heures d’induction en galactose pour être maximale après 24 heures. Cette cinétique a été améliorée en réalisant une pré-culture en présence de raffinose.The conditional activation of the CRE-LoxP system has also been used in yeast, and in particular S. cerevisae (Sauer, 1987, Mol. Cell. Biol. 7, 2087-2096). The gene coding for CRE recombinase was placed under the control of the GAL1 promoter, the activity of which is repressed in the presence of glucose and stimulated in the presence of galactose. The addition of galactose to the culture medium has been shown to induce excision of the target LEU2 gene flanked by two LoxP sites of the same orientation and previously integrated into the genome. The kinetics of onset of leucine auxotrophy show that the recombinase activity of CRE in yeast begins after eight hours of galactose induction and is maximal after 24 hours. These kinetics have been improved by carrying out a preculture in the presence of raffinose.

Un contrôle temporel de l’activité du système CRE-LoxP a également été obtenu en utilisant une recombinase CRE dont l’activité est dépendante d’un ligand (Metzger et al., 1995, Proc. Natl. Acad. Sci. 92, 6991-6995). Cette enzyme est obtenue par fusion du gène codant pour la recombinase CRE avec un cDNA du domaine de liaison au ligand (LBD) des récepteurs aux hormones stéroïdes et en particulier du récepteur humain à l’estrogène (hER). En absence de ligand (progestérone, estrogène), la recombinase CRE n’est pas ou peu active. A l’inverse, en présence du ligand, la protéine chimérique subit un changement conformationnel et présente une activité CRE recombinase. Ce système a été amélioré en introduisant différentes mutations dans le domaine LBD afin de remplacer les hormones naturelles par un stéroïde artificiel, le tamoxifène, et/ou d’augmenter la spécificité et l’efficacité d’activation (Indra et al., 1999, Nucleic Acids Res. 27, 43244327; Metzger and Chambon, 2001, Methods 24, 71-80).A temporal control of the activity of the CRE-LoxP system was also obtained using a CRE recombinase whose activity is dependent on a ligand (Metzger et al., 1995, Proc. Natl. Acad. Sci. 92, 6991 -6995). This enzyme is obtained by fusion of the gene coding for CRE recombinase with a cDNA of the ligand-binding domain (LBD) of steroid hormone receptors and in particular of the human estrogen receptor (hER). In the absence of ligand (progesterone, estrogen), the CRE recombinase is not or only slightly active. Conversely, in the presence of the ligand, the chimeric protein undergoes a conformational change and exhibits CRE recombinase activity. This system has been improved by introducing various mutations in the LBD domain in order to replace the natural hormones with an artificial steroid, tamoxifen, and / or to increase the specificity and the activation efficiency (Indra et al., 1999, Nucleic Acids Res. 27, 43244327; Metzger and Chambon, 2001, Methods 24, 71-80).

L’activité du système CRE-LoxP peut également être contrôlée par la température. Utilisant un poisson comme modèle d’étude, il a en effet été démontré que l’expression de la recombinase CRE pouvait être contrôlée par un «heat shock element» (HSE) (Kobayashi et al., 2013, Genes. N. Y. N 2000 51, 59-67). Le système HSE-CRE est ainsi activable par choc thermique (39°C pendant deux heures). La réponse obtenue est cependant variable en fonction des différents types cellulaires et en fonction du stade de développement durant lequel le choc thermique a eu lieu.The activity of the CRE-LoxP system can also be controlled by temperature. Using a fish as a study model, it has indeed been demonstrated that the expression of CRE recombinase can be controlled by a “heat shock element” (HSE) (Kobayashi et al., 2013, Genes. NY N 2000 51 , 59-67). The HSE-CRE system can thus be activated by thermal shock (39 ° C for two hours). The response obtained is however variable depending on the different cell types and depending on the stage of development during which the thermal shock took place.

Plusieurs systèmes CRE-LoxP inductibles par la lumière ont également été décrits.Several light-inducible CRE-LoxP systems have also been described.

L’un de ces systèmes est une adaptation du système CRE-ER rendu localement photo-activable par Γutilisation d’un inducteur photo-chimique, le cyclofène-OH. Ce substrat, dont la structure est proche du tamoxifène-OH, est entouré de groupes photolabiles. En réponse à une illumination, le ligand libéré de ces groupes peut se fixer au récepteur ER et ainsi activer la recombinase CRE. Ce système a été utilisé chez le poisson (Sinha et al., 2010, Zebrafish, 7, 199-204 ; Sinha et al., 2010, ChemBioChem 11, 653663) et chez la souris (Lu et al., 2012, Bioconjug. Chem. 23, 1945-1951). Le contrôle spatial et temporel de cette activation est toutefois particulièrement complexe en ce qu’il requiert de maîtriser la qualité, la quantité et la diffusion du ligand photoactivable.One of these systems is an adaptation of the CRE-ER system made locally photo-activatable by the use of a photo-chemical inducer, cyclofen-OH. This substrate, whose structure is close to tamoxifen-OH, is surrounded by photolabile groups. In response to illumination, the ligand released from these groups can bind to the ER receptor and thus activate CRE recombinase. This system has been used in fish (Sinha et al., 2010, Zebrafish, 7, 199-204; Sinha et al., 2010, ChemBioChem 11, 653663) and in mice (Lu et al., 2012, Bioconjug. Chem. 23, 1945-1951). Spatial and temporal control of this activation is however particularly complex in that it requires controlling the quality, quantity and diffusion of the photoactivatable ligand.

De la même manière, le système photo-inductible d’expression de gènes Light On a été utilisé pour contrôler l’expression de la recombinase CRE (Wang et al., 2012, Nat. Methods 9, 266-269). Ce système est basé sur l’utilisation d’un transactivateur qui, sous l’action de la lumière, se fixe à un promoteur transcriptionnel et l’active. Ce système présente cependant l’inconvénient de nécessiter des périodes d’illumination très longues (de l’ordre de 22 heures).Similarly, the photo-inducible Light On gene expression system has been used to control the expression of CRE recombinase (Wang et al., 2012, Nat. Methods 9, 266-269). This system is based on the use of a transactivator which, under the action of light, attaches to a transcriptional promoter and activates it. However, this system has the disadvantage of requiring very long lighting periods (of the order of 22 hours).

Un autre système Cre-LoxP photo-activable a également été décrit par Kawano et al. (Nat Chem Biol. 2016 Dec; 12(12): 1059-1064). Ce système utilise deux protéines de fusion, chacune comprenant un fragment de la recombinase CRE fusionné à un photocommutateur appelé « Magnet ». L’illumination du système provoque la dimérisation des « Magnets » et l’association des fragments de la recombinase CRE qui devient ainsi active.Another photo-activatable Cre-LoxP system has also been described by Kawano et al. (Nat Chem Biol. 2016 Dec; 12 (12): 1059-1064). This system uses two fusion proteins, each comprising a fragment of the CRE recombinase fused to a photoswitch called “Magnet”. The illumination of the system causes the dimerization of the "Magnets" and the association of the fragments of the CRE recombinase which thus becomes active.

Un système similaire de Cre-LoxP photo-activable a été décrit par Taslimi et al. (Nat Chem Biol. 2016 June;12(6):425-430). Ce système utilise également deux protéines de fusion, chacune comprenant un fragment de la recombinase CRE fusionné à un domaine de dimérisation photosensible appelé CRY2-CIB. L’illumination du système provoque la dimérisation des deux protéines chimériques et l’association des fragments de la recombinase CRE qui devient ainsi active.A similar photo-activatable Cre-LoxP system has been described by Taslimi et al. (Nat Chem Biol. 2016 June; 12 (6): 425-430). This system also uses two fusion proteins, each comprising a fragment of the CRE recombinase fused to a photosensitive dimerization domain called CRY2-CIB. The illumination of the system causes the dimerization of the two chimeric proteins and the association of the fragments of the CRE recombinase which thus becomes active.

Un autre système de Cre-LoxP photo-activable a été décrit dans des cellules humaines par Zhang et al. (Nature Methods. 2017 14(4):391-394). Ce système utilise un domaine protéique appelé PhoCl qui est clivé lors de la photoactivation, ainsi qu'un domaine de liaison au ligand des récepteurs aux hormones stéroïdes (SR). La protéine chimérique décrite appelée SR-PhoCl-Cre-PhoCl-SR est inactive à cause des domaines SR qui recrutent la protéine inhibitrice Hsp90 de la cellule hôte. Après illumination, le double clivage de la protéine libère les domaines SR et lève ainsi l'inhibition imposée par Hsp90.Another photo-activatable Cre-LoxP system has been described in human cells by Zhang et al. (Nature Methods. 2017 14 (4): 391-394). This system uses a protein domain called PhoCl which is cleaved during photoactivation, as well as a ligand binding domain of steroid hormone receptors (SR). The chimeric protein described called SR-PhoCl-Cre-PhoCl-SR is inactive because of the SR domains which recruit the inhibitor protein Hsp90 from the host cell. After illumination, the double cleavage of the protein releases the SR domains and thus lifts the inhibition imposed by Hsp90.

Compte-tenu de l’importance des recombinases en tant qu’outils en génie génétique, de nombreuses études ont été et sont menées pour en améliorer le contrôle. Les différents systèmes inductibles disponibles à ce jour restent cependant complexes, coûteux et/ou imprécis. Il demeure donc un réel besoin pour une technologie simple et efficace assurant le contrôle de l’activité recombinase dans une cellule individuelle ou un ensemble de cellules à un instant donné.Given the importance of recombinases as tools in genetic engineering, many studies have been and are being carried out to improve control. The various inducible systems available to date however remain complex, expensive and / or imprecise. There therefore remains a real need for a simple and effective technology ensuring the control of recombinase activity in an individual cell or a set of cells at a given time.

Résumé de l’inventionSummary of the invention

L’objectif de la présente invention est de fournir un système recombinase dont l’utilisation serait simple et peu coûteuse afin d’être adaptée à un usage industriel, tout en assurant un contrôle temporel et spatial précis de l’activité recombinase.The objective of the present invention is to provide a recombinase system, the use of which would be simple and inexpensive in order to be suitable for industrial use, while ensuring precise temporal and spatial control of the recombinase activity.

A cette fin, les inventeurs ont développé une recombinase photoactivable. Contrairement aux systèmes développés précédemment où la dépendance à la lumière est indirecte (par exemple via un activateur chimique photo-protégé ou un activateur transcriptionnel photo-inductible), la recombinase selon l’invention est directement activée par la lumière, simplifiant ainsi considérablement le procédé.To this end, the inventors have developed a photoactivable recombinase. Unlike the systems developed previously where the dependence on light is indirect (for example via a photo-protected chemical activator or a photo-inducible transcriptional activator), the recombinase according to the invention is directly activated by light, thus considerably simplifying the process. .

Ainsi, selon un premier aspect, la présente invention concerne une protéine de fusion comprenant un domaine recombinase fusionné à un domaine photorécepteur et dans laquelle l’activité recombinase est photoactivable.Thus, according to a first aspect, the present invention relates to a fusion protein comprising a recombinase domain fused to a photoreceptor domain and in which the recombinase activity is photoactivable.

De préférence, le domaine recombinase est fusionné en N-terminal au domaine photorécepteur.Preferably, the recombinase domain is fused in N-terminal to the photoreceptor domain.

De préférence, le domaine photorécepteur comprend, ou consiste en, un domaine LOV2 de phototropine, ou un variant ou dérivé de celui-ci. En particulier, le domaine photorécepteur peut être un dérivé d’un domaine LOV2, de préférence un domaine iLID (improved light inducible dimer), et de manière plus particulièrement préférée un domaine iLID dérivé du domaine LOV2 de la phototropine 1 d’Avena sativa. Selon certains modes particuliers, le domaine photorécepteur de la protéine de fusion est un domaine iLID présentant la séquence SEQ ID NO : 13 dans laquelle X représente un à trois acides aminés, de préférence X représente A, D, K, L, IL, VV, AI ou QPG.Preferably, the photoreceptor domain comprises, or consists of, a LOV2 domain of phototropin, or a variant or derivative thereof. In particular, the photoreceptor domain can be a derivative of a LOV2 domain, preferably an iLID domain (improved light inducible dimer), and more particularly an iLID domain derived from the LOV2 domain of phototropin 1 from Avena sativa. According to certain particular modes, the photoreceptor domain of the fusion protein is an iLID domain having the sequence SEQ ID NO: 13 in which X represents one to three amino acids, preferably X represents A, D, K, L, IL, VV , AI or QPG.

Le domaine recombinase est de préférence sélectionné dans le groupe constitué de la recombinase CRE (SEQ ID NO : 1), et des variants fonctionnels de celle-ci. En particulier, le domaine recombinase peut être un variant fonctionnel de la recombinase CRE comprenant, ou consistant en, la séquence SEQ ID NO : 2, ou une séquence présentant au moins 80% d’identité de séquence avec la SEQ ID NO : 2.The recombinase domain is preferably selected from the group consisting of CRE recombinase (SEQ ID NO: 1), and functional variants thereof. In particular, the recombinase domain can be a functional variant of the CRE recombinase comprising, or consisting of, the sequence SEQ ID NO: 2, or a sequence having at least 80% of sequence identity with SEQ ID NO: 2.

De manière plus particulièrement préférée, le domaine recombinase est un variant fonctionnel de la recombinase CRE, ledit variant comprenant, ou consistant en, une recombinase CRE de SEQ ID NO : 1 dans laquelle 18,19,26 ou 31 acides aminés ont été délétés en N-terminal, et présentant de manière optionnelle une substitution au niveau du résidu correspondant au résidu E340 de la SEQ ID NO : 1 et/ou une substitution au niveau du résidu correspondant au résidu D341 de la SEQ ID NO : 1More particularly preferably, the recombinase domain is a functional variant of the CRE recombinase, said variant comprising or consisting of a CRE recombinase of SEQ ID NO: 1 in which 18,19,26 or 31 amino acids have been deleted. N-terminal, and optionally having a substitution at the level of the residue corresponding to residue E340 of SEQ ID NO: 1 and / or a substitution at the level of the residue corresponding to residue D341 of SEQ ID NO: 1

La présente invention concerne également un acide nucléique codant pour une protéine de fusion selon l’invention, une cassette d’expression comprenant un acide nucléique selon l’invention, un vecteur d’expression comprenant un acide nucléique selon l’invention ou une cassette d’expression selon l’invention, une cellule hôte comprenant un acide nucléique, une cassette d’expression ou un vecteur d’expression selon l’invention.The present invention also relates to a nucleic acid coding for a fusion protein according to the invention, an expression cassette comprising a nucleic acid according to the invention, an expression vector comprising a nucleic acid according to the invention or a cassette d expression according to the invention, a host cell comprising a nucleic acid, an expression cassette or an expression vector according to the invention.

La présente invention concerne également un procédé pour induire une activité recombinase dans une cellule comprenantThe present invention also relates to a method for inducing recombinase activity in a cell comprising

- la fourniture d’une cellule exprimant une protéine de fusion selon l’invention ou l’insertion d’un acide nucléique, une cassette d’expression ou un vecteur d’expression selon l’invention dans une cellule etthe supply of a cell expressing a fusion protein according to the invention or the insertion of a nucleic acid, an expression cassette or an expression vector according to the invention in a cell and

- l’exposition de ladite cellule à une lumière capable d’activer le domaine photorécepteur de ladite protéine de fusion et donc l’activité recombinase.- the exposure of said cell to light capable of activating the photoreceptor domain of said fusion protein and therefore the recombinase activity.

La présente invention concerne également un procédé pour modifier un acide nucléique, comprenantThe present invention also relates to a method for modifying a nucleic acid, comprising

- la mise en contact d’une protéine de fusion selon l’invention, avec ledit acide nucléique d’intérêt comprenant un ou plusieurs sites de reconnaissance reconnus par le domaine recombinase de ladite protéine de fusion, etbringing a fusion protein according to the invention into contact with said nucleic acid of interest comprising one or more recognition sites recognized by the recombinase domain of said fusion protein, and

- l’exposition de la protéine de fusion et dudit acide nucléique à une lumière capable d’activer le domaine photorécepteur de ladite protéine de fusion et donc l’activité recombinase.- the exposure of the fusion protein and of said nucleic acid to light capable of activating the photoreceptor domain of said fusion protein and therefore of the recombinase activity.

Ce procédé peut notamment être utilisé pour moduler l’expression d’une molécule d’intérêt dans la cellule hôte, pour induire de la diversité génétique dans la cellule hôte ou pour modifier une activité biologique dans le cadre d’une thérapie génique.This method can in particular be used to modulate the expression of a molecule of interest in the host cell, to induce genetic diversity in the host cell or to modify a biological activity in the context of gene therapy.

La présente invention concerne en outre un kit comprenant une protéine de fusion, un acide nucléique, une cassette d’expression, un vecteur d’expression et/ou une cellule hôte selon l’invention, et optionnellement une source lumineuse capable d’activer le domaine photorécepteur de la protéine de fusion. Elle concerne également l’utilisation dudit kit pour induire une activité recombinase dans une cellule selon le procédé selon l’invention et/ou pour modifier un ou plusieurs acides nucléiques selon le procédé selon l’invention.The present invention further relates to a kit comprising a fusion protein, a nucleic acid, an expression cassette, an expression vector and / or a host cell according to the invention, and optionally a light source capable of activating the photoreceptor domain of the fusion protein. It also relates to the use of said kit for inducing recombinase activity in a cell according to the method according to the invention and / or for modifying one or more nucleic acids according to the method according to the invention.

BREVE DESCRIPTION DES DESSINSBRIEF DESCRIPTION OF THE DRAWINGS

Figure 1 : Système rapporteur permettant de détecter et quantifier l'activité CRE recombinase dans des cellules de levure. La partie gauche représente la construction génétique du système. La partie droite représente le phénotype d'une cellule de levure portant cette construction.Figure 1: Reporter system for detecting and quantifying CRE recombinase activity in yeast cells. The left side represents the genetic construction of the system. The right side represents the phenotype of a yeast cell carrying this construction.

Figure 2 : Représentation des résultats de test d'activité CRE recombinase. A) Lhistogramme montre des données produites par cytométrie en flux. Abscisse: intensité du signal FL1-H correspondant à la fluorescence GFP. Ordonnée: nombre de cellules ayant cette intensité de signal. Les données sont analysées pour déterminer un seuil de signal GFP permettant de départager les cellules OFF (faible signal) des cellules ON (fort signal). B) L'efficacité de recombinaison est la proportion de cellules ON dans une population de cellules ayant exprimé la protéine testée.Figure 2: Representation of CRE recombinase activity test results. A) The histogram shows data produced by flow cytometry. Abscissa: intensity of the FL1-H signal corresponding to the GFP fluorescence. Y-coordinate: number of cells with this signal strength. The data are analyzed to determine a GFP signal threshold making it possible to separate the OFF cells (weak signal) from the ON cells (strong signal). B) The recombination efficiency is the proportion of ON cells in a population of cells having expressed the protein tested.

Figure 3: Résultats du test d'activités de mutants CRE C-Ter. Barres d'erreur: écart-type, n = 3.Figure 3: Results of the CRE C-Ter mutant activity test. Error bars: standard deviation, n = 3.

Figure 4 : Résultats du test d'activités de mutants CRE N-Ter. Barres d'erreur: écart-type, n = 3.Figure 4: Results of the CRE N-Ter mutant activity test. Error bars: standard deviation, n = 3.

Figure 5 : Schéma de la construction des fusions iLID-CRE par recombinaison homologue. Cre/AA: séquence codante de la ou d'une portion de la protéine Cre ou du variant Cre_A340A341. TRP1: gène de S. cerevisiae permettant une sélection auxotrophique des levures transformées. Flèches noires: oligonucléotides (amorces) utilisés pour l'amplification. Etoile: mutation éventuellement portée sur l'oligonucléotide amont. PromGALl: promoteur du gène GAL1 de S. cerevisiae permettant d’induire ou de réprimer l’expression de la protéine d’intérêt.Figure 5: Diagram of the construction of iLID-CRE fusions by homologous recombination. Cre / AA: coding sequence for or a portion of the Cre protein or the Cre_A340A341 variant. TRP1: gene of S. cerevisiae allowing an auxotrophic selection of transformed yeasts. Black arrows: oligonucleotides (primers) used for amplification. Star: mutation possibly carried on the upstream oligonucleotide. PromGALl: promoter of the GAL1 gene of S. cerevisiae used to induce or suppress the expression of the protein of interest.

Figure 6 : Les fusions iLID-Crel9, iLID-Cre27, iLID-Cre32 et iLID-CreAA20 ont une activité CRE accrue après stimulation par la lumière. Noir (obscurité): sans illumination. Bleu (lumière): après illumination des cellules à 460 nm de 36,3 mW/cm2 durant 30 minutes. Barres d’erreur: écart-type, n = 5.Figure 6: The iLID-Crel9, iLID-Cre27, iLID-Cre32 and iLID-CreAA20 fusions have increased CRE activity after stimulation with light. Black (darkness): without illumination. Blue (light): after illumination of the cells at 460 nm at 36.3 mW / cm 2 for 30 minutes. Error bars: standard deviation, n = 5.

Figure 7 : Activité des fusions iLID-xn-Cre32. Séquence de la jonction: 24A et 24B: iLID-QIA-Cre32, 24F: iLID-QIK-Cre32, 241: iLID-QIL-Cre32, 25C: iLID-QIILCre32, 25F: iLID-QIVV-Cre32, 25X: iLID-QIAI-Cre32,26R: iLID-QIQPG-Cre32. Noir (obscurité): sans illumination. Bleu (lumière): en incluant une illumination à 460 nm de 2,2 mW/cm2 durant 90 minutes. Barres d’erreur: écart-type, n - 3.Figure 7: Activity of iLID-xn-Cre32 mergers. Junction sequence: 24A and 24B: iLID-QIA-Cre32, 24F: iLID-QIK-Cre32, 241: iLID-QIL-Cre32, 25C: iLID-QIILCre32, 25F: iLID-QIVV-Cre32, 25X: iLID-QIAI -Cre32,26R: iLID-QIQPG-Cre32. Black (darkness): without illumination. Blue (light): including an illumination at 460 nm of 2.2 mW / cm2 for 90 minutes. Error bars: standard deviation, n - 3.

Figure 8 : Effets de différentes conditions d’illumination dans le cadre d’une expression contrôlée par le promoteur GAL1. Noir: sans illumination. Bleu: en incluant une illumination à 460nm durant le temps indiqué (30, 60 ou 90) minutes et différentes intensités: 10, 20, 50,100 correspondant respectivement à 2,2, 5,1,17,9 et 36,3 mW/cm2. Barres d’erreur: écart-type, n = 3.Figure 8: Effects of different illumination conditions in the context of an expression controlled by the GAL1 promoter. Black: without illumination. Blue: by including an illumination at 460nm during the indicated time (30, 60 or 90) minutes and different intensities: 10, 20, 50,100 corresponding respectively to 2,2, 5,1,17,9 and 36,3 mW / cm2 . Error bars: standard deviation, n = 3.

Figure 9 : Effets de différentes conditions d’illumination dans le cadre d’une expression contrôlée par le promoteur MET17. Noir: sans illumination. Bleu: en incluant une illumination à 460 nm durant le temps indiqué (30, 90 ou 180) minutes et différentes intensités: 5%, 10% et 20% correspondant respectivement à 1, 2,2 et 5,1 mW/cm2. Barres d’erreur: écart-type, n - 3.Figure 9: Effects of different illumination conditions in the context of an expression controlled by the MET17 promoter. Black: without illumination. Blue: by including an illumination at 460 nm during the indicated time (30, 90 or 180) minutes and different intensities: 5%, 10% and 20% corresponding respectively to 1, 2.2 and 5.1 mW / cm2. Error bars: standard deviation, n - 3.

Figure 10: Comparaison de l’activité de fusion iLID-CreAA20 seule ou avec NLS. Noir (obscurité): sans illumination. Bleu (10%): en incluant une illumination à 460 nm de 2,2 mW/cm2 durant 180 minutes. Barres d’erreur: écart-type, n = 3.Figure 10: Comparison of iLID-CreAA20 fusion activity alone or with NLS. Black (darkness): without illumination. Blue (10%): by including an illumination at 460 nm of 2.2 mW / cm2 for 180 minutes. Error bars: standard deviation, n = 3.

Figure 11 : Comparaison du système selon l’invention avec le système nMag/pMag-Cre. Noir (obscurité): sans illumination. Bleu (lumière): en incluant une illumination à 460 nm de 2,2 mW/cm2 durant 180 minutes. Barres d’erreur: écart-type, n = 3.Figure 11: Comparison of the system according to the invention with the nMag / pMag-Cre system. Black (darkness): without illumination. Blue (light): by including an illumination at 460 nm of 2.2 mW / cm2 for 180 minutes. Error bars: standard deviation, n = 3.

Description detaillee de l’inventionDetailed description of the invention

Les inventeurs ont conçu une protéine chimérique douée d’une activité recombinase directement photoactivable. Ils ont pour cela fusionné un domaine recombinase à un domaine photorécepteur et ont démontré que l’activation par la lumière du domaine photorécepteur permettait d’activer le domaine recombinase. L’activité recombinase de cette protéine est donc directement dépendante de l’exposition à la lumière. En l’absence de lumière, la protéine de fusion selon l’invention n’a que peu ou pas d’activité recombinase. En revanche, les inventeurs ont démontré qu’une courte exposition à la lumière de cette protéine permettait d’induire fortement cette activité.The inventors have designed a chimeric protein endowed with a directly photoactivatable recombinase activity. They have therefore fused a recombinase domain to a photoreceptor domain and have demonstrated that the activation by light of the photoreceptor domain makes it possible to activate the recombinase domain. The recombinase activity of this protein is therefore directly dependent on exposure to light. In the absence of light, the fusion protein according to the invention has little or no recombinase activity. On the other hand, the inventors have demonstrated that a short exposure to light of this protein makes it possible to strongly induce this activity.

La protéine de fusion développée par les inventeurs constitue ainsi un outil génétique simple et efficace pour procéder à des modifications de l’ADN in vivo ou in vitro sous l’impulsion d’une simple stimulation lumineuse.The fusion protein developed by the inventors thus constitutes a simple and effective genetic tool for carrying out DNA modifications in vivo or in vitro under the impulse of a simple light stimulation.

Ainsi, selon un premier aspect, la présente invention concerne une protéine de fusion comprenant un domaine recombinase fusionné à un domaine photorécepteur.Thus, according to a first aspect, the present invention relates to a fusion protein comprising a recombinase domain fused to a photoreceptor domain.

Dans le présent document, les termes « peptide », « oligopeptide », « polypeptide » et « protéine » sont utilisés indifféremment et se réfèrent à une chaîne d’acides aminés reliés par des liaisons peptidiques, quel que soit le nombre de résidus d’acide aminé constituant cette chaîne.In this document, the terms "peptide", "oligopeptide", "polypeptide" and "protein" are used interchangeably and refer to a chain of amino acids linked by peptide bonds, regardless of the number of residues of amino acid constituting this chain.

Les acides aminés sont ici représentés par leur code à une lettre ou à trois lettres selon la nomenclature suivante: A: alanine (Ala); C: cystéine (Cys); D: acide aspartique (Asp); E: acide glutamique (Glu); F: phénylalanine (Phe); G: glycine (Gly); H: histidine (His); I: isoleucine (Ile); K: lysine (Lys); L: leucine (Leu); M: méthionine (Met); N: asparagine (Asn); P: proline (Pro); Q: glutamine (Gin); R: arginine (Arg); S: sérine (Ser); T: thréonine (Thr); V: valine (Val); W: tryptophane (Trp) et Y: tyrosine (Tyr). Les acides aminés constituant la protéine de fusion selon l'invention peuvent être de configuration L ou D, de préférence de configuration L.Amino acids are represented here by their one-letter or three-letter code according to the following nomenclature: A: alanine (Ala); C: cysteine (Cys); D: aspartic acid (Asp); E: glutamic acid (Glu); F: phenylalanine (Phe); G: glycine (Gly); H: histidine (His); I: isoleucine (Ile); K: lysine (Lys); L: leucine (Leu); M: methionine (Met); N: asparagine (Asn); P: proline (Pro); Q: glutamine (Gin); R: arginine (Arg); S: serine (Ser); T: threonine (Thr); V: valine (Val); W: tryptophan (Trp) and Y: tyrosine (Tyr). The amino acids constituting the fusion protein according to the invention can be of L or D configuration, preferably of L configuration.

Tel qu’utilisé ici, le terme « protéine de fusion » se réfère à une protéine artificielle comprenant au moins deux domaines protéiques fusionnés en une seule molécule, étant entendu que ces deux domaines ne se trouvent jamais associés dans une protéine naturelle. Chacun des domaines de cette protéine peut être un domaine naturel, c’est-à-dire une protéine naturelle ou un fragment de celle-ci, ou un domaine synthétique, c’est-à-dire un domaine protéique n’existant pas dans la nature ou dans une protéine naturelle. La protéine de fusion est le plus souvent le produit d’un gène de fusion dans lequel les séquences codantes des différents domaines sont en phase.As used herein, the term "fusion protein" refers to an artificial protein comprising at least two protein domains fused into a single molecule, it being understood that these two domains are never found associated in a natural protein. Each of the domains of this protein can be a natural domain, that is to say a natural protein or a fragment thereof, or a synthetic domain, that is to say a protein domain that does not exist in nature or in a natural protein. The fusion protein is most often the product of a fusion gene in which the coding sequences of the different domains are in phase.

La protéine de fusion selon l’invention peut présenter une ou plusieurs modifications post-traductionnelles et/ou une ou plusieurs modifications chimiques telles que des glycosylations, amidations, acylations, acétylations, ubiquitinations, phosphorylations ou méthylations. Afin d’augmenter la résistance de la protéine de fusion selon l’invention aux protéases, notamment dans le cas d’utilisation in vitro, des groupements protecteurs peuvent être ajoutés aux extrémités C- et/ou N-terminale. Par exemple, le groupement protecteur à l’extrémité N-terminale peut être une acylation ou une acétylation et le groupement protecteur à l’extrémité C-terminale peut être une amidation ou une estérification. La protéine selon l’invention peut également comprendre des liaisons pseudo-peptidiques remplaçant les liaisons peptidiques « classiques » CONH et conférant une résistance accrue aux protéases, telles que CHOH-CH2, NHCO, CH20, CH2CH2, CO-CH2, N-N, CH=CH, CH2NH, et CH2-S.The fusion protein according to the invention may have one or more post-translational modifications and / or one or more chemical modifications such as glycosylations, amidations, acylations, acetylations, ubiquitinations, phosphorylations or methylations. In order to increase the resistance of the fusion protein according to the invention to proteases, in particular in the case of use in vitro, protective groups can be added at the C- and / or N-terminal ends. For example, the protective group at the N-terminal end may be an acylation or an acetylation and the protective group at the C-terminal end may be an amidation or an esterification. The protein according to the invention can also comprise pseudo-peptide bonds replacing the “classic” CONH peptide bonds and conferring increased resistance to proteases, such as CHOH-CH2, NHCO, CH20, CH2CH2, CO-CH2, NN, CH = CH, CH2NH, and CH2-S.

Selon certains modes de réalisation, la protéine de fusion peut comprendre, outre le domaine recombinase fusionné à un domaine photorécepteur, un domaine peptidique additionnel en N-terminal ou C-terminal, de préférence en C-terminal. Ce domaine additionnel est de préférence fusionné au domaine recombinase de la protéine de fusion. Le domaine additionnel peut être un tag (ou étiquette) utile pour la purification ou l’immobilisation de la protéine de fusion. De tels tags sont bien connus de l’homme du métier et incluent par exemple les tags histidine (Hise), FLAG, HA (épitope dérivé de l’hémagglutinine du virus de la grippe), MYC (épitope dérivé de la proto-oncoprotéine humaine MYC) ou GST (glutathion-S-transférase). Optionnellement, la protéine de fusion peut comprendre un site de clivage par une protéase ou un agent chimique permettant de supprimer ce domaine additionnel.According to certain embodiments, the fusion protein can comprise, in addition to the recombinase domain fused to a photoreceptor domain, an additional peptide domain in N-terminal or C-terminal, preferably in C-terminal. This additional domain is preferably fused to the recombinase domain of the fusion protein. The additional domain can be a tag (or label) useful for the purification or immobilization of the fusion protein. Such tags are well known to those skilled in the art and include, for example, the tags histidine (Hise), FLAG, HA (epitope derived from hemagglutinin of the influenza virus), MYC (epitope derived from human proto-oncoprotein MYC) or GST (glutathione-S-transferase). Optionally, the fusion protein can comprise a site for cleavage by a protease or a chemical agent making it possible to suppress this additional domain.

Le domaine recombinase de la protéine de fusion selon l’invention peut être tout domaine protéique présentant une activité recombinase.The recombinase domain of the fusion protein according to the invention can be any protein domain exhibiting recombinase activity.

Tel qu’utilisé ici, le terme « recombinase » se réfère à une ADN recombinase sitespécifique, c’est-à-dire une ADN recombinase qui reconnaît et se lie à des régions cibles spécifiques, ou sites de reconnaissance, de l’ADN et catalyse une réaction de recombinaison entre les acides nucléiques de ces sites. Les sites de reconnaissance sont généralement de courtes séquences (d’environ 30 à 40 nucléotides) qui sont spécifiques de chaque recombinase. Ces enzymes présentent à la fois une activité endonucléase et une activité ligase et catalysent (i) la délétion d’un fragment d’ADN flanqué de deux sites de reconnaissance compatibles et dans la même orientation et/ou (ii) l’inversion d’un fragment d’ADN flanqué de deux sites de reconnaissance compatibles et dans des orientations opposées et/ou (iii) la translocation intra- ou intermoléculaire d'un fragment d'ADN flanqué d’un site de reconnaissance vers un autre site de reconnaissance compatible. L’activité recombinase d’une protéine peut être évaluée par toute méthode connue de l’homme du métier, notamment par la méthode exposée dans la partie expérimentale du présent document ou par l’un des nombreux tests décrits dans la littérature tels que par exemple l'apparition ou la disparition d'un signal rapportant la présence ou l'intégrité d'un acide nucléique ciblé par la recombinase, tel qu’une molécule d’ADN comprenant d'une part une séquence codant une protéine rapportrice telle que la beta-galactosidase, la GFP (Green Fluorescent Protein), la luciférase ou la protéine fluorescente mCherry, et d'autre part un ou plusieurs sites de reconnaissance de la recombinase, et dont le remaniement par la recombinase affecte l'expression de la protéine rapportrice (disparition ou apparition du signal).As used herein, the term "recombinase" refers to a site specific DNA recombinase, i.e. a DNA recombinase which recognizes and binds to specific target regions, or recognition sites, of DNA and catalyzes a recombination reaction between the nucleic acids of these sites. The recognition sites are generally short sequences (of around 30 to 40 nucleotides) which are specific for each recombinase. These enzymes exhibit both endonuclease activity and ligase activity and catalyze (i) the deletion of a DNA fragment flanked by two compatible recognition sites and in the same orientation and / or (ii) inversion of a DNA fragment flanked by two compatible recognition sites and in opposite directions and / or (iii) the intra- or intermolecular translocation of a DNA fragment flanked by a recognition site to another compatible recognition site . The recombinase activity of a protein can be evaluated by any method known to a person skilled in the art, in particular by the method described in the experimental part of this document or by one of the numerous tests described in the literature such as for example the appearance or disappearance of a signal reporting the presence or the integrity of a nucleic acid targeted by the recombinase, such as a DNA molecule comprising on the one hand a sequence encoding a reporter protein such as beta -galactosidase, GFP (Green Fluorescent Protein), luciferase or fluorescent protein mCherry, and on the other hand one or more recognition sites for recombinase, and whose rearrangement by recombinase affects the expression of the reporter protein ( disappearance or appearance of the signal).

Le domaine recombinase peut être une protéine recombinase ou un variant fonctionnel de celle-ci.The recombinase domain can be a protein recombinase or a functional variant thereof.

De nombreuses recombinases ont été décrites dans la littérature et sont utilisables dans la présente invention. Des exemples de recombinases comprennent, sans y être limités, la recombinase CRE du phage PI, la recombinase FLP de Saccharomyces cerevisiae, la recombinase R de Zygosaccharomyces rouxii, la recombinase HIN de Salmonella, la recombinase A de Kluyveromyces drosophilarium ou Kluyveromyces waltii, l’intégrase λ Int, la recombinase GIN du phage Mu, l’intégrase PhiC31, la résolvase Tn3, la recombinase TRE, la recombinase DRE (Anastassiadis et al. Disease Models & Mechanisms 2009 2: 508-515) et la beta-recombinase procaryote.Many recombinases have been described in the literature and can be used in the present invention. Examples of recombinases include, but are not limited to, phage PI recombinase CRE, Saccharomyces cerevisiae FLP recombinase, Zygosaccharomyces rouxii recombinase R, Salmonella HIN recombinase, Kluyveromyces drosophilarium or Kluyveromyces waltii recombinase A, λ Int integrase, phage Mu recombinase GIN, PhiC31 integrase, Tn3 resolvase, TRE recombinase, DRE recombinase (Anastassiadis et al. Disease Models & Mechanisms 2009 2: 508-515) and prokaryotic beta-recombinase.

De préférence, la protéine recombinase est choisie dans le groupe constitué de la recombinase CRE et de la recombinase FLP.Preferably, the protein recombinase is chosen from the group consisting of CRE recombinase and FLP recombinase.

La recombinase FLP est une enzyme dérivée du plasmide 2-micron de Saccharomyces cerevisiae et catalysant la réaction de recombinaison entre deux sites spécifiques FRT. Comme les sites LoxP, les sites FRT sont constitués d’une séquence asymétrique de 8 pb encadrée par deux bras palindromiques de 13 pb. Il existe de nombreuses variations/mutants des sites FRT et LoxP.The FLP recombinase is an enzyme derived from the 2-micron plasmid of Saccharomyces cerevisiae and catalyzing the recombination reaction between two specific FRT sites. Like LoxP sites, FRT sites consist of an asymmetric 8 bp sequence flanked by two 13 bp palindromic arms. There are many variations / mutants of the FRT and LoxP sites.

De manière plus particulièrement préférée, la protéine recombinase est la recombinase CRE. La recombinase CRE (Uniprot : P06956 ; NCBI GenelD : ΤΠΊΜΤ) est une tyrosine recombinase issue du bactériophage PI dont la séquence est présentée en SEQ ID NO : 1. Comme mentionné précédemment, cette enzyme catalyse la réaction de recombinaison entre deux sites spécifiques LoxP.More particularly preferably, the protein recombinase is the recombinase CRE. The CRE recombinase (Uniprot: P06956; NCBI GenelD: ΤΠΊΜΤ) is a tyrosine recombinase derived from the bacteriophage PI whose sequence is presented in SEQ ID NO: 1. As mentioned previously, this enzyme catalyzes the recombination reaction between two specific LoxP sites.

Le terme « variant fonctionnel » se réfère à une protéine dont la séquence diffère de la protéine parente par au moins une substitution, insertion ou délétion mais qui conserve une activité recombinase.The term “functional variant” refers to a protein whose sequence differs from the parent protein by at least one substitution, insertion or deletion but which retains recombinase activity.

De nombreux variants de protéines recombinases ont été décrits dans la littérature, en particulier des variants des recombinases CRE et FLP, et sont utilisables dans la présente invention. Ces variants peuvent être naturels ou synthétiques et présentent une activité recombinase telle que définie ci-dessus. Ils peuvent par exemple reconnaître d’autres sites de reconnaissance que l’enzyme sauvage (voir par exemple l’article de Santoro and Schultz, Proc Natl Acad Sci USA. 2002 Apr 2;99(7):4185-90 décrivant des variants de la recombinase CRE), présenter des caractéristiques améliorées telles qu’une thermostabilité accrue (voir par exemple les variants thermostables de la recombinase FLP décrits dans les articles de Buchholz et al., 1998, Nat Biotechnol. 16, 657-662 et Raymond and Soriano, 2007, PLoS ONE 2, el 62), une précision accrue (voir par exemple les variants de la recombinase CRE décrits dans la demande WO 2014/158593), une expression améliorée dans les cellules de mammifères (voir par exemple les variants de la recombinase CRE décrits dans le brevet US 6,734,295).Many variants of protein recombinases have been described in the literature, in particular variants of the CRE and FLP recombinases, and can be used in the present invention. These variants can be natural or synthetic and exhibit recombinase activity as defined above. They can, for example, recognize other recognition sites than the wild-type enzyme (see for example the article by Santoro and Schultz, Proc Natl Acad Sci USA. 2002 Apr 2; 99 (7): 4185-90 describing variants of recombinase CRE), have improved characteristics such as increased thermostability (see for example the thermostable variants of the FLP recombinase described in the articles by Buchholz et al., 1998, Nat Biotechnol. 16, 657-662 and Raymond and Soriano , 2007, PLoS ONE 2, el 62), increased precision (see for example the CRE recombinase variants described in application WO 2014/158593), improved expression in mammalian cells (see for example the variants of the CRE recombinase described in US Patent 6,734,295).

De préférence, les variants fonctionnels présentent au moins 80% d’identité de séquence avec la protéine recombinase parente, de manière plus particulièrement préférée au moins 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% ou 99% d’identité de séquence avec la protéine recombinase parente.Preferably, the functional variants have at least 80% of sequence identity with the parent protein recombinase, more particularly preferably at least 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% or 99% sequence identity with the parent protein recombinase.

Tel qu'utilisé ici, le terme identité de séquence ou identité se réfère au nombre (%) d'appariements (résidus d'acides aminés identiques) aux positions provenant d'un alignement de deux séquences polypeptidiques. L’identité de séquence est déterminée en comparant les séquences lorsqu'elles sont alignées de manière à maximiser le chevauchement et l'identité tout en minimisant les interruptions de séquence. En particulier, l'identité de séquence peut être déterminée en utilisant l'un quelconque des nombreux algorithmes d'alignement global ou local, en fonction de la longueur des deux séquences. Des séquences de longueurs similaires sont de préférence alignées en utilisant des algorithmes d’alignement global (e.g. Needleman & Wunsch, J. Mol. Biol 48:443, 1970) qui alignent les séquences de manière optimale sur toute la longueur, tandis que des séquences de longueurs sensiblement différentes sont de préférence alignées en utilisant un algorithme d’alignement local, par exemple l’algorithme de Smith et Waterman (Smith et Waterman, Adv. Appl. Math. 2:482,1981) ou l’algorithme d’Altschul (Altschul et al (1997) Nucleic Acids Res. 25:3389-3402 ; Altschul et al (2005) FEBS J. 272:5101-5109). L’alignement dans le but de déterminer le pourcentage d’identité de séquence d'acides aminés peut être réalisé par toute méthode connue de l’homme du métier, par exemple en utilisant un logiciel disponible sur des sites Internet tels que http: //blast.ncbi.nlm. nih.gov / ou http://www.ebi.ac.uk/Tools/emboss/. L’homme de l’art peut aisément déterminer les paramètres appropriés pour mesurer l’alignement. Aux fins de la présente invention, les valeurs de pourcentage d’identité de séquence d’acides aminés désignent des valeurs générées en utilisant le programme EMBOSS Needle d’alignement de séquences par paires qui crée un alignement global optimal de deux séquences en utilisant l’algorithme de Needleman-Wunsch dans lequel les paramètres sont les paramètres par défaut : Scoring matrix = BLOSUM62, Gap open = 10, Gap extend = 0.5, End gap penalty = false, End gap open = 10 and End gap extend = 0.5.As used herein, the term sequence identity or identity refers to the number (%) of matches (identical amino acid residues) at positions from an alignment of two polypeptide sequences. Sequence identity is determined by comparing the sequences when they are aligned to maximize overlap and identity while minimizing sequence interruptions. In particular, the sequence identity can be determined using any of the many global or local alignment algorithms, depending on the length of the two sequences. Sequences of similar length are preferably aligned using global alignment algorithms (eg Needleman & Wunsch, J. Mol. Biol 48: 443, 1970) which optimally align the sequences over the entire length, while sequences substantially different lengths are preferably aligned using a local alignment algorithm, for example the Smith and Waterman algorithm (Smith and Waterman, Adv. Appl. Math. 2: 482,1981) or the Altschul algorithm (Altschul et al (1997) Nucleic Acids Res. 25: 3389-3402; Altschul et al (2005) FEBS J. 272: 5101-5109). Alignment for the purpose of determining the percentage of amino acid sequence identity can be carried out by any method known to those skilled in the art, for example using software available on Internet sites such as http: // blast.ncbi.nlm. nih.gov / or http://www.ebi.ac.uk/Tools/emboss/. Those skilled in the art can readily determine the appropriate parameters for measuring the alignment. For the purposes of the present invention, percent values of amino acid sequence identity denote values generated using the EMBOSS Needle pair sequence alignment program which creates an optimal overall alignment of two sequences using the Needleman-Wunsch algorithm in which the parameters are the default parameters: Scoring matrix = BLOSUM62, Gap open = 10, Gap extend = 0.5, End gap penalty = false, End gap open = 10 and End gap extend = 0.5.

Alternativement, les variants fonctionnels d’une recombinase diffèrent de cette dernière par 1 à 50, 1 à 40, 1 à 30, 1 à 20, 1 à 10 ou 1 à 5 substitutions, insertions et/ou délétions d’acides aminés, de préférence par 1 à 50, 1 à 40, 1 à 30,1 à 20,1 à 10 ou 1 à 5 substitutions et/ou délétions d’acides aminés. En particulier, les variants fonctionnels d’une recombinase peuvent différer de cette dernière par 1 à 50, 1 à 40, 1 à 30, 1 à 20, 1 à 10 ou 1 à 5 substitutions d’acides aminés, de préférence par 1 ou 2 substitutions d’acides aminés.Alternatively, the functional variants of a recombinase differ from the latter by 1 to 50, 1 to 40, 1 to 30, 1 to 20, 1 to 10 or 1 to 5 substitutions, insertions and / or deletions of amino acids, preferably by 1 to 50, 1 to 40, 1 to 30.1 to 20.1 to 10 or 1 to 5 substitutions and / or deletions of amino acids. In particular, the functional variants of a recombinase can differ from the latter by 1 to 50, 1 to 40, 1 to 30, 1 to 20, 1 to 10 or 1 to 5 amino acid substitutions, preferably by 1 or 2 amino acid substitutions.

Le terme « substitution », tel qu’utilisé ici par rapport à une position ou à un acide aminé, signifie que l’acide aminé dans la position particulière a été remplacé par un autre acide aminé ou qu’un acide aminé différent de celui de la protéine de type sauvage est présent. Le terme « substitution » peut désigner le remplacement d’un résidu d’acide aminé par un autre choisi parmi les 20 résidus d’acides aminés standard naturels, les résidus d’acides aminés naturels rares (par exemple hydroxyproline, hydroxylysine, allohydroxylysine, 6-N-méthyllysine, N-éthylglycine, N-méthylglycine, N éthylasparagine, allo-isoleucine, N-méthylisoleucine, N-méthylvaline, pyroglutamine, acide aminobutyrique, omithine) et d’acides aminés non naturels (par exemple norleucine, norvaline et cyclohexyl-alanine). De préférence, le terme « substitution » se réfère au remplacement d'un résidu d'acide aminé par un autre choisi parmi les 20 résidus d'acides aminés standards naturels (G, P, A, V, L, I, M, C, F, Y, W, H, K, R, Q, N, E, D, S et T). Dans le présent document, la terminologie suivante est utilisée pour désigner une substitution: D341A indique que le résidu d'acide aminé à la position 341 de SEQ ID NO : 1 (acide aspartique, D) est changé en alanine (A).The term "substitution", as used herein with respect to a position or an amino acid, means that the amino acid in the particular position has been replaced by another amino acid or that an amino acid different from that of wild type protein is present. The term “substitution” can designate the replacement of an amino acid residue with another chosen from among 20 natural standard amino acid residues, rare natural amino acid residues (for example hydroxyproline, hydroxylysine, allohydroxylysine, 6 -N-methyllysine, N-ethylglycine, N-methylglycine, N ethylasparagine, allo-isoleucine, N-methylisoleucine, N-methylvaline, pyroglutamine, aminobutyric acid, omithine) and unnatural amino acids (e.g. norleucine, norvaline and cyclohexyl alanine). Preferably, the term “substitution” refers to the replacement of an amino acid residue with another chosen from among the 20 natural standard amino acid residues (G, P, A, V, L, I, M, C , F, Y, W, H, K, R, Q, N, E, D, S and T). In this document, the following terminology is used to designate a substitution: D341A indicates that the amino acid residue at position 341 of SEQ ID NO: 1 (aspartic acid, D) is changed to alanine (A).

La ou les substitutions peuvent être des substitutions conservatives ou non conservatives. Le terme « substitution conservative » tel qu’utilisé dans ce document, se réfère à une substitution d’un résidu d’acide aminé par un autre qui présente des propriétés chimiques ou physiques similaires (taille, charge ou polarité). Des exemples de substitutions conservatives se font parmi (i) les acides aminés basiques (arginine, lysine et histidine), (ii) les acides aminés acides (acide glutamique et acide aspartique), (iii) les acides aminés polaires (glutamine et asparagine ou sérine, thréonine et tyrosine ), (iv) les acides aminés hydrophobes (méthionine, leucine, isoleucine et valine), (v) les acides aminés aromatiques (phénylalanine, tryptophane) et (vi) les petits acides aminés (glycine, alanine).The substitution (s) can be conservative or non-conservative substitutions. The term "conservative substitution" as used in this document refers to a substitution of one amino acid residue with another that has similar chemical or physical properties (size, charge or polarity). Examples of conservative substitutions are made among (i) basic amino acids (arginine, lysine and histidine), (ii) acid amino acids (glutamic acid and aspartic acid), (iii) polar amino acids (glutamine and asparagine or serine, threonine and tyrosine), (iv) hydrophobic amino acids (methionine, leucine, isoleucine and valine), (v) aromatic amino acids (phenylalanine, tryptophan) and (vi) small amino acids (glycine, alanine).

Selon certains modes de réalisation, le variant fonctionnel est obtenu en délétant des résidus en N-ter et/ou C-ter d’une recombinase de façon à obtenir un fragment comprenant au moins 100, 150, 200, 250 ou 300 acides aminés contigus de ladite recombinase, tout en conservant l'activité recombinase. De préférence, le fragment est obtenu par délétion de 1 à 50, 1 à 40, 1 à 30, 1 à 20, 1 à 10 ou 1 à 5 acides aminés en Nterminal et/ou C-terminal d’une protéine recombinase. Le nombre d’acides aminés qui peuvent être délétés sans affecter Γ activité recombinase dépend de la nature de la protéine et peut être aisément déterminé par l’homme du métier au moyen de techniques de routine.According to certain embodiments, the functional variant is obtained by deleting N-ter and / or C-ter residues of a recombinase so as to obtain a fragment comprising at least 100, 150, 200, 250 or 300 contiguous amino acids of said recombinase, while retaining the recombinase activity. Preferably, the fragment is obtained by deletion from 1 to 50, 1 to 40, 1 to 30, 1 to 20, 1 to 10 or 1 to 5 amino acids in Nterminal and / or C-terminal of a protein recombinase. The number of amino acids which can be deleted without affecting the recombinase activity depends on the nature of the protein and can be readily determined by those skilled in the art using routine techniques.

Dans un mode de réalisation particulier, le domaine recombinase est la recombinase CRE ou un variant fonctionnel de celle-ci.In a particular embodiment, the recombinase domain is the CRE recombinase or a functional variant thereof.

Le variant fonctionnel peut être tout variant de la recombinase CRE connu de l’homme du métier et décrit dans la littérature tel que par exemple les variants décrits dans l’article de Santoro and Schultz (Proc Natl Acad Sci USA. 2002 Apr 2;99(7) :4185The functional variant can be any variant of the CRE recombinase known to those skilled in the art and described in the literature such as, for example, the variants described in the article by Santoro and Schultz (Proc Natl Acad Sci USA. 2002 Apr 2; 99 (7): 4185

90), dans la demande WO 2014/158593, dans le brevet US 6,734,295, et dans l'article de Frank Buchholz and A. Francis Stewart (Nature Biotechnology 2001 19:1047-1052).90), in application WO 2014/158593, in US patent 6,734,295, and in the article by Frank Buchholz and A. Francis Stewart (Nature Biotechnology 2001 19: 1047-1052).

Selon un mode de réalisation, le variant fonctionnel de la recombinase CRE a une séquence présentant au moins 80% d’identité de séquence avec la SEQ ID NO : 1, de préférence au moins 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% ou 99% d’identité de séquence avec la SEQ ID NO : 1.According to one embodiment, the functional variant of the CRE recombinase has a sequence having at least 80% of sequence identity with SEQ ID NO: 1, preferably at least 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% or 99% of sequence identity with SEQ ID NO: 1.

Les inventeurs ont ici démontré que la recombinase CRE conserve son activité après délétion de 31 résidus en N-ter et/ou de 3 résidus en C-ter.The inventors have demonstrated here that the CRE recombinase retains its activity after deletion of 31 residues in N-ter and / or 3 residues in C-ter.

Ainsi, selon un mode de réalisation particulier, le variant fonctionnel de la recombinase CRE peut comprendre, ou consister en,Thus, according to a particular embodiment, the functional variant of the CRE recombinase can comprise, or consist of,

- la séquence SEQ ID NO : 2 (résidus 32 à 340 de la SEQ ID NO : 1), ou- the sequence SEQ ID NO: 2 (residues 32 to 340 of SEQ ID NO: 1), or

- une séquence présentant au moins 80% d’identité de séquence avec la SEQ ID NO : 2, de préférence au moins 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% ou 99% d’identité de séquence avec la SEQ ID NO : 2.- a sequence having at least 80% of sequence identity with SEQ ID NO: 2, preferably at least 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97 %, 98% or 99% of sequence identity with SEQ ID NO: 2.

Le variant fonctionnel de la recombinase CRE peut également comprendre, ou consister en, une recombinase CRE de SEQ ID NO : 1 dans laquelle au maximum 31 acides aminés ont été délétés en N-terminal et/ou au maximum 3 acides aminés ont été délétés en C-terminal. En particulier, le variant fonctionnel de la recombinase CRE peut comprendre, ou consister en, une recombinase CRE de SEQ ID NO : 1 dans laquelle 18, 19, 26 ou 31 acides aminés ont été délétés en N-terminal.The functional variant of the CRE recombinase can also comprise, or consist of, a CRE recombinase of SEQ ID NO: 1 in which a maximum of 31 amino acids have been deleted in N-terminal and / or a maximum of 3 amino acids have been deleted in C-terminal. In particular, the functional variant of the CRE recombinase may comprise, or consist of, a CRE recombinase of SEQ ID NO: 1 in which 18, 19, 26 or 31 amino acids have been deleted at the N-terminal.

Dans certains modes de réalisation, le variant fonctionnel de la recombinase CRE peut présenter une substitution au niveau du résidu correspondant au résidu E340 de la SEQ ID NO : 1 et/ou une substitution au niveau du résidu correspondant au résidu D341 de la SEQ ID NO : 1. Les résidus du variant correspondant aux résidus E340 et D341 de la SEQ ID NO : 1 sont aisément identifiés par l’homme du métier au moyen d’un algorithme d’alignement de séquences.In certain embodiments, the functional variant of the CRE recombinase may have a substitution at the level of the residue corresponding to the residue E340 of SEQ ID NO: 1 and / or a substitution at the level of the residue corresponding to the residue D341 of SEQ ID NO : 1. The residues of the variant corresponding to residues E340 and D341 of SEQ ID NO: 1 are easily identified by a person skilled in the art using a sequence alignment algorithm.

Le ou les résidus de substitution sont choisis indépendamment dans le groupe constitué de A, G, V, L, I, P, M, W, C, N, Q, S, T et Y. De préférence, le ou les résidus sont substitués par un résidu alanine.The substitution residue (s) are independently selected from the group consisting of A, G, V, L, I, P, M, W, C, N, Q, S, T and Y. Preferably, the residue (s) are substituted with an alanine residue.

Selon un mode particulier de réalisation, le domaine recombinase est un variant fonctionnel de la recombinase CRE, ledit variant comprenant, ou consistant en, une recombinase CRE de SEQID NO : 1 dans laquelle 18,19,26 ou 31 acides aminés ont été délétés en N-terminal, et présentant de manière optionnelle une substitution au niveau du résidu correspondant au résidu E340 de la SEQ ID NO : 1 et/ou une substitution au niveau du résidu correspondant au résidu D341 de la SEQ ID NO : 1.According to a particular embodiment, the recombinase domain is a functional variant of the CRE recombinase, said variant comprising or consisting of a CRE recombinase of SEQID NO: 1 in which 18,19,26 or 31 amino acids have been deleted in N-terminal, and optionally having a substitution at the residue corresponding to residue E340 of SEQ ID NO: 1 and / or a substitution at the level of residue corresponding to residue D341 of SEQ ID NO: 1.

De préférence, le domaine recombinase est un variant fonctionnel de la recombinase CRE, ledit variant comprenant, ou consistant en, une recombinase CRE de SEQ ID NO : 1 dans laquelle 19 ou 31 acides aminés ont été délétés en N-terminal, et présentant de manière optionnelle une substitution au niveau du résidu correspondant au résidu E340 de la SEQ ID NO : 1 et/ou une substitution au niveau du résidu correspondant au résidu D341 de la SEQ ID NO : 1Preferably, the recombinase domain is a functional variant of the CRE recombinase, said variant comprising or consisting of a CRE recombinase of SEQ ID NO: 1 in which 19 or 31 amino acids have been deleted at the N-terminal, and having optionally a substitution at the level of the residue corresponding to the residue E340 of SEQ ID NO: 1 and / or a substitution at the level of the residue corresponding to residue D341 of SEQ ID NO: 1

Selon un mode de réalisation préféré, le domaine recombinase estAccording to a preferred embodiment, the recombinase domain is

- un variant fonctionnel de la recombinase CRE de la SEQ ID NO: 1 obtenu par délétion de 19 acides aminés en N-terminal et substitution des résidus 340 et 341 de la SEQ ID NO: 1 par une alanine (SEQ ID NO : 3), ou- a functional variant of the CRE recombinase of SEQ ID NO: 1 obtained by deletion of 19 amino acids at the N-terminal and substitution of residues 340 and 341 of SEQ ID NO: 1 with an alanine (SEQ ID NO: 3) , or

- un variant fonctionnel de la recombinase CRE de la SEQ ID NO: 1 obtenu par délétion de 31 acides aminés en N-terminal (SEQ ID NO : 4).- a functional variant of the CRE recombinase of SEQ ID NO: 1 obtained by deletion of 31 amino acids in N-terminal (SEQ ID NO: 4).

Le domaine photorécepteur de la protéine de fusion selon l’invention est un domaine obtenu à partir d’une protéine photoréceptrice et qui a la propriété de changer de conformation lorsqu’il est exposé à la lumière. De préférence, le domaine photorécepteur est sensible à la lumière bleue, soit une lumière d’une longueur d’onde comprise entre 400 et 500 nm.The photoreceptor domain of the fusion protein according to the invention is a domain obtained from a photoreceptor protein and which has the property of changing conformation when exposed to light. Preferably, the photoreceptor domain is sensitive to blue light, ie light with a wavelength between 400 and 500 nm.

Les protéines photoréceptrices sont des protéines sensibles à la lumière impliquées dans la perception et la réponse à la lumière d’une grande variété d’organismes. Ces capteurs de lumière possèdent un domaine photorécepteur qui réagit et déclenche une cascade de transduction de signal. Les photorécepteurs nécessitent généralement la présence de co-facteurs qui captent les photons, comme par exemple la flavine adénine dinucléotide (FAD) ou la flavine mononucléotide (FMN).Photoreceptor proteins are light-sensitive proteins involved in the perception and response to light of a wide variety of organisms. These light sensors have a photoreceptor domain which reacts and triggers a signal transduction cascade. Photoreceptors generally require the presence of co-factors which capture photons, such as for example flavin adenine dinucleotide (FAD) or flavin mononucleotide (FMN).

Le domaine photorécepteur de la protéine de fusion selon l’invention peut être obtenu à partir de toute protéine photoréceptrice connue de l’homme du métier telle que la rhodopsine, la mélanopsine, la photopsine, la protéine kinase C, les photolyases cryptochrome 1 et 2, les phototropines, le phytochrome, les protéines fluorescentes photoconvertibles, les protéines contenant un domaine PAS (Per-ARNT-Sim) telles que décrites dans Taylor, I. B. Zhulin, Microbiol. Mol. Biol. Rev. 63, 479 (1999) ou les protéines contenant un domaine BLUF telles que décrites dans Wu, Q., and Gardner, K.H. (2009) Biochemistry (Mosc.) 48, 2620-2629.The photoreceptor domain of the fusion protein according to the invention can be obtained from any photoreceptor protein known to those skilled in the art such as rhodopsin, melanopsin, photopsin, protein kinase C, cryptochrome 1 and 2 photolyases , phototropins, phytochrome, fluorescent photoconvertible proteins, proteins containing a PAS domain (Per-ARNT-Sim) as described in Taylor, IB Zhulin, Microbiol. Mol. Biol. Rev. 63, 479 (1999) or the proteins containing a BLUF domain as described in Wu, Q., and Gardner, K.H. (2009) Biochemistry (Mosc.) 48, 2620-2629.

De préférence, le domaine photorécepteur de la protéine de fusion est un domaine LOV (Light Oxygen Voltage). Les domaines LOV appartiennent à la superfamille des domaines PAS et sont des photorécepteurs flavine-dépendant.Preferably, the photoreceptor domain of the fusion protein is a LOV (Light Oxygen Voltage) domain. LOV domains belong to the PAS domain superfamily and are flavin-dependent photoreceptors.

Selon un mode de réalisation, le domaine photorécepteur de la protéine de fusion selon l’invention comprend, ou consiste en, un domaine LOV d’une phototropine, ou un variant ou dérivé de celui-ci.According to one embodiment, the photoreceptor domain of the fusion protein according to the invention comprises, or consists of, a LOV domain of a phototropin, or a variant or derivative thereof.

Les phototropines sont des photorécepteurs végétaux qui possèdent deux domaines LOV et un domaine Ser/Thr kinase. En particulier, le domaine photorécepteur peut être choisi parmi les domaines LOV des phototropines d’Avena Sativa (UNIPROT Gene ID : 049003) , Arabidopsis thaliana (Gene ID : 823721 et 835926), Neurospora crassa (GenBank ID: AAK08514.1), Brucella mellitus ou Chlamydomonas reinhardtii (Zoltowski, B.D., Vaccaro, B., and Crâne, B.R. (2009) Nat. Chem. Biol. 5, 827-834).Phototropins are plant photoreceptors that have two LOV domains and one Ser / Thr kinase domain. In particular, the photoreceptor domain can be chosen from the LOV domains of the phototropins of Avena Sativa (UNIPROT Gene ID: 049003), Arabidopsis thaliana (Gene ID: 823721 and 835926), Neurospora crassa (GenBank ID: AAK08514.1), Brucella mellitus or Chlamydomonas reinhardtii (Zoltowski, BD, Vaccaro, B., and Crane, BR (2009) Nat. Chem. Biol. 5, 827-834).

De préférence, le domaine photorécepteur est un domaine LOV de phototropine d’Avena sativa, en particulier le domaine LOV1 ou LOV2 de la phototropine 1 d’Avena sativa, et de manière plus particulièrement préférée le domaine LOV2 de la phototropine 1 d’Avena sativa.Preferably, the photoreceptor domain is a LOV domain of phototropin of Avena sativa, in particular the LOV1 or LOV2 domain of phototropin 1 of Avena sativa, and more particularly preferably the LOV2 domain of phototropin 1 of Avena sativa .

Le domaine LOV2 d’Avena sativa (asLOV2) est constitué de 143 acides aminés (SEQ ID NO : 14) (résidus 404 à 546 de la phototropine 1, Genbank ID : AAC05083) et se lie à la FMN (Flavine MonoNucléotide). Comme les autres membres de la famille LOV, la structure de asLOV2 révèle un domaine PAS, formé de 2 brins β (A et B) et de 3 hélices a (C, D et E), complété par un connecteur hélical Fa et de 3 feuillets β (G, H, I). Les 5 brins β forment un feuillet β antiparallèle torsadé qui avec la boucle Fa et les hélices permettent l'insertion de FMN. La structure de ce photorécepteur montre une particularité à son extrémité C-Terminale, une hélice Ja d'une vingtaine d'acide aminés ainsi qu'une hélice A'a en extrémité N-Terminale (Halavaty and Moffat, 2007, Biochemistry (Mosc.) 46, 14001-14009; Harper, 2003, Science 301, 1541-1544; Zayner et al., 2012, J. Mol. Biol. 419, 61-74). Sous l'effet de la lumière bleue, le photorécepteur asLOV2 subit une succession de réactions entraînant un changement conformationnel de la protéine et une libération ainsi qu'un relâchement de l'hélice Ja. Lorsque le domaine est intégré dans la phototropine (son contexte naturel), cette modification déclenche l'activité kinase de la phototropine.The LOV2 domain of Avena sativa (asLOV2) consists of 143 amino acids (SEQ ID NO: 14) (residues 404 to 546 of phototropin 1, Genbank ID: AAC05083) and binds to FMN (Flavine MonoNucleotide). Like the other members of the LOV family, the structure of asLOV2 reveals a PAS domain, formed by 2 β strands (A and B) and 3 a helices (C, D and E), completed by a helical connector Fa and 3 β sheets (G, H, I). The 5 β strands form a twisted antiparallel β sheet which with the Fa loop and the helices allow the insertion of FMN. The structure of this photoreceptor shows a peculiarity at its C-terminal end, a Ja helix of about twenty amino acids as well as an A'a helix at the N-Terminal end (Halavaty and Moffat, 2007, Biochemistry (Mosc. ) 46, 14001-14009; Harper, 2003, Science 301, 1541-1544; Zayner et al., 2012, J. Mol. Biol. 419, 61-74). Under the effect of blue light, the asLOV2 photoreceptor undergoes a succession of reactions resulting in a conformational change in the protein and a release and a relaxation of the Ja helix. When the domain is integrated into phototropin (its natural context), this modification triggers the kinase activity of phototropin.

Le domaine photorécepteur peut également être un variant fonctionnel d’un domaine LOV de phototropine, en particulier un variant du domaine asLOV2. Le variant conserve la capacité du domaine LOV à changer de conformation en réponse à une stimulation lumineuse et présente au moins 80% d’identité de séquence avec le domaine LOV parent, de manière plus particulièrement préférée au moins 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% ou 99% d’identité de séquence avec le domaine LOV parent. La capacité du variant à changer de conformation en réponse à une stimulation lumineuse peut être aisément testé par toute technique connue de l’homme du métier telle que, par exemple, le test de liaison de asLOV2-SsrA à SspB décrit dans l’article de Lungu et al. 2012, Chem. Biol. 19, 507-517.The photoreceptor domain can also be a functional variant of a LOV domain of phototropin, in particular a variant of the asLOV2 domain. The variant retains the ability of the LOV domain to change conformation in response to light stimulation and has at least 80% sequence identity with the parent LOV domain, more particularly preferably at least 85%, 90%, 91% , 92%, 93%, 94%, 95%, 96%, 97%, 98% or 99% of sequence identity with the parent LOV domain. The ability of the variant to change conformation in response to light stimulation can be easily tested by any technique known to a person skilled in the art, such as, for example, the asLOV2-SsrA to SspB binding test described in the article by Lungu et al. 2012, Chem. Biol. 19, 507-517.

Selon un mode de réalisation préféré, le domaine photorécepteur est un dérivé d’un domaine LOV, de préférence un dérivé du domaine asLOV2. Par comparaison aux domaines LOV parents, ces dérivés présentent en général une réactivité accrue à la lumière, une expression accrue par la cellule hôte ou une stabilité différente.According to a preferred embodiment, the photoreceptor domain is a derivative of a LOV domain, preferably a derivative of the asLOV2 domain. Compared to the parent LOV domains, these derivatives generally exhibit increased reactivity to light, increased expression by the host cell or different stability.

De nombreux dérivés de domaine LOV, et en particulier du domaine asLOV2, ont été décrits dans la littérature. Ces dérivés incluent, sans y être limités, le domaine LOVSsrA dans lequel le peptide SsrA bactérien a été incorporé dans l’hélice C-terminale d’asLOV2 (Lungu et al., 2012, Chem. Biol. 19, 507-517), le domaine iLID (Improved Light Induced Dimer) (Guntas et al., 2015, Proc. Natl. Acad. Sci. 112, 112-117), les mutants G528A et N358E tels que décrits dans l'article Strickland et al. Nature Methods (2010), 7 (8) 623-626, et les mutants décrits dans l'article de Kawano et al. PLoS One 2013 8(12): e82693 tels que V416T ou V416L.Many derivatives of the LOV domain, and in particular of the asLOV2 domain, have been described in the literature. These derivatives include, but are not limited to, the LOVSsrA domain in which the bacterial SsrA peptide has been incorporated into the C-terminal helix of asLOV2 (Lungu et al., 2012, Chem. Biol. 19, 507-517), the iLID domain (Improved Light Induced Dimer) (Guntas et al., 2015, Proc. Natl. Acad. Sci. 112, 112-117), the mutants G528A and N358E as described in the article Strickland et al. Nature Methods (2010), 7 (8) 623-626, and the mutants described in the article by Kawano et al. PLoS One 2013 8 (12): e82693 such as V416T or V416L.

Selon un mode de réalisation particulier, le domaine photorécepteur de la protéine de fusion est un domaine iLID comprenant, ou consistant en, la séquence suivante MRGSHHHHHHGSLATTLERIEKNFVITDPRLPDNPIIFASDSFLQLTEYSREEILG RNCRFLQGPETDRATVRKIRDAIDNQTEVTVQLINYTKSGKKFWNVFHLQPMR DYKGDVQYFIGVQLDGTERLHGAAEREAVCLIKKTAFQIX (SEQ ID NO : 13), dans laquelle X représente un ou plusieurs acides aminés.According to a particular embodiment, the light receiving area of the fusion protein is a ILID domain comprising or consisting of the following sequence MRGSHHHHHHGSLATTLERIEKNFVITDPRLPDNPIIFASDSFLQLTEYSREEILG RNCRFLQGPETDRATVRKIRDAIDNQTEVTVQLINYTKSGKKFWNVFHLQPMR DYKGDVQYFIGVQLDGTERLHGAAEREAVCLIKKTAFQIX (SEQ ID NO: 13), wherein X represents one or more amino acids.

X peut être toute séquence d’acides aminés adoptant une conformation en hélice alpha. De préférence, X représente un à 10 acides aminés, de manière plus préférée un à 9, 8, 7, 6, 5 ou 4 acides aminés, et de manière plus particulièrement préférée de un à trois acides aminés.X can be any amino acid sequence adopting an alpha helix conformation. Preferably, X represents one to 10 amino acids, more preferably one to 9, 8, 7, 6, 5 or 4 amino acids, and more particularly preferably one to three amino acids.

Selon certains modes particuliers de réalisation, X est choisi dans le groupe constituéAccording to certain particular embodiments, X is chosen from the group made up

- d’un acide aminé choisi parmi A, D, K et L,- an amino acid chosen from A, D, K and L,

- d’une séquence de deux acides aminés choisie parmi IL, VV et AI, et- a sequence of two amino acids chosen from IL, VV and AI, and

- de la séquence QPG.- the QPG sequence.

Le domaine photorécepteur de la protéine de fusion peut être fusionné en Nterminal ou C-terminal du domaine recombinase.The photoreceptor domain of the fusion protein can be fused to the Nterminal or C-terminal of the recombinase domain.

De préférence, le domaine photorécepteur de la protéine de fusion est fusionné en N-terminal du domaine recombinase.Preferably, the photoreceptor domain of the fusion protein is fused to the N-terminal of the recombinase domain.

Les deux domaines peuvent être immédiatement adjacents ou séparés par une ou plusieurs séquences de liaison. De préférence, les domaines sont séparés d’au maximum 10 acides aminés.The two domains can be immediately adjacent or separated by one or more linker sequences. Preferably, the domains are separated by a maximum of 10 amino acids.

De manière plus particulièrement préférée, les deux domaines sont directement adjacents, c’est-à-dire sans séquence de liaison entre eux.More particularly preferably, the two domains are directly adjacent, that is to say without linkage sequence between them.

Selon un mode de réalisation particulier, la protéine de fusion selon l’invention comprend, ou consiste en, une séquence choisie parmi les séquences SEQ ID NO : 5 à 12.According to a particular embodiment, the fusion protein according to the invention comprises, or consists of, a sequence chosen from the sequences SEQ ID NO: 5 to 12.

La protéine de fusion selon l’invention présente une activité recombinase photoactivable. Cela signifie que l’activation du domaine photorécepteur induit l’activation ou une augmentation de l’activité du domaine recombinase.The fusion protein according to the invention exhibits photoactivatable recombinase activity. This means that activation of the photoreceptor domain induces activation or increased activity of the recombinase domain.

L’activation du domaine photorécepteur est réalisée par exposition à une lumière dont la longueur d’onde peut varier selon la nature du photorécepteur. Comme mentionné ci-dessus, le domaine photorécepteur est de préférence sensible à la lumière bleue, soit une lumière d’une longueur d’onde comprise entre 400 et 500 nm.Activation of the photoreceptor domain is achieved by exposure to light, the wavelength of which can vary depending on the nature of the photoreceptor. As mentioned above, the photoreceptor domain is preferably sensitive to blue light, ie light with a wavelength between 400 and 500 nm.

La durée d’exposition à la lumière et l’intensité lumineuse peuvent être aisément déterminées par l’homme du métier.The duration of exposure to light and the light intensity can be easily determined by a person skilled in the art.

De préférence, la protéine de fusion peut être exposée à une intensité lumineuse comprise entre 2 mW/cm2 et 40 mW/cm2, de manière plus particulièrement préférée entre 2 mW/cm2 et 10 mW/cm2.Preferably, the fusion protein can be exposed to a light intensity of between 2 mW / cm 2 and 40 mW / cm 2 , more particularly preferably between 2 mW / cm 2 and 10 mW / cm 2 .

De préférence, la durée d’exposition à la lumière est comprise entre 10 min et trois heures, de manière plus particulièrement préférée entre 30 min et deux heures.Preferably, the duration of exposure to light is between 10 min and three hours, more particularly preferably between 30 min and two hours.

Selon un mode de réalisation particulier, l’activité recombinase de la protéine de fusion est induite par une exposition de 10 min à trois heures, de préférence de 30 min à deux heures, à une lumière bleue d’une intensité de 2 mW/cm2 et 40 mW/cm2, de préférence de 2 mW/cm2 et 10 mW/cm2.According to a particular embodiment, the recombinase activity of the fusion protein is induced by an exposure of 10 min to three hours, preferably from 30 min to two hours, to blue light with an intensity of 2 mW / cm 2 and 40 mW / cm 2 , preferably 2 mW / cm 2 and 10 mW / cm 2 .

Tel qu’utilisé ici, le terme « photoactivable » signifie de préférence que l’exposition de la protéine de fusion selon l’invention à la lumière permet d’obtenir une augmentation au minimum 25 % de l’activité recombinase, de préférence une augmentation d’au minimum 30%, 40% ou 50% de l’activité recombinase, par rapport au niveau sans exposition lumineuse. De manière plus particulièrement préférée, l’exposition de la protéine de fusion selon l’invention à une lumière bleue d’une intensité d’environ 2 mW/cm2 durant 90 min permet d’obtenir une augmentation d’au minimum 50% de l’activité recombinase, par rapport au niveau sans exposition lumineuse.As used herein, the term “photoactivatable” preferably means that the exposure of the fusion protein according to the invention to light makes it possible to obtain a minimum 25% increase in the recombinase activity, preferably an increase at least 30%, 40% or 50% of the recombinase activity, compared to the level without light exposure. More particularly preferably, the exposure of the fusion protein according to the invention to blue light with an intensity of approximately 2 mW / cm 2 for 90 min makes it possible to obtain an increase of at least 50% of recombinase activity, compared to the level without light exposure.

La présente invention concerne également un support solide sur lequel est immobilisée une protéine de fusion selon l’invention. Elle concerne également un procédé de préparation d’un tel support solide comprenant la fourniture d’une protéine de fusion selon l’invention et d’un support solide adapté, et l’immobilisation de ladite protéine sur ledit support.The present invention also relates to a solid support on which a fusion protein according to the invention is immobilized. It also relates to a process for the preparation of such a solid support comprising the supply of a fusion protein according to the invention and of a suitable solid support, and the immobilization of said protein on said support.

Les moyens d'immobilisation sont bien connus de l'homme de l'art (voir par exemple « Enzyme Technology » de Martin Chaplin et Christopher Bucke, Cambridge University Press, 1990). La protéine de fusion selon l’invention peut être immobilisée sur le support solide par tout moyen adapté tel qu’une liaison covalente ou non covalente. Une grande variété de matériaux peut être utilisée comme support d’immobilisation. Ces matériaux sont en général des matrices polymériques ou inorganiques inertes. Le support peut être par exemple membranaire, particulaire (e.g. billes, nanobilles, microbilles) ou fibreux. Des exemples de support comprennent, sans y être limité, des matrices de polyuréthane, du sépharose activé, de l’alginate, des résines Amberlite, Sephadex ou Duolite, des résines acryliques, des résines polystyrène ou des résines macroréticulées.Means of immobilization are well known to those skilled in the art (see for example "Enzyme Technology" by Martin Chaplin and Christopher Bucke, Cambridge University Press, 1990). The fusion protein according to the invention can be immobilized on the solid support by any suitable means such as a covalent or non-covalent bond. A wide variety of materials can be used as an immobilizer. These materials are generally inert polymeric or inorganic matrices. The support can be for example membrane, particulate (e.g. beads, nanobeads, microbeads) or fibrous. Examples of carriers include, but are not limited to, polyurethane matrices, activated sepharose, alginate, Amberlite, Sephadex or Duolite resins, acrylic resins, polystyrene resins or macroreticulated resins.

La présente invention concerne également un acide nucléique codant pour une protéine de fusion selon l’invention.The present invention also relates to a nucleic acid encoding a fusion protein according to the invention.

L'acide nucléique peut être de l'ADN (ADNc ou ADNg), de TARN ou un mélange des deux. Il peut être sous forme monocaténaire ou sous forme duplex ou un mélange des deux. Il peut comprendre des nucléotides modifiés, comprenant par exemple une liaison modifiée, une base purine ou pyrimidine modifiée, ou un sucre modifié. Il peut être préparé par toute méthode connue de l'homme du métier, telle que la synthèse chimique, la recombinaison et la mutagenèse. L'acide nucléique selon l'invention peut être déduit de la séquence de la protéine de fusion selon l'invention et l'utilisation des codons peut être adaptée en fonction de la cellule hôte dans laquelle l'acide nucléique doit être transcrit et/ou traduit. Ces étapes peuvent être réalisées selon des méthodes bien connues de l'homme du métier et dont certaines sont décrites dans le manuel de référence Sambrook et al. (Sambrook étal., 2001, Molecular cloning: a laboratory manual, Third Edition Cold Spring Harbor).The nucleic acid can be DNA (cDNA or gDNA), TARN or a mixture of the two. It can be in single-stranded form or in duplex form or a mixture of the two. It can comprise modified nucleotides, comprising for example a modified bond, a modified purine or pyrimidine base, or a modified sugar. It can be prepared by any method known to those skilled in the art, such as chemical synthesis, recombination and mutagenesis. The nucleic acid according to the invention can be deduced from the sequence of the fusion protein according to the invention and the use of the codons can be adapted depending on the host cell in which the nucleic acid is to be transcribed and / or translated. These steps can be carried out according to methods well known to those skilled in the art and some of which are described in the reference manual Sambrook et al. (Sambrook et al., 2001, Molecular cloning: a laboratory manual, Third Edition Cold Spring Harbor).

La présente invention concerne en outre une cassette d’expression comprenant un acide nucléique selon l’invention,The present invention further relates to an expression cassette comprising a nucleic acid according to the invention,

Le terme « cassette d'expression » désigne ici une construction d'acide nucléique comprenant une région codante comprenant un acide nucléique selon l’invention et une ou plusieurs séquences régulatrices, la région codante et la ou les séquences régulatrices étant liées de manière opérationnelle.The term “expression cassette” here designates a nucleic acid construct comprising a coding region comprising a nucleic acid according to the invention and one or more regulatory sequences, the coding region and the regulatory sequence or sequences being operably linked.

L'expression « lié de manière opérationnelle » indique que les éléments sont combinés de manière à ce que l'expression de la région codante soit sous le contrôle de la ou des séquences régulatrices.The expression "operably linked" indicates that the elements are combined so that expression of the coding region is under the control of the regulatory sequence (s).

L'expression « séquence régulatrice » désigne une séquence d'acide nucléique nécessaire à l’expression ou contrôlant l’expression de la région codante. Les séquences régulatrices peuvent être endogènes ou hétérologues à la cellule hôte. De telles séquences sont bien connues de l’homme du métier qui peut aisément sélectionner les séquences régulatrices adaptées à chaque application et notamment à la cellule hôte dans laquelle l’expression est souhaitée. Sans y être limité, ces séquences peuvent comprendre notamment un promoteur, une séquence de polyadénylation, un terminateur de transcription, une région 3’UTR, une région 5’UTR et un peptide signal.The term "regulatory sequence" refers to a nucleic acid sequence necessary for the expression or controlling the expression of the coding region. The regulatory sequences can be endogenous or heterologous to the host cell. Such sequences are well known to those skilled in the art who can easily select the regulatory sequences suitable for each application and in particular the host cell in which expression is desired. Without being limited thereto, these sequences may especially comprise a promoter, a polyadenylation sequence, a transcription terminator, a 3’UTR region, a 5’UTR region and a signal peptide.

De préférence, la cassette d’expression selon l’invention comprend, ou consiste en, un promoteur permettant d’initier la transcription, un acide nucléique selon l’invention, et un terminateur de transcription. Typiquement, la séquence du promoteur est placée en amont de la région codante et à une distance compatible avec le contrôle de l'expression de ladite région.Preferably, the expression cassette according to the invention comprises, or consists of, a promoter making it possible to initiate transcription, a nucleic acid according to the invention, and a transcription terminator. Typically, the promoter sequence is placed upstream of the coding region and at a distance compatible with controlling the expression of said region.

Le promoteur contient des séquences de contrôle transcriptionnel qui initient l'expression de l’acide nucléique codant pour une protéine de fusion de l'invention. Il peut être un promoteur reconnu par une cellule hôte ou un système d'expression in vitro. Le promoteur peut être tout polynucléotide présentant une activité transcriptionnelle dans les conditions d’utilisation envisagées, i.e. in vitro ou in vivo, et peut notamment être un promoteur obtenu à partir de gènes codant pour des polypeptides endogènes ou hétérologues à la cellule hôte, ou un promoteur mutant, tronqué ou hybride. Le promoteur peut être un promoteur fort, faible, constitutif ou inductible. Sur la base de ses connaissances, l’homme du métier peut aisément choisir le promoteur adapté.The promoter contains transcriptional control sequences which initiate the expression of the nucleic acid encoding a fusion protein of the invention. It can be a promoter recognized by a host cell or an in vitro expression system. The promoter can be any polynucleotide exhibiting transcriptional activity under the conditions of use envisaged, ie in vitro or in vivo, and can in particular be a promoter obtained from genes coding for polypeptides endogenous or heterologous to the host cell, or a mutant, truncated or hybrid promoter. The promoter can be a strong, weak, constitutive or inducible promoter. Based on his knowledge, the skilled person can easily choose the suitable promoter.

Le terminateur de transcription est reconnu par une cellule hôte pour terminer la transcription. Le terminateur est fonctionnellement lié à l'extrémité 3' de l'acide nucléique selon l’invention. Tout terminateur qui est fonctionnel dans la cellule hôte peut être utilisé dans la présente invention.The transcription terminator is recognized by a host cell to complete transcription. The terminator is functionally linked to the 3 ′ end of the nucleic acid according to the invention. Any terminator that is functional in the host cell can be used in the present invention.

La présente invention concerne également un vecteur d’expression comprenant un acide nucléique ou une cassette d’expression selon l’invention. Ce vecteur d’expression peut être utilisé pour transformer une cellule hôte et permettre l’expression de l’acide nucléique selon l’invention dans ladite cellule.The present invention also relates to an expression vector comprising a nucleic acid or an expression cassette according to the invention. This expression vector can be used to transform a host cell and allow the expression of the nucleic acid according to the invention in said cell.

Le vecteur peut être un ADN ou un ARN, circulaire ou non, simple- ou doublebrin. Il est avantageusement choisi parmi un plasmide, un phage, un phagemide, un virus, un cosmide et un chromosome artificiel.The vector can be DNA or RNA, circular or not, single- or double-stranded. It is advantageously chosen from a plasmid, a phage, a phagemid, a virus, a cosmid and an artificial chromosome.

De manière générale, le vecteur est choisi de manière à être compatible avec la cellule hôte dans laquelle il doit être introduit. Le vecteur peut être un vecteur se répliquant de manière autonome, c'est-à-dire un vecteur existant en tant qu'entité extrachromosomique dont la réplication est indépendante de la réplication chromosomique, ou un vecteur qui, lorsqu'il est introduit dans la cellule hôte, est intégré dans le génome et répliqué avec le chromosome dans lequel il a été intégré.In general, the vector is chosen so as to be compatible with the host cell into which it is to be introduced. The vector can be an autonomously replicating vector, that is to say a vector existing as an extrachromosomal entity whose replication is independent of chromosomal replication, or a vector which, when it is introduced into the host cell, is integrated into the genome and replicated with the chromosome in which it was integrated.

Avantageusement, le vecteur d’expression comprend des éléments régulateurs permettant l’expression de l’acide nucléique selon l’invention. Ces éléments peuvent comporter par exemple des promoteurs de transcription, des activateurs de transcription, des séquences terminatrices, des codons d’initiation et de terminaison. Les méthodes pour sélectionner ces éléments en fonction de la cellule hôte dans laquelle l’expression est souhaitée, sont bien connues de l’homme du métier.Advantageously, the expression vector comprises regulatory elements allowing the expression of the nucleic acid according to the invention. These elements can include, for example, transcription promoters, transcription activators, terminator sequences, initiation and termination codons. The methods for selecting these elements according to the host cell in which expression is desired, are well known to those skilled in the art.

Le vecteur peut comporter en outre des éléments permettant sa sélection dans la cellule hôte comme, par exemple, un gène de résistance à un antibiotique ou un gène de sélection assurant la complémentation du gène respectif délété dans le génome de la cellule hôte. De tels éléments sont bien connus de l'homme du métier et largement décrits dans la littérature.The vector may also comprise elements allowing its selection in the host cell such as, for example, a gene for resistance to an antibiotic or a selection gene ensuring the complementation of the respective gene deleted in the genome of the host cell. Such elements are well known to those skilled in the art and widely described in the literature.

Selon certains modes de réalisation, le vecteur comprend un ou plusieurs éléments permettant l’intégration du vecteur dans le génome de la cellule hôte. Cette intégration peut reposer sur une recombinaison homologue ou non homologue. Dans le cas d’une intégration ciblée, le vecteur peut contenir des séquences homologues d’une région cible du génome et qui permettent de cibler l’intégration par recombinaison homologue à un emplacement précis dans le génome de la cellule hôte.According to certain embodiments, the vector comprises one or more elements allowing the integration of the vector into the genome of the host cell. This integration can be based on homologous or non-homologous recombination. In the case of targeted integration, the vector may contain sequences homologous to a target region of the genome and which make it possible to target integration by homologous recombination at a precise location in the genome of the host cell.

Lorsque la réplication autonome du vecteur est souhaitée, le vecteur peut comprendre une origine de réplication fonctionnelle dans la cellule hôte.When autonomous replication of the vector is desired, the vector may include an origin of functional replication in the host cell.

Les méthodes pour sélectionner ces différents éléments en fonction du vecteur et de la cellule hôte dans laquelle l’expression est souhaitée sont bien connues de l’homme du métier. Les vecteurs selon l’invention peuvent être construits par les techniques classiques de biologie moléculaire.The methods for selecting these different elements as a function of the vector and of the host cell in which expression is desired are well known to those skilled in the art. The vectors according to the invention can be constructed by conventional techniques of molecular biology.

La présente invention concerne l’utilisation d’un acide nucléique, d’une cassette d’expression ou d’un vecteur d’expression selon l’invention pour transformer ou transfecter une cellule. La cellule hôte peut être transformée/transfectée de manière transitoire ou stable et l’acide nucléique, la cassette ou le vecteur peut être contenu dans la cellule sous forme d’épisome ou sous forme chromosomique.The present invention relates to the use of a nucleic acid, an expression cassette or an expression vector according to the invention for transforming or transfecting a cell. The host cell can be transiently or stably transformed / transfected and the nucleic acid, cassette or vector can be contained in the cell as an episome or in chromosomal form.

La présente invention concerne également une cellule hôte comprenant un acide nucléique, une cassette ou un vecteur d’expression selon l’invention.The present invention also relates to a host cell comprising a nucleic acid, a cassette or an expression vector according to the invention.

La cellule hôte peut être une cellule procaryote ou une cellule eucaryote.The host cell can be a prokaryotic cell or a eukaryotic cell.

Selon un mode de réalisation, la cellule hôte est une cellule procaryote, de préférence une bactérie.According to one embodiment, the host cell is a prokaryotic cell, preferably a bacterium.

Selon un autre mode de réalisation, la cellule hôte est une cellule eucaryote, de préférence une levure, une cellule de champignon, une cellule d’algue, une cellule de plante ou une cellule animale, et de manière plus particulièrement préférée une cellule animale ou une levure.According to another embodiment, the host cell is a eukaryotic cell, preferably a yeast, a fungus cell, an algae cell, a plant cell or an animal cell, and more particularly an animal cell or yeast.

Selon un mode de réalisation particulier, la cellule hôte est une cellule animale, de préférence une cellule d’insecte ou de mammifère, et de manière plus particulièrement préférée une cellule de souris, une cellule de hamster (par exemple une cellule CHO) ou une cellule humaine.According to a particular embodiment, the host cell is an animal cell, preferably an insect or mammalian cell, and more particularly a mouse cell, a hamster cell (for example a CHO cell) or a human cell.

Dans un mode de réalisation particulier, la cellule est non-humaine et/ou n’est pas une cellule souche embryonnaire.In a particular embodiment, the cell is non-human and / or is not an embryonic stem cell.

Selon un autre mode de réalisation particulier, la cellule hôte est une cellule de mammifère non humain.According to another particular embodiment, the host cell is a non-human mammalian cell.

Selon un autre mode de réalisation particulier, la cellule hôte est une cellule animale, de préférence humaine, et n’est pas une cellule souche embryonnaire humaine.According to another particular embodiment, the host cell is an animal cell, preferably human, and is not a human embryonic stem cell.

Selon un autre mode de réalisation particulier, la cellule hôte est un microorganisme, de préférence une bactérie ou une levure.According to another particular embodiment, the host cell is a microorganism, preferably a bacterium or a yeast.

Le terme « cellule hôte » englobe également toute progéniture d'une cellule hôte parente qui n'est pas identique à la cellule hôte parente en raison des mutations qui se produisent pendant la réplication.The term "host cell" also includes any offspring of a parent host cell that is not identical to the parent host cell due to mutations that occur during replication.

L’acide nucléique, cassette d’expression ou vecteur d’expression selon l’invention peut être introduit dans la cellule hôte par toute méthode connue de l’homme du métier, telle que l’infection, l’électroporation, la conjugaison, la transduction, la transformation de cellules compétentes, la transformation de protoplaste, la fusion de protoplastes, la biolistique ou encore des méthodes de transformation faisant intervenir le PEG, des agents lipidiques, l’acétate de lithium ou des liposomes.The nucleic acid, expression cassette or expression vector according to the invention can be introduced into the host cell by any method known to a person skilled in the art, such as infection, electroporation, conjugation, transduction, transformation of competent cells, transformation of protoplast, fusion of protoplasts, biolistics or transformation methods involving PEG, lipid agents, lithium acetate or liposomes.

Selon les modes de réalisation, une ou plusieurs copies d’un acide nucléique, d’une cassette ou d’un vecteur selon la présente invention peut être insérée dans une cellule hôte.According to the embodiments, one or more copies of a nucleic acid, of a cassette or of a vector according to the present invention can be inserted into a host cell.

La cellule hôte peut être une cellule isolée (transformation/transfection ex vivo) ou une cellule présente dans un organisme (transformation/transfection in vivo).The host cell can be an isolated cell (ex vivo transformation / transfection) or a cell present in an organism (in vivo transformation / transfection).

De préférence, la cellule hôte est une cellule isolée. Tel qu’utilisé ici, le terme « cellule isolée » se réfère à une cellule séparée et/ou récupérée à partir de son environnement naturel. En particulier, la cellule peut être isolée/récupérée à partir d’un organisme pluricellulaire afin d’être manipulée ex vivo.Preferably, the host cell is an isolated cell. As used here, the term "isolated cell" refers to a separate cell and / or recovered from its natural environment. In particular, the cell can be isolated / recovered from a multicellular organism in order to be manipulated ex vivo.

Selon un autre aspect, la présente invention concerne un procédé de production d’une protéine de fusion selon l'invention comprenant l’expression d'un acide nucléique codant pour ladite protéine de fusion et la récupération de celle-ci.According to another aspect, the present invention relates to a process for producing a fusion protein according to the invention comprising the expression of a nucleic acid coding for said fusion protein and the recovery thereof.

La présente invention concerne en particulier un procédé de production in vitro d’une protéine de fusion selon l'invention comprenant (a) la mise en contact d'un acide nucléique, d'une cassette ou d'un vecteur selon l'invention avec un système d'expression in vitro', et (b) la récupération de la protéine de fusion. Les systèmes d'expression in vitro sont bien connus de l'homme du métier et de nombreux systèmes sont disponibles dans le commerce.The present invention relates in particular to a method of in vitro production of a fusion protein according to the invention comprising (a) bringing a nucleic acid, a cassette or a vector according to the invention into contact with an in vitro expression system, and (b) recovering the fusion protein. In vitro expression systems are well known to those of skill in the art and many systems are commercially available.

La présente invention concerne de préférence un procédé de production d’une protéine de fusion selon invention comprenant (a) la culture d’une cellule hôte selon l'invention dans un milieu de culture approprié et dans des conditions appropriées pour produire ladite protéine de fusion; et (b) la récupération de la protéine de fusion à partir de la culture cellulaire.The present invention preferably relates to a method for producing a fusion protein according to the invention comprising (a) culturing a host cell according to the invention in an appropriate culture medium and under conditions suitable for producing said fusion protein ; and (b) recovering the fusion protein from the cell culture.

Les cellules hôtes sont cultivées dans un milieu nutritif approprié pour la production de la protéine de fusion en utilisant des procédés bien connus de l’homme du métier.Host cells are grown in a nutrient medium suitable for the production of the fusion protein using methods well known to those skilled in the art.

Par exemple, la cellule hôte peut être cultivée en flacon ou en fermenteur dans un milieu approprié et dans des conditions permettant à la protéine de fusion d’être exprimée et/ou isolée. La culture a lieu dans un milieu nutritif approprié comprenant notamment des sources de carbone, d'azote et des sels inorganiques, en utilisant des procédures bien connues de l’homme du métier. De tels milieux sont disponibles auprès de fournisseurs commerciaux ou peuvent être préparés selon des compositions publiées (par exemple, dans les catalogues de l'American Type Culture Collection).For example, the host cell can be cultured in a flask or in a fermenter in an appropriate medium and under conditions allowing the fusion protein to be expressed and / or isolated. The culture takes place in a suitable nutrient medium comprising in particular carbon sources, nitrogen and inorganic salts, using procedures well known to those skilled in the art. Such media are available from commercial suppliers or can be prepared according to published compositions (for example, in the catalogs of the American Type Culture Collection).

Si la protéine de fusion est sécrétée dans le milieu nutritif, celle-ci peut être récupérée directement à partir du surnageant de culture. Si elle n'est pas sécrétée, elle peut être récupérée à partir des lysats cellulaires ou après perméabilisation.If the fusion protein is secreted into the nutrient medium, this can be recovered directly from the culture supernatant. If it is not secreted, it can be recovered from cell lysates or after permeabilization.

La protéine de fusion peut être détectée et récupérée en utilisant tout procédé connu de l’homme du métier tel que des méthodes de chromatographie et/ou des méthodes électrophorétiques.The fusion protein can be detected and recovered using any method known to those skilled in the art such as chromatography methods and / or electrophoretic methods.

Selon un autre aspect, la présente invention concerne également un procédé pour stimuler l’activité recombinase dans une cellule comprenantAccording to another aspect, the present invention also relates to a method for stimulating recombinase activity in a cell comprising

- la fourniture d’une cellule exprimant une protéine de fusion selon l’invention ou l’insertion d’un acide nucléique, une cassette d’expression ou un vecteur d’expression selon l’invention dans une cellule, etthe supply of a cell expressing a fusion protein according to the invention or the insertion of a nucleic acid, an expression cassette or an expression vector according to the invention into a cell, and

- l’exposition de ladite cellule à une lumière capable d’activer le domaine photorécepteur de ladite protéine de fusion et donc l’activité recombinase.- the exposure of said cell to light capable of activating the photoreceptor domain of said fusion protein and therefore the recombinase activity.

La cellule peut être une cellule hôte telle que définie ci-dessus.The cell can be a host cell as defined above.

L’insertion de l’acide nucléique, de la cassette ou du vecteur selon l’invention dans la cellule peut se faire par toute technique connue de l’homme du métier.The insertion of the nucleic acid, the cassette or the vector according to the invention into the cell can be carried out by any technique known to a person skilled in the art.

La cellule peut éventuellement avoir été préalablement génétiquement modifiée afin d’insérer un ou plusieurs sites de reconnaissance reconnus par le domaine recombinase de la protéine de fusion, et éventuellement un ou plusieurs acides nucléiques dont l’expression, le nombre et/ou la localisation dans le génome se trouveront modifiés par l’action de la recombinase au niveau desdits sites de reconnaissance.The cell may possibly have been genetically modified beforehand in order to insert one or more recognition sites recognized by the recombinase domain of the fusion protein, and optionally one or more nucleic acids whose expression, number and / or localization in the genome will be modified by the action of recombinase at said recognition sites.

En particulier, la cellule peut être un microorganisme, par exemple une bactérie ou une levure, dans lequel un ou plusieurs gènes d’intérêt ont été introduits (par exemple des gènes codant pour des enzymes donnant lieu à la production d'un composé d’intérêt) en combinaison avec des sites de reconnaissance reconnus par le domaine recombinase de la protéine de fusion. L’exposition de cette cellule à une lumière capable d’activer le domaine photorécepteur de la protéine de fusion génère un réarrangement chromosomique qui permet, selon la configuration des sites de reconnaissance de la recombinase, par exemple d’activer ou d’inhiber l’expression du ou des gènes d’intérêt, et/ou de déléter, insérer ou transloquer un ou plusieurs gènes d’intérêt de la cellule hôte.In particular, the cell may be a microorganism, for example a bacterium or a yeast, into which one or more genes of interest have been introduced (for example genes coding for enzymes giving rise to the production of a compound of interest) in combination with recognition sites recognized by the recombinase domain of the fusion protein. The exposure of this cell to a light capable of activating the photoreceptor domain of the fusion protein generates a chromosomal rearrangement which makes it possible, depending on the configuration of the recombinase recognition sites, for example to activate or inhibit the expression of the gene (s) of interest, and / or to delete, insert or translocate one or more genes of interest from the host cell.

Ce type de modulation est bien connue de l’homme du métier. En revanche, l’avantage majeur du procédé selon l’invention est d’utiliser la lumière comme agent d’induction de l’activité recombinase et non un inducteur chimique.This type of modulation is well known to those skilled in the art. On the other hand, the major advantage of the method according to the invention is to use light as an agent for inducing recombinase activity and not a chemical inducer.

La présente invention concerne également un procédé pour modifier un ou plusieurs acides nucléiques, comprenantThe present invention also relates to a method for modifying one or more nucleic acids, comprising

- la mise en contact d’une protéine de fusion selon l’invention, avec un ou des acides nucléiques d’intérêt comprenant un ou plusieurs sites de reconnaissance reconnus par le domaine recombinase de ladite protéine de fusion, etcontacting a fusion protein according to the invention with one or more nucleic acids of interest comprising one or more recognition sites recognized by the recombinase domain of said fusion protein, and

- l’exposition de la protéine de fusion et du ou des acides nucléiques à une lumière capable d’activer le domaine photorécepteur de ladite protéine de fusion et donc l’activité recombinase.- the exposure of the fusion protein and of the nucleic acid (s) to light capable of activating the photoreceptor domain of said fusion protein and therefore the recombinase activity.

Les modifications apportées aux acides nucléiques peuvent être des translocations, inversions, insertions et/ou délétions. Celles-ci peuvent notamment conduire à induire ou bloquer l’expression d’un gène, ou à introduire une mutation dans une séquence codante (séquence sauvage vers séquence mutée ou vice-versa). Ce type de modifications au moyen de recombinases est bien connu de l’homme du métier.The modifications made to the nucleic acids can be translocations, inversions, insertions and / or deletions. These can in particular lead to inducing or blocking the expression of a gene, or to introducing a mutation in a coding sequence (wild sequence to mutated sequence or vice versa). This type of modification by means of recombinases is well known to those skilled in the art.

La mise en contact de la protéine de fusion avec le ou les acides nucléiques d’intérêt peut avoir lieu dans une cellule, in vivo ou ex vivo, ou in vitro.The contact of the fusion protein with the nucleic acid (s) of interest can take place in a cell, in vivo or ex vivo, or in vitro.

Dans le cas d’une mise en contact dans une cellule, la protéine de fusion est de préférence exprimée par ladite cellule qui comprend également le ou les acides nucléiques à modifier.In the case of contacting in a cell, the fusion protein is preferably expressed by said cell which also comprises the nucleic acid or acids to be modified.

Dans le cadre d’une utilisation in vivo, la protéine de fusion selon l’invention peut être mise en contact avec le ou les acides nucléiques à modifier en administrant soit un vecteur ou une cassette d’expression codant pour ladite protéine, soit directement ladite protéine dans l’organisme, le tissu ou la cellule cible. L’activation de l’activité recombinase peut être réalisée par photothérapie, photochimiothérapie ou via des sources lumineuses offrant une précision spatiale telles que des fibres optiques. Ce type d’application trouve un intérêt tout particulier en thérapie génique lorsqu’il est nécessaire de modifier l'activité ou la viabilité d'une cellule ou d'un groupe de cellules impliquées dans une pathologie ou dans son évolution (voir par exemple Greco et al. Gene Therapy volume 13, pages 206-215 (2006)).In the context of in vivo use, the fusion protein according to the invention can be brought into contact with the nucleic acid or acids to be modified by administering either a vector or an expression cassette coding for said protein, or directly said protein in the target organism, tissue or cell. Activation of the recombinase activity can be carried out by phototherapy, photochemotherapy or via light sources offering spatial precision such as optical fibers. This type of application is of particular interest in gene therapy when it is necessary to modify the activity or the viability of a cell or a group of cells involved in a pathology or in its evolution (see for example Greco et al. Gene Therapy volume 13, pages 206-215 (2006)).

Dans le cas d’une mise en contact in vitro, la protéine de fusion est de préférence mise en contact avec un mélange réactionnel comprenant le ou les acides nucléiques d’intérêt sous la forme d’une protéine purifiée. La protéine de fusion peut être utilisée en solution ou sous une forme immobilisée. De préférence, le mélange réactionnel comprend également un système de transcription et traduction in vitro.In the case of contacting in vitro, the fusion protein is preferably brought into contact with a reaction mixture comprising the nucleic acid (s) of interest in the form of a purified protein. The fusion protein can be used in solution or in an immobilized form. Preferably, the reaction mixture also comprises an in vitro transcription and translation system.

Selon un mode de réalisation, ce procédé est utilisé pour générer de la diversité génétique au sein d’une cellule ou d'une population de cellules, de préférence une population de bactéries ou de levures, ou dans un acide nucléique ou mélange d'acides nucléiques. De manière optionnelle, le génome de la cellule ou l’acide nucléique peut être préalablement synthétisé ou modifié afin comprendre une pluralité de sites de reconnaissance insérée de manière ciblée ou aléatoire et générant ainsi, sous l’action de la recombinase, une diversité génétique contrôlée ou aléatoire.According to one embodiment, this method is used to generate genetic diversity within a cell or a population of cells, preferably a population of bacteria or yeasts, or in a nucleic acid or mixture of acids. nucleic. Optionally, the cell genome or the nucleic acid can be previously synthesized or modified in order to comprise a plurality of recognition sites inserted in a targeted or random manner and thus generating, under the action of recombinase, a controlled genetic diversity. or random.

Les procédés selon l’invention peuvent trouver une application dans un très grand nombre de domaines, notammentThe methods according to the invention can find an application in a very large number of fields, in particular

- pour moduler l’expression d’une molécule d’intérêt, par exemple dans le cadre d’un procédé de bioproduction. L’expression de la molécule d’intérêt peut notamment être induite, stoppée, augmentée ou diminuée. Le composé d’intérêt peut être notamment tout produit de fermentation, un composé changeant la physiologie ou la viabilité de la cellule hôte ou de cellules en contact direct ou indirect avec celle-ci, un composé contrôlant une propriété moléculaire ou cellulaire de ladite cellule hôte ou de cellules en contact direct ou indirect avec celle-ci. Le composé d’intérêt peut également être une protéine ou un acide nucléique présentant une mutation par rapport à la version produite par la cellule hôte avant l’action de la recombinase ;- to modulate the expression of a molecule of interest, for example in the context of a bioproduction process. The expression of the molecule of interest can in particular be induced, stopped, increased or decreased. The compound of interest can in particular be any fermentation product, a compound changing the physiology or the viability of the host cell or of cells in direct or indirect contact with it, a compound controlling a molecular or cellular property of said host cell or cells in direct or indirect contact with it. The compound of interest can also be a protein or a nucleic acid having a mutation compared to the version produced by the host cell before the action of the recombinase;

- pour induire de la diversité génétique dans une cellule hôte ou une population de cellules hôtes, par exemple pour des applications d’évolution dirigée ou de criblage. Les cellules ainsi obtenues peuvent ensuite être criblées afin d’identifier ou de sélectionner des cellules présentant de nouvelles caractéristiques d’intérêt, telles que par exemple, la synthèse d’un nouveau composé, une résistance accrue à des conditions particulières de culture ou une productivité accrue ; ou- to induce genetic diversity in a host cell or a population of host cells, for example for directed evolution or screening applications. The cells thus obtained can then be screened in order to identify or select cells having new characteristics of interest, such as for example, the synthesis of a new compound, increased resistance to particular culture conditions or productivity. increased; or

- pour modifier une activité biologique dans le cadre d’une thérapie génique, par exemple comme décrit ci-dessus.- to modify a biological activity in the context of gene therapy, for example as described above.

Selon un autre aspect, la présente invention concerne également un kit comprenant une protéine de fusion, un acide nucléique, une cassette ou un vecteur d’expression selon l’invention et/ou une cellule hôte selon l’invention, et optionnellement une source lumineuse capable d’activer le domaine photorécepteur de la protéine de fusion.According to another aspect, the present invention also relates to a kit comprising a fusion protein, a nucleic acid, a cassette or an expression vector according to the invention and / or a host cell according to the invention, and optionally a light source capable of activating the photoreceptor domain of the fusion protein.

Elle concerne également l’utilisation de ce kit pour mettre en œuvre un procédé selon l’invention, notamment pour induire une activité recombinase dans une cellule et/ou pour modifier in vivo, ex vivo ou in vitro un ou plusieurs acides nucléiques.It also relates to the use of this kit for implementing a method according to the invention, in particular for inducing recombinase activity in a cell and / or for modifying in vivo, ex vivo or in vitro one or more nucleic acids.

Toutes les références citées dans cette description sont incorporées par référence dans la présente demande. D'autres caractéristiques et avantages de l'invention apparaîtront mieux à la lecture des exemples suivants donnés à titre illustratif et non limitatif.All the references cited in this description are incorporated by reference into the present application. Other characteristics and advantages of the invention will appear better on reading the following examples given by way of illustration and not limitation.

ExemplesExamples

Matériel et méthodesMaterial and methods

Système rapporteur permettant de quantifier l’activité CRE recombinase in vivo.Reporter system for quantifying CRE recombinase activity in vivo.

Le système rapporteur est illustré sur la Figure 1. Ce système est intégré au locus HO du génome de cellules de levure Saccharomyces cerevisiae. Il est constitué des éléments de séquence consécutifs suivants:The reporter system is illustrated in Figure 1. This system is integrated into the HO locus of the yeast cell genome Saccharomyces cerevisiae. It consists of the following consecutive sequence elements:

- PromTEF: promoteur conférant une expression constitutive (provient du gène TEF1 de Saccharomyces cerevisiae').- PromTEF: promoter conferring a constitutive expression (comes from the TEF1 gene of Saccharomyces cerevisiae ').

- LoxP: site de reconnaissance de la CRE recombinase.- LoxP: CRE recombinase recognition site.

-K1LEU2: séquence codante du gène K1LEU2 de la levure Kluyveromyces lactis, codant pour une Beta-isopropylmalate dehydrogenase.-K1LEU2: coding sequence of the K1LEU2 gene from the yeast Kluyveromyces lactis, coding for a Beta-isopropylmalate dehydrogenase.

-TermADHl: sequence terminatrice de transcription provenant du gène ADH1 (Alcohol DeHydrogenase 1) de Saccharomyces cerevisiae. Cette séquence comporte un ou plusieurs codons STOP qui assurent également une terminaison de la traduction.-TermADHl: transcription terminator sequence originating from the ADH1 (Alcohol DeHydrogenase 1) gene from Saccharomyces cerevisiae. This sequence comprises one or more STOP codons which also ensure termination of the translation.

-LoxP: site de reconnaissance de la CRE recombinase.-LoxP: CRE recombinase recognition site.

- GFP: séquence codante de la Green Fluorescent Protein- GFP: coding sequence of the Green Fluorescent Protein

- TermCYCl : séquence terminatrice de transcription provenant du gène CYC1 de Saccharomyces cerevisiae.- TermCYCl: transcription terminator sequence originating from the CYC1 gene of Saccharomyces cerevisiae.

En l'absence d'activité CRE recombinase, les cellules portant cette construction ne sont pas fluorescentes. En présence d'activité CRE recombinase, la recombinaison entre les deux sites loxP génère l'excision de la portion KlLEU2-TermADHl, et place ainsi la portion GFP sous l'activité transcriptionnelle conférée par la portion PromTEF. Les cellules ayant subi cette excision expriment ainsi la protéine GFP et sont fluorescentes.In the absence of CRE recombinase activity, cells carrying this construct are not fluorescent. In the presence of CRE recombinase activity, the recombination between the two loxP sites generates the excision of the KlLEU2-TermADHl portion, and thus places the GFP portion under the transcriptional activity conferred by the PromTEF portion. The cells having undergone this excision thus express the GFP protein and are fluorescent.

Conditions expérimentales du test de l'activité CRE recombinase.Experimental conditions for the CRE recombinase activity test.

Des cellules de levures correspondant à la souche GY1761 de génotype MATalpha his3A200 leu2\l Irpl \63 ura3 \0 hoés::loxKlLEU2loxGFP et portant le système rapporteur décrit ci-dessus sont transformées avec un plasmide portant une cassette d'expression d'une protéine candidate susceptible d'avoir une activité CRE recombinase. La souche de levure ainsi transformée est cultivée durant une nuit sur milieu sélectif dans des conditions où la protéine candidate est exprimée. Ce milieu est appelé milieu de préculture ci-après. Le lendemain, ΙΟΟμΙ de cette culture sont transférés dans une plaque 96-puits de plastique transparent à fond plat et, le cas échéant, illuminé à température ambiante dans les conditions souhaitées de temps, longueur d'onde et énergie lumineuse. Une partie des cellules de cet échantillon sont ensuite cultivées durant 4 heures dans un milieu correspondant à des conditions où la protéine candidate n'est pas exprimée. Ce milieu est appelé milieu de récupération ci-après. Un échantillon de ces cellules est ensuite transféré dans un milieu appelé milieu d'analyse ci-après et analysé à la vitesse de 400 évènements par seconde sur un cytomètre en flux FACSCalibur (BDBiosciences) dans lequel la GFP a été excitée avec un laser à 488 nm et la fluorescence émise à travers un filtre 530/30 a été quantifiée pour produire des données telles que celles représentées sur la Figure 2A. En fonction de la fluorescence des cellules, celles-ci sont classées en deux groupes: OFF (fluorescence faible) et ON (fluorescence élevée) qui correspondent aux cellules qui n’ont pas (OFF) ou qui ont (ON) activé le système rapporteur. La proportion de cellules ON est utilisée comme indicateur de l'activité CRE recombinase, comme indiqué sur la Figure 2B.Yeast cells corresponding to the strain GY1761 of genotype MATalpha his3A200 leu2 \ l Irpl \ 63 ura3 \ 0 hoés :: loxKlLEU2loxGFP and carrying the reporter system described above are transformed with a plasmid carrying a protein expression cassette candidate likely to have CRE recombinase activity. The yeast strain thus transformed is cultivated overnight on selective medium under conditions where the candidate protein is expressed. This medium is called preculture medium below. The next day, ΙΟΟμΙ of this culture are transferred to a 96-well transparent plastic plate with a flat bottom and, if necessary, illuminated at room temperature under the desired conditions of time, wavelength and light energy. Part of the cells in this sample are then cultured for 4 hours in a medium corresponding to conditions where the candidate protein is not expressed. This medium is called recovery medium below. A sample of these cells is then transferred to a medium called analysis medium below and analyzed at the speed of 400 events per second on a FACSCalibur flow cytometer (BDBiosciences) in which the GFP was excited with a 488 laser. nm and the fluorescence emitted through a 530/30 filter was quantified to produce data such as that shown in Figure 2A. Depending on the fluorescence of the cells, these are classified into two groups: OFF (weak fluorescence) and ON (high fluorescence) which correspond to cells which do not have (OFF) or which have (ON) activated the reporter system. . The proportion of ON cells is used as an indicator of CRE recombinase activity, as shown in Figure 2B.

Milieux et tampons utilisésMedia and buffers used

Le tampon TBS est une dilution au dixième dans l'eau du tampon TBS10X, lequel correspond à une solution aqueuse (Tris 30 g/L, NaCl 80 g/L, KO 2 g/L) ajustée à pH 7,4 avec de l'acide chlorydrique fumant.The TBS buffer is a tenth dilution in water of the TBS10X buffer, which corresponds to an aqueous solution (Tris 30 g / L, NaCl 80 g / L, KO 2 g / L) adjusted to pH 7.4 with l fuming hydrochloric acid.

Les milieux de culture de cellules de levure sont préparés à partir d'un mélange poudreux d'acides aminés et de nucléotides appelé MixW dont la composition est la suivante: Adénine (Ad) 1 g, Uracile (U) 2 g, Alanine (A) 2 g, Arginine (R) 2 g, Aspartate (D) 2 g, Asparagine (N) 2 g, Cystéine (C) 2 g, Glutamate (E) 2 g, Glutamine (Q) 2 g, Glycine (G) g, Histidine (H) 2 g, Isoleucine (I) 2 g, Leucine (L) 4 g, Lysine (K) 2 g, Méthionine (M) 2 g, Phénylalanine (F) 2 g, Proline (P) 2 g, Sérine (S) 2 g, Thréonine (T) 2 g, Tyrosine (Y) 2 g, Valine (V) 2 g. D'autres mélanges, appelés MixWX’ où X désigne un des composés du mélange, sont préparés de la même manière mais en omettant le composé X. Ainsi, par exemple, le mélange MixW’M’ ne contient pas de méthionine. De manière similaire, d'autres mélanges, appelés MixW’X’Y’ sont préparés en omettant deux composés désignés par X et Y.The yeast cell culture media are prepared from a powdery mixture of amino acids and nucleotides called MixW, the composition of which is as follows: Adenine (Ad) 1 g, Uracil (U) 2 g, Alanine (A ) 2 g, Arginine (R) 2 g, Aspartate (D) 2 g, Asparagine (N) 2 g, Cysteine (C) 2 g, Glutamate (E) 2 g, Glutamine (Q) 2 g, Glycine (G) g, Histidine (H) 2 g, Isoleucine (I) 2 g, Leucine (L) 4 g, Lysine (K) 2 g, Methionine (M) 2 g, Phenylalanine (F) 2 g, Proline (P) 2 g , Serine (S) 2 g, Threonine (T) 2 g, Tyrosine (Y) 2 g, Valine (V) 2 g. Other mixtures, called MixWX ’where X denotes one of the compounds in the mixture, are prepared in the same way but omitting compound X. Thus, for example, the MixW’M’ mixture does not contain methionine. Similarly, other mixtures, called MixW’X’Y ’are prepared by omitting two compounds designated by X and Y.

Protocole PI:PI Protocol:

La procédure décrite dans la section 'Conditions expérimentales du test de l'activité CRE recombinase' ci-dessus est appliquée, avec les milieux suivants:The procedure described in the section 'Experimental conditions for testing the CRE recombinase activity' above is applied, with the following media:

- Milieu de préculture: 6,7 g de Yeast Nitrogen Base without Amino-Acids (Difco, BDBiosciences), 20g de galactose, 20g de raffinose, et 2g de MixW’ décrit ci-dessus dont dilués dans IL d'eau distillée, ImL de NaOH IM est rajouté et la solution est autoclavée à 0.5 bar.- Preculture medium: 6.7 g of Yeast Nitrogen Base without Amino-Acids (Difco, BDBiosciences), 20g of galactose, 20g of raffinose, and 2g of MixW 'described above, diluted in IL of distilled water, ImL of NaOH IM is added and the solution is autoclaved at 0.5 bar.

- Milieu de récupération: 6,7 g de Yeast Nitrogen Base without Amino-Acids (Difco, BDBiosciences), 20g de glucose, et 2g de MixW’ décrit ci-dessus dont dilués dans IL d'eau distillée, ImL de NaOH IM est rajouté et la solution est autoclavée à 0.5 bar.- Recovery medium: 6.7 g of Yeast Nitrogen Base without Amino-Acids (Difco, BDBiosciences), 20g of glucose, and 2g of MixW 'described above, diluted in IL of distilled water, ImL of NaOH IM is added and the solution is autoclaved at 0.5 bar.

- Milieu d'analyse: Tampon TBS auquel est rajouté ImM d'azide de sodium.- Analysis medium: TBS buffer to which is added ImM sodium azide.

Protocole P2:P2 protocol:

La procédure décrite dans la section 'Conditions expérimentales du test de l'activité CRE recombinase' ci-dessus est appliquée, avec les milieux suivants:The procedure described in the section 'Experimental conditions for testing the CRE recombinase activity' above is applied, with the following media:

- Milieu de préculture: 6,7 g de Yeast Nitrogen Base without Amino-Acids (Difco, BDBiosciences), 20g de glucose, et 2g de MixW’M’ décrit ci-dessus dont dilués dans IL d'eau distillée, ImL de NaOH IM est rajouté et la solution est autoclavée à 0.5 bar.- Preculture medium: 6.7 g of Yeast Nitrogen Base without Amino-Acids (Difco, BDBiosciences), 20g of glucose, and 2g of MixW'M 'described above, diluted in IL of distilled water, ImL of NaOH IM is added and the solution is autoclaved at 0.5 bar.

- Milieu de récupération: 6,7 g de Yeast Nitrogen Base without Amino-Acids (Difco, BDBiosciences), 20g de glucose, et 2g de MixW’H’ décrit ci-dessus dont dilués dans IL d'eau distillée, ImL de NaOH IM est rajouté et la solution est autoclavée à 0.5 bar.- Recovery medium: 6.7 g of Yeast Nitrogen Base without Amino-Acids (Difco, BDBiosciences), 20g of glucose, and 2g of MixW'H 'described above, diluted in IL of distilled water, ImL of NaOH IM is added and the solution is autoclaved at 0.5 bar.

- Milieu d'analyse: Tampon TBS.- Analysis medium: TBS buffer.

Protocole P3:P3 protocol:

La procédure décrite dans la section 'Conditions expérimentales du test de l'activité CRE recombinase' ci-dessus est appliquée, avec les milieux suivants:The procedure described in the section 'Experimental conditions for testing the CRE recombinase activity' above is applied, with the following media:

- Milieu de préculture: 6,7 g de Yeast Nitrogen Base without Amino-Acids (Difco, BDBiosciences), 20g de glucose, et 2g de MixW’M U’ décrit ci-dessus dont dilués dans IL d'eau distillée, ImL de NaOH IM est rajouté et la solution est autoclavée à 0.5 bar.- Preculture medium: 6.7 g of Yeast Nitrogen Base without Amino-Acids (Difco, BDBiosciences), 20 g of glucose, and 2 g of MixW'M U 'described above, diluted in IL of distilled water, ImL of NaOH IM is added and the solution is autoclaved at 0.5 bar.

- Milieu de récupération: 6,7 g de Yeast Nitrogen Base without Amino-Acids (Difco, BDBiosciences), 20g de glucose, et 2g de MixWH U- décrit ci-dessus dont dilués dans IL d'eau distillée, ImL de NaOH IM est rajouté et la solution est autoclavée à 0.5 bar.- Recovery medium: 6.7 g of Yeast Nitrogen Base without Amino-Acids (Difco, BDBiosciences), 20g of glucose, and 2g of MixWH U - described above, diluted in IL of distilled water, IML of NaOH IM is added and the solution is autoclaved at 0.5 bar.

- Milieu d'analyse: Tampon TBS.- Analysis medium: TBS buffer.

RésultatsResults

Effets de mutations de l'extrémité en C-terminale de la CRE recombinaseEffects of mutations of the C-terminal end of CRE recombinase

Le mutant Cre_Stop341 a été obtenu par mutagénèse dirigée d'un plasmide où le codon D341 a été remplacé par un codon Stop. Le mutant Cre_A340A341 a été obtenu par mutagénèse dirigée d'un plasmide où les codons E340 et D341 ont été remplacés par A340 et A341. Dans les plasmides ainsi obtenus, l'expression de la protéine recombinase sauvage ou mutante est placée sous le contrôle du promoteur du gène GAL1 de Saccharomyces cerevisiae. Les conditions du test sont celles du protocole PI sans illumination.The Cre_Stop341 mutant was obtained by site-directed mutagenesis of a plasmid where the codon D341 has been replaced by a stop codon. The Cre_A340A341 mutant was obtained by site-directed mutagenesis of a plasmid where the codons E340 and D341 have been replaced by A340 and A341. In the plasmids thus obtained, the expression of the wild-type or mutant protein recombinase is placed under the control of the promoter of the GAL1 gene from Saccharomyces cerevisiae. The test conditions are those of the PI protocol without illumination.

Les résultats montrant l'activité CRE recombinase de ces mutants sont présentés sur la Figure 3. Le mutant mutant Cre_Stop341 présente une activité complète. Ceci démontre que la recombinase CRE délétée de 3 acides-aminés C-terminaux est active. D'autre part, les résultats montrent que le mutant Cre_A340A341 présente une activité légèrement réduite par rapport à la CRE recombinase sauvage.The results showing the CRE recombinase activity of these mutants are presented in FIG. 3. The mutant Cre_Stop341 mutant exhibits complete activity. This demonstrates that the CRE recombinase deleted from 3 C-terminal amino acids is active. On the other hand, the results show that the Cre_A340A341 mutant has a slightly reduced activity compared to wild-type CRE recombinase.

Effets de mutations de l'extrémité en N-terminale de la CRE recombinaseEffects of mutations of the N-terminal end of CRE recombinase

Les mutants Cre_A2-21 et Cre_A2-28 ont été obtenus parThe mutants Cre_A2-21 and Cre_A2-28 were obtained by

i) PCR où la matrice ADN a été le plasmide pGY115 et où les amorces ont été 1L80 dont la séquence est 5'-tggtatctttatagtcctgtcgg-3' (SEQID NO : 15) et, pour Cre_A221 1L71 dont la séquence est 5'-gaacatgtccatcaggttcttgcgaacctccatttaacactcagataa-3' (SEQ ID NO : 16), et pour Cre_A2-28 1L72 dont la séquence est 5'agaaaacgcctggcgatccctgaacatgtccatttaacactcagataa-3' (SEQ ID NO : 17).i) PCR where the DNA template was the plasmid pGY115 and where the primers were 1L80 whose sequence is 5'-tggtatctttatagtcctgtcgg-3 '(SEQID NO: 15) and, for Cre_A221 1L71 whose sequence is 5'-gaacatgtccatcaggctcttgcga 3 '(SEQ ID NO: 16), and for Cre_A2-28 1L72 whose sequence is 5'agaaaacgcctggcgatccctgaacatgtccatttaacactcagataa-3' (SEQ ID NO: 17).

ii) digestion du plasmide pGY115 par l’enzyme Agel et purification sur gel d'agarose 1% du fragment de 6.3Kb iii) co-transformation des produits des étapes i) et ii) dans une souche de levure trpld et sélection sur milieu sans tryptophane.ii) digestion of the plasmid pGY115 with the enzyme Agel and purification on agarose gel 1% of the 6.3Kb fragment iii) co-transformation of the products of steps i) and ii) in a yeast strain trpld and selection on medium without tryptophan.

La dénomination Δχ-y indique ici la délétion des acides aminés situés de la position x incluse à la position y incluse.The name Δχ-y indicates here the deletion of the amino acids located from position x included to position y included.

Dans les plasmides ainsi obtenus, l'expression de la protéine recombinase sauvage ou mutante est placée sous le contrôle du promoteur du gène GAL1 de Saccharomyces cerevisiae. Les conditions du test sont celles du protocole PI sans illumination. Les résultats montrant l'activité de ces mutants sont présentés sur la figure 4. L'activité CRE du mutant Cre_A2-21 est complète tandis que celle du mutant Cre_A2-28 est réduite de moins de 10%.In the plasmids thus obtained, the expression of the wild-type or mutant protein recombinase is placed under the control of the promoter of the GAL1 gene from Saccharomyces cerevisiae. The test conditions are those of the PI protocol without illumination. The results showing the activity of these mutants are presented in FIG. 4. The CRE activity of the Cre_A2-21 mutant is complete while that of the Cre_A2-28 mutant is reduced by less than 10%.

Construction de fusions LOV2-CREConstruction of LOV2-CRE mergers

Le photorécepteur iLID dérivé de asLOV2 et décrit dans l'article de Guntas et al. 2015 P.N.A.S. 112(1):112-117 a été fusionné en N-terminal de plusieurs variants de la protéine CRE recombinase. La méthode utilisée est schématisée sur la Figure 5. Elle a été de transférer, par recombinaison homologue spontanée dans des cellules de levure, un fragment d'ADN amplifié par PCR et contenant la séquence du variant CRE ainsi que, éventuellement, certaines modifications de séquence souhaitées en N-terminal dudit variant, dans un plasmide contenant un système d'expression et la séquence codante de iLID.The iLID photoreceptor derived from asLOV2 and described in the article by Guntas et al. 2015 P.N.A.S. 112 (1): 112-117 has been fused to the N-terminal of several variants of the CRE recombinase protein. The method used is shown diagrammatically in FIG. 5. It was to transfer, by spontaneous homologous recombination into yeast cells, a DNA fragment amplified by PCR and containing the sequence of the CRE variant as well as, possibly, certain sequence modifications. desired at the N-terminal of said variant, in a plasmid containing an expression system and the coding sequence of iLID.

En particulier, la construction iLID-Crel9 a été obtenue par i) PCR où la matrice ADN a été le plasmide pGY115 et où les amorces ont été 1G42 dont la séquence est 5'AGAAAAGGAGAGGGCCAAGA-3' (SEQ ID NO : 18) et 1M43 dont la séquence est 5'CTTATTAAGAAAACCGCATTTCAAATCgccacgagtgatgaggttcgcaag-3' (SEQ ID NO : 19), ii) digestion du plasmide pGY408 par les enzymes Mfel et BsiWI et purification sur gel d'agarose 1% du fragment de 4,4Kb, iii) co-transformation des produits des étapes i) et ii) dans la souche de levure GY 1761 et sélection sur milieu sans tryptophane.In particular, the construction iLID-Crel9 was obtained by i) PCR where the DNA template was the plasmid pGY115 and where the primers were 1G42 whose sequence is 5'AGAAAAGGAGAGGGCCAAGA-3 '(SEQ ID NO: 18) and 1M43 whose sequence is 5'CTTATTAAGAAAACCGCATTTCAAATCgccacgagtgatgaggttcgcaag-3 '(SEQ ID NO: 19), ii) digestion of the plasmid pGY408 with the enzymes Mfel and BsiWI and purification on agarose gel 1% of the fragment of 4.4Kb, iii) co- transformation of the products of steps i) and ii) in the yeast strain GY 1761 and selection on medium without tryptophan.

De manière similaire, la construction iLID-Cre27 a été obtenue en appliquant les étapes i) à iii) ci-dessus avec la modification suivante de l'étape i): utilisation de l'amorceSimilarly, the iLID-Cre27 construct was obtained by applying steps i) to iii) above with the following modification of step i): use of the primer

1M51 dont la séquence est 5'-CTTATTAAGAAAACCGCATTT CAAATCgccctgatggacatgttcagggat-3' (SEQID NO :20) à la place de l'amorce 1M43.1M51 whose sequence is 5'-CTTATTAAGAAAACCGCATTT CAAATCgccctgatggacatgttcagggat-3 '(SEQID NO: 20) in place of the primer 1M43.

De manière similaire, la construction iLID-Cre32 contenue dans le plasmide pGY415 a été obtenue en appliquant les étapes i) à iii) ci-dessus avec la modification suivante de l'étape i): utilisation de l'amorce 1M53 dont la séquence est 5'CTTATTAAGAAAACCGCA TTTCAAATCgccagggatcgccaggcgttttctg-3' (SEQ ID NO :21) à la place de l'amorce 1M43.Similarly, the construction iLID-Cre32 contained in the plasmid pGY415 was obtained by applying steps i) to iii) above with the following modification of step i): use of the primer 1M53 whose sequence is 5'CTTATTAAGAAAACCGCA TTTCAAATCgccagggatcgccaggcgttttctg-3 '(SEQ ID NO: 21) in place of the primer 1M43.

De manière similaire, la construction iLID-CreAA20 contenue dans le plasmide pGY416 a été obtenue en appliquant les étapes i) à v) ci-dessus avec les modifications suivantes de l'étape i): utilisation de l'amorce 1M44 dont la séquence est 5'CTTATTAAG AAAACCGCATTTCAAATCgccagtgatgaggttcgcaagaac-3' (SEQ ID NO :22) à la place de l'amorce 1M43 et utilisation de la matrice pGY372 au lieu de la matrice pGY115.Similarly, the construction iLID-CreAA20 contained in the plasmid pGY416 was obtained by applying steps i) to v) above with the following modifications of step i): use of the primer 1M44 whose sequence is 5'CTTATTAAG AAAACCGCATTTCAAATCgccagtgatgaggttcgcaagaac-3 '(SEQ ID NO: 22) in place of the primer 1M43 and use of the matrix pGY372 instead of the matrix pGY115.

Dans les constructions ainsi obtenues, l'expression de la protéine de fusion est placée sous le contrôle du promoteur du gène GAL1 de Saccharomyces cerevisiae.In the constructions thus obtained, the expression of the fusion protein is placed under the control of the promoter of the GAL1 gene from Saccharomyces cerevisiae.

Démonstration de la photoactivation de ces protéines de fusion.Demonstration of the photoactivation of these fusion proteins.

L'activité des protéines de fusions a été évaluée en appliquant ou non une illumination des cellules selon le protocole PI. Les résultats obtenus sont présentés en figure 6. La fusion iLID-Crel9 présente une activité de 25% sans illumination et de 32% après illumination, la fusion iLID-Cre27 présente une activité de 50% sans illumination et de 60% après illumination, la fusion iLID-Cre32 présente une activité de 15% sans illumination et de 45% après illumination, et la fusion iLID-CreAA20 présente une activité nulle sans illumination et de 18% après illumination.The activity of the fusion proteins was evaluated by applying or not applying cell illumination according to the PI protocol. The results obtained are presented in FIG. 6. The iLID-Crel9 fusion has an activity of 25% without illumination and of 32% after illumination, the iLID-Cre27 fusion has an activity of 50% without illumination and of 60% after illumination, the iLID-Cre32 fusion exhibits 15% activity without illumination and 45% after illumination, and iLID-CreAA20 fusion exhibits zero activity without illumination and 18% after illumination.

Obtention et activités des constructions iLID(QI}-xn-Cre32Obtaining and activities of iLID constructions (QI} -x n -Cre32

Une série de mutants notés iLID(QI)-xi-Cre32 a été générée afin d'introduire un acide aminé aléatoire à la jonction entre iLID et Cre32. Cette série a été obtenue en amplifiant par PCR la séquence comportant une portion de la CRE recombinase en utilisant l'amorce antisens 1F14 de séquence 5'-gtgatgacggtgaaaacctc-3' (SEQ ID NO :23) et l’amorce sens 1N24 de séquence 5’-CTT ATT AAG AAA ACC GCA TTT CAA ATCVNN-agg gat cgc cag gcg ttt tct g-3' (SEQ ID NO :24) où V correspond aléatoirement àA series of mutants noted iLID (QI) -xi-Cre32 was generated in order to introduce a random amino acid at the junction between iLID and Cre32. This series was obtained by PCR amplification of the sequence comprising a portion of CRE recombinase using the antisense primer 1F14 of sequence 5'-gtgatgacggtgaaaacctc-3 '(SEQ ID NO: 23) and the sense primer 1N24 of sequence 5 '-CTT ATT AAG AAA ACC GCA TTT CAA ATCVNN-agg gat cgc cag gcg ttt tct g-3' (SEQ ID NO: 24) where V corresponds randomly to

A, C ou G, et N correspond aléatoirement à A, T, C ou G. L'amplicon obtenu a été inséré par recombinaison homologue dans le vecteur de 4,4kb issu de la digestion NcoI-BsiWI du plasmide pGY417.A, C or G, and N randomly corresponds to A, T, C or G. The amplicon obtained was inserted by homologous recombination into the 4.4 kb vector resulting from the NcoI-BsiWI digestion of the plasmid pGY417.

Une autre série de mutants notés iLID(QI)-X2-Cre32 a été générée de manière similaire en utilisant l’amorce 1N25 de séquence 5’-CTT ATT AAG AAA ACC GCA TTT CAA ATC-VNN VNN-agg gat cgc cag gcg ttt tct g-3’ (SEQ ID NO :25) au lieu de l’amorce 1N24.Another series of mutants noted iLID (QI) -X2-Cre32 was similarly generated using the primer 1N25 of sequence 5'-CTT ATT AAG AAA ACC GCA TTT CAA ATC-VNN VNN-agg gat cgc cag gcg ttt tct g-3 '(SEQ ID NO: 25) instead of the primer 1N24.

Une autre série de mutants notés iLID(QI)-X3-Cre32 a été générée de manière similaire en utilisant l’amorce 1N26 de séquence 5’-CTT ATT AAG AAA ACC GCA TTT CAA ATC-VNN VNN VNN-agg gat cgc cag gcg ttt tct g-3' (SEQ ID NO :26) au lieu de l’amorce 1N24. Dans les constructions ainsi obtenues, l’expression de la protéine de fusion est placée sous le contrôle du promoteur du gène GAL1 de Saccharomyces cerevisiae.Another series of mutants noted iLID (QI) -X3-Cre32 was similarly generated using the primer 1N26 of sequence 5'-CTT ATT AAG AAA ACC GCA TTT CAA ATC-VNN VNN VNN-agg gat cgc cag gcg ttt tct g-3 '(SEQ ID NO: 26) instead of the primer 1N24. In the constructions thus obtained, the expression of the fusion protein is placed under the control of the promoter of the GAL1 gene from Saccharomyces cerevisiae.

L’activité des protéines de fusions a été évaluée en appliquant ou non une illumination selon le protocole PL La Figure 7 présente les activités sans ou avec illumination pour plusieurs constructions iLID(QI)-xn-Cre32 ainsi générées. Ces constructions présentent un gain d’activité après illumination.The activity of the fusion proteins was evaluated by applying or not applying illumination according to the PL protocol. FIG. 7 presents the activities without or with illumination for several iLID (QI) -x n -Cre32 constructs thus generated. These constructions have a gain in activity after illumination.

Activité lors de différentes conditions d'illuminationActivity under different lighting conditions

Des conditions d’illumination de temps et d’intensités différentes ont été appliquées à des cellules de levure contenant la construction iLID_Cre32 ou la construction iLID_CreAA20, placée dans deux types de cassette d’expression. La première cassette comprend le promoteur du gène GAL1. Les résultats obtenus avec cette cassette et selon le protocole PI, en appliquant ou non une illumination des cellules selon des intensités et des durées variables, sont présentés sur la figure 8. La seconde cassette comprend le promoteur du gène MET 17. Les résultats obtenus avec cette cassette et selon le protocole P2, en appliquant ou non une illumination des cellules selon des intensités et des durées variables, sont présentés sur la figure 9. Ces résultats montrent que l’activité recombinase des constructions est activable dans des conditions de temps et d’intensité très variées.Different illumination conditions of time and intensity were applied to yeast cells containing the iLID_Cre32 construct or the iLID_CreAA20 construct, placed in two types of expression cassette. The first cassette includes the promoter of the GAL1 gene. The results obtained with this cassette and according to the PI protocol, whether or not applying an illumination of the cells according to variable intensities and durations, are presented in FIG. 8. The second cassette comprises the promoter of the MET 17 gene. The results obtained with this cassette and according to the protocol P2, by applying or not applying an illumination of the cells according to variable intensities and durations, are presented in FIG. 9. These results show that the recombinase activity of the constructs can be activated under time and time conditions. 'very varied intensity.

Ajout d'un peptide d'adressage au noyau.Addition of an addressing peptide to the nucleus.

Une construction NLS_iLID_CreAA20 a été étudiée. Cette construction correspond à la fusion à l'extrémité N-terminale de iLID_CreAA20 d'un peptide dont la séquence VPKKKRKV (SEQ ID NO : 27) (Nuclear Localization Signal, NLS) est connue pour adresser des protéines au noyau des cellules, comme indiqué dans l'article de Cheng et al. Endocrinology 157: 127-140, 2016, suivie de la séquence GGSGG (SEQ ID NO : 28). Cette construction a été obtenue en réalisant une amplification PCR avec les amorces 1080 (5’-atgtgagttacctcactcat-3' (SEQ ID NO : 29)) et 1084 (5'GCTAAAGAACCGTGATGGTGGTGATGATGTGAACCTCTCATACCTCCGGAac caccgacttttctcttct-3' (SEQ ID NO : 30)) sur le plasmide pGY491 et en co-transformant le produit de ladite amplification avec le fragment SacI-EcoRI du plasmide pGY466 dans une souche de levure. Dans les constructions ainsi obtenues, l'expression de la protéine de fusion est placée sous le contrôle du promoteur du gène MET17 de Saccharomyces cerevisiae. L'activité de cette construction a été évaluée en appliquant le protocole P2. L'activité de cette construction est présentée dans les résultats de la figure 10.An NLS_iLID_CreAA20 construction was studied. This construction corresponds to the fusion at the N-terminal end of iLID_CreAA20 of a peptide whose sequence VPKKKRKV (SEQ ID NO: 27) (Nuclear Localization Signal, NLS) is known to target proteins to the cell nucleus, as indicated in the article by Cheng et al. Endocrinology 157: 127-140, 2016, followed by the sequence GGSGG (SEQ ID NO: 28). This construction was obtained by carrying out a PCR amplification with the primers 1080 (5'-atgtgagttacctcactcat-3 '(SEQ ID NO: 29)) and 1084 (5'GCTAAAGAACCGTGATGGTGGTGATGATGTGAACCTCTCATACCTCCGGAac caccgacttttctctQ NO: 3') plasmid pGY491 and by co-transforming the product of said amplification with the SacI-EcoRI fragment of the plasmid pGY466 in a yeast strain. In the constructions thus obtained, the expression of the fusion protein is placed under the control of the promoter of the MET17 gene from Saccharomyces cerevisiae. The activity of this construction was evaluated by applying the P2 protocol. The activity of this construction is presented in the results of Figure 10.

Test comparatif avec le système nMag/pMag-CREComparative test with the nMag / pMag-CRE system

Un système de recombinase activable basé sur la dimérisation photo-inductible de peptides appelés nMag et pMag, a été décrit dans l'article de Kawano et al. Nat. Chem. Biol. 2016 12(12): 1059-1064. Ce système comporte deux protéines de fusion distinctes qui doivent être exprimées dans la même cellule. Afin de comparer les performances de ce système à celles de la présente invention, deux constructions plasmidiques ont été réalisées: pMetl7-Cre!8to59-nMag-NLS-URA (SEQ ID NO : 31) etpMetl7-ATG-NLSpMag-Cre60to343-TRP (SEQ ID NO : 32). Dans ces constructions, l'expression de chacune des protéines de fusion est placée sous le contrôle du promoteur du gène MET 17 de Saccharomyces cerevisiae. La combinaison de ces deux plasmides est appelée nMag/pMag-CRE ci-après.An activatable recombinase system based on the photo-inducible dimerization of peptides called nMag and pMag, was described in the article by Kawano et al. Nat. Chem. Biol. 2016 12 (12): 1059-1064. This system has two separate fusion proteins that must be expressed in the same cell. In order to compare the performance of this system with that of the present invention, two plasmid constructions were carried out: pMetl7-Cre! 8to59-nMag-NLS-URA (SEQ ID NO: 31) and pMetl7-ATG-NLSpMag-Cre60to343-TRP ( SEQ ID NO: 32). In these constructions, the expression of each of the fusion proteins is placed under the control of the promoter of the MET 17 gene from Saccharomyces cerevisiae. The combination of these two plasmids is called nMag / pMag-CRE below.

L'activité de ce système a été testée en comparaison de la présente invention selon le protocole P3 et les résultats obtenus sont présentés sur la figure IL Ces résultats confirment que le système nMag/pMag-CRE est photoactivable (activité de 10% sans illumination et de 35% après illumination). Ils montrent également que ce système est moins performant que le système de la présente invention, en particulier que les fusions iLID_Cre32 et iLID_CreAA20: celles-ci présentent un différentiel d'activité lié à l’illumination qui est supérieur.The activity of this system was tested in comparison with the present invention according to the P3 protocol and the results obtained are presented in FIG. These results confirm that the nMag / pMag-CRE system is photoactivable (activity of 10% without illumination and 35% after illumination). They also show that this system is less efficient than the system of the present invention, in particular that the iLID_Cre32 and iLID_CreAA20 mergers: these have a higher activity-related difference in illumination.

Claims (17)

Revendicationsclaims 1. Protéine de fusion comprenant un domaine recombinase fusionné à un domaine photorécepteur et dans laquelle l'activité recombinase est photoactivable.1. A fusion protein comprising a recombinase domain fused to a photoreceptor domain and in which the recombinase activity is photoactivatable. 2. Protéine de fusion selon la revendication 1, dans laquelle le domaine recombinase est fusionné en N-terminal au domaine photorécepteur.2. A fusion protein according to claim 1, in which the recombinase domain is fused in N-terminal to the photoreceptor domain. 3. Protéine de fusion selon l’une quelconque des revendications précédentes, dans laquelle le domaine photorécepteur comprend, ou consiste en, un domaine LOV2 de phototropine, ou un variant ou dérivé de celui-ci.3. A fusion protein according to any one of the preceding claims, wherein the photoreceptor domain comprises, or consists of, a LOV2 domain of phototropin, or a variant or derivative thereof. 4. Protéine de fusion selon l’une quelconque des revendications précédentes, dans laquelle le domaine photorécepteur est un dérivé d’un domaine LOV2, de préférence un domaine iLID (improved light inducible dimer), et de manière plus particulièrement préférée un domaine iLID dérivé du domaine LOV2 de la phototropine 1 à'Avenu sativa.4. Fusion protein according to any one of the preceding claims, in which the photoreceptor domain is a derivative of a LOV2 domain, preferably an iLID domain (improved light inducible dimer), and more particularly a derivative iLID domain. of the LOV2 domain of phototropin 1 in Avenida sativa. 5. Protéine de fusion selon l’une quelconque des revendications précédentes, dans laquelle le domaine photorécepteur de la protéine de fusion est un domaine iLID présentant la séquence SEQ ID NO : 13 dans laquelle X représente un à trois acides aminés, de préférence X représente A, D, K, L, IL, W, AI ou QPG.5. Fusion protein according to any one of the preceding claims, in which the photoreceptor domain of the fusion protein is an iLID domain having the sequence SEQ ID NO: 13 in which X represents one to three amino acids, preferably X represents A, D, K, L, IL, W, AI or QPG. 6. Protéine de fusion selon l’une quelconque des revendications précédentes, dans laquelle le domaine recombinase est sélectionné dans le groupe constitué de la recombinase CRE (SEQ ID NO : 1), et des variants fonctionnels de celle-ci.6. A fusion protein according to any one of the preceding claims, wherein the recombinase domain is selected from the group consisting of CRE recombinase (SEQ ID NO: 1), and functional variants thereof. 7. Protéine de fusion selon l’une quelconque des revendications précédentes, dans laquelle le domaine recombinase est un variant fonctionnel de la recombinase CRE comprenant, ou consistant en, la séquence SEQ ID NO : 2, ou une séquence présentant au moins 80% d’identité de séquence avec la SEQ ID NO : 2.7. A fusion protein according to any one of the preceding claims, in which the recombinase domain is a functional variant of the CRE recombinase comprising, or consisting of, the sequence SEQ ID NO: 2, or a sequence having at least 80% d sequence identity with SEQ ID NO: 2. 8. Protéine de fusion selon 1 une quelconque des revendications précédentes, dans laquelle le domaine recombinase est un variant fonctionnel de la recombinase CRE, ledit variant comprenant, ou consistant en, une recombinase CRE de SEQ ID NO : 1 dans laquelle 18, 19, 26 ou 31 acides aminés ont été délétés en N-terminal, et présentant de manière optionnelle une substitution au niveau du résidu correspondant au résidu E340 de la SEQ ID NO : 1 et/ou une substitution au niveau du résidu correspondant au résidu D341 de la SEQ ID NO : 18. A fusion protein according to claim 1, in which the recombinase domain is a functional variant of the CRE recombinase, said variant comprising or consisting of a CRE recombinase of SEQ ID NO: 1 in which 18, 19, 26 or 31 amino acids have been deleted at the N-terminal, and optionally having a substitution at the level of the residue corresponding to residue E340 of SEQ ID NO: 1 and / or a substitution at the level of the residue corresponding to residue D341 of SEQ ID NO: 1 9. Acide nucléique codant pour une protéine de fusion selon l’une quelconque des revendications précédentes.9. Nucleic acid encoding a fusion protein according to any one of the preceding claims. 10. Cassette d expression comprenant un acide nucléique selon la revendication 9.10. Expression cassette comprising a nucleic acid according to claim 9. 11. Vecteur d’expression comprenant un acide nucléique selon la revendication 9 ou une cassette d’expression selon la revendication 10.11. An expression vector comprising a nucleic acid according to claim 9 or an expression cassette according to claim 10. 12. Cellule hôte comprenant un acide nucléique selon la revendication 9, une cassette d expression selon la revendication 10 ou un vecteur d’expression selon la revendication 11.12. Host cell comprising a nucleic acid according to claim 9, an expression cassette according to claim 10 or an expression vector according to claim 11. 13. Procédé pour induire une activité recombinase dans une cellule hôte isolée comprenant13. A method for inducing recombinase activity in an isolated host cell comprising - la fourniture d’une cellule hôte isolée exprimant une protéine de fusion selon l’une quelconque des revendications 1 à 8 ou l’insertion d’un acide nucléique selon la revendication 9, une cassette d’expression selon la revendication 10 ou un vecteur d’expression selon la revendication 11 dans une cellule hôte isolée et- the supply of an isolated host cell expressing a fusion protein according to any one of claims 1 to 8 or the insertion of a nucleic acid according to claim 9, an expression cassette according to claim 10 or a vector of expression according to claim 11 in an isolated host cell and - l’exposition de ladite cellule à une lumière capable d’activer le domaine photorécepteur de ladite protéine de fusion et donc l’activité recombinase.- the exposure of said cell to light capable of activating the photoreceptor domain of said fusion protein and therefore the recombinase activity. 14. Procédé pour modifier un acide nucléique, comprenant14. A method for modifying a nucleic acid, comprising - la mise en contact in vitro ou ex vivo d’une protéine de fusion selon l’une quelconque des revendications 1 à 8, avec ledit acide nucléique d’intérêt comprenant un ou plusieurs sites de reconnaissance reconnus par le domaine recombinase de ladite protéine de fusion, et- contacting in vitro or ex vivo a fusion protein according to any one of claims 1 to 8, with said nucleic acid of interest comprising one or more recognition sites recognized by the recombinase domain of said protein fusion, and - l’exposition de la protéine de fusion et dudit acide nucléique à une lumière capable d’activer le domaine photorécepteur de ladite protéine de fusion et donc l’activité recombinase.- the exposure of the fusion protein and of said nucleic acid to light capable of activating the photoreceptor domain of said fusion protein and therefore of the recombinase activity. 15. Procédé selon la revendication 14, qui est utilisé15. The method of claim 14, which is used - pour moduler l’expression d’une molécule d’intérêt dans la cellule hôte,- to modulate the expression of a molecule of interest in the host cell, - pour induire de la diversité génétique dans la cellule hôte, ou- to induce genetic diversity in the host cell, or - pour modifier une activité biologique dans le cadre d’une thérapie génique.- to modify a biological activity within the framework of gene therapy. 16. Kit comprenant une protéine de fusion selon l’une quelconque des revendications 1 à 8, un acide nucléique selon la revendication 9, une cassette d’expression selon la revendication 10, un vecteur d’expression selon la revendication 11 et/ou une cellule hôte selon la revendication 12, et optionnellement une source lumineuse capable d’activer le domaine photorécepteur de la protéine de fusion.16. Kit comprising a fusion protein according to any one of claims 1 to 8, a nucleic acid according to claim 9, an expression cassette according to claim 10, an expression vector according to claim 11 and / or a host cell according to claim 12, and optionally a light source capable of activating the photoreceptor domain of the fusion protein. 17. Utilisation d’un kit selon la revendication 16, pour induire une activité recombinase dans une cellule selon le procédé de la revendication 13 et/ou pour modifier un ou plusieurs acides nucléiques selon le procédé de la revendication 14 ou 15.17. Use of a kit according to claim 16, for inducing recombinase activity in a cell according to the method of claim 13 and / or for modifying one or more nucleic acids according to the method of claim 14 or 15.
FR1853046A 2018-04-06 2018-04-06 CHIMERIC PROTEIN HAVING PHOTOACTIVABLE RECOMBINASE ACTIVITY Withdrawn FR3079832A1 (en)

Priority Applications (2)

Application Number Priority Date Filing Date Title
FR1853046A FR3079832A1 (en) 2018-04-06 2018-04-06 CHIMERIC PROTEIN HAVING PHOTOACTIVABLE RECOMBINASE ACTIVITY
PCT/EP2019/058829 WO2019193205A1 (en) 2018-04-06 2019-04-08 Chimeric protein having photoactivatable recombinase activity

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
FR1853046A FR3079832A1 (en) 2018-04-06 2018-04-06 CHIMERIC PROTEIN HAVING PHOTOACTIVABLE RECOMBINASE ACTIVITY
FR1853046 2018-04-06

Publications (1)

Publication Number Publication Date
FR3079832A1 true FR3079832A1 (en) 2019-10-11

Family

ID=63080037

Family Applications (1)

Application Number Title Priority Date Filing Date
FR1853046A Withdrawn FR3079832A1 (en) 2018-04-06 2018-04-06 CHIMERIC PROTEIN HAVING PHOTOACTIVABLE RECOMBINASE ACTIVITY

Country Status (2)

Country Link
FR (1) FR3079832A1 (en)
WO (1) WO2019193205A1 (en)

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2017144620A1 (en) * 2016-02-24 2017-08-31 Max Planck Florida Institute for Neuroscience Light-gated signaling modulation

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001086989A (en) 1999-09-17 2001-04-03 Univ Osaka MAMMALIAN Cre RECOMBINASE GENE
US9777262B2 (en) 2013-03-13 2017-10-03 President And Fellows Of Harvard College Mutants of Cre recombinase
US10392674B2 (en) * 2015-07-22 2019-08-27 President And Fellows Of Harvard College Evolution of site-specific recombinases

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2017144620A1 (en) * 2016-02-24 2017-08-31 Max Planck Florida Institute for Neuroscience Light-gated signaling modulation

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
FUUN KAWANO ET AL: "A photoactivatable Cre-loxP recombination system for optogenetic genome engineering", NATURE CHEMICAL BIOLOGY, vol. 12, no. 12, 1 December 2016 (2016-12-01), Basingstoke, pages 1059 - 1064, XP055506281, ISSN: 1552-4450, DOI: 10.1038/nchembio.2205 *
LIU RONGRONG ET AL: "Effect of deletion mutation on the recombination activity of Cre recombinase", ACTA BIOCHIMICA POLONICA, vol. 52, 1 January 2005 (2005-01-01), PL, pages 541 - 544, XP055506217, ISSN: 0001-527X *
SUZANNE E. SCHINDLER ET AL: "Photo-activatable Cre recombinase regulates gene expression in vivo", SCIENTIFIC REPORTS, vol. 5, no. 1, 9 September 2015 (2015-09-09), XP055506223, DOI: 10.1038/srep13627 *

Also Published As

Publication number Publication date
WO2019193205A1 (en) 2019-10-10

Similar Documents

Publication Publication Date Title
EP3250688B1 (en) Method for inducing targeted meiotic recombinations
US10689656B2 (en) Expression constructs and methods of genetically engineering methylotrophic yeast
WO2022100527A1 (en) Novel cas enzyme and system and use thereof
WO2002072846A9 (en) Synthetic genes and bacterial plasmids devoid of cpg
JP2002512015A (en) Rapidly degradable GFP fusion proteins and methods of use
EP1824984A2 (en) In-vitro method for producing oocytes or eggs having targeted genomic modification
US20120034634A1 (en) Modified luciola cruciata luciferase protein
RU2730038C2 (en) Luciferin biosynthesis enzymes and use thereof
FR2500847A1 (en) SELECTIVE GENETIC MARKERS FOR EUKARYOTIC CELLS, PROCESS FOR IMPLEMENTING SUCH MARKERS AND APPLICATION OF THE CELLS CONTAINING SUCH A MARKER TO THE MANUFACTURE OF DETERMINED PROTEINS AFTER THEIR TRANSFORMATION BY A CORRESPONDING DNA
Taoka et al. Novel assays to monitor gene expression and protein-protein interactions in rice using the bioluminescent protein, NanoLuc
FR3079832A1 (en) CHIMERIC PROTEIN HAVING PHOTOACTIVABLE RECOMBINASE ACTIVITY
CA2455542A1 (en) Mutated photoproteins and their uses
JP2006508678A (en) Fluorescent proteins from aqueous species
EP2689018B1 (en) Constructs and method for regulating gene expression or for detecting and controlling a dna locus in eukaryotes
JP5224100B2 (en) Mutant luciferase
JP7241423B2 (en) Photoproteins, their substrates, and their uses
JP2008237024A (en) Transformant having galactose-inducing system and its utilization
WO2024034619A1 (en) Luminescent protein
EP2424572A1 (en) Targeting nucleic acids in the mitochondria
EP1071798A1 (en) Novel constructs for controlled expression of recombinant proteins in prokaryotic cells
CA2533479C (en) Peptide protein translation inhibitor and the use thereof for protein translation control
JP6573400B2 (en) A novel diatom transformation vector and a novel promoter sequence contained therein
US20220213463A1 (en) Fe-s fusion protein acting as electron transfer chain, carbon monoxide formate redox enzyme mediated through fes fusion protein, strain bcf12 derived from thermococcus wherein enzyme is transformed, and use thereof
FR3008106A1 (en) METHOD OF INDUCING A TARGETED MEIOTIC RECOMBINATION
FR2746814A1 (en) RECOMBINANT NUCLEIC SEQUENCES ENCODING PROTEINS COMPRISING AT LEAST ONE HYDROPHOBIC DOMAIN AND THEIR APPLICATIONS

Legal Events

Date Code Title Description
PLFP Fee payment

Year of fee payment: 2

PLSC Publication of the preliminary search report

Effective date: 20191011

PLFP Fee payment

Year of fee payment: 3

ST Notification of lapse

Effective date: 20211205