FR2786201A1 - New nucleic acid sequences encoding enzymes involved in macrolide biosynthesis - Google Patents

New nucleic acid sequences encoding enzymes involved in macrolide biosynthesis Download PDF

Info

Publication number
FR2786201A1
FR2786201A1 FR9903715A FR9903715A FR2786201A1 FR 2786201 A1 FR2786201 A1 FR 2786201A1 FR 9903715 A FR9903715 A FR 9903715A FR 9903715 A FR9903715 A FR 9903715A FR 2786201 A1 FR2786201 A1 FR 2786201A1
Authority
FR
France
Prior art keywords
ala
leu
gly
arg
val
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
FR9903715A
Other languages
French (fr)
Other versions
FR2786201B1 (en
Inventor
Claude Fromentin
Jean Marc Michel
Marie Cecile Raynal
Bey Khadidja Salah
Jesus Cortes
Sabine Gaisser
Peter LEADLAY
Carmen Mendez
Jose A Salas
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sanofi Aventis France
Aventis Pharmaceuticals Inc
Original Assignee
Hoechst Marion Roussel
Hoechst Marion Roussel Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hoechst Marion Roussel, Hoechst Marion Roussel Inc filed Critical Hoechst Marion Roussel
Priority to FR9903715A priority Critical patent/FR2786201B1/en
Publication of FR2786201A1 publication Critical patent/FR2786201A1/en
Application granted granted Critical
Publication of FR2786201B1 publication Critical patent/FR2786201B1/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/52Genes encoding for enzymes or proenzymes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P19/00Preparation of compounds containing saccharide radicals
    • C12P19/44Preparation of O-glycosides, e.g. glucosides
    • C12P19/60Preparation of O-glycosides, e.g. glucosides having an oxygen of the saccharide radical directly bound to a non-saccharide heterocyclic ring or a condensed ring system containing a non-saccharide heterocyclic ring, e.g. coumermycin, novobiocin
    • C12P19/62Preparation of O-glycosides, e.g. glucosides having an oxygen of the saccharide radical directly bound to a non-saccharide heterocyclic ring or a condensed ring system containing a non-saccharide heterocyclic ring, e.g. coumermycin, novobiocin the hetero ring having eight or more ring members and only oxygen as ring hetero atoms, e.g. erythromycin, spiramycin, nystatin
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6888Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for detection or identification of organisms
    • C12Q1/689Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for detection or identification of organisms for bacteria

Abstract

New isolated DNA (I), single or double stranded, is a 3439 bp sequence (S1), reproduced, containing the eryG-eryAIII region of the gene cluster for erythromycin biosynthesis. Also new are (A) DNA (Ia) representing the eryAI-eryK region of the same cluster (8160 bp, S2); (B) nucleic acid corresponding to one or more open reading frames (ORFs) within (I) or (Ia); (C) polypeptides (II) encoded by (I) and (Ia); (D) isolated DNA (Ib) representing a region of the gene cluster for oleandomycin biosynthesis (6093 bp, S3); (E) nucleic acid corresponding to one or more ORFs within (Ib); (F) polypeptides (IIa) encoded by (Ib); (G) strains of Saccharopolyspora erythrea (S.e.) in which specific enzymes are inactivated such that particular macrolides are produced; (H) method for producing oleandomycin precursors in Streptomyces antibioticus (S.a.) by altering an ORF of (S3); (J) thymidine 5'-(trihydrogen diphosphate), P'- 3,4,6-trideoxy-3-dimethylamino-D-xylohexopyranosyl ester (dTDP-D-desosamine) and its base addition salts.

Description

<Desc/Clms Page number 1> <Desc / Clms Page number 1>

Gènes de biosynthèse et de transfert des 6-désoxyhexoses chez Saccharopolyspora erythraea et chez Streptomyces antibioticus et leur utilisation.  Genes for biosynthesis and transfer of 6-deoxyhexoses in Saccharopolyspora erythraea and in Streptomyces antibioticus and their use.

La présente invention décrit des gènes impliqués dans la biosynthèse et le transfert des 6-désoxyhexoses chez Saccharopolyspora erythraea et leur utilisation dans la production d'analogues de l'érythromycine par manipulation génétique.  The present invention describes genes involved in the biosynthesis and transfer of 6-deoxyhexoses in Saccharopolyspora erythraea and their use in the production of erythromycin analogs by genetic manipulation.

L'érythromycine A est un antibiotique macrolide cliniquement important produit par la bactérie gram-positive Sac. erythraea. Les gènes de la biosynthèse de l'érythromycine sont organisés en un cluster de gènes ery qui inclut aussi le gène d'auto-résistance à l'érythromycine ermE.  Erythromycin A is a clinically important macrolide antibiotic produced by the Gram-positive bacteria Sac. erythraea. The erythromycin biosynthesis genes are organized into a ery gene cluster which also includes the ermE erythromycin self-resistance gene.

Le cluster ery contient les trois grands gènes eryAI, eryAII et eryAIII (locus eryA) codant pour trois polypeptides composant la polykétide synthétase (dénommée PKS) flanqués par deux régions comprenant les gènes impliqués dans les stades ultérieurs de conversion du noyau lactone (6-désoxyérythronolide B) en érythromycine A.  The ery cluster contains the three major genes eryAI, eryAII and eryAIII (locus eryA) encoding three polypeptides making up polyketide synthetase (called PKS) flanked by two regions comprising the genes involved in the later stages of conversion of the lactone nucleus (6-deoxyerythronolide B) in erythromycin A.

Pendant le processus de biosynthèse de l'érythromycine A représenté à la figure 1, la biosynthèse des 6-désoxyhexoses comprend l'ensemble des réactions enzymatiques conduisant du glucose-1-phosphate au sucre activé final dTDP-L-mycarose ou dTDP-D-désosamine. Le dTDP-L-mycarose ou la dTDP-D-désosamine ainsi produits sont ensuite utilisés comme substrats pour le transfert des deux désoxyhexoses sur le noyau lactone. La formation de l'érythromycine requiert l'attachement du mycarose via l'hydroxyle en position C-3 du noyau lactone et l'attachement de la désosamine via l'hydroxyle en position C-5. L'ensemble des gènes eryB impliqués dans la biosynthèse ou le transfert du mycarose et l'ensemble des gènes eryC impliqués dans la biosynthèse ou le transfert de la désosamine n'ont pas encore été clairement identifiés.  During the biosynthesis process of erythromycin A represented in FIG. 1, the biosynthesis of 6-deoxyhexoses comprises all the enzymatic reactions leading from glucose-1-phosphate to the final activated sugar dTDP-L-mycarose or dTDP-D- desosamine. The dTDP-L-mycarose or the dTDP-D-desosamine thus produced are then used as substrates for the transfer of the two deoxyhexoses onto the lactone nucleus. The formation of erythromycin requires the attachment of mycarosis via the hydroxyl in position C-3 of the lactone nucleus and the attachment of desosamine via hydroxyl in position C-5. The set of eryB genes involved in the biosynthesis or transfer of mycarosis and the set of eryC genes involved in the biosynthesis or transfer of desosamine have not yet been clearly identified.

Le cluster ery d'une longueur de 56 kb comprend 21 phases ouvertes de lecture ou "open reading frames" (ORFs) dont la numérotation a été établie par Haydock et al. (1991) et Donadio et al. (1993). Le locus eryA comprend les ORFs 10,  The 56 kb ery cluster includes 21 open reading frames (ORFs), the numbering of which was established by Haydock et al. (1991) and Donadio et al. (1993). The eryA locus includes ORFs 10,

<Desc/Clms Page number 2><Desc / Clms Page number 2>

11 et 12.  11 and 12.

Des travaux précoces d'interruption ou de remplacement de gène dans la partie gauche du cluster ery a permis une première identification du gène eryCI (ORF1) (Dhillon et al., 1989), puis du gène eryBI (ORF2), du locus eryH (ORFs 3,4 et 5) dont l'inactivation conduit à la production de 6-désoxyérythronolide B, d'un locus eryBII (ORFs 7 et 8) et le gène eryCII (Weber et al., 1990).  Early work on gene interruption or replacement on the left side of the ery cluster allowed a first identification of the eryCI gene (ORF1) (Dhillon et al., 1989), then of the eryBI gene (ORF2), of the eryH locus ( ORFs 3,4 and 5) whose inactivation leads to the production of 6-deoxyerythronolide B, of an eryBII locus (ORFs 7 and 8) and the eryCII gene (Weber et al., 1990).

Parmi les activités enzymatiques impliquées dans les modifications ultérieures du noyau lactone ont été identifiées le gène eryF (ORF4) responsable de l'hydroxylation en C6 (Weber et al., 1991) et le gène eryK (ORF20) responsable de l'hydroxylation en C12 (Stassi et al., 1993).  Among the enzymatic activities involved in the subsequent modifications of the lactone nucleus have been identified the eryF gene (ORF4) responsible for C6 hydroxylation (Weber et al., 1991) and the eryK gene (ORF20) responsible for C12 hydroxylation (Stassi et al., 1993).

D'autre part, le gène eryG (ORF6) responsable de la O-méthylation du mycarose en cladinose (position 3"OH) a été identifié (Weber et al., 1989). L'érythromycine A est ainsi formée via l'érythromycine B ou l'érythromycine C à partir de l'érythromycine D selon le schéma proposé (figure 1). On the other hand, the eryG gene (ORF6) responsible for the O-methylation of mycarosis in cladinose (position 3 "OH) has been identified (Weber et al., 1989). Erythromycin A is thus formed via erythromycin B or erythromycin C from erythromycin D according to the proposed scheme (Figure 1).

La caractérisation fonctionnelle des gènes eryB et eryC situés sur la partie droite de cluster ery (ORFs 13 à 19) n'a pas encore été établie de façon précise, malgré les informations parcellaires communiquées dans différents articles de revues (Donadio et al., 1993 ; et Thorson, 1994 ; Katz et Donadio, 1995).  The functional characterization of the eryB and eryC genes located on the right-hand side of the ery cluster (ORFs 13 to 19) has not yet been precisely established, despite the fragmentary information communicated in various journal articles (Donadio et al., 1993 ; and Thorson, 1994; Katz and Donadio, 1995).

En raison de l'intérêt commercial des antibiotiques macrolides, l'obtention de nouveaux dérivés, notamment l'obtention d'analogues de l'érythromycine ayant des propriétés avantageuses, est intensivement recherchée. Les modifications peuvent être désirées dans la partie aglycone (macrolactone) ou/et dans son hydroxylation secondaire ainsi que dans la partie sucre (cladinose et/ou désosamine) de l'érythromycine.  Due to the commercial interest of macrolide antibiotics, the obtaining of new derivatives, in particular the obtaining of erythromycin analogs having advantageous properties, is intensively sought. The modifications may be desired in the aglycone part (macrolactone) or / and in its secondary hydroxylation as well as in the sugar part (cladinose and / or desosamine) of erythromycin.

Les méthodes courantes telles que les modifications chimiques sont difficiles et limitées vis-à-vis du type de produit que l'on peut obtenir à partir de l'érythromycine.  Current methods such as chemical modifications are difficult and limited with regard to the type of product that can be obtained from erythromycin.

Par exemple, Sakakibara et al. (1984) passent en revue des modifications chimiques réalisées à partir de l'érythromycine A ou B, aussi bien dans la partie sucre que dans la macro- For example, Sakakibara et al. (1984) review chemical modifications made from erythromycin A or B, both in the sugar part and in the macro-

<Desc/Clms Page number 3><Desc / Clms Page number 3>

lactone.  lactone.

Des modifications de la macrolactone de l'érythromycine A par manipulation génétique du microorganisme Sac. erythraea ont été décrites dans la demande de brevet internationale WO 93/13663 ainsi que l'obtention de nouvelles molécules polykétides par altérations génétiques spécifiques du locus eryA du chromosome codant pour la PKS. Par exemple la 7-hydroxyérythromycine A, la 6-désoxy-7-hydroxyérythromycine A ou le 3-oxo-3-désoxy-5-désoaminyl-érythronolide A ont été ainsi obtenus.  Changes in the macrolactone of erythromycin A by genetic manipulation of the microorganism Sac. erythraea have been described in international patent application WO 93/13663 as well as the obtaining of new polyketide molecules by specific genetic alterations of the eryA locus of the chromosome coding for PKS. For example, 7-hydroxyerythromycin A, 6-deoxy-7-hydroxyerythromycin A or 3-oxo-3-deoxy-5-deoaminyl-erythronolide A were thus obtained.

La présente invention concerne la caractérisation fonctionnelle de dix gènes de Sac. erythraea impliqués dans la biosynthèse ou l'attachement du mycarose et de la désosamine (eryBII, eryCIII et eryCII situés en aval du locus eryA et eryBIV, eryBV, eryCVI, eryBVI, eryCIV, eryCV et eryBVII situés en amont), leur utilisation dans la production d'analogues de l'érythromycine ainsi qu'un procédé de préparation de ceux-ci.  The present invention relates to the functional characterization of ten Sac genes. erythraea involved in the biosynthesis or attachment of mycarosis and desosamine (eryBII, eryCIII and eryCII located downstream of the locus eryA and eryBIV, eryBV, eryCVI, eryBVI, eryCIV, eryCV and eryBVII located upstream) production of erythromycin analogs and a process for their preparation.

La présente invention a donc pour objet une séquence d'ADN simple ou double brin isolée, représentée à la figure 2 (séquence directe et complémentaire de SEQ ID N 1) correspondant à la région eryG-eryAIII du cluster de gènes de la biosynthèse de l'érythromycine et a particulièrement pour objet une séquence d'ADN ci-dessus comprenant : - la séquence eryBII correspondant à l'ORF7 (séquence complémentaire de SEQ ID N 1 du nucléotide 48 au nucléotide 1046) et codant pour une dTDP-4-céto-L-6-désoxyhexose 2,3-réductase, - la séquence eryCIII correspondant à l'ORF8 (séquence complémentaire de SEQ ID N 1 du nucléotide 1046 au nucléotide 2308) et codant pour une désosaminyltransférase et - la séquence eryCII correspondant à l'ORF9 (séquence complémentaire de SEQ ID N 1 du nucléotide 2322 au nucléotide 3404) et codant pour une dTDP-4-céto-D-6-désoxyhexose 3,4-isomérase.  The subject of the present invention is therefore an isolated single or double stranded DNA sequence, represented in FIG. 2 (direct and complementary sequence of SEQ ID N 1) corresponding to the eryG-eryAIII region of the gene cluster for the biosynthesis of l erythromycin and particularly relates to a DNA sequence above comprising: - the eryBII sequence corresponding to ORF7 (sequence complementary to SEQ ID N 1 from nucleotide 48 to nucleotide 1046) and coding for a dTDP-4-keto -L-6-deoxyhexose 2,3-reductase, - the eryCIII sequence corresponding to ORF8 (sequence complementary to SEQ ID N 1 from nucleotide 1046 to nucleotide 2308) and coding for a deosaminyltransferase and - the eryCII sequence corresponding to ORF9 (sequence complementary to SEQ ID N 1 from nucleotide 2322 to nucleotide 3404) and coding for a dTDP-4-keto-D-6-deoxyhexose 3,4-isomerase.

La séquence d'ADN ci-dessus montrée à la figure 2 est une séquence d'ADN génomique qui peut être obtenue par exemple par sous-clonage de fragments de restriction d'un  The above DNA sequence shown in Figure 2 is a genomic DNA sequence which can be obtained for example by subcloning restriction fragments of a

<Desc/Clms Page number 4><Desc / Clms Page number 4>

fragment d'ADN génomique de Sac. erythraea, selon des conditions opératoires dont une description détaillée est donnée plus loin.  Sac genomic DNA fragment. erythraea, according to operating conditions, a detailed description of which is given below.

L'invention a plus particulièrement pour objet une séquence d'ADN isolée représentée à la figure 2 choisie parmi la séquence eryBII correspondant à l'ORF7 (séquence complémentaire de SEQ ID N 1 du nucléotide 48 au nucléotide 1046), la séquence eryCIII correspondant à l'ORF8 (séquence complémentaire de SEQ ID N 1 du nucléotide 1046 au nucléotide 2308) ou la séquence eryCII correspondant à l'ORF9 (séquence complémentaire de SEQ ID N 1 du nucléotide 2322 au nucléotide 3404) et les séquences qui hybrident et/ou présentent des homologies significatives avec cette séquence ou des fragments de celle-ci et ayant la même fonction.  The invention more particularly relates to an isolated DNA sequence represented in FIG. 2 chosen from the sequence eryBII corresponding to ORF7 (sequence complementary to SEQ ID N 1 from nucleotide 48 to nucleotide 1046), the sequence eryCIII corresponding to ORF8 (sequence complementary to SEQ ID N 1 from nucleotide 1046 to nucleotide 2308) or the eryCII sequence corresponding to ORF9 (sequence complementary to SEQ ID N 1 from nucleotide 2322 to nucleotide 3404) and the sequences which hybridize and / or have significant homologies with this sequence or fragments thereof and having the same function.

L'invention a tout particulièrement pour objet la séquence d'ADN isolée eryCIII représentée à la figure 2 correspondant à l'ORF8 (séquence complémentaire de SEQ ID N 1 du nucléotide 1046 au nucléotide 2308 = séquence complémentaire de SEQ ID N 4) et codant pour une désosaminyltransférase.  The subject of the invention is very particularly the isolated DNA sequence eryCIII represented in FIG. 2 corresponding to ORF8 (sequence complementary to SEQ ID N 1 from nucleotide 1046 to nucleotide 2308 = sequence complementary to SEQ ID N 4) and coding for a desosaminyltransferase.

La séquence eryBII correspondant à l'ORF7 code pour un polypeptide ayant 333 acides aminés (séquence de SEQ ID N 2), la séquence eryCIII correspondant à l'ORF8 code pour un polypeptide ayant 421 acides aminés (séquence de SEQ ID N 5) et la séquence eryCII correspondant à l'ORF9 code pour un polypeptide ayant 361 acides aminés (séquence de SEQ ID N 3) .  The eryBII sequence corresponding to ORF7 codes for a polypeptide having 333 amino acids (sequence of SEQ ID N 2), the eryCIII sequence corresponding to ORF8 codes for a polypeptide having 421 amino acids (sequence of SEQ ID N 5) and the eryCII sequence corresponding to ORF9 codes for a polypeptide having 361 amino acids (sequence of SEQ ID N 3).

La mise en évidence des activités enzymatiques respectives indiquées ci-dessus a été réalisée par introduction d'une délétion interne au gène correspondant telle qu'illustrée plus loin dans la partie expérimentale.  The demonstration of the respective enzymatic activities indicated above was carried out by introduction of an internal deletion to the corresponding gene as illustrated below in the experimental part.

Par séquences qui hybrident et ayant la même fonction, on inclut les séquences d'ADN qui hybrident avec l'une des séquences d'ADN ci-dessus sous des conditions standards de stringence élevée ou moyenne décrites par Sambrook et al.  By sequences which hybridize and having the same function, we include the DNA sequences which hybridize with one of the above DNA sequences under standard conditions of high or medium stringency described by Sambrook et al.

(1989) et qui codent pour une protéine ayant la même fonction enzymatique. Par même fonction enzymatique, on entend une activité enzymatique donnée sur des substrats de même nature, (1989) and which code for a protein having the same enzymatic function. By the same enzymatic function is meant an enzymatic activity given on substrates of the same nature,

<Desc/Clms Page number 5><Desc / Clms Page number 5>

par exemple un dTDP-6-désoxyhexose ou une macrolactone nue ou glycosylée. Les conditions de forte stringence comprennent par exemple une hybridation à 65 C pendant 18 heures dans une solution 5 x SSPE, 10 x Denhardt, 100 g/ml DNAss, 1 % SDS suivie de 2 lavages pendant 20 minutes avec une solution 2 x SSC, 0,05 % SDS à 65 C suivis d'un dernier lavage pendant 45 minutes dans une solution 0,1 x SSC, 0,1 % SDS à 65 C. Les conditions de stringence moyenne comprennent par exemple un dernier lavage pendant 20 minutes dans une solution 0,2 x SSC, 0,1 % SDS à 65 C.  for example a dTDP-6-deoxyhexose or a naked or glycosylated macrolactone. The high stringency conditions include, for example, hybridization at 65 ° C. for 18 hours in a 5 × SSPE, 10 × Denhardt solution, 100 g / ml DNAss, 1% SDS followed by 2 washes for 20 minutes with a 2 × SSC solution, 0.05% SDS at 65 C followed by a last wash for 45 minutes in a 0.1 x SSC solution, 0.1% SDS at 65 C. The conditions of medium stringency include, for example, a last wash for 20 minutes in 0.2 x SSC, 0.1% SDS solution at 65 C.

Par séquences qui présentent des homologies significatives et ayant la même fonction, on inclut les séquences ayant une identité de séquence nucléotidique d'au moins 60 % avec l'une des séquences ADN ci-dessus et qui codent pour une protéine ayant la même fonction enzymatique.  By sequences which have significant homologies and having the same function, we include the sequences having a nucleotide sequence identity of at least 60% with one of the DNA sequences above and which code for a protein having the same enzymatic function .

L'invention a aussi pour objet un polypeptide codé par l'une des séquences d'ADN ci-dessus et a spécialement pour objet un polypeptide correspondant à une ORF représentée à la figure 2, choisie parmi l'ORF7 (ayant la séquence de SEQ ID N 2), l'ORF8 (ayant la séquence de SEQ ID N 5) ou l'ORF9 (ayant la séquence de SEQ ID N 3) et les analogues de ce polypeptide.  The subject of the invention is also a polypeptide encoded by one of the DNA sequences above and especially relates to a polypeptide corresponding to an ORF represented in FIG. 2, chosen from ORF7 (having the sequence of SEQ ID N 2), ORF8 (having the sequence of SEQ ID N 5) or ORF9 (having the sequence of SEQ ID N 3) and analogs of this polypeptide.

Par analogues, on inclut les peptides ayant une séquence en acides aminés modifiée par substitution, délétion ou addition d'un ou plusieurs acides aminés pour autant que ces produits conservent la même fonction enzymatique. Les séquences modifiées peuvent être par exemple préparées en utilisant la technique de mutagénèse dirigée connue de l'homme du métier.  By analogues, we include peptides having an amino acid sequence modified by substitution, deletion or addition of one or more amino acids provided that these products retain the same enzymatic function. The modified sequences can for example be prepared using the site-directed mutagenesis technique known to those skilled in the art.

L'invention a plus spécialement pour objet le polypeptide correspondant à l'ORF 8 représentée à la figure 2 (ayant la séquence de SEQ ID N 5) et ayant une activité désosaminyltransférase, dénommé EryCIII.  A more specific subject of the invention is the polypeptide corresponding to ORF 8 represented in FIG. 2 (having the sequence of SEQ ID N 5) and having a deosaminyltransferase activity, called EryCIII.

L'invention décrit une protéine recombinante EryCIII de Sac. erythraea obtenue par expression dans une cellule hôte selon les méthodes connues de génie génétique et de culture cellulaire.  The invention describes a recombinant Sac EryCIII protein. erythraea obtained by expression in a host cell according to known methods of genetic engineering and cell culture.

L'obtention de la protéine recombinante purifiée a  Obtaining the purified recombinant protein a

<Desc/Clms Page number 6><Desc / Clms Page number 6>

permis de confirmer la caractérisation de la fonction glycosyltranférase associée au produit du gène eryCIII dans un test in vitro qui met en évidence le transfert du sucre activé dTDP-D-désosamine sur le noyau lactone.  allowed to confirm the characterization of the glycosyltranferase function associated with the eryCIII gene product in an in vitro test which demonstrates the transfer of activated sugar dTDP-D-desosamine to the lactone nucleus.

L'invention a aussi pour objet la thymidine 5'-(trihydrogène diphosphate),P'-[3,4,6-tridésoxy-3-(diméthylamino)D-. xylo.-hexopyranosyl] ester (dTDP-D-désosamine) et les sels d'addition avec les bases, dont un exemple de préparation est décrit plus loin dans la partie expérimentale.  A subject of the invention is also thymidine 5 '- (trihydrogen diphosphate), P' - [3,4,6-tridesoxy-3- (dimethylamino) D-. xylo.-hexopyranosyl] ester (dTDP-D-desosamine) and addition salts with bases, an example of preparation of which is described later in the experimental part.

L'invention a aussi pour objet une séquence d'ADN isolée représentée à la figure 3 (séquence de SEQ ID N 6) correspondant à la région eryAI-eryK du cluster de gènes de la biosynthèse de l'érythromycine et a particulièrement pour objet une séquence d'ADN ci-dessus comprenant : - la séquence eryBIV correspondant à l'ORF13 (séquence de SEQ ID N 6 du nucléotide 242 au nucléotide 1207) et codant pour une dTDP-4-céto-L-6-désoxyhexose 4-réductase, - la séquence eryBV correspondant à l'ORF14 (séquence de SEQ ID N 6 du nucléotide 1210 au nucléotide 2454) et codant pour une mycarosyltransférase, - la séquence eryCVI correspondant à l'ORF15 (séquence de SEQ ID N 6 du nucléotide 2510 au nucléotide 3220) et codant pour une dTDP-D-6-désoxyhexose 3-N-méthyltransférase, - la séquence eryBVI correspondant à l'ORF16 (séquence de SEQ ID N 6 du nucléotide 3308 au nucléotide 4837) et codant pour une dTDP-4-céto-L-6-désoxyhexose 2,3-déshydratase, - la séquence eryCIV correspondant à l'ORF17 (séquence de SEQ ID N 6 du nucléotide 4837 au nucléotide 6039) et codant pour une dTDP-D-6-désoxyhexose 3,4-déshydratase, - la séquence eryCV correspondant à l'ORF18 (séquence de SEQ ID N 6 du nucléotide 6080 au nucléotide 7546) et codant pour une dTDP-D-4,6-didésoxyhexose 3,4-réductase et - la séquence eryBVII correspondant à l'ORF19 (séquence de SEQ ID N 6 du nucléotide 7578 au nucléotide 8156) et codant pour une dTDP-4-céto-D-6-désoxyhexose 3,5 épimérase.  The subject of the invention is also an isolated DNA sequence represented in FIG. 3 (sequence of SEQ ID N 6) corresponding to the eryAI-eryK region of the gene cluster for erythromycin biosynthesis and particularly relates to a DNA sequence above comprising: - the eryBIV sequence corresponding to ORF13 (sequence of SEQ ID N 6 from nucleotide 242 to nucleotide 1207) and coding for a dTDP-4-keto-L-6-deoxyhexose 4-reductase , - the eryBV sequence corresponding to ORF14 (sequence of SEQ ID N 6 from nucleotide 1210 to nucleotide 2454) and coding for a mycarosyltransferase, - the eryCVI sequence corresponding to ORF15 (sequence of SEQ ID N 6 of nucleotide 2510 to nucleotide 3220) and coding for a dTDP-D-6-deoxyhexose 3-N-methyltransferase, - the sequence eryBVI corresponding to ORF16 (sequence of SEQ ID N 6 from nucleotide 3308 to nucleotide 4837) and coding for a dTDP-4 -keto-L-6-deoxyhexose 2,3-dehydratase, - the sequenc e eryCIV corresponding to ORF17 (sequence of SEQ ID N 6 from nucleotide 4837 to nucleotide 6039) and coding for a dTDP-D-6-deoxyhexose 3,4-dehydratase, - the eryCV sequence corresponding to ORF18 (sequence of SEQ ID N 6 from nucleotide 6080 to nucleotide 7546) and coding for a dTDP-D-4,6-dideoxyhexose 3,4-reductase and - the eryBVII sequence corresponding to ORF19 (sequence of SEQ ID N 6 from nucleotide 7578 to nucleotide 8156) and coding for a dTDP-4-keto-D-6-deoxyhexose 3,5 epimerase.

La séquence d'ADN ci-dessus montrée à la figure 3 est une séquence d'ADN génomique qui peut être obtenue, par exemple, par sous-clonage de fragments de restriction de  The above DNA sequence shown in Figure 3 is a genomic DNA sequence which can be obtained, for example, by subcloning restriction fragments of

<Desc/Clms Page number 7><Desc / Clms Page number 7>

cosmides contenant une banque d'ADN génomique de Sac. erythraea, selon des conditions opératoires dont une description détaillée est donnée plus loin.  cosmids containing a Sac genomic DNA library. erythraea, according to operating conditions, a detailed description of which is given below.

L'invention a plus particulièrement pour objet une séquence d'ADN isolée représentée à la figure 3 choisie parmi la séquence eryBIV correspondant à l'ORF13 (séquence de SEQ ID N 6 du nucléotide 242 au nucléotide 1207), la séquence eryBV correspondant à l'ORF14 (séquence de SEQ ID N 6 du nucléotide 1210 au nucléotide 2454), la séquence eryCVI correspondant à l'ORF15 (séquence de SEQ ID N 6 du nucléotide 2510 au nucléotide 3220), la séquence eryBVI correspondant à l'ORF16 (séquence de SEQ ID N 6 du nucléotide 3308 au nucléotide 4837), la séquence eryCIV correspondant à l'ORF17 (séquence de SEQ ID N 6 du nucléotide 4837 au nucléotide 6039), la séquence eryCV correspondant à l'ORF18 (séquence de SEQ ID N 6 du nucléotide 6080 au nucléotide 7546) ou la séquence eryBVII correspondant à l'ORF19 (séquence de SEQ ID N 6 du nucléotide 7578 au nucléotide 8156) et les séquences qui hybrident et/ou présentent des homologies significatives avec cette séquence ou des fragments de celle-ci et ayant la même fonction.  A more particular subject of the invention is an isolated DNA sequence represented in FIG. 3 chosen from the eryBIV sequence corresponding to ORF13 (sequence of SEQ ID N 6 from nucleotide 242 to nucleotide 1207), the eryBV sequence corresponding to l 'ORF14 (sequence of SEQ ID N 6 from nucleotide 1210 to nucleotide 2454), the sequence eryCVI corresponding to ORF15 (sequence of SEQ ID N 6 from nucleotide 2510 to nucleotide 3220), the sequence eryBVI corresponding to ORF16 (sequence of SEQ ID N 6 from nucleotide 3308 to nucleotide 4837), the eryCIV sequence corresponding to ORF17 (sequence of SEQ ID N 6 from nucleotide 4837 to nucleotide 6039), the eryCV sequence corresponding to ORF18 (sequence of SEQ ID N 6 from nucleotide 6080 to nucleotide 7546) or the eryBVII sequence corresponding to ORF19 (sequence of SEQ ID N 6 from nucleotide 7578 to nucleotide 8156) and the sequences which hybridize and / or show significant homologies with this sequence or fragments thereof and having the same function.

L'invention a tout particulièrement pour objet la séquence d'ADN isolée eryBV représentée à la figure 3 correspondant à l'ORF14 (séquence de SEQ ID N 6 du nucléotide 1210 au nucléotide 2454) et codant pour une mycarosyltransférase.  The subject of the invention is most particularly the isolated DNA sequence eryBV represented in FIG. 3 corresponding to ORF14 (sequence of SEQ ID N 6 from nucleotide 1210 to nucleotide 2454) and coding for a mycarosyltransferase.

La séquence eryBIV correspondant à l'ORF13 code pour un polypeptide ayant 322 acides aminés (SEQ ID N 7), la séquence eryBV correspondant à l'ORF14 code pour un polypeptide ayant 415 acides aminés (SEQ ID N 8), la séquence eryCVI correspondant à l'ORF15 code pour un polypeptide ayant 237 acides aminés (SEQ ID N 9), la séquence eryBVI correspondant à l'ORF16 code pour un polypeptide ayant 510 acides aminés (SEQ ID N 10), la séquence eryCIV correspondant à l'ORF17 code pour un polypeptide ayant 401 acides aminés (SEQ ID N 14), la séquence eryCV correspondant à l'ORF18 code pour un polypeptide ayant 489 acides aminés (SEQ ID N 11) et la séquence eryBVII correspondant à l'ORF19 code pour un  The eryBIV sequence corresponding to ORF13 codes for a polypeptide having 322 amino acids (SEQ ID N 7), the eryBV sequence corresponding to ORF14 codes for a polypeptide having 415 amino acids (SEQ ID N 8), the corresponding eryCVI sequence to ORF15 codes for a polypeptide having 237 amino acids (SEQ ID N 9), the sequence eryBVI corresponding to ORF16 codes for a polypeptide having 510 amino acids (SEQ ID N 10), the sequence eryCIV corresponding to ORF17 code for a polypeptide having 401 amino acids (SEQ ID N 14), the eryCV sequence corresponding to ORF18 codes for a polypeptide having 489 amino acids (SEQ ID N 11) and the eryBVII sequence corresponding to ORF19 codes for a

<Desc/Clms Page number 8><Desc / Clms Page number 8>

polypeptide ayant 193 acides aminés (SEQ ID N 12).  polypeptide having 193 amino acids (SEQ ID N 12).

La mise en évidence des activités enzymatiques respectives indiquées ci-dessus a été réalisée par introduction d'une délétion interne au gène correspondant telle qu'illustrée plus loin dans la partie expérimentale.  The demonstration of the respective enzymatic activities indicated above was carried out by introduction of an internal deletion to the corresponding gene as illustrated below in the experimental part.

Les séquences d'ADN qui hybrident ainsi que les séquences d'ADN qui présentent des homologies significatives et ayant la même fonction ont la même signification que celle indiquée précédemment.  The DNA sequences which hybridize as well as the DNA sequences which exhibit significant homologies and having the same function have the same meaning as that indicated above.

L'invention a aussi pour objet un polypeptide codé par l'une des séquences d'ADN ci-dessus et a spécialement pour objet un polypeptide correspondant à une ORF représentée à la figure 3, choisie parmi l'ORF13 (ayant la séquence de SEQ ID N 7), l'ORF14 (ayant la séquence de SEQ ID N 8), l'ORF15 (ayant la séquence de SEQ ID N 9), l'ORF16 (ayant la séquence de SEQ ID N 10), l'ORF17 (ayant la séquence de SEQ ID N 14), l'ORF18 (ayant la séquence de SEQ ID N 11) ou l'ORF19 (ayant la séquence de SEQ ID N 12) et les analogues de ce peptide.  The subject of the invention is also a polypeptide encoded by one of the DNA sequences above and especially relates to a polypeptide corresponding to an ORF represented in FIG. 3, chosen from ORF13 (having the sequence of SEQ ID N 7), ORF14 (having the sequence of SEQ ID N 8), ORF15 (having the sequence of SEQ ID N 9), ORF16 (having the sequence of SEQ ID N 10), ORF17 (having the sequence of SEQ ID N 14), ORF18 (having the sequence of SEQ ID N 11) or ORF19 (having the sequence of SEQ ID N 12) and analogs of this peptide.

Les analogues du polypeptide ont la même signification que celle indiquée précédemment.  The analogs of the polypeptide have the same meaning as that indicated above.

L'invention a plus spécialement pour objet le polypeptide correspondant à l'ORF14 représentée à la figure 3 (ayant la séquence de SEQ ID N 8) et ayant une activité mycarosyltransférase, dénommé EryBV.  A more specific subject of the invention is the polypeptide corresponding to ORF14 represented in FIG. 3 (having the sequence of SEQ ID N 8) and having a mycarosyltransferase activity, called EryBV.

La connaissance de chaque séquence d'ADN eryB ou eryC de l'invention indiquée ci-dessus et montrée à la figure 2 ou à la figure 3 permet de reproduire la présente invention par exemple par des méthodes connues de synthèse chimique ou par criblage d'une banque génomique à l'aide de sondes d'oligonucléotides de synthèse par les techniques connues d'hybridation ou par amplification par PCR.  Knowledge of each eryB or eryC DNA sequence of the invention indicated above and shown in FIG. 2 or in FIG. 3 makes it possible to reproduce the present invention for example by known methods of chemical synthesis or by screening for a genomic library using probes of synthetic oligonucleotides by known techniques of hybridization or by PCR amplification.

Les polypeptides de l'invention peuvent être obtenus par les méthodes connues, par exemple par synthèse chimique ou par la méthodologie de l'ADN recombinant par expression dans une cellule hôte procaryote ou eucaryote.  The polypeptides of the invention can be obtained by known methods, for example by chemical synthesis or by the methodology of recombinant DNA by expression in a prokaryotic or eukaryotic host cell.

Un autre objet de l'invention concerne l'utilisation d'au moins l'une des séquences d'ADN choisie parmi les  Another subject of the invention relates to the use of at least one of the DNA sequences chosen from

<Desc/Clms Page number 9><Desc / Clms Page number 9>

séquences eryBII (séquence complémentaire de SEQ ID N 1 du nucléotide 48 au nucléotide 1046), eryCIII (séquence complémentaire de SEQ ID N 1 du nucléotide 1046 au nucléotide 2308) ou eryCII (séquence complémentaire de SEQ ID N 1 du nucléotide 2322 au nucléotide 3404) représentées à la figure 2, eryBIV (séquence de SEQ ID N 6 du nucléotide 242 au nucléotide 1207), eryBV (séquence de SEQ ID N 6 du nucléotide 1210 au nucléotide 2454), eryCVI (séquence de SEQ ID N 6 du nucléotide 2510 au nucléotide 3220), eryBVI (séquence de SEQ ID N 6 du nucléotide 3308 au nucléotide 4837), eryCIV (séquence de SEQ ID N 6 du nucléotide 4837 au nucléotide 6039), eryCV (séquence de SEQ ID N 6 du nucléotide 6080 au nucléotide 7546) ou eryBVII (séquence de SEQ ID N 6 du nucléotide 7578 au nucléotide 8156) représentées à la figure 3, pour synthétiser des métabolites secondaires hybrides chez Sac. erythraea.  sequences eryBII (sequence complementary to SEQ ID N 1 from nucleotide 48 to nucleotide 1046), eryCIII (sequence complementary to SEQ ID N 1 from nucleotide 1046 to nucleotide 2308) or eryCII (sequence complementary to SEQ ID N 1 from nucleotide 2322 to nucleotide 3404 ) shown in FIG. 2, eryBIV (sequence of SEQ ID N 6 from nucleotide 242 to nucleotide 1207), eryBV (sequence of SEQ ID N 6 from nucleotide 1210 to nucleotide 2454), eryCVI (sequence of SEQ ID N 6 of nucleotide 2510 at nucleotide 3220), eryBVI (sequence of SEQ ID N 6 from nucleotide 3308 to nucleotide 4837), eryCIV (sequence of SEQ ID N 6 from nucleotide 4837 to nucleotide 6039), eryCV (sequence of SEQ ID N 6 from nucleotide 6080 to nucleotide 7546) or eryBVII (sequence of SEQ ID N 6 from nucleotide 7578 to nucleotide 8156) shown in FIG. 3, to synthesize hybrid secondary metabolites in Sac. erythraea.

Par métabolites secondaires hybrides, on entend soit des analogues de l'érythromycine, c'est-à-dire des dérivés de l'érythromycine ayant une ou plusieurs modifications portant sur la partie sucre et possédant une activité antibiotique, soit des précurseurs de l'érythromycine tels que le 6désoxyérythronolide B ou l'érythronolide B auxquels sont attachés un ou plusieurs résidus sucre modifiés ou non et ne possédant pas d'activité antibiotique. Le résidu sucre modifié peut être par exemple, le 4-céto-L-mycarose.  By hybrid secondary metabolites is meant either erythromycin analogs, that is to say erythromycin derivatives having one or more modifications relating to the sugar part and having antibiotic activity, or precursors of erythromycin such as 6 deoxyerythronolide B or erythronolide B to which are attached one or more modified or unmodified sugar residues and not having antibiotic activity. The modified sugar residue can be, for example, 4-keto-L-mycarose.

La synthèse de métabolites secondaires hybrides chez Sac. erythraea par utilisation de séquences d'ADN eryB ou eryC de l'invention peut être réalisée par exemple, par l'inactivation d'un ou plusieurs gènes eryB ou eryC ci-dessus et l'introduction d'un ou plusieurs gènes exogènes ou de leurs dérivés obtenus par exemple par mutagénèse, ayant des séquences nucléotidiques codant pour des enzymes ayant la même fonction chez des souches productrices d'autres macrolides, par exemple la tylosine, la picromycine ou la méthymycine. En particulier, l'introduction de gènes exogènes peut être effectuée par intégration d'une séquence d'ADN obtenue selon la méthodologie du "DNA shuffling" (Stemmer, 1994) ou par la construction d'une séquence d'ADN chimère,par  The synthesis of hybrid secondary metabolites in Sac. erythraea by using DNA sequences eryB or eryC of the invention can be carried out for example, by the inactivation of one or more genes eryB or eryC above and the introduction of one or more exogenous genes or their derivatives obtained for example by mutagenesis, having nucleotide sequences coding for enzymes having the same function in strains producing other macrolides, for example tylosin, picromycin or methymycin. In particular, the introduction of exogenous genes can be carried out by integration of a DNA sequence obtained according to the "DNA shuffling" methodology (Stemmer, 1994) or by the construction of a chimeric DNA sequence, by

<Desc/Clms Page number 10><Desc / Clms Page number 10>

exemple à partir d'une séquence eryB ou eryC de l'invention intervenant dans le transfert d'un résidu sucre, par exemple la séquence eryCIII ou eryBV, et de gènes homologues isolés à partir de souches productrices de macrolides, par exemple Streptomyces fradiae, Streptomyces olivaceus, Streptomyces venezuelae ou Streptomyces antibioticus.  example from an eryB or eryC sequence of the invention involved in the transfer of a sugar residue, for example the eryCIII or eryBV sequence, and of homologous genes isolated from macrolide producing strains, for example Streptomyces fradiae, Streptomyces olivaceus, Streptomyces venezuelae or Streptomyces antibioticus.

L'invention concerne aussi l'utilisation d'au moins l'une des séquences d'ADN choisie parmi les séquences eryBII (séquence complémentaire de SEQ ID N 1 du nucléotide 48 au nucléotide 1046), eryCIII (séquence complémentaire de SEQ ID N 1 du nucléotide 1046 au nucléotide 2308) ou eryCII (séquence complémentaire de SEQ ID N 1 du nucléotide 2322 au nucléotide 3404) représentées à la figure 2, eryBIV (séquence de SEQ ID N 6 du nucléotide 242 au nucléotide 1207), eryBV (séquence de SEQ ID N 6 du nucléotide 1210 au nucléotide 2454), eryCVI (séquence de SEQ ID N 6 du nucléotide 2510 au nucléotide 3220), eryBVI (séquence de SEQ ID N 6 du nucléotide 3308 au nucléotide 4837), eryCIV (séquence de SEQ ID N 6 du nucléotide 4837 au nucléotide 6039), eryCV (séquence de SEQ ID N 6 du nucléotide 6080 au nucléotide 7546) ou eryBVII (séquence de SEQ ID N 6 du nucléotide 7578 au nucléotide 8156) représentée à la figure 3 ou d'un fragment de cette séquence, comme sondes d'hybridation.  The invention also relates to the use of at least one of the DNA sequences chosen from the sequences eryBII (sequence complementary to SEQ ID N 1 from nucleotide 48 to nucleotide 1046), eryCIII (sequence complementary to SEQ ID N 1 from nucleotide 1046 to nucleotide 2308) or eryCII (sequence complementary to SEQ ID N 1 from nucleotide 2322 to nucleotide 3404) shown in FIG. 2, eryBIV (sequence from SEQ ID N 6 from nucleotide 242 to nucleotide 1207), eryBV (sequence of SEQ ID N 6 from nucleotide 1210 to nucleotide 2454), eryCVI (sequence of SEQ ID N 6 from nucleotide 2510 to nucleotide 3220), eryBVI (sequence of SEQ ID N 6 from nucleotide 3308 to nucleotide 4837), eryCIV (sequence of SEQ ID N 6 from nucleotide 4837 to nucleotide 6039), eryCV (sequence of SEQ ID N 6 of nucleotide 6080 to nucleotide 7546) or eryBVII (sequence of SEQ ID N 6 of nucleotide 7578 to nucleotide 8156) represented in FIG. 3 or of a fragment of this sequence , as hybridization probes.

Les séquences d'ADN eryB ou eryC de l'invention peuvent être utilisées pour constituer des sondes d'hybridation d'au moins 19 nucléotides, permettant d'isoler des gènes homologues dans des souches productrices de macrolides en utilisant les méthodes classiques d'hybridation d'acides nucléiques immobilisées sur des filtres ou d'amplification par PCR, selon les conditions décrites par Sambrook et al.  The eryB or eryC DNA sequences of the invention can be used to constitute hybridization probes of at least 19 nucleotides, making it possible to isolate homologous genes in macrolide producing strains using the conventional hybridization methods of nucleic acids immobilized on filters or of amplification by PCR, according to the conditions described by Sambrook et al.

(1989) . (1989).

L'invention concerne particulièrement l'utilisation de la séquence d'ADN eryCIII représentée à la figure 2 (séquence complémentaire de SEQ ID N 1 du nucléotide 1046 au nucléotide 2308 = séquence complémentaire de SEQ ID N 4) comme sonde d'hybridation pour isoler des gènes homologues responsables de la glycosylation de la macrolactone chez une souche productrice de macrolide.  The invention relates particularly to the use of the DNA sequence eryCIII represented in FIG. 2 (sequence complementary to SEQ ID N 1 from nucleotide 1046 to nucleotide 2308 = sequence complementary to SEQ ID N 4) as a hybridization probe for isolating homologous genes responsible for the glycosylation of macrolactone in a macrolide producing strain.

<Desc/Clms Page number 11> <Desc / Clms Page number 11>

L'invention concerne plus particulièrement l'utilisation ci-dessus, dans laquelle les gènes homologues sont les gènes de la biosynthèse de l'oléandomycine chez S. antibioticus.  The invention relates more particularly to the above use, in which the homologous genes are the genes for the biosynthesis of oleandomycin in S. antibioticus.

L'invention décrit, à titre d'exemple, l'utilisation de la séquence du gène eryCIII comme sonde d'hybridation pour isoler des gènes homologues dans une souche productrice d'oléandomycine. La sonde eryCIII utilisée a permis d'isoler les gènes oleG1 et oleG2 codant pour des glycosyltransférases chez S. antibioticus impliquées dans le transfert de la désosamine et de l'oléandrose sur le noyau lactone.  The invention describes, by way of example, the use of the sequence of the eryCIII gene as a hybridization probe for isolating homologous genes in a strain producing oleandomycin. The eryCIII probe used made it possible to isolate the oleG1 and oleG2 genes coding for glycosyltransferases in S. antibioticus involved in the transfer of desosamine and oleandrosis to the lactone nucleus.

La caractérisation fonctionnelle des gènes oleG1 et oleG2 a permis de définir l'organisation de la partie droite du cluster des gènes de la biosynthèse de l'oléandomycine chez S. antibioticus.  The functional characterization of the oleG1 and oleG2 genes made it possible to define the organization of the right side of the cluster of genes for the biosynthesis of oleandomycin in S. antibioticus.

L'invention a donc pour objet une séquence d'ADN isolée représentée à la figure 22 (séquence de SEQ ID N 15) correspondant à une région du cluster de gènes de la biosynthèse de l'oléandomycine comprenant : - la séquence correspondant à l'ORF oleP1 du nucléotide 184 au nucléotide 1386, - la séquence correspondant à l'ORF oleG1 du nucléotide 1437 au nucléotide 2714 codant pour une activité glycosyltransférase, - la séquence correspondant à l'ORF oleG2 du nucléotide 2722 au nucléotide 3999 codant pour une activité glycosyltransférase, - la séquence correspondant à l'ORF oleM du nucléotide 3992 au nucléotide 4720 (= séquence de SEQ ID N 20) et - la séquence correspondant à l'ORF oleY du nucléotide 4810 au nucléotide 5967.  The subject of the invention is therefore an isolated DNA sequence represented in FIG. 22 (sequence of SEQ ID N 15) corresponding to a region of the gene cluster for the biosynthesis of oleandomycin comprising: - the sequence corresponding to ORF oleP1 from nucleotide 184 to nucleotide 1386, - the sequence corresponding to ORF oleG1 from nucleotide 1437 to nucleotide 2714 coding for glycosyltransferase activity, - the sequence corresponding to ORF oleG2 from nucleotide 2722 to nucleotide 3999 coding for glycosyltransferase activity , - the sequence corresponding to the oleM ORF from nucleotide 3992 to nucleotide 4720 (= sequence of SEQ ID N 20) and - the sequence corresponding to the oleY ORF from nucleotide 4810 to nucleotide 5967.

La séquence d'ADN ci-dessus montrée à la figure 22 (séquence de SEQ ID N 15) est une séquence d'ADN génomique qui peut être obtenue par exemple à partir d'un cosmide couvrant la partie droite du cluster de gènes de la biosynthèse de l'oléandomycine par hybridation avec une sonde eryCIII, selon les conditions opératoires dont une description détaillée est donnée plus loin.  The above DNA sequence shown in FIG. 22 (sequence of SEQ ID N 15) is a genomic DNA sequence which can be obtained for example from a cosmid covering the right part of the gene cluster of the biosynthesis of oleandomycin by hybridization with an eryCIII probe, according to the operating conditions, a detailed description of which is given below.

L'invention a plus particulièrement pour objet une  The subject of the invention is more particularly a

<Desc/Clms Page number 12><Desc / Clms Page number 12>

séquence d'ADN isolée représentée à la figure 22 choisie parmi la séquence correspondant à l'ORF oleG1 (séquence de SEQ ID N 15 du nucléotide 1437 au nucléotide 2714 codant pour une activité glycosyltransférase et la séquence correspondant à l'ORF oleG2 (séquence de SEQ ID N 15 du nucléotide 2722 au nucléotide 3999) codant pour une activité glycosyltransférase.  isolated DNA sequence represented in FIG. 22 chosen from the sequence corresponding to the ORF oleG1 (sequence of SEQ ID N 15 from nucleotide 1437 to nucleotide 2714 coding for a glycosyltransferase activity and the sequence corresponding to the ORF oleG2 (sequence of SEQ ID N 15 from nucleotide 2722 to nucleotide 3999) coding for glycosyltransferase activity.

L'invention a tout particulièrement pour objet une séquence d'ADN isolée ci-dessus correspondant à l'ORF oleG1 (séquence de SEQ ID N 15 du nucléotide 1437 au nucléotide 2714) codant pour une activité désosaminyltransférase, ainsi qu'une séquence d'ADN isolée ci-dessus correspondant à l'ORF oleG2 (séquence de SEQ ID N 15 du nucléotide 2722 au nucléotide 3999) codant pour une activité oléandrosyltransférase.  The subject of the invention is very particularly a DNA sequence isolated above corresponding to the ORF oleG1 (sequence of SEQ ID N 15 from nucleotide 1437 to nucleotide 2714) coding for a deosaminyltransferase activity, as well as a sequence of DNA isolated above corresponding to the ORF oleG2 (sequence of SEQ ID N 15 from nucleotide 2722 to nucleotide 3999) coding for an oleandrosyltransferase activity.

La séquence correspondant à l'ORF oleG1 code pour un polypeptide ayant 426 acides aminés (séquence de SEQ ID N 17) et la séquence correspondant à l'ORF oleG2 code pour un polypeptide ayant 426 acides aminés (séquence de SEQ ID N 18).  The sequence corresponding to the ORF oleG1 codes for a polypeptide having 426 amino acids (sequence of SEQ ID N 17) and the sequence corresponding to the ORF oleG2 codes for a polypeptide having 426 amino acids (sequence of SEQ ID N 18).

La mise en évidence des activités enzymatiques respectives indiquées ci-dessus a été réalisée par altération du gène correspondant telle qu'illustrée plus loin dans la partie expérimentale.  The demonstration of the respective enzymatic activities indicated above was carried out by alteration of the corresponding gene as illustrated later in the experimental part.

L'invention a aussi pour objet le polypeptide codé par la séquence d'ADN correspondant à l'ORF oleG1 et ayant une activité désosaminyltransférase (séquence de SEQ ID N 17) et le polypeptide codé par la séquence d'ADN correspondant à l'ORF oleG2 et ayant une activité oléandrosyltransférase (séquence de SEQ ID N 18).  A subject of the invention is also the polypeptide coded by the DNA sequence corresponding to the oleG1 ORF and having a deosaminyltransferase activity (sequence of SEQ ID N 17) and the polypeptide coded by the DNA sequence corresponding to the ORF oleG2 and having oleandrosyltransferase activity (sequence of SEQ ID N 18).

Les polypeptides ci-dessus dénommés respectivement OleGl et OleG2 peuvent être obtenus par les méthodes connues indiquées ci-dessus.  The above polypeptides called respectively OleGl and OleG2 can be obtained by the known methods indicated above.

L'invention a aussi pour objet un procédé de préparation de métabolites secondaires hybrides chez Sac. erythraea dans lequel : - on isole une séquence ADN contenant au moins une séquence eryB ou une séquence eryC du cluster de gènes de la bio-  The invention also relates to a process for the preparation of hybrid secondary metabolites in Sac. erythraea in which: - a DNA sequence is isolated containing at least one eryB sequence or an eryC sequence from the gene cluster of bio-

<Desc/Clms Page number 13><Desc / Clms Page number 13>

synthèse de l'érythromycine représentée à la figure 2 (séquence complémentaire de SEQ ID N 1) ou à la figure 3 (séquence de SEQ ID N 6), - on crée une modification dans la dite séquence et on obtient une séquence altérée, - on intègre la séquence altérée dans le chromosome de la souche hôte et on obtient une souche modifiée, - on cultive la souche modifiée dans des conditions permettant la formation du métabolite secondaire hybride et - on isole le métabolite secondaire hybride.  synthesis of erythromycin shown in FIG. 2 (sequence complementary to SEQ ID N 1) or in FIG. 3 (sequence of SEQ ID N 6), - a modification is created in said sequence and an altered sequence is obtained, - the altered sequence is integrated into the chromosome of the host strain and a modified strain is obtained, - the modified strain is cultivated under conditions allowing the formation of the hybrid secondary metabolite and - the hybrid secondary metabolite is isolated.

La modification de la séquence d'ADN peut être réalisée par exemple par une addition et/ou par une délétion de séquences d'ADN d'au moins un nucléotide, dans une séquence eryB ou eryC de l'invention qui code pour l'une des enzymes correspondantes indiquées ci-dessus.  The modification of the DNA sequence can be carried out for example by adding and / or by deleting DNA sequences of at least one nucleotide, in an eryB or eryC sequence of the invention which codes for one corresponding enzymes indicated above.

L'intégration de la séquence altérée dans la souche hôte peut être réalisée par exemple par la méthodologie de la recombinaison homologue qui peut être effectuée selon le schéma montré à la figure 4 et conduit à la génération de mutants chromosomiques de souches Sac. erythraea que l'on cultive ensuite selon les méthodes générales connues de culture cellulaire.  The integration of the altered sequence into the host strain can be carried out for example by the methodology of homologous recombination which can be carried out according to the scheme shown in FIG. 4 and leads to the generation of chromosomal mutants of Sac strains. erythraea which is then cultivated according to the general known methods of cell culture.

L'invention a particulièrement pour objet le procédé cidessus dans lequel la séquence ADN code pour l'une des enzymes choisie parmi une - dTDP-4-céto-D-6-désoxyhexose 2,3-réductase, - désosaminyltransférase, - dTDP-4-céto-D-6-désoxyhexose 3,4-isomérase, - dTDP-4-céto-L-6-désoxyhexose 4-réductase, - mycarosyltransférase, - dTDP-D-6-désoxyhexose 3-N-méthyltransférase, - dTDP-4-céto-L-6-désoxyhexose 2,3-déshydratase, - dTDP-D-6-désoxyhexose 3,4-déshydratase, - dTDP-D-4,6-didésoxyhexose 3,4-réductase ou - dTDP-4-céto-D-6-désoxyhexose 3,5 épimérase.  The invention particularly relates to the above process in which the DNA sequence codes for one of the enzymes chosen from a - dTDP-4-keto-D-6-deoxyhexose 2,3-reductase, - deosaminyltransferase, - dTDP-4 -keto-D-6-deoxyhexose 3,4-isomerase, - dTDP-4-keto-L-6-deoxyhexose 4-reductase, - mycarosyltransferase, - dTDP-D-6-deoxyhexose 3-N-methyltransferase, - dTDP- 4-keto-L-6-deoxyhexose 2,3-dehydratase, - dTDP-D-6-deoxyhexose 3,4-dehydratase, - dTDP-D-4,6-dideoxyhexose 3,4-reductase or - dTDP-4- keto-D-6-deoxyhexose 3.5 epimerase.

L'invention a plus particulièrement pour objet le procédé ci-dessus dans lequel l'altération de la séquence résulte dans l'inactivation d'au moins l'une des enzymes  The invention more particularly relates to the above method in which the alteration of the sequence results in the inactivation of at least one of the enzymes

<Desc/Clms Page number 14><Desc / Clms Page number 14>

indiquées ci-dessus.  indicated above.

L'inactivation d'au moins 1-lune des enzymes est mise en évidence, d'une part par l'absence de production d'érythromycine, d'autre part par l'accumulation de précurseurs de l'érythromycine tels que le 6-désoxyérythronolide B, l'érythronolide B ou le 3-a-mycarosyl érythronolide B et/ou l'accumulation de métabolites secondaires hybrides tels que définis précédemment dans les surnageants de cultures des souches modifiées correspondantes.  The inactivation of at least 1-moon of the enzymes is demonstrated, on the one hand by the absence of erythromycin production, on the other hand by the accumulation of erythromycin precursors such as 6- deoxyerythronolide B, erythronolide B or 3-a-mycarosyl erythronolide B and / or the accumulation of hybrid secondary metabolites as defined above in the culture supernatants of the corresponding modified strains.

L'invention concerne tout particulièrement le procédé ci-dessus dans lequel l'enzyme inactivée est une dTDP-4-cétoL-6-désoxyhexose 4-réductase ou dans lequel l'enzyme inactivée est une dTDP-D-6-désoxyhexose 3,4-déshydratase ou dans lequel l'enzyme inactivée est une mycarosyltransférase ou dans lequel l'enzyme inactivée est une dTDP-4-céto-L-6désoxyhexose 2,3-réductase.  The invention relates more particularly to the above method in which the inactivated enzyme is a dTDP-4-ketoL-6-deoxyhexose 4-reductase or in which the inactivated enzyme is a dTDP-D-6-deoxyhexose 3,4 -dehydratase or in which the inactivated enzyme is a mycarosyltransferase or in which the inactivated enzyme is a dTDP-4-keto-L-6 deoxyhexose 2,3-reductase.

L'invention concerne aussi le procédé ci-dessus dans lequel le métabolite secondaire hybride isolé est un analogue de l'érythromycine choisi parmi la 4"-céto-érythromycine, la 4'-hydroxy-érythromycine ou la 3"-C désméthyl-2",3"-ène- érythromycine ou dans lequel le métabolite secondaire hybride isolé est le désosaminyl érythronolide B.  The invention also relates to the above process in which the isolated hybrid secondary metabolite is an erythromycin analog chosen from 4 "-keto-erythromycin, 4'-hydroxy-erythromycin or 3" -C-desmethyl-2 ", 3" -ene- erythromycin or in which the isolated hybrid secondary metabolite is desosaminyl erythronolide B.

Des exemples de mise en oeuvre du procédé de l'invention sont donnés dans la partie expérimentale. L'accumulation de métabolites secondaires hybrides dans des souches de Sac. erythraea modifiées est également décrite plus loin.  Examples of implementation of the method of the invention are given in the experimental part. The accumulation of hybrid secondary metabolites in Sac strains. modified erythraea is also described below.

L'invention concerne aussi une souche de Sac. erythraea modifiée dans laquelle au moins l'une des enzymes choisie parmi une - dTDP-4-céto-L-6-désoxyhexose 2,3-réductase, - désosaminyltransférase, - dTDP-4-céto-D-6-désoxyhexose 3,4-isomérase, - dTDP-4-céto-L-6-désoxyhexose 4-réductase, - mycarosyltransférase, - dTDP-D-6-désoxyhexose 3-N-méthyltransférase, - dTDP-4-céto-L-6-désoxyhexose 2,3-déshydratase, - dTDP-D-6-désoxyhexose 3,4-déshydratase, - dTDP-D-4,6-didésoxyhexose 3,4-réductase ou  The invention also relates to a Sac strain. modified erythraea in which at least one of the enzymes chosen from a - dTDP-4-keto-L-6-deoxyhexose 2,3-reductase, - deosaminyltransferase, - dTDP-4-keto-D-6-deoxyhexose 3,4 -isomerase, - dTDP-4-keto-L-6-deoxyhexose 4-reductase, - mycarosyltransferase, - dTDP-D-6-deoxyhexose 3-N-methyltransferase, - dTDP-4-keto-L-6-deoxyhexose 2, 3-dehydratase, - dTDP-D-6-deoxyhexose 3,4-dehydratase, - dTDP-D-4,6-dideoxyhexose 3,4-reductase or

<Desc/Clms Page number 15><Desc / Clms Page number 15>

- dTDP-4-céto-D-6-désoxyhexose 3,5 épimérase est inactivée et produisant au moins un métabolite secondaire hybride.  - dTDP-4-keto-D-6-deoxyhexose 3,5 epimerase is inactivated and produces at least one secondary hybrid metabolite.

L'invention concerne particulièrement la souche de Sac. erythraea modifiée BII92 dans laquelle une dTDP-4-céto-L-6désoxyhexose 2,3-réductase est inactivée et produisant la 3"-C désméthyl-2",3"-ène-érythromycine C, la souche de Sac. erythraea modifiée BIV87 dans laquelle une dTDP-4-céto-L-6désoxyhexose 4-réductase est inactivée et produisant la 4"céto-érythromycine, la souche de Sac. erythraea modifiée CIV89 dans laquelle une dTDP-D-6-désoxyhexose 3,4-déshydratase est inactivée et produisant la 4'-hydroxyérythromycine D ainsi que la souche de Sac. erythraea modifiée BV88 dans laquelle une mycarosyltransférase est inactivée et produisant du désoaminyl érythronolide B. Des constructions détaillées des souches ci-dessus sont données plus loin dans la partie expérimentale.  The invention particularly relates to the Sac strain. modified BII92 erythraea in which a dTDP-4-keto-L-6 deoxyhexose 2,3-reductase is inactivated and producing 3 "-C desmethyl-2", 3 "-ene-erythromycin C, the Sac strain. modified erythraea BIV87 in which a dTDP-4-keto-L-6 deoxyhexose 4-reductase is inactivated and producing 4 "keto-erythromycin, the Sac strain. modified CIV89 erythraea in which a dTDP-D-6-deoxyhexose 3,4-dehydratase is inactivated and producing 4'-hydroxyerythromycin D as well as the Sac strain. modified erythraea BV88 in which a mycarosyltransferase is inactivated and producing deoaminyl erythronolide B. Detailed constructions of the above strains are given later in the experimental part.

L'invention concerne aussi un procédé de préparation de précurseurs de l'oléandomycine chez S. antibioticus dans lequel - on crée une altération de la séquence du gène choisie parmi la séquence d'ADN correspondant à l'ORF oleG1 (séquence de SEQ ID N 15 du nucléotide 1437 au nucléotide 2714) et la séquence d'ADN correspondant à l'ORF oleG2 (séquence de SEQ ID N 15 du nucléotide 2722 au nucléotide 3999) dans le chromosome d'une souche hôte et obtient une souche modifiée, - on cultive la souche modifiée dans des conditions permettant l'accumulation des précurseurs de l'oléandomycine et - on isole ces précurseurs.  The invention also relates to a process for the preparation of oleandomycin precursors in S. antibioticus in which - an alteration is created in the gene sequence chosen from the DNA sequence corresponding to the ORF oleG1 (sequence of SEQ ID N 15 from nucleotide 1437 to nucleotide 2714) and the DNA sequence corresponding to the ORF oleG2 (sequence of SEQ ID N 15 from nucleotide 2722 to nucleotide 3999) in the chromosome of a host strain and a modified strain is obtained, - we the modified strain is cultivated under conditions allowing the accumulation of the oleandomycin precursors and - these precursors are isolated.

L'altération de la séquence d'ADN peut être réalisée par exemple par interruption du gène cible dans la souche S. antibioticus, par exemple par intégration d'un plasmide par la méthodologie de la recombinaison homologue et conduit à la génération de mutants chromosomiques de la souche sauvage.  The alteration of the DNA sequence can be carried out for example by interruption of the target gene in the strain S. antibioticus, for example by integration of a plasmid by the methodology of homologous recombination and leads to the generation of chromosomal mutants of the wild strain.

L'invention concerne particulièrement un procédé ci-  The invention particularly relates to a process

<Desc/Clms Page number 16><Desc / Clms Page number 16>

dessus dans lequel l'altération est créée dans la séquence d'ADN correspondant à l'ORF oleG1 (séquence de SEQ ID N 15 du nucléotide 1437 au nucléotide 2714) et dont il résulte au moins l'élimination de l'activité désoaminyltransférase et l'accumulation du précurseur de l'oléandomycine 8,8a-désoxyoléandolide.  above in which the alteration is created in the DNA sequence corresponding to the ORF oleG1 (sequence of SEQ ID N 15 from nucleotide 1437 to nucleotide 2714) and from which it results at least the elimination of the deoaminyltransferase activity and l accumulation of the oleandomycin 8,8a-deoxyoleandolide precursor.

L'accumulation d'un précurseur non glycosylé de l'oléandomycine 8,8a-désoxyoléandolide observée par interruption du gène oleG1 est due à un effet polaire transcriptionnel inactivant le gène oleG2.  The accumulation of an unglycosylated precursor of oleandomycin 8,8a-deoxyoleandolide observed by interruption of the oleG1 gene is due to a polar transcriptional effect inactivating the oleG2 gene.

Un exemple de mise en oeuvre du procédé ci-dessus est donné plus loin dans la partie expérimentale.  An example of implementation of the above method is given later in the experimental part.

Matériels et méthodes générales. General materials and methods.

1. Souches bactériennes, plasmides et conditions de croissance. 1. Bacterial strains, plasmids and growth conditions.

La souche Sac. erythraea utilisée pour la réalisation de l'invention est un variant phénotypique spontané dit "red variant" (Hessler et al., 1997) de la souche sauvage Sac. erythraea NRRL 2338 dont la croissance est effectuée en routine soit sur milieu solide R2T2 (milieu R2T décrit par Weber et al., 1985 sans peptone), R2T20 (Yamamoto et al., 1986) ou Ml-102 sur agar (Kaneda et al., 1962), soit en milieu liquide TSB (Oxoid) à 30 C.  The Sac strain. erythraea used for carrying out the invention is a spontaneous phenotypic variant called "red variant" (Hessler et al., 1997) of the wild strain Sac. erythraea NRRL 2338, the growth of which is carried out routinely either on solid R2T2 medium (R2T medium described by Weber et al., 1985 without peptone), R2T20 (Yamamoto et al., 1986) or Ml-102 on agar (Kaneda et al. , 1962), or in TSB (Oxoid) liquid medium at 30 C.

La souche Streptomyces lividans 1326 (John Innes Culture Collection) décrite par Hopwood et al. (1983), utilisée pour la préparation de plasmides dépourvus d'origine de réplication d'Escherichia coli tels que pIJ702 et pIJ486, a été maintenue sur milieu solide R2YE (R5) et al., 1985).  The strain Streptomyces lividans 1326 (John Innes Culture Collection) described by Hopwood et al. (1983), used for the preparation of plasmids devoid of Escherichia coli origin of replication such as pIJ702 and pIJ486, was maintained on solid medium R2YE (R5) et al., 1985).

La croissance des souches E. coli XL1-blue (Stratagene), JM110 (Stratagene) et DH5a.MCR (GibcoBRL), utilisées pour les préparations de plasmides, a été effectuée en routine en milieu liquide 2 x YT ou LB ou en milieu solide LB sur agar, tels que décrits par Sambrook et al. (1989). La souche E. coli XL1-blue est utilisée pour les clonages en routine.  The growth of the E. coli XL1-blue (Stratagene), JM110 (Stratagene) and DH5a.MCR (GibcoBRL) strains, used for the plasmid preparations, was carried out routinely in liquid medium 2 x YT or LB or in solid medium LB on agar, as described by Sambrook et al. (1989). The E. coli XL1-blue strain is used for routine cloning.

La souche JM110 est utilisée pour des clonages où l'on utilise des sites de restriction tels que BclI. La souche DH5a.MCR est utilisée pour la préparation de plasmides The JM110 strain is used for cloning where restriction sites such as BclI are used. The DH5a.MCR strain is used for the preparation of plasmids

<Desc/Clms Page number 17><Desc / Clms Page number 17>

destinés à être introduits chez Sac. erythraea pour une transformation optimale.  intended to be introduced to Sac. erythraea for optimal transformation.

La sélection des plasmides dans E. coli a été effectuée sur ampicilline (Sigma) à 100 g/ml.  The selection of the plasmids in E. coli was carried out on ampicillin (Sigma) at 100 g / ml.

Les souches Bacillus subtilis ATCC 6633 ou Bacillus pumilus ATCC 14884 ont été utilisées comme souches indicatrices pour évaluer la production d'érythromycine dans des essais biologiques par antibiogramme.  Bacillus subtilis ATCC 6633 or Bacillus pumilus ATCC 14884 were used as indicator strains to assess the production of erythromycin in bioassays by antibiogram.

Les plasmides Litmus28, pUC18 et pUC19 (New England Biolabs) ont été utilisés en routine pour les sous-clonages.  The plasmids Litmus28, pUC18 and pUC19 (New England Biolabs) were used routinely for subcloning.

Le vecteur pIJ702 (Katz et al., 1983) a été obtenu du John Innes Institute. Le vecteur pIJ486 (Ward et al., 1986) a été obtenu de C.J. Thompson (Université de Bâle, Suisse). Le phagmide pTZ18R a été obtenu de Pharmacia Biotech. Le vecteur navette coli-streptomyces pUWL218 (Wehmeier, 1995) utilisé pour l'intégration chromosomique dans Sac. erythraea a été obtenu de W. Piepersberg (Université de Wuppertal, Allemagne). The vector pIJ702 (Katz et al., 1983) was obtained from the John Innes Institute. The vector pIJ486 (Ward et al., 1986) was obtained from C.J. Thompson (University of Basel, Switzerland). The phagmid pTZ18R was obtained from Pharmacia Biotech. The coli-streptomyces shuttle vector pUWL218 (Wehmeier, 1995) used for chromosomal integration in Sac. erythraea was obtained from W. Piepersberg (University of Wuppertal, Germany).

2. Manipulation de l'ADN et séquençage. 2. DNA manipulation and sequencing.

Les méthodes générales de biologie moléculaire utilisées sont décrites par Sambrook et al., 1989.  The general methods of molecular biology used are described by Sambrook et al., 1989.

Les réactifs d'origine commerciale ont été utilisés incluant les enzymes de restriction (New England Biolabs et Boehringer Mannheim), le fragment de Klenow de l'ADN polymerase I (Boehringer Mannheim). La trousse "DNA ligation system" (Amersham) a été utilisée pour effectuer les ligations et la trousse Plasmid Midi kit (Quiagen) ou RPM kit (Bio101 Inc. ) pour purifier l'ADN plasmidique.  Commercial reagents were used including restriction enzymes (New England Biolabs and Boehringer Mannheim), the Klenow fragment of DNA polymerase I (Boehringer Mannheim). The DNA ligation system kit (Amersham) was used to perform the ligations and the Plasmid Midi kit (Quiagen) or RPM kit (Bio101 Inc.) to purify the plasmid DNA.

La préparation de l'ADN du bactériophage X a été réalisée selon Ausubel et al. (1995) et l'isolement de l'ADN chromosomique de Sac. erythraea selon Hopwood et al. (1985).  The preparation of the bacteriophage X DNA was carried out according to Ausubel et al. (1995) and the isolation of chromosomal DNA from Sac. erythraea according to Hopwood et al. (1985).

La transformation de S. lividans et l'isolement des plasmides ont été effectués selon Hopwood et al. (1985).  The transformation of S. lividans and the isolation of the plasmids were carried out according to Hopwood et al. (1985).

3. Préparation de l'érythronolide B et du 3-a-mycarosyl érythronolide B. 3. Preparation of erythronolide B and 3-a-mycarosyl erythronolide B.

L'érythronolide B et le 3-a-mycarosyl érythronolide B ont été purifiés à partir d'extraits de culture du mutant eryCI (clone WHB2221 décrit par Dhillon et al., 1989) par chromatographie sur gel d'aminopropyl (LichroprepNH2 25-40 ,  Erythronolide B and 3-a-mycarosyl erythronolide B were purified from culture extracts of the eryCI mutant (clone WHB2221 described by Dhillon et al., 1989) by chromatography on aminopropyl gel (LichroprepNH2 25-40 ,

<Desc/Clms Page number 18><Desc / Clms Page number 18>

Merck) avec un gradient d'élution par des mélanges chlorure de butyle/chlorure de méthylène successifs (100: 0, 80:20, 50 :50 et 20 :80) suivid'un gradient d'élution linéaire par le mélange chlorure de butyle/méthanol variant de 99:1 à 90 :10.  Merck) with an elution gradient by successive butyl chloride / methylene chloride mixtures (100: 0, 80:20, 50: 50 and 20: 80) followed by a linear elution gradient with the butyl chloride mixture / methanol varying from 99: 1 to 90: 10.

Les fractions contenant les produits attendus sont amenées à sec sous vide puis analysées par chromatographie en couche mince (ccm). L'érythronolide B est ensuite cristallisé dans un mélange acétate d'éthyle/hexane puis recristallisé dans l'éthanol. Le 3-a-mycarosyl érythronolide B est cristallisé deux fois dans un mélange acétate d'éthyle/hexane. The fractions containing the expected products are brought to dryness under vacuum and then analyzed by thin layer chromatography (ccm). Erythronolide B is then crystallized from an ethyl acetate / hexane mixture and then recrystallized from ethanol. 3-a-mycarosyl erythronolide B is crystallized twice from an ethyl acetate / hexane mixture.

Milieux cités. Cited environments.

1. R2T2 : Pour 1 litre de solution aqueuse : sucrose 103 g ; K2S04 0,25g ; extrait de levure 6,5 g ; 5,0 g ; 22,0 g ; eau distillée qsp 860 ml. La solution est stéri- lisée par autoclavage pendant 30 minutes à 120 C. Au moment de l'utilisation, les solutions stériles suivantes sont ajoutées : 20 ml de glucose à 50 % ; ml de Tris-HCl 1M, pH7,0 ; 5 ml de KH2P04 à 0,5 % ; 2,5 ml de NaOH 1N ; 50 ml de CaCl2 1M ; 50 ml de MgC12,6H20 1M et 2 ml de solution de "trace éléments" (Hopwood et al., 1985). 1. R2T2: For 1 liter of aqueous solution: sucrose 103 g; K2SO4 0.25g; yeast extract 6.5 g; 5.0 g; 22.0 g; distilled water qs 860 ml. The solution is sterilized by autoclaving for 30 minutes at 120 C. At the time of use, the following sterile solutions are added: 20 ml of 50% glucose; ml of 1M Tris-HCl, pH 7.0; 5 ml 0.5% KH2PO4; 2.5 ml of 1N NaOH; 50 ml of 1M CaCl2; 50 ml of 1 M MgC12.6H20 and 2 ml of "trace element" solution (Hopwood et al., 1985).

2. R2T20 : Pour un litre de solution aqueuse : milieu R2T2 contenant 206 g de sucrose. 2. R2T20: For one liter of aqueous solution: R2T2 medium containing 206 g of sucrose.

3. Ml-102 (Kaneda et al., 1962) : Pour 1 litre de solution aqueuse : glucose 5 g ; sucre brun commercial 10 g ; 5 g ; de levure 2,5 g ; Versène 36 mg ; eau courante 1000 ml ; final ajusté à 7,0 à 7,2 avec KOH. La solution est stérilisée par autoclavage pendant 30 minutes à 120 C. 3. MI-102 (Kaneda et al., 1962): For 1 liter of aqueous solution: glucose 5 g; commercial brown sugar 10 g; 5 g; yeast 2.5 g; Versene 36 mg; running water 1000 ml; final adjusted to 7.0 to 7.2 with KOH. The solution is sterilized by autoclaving for 30 minutes at 120 C.

4. R2YE (R5) et al., 1985) : Pour 1 litre de solution aqueuse : sucrose 103 g ; K2S04 0,25 g ; MgCl2,6H20 10,12 g ; casaminoacides 0,1 g ; de "trace éléments" 2 ml ; extrait de levure 5 g ; TES 5,72 g ; bactoagar 15 g ; eau distillée qsp 940 ml. La solution est stérilisée par autoclavage pendant 30 minutes à 120 C. Au moment de l'utilisation, les solutions stériles suivantes sont ajoutées : 10 ml de KH2P04 0,5 % ; ml de  4. R2YE (R5) et al., 1985): For 1 liter of aqueous solution: sucrose 103 g; K2SO4 0.25 g; MgCl2.6H20 10.12 g; casamino acids 0.1 g; of "trace elements" 2 ml; yeast extract 5 g; TES 5.72 g; bacteroagar 15 g; distilled water qs 940 ml. The solution is sterilized by autoclaving for 30 minutes at 120 C. At the time of use, the following sterile solutions are added: 10 ml of 0.5% KH2PO4; ml of

<Desc/Clms Page number 19><Desc / Clms Page number 19>

CaCl2 1M ; 15 ml de L-proline à 20 % ; 20 ml de glucose à 50 % et 1 ml de CuCl2 10mM.  1M CaCl2; 15 ml of 20% L-proline; 20 ml of 50% glucose and 1 ml of 10mM CuCl2.

5.2 x TY : Pour 1 litre de solution aqueuse : tryptone 10 g ; de levure 10 g ; NaCl 5 g. 5.2 x TY: For 1 liter of aqueous solution: tryptone 10 g; yeast 10 g; NaCl 5 g.

6. Tampon PT : Pour 1 litre de solution aqueuse : sucrose 100 g ; K2S04 0,25 g ; MgCl26H20 5,1 g ; de "trace éléments" 2 ml ; distillée qsp 875 ml. La solution est stérilisée par autoclavage pendant 30 minutes à 120 C. Au moment de l'utilisation, les solutions stériles suivantes sont ajoutées : 5 ml de CaCl2 et 20 ml de TES 5,3 %. 6. PT buffer: For 1 liter of aqueous solution: sucrose 100 g; K2SO4 0.25 g; MgCl26H20 5.1 g; of "trace elements" 2 ml; distilled qs 875 ml. The solution is sterilized by autoclaving for 30 minutes at 120 C. At the time of use, the following sterile solutions are added: 5 ml of CaCl2 and 20 ml of 5.3% TES.

7. Sucrose-succinate (Caffrey et al., 1992) : Pour 1 litre de solution aqueuse : sucrose 0,2 M ; succinique 20 mM ; phosphate de potassium 20 mM (pH 6,6) ; sulfate de magnésium 5 mM ; de potassium 100 mM ; solution de "trace éléments" 2 ml. La solution est stérilisée par autoclavage pendant 30 minutes à 120 C. 7. Sucrose-succinate (Caffrey et al., 1992): For 1 liter of aqueous solution: 0.2 M sucrose; 20 mM succinic; 20 mM potassium phosphate (pH 6.6); 5 mM magnesium sulfate; 100 mM potassium; "trace elements" solution 2 ml. The solution is sterilized by autoclaving for 30 minutes at 120 C.

Les figures ci-annexées illustrent certains aspects de l'invention. The attached figures illustrate certain aspects of the invention.

La figure 1 représente la voie de biosynthèse de l'érythromycine A.  Figure 1 shows the biosynthetic pathway for erythromycin A.

La figure 2 représente la séquence nucléotidique (séquence directe et complémentaire de SEQ ID N 1) de la région eryG-eryAIII du cluster de gènes de la biosynthèse de l'érythromycine comprenant les ORFs 7,8 et 9 et leurs séquences protéiques déduites.  FIG. 2 represents the nucleotide sequence (direct sequence complementary to SEQ ID N 1) of the eryG-eryAIII region of the erythromycin biosynthesis gene cluster comprising ORFs 7,8 and 9 and their deduced protein sequences.

La figure 3 représente la séquence nucléotidique (séquence de SEQ ID N 6) de la région eryAI-eryK du cluster de gènes de la biosynthèse de l'érythromycine comprenant les ORFs 13 à 19 et leurs séquences protéiques déduites.  FIG. 3 represents the nucleotide sequence (sequence of SEQ ID N 6) of the eryAI-eryK region of the erythromycin biosynthesis gene cluster comprising ORFs 13 to 19 and their deduced protein sequences.

La figure 4 représente le schéma de substitution de gène par recombinaison homologue.  Figure 4 shows the gene substitution scheme by homologous recombination.

La figure 5A représente l'organisation de la partie gauche du cluster des gènes de la biosynthèse de l'érythromy- cine chez Sac. erythraea dont les ORFs 1 à 9 sont indiquées par des flèches ainsi qu'une carte de restriction des plasmides pK62, pBCKl, pKB22, pBK44, pBIISB, pEco2 et pK23,  FIG. 5A represents the organization of the left part of the cluster of genes for the biosynthesis of erythromycin in Sac. erythraea whose ORFs 1 to 9 are indicated by arrows as well as a restriction map of the plasmids pK62, pBCKl, pKB22, pBK44, pBIISB, pEco2 and pK23,

<Desc/Clms Page number 20><Desc / Clms Page number 20>

générés à partir du clone génomique XSE5.5. (Abréviations des enzymes de restriction : B, BamHI ; Bc, BclI ; Bg, BglII ; E, EcoRI ; K, KpnI ; M, MluI ; P, PstI ; S, SacI ; Sa, SalI.)
La figure 5B représente l'organisation de la partie droite du cluster des gènes de la biosynthèse de l'érythromycine chez Sac. erythraea dont les ORFs 13 à 21 sont indiquées par des flèches ainsi qu'une carte de restriction des plasmides pBK6-12, pCN9, pNC028, pNB49, pNC062, pPSP4, pNC062X et pBAB18. (Abréviations des enzymes de restriction : B, BamHI ; Ba, BalI ; Bc, BclI ; C, ClaI ; E, EcoRI ; K, KpnI ; N, NcoI ; Ns, NsiI ; P, PstI ; Pv, PvuII ; S, SacI ; Sc, ScaI ; Sh, SphI ; Sp, SpeI ; X, XbaI ; Xh, XhoI).
generated from the XSE5.5 genomic clone. (Abbreviations for restriction enzymes: B, BamHI; Bc, BclI; Bg, BglII; E, EcoRI; K, KpnI; M, MluI; P, PstI; S, SacI; Sa, SalI.)
FIG. 5B represents the organization of the right part of the cluster of genes for the biosynthesis of erythromycin in Sac. erythraea whose ORFs 13 to 21 are indicated by arrows as well as a restriction map of the plasmids pBK6-12, pCN9, pNC028, pNB49, pNC062, pPSP4, pNC062X and pBAB18. (Abbreviations of restriction enzymes: B, BamHI; Ba, BalI; Bc, BclI; C, ClaI; E, EcoRI; K, KpnI; N, NcoI; Ns, NsiI; P, PstI; Pv, PvuII; S, SacI ; Sc, ScaI; Sh, SphI; Sp, SpeI; X, XbaI; Xh, XhoI).

La figure 6A représente le schéma de construction du plasmide pBIlA.  FIG. 6A represents the construction diagram of the plasmid pBIlA.

La figure 6B représente une carte de restriction du plasmide pUWL218.  Figure 6B shows a restriction map of plasmid pUWL218.

La figure 6C représente une carte de restriction du plasmide pBIlA.  Figure 6C shows a restriction map of the plasmid pBIlA.

La figure 7A représente le schéma de construction du plasmide pdel88.  FIG. 7A represents the construction diagram of the plasmid pdel88.

La figure 7B représente le schéma de construction du plasmide pdel88A.  FIG. 7B represents the construction diagram of the plasmid pdel88A.

La figure 7C représente le schéma de construction du plasmide pOBB.  FIG. 7C represents the construction diagram of the plasmid pOBB.

La figure 7D représente le schéma de construction et une carte de restriction du plasmide pCIII#.  FIG. 7D represents the construction diagram and a restriction map of the plasmid pCIII #.

La figure 8A représente le schéma de construction du plasmide pCII.  FIG. 8A represents the construction diagram of the plasmid pCII.

La figure 8B représente une carte de restriction du plasmide pORT1.  FIG. 8B represents a restriction map of the plasmid pORT1.

La figure 8C représente une carte de restriction du plasmide pCII.  Figure 8C shows a restriction map of plasmid pCII.

La figure 9A représente le schéma de construction du plasmide pBIVA.  FIG. 9A represents the construction diagram of the plasmid pBIVA.

La figure 9B représente une carte de restriction du plasmide pBIVA.  Figure 9B shows a restriction map of plasmid pBIVA.

La figure 10A représente le schéma de construction du plasmide pBV#.  FIG. 10A represents the construction diagram of the plasmid pBV #.

<Desc/Clms Page number 21> <Desc / Clms Page number 21>

La figure 10B représente une carte de restriction du plasmide pBVA.  FIG. 10B represents a restriction map of the plasmid pBVA.

La figure 11A représente le schéma de construction du plasmide pPSTI.  FIG. 11A represents the construction diagram of the plasmid pPSTI.

La figure 11B représente une carte de restriction du plasmide pPSTI.  Figure 11B shows a restriction map of the plasmid pPSTI.

La figure 12A représente le schéma de construction du plasmide pXhoI.  FIG. 12A represents the construction diagram of the plasmid pXhoI.

La figure 12B représente une carte de restriction du plasmide pXhoI.  Figure 12B shows a restriction map of plasmid pXhoI.

La figure 13A représente le schéma de construction du plasmide pCIVA.  FIG. 13A represents the construction diagram of the plasmid pCIVA.

La figure 13B représente une carte de restriction du plasmide pCIVA.  Figure 13B shows a restriction map of plasmid pCIVA.

La figure 14A représente le schéma de construction du plasmide pCVA.  FIG. 14A represents the construction diagram of the plasmid pCVA.

La figure 14B représente une carte de restriction du plasmide pCVA.  Figure 14B shows a restriction map of plasmid pCVA.

La figure 15 représente l'analyse par Southern blot des souches mutantes BII92, CIII68, CII62, BIV87, BV88, CIV89 et CV90, comparativement à la souche sauvage "red variant" notée Wt. Pour chaque mutant, l'enzyme de restriction utilisée est indiquée en-dessous de chaque blot et la taille des bandes détectées devant chaque blot est estimée par rapport aux marqueurs de poids moléculaire #-HindIII et X-BstEII (non détectables par auto-radiographie).  FIG. 15 represents the analysis by Southern blot of the mutant strains BII92, CIII68, CII62, BIV87, BV88, CIV89 and CV90, compared to the wild strain "red variant" noted Wt. For each mutant, the restriction enzyme used is indicated below each blot and the size of the bands detected in front of each blot is estimated relative to the molecular weight markers # -HindIII and X-BstEII (not detectable by auto-radiography ).

La figure 16 représente l'analyse par PCR des souches mutantes BII91, CIII68, CII62, BIV87, BV88, CIV89 et CV90, comparativement à la souche sauvage "red variant" notée Wt et aux plasmides pBII#, pCIUA, pCII#, pBIVA, pBVA, PCIVA et pCVA utilisés respectivement pour obtenir le mutant par recombinaison homologue. Les tailles des bandes détectées par coloration au bromure d'éthydium sont estimées par rapport aux marqueurs de poids moléculaire X174-HaeIII ou X-BstEII.  FIG. 16 represents the analysis by PCR of the mutant strains BII91, CIII68, CII62, BIV87, BV88, CIV89 and CV90, compared with the wild strain "red variant" denoted Wt and with the plasmids pBII #, pCIUA, pCII #, pBIVA, pBVA, PCIVA and pCVA used respectively to obtain the mutant by homologous recombination. The band sizes detected by staining with ethydium bromide are estimated relative to the molecular weight markers X174-HaeIII or X-BstEII.

La figure 17 représente l'analyse par CCM des métabolites produits par les souches mutantes BII92, CIII68, CII62, BIV87, BV88, CIV89 et CV90, comparativement aux produits standards érythromycine A (Er A), érythronolide B (EB) et  FIG. 17 represents the TLC analysis of the metabolites produced by the mutant strains BII92, CIII68, CII62, BIV87, BV88, CIV89 and CV90, compared to the standard products erythromycin A (Er A), erythronolide B and

<Desc/Clms Page number 22><Desc / Clms Page number 22>

3-a-mycarosyl érythronolide B (MEB).  3-a-mycarosyl erythronolide B (SEM).

La figure 18 représente l'analyse par SDS-PAGE de la purification de la protéine EryCIII successivement après extraction à l'urée 7M (ligne 2), chromatographie Q Sépharose (ligne 3), chromatographie Superdex (ligne 4), chromatographie Q source (ligne 6) avec des marqueurs standard de poids moléculaire (lignes 1 et 5);
La figure 19 représente l'analyse par CMM du test d'activité biologique de la protéine EryCIII, par incubation avec d-TDP-D-désosamine (ligne 2) ou avec d-TDP-D-désosamine et 3-a-mycarosyl érythronolide B (MEB) (ligne 3) comparativement au contrôle MEB (ligne 1) et au contrôle érythromycine A (ligne 4). Les pointillés marquent les zones montrant une activité antibiotique par autobiogramme sur B. pumilus.
FIG. 18 represents the analysis by SDS-PAGE of the purification of the protein EryCIII successively after extraction with urea 7M (line 2), Q Sepharose chromatography (line 3), Superdex chromatography (line 4), Q source chromatography ( lane 6) with standard molecular weight markers (lanes 1 and 5);
FIG. 19 represents the analysis by CMM of the test of biological activity of the protein EryCIII, by incubation with d-TDP-D-desosamine (lane 2) or with d-TDP-D-desosamine and 3-a-mycarosyl erythronolide B (SEM) (line 3) compared to the SEM control (line 1) and the erythromycin A control (line 4). The dotted lines mark the areas showing antibiotic activity by autobiogram on B. pumilus.

La figure 20 représente la localisation des six cosmides (cosAB35, cosAB76, cosAB87, cosAB67, cosAB63 et cosAB61) couvrant l'ensemble du cluster des gènes de la biosynthèse de l'oléandomycine. Les fragments de restriction BamHI (noté B) hybridant avec les sondes notées str M, D, E et les fragments BamHI (3,5 kb et 2,7 kb) hybridant avec la sonde eryCIII sont montrés.  FIG. 20 represents the location of the six cosmids (cosAB35, cosAB76, cosAB87, cosAB67, cosAB63 and cosAB61) covering the entire gene cluster of oleanomomycin biosynthesis. The BamHI restriction fragments (denoted B) hybridizing with the probes denoted str M, D, E and the BamHI fragments (3.5 kb and 2.7 kb) hybridizing with the eryCIII probe are shown.

La figure 21 représente l'organisation de la partie droite du cluster des gènes de la biosynthèse de l'oléandromycine chez S. antibioticus dont les différentes ORFs (notées olePl, oleGl, oleG2, oleM, oleY, oleP et oleB) sont indiquées par des flèches ainsi qu'une carte de restriction du plasmide pC035-S et l'insert du plasmide pC03 généré à partir du pC035-S. La double flèche indique l'insert correspondant à la séquence de la figure 22 (abréviations des enzymes de restriction : B, BamHI ; Bg, BglII ; K, KpnI ; S, SacI ; Sh, SphI ; l'étoile indique qu'il ne s'agit pas d'un site unique).  FIG. 21 represents the organization of the right part of the cluster of genes for the biosynthesis of oleandromycin in S. antibioticus, the different ORFs of which (noted olePl, oleGl, oleG2, oleM, oleY, oleP and oleB) are indicated by arrows as well as a restriction map of plasmid pC035-S and the insert of plasmid pC03 generated from pC035-S. The double arrow indicates the insert corresponding to the sequence of Figure 22 (abbreviations of restriction enzymes: B, BamHI; Bg, BglII; K, KpnI; S, SacI; Sh, SphI; the star indicates that it does not this is not a single site).

La figure 22 représente la séquence nucléotidique (séquence de SEQ ID N 15) de la région couvrant les gènes olePl, oleGl, oleG2, oleM et oleY de la biosynthèse de l'oléandomycine et leurs séquences protéiques déduites.  FIG. 22 represents the nucleotide sequence (sequence of SEQ ID N 15) of the region covering the oleP1, oleGl, oleG2, oleM and oleY genes of oleanomomycin biosynthesis and their deduced protein sequences.

EXEMPLE 1 : clonage et séquençage de la région eryG-eryAIII du cluster de gènes de la biosynthèse de l'érythromycine. EXAMPLE 1: Cloning and sequencing of the eryG-eryAIII region of the gene cluster for erythromycin biosynthesis.

<Desc/Clms Page number 23> <Desc / Clms Page number 23>

Un fragment d'ADN génomique de Sac. erythraea NRRL 2338 ayant > 20 kb en aval du gène ermE couvrant notamment les ORFs 3 à 9 et correspondant au clone XSE5.5 ainsi que la séquence nucléotidique d'un fragment de 4,5 kb correspondant à la région du cluster ery comprise entre 3,7 kb et 8,0 kb à partir de l'extrémité 3' du gène ermE et comprenant les ORFs 3,4, 5 et 6 ont été décrits par Haydock et al. (1991).  A fragment of genomic DNA from Sac. erythraea NRRL 2338 having> 20 kb downstream of the ermE gene covering in particular ORFs 3 to 9 and corresponding to the clone XSE5.5 as well as the nucleotide sequence of a 4.5 kb fragment corresponding to the region of the ery cluster between 3 , 7 kb and 8.0 kb from the 3 'end of the ermE gene and comprising ORFs 3,4, 5 and 6 have been described by Haydock et al. (1991).

En tenant compte de la carte de restriction montrée par Haydock et al. (1991), des sous-clones ont été dérivés du clone XSE5.5 par sous-clonage de fragments de restriction dans pUC19. Les plasmides pKB22, pBK44, pBIISB et pEco2 ont été ainsi générés selon la figure 5A de la façon suivante :
A partir de l'ADN du clone XSE5.5 digéré par l'enzyme de restriction KpnI, les plasmides pK62 et pK66 ont été directement construits par sous-clonage du fragment KpnI de 5,8 kb dans pUC19, le plasmide pK66 correspondant au même fragment KpnI sous-cloné avec une orientation inversée de l'insert par rapport au vecteur. Le plasmide pKB22 contenant un insert de 2,9 kb a été ensuite dérivé du plasmide pK66 par excision du fragment BamHI-BglII (2,9 kb) couvrant l'ORF8 ainsi qu'une partie des ORFs 7 et 9 par digestion avec les enzymes de restriction BamHI et BglII. De la même façon, le plasmide pKB44 contenant un insert de 2,9 kb a été obtenu à partir du plasmide pK62 par excision du fragment BamHI-BgIII (2,9 kb) couvrant le gène eryG correspondant aux ORFs 5 et 6 et le gène eryF correspondant à l'ORF4.
Taking into account the restriction map shown by Haydock et al. (1991), subclones were derived from clone XSE5.5 by subcloning of restriction fragments in pUC19. The plasmids pKB22, pBK44, pBIISB and pEco2 were thus generated according to FIG. 5A as follows:
From the DNA of clone XSE5.5 digested with the restriction enzyme KpnI, the plasmids pK62 and pK66 were directly constructed by subcloning the KpnI fragment of 5.8 kb in pUC19, the plasmid pK66 corresponding to the same KpnI fragment subcloned with an inverted orientation of the insert relative to the vector. The plasmid pKB22 containing an insert of 2.9 kb was then derived from the plasmid pK66 by excision of the BamHI-BglII fragment (2.9 kb) covering the ORF8 as well as part of the ORFs 7 and 9 by digestion with enzymes BamHI and BglII restriction. Similarly, the plasmid pKB44 containing a 2.9 kb insert was obtained from the plasmid pK62 by excision of the BamHI-BgIII fragment (2.9 kb) covering the eryG gene corresponding to ORFs 5 and 6 and the gene eryF corresponding to ORF4.

Le plasmide pBIISB a été dérivé du plasmide pBK44 par sous-clonage dans pUC19 du fragment Sali de 600 pb obtenu à partir du plasmide pBK44 digéré par l'enzyme de restriction SalI (figure 5A) .  The plasmid pBIISB was derived from the plasmid pBK44 by subcloning into pUC19 of the SalI fragment of 600 bp obtained from the plasmid pBK44 digested with the restriction enzyme SalI (FIG. 5A).

A partir de l'ADN du clone XSE5.5 digéré par l'enzyme de restriction EcoRI, le plasmide pEco2 a été directement construit par sous-clonage du fragment EcoRI (2,2 kb) dans pUC19.  From the DNA of the clone XSE5.5 digested with the restriction enzyme EcoRI, the plasmid pEco2 was directly constructed by subcloning of the EcoRI fragment (2.2 kb) in pUC19.

Les sous-clones pKB22, pBK44, pBIISB et pEco2 ainsi obtenus ont été ensuite séquences. L'analyse a été faite sur des échantillons d'ADN plasmidique, préalablement purifié sur une colonne de Quiagen 100 (Quiagen), sur le séquenceur  The subclones pKB22, pBK44, pBIISB and pEco2 thus obtained were then sequenced. The analysis was carried out on plasmid DNA samples, previously purified on a column of Quiagen 100 (Quiagen), on the sequencer

<Desc/Clms Page number 24><Desc / Clms Page number 24>

automatique ABI prism 377. Les réactions de séquençage ont été réalisées par la méthode de Sanger (1977) en utilisant les amorces M13 conventionnelles ou des amorces synthétiques et des didésoxynucléosides triphosphate fluorescents et la polymérase Taq FS (Perkin Elmer) en présence de 5 % de diméthylsulfoxide, les amorces synthétiques utilisées ayant les séquences suivantes : C3R2 TCCTCGATGGAGACCTGCC (SEQ ID N 22) B2R1 GAGACCATGCCCAGGGAGT (SEQ ID N 23) C3S2 TCTGGGAGCCGCTCACCTT (SEQ ID N 24) C2R1 GACGAGGCCGAAGAGGTGG (SEQ ID N 25) C2S GCACACCGGAATGGATGCG (SEQ ID N 26) fullC3S CCGTCGAGCTCTGAGGTAA (SEQ ID N 27) fullC3R GCCCGAGCCGCACGTGCGT (SEQ ID N 28) et C4 TGCACGCGCTGCTGCCGACC (SEQ ID N 29).  automatic ABI prism 377. The sequencing reactions were carried out by the method of Sanger (1977) using the primers M13 conventional or synthetic primers and dideoxynucleosides triphosphate fluorescent and the polymerase Taq FS (Perkin Elmer) in the presence of 5% of dimethylsulfoxide, the synthetic primers used having the following sequences: C3R2 TCCTCGATGGAGACCTGCC (SEQ ID N 22) B2R1 GAGACCATGCCCAGGGAGT (SEQ ID N 23) C3S2 TCTGGGAGCCGCTCACCTT (SEQ ID N 24) C2R1 GACGAGGGGGGGAGGAGGAGGAGGAGGAGGAGGAGGAGGAGGAGGAGGAGGGAGGAGGGAGGAGGAGGGAGGAGGAGGAGGGAGGGGAGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGG: ) fullC3S CCGTCGAGCTCTGAGGTAA (SEQ ID N 27) fullC3R GCCCGAGCCGCACGTGCGT (SEQ ID N 28) and C4 TGCACGCGCTGCTGCCGACC (SEQ ID N 29).

L'assemblage des données de séquence a été réalisé avec le logiciel AutoassemblerTM pakage (Applied Biosystem). Les séquences ont été analysées en utilisant l'ensemble des logiciels GCG (Devereux 1984).  Sequence data was assembled using AutoassemblerTM pakage software (Applied Biosystem). The sequences were analyzed using all of the GCG software (Devereux 1984).

Les séquences nucléotidiques obtenues ont permis d'établir la séquence nucléotidique de 3412 bp de la figure 2 (séquence directe et complémentaire de SEQ ID N 1) dans laquelle trois ORFs (7,8 et 9) ont été identifiées respectivement du nucléotide 8957 au nucléotide 7959, du nucléotide 10219 au nucléotide 8957 et du nucléotide 11315 au nucléotide 10233 (numérotés dans la figure 2 à partir du site BamHI situé à l'extrémité 5' du gène ermE) (respectivement séquence complémentaire de SEQ ID N 1 du nucléotide 48 au nucléotide 1046, du nucléotide 1046 au nucléotide 2308 et du nucléotide 2322 au nucléotide 3404) et correspondant respectivement aux gènes eryBII, eryCIII et eryCII selon Liu et Thorson (1994) dont les caractérisations fonctionnelles n'avaient pas encore été identifiées. Les trois ORFs 7,8 et 9 ont la même orientation, la lecture se faisant à partir de la région 3' du gène eryAIII.  The nucleotide sequences obtained made it possible to establish the nucleotide sequence of 3412 bp of FIG. 2 (direct and complementary sequence of SEQ ID N 1) in which three ORFs (7.8 and 9) were identified respectively from nucleotide 8957 to the nucleotide 7959, from nucleotide 10219 to nucleotide 8957 and from nucleotide 11315 to nucleotide 10233 (numbered in FIG. 2 from the BamHI site located at the 5 ′ end of the ermE gene) (respectively sequence complementary to SEQ ID N 1 of nucleotide 48 to nucleotide 1046, from nucleotide 1046 to nucleotide 2308 and from nucleotide 2322 to nucleotide 3404) and corresponding respectively to the genes eryBII, eryCIII and eryCII according to Liu and Thorson (1994) whose functional characterizations had not yet been identified. The three ORFs 7,8 and 9 have the same orientation, the reading being done from the 3 ′ region of the eryAIII gene.

Des échantillons de E. coli XL1-blue contenant la région codante des ORFs ci-dessus ont été déposés à la CNCM le 16 juillet 1997 :  Samples of E. coli XL1-blue containing the coding region of the above ORFs were deposited at the CNCM on July 16, 1997:

<Desc/Clms Page number 25><Desc / Clms Page number 25>

- le plasmide pK62 comprenant la séquence codante pour l'ORF7, l'ORF8 et une partie de l'ORF9 sous le numéro 1-1897, - le plasmide pEco2 comprenant la séquence codante pour l'ORF9 et une partie de l'ORF8 sous le numéro 1-1899.  - the plasmid pK62 comprising the coding sequence for ORF7, the ORF8 and a part of ORF9 under the number 1-1897, - the plasmid pEco2 comprising the coding sequence for ORF9 and a part of ORF8 under the number 1-1899.

EXEMPLE 2 : construction du plasmide pBII#. EXAMPLE 2 Construction of the plasmid pBII #.

Un plasmide d'intégration, dénommé pBII# et portant une délétion dans le gène eryBII codant pour l'ORF7, a été construit selon le schéma de la figure 6A.  An integration plasmid, called pBII # and carrying a deletion in the eryBII gene coding for ORF7, was constructed according to the diagram of FIG. 6A.

Le fragment BclI-BamHI de 598 pb a été délété dans le plasmide pK62 obtenu à l'exemple 1 par digestion avec les enzymes Bell et BamHI. Le plasmide pBCKl résultant a été ensuite digéré avec les enzymes de restriction MluI et BglII de façon à déléter un fragment ayant 853 pb à l'intérieur de l'ORF7 du nucléotide 8011 au nucléotide 8863 de la séquence de la figure 2. Après remplissage des extrémités à l'aide du fragment de Klenow de l'ADN polymérase I, le plasmide contenant la délétion , a été religaturé et transformé dans E. coli XL1-blue. A partir du plasmide pl9BII ainsi généré, le fragment KpnI-HindIII (4,3 kb) qui porte la délétion a été sous-cloné dans le plasmide pUWL218 (figure 6B). La présence de la délétion de 853 pb du nucléotide 8011 au nucléotide 8863 dans le plasmide pBII# ainsi généré (figure 6C) a été confirmée par séquençage.  The 598 bp BclI-BamHI fragment was deleted in the plasmid pK62 obtained in Example 1 by digestion with the enzymes Bell and BamHI. The resulting plasmid pBCKl was then digested with the restriction enzymes MluI and BglII so as to delete a fragment having 853 bp inside the ORF7 of nucleotide 8011 to nucleotide 8863 of the sequence of FIG. 2. After filling in the ends using the Klenow fragment of DNA polymerase I, the plasmid containing the deletion, was religated and transformed into E. coli XL1-blue. From the plasmid pl9BII thus generated, the KpnI-HindIII fragment (4.3 kb) which carries the deletion was subcloned in the plasmid pUWL218 (FIG. 6B). The presence of the 853 bp deletion from nucleotide 8011 to nucleotide 8863 in the plasmid pBII # thus generated (FIG. 6C) was confirmed by sequencing.

Le plasmide pBII# a ensuite été transféré dans la souche E. coli DH5aMRC, puis utilisé pour transformer Sac. erythraea. The plasmid pBII # was then transferred to the E. coli DH5aMRC strain, then used to transform Sac. erythraea.

EXEMPLE 3 : construction d'une souche Sac. erythraea ery BII# (BII92). EXAMPLE 3: Construction of a Sac strain. erythraea ery BII # (BII92).

La construction d'une souche Sac. erythraea dans laquelle le gène eryBII porte une délétion interne telle que celle introduite dans le plasmide pBII# préparé à l'exemple 2 et le processus d'intégration ont été réalisés de la façon suivante :
La préparation des protoplastes a été réalisée selon la méthode décrite par Weber et Losick (1988), en utilisant du PEG 3350 (Sigma) au lieu de PEG 1000 et un tampon P modifié (dénommé PT) contenant MgCl2,6H20 28 mM et sans P04H2K au lieu des tampons P, L ou T décrits, selon les conditions
Building a Sac strain. erythraea in which the eryBII gene carries an internal deletion such as that introduced into the plasmid pBII # prepared in Example 2 and the integration process were carried out as follows:
The protoplast preparation was carried out according to the method described by Weber and Losick (1988), using PEG 3350 (Sigma) instead of PEG 1000 and a modified P buffer (called PT) containing 28 mM MgCl2.6H20 and without P04H2K instead of the buffers P, L or T described, depending on the conditions

<Desc/Clms Page number 26><Desc / Clms Page number 26>

opératoires suivantes :
Les cellules (au moins 108 spores) de Sac. erythraea "red variant" (dont un échantillon a été déposé à la CNCM le 16 juillet 1997 sous le numéro 1-1902) ont été mises à pousser dans 50 ml de milieu TBS pendant 3 à 5 jours à 30 C, puis lavées dans du sucrose à 10,3 %. Les cellules ont été remises en suspension dans 50 ml de tampon PT contenant 2 à 5 mg/ml de lysozyme (Sigma), puis incubées à 30 C pendant 1 à 2 heures en désagrégeant les amas de mycélium toutes les 15 minutes jusqu'à conversion d'au moins 50 % du mycélium en protoplastes. Les protoplastes ont été lavés avec 50 ml de tampon PT, remis en suspension dans 12,5 à 25 ml du même tampon, congelés lentement puis stockés à -80 C par aliquots de 200 l.
following operations:
Sac cells (at least 108 spores). erythraea "red variant" (a sample of which was deposited with the CNCM on July 16, 1997 under the number 1-1902) were put to push in 50 ml of TBS medium during 3 to 5 days at 30 C, then washed in 10.3% sucrose. The cells were resuspended in 50 ml of PT buffer containing 2 to 5 mg / ml of lysozyme (Sigma), then incubated at 30 C for 1 to 2 hours by disaggregating the mycelium clusters every 15 minutes until conversion at least 50% of the mycelium in protoplasts. The protoplasts were washed with 50 ml of PT buffer, resuspended in 12.5 to 25 ml of the same buffer, frozen slowly and then stored at -80 ° C. in 200 l aliquots.

Pour la transformation, un aliquot a été décongelé et 50 l ont été prélevés puis transférés dans un tube de 15 ml.  For processing, an aliquot was thawed and 50 liters were removed and then transferred to a 15 ml tube.

Un à 10 g d'ADN plasmidique pBII#, préparé à l'exemple 2 à partir de la souche E. coli DH5aMRC ont été mis en solution dans 5 à 10 l de tampon TE (Tris HC1 10 mM pH 7,5, EDTA 1 mM) puis déposés sur la paroi du tube incliné auquel a été ensuite ajouté 0,5 ml d'une solution de PEG 3350 dans le tampon PT préparée extemporanément à partir d'une solution aqueuse à 50 % que l'on dilue au demi dans le tampon 2 x PT. One to 10 g of plasmid DNA pBII #, prepared in Example 2 from the E. coli strain DH5aMRC were dissolved in 5 to 10 l of TE buffer (10 mM Tris HC1 pH 7.5, EDTA 1 mM) then deposited on the wall of the inclined tube to which was then added 0.5 ml of a PEG 3350 solution in the PT buffer prepared extemporaneously from a 50% aqueous solution which is diluted to half in the buffer 2 x PT.

Après dilution avec 3 à 5 ml de tampon PT puis centrifugation à 2500 rpm pendant 15 mn, le culot a été dissocié dans 0,5 ml de tampon PT et la suspension de protoplastes transformés ainsi obtenue a été immédiatement répartie sur 2 ou 3 boîtes R2T2 très sèches (3 h sous une hotte à flux laminaire). Les boîtes ont été ensuite incubées à 32 C pendant 16 à 24 h jusqu'à apparition du voile de régénération des protoplastes. After dilution with 3 to 5 ml of PT buffer then centrifugation at 2500 rpm for 15 min, the pellet was dissociated in 0.5 ml of PT buffer and the suspension of transformed protoplasts thus obtained was immediately distributed over 2 or 3 R2T2 dishes very dry (3 hours under a laminar flow hood). The dishes were then incubated at 32 ° C for 16 to 24 h until the appearance of the protoplast regeneration veil.

A partir d'une solution stock de thiostrepton (Sigma) à 50 mg/ml dans le DMSO, une quantité appropriée a été diluée dans 0,5 à 1 ml d'eau puis étalée sur les boîtes de façon à obtenir une concentration finale de 20 g de thiostrepton/ml de gélose. Après absorption complète de l'antibiotique, les boîtes ont été incubées à 32 C pendant 3 à 4 jours, ce qui permet la visualisation des transformants. Les boites ont encore été incubées plusieurs jours jusqu'à développement From a stock solution of thiostrepton (Sigma) at 50 mg / ml in DMSO, an appropriate quantity was diluted in 0.5 to 1 ml of water and then spread on the dishes so as to obtain a final concentration of 20 g of thiostrepton / ml of agar. After complete absorption of the antibiotic, the dishes were incubated at 32 ° C. for 3 to 4 days, which allows the visualization of the transformants. The dishes were further incubated for several days until development

<Desc/Clms Page number 27><Desc / Clms Page number 27>

complet des spores.  full of spores.

La sélection des intégrants correspondant au premier événement de recombinaison (figure 4) a été réalisée par réplication des boites sporulées à l'aide de velours ou par étalement d'une suspension des spores sur des boites R2T2 contenant du thiostrepton puis incubation à 32 C, ce qui permet la croissance des clones d'intégrants potentiels.  The selection of the integrants corresponding to the first recombination event (FIG. 4) was carried out by replicating the spore-forming dishes using velvet or by spreading a suspension of the spores on R2T2 dishes containing thiostrepton then incubation at 32 ° C., which allows the growth of clones of potential integrants.

Pour la sélection de clones ayant subi un deuxième événement de recombinaison (figure 4), 5 à 10 clones résistants au thiostrepton obtenus ci-dessus ont été mis en culture dans 8 ml de milieu liquide TSB à 30 C pendant 3 à 4 jours. 50 à 100 l ont été prélevés et remis en culture dans les mêmes conditions. Après 4 cycles successifs de dilution et culture destinés à favoriser la perte du marqueur de résistance au thiostrepton, des protoplastes ont été préparées à partir des cellules comme indiqué ci-dessus, de façon à chasser le plasmide. Les protoplastes ont ensuite été étalés sur des boites R2T2 de façon à obtenir des colonies individualisées dont la sensibilité au thiostrepton a été déterminée par réplique sur des boîtes R2T2 contenant du thiostrepton.  For the selection of clones having undergone a second recombination event (FIG. 4), 5 to 10 clones resistant to thiostrepton obtained above were cultured in 8 ml of TSB liquid medium at 30 ° C. for 3 to 4 days. 50 to 100 l were collected and returned to culture under the same conditions. After 4 successive dilution and culture cycles intended to promote the loss of the thiostrepton resistance marker, protoplasts were prepared from the cells as indicated above, so as to drive out the plasmid. The protoplasts were then spread on R2T2 dishes so as to obtain individualized colonies whose sensitivity to thiostrepton was determined by replication on R2T2 dishes containing thiostrepton.

Selon la position du deuxième événement de recombinaison par rapport au site de délétion (figure 4), on peut attendre que le phénotype des colonies sensibles au thiostrepton soit du type sauvage ou du type muté porteur de la délétion.  Depending on the position of the second recombination event with respect to the deletion site (FIG. 4), it can be expected that the phenotype of the thiostrepton-sensitive colonies is of the wild type or of the mutated type carrying the deletion.

Parmi les colonies sensibles au thiostrepton, la sélection des mutants ayant le phénotype ery- a été réalisée par antibiogramme sur la souche B. pumilus ATCC 14884 sensible à l'érythromycine. La souche B. pumilus a été utilisée comme souche indicatrice pour évaluer la production d'érythromycine dans des essais biologiques par antibiogramme. Les colonies ont été étalées à l'anse de platine sur des boites R2T2, puis incubées pendant 3 à 4 jours à 30 C. Des zones d'agar où le mutant a poussé à confluence ont ensuite été prélevées à l'emporte pièce puis placées sur des boites A-Merck recouvertes d'une surcouche de 4 ml de 0,5 x A Merck (Antibiotic agar N 1 Merck) inoculée d'une suspension de spores de B. pumilus, puis incubées une nuit à 37 C.  Among the colonies sensitive to thiostrepton, the selection of mutants having the ery- phenotype was carried out by antibiogram on the strain B. pumilus ATCC 14884 sensitive to erythromycin. The B. pumilus strain was used as an indicator strain to evaluate the production of erythromycin in bioassays by antibiogram. The colonies were spread with a platinum loop on R2T2 dishes, then incubated for 3 to 4 days at 30 C. Agar zones where the mutant grew at confluence were then removed with a cookie cutter and then placed on A-Merck dishes covered with a 4 ml overlay of 0.5 x A Merck (Antibiotic agar N 1 Merck) inoculated with a suspension of B. pumilus spores, then incubated overnight at 37 C.

<Desc/Clms Page number 28> <Desc / Clms Page number 28>

La présence de la délétion attendue dans le chromosome du mutant (délétion de 853 pb du nucléotide 8011 au nucléotide 8863 de la figure 2) a ensuite été confirmée par analyse génomique par Southern blot ainsi que par PCR de la façon suivante :
Pour l'analyse par Southern blot, le transfert d'ADN génomique, préalablement digéré avec l'enzyme de restriction appropriée, sur des membranes GeenscreenPlus (Dupont NEN) a été réalisé dans NaOH 0,4 M selon Ausubel et al. (1995). Les hybridations ont été effectuées en utilisant comme sonde l'oligonucléotide marqué à son extrémité 5' en utilisant du [[gamma]32P]ATP (Amersham) et la polynucléotide kinase (Boehringer Mannheim) selon Sambroock et al. (1989), ayant la séquence suivante : B2-S TTGGCGAAGTCGACCAGGTC (SEQ ID N 30) correspondant à la région d'ADN du début du gène eryG située de la position 4118 à la position 4137 de la séquence déposée dans la base EMBL sous la référence X60379 et décrite par Haydock et al. (1991). Les hybridations ont été effectuées avec un tampon d'hybridation rapide (Amersham) et les conditions de lavage suivantes : 2 x 5 mn, 2 x SSC, 20 C ; 30 mn, 2 x SSC, 65 C ; 30 mn, 0,1 x SSC, 20 C.
The presence of the expected deletion in the mutant chromosome (deletion of 853 bp from nucleotide 8011 to nucleotide 8863 in FIG. 2) was then confirmed by genomic analysis by Southern blot as well as by PCR as follows:
For the Southern blot analysis, the transfer of genomic DNA, previously digested with the appropriate restriction enzyme, onto GeenscreenPlus membranes (Dupont NEN) was carried out in 0.4 M NaOH according to Ausubel et al. (1995). The hybridizations were carried out using as probe the oligonucleotide labeled at its 5 ′ end using [[gamma] 32P] ATP (Amersham) and the polynucleotide kinase (Boehringer Mannheim) according to Sambroock et al. (1989), having the following sequence: B2-S TTGGCGAAGTCGACCAGGTC (SEQ ID N 30) corresponding to the DNA region at the start of the eryG gene located from position 4118 to position 4137 of the sequence deposited in the EMBL base under the reference X60379 and described by Haydock et al. (1991). The hybridizations were carried out with a rapid hybridization buffer (Amersham) and the following washing conditions: 2 × 5 min, 2 × SSC, 20 C; 30 min, 2 x SSC, 65 C; 30 min, 0.1 x SSC, 20 C.

Par hybridation Southern sur l'ADN génomique isolé selon Hopwood et al. (1985) puis digéré par l'enzyme de restriction KpnI, une bande de 5,8 kb à partir de la souche sauvage "red variant" et une bande de 4,9 kb à partir du mutant BII92 ont été détectées. Les résultats montrés à la figure 15 indiquent la présence chez le mutant d'une délétion d'environ 900 pb dans cette région du chromosome.  By Southern hybridization on the genomic DNA isolated according to Hopwood et al. (1985) then digested with the restriction enzyme KpnI, a band of 5.8 kb from the wild strain "red variant" and a band of 4.9 kb from the mutant BII92 were detected. The results shown in FIG. 15 indicate the presence in the mutant of a deletion of approximately 900 bp in this region of the chromosome.

Pour l'analyse par PCR ,un échantillon de 100 /il d'une culture de 3 jours en milieu TSB a été centrifugé. Le culot obtenu a été remis en suspension dans 10 /il de milieu TSB, puis utilisé pour l'amplification dans l'appareil genAmp PCR system 9600 (Perkin Elmer Cetus). Après chauffage de l'échantillon pendant 3 mn à 94 C, les conditions d'amplification suivantes ont été utilisées : 94 C, 1 mn ; 55 C, 1 mn ; 72 C, 3 mn ; 30 cycles ; polymérase Ampli Taq (Perkin Elmer) en présence de diméthylsufoxyde 10 % (v/v)  For PCR analysis, a 100 µl sample of a 3-day culture in TSB medium was centrifuged. The pellet obtained was resuspended in 10 μl of TSB medium, then used for amplification in the genAmp PCR system 9600 device (Perkin Elmer Cetus). After heating the sample for 3 min at 94 C, the following amplification conditions were used: 94 C, 1 min; 55 C, 1 min; 72 C, 3 min; 30 cycles; Ampli Taq polymerase (Perkin Elmer) in the presence of 10% dimethylsulfoxide (v / v)

<Desc/Clms Page number 29><Desc / Clms Page number 29>

suivis d'une élongation de 3 mn à 72 C . L'amplification a été effectuée en utilisant l'oligonucléotide B2S ci-dessus et l'oligonucléotide ayant la séquence suivante B2-R GCCGCTCGGCACGGTGAACTTCA (SEQ ID N 31) correspondant à la séquence du brin complémentaire de la région d'ADN située de la position 8873 à la position 8892 de la séquence de la figure 2 à laquelle ont été ajoutés trois nucléotides à l'extrêmité 5' et permettant d'encadrer par amplification PCR la région portant la délétion interne à l'ORF7.  followed by an elongation of 3 min at 72 C. The amplification was carried out using the oligonucleotide B2S above and the oligonucleotide having the following sequence B2-R GCCGCTCGGCACGGTGAACTTCA (SEQ ID N 31) corresponding to the sequence of the complementary strand of the DNA region located at position 8873 at position 8892 of the sequence of FIG. 2 to which three nucleotides have been added at the 5 ′ end and making it possible to frame by region PCR the region carrying the internal deletion at ORF7.

L'analyse par amplification par PCR sur des cellules entières a permis de détecter une bande d'environ 1 kb dans la souche sauvage et une bande de 0,16 kb dans le mutant BII92 de façon identique au signal obtenu avec le plasmide pBII. Les résultats montrés à la figure 16 confirment que la délétion d'environ 900 pb détectée par l'analyse Southern est identique à celle portée par le plasmide pBII (853 pb).  Analysis by PCR amplification on whole cells made it possible to detect a band of approximately 1 kb in the wild strain and a band of 0.16 kb in the mutant BII92 in an identical manner to the signal obtained with the plasmid pBII. The results shown in FIG. 16 confirm that the deletion of approximately 900 bp detected by the Southern analysis is identical to that carried by the plasmid pBII (853 bp).

La souche recombinante ainsi obtenue, désignée BII92, a été ensuite cultivée pour identifier les métabolites produits par la souche.  The recombinant strain thus obtained, designated BII92, was then cultured to identify the metabolites produced by the strain.

EXEMPLE 4 : fermentation de la souche BII92 et identification des métabolites secondaires produits. EXAMPLE 4 Fermentation of the BII92 strain and identification of the secondary metabolites produced.

Des extraits de bouillon de culture de la souche ont été analysés par chromatographie en couche mince (ccm) avec l'érythromycine A, l'érythronolide B et le 3-a-mycarosyl érythronolide B comme standards.  Culture broth extracts of the strain were analyzed by thin layer chromatography (cmc) with erythromycin A, erythronolide B and 3-a-mycarosyl erythronolide B as standards.

La souche BII92 a été cultivée en erlen de 50 ml dans les conditions permettant une production optimale d'érythromycine A et de ses dérivés qui consistent à effectuer une préculture cellulaire à 28 C pendant 48 heures dans le milieu EPI (Solulys L-Corn steep liquor (Roquette frères) 5 g/1 ; farine de soja déshuilée (Cargill) 10 g/1 ; C03Ca 2 g/1 ; ClNa 5 g/1 ; pH = 6,8 ; glucose qsp 15 g/1 ajouté après autoclavage), puis une culture pendant 72 heures après dilution à 7 % v/v avec le milieu EP2 (farine de soja déshuilée 10 g/1 ; C03Ca 0,2 g/1 ; Cl2Co-6H20 1 mg/1 ; pH = 6,8-7 ; glucose qsp 20 g/1 ajouté après autoclavage).  The BII92 strain was cultivated in a 50 ml Erlenmeyer flask under the conditions allowing optimal production of erythromycin A and its derivatives which consist in carrying out a cell preculture at 28 C for 48 hours in PPE medium (Solulys L-Corn steep liquor (Roquette frères) 5 g / 1; deoiled soy flour (Cargill) 10 g / 1; C03Ca 2 g / 1; ClNa 5 g / 1; pH = 6.8; glucose qs 15 g / 1 added after autoclaving), then a culture for 72 hours after dilution to 7% v / v with the EP2 medium (deoiled soy flour 10 g / 1; C03Ca 0.2 g / 1; Cl2Co-6H20 1 mg / 1; pH = 6.8- 7; glucose qs 20 g / 1 added after autoclaving).

Le surnageant de culture a été ensuite extrait à pH 9-10  The culture supernatant was then extracted at pH 9-10

<Desc/Clms Page number 30><Desc / Clms Page number 30>

avec de l'acétate d'éthyle. Les phases organiques ont été séchées sur S04Mg, amenées à sec sous pression réduite puis analysées par ccm sur gel de silice 60 F254 (Merck) [dichlorométhane/méthanol (90: 10, v/v) ou éther isopropylique/méthanol/NH40H à 25 % (75: 35:2, v/v) ]. De façon alternative, l'analyse a été réalisée par ccm sur des plaques de gel de silice greffées de type NH2 F254 (Merk) [chlorure de butyle/méthanol (90: 10, v/v) ].  with ethyl acetate. The organic phases were dried over SO4Mg, brought to dryness under reduced pressure and then analyzed by ccm on silica gel 60 F254 (Merck) [dichloromethane / methanol (90: 10, v / v) or isopropyl ether / methanol / NH40H at 25 % (75: 35: 2, v / v)]. Alternatively, the analysis was carried out by ccm on grafted silica gel plates of NH2 F254 type (Merk) [butyl chloride / methanol (90: 10, v / v)].

La révélation chimique des plaques a été effectuée par pulvérisation d'une solution de p-anisaldéhyde-acide sulfurique 98 %-éthanol (1: 1:9, v/v), suivie de chauffage pendant quelques minutes à 80 C. Les activités antibiotiques potentielles ont été analysées par bioautographie directe des plaques de ccm sur agar ensemencé de B. pumilus ATCC 14884.  The chemical development of the plates was carried out by spraying with a 98% p-anisaldehyde-sulfuric acid-ethanol solution (1: 1: 9, v / v), followed by heating for a few minutes at 80 C. Antibiotic activities potentials were analyzed by direct bioautography of the cmc plates on agar seeded with B. pumilus ATCC 14884.

Les résultats obtenus par révélation chimique (figure 17) montrent que la souche BII92 accumule préférentiellement l'érythronolide B comme attendu d'un mutant eryB.  The results obtained by chemical development (FIG. 17) show that the strain BII92 preferentially accumulates erythronolide B as expected from an eryB mutant.

Des métabolites mineurs de faible mobilité manifestant une activité antibiotique ont également été détectés. Ces métabolites ont été extraits à l'acétate d'éthyle et identifiés par chromatographie liquide à haute performance en phase inverse (RP-HPLC) couplée à la spectrométrie de masse.  Low mobility minor metabolites exhibiting antibiotic activity have also been detected. These metabolites were extracted with ethyl acetate and identified by reverse-phase high performance liquid chromatography (RP-HPLC) coupled with mass spectrometry.

La RP-HPLC a été effectuée sur colonne (250 x 4,6mm) de Kromasil C18 5 en utilisant comme phase mobile le mélange acétonitrile/méthanol/acétate d'ammonium 0,065 M pH 6,7 (350: 150:500, v/v) sur un chromatographe Waters équipé d'un spectromètre de masse Finningan TSQ 7000. The RP-HPLC was carried out on a column (250 x 4.6 mm) of Kromasil C18 5 using as a mobile phase the acetonitrile / methanol / 0.065 M ammonium acetate mixture pH 6.7 (350: 150: 500, v / v) on a Waters chromatograph equipped with a Finningan TSQ 7000 mass spectrometer.

A côté de traces d'érythromycine A, B, C et D, 4 métabolites mineurs dénommés Ml à M4 ont été détectés : - Ml donne un pic parent à m/z 704 et des produits de fragmentation à m/z 576 et m/z 158. La présence de désaminyl- érythronolide A (m/z 576) indique que la différence de m/z de 30 comparée à l'érythromycine A (m/z 734) ou de 16 comparée à l'érythromycine C (m/z 720) est portée par le résidu sucre neutre. La structure proposée pour Ml est la 3"-C désméthyl- 2",3"-ène-érythromycine C.  Next to traces of erythromycin A, B, C and D, 4 minor metabolites called Ml to M4 were detected: - Ml gives a parent peak at m / z 704 and fragmentation products at m / z 576 and m / z 158. The presence of deaminerythronolide A (m / z 576) indicates that the difference in m / z of 30 compared to erythromycin A (m / z 734) or 16 compared to erythromycin C (m / z 576) z 720) is carried by the neutral sugar residue. The proposed structure for Ml is 3 "-C desmethyl- 2", 3 "-ene-erythromycin C.

- M2 donne un pic parent à m/z 706 et des produits de fragmentation à m/z 576 et m/z 158. La présence de désaminyl- - M2 gives a parent peak at m / z 706 and fragmentation products at m / z 576 and m / z 158. The presence of deaminyl-

<Desc/Clms Page number 31><Desc / Clms Page number 31>

érythronolide A (m/z 576) indique que la différence de m/z de 28 comparée à l'érythromycine A (m/z 734) ou de 14 comparée à l'érythromycine C (m/z 720) est portée par le résidu sucre neutre. La structure proposée pour M2 est la 3"-C désméthyl- érythromycine C.  erythronolide A (m / z 576) indicates that the difference in m / z of 28 compared to erythromycin A (m / z 734) or 14 compared to erythromycin C (m / z 720) is borne by the residue neutral sugar. The proposed structure for M2 is 3 "-C desmethyl- erythromycin C.

- M3 donne un pic parent à m/z 690 et des produits de fragmentation à m/z 560 et m/z 158. La présence de désaminyl- érythronolide B (m/z 560) indique que la différence de m/z de 28 comparée à l'érythromycine B (m/z 718) ou de 14 comparée à l'érythromycine D (m/z 704) est portée par le résidu sucre neutre. La structure proposée pour M3 est la 3"-C désméthyl- érythromycine D. - M3 gives a parent peak at m / z 690 and fragmentation products at m / z 560 and m / z 158. The presence of deaminylerythronolide B (m / z 560) indicates that the difference in m / z of 28 compared to erythromycin B (m / z 718) or 14 compared to erythromycin D (m / z 704) is carried by the neutral sugar residue. The proposed structure for M3 is 3 "-C desmethyl- erythromycin D.

- M4 donne un pic parent à m/z 720 et des produits de fragmentation à m/z 576 et m/z 158. Le profil est identique à celui de l'érythromycine C (m/z 720) avec la présence de désosaminylérythronolide A (m/z 576) et la perte du résidu sucre aminé (m/z 158), mais le métabolite M4 n'a pas le même temps de rétention en RP-HPLC que l'érythromycine. La structure proposée pour M4 est la 3"-C désméthyl- érythromycine A. - M4 gives a parent peak at m / z 720 and fragmentation products at m / z 576 and m / z 158. The profile is identical to that of erythromycin C (m / z 720) with the presence of desosaminylerythronolide A (m / z 576) and the loss of the amino sugar residue (m / z 158), but the metabolite M4 does not have the same RP-HPLC retention time as erythromycin. The proposed structure for M4 is 3 "-C desmethyl- erythromycin A.

La détection par SM-SM du métabolite mineur Ml ayant un sucre neutre insaturé (3"-C désmêthyl-2",3"-ène-érythromycine C) indique que le gène eryBII code pour la dTDP-4-céto-L-6désoxyhexose 2,3-réductase dans la voie de biosynthèse du dTDP-mycarose.  Detection by SM-SM of the minor metabolite Ml having an unsaturated neutral sugar (3 "-C desmethyl-2", 3 "-ene-erythromycin C) indicates that the eryBII gene codes for dTDP-4-keto-L-6 deoxyhexose 2,3-reductase in the biosynthesis pathway of dTDP-mycarose.

La souche BII92 a été déposée à la CNCM le 16 juillet 1997 sous le numéro 1-1903. The BII92 strain was deposited at the CNCM on July 16, 1997 under the number 1-1903.

EXEMPLE 5 : construction du plasmide pCIII#. EXAMPLE 5 Construction of the plasmid pCIII #.

L'ORF8 pouvant être traductionnellement couplée à l'ORF7 située en aval, une délétion en phase a été introduite de façon à éviter un effet polaire. Un plasmide d'intégration, dénommé pCIII# porteur d'une telle délétion, a été construit selon le schéma de la figure 7(A-D).  Since ORF8 can be translated in translation to ORF7 located downstream, a phase deletion has been introduced so as to avoid a polar effect. An integration plasmid, called pCIII # carrying such a deletion, was constructed according to the diagram in FIG. 7 (A-D).

Une délétion SalI de 663 pb a été introduite dans l'ORF8 du nucléotide 9384 au nucléotide 10046 de la séquence de la figure 2 en sous-clonant dans le plasmide pUC19 les deux fragments SalI (a : 794 pb et b : 631 pb montrés à la figure 5A ) isolés à partir du plasmide pBK44 obtenu à l'exemple 1  A SalI deletion of 663 bp was introduced into the ORF8 from nucleotide 9384 to nucleotide 10046 of the sequence of FIG. 2 by subcloning in the plasmid pUC19 the two SalI fragments (a: 794 bp and b: 631 bp shown at FIG. 5A) isolated from the plasmid pBK44 obtained in Example 1

<Desc/Clms Page number 32><Desc / Clms Page number 32>

pour générer le plasmide pdel88 (figure 7A). La présence de la délétion de 663 pb a été confirmée par séquençage. Le plasmide pdel88 a été ensuite soumis à deux sous-clonages additionnels de façon à élargir les régions chromosomiques utilisables pour la recombinaison homologue des deux cotés du site de délétion. Le fragment SacI (450 pb) du plasmide pdel88 a d'abord été remplacé par le fragment SacI (1,1 kb) du plasmide pEco2 obtenu à l'exemple 1 pour générer le plasmide pdel88A (figure 7B). Puis le fragment EcoRI (1,5 kb) portant la délétion dans l'ORF8 a été isolé du plasmide pdel88A et utilisé pour remplacer le fragment EcoRI (1,66 kb) porteur de l'ORF intacte dans le plasmide pOBB. Le plasmide pOBB, représenté à la figure 7C, correspond au plasmide pBK44 préparé à l'exemple 1 dans le site PstI duquel a été souscloné le fragment PstI de 4 kb du plasmide pIJ486 obtenu par digestion par l'enzyme de restriction PstI et porteur de l'origine de réplication streptomyces ainsi que du gène de résistance au thiostrepton. Le plasmide résultant pCIIIA porte des régions chromosomiques pour la recombinaison homologue de 1,27 kb et 1,38 kb respectivement en amont et en aval du site de délétion. Le plasmide pCIII ainsi obtenu (figure 7D) a ensuite été transféré dans la souche E. coli DH5aMRC, puis utilisé pour transformer Sac. erythraea.  to generate the plasmid pdel88 (Figure 7A). The presence of the 663 bp deletion was confirmed by sequencing. The plasmid pdel88 was then subjected to two additional subcloning so as to widen the chromosomal regions which can be used for homologous recombination on both sides of the deletion site. The SacI fragment (450 bp) of the plasmid pdel88 was first replaced by the SacI fragment (1.1 kb) of the plasmid pEco2 obtained in Example 1 to generate the plasmid pdel88A (FIG. 7B). Then the EcoRI fragment (1.5 kb) carrying the deletion in the ORF8 was isolated from the plasmid pdel88A and used to replace the EcoRI fragment (1.66 kb) carrying the intact ORF in the plasmid pOBB. The plasmid pOBB, represented in FIG. 7C, corresponds to the plasmid pBK44 prepared in Example 1 in the PstI site from which the 4 kb PstI fragment of the plasmid pIJ486 obtained by digestion with the restriction enzyme PstI and carrying the the origin of replication streptomyces as well as the thiostrepton resistance gene. The resulting plasmid pCIIIA carries chromosomal regions for homologous recombination of 1.27 kb and 1.38 kb respectively upstream and downstream of the deletion site. The plasmid pCIII thus obtained (FIG. 7D) was then transferred to the E. coli strain DH5aMRC, then used to transform Sac. erythraea.

EXEMPLE 6 : construction d'une souche Sac. erythraea eryCIII# (CIII68) . EXAMPLE 6: Construction of a Sac strain. erythraea eryCIII # (CIII68).

Une souche dans laquelle le gène eryCIII porte une délétion interne telle que celle introduite dans le plasmide pCIIIA obtenu à l'exemple 5 a été préparée par transformation des protoplastes de Sac. erythraea avec le plasmide pCIIIA.  A strain in which the eryCIII gene carries an internal deletion such as that introduced into the plasmid pCIIIA obtained in Example 5 was prepared by transformation of the sac protoplasts. erythraea with the plasmid pCIIIA.

La préparation des protoplastes, le processus d'intégration et la sélection des mutants ayant le phénotype ery- ont été réalisés comme à l'exemple 3.  The preparation of the protoplasts, the integration process and the selection of the mutants having the ery- phenotype were carried out as in Example 3.

De plus, la présence de la délétion attendue dans le chromosome (délétion de 663 pb du nucléotide 9384 au nucléotide 10046 de la séquence de la figure 2) a été confirmée par analyse génomique par Southern blot ainsi que par amplification par PCR selon les conditions décrites à l'exemple 3.  In addition, the presence of the expected deletion in the chromosome (deletion of 663 bp from nucleotide 9384 to nucleotide 10046 of the sequence of FIG. 2) was confirmed by genomic analysis by Southern blot as well as by PCR amplification according to the conditions described in Example 3.

<Desc/Clms Page number 33> <Desc / Clms Page number 33>

Par hybridation Southern sur l'ADN génomique digéré par l'enzyme de restriction EcoRI, en utilisant comme sonde l'oligonucléotide ayant la séquence suivante C3-S ATGCGCGTCGTCTTCTCCTCCATG (SEQ ID N 32) correspondant au brin complémentaire de la région d'ADN située de la position 10196 à la position 10219 de la séquence de la figure 2, une bande de 2,2 kb à partir de la souche sauvage et une bande de 1,5 kb à partir du mutant CIII68 ont été détectées. Les résultats montrés à la figure 15 indiquent la présence chez le mutant d'une délétion d'environ 700 pb dans cette région du chromosome.  By Southern hybridization on the genomic DNA digested with the restriction enzyme EcoRI, using as oligonucleotide probe having the following sequence C3-S ATGCGCGTCGTCTTCTCCTCCATG (SEQ ID N 32) corresponding to the complementary strand of the DNA region located in position 10196 at position 10219 of the sequence of Figure 2, a 2.2 kb band from the wild strain and a 1.5 kb band from the mutant CIII68 were detected. The results shown in FIG. 15 indicate the presence in the mutant of a deletion of approximately 700 bp in this region of the chromosome.

L'amplification par PCR a été effectuée en utilisant l'oligonucléotide C3-S ci-dessus et l'oligonucléotide ayant la séquence suivante C3-R TCATCGTGGTTCTCTCCTTCC (SEQ ID N 33) correspondant à la séquence située de la position 8954 à la position 8974 de la séquence de la figure 2 permettant d'encadrer par amplification PCR la région portant la délétion interne à l'ORF8. L'analyse par amplification par PCR a permis de détecter une bande d'environ 1,2 kb dans la souche sauvage et une bande d'environ 0,6 kb dans le mutant CIII68 de façon identique au signal obtenu avec pCIII. Les résultats montrés à la figure 16 confirment que la délétion d'environ 700 pb détectée par l'analyse de Southern est identique à celle portée par le plasmide pCIII (663 pb).  The PCR amplification was carried out using the oligonucleotide C3-S above and the oligonucleotide having the following sequence C3-R TCATCGTGGTTCTCTCCTTCC (SEQ ID N 33) corresponding to the sequence located from position 8954 to position 8974 of the sequence of FIG. 2 making it possible to frame, by PCR amplification, the region carrying the deletion internal to the ORF8. Analysis by PCR amplification made it possible to detect a band of approximately 1.2 kb in the wild-type strain and a band of approximately 0.6 kb in the mutant CIII68 in an identical manner to the signal obtained with pCIII. The results shown in FIG. 16 confirm that the deletion of approximately 700 bp detected by the Southern analysis is identical to that carried by the plasmid pCIII (663 bp).

La souche recombinante ainsi obtenue, désignée CIII68, a été ensuite cultivée pour identifier les métabolites produits par la souche.  The recombinant strain thus obtained, designated CIII68, was then cultured to identify the metabolites produced by the strain.

EXEMPLE 7 : fermentation de la souche CIII68 et identification des métabolites secondaires produits. EXAMPLE 7 Fermentation of the CIII68 strain and identification of the secondary metabolites produced.

La culture de la souche CIII68 et les analyses par ccm suivie de bioautographie ont été réalisées selon les conditions indiquées à l'exemple 4.  The culture of the CIII68 strain and the analyzes by cmc followed by bioautography were carried out according to the conditions indicated in Example 4.

Les résultats de ccm (figure 17) montrent que la souche CII68 accumule préférentiellement du 3-a-mycarosyl érythronolide B ainsi que de petites quantités d'érythronolide B comme attendu d'un mutant eryC.  The ccm results (FIG. 17) show that the CII68 strain preferentially accumulates 3-a-mycarosyl erythronolide B as well as small amounts of erythronolide B as expected from an eryC mutant.

La séquence eryCIII présente une forte homologie avec  The eryCIII sequence has strong homology with

<Desc/Clms Page number 34><Desc / Clms Page number 34>

d'autres glycosyltransférases putatives telles que DauH (43 % d'identité au niveau protéique) et DnrS (47 % d'identité) impliquées dans la biosynthèse de la daunorubicine chez S. peucetius (Otten et al., 1995) et chez Streptomyces sp C5 (Dickens et al., 1996) ainsi que TylM2 (50 % d'identité) impliquée dans le transfert du mycaminose sur la tylactone dans la voie de biosynthèse de la tylosine chez S. fradiae (Gandecha et al., 1997).  other putative glycosyltransferases such as DauH (43% identity at the protein level) and DnrS (47% identity) involved in the biosynthesis of daunorubicin in S. peucetius (Otten et al., 1995) and in Streptomyces sp C5 (Dickens et al., 1996) as well as TylM2 (50% identity) involved in the transfer of mycaminosis to tylactone in the pathway of tylosin biosynthesis in S. fradiae (Gandecha et al., 1997).

Ces observations indiquent que gène eryCIII code pour la désosaminyltransférase dans la voie de biosynthèse de l'érythromycine.  These observations indicate that the eryCIII gene codes for deosaminyltransferase in the erythromycin biosynthetic pathway.

EXEMPLE 8 : construction du plasmide pCII# . EXAMPLE 8 Construction of the plasmid pCII #.

Un plasmide d'intégration, dénommé pCII et portant une délétion dans le gène eryBII codant pour l'ORF9, a été construit selon le schéma de la figure 8A.  An integration plasmid, called pCII and carrying a deletion in the eryBII gene coding for ORF9, was constructed according to the diagram of FIG. 8A.

Le plasmide pK23 (figure 5A) a été obtenu par sousclonage dans pUC19 du fragment KpnI de 10 kb isolé à partir de l'ADN du clone XSE5.5 digéré par l'enzyme de restriction KpnI.  The plasmid pK23 (FIG. 5A) was obtained by subcloning into pUC19 the 10 kb KpnI fragment isolated from the DNA of the clone XSE5.5 digested with the restriction enzyme KpnI.

Dans un premier temps, le vecteur navette pORTl, montré à la figure 8B, a été obtenu par sous-clonage du fragment PstI de 4kb isolé par digestion du plasmide pIJ486 avec l'enzyme de restriction PstI incluant le gène de résistance au thiostrepton et le réplicon Streptomyces, dans le site PstI de pUC19.  Initially, the shuttle vector pORT1, shown in FIG. 8B, was obtained by subcloning the PstI fragment of 4kb isolated by digestion of the plasmid pIJ486 with the restriction enzyme PstI including the thiostrepton resistance gene and the replicon Streptomyces, in the PstI site of pUC19.

Une délétion hors phase de 304 pb a été introduite dans l'ORF9 du nucléotide 10881 au nucléotide 11184 de la séquence de la figure 2 en sous-clonant le fragment SacI-KpnI (1,1 kb) du plasmide pK23 avec le fragment EcoRI-KpnI (1,7 kb) du plasmide pEco2 obtenu à l'exemple 1 dans le plasmide pORTl ci-dessus préalablement digéré avec les enzymes de restriction SacI et EcoRI. Le plasmide d'intégration pCII ainsi obtenu (figure 8C) a été ensuite transféré dans la souche E. coli DH5aMRC, puis utilisé pour transformer Sac. erythraea.  An out-of-phase deletion of 304 bp was introduced into ORF9 from nucleotide 10881 to nucleotide 11184 of the sequence of FIG. 2 by subcloning the SacI-KpnI fragment (1.1 kb) of the plasmid pK23 with the EcoRI- fragment KpnI (1.7 kb) of the plasmid pEco2 obtained in Example 1 in the plasmid pORTl above previously digested with the restriction enzymes SacI and EcoRI. The integration plasmid pCII thus obtained (FIG. 8C) was then transferred to the E. coli strain DH5aMRC, then used to transform Sac. erythraea.

EXEMPLE 9 : construction d'une souche Sac. erythraea eryCIlA (CII62). EXAMPLE 9: Construction of a Sac strain. erythraea eryCIlA (CII62).

Une souche dans laquelle le gène eryCII porte une délétion interne telle que celle introduite dans le plasmide  A strain in which the eryCII gene carries an internal deletion such as that introduced into the plasmid

<Desc/Clms Page number 35><Desc / Clms Page number 35>

pCII# obtenu à l'exemple 8 a été préparée par transformation des protoplastes de Sac. erythràea avec le plasmide pCIIA.  pCII # obtained in Example 8 was prepared by transformation of the Sac protoplasts. erythràea with the plasmid pCIIA.

La préparation des protoplastes, le processus d'intégration et la sélection des mutants ayant le phénotype eryont été réalisés comme à l'exemple 3.  The preparation of the protoplasts, the integration process and the selection of the mutants having the ery phenotype were carried out as in Example 3.

De plus, la présence de la délétion attendue dans le chromosome (délétion de 304 bp du nucléotide 10881 au nucléotide 11184 de la séquence de la figure 2) a été confirmée par analyse génomique par Southern blot ainsi que par PCR selon les conditions décrites à l'exemple 3.  In addition, the presence of the expected deletion in the chromosome (deletion of 304 bp from nucleotide 10881 to nucleotide 11184 of the sequence of FIG. 2) was confirmed by genomic analysis by Southern blot as well as by PCR according to the conditions described in l 'example 3.

Par hybridation Southern sur l'ADN génomique digéré par l'enzyme de restriction EcoRI, en utilisant comme sonde l'oligonucléotide C3-S ayant la séquence ci-dessus, une bande de 2,2 kb à partir de la souche sauvage et une bande de 1,8 kb à partir du mutant CII62 ont été détectées. Les résultats montrés à la figure 15 indiquent chez le mutant la présence d'une délétion d'environ 400 pb dans cette région du chromosome.  By Southern hybridization on the genomic DNA digested with the restriction enzyme EcoRI, using as probe Oligonucleotide C3-S having the sequence above, a band of 2.2 kb from the wild strain and a band 1.8 kb from the mutant CII62 were detected. The results shown in FIG. 15 indicate in the mutant the presence of a deletion of approximately 400 bp in this region of the chromosome.

L'amplification par PCR a été effectuée en utilisant l'oligonucléotide ayant la séquence suivante C2-S GGAATTCATGACCACGACCGATC (SEQ ID N 34) correspondant au brin complémentaire de la région d'ADN de la fin du gène eryAIII située de la position 20258 à la position 20280 de la séquence déposée dans la base EMBL sous la référence X62569 et décrite par Bevitt et al., 1992 et l'oligonucléotide ayant la séquence suivante C2-R CGCTCCAGGTGCAATGCCGGGTGCAGGC (SEQ ID N 35) correspondant à la séquence située de la position 10558 à la position 10585 de la séquence de la figure 2 permettant d'encadrer par amplification PCR la région portant la délétion interne à l'ORF9. L'analyse par amplification par PCR a permis de détecter une bande d'environ 760 pb dans la souche sauvage et une bande d'environ 460 pb dans le mutant CII62 de façon identique au signal obtenu avec pCIIA. Les résultats montrés à la figure 16 confirment que la délétion d'environ 400 pb détectée par l'analyse Southern est identique à celle portée par le plasmide pCII# (304 pb).  The PCR amplification was carried out using the oligonucleotide having the following sequence C2-S GGAATTCATGACCACGACCGATC (SEQ ID N 34) corresponding to the complementary strand of the DNA region at the end of the eryAIII gene located from position 20258 at position 20280 of the sequence deposited in the EMBL base under the reference X62569 and described by Bevitt et al., 1992 and the oligonucleotide having the following sequence C2-R CGCTCCAGGTGCAATGCCGGGTGCAGGC (SEQ ID N 35) corresponding to the sequence located in position 10558 at position 10585 of the sequence of FIG. 2 allowing the region carrying the internal deletion to the ORF9 to be framed by PCR amplification. Analysis by PCR amplification made it possible to detect a band of approximately 760 bp in the wild strain and a band of approximately 460 bp in the mutant CII62 in an identical manner to the signal obtained with pCIIA. The results shown in FIG. 16 confirm that the deletion of approximately 400 bp detected by the Southern analysis is identical to that carried by the plasmid pCII # (304 bp).

La souche recombinante ainsi obtenue, désignée CII62, a  The recombinant strain thus obtained, designated CII62, has

<Desc/Clms Page number 36><Desc / Clms Page number 36>

été ensuite cultivée pour identifier les métabolites produits par la souche.  was then cultured to identify the metabolites produced by the strain.

EXEMPLE 10 : fermentation de la souche CII62 et identification des métabolites secondaires produits. EXAMPLE 10 Fermentation of the CII62 strain and identification of the secondary metabolites produced.

La culture de la souche CII62 et les analyses par ccm suivie de bioautographie ont été réalisées selon les conditions indiquées à l'exemple 4.  The culture of the CII62 strain and the analyzes by cmc followed by bioautography were carried out according to the conditions indicated in Example 4.

Les résultats de ccm (figure 17) montrent que la souche CII62 accumule préférentiellement du 3-a-mycarosyl érythronolide B ainsi que de petites quantités d'érythronolide B comme attendu d'un mutant eryC.  The ccm results (FIG. 17) show that the CII62 strain preferentially accumulates 3-a-mycarosyl erythronolide B as well as small amounts of erythronolide B as expected from an eryC mutant.

La séquence eryCII présente une forte homologie avec des gènes impliqués dans les voies de biosynthèse de la daunosamine (DnrQ, 38 % d'identité au niveau protéique, Otten et al., 1995) et du mycaminose (protéine codée par l'ORF1*, 40 % d'identité au niveau protéique, Gandecha et al., 1997) qui ont également besoin de transférer un groupement céto en position 3 à partir d'un carbone adjacent.  The eryCII sequence has a strong homology with genes involved in the biosynthesis pathways of daunosamine (DnrQ, 38% identity at the protein level, Otten et al., 1995) and mycaminose (protein coded by ORF1 *, 40% protein level identity, Gandecha et al., 1997) who also need to transfer a keto group in position 3 from an adjacent carbon.

Ces observations indiquent que le gène eryCII code pour la dTDP-4-céto-D-6-désoxyhexose 3,4-isomérase dans la voie de biosynthèse de la dTDP-désosamine.  These observations indicate that the eryCII gene codes for dTDP-4-keto-D-6-deoxyhexose 3,4-isomerase in the biosynthesis pathway for dTDP-desosamine.

EXEMPLE 11 : clonage et séquençage de la région eryAI-eryK du cluster de gènes de la biosynthèse de l'érythromycine. EXAMPLE 11 Cloning and Sequencing of the eryAI-eryK Region of the Gene Cluster for Erythromycin Biosynthesis.

Des cosmides contenant la région eryAI-eryK du cluster de gènes ery tel que le cosmide Cos6B, ont été isolés par screening d'une banque d'ADN génomique de Sac. erythraea dans le vecteur cosmidique pWE15 (Stratagene) en utilisant comme sonde un fragment d'ADN de 13,2 kb comprenant la totalité du gène eryAI et correspondant à la région d'ADN comprise entre le site NcoI situé à la position 44382 de la séquence de la figure 3 et le site NcoI situé à la position 392 de la séquence X62569 (Bevitt et al., 1992). La sonde a été préparée de la façon suivante : Dans un premier temps, le fragment NcoI de 13,2 kb a été isolé à partir du plasmide pBK25 décrit par Bevitt et al., 1992 et sous-cloné dans le site SmaI de pUC18 après remplissage des extrémités NcoI avec le fragment de Klenow. A partir du plasmide pNC012 ainsi généré, le fragment de 13,2 kb a été isolé par digestion avec  Cosmids containing the eryAI-eryK region of the ery gene cluster, such as the cosmid Cos6B, were isolated by screening of a Sac genomic DNA library. erythraea in the cosmid vector pWE15 (Stratagene) using as probe a DNA fragment of 13.2 kb comprising the entire eryAI gene and corresponding to the DNA region between the NcoI site located at position 44382 of the sequence in Figure 3 and the NcoI site located at position 392 of the sequence X62569 (Bevitt et al., 1992). The probe was prepared as follows: First, the 13.2 kb NcoI fragment was isolated from the plasmid pBK25 described by Bevitt et al., 1992 and subcloned into the SmaI site of pUC18 after filling of the NcoI ends with the Klenow fragment. From the plasmid pNC012 thus generated, the 13.2 kb fragment was isolated by digestion with

<Desc/Clms Page number 37><Desc / Clms Page number 37>

l'enzyme de restriction NcoI.  the restriction enzyme NcoI.

Le cosmide cos6B ainsi obtenu a été digéré par l'enzyme de restriction NcoI et les fragments résultants de 2,8 kb et 6,1 kb ont été clones dans le site NcoI du vecteur Litmus28 générant respectivement les plasmides pNC028 et pNC062 montrés à la figure 5B.  The cosmid cos6B thus obtained was digested with the restriction enzyme NcoI and the resulting fragments of 2.8 kb and 6.1 kb were cloned into the NcoI site of the vector Litmus28 generating the plasmids pNC028 and pNC062 respectively shown in the figure. 5B.

Le plasmide pNC028 a été séquence par génération de sous-clones en utilisant l'exonucléase III selon le protocole du fournisseur de la trousse Erase-a-Base Kit (Promega) en digérant par les enzymes de restriction respectivement SacI/XbaI et NsiI/BamHI pour la direction inverse. La séquence a été complétée en utilisant comme amorces les oligonucléotides synthétiques ayant les séquences suivantes 644 GATCACGCTCTTCGAGCGGCAG (SEQ ID N 36) 645 GAACTCGGTGGAGTCGATGTC (SEQ ID N 37) et 650 GTTGTCGATCAAGACCCGCAC (SEQ ID N 38)
Pour le séquençage du plasmide pNC062, des matrices ont été générées par sonication de l'ADN selon Bankier et al.
Plasmid pNC028 was sequenced by generation of subclones using exonuclease III according to the protocol of the supplier of the Erase-a-Base Kit (Promega) by digesting with the restriction enzymes SacI / XbaI and NsiI / BamHI respectively for the reverse direction. The sequence was completed using as primers the synthetic oligonucleotides having the following sequences 644 GATCACGCTCTTCGAGCGGCAG (SEQ ID N 36) 645 GAACTCGGTGGAGTCGATGTC (SEQ ID N 37) and 650 GTTGTCGATCAAGACCCGCAC (SEQ ID N 38)
For the sequencing of the plasmid pNC062, templates were generated by sonication of the DNA according to Bankier et al.

(1987) en utilisant pUC18 comme vecteur. La séquence a été complétée en utilisant comme amorces les oligonucléotides synthétiques ayant les séquences suivantes : 646 CATCGTCAAGGAGTTCGACGGT (SEQ ID N 39) 647 TGCGCAGGTCCATGTTCACCACGTT (SEQ ID N 40) 648 GCTACGCCCTGGAGAGCCTG (SEQ ID N 41) 649 GTCGCGGTCGGAGAGCACGAC (SEQ ID N 42) et 874 GCCAGCTCGGCGACGTCCATC (SEQ ID N 43). (1987) using pUC18 as a vector. The sequence was completed using as primers the synthetic oligonucleotides having the following sequences: 646 CATCGTCAAGGAGTTCGACGGT (SEQ ID N 39) 647 TGCGCAGGTCCATGTTCACCACGTT (SEQ ID N 40) 648 GCTACGCCCTGGAGAGCCTG (SEQ ID NAGTCG 429) 874 GCCAGCTCGGCGACGTCCATC (SEQ ID N 43).

Les jonctions NcoI ont été séquencées en utilisant comme matrice l'ADN du cosmide cos6B obtenu ci-dessus dont les régions recouvrant les sites NcoI ont été séquencées en utilisant les amorces ayant les séquences 644 et 645 indiquées ci-dessus.  The NcoI junctions were sequenced using as DNA the cosmid cos6B DNA obtained above, the regions covering the NcoI sites were sequenced using the primers having the sequences 644 and 645 indicated above.

De plus, un fragment ClaI-NcoI de 0,9 kb, contenant le début de la séquence du gène eryAI et la partie 5' de l'ORF13, a été cloné dans pUC18. Ce fragment a été préparé de la façon suivante : Le plasmide pBK6-12 représenté à la figure 5B a d'abord été généré par sous-clonage dans le phagmide pTZ18R du fragment KpnI de 4,5 kb isolé à partir du plasmide pBK25 décrit par Bevitt et al., 1992. Le sous-clone  In addition, a 0.9 kb ClaI-NcoI fragment, containing the start of the eryAI gene sequence and the 5 'part of ORF13, was cloned into pUC18. This fragment was prepared as follows: The plasmid pBK6-12 shown in FIG. 5B was first generated by subcloning into phagmide pTZ18R the 4.5 kb KpnI fragment isolated from the plasmid pBK25 described by Bevitt et al., 1992. The subclone

<Desc/Clms Page number 38><Desc / Clms Page number 38>

pCN9 a ensuite été généré par sous-clonage du fragment ClaINcoI de 0,9 kb isolé à partir du plasmide pBK6-12 dans le site SmaI de pUC19, après remplissage des extrémités à l'aide du fragment de Klenow. Le plasmide pCN9 ainsi obtenu (figure 5B) a été séquence. Des matrices ont été générées par sonication de l'ADN selon Bankier et al. (1987) en utilisant pUC18 comme vecteur. La séquence a été complétée en utilisant comme amorce l'oligonucléotide ayant la séquence suivante : 875 CGACGAGGTCGTGCATCAG (SEQ ID N 44).  pCN9 was then generated by subcloning the 0.9 kb ClaINcoI fragment isolated from the plasmid pBK6-12 in the SmaI site of pUC19, after filling the ends with the Klenow fragment. The plasmid pCN9 thus obtained (FIG. 5B) was sequenced. Arrays were generated by DNA sonication according to Bankier et al. (1987) using pUC18 as a vector. The sequence was completed using as an primer the oligonucleotide having the following sequence: 875 CGACGAGGTCGTGCATCAG (SEQ ID N 44).

Le séquençage de l'ADN est réalisé par la méthode de Sanger (1977) en utilisant un séquenceur automatisé sur les matrices d'ADN double brin avec le séquenceur Applied Biosystem 373 A. L'assemblage des données de séquence a été réalisé avec le logiciel SAP (Staden, 1984). Les séquences ont été analysées en utilisant le logiciel GCG (Devereux, 1984) .  DNA sequencing is carried out by Sanger's method (1977) using an automated sequencer on double stranded DNA templates with the Applied Biosystem 373 A sequencer. The assembly of the sequence data was carried out with the software SAP (Staden, 1984). The sequences were analyzed using GCG software (Devereux, 1984).

Les séquences nucléotidiques obtenues ont permis d'établir la séquence nucléotidique de 8160 bp de la figure 3 (séquence de SEQ ID N 6) dans laquelle sept ORFs (13-19) ont été identifiées respectivement du nucléotide 43841 au nucléotide 44806, du nucléotide 44809 au nucléotide 46053, du nucléotide 46109 au nucléotide 46819, du nucléotide 46907 au nucléotide 48436, du nucléotide 48436 au nucléotide 49638, du nucléotide 49679 au nucléotide 51145 et du nucléotide 51177 au nucléotide 51755 (numérotés dans la figure 3 à partir du site BamHI situé à l'extrémité 5' du gène ermE) (respectivement séquence de SEQ ID N 6 du nucléotide 242 au nucléotide 1207, du nucléotide 1210 au nucléotide 2454, du nucléotide 2510 au nucléotide 3220, du nucléotide 3308 au nucléotide 4837, du nucléotide 4837 au nucléotide 6039, du nucléotide 6080 au nucléotide 7546 et du nucléotide 7578 au nucléotide 8156) et correspondant respectivement aux gènes eryBIV, eryBV, eryCVI, eryBVI, eryCIV, eryCV et eryBVII, selon Liu et Thorson (1994) dont les caractérisations fonctionnelles n'avaient pas encore été identifiées. Les sept ORFs (13-19) sont dans la même direction, la lecture se faisant à partir de la région 5' du gène eryAI.  The nucleotide sequences obtained made it possible to establish the nucleotide sequence of 8160 bp of FIG. 3 (sequence of SEQ ID N 6) in which seven ORFs (13-19) were identified respectively from nucleotide 43841 to nucleotide 44806, from nucleotide 44809 at nucleotide 46053, from nucleotide 46109 to nucleotide 46819, from nucleotide 46907 to nucleotide 48436, from nucleotide 48436 to nucleotide 49638, from nucleotide 49679 to nucleotide 51145 and from nucleotide 51177 to nucleotide 51755 (numbered in Figure 3 from the BamHI site at the 5 'end of the ermE gene) (respectively sequence of SEQ ID N 6 from nucleotide 242 to nucleotide 1207, from nucleotide 1210 to nucleotide 2454, from nucleotide 2510 to nucleotide 3220, from nucleotide 3308 to nucleotide 4837, from nucleotide 4837 to nucleotide 6039, from nucleotide 6080 to nucleotide 7546 and from nucleotide 7578 to nucleotide 8156) and corresponding respectively to the genes eryBIV, eryBV, er yCVI, eryBVI, eryCIV, eryCV and eryBVII, according to Liu and Thorson (1994) whose functional characterizations had not yet been identified. The seven ORFs (13-19) are in the same direction, the reading being done from the 5 ′ region of the eryAI gene.

Des échantillons de E. coli XL1-blue contenant la région  E. coli XL1-blue samples containing the region

<Desc/Clms Page number 39><Desc / Clms Page number 39>

codante des ORFs ci-dessus ont été déposés à la CNCM le 16 juillet 1997 : - le plasmide pBK6-12 comprenant la séquence codante pour l'ORF13 et pour une partie de l'ORF14 sous le numéro 1-1898 - le plasmide pNC028 comprenant la séquence codante pour les ORFs 14 et 15 ainsi que pour une partie des ORFs 13 et 16 sous le numéro 1-1901 et - le plasmide pNC062 comprenant la séquence codante pour les ORFs 17,18 et 19 ainsi que pour une partie de l'ORF16 sous le numéro 1-1900.  encoding the above ORFs were deposited with the CNCM on July 16, 1997: - the plasmid pBK6-12 comprising the coding sequence for ORF13 and for a part of ORF14 under the number 1-1898 - the plasmid pNC028 comprising the coding sequence for ORFs 14 and 15 as well as for part of ORFs 13 and 16 under the number 1-1901 and - the plasmid pNC062 comprising the coding sequence for ORFs 17,18 and 19 as well as for part of ORF16 under number 1-1900.

EXEMPLE 12 : construction du plasmide pBIVA. EXAMPLE 12 Construction of the plasmid pBIVA.

L'ORF13 étant translationnellement couplé à l'ORF14 située en aval, une délétion en phase a dû être introduite.  The ORF13 being translational coupled to the ORF14 located downstream, a phase deletion had to be introduced.

Un plasmide d'intégration, dénommé pBIVA et portant cette délétion, a été construit selon le schéma de la figure 9A. An integration plasmid, called pBIVA and carrying this deletion, was constructed according to the diagram in FIG. 9A.

Le plasmide pPSP4 (figure 5B) a d'abord été construit par sous-clonage du fragment PvuII-SpeI (2,7 kb) isolé à partir du plasmide pBK6-12 obtenu à l'exemple 11 et du fragment SpeI-PstI (1,6 kb) isolé à partir du plasmide pNC028 obtenu à l'exemple 11 dans le vecteur pUC19 préalablement digéré à l'aide des enzymes de restriction SmaI et PstI.  The plasmid pPSP4 (FIG. 5B) was first constructed by subcloning the PvuII-SpeI fragment (2.7 kb) isolated from the plasmid pBK6-12 obtained in Example 11 and the SpeI-PstI fragment (1 , 6 kb) isolated from the plasmid pNC028 obtained in Example 11 in the vector pUC19 previously digested using the restriction enzymes SmaI and PstI.

* A partir du plasmide pPSP4, le plasmide pl9BIVA a été généré en délétant le fragment BclI-NcoI de 510 pb interne à l'ORF13 et en lui substituant 45 pb venant d'un adaptateur synthétique de 54 pb. Cet adaptateur a été généré par appariement des 2 oligonucléotides complémentaires ayant les séquences suivantes SEQ A AATTGATCAAGGTGAACACGGTCATGCGCAGGATCCTCGAGCGGAACTCCATGGGG (SEQ ID N 45) et SEQ B CCCCATGGAGTTCCGCTCGAGGATCCTGCGCATGACCGTGTTCACCTTGATCAATT (SEQ ID N 46) créant un site Bell et un site NcoI encadrant la séquence de 45 pb. * From the plasmid pPSP4, the plasmid pl9BIVA was generated by deleting the BclI-NcoI fragment of 510 bp internal to ORF13 and by replacing it with 45 bp coming from a synthetic adapter of 54 bp. This adapter was generated by pairing the 2 complementary oligonucleotides having the following sequences: SEQ A AATTGATCAAGGTGAACACGGTCATGCGCAGGATCCTCGAGCGGAACTCCATGGGG (SEQ ID N 45) and SEQ B CCCCATGGAGTTCCGCTCGAGGATCCTGCGCATGACCGTGTAC site.

Pour l'appariement, les deux oligonucléotides ont été mis à une concentration finale 1,8 M dans le tampon d'hybridation NaCl 50 mM, Tris, HC1 20 mM pH 7,4, MgCl2,6H20  For pairing, the two oligonucleotides were brought to a final concentration of 1.8 M in the hybridization buffer NaCl 50 mM, Tris, HCl 20 mM pH 7.4, MgCl2.6H20

<Desc/Clms Page number 40><Desc / Clms Page number 40>

2 mM, chauffés pendant 5 mn à 100 C puis refroidis lentement à température ambiante. Après digestion avec les enzymes de restriction Ncol et BclI, une ligature a été effectuée dans le plasmide pPSP4 dont le fragment BclI-NcoI de 510 pb avait préalablement été éliminé. A partir du plasmide pl9BIVA ainsi généré, le fragment SacI-EcoRI (2,2 kb) portant l'ORF13 modifiée a été sous-cloné dans le plasmide pUWL218 préalablement digéré avec les enzymes de restriction SacI et EcoRI. Le plasmide d'intégration pBIVA ainsi obtenu (figure 9B) a été ensuite transféré dans la souche E. coli DH5aMRC, puis utilisé pour transformer Sac. erythraea.  2 mM, heated for 5 min at 100 C and then slowly cooled to room temperature. After digestion with the restriction enzymes Ncol and BclI, a ligation was carried out in the plasmid pPSP4 from which the BclI-NcoI fragment of 510 bp had previously been eliminated. From the plasmid pl9BIVA thus generated, the SacI-EcoRI fragment (2.2 kb) carrying the modified ORF13 was subcloned into the plasmid pUWL218 previously digested with the restriction enzymes SacI and EcoRI. The integration plasmid pBIVA thus obtained (FIG. 9B) was then transferred into the E. coli strain DH5aMRC, then used to transform Sac. erythraea.

EXEMPLE 13 : construction d'une souche Sac. erythraea eryBIVA (BIV87). EXAMPLE 13: Construction of a Sac strain. erythraea eryBIVA (BIV87).

Une souche dans laquelle le gène eryBIV porte une délétion interne telle que celle introduite dans le plasmide pBIVA obtenu à l'exemple 12 a été préparée par transformation des protoplastes de Sac. erythraea avec le plasmide pBIVA.  A strain in which the eryBIV gene carries an internal deletion such as that introduced into the plasmid pBIVA obtained in Example 12 was prepared by transformation of the protoplasts of Sac. erythraea with the plasmid pBIVA.

La préparation des protoplastes, le processus d'intégration et la sélection des mutants ayant le phénotype ery- ont été réalisés comme à l'exemple 3.  The preparation of the protoplasts, the integration process and the selection of the mutants having the ery- phenotype were carried out as in Example 3.

De plus, la présence de la délétion attendue dans le chromosome (délétion de 510 bp du nucléotide 43872 au nucléotide 44382 de la séquence de la figure 3) et son remplacement par la séquence synthétique de 45 pb a été confirmée par analyse génomique par Southern blot ainsi que par PCR selon les conditions décrites à l'exemple 3.  In addition, the presence of the expected deletion in the chromosome (deletion of 510 bp from nucleotide 43872 to nucleotide 44382 of the sequence in FIG. 3) and its replacement by the synthetic sequence of 45 bp was confirmed by genomic analysis by Southern blot as well as by PCR according to the conditions described in Example 3.

Par hybridation Southern sur l'ADN génomique digéré par l'enzyme de restriction Xhol, en utilisant comme sonde l'oligonucléotide B4-R ayant la séquence suivante B4-R AACTCGGTGGAGTCGATGTCGTCGCTGCGGAA (SEQ ID N 47) correspondant au brin complémentaire de la région d'ADN située de la position 44687 à la position 44718 de la séquence de la figure 3, une bande de 5,4 kb à partir de la souche sauvage et une bande de 2,7 kb à partir du mutant BIV87 ont été détectées. Les résultats montrés à la figure 15 indiquent la présence d'un site Xhol supplémentaire à une distance de 2,7 kb en amont du site XhoI situé à la position 47114 de la séquence de la figure 3 confirmant ainsi  By Southern hybridization on the genomic DNA digested by the restriction enzyme Xhol, using as probe Oligonucleotide B4-R having the following sequence B4-R AACTCGGTGGAGTCGATGTCGTCGCTGCGGAA (SEQ ID N 47) corresponding to the complementary strand of the region of DNA located from position 44687 to position 44718 of the sequence of Figure 3, a 5.4 kb band from the wild strain and a 2.7 kb band from the BIV87 mutant were detected. The results shown in FIG. 15 indicate the presence of an additional Xhol site at a distance of 2.7 kb upstream from the XhoI site located at position 47114 of the sequence of FIG. 3, thus confirming

<Desc/Clms Page number 41><Desc / Clms Page number 41>

l'incorporation de l'adaptateur dans le chromosome de mutant, telle qu'attendue par l'incorporation de l'adaptateur synthétique ci-dessus utilisé pour générer le plasmide pBIVA.  incorporation of the adapter into the mutant chromosome, as expected by the incorporation of the above synthetic adapter used to generate the plasmid pBIVA.

L'amplification par PCR a été effectuée en utilisant l'oligonucléotide ayant la séquence suivante B4-S CAATATAGGAAGGATCAAGAGGTTGAC (SEQ ID N 48) correspondant à la région d'ADN située de la position 43652 à la position 43678 de la séquence de la figure 3 et l'oligonucléotide B4-R ayant la séquence indiquée ci-dessus, permettant d'encadrer par amplification PCR la région portant la délétion interne à l'ORF13. L'analyse par amplification par PCR a permis de détecter une bande d'environ 1 kb dans la souche sauvage et une bande d'environ 500 pb dans le mutant BIV87 de façon identique au signal obtenu avec le plasmide pBIV87 (figure 16).  The PCR amplification was carried out using the oligonucleotide having the following sequence B4-S CAATATAGGAAGGATCAAGAGGTTGAC (SEQ ID N 48) corresponding to the DNA region located from position 43652 to position 43678 of the sequence of FIG. 3 and the oligonucleotide B4-R having the sequence indicated above, making it possible to frame by PCR amplification the region carrying the deletion internal to the ORF13. Analysis by amplification by PCR made it possible to detect a band of approximately 1 kb in the wild strain and a band of approximately 500 bp in the mutant BIV87 in an identical manner to the signal obtained with the plasmid pBIV87 (FIG. 16).

L'ensemble des résultats d'analyse par Southern et par PCR confirme la présence de la délétion de 510 pb et de l'adaptateur synthétique au niveau du chromosome du mutant.  All the results of analysis by Southern and by PCR confirm the presence of the 510 bp deletion and of the synthetic adapter at the level of the mutant chromosome.

La souche recombinante ainsi obtenue, désignée BIV87, a été ensuite cultivée pour identifier les métabolites produits par la souche.  The recombinant strain thus obtained, designated BIV87, was then cultured to identify the metabolites produced by the strain.

EXEMPLE 14 : fermentation de la souche BIV87 et identification des métabolites secondaires produits. EXAMPLE 14 Fermentation of the BIV87 strain and identification of the secondary metabolites produced.

La culture de la souche BIV87 et les analyses par ccm ont été réalisées selon les conditions indiquées à l'exemple 4.  The culture of the BIV87 strain and the ccm analyzes were carried out according to the conditions indicated in Example 4.

Les résultats de ccm (figure 17) montrent que la souche BIV87 accumule préférentiellement de l'érythronolide B comme attendu d'un mutant eryB.  The results of ccm (FIG. 17) show that the strain BIV87 preferentially accumulates erythronolide B as expected from an eryB mutant.

Des métabolites mineurs de faibles mobilités manifestant une activité antibiotique ont également été détectés. Ces métabolites ont été extraits et analysés par RP-HPLC couplée à la spectrométrie de masse comme décrit à l'exemple 4.  Minor metabolites of low mobility exhibiting antibiotic activity have also been detected. These metabolites were extracted and analyzed by RP-HPLC coupled to mass spectrometry as described in Example 4.

Les résultats de spectre de masse indiquent que des formes modifiées de l'érythromycine A, B, C et D ont été produites. Un métabolite majeur et 3 métabolites mineurs ont été détectés.  Mass spectrum results indicate that modified forms of erythromycin A, B, C and D have been produced. One major metabolite and 3 minor metabolites were detected.

Le métabolite majeur M5 donne un pic parent à m/z 702  The major metabolite M5 gives a parent peak at m / z 702

<Desc/Clms Page number 42><Desc / Clms Page number 42>

avec des produits de déshydratation et de fragmentation à m/z 684, m/z 560 et m/z 158 et correspond à l'élimination de 2 atomes d'hydrogène dans l'érythromycine D (m/z 704, m/z 686).  with dehydration and fragmentation products at m / z 684, m / z 560 and m / z 158 and corresponds to the elimination of 2 hydrogen atoms in erythromycin D (m / z 704, m / z 686 ).

La présence de désosaminyl érythronolide B (fragment m/z à 560) indique que la différence de masse est portée par le sucre neutre. La structure proposée pour ce métabolite est la 4"-céto érythromycine D. The presence of desosaminyl erythronolide B (fragment m / z at 560) indicates that the difference in mass is carried by the neutral sugar. The proposed structure for this metabolite is 4 "-keto erythromycin D.

Les métabolites mineurs donnent aussi un profil avec une différence de 2 dans les valeurs m/z respectivement : - M6 (m/z à 718, m/z 700, m/z 576, m/z 158) au lieu de m/z 720, m/z 702 pour l'érythromycine C ; - M7 (m/z à 732, m/z 714, m/z 576, m/z 158) au lieu de m/z 734, m/z 716 pour l'érythromycine A ; - M8 (m/z à 716, m/z 698, m/z 560, m/z 158) au lieu de m/z 718, m/z 700 pour l'érythromycine B.  The minor metabolites also give a profile with a difference of 2 in the m / z values respectively: - M6 (m / z at 718, m / z 700, m / z 576, m / z 158) instead of m / z 720, m / z 702 for erythromycin C; - M7 (m / z to 732, m / z 714, m / z 576, m / z 158) instead of m / z 734, m / z 716 for erythromycin A; - M8 (m / z to 716, m / z 698, m / z 560, m / z 158) instead of m / z 718, m / z 700 for erythromycin B.

Les structures proposées sont respectivement la 4"-céto érythromycine C pour M6, la 4"-céto érythromycine A pour M7 et la 4"-céto érythromycine B pour M8.  The proposed structures are respectively 4 "-keto erythromycin C for M6, 4" -keto erythromycin A for M7 and 4 "-keto erythromycin B for M8.

Ces observations indiquent que le gène eryBIV code pour la dTDP-4-céto-L-6-désoxyhexose 4-réductase dans la voie de biosynthèse du dTDP-mycarose.  These observations indicate that the eryBIV gene codes for dTDP-4-keto-L-6-deoxyhexose 4-reductase in the biosynthetic pathway for dTDP-mycarose.

La souche BIV87 a été déposé à la CNCM le 16 juillet 1997 sous le numéro 1-1904 EXEMPLE 15 : construction du plasmide pBV#.  The strain BIV87 was deposited at the CNCM on July 16, 1997 under the number 1-1904 EXAMPLE 15: construction of the plasmid pBV #.

Un plasmide d'intégration, dénommé pBV# et portant une délétion dans le gène eryBV codant pour l'ORF14, a été construit selon le schéma de la figure 10A.  An integration plasmid, called pBV # and carrying a deletion in the eryBV gene coding for ORF14, was constructed according to the diagram of FIG. 10A.

Une délétion de 726 pb a été générée dans l'ORF14 du nucléotide 44963 au nucléotide 45688 de la séquence de la figure 3 par ligature du fragment BclI-KpnI (1,1 kb) isolé à partir du plasmide pBK6-12, obtenu à l'exemple 11, au fragment Kpnl-BamHI (1,1 kb) isolé à partir du plasmide pNC028, obtenu à l'exemple 11, dans le plasmide pUWL218 préalablement digéré par l'enzyme de restriction BamHI. Le plasmide d'intégration pBVA ainsi obtenu (figure 10B) a ensuite été transféré dans la souche E. coli DH5aMRC, puis utilisé pour transformer Sac. erythraea.  A 726 bp deletion was generated in ORF14 from nucleotide 44963 to nucleotide 45688 of the sequence of FIG. 3 by ligation of the BclI-KpnI fragment (1.1 kb) isolated from the plasmid pBK6-12, obtained at 1 Example 11, to the KpnI-BamHI fragment (1.1 kb) isolated from the plasmid pNC028, obtained in Example 11, in the plasmid pUWL218 previously digested with the restriction enzyme BamHI. The pBVA integration plasmid thus obtained (FIG. 10B) was then transferred to the E. coli DH5aMRC strain, then used to transform Sac. erythraea.

EXEMPLE 16 : construction d'une souche Sac. erythraea eryBVA EXAMPLE 16: Construction of a Sac strain. erythraea eryBVA

<Desc/Clms Page number 43><Desc / Clms Page number 43>

(BV88).  (BV88).

Une souche dans laquelle le gène eryBV porte une délétion interne telle que celle introduite dans le plasmide pBV# obtenu à l'exemple 15 a été préparée par transformation des protoplastes de Sac. erythraea avec le plasmide pBV#.  A strain in which the eryBV gene carries an internal deletion such as that introduced into the plasmid pBV # obtained in Example 15 was prepared by transformation of the sac protoplasts. erythraea with the plasmid pBV #.

La préparation des protoplastes, le processus d'intégration et la sélection des mutants ayant le phénotype ery- ont été réalisés comme à l'exemple 3.  The preparation of the protoplasts, the integration process and the selection of the mutants having the ery- phenotype were carried out as in Example 3.

De plus, la présence de la délétion attendue dans le chromosome (délétion de 726 pb du nucléotide 44963 au nucléotide 45688 de la séquence de la figure 3) a été confirmée par analyse génomique par Southern blot ainsi que par PCR selon les conditions décrites à l'exemple 3.  In addition, the presence of the expected deletion in the chromosome (deletion of 726 bp from nucleotide 44963 to nucleotide 45688 of the sequence of FIG. 3) was confirmed by genomic analysis by Southern blot as well as by PCR according to the conditions described in l 'example 3.

Par hybridation Southern sur l'ADN génomique digéré par l'enzyme de restriction NcoI, en utilisant comme sonde l'oligonucléotide ayant la séquence suivante : B5-R TCCGGAGGTGTGCTGTCGGACGGACTTGTCGGTCGGAAA (SEQ ID N 49) correspondant au brin complémentaire de la région d'ADN située de la position 46060 à la position 46098 de la séquence de la figure 3, une bande de 2,7 kb à partir de la souche sauvage et une bande de 2,0 kb à partir du mutant BV88 ont été détectées. Les résultats montrés à la figure 15 indiquent chez le mutant la présence d'une délétion d'environ 700 pb dans cette région du chromosome.  By Southern hybridization on the genomic DNA digested with the restriction enzyme NcoI, using as oligonucleotide probe having the following sequence: B5-R TCCGGAGGTGTGCTGTCGGACGGACTTGTCGGTCGGAAA (SEQ ID N 49) corresponding to the complementary strand of the DNA region located from position 46060 to position 46098 of the sequence of FIG. 3, a band of 2.7 kb from the wild strain and a band of 2.0 kb from the mutant BV88 were detected. The results shown in FIG. 15 indicate in the mutant the presence of a deletion of approximately 700 bp in this region of the chromosome.

L'amplification par PCR a été effectuée en utilisant l'oligonucléotide ayant la séquence suivante : B5-S AGGAGCACTAGTGCGGGTACTGCTGACGTCCTT (SEQ ID N 50) correspondant à la région d'ADN située de la position 44799 à la position 44831 de la séquence de la figure 3 et l'oligonucléotide B5-R ayant la séquence indiquée ci-dessus, permettant d'encadrer par amplification PCR la région portant la délétion interne à l'ORF14. L'analyse par amplification par PCR a permis de détecter une bande d'environ 1,3 kb dans la souche sauvage et une bande d'environ 570 pb dans le mutant BV88 de façon identique au signal obtenu avec le plasmide pBV88 (figure 16). Ces résultats confirment que la délétion de 710 pb détectée par analyse Southern est identique à celle portée par le plasmide pBV# (726 pb).  The PCR amplification was carried out using the oligonucleotide having the following sequence: B5-S AGGAGCACTAGTGCGGGTACTGCTGACGTCCTT (SEQ ID N 50) corresponding to the DNA region located at position 44799 at position 44831 in the sequence of the figure 3 and the oligonucleotide B5-R having the sequence indicated above, making it possible to frame by PCR amplification the region carrying the internal deletion at ORF14. Analysis by PCR amplification made it possible to detect a band of approximately 1.3 kb in the wild strain and a band of approximately 570 bp in the mutant BV88 in an identical manner to the signal obtained with the plasmid pBV88 (FIG. 16). . These results confirm that the deletion of 710 bp detected by Southern analysis is identical to that carried by the plasmid pBV # (726 bp).

<Desc/Clms Page number 44> <Desc / Clms Page number 44>

La souche recombinante ainsi obtenue, désignée BV88, a été ensuite cultivée pour identifier les métabolites produits par la souche.  The recombinant strain thus obtained, designated BV88, was then cultured to identify the metabolites produced by the strain.

EXEMPLE 17 : fermentation de la souche BV88 et identification des métabolites secondaires produits. EXAMPLE 17 Fermentation of the BV88 strain and identification of the secondary metabolites produced.

La culture de la souche BV88 et les analyses par ccm ont été réalisées selon les conditions indiquées à l'exemple 4.  The culture of the BV88 strain and the ccm analyzes were carried out according to the conditions indicated in Example 4.

Les résultats de ccm (figure 17) montrent que la souche BV88 accumule préférentiellement de l'érythronolide B comme attendu d'un mutant eryB.  The ccm results (FIG. 17) show that the BV88 strain preferentially accumulates erythronolide B as expected from an eryB mutant.

Des métabolites mineurs de faibles mobilités ont également été détectés puis extraits et identifiés par RPHPLC couplée à la spectrométrie de masse selon les conditions utilisées à l'exemple 4.  Minor metabolites of low mobility were also detected then extracted and identified by RPHPLC coupled to mass spectrometry according to the conditions used in Example 4.

Le spectre de masse montre la présence d'un métabolite ayant un pic parent à m/z 560 et des produits de déshydratation et de fragmentation à m/z 542 et m/z 158 pour lequel la structure proposée est le désosaminyl érythronolide B.  The mass spectrum shows the presence of a metabolite having a parent peak at m / z 560 and dehydration and fragmentation products at m / z 542 and m / z 158 for which the proposed structure is desosaminyl erythronolide B.

La séquence eryBV présente une forte homologie avec d'autres glycosyltransférases ainsi qu'avec le gène eryCIII ci-dessus (60,7 % d'identité au niveau nucléotidique, 44 % au niveau protéique).  The eryBV sequence has strong homology with other glycosyltransferases as well as with the eryCIII gene above (60.7% identity at the nucleotide level, 44% at the protein level).

Ces observations indiquent que le gène eryBV code pour la mycarosyltransférase impliquée dans la biosynthèse de l'érythomycine.  These observations indicate that the eryBV gene codes for the mycarosyltransferase involved in the biosynthesis of erythomycin.

EXEMPLE 18 : construction d'un plasmide pCVI# (pPSTI). EXAMPLE 18: Construction of a plasmid pCVI # (pPSTI).

Un plasmide d'intégration, dénommé pPSTI et portant une délétion dans le gène eryCVI codant pour l'ORF15, a été construit selon le schéma de la figure 11A de la façon suivante :
Dans un premier temps, le plasmide pNB49 a été généré par traitement à l'exonucléase III du plasmide pNC028 obtenu à l'exemple 11 préalablement digéré par les enzymes de restriction NsiI et BamHI. Le plasmide pNB49 (figure 5B) contenant les nucléotides 44382 à 46562 de la séquence de la figure 3, a été ensuite digéré à l'aide de l'enzyme de restriction PstI puis traité par la nucléase Mung Bean (NE Biolabs) comme décrit par Sambrook et al. (1989). Après
An integration plasmid, called pPSTI and carrying a deletion in the eryCVI gene coding for ORF15, was constructed according to the diagram of FIG. 11A as follows:
Initially, the plasmid pNB49 was generated by treatment with exonuclease III of the plasmid pNC028 obtained in Example 11 previously digested with the restriction enzymes NsiI and BamHI. The plasmid pNB49 (FIG. 5B) containing the nucleotides 44382 to 46562 of the sequence of FIG. 3, was then digested using the restriction enzyme PstI then treated with the Mung Bean nuclease (NE Biolabs) as described by Sambrook et al. (1989). After

<Desc/Clms Page number 45><Desc / Clms Page number 45>

religature et transformation dans E. coli XL1-Blue, les colonies résistantes à l'ampicilline ont été sélectionnées par analyse de restriction avec l'enzyme Pstl. La perte du site PstI a été confirmée par séquençage d'un clone en utilisant l'amorce M13 inverse et la délétion du nucléotide 46364 de la séquence de la figure 3 a été observée créant un changement de phase dans l'ORF15 dans le plasmide pNB49APst ainsi généré. Le plasmide pIJ702 digéré avec l'enzyme de restriction BglII a été ensuite ligaturé au site BglII du plasmide pNB49APst générant le plasmide pPSTI. L'orientation de pIJ702 dans pPSTI a été confirmée par la présence d'un fragment d'ADN ayant 0,9 kb après digestion avec l'enzyme de restriction Sphl. Le plasmide d'intégration pPSTI (figure 11B) ainsi obtenu a été transféré dans la souche E. coli DH5aMRC, puis utilisé pour transformer Sac. erythraea.  religation and transformation in E. coli XL1-Blue, ampicillin resistant colonies were selected by restriction analysis with the enzyme Pstl. The loss of the PstI site was confirmed by sequencing a clone using the reverse M13 primer and the deletion of nucleotide 46364 from the sequence of FIG. 3 was observed creating a phase change in the ORF15 in the plasmid pNB49APst thus generated. The plasmid pIJ702 digested with the restriction enzyme BglII was then ligated to the BglII site of the plasmid pNB49APst generating the plasmid pPSTI. The orientation of pIJ702 in pPSTI was confirmed by the presence of a DNA fragment having 0.9 kb after digestion with the restriction enzyme Sphl. The integration plasmid pPSTI (FIG. 11B) thus obtained was transferred into the E. coli strain DH5aMRC, then used to transform Sac. erythraea.

EXEMPLE 19 : construction d'une souche Sac. erythraea eryCVI# (PstlO) . EXAMPLE 19: Construction of a Sac strain. erythraea eryCVI # (PstlO).

Une souche dans laquelle le gène eryCVI porte une délétion interne telle que celle introduite dans le plasmide pPSTI obtenu à l'exemple 18 a été préparée par transformation des protoplastes de Sac. erythraea avec le plasmide pPSTI.  A strain in which the eryCVI gene carries an internal deletion such as that introduced into the plasmid pPSTI obtained in Example 18 was prepared by transformation of the sac protoplasts. erythraea with the plasmid pPSTI.

La préparation des protoplastes et le processus d'intégration ont été réalisés comme à l'exemple 3.  The protoplast preparation and the integration process were carried out as in Example 3.

La sélection des mutants ayant le phénotype ery- a été réalisée comme à l'exemple 3 en utilisant une souche B. subtilis sensible à l'érythromycine au lieu d'une souche B. pumilus comme souche indicatrice. La souche B. subtilis ATCC 6633 a été utilisée pour évaluer la production d'érythromycine dans des essais biologiques sur des boîtes d'agar en milieu Ml-102 inoculées avec le mutant à analyser et incubées pendant 3 jours à 30 C. Des zones d'agar recouvertes de bactéries ont ensuite été prélevées à l'emporte pièce puis placées sur des boîtes 2 x TY recouvertes d'une surcouche de 5 ml d'agar en milieu TY contenant 200 fil d'une culture de B. subtilis ATCC 6633, puis incubées une nuit à 37 C.  The selection of mutants with the ery- phenotype was carried out as in Example 3 using a B. subtilis strain sensitive to erythromycin instead of a B. pumilus strain as an indicator strain. The strain B. subtilis ATCC 6633 was used to evaluate the production of erythromycin in biological tests on agar dishes in Ml-102 medium inoculated with the mutant to be analyzed and incubated for 3 days at 30 C. agar covered with bacteria were then removed with a cookie cutter and then placed on 2 x TY dishes covered with an overlay of 5 ml of agar in TY medium containing 200 μl of a culture of B. subtilis ATCC 6633, then incubated overnight at 37 C.

L'absence de production d'érythromycine a été évaluée également en présence de précurseurs ajoutés tels que  The absence of erythromycin production was also evaluated in the presence of added precursors such as

<Desc/Clms Page number 46><Desc / Clms Page number 46>

l'érythronolide B ou le 3-a-mycarosyl érythronolide B par application de 10 /il d'une solution 10 mM de chaque métabolite sur les zones d'agar découpées suivie d'une incubation à 30 C pendant une nuit avant de recouvrir les boites de la culture de B. subtilis comme indiqué ci-dessus. La souche Sac. erythraea sauvage "red variant" a été utilisée comme contrôle.  erythronolide B or 3-a-mycarosyl erythronolide B by applying 10 μl of a 10 mM solution of each metabolite to the cut agar zones followed by incubation at 30 ° C. overnight before covering the culture dishes of B. subtilis as indicated above. The Sac strain. wild erythraea "red variant" was used as a control.

Après la transformation des protoplastes avec le plasmide pPSTI et la sélection des colonies résistantes au thiostrepton, l'intégration dans le chromosome a été confirmée par analyse de Southern selon les méthodes générales décrites à l'exemple 3.  After the transformation of the protoplasts with the plasmid pPSTI and the selection of the thiostrepton-resistant colonies, the integration into the chromosome was confirmed by Southern analysis according to the general methods described in Example 3.

Un fragment d'ADN de 1269 pb correspondant à l'ORF14 généré par PCR en utilisant les oligonucléotides synthétiques ayant les séquences suivantes : 14-1 GGGGGATCCCATATGCGGGTACTGCTGACGTCCTTCG (SEQ ID N 51) et 14-2 GAAAAGATCTGCCGGCGTGGCGGCGCGTGAGTTCCTC (SEQ ID N 52) a été utilisé comme sonde.  A 1269 bp DNA fragment corresponding to ORF14 generated by PCR using synthetic oligonucleotides having the following sequences: 14-1 GGGGGATCCCATATGCGGGTACTGCTGACGTCCTTCG (SEQ ID N 51) and 14-2 GAAAAGATCTGCCGGCGTGGCGGCGCGTGAGTTCCTC was used IDQ 52 as a probe.

L'oligonucléotide 14-1 a été dessiné de façon à introduire un site BamHI et un site NdeI en amont de la séquence correspondant à la région d'ADN située de la position 44811 à la position 44833 de la séquence de la figure 3.  The oligonucleotide 14-1 was designed so as to introduce a BamHI site and an NdeI site upstream of the sequence corresponding to the DNA region located from position 44811 to position 44833 of the sequence of FIG. 3.

L'oligonucléotide 14-2 a été dessiné de façon à introduire un site BglII en aval de la séquence correspondant au brin complémentaire de la région d'ADN située de la position 46027 à la position 46053 de la séquence de la figure 3.  The oligonucleotide 14-2 was designed so as to introduce a BglII site downstream of the sequence corresponding to the complementary strand of the DNA region located from position 46027 to position 46053 of the sequence of FIG. 3.

L'ADN chromosomique préalablement digéré avec les enzymes de restriction ClaI et PstI a montré les bandes attendues de 4 kb et 7 kb à partir de l'intégrant alors que la souche sauvage présentait la bande de 3 kb attendue. The chromosomal DNA previously digested with the restriction enzymes ClaI and PstI showed the expected bands of 4 kb and 7 kb from the integrant while the wild strain presented the expected band of 3 kb.

Après cultures répétées des intégrants, les colonies individualisées obtenues ont été analysées pour la sensibilité au thiostrepton et la production d'érythromycine, puis l'intégration de la délétion attendue (délétion du nucléotide 46364 de la séquence de la figure 3) dans le chromosome d'un clone mutant ayant le phénotype ery- (PstlO) a été confirmée par analyse de Southern. L'ADN chromosomique, isolé respectivement à partir de la souche sauvage et du mutant PstlO, a  After repeated cultures of the integrants, the individualized colonies obtained were analyzed for sensitivity to thiostrepton and the production of erythromycin, then the integration of the expected deletion (deletion of nucleotide 46364 of the sequence of FIG. 3) in chromosome d a mutant clone having the ery- phenotype (Pst10) was confirmed by Southern analysis. The chromosomal DNA, isolated respectively from the wild strain and the Pst10 mutant, has

<Desc/Clms Page number 47><Desc / Clms Page number 47>

été digéré avec l'enzyme de restriction PstI. L'hybridation avec la sonde PstI-NcoI de 0,8kb (nucléotides 46368 à 47142 de la séquence de la figure 3) a donné le profil attendu avec une bande PstI de lkb correspondant aux nucléotides 46368 à 47397 de la séquence de la figure 3 à partir de la souche sauvage et avec une bande >20 kb à partir du mutant. La perte du site PstI à la position 46368 ci-dessus a aussi été montrée après double digestion par les enzymes PstI et NcoI, résultant en une bande PstI-NcoI de 0,8 kb (nucléotide 46368 à 47142) à partir de la souche sauvage et une bande NcoI de 2,8 kb (nucléotide 44382 à 47142) avec le mutant.  been digested with the restriction enzyme PstI. Hybridization with the PstI-NcoI probe of 0.8 kb (nucleotides 46368 to 47142 of the sequence of FIG. 3) gave the expected profile with a PstI band of lkb corresponding to nucleotides 46368 to 47397 of the sequence of FIG. 3 from the wild strain and with a band> 20 kb from the mutant. The loss of the PstI site at position 46368 above was also shown after double digestion with the enzymes PstI and NcoI, resulting in a PstI-NcoI band of 0.8 kb (nucleotide 46368 to 47142) from the wild strain. and a 2.8 kb NcoI band (nucleotide 44382 to 47142) with the mutant.

La souche recombinante ainsi obtenue, désignée PstlO, a ensuite été cultivée pour identifier les métabolites produits.  The recombinant strain thus obtained, designated Pst10, was then cultured to identify the metabolites produced.

EXEMPLE 20 : fermentation de la souche PstlO et identification des métabolites secondaires produits. EXAMPLE 20 Fermentation of the Pst10 strain and identification of the secondary metabolites produced.

La souche PstlO a été cultivée dans le milieu sucrosesuccinate décrit par Caffrey et al. (1992) pendant 3 jours à 30 C. Le surnageant de culture a été ensuite extrait à pH 9 avec de l'acétate d'éthyle. Les phases organiques obtenues ont été séchées sur S04Mg2 puis amenées à sec sous pression réduite. Le résidu a été dissous dans le mélange acétonitrile-eau (1:1, v/v), puis a ensuite été analysé par spectrométrie de masse sur un spectromètre BioQ (Micromass, Manchester, UK) ou Finningan LCQ (Finningag, CA).  The Pst10 strain was cultivated in the sucrosesuccinate medium described by Caffrey et al. (1992) for 3 days at 30 C. The culture supernatant was then extracted at pH 9 with ethyl acetate. The organic phases obtained were dried over SO4Mg2 and then brought to dryness under reduced pressure. The residue was dissolved in acetonitrile-water (1: 1, v / v), then was analyzed by mass spectrometry on a BioQ (Micromass, Manchester, UK) or Finningan LCQ (Finningag, CA) spectrometer.

La production d'érythomycine A (m/z 734 et m/z 716) n'a pas été observée mais la présence d'érythronolide B (MK+ : m/z 441 et MNa+ : m/z 425) ainsi que de 3-a-mycarosyl érythronolide B (MK+ : m/z 585 et MNa+ : m/z 569) mise en évidence caractérise la souche PstlO comme un mutant eryC.  The production of erythomycin A (m / z 734 and m / z 716) was not observed but the presence of erythronolide B (MK +: m / z 441 and MNa +: m / z 425) as well as 3- a-mycarosyl erythronolide B (MK +: m / z 585 and MNa +: m / z 569) demonstrated characterizes the Pst10 strain as an eryC mutant.

La séquence eryCVI présente une forte homologie avec d'autres méthyltransférases telles que SnoX impliquée dans la biosynthèse de la nogalamycine chez S. nogalater (numéro d'accession EMBL S52403) (55,5 % d'identité au niveau protéique), TylM1 impliquée dans la biosynthèse de la tylosine chez S. fradiae (numéro d'accession EMBL X81885) (65 % d'identité au niveau protéique) et SrmX impliquée dans la biosynthèse de la spiramycine chez S. ambofaciens (numéro  The eryCVI sequence has strong homology with other methyltransferases such as SnoX involved in the biosynthesis of nogalamycin in S. nogalater (accession number EMBL S52403) (55.5% identity at the protein level), TylM1 involved in the biosynthesis of tylosin in S. fradiae (accession number EMBL X81885) (65% identity at the protein level) and SrmX involved in the biosynthesis of spiramycin in S. ambofaciens (number

<Desc/Clms Page number 48><Desc / Clms Page number 48>

d'accession EMBL S25204) (52,8 % d'identité au niveau protéique).  EMBL S25204) (52.8% protein identity).

Ces observations indiquent que le gène eryCVI code pour la dTDP-D-6-désoxyhexose 3-N-méthyltransférase impliquée dans la voie de biosynthèse de la dTDP-D-désosamine.  These observations indicate that the eryCVI gene encodes the dTDP-D-6-deoxyhexose 3-N-methyltransferase involved in the biosynthesis pathway of dTDP-D-desosamine.

EXEMPLE 21 : construction d'un plasmide pBViA (pXhoI). EXAMPLE 21: Construction of a plasmid pBViA (pXhoI).

Un plasmide d'intégration, dénommé pXhoI et portant une délétion dans le gène eryBVI codant pour l'ORF16, a été construit selon le schéma de la figure 12A de la façon suivante :
Le fragment NcoI-XhoI (3,1 kb) du plasmide pNC062 obtenu à l'exemple 11 et contenant les nucléotides 47142 à 50254 de la séquence de la figure 3 a été sous-cloné dans les sites Ncol et Xhol du plasmide Litmus 28. Le plasmide pNC062X (figure 5B) ainsi généré a été digéré avec l'enzyme de restriction PstI puis traité avec l'ADN polymérase T4 (Boehringer Mannheim). Après religature et transformation dans E. coli XL1-Blue, la perte du site PstI au nucléotide 47397 de la séquence de la figure 3 a été confirmée par séquençage et une délétion de 60 pb du nucléotide 47337 au nucléotide 47397 de la séquence de la figure 3 ont été observés. Le plasmide pIJ702 digéré avec l'enzyme de restriction BglII a été ensuite ligaturé au site BglII de cette contruction. L'orientation de pIJ702 dans la construction a été confirmée par la présence d'un fragment d'ADN ayant 4,3 kb après digestion avec l'enzyme de restriction Xhol. Le plasmide d'intégration pXhoI (figure 12B) ainsi obtenu a été utilisé pour transformer Sac. erythraea.
An integration plasmid, called pXhoI and carrying a deletion in the eryBVI gene coding for ORF16, was constructed according to the diagram of FIG. 12A as follows:
The NcoI-XhoI fragment (3.1 kb) of the plasmid pNC062 obtained in Example 11 and containing the nucleotides 47142 to 50254 of the sequence of FIG. 3 was subcloned in the Ncol and Xhol sites of the plasmid Litmus 28. The plasmid pNC062X (FIG. 5B) thus generated was digested with the restriction enzyme PstI and then treated with DNA polymerase T4 (Boehringer Mannheim). After religion and transformation in E. coli XL1-Blue, the loss of the PstI site at nucleotide 47397 of the sequence of FIG. 3 was confirmed by sequencing and a deletion of 60 bp from nucleotide 47337 to nucleotide 47397 of the sequence of FIG. 3 have been observed. The plasmid pIJ702 digested with the restriction enzyme BglII was then ligated to the BglII site of this contruction. The orientation of pIJ702 in the construction was confirmed by the presence of a DNA fragment having 4.3 kb after digestion with the restriction enzyme Xhol. The integration plasmid pXhoI (FIG. 12B) thus obtained was used to transform Sac. erythraea.

EXEMPLE 22 : construction d'une souche Sac. erythraea eryBVI# (Xho91). EXAMPLE 22: construction of a Sac strain. erythraea eryBVI # (Xho91).

Une souche dans laquelle le gène eryBVI porte une délétion interne telle que celle introduite dans le plasmide pXhoI obtenu à l'exemple 21 a été préparée par transformation des protoplastes de Sac. erythraea avec le plasmide pXhoI.  A strain in which the eryBVI gene carries an internal deletion such as that introduced into the plasmid pXhoI obtained in Example 21 was prepared by transformation of the sac protoplasts. erythraea with the plasmid pXhoI.

La préparation des protoplastes et le processus d'intégration ont été réalisés comme à l'exemple 3.  The protoplast preparation and the integration process were carried out as in Example 3.

La sélection et l'analyse des mutants ayant le phénotype ery- a été réalisée selon les conditions décrites à l'exemple  The selection and analysis of the mutants having the ery- phenotype was carried out according to the conditions described in the example.

<Desc/Clms Page number 49><Desc / Clms Page number 49>

19.  19.

L'intégration dans le chromosome et la présence de la délétion attendue ont été confirmées par analyse de Southern selon les méthodes générales décrites à l'exemple 19.  Integration into the chromosome and the presence of the expected deletion were confirmed by Southern analysis according to the general methods described in Example 19.

Après la transformation des protoplastes avec le plasmide pXhoI et la sélection des colonies résistantes au thiostrepton, l'intégration dans le chromosome a été confirmée par analyse de Southern. En utilisant comme sonde le fragment PstI de 3,3 kb du plasmide pNC062, l'ADN chromosomique d'un intégrant préalablement digéré avec les enzymes de restriction PstI et BglII a montré les bandes 3 kb et 6 kb attendues.  After the transformation of the protoplasts with the plasmid pXhoI and the selection of the thiostrepton-resistant colonies, integration into the chromosome was confirmed by Southern analysis. Using the 3.3 kb PstI fragment of the plasmid pNC062 as probe, the chromosomal DNA of an integrant previously digested with the restriction enzymes PstI and BglII showed the expected 3 kb and 6 kb bands.

Après cultures répétées des intégrants, les colonies individualisées obtenues ont été analysées pour la sensibilité au thiostrepton et la production d'érythromycine, puis l'intégration de la délétion attendue (délétion de 60 pb du nucléotide 47338 au nucléotide 47397 de la séquence de la figure 3) dans le chromosome d'un clone mutant ayant le phénotype ery- (XhoI) a été confirmée par analyse de Southern. L'ADN chromosomique, isolé respectivement à partir de la souche sauvage et du mutant XhoI, a été digéré avec l'enzyme de restriction PstI. L'hybridation avec la sonde PstI-NcoI de 0,8 kb (nucléotides 46368 à 47142 de la séquence de la figure 3) a donné le profil attendu avec une bande PstI de 1 kb correspondant aux nucléotides 46368 à 47397 de la séquence de la figure 3 à partir de la souche sauvage et avec une bande de 4 kb à partir du mutant indiquant que le site PstI à la position 47397 ci-dessus a été perdu.  After repeated cultures of the integrants, the individualized colonies obtained were analyzed for sensitivity to thiostrepton and the production of erythromycin, then the integration of the expected deletion (deletion of 60 bp from nucleotide 47338 to nucleotide 47397 of the sequence of the figure 3) in the chromosome of a mutant clone having the ery- phenotype (XhoI) was confirmed by Southern analysis. The chromosomal DNA, isolated respectively from the wild-type strain and from the XhoI mutant, was digested with the restriction enzyme PstI. Hybridization with the 0.8 kb PstI-NcoI probe (nucleotides 46368 to 47142 of the sequence of FIG. 3) gave the expected profile with a PstI band of 1 kb corresponding to nucleotides 46368 to 47397 of the sequence of the Figure 3 from the wild strain and with a 4 kb band from the mutant indicating that the PstI site at position 47397 above has been lost.

La perte du site PstI à la position 47397 a aussi été confirmée par PCR. L'ADN chromosomique a été soumis à une amplification par PCR en utilisant les amorces correspondant respectivement à la séquence du nucléotide 47300 au nucléotide 57320 et à la séquence du nucléotide 47661 au nucléotide 47636 de la séquence d la figure 3. Un fragment attendu de 306 pb a été ainsi amplifié à partir de la souche sauvage générant après digestion avec l'enzyme de restriction PstI deux bandes d'environ 100 et 300 pb. A partir du mutant Xho91, un fragment de 300 pb a été amplifié, résultant de la  The loss of the PstI site at position 47397 was also confirmed by PCR. The chromosomal DNA was subjected to an amplification by PCR using the primers corresponding respectively to the sequence of nucleotide 47300 to nucleotide 57320 and to the sequence of nucleotide 47661 to nucleotide 47636 of the sequence of FIG. 3. An expected fragment of 306 bp was thus amplified from the wild strain generating after digestion with the restriction enzyme PstI two bands of approximately 100 and 300 bp. From the mutant Xho91, a 300 bp fragment was amplified, resulting from the

<Desc/Clms Page number 50><Desc / Clms Page number 50>

délétion de 60 pb. Ce fragment a été ensuite isolé et a été trouvé résistant à la digestion par l'enzyme PstI.  60 bp deletion. This fragment was then isolated and found to be resistant to digestion with the PstI enzyme.

La souche recombinante ainsi obtenue et désignée Xho91, a ensuite été cultivée pour identifier les métabolites produits.  The recombinant strain thus obtained and designated Xho91, was then cultured to identify the metabolites produced.

EXEMPLE 23 : fermentation de la souche Xho91 et identification des métabolites secondaires produits. EXAMPLE 23 Fermentation of the Xho91 strain and identification of the secondary metabolites produced.

La culture de la souche Xho91 et l'analyse du surnageant de culture par spectrométrie de masse ont été réalisées selon les conditions décrites à l'exemple 20.  The culture of the Xho91 strain and the analysis of the culture supernatant by mass spectrometry were carried out according to the conditions described in Example 20.

La production d'érythomycine A (m/z 734 et m/z 716) n'a pas été observée mais la présence d'une quantité majoritaire d'érythronolide B (MK+ : m/z 441 ; MNa+ : m/z 425 ; M-H20 H+ : m/z 385) ainsi que la présence de désosaminyl érythronolide B (m/z 560) mises en évidence caractérisent la souche PstlO comme un mutant eryB.  The production of erythomycin A (m / z 734 and m / z 716) was not observed but the presence of a majority amount of erythronolide B (MK +: m / z 441; MNa +: m / z 425; M-H20 H +: m / z 385) as well as the presence of desosaminyl erythronolide B (m / z 560) demonstrated characterize the Pst10 strain as an eryB mutant.

Les résultats de spéctrométrie de masse ont été confirmés par spectrométrie de masse en haute résolution sur un spectromètre Brucker FT-ICR (Brucker, FRG).  The mass spectrometry results were confirmed by high resolution mass spectrometry on a Brucker FT-ICR spectrometer (Brucker, FRG).

La séquence eryBVI présente une forte homologie avec DnmT impliquée dans la biosynthèse de la daunorubicine chez S. peucetius (numéro d'accession EMBL U77891) (43,9 % d'identité au niveau protéique).  The eryBVI sequence has a strong homology with DnmT involved in the biosynthesis of daunorubicin in S. peucetius (accession number EMBL U77891) (43.9% identity at the protein level).

Ces observations indiquent que le gène eryBVI code pour la dTDP-4-céto-L-6-désoxyhexose 2,3-déshydratase impliquée dans la biosynthèse du dTDP-mycarose, comme suggéré par Scotti et Hutchinson, 1996.  These observations indicate that the eryBVI gene codes for dTDP-4-keto-L-6-deoxyhexose 2,3-dehydratase involved in the biosynthesis of dTDP-mycarose, as suggested by Scotti and Hutchinson, 1996.

EXEMPLE 24 : du plasmide pCIV#.  EXAMPLE 24 Plasmid pCIV #

Un plasmide d'intégration, dénommé pCIVA et portant une délétion dans le gène eryCIV codant pour l'ORF17, a été construit selon le schéma de la figure 13A de la façon suivante :
Le plasmide pNC062 obtenu à l'exemple 11 a été digéré à l'aide des enzymes de restriction BalI et BclI de façon à éliminer un fragment ayant 949 pb à l'intérieur de l'ORF17 du nucléotide 48650 au nucléotide 49598 de la séquence de la figure 3. Après remplissage des extrémités à l'aide du fragment de Klenow de l'ADN polymérase I, le plasmide a été
An integration plasmid, called pCIVA and carrying a deletion in the eryCIV gene coding for ORF17, was constructed according to the diagram of FIG. 13A as follows:
The plasmid pNC062 obtained in Example 11 was digested using the restriction enzymes BalI and BclI so as to eliminate a fragment having 949 bp inside the ORF17 of nucleotide 48650 to nucleotide 49598 of the sequence Figure 3. After filling the ends with the Klenow fragment of DNA polymerase I, the plasmid was

<Desc/Clms Page number 51><Desc / Clms Page number 51>

religaturé et transformé dans E. coli XLl-blue. A partir du plasmide pBCB17 ainsi généré, le fragment de 2,68 kb portant la délétion a été isolé par digestion à l'aide des enzymes
XbaI et SphI, puis sous-cloné dans les sites correspondant du
5 plasmide pUWL218. La présence de la délétion de 949 pb du nucléotide 48650 au nucléotide 49598 de la séquence de la figure 3 a été confirmée par séquençage. Le plasmide d'intégration pCIVA ainsi obtenu (figure 13B) a ensuite été transféré dans la souche E. coli DH5aMRC, puis utilisé pour 10 transformer Sac. erythraea.
religated and transformed in E. coli XLl-blue. From the plasmid pBCB17 thus generated, the 2.68 kb fragment carrying the deletion was isolated by digestion using enzymes
XbaI and SphI, then subcloned in the corresponding sites of the
5 plasmid pUWL218. The presence of the 949 bp deletion from nucleotide 48650 to nucleotide 49598 of the sequence of Figure 3 was confirmed by sequencing. The integration plasmid pCIVA thus obtained (FIG. 13B) was then transferred to the E. coli strain DH5aMRC, then used to transform Sac. erythraea.

EXEMPLE 25 : construction d'une souche Sac. erythraea eryCIVA (CIV89).  EXAMPLE 25: Construction of a Sac strain. erythraea eryCIVA (CIV89).

Une souche, dans laquelle le gène eryCIV porte une délétion interne telle que celle introduite dans le plasmide 15 pCIVA obtenu à l'exemple 24, a été préparée par transforma- tion des protoplastes de Sac. erythraea avec le plasmide pCIVA.  A strain, in which the eryCIV gene carries an internal deletion such as that introduced into the plasmid pCIVA obtained in Example 24, was prepared by transformation of the sac protoplasts. erythraea with the plasmid pCIVA.

La préparation des protoplastes, le processus d'intégration et la sélection des mutants ayant le phénotype 20 ery- ont été réalisés comme à l'exemple 3.  The preparation of the protoplasts, the integration process and the selection of the mutants having the ery- phenotype were carried out as in Example 3.

De plus, la présence de la délétion attendue dans le chromosome (délétion de 949 bp du nucléotide 48650 au nucléotide 49598 de la séquence de la figure 3 a été confirmée par analyse génomique par Southern blot ainsi que 25 par PCR selon les conditions décrites à l'exemple 3.  In addition, the presence of the expected deletion in the chromosome (deletion of 949 bp from nucleotide 48650 to nucleotide 49598 of the sequence of FIG. 3 was confirmed by genomic analysis by Southern blot as well as by PCR according to the conditions described in l 'example 3.

Par hybridation Southern sur l'ADN génomique digéré par l'enzyme de restriction NcoI, en utilisant comme sonde l'oligonucléotide ayant la séquence suivante :
C4-R AGCGGCTTGATCGTGTTGGACCAGTAC (SEQ ID N 53) 30 correspondant au brin complémentaire de la région d'ADN située de la position 49996 à la position 50022 de la séquence de la figure 3, une bande de 6,2 kb à partir de la souche sauvage et une bande de 5,2 kb à partir du mutant
CIV89 ont été détectées. Les résultats montrés à la figure 15 35 indiquent la présence dans le mutant d'une délétion d'environ
1 kb dans cette région du chromosome.
By Southern hybridization on the genomic DNA digested with the restriction enzyme NcoI, using as oligonucleotide probe having the following sequence:
C4-R AGCGGCTTGATCGTGTTGGACCAGTAC (SEQ ID N 53) corresponding to the complementary strand of the DNA region located from position 49996 to position 50022 of the sequence of Figure 3, a 6.2 kb band from the strain wild and 5.2 kb band from mutant
CIV89 have been detected. The results shown in Figure 15 indicate the presence in the mutant of a deletion of approximately
1 kb in this region of the chromosome.

L'amplification par PCR a été effectuée en utilisant l'oligonucléotide ayant la séquence suivante :  The PCR amplification was carried out using the oligonucleotide having the following sequence:

<Desc/Clms Page number 52><Desc / Clms Page number 52>

C4-S GGCCTATGTGGACTACGTGTTGAACGT (SEQ ID N 54) correspondant à la région d'ADN située de la position 48169 à la position 48195 de la séquence de la figure 3 et l'oligonucléotide C4-R ayant la séquence indiquée ci-dessus, permettant d'encadrer par amplification PCR la région portant la délétion interne à l'ORF17. L'analyse par amplification par PCR a permis de détecter une bande de 1,8 kb dans la souche sauvage et une bande de 900 pb dans le mutant CIV89 de façon identique au signal obtenu avec le plasmide pCIVA. Les résultats montrés à la figure 16 confirment que la délétion d'environ 900 pb détectée par l'analyse Southern est identique à celle portée par le plasmide pCIV# (949 pb).  C4-S GGCCTATGTGGACTACGTGTTGAACGT (SEQ ID N 54) corresponding to the DNA region located from position 48169 to position 48195 of the sequence of Figure 3 and the oligonucleotide C4-R having the sequence indicated above, allowing d '' frame by PCR amplification the region carrying the internal deletion at ORF17. Analysis by PCR amplification made it possible to detect a 1.8 kb band in the wild strain and a 900 bp band in the mutant CIV89 in an identical manner to the signal obtained with the plasmid pCIVA. The results shown in FIG. 16 confirm that the deletion of approximately 900 bp detected by the Southern analysis is identical to that carried by the plasmid pCIV # (949 bp).

La souche recombinante ainsi obtenue, désignée CIV89, a été ensuite cultivée pour identifier les métabolites produits par la souche.  The recombinant strain thus obtained, designated CIV89, was then cultured to identify the metabolites produced by the strain.

EXEMPLE 26 : fermentation de la souche CIV89 et identification des métabolites secondaires produits. EXAMPLE 26 Fermentation of the CIV89 strain and identification of the secondary metabolites produced.

La culture de la souche CIV89 et les analyses par ccm ont été réalisées selon les conditions indiquées à l'exemple 4.  The culture of the CIV89 strain and the analyzes by cmc were carried out according to the conditions indicated in Example 4.

Les résultats de ccm (figure 17) montrent que la souche CIV89 accumule préférentiellement du 3-a-mycarosyl érythronolide B ainsi que de l'érythronolide B comme attendu d'un mutant eryC.  The ccm results (FIG. 17) show that the CIV89 strain preferentially accumulates 3-a-mycarosyl erythronolide B as well as erythronolide B as expected from an eryC mutant.

Des métabolites mineurs de faibles mobilités ont été également détectés, puis extraits et analysés par RP-HPLC couplée à la spectrométrie de masse selon les conditions utilisées à l'exemple 4.  Minor metabolites of low mobility were also detected, then extracted and analyzed by RP-HPLC coupled to mass spectrometry according to the conditions used in Example 4.

Un métabolite mineur donne un pic parent à m/z 720 et des produits de déshydration et de fragmentation à m/z 702, m/z 576 et m/z 174. Le pic 174 peut correspondre à la 4-hydroxydésosamine et le pic 576 au 4'-hydroxydésosaminyl érythronolide B.  A minor metabolite gives a parent peak at m / z 720 and dehydration and fragmentation products at m / z 702, m / z 576 and m / z 174. Peak 174 may correspond to 4-hydroxydososamine and peak 576 4'-hydroxydesosaminyl erythronolide B.

Ces résultats suggèrent que la différence de m/z de 16 comparée à l'érythromycine D (pic parent m/z 704) est portée par le sucre aminé. La structure proposée pour ce métabolite est la 4'-hydroxy érythromycine D.  These results suggest that the difference in m / z of 16 compared to erythromycin D (parent peak m / z 704) is carried by the amino sugar. The proposed structure for this metabolite is 4'-hydroxy erythromycin D.

Ces observations indiquent que l'enzyme est impliquée  These observations indicate that the enzyme is involved

<Desc/Clms Page number 53><Desc / Clms Page number 53>

dans le retrait du groupement hydroxyle dans la voie de biosynthèse de l'érythromycine et que le gène eryCIV code pour la dTDP-6-désoxyhexose 3,4-déshydratase.  in the withdrawal of the hydroxyl group in the biosynthetic pathway of erythromycin and that the eryCIV gene codes for dTDP-6-deoxyhexose 3,4-dehydratase.

La souche CIV89 a été déposée à la CNCM le 16 juillet 1997 sous le numéro 1-1905.  The CIV89 strain was deposited at the CNCM on July 16, 1997 under the number 1-1905.

EXEMPLE 27 : construction du plasmide pCV# . EXAMPLE 27 Construction of the plasmid pCV #.

Un plasmide d'intégration, dénommé pCVA et portant une délétion dans le gène eryCV codant pour l'ORF18, a été construit selon le schéma de la figure 14A de la façon suivante :
Le fragment BalI-BamHI (3,48 kb), obtenu à partir du plasmide pNC062 préparé à l'exemple 11 par digestion avec les enzymes de restriction BalI et BamHI, a été sous-cloné dans les sites SmaI-BamHI du vecteur pUC19. Du plasmide résultant pBAB18 (figure 5B), le fragment interne ScaI (lkb) a été ensuite délété par digestion avec l'enzyme ScaI pour générer une délétion de 1044 pb du nucléotide 49998 au nucléotide 51041 de la séquence de la figure 3 dans l'ORF18. Du plasmide pBABACV ainsi obtenu, le fragment portant la délétion a ensuite été réisolé à partir du polylinker de pUC19 par digestion avec les enzymes de restriction HindIII et EcoRI, puis sous-cloné dans le plasmide pUWL218. Le plasmide d'intégration pCVA ainsi obtenu (figure 14B) a été transféré dans la souche E. coli DH5aMRC, puis utilisé pour transformer Sac. erythraea.
An integration plasmid, called pCVA and carrying a deletion in the eryCV gene coding for ORF18, was constructed according to the diagram of FIG. 14A as follows:
The BalI-BamHI fragment (3.48 kb), obtained from the plasmid pNC062 prepared in Example 11 by digestion with the restriction enzymes BalI and BamHI, was subcloned into the SmaI-BamHI sites of the vector pUC19. From the resulting plasmid pBAB18 (Figure 5B), the internal ScaI fragment (lkb) was then deleted by digestion with the enzyme ScaI to generate a 1044 bp deletion from nucleotide 49998 to nucleotide 51041 of the sequence of Figure 3 in the ORF18. From the plasmid pBABACV thus obtained, the fragment carrying the deletion was then re-isolated from the polylinker of pUC19 by digestion with the restriction enzymes HindIII and EcoRI, then subcloned in the plasmid pUWL218. The integration plasmid pCVA thus obtained (FIG. 14B) was transferred into the E. coli DH5aMRC strain, then used to transform Sac. erythraea.

EXEMPLE 28 : construction d'une souche Sac. erythraea eryCVA (CV90). EXAMPLE 28: construction of a Sac strain. erythraea eryCVA (CV90).

Une souche dans laquelle le gène eryCV porte une délétion interne telle que celle introduite dans le plasmide pCVA obtenu à l'exemple 27 a été préparée par transformation des protoplastes de Sac. erythraea avec le plasmide pCVA.  A strain in which the eryCV gene carries an internal deletion such as that introduced into the plasmid pCVA obtained in Example 27 was prepared by transformation of the sac protoplasts. erythraea with the plasmid pCVA.

La préparation des protoplastes, le processus d'intégration et la sélection des mutants ayant le phénotype ery- ont été réalisés comme à l'exemple 3.  The preparation of the protoplasts, the integration process and the selection of the mutants having the ery- phenotype were carried out as in Example 3.

De plus, la présence de la délétion attendue dans le chromosome (délétion de 1044 pb du nucléotide 49998 au nucléotide 51041) a été confirmée par analyse génomique par Southern blot ainsi que par PCR selon les conditions décrites  In addition, the presence of the expected deletion in the chromosome (1044 bp deletion from nucleotide 49998 to nucleotide 51041) was confirmed by genomic analysis by Southern blot as well as by PCR according to the conditions described.

<Desc/Clms Page number 54><Desc / Clms Page number 54>

à l'exemple 3.  in Example 3.

Par hybridation Southern sur l'ADN génomique digéré par l'enzyme de restriction NcoI, en utilisant comme sonde l'oligonucléotide ayant la séquence suivante : C5-R AACGCCTCGTCCTGCAGCGGAGACACGAACA (SEQ ID N 55) correspondant au brin complémentaire de la région d'ADN située de la position 51229 à la position 51259 de la séquence de la figure 3, une bande de 6,2 kb à partir de la souche sauvage et une bande de 5,1 kb à partir du mutant CV90 ont été détectées. Les résultats montrés à la figure 15 indiquent chez le mutant la présence d'une délétion d'environ 1,1 kb dans cette région du chromosome.  By Southern hybridization on the genomic DNA digested by the restriction enzyme NcoI, using as oligonucleotide probe having the following sequence: C5-R AACGCCTCGTCCTGCAGCGGAGACACGAACA (SEQ ID N 55) corresponding to the complementary strand of the DNA region located from position 51229 to position 51259 of the sequence of Figure 3, a 6.2 kb band from the wild strain and a 5.1 kb band from the CV90 mutant were detected. The results shown in FIG. 15 indicate in the mutant the presence of a deletion of approximately 1.1 kb in this region of the chromosome.

L'amplification par PCR a été effectuée en utilisant l'oligonucléotide ayant la séquence suivante : C5-S TTCGCTCCCCGATGAACACAACTCGTA (SEQ ID N 56) correspondant à la région d'ADN située de la position 49668 à la position 49694 de la séquence de la figure 3 et l'oligonucléotide C5-R ayant la séquence indiquée ci-dessus, permettant d'encadrer par amplification PCR la région portant la délétion interne à l'ORF18. L'analyse par amplification par PCR a permis de détecter une bande d'environ 1,6 kb dans la souche sauvage et une bande d'environ 500 pb dans le mutant CV90 de façon identique au signal obtenu avec le plasmide pCV#. Les résultats montrés à la figure 16 confirment que la délétion d'environ 1,1 kb détectée par l'analyse Southern est identique à celle portée par le plasmide PCVA (1044 pb).  The PCR amplification was carried out using the oligonucleotide having the following sequence: C5-S TTCGCTCCCCGATGAACACAACTCGTA (SEQ ID N 56) corresponding to the DNA region located at position 49668 at position 49694 in the sequence of the figure 3 and the oligonucleotide C5-R having the sequence indicated above, making it possible to frame by PCR amplification the region carrying the deletion internal to the ORF18. Analysis by PCR amplification made it possible to detect a band of approximately 1.6 kb in the wild-type strain and a band of approximately 500 bp in the CV90 mutant in an identical manner to the signal obtained with the plasmid pCV #. The results shown in FIG. 16 confirm that the deletion of approximately 1.1 kb detected by the Southern analysis is identical to that carried by the plasmid PCVA (1044 bp).

La souche recombinante ainsi obtenue, désignée CV90, a été ensuite cultivée pour identifier les métabolites produits par la souche.  The recombinant strain thus obtained, designated CV90, was then cultured to identify the metabolites produced by the strain.

EXEMPLE 29 : fermentation de la souche CV90 et identification des métabolites secondaires produits. EXAMPLE 29 Fermentation of the CV90 strain and identification of the secondary metabolites produced.

La culture de la souche CV90 et les analyses par ccm ont été réalisées selon les conditions indiquées à l'exemple 4.  The culture of the CV90 strain and the ccm analyzes were carried out according to the conditions indicated in Example 4.

Les résultats de ccm (figure 17) montre que la souche CV90 accumule préférentiellement du 3-a-mycarosyl érythronolide B ainsi que de l'érythronolide B comme attendu d'un mutant eryC.  The results of ccm (FIG. 17) show that the CV90 strain preferentially accumulates 3-a-mycarosyl erythronolide B as well as erythronolide B as expected from an eryC mutant.

<Desc/Clms Page number 55> <Desc / Clms Page number 55>

La séquence des résidus 38-50 (VTGAGDGDADVQA) Val Thr Gly Ala Gly Asp Gly Asp Ala Asp Val Gln Ala (SEQ ID N 61) de la protéine codée par eryCV (séquence de SEQ ID N 11) est proche de la séquence consensus de liaison au NAD+ décrit par Wierenga et al., 1985 et par Scrutton et al., 1990.  The sequence of residues 38-50 (VTGAGDGDADVQA) Val Thr Gly Ala Gly Asp Gly Asp Ala Asp Val Gln Ala (SEQ ID N 61) of the protein coded by eryCV (sequence of SEQ ID N 11) is close to the consensus sequence of binding to NAD + described by Wierenga et al., 1985 and by Scrutton et al., 1990.

Ces observations permettent de conclure que le gène eryCV code pour une réductase qui interviendrait comme une dTDP-4,6-désoxyhexose 3,4-réductase dans la voie de biosynthèse de la d-TDP-désosamine.  These observations make it possible to conclude that the eryCV gene codes for a reductase which would intervene as a dTDP-4,6-deoxyhexose 3,4-reductase in the biosynthetic pathway of d-TDP-desosamine.

EXEMPLE 30 : surexpression du produit du gène eryCIII dans E. coli. EXAMPLE 30 Overexpression of the eryCIII gene product in E. coli.

L'expression hétérologue du produit du gène eryCIII de Sac. erythraea correspondant à l'ORF8 décrite à l'exemple 1 et codant pour l'activité désosaminyltransférase identifiée à l'exemple 7 a été réalisée en utilisant E. coli comme souche hôte. La protéine ainsi produite sous forme de corps d'inclusion a été ensuite purifiée et son activité enzymatique déterminée in vitro.  The heterologous expression of the Sac eryCIII gene product. erythraea corresponding to ORF8 described in Example 1 and coding for the deosaminyltransferase activity identified in Example 7 was carried out using E. coli as host strain. The protein thus produced in the form of inclusion bodies was then purified and its enzymatic activity determined in vitro.

1) Expression de la protéine EryCIII dans E. coli
L'expression a été réalisée en utilisant le vecteur pETlla (Stratagène) pour le clonage et l'expression de protéines recombinantes dans E. coli sous le contrôle du promoteur de l'ARN polymérase du bactériophage T7.
1) Expression of the EryCIII protein in E. coli
Expression was carried out using the vector pET11a (Stratagene) for the cloning and expression of recombinant proteins in E. coli under the control of the promoter of the RNA polymerase of bacteriophage T7.

Dans un premier temps, le gène eryCIII a été amplifié à partir du plasmide pK62 décrit à l'exemple 1 de la façon suivante :
L'amplification par PCR a été effectuée en utilisant la polymérase Native Pfu (Stratagène) et comme amorces l'oligonucléotide A homologue au brin codant du gène eryCIII ayant la séquence A GAAGGAGATATACATATGCGCGTCGTCTTCTCCTC (SEQ ID N 57) permettant d'introduire un site NdeI en amont de l'ATG initiateur de eryCIII et l'oligonucléotide B homologue au brin complémentaire du gène eryCIII ayant la séquence B CGGGATCCTCATCGTGGTTCTCTCCTTCCTGC (SEQ ID N 58) permettant d'introduire un site BamHI en aval du codon stop du gène eryCIII.
First, the eryCIII gene was amplified from the plasmid pK62 described in Example 1 as follows:
The PCR amplification was carried out using the native Pfu polymerase (Stratagene) and as primers the oligonucleotide A homologous to the strand coding for the eryCIII gene having the sequence A GAAGGAGATATACATATGCGCGTCGTCTTCTCCTC (SEQ ID N 57) making it possible to introduce an NdeI site upstream of the ATG initiator of eryCIII and the oligonucleotide B homologous to the complementary strand of the eryCIII gene having the sequence B CGGGATCCTCATCGTGGTTCTCTCCTTCCTGC (SEQ ID N 58) allowing the introduction of a BamHI site downstream of the stop codon of the eryCIII gene.

<Desc/Clms Page number 56> <Desc / Clms Page number 56>

L'ADN amplifié a été ensuite digéré par les enzymes de restriction NdeI et BamHI, puis -le fragment NdeI-BamHI de 1,2 kb obtenu contenant la totalité du gène eryCIII a été ligaturé dans le vecteur d'expression pET11a (Stratagène) qui contient le gène ss-lactamase de résistance à l'ampicilline, l'origine de réplication ColEl et le promoteur du gène de l'ARN polymérase T7 situé en amont du site de clonage NdeI, préalablement digéré avec les enzymes de restriction NdeI et BamHI. Après ligation et transformation dans E. coli XL1- blue, le plasmide pCEIII ainsi obtenu a été confirmé par carte de restriction et séquençage.  The amplified DNA was then digested with the restriction enzymes NdeI and BamHI, then the obtained 1.2 kb NdeI-BamHI fragment containing the entire eryCIII gene was ligated into the expression vector pET11a (Stratagene) which contains the ampicillin resistance ss-lactamase gene, the origin of ColEl replication and the promoter of the T7 RNA polymerase gene located upstream of the NdeI cloning site, previously digested with the restriction enzymes NdeI and BamHI. After ligation and transformation in E. coli XL1-blue, the plasmid pCEIII thus obtained was confirmed by restriction map and sequencing.

La souche d'E. coli BL21 (DE3) de la trousse pET (Stratagène) qui contient dans son ADN chromosomique le gène lacIq et le promoteur 2acUV5 en amont du gène de l'ARN polymérase T7, a ensuite été transformée par le plasmide pECIII.5.  The strain of E. coli BL21 (DE3) of the pET kit (Stratagene) which contains in its chromosomal DNA the lacIq gene and the 2acUV5 promoter upstream of the T7 RNA polymerase gene, was then transformed by the plasmid pECIII.5.

La souche transformée obtenue, dénommée BL21/pECIII, a été cultivée en erlen de 50 ml à 37 C en milieu LB ensemencé à DO600=0,1 à partir d'une préculture, puis induite par l'isopropyl-ss-D-thiogalactopyranoside (IPTG) lmM à D0600=1.  The transformed strain obtained, called BL21 / pECIII, was cultured in a 50 ml Erlenmeyer flask at 37 ° C. in LB medium seeded at DO600 = 0.1 from a preculture, then induced by isopropyl-ss-D-thiogalactopyranoside (IPTG) lmM at D0600 = 1.

Après 3 h 30 d'induction, 1 ml de culture a été prélevé et centrifugé, puis le culot bactérien obtenu a été dissout dans 240 fil d'eau et 120 /il de tampon d'échantillon SDS 3X (Tris- HC1 1M pH = 6,8 : 1,9 ml ; 3 ml ; -mercaptoéthanol 1,5 ml ; 20 % , 3 ml ; de bromophénol 1 % pH = 7 : 0,3 ml ; H20 qsq 10 ml). A partir de 15 /il de la solution obtenue, les protéines totales extraites ont été analysées par SDS-PAGE sur un gel à 10 % de polyacrylamide avec une coloration au bleu de Comassie. After 3 h 30 of induction, 1 ml of culture was removed and centrifuged, then the bacterial pellet obtained was dissolved in 240 μl of water and 120 μl of SDS 3X sample buffer (Tris- HC1 1M pH = 6.8: 1.9 ml; 3 ml; -mercaptoethanol 1.5 ml; 20%, 3 ml; bromophenol 1% pH = 7: 0.3 ml; H2O qsq 10 ml). From 15 µl of the solution obtained, the total proteins extracted were analyzed by SDS-PAGE on a 10% polyacrylamide gel with Comassie blue staining.

La surexpression d'une protéine ayant un poids moléculaire apparent d'environ 46 Kd correspondant au PM attendu pour la protéine EryCIII a été observée comparative- ment aux protéines totales d'une souche témoin transformée par le plasmide pETlla.  The overexpression of a protein having an apparent molecular weight of approximately 46 Kd corresponding to the expected PM for the protein EryCIII was observed compared to the total proteins of a control strain transformed by the plasmid pET11a.

2) Purification de la protéine EryCIII
La souche transformée BL21/pECIII ci-dessus a été cultivée en fermenteur de 6 litres en milieu minimum contenant du glycérol comme source de carbone (Korz et al.,
2) Purification of the EryCIII protein
The transformed strain BL21 / pECIII above was cultivated in a 6 liter fermenter in a minimum medium containing glycerol as a carbon source (Korz et al.,

<Desc/Clms Page number 57><Desc / Clms Page number 57>

1995) à 25 C jusqu'à D0600=12, puis induite par l'IPTG pendant 18 h jusqu'à D0600=54. A partir du bouillon récolté, le culot bactérien contenant des corps d'inclusion a été isolé par centrifugation à 5000 g pendant 30 mn.  1995) at 25 C until D0600 = 12, then induced by the IPTG for 18 h until D0600 = 54. From the broth collected, the bacterial pellet containing inclusion bodies was isolated by centrifugation at 5000 g for 30 min.

L'induction de la protéine EryCIII a été contrôlée par SDS-PAGE (gradient de polyacrylamide : à 20 %) et avec une coloration au bleu de Comassie après lyse sur un aliquot dans le tampon SDS 1 %, à 100 C pendant 5 min, soit directement sur le bouillon récolté, soit sur le culot bactérien après une première lyse par sonication dans un tampon phosphate.  The induction of the EryCIII protein was monitored by SDS-PAGE (polyacrylamide gradient: 20%) and with Comassie blue staining after lysis on an aliquot in the 1% SDS buffer, at 100 ° C. for 5 min, either directly on the broth harvested, or on the bacterial pellet after a first lysis by sonication in a phosphate buffer.

190 g de culot bactérien correspondant à 1 litre de bouillon récolté ont été remis en suspension dans 2,5 volumes de tampon KH2P04/K2HP04 20 mM pH 7,2 contenant de l'EDTA 2,5 mM et du DTT 2,5 mM. Les cellules ont été ensuite lysées en utilisant un appareil Rannie (Mini-Lab, type 8-30H, APV Homogenisers As, Denmark) avec trois passages sous une pression de 1000 bars. Après centrifugation à 46.000 g pendant 3 heures, le culot obtenu a été mis en suspension dans 2,5 volumes d'urée 2M puis centrifugé dans les mêmes conditions.  190 g of bacterial pellet corresponding to 1 liter of broth harvested were resuspended in 2.5 volumes of 20 mM KH2PO4 / K2HPO4 buffer pH 7.2 containing 2.5 mM EDTA and 2.5 mM DTT. The cells were then lysed using a Rannie device (Mini-Lab, type 8-30H, APV Homogenizers As, Denmark) with three passages under a pressure of 1000 bars. After centrifugation at 46,000 g for 3 hours, the pellet obtained was suspended in 2.5 volumes of 2M urea and then centrifuged under the same conditions.

Le culot ainsi lavé a été ensuite mis en suspension dans 2,5 volumes d'une solution d'urée 7M dans du tampon tris 50 mM pH 7,5 (tampon A) de façon à solubiliser la protéine EryCIII. Après centrifugation dans les mêmes conditions, le surnageant recueilli obtenu contient 2,1 g de protéines totales déterminées par la méthode de Bradford en utilisant une trousse du commerce (Pierce).  The pellet thus washed was then suspended in 2.5 volumes of a 7M urea solution in 50 mM tris buffer pH 7.5 (buffer A) so as to dissolve the EryCIII protein. After centrifugation under the same conditions, the collected supernatant obtained contains 2.1 g of total proteins determined by the Bradford method using a commercial kit (Pierce).

L'extrait dans l'urée 7M a été ensuite chargé à la vitesse de 0,5 mètres/h et à 4-8 C sur une colonne de 180 ml (5 cm x 9 cm) de Q sepharose (Pharmacia) préalablement équilibrée avec le tampon A ci-dessus et avec une détection à 280 nm. La protéine EryCIII a été ensuite éluée avec le tampon A contenant NaCl 0,3M. Les fractions réunies, contenant la protéine EryCIII, mise en évidence par SDS-PAGE (gradient de polyacrylamide : 10 à 20 %) révélée par coloration au bleu de Comassie et 835 mg de protéines totales, ont été ensuite chargées sur une colonne de 5,5 litres (10 cm x 70 cm) de Superdex 200 Prep grade (Pharmacia)  The extract in 7M urea was then loaded at the speed of 0.5 meters / h and at 4-8 C on a 180 ml column (5 cm x 9 cm) of Q sepharose (Pharmacia) previously equilibrated with buffer A above and with detection at 280 nm. The EryCIII protein was then eluted with buffer A containing 0.3M NaCl. The combined fractions, containing the EryCIII protein, demonstrated by SDS-PAGE (polyacrylamide gradient: 10 to 20%) revealed by staining with Comassie blue and 835 mg of total proteins, were then loaded onto a column of 5, 5 liters (10 cm x 70 cm) of Superdex 200 Prep grade (Pharmacia)

<Desc/Clms Page number 58><Desc / Clms Page number 58>

préalablement équilibrée avec le tampon A ci-dessus. Par élution de la colonne avec le tampon A et par détection à 280 nm, un pic de protéine a été obtenu dont les fractions contenant la protéine EryCIII mise en évidence par SDS-PAGE et 200 mg de protéines totales ont été réunies puis purifiées sur une colonne de 180 ml (5 cm x 9 cm) de Q Source (Pharmacia) préalablement équilibrée avec le tampon A. Par élution avec un gradient linéaire de NaCl variant de 0 à 0,3 M dans le tampon A, 30 ml de solution contenant 100 mg de protéine EryCIII dénaturée homogène en pureté évaluée par SDS-PAGE, avec une révélation au nitrate d'argent, ont été obtenus.  previously balanced with buffer A above. By elution from the column with buffer A and by detection at 280 nm, a protein peak was obtained, the fractions containing the EryCIII protein demonstrated by SDS-PAGE and 200 mg of total proteins were combined and then purified on a 180 ml (5 cm x 9 cm) column of Q Source (Pharmacia) previously equilibrated with buffer A. By elution with a linear gradient of NaCl varying from 0 to 0.3 M in buffer A, 30 ml of solution containing 100 mg of denatured EryCIII protein, homogeneous in purity evaluated by SDS-PAGE, with revelation with silver nitrate, were obtained.

La figure 18 montre l'évolution de la pureté de la protéine EryCIII suivie par SDS-PAGE (gradient de polyacrylamide : 10 à 15 %) pour un dépôt de 500 ng de protéines totales et une révélation au nitrate d'argent successivement après extraction à l'urée 7M (ligne 2), chromatographie Q sepharose (ligne 3), chromatographie Superdex (ligne 4), chromatographie Q source (ligne 6) par rapport aux marqueurs de poids moléculaire (lignes 1 et 5).  FIG. 18 shows the evolution of the purity of the EryCIII protein followed by SDS-PAGE (polyacrylamide gradient: 10 to 15%) for a deposit of 500 ng of total proteins and a revelation with silver nitrate successively after extraction at 7M urea (lane 2), Sepharose Q chromatography (lane 3), Superdex chromatography (lane 4), Q source chromatography (lane 6) compared to molecular weight markers (lanes 1 and 5).

La protéine EryCIII a été ensuite renaturée par dilution de l'éluat homogène avec une solution de tampon A contenant du DTT 10 mM pour obtenir une concentration finale en protéine de 0,1 mg/ml. La solution diluée a été ensuite dialysée contre du tampon Tris 50 mM ; 0,15 M ; % n-octyl--D-glucopyranosyl (NOG) ; DTT 10 mM, pH 8,3 puis concentrée à 4 mg/ml par ultrafiltration sur une membrane PLGC04310 (Millipore) ayant un seuil de coupure de 10.000.  The EryCIII protein was then renatured by diluting the homogeneous eluate with a solution of buffer A containing 10 mM DTT to obtain a final protein concentration of 0.1 mg / ml. The diluted solution was then dialyzed against 50 mM Tris buffer; 0.15 M; % n-octyl - D-glucopyranosyl (NOG); 10 mM DTT, pH 8.3 then concentrated to 4 mg / ml by ultrafiltration on a PLGC04310 membrane (Millipore) having a cutoff threshold of 10,000.

La protéine EryCIII purifiée a été ensuite conservée à l'état congelé à -20 C en aliquots de 500 /il.  The purified EryCIII protein was then stored frozen at -20 ° C. in aliquots of 500 μl.

3) Caractérisation de la protéine EryCIII
La caractérisation de la protéine EryCIII ainsi obtenue a été examinée pour les propriétés suivantes : a) Homogénéité.
3) Characterization of the EryCIII protein
The characterization of the protein EryCIII thus obtained was examined for the following properties: a) Homogeneity.

L'électrophorèse par SDS-PAGE (gradient de polyacrylamide : 10 à 15 %) en utilisant l'appareil Phast System (Pharmacia) et une révélation au nitrate d'argent montre une pureté supérieure à 99 % pour un dépôt de 2000 ng.  Electrophoresis by SDS-PAGE (polyacrylamide gradient: 10 to 15%) using the Phast System device (Pharmacia) and revelation with silver nitrate shows a purity greater than 99% for a deposit of 2000 ng.

<Desc/Clms Page number 59><Desc / Clms Page number 59>

b) Poids moléculaire par électrophorèse et spectrométrie de masse.  b) Molecular weight by electrophoresis and mass spectrometry.

Par électrophorèse, un PM apparent de 46 kDa a été déterminé en accord avec le PM calculé de 45929.  By electrophoresis, an apparent MW of 46 kDa was determined in agreement with the calculated MW of 45929.

L'analyse par RP-HPLC couplée à la spectrométrie de masse (HPLC : ESI-SM) donne une masse de 45934 uma. c) Séquence en acide aminés N-terminale
La séquence N-terminale a été déterminée par microséquençage sur un microséquenceur de protéine Model A492 couplé à un analyseur HPLC de PTH-aminoacides (Applied Biosystems).
Analysis by RP-HPLC coupled to mass spectrometry (HPLC: ESI-SM) gives a mass of 45,934 uma. c) N-terminal amino acid sequence
The N-terminal sequence was determined by microsequencing on a Model A492 protein microsequencer coupled to an HPLC analyzer of PTH-amino acids (Applied Biosystems).

Aucune séquence secondaire n'a été décelée pour les 10 premiers résidus qui est en accord avec la séquence en acides aminés décrite à la figure 2 (séquence de SEQ ID N 5) . d) Activité biologique
L'activité désosaminyl transférase de la protéine EryCIII a été déterminée in vitro par la mise en évidence de la formation d'érythromycine D à partir de dTDP-D-désosamine, dont la préparation est décrite plus loin et de 3-a-mycarosyl érythronolide B (MEB) dont la préparation est décrite cidessus dans Matériels et Méthodes générales.
No secondary sequence was detected for the first 10 residues which is in agreement with the amino acid sequence described in FIG. 2 (sequence of SEQ ID N 5). d) Biological activity
The desosaminyl transferase activity of the EryCIII protein was determined in vitro by demonstrating the formation of erythromycin D from dTDP-D-desosamine, the preparation of which is described below and from 3-a-mycarosyl erythronolide B (SEM), the preparation of which is described above in General Materials and Methods.

Le milieu de réaction contient 150 nmoles de dTDP-Ddésosamine, 137,4 nmoles de MEB et 1 mg de protéine EryCIII en utilisant les conditions opératoires suivantes :
Dans un tube en verre à vis, on introduit successivement 4,78 ml de tampon Tris 50 mM pH 7,3 (tampon B) ; 20 l de dTDP-D-désosamine, sel de triéthylamine (150 nmoles) en solution dans le tampon B contenant EDTA 1 mM et PEFABLOC 0, 4 mM (Merck) ; 100 /ni de MEB (137,4 nmoles) en solution dans le tampon B et 1 mg de protéine EryCIII correspondant à 250 /il d'un aliquot de solution congelée obtenue ci-dessus.
The reaction medium contains 150 nmol of dTDP-D deosamine, 137.4 nmol of SEM and 1 mg of EryCIII protein using the following operating conditions:
4.78 ml of 50 mM Tris buffer pH 7.3 (buffer B) are successively introduced into a screw glass tube; 20 l of dTDP-D-desosamine, triethylamine salt (150 nmol) in solution in buffer B containing 1 mM EDTA and 0.4 mM PEFABLOC (Merck); 100 µl of SEM (137.4 nmol) in solution in buffer B and 1 mg of EryCIII protein corresponding to 250 µl of an aliquot of frozen solution obtained above.

Après homogénisation au Vortex, le tube bouché est placé pendant 5 h dans un bain thermostaté à 30 C, puis on ajuste le pH à 9-10 avec NaOH 32 % puis extrait le mélange réactionnel 3 fois avec 5 ml d'acétate d'éthyle. L'extrait obtenu, amené à sec sous pression réduite, puis repris par 100 /il de chlorure de méthylène est ensuite analysé par ccm  After homogenization with Vortex, the stoppered tube is placed for 5 h in a bath thermostatically controlled at 30 C, then the pH is adjusted to 9-10 with 32% NaOH and then the reaction mixture is extracted 3 times with 5 ml of ethyl acetate . The extract obtained, brought to dryness under reduced pressure, then taken up in 100 μl of methylene chloride is then analyzed by ccm

<Desc/Clms Page number 60><Desc / Clms Page number 60>

dans les conditions indiquées à l'exemple 4 en utilisant comme éluant le mélange chlorure de méthylène/méthanol (90 : 10,v/v).  under the conditions indicated in Example 4 using as eluent the methylene chloride / methanol mixture (90: 10, v / v).

Un essai témoin (t = 0) dont l'incubation est arrêtée immmédiatement par l'ajout de NaOH, est effectué dans les mêmes conditions.  A control test (t = 0), the incubation of which is stopped immediately by the addition of NaOH, is carried out under the same conditions.

Les résultats obtenus par révélation chimique montrent l'apparition d'un produit moins mobile ayant un Rf voisin de l'érythromycine D attendue et pour lequel une faible activité antibiotique est détectée par autobiogramme direct des plaques sur B. pumilus. Aucune activité biologique n'est observée pour l'essai témoin (figure 19).  The results obtained by chemical revelation show the appearance of a less mobile product having an Rf close to the expected erythromycin D and for which a weak antibiotic activity is detected by direct autobiogram of the plates on B. pumilus. No biological activity was observed for the control test (Figure 19).

Ces résultats confirment que la protéine EryCIII produite dans E. coli et purifiée ci-dessus a l'activité désoaminyl transférase attendue et a été correctement renaturée.  These results confirm that the protein EryCIII produced in E. coli and purified above has the expected deoaminyl transferase activity and has been correctly renatured.

EXEMPLE 31 : utilisation de la séquence du gène eryCIII comme sonde pour isoler les gènes oleGl et oleG2 codant pour des glycosyltransférases chez S. antibioticus. EXAMPLE 31 Use of the eryCIII gene sequence as a probe to isolate the oleGl and oleG2 genes coding for glycosyltransferases in S. antibioticus.

1) clonage des gènes oleG1 et oleG2
La séquence du gène eryCIII de Sac. erythraea correspondant à l'ORF8 décrite à l'exemple 1 codant pour l'activité désosaminyltransférase a été utilisée pour préparer une sonde d'hybridation et a permis d'isoler des gènes homologues dans la souche S. antibioticus ATCC 11891 productrice d'oléandomycine par hybridation Southern.
1) cloning of the oleG1 and oleG2 genes
The sequence of the Sac eryCIII gene. erythraea corresponding to the ORF8 described in example 1 coding for the deosaminyltransferase activity was used to prepare a hybridization probe and made it possible to isolate homologous genes in the strain S. antibioticus ATCC 11891 producing oleandomycin by Southern hybridization.

L'intégralité du gène eryCIII a été amplifiée par PCR à partir de 6 ng du plasmide pK62 obtenu à l'exemple 1 en suivant les conditions opératoires décrites à l'exemple 3 en utilisant la polymérase native pfu (Stratagene) et comme amorces l'oligonucléotide ayant la séquence suivante : eryCIII-1 CGGGTACCATGCGCGTCGTCTTCTCCTCCATG (SEQ ID N 59) comportant un site de restriction KpnI dans sa région 5' et dont la partie 3' correspond au brin complémentaire de la région d'ADN située de la position 10196 à la position 10219 de la séquence de la figure 2 et l'oligonucléotide eryCIII2 ayant la séquence suivante : eryCIII-2 CGGGTACCTCATCGTGGTTCTCTCCTTCC (SEQ ID N 60)  The entire eryCIII gene was amplified by PCR from 6 ng of the plasmid pK62 obtained in Example 1 by following the operating conditions described in Example 3 using the native polymerase pfu (Stratagene) and as primers the oligonucleotide having the following sequence: eryCIII-1 CGGGTACCATGCGCGTCGTCTTCTCCTCCATG (SEQ ID N 59) comprising a KpnI restriction site in its 5 'region and of which the 3' part corresponds to the complementary strand of the DNA region located from position 10196 to the position 10219 of the sequence of FIG. 2 and the oligonucleotide eryCIII2 having the following sequence: eryCIII-2 CGGGTACCTCATCGTGGTTCTCTCCTTCC (SEQ ID N 60)

<Desc/Clms Page number 61><Desc / Clms Page number 61>

comportant un site KpnI dans sa région 5' et dont la partie 3' correspond à la région d'ADN située de la position 8954 à la position 8974 de la séquence de la figure 2.  comprising a KpnI site in its 5 ′ region and of which the 3 ′ part corresponds to the DNA region located from position 8954 to position 8974 of the sequence of FIG. 2.

La bande d'environ 1,2 kb obtenue par amplification a été ensuite digérée par l'enzyme de restriction KpnI et clonée dans le plasmide pUC19 préalablement digéré par l'enzyme KpnI. Le plasmide pCIIIPCRl ainsi obtenu a été ensuite utilisé pour réisoler le fragment KpnI de 1,2 kb correspondant à l'intégralité du gène eryCIII montré à la figure 2. Le fragment ainsi isolé a été ensuite marqué au 32P par la technique "random priming" décrite par Sambrook et al., 1989 et utilisé comme sonde eryCIII pour analyser par hybridation Southern des clones cosmides obtenus à partir d'une banque d'ADN génomique de S. antibioticus ATCC 11891 et préparés de la façon suivante (figure 20) :
Une série de six cosmides (cosAB35, cosAB76, cosAB87, cosAB67, cosAB63 et cosAB61) se chevauchant et couvrant environ 100 kb de la région correspondant au cluster de gènes de la biosynthèse de l'oléandomycine a été isolée en suivant la méthode décrite par Swan et al., 1994 en utilisant comme sondes le fragment SmaI de 2 kb interne à la troisième sousunité de la polykétide synthase de Sac. erythraea dans le cluster de gènes de la biosynthèse de l'érythromycine (Cortes et al., 1990) suivie d'une marche sur le chromosome. Les sondes strD, strE et strM codant respectivement pour la dTDPglucose synthase, la dTDP-glucose 4,6-déshydratase et la dTDP-6-désoxyglucose 3,5-épimérase de S. griseus (Stockmann et Piepersberg, 1992) hybrident avec les cosmides cosAB61 et cosAB63 (fig. 20). De façon analogue, par hybridation Southern avec la sonde eryCIII préparée ci-dessus effectuée selon les conditions standard décrites par Hopwood et al., 1985, le cosmide cosAB35 (Swan et al., 1994) donne des signaux positifs dans deux fragments de restriction BamHI de 3,5kb et de 2,7 kb représentés à la figure 20. Le sousclonage et le séquençage ultérieurs montrent que ces deux fragments sont séparés par un fragment BamHI de 0,6 kb non détecté par hybridation.
The approximately 1.2 kb band obtained by amplification was then digested with the restriction enzyme KpnI and cloned into the plasmid pUC19 previously digested with the enzyme KpnI. The plasmid pCIIIPCR1 thus obtained was then used to re-isolate the 1.2 kb KpnI fragment corresponding to the entire eryCIII gene shown in FIG. 2. The fragment thus isolated was then labeled with 32P by the "random priming" technique described by Sambrook et al., 1989 and used as an eryCIII probe to analyze by Southern hybridization cosmid clones obtained from a genomic DNA library of S. antibioticus ATCC 11891 and prepared as follows (FIG. 20):
A series of six cosmids (cosAB35, cosAB76, cosAB87, cosAB67, cosAB63 and cosAB61) overlapping and covering approximately 100 kb of the region corresponding to the olandomycin biosynthesis gene cluster was isolated using the method described by Swan et al., 1994 using as probes the SmaI fragment of 2 kb internal to the third subunit of the polyketide synthase of Sac. erythraea in the erythromycin biosynthesis gene cluster (Cortes et al., 1990) followed by a walk on the chromosome. The strD, strE and strM probes coding respectively for dTDPglucose synthase, dTDP-glucose 4,6-dehydratase and dTDP-6-deoxyglucose 3,5-epimerase from S. griseus (Stockmann and Piepersberg, 1992) hybridize with the cosmids cosAB61 and cosAB63 (fig. 20). Similarly, by Southern hybridization with the eryCIII probe prepared above carried out according to the standard conditions described by Hopwood et al., 1985, the cosmid cosAB35 (Swan et al., 1994) gives positive signals in two BamHI restriction fragments. 3.5 kb and 2.7 kb shown in Figure 20. Subcloning and subsequent sequencing show that these two fragments are separated by a 0.6 kb BamHI fragment not detected by hybridization.

Un fragment SstI de 10,8 kb d'ADN génomique de  A 10.8 kb SstI fragment of genomic DNA from

<Desc/Clms Page number 62><Desc / Clms Page number 62>

S. antibioticus ATCC 11891 représenté à la figure 21, correspondant à la partie droite du cluster de gènes de la biosynthèse de l'oléandomycine comprise entre le site SstI en position 11081 du gène OLE-ORF3 des PKS de la séquence EMBL nOL09654) et le site SstI en position 5 de la séquence EMBL n L36601 situé à 1,4 kb en amont du gène oleB et hybridant avec la sonde eryCIII préparée ci-dessus, a été isolé à partir du cosmide cosAB35 et sous-cloné dans le vecteur plasmidique pSL1180 (Pharmacia Biotech). Le clone pC035-S ainsi obtenu a été utilisé pour générer des matrices simple brin par sous-clonage de différents fragments d'ADN dans les bactériophages M13mpl8 et MP13mpl9 (New England Biolabs), puis la séquence nucléotidique de ces fragments a été déterminée selon la méthode de Sanger et al. (1977) en utilisant une polymérase T7 modifiée (Sequenase version 2.0; U. S. Biochemicals) en présence d'a[35S]dCTP (Amersham) et de 7-déaza-dGTP, selon les recommandations du fournisseur afin de limiter les problèmes de compression de bandes. Les amorces conventionnelles fournies avec la trousse Sequenase ainsi que les amorces synthétiques (17mer) internes ont été utilisées.  S. antibioticus ATCC 11891 represented in FIG. 21, corresponding to the right part of the gene cluster for the biosynthesis of oleandomycin comprised between the SstI site in position 11081 of the PLE OLE-ORF3 gene of the EMBL sequence nOL09654) and the SstI site at position 5 of the EMBL n L36601 sequence located 1.4 kb upstream of the oleB gene and hybridizing with the eryCIII probe prepared above, was isolated from the cosmid cosAB35 and subcloned into the plasmid vector pSL1180 (Pharmacia Biotech). The clone pC035-S thus obtained was used to generate single-stranded templates by subcloning of different DNA fragments in the bacteriophages M13mpl8 and MP13mpl9 (New England Biolabs), then the nucleotide sequence of these fragments was determined according to the method of Sanger et al. (1977) using a modified T7 polymerase (Sequenase version 2.0; US Biochemicals) in the presence of a [35S] dCTP (Amersham) and 7-deaza-dGTP, according to the supplier's recommendations in order to limit compression compression problems bands. The conventional primers supplied with the Sequenase kit as well as the internal synthetic primers (17 mer) were used.

L'assemblage des données de séquence a été réalisé en utilisant le programme Fragment Assembly (Genetic Computer Group, University of Wisconsin) et l'identification des phases ouvertes de lecture en utilisant le programme CODONPREFERENCE (Devereux et al., 1984).  The assembly of the sequence data was carried out using the Fragment Assembly program (Genetic Computer Group, University of Wisconsin) and the identification of the open reading phases using the CODONPREFERENCE program (Devereux et al., 1984).

Les séquences nucléotidiques obtenues ont permis d'établir la séquence nucléotidique de 6093 bp représentée à la figure 22 (séquence de SEQ ID N 15), comprise entre les sites SphI* et KpnI montrés à la figure 21, dans laquelle cinq ORFs ont été identifiées respectivement du nucléotide 184 au nucléotide 1386 (ORF dénommée oleP1), du nucléotide 1437 au nucléotide 2714 (ORF dénommée oleG1), du nucléotide 2722 au nucléotide 3999 (ORF dénommée oleG2), du nucléotide 3992 au nucléotide 4729 (ORF dénommée oleM) et du nucléotide 4810 au nucléotide 5967 (ORF dénommée oleY). Les cinq ORFs sont transcrites dans la même direction.  The nucleotide sequences obtained made it possible to establish the nucleotide sequence of 6093 bp represented in FIG. 22 (sequence of SEQ ID N 15), comprised between the SphI * and KpnI sites shown in FIG. 21, in which five ORFs were identified respectively from nucleotide 184 to nucleotide 1386 (ORF designated oleP1), from nucleotide 1437 to nucleotide 2714 (ORF designated oleG1), from nucleotide 2722 to nucleotide 3999 (ORF designated oleG2), from nucleotide 3992 to nucleotide 4729 (ORF designated oleM) and nucleotide 4810 to nucleotide 5967 (ORF called oleY). The five ORFs are transcribed in the same direction.

Des échantillons de E. coli contenant le plasmide  E. coli samples containing the plasmid

<Desc/Clms Page number 63><Desc / Clms Page number 63>

pC035-S comprenant la région codante des ORFs olePl, oleGl, oleG2, oleM et oleY ont été déposés à la CNCM le 8 avril 1998 sous le numéro 1-2003.  pC035-S comprising the coding region of the ORFs olePl, oleGl, oleG2, oleM and oleY were deposited at the CNCM on April 8, 1998 under number 1-2003.

Le gène oleG1 code pour un polypeptide ayant 426 acides aminés (séquence de SEQ ID N 17). Cependant, la présence d'un codon CGC codant pour une arginine très conservée dans cette classe de glycosyltransférase chez les Streptomycètes situé immédiatement en amont du codon GTG, indiquerait que le codon initiateur pourrait être le codon CTG en position 1431 de la séquence SEQ ID N 17.  The oleG1 gene codes for a polypeptide having 426 amino acids (sequence of SEQ ID N 17). However, the presence of a CGC codon coding for an arginine very conserved in this class of glycosyltransferase in Streptomycetes located immediately upstream from the GTG codon, would indicate that the initiating codon could be the CTG codon at position 1431 of the sequence SEQ ID N 17.

Le gène oleG2 code pour un polypeptide ayant 426 acides aminés (séquence de SEQ ID N 18).  The oleG2 gene codes for a polypeptide having 426 amino acids (sequence of SEQ ID N 18).

La comparaison des séquences en acides aminés déduites des ORFs oleG1 et oleG2 ci-dessus avec les protéines de bases de données à l'aide du programme Blast (Altschul et al., 1990) a montré des similarités avec des glycosyl transférases de différentes sources, notamment environ 72 % de similarité et 53 % d'identité avec la déosaminyltransférase EryCIII décrite à l'exemple 30.  The comparison of the amino acid sequences deduced from the above oleG1 and oleG2 ORFs with the database proteins using the Blast program (Altschul et al., 1990) showed similarities with glycosyl transferases from different sources, in particular approximately 72% similarity and 53% identity with the deosaminyltransferase EryCIII described in Example 30.

L'identification de la fonction du gène oleG1 ou du gène oleG2 a été ensuite réalisée par interruption du gène cible dans la souche de S. antibioticus ATCC 11891 et par identification d'un précurseur non glycosylé de l'oléandomycine produit par la souche mutante en utilisant les méthodes décrites dans les exemples 3 à 4.  The identification of the function of the oleG1 gene or of the oleG2 gene was then carried out by interruption of the target gene in the strain of S. antibioticus ATCC 11891 and by identification of a non-glycosylated precursor of oleandomycin produced by the mutant strain in using the methods described in examples 3 to 4.

2) génération d'une souche de S. antibioticus oleG1# (A35G1). 2) generation of a strain of S. antibioticus oleG1 # (A35G1).

Une souche dans laquelle le gène oleG1 est interrompu a été préparée par intégration d'un plasmide pC03 dans les régions homologues de l'ADN chromosomique de la souche de S. antibioticus ATCC 11891 productrice d'oléandomycine.  A strain in which the oleG1 gene is interrupted was prepared by integration of a plasmid pC03 into the homologous regions of the chromosomal DNA of the strain of S. antibioticus ATCC 11891 producing oleandomycin.

Dans un premier temps, le fragment BamHI de 0,6 kb interne au gène oleGl, obtenu par digestion du plamide pC035-S préparé ci-dessus, avec l'enzyme de restriction BamHI (figure 21), a été sous-cloné dans le site BamHI du plasmide pOJ260 NRRL B-14785.  First, the 0.6 kb BamHI fragment internal to the oleGl gene, obtained by digestion of the pC035-S plamide prepared above, with the restriction enzyme BamHI (FIG. 21), was subcloned into the BamHI site of plasmid pOJ260 NRRL B-14785.

Le plasmide pC03 ainsi généré a été ensuite transféré dans la souche E. coli TG1 rec01504::Tn5 (Kolodner et al., 1985), puis utilisé pour transformer les protoplastes de  The plasmid pC03 thus generated was then transferred into the E. coli TG1 strain rec01504 :: Tn5 (Kolodner et al., 1985), then used to transform the protoplasts of

<Desc/Clms Page number 64><Desc / Clms Page number 64>

S. antibioticus. La sélection des transformants a été réalisée par résistance à l'apramycine (Apramycine pour injection, Rhône Mérieux).  S. antibioticus. The selection of transformants was carried out by resistance to apramycin (Apramycin for injection, Rhône Mérieux).

La préparation des protoplastes a été réalisée à partir de la souche S. antibioticus ATCC 11891 en suivant les conditions décrites par Hopwood et al., 1985.  The preparation of the protoplasts was carried out from the strain S. antibioticus ATCC 11891 according to the conditions described by Hopwood et al., 1985.

La transformation a été réalisée en utilisant 50 l d'aliquot de protoplastes, 5 g d'ADN plasmidique pC03 et en remplaçant le thiostrepton par de l'apramycine à la concentration finale de 25 jug/ml.  The transformation was carried out using 50 l of aliquot of protoplasts, 5 g of plasmid DNA pCO3 and replacing the thiostrepton with apramycin at the final concentration of 25 jug / ml.

La sélection des intégrants effectuée par résistance à l'apramycine a permis d'isoler un clone dénommé A35G1.  The selection of integrants carried out by resistance to apramycin made it possible to isolate a clone called A35G1.

L'altération attendue dans la région correspondante du chromosome de S. antibioticus a été confirmée par analyse génomique par Southern blot. L'ADN chromosomique isolé puis digéré par l'enzyme de restriction PstI à partir de la souche S. antibioticus sauvage ou du mutant A35G1 a été analysé par Southern en utilisant comme sonde d'hybridation le fragment BamHI de 0,6 kb indiqué ci-dessus. Le remplacement du fragment PstI de 4,7 kb ainsi détecté dans la souche sauvage par deux fragments PstI de 2,4 et 6,5 kb dans le mutant A35G1 confirme l'intégration du plasmide pC03 dans le chromosome de la souche A35G1 au niveau de l'ORF oleGl.  The expected alteration in the corresponding region of the chromosome of S. antibioticus was confirmed by genomic analysis by Southern blot. The chromosomal DNA isolated and then digested with the restriction enzyme PstI from the strain S. antibioticus wild or from the mutant A35G1 was analyzed by Southern using, as hybridization probe, the 0.6 kb BamHI fragment indicated above. above. The replacement of the 4.7 kb PstI fragment thus detected in the wild-type strain by two PstI fragments of 2.4 and 6.5 kb in the mutant A35G1 confirms the integration of the plasmid pC03 into the chromosome of the strain A35G1 at the level of the oleGl ORF.

La souche recombinante A35G1 ainsi obtenue a été ensuite cultivée pour identifier les précurseurs produits par la souche.  The recombinant strain A35G1 thus obtained was then cultured to identify the precursors produced by the strain.

3) fermentation de la souche A35G1 et identification des précurseurs de l'oléandomycine produits. 3) fermentation of the strain A35G1 and identification of the oleandomycin precursors produced.

La souche A35G1 a été cultivée pendant 72 h en erlen de 50 ml dans le milieu EP2 à partir d'une préculture de 48 h en milieu EPI dans les conditions décrites à l'exemple 4.  The strain A35G1 was cultivated for 72 h in 50 ml Erlenmeyer flask in EP2 medium from a 48 h preculture in PPE medium under the conditions described in Example 4.

Les extraits de bouillon avec de l'acétate d'éthyle ont été ensuite analysés selon les méthodes utilisées dans les exemples 3 et 4. a) L'essai biologique par antibiogramme a été réalisé de la façon suivante :
Après croissance de la souche B. pumilus sur milieu TSB pendant une nuit à 37 C, la culture a été diluée à 1/100 dans
The broth extracts with ethyl acetate were then analyzed according to the methods used in Examples 3 and 4. a) The biological test by antibiogram was carried out as follows:
After growth of the B. pumilus strain on TSB medium overnight at 37 ° C., the culture was diluted to 1/100 in

<Desc/Clms Page number 65><Desc / Clms Page number 65>

du milieu contenant 50 % (w/v) de glycérol, puis la suspension cellulaire obtenue a été conservée à -20 C avant utilisation.  medium containing 50% (w / v) glycerol, then the cell suspension obtained was stored at -20 C before use.

L'essai biologique a ensuite été effectué en introduisant 150 /ni de la suspension cellulaire décongelée dans 100 ml de milieu TSB contenant 1 % d'agar et maintenu à 55 C. Le mélange a été ensuite versé dans des boites de pétri. Après refroidissement, des cylindres oxford contenant 50 à 200 l d'extraits à l'acétate d'éthyle ont été placés sur les boites d'agar, maintenus 2 h à 4 C, puis incubés pendant une nuit à 37 C.  The biological test was then carried out by introducing 150 μl of the thawed cell suspension into 100 ml of TSB medium containing 1% of agar and maintained at 55 C. The mixture was then poured into petri dishes. After cooling, oxford cylinders containing 50 to 200 l of ethyl acetate extracts were placed on the agar dishes, kept for 2 h at 4 ° C., then incubated overnight at 37 ° C.

Les extraits ne montrent pas d'effet inhibiteur sur la croissance de B. pumilus ATCC 14884. b) L'analyse par ccm par révélation chimique a été effectuée selon les conditions décrites à l'exemple 4 en utilisant comme standards l'érythromycine A, l'érythronolide B ainsi que le 6-désoxyérythronolide B.  The extracts do not show an inhibitory effect on the growth of B. pumilus ATCC 14884. b) The analysis by cmc by chemical development was carried out according to the conditions described in Example 4 using erythromycin A as standards, erythronolide B as well as 6-deoxyerythronolide B.

L'analyse par ccm montre que la souche A35G1 ne produit pas d'oléandomycine mais accumule préférentiellement un produit pourpre ayant une mobilité plus grande que l'érythronolide B et voisine du 6-désoxyérythronolide B et que l'on peut attendre de la partie aglycone 8,8a-désoxyoléandolide. c) L'analyse par chromatographie RP-HPLC couplée à la spectrométrie de masse a été réalisée selon les conditions décrites à l'exemple 4. Deux métabolites majeurs, dénommmés M9 et M10, ont été détectés (élution à 6,12 mn et 17,23 mn respectivement). Les deux produits donnent un pic parent m/z 373 et des profils de fragmentation analogues qui peuvent être en accord avec la structure [8,8a-désoxyoléandolide]H+.  The ccm analysis shows that the strain A35G1 does not produce oleandomycin but preferentially accumulates a purple product having greater mobility than erythronolide B and close to 6-deoxyerythronolide B and which can be expected from the aglycone part 8.8a-deoxyoleandolide. c) Analysis by RP-HPLC chromatography coupled to mass spectrometry was carried out according to the conditions described in Example 4. Two major metabolites, called M9 and M10, were detected (elution at 6.12 min and 17 , 23 min respectively). The two products give a parent peak m / z 373 and similar fragmentation profiles which may be in agreement with the structure [8,8a-deoxyoleandolide] H +.

Cependant seul le temps de rétention du métabolite M10 est en accord avec la structure proposée alors que le métabolite M9 pourrait correspondre à une structure isomère ou au noyau lactone ouvert. However, only the retention time of the metabolite M10 is in agreement with the proposed structure whereas the metabolite M9 could correspond to an isomer structure or to the open lactone nucleus.

Des expériences de complémentation des souches mutantes de Sac. erythraea CIII68 décrite à l'exemple 6 et BV88 décrite à l'exemple 16 ont été également réalisées en utilisant des constructions plasmidiques permettant  Complementary experiments with mutant Sac strains. erythraea CIII68 described in Example 6 and BV88 described in Example 16 were also produced using plasmid constructs allowing

<Desc/Clms Page number 66><Desc / Clms Page number 66>

d'exprimer respectivement chacun des gènes oleG1 et oleG2.  to express each of the oleG1 and oleG2 genes, respectively.

Ces observations et l'absence de détection d'oléandrosyl 8,8a-désoxyoléandolide ou de désosaminyl 8,8a-désoxyoléandolide indiquent que le gène oleG1 code pour la désoaminosyltransférase et le gène oleG2 code pour l'oléandrosyltransférase respectivement impliquées dans la biosynthèse de l'oléandomycine.  These observations and the absence of detection of oleandrosyl 8,8a-deoxyoleandolide or of desosaminyl 8,8a-deoxyoleandolide indicate that the oleG1 gene codes for deoaminosyltransferase and the oleG2 gene codes for oleandrosyltransferase respectively involved in the biosynthesis of oleandomycin.

PREPARATION DE L'EXEMPLE 30 :Thymidine 5'-(trihydrogendiphosphate),p'- [3,4,6-tridéoxy-3-(diméthylamino)-D-xylohexopyranosyl]ester,N,N-diéthyléthanamine STADE A : chlorhydrate 3,4,6-tridéoxy-3-(diméthylamino)-D- xylohexopyranose
On ajoute sous agitation et à température ambiante 146,6 g d'érythromycine A, à 1,5 litres d'acide chlorhydrique 6N. On porte la solution obtenue au reflux pendant 2 h. On refroidit à la température ambiante, filtre et lave à l'eau le résidu obtenu. On extrait la phase aqueuse au chlorure de méthylène, puis à l'éther sulfurique. On ajoute à la phase aqueuse 10 g de noir L2S et chasse les traces d'éther sous pression réduite. On filtre, et concentre. On effectue un second envoi dans les mêmes conditions. On rassemble les deux essais, dissout dans l'éthanol (150 cm3), ajoute 150 cm3 d'éther éthylique. On essore, lave et sèche les cristaux obtenus. On obtient 42 g de produit recherché. F = 158-160 C.
PREPARATION OF EXAMPLE 30: Thymidine 5 '- (trihydrogendiphosphate), p'- [3,4,6-trideoxy-3- (dimethylamino) -D-xylohexopyranosyl] ester, N, N-diethylethanamine STAGE A: hydrochloride 3, 4,6-trideoxy-3- (dimethylamino) -D- xylohexopyranose
146.6 g of erythromycin A are added with stirring and at room temperature to 1.5 liters of 6N hydrochloric acid. The solution obtained is brought to reflux for 2 h. It is cooled to room temperature, filtered and the residue obtained is washed with water. The aqueous phase is extracted with methylene chloride, then with sulfuric ether. 10 g of black L2S are added to the aqueous phase and the traces of ether are removed under reduced pressure. We filter and concentrate. A second shipment is made under the same conditions. The two tests are combined, dissolved in ethanol (150 cm3), 150 cm3 of ethyl ether are added. The crystals obtained are filtered, washed and dried. 42 g of sought product is obtained. F = 158-160 C.

STADE B : 3,4,6-tridéoxy-3-(diméthylamino)-D-xylo-hexopyranose,l,2-diacétate
On ajoute sous agitation à 20 C, 60 cm3 de triéthylamine dans un mélange renfermant 15,27 g de produit du stade A et 150 cm3 de chlorure de méthylène. On ajoute à 20 C une solution renfermant 20 cm3 d'anhydride acétique et 80 cm3 de chlorure de méthylène. On agite à la température ambiante pendant 20 heures. On filtre, lave et concentre. On empâte dans l'éther sulfurique. On concentre le filtrat sous pression réduite. On chromatographie le résidu obtenu en éluant avec le mélange acétate d'éthyle-triéthylamine (95-5).
STAGE B: 3,4,6-trideoxy-3- (dimethylamino) -D-xylo-hexopyranose, 1,2-diacetate
60 cm3 of triethylamine are added with stirring at 20 ° C. in a mixture containing 15.27 g of product from stage A and 150 cm3 of methylene chloride. A solution containing 20 cm3 of acetic anhydride and 80 cm3 of methylene chloride is added at 20 ° C. Stir at room temperature for 20 hours. It is filtered, washed and concentrated. We paste in sulfuric ether. The filtrate is concentrated under reduced pressure. The residue obtained is chromatographed, eluting with an ethyl acetate-triethylamine mixture (95-5).

On obtient 18,6 g de produit recherché que l'on utilise tel quel dans le stade suivant. 18.6 g of sought product is obtained which is used as it is in the following stage.

STADE C : 3,4,6-tridéoxy-3-(diméthylamino)-D-xylo-hexopyra- STAGE C: 3,4,6-trideoxy-3- (dimethylamino) -D-xylo-hexopyra-

<Desc/Clms Page number 67><Desc / Clms Page number 67>

nose,2-acétate
On porte à 50 C un mélange renfermant 18,6 g du produit du stade B et 50 cm3 de DMF et ajoute 6,62 g d'acétate d'hydrazine NH2NH2, ACOH. On agite le mélange réactionnel et le verse sur une solution saturée de carbonate acide de sodium. On extrait la phase aqueuse à l'acétate d'éthyle. On rassemble les phases organiques, sèche, filtre et concentre.
nose, 2-acetate
A mixture containing 18.6 g of the product from stage B and 50 cm3 of DMF is brought to 50 ° C. and 6.62 g of hydrazine acetate NH2NH2, ACOH are added. The reaction mixture is stirred and poured onto a saturated solution of sodium hydrogen carbonate. The aqueous phase is extracted with ethyl acetate. The organic phases are combined, dried, filtered and concentrated.

On distille sous pression réduite pour éliminer le DMF par entraînement azéotrophirque avec le toluène. On obtient 11,28 g de produit que l'on chromatographie sur silice en éluant avec le mélange acétate d'éthyle-triéthylamine (90-10). On obtient 6,5 g de produit recherché que l'on utilise tel quel dans le stade suivant. Distillation is carried out under reduced pressure to remove the DMF by azeotrophic entrainment with toluene. 11.28 g of product are obtained which is chromatographed on silica eluting with an ethyl acetate-triethylamine mixture (90-10). 6.5 g of sought product is obtained which is used as it is in the following stage.

STADE D : 3,4,6-tridéoxy-3-(diméthylamino)-D-xylo-hexopyranose,2-acétate bis(phénylméthyl)phosphate
On ajoute à -70 C, 5,7 cm3 d'une solution de n-butyllithium dans l'hexane dans une solution renfermant 1,738 g du produit du stade précédent et 40 cm3 de THF. On ajoute à -70#-75 C 10 g de dibenzylphosphochlorure préparé extemporanément (J. Chem. Soc. 1958, p. 1957),

Figure img00670001

en solution dans 20 cm3 de THF. On maintient l'agitation pendant 1 h 30 entre-70 et -74 C. On verse sur une solution saturée de carbonate acide de sodium, extrait à l'acétate d'éthyle. On sèche la phase organique sur sulfate de sodium, filtre et concentre. On chromatographie le produit obtenu sur silice en éluant avec le mélange acétone-chlorure de méthylène (5-5). On obtient 1,070 g du produit recherché. STAGE D: 3,4,6-trideoxy-3- (dimethylamino) -D-xylo-hexopyranose, 2-acetate bis (phenylmethyl) phosphate
5.7 cm3 of a solution of n-butyllithium in hexane in a solution containing 1.738 g of the product of the preceding stage and 40 cm3 of THF are added at -70 ° C. 10 g of dibenzylphosphochloride prepared extemporaneously are added to -70 # -75 ° C. (J. Chem. Soc. 1958, p. 1957),
Figure img00670001

dissolved in 20 cm3 of THF. Stirring is continued for 1 h 30 between -70 and -74 C. It is poured over a saturated solution of sodium hydrogen carbonate, extracted with ethyl acetate. The organic phase is dried over sodium sulfate, filtered and concentrated. The product obtained is chromatographed on silica, eluting with an acetone-methylene chloride mixture (5-5). 1.070 g of the sought product is obtained.

STADE E : 3,4,6-tridéoxy-3- (diméthylamino)-D-xylohexopyranose,l-(dihydrogen phosphate),N,N-diéthyléthanamine
On place sous agitation et sous courant d'hydrogène pendant 30 minutes à la température ambiante, un mélange renfermant 1,070 g du produit du stade précédent, 20 cm3 d'acétate d'éthyle, 10 cm3 de méthanol, 0,622 cm3 de triéthy-
STAGE E: 3,4,6-trideoxy-3- (dimethylamino) -D-xylohexopyranose, l- (dihydrogen phosphate), N, N-diethylethanamine
A mixture containing 1.070 g of the product from the preceding stage, 20 cm3 of ethyl acetate, 10 cm3 of methanol, 0.622 cm3 of triethyl is placed under stirring and under a stream of hydrogen for 30 minutes at room temperature.

<Desc/Clms Page number 68><Desc / Clms Page number 68>

lamine et 200 mg de palladium sur charbon. On filtre, lave au méthanol et à l'acétate d'éthyle et concentre le filtrat. On obtient 1 g d'une huile à laquelle on ajoute 10 cm3 de méthanol. On agite la solution obtenue pendant 20 heures. On chasse le méthanol sous pression réduite à 30 C. On obtient 680 g de produit recherché.  laminated and 200 mg of palladium on carbon. It is filtered, washed with methanol and ethyl acetate and the filtrate is concentrated. 1 g of an oil is obtained to which 10 cm 3 of methanol are added. The solution obtained is stirred for 20 hours. The methanol is removed under reduced pressure at 30 C. 680 g of sought product is obtained.

STADE F : 3,4,6-tridéoxy-3-(diméthylamino)-D-xylohexopyranose,l-(dihydrogen phosphate)
On dissout 420 mg du produit isolé sous forme de sels de triéthylamine, obtenu au stade précédent, dans 1,6 cm3 de méthanol. On ajoute 3,2 cm3 d'éther sulfurique. On ajoute ensuite 6,4 cm3 d'éther sulfurique. On obtient 250 mg de produit recherché fondant à 242-244 C.
STAGE F: 3,4,6-trideoxy-3- (dimethylamino) -D-xylohexopyranose, l- (dihydrogen phosphate)
420 mg of the isolated product in the form of triethylamine salts, obtained in the preceding stage, are dissolved in 1.6 cm 3 of methanol. 3.2 cm3 of sulfuric ether are added. 6.4 cm3 of sulfuric ether are then added. 250 mg of sought product is obtained, melting at 242-244 C.

STADE G : Thymidine 5'-(trihydrogen diphosphate),P'-[3,4,6tridéoxy-3-(diméthylamino)-D-xylo-hexopyranosyl]ester,N,Ndiéthyléthanamine
On mélange 228 mg du produit de la préparation 1,6 cm3 de pyridine et 544 mg de thymidine 5'-monophosphate morpholidate-4-morpholine-NN'-dicyclohexylcarboxamidine. On chasse la pyridine sous pression réduite au rotorvapor en maintenant la température à 30 C ou en dessous. On ajoute 6 cm3 de pyridine que l'on chasse sous pression réduite. On répète l'opération 2 fois. On ajoute 6 cm3 de pyridine, 105 mg de 1H-tétrazole.
STAGE G: Thymidine 5 '- (trihydrogen diphosphate), P' - [3,4,6trideoxy-3- (dimethylamino) -D-xylo-hexopyranosyl] ester, N, Ndiethylethanamine
228 mg of the product of the preparation 1.6 cm3 of pyridine and 544 mg of thymidine 5'-monophosphate morpholidate-4-morpholine-NN'-dicyclohexylcarboxamidine are mixed. The pyridine is removed under reduced pressure on the rotor-vapor while maintaining the temperature at 30 ° C. or below. 6 cm 3 of pyridine are added, which is removed under reduced pressure. The operation is repeated 2 times. 6 cm 3 of pyridine, 105 mg of 1H-tetrazole are added.

On agite pendant 3 jours à la température ambiante. On chasse la pyridine sous pression réduite. On reprend dans l'eau, filtre, concentre et obtient un produit que l'on purifie par chromatographie. On obtient ainsi le produit recherché. rf = 0,12 éluant CH2C12, MeOH, H20 (60-35-6). The mixture is stirred for 3 days at room temperature. The pyridine is removed under reduced pressure. It is taken up in water, filtered, concentrated and a product is obtained which is purified by chromatography. The desired product is thus obtained. rf = 0.12 eluting CH2C12, MeOH, H2O (60-35-6).

Références bibliographiques : Altschul SF, Gish W, Miller W, Myers EW, Lipman DJ (1990) J Mol Biol 215 : 403-410. Bibliographic references: Altschul SF, Gish W, Miller W, Myers EW, Lipman DJ (1990) J Mol Biol 215: 403-410.

Ausubel FM, Brent R, Kingston RE, Moore DD, Seidman JG, Smith JA Struhl K (1995) Current protocols in molecular biology. Ausubel FM, Brent R, Kingston RE, Moore DD, Seidman JG, Smith JA Struhl K (1995) Current protocols in molecular biology.

Massachusetts General Hospital and Harvard medical School. Massachusetts General Hospital and Harvard medical School.

John Wiley and Sons, Inc. John Wiley and Sons, Inc.

<Desc/Clms Page number 69> <Desc / Clms Page number 69>

Bankier AT, Weston KM, Barrell BG (1987) Methods in Enzymology 155 : 51-93. Bankier AT, Weston KM, Barrell BG (1987) Methods in Enzymology 155: 51-93.

Bevitt DJ, Cortes J, Haydock SF and Leadlay PF, (1992), Eur. Bevitt DJ, Cortes J, Haydock SF and Leadlay PF, (1992), Eur.

J. Biochem 204 : 39-49. J. Biochem 204: 39-49.

Caffrey P, Bevitt DJ, Staunton J, Leadlay PF (1992) FEBS 304 : 225-228. Caffrey P, Bevitt DJ, Staunton J, Leadlay PF (1992) FEBS 304: 225-228.

Cortés J, Haydock SF, Roberts GA, Bevitt DJ, Leadlay PF (1990) Nature 348 : 176-178. Cortés J, Haydock SF, Roberts GA, Bevitt DJ, Leadlay PF (1990) Nature 348: 176-178.

Devereux J, Haeberli P, Smithies 0 (1984) Nucl Acids Res 12 : 387-395. Devereux J, Haeberli P, Smithies 0 (1984) Nucl Acids Res 12: 387-395.

Dhillon N, Hale RS, Cortes J, Leadlay PF (1989) Mol Microbiol 3 : 1405-1414. Dhillon N, Hale RS, Cortes J, Leadlay PF (1989) Mol Microbiol 3: 1405-1414.

Dickens ML, Ye J, Strohl WR (1996) J Bacteriol 178 : 3384-3388. Dickens ML, Ye J, Strohl WR (1996) J Bacteriol 178: 3384-3388.

Donadio S, Stassi J, McAlpine JB, Staver MJ, Sheldon PJ, Jackson M, Swanson SJ, Wendt-Pienkowski E, Wang YG, Jarvis B, Hutchinson CR, Katz L (1993) In : Baltz RH, Hegeman GD, Skatrud PL (eds) Industrial Microorganisms : Basic and Applied Molecular Genetics : American Society for Microbiology, Washington, DC, 257-265. Donadio S, Stassi J, McAlpine JB, Staver MJ, Sheldon PJ, Jackson M, Swanson SJ, Wendt-Pienkowski E, Wang YG, Jarvis B, Hutchinson CR, Katz L (1993) In: Baltz RH, Hegeman GD, Skatrud PL (eds) Industrial Microorganisms: Basic and Applied Molecular Genetics: American Society for Microbiology, Washington, DC, 257-265.

Gandecha AR, Large SL, Cundliffe E (1997) Gène 184 : 197-203. Gandecha AR, Large SL, Cundliffe E (1997) Gene 184: 197-203.

Haydock SF, Dowson JA, Dhillon N, Roberts GA, Cortes J, Leadlay PF (1991) Mol Gen Genet 230 : 120-128. Haydock SF, Dowson JA, Dhillon N, Roberts GA, Cortes J, Leadlay PF (1991) Mol Gen Genet 230: 120-128.

Hessler PE, Larsen PE, Constantinou AI, Schram KH, Weber JM, Appl Microbiol. Biotechnol (1997), 47 : 398-404. Hessler PE, Larsen PE, Constantinou AI, Schram KH, Weber JM, Appl Microbiol. Biotechnol (1997), 47: 398-404.

Hopwood DA, Kieser T, Wright HM an Bibb MJ, Journal of General Microbiology (1983), 129,2257-2269. Hopwood DA, Kieser T, Wright HM an Bibb MJ, Journal of General Microbiology (1983), 129.2257-2269.

<Desc/Clms Page number 70> <Desc / Clms Page number 70>

Hopwood DA, Bibb MJ, Chater KF, Kieser T, Bruton C, Kieser HM, Lydiate DJ, Smith CP, Ward JM, Schremp H (1985) Genetic manipulation of Streptomyces. A laboratory Manual. John Innes Foundation, Norwich. Hopwood DA, Bibb MJ, Chater KF, Kieser T, Bruton C, Kieser HM, Lydiate DJ, Smith CP, Ward JM, Schremp H (1985) Genetic manipulation of Streptomyces. A laboratory Manual. John Innes Foundation, Norwich.

Kaneda T, Butte JC, Taubman B, Corcoran JW (1962) J Biol Chem 237 : 322-327. Kaneda T, Butte JC, Taubman B, Corcoran JW (1962) J Biol Chem 237: 322-327.

Katz E, Thompson CJ, Hopwood DA (1983) J Gen Microbiol 129 : 2703-2714. Katz E, Thompson CJ, Hopwood DA (1983) J Gen Microbiol 129: 2703-2714.

Korz DJ, Rinas U, Hellmuth K, Sanders EA, Deckwer W-D (1995) Journal of Biotechnology 39 : 59-65. Korz DJ, Rinas U, Hellmuth K, Sanders EA, Deckwer W-D (1995) Journal of Biotechnology 39: 59-65.

Katz L, Donadio S (1995) Macrolides. In : Vining LC, Stuttard C (eds). Genetics and Biochemistry of Antibiotic Production. Katz L, Donadio S (1995) Macrolides. In: Vining LC, Stuttard C (eds). Genetics and Biochemistry of Antibiotic Production.

Butterworth-Heinemann, Newton, MA, 385-420. Butterworth-Heinemann, Newton, MA, 385-420.

Liu H-W, Thorson JS (1994) Annu Rev Microbiol 48 : 223-56. Liu H-W, Thorson JS (1994) Annu Rev Microbiol 48: 223-56.

Otten SL, Liu X, Ferguson J, Hutchinson CR (1995) J Bacteriol 177 : 6688-6692. Otten SL, Liu X, Ferguson J, Hutchinson CR (1995) J Bacteriol 177: 6688-6692.

Sakakibara H and Omura S (1984). In : Omura S. (ed) Macrolide Antibiotics : Chemistry, Biology, and Practice. Academic Press, Inc. London, 85-125. Sakakibara H and Omura S (1984). In: Omura S. (ed) Macrolide Antibiotics: Chemistry, Biology, and Practice. Academic Press, Inc. London, 85-125.

Sambrook J, Fritsch EF, Maniatis T (1989) Molecular cloning: a laboratory manual, 2nd ed. Cold Spring Harbor Laboratory Press, N.Y. Sambrook J, Fritsch EF, Maniatis T (1989) Molecular cloning: a laboratory manual, 2nd ed. Cold Spring Harbor Laboratory Press, N.Y.

Sanger F, Nicklen S, Coulson AR (1977) Proc Natl Acad Sci USA 74 : 5463-5467. Sanger F, Nicklen S, Coulson AR (1977) Proc Natl Acad Sci USA 74: 5463-5467.

Scotti C, Hutchinson CR (1996) J Bacteriol 178 : 7316-7321. Scotti C, Hutchinson CR (1996) J Bacteriol 178: 7316-7321.

Scrutton NS, Berry A, Perham RN (1990) Nature 343 : 38-43. Scrutton NS, Berry A, Perham RN (1990) Nature 343: 38-43.

<Desc/Clms Page number 71> <Desc / Clms Page number 71>

Staden R (1984), Nucleic Acids Res 12 : 521-528. Staden R (1984), Nucleic Acids Res 12: 521-528.

Stassi D, Donadio S, Staver MJ, Katz L (1993) J Bacteriol 175 : 182-189. Stassi D, Donadio S, Staver MJ, Katz L (1993) J Bacteriol 175: 182-189.

Stemmer WPC (1994) Proc. Natl. Acad. Sci., Vol. 91, pp. Stemmer WPC (1994) Proc. Natl. Acad. Sci., Vol. 91, pp.

10747-10751. 10747-10751.

Stockmann M, and Piepersberg W (1992) FEMS Microbiol Lett 90 : 185-190. Stockmann M, and Piepersberg W (1992) FEMS Microbiol Lett 90: 185-190.

Swan D. G., Rodriguez A.M., Vilches C., Méndez C., Salas J.A., (1994) Mol Gen Genet 242 : 358-362. Swan D. G., Rodriguez A.M., Vilches C., Méndez C., Salas J.A., (1994) Mol Gen Genet 242: 358-362.

Ward JM, Janssen GR, Kieser T, Bibb MJ, Buttner MJ, Bibb MJ (1986) Mol. Gen. Genet. 203 : 468-475 Weber JM, Wierman CK, Hutchinson CR (1985) J Bacteriol 164 : 425-433. Ward JM, Janssen GR, Kieser T, Bibb MJ, Buttner MJ, Bibb MJ (1986) Mol. Gen. Broom. 203: 468-475 Weber JM, Wierman CK, Hutchinson CR (1985) J Bacteriol 164: 425-433.

Weber JM, Losick R (1988) Gene 68 : 173-180. Weber JM, Losick R (1988) Gene 68: 173-180.

Weber JM, Schoner B, Losick R (1989) Gene 75 : 235-241. Weber JM, Schoner B, Losick R (1989) Gene 75: 235-241.

Weber JM, Leung JO, Maine GT, Potenz RHB, Paulus TJ, DeWitt JP (1990) J Bacteriol 172 : 2372-2383. Weber JM, Leung JO, Maine GT, Potenz RHB, Paulus TJ, DeWitt JP (1990) J Bacteriol 172: 2372-2383.

Weber JM, Leung JO, Swanson SJ, Idler KB, McAlpine JB (1991) Science 252 : 114-117. Weber JM, Leung JO, Swanson SJ, Idler KB, McAlpine JB (1991) Science 252: 114-117.

Wehmeier UF (1995) Gene 165 : 149-150. Wehmeier UF (1995) Gene 165: 149-150.

Wierenga RK, Terpstra P, Hol WGJ (1986) J. Mol. Biol. 187 : 101-107. Wierenga RK, Terpstra P, Hol WGJ (1986) J. Mol. Biol. 187: 101-107.

Yamamoto H, Maurer KH, Hutchinson CR (1986) J Antibiot 34 : 1304-1313. Yamamoto H, Maurer KH, Hutchinson CR (1986) J Antibiot 34: 1304-1313.

<Desc/Clms Page number 72> <Desc / Clms Page number 72>

LISTE DE SEQUENCES (1) INFORMATIONS GENERALES: (i) DEPOSANT: (A) NOM : Hoechst Marion Roussel (B) RUE : Terrasse Bellini (C) VILLE : PUTEAUX (E) PAYS : (F) CODE POSTAL : (G) TELEPHONE : (H) TELECOPIE : 01.49.91.46.10(ii) TITRE DE L' INVENTION : Gènes de biosynthese et de transfert des
6-desoxyhexoses chez Saccharopolyspora erythraea et chez
Streptomyces antibioticus et leur utilisation.
SEQUENCES LIST (1) GENERAL INFORMATION: (i) DEPOSITOR: (A) NAME: Hoechst Marion Roussel (B) STREET: Terrasse Bellini (C) CITY: PUTEAUX (E) COUNTRY: (F) POSTAL CODE: (G) TELEPHONE : (H) FAX: 01.49.91.46.10 (ii) TITLE OF THE INVENTION: Genes for biosynthesis and transfer of
6-desoxyhexoses in Saccharopolyspora erythraea and in
Streptomyces antibioticus and their use.

(iii) NOMBRE DE SEQUENCES : (iv) FORME DECHIFFRABLE PAR ORDINATEUR: (A) TYPE DE SUPPORT : disk (B) ORDINATEUR : PC compatible (C) SYSTEME D' EXPLOITATION : (D) LOGICIEL: Patentin Release #1.0, Version #1.30 (OEB) (2) INFORMATIONS POUR LA SEQ ID NO: 1 : (i) CARACTERISTIQUES DE LA SEQUENCE: (A) LONGUEUR : paires de bases (B) TYPE: nucléotide (C) NOMBRE DE BRINS : (D) CONFIGURATION : linéaire(ii) TYPE DE MOLECULE: ADNc (vi) ORIGINE: (A) ORGANISME : Saccharopolyspora erythraea (ix) CARACTERISTIQUE: (A) NOM/CLE : CDS (B) EMPLACEMENT:complement (48..1046) (D) AUTRES INFORMATIONS:/function= "implique dans la biosynthese du mycarose" /gene= "eryBII"  (iii) NUMBER OF SEQUENCES: (iv) FORM DECEPTED BY COMPUTER: (A) TYPE OF MEDIA: disk (B) COMPUTER: compatible PC (C) OPERATING SYSTEM: (D) SOFTWARE: Patentin Release # 1.0, Version # 1.30 (EPO) (2) INFORMATION FOR SEQ ID NO: 1: (i) CHARACTERISTICS OF THE SEQUENCE: (A) LENGTH: base pairs (B) TYPE: nucleotide (C) NUMBER OF STRANDS: (D) CONFIGURATION: linear (ii) TYPE OF MOLECULE: cDNA (vi) ORIGIN: (A) ORGANISM: Saccharopolyspora erythraea (ix) CHARACTERISTIC: (A) NAME / KEY: CDS (B) LOCATION: complement (48..1046) (D) OTHERS INFORMATION: / function = "involved in the biosynthesis of mycarosis" / gene = "eryBII"

<Desc/Clms Page number 73><Desc / Clms Page number 73>

(ix) CARACTERISTIQUE: (A) NOM/CLE : (B) EMPLACEMENT:complement (2322..3404) (D) AUTRES INFORMATIONS:/function= "implique dans la biosynthese de la desosamine" /gene= "eryCII" (xi) DESCRIPTION DE LA SEQUENCE : ID NO: 1: GCTTCACGCT CACCAGCCGT ATCCTTTCTC GGTTCCTCTT GTGCTCACTG CAACCAGGCT 60 TCCGGCGCCG CGCCGCCGGA GGCCACCGCG GGGAAGATCT CGTCCAGTTC GGACAGCGCC 120 TGCTCGTCCA GGGTCATCGC GGACGCCTTC AGCGCGGAGT CGAGCTGCTC GGGGGTTCGC 180 GGGCCGATGA CGGCGCCGGC GATGCCGGGC CGGGACAGCA CCCATGCGAG CCCCACCTCG 240 GCCGGGTCTT CGCCGAGGTT GCGGCAGAAC TTCTCGTAGG CCTCGATCGC CGGGCGCAGG 300 GACGGCAACA GCACCTGCGC ACGGCCCTGC GCCGACTTCA CCGCGGTGCC CGCGGCCAGC 360 TTCTCCAGCG CTCCGCTGAG CAGGCCGCCG TGCAGCGGCG ACCAGGCGAA GACGCCGAGC 420 CCGTAGGCCT GCGCGGCGGG CAGCACCTCC AGCTCGGCGT GCCGGACCGC CAGGTTGTAC 480 AGGCACTGGT GGGAGACCAT GCCCAGGGAG TGGCGGCGGG CGGCGTTCTC CTGCGCGGCG 540 GCGATGTGCC AGCCCGCGAA GTTCGACGAG CCGACGTAGG AGACCTTGCC GCTGGCGACG 600 AGGCTGTCCA TGGCCTGCCA CACCTCGTCC CACGGCGCGG ACCGGTCGAT GTGGTGCATC 660 TGGTAGACGT CGATGTGGTC GACGCCCAGC CTGCGCAGCG ATCCCTCGCA GGAGGCGATG 720 ATGTGCCGCG CCGACAGCCC GCTGTCGTTG ACGCGCTCGC TCATCTCGCC GCCGACCTTG 780 GTCGCCAGCA CGGTGTCCTC GCGCCGTCCG CCGCCCTGGG CCAGCCACCT GCCCACCAGC 840 TCCTCGGTGT GGCCCTTGTA GAGCCGCCAG CCGTACATGT CGGCGGTGTC GAGGCAGTTG 900 ATGCCGCGGT CCCGGGCGTG GTCCATCAGG CGCAGCGCGT CGTCGTCCTC GACGCGTCCG 960 CTGAAGTTCA CCGTGCCGAG CCAGAGCCTG CTGGTGAGCA GCGCGGAACG CCCGAGCCGC 1020 ACGTGCGTCG CGGCGTCGGT GGTCATCGTG GTTCTCTCCT TCCTGCGGCC AGTTCCTCGC 1080  (ix) CHARACTERISTIC: (A) NAME / KEY: (B) LOCATION: complement (2322..3404) (D) OTHER INFORMATION: / function = "involved in the biosynthesis of desosamine" / gene = "eryCII" (xi ) SEQUENCE DESCRIPTION: ID NO: 1: GCTTCACGCT CACCAGCCGT ATCCTTTCTC GGTTCCTCTT GTGCTCACTG CAACCAGGCT 60 TCCGGCGCCG CGCCGCCGGA GGCCACCGCG GGGAAGATCT CGTCCAGTTC GGACAGCGCC 120 TGCTCGTCCA GGGTCATCGC GGACGCCTTC AGCGCGGAGT CGAGCTGCTC GGGGGTTCGC 180 GGGCCGATGA CGGCGCCGGC GATGCCGGGC CGGGACAGCA CCCATGCGAG CCCCACCTCG 240 GCCGGGTCTT CGCCGAGGTT GCGGCAGAAC TTCTCGTAGG CCTCGATCGC CGGGCGCAGG 300 GACGGCAACA GCACCTGCGC ACGGCCCTGC GCCGACTTCA CCGCGGTGCC CGCGGCCAGC 360 TTCTCCAGCG CTCCGCTGAG CAGGCCGCCG TGCAGCGGCG ACCAGGCGAA GACGCCGAGC 420 CCGTAGGCCT GCGCGGCGGG CAGCACCTCC AGCTCGGCGT GCCGGACCGC CAGGTTGTAC 480 AGGCACTGGT GGGAGACCAT GCCCAGGGAG TGGCGGCGGG CGGCGTTCTC CTGCGCGGCG 540 GCGATGTGCC AGCCCGCGAA GTTCGACGAG CCGACGTAGG AGACCTTGCC GCTGGCGACG 600 AGGCTGTCCA TGGCCTGCCA CACCTCGTCC CACGGCGCGG ACCGGTCGAT GTGGTGCATC 660 TGGTAGACGT C GATGTGGTC GACGCCCAGC CTGCGCAGCG ATCCCTCGCA GGAGGCGATG 720 ATGTGCCGCG CCGACAGCCC GCTGTCGTTG ACGCGCTCGC TCATCTCGCC GCCGACCTTG 780 GTCGCCAGCA CGGTGTCCTC GCGCCGTCCG CCGCCCTGGG CCAGCCACCT GCCCACCAGC 840 TCCTCGGTGT GGCCCTTGTA GAGCCGCCAG CCGTACATGT CGGCGGTGTC GAGGCAGTTG 900 ATGCCGCGGT CCCGGGCGTG GTCCATCAGG CGCAGCGCGT CGTCGTCCTC GACGCGTCCG 960 CTGAAGTTCA CCGTGCCGAG CCAGAGCCTG CTGGTGAGCA GCGCGGAACG CCCGAGCCGC 1020 ACGTGCGTCG CGGCGTCGGT GGTCATCGTG GTTCTCTCCT TCCTGCGGCC AGTTCCTCGC 1080

<Desc/Clms Page number 74><Desc / Clms Page number 74>

AGATGCCGAC GACCTCGGCC GGTGACGGCT CCGCGAGCAT GTCGTCGCGC ATCCGCGCCG 1140 CGCCGGCGCG GTGGGCCGGG TCGTCGAGGA CCCGCTTCAC CGACTCCCGG AGCTGGTCGG 1200 GGGTCAGCTC GGGCACGGGC AGCGCGATCC CCGCCCCGAA TTCCTGCGTG CGCTGCGCGC 1260 GCACGCCGGT GTCCCAGCCG TCGGGCAGGA TCACCTGCGG CACGCCGTGG ATCGCCGCGG 1320 TGTGCCAGCT CCCGGGTCCG CCGTGGTGCA CCGTCGCCGC GCAGGTCGGC AGCAGCGCGT 1380 GCATCGGGAC GAAGCCGACC GTGCGGACGT TGTCCGGGAT GTTCGCGACG CCTTCTAGCT 1440 GCTGCGCGTC GAAGGTCGCG ATGATCTCGG CGTCGACGTC GCCGACGGCA CCCAGCAGCT 1500 CCTCGATGGA GACCTGCCCG ATGCTGTTCT CGCGGCTGGA GATCCCGAGC GTGAGGCACA 1560 CGCGGCGGCG CTCGGGCTCG TCGTGCAGCC ATTCCGGCAC CACGGACGGC CCGTTGTAGT 1620 CGACGTAGCG CATCCCGACG GTCTTCAGGC CGGTGTCGAG CCTGATCGCG GCCGGGGCGG 1680 GGTCGATCGT CCACTGCCCG ACGACCACCT CCTCGTCGAA GGCCGGGCCG CCGTACTTCT 1740 CCAGCGTCCA GGTGAGCCAC TCGGCGAGCG GGTCCTCCCG GTGCTCCTCC GGCTGGTCGG 1800 GCAGCAGGCC GAGGAAGTTC TGCCGCGCCC GGGTGGTGAT GTCGGGTCCC CACAGCAGCC 1860 GCGCGTGCGG CGTTCCGGTC ACCGCCGCCG CGATGGGCGC GGCGAAGGTG AGCGGCTCCC 1920 AGATGACCAG GTCGGGCCGC CACTTCCGGC AGAACGAGAC CATGCCTTCG ATGAGCGTGT 1980 CCGGGCTCAT CAGGGCGTAG AAGGTCGGGG TGAGCACGGT CTGCATGCCC AGCAGGTGCT 2040 CCCAGGTCAA GGTGGCGGGG TCCCGCTCGC TGAAGTCCAG GCTCCGGACG TAGTCGATGA 2100 TGTCGTGGCC CGCGTGGGTC ATGAAGTCCA CGAGGTCGAC GTCGGTGCCG ACCGGGACGG 2160 CGGTCAGCCC GGCCGCGGTG ATGTCCTCGG TGAGCGCCGG GGACGCGACC ACGCGGACCT 2220 CGTGCCCCGC CGCGCGGAAC GCCCATGCGA GGGGGACGAG GCCGAAGAGG TGGCTCTTGC 2280 TGGCCATGGA GGAGAAGACG ACGCGCATCG CGGTTACCTC AGAGCTCGAC GGGGCAGCGG 2340 TTGGTTCCCC GCAGGACGGG TGATCGGCGG CGCCGGACGA CCGGGCCGCT GGGCGTGAGT 2400 CCGGGCAGCG CCTTGGCCGC GGCCCGCAGT GCGGCGGTGG CGAGCGCGGT GACCAGCTCC 2460  AGATGCCGAC GACCTCGGCC GGTGACGGCT CCGCGAGCAT GTCGTCGCGC ATCCGCGCCG 1140 CGCCGGCGCG GTGGGCCGGG TCGTCGAGGA CCCGCTTCAC CGACTCCCGG AGCTGGTCGG 1200 GGGTCAGCTC GGGCACGGGC AGCGCGATCC CCGCCCCGAA TTCCTGCGTG CGCTGCGCGC 1260 GCACGCCGGT GTCCCAGCCG TCGGGCAGGA TCACCTGCGG CACGCCGTGG ATCGCCGCGG 1320 TGTGCCAGCT CCCGGGTCCG CCGTGGTGCA CCGTCGCCGC GCAGGTCGGC AGCAGCGCGT 1380 GCATCGGGAC GAAGCCGACC GTGCGGACGT TGTCCGGGAT GTTCGCGACG CCTTCTAGCT 1440 GCTGCGCGTC GAAGGTCGCG ATGATCTCGG CGTCGACGTC GCCGACGGCA CCCAGCAGCT 1500 CCTCGATGGA GACCTGCCCG ATGCTGTTCT CGCGGCTGGA GATCCCGAGC GTGAGGCACA 1560 CGCGGCGGCG CTCGGGCTCG TCGTGCAGCC ATTCCGGCAC CACGGACGGC CCGTTGTAGT 1620 CGACGTAGCG CATCCCGACG GTCTTCAGGC CGGTGTCGAG CCTGATCGCG GCCGGGGCGG 1680 GGTCGATCGT CCACTGCCCG ACGACCACCT CCTCGTCGAA GGCCGGGCCG CCGTACTTCT 1740 CCAGCGTCCA GGTGAGCCAC TCGGCGAGCG GGTCCTCCCG GTGCTCCTCC GGCTGGTCGG 1800 GCAGCAGGCC GAGGAAGTTC TGCCGCGCCC GGGTGGTGAT GTCGGGTCCC CACAGCAGCC 1860 GCGCGTGCGG CGTTCCGGTC ACCGCCGCCG CGATGGGCGC GGCGAAGGTG AGCGGCTCCC 1920 AGATGA GCC GTCGGGCCGC CACTTCCGGC AGAACGAGAC CATGCCTTCG ATGAGCGTGT 1980 CCGGGCTCAT CAGGGCGTAG AAGGTCGGGG TGAGCACGGT CTGCATGCCC AGCAGGTGCT 2040 CCCAGGTCAA GGTGGCGGGG TCCCGCTCGC TGAAGTCCAG GCTCCGGACG TAGTCGATGA 2100 TGTCGTGGCC CGCGTGGGTC ATGAAGTCCA CGAGGTCGAC GTCGGTGCCG ACCGGGACGG 2160 CGGTCAGCCC GGCCGCGGTG ATGTCCTCGG TGAGCGCCGG GGACGCGACC ACGCGGACCT 2220 CGTGCCCCGC CGCGCGGAAC GCCCATGCGA GGGGGACGAG GCCGAAGAGG TGGCTCTTGC 2280 TGGCCATGGA GGAGAAGACG ACGCGCATCG CGGTTACCTC AGAGCTCGAC GGGGCAGCGG 2340 TTGGTTCCCC GCAGGACGGG TGATCGGCGG CGCCGGACGA CCGGGCCGCT GGGCGTGAGT 2400 CCGGGCAGCG CCTTGGCCGC GGCCCGCAGT GCGGCGGTGG CGAGCGCGGT GACCAGCTCC 2460

<Desc/Clms Page number 75><Desc / Clms Page number 75>

TCCAGCCTGC CGGGGTGGCC GCGATGTGCC GACAGCGCGC GGTCGGCGTC GGGGCGGTCC 2520 ACGTCGAGGC GGTCGGGCTC GGCGAAGACC TCCGGGTCGC GGTTGGCCGC CGCGACGACG 2580 ACCACGACCT CCTCGCCTTC GCCGATCACG TGCTCGCCGA GCCGCACCTC TGCGGTGGCC 2640 GTGCGCCGCT CCAGGTGCAA TGCCGGGTGC AGGCGCAGCA CCTCGGCGAC GGTTCGCTGC 2700 GCGGCGGCGG GGTCGTCGGC GATCCGTTCG GCCAGCCCCG GTTCGGCCGA GACGGCCAGG 2760 ACCGCGTCGA CCACGGTGTT CGCGGTCATC TCGGCCCCGG CGAACAGGGC GCGCAGTGCG 2820 GGGTCGGCGG GCAGTGCCGC GACCGCTGCT TCGGTCACCG CGAGCTGCTG CGGGCTGAGC 2880 TGGGCGTCCA GGCTGACGCG GGCGTCCCAC GCGGCGCCGC GCAGCACTCC GGCTGCGCCG 2940 AGCACGGCGG TCATGCCCTG CACCGGTACC TGCCAGGCGA AGTCGCCGAC CAGGTCCAGC 3000 CGCGCGCCCG CGCCGGGGAG CAGACCGGCG AAGCTCTCCG CCAGTTCCCC GACGTCGGGG 3060 ACCTCGCCTT CCCAGGACGC GGCGTGCACG TCCCGGAACG GCTGGGCCCA CTCGGCGGGT 3120 GGCGCGCCCG CGGCCCGCAT CCATTCCGGT GTGCGTCCGG TGGCGCGGGT GAACGCGGGG 3180 TCGTCGAGCA CCTGCCGGGC GGTGGCGTGG TCGGCCACCA CCCACGTCTC GGTGCGGCTG 3240 CGCCGCACAC CGGACTCGCG CATCGAGCGG TACCGGCGCT GCGGGTCGTC GTCGTGTCCG 3300 CACAGCAGCA TCGGGTAAGG GTCGCCGTTG CTGCCGTAAC CCCAGTGCAG GCCGCGGATC 3360 ATCTGGAGCT GCCTGCCCAG CCCGGCGCGA TCGGTCGTGG TCATGAATTC CCTCCGCCCA 3420 GCCAGGCGTC GATGTGCCG 3439 (2) INFORMATIONS POUR LA SEQ ID NO: 2 : (i) CARACTERISTIQUES DE LA SEQUENCE: (A) LONGUEUR : 333 acides aminés (B) TYPE : aminé (D) CONFIGURATION : linéaire(ii) TYPE DE MOLECULE : (xi) DESCRIPTION DE LA SEQUENCE : ID NO: 2 :  TCCAGCCTGC CGGGGTGGCC GCGATGTGCC GACAGCGCGC GGTCGGCGTC GGGGCGGTCC 2520 ACGTCGAGGC GGTCGGGCTC GGCGAAGACC TCCGGGTCGC GGTTGGCCGC CGCGACGACG 2580 ACCACGACCT CCTCGCCTTC GCCGATCACG TGCTCGCCGA GCCGCACCTC TGCGGTGGCC 2640 GTGCGCCGCT CCAGGTGCAA TGCCGGGTGC AGGCGCAGCA CCTCGGCGAC GGTTCGCTGC 2700 GCGGCGGCGG GGTCGTCGGC GATCCGTTCG GCCAGCCCCG GTTCGGCCGA GACGGCCAGG 2760 ACCGCGTCGA CCACGGTGTT CGCGGTCATC TCGGCCCCGG CGAACAGGGC GCGCAGTGCG 2820 GGGTCGGCGG GCAGTGCCGC GACCGCTGCT TCGGTCACCG CGAGCTGCTG CGGGCTGAGC 2880 TGGGCGTCCA GGCTGACGCG GGCGTCCCAC GCGGCGCCGC GCAGCACTCC GGCTGCGCCG 2940 AGCACGGCGG TCATGCCCTG CACCGGTACC TGCCAGGCGA AGTCGCCGAC CAGGTCCAGC 3000 CGCGCGCCCG CGCCGGGGAG CAGACCGGCG AAGCTCTCCG CCAGTTCCCC GACGTCGGGG 3060 ACCTCGCCTT CCCAGGACGC GGCGTGCACG TCCCGGAACG GCTGGGCCCA CTCGGCGGGT 3120 GGCGCGCCCG CGGCCCGCAT CCATTCCGGT GTGCGTCCGG TGGCGCGGGT GAACGCGGGG 3180 TCGTCGAGCA CCTGCCGGGC GGTGGCGTGG TCGGCCACCA CCCACGTCTC GGTGCGGCTG 3240 CGCCGCACAC CGGACTCGCG CATCGAGCGG TACCGGCGCT GCGGGTCGTC GTCGTGTCCG 3300 CACAGC AGCA TCGGGTAAGG GTCGCCGTTG CTGCCGTAAC CCCAGAGTGCAG GCCGCGGATC 3360 ATCTGGAGCT GCCTGCCCAG CCCGGCGCGA TCGGTCGTGG TCATGAATTC CCTCCGCCCA 3420 GCCAGGCGTC GATGTGCCG 3439 (2) INFORMATION FOR LAQ: AT QUANTIG: LAQ: amine (D) CONFIGURATION: linear (ii) TYPE OF MOLECULE: (xi) DESCRIPTION OF THE SEQUENCE: ID NO: 2:

<Desc/Clms Page number 76><Desc / Clms Page number 76>

Met Thr Thr Asp Ala Ala Thr His Val Arg Leu Gly Arg Ser Ala Leu
1 5 10 15 Leu Thr Ser Arg Leu Trp Leu Gly Thr Val Asn Phe Ser Gly Arg Val
20 25 30 Glu Asp Asp Asp Ala Leu Arg Leu Met Asp His Ala Arg Asp Arg Gly
35 40 45 Ile Asn Cys Leu Asp Thr Ala Asp Met Tyr Gly Trp Arg Leu Tyr Lys
50 55 60 Gly His Thr Glu Glu Leu Val Gly Arg Trp Leu Ala Gln Gly Gly Gly
65 70 75 80 Arg Arg Glu Asp Thr Val Leu Ala Thr Lys Val Gly Gly Glu Met Ser
85 90 95 Glu Arg Val Asn Asp Ser Gly Leu Ser Ala Arg His Ile Ile Ala Ser
100 105 110 Cys Glu Gly Ser Leu Arg Arg Leu Gly Val Asp His Ile Asp Val Tyr
115 120 125 Gln Met His His Ile Asp Arg Ser Ala Pro Trp Asp Glu Val Trp Gln
130 135 140 Ala Met Asp Ser Leu Val Ala Ser Gly Lys Val Ser Tyr Val Gly Ser 145 150 155 160 Ser Asn Phe Ala Gly Trp His Ile Ala Ala Ala Gln Glu Asn Ala Ala
165 170 175 Arg Arg His Ser Leu Gly Met Val Ser His Gln Cys Leu Tyr Asn Leu
180 185 190 Ala Val Arg His Ala Glu Leu Glu Val Leu Pro Ala Ala Gln Ala Tyr
195 200 205 Gly Leu Gly Val Phe Ala Trp Ser Pro Leu His Gly Gly Leu Leu Ser
210 215 220 Gly Ala Leu Glu Lys Leu Ala Ala Gly Thr Ala Val Lys Ser Ala Gln 225 230 235 240
Met Thr Thr Asp Ala Ala Thr His Val Arg Leu Gly Arg Ser Ala Leu
1 5 10 15 Leu Thr Ser Arg Leu Trp Leu Gly Thr Val Asn Phe Ser Gly Arg Val
20 25 30 Glu Asp Asp Asp Ala Leu Arg Leu Met Asp His Ala Arg Asp Arg Gly
35 40 45 Ile Asn Cys Leu Asp Thr Ala Asp Met Tyr Gly Trp Arg Leu Tyr Lys
50 55 60 Gly His Thr Glu Glu Leu Val Gly Arg Trp Leu Ala Gln Gly Gly Gly
65 70 75 80 Arg Arg Glu Asp Thr Val Leu Ala Thr Lys Val Gly Gly Glu Met Ser
85 90 95 Glu Arg Val Asn Asp Ser Gly Leu Ser Ala Arg His Ile Ile Ala Ser
100 105 110 Cys Glu Gly Ser Leu Arg Arg Leu Gly Val Asp His Ile Asp Val Tyr
115 120 125 Gln Met His His Ile Asp Arg Ser Ala Pro Trp Asp Glu Val Trp Gln
130 135 140 Ala Met Asp Ser Leu Val Ala Ser Gly Lys Val Ser Tyr Val Gly Ser 145 150 155 160 Ser Asn Phe Ala Gly Trp His Ile Ala Ala Ala Gln Glu Asn Ala Ala
165 170 175 Arg Arg His Ser Leu Gly Met Val Ser His Gln Cys Leu Tyr Asn Leu
180 185 190 Ala Val Arg His Ala Glu Leu Glu Val Leu Pro Ala Ala Gln Ala Tyr
195 200 205 Gly Leu Gly Val Phe Ala Trp Ser Pro Leu His Gly Gly Leu Leu Ser
210 215 220 Gly Ala Leu Glu Lys Leu Ala Ala Gly Thr Ala Val Lys Ser Ala Gln 225 230 235 240

<Desc/Clms Page number 77><Desc / Clms Page number 77>

Gly Arg Ala Gln Val Leu Leu Pro Ser Leu Arg Pro Ala Ile Glu Ala
245 250 255 Tyr Glu Lys Phe Cys Arg Asn Leu Gly Glu Asp Pro Ala Glu Val Gly
260 265 270 Leu Ala Trp Val Leu Ser Arg Pro Gly Ile Ala Gly Ala Val Ile Gly
275 280 285 Pro Arg Thr Pro Glu Gln Leu Asp Ser Ala Leu Lys Ala Ser Ala Met
290 295 300 Thr Leu Asp Glu Gln Ala Leu Ser Glu Leu Asp Glu Ile Phe Pro Ala 305 310 315 320 ValAla Ser Gly Gly Ala Ala Pro Glu Ala Trp Leu Gln
325 330 (2) INFORMATIONS POUR LA SEQ ID NO: 3 : (i) CARACTERISTIQUES DE LA SEQUENCE: (A) LONGUEUR : 361 acides aminés (B) TYPE : aminé (D) CONFIGURATION : linéaire(ii) TYPE DE MOLECULE : (xi) DESCRIPTION DE LA SEQUENCE : ID NO: 3 : Met Thr Thr Thr Asp Arg Ala Gly Leu Gly Arg Gln Leu Gln Met Ile
1 5 10 15 Arg Gly Leu His Trp Gly Tyr Gly Ser Asn Gly Asp Pro Tyr Pro Met
20 25 30 Leu Leu Cys Gly His Asp Asp Asp Pro Gln Arg Arg Tyr Arg Ser Met
35 40 45 Arg Glu Ser Gly Val Arg Arg Ser Arg Thr Glu Thr Trp Val Val Ala
50 55 60 Asp His Ala Thr Ala Arg Gln Val Leu Asp Asp Pro Ala Phe Thr Arg
65 70 75 80 Ala Thr Gly Arg Thr Pro Glu Trp Met Arg Ala Ala Gly Ala Pro Pro
85 90 95
Gly Arg Ala Gln Val Leu Leu Pro Ser Leu Arg Pro Ala Ile Glu Ala
245 250 255 Tyr Glu Lys Phe Cys Arg Asn Leu Gly Glu Asp Pro Ala Glu Val Gly
260 265 270 Leu Ala Trp Val Leu Ser Arg Pro Gly Ile Ala Gly Ala Val Ile Gly
275 280 285 Pro Arg Thr Pro Glu Gln Leu Asp Ser Ala Leu Lys Ala Ser Ala Met
290 295 300 Thr Leu Asp Glu Gln Ala Leu Ser Glu Leu Asp Glu Ile Phe Pro Ala 305 310 315 320 ValAla Ser Gly Gly Ala Ala Pro Glu Ala Trp Leu Gln
325 330 (2) INFORMATION FOR SEQ ID NO: 3: (i) CHARACTERISTICS OF THE SEQUENCE: (A) LENGTH: 361 amino acids (B) TYPE: amino (D) CONFIGURATION: linear (ii) TYPE OF MOLECULE: ( xi) DESCRIPTION OF THE SEQUENCE: ID NO: 3: Met Thr Thr Thr Asp Arg Ala Gly Leu Gly Arg Gln Leu Gln Met Ile
1 5 10 15 Arg Gly Leu His Trp Gly Tyr Gly Ser Asn Gly Asp Pro Tyr Pro Met
20 25 30 Leu Leu Cys Gly His Asp Asp Asp Pro Gln Arg Arg Tyr Arg Ser Met
35 40 45 Arg Glu Ser Gly Val Arg Arg Ser Arg Thr Glu Thr Trp Val Val Ala
50 55 60 Asp His Ala Thr Ala Arg Gln Val Leu Asp Asp Pro Ala Phe Thr Arg
65 70 75 80 Ala Thr Gly Arg Thr Pro Glu Trp Met Arg Ala Ala Gly Ala Pro Pro
85 90 95

<Desc/Clms Page number 78><Desc / Clms Page number 78>

Ala Glu Trp Ala Gln Pro Phe Arg Asp Val His Ala Ala Ser Trp Glu
100 105 110 Gly Glu Val Pro Asp Val Gly Glu Leu Ala Glu Ser Phe Ala Gly Leu
115 120 125 Leu Pro Gly Ala Gly Ala Arg Leu Asp Leu Val Gly Asp Phe Ala Trp
130 135 140 Gln Val Pro Val Gln Gly Met Thr Ala Val Leu Gly Ala Ala Gly Val 145 150 155 160 Leu Arg Gly Ala Ala Trp Asp Ala Arg Val Ser Leu Asp Ala Gln Leu
165 170 175 Ser Pro Gln Gln Leu Ala Val Thr Glu Ala Ala Val Ala Ala Leu Pro
180 185 190 Ala Asp Pro Ala Leu Arg Ala Leu Phe Ala Gly Ala Glu Met Thr Ala
195 200 205 Asn Thr Val Val Asp Ala Val Leu Ala Val Ser Ala Glu Pro Gly Leu
210 215 220 Ala Glu Arg Ile Ala Asp Asp Pro Ala Ala Ala Gln Arg Thr Val Ala 225 230 235 240 Glu Val Leu Arg Leu His Pro Ala Leu His Leu Glu Arg Arg Thr Ala
245 250 255 Thr Ala Glu Val Arg Leu Gly Glu His Val Ile Gly Glu Gly Glu Glu
260 265 270 Val Val Val Val Val Ala Ala Ala Asn Arg Asp Pro Glu Val Phe Ala
275 280 285 Glu Pro Asp Arg Leu Asp Val Asp Arg Pro Asp Ala Asp Arg Ala Leu
290 295 300 Ser Ala His Arg Gly His Pro Gly Arg Leu Glu Glu Leu Val Thr Ala 305 310 315 320 Leu Ala Thr Ala Ala Leu Arg Ala Ala Ala Lys Ala Leu Pro Gly Leu
325 330 335
Ala Glu Trp Ala Gln Pro Phe Arg Asp Val His Ala Ala Ser Trp Glu
100 105 110 Gly Glu Val Pro Asp Val Gly Glu Leu Ala Glu Ser Phe Ala Gly Leu
115 120 125 Leu Pro Gly Ala Gly Ala Arg Leu Asp Leu Val Gly Asp Phe Ala Trp
130 135 140 Gln Val Pro Val Gln Gly Met Thr Ala Val Leu Gly Ala Ala Gly Val 145 150 155 160 Leu Arg Gly Ala Ala Trp Asp Ala Arg Val Ser Leu Asp Ala Gln Leu
165 170 175 Ser Pro Gln Gln Leu Ala Val Thr Glu Ala Ala Val Ala Ala Leu Pro
180 185 190 Ala Asp Pro Ala Leu Arg Ala Leu Phe Ala Gly Ala Glu Met Thr Ala
195 200 205 Asn Thr Val Val Asp Ala Val Leu Ala Val Ser Ala Glu Pro Gly Leu
210 215 220 Ala Glu Arg Ile Ala Asp Asp Pro Ala Ala Ala Gln Arg Thr Val Ala 225 230 235 240 Glu Val Leu Arg Leu His Pro Ala Leu His Leu Glu Arg Arg Thr Ala
245 250 255 Thr Ala Glu Val Arg Leu Gly Glu His Val Ile Gly Glu Gly Glu Glu
260 265 270 Val Val Val Val Ala Ala Ala Asn Arg Asp Pro Glu Val Phe Ala
275 280 285 Glu Pro Asp Arg Leu Asp Val Asp Arg Pro Asp Ala Asp Arg Ala Leu
290 295 300 Ser Ala His Arg Gly His Pro Gly Arg Leu Glu Glu Leu Val Thr Ala 305 310 315 320 Leu Ala Thr Ala Ala Leu Arg Ala Ala Ala Lys Ala Leu Pro Gly Leu
325 330 335

<Desc/Clms Page number 79><Desc / Clms Page number 79>

Thr Pro Ser Gly Pro Val Val Arg Arg Arg Arg Ser Pro Val Leu Arg
340 345 350 Gly Thr Asn Arg Cys Pro Val Glu Leu
355 360 (2) INFORMATIONS POUR LA SEQ ID NO: 4 : (i) CARACTERISTIQUES DE LA SEQUENCE: (A) LONGUEUR : 1266 paires de bases (B) TYPE: nucléotide (C) NOMBRE DE BRINS : double(D) CONFIGURATION : linéaire (ii) TYPE DE MOLECULE: ADNc (vi) ORIGINE: (A) ORGANISME : Saccharopolyspora erythraea (ix) CARACTERISTIQUE: (A) NOM/CLE : CDS (B) EMPLACEMENT:complement (4..1266) (D) AUTRES INFORMATIONS:/function= "implique dans la biosynthese de la desosamine" /gene= "eryCIII" /note= "SEQ ID NO 1 DE 1046 A 2308" (xi) DESCRIPTION DE LA SEQUENCE : ID NO: 4 : TCATCGTGGT TCTCTCCTTC CTGCGGCCAG TTCCTCGCAG ATGCCGACGA CCTCGGCCGG 60 TGACGGCTCC GCGAGCATGT CGTCGCGCAT CCGCGCCGCG CCGGCGCGGT GGGCCGGGTC 120 GTCGAGGACC CGCTTCACCG ACTCCCGGAG CTGGTCGGGG GTCAGCTCGG GCACGGGCAG 180 CGCGATCCCC GCCCCGAATT CCTGCGTGCG CTGCGCGCGC ACGCCGGTGT CCCAGCCGTC 240 GGGCAGGATC ACCTGCGGCA CGCCGTGGAT CGCCGCGGTG TGCCAGCTCC CGGGTCCGCC 300 GTGGTGCACC GTCGCCGCGC AGGTCGGCAG CAGCGCGTGC ATCGGGACGA AGCCGACCGT 360 GCGGACGTTG TCCGGGATGT TCGCGACGCC TTCTAGCTGC TGCGCGTCGA AGGTCGCGAT 420 GATCTCGGCG TCGACGTCGC CGACGGCACC CAGCAGCTCC TCGATGGAGA CCTGCCCGAT 480
Thr Pro Ser Gly Pro Val Val Arg Arg Arg Ser Pro Val Leu Arg
340 345 350 Gly Thr Asn Arg Cys Pro Val Glu Leu
355 360 (2) INFORMATION FOR SEQ ID NO: 4: (i) CHARACTERISTICS OF THE SEQUENCE: (A) LENGTH: 1266 base pairs (B) TYPE: nucleotide (C) NUMBER OF STRANDS: double (D) CONFIGURATION: linear (ii) TYPE OF MOLECULE: cDNA (vi) ORIGIN: (A) ORGANISM: Saccharopolyspora erythraea (ix) CHARACTERISTIC: (A) NAME / KEY: CDS (B) LOCATION: complement (4..1266) (D) OTHERS INFORMATION: / function = "involved in the biosynthesis of desosamine" / gene = "eryCIII" / note = "SEQ ID NO 1 FROM 1046 TO 2308" (xi) DESCRIPTION OF THE SEQUENCE: ID NO: 4: TCATCGTGGT TCTCTCCTTC CTGCGGCCAG TTCCTCGCAG ATGCCGACGA CCTCGGCCGG 60 TGACGGCTCC GCGAGCATGT CGTCGCGCAT CCGCGCCGCG CCGGCGCGGT GGGCCGGGTC 120 GTCGAGGACC CGCTTCACCG ACTCCCGGAG CTGGTCGGGG GTCAGCTCGG GCACGGGCAG 180 CGCGATCCCC GCCCCGAATT CCTGCGTGCG CTGCGCGCGC ACGCCGGTGT CCCAGCCGTC 240 GGGCAGGATC ACCTGCGGCA CGCCGTGGAT CGCCGCGGTG TGCCAGCTCC CGGGTCCGCC 300 GTGGTGCACC GTCGCCGCGC AGGTCGGCAG CAGCGCGTGC ATCGGGACGA AGCCGACCGT 360 GCGGACGTTG TCCGGGATGT TCGCGACGCC TTC TAGCTGC TGCGCGTCGA AGGTCGCGAT 420 GATCTCGGCG TCGACGTCGC CGACGGCACC CAGCAGCTCC TCGATGGAGA CCTGCCCGAT 480

<Desc/Clms Page number 80><Desc / Clms Page number 80>

GCTGTTCTCG CGGCTGGAGA TCCCGAGCGT GAGGCACACG CGGCGGCGCT CGGGCTCGTC 540 GTGCAGCCAT TCCGGCACCA CGGACGGCCC GTTGTAGTCG ACGTAGCGCA TCCCGACGGT 600 CTTCAGGCCG GTGTCGAGCC TGATCGCGGC CGGGGCGGGG TCGATCGTCC ACTGCCCGAC 660 GACCACCTCC TCGTCGAAGG CCGGGCCGCC GTACTTCTCC AGCGTCCAGG TGAGCCACTC 720 GGCGAGCGGG TCCTCCCGGT GCTCCTCCGG CTGGTCGGGC AGCAGGCCGA GGAAGTTCTG 780 CCGCGCCCGG GTGGTGATGT CGGGTCCCCA CAGCAGCCGC GCGTGCGGCG TTCCGGTCAC 840 CGCCGCCGCG ATGGGCGCGG CGAAGGTGAG CGGCTCCCAG ATGACCAGGT CGGGCCGCCA 900 CTTCCGGCAG AACGAGACCA TGCCTTCGAT GAGCGTGTCC GGGCTCATCA GGGCGTAGAA 960 GGTCGGGGTG AGCACGGTCT GCATGCCCAG CAGGTGCTCC CAGGTCAAGG TGGCGGGGTC 1020 CCGCTCGCTG AAGTCCAGGC TCCGGACGTA GTCGATGATG TCGTGGCCCG CGTGGGTCAT 1080 GAAGTCCACG AGGTCGACGT CGGTGCCGAC CGGGACGGCG GTCAGCCCGG CCGCGGTGAT 1140 GTCCTCGGTG AGCGCCGGGG ACGCGACCAC GCGGACCTCG TGCCCCGCCG CGCGGAACGC 1200 CCATGCGAGG GGGACGAGGC CGAAGAGGTG GCTCTTGCTG GCCATGGAGG AGAAGACGAC 1260 GCGCAT 1266 (2) INFORMATIONS POUR LA SEQ ID NO: 5 : (i) CARACTERISTIQUES DE LA SEQUENCE : (A) LONGUEUR : 421 acides aminés (B) TYPE : acideaminé (D) CONFIGURATION : linéaire(ii) TYPE DE MOLECULE : (xi) DESCRIPTION DE LA SEQUENCE : ID NO: 5 : Met Arg Val Val Phe Ser Ser Met Ala Ser Lys Ser His Leu Phe Gly
1 5 10 15 Leu Val Pro Leu Ala Trp Ala Phe Arg Ala Ala Gly His Glu Val Arg
20 25 30
GCTGTTCTCG CGGCTGGAGA TCCCGAGCGT GAGGCACACG CGGCGGCGCT CGGGCTCGTC 540 GTGCAGCCAT TCCGGCACCA CGGACGGCCC GTTGTAGTCG ACGTAGCGCA TCCCGACGGT 600 CTTCAGGCCG GTGTCGAGCC TGATCGCGGC CGGGGCGGGG TCGATCGTCC ACTGCCCGAC 660 GACCACCTCC TCGTCGAAGG CCGGGCCGCC GTACTTCTCC AGCGTCCAGG TGAGCCACTC 720 GGCGAGCGGG TCCTCCCGGT GCTCCTCCGG CTGGTCGGGC AGCAGGCCGA GGAAGTTCTG 780 CCGCGCCCGG GTGGTGATGT CGGGTCCCCA CAGCAGCCGC GCGTGCGGCG TTCCGGTCAC 840 CGCCGCCGCG ATGGGCGCGG CGAAGGTGAG CGGCTCCCAG ATGACCAGGT CGGGCCGCCA 900 CTTCCGGCAG AACGAGACCA TGCCTTCGAT GAGCGTGTCC GGGCTCATCA GGGCGTAGAA 960 GGTCGGGGTG AGCACGGTCT GCATGCCCAG CAGGTGCTCC CAGGTCAAGG TGGCGGGGTC 1020 CCGCTCGCTG AAGTCCAGGC TCCGGACGTA GTCGATGATG TCGTGGCCCG CGTGGGTCAT 1080 GAAGTCCACG AGGTCGACGT CGGTGCCGAC CGGGACGGCG GTCAGCCCGG CCGCGGTGAT 1140 GTCCTCGGTG AGCGCCGGGG ACGCGACCAC GCGGACCTCG TGCCCCGCCG CGCGGAACGC 1200 CCATGCGAGG GGGACGAGGC CGAAGAGGTG GCTCTTGCTG GCCATGGAGG AGAAGACGAC 1260 GCGCAT 1266 (2) INFORMATION FOR SEQ ID NO: 5: (i) CHARACTERISTICS OF THE SEQUEN EC: (A) LENGTH: 421 amino acids (B) TYPE: amino acid (D) CONFIGURATION: linear (ii) TYPE OF MOLECULE: (xi) DESCRIPTION OF THE SEQUENCE: ID NO: 5: Met Arg Val Val Phe Ser Ser Met Ala Ser Lys Ser His Leu Phe Gly
1 5 10 15 Leu Val Pro Leu Ala Trp Ala Phe Arg Ala Ala Gly His Glu Val Arg
20 25 30

<Desc/Clms Page number 81><Desc / Clms Page number 81>

Val Val Ala Ser Pro Ala Leu Thr Glu Asp Ile Thr Ala Ala Gly Leu
35 40 45 Thr Ala Val Pro Val Gly Thr Asp Val Asp Leu Val Asp Phe Met Thr
50 55 60 His Ala Gly His Asp Ile Ile Asp Tyr Val Arg Ser Leu Asp Phe Ser
65 70 75 80 Glu Arg Asp Pro Ala Thr Leu Thr Trp Glu His Leu Leu Gly Met Gln
85 90 95 Thr Val Leu Thr Pro Thr Phe Tyr Ala Leu Met Ser Pro Asp Thr Leu
100 105 110 Ile Glu Gly Met Val Ser Phe Cys Arg Lys Trp Arg Pro Asp Leu Val
115 120 125 Ile Trp Glu Pro Leu Thr Phe Ala Ala Pro Ile Ala Ala Ala Val Thr
130 135 140 Gly Thr Pro His Ala Arg Leu Leu Trp Gly Pro Asp Ile Thr Thr Arg 145 150 155 160 Ala Arg Gln Asn Phe Leu Gly Leu Leu Pro Asp Gln Pro Glu Glu His
165 170 175 Arg Glu Asp Pro Leu Ala Glu Trp Leu Thr Trp Thr Leu Glu Lys Tyr
180 185 190 Gly Gly Pro Ala Phe Asp Glu Glu Val Val Val Gly Gln Trp Thr Ile
195 200 205 Asp Pro Ala Pro Ala Ala Ile Arg Leu Asp Thr Gly Leu Lys Thr Val
210 215 220 Gly Met Arg Tyr Val Asp Tyr Asn Gly Pro Ser Val Val Pro Glu Trp 225 230 235 240 Leu His Asp Glu Pro Glu Arg Arg Arg Val Cys Leu Thr Leu Gly Ile
245 250 255 Ser Ser Arg Glu Asn Ser Ile Gly Gln Val Ser Ile Glu Glu Leu Leu
260 265 270
Val Val Ala Ser Pro Ala Leu Thr Glu Asp Ile Thr Ala Ala Gly Leu
35 40 45 Thr Ala Val Pro Val Gly Thr Asp Val Asp Leu Val Asp Phe Met Thr
50 55 60 His Ala Gly His Asp Ile Ile Asp Tyr Val Arg Ser Leu Asp Phe Ser
65 70 75 80 Glu Arg Asp Pro Ala Thr Leu Thr Trp Glu His Leu Leu Gly Met Gln
85 90 95 Thr Val Leu Thr Pro Thr Phe Tyr Ala Leu Met Ser Pro Asp Thr Leu
100 105 110 Ile Glu Gly Met Val Ser Phe Cys Arg Lys Trp Arg Pro Asp Leu Val
115 120 125 Ile Trp Glu Pro Leu Thr Phe Ala Ala Pro Ile Ala Ala Ala Val Thr
130 135 140 Gly Thr Pro His Ala Arg Leu Leu Trp Gly Pro Asp Ile Thr Thr Arg 145 150 155 160 Ala Arg Gln Asn Phe Leu Gly Leu Leu Pro Asp Gln Pro Glu Glu His
165 170 175 Arg Glu Asp Pro Leu Ala Glu Trp Leu Thr Trp Thr Leu Glu Lys Tyr
180 185 190 Gly Gly Pro Ala Phe Asp Glu Glu Val Val Val Gly Gln Trp Thr Ile
195 200 205 Asp Pro Ala Pro Ala Ala Ile Arg Leu Asp Thr Gly Leu Lys Thr Val
210 215 220 Gly Met Arg Tyr Val Asp Tyr Asn Gly Pro Ser Val Val Pro Glu Trp 225 230 235 240 Leu His Asp Glu Pro Glu Arg Arg Arg Cys Leu Thr Leu Gly Ile
245 250 255 Ser Ser Arg Glu Asn Ser Ile Gly Gln Val Ser Ile Glu Glu Leu Leu
260 265 270

<Desc/Clms Page number 82><Desc / Clms Page number 82>

Gly Ala Val Gly Asp Val Asp Ala Glu Ile Ile Ala Thr Phe Asp Ala
275 280 285 Gln Gln Leu Glu Gly Val Ala Asn Ile Pro Asp Asn Val Arg Thr Val
290 295 300 Gly Phe Val Pro Met His Ala Leu Leu Pro Thr Cys Ala Ala Thr Val 305 310 315 320 His His Gly Gly Pro Gly Ser Trp His Thr Ala Ala Ile His Gly Val
325 330 335 Pro Gln Val Ile Leu Pro Asp Gly Trp Asp Thr Gly Val Arg Ala Gln
340 345 350 Arg Thr Gln Glu Phe Gly Ala Gly Ile Ala Leu Pro Val Pro Glu Leu
355 360 365 Thr Pro Asp Gln Leu Arg Glu Ser Val Lys Arg Val Leu Asp Asp Pro
370 375 380 Ala His Arg Ala Gly Ala Ala Arg Met Arg Asp Asp Met Leu Ala Glu 385 390 395 400 Pro Ser Pro Ala Glu Val Val Gly Ile Cys Glu Glu Leu Ala Ala Gly
405 410 415 Arg Arg Glu Pro Arg
420 (2) INFORMATIONS POUR LA SEQ ID NO: 6 : (i) CARACTERISTIQUES DE LA SEQUENCE : (A) LONGUEUR : 8160 paires de bases (B) TYPE: nucléotide (C) NOMBRE DE BRINS : (D) CONFIGURATION : linéaire(ii) TYPE DE MOLECULE : (génomique) (vi) ORIGINE: (A) ORGANISME : Saccharopolyspora erythraea (ix) CARACTERISTIQUE: (A) NOM/CLE : CDS
Gly Ala Val Gly Asp Val Asp Ala Glu Ile Ala Island Thr Phe Asp Ala
275 280 285 Gln Gln Leu Glu Gly Val Ala Asn Ile Pro Asp Asn Val Arg Thr Val
290 295 300 Gly Phe Val Pro Met His Ala Leu Leu Pro Thr Cys Ala Ala Thr Val 305 310 315 320 His His Gly Gly Pro Gly Ser Trp His Thr Ala Ala Ile His Gly Val
325 330 335 Pro Gln Val Ile Leu Pro Asp Gly Trp Asp Thr Gly Val Arg Ala Gln
340 345 350 Arg Thr Gln Glu Phe Gly Ala Gly Ile Ala Leu Pro Val Pro Glu Leu
355 360 365 Thr Pro Asp Gln Leu Arg Glu Ser Val Lys Arg Val Leu Asp Asp Pro
370 375 380 Ala His Arg Ala Gly Ala Ala Arg Met Arg Asp Asp Met Leu Ala Glu 385 390 395 400 Pro Ser Pro Ala Glu Val Val Gly Ile Cys Glu Glu Leu Ala Ala Gly
405 410 415 Arg Arg Glu Pro Arg
420 (2) INFORMATION FOR SEQ ID NO: 6: (i) CHARACTERISTICS OF THE SEQUENCE: (A) LENGTH: 8160 base pairs (B) TYPE: nucleotide (C) NUMBER OF STRANDS: (D) CONFIGURATION: linear ( ii) TYPE OF MOLECULE: (genomics) (vi) ORIGIN: (A) ORGANISM: Saccharopolyspora erythraea (ix) CHARACTERISTIC: (A) NAME / KEY: CDS

<Desc/Clms Page number 83><Desc / Clms Page number 83>

(B) EMPLACEMENT:242..1207 (D) AUTRES INFORMATIONS:/function= "implique dans la biosynthese du mycarose" /gene= "eryBIV" /transl~except= (pos: 242.. 244, aa : (ix) CARACTERISTIQUE: (A) NOM/CLE: CDS (B) EMPLACEMENT:1210..2454 (D) AUTRES INFORMATIONS:/function= "implique dans la biosynthese du mycarose" /gene= "eryBV" /transl~except= (pos: 1210.. 1212, aa : (ix) CARACTERISTIQUE: (A) NOM/CLE: CDS (B) EMPLACEMENT:2510..3220 (D) AUTRES INFORMATIONS:/function= "implique dans la biosynthese de la desosamine" /gene= "eryCVI" (ix) CARACTERISTIQUE: (A) NOM/CLE: CDS (B) EMPLACEMENT:3308..4837 (D) AUTRES INFORMATIONS:/function= "implique dans la biosynthese du mycarose" /gene= "eryBVI" /transl~except= (pos: 3308.. 3310, aa : (ix) CARACTERISTIQUE: (A) NOM/CLE: CDS (B) EMPLACEMENT:6080..7546 (D) AUTRES INFORMATIONS:/function= "implique dans la biosynthese de la desosamine" /gene= "eryCV" (ix) CARACTERISTIQUE: (A) NOM/CLE: CDS (B) EMPLACEMENT:7578..8156 (D) AUTRES INFORMATIONS:/function= "implique dans la biosynthese du mycarose" /gene= "eryBVII" /transl except= (pos: 7578.. 7580, aa : (ix) CARACTERISTIQUE: (A) NOM/CLE: mat~peptide  (B) LOCATION: 242..1207 (D) OTHER INFORMATION: / function = "involved in the biosynthesis of mycarosis" / gene = "eryBIV" / transl ~ except = (pos: 242 .. 244, aa: (ix) CHARACTERISTIC: (A) NAME / KEY: CDS (B) LOCATION: 1210..2454 (D) OTHER INFORMATION: / function = "involved in the biosynthesis of mycarosis" / gene = "eryBV" / transl ~ except = (pos: 1210 .. 1212, aa: (ix) CHARACTERISTIC: (A) NAME / KEY: CDS (B) LOCATION: 2510..3220 (D) OTHER INFORMATION: / function = "involves in the biosynthesis of desosamine" / gene = "eryCVI" (ix) CHARACTERISTIC: (A) NAME / KEY: CDS (B) LOCATION: 3308..4837 (D) OTHER INFORMATION: / function = "involved in the biosynthesis of mycarosis" / gene = "eryBVI" / transl ~ except = (pos: 3308 .. 3310, aa: (ix) CHARACTERISTIC: (A) NAME / KEY: CDS (B) LOCATION: 6080..7546 (D) OTHER INFORMATION: / function = "involved in the biosynthesis of la desosamine "/ gene =" eryCV "(ix) CHARACTERISTIC: (A) NAME / KEY: CDS (B) LOCATION: 7578..8156 (D) OTHER INFORMATION: / function =" implies dan s the biosynthesis of mycarosis "/ gene =" eryBVII "/ transl except = (pos: 7578 .. 7580, aa: (ix) CHARACTERISTIC: (A) NAME / KEY: mat ~ peptide

<Desc/Clms Page number 84><Desc / Clms Page number 84>

(B) EMPLACEMENT:242 (xi) DESCRIPTION DE LA SEQUENCE : (B) LOCATION: 242 (xi) DESCRIPTION OF THE SEQUENCE:

* ID NO: 6 : TTTGACAGGT CCGCCACGCG TCCCCCTACT CGACGACCAC GCAATGGGCG AACAATATAG 60 GAAGGATCAA GAGGTTGACA TCGCCTCGTC GAGCCAACGA ACCTGTGAAC ATCTGCATGT 120 TGACAAGATC AACGGCGGCT ACCTACTGTG GTGGCCCAGT GACGGGTTGC CGCACATCGC 180 GCTGGGGAGA TTCTTTGAAT TTCGCCCGTA GCACCGACCT GGAAAGCGAG CAAATGCTCC 240 G GTG AAT GGG ATC AGT GAT TCC CCG CGT CAA TTG ATC ACC CTT CTG 286
Met Asn Gly Ile Ser Asp Ser Pro Arg Gln Leu Ile Thr Leu Leu 1 5 10 15 GGC GCT TCC GGC TTC GTC GGG AGC GCG GTT CTG CGC GAG CTG CGC GAC 334 Gly Ala Ser Gly Phe Val Gly Ser Ala Val Leu Arg Glu Leu Arg Asp
20 25 30 CAC CCG GTC CGG CTG CGC GCG GTG TCC CGC GGC GGA GCG CCC GCG GTT 382 His Pro Val Arg Leu Arg Ala Val Ser Arg Gly Gly Ala Pro Ala Val
35 40 45 CCG CCC GGC GCC GCG GAG GTC GAG GAC CTG CGC GCC GAC CTG CTG GAA 430 Pro Pro Gly Ala Ala Glu Val Glu Asp Leu Arg Ala Asp Leu Leu Glu
50 55 60 CCG GGC CGG-GCC GCC GCC GCG ATC GAG GAC GCC GAC GTG ATC GTG CAC 478 Pro Gly Arg Ala Ala Ala Ala Ile Glu Asp Ala Asp Val Ile Val His
65 70 75 CTG GTG GCG CAC GCA GCG GGC GGT TCC ACC TGG CGC AGC GCC ACC TCC 526 Leu Val Ala His Ala Ala Gly Gly Ser Thr Trp Arg Ser Ala Thr Ser
80 85 90 95 GAC CCG GAA GCC GAG CGG GTC AAC GTC GGC CTG ATG CAC GAC CTC GTC 574 Asp Pro Glu Ala Glu Arg Val Asn Val Gly Leu Met His Asp Leu Val
100 105 110 GGC GCG CTG CAC GAT CGC CGC AGG TCG ACG CCG CCC GTG TTG CTC TAC 622 Gly Ala Leu His Asp Arg Arg Arg Ser Thr Pro Pro Val Leu Leu Tyr
115 120 125
* ID NO: 6: TTTGACAGGT CCGCCACGCG TCCCCCTACT CGACGACCAC GCAATGGGCG AACAATATAG 60 GAAGGATCAA GAGGTTGACA TCGCCTCGTC GAGCCAACGA ACCTGTGAAC ATCTGCATGT 120 TGACAAGATC AACGGCGGCT ACCTACTGTG GTGGCCCAGT GACGGGTTGC CGCACATCGC 180 GCTGGGGAGA TTCTTTGAAT TTCGCCCGTA GCACCGACCT GGAAAGCGAG CAAATGCTCC 240 G GTG AAT GGG ATC AGT GAT TCC CGC CGT CAA TTG ATC ACC CTT CTG 286
Met Asn Gly Ile Ser Asp Ser Pro Arg Gln Leu Ile Thr Leu Leu 1 5 10 15 GGC GCT TCC GGC TTC GTC GGG AGC GCG GTT CTG CGC GAG CTG CGC GAC 334 Gly Ala Ser Gly Phe Val Gly Ser Ala Val Leu Arg Glu Leu Arg Asp
20 25 30 CAC CCG GTC CGG CTG CGC GCG GTG TCC CGC GGC GGA GCG CCC GCG GTT 382 His Pro Val Arg Leu Arg Ala Val Ser Arg Gly Gly Ala Pro Ala Val
35 40 45 CCG CCC GGC GCC GCG GAG GTC GAG GAC CTG CGC GCC GAC CTG CTG GAA 430 Pro Pro Gly Ala Ala Glu Val Glu Asp Leu Arg Ala Asp Leu Leu Glu
50 55 60 CCG GGC CGG-GCC GCC GCC GCG ATC GAG GAC GCC GAC GTG ATC GTG CAC 478 Pro Gly Arg Ala Ala Ala Ala Ile Glu Asp Ala Asp Val Ile Val His
65 70 75 CTG GTG GCG CAC GCA GCG GGC GGT TCC ACC TGG CGC AGC GCC ACC TCC 526 Leu Val Ala His Ala Ala Gly Gly Ser Thr Trp Arg Ser Ala Thr Ser
80 85 90 95 GAC CCG GAA GCC GAG CGG GTC AAC GTC GGC CTG ATG CAC GAC CTC GTC 574 Asp Pro Glu Ala Glu Arg Val Asn Val Gly Leu Met His Asp Leu Val
100 105 110 GGC GCG CTG CAC GAT CGC CGC AGG TCG ACG CCG CCC GTG TTG CTC TAC 622 Gly Ala Leu His Asp Arg Arg Arg Ser Thr Pro Pro Val Leu Leu Tyr
115 120 125

<Desc/Clms Page number 85><Desc / Clms Page number 85>

GCG AGC ACC GCA CAG GCC GCG AAC CCG TCG GCG GCC AGC AGG TAC GCG 670 Ala Ser Thr Ala Gln Ala Ala Asn Pro Ser Ala Ala Ser Arg Tyr Ala
130 135 140 CAG CAG AAG ACC GAG GCC GAG CGC ATC CTG CGC AAA GCC ACC GAC GAG 718 Gln Gln Lys Thr Glu Ala Glu Arg Ile Leu Arg Lys Ala Thr Asp Glu
145 150 155 GGC CGG GTG CGC GGC GTG ATC CTG CGG CTG CCC GCC GTC TAC GGC CAG 766 Gly Arg Val Arg Gly Val Ile Leu Arg Leu Pro Ala Val Tyr Gly Gln 160 165 170 175 AGC GGC CCG TCC GGC CCC ATG GGG CGG GGC GTG GTC GCA GCG ATG ATC 814 Ser Gly Pro Ser Gly Pro Met Gly Arg Gly Val Val Ala Ala Met Ile
180 185 190 CGG CGT GCC CTC GCC GGC GAG CCG CTC ACC ATG TGG CAC GAC GGC GGC 862 Arg Arg Ala Leu Ala Gly Glu Pro Leu Thr Met Trp His Asp Gly Gly
195 200 205 GTG CGC CGC GAC CTG CTG CAC GTC GAG GAC GTG GCC ACC GCG TTC GCC 910 Val Arg Arg Asp Leu Leu His Val Glu Asp Val Ala Thr Ala Phe Ala
210 215 220 GCC GCG CTG GAG CAC CAC GAC GCG CTG GCC GGC GGC ACG TGG GCG CTG 958 Ala Ala Leu Glu His His Asp Ala Leu Ala Gly Gly Thr Trp Ala Leu
225 230 235 GGC GCC GAC CGA TCC GAG CCG CTC GGC GAC ATC TTC CGG GCC GTC TCC 1006 Gly Ala Asp Arg Ser Glu Pro Leu Gly Asp Ile Phe Arg Ala Val Ser 240 245 250 255 GGC AGC GTC GCC CGG CAG ACC GGC AGC CCC GCC GTC GAC GTG GTC ACC 1054 Gly Ser Val Ala Arg Gln Thr Gly Ser Pro Ala Val Asp Val Val Thr
260 265 270 GTG CCC GCG CCC GAG CAC GCC GAG GCC AAC GAC TTC CGC AGC GAC GAC 1102 Val Pro Ala Pro Glu His Ala Glu Ala Asn Asp Phe Arg Ser Asp Asp
275 280 285 ATC GAC TCC ACC GAG TTC CGC AGC CGG ACC GGC TGG CGC CCC CGG GTT 1150 Ile Asp Ser Thr Glu Phe Arg Ser Arg Thr Gly Trp Arg Pro Arg Val
290 295 300
GCG AGC ACC GCA CAG GCC GCG AAC CCG TCG GCG GCC AGC AGG TAC GCG 670 Ala Ser Thr Ala Gln Ala Ala Asn Pro Ser Ala Ala Ser Arg Tyr Ala
130 135 140 CAG CAG AAG ACC GAG GCC GAG CGC ATC CTG CGC AAA GCC ACC GAC GAG 718 Gln Gln Lys Thr Glu Ala Glu Arg Ile Leu Arg Lys Ala Thr Asp Glu
145 150 155 GGC CGG GTG CGC GGC GTG ATC CTG CGG CTG CCC GCC GTC TAC GGC CAG 766 Gly Arg Val Arg Gly Val Ile Leu Arg Leu Pro Ala Val Tyr Gly Gln 160 165 170 175 AGC GGC CCG TCC GGC CCC ATG GGG CGG GGC GTG GTC GCA GCG ATG ATC 814 Ser Gly Pro Ser Gly Pro Met Gly Arg Gly Val Val Ala Ala Met Ile
180 185 190 CGG CGT GCC CTC GCC GGC GAG CCG CTC ACC ATG TGG CAC GAC GGC GGC 862 Arg Arg Ala Leu Ala Gly Glu Pro Leu Thr Met Trp His Asp Gly Gly
195 200 205 GTG CGC CGC GAC CTG CTG CAC GTC GAG GAC GTG GCC ACC GCG TTC GCC 910 Val Arg Arg Asp Leu Leu His Val Glu Asp Val Ala Thr Ala Phe Ala
210 215 220 GCC GCG CTG GAG CAC CAC GAC GCG CTG GCC GGC GGC ACG TGG GCG CTG 958 Ala Ala Leu Glu His His Asp Ala Leu Ala Gly Gly Thr Trp Ala Leu
225 230 235 GGC GCC GAC CGA TCC GAG CCG CTC GGC GAC ATC TTC CGG GCC GTC TCC 1006 Gly Ala Asp Arg Ser Glu Pro Leu Gly Asp Ile Phe Arg Ala Val Ser 240 245 250 255 GGC AGC GTC GCC CGG CAG ACC GGC AGC CCC GCC GTC GAC GTG GTC ACC 1054 Gly Ser Val Ala Arg Gln Thr Gly Ser Pro Ala Val Asp Val Val Thr
260 265 270 GTG CCC GCG CCC GAG CAC GCC GAG GCC AAC GAC TTC CGC AGC GAC GAC 1102 Val Pro Ala Pro Glu His Ala Glu Ala Asn Asp Phe Arg Ser Asp Asp
275 280 285 ATC GAC TCC ACC GAG TTC CGC AGC CGG ACC GGC TGG CGC CCC CGG GTT 1150 Ile Asp Ser Thr Glu Phe Arg Ser Arg Thr Gly Trp Arg Pro Arg Val
290 295 300

<Desc/Clms Page number 86><Desc / Clms Page number 86>

TCC CTC ACC GAC GGC ATC GAC CGG ACG GTG GCC GCC CTG ACC CCC ACC 1198 Ser Leu Thr Asp Gly Ile Asp Arg Thr Val Ala Ala Leu Thr Pro Thr
305 310 315 GAG GAG CAC TA GTG CGG GTA CTG CTG ACG TCC TTC GCG CAC CGC ACG 1245 Glu Glu His Met Arg Val Leu Leu Thr Ser Phe Ala His Arg Thr 320 1 5 10 CAC TTC CAG GGA CTG GTC CCG CTG GCG TGG GCG CTG CGC ACC GCG GGT 1293 His Phe Gln Gly Leu Val Pro Leu Ala Trp Ala Leu Arg Thr Ala Gly
15 20 25 CAC GAC GTG CGC GTG GCC GCC CAG CCC GCG CTC ACC GAC GCG GTC ATC 1341 His Asp Val Arg Val Ala Ala Gln Pro Ala Leu Thr Asp Ala Val Ile
30 35 40 GGC GCC GGT CTC ACC GCG GTA CCC GTC GGC TCC GAC CAC CGG CTG TTC 1389 Gly Ala Gly Leu Thr Ala Val Pro Val Gly Ser Asp His Arg Leu Phe
45 50 55 60 GAC ATC GTC CCG GAA GTC GCC GCT CAG GTG CAC CGC TAC TCC TTC TAC 1437 Asp Ile Val Pro Glu Val Ala Ala Gln Val His Arg Tyr Ser Phe Tyr
65 70 75 CTG GAC TTC TAC CAC CGC GAG CAG GAG CTG CAC TCG TGG GAG TTC CTG 1485 Leu Asp Phe Tyr His Arg Glu Gln Glu Leu His Ser Trp Glu Phe Leu
80 85 90 CTC GGC ATG CAG GAG GCC ACC TCG CGG TGG GTA TAC CCG GTG GTC AAC 1533 Leu Gly Met Gln Glu Ala Thr Ser Arg Trp Val Tyr Pro Val Val Asn
95 100 105 AAC GAC TCC TTC GTC GCC GAG CTG GTC GAC TTC GCC CGG GAC TGG CGT 1581 Asn Asp Ser Phe Val Ala Glu Leu Val Asp Phe Ala Arg Asp Trp Arg
110 115 120 CCT GAC CTG GTG CTC TGG GAG CCG TTC ACC TTC GCC GGC GCC GTC GCG 1629 Pro Asp Leu Val Leu Trp Glu Pro Phe Thr Phe Ala Gly Ala Val Ala 125 130 135 140 GCC CGG GCC TGC GGA GCC GCG CAC GCC CGG CTG CTG TGG GGC AGC GAC 1677 Ala Arg Ala Cys Gly Ala Ala His Ala Arg Leu Leu Trp Gly Ser Asp
145 150 155
TCC CTC ACC GAC GGC ATC GAC CGG ACG GTG GCC GCC CTG ACC CCC ACC 1198 Ser Leu Thr Asp Gly Ile Asp Arg Thr Val Ala Ala Leu Thr Pro Thr
305 310 315 GAG GAG CAC TA GTG CGG GTA CTG CTG ACG TCC TTC GCG CAC CGC ACG 1245 Glu Glu His Met Arg Val Leu Leu Thr Ser Phe Ala His Arg Thr 320 1 5 10 CAC TTC CAG GGA CTG GTC CCG CTG GCG TGG GCG CTG CGC ACC GCG GGT 1293 His Phe Gln Gly Leu Val Pro Leu Ala Trp Ala Leu Arg Thr Ala Gly
15 20 25 CAC GAC GTG CGC GTG GCC GCC CAG CCC GCG CTC ACC GAC GCG GTC ATC 1341 His Asp Val Arg Val Ala Ala Gln Pro Ala Leu Thr Asp Ala Val Ile
30 35 40 GGC GCC GGT CTC ACC GCG GTA CCC GTC GGC TCC GAC CAC CGG CTG TTC 1389 Gly Ala Gly Leu Thr Ala Val Pro Val Gly Ser Asp His Arg Leu Phe
45 50 55 60 GAC ATC GTC CCG GAA GTC GCC GCT CAG GTG CAC CGC TAC TCC TTC TAC 1437 Asp Ile Val Pro Glu Val Ala Ala Gln Val His Arg Tyr Ser Phe Tyr
65 70 75 CTG GAC TTC TAC CAC CGC GAG CAG GAG CTG CAC TCG TGG GAG TTC CTG 1485 Leu Asp Phe Tyr His Arg Glu Gln Glu Leu His Ser Trp Glu Phe Leu
80 85 90 CTC GGC ATG CAG GAG GCC ACC TCG CGG TGG GTA TAC CCG GTG GTC AAC 1533 Leu Gly Met Gln Glu Ala Thr Ser Arg Trp Val Tyr Pro Val Val Asn
95 100 105 AAC GAC TCC TTC GTC GCC GAG CTG GTC GAC TTC GCC CGG GAC TGG CGT 1581 Asn Asp Ser Phe Val Ala Glu Leu Val Asp Phe Ala Arg Asp Trp Arg
110 115 120 CCT GAC CTG GTG CTC TGG GAG CCG TTC ACC TTC GCC GGC GCC GTC GCG 1629 Pro Asp Leu Val Leu Trp Glu Pro Phe Thr Phe Ala Gly Ala Val Ala 125 130 135 140 GCC CGG GCC TGC GGA GCC GCG CAC GCC CGG CTG CTG TGG GGC AGC GAC 1677 Ala Arg Ala Cys Gly Ala Ala His Ala Arg Leu Leu Trp Gly Ser Asp
145 150 155

<Desc/Clms Page number 87><Desc / Clms Page number 87>

CTC ACC GGC TAC TTC CGC GGC CGG TTC CAG GCG CAA CGC CTG CGA CGG 1725 Leu Thr Gly Tyr Phe Arg Gly Arg Phe Gln Ala Gln Arg Leu Arg Arg
160 165 170 CCG CCG GAG GAC CGG CCG GAC CCG CTG GGC ACG TGG CTG ACC GAG GTC 1773 Pro Pro Glu Asp Arg Pro Asp Pro Leu Gly Thr Trp Leu Thr Glu Val
175 180 185 GCG GGG CGC TTC GGC GTC GAA TTC GGC GAG GAC CTC GCG GTC GGG CAG 1821 Ala Gly Arg Phe Gly Val Glu Phe Gly Glu Asp Leu Ala Val Gly Gln
190 195 200 TGG TCG GTC GAC CAG TTG CCG CCG AGT TTC CGG CTG GAC ACC GGA ATG 1869 Trp Ser Val Asp Gln Leu Pro Pro Ser Phe Arg Leu Asp Thr Gly Met 205 210 215 220 GAA ACC GTT GTC GCG CGG ACC CTG CCC TAC AAC GGC GCG TCG GTG GTT 1917 Glu Thr Val Val Ala Arg Thr Leu Pro Tyr Asn Gly Ala Ser Val Val
225 230 235 CCG GAC TGG CTC AAG AAG GGC AGT GCG ACT CGA CGC ATC TGC ATT ACC 1965 Pro Asp Trp Leu Lys Lys Gly Ser Ala Thr Arg Arg Ile Cys Ile Thr
240 245 250 GGA GGG TTC TCC GGA CTC GGG CTC GCC GCC GAT GCC GAT CAG TTC GCG 2013 Gly Gly Phe Ser Gly Leu Gly Leu Ala Ala Asp Ala Asp Gln Phe Ala
255 260 265 CGG ACG CTC GCG CAG CTC GCG CGA TTC GAT GGC GAA ATC GTG GTT ACG 2061 Arg Thr Leu Ala Gln Leu Ala Arg Phe Asp Gly Glu Ile Val Val Thr
270 275 280 GGT TCC GGT CCG GAT ACC TCC GCG GTA CCG GAC AAC ATT CGT TTG GTG 2109 Gly Ser Gly Pro Asp Thr Ser Ala Val Pro Asp Asn Ile Arg Leu Val 285 290 295 300 GAT TTC GTT CCG ATG GGC GTT CTG CTC CAG AAC TGC GCG GCG ATC ATC 2157 Asp Phe Val Pro Met Gly Val Leu Leu Gln Asn Cys Ala Ala Ile Ile
305 310 315 CAC CAC GGC GGG GCC GGA ACC TGG GCC ACG GCA CTG CAC CAC GGA ATT 2205 His His Gly Gly Ala Gly Thr Trp Ala Thr Ala Leu His His Gly Ile
320 325 330
CTC ACC GGC TAC TTC CGC GGC CGG TTC CAG GCG CAA CGC CTG CGA CGG 1725 Leu Thr Gly Tyr Phe Arg Gly Arg Phe Gln Ala Gln Arg Leu Arg Arg
160 165 170 CCG CCG GAG GAC CGG CCG GAC CCG CTG GGC ACG TGG CTG ACC GAG GTC 1773 Pro Pro Glu Asp Arg Pro Asp Pro Leu Gly Thr Trp Leu Thr Glu Val
175 180 185 GCG GGG CGC TTC GGC GTC GAA TTC GGC GAG GAC CTC GCG GTC GGG CAG 1821 Ala Gly Arg Phe Gly Val Glu Phe Gly Glu Asp Leu Ala Val Gly Gln
190 195 200 TGG TCG GTC GAC CAG TTG CCG CCG AGT TTC CGG CTG GAC ACC GGA ATG 1869 Trp Ser Val Asp Gln Leu Pro Pro Ser Phe Arg Leu Asp Thr Gly Met 205 210 215 220 GAA ACC GTT GTC GCG CGG ACC CTG CCC TAC AAC GGC GCG TCG GTG GTT 1917 Glu Thr Val Val Ala Arg Thr Leu Pro Tyr Asn Gly Ala Ser Val Val
225 230 235 CCG GAC TGG CTC AAG AAG GGC AGT GCG ACT CGA CGC ATC TGC ATT ACC 1965 Pro Asp Trp Leu Lys Lys Gly Ser Ala Thr Arg Arg Ile Cys Ile Thr
240 245 250 GGA GGG TTC TCC GGA CTC GGG CTC GCC GCC GAT GCC GAT CAG TTC GCG 2013 Gly Gly Phe Ser Gly Leu Gly Leu Ala Ala Asp Ala Asp Gln Phe Ala
255 260 265 CGG ACG CTC GCG CAG CTC GCG CGA TTC GAT GGC GAA ATC GTG GTT ACG 2061 Arg Thr Leu Ala Gln Leu Ala Arg Phe Asp Gly Glu Ile Val Val Thr
270 275 280 GGT TCC GGT CCG GAT ACC TCC GCG GTA CCG GAC AAC ATT CGT TTG GTG 2109 Gly Ser Gly Pro Asp Thr Ser Ala Val Pro Asp Asn Ile Arg Leu Val 285 290 295 300 GAT TTC GTT CCG ATG GGC GTT CTG CTC CAG AAC TGC GCG GCG ATC ATC 2157 Asp Phe Val Pro Met Gly Val Leu Leu Gln Asn Cys Ala Ala Ile Ile
305 310 315 CAC CAC GGC GGG GCC GGA ACC TGG GCC ACG GCA CTG CAC CAC GGA ATT 2205 His His Gly Gly Ala Gly Thr Trp Ala Thr Ala Leu His His Gly Ile
320 325 330

<Desc/Clms Page number 88><Desc / Clms Page number 88>

CCG CAA ATA TCA GTT GCA CAT GAA TGG GAT TGC ATG CTA CGC GGC CAG 2253 Pro Gln Ile Ser Val Ala His Glu Trp Asp Cys Met Leu Arg Gly Gln
335 340 345 CAG ACC GCG GAA CTG GGC GCG GGA ATC TAC CTC CGG CCG GAC GAG GTC 2301 Gln Thr Ala Glu Leu Gly Ala Gly Ile Tyr Leu Arg Pro Asp Glu Val
350 355 360 GAT GCC GAC TCA TTG GCG AGC GCC CTC ACC CAG GTG GTC GAG GAC CCC 2349 Asp Ala Asp Ser Leu Ala Ser Ala Leu Thr Gln Val Val Glu Asp Pro 365 370 375 380 ACC TAC ACC GAG AAC GCG GTG AAG CTT CGC GAG GAG GCG CTG TCC GAC 2397 Thr Tyr Thr Glu Asn Ala Val Lys Leu Arg Glu Glu Ala Leu Ser Asp
385 390 395 CCG ACG CCG CAG GAG ATC GTC CCG CGA CTG GAG GAA CTC ACG CGC CGC 2445 Pro Thr Pro Gln Glu Ile Val Pro Arg Leu Glu Glu Leu Thr Arg Arg
400 405 410 CAC GCC GGC TAGCGGTTTC CGACCGACAA GTCCGTCCGA CAGCACACCT 2494 His Ala Gly
415 CCGGAGGGAG CAGGG ATG TAC GAG GGC GGG TTC GCC GAG CTT TAC GAC CGG 2545
Met Tyr Glu Gly Gly Phe Ala Glu Leu Tyr Asp Arg
1 5 10 TTC TAC CGC GGC CGG GGC AAG GAC TAC GCG GCC GAG GCC GCG CAG GTC 2593 Phe Tyr Arg Gly Arg Gly Lys Asp Tyr Ala Ala Glu Ala Ala Gln Val
15 20 25 GCG CGG CTG GTC AGA GAC CGC CTG CCC TCG GCT TCC TCG CTG CTC GAC 2641 Ala Arg Leu Val Arg Asp Arg Leu Pro Ser Ala Ser Ser Leu Leu Asp
30 35 40 GTG GCC TGC GGG ACC GGC ACC CAC CTG CGC CGG TTC GCC GAC CTC TTC 2689 Val Ala Cys Gly Thr Gly Thr His Leu Arg Arg Phe Ala Asp Leu Phe
45 50 55 60 GAC GAC GTG ACC GGG CTG GAG CTG TCG GCG GCG ATG ATC GAG GTC GCC 2737 Asp Asp Val Thr Gly Leu Glu Leu Ser Ala Ala Met Ile Glu Val Ala
65 70 75
CCG CAA ATA TCA GTT GCA CAT GAA TGG GAT TGC ATG CTA CGC GGC CAG 2253 Pro Gln Ile Ser Val Ala His Glu Trp Asp Cys Met Leu Arg Gly Gln
335 340 345 CAG ACC GCG GAA CTG GGC GCG GGA ATC TAC CTC CGG CCG GAC GAG GTC 2301 Gln Thr Ala Glu Leu Gly Ala Gly Ile Tyr Leu Arg Pro Asp Glu Val
350 355 360 GAT GCC GAC TCA TTG GCG AGC GCC CTC ACC CAG GTG GTC GAG GAC CCC 2349 Asp Ala Asp Ser Leu Ala Ser Ala Leu Thr Gln Val Val Glu Asp Pro 365 370 375 380 ACC TAC ACC GAG AAC GCG GTG AAG CTT CGC GAG GAG GCG CTG TCC GAC 2397 Thr Tyr Thr Glu Asn Ala Val Lys Leu Arg Glu Glu Ala Leu Ser Asp
385 390 395 CCG ACG CCG CAG GAG ATC GTC CCG CGA CTG GAG GAA CTC ACG CGC CGC 2445 Pro Thr Pro Gln Glu Ile Val Pro Arg Leu Glu Glu Leu Thr Arg Arg
400 405 410 CAC GCC GGC TAGCGGTTTC CGACCGACAA GTCCGTCCGA CAGCACACCT 2494 His Ala Gly
415 CCGGAGGGAG CAGGG ATG TAC GAG GGC GGG TTC GCC GAG CTT TAC GAC CGG 2545
Met Tyr Glu Gly Gly Phe Ala Glu Leu Tyr Asp Arg
1 5 10 TTC TAC CGC GGC CGG GGC AAG GAC TAC GCG GCC GAG GCC GCG CAG GTC 2593 Phe Tyr Arg Gly Arg Gly Lys Asp Tyr Ala Ala Glu Ala Ala Gln Val
15 20 25 GCG CGG CTG GTC AGA GAC CGC CTG CCC TCG GCT TCC TCG CTG CTC GAC 2641 Ala Arg Leu Val Arg Asp Arg Leu Pro Ser Ala Ser Ser Leu Leu Asp
30 35 40 GTG GCC TGC GGG ACC GGC ACC CAC CTG CGC CGG TTC GCC GAC CTC TTC 2689 Val Ala Cys Gly Thr Gly Thr His Leu Arg Arg Phe Ala Asp Leu Phe
45 50 55 60 GAC GAC GTG ACC GGG CTG GAG CTG TCG GCG GCG ATG ATC GAG GTC GCC 2737 Asp Asp Val Thr Gly Leu Glu Leu Ser Ala Ala Met Ile Glu Val Ala
65 70 75

<Desc/Clms Page number 89><Desc / Clms Page number 89>

CGG CCG CAG CTC GGC GGC ATC CCG GTG CTG CAG GGC GAC ATG CGC GAC 2785 Arg Pro Gln Leu Gly Gly Ile Pro Val Leu Gln Gly Asp Met Arg Asp
80 85 90 TTC GCG CTG GAT CGC GAG TTC GAC GCC GTC ACC TGC ATG TTC AGC TCC 2833 Phe Ala Leu Asp Arg Glu Phe Asp Ala Val Thr Cys Met Phe Ser Ser
95 100 105 ATC GGG CAC ATG CGC GAC GGC GCC GAG CTG GAC CAG GCG CTG GCG TCC 2881 Ile Gly His Met Arg Asp Gly Ala Glu Leu Asp Gln Ala Leu Ala Ser
110 115 120 TTC GCC CGC CAC CTC GCC CCC GGC GGC GTC GTG GTG GTC GAA CCG TGG 2929 Phe Ala Arg His Leu Ala Pro Gly Gly Val Val Val Val Glu Pro Trp 125 130 135 140 TGG TTC CCG GAG GAC TTC CTC GAC GGC TAC GTG GCC GGT GAC GTG GTG 2977 Trp Phe Pro Glu Asp Phe Leu Asp Gly Tyr Val Ala Gly Asp Val Val
145 150 155 CGC GAC GGC GAC CTG ACG ATC TCG CGC GTC TCG CAC TCC GTG CGC GCC 3025 Arg Asp Gly Asp Leu Thr Ile Ser Arg Val Ser His Ser Val Arg Ala
160 165 170 GGC GGC GCG ACC CGG ATG GAG ATC CAC TGG GTC GTG GCC GAC GCG GTG 3073 Gly Gly Ala Thr Arg Met Glu Ile His Trp Val Val Ala Asp Ala Val
175 180 185 AAC GGT CCG CGG CAC CAC GTG GAG CAC TAC GAG ATC ACG CTC TTC GAG 3121 Asn Gly Pro Arg His His Val Glu His Tyr Glu Ile Thr Leu Phe Glu
190 195 200 CGG CAG CAG TAC GAG AAG GCC TTC ACC GCG GCC GGT TGC GCT GTG CAG 3169 Arg Gln Gln Tyr Glu Lys Ala Phe Thr Ala Ala Gly Cys Ala Val Gln 205 210 215 220 TAC CTG GAG GGC GGA CCC TCC GGA CGC GGG TTG TTC GTC GGT GTG CGC 3217 Tyr Leu Glu Gly Gly Pro Ser Gly Arg Gly Leu Phe Val Gly Val Arg
225 230 235 GGA TGACCCGTGC GTTCGCGTTT TCCGTTCCTG GCACAGGTGA TCCGCTCCAC 3270 Gly
CGG CCG CAG CTC GGC GGC ATC CCG GTG CTG CAG GGC GAC ATG CGC GAC 2785 Arg Pro Gln Leu Gly Gly Ile Pro Val Leu Gln Gly Asp Met Arg Asp
80 85 90 TTC GCG CTG GAT CGC GAG TTC GAC GCC GTC ACC TGC ATG TTC AGC TCC 2833 Phe Ala Leu Asp Arg Glu Phe Asp Ala Val Thr Cys Met Phe Ser Ser
95 100 105 ATC GGG CAC ATG CGC GAC GGC GCC GAG CTG GAC CAG GCG CTG GCG TCC 2881 Ile Gly His Met Arg Asp Gly Ala Glu Leu Asp Gln Ala Leu Ala Ser
110 115 120 TTC GCC CGC CAC CTC GCC CCC GGC GGC GTC GTG GTG GTC GAA CCG TGG 2929 Phe Ala Arg His Leu Ala Pro Gly Gly Val Val Val Glu Pro Trp 125 130 135 140 TGG TTC CCG GAG GAC TTC CTC GAC GGC TAC GTG GCC GGT GAC GTG GTG 2977 Trp Phe Pro Glu Asp Phe Leu Asp Gly Tyr Val Ala Gly Asp Val Val
145 150 155 CGC GAC GGC GAC CTG ACG ATC TCG CGC GTC TCG CAC TCC GTG CGC GCC 3025 Arg Asp Gly Asp Leu Thr Ile Ser Arg Val Ser His Ser Val Arg Ala
160 165 170 GGC GGC GCG ACC CGG ATG GAG ATC CAC TGG GTC GTG GCC GAC GCG GTG 3073 Gly Gly Ala Thr Arg Met Glu Ile His Trp Val Val Ala Asp Ala Val
175 180 185 AAC GGT CCG CGG CAC CAC GTG GAG CAC TAC GAG ATC ACG CTC TTC GAG 3121 Asn Gly Pro Arg His His Val Glu His Tyr Glu Ile Thr Leu Phe Glu
190 195 200 CGG CAG CAG TAC GAG AAG GCC TTC ACC GCG GCC GGT TGC GCT GTG CAG 3169 Arg Gln Gln Tyr Glu Lys Ala Phe Thr Ala Ala Gly Cys Ala Val Gln 205 210 215 220 TAC CTG GAG GGC GGA CCC TCC GGA CGC GGG TTG TTC GTC GGT GTG CGC 3217 Tyr Leu Glu Gly Gly Pro Ser Gly Arg Gly Leu Phe Val Gly Val Arg
225 230 235 GGA TGACCCGTGC GTTCGCGTTT TCCGTTCCTG GCACAGGTGA TCCGCTCCAC 3270 Gly

<Desc/Clms Page number 90><Desc / Clms Page number 90>

GGGCCCTTTC CCCGCCGTGA CCGGACCCTT ACAGTGA GTG CGG GTC TTG ATC GAC 3325
Met Arg Val Leu Ile Asp
1 5 AAC GCC CGG CGG CAG CAA GCG GAG CCG TCG ACG ACA CCG CAG GGA GAG 3373 Asn Ala Arg Arg Gln Gln Ala Glu Pro Ser Thr Thr Pro Gln Gly Glu
10 15 20 TCG ATG GGT GAT CGG ACC GGC GAC CGG ACG ATT CCG GAA TCC TCG CAG 3421 Ser Met Gly Asp Arg Thr Gly Asp Arg Thr Ile Pro Glu Ser Ser Gln
25 30 35 ACC GCA ACG CGT TTC CTG CTC GGC GAC GGC GGA ATC CCC ACC GCC ACG 3469 Thr Ala Thr Arg Phe Leu Leu Gly Asp Gly Gly Ile Pro Thr Ala Thr
40 45 50 GCG GAA ACC CAC GAC TGG CTG ACC CGC AAC GGC GCC GAG CAG CGG CTC 3517 Ala Glu Thr His Asp Trp Leu Thr Arg Asn Gly Ala Glu Gln Arg Leu
55 60 65 70 GAG GTG GCG CGC GTG CCG TTC AGC GCC ATG GAC CGC TGG TCG TTC CAG 3565 Glu Val Ala Arg Val Pro Phe Ser Ala Met Asp Arg Trp Ser Phe Gln
75 80 85 CCC GAG GAC GGC AGG CTC GCC CAC GAG TCC GGG CGC TTC TTC TCC ATC 3613 Pro Glu Asp Gly Arg Leu Ala His Glu Ser Gly Arg Phe Phe Ser Ile
90 95 100 GAG GGC CTG CAC GTG CGG ACG AAC TTC GGC TGG CGG CGG GAC TGG ATC 3661 Glu Gly Leu His Val Arg Thr Asn Phe Gly Trp Arg Arg Asp Trp Ile
105 110 115 CAG CCC ATC ATC GTG CAG CCC GAG ATC GGC TTC CTC GGC CTC ATC GTC 3709 Gln Pro Ile Ile Val Gln Pro Glu Ile Gly Phe Leu Gly Leu Ile Val
120 125 130 AAG GAG TTC GAC GGT GTG CTG CAC GTG CTG GCG CAG GCC AAG GCC GAG 3757 Lys Glu Phe Asp Gly Val Leu His Val Leu Ala Gln Ala Lys Ala Glu 135 140 145 150 CCG GGC AAC ATC AAC GCC GTC CAG CTC TCC CCG ACC CTG CAG GCG ACC 3805 Pro Gly Asn Ile Asn Ala Val Gln Leu Ser Pro Thr Leu Gln Ala Thr
155 160 165
GGGCCCTTTC CCCGCCGTGA CCGGACCCTT ACAGTGA GTG CGG GTC TTG ATC GAC 3325
Met Arg Val Leu Ile Asp
1 5 AAC GCC CGG CGG CAG CAA GCG GAG CCG TCG ACG ACA CCG CAG GGA GAG 3373 Asn Ala Arg Arg Gln Gln Ala Glu Pro Ser Thr Thr Pro Gln Gly Glu
10 15 20 TCG ATG GGT GAT CGG ACC GGC GAC CGG ACG ATT CCG GAA TCC TCG CAG 3421 Ser Met Gly Asp Arg Thr Gly Asp Arg Thr Ile Pro Glu Ser Ser Gln
25 30 35 ACC GCA ACG CGT TTC CTG CTC GGC GAC GGC GGA ATC CCC ACC GCC ACG 3469 Thr Ala Thr Arg Phe Leu Leu Gly Asp Gly Gly Ile Pro Thr Ala Thr
40 45 50 GCG GAA ACC CAC GAC TGG CTG ACC CGC AAC GGC GCC GAG CAG CGG CTC 3517 Ala Glu Thr His Asp Trp Leu Thr Arg Asn Gly Ala Glu Gln Arg Leu
55 60 65 70 GAG GTG GCG CGC GTG CCG TTC AGC GCC ATG GAC CGC TGG TCG TTC CAG 3565 Glu Val Ala Arg Val Pro Phe Ser Ala Met Asp Arg Trp Ser Phe Gln
75 80 85 CCC GAG GAC GGC AGG CTC GCC CAC GAG TCC GGG CGC TTC TTC TCC ATC 3613 Pro Glu Asp Gly Arg Leu Ala His Glu Ser Gly Arg Phe Phe Ser Ile
90 95 100 GAG GGC CTG CAC GTG CGG ACG AAC TTC GGC TGG CGG CGG GAC TGG ATC 3661 Glu Gly Leu His Val Arg Thr Asn Phe Gly Trp Arg Arg Asp Trp Ile
105 110 115 CAG CCC ATC ATC GTG CAG CCC GAG ATC GGC TTC CTC GGC CTC ATC GTC 3709 Gln Pro Ile Ile Val Gln Pro Glu Ile Gly Phe Leu Gly Leu Ile Val
120 125 130 AAG GAG TTC GAC GGT GTG CTG CAC GTG CTG GCG CAG GCC AAG GCC GAG 3757 Lys Glu Phe Asp Gly Val Leu His Val Leu Ala Gln Ala Lys Ala Glu 135 140 145 150 CCG GGC AAC ATC AAC GCC GTC CAG CTC TCC CCG ACC CTG CAG GCG ACC 3805 Pro Gly Asn Ile Asn Ala Val Gln Leu Ser Pro Thr Leu Gln Ala Thr
155 160 165

<Desc/Clms Page number 91><Desc / Clms Page number 91>

CGC AGC AAC TAC ACC GGC GTC CAC CGC GGC TCG AAG GTC CGG TTC ATC 3853 Arg Ser Asn Tyr Thr Gly Val His Arg Gly Ser Lys Val Arg Phe Ile
170 175 180 GAG TAC TTC AAC GGC ACG CGC CCG AGC CGG ATC CTC GTC GAC GTG CTC 3901 Glu Tyr Phe Asn Gly Thr Arg Pro Ser Arg Ile Leu Val Asp Val Leu
185 190 195 CAG TCC GAG CAG GGC GCG TGG TTC CTG CGC AAG CGC AAC CGG AAC ATG 3949 Gln Ser Glu Gln Gly Ala Trp Phe Leu Arg Lys Arg Asn Arg Asn Met
200 205 210 GTC GTC GAG GTG TTC GAC GAC CTG CCC GAG CAC CCG AAC TTC CGG TGG 3997 Val Val Glu Val Phe Asp Asp Leu Pro Glu His Pro Asn Phe Arg Trp 215 220 225 230 CTG ACC GTC GCG CAG CTG CGG GCG ATG CTG CAC CAC GAC AAC GTG GTG 4045 Leu Thr Val Ala Gln Leu Arg Ala Met Leu His His Asp Asn Val Val
235 240 245 AAC ATG GAC CTG CGC ACC GTG CTG GCC TGC GTC CCG ACC GCC GTG GAG 4093 Asn Met Asp Leu Arg Thr Val Leu Ala Cys Val Pro Thr Ala Val Glu
250 255 260 CGG GAC CGG GCC GAC GAC GTG CTC GCG CGC CTG CCC GAG GGC TCG TTC 4141 Arg Asp Arg Ala Asp Asp Val Leu Ala Arg Leu Pro Glu Gly Ser Phe
265 270 275 CAG GCC CGG CTG CTG CAC TCG TTC ATC GGC GCG GGC ACC CCG GCC AAC 4189 Gln Ala Arg Leu Leu His Ser Phe Ile Gly Ala Gly Thr Pro Ala Asn
280 285 290 AAC ATG AAC AGC CTG CTG AGC TGG ATC TCC GAC GTG CGC GCC AGG CGC 4237 Asn Met Asn Ser Leu Leu Ser Trp Ile Ser Asp Val Arg Ala Arg Arg 295 300 305 310 GAG TTC GTG CAG CGC GGC CGC CCG CTG CCC GAC ATC GAG CGC AGC GGG 4285 Glu Phe Val Gln Arg Gly Arg Pro Leu Pro Asp Ile Glu Arg Ser Gly
315 320 325 TGG ATC CGC CGC GAC GAC GGC ATC GAG CAC GAG GAG AAG AAG TAC TTC 4333 Trp Ile Arg Arg Asp Asp Gly Ile Glu His Glu Glu Lys Lys Tyr Phe
330 335 340
CGC AGC AAC TAC ACC GGC GTC CAC CGC GGC TCG AAG GTC CGG TTC ATC 3853 Arg Ser Asn Tyr Thr Gly Val His Arg Gly Ser Lys Val Arg Phe Ile
170 175 180 GAG TAC TTC AAC GGC ACG CGC CCG AGC CGG ATC CTC GTC GAC GTG CTC 3901 Glu Tyr Phe Asn Gly Thr Arg Pro Ser Arg Ile Leu Val Asp Val Leu
185 190 195 CAG TCC GAG CAG GGC GCG TGG TTC CTG CGC AAG CGC AAC CGG AAC ATG 3949 Gln Ser Glu Gln Gly Ala Trp Phe Leu Arg Lys Arg Asn Arg Asn Met
200 205 210 GTC GTC GAG GTG TTC GAC GAC CTG CCC GAG CAC CCG AAC TTC CGG TGG 3997 Val Val Glu Val Phe Asp Asp Leu Pro Glu His Pro Asn Phe Arg Trp 215 220 225 230 CTG ACC GTC GCG CAG CTG CGG GCG ATG CTG CAC CAC GAC AAC GTG GTG 4045 Leu Thr Val Ala Gln Leu Arg Ala Met Leu His His Asp Asn Val Val
235 240 245 AAC ATG GAC CTG CGC ACC GTG CTG GCC TGC GTC CCG ACC GCC GTG GAG 4093 Asn Met Asp Leu Arg Thr Val Leu Ala Cys Val Pro Thr Ala Val Glu
250 255 260 CGG GAC CGG GCC GAC GAC GTG CTC GCG CGC CTG CCC GAG GGC TCG TTC 4141 Arg Asp Arg Ala Asp Asp Val Leu Ala Arg Leu Pro Glu Gly Ser Phe
265 270 275 CAG GCC CGG CTG CTG CAC TCG TTC ATC GGC GCG GGC ACC CCG GCC AAC 4189 Gln Ala Arg Leu Leu His Ser Phe Ile Gly Ala Gly Thr Pro Ala Asn
280 285 290 AAC ATG AAC AGC CTG CTG AGC TGG ATC TCC GAC GTG CGC GCC AGG CGC 4237 Asn Met Asn Ser Leu Leu Ser Trp Ile Ser Asp Val Arg Ala Arg Arg 295 300 305 310 GAG TTC GTG CAG CGC GGC CGC CCG CTG CCC GAC ATC GAG CGC AGC GGG 4285 Glu Phe Val Gln Arg Gly Arg Pro Leu Pro Asp Ile Glu Arg Ser Gly
315 320 325 TGG ATC CGC CGC GAC GAC GGC ATC GAG CAC GAG GAG AAG AAG TAC TTC 4333 Trp Ile Arg Arg Asp Asp Gly Ile Glu His Glu Glu Lys Lys Tyr Phe
330 335 340

<Desc/Clms Page number 92><Desc / Clms Page number 92>

GAC GTC TTC GGC GTC ACG GTG GCG ACC AGC GAC CGC GAG GTC AAC TCG 4381 Asp Val Phe Gly Val Thr Val Ala Thr Ser Asp Arg Glu Val Asn Ser
345 350 355 TGG ATG CAG CCG CTG CTC TCG CCC GCC AAC AAC GGC CTG CTC GCC CTG 4429 Trp Met Gln Pro Leu Leu Ser Pro Ala Asn Asn Gly Leu Leu Ala Leu
360 365 370 CTG GTC AAG GAC ATC GGC GGC ACG TTG CAC GCG CTC GTG CAG CTG CGC 4477 Leu Val Lys Asp Ile Gly Gly Thr Leu His Ala Leu Val Gln Leu Arg 375 380 385 390 ACC GAG GCG GGC GGG ATG GAC GTC GCC GAG CTG GCG CCT ACG GTG CAC 4525 Thr Glu Ala Gly Gly Met Asp Val Ala Glu Leu Ala Pro Thr Val His
395 400 405 TGC CAG CCC GAC AAC TAC GCC GAC GCG CCC GAG GAG TTC CGA CCG GCC 4573 Cys Gln Pro Asp Asn Tyr Ala Asp Ala Pro Glu Glu Phe Arg Pro Ala
410 415 420 TAT GTG GAC TAC GTG TTG AAC GTG CCG CGC TCG CAG GTC CGC TAC GAC 4621 Tyr Val Asp Tyr Val Leu Asn Val Pro Arg Ser Gln Val Arg Tyr Asp
425 430 435 GCA TGG CAC TCC GAG GAG GGC GGC CGG TTC TAC CGC AAC GAG AAC CGG 4669 Ala Trp His Ser Glu Glu Gly Gly Arg Phe Tyr Arg Asn Glu Asn Arg
440 445 450 TAC ATG CTG ATC GAG GTG CCC GCC GAC TTC GAC GCC AGT GCC GCT CCC 4717 Tyr Met Leu Ile Glu Val Pro Ala Asp Phe Asp Ala Ser Ala Ala Pro 455 460 465 470 GAC CAC CGG TGG ATG ACC TTC GAC CAG ATC ACC TAC CTG CTC GGG CAC 4765 Asp His Arg Trp Met Thr Phe Asp Gln Ile Thr Tyr Leu Leu Gly His
475 480 485 AGC CAC TAC GTC AAC ATC CAG CTG CGC AGC ATC ATC GCG TGC GCC TCG 4813 Ser His Tyr Val Asn Ile Gln Leu Arg Ser Ile Ile Ala Cys Ala Ser
490 495 500 GCC GTC TAC ACC AGG ACC GCC GGA TGAAACGCGC GCTGACCGAC CTGGCGATCT 4867 Ala Val Tyr Thr Arg Thr Ala Gly
505 510 TCGGCGGCCC CGAGGCATTC CTGCACACCC TCTACGTGGG CAGGCCGACC GTCGGGGACC 4927
GAC GTC TTC GGC GTC ACG GTG GCG ACC AGC GAC CGC GAG GTC AAC TCG 4381 Asp Val Phe Gly Val Thr Val Ala Thr Ser Asp Arg Glu Val Asn Ser
345 350 355 TGG ATG CAG CCG CTG CTC TCG CCC GCC AAC AAC GGC CTG CTC GCC CTG 4429 Trp Met Gln Pro Leu Leu Ser Pro Ala Asn Asn Gly Leu Leu Ala Leu
360 365 370 CTG GTC AAG GAC ATC GGC GGC ACG TTG CAC GCG CTC GTG CAG CTG CGC 4477 Leu Val Lys Asp Ile Gly Gly Thr Leu His Ala Leu Val Gln Leu Arg 375 380 385 390 ACC GAG GCG GGC GGG ATG GAC GTC GCC GAG CTG GCG CCT ACG GTG CAC 4525 Thr Glu Ala Gly Gly Met Asp Val Ala Glu Leu Ala Pro Thr Val His
395 400 405 TGC CAG CCC GAC AAC TAC GCC GAC GCG CCC GAG GAG TTC CGA CCG GCC 4573 Cys Gln Pro Asp Asn Tyr Ala Asp Ala Pro Glu Glu Phe Arg Pro Ala
410 415 420 TAT GTG GAC TAC GTG TTG AAC GTG CCG CGC TCG CAG GTC CGC TAC GAC 4621 Tyr Val Asp Tyr Val Leu Asn Val Pro Arg Ser Gln Val Arg Tyr Asp
425 430 435 GCA TGG CAC TCC GAG GAG GGC GGC CGG TTC TAC CGC AAC GAG AAC CGG 4669 Ala Trp His Ser Glu Glu Gly Gly Arg Phe Tyr Arg Asn Glu Asn Arg
440 445 450 TAC ATG CTG ATC GAG GTG CCC GCC GAC TTC GAC GCC AGT GCC GCT CCC 4717 Tyr Met Leu Ile Glu Val Pro Ala Asp Phe Asp Ala Ser Ala Ala Pro 455 460 465 470 GAC CAC CGG TGG ATG ACC TTC GAC CAG ATC ACC TAC CTG CTC GGG CAC 4765 Asp His Arg Trp Met Thr Phe Asp Gln Ile Thr Tyr Leu Leu Gly His
475 480 485 AGC CAC TAC GTC AAC ATC CAG CTG CGC AGC ATC ATC GCG TGC GCC TCG 4813 Ser His Tyr Val Asn Ile Gln Leu Arg Ser Ile Ile Ala Cys Ala Ser
490 495 500 GCC GTC TAC ACC AGG ACC GCC GGA TGAAACGCGC GCTGACCGAC CTGGCGATCT 4867 Ala Val Tyr Thr Arg Thr Ala Gly
505 510 TCGGCGGCCC CGAGGCATTC CTGCACACCC TCTACGTGGG CAGGCCGACC GTCGGGGACC 4927

<Desc/Clms Page number 93><Desc / Clms Page number 93>

GGGAGCGGTT CTTCGCCCGC CTGGAGTGGG CGCTGAACAA CAACTGGCTG ACCAACGGCG 4987 GACCACTGGT GCGCGAGTTC GAGGGCCGGG TCGCCGACCT GGCGGGTGTC CGCCACTGCG 5047 TGGCCACCTG CAACGCGACG GTCGCGCTGC AACTGGTGCT GCGCGCGAGC GACGTGTCCG 5107 GCGAGGTCGT CATGCCTTCG ATGACGTTCG CGGCCACCGC GCACGCGGCG AGCTGGCTGG 5167 GGCTGGAACC GGTGTTCTGC GACGTGGACC CCGAGACCGG CCTGCTCGAC CCCGAGCACG 5227 TCGCGTCGCT GGTGACACCG CGGACGGGCG CGATCATCGG CGTGCACCTG TGGGGCAGGC 5287 CCGCTCCGGT CGAGGCGCTG GAGAAGATCG CCGCCGAGCA CCAGGTCAAA CTCTTCTTCG 5347 ACGCCGCGCA CGCGCTGGGC TGCACCGCCG GCGGGCGGCC GGTCGGCGCC TTCGGCAACG 5407 CCGAGGTGTT CAGCTTCCAC GCCACGAAGG CGGTCACCTC GTTCGAGGGC GGCGCCATCG 5467 TCACCGACGA CGGGCTGCTG GCCGACCGCA TCCGCGCCAT GCACAACTTC GGGATCGCAC 5527 CGGACAAGCT GGTGACCGAT GTCGGCACCA ACGGCAAGAT GAGCGAGTGC GCCGCGGCGA 5587 TGGGCCTCAC CTCGCTCGAC GCCTTCGCCG AGACCAGGGT GCACAACCGC CTCAACCACG 5647 CGCTCTACTC CGACGAGCTC CGCGACGTGC GCGGCATATC CGTGCACGCG TTCGATCCTG 5707 GCGAGCAGAA CAACTACCAG TACGTGATCA TCTCGGTGGA CTCCGCGGCC ACCGGCATCG 5767 ACCGCGACCA GTTGCAGGCG ATCCTGCGAG CGGAGAAGGT TGTGGCACAA CCCTACTTCT 5827 CCCCCGGGTG CCACCAGATG CAGCCGTACC GGACCGAGCC GCCGCTGCGG CTGGAGAACA 5887 CCGAACAGCT CTCCGACCGG GTGCTCGCGC TGCCCACCGG CCCCGCGGTG TCCAGCGAGG 5947 ACATCCGGCG GGTGTGCGAC ATCATCCGGC TCGCCGCCAC CAGCGGCGAG CTGATCAACG 6007 CGCAATGGGA CCAGAGGACG CGCAACGGTT CGTGACGACC TGCGCCACAA GTGCCAGGAG 6067 GTTCGCTCCC CG ATG AAC ACA ACT CGT ACG GCA ACC GCC CAG GAA GCG 6115
Met Asn Thr Thr Arg Thr Ala Thr Ala Gln Glu Ala 1 5 10 GGG GTC GCC GAC GCG GCG CGC CCG GAC GTC GAC CGG CGG GCG GTC GTG 6163 Gly Val Ala Asp Ala Ala Arg Pro Asp Val Asp Arg Arg Ala Val Val
15 20 25
GGGAGCGGTT CTTCGCCCGC CTGGAGTGGG CGCTGAACAA CAACTGGCTG ACCAACGGCG 4987 GACCACTGGT GCGCGAGTTC GAGGGCCGGG TCGCCGACCT GGCGGGTGTC CGCCACTGCG 5047 TGGCCACCTG CAACGCGACG GTCGCGCTGC AACTGGTGCT GCGCGCGAGC GACGTGTCCG 5107 GCGAGGTCGT CATGCCTTCG ATGACGTTCG CGGCCACCGC GCACGCGGCG AGCTGGCTGG 5167 GGCTGGAACC GGTGTTCTGC GACGTGGACC CCGAGACCGG CCTGCTCGAC CCCGAGCACG 5227 TCGCGTCGCT GGTGACACCG CGGACGGGCG CGATCATCGG CGTGCACCTG TGGGGCAGGC 5287 CCGCTCCGGT CGAGGCGCTG GAGAAGATCG CCGCCGAGCA CCAGGTCAAA CTCTTCTTCG 5347 ACGCCGCGCA CGCGCTGGGC TGCACCGCCG GCGGGCGGCC GGTCGGCGCC TTCGGCAACG 5407 CCGAGGTGTT CAGCTTCCAC GCCACGAAGG CGGTCACCTC GTTCGAGGGC GGCGCCATCG 5467 TCACCGACGA CGGGCTGCTG GCCGACCGCA TCCGCGCCAT GCACAACTTC GGGATCGCAC 5527 CGGACAAGCT GGTGACCGAT GTCGGCACCA ACGGCAAGAT GAGCGAGTGC GCCGCGGCGA 5587 TGGGCCTCAC CTCGCTCGAC GCCTTCGCCG AGACCAGGGT GCACAACCGC CTCAACCACG 5647 CGCTCTACTC CGACGAGCTC CGCGACGTGC GCGGCATATC CGTGCACGCG TTCGATCCTG 5707 GCGAGCAGAA CAACTACCAG TACGTGATCA TCTCGGTGGA CTCCGCGGCC ACCGGCATCG 5767 ACCGCG ACCA GTTGCAGGCG ATCCTGCGAG CGGAGAAGGT TGTGGCACAA CCCTACTTCT 5827 CCCCCGGGTG CCACCAGATG CAGCCGTACC GGACCGAGCC GCCGCTGCGG CTGGAGAACA 5887 CCGAACAGCT CTCCGACCGG GTGCTCGCGC TGCCCACCGG CCCCGCGGTG TCCAGCGAGG 5947 ACATCCGGCG GGTGTGCGAC ATCATCCGGC TCGCCGCCAC CAGCGGCGAG CTGATCAACG 6007 CGCAATGGGA CCAGAGGACG CGCAACGGTT CGTGACGACC TGCGCCACAA GTGCCAGGAG 6067 GTTCGCTCCC GC ATG AAC ACA ACT CGT ACG GCA CCA CCG CAG GAA GCG 6115
Met Asn Thr Thr Arg Thr Ala Thr Ala Gln Glu Ala 1 5 10 GGG GTC GCC GAC GCG GCG CGC CCG GAC GTC GAC CGG CGG GCG GTC GTG 6163 Gly Val Ala Asp Ala Ala Arg Pro Asp Val Asp Arg Arg Ala Val Val
15 20 25

<Desc/Clms Page number 94><Desc / Clms Page number 94>

CGG GCG CTG AGC TCG GAG GTC TCC CGC GTC ACC GGC GCC GGT GAC GGT 6211 Arg Ala Leu Ser Ser Glu Val Ser Arg Val Thr Gly Ala Gly Asp Gly
30 35 40 GAC GCC GAC GTG CAG GCC GCC CGG CTC GCC GAC CTC GCC GCG CAC TAC 6259 Asp Ala Asp Val Gln Ala Ala Arg Leu Ala Asp Leu Ala Ala His Tyr
45 50 55 60 GGG GCG CAC CCG TTC ACG CCG CTG GAG CAG ACG CGT GCG CGG CTC GGC 6307 Gly Ala His Pro Phe Thr Pro Leu Glu Gln Thr Arg Ala Arg Leu Gly
65 70 75 CTG GAC CGC GCG GAG TTC GCC CAC CTG CTC GAC CTG TTC GGC CGC ATC 6355 Leu Asp Arg Ala Glu Phe Ala His Leu Leu Asp Leu Phe Gly Arg Ile
80 85 90 CCG GAC CTG GGC ACC GCG GTG GAG CAC GGT CCG GCG GGC AAG TAC TGG 6403 Pro Asp Leu Gly Thr Ala Val Glu His Gly Pro Ala Gly Lys Tyr Trp
95 100 105 TCC AAC ACG ATC AAG CCG CTG GAC GCC GCA GGC GCA CTG GAC GCG GCG 6451 Ser Asn Thr Ile Lys Pro Leu Asp Ala Ala Gly Ala Leu Asp Ala Ala
110 115 120 GTC TAC CGC AAG CCT GCC TTC CCC TAC AGC GTC GGC CTG TAC CCC GGG 6499 Val Tyr Arg Lys Pro Ala Phe Pro Tyr Ser Val Gly Leu Tyr Pro Gly 125 130 135 140 CCG ACG TGC ATG TTC CGC TGC CAC TTC TGC GTG CGG GTG ACC GGT GCC 6547 Pro Thr Cys Met Phe Arg Cys His Phe Cys Val Arg Val Thr Gly Ala
145 150 155 CGC TAC GAG GCC GCA TCG GTC CCG GCG GGC AAC GAG ACG CTG GCC GCG 6595 Arg Tyr Glu Ala Ala Ser Val Pro Ala Gly Asn Glu Thr Leu Ala Ala
160 165 170 ATC ATC GAC GAG GTG CCC ACG GAC AAC CCG AAG GCG ATG TAC ATG TCG 6643 Ile Ile Asp Glu Val Pro Thr Asp Asn Pro Lys Ala Met Tyr Met Ser
175 180 185 GGC GGG CTC GAG CCG CTG ACC AAC CCC GGT CTC GGC GAG CTG GTG TCG 6691 Gly Gly Leu Glu Pro Leu Thr Asn Pro Gly Leu Gly Glu Leu Val Ser
190 195 200
CGG GCG CTG AGC TCG GAG GTC TCC CGC GTC ACC GGC GCC GGT GAC GGT 6211 Arg Ala Leu Ser Ser Glu Val Ser Arg Val Thr Gly Ala Gly Asp Gly
30 35 40 GAC GCC GAC GTG CAG GCC GCC CGG CTC GCC GAC CTC GCC GCG CAC TAC 6259 Asp Ala Asp Val Gln Ala Ala Arg Leu Ala Asp Leu Ala Ala His Tyr
45 50 55 60 GGG GCG CAC CCG TTC ACG CCG CTG GAG CAG ACG CGT GCG CGG CTC GGC 6307 Gly Ala His Pro Phe Thr Pro Leu Glu Gln Thr Arg Ala Arg Leu Gly
65 70 75 CTG GAC CGC GCG GAG TTC GCC CAC CTG CTC GAC CTG TTC GGC CGC ATC 6355 Leu Asp Arg Ala Glu Phe Ala His Leu Leu Asp Leu Phe Gly Arg Ile
80 85 90 CCG GAC CTG GGC ACC GCG GTG GAG CAC GGT CCG GCG GGC AAG TAC TGG 6403 Pro Asp Leu Gly Thr Ala Val Glu His Gly Pro Ala Gly Lys Tyr Trp
95 100 105 TCC AAC ACG ATC AAG CCG CTG GAC GCC GCA GGC GCA CTG GAC GCG GCG 6451 Ser Asn Thr Ile Lys Pro Leu Asp Ala Ala Gly Ala Leu Asp Ala Ala
110 115 120 GTC TAC CGC AAG CCT GCC TTC CCC TAC AGC GTC GGC CTG TAC CCC GGG 6499 Val Tyr Arg Lys Pro Ala Phe Pro Tyr Ser Val Gly Leu Tyr Pro Gly 125 130 135 140 CCG ACG TGC ATG TTC CGC TGC CAC TTC TGC GTG CGG GTG ACC GGT GCC 6547 Pro Thr Cys Met Phe Arg Cys His Phe Cys Val Arg Val Thr Gly Ala
145 150 155 CGC TAC GAG GCC GCA TCG GTC CCG GCG GGC AAC GAG ACG CTG GCC GCG 6595 Arg Tyr Glu Ala Ala Ser Val Pro Ala Gly Asn Glu Thr Leu Ala Ala
160 165 170 ATC ATC GAC GAG GTG CCC ACG GAC AAC CCG AAG GCG ATG TAC ATG TCG 6643 Ile Ile Asp Glu Val Pro Thr Asp Asn Pro Lys Ala Met Tyr Met Ser
175 180 185 GGC GGG CTC GAG CCG CTG ACC AAC CCC GGT CTC GGC GAG CTG GTG TCG 6691 Gly Gly Leu Glu Pro Leu Thr Asn Pro Gly Leu Gly Glu Leu Val Ser
190 195 200

<Desc/Clms Page number 95><Desc / Clms Page number 95>

CAC GCC GCC GGG CGC GGT TTC GAC CTC ACC GTC TAC ACC AAC GCC TTC 6739 His Ala Ala Gly Arg Gly Phe Asp Leu Thr Val Tyr Thr Asn Ala Phe 205 210 215 220 GCC CTC ACC GAG CAG ACG CTG AAC CGC CAG CCC GGC CTG TGG GAG CTG 6787 Ala Leu Thr Glu Gln Thr Leu Asn Arg Gln Pro Gly Leu Trp Glu Leu
225 230 235 GGC GCG ATC CGC ACG TCC CTC TAC GGG CTG AAC AAC GAC GAG TAC GAG 6835 Gly Ala Ile Arg Thr Ser Leu Tyr Gly Leu Asn Asn Asp Glu Tyr Glu
240 245 250 ACG ACC ACC GGC AAG CGC GGC GCT TTC GAA CGC GTC AAG AAG AAC CTG 6883 Thr Thr Thr Gly Lys Arg Gly Ala Phe Glu Arg Val Lys Lys Asn Leu
255 260 265 CAG GGC TTC CTG CGG ATG CGC GCC GAG CGG GAC GCG CCG ATC CGG CTC 6931 Gln Gly Phe Leu Arg Met Arg Ala Glu Arg Asp Ala Pro Ile Arg Leu
270 275 280 GGC TTC AAC CAC ATC ATC CTG CCG GGA CGG GCC GAC CGG CTC ACC GAC 6979 Gly Phe Asn His Ile Ile Leu Pro Gly Arg Ala Asp Arg Leu Thr Asp 285 290 295 300 CTC GTC GAC TTC ATC GCC GAG CTC AAC GAG TCC AGC CCG CAA CGG CCG 7027 Leu Val Asp Phe Ile Ala Glu Leu Asn Glu Ser Ser Pro Gln Arg Pro
305 310 315 CTG GAC TTC GTG ACG GTG CGC GAG GAC TAC AGC GGC CGC GAC GAC GGC 7075 Leu Asp Phe Val ThrVal Arg Glu Asp Tyr Ser Gly Arg Asp Asp Gly
320 325 330 CGG CTG TCG GAC TCC GAG CGC AAC GAG CTG CGC GAG GGC CTG GTG CGG 7123 Arg Leu Ser Asp Ser Glu Arg Asn Glu Leu Arg Glu Gly Leu Val Arg
335 340 345 TTC GTC GAC TAC GCC GCC GAG CGG ACC CCG GGC ATG CAC ATC GAC CTG 7171 Phe Val Asp Tyr Ala Ala Glu Arg Thr Pro Gly Met His Ile Asp Leu
350 355 360 GGC TAC GCC CTG GAG AGC CTG CGG CGG GGT GTG GAC GCC GAG CTG CTG 7219 Gly Tyr Ala Leu Glu Ser Leu Arg Arg Gly Val Asp Ala Glu Leu Leu 365 370 375 380
CAC GCC GCC GGG CGC GGT TTC GAC CTC ACC GTC TAC ACC AAC GCC TTC 6739 His Ala Ala Gly Arg Gly Phe Asp Leu Thr Val Tyr Thr Asn Ala Phe 205 210 215 220 GCC CTC ACC GAG CAG ACG CTG AAC CGC CAG CCC GGC CTG TGG GAG CTG 6787 Ala Leu Thr Glu Gln Thr Leu Asn Arg Gln Pro Gly Leu Trp Glu Leu
225 230 235 GGC GCG ATC CGC ACG TCC CTC TAC GGG CTG AAC AAC GAC GAG TAC GAG 6835 Gly Ala Ile Arg Thr Ser Leu Tyr Gly Leu Asn Asn Asp Glu Tyr Glu
240 245 250 ACG ACC ACC GGC AAG CGC GGC GCT TTC GAA CGC GTC AAG AAG AAC CTG 6883 Thr Thr Thr Gly Lys Arg Gly Ala Phe Glu Arg Val Lys Lys Asn Leu
255 260 265 CAG GGC TTC CTG CGG ATG CGC GCC GAG CGG GAC GCG CCG ATC CGG CTC 6931 Gln Gly Phe Leu Arg Met Arg Ala Glu Arg Asp Ala Pro Ile Arg Leu
270 275 280 GGC TTC AAC CAC ATC ATC CTG CCG GGA CGG GCC GAC CGG CTC ACC GAC 6979 Gly Phe Asn His Ile Ile Leu Pro Gly Arg Ala Asp Arg Leu Thr Asp 285 290 295 300 CTC GTC GAC TTC ATC GCC GAG CTC AAC GAG TCC AGC CCG CAA CGG CCG 7027 Leu Val Asp Phe Ile Ala Glu Leu Asn Glu Ser Ser Pro Gln Arg Pro
305 310 315 CTG GAC TTC GTG ACG GTG CGC GAG GAC TAC AGC GGC CGC GAC GAC GGC 7075 Leu Asp Phe Val ThrVal Arg Glu Asp Tyr Ser Gly Arg Asp Asp Gly
320 325 330 CGG CTG TCG GAC TCC GAG CGC AAC GAG CTG CGC GAG GGC CTG GTG CGG 7123 Arg Leu Ser Asp Ser Glu Arg Asn Glu Leu Arg Glu Gly Leu Val Arg
335 340 345 TTC GTC GAC TAC GCC GCC GAG CGG ACC CCG GGC ATG CAC ATC GAC CTG 7171 Phe Val Asp Tyr Ala Ala Glu Arg Thr Pro Gly Met His Ile Asp Leu
350 355 360 GGC TAC GCC CTG GAG AGC CTG CGG CGG GGT GTG GAC GCC GAG CTG CTG 7219 Gly Tyr Ala Leu Glu Ser Leu Arg Arg Gly Val Asp Ala Glu Leu Leu 365 370 375 380

<Desc/Clms Page number 96><Desc / Clms Page number 96>

CGC ATC CGG CCG GAG ACG ATG CGT CCC ACC GCG CAC CCC CAG GTC GCG 7267 Arg Ile Arg Pro Glu Thr Met Arg Pro Thr Ala His Pro Gln Val Ala
385 390 395 GTG CAG ATC GAC CTG CTC GGC GAC GTC TAC CTC TAC CGC GAG GCG GGC 7315 Val Gln Ile Asp Leu Leu Gly Asp Val Tyr Leu Tyr Arg Glu Ala Gly
400 405 410 TTC CCG GAG CTG GAG GGC GCC ACC CGC TAC ATC GCG GGC CGG GTC ACC 7363 Phe Pro Glu Leu Glu Gly Ala Thr Arg Tyr Ile Ala Gly Arg Val Thr
415 420 425 CCG TCG ACC AGC CTG CGC GAG GTG GTG GAG AAC TTC GTG CTG GAG AAC 7411 Pro Ser Thr Ser Leu Arg Glu Val Val Glu Asn Phe Val Leu Glu Asn
430 435 440 GAG GGC GTG CAG CCC CGC CCC GGC GAC GAG TAC TTC CTC GAC GGC TTC 7459 Glu Gly Val Gln Pro Arg Pro Gly Asp Glu Tyr Phe Leu Asp Gly Phe 445 450 455 460 GAC CAG TCG GTG ACC GCA CGG CTC AAC CAG CTC GAA CGA GAC ATC GCC 7507 Asp Gln Ser Val Thr Ala Arg Leu Asn Gln Leu Glu Arg Asp Ile Ala
465 470 475 GAC GGG TGG GAG GAC CAC CGC GGC TTC CTG CGC GGA AGG TGAACCGGAG 7556 Asp Gly Trp Glu Asp His Arg Gly Phe Leu Arg Gly Arg
480 485 TTGCGAGTAC GTGAGCTGGC G GTG GCG GGC GGT TTC GAG TTC ACC CCC GAC 7607
Met Ala Gly Gly Phe Glu Phe Thr Pro Asp 1 5 5 10 CCG AAG CAG GAC CGG CGG GGC CTG TTC GTG TCT CCG CTG CAG GAC GAG 7655 Pro Lys Gln Asp Arg Arg Gly Leu Phe Val Ser Pro Leu Gln Asp Glu
15 20 25 GCG TTC GTG GGC GCG GTG GGC CAT CGG TTC CCC GTC GCC CAG ATG AAC 7703 Ala Phe Val Gly Ala Val Gly His Arg Phe Pro Val Ala Gln Met Asn
30 35 40 CAC ATC GTC TCC GCC CGG GGC GTG CTG CGC GGG CTG CAC TTC ACC ACC 7751 His Ile Val Ser Ala Arg Gly Val Leu Arg Gly Leu His Phe Thr Thr
45 50 55
CGC ATC CGG CCG GAG ACG ATG CGT CCC ACC GCG CAC CCC CAG GTC GCG 7267 Arg Ile Arg Pro Glu Thr Met Arg Pro Thr Ala His Pro Gln Val Ala
385 390 395 GTG CAG ATC GAC CTG CTC GGC GAC GTC TAC CTC TAC CGC GAG GCG GGC 7315 Val Gln Ile Asp Leu Leu Gly Asp Val Tyr Leu Tyr Arg Glu Ala Gly
400 405 410 TTC CCG GAG CTG GAG GGC GCC ACC CGC TAC ATC GCG GGC CGG GTC ACC 7363 Phe Pro Glu Leu Glu Gly Ala Thr Arg Tyr Ile Ala Gly Arg Val Thr
415 420 425 CCG TCG ACC AGC CTG CGC GAG GTG GTG GAG AAC TTC GTG CTG GAG AAC 7411 Pro Ser Thr Ser Leu Arg Glu Val Val Glu Asn Phe Val Leu Glu Asn
430 435 440 GAG GGC GTG CAG CCC CGC CCC GGC GAC GAG TAC TTC CTC GAC GGC TTC 7459 Glu Gly Val Gln Pro Arg Pro Gly Asp Glu Tyr Phe Leu Asp Gly Phe 445 450 455 460 GAC CAG TCG GTG ACC GCA CGG CTC AAC CAG CTC GAA CGA GAC ATC GCC 7507 Asp Gln Ser Val Thr Ala Arg Leu Asn Gln Leu Glu Arg Asp Ile Ala
465 470 475 GAC GGG TGG GAG GAC CAC CGC GGC TTC CTG CGC GGA AGG TGAACCGGAG 7556 Asp Gly Trp Glu Asp His Arg Gly Phe Leu Arg Gly Arg
480 485 TTGCGAGTAC GTGAGCTGGC G GTG GCG GGC GGT TTC GAG TTC ACC CCC GAC 7607
Met Ala Gly Gly Phe Glu Phe Thr Pro Asp 1 5 5 10 CCG AAG CAG GAC CGG CGG GGC CTG TTC GTG TCT CCG CTG CAG GAC GAG 7655 Pro Lys Gln Asp Arg Arg Gly Leu Phe Val Ser Pro Leu Gln Asp Glu
15 20 25 GCG TTC GTG GGC GCG GTG GGC CAT CGG TTC CCC GTC GCC CAG ATG AAC 7703 Ala Phe Val Gly Ala Val Gly His Arg Phe Pro Val Ala Gln Met Asn
30 35 40 CAC ATC GTC TCC GCC CGG GGC GTG CTG CGC GGG CTG CAC TTC ACC ACC 7751 His Ile Val Ser Ala Arg Gly Val Leu Arg Gly Leu His Phe Thr Thr
45 50 55

<Desc/Clms Page number 97><Desc / Clms Page number 97>

ACC CCG CCG GGG CAG TGC AAG TAC GTC TAC TGC GCG CGC GGC CGG GCG 7799 Thr Pro Pro Gly Gln Cys Lys Tyr Val Tyr Cys Ala Arg Gly Arg Ala
60 65 70 CTC GAC GTC ATC GTC GAC ATC CGG GTC GGC TCG CCG ACG TTC GGG AAG 7847 Leu Asp Val Ile Val Asp Ile Arg Val Gly Ser Pro Thr Phe Gly Lys
75 80 85 90 TGG GAC GCG GTG GAG ATG GAC ACC GAG CAC TTC CGG GCG GTC TAC TTC 7895 Trp Asp Ala Val Glu Met Asp Thr Glu His Phe Arg Ala Val Tyr Phe
95 100 105 CCC AGG GGC ACC GCG CAC GCC TTC CTC GCG CTT GAG GAC GAC ACC CTG 7943 Pro Arg Gly Thr Ala His Ala Phe Leu Ala Leu Glu Asp Asp Thr Leu
110 115 120 ATG TCG TAC CTG GTC AGC ACG CCG TAC GTG GCC GAG TAC GAG CAG GCG 7991 Met Ser Tyr Leu Val Ser Thr Pro Tyr Val Ala Glu Tyr Glu Gln Ala
125 130 135 ATC GAC CCG TTC GAC CCC GCG CTG GGT CTG CCG TGG CCC GCG GAC CTG 8039 Ile Asp Pro Phe Asp Pro Ala Leu Gly Leu Pro Trp Pro Ala Asp Leu
140 145 150 GAG GTC GTG CTC TCC GAC CGC GAC ACG GTG GCC GTG GAC CTG GAG ACC 8087 Glu Val Val Leu Ser Asp Arg Asp Thr Val Ala Val Asp Leu Glu Thr 155 160 165 170 GCC AGG CGG CGA GGG ATG CTG CCC GAC TAC GCC GAC TGC CTC GGC GAG 8135 Ala Arg Arg Arg Gly Met Leu Pro Asp Tyr Ala Asp Cys Leu Gly Glu
175 180 185 GAG CCC GCC AGC ACC GGC AGG TGAC 8160 Glu Pro Ala Ser Thr Gly Arg
190 (2) INFORMATIONS POUR LA SEQ ID NO: 7 : (i) CARACTERISTIQUES DE LA SEQUENCE: (A) LONGUEUR : 322 acides aminés (B) TYPE : acide aminé (D) CONFIGURATION : linéaire(ii) TYPE DE MOLECULE : (xi) DESCRIPTION DE LA SEQUENCE : SEQ ID NO: 7 :
ACC CCG CCG GGG CAG TGC AAG TAC GTC TAC TGC GCG CGC GGC CGG GCG 7799 Thr Pro Pro Gly Gln Cys Lys Tyr Val Tyr Cys Ala Arg Gly Arg Ala
60 65 70 CTC GAC GTC ATC GTC GAC ATC CGG GTC GGC TCG CCG ACG TTC GGG AAG 7847 Leu Asp Val Ile Val Asp Ile Arg Val Gly Ser Pro Thr Phe Gly Lys
75 80 85 90 TGG GAC GCG GTG GAG ATG GAC ACC GAG CAC TTC CGG GCG GTC TAC TTC 7895 Trp Asp Ala Val Glu Met Asp Thr Glu His Phe Arg Ala Val Tyr Phe
95 100 105 CCC AGG GGC ACC GCG CAC GCC TTC CTC GCG CTT GAG GAC GAC ACC CTG 7943 Pro Arg Gly Thr Ala His Ala Phe Leu Ala Leu Glu Asp Asp Thr Leu
110 115 120 ATG TCG TAC CTG GTC AGC ACG CCG TAC GTG GCC GAG TAC GAG CAG GCG 7991 Met Ser Tyr Leu Val Ser Thr Pro Tyr Val Ala Glu Tyr Glu Gln Ala
125 130 135 ATC GAC CCG TTC GAC CCC GCG CTG GGT CTG CCG TGG CCC GCG GAC CTG 8039 Ile Asp Pro Phe Asp Pro Ala Leu Gly Leu Pro Trp Pro Ala Asp Leu
140 145 150 GAG GTC GTG CTC TCC GAC CGC GAC ACG GTG GCC GTG GAC CTG GAG ACC 8087 Glu Val Val Leu Ser Asp Arg Asp Thr Val Ala Val Asp Leu Glu Thr 155 160 165 170 GCC AGG CGG CGA GGG ATG CTG CCC GAC TAC GCC GAC TGC CTC GGC GAG 8135 Ala Arg Arg Arg Gly Met Leu Pro Asp Tyr Ala Asp Cys Leu Gly Glu
175 180 185 GAG CCC GCC AGC ACC GGC AGG TGAC 8160 Glu Pro Ala Ser Thr Gly Arg
190 (2) INFORMATION FOR SEQ ID NO: 7: (i) CHARACTERISTICS OF THE SEQUENCE: (A) LENGTH: 322 amino acids (B) TYPE: amino acid (D) CONFIGURATION: linear (ii) TYPE OF MOLECULE: ( xi) DESCRIPTION OF THE SEQUENCE: SEQ ID NO: 7:

<Desc/Clms Page number 98><Desc / Clms Page number 98>

Met Asn Gly Ile Ser Asp Ser Pro Arg Gln Leu Ile Thr Leu Leu Gly 1 5 10 15 Ala Ser Gly Phe Val Gly Ser Ala Val Leu Arg Glu Leu Arg Asp His
20 25 30 Pro Val Arg Leu Arg Ala Val Ser Arg Gly Gly Ala Pro Ala Val Pro
35 40 45 Pro Gly Ala Ala Glu Val Glu Asp Leu Arg Ala Asp Leu Leu Glu Pro
50 55 60 Gly Arg Ala Ala Ala Ala Ile Glu Asp Ala Asp Val Ile Val His Leu
65 70 75 80 Val Ala His Ala Ala Gly Gly Ser Thr Trp Arg Ser Ala Thr Ser Asp
85 90 95 Pro Glu Ala Glu Arg Val Asn Val Gly Leu Met His Asp Leu Val Gly
100 105 110 Ala Leu His Asp Arg Arg Arg Ser Thr Pro Pro Val Leu Leu Tyr Ala
115 120 125 Ser Thr Ala Gln Ala Ala Asn Pro Ser Ala Ala Ser Arg Tyr Ala Gln
130 135 140 Gln Lys Thr Glu Ala Glu Arg Ile Leu Arg Lys Ala Thr Asp Glu Gly 145 150 155 160 Arg Val Arg Gly Val Ile Leu Arg Leu Pro Ala Val Tyr Gly Gln Ser
165 170 175 Gly Pro Ser Gly Pro Met Gly Arg Gly Val Val Ala Ala Met Ile Arg
180 185 190 Arg Ala Leu Ala Gly Glu Pro Leu Thr Met Trp His Asp Gly Gly Val
195 200 205 Arg Arg Asp Leu Leu His Val Glu Asp Val Ala Thr Ala Phe Ala Ala
210 215 220 Ala Leu Glu His His Asp Ala Leu Ala Gly Gly Thr Trp Ala Leu Gly 225 230 235 240
Met Asn Gly Ile Ser Asp Ser Pro Arg Gln Leu Ile Thr Leu Leu Gly 1 5 10 15 Ala Ser Gly Phe Val Gly Ser Ala Val Leu Arg Glu Leu Arg Asp His
20 25 30 Pro Val Arg Leu Arg Ala Val Ser Arg Gly Gly Ala Pro Ala Val Pro
35 40 45 Pro Gly Ala Ala Glu Val Glu Asp Leu Arg Ala Asp Leu Leu Glu Pro
50 55 60 Gly Arg Ala Ala Ala Ala Ile Glu Asp Ala Asp Val Ile Val His Leu
65 70 75 80 Val Ala His Ala Ala Gly Gly Ser Thr Trp Arg Ser Ala Thr Ser Asp
85 90 95 Pro Glu Ala Glu Arg Val Asn Val Gly Leu Met His Asp Leu Val Gly
100 105 110 Ala Leu His Asp Arg Arg Arg Ser Thr Pro Pro Val Leu Leu Tyr Ala
115 120 125 Ser Thr Ala Gln Ala Ala Asn Pro Ser Ala Ala Ser Arg Tyr Ala Gln
130 135 140 Gln Lys Thr Glu Ala Glu Arg Ile Leu Arg Lys Ala Thr Asp Glu Gly 145 150 155 160 Arg Val Arg Gly Val Ile Leu Arg Leu Pro Ala Val Tyr Gly Gln Ser
165 170 175 Gly Pro Ser Gly Pro Met Gly Arg Gly Val Val Ala Ala Met Ile Arg
180 185 190 Arg Ala Leu Ala Gly Glu Pro Leu Thr Met Trp His Asp Gly Gly Val
195 200 205 Arg Arg Asp Leu Leu His Val Glu Asp Val Ala Thr Ala Phe Ala Ala
210 215 220 Ala Leu Glu His His Asp Ala Leu Ala Gly Gly Thr Trp Ala Leu Gly 225 230 235 240

<Desc/Clms Page number 99><Desc / Clms Page number 99>

Ala Asp Arg Ser Glu Pro Leu Gly Asp Ile Phe Arg Ala Val Ser Gly
245 250 255 Ser Val Ala Arg Gln Thr Gly Ser Pro Ala Val Asp Val Val Thr Val
260 265 270 Pro Ala Pro Glu His Ala Glu Ala Asn Asp Phe Arg Ser Asp Asp Ile
275 280 285 Asp Ser Thr Glu Phe Arg Ser Arg Thr Gly Trp Arg Pro Arg Val Ser
290 295 300 Leu Thr Asp Gly Ile Asp Arg Thr Val Ala Ala Leu Thr Pro Thr Glu 305 310 315 320 Glu His (2) INFORMATIONS POUR LA SEQ ID NO: 8 : (i) CARACTERISTIQUES DE LA SEQUENCE: (A) LONGUEUR: 415 acides aminés (B) TYPE : aminé (D) CONFIGURATION : linéaire(ii) TYPE DE MOLECULE : (xi) DESCRIPTION DE LA SEQUENCE : SEQ ID NO: 8 : Met Arg Val Leu Leu Thr Ser Phe Ala His Arg Thr His Phe Gln Gly 1 5 10 15 Leu Val Pro Leu Ala Trp Ala Leu Arg Thr Ala Gly His Asp Val Arg
20 25 30 Val Ala Ala Gln Pro Ala Leu Thr Asp Ala Val Ile Gly Ala Gly Leu
35 40 45 Thr Ala Val Pro Val Gly Ser Asp His Arg Leu Phe Asp Ile Val Pro
50 55 60 Glu Val Ala Ala Gln Val His Arg Tyr Ser Phe Tyr Leu Asp Phe Tyr
65 70 75 80 His Arg Glu Gln Glu Leu His Ser Trp Glu Phe Leu Leu Gly Met Gln
85 90 95
Ala Asp Arg Ser Glu Pro Leu Gly Asp Ile Phe Arg Ala Val Ser Gly
245 250 255 Ser Val Ala Arg Gln Thr Gly Ser Pro Ala Val Asp Val Val Thr Val
260 265 270 Pro Ala Pro Glu His Ala Glu Ala Asn Asp Phe Arg Ser Asp Asp Ile
275 280 285 Asp Ser Thr Glu Phe Arg Ser Arg Thr Gly Trp Arg Pro Arg Val Ser
290 295 300 Leu Thr Asp Gly Ile Asp Arg Thr Val Ala Ala Leu Thr Pro Thr Glu 305 310 315 320 Glu His (2) INFORMATION FOR SEQ ID NO: 8: (i) CHARACTERISTICS OF THE SEQUENCE: (A) LENGTH: 415 amino acids (B) TYPE: amino (D) CONFIGURATION: linear (ii) TYPE OF MOLECULE: (xi) SEQUENCE DESCRIPTION: SEQ ID NO: 8: Met Arg Val Leu Leu Thr Ser Phe Ala His Arg Thr His Phe Gln Gly 1 5 10 15 Leu Val Pro Leu Ala Trp Ala Leu Arg Thr Ala Gly His Asp Val Arg
20 25 30 Val Ala Ala Gln Pro Ala Leu Thr Asp Ala Val Ile Gly Ala Gly Leu
35 40 45 Thr Ala Val Pro Val Gly Ser Asp His Arg Leu Phe Asp Ile Val Pro
50 55 60 Glu Val Ala Ala Gln Val His Arg Tyr Ser Phe Tyr Leu Asp Phe Tyr
65 70 75 80 His Arg Glu Gln Glu Leu His Ser Trp Glu Phe Leu Leu Gly Met Gln
85 90 95

<Desc/Clms Page number 100><Desc / Clms Page number 100>

Glu Ala Thr Ser Arg Trp Val Tyr Pro Val Val Asn Asn Asp Ser Phe
100 105 110 Val Ala Glu Leu Val Asp Phe Ala Arg Asp Trp Arg Pro Asp Leu Val
115 120 125 Leu Trp Glu Pro Phe Thr Phe Ala Gly Ala Val Ala Ala Arg Ala Cys
130 135 140 Gly Ala Ala His Ala Arg Leu Leu Trp Gly Ser Asp Leu Thr Gly Tyr 145 150 155 160 Phe Arg Gly Arg Phe Gln Ala Gln Arg Leu Arg Arg Pro Pro Glu Asp
165 170 175 Arg Pro Asp Pro Leu Gly Thr Trp Leu Thr Glu Val Ala Gly Arg Phe
180 185 190 Gly Val Glu Phe Gly Glu Asp Leu Ala Val Gly Gln Trp Ser Val Asp
195 200 205 Gln Leu Pro Pro Ser Phe Arg Leu Asp Thr Gly Met Glu Thr Val Val
210 215 220 Ala Arg Thr Leu Pro Tyr Asn Gly Ala Ser Val Val Pro Asp Trp Leu 225 230 235 240 Lys Lys Gly Ser Ala Thr Arg Arg Ile Cys Ile Thr Gly Gly Phe Ser
245 250 255 Gly Leu Gly Leu Ala Ala Asp Ala Asp Gln Phe Ala Arg Thr Leu Ala
260 265 270 Gln Leu Ala Arg Phe Asp Gly Glu Ile Val Val Thr Gly Ser Gly Pro
275 280 285 Asp Thr Ser Ala Val Pro Asp Asn Ile Arg Leu Val Asp Phe Val Pro
290 295 300 Met Gly Val Leu Leu Gln Asn Cys Ala Ala Ile Ile His His Gly Gly 305 310 315 320 Ala Gly Thr Trp Ala Thr Ala Leu His His Gly Ile Pro Gln Ile Ser
325 330 335
Glu Ala Thr Ser Arg Trp Val Tyr Pro Val Val Asn Asn Asp Ser Phe
100 105 110 Val Ala Glu Leu Val Asp Phe Ala Arg Asp Trp Arg Pro Asp Leu Val
115 120 125 Leu Trp Glu Pro Phe Thr Phe Ala Gly Ala Val Ala Ala Arg Ala Cys
130 135 140 Gly Ala Ala His Ala Arg Leu Leu Trp Gly Ser Asp Leu Thr Gly Tyr 145 150 155 160 Phe Arg Gly Arg Phe Gln Ala Gln Arg Leu Arg Arg Pro Pro Glu Asp
165 170 175 Arg Pro Asp Pro Leu Gly Thr Trp Leu Thr Glu Val Ala Gly Arg Phe
180 185 190 Gly Val Glu Phe Gly Glu Asp Leu Ala Val Gly Gln Trp Ser Val Asp
195 200 205 Gln Leu Pro Pro Ser Phe Arg Leu Asp Thr Gly Met Glu Thr Val Val
210 215 220 Ala Arg Thr Leu Pro Tyr Asn Gly Ala Ser Val Val Pro Asp Trp Leu 225 230 235 240 Lys Lys Gly Ser Ala Thr Arg Arg Ile Cys Ile Thr Gly Gly Phe Ser
245 250 255 Gly Leu Gly Leu Ala Ala Asp Ala Asp Gln Phe Ala Arg Thr Leu Ala
260 265 270 Gln Leu Ala Arg Phe Asp Gly Glu Ile Val Val Thr Gly Ser Gly Pro
275 280 285 Asp Thr Ser Ala Val Pro Asp Asn Ile Arg Leu Val Asp Phe Val Pro
290 295 300 Met Gly Val Leu Leu Gln Asn Cys Ala Ala Ile Ile His His Gly Gly 305 310 315 320 Ala Gly Thr Trp Ala Thr Ala Leu His His Gly Ile Pro Gln Ile Ser
325 330 335

<Desc/Clms Page number 101><Desc / Clms Page number 101>

Val Ala His Glu Trp Asp Cys Met Leu Arg Gly Gln Gln Thr Ala Glu
340 345 350 Leu Gly Ala Gly Ile Tyr Leu Arg Pro Asp Glu Val Asp Ala Asp Ser
355 360 365 Leu Ala Ser Ala Leu Thr Gln Val Val Glu Asp Pro Thr Tyr Thr Glu
370 375 380 Asn Ala Val Lys Leu Arg Glu Glu Ala Leu Ser Asp Pro Thr Pro Gln 385 390 395 400 Glu Ile Val Pro Arg Leu Glu Glu Leu Thr Arg Arg His Ala Gly
405 410 415 (2) INFORMATIONS POUR LA SEQ ID NO: 9 : (i) CARACTERISTIQUES DE LA SEQUENCE: (A) LONGUEUR : 237 acides aminés (B) TYPE: acide aminé (D) CONFIGURATION : linéaire(ii) TYPE DE MOLECULE : (xi) DESCRIPTION DE LA SEQUENCE : ID NO: 9 : Met Tyr Glu Gly Gly Phe Ala Glu Leu Tyr Asp Arg Phe Tyr Arg Gly 1 5 10 15 Arg Gly Lys Asp Tyr Ala Ala Glu Ala Ala Gln Val Ala Arg Leu Val
20 25 30 Arg Asp Arg Leu Pro Ser Ala Ser Ser Leu Leu Asp Val Ala Cys Gly
35 40 45 Thr Gly Thr His Leu Arg Arg Phe Ala Asp Leu Phe Asp Asp Val Thr
50 55 60 Gly Leu Glu Leu Ser Ala Ala Met Ile Glu Val Ala Arg Pro Gln Leu
65 70 75 80 Gly Gly Ile Pro Val Leu Gln Gly Asp Met Arg Asp Phe Ala Leu Asp
85 90 95 Arg Glu Phe Asp Ala Val Thr Cys Met Phe Ser Ser Ile Gly His Met
100 105 110
Val Ala His Glu Trp Asp Cys Met Leu Arg Gly Gln Gln Thr Ala Glu
340 345 350 Leu Gly Ala Gly Ile Tyr Leu Arg Pro Asp Glu Val Asp Ala Asp Ser
355 360 365 Leu Ala Ser Ala Leu Thr Gln Val Val Glu Asp Pro Thr Tyr Thr Glu
370 375 380 Asn Ala Val Lys Leu Arg Glu Glu Ala Leu Ser Asp Pro Thr Pro Gln 385 390 395 400 Glu Ile Val Pro Arg Leu Glu Glu Leu Thr Arg Arg His Ala Gly
405 410 415 (2) INFORMATION FOR SEQ ID NO: 9: (i) CHARACTERISTICS OF THE SEQUENCE: (A) LENGTH: 237 amino acids (B) TYPE: amino acid (D) CONFIGURATION: linear (ii) TYPE OF MOLECULE : (xi) DESCRIPTION OF THE SEQUENCE: ID NO: 9: Met Tyr Glu Gly Gly Phe Ala Glu Leu Tyr Asp Arg Arg Phe Tyr Arg Gly 1 5 10 15 Arg Gly Lys Asp Tyr Ala Ala Glu Ala Ala Gln Val Ala Arg Leu Val
20 25 30 Arg Asp Arg Leu Pro Ser Ala Ser Ser Leu Leu Asp Val Ala Cys Gly
35 40 45 Thr Gly Thr His Leu Arg Arg Phe Ala Asp Leu Phe Asp Asp Val Thr
50 55 60 Gly Leu Glu Leu Ser Ala Ala Met Ile Glu Val Ala Arg Pro Gln Leu
65 70 75 80 Gly Gly Ile Pro Val Leu Gln Gly Asp Met Arg Asp Phe Ala Leu Asp
85 90 95 Arg Glu Phe Asp Ala Val Thr Cys Met Phe Ser Ser Ile Gly His Met
100 105 110

<Desc/Clms Page number 102><Desc / Clms Page number 102>

Arg Asp Gly Ala Glu Leu Asp Gln Ala Leu Ala Ser Phe Ala Arg His
115 120 125 Leu Ala Pro Gly Gly Val Val Val Val Glu Pro Trp Trp Phe Pro Glu
130 135 140 Asp Phe Leu Asp Gly Tyr Val Ala Gly Asp Val Val Arg Asp Gly Asp 145 150 155 160 Leu Thr Ile Ser Arg Val Ser His Ser Val Arg Ala Gly Gly Ala Thr
165 170 175 Arg Met Glu Ile His Trp Val Val Ala Asp Ala Val Asn Gly Pro Arg
180 185 190 His His Val Glu His Tyr Glu Ile Thr Leu Phe Glu Arg Gln Gln Tyr
195 200 205 Glu Lys Ala Phe Thr Ala Ala Gly Cys Ala Val Gln Tyr Leu Glu Gly
210 215 220 Gly Pro Ser Gly Arg Gly Leu Phe Val Gly Val Arg Gly 225 230 235 (2) INFORMATIONS POUR LA SEQ ID NO: 10 : (i) CARACTERISTIQUES DE LA SEQUENCE: (A) LONGUEUR : 510 acides aminés (B) TYPE : aminé (D) CONFIGURATION : linéaire(ii) TYPE DE MOLECULE : (xi) DESCRIPTION DE LA SEQUENCE : SEQ ID NO: 10 : Met Arg Val Leu Ile Asp Asn Ala Arg Arg Gln Gln Ala Glu Pro Ser 1 5 10 15 Thr Thr Pro Gln Gly Glu Ser Met Gly Asp Arg Thr Gly Asp Arg Thr
20 25 30 Ile Pro Glu Ser Ser Gln Thr Ala Thr Arg Phe Leu Leu Gly Asp Gly
35 40 45 Gly Ile Pro Thr Ala Thr Ala Glu Thr His Asp Trp Leu Thr Arg Asn
50 55 60
Arg Asp Gly Ala Glu Leu Asp Gln Ala Leu Ala Ser Phe Ala Arg His
115 120 125 Leu Ala Pro Gly Gly Val Val Val Val Glu Pro Trp Trp Phe Pro Glu
130 135 140 Asp Phe Leu Asp Gly Tyr Val Ala Gly Asp Val Val Arg Asp Gly Asp 145 150 155 160 Leu Thr Ile Ser Arg Val Ser His Ser Val Arg Ala Gly Gly Ala Thr
165 170 175 Arg Met Glu Ile His Trp Val Val Ala Asp Ala Val Asn Gly Pro Arg
180 185 190 His His Val Glu His Tyr Glu Ile Thr Leu Phe Glu Arg Gln Gln Tyr
195 200 205 Glu Lys Ala Phe Thr Ala Ala Gly Cys Ala Val Gln Tyr Leu Glu Gly
210 215 220 Gly Pro Ser Gly Arg Gly Leu Phe Val Gly Val Arg Gly 225 230 235 (2) INFORMATION FOR SEQ ID NO: 10: (i) CHARACTERISTICS OF THE SEQUENCE: (A) LENGTH: 510 amino acids (B) TYPE: amino (D) CONFIGURATION: linear (ii) TYPE OF MOLECULE: (xi) SEQUENCE DESCRIPTION: SEQ ID NO: 10: Met Arg Val Leu Ile Asp Asn Ala Arg Arg Gln Gln Ala Glu Pro Ser 1 5 10 15 Thr Thr Pro Gln Gly Glu Ser Met Gly Asp Arg Thr Gly Asp Arg Thr
20 25 30 Ile Pro Glu Ser Ser Gln Thr Ala Thr Arg Phe Leu Leu Gly Asp Gly
35 40 45 Gly Ile Pro Thr Ala Thr Ala Glu Thr His Asp Trp Leu Thr Arg Asn
50 55 60

<Desc/Clms Page number 103><Desc / Clms Page number 103>

Gly Ala Glu Gln Arg Leu Glu Val Ala Arg Val Pro Phe Ser Ala Met
65 70 75 80 Asp Arg Trp Ser Phe Gln Pro Glu Asp Gly Arg Leu Ala His Glu Ser
85 90 95 Gly Arg Phe Phe Ser Ile Glu Gly Leu His Val Arg Thr Asn Phe Gly
100 105 110 Trp Arg Arg Asp Trp Ile Gln Pro Ile Ile Val Gln Pro Glu Ile Gly
115 120 125 Phe Leu Gly Leu Ile Val Lys Glu Phe Asp Gly Val Leu His Val Leu
130 135 140 Ala Gln Ala Lys Ala Glu Pro Gly Asn Ile Asn Ala Val Gln Leu Ser 145 150 155 160 Pro Thr Leu Gln Ala Thr Arg Ser Asn Tyr Thr Gly Val His Arg Gly
165 170 175 Ser Lys Val Arg Phe Ile Glu Tyr Phe Asn Gly Thr Arg Pro Ser Arg
180 185 190 Ile Leu Val Asp Val Leu Gln Ser Glu Gln Gly Ala Trp Phe Leu Arg
195 200 205 Lys Arg Asn Arg Asn Met Val Val Glu Val Phe Asp Asp Leu Pro Glu
210 215 220 His Pro Asn Phe Arg Trp Leu Thr Val Ala Gln Leu Arg Ala Met Leu 225 230 235 240 His His Asp Asn Val Val Asn Met Asp Leu Arg Thr Val Leu Ala Cys
245 250 255 Val Pro Thr Ala Val Glu Arg Asp Arg Ala Asp Asp Val Leu Ala Arg
260 265 270 Leu Pro Glu Gly Ser Phe Gln Ala Arg Leu Leu His Ser Phe Ile Gly
275 280 285 Ala Gly Thr Pro Ala Asn Asn Met Asn Ser Leu Leu Ser Trp Ile Ser
290 295 300
Gly Ala Glu Gln Arg Leu Glu Val Ala Arg Val Pro Phe Ser Ala Met
65 70 75 80 Asp Arg Trp Ser Phe Gln Pro Glu Asp Gly Arg Leu Ala His Glu Ser
85 90 95 Gly Arg Phe Phe Ser Ile Glu Gly Leu His Val Arg Thr Asn Phe Gly
100 105 110 Trp Arg Arg Asp Trp Ile Gln Pro Ile Val Gln Pro Glu Ile Gly
115 120 125 Phe Leu Gly Leu Ile Val Lys Glu Phe Asp Gly Val Leu His Val Leu
130 135 140 Ala Gln Ala Lys Ala Glu Pro Gly Asn Ile Asn Ala Val Gln Leu Ser 145 150 155 160 Pro Thr Leu Gln Ala Thr Arg Ser Asn Tyr Thr Gly Val His Arg Gly
165 170 175 Ser Lys Val Arg Phe Ile Glu Tyr Phe Asn Gly Thr Arg Pro Ser Arg
180 185 190 Ile Leu Val Asp Val Leu Gln Ser Glu Gln Gly Ala Trp Phe Leu Arg
195 200 205 Lys Arg Asn Arg Asn Met Val Val Glu Val Phe Asp Asp Leu Pro Glu
210 215 220 His Pro Asn Phe Arg Trp Leu Thr Val Ala Gln Leu Arg Ala Met Leu 225 230 235 240 His His Asp Asn Val Val Asn Met Asp Leu Arg Thr Val Leu Ala Cys
245 250 255 Val Pro Thr Ala Val Glu Arg Asp Arg Ala Asp Asp Val Leu Ala Arg
260 265 270 Leu Pro Glu Gly Ser Phe Gln Ala Arg Leu Leu His His Phe Ile Gly
275 280 285 Ala Gly Thr Pro Ala Asn Asn Met Asn Ser Leu Leu Ser Trp Ile Ser
290 295 300

<Desc/Clms Page number 104><Desc / Clms Page number 104>

Asp Val Arg Ala Arg Arg Glu Phe Val Gln Arg Gly Arg Pro Leu Pro 305 310 - 315 320 Asp Ile Glu Arg Ser Gly Trp Ile Arg Arg Asp Asp Gly Ile Glu His
325 330 335 Glu Glu Lys Lys Tyr Phe Asp Val Phe Gly Val Thr Val Ala Thr Ser
340 345 350 Asp Arg Glu Val Asn Ser Trp Met Gln Pro Leu Leu Ser Pro Ala Asn
355 360 365 Asn Gly Leu Leu Ala Leu Leu Val Lys Asp Ile Gly Gly Thr Leu His
370 375 380 Ala Leu Val Gln Leu Arg Thr Glu Ala Gly Gly Met Asp Val Ala Glu 385 390 395 400 Leu Ala Pro Thr Val His Cys Gln Pro Asp Asn Tyr Ala Asp Ala Pro
405 410 415 Glu Glu Phe Arg Pro Ala Tyr Val Asp Tyr Val Leu Asn Val Pro Arg
420 425 430 Ser Gln Val Arg Tyr Asp Ala Trp His Ser Glu Glu Gly Gly Arg Phe
435 440 445 Tyr Arg Asn Glu Asn Arg Tyr Met Leu Ile Glu Val Pro Ala Asp Phe
450 455 460 Asp Ala Ser Ala Ala Pro Asp His Arg Trp Met Thr Phe Asp Gln Ile 465 470 475 480 Thr Tyr Leu Leu Gly His Ser His Tyr Val Asn Ile Gln Leu Arg Ser
485 490 495 Ile Ile Ala Cys Ala Ser Ala Val Tyr Thr Arg Thr Ala Gly
500 505 510 (2) INFORMATIONS POUR LA SEQ ID NO: 11 : (i) CARACTERISTIQUES DE LA SEQUENCE: (A) LONGUEUR : acides aminés (B) TYPE : aminé (D) CONFIGURATION :
Asp Val Arg Ala Arg Arg Glu Phe Val Gln Arg Gly Arg Pro Leu Pro 305 310 - 315 320 Asp Ile Glu Arg Ser Gly Trp Ile Arg Arg Asp Asp Gly Ile Glu His
325 330 335 Glu Glu Lys Lys Tyr Phe Asp Val Phe Gly Val Thr Val Ala Thr Ser
340 345 350 Asp Arg Glu Val Asn Ser Trp Met Gln Pro Leu Leu Ser Pro Ala Asn
355 360 365 Asn Gly Leu Leu Ala Leu Leu Val Lys Asp Ile Gly Gly Thr Leu His
370 375 380 Ala Leu Val Gln Leu Arg Thr Glu Ala Gly Gly Met Asp Val Ala Glu 385 390 395 400 Leu Ala Pro Thr Val His Cys Gln Pro Asp Asn Tyr Ala Asp Ala Pro
405 410 415 Glu Glu Phe Arg Pro Ala Tyr Val Asp Tyr Val Leu Asn Val Pro Arg
420 425 430 Ser Gln Val Arg Tyr Asp Ala Trp His Ser Glu Glu Gly Gly Arg Phe
435 440 445 Tyr Arg Asn Glu Asn Arg Tyr Met Leu Ile Glu Val Pro Ala Asp Phe
450 455 460 Asp Ala Ser Ala Ala Pro Asp His Arg Trp Met Thr Phe Asp Gln Ile 465 470 475 480 Thr Tyr Leu Leu Gly His Ser His Tyr Val Asn Ile Gln Leu Arg Ser
485 490 495 Ile Ile Ala Cys Ala Ser Ala Val Tyr Thr Arg Thr Ala Gly
500 505 510 (2) INFORMATION FOR SEQ ID NO: 11: (i) CHARACTERISTICS OF THE SEQUENCE: (A) LENGTH: amino acids (B) TYPE: amino (D) CONFIGURATION:

<Desc/Clms Page number 105><Desc / Clms Page number 105>

linéaire(ii) TYPE DE MOLECULE : (xi) DESCRIPTION DE LA SEQUENCE : ID NO: 11 : Met Asn Thr Thr Arg Thr Ala Thr Ala Gln Glu Ala Gly Val Ala Asp 1 5 10 15 Ala Ala Arg Pro Asp Val Asp Arg Arg Ala Val Val Arg Ala Leu Ser
20 25 30 Ser Glu Val Ser Arg Val Thr Gly Ala Gly Asp Gly Asp Ala Asp Val
35 40 45 Gln Ala Ala Arg Leu Ala Asp Leu Ala Ala His Tyr Gly Ala His Pro
50 55 60 Phe Thr Pro Leu Glu Gln Thr Arg Ala Arg Leu Gly Leu Asp Arg Ala
65 70 75 80 Glu Phe Ala His Leu Leu Asp Leu Phe Gly Arg Ile Pro Asp Leu Gly
85 90 95 Thr Ala Val Glu His Gly Pro Ala Gly Lys Tyr Trp Ser Asn Thr Ile
100 105 110 Lys Pro Leu Asp Ala Ala Gly Ala Leu Asp Ala Ala Val Tyr Arg Lys
115 120 125 Pro Ala Phe Pro Tyr Ser Val Gly Leu Tyr Pro Gly Pro Thr Cys Met
130 135 140 Phe Arg Cys His Phe Cys Val Arg Val Thr Gly Ala Arg Tyr Glu Ala 145 150 155 160 Ala Ser Val Pro Ala Gly Asn Glu Thr Leu Ala Ala Ile Ile Asp Glu
165 170 175 Val Pro Thr Asp Asn Pro Lys Ala Met Tyr Met Ser Gly Gly Leu Glu
180 185 190 Pro Leu Thr Asn Pro Gly Leu Gly Glu Leu Val Ser His Ala Ala Gly
195 200 205 Arg Gly Phe Asp Leu Thr Val Tyr Thr Asn Ala Phe Ala Leu Thr Glu
210 215 220
linear (ii) MOLECULE TYPE: (xi) SEQUENCE DESCRIPTION: ID NO: 11: Met Asn Thr Thr Arg Thr Ala Thr Ala Gln Glu Ala Gly Val Ala Asp 1 5 10 15 Ala Ala Arg Pro Asp Val Asp Arg Arg Ala Val Val Arg Ala Leu Ser
20 25 30 Ser Glu Val Ser Arg Val Thr Gly Ala Gly Asp Gly Asp Ala Asp Val
35 40 45 Gln Ala Ala Arg Leu Ala Asp Leu Ala Ala His Tyr Gly Ala His Pro
50 55 60 Phe Thr Pro Leu Glu Gln Thr Arg Ala Arg Leu Gly Leu Asp Arg Ala
65 70 75 80 Glu Phe Ala His Leu Leu Asp Leu Phe Gly Arg Ile Pro Asp Leu Gly
85 90 95 Thr Ala Val Glu His Gly Pro Ala Gly Lys Tyr Trp Ser Asn Thr Ile
100 105 110 Lys Pro Leu Asp Ala Ala Gly Ala Leu Asp Ala Ala Val Tyr Arg Lys
115 120 125 Pro Ala Phe Pro Tyr Ser Val Gly Leu Tyr Pro Gly Pro Thr Cys Met
130 135 140 Phe Arg Cys His Phe Cys Val Arg Val Thr Gly Ala Arg Tyr Glu Ala 145 150 155 160 Ala Ser Val Pro Ala Gly Asn Glu Thr Leu Ala Ala Ile Ile Asp Glu
165 170 175 Val Pro Thr Asp Asn Pro Lys Ala Met Tyr Met Ser Gly Gly Leu Glu
180 185 190 Pro Leu Thr Asn Pro Gly Leu Gly Glu Leu Val Ser His Ala Ala Gly
195 200 205 Arg Gly Phe Asp Leu Thr Val Tyr Thr Asn Ala Phe Ala Leu Thr Glu
210 215 220

<Desc/Clms Page number 106><Desc / Clms Page number 106>

Gln Thr Leu Asn Arg Gln Pro Gly Leu Trp Glu Leu Gly Ala Ile Arg 225 230 235 240 Thr Ser Leu Tyr Gly Leu Asn Asn Asp Glu Tyr Glu Thr Thr Thr Gly
245 250 255 Lys Arg Gly Ala Phe Glu Arg Val Lys Lys Asn Leu Gln Gly Phe Leu
260 265 270 Arg Met Arg Ala Glu Arg Asp Ala Pro Ile Arg Leu Gly Phe Asn His
275 280 285 Ile Ile Leu Pro Gly Arg Ala Asp Arg Leu Thr Asp Leu Val Asp Phe
290 295 300 Ile Ala Glu Leu Asn Glu Ser Ser Pro Gln Arg Pro Leu Asp Phe Val 305 310 315 320 Thr Val Arg Glu Asp Tyr Ser Gly Arg Asp Asp Gly Arg Leu Ser Asp
325 330 335 Ser Glu Arg Asn Glu Leu Arg Glu Gly Leu Val Arg Phe Val Asp Tyr
340 345 350 Ala Ala Glu Arg Thr Pro Gly Met His Ile Asp Leu Gly Tyr Ala Leu
355 360 365 Glu Ser Leu Arg Arg Gly Val Asp Ala Glu Leu Leu Arg Ile Arg Pro
370 375 380 Glu Thr Met Arg Pro Thr Ala His Pro Gln Val Ala Val Gln Ile Asp 385 390 395 400 Leu Leu Gly Asp Val Tyr Leu Tyr Arg Glu Ala Gly Phe Pro Glu Leu
405 410 415 Glu Gly Ala Thr Arg Tyr Ile Ala Gly Arg Val Thr Pro Ser Thr Ser
420 425 430 Leu Arg Glu Val Val Glu Asn Phe Val Leu Glu Asn Glu Gly Val Gln
435 440 445 Pro Arg Pro Gly Asp Glu Tyr Phe Leu Asp Gly Phe Asp Gln Ser Val
450 455 460
Gln Thr Leu Asn Arg Gln Pro Gly Leu Trp Glu Leu Gly Ala Ile Arg 225 230 235 240 Thr Ser Leu Tyr Gly Leu Asn Asn Asp Glu Tyr Glu Thr Thr Thr Gly
245 250 255 Lys Arg Gly Ala Phe Glu Arg Val Lys Lys Asn Leu Gln Gly Phe Leu
260 265 270 Arg Met Arg Ala Glu Arg Asp Ala Pro Ile Arg Leu Gly Phe Asn His
275 280 285 Ile Ile Leu Pro Gly Arg Ala Asp Arg Leu Thr Asp Leu Val Asp Phe
290 295 300 Ile Ala Glu Leu Asn Glu Ser Ser Pro Gln Arg Pro Leu Asp Phe Val 305 310 315 320 Thr Val Arg Glu Asp Tyr Ser Gly Arg Asp Asp Gly Arg Leu Ser Asp
325 330 335 Ser Glu Arg Asn Glu Leu Arg Glu Gly Leu Val Arg Phe Val Asp Tyr
340 345 350 Ala Ala Glu Arg Thr Pro Gly Met His Ile Asp Leu Gly Tyr Ala Leu
355 360 365 Glu Ser Leu Arg Arg Gly Val Asp Ala Glu Leu Leu Arg Ile Arg Pro
370 375 380 Glu Thr Met Arg Pro Thr Ala His Pro Gln Val Ala Val Gln Ile Asp 385 390 395 400 Leu Leu Gly Asp Val Tyr Leu Tyr Arg Glu Ala Gly Phe Pro Glu Leu
405 410 415 Glu Gly Ala Thr Arg Tyr Ile Ala Gly Arg Val Thr Pro Ser Thr Ser
420 425 430 Leu Arg Glu Val Val Glu Asn Phe Val Leu Glu Asn Glu Gly Val Gln
435 440 445 Pro Arg Pro Gly Asp Glu Tyr Phe Leu Asp Gly Phe Asp Gln Ser Val
450 455 460

<Desc/Clms Page number 107><Desc / Clms Page number 107>

Thr Ala Arg Leu Asn Gln Leu Glu Arg Asp Ile Ala Asp Gly Trp Glu 465 470 475 480 Asp His Arg Gly Phe Leu Arg Gly Arg
485 (2) INFORMATIONS POUR LA SEQ ID NO: 12 : (i) CARACTERISTIQUES DE LA SEQUENCE: (A) LONGUEUR : acides aminés (B) TYPE : aminé (D) CONFIGURATION : linéaire(ii) TYPE DE MOLECULE : (xi) DESCRIPTION DE LA SEQUENCE : SEQ ID NO: 12 : Met Ala Gly Gly Phe Glu Phe Thr Pro Asp Pro Lys Gln Asp Arg Arg 1 5 10 15 Gly Leu Phe Val Ser Pro Leu Gln Asp Glu Ala Phe Val Gly Ala Val
20 25 30 Gly His Arg Phe Pro Val Ala Gln Met Asn His Ile Val Ser Ala Arg
35 40 45 Gly Val Leu Arg Gly Leu His Phe Thr Thr Thr Pro Pro Gly Gln Cys
50 55 60 Lys Tyr Val Tyr Cys Ala Arg Gly Arg Ala Leu Asp Val Ile Val Asp
65 70 75 80 Ile Arg Val Gly Ser Pro Thr Phe Gly Lys Trp Asp Ala Val Glu Met
85 90 95 Asp Thr Glu His Phe Arg Ala Val Tyr Phe Pro Arg Gly Thr Ala His
100 105 110 Ala Phe Leu Ala Leu Glu Asp Asp Thr Leu Met Ser Tyr Leu Val Ser
115 120 125 Thr Pro Tyr Val Ala Glu Tyr Glu Gln Ala Ile Asp Pro Phe Asp Pro
130 135 140 Ala Leu Gly Leu Pro Trp Pro Ala Asp Leu Glu Val Val Leu Ser Asp 145 150 155 160
Thr Ala Arg Leu Asn Gln Leu Glu Arg Asp Ile Ala Asp Gly Trp Glu 465 470 475 480 Asp His Arg Gly Phe Leu Arg Gly Arg
485 (2) INFORMATION FOR SEQ ID NO: 12: (i) CHARACTERISTICS OF THE SEQUENCE: (A) LENGTH: amino acids (B) TYPE: amino (D) CONFIGURATION: linear (ii) TYPE OF MOLECULE: (xi) SEQUENCE DESCRIPTION: SEQ ID NO: 12: Met Ala Gly Gly Phe Glu Phe Thr Pro Asp Pro Lys Gln Asp Arg Arg 1 5 10 15 Gly Leu Phe Val Ser Pro Leu Gln Asp Glu Ala Phe Val Gly Ala Val
20 25 30 Gly His Arg Phe Pro Val Ala Gln Met Asn His Ile Val Ser Ala Arg
35 40 45 Gly Val Leu Arg Gly Leu His Phe Thr Thr Thr Pro Pro Gly Gln Cys
50 55 60 Lys Tyr Val Tyr Cys Ala Arg Gly Arg Ala Leu Asp Val Ile Val Asp
65 70 75 80 Ile Arg Val Gly Ser Pro Thr Phe Gly Lys Trp Asp Ala Val Glu Met
85 90 95 Asp Thr Glu His Phe Arg Ala Val Tyr Phe Pro Arg Gly Thr Ala His
100 105 110 Ala Phe Leu Ala Leu Glu Asp Asp Thr Leu Met Ser Tyr Leu Val Ser
115 120 125 Thr Pro Tyr Val Ala Glu Tyr Glu Gln Ala Ile Asp Pro Phe Asp Pro
130 135 140 Ala Leu Gly Leu Pro Trp Pro Ala Asp Leu Glu Val Val Leu Ser Asp 145 150 155 160

<Desc/Clms Page number 108><Desc / Clms Page number 108>

Arg Asp Thr Val Ala Val Asp Leu Glu Thr Ala Arg Arg Arg Gly Met
165 170 175 Leu Pro Asp Tyr Ala Asp Cys Leu Gly Glu Glu Pro Ala Ser Thr Gly
180 185 190 Arg (2) INFORMATIONS POUR LA SEQ ID NO: 13 : (i) CARACTERISTIQUES DE LA SEQUENCE: (A) LONGUEUR : paires de bases (B) TYPE : (C) NOMBRE DE BRINS : double(D) CONFIGURATION : linéaire (ii) TYPE DE MOLECULE : ADN(génomique) (vi) ORIGINE: (A) ORGANISME : erythraea (ix) CARACTERISTIQUE: (A) NOM/CLE : (B) EMPLACEMENT:1..1203 (D) AUTRES INFORMATIONS:/function= "implique dans la byosynthese de la desosamine" /gene= "eryCIV" /note= "SEQ ID NO 6 DE 4837 A 6039" (ix) CARACTERISTIQUE: (A) NOM/CLE: mat~peptide (B) EMPLACEMENT:! (xi) DESCRIPTION DE LA SEQUENCE : ID NO: 13 : ATG AAA CGC GCG CTG ACC GAC CTG GCG ATC TTC GGC GGC CCC GAG GCA 48 Met Lys Arg Ala Leu Thr Asp Leu Ala Ile Phe Gly Gly Pro Glu Ala 1 5 10 15 TTC CTG CAC ACC CTC TAC GTG GGC AGG CCG ACC GTC GGG GAC CGG GAG 96 Phe Leu His Thr Leu Tyr Val Gly Arg Pro Thr Val Gly Asp Arg Glu
20 25 30
Arg Asp Thr Val Ala Val Asp Leu Glu Thr Ala Arg Arg Arg Gly Met
165 170 175 Leu Pro Asp Tyr Ala Asp Cys Leu Gly Glu Glu Pro Ala Ser Thr Gly
180 185 190 Arg (2) INFORMATION FOR SEQ ID NO: 13: (i) CHARACTERISTICS OF THE SEQUENCE: (A) LENGTH: base pairs (B) TYPE: (C) NUMBER OF STRANDS: double (D) CONFIGURATION: linear (ii) TYPE OF MOLECULE: DNA (genomics) (vi) ORIGIN: (A) ORGANISM: erythraea (ix) CHARACTERISTIC: (A) NAME / KEY: (B) LOCATION: 1..1203 (D) OTHER INFORMATION: / function = "involved in the desosamine byosynthesis" / gene = "eryCIV" / note = "SEQ ID NO 6 FROM 4837 TO 6039" (ix) CHARACTERISTIC: (A) NAME / KEY: mat ~ peptide (B) LOCATION :! (xi) DESCRIPTION OF THE SEQUENCE: ID NO: 13: ATG AAA CGC GCG CTG ACC GAC CTG GCG ATC TTC GGC GGC CCC GAG GCA 48 Met Lys Arg Ala Leu Thr Asp Leu Ala Ile Phe Gly Gly Pro Glu Ala 1 5 10 15 TTC CTG CAC ACC CTC TAC GTG GGC AGG CCG ACC GTC GGG GAC CGG GAG 96 Phe Leu His Thr Leu Tyr Val Gly Arg Pro Thr Val Gly Asp Arg Glu
20 25 30

<Desc/Clms Page number 109><Desc / Clms Page number 109>

CGG TTC TTC GCC CGC CTG GAG TGG GCG CTG AAC AAC AAC TGG CTG ACC 144 Arg Phe Phe Ala Arg Leu Glu Trp Ala Leu Asn Asn Asn Trp Leu Thr
35 40 45 AAC GGC GGA CCA CTG GTG CGC GAG TTC GAG GGC CGG GTC GCC GAC CTG 192 Asn Gly Gly Pro Leu Val Arg Glu Phe Glu Gly Arg Val Ala Asp Leu
50 55 60 GCG GGT GTC CGC CAC TGC GTG GCC ACC TGC AAC GCG ACG GTC GCG CTG 240 Ala Gly Val Arg His Cys Val Ala Thr Cys Asn Ala Thr Val Ala Leu
65 70 75 80 CAA CTG GTG CTG CGC GCG AGC GAC GTG TCC GGC GAG GTC GTC ATG CCT 288 Gln Leu Val Leu Arg Ala Ser Asp Val Ser Gly Glu Val Val Met Pro
85 90 95 TCG ATG ACG TTC GCG GCC ACC GCG CAC GCG GCG AGC TGG CTG GGG CTG 336 Ser Met Thr Phe Ala Ala Thr Ala His Ala Ala Ser Trp Leu Gly Leu
100 105 110 GAA CCG GTG TTC TGC GAC GTG GAC CCC GAG ACC GGC CTG CTC GAC CCC 384 Glu Pro Val Phe Cys Asp Val Asp Pro Glu Thr Gly Leu Leu Asp Pro
115 120 125 GAG CAC GTC GCG TCG CTG GTG ACA CCG CGG ACG GGC GCG ATC ATC GGC 432 Glu His Val Ala Ser Leu Val Thr Pro Arg Thr Gly Ala Ile Ile Gly
130 135 140 GTG CAC CTG TGG GGC AGG CCC GCT CCG GTC GAG GCG CTG GAG AAG ATC 480 Val His Leu Trp Gly Arg Pro Ala Pro Val Glu Ala Leu Glu Lys Ile 145 150 155 160 GCC GCC GAG CAC CAG GTC AAA CTC TTC TTC GAC GCC GCG CAC GCG CTG 528 Ala Ala Glu His Gln Val Lys Leu Phe Phe Asp Ala Ala His Ala Leu
165 170 175 GGC TGC ACC GCC GGC GGG CGG CCG GTC GGC GCC TTC GGC AAC GCC GAG 576 Gly Cys Thr Ala Gly Gly Arg Pro Val Gly Ala Phe Gly Asn Ala Glu
180 185 190 GTG TTC AGC TTC CAC GCC ACG AAG GCG GTC ACC TCG TTC GAG GGC GGC 624 Val Phe Ser Phe His Ala Thr Lys Ala Val Thr Ser Phe Glu Gly Gly
195 200 205
CGG TTC TTC GCC CGC CTG GAG TGG GCG CTG AAC AAC AAC TGG CTG ACC 144 Arg Phe Phe Ala Arg Leu Glu Trp Ala Leu Asn Asn Asn Trp Leu Thr
35 40 45 AAC GGC GGA CCA CTG GTG CGC GAG TTC GAG GGC CGG GTC GCC GAC CTG 192 Asn Gly Gly Pro Leu Val Arg Glu Phe Glu Gly Arg Val Ala Asp Leu
50 55 60 GCG GGT GTC CGC CAC TGC GTG GCC ACC TGC AAC GCG ACG GTC GCG CTG 240 Ala Gly Val Arg His Cys Val Ala Thr Cys Asn Ala Thr Val Ala Leu
65 70 75 80 CAA CTG GTG CTG CGC GCG AGC GAC GTG TCC GGC GAG GTC GTC ATG CCT 288 Gln Leu Val Leu Arg Ala Ser Asp Val Ser Gly Glu Val Val Met Pro
85 90 95 TCG ATG ACG TTC GCG GCC ACC GCG CAC GCG GCG AGC TGG CTG GGG CTG 336 Ser Met Thr Phe Ala Ala Thr Ala His Ala Ala Ser Trp Leu Gly Leu
100 105 110 GAA CCG GTG TTC TGC GAC GTG GAC CCC GAG ACC GGC CTG CTC GAC CCC 384 Glu Pro Val Phe Cys Asp Val Asp Pro Glu Thr Gly Leu Leu Asp Pro
115 120 125 GAG CAC GTC GCG TCG CTG GTG ACA CCG CGG ACG GGC GCG ATC ATC GGC 432 Glu His Val Ala Ser Leu Val Thr Pro Arg Thr Gly Ala Ile Gly Ile
130 135 140 GTG CAC CTG TGG GGC AGG CCC GCT CCG GTC GAG GCG CTG GAG AAG ATC 480 Val His Leu Trp Gly Arg Pro Ala Pro Val Glu Ala Leu Glu Lys Ile 145 150 155 160 GCC GCC GAG CAC CAG GTC AAA CTC incl. GAC GCC GCG CAC GCG CTG 528 Ala Ala Glu His Gln Val Lys Leu Phe Phe Asp Ala Ala His Ala Leu
165 170 175 GGC TGC ACC GCC GGC GGG CGG CCG GTC GGC GCC TTC GGC AAC GCC GAG 576 Gly Cys Thr Ala Gly Gly Arg Pro Val Gly Ala Phe Gly Asn Ala Glu
180 185 190 GTG TTC AGC TTC CAC GCC ACG AAG GCG GTC ACC TCG TTC GAG GGC GGC 624 Val Phe Ser Phe His Ala Thr Lys Ala Val Thr Ser Phe Glu Gly Gly
195 200 205

<Desc/Clms Page number 110><Desc / Clms Page number 110>

GCC ATC GTC ACC GAC GAC GGG CTG CTG GCC GAC CGC ATC CGC GCC ATG 672 Ala Ile Val Thr Asp Asp Gly Leu Leu Ala Asp Arg Ile Arg Ala Met
210 215 220 CAC AAC TTC GGG ATC GCA CCG GAC AAG CTG GTG ACC GAT GTC GGC ACC 720 His Asn Phe Gly Ile Ala Pro Asp Lys Leu Val Thr Asp Val Gly Thr 225 230 235 240 AAC GGC AAG ATG AGC GAG TGC GCC GCG GCG ATG GGC CTC ACC TCG CTC 768 Asn Gly Lys Met Ser Glu Cys Ala Ala Ala Met Gly Leu Thr Ser Leu
245 250 255 GAC GCC TTC GCC GAG ACC AGG GTG CAC AAC CGC CTC AAC CAC GCG CTC 816 Asp Ala Phe Ala Glu Thr Arg Val His Asn Arg Leu Asn His Ala Leu
260 265 270 TAC TCC GAC GAG CTC CGC GAC GTG CGC GGC ATA TCC GTG CAC GCG TTC 864 Tyr Ser Asp Glu Leu Arg Asp Val Arg Gly Ile Ser Val His Ala Phe
275 280 285 GAT CCT GGC GAG CAG AAC AAC TAC CAG TAC GTG ATC ATC TCG GTG GAC 912 Asp Pro Gly Glu Gln Asn Asn Tyr Gln Tyr Val Ile Ile Ser Val Asp
290 295 300 TCC GCG GCC ACC GGC ATC GAC CGC GAC CAG TTG CAG GCG ATC CTG CGA 960 Ser Ala Ala Thr Gly Ile Asp Arg Asp Gln Leu Gln Ala Ile Leu Arg 305 310 315 320 GCG GAG AAG GTT GTG GCA CAA CCC TAC TTC TCC CCC GGG TGC CAC CAG 1008 Ala Glu Lys Val Val Ala Gln Pro Tyr Phe Ser Pro Gly Cys His Gln
325 330 335 ATG CAG CCG TAC CGG ACC GAG CCG CCG CTG CGG CTG GAG AAC ACC GAA 1056 Met Gln Pro Tyr Arg Thr Glu Pro Pro Leu Arg Leu Glu Asn Thr Glu
340 345 350 CAG CTC TCC GAC CGG GTG CTC GCG CTG CCC ACC GGC CCC GCG GTG TCC 1104 Gln Leu Ser Asp Arg Val Leu Ala Leu Pro Thr Gly Pro Ala Val Ser
355 360 365 AGC GAG GAC ATC CGG CGG GTG TGC GAC ATC ATC CGG CTC GCC GCC ACC 1152 Ser Glu Asp Ile Arg Arg Val Cys Asp Ile Ile Arg Leu Ala Ala Thr
370 375 380
GCC ATC GTC ACC GAC GAC GGG CTG CTG GCC GAC CGC ATC CGC GCC ATG 672 Ala Ile Val Thr Asp Asp Gly Leu Leu Ala Asp Arg Ile Arg Ala Met
210 215 220 CAC AAC TTC GGG ATC GCA CCG GAC AAG CTG GTG ACC GAT GTC GGC ACC 720 His Asn Phe Gly Ile Ala Pro Asp Lys Leu Val Thr Asp Val Gly Thr 225 230 235 240 AAC GGC AAG ATG AGC GAG TGC GCC GCG GCG ATG GGC CTC ACC TCG CTC 768 Asn Gly Lys Met Ser Glu Cys Ala Ala Ala Met Gly Leu Thr Ser Leu
245 250 255 GAC GCC TTC GCC GAG ACC AGG GTG CAC AAC CGC CTC AAC CAC GCG CTC 816 Asp Ala Phe Ala Glu Thr Arg Val His Asn Arg Leu Asn His Ala Leu
260 265 270 TAC TCC GAC GAG CTC CGC GAC GTG CGC GGC ATA TCC GTG CAC GCG TTC 864 Tyr Ser Asp Glu Leu Arg Asp Val Arg Gly Ile Ser Val His Ala Phe
275 280 285 GAT CCT GGC GAG CAG AAC AAC TAC CAG TAC GTG ATC ATC TCG GTG GAC 912 Asp Pro Gly Glu Gln Asn Asn Tyr Gln Tyr Val Ile Ile Ser Val Asp
290 295 300 TCC GCG GCC ACC GGC ATC GAC CGC GAC CAG TTG CAG GCG ATC CTG CGA 960 Ser Ala Ala Thr Gly Ile Asp Arg Asp Gln Leu Gln Ala Ile Leu Arg 305 310 315 320 GCG GAG AAG GTT GTG GCA CAA CCC TAC TTC TCC CCC GGG TGC CAC CAG 1008 Ala Glu Lys Val Val Ala Gln Pro Tyr Phe Ser Pro Gly Cys His Gln
325 330 335 ATG CAG CCG TAC CGG ACC GAG CCG CCG CTG CGG CTG GAG AAC ACC GAA 1056 Met Gln Pro Tyr Arg Thr Glu Pro Pro Leu Arg Leu Glu Asn Thr Glu
340 345 350 CAG CTC TCC GAC CGG GTG CTC GCG CTG CCC ACC GGC CCC GCG GTG TCC 1104 Gln Leu Ser Asp Arg Val Leu Ala Leu Pro Thr Gly Pro Ala Val Ser
355 360 365 AGC GAG GAC ATC CGG CGG GTG TGC GAC ATC ATC CGG CTC GCC GCC ACC 1152 Ser Glu Asp Ile Arg Arg Val Cys Asp Ile Ile Arg Leu Ala Ala Thr
370 375 380

<Desc/Clms Page number 111><Desc / Clms Page number 111>

AGC GGC GAG CTG ATC AAC GCG CAA TGG GAC CAG AGG ACG CGC AAC GGT 1200 Ser Gly Glu Leu Ile Asn Ala Gln Trp Asp Gln Arg Thr Arg Asn Gly 385 390 395 400 TCG TGA 1206 Ser (2) INFORMATIONS POUR LA SEQ ID NO: 14 : (i) CARACTERISTIQUES DE LA SEQUENCE: (A) LONGUEUR : 401 acides aminés (B) TYPE : acide aminé (D) CONFIGURATION : linéaire(ii) TYPE DE MOLECULE : (xi) DESCRIPTION DE LA SEQUENCE : SEQ ID NO: 14 : Met Lys Arg Ala Leu Thr Asp Leu Ala Ile Phe Gly Gly Pro Glu Ala 1 5 10 15 Phe Leu His Thr Leu Tyr Val Gly Arg Pro Thr Val Gly Asp Arg Glu
20 25 30 Arg Phe Phe Ala Arg Leu Glu Trp Ala Leu Asn Asn Asn Trp Leu Thr
35 40 45 Asn Gly Gly Pro Leu Val Arg Glu Phe Glu Gly Arg Val Ala Asp Leu
50 55 60 Ala Gly Val Arg His Cys Val Ala Thr Cys Asn Ala Thr Val Ala Leu
65 70 75 80 Gln Leu Val Leu Arg Ala Ser Asp Val Ser Gly Glu Val Val Met Pro
85 90 95 Ser Met Thr Phe Ala Ala Thr Ala His Ala Ala Ser Trp Leu Gly Leu
100 105 110 Glu Pro Val Phe Cys Asp Val Asp Pro Glu Thr Gly Leu Leu Asp Pro
115 120 125 Glu His Val Ala Ser Leu Val Thr Pro Arg Thr Gly Ala Ile Ile Gly
130 135 140
AGC GGC GAG CTG ATC AAC GCG CAA TGG GAC CAG AGG ACG CGC AAC GGT 1200 Ser Gly Glu Leu Ile Asn Ala Gln Trp Asp Gln Arg Thr Arg Asn Gly 385 390 395 400 TCG TGA 1206 Ser (2) INFORMATION FOR SEQ ID NO : 14: (i) CHARACTERISTICS OF THE SEQUENCE: (A) LENGTH: 401 amino acids (B) TYPE: amino acid (D) CONFIGURATION: linear (ii) TYPE OF MOLECULE: (xi) DESCRIPTION OF THE SEQUENCE: SEQ ID NO : 14: Met Lys Arg Ala Leu Thr Asp Leu Ala Ile Phe Gly Gly Pro Glu Ala 1 5 10 15 Phe Leu His Thr Leu Tyr Val Gly Arg Pro Thr Val Gly Asp Arg Glu
20 25 30 Arg Phe Phe Ala Arg Leu Glu Trp Ala Leu Asn Asn Asn Trp Leu Thr
35 40 45 Asn Gly Gly Pro Leu Val Arg Glu Phe Glu Gly Arg Val Ala Asp Leu
50 55 60 Ala Gly Val Arg His Cys Val Ala Thr Cys Asn Ala Thr Val Ala Leu
65 70 75 80 Gln Leu Val Leu Arg Ala Ser Asp Val Ser Gly Glu Val Val Met Pro
85 90 95 Ser Met Thr Phe Ala Ala Thr Ala His Ala Ala Ser Trp Leu Gly Leu
100 105 110 Glu Pro Val Phe Cys Asp Val Asp Pro Glu Thr Gly Leu Leu Asp Pro
115 120 125 Glu His Val Ala Ser Leu Val Thr Pro Arg Thr Gly Ala Ile Ile Gly
130 135 140

<Desc/Clms Page number 112><Desc / Clms Page number 112>

Val His Leu Trp Gly Arg Pro Ala Pro Val Glu Ala Leu Glu Lys Ile 145 150 155 160 Ala Ala Glu His Gln Val Lys Leu Phe Phe Asp Ala Ala His Ala Leu
165 170 175 Gly Cys Thr Ala Gly Gly Arg Pro Val Gly Ala Phe Gly Asn Ala Glu
180 185 190 Val Phe Ser Phe His Ala Thr Lys Ala Val Thr Ser Phe Glu Gly Gly
195 200 205 Ala Ile Val Thr Asp Asp Gly Leu Leu Ala Asp Arg Ile Arg Ala Met
210 215 220 His Asn Phe Gly Ile Ala Pro Asp Lys Leu Val Thr Asp Val Gly Thr 225 230 235 240 Asn Gly Lys Met Ser Glu Cys Ala Ala Ala Met Gly Leu Thr Ser Leu
245 250 255 Asp Ala Phe Ala Glu Thr Arg Val His Asn Arg Leu Asn His Ala Leu
260 265 270 Tyr Ser Asp Glu Leu Arg Asp Val Arg Gly Ile Ser Val His Ala Phe
275 280 285 Asp Pro Gly Glu Gln Asn Asn Tyr Gln Tyr Val Ile Ile Ser Val Asp
290 295 300 Ser Ala Ala Thr Gly Ile Asp Arg Asp Gln Leu Gln Ala Ile Leu Arg 305 310 315 320 Ala Glu Lys Val Val Ala Gln Pro Tyr Phe Ser Pro Gly Cys His Gln
325 330 335 Met Gln Pro Tyr Arg Thr Glu Pro Pro Leu Arg Leu Glu Asn Thr Glu
340 345 350 Gln Leu Ser Asp Arg Val Leu Ala Leu Pro Thr Gly Pro Ala Val Ser
355 360 365 Ser Glu Asp Ile Arg Arg Val Cys Asp Ile Ile Arg Leu Ala Ala Thr
370 375 380
Val His Leu Trp Gly Arg Pro Ala Pro Val Glu Ala Leu Glu Lys Ile 145 150 155 160 Ala Ala Glu His Gln Val Lys Leu Phe Phe Asp Ala Ala His Ala Leu
165 170 175 Gly Cys Thr Ala Gly Gly Arg Pro Val Gly Ala Phe Gly Asn Ala Glu
180 185 190 Val Phe Ser Phe His Ala Thr Lys Ala Val Thr Ser Phe Glu Gly Gly
195 200 205 Ala Ile Val Thr Asp Asp Gly Leu Leu Ala Asp Arg Ile Arg Ala Met
210 215 220 His Asn Phe Gly Ile Ala Pro Asp Lys Leu Val Thr Asp Val Gly Thr 225 230 235 240 Asn Gly Lys Met Ser Glu Cys Ala Ala Ala Met Gly Leu Thr Ser Leu
245 250 255 Asp Ala Phe Ala Glu Thr Arg Val His Asn Arg Leu Asn His Ala Leu
260 265 270 Tyr Ser Asp Glu Leu Arg Asp Val Arg Gly Ile Ser Val His Ala Phe
275 280 285 Asp Pro Gly Glu Gln Asn Asn Tyr Gln Tyr Val Ile Ile Ser Val Asp
290 295 300 Ser Ala Ala Thr Gly Ile Asp Arg Asp Gln Leu Gln Ala Ile Leu Arg 305 310 315 320 Ala Glu Lys Val Val Ala Gln Pro Tyr Phe Ser Pro Gly Cys His Gln
325 330 335 Met Gln Pro Tyr Arg Thr Glu Pro Pro Leu Arg Leu Glu Asn Thr Glu
340 345 350 Gln Leu Ser Asp Arg Val Leu Ala Leu Pro Thr Gly Pro Ala Val Ser
355 360 365 Ser Glu Asp Ile Arg Arg Val Cys Asp Ile Ile Arg Leu Ala Ala Thr
370 375 380

<Desc/Clms Page number 113><Desc / Clms Page number 113>

Ser Gly Glu Leu Ile Asn Ala Gln Trp Asp Gln Arg Thr Arg Asn Gly 385 390 395 400 Ser (2) INFORMATIONS POUR LA SEQ ID NO: 15 : (i) CARACTERISTIQUES DE LA SEQUENCE : (A) LONGUEUR : 6093 paires de bases (B) TYPE : (C) NOMBRE DE BRINS : (D) CONFIGURATION : linéaire(ii) TYPE DE MOLECULE : ADN(génomique) (vi) ORIGINE: (A) ORGANISME : Streptomyces antibioticus (ix) CARACTERISTIQUE: (A) NOM/CLE: CDS (B) EMPLACEMENT:184..1386 (D) AUTRES INFORMATIONS:/gene= "olePl" (ix) CARACTERISTIQUE: (A) NOM/CLE: CDS (B) EMPLACEMENT:1437..2714 (D) AUTRES INFORMATIONS:/function= "glycosylation de
8,8a-desoxyoleandolide" /gene= "oleGl" /transl~except= (pos: 1437.. 1439, aa : (ix) CARACTERISTIQUE: (A) NOM/CLE : CDS (B) EMPLACEMENT:2722..3999 (D) AUTRES INFORMATIONS:/function= "glycosylation de
8,8a-desoxyoleandolide" /gene= "oleG2" (ix) CARACTERISTIQUE: (A) NOM/CLE: CDS (B) EMPLACEMENT:4810..5967 (D) AUTRES INFORMATIONS:/gene= "oleY" (ix) CARACTERISTIQUE: (A) NOM/CLE: mat~peptide
Ser Gly Glu Leu Ile Asn Ala Gln Trp Asp Gln Arg Thr Arg Asn Gly 385 390 395 400 Ser (2) INFORMATION FOR SEQ ID NO: 15: (i) CHARACTERISTICS OF THE SEQUENCE: (A) LENGTH: 6093 base pairs (B) TYPE: (C) NUMBER OF STRANDS: (D) CONFIGURATION: linear (ii) TYPE OF MOLECULE: DNA (genomics) (vi) ORIGIN: (A) ORGANISM: Streptomyces antibioticus (ix) CHARACTERISTICS: (A) NAME / KEY: CDS (B) LOCATION: 184..1386 (D) OTHER INFORMATION: / gene = "olePl" (ix) CHARACTERISTIC: (A) NAME / KEY: CDS (B) LOCATION: 1437..2714 (D) OTHER INFORMATION: / function = "glycosylation of
8,8a-desoxyoleandolide "/ gene =" oleGl "/ transl ~ except = (pos: 1437 .. 1439, aa: (ix) CHARACTERISTIC: (A) NAME / KEY: CDS (B) LOCATION: 2722..3999 ( D) OTHER INFORMATION: / function = "glycosylation of
8,8a-desoxyoleandolide "/ gene =" oleG2 "(ix) CHARACTERISTICS: (A) NAME / KEY: CDS (B) LOCATION: 4810..5967 (D) OTHER INFORMATION: / gene =" oleY "(ix) CHARACTERISTICS : (A) NAME / KEY: mat ~ peptide

<Desc/Clms Page number 114><Desc / Clms Page number 114>

(B) EMPLACEMENT:184 (xi) DESCRIPTION DE LA SEQUENCE : ID NO: 15 : GCATGCCCCG CTTTCCTCCC CCTCTCCGAA CGCATCGACG ACCCGATCCC CCTCAGGGAC 60 CGGTGAAGGA GCGTGTTGCA CTCATGCAGG ACATGCAAGG CGTACAGCCC GAACCAGCCA 120 GTGTCGAACA CGCGGCGGAC GCAGCTCGAA CAGAGCGAAC GGCGCACGGA AGCCGCCCAG 180 GAG ATG GAG GAC AGC GAA CTG GGG CGC CGC CTG CAG ATG CTC CGC GGC 228
Met Glu Asp Ser Glu Leu Gly Arg Arg Leu Gln Met Leu Arg Gly
1 5 10 15 ATG CAG TGG GTC TTC GGC GCC AAC GGC GAT CCG TAC GCC CGG CTG CTG 276 Met Gln Trp Val Phe Gly Ala Asn Gly Asp Pro Tyr Ala Arg Leu Leu
20 25 30 TGT GGC ATG GAG GAT GAC CCG TCA CCT TTC TAC GAC GCG ATA CGG ACC 324 Cys Gly Met Glu Asp Asp Pro Ser Pro Phe Tyr Asp Ala Ile Arg Thr
35 40 45 CTG GGC GAG CTG CAC CGG AGC AGG ACC GGA GCC TGG GTC ACC GCC GAC 372 Leu Gly Glu Leu His Arg Ser Arg Thr Gly Ala Trp Val Thr Ala Asp
50 55 60 CCC GGG CTC GGG GGC CGC ATC CTC GCC GAC CGG AAG GCT CGG TGC CCG 420 Pro Gly Leu Gly Gly Arg Ile Leu Ala Asp Arg Lys Ala Arg Cys Pro
65 70 75 GAA GGC TCG TGG CCG GTG CGG GCG AAG ACC GAC GGG CTG GAG CAG TAC 468 Glu Gly Ser Trp Pro Val Arg Ala Lys Thr Asp Gly Leu Glu Gln Tyr
80 85 90 95 GTG CTG CCC GGG CAC CAG GCG TTC CTG CGG CTG GAG CGC GAG GAG GCC 516 Val Leu Pro Gly His Gln Ala Phe Leu Arg Leu Glu Arg Glu Glu Ala
100 105 110 GAG CGA CTG CGG GAG GTC GCG GCG CCG GTG CTG GGG GCC GCG GCG GTC 564 Glu Arg Leu Arg Glu Val Ala Ala Pro Val Leu Gly Ala Ala Ala Val
115 120 125 GAC GCG TGG CGC CCG CTG ATC GAC GAG GTC TGC GCG GGG CTC GCG AAG 612 Asp Ala Trp Arg Pro Leu Ile Asp Glu Val Cys Ala Gly Leu Ala Lys
130 135 140
(B) LOCATION: 184 (xi) SEQUENCE DESCRIPTION: ID NO: 15: GCATGCCCCG CTTTCCTCCC CCTCTCCGAA CGCATCGACG ACCCGATCCC CCTCAGGGAC 60 CGGTGAAGGA GCGTGTTGCA CTCATGCAGG ACATGCAAGG CGTACAGCCC GAACCAGCCA 120 GTGTCGAACA CGCGGCGGAC GCAGCTCGAA CAGAGCGAAC GGCGCACGGA AGCCGCCCAG 180 GAG ATG GAG GAC AGC GAA CTG GGG CGC CGC CTG CAG ATG CTC CGC GGC 228
Met Glu Asp Ser Glu Leu Gly Arg Arg Leu Gln Met Leu Arg Gly
1 5 10 15 ATG CAG TGG GTC TTC GGC GCC AAC GGC GAT CCG TAC GCC CGG CTG CTG 276 Met Gln Trp Val Phe Gly Ala Asn Gly Asp Pro Tyr Ala Arg Leu Leu
20 25 30 TGT GGC ATG GAG GAT GAC CCG TCA CCT TTC TAC GAC GCG ATA CGG ACC 324 Cys Gly Met Glu Asp Asp Pro Ser Pro Phe Tyr Asp Ala Ile Arg Thr
35 40 45 CTG GGC GAG CTG CAC CGG AGC AGG ACC GGA GCC TGG GTC ACC GCC GAC 372 Leu Gly Glu Leu His Arg Ser Arg Thr Gly Ala Trp Val Thr Ala Asp
50 55 60 CCC GGG CTC GGG GGC CGC ATC CTC GCC GAC CGG AAG GCT CGG TGC CCG 420 Pro Gly Leu Gly Gly Arg Ile Leu Ala Asp Arg Lys Ala Arg Cys Pro
65 70 75 GAA GGC TCG TGG CCG GTG CGG GCG AAG ACC GAC GGG CTG GAG CAG TAC 468 Glu Gly Ser Trp Pro Val Arg Ala Lys Thr Asp Gly Leu Glu Gln Tyr
80 85 90 95 GTG CTG CCC GGG CAC CAG GCG TTC CTG CGG CTG GAG CGC GAG GAG GCC 516 Val Leu Pro Gly His Gln Ala Phe Leu Arg Leu Glu Arg Glu Glu Ala
100 105 110 GAG CGA CTG CGG GAG GTC GCG GCG CCG GTG CTG GGG GCC GCG GCG GTC 564 Glu Arg Leu Arg Glu Val Ala Ala Pro Val Leu Gly Ala Ala Ala Val
115 120 125 GAC GCG TGG CGC CCG CTG ATC GAC GAG GTC TGC GCG GGG CTC GCG AAG 612 Asp Ala Trp Arg Pro Leu Ile Asp Glu Val Cys Ala Gly Leu Ala Lys
130 135 140

<Desc/Clms Page number 115><Desc / Clms Page number 115>

GGG CTG CCG GAC ACG TTC GAC CTG GTC GAG GAG TAC GCG GGG CTG GTG 660 Gly Leu Pro Asp Thr Phe Asp Leu Val Glu Glu Tyr Ala Gly Leu Val
145 150 155 CCG GTC GAG GTG CTG GCG CGG ATC TGG GGC GTC CCG GAG GAG GAC CGC 708 Pro Val Glu Val Leu Ala Arg Ile Trp Gly Val Pro Glu Glu Asp Arg 160 165 170 175 GCC CGG TTC GGG CGT GAC TGC CGG GCG CTC GCT CCC GCG CTG GAC AGC 756 Ala Arg Phe Gly Arg Asp Cys Arg Ala Leu Ala Pro Ala Leu Asp Ser
180 185 190 CTC CTG TGT CCC CAG CAG TTG GCG CTG AGC AAG GAC ATG GCG TCC GCC 804 Leu Leu Cys Pro Gln Gln Leu Ala Leu Ser Lys Asp Met Ala Ser Ala
195 200 205 CTG GAG GAC CTG CGT CTC CTC TTC GAC GGC CTC GAC GCG ACG CCG CGC 852 Leu Glu Asp Leu Arg Leu Leu Phe Asp Gly Leu Asp Ala Thr Pro Arg
210 215 220 CTC GCC GGC CCC GCC GAC GGT GAC GGA ACG GCC GTG GCC ATG CTC ACC 900 Leu Ala Gly Pro Ala Asp Gly Asp Gly Thr Ala Val Ala Met Leu Thr
225 230 235 GTT CTG CTC TGC ACG GAG CCG GTG ACC ACG GCG ATC GGG AAC ACC GTG 948 Val Leu Leu Cys Thr Glu Pro Val Thr Thr Ala Ile Gly Asn Thr Val 240 245 250 255 CTC GGG CTC CTT CCC GGG CAG TGG CCC GTG CCC TGC ACC GGC CGG GTG 996 Leu Gly Leu Leu Pro Gly Gln Trp Pro Val Pro Cys Thr GlyArg Val
260 265 270 GCT GCC GGG CAG GTT GCC GGG CAG GCG CTG CAC CGG GCG GTG TCG TAC 1044 Ala Ala Gly Gln Val Ala Gly Gln Ala Leu His Arg Ala Val Ser Tyr
275 280 285 CGT ATC GCG ACG CGG TTC GCC CGG GAG GAC CTG GAG TTG GCG GGC TGC 1092 Arg Ile Ala Thr Arg Phe Ala Arg Glu Asp Leu Glu Leu Ala Gly Cys
290 295 300 GAG GTC AAG TCC GGT GAC GAG GTG GTG GTC CTG GCC GGA GCG ATC GGC 1140 Glu Val Lys Ser Gly Asp Glu Val Val Val Leu Ala Gly Ala Ile Gly
305 310 315
GGG CTG CCG GAC ACG TTC GAC CTG GTC GAG GAG TAG GCG GGG CTG GTG 660 Gly Leu Pro Asp Thr Phe Asp Leu Val Glu Glu Tyr Ala Gly Leu Val
145 150 155 CCG GTC GAG GTG CTG GCG CGG ATC TGG GGC GTC CCG GAG GAG GAC CGC 708 Pro Val Glu Val Leu Ala Arg Ile Trp Gly Val Pro Glu Glu Asp Arg 160 165 170 175 GCC CGG TTC GGG CGT GAC TGC CGG GCG CTC GCT CCC GCG CTG GAC AGC 756 Ala Arg Phe Gly Arg Asp Cys Arg Ala Leu Ala Pro Ala Leu Asp Ser
180 185 190 CTC CTG TGT CCC CAG CAG TTG GCG CTG AGC AAG GAC ATG GCG TCC GCC 804 Leu Leu Cys Pro Gln Gln Leu Ala Leu Ser Lys Asp Met Ala Ser Ala
195 200 205 CTG GAG GAC CTG CGT CTC CTC TTC GAC GGC CTC GAC GCG ACG CCG CGC 852 Leu Glu Asp Leu Arg Leu Leu Phe Asp Gly Leu Asp Ala Thr Pro Arg
210 215 220 CTC GCC GGC CCC GCC GAC GGT GAC GGA ACG GCC GTG GCC ATG CTC ACC 900 Leu Ala Gly Pro Ala Asp Gly Asp Gly Thr Ala Val Ala Met Leu Thr
225 230 235 GTT CTG CTC TGC ACG GAG CCG GTG ACC ACG GCG ATC GGG AAC ACC GTG 948 Val Leu Leu Cys Thr Glu Pro Val Thr Thr Ala Ile Gly Asn Thr Val 240 245 250 255 CTC GGG CTC CTT CCC GGG CAG TGG CCC GTG CCC TGC ACC GGC CGG GTG 996 Leu Gly Leu Leu Pro Gly Gln Trp Pro Val Pro Cys Thr GlyArg Val
260 265 270 GCT GCC GGG CAG GTT GCC GGG CAG GCG CTG CAC CGG GCG GTG TCG TAC 1044 Ala Ala Gly Gln Val Ala Gly Gln Ala Leu His Arg Ala Val Ser Tyr
275 280 285 CGT ATC GCG ACG CGG TTC GCC CGG GAG GAC CTG GAG TTG GCG GGC TGC 1092 Arg Ile Ala Thr Arg Phe Ala Arg Glu Asp Leu Glu Leu Ala Gly Cys
290 295 300 GAG GTC AAG TCC GGT GAC GAG GTG GTG GTC CTG GCC GGA GCG ATC GGC 1140 Glu Val Lys Ser Gly Asp Glu Val Val Val Leu Ala Gly Ala Ile Gly
305 310 315

<Desc/Clms Page number 116><Desc / Clms Page number 116>

CGG AAC GGA CCG TCC GCA GCC GCC CCG CCT GCC CCA CCG GGC CCA GCG 1188 Arg Asn Gly Pro Ser Ala Ala Ala Pro Pro Ala Pro Pro Gly Pro Ala 320 325 330 335 GCC CCG CCC GCC CCG TCG GTC TTC GGT GCC GCC GCC TTC GAG AAC GCG 1236 Ala Pro Pro Ala Pro Ser Val Phe Gly Ala Ala Ala Phe Glu Asn Ala
340 345 350 CTG GCC GAA CCC CTC GTC CGG GCT GTG ACG GGA GCG GCC CTC CAG GCC 1284 Leu Ala Glu Pro Leu Val Arg Ala Val Thr Gly Ala Ala Leu Gln Ala
355 360 365 CTC GCG GAG GGG CCC CCC CGG CTG ACG GCG GCG GGA CCC GTC GTA CGA 1332 Leu Ala Glu Gly Pro Pro Arg Leu Thr Ala Ala Gly Pro Val Val Arg
370 375 380 CGG CGG CGT TCC CCT GTC GTC GGC GGG CTG CAC CGG GCT CCG GTG GCC 1380 Arg Arg Arg Ser Pro Val Val Gly Gly Leu His Arg Ala Pro Val Ala
385 390 395 GCC GCA TGAGCATCGC GTCGAACGGC GCGCGCTCGG CCCCCCGCCG GCCCCTGCGC 1436 Ala Ala 400 GTG ATG ATG ACC ACC TTC GCG GCC AAC ACG CAC TTC CAG CCG CTG GTT 1484 Met Met Met Thr Thr Phe Ala Ala Asn Thr His Phe Gln Pro Leu Val
1 5 10 15 CCC CTG GCC TGG GCA CTG CGG ACA GCC GGG CAC GAG GTG CGC GTG GTG 1532 Pro Leu Ala Trp Ala Leu Arg Thr Ala Gly His Glu Val Arg Val Val
20 25 30 AGC CAG CCC TCG CTG AGC GAC GTG GTG ACG CAG GCG GGG CTC ACC TCG 1580 Ser Gln Pro Ser Leu Ser Asp Val Val Thr Gln Ala Gly Leu Thr Ser
35 40 45 GTC CCG GTG GGC ACC GAG GCT CCG GTC GAG CAG TTC GCG GCG ACC TGG 1628 Val Pro Val Gly Thr Glu Ala Pro Val Glu Gln Phe Ala Ala Thr Trp
50 55 60 GGC GAC GAT GCC TAC ATC GGC GTC AAC AGC ATC GAC TTC ACC GGC AAC 1676 Gly Asp Asp Ala Tyr Ile Gly Val Asn Ser Ile Asp Phe Thr Gly Asn
65 70 75 80
CGG AAC GGA CCG TCC GCA GCC GCC CCG CCT GCC CCA CCG GGC CCA GCG 1188 Arg Asn Gly Pro Ser Ala Ala Ala Pro Pro Ala Pro Pro Gly Pro Ala 320 325 330 335 GCC CCG CCC GCC CCG TCG GTC TTC GGT GCC GCC GCC TTC GAG AAC GCG 1236 Ala Pro Pro Ala Pro Ser Val Phe Gly Ala Ala Ala Phe Glu Asn Ala
340 345 350 CTG GCC GAA CCC CTC GTC CGG GCT GTG ACG GGA GCG GCC CTC CAG GCC 1284 Leu Ala Glu Pro Leu Val Arg Ala Val Thr Gly Ala Ala Leu Gln Ala
355 360 365 CTC GCG GAG GGG CCC CCC CGG CTG ACG GCG GCG GGA CCC GTC GTA CGA 1332 Leu Ala Glu Gly Pro Pro Arg Leu Thr Ala Ala Gly Pro Val Val Arg
370 375 380 CGG CGG CGT TCC CCT GTC GTC GGC GGG CTG CAC CGG GCT CCG GTG GCC 1380 Arg Arg Arg Ser Pro Val Val Gly Gly Leu His Arg Ala Pro Val Ala
385 390 395 GCC GCA TGAGCATCGC GTCGAACGGC GCGCGCTCGG CCCCCCGCCG GCCCCTGCGC 1436 Ala Ala 400 GTG ATG ATG ACC ACC TTC GCG GCC AAC ACG CAC TTC CAG CCG CTG GTT 1484 Met Met Met Thr Thr Phe Ala Ala Asn Thr His Phe Gln Pro Leu Val
1 5 10 15 CCC CTG GCC TGG GCA CTG CGG ACA GCC GGG CAC GAG GTG CGC GTG GTG 1532 Pro Leu Ala Trp Ala Leu Arg Thr Ala Gly His Glu Val Arg Val Val
20 25 30 AGC CAG CCC TCG CTG AGC GAC GTG GTG ACG CAG GCG GGG CTC ACC TCG 1580 Ser Gln Pro Ser Leu Ser Asp Val Val Thr Gln Ala Gly Leu Thr Ser
35 40 45 GTC CCG GTG GGC ACC GAG GCT CCG GTC GAG CAG TTC GCG GCG ACC TGG 1628 Val Pro Val Gly Thr Glu Ala Pro Val Glu Gln Phe Ala Ala Thr Trp
50 55 60 GGC GAC GAT GCC TAC ATC GGC GTC AAC AGC ATC GAC TTC ACC GGC AAC 1676 Gly Asp Asp Ala Tyr Ile Gly Val Asn Ser Ile Asp Phe Thr Gly Asn
65 70 75 80

<Desc/Clms Page number 117><Desc / Clms Page number 117>

GAC CCC GGC CTG TGG ACG TGG CCG TAC CTC CTG GGC ATG GAG ACC ATG 1724 Asp Pro Gly Leu Trp Thr Trp Pro Tyr Leu Leu Gly Met Glu Thr Met
85 90 95 CTG GTG CCG GCC TTC TAC GAG TTG CTG AAC AAC GAG TCC TTC GTG GAC 1772 Leu Val Pro Ala Phe Tyr Glu Leu Leu Asn Asn Glu Ser Phe Val Asp
100 105 110 GGC GTA GTC GAG TTC GCC CGT GAC TGG CGG CCC GAC CTG GTG ATC TGG 1820 Gly Val Val Glu Phe Ala Arg Asp Trp Arg Pro Asp Leu Val Ile Trp
115 120 125 GAG CCG CTG ACG TTC GCC GGC GCG GTG GCG GCG CGC GTC ACC GGC GCG 1868 Glu Pro Leu Thr Phe Ala Gly Ala Val Ala Ala Arg Val Thr Gly Ala
130 135 140 GCC CAC GCC CGG CTG CCG TGG GGG CAG GAG ATC ACC CTG CGC GGG CGG 1916 Ala His Ala Arg Leu Pro Trp Gly Gln Glu Ile Thr Leu Arg Gly Arg 145 150 155 160 CAG GCG TTC CTC GCC GAG CGT GCC CTG CAA CCG TTC GAG CAC CGG GAG 1964 Gln Ala Phe Leu Ala Glu Arg Ala Leu Gln Pro Phe Glu His Arg Glu
165 170 175 GAT CCC ACG GCC GAG TGG CTG GGC CGC ATG CTC GAC CGG TAC GGC TGC 2012 Asp Pro Thr Ala Glu Trp Leu Gly Arg Met Leu Asp Arg Tyr Gly Cys
180 185 190 TCG TTC GAC GAG GAG ATG GTC ACC GGG CAG TGG ACC ATC GAC ACG CTG 2060 Ser Phe Asp Glu Glu Met Val Thr Gly Gln Trp Thr Ile Asp Thr Leu
195 200 205 CCG CGC AGC ATG CGG CTG GAG CTG TCC GAG GAG CTG CGC ACC CTG GAC 2108 Pro Arg Ser Met Arg Leu Glu Leu Ser Glu Glu Leu Arg Thr Leu Asp
210 215 220 ATG CGG TAC GTG CCG TAC AAC GGA CCG GCG GTC GTA CCC CCC TGG GTG 2156 Met Arg Tyr Val Pro Tyr Asn Gly Pro Ala Val Val Pro Pro Trp Val 225 230 235 240 TGG GAA CCG TGC GAG CGG CCC CGG GTC TGT CTG ACG ATC GGC ACC TCC 2204 Trp Glu Pro Cys Glu Arg Pro Arg Val Cys Leu Thr Ile Gly Thr Ser
245 250 255
GAC CCC GGC CTG TGG ACG TGG CCG TAC CTC CTG GGC ATG GAG ACC ATG 1724 Asp Pro Gly Leu Trp Thr Trp Pro Tyr Leu Leu Gly Met Glu Thr Met
85 90 95 CTG GTG CCG GCC TTC TAC GAG TTG CTG AAC AAC GAG TCC TTC GTG GAC 1772 Leu Val Pro Ala Phe Tyr Glu Leu Leu Asn Asn Glu Ser Phe Val Asp
100 105 110 GGC GTA GTC GAG TTC GCC CGT GAC TGG CGG CCC GAC CTG GTG ATC TGG 1820 Gly Val Val Glu Phe Ala Arg Asp Trp Arg Pro Asp Leu Val Ile Trp
115 120 125 GAG CCG CTG ACG TTC GCC GGC GCG GTG GCG GCG CGC GTC ACC GGC GCG 1868 Glu Pro Leu Thr Phe Ala Gly Ala Val Ala Ala Arg Val Thr Gly Ala
130 135 140 GCC CAC GCC CGG CTG CCG TGG GGG CAG GAG ATC ACC CTG CGC GGG CGG 1916 Ala His Ala Arg Leu Pro Trp Gly Gln Glu Ile Thr Leu Arg Gly Arg 145 150 155 160 CAG GCG TTC CTC GCC GAG CGT GCC CTG CAA CCG TTC GAG CAC CGG GAG 1964 Gln Ala Phe Leu Ala Glu Arg Ala Leu Gln Pro Phe Glu His Arg Glu
165 170 175 GAT CCC ACG GCC GAG TGG CTG GGC CGC ATG CTC GAC CGG TAC GGC TGC 2012 Asp Pro Thr Ala Glu Trp Leu Gly Arg Met Leu Asp Arg Tyr Gly Cys
180 185 190 TCG TTC GAC GAG GAG ATG GTC ACC GGG CAG TGG ACC ATC GAC ACG CTG 2060 Ser Phe Asp Glu Glu Met Val Thr Gly Gln Trp Thr Ile Asp Thr Leu
195 200 205 CCG CGC AGC ATG CGG CTG GAG CTG TCC GAG GAG CTG CGC ACC CTG GAC 2108 Pro Arg Ser Met Arg Leu Glu Leu Ser Glu Glu Leu Arg Thr Leu Asp
210 215 220 ATG CGG TAC GTG CCG TAC AAC GGA CCG GCG GTC GTA CCC CCC TGG GTG 2156 Met Arg Tyr Val Pro Tyr Asn Gly Pro Ala Val Val Pro Pro Trp Val 225 230 235 240 TGG GAA CCG TGC GAG CGG CCC CGG GTC TGT CTG ACG ATC GGC ACC TCC 2204 Trp Glu Pro Cys Glu Arg Pro Arg Val Cys Leu Thr Ile Gly Thr Ser
245 250 255

<Desc/Clms Page number 118><Desc / Clms Page number 118>

CAG CGT GAC TCC GGC CGG GAC CAT GTC CCC CTC GAC CAC CTG CTC GAC 2252 Gln Arg Asp Ser Gly Arg Asp His Val Pro Leu Asp His Leu Leu Asp
260 265 270 TCC CTC GCC GAC GTG GAC GCG GAG ATC GTG GCC ACG CTC GAC ACC ACC 2300 Ser Leu Ala Asp Val Asp Ala Glu Ile Val Ala Thr Leu Asp Thr Thr
275 280 285 CAG CAG GAG CGC CTG CGG GGC GCG GCC CCC GGC AAC GTC CGG CTG GTG 2348 Gln Gln Glu Arg Leu Arg Gly Ala Ala Pro Gly Asn Val Arg Leu Val
290 295 300 GAC TTC GTC CCG CTG CAC GCG CTG ATG CCG ACC TGC TCG GCG ATC GTG 2396 Asp Phe Val Pro Leu His Ala Leu Met Pro Thr Cys Ser Ala Ile Val 305 310 315 320 CAC CAC GGT GGT CCG GGC ACG TGG TCG ACG GCG GCG CTC CAC GGC GTC 2444 His His Gly Gly Pro Gly Thr Trp Ser Thr Ala Ala Leu His Gly Val
325 330 335 CCG CAG ATC ATC CTG GAC ACC TCG TGG GAC ACA CCG GTG CGG GCG CAG 2492 Pro Gln Ile Ile Leu Asp Thr Ser Trp Asp Thr Pro Val Arg Ala Gln
340 345 350 CGC ATG CAG CAA CTC GGG GCG GGC CTG TCG ATG CCG GTG GGG GAA CTG 2540 Arg Met Gln Gln Leu Gly Ala Gly Leu Ser Met Pro Val Gly Glu Leu
355 360 365 GGC GTC GAG GCG CTG CGG GAC CGG GTC CTG CGG CTG CTG GGG GAG CCG 2588 Gly Val Glu Ala Leu Arg Asp Arg Val Leu Arg Leu Leu Gly Glu Pro
370 375 380 GAG TTC CGC GCG GGC GCC GAG CGG ATC CGG GCC GAG ATG CTC GCG ATG 2636 Glu Phe Arg Ala Gly Ala Glu Arg Ile Arg Ala Glu Met Leu Ala Met 385 390 395 400 CCC GCC CCC GGT GAC GTC GTA CCG GAC CTG GAA CGA CTC ACC GCG GAG 2684 Pro Ala Pro Gly Asp Val Val Pro Asp Leu Glu Arg Leu Thr Ala Glu
405 410 415 CAT GCC ACC GGC GCG ATG GCG GGA AGG CGG TGAGACG ATG CGC GTA CTG 2733 His Ala Thr Gly Ala Met Ala Gly Arg Arg Met Arg Val Leu
420 425 1
CAG CGT GAC TCC GGC CGG GAC CAT GTC CCC CTC GAC CAC CTG CTC GAC 2252 Gln Arg Asp Ser Gly Arg Asp His Val Pro Leu Asp His Leu Leu Asp
260 265 270 TCC CTC GCC GAC GTG GAC GCG GAG ATC GTG GCC ACG CTC GAC ACC ACC 2300 Ser Leu Ala Asp Val Asp Ala Glu Ile Val Ala Thr Leu Asp Thr Thr
275 280 285 CAG CAG GAG CGC CTG CGG GGC GCG GCC CCC GGC AAC GTC CGG CTG GTG 2348 Gln Gln Glu Arg Leu Arg Gly Ala Ala Pro Gly Asn Val Arg Leu Val
290 295 300 GAC TTC GTC CCG CTG CAC GCG CTG ATG CCG ACC TGC TCG GCG ATC GTG 2396 Asp Phe Val Pro Leu His Ala Leu Met Pro Thr Cys Ser Ala Ile Val 305 310 315 320 CAC CAC GGT GGT CCG GGC ACG TGG TCG ACG GCG GCG CTC CAC GGC GTC 2444 His His Gly Gly Pro Gly Thr Trp Ser Thr Ala Ala Leu His Gly Val
325 330 335 CCG CAG ATC ATC CTG GAC ACC TCG TGG GAC ACA CCG GTG CGG GCG CAG 2492 Pro Gln Ile Ile Asp Asp Ser Trp Asp Thr Pro Val Arg Ala Gln
340 345 350 CGC ATG CAG CAA CTC GGG GCG GGC CTG TCG ATG CCG GTG GGG GAA CTG 2540 Arg Met Gln Gln Leu Gly Ala Gly Leu Ser Met Pro Val Gly Glu Leu
355 360 365 GGC GTC GAG GCG CTG CGG GAC CGG GTC CTG CGG CTG CTG GGG GAG CCG 2588 Gly Val Glu Ala Leu Arg Asp Arg Val Leu Arg Leu Leu Gly Glu Pro
370 375 380 GAG TTC CGC GCG GGC GCC GAG CGG ATC CGG GCC GAG ATG CTC GCG ATG 2636 Glu Phe Arg Ala Gly Ala Glu Arg Ile Arg Ala Glu Met Leu Ala Met 385 390 395 400 CCC GCC CCC GGT GAC GTC GTA CCG GAC CTG GAA CGA CTC ACC GCG GAG 2684 Pro Ala Pro Gly Asp Val Val Pro Asp Leu Glu Arg Leu Thr Ala Glu
405 410 415 CAT GCC ACC GGC GCG ATG GCG GGA AGG CGG TGAGACG ATG CGC GTA CTG 2733 His Ala Thr Gly Ala Met Ala Gly Arg Arg Met Arg Val Leu
420 425 1

<Desc/Clms Page number 119><Desc / Clms Page number 119>

CTG ACC TGC TTC GCC AAC GAC ACC CAC TTC CAC GGG CTG GTG CCG CTG 2781 Leu Thr Cys Phe Ala Asn Asp Thr His Phe His Gly Leu Val Pro Leu
5 10 15 20 GCG TGG GCG CTG CGG GCC GCC GGG CAC GAA GTC CGC GTG GCC AGT CAG 2829 Ala Trp Ala Leu Arg Ala Ala Gly His Glu Val Arg Val Ala Ser Gln
25 30 35 CCC GCC CTG TCC GAC ACG ATC ACC CAA GCG GGA CTG ACC GCG GTG CCC 2877 Pro Ala Leu Ser Asp Thr Ile Thr Gln Ala Gly Leu Thr Ala Val Pro
40 45 50 GTG GGC CGG GAC ACC GCC TTC CTG GAG CTG ATG GGG GAG ATC GGC GCG 2925 Val Gly Arg Asp Thr Ala Phe Leu Glu Leu Met Gly Glu Ile Gly Ala
55 60 65 GAC GTC CAG AAG TAC TCC ACC GGC ATC GAC CTG GGC GTC CGC GCG GAG 2973 Asp Val Gln Lys Tyr Ser Thr Gly Ile Asp Leu Gly Val Arg Ala Glu
70 75 80 CTG ACG AGC TGG GAG TAC CTG CTC GGC ATG CAC ACG ACC CTG GTG CCC 3021 Leu Thr Ser Trp Glu Tyr Leu Leu Gly Met His Thr Thr Leu Val Pro
85 90 95 100 ACG TTC TAC TCG CTG GTC AAC GAC GAG CCG TTC GTC GAC GGG CTC GTC 3069 Thr Phe Tyr Ser Leu Val Asn Asp Glu Pro Phe Val Asp Gly Leu Val
105 110 115 GCG CTG ACC CGG GCC TGG CGG CCC GAC CTC ATC CTG TGG GAG CAC TTC 3117 Ala Leu Thr Arg Ala Trp Arg Pro Asp Leu Ile Leu Trp Glu His Phe
120 125 130 AGC TTC GCC GGG GCG TTG GCG GCG CGG GCC ACC GGC ACG CCC CAC GCC 3165 Ser Phe Ala Gly Ala Leu Ala Ala Arg Ala Thr Gly Thr Pro His Ala
135 140 145 CGC GTG CTG TGG GGG TCG GAC CTC ATC GTC CGG TTC CGC CGG GAC TTC 3213 Arg Val Leu Trp Gly Ser Asp Leu Ile Val Arg Phe Arg Arg Asp Phe
150 155 160 CTC GCG GAG CGG GCG AAC CGG CCC GCC GAG CAC CGC GAG GAC CCC ATG 3261 Leu Ala Glu Arg Ala Asn Arg Pro Ala Glu His Arg Glu Asp Pro Met 165 170 175 180
CTG ACC TGC TTC GCC AAC GAC ACC CAC TTC CAC GGG CTG GTG CCG CTG 2781 Leu Thr Cys Phe Ala Asn Asp Thr His Phe His Gly Leu Val Pro Leu
5 10 15 20 GCG TGG GCG CTG CGG GCC GCC GGG CAC GAA GTC CGC GTG GCC AGT CAG 2829 Ala Trp Ala Leu Arg Ala Ala Gly His Glu Val Arg Val Ala Ser Gln
25 30 35 CCC GCC CTG TCC GAC ACG ATC ACC CAA GCG GGA CTG ACC GCG GTG CCC 2877 Pro Ala Leu Ser Asp Thr Ile Thr Gln Ala Gly Leu Thr Ala Val Pro
40 45 50 GTG GGC CGG GAC ACC GCC TTC CTG GAG CTG ATG GGG GAG ATC GGC GCG 2925 Val Gly Arg Asp Thr Ala Phe Leu Glu Leu Met Gly Glu Ile Gly Ala
55 60 65 GAC GTC CAG AAG TAC TCC ACC GGC ATC GAC CTG GGC GTC CGC GCG GAG 2973 Asp Val Gln Lys Tyr Ser Thr Gly Ile Asp Leu Gly Val Arg Ala Glu
70 75 80 CTG ACG AGC TGG GAG TAC CTG CTC GGC ATG CAC ACG ACC CTG GTG CCC 3021 Leu Thr Ser Trp Glu Tyr Leu Leu Gly Met His Thr Thr Leu Val Pro
85 90 95 100 ACG TTC TAC TCG CTG GTC AAC GAC GAG CCG TTC GTC GAC GGG CTC GTC 3069 Thr Phe Tyr Ser Leu Val Asn Asp Glu Pro Phe Val Asp Gly Leu Val
105 110 115 GCG CTG ACC CGG GCC TGG CGG CCC GAC CTC ATC CTG TGG GAG CAC TTC 3117 Ala Leu Thr Arg Ala Trp Arg Pro Asp Leu Ile Leu Trp Glu His Phe
120 125 130 AGC TTC GCC GGG GCG TTG GCG GCG CGG GCC ACC GGC ACG CCC CAC GCC 3165 Ser Phe Ala Gly Ala Leu Ala Ala Arg Ala Thr Gly Thr Pro His Ala
135 140 145 CGC GTG CTG TGG GGG TCG GAC CTC ATC GTC CGG TTC CGC CGG GAC TTC 3213 Arg Val Leu Trp Gly Ser Asp Leu Ile Val Arg Phe Arg Arg Asp Phe
150 155 160 CTC GCG GAG CGG GCG AAC CGG CCC GCC GAG CAC CGC GAG GAC CCC ATG 3261 Leu Ala Glu Arg Ala Asn Arg Pro Ala Glu His Arg Glu Asp Pro Met 165 170 175 180

<Desc/Clms Page number 120><Desc / Clms Page number 120>

GCG GAG TGG CTG GGC TGG GCG GCC GAA CGG CTG GGC TCC ACC TTC GAC 3309 Ala Glu Trp Leu Gly Trp Ala Ala Glu Arg Leu Gly Ser Thr Phe Asp
185 190 195 GAG GAG CTG GTG ACC GGG CAG TGG ACG ATC GAC CCG CTG CCG CGG AGC 3357 Glu Glu Leu Val Thr Gly Gln Trp Thr Ile Asp Pro Leu Pro Arg Ser
200 205 210 ATG CGG CTG CCC ACC GGG ACG ACG ACG GTG CCG ATG CGG TAC GTG CCG 3405 Met Arg Leu Pro Thr Gly Thr Thr Thr Val Pro Met Arg Tyr Val Pro
215 220 225 TAC AAC GGG CGG GCC GTG GTC CCC GCA TGG GTC CGG CAG CGT GCG CGG 3453 Tyr Asn Gly Arg Ala Val Val Pro Ala Trp Val Arg Gln Arg Ala Arg
230 235 240 CGG CCC CGG ATC TGC CTG ACG CTC GGT GTG TCG GCC CGG CAG ACC CTG 3501 Arg Pro Arg Ile Cys Leu Thr Leu Gly Val Ser Ala Arg Gln Thr Leu 245 250 255 260 GGC GAC GGC GTG TCG CTG GCG GAG GTG CTG GCC GCG CTG GGC GAC GTG 3549 Gly Asp Gly Val Ser Leu Ala Glu Val Leu Ala Ala Leu Gly Asp Val
265 270 275 GAC GCG GAG ATC GTG GCC ACG CTG GAC GCC TCC CAG CGC AAG CTC CTG 3597 Asp Ala Glu Ile Val Ala Thr Leu Asp Ala Ser Gln Arg Lys Leu Leu
280 285 290 GGG CCG GTG CCG GAC AAC GTC CGG CTG GTG GAC TTC GTG CCC CTG CAC 3645 Gly Pro Val Pro Asp Asn Val Arg Leu Val Asp Phe Val Pro Leu His
295 300 305 GCC CTG ATG CCG ACC TGT TCG GCG ATC GTG CAC CAC GGC GGC GCC GGT 3693 Ala Leu Met Pro Thr Cys Ser Ala Ile Val His His Gly Gly Ala Gly
310 315 320 ACC TGG CTG ACG GCC GCC GTC CAC GGC GTC CCG CAG ATC GTC CTC GGT 3741 Thr Trp Leu Thr Ala Ala Val His Gly Val Pro Gln Ile Val Leu Gly 325 330 335 340 GAC CTC TGG GAC AAC CTG CTG CGC GCC CGG CAG ACA CAG GCC GCG GGC 3789 Asp Leu Trp Asp Asn Leu Leu Arg Ala Arg Gln Thr Gln Ala Ala Gly
345 350 355
GCG GAG TGG CTG GGC TGG GCG GCC GAA CGG CTG GGC TCC ACC TTC GAC 3309 Ala Glu Trp Leu Gly Trp Ala Ala Glu Arg Leu Gly Ser Thr Phe Asp
185 190 195 GAG GAG CTG GTG ACC GGG CAG TGG ACG ATC GAC CCG CTG CCG CGG AGC 3357 Glu Glu Leu Val Thr Gly Gln Trp Thr Ile Asp Pro Leu Pro Arg Ser
200 205 210 ATG CGG CTG CCC ACC GGG ACG ACG ACG GTG CCG ATG CGG TAC GTG CCG 3405 Met Arg Leu Pro Thr Gly Thr Thr Thr Val Pro Met Arg Tyr Val Pro
215 220 225 TAC AAC GGG CGG GCC GTG GTC CCC GCA TGG GTC CGG CAG CGT GCG CGG 3453 Tyr Asn Gly Arg Ala Val Val Pro Ala Trp Val Arg Gln Arg Ala Arg
230 235 240 CGG CCC CGG ATC TGC CTG ACG CTC GGT GTG TCG GCC CGG CAG ACC CTG 3501 Arg Pro Arg Ile Cys Leu Thr Leu Gly Val Ser Ala Arg Gln Thr Leu 245 250 255 260 GGC GAC GGC GTG TCG CTG GCG GAG GTG CTG GCC GCG CTG GGC GAC GTG 3549 Gly Asp Gly Val Ser Leu Ala Glu Val Leu Ala Ala Leu Gly Asp Val
265 270 275 GAC GCG GAG ATC GTG GCC ACG CTG GAC GCC TCC CAG CGC AAG CTC CTG 3597 Asp Ala Glu Ile Val Ala Thr Leu Asp Ala Ser Gln Arg Lys Leu Leu
280 285 290 GGG CCG GTG CCG GAC AAC GTC CGG CTG GTG GAC TTC GTG CCC CTG CAC 3645 Gly Pro Val Pro Asp Asn Val Arg Leu Val Asp Phe Val Pro Leu His
295 300 305 GCC CTG ATG CCG ACC TGT TCG GCG ATC GTG CAC CAC GGC GGC GCC GGT 3693 Ala Leu Met Pro Thr Cys Ser Ala Ile Val His His Gly Gly Ala Gly
310 315 320 ACC TGG CTG ACG GCC GCC GTC CAC GGC GTC CCG CAG ATC GTC CTC GGT 3741 Thr Trp Leu Thr Ala Ala Val His Gly Val Pro Gln Ile Val Leu Gly 325 330 335 340 GAC CTC TGG GAC AAC CTG CTG CGC GCC CGG CAG ACA CAG GCC GCG GGC 3789 Asp Leu Trp Asp Asn Leu Leu Arg Ala Arg Gln Thr Gln Ala Ala Gly
345 350 355

<Desc/Clms Page number 121><Desc / Clms Page number 121>

GCG GGC CTG TTC ATC CAT CCG TCC GAG GTC ACC GCG GCC GGG CTC GGT 3837 Ala Gly Leu Phe Ile His Pro Ser Glu Val Thr Ala Ala Gly Leu Gly
360 365 370 GAG GGC GTG CGC CGG GTG CTG ACG GAC CCT TCC ATC CGG GCC GCC GCA 3885 Glu Gly Val Arg Arg Val Leu Thr Asp Pro Ser Ile Arg Ala Ala Ala
375 380 385 CAG CGC GTC CGG GAC GAG ATG AAT GCA GAG CCG ACG CCG GGC GAG GTC 3933 Gln Arg Val Arg Asp Glu Met Asn Ala Glu Pro Thr Pro Gly Glu Val
390 395 400 GTC ACG GTG CTG GAG CGG CTC GCC GCG AGC GGC GGA CGC GGA CGA GGA 3981 Val Thr Val Leu Glu Arg Leu Ala Ala Ser Gly Gly Arg Gly Arg Gly 405 410 415 420 GGC GGG AAC CAT GCG GGC TGACACGGAG CCGACCACCG GGTACGAGGA 4029 Gly Gly Asn His Ala Gly
425 CGAGTTCGCC GAGATCTACG ACGCCGTGTA CCGGGGCCGG GGCAAGGACT ACGCCGGCGA 4089 GGCGAAGGAC GTGGCGGACC TCGTGCGCGA CCGGGTGCCG GACGCGTCCT CCCTCCTGGA 4149 CGTGGCCTGC GGCACGGGCG CGCACCTGCG GCACTTCGCC ACGCTCTTCG ACGACGCCCG 4209 CGGTCTCGAA CTGTCCGCGA GCATGCTGGA CATCGCCCGC TCCCGCATGC CGGGCGTGCC 4269 GCTGCACCAA GGGGACATGC GATCCTTCGA CCTGGGGCCA CGCGTCTCCG CGGTCACCTG 4329 CATGTTCAGC TCCGTCGGCC ACCTGGCCAC CACCGCCGAA CTCGACGCGA CGCTGCGGTG 4389 CTTCGCCCGG CACACCCGGC CCGGCGGCGT GGCCGTCATC GAACCGTGGT GGTTCCCGGA 4449 GACCTTCACC GACGGCTACG TGGCGGGTGA CATCGTACGC GTCGACGGCC GGACCATCTC 4509 CCGGGTGTCC CACTCGGTAC GGGACGGCGG CGCCACCCGC ATGGAGATCC ACTACGTGAT 4569 CGCCGACGCC GAGCACGGTC CCCGGCACCT GGTCGAGCAC CACCGCATCA CGCTGTTCCC 4629 GCGGCATGCG TACACGGCCG CGTACGAGAA GGCGGGCTAC ACCGTCGAGT ACCTCGACGG 4689 CGGGCCCTCG GGCCGGGGGC TGTTCGTCGG CACCCGGACG TGAACCCGCC CGCGCACCGC 4749 CCGATCACCC TGCTCAACGC CGTTCACACG GATCACCGGA CCACGCGAAG GACCTTTCAC 4809
GCG GGC CTG TTC ATC CAT CCG TCC GAG GTC ACC GCG GCC GGG CTC GGT 3837 Ala Gly Leu Phe Ile His Pro Ser Glu Val Thr Ala Ala Gly Leu Gly
360 365 370 GAG GGC GTG CGC CGG GTG CTG ACG GAC CCT TCC ATC CGG GCC GCC GCA 3885 Glu Gly Val Arg Arg Val Leu Thr Asp Pro Ser Ile Arg Ala Ala Ala
375 380 385 CAG CGC GTC CGG GAC GAG ATG AAT GCA GAG CCG ACG CCG GGC GAG GTC 3933 Gln Arg Val Arg Asp Glu Met Asn Ala Glu Pro Thr Pro Gly Glu Val
390 395 400 GTC ACG GTG CTG GAG CGG CTC GCC GCG AGC GGC GGA CGC GGA CGA GGA 3981 Val Thr Val Leu Glu Arg Leu Ala Ala Ser Gly Gly Arg Gly Arg Gly 405 410 415 420 GGC GGG AAC CAT GCG GGC TGACACGGAG CCGACCACCG GGTACGAG29 Gly Gly Asn His Ala Gly
425 CGAGTTCGCC GAGATCTACG ACGCCGTGTA CCGGGGCCGG GGCAAGGACT ACGCCGGCGA 4089 GGCGAAGGAC GTGGCGGACC TCGTGCGCGA CCGGGTGCCG GACGCGTCCT CCCTCCTGGA 4149 CGTGGCCTGC GGCACGGGCG CGCACCTGCG GCACTTCGCC ACGCTCTTCG ACGACGCCCG 4209 CGGTCTCGAA CTGTCCGCGA GCATGCTGGA CATCGCCCGC TCCCGCATGC CGGGCGTGCC 4269 GCTGCACCAA GGGGACATGC GATCCTTCGA CCTGGGGCCA CGCGTCTCCG CGGTCACCTG 4329 CATGTTCAGC TCCGTCGGCC ACCTGGCCAC CACCGCCGAA CTCGACGCGA CGCTGCGGTG 4389 CTTCGCCCGG CACACCCGGC CCGGCGGCGT GGCCGTCATC GAACCGTGGT GGTTCCCGGA 4449 GACCTTCACC GACGGCTACG TGGCGGGTGA CATCGTACGC GTCGACGGCC GGACCATCTC 4509 CCGGGTGTCC CACTCGGTAC GGGACGGCGG CGCCACCCGC ATGGAGATCC ACTACGTGAT 4569 CGCCGACGCC GAGCACGGTC CCCGGCACCT GGTCGAGCAC CACCGCATCA CGCTGTTCCC 4629 GCGGCATGCG TACACGGCCG CGTACGAGAA GGCGGGCTAC ACCGTCGAGT ACCTCGACGG 4689 CGGGCCCTCG GGCCGGGGGC TGTTCGTCGG CACCCGGACG TGAACCCGCC CGCGCACCGC 4749 CCGATCACCC TGCTCAACGC CGTTCACACG GATCACCGGA CCACGCGAAG GACCTTTCAC 4809

<Desc/Clms Page number 122><Desc / Clms Page number 122>

ATG TCG TAC GAC GAC CAC GCG GTG CTG GAA GCG ATA CTG CGG TGC GCC 4857 Met Ser Tyr Asp Asp His Ala Val Leu Glu Ala Ile Leu Arg Cys Ala 1 5 10 15 GGA GGT GAC GAG CGC TTC CTG CTG AAC ACC GTC GAG GAA TGG GGA GCC 4905 Gly Gly Asp Glu Arg Phe Leu Leu Asn Thr Val Glu Glu Trp Gly Ala
20 25 30 GCC GAG ATC ACC GCG GCG CTC GTG GAC GAG TTG CTG TTC CGC TGC GAG 4953 Ala Glu Ile Thr Ala Ala Leu Val Asp Glu Leu Leu Phe Arg Cys Glu
35 40 45 ATC CCG CAG GTG GGC GGT GAG GCG TTC ATC GGC CTG GAC GTC CTG CAC 5001 Ile Pro Gln Val Gly Gly Glu Ala Phe Ile Gly Leu Asp Val Leu His
50 55 60 GGC GCC GAC CGG ATC AGC CAT GTG CTG CAG GTG ACG GAC GGC AAG CCG 5049 Gly Ala Asp Arg Ile Ser His Val Leu Gln Val Thr Asp Gly Lys Pro
65 70 75 80 GTC ACG TCG GCG GAA CCG GCC GGC CAG GAA CTG GGC GGC CGT ACC TGG 5097 Val Thr Ser Ala Glu Pro Ala Gly Gln Glu Leu Gly Gly Arg Thr Trp
85 90 95 AGT TCA CGC TCA GCG ACC CTC CTG CGG GAG CTG TTC GGC CCG CCG TCC 5145 Ser Ser Arg Ser Ala Thr Leu Leu Arg Glu Leu Phe Gly Pro Pro Ser
100 105 110 GGC CGC ACC GCG GGG GGC TTC GGC GTC TCC TTC CTG CCC GAC CTG CGC 5193 Gly Arg Thr Ala Gly Gly Phe Gly Val Ser Phe Leu Pro Asp Leu Arg
115 120 125 GGC CCG CGG ACC ATG GAG GGC GCG GCC CTG GCC GCC CGC GCC ACC AAC 5241 Gly Pro Arg Thr Met Glu Gly Ala Ala Leu Ala Ala Arg Ala Thr Asn
130 135 140 GTG GTG CTG CAC GCG ACG ACC AAC GAG ACG CCC CCA CTG GAC CGG CTG 5289 Val Val Leu His Ala Thr Thr Asn Glu Thr Pro Pro Leu Asp Arg Leu 145 150 155 160 GCC CTG CGC TAC GAG TCC GAC AAG TGG GGC GGC GTC CAC TGG TTC ACC 5337 Ala Leu Arg Tyr Glu Ser Asp Lys Trp Gly Gly Val His Trp Phe Thr
165 170 175
ATG TCG TAC GAC GAC CAC GCG GTG CTG GAA GCG ATA CTG CGG TGC GCC 4857 Met Ser Tyr Asp Asp His Ala Val Leu Glu Ala Ile Leu Arg Cys Ala 1 5 10 15 GGA GGT GAC GAG CGC TTC CTG CTG AAC ACC GTC GAG GAA TGG GGA GCC 4905 Gly Gly Asp Glu Arg Phe Leu Leu Asn Thr Val Glu Glu Trp Gly Ala
20 25 30 GCC GAG ATC ACC GCG GCG CTC GTG GAC GAG TTG CTG TTC CGC TGC GAG 4953 Ala Glu Ile Thr Ala Ala Leu Val Asp Glu Leu Leu Phe Arg Cys Glu
35 40 45 ATC CCG CAG GTG GGC GGT GAG GCG TTC ATC GGC CTG GAC GTC CTG CAC 5001 Ile Pro Gln Val Gly Gly Glu Ala Phe Ile Gly Leu Asp Val Leu His
50 55 60 GGC GCC GAC CGG ATC AGC CAT GTG CTG CAG GTG ACG GAC GGC AAG CCG 5049 Gly Ala Asp Arg Ile Ser His Val Leu Gln Val Thr Asp Gly Lys Pro
65 70 75 80 GTC ACG TCG GCG GAA CCG GCC GGC CAG GAA CTG GGC GGC CGT ACC TGG 5097 Val Thr Ser Ala Glu Pro Ala Gly Gln Glu Leu Gly Gly Arg Thr Trp
85 90 95 AGT TCA CGC TCA GCG ACC CTC CTG CGG GAG CTG TTC GGC CCG CCG TCC 5145 Ser Ser Arg Ser Ala Thr Leu Leu Arg Glu Leu Phe Gly Pro Pro Ser
100 105 110 GGC CGC ACC GCG GGG GGC TTC GGC GTC TCC TTC CTG CCC GAC CTG CGC 5193 Gly Arg Thr Ala Gly Gly Phe Gly Val Ser Phe Leu Pro Asp Leu Arg
115 120 125 GGC CCG CGG ACC ATG GAG GGC GCG GCC CTG GCC GCC CGC GCC ACC AAC 5241 Gly Pro Arg Thr Met Glu Gly Ala Ala Leu Ala Ala Arg Ala Thr Asn
130 135 140 GTG GTG CTG CAC GCG ACG ACC AAC GAG ACG CCC CCA CTG GAC CGG CTG 5289 Val Val Leu His Ala Thr Thr Asn Glu Thr Pro Pro Leu Asp Arg Leu 145 150 155 160 GCC CTG CGC TAC GAG TCC GAC AAG TGG GGC GGC GTC CAC TGG TTC ACC 5337 Ala Leu Arg Tyr Glu Ser Asp Lys Trp Gly Gly Val His Trp Phe Thr
165 170 175

<Desc/Clms Page number 123><Desc / Clms Page number 123>

GGC CAC TAC GAC CGG CAC CTG CGG GCC GTG CGC GAC CAG GCG GTG CGG 5385 Gly His Tyr Asp Arg His Leu Arg Ala Val Arg Asp Gln Ala Val Arg
180 185 190 ATC CTG GAG ATC GGC ATC GGC GGC TAC GAC GAC CTG CTG CCG AGC GGC 5433 Ile Leu Glu Ile Gly Ile Gly Gly Tyr Asp Asp Leu Leu Pro Ser Gly
195 200 205 GCC TCA CTG AAG ATG TGG AAG CGC TAC TTC CCG CGC GGC CTG GTC TTC 5481 Ala Ser Leu Lys Met Trp Lys Arg Tyr Phe Pro Arg Gly Leu Val Phe
210 215 220 GGC GTG GAC ATC TTC GAC AGT CGG CGT GCG ACC AGC CGC GTG TCA AGA 5529 Gly Val Asp Ile Phe Asp Ser Arg Arg Ala Thr Ser Arg Val Ser Arg 225 230 235 240 CGC TCC GCG GCC CGG CAG GAC GAC CCG GAG TTC ATG CGC CGC GTC GCC 5577 Arg Ser Ala Ala Arg Gln Asp Asp Pro Glu Phe Met Arg Arg Val Ala
245 250 255 GAG GAG CAC GGG CCG TTC GAC GTC ATC ATC GAC GAC GGC AGC CAC ATC 5625 Glu Glu His Gly Pro Phe Asp Val Ile Ile Asp Asp Gly Ser His Ile
260 265 270 AAC GCA CAC ATG CGG ACG TCG TTC TCG GTG ATG TTC CCC CAC CTG CGC 5673 Asn Ala His Met Arg Thr Ser Phe Ser Val Met Phe Pro His Leu Arg
275 280 285 AAC GGC GGC TTC TAC GTC ATC GAG GAC ACC TTC ACC TCC TAC TGG CCC 5721 Asn Gly Gly Phe Tyr Val Ile Glu Asp Thr Phe Thr Ser Tyr Trp Pro
290 295 300 GGG TAC GGA GGG CCA TCC GGA GCC CGG TGC CCG TCC GGA ACA ACC GCG 5769 Gly Tyr Gly Gly Pro Ser Gly Ala Arg Cys Pro Ser Gly Thr Thr Ala 305 310 315 320 CTG GAG ATG GTC AAG GGA CTG ATC GAC TCG GTG CAC TAC GAG GAG CGG 5817 Leu Glu Met Val Lys Gly Leu Ile Asp Ser Val His Tyr Glu Glu Arg
325 330 335 CCG GAC GGC GCG GCC ACG GCC GAC TAC ATC GCC AGG AAC CTC GTC GGG 5865 Pro Asp Gly Ala Ala Thr Ala Asp Tyr Ile Ala Arg Asn Leu Val Gly
340 345 350
GGC CAC TAC GAC CGG CAC CTG CGG GCC GTG CGC GAC CAG GCG GTG CGG 5385 Gly His Tyr Asp Arg His Leu Arg Ala Val Arg Asp Gln Ala Val Arg
180 185 190 ATC CTG GAG ATC GGC ATC GGC GGC TAC GAC GAC CTG CTG CCG AGC GGC 5433 Ile Leu Glu Ile Gly Ile Gly Gly Tyr Asp Asp Leu Leu Pro Ser Gly
195 200 205 GCC TCA CTG AAG ATG TGG AAG CGC TAC TTC CCG CGC GGC CTG GTC TTC 5481 Ala Ser Leu Lys Met Trp Lys Arg Tyr Phe Pro Arg Gly Leu Val Phe
210 215 220 GGC GTG GAC ATC TTC GAC AGT CGG CGT GCG ACC AGC CGC GTG TCA AGA 5529 Gly Val Asp Ile Phe Asp Ser Arg Arg Ala Thr Ser Arg Val Ser Arg 225 230 235 240 CGC TCC GCG GCC CGG CAG GAC GAC CCG GAG TTC ATG CGC CGC GTC GCC 5577 Arg Ser Ala Ala Arg Gln Asp Asp Pro Glu Phe Met Arg Arg Val Ala
245 250 255 GAG GAG CAC GGG CCG TTC GAC GTC ATC ATC GAC GAC GGC AGC CAC ATC 5625 Glu Glu His Gly Pro Phe Asp Val Ile Ile Asp Asp Gly Ser His Ile
260 265 270 AAC GCA CAC ATG CGG ACG TCG TTC TCG GTG ATG TTC CCC CAC CTG CGC 5673 Asn Ala His Met Arg Thr Ser Phe Ser Val Met Phe Pro His Leu Arg
275 280 285 AAC GGC GGC TTC TAC GTC ATC GAG GAC ACC TTC ACC TCC TAC TGG CCC 5721 Asn Gly Gly Phe Tyr Val Ile Glu Asp Thr Phe Thr Ser Tyr Trp Pro
290 295 300 GGG TAC GGA GGG CCA TCC GGA GCC CGG TGC CCG TCC GGA ACA ACC GCG 5769 Gly Tyr Gly Gly Pro Ser Gly Ala Arg Cys Pro Ser Gly Thr Thr Ala 305 310 315 320 CTG GAG ATG GTC AAG GGA CTG ATC GAC TCG GTG CAC TAC GAG GAG CGG 5817 Leu Glu Met Val Lys Gly Leu Ile Asp Ser Val His Tyr Glu Glu Arg
325 330 335 CCG GAC GGC GCG GCC ACG GCC GAC TAC ATC GCC AGG AAC CTC GTC GGG 5865 Pro Asp Gly Ala Ala Thr Ala Asp Tyr Ile Ala Arg Asn Leu Val Gly
340 345 350

<Desc/Clms Page number 124><Desc / Clms Page number 124>

CTG CAC GCC TAC CAA ACG ACC TCG TCT TCC TCG AGA AGG GCG ATC AAC 5913 Leu His Ala Tyr Gln Thr Thr Ser Ser Ser Ser Arg Arg Ala Ile Asn
355 360 365 AAG GAG GGC GGC ATC CCC CAC ACC GTG CCC CGG GAG CCG TTC TGG AAC 5961 Lys Glu Gly Gly Ile Pro His Thr Val Pro Arg Glu Pro Phe Trp Asn
370 375 380 GAC AAC TAGCCACGGC CGCAACCAGA GCCGGAAACC GCACCACTGT CCGCGCCACC 6017 Asp Asn 385 TCGGAACCAC CTCCAGCAAA GGACACACCG CTGTGACCGA TACGCACACC GGACCGACAC 6077 CGGCCGACGC GGTACC 6093 (2) INFORMATIONS POUR LA SEQ ID NO: 16: (i) CARACTERISTIQUES DE LA SEQUENCE : (A) LONGUEUR : acides amin s (B) TYPE : amin (D) CONFIGURATION : lin aire(ii) TYPE DE MOLECULE : (xi) DESCRIPTION DE LA SEQUENCE : SEQ ID NO: 16 : Met Glu Asp Ser Glu Leu Gly Arg Arg Leu Gln Met Leu Arg Gly Met 1 5 10 15 Gln Trp Val Phe Gly Ala Asn Gly Asp Pro Tyr Ala Arg Leu Leu Cys
20 25 30 Gly Met Glu Asp Asp Pro Ser Pro Phe Tyr Asp Ala Ile Arg Thr Leu
35 40 45 Gly Glu Leu His Arg Ser Arg Thr Gly Ala Trp Val Thr Ala Asp Pro
50 55 60 Gly Leu Gly Gly Arg Ile Leu Ala Asp Arg Lys Ala Arg Cys Pro Glu
65 70 75 80 Gly Ser Trp Pro Val Arg Ala Lys Thr Asp Gly Leu Glu Gln Tyr Val
85 90 95
CTG CAC GCC TAC CAA ACG ACC TCG TCT TCC TCG AGA AGG GCG ATC AAC 5913 Leu His Ala Tyr Gln Thr Thr Ser Ser Ser Ser Arg Arg Ala Ile Asn
355 360 365 AAG GAG GGC GGC ATC CCC CAC ACC GTG CCC CGG GAG CCG TTC TGG AAC 5961 Lys Glu Gly Gly Ile Pro His Thr Val Pro Arg Glu Pro Phe Trp Asn
370 375 380 GAC AAC TAGCCACGGC CGCAACCAGA GCCGGAAACC GCACCACTGT CCGCGCCACC 6017 Asp Asn 385 TCGGAACCAC CTCCAGCAAA GGACACACCG CTGTGACCGA TACGCACACC GGACCGACAC 6077 CGGCCGACGC GGTACC 6093 (2) INFORMATION FOR THE SEA: ID: amin s (B) TYPE: amin (D) CONFIGURATION: lin aire (ii) TYPE OF MOLECULE: (xi) SEQUENCE DESCRIPTION: SEQ ID NO: 16: Met Glu Asp Ser Glu Leu Gly Arg Arg Leu Gln Met Leu Arg Gly Met 1 5 10 15 Gln Trp Val Phe Gly Ala Asn Gly Asp Pro Tyr Ala Arg Leu Leu Cys
20 25 30 Gly Met Glu Asp Asp Pro Ser Pro Phe Tyr Asp Ala Ile Arg Thr Leu
35 40 45 Gly Glu Leu His Arg Ser Arg Thr Gly Ala Trp Val Thr Ala Asp Pro
50 55 60 Gly Leu Gly Gly Arg Ile Leu Ala Asp Arg Lys Ala Arg Cys Pro Glu
65 70 75 80 Gly Ser Trp Pro Val Arg Ala Lys Thr Asp Gly Leu Glu Gln Tyr Val
85 90 95

<Desc/Clms Page number 125><Desc / Clms Page number 125>

Leu Pro Gly His Gln Ala Phe Leu Arg Leu Glu Arg Glu Glu Ala Glu
100 105 110 Arg Leu Arg Glu Val Ala Ala Pro Val Leu Gly Ala Ala Ala Val Asp
115 120 125 Ala Trp Arg Pro Leu Ile Asp Glu Val Cys Ala Gly Leu Ala Lys Gly
130 135 140 Leu Pro Asp Thr Phe Asp Leu Val Glu Glu Tyr Ala Gly Leu Val Pro 145 150 155 160 Val Glu Val Leu Ala Arg Ile Trp Gly Val Pro Glu Glu Asp Arg Ala
165 170 175 Arg Phe Gly Arg Asp Cys Arg Ala Leu Ala Pro Ala Leu Asp Ser Leu
180 185 190 Leu Cys Pro Gln Gln Leu Ala Leu Ser Lys Asp Met Ala Ser Ala Leu
195 200 205 Glu Asp Leu Arg Leu Leu Phe Asp Gly Leu Asp Ala Thr Pro Arg Leu
210 215 220 Ala Gly Pro Ala Asp Gly Asp Gly Thr Ala Val Ala Met Leu Thr Val 225 230 235 240 Leu Leu Cys Thr Glu Pro Val Thr Thr Ala Ile Gly Asn Thr Val Leu
245 250 255 Gly Leu Leu Pro Gly Gln Trp Pro Val Pro Cys Thr Gly Arg Val Ala
260 265 270 Ala Gly Gln Val Ala Gly Gln Ala Leu His Arg Ala Val Ser Tyr Arg
275 280 285 Ile Ala Thr Arg Phe Ala Arg Glu Asp Leu Glu Leu Ala Gly Cys Glu
290 295 300 Val Lys Ser Gly Asp Glu Val Val Val Leu Ala Gly Ala Ile Gly Arg 305 310 315 320 Asn Gly Pro Ser Ala Ala Ala Pro Pro Ala Pro Pro Gly Pro Ala Ala
325 330 335
Leu Pro Gly His Gln Ala Phe Leu Arg Leu Glu Arg Glu Glu Ala Glu
100 105 110 Arg Leu Arg Glu Val Ala Ala Pro Val Leu Gly Ala Ala Ala Val Asp
115 120 125 Ala Trp Arg Pro Leu Ile Asp Glu Val Cys Ala Gly Leu Ala Lys Gly
130 135 140 Leu Pro Asp Thr Phe Asp Leu Val Glu Glu Tyr Ala Gly Leu Val Pro 145 150 155 160 Val Glu Val Leu Ala Arg Ile Trp Gly Val Pro Glu Glu Asp Arg Ala
165 170 175 Arg Phe Gly Arg Asp Cys Arg Ala Leu Ala Pro Ala Leu Asp Ser Leu
180 185 190 Leu Cys Pro Gln Gln Leu Ala Leu Ser Lys Asp Met Ala Ser Ala Leu
195 200 205 Glu Asp Leu Arg Leu Leu Phe Asp Gly Leu Asp Ala Thr Pro Arg Leu
210 215 220 Ala Gly Pro Ala Asp Gly Asp Gly Thr Ala Val Ala Met Leu Thr Val 225 230 235 240 Leu Leu Cys Thr Glu Pro Val Thr Thr Ala Ile Gly Asn Thr Val Leu
245 250 255 Gly Leu Leu Pro Gly Gln Trp Pro Val Pro Cys Thr Gly Arg Val Ala
260 265 270 Ala Gly Gln Val Ala Gly Gln Ala Leu His Arg Ala Val Ser Tyr Arg
275 280 285 Ile Ala Thr Arg Phe Ala Arg Glu Asp Leu Glu Leu Ala Gly Cys Glu
290 295 300 Val Lys Ser Gly Asp Glu Val Val Leu Ala Gly Ala Ile Gly Arg 305 310 315 320 Asn Gly Pro Ser Ala Ala Ala Pro Pro Ala Pro Pro Gly Pro Ala Ala
325 330 335

<Desc/Clms Page number 126><Desc / Clms Page number 126>

Pro Pro Ala Pro Ser Val Phe Gly Ala Ala Ala Phe Glu Asn Ala Leu
340 345 350 Ala Glu Pro Leu Val Arg Ala Val Thr Gly Ala Ala Leu Gln Ala Leu
355 360 365 Ala Glu Gly Pro Pro Arg Leu Thr Ala Ala Gly Pro Val Val Arg Arg
370 375 380 Arg Arg Ser Pro Val Val Gly Gly Leu His Arg Ala Pro Val Ala Ala 385 390 395 400 Ala (2) INFORMATIONS POUR LA SEQ ID NO: 17 : (i) CARACTERISTIQUES DE LA SEQUENCE: (A) LONGUEUR : 426 acides amin s (B) TYPE : amin (D) CONFIGURATION : lin aire(ii) TYPE DE MOLECULE : (xi) DESCRIPTION DE LA SEQUENCE : ID NO: 17 : Met Met Met Thr Thr Phe Ala Ala Asn Thr His Phe Gln Pro Leu Val 1 5 10 15 Pro Leu Ala Trp Ala Leu Arg Thr Ala Gly His Glu Val Arg Val Val
20 25 30 Ser Gln Pro Ser Leu Ser Asp Val Val Thr Gln Ala Gly Leu Thr Ser
35 40 45 Val Pro Val Gly Thr Glu Ala Pro Val Glu Gln Phe Ala Ala Thr Trp
50 55 60 Gly Asp Asp Ala Tyr Ile Gly Val Asn Ser Ile Asp Phe Thr Gly Asn
65 70 75 80 Asp Pro Gly Leu Trp Thr Trp Pro Tyr Leu Leu Gly Met Glu Thr Met
85 90 95 Leu Val Pro Ala Phe Tyr Glu Leu Leu Asn Asn Glu Ser Phe Val Asp
100 105 110
Pro Pro Ala Pro Ser Val Phe Gly Ala Ala Ala Phe Glu Asn Ala Leu
340 345 350 Ala Glu Pro Leu Val Arg Ala Val Thr Gly Ala Ala Leu Gln Ala Leu
355 360 365 Ala Glu Gly Pro Pro Arg Leu Thr Ala Ala Gly Pro Val Val Arg Arg
370 375 380 Arg Arg Ser Pro Val Val Gly Gly Leu His Arg Ala Pro Val Ala Ala 385 390 395 400 Ala (2) INFORMATION FOR SEQ ID NO: 17: (i) CHARACTERISTICS OF THE SEQUENCE: (A) LENGTH: 426 amino acids s (B) TYPE: amin (D) CONFIGURATION: lin aire (ii) TYPE OF MOLECULE: (xi) SEQUENCE DESCRIPTION: ID NO: 17: Met Met Met Thr Thr Phe Ala Ala Asn Thr His Phe Gln Pro Leu Val 1 5 10 15 Pro Leu Ala Trp Ala Leu Arg Thr Ala Gly His Glu Val Arg Val Val
20 25 30 Ser Gln Pro Ser Leu Ser Asp Val Val Thr Gln Ala Gly Leu Thr Ser
35 40 45 Val Pro Val Gly Thr Glu Ala Pro Val Glu Gln Phe Ala Ala Thr Trp
50 55 60 Gly Asp Asp Ala Tyr Ile Gly Val Asn Ser Ile Asp Phe Thr Gly Asn
65 70 75 80 Asp Pro Gly Leu Trp Thr Trp Pro Tyr Leu Leu Gly Met Glu Thr Met
85 90 95 Leu Val Pro Ala Phe Tyr Glu Leu Leu Asn Asn Glu Ser Phe Val Asp
100 105 110

<Desc/Clms Page number 127><Desc / Clms Page number 127>

Gly Val Val Glu Phe Ala Arg Asp Trp Arg Pro Asp Leu Val Ile Trp
115 120 125 Glu Pro Leu Thr Phe Ala Gly Ala Val Ala Ala Arg Val Thr Gly Ala
130 135 140 Ala His Ala Arg Leu Pro Trp Gly Gln Glu Ile Thr Leu Arg Gly Arg 145 150 155 160 Gln Ala Phe Leu Ala Glu Arg Ala Leu Gln Pro Phe Glu His Arg Glu
165 170 175 Asp Pro Thr Ala Glu Trp Leu Gly Arg Met Leu Asp Arg Tyr Gly Cys
180 185 190 Ser Phe Asp Glu Glu Met Val Thr Gly Gln Trp Thr Ile Asp Thr Leu
195 200 205 Pro Arg Ser Met Arg Leu Glu Leu Ser Glu Glu Leu Arg Thr Leu Asp
210 215 220 Met Arg Tyr Val Pro Tyr Asn Gly Pro Ala Val Val Pro Pro Trp Val 225 230 235 240 Trp Glu Pro Cys Glu Arg Pro Arg Val Cys Leu Thr Ile Gly Thr Ser
245 250 255 Gln Arg Asp Ser Gly Arg Asp His Val Pro Leu Asp His Leu Leu Asp
260 265 270 Ser Leu Ala Asp Val Asp Ala Glu Ile Val Ala Thr Leu Asp Thr Thr
275 280 285 Gln Gln Glu Arg Leu Arg Gly Ala Ala Pro Gly Asn Val Arg Leu Val
290 295 300 Asp Phe Val Pro Leu His Ala Leu Met Pro Thr Cys Ser Ala Ile Val 305 310 315 320 His His Gly Gly Pro Gly Thr Trp Ser Thr Ala Ala Leu His Gly Val
325 330 335 Pro Gln Ile Ile Leu Asp Thr Ser Trp Asp Thr Pro Val Arg Ala Gln
340 345 350
Gly Val Val Glu Phe Ala Arg Asp Trp Arg Pro Asp Leu Val Ile Trp
115 120 125 Glu Pro Leu Thr Phe Ala Gly Ala Val Ala Ala Arg Val Thr Gly Ala
130 135 140 Ala His Ala Arg Leu Pro Trp Gly Gln Glu Ile Thr Leu Arg Gly Arg 145 150 155 160 Gln Ala Phe Leu Ala Glu Arg Ala Leu Gln Pro Phe Glu His Arg Glu
165 170 175 Asp Pro Thr Ala Glu Trp Leu Gly Arg Met Leu Asp Arg Tyr Gly Cys
180 185 190 Ser Phe Asp Glu Glu Met Val Thr Gly Gln Trp Thr Ile Asp Thr Leu
195 200 205 Pro Arg Ser Met Arg Leu Glu Leu Ser Glu Glu Leu Arg Thr Leu Asp
210 215 220 Met Arg Tyr Val Pro Tyr Asn Gly Pro Ala Val Val Pro Pro Trp Val 225 230 235 240 Trp Glu Pro Cys Glu Arg Pro Arg Val Cys Leu Thr Ile Gly Thr Ser
245 250 255 Gln Arg Asp Ser Gly Arg Asp His Val Pro Leu Asp His Leu Leu Asp
260 265 270 Ser Leu Ala Asp Val Asp Ala Glu Ile Val Ala Thr Leu Asp Thr Thr
275 280 285 Gln Gln Glu Arg Leu Arg Gly Ala Ala Pro Gly Asn Val Arg Leu Val
290 295 300 Asp Phe Val Pro Leu His Ala Leu Met Pro Thr Cys Ser Ala Ile Val 305 310 315 320 His His Gly Gly Pro Gly Thr Trp Ser Thr Ala Ala Leu His Gly Val
325 330 335 Pro Gln Ile Ile Asp Asp Ser Ser Trp Asp Thr Pro Val Arg Ala Gln
340 345 350

<Desc/Clms Page number 128><Desc / Clms Page number 128>

Arg Met Gln Gln Leu Gly Ala Gly Leu Ser Met Pro Val Gly Glu Leu
355 360 365 Gly Val Glu Ala Leu Arg Asp Arg Val Leu Arg Leu Leu Gly Glu Pro
370 375 380 Glu Phe Arg Ala Gly Ala Glu Arg Ile Arg Ala Glu Met Leu Ala Met 385 390 395 400 Pro Ala Pro Gly Asp Val Val Pro Asp Leu Glu Arg Leu Thr Ala Glu
405 410 415 His Ala Thr Gly Ala Met Ala Gly Arg Arg
420 425 (2) INFORMATIONS POUR LA SEQ ID NO: 18 : (i) CARACTERISTIQUES DE LA SEQUENCE: (A) LONGUEUR : acides amin s (B) TYPE : amin (D) CONFIGURATION : lin aire(ii) TYPE DE MOLECULE : (xi) DESCRIPTION DE LA SEQUENCE : ID NO: 18 : Met Arg Val Leu Leu Thr Cys Phe Ala Asn Asp Thr His Phe His Gly
1 5 10 15 Leu Val Pro Leu Ala Trp Ala Leu Arg Ala Ala Gly His Glu Val Arg
20 25 30 Val Ala Ser Gln Pro Ala Leu Ser Asp Thr Ile Thr Gln Ala Gly Leu
35 40 45 Thr Ala Val Pro Val Gly Arg Asp Thr Ala Phe Leu Glu Leu Met Gly
50 55 60 Glu Ile Gly Ala Asp Val Gln Lys Tyr Ser Thr Gly Ile Asp Leu Gly
65 70 75 80 Val Arg Ala Glu Leu Thr Ser Trp Glu Tyr Leu Leu Gly Met His Thr
85 90 95 Thr Leu Val Pro Thr Phe Tyr Ser Leu Val Asn Asp Glu Pro Phe Val
100 105 110
Arg Met Gln Gln Leu Gly Ala Gly Leu Ser Met Pro Val Gly Glu Leu
355 360 365 Gly Val Glu Ala Leu Arg Asp Arg Val Leu Arg Leu Leu Gly Glu Pro
370 375 380 Glu Phe Arg Ala Gly Ala Glu Arg Ile Arg Ala Glu Met Leu Ala Met 385 390 395 400 Pro Ala Pro Gly Asp Val Val Pro Asp Leu Glu Arg Leu Thr Ala Glu
405 410 415 His Ala Thr Gly Ala Met Ala Gly Arg Arg
420 425 (2) INFORMATION FOR SEQ ID NO: 18: (i) CHARACTERISTICS OF THE SEQUENCE: (A) LENGTH: amino acids (B) TYPE: amin (D) CONFIGURATION: flax (ii) TYPE OF MOLECULE: (xi) DESCRIPTION OF THE SEQUENCE: ID NO: 18: Met Arg Val Leu Leu Thr Cys Phe Ala Asn Asp Thr His Phe His Gly
1 5 10 15 Leu Val Pro Leu Ala Trp Ala Leu Arg Ala Ala Gly His Glu Val Arg
20 25 30 Val Ala Ser Gln Pro Ala Leu Ser Asp Thr Ile Thr Gln Ala Gly Leu
35 40 45 Thr Ala Val Pro Val Gly Arg Asp Thr Ala Phe Leu Glu Leu Met Gly
50 55 60 Glu Ile Gly Ala Asp Val Gln Lys Tyr Ser Thr Gly Ile Asp Leu Gly
65 70 75 80 Val Arg Ala Glu Leu Thr Ser Trp Glu Tyr Leu Leu Gly Met His Thr
85 90 95 Thr Leu Val Pro Thr Phe Tyr Ser Leu Val Asn Asp Glu Pro Phe Val
100 105 110

<Desc/Clms Page number 129><Desc / Clms Page number 129>

Asp Gly Leu Val Ala Leu Thr Arg Ala Trp Arg Pro Asp Leu Ile Leu
115 120 125 Trp Glu His Phe Ser Phe Ala Gly Ala Leu Ala Ala Arg Ala Thr Gly
130 135 140 Thr Pro His Ala Arg Val Leu Trp Gly Ser Asp Leu Ile Val Arg Phe 145 150 155 160 Arg Arg Asp Phe Leu Ala Glu Arg Ala Asn Arg Pro Ala Glu His Arg
165 170 175 Glu Asp Pro Met Ala Glu Trp Leu Gly Trp Ala Ala Glu Arg Leu Gly
180 185 190 Ser Thr Phe Asp Glu Glu Leu Val Thr Gly Gln Trp Thr Ile Asp Pro
195 200 205 Leu Pro Arg Ser Met Arg Leu Pro Thr Gly Thr Thr Thr Val Pro Met
210 215 220 Arg Tyr Val Pro Tyr Asn Gly Arg Ala Val Val Pro Ala Trp Val Arg 225 230 235 240 Gln Arg Ala Arg Arg Pro Arg Ile Cys Leu Thr Leu Gly Val Ser Ala
245 250 255 Arg Gln Thr Leu Gly Asp Gly Val Ser Leu Ala Glu Val Leu Ala Ala
260 265 270 Leu Gly Asp Val Asp Ala Glu Ile Val Ala Thr Leu Asp Ala Ser Gln
275 280 285 Arg Lys Leu Leu Gly Pro Val Pro Asp Asn Val Arg Leu Val Asp Phe
290 295 300 Val Pro Leu His Ala Leu Met Pro Thr Cys Ser Ala Ile Val His His 305 310 315 320 Gly Gly Ala Gly Thr Trp Leu Thr Ala Ala Val His Gly Val Pro Gln
325 330 335 Ile Val Leu Gly Asp Leu Trp Asp Asn Leu Leu Arg Ala Arg Gln Thr
340 345 350
Asp Gly Leu Val Ala Leu Thr Arg Ala Trp Arg Pro Asp Leu Ile Leu
115 120 125 Trp Glu His Phe Ser Phe Ala Gly Ala Leu Ala Ala Arg Ala Thr Gly
130 135 140 Thr Pro His Ala Arg Val Leu Trp Gly Ser Asp Leu Ile Val Arg Phe 145 150 155 160 Arg Arg Asp Phe Leu Ala Glu Arg Ala Asn Arg Pro Ala Glu His Arg
165 170 175 Glu Asp Pro Met Ala Glu Trp Leu Gly Trp Ala Ala Glu Arg Leu Gly
180 185 190 Ser Thr Phe Asp Glu Glu Leu Val Thr Gly Gln Trp Thr Ile Asp Pro
195 200 205 Leu Pro Arg Ser Met Arg Leu Pro Thr Gly Thr Thr Thr Val Pro Met
210 215 220 Arg Tyr Val Pro Tyr Asn Gly Arg Ala Val Val Pro Ala Trp Val Arg 225 230 235 240 Gln Arg Ala Arg Arg Pro Arg Ile Cys Leu Thr Leu Gly Val Ser Ala
245 250 255 Arg Gln Thr Leu Gly Asp Gly Val Ser Leu Ala Glu Val Leu Ala Ala
260 265 270 Leu Gly Asp Val Asp Ala Glu Ile Val Ala Thr Leu Asp Ala Ser Gln
275 280 285 Arg Lys Leu Leu Gly Pro Val Pro Asp Asn Val Arg Leu Val Asp Phe
290 295 300 Val Pro Leu His Ala Leu Met Pro Thr Cys Ser Ala Ile Val His His 305 310 315 320 Gly Gly Ala Gly Thr Trp Leu Thr Ala Ala Val His Gly Val Pro Gln
325 330 335 Ile Val Leu Gly Asp Leu Trp Asp Asn Leu Leu Arg Ala Arg Gln Thr
340 345 350

<Desc/Clms Page number 130><Desc / Clms Page number 130>

Gln Ala Ala Gly Ala Gly Leu Phe Ile His Pro Ser Glu Val Thr Ala
355 360 365 Ala Gly Leu Gly Glu Gly Val Arg Arg Val Leu Thr Asp Pro Ser Ile
370 375 380 Arg Ala Ala Ala Gln Arg Val Arg Asp Glu Met Asn Ala Glu Pro Thr 385 390 395 400 Pro Gly Glu Val Val Thr Val Leu Glu Arg Leu Ala Ala Ser Gly Gly
405 410 415 Arg Gly Arg Gly Gly Gly Asn His Ala Gly
420 425 (2) INFORMATIONS POUR LA SEQ ID NO: 19 : (i) CARACTERISTIQUES DE LA SEQUENCE: (A) LONGUEUR : acides amin s (B) TYPE : amin (D) CONFIGURATION : lin aire(ii) TYPE DE MOLECULE : (xi) DESCRIPTION DE LA SEQUENCE : ID NO: 19 : Met Ser Tyr Asp Asp His Ala Val Leu Glu Ala Ile Leu Arg Cys Ala
1 5 10 15 Gly Gly Asp Glu Arg Phe Leu Leu Asn Thr Val Glu Glu Trp Gly Ala
20 25 30 Ala Glu Ile Thr Ala Ala Leu Val Asp Glu Leu Leu Phe Arg Cys Glu
35 40 45 Ile Pro Gln Val Gly Gly Glu Ala Phe Ile Gly Leu Asp Val Leu His
50 55 60 Gly Ala Asp Arg Ile Ser His Val Leu Gln Val Thr Asp Gly Lys Pro
65 70 75 80 Val Thr Ser Ala Glu Pro Ala Gly Gln Glu Leu Gly Gly Arg Thr Trp
85 90 95 Ser Ser Arg Ser Ala Thr Leu Leu Arg Glu Leu Phe Gly Pro Pro Ser
100 105 110
Gln Ala Ala Gly Ala Gly Leu Phe Ile His Pro Ser Glu Val Thr Ala
355 360 365 Ala Gly Leu Gly Glu Gly Val Arg Arg Val Leu Thr Asp Pro Ser Ile
370 375 380 Arg Ala Ala Ala Gln Arg Val Arg Asp Glu Met Asn Ala Glu Pro Thr 385 390 395 400 Pro Gly Glu Val Val Thr Val Leu Glu Arg Leu Ala Ala Ser Gly Gly
405 410 415 Arg Gly Arg Gly Gly Gly Asn His Ala Gly
420 425 (2) INFORMATION FOR SEQ ID NO: 19: (i) CHARACTERISTICS OF THE SEQUENCE: (A) LENGTH: amino acids (B) TYPE: amin (D) CONFIGURATION: linen (ii) TYPE OF MOLECULE: (xi) DESCRIPTION OF THE SEQUENCE: ID NO: 19: Met Ser Tyr Asp Asp His Ala Val Leu Glu Ala Ile Leu Arg Cys Ala
1 5 10 15 Gly Gly Asp Glu Arg Phe Leu Leu Asn Thr Val Glu Glu Trp Gly Ala
20 25 30 Ala Glu Ile Thr Ala Ala Leu Val Asp Glu Leu Leu Phe Arg Cys Glu
35 40 45 Ile Pro Gln Val Gly Gly Glu Ala Phe Ile Gly Leu Asp Val Leu His
50 55 60 Gly Ala Asp Arg Ile Ser His Val Leu Gln Val Thr Asp Gly Lys Pro
65 70 75 80 Val Thr Ser Ala Glu Pro Ala Gly Gln Glu Leu Gly Gly Arg Thr Trp
85 90 95 Ser Ser Arg Ser Ala Thr Leu Leu Arg Glu Leu Phe Gly Pro Pro Ser
100 105 110

<Desc/Clms Page number 131><Desc / Clms Page number 131>

Gly Arg Thr Ala Gly Gly Phe Gly Val Ser Phe Leu Pro Asp Leu Arg
115 120 125 Gly Pro Arg Thr Met Glu Gly Ala Ala Leu Ala Ala Arg Ala Thr Asn
130 135 140 Val Val Leu His Ala Thr Thr Asn Glu Thr Pro Pro Leu Asp Arg Leu 145 150 155 160 Ala Leu Arg Tyr Glu Ser Asp Lys Trp Gly Gly Val His Trp Phe Thr
165 170 175 Gly His Tyr Asp Arg His Leu Arg Ala Val Arg Asp Gln Ala Val Arg
180 185 190 Ile Leu Glu Ile Gly Ile Gly Gly Tyr Asp Asp Leu Leu Pro Ser Gly
195 200 205 Ala Ser Leu Lys Met Trp Lys Arg Tyr Phe Pro Arg Gly Leu Val Phe
210 215 220 Gly Val Asp Ile Phe Asp Ser Arg Arg Ala Thr Ser Arg Val Ser Arg 225 230 235 240 Arg Ser Ala Ala Arg Gln Asp Asp Pro Glu Phe Met Arg Arg Val Ala
245 250 255 Glu Glu His Gly Pro Phe Asp Val Ile Ile Asp Asp Gly Ser His Ile
260 265 270 Asn Ala His Met Arg Thr Ser Phe Ser Val Met Phe Pro His Leu Arg
275 280 285 Asn Gly Gly Phe Tyr Val Ile Glu Asp Thr Phe Thr Ser Tyr Trp Pro
290 295 300 Gly Tyr Gly Gly Pro Ser Gly Ala Arg Cys Pro Ser Gly Thr Thr Ala 305 310 315 320 Leu Glu Met Val Lys Gly Leu Ile Asp Ser Val His Tyr Glu Glu Arg
325 330 335 Pro Asp Gly Ala Ala Thr Ala Asp Tyr Ile Ala Arg Asn Leu Val Gly
340 345 350
Gly Arg Thr Ala Gly Gly Phe Gly Val Ser Phe Leu Pro Asp Leu Arg
115 120 125 Gly Pro Arg Thr Met Glu Gly Ala Ala Leu Ala Ala Arg Ala Thr Asn
130 135 140 Val Val Leu His Ala Thr Thr Asn Glu Thr Pro Pro Leu Asp Arg Leu 145 150 155 160 Ala Leu Arg Tyr Glu Ser Asp Lys Trp Gly Gly Val His Trp Phe Thr
165 170 175 Gly His Tyr Asp Arg His Leu Arg Ala Val Arg Asp Gln Ala Val Arg
180 185 190 Ile Leu Glu Ile Gly Ile Gly Gly Tyr Asp Asp Leu Leu Pro Ser Gly
195 200 205 Ala Ser Leu Lys Met Trp Lys Arg Tyr Phe Pro Arg Gly Leu Val Phe
210 215 220 Gly Val Asp Ile Phe Asp Ser Arg Arg Ala Thr Ser Arg Val Ser Arg 225 230 235 240 Arg Ser Ala Ala Arg Gln Asp Asp Pro Glu Phe Met Arg Arg Val Ala
245 250 255 Glu Glu His Gly Pro Phe Asp Val Ile Ile Asp Asp Gly Ser His Ile
260 265 270 Asn Ala His Met Arg Thr Ser Phe Ser Val Met Phe Pro His Leu Arg
275 280 285 Asn Gly Gly Phe Tyr Val Ile Glu Asp Thr Phe Thr Ser Tyr Trp Pro
290 295 300 Gly Tyr Gly Gly Pro Ser Gly Ala Arg Cys Pro Ser Gly Thr Thr Ala 305 310 315 320 Leu Glu Met Val Lys Gly Leu Ile Asp Ser Val His Tyr Glu Glu Arg
325 330 335 Pro Asp Gly Ala Ala Thr Ala Asp Tyr Ile Ala Arg Asn Leu Val Gly
340 345 350

<Desc/Clms Page number 132><Desc / Clms Page number 132>

Leu His Ala Tyr Gln Thr Thr Ser Ser Ser Ser Arg Arg Ala Ile Asn
355 360 365 Lys Glu Gly Gly Ile Pro His Thr Val Pro Arg Glu Pro Phe Trp Asn
370 375 380 Asp Asn 385 (2) INFORMATIONS POUR LA SEQ ID NO: 20 : (i) CARACTERISTIQUES DE LA SEQUENCE : (A) LONGUEUR : 738 paires de bases (B) TYPE : (C) NOMBRE DE BRINS : (D) CONFIGURATION : lin aire(ii) TYPE DE MOLECULE : ADN(g nomique) (vi) ORIGINE: (A) ORGANISME : Streptomyces antibioticus (ix) CARACTERISTIQUE: (A) NOM/CLE : CDS (B) EMPLACEMENT:1..738 (D) AUTRES INFORMATIONS:/gene= "oleM" /note= "SEQ ID NO 15 DE 3992 A 4729" (ix) CARACTERISTIQUE: (A) NOM/CLE: mat~peptide (B) EMPLACEMENT : (xi) DESCRIPTION DE LA SEQUENCE : SEQ ID NO: 20 : ATG CGG GCT GAC ACG GAG CCG ACC ACC GGG TAC GAG GAC GAG TTC GCC 48 Met Arg Ala Asp Thr Glu Pro Thr Thr Gly Tyr Glu Asp Glu Phe Ala 1 5 10 15 GAG ATC TAC GAC GCC GTG TAC CGG GGC CGG GGC AAG GAC TAC GCC GGC 96 Glu Ile Tyr Asp Ala Val Tyr Arg Gly Arg Gly Lys Asp Tyr Ala Gly
20 25 30 GAG GCG AAG GAC GTG GCG GAC CTC GTG CGC GAC CGG GTG CCG GAC GCG 144 Glu Ala Lys Asp Val Ala Asp Leu Val Arg Asp Arg Val Pro Asp Ala
35 40 45
Leu His Ala Tyr Gln Thr Thr Ser Ser Ser Ser Arg Arg Ala Ile Asn
355 360 365 Lys Glu Gly Gly Ile Pro His Thr Val Pro Arg Glu Pro Phe Trp Asn
370 375 380 Asp Asn 385 (2) INFORMATION FOR SEQ ID NO: 20: (i) CHARACTERISTICS OF THE SEQUENCE: (A) LENGTH: 738 base pairs (B) TYPE: (C) NUMBER OF STRANDS: (D) CONFIGURATION: linear (ii) TYPE OF MOLECULE: DNA (g nomic) (vi) ORIGIN: (A) ORGANISM: Streptomyces antibioticus (ix) CHARACTERISTIC: (A) NAME / KEY: CDS (B) LOCATION: 1..738 (D) OTHER INFORMATION: / gene = "oleM" / note = "SEQ ID NO 15 FROM 3992 TO 4729" (ix) CHARACTERISTIC: (A) NAME / KEY: mat ~ peptide (B) LOCATION: (xi) DESCRIPTION OF LA SEQUENCE: SEQ ID NO: 20: ATG CGG GCT GAC ACG GAG CCG ACC ACC GGG TAC GAG GAC GAG TTC GCC 48 Met Arg Ala Asp Thr Glu Pro Thr Thr Gly Tyr Glu Asp Glu Phe Ala 1 5 10 15 GAG ATC TAC GAC GCC GTG TAC CGG GGC CGG GGC AAG GAC TAC GCC GGC 96 Glu Ile Tyr Asp Ala Val Tyr Arg Gly Arg Gly Lys Asp Tyr Ala Gly
20 25 30 GAG GCG AAG GAC GTG GCG GAC CTC GTG CGC GAC CGG GTG CCG GAC GCG 144 Glu Ala Lys Asp Val Ala Asp Leu Val Arg Asp Arg Val Pro Asp Ala
35 40 45

<Desc/Clms Page number 133><Desc / Clms Page number 133>

TCC TCC CTC CTG GAC GTG GCC TGC GGC ACG GGC GCG CAC CTG CGG CAC 192 Ser Ser Leu Leu Asp Val Ala Cys Gly Thr Gly Ala His Leu Arg His
50 55 60 TTC GCC ACG CTC TTC GAC GAC GCC CGC GGT CTC GAA CTG TCC GCG AGC 240 Phe Ala Thr Leu Phe Asp Asp Ala Arg Gly Leu Glu Leu Ser Ala Ser
65 70 75 80 ATG CTG GAC ATC GCC CGC TCC CGC ATG CCG GGC GTG CCG CTG CAC CAA 288 Met Leu Asp Ile Ala Arg Ser Arg Met Pro Gly Val Pro Leu His Gln
85 90 95 GGG GAC ATG CGA TCC TTC GAC CTG GGG CCA CGC GTC TCC GCG GTC ACC 336 Gly Asp Met Arg Ser Phe Asp Leu Gly Pro Arg Val Ser Ala Val Thr
100 105 110 TGC ATG TTC AGC TCC GTC GGC CAC CTG GCC ACC ACC GCC GAA CTC GAC 384 Cys Met Phe Ser Ser Val Gly His Leu Ala Thr Thr Ala Glu Leu Asp
115 120 125 GCG ACG CTG CGG TGC TTC GCC CGG CAC ACC CGG CCC GGC GGC GTG GCC 432 Ala Thr Leu Arg Cys Phe Ala Arg His Thr Arg Pro Gly Gly Val Ala
130 135 140 GTC ATC GAA CCG TGG TGG TTC CCG GAG ACC TTC ACC GAC GGC TAC GTG 480 Val Ile Glu Pro Trp Trp Phe Pro Glu Thr Phe Thr Asp Gly Tyr Val 145 150 155 160 GCG GGT GAC ATC GTA CGC GTC GAC GGC CGG ACC ATC TCC CGG GTG TCC 528 Ala Gly Asp Ile Val Arg Val Asp Gly Arg Thr Ile Ser Arg Val Ser
165 170 175 CAC TCG GTA CGG GAC GGC GGC GCC ACC CGC ATG GAG ATC CAC TAC GTG 576 His Ser Val Arg Asp Gly Gly Ala Thr Arg Met Glu Ile His Tyr Val
180 185 190 ATC GCC GAC GCC GAG CAC GGT CCC CGG CAC CTG GTC GAG CAC CAC CGC 624 Ile Ala Asp Ala Glu His Gly Pro Arg His Leu Val Glu His His Arg
195 200 205 ATC ACG CTG TTC CCG CGG CAT GCG TAC ACG GCC GCG TAC GAG AAG GCG 672 Ile Thr Leu Phe Pro Arg His Ala Tyr Thr Ala Ala Tyr Glu Lys Ala
210 215 220
TCC TCC CTC CTG GAC GTG GCC TGC GGC ACG GGC GCG CAC CTG CGG CAC 192 Ser Ser Leu Leu Asp Val Ala Cys Gly Thr Gly Ala His Leu Arg His
50 55 60 TTC GCC ACG CTC TTC GAC GAC GCC CGC GGT CTC GAA CTG TCC GCG AGC 240 Phe Ala Thr Leu Phe Asp Asp Ala Arg Gly Leu Glu Leu Ser Ala Ser
65 70 75 80 ATG CTG GAC ATC GCC CGC TCC CGC ATG CCG GGC GTG CCG CTG CAC CAA 288 Met Leu Asp Ile Ala Arg Ser Arg Met Pro Gly Val Pro Leu His Gln
85 90 95 GGG GAC ATG CGA TCC TTC GAC CTG GGG CCA CGC GTC TCC GCG GTC ACC 336 Gly Asp Met Arg Ser Phe Asp Leu Gly Pro Arg Val Ser Ala Val Thr
100 105 110 TGC ATG TTC AGC TCC GTC GGC CAC CTG GCC ACC ACC GCC GAA CTC GAC 384 Cys Met Phe Ser Ser Val Gly His Leu Ala Thr Thr Ala Glu Leu Asp
115 120 125 GCG ACG CTG CGG TGC TTC GCC CGG CAC ACC CGG CCC GGC GGC GTG GCC 432 Ala Thr Leu Arg Cys Phe Ala Arg His Thr Arg Pro Gly Gly Val Ala
130 135 140 GTC ATC GAA CCG TGG TGG TTC CCG GAG ACC TTC ACC GAC GGC TAC GTG 480 Val Ile Glu Pro Trp Trp Phe Pro Glu Thr Phe Thr Asp Gly Tyr Val 145 150 155 160 GCG GGT GAC ATC GTA CGC GTC GAC GGC CGG ACC ATC TCC CGG GTG TCC 528 Ala Gly Asp Ile Val Arg Val Asp Gly Arg Thr Ile Ser Arg Val Ser
165 170 175 CAC TCG GTA CGG GAC GGC GGC GCC ACC CGC ATG GAG ATC CAC TAC GTG 576 His Ser Val Arg Asp Gly Gly Ala Thr Arg Met Glu Ile His Tyr Val
180 185 190 ATC GCC GAC GCC GAG CAC GGT CCC CGG CAC CTG GTC GAG CAC CAC CGC 624 Ile Ala Asp Ala Glu His Gly Pro Arg His Leu Val Glu His His Arg
195 200 205 ATC ACG CTG TTC CCG CGG CAT GCG TAC ACG GCC GCG TAC GAG AAG GCG 672 Ile Thr Leu Phe Pro Arg His Ala Tyr Thr Ala Ala Tyr Glu Lys Ala
210 215 220

<Desc/Clms Page number 134><Desc / Clms Page number 134>

GGC TAC ACC GTC GAG TAC CTC GAC GGC GGG CCC TCG GGC CGG GGG CTG 720 Gly Tyr Thr Val Glu Tyr Leu Asp Gly Gly Pro Ser Gly Arg Gly Leu 225 230 235 240 TTC GTC GGC ACC CGG ACG 738 Phe Val Gly Thr Arg Thr
245 (2) INFORMATIONS POUR LA SEQ ID NO: 21 : (i) CARACTERISTIQUES DE LA SEQUENCE: (A) LONGUEUR : 246 acides amin s (B) TYPE : amin (D) CONFIGURATION : lin aire(ii) TYPE DE MOLECULE : (xi) DESCRIPTION DE LA SEQUENCE : ID NO: 21 : Met Arg Ala Asp Thr Glu Pro Thr Thr Gly Tyr Glu Asp Glu Phe Ala
1 5 10 15 Glu Ile Tyr Asp Ala Val Tyr Arg Gly Arg Gly Lys Asp Tyr Ala Gly
20 25 30 Glu Ala Lys Asp Val Ala Asp Leu Val Arg Asp Arg Val Pro Asp Ala
35 40 45 Ser Ser Leu Leu Asp Val Ala Cys Gly Thr Gly Ala His Leu Arg His
50 55 60 Phe Ala Thr Leu Phe Asp Asp Ala Arg Gly Leu Glu Leu Ser Ala Ser
65 70 75 80 Met Leu Asp Ile Ala Arg Ser Arg Met Pro Gly Val Pro Leu His Gln
85 90 95 Gly Asp Met Arg Ser Phe Asp Leu Gly Pro Arg Val Ser Ala Val Thr
100 105 110 Cys Met Phe Ser Ser Val Gly His Leu Ala Thr Thr Ala Glu Leu Asp
115 120 125 Ala Thr Leu Arg Cys Phe Ala Arg His Thr Arg Pro Gly Gly Val Ala
130 135 140
GGC TAC ACC GTC GAG TAC CTC GAC GGC GGG CCC TCG GGC CGG GGG CTG 720 Gly Tyr Thr Val Glu Tyr Leu Asp Gly Gly Pro Ser Gly Arg Gly Leu 225 230 235 240 TTC GTC GGC ACC CGG ACG 738 Phe Val Gly Thr Arg Thr
245 (2) INFORMATION FOR SEQ ID NO: 21: (i) CHARACTERISTICS OF THE SEQUENCE: (A) LENGTH: 246 amino acids (B) TYPE: amin (D) CONFIGURATION: flax (ii) TYPE OF MOLECULE: (xi) DESCRIPTION OF THE SEQUENCE: ID NO: 21: Met Arg Ala Asp Thr Glu Pro Thr Thr Gly Tyr Glu Asp Glu Phe Ala
1 5 10 15 Glu Ile Tyr Asp Ala Val Tyr Arg Gly Arg Gly Lys Asp Tyr Ala Gly
20 25 30 Glu Ala Lys Asp Val Ala Asp Leu Val Arg Asp Arg Val Pro Asp Ala
35 40 45 Ser Ser Leu Leu Asp Val Ala Cys Gly Thr Gly Ala His Leu Arg His
50 55 60 Phe Ala Thr Leu Phe Asp Asp Ala Arg Gly Leu Glu Leu Ser Ala Ser
65 70 75 80 Met Leu Asp Ile Ala Arg Ser Arg Met Pro Gly Val Pro Leu His Gln
85 90 95 Gly Asp Met Arg Ser Phe Asp Leu Gly Pro Arg Val Ser Ala Val Thr
100 105 110 Cys Met Phe Ser Ser Val Gly His Leu Ala Thr Thr Ala Glu Leu Asp
115 120 125 Ala Thr Leu Arg Cys Phe Ala Arg His Thr Arg Pro Gly Gly Val Ala
130 135 140

<Desc/Clms Page number 135><Desc / Clms Page number 135>

Val Ile Glu Pro Trp Trp Phe Pro Glu Thr Phe Thr Asp Gly Tyr Val 145 150 155 160 Ala Gly Asp Ile Val Arg Val Asp Gly Arg Thr Ile Ser Arg Val Ser
165 170 175 His Ser Val Arg Asp Gly Gly Ala Thr Arg Met Glu Ile His Tyr Val
180 185 190 Ile Ala Asp Ala Glu His Gly Pro Arg His Leu Val Glu His His Arg
195 200 205 Ile Thr Leu Phe Pro Arg His Ala Tyr Thr Ala Ala Tyr Glu Lys Ala
210 215 220 Gly Tyr Thr Val Glu Tyr Leu Asp Gly Gly Pro Ser Gly Arg Gly Leu 225 230 235 240 Phe Val Gly Thr Arg Thr
245 (2) INFORMATIONS POUR LA SEQ ID NO: 22 : (i) CARACTERISTIQUES DE LA SEQUENCE : (A) LONGUEUR : 19 paires de bases (B) TYPE : (C) NOMBRE DE BRINS : (D) CONFIGURATION : linéaire(ii) TYPE DE MOLECULE : acide nucléique (A) DESCRIPTION : /desc = "OLIGONUCLEOTIDE" (xi) DESCRIPTION DE LA SEQUENCE : ID NO: 22 : TCCTCGATGG AGACCTGCC 19 (2) INFORMATIONS POUR LA SEQ ID NO: 23 : (i) CARACTERISTIQUES DE LA SEQUENCE : (A) LONGUEUR : paires de bases (B) TYPE : (C) NOMBRE DE BRINS : (D) CONFIGURATION : linéaire(ii) TYPE DE MOLECULE : acide nucléique
Val Ile Glu Pro Trp Trp Phe Pro Glu Thr Phe Thr Asp Gly Tyr Val 145 150 155 160 Ala Gly Asp Ile Val Arg Val Asp Gly Arg Thr Ile Ser Arg Val Ser
165 170 175 His Ser Val Arg Asp Gly Gly Ala Thr Arg Met Glu Ile His Tyr Val
180 185 190 Ile Ala Asp Ala Glu His Gly Pro Arg His Leu Val Glu His His Arg
195 200 205 Ile Thr Leu Phe Pro Arg His Ala Tyr Thr Ala Ala Tyr Glu Lys Ala
210 215 220 Gly Tyr Thr Val Glu Tyr Leu Asp Gly Gly Pro Ser Gly Arg Gly Leu 225 230 235 240 Phe Val Gly Thr Arg Thr
245 (2) INFORMATION FOR SEQ ID NO: 22: (i) CHARACTERISTICS OF THE SEQUENCE: (A) LENGTH: 19 base pairs (B) TYPE: (C) NUMBER OF STRANDS: (D) CONFIGURATION: linear (ii ) TYPE OF MOLECULE: nucleic acid (A) DESCRIPTION: / desc = "OLIGONUCLEOTIDE" (xi) DESCRIPTION OF THE SEQUENCE: ID NO: 22: TCCTCGATGG AGACCTGCC 19 (2) INFORMATION FOR THE SEQ ID NO: 23: (i) CHARACTERISTICS OF THE SEQUENCE: (A) LENGTH: base pairs (B) TYPE: (C) NUMBER OF STRANDS: (D) CONFIGURATION: linear (ii) TYPE OF MOLECULE: nucleic acid

<Desc/Clms Page number 136><Desc / Clms Page number 136>

(A) DESCRIPTION : /desc = "OLIGONUCLEOTIDE" (xi) DESCRIPTION DE LA SEQUENCE : ID NO: 23 : GAGACCATGC CCAGGGAGT 19 (2) INFORMATIONS POUR LA SEQ ID NO: 24 : (i) CARACTERISTIQUES DE LA SEQUENCE: (A) LONGUEUR : 19paires de bases (B) TYPE : (C) NOMBRE DE BRINS : (D) CONFIGURATION : linéaire(ii) TYPE DE MOLECULE : acide nucléique (A) DESCRIPTION: /desc * "OLIGONUCLEOTIDE" (xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 24 : TCTGGGAGCC GCTCACCTT 19 (2) INFORMATIONS POUR LA SEQ ID NO: 25 : (i) CARACTERISTIQUES DE LA SEQUENCE: (A) LONGUEUR : 19 paires de bases (B) TYPE: nucléotide (C) NOMBRE DE BRINS : (D) CONFIGURATION : linéaire(ii) TYPE DE MOLECULE : acide nucléique (A) DESCRIPTION: /desc = "OLIGONUCLEOTIDE" (xi) DESCRIPTION DE LA SEQUENCE : ID NO: 25 : GACGAGGCCG AAGAGGTGG 19 (2) INFORMATIONS POUR LA SEQ ID NO: 26 : (i) CARACTERISTIQUES DE LA SEQUENCE: (A) LONGUEUR : paires de bases (B) TYPE: nucléotide (C) NOMBRE DE BRINS : (D) CONFIGURATION :  (A) DESCRIPTION: / desc = "OLIGONUCLEOTIDE" (xi) DESCRIPTION OF THE SEQUENCE: ID NO: 23: GAGACCATGC CCAGGGAGT 19 (2) INFORMATION FOR THE SEQ ID NO: 24: (i) CHARACTERISTICS OF THE SEQUENCE: (A) LENGTH: 19pairs of bases (B) TYPE: (C) NUMBER OF STRANDS: (D) CONFIGURATION: linear (ii) TYPE OF MOLECULE: nucleic acid (A) DESCRIPTION: / desc * "OLIGONUCLEOTIDE" (xi) DESCRIPTION OF THE SEQUENCE : SEQ ID NO: 24: TCTGGGAGCC GCTCACCTT 19 (2) INFORMATION FOR SEQ ID NO: 25: (i) CHARACTERISTICS OF THE SEQUENCE: (A) LENGTH: 19 base pairs (B) TYPE: nucleotide (C) NUMBER OF STRANDS: (D) CONFIGURATION: linear (ii) TYPE OF MOLECULE: nucleic acid (A) DESCRIPTION: / desc = "OLIGONUCLEOTIDE" (xi) DESCRIPTION OF THE SEQUENCE: ID NO: 25: GACGAGGCCG AAGAGGTGG 19 (2) INFORMATION FOR THE SEQ ID NO: 26: (i) CHARACTERISTICS OF THE SEQUENCE: (A) LENGTH: base pairs (B) TYPE: nucleotide (C) NUMBER OF STRANDS: (D) CONFIGURATION:

<Desc/Clms Page number 137><Desc / Clms Page number 137>

linéaire(ii) TYPE DE MOLECULE : acide nucléique (A) DESCRIPTION : /desc = "OLIGONUCLEOTIDE" (xi) DESCRIPTION DE LA SEQUENCE : ID NO: 26 : GCACACCGGA ATGGATGCG 19 (2) INFORMATIONS POUR LA SEQ ID NO: 27 : (i) CARACTERISTIQUES DE LA SEQUENCE: (A) LONGUEUR : paires de bases (B) TYPE: nucléotide (C) NOMBRE DE BRINS : (D) CONFIGURATION : linéaire(ii) TYPE DE MOLECULE : acide nucléique (A) DESCRIPTION : /desc = "OLIGONUCLEOTIDE" (xi) DESCRIPTION DE LA SEQUENCE : ID NO: 27 : CCGTCGAGCT CTGAGGTAA 19 (2) INFORMATIONS POUR LA SEQ ID NO: 28 : (i) CARACTERISTIQUES DE LA SEQUENCE: (A) LONGUEUR : paires de bases (B) TYPE: nucléotide (C) NOMBRE DE BRINS : (D) CONFIGURATION : linéaire(ii) TYPE DE MOLECULE : acide nucléique (A) DESCRIPTION: /desc = "OLIGONUCLEOTIDE" (xi) DESCRIPTION DE LA SEQUENCE : SEQ ID NO: 28 : GCCCGAGCCG CACGTGCGT 19 (2) INFORMATIONS POUR LA SEQ ID NO: 29 : (i) CARACTERISTIQUES DE LA SEQUENCE: (A) LONGUEUR : paires de bases (B) TYPE : nucléotide (C) NOMBRE DE BRINS :  linear (ii) TYPE OF MOLECULE: nucleic acid (A) DESCRIPTION: / desc = "OLIGONUCLEOTIDE" (xi) DESCRIPTION OF THE SEQUENCE: ID NO: 26: GCACACCGGA ATGGATGCG 19 (2) INFORMATION FOR THE SEQ ID NO: 27: ( i) CHARACTERISTICS OF THE SEQUENCE: (A) LENGTH: base pairs (B) TYPE: nucleotide (C) NUMBER OF STRANDS: (D) CONFIGURATION: linear (ii) TYPE OF MOLECULE: nucleic acid (A) DESCRIPTION: / desc = "OLIGONUCLEOTIDE" (xi) SEQUENCE DESCRIPTION: ID NO: 27: CCGTCGAGCT CTGAGGTAA 19 (2) INFORMATION FOR SEQ ID NO: 28: (i) CHARACTERISTICS OF THE SEQUENCE: (A) LENGTH: base pairs (B ) TYPE: nucleotide (C) NUMBER OF STRANDS: (D) CONFIGURATION: linear (ii) TYPE OF MOLECULE: nucleic acid (A) DESCRIPTION: / desc = "OLIGONUCLEOTIDE" (xi) DESCRIPTION OF THE SEQUENCE: SEQ ID NO: 28 : GCCCGAGCCG CACGTGCGT 19 (2) INFORMATION FOR SEQ ID NO: 29: (i) CHARACTERISTICS OF THE SEQUENCE: (A) LENGTH: base pairs (B) TYPE: nucleotide (C) NUMBER OF STRANDS:

<Desc/Clms Page number 138><Desc / Clms Page number 138>

(D) CONFIGURATION : linéaire(ii) TYPE DE MOLECULE : acide nucléique (A) DESCRIPTION : /desc = "OLIGONUCLEOTIDE" (xi) DESCRIPTION DE LA SEQUENCE : ID NO: 29 : TGCACGCGCT GCTGCCGACC 20 (2) INFORMATIONS POUR LA SEQ ID NO: 30 : (i) CARACTERISTIQUES DE LA SEQUENCE: (A) LONGUEUR : 20 paires de bases (B) TYPE: nucléotide (C) NOMBRE DE BRINS : (D) CONFIGURATION : linéaire(ii) TYPE DE MOLECULE : acide nucléique (A) DESCRIPTION: /desc = "OLIGONUCLEOTIDE" (xi) DESCRIPTION DE LA SEQUENCE : SEQ ID NO: 30 : TTGGCGAAGT CGACCAGGTC 20 (2) INFORMATIONS POUR LA SEQ ID NO: 31 : (i) CARACTERISTIQUES DE LA SEQUENCE: (A) LONGUEUR : paires de bases (B) TYPE: nucléotide (C) NOMBRE DE BRINS : (D) CONFIGURATION : linéaire(ii) TYPE DE MOLECULE : acide nucléique (A) DESCRIPTION: /desc = "OLIGONUCLEOTIDE" (xi) DESCRIPTION DE LA SEQUENCE : ID NO: 31 : GCCGCTCGGC ACGGTGAACT TCA 23 (2) INFORMATIONS POUR LA SEQ ID NO: 32 : (i) CARACTERISTIQUES DE LA SEQUENCE: (A) LONGUEUR : 24 paires de bases  (D) CONFIGURATION: linear (ii) TYPE OF MOLECULE: nucleic acid (A) DESCRIPTION: / desc = "OLIGONUCLEOTIDE" (xi) DESCRIPTION OF THE SEQUENCE: ID NO: 29: TGCACGCGCT GCTGCCGACC 20 (2) INFORMATION FOR THE SEQ ID NO: 30: (i) CHARACTERISTICS OF THE SEQUENCE: (A) LENGTH: 20 base pairs (B) TYPE: nucleotide (C) NUMBER OF STRANDS: (D) CONFIGURATION: linear (ii) TYPE OF MOLECULE: nucleic acid ( A) DESCRIPTION: / desc = "OLIGONUCLEOTIDE" (xi) DESCRIPTION OF THE SEQUENCE: SEQ ID NO: 30: TTGGCGAAGT CGACCAGGTC 20 (2) INFORMATION FOR SEQ ID NO: 31: (i) CHARACTERISTICS OF THE SEQUENCE: (A) LENGTH: base pairs (B) TYPE: nucleotide (C) NUMBER OF STRANDS: (D) CONFIGURATION: linear (ii) TYPE OF MOLECULE: nucleic acid (A) DESCRIPTION: / desc = "OLIGONUCLEOTIDE" (xi) DESCRIPTION OF THE SEQUENCE: ID NO: 31: GCCGCTCGGC ACGGTGAACT TCA 23 (2) INFORMATION FOR SEQ ID NO: 32: (i) CHARACTERISTICS OF THE SEQUENCE: (A) LENGTH: 24 base pairs

<Desc/Clms Page number 139><Desc / Clms Page number 139>

(B) TYPE: nucléotide (C) NOMBRE DE BRINS: simple - (D) CONFIGURATION : linéaire(ii) TYPE DE MOLECULE : acide nucléique (A) DESCRIPTION: /desc - "OLIGONUCLEOTIDE" (xi) DESCRIPTION DE LA SEQUENCE : ID NO: 32 : ATGCGCGTCG TCTTCTCCTC CATG 24 (2) INFORMATIONS POUR LA SEQ ID NO: 33 : (i) CARACTERISTIQUES DE LA SEQUENCE : (A) LONGUEUR : 21 paires de bases (B) TYPE: nucléotide (C) NOMBRE DE BRINS : (D) CONFIGURATION : linéaire(ii) TYPE DE MOLECULE : acide nucléique (A) DESCRIPTION: /desc - "OLIGONUCLEOTIDE" (xi) DESCRIPTION DE LA SEQUENCE : ID NO: 33 : TCATCGTGGT TCTCTCCTTC C 21 (2) INFORMATIONS POUR LA SEQ ID NO: 34 : (i) CARACTERISTIQUES DE LA SEQUENCE : (A) LONGUEUR : 23 paires de bases (B) TYPE: nucléotide (C) NOMBRE DE BRINS : (D) CONFIGURATION : linéaire(ii) TYPE DE MOLECULE : acide nucléique (A) DESCRIPTION : /desc = "OLIGONUCLEOTIDE" (xi) DESCRIPTION DE LA SEQUENCE : SEQ ID NO: 34 : GGAATTCATG ACCACGACCG ATC 23 (2) INFORMATIONS POUR LA SEQ ID NO: 35 :  (B) TYPE: nucleotide (C) NUMBER OF STRANDS: simple - (D) CONFIGURATION: linear (ii) TYPE OF MOLECULE: nucleic acid (A) DESCRIPTION: / desc - "OLIGONUCLEOTIDE" (xi) DESCRIPTION OF THE SEQUENCE: ID NO: 32: ATGCGCGTCG TCTTCTCCTC CATG 24 (2) INFORMATION FOR SEQ ID NO: 33: (i) CHARACTERISTICS OF THE SEQUENCE: (A) LENGTH: 21 base pairs (B) TYPE: nucleotide (C) NUMBER OF STRANDS: (D) CONFIGURATION: linear (ii) TYPE OF MOLECULE: nucleic acid (A) DESCRIPTION: / desc - "OLIGONUCLEOTIDE" (xi) DESCRIPTION OF THE SEQUENCE: ID NO: 33: TCATCGTGGT TCTCTCCTTC C 21 (2) INFORMATION FOR THE SEQ ID NO: 34: (i) CHARACTERISTICS OF THE SEQUENCE: (A) LENGTH: 23 base pairs (B) TYPE: nucleotide (C) NUMBER OF STRANDS: (D) CONFIGURATION: linear (ii) TYPE OF MOLECULE: nucleic acid (A) DESCRIPTION: / desc = "OLIGONUCLEOTIDE" (xi) DESCRIPTION OF THE SEQUENCE: SEQ ID NO: 34: GGAATTCATG ACCACGACCG ATC 23 (2) INFORMATION FOR SEQ ID NO: 35:

<Desc/Clms Page number 140><Desc / Clms Page number 140>

(i) CARACTERISTIQUES DE LA SEQUENCE: (A) LONGUEUR : 28 paires de bases (B) TYPE : (C) NOMBRE DE BRINS : (D) CONFIGURATION : linéaire(ii) TYPE DE MOLECULE : acide nucléique (A) DESCRIPTION: /desc = "OLIGONUCLEOTIDE" (xi) DESCRIPTION DE LA SEQUENCE : ID NO: 35 : CGCTCCAGGT GCAATGCCGG GTGCAGGC 28 (2) INFORMATIONS POUR LA SEQ ID NO: 36 : (i) CARACTERISTIQUES DE LA SEQUENCE: (A) LONGUEUR : paires de bases (B) TYPE : (C) NOMBRE DE BRINS : simple(D) CONFIGURATION : linéaire (ii) TYPE DE MOLECULE : acide nucléique (A) DESCRIPTION: /desc = "OLIGONUCLEOTIDE" (xi) DESCRIPTION DE LA SEQUENCE : ID NO: 36 : GATCACGCTC TTCGAGCGGC AG 22 (2) INFORMATIONS POUR LA SEQ ID NO: 37 : (i) CARACTERISTIQUES DE LA SEQUENCE: (A) LONGUEUR : paires de bases (B) TYPE : (C) NOMBRE DE BRINS : (D) CONFIGURATION : linéaire(ii) TYPE DE MOLECULE : acide nucléique (A) DESCRIPTION : /desc = "OLIGONUCLEOTIDE" (xi) DESCRIPTION DE LA SEQUENCE : ID NO: 37 : GAACTCGGTG GAGTCGATGT C 21  (i) CHARACTERISTICS OF THE SEQUENCE: (A) LENGTH: 28 base pairs (B) TYPE: (C) NUMBER OF STRANDS: (D) CONFIGURATION: linear (ii) TYPE OF MOLECULE: nucleic acid (A) DESCRIPTION: / desc = "OLIGONUCLEOTIDE" (xi) SEQUENCE DESCRIPTION: ID NO: 35: CGCTCCAGGT GCAATGCCGG GTGCAGGC 28 (2) INFORMATION FOR SEQ ID NO: 36: (i) CHARACTERISTICS OF THE SEQUENCE: (A) LENGTH: base pairs (B) TYPE: (C) NUMBER OF STRANDS: simple (D) CONFIGURATION: linear (ii) TYPE OF MOLECULE: nucleic acid (A) DESCRIPTION: / desc = "OLIGONUCLEOTIDE" (xi) DESCRIPTION OF THE SEQUENCE: ID NO: 36: GATCACGCTC TTCGAGCGGC AG 22 (2) INFORMATION FOR SEQ ID NO: 37: (i) CHARACTERISTICS OF THE SEQUENCE: (A) LENGTH: base pairs (B) TYPE: (C) NUMBER OF STRANDS: (D) CONFIGURATION : linear (ii) TYPE OF MOLECULE: nucleic acid (A) DESCRIPTION: / desc = "OLIGONUCLEOTIDE" (xi) DESCRIPTION OF THE SEQUENCE: ID NO: 37: GAACTCGGTG GAGTCGATGT C 21

<Desc/Clms Page number 141><Desc / Clms Page number 141>

(2) INFORMATIONS POUR LA SEQ ID NO: 38 : (i) CARACTERISTIQUES DE LA SEQUENCE : (A) LONGUEUR : paires de bases (B) TYPE: nucléotide (C) NOMBRE DE BRINS: simple (D) CONFIGURATION : linéaire (ii) TYPE DE MOLECULE : acide nucléique (A) DESCRIPTION : /desc - "OLIGONUCLEOTIDE" (xi) DESCRIPTION DE LA SEQUENCE : ID NO: 38 : GTTGTCGATC AAGACCCGCA C 21 (2) INFORMATIONS POUR LA SEQ ID NO: 39 : (i) CARACTERISTIQUES DE LA SEQUENCE: (A) LONGUEUR : 22 paires de bases (B) TYPE: nucléotide (C) NOMBRE DE BRINS : simple(D) CONFIGURATION : linéaire (ii) TYPE DE MOLECULE : acide nucléique (A) DESCRIPTION: /desc = "OLIGONUCLEOTIDE" (xi) DESCRIPTION DE LA SEQUENCE : ID NO: 39 : CATCGTCAAG GAGTTCGACG GT 22 (2) INFORMATIONS POUR LA SEQ ID NO: 40 : (i) CARACTERISTIQUES DE LA SEQUENCE: (A) LONGUEUR : paires de bases (B) TYPE: nucléotide (C) NOMBRE DE BRINS : simple(D) CONFIGURATION : linéaire (ii) TYPE DE MOLECULE : acide nucléique (A) DESCRIPTION: /desc = "OLIGONUCLEOTIDE" (xi) DESCRIPTION DE LA SEQUENCE : ID NO: 40 : TGCGCAGGTC CATGTTCACC ACGTT 25  (2) INFORMATION FOR SEQ ID NO: 38: (i) CHARACTERISTICS OF THE SEQUENCE: (A) LENGTH: base pairs (B) TYPE: nucleotide (C) NUMBER OF STRANDS: simple (D) CONFIGURATION: linear (ii ) TYPE OF MOLECULE: nucleic acid (A) DESCRIPTION: / desc - "OLIGONUCLEOTIDE" (xi) DESCRIPTION OF THE SEQUENCE: ID NO: 38: GTTGTCGATC AAGACCCGCA C 21 (2) INFORMATION FOR THE SEQ ID NO: 39: (i) CHARACTERISTICS OF THE SEQUENCE: (A) LENGTH: 22 base pairs (B) TYPE: nucleotide (C) NUMBER OF STRANDS: simple (D) CONFIGURATION: linear (ii) TYPE OF MOLECULE: nucleic acid (A) DESCRIPTION: / desc = "OLIGONUCLEOTIDE" (xi) SEQUENCE DESCRIPTION: ID NO: 39: CATCGTCAAG GAGTTCGACG GT 22 (2) INFORMATION FOR SEQ ID NO: 40: (i) CHARACTERISTICS OF THE SEQUENCE: (A) LENGTH: base pairs ( B) TYPE: nucleotide (C) NUMBER OF STRANDS: simple (D) CONFIGURATION: linear (ii) TYPE OF MOLECULE: nucleic acid (A) DESCRIPTION: / desc = "OLIGONUCLEOTIDE" (xi) DESCRIPTION OF THE SEQUEN CE: ID NO: 40: TGCGCAGGTC CATGTTCACC ACGTT 25

<Desc/Clms Page number 142><Desc / Clms Page number 142>

(2) INFORMATIONS POUR LA SEQ ID NO: 41 : (i) CARACTERISTIQUES DE LA SEQUENCE: (A) LONGUEUR : 20 paires de bases (B) TYPE : nucléotide (C) NOMBRE DE BRINS : (D) CONFIGURATION : linéaire(ii) TYPE DE MOLECULE : acide nucléique (A) DESCRIPTION: /desc = "OLIGONUCLEOTIDE" (xi) DESCRIPTION DE LA SEQUENCE : SEQ ID NO: 41 : GCTACGCCCT GGAGAGCCTG 20 (2) INFORMATIONS POUR LA SEQ ID NO: 42 : (i) CARACTERISTIQUES DE LA SEQUENCE: (A) LONGUEUR : 21 paires de bases (B) TYPE : nucléotide (C) NOMBRE DE BRINS : (D) CONFIGURATION : linéaire(ii) TYPE DE MOLECULE : acide nucléique (A) DESCRIPTION: /desc = "OLIGONUCLEOTIDE" (xi) DESCRIPTION DE LA SEQUENCE : ID NO: 42 : GTCGCGGTCG GAGAGCACGA C 21 (2) INFORMATIONS POUR LA SEQ ID NO: 43: (i) CARACTERISTIQUES DE LA SEQUENCE : (A) LONGUEUR : 21 paires de bases (B) TYPE: nucléotide (C) NOMBRE DE BRINS : (D) CONFIGURATION : linéaire(ii) TYPE DE MOLECULE : acide nucléique (A) DESCRIPTION : /desc = "OLIGONUCLEOTIDE" (xi) DESCRIPTION DE LA SEQUENCE : SEQ ID NO: 43 : GCCAGCTCGG CGACGTCCAT C 21  (2) INFORMATION FOR SEQ ID NO: 41: (i) CHARACTERISTICS OF THE SEQUENCE: (A) LENGTH: 20 base pairs (B) TYPE: nucleotide (C) NUMBER OF STRANDS: (D) CONFIGURATION: linear (ii ) TYPE OF MOLECULE: nucleic acid (A) DESCRIPTION: / desc = "OLIGONUCLEOTIDE" (xi) DESCRIPTION OF THE SEQUENCE: SEQ ID NO: 41: GCTACGCCCT GGAGAGCCTG 20 (2) INFORMATION FOR SEQ ID NO: 42: (i) CHARACTERISTICS OF THE SEQUENCE: (A) LENGTH: 21 base pairs (B) TYPE: nucleotide (C) NUMBER OF STRANDS: (D) CONFIGURATION: linear (ii) TYPE OF MOLECULE: nucleic acid (A) DESCRIPTION: / desc = "OLIGONUCLEOTIDE" (xi) SEQUENCE DESCRIPTION: ID NO: 42: GTCGCGGTCG GAGAGCACGA C 21 (2) INFORMATION FOR SEQ ID NO: 43: (i) CHARACTERISTICS OF THE SEQUENCE: (A) LENGTH: 21 base pairs ( B) TYPE: nucleotide (C) NUMBER OF STRANDS: (D) CONFIGURATION: linear (ii) TYPE OF MOLECULE: nucleic acid (A) DESCRIPTION: / desc = "OLIGONUCLEOTIDE" (xi) DESCRIPTION OF THE SEQUENCE: SEQ ID N O: 43: GCCAGCTCGG CGACGTCCAT C 21

<Desc/Clms Page number 143><Desc / Clms Page number 143>

(2) INFORMATIONS POUR LA SEQ ID NO: 44 : (i) CARACTERISTIQUES DE LA SEQUENCE: (A) LONGUEUR : 19 paires de bases (B) TYPE : (C) NOMBRE DE BRINS : (D) CONFIGURATION : linéaire(ii) TYPE DE MOLECULE : acide nucléique (A) DESCRIPTION : /desc = "OLIGONUCLEOTIDE" (xi) DESCRIPTION DE LA SEQUENCE : ID NO: 44 : CGACGAGGTC GTGCATCAG 19 (2) INFORMATIONS POUR LA SEQ ID NO: 45 : (i) CARACTERISTIQUES DE LA SEQUENCE : (A) LONGUEUR : paires de bases (B) TYPE : (C) NOMBRE DE BRINS : (D) CONFIGURATION : linéaire(ii) TYPE DE MOLECULE : acide nucléique (A) DESCRIPTION : /desc = "OLIGONUCLEOTIDE" (xi) DESCRIPTION DE LA SEQUENCE : SEQ ID NO: 45 : AATTGATCAA GGTGAACACG GTCATGCGCA GGATCCTCGA GCGGAACTCC ATGGGG 56 (2) INFORMATIONS POUR LA SEQ ID NO: 46 : (i) CARACTERISTIQUES DE LA SEQUENCE: (A) LONGUEUR : paires de bases (B) TYPE : (C) NOMBRE DE BRINS : (D) CONFIGURATION : linéaire(ii) TYPE DE MOLECULE : acide nucléique (A) DESCRIPTION : /desc = "OLIGONUCLEOTIDE" (xi) DESCRIPTION DE LA SEQUENCE : ID NO: 46 : CCCCATGGAG TTCCGCTCGA GGATCCTGCG CATGACCGTG TTCACCTTGA TCAATT 56  (2) INFORMATION FOR SEQ ID NO: 44: (i) CHARACTERISTICS OF THE SEQUENCE: (A) LENGTH: 19 base pairs (B) TYPE: (C) NUMBER OF STRANDS: (D) CONFIGURATION: linear (ii) TYPE OF MOLECULE: nucleic acid (A) DESCRIPTION: / desc = "OLIGONUCLEOTIDE" (xi) DESCRIPTION OF THE SEQUENCE: ID NO: 44: CGACGAGGTC GTGCATCAG 19 (2) INFORMATION FOR SEQ ID NO: 45: (i) CHARACTERISTICS OF THE SEQUENCE: (A) LENGTH: base pairs (B) TYPE: (C) NUMBER OF STRANDS: (D) CONFIGURATION: linear (ii) TYPE OF MOLECULE: nucleic acid (A) DESCRIPTION: / desc = "OLIGONUCLEOTIDE" ( xi) DESCRIPTION OF THE SEQUENCE: SEQ ID NO: 45: AATTGATCAA GGTGAACACG GTCATGCGCA GGATCCTCGA GCGGAACTCC ATGGGG 56 (2) INFORMATION FOR SEQ ID NO: 46: (i) CHARACTERISTICS OF THE SEQUENCE: (A) LENGTH: base pairs (B ) TYPE: (C) NUMBER OF STRANDS: (D) CONFIGURATION: linear (ii) TYPE OF MOLECULE: nucleic acid (A) DESCRIPTION: / desc = "OLIGONUCLEOTIDE" (xi) DESCRIPTION OF THE SEQUENCE: ID NO: 46 : CCCCATGGAG TTCCGCTCGA GGATCCTGCG CATGACCGTG TTCACCTTGA TCAATT 56

<Desc/Clms Page number 144><Desc / Clms Page number 144>

(2) INFORMATIONS POUR LA SEQ ID NO: 47 : (i) CARACTERISTIQUES DE LA SEQUENCE : (A) LONGUEUR : paires de bases (B) TYPE : (C) NOMBRE DE BRINS : (D) CONFIGURATION : linéaire(ii) TYPE DE MOLECULE : acide nucléique (A) DESCRIPTION: /desc - "OLIGONUCLEOTIDE" (xi) DESCRIPTION DE LA SEQUENCE : ID NO: 47 : AACTCGGTGG AGTCGATGTC GTCGCTGCGG AA 32 (2) INFORMATIONS POUR LA SEQ ID NO: 48 : (i) CARACTERISTIQUES DE LA SEQUENCE: (A) LONGUEUR : paires de bases (B) TYPE : (C) NOMBRE DE BRINS : (D) CONFIGURATION : linéaire(ii) TYPE DE MOLECULE : acide nucléique (A) DESCRIPTION : /desc= "OLIGONUCLEOTIDE" (xi) DESCRIPTION DE LA SEQUENCE : SEQ ID NO: 48 : CAATATAGGA AGGATCAAGA GGTTGAC 27 (2) INFORMATIONS POUR LA SEQ ID NO: 49 : (i) CARACTERISTIQUES DE LA SEQUENCE : (A) LONGUEUR : 39 paires de bases (B) TYPE : nucléotide (C) NOMBRE DE BRINS : simple(D) CONFIGURATION : linéaire (ii) TYPE DE MOLECULE : acide nucléique (A) DESCRIPTION : /desc= "OLIGONUCLEOTIDE" (xi) DESCRIPTION DE LA SEQUENCE : SEQ ID NO: 49 : TCCGGAGGTG TGCTGTCGGA CGGACTTGTC GGTCGGAAA 39  (2) INFORMATION FOR SEQ ID NO: 47: (i) CHARACTERISTICS OF THE SEQUENCE: (A) LENGTH: base pairs (B) TYPE: (C) NUMBER OF STRANDS: (D) CONFIGURATION: linear (ii) TYPE OF MOLECULE: nucleic acid (A) DESCRIPTION: / desc - "OLIGONUCLEOTIDE" (xi) DESCRIPTION OF THE SEQUENCE: ID NO: 47: AACTCGGTGG AGTCGATGTC GTCGCTGCGG AA 32 (2) INFORMATION FOR SEQ ID NO: 48: (i) CHARACTERISTICS OF THE SEQUENCE: (A) LENGTH: base pairs (B) TYPE: (C) NUMBER OF STRANDS: (D) CONFIGURATION: linear (ii) TYPE OF MOLECULE: nucleic acid (A) DESCRIPTION: / desc = "OLIGONUCLEOTIDE" (xi) DESCRIPTION OF THE SEQUENCE: SEQ ID NO: 48: CAATATAGGA AGGATCAAGA GGTTGAC 27 (2) INFORMATION FOR SEQ ID NO: 49: (i) CHARACTERISTICS OF THE SEQUENCE: (A) LENGTH: 39 base pairs (B) TYPE: nucleotide (C) NUMBER OF STRANDS: simple (D) CONFIGURATION: linear (ii) TYPE OF MOLECULE: nucleic acid (A) DESCRIPTION: / desc = "OLIGONUCLEOTIDE" (xi) DESCRIPTION OF THE SEQUENCE: SEQ ID NO : 49: TCCGGAGGTG TGCTGTCGGA CGGACTTGTC GGTCGGAAA 39

<Desc/Clms Page number 145><Desc / Clms Page number 145>

(2) INFORMATIONS POUR LA SEQ ID NO: 50 : (i) CARACTERISTIQUES DE LA SEQUENCE: (A) LONGUEUR : paires de bases (B) TYPE : (C) NOMBRE DE BRINS : (D) CONFIGURATION : linéaire(ii) TYPE DE MOLECULE : acide nucléique (A) DESCRIPTION: /desc - "OLIGONUCLEOTIDE" (xi) DESCRIPTION DE LA SEQUENCE : ID NO: 50 : AGGAGCACTA GTGCGGGTAC TGCTGACGTC CTT 33 (2) INFORMATIONS POUR LA SEQ ID NO: 51 : (i) CARACTERISTIQUES DE LA SEQUENCE: (A) LONGUEUR : paires de bases (B) TYPE : nucléotide (C) NOMBRE DE BRINS : (D) CONFIGURATION : (ii) TYPE DE MOLECULE : acide nucléique (A) DESCRIPTION: /desc = "OLIGONUCLEOTIDE" (xi) DESCRIPTION DE LA SEQUENCE : ID NO: 51 : GGGGGATCCC ATATGCGGGT ACTGCTGACG TCCTTCG 37 (2) INFORMATIONS POUR LA SEQ ID NO: 52 : (i) CARACTERISTIQUES DE LA SEQUENCE: (A) LONGUEUR : paires de bases (B) TYPE : (C) NOMBRE DE BRINS : (D) CONFIGURATION : linéaire(ii) TYPE DE MOLECULE : acide nucléique (A) DESCRIPTION: /desc = "OLIGONUCLEOTIDE" (xi) DESCRIPTION DE LA SEQUENCE : ID NO: 52 : GAAAAGATCT GCCGGCGTGG CGGCGCGTGA GTTCCTC 37 (2) INFORMATIONS POUR LA SEQ ID NO: 53 :  (2) INFORMATION FOR SEQ ID NO: 50: (i) CHARACTERISTICS OF THE SEQUENCE: (A) LENGTH: base pairs (B) TYPE: (C) NUMBER OF STRANDS: (D) CONFIGURATION: linear (ii) TYPE OF MOLECULE: nucleic acid (A) DESCRIPTION: / desc - "OLIGONUCLEOTIDE" (xi) SEQUENCE DESCRIPTION: ID NO: 50: AGGAGCACTA GTGCGGGTAC TGCTGACGTC CTT 33 (2) INFORMATION FOR SEQ ID NO: 51: (i) CHARACTERISTICS OF THE SEQUENCE: (A) LENGTH: base pairs (B) TYPE: nucleotide (C) NUMBER OF STRANDS: (D) CONFIGURATION: (ii) TYPE OF MOLECULE: nucleic acid (A) DESCRIPTION: / desc = "OLIGONUCLEOTIDE" (xi) DESCRIPTION OF THE SEQUENCE: ID NO: 51: GGGGGATCCC ATATGCGGGT ACTGCTGACG TCCTTCG 37 (2) INFORMATION FOR SEQ ID NO: 52: (i) CHARACTERISTICS OF THE SEQUENCE: (A) LENGTH: base pairs (B) TYPE : (C) NUMBER OF STRANDS: (D) CONFIGURATION: linear (ii) TYPE OF MOLECULE: nucleic acid (A) DESCRIPTION: / desc = "OLIGONUCLEOTIDE" (xi) DESCRIPTION OF THE SEQUENCE: ID NO: 52: GAAAAGATCT GCCGGCGTGG CGGCGCGTGA GTTCCTC 37 (2) INFORMATION FOR SEQ ID NO: 53:

<Desc/Clms Page number 146><Desc / Clms Page number 146>

(i) CARACTERISTIQUES DE LA SEQUENCE: (A) LONGUEUR : 27 paires de bases (B) TYPE : nucléotide (C) NOMBRE DE BRINS: simple (D) CONFIGURATION : linéaire(ii) TYPE DE MOLECULE: Autre acide nucléique (A) DESCRIPTION: /desc = "OLIGONUCLEOTIDE" (xi) DESCRIPTION DE LA SEQUENCE : SEQ ID NO: 53 : AGCGGCTTGA TCGTGTTGGA CCAGTAC 27 (2) INFORMATIONS POUR LA SEQ ID NO: 54: (i) CARACTERISTIQUES DE LA SEQUENCE: (A) LONGUEUR : 27 paires de bases (B) TYPE : (C) NOMBRE DE BRINS : (D) CONFIGURATION : linéaire(ii) TYPE DE MOLECULE: Autre acide nucléique (A) DESCRIPTION : /desc = "OLIGONUCLEOTIDE" (xi) DESCRIPTION DE LA SEQUENCE : SEQ ID NO: 54 : GGCCTATGTG GACTACGTGT TGAACGT 27 (2) INFORMATIONS POUR LA SEQ ID NO: 55 : (i) CARACTERISTIQUES DE LA SEQUENCE: (A) LONGUEUR : paires de bases (B) TYPE : (C) NOMBRE DE BRINS : (D) CONFIGURATION : linéaire(ii) TYPE DE MOLECULE : acide nucléique (A) DESCRIPTION : /desc * "OLIGONUCLEOTIDE" (xi) DESCRIPTION DE LA SEQUENCE : ID NO: 55 : AACGCCTCGT CCTGCAGCGG AGACACGAAC A 31 (2) INFORMATIONS POUR LA SEQ ID NO: 56 : (i) CARACTERISTIQUES DE LA SEQUENCE:  (i) CHARACTERISTICS OF THE SEQUENCE: (A) LENGTH: 27 base pairs (B) TYPE: nucleotide (C) NUMBER OF STRANDS: simple (D) CONFIGURATION: linear (ii) TYPE OF MOLECULE: Other nucleic acid (A) DESCRIPTION: / desc = "OLIGONUCLEOTIDE" (xi) SEQUENCE DESCRIPTION: SEQ ID NO: 53: AGCGGCTTGA TCGTGTTGGA CCAGTAC 27 (2) INFORMATION FOR SEQ ID NO: 54: (i) CHARACTERISTICS OF THE SEQUENCE: (A) LENGTH : 27 base pairs (B) TYPE: (C) NUMBER OF STRANDS: (D) CONFIGURATION: linear (ii) TYPE OF MOLECULE: Other nucleic acid (A) DESCRIPTION: / desc = "OLIGONUCLEOTIDE" (xi) DESCRIPTION OF THE SEQUENCE: SEQ ID NO: 54: GGCCTATGTG GACTACGTGT TGAACGT 27 (2) INFORMATION FOR SEQ ID NO: 55: (i) CHARACTERISTICS OF THE SEQUENCE: (A) LENGTH: base pairs (B) TYPE: (C) NUMBER OF STRANDS: (D) CONFIGURATION: linear (ii) TYPE OF MOLECULE: nucleic acid (A) DESCRIPTION: / desc * "OLIGONUCLEOTIDE" (xi) DESCRIPTION OF THE SEQUENCE: ID NO: 55: AACGCCTCGT CCTGCAGCGG AGACACG AAC A 31 (2) INFORMATION FOR SEQ ID NO: 56: (i) CHARACTERISTICS OF THE SEQUENCE:

<Desc/Clms Page number 147><Desc / Clms Page number 147>

(A) LONGUEUR : 27 paires de bases (B) TYPE: nucléotide (C) NOMBRE DE BRINS : (D) CONFIGURATION : linéaire(ii) TYPE DE MOLECULE : acide nucléique (A) DESCRIPTION: /desc - "OLIGONUCLEOTIDE" (xi) DESCRIPTION DE LA SEQUENCE : SEQ ID NO: 56 : TTCGCTCCCC GATGAACACA ACTCGTA 27 (2) INFORMATIONS POUR LA SEQ ID NO: 57 : (i) CARACTERISTIQUES DE LA SEQUENCE: (A) LONGUEUR : paires de bases (B) TYPE: nucléotide (C) NOMBRE DE BRINS : (D) CONFIGURATION : linéaire(ii) TYPE DE MOLECULE : acide nucléique (A) DESCRIPTION: /desc = "OLIGONUCLEOTIDE" (xi) DESCRIPTION DE LA SEQUENCE : SEQ ID NO: 57 : GAAGGAGATA TACATATGCG CGTCGTCTTC TCCTC 35 (2) INFORMATIONS POUR LA SEQ ID NO: 58 : (i) CARACTERISTIQUES DE LA SEQUENCE: (A) LONGUEUR : paires de bases (B) TYPE: nucléotide (C) NOMBRE DE BRINS : (D) CONFIGURATION : linéaire(ii) TYPE DE MOLECULE : acide nucléique (A) DESCRIPTION : /desc = "OLIGONUCLEOTIDE" (xi) DESCRIPTION DE LA SEQUENCE : ID NO: 58 : CGGGATCCTC ATCGTGGTTC TCTCCTTCCT GC 32 (2) INFORMATIONS POUR LA SEQ ID NO: 59 : (i) CARACTERISTIQUES DE LA SEQUENCE: (A) LONGUEUR : paires de bases  (A) LENGTH: 27 base pairs (B) TYPE: nucleotide (C) NUMBER OF STRANDS: (D) CONFIGURATION: linear (ii) TYPE OF MOLECULE: nucleic acid (A) DESCRIPTION: / desc - "OLIGONUCLEOTIDE" (xi ) DESCRIPTION OF THE SEQUENCE: SEQ ID NO: 56: TTCGCTCCCC GATGAACACA ACTCGTA 27 (2) INFORMATION FOR SEQ ID NO: 57: (i) CHARACTERISTICS OF THE SEQUENCE: (A) LENGTH: base pairs (B) TYPE: nucleotide (C) NUMBER OF STRANDS: (D) CONFIGURATION: linear (ii) TYPE OF MOLECULE: nucleic acid (A) DESCRIPTION: / desc = "OLIGONUCLEOTIDE" (xi) DESCRIPTION OF THE SEQUENCE: SEQ ID NO: 57: GAAGGAGATA TACATATGCG CGTCGTCTTC TCCTC 35 (2) INFORMATION FOR SEQ ID NO: 58: (i) CHARACTERISTICS OF THE SEQUENCE: (A) LENGTH: base pairs (B) TYPE: nucleotide (C) NUMBER OF STRANDS: (D) CONFIGURATION: linear ( ii) TYPE OF MOLECULE: nucleic acid (A) DESCRIPTION: / desc = "OLIGONUCLEOTIDE" (xi) SEQUENCE DESCRIPTION: ID NO: 58: CGGGATCCTC ATCGTGGTTC TCTCCTTCCT GC 32 (2) INFORMATION FOR SEQ ID NO: 59: (i) CHARACTERISTICS OF THE SEQUENCE: (A) LENGTH: base pairs

<Desc/Clms Page number 148><Desc / Clms Page number 148>

(B) TYPE : (C) NOMBRE DE BRINS : (D) CONFIGURATION : linéaire(ii) TYPE DE MOLECULE : acide nucléique (A) DESCRIPTION : /desc - "OLIGONUCLEOTIDE" (xi) DESCRIPTION DE LA SEQUENCE : ID NO: 59 : CGGGTACCAT GCGCGTCGTC TTCTCCTCCA TG 32 (2) INFORMATIONS POUR LA SEQ ID NO: 60 : (i) CARACTERISTIQUES DE LA SEQUENCE: (A) LONGUEUR : paires de bases (B) TYPE : (C) NOMBRE DE BRINS : (D) CONFIGURATION : linéaire(ii) TYPE DE MOLECULE : acide nucléique (A) DESCRIPTION: /desc = "OLIGONUCLEOTIDE" (xi) DESCRIPTION DE LA SEQUENCE : ID NO: 60 : CGGGTACCTC ATCGTGGTTC TCTCCTTCC 29 (2) INFORMATIONS POUR LA SEQ ID NO: 61 : (i) CARACTERISTIQUES DE LA SEQUENCE: (A) LONGUEUR : 13 acides aminés (B) TYPE : aminé (C) NOMBRE DE BRINS : (D) CONFIGURATION : linéaire(ii) TYPE DE MOLECULE : (ix) CARACTERISTIQUE: (A) NOM/CLE : Peptide (B) EMPLACEMENT:1..13 (D) AUTRES INFORMATIONS:/note= "SEQ ID NO 11 DE 38 A 50" (xi) DESCRIPTION DE LA SEQUENCE : ID NO: 61 :
Val Thr Gly Ala Gly Asp Gly Asp Ala Asp Val Gln Ala
1 5 10
(B) TYPE: (C) NUMBER OF STRANDS: (D) CONFIGURATION: linear (ii) TYPE OF MOLECULE: nucleic acid (A) DESCRIPTION: / desc - "OLIGONUCLEOTIDE" (xi) DESCRIPTION OF THE SEQUENCE: ID NO: 59 : CGGGTACCAT GCGCGTCGTC TTCTCCTCCA TG 32 (2) INFORMATION FOR SEQ ID NO: 60: (i) CHARACTERISTICS OF THE SEQUENCE: (A) LENGTH: base pairs (B) TYPE: (C) NUMBER OF STRANDS: (D) CONFIGURATION : linear (ii) TYPE OF MOLECULE: nucleic acid (A) DESCRIPTION: / desc = "OLIGONUCLEOTIDE" (xi) SEQUENCE DESCRIPTION: ID NO: 60: CGGGTACCTC ATCGTGGTTC TCTCCTTCC 29 (2) INFORMATION FOR SEQ ID NO: 61 : (i) CHARACTERISTICS OF THE SEQUENCE: (A) LENGTH: 13 amino acids (B) TYPE: amino (C) NUMBER OF STRANDS: (D) CONFIGURATION: linear (ii) TYPE OF MOLECULE: (ix) CHARACTERISTIC: (A ) NAME / KEY: Peptide (B) LOCATION: 1..13 (D) OTHER INFORMATION: / note = "SEQ ID NO 11 FROM 38 TO 50" (xi) DESCRIPTION OF THE SEQUENCE: ID NO: 61:
Val Thr Gly Ala Gly Asp Gly Asp Ala Asp Val Gln Ala
1 5 10

Claims (10)

REVENDICATIONS 1) Utilisation de la séquence d'ADN eryCIII représentée à la figure 2 (séquence complémentaire de SEQ ID N 1 du nucléotide 1046 au nucléotide 2308 = séquence complémentaire de SEQ ID N 4) comme sonde d'hybridation pour isoler des gènes homologues responsables de la glycosylation de la macrolactone chez une souche productrice de macrolide.  CLAIMS 1) Use of the DNA sequence eryCIII represented in FIG. 2 (sequence complementary to SEQ ID N 1 from nucleotide 1046 to nucleotide 2308 = sequence complementary to SEQ ID N 4) as a hybridization probe to isolate responsible homologous genes of macrolactone glycosylation in a macrolide producing strain. 2) Utilisation selon la revendication 1 dans laquelle les gènes homologues sont les gènes de la biosynthèse de l'oléandomycine chez S. antibioticus. 2) Use according to claim 1 wherein the homologous genes are the genes for the biosynthesis of oleandomycin in S. antibioticus. 3) Séquence d'ADN isolée représentée à la figure 22 (séquence de SEQ ID N 15) correspondant à une région du cluster de gènes de la biosynthèse de l'oléandomycine comprenant : - la séquence correspondant à l'ORF oleP1 du nucléotide 184 au nucléotide 1386, - la séquence correspondant à l'ORF oleGl du nucléotide 1437 au nucléotide 2714 codant pour une activité glycosyltransférase, - la séquence correspondant à l'ORF oleG2 du nucléotide 2722 au nucléotide 3999 codant pour une activité glycosyltransférase, - la séquence correspondant à l'ORF oleM du nucléotide 3992 au nucléotide 4720 (= séquence de SEQ ID N 20) et - la séquence correspondant à l'ORF oleY du nucléotide 4810 au nucléotide 5967. 3) Isolated DNA sequence represented in FIG. 22 (sequence of SEQ ID N 15) corresponding to a region of the gene cluster for the biosynthesis of oleandomycin comprising: - the sequence corresponding to the oleP1 ORF of nucleotide 184 at nucleotide 1386, - the sequence corresponding to the ORF oleGl from nucleotide 1437 to nucleotide 2714 coding for a glycosyltransferase activity, - the sequence corresponding to the ORF oleG2 from nucleotide 2722 to nucleotide 3999 coding for a glycosyltransferase activity, - the sequence corresponding to the oleM ORF from nucleotide 3992 to nucleotide 4720 (= sequence of SEQ ID N 20) and - the sequence corresponding to the oleY ORF from nucleotide 4810 to nucleotide 5967. 4) Séquence d'ADN isolée représentée à la figure 22 choisie parmi la séquence correspondant à l'ORF oleGl (séquence de SEQ ID N 15 du nucléotide 1437 au nucléotide 2714 codant pour une activité glycosyltransférase et la séquence correspondant à l'ORF oleG2 (séquence de SEQ ID N 15 du nucléotide 2722 au nucléotide 3999) codant pour une activité glycosyltransférase. 4) Isolated DNA sequence represented in FIG. 22 chosen from the sequence corresponding to the oleG1 ORF (sequence of SEQ ID N 15 from nucleotide 1437 to nucleotide 2714 coding for a glycosyltransferase activity and the sequence corresponding to the oleG2 ORF ( sequence of SEQ ID N 15 from nucleotide 2722 to nucleotide 3999) coding for glycosyltransferase activity. 5) Séquence d'ADN isolée selon la revendication 4 correspondant à l'ORF oleG1 (séquence de SEQ ID N 15 du nucléotide 1437 au nucléotide 2714) codant pour une activité désosaminyltransférase. 5) Isolated DNA sequence according to claim 4 corresponding to the ORF oleG1 (sequence of SEQ ID N 15 from nucleotide 1437 to nucleotide 2714) coding for a deosaminyltransferase activity. 6) Séquence d'ADN isolée selon la revendication 4 correspondant à l'ORF oleG2 (séquence de SEQ ID N 15 du 6) Isolated DNA sequence according to claim 4 corresponding to the oleG2 ORF (sequence of SEQ ID N 15 of <Desc/Clms Page number 150><Desc / Clms Page number 150> nucléotide 2722 au nucléotide 3999) codant pour une activité oléandrosyltransférase.  nucleotide 2722 to nucleotide 3999) coding for an oleandrosyltransferase activity. 7) Polypeptide codé par la séquence d'ADN correspondant à l'ORF oleG1 et ayant une activité désosaminyltransférase (séquence de SEQ ID N 17). 7) Polypeptide encoded by the DNA sequence corresponding to the oleG1 ORF and having a deosaminyltransferase activity (sequence of SEQ ID N 17). 8) Polypeptide codé par la séquence d'ADN correspondant à l'ORF oleG2 et ayant une activité oléandrosyltransférase (séquence de SEQ ID N 18). 8) Polypeptide encoded by the DNA sequence corresponding to the oleG2 ORF and having an oleandrosyltransferase activity (sequence of SEQ ID N 18). 9) Procédé de préparation de précurseurs de l'oléandomycine chez S. antibioticus dans lequel - on crée une altération de la séquence du gène choisie parmi la séquence d'ADN correspondant à l'ORF oleG1 (séquence de SEQ ID N 15 du nucléotide 1437 au nucléotide 2714) et la séquence d'ADN correspondant à l'ORF oleG2 (séquence de SEQ ID N 15 du nucléotide 2722 au nucléotide 3999) dans le chromosome d'une souche hôte et obtient une souche modifiée, - on cultive la souche modifiée dans des conditions permettant l'accumulation des précurseurs de l'oléandomycine et - on isole ces précurseurs. 9) Process for the preparation of oleandomycin precursors in S. antibioticus in which - an alteration of the gene sequence chosen from the DNA sequence corresponding to the ORF oleG1 (sequence of SEQ ID N 15 of nucleotide 1437) is created at nucleotide 2714) and the DNA sequence corresponding to the ORF oleG2 (sequence of SEQ ID N 15 from nucleotide 2722 to nucleotide 3999) in the chromosome of a host strain and obtains a modified strain, - the modified strain is cultivated under conditions allowing the accumulation of oleandomycin precursors and - these precursors are isolated. 10) Procédé selon la revendication 9 dans lequel l'altération est créée dans la séquence d'ADN correspondant à l'ORF oleG1 (séquence de SEQ ID N 15 du nucléotide 1437 au nucléotide 2714) et dont il résulte au moins l'élimination de l'activité désoaminyltransférase et l'accumulation du précurseur de l'oléandomycine 8,8a-désoxyoléandolide.10) Method according to claim 9 wherein the alteration is created in the DNA sequence corresponding to the ORF oleG1 (sequence of SEQ ID N 15 from nucleotide 1437 to nucleotide 2714) and from which it results at least the elimination of deoaminyltransferase activity and the accumulation of the precursor of oleandomycin 8,8a-deoxyoleandolide.
FR9903715A 1999-03-25 1999-03-25 GENES OF BIOSYNTHESIS AND TRANSFER OF 6-DESOXY-HEXOSES IN SACCHAROPOLYSPORA ERYTHRAEA AND IN STREPTOMYCES ANTIBIOTICUS AND THEIR USE Expired - Fee Related FR2786201B1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
FR9903715A FR2786201B1 (en) 1999-03-25 1999-03-25 GENES OF BIOSYNTHESIS AND TRANSFER OF 6-DESOXY-HEXOSES IN SACCHAROPOLYSPORA ERYTHRAEA AND IN STREPTOMYCES ANTIBIOTICUS AND THEIR USE

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
FR9903715A FR2786201B1 (en) 1999-03-25 1999-03-25 GENES OF BIOSYNTHESIS AND TRANSFER OF 6-DESOXY-HEXOSES IN SACCHAROPOLYSPORA ERYTHRAEA AND IN STREPTOMYCES ANTIBIOTICUS AND THEIR USE

Publications (2)

Publication Number Publication Date
FR2786201A1 true FR2786201A1 (en) 2000-05-26
FR2786201B1 FR2786201B1 (en) 2003-01-17

Family

ID=9543612

Family Applications (1)

Application Number Title Priority Date Filing Date
FR9903715A Expired - Fee Related FR2786201B1 (en) 1999-03-25 1999-03-25 GENES OF BIOSYNTHESIS AND TRANSFER OF 6-DESOXY-HEXOSES IN SACCHAROPOLYSPORA ERYTHRAEA AND IN STREPTOMYCES ANTIBIOTICUS AND THEIR USE

Country Status (1)

Country Link
FR (1) FR2786201B1 (en)

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1997023630A2 (en) * 1995-12-21 1997-07-03 Abbott Laboratories Polyketide-associated sugar biosynthesis genes

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1997023630A2 (en) * 1995-12-21 1997-07-03 Abbott Laboratories Polyketide-associated sugar biosynthesis genes

Non-Patent Citations (6)

* Cited by examiner, † Cited by third party
Title
KAO, C. ET AL.: "Engineered biosynthesis of a complete macrolactone in a heterologous host", SCIENCE, vol. 265, 22 July 1994 (1994-07-22), pages 509 - 512, XP002096257 *
LIU, H.-W. & THORSON, J.: "Pathways and mechanisms in the biogenesis of novel deoxysugars by bacteria", ANNUAL REVIEW OF MICROBIOLOGY, vol. 48, 1994, pages 223 - 256, XP002061259 *
MALPARTIDA F ET AL: "Homology between Streptomyces genes coding for synthesis of different polyketides used to clone antibiotic biosynthetic genes", NATURE, vol. 325, 26 February 1987 (1987-02-26), pages 818 - 821, XP002075972 *
OLANO C ET AL: "Analysis of a Streptomyces antibioticus chromosomal region involved in oleandomycin biosynthesis, which encodes two glycosyltransferases responsible for glycosylation of the macrolactone ring.", MOLECULAR AND GENERAL GENETICS, (1998 AUG) 259 (3) 299-308., XP002096258 *
QUIROS, L. & SALAS, J.: "Biosynthesis of the macrolide oleandomycin by Streptomyces antibioticus", JOURNAL OF BIOLOGICAL CHEMISTRY, (1995 AUG 4) 270 (31) 18234-9., vol. 270, 4 August 1995 (1995-08-04), pages 18234 - 18239, XP002096256 *
SWAN D G ET AL: "Characterisation of a Streptomyces antibioticus gene encoding a type I polyketide synthase which has an unusual coding sequence.", MOLECULAR AND GENERAL GENETICS, (1994 FEB) 242 (3) 358-62., XP002087278 *

Also Published As

Publication number Publication date
FR2786201B1 (en) 2003-01-17

Similar Documents

Publication Publication Date Title
CA2322449C (en) Biosynthetic genes for spinosyn insecticide production
AU758421B2 (en) Recombinant oleandolide polyketide synthase
WO1999005283A2 (en) Biosynthesis genes and transfer of 6-desoxy-hexoses in saccharopolyspora erythraea and in streptomyces antibioticus and their use
EP2271666B1 (en) Nrps-pks gene cluster and its manipulation and utility
JP2000515390A (en) Novel polyketide derivative and recombinant method for producing the same
JP2000502899A (en) Polyketide-linked sugar biosynthesis gene
US20170081690A1 (en) Moenomycin biosynthesis-related compositions and methods of use thereof
AU784995B2 (en) Novel genes encoding a nystatin polyketide synthase and their manipulation and utility
AU728870B2 (en) Isolation of the biosynthesis genes for pseudo- oligosaccharides from Streptomyces glaucescens GLA.O and their use
JPH10507087A (en) Vector producing high purity 6,12-dideoxyerythromycin A by fermentation and method thereof
Arisawa et al. Direct fermentative production of acyltylosins by genetically-engineered strains of Streptomyces fradiae
WO2002059322A9 (en) Compositions and methods relating to the daptomycin biosynthetic gene cluster
JP7086984B2 (en) Compositions and Methods for Enhancing Enduracididine Production in Recombinant strains of Streptomyces fungicidicus
KR100882692B1 (en) Biosynthetic Genes for Butenyl-Spinosyn Insecticide Production
FR2786200A1 (en) New nucleic acid sequences encoding enzymes involved in macrolide biosynthesis
FR2786201A1 (en) New nucleic acid sequences encoding enzymes involved in macrolide biosynthesis
FR2786189A1 (en) New nucleic acid sequences encoding enzymes involved in macrolide biosynthesis
US20040219645A1 (en) Polyketides and their synthesis
FR2766496A1 (en) New nucleic acid sequences encoding enzymes involved in macrolide biosynthesis
KR101110175B1 (en) Polypeptides involved in spiramycin biosynthesis, nucleotide sequences encoding said polypeptides and uses thereof
EP0792285B1 (en) Process for producing anthracyclines and intermediates thereof
JP2009502187A (en) Genes involved in thiocoralin biosynthesis and their heterologous production
JP2004089156A (en) Vicenistatin synthetase gene cluster, vicenisamine sugar transferase polypeptide and gene encoding the polypeptide
KR20000016470A (en) Method for isolating pseudo-oligosaccharide biosynthesizing gene from streptomyces glaucescens gla.o and usage of the same
MXPA00008811A (en) Biosynthetic genes for spinosyn insecticide production

Legal Events

Date Code Title Description
TP Transmission of property
ST Notification of lapse

Effective date: 20060228