WO1999031244A1 - NEUER TRANSKRIPTIONSFAKTOR CPCR1 ZUR REGULATION DES ISOPENICILLIN N-SYNTHETASE-GENS (PCbC) UND DES AC-/ACV-SYNTHETASE-GENS (pcbAB) - Google Patents

NEUER TRANSKRIPTIONSFAKTOR CPCR1 ZUR REGULATION DES ISOPENICILLIN N-SYNTHETASE-GENS (PCbC) UND DES AC-/ACV-SYNTHETASE-GENS (pcbAB) Download PDF

Info

Publication number
WO1999031244A1
WO1999031244A1 PCT/EP1998/007971 EP9807971W WO9931244A1 WO 1999031244 A1 WO1999031244 A1 WO 1999031244A1 EP 9807971 W EP9807971 W EP 9807971W WO 9931244 A1 WO9931244 A1 WO 9931244A1
Authority
WO
WIPO (PCT)
Prior art keywords
dna
seq
ala
protein
leu
Prior art date
Application number
PCT/EP1998/007971
Other languages
English (en)
French (fr)
Inventor
Ulrich Kück
Esther Schmitt
Original Assignee
Biochemie Gesellschaft M.B.H.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Biochemie Gesellschaft M.B.H. filed Critical Biochemie Gesellschaft M.B.H.
Priority to AU24131/99A priority Critical patent/AU2413199A/en
Publication of WO1999031244A1 publication Critical patent/WO1999031244A1/de

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/37Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from fungi
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide

Definitions

  • the invention relates to a DNA-binding protein which binds to double-stranded DNA of the sequence GTTGCCGGGCCAATCCCTGAGCTT (SEQ ID NO .: 4) from the intergenic area of the pcbAB and pcbC gene from Acremonium chrysogenum and is capable of transcribing the pcbAB and / or to influence pcbC gene.
  • the gene expression is u. a. regulated by the frequency of transcription initiation.
  • transcription factors can have a positive or a negative influence.
  • Transcription factors are frans-acting DNA binding proteins that can, for example, bind to DNA elements within the regulatory sequences of a gene. The specificity of the DNA-protein interaction is achieved through contacts between the nucleotides involved or the DNA backbone and the amino acids and their side chains (summary by Pabo and Sauer 1992).
  • Transcription factors are divided into different classes according to the structural properties of their DNA binding domains.
  • Most classes of transcription factors have also been discovered in hypha fungi and characteristic examples are given in Table 1.
  • a total of about 50 transcription factors of hyphae have been characterized molecularly.
  • Aspergillus nidulans is one of the organisms among the hyphae fungi, the most well-known of which is the transcriptional regulation of gene expression.
  • Neurospora crassa has detailed knowledge, for example, about the regulation of genes for the utilization of nitrate to cover the nitrogen requirement (Marzluff 1993).
  • the nit-3 gene codes for nitrate reductase and represents the first gene of the metabolic pathway for nitrate assimilation.
  • the expression of this gene is controlled by two regulatory proteins (NIT2 and NIT4).
  • NIT2 is a general regulatory protein and NIT4 is a pathway-specific transcription factor (Chiang and Marzluff 1995).
  • NIT4 belongs to the class of Zn (ll) 2 Cys 6 zinc finger proteins that have so far only been found in fungi (Schjerling and Holmberg 1996).
  • GAL4 protein of the yeast Saccharomyces cerevisiae Another very well analyzed example of this class is the GAL4 protein of the yeast Saccharomyces cerevisiae. So far, no transcription factors have been isolated from the ⁇ -lactam producer Acremonium chrysogenum. Only biochemical characterizations of DNA binding proteins that interact with cephalosporin C biosynthesis genes were carried out (Radzio 1996, Then Bergh et al. 1996).
  • cephalosporin C another ß-lactam parent compound, cephalosporin C, could be isolated from the culture filtrate of the hyphae fungus Acremonium chrysogenum (syn. Cephalospohum acremonium) in addition to the already known penicillin N.
  • Acremonium chrysogenum se. Cephalospohum acremonium
  • Chrysogenum like Peniciliium chrysogenum, is one of the filamentous fungi that can be morphologically clearly distinguished from yeasts or single-celled bacteria.
  • Cephalosporins differ from penicillins in that they have a modified basic structure. In contrast to penicillins, they are synthesized by bacteria in addition to hyphae.
  • cephalosporins Similar to penicillins, semi-synthetic cephalosporins are mainly used in pharmacology, which are synthesized from 7-aminocephalosporanic acid (7-ACS).
  • 7-aminocephalosporanic acid 7-ACS.
  • the "third generation" of cephalosporins used today is characterized by a broad spectrum of activity also against Gram-negative bacteria, many of which show resistance to antibiotics, low human toxicity and good stability against bacterial ß-lactamases.
  • A. chrysogenum is still the most important producer of the corresponding preliminary stages.
  • the biosynthetic pathway and the external factors that act on the synthesis are known in principle. Conventional mutagenic methods and selection have produced high-performance strains that synthesize antibiotics in large quantities.
  • A. nidulans has the same arrangement of the pernicillin biosynthesis genes as in P. chrysogenum.
  • Studies on A. chrysogenum or on the Actinomyceten Nocardia Lactamdurans showed that the genes responsible for the general steps in penicillin biosynthesis are also organized in the same way.
  • the bacterial ß-lactam producers who continue the biosynthesis via the cepham ring have the genes for them subsequent steps as well next to each other in Acremonium in a separate "gene cluster" on chromosome II. Investigations on high-performance strains of P. chrysogenum regarding their gene dose are interesting.
  • the pcbC gene In a strain with increased peniciliin production, the pcbC gene is present in several copies and in the high-performance strain As-P-78, the entire "gut" of the genes is five times. The multiplication of genes leads to an increased biosynthesis of the gene products, since several copies can be expressed at the same time.
  • the ß-lactam antibiotic cephalosporin C is synthesized by the enzymatic activity of several proteins in A. chrysogenum.
  • the first two synthesis steps are catalyzed by the AC / ACV synthetase and the isopenicillin N synthetase.
  • Both enzymes are encoded by the pcbAB or pcbC gene, which are adjacent and divergent in the genome. The transcription begins in the common intergenic promoter region of the two genes.
  • the ONE-HYBRID-SYSTEM offers the possibility to investigate interactions between DNA sequences and proteins.
  • the analysis of the DNA-protein interaction is carried out similarly to the analog TWO-HYBRID SYSTEM (protein-protein interaction, Fields and Song 1989) using a reporter gene in the baker's yeast Saccharomyces cerevisiae.
  • the method was developed by Wang and Reed (1993) and was successfully used for the first time in the cloning of an olfactory transcription factor.
  • Both the analyzed DNA sequence and the presumptive DNA-binding proteins of the examined organism are introduced into a yeast strain (see FIG. 1).
  • the DNA binding protein is expressed as a fusion protein with the transcription activating domain of the yeast GAL4 protein.
  • An interaction of the DNA-binding polypeptide with the analyzed DNA sequence, which is integrated upstream of a reporter gene enables the transcription initiation of the reporter gene by the fused GAL4 domain. In the DNA-protein interaction described, this transcription-activating protein domain comes in close proximity to the transcription start point.
  • the HIS3 gene in the vector pHISi
  • the / acZ gene in the vector pLACZi
  • the HIS3 gene enables direct selection for those yeast cells in which the described DNA-protein interaction takes place.
  • the / acZ gene allows the quantification of the reporter gene activity and thus the measurement of the binding affinity between the protein and the analyzed DNA sequence.
  • the ONE-HYBRID-SYSTEM can also be used to isolate previously unknown frans-acting factors of a DNA sequence.
  • an expression gene bank (cDNA bank) of the examined organism is used.
  • the cDNA library is set up in the yeast expression vector pGAD424 so that the cloned cDNAs can be expressed together with the GAL4 domain in the yeast.
  • a DNA sequence of 24 nucleotides was selected from the 1.2 kb promoter and used as the target element in the ONE-HYBRID SYSTEM to isolate a specific transcription factor (FIG. 2).
  • the sequence contains a so-called CCAAT box, which was found in the promoters and enhancer regions of many eukaryotic genes (e.g. Nussinov R 1992).
  • CCAAT box which was found in the promoters and enhancer regions of many eukaryotic genes (e.g. Nussinov R 1992).
  • transcription factors that bind to this motif (e.g. Raymondjean et al. 1988).
  • the Am Alpha binding protein (AAB) from Neurospora crassa was cloned due to its affinity for a CCAAT-containing promoter fragment.
  • AAB transcription factor for these could be determined by mutagenesis of the CCAAT motif Sequence are shown (Chen and Kinsey 1995). In Aspergillus nidulans, a DNA-protein interaction could be detected in the area of such a CCAAT box (Then Bergh et al. 1996).
  • the object on which the present invention is based is accordingly the finding of genes for transcription factors which are involved in the gene regulation of the biosynthetic genes of cephalosporin C, in order to ultimately increase the yield of cephalosporin C in corresponding fermentation processes.
  • the invention relates to a DNA-binding protein which binds as a monomer, homodimer or part of a heterodimer to double-stranded DNA of the sequence GTTGCCGGGCCAATCCCTGAGCTT (SEQ ID NO .: 4) from the intergenic region of the pcbAB and pcbC gene from Acremonium chrysogenum and in is able to influence the transcription of the pcbAB and / or pcbC gene, in particular characterized in that it contains the amino acid sequence of the CPCR1 protein according to Table 7 (SEQ ID NO .: 20) or parts thereof.
  • Another object of the invention is a fusion protein containing the amino acid sequence of the CPCR1 protein according to Table 7 (SEQ ID NO .: 21) or parts thereof and a transactivation domain which is capable of transcribing the pcbAB and / or pcbC gene to influence.
  • the fusion protein is characterized in that the named parts of the CPCR1 protein correspond to the DNA binding domain (amino acids 180 to 254 according to Table 7) and the dimerization domain (amino acids 502 to 660 according to Table 7) and / or the transactivation domain from the transcription factor GAL4 (amino acids 768 to 881).
  • Another object of the invention is a DNA molecule coding for a protein as described above.
  • This DNA molecule is particularly characterized in that
  • Another object of the invention is a vector containing a DNA as previously described.
  • this vector is characterized in that it is a vector suitable for expression in Acremonium chrysogenum or Saccharomyces cerevisiae.
  • the vector is preferably selected from the group comprising the vectors pGC1 and pGC1 ⁇ DIM1.
  • Another object of the invention is a host cell containing one or more copies of a vector or a DNA as described above, particularly characterized in that it is selected from the group containing Acremonium chrysogenum and Saccharomyces cerevisiae.
  • Another object of the invention is a method for producing a DNA-binding protein as previously described, characterized in that a DNA as previously described is expressed and isolated in a host cell as previously described by means of a vector as previously described.
  • Another object of the invention is a method for increasing the cephalosporin C yield in Acremonium chrysogenum, in which the expression of the cpcR1 gene product is varied, in particular characterized in that the varied expression by introducing one or more copies of the cpcR1 gene in the Host organism in addition to the endogenous cpcR1 gene is achieved or characterized in that the varied expression by integrating one or more additional DNA binding sequences TTGCCGGGCCAAT (SEQ ID NO .: 1) or variants of the same function of the DNA-binding protein as described above are achieved in the pcbAB / pcbC promoter.
  • the invention furthermore relates to a DNA binding site for a DNA-binding protein as described above, selected from the group comprising the double-stranded sequences GTTGCCGGGCCAATCCCTGAGCTT (SEQ ID NO .: 3), TTGCCGGGCCAAT (SEQ ID NO .: 1) and GTTGCCGGGCGTATCCCTGAGCTT (SEQ ID NO .: 1) ID NO .: 8).
  • Another object of the invention is a vector as described above, containing one or more copies of the DNA binding sequences of the DNA-binding protein of the invention as described above.
  • the oligonucleotide has the nucleotides CCC, which belong to the recognition sequence of the restriction enzyme Sma ⁇ .
  • an oligonucleotide of 76 nt was synthesized, the sequence of which is complementary to the first Is oligonucleotide.
  • the 3 'end of this oligonucleotide closes with a G, so that the hybridization of the two oligonucleotides results in a double-stranded DNA molecule, the 5' end of which is characterized by an EcoRI overhang.
  • This double-stranded DNA molecule (BSII) was integrated into the reporter gene plasmids pHISi and pLACZi (Gontech).
  • the plasmids had previously been cut with the restriction enzymes EcoRI and Smal.
  • the resulting plasmids pHISi-BSII and pLACZi-BSII were integrated into the genome of the recipient strain by means of DNA transformation.
  • the resulting yeast strain (see Table 5) was used to transform an A. chrysogenum cDNA library.
  • MRNA of the A. chrysogenum strain A3 / 2 was used as the starting material for the cDNA synthesis and the yeast vector pGAD424 (Gontech) was used for the construction of the cDNA library.
  • the DNA sequence of the isolated A. chrysogenum cDNA is shown in Table 6.
  • the isolated clone comprises a cDNA fragment of 2541 bp and additionally a polyA end of approximately 80 nucleotides.
  • the DNA sequence of the cDNA described isolated from A. chrysogenum contains an open reading frame for 786 amino acids (Table 7).
  • a computer comparison of the protein sequence of the cpcR1 gene with the EMBL database revealed homologies of 28 to 22 percent with different members of the family of RFX proteins. The highest homology exists with 28% to the SAK1 protein of Schizosaccharomyces pombe.
  • the human RFX1 protein is best characterized by all members of the family and has a homology of 23.9% to the CPCR1 protein over a range of 476 amino acids. The homologies within the conserved protein domains are significantly higher ( Figure 3 and Tables 8 and 9).
  • the transcription factors of the RFX family are characterized by a number of conserved protein domains (review by Emery et al. 1996).
  • the proteins have a so-called RFX-DNA binding domain comprising 76 amino acids, the consensus sequence of which has no homology to other known DNA binding domains.
  • most members of the protein family contain a putative dimerization domain that is less conserved.
  • further conserved protein regions A, B and C
  • the CPCR1 protein has the conserved regions B and C, a proline and glutamine-rich region in the N-terminal region and an aspartic acid and glutamic acid-rich region in the C-terminal part ( Figure 3).
  • yeast cells of the BSII strain (see Table 2) with the plasmid pGCI ⁇ DIMI are no longer able to grow on HIS selection plates with 55 mM 3-aminotriazole. This suggests that the DNA binding activity of the CPCR1 protein depends on the dimerization domain.
  • the transcription factor in this in vivo experiment may only bind to the DNA target sequence as a homodimer and thus leads to the expression of the HIS3 reporter gene.
  • Transcription factors are DNA binding proteins that in most cases are involved in the transcriptional regulation of gene expression through a specific interaction with DNA sequences of a promoter.
  • nucleotides which are necessary for the specific interaction of the CPCR1 protein with areas of the pcöAB / pcöC promoter, mutations were introduced into the presumptive binding site.
  • oligonucleotides were synthesized (BSIIml -3), the sequence of which in each case deviates from the starting sequence (BSIl) over a range of 2 to 5 nucleotides. Table 2 shows the sequences of the mutated oligonucleotides.
  • the sequences shown were synthesized in triplicate and integrated into the yeast genome as described in Example 1.
  • the reporter gene activity of the / acZ gene when the CPCR1 protein is expressed in the resulting yeast strains is shown in Table 2.
  • the substitution of the nucleotides CCAAT for GGTTA in the oligonucleotide BSIIml leads to a loss of the / acZ activity of the corresponding yeast strain.
  • the nucleotides CM may form the right half of a palindromic recognition sequence for the factor CPCRl. If the corresponding nucleotides (TTG to AAC) are substituted in the putative left half of the palindrome, a loss of / acZ activity can also be found (see BSIIm3).
  • FIG. 4 shows a Southern hybridization under stringent conditions with genomic DNA of the Acremonium chrysogenum strain A3 / 2.
  • the DNA was cut with the restriction enzymes EcoRI, SamHI or Hind ⁇ and separated by gel electrophoresis.
  • EcoRI EcoRI
  • SamHI SamHI
  • Hind ⁇ the restriction enzyme
  • the 2.4 kb hybridization fragment is a PstI fragment which occupies the following position within the recombinant plasmid pGC1: the fragment extends from the PstI recognition site at nucleotide position 129 within the open reading frame of the cpcRI gene to the PstI Recognition site within the multiple cloning site of the recombinant plasmid.
  • the multiple cloning site comes from the starting vector pGAD424.
  • all gene regions are contained in the hybridization fragment, with the exception of the first 129 nucleotides. Since only 1 fragment is labeled in the genomic DNA (7 to approx. 15 kb), the cpcR1 gene is probably present in a single copy in the genome of A. chrysogenum.
  • Hybridization buffer 50% formamide; 5x SSPE; 0.2% SDS; 100 ⁇ g / ml herring sperm DNA; Hybridization conditions: 1 h prehybridization at 37 ° C; 12 h hybridization with radioactive ( 32 P) -labeled probe; Wash buffer: 5x SSPE, 0.2% SDS; Washing conditions: 10 min at 60 ° C.
  • the expression of the cpcR1 gene in 3 different Acremonium chrysogenum strains was examined by means of a Northem hybridization (FIG. 5). That as Radioactive-labeled fragment of the cpcR1 gene (see above) labeled an RNA molecule of approximately 3.5 kb in the total RNA of A. chrysogenum.
  • the differences in the intensity of the hybridization between the 3 fungal strains (A c. ATCC 14553, A3 / 2 and Ad) indicate a different level of expression of the cpcR1 gene.
  • Hybridization conditions 2 h prehybridization at 37 ° C; 12 h hybridization with radioactive ( 32 P) -labeled probe; Wash buffer: 5x SSPE, 0.2% SDS; Washing conditions: 10 min at 60 ° C.
  • the expression vectors plR11, plR12, plR13, plR21, plR22, plR23, plR31, plR32 and plR33 are described below.
  • the vectors were constructed using standard methods of molecular genetics (Sambrook et al. 1989).
  • the nucleotide sequence of the vectors can be derived from Table 10.
  • All vectors are based on the bacterial plasmid PCRScript + AmpSK (+) (Stratagene, Heidelberg) and receive an origin of replication for propagation in E. coli, which is effective in E. coli. They also carry an ampicillin resistance gene that codes for a ß-lactamase. The resistance gene enables selection in E. coli.
  • the PCRScript + AmpSK (+) fraction is referred to as the "bacterial fraction”.
  • All vectors contain the promoter region of the pcbC gene (Samson et al. 1985, Menne et al. 1994).
  • the vectors contain variable cloning insertion interfaces, which are determined by the linkers of Table 11.
  • the vectors plR21, plR22, plR23 and plR31, plR32, plR33 contain secretion signal sequences for translation fusions.
  • secretion signal sequences were inserted immediately before the cloning insertion site, which bring about a transport of the expressed protein into the endoplasmic reticulum and finally a secretion from the cells.
  • the gene product should therefore be present in the culture supernatants of the corresponding fungal transformants.
  • Two different export signal sequences were used:
  • the second signal sequence used originates from A. chrysogenum and is also part of a gene which codes for an alkaline protease. This sequence has a length of 60 bp, the resulting signal peptide, the functionality of which has also been verified in S. cerevisiae and A chrysogenum, being 20 amino acids in length (Isogai et al. 1991).
  • the signal sequence from A. chrysogenum is contained in the vectors plR31, plR32, ⁇ lR33.
  • the vectors described in Example 6 can be used to express the CPCR1 protein in A. chrysogenum.
  • the cpcR1 gene can be synthesized from the plasmid pGC1 by PCR amplification (Sambrook et al. 1989). The following two primers are used in this amplification (the positions of the oligonucleotides within the nucleotide sequence according to Table 6 are given in brackets).
  • the amplification gives a 2362 bp DNA fragment, which is checked for correctness by DNA sequencing.
  • This fragment is cloned into the Nrul restriction site of the plasmid plR11.
  • the enzyme Nrul produces a so-called "blunt end" with which the cloning of the PCR Fragments is possible without previous restriction.
  • the ligation of the vector and the PCR fragment creates a recombinant plasmid called plRS11, which can then be cloned and expanded in E. coli.
  • the plasmid is introduced into A.chrysogenum by subsequent DNA co-transformation experiments (Menne et al. 1994). Usually, the plasmid is integrated into the fungal genome in multiple copies. Fungal transformants with multiple copies of the cpcRI gene can thus be obtained under the control of the pcbC promoter. The subsequent molecular analysis of the fungal transformants allows the selection of suitable strains. These should over-synthesize the CPCR 1 protein and thus result in an increased expression of the cephalosporin C biosynthesis genes due to the CPCR 1 effect.
  • the CPCR1 protein presumably has at least two important functional domains, the DNA binding domain and the dimerization domain.
  • the characterization of the potential dimerization domain is described below by in vivo experiments with derivatives of the CPCR1 protein. The analyzes were carried out with suitable yeast strains in the form of ONE-HYBRID and TWO-HYBRID experiments.
  • the DNA-protein interaction can be investigated in vivo with the ONE-HYBRID system. It is possible to vary the DNA binding sequence and thus obtain information about nucleotides that are essential for protein binding are. On the other hand, the protein content of the analyzed complex can also be changed. In both cases, the strength of the interactions is determined by measuring the reporter gene activity.
  • the reporter gene activity of yeast transformants in the ONE-HYBRID system upon expression of the cpcR1 gene and its deletion constructs are shown in FIG. 6.
  • the plasmid pGC1 codes for a fusion protein from the GAL4-AD and the CPCR1 protein from A chrysogenum.
  • the transformation of this plasmid into the reporter gene strain with the binding site II from the pcJbC promoter results in a high ⁇ -galactosidase activity (see FIG. 6).
  • the expression of the cpcR1 gene without the activating domain does not lead to an increased reporter gene activity, as can be seen in FIG. 6.
  • the figure also shows the effects of deletions within the cpcR1 gene.
  • the AD-DIM1 protein has only the N-terminal half of the CPCR1 protein. As a result, the dimerization domain is completely absent, while the DNA binding domain is retained. Yeast transformants in which this derivative of the CPCR1 protein is formed show no reporter gene activity, which indicates a lack of DNA binding. The effects of a smaller deletion can be seen with the protein AD-DIM2. Here the deletion begins in the middle of the dimerization domain, so that the N-terminal half of the domain is retained.
  • the ⁇ -galactosidase activity of a protein extract from yeast transformants with this construct is 32 U / mg protein. This corresponds to just over 5% of the activity of the wild-type protein.
  • the use of derivatives of the CPCR1 protein in the ONE-HYBRID system allows the analysis of functional protein domains.
  • the dimerization domain of the CPCR1- Protein appears to play a crucial role in the DNA binding activity of the protein, because complete or incomplete deletion of this domain leads to a sharp decrease in reporter gene activity.
  • the TWO-HYBRID system enables the direct detection of protein-protein interactions (Fields and Song 1989). Like the ONE-HYBRID system, it is carried out in the yeast S. cerevisiae. The two proteins to be tested for a possible interaction must each be introduced into a suitable yeast strain as fusion proteins with two different domains of the GAL4 protein of the yeast. The DNA binding domain of the GAL4 protein (BD) is linked to one
  • Interaction partner fused, the activating domain of the GAL4 protein (AD) with the other protein. If the two proteins interact with each other, the two GAL4 domains come into spatial proximity to one another and reporter genes are expressed in the corresponding yeast transformants.
  • the derivatives of the CPCR1 protein used in the previous section were also used in the TWO-HYBRID system. For this purpose, the CPCR1 protein and the proteins DIM1 and DIM2 (see FIG. 6) were fused with the DNA binding domain (BD) of the GAL4 protein. Together with the already existing constructs, which represent a fusion with the activating domain (AD), these proteins can be tested for interactions with one another.
  • FIG. 7A shows a schematic representation of the five yeast strains with the different proteins.
  • the binding site of the GAL4 protein is integrated upstream of the H / S3 gene in the yeast strain used, so that an interaction of the examined proteins leads to histidine prototrophy.
  • the analysis of the protein-protein interaction in the yeast transformants was carried out accordingly on selection plates (see FIG. 7). The strength of the interaction can be deduced from the growth of the yeast cells. A very weak growth along the vaccination lines is due to the background activity of the HIS3 gene in the yeast cells.
  • FIGS 15B and D also show that the complete CPCR1-
  • the mutated BSIIml binding site from the pcbC promoter was also used as the specificity control in addition to the wild-type binding site BSII. It was thus possible to check whether the isolated putative transcription factor of A. chrysogenum interacted with the binding site in the yeast cells in a sequence-specific manner. Further mutations and gel retention analyzes allow a more precise determination of the binding site of the CPCR1 protein.
  • the 24-nucleotide DNA fragment BSI1 from the pcbC promoter which was selected as a potential binding site for a transcription factor for use in the ONE-HYBRID system, contains the base sequence 5'-CCAAT-3 '
  • the strain with the BSIIml binding site is the reporter gene strain already described, which was used for the selection of the cDNA clone (see Example 1). After the transformation of the Expression plasmids with the cDNA of the cpcR1 gene in the named reporter gene strains were able to analyze the activity of the reporter genes.
  • the activity of the H / S3 gene in the transformants was determined by a growth test on selection plates, the expression of the / acZ gene by measuring the enzyme activity.
  • Protein extracts from yeast strains with the wild-type sequence BSII show an activity of the ⁇ -galactosidase of 603 U / mg protein extract.
  • the entire CCAAT box is mutated and thus also the right half of the palindrome.
  • the activity of the ⁇ -galactosidase with nine U / mg protein extract is very low.
  • a mutation of the left half of the palindrome also leads to a loss of reporter gene expression, which indicates a disturbed DNA-protein interaction.
  • BSIIm2 sequence only two nucleotides are exchanged within the CCAAT box.
  • the resulting activity of the ⁇ -galactosidase with 140 U / mg protein extract is less than a quarter of the wild-type activity.
  • Promoter binds.
  • the right half of the palindrome coincides with a CCAAT box. Both halves of the palindrome are essential for binding.
  • the interaction between a protein and a known DNA fragment can also be investigated in vitro using gel retention analysis, in which radioactively labeled DNA, which contains the protein binding site, is incubated with protein extracts. Subsequently, DNA-protein complexes are separated from free DNA molecules by gel electrophoresis and detected by autoradiography. A double-stranded oligonucleotide which contains three times the sequence of the BSI1 binding site (see FIG. 2) was labeled by the incorporation of radioactive nucleotides and incubated with various protein extracts. Protein crude extracts were made
  • chrysogenum and recombinant yeast strains were obtained and purified and fractionated by “Fast Protein Liquid” chromatography (FPLC) using a heparin column.
  • FPLC Fast Protein Liquid
  • a specific DNA-protein interaction with binding site II was demonstrated with protein extract from Acremonium and from a yeast strain that forms the CPCR1 protein.
  • the specificity of the binding was examined by competition analyzes. By adding non-radioactively labeled DNA molecules to the reaction batch, it can be tested whether the protein also binds to these DNA molecules and thus forms the specific DNA-protein complex to a reduced extent. Competition with binding site II leads to a strong decrease in the complex. This cannot be observed when adding oligonucleotides with a mutated sequence (BSIIm3). This indicates a specific interaction between the CPCR1 protein and binding site II.
  • gel retention analyzes were carried out with two other yeast strains.
  • One strain of yeast expresses the CPCR1 protein as
  • AD-CPCR1 Fusion protein with the transcription activating domain of the yeast GAL4 protein (AD-CPCR1).
  • the other strain was used as a control and only expresses the domain of the GAL4 protein (AD).
  • This control protein extract does not lead to the formation of the specific DNA-protein complex that can be observed with the protein AD-CPCR1.
  • This comparison of the yeast protein extracts showed that the protein extract AD-CPCR1 from the recombinant yeast strain is suitable for in vitro binding studies.
  • a genomic DNA fragment from A chrysogenum was isolated which contains the CPCR1 gene.
  • the sequence is shown in Table 13 (SEQ ID NO .: 57).
  • the open lex frame begins at position 535 and ends at position 3130.
  • Two introns are included: intron 1 from position 1215 to position 1267, intron 2 from position 1568 to position 1619.
  • Fig. 1 Scheme of the ONE-HYBRID SYSTEM.
  • a yeast reporter gene strain is transformed with an A. chrysogenum expression gene bank.
  • a DNA-protein interaction between the heterologous portion of the fusion protein and the analyzed DNA element (E) leads to the expression of the reporter gene (HIS3).
  • HIS3 reporter gene
  • AD transcription activating GAL4 domain
  • BP DNA binding protein
  • E analyzed DNA element
  • HIS3 histidine biosynthesis gene
  • P promoter
  • Fig. 3 Schematic representation of the CPCR1 protein.
  • the DNA binding domain (DBD) and the dimerization domain (DIM) are identified by a bold frame. Regions B and C conserved within the RFX family are also shown. Protein regions that contain an increased proportion of certain amino acids are marked with PQ (proline and glutamine) or with DE (aspartic acid and glutamic acid).
  • Fig. 4 Southern hybridization of total DNA of A cfttysogenttm strain Ad. The total DNA was cut with restriction enzymes as indicated and separated by gel electrophoresis. A radioactively labeled Ps / I fragment of the cpcR1 gene with a size of 2.4 kb was used. The plasmid pGC1, which contains the cpcR1 cDNA, served as a positive control for the hybridization.
  • Fig. 6 Schematic representation of the proteins used in the ONE-HYBRID system and the ⁇ -galactosidase activity of the corresponding yeast transformants.
  • the ⁇ -galactosidase activity was determined from at least three experiments.
  • Fig. 7 Reporter gene analysis of TWO-HYBRID experiments with the CPCR1 protein and deleted derivatives of the CPCR1 protein.
  • the selection plates contain no histidine, leucine and uracil, but 6 mM 3-aminotriazole.
  • AD activating domain
  • BD DNA binding domain.
  • Cys-3 the positive-acting sulfur regulatory gene of Neurospora crassa, encodes a protein with a putative leucine zipper DNA-binding element.
  • Mol Cell Biol 9: 1120-1127 Isogai T, Fukagawa M, Kojo H., Kohsaka M, Aoki H, Imanaka H (1991) Cloning and nucleotide sequences of the complementary and genomic DNAs for the alkaline protease from Acremonium chrysogenum Agric. Biol. Chem. 55: 471-477
  • Tab. 1 Exemplary selection of transcription factors for hyphae.
  • Tab. 2 Monomeric partial sequences of oligonucleotides that were used in the ONE-HYBRID-SYSTEM.
  • the BSI1 sequence corresponds to the range from -447 to -423 of the p ⁇ AB / pcoC promoter of A. chrysogenum.
  • the mutated oligonucleotides BSIIml -3 were used to determine the binding sequence of the CPCR1 protein.
  • the nucleotides deviating from the starting sequence are given in bold.
  • the consensus sequence of the binding sites of the human RFX1 protein is also given. Underlined are those nucleotides within the sequences that could be involved in the formation of a palindrome.
  • Table 3 Sequences of complementary oligonucleotides with triple copies of the putative transcription factor binding sequence from the p bAB / pcbC promoter.
  • the wild type sequence is given above, including derivatives with substitutions of the DNA binding site (underlined).
  • the hybridized oligonucleotides were integrated into the cloning sites of reporter gene vectors (pHISi and pLACi) and introduced into the yeast genome by means of DNA transformation.
  • Tab. 4 Overview of the yeast plasmids used. Part A of the table contains yeast plasmids with integrations of the oligonucleotides listed in table 3. They are integrative yeast plasmids. Part B of the table contains yeast expression plasmids which have been transformed into the yeast strains generated and are present there as autonomously replicating plasmids.
  • Table 6 DNA sequence of the isolated cDNA clone (cpcRI) from Acremonium chrysogenum. The sequence given comprises 2546 bp (SEQ ID NO .: 20) and is shown as a single-stranded, linear DNA molecule in the 5'-3 'direction.
  • 1390 1400 1410 1420 1430 1440 TCGCTCGTGG TGGTGCCTAA TGTGTATCTC AACCGGATGC GGTCCATCGC CGACCGTCTC
  • Table 8 Comparison of the amino acid sequences of the DNA binding domains of some members of the RFX protein family. Identical amino acids are highlighted by gray boxes. The consensus sequence also took into account positions where 2 different amino acids occur.
  • Table 11 The characteristic cloning sites of the nine vectors and the restriction sites derived therefrom, which are suitable for cloning. It should be noted that the three cloning sites differ only in one or two base pairs.
  • Reading frame (oligonucleotides No. 1 +2)
  • Reading frame (oligonucleotides No. 3 + 4)
  • Reading frame (oligonucleotides No. 5 + 6)
  • Tab. 12 Transition sequences in the area of the multiple cloning site (framed) in the specified expression vectors. In the sequences, those nucleotides were underlined that differ from the first-mentioned plasmid.
  • AAACCGTCACC ATG AAG CTT TCG CGA GAA TTC GGGTCGATCAGG SEQ ID NO.: 36
  • TTTGGCAGTGG TAC TTC GAA
  • AGC GCT CTT AAG CCCAGCTAGTCC SEQ ID NO .: 37
  • AAACCGTCACC ATG (SEQ ID NO.: 38) TTTGGCAGTGG TAC (SEQ ID NO.: 39)
  • S AAT TCjGGGTCGATCAGG SEQ ID NO.: 40
  • AAACCGTCACC ATG CGT CTG TCC ATC ATC GCA GTC CTT CCC CTG GCC CTC GCC TTTGGCAGTGG TAC GCA GAC AGG TAG TAG CGT CAG GAA GGG GAC CGG GAG CGG
  • AAACCGTCACC ATG CGT CTG TCC ATC ATC GCA GTC CTT CCC CTG GCC CTC GCC TTTGGCAGTGG TAC GCA GAC AGG TAG TAG CGT CAG GAA GGG GAC CGG GAG CGG
  • AAACCGTCACC ATG CGT CTG TCC ATC ATC GCA GTC CTT CCC CTG GCC CTC GCC TTTGGCAGTGG TAC GCA GAC AGG TAG TAG CGT CAG GAA GGG GAC CGG GAG CGG
  • AAACCGTCACC ATG GTC ACC CTC CGC CTC GCC GTC CTC CTC GGC TTTGGCAGTGG TAC CAG TGG GAG GCG GCG GAG CGG CAG GAG GAG CCG
  • AAACCGTCACC ATG GTC ACC CTC CGC CTC GCC GTC CTC CTC GGC GCC ATC CCC GOC TTTGGCAGTGG TAC CAG TGG GAG GCG GCG GAG CGG CAG GAG GAG CCG CGG TAG GGG CGG
  • GCC CTC GCC GCC ATG (SEQ ID NO .: 50)
  • CGG GAG CGG CGG TAC (SEQ ID NO .: 51)
  • AAACCGTCACC ATG GTC ACC CTC CGC CTC GCC GTC CTC CTC GGC GCC ATC CCC GCC TTTGGCAGTGG TAC CAG TGG GAG GCG GCG GAG CGG CAG GAG GAG CCG CGG TAG GGG CGG
  • 1390 1400 1410 1420 1430 1440 TCGGGAAGTT GGTGCGAGTC GTCTTCCCAT CCATCAAAAC CCGACGACTT GGAGTCCGGG
  • MOLECULE TYPE DNA (genomic)
  • MOLECULE TYPE DNA (genomic)
  • MOLECULE TYPE DNA (genomic)
  • MOLECULE TYPE DNA (genomic)
  • MOLECULE TYPE DNA (genomic)
  • MOLECULE TYPE DNA (genomic)
  • MOLECULE TYPE DNA (genomic)
  • MOLECULE TYPE DNA (genomic)
  • MOLECULE TYPE DNA (genomic)
  • MOLECULE TYPE DNA (genomic)
  • MOLECULE TYPE DNA (genomic)
  • MOLECULE TYPE DNA (genomic)
  • MOLECULE TYPE DNA (genomic)
  • MOLECULE TYPE DNA (genomic)
  • MOLECULE TYPE DNA (genomic)
  • MOLECULE TYPE DNA (genomic)
  • MOLECULE TYPE DNA (genomic)
  • MOLECULE TYPE DNA (genomic)
  • MOLECULE TYPE DNA (genomic)
  • MOLECULE TYPE DNA (genomic)
  • MOLECULE TYPE DNA (genomic)
  • MOLECULE TYPE DNA (genomic)
  • MOLECULE TYPE DNA (genomic)
  • MOLECULE TYPE DNA (genomic)
  • MOLECULE TYPE DNA (genomic)
  • MOLECULE TYPE DNA (genomic)

Landscapes

  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Medicinal Chemistry (AREA)
  • Biochemistry (AREA)
  • Biophysics (AREA)
  • Mycology (AREA)
  • Genetics & Genomics (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Peptides Or Proteins (AREA)

Abstract

Die Erfindung betrifft ein DNA-bindendes Protein, welches als Monomer, Homodimer oder Teil eines Heterodimer an doppelsträngige DNA der Sequenz GTTGCCGGGCCAATCCCTGAGCTT aus dem intergenischen Bereich des pcbAB und pcbC-Gens von Acremonium chrysogenum bindet und in der Lage ist, die Transkription des pcbAB und/oder pcbC-Gens zu beeinflussen, insbesondere dadurch gekennzeichnet, daß es die Aminosäuresequenz des CPCR1-Proteins gemäß Tab. 7 enthält. Des weiteren betrifft die Erfindung Fusionsproteine, enthaltend die Aminosäuresequenz des cpcR1-Proteins oder Teile davon und eine Transaktivierungsdomäne. Die Erfindung betrifft ebenfalls für die genannten Proteine kodierende DNA, Vektoren enthaltend diese DNA, Wirtszellen enthaltend die DNA und/oder die Vektoren, ein Verfahren zur Herstellung des DNA-bindenden Proteins, ein Verfahren zur Steigerung der Cephalosporin C-Ausbeute in Acremonium chrysogenum. Außerdem betrifft die Erfindung die DNA-Bindungsstellen für das erfindungsgemäße DNA-bindende Protein.

Description

Beschreibung
Neuer Transkriptionsfaktor CPCR1 zur Regulation des Isopenicillin N-Synthetase- Gens (pcbC) und des AC-/ACV-Synthetase-Gens (pcbAB)
Die Erfindung betrifft ein DNA bindendes Protein, welches an doppelstrangige DNA der Sequenz GTTGCCGGGCCAATCCCTGAGCTT (SEQ ID NO.: 4) aus dem intergenischen Bereich des pcbAB und pcbC-Gens von Acremonium chrysogenum bindet und in der Lage ist, die Transkription des pcbAB und/oder pcbC-Gens zu beeinflussen.
1. Regulation der Genexpression mittels Transkriptionsfaktoren bei Pilzen
Die Genexpresssion wird u. a. über die Häufigkeit der Transkriptionsinitiation reguliert. Das Vorhandensein von sogenannten Transkriptionsfaktoren kann dabei einen positiven oder einen negativen Einfluß haben. Transkriptionsfaktoren sind frans-wirkende DNA-Bindeproteine, die zum Beispiel an DNA-Elemente innerhalb der regulatorischen Sequenzen eines Gens binden können. Die Spezifität der DNA- Protein-Interaktion wird durch Kontakte zwischen den beteiligten Nukleotiden, bzw. dem DNA-Rückgrad und den Aminosäuren und ihren Seitenketten erreicht (Zusammenfassung bei Pabo und Sauer 1992).
Transkriptionsfaktoren werden nach den strukturellen Eigenschaften ihrer DNA- Bindedomänen in verschiedenen Klassen eingeteilt. So kennt man .zum Beispiel Helix-Turn-Helix-, Homeodomain-, Zinkfinger oder auch Leucin-Zipper-Proteine (Zusammenfassung bei Pabo und Sauer 1992). Die meisten Klassen von Transkriptionsfaktoren wurden auch bei Hyphenpilzen entdeckt und charakteristische Beispiele werden in Tabelle 1 genannt. Insgesamt wurden etwa 50 Transkriptionsfaktoren von Hyphenpilzen molekular charakterisiert. Mit circa 20 klonierten Transkriptionsfaktoren gehört Aspergillus nidulans unter den Hyphenpilzen zu den Organismen, über deren transkriptioneile Regulation der Genexpression am meisten bekannt ist. Bei Neurospora crassa liegen detaillierte Kenntnisse zum Beispiel über die Regulation der Gene für die Verwertung von Nitrat zur Deckung des Stickstoffbedarfs vor (Marzluff 1993). Das nit-3 Gen kodiert für die Nitratreduktase und stellt das erste Gen des Stoffwechselweges für die Nitratassimilation dar. Die Expression dieses Gens wird von .zwei regulatorischen Proteinen (NIT2 und NIT4) gesteuert. Wobei es sich bei NIT2 um ein allgemeines regulatorisches Protein und bei NIT4 um einen Stoffwechselweg-spezifischen Transkriptionsfaktor handelt (Chiang und Marzluff 1995). NIT4 gehört zur Klasse der Zn(ll)2Cys6-Zinkfingerproteine, die bislang nur bei Pilzen gefunden wurden (Schjerling und Holmberg 1996). Ein anderes sehr gut analysiertes Beispiel dieser Klasse ist das GAL4-Protein der Hefe Saccharomyces cerevisiae. Aus dem ß-Lactam-Produzenten Acremonium chrysogenum wurden bisher keine Transkriptionsfaktoren isoliert. Es wurden lediglich biochemische Charakterisierungen von DNA-Bindeproteinen vorgenommen, die mit Cephalosporin C-Biosynthese-Genen in Wechselwirkung treten (Radzio 1996, Then Bergh et al. 1996).
2. Produktion von ß-Lactamantibiotika durch Mikroorganismen
Die ß-Lactame sind seit der Entdeckung des Penicillins durch Alexander Fleming im Jahre 1929 eine der erfolgreichsten Wirkstoff gruppen mit antibakterieller Potenz. Ursprünglich als eine Kontamination auf einer Petrischale mit Staphylococcen aufgrund seiner wachstumshemmenden Eigenschaften entdeckt, konnte der Pilz Penicillium notatum zur ersten biotechnologischen Produktion eines Medikamentes genutzt werden. Chain und Florey isolierten 1940 den Wirkstoff Penicillin und setzten ihn klinisch ein. Das chemische Grundgerüst der Penicilline, die 6- Aminopenicillansäure (6-APA), kann verschiedene Substituenten tragen, was die große Vielfalt der ß-Lactame bedingt. Penicilline zeigen sich äußerst wirksam gegen Gram-positive Bakterien wie Staphylococcus aureus. Allerdings haben viele Bakterienstämme im Laufe der Zeit Resistenzen entwickelt.
Bei der Entwicklung neuer Penicillin-Derivate wurden z.B. halbsynthetische Antibiotika eingesetzt, bei denen eine fermentativ produzierte Vorstufe, das Penicillin G, chemisch oder enzymatisch zu 6-APA umgesetzt wird. Diese kann anschließend zu den Wirksubstanzen weiterverarbeitet werden. Zum anderen wurde schon frühzeitig damit begonnen, nach weiteren natürlichen ß-Lactamen zu suchen.
1953 konnte aus dem Kulturfiltrat des Hyphenpilzes Acremonium chrysogenum (syn. Cephalospohum acremonium) neben dem bereits bekannten Penicillin N eine weitere ß-Lactam-Stammverbindung, das Cephalosporin C isoliert werden. A. chrysogenum zählt wie Peniciliium chrysogenum zu den filamentös wachsenden Pilzen, die sich morphologisch deutlich von Hefen oder einzelligen Bakterien abgrenzen lassen.
Cephalosporine unterscheiden sich von den Penicillinen durch ein modifiziertes Grundgerüst. Sie werden im Gegensatz zu den Penicillinen außer von Hyphenpilzen auch von Bakterien synthetitisert.
Ähnlich wie bei den Penicillinen werden in der Pharmakologie im wesentlichen halbsynthetische Cephalosporine eingesetzt, die ausgehend von der 7- Aminocephalosporansäure (7-ACS) synthetisiert werden. Die heute verwendete "dritte Generation" der Cephalosporine zeichnet sich durch ein breites Aktivitätsspektrum auch gegen Gram-negative Bakterien, von denen viele Resistenzen gegen Antibiotika zeigen, geringe Humantoxizität und gute Stabilität gegen bakterielle ß-Lactamasen aus. A. chrysogenum ist bis heute der wichtigste Produzent der entsprechenden Vorstufen. Der Biosyntheseweg und die äußeren Faktoren, die auf die Synthese wirken, sind im Prinzip bekannt. Durch konventionelle Mutagenseverfahren und Auswahl hat man Hochleistungsstämme erzeugt, die Antibiotika in großen Mengen synthetisieren. Produzierte der von Fleming isolierte Stamm noch 0,0012 g Penicillin pro Liter Kultur, so erzielt man in heutigen Prozessen ca. 50 g Penicllin oder über 20 g Cephalosporin C pro Liter Kulturmedium, eine notwendige weitere Verbesserung der Selektivität und Produktivität erfordert jedoch immer bessere Produktionsstämme. Dieses ist nicht mehr allein durch Zufallsmutagenese zu erreichen, sondern erfordert alternative Methoden. Der Einsatz molekulargenetischer Techniken zur gezielten Beeinflussung der Biosyntheseenzyme erscheint deshalb vielversprechend zu sein.
3. Physikalische Organisation des pcbAB/pcbC intergenischen Bereichs von Acremonium chrysogenum
Beim Versuch, aus Streptomyces coelicolor Gene zu klonieren, die an der Biosynthese des Antibiotikums Actinorhodin beteiligt sind, wurde zunächst festgestellt, daß die gesamte Information, die zur Biosynthese notwendig war, auf einem 33 000 Basenpaare langen DNA-Fragment lag. Nach Transformation dieses Fragmentes in einen anderen Stamm von Streptomyces, welcher diese Gene nicht enthielt, konnte dieser Actinorhodin synthetisieren. Dieses war der erste Hinweis auf eine Vielzahl von Antibiotikasynthesegenen auf einem relativ kurzen DNA-Aoschnitt in einem Prokaryonten. Später konnte gezeigt werden, daß die Kopplung der Biosynthesegene für ein anderes Antibiotikum, das Cephamycin, bei Streptomyces soweit geht, daß die Information aus zwei verschiedenen Genen, dem für die Epimerase (cefD) und dem für die Expandase (cefEF), gemeinsam in RNA umgeschrieben wird. Parallel dazu wurde untersucht, ob in Eukaryonten ähnliche Verhältnisse vorliegen. Experimente mit Penicillium zeigten, daß das penDE-Gen, das für eine Isopenicillin-N-Acyltransferase kodiert, unmittelbar stomabwärts des pcbC-Gens lag. Das entgegengesetzt transkribierte pcbAB-Gen ist ebenfalls dem pcbC-Gen unmittelbar benachbart. Damit wurde gezeigt, daß die Gene für den Biosyntheseweg der Penicilline als "Güster" organisiert sind.
In A. nidulans findet sich die gleiche Anordnung der Pernicillinbiosynthesegene wie bei P. chrysogenum. Untersuchungen an A. chrysogenum oder beim Actinomyceten Nocardia Lactamdurans zeigten, daß hier ebenfalls die für die generellen Schritte der Penicillinbiosynthese erantwortlichen Gene in gleicher Weise organisiert sind, bei den bakteriellen ß-Lactamproduzenten, welche die Biosynthese über den Cephamring fortsetzen, liegen die Gene für die darauffolgenden Schritte ebenfalls nebeneinander, in Acremonium dagegeben in einem separaten "Gen-cluster" auf dem Chromosom II. Interessant sind Untersuchungen an Hochleistungsstämmen von P. chrysogenum bezüglich ihrer Gendosis. In einem Stamm mit erhöhter Peniciliinproduktion liegt das pcbC-Gen in mehreren Kopien und im Hochleistungsstamm As-P-78 der gesamte "Güster" der Gene fünffach vor. Durch die Genvervielfachung kommt es zu einer erhöhten Biosynthese der Genprodukte, da mehrere Kopien gleichzeitig exprimiert werden können.
Das ß-Lactamantibiotikum Cephalosporin C wird durch die enzymatische Aktivität mehrerer Proteine in A. chrysogenum synthetisiert. Die ersten beiden Syntheseschritte werden durch die AC-/ACV-Synthetase und die Isopenicillin N- Synthetase katalysiert. Beide Enzyme werden durch das pcbAB- bzw. das pcbC- Gen kodiert, welche im Genom benachbart und divergent angeordnet sind. Die Transkription beginnt im gemeinsamen intergenischen Promotorbereich der beiden Gene.
4. Das Hefe ONE-HYBRID-SYSTEM als Methode zur Isolation von Transkriptionsfaktoren
Das ONE-HYBRID-SYSTEM (Gontech 1995) bietet die Möglichkeit, Interaktionen zwischen DNA-Sequenzen und Proteinen zu untersuchen. Die Analyse der DNA- Protein-Interaktion wird ähnlich wie bei dem analogen TWO-HYBRID-SYSTEM (Protein-Protein-Interaktion, Fields und Song 1989) mit Hilfe eines Reportergens in der Bäckerhefe Saccharomyces cerevisiae durchgeführt. Das Verfahren wurde von Wang und Reed (1993) entwickelt und erstmals erfolgreich bei der Klonierung eines olfaktorischen Transkriptionsfaktors eingesetzt.
Sowohl die analysierte DNA-Sequenz als auch die präsumptiven DNA-bindenden Proteine des untersuchten Organismus werden in einen Hefestamm eingebracht (siehe Figur 1 ). Das DNA-bindende Protein wird als Fusionsprotein mit der transkriptionsaktivierenden Domäne des GAL4-Proteins der Hefe exprimiert. Eine Interaktion des DNA-bindenden Polypeptids mit der analysierten DNA-Sequenz, welche stromaufwärts eines Reportergens integriert wird, ermöglicht die Transkriptionsinitiation des Reportergens durch die fusionierte GAL4-Domäne. Diese transkriptionsaktivierende Proteindomäne gelangt bei der beschriebenen DNA-Protein-Interaktion in räumliche Nähe des Transkriptionsstartpunktes. Als Reportergene werden das HIS3-Gen (in dem Vektor pHISi) und das /acZ-Gen (in dem Vektor pLACZi) eingesetzt. Das HIS3-Gen ermöglicht die direkte Selektion auf solche Hefezellen, bei denen die beschriebene DNA-Protein-Interaktion stattfindet. Das /acZ-Gen erlaubt die Quantifizierung der Reportergenaktivität und damit die Messung der Bindungsaffinität zwischen Protein und analysierter DNA-Sequenz. Neben dem Nachweis der DNA-Protein-Interaktion zwischen zwei bekannten Komponenten kann das ONE-HYBRID-SYSTEM auch zur Isolation bislang unbekannter frans-wirkender Faktoren einer DNA-Sequenz eingesetzt werden. Hierbei wird mit einer Expressionsgenbank (cDNA-Bank) des untersuchten Organismus gearbeitet. Die cDNA-Bank wird in dem Hefe-Expressionsvektor pGAD424 angelegt, so daß die klonierten cDNAs zusammen mit der GAL4-Domäne in der Hefe exprimiert werden können. Durch die Selektion auf die Expression von Reportergenen können solche cDNAs identifiziert werden, deren Proteinprodukte in diesem in w'vo-System eine funktionelle DNA-Bindeaktivität besitzen.
Aus dem 1 ,2 kb umfassenden Promotor wurde eine DNA-Sequenz von 24 Nukleotiden (Position -447 bis -423) ausgewählt und als Zielelement im ONE- HYBRID-SYSTEM zur Isolation eines spezifischen Transkriptionsfaktors eingesetzt (Figur 2). Die Sequenz enthält eine sogenannte CCAAT-Box, die in den Promotoren und Enhancer-Regionen vieler eukaryontischer Gene gefunden wurde (z. B. Nussinov R 1992). Es existieren mehrere unterschiedliche Transkriptionsfaktoren, die an dieses Motiv binden (z. B. Raymondjean et al. 1988). Z.B. wurde das Am Alpha ßinding-Protein (AAB) von Neurospora crassa aufgrund seiner Affinität zu einem CCAAT-enthaltendem Promotorfragment kloniert. Durch Mutagenese des CCAAT-Motivs konnte die Spezifität des AAB-Transkriptionsfaktors für diese Sequenz gezeigt werden (Chen und Kinsey 1995). Bei Aspergillus nidulans konnte eine DNA-Protein-Interaktion im Bereich einer solchen CCAAT-Box nachgewiesen werden (Then Bergh et al. 1996).
Die Synthese des Anitbiotikums in A. chrysogenum unterliegt einer Reihe von Faktoren (Kohlenstoffquellen, pH-Wert und Sauerstoffgehalt des Mediums, usw.), deren Umsetzung auf die molekulare Regulation der Genexpression unbekannt ist (Übersicht bei Nosek et al. 1997). Transkriptionsfaktoren mit spezifischen Affinitäten für DNA-Sequenzen des regulatorischen Bereichs der pcbABI pcöC-Gene sind Mittel der molekularen Regulation. Bei Kenntnis und Verfügbarkeit solcher Transkriptionsfaktoren und der entsprechenden Gene erschließen sich neue Möglichkeiten, die Regulation der Cephalosporin C-Biosynthese zu untersuchen und die gewonnenen Erkenntnisse auf die Antibiotika-Produktion zu übertragen.
Die der vorliegenden Erfindung zugrundeliegende Aufgabe ist demgemäß das Auffinden von Genen für Transkriptionsfaktoren, die an der Genregulation der Biosynthesegene von Cephalosporin C beteiligt sind, um letztlich eine Ausbeutesteigerung an Cephalosporin C in entsprechenden Fermentationsprozessen zu erreichen.
Überraschenderweise wurde bei der Lösung dieser Aufgabe mittels des Hefe ONE- HYBRIDSYSTEMS das Gen eines DNA-bindenden Proteins (cpcR1-Gen) entdeckt, dessen Gen-Produkt (CPCR1) im intergenischen Bereich der pcbAB und pcbC- Gene von A. chrysogenum bindet und der Familie der RFX-proteine (Emery et al., 1996) zuzurechnen ist. Dies ist um so überraschender, als daß man aufgrund des Voriiegens einer CCAAT-Box im zum Screening benutzten DNA-Fragment eigentlich ein Protein aus einer Protein-Familie erwartet hätte, welche aus Mitgliedern besteht, die spezisch an das Sequenzmotiv "CCAAT-Box" binden. Eine mögliche Erklärung für diesen überraschenden Befund ist die Struktur der erfindungsgemäßen DNA Bindestelle.GTTGCCGGGCCAATCCCTGAGCTT (SEQ ID No.: 4). Die Sequenz enthält ein palindromisches Sequenzmotiv, welches wohl die Bindungsstelle für das CPCR1 -Protein darstellt; die CCAAT-Box überlappt lediglich teilweise mit dieser Sequenz.
Ein Gegenstand der Erfindung ist ein DNA-bindendes Protein, welches als Monomer, Homodimer oder Teil eines Heterodimer an doppelstrangige DNA der Sequenz GTTGCCGGGCCAATCCCTGAGCTT (SEQ ID NO.: 4) aus dem intergenischen Bereich des pcbAB und pcbC-Gens von Acremonium chrysogenum bindet und in der Lage ist, die Transkription des pcbAB und/oder pcbC-Gens zu beinflussen, insbesondere dadurch gekennzeichnet, daß es die Aminosäuresequenz des CPCR1 -Proteins gemäß Tabelle 7 (SEQ ID NO.: 20) oder Teile davon enthält.
Ein weiterer Gegenstand der Erfindung ist ein Fusionsprotein, enthaltend die Aminosäuresequenz des CPCR1 -Proteins gemäß Tabelle 7 (SEQ ID NO.: 21 ) oder Teile davon und eine Transaktivierungsdomäne, welche in der Lage ist, die Transkription des pcbAB und/oder pcbC-Gens zu beinflussen.
Insbesondere ist das Fusionsprotein dadurch gekennzeichnet, daß die genannten Teile des CPCR1 Proteins der DNA-Bindungsdomäne (Aminosäuren 180 bis 254 gemäß Tabelle 7) und der Dimerisierungsdomäne (Aminosäuren 502 bis 660 gemäß Tabelle 7) entsprechen und/oder die Transaktivierungsdomäne vom Transkriptionsfaktor GAL4 (Aminosäuren 768 bis 881 ) stammt.
Ein weiterer Gegenstand der Erfindung ist ein DNA-Molekül, kodierend für ein Protein wie vorgehend beschrieben. Dieses DNA-Molekül ist insbesondere dadurch gekennzeichnet, daß
(a) es eine DNA-Sequenz gemäß Tabelle 6 (SEQ ID NO.: 20) oder Teile davon enthält;
(b) es eine DNA-Sequenz enthält, die in der Lage ist, mit dem DNA-Molekül gemäß (a) unter stringenten Bedingungen zu hybridisieren, oder Teile davon; (c) es eine DNA-Sequenz enthält, die aufgrund der Degeneriertheit des genetischen Codes von den DNA-Molekülen gemäß (a) und (b) verschieden ist, jedoch die Expression der entsprechend mit den DNA-Molekülen gemäß (a) und (b) exprimierbaren Proteinen ermöglicht, oder Teile davon.
Ein weiterer Gegenstand der Erfindung ist ein Vektor, enthaltend eine DNA wie vorhergehend beschrieben. Insbesondere ist dieser Vektor dadurch gekennzeichnet, daß es ein Vektor geeignet zur Expression in Acremonium chrysogenum oder Saccharomyces cerevisiae ist.
Bevorzugt ausgewählt wird der Vektor aus der Gruppe enthaltend die Vektoren pGC1 und pGC1ΔDIM1.
Ein weiterer Gegenstand der Erfindung ist eine Wirtszelle, enthaltend eine oder mehrere Kopien eines Vektors oder einer DNA wie vorhergehend beschrieben, insbesondere dadurch gekennzeichnet, daß sie ausgewählt ist aus der Gruppe enthaltend Acremonium chrysogenum und Saccharomyces cerevisiae.
Ein weiterer Gegenstand der Erfindung ist ein Verfahren zur Herstellung eines DNA- bindenden Proteins wie vorhergehend beschrieben, dadurch gekennzeichnet, daß eine DNA wie vorhergehend beschrieben mittels eines Vektors wie vorhergehend beschrieben in einer Wirtszelle wie vorhergehend beschrieben exprimiert und isoliert wird.
Ein weiterer Gegenstand der Erfindung ist ein Verfahren zur Steigerung der Cephalosporin C-Ausbeute in Acremonium chrysogenum, bei dem die Expression des cpcR1 -Genprodukts variiert wird, insbesondere dadurch gekennzeichnet, daß die variierte Expression durch Einbringen einer oder mehrerer Kopien des cpcR1- Gens in den Wirtsorganismus zusätzlich zum endogenen cpcR1-Gen, erreicht wird oder auch dadurch gekennzeichnet, daß die variierte Expression durch Integration einer oder mehrerer zusätzlicher DNA-Bindesequenzen TTGCCGGGCCAAT (SEQ ID NO.: 1 ) oder Varianten gleicher Funktion des DNA-bindenden Proteins wie vorhergehend beschrieben, im pcbAB/pcbC-Promotors erreicht wird.
Ferner ist Gegenstand der Erfindung eine DNA-Bindungsstelle für ein DNA- bindendes Protein wie vorhergehend beschrieben, ausgewählt aus der Gruppe enthaltend die doppelsträngigen Sequenzen GTTGCCGGGCCAATCCCTGAGCTT (SEQ ID NO.: 3), TTGCCGGGCCAAT (SEQ ID NO.: 1 ) und GTTGCCGGGCGTATCCCTGAGCTT (SEQ ID NO.: 8).
Ein weiterer Gegenstand der Erfindung ist ein Vektor wie vorhergehend beschrieben, enthaltend eine oder mehrere Kopien der DNA-Bindesequenzen des erfindungsgemäßen DNA-bindenden Proteins wie vorhergehend beschrieben.
Die Erfindung wird nun anhand der Beispiele, Figuren und Tabellen beschrieben, ohne darauf beschränkt zu sein.
Beispiel 1 :
Isolation der cpcR1-cDNA von Acremonium chrysogenum mit Hilfe des ONE-
HYBRID-SYSTEMS
Die im vorausgegangenen beschriebene DNA-Sequenz aus dem pcbABIpcbC- Promotorbereich wurde eingesetzt um mittels des ONE-HYBRID-SYSTEMS cDNA- Klone von A. chrysogenum zu isolieren, die für DNA-Bindeproteine kodieren. Es wurde grundsätzlich so vorgegangen, wie im "Matchmaker One Hybrid System protocol" von Gontech beschrieben. Es wurde ein Oligonukleotid mit einer Länge von 80 Nukleotiden (nt) synthetisiert, welches die DNA-Sequenz (Position -447 bis 423 im pcbAB/pc-bC-Promotor) in dreifacher Kopie enthält (Tabelle 3). Am 5' -Ende wurden die Nukleotide AATTC zugefügt, um einen EcoRI-Überhang zu erzeugen. Am 3'-Ende besitzt das Oligonukleotid die Nukleotide CCC, die zur Erkennungssequenz des Restriktionsenzyms Sma\ gehören. Zudem wurde ein Oligonukleotid von 76 nt synthetisiert, dessen Sequenz komplemantär zum ersten Oligonukleotid ist. Das 3'-Ende dieses Oligonukleotids schließt mit einem G, so daß bei der Hybridisierung der beiden Oligonukleotide ein doppelsträngiges DNA- Molekül entsteht, dessen 5'-Ende durch einen EcoRI-Überhang charakterisiert ist. Dieses doppelstrangige DNA-Molekül (BSII) wurde in die Reportergenplasmide pHISi und pLACZi (Gontech) integriert. Die Plasmide wurden zuvor mit den Restriktionsenzymen EcoRI und Smal geschnitten. Die erhaltenen Plasmide pHISi- BSII und pLACZi-BSII (siehe Tabelle 4) wurden mittels DNA-Transformation in das Genom des Rezipientenstammes integriert.
Der resultierende Hefestamm (siehe Tabelle 5) wurde zur Transformationen einer cDNA-Bank von A. chrysogenum eingesetzt. Als Ausgangsmaterial für die cDNA- Synthese diente mRNA des A. chrysogenum-Stammes A3/2 (Radzio und Kück, 1997; DSM 11878) und für die Konstruktion der cDNA-Bank wurde der Hefevektor pGAD424 (Gontech) verwendet.
Es wurden .zwei identische Klone identifiziert, die auch in wiederholten in vivo- Experimenten zu einer nachweisbaren DNA-Protein-Interaktion mit dem Zielelement führten. Die DNA-Sequenz der isolierten cDNA von A. chrysogenum ist in Tabelle 6 dargestellt. Der isolierte Klon umfaßt ein cDNA-Fragment von 2541 bp und zusätzlich ein PolyA-Ende von ca. 80 Nukleotiden.
Beispiel 2:
Homologie des CPCR1 -Proteins zu Transkriptionsfaktoren der RFX-Familie
Die DNA-Sequenz der beschriebenen aus A. chrysogenum isolierten cDNA enthält einen offenen Leserahmen für 786 Aminosäuren (Tabelle 7). Ein Computervergleich der Proteinsequenz des cpcR1-Gens mit der EMBL-Datenbank ergab Homologien von 28 bis 22 Prozent zu verschiedenen Mitgliedern der Familie der RFX-Proteine. Die höchste Homologie besteht mit 28 % zum SAK1 -Protein von Schizosaccharomyces pombe. Das humane RFX1 -Protein ist von allen Mitgliedern der Familie am besten charakterisiert und besitzt zum CPCR1 -Protein eine Homologie von 23,9 % über einen Bereich von 476 Aminosäuren. Die Homologien innerhalb der konservierten Proteindomänen liegen deutlich höher (Abbildung 3 und Tabellen 8 und 9). Die Transkriptionsfaktoren der RFX-Familie sind durch eine Reihe von konservierten Proteindomänen gekennzeichnet (Übersicht bei Emery et al. 1996). Die Proteine besitzen eine 76 Aminosäuren umfassende sogenannte RFX-DNA-Bindedomäne, deren Konsensus-Sequenz keine Homologie zu anderen bekannten DNA-Bindedomänen aufweist. Daneben enthalten die meisten Mitglieder der Proteinfamilie eine putative Dimerisationsdomäne, die weniger stark konserviert ist. Durch Homologievergleiche der RFX-Proteine konnten weitere konservierte Proteinregionen (A,B und C) lokalisiert werden, deren Funktion unbekannt ist. Außerdem enthalten einige Mitglieder der Familie Bereiche, in denen bestimmte Aminosäuren besonders häufig vorkommen. Das CPCR1 -Protein besitzt die konservierten Regionen B und C, sowie im N-terminalen Bereich eine Prolin- und Glutamin-reiche und im C-terminalen Teil eine Asparaginsäure- und Glutaminsäurereiche Region (Abbildung 3).
Die Deletion der C-terminalen 1 ,3 kb des CPCR1 -Proteins in dem Vektor μGC1 führt zu dem Plasmid pGCIΔDIMI . Bei dieser Deletionsmutante sind die Nukleotide 1213 bis 2372 gemäß Tabelle 6 deletiert. Dies bedeutet, daß das mit dem Plasmid pGCIΔDIMI exprimierbare Protein die Aminosäuresequenz von Position 1 bis Position 402 gemäß Tabelle 6 hat.
Hefezellen des Stammes BSII (siehe Tabelle 2) mit dem Plasmid pGCIΔDIMI sind im Gegensatz zu solchen mit dem Ausgansplasmid pGC1 nicht mehr in der Lage auf HIS-Selektionsplatten mit 55 mM 3-Aminotriazol zu wachsen. Dies deutet darauf hin, daß die DNA-Bindeaktivität des CPCR1 -Proteins von der Dimerisationsdomäne abhängt. Möglicherweise bindet der Transkriptionsfaktor in diesem in vivo- Experiment nur als Homodimer an die DNA-Zielsequenz und führt somit zur Expression des HIS3-Reportergens. Beispiel 3:
In Vo-Analysen zur Spezifität der DNA-Protein-Interaktion des CPCR1 -Proteins
Transkriptionsfaktoren sind DNA-Bindeproteine, die in den meisten Fällen durch eine spezifische Interaktion mit DNA-Sequenzen eines Promotors an der transkriptionellen Regulation der Genexpression beteiligt sind. Zur exakten Bestimmung der Nukleotide, die für die spezifische Interaktion des CPCR1 -Proteins mit Bereichen des pcöAB/pcöC-Promotors notwendig sind, wurden Mutationen in die präsumptive Bindestelle eingebracht. Es wurden hierzu Oligonukleotide synthetisiert (BSIIml -3), deren Sequenz jeweils an einer Stelle über einen Bereich von 2 bis 5 Nukleotiden von der Ausgangssequenz (BSIl) abweicht. In der Tabelle 2 sind die Sequenzen der mutierten Oligonukleotide angegeben. Die dargestellen Sequenzen wurden in dreifacher Kopie synthetisiert und wie in Beispiel 1 beschrieben in das Hefegenom integriert. Die Reportergenaktivität des /acZ-Gens bei Expression des CPCR1 -Proteins in den resultierenden Hefestämmen ist in der Tabelle 2 angegeben. Die Substitution der Nukleotide CCAAT zu GGTTA in dem Oligonukleotid BSIIml führt zu einem Verlust der /acZ-Aktivität des entsprechenden Hefestammes. Die Nukleotide CM bilden möglicherweise die rechte Hälfte einer palindromischen Erkennungssequenz für den Faktor CPCRl Bei einer Substitution der entsprechenden Nukleotide (TTG zu AAC) in der putativen linken Hälfte des Palindroms ist ebenfalls ein Verlust der /acZ-Aktivität festzustellen (siehe BSIIm3). Diese Ergebnisse sprechen dafür, daß die Erkennungssequenz des Transkriptionsfaktors CPCR1 eine palindromische Struktur aufweist. Eine Substitution der Nukleotide GT in dem Oligonukleotid BSIIm2 zerstört das Palindrom nicht vollständig und bewirkt auch keinen Verlust der /acZ-Aktivität. Beispiel 4:
Nachweis des cpcR1-Gens in Acremonium chrysogenum durch DNA-
Hybridisierungen
In der Figur 4 ist eine Southern-Hybridisierung unter stringenten Bedingungen mit genomischer DNA des Acremonium chrysogenum Stammes A3/2 dargestellt. Die DNA wurde mit den Restriktionsenzymen EcoRI, SamHI bzw. Hind\\\ geschnitten und gelelektrophoretisch aufgetrennt. Als Sonde diente ein 2,4 kb-Fragment der
cpcR1-cDNA, welches mit 32Phosphor radioaktiv markiert wurde. Bei dem 2,4 kb großen Hybridisierungsfragment handelt es sich um ein Pstl-Fragment, welches innerhalb des rekombinanten Plasmids pGC1 folgende Position einnimmt: das Fragment erstreckt sich von der PstI Erkennungsstelle an der Nukleotidposition 129 innerhalb des offenen Leserahmens des cpcRI-Gens bis zur Pstl-Erkennungsstelle innerhalb der multiplen Klonierungsstelle des rekombinanten Plasmids. Die multiple Klonierungsstelle stammt von dem Ausgangsvektor pGAD424. Somit sind in dem Hybridisierungsfragment alle Genbereiche enthalten, mit Ausnahme der ersten 129 Nukleotide. Da in der genomischen DNA jeweils nur 1 Fragment markiert wird (7 bis ca. 15 kb), liegt das cpcR1-Gen wahrscheinlich in Einzelkopie im Genom von A. chrysogenum vor.
Hybridisierungspuffer: 50 % Formamid; 5x SSPE; 0,2 % SDS; 100 μg/ml Heringssperma-DNA; Hybridisierungsbedingungen: 1 h Vorhybridisierung bei 37°C; 12 h Hybridisierung mit radioaktiv (32P)-markierter Sonde; Waschpuffer: 5x SSPE, 0,2 % SDS; Waschbedingungen: 10 min bei 60°C.
Beispiel 5:
Nachweis des cpcR1 -Gentranskripts in Acremonium chrysogenum durch RNA-
Hybridisierungen
Die Expression des cpcR1-Gens in 3 verschiedenen Acremonium chrysogenum Stämmen wurde mittels einer Northem-Hybridisierung untersucht (Figur 5). Das als Sonde eingesetzte radioaktiv-markierte Fragment des cpcR1-Gens (s. o.) markiert in der Gesamt-RNA von A. chrysogenum ein RNA-Molekül von etwa 3,5 kb. Die Unterschiede in der Intensität der Hybridisierung zwischen den 3 Pilzstämmen (A c. ATCC 14553, A3/2 und Ad ) deuten auf eine unterschiedlich starke Expression des cpcR1-Gens hin. Eine höhere Expression des Transkriptionsfaktors CPCR1 in den beiden Semi-Produzentenstämmen A3/2 und Ad korreliert mit der erhöhten Cephalosporin-Syntheseleistung dieser Stämme. Dieses Ergebnis weist auf die mögliche regulatorische Wirkung des CPCR1 -Proteins für die Cephalosporin C- Biosynthese hin. Hybridisierungspuffer: 50 % Formamid; 5x SSPE; 0,2 % SDS; 200
μg/ml Heringssperma-DNA; Hybridisierungsbedingungen: 2 h Vorhybridisierung bei 37°C; 12 h Hybridisierung mit radioaktiv (32P)-markierter Sonde; Waschpuffer: 5x SSPE, 0,2 % SDS; Waschbedingungen: 10 min bei 60°C.
Beispiel 6:
Konstruktion von Expressionsvektoren für Acremonium chrysogenum
Im folgenden werden die Expressionsvektoren plR11 , plR12, plR13, plR21 , plR22, plR23, plR31 , plR32 und plR33 beschrieben. Die Konstruktion der Vektoren wurde nach Standardmethoden der molekularen Genetik vorgenommen (Sambrook et al. 1989). Die Nukleotidsequenz der Vektoren ist aus Tabelle 10 abzuleiten.
Allgemeine Beschreibung der Vektoren:
1. Alle Vektoren basieren auf dem bakteriellen Plasmid PCRScript+AmpSK(+) (Stratagene, Heidelberg) und erhalten für die Vermehrung in E. coli einen Replikationsursprung, welcher in E. coli wirksam ist. Außerdem tragen sie ein Ampicillin-Resistenzgen, welches für eine ß-Lactamase kodiert. Die Selektion in E.coli wird durch das Resistenzgen ermöglicht. In Tabelle 10 wird der PCRScript+AmpSK(+)-Anteil als "bakterieller Anteil" bezeichnet. 2. Alle Vektoren enthalten den Promotorbereich des pcbC-Gens (Samson et al. 1985, Menne et al. 1994).
3. Alle Vektoren enthalten die Transkriptions-Terminationssignale des pcbC- Gens (Samson et al. 1985)
4. Die Vektoren enthalten variable Klonierungsinsertionsschnittstellen, die durch die Linker der Tabelle 11 bestimmt werden.
Die drei unterschiedlichen Klonierungsinsertionsstellen unterscheiden sich lediglich durch einzelne Nukleotide (unterstrichen in der Tabelle 11 ). Dadurch ist eine
Translationsfusion von zwei Gensequenzen in den drei möglichen Leserahmen eines Protein-kodierenden Gens möglich.
5. Die Vektoren plR21 , plR22, plR23 und plR31 , plR32, plR33 enthalten Sekretions-Signalsequenzen für Translationsfusionen.
Um eine effiziente Expression und eine möglichst einfache Reinigung des heterologen Genprodukts zu ermöglichen, wurden unmittelbar vor der Klonierungsinsertionsstelle sogenannte Sekretions-Signalsequenzen eingefügt, die einen Transport des exprimierten Proteins in das endoplasmatische Reticulum und schließlich eine Sekretion aus den Zellen bewirken. Das Genprodukt sollte somit in den Kulturüberständen der entsprechenden Pilztransformanten vorliegen. Es wurden zwei verschiedene Export-Signalsequenzen verwendet:
a) Zum einen handelt es sich um eine Sequenz mit einer Länge von 42 bp, die Teil eines Gens ist, das für eine alkalische Protease aus dem Pilz Fusarium sp. kodiert. Das kodierte Signalpeptid hat eine Länge von 14 Aminosäuren und wurde bereits in Saccharomyces cerevisiae und in A. chrysogenum auf seine Funktionalität getestet, jedoch nicht in Verbindung mit einem heterologen Gen (Kitano et al. 1992). Die Signalsequenz ist in den Vektoren plR21 , plR22 und plR23 enthalten.
b) Die zweite verwendete Signalsequenz stammt aus A. chrysogenum und ist ebenfalls Teil eines Gens, das für eine alkalische Protease kodiert. Diese Sequenz hat eine Länge von 60 bp, wobei das resultierende Signalpeptid, dessen Funktionalität gleichfalls in S. cerevisiae und A chrysogenum verifiziert wurde, eine Länge von 20 Aminosäuren hat (Isogai et al. 1991 ). Die Signalsequenz aus A. chrysogenum ist in den Vektoren plR31 , plR32, ρlR33 enthalten.
Zusammenfasend werden die Übergangssequenzen der neun Expressionsvektoren in der Tabelle 12 angegeben.
Beispiel 7:
Expression des CPCR1 Proteins in A chrysogenum
Die im Beispiel 6 beschreibenen Vektoren können benutzt werden, um das CPCR1 Protein in A. chrysogenum zu exprimieren.
Zu diesem Zweck kann das cpcR1-Gen aus dem Plasmid pGC1 durch PCR- Amplifikation (Sambrook et al. 1989) synthetisiert werden. Bei dieser Amplifikation werden die folgenden .zwei Primer eingesetzt (in Klammern sind die Positionen der Oligonukleotide innerhalb der Nukleotidsequenz gemäß Tabelle 6 genannt).
1. 5'CCT GCT ATG TAC GGA CAA GGG3' (10-30) (SEQ ID NO.: 54)
2. 5'CC TCG TCA TGC AGG AGC CGC CC3' (2351-2372) (SEQ ID NO.: 55)
Durch die Amplifikation erhält man ein 2362 bp großes DNA-Fragment, das durch DNA-Sequenzierung auf seine Korrektheit hin überprüft wird. Dieses Fragment wird in die Nrul-Restriktionsstelle des Plasmids plR11 kloniert. Durch das Enzym Nrul wird ein sogenanntes "stumpfes Ende" hergestellt, mit dem die Klonierung des PCR- Fragments ohne vorausgegangene Restriktrion möglich wird. Durch die Ligation des Vektors und des PCR-Fragments entsteht ein rekombinantes Plasmid mit der Bezeichnung plRS11 , das anschließend in E coli kloniert und vermehrt werden kann.
Durch anschließende DNA-Kotransformationsexperimente (Menne et al. 1994) wird das Plasmid in A.chrysogenum eingebracht. In der Regel erfolgt eine ektopische Integration des Plasmids in mehreren Kopien in das pilzliche Genom. Es können also pilzliche Transformanten mit mehreren Kopien des cpcRI-Gens unter der Kontrolle des pcbC-Promotors erhalten werden. Die anschließende molekulare Analyse der Pilztransformanten erlaubt die Selektion geeigneter Stämme. Diese sollten das CPCR1 -Protein übersynthetisieren und somit eine erhöhte Expression der Cephalosporin C-Biosynthesegene aufgrund der CPCR1-Wirkung zur Folge haben.
Beispiel 8:
Charakterisierung der Dimerisationsdomäne des CPCR1 -Proteins
Das CPCR1 -Protein besitzt vermutlich mindestens zwei wichtige funktioneile Domänen, die DNA-Bindedomäne und die Dimerisationsdomäne. Die Charakterisierung der potentiellen Dimerisationsdomäne wird im folgenden durch in vivo Experimente mit Derivaten des CPCR1 -Proteins beschrieben. Die Analysen wurden mit geeigneten Hefestämmen in Form von ONE-HYBRID und TWO-HYBRID Versuchen durchgeführt.
A. ONE-HYBRID Experimente zur in vivo DNA-Bindeaktivität von Wildtyp und mutiertem CPCR1 -Protein.
Mit dem ONE-HYBRID-System kann die DNA-Protein-Interaktion in vivo untersucht werden. Dabei besteht die Möglichkeit, die DNA-Bindesequenz zu variieren und so eine Aussage über Nukleotide zu erhalten, welche für die Protein-Bindung essentiell sind. Andererseits kann auch der Protein-Anteil des analysierten Komplexes verändert werden. In beiden Fällen wird die Stärke der Interaktionen durch eine Messung der Reportergenaktivität ermittelt.
Die Reportergenaktivität von Hefetransformanten im ONE-HYBRID-System bei Expression des cpcR1-Gens und dessen Deletionskonstrukten sind in der Figur 6 dargestellt. Das Plasmid pGC1 kodiert für ein Fusionsprotein aus der GAL4-AD und dem CPCR1 -Protein von A chrysogenum. Die Transformation dieses Plasmids in den Reportergenstamm mit der Bindestelle II aus dem pcJbC-Promotor resultiert in einer hohen ß-Galaktosidase-Aktivität (siehe Figur 6).
Während der Interaktion des CPCR1 -Proteins mit der Bindestelle erfolgt eine Aktivierung der Transkription des Reportergens durch die fusionierte GAL4-
Domäne. Die Expression des cpcR1-Gens ohne die aktivierende Domäne (CPCR1 ) führt wie in der Figur 6 zu erkennen nicht zu einer erhöhten Reportergenaktivität. In der Abbildung sind außerdem die Auswirkungen von Deletionen innerhalb des cpcR1-Gens dargestellt. Das Protein AD-DIM1 besitzt nur die N-terminale Hälfte des CPCR1 -Proteins. Dadurch fehlt die Dimerisationsdomäne vollständig, während die DNA-Bindedomäne erhalten bleibt. Hefetransformanten, in denen dieses Derivat des CPCR1 -Proteins gebildet wird, zeigen keine Reportergenaktivität, was auf eine fehlende DNA-Bindung hinweist. Die Auswirkungen einer kleineren Deletion sind bei dem Protein AD-DIM2 erkennbar. Hier beginnt die Deletion in der Mitte der Dimerisationsdomäne, so daß die N-terminale Hälfte der Domäne erhalten bleibt. Die ß-Galaktosidase-Aktivität eines Proteinextraktes von Hefetransformanten mit diesem Konstrukt liegt bei 32 U/mg Protein. Dies entspricht etwas mehr als 5 % der Aktivität des Wildtyp-Proteins. Diese ONE-HYBRID Versuche zeigen, daß Deletionen des CPCR1 -Proteins zu einem unterschiedlich starken Verlust der analysierten DNA-Bindeaktivität führen.
Der Einsatz von Derivaten des CPCR1 -Proteins im ONE-HYBRID-System erlaubt die Analyse funktioneller Proteindomänen. Die Dimerisationsdomäne des CPCR1- Proteins scheint eine entscheidende Rolle für die DNA-Bindeaktivität des Proteins zu besitzen, denn eine vollständige oder unvollständige Deletion dieser Domäne führt zu einer starken Abnahme der Reportergenaktivität.
B. TWO-HYBRID Experimente zur Bestimmung von Protein-Protein- Interaktionen zwischen dem CPCR1 -Protein und dessen Derivaten
Das TWO-HYBRID-System ermöglicht den direkten Nachweis von Protein-Protein- Interaktionen (Fields und Song 1989). Es wird, wie das ONE-HYBRID-System, in der Hefe S. cerevisiae durchgeführt. Die beiden auf eine mögliche Interaktion zu testenden Proteine müssen jeweils als Fusionsproteine mit zwei verschiedenen Domänen des GAL4-Proteins der Hefe in einen geeigneten Hefestamm eingebracht werden. Die DNA-Bindedomäne des GAL4-Proteins (BD) wird mit dem einem
Interaktionspartner fusioniert, die aktivierenden Domäne des GAL4-Proteins (AD) mit dem anderen Protein. Interagieren die beiden Proteine miteinander, gelangen die beiden GAL4-Domänen in räumliche Nähe zueinander und es kommt zur Expression von Reportergenen in den entsprechenden Hefetransformanten. Die im vorherigen Abschnitt verwendeten Derivate des CPCR1 -Proteins wurden auch im TWO-HYBRID-System eingesetzt. Dazu wurden das CPCR1 -Protein und die Proteine DIM1 und DIM2 (siehe Figur 6) mit der DNA-Bindedomäne (BD) des GAL4-Proteins fusioniert. Zusammen mit den bereits vorhandenen Konstrukten, die eine Fusion mit der aktivierenden Domäne (AD) darstellen, können diese Proteine auf Interaktionen untereinander getestet werden.
Es wurden sämtliche Kombinationen der bereits beschriebenen Proteine untersucht. Zu diesem Zweck wurden zunächst drei Stämme erzeugt, die jeweils die Fusionsproteine BD-CPCR1 , BD-DIM1 und BD-DIM2 exprimierten. Anschließend wurden in diese Stämme entweder eines der drei entsprechenden Konstrukte mit den AD-Fusionen oder eines von zwei Kontrollplasmiden transformiert. Bei den Kontrollplasmiden handelt es sich um das Plasmid pGAD424, welches nur für die AD kodiert und um das Plasmid pC1 , welches das cpcR1 -Gen ohne eine fusionierte GAL4-Domäne enthält. In der Figur 7A befindet sich eine schematische Darstellung der fünf Hefestämme mit den verschiedenen Proteinen. In dem verwendeten Hefestamm ist die Bindestelle des GAL4-Proteins stromaufwärts des H/S3-Gens integriert, so daß eine Interaktion der untersuchten Proteine zur Histidin-Prototrophie führt. Entsprechend wurde die Analyse der Protein-Protein-Interaktion in den Hefetransformanten auf Selektionsplatten durchgeführt (siehe Figur 7). Vom Wachstum der Hefezellen kann auf die Stärke der Interaktion geschlossen werden. Ein ganz schwaches Wachstum entlang der Impfstriche geht auf die Hintergrundaktivität des HIS3-Gens in den Hefezellen zurück.
Es wird deutlich, daß die Kombination von CPCR1 mit unverändertem CPCR1 zur stärksten Wechselwirkung führt (Figur 7B). Die Deletion im Protein DIM2 erlaubt noch eine Interaktion mit sich selbst, wenngleich die Affinität der Interaktionspartner
sehr gering ist (Figur 7D). Das Protein DIM1 mit der größeren Deletion kann dagegen nicht mehr mit sich selbst interagieren (Figur 7C).
In der Abbildung 15B und D ist auch zu erkennen, daß das vollständige CPCR1-
Protein mit beiden Derivaten DIM1 und DIM2 interagieren kann. Allerdings ist die
Interaktion mit DIM2 wesentlich stärker als mit DIM1. Die Kontrollproteine, AD und
CPCR1 ohne die Fusion, führen in keinem Fall zu einem Wachstum der
Hefetransformanten.
Durch TWO-HYBRID Versuche konnte gezeigt werden, daß das CPCR1 -Protein mit sich selbst interagiert. Der Bereich der Dimerisationsdomäne ist für eine starke Interaktion notwendig, wenngleich eine schwache Interaktion wahrscheinlich auch über die N-terminale Hälfte des Proteins vermittelt werden kann. Beispiel 9:
Nachweis einer spezifischen Bindung des CPCR1 -Proteins an eine palindromische
Sequenz des pcbC-Promotors
Bereits beim Durchsuchen der cDNA-Bank nach möglichen positiven Hefetransformanten wurde neben der Wildtyp-Bindestelle BSIl aus dem pcbC- Promotor auch die mutierte Bindestelle BSIIml als Spezifitätskontrolle eingesetzt. Dadurch konnte überprüft werden, ob der isolierte putative Transkriptionsfaktor von A. chrysogenum mit der Bindestelle in den Hefezellen sequenzspezifisch interagiert ist. Weitere Mutationen und Gelretentionsanalysen erlauben eine genauere Bestimmung der Bindestelle des CPCR1 -Proteins.
A. In vivo Analysen des CPCR1 -Proteins mit mutierten Bindestellen unter Verwendung des ONE-HYBRID-Systems
Das 24 Nukleotide umfassende DNA-Fragment BSIl aus dem pcbC-Promotor, welches als potentielle Bindestelle eines Transkriptionsfaktors für den Einsatz im ONE-HYBRID-System ausgewählt wurde, enthält mit der Basenabfolge 5'-CCAAT-3'
eine putative CCAAT-Box. Einige der Nukleotidpositionen in der CCAAT-Box sind zusätzlich Teil einer palindromischen Struktur. In der Figur 2 ist diese Sequenz wiedergegeben (BSIl), wobei Nukleotide unterstrichen sind, die Teil des Palindroms sind. Mit Hilfe von Hefe-Reportergenstämmen wurde untersucht, wie sich Mutationen in der CCAAT-Box und anderen Bereichen des Palindroms auf die in vivo DNA-Protein-Interaktion im ONE-HYBRID-System auswirken. Dazu wurden die in Figur 2 dargestellten mutierten Bindestellen BSIIm2 und BSIIm3 in je dreifacher Kopie vor die Reportergene HIS3 und lacZ integriert, so daß zusammen mit BSIIml für jedes Reportergen insgesamt drei Reportergenstämme mit mutierten Bindestellen zur Verfügung standen. Bei dem Stamm mit der Bindestelle BSIIml handelt es sich um den bereits beschriebenen Reportergenstamm, der zur Selektion des cDNA-Klons eingesetzt wurde (siehe Beispiel 1 ). Nach der Transformation des Expressionsplasmids mit der cDNA des cpcR1 -Gens in die genannten Reportergenstämme konnte die Aktivität der Reportergene analysiert werden.
Die Aktivität des H/S3-Gens in den Transformanten wurde durch einen Wuchstest auf Selektionsplatten, die Expression des /acZ-Gens durch eine Messung der Enzymaktivität bestimmt. Proteinextrakte aus Hefestämmen mit der Wildtyp- Sequenz BSIl zeigen eine Aktivität der ß-Galaktosidase von 603 U/mg Proteinextrakt. In dem Stamm mit der Sequenz BSIIml ist die gesamte CCAAT-Box mutiert und damit auch die rechte Hälfte des Palindroms. In Transformanten dieses Stammes ist die Aktivität der ß-Galaktosidase mit neun U/mg Proteinextrakt sehr gering. Auch eine Mutation der linken Hälfte des Palindroms (BSIIm3, 5,7 U/mg) führt zu einem Verlust der Reportergenexpression, was auf eine gestörte DNA- Protein-Interaktion hinweist. In der Sequenz BSIIm2 werden innerhalb der CCAAT- Box nur zwei Nukleotide ausgetauscht. Die resultierende Aktivität der ß- Galaktosidase beträgt mit 140 U/mg Proteinextrakt weniger als ein Viertel der Wildtyp-Aktivität.
Reportergenanalysen mit mutierten Bindestellen im ONE-HYBRID-System zeigten, daß das CPCR1 -Protein spezifisch an eine palindromische Sequenz aus dem pcbC-
Promotor bindet. Die rechte Hälfte des Palindroms fällt mit einer CCAAT-Box zusammen. Beide Hälften des Palindroms sind für eine Bindung essentiell.
B. In vitro Gelretentionsanalysen mit Proteinextrakten aus A. chrysogenum und rekombinanten Hefestämmen
Die Interaktion zwischen einem Protein und einem bekannten DNA-Fragment kann auch in vitro mittels der Gelretentionsanalyse untersucht werden, bei der radioaktiv markierte DNA, welche die Protein-Bindestelle enthält, mit Proteinextrakten inkubiert wird. Anschließend werden DNA-Protein-Komplexe gelelektrophoretisch von freien DNA-Molekülen getrennt und durch Autoradiographie nachgewiesen. Ein doppelsträngiges Oligonukleotid, welches dreimal die Sequenz der Bindestelle BSIl (siehe Figur 2) enthält, wurde durch den Einbau radioaktiver Nukleotide markiert und mit verschiedenen Proteinextrakten inkubiert. Protein-Rohextrakte wurden aus
A. chrysogenum und rekombinanten Hefestämmen gewonnen und durch „Fast- Protein-Liquid"-Chromatographie (FPLC) unter Verwendung einer Heparinsäule aufgereinigt und fraktioniert.
Mit Proteinextrakt aus Acremonium und aus einem Hefestamm, der das CPCR1- Protein bildet, konnte eine spezifische DNA-Protein-Interaktion mit der Bindestelle II nachgewiesen werden. Die Spezifität der Bindung wurde durch Kompetitionsanalysen untersucht. Durch die Zugabe von nicht radioaktiv markierten DNA-Molekülen zum Reaktionsansatz kann getestet werden, ob das Protein auch an diese DNA-Moleküle bindet und damit im verminderten Umfang den spezifischen DNA-Protein-Komplex bildet. Eine Kompetition mit der Bindestelle II führt zu einer starken Abnahme des Komplexes. Bei Zugabe von Oligonukleotiden mit einer mutierten Sequenz (BSIIm3) kann dies nicht beobachtet werden. Dies deutet auf eine spezifische Interaktion zwischen dem CPCR1 -Protein und der Bindestelle II hin.
Des weiteren wurden Gelretentionsanalysen mit 2 weiteren Hefestämmen vorgenommen. Der eine Hefestamm exprimiert das CPCR1 -Protein als
Fusionsprotein mit der transkriptionsaktivierenden Domäne des GAL4-Proteins der Hefe (AD-CPCR1 ). Der andere Stamm wurde als Kontrolle verwendet und exprimiert nur die Domäne des GAL4-Proteins (AD). Dieser Kontrollproteinextrakt führt nicht zur Bildung des spezifischen DNA-Protein-Komplexes, der mit dem Protein AD- CPCR1 beobachtet werden kann. Durch diesen Vergleich der Hefeproteinextrakte konnte gezeigt werden, daß der Proteinextrakt AD-CPCR1 aus dem rekombinanten Hefestamm für in vitro Bindungsstudien geeignet ist.
Durch Gelretentionsanalysen konnte eine spezifische Interaktion von Proteinextrakten aus A chrysogenum und rekombinanten Hefestämmen mit der Bindestelle II nachgewiesen werden. Damit bestätigt sich die Spezifität der Bindung des CPCR1 -Proteins an die palindromische Sequenz aus dem pαbC-Promotor auch in vitro.
Beispiel 10:
Genomische DNA von A. chrysogenum enthaltend das CPCR1-Gen
Es wurde ein genomisches DNA-Fragment aus A chrysogenum isoliert, welches das CPCR1-Gen enthält. Die Sequenz ist in Tabelle 13 gezeigt (SEQ ID NO.: 57). Der offene Lexrahmen beginnt bei Position 535 und endet bei Position 3130. Es sind 2 Introns enthalten: Intron 1 von Position 1215 bis Position 1267, Intron 2 von Position 1568 bis Position 1619.
Figurlegenden:
Fig. 1 : Schema des ONE-HYBRID-SYSTEMS. Ein Hefe-Reportergenstamm wird mit einer Expressionsgenbank von A. chrysogenum transformiert. Bei einer DNA- Protein-Interaktion .zwischen dem heterologen Anteil des Fusionsproteins und dem analysierten DNA-Element (E) kommt es zur Expression des Reportergens (HIS3). Dieses Prinzip der Selektion auf Histidin-Auxotrophie erlaubt die direkte Identifizierung von Transformanden, deren Expressionsplasmid für einen möglichen
/rans-Faktor kodiert. Abkürzungen: AD: transkriptionsaktivierende GAL4-Domäne, BP: DNA-Bindeprotein, E: analysiertes DNA-Element, HIS3: Histidin- Biosynthesegen, P: Promotor
Fig. 2: Schematische Darstellung des intergenischen Promotorbereiches der pcbAB/ pcbC-Gene von Acremonium chrysogenum. Der Promotorbereich ist schraffiert, die Translationsstartpunkte der beiden divergenten Gene sind durch Pfeile markiert. Dargestellt ist die Sequenz (Position -447 bis -423) des Promotors, welche in dem ONE-HYBRID-SYSTEM zur Selektion spezischer Transkriptionsfaktoren eingesetzt wurde, sowie Variationen davon. Ebenfalls dargestellt wird die quantitative Analayse der Aktivität der ß-Galaktosidase von entsprechenden Reportergenstämmen.
Fig. 3: Schematische Darstellung des CPCR1 -Proteins. Die DNA-Bindedomäne (DBD) und die Dimerisationsdomäne (DIM) sind durch einen fettgedruckten Rahmen gekennzeichnet. Außerdem sind die innerhalb der RFX-Familie konservierten Regionen B und C eingezeichnet. Proteinregionen, die einen erhöhten Anteil bestimmter Aminosäuren enthalten sind mit PQ (Prolin und Glutamin) bzw. mit DE (Asparaginsäure und Glutaminsäure) markiert.
Fig. 4: Southern-Hybridisierung von Gesamt-DNA des A cfttysogenttm-Stammes Ad . Die Gesamt-DNA wurde mit Restriktionsenzymen wie angegeben geschnitten und gelelektrophoretisch aufgetrennt. Als Sonde wurde ein radioaktiv-markiertes Ps/I-Fragment des cpcR1-Gens mit einer Größe von 2,4 kb eingesetzt. Als Positivkontrolle für die Hybridisierung diente das Plasmid pGC1 , welches die cpcR1-cDNA enthält.
Fig. 5: Northem-Hybridisierung mit Gesamt-RNA der A. chrysogenum-Stämme ATCC 14553 (Spurl ), A3/2 (Spur2) und Ad (Spur3). Als Sonde wurde ein radioaktiv-markiertes Psfl-Fragment des cpcR1-Gens mit einer Größe von 2,4 kb eingesetzt.
Fig. 6: Schematische Darstellung der im ONE-HYBRID-System eingesetzten Proteine und der ß-Galaktosidase-Aktivität der entsprechenden Hefetransformanten. Die ß-Galaktosidase-Aktivität wurde aus mindestens drei Experimenten ermittelt. Wichtige Abkürzungen: AD: transkriptionsaktivierende Domäne des GAL4-Proteins, DBD: DNA-Bindedomäne, DIM: Dimerisationsdomäne, DIM1/2: Deletionskonstrukte des cpcR1-Gens, U ß-Gal: U ß-Galaktosidase pro mg Protein. Alle weiteren Bezeichnungen entsprechen den Anmerkungen zu Figur 3. Fig. 7: Reportergenanalyse von TWO-HYBRID Experimenten mit dem CPCR1- Protein und deletierten Derivaten des CPCR1 -Proteins. A) Schematische Darstellung der Hefestämme mit den jeweiligen Proteinen. B), C) und D) Photographien von Histidin-Selektionsplatten. Interaktionen der untersuchten Proteine führen in Hefetransformanten zu einer Expression des /7/S3-Gens, die den Hefezellen das Wachstum ermöglicht. Die Selektionsplatten enthalten kein Histidin, Leucin und Urazil, aber 6 mM 3-Aminotriazol. Abkürzungen: AD: aktivierende Domäne, BD: DNA-Bindedomäne. Schematische Darstellung der Proteine siehe Figur 6.
Literatur
Cheng H, Kinsey JA (1995) Purification of a heteromeric CCAAT binding protein from Neurospora crassa. Mol Gen Genet 249: 301-308
Chiang T, Marzluff GA (1995) Binding affinity and functional significance of NIT2 and NIT4 binding Sites in the promoter of the highly regulated nit-3 gene, which encodes nitrate reductase in Neurospora crassa. J Bacteriol 177: 6093-6099
Gontech (1995) Matchmaker One-Hybrid System protocol. Catalog # K1603-1
Emery P, Durand B, Mach B, Reith W (1996) RFX proteins, a noval family of DNA binding proteins conserved in the eukaryotic kingdom. NucI Acids Res 24: 803-807
Fields S, Song O (1989) A novel genetic System to detect protein-protein interactions. Nature 340: 245-246
Fu YH, Paietta JV, Mannix DG, Marzluf GA (1989) Cys-3, the positive-acting sulfur regulatory gene of Neurospora crassa, encodes a protein with a putative leucine zipper DNA-binding element. Mol Cell Biol 9:1120-1127 Isogai T, Fukagawa M, Kojo H., Kohsaka M, Aoki H, Imanaka H (1991 ) Cloning and nucleotide sequences of the complementary and genomic DNAs for the alkaline protease from Acremonium chrysogenum Agric. Biol. Chem. 55:471-477
Kang S, Metzenberg RL (1990) Molecular ananlysis of nuc- +, a gene Controlling phosphorus acquisition in Neurospora crassa. Mol Cell Biol 10: 5839-5848
Kitano K, Morita S, Kuriyama M, Mejima K (1992) Alkaline protease gene from Fusarium. European Patent No. 0519229A2
Kudla B, Caddick MX, Langdon T, Martinez-Rossi NM, Bennett CF, Sibley S, Davis RW, Arst HN Jr (1990) The regulatory gene areA mediating nitrogen metabolite repression in Aspergillus nidulans. Mutations affecting specificity of gene activation alter a loop residue of a putative zinc finger. EMBO J 9: 1355-1364
Marzluff GA (1993) Regulation of sulfur and nitrogen metabolism in filamentous fungi. Annu Rev Microbiol 47: 31-55
Menne S, Walz M, Kück U (1994) Expression studies with the bidirectional pcbAB- pcbC promoter region from Acremonium chrysogenum using reporter gene fusions. Appl. Microbiol. Biotechnol. 42: 57-66
Nosek J, Radzio R, Kück U (1997) Produktion von ß-Lactamantibiotika durch Mikroorganismen. Chemie in unserer Zeit 31 : 172-182
Nussinov R (1992) The eukaryotic CCAAT and TATA boxes, DNA spacer flexibiltity and looping. J Theor Biol 155: 243-270
Pabo CO, Sauer RT (1992) Transcription factors: structural families and principles of DNA recognition. Annu Rev Biochem 61 : 1053-1095 Payne GA, Nystrem GJ, Bhatnagar D, Cleveland TE, Woloshuk CP (1993) Cloning of the alfl-2 gene involved in aflatoxin biosynthesis from Aspergillus flavus. Appl Environ Microbiol 59: 156-162
Radzio R (1996) Heterologe Genexpression in dem Cephalosporin C- produzierendem Hyphenpilz Acremonium chrysogenum. Dissertation, Ruhr- Universität Bochum
Radzio R, Kück U (1997) Efficient synthesis of the blood-coagulation inhibitor hirudin in the filamentous fungus Acremonium chrysogenum. Appl. Microbiol Biotechnol (199) 48: 58-65
Raymondjean M, Cereghini S, Yaniv M (1988) Several distinct „CCAAT" box binding proteins coexist in eukaryotic cells. Proc Natl Acad Sei 85: 757-761
Sambrook J. Fritsch EF, Maniatis T (1989) Molecular cloning - A laboratory manual. Cold Spring Harbour Laboratory Press, New York
Samson SM, Belagaje R, Blankenship DT, Chapman JL, Perry D, Skatrud PL, VanFrank RM, Abraham EP, Baldwin JE, Queener SW, Ingolia TD (1985) Isolation, sequence determination and expression in Escherichia co/ of the isopenicillin N synthetase gene from Cephalospohum acremonium. Nature 318: 191-194
Schjerling P, Holmberg S (1996) Comparative amino acid sequence analysis of the Cβ zinc cluster family of transcriptional regulators. NucI Acids Res 24: 4599-4607
Then Bergh K, Litzka O, Brakhage AA (1996) Identification of a major c/'s-acting DNA element Controlling the bidirectionally transcribed penicillin biosynthesis genes acvA {pcbAB) and \pnA {pcbC) of Aspergillus nidulans. J Bacteriol 178: 3908-3916 Wang MM, Reed RR (1993) Molecular cloning of the olfactory neuronal transcription factor Olf-1 by genetic selection in yeast. Nature 364: 121-126
Tabellen
Tab. 1 : Exemplarische Auswahl von Transkriptionsfaktoren bei Hyphenpilzen. Abkürzungen: bZIP: basic Leucin-Zipper, bHLH: basic Helix-Loop-Helix, Transfaktor: transaktivierender Faktor
Figure imgf000033_0001
Tab. 2: Monomere Teilsequenzen von Oligonukleotiden, die im ONE-HYBRID- SYSTEM eingesetzt wurden. Die Sequenz BSIl entspricht dem Bereich von -447 bis -423 des pα AB/pcoC-Promotors von A. chrysogenum. Die mutierten Oligonukleotide BSIIml -3 wurden zur Bestimmung der Bindesequenz des CPCR1- Proteins eingesetzt. Die von der Ausgangssequenz abweichenden Nukleotide sind in Fettdruck angegeben. Neben den Ergebnissen der Reportergenanalysen ist auch die Konsensus-Sequenz der Bindestellen des humanen RFX1 -Proteins angegeben. Unterstrichen sind solche Nukleotide innerhalb der Sequenzen, die an der Bildung eines Palindroms beteiligt sein könnten.
Figure imgf000034_0001
Tab. 3: Sequenzen komplementärer Oligonukleotide mit dreifach Kopien der putativen Transkriptionsfaktor-Bindesequenz aus dem p bAB/pcbC-Promotor. Oben ist die Wildtypsequenz angegeben, darunter Derivate mit Substitutionen der DNA-Bindestelle (unterstrichen). Die hybridisierten Oligonukleotide wurden in die Klonierungsstellen von Reportergenvektoren (pHISi und pLACi) integriert und mittels DNA-Transformation in das Hefegenom eingebracht.
Figure imgf000035_0001
Tab. 4: Übersicht über die verwendeten Hefeplasmide. Der Teil A der Tabelle enthält Hefeplasmide mit Integrationen der in Tabelle 3 aufgeführten Oligonukleotide. Es handelt sich um integrative Hefeplasmide. Der Teil B der Tabelle enthält Hefe-Expressionsplasmide, welche in die erzeugten Hefestämmen transformiert wurden und dort als autonom replizierende Plasmide vorliegen.
Figure imgf000036_0001
Tab. 5: Übersicht über die verwendeten Hefestämme. Die transgenen Hefestämme wurden durch die Transformation mit integrativen und/oder frei replizierenden Hefeplasmiden (siehe Tabelle 4) erzeugt.
Figure imgf000037_0001
Tab. 6: DNA-Sequenz des isolierten cDNA-Klons (cpcRI ) von Acremonium chrysogenum. Die angegebene Sequenz umfaßt 2546 bp (SEQ ID NO.: 20) und ist als einzelsträngiges, linearen DNA-Molekül in 5'-3'-Richtung dargestellt.
10 20 30 40 50 60 TCCAATATGC CTGCTATGTA CGGACAAGGG TGGTCATCAT CGTTTTCCCA GCAGAACCAC
70 80 90 100 110 120 GCCGGATATT CCACGCAGCC GCCGCAGCCG AGCCAGCAAG GACAGACATC GCAGATCCTC
130 140 150 160 170 180 CTTCTGCAGC AAGCAAGCAA CCCCGATGCG GCATCAAATC ATTTCCCTAT GAACGGCATG
190 200 210 220 230 240 AACGGCCACC CAATGGAATC CCAATTTCAT GCTCACCCGA TGCCAGCACA ACACCCGATA
250 260 270 280 290 300 CAACACTCGC AGCCTCACCT ACACCAGATG CATGCTCAGC ATCAAATGCC GGCCCATGCG
310 320 330 340 350 360 TTGAACCCAC ACACCTGGGC CAACGGAGAG AGCCAATCTG GAATGGATCA AACCGGTGAT
370 380 390 400 410 420 GCCCTGAAGG ACAATGCGAA TGGTCTCAAA AAGGGAAAGT CTAAGAGGAG GTCGAATGCC
430 440 450 460 470 480 AACAATGACG GCGAGATGAA GGAGCTTTTC GAGAGCAACC GCCACAAGTC GTTGGAGGAG
490 500 510 520 530 540 ATTGTTCAGG ATGTCAGGGG CAACGAGCGC GGTCCCAACG CAGAGCGCAA ACGTCAACTA
550 560 570 580 590 600 TATGCCATGC TCTGGCTCAA CTCAGCGTGC GTGGAAAGCA AGAACTCGAT CCCACGCGGC
610 620 630 640 650 660 CGGGTGTATC ACACTTATGC CTCAAAATGT ACCGACAGCA GAGTCGTAGT TCTCAACCCT
670 680 690 700 710 720 GCTAGTTTCG GGAAGTTGGT GCGAGTCGTC TTCCCATCCA TCAAAACCCG ACGACTTGGA
730 740 750 760 770 780 GTCCGGGGCG AGTCAAAGTA TCACTATTGC AACTTTCAAC TCCGTGATCC GCCACCGCCC
790 800 810 820 830 840 GAGGTGAGCG GGCTGCGAGA CGCTAGCGTT CCCGCTCCCG AAGAGGCAGC TAAGGGGGAG
850 860 870 880 890 900 GAGTTTGACT TCAACACACC GCCGAACCAG CAAAATGACG TCAAAGGAGC CAGTCGTTTA
910 920 930 940 950 960 CCATCGCCGG AGGATGCTTC TCATCCACCG GTCTCCCGCG CCACATCACG GACAAGCCAT
970 980 990 1000 1010 1020 GGATTGGGTT CGCACAGCCG TTACATTGTT CCGCAGCCGC GGCGACTGAA ATCGGGATGG
1030 1040 1050 1060 1070 1080 GCTGGGGGCA TCTGCGCAAC GTCCAAGACG CGCATCAAGC TCCGGGTCGC AACAGAGGCG
1090 1100 1110 1120 1130 1140 GAAACGAAAT TCGATTGGGA CGAGCCACTG GTGTTGCCGC CGATCGACCC GTTCCTGCCG
1150 1160 1170 1180 1190 1200 CCGCACACAG ATAAGGACGC GGCCGCCTCG CTGGTGGCCC TGTACCGCGC GCAGTTGACA
1210 1220 1230 1240 1250 1260 TCCCTCGCTG AGGCCTTCCG ATACATCAGG GACAAGAGCT TTTTCCACCT GTACACGTCC
1270 1280 1290 1300 1310 1320 TTCCACGGCA CATTGACGAT GCCTGTACAG AAGCTCTTTG CGCATCCGAG CATTGCTCCT
1330 1340 1350 1360 1370 1380 TGGATCGAGG AGTGCGACCT TGTTCTGTAC CAGCGGCTGA CCAAATTCGC CTTCACCATG
1390 1400 1410 1420 1430 1440 TCGCTCGTGG TGGTGCCTAA TGTGTATCTC AACCGGATGC GGTCCATCGC CGACCGTCTC
1450 1460 1470 1480 1490 1500 GTGCCGCACA TTGTGGACGT GTTCGGCGGG CATCCTGAGC ATGTGGTGCA AGCCAAGGCG
1510 9 1520 1530 1540 1550 1560 GGTCCGGCGG CCATCTTCGT AGGCATCCTG GAGCGGATGA CGCGTGTGAA CAAGACGGCG
1570 1580 1590 1600 1610 1620 CACGCGGCGG CCAGACCAGT GGCGTTGGAC GCCAACAGGG ACCAGATGTA CGCGGATTGG
1630 1640 1650 1660 1670 1680 CTGGAACTGG TCAACGCGCG CAAGATTGCC GAGTGCGTGC CGACGCGGGG AATGGACGAT
1690 1700 1710 1720 1730 1740 GTGGCGGAGC TACTTGTCAG GGAGATGCGG TATCTCGTGG ACCCCAAGAA CTATATTCCG
1750 1760 1770 1780 1790 1800 GATGACGAGA CTTCGAATGC CGATGCTGGA GGGGCCCGGT CACCGTTTGC CGTCAACCGA
1810 1820 1830 1840 1850 1860 TGGCGGGACT TTCTGATGAG TCTGCCCGGC AAGTTCCCGT ATGCGTCACA CGAAGACATT
1870 1880 1890 1900 1910 1920 GTTTGGTGCG TGGAGAGGGT GGGGACGGCG ATTGTGAGGG AGCTCACCTT GCAAGGGGGC
1930 1940 1950 1960 1970 1980 ACCAGCTTCA CAACGTGGTG GTCTATCAAG ACGTTCCTCG ACGAGGAGAT TATGTACCTG
1990 2000 2010 2020 2030 2040 GCCGAGGTTG GCGGGCTCAT GCATACGAAG AGCCTGCGCG ATGAGCCGTC AAGGCAGCAA
2050 2060 2070 2080 2090 2100 GCGACAACGG TCGTGACGGA AAGAGGCCAA AAAGGGGCCA CAGCGGACGA CGACGGTGAG
2110 2120 2130 2140 2150 2160 GTGGTGATGG GCGACGCAGG TCAGGAGGAA CCGATGGCGG TGGCGGCGTC GCCGGTGCAC
2170 2180 2190 2200 2210 2220 ACAGACCGGG CGCCATTCCC ACCGAAACAG GGACATGCGG CCAACATGGG CGACGCGGCA
2230 2240 2250 2260 2270 2280 AGTGATGCGC ACGATGACAG TGGGATAGGG ATCCGGACCC CCGAGACGGA CTTTCCGGTG
2290 2300 2310 2320 2330 2340
GACAAGTTTG GACTCCATGA GGCGGAGGCG GGGGTCACAG AACTAGCCTA CGAAGGGTTG
2350 2360 2370 2380 2390 2400
GATCGAGAAT GGGCGGCTCC TGCATGACGA GGCCTGACGA AGGCACGAAG AGATGAACAG
2410 2420 2430 2440 2450 2460
CACGTGTTGG ATTAACGGTA TATCCCGGGG TTCTGGTTAT GGGTCCGGAG TAGGTCATGT
2470 2480 2490 2500 2510 2520
CACTAAGGGG TCTATTGGGT AAATGTGATG TTGGGTCACT CTTCGAATTA TACCTCATTA
2530 2540 2550 2560 2570 2580 ATGCCACTAC TGCCTGATGA TAAAAA
Tab. 7: Aminosäuresequenz, abgeleitet vom ORF 786 aus dem cDNA-Klon (cpcRI) von Acremonium chrysogenum. Der offenen Leserahmen kodiert für 786 Aminosäuren (SEQ ID NO.: 21 ).
10 20
Met Arg Ala Asp Glu Pro Ala Ala Ala Ile Gin Ala Ser Ser Ala Ala Met Arg Pro Gin
30 40
Ser Arg Ala Ser Thr Ser Ser Thr His Ser Ala Ala Thr Gin Pro Thr Thr Asp Ala His
50 60
Asp Tyr Ser Asn Met Pro Ala Met Tyr Gly Gin Gly Trp Ser Ser Ser Phe Ser Gin Gin
70 80
Asn His Ala Gly Tyr Ser Thr Gin Pro Pro Gin Pro Ser Gin Gin Gly Gin Thr Ser Gin
90 100
Ile Leu Leu Leu Gin Gin Ala Ser Asn Pro Asp Ala Ala Ser Asn His Phe Pro Met Asn
110 120
Gly Met Asn Gly His Pro Met Glu Ser Gin Phe His Ala His Pro Met Pro Ala Gin His
130 140
Pro Ile Gin His Ser Gin Pro His Leu His Gin Met His Ala Gin His Gin Met Pro Ala
150 160
His Ala Leu Asn Pro His Thr Trp Ala Asn Gly Glu Ser Gin Ser Gly Met Asp Gin Thr
170 180
Gly Asp Ala Leu Lys Asp Asn Ala Asn Gly Leu Lys Lys Gly Lys Ser Lys Arg Arg Ser
190 200
Asn Ala Asn Asn Asp Gly Glu Met Lys Glu Leu Phe Glu Ser Asn Arg His Lys Ser Leu
210 220
Glu Glu Ile Val Gin Asp Val Arg Gly Asn Glu Arg Gly Pro Asn Ala Glu Arg Lys Arg
230 240
Gin Leu Tyr Ala Met Leu Trp Leu Asn Ser Ala Cys Val Glu Ser Lys Asn Ser Ile Pro
250 260
Arg Gly Arg Val Tyr His Thr Tyr Ala Ser Lys Cys Thr Asp Asp Arg Val Val Val Leu
270 280
Asn Pro Ala Ser Phe Gly Lys Leu Val Arg Val Val Phe Pro Ser Ile Lys Thr Arg Arg
290 300
Leu Gly Val Arg Gly Glu Ser Lys Tyr His Tyr Cys Asn Phe Gin Leu Arg Asp Pro Pro
310 320
Pro Pro Glu Val Ser Gly Leu Arg Asp Ala Ser Val Pro Ala Pro Glu Glu Ala Ala Lys
330 340
Gly Glu Glu Phe Asp Phe Asn Thr Pro Pro Asn Gin Gin Asn Asp Val Lys Gly Ala Ser
350 360
Arg Leu Pro Ser Pro Glu Asp Ala Ser His Pro Pro Val Ser Arg Ala Thr Ser Arg Thr
370 380 Ser His Gly Leu Gly Ser His Ser Arg Tyr Ile Val Pro Gin Pro Arg Arg Leu Lys Ser
390 400
Gly Trp Ala Gly Gly Ile Cys Ala Thr Ser Lys Thr Arg Ile Lys Leu Arg Val Ala Thr
410 420
Glu Ala Glu Thr Lys Phe Asp Trp Asp Glu Pro Leu Val Leu Pro Pro Ile Asp Pro Phe
430 440
Leu Pro Pro His Thr Asp Lys Asp Ala Ala Ala Ser Leu Val Ala Leu Tyr Arg Ala Gin
450 460
Leu Thr Ser Leu Ala Glu Ala Phe Arg Tyr Ile Arg Asp Lys Ser Phe Phe His Leu Tyr
470 480
Thr Ser Phe His Gly Thr Leu Thr Met Pro Val Gin Lys Leu Phe Ala His Pro Ser Ile
490 500
Ala Pro Trp Ile Glu Glu Cys Asp Leu Val Leu Tyr Gin Arg Leu Thr Lys Phe Ala Phe
510 520
Thr Met Ser Leu Val Val Val Pro Asn Val Tyr Leu Asn Arg Met Arg Ser Ile Ala Asp
530 540
Arg Leu Val Pro His Ile Val Asp Val Phe Gly Gly His Pro Glu His Val Val Gin Ala
550 560
Lys Ala Gly Pro Ala Ala Ile Phe Val Gly Ile Leu Glu Arg Met Thr Arg Val Asn Lys
570 580
Thr Ala His Ala Ala Ala Arg Pro Val Ala Leu Asp Ala Asn Arg Asp Gin Met Tyr Ala
590 600
Asp Trp Leu Glu Leu Val Asn Ala Arg Lys Ile Ala Glu Cys Val Pro Thr Arg Gly Met
610 620
Asp Asp Val Ala Glu Leu Leu Val Arg Glu Met Arg Tyr Leu Val Asp Pro Lys Asn Tyr
630 640
Ile Pro Asp Asp Glu Thr Ser Asn Ala Asp Ala Gly Gly Ala Arg Ser Pro Phe Ala Val
650 660
Asn Arg Trp Arg Asp Phe Leu Met Ser Leu Pro Gly Lys Phe Pro Tyr Ala Ser His Glu
670 680
Asp Ile Val Trp Cys Val Glu Arg Val Gly Thr Ala Ile Val Arg Glu Leu Thr Leu Gin
690 700
Gly Gly Thr Ser Phe Thr Thr Trp Trp Ser Ile Lys Thr Phe Leu Asp Glu Glu Ile Met
710 720
Tyr Leu Ala Glu Val Gly Gly Leu Met His Thr Lys Ser Leu Arg Asp Glu Pro Ser Arg
730 740
Gin Gin Ala Thr Thr Val Val Thr Glu Arg Gly Gin Lys Gly Ala Thr Ala Asp Asp Asp
750 760
Gly Glu Val Val Met Gly Asp Ala Gly Gin Glu Glu Pro Met Ala Val Ala Ala Ser Pro
770 780
Val His Thr Asp Arg Ala Pro Phe Pro Pro Lys Gin Gly His Ala Ala Asn Met Gly Asp
790 800
Ala Ala Ser Asp Ala His Asp Asp Ser Gly Ile Gly Ile Arg Thr Pro Glu Thr Asp Phe
810 820
Pro Val Asp Lys Phe Gly Leu His Glu Ala Glu Ala Gly Val Thr Glu Leu Ala Tyr Glu
830 840 Gly Leu Asp Arg Glu Trp Ala Ala Pro Ala
Tab. 8: Aminosäuresequenz-Vergleich der DNA-Bindedomänen einiger Mitglieder der RFX-Proteinfamilie. Identische Aminosäur sind durch graue Boxen hervorgehoben. In der Konsensus-Sequenz wurden auch solche Positionen berücksichtigt, an denen 2 verschiedene Aminosäuren auftreten. Abkürzungen: AcCPCRI : Acremonium chrysogenum CPCR1-Protein (SEQ ID NO.: 22), SpSAKI : Schizosaccharomyces pombe SAK1 -Protein (U 19978) (SEQ ID NO.: 23), ScRFX: Saccharomyces cerevisiae RFX- Protein (U17246) (SEQ ID NO.: 24), HsRFXI : Homo sapiens RFX1-Protein (A20492) (SEQ ID NO.: 25). In Klammern sind die „accession numbers" der EMBL Datenbank (Heidelberg) angegeben.
1 AcCPCRI
2 SpSAKI
3 ScRFX
4 HsRFXI
cons.
Figure imgf000042_0001
Tab. 9: Aminosäuresequenz-Vergleich der Dimerisationsdomänen einiger Mitglieder der RFX-Familie. Graue Boxen markieren identische Aminosäuren, weiße Positionen mit 2 verschiedenen Aminosäuren. Abkürzungen: AcCPCRI : Acremonium chrysogenum CPCR1-Protein (SEQ ID NO.: 26), SpSAKI: Schizosaccharomyces pombe SAK1-Protein (U19978) (SEQ ID NO.: 27), ScRFX: Saccharomyces cerevisiae RFX-Protein (U17246) (SEQ ID NO.: 28), HsRFXI : Homo sapiens RFX1-Protein (A2049 (SEQ ID NO.: 29). In Klammern sind die „accession numbers" der EMBL Datenbank (Heidelberg) angegeben.
1
2
3
4
1
2
3
4
Figure imgf000043_0001
Tab. 10: Nukleotidsequenzen der Vektoren und Angabe rekombinanter Literaturreferenzen
Vektor bakterieller Anteil 5' pcbC Leaderpeptid Linker 3" pcbC plR11 Stratagene, Heidelberg Menne et al. 1994 - Linker A Samson et al. 1985
Pos. 1-659 Pos. 7-1233 Tab. 11 Pos. 1021-1462
Pos. 728-2961 plR12 Strategene, Heidelberg Menne et al. 1994 - Linker B Samson et al. 1985
Pos. 1-659 Pos. 7-1233 Tab. 11 Pos. 1021-1462
Pos. 728-2961 plR13 Strategene, Heidelberg Menne et al. 1994 - Linker C Samson et al. 1985
Pos. 1-659 Pos. 7-1233 Tab. 11 Pos. 1021-1462
Pos. 728-2961 plR21 Strategene, Heidelberg Menne et al. 1994 von Fusarium sp. Linker A Samson et al. 1985
Pos. 1-659 Pos. 7-1233 42 bp, Tab. 12 B Tab. 11 Pos. 1021-1462
Pos. 728-2961 plR22 Strategene, Heidelberg Menne et al. 1994 von Fusarium sp. Linker B Samson et al. 1985
Pos. 1-659 Pos. 7-1233 42 bp, Tab. 12 B Tab. 11 Pos. 1021-1462
Vektor bakterieller Anteil 5' pcbC Leadeφeptid Linker 3' pcbC
Pos. 728-2961 plR23 Strategene, Heidelberg Menne et al. 1994 von Fusarium sp. Linker C Samson et al. 1985
Pos. 1-659 Pos. 7-1233 42 bp, Tab. 12 B Tab. 11 Pos. 1021-1462
Pos. 728-2961 plR31 Strategene, Heidelberg Menne et al. 1994 von Acremonium Linker A Samson et al. 1985
Pos. 1-659 Pos. 7-1233 chrysogenum Tab. 11 Pos. 1021-1462
Pos. 728-2961 60 bp, Tab. 12 C plR32 Strategene, Heidelberg Menne et al. 1994 von Acremonium Linker B Samson et al. 1985
Pos. 1-659 Pos. 7-1233 chrysogenum Tab. 11 Pos. 1021-1462
Pos. 728-2961 60 bp, Tab. 12 C plR33 Strategene, Heidelberg Menne et al. 1994 von Acrmonium Linker C Samson et al. 1985
Pos. 1-659 Pos. 7-1233 chrysogenum Tab. 11 Pos. 1021-1462
Pos. 728-2961 60 bp, Tab. 12 C
Tab. 11 : Die charakteristischen Klonierungsstellen der neun Vektoren und die davon abgeleiteten Restriktionsschnittstellen, welche für Klonierungen geeignet sind. Zu beachten ist, daß sich die drei Klonierungsstellen nur durch ein bzw. zwei Basenpaare unterscheiden.
1. Leseraster (Oligonukleotide Nr. 1 +2)
HindiII Nrul EcoRI 5' C ATG AAG CTT TCG CGA GAA TCC 3' (SEQ ID NO.: 30) pIR22,21,31 3' TTC GAA AGC GCT CTT AAG 5' (SEQ ID NO. : 31)
2. Leseraster (Oligonukleotide Nr. 3 + 4)
B 5' C ATG CAA GCT TTC GCG AGA ATT C 3' (SEQ ID NO.: 32) pIR12,22,32 3' GTT CGA AAG CGC TCT TAA G 5' (SEQ ID NO.: 33)
3. Leseraster (Oligonukleotide Nr. 5 + 6)
C 5' C ATG CTA AGC TTT CGC GAG AAT TC 3' (SEQ ID NO.: 34) pIR13,23,33 3' GAT TCG AAA GCG CTC TTA AG 5' (SEQ ID NO. : 35)
Tab.12: Übergangssequenzen im Bereich der multiplen Klonierungsstelle (eingerahmt) in den angegebenen Expressionsvektoren. In den Sequenzen wurden solche Nukleotide unterstrichen, die gegenüber dem erstgenannten Plasmid verschieden sind.
A. Vektoren ohne Signalsequenz
plR11
1. Leseraster
Hindlll Nrul EcoRI
AAACCGTCACC ATG AAG CTT TCG CGA GAA TTC GGGTCGATCAGG (SEQ ID NO. : 36) TTTGGCAGTGG TAC TTC GAA AGC GCT CTT AAG CCCAGCTAGTCC (SEQ ID NO.: 37)
plR12
2. Leseraster
AAACCGTCACC ATG (SEQ ID NO. : 38) TTTGGCAGTGG TAC (SEQ ID NO. : 39)
Figure imgf000047_0001
plR13
3. Leseraster
AAACCGTCACC ATG CljA AGC TTfT CGC GA|S AAT TCjGGGTCGATCAGG (SEQ ID NO. : 40) TTTGGCAGTGG TAC GftT TCG A?ψ GCG CTfc TTA AGfcCCAGCTAGTCC (SEQ ID NO. : 41)
B. Vektoren mit Signalsequenz aus Fusarium
plR21
1. Leseraster
AAACCGTCACC ATG CGT CTG TCC ATC ATC GCA GTC CTT CCC CTG GCC CTC GCC TTTGGCAGTGG TAC GCA GAC AGG TAG TAG CGT CAG GAA GGG GAC CGG GAG CGG
Hindlll Nrul EcoRI
ATG AAG CTT TCG CGA GAA TTC GTCGATCAGG (SEQ ID NO.: 42) TAC TTC GAA AGC GCT CTT AAG CpCAGCTAGTCC (SEQ ID NO.: 43)
plR22
2. Leseraster
AAACCGTCACC ATG CGT CTG TCC ATC ATC GCA GTC CTT CCC CTG GCC CTC GCC TTTGGCAGTGG TAC GCA GAC AGG TAG TAG CGT CAG GAA GGG GAC CGG GAG CGG
Figure imgf000048_0001
plR23
3. Leseraster
AAACCGTCACC ATG CGT CTG TCC ATC ATC GCA GTC CTT CCC CTG GCC CTC GCC TTTGGCAGTGG TAC GCA GAC AGG TAG TAG CGT CAG GAA GGG GAC CGG GAG CGG
ATG ---- AGC TTΓ CGC AAT TC 5GGTCGATCAGG (SEQ ID NO. : 46)
TAC G; TGC A?A GCG TTA AG CCAGCTAGTCC (SEQ ID NO. : 47) C. Vektoren mit Signalsequenz aus Acremonium chrysogenum
plR31
1. Leseraster
AAACCGTCACC ATG GTC ACC CTC CGC CGC CTC GCC GTC CTC CTC GGC TTTGGCAGTGG TAC CAG TGG GAG GCG GCG GAG CGG CAG GAG GAG CCG
Hindlll Nrul EcoRI
GCC ATC CCC GCC GCC CTC GCC GCC ATG TCG CGA GAA TTC CGG TAG GGG CGG CGG GAG CGG CGG TAC AGC GCT CTT AAG
Figure imgf000049_0001
GGGTCGATCAGG (SEQ ID NO. 48) CCCAGCTAGTCC (SEQ ID NO. 49)
plR32
2. Leseraster
AAACCGTCACC ATG GTC ACC CTC CGC CGC CTC GCC GTC CTC CTC GGC GCC ATC CCC GOC TTTGGCAGTGG TAC CAG TGG GAG GCG GCG GAG CGG CAG GAG GAG CCG CGG TAG GGG CGG
GCC CTC GCC GCC ATG (SEQ ID NO.: 50) CGG GAG CGG CGG TAC (SEQ ID NO.: 51)
Figure imgf000049_0002
plR33
3. Leseraster
AAACCGTCACC ATG GTC ACC CTC CGC CGC CTC GCC GTC CTC CTC GGC GCC ATC CCC GCC TTTGGCAGTGG TAC CAG TGG GAG GCG GCG GAG CGG CAG GAG GAG CCG CGG TAG GGG CGG
GCC CTC GCC GCC ATG (SEQ ID NO. : 52) CGG GAG CGG CGG TAC (SEQ ID NO. : 53)
Figure imgf000049_0003
Tabelle 13: DNA-Sequenz der genomischen Kopie des cpcR1-Gens von Acremonium chrysogenum (SEQ ID NO.: 57)
10 20 30 40 50 60
AGAATGAGAG TTATTACCTG GGAATCGTTC GTGCAGTGGT CCCAGCCACA TGCACAAGGT
70 80 90 100 110 120
TGAGAGGTTC GCAGCAGGGA TGCGGGGCAA CGCCAGGAAC TTTGACAAAT GAGGGTGCGT
130 140 150 160 170 180 TCCTGCTTAC CTAAGTTGGC TCGTGCCCAC AAACCGGGAG TCGTTTCTCC TCCCGTTGGC
190 200 210 220 230 240 CTCGCAACAG AAAAACACAC CGACCACAAA CAACAGCCCG CCTTCCGTCC ATCGAGCAAC
250 260 270 280 290 300 CACTTGCCTA GCCTTGCCCG ACGCGGGTCA TCCAGACAGA CCTTGCGCGG AACCGGACGC
310 320 330 340 350 360 ATCACGTCAC ATTTTTCTTT ATTTCTTTTC CTCGACAACG ACACGCCTTC AGCGCGCCCT
370 380 390 400 410 420 GCGCACCCAT CGCTGTCGCG CTGCTGCGGA GCAGTGTTTG TTGTGAACTG CGACCGACCC
430 440 450 460 470 480 CCGACAGGCA GCTTTCCGTG GAAGTGGACC TCCACCAAAA CATCCCCATC ATGGACCAAG
490 500 510 520 530 540 GTTTGTCCCA CCCTGCTCCG ATGGCAGATG ACTTACTAGA ACGGCTTGTT GACAATGCGA
550 560 570 580 590 600 GCAGACGAGC CGGCCGCCGC GATTCAGGCG TCTTCCGCCG CGATGCGGCC GCAATCTAGG
610 620 630 640 650 660 GCCTCGACCT CCTCGACACA CAGCGCCGCG ACGCAACCCA CCACAGATGC CCATGATTAC
670 680 690 700 710 720 TCCAATATGC CTGCTATGTA CGGACAAGGG TGGTCATCAT CGTTTTCCCA GCAGAACCAC 730 740 750 760 770 780 GCCGGATATT CCACGCAGCC GCCGCAGCCG AGCCAGCAAG GACAGACATC GCAGATCCTC
790 800 810 820 830 840 CTTCTGCAGC AAGCAAGCAA CCCCGATGCG GCATCAAATC ATTTCCCTAT GAACGGCATG
850 860 870 880 890 900 AACGGCCACC CAATGGAATC CCAATTTCAT GCTCACCCGA TGCCAGCACA ACACCCGATA
910 920 930 940 950 960 CAACACTCGC AGCCTCACCT ACACCAGATG CATGCTCAGC ATCAAATGCC GGCCCATGCG
970 980 990 1000 1010 1020 TTGAACCCAC ACACCTGGGC CAACGGAGAG AGCCAATCTG GAATGGATCA AACCGGTGAT
1030 1040 1050 1060 1070 1080 GCCCTGAAGG ACAATGCGAA TGGTCTCAAA AAGGGAAAGT CTAAGAGGAG GTCGAATGCC
1090 1100 1110 1120 1130 1140 AACAATGACG GCGAGATGAA GGAGCTTTTC GAGAGCAACC GCCACAAGTC GTTGGAGGAG
1150 1160 1170 1180 1190 1200 ATTGTTCAGG ATGTCAGGGG CAACGAGCGC GGTCCCAACG CAGAGCGCAA ACGTCAACTA
1210 1220 1230 1240 1250 1260 TATGCCATGC TCTGGTAAGA ACGACAGAGA GACTGACCAG CGCTTCACGT TCACTGACAT
1270 1280 1290 1300 1310 1320 GCGACAGGCT CAACTCAGCG TGCGTGGAAA GCAAGAACTC GATCCCACGC GGCCGGGTGT
1330 1340 1350 1360 1370 1380 ATCACACTTA TGCCTCAAAA TGTACCGACG ACAGAGTCGT AGTTCTCAAC CCTGCTAGTT
1390 1400 1410 1420 1430 1440 TCGGGAAGTT GGTGCGAGTC GTCTTCCCAT CCATCAAAAC CCGACGACTT GGAGTCCGGG
1450 1460 1470 1480 1490 1500 GCGAGTCAAA GTATCACTAT TGCAACTTTC AACTCCGTGA TCCGCCACCG CCCGAGGTGA
1510 1520 1530 1540 1550 1560 GCGGGCTGCG AGACGCTAGC GTTCCCGCTC CCGAAGAGGC AGCTAAGGGG GAGGAGTTTG
1570 1580 1590 1600 1610 1620 ACTTCAAGTA AGTACCTATT GACAGGATGA TGCTGTATGC GCCTCTAACG TGTACCCAGC
1630 1640 1650 1660 1670 1680 ACACCGCCGA ACCAGCAAAA TGACGTCAAA GGAGCCAGTC GTTTACCATC GCCGGAGGAT
1690 1700 1710 1720 1730 1740 GCTTCTCATC CACCGGTCTC CCGCGCCACA TCACGGACAA GCCATGGATT GGGTTCGCAC
1750 1760 1770 1780 1790 1800 AGCCGTTACA TTGTTCCGCA GCCGCGGCGA CTGAAATCGG GATGGGCTGG GGGCATCTGC
1810 1820 1830 1840 1850 1860 GCAACGTCCA AGACGCGCAT CAAGCTCCGG GTCGCAACAG AGGCGGAAAC GAAATTCGAT
1870 1880 1890 1900 1910 1920 TGGGACGAGC CACTGGTGTT GCCGCCGATC GACCCGTTCC TGCCGCCGCA CACAGATAAG
1930 1940 1950 1960 1970 1980 GACGCGGCCG CCTCGCTGGT GGCCCTGTAC CGCGCGCAGT TGACATCCCT CGCTGAGGCC
1990 2000 2010 2020 2030 2040 TTCCGATACA TCAGGGACAA GAGCTTTTTC CACCTGTACA CGTCCTTCCA CGGCACATTG
2050 2060 2070 2080 2090 2100 ACGATGCCTG TACAGAAGCT CTTTGCGCAT CCGAGCATTG CTCCTTGGAT CGAGGAGTGC
2110 2120 2130 2140 2150 2160 GACCTTGTTC TGTACCAGCG GCTGACCAAA TTCGCCTTCA CCATGTCGCT CGTGGTGGTG
2170 2180 2190 2200 2210 2220 CCTAATGTGT ATCTCAACCG GATGCGGTCC ATCGCCGACC GTCTCGTGCC GCACATTGTG
2230 2240 2250 2260 2270 2280 GACGTGTTCG GCGGGCATCC TGAGCATGTG GTGCAAGCCA AGGCGGGTCC GGCGGCCATC
2290 2300 2310 2320 2330 2340 TTCGTAGGCA TCCTGGAGCG GATGACGCGT GTGAACAAGA CGGCGCACGC GGCGGCCAGA 2350 2360 2370 2380 2390 2400 CCAGTGGCGT TGGACGCCAA CAGGGACCAG ATGTACGCGG ATTGGCTGGA ACTGGTCAAC
2410 2420 2430 2440 2450 2460 GCGCGCAAGA TTGCCGAGTG CGTGCCGACG CGGGGAATGG ACGATGTGGC GGAGCTACTT
2470 2480 2490 2500 2510 2520 GTCAGGGAGA TGCGGTATCT CGTGGACCCC AAGAACTATA TTCCGGATGA CGAGACTTCG
2530 2540 2550 2560 2570 2580 AATGCCGATG CTGGAGGGGC CCGGTCACCG TTTGCCGTCA ACCGATGGCG GGACTTTCTG
2590 2600 2610 2620 2630 2640 ATGAGTCTGC CCGGCAAGTT CCCGTATGCG TCACACGAAG ACATTGTTTG GTGCGTGGAG
2650 2660 2670 2680 2690 2700 AGGGTGGGGA CGGCGATTGT GAGGGAGCTC ACCTTGCAAG GGGGCACCAG CTTCACAACG
2710 2720 2730 2740 2750 2760 TGGTGGTCTA TCAAGACGTT CCTCGACGAG GAGATTATGT ACCTGGCCGA GGTTGGCGGG
2770 2780 2790 2800 2810 2820 CTCATGCATA CGAAGAGCCT GCGCGATGAG CCGTCAAGGC AGCAAGCGAC AACGGTCGTG
2830 2840 2850 2860 2870 2880 ACGGAAAGAG GCCAAAAAGG GGCCACAGCG GACGACGACG GTGAGGTGGT GATGGGCGAC
2890 2900 2910 2920 2930 2940 GCAGGTCAGG AGGAACCGAT GGCGGTGGCG GCGTCGCCGG TGCACACAGA CCGGGCGCCA
2950 2960 2970 2980 2990 3000 TTCCCACCGA AACAGGGACA TGCGGCCAAC ATGGGCGACG CGGCAAGTGA TGCGCACGAT
3010 3020 3030 3040 3050 3060 GACAGTGGGA TAGGGATCCG GACCCCCGAG ACGGACTTTC CGGTGGACAA GTTTGGACTC
3070 3080 3090 3100 3110 3120 CATGAGGCGG AGGCGGGGGT CACAGAACTA GCCTACGAAG GGTTGGATCG AGAATGGGCG
3130 3140 3150 3160 3170 3180 GCTCCTGCAT GACGAGGCCT GACGAAGGCA CGAAGAGATG AACAGCACGT GTTGGATTAA 3190 3200 3210 3220 3230 3240 CGGTATATCC CGGGGTTCTG GTTATGGGTC CGGAGTAGGT CATGTCACTA AGGGGTCTAT
3250 3260 3270 3280 3290 3300 TGGGTAAATG TGATGTTGGG TCACTCTTCG AATTATACCT CATTAATGCC ACTACTGCCT
3310 3320 3330 3340 3350 3360 GATGATACTC TTATGGGGGG GGGGGGGGGG TTGAGCTACT CAATGCTTAA GTGAATCGGA
3370 3380 3390 3400 3410 3420 GAGCACTTTG CCTTTCCAGC GGAGACTTTT TGTTGTCGGC CAGTGATGCT TGGTTGTAGA
3430 3440 3450 3460 3470 3480 TGGAAGTGGT GGTCATGACT CGGAGGAGGG TGTAGGGTAG CTGTACTTGC GGGTGCGTTG
3490 3500 3510 3520 3530 3540 TTACGAAGAG TATTTGGGCG GCGGAAGACC GGGCGGATGC CGAACCCGGA CGTGCGGTAA
3550 3560 3570 3580 3590 3600 CGGGGATGAG CAGCGTCAGT CGAGTCATCC ATGATTTCAG GTCCAGGGTC CAAGTCGCGT
3610 3620 3630 3640 3650 3660 ATTCGTATTT GTATTCCGGA TTACTGTTTG CCAGTATGGA GTTTACGGTA CTAAGGGAGA
3670 3680 3690 3700 3710 3720 TTATTTAGTC GAC
SEQUENZPROTOKOLL
(1) ALLGEMEINE INFORMATION:
(i) ANMELDER:
(A) NAME: Hoechst Marion Roussel Deutschland GmbH
(B) STRASSE: -
(C) ORT: Frankfurt
(D) BUNDESLAND: -
(E) LAND: Deutschland
(F) POSTLEITZAHL: 65926
(G) TELEPHON: 069-305-3005 (H) TELEFAX: 069-35-7175 (I) TELEX: -
(ii) ANMELDETITEL: Regulation des Isopenicillin
N-Synthetase-Gens (pcbC) durch das cpcRl-Genprodukt
(iii) ANZAHL DER SEQUENZEN: 56
(iv) COMPUTER- LESBARE FORM:
(A) DATENTRÄGER: Floppy disk
(B) COMPUTER: IBM PC compatible
(C) BETRIEBSSYSTEM: PC-DOS/MS-DOS
(D) SOFTWARE: Patentin Release #1.0, Version #1.25 (EPA)
(2) INFORMATION ZU SEQ ID NO: 1 :
(i) SEQUENZ CHARAKTERISTIK:
(A) LÄNGE: 13 Basenpaare
(B) ART: Nukleinsäure
(C) STRANGFORM: Einzel
(D) TOPOLOGIE: linear
(ii) ART DES MOLEKÜLS: DNS (genomisch)
(ix) MERKMALE:
(A) NAME/SCHLÜSSEL: exon
(B) LAGE: 1..13
(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 1: TTGCCGGGCC AAT 13 (2) INFORMATION ZU SEQ ID NO: 2:
(i) SEQUENZ CHARAKTERISTIK:
(A) LANGE: 10 Basenpaare
(B) ART: Nukleinsäure
(C) STRANGFORM: Einzel
(D) TOPOLOGIE: linear
(ii) ART DES MOLEKÜLS: DNS (genomisch)
(ix) MERKMALE:
(A) NAME/SCHLÜSSEL: exon
(B) LAGE: 1..10
(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 2: TTAGGCCTAA 10
(2) INFORMATION ZU SEQ ID NO: 3:
(i) SEQUENZ CHARAKTERISTIK:
(A) LÄNGE: 24 Basenpaare
(B) ART: Nukleinsäure
(C) STRANGFORM: Einzel
(D) TOPOLOGIE: linear
(ii) ART DES MOLEKÜLS: DNS (genomisch)
(ix) MERKMALE:
(A) NAME/SCHLÜSSEL: exon
(B) LAGE: 1..24
(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 3: GTTGCCGGGC CAATCCCTGA GCTT 24
(2) INFORMATION ZU SEQ ID NO: 4: (i) SEQUENZ CHARAKTERISTIK:
(A) LÄNGE: 24 Basenpaare
(B) ART: Nukleinsäure
(C) STRANGFORM: Einzel
(D) TOPOLOGIE: linear
(ii) ART DES MOLEKÜLS: DNS (genomisch)
(ix) MERKMALE:
(A) NAME/SCHLÜSSEL: exon
(B) LAGE: 1..24
(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 4: GTTGCCGGGC CAATCCCTGA GCTT 24 (2) INFORMATION ZU SEQ ID NO: 5:
(i) SEQUENZ CHARAKTERISTIK:
(A) LANGE: 24 Basenpaare
(B) ART: Nukleinsäure
(C) STRANGFORM: Einzel
(D) TOPOLOGIE: linear
(ii) ART DES MOLEKÜLS: DNS (genomisch)
(ix) MERKMALE:
(A) NAME/SCHLÜSSEL: exon
(B) LAGE: 1..24
(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 5: AAGCTCAGGG ATTGGCCCGG CAAC 24
(2) INFORMATION ZU SEQ ID NO: 6:
(i) SEQUENZ CHARAKTERISTIK:
(A) LÄNGE: 24 Basenpaare
(B) ART: Nukleinsäure
(C) STRANGFORM: Einzel
(D) TOPOLOGIE: linear
(ii) ART DES MOLEKÜLS: DNS (genomisch)
(ix) MERKMALE:
(A) NAME/SCHLÜSSEL: exon
(B) LAGE: 1..24
(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 6: GTTGCCGGGG GTTACCCTGA GCTT 24
(2) INFORMATION ZU SEQ ID NO: 7:
(i) SEQUENZ CHARAKTERISTIK:
(A) LÄNGE: 24 Basenpaare
(B) ART: Nukleinsäure
(C) STRANGFORM: Einzel
(D) TOPOLOGIE: linear
(ii) ART DES MOLEKÜLS: DNS (genomisch)
(ix) MERKMALE:
(A) NAME/SCHLÜSSEL: exon
(B) LAGE: 1..24
(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 7: AAGCTCAGGG TAACCCCCGG CAAC 24
(2) INFORMATION ZU SEQ ID NO: 8:
(i) SEQUENZ CHARAKTERISTIK:
(A) LÄNGE: 24 Basenpaare
(B) ART: Nukleinsäure
(C) STRANGFORM: Einzel
(D) TOPOLOGIE: linear
(ii) ART DES MOLEKÜLS: DNS (genomisch)
(ix) MERKMALE:
(A) NAME/ SCHLÜSSEL: exon
(B) LAGE: 1..24
(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: GTTGCCGGGC GTATCCCTGA GCTT 24
(2) INFORMATION ZU SEQ ID NO: 9:
(i) SEQUENZ CHARAKTERISTIK.:
(A) LÄNGE: 24 Basenpaare
(B) ART: Nukleinsäure
(C) STRANGFORM: Einzel
(D) TOPOLOGIE: linear
(ii) ART DES MOLEKÜLS: DNS (genomisch)
(ix) MERKMALE:
(A) NAME/SCHLÜSSEL: exon
(B) LAGE: 1..24
(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 9: AAGCTCAGGG ATACGCCCGG CAAC 24
(2) INFORMATION ZU SEQ ID NO: 10:
(i) SEQUENZ CHARAKTERISTIK:
(A) LÄNGE: 24 Basenpaare
(B) ART: Nukleinsäure
(C) STRANGFORM: Einzel
(D) TOPOLOGIE: linear
(ii) ART DES MOLEKÜLS: DNS (genomisch)
(ix) MERKMALE:
(A) NAME/SCHLÜSSEL: exon
(B) LAGE: 1..24 (xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 10: CAACCCGGGC CAATCCCTGA GCTT 24
(2) INFORMATION ZU SEQ ID NO: 11:
(i) SEQUENZ CHARAKTERISTIK:
(A) LÄNGE: 24 Basenpaare
(B) ART: Nukleinsäure
(C) STRANGFORM: Einzel
(D) TOPOLOGIE: linear
(ii) ART DES MOLEKÜLS: DNS (genomisch)
(ix) MERKMALE:
(A) NAME/SCHLÜSSEL: exon
(B) LAGE: 1..24
(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 11: AAGCTCAGGG ATTGGCCCGG GTTG 24
(2) INFORMATION ZU SEQ ID NO: 12:
(i) SEQUENZ CHARAKTERISTIK.:
(A) LANGE: 80 Basenpaare
(B) ART: Nukleinsäure
(C) STRANGFORM: Einzel
(D) TOPOLOGIE: linear
(ii) ART DES MOLEKÜLS: DNS (genomisch)
(ix) MERKMALE:
(A) NAME/SCHLÜSSEL: exon
(B) LAGE: 1..80
(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 12: AATTCGTTGC CGGGCCAATC CCTGAGCTTG TTGCCGGGCC AATCCCTGAG CTTGTTGCCG 60 GGCCAATCCC TGAGCTTCCC 80
(2) ANGABEN ZU SEQ ID NO: 13:
(i) SEQUENZKENNZEICHEN:
(A) LÄNGE: 76 Basenpaare
(B) ART: Nucleotid
(C) STRANGFORM: Einzelstrang
(D) TOPOLOGIE: linear
(ii) ART DES MOLEKÜLS: Genom-DNA
(ix) MERKMAL: (A) NAME/SCHLÜSSEL: exon
(B) LAGE: 1..76
(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 13: GCAACGGCCC GGTTAGGGAC TCGAACAACG GCCCGGTTAG GGACTCGAAC AACGGCCCGG 60 TTAGGGACTC GAAGGG 76
(2) INFORMATION ZU SEQ ID NO: 14:
(i) SEQUENZ CHARAKTERISTIK.:
(A) LÄNGE: 80 Basenpaare
(B) ART: Nukleinsäure
(C) STRANGFORM: Einzel
(D) TOPOLOGIE: linear
(ii) ART DES MOLEKÜLS: DNS (genomisch)
(ix) MERKMALE:
(A) NAME/SCHLÜSSEL: exon
(B) LAGE: 1..80
(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 14: AATTCGTTGC CGGGGGTTAC CCTGAGCTTG TTGCCGGGGG TTACCCTGAG CTTGTTGCCG 60 GGGGTTACCC TGAGCTTCCC 80
(2) INFORMATION ZU SEQ ID NO: 15:
(i) SEQUENZ CHARAKTERISTIK.:
(A) LÄNGE: 76 Basenpaare
(B) ART: Nukleinsäure
(C) STRANGFORM: Einzel
(D) TOPOLOGIE: linear
(ii) ART DES MOLEKÜLS: DNS (genomisch)
(ix) MERKMALE:
(A) NAME/SCHLÜSSEL: exon
(B) LAGE: 1..76
(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 15: GGGAAGCTCA GGGTAACCCC CGGCAACAAG CTCAGGGTAA CCCCCGGCAA CAAGCTCAGG 60 GTAACCCCCG GCAACG 76
(2) INFORMATION ZU SEQ ID NO: 16: (i) SEQUENZ CHARAKTERISTIK: (A) LÄNGE: 80 Basenpaare
(B) ART: Nukleinsäure
(C) STRANGFORM: Einzel
(D) TOPOLOGIE: linear
(ii) ART DES MOLEKÜLS: DNS (genomisch)
(ix) MERKMALE:
(A) NAME/SCHLÜSSEL: exon
(B) LAGE: 1..80
(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 16: AATTCGTTGC CGGGCGTATC CCTGAGCTTG TTGCCGGGCG TATCCCTGAG CTTGTTGCCG 60 GGCGTATCCC TGAGCTTCCC 80
(2) INFORMATION ZU SEQ ID NO: 17:
(i) SEQUENZ CHARAKTERISTIK:
(A) LÄNGE: 76 Basenpaare
(B) ART: Nukleinsäure
(C) STRANGFORM: Einzel
(D) TOPOLOGIE: linear
(ii) ART DES MOLEKÜLS: DNS (genomisch)
(ix) MERKMALE:
(A) NAME/SCHLÜSSEL: exon
(B) LAGE: 1..76
(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 17: GGGAAGCTCA GGGATACGCC CGGCAACAAG CTCAGGGATA CGCCCGGCAA CAAGCTCAGG 60 GATACGCCCG GCAACG 76
(2) INFORMATION ZU SEQ ID NO: 18:
(i) SEQUENZ CHARAKTERISTIK:
(A) LÄNGE: 80 Basenpaare
(B) ART: Nukleinsäure
(C) STRANGFORM: Einzel
(D) TOPOLOGIE: linear
(ii) ART DES MOLEKÜLS: DNS (genomisch)
(ix) MERKMALE:
(A) NAME/SCHLÜSSEL: exon
(B) LAGE: 1..80
(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 18: AATTCCAACC CGGGCCAATC CCTGAGCTTC AACCCGGGCC AATCCCTGAG CTTCAACCCG 60 GGCCAATCCC TGAGCTTCCC 80
(2) INFORMATION ZU SEQ ID NO: 19:
(i) SEQUENZ CHARAKTERISTIK:
(A) LÄNGE: 76 Basenpaare
(B) ART: Nukleinsäure
(C) STRANGFORM: Einzel
(D) TOPOLOGIE: linear
( ii ) ART DES MOLEKÜLS : DNS ( genomisch )
( ix) MERKMALE :
(A) NAME/SCHLÜSSEL: exon
(B) LAGE: 1..76
(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 19: GGGAAGCTCA GGGATTGGCC CGGGTTGAAG CTCAGGGATT GGCCCGGGTT GAAGCTCAGG 60 GATTGGCCCG GGTTGG 76
(2) ANGABEN ZU SEQ ID NO: 20:
(i) SEQUENZKENNZEICHEN:
(A) LÄNGE: 2546 Basenpaare
(B) ART: Nucleotid
(C) STRANGFORM: Einzelstrang
(D) TOPOLOGIE: linear
(ii) ART DES MOLEKÜLS: Genom-DNA
(ix) MERKMAL:
(A) NAME/SCHLÜSSEL: exon
(B) LAGE: 1..2546
(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 20:
TCCAATATGC CTGCTATGTA CGGACAAGGG TGGTCATCAT CGTTTTCCCA GCAGAACCAC 60
GCCGGATATT CCACGCAGCC GCCGCAGCCG AGCCAGCAAG GACAGACATC GCAGATCCTC 120
CTTCTGCAGC AAGCAAGCAA CCCCGATGCG GCATCAAATC ATTTCCCTAT GAACGGCATG 180
AACGGCCACC CAATGGAATC CCAATTTCAT GCTCACCCGA TGCCAGCACA ACACCCGATA 240
CAACACTCGC AGCCTCACCT ACACCAGATG CATGCTCAGC ATCAAATGCC GGCCCATGCG 300
TTGAACCCAC ACACCTGGGC CAACGGAGAG AGCCAATCTG GAATGGATCA AACCGGTGAT 360
GCCCTGAAGG ACAATGCGAA TGGTCTCAAA AAGGGAAAGT CTAAGAGGAG GTCGAATGCC 420 AACAATGACG GCGAGATGAA GGAGCTTTTC GAGAGCAACC GCCACAAGTC GTTGGAGGAG 480
ATTGTTCAGG ATGTCAGGGG CAACGAGCGC GGTCCCAACG CAGAGCGCAA ACGTCAACTA 540
TATGCCATGC TCTGGCTCAA CTCAGCGTGC GTGGAAAGCA AGAACTCGAT CCCACGCGGC 600
CGGGTGTATC ACACTTATGC CTCAAAATGT ACCGACAGCA GAGTCGTAGT TCTCAACCCT 660
GCTAGTTTCG GGAAGTTGGT GCGAGTCGTC TTCCCATCCA TCAAAACCCG ACGACTTGGA 720
GTCCGGGGCG AGTCAAAGTA TCACTATTGC AACTTTCAAC TCCGTGATCC GCCACCGCCC 780
GAGGTGAGCG GGCTGCGAGA CGCTAGCGTT CCCGCTCCCG AAGAGGCAGC TAAGGGGGAG 840
GAGTTTGACT TCAACACACC GCCGAACCAG CAAAATGACG TCAAAGGAGC CAGTCGTTTA 900
CCATCGCCGG AGGATGCTTC TCATCCACCG GTCTCCCGCG CCACATCACG GACAAGCCAT 960
GGATTGGGTT CGCACAGCCG TTACATTGTT CCGCAGCCGC GGCGACTGAA ATCGGGATGG 1020
GCTGGGGGCA TCTGCGCAAC GTCCAAGACG CGCATCAAGC TCCGGGTCGC AACAGAGGCG 1080
GAAACGAAAT TCGATTGGGA CGAGCCACTG GTGTTGCCGC CGATCGACCC GTTCCTGCCG 1140
CCGCACACAG ATAAGGACGC GGCCGCCTCG CTGGTGGCCC TGTACCGCGC GCAGTTGACA 1200
TCCCTCGCTG AGGCCTTCCG ATACATCAGG GACAAGAGCT TTTTCCACCT GTACACGTCC 1260
TTCCACGGCA CATTGACGAT GCCTGTACAG AAGCTCTTTG CGCATCCGAG CATTGCTCCT 1320
TGGATCGAGG AGTGCGACCT TGTTCTGTAC CAGCGGCTGA CCAAATTCGC CTTCACCATG 1380
TCGCTCGTGG TGGTGCCTAA TGTGTATCTC AACCGGATGC GGTCCATCGC CGACCGTCTC 1440
GTGCCGCACA TTGTGGACGT GTTCGGCGGG CATCCTGAGC ATGTGGTGCA AGCCAAGGCG 1500
GGTCCGGCGG CCATCTTCGT AGGCATCCTG GAGCGGATGA CGCGTGTGAA CAAGACGGCG 1560
CACGCGGCGG CCAGACCAGT GGCGTTGGAC GCCAACAGGG ACCAGATGTA CGCGGATTGG 1620
CTGGAACTGG TCAACGCGCG CAAGATTGCC GAGTGCGTGC CGACGCGGGG AATGGACGAT 1680
GTGGCGGAGC TACTTGTCAG GGAGATGCGG TATCTCGTGG ACCCCAAGAA CTATATTCCG 1740
GATGACGAGA CTTCGAATGC CGATGCTGGA GGGGCCCGGT CACCGTTTGC CGTCAACCGA 1800
TGGCGGGACT TTCTGATGAG TCTGCCCGGC AAGTTCCCGT ATGCGTCACA CGAAGACATT 1860
GTTTGGTGCG TGGAGAGGGT GGGGACGGCG ATTGTGAGGG AGCTCACCTT GCAAGGGGGC 1920
ACCAGCTTCA CAACGTGGTG GTCTATCAAG ACGTTCCTCG ACGAGGAGAT TATGTACCTG 1980
GCCGAGGTTG GCGGGCTCAT GCATACGAAG AGCCTGCGCG ATGAGCCGTC AAGGCAGCAA 2040
GCGACAACGG TCGTGACGGA AAGAGGCCAA AAAGGGGCCA CAGCGGACGA CGACGGTGAG 2100
GTGGTGATGG GCGACGCAGG TCAGGAGGAA CCGATGGCGG TGGCGGCGTC GCCGGTGCAC 2160
ACAGACCGGG CGCCATTCCC ACCGAAACAG GGACATGCGG CCAACATGGG CGACGCGGCA 2220 AGTGATGCGC ACGATGACAG TGGGATAGGG ATCCGGACCC CCGAGACGGA CTTTCCGGTG 2280
GACAAGTTTG GACTCCATGA GGCGGAGGCG GGGGTCACAG AACTAGCCTA CGAAGGGTTG 2340
GATCGAGAAT GGGCGGCTCC TGCATGACGA GGCCTGACGA AGGCACGAAG AGATGAACAG 2400
CACGTGTTGG ATTAACGGTA TATCCCGGGG TTCTGGTTAT GGGTCCGGAG TAGGTCATGT 2460
CACTAAGGGG TCTATTGGGT AAATGTGATG TTGGGTCACT CTTCGAATTA TACCTCATTA 2520
ATGCCACTAC TGCCTGATGA TAAAAA 2546
(2) ANGABEN ZU SEQ ID NO: 21:
(i) SEQUENZKENNZEICHEN:
(A) LÄNGE: 830 Aminosäuren
(B) ART: Aminosäure
(C) STRANGFORM: Einzelstrang
(D) TOPOLOGIE: linear
(ii) ART DES MOLEKÜLS: Peptid
(ix) MERKMAL:
(A) NAME/SCHLÜSSEL: Peptide
(B) LAGE:1..830
(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 21:
Met Arg Ala Asp Glu Pro Ala Ala Ala Ile Gin Ala Ser Ser Ala Ala 1 5 10 15
Met Arg Pro Gin Ser Arg Ala Ser Thr Ser Ser Thr His Ser Ala Ala 20 25 30
Thr Gin Pro Thr Thr Asp Ala His Asp Tyr Ser Asn Met Pro Ala Met 35 40 45
Tyr Gly Gin Gly Trp Ser Ser Ser Phe Ser Gin Gin Asn His Ala Gly 50 55 60
Tyr Ser Thr Gin Pro Pro Gin Pro Ser Gin Gin Gly Gin Thr Ser Gin 65 70 75 80
Ile Leu Leu Leu Gin Gin Ala Ser Asn Pro Asp Ala Ala Ser Asn His 85 90 95
Phe Pro Met Asn Gly Met Asn Gly His Pro Met Glu Ser Gin Phe His 100 105 110
Ala His Pro Met Pro Ala Gin His Pro Ile Gin His Ser Gin Pro His 115 120 125
Leu His Gin Met His Ala Gin His Gin Met Pro Ala His Ala Leu Asn 130 135 140
Pro His Thr Trp Ala Asn Gly Glu Ser Gin Ser Gly M=t Asp Gin Thr 145 150 155 160 Gly Asp Ala Leu Lys Asp Asn Ala Asn Gly Leu Lys Lys Gly Lys Ser 165 170 175
Lys Arg Arg Ser Asn Ala Asn Asn Asp Gly Glu Met Lys Glu Leu Phe 180 185 190
Glu Ser Asn Arg His Lys Ser Leu Glu Glu Ile Val Gin Asp Val Arg 195 200 205
Gly Asn Glu Arg Gly Pro Asn Ala Glu Arg Lys Arg Gin Leu Tyr Ala 210 215 220
Met Leu Trp Leu Asn Ser Ala Cys Val Glu Ser Lys Asn Ser Ile Pro 225 230 235 240
Arg Gly Arg Val Tyr His Thr Tyr Ala Ser Lys Cys Thr Asp Asp Arg 245 250 255
Val Val Val Leu Asn Pro Ala Ser Phe Gly Lys Leu Val Arg Val Val 260 265 270
Phe Pro Ser Ile Lys Thr Arg Arg Leu Gly Val Arg Gly Glu Ser Lys 275 280 285
Tyr His Tyr Cys Asn Phe Gin Leu Arg Asp Pro Pro Pro Pro Glu Val 290 295 300
Ser Gly Leu Arg Asp Ala Ser Val Pro Ala Pro Glu Glu Ala Ala Lys 305 310 315 320
Gly Glu Glu Phe Asp Phe Asn Thr Pro Pro Asn Gin Gin Asn Asp Val 325 330 335
Lys Gly Ala Ser Arg Leu Pro Ser Pro Glu Asp Ala Ser His Pro Pro 340 345 350
Val Ser Arg Ala Thr Ser Arg Thr Ser His Gly Leu Gly Ser His Ser 355 360 365
Arg Tyr Ile Val Pro Gin Pro Arg Arg Leu Lys Ser Gly Trp Ala Gly 370 375 380
Gly Ile Cys Ala Thr Ser Lys Thr Arg Ile Lys Leu Arg Val Ala Thr 385 390 395 400
Glu Ala Glu Thr Lys Phe Asp Trp Asp Glu Pro Leu Val Leu Pro Pro 405 410 415
Ile Asp Pro Phe Leu Pro Pro His Thr Asp Lys Asp Ala Ala Ala Ser 420 425 430
Leu Val Ala Leu Tyr Arg Ala Gin Leu Thr Ser Leu Ala Glu Ala Phe 435 440 445
Arg Tyr Ile Arg Asp Lys Ser Phe Phe His Leu Tyr Thr Ser Phe His 450 455 460
Gly Thr Leu Thr Met Pro Val Gin Lys Leu Phe Ala His Pro Ser Ile 465 470 475 480 Ala Pro Trp Ile Glu Glu Cys Asp Leu Val Leu Tyr Gin Arg Leu Thr 485 490 495
Lys Phe Ala Phe Thr Met Ser Leu Val Val Val Pro Asn Val Tyr Leu 500 505 510
Asn Arg Met Arg Ser Ile Ala Asp Arg Leu Val Pro His Ile Val Asp 515 520 525
Val Phe Gly Gly His Pro Glu His Val Val Gin Ala Lys Ala Gly Pro 530 535 540
Ala Ala Ile Phe Val Gly Ile Leu Glu Arg Met Thr Arg Val Asn Lys 545 550 555 560
Thr Ala His Ala Ala Ala Arg Pro Val Ala Leu Asp Ala Asn Arg Asp 565 570 575
Gin Met Tyr Ala Asp Trp Leu Glu Leu Val Asn Ala Arg Lys Ile Ala 580 585 590
Glu Cys Val Pro Thr Arg Gly Met Asp Asp Val Ala Glu Leu Leu Val 595 600 605
Arg Glu Met Arg Tyr Leu Val Asp Pro Lys Asn Tyr Ile Pro Asp Asp 610 615 620
Glu Thr Ser Asn Ala Asp Ala Gly Gly Ala Arg Ser Pro Phe Ala Val 625 630 635 640
Asn Arg Trp Arg Asp Phe Leu Met Ser Leu Pro Gly Lys Phe Pro Tyr 645 650 655
Ala Ser His Glu Asp Ile Val Trp Cys Val Glu Arg Val Gly Thr Ala 660 665 670
Ile Val Arg Glu Leu Thr Leu Gin Gly Gly Thr Ser Phe Thr Thr Trp 675 680 685
Trp Ser Ile Lys Thr Phe Leu Asp Glu Glu Ile Met Tyr Leu Ala Glu 690 695 700
Val Gly Gly Leu Met His Thr Lys Ser Leu Arg Asp Glu Pro Ser Arg 705 710 715 720
Gin Gin Ala Thr Thr Val Val Thr Glu Arg Gly Gin Lys Gly Ala Thr 725 730 735
Ala Asp Asp Asp Gly Glu Val Val Met Gly Asp Ala Gly Gin Glu Glu 740 745 750
Pro Met Ala Val Ala Ala Ser Pro Val His Thr Asp Arg Ala Pro Phe 755 760 765
Pro Pro Lys Gin Gly His Ala Ala Asn Met Gly Asp Ala Ala Ser Asp 770 775 780
Ala His Asp Asp Ser Gly Ile Gly Ile Arg Thr Pro Glu Thr Asp Phe 785 790 795 800 Pro Val Asp Lys Phe Gly Leu His Glu Ala Glu Ala Gly Val Thr Glu 805 810 815
Leu Ala Tyr Glu Gly Leu Asp Arg Glu Trp Ala Ala Pro Ala 820 825 830
(2) INFORMATION ZU SEQ ID NO: 22:
(i) SEQUENZ CHARAKTERISTIK:
(A) LÄNGE: 75 Aminosäuren
(B) ART: Aminosäure
(C) STRANGFORM: Einzel
(D) TOPOLOGIE: linear
(ii) ART DES MOLEKÜLS: Peptid
(ix) MERKMALE:
(A) NAME/SCHLÜSSEL: Peptide
(B) LAGE: 1..75
(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 22:
Ala Met Leu Trp Leu Asn Ser Ala Cys Val Glu Ser Lys Asn Ser Ile 1 5 10 15
Pro Pro Gly Arg Val Tyr His Thr Tyr Ala Ser Lys Cys Thr Asp Ser 20 25 30
Arg Val Val Val Leu Asn Pro Ala Ser Phe Gly Lys Leu Val Arg Val 35 40 45
Val Phe Pro Ser Ile Lys Thr Arg Arg Leu Gly Val Arg Gly Glu Ser 50 55 60
Lys Tyr His Tyr Cys Asn Phe Gin Leu Arg Asp 65 70 75
(2) INFORMATION ZU SEQ ID NO: 23:
(i) SEQUENZ CHARAKTERISTIK:
(A) LÄNGE: 76 Aminosäuren
(B) ART: Aminosäure
(C) STRANGFORM: Einzel
(D) TOPOLOGIE: linear
(ii) ART DES MOLEKÜLS: Peptid
(ix) MERKMALE:
(A) NAME/SCHLÜSSEL: Peptide
(B) LAGE: 1..76
(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 23: Gly Glu Cys Trp Leu Lys Arg Ala Cys Glu Glu Gin Gin Asp Ala Ala 1 5 10 15
Val Gin Arg Asn Gin Ile Tyr Ala His Tyr Val Glu Ile Cys Asn Ser 20 25 30
Leu His Ile Lys Pro Leu Asn Ser Ala Ser Phe Gly Lys Leu Val Arg 35 40 45
Leu Leu Phe Pro Ser Ile Lys Thr Arg Arg Leu Gly Met Arg Gly His 50 55 60
Ser Lys Tyr His Tyr Cys Gly Ile Lys Leu Arg Gly 65 70 75
(2) INFORMATION ZU SEQ ID NO: 24:
(i) SEQUENZ CHARAKTERISTIK:
(A) LÄNGE: 76 Aminosäuren
(B) ART: Aminosäure
(C) STRANGFORM: Einzel
(D) TOPOLOGIE: linear
(ii) ART DES MOLEKÜLS: Peptid
(ix) MERKMALE:
(A) NAME/SCHLÜSSEL: Peptide
(B) LAGE: 1..76
(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 24:
Ala Leu Leu Trp Leu Met Lys Asn Cys Lys Trp Gin His Asp Ser Tyr 1 5 10 15
Val Pro Arg Gly Lys Ile Phe Ala Gin Tyr Ala Ser Ser Cys Ser Gin 20 25 30
Asn Asn Leu Lys Pro Leu Ser Gin Ala Ser Leu Gly Lys Leu Ile Arg 35 40 45
Thr Val Phe Pro Asp Leu Thr Thr Arg Arg Leu Gly Met Arg Gly Gin 50 55 60
Ser Lys Tyr His Tyr Cys Gly Leu Lys Leu Thr Val 65 70 75
(2) INFORMATION ZU SEQ ID NO: 25:
(i) SEQUENZ CHARAKTERISTIK:
(A) LÄNGE: 76 /Aminosäuren
(B) ART: Aminosäure
(C) STRANGFORM: Einzel
(D) TOPOLOGIE: linear
(ii) ART DES MOLEKÜLS: Peptid (ix) MERKMALE :
(A) NAME/SCHLÜSSEL: Peptide
(B) LAGE: 1..76
(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 25:
Thr Val Gin Trp Leu Leu Asp Asn Tyr Glu Thr Ala Glu Gly Val Ser 1 5 10 15
Leu Pro Arg Ser Thr Leu Tyr Cys His Tyr Leu Leu His Cys Gin Glu 20 25 30
Gin Lys Leu Glu Pro Val Asn Ala Ala Ser Phe Gly Lys Leu Ile Arg 35 40 45
Ser Val Phe Met Gly Leu Arg Thr Arg Arg Leu Gly Thr Arg Gly Asn
50 55 60
Ser Lys Tyr His Tyr Tyr Gly Leu Arg Ile Lys Ala 65 70 75
(2) INFORMATION ZU SEQ ID NO: 26:
(i) SEQUENZ CHARAKTERISTIK.:
(A) LÄNGE: 158 Aminosäuren
(B) ART: Aminosäure
(C) STRANGFORM: Einzel
(D) TOPOLOGIE: linear
(ii) ART DES MOLEKÜLS: Peptid
(ix) MERKMALE:
(A) NAME/SCHLÜSSEL: Peptide
(B) LAGE: 1..158
(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 26:
Ile Phe Val Gly Ile Leu Glu Arg Met Thr Arg Val Asn Lys Thr Ala 1 5 10 15
His Ala Ala Ala Arg Pro Val Ala Leu Asp Ala Asn Arg Asp Gin Met 20 25 30
Tyr Ala Asp Trp Leu Glu Leu Val Asn Ala Arg Lys Ile Ala Glu Cys 35 40 45
Val Pro Thr Arg Gly Met Asp Asp Val Ala Glu Leu Leu Val Arg Glu 50 55 60
Met Arg Tyr Leu Val Asp Pro Lys Asn Tyr Ile Pro Asp Asp Glu Thr 65 70 75 80
Ser Asn Ala Asp Ala Gly Gly Ala Arg Ser Pro Phe Ala Val Asn Arg 85 90 95
Trp Arg Asp Phe Leu Met Ser Leu Pro Gly Lys Phe Pro Tyr Ala Ser 100 105 110
His Glu Asp Ile Val Trp Cys Val Glu Arg Val Gly Thr Ala Ile Val 115 120 125
Arg Glu Leu Thr Leu Gin Gly Gly Thr Ser Phe Thr Thr Trp Trp Ser 130 135 140
Ile Lys Thr Phe Leu Asp Glu Glu Ile Met Tyr Leu Ala Glu 145 150 155
(2) INFORMATION ZU SEQ ID NO: 27:
(i) SEQUENZ CHARAKTERISTIK:
(A) LÄNGE: 168 Aminosäuren
(B) ART: Aminosäure
(C) STRANGFORM: Einzel
(D) TOPOLOGIE: linear
(ii) ART DES MOLEKÜLS: Peptid
(ix) MERKMALE:
(A) NAME/SCHLÜSSEL: Peptide
(B) LAGE: 1..168
(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 27:
Ile Phe Ser Asn Leu Leu Ser Arg Leu Leu Arg Val Asn Asp Thr Ala 1 5 10 15
His Ala Ala Ala Arg Phe Leu Ala Asn Pro Ala Asp Arg His Leu Ile 20 25 30
Cys Asn Asp Trp Glu Arg Phe Val Ser Thr Arg Phe Ile Val His Arg 35 40 45
Glu Leu Met Cys Asn Asp Lys Glu Ala Val Ala Ala Leu Asp Glu Trp 50 55 60
Tyr Ser Ile Leu Ser Thr Cys Ser Asn Pro Ser Asp Leu Leu Asp Pro 65 70 75 80
Leu Lys Asp Lys His Glu Ala Ser Asp Thr Ser Met Lys Arg Val Glu 85 90 95
Leu Arg Gin Ile Asp Gly Val Leu Asp Arg Met Ala Asp Phe Phe Leu 100 105 110
Glu Leu Pro Ser Arg Phe Pro Ser Cys Ser Pro Arg Met Phe Leu Leu 115 120 125
Cys Leu Gly Ala Leu Gin Thr Ser Val Leu Arg Glu Ile Thr Val Ser 130 135 140
Gly Gly Glu Ala Phe Gly Ala Leu Trp Val Ile Arg Cys Trp Val Asp 145 150 155 160 Glu Tyr Met Thr Trp Val Ala Glu 165
(2) INFORMATION ZU SEQ ID NO: 28:
(i) SEQUENZ CHARAKTERISTIK:
(A) LANGE: 159 Aminosäuren
(B) ART: Aminosäure
(C) STRANGFORM: Einzel
(D) TOPOLOGIE: linear
(ii) ART DES MOLEKÜLS: Peptid
(ix) MERKMALE:
(A) NAME/SCHLÜSSEL: Peptide
(B) LAGE: 1..159
(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 28:
Asn Phe Thr Lys Leu Val Lys Lys Leu Ile Lys Leu Leu Lys Phe Ile 1 5 10 15
Leu Asn Phe Leu Lys Ser Phe Pro Ile Phe Lys Ser Gly Met Asn Asn 20 25 30
Asp Trp Lys Asn Ile Val Asn Leu Asp Asp Ile Leu Glu Met Met Ile 35 40 45
Asn Glu Asp Asp Thr Asn Ser Glu Thr Asn Thr Ile Met Gin His Leu 50 55 60
Gin Gly Phe Cys Gin Val Phe Val Thr Lys Phe Leu Asn Ser Ser Met 65 70 75 80
Ser Val Ser Asn Asp Pro Ser Val Ser Ile Glu Cys Lys Ser Leu Asn 85 90 95
Glu Met Ile Lys Asp Phe Cys Ser Phe Ile Ser Leu Gin Ser Lys Phe 100 105 110
Ser Cys Leu Lys Leu Ile Asp Cys Ser Thr Arg Phe Arg Asn Ala Ile 115 120 125
Ile Gly Asp Ile Ser Leu Lys Ser Asn Glu Asn Leu Leu Ser Trp Leu 130 135 140
Phe Leu Asn Asn Val Met Gly Gin Leu Leu Asn Tyr Cys Phe Glu 145 150 155
(2) INFORMATION ZU SEQ ID NO: 29:
(i) SEQUENZ CHARAKTERISTIK:
(A) LÄNGE: 149 Aminosäuren
(B) ART: Aminosäure
(C) STRANGFORM: Einzel
(D) TOPOLOGIE: linear (ii) ART DES MOLEKÜLS: Peptid
(ix) MERKMALE:
(A) NAME/SCHLÜSSEL: Peptide
(B) LAGE: 1..149
(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 29:
Ala Phe Ala Gin Thr Leu Arg Arg Tyr Thr Ser Leu Asn His Leu Ala 1 5 10 15
Gin Ala Ala Arg Ala Val Leu Gin Asn Thr Ala Gin Ile Asn Gin Met 20 25 30
Leu Ser Asp Leu Asn Arg Val Asp Phe Ala Asn Val Gin Glu Gin Ala 35 40 45
Ser Trp Val Cys Arg Cys Glu Asp Arg Val Val Gin Arg Leu Glu Gin 50 55 60
Asp Phe Lys Val Thr Leu Gin Gin Gin Asn Ser Leu Glu Gin Trp Ala 65 70 75 80
Ala Trp Leu Asp Gly Val Val Ser Gin Val Leu Lys Pro Tyr Gin Gly 85 90 95
Ser Ala Gly Phe Pro Lys Ala Ala Lys Leu Phe Leu Leu Lys Trp Ser 100 105 110
Phe Tyr Ser Ser Met Val Ile Arg Asp Leu Thr Leu Arg Ser Ala Ala 115 120 125
Ser Phe Gly Ser Phe His Leu Ile Arg Leu Leu Tyr Asp Glu Tyr Met 130 135 140
Tyr Tyr Leu Ile Glu 145
(2) INFORMATION ZU SEQ ID NO: 30:
(i) SEQUENZ CHARAKTERISTIK.:
(A) LÄNGE: 22 Basenpaare
(B) ART: Nukleinsäure
(C) STRANGFORM: Doppel
(D) TOPOLOGIE: linear
(ii) ART DES MOLEKÜLS: DNS (genomisch)
(ix) MERKMALE:
(A) NAME/SCHLÜSSEL: exon
(B) LAGE: 1..22
(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 30: CATGAAGCTT TCGCGAGAAT TC 22 (2) INFORMATION ZU SEQ ID NO: 31:
(i) SEQUENZ CHARAKTERISTIK:
(A) LÄNGE: 18 Basenpaare
(B) ART: Nukleinsäure
(C) STRANGFORM: Doppel
(D) TOPOLOGIE: linear
(ii) ART DES MOLEKÜLS: DNS (genomisch)
(ix) MERKMALE:
(A) NAME/SCHLÜSSEL: exon
(B) LAGE: 1..18
(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 31: GAATTCTCGC GAAAGCTT 18
(2) INFORMATION ZU SEQ ID NO: 32:
(i) SEQUENZ CHARAKTERISTIK:
(A) LÄNGE: 23 Basenpaare
(B) ART: Nukleinsäure
(C) STRANGFORM: Doppel
(D) TOPOLOGIE: linear
(ii) ART DES MOLEKÜLS: DNS (genomisch)
(ix) MERKMALE:
(A) NAME/SCHLÜSSEL: exon
(B) LAGE: 1..23
(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 32: CATGCAAGCT TTCGCGAGAA TTC 23
(2) INFORMATION ZU SEQ ID NO: 33:
(i) SEQUENZ CHARAKTERISTIK:
(A) LÄNGE: 19 Basenpaare
(B) ART: Nukleinsäure
(C) STRANGFORM: Doppel
(D) TOPOLOGIE: linear
(ii) ART DES MOLEKÜLS: DNS (genomisch)
(ix) MERKMALE:
(A) NAME/SCHLÜSSEL: exon
(B) LAGE: 1..19
(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 33: GAATTCTCGC GAAAGCTTG 19
(2) INFORMATION ZU SEQ ID NO: 34:
(i) SEQUENZ CHARAKTERISTIK.:
(A) LÄNGE: 24 Basenpaare
(B) ART: Nukleinsäure
(C) STRANGFORM: Doppel
(D) TOPOLOGIE: linear
(ii) ART DES MOLEKÜLS: DNS (genomisch)
(ix) MERKMALE:
(A) NAME/SCHLÜSSEL: exon
(B) LAGE: 1..24
(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 34: CATGCTAAGC TTTCGCGAGA ATTC 24
(2) INFORMATION ZU SEQ ID NO: 35:
(i) SEQUENZ CHARAKTERISTIK.:
(A) LÄNGE: 20 Basenpaare
(B) ART: Nukleinsäure
(C) STRANGFORM: Doppel
(D) TOPOLOGIE: linear
(ii) ART DES MOLEKÜLS: DNS (genomisch)
(ix) MERKMALE:
(A) NAME/SCHLÜSSEL: exon
(B) LAGE: 1..20
( i) SEQUENZBESCHREIBUNG: SEQ ID NO: 35: GAATTCTCGC GAAAGCTTAG 20
(2) INFORMATION ZU SEQ ID NO: 36:
(i) SEQUENZ CHARAKTERISTIK:
(A) LÄNGE: 44 Basenpaare
(B) ART: Nukleinsäure
(C) STRANGFORM: Doppel
(D) TOPOLOGIE: linear
(ii) ART DES MOLEKÜLS: DNS (genomisch)
(ix) MERKMALE:
(A) NAME/SCHLÜSSEL: exon
(B) LAGE: 1..44 (xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 36: AAACCGTCAC CATGAAGCTT TCGCGAGAAT TCGGGTCGAT CAGG 44
(2) INFORMATION ZU SEQ ID NO: 37:
(i) SEQUENZ CHARAKTERISTIK:
(A) LÄNGE: 44 Basenpaare
(B) ART: Nukleinsäure
(C) STRANGFORM: Doppel
(D) TOPOLOGIE: linear
(ii) ART DES MOLEKÜLS: DNS (genomisch)
(ix) MERKMALE:
(A) NAME/SCHLÜSSEL: exon
(B) LAGE: 1..44
(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 37: CCTGATCGAC CCGAATTCTC GCGAAAGCTT CATGGTGACG GTTT 44
(2) INFORMATION ZU SEQ ID NO: 38:
(i) SEQUENZ CHARAKTERISTIK.:
(A) LÄNGE: 45 Basenpaare
(B) ART: Nukleinsäure
(C) STRANGFORM: Doppel
(D) TOPOLOGIE: linear
(ii) ART DES MOLEKÜLS: DNS (genomisch)
(ix) MERKMALE:
(A) NAME/SCHLÜSSEL: exon
(B) LAGE: 1..45
(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 38: AAACCGTCAC CATGCAAGCT TTCGCGAGAA TTCGGGTCGA TCAGG 45
(2) INFORMATION ZU SEQ ID NO: 39:
(i) SEQUENZ CHARAKTERISTIK:
(A) LÄNGE: 45 Basenpaare
(B) ART: Nukleinsäure
(C) STRANGFORM: Doppel
(D) TOPOLOGIE: linear
(ii) ART DES MOLEKÜLS: DNS (genomisch)
(ix) MERKMALE: (A) NAME/ SCHLÜSSEL: exon
(B) LAGE: 1..45
(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 39: CCTGATCGAC CCGAATTCTC GCGAAAGCTT GCATGGTGAC GGTTT 45
(2) INFORMATION ZU SEQ ID NO: 40:
(i) SEQUENZ CHARAKTERISTIK.:
(A) LÄNGE: 46 Basenpaare
(B) ART: Nukleinsäure
(C) STRANGFORM: Doppel
(D) TOPOLOGIE: linear
(ii) ART DES MOLEKÜLS: DNS (genomisch)
(ix) MERKMALE:
(A) NAME/SCHLÜSSEL: exon
(B) LAGE: 1..46
(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 40: AAACCGTCAC CATGCTAAGC TTTCGCGAGA ATTCGGGTCG ATCAGG 46
(2) INFORMATION ZU SEQ ID NO: 41:
(i) SEQUENZ CHARAKTERISTIK:
(A) LÄNGE: 46 Basenpaare
(B) ART: Nukleinsäure
(C) STRANGFORM: Doppel
(D) TOPOLOGIE: linear
(ii) ART DES MOLEKÜLS: DNS (genomisch)
(ix) MERKMALE:
(A) NAME/SCHLÜSSEL: exon
(B) LAGE: 1..46
(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 41: CCTGATCGAC CCGAATTCTC GCGAAAGCTT AGCATGGTGA CGGTTT 46
(2) INFORMATION ZU SEQ ID NO: 42:
(i) SEQUENZ CHARAKTERISTIK:
(A) LÄNGE: 86 Basenpaare
(B) ART: Nukleinsäure
(C) STRANGFORM: Doppel
(D) TOPOLOGIE: linear (ii) ART DES MOLEKÜLS: DNS (genomisch)
(ix) MERKMALE:
(A) NAME/SCHLÜSSEL: exon
( B ) LAGE : 1..86
(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 42: AAACCGTCAC CATGCGTCTG TCCATCATCG CAGTCCTTCC CCTGGCCCTC GCCATGAAGC 60 TTTCGCGAGA ATTCGGGTCG ATCAGG 86
(2) INFORMATION ZU SEQ ID NO: 43:
(i) SEQUENZ CHARAKTERISTIK:
(A) LÄNGE: 86 Basenpaare
(B) ART: Nukleinsäure
(C) STRANGFORM: Doppel
(D) TOPOLOGIE: linear
(ii) ART DES MOLEKÜLS: DNS (genomisch)
(ix) MERKMALE:
(A) NAME/SCHLÜSSEL: exon
(B) LAGE: 1..86
(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 43: CCTGATCGAC CCGAATTCTC GCGAAAGCTT CATGGCGAGG GCCAGGGGAA GGACTGCGAT 60 GATGGACAGA CGCATGGTGA CGGTTT 86
(2) INFORMATION ZU SEQ ID NO: 44:
(i) SEQUENZ CHARAKTERISTIK.:
(A) LÄNGE: 87 Basenpaare
(B) ART: Nukleinsäure
(C) STRANGFORM: Doppel
(D) TOPOLOGIE: linear
(ii) ART DES MOLEKÜLS: DNS (genomisch)
(ix) MERKMALE:
(A) NAME/SCHLÜSSEL: exon
(B) LAGE: 1..87
(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 44: AAACCGTCAC CATGCGTCTG TCCATCATCG CAGTCCTTCC CCTGGCCCTC GCCATGCAAG 60 CTTTCGCGAG AATTCGGGTC GATCAGG 87
(2) INFORMATION ZU SEQ ID NO: 45: (i) SEQUENZ CHARAKTERISTIK:
(A) LÄNGE: 87 Basenpaare
(B) ART: Nukleinsäure
(C) STRANGFORM: Einzel
(D) TOPOLOGIE: linear
(ii) ART DES MOLEKÜLS: DNS (genomisch)
(ix) MERKMALE:
(A) NAME/SCHLÜSSEL: exon
(B) LAGE: 1..87
(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 45: CCTGATCGAC CCGAATTCTC GCGAAAGCTT GCATGGCGAG GGCCAGGGGA AGGACTGCGA 60 TGATGGACAG ACGCATGGTG ACGGTTT 87
(2) INFORMATION ZU SEQ ID NO: 46:
(i) SEQUENZ CHARAKTERISTIK:
(A) LÄNGE: 88 Basenpaare
(B) ART: Nukleinsäure
(C) STRANGFORM: Doppel
(D) TOPOLOGIE: linear
(ii) ART DES MOLEKÜLS: DNS (genomisch)
(ix) MERKMALE:
(A) NAME/SCHLÜSSEL: exon (B) LAGE: 1..88
(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 46: AAACCGTCAC CATGCGTCTG TCCATCATCG CAGTCCTTCC CCTGGCCCTC GCCATGCTAA 60 GCTTTCGCGA GAATTCGGGT CGATCAGG 88
(2) INFORMATION ZU SEQ ID NO: 47:
(i) SEQUENZ CHARAKTERISTIK:
(A) LÄNGE: 88 Basenpaare
(B) ART: Nukleinsäure
(C) STRANGFORM: Doppel
(D) TOPOLOGIE: linear
(ii) ART DES MOLEKÜLS: DNS (genomisch)
(ix) MERKMALE:
(A) NAME/SCHLÜSSEL: exon
(B) LAGE: 1..88 (xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 47: CCTGATCGAC CCGAATTCTC GCGAAACGTT AGCATGGCGA GGGCCAGGGG AAGGACTGCG 60 ATGATGGACA GACGCATGGT GACGGTTT 88
(2) INFORMATION ZU SEQ ID NO: 48:
(i) SEQUENZ CHARAKTERISTIK:
(A) LÄNGE: 104 Basenpaare
(B) ART: Nukleinsäure
(C) STRANGFORM: Doppel
(D) TOPOLOGIE: linear
(ii) ART DES MOLEKÜLS: DNS (genomisch)
(ix) MERKMALE:
(A) NAME/SCHLÜSSEL: exon
(B) LAGE: 1..104
(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 48: AAACCGTCAC CATGGTCACC CTCCGCCGCC TCGCCGTCCT CCTCGGCGCC ATCCCCGCCG 60 CCCTCGCCGC CATGAAGCTT TCGCGAGAAT TCGGGTCGAT CAGG 104
(2) INFORMATION ZU SEQ ID NO: 49:
(i) SEQUENZ CHARAKTERISTIK.:
(A) LÄNGE: 104 Basenpaare
(B) ART: Nukleinsäure
(C) STRANGFORM: Doppel
(D) TOPOLOGIE: linear
(ii) ART DES MOLEKÜLS: DNS (genomisch)
(ix) MERKMALE:
(A) NAME/SCHLÜSSEL: exon
(B) LAGE: 1..104
(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 49: CCTGATCGAC CCGAATTCTC GCGAAAGCTT CATGGCGGCG AGGGCGGCGG GGATGGCGCC 60 GAGGAGGACG GCGAGGCGGC GGAGGGTGAC CATGGTGACG GTTT 104
(2) INFORMATION ZU SEQ ID NO: 50:
(i) SEQUENZ CHARAKTERISTIK:
(A) LÄNGE: 105 Basenpaare
(B) ART: Nukleinsäure
(C) STRANGFORM: Doppel (D) TOPOLOGIE: linear (ii) ART DES MOLEKÜLS: DNS (genomisch)
(ix) MERKMALE:
(A) NAME/SCHLÜSSEL: exon
(B) LAGE: 1..105
(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 50: AAACCGTCAC CATGGTCACC CTCCGCCGCC TCGCCGTCCT CCTCGGCGCC ATCCCCGCCG 60 CCCTCGCCGC CATGCAAGCT TTCGCGAGAA TTCGGGTCGA TCAGG 105
(2) INFORMATION ZU SEQ ID NO: 51:
(i) SEQUENZ CHARAKTERISTIK:
(A) LÄNGE: 105 Basenpaare
(B) ART: Nukleinsäure
(C) STRANGFORM: Doppel
(D) TOPOLOGIE: linear
(ii) ART DES MOLEKÜLS: DNS (genomisch)
(ix) MERKMALE:
(A) NAME/SCHLÜSSEL: exon
(B) LAGE: 1..105
(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 51: CCTGATCGAC CCGAATTCTC GCGAAAGCTT GCATGGCGGC GAGGGCGGCG GGGATGGCGC 60 CGAGGAGGAC GGCGAGGCGG CGGAGGGTGA CCATGGTGAC GGTTT 105
(2) INFORMATION ZU SEQ ID NO: 52:
(i) SEQUENZ CHARAKTERISTIK.:
(A) LÄNGE: 106 Basenpaare
(B) ART: Nukleinsäure
(C) STRANGFORM: Doppel
(D) TOPOLOGIE: linear
(ii) ART DES MOLEKÜLS: DNS (genomisch)
(ix) MERKMALE:
(A) NAME/SCHLÜSSEL: exon
(B) LAGE: 1..106
(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 52: AAACCGTCAC CATGGTCACC CTCCGCCGCC TCGCCGTCCT CCTCGGCGCC ATCCCCGCCG 60 CCCTCGCCGC CATGCTAAGC TTTCGCGAGA ATTCGGGTCG ATCAGG 106
(2) INFORMATION ZU SEQ ID NO: 53:
(i) SEQUENZ CHARAKTERISTIK.:
(A) LÄNGE: 106 Basenpaare
(B) ART: Nukleinsäure
(C) STRANGFORM: Doppel
(D) TOPOLOGIE: linear
(ii) ART DES MOLEKÜLS: DNS (genomisch)
(ix) MERKMALE:
(A) NAME/SCHLÜSSEL: exon
(B) LAGE: 1..106
(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 53: CCTGATCGAC CCGAAATCTC GCGAAACGTT AGCATGGCGG CGAGGGCGGC GGGGATGGCG 60 CCGAGGAGGA CGGCGAGGCG GCGGAGGGTG ACCATGGTGA CGGTTT 106
(2) INFORMATION ZU SEQ ID NO: 54
(i) SEQUENZ CHARAKTERISTIK.:
(A) LÄNGE: 21 Basenpaare
(B) ART: Nukleinsäure
(C) STRANGFORM: Einzel
(D) TOPOLOGIE: linear
(ii) ART DES MOLEKÜLS: DNS (genomisch)
(ix) MERKMALE:
(A) NAME/SCHLÜSSEL: exon
(B) LAGE: 1..21
(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 54: CCTGCTATGT ACGGACAAGG G 21
(2) INFORMATION ZU SEQ ID NO: 55:
(i) SEQUENZ CHARAKTERISTIK.:
(A) LÄNGE: 22 Basenpaare
(B) ART: Nukleinsäure
(C) STRANGFORM: Einzel
(D) TOPOLOGIE: linear
(ii) ART DES MOLEKÜLS: DNS (genomisch)
(ix) MERKMALE:
(A) NAME/SCHLÜSSEL: exon ( B ) LAGE : 1 . . 22
(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 55: CCTCGTCATG CAGGAGCCGC CC 22
(2) INFORMATION ZU SEQ ID NO: 56:
(i) SEQUENZ CHARAKTERISTIK.:
(A) LÄNGE: 16 Basenpaare
(B) ART: Nukleotide
(C) STRANGFORM: Einzel
(D) TOPOLOGIE: linear
(ii) ART DES MOLEKÜLS: DNS (genomisch)
(ix) MERKMALE:
(A) NAME/SCHLÜSSEL: exon
(B) LAGE: 1..16
(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 56: NNGTNRCCRG YAACNN 16

Claims

Patentansprüche:
1. DNA-bindendes Protein, welches als Monomer, Homodimer oder Teil eines Heterodimer an doppelstrangige DNA der Sequenz GTTGCCGGGCCAAT CCCTGAGCTT (SEQ ID NO.: 4) aus dem intergenischen Bereich des pcbAB und pcbC-Gens von Acremonium chrysogenum bindet und in der Lage ist, die Transkription des pcbAB und/oder pcbC-Gens zu beinflussen.
2. DNA-bindendes Protein gemäß Anspruch 1 , dadurch gekennzeichnet, daß es die Aminosäuresequenz des CPCR1 -Proteins gemäß Tab. 7 (SEQ ID NO.: 21 ) oder Teile davon enthält.
3. Fusionsprotein, enthaltend die Aminosäuresequenz des CPCR1 -Proteins gemäß Tab. 7 (SEQ ID NO.: 21 ) oder Teile davon und eine Transaktivierungsdomäne, welches in der Lage ist, die Transkription des pcbAB und/oder pcbC-Gens zu beeinflussen.
4. Fusionsprotein gemäß Anspruch 3, dadurch gekennzeichnet, daß die genannten Teile des CPCR1 Proteins der DNA-Bindungsdomäne (Aminosäuren 180 bis 254 gemäß Tab. 7) und/oder der Dime sierungsdomäne (Aminosäuren 502 bis 660 gemäß Tabelle 7) entsprechen und die Transaktivierungsdomäne vom Transkriptionsfaktor GAL4 (Aminosäuren 768 bis 881 ) stammt.
5. DNA-Molekül, kodierend für ein Protein gemäß einem oder mehreren der Ansprüche 1 bis 4.
6. DNA-Molekül gemäß Anspruch 5, dadurch gekennzeichnet, daß
(a) es eine DNA-Sequenz gemäß Tabelle 6 (SEQ ID NO.: 20) oder Teile davon enthält; (b) es eine DNA-Sequenz gemäß Tabelle 13 (SEQ ID NO.: 57) oder Teile davon enthält;
(c) es eine DNA-Sequenz enthält, die in der Lage ist, mit den DNA-Molekülen gemäß (a) oder (b) unter stringenten Bedingungen zu hybridisieren, oder Teile davon;
(d) es eine DNA-Sequenz enthält, die aufgrund der Degeneriertheit des genetischen Codes von den DNA-Molekülen gemäß (a), (b) und (c) verschieden ist, jedoch die Expression der entsprechend mit den DNA- Molekülen gemäß (a), (b) und (c) exprimierbaren Proteinen ermöglicht, oder Teile davon.
7. Vektor, enthaltend eine DNA gemäß Anspruch 5 oder 6.
8. Vektor gemäß Anspruch 7, dadurch gekennzeichnet, daß es ein Vektor geeignet zur Expression in Acremonium chrysogenum oder Saccharomyces cerevisiae ist.
9. Vektor gemäß Anspruch 7, dadurch gekennzeichnet, daß er ausgewählt wird aus der Gruppe enthaltend die Vektoren pGC1 und pGCIΔDIMI .
10. Wirtszelle, enthaltend eine oder mehrere Kopien eines Vektors gemäß einem oder mehreren der Ansprüche 7 bis 9 oder eine DNA gemäß einem der Ansprüche 5 oder 6.
11. Wirtszelle gemäß Anspruch 10, dadurch gekennzeichnet, daß sie ausgewählt ist aus der Gruppe enthaltend Acremonium chrysogenum und Saccharomyces cerevisiae.
12. Verfahren zur Herstellung eines DNA-bindenden Proteins gemäß einem oder mehreren der Ansprüche 1 bis 4, dadurch gekennzeichnet, daß eine DNA gemäß einem der Ansprüche 5 oder 6 mittels eines Vektors gemäß einem der Ansprüche 7 bis 9 in einer Wirtszelle gemäß Anspruch 10 oder 11 exprimiert und isoliert wird.
13. Verfahren zur Steigerung der Cephalosporin C-Ausbeute in Acremonium chrysogenum, bei dem die Expression des cpcRI -Genprodukts mit gentechnischen Mitteln variiert wird und das Cephalosporin C isoliert wird.
14. Verfahren gemäß Anspruch 13, dadurch gekennzeichnet, daß die variierte Expression durch Einbringen einer oder mehrerer Kopien des cpcR1-Gens in den Wirtsorganismus zusätzlich zum endogenen cpcR1-Gen erreicht wird.
15. Verfahren gemäß Anspruch 13, dadurch gekennzeichnet, daß die variierte Expression durch Integration einer oder mehrerer zusätzlicher DNA- Bindesequenzen TTGCCGGGCCAAT (SEQ ID NO.: 1 ) des DNA-bindenden Proteins gemäß einem der Ansprüche 1 bis 4 im pcbAB/pcbC-Promotor erreicht wird.
16. DNA-Bindungsstelle für ein DNA-bindendes Protein gemäß einem oder mehreren der Ansprüche 1 bis 4, ausgewählt aus der Gruppe enthaltend die doppelsträngigen Sequenzen GTTGCCGGGCCAATCCCTGAGCTT (SEQ ID NO.: 4), TTGCCGGGCCAAT (SEQ ID NO.: 1 ) und GTTGCCGGGC GTATCCCTGAGCTT (SEQ ID NO.: 8).
17. Vektor gemäß einem oder mehreren der Ansprüche 7 bis 9, enthaltend eine oder mehrere Kopien der DNA-Sequenzen gemäß Anspruch 16.
PCT/EP1998/007971 1997-12-12 1998-12-08 NEUER TRANSKRIPTIONSFAKTOR CPCR1 ZUR REGULATION DES ISOPENICILLIN N-SYNTHETASE-GENS (PCbC) UND DES AC-/ACV-SYNTHETASE-GENS (pcbAB) WO1999031244A1 (de)

Priority Applications (1)

Application Number Priority Date Filing Date Title
AU24131/99A AU2413199A (en) 1997-12-12 1998-12-08 Novel transcription factor cpcr1 for regulation of isopenicillin n synthetase gene (pcbc) and ac/acv synthesase gene (pcbab)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
DE1997155302 DE19755302A1 (de) 1997-12-12 1997-12-12 Neuer Transkriptionsfaktor CPCR1 zur Regulation des Isopenicillin N-Synthetase-Gens (pcbC) und des AC-/ACV-Synthetase-Gens (pcbAB)
DE19755302.8 1997-12-12

Publications (1)

Publication Number Publication Date
WO1999031244A1 true WO1999031244A1 (de) 1999-06-24

Family

ID=7851715

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/EP1998/007971 WO1999031244A1 (de) 1997-12-12 1998-12-08 NEUER TRANSKRIPTIONSFAKTOR CPCR1 ZUR REGULATION DES ISOPENICILLIN N-SYNTHETASE-GENS (PCbC) UND DES AC-/ACV-SYNTHETASE-GENS (pcbAB)

Country Status (3)

Country Link
AU (1) AU2413199A (de)
DE (1) DE19755302A1 (de)
WO (1) WO1999031244A1 (de)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2002057456A2 (en) * 2000-12-22 2002-07-25 Microbia Regulators of fungal gene expression

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0200425A2 (de) * 1985-04-22 1986-11-05 Eli Lilly And Company Rekombinante DNS-Expressionsvektoren und DNS-Verbindungen
EP0618298A2 (de) * 1993-03-20 1994-10-05 Hoechst Aktiengesellschaft Bidirektionaler Promotor des pcbAB- und pcbC- Gens von Acremonium chrysogenum und seine Verwendung
ES2094088A1 (es) * 1994-05-04 1997-01-01 Antibioticos Sa Identificacion, clonacion y utilizacion de una region de dna amplificada en cepas de p. chrysogenum superproductoras de penicilina.

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0200425A2 (de) * 1985-04-22 1986-11-05 Eli Lilly And Company Rekombinante DNS-Expressionsvektoren und DNS-Verbindungen
EP0618298A2 (de) * 1993-03-20 1994-10-05 Hoechst Aktiengesellschaft Bidirektionaler Promotor des pcbAB- und pcbC- Gens von Acremonium chrysogenum und seine Verwendung
ES2094088A1 (es) * 1994-05-04 1997-01-01 Antibioticos Sa Identificacion, clonacion y utilizacion de una region de dna amplificada en cepas de p. chrysogenum superproductoras de penicilina.

Non-Patent Citations (6)

* Cited by examiner, † Cited by third party
Title
CHEN H. AND KINSEY J.: "Purification of a heteromeric CCAAT binding protein from Neurospora crassa", MOLECULAR AND GENERAL GENETICS, vol. 249, no. 1, 1995, pages 301 - 308, XP002101444 *
DATABASE WPI Section Ch Week 9708, Derwent World Patents Index; Class C12, AN 97-079738, XP002101446 *
MARTIN J. AND GUTIÉRREZ S.: "Genes for beta-lactam antibiotic biosynthesis", ANTONIE VAN LEEUWENHOEK, vol. 67, 1995, pages 181 - 200, XP002101445 *
PAPAGIANNOPOULOS P. ET AL.: "The hapC gene of Aspergillus nidulans is involved in the expression of CCAAT-containing promoters", MOLECULAR AND GENERAL GENETICS, vol. 251, 1996, pages 412 - 421, XP002101443 *
SMITH A W ET AL: "Regulation of isopenicillin N synthetase (IPNS) gene expression in Acremonium chrysogenum.", BIO/TECHNOLOGY, (1990 MAR) 8 (3) 237-40. JOURNAL CODE: AL1. ISSN: 0733-222X., United States, XP002101442 *
THEN BERGH K. ET AL.: "Identification of a major cis-acting DNA element controlling the bidirectionally transcribed penicillin biosynthesis genes acvA (pcbAB) and ipnA (pcbC) of Aspergillus nidulans", JOURNAL OF BACTERIOLOGY, vol. 178, no. 13, 1996, pages 3908 - 3916, XP002101441 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2002057456A2 (en) * 2000-12-22 2002-07-25 Microbia Regulators of fungal gene expression
WO2002057456A3 (en) * 2000-12-22 2003-05-01 Microbia Regulators of fungal gene expression
US6806082B2 (en) 2000-12-22 2004-10-19 Microbia, Inc. Isolated nucleic acid molecule encoding a regulator of fungal gene expression

Also Published As

Publication number Publication date
DE19755302A1 (de) 1999-06-17
AU2413199A (en) 1999-07-05

Similar Documents

Publication Publication Date Title
EP0751995B1 (de) Riboflavin-biosynthesis in fungi
Nehlin et al. Yeast SKO1 gene encodes a bZIP protein that binds to the CRE motif and acts as a repressor of transcription
DE69734669T2 (de) Enzymatische cofaktor-regeneration unter verwendung von pyridin-nucleotid transhydrogenase
EP0875567B1 (de) Myc-bindende Zinkfinger-Proteine, ihre Herstellung und ihre Verwendung
EP0915981B1 (de) Isolierung der biosynthesegene für pseudo-oligosaccharide aus streptomyces glaucescens gla.o und ihre verwendung
DE3931716C2 (de) Rekombinante DNA, eine sie enthaltende Transformante und ein Verfahren zur Herstellung von wärmestabiler Glucosedehydrogenase und ihre Verwendung
EP0668917B1 (de) Riboflavin-synthese in hefen
DE69627787T2 (de) Actinomyceten-Promotor
EP1337646A2 (de) Gene des 1-desoxy-d-xylulose-biosynthesewegs
EP0953044A2 (de) Gen für adenylatzyklase und seine verwendung
US6326477B1 (en) Process for modifying glucose repression
WO1997003208A1 (de) Verfahren zur herstellung von riboflavin mittels mikroorganismen mit veränderter isocitratlyase-aktivität
WO1999031244A1 (de) NEUER TRANSKRIPTIONSFAKTOR CPCR1 ZUR REGULATION DES ISOPENICILLIN N-SYNTHETASE-GENS (PCbC) UND DES AC-/ACV-SYNTHETASE-GENS (pcbAB)
HU218265B (hu) V-penicillin amidohidrolázt kódoló izolált nukleinsav-szekvenciák Fusarium oxysporumból, ezeket tartalmazó expressziós vektorok és gazdasejtek, és eljárás az általuk kódolt polipeptidek előállítására
DE69832783T2 (de) Mikroorganismen mit erhöhter herstellung von clavulansäure
JPH02117694A (ja) デスルファトヒルジン変異体
DE4420785A1 (de) Riboflavin-Biosynthese in Pilzen
DE19526485A1 (de) Rekombinant hergestellte Leucinaminopeptidase aus Aspergillus sojae
DE4024158A1 (de) Klonierung und ueberexpression von glucose-6-phosphat-dehydrogenase aus leuconostoc dextranicus
DE4204103A1 (de) Expression cytotoxischer gaba-permeasegene, verfahren zu ihrer isolierung und ihre verwendung
EP0569806B1 (de) DNA-Verbindungen und rekombinante, die Ribloflavinsynthetaseaktivität von S. cerevisiae codierende DNA-Expressionsvektoren
WO1989009821A1 (en) GENE AND GENE PRODUCT FOR PREPARING beta-LACTAM COMPOUNDS
EP0180225B1 (de) Plasmide zur erhöhten Produktion von Penicillin G-Amidase
DE10045123B4 (de) Das C. albicans TEC1 GEN(CaTEC1) und das kodierte Tec1p Protein
DE3730712A1 (de) Expression von mutarotase

Legal Events

Date Code Title Description
AK Designated states

Kind code of ref document: A1

Designated state(s): AL AM AT AU AZ BA BB BG BR BY CA CH CN CU CZ DE DK EE ES FI GB GD GE GH GM HR HU ID IL IN IS JP KE KG KP KR KZ LC LK LR LS LT LU LV MD MG MK MN MW MX NO NZ PL PT RO RU SD SE SG SI SK SL TJ TM TR TT UA UG US UZ VN YU ZW

AL Designated countries for regional patents

Kind code of ref document: A1

Designated state(s): GH GM KE LS MW SD SZ UG ZW AM AZ BY KG KZ MD RU TJ TM AT BE CH CY DE DK ES FI FR GB GR IE IT LU MC NL PT SE BF BJ CF CG CI CM GA GN GW ML MR NE SN TD TG

121 Ep: the epo has been informed by wipo that ep was designated in this application
DFPE Request for preliminary examination filed prior to expiration of 19th month from priority date (pct application filed before 20040101)
ENP Entry into the national phase

Ref country code: AT

Ref document number: 1998 9139

Date of ref document: 19990624

Kind code of ref document: A

Format of ref document f/p: F

WWE Wipo information: entry into national phase

Ref document number: 19989139

Country of ref document: AT

NENP Non-entry into the national phase

Ref country code: KR

122 Ep: pct application non-entry in european phase
REG Reference to national code

Ref country code: DE

Ref legal event code: 8642

NENP Non-entry into the national phase

Ref country code: CA