PT915981E - Isolamento dos genes de biossíntese para pseudo-oligossacáridos a partir de streptomyces glaucescens gla.o e sua utilização - Google Patents

Isolamento dos genes de biossíntese para pseudo-oligossacáridos a partir de streptomyces glaucescens gla.o e sua utilização Download PDF

Info

Publication number
PT915981E
PT915981E PT97927087T PT97927087T PT915981E PT 915981 E PT915981 E PT 915981E PT 97927087 T PT97927087 T PT 97927087T PT 97927087 T PT97927087 T PT 97927087T PT 915981 E PT915981 E PT 915981E
Authority
PT
Portugal
Prior art keywords
ala
acarbose
dna
leu
gly
Prior art date
Application number
PT97927087T
Other languages
English (en)
Inventor
Heinrich Decker
Original Assignee
Sanofi Aventis Deutschland
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sanofi Aventis Deutschland filed Critical Sanofi Aventis Deutschland
Publication of PT915981E publication Critical patent/PT915981E/pt

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/195Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria
    • C07K14/36Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria from Actinomyces; from Streptomyces (G)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/52Genes encoding for enzymes or proenzymes

Landscapes

  • Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Organic Chemistry (AREA)
  • Molecular Biology (AREA)
  • Biomedical Technology (AREA)
  • General Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Zoology (AREA)
  • Biophysics (AREA)
  • Biochemistry (AREA)
  • Wood Science & Technology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biotechnology (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Plant Pathology (AREA)
  • Physics & Mathematics (AREA)
  • Microbiology (AREA)
  • Medicinal Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Medicines Containing Plant Substances (AREA)
  • Agricultural Chemicals And Associated Chemicals (AREA)

Description

DESCRIÇÃO "ISOLAMENTO DOS GENES DE BIOSSÍNTESE PARA PSEUDO-OLIGOSSACÁRIDOS A PARTIR DE STREPTOMYCES GLAUCESCENS GLA.O E SUA UTILIZAÇÃO" A presente invenção refere-se ao isolamento de genes os quais codificam para enzimas de biossintese de substâncias inibidoras de α-amilase, os denominados pseudo-oligossacáridos. Trata-se, neste caso, em particular de genes da estirpe de estreptomicetas Streptomyces glaucescens GLA.O (DSM 40716). Para além disso, descreve-se a utilização destes genes para a produção de acarbose e substâncias homólogas com Streptomyces glaucescens (DSM 40716), sua expressão heteróloga noutras estirpes produtoras de pseudo-oligossacáridos (p. ex. Actinoplanes sp. SE50/100) para o aumento de produção e estabilização de produção, bem como sua expressão heteróloga noutros microrganismos, tal como, p. ex., E. coli, Bacillus subtilis, actinomicetales, tal como, p. ex. estirpes de Streptomyces, Actinoplanes, Ampullariella, Streptosporangium, Streptomyces hygroscopicus var. limoneus, Streptomyces glaucescens, bem como fungos relevantes em termos biotecnológicos (p. ex., Aspergillus niger, Penicillium chrysogenum) e leveduras (p. ex., Saccharomyces cerevisiae). A invenção refere-se também a genes homólogos noutros organismos, bem como a processos para seu isolamneto. A Streptomyces glaucescens (DSM 40716), a qual também é designada na literatura por Streptomyces glaucescens GLA.O, produz os dois antibióticos, a hidroxiestreptomicina (Hutter (1967) Systematik der Streptomyceten. Basel Karger Verlag) e a 1 tetracenomicina (Weber et 116). É sabido que as sintetizar substâncias Frequentemente, contudo, compostos são produzidos são produzidas apenas em detectadas. al. (1979) Arch. Microbiol. 121: 111-estreptomicetas têm capacidade para naturais estruturalmente distintas. as condições sob as quais estes não são conhecidas ou as substâncias quantidades muito reduzidas e não são A substância inibidora de α-amilase, acarbose, foi isolada de diversas estirpes de Actinoplanes (SE50, SE82 e SE18) (Schmidt et al. (1977) Naturwissenschaften 64: 535-536). A substância activa foi descoberta num rastreio para substâncias inibidoras de α-amilase a partir de organismos dos géneros Actinoplanes, Ampullariella e Streptosporangium. No caso da acarbose trata-se de um pseudotetrassacárido que consiste numa unidade de ciclitol insaturada inabitual, à qual está ligado um aminoaçúcar 4,6-dideoxi-4-amino-D-glucopiranose. Ao aminoaçúcar podem estar ainda ligadas unidades adicionais de D-glucopiranose ligadas por ligação glicosidica oí-1,4. Assim, a acarbose contém, p. ex., duas moléculas de D-glicose adicionais. A estirpe produtora sintetiza uma mistura de produto de pseudo-oligossacáridos com cadeias laterais de açúcar de diferentes comprimentos (Schmidt et al. (1977) Naturwissenschaften 64: 535-536). 0 residuo ciclitol da acarbose é idêntico ao composto valienamina, um componente do antibiótico validamicina A (Iwasa et al. (1979) J. Antibiot. 32: 595-602) de Streptomyces hygroscopicus var. limoneus. A acarbose pode ser preparada por fermentação com uma estirpe de Actinoplanes e obteve grande importância económica como agente terapêutico para diabéticos. A Actinoplanes sintetiza uma mistura de produto de inibidores de a-amilase, 2 contudo, apenas o composto com o peso molecular relativo de 645,5 (acarviosina com 2 unidades de glicose (Truscheit (1984) VlIIth International Symposium on Medicinal Chemistry, Proc. Vol. I. Swedish Academy of Pharmaceutical Sciences, Stockholm, Sweden) é empregue sob o nome genérico acarbose. As condições de fermentação são seleccionadas de modo a que a acarbose seja o produto principal da fermentação. Alternativamente são utilizadas determinadas selecções e estirpes nas quais a acarbose é originada como produto principal ou então são empregues processos de purificação para o isolamento selectivo (Truscheit (1984) VlIIth International Symposium on Medicinal Chemistry, Proc. Vol. I. Swedish Academy of Pharmaceutical Sciences, Stockholm Sweden). É também possível a transformação quimica da mistura de produto de modo a, por fim, obter o produto desejado, a acarbose.
No pedido de patente alemão com o número de publicação 2209834 está descrito um processo para a preparação de inibidores de sacarose a partir da estirpe de Actinoplanes SE 50. Sondas de genes para a detecção do metabolismo de 6-desoxi-hexose em estreptomicetas, as quais produzem metabolitos secundários, foram descritas por Stockmann e Piepersberg (FEMS Microbiology Letters 90, (1992), 185-190).
Ao contrário do género Streptomyces, o género Actinoplanes ainda não foi até à data investigado geneticamente de modo intensivo. Os métodos que foram estabelecidos para o género Streptomyces não são, ou nem sempre são, transferíveis para o género Actinoplanes. Para uma optimização orientada da produção de acarbose com métodos de biologia molecular, os genes para a biossíntese de acarbose têm de ser isolados, bem como caracterizados. Neste caso, é natural a tentativa de estabelecer 3 um sistema hospedeiro-vector para Actinoplanes sp.. Isto é contudo muito moroso e dispendioso devido às investigações pouco intensivas de Actinoplanes. A invenção descrita no presente pedido de patente é uma solução para o objectivo de levar a cabo a clonagem dos genes de biossintese para acarbose e pseudo-oligossacáridos homólogos, e designadamente a partir de Streptomyces glaucescens GLA.O, uma estreptomiceta que está bem investigada em termos de genética (Crameri et al. (1983) J. Gen. Microbiol. 129: 519-527/ Hintermann et al. (1984) Mol. Gen. Genet. 196: 513-520; Motamedi and Hutchinson (1987) PNAS USA 84: 4445-4449; Geistlich et al. (1989) Mol. Microbiol. 3: 1061-1069) e é surpreendentemente um produtor de acarbose. Em meio contendo amido, a Streptomyces glaucescens GLA.O produz pseudo-oligassacáridos com os pesos moleculares 645, 807 e 970.
Um objecto da invenção é portanto o isolamento dos genes de biossintese correspondentes a partir de Streptomyces glaucescens GLA.O e sua utilização para o isolamento das regiões de ADN adjacentes para completar o agrupamento de genes dos genes de biossintese mencionados. O isolamento dos genes para a biossintese de pseudo-oligossacáridos e sua caracterização são de grande importância de modo a poder-se entender melhor a biossintese e sua regulação. Com este conhecimento pode aumentar-se depois a produtividade da estirpe Streptomyces glaucescens GLA.O quanto à produção de acarbose com processos clássicos e de biologia molecular estabelecidos. Para além disso, o agrupamento de genes completo, que codifica para a sintese dos pseudo-oligossacáridos, ou genes individuais deste, pode ser também 4 expresso noutros microrganismos relevantes em termos biotecnológicos de modo a alcançar-se um aumento adicional da produção ou uma simplificação da preparação de pseudo-oligossacáridos tal como, p. ex. acarbose. Através de modificação dirigida dos genes de biossintese também se pode preparar uma estirpe que produz exclusivamente acarbose com um peso molecular de 645. Dado que os genes para sínteses de antibióticos se encontram sempre em agrupamentos e, frequentemente, são fortemente conservados (Stockmann e Piepersberg (1992) FEMS Microbiol. Letters 90: 185-190; Malpartida et al. (1987) Nature 314: 642-644), os genes de Streptomyces glaucescens GLA.O também podem ser empregues como sonda para o isolamento dos genes codificadores para acarbose a partir de, p. ex., Actinoplanes sp. . A expressão de genes de regulação ou de genes que codificam para passos de biossintese limitativos pode ter como consequência um aumento da produtividade em Streptomyces glaucescens GLA.O, Actinoplanes sp. ou estirpes produtoras correspondentes. Do mesmo modo, pode ser conseguido um aumento da produtividade através de uma inactivação ("knock out" ou mutagénese) daqueles genes de biossintese de acarbose que actuam na biossintese como inibidores.
Uma possível estratégia para a clonagem de genes de biossintese de antibióticos não isolados até à data consiste na utilização de sondas específicas de genes (Stockmann e Piepersberg (1992) FEMS Microbiol. Letters 90: 185-190; Malpartida et al. (1987) Nature 314: 642-644). Isto podem ser fragmentos de ADN marcados com P32 ou marcados de outro modo ou então amplifica-se os genes correspondentes directamente a partir das estirpes a ser investigadas com iniciadores para PCR degenerados e ADN cromossómico isolado como moldes. 5 0 processo mencionado por último foi empregue no presente trabalho. Os pseudo-oligossacáridos como a acarbose contêm uma unidade construtiva de 4,6-deoxiglicose como elemento estrutural. É sabido que a enzima dTDP-glicose-4,6-desidratase está envolvida na biossintese de 4,6-deoxiglicose (Stockmann e Piepersberg (1992) FEMS Microbiol. Letters 90: 185-190). Dado que o deoxiaçúcar é um componente frequente de substâncias naturais e antibióticos, esta enzima é possivelmente um meio para o isolamento dos genes de biossintese de antibióticos correspondentes. Dado que estes se encontram sempre como agrupamentos, em primeiro lugar, é suficiente o isolamento de um gene; subsequentemente pode realizar-se então o isolamento e caracterização das regiões de ADN adjacentes.
Uma dTDP glicose 4,6-desidratase catalisa, p. ex., um passo na biossintese de hidroxiestreptomicina na Streptomyces glaucescens GLA.O (Retzlaff et al. (1993) Industrial Microorganisms. Basic and applied molecular genetics ASM, Washington DC, USA). dTDP glicose 4, 6-desidratases adicionais foram isoladas de outros microrganismos, p. ex., a partir de Streptomyces griseus (Pissowotzki et al. (1991) Mol. Gen. Genet. 231: 113-123), Streptomyces fradiae (Merson-Davies and
Cundcliffe (1994) Mol. Microbiol. 13: 349-355) e Streptomyces violaceoruber (Bechthold, et al. (1995) Mol. Gen. Genet. 248: 610-620). A sequência dos iniciadorespara PCR para a amplificação de uma dTDP-glicose-4,6-desidratase pôde ser portanto deduzida da sequência de aminoácidos de genes de biossintese já conhecidos. Foram seleccionadas, para o efeito, regiões conservadas na sequência proteica destas enzimas e a sequência de aminoácidos foi traduzida para uma sequência de ácidos nucleicos em 6 correspondência com o código genético. As seguências proteicas foram retiradas dos bancos de dados do EMBL e Genbank. Foram utilizadas as seguintes seguências: Streptomyces griseus, número de acesso: X62567, gene: strE (de 30.10.1993); Streptomyces violaceoruber: número de acesso: L37334, gene: graE (de 10.04.1995); Saccharopolyspora etythraea; número de acesso: L37354, gene: gdh (de 09.11.1994). Devido à degenerabilidade do código genético originam-se muitas sequências de iniciadores possíveis. Dado que as estreptomicetas contêm, na maioria dos casos, um G ou C na terceira posição de um codão (Wright and Bibb (1992) Gene 113: 55-65), reduz-se o número dos iniciadores a ser sintetizado. Com estas misturas de iniciadores pode realizar-se então uma amplificação por PCR com o ADN das estirpes a ser investigadas que, no caso ideal, conduz a um fragmento de ADN amplificado. No caso de proteínas altamente conservadas, este fragmento apresenta um comprimento previsível, que resulta da distância entre os iniciadores na sequência de ácidos nucleicos do gene correspondente. Um princípio de ensaio deste tipo não tem contudo de conduzir necessariamente a um amplificado. Os iniciadores podem ser demasiado inespecíficos e amplificar muitos fragmentos ou entãonão se obtém qualquer produto da PCR quando não existam, para os iniciadores para PCR preparados, quaisquer locais de ligação complementares no cromossoma. A investigação da estirpe de estreptomicetas Streptomyces glaucescens GLA.O forneceu um fragmento de ADN amplificado (acdD*) com o comprimento esperado de 550 pb. A investigação adicional revelou que esta estirpe contém, surpreendentemente, a par de um gene de dTDP glicose-4, 6-desidratase para a biossíntese de hidroxiestreptomicina, um segundo gene de dTDP glicose-4,6-desidratase para a biossíntese de pseudo- 7 oligossacáridos, como a acarbose. Os dois genes apresentam uma elevada homologia, mas ao nível dos aminoácidos são apenas idênticos em 65%.
Com a sonda acbD* (ver exemplo 2 e tabela 2a) isolou-se um fragmento de ADN de PstI de 6,8 kb de comprimento a partir de Streptomyces glaucescens GLA.O, que codifica para diversos genes (acbA, acbB, acbC, acbD, acbE, acbF), que estão envolvidos na biossíntese dos pseudo-oligossacáridos.
Através da delecção dos genes acbBCD (aminotransferase acbB, dTDP-glicose sintase acbC, dTDP glicose-4,6-desidratase acbD, ver exemplo 6) gerou-se um mutante de Streptomyces glaucescens GLA.O que, no meio de produção, já não produz quaisquer pseudo-oligossacáridos. 0 envolvimento dos genes acbBCD na síntese de pseudo-oligossacáridos foi portanto comprovado pela delecção dos loci correspondentes.
Os dois genes dTDP-glicose sintase e dTDP glicose-4,6-desidratase poderiam estar envolvidos na biossíntese do deoxiaçúcar dos pseudo-oligossacáridos o que se pode concluir a partir da função de enzimas homólogas bem investigadas (ver acima). A aminotransferase (codificada pelo gene acbB) é provavelmente responsável pela transferência do grupo amino para o resíduo de açúcar ou de ciclitol. Através da análise da sequência proteica de acbB pode encontrar-se um padrão de aminoácidos que está envolvido na ligação de piridoxal-fosfato. Este padrão é típico para aminotransferases da clase III (EC 2.6.1.11; EC 2.6.1.13; EC 2.6.1.18; EC 2.6.1.19; EC 2.6.1.62; EC 2.6.1.64; EC 5.4.3.8). A função enzimática exacta de acbB só pode ser clarificada na investigação adicional da biossíntese dos pseudo-oligossacraídeos. O acbE codifica para uma proteína 8 de regulação de transcrição com grandes semelhanças a proteínas ligantes a ADN com um padrão hélice-volta-hélice (p. ex., Bacillus subtilis DegA, P37947: banco de dados Swiss-Prot). Assim, o activador de transcrição CcpA de Bacillus subtilis inibe a formação de α-amilase na presença de, p. ex., glicose (Henkin et al. (1991) Mol. Microbiol. 5: 575-584). No caso de outros representantes deste grupo, trata-se de proteínas que reconhecem determinadas unidades construtivas de açúcar e podem apresentar um efeito positivo ou negativo sobre a biossíntese de vias metabólicas. A biossíntese dos pseudo-oligossacáridos em Streptomyces glaucescens GLA.O também é regulada. A síntese dos pseudo-oligossacáridos só pode ser detectada, até à data, em meios contendo amido. 0 acbE poderia ser assim responsável pela regulação da síntese dos pseudo-oligossacáridos, o mecanismo exacto não é ainda contudo conhecido. Contudo, o gene pode agora ser modificado de modo dirigido com métodos de biologia molecular, de modo a conseguir-se uma taxa da biossíntese de pseudo-oligossacáridos aumentada. Além disso, o local de ligação ao ADN de acbE pode ser identificado por, assim denominados, ensaios de deslocamento em gel (Miwa et al. (1994) Microbiology 140: 2567-2575). Após identificação e subsequente modificação dos promotores e outras regiões reguladores do ADN, as quais são responsáveis pela transcrição dos genes de pseudo-oligossacáridos, pode alcançar-se um aumento da taxa de biossíntese de acarbose. A função de acbF ainda não é actualmente inequivocamente conhecida. O produto génico apresenta homologias para com proteínas ligantes a açúcares, tal como, por exemplo, à proteína ligante a açúcar de Streptococcus mutans (MsmE; Q00749: banco de dados Swissprot), o que torna provável um envolvimento na biossíntese dos pseudo-oligossacáridos. O produto génico do gene 9 acbA apresenta homologias para com proteínas bacterianas ligantes a ATP conhecidas (p. ex., de Streptomyces peucitus DrrA, P32010: banco de dados SwissProt). A proteína AcbA apresenta o padrão de ligação a ATP/GTP típico, o assim denominado laço P. Estas proteínas representam um componente importante de, assim denominados, transportadores ABC, que estão envolvidos no transporte activo de metabolitos em membranas biológicas (Higgins (1995) Cell 82: 693-696). A AcbA poderia ser assim responsável pela exportação dos pseudo-oligossacáridos a partir da célula ou então estar envolvida na importação de unidades construtivas de açúcar para a biossínteses de substâncias inibidoras de α-amilase, tal como, p. ex., maltose.
Todos os genes de biossíntese para metabolitos secundários de estreptomicetas analisados até à data estão dispostos num agrupamento. Por este motivo, é de admitir também um agrupamento de genes desse tipo para os genes de biossíntese de acarbose de acordo com o pedido. Deste modo, através do isolamento das regiões de ADN adjacentes do fragmento de ADN PstI de 6,8 kb, de acordo com a invenção, podem também ser isolados os restantes genes que são relevantes para a biossíntese de pseudo-oligossacáridos. Tal como já mencionado acima, o isolamento de agrupamentos de genes homólogos a partir de microrganismos diferentes de Streptomyces glaucescens (DSM 40716) é facilmente possível.
Objectivo da invenção e, por conseguinte, uma molécula de ADN recombinante, contendo genes para a biossíntese de acarbose, a qual (a) contém uma sequência de ADN de acordo com a tabela 4; 10 (b) contém uma sequência de ADN que tem a capacidade de hibridar, sob condições estringentes, com a molécula de ADN de acordo com (a) ; ou (c) contém uma sequência de ADN que, devido à degenerabilidade do código genético, é diferente das moléculas de ADN de acordo com (a) e (b) , mas que possibilita a expressão das proteínas que podem ser correspondentemente expressas com a molécula de ADN de acordo com (a) e (b).
Além disso, são objectos da invenção, uma molécula de ADN recombinante contendo o gene acbA, caracterizada, em particular, por conter a sequência de ADN dos nucleótidos 1 até 720 segundo a tabela 4 ou partes desta; uma molécula de ADN recombinante contendo o gene acbB, caracterizada, em particular, por conter a sequência de ADN dos nucleótidos 720 até 2006 segundo a tabela 4 ou partes desta; uma molécula de ADN recombinante contendo o gene acbC, caracterizada, em particular, por conter a sequência de ADN dos nucleótidos 2268 até 3332 segundo a tabela 4 ou partes desta; uma molécula de ADN recombinante contendo o gene acbD, caracterizada, em particular, por conter a sequência de ADN dos nucleótidos 3332 até 4306 segundo a tabela 4 ou partes desta; uma molécula de ADN recombinante contendo o gene acbE, caracterizada, em particular, por conter a sequência de ADN dos nucleótidos 4380 até 5414 segundo a tabela 4 ou partes desta; uma molécula de ADN recombinante contendo o gene acbF, caracterizada, em particular, por conter a sequência de ADN dos nucleótidos 5676 até 6854 segundo a tabela 4 ou partes desta.
Objectos adicionais da invenção é um iniciador oligonucleotidico para a amplificação por PCR de uma molécula de ADN recombinante, tal como descrita acima, contendo genes para a 11 biossíntese de acarbose, em que o iniciador tem, em particular, a sequência de acordo com a tabela 1.
Um objecto adicional da invenção é um vector contendo uma molécula de ADN recombinante, a qual contém uma molécula de ADN tal como descrita no penúltimo e antepenúltimo parágrafo, caracterizado, em particular, por o vector ser um vector de expressão e a dita molécula de ADN estar ligada operativamente com uma sequência de promotor, em que o vector é, de um modo preferido, adequado para a expressão em organismos hospedeiros, seleccionados do grupo constituído por E. coli, Bacillus subtilis, actinomicetales, tal como, p. ex., estirpes de Streptomyces, Actinoplanes, Ampullariella, Streptosporangium, Streptomyces hygroscopicus var. limoneus, Streptomyces glaucescens, bem como fungos relevantes em termos biotecnológicos (p. ex. Aspergillus niger, Penicillium chrysogenum) e leveduras (p. ex. Saccharomyces cerevisiae) , de um modo muito preferido em particular, Streptomyces glaucescens (DSM 40716) ou Actinoplanes sp.. Dado que a ligação operativa da dita molécula de ADN com sequências de promotor do vector é apenas uma forma de realização preferida da invenção, é também possivel uma expressão por meio de sequências endógenas de promotor quanto à molécula de ADN, p. ex., dos respectivos promotores naturais, ou naturais mutados quanto à optimização do rendimento de acarbose. Promotores naturais deste tipo são parte da molécula de ADN de acordo com a invenção.
Um objecto adicional da invenção é um vector contendo a molécula de ADN de acordo com a invenção para a utilização num processo para a inactivação ou alteração de genes naturais de biossintese de acarbose num microrganismo produtor de acarbose. Um vector deste tipo é seleccionado, de um modo preferido, do 12 grupo contendo pGM160 e vectores tal como descritos nas patentes europeias EP 0334282 e EP 0158872.
Um objecto adicional da invenção é uma célula hospedeira, transformada com uma das moléculas de ADN ou vectores descritos acima, caracterizada, em particular, por a dita célula hospedeira ser seleccionada do grupo constituído por E. coli, Bacillus subtilis, actinomicetales, tal como, p. ex., estirpes de Streptomyces, Actinoplanes, Ampullariella, Streptosporangium, Streptomyces hygroscopicus var. limoneus, Streptomyces glaucescens, bem como fungos relevantes em termos biotecnológicos (p. ex. Aspergillus niger, Penicillium chrysogenum) e leveduras (p. ex. Saccharomyces cerevisiae); de um modo muito preferido em particular, por ser seleccionada do grupo constituído por Streptomyces glaucescens (DSM 40716) e Actinoplanes sp..
Um objecto adicional da invenção são proteínas isoladas, obteníveis por expressão dos genes, as quais são codificadas pela molécula de ADN descrita no parágrafo anterior.
As seguintes afirmações são válidas para todos os genes individuais identificados no âmbito da presente invenção e estão resumidas apenas por razões de perceptibilidade: Objecto adicional da invenção é uma proteína codificada por uma molécula de ADN recombinante, tal como descrita no penúltimo parágrafo, caracterizada, em particular, por conter a sequência de ADN dos nucleótidos 1 até 720 ou 720 até 2006 ou 2268 até 3332 ou 3332 até 4306 ou 4380 até 5414 ou 5676 até 6854 segundo a tabela 4 ou partes desta; muito preferida em particular é uma proteína, codificada pelo gene acbA ou pelo gene acbB ou pelo gene acbC ou 13 pelo gene acbD ou pelo gene acbE ou pelo gene acbF, contendo a sequência de aminoácidos segundo a tabela 4.
Um objecto adicional da invenção é um processo para a obtenção das proteínas que foram descritas anteriormente como objectos da invenção, caracterizado por (a) as proteínas serem expressas numa célula hospedeira adequada, caracterizado, em particular, por a dita célula hospedeira ser seleccionada do grupo constituído por E. coli, Bacillus subtilis, actinomicetales, tal como, p. ex., estirpes de Streptomyces, Actinoplanes, Ampullariella, Streptosporangium, Streptomyces hygroscopicus var. limoneus, Streptomyces glaucescens, bem como fungos relevantes em termos biotecnológicos (p. ex. Aspergillus niger, Penicillium chrysogenum) e leveduras (p. ex. Saccharomyces cerevisiae) ; de um modo muito preferido em particular, por ser seleccionada do grupo constituído por Streptomyces glaucescens (DSM 40716) e Actinoplanes sp. e (b) isoladas.
Um objecto adicional da invenção é um processo para a preparação de acarbose, caracterizado por (a) serem utilizados um ou vários genes da molécula de ADN recombinante, a qual contém uma sequência de ADN segundo a tabela 4, ou partes desta, ou contém uma sequência de ADN que tem a capacidade de hibridar, sob condições estringentes, com a molécula de ADN segundo a tabela 4, ou partes desta, ou contém uma sequência de ADN que, devido à degenerabilidade do código genético, é diferente das moléculas de ADN agora mesmo descritas, mas que possibilita 14 a expressão das proteínas que podem ser correspondentemente expressas com estas moléculas de ADN, ou partes desta, para a expressão numa célula hospedeira adequada que é seleccionada, em particular, do mesmo grupo tal como descrito no último parágrafo, e (b) a acarbose ser isolada a partir de sobrenadantes de cultura da dita célula hospedeira.
Um objecto adicional da invenção é um processo para a preparação de acarbose caracterizado por, (a) serem inactivados um ou vários genes da molécula de ADN recombinante, a qual contém uma sequência de ADN segundo a tabela 4, ou partes desta, ou contém uma sequência que tem a capacidade de hibridar, sob condições estringentes, com a molécula de ADN segundo a tabela 4, ou partes desta, ou contém uma sequência de ADN que, devido à degenerabilidade do código genético, é diferente das moléculas de ADN agora mesmo descritas, mas que possibilita a expressão das proteínas que podem ser correspondentemente expressas com estas moléculas de ADN, ou partes desta, numa célula hospedeira produtora de acarbose, em particular Streptomyces glaucescens (DSM 40716) e Actinoplanes sp. e (b) a acarbose ser isolada a partir da dita célula hospedeira. A inactivação de um ou vários genes, neste caso, pode ser efectuada segundo métodos padrão de biologia molecular, p. ex., sob utilização dos vectores descritos acima (pGM160 e outros). Um gene a inactivar poderia ser, p. ex., o gene acbE o qual tem, provavelmente, uma função reguladora. Do mesmo modo, poder-se-ia inactivar genes com o objectivo de já só se obter acarbose pura 15 como produto de fermentação e nenhuma mistura de pseudo-oligossacáridos homólogos (ver acima). Para a inactivação dos ditos genes servem, de um modo preferido, os vectores descritos acima para esta finalidade.
Um objecto adicional da invenção é um processo para a preparação de acarbose, caracterizado por os processos para a preparação de acarbose descritos nos dois parágrafos anteriores serem combinados entre si, portanto por um ou vários dos ditos genes serem expressos artificialmente e um ou vários dos ditos genes serem inactivados.
Um objecto adicional da presente invenção é um processo para a alteração da expressão génica de genes endógenos de biossintese de acarbose por mutação do respectivo promotor génico, de modo a obter-se melhores rendimentos de acarbose. As mutações podem ser introduzidas, neste caso, segundo processos conhecidos de recombinação homóloga na estirpe produtora a melhorar. Mutações deste tipo podem ser transições, delecções e/ou adições. Uma "adição" pode significar, p. ex., a introdução de um único ou vários nucleótidos ou uma ou várias sequências de ADN de acção reguladora positiva, que provoca uma intensificação da expressão de um gene endógeno de biossintese para a acarbose. 0 caso contrário, a introdução de uma sequência de ADN com acção reguladora negativa para a repressão de um gene endógeno de biossintese de acarbose também é uma forma preferida de uma adição. "Transições" podem ser, p. ex., trocas de nucleotidios que enfraquecem ou intensificam elementos reguladores positivos ou negativos na sua acção. Pelas "delecções" podem ser eliminados elementos reguladores positivos ou negativos. Os genes endógenos destes processos encontram-se, de um modo preferidos em actinomicetales, tal como, p. ex., estirpes de 16
Streptomyces, Actinoplanes, Ampullariella, Streptosporangium,
Streptomyces hygroscopicus var. limoneus, Streptomyces glaucescens; encontram-se de um modo muito preferido em Streptomyces glaucescens (DSM 40716) e Actinoplanes sp..
Um objecto adicional da invenção é a utilização de
Streptomyces (DSM 40716) para a obtenção de acarbose.
Um objecto adicional da invenção é a utilização de
Streptomyces (DSM 40716) para a preparação de mutantes desta estirpe por "via clássica", que possibilitam uma produção de acarbose mais rentável. Os processos de preparação para produtores melhorados de substâncias naturais deste tipo são conhecidos desde há muito e servem-se frequentemente de passos clássicos de mutagénese e selecção.
Um objecto adicional da invenção é um processo para completar o agrupamento de genes para a biossintese de acarbose e polissacáridos homólogos de acordo com a tabela 4, caracterizado por a) serem preparadas amostras de hibridação que são derivadas da molécula de ADN de acordo com a tabela 4, b) estas amostras de hibridação serem empregues, sob condições estringentes, para o rastreio genómico de bibliotecas de ADN, obtidas a partir de Streptomyces glaucescens (DSM 40716), e c) os clones encontrados serem isolados e caracterizados.
Um objecto adicional da invenção é um processo para completar o agrupamento de genes para a biossintese de acarbose e pseudo-oligossacáridos homólogos de acordo com a tabela 4, 17 caracterizado por, partindo da molécula de ADN recombinante de acordo com a tabela 4 a) serem preparados iniciadores para PCR, b) estes iniciadores para PCR serem utilizados para a acumulação de fragmentos de ADN de ADN genómico de Streptomyces glaucescens (DSM 40716), em que estes iniciadores são combinados com os iniciadores que hibridam de sequências do sistema de vectores utilizado, c) os fragmentos acumulados serem isolados e caracterizados.
Um objecto adicional da invenção é um processo para o isolamento de um agrupamento de genes para a biossintese de acarbose e pseudo-oligossacáridos homólogos a partir de microrganismos produtores de acarbose, que são diferentes de Streptomyces glaucescens (DSM 40716), caracterizado por, partindo da molécula de ADN recombinante de acordo com a reivindicação 4 a) serem preparadas amostras de hibridação, b) estas amostras de hibridação serem empregues, sob condições estringentes, para o rastreio genómico ou de ADNc de bibliotecas de ADN, obtidas do microrganismo correspondente, e c) os clones encontrados serem isolados e caracterizados.
Um objecto adicional da invenção é um processo para o isolamento de um agrupamento de genes para a biossintese de acarbose e pseudo-oligossacáridos homólogos a partir de microrganismos produtores de acarbose, que são diferentes de Streptomyces glaucescens (DSM 40716), caracterizado por, 18 partindo da molécula de ADN recombinante de acordo com a reivindicação 4 a) serem preparados iniciadores para PCR, b) estes iniciadores para PCR serem utilizados para a acumulação de fragmentos de ADN de ADN genómico ou de ADNc de um microrganismo correspondente, c) os fragmentos acumulados serem isolados e caracterizados e d) serem eventualmente empregues num processo tal como descrito no parágrafo anterior.
Os processos descritos para o isolamento de um agrupamento de genes para a biossintese de acarbose e pseudo-oligossacáridos homólogos a partir de microrganismos produtores de acarbose, que são diferentes de Streptomyces glaucescens (DSM 40716), são caracterizados por os microrganismos serem seleccionados do grupo constituído por actinomicetales, tal como, p. ex., estirpes de Streptomyces, Actinoplanes, Ampullariella, Streptosporangium, Streptomyces hygroscopicus var. limoneus, Streptomyces glaucescens; de um modo muito preferido do grupo constituído por Streptomyces glaucescens (DSM 40716) e Actinoplanes sp.. utilização de isolamento de
Um objecto adicional da invenção é a Streptomyces glaucescens (DSM 40716) para o acarbose. A invenção é agora explicada mais detalhadamente com base nos exemplos, tabelas e figuras, sem ser limitada a estes. 19
Todos os isolamentos de plasmídeos foram realizados com um kit de isolamento (Nucleobond®) da firma Macherey und Nagel (Diiren, Alemanha) segundos as indicações do produtor. Os passos de trabalho de biologia molecular foram realizados segundo protocolos padrão (Sambrock et al. (1989) Molecular cloning: A
Laboratory Manual, 2nd ed. Cold Spring Harbor Laboratory, USA) ou segundo indicações do respectivo produtor. As sequências de ADN e de proteínas foram analisadas com o software da Genetics Computer Group, versão 8 (programas: FastA, TFastA, BlastX, Motifs, GAP, CODONPREFERENCE) e os bancos de dados Swiss-Prot (Release 32), EMBL (Release 46) e Prosite (Release 12.2). 0 tratamento em termos de biologia molecular de Streptomyces glaucescens e Actinoplanes (isolamento de ADN, transformações de ADN) foi realizado tal como descrito em Hopwood et al.: Genetic Manipulation of Streptomycetes: A Laboratory Manual. The John Innes Foundation, Norwich, UK, 1985 e Motamedi and Hutchinson: Cloning and heterologous expression of a gene cluster for the biosynthesis of tetracenomycin C, the anthracycline antitumor antibiotic of Streptomyces glaucescens. Proc. Natl. Acad. Sei. USA 84: 4445-4449 (1987).
As hibridações foram levadas a cabo, de um modo geral, com o "Non radioactive DNA labeling kit" da Boehringer Mannheim (Cat. No. 1175033). A visualização realizou-se com o "Luminescent Detection Kit" da Boehringer Mannheim (Cat. No. 1363514) . A hibridação, em todos os exemplos indicados neste pedido de patente, realizou-se sob condições estringentes: 68 °C, 16 horas, 5 x SSC, 0,1% de N-laurilsarcosina, 0,02 % de SDS, 1% de agente bloqueador (Boehringer Mannheim). SSC significa NaCl 0,15 M / citrato de sódio 0,015 Μ. A definição de "condições estringentes" aqui dada é válida para todos os aspectos do presente pedido que se referem a "condições 20 estringentes". Neste caso, o modo como se alcança esta estringência, isto é as condições de hibridação indicadas, não deve actuar de forma limitativa, dado que o especialista também pode seleccionar outras condições de modo a alcançar as mesmas condições estringentes, p. ex., através de outras soluções de hibridação em associação com outras temperaturas.
Exemplo 1: Sintese e sequência dos iniciadores para PCR e amplificação dos fragmentos de S. glaucescens (DSM 40716) A PCR realizou-se segundo condições padrão com respectivamente 100 pmol de iniciadores 1 e 2 em 100 pL de mistura reaccional
10 pL respectivamente 2,5 pL respectivamente 0,2 mM 1 pL 1 pg (1 pL) 1,5 pL para perfazer 100 pL
Tampão PCR1
Iniciadores para PCR dNTPs BSA (10 mg/mL) ADN molde
Taq Polymerase2 (5 unidades/mL) H20 1: Promega 2: Boehringer Mannheim
As amostras são revestidas com 75 pL de óleo mineral e a amplificação realizada com um ADN Thermal Cyler TC1 da firma Perkin Elmer. 21
Parâmetros :
Ciclos 1 30 1 Temperatura Duração CT) o O 5 min. o O 5 min. 95 °C 1,5 min. O O 1,5 min. 74 °C 5 min.
Na tabela 1 está apresentada a sequência dos iniciadores degenerados, que deveria ser utilizada para a amplificação de dTDP glicose-desidratases de diferentes estreptomicetas.
Tabela 1: Sequências de iniciadores para a amplificação de dTDP-glicose-4,6-desidratases (SEQ ID N°.: 1) (SEQ ID N°.: 2)
Iniciador 1: CSGGSGSSGCSGGSTTCATSGG
Iniciador 2: GGGWVCTGGYVSGGSCCGTAGTTG
Neste caso significam S = G ou C, W = A ou T, V = A ou G, Y = T ou C.
Exemplo 2: Sequência de ADN dos fragmentos da PCR isolados de Streptomyces glaucescens (DSM 40716) A sequenciação realizou-se segundo o método didesoxi de terminação da cadeia segundo Sanger et al. (PNAS USA, 74: 5463- 5467 (1977)). As reacções foram realizadas com o Auto Read
Sequenzing Kit® da firma Pharmacia Biotech (Freiburg, Alemanha) segundo as indicações do produtor. A separação e detecção 22 realizou-se por via de um ALF DNA Sequencer® da firma Pharmacia Biotech (Freiburg, Alemanha). A subsequente clonagem dos fragmentos da PCR (Sure Clone Kit®, Pharmacia Biotech, Freiburg) no vector pUC18 de E. coli e a sequenciação do fragmento comprovou a suposição de que se trata de uma dTDP-glicose-4,6-desidratase. Todavia, foram isolados dois genes diferentes que apresentam, ambos, elevadas homologias para com a dTDP-glicose-4,6-desidratase, mas que não são idênticos. Os fragmentos da PCR são designados em seguida por acbD* e HstrE*.
Na tabela 2A e 2B mostra-se a sequência dos fragmentos da PCR isolados e, na tabela 2C, a comparação de homologia da sequência de aminoácidos derivada de HstrE* e acbD*. As duas proteínas apresentam uma identidade de somente 65%.
Tabela 2A: Sequência de ADN de acbD* (locais de ligação ao iniciador estão sublinhados, SEQ ID NO.: 3) iniciador 1
1 CCCGGGCGGG GCGGGGTTCA TCGGCTCCGC CTACGTCCGC CGGCTCCTGT 51 CGCCCGGGGC CCCCGGCGGC GTCGCGGTGA CCGTCCTCGA CAAACTCACC 101 TACGCCGGCA GCCTCGCCCG CCTGCACGCG GTGCGTGACC ATCCCGGCCT 151 CACCTTCGTC CAGGGCGACG TGTGCGACAC CGCGCTCGTC GACACGCTGG 201 CCGCGCGGCA CGACGACATC GTGCACTTCG CGGCCGAGTC GCACGTCGAC 251 CGCTCCATCA CCGACAGCGG TGCCTTCACC CGCACCAACG TGCTGGGCAC 301 CCAGGTCCTG CTCGACGCCG CGCTCCGCCA CGGTGTGCGC ACCCTCGTGC 351 ACGTCTCCAC CGACGAGGTG TACGGCTCCC TCCCGCACGG GGCCGCCGCG 401 GAGAGCGACC CCCTGCTCCC GACCTCGCCG TACGCGGCGT CGAAGGCGGC 451 CTCGGACCTC ATGGCGCTCG CCCACCACCG CACCCACGGC CTGGACGTCC 501 GGGTGACCCG CTGTTCGAASL AACTAÇSGCC CGCACCAGTT CCCGGG iniciador 2 23
Tabela 2B: Sequência de AON de HstrR* (locais de ligação ao iniciador estão sublinhados, SEQ ID NO.: 4) iniciador 2
1 CCCCGGGTGC TGGTAGGGGC -CGXAGTTSTT GGAGCAGCGG GTGATGCGCA 51 CGTCCAGGCC GTGGCTGACG TGCATGGCCA GCGCGAGCAG GTCGCCCGAC 101 GCCTTGGAGG TGGCATAGGG GCTGTTGGGG CGCAGCGGCT CGTCCTCCGT 151 CCACGACCCC GTCTCCAGCG AGCCGTAGAC CTCGTCGGTG GACACCTGCA 201 CGAAGGGGGC CACGCCGTGC CGCAGGGCCG CGTCGAGGAG TGTCTGCGTG 251 CCGCCGGCGT TGGTCCGCAC GAACGCGGCG GCATCGAGCA GCGAGCGGTC 301 CACGTGCGAC TCGGCGGCGA GGTGCACGAC CTGGTCCTGG CCGGCCATGA 351 CCCGGTCGAC CAGGTCCGCG TCGCAGATGT CGCCGTGGAC GAAGCGCAGC 401 CGGGGGTGGT CGCGGACCGG GTCGAGGTTG GCGAGGTTGC CGGCGTAGCT
451 CAGGGCGTCG AGCACGGTGA CGACGGCGTC GGGCGGCCCG TCCGGACCGA
501 GGAGGGTGCG GACGTAGTGC GAGCCCATGA ACCCCGCCGC C iniciador 1
Tabela 2C: Comparação de homologia da sequência de aminoácidos derivada dos produtos da PCR HstrE* e acbD* (Programa: GAP)
Qualidade: 196, 3 Comprimento 182 Proporção: 1,091 latos: 0 Percentagem de semelhança: 77,654 Percentagem de identidade: 65,363 PCRstrE.Pep x PCRacbD.Pep 1 . .AAGFMGSHYVRTLLGPDGPPDAWTVLDALSYAGNLANLDPVRDHPRL 48
*IIMI III 11 s | j: | ·5 · · 11111 I · 111 · 11 -1 ·: 11111 I 1 PGGAGFIGSAYVRRLLSPGAPGGVAVTVLDKLTYAGSLARLHAVRDHPGL 50 • * · · » 49 RFVHGDICDADLVDRVMAGQDQWHLAAESHVDRSLLDAAAFVRTNAGGT 98
11:11:11 ·* 111 : I : I:: 11:111111111: Ι·:ΙΜΙΙ· II 51 TFVQGDVCDTALVDTLAARHDDIVHFAAESHVDRSITDSGAFTRTNVLGT 100 • · · · · 99 QTLLDAALRHGVAPFVQVSTDEVYGSLETGSWTEDEPLRPNSPYATSKAS 148 Ι·ΙΙΙΙΙΙΜΙΙ ·: 1: 1111II1111 · I- ♦ I ·; 11 1-1111-111- 101 QVLLDAALRHGVRTLVHVSTDEVYGSLPHGAAAESDPLLPTSPYAASKAA 150 • · · 149 GDLLALAMHVSHGLDVRITRCSNNYGPYQHPG 180
:11:111 I -111111:111111111 - I I 151 SDLMALAHHRTHGLDVRVTRCSNNYGPHQFP. 181 respectivamente, linha superior: SEQ ID N°.: 5 respectivamente, linha inferior: SEQ ID N°.: 6
Exemplo 3: Análise de Southern com ADN cromossómico de Streptomyces glaucescens (DSM 40716) e dos fragmentos da PCR marcados e isolados
Cultivaram-se as células em meio R2YENG e colheram-se após 30 h para o isolamento de ADN. 0 isolamento do ADN cromossómico de S. glaucescens (DSM 40716) realizou-se tal como descrito em Hopwood et al. ((1985) Genetic manipulations of Streptomyces: a laboratory manual. The John Innes Foundation, Norwich UK).
Com as sondas marcadas do fragmento da PCR acbD* und HstrE* realizou-se uma análise de Southern Blot com ADN cromossómico da estirpe produtora S. glaucescens (DSM 40716), gue foi digerida com PstI, BglII e BamHI. Marcaram-se os dois fragmentos da PCR com digoxigenina segundo as indicações do produtor (Boehringer Mannheim; Mannheim) e separou-se uma digestão de ADN cromossómica da estirpe produtora Streptomyces glaucescens (DSM 40716) sobre um gel de agarose. Transferiu-se o ADN por 25 transferência capilar para membranas de nylon e subsequentemente, após hibridação, tornaram-se visiveis, com as sondas marcadas, as regiões de ADN homólogas.
Os dois genes marcam regiões de ADN distintas (fig. 1 e fig. 2), em que no caso dos fragmentos que foram marcados por HstrE*, se tem de tratar de fragmentos do gene da biossintese de hidroxiestreptomicina de Streptomyces glaucescens (DSM 40716). A sequência de ADN não está publicada, mas a elevada homologia da sequência proteica derivada de HstrE* para com a StrE (Pissowotzki et al. (1991) Mol. Gen. Genet. 231: 113-123) da sintese de estreptomicina de Streptomyces griseus N2-3-11 (identidade a 82%) e a coincidência dos fragmentos de ADN marcados por HstrE* (Fig. 1) com o mapa de restrição publicado do agrupamento de genes da hidroxiestreptomicina de Streptomyces glaucescens (DSM 40716) (Retzlaff et al. (1993) Industrial Microorganisms. Basic and applied molecular genetics ASM, Washington DC, USA) permite esta conclusão. Os fragmentos que foram marcados pela sonda acbD* (Fig. 2), pertecem a uma região de ADN não investigada até à data. Esta região codifica para as enzimas de biossintese dos pseudo-oligossacáridos de Streptomyces glaucescens (DSM 40716).
Exemplo 4: Clonagem do fragmento PstI de 6,8 kb de comprimento
Entre outros, marca-se um fragmento de ADN PstI de 6,8 kb de comprimento com o fragmento da PCR acbD* (Fig. 2) . Este fragmento de ADN foi isolado do seguinte modo. A região do gel foi recortada com uma lâmina de barbear e o ADN isolado a partir do gel com um kit de isolamento da firma Pharmacia Biotech e 26 clonado no plasmídeo pUC19 cortado com a enzima de restrição PstI (plasmideo pacbl) e transformado na estirpe de E. coli DH5a. Subcultivaram-se clones individuais a partir destas placas e realizou-se um isolamento de ADN de plasmideo com estes clones. Com o ADN destes clones (250) realizou-se uma amplificação por PCR com os iniciadores 1 e 2 descritos (tab. 1) . O clone de E. coli correspondente que contém o fragmento PstI de 6,8 kb de comprimento foi isolado deste modo.
Exemplo 5: Sequenciação do fragmento de ADN PstI de 6,8 kb de comprimento isolado O ADN foi digerido com diferentes enzimas de restrição e fragmentos de ADN individuais clonados em pUCl9. Subsequentemente determinou-se a sequência de ADN do fragmento completo, a qual é mostrada na tab. 4 (SEQ ID N°.:7). A sequência de ADN do fragmento PstI de 6,8 kb foi apenas parcialmente confirmada por sequenciação complementar da cadeia inversa. Foram encontrados vários quadros de leitura abertos que codificam para diferentes proteínas (programa: CODONPREFERENCE, BlastX). No total, puderam ser encontradas 6 regiões codificadoras. Um gene com elevada homologia para com proteínas ligantes a ATP acbA, uma aminotransferase acbB, uma dTDP-glicose-sintase acbC, uma dTDP-glicose-desidrase acbD, um gene de regulação com homologias para com a familia de proteínas LacI acbE e uma proteina com semelhanças para com proteínas ligantes a açúcares acbF. A sequência dos genes acbA e acbF foi apenas determinada parcialmente. As homologias para com outras proteínas dos bancos de dados e as propriedades das proteínas putativas estão resumidas na tabela 3. A fig. 3 mostra resumidamente um mapa de restrição do fragmento com os locais de 27 corte de restrição mais importantes mencionados no texto e a disposição dos quadros de leitura abertos identificados.
Tabela 3: Análise dos quadros de leitura abertos identificados sobre o fragmento PstI de 6, 8 kb de comprimento a partir de Streptomyces glaucescens (DSM 40716) ORF Aminoácidos MG FastAs Identidade% Número de acesso § acbA 239 * MalK, E coli 29% P02914 acbB 429 45618 DgdA, Burkholderia cepacia 32% P16932 acbC 355 37552 StrD, Streptomyces griseus 60% P08075 acbD 325 35341 StrE, Streptomyces griseus 62% P29782 acbE 345 36549 DegA, Bacillus. subtilis 31% P37947 acbF 396 * MalE, E. coli 22% P02928 * Quadro de leitura aberto incompleto; s Banco de dados Swiss-Prot (Release 32)
Exemplo 6: Delecção dos genes para a biossintese de pseudo-oligossacáridos acbBCD do cromossoma de Streptomyces glaucescens (DSM 40716) 28
Uma demonstração de que o fragmento de ADN identificado codifica para genes da biossintese de pseudo-oligossacáridos, foi conduzida do seguinte modo. Uma região de genes de 3,4 kb (fragmento b de EcoRI-SstI, fig. 3) foi substituída pelo gene de resistência à eritromicina (1,6 kb) e clonada com regiões flanqueadas de ADN do fragmento PstI de 6,8 kb (pacbl) no plasmídeo sensível à temperatura pGM160. A construção do plasmídeo realizou-se como descrito em seguida: a partir do plasmídeo pacbl clonou-se o fragmento FcoAI-HindiII de 2,2 kb de comprimento (c, fig. 3) em pGEM7zf (Promega, Madison, WI, USA; plasmídeo pacb2), bem como o fragmento Sstll de 1 kb de comprimento a partir de pacbl (a, fig. 3), em pUC19 (plasmídeo pacb3). Subsequentemente realizou-se uma ligação com os seguintes fragmentos. 0 plasmídeo pGM160 (Muth et al. (1989)
Mol. Gen Genet. 219:341-348) foi cortado com BamHI/HindIII, o plasmídeo pacb2 com Xbal/BamHI (c, Fig. 3) , o plasmídeo pacb3 com Fco-RI/HindiII (a, Fig. 3) e o plasmídeo pIJ4026 (Bibb et al. (1985) Gene 38:215-226) com EcoRl/Xbal para o isolamento do gene de resistência ermE de 1,6 kb de comprimento. Os fragmentos foram ligados numa mistura reaccional e transformados em E. coli DH5a e seleccionados quanto a ampicilina. O plasmídeo resultante pacb4 foi isolado a partir de E. coli DH5a, testado quanto à sua correcção por meio de digestão de restrição e transferido subsequentemente para S. glaucescens (DSM 40716) por transformação de protoplastos Os seres transformados foram seleccionados com tioestreptona a 27 °C sobre agar R2YENG. Subsequentemente realizou-se uma incubação dos seres transformados à temperatura não permissiva de 39 °C e induzida deste modo a integração do plasmídeo no genoma através de recombinação homóloga (selecção com tioestreptona (25 pg/mL) e eritromicina (50 pg/mL)). Nestas condições apenas crescem os clones nos quais o plasmídeo está integrado no genoma. Os clones 29 correspondentes foram isolados, levados à esporulação (meio 1, ver abaixo) e plaquetados em agar contendo eritromicina (meio 1) . A partir desta placa foram novamente isolados clones individuais e riscados tanto sobre meios contendo tioestreptona como também eritromicina. Foram analisados os clones que eram resistentes a eritromicina, mas já não eram resistentes a tioestreptona. Nestes clones, os genes acbBCD haviam sido substituídos pelo ermE. Analisaram-se vários clones e seleccionou-se por fim a estirpe S. glaucescens (DSM 40716) Aacb como estirpe referência (resistente a eritromicina, sensível a tioestreptona) para a investigação adicional.
Meio 1
Extracto de levedura 4 g/L Extracto de malte 10 g/L Glicose 4 g/L Agar 15 g/L pH 7,2
Numa experiência adicional foi testado se a estirpe correspondente ainda produz acarbose. Cultivaram-se alguns clones e investigou-se, no bioensaio, quanto à formação da substância inibidora de α-amilase, mas não se encontrou qualquer actividade. Subsequentemente os mutantes foram caracterizados adicionalmente por hibridação de Southern. A integração do gene ermE havia ocorrido no local previsto. A fig. 4 mostra uma hibridação de Southern que foi realizada com o tipo selvagem e o mutante por delecçao, Streptomyces glaucescens (DSM 40716) Aacb. Como sonda foi utilizado o fragmento SstI de pacb3. O ADN cromossómico foi isolado a partir do tipo selvagem e dos mutantes e digerido com as enzimas PstI e PstI/HindIII. O padrão 30 de fragmentação dos mutantes por delecção corresponde ao acontecimento de recombinação previsto. 0 tipo selvagem apresenta o fragmento PstI de 6,8 kb de comprimento inalterado, enquanto que o mutante apresenta um fragmento encurtado em 1,8 kb (comparar banda 1 e 3, fig. 4). Através da integração do gene de resistência ermE foi introduzido, além disso, um local de corte interno de HindIII no fragmento PstI (comparar banda 2 e 4, fig. 4) .
Exemplo 7: Inibição de α-amilase por acarbose
Através de um teste enzimático para a detecção de amido (TC-Starch, Boehringer-Mannheim, Cat. N°. 297748) pôde ser mostrado que o composto isolado a partir de Streptomyces glaucescens (DSM 40716) inibe α-amilase. Principio de teste: O amido é dissociado pela amiloglucosidase em D-glicose. A glicose é transformada subsequentemente pela hexoquinase a glicose-6-fosfato e esta é transformada pela glicose-6-fosfato- desidrogenase a D-gluconato-6-fosfato. Neste caso origina-se NADPH, cuja formação pode ser determinada fotometricamente. A acarbose inibe a α-amilase e impede deste modo a formação de D-glicose e por conseguinte também a formação de NADPH.
Exemplo 8: Meio para a cultura de S. glaucescens (DSM 40716) e produção de acarbose
Realizou-se a fermentação em balões de Erlenmeyer de 500 mL com uma perfuração lateral e 100 mL de meio 2 a 27 °C sobre um agitador rotativo a 120 rpm. Interrompeu-se a fermentação após 2 ou 3 dias. Os pseudo-oligossacáridos puderam ser detectados no 31 teste de difusão em placas de acordo com o exemplo 9. Com o meio 3 não foram produzidos quaisquer inibidores de α-amilase. Isto significa que a produção dos pseudo-oligossacáridos é inibida por glicose. Outros açúcares tal como maltose, açúcar-de-cana ou fontes complexas de açúcar (extracto de malte) também se podem considerar para a produção de pseudo-oligossacáridos com S. glaucescens (DSM 40716).
Meio 2 : 20 g/L 20 g/L 7,2 20 g/L 20 g/L 7,2
Farinha de soja
Amido
PH
Meio 3:
Farinha de soja
Glicose
pH
Exemplo 9: Bioteste sob utilização de Mucor miehei
Verteu-se uma suspensão de esporos da estirpe Mucor miehei em agar (meio 5) (105 esporos/mL) e, a partir desta mistura reaccional, verteram-se respectivamente 10 mL em caixas de Petri. Revestiram-se plaquetas de teste em papel (diâmetro 6 mm) com 10 pL de acarbose (1 mg/mL) ou com uma amostra de uma cultura de S. glaucescens e colocaram-se sobre as placas de teste. A incubação das placas realizou-se a 37 °C. Sobre o meio 32 5 contendo amido revelaram-se substâncias inibidoras. Como controlo serviu uma placa que foi preparada com glicose (meio 4) em vez de amido. Sobre este meio não se formou qualquer substância inibidora em volta das plaquetas de filtro carregadas com substância activa.
Meio 4 e 5: KH2P04 x 3 H20 0,5 g MgS04 x 7 H20 0,2 g NaCl 0,1 g Sulfato de amónio 5 g Base de azoto de levedura 1,7 g Glicose (4) ou amido (5) 5 g Agar 15 g
Exemplo 10: Transformação de S. glaucescens (DSM 40716).
Isolaram-se protoplastos da estirpe Streptomyces glaucescens tal como descrito em Motamedi and Hutchinson ((1987) PNAS USA 84: 4445-4449)e transferiu-se o plasmideo de ADN isolado para as células por meio de transformação PEG tal como explicado em Hopwood et al. ((1985) Genetic manipulations of Streptomyces: a laboratory manual. The John Innes Foundation, Norwich UK) . A regeneração dos protoplastos realizou-se sobre meio R2YENG a 30 °C (Motamedi and Hutchinson (1987) PNAS USA 84: 4445-4449). As placas de agar foram revestidas após 18 h com uma solução contendo tioestreptona e incubadas a 30 °C (concentração final de tioestreptona: 20 yg/mL). 33
Exemplo 11: Isolamento dos pseudo-oligossacáridos a partir de Streptomyces glaucescens (DSM 40716), análise por HPLC e espectroscopia de massa
Isolamento
Separou-se o caldo de cultura, por filtração, do micélio. Aplica-se subsequentemente o filtrado de cultura assim obtido sobre uma coluna XAD16, lava-se esta com água e elui-se os componentes activos com metanol a 30%. Concentrou-se o eluato até à fase aquosa e extraiu-se com éster acético para remover impurezas lipofilicas. Concentrou-se subsequentemente a fase aquosa e purificou-se adicionalmente os componentes activos em metanol a 5% com uma coluna de Biogel P2. As fracções individuais são recolhidas com um recolector de fracções. A análise das fracções individuais realizou-se por meio de bioteste com Mucor miehei. Os eluatos activos foram renovadamente cromatografados, para a purificação adicional, sobre Biogel P2 em metanol a 5%. O material assim isolado foi adicionalmente investigado por meio de HPLC e MS.
HPLC
Coluna: Nucleosil® 100 C-18
Fase móvel ácido fosfórico 0,1% = A/ acetonitrilo = B Gradiente: de 0-100% B em 15 min.
Detecção: 215 nm Fluxo 2 mL/min.
Volume de injecção: 10-20 pL A preparação de pseudo-oligossacáridos a partir de S. glaucescens (DSM 40716) não pôde ser distinguida da acarbose 34 autêntica por meio de HPLC. Tanto o tempo de retenção, como também o espectro de absorção de UV de ambos os componentes foram idênticos neste sistema de fase móvel. A mistura de pseudo-oligossacáridos não foi separada nestas condições.
Análise de espectroscopia de massa (MS) A determinação dos pesos moleculares e do padrão de fragmentação de acarbose autêntica e dos pseudo-oligossacáridos isolados a partir de Streptomyces glaucescens (DSM 40716) realizou-se por meio de MS de electrospray. A análise de acarbose obtenível comercialmente da Bayer (Glucobay) originou um pico de massa a 645,5 (acarbose) . As amostras a partir de S. glaucescens (DSM 40716) purificadas contêm uma mistura de diferentes pseudo-oligossacáridos de diferentes comprimentos na cadeia lateral de açúcar: 969 (acarbose + 2 unidades de glicose), 807 (acarbose + 1 unidade de glicose), 645 (corresponde à acarbose autêntica). Na fragmentação da acarbose e do composto isolado a partir de S. glaucescens (DSM 40716) com o peso molecular de 645 originam-se as mesmas fracções de moléculas: 145 (4-amino-4,6-deoxiglicose), 303 (acarviosina) e 465 (303 com uma unidade de glicose).
Também a Actinoplanes sp. SE50 produz uma mistura de moléculas de acarbose com cadeias laterais de açúcar de diferentes comprimentos (Truscheit (1984) VlIIth International Symposium on Medicinal Chemistry, Proc. Vol. I. Swedish Academy of Pharmaceutical Sciences, Stockholm, Sweden). O comprimento das cadeias laterais de açúcar pode ser influenciado pela selecção dos parâmetros de fermentação e do substrato na solução nutritiva. 35
Exemplo 12: Hibridação de Southern com Actinoplanes sp. SE50/110 (ATCC31044) A partir da estirpe Actinoplanes sp. SE50/100 isolou-se o AND cromossómico e digeriu-se com enzimas de restrição (PstI e BamHI). Subsequentemente, realizou-se uma hibridação de Southern com uma sonda que abrange a região codificadora da dTDP-glicose 4,6-desidratase acbD de Streptomyces glaucescens (DSM 40716) (fragmento d, fig. 3) . A sonda híbrida com bandas distintas de Actinoplanes sp. SE50/110 (fig. 5, banda 1 e 2) . Deste modo é dada a possibilidade do isolamento dos fragmentos corresponddentes de Actinoplanes sp. SE50/100 e de linhas de estirpes adicionais. Se estas regiões de ADN estão efectivamente envolvidas na biossíntese da acarbose tem ainda de ser demonstrado em investigações adicionais. Alternativamente poder-se-iam utilizar também os iniciadores 1 e 2 da PCR (tab. 1) para a amplificação da dTDP-glicose-4,6-desidratase de Actinoplanes sp. .
Legendas:
Fig. 1: Hibridação de Southern com S. glaucescens (DSM 40716). Banda 1: PstI, banda 2: BamHI, banda 3:
BglII. Como sonda foi utilizado o fragmento da PCR marcado HstrE*. Marcação de fragmentos de ADN que estão envolvidos na biossíntese de hidroxiestreptomicina.
Fig. 2: Hibridação de Southern com S. glaucescens (DSM 40716). Banda 1: PstI, banda 2: BamHI, banda 3:
BglII. Como sonda foi utilizado o fragmento da
PCR marcado acbD*. Marcação de fragmentos de ADN 36 que estão envolvidos na biossintese dos pseudo-oligossacáridos.
Fig. 3
Mapa de restrição do fragmento PstI de 6,8 kb de comprimento de Streptomyces glaucescens (DSM 40716). Quadros de leitura abertos e sua respectiva direcção de transcrição estão indicados com setas. Os fragmentos a, b, c e d identificam regiões de ADN que são explicadas em maior detalhe no texto.
Fig. 4
Hibridação de Southern com Streptomyces glaucescens Aacb: banda 1: PstI, banda 2:
PstI/HindIII, e Streptomyces glaucescens (DSM 40716) banda 3: PstI, banda: 4: PstI/HindIII. Como sonda foi utilizado o fragmento a marcado SstI de 1,0 kb de comprimento (fig. 3).
Fig. 5
Hibridação de Southern com Actinoplanes sp. SE50/100: banda 1: PstI, banda 2: BamHI e
Streptomyces glaucescens (DSM 40716) banda 3:
PstI. Como sonda foi utilizado o fragmento d marcado Smal/EcoRl de 1,0 kb de comprimento (dTDP-glicose-4,6-desidratase, fig. 3). As setas indicam os fragmentos de ADN marcados (BamHI: 2.1 e 0,7 kb, PstI: ~11-12 kb)
Tab. 4
Sequência de ADN do fragmento PstI de 6, 8 kb de comprimento de Streptomyces glaucescens (DSM 40716) (SEQ ID N° . : 7). A sequência de aminoácidos (SEQ ID N°.: 8-13) derivada dos quadros de leitura abertos identificados está 37
Codões de indicada abaixo da sequência de ADN. iniciação, paragem e potenciais locais de ligação a ribossomas estão sublinhados. acbA: acbB: acbC: acbD: acbE: acbF: SEQ ID N° . : 8 SEQ ID N° . : 9 SEQ ID N° . : 10 SEC ID N° . : 11 SEQ ID N° . : 12 SEQ ID N° . : 13 38
Tabela 4: (SEQ ID N 7, 8, 9, 10, 11, 12, 13) p s t
I
CTGCAGGGTTCCCTGGTGCACGACCCGCCCCTGGTCGACGACCAGGGCGCTGTCGCAGAT ------—+---------+---------4----------4----------+---------+ 6o GACGTCCCAAGGGACCACGTGCTGGGCGGGGACCAGCTGCTGGTCCCGCGACAGCGTCTA QLTGQHVVRGQDVVLASDC I -
CGCGGCGATGTCGGCGATGTCGTGGCTGGTGAGCACCACGGTGGTGCCCAGTTCCCGGTG ---------+---------4----------+---------+---------+---------+ 120
GCGCCGCTACAGCCGCTACAGCACCGACCACTCGTGGTGCCACCACGGGTCAAGGGCCAC AAIDAIDHSTLVVTTGLERH-
GGCGCGGTTGACCAGCCGGCGCACCGCGTCCTTCAGCACCATGTCGAGGCCGATCGTGGG ---------+---------+---------+---------+---------+---------+ 180
CCGCGCCAACTGGTCGGCCGCCTGGCGCAGGAAGTCGTGGTACAGCTCCGGCTAGCACCC ARNVLRRVADKLVMDLGITP-
CTCGTCCCAGAACAGCACGGCCGGGTCGTGCAGCAGGCTCGCCGCGATCTCGGCGCGCAT ---------+---------+---------+---------+---------+---------+ 240
GAGCAGGGTCTTGTCGTGCCGGCCCAGCACGTCGTCCGAGCGGCGCTAGAGCCGCGCGTA EDWFLVAPDHLLSAAIEARM-
S
P h
I
GCGCTGTCCGAGGCTGAGCTGCCGCACGGGGGTGGACCCCAGCGCGTCGATGTCGAGGAG __——---4-—-------+---------+---------+---------+---------+ 300
CGCGACAGGCTCCGACTCGACGGCGTGCCCCCACCTGGGGTCGCGCAGCTACAGCTCCTC RQGLSLQRVPTSGLADIDLL-
GTCCCGGAACAGGGCGAGGTTGCGCCGGTAGACCGGTCCGGGGATGTCGTAGATGCGGCG ---------+---------4.---------4.---------4.---------4.---------4. 360 CAGGGCCTTGTCCCGCTCCAACGCGGCCATCTGGCCAGGCCCCTACAGCATCTACGCCGC DRFLALNRRYVPGPIDY I R R —
K
P n i caggatgcggaaggagtcgggtaccgacaggtcccaccagagctggctgcgctggccgaa ---------4.---------4.---------4----------4.---------4----------4- 420 gtcctacgccttcctcagcccatggctgtccagggtggtctcgaccgacgcgaccggctt LIRFSDPVSLDWWLQSRQGF- gacgacgccgatcgtgcgggcgttgcgctgccggtgccggtagggctccagcccggcgac --------_4----------4----------4----------4.---------4.--------—4- 480
CTGCTGCGGCTAGCACGCCCGCAACGCGACGGCCACGGCCATCCCGAGGTCGGGCCGCTG VVGITRANRQRHRYPELGAV-
CGTGCAGCGGCCGGAGGTGGGGGTCATGATGCCGGTCAGCATCTTGATCGTGGTCGACTT ---------4.---------4----------4----------+---------4----------+ 540
GCACGTCGCCGGCCTCCACCCCCAGTACTACGGCCAGTCGTAGAACTAGCACCAGCTGAA TCRGSTPTMIGTLMKITTSK- gccggctccgttggcgccgatgtaggcggtcttcgtgccggccggtatctcgaaggagac ---------4.---------4--------------------------------4----------4- 600 CGGCCGAGGCAACCGCGGCTACATCCGCCAGAAGCACGGCCGGCCATAGAGCTTCCTCTG GAGNAG I YATKTGAP IEFS V - 39 κ Ρ η
I
GTCGTCGACGGCGCGCACGACGCGGTACCGGCGGGTCAGGAGGGTGGAGAGGCTGCCGAG +——————660
CAGCAGCTGCCGCGCGTGCTGCGCCATGGCCGCCCAGTCCTCCCACCTCTCCGACGGCTC DDVARVVRYRRTLLTSLSGL-
CAGGCCGGGCTCGCGTTCGGCCAGCCGGAACTCCTTGACGAGGTGTTCGGCCACGATCAC ---------+---------+---------+---------+---------+---------+ 720
GTCCGGCCCGAGCGCAAGCCGGTCGGCCTTGAGGAACTGCTCCACAAGCCGGTGCTAGTG * — LGPEREALRFEKVLHEAVIV-
—— " acbA
GCGATCACCCGCTCGACGGCCGTCTCCAGCAGGCGCAGGCCCTCGTCGAGCAGCGCCTCG ---------+---------+---------+---------+---------+---------+ 780
CGCTAGTGGGCGAGCTGCCGGCAGAGGTCGTCCGCGTCCGGGAGCAGCTCGTCGCGGAGC AIVREVATELLRLGEDLLAE-
TCGAGGGTGAACGGCGGTGCCAGCCGCAGGATGTGGCCGCCCAGGGAGGTGCGCAGCCCC ---------+---------+---------+---------+---------+---------+ 840
AGCTCCCACTTGCCGCCACGGTCGGCGTCCTACACCGGCGGGTCCCTCCACGCGTCGGGG DLTFPPALRLIHGGLSTRLG-
S m a
I
AGGTCGAGGGCGGTGGTGTAGACGGCCCGGGCGGTCTCGGGGGCGGGTGCCCGGCCGACG ---------+---------+---------+---------+---------+---------+ 900
TCCAGCTCCCGCCACCACATCTGCCGGGCCCGCCAGAGCCCCCGCCCACGGGCCGGCTGC LDLATTYVARATEPAPARGV-
GCGTCGGTGACGAACTCCAGGCCCCACAGCAGTCCGAGGCCGCGTACCTGGCCGAGCTGG ---------+---------+---------+---------+---------+---------+ 960
CGCAGCCACTGCTTGAGGTCCGGGGTGTCGTCAGGCTCCGGCGCATGGACCGGCTCGACC ADTVFELGWLLGLGRVQGLQ- 5 s t
I
GGGAAGCGGGACTCCAGGGCGCGCAGCCGCTCCTGGATGAGCTCGCCGAGGACGCGCACG ---------+---------+---------+---------+---------+---------+ 1020
CCCTTCGCCCTGAGGTCCCGCGCGTCGGCGAGGACCTACTCGAGCGGCTCCTGCGCGTGC PFRSELARLREQILEGLVRV-
CGGTCGATCAGCCGGTCGCGCTCGACGACCTCCAGCGTGGCGCGGGCGGCGGCGATCCCC ---------+---------+---------+---------+---------+---------+ 1080 GCCAGCTAGTCGGCCAGCGCGAGCTGCTGGAGGTCGCACCGCGCCCGCCGCCGCTAGGGG RDI LRDREVVELTARAAAIG-
S m a
I
AGTGGGTTGCTCGCGTACGTCGAGGCGTACGCCCCGGGGTGGCCGCCTCCGGCCTGCGCA ---------+---------+---------+---------+---------+---------+ 1140
TCACCCAACGAGCGCATGCAGCTCCGCATGCGGGGCCCCACCGGCGGAGGCCGGACGCGT LPNSAYTSAYAGPHGGGAQA- 40
GCTTCCGCGCGTCCGGCCAGCACGGCGAAGGGGAATCCGCTCGCGGTGCCCTTGGACAGC ---------+---------+---------+---------+---------+---------+ 1200 CGAAGGCGCGCAGGCCGGTCGTGCCGCTTCCCCTTAGGCGAGCGCCACGGGAACCTGTCG A E A R GALVAFP FGSAT GKS L -
ATCGCCAGGTCCGGCTCGATGCCGAACAGTTCGCTGGCGAGGAAGGCGCCGGTGCGCCCG ----------1-----------1----------.4-----------1----------H-----------1- 1260
TAGCGGTCCAGGCCGAGCTACGGCTTGTCAAGCGACCGCTCCTTCCGCGGCCACGCGGGC MALDPEIGFLESALFAGTRG-
CCGCCGGTGAGGACCTCGTCGGCGACGAGCAGCACGCCGCCGTCCCGGCAGGCGCCGGCG ---------+---------+---------+---------+---------+---------+ 1320
GGCGGCCACTCCTGGAGCAGCCGCTGCTCGTCGTGCGGCGGCAGGGCCGTCCGCGGCCGC GGTLVEDAVLLVGGDRCAGA-
ATCCGCTCCCAGTAGCCGGGGGGCGGCACGATGACGCCTGCCGCGCCGAGGACGGGTTCG ---------+---------+---------+---------+---------+---------+ 1380
TAGGCGAGGGTCATCGGCCCCCCGCCGTGCTACTGCGGACGGCGCGGCTCCTGCCCAAGC IREWYGPPPVIVGAAGLVPE-
AAGACCAGGGCCGAGACGTTGGGCTTCTCCGCGATGTGCCGGCGCACGAGGGTCGCGCAC ---------+---------+---------+---------+---------+---------+ 1440
TTCTGGTCCCGGCTCTGCAACCCGAAGAGGCGCTACACGGCCGCGTGCTCCCAGCGCGTG FVLASVNPKEAIHRRVLTAC-
CGCACGTCGCACGAGGGGTACTCCAGGCCCAGGGGACAGCGGTAGCCAGTAGGGGCTGTA ---------+---------+---------+---------+---------+---------+ 1500
GCGTGCAGCGTGCTCCCCATGAGGTCCGGGTCCCCTGTCGCCATCGGTCATCCCCGACAT RVDCSPYELGLPCRYGTPAT-
GCCAGCACGCTGTTGCCGCTGAAGGCCTGGTGGCCGATGTCCCAGTGGACCAGCATCCGG ---------+.---------+---------+---------+----------μ---------+ 1560 CGGTCGTGCGACAACGGCGACTTCCGGACCACCGGCTACAGGGTCACCTGGTCGTAGGCC ALVSNGS FAQHGIDWHVLMR-
GCGCCCATGGTCTTGCCGTGGAAGCCGTGGCGCAGGGCGCAGATCCGGTTGCGGCCCGGC ---------+---------+---------+---------+----------μ---------+ 1620
CGCGGGTACCAGAACGGCACCTTCGGCACCGCGTCCCGCGTCTAGGCCAACGCCGGGCCG AGMTKGHFGHRLACIRNRGP-
GCGGCGGTCGCCTGGACGACCCGCAGGGCGGCCTCGACCACCTCCGCGCCGGTGGAGAAG ---------+---------+---------+---------+---------+---------+ 1680 CGCCGCCAGCGGACCTGCTGGGCGTCCCGCCGGAGCTGGTGGAGGCGCGGCCACCTCTTC AATAQVVR LAAEVVEAGTS F-
AAGGCGTAGGTGTCGAGCTGTTCGGGCAGCAGCCTGGCGAGCAGTTCCAGCAGGCCGGCG ---------+---------+---------+---------+----------μ---------+ 1740 TTCCGCATCCACAGCTCGACAAGCCCGTCGTCGGACCGCTCGTCAAGGTCGTCCGGCCGC FAYTDLQE PLLRALLELLGA-
CGGTCCGGCGTGGCGCTGTCGTGGACGTTCCACAGGCGGCGGGCCTGGGTGGTGAGTGCC ---------+---------+---------+---------+---------+---------+ 1800
GCCAGGCCGCACCGCGACAGCACCTGCAAGGTGTCCGCCGCCCGGACCCACCACTCACGG RDPTASDHVNWLRRAQTTLA-
TCGACGACCTCCGGGTGCCCGTGGCCCAGTGACTGGGTGAGGGTCCCGGCCGCGAAGTCG ---------+---------+---------+---------+----------h---------+ 1860 AGCTGCTGGAGGCCCACGGGCACCGGGTCACTGACCCACTCCCAGGGCCGGCGCTTCAGC EVVE PHGH GLSQTLTGAAFD- 41
AGGTACTGGTTGCCGTCCAGGTCGGTCAGAACGGGACCGCGTCCCTCGGCGAAGACCCGG ---------+---------+---------+---------+---------+---------+ 1920
TCCATGACCAACGGCAGGTCCAGCCAGTCTTGCCCTGGCGCAGGGAGCCGCTTCTGGGCC LYQNGDLDTLVPGRGEAFVR-
CGTCCGTGGACGGCTTCCTCGGAGGCGCCCGGCGCCAGGTGGCGGGCCTCCCGTGCCAGG ---------+---------+---------+---------+---------+---------+ 1980
GCAGGCACCTGCCGAAGGAGCCTCCGCGGGCCGCGGTCCACCGCCCGGAGGGCACGGTCC RGHVAEESAGPALHRAERAL-
TGCTGTGTCTGCCGTAAGCCTGTCATCGCTGCCTCTGCTCGTCGGACCGGCTGACGCGAT ---------H----------h----------+---------+---------+---------+ 2040
ACGACACAGACGGCATTCGGACAGTAGCGACGGAGACGAGCAGCCTGGCCGACTGCGCTA
HQTQRLGTM
- acbB
CGCCGGCGAACTGCGTTGTGGCGCACCACGGTTGGGGCGGCTCGGCGCTGAGTCAAACAC ---------+---------+---------+---------+---------+---------+ 2100
GCGGCCGCTTGACGCAACACCGCGTGGTGCCAACCCCGCCGAGCCGCGACTCAGTTTGTG
TTGAACACACACCGCTGCAAGAGTTTGCGGGTTGTTTCAGAAAGTTGTTGCGAGCGGCCC -------------------í----------—+------------*-----------*-----------2160
AACTTGTGTGTGGCGACGTTCTCAAACGCCCAACAAAGTCTTTCAACAACGCTCGCCGGG
CGGCACTCTGGTTGAGTCGACGTGCTTACGGCGCCACCACGCCTCACGTTCGAGGAGGGA ---------+---------+---------+---------+---------+---------+ 2220
GCCGTGAGACCAACTCAGCTGCACGAATGCCGCGGTGGTGCGGAGTGCAAGCTCCTCCCT cctgtgagaacaagcccgcagaccgacccgctcccgcggrggccgaggtgaaggccctgg ---------+---------+---------+---------+---------+---------+ 2280
GGACACTCTTGTTCGGGCGTCTGGCTGGGCGAGGGCGCCTCCGGCTCCACTTCCGGGACC V K A L V -acbC -
P
V u 1
I
TCCTGGCAGGTGGAACCGGCAGCAGACTGAGGCCGTTCACCCACACCGCCGCCAAGCAGC ---------+---------+---------+---------+---------+---------+ 2340
AGGACCGTCCACCTTGGCCGTCGTCTGACTCCGGCAAGTGGGTGTGGCGGCGGTTCGTCG LAGGTGSRLRPFTHTAAKQL-
TGCTCCCCATCGCCAACAAGCCCGTGCTCTTCTACGCGCTGGAGTCCCTCGCCGCGGCGG ---------+---------+---------+---------+---------+---------+ 2400 ACGAGGGGTAGCGGTTGTTCGGGCACGAGAAGATGCGCGACCTCAGGGAGCGGCGCCGCC LP I ANKPVLFY ALESLAAAG —
GTGTCCGGGAGGCCGGCGTCGTCGTGGGCGCGTACGGCCGGGAGATCCGCGAACTCACCG ---------+---------+---------+---------+---------+---------+ 2460 CACAGGCCCTCCGGCCGCAGCAGCACCCGCGCATGCCGGCCCTCTAGGCGCTTGAGTGGC VREAGVVVGAYGRE I RELTG-
GCGACGGCACCGCGTTCGGGTTACGCATCACCTACCTCCACCAGCCCCGCCCGCTCGGTC ---------+---------+---------+---------+----------f---------+ 2520
CGCTGCCGTGGCGCAAGCCCAATGCGTAGTGGATGGAGGTGGTCGGGGCGGGCGAGCCAG DGTAFGLRITYLHQPRPLGL-
TCGCGCACGCGGTGCGCATCGCCCGCGGCTTCCTGGGCGACGACGACTTCCTGCTGTACC ---------+---------+---------+---------+---------+---------+ 2580
AGCGCGTGCGCCACGCGTAGCGGGCGCCGAAGGACCCGCTGCTGCTGAAGGACGACATGG AHAVRIARGFLGDDDFLLYL- 42
TGGGGGACAACTACCTGCCCCAGGGCGTCACCGACTTCGCCCGCCAATCGGCCGCCGATC ---------+--- +---------+---------+---------+---------+ 2640
ACCCCCTGTTGATGGACGGGGTCCCGCAGTGGCTGAAGCGGGCGGTTAGCCGGCGGCTAG GDNYLPQGVTDFARQSAADP-
CCGCGGCGGCCCGGCTGCTGCTCACCCCGGTCGCGGACCCGTCCGCCTTCGGCGTCGCGG ---------+---------+---------+---------+---------+---------+ 2700
GGCGCCGCCGGGCCGACGACGAGTGGGGCCAGCGCCTGGGCAGGCGGAAGCCGCAGCGCC AAARLLLTPVADPSAFGVAE- aggtcgacgcggacgggaacgtgctgcgcttggaggagaaacccgacgtcccgcgcagct ---------+---------+---------+---------+---------+---------+ 2760 tccagctgcgcctgcccttgcacgacgcgaacctcctctttgggctgcagggcgcgtcga VDADGNVLRLEEKPDVPRSS- cgctcgcgctgatcggcgtgtacgccttcagcccggccgtccacgaggcggtacgggcca ---------+---------+---------+---------+---------+---------+ 2820 gcgagcgcgagtagccgcacatgcggaagtcgggccggcaggtgctccgccatgcccggt LALIGVYAFSPAVHEAVRAI-
TCACCCCCTCCGCCCGCGGCGAGCTGGAGATCACCCACGCCGTGCAGTGGATGATCGACC ---------+---------+---------+---------+---------+---------+ 2880 AGTGGGGGAGGCGGGCGCCGCTCGACCTCTAGTGGGTGCGGCACGTCACCTACTAGCTGG TPSARGELE I THAVQWM I DR-
GGGGCCTGCGCGTACGGGCCGAGACCACCACCCGGCCCTGGCGCGACACCGGCAGCGCGG ---------+---------+---------+---------+---------+---------+ 2940
CCCCGGACGCGCATGCCCGGCTCTGGTGGTGGGCCGGGACCGCGCTGTGGCCGTCGCGCC GLRVRAETTTRPWRDTGSAE-
AGGACATGCTGGAGGTCAACCGTCACGTCCTGGACGGACTGGAGGGCCGCATCGAGGGGA ---------+---------+---------+---------+---------+---------+ 3000 TCCTGTACGACCTCCAGTTGGCAGTGCAGGACCTGCCTGACCTCCCGGCGTAGCTCCCCT DMLEVNRHVLDGLEGR I EGK-
AGGTCGACGCGCACAGCACGCTGGTCGGCCGGGTCCGGGTGGCCGAAGGCGCGATCGTGC ——----—+ 3060
TCCAGCTGCGCGTGTCGTGCGACCAGCCGGCCCAGGCCCACCGGCTTCCGCGCTAGCACG VDAHSTLVGRVRVAEGAIVR-
GGGGGTCACACGTGGTGGGCCCGGTGGTGATCGGCGCGGGTGCCGTCGTCAGCAACTCCA ---------+---------+------------------+---------+---------+ 3120
CCCCCAGTGTGCACCACCCGGGCCACCACTAGCCGCGCCCACGGCAGCAGTCGTTGAGGT GSHVVGPVVIGAGAVVSNSS-
GTGTCGGCCCGTACACCTCCATCGGGGAGGACTGCCGGGTCGAGGACAGCGCCATCGAGT ---------+---------+---------+---------+---------+---------+ 3180 CACAGCCGGGCATGTGGAGGTAGCCCCTCCTGACGGCCCAGCTCCTGTCGCGGTAGCTCA VGPYTS IGEDCRVED SAIEY-
ACTCCGTCCTGCTGCGCGGCGCCCAGGTCGAGGGGGCGTCCCGCATCGAGGCGTCCCTCA ---------+-------—+----------h---------——+ 3240
TGAGGCAGGACGACGCGCCGCGGGTCCAGCTCCCCCGCAGGGCGTAGCTCCGCAGGGAGT SVLLRGAQVEGASRIEASLI-
TCGGCCGCGGCGCCGTCGTCGGCCCGGCCCCCCGTCTCCCGCAGGCTCACCGACTGGTGA ---------+---------+---------+---------+---------+---------+ 3300
AGCCGGCGCCGCGGCAGCAGCCGGGCCGGGGGGCAGAGGGCGTCCGAGTGGCTGACCACT GRGAVVGPAPRLPQAHRLVI- 43
TCGGCGACCACAGCAAGGTGTATCTCACCCCfilSÀCCACGACCATCCTCGTCACCGGCGG ——---—+---—----—+--------—*·“---—----1~—----——i-------——+ 3360
AGCCGCTGGTGTCGTTCCACATAGAGTGGGGTACTGGTGCTGGTAGGAGCAGTGGCCGCC MTTTILVTGG- GDHSKVYLTP* acbD -1 — ...... s m a i
AGCGGGCTTCATTCGCTCCGCCTACGTCCGCCGGCTCCTGTCGCCCGGGGCCCCCGGCGG ---------+---------+---------+---------+---------+---------+ 3420 TCGCCCGAAGTAAGCGAGGCGGATGCAGGCGGCCGAGGACAGCGGGCCCCGGGGGCCGCC AGFIRSAYVRRLLS PGAPGG-
CGTCGCGGTGACCGTCCTCGACAAACTCACCTACGCCGGCAGCCTCGCCCGCCTGCACGC ---------+---------+---------+---------+---------+---------+- 3480 GCAGCGCCACTGGCAGGAGCTGTTTGAGTGGATGCGGCCGTCGGAGCGGGCGGACGTGCG VAVTVLDKLTYAGS larlha-
GGTGCGTGACCATCCCGGCCTCACCTTCGTCCAGGGCGACGTGTGCGACACCGCGCTCGT ---------+---------+---------+---------+---------+---------+ 3540
CCACGCACTGGTAGGGCCGGAGTGGAAGCAGGTCCCGCTGCACACGCTGTGGCGCGAGCA VRDHPGLTFVQGDVCDTALV-
CGACACGCTGGCCGCGCGGCACGACGACATCGTGCACTTCGCGGCCGAGTCGCACGTCGA -------—1------—----1--------—+—---------1——-------1—--------h 3600 GCTGTGCGACCGGCGCGCCGTGCTGCTGTAGCACGTGAAGCGCCGGCTCAGCGTGCAGCT DTLAARHDD I VH FAAE SHVD-
CCGCTCCATCACCGACAGCGGTGCCTTCACCCGCACCAACGTGCTGGGCACCCAGGTCCT ———————+—————— —_—+—----+-------+ 3660
GGCGAGGTAGTGGCTGTCGCCACGGAAGTGGGCGTGGTTGCACGACCCGTGGGTCCAGGA RSITDSGAFTRTNVLGTQVL·-
GCTCGACGCCGCGCTCCGCCACGGTGTGCGCACCTTCGTGCACGTCTCCACCGACGAGGT ---------+·----------+---------+---------+---------+----------+- 3720
CGAGCTGCGGCGCGAGGCGGTGCCACACGCGTGGAAGCACGTGCAGAGGTGGCTGCTCCA LDAALRHGVRTFVHVSTDEV-
GTACGGCTCCCTCCCGCACGGGGCCGCCGCGGAGAGCGACCCCCTGCTTCCGACCTCGCC ---------+---------+---------+---------+.---------+---------+ 3780
CATGCCGAGGGAGGGCGTGCCCCGGCGGCGCCTCTCGCTGGGGGACGAAGGCTGGAGCGG YGSLPHGAAAESDPLLPTSP-
GTACGCGGCGTCGAAGGCGGCCTCGGACCTCATGGCGCTCGCCCACCACCGCACCCACGG ---------+----------+----------+---------+----------+---------+ 3840 CATGCGCCGCAGCTTCCGCCGGAGCCTGGAGTACCGCGAGCGGGTGGTGGCGTGGGTGCC YAAS KAASDLMALAHHRTHG-
CCTGGACGTCCGGGTGACCCGCTGTTCGAACAACTTCGGCCCCCACCAGCATCCCGAGAA ---------+---------+---------+---------·+---------+---------+· 3900
GGACCTGCAGGCCCACTGGGCGACAAGCTTGTTGAAGCCGGGGGTGGTCGTAGGGCTCTT LDVRVTRCSNNFGPHQHPEK-
GCTCATACCGCGCTTCCTGACCAGCCTCCTGTCCGGCGGCACCGTTCCCCTCTACGGCGA ---------+.---------+.---------+.---------+---------+---------+ 3960 CGAGTATGGCGCGAAGGACTGGTCGGAGGACAGGCCGCCGTGGCAAGGGGAGATGCCGCT LI PRFLTSLLSGGTVPLYGD- 44
CGGGCGGCACGTGCGCGACTGGCTGCACGTCGACGACCACGTCAGGGCCGTCGAACTCGT ---------+---------η----------+---------+---------+---------+ 4020
GCCCGCCGTGCACGCGCTGACCGACGTGCAGCTGCTGGTGCAGTCCCGGCAGCTTGAGCA GRHVRDWLHVDDHVRAVELV-
B g 1
I
I
CCGCGTGTCGGGCCGGCCGGGAGAGATCTACAACATCGGGGGCGGCACCTCGCTGCCCAA ---------+---------+---------+---------+---------+---------+ 4080
GGCGCACAGCCCGGCCGGCCCTCTCTAGATGTTGTAGCCCCCGCCGTGGAGCGACGGGTT RVSGRPGEIYNIGGGTSLPN-
S s t
I
CCTGGAGCTCACGCACCGGTTGCTCGCACTGTGCGGCGCGGGCCCGGAGCGCATCGTCCA ---------+---------+---------+---------+---------+---------+ 4140
GGACCTCGAGTGCGTGGCCAACGAGCGTGACACGCCGCGCCCGGGCCTCGCGTAGCAGGT LELTHRLLALCGAGPERIVH-
CGTCGAGAACCGCAAGGGGCACGACCGGCGCTACGCGGTCGACCACAGCAAGATCACCGC ---------+---------+---------+---------+---------+---------+ 4200
GCAGCTCTTGGCGTTCCCCGTGCTGGCCGCGATGCGCCAGCTGGTGTCGTTCTAGTGGCG VENRKGHDRRYAVDHSKITA-
N r u
I
GGAACTCGGTTACCGGCCGCGCACCGACTTCGCGACCGCGCTGGCCGACACCGCGAAGTG ---------+---------+---------+---------+---------+---------+ 4260 CCTTGAGCCAATGGCCGGCGCGTGGCTGAAGCGCTGGCGCGACCGGCTGTGGCGCTTCAC E LGYR PRTD FATALADTAKW-
GTACGAGCGGCACGAGGACTGGTGGCGTCCCCTGCTCGCCGCGACATGACGTCGGGCCGG ---------+---------+---------h----------+---------+---------+ 4320 CATGCTCGCCGTGCTCCTGACCACCGCAGGGGACGAGCGGCGCTGTACTGCAGCCCGGCC YERHE DWWR PLLAAT*
ACCGCAACCACCGGCCCCGGCCGGCACACCGCCGCCCGCGGCCGGTGGCCGGCCGGTCAG ---------+---------+---------+---------+---------+---------+ 4380
TGGCGTTGGTGGCCGGGGCCGGCCGTGTGGCGGCGGGCGCCGGCCACCGGCCGGCCAGTC
CGTCCGTGAGCCGGGCGCCGGCCGCCCCGCGGGCCGGCGGCGGTGGACCCCCGGACCACC ----------1-----------^ -----------h-----------1-----------b------------f- 4440
GCAGGCACTCGGCCCGCGGCCGGCGGGGCGCCCGGCCGCCGCCACCTGGGGGCCTGGTGG RGHAPRRGGRPGAATSGRVV-
E c
0 R 1
AGTTCCGGCATGAAGACGAATTCGGTGCGCGGCGGCGGCGTTCCGCTCATCTCCTCCAGC ---------+---------+---------+---------+---------+---------+ 4500
TCAAGGCCGTACTTCTGCTTAAGCCACGCGCCGCCGCCGCAAGGCGAGTAGAGGAGGTCG LEPMFVFETRPPPTGSMEEL- 45
AGTGCGTCCACGGCGACCTGCCCCATCGCCTTGACGGGCTGTCTGATGGTGGTCAGGGGA ----------1----------+---------+----------ι----------+---------+ 4560
TCACGCAGGTGCCGCTGGACGGGGTAGCGGAACTGCCCGACAGACTACCACCAGTCCCCT LADVAVQGMAKVPQRITTLP-
GGGTCGGTGAAGGCCATGAGCGGCGAGTCGTCGAAGCCGACCACCGAGATGTCACCGGGA ---------+---------+---------+---------+---------+---------+ 4620
CCCAGCCACTTCCGGTACTCGCCGCTCAGCAGCTTCGGCTGGTGGCTCTACAGTGGCCCT PDTFAMLPSDDFGVVSIDGP-
ACCGTGAGACCCCGCCGGCGCGCGGCCCGCACGGCGCCGAGGGCCATCATGTCGCTGGCG ---------+---------+---------+---------+---------+---------+ 4680
TGGCACTCTGGGGCGGCCGCGCGCCGGGCGTGCCGCGGCTCCCGGTAGTACAGCGACCGC VTLGRRRAARVAGLAMMDSA-
CACATGACGGCGGTGCAGCCCAGGTCGATCAGCGCGGACGCGGCGGCCTGGCCCCCCTCC ---------+---------+---------+---------+---------+---------+ 4740 GTGTACTGCCGCCACGTCGGGTCCAGCTAGTCGCGCCTGCGCCGCCGGACCGGGGGGAGG CMVATCGLDI LASAAAQGGE-
S s t
I
AGGGAGAACAGCGAGTGCTGCACGAGCTCCTCGGACTCCCGCGCCGACACTCCCAGGTGC ---------+---------+---------+---------+---------+---------+ 4800
TCCCTCTTGTCGCTCACGACGTGCTCGAGGAGCCTGAGGGCGCGGCTGTGAGGGTCCACG LSFLSHQVLEESERASVGLH-
TCCCGCACGCCGGCCCGGAACCCCTCGATCTTCCGCTGCACCGGCACGAAGCGGGCGGGC ---------+---------+---------h----------+---------+---------+ 4860
AGGGCGTGCGGCCGGGCCTTGGGGAGCTAGAAGGCGACGTGGCCGTGCTTCGCCCGCCCG ERVGARFGEIKRQVPVFRAP-
CCGACGGCGAGGCCGACGCGCTCGTGCCCCAGCTCCGCCAGGTGCGCCACGGCCAGGCGC ---------+---------+---------+---------+---------+---------+ 4920
GGCTGCCGCTCCGGCTGCGCGAGCACGGGGTCGAGGCGGTCCACGCGGTGCCGGTCCGCG GVALGVREHGLEALHAVALR-
ATCGCGGCCCGGTCGTCCGGGGAGACGAAGGGTGCCTCGATCCGGGGCGAGAACCCGTTC ---------+---------+---------+---------+---------+---------+ 4980 TAGCGCCGGGCCAGCAGGCCCCTCTGCTTCCCACGGAGCTAGGCCCCGCTCTTGGGCAAG MAARDD.PSVF PAEIRPS FGN -
ACGAGGACGAAGGGCACCTGCCGCTCGTGCAGCCGGCCGTACCGTCCGGTCTCGGCGGTG ---------+----------t----------+---------+---------+----------h 5040
TGCTCCTGCTTCCCGTGGACGGCGAGCACGTCGGCCGGCATGGCAGGCCAGAGCCGCCAC VLVFPVQREHLRGYRGTEAT-
GTGTCCGCGTGCAGTCCGGAGACGAAGATGATGCCGGACACCCCGCGGTCCACGAGCATC ---------+---------+---------+---------+---------+---------+ 5100 CACAGGCGCACGTCAGGCCTCTGCTTCTACTACGGCCTGTGGGGCGCCAGGTGCTCGTAG TDAHLGSVFI IGSVGRDVLM-
S m a
I
TCCGTGAGTTCGTCCTCGGTCGAGCCGCCCGGGGTCTGCGTGGCGAGCACGGGCGTGTAG ---------+----------μ---------+---------+---------+---------+ 5160
AGGCACTCAAGCAGGAGCCAGCTCGGCGGGCCCCAGACGCACCGCTCGTGCCCGCACATC ETLEDETSGGPTQTALVPTY- 46
CCCTGACGCGTGAGCGCCTGCCCCATCACCTGGGCCAGTGCGGGGAAGAAGGGGTTGTCC ---------+---------+---------+---------+---------+---------+ 5220
GGGACTGCGCACTCGCGGACGGGGTAGTGGACCCGGTCACGCCCCTTCTTCCCCAACAGG GQRTLAQGMVQALAPFFPND-
AGTTCGGGGGTGACCAGTCCGACCAGCTCGGCGCGGCGCTGTCGCGCCGGCTGCTCGTAG ---------+---------+---------+---------+---------+---------+ 5280
TCAAGCCCCCACTGGTCAGGCTGGTCGAGCCGCGCCGCGACAGCGCGGCCGACGAGCATC LEPTVLGVLEARRQRAPQEY-
CCCAGCGCGTCCAGTGCGGTCAGCACCGAGTCGCGGGTGCCGGTGGCCACACCGCGCGCA ---------+---------+---------+---------+---------+---------+ 5340 GGGTCGCGCAGGTCACGCCAGTCGTGGCTCAGCGCCCACGGCCACCGGTGTGGCGCGCGT GLAD LAT LVSDRT GTAV GRA-
S m a
I
CCGTTCAGCACCCGGCTGACCGTGGCCTTGCTGACGCCCGCCCGGGCTGCGATGTCGGCG ---------+---------+---------+---------+---------+---------+ 5400
GGCAAGTCGTGGGCCGACTGGCACCGGAACGACTGCGGGCGGGCCCGACGCTACAGCCGC GNLVRSVTAKSVGARAAIDA-
AGCCGCATGGTCATGGCAACGCACTCTACCTGTCGGGGCGTCAGGGCGTGCCCACCGCGC ---------+----------1----------+---------+---------+---------+ 5460
TCGGCGTACCAGTACCGTTGCGTGAGATGGACAGCCCCGCAGTCCCGGACGGGTGGCGCG L R Μ T M 1 acbE
GCGGAACCGGCGGACTGCGGGGCACGGCCCGTCCGCCGCCCACGGACCACGCGCCCGAAA ---------+---------+---------+---------+---------+---------+ 5520
CGCCTTGGCCGCCTGACGCCCCGTGCCGGGCAGGCGGCGGGTGCCTGGTGCGCGGGCTTT
CGATGGCTGAAAATGCTTGCAGCAAATTGCCGCAACGTCTTTCGGCGGCTTTTCGATCCT ---------+----------1----------+---------+---------+---------+ 5580
GCTACCGACTTTTACGAACGTCGTTTAACGGCGTTGCAGAAAGCCGCCGAAAAGCTAGGA
GTTACGTTCCTGGCAACCCCGGCGCCGCGCAGAAGCGGTTGGCGTGAGGCGTCCAGACCT ---------+----------1----------+---------+---------+---------+ 5640
CAATGCAAGGACCGTTGGGGCCGCGGCGCGTCTTCGCCAACCGCACTCCGCAGGTCTGGA
CCGCCCGATTCCGGGATCACTCAGGGGAGTTCACAATGCGGCGTGGCATTGCGGCCACCG ---------+---------h----------+---------+---------+---------+ 5700
GGCGGGCTAAGGCCCTAGTGAGTCCCCTCAAGTGTTACGCCGCACCGTAACGCCGGTGGC
MRRGIAATA-acbF
CGCTGTTCGCGGCTGTGGCCATGACGGCATCGGCGTGTGGCGGGGGCGACAACGGCGGAA ———----.4------—------------—h----—------{-----------1----------+ 5760
GCGACAAGCGCCGACACCGGTACTGCCGTAGCCGCACACCGCCCCCGCTGTTGCCGCCTT LFAAVAMTASACGGGDNGGS-
K
P n
I
GCGGTACCGACGCGGGCGGCACGGAGCTGTCGGGGACCGTCACCTTCTGGGACACGTCCA ---------+---------+---------+---------+----------μ---------+ 5820
CGCCATGGCTGCGCCCGCCGTGCCTCGACAGCCCCTGGCAGTGGAAGACCCTGTGCAGGT GTDAGGTELSGTVTFWDTSN- 47 acgaagccgagaaggcgacgtaccaggccctcgcggagggcttcgagaaggagcacccga ---------+— -------+---------+---------+---------+---------+ 5880 TGCTTCGGCTCTTCCGCTGCATGGTCCGGGAGCGCCTCCCGAAGCTCTTCCTCGTGGGCT EAEKATY QALAE GFE KE Η P K -
AGGTCGACGTCAAGTACGTCAACGTCCCGTTCGGCGAGGCGAACGCCAAGTTCAAGAACG ---------+---------+---------+---------+---------+---------+ 5940 TCCAGCTGCAGTTCATGCAGTTGCAGGGCAAGCCGCTCCGCTTGCGGTTCAAGTTCTTGC VDVKYVNV P FGEANAK FKNA-
CCGCGGGCGGCAACTCCGGTGCCCCGGACGTGATGCGTACGGAGGTCGCCTGGGTCGCGG -----—— ——————*—H—* -----——+--------—h 6000
GGCGCCCGCCGTTGAGGCCACGGGGCCTGCACTACGCATGCCTCCAGCGGACCCAGCGCC AGGNSGAPDVMRTEVAWVAD-
ACTTCGCCAGCATCGGCTACCTCGCCCCGCTCGACGGCACGCCCGCCCTCGACGACGGGT ---------+---------+---------+---------+---------+---------+ 6060 TGAAGCGGTCGTAGCCGATGGAGCGGGGCGAGCTGCCGTGCGGGCGGGAGCTGCTGCCCA FAS I GY LAPLDGTPALDDGS-
CGGACCACCTTCCCCAGGGCGGCAGCACCAGGTACGAGGGGAAGACCTACGCGGTCCCGC --------——————————---------------1 --------1-----------h 6120
GCCTGGTGGAAGGGGTCCCGCCGTCGTGGTCCATGCTCCCCTTCTGGATGCGCCAGGGCG DHLPQGGSTRYEGKTYAVPQ-
AGGTGATCGACACCCTGGCGCTCTTCTACAACAAGGAACTGCTGACGAAGGCCGGTGTCG ---------+---------+---------+---------+---------+---------+ 6180
TCCACTAGCTGTGGGACCGCGAGAAGATGTTGTTCCTTGACGACTGCTTCCGGCCACAGC VIDTLALFYNKELLTKAGVE-
AGGTGCCGGGCTCCCTCGCCGAGCTGAAGACGGCCGCCGCCGAGATCACCGAGAAGACCG ---------+---------+---------+---------+---------+---------+ 6240 TCCACGGCCCGAGGGAGCGGCTCGACTTCTGCCGGCGGCGGCTCTAGTGGCTCTTCTGGC V PGS LAE LKTAAAE I TEKTG-
GCGCGAGCGGCCTCTACTGCGGGGCGACGACCCGTACTTGGTTCCTGCCCTACCTCTACG ---------+---------+---------H----------+---------+---------+ 6300 CGCGCTCGCCGGAGATGACGCCCCGCTGCTGGGCATGAACCAAGGACGGGATGGAGATGC ASGLY CGATTRTWFLPY LY G-
GGGAGGGCGGCGACCTGGTCGACGAGAAGAACAAGACCGTCACGGTCGACGACGAAGCCG ---------+---------+--------—+---------+---------+---------+ 6360 CCCTCCCGCCGCTGGACCAGCTGCTCTTCTTGTTCTGGCAGTGCCAGCTGCTGCTTCGGC E GGDLVDEKNKTVTVDDEAG-
GTGTGCGCGCCTACCGCGTCATCAAGGACCTCGTGGACAGCAAGGCGGCCATCACCGACG ---------+---------+---------+---------+---------+---------+ 6420
CACACGCGCGGATGGCGCAGTAGTTCCTGGAGCACCTGTCGTTCCGCCGGTAGTGGCTGC VRAYRVIKDLVDSKAAITDA-
CGTCCGACGGCTGGAACAACATGCAGAACGCCTTCAAGTCGGGCAAGGTCGCCATGATGG ---------+---------+---------+---------+---------+---------+ 6480 GCAGGCTGCCGACCTTGTTGTACGTCTTGCGGAAGTTCAGCCCGTTCCAGCGGTACTACC S DGWNNMQNAFKS GKVAMMV-
TCAACGGCCCCTGGGCCATCGAGGACGTCAAGGCGGGAGCCCGCTTCAAGGACGCCGGCA ---------+---------+---------+---------+---------+---------+ 6540 AGTTGCCGGGGACCCGGTAGCTCCTGCAGTTCCGCCCTCGGGCGAAGTTCCTGCGGCCGT NGPWAI EDVKAGARFKDAGN- 48
ACCTGGGGGTCGCCCCCGTCCCGGCCGGCAGTGCCGGACAGGGCTCTCCCCAGGGCGGGT ---------+---------+---------+---------+---------+---------+ 6600 TGGACCCCCAGCGGGGGCAGGGCCGGCCGTCACGGCCTGTCCCGAGAGGGGTCCCGCCCA LGVAPVPAGSAGQGS PQGGW-
GGAACCTCTCGGTGTACGCGGGCTCGAAGAACCTCGACGCCTCCTACGCCTTCGTGAAGT ---------+---------+---------+---------+---------+---------+ 6660
CCTTGGAGAGCCACATGCGCCCGAGCTTCTTGGAGCTGCGGAGGATGCGGAAGCACTTCA NLSVYAGSKNLDASYAFVKY-
S s t
I
ACATGAGCTCCGCCAAGGTGCAGCAGCAGACCACCGAGAAGCTGAGCCTGCTGCCCACCC ---------+---------+---------+---------+---------+---------+ 6720
TGTACTCGAGGCGGTTCCACGTCGTCGTCTGGTGGCTCTTCGACTCGGACGACGGGTGGG MSSAKVQQQTTEKLSLLPTR-
GCACGTCCGTCTACGAGGTCCCGTCCGTCGCGGACAACGAGATGGTGAAGTTCTTCAAGC ---------+---------+---------+---------+---------+---------+ 6780 CGTGCAGGCAGATGCTCCAGGGCAGGCAGCGCCTGTTGCTCTACCACTTCAAGAAGTTCG TSVYEVPSVADNEMVKF FKP-
CGGCCGTCGACAAGGCCGTCGAACGGCCGTGGATCGCCGAGGGCAATGCCCTCTTCGAGC ---------+---------+---------+----- +---------+----------1- 6840
GCCGGCAGCTGTTCCGGCAGCTTGCCGGCACCTAGCGGCTCCCGTTACGGGAGAAGCTCG AVDKAVERPWIAEGNALFEP-
P s t
I
CGATCCGGCTGCAG ---------+---- 6854
GCTAGGCCGACGTC I R L Q PROTOCOLO DE SEQUÊNCIAS (1) INFORMAÇÃO GERAL: (i) REQUERENTE: (A) NOME: Hoechst Aktiengesellschaft (B) RUA: - (C) LOCAL: Frankfurt (D) REGIÃO FEDERAL: - (E) PAÍS: Deutschland (F) CÓDIGO POSTAL: 65926 49 (G) TELEFONE: 069-305-3005 (H) TELEFAX: 069-35-7175 (I) TELEX: - (ii) TÍTULO DO PEDIDO: Isolamento dos genes de biossintese para pseudo-oligossacáridos a partir de Streptomyces glaucescens GLA.O e sua utilização (iii) NÚMERO DE SEQUÊNCIAS: 13 (iv) FORMA LEGÍVEL POR COMPUTADOR: (A) SUPORTE DE DADOS: Disguete (B) COMPUTADOR: IBM PC compatible
(C) SISTEMA OPERATIVO: PC-DOS/MS-DOS (D) SOFTWARE: Patent In Release #1.0, versão #1.25 (EPA) (2) INFORMAÇÃO PARA A SEQ ID N°: 1: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 22 pares de bases (B) TIPO: Ácido nucleico (C) FORMA DA CADEIA: simples (D) TOPOLOGIA: linear (ii) TIPO DA MOLÉCULA: DNA (ix) CARACTERÍSTICAS: (A) NOME/CHAVE: exão (B) POSIÇÃO: 1..22 (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID N°: 1: CSGGSGSSGC SGGSTTCATS GG 22 (2) INFORMAÇÃO PARA A SEQ ID N°: 2: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 24 pares de bases (B) TIPO: Ácido nucleico 50 (C) FORMA DA CADEIA: simples (D) TOPOLOGIA: linear (ii) TIPO DA MOLÉCULA: DNA (ix) CARACTERÍSTICAS: (A) NOME/CHAVE: exão (B) POSIÇÃO: 1..24 (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID N°: 2: GGGWVCTGGY VSGGSCCGTA GTTG 24 (2) INFORMAÇÃO PARA A SEQ ID N°: 3: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 546 pares de bases (B) TIPO: Ácido nucleico (C) FORMA DA CADEIA: simples (D) TOPOLOGIA: linear (ii) TIPO DA MOLÉCULA: DNA (genómico) (ix) CARACTERÍSTICAS: (A) NOME/CHAVE: exão (B) POSIÇÃO: 1..546 (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID N°: 3: CCCGGGCGGG GCGGGGTTCA TCGGCTCCGC CTACGTCCGC CGGCTCCTGT CGCCCGGGGC 60 CCCCGGCGGC GTCGCGGTGA CCGTCCTCGA CAAACTCACC TACGCCGGCA GCCTCGCCCG 120 CCTGCACGCG GTGCGTGACC ATCCCGGCCT CACCTTCGTC CAGGGCGACG TGTGCGACAC 180 CGCGCTCGTC GACACGCTGG CCGCGCGGCA CGACGACATC GTGCACTTCG CGGCCGAGTC 240 GCACGTCGAC CGCTCCATCA CCGACAGCGG TGCCTTCACC CGCACCAACG TGCTGGGCAC 300 CCAGGTCCTG CTCGACGCCG CGCTCCGCCA CGGTGTGCGC ACCCTCGTGC ACGTCTCCAC 360 CGACGAGGTG TACGGCTCCC TCCCGCACGG'GGCCGCCGCG GAGAGCGACC CCCTGCTCCC 420 GACCTCGCCG TACGCGGCGT CGAAGGCGGC CTCGGACCTC ATGGCGCTCG CCCACCACCG 480 CACCCACGGC CTGGACGTCC GGGTGACCCG CTGTTCGAAC AACTACGGCC CGCACCAGTT 540 CCCGGG 546 51 (2) INFORMAÇÃO PARA A SEQ ID N°: 4: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 541 pares de bases (B) TIPO: Ácido nucleico (C) FORMA DA CADEIA: simples (D) TOPOLOGIA: linear (ii) TIPO DA MOLÉCULA: DNA (genómico) (ix) CARACTERÍSTICAS: (A) NOME/CHAVE: exão (B) POSIÇÃO: 1..541 (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID N°: 4: CCCCGGGTGC TGGTAGGGGC CGTAGTTGTT GGAGCAGCGG GTGATGCGCA CGTCCAGGCC 60 GTGGCTGACG TGCATGGCCA GCGCGAGCAG GTCGCCCGAC GCCTTGGAGG TGGCATAGGG 120 GCTGTTGGGG CGCAGCGGCT CGTCCTCCGT CCACGACCCC GTCTCCAGCG AGCCGTAGAC 180 CTCGTCGGTG GACACCTGCA CGAAGGGGGC CACGCCGTGC CGCAGGGCCG CGTCGAGGAG 240 TGTCTGCGTO CCGCCGGCGT TGGTCCGCAC GAACGCGGCG GCATCGAGCA GCGAGCGGTC 300 CACGTGCGAC TCGGCGGCGA GGTGCACGAC CTGGTCCTGG CCGGCCATGA CCCGGTCGAC 360 CAGGTCCGCG TCGCAGATGT CGCCGTGGAC GAAGCGCAGC CGGGGGTGGT CGCGGACCGG 420 GTCGAGGTTG GCGAGGTTGC CGGCGTAGCT CAGGGCGTCG AGCACGGTGA CGACGGCGTC 480 GGGCGGCCCG TCCGGACCGA GGAGGGTGCG GACGTAGTGC GAGCCCATGA ACCCCGCCGC 540 C 541 (2) INFORMAÇÃO DA SEQ ID N°: 5: (i) CARACTERÍSTICAS PARA A SEQUÊNCIA: (A) COMPRIMENTO: 180 aminoácidos (B) TIPO: aminoácido (C) FORMA DA CADEIA: simples (D) TOPOLOGIA: linear (ii) TIPO DA MOLÉCULA: proteína (ix) CARACTERÍSTICAS: 52 (A) NOME/CHAVE: PCRstrE.Pep (B) POSIÇÃO: 1..180 (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID N°: 5:
Ala 1 Ala Gly Phe Met 5 Gly Ser His Tyr Vai 10 Arg Thr Leu Leu Gly 15 Pro Asp Gly Pro Pro 20 Asp Ala Vai Vai Thr 25 Vai Leu Asp Ala Leu 30 Ser Tyr Ala Gly Asn 35 Leu Ala Asn Leu Asp 40 Pro Vai Arg Asp His 45 Pro Arg Leu Arg Phe 50 Vai His Gly Asp Ile 55 Cys Asp Ala Asp Leu 60 Vai Asp Arg Vai Met 65 Ala Gly Gin Asp Gin 70 Vai Vai His Leu Ala 75 Ala Glu Ser His Vai 80 Asp Arg Ser Leu Leu 85 Asp Ala Ala Ala Phe 90 Vai Arg Thr Asn Ala 95 Gly Gly Thr Gin Thr 100 Leu Leu Asp Ala Ala 105 Leu Arg His Gly Vai 110 Ala Pro Phe Vai Gin 115 Vai Ser Thr Asp Glu 120 Vai Tyr Gly Ser Leu 125 Glu Thr Gly Ser Trp 130 Thr Glu Asp Glu Pro 135 Leu Arg Pro Asn Ser 140 Pro Tyr Ala Thr Ser 145 Lys Ala Ser Gly Asp 150 Leu Leu Ala Leu Ala 155 Met His Vai Ser His 160 Gly Leu Asp Vai Arg 165 Ile Thr Arg Cys Ser 170 Asn Asn Tyr Gly Pro 175 Tyr Gin His Pro Gly 180 (2) INFORMAÇÃO PARA A SEQ ID N°: 6: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 181 aminoácidos (B) TIPO: aminoácido (C) FORMA DA CADEIA: simples (D) TOPOLOGIA: linear (ii) TIPO DA MOLÉCULA: proteína (ix) CARACTERÍSTICAS: (A) NOME/CHAVE: PCR acbD.Pep 53 (B) POSIÇÃO: 1..181 (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID N°: 6:
Pro 1 Gly Gly Ala Gly 5 Phe Ile Gly Ser Ala 10 Tyr Vai Arg Arg Leu 15 Leu Ser Pro Gly Ala 20 Pro Gly Gly Vai Ala 25 Vai Thr Vai Leu Asp 30 Lys Leu Thr Tyr Ala 35 Gly Ser Leu Ala Arg 40 Leu His Ala Vai Arg Asp 45 His Pro Gly Leu 50 Thr Phe Vai Gin Gly 55 Asp Vai Cys Asp Thr 60 Ala Leu Vai Asp Thr 65 Leu Ala Ala Arg His 70 Asp Asp ile Vai His 75 Phe Ala Ala Glu Ser 80 His Vai Asp Arg Ser 85 Ile Thr Asp Ser Gly 90 Ala Phe Thr Arg Thr 95 Asn Vai Leu Gly Thr 100 Gin Vai Leu Leu Asp 105 Ala Ala Leu Arg His 110 Gly Vai Arg Thr Leu 115 Vai His Vai Ser Thr 120 Asp Glu Vai Tyr Gly Ser 125 Leu Pro His Gly 130 Ala Ala Ala Glu Ser 135 Asp Pro Leu Leu Pro 140 Thr Ser Pro Tyr Ala 145 Ala Ser Lys Ala Ala 150 Ser Asp Leu Met Ala 155 Leu Ala His His Arg 160 Thr His Gly Leu Asp 165 Vai Arg Vai Thr Arg 170 Cys Ser Asn Asn Tyr Gly 175 Pro His Gin Phe 180 Pro (2) INFORMAÇÃO PARA A SEQ ID N°: 7: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 6854 pares de bases (B) TIPO: Ácido nucleico (C) FORMA DA CADEIA: dupla (D) TOPOLOGIA: linear (ii) TIPO DA MOLÉCULA: DNA (genómico) (ix) CARACTERÍSTICAS: (A) NOME/CHAVE: agrupamento de genes de biossíntese "acarbose" 54 (B) POSIÇÃO: 1..6854 (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID N°: 7: CTGCAGGGTT CCCTGGTGCA CGACCCGCCC CTGGTCGACG ACCAGGGCGC TGTCGCAGAT 60 CGCGGCGATG TCGGCGATGT CGTGGCTGGT GAGCACCACG GTGGTGCCCA GTTCCCGGTG 120 GGCGCGGTTG ACCAGCCGGC GCACCGCGTC CTTCAGCACC ATGTCGAGGC CGATCGTGGG 180 CTCGTCCCAG AACAGCACGG CCGGGTCGTG CAGCAGGCTC GCCGCGATCT CGGCGCGCAT 240 GCGCTGTCCG AGGCTGAGCT GCCGCACGGG GGTGGACCCC AGCGCGTCGA TGTCGAGGAG 300 GTCCCGGAAC AGGGCGAGGT TGCGCCGGTA GACCGGTCCG GGGATGTCGT AGATGCGGCG 360 CAGGATGCGG AAGGAGTCGG GTACCGACAG GTCCCACCAG AGCTGGCTGC GCTGGCCGAA 420 GACGACGCCG ATCGTGCGGG CGTTGCGCTG CCGGTGCCGG TAGGGCTCCA GCCCGGCGAC 480 CGTGCAGCGG CCGGAGGTGG GGGTCATGAT GCCGGTCAGC ATCTTGATCG TGGTCGACTT 540 GCCGGCTCCG TTGGCGCCGA TGTAGGCGGT CTTCGTGCCG GCCGGTATCT CGAAGGAGAC 600 GTCGTCGACG GCGCGCACGA CGCGGTACCG GCGGGTCAGG AGGGTGGAGA GGCTGCCGAG 660 CAGGCCGGGC TCGCGTTCGG CCAGCCGGAA CTCCTTGACG AGGTGTTCGG CCACGATCAC 720 GCGATCACCC GCTCGACGGC CGTCTCCAGC AGGCGCAGGC CCTCGTCGAG CAGCGCCTCG 780 TCGAGGGTGA ACGGCGGTGC CAGCCGCAGG ATGTGGCCGC CCAGGGAGGT GCGCAGCCCC 840 AGGTCGAGGG CGGTGGTGTA GACGGCCCGG GCGGTCTCGG GGGCGGGTGC CCGGCCGACG 900 GCGTCGGTGA CGAACTCCAG GCCCCACAGC AGTCCGAGGC CGCGTACCTG GCCGAGCTGG 960 GGGAAGCGGG ACTCCAGGGC GCGCAGCCGC TCCTGGATGA GCTCGCCGAG GACGCGCACG 1020 CGGTCGATCA GCCGGTCGCG CTCGACGACC TCCAGCQTGG CGCGGGCGGC GGCGATCCCC 1080 AGTGGGTTGC TCGCGTACGT CGAGGCGTAC GCCCCGGGGT GGCCGCCTCC GGCCTGCGCA 1140 GCTTCCGCGC GTCCGGCCAG CACGGCGAAG GGGAATCCGC TCGCGGTGCC CTTGGACAGC 1200 ATCGCCAGGT CCGGCTCGAT GCCGAACAGT TCGCIGGCGA GGAAGGCGCC GGTGCGCCCG 1260 CCGCCGGTGA GGACCTCGTC GGCGACGAGC AGCACGCCGC CGTCCCGGCA GGCGCCGGCG 1320 ATCCGCTCCC AGTAGCCGGG GGGCGGCACG ATGACGCCTG CCGCGCCGAG GACGGGTTCG 1380 AAGACCAGGG CCGAGACGTT GGGCTTCTCC GCGATGTGCC GGCGCACGAG GGTCGCGCAC 1440 CGCACGTCGC ACGAGGGGTA CTCCAGGCCC AGGGGACAGC GGTAGCCAGT AGGGGCTGTA 1500 GCCAGCACGC TGTTGCCGCT GAAGGCCTGG TGGCCGATGT CCCAGTGGAC CAGCATCCGG 1560 GCGCCCATGG TCTTGCCGTG GAAGCCGTGG CGCAGGGCGC AGATCCGGTT GCGGCCCGGC 1620 GCGGCGGTCG CCTGGACGAC CCGCAGGGCG GCCTCGACCA CCTCCGCGCC GGTGGAGAAG 1680 AAGGCGTAGG TGTCGAGCTG TTCGGGCAGC AGCCTGGCGA GCAGTTCCAG CAGGCCGGCG 1740 CGGTCCGGCG TGGCGCTGTC GTGGACGTTC CACAGGCGGC GGGCCTGGGT GGTGAGTGCC 1800 55 TCGACGACCT CCGGGTGCCC GTGGCCCAGT GACTGGGTGA gggtcccggc CGCGAAGTCG 1860 AGGTACTGGT TGCCGTCCAG GTCGGTCAGA ACGGGACCGC GTCCCTCGGC GAAGACCCGG 1920 CGTCCGTGGA CGGCTTCCTC GGAGGCGCCC GGCGCCAGGT GGCGGGCCTC CCGTGCCAGG 1980 TGCTGTGTCT GCCGTAAGCC TGTCATCGCT GCCTCTGCTC GTCGGACCGG CTGACGCGAT 2040 CGCCGGCGAA CTGCGTTGTG GCGCACCACG GTTGGGGCGG CTCGGCGCTG AGTCAAACAC 2100 TTGAACACAC ACCGCTGCAA GAGTTTGCGG GTTGTTTCAG AAAGTTGTTG CGAGCGGCCC 2180 CGGCACTCTG GTTGAGTCGA CGTGCTTACG GCGCCACCAC GCCTCACGTT CGAGGAGGGA 2220 CCTGTGAGAA CAAGCCCGCA GACCGACCCG CTCCCGCGGA GGCCGAGGTG AAGGCCCTGG 2280 TCCTGGCAGG TGGAACCGGC AGCAGACTGA GGCCGTTCAC CCACACCGCC GCCAAGCAGC 2340 TGCTCCCCAT CGCCAACAAG CCCGTGCTCT TCTACGCGCT GGAGTCCCTC GCCGCGGCGG 2400 GTGTCCGGGA GGCCGGCGTC GTCGTGGGCG CGTACGGCCG GGAGATCCGC GAACTCACCG 2460 GCGACGGCAC CGCGTTCGGG TTACGCATCA CCTACCTCCA CCAGCCCCGC CCGCTCGGTC 2520 TCGCGCACGC GGTGCGCATC GCCCGCGGCT TCCTGGGCGA CGACGACTTC CTGCTGTACC 2580 TGGGGGACAA CTACCTGCCC CAGGGCGTCA CCGACTTCGC CCGCCAATCG GCCGCCGATC 2640 CCGCGGCGGC CCGGCTGCTG CTCACCCCGG TCGCGGACCC GTCCGCCTTC ggcgtcgcgg 2700 AGGTCGACGC GGACGGGAAC GTGCTGCGCT TGGAGGAGAA ACCCGACGTC CCGCGCAGCT 2760 CGCTCGCGCT CATCGGCGTG TACGCCTTCA GCCCGGCCGT CCACGAGGCG GTACGGGCCA 2820 TCACCCCCTC CGCCCGCGGC GAGCTGGAGA TCACCCACGC CGTGCAGTGG ATGATCGACC 2880 GGGGCCTGCG CGTACGGGCC GAGACCACCA CCCGGCCCTG GCGCGACACC GGCAGCGCGG 2940 AGGACATGCT GGAGGTCAAC CGTCACGTCC TGGACGGACT GGAGGGCCGC ATCGAGGGGA 3000 AGGTCGACGC GCACAGCACG CTGGTCGGCC GGGTCCGGGT GGCCGAAGGC GCGATCGTGC 3060 GGGGGTCACA CGTGGTGGGC CCGGTGGTGA TCGGCGCGGG TGCCGTCGTC AGCAACTCCA 3120 GTGTCGGCCC GTACACCTCC ATCGGGGAGG ACTGCCGGGT CGAGGACAGC GCCATCGAGT 3180 ACTCCGTCCT GCTGCGCGGC GCCCAGGTCG AGGGGGCGTC CCGCATCGAG GCGTCCCTCA 324 0 TCGGCCGCGG CGCCGTCGTC GGCCCGGCCC CCCGTCTCCC GCAGGCTCAC CGACTGGTGA 3300 TCGGCGACCA CAGCAAGGTG TATCTCACCC CATGACCACG ACCATCCTCG TCACCGGCGG 3360 AGCGGGCTTC ATTCGCTCCG CCTACGTCCG CCGGCTCCTG TCGCCCGGGG CCCCCGGCGG 3420 CGTCGCGGTG ACCGTCCTCG ACAAACTCAC CTACGCCGGC AGCCTCGCCC GCCTGCACGC 3480 GGTGCGTGAC CATCCCGGCC TCACCTTCGT CCAGGGCGAC GTGTGCGACA CCGCGCTCGT 3540 CGACACGCTG GCCGCGCGGC ACGACGACAT CGTGCACTTC GCGGCCGAGT CGCACGTCGA 3600 CCGCTCCATC ACCGACAGCG GTGCCTTCAC CCGCACCAAC GTGCTGGGCA CCCAGGTCCT 3660 GCTCGACGCC GCGCTCCGCC ACGGTGTGCG caccttcgtg CACGTCTCCA CCGACGAGGT 3720 GTACGGCTCC CTCCCGCACG GGGCCGCCGC GGAGAGCGAC CCCCTGCTTC CGACCTCGCC 3780 GTACGCGGCG TCGAAGGCGG CCTCGGACCT CATGGCGCTC GCCCACCACC GCACCCACGG 3840 56 CCTGGACGTC CGGGTGACCC GCTGTTCGAA CAACTTCGGC CCCCACCAGC ATCCCGAGAA 3900 GCTCATACCG CGCTTCCTGA CCAGCCTCCT GTCCGGCGGC ACCGTTCCCC TCTACGGCGA 3960 CGGGCGGCAC GTGCGCGACT GGCTGCACGT CGACGACCAC GTCAGGGCCG TCGAACTCGT 4020 CCGCGTGTCG GGCCGGCCGG GAGAGATCTA CAACATCGGG GGCGGCACCT CGCTGCCCAA 4080 CCTGGAGCTC ACGCACCGGT TGCTCGCACT GTGCGGCGCG GGCCCGGAGC GCATCGTCCA 4140 CGTCGAGAAC CGCAAGGGGC ACGACCGGCG CTACGCGGTC GACCACAGCA AGATCACCGC 4200 GGAACTCGGT TACCGGCCGC GCACCGACTT CGCGACCGCG CTGGCCGACA CCGCGAAGTG 4260 GTACGAGCGG CACGAGGACT GGTGGCGTCC CCTGCTCGCC GCGACATGAC GTCGGGCCGG 4320 ACCGCAACCA CCGGCCCCGG CCGGCACACC GCCGCCCGCG GCCGGTGGCC GGCCGGTCAG 4380 CGTCCGTGAG CCGGGCGCCG GCCGCCCCGC GGGCCGGCGG CGGTGGACCC CCGGACCACC 4440 AGTTCCGGCA TGAAGACGAA TTCGGTGCGC GGCGGCGGCG TTCCGCTCAT CTCCTCCAGC 4500 AGTGCGTCCA CGGCGACCXG CCCCATCGCC TTGACGGGCT GTCTGATGGT GGTCAGGGGA 4560 GGGTCGGTGA AGGCCATGAG CGGCGAGTCG TCGAAGCCGA CCACCGAGAT GTCACCGGGA 4620 ACCGTGAGAC CCCGCCGGCG CGCGGCCCGC ACGGCGCCGA GGGCCATCAT GTCGCTGGCG 4680 CACATGACGG CGGTGCAGCC CAGGTCGATC AGCGCGGACG CGGCGGCCTG GCCCCCCTCC 4740 AGGGAGAACA GCGAGTGCTG CACGAGCTCC TCGGACTCCC GCGCCGACAC TCCCAGGTGC 4800 TCCCGCACGC CGGCCCGGAA CCCCTCGATC TTCCGCTGCA CCGGCACGAA GCGGGCGGGC 4860 CCGACGGCGA GGCCGACGCG CTCGTGCCCC AGCTCCGCCA GGTGCGCCAC GGCCAGGCGC 4920 ATCGCGGCCC GGTCGTCCGG GGAGACGAAG GGTGCCTCGA TCCGGGGCGA GAACCCGTTC 4980 ACGAGGACGA AGGGCACCTG CCGCTCGTGC AGCCGGCCGT ACCGTCCGGT CTCGGCGGTG 5040 GTGTCCGCGT GCAGTCCGGA GACGAAGATG ATGCCGGACA CCCCGCGGTC CACGAGCATC 5100 TCCGTGAGTT CGTC CTCGGT CGAGCCGCCC GGGGTCTGCG TGGCGAGCAC GGGCGTGTAG 5160 CCCTGACGCG TGAGCGCCTG CCCCATCACC TGGGCCAGTG CGGGGAAGAA GGGGTTGTCC 5220 AGTTCGGGGG TGACCAGTCC GACCAGCTCG GCGCGGCGCT GTCGCGCCGG CTGCTCGTAG 5280 CCCAGCGCGT CCAGTGCGGT CAGCACCGAG TCGCGGGTGC CGGTGGCCAC ACCGCGCGCA 5340 CCGTTCAGCA CCCGGCTGAC CGTGGCCTTG CTGACGCCCG CCCGGGCTGC GATGTCGGCG 5400 AGCCGCATGG TCATGGCAAC GCACTCTACC TGTCGGGGCG TCAGGGCGTG CCCACCGCGC 5460 GCGGAACCGG CGGACTGCGG GGCACGGCCC GTCCGCCGCC CACGGACCAC GCGCCCGAAA 5520 CGATGGCTGA AAATGCTTGC AGCAAATTGC CGCAACGTCT TTCGGCGGCT TTTCGATCCT 5580 GTTACGTTCC TGGCAACCCC GGCGCCGCGC AGAAGCGGTT GGCGTGAGGC GTCCAGACCT 5640 CCGCCCGATT CCGGGATCAC TCAGGGGAGT TCACAATGCG GCGTGGCATT GCGGCCACCG 5700 CGCTGTTCGC GGCTGTGGCC ATGACGGCAT CGGCGTGTGG CGGGGGCGAC AACGGCGGAA 5760 GCGGTACCGA CGCGGGCGGC ACGGAGCTGT CGGGGACCGT CACCTTCTGG GACACGTCCA 5820 ACGAAGCCGA GAAGGCGACG TACCAGGCCC TCGCGGAGGG CTTCGAGAAG GAGCACCCGA 5880 57 AGGTCGACGT CAAGTACGTC aacgtcccgt TCGGCGAGGC GAACGCCAAG TTCAAGAACG 5940 CCGCGGGCGG CAACTCCGGT GCCCCGGACG TGATGCGTAC GGAGGTCGCC TGGGTCGCGG 6000 ACTTCGCCAG CATCGGCTAC CTCGCCCCGC TCGACGGCAC GCCCGCCCTC GACGACGGGT 6060 CGGACCACCT TCCCCAGGGC GGCAGCACCA GGTACGAGGG GAAGACCTAC GCGGTCCCGC 6120 AGGTGATCGA CACCCTGGCG CTCTTCTACA ACAAGGAACT GCTGACGAAG GCCGGTGTCG 6180 AGGTGCCGGG CTCCCTCGCC GAGCTGAAGA CGGCCGCCGC CGAGATCACC GAGAAGACCG 6240 GCGCGAGCGG CCTCTACTGC GGGGCGACGA CCCGTACTTG GTTCCTGCCC TACCTCTACG 6300 GGGAGGGCGG CGACCTGGTC GACGAGAAGA ACAAGACCGT CACGGTCGAC GACGAAGCCG 6360 GTGTGCGCGC CTACCGCGTC ATCAAGGACC TCGTGGACAG CAAGGCGGCC ATCACCGACG 6420 CGTCCGACGG CTGGAACAAC ATGCAGAACG CCTTCAAGTC GGGCAAGGTC GCCATGATGG 6480 TCAACGGCCC CTGGGCCATC GAGGACGTCA AGGCGGGAGC CCGCTTCAAG GACGCCGGCA 6540 ACCTGGGGGT CGCCCCCGTC CCGGCCGGCA GTGCCGGACA GGGCTCTCCC CAGGGCGGGT 6600 GGAACCTCTC GGTGTACGCG GGCTCGAAGA ACCTCGACGC CTCCTACGCC TTCGTGAAGT 6660 ACATGA6CTC CGCCAAGGTG CAGCAGCAGA CCACCGAGAA GCTGAGCCTG CTGCCCACCC 6720 GCACGTCCGT CTACGAGGTC CCGTCCGTCG CGGACAACGA GATGGTGAAG TTCTTCAAGC 6780 CGGCCGTCGA CAAGGCCGTC GAACGGCCGT GGATCGCCGA GGGCAATGCC CTCTTCGAGC 6840 CGATCCGGCT GCAG 6854 (2) INFORMAÇÃO PARA A SEQ ID N°: 8: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 240 aminoácidos (B) TIPO: aminoácido (C) FORMA DA CADEIA: simples (D) TOPOLOGIA: linear (ii) TIPO DA MOLÉCULA: proteína (ix) CARACTERÍSTICAS:
(A) NOME/CHAVE: acbA (B) POSIÇÃO: 1..240 (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID N°: 8: 58
Vai 1 Ile Vai Ala Glu 5 His Leu Vai Lys Glu 10 Phe Arg Leu Ala Glu 15 Arg Glu Pro Gly Leu 20 Leu Gly Ser Leu Ser 25 Thr Leu Leu Thr Arg 30 Arg Tyr Arg Vai Vai 35 Arg Ala Vai Asp Asp 40 Vai Ser Phe Glu Ile 45 Pro Ala Gly Thr Lys 50 Thr Ala Tyr Ile Gly 55 Ala Asn Gly Ala Gly Lys Ser 60 Thr Thr lie €5 Lys Met Leu Thr Gly 70 Ile Met Thr Pro Thr 75 Ser Gly Arg Cys Thr 80 Vai Ala Gly Leu Glu 85 Pro Tyr Arg His Arg Gin Arg 90 Asn Ala Arg 95 Thr Ile Gly Vai Vai 100 Phe Gly Gin Arg Ser 105 Gin Leu Trp Trp Asp 110 Leu Ser Vai Pro Asp 115 Ser Phe Arg Ile Leu Arg Arg 120 Ile Tyr Asp 125 Ile Pro Gly Pro Vai 130 Tyr Arg Arg Asn Leu 135 Ala Leu Phe Arg Asp 140 Leu Leu Asp Ile Asp 145 Ala Leu Gly Ser Thr 150 Pro Vai Arg Gin Leu 155 Ser Leu Gly Gin Arg 160 Met Arg Ala Glu Ile 165 Ala Ala Ser Leu Leu 170 His Asp Pro Ala vai 175 Leu Phe Trp Asp Glu 180 Pro Thr Ile Gly Leu Asp 185 Met Vai Leu Lys 190 Asp Ala Vai Arg Arg 195 Leu Vai Asn Arg Ala 200 His Arg Glu Leu Gly Thr 205 Thr Vai vai Leu 210 Thr Ser His Asp Ile 215 Ala Asp Ile Ala Ala 220 Ile Cys Asp Ser Ala 225 Leu Vai Vai Asp Gin Gly Arg 230 Vai Vai His 235 Gin Gly Thr Leu Gin 240 (2) INFORMAÇÃO PARA A SEQ ID N°: 9: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 429 aminoácidos (B) TIPO: aminoácido (C) FORMA DA CADEIA: simples (D) TOPOLOGIA: linear (ii) TIPO DA MOLÉCULA: proteína 59 (ix) CARACTERÍSTICAS:
(A) NOME/CHAVE: acbB (B) POSIÇÃO: 1..429 (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID N°: 9:
Met 1 Thr Gly Leu Arg 5 Gin Thr Gin His Leu 10 Ala Arg Glu Ala Arg 15 His Leu Ala Pro Gly 20 Ala Ser Glu Glu Ala 25 Vai His Gly Arg Arg vai 30 Phe Ala Glu Gly 35 Arg Gly Pro Vai Leu 40 Thr Asp Leu Asp Gly Asn 45 Gin Tyr Leu Asp 50 Phe Ala Ala Gly Thr 55 Leu Thr Gin Ser Leu Gly His 60 Gly His Pro 65 Glu Vai Vai Glu Ala 70 Leu Thr Thr Gin Ala 75 Arg Arg Leu Trp Asn 80 Vai His Asp Ser Ala 65 Thr Pro Asp Arg Ala 90 Gly Leu Leu Glu Leu 95 Leu 60
Ala Arg Leu Leu 100 Pro Glu Gin Leu Gly Ala Glu Vai 115 Vai Glu Ala Ala 120 Ala Pro Gly Arg 130 Asn Arg Ile 135 Cys Lys 145 Thr Met Gly Ala Arg Met 150 Leu Ala Phe Ser Gly Asn Ser Vai 165 Leu Cys Pro Leu Gly 180 Leu Glu Tyr Pro Leu Vai Arg Arg 195 His Ile Ala Glu 200 Phe Glu 210 Pro Vai Leu Gly Ala 215 Ala Tyr 225 Trp Glu Arg Ile Ala Gly 230 Ala Vai Ala Asp Glu Vai Leu Thr 245 Gly Ala Ser Glu Leu 260 Phe Gly Ile Glu Gly Thr Ala Ser 275 Gly Phe Pro Phe 280 Ala Ala 290 Gin Ala Gly Gly Gly 295 His Ala 305 Ser Asn Pro Leu Gly Ile 310 Ala Vai Glu Arg Asp Arg Leu Ile 325 Asp Ile Gin Glu Arg 340 Leu Arg Ala Leu Gin Vai Arg Gly 355 Leu Gly Leu Leu 360 Ala Vai 370 Gly Arg Ala Pro Ala 375 Pro Thr 385 Ala Leu Asp Leu Gly Leu 390 Arg Arg Leu Ala Pro Pro Phe Thr 405 Leu Leu Arg Leu Leu 420 Glu Thr Ala Vai
Asp Thr Tyr Ala Phe Phe Ser Thr 105 110
Leu Arg Vai Vai Gin Ala Thr Ala 125
Ala Leu Arg His Gly Phe His Gly 140
Vai His Trp Asp Ile Gly His Gin 155 160
Ala Thr Ala Pro Thr Gly Tyr Arg 170 175
Ser Cys Asp Vai Arg Cys Ala Thr 185 190
Lys Pro Asn Vai Ser Ala Leu Vai 205
Gly Vai Ile Vai Pro Pro Pro Gly 220
Cys Arg Asp Gly Gly Vai Leu Leu 235 240
Gly Gly Arg Thr Gly Ala Phe Leu 250 255
Pro Asp Leu Ala Met Leu Ser Lys 265 270
Ala Vai Leu Ala Gly Arg Ala Glu 285
Pro Gly Ala Tyr Ala Ser Thr Tyr 300
Ala Ala Arg Ala Thr Leu Glu Vai 315 320
Arg Vai Arg Vai Leu Gly Glu Leu 330 335
Glu Ser Arg Phe Pro Gin Leu Gly 345 350
Trp Gly Leu Glu Phe Vai Thr Asp 365
Glu Thr Ala Arg Ala Vai Tyr Thr 380
Thr Ser Leu Gly Gly His Ile Leu 395 400
Asp Glu Ala Leu Leu Asp Glu Gly 410 415
Glu Arg Vai Ile Ala 425 61 (2) INFORMAÇÃO PARA A SEQ ID N°: 10: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 355 aminoácidos (B) TIPO: aminoácido (C) FORMA DA CADEIA: simples (D) TOPOLOGIA: linear (ii) TIPO DA MOLÉCULA: proteína (ix) CARACTERÍSTICAS:
(A) NOME/CHAVE: acbC (B) POSIÇÃO: 1..355 (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID N°: 10 62
Val Lya 1 Ala Leu Val 5 Leu Ala Gly Gly Thr 10 Gly Ser Arg Leu Arg 15 Pro Phe Thr His Thr 20 Ala Ala Lys Gin Leu 25 Leu Pro Ile Ala Asn Lys 30 Pro Val Leu Phe 35 Tyr Ala Leu Glu Ser 40 Leu Ala Ala Ala Gly 45 Val Arg Glu Ala Gly 50 Val Val Val Gly Ala 55 Tyr Gly Arg Glu Ile 60 Arg Glu Leu Thr Gly Asp 65 Gly Thr Ala Phe 70 Gly Leu Arg Ile Thr 75 Tyr Leu His Gin Pro 80 Arg Pro Leu Gly Leu 85 Ala His Ala Val Arg 90 ile Ala Arg Gly Phe 95 Leu Gly Asp Asp Asp 100 Phe Leu Leu Tyr Leu 105 Gly Asp Asn Tyr Leu Pro 110 Gin Gly Val Thr 115 Asp Phe Ala Arg Gin 120 Ser Ala Ala Asp Pro 125 Ala Ala Ala Arg Leu 130 Leu Leu Thr Pro Val 135 Ala Asp Pro Ser Ala 140 Phe Gly Val Ala Glu Val 145 Asp Ala Asp Gly 150 Asn Val Leu Arg Leu 155 Glu Glu Lys Pro Asp 160 Val Pro Arg Ser Ser 165 Leu Ala Leu Ile Gly 170 Val Tyr Ala Phe Ser 175 Pro Ala Val His Glu 180 Ala Val Arg Ala Ile 185 Thr Pro Ser Ala Arg Gly 190 Glu Leu Glu Ile 195 Thr His Ala Val Gin 200 Trp Met Ile Asp Arg 205 Gly Leu Arg Val Arg 210 Ala Glu Thr Thr Thr 215 Arg Pro Trp Arg Asp 220 Thr Gly Ser Ala Glu Asp 225 Met Leu Glu Val 230 Asn Arg HiS Val Leu 235 Asp Gly Leu Glu Gly 240 Arg Ile Glu Gly Lys 24 5 Val Asp Ala His Ser 250 Thr Leu Val Gly Arg 255 Val
Arg Val Ala Glu 260 Gly Ala Ile Val Arg 265 Gly Ser His Val Val 270 Gly Pro Val Val Ile 275 Gly Ala Gly Ala Val 280 Val Ser Asn Ser Ser 285 Val Gly Pro Tyr Thr 290 Ser Ile Gly Glu Asp Cys 295 Arg Val Glu Asp 300 Ser Ala Ile Glu Tyr 305 Ser Val Leu Leu Arg Gly Ala 310 Gin Val Glu 315 Gly Ala Ser Arg Ile 320 Glu Ala Ser Leu Ile Gly Arg Gly 325 Ala Val Val 330 Gly Pro Ala Pro 335 Arg Leu Pro Gin Ala 340 His Arg Leu Val Ile 345 Gly Asp His Ser Lys 350 Val Tyr
Leu Thr Pro 355 63 (2) INFORMAÇÃO PARA A SEQ ID N°: 11: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 325 aminoácidos (B) TIPO: aminoácido (C) FORMA DA CADEIA: simples (D) TOPOLOGIA: linear (ii) TIPO DA MOLÉCULA: proteina (ix) CARACTERÍSTICAS:
(A) NOME/CHAVE: acbD (B) POSIÇÃO: 1..325 (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID N°: 11:
Met 1 Thr Thr Thr lie 5 Leu Vai Thr Gly Gly Ala 10 Gly Phe Ile Arg 15 Ser Ala Tyr Vai Arg 20 Arg Leu Leu Ser Pro Gly Ala 25 Pro Gly Gly Vai 30 Ala Vai Thr Vai 35 Leu Asp Lys Leu Thr Tyr Ala Gly 40 Ser Leu 45 Ala Arg Leu His Ala 50 Vai Arg Asp His Pro Gly 55 Leu Thr Phe Vai 60 Gin Gly Asp Vai Cys Asp £5 Thr Ala Leu Vai 70 Asp Thr Leu Ala Ala 75 Arg His Asp Asp Ile 80 Vai Hls Phe Ala Ala 85 Glu Ser His Vai Asp Arg 90 Ser Ile Thr Asp 95 Ser Gly Ala Phe Thr 100 Arg Thr Asn Vai Leu Gly Thr Gin Vai 105 Leu Leu 110 Asp Ala Ala Leu Arg 115 His Gly Vai Arg 120 Thr Phe Vai His Vai 125 Ser Thr Asp Glu Vai 130 Tyr Gly Ser Leu Pro 135 His Gly Ala Ala Ala 140 Glu Ser Asp Pro 64
Leu 145 Leu Pro Thr Ser Pro 150 Tyr Ala Ala Ser Lys 155 Ala Ala Ser Asp Leu 160 Met Ala Leu Ala His 165 His Arg Thr His Gly Leu 170 Asp Vai Arg Val 175 Thr Arg Cys Ser Asn 180 Asn Phe Gly Pro His 185 Gin His Pro Glu Lys 190 Leu Ile Pro Arg Phe 195 Leu Thr Ser Leu Leu 200 Ser Gly Gly Thr Vai 205 Pro Leu Tyr Gly Asp Gly 210 Arg His Vai Arg 215 Asp Trp Leu His Vai 220 Asp Asp His Val Arg 225 Ala Vai Glu Leu Vai 230 Arg Vai Ser Gly Arg 235 Pro Gly Glu Ile Tyr 240 Asn Xle Gly Gly Gly 245 Thr Ser Leu Pro Asn Leu 250 Glu Leu Thr His 255 Arg Leu Leu Ala Leu 260 Cys Gly Ala Gly Pro 265 Glu Arg Zle val His 270 Val Glu Asn Arg Lys 275 Gly His Asp Arg Arg 280 Tyr Ala Vai Asp His 285 Ser Lys Ile Thr Ala 290 Glu Leu Gly Tyr Arg 295 Pro Arg Thr Asp Phe 300 Ala Thr Ala Leu Ala 305 Asp Thr Ala Lys Trp 310 Tyr Glu Arg His Glu 315 Asp Trp Trp Arg Pro 320
Leu Leu Ala Ala Thr 325 (2) INFORMAÇÃO DA SEQ ID N°: 12: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 345 aminoácidos (B) TIPO: aminoácido (C) FORMA DA CADEIA: simples (D) TOPOLOGIA: linear (ii) TIPO DA MOLÉCULA: proteína (ix) CARACTERÍSTICAS:
(A) NOME/CHAVE: acbE (B) POSIÇÃO: 1..345 (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID N°: 12: 65
Met Thr Met Arg Leu Ala Asp Ile Ala Ala Arg Ala Gly Vai Ser Lys 15 10 15
Ala Thr Vai Ser Arg Vai Leu Asn Gly Ala Arg Gly Vai Ala Thr Gly 20 25 30
Thr Arg Asp Ser Vai Leu Thr Ala Leu Asp Ala Leu Gly Tyr Glu Gin 35 40 45
Pro Ala Arg Gin Arg Arg Ala Glu Leu Vai Gly Leu Vai Thr Pro Glu 50 55 60 66
Leu Asp Asn Pro Phe Phe Pro Ala 65 70
Leu Thr Arg Gin Gly Tyr Thr Pro 85
Gly Ser Thr Glu Asp Glu Leu Thr 100
Ser Gly Ile Ile Phe Vai Ser Gly 115 120
Thr Gly Arg Tyr Gly Arg Leu His 130 135
Vai Asn Gly Phe Ser Pro Arg Ile 145 150
Asp Arg Ala Ala Met Arg Leu Ala 165
His Glu Arg Vai Gly Leu Ala Vai 180
Gin Arg Lys Ile Glu Gly Phe Arg 195 200
Vai Ser Ala Arg Glu Ser Glu Glu 210 215
Leu Glu Gly Gly Gin Ala Ala Ala 225 230
Thr Ala Vai Met Cys Ala Ser Asp 245
Ala Ala Arg Arg Arg Gly Leu Thr 260
Gly Phe Asp Asp Ser Pro Leu Met 275 280
Thr IIe Arg Gin Pro Vai Lys Ala 290 295
Leu Leu Glu Glu Met Ser Gly Thr 305 310
Phe Met Pro Glu Leu Vai Vai Arg 325
Gly Gly Arg Arg Pro Ala His Gly 340
Leu Ala Gin Vai Met Gly Gin Ala 75 80
Vai Leu Ala Thr Gin Thr Pro Gly 90 95
Glu Met Leu Vai Asp Arg Gly Vai 105 110
Leu His Ala Asp Thr Thr Ala Glu 125
Glu Arg Gin Vai Pro Phe Vai Leu 140
Glu Ala Pro Phe Vai Ser Pro Asp 155 160
Vai Ala His Leu Ala Glu Leu Gly 170 175
Gly Pro Ala Arg Phe Vai Pro Vai 185 190
Ala Gly Vai Arg Glu His Leu Gly 205
Leu Vai Gin His Ser Leu Phe Ser 220
Ser Ala Leu lie Asp Leu Gly Cys 235 240
Met Met Ala Leu Gly Ala Vai Arg 250 255
Vai Pro Gly Asp Ile Ser Vai Vai 265 270
Ala Phe Thr Asp Pro Pro Leu Thr 285
Met Gly Gin Vai Ala Vai Asp Ala 300
Pro Pro Pro Arg Thr Glu Phe Vai 315 320
Gly Ser Thr Ala Ala Gly Pro Arg 330 335
Arg 345 67 (2) INFORMAÇÃO PARA A SEQ ID N°: 13: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 393 aminoácidos (B) TIPO: aminoácido (C) FORMA DA CADEIA: simples (D) TOPOLOGIA: linear (ii) TIPO DA MOLÉCULA: proteína (ix) CARACTERÍSTICAS:
(A) NOME/CHAVE: acbF (B) POSIÇÃO: 1..393 (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID N°: 13 68
Met Arg 1 Arg Gly Ile 5 Ala Ala Thr Ala Leu 10 Phe Ala Ala Vai Ala 15 Met Thr Ala Ser Ala 20 Cys Gly Gly Gly Asp Asn Gly Gly 25 Ser Gly Thr 30 Asp Ala Gly Gly 35 Thr Glu Leu Ser Gly 40 Thr Vai Thr Phe Trp Asp 45 Thr Ser Asn Glu 50 Ala Glu Lys Ala Thr 55 Tyr Gin Ala Leu Ala 60 Glu Gly Phe Glu Lys 65 Glu His Pro Lys Vai 70 Asp Vai Lys Tyr vai 75 Asn Vai Pro Phe Gly 80 Glu Ala Asn Ala Lys 85 Phe Lys Asn Ala Ala Gly Gly Asn 90 Ser Gly Ala 95 Pro Asp Vai Met 100 Arg Thr Glu Vai Ala 105 Trp Vai Ala Asp Phe 110 Ala Ser Ile Gly Tyr 115 Leu Ala Pro Leu Asp 120 Gly Thr Pro Ala Leu Asp Asp Gly 125 Ser Asp 130 His Leu Pro Gin Gly 135 Gly Ser Thr Arg Tyr Glu Gly 140 Lys Thr Tyr 145 Ala Vai Pro Gin Vai 150 Ile Asp Thr Leu Ala 155 Leu Phe Tyr Asn Lys 160 Glu Leu Leu Thr Lys 165 Ala Gly Vai Glu Vai 170 Pro Gly Ser Leu Ala 175 Glu Leu Lys Thr Ala 180 Ala Ala Glu Ile Thr 185 Glu Lys Thr Gly Ala 190 Ser Gly Leu Tyr Cys 195 Gly Ala Thr Thr Arg 200 Thr Trp Phe Leu Pro 205 Tyr Leu Tyr Gly Glu 210 Gly Gly Asp Leu Vai 215 Asp Glu Lys Asn Lys 220 Thr Vai Thr Vai Asp Asp 225 Glu Ala Gly Vai 230 Arg Ala Tyr Arg Vai 235 Ile Lys Asp Leu Vai 240 Asp Ser Lys Ala Ala 245 Ile Thr Asp Ala Ser Asp Gly Trp 250 Asn Asn 255 Met Gin Asn Ala Phe 260 Lys Ser Gly Lys Vai 265 Ala Met Met Vai Asn Gly 270 Pro Trp Ala ile 275 Glu Asp Vai Lys Ala 280 Gly Ala Arg Phe Lys 285 Asp Ala Gly Asn Leu 290 Gly Vai Ala Pro Vai 295 Pro Ala Gly Ser Ala 300 Gly Gin Gly Ser Pro 305 Gin Gly Gly Trp Asn 310 Leu Ser Vai Tyr Ala 315 Gly Ser Lys Asn Leu 320 69
Asp Ala Ser Tyr Ala 325 Phe Val Lys Tyr Met 330 Ser Ser Ala Lys Val 335 Gin Gin Gin Thr Thr 340 Glu Lys Leu Ser Leu 345 Leu Pro Thr Arg Thr 350 Ser Val Tyr Glu Vai 355 Pro Ser Val Ala Asp Asn 360 Glu Met Val Lys 365 Phe Phe Lys Pro Ala 370 Val Asp Lys Ala Val 375 Glu Arg Pro Trp Ile 380 Ala Glu Gly Asn Ala Leu 385 Phe Glu Pro Ile 390 Arg Leu Gin
Lisboa, 12 de Janeiro de 2007 70

Claims (40)

  1. REIVINDICAÇÕES 1. Molécula de ADN contendo os genes para a biossíntese de acarbose, caracterizada por (a) conter uma sequência de ADN de acordo com a tabela 4; ou (b) conter uma sequência de ADN que tem a capacidade de hibridar, sob condições estringentes, com a molécula de ADN de acordo com (a) ou (c) conter uma sequência de ADN que é diferente das moléculas de ADN de acordo com (a) e (b) devido à degenerabilidade do código genético, mas que possibilita a expressão das proteínas que podem ser correspondentemente expressas com as moléculas de ADN de acordo com (a) e (b) .
  2. 2. Molécula de ADN de acordo com a reivindicação 1, caracterizada por conter, como a sequência indicada em (a), a sequência de ADN dos nucleótidos 1 até 720 (gene acbA) segundo a tabela 4.
  3. 3. Molécula de ADN de acordo com a reivindicação 1, caracterizada por conter, como a sequência indicada em (a), a sequência de ADN dos nucleótidos 720 até 2006 (gene acbB) segundo a tabela 4.
  4. 4. Molécula de ADN de acordo com a reivindicação 1, caracterizada por conter, como a sequência indicada em (a), a sequência de ADN dos nucleótidos 2268 até 3332 (gene acbC) segundo a tabela 4. 1
  5. 5. Molécula de ADN de acordo com a reivindicação 1, caracterizada por conter, como a sequência indicada em (a), a sequência de ADN dos nucleótidos 3332 até 4306 (gene acbD) segundo a tabela 4.
  6. 6. Molécula de ADN de acordo com a reivindicação 1, caracterizada por conter, como a sequência indicada em (a), a sequência de ADN dos nucleótidos 4380 até 5414 (gene acbE) segundo a tabela 4.
  7. 7. Molécula de ADN de acordo com a reivindicação 1, caracterizada por conter, como a sequência indicada em (a), a sequência de ADN dos nucleótidos 567 6 até 6854 (gene acbF) segundo a tabela 4.
  8. 8. Iniciador oligonucleotídico para a amplificação por PCR da molécula de ADN de acordo com a reivindicação 1.
  9. 9. Vector contendo uma molécula de ADN de acordo com uma ou várias das reivindicações 1 até 8.
  10. 10. Vector de acordo com a reivindicação 9 para a utilização num processo para a inactivação ou alteração de genes naturais de biossintese de acarbose num microrganismo produtor de acarbose.
  11. 11. Vector de acordo com a reivindicação 10, caracterizado por ser seleccionado do grupo contendo pGM160 ou vectores aparentados. 2
  12. 12. Vector de acordo com a reivindicação 9, caracterizado por ser um vector de expressão e a dita molécula de ADN estar ligada operativamente com uma sequência de promotor
  13. 13. Vector de acordo com a reivindicação 12, adequado para a expressão em organismos hospedeiros, seleccionados do grupo constituído por E. coli, Bacillus subtilis, estirpes de Streptomyces, Actinoplanes, Ampullariella, Streptosporangium, Streptomyces hygroscopicus var. limoneus, Streptomyces glaucescens, bem como Aspergillus niger, Penicillium chrysogenum e Saccharomyces cerevisiae.
  14. 14. Vector de acordo com a reivindicação 12, adequado para a expressão em Streptomyces glaucescens (DSM 40716) ou Actinoplanes sp..
  15. 15. Célula hospedeira transformada com um vector de acordo com qualquer uma das reivindicaçãoes 9 até 14.
  16. 16. Célula hospedeira de acordo com a reivindicação 15, caracterizada por ser seleccionada do grupo constituído por E. coli, Bacillus subtilis, estirpes de Streptomyces, Actinoplanes, Ampullariella, Streptosporangium, Streptomyces hygroscopicus var. limoneus, Streptomyces glaucescens, bem como Aspergillus niger, Penicillium chrysogenum e Saccharomyces cerevisiae.
  17. 17. Célula hospedeira de acordo com a reivindicação 16, caracterizada por ser seleccionada do grupo constituído por Streptomyces glaucescens (DSM 40716) e Actinoplanes sp.. 3
  18. 18. Proteína (produto do gene acordo com a reivindicação
  19. 19. Proteína (produto do gene acordo com a reivindicação
  20. 20. Proteína (produto do gene acordo com a reivindicação
  21. 21. Proteína (produto do gene acordo com a reivindicação
  22. 22. Proteína (produto do gene acordo com a reivindicação
  23. 23. Proteína (produto do gene acordo com a reivindicação acbA) , codificada por um ADN de 2. acbB) , codificada por um ADN de 3. acbC) , codificada por um ADN de 4. acbD) , codificada por um ADN de 5. acbE) , codificada por um ADN de 6. acbF) , codificada por um ADN de 7 .
  24. 24. Processo para a obtenção das proteínas segundo qualquer uma das reivindicações 18 até 23, caracterizado por (a) as proteínas serem expressas numa célula hospedeira adequada e (b) isoladas.
  25. 25. Processo de acordo com a reivindicação 24, caracterizado por a célula hospedeira ser seleccionada do grupo constituído por E. coli, Bacillus subtilis, estirpes de Streptomyces, Actinoplanes, Ampullariella, Streptosporangium, Streptomyces hygroscopicus var. limoneus, Streptomyces glaucescens, bem como Aspergillus niger, Penicillium chrysogenum e Saccharomyces cerevisiae. 4
  26. 26. Processo de acordo com a reivindicação 24, caracterizado por a célula hospedeira ser seleccionada do grupo constituído por Streptomyces glaucescens (DSM 40716) e Actinoplanes sp..
  27. 27. Processo para a preparação de acarbose, caracterizado por (a) um ou vários genes de acordo com uma ou várias das reivindicações 2 até 7 serem utilizados para a expressão numa célula hospedeira adequada e (b) a acarbose ser isolada a partir de sobrenadantes de cultura da dita célula hospedeira.
  28. 28. Processo para a preparação de acarbose de acordo com a reivindicação 27, caracterizado por as células hospedeiras serem seleccionadas de acordo com qualquer uma das reivindicações 16 ou 17.
  29. 29. Processo para a preparação de acarbose, caracterizado por (a) um ou vários genes de acordo com uma ou várias das reivindicações 2 até 7 serem inactivados numa célula hospedeira produtora natural de acarbose e (b) a acarbose ser isolada da dita célula hospedeira.
  30. 30. Processo para a preparação de acarbose de acordo com a reivindicação 29, caracterizado por as células hospedeiras serem seleccionadas de acordo com a reivindicação 17.
  31. 31. Processo para a preparação de acarbose, caracterizado por um processo segundo qualquer uma das reivindicações 27 até 5 28 ser combinado com um processo segundo qualquer uma das reivindicações 29 até 30.
  32. 32. Processo para completar o agrupamento de genes para a biossintese de acarbose de acordo com a reivindicação 1, caracterizado por (a) serem isoladas regiões genómicas de ADN adjacentes, por meio de processos de hibridação, sob utilização de sondas de hibridação, que hibridam, sob condições estringentes, com a molécula de ADN de acordo com a reivindicação 1 e (b) sequenciadas.
  33. 33. Processo para completar o agrupamento de genes para a biossintese de acarbose de acordo com a reivindicação 1, caracterizado por (a) serem isoladas regiões genómicas de ADN adjacentes por meio de PCR, sob utilização de iniciadores para PCR, que hibridam, sob condições estringentes, com sequências de ADN da molécula de ADN de acordo com a reivindicação 1 e iniciador com uma sequência que permite a hibridação a sequências do sistema de vector utilizado e (b) sequenciadas.
  34. 34. Processo para o isolamento de um agrupamento de genes para a biossintese de acarbose e pseudo-oligossacáridos homólogos a partir de microrganismos produtores de acarbose que são diferentes de Streptomyces glaucescens (DSM 40716), caracterizado por 6 (a) serem preparadas amostras de hibridação que hibridam, sob condições estringentes, com a molécula de ADN recombinante de acordo com a reivindicação 1, (b) estas amostras de hibridação serem empregues para o rastreio genómico ou de ADNc de bibliotecas de ADN, obtidas do microrganismo correspondente, e (c) os clones encontrados serem isolados e caracterizados.
  35. 35. Processo para o isolamento de um agrupamento de genes para a biossintese de acarbose e pseudo-oligossacáridos homólogos a partir de microrganismos produtores de acarbose que são diferentes de Streptomyces glaucescens (DSM 40716), caracterizado por (a) serem preparados iniciadores para PCR que hibridam, sob condições estringentes, com a molécula de ADN recombinante de acordo com a reivindicação 1, (b) estes iniciadores para PCR serem utilizados para a acumulação de fragmentos de ADN de ADN genómico ou ADNc de um microrganismo correspondente, (c) os fragmentos acumulados serem isolados e caracterizados e (d) serem eventualmente empregues para um processo de acordo com a reivindicação 34.
  36. 36. Processo de acordo com qualquer uma das reivindicações 34 ou 35, caracterizado por os microrganismos serem seleccionados do grupo constituído por actinomicetales, estirpes de Streptomyces, Actinoplanes, Ampullariella, Streptosporangium, Streptomyces hygroscopicus var. limoneus, Streptomyces glaucescens. 7
  37. 37. Processo de acordo com a reivindicação 36, caracterizado por os microrganismos serem seleccionados em particular do grupo constituído por Streptomyces glaucescens (DSM 40716) e Actinoplanes sp..
  38. 38. Utilização de Streptomyces glaucescens (DSM 40716) para a obtenção de acarbose.
  39. 39. Processo para a alteração da expressão génica de genes endógenos de biossíntese de acarbose de modo a obter um rendimento de acarbose melhorado, em que (a) são introduzidas mutações em um ou vários dos respectivos promotores de genes e (b) o rendimento de acarbose da estirpe produtora assim obtida ser comparado com a estirpe de partida.
  40. 40. Processo de acordo com a reivindicação 39, caracterizado por, no caso das mutações, se tratar de a) transições b) delecções e/ou c) adições. Lisboa, 12 de Janeiro de 2007 8
PT97927087T 1996-06-07 1997-05-30 Isolamento dos genes de biossíntese para pseudo-oligossacáridos a partir de streptomyces glaucescens gla.o e sua utilização PT915981E (pt)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
DE19622783A DE19622783A1 (de) 1996-06-07 1996-06-07 Isolierung der Biosynthesegene für Pseudo-Oligosaccharide aus Streptomyces glaucescens GLA.O und ihre Verwendung

Publications (1)

Publication Number Publication Date
PT915981E true PT915981E (pt) 2007-02-28

Family

ID=7796342

Family Applications (1)

Application Number Title Priority Date Filing Date
PT97927087T PT915981E (pt) 1996-06-07 1997-05-30 Isolamento dos genes de biossíntese para pseudo-oligossacáridos a partir de streptomyces glaucescens gla.o e sua utilização

Country Status (13)

Country Link
US (2) US6306627B1 (pt)
EP (1) EP0915981B1 (pt)
JP (1) JP2001507923A (pt)
CN (1) CN1263855C (pt)
AT (1) ATE346936T1 (pt)
AU (1) AU728870B2 (pt)
BR (1) BR9709658A (pt)
CA (1) CA2257111A1 (pt)
DE (2) DE19622783A1 (pt)
DK (1) DK0915981T3 (pt)
ES (1) ES2276427T3 (pt)
PT (1) PT915981E (pt)
WO (1) WO1997047748A1 (pt)

Families Citing this family (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0796915A3 (de) * 1996-03-22 1999-04-14 Bayer Ag Verfahren zur Herstellung sowie zur Verwendung von Acarviosyl-Transferase bei der Umwandlung von Acarbose-Homologen in Acarbose, zur Herstellung von Acarbose-Homologen
DE19708127A1 (de) * 1997-02-28 1998-09-03 Bayer Ag Acarbose acb-Cluster: Isolierung von weiteren Genen der Acarbose Biosynthese und des Acarbose-Stoffwechsels aus Actinoplanes sp. SE 50/110 sowie deren Verwendung
KR100761340B1 (ko) 2005-02-28 2007-10-09 명지대학교 산학협력단 발리다마이신 생합성 유전자군의 염기서열, 이를 이용한알파-글루코시데이즈 억제물질 생산 균주의 제조 및알파-글루코시데이즈 억제물질의 대량생산방법
RU2015151857A (ru) 2008-12-02 2019-01-15 Уэйв Лайф Сайенсес Джапан, Инк. Способ синтеза модифицированных по атому фосфора нуклеиновых кислот
AU2010270714B2 (en) 2009-07-06 2015-08-13 Wave Life Sciences Ltd. Novel nucleic acid prodrugs and methods use thereof
DK2620428T3 (da) 2010-09-24 2019-07-01 Wave Life Sciences Ltd Asymmetrisk hjælpegruppe
CN107365339A (zh) 2011-07-19 2017-11-21 波涛生命科学有限公司 合成官能化核酸的方法
CA2879023C (en) 2012-07-13 2017-03-28 Wave Life Sciences Japan Asymmetric auxiliary group
AU2013287630B2 (en) 2012-07-13 2017-05-25 Shin Nippon Biomedical Laboratories, Ltd. Chiral nucleic acid adjuvant
CN104661664B (zh) 2012-07-13 2020-07-03 波涛生命科学有限公司 手性控制
JPWO2015108048A1 (ja) 2014-01-15 2017-03-23 株式会社新日本科学 抗腫瘍作用を有するキラル核酸アジュバンド及び抗腫瘍剤
JPWO2015108046A1 (ja) 2014-01-15 2017-03-23 株式会社新日本科学 抗アレルギー作用を有するキラル核酸アジュバンド及び抗アレルギー剤
EP3095461A4 (en) 2014-01-15 2017-08-23 Shin Nippon Biomedical Laboratories, Ltd. Chiral nucleic acid adjuvant having immunity induction activity, and immunity induction activator
KR20230152178A (ko) 2014-01-16 2023-11-02 웨이브 라이프 사이언시스 리미티드 키랄 디자인
CN111187746B (zh) * 2018-11-15 2022-11-22 上海医药工业研究院 一种基因工程菌及其制备方法和应用

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE730029C (de) 1938-06-28 1943-01-06 Wilhelm O P Rieck G M B H Vorrichtung zum Verschliessen von Flaschen o. dgl.
DE2209834C3 (de) 1972-03-01 1978-04-20 Bayer Ag, 5090 Leverkusen Herstellung von Saccharase-Inhibitoren
DE19507214A1 (de) * 1995-03-02 1996-10-31 Bayer Ag Acarbose-Biosynthesegene aus Actinoplanes sp., Verfahren zu ihrer Isolierung sowie ihre Verwendung

Also Published As

Publication number Publication date
CN1223687A (zh) 1999-07-21
CN1263855C (zh) 2006-07-12
DE19622783A1 (de) 1997-12-11
WO1997047748A1 (de) 1997-12-18
DK0915981T3 (da) 2007-03-26
EP0915981A1 (de) 1999-05-19
DE59712773D1 (de) 2007-01-11
US6306627B1 (en) 2001-10-23
US6825013B2 (en) 2004-11-30
ATE346936T1 (de) 2006-12-15
EP0915981B1 (de) 2006-11-29
BR9709658A (pt) 1999-08-10
AU3170197A (en) 1998-01-07
US20020192793A1 (en) 2002-12-19
ES2276427T3 (es) 2007-06-16
JP2001507923A (ja) 2001-06-19
CA2257111A1 (en) 1997-12-18
AU728870B2 (en) 2001-01-18

Similar Documents

Publication Publication Date Title
Floriano et al. afsR is a pleiotropic but conditionally required regulatory gene for antibiotic production in Streptomyces coelicolor A3 (2)
Gandecha et al. Analysis of four tylosin biosynthetic genes from the tylLM region of the Streptomyces fradiae genome
EP2342335B1 (en) Novel gene cluster
PT915981E (pt) Isolamento dos genes de biossíntese para pseudo-oligossacáridos a partir de streptomyces glaucescens gla.o e sua utilização
US7381546B2 (en) Polyketides and their synthesis and use
Koběrská et al. Sequence analysis and heterologous expression of the lincomycin biosynthetic cluster of the type strain Streptomyces lincolnensis ATCC 25466
US20170081690A1 (en) Moenomycin biosynthesis-related compositions and methods of use thereof
WO1999005283A2 (fr) Genes de biosynthese et de transfert des 6-desoxyhexoses chez saccharopolyspora erythraea et chez streptomyces antibioticus et leur utilisation
TW589377B (en) Cloning of DNA for 5S clavams biosynthesis and the use thereof
KR20000075777A (ko) 악티노플라네스 종 se50/110 유래의 아카보스 (acb) 클러스터
US7217511B2 (en) Methods of increasing antibiotic production in Streptomyces by deletion of the scbA gene
HUT76092A (en) Genes encoding branched-chain alpha-ketoacid dehydrogenase complex from streptomyces avermitilis
US5989882A (en) Processes for preparing acarviosyl transferase and for using it in the conversion of acarbose homologues into acarbose, for the preparation of acarbose homologues
Pérez-González et al. Cloning and characterization of the gene encoding a blasticidin S acetyltransferase from Streptoverticillum sp.
JPH08256781A (ja) アクチノプラーネス種からのアカルボース生合成遺伝子、それらの単離法、及びそれらの利用
JP2003518387A (ja) 遺伝子発現に関する方法および材料
KR20000016470A (ko) 스트렙토마이세스 글라우체센스 지엘에이.오로부터 슈도-올리고사카라이드 생합성용 유전자의 분리 방법 및 이의 용도
JP2009502187A (ja) チオコラリンの生合成に関与する遺伝子およびその異種産生
Ogasawara et al. Organization of genes and regulatory sequences in the origin region of the Bacillus subtilis chromosome: remarkable homology with Escherichia coli
FR2786200A1 (fr) Genes de biosynthese et de transfert des 6-desoxy-hexoses chez saccharopolyspora erythraea et chez streptomyces antibioticus et leur utilisation
Pérez-González et al. Cloning and characterization of the gene encoding a blastieidin S acetyltnnfm from Streptoverticillum sp.
FR2786201A1 (fr) Genes de biosynthese et de transfert des 6-desoxy-hexoses chez saccharopolyspora erythraea et chez streptomyces antibioticus et leur utilisation
FR2786189A1 (fr) Genes de biosynthese et de transfert des 6-desoxy-hexoses chez saccharopolyspora erythraea et chez streptomyces antibioticus et leur utilisation
FR2766496A1 (fr) Genes de biosynthese et de transfert des 6-desoxyhexoses chez saccharopolyspora erythraea et leur utilisation
CA2322241A1 (en) Antibiotic production