JP2005514067A - Compositions, methods and systems for finding lipopeptides - Google Patents

Compositions, methods and systems for finding lipopeptides Download PDF

Info

Publication number
JP2005514067A
JP2005514067A JP2003560212A JP2003560212A JP2005514067A JP 2005514067 A JP2005514067 A JP 2005514067A JP 2003560212 A JP2003560212 A JP 2003560212A JP 2003560212 A JP2003560212 A JP 2003560212A JP 2005514067 A JP2005514067 A JP 2005514067A
Authority
JP
Japan
Prior art keywords
sequence
polypeptide
seq
acyl
polynucleotide
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2003560212A
Other languages
Japanese (ja)
Inventor
クリス エム ファーネット
アルフレド スタッファ
エマヌエル ザゾプロス
Original Assignee
エコピア バイオサイエンシーズ インク
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by エコピア バイオサイエンシーズ インク filed Critical エコピア バイオサイエンシーズ インク
Publication of JP2005514067A publication Critical patent/JP2005514067A/en
Pending legal-status Critical Current

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/52Genes encoding for enzymes or proenzymes
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/195Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria
    • C07K14/36Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria from Actinomyces; from Streptomyces (G)

Landscapes

  • Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Engineering & Computer Science (AREA)
  • Biomedical Technology (AREA)
  • Molecular Biology (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • Biochemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Health & Medical Sciences (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Biophysics (AREA)
  • Physics & Mathematics (AREA)
  • Microbiology (AREA)
  • Plant Pathology (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Medicinal Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Peptides Or Proteins (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Enzymes And Modification Thereof (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)

Abstract

本発明は、リポペプチド生合成に関与する単離されたポリペプチド、及びかかるポリペプチドをコードするポリヌクレオチドに関する。詳しくは、単離されたポリペプチドは、アシル特異的Cドメイン、アデニル化酵素、又はアシルキャリアであり得る。さらに、本発明は、リポペプチド生合成に関与するポリペプチド、又はかかるポリペプチドをコードするポリヌクレオチドを検出する方法、並びに関連する有用なコンピュータ解読可能媒体及びコンピュータシステムに関する。  The present invention relates to isolated polypeptides involved in lipopeptide biosynthesis and polynucleotides encoding such polypeptides. Specifically, the isolated polypeptide can be an acyl-specific C domain, an adenylating enzyme, or an acyl carrier. The invention further relates to methods for detecting polypeptides involved in lipopeptide biosynthesis, or polynucleotides encoding such polypeptides, and related useful computer-readable media and computer systems.

Description

本発明は、リポペプチドの生合成に関与する遺伝子及びタンパク質、並びに関連化合物と、新規リポペプチド生合成遺伝子座を見出し操作するための方法、システム及び組成物、並びに新規リポペプチドに関する。   The present invention relates to genes and proteins involved in lipopeptide biosynthesis, and related compounds, methods, systems and compositions for finding and manipulating novel lipopeptide biosynthesis loci, and novel lipopeptides.

本出願は、2001年12月26日に出願した米国仮出願第60/342,133号、2002年4月17日に出願した米国仮出願第第60/372,789号の利益を主張するものである。本出願は、2001年10月15日に出願した米国出願第09/976,059号、及び2002年9月3日に出願した米国出願第10/232,370号(米国出願第09/910,813号の一部継続出願)の一部継続出願である。上記出願の教示内容は、それら全体を参照により本明細書に組み入れるものとする。   This application claims the benefit of US Provisional Application No. 60 / 342,133, filed on Dec. 26, 2001, and US Provisional Application No. 60 / 372,789, filed on Apr. 17, 2002. It is. No. 09 / 976,059 filed on Oct. 15, 2001, and US Application No. 10 / 232,370 filed Sep. 3, 2002 (US Application No. 09/910, No. 813, part continuation application). The teachings of the above applications are incorporated herein by reference in their entirety.

リポペプチドは、抗生物質、抗真菌剤又は抗ウィルス剤として生物工学用途及び医薬用途において可能性が高い、効果のある広域抗生物質活性を示す天然産物である。例としては、リケニシン(lichenysin)、フェンギシン(fengycin)、スルファクチン(surfactin)、シリンゴマイシン(syringomycin)、セラウェッチン(serrawettin)、ラモプラニン(ramoplanin)、ダプトマイシン(daptomycin)、A54145、ストレプトマイセス・コエリカラー(Streptomyces coelicolor)由来の「カルシウム依存性抗生物質」、エチノカンジン(echinocandin)、プネウモカンジン(pneumocandin)、アクレアシン(aculeacin)などの化合物が挙げられる。近縁種の一連の放線菌リポペプチド産生菌体の群であっても、リポペプチド天然産物は構造上異なっている可能性があり、それら天然産物の化学的特徴に基づいて異なる亜群に分類することができる。リポグリコペプチドはリポペプチド天然産物であるが、それは例えばグリコシル化されたラモプラニンである。酸性リポペプチドは、リポペプチド(例えば、ダプトマイシン、A54145及びストレプトマイセス・コエリカラー由来のカルシウム依存性抗生物質)のペプチド鎖部位に組み込まれている酸性アミノ酸残基を有することを特徴とするリポペプチド天然産物である。   Lipopeptides are natural products that exhibit effective broad-spectrum antibiotic activity, likely in biotechnological and pharmaceutical applications as antibiotics, antifungals or antivirals. Examples include lichenysin, fengycin, sulfactin, syringomycin, serawetin, raplanin, daptomycin14, daptomycin14, daptomycin14, daptomycin14. and compounds such as “calcium-dependent antibiotic” derived from coelicolor, ethinocandin, pneumocandin, aculaecin and the like. Even in a group of closely related species of actinomycete lipopeptide-producing cells, lipopeptide natural products may be structurally different and classified into different subgroups based on the chemical characteristics of these natural products can do. Lipoglycopeptide is a lipopeptide natural product, for example glycosylated ramoplanin. Acidic lipopeptides have an acidic amino acid residue incorporated into the peptide chain site of lipopeptides (eg daptomycin, A54145 and calcium-dependent antibiotics from Streptomyces coelicolor) It is a product.

一つの微生物は、遊離アミン(通常、ペプチドコアのN末端アミン)を介してペプチドコアに結合されている脂質成分が異なる一連のリポペプチド類の混合物を産生し得る。この脂質成分は、リポペプチド天然産物の生物学上の特性に重大な影響を有し得る。例えば、S.roseosporusによって産生されるリポペプチド抗生物質A21978C複合体は、少なくとも一連の6種類の微生物学的活性因子C、C、C、C、C及びCを含んでいる。リポペプチド抗生物質A21978C複合体のすべての因子は、同一の13個のアミノ酸からなる環状酸性ポリペプチドコアを有するが、末端アミノ基の脂肪アシル基の同一性が互いに異なる。その異なる複数のA21978C因子における生物学的特性(例えば抗菌作用、毒性、溶解度)は多様である。また、A21978C複合体の一部として同定されているその6つの因子のうちの1つであるA21978C因子Cは、ダプトマイシンとして知られている。同様に、S.fradiaeによって産生されるA54145抗生物質は、A21978C複合体に関連するリポペプチドの一群である。A21978C複合体と同様に、A54145抗生物質は、少なくとも8つの一連の微生物学的活性因子、A、A、B、B、C、D、E及びFを含んでいる。A54145の各因子は、環状の13個からなるアミノ酸、酸性ポリペプチドコア、及びN末端アミンに結合している脂肪アシル基を有する。A54145のその8つの因子は、ペプチドコアの位置12及び位置13のアミノ酸残基の同一性、並びに、位置1のアミノ酸残基の末端アミノ基に結合している脂肪アシル基の同一性が異なる。依然として、リポペプチド天然産物及び関連化合物の発見に有用な組成物、方法及びシステムが必要とされている。 A single microorganism can produce a mixture of a series of lipopeptides with different lipid components attached to the peptide core via a free amine (usually the N-terminal amine of the peptide core). This lipid component can have a significant impact on the biological properties of the lipopeptide natural product. For example, S.M. The lipopeptide antibiotic A21978C complex produced by roseosporus contains at least a series of six microbiologically active factors C 0 , C 1 , C 2 , C 3 , C 4 and C 5 . All factors of the lipopeptide antibiotic A21978C complex have a cyclic acidic polypeptide core consisting of the same 13 amino acids, but differ in the identity of the fatty acyl group of the terminal amino group. The biological properties (eg, antibacterial activity, toxicity, solubility) of the different A21978C factors are diverse. Further, A21978C factor C 0 is one of the six factors have been identified as part of A21978C complex is known as daptomycin. Similarly, S.M. A54145 antibiotic produced by Fradiae is a group of lipopeptides related to the A21978C complex. Similar to the A21978C complex, the A54145 antibiotic contains at least eight series of microbiologically active factors, A, A 1 , B, B 1 , C, D, E and F. Each factor of A54145 has a cyclic 13 amino acid, an acidic polypeptide core, and a fatty acyl group attached to the N-terminal amine. The eight factors of A54145 differ in the identity of the amino acid residues at positions 12 and 13 of the peptide core and the identity of the fatty acyl group attached to the terminal amino group of the amino acid residue at position 1. There remains a need for compositions, methods and systems useful for the discovery of lipopeptide natural products and related compounds.

天然産物を見出すための方法は多くの課題に直面してきている。微生物由来の天然産物に焦点をあてて見つけ出そうとする努力は、微生物の培養が困難であることによって阻まれ、実際、大部分の微生物が未だin vitroで培養されてはいない。さらに、多数の培養微生物は発酵の影響を受けやすい。さらに、2次代謝産物の多くは、in vitro条件下では、検出可能な濃度まで発現されない。また、in vitro条件下で産生される天然産物は、増殖条件(例えば、供給する栄養源)により変動することが多く、微生物の生合成に関する可能性を最大限に示すとは限らない。このため、リポペプチドを見出すためのゲノミクスベースの組成物、方法及びシステムは、これらの1つ以上の欠点を回避し、あるいは軽減することができるであろう。   Methods for finding natural products have faced many challenges. Efforts to find and focus on natural products derived from microorganisms have been hampered by the difficulty of culturing microorganisms, and in fact, most microorganisms have not yet been cultured in vitro. Furthermore, many cultured microorganisms are susceptible to fermentation. In addition, many of the secondary metabolites are not expressed to detectable concentrations under in vitro conditions. In addition, natural products produced under in vitro conditions often fluctuate depending on growth conditions (for example, nutrients to be supplied), and do not always show the potential for microbial biosynthesis. Thus, genomics-based compositions, methods and systems for finding lipopeptides could avoid or mitigate one or more of these disadvantages.

微生物により産生されるリポペプチドは、非リボソーム型ペプチド合成酵素(NRPS)と称する大型の多機能タンパク質上でリボソームとは無関係に合成される(Doekel and Marahiel、2001、Metabolic Engineering、Vol.3、pp.64−77)。NRPS類は、各々がモジュールから構成されている、1個又は複数の多官能性ポリペプチドからなるモジュールタンパク質である。各モジュールのアミノ末端からカルボキシ末端までの順序と特性は、ペプチド産物のアミノ酸残基の配列順序と相同性に一致する。各NRPSモジュールは、特定のアミノ酸基質を認識し、段階的な縮合を触媒して伸長するペプチド鎖を形成する。ある特定の単位が認識するアミノ酸の相同性は、すでに判明している他の単位の特性と比較することによって決定することができる(Challis and Ravel、2000、FEMS Microbiology Letters、Vol.187、pp.111−114)。結核菌ゲノム由来のミコバクチン生合成遺伝子クラスタの同定によって示されているように、多くのペプチド合成酵素では、ペプチド合成酵素中の繰り返し単位の順序と、各アミノ酸がペプチド産物中に出現する順序の間に厳密な相関があり、それにより、構造が知られているペプチドとそれらの合成をコードする推定遺伝子とを相関させることが可能である(Quadri et al.、1998、Chem.Biol.Vol.5、pp.631−645)。   Lipopeptides produced by microorganisms are synthesized independently of ribosomes on a large multifunctional protein called nonribosomal peptide synthase (NRPS) (Doekel and Marahiel, 2001, Metabolic Engineering, Vol. 3, pp. .64-77). NRPSs are modular proteins composed of one or more multifunctional polypeptides, each composed of a module. The order and properties from the amino terminus to the carboxy terminus of each module are consistent with the sequence order and homology of the amino acid residues of the peptide product. Each NRPS module recognizes a specific amino acid substrate and catalyzes a stepwise condensation to form a peptide chain that extends. The homology of the amino acids recognized by a particular unit can be determined by comparison with the characteristics of other units already known (Challes and Label, 2000, FEMS Microbiology Letters, Vol. 187, pp. 111-114). For many peptide synthases, the order of repeat units in the peptide synthase and the order in which each amino acid appears in the peptide product, as shown by the identification of the mycobactin biosynthetic gene cluster from the Mycobacterium tuberculosis genome. Can be correlated with peptides of known structure and putative genes encoding their synthesis (Quadri et al., 1998, Chem. Biol. Vol. 5). Pp. 631-645).

ペプチド合成酵素のモジュールは、ペプチド産物を形成するための認識、活性化、修飾及びアミノ酸前駆体の結合においてそれぞれが特定の役割を互いに果たす、さらに小型の単位又は「ドメイン」からなる。ドメインの1つのタイプであるアデニル化(A)ドメインは、ペプチド合成酵素のある特定の単位により組み込まれるアミノ酸を選択的に認識し、活性化することができる。この活性化ステップはATP依存性であり、アミノアシルアデニレートの一時的な形成が関与する。かかる活性化アミノ酸は、別のタイプのドメインであるチオール化(T)ドメイン(通常は、Aドメインに隣接して位置している)を通じてペプチド合成酵素に共有結合する。このTドメインは、保存されているセリン残基にホスホパンテテイン補欠分子族が共有結合することにより翻訳後修飾される。かかる活性化アミノ酸基質は、各Tドメインのホスホパンテテイン補欠分子族に対するチオエステル結合を介して非リボソーム型ペプチド合成酵素上に結合される。このペプチド合成酵素の連続単位に結合したアミノ酸は、その後、別のタイプのドメイン、すなわち縮合(C)ドメインが触媒となるアミド結合の形成によって共有結合する。   Peptide synthase modules consist of smaller units or “domains”, each of which plays a specific role in recognition, activation, modification and amino acid precursor binding to form a peptide product. One type of domain, the adenylation (A) domain, can selectively recognize and activate amino acids incorporated by certain units of peptide synthases. This activation step is ATP dependent and involves the temporary formation of aminoacyl adenylates. Such activated amino acids are covalently linked to the peptide synthase through another type of domain, a thiolation (T) domain (usually located adjacent to the A domain). This T domain is post-translationally modified by covalent attachment of a phosphopantethein prosthetic group to a conserved serine residue. Such activated amino acid substrates are bound on non-ribosomal peptide synthases via thioester bonds to the phosphopantethein prosthetic group of each T domain. The amino acids attached to the contiguous unit of this peptide synthase are then covalently linked by the formation of an amide bond catalyzed by another type of domain, the condensed (C) domain.

ペプチドコアへの脂質成分の結合に関する機構についてはほとんど解明されていない。リポペプチド天然産物にアシル基が付加される酵素的機構又はタイミングに関する文献はほとんどない。特に、ペプチド天然産物のN−アシル化に関与する酵素は同定されておらず、アシル化が、ペプチドコアの形成前に、形成と同時に、あるいは形成後に起こるかどうかについては未だ知られていない。Doekel及びMarahiel(2001、Metabolic Engineering、3、64−77)は、ペプチド合成酵素中の触媒ドメインを調査し、縮合ドメイン配列がNRPSのドメインアレンジメントにより変化していることを報告し、C末端からエピマー化ドメインに位置する縮合ドメイン、C末端からチオール化ドメインに位置する縮合ドメイン、及びリポペプチドの構築時のアシル移転の開始に関与している縮合ドメインについて言及している。脂質成分がペプチドコアに共有結合される機構が理解されれば、組換DNA技術により所与のペプチドコア上に脂肪アシル成分を選択的に導入することが可能となり、あるいは組換DNA技術により所望の1種又は複数の脂肪アシル成分を含有する産物の収率を高めることができるであろう。   Little is known about the mechanism involved in the binding of lipid components to the peptide core. There is little literature on the enzymatic mechanism or timing of acyl groups being added to lipopeptide natural products. In particular, the enzymes involved in N-acylation of peptide natural products have not been identified and it is not yet known whether acylation occurs before, simultaneously with, or after formation of the peptide core. Doekel and Marahiel (2001, Metabolic Engineering, 3, 64-77) investigated the catalytic domain in peptide synthases and reported that the condensing domain sequence was altered by the NRPS domain arrangement and epimerized from the C-terminus. Mention is made of a condensation domain located in the thiolation domain, a condensation domain located in the thiolation domain from the C-terminus, and a condensation domain involved in the initiation of acyl transfer during the construction of lipopeptides. Once the mechanism by which the lipid component is covalently bound to the peptide core is understood, it is possible to selectively introduce a fatty acyl component onto a given peptide core by recombinant DNA technology, or as desired by recombinant DNA technology. The yield of products containing one or more fatty acyl components may be increased.

選択的な栄養源供給実験によれば、増殖栄養源がリポペプチド産物の相対量に影響を及ぼし得ることが明らかになっている。ある特定の脂質前駆体の合成を促進する増殖条件では、その脂質成分を含む対応するリポペプチドが主に合成される。例えば、ダプトマイシンは、通常、S.roseosporusによりごく微量産生される。このため、適当量の生物学的に純粋なダプトマイシンを生成するには多大なる努力が必要となっている。オレイン酸メチル中1:1(v:v)混合されたカプロン酸又はカプリン酸を含む発酵培地を連続供給すると、ダプトマイシンの収率が上昇することが示唆されている(R.H.Baltz、Lipopeptide Antibiotics Produced by Streptomyces roseosporus and Streptomyces fradiae、in:Biotechnology of Antibiotics、Second Edition、pp.415−435、edited by W.R.Strohl)。あるいは、A21978C因子の酵素的脱アシル化に必要とされる化学工程、化合物のペプチド部分に存在するある種の反応性側鎖の保護、脂肪アシル基の合成的付加、及び所望のダプトマイシン産物を産出するための最終的な脱保護が開発されている。しかし、これらの方法は、化合物特異的であり、煩雑かつ非能率的である。
米国仮出願第60/342,133号 米国仮出願第第60/372,789号 米国出願第09/976,059号 米国出願第10/232,370号 米国出願第09/910,813号 米国特許第4,303,646号 米国特許第4,427,656号 PCT国際出願PCT/CA01/01462号 米国特許出願第10/XXX,XXX号 米国特許出願第60/372,789号 米国特許第4,977,083号 Doekel and Marahiel、2001、Metabolic Engineering、Vol.3、pp.64−77 Challis and Ravel、2000、FEMS Microbiology Letters、Vol.187、pp.111−114 Quadri et al.、1998、Chem.Biol.Vol.5、pp.631−645 Doekel and Marahiel(2001、Metabolic Engineering、3、64−77) R.H.Baltz、Lipopeptide Antibiotics Produced by Streptomyces roseosporus and Streptomyces fradiae、in:Biotechnology of Antibiotics、Second Edition、pp.415−435、edited by W.R.Strohl Bentley et al.、2002、Nature、vol.417、pp 141−147 Altschul et al.1990、J.Mol.Biol.215(3):403−410;Gish et al.、1993、Nature Genetics 3:266−272 McHenney et al.(1998)J.Bact.Vol.180 pp.143−151 Linne and Marahiel、2000、Biochemistry、Vol.39、pp.10439−10447 Guenzi et al.(1998)J.Biol.Chem.Vol.273、pp.32857−32863 Lindum et al.(1998)Vol.180、pp.6384−6388 Steller et al.(1999)Chem.Biol.Vol.6、pp.31−41 Konz et al.(1999)J.Bact.Vol.181、pp.133−140 Hajati et al.(2002)Chem.Biol.Vol.9、pp.1175−1187 Hino et al.(2001)Journal of Industrial Microbiology and Biotechnology Vol.27、pp.157−162 Duitman et al.(1999)Proc.Natl.Acad.Sci USA.Vol.96、pp.13294−13299 Tsuge et al.(2001)J.Bact、Vol.183、pp.6265−6273 Ecopia BioSciences Inc;CA 2,352,451 Mootz et at.(2000)Proc.Natl.Acad.Sci.USA.Vol.97 pp.5848−5853 Chiu et al.(2001)Proc.Natl.Acad.Sci.USA Vol.98 pp.8548−8553
Selective nutrient supply experiments have shown that growth nutrients can affect the relative amount of lipopeptide product. In growth conditions that facilitate the synthesis of a particular lipid precursor, the corresponding lipopeptide containing that lipid component is primarily synthesized. For example, daptomycin is usually S. cerevisiae. Very small amount produced by roseosporus. For this reason, much effort is required to produce an appropriate amount of biologically pure daptomycin. It has been suggested that continuous feeding of a fermentation medium containing caproic acid or capric acid mixed 1: 1 (v: v) in methyl oleate increases the yield of daptomycin (RH Baltz, Lipopeptide). Antibiotics Produced by Streptomyces roseosporus and Streptomyces fradiae, in: Biotechnology of Antibiotics, Second Edition, pp. 415b. Alternatively, the chemical steps required for the enzymatic deacylation of factor A21978C, the protection of certain reactive side chains present in the peptide portion of the compound, the synthetic addition of fatty acyl groups, and the desired daptomycin product. Final deprotection has been developed to do so. However, these methods are compound specific, cumbersome and inefficient.
US Provisional Application No. 60 / 342,133 US Provisional Application No. 60 / 372,789 US Application No. 09 / 976,059 US Application No. 10 / 232,370 US Application No. 09 / 910,813 U.S. Pat. No. 4,303,646 U.S. Pat. No. 4,427,656 PCT International Application PCT / CA01 / 01462 US Patent Application No. 10 / XXX, XXX US Patent Application No. 60 / 372,789 U.S. Pat. No. 4,977,083 Doekel and Marahiel, 2001, Metabolic Engineering, Vol. 3, pp. 64-77 Challis and Ravel, 2000, FEMS Microbiology Letters, Vol. 187, pp. 111-114 Quadri et al. 1998, Chem. Biol. Vol. 5, pp. 631-645 Doekel and Marahiel (2001, Metabolic Engineering, 3, 64-77) R. H. Baltz, Lipopeptide Antibiotics Produced by Streptomyces rosesporus and Streptomyces fradiae, in: Biotechnology of Antibiotics, Sept. 415-435, edited by W.M. R. Strohl Bentley et al. 2002, Nature, vol. 417, pp 141-147 Altschul et al. 1990, J.A. Mol. Biol. 215 (3): 403-410; Gish et al. 1993, Nature Genetics 3: 266-272. McHenney et al. (1998) J. MoI. Bact. Vol. 180 pp. 143-151 Linne and Marahiel, 2000, Biochemistry, Vol. 39, pp. 10439-10447 Guenzi et al. (1998) J. MoI. Biol. Chem. Vol. 273, pp. 32857-32863 Lindum et al. (1998) Vol. 180, pp. 6384-6388 Steller et al. (1999) Chem. Biol. Vol. 6, pp. 31-41 Konz et al. (1999) J. MoI. Bact. Vol. 181 pp. 133-140 Hajati et al. (2002) Chem. Biol. Vol. 9, pp. 1175-1187 Hino et al. (2001) Journal of Industrial Microbiology and Biotechnology Vol. 27, pp. 157-162 Duitman et al. (1999) Proc. Natl. Acad. Sci USA. Vol. 96, pp. 13294-13299 Tsuge et al. (2001) J. Org. Bact, Vol. 183, pp. 6265-6273 Ecobio BioSciences Inc; CA 2,352,451 Mootz et at. (2000) Proc. Natl. Acad. Sci. USA. Vol. 97 pp. 5848-5853 Chiu et al. (2001) Proc. Natl. Acad. Sci. USA Vol. 98 pp. 8548-8553

このため、リポペプチド及びその誘導体を産生する改良された方法が強く求められている。   For this reason, there is a strong need for improved methods of producing lipopeptides and derivatives thereof.

一態様では、本発明は、単離されたポリヌクレオチドが、配列番号1及び2から選択される少なくとも1つの配列に少なくとも45%の配列同一性を有するポリペプチドをコードする、アシル特異的Cドメインをコードする単離されたポリヌクレオチドを提供する。ある実施形態では、1つ又は複数の配列、特に、GenBankアクセッション番号CAB38518のNRPSタンパク質のCドメインに対応するヌクレオチド配列(すなわち、Genbankヌクレオチドアクセッション番号AL939115の195135〜217526、及び配列番号21と同じである)を特に除く。他の実施形態では、放線菌(actinomycetes)分類群の微生物以外の微生物に由来する核酸配列を除く。他の配列は、本発明の範囲から逸脱することなく除外され得る。関連の態様では、本発明は、(a)配列番号5、7、9、11、13、15、17及び19からなる群から選択される配列;(b)(a)に相補的な配列;(c)高ストリンジェンシーな条件下で前記の(a)又は(b)の配列にハイブリダイズする配列;及び、(d)前記の(a)(b)又は(c)の配列に少なくとも70%以上の相同性を有する配列、からなる群から選択される配列を含む、単離されたポリヌクレオチドを提供する。ある実施形態では、1つ又は複数の配列、特に、GenBankアクセッション番号CAB38518のNRPSタンパク質のCドメインに対応するヌクレオチド配列(すなわち、Genbankヌクレオチドアクセッション番号AL939115の195135〜217526、及び配列番号21と同じである)を特に除く。他の実施形態では、放線菌分類群の微生物以外の微生物に由来する核酸配列を除く。他の配列は、本発明の範囲から逸脱することなく除外され得る。本発明の一実施形態では、単離されたポリヌクレオチドによってコードされているアシル特異的Cドメインは、リポペプチドアシルキャッピングを含む。一実施形態では、アシル特異的Cドメインは、アクセッション番号IDAC 190901−2、IDAC 260202−1、及びIDAC 260202−5を各々有するコスミド008CH、184CM、及び024CK中に存在する。   In one aspect, the invention provides an acyl-specific C domain wherein the isolated polynucleotide encodes a polypeptide having at least 45% sequence identity to at least one sequence selected from SEQ ID NOs: 1 and 2. An isolated polynucleotide encoding is provided. In certain embodiments, one or more sequences, particularly the nucleotide sequence corresponding to the C domain of the NRPS protein of GenBank accession number CAB38518 (ie, 195135 to 217526 of Genbank nucleotide accession number AL939115, and the same as SEQ ID NO: 21 In particular). In other embodiments, nucleic acid sequences derived from microorganisms other than those of the actinomycetes taxon are excluded. Other sequences may be excluded without departing from the scope of the present invention. In a related aspect, the invention provides (a) a sequence selected from the group consisting of SEQ ID NOs: 5, 7, 9, 11, 13, 15, 17, and 19; (b) a sequence complementary to (a); (C) a sequence that hybridizes to the sequence of (a) or (b) under high stringency conditions; and (d) at least 70% to the sequence of (a), (b), or (c). Provided is an isolated polynucleotide comprising a sequence selected from the group consisting of the sequences having the above homology. In certain embodiments, one or more sequences, particularly the nucleotide sequence corresponding to the C domain of the NRPS protein of GenBank accession number CAB38518 (ie, 195135 to 217526 of Genbank nucleotide accession number AL939115, and the same as SEQ ID NO: 21 In particular). In other embodiments, nucleic acid sequences derived from microorganisms other than actinomycete taxonomic microorganisms are excluded. Other sequences may be excluded without departing from the scope of the present invention. In one embodiment of the invention, the acyl-specific C domain encoded by the isolated polynucleotide comprises lipopeptide acyl capping. In one embodiment, the acyl-specific C domain is present in cosmids 008CH, 184CM, and 024CK having accession numbers IDAC 190901-2, IDAC 260202-1, and IDAC 260202-5, respectively.

さらなる実施形態では、アシル特異的Cドメインをコードする単離されたポリヌクレオチドは、アクチノプラネス菌種(Actinoplanes sp.)ATCC 33076由来のラモプラニン(ramoplanin)の生合成遺伝子座;ストレプトマイセス・ロゼオスポルス(Streptomyces roseosporus)NRRL 11379由来のA21978Cの生合成遺伝子座;ストレプトマイセス・フラディエ(Streptomyces fradiae)ATCC 18158由来のA54145の生合成遺伝子座;ストレプトマイセス・コエリカラー(Streptomyces coelicolor)A3(2)由来のカルシウム依存性抗生物質の生合成遺伝子座;ストレプトマイセス・ガナエンシス(Streptomyces ghanaensis)NRRL B−12104由来のリポペプチド天然産物の生合成遺伝子座;ストレプトマイセス・レフイノウス(Streptomyces refuineus)NRRL 3143由来のリポペプチド天然産物の生合成遺伝子座;ストレプトマイセス・アイズネンシス(Streptomyces aizunensis)NRRL B−11277由来のリポペプチド天然産物の生合成遺伝子座;アクチノプラネスニポネンシス(Actinoplanes nipponensis)FD 24834 ATCC 31145由来のリポペプチド天然産物の生合成遺伝子座;及び、ストレプトマイセス菌種(Streptomyces sp.)微生物由来のリポペプチド天然産物の生合成遺伝子座、からなる群から選択された遺伝子座に存在する。   In a further embodiment, the isolated polynucleotide encoding an acyl-specific C domain is a biosynthetic locus of ramoplanin from Actinoplanes sp. ATCC 33076; Streptomyces roseosporus ( A211978C biosynthetic locus from Streptomyces roseosporus NRRL 11379; A54145 biosynthetic locus from Streptomyces fradiae ATCC 18158; Streptomyces coelicolor 2 (Streptomyces coelicolor 2 (Streptomyces coelicolor 2) Biosynthetic loci for addictive antibiotics; Streptomyces ganaensis ( biosynthesis locus of lipopeptide natural product derived from Treptomyces gananaensis NRRL B-12104; biosynthesis locus of lipopeptide natural product derived from Streptomyces refuinus NRRL 3143; ) Biosynthetic loci of lipopeptide natural products from NRRL B-11277; biosynthetic loci of lipopeptide natural products from Actinoplanes nipponensis FD 24834 ATCC 31145; and Streptomyces species ( Streptomyces sp.) Biopeptide biosynthesis derived from microorganisms Locus present in selected loci from the group consisting of.

別の実施形態では、アシル特異的Cドメインをコードする単離されたポリヌクレオチドは、Streptomyces coelicolor A3(2)(CADA)由来のカルシウム依存性抗生物質の生合成遺伝子座には存在しない。   In another embodiment, the isolated polynucleotide encoding the acyl-specific C domain is not present in the biosynthetic locus of calcium-dependent antibiotics from Streptomyces coelicolor A3 (2) (CADA).

また、本発明は、第1のポリヌクレオチドが配列番号1及び2から選択される少なくとも1つのポリヌクレオチドに少なくとも45%の相同性を有するポリペプチドをコードし、かつ第2のポリヌクレオチドが、配列番号3に少なくとも55%の配列同一性を有するポリペプチドと配列番号4に少なくとも50%の配列同一性を有するポリペプチドからなる群から選択されるポリペプチドをコードするものである、単離された2つ以上のポリヌクレオチドを提供する。関連する態様では、本発明は、第1のポリヌクレオチドがアシル特異的Cドメインをコードし、かつ第2のポリヌクレオチドがアデニル化酵素、アシルキャリアタンパク質、又はアデニル化酵素とアシルキャリアタンパク質の融合物をコードするものである、2つ以上の単離されたポリヌクレオチドを提供する。   The present invention also provides that the first polynucleotide encodes a polypeptide having at least 45% homology to at least one polynucleotide selected from SEQ ID NOs: 1 and 2, and the second polynucleotide has the sequence An isolated polypeptide encoding a polypeptide selected from the group consisting of a polypeptide having at least 55% sequence identity to No. 3 and a polypeptide having at least 50% sequence identity to SEQ ID No. 4. Two or more polynucleotides are provided. In a related aspect, the invention provides that the first polynucleotide encodes an acyl-specific C domain and the second polynucleotide is an adenylation enzyme, an acyl carrier protein, or a fusion of an adenylation enzyme and an acyl carrier protein. Two or more isolated polynucleotides are provided that encode.

また、本発明は、(a)配列番号23、25、27、29、31、33、35、37、39、41、43、45及び47からなる群から選択される配列;(b)(a)に相補的な配列;(c)高ストリンジェンシーな条件下で前記の(a)又は(b)の配列にハイブリダイズする配列、及び、(d)前記の(a)(b)、又は(c)の配列に少なくとも70%以上の相同性を有する配列、からなる群から選択される配列を含む、単離されたポリヌクレオチドを提供する。一実施形態では、ポリヌクレオチドが、配列番号3に少なくとも55%の配列同一性を有するポリペプチドからなる群から選択されるポリペプチドをコードする。別の実施形態では、ポリヌクレオチドは、配列番号4に少なくとも50%の配列同一性を有するポリペプチドをコードする。   The present invention also relates to (a) a sequence selected from the group consisting of SEQ ID NOs: 23, 25, 27, 29, 31, 33, 35, 37, 39, 41, 43, 45 and 47; (b) (a (C) a sequence that hybridizes to the sequence of (a) or (b) under high stringency conditions, and (d) the sequence of (a), (b), or ( An isolated polynucleotide comprising a sequence selected from the group consisting of a sequence having at least 70% homology to the sequence of c). In one embodiment, the polynucleotide encodes a polypeptide selected from the group consisting of polypeptides having at least 55% sequence identity to SEQ ID NO: 3. In another embodiment, the polynucleotide encodes a polypeptide having at least 50% sequence identity to SEQ ID NO: 4.

一実施形態では、ポリヌクレオチドはアデニル化酵素をコードする。別の実施形態では、ポリヌクレオチドはアシルキャリアタンパク質をコードする。さらなる実施形態では、ポリヌクレオチドは、アデニル化酵素及びアシルキャリアタンパク質の融合物をコードする。別の実施形態では、アデニル化酵素、アシルキャリアタンパク質、又は前記2つの融合物をコードするポリペプチドは、アクチノプラネス菌種(Actinoplanes sp.)ATCC 33076由来のラモプラニン(ramoplanin)の生合成遺伝子座;ストレプトマイセス・ロゼオスポルス(Streptomyces roseosporus)NRRL 11379由来のA21978Cの生合成遺伝子座;ストレプトマイセス・フラディエ(Streptomyces fradiae)ATCC 18158由来のA54145の生合成遺伝子座;ストレプトマイセス・ガナエンシス(Streptomyces ghanaensis)NRRL B−12104由来のリポペプチド天然産物の生合成遺伝子座;ストレプトマイセス・レフイノウス(Streptomyces refuineus)NRRL 3143由来のリポペプチド天然産物の生合成遺伝子座;ストレプトマイセス・アイズネンシス(Streptomyces aizunensis)NRRL B−11277由来のリポペプチド天然産物の生合成遺伝子座;アクチノプラネスニポネンシス(Actinoplanes nipponensis)FD 24834 ATCC 31145由来のリポペプチド天然産物の生合成遺伝子座;及び、ストレプトマイセス菌種(Streptomyces sp.)微生物由来のリポペプチド天然産物の生合成遺伝子座、からなる群から選択される生合成遺伝子座に由来している。一実施形態では、アデニル化酵素は、各々アクセッション番号IDAC 190901−2及びIDAC 260202−5を有するコスミド008CO及び024CK由来である。別の実施形態では、アシルキャリアタンパク質は、各々アクセッション番号IDAC 190901−3及びIDAC 260202−5を有するコスミド008CH及び024CK由来である。一実施形態では、アデニル化酵素及びアシルキャリアタンパク質を含有する融合タンパク質は、アクセッション番号IDAC 260202−1を有するコスミド184CM由来である。   In one embodiment, the polynucleotide encodes an adenylating enzyme. In another embodiment, the polynucleotide encodes an acyl carrier protein. In a further embodiment, the polynucleotide encodes a fusion of an adenylating enzyme and an acyl carrier protein. In another embodiment, the polypeptide encoding an adenylating enzyme, an acyl carrier protein, or the two fusions is a biosynthetic locus of ramoplanin from Actinoplanes sp. ATCC 33076; The biosynthetic locus of A21978C from Streptomyces roseosporus NRRL 11379; the biosynthetic locus of A54145 from Streptomyces fradiae ATCC 18158; B-12104-derived lipopeptide natural product biosynthetic locus; Biosynthetic loci of lipopeptide natural products from Streptomyces refineus NRRL 3143; biosynthetic loci of lipopeptide natural products from Streptomyces aizunensis NRRL B-11277; Biosynthetic loci of lipopeptide natural products derived from cis (Actinoplanes nipponensis) FD 24834 ATCC 31145; and biosynthetic loci of lipopeptide natural products derived from Streptomyces sp. Derived from the selected biosynthetic locus. In one embodiment, the adenylating enzyme is derived from cosmids 008CO and 024CK having accession numbers IDAC 190901-2 and IDAC 260202-5, respectively. In another embodiment, the acyl carrier protein is derived from cosmids 008CH and 024CK having accession numbers IDAC 190901-3 and IDAC 260202-5, respectively. In one embodiment, the fusion protein containing an adenylating enzyme and an acyl carrier protein is derived from cosmid 184CM having accession number IDAC 260202-1.

また、本発明は、配列番号1及び配列番号2から選択される少なくとも1つの配列に少なくとも45%の配列相同性を有する単離されたアシル特異的Cドメインを提供する。ある実施形態では、1つ又は複数の配列、特に、GenBankアクセッション番号CAB38518及び配列番号22のNRPSタンパク質のCドメインに対応するポリペプチド配列を特に除く。他の実施形態では、放線菌分類群の微生物以外の微生物に由来するポリペプチド配列を除く。本発明の範囲から逸脱しない限り、他の配列が除外し得る。関連する態様では、本発明は、(a)配列番号6、8、10、12、14、16、18、20及び22からなる群から選択される配列;並びに(b)前記の(a)の配列に少なくとも70%以上の相同性を有する配列、からなる群から選択されるポリペプチド配列を含む、単離されたアシル特異的Cドメインを提供する。ある実施形態では、1つ又は複数の配列、特に、GenBankアクセッション番号CAB38518及び配列番号22のNRPSタンパク質のCドメインに対応するポリペプチド配列を特に除く。他の実施形態では、放線菌分類群の微生物以外の微生物に由来するポリペプチド配列を除く。本発明の範囲から逸脱しない限り、他の配列が除外し得る。   The present invention also provides an isolated acyl-specific C domain having at least 45% sequence homology to at least one sequence selected from SEQ ID NO: 1 and SEQ ID NO: 2. In certain embodiments, one or more sequences are specifically excluded, particularly polypeptide sequences corresponding to the C domain of the NRPS protein of GenBank accession number CAB38518 and SEQ ID NO: 22. In other embodiments, polypeptide sequences derived from microorganisms other than actinomycete taxonomic microorganisms are excluded. Other sequences may be excluded without departing from the scope of the invention. In a related aspect, the invention provides (a) a sequence selected from the group consisting of SEQ ID NOs: 6, 8, 10, 12, 14, 16, 18, 20, and 22; and (b) of (a) above An isolated acyl-specific C domain is provided comprising a polypeptide sequence selected from the group consisting of a sequence having at least 70% homology to the sequence. In certain embodiments, one or more sequences are specifically excluded, particularly polypeptide sequences corresponding to the C domain of the NRPS protein of GenBank accession number CAB38518 and SEQ ID NO: 22. In other embodiments, polypeptide sequences derived from microorganisms other than actinomycete taxonomic microorganisms are excluded. Other sequences may be excluded without departing from the scope of the invention.

さらに、本発明は、第1の単離されたポリペプチドが、配列番号1及び配列番号2から選択される少なくとも1つの配列に少なくとも45%の相同性を有するアシル特異的Cドメインであり、かつ第2の単離されたポリペプチドが、配列番号3に少なくとも55%の同一性を有するポリペプチドと配列番号4に少なくとも50%の同一性を有するポリペプチドからなる群から選択されるものである、2つ以上の単離されたポリペプチドを提供する。また、さらなる態様では、本発明は、少なくとも1つのアシル特異的Cドメインポリペプチドと、アデニル化タンパク質及びアシルキャリアタンパク質からなる群から選択される別のポリペプチドとを含む、N−アシルキャッピングカセットを提供する。   Furthermore, the present invention provides that the first isolated polypeptide is an acyl-specific C domain having at least 45% homology to at least one sequence selected from SEQ ID NO: 1 and SEQ ID NO: 2, and The second isolated polypeptide is selected from the group consisting of a polypeptide having at least 55% identity to SEQ ID NO: 3 and a polypeptide having at least 50% identity to SEQ ID NO: 4 Two or more isolated polypeptides are provided. In yet a further aspect, the present invention provides an N-acyl capping cassette comprising at least one acyl-specific C domain polypeptide and another polypeptide selected from the group consisting of an adenylated protein and an acyl carrier protein. provide.

一実施形態では、単離されたアシル特異的Cドメインがストレプトマイセス・コエリカラー(Streptomyces coelicolor)A3(2)(CADA)由来のカルシウム依存性抗生物質の生合成遺伝子座由来ではない。   In one embodiment, the isolated acyl-specific C domain is not derived from a biosynthetic locus of a calcium-dependent antibiotic from Streptomyces coelicolor A3 (2) (CADA).

また、本発明は、(a)配列番号24、26、28、30、32、34、36、38、40、42、44、46及び48;並びに、(b)前記の(a)の配列に少なくとも70%以上の相同性を有している配列、からなる群から選択されるポリペプチドを含む、単離されたポリペプチドを提供する。一実施形態では、かかる単離されたポリペプチドは、ストレプトマイセス・コエリカラー(Streptomyces coelicolor)A3(2)(CADA)由来のカルシウム依存性抗生物質の生合成遺伝子座由来ではない。   The present invention also includes (a) SEQ ID NOS: 24, 26, 28, 30, 32, 34, 36, 38, 40, 42, 44, 46, and 48; and (b) the sequence of (a) An isolated polypeptide is provided comprising a polypeptide selected from the group consisting of a sequence having at least 70% homology. In one embodiment, such isolated polypeptide is not derived from a biosynthetic locus of a calcium-dependent antibiotic from Streptomyces coelicolor A3 (2) (CADA).

さらに、本発明は、(a)ポリヌクレオチド若しくはポリペプチド配列の同定、分析又は表示のモデル化を行う方法を実行するのに十分な命令を含んでいる媒体上に格納されているコンピュータプログラムと;(b)i)配列番号1又は配列番号2のいずれかと少なくとも45%の配列同一性を有するポリペプチドをコードする、アシル特異的Cドメインをコードするポリヌクレオチド;ii)配列番号3と少なくとも55%の配列同一性を有するポリペプチドをコードするポリヌクレオチド;及び、iii)配列番号4と少なくとも50%の配列同一性を有するポリペプチドをコードするポリヌクレオチド、からなる群から選択されるポリヌクレオチドの配列を示す前記媒体上に格納されているデータと;(c)配列の論理的なサブコンポーネントに対応するデータ要素へ前記コンピュータプログラムがアクセスするのを容易にするための前記データの基本的な構成及び構造を反映し、前記データ構造が、前記プログラムに、かつコンピュータプログラムが前記データを系統化しアクセスする方法に固有のものであるデータ構造とを含むコンピュータ解読可能媒体を提供する。関連する態様では、本発明は、(a)ポリペプチド配列の同定、分析又は表示のモデル化を行う方法を実行するのに十分な命令を含んでいる媒体上に格納されているコンピュータプログラムと;(b)i)アシル特異的Cドメインを示し(representing)、かつ配列番号1又は配列番号2のいずれかと少なくとも45%の配列相同性を有するポリペプチド;ii)配列番号3と少なくとも55%の配列同一性を有するポリペプチド;及び、iii)配列番号4と少なくとも50%の配列同一性を有するポリペプチド、からなる群から選択されるポリペプチドの配列を示す媒体上に格納されているデータと;(c)配列の論理的サブコンポーネントに対応するデータ要素へ前記コンピュータプログラムがアクセスするのを容易にするための前記データの基本的な構成及び構造を反映し、前記データ構造が、前記プログラムに、かつコンピュータプログラムが前記データを系統化しアクセスする方法に固有のものであるデータ構造とを含むコンピュータ解読可能媒体を提供する。   Furthermore, the present invention includes (a) a computer program stored on a medium containing instructions sufficient to carry out a method for identifying, analyzing or modeling a polynucleotide or polypeptide sequence; (B) i) a polynucleotide encoding an acyl-specific C domain that encodes a polypeptide having at least 45% sequence identity with either SEQ ID NO: 1 or SEQ ID NO: 2; ii) at least 55% with SEQ ID NO: 3 A polynucleotide encoding a polypeptide having the following sequence identity; and iii) a polynucleotide encoding a polypeptide having at least 50% sequence identity to SEQ ID NO: 4, the sequence of a polynucleotide selected from the group consisting of (C) a logical sub-component of the array; Reflecting the basic structure and structure of the data for facilitating the computer program to access the data elements corresponding to the network element, the data structure being in the program, and the computer program systematizing the data. And a computer readable medium including a data structure that is specific to the accessing method. In a related aspect, the invention comprises (a) a computer program stored on a medium containing instructions sufficient to perform a method for identifying, analyzing, or modeling a polypeptide sequence; (B) i) a polypeptide representing an acyl-specific C domain and having at least 45% sequence homology with either SEQ ID NO: 1 or SEQ ID NO: 2; ii) at least 55% sequence with SEQ ID NO: 3 A polypeptide having identity; and iii) data stored on a medium indicating the sequence of a polypeptide selected from the group consisting of SEQ ID NO: 4 and a polypeptide having at least 50% sequence identity; (C) the data for facilitating access of the computer program to data elements corresponding to logical subcomponents of the array; A computer readable medium is provided that reflects the basic structure and structure of the data structure, wherein the data structure includes the program and a data structure that is specific to the way the computer program organizes and accesses the data. .

また、本発明は、(a)配列番号1又は配列番号2のいずれかと少なくとも45%の配列同一性を有するポリペプチドをコードする、アシル特異的Cドメインをコードするポリヌクレオチド;(b)配列番号3と少なくとも55%の配列同一性を有するポリペプチドをコードするポリヌクレオチド;及び、(c)配列番号4と少なくとも50%の配列同一性を有するポリペプチドをコードするポリヌクレオチド、からなる群から選択されるポリヌクレオチドを示すデータを含む、ポリヌクレオチド又はポリペプチドの配列の同定、分析又はモデル化を行う方法を実行するようにプログラムされたコンピュータによってアクセス可能なデータを格納するためのメモリを提供する。関連する態様では、本発明は、(a)配列番号1又は配列番号2のいずれかと少なくとも45%の配列同一性を有するポリペプチド;(b)配列番号3と少なくとも55%の配列相同性を有するポリペプチド;及び、(c)配列番号4と少なくとも50%の配列同一性を有するポリペプチド、からなる群から選択されるポリペプチドを示すデータを含む、ポリペプチドの配列の同定、分析又はモデリングを行う方法を実行するようにプログラムされたコンピュータによってアクセス可能なデータを格納するためのメモリを提供する。   The present invention also relates to (a) a polynucleotide encoding an acyl-specific C domain that encodes a polypeptide having at least 45% sequence identity with either SEQ ID NO: 1 or SEQ ID NO: 2; (b) SEQ ID NO: A polynucleotide encoding a polypeptide having at least 55% sequence identity with 3; and (c) a polynucleotide encoding a polypeptide having at least 50% sequence identity with SEQ ID NO: 4 A memory for storing data accessible by a computer programmed to perform a method for identifying, analyzing or modeling a sequence of a polynucleotide or polypeptide, including data indicative of the polynucleotide to be . In a related aspect, the invention provides (a) a polypeptide having at least 45% sequence identity with either SEQ ID NO: 1 or SEQ ID NO: 2; (b) having at least 55% sequence homology with SEQ ID NO: 3 Identification, analysis or modeling of the sequence of the polypeptide, comprising data representing a polypeptide selected from the group consisting of: a polypeptide; and (c) a polypeptide having at least 50% sequence identity with SEQ ID NO: 4 A memory is provided for storing data accessible by a computer programmed to perform the method.

また、本発明は、(a)配列番号1又は配列番号2のいずれかと少なくとも45%の配列相同性を有するポリペプチド、あるいは(b)配列番号1又は配列番号2に少なくとも45%の配列同一性を有するポリペプチドをコードするポリヌクレオチドを、同定するステップを含む、リポペプチド生合成に関与するポリペプチド又はかかるポリペプチドをコードするポリヌクレオチドを検出する方法であって、前記の少なくとも45%の配列同一性が、リポペプチド生合成に関与するポリペプチドを示す、前記方法を提供する。一実施形態では、本方法は、(a)アシル特異的ドメインを示すポリヌクレオチド配列又はポリペプチド配列からなる群から選択される基準ポリヌクレオチド又はポリペプチド配列を提供するステップと;(b)前記基準配列を、コンピュータ解読可能媒体上に格納された1つ以上の候補ポリヌクレオチド又はポリペプチド配列と比較するステップと;(c)前記基準配列と前記の1つ以上の候補配列との間の相同性レベルを検出するステップと;(d)基準配列と少なくとも70%の相同性を有する候補配列を同定するステップとを含む。一実施形態では、本方法は、さらに、少なくとも、a)のポリペプチド又はb)のポリヌクレオチドに近接している、c)配列番号3に少なくとも55%の配列同一性を有する1つのポリペプチド、若しくは配列番号3に少なくとも55%の配列同一性を有するポリペプチドをコードする1つのポリヌクレオチド配列;又は、d)配列番号4に少なくとも50%の配列同一性を有する1つのポリペプチド、若しくは配列番号4に少なくとも50%の配列相同性を有するポリペプチドをコードする1つのポリヌクレオチド配列を同定するステップを含む。本方法の別の実施形態では、c)のポリペプチドが、配列番号24、26、28、30、32、34、36、38若しくは40のポリペプチド、又は配列番号24、26、28、30、32、34、36、38若しくは40のポリペプチドに少なくとも70%の配列同一性を有するポリペプチドであるか;あるいは、d)のヌクレオチドが、配列番号24、26、28、30、32、34、36、38若しくは40のポリペプチドをコードするヌクレオチド、又は配列番号24、26、28、30、32、34、36、38若しくは40のポリペプチドに少なくとも70%の配列同一性を有するポリペプチドをコードするヌクレオチドである。   The present invention also relates to (a) a polypeptide having at least 45% sequence homology with either SEQ ID NO: 1 or SEQ ID NO: 2, or (b) at least 45% sequence identity to SEQ ID NO: 1 or SEQ ID NO: 2. A method of detecting a polypeptide involved in lipopeptide biosynthesis or a polynucleotide encoding such a polypeptide, comprising the step of identifying a polynucleotide encoding a polypeptide having the sequence of at least 45% of said sequence The method is provided wherein the identity indicates a polypeptide involved in lipopeptide biosynthesis. In one embodiment, the method comprises (a) providing a reference polynucleotide or polypeptide sequence selected from the group consisting of a polynucleotide sequence or a polypeptide sequence that exhibits an acyl-specific domain; and (b) the reference Comparing the sequence to one or more candidate polynucleotide or polypeptide sequences stored on a computer readable medium; (c) homology between the reference sequence and the one or more candidate sequences; Detecting a level; and (d) identifying a candidate sequence having at least 70% homology with a reference sequence. In one embodiment, the method further comprises at least one polypeptide having a sequence identity of at least 55% to SEQ ID NO: 3, in proximity to the polypeptide of a) or b). Or one polynucleotide sequence encoding a polypeptide having at least 55% sequence identity to SEQ ID NO: 3; or d) one polypeptide having at least 50% sequence identity to SEQ ID NO: 4, or SEQ ID NO: Identifying a polynucleotide sequence encoding a polypeptide having a sequence homology of at least 50% to 4. In another embodiment of this method, the polypeptide of c) is the polypeptide of SEQ ID NO: 24, 26, 28, 30, 32, 34, 36, 38 or 40, or SEQ ID NO: 24, 26, 28, 30, A polypeptide having at least 70% sequence identity to a 32, 34, 36, 38 or 40 polypeptide; or alternatively, the nucleotide of d) is SEQ ID NO: 24, 26, 28, 30, 32, 34, Nucleotides encoding 36, 38 or 40 polypeptides, or polypeptides having at least 70% sequence identity to the polypeptide of SEQ ID NO: 24, 26, 28, 30, 32, 34, 36, 38 or 40 Nucleotide.

また、本発明は、(a)脂質生合成に関与するタンパク質をコードし、かつ(i)アシル特異的Cドメイン、又はアシル特異的Cドメインをコードするポリヌクレオチドを示すポリペプチド配列の1つ以上を含む基準配列のデータベースと、(b)(ii)データベース中の各基準配列に対して比較するための試験配列を受け取ることと;(iii)比較の結果を示すことと、が可能であるユーザインターフェースとを含むコンピュータシステムを提供する。一実施形態では、コンピュータシステムの基準配列が、(iv)アデニル化酵素を示すポリペプチド配列、又はアデニル化酵素をコードするポリヌクレオチド;及び(v)アシルキャリアタンパク質を示すポリペプチド配列、又はアシルキャリアタンパク質をコードするポリヌクレオチド、の1つ以上をさらに含む。別の実施形態では、(i)の基準配列は、配列番号1、2、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21及び22から選択され、(iv)の基準配列が、配列番号3、23、24、25、26、27、28、29、30、31、32、33及び34から選択され;(v)の基準配列が、配列番号4、37、38、39、40、41、42、43、44、45、46、47及び48から選択される。   The present invention also provides one or more polypeptide sequences that (a) encode a protein involved in lipid biosynthesis and (i) an acyl-specific C domain or a polynucleotide encoding an acyl-specific C domain. A database of reference sequences comprising: (b) a user capable of (ii) receiving a test sequence for comparison against each reference sequence in the database; and (iii) indicating the results of the comparison A computer system including an interface is provided. In one embodiment, the reference sequence of the computer system is (iv) a polypeptide sequence that represents an adenylating enzyme, or a polynucleotide that encodes an adenylating enzyme; and (v) a polypeptide sequence that represents an acyl carrier protein, or an acyl carrier. It further comprises one or more of a polynucleotide encoding the protein. In another embodiment, the reference sequence of (i) is SEQ ID NO: 1, 2, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, (Iv) the reference sequence is selected from SEQ ID NOs: 3, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33 and 34; ) Is selected from SEQ ID NOs: 4, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47 and 48.

本発明は、リポペプチド及び関連化合物を見出すこと、遺伝子操作に有用な組成物、方法及びシステムを提供する。本組成物は、リポペプチド天然産物、リポペプチド遺伝子、リポペプチド遺伝子群及びリポペプチド産生微生物を同定するのに用いることができる。   The present invention provides compositions, methods and systems useful for finding lipopeptides and related compounds and for genetic manipulation. The composition can be used to identify lipopeptide natural products, lipopeptide genes, lipopeptide gene groups and lipopeptide-producing microorganisms.

種々の微生物由来のリポペプチドの生合成遺伝子座を見出し、分析した。便宜上、リポペプチドの生合成遺伝子座とその座が見出されている微生物は、供給元の呼称を参照することにより示すことがある。その場合、「RAMO」はActinoplanes sp.ATCC 33076由来のラモプラニンの生合成遺伝子座を表し、「DAPT」はStreptomyces roseosporus NRRL 11379由来のA21978Cの生合成遺伝子座を表し、「A541」はStreptomyces fradiae ATCC 18158由来のA54145の生合成遺伝子座を表し、「CADA」は、Streptomyces coelicolor A3(2)由来のカルシウム依存性抗生物質の生合成遺伝子座を表し(Bentley et al.、2002、Nature、vol.417、pp 141−147)、「009H」は、Streptomyces ghanaensis NRRL B−12104由来のリポペプチド天然産物の生合成遺伝子座を表し、「024A」は、Streptomyces refuineus NRRL 3143由来のリポペプチド天然産物の生合成遺伝子座を表し、「023C」は、Streptomyces aizunensis NRRL B−11277由来のリポペプチド天然産物の生合成遺伝子座を表し、「A410」は、Actinoplanes nipponensis FD 24834 ATCC 31145由来のリポペプチド天然産物の生合成遺伝子座を表し、かつ「070B」は、Ecopia’s private culture collectionのStreptomyces sp.微生物由来のリポペプチド天然産物の生合成遺伝子座を表す。   Biosynthetic loci of lipopeptides from various microorganisms were found and analyzed. For convenience, the biosynthetic locus of the lipopeptide and the microorganism in which the locus is found may be indicated by referring to the designation of the supplier. In such a case, “RAMO” is an Actinoplanes sp. Represents the biosynthetic locus of ramoplanin from ATCC 33076, “DAPT” represents the biosynthetic locus of A21978C from Streptomyces roseosporus NRRL 11379, “A541” represents the biosynthetic locus of Streptomyces fradiae ATCC 18158 derived from A54145 , “CADA” represents the biosynthetic locus of calcium-dependent antibiotics derived from Streptomyces coelicolor A3 (2) (Bentley et al., 2002, Nature, vol. 417, pp 141-147), “009H” is , Which represents the biosynthetic locus of the lipopeptide natural product from Streptomyces ghanaensis NRRL B-12104, “024 "Represents the biosynthetic locus of the lipopeptide natural product derived from Streptomyces refuineus NRRL 3143," 023C "represents the biosynthetic locus of the lipopeptide natural product derived from Streptomyces aizunensis NRRL B-11277, and" A410 " , Actinoplanes nipponensis FD 24834 ATCC 31145 represents the biosynthetic locus of the natural product of lipopeptide, and “070B” represents Ecopia's private culture streptomyces sp. Represents the biosynthetic locus of a lipopeptide natural product derived from a microorganism.

驚いたことに、リポペプチド生合成遺伝子座に共通の保存された遺伝子ドメイン及び保存された遺伝子が発見された。この保存されたドメインは「アシル特異的Cドメイン(特異Cドメイン)」と呼ばれ、リポペプチド生合成のためのN−アシルキャッピングに関与する縮合ドメイン(Cドメイン)を意味する。「アシル特異的Cドメイン」は、リポペプチド中の脂質成分とペプチドコアの第1のアミノ酸残基の間で確認されているN−アシル化ペプチド結合に必要とされるものである。本発明のアシル特異的Cドメインの代表的な例としては、Actinoplanes sp.ATCC 33076(配列番号6)由来のラモプラニン生合成遺伝子座に存在するアシル特異的Cドメイン、Streptomyces roseosporus NRRL 11379(配列番号8)由来のA21978C座に存在するアシル特異的Cドメイン、Streptomyces fradiae ATCC 18158(配列番号10)由来のA54145座に存在するアシル特異的Cドメイン、Streptomyces ghanaensis NRRL B−12104(配列番号12)由来のリポペプチド生合成遺伝子座に存在するアシル特異的Cドメイン、Streptomyces refuineus NRRL 3143(配列番号14)由来のリポペプチド生合成遺伝子座に存在するアシル特異的Cドメイン、Streptomyces aizunensis NRRL B−11277(配列番号16)由来のリポペプチド生合成遺伝子座に存在するアシル特異的Cドメイン、Actinoplanes nipponensis FD 24834(配列番号18)ATCC 31145由来のA41,012リポペプチド生合成遺伝子座に存在するアシル特異的Cドメイン、Ecopia’s private culture collectionの中のStreptomyces sp.organism 070(配列番号20)由来の推定上のリポペプチド生合成遺伝子座に存在するアシル特異的Cドメイン、及び、Streptomyces coelicolor A3(2)(配列番号22)由来のカルシウム依存性抗生物質の生合成遺伝子座に存在するアシル特異的Cドメインが挙げられる。ある実施形態では、Streptomyces coelicolor A3(2)由来のカルシウム依存性抗生物質生合成遺伝子座に存在するアシル特異的Cドメイン(配列番号22)、及びGenBankアクセッション番号CAB 38518のNRPSタンパク質のCドメインに対応するポリペプチド配列を特に除外する。他の実施形態では、放線菌分類群の微生物以外の微生物から得られるポリペプチド配列は、特定して除く。   Surprisingly, conserved gene domains and conserved genes common to lipopeptide biosynthetic loci have been discovered. This conserved domain is called “acyl-specific C domain (specific C domain)” and refers to a condensation domain (C domain) involved in N-acyl capping for lipopeptide biosynthesis. An “acyl-specific C domain” is that required for N-acylated peptide bonds that are identified between the lipid component in the lipopeptide and the first amino acid residue of the peptide core. Representative examples of acyl-specific C domains of the present invention include Actinoplanes sp. An acyl-specific C domain present at the ramoplanin biosynthetic locus derived from ATCC 33076 (SEQ ID NO: 6), an acyl-specific C domain present at the A21978C locus derived from Streptomyces roseosporus NRRL 11379 (Streptomyces fradiae ATCC 18158 (ATCC 18158) An acyl-specific C domain present at the A54145 locus derived from SEQ ID NO: 10), an acyl-specific C domain present at the lipopeptide biosynthesis locus derived from Streptomyces ghanaensis NRRL B-12104 (SEQ ID NO: 12), Streptomyces refuinus NRRL 3143 ( An acyl-specific C domain present at the lipopeptide biosynthesis locus from SEQ ID NO: 14), S An acyl-specific C domain present in the lipopeptide biosynthesis locus from reptomyces aizunensis NRRL B-11277 (SEQ ID NO: 16), A41,012 lipopeptide biosynthesis locus from Actinoplanes nipponensis FD24834 (SEQ ID NO: 18) ATCC 31145 Streptomyces sp. In the acyl-specific C domain present in Ecopia's private culture collection. Biosynthesis of an acyl-specific C domain present in a putative lipopeptide biosynthesis locus from organism 070 (SEQ ID NO: 20) and a calcium-dependent antibiotic from Streptomyces coelicolor A3 (2) (SEQ ID NO: 22) Examples include acyl-specific C domains present at the locus. In certain embodiments, an acyl-specific C domain (SEQ ID NO: 22) present in a calcium-dependent antibiotic biosynthetic locus from Streptomyces coelicolor A3 (2), and a C domain of an NRPS protein with GenBank accession number CAB 38518 The corresponding polypeptide sequence is specifically excluded. In other embodiments, polypeptide sequences obtained from microorganisms other than actinomycete taxonomic microorganisms are specifically excluded.

本発明の「アシル特異的Cドメイン」は、BLASTP 2.0.10アルゴリズムを用いて、以下の2つのコンセンサス配列のうちの1つに少なくとも45%の同一性を有する配列が得られるポリペプチド配列として構造上定義される(filter option −F:false、gap opening penalty −G:11、gap extension penalty −E:1、かつ残りのすべてのオプションはデフォルト値):
>コンセンサス配列1
>コンセンサス配列2
この場合、コンセンサス配列1は、Streptomyces coelicolor A3(2)のカルシウム依存性抗生物質(CADA)座、Streptomyces roseosporus(NRRL 11379)のA21978C(DAPT)座、Streptomyces fradiae(ATCC 18158)のA54145座、Actinoplanes nipponensisのA410座、Streptomyces ghanaensis(NRRL B−12104)の009H座、及びStreptomyces refuineus(NRRL 3143)の024A座からのアシル特異的縮合ドメインの配列(GenBankアクセッション番号、CAB38517、CAB38518;CAB38516及びCAB38876)に基づき、また、コンセンサス配列2は、ラモプラニン(RAMO)座(Actinoplanes sp.ATCC 33076)、Streptomyces aizunensis(NRRL B−11277)由来の023C座、及び070B(Ecopia’s private culture collectionから発見された推定上のリポペプチド座)からのアシル特効薬縮合ドメインの配列に基づいている。
An “acyl-specific C domain” of the present invention is a polypeptide sequence that uses the BLASTP 2.0.10 algorithm to obtain a sequence having at least 45% identity to one of the following two consensus sequences: (Filter option -F: false, gap opening penalty -G: 11, gap extension penalty -E: 1, and all remaining options are default values):
> Consensus sequence 1
> Consensus sequence 2
In this case, the consensus sequence 1 consists of the calcium-dependent antibiotic (CADA) locus of Streptomyces coelicolor A3 (2), the A21978C (DAPT) nac8 es18a (ACC) of the Streptomyces roseosporus (NRRL 11379), and the Streptomyces 8A15 Sequences of acyl-specific condensation domains from the A410 locus, Streptomyces ghanaensis (NRRL B-12104) 009H locus, and Streptomyces refuinus (NRRL 3143) 024A locus (GenBank accession numbers, CAB16517, CAB3851; And the consensus sequence 2 is derived from the ramoplanin (RAMO) locus (Actinoplanes sp. ATCC 33076), the 023C locus from Streptomyces aizunnosis (NRRL B-11277), and 070B (Ecopia's priv cit) Based on the sequence of the acyl specific drug condensation domain from the putative lipopeptide locus.

これらのコンセンサス配列は、以下のように調製した。まず、これらの列記した配列は、デフォルト設定を用いて、ClustalX 1.81プログラムによりアライメントをとった。次いでプロファイル隠れマルコフモデル(hidden Markov model)(HMM)をHMMER2.2パッケージのhmmbuildプログラム(Sean Eddy、Washington University;world−wide−web hmmer.wustl.edu/)を用いてアラインメントファイルから作製し、ともにデフォルト設定を用いて、HMMERパッケージのhmmcalibrateプログラムにより調整した。簡単に言えば、隠れマルコフモデルプロファイルはファミリーコンセンサス配列の統計学的記述である。HMMERは、フリーで分配され得るタンパク質配列分析用のHMMプロファイルソフトウェアの実装であり、上記のウェブサイトから利用可能である。最後に、−cオプションを用いてHMMERパッケージのhmmemitプログラムによりHMMからコンセンサス配列を作製し、HMMの確率分布から1つの多数決原理コンセンサス配列を予測した。高度に保存されたアミノ酸残基(p>=0.5)は、このコンセンサス配列中、大文字で示し、それ以外は小文字で示している。   These consensus sequences were prepared as follows. First, these listed sequences were aligned by the ClustalX 1.81 program using default settings. Next, a hidden Markov model (HMM) was created from the hmmbuild program (Sean Eddy, Washington University; world-web hummer.wustl.edu. The default settings were used to adjust the hmmer package's hmmcalibrate program. Simply put, the hidden Markov model profile is a statistical description of the family consensus sequence. HMMER is an implementation of HMM profile software for protein sequence analysis that can be distributed freely and is available from the above website. Finally, a consensus sequence was created from the HMM by the hmmer program of the HMMER package using the -c option, and one majority rule consensus sequence was predicted from the probability distribution of the HMM. Highly conserved amino acid residues (p> = 0.5) are shown in capital letters in this consensus sequence, otherwise in lower case letters.

「アシル特異的縮合ドメイン(Cドメイン)をコードするポリヌクレオチド」とは、アシル特異的Cドメインをコードするポリヌクレオチドを意味する。本発明のアシル特異的Cドメインをコードするポリヌクレオチドの代表的な例としては、Actinoplanes sp.ATCC 33076由来のラモプラニン生合成遺伝子座に存在するアシル特異的Cドメインをコードするポリヌクレオチド(配列番号5)、Streptomyces roseosporus NRRL 11379のA21978C座に存在するアシル特異的Cドメインをコードするポリヌクレオチド(配列番号7)、Streptomyces fradiae ATCC 18158のA54145座に存在するアシル特異的Cドメインをコードするポリヌクレオチド(配列番号9)、Streptomyces ghanaensis NRRL B−12104のリポペプチド生合成遺伝子座に存在するアシル特異的Cドメインをコードするポリヌクレオチド(配列番号11)、Streptomyces refuineus NRRL 3143のリポペプチド生合成遺伝子座に存在するアシル特異的Cドメインをコードするポリヌクレオチド(配列番号13)、Streptomyces aizunensis NRRL B−11277のリポペプチド生合成遺伝子座に存在するアシル特異的Cドメインをコードするポリヌクレオチド(配列番号15)、Actinoplanes nipponensis FD 24834 ATCC 31145のリポペプチド生合成遺伝子座に存在するアシル特異的Cドメインをコードするポリヌクレオチド(配列番号17)、Ecopia’s private culture collectionのStreptomyces sp.の生合成遺伝子座に存在するアシル特異的Cドメインをコードするポリヌクレオチド(配列番号19)、及びStreptomyces coelicolor A3(2)由来のカルシウム依存性抗生物質生合成遺伝子座に存在するアシル特異的Cドメインをコードするポリヌクレオチド(配列番号21)を挙げることができる。ある実施形態では、Streptomyces coelicolor A3(2)由来のカルシウム依存性抗生物質生合成遺伝子座に存在するアシル特異的Cドメインをコードするポリヌクレオチド(配列番号21)と、GenBankアクセッション番号CAB 38518のNRPSタンパク質のCドメインのポリペプチド配列をコードするヌクレオチド配列(すなわち、CAB38518のNRPSのヌクレオチド配列を示すヌクレオチドアクセッション番号AL939115の座195135〜217526に等しい)を特に除く。他の実施形態では、放線菌分類群の微生物以外の微生物から得られるポリペプチド配列を除く。   “Polynucleotide encoding an acyl-specific condensation domain (C domain)” means a polynucleotide encoding an acyl-specific C domain. Representative examples of polynucleotides encoding the acyl-specific C domain of the present invention include Actinoplanes sp. Polynucleotide encoding an acyl-specific C domain present at the ramoplanin biosynthesis locus from ATCC 33076 (SEQ ID NO: 5), Polynucleotide encoding an acyl-specific C domain present at the A21978C locus of Streptomyces roseosporus NRRL 11379 (sequence No. 7), a polynucleotide encoding the acyl-specific C domain present in the A54145 locus of Streptomyces fradiae ATCC 18158 (SEQ ID NO: 9), an acyl-specific C present in the lipopeptide biosynthetic locus of Streptomyces ghanaensis NRRL B-12104 A polynucleotide encoding a domain (SEQ ID NO: 11), Streptomyces refuinus NR A polynucleotide encoding an acyl-specific C domain present at the lipopeptide biosynthesis locus of L 3143 (SEQ ID NO: 13), an acyl-specific C domain present at the lipopeptide biosynthesis locus of Streptomyces aizunensis NRRL B-11277 The encoding polynucleotide (SEQ ID NO: 15), the polynucleotide encoding the acyl-specific C domain present in the lipopeptide biosynthetic locus of Actinoplanes nipponensis FD 24834 ATCC 31145 (SEQ ID NO: 17), Ecopia's private collection collection sp. A polynucleotide encoding an acyl-specific C domain present in the biosynthetic locus of SEQ ID NO: 19 and an acyl-specific C domain present in the calcium-dependent antibiotic biosynthetic locus derived from Streptomyces coelicolor A3 (2) A polynucleotide (SEQ ID NO: 21) encoding can be mentioned. In one embodiment, a polynucleotide (SEQ ID NO: 21) encoding an acyl-specific C domain present at a calcium-dependent antibiotic biosynthetic locus from Streptomyces coelicolor A3 (2), and an NRPS with GenBank accession number CAB 38518 Specifically excluded is a nucleotide sequence that encodes the polypeptide sequence of the C domain of the protein (ie, equivalent to locus 195135-217526 of nucleotide accession number AL939115 indicating the nucleotide sequence of NRPS of CAB38518). In other embodiments, polypeptide sequences obtained from microorganisms other than actinomycete taxonomic microorganisms are excluded.

配列番号6、8、10、12、14、16、18及び20のアシル特異的Cドメインは、Biotechnology Information(NCBI)非冗長タンパク質データベースに対するNational Centerの配列と、微生物の遺伝子、経路及び天然産物のDECIPHER(登録商標)データベースの配列(Ecopia BioSciences Inc.、St−Laurent、Canada)について、デフォルトパラメーター設定のBLASTPアルゴリズムを用いて比較した。このBLAST解析のトップGenBankヒットのアクセッション番号は、対応するE値と共に表1に示している。E値は、2つの配列が十分な類似性を示すかどうかの検出を促進し、相同性の推論を証明するものである。E値は、確認されたアラインメントスコアに少なくとも等しいアラインメントスコアを有する見込みアラインメントの予測値を意味する。E値0.00は、完全な相同体を示す。E値は、Altschul et al.1990、J.Mol.Biol.215(3):403−410;Gish et al.、1993、Nature Genetics 3:266−272に記載されているようにして計算する。   The acyl-specific C domains of SEQ ID NOs: 6, 8, 10, 12, 14, 16, 18 and 20 include the National Center sequence for the Biotechnology Information (NCBI) non-redundant protein database and the genes, pathways and natural products of microorganisms. DECIPHER® database sequences (Ecopia BioSciences Inc., St-Laurent, Canada) were compared using the BLASTP algorithm with default parameter settings. The accession numbers of the top GenBank hits for this BLAST analysis are shown in Table 1 along with the corresponding E values. The E value facilitates the detection of whether two sequences show sufficient similarity and proves an inference of homology. The E value means a predicted value of a prospective alignment having an alignment score that is at least equal to the confirmed alignment score. An E value of 0.00 indicates a complete homologue. E values are reported in Altschul et al. 1990, J.A. Mol. Biol. 215 (3): 403-410; Gish et al. 1993, Nature Genetics 3: 266-272.

本明細書では、「アデニル化酵素」又はADLEは、リポペプチド生合成のN−アシルキャッピングに関与するタンパク質ファミリーのメンバーを意味する。本発明の代表的なアデニル化酵素としては、Actinoplanes sp.ATCC 33076のラモプラニン生合成遺伝子座に存在するアデニル化酵素(配列番号22)、Streptomyces roseosporus NRRL 11379のA21978C座に存在するアデニル化酵素(配列番号24)、Streptomyces ghanaensis NRRL B−12104のリポペプチドの生合成遺伝子座に存在するアデニル化酵素(配列番号26)、Streptomyces refuineus NRRL 3143のリポペプチド生合成遺伝子座に存在するアデニル化酵素(配列番号28)、Streptomyces aizunensis NRRL B−11277のリポペプチド生合成遺伝子座に存在するアデニル化酵素(配列番号30)、及びActinoplanes nipponensis FD 24834 ATCC 31145のリポペプチド生合成遺伝子座に存在するアデニル化酵素(配列番号32)が挙げられる。アデニル化酵素は融合タンパク質の一部であってもよい。例えば、Streptomyces fradiae ATCC 18158のA54145座に存在するアデニル化酵素は、ADLFと呼ばれる融合タンパク質の残基1〜648である(配列番号34)。   As used herein, “adenylation enzyme” or ADLE means a member of a protein family involved in N-acyl capping of lipopeptide biosynthesis. Representative adenylating enzymes of the present invention include Actinoplanes sp. Adenylation enzyme (SEQ ID NO: 22) present at the ramoplanin biosynthetic locus of ATCC 33076, adenylation enzyme (SEQ ID NO: 24) present at the A21978C locus of Streptomyces roseosporus NRRL 11379, and the NRRL lipo B12 peptide of Streptomyces ghanaensis NRRL B12 Adenylation enzyme (SEQ ID NO: 26) present at the synthetic locus, Adenylation enzyme (SEQ ID NO: 28) present at the lipopeptide biosynthesis locus of Streptomyces refuineus NRRL 3143, Lipopeptide biosynthesis gene of Streptomyces aizunensis NRRL B-11277 Adenylating enzyme present in the locus (SEQ ID NO: 30), and Actinoplanes nip an adenylating enzyme (SEQ ID NO: 32) present in the lipopeptide biosynthesis locus of Ponensis FD 24834 ATCC 31145. The adenylating enzyme may be part of a fusion protein. For example, the adenylating enzyme present at the A54145 locus of Streptomyces fradia ATCC 18158 is residues 1-648 of a fusion protein called ADLF (SEQ ID NO: 34).

アデニル化酵素は、BLASTP 2.0.10アルゴリズムを用いて、以下のコンセンサス配列に少なくとも55%の同一性を有する配列が得られるポリペプチド配列として構造上定義される(filter option −F:false、gap opening penalty −G:11、gap extension penalty −E:1、かつ残りのすべてのオプションはデフォルト値):
>コンセンサス配列3
この場合、コンセンサス配列3は、本明細書に記載されているDAPT、A410、009H、024A、RAMO及び023Cリポペプチド座のADLEポリペプチド配列、並びにA541リポペプチド座のADLF(下記に定義されているとおり)ポリペプチド配列の残基1〜648に基づいている。コンセンサス配列3は、コンセンサス配列1及び2に関して上に記載されているようにして得られた。
An adenylating enzyme is structurally defined using the BLASTP 2.0.10 algorithm as a polypeptide sequence that yields a sequence having at least 55% identity to the following consensus sequence (filter option -F: false, gap opening penalty -G: 11, gap extension penalty -E: 1, and all remaining options are default values):
> Consensus sequence 3
In this case, the consensus sequence 3 is the ADLE polypeptide sequence of DAPT, A410, 009H, 024A, RAMO and 023C lipopeptide loci described herein, and the ADLF of the A541 lipopeptide locus (as defined below). As) based on residues 1 to 648 of the polypeptide sequence. Consensus sequence 3 was obtained as described above for consensus sequences 1 and 2.

「アデニル化酵素をコードするポリヌクレオチド」又は「ポリADLEをコードするヌクレオチド」は、リポペプチド生合成のN−アシルキャッピングに関与するタンパク質のADLEファミリーのメンバーをコードするポリヌクレオチドを意味する。本発明のアデニル化酵素をコードする代表的なポリヌクレオチドとしては、Actinoplanes sp.ATCC 33076のラモプラニン生合成遺伝子座に存在するアデニル化酵素をコードするポリヌクレオチド(配列番号21)、Streptomyces roseosporus NRRL 11379のA21978C座に存在するアデニル化酵素をコードするポリヌクレオチド(配列番号23)、Streptomyces ghanaensis NRRL B−12104のリポペプチド生合成遺伝子座に存在するアデニル化酵素をコードするポリヌクレオチド(配列番号25)、Streptomyces refuineus NRRL 3143のリポペプチド生合成遺伝子座に存在するアデニル化酵素をコードするポリヌクレオチド(配列番号27)、Streptomyces aizunensis NRRL B−11277のリポペプチド生合成遺伝子座に存在するアデニル化酵素をコードするポリヌクレオチド(配列番号29)、及びActinoplanes nipponensis FD 24834 ATCC 31145のリポペプチド生合成遺伝子座に存在するアデニル化酵素をコードするポリヌクレオチド(配列番号31)が挙げられる。アデニル化酵素をコードするヌクレオチドは、融合タンパク質をコードする遺伝子の一部であってもよい。例えば、Streptomyces fradiae ATCC 18158のA54145座に存在するアデニル化酵素をコードするヌクレオチドは、ADLFと呼ばれる融合タンパク質をコードするヌクレオチドの残基1〜1944である(配列番号33)。ADLF融合タンパク質のADLE部分は、図中で星印「*」を付けて明示している場合がある。   "Polynucleotide encoding adenylation enzyme" or "nucleotide encoding polyADLE" means a polynucleotide encoding a member of the ADLE family of proteins involved in N-acyl capping of lipopeptide biosynthesis. Representative polynucleotides encoding the adenylating enzyme of the present invention include Actinoplanes sp. A polynucleotide encoding an adenylating enzyme present at the ramoplanin biosynthetic locus of ATCC 33076 (SEQ ID NO: 21), a polynucleotide encoding an adenylating enzyme present at the A21978C locus of Streptomyces roseosporus NRRL 11379 (SEQ ID NO: 23), Streptomyces Polynucleotide encoding an adenylation enzyme present in the lipopeptide biosynthesis locus of ghanaensis NRRL B-12104 (SEQ ID NO: 25), poly encoding an adenylation enzyme present in the lipopeptide biosynthesis locus of Streptomyces refrainus NRRL 3143 Nucleotide (SEQ ID NO: 27), Streptomyces aizunensis NRRL B-11 A polynucleotide encoding an adenylating enzyme present in 77 lipopeptide biosynthetic loci (SEQ ID NO: 29), and a polynucleotide encoding an adenylating enzyme present in the lipopeptide biosynthetic locus of Actinoplanes nipponensis FD24834 ATCC 31145 (SEQ ID NO: 31). The nucleotide encoding the adenylating enzyme may be part of the gene encoding the fusion protein. For example, the nucleotide encoding the adenylating enzyme present at the A54145 locus of Streptomyces fradia ATCC 18158 is residues 1-1944 of the nucleotide encoding a fusion protein called ADLF (SEQ ID NO: 33). The ADLE part of the ADLF fusion protein may be clearly indicated with an asterisk “*” in the figure.

配列番号24、26、28、30、31、32、及び配列番号34の残基1〜648のADLEポリペプチド、(すなわちADLEタンパク質を表わすADLF融合タンパク質の一部分)は、Biotechnology Information(NCBI)非冗長タンパク質データベースに対するNational Centerの配列と、微生物の遺伝子、経路及び天然産物のDECIPHER(登録商標)データベースの配列(Ecopia BioSciences Inc.、St−Laurent、Canada)について、デフォルトパラメーター設定のBLASTPアルゴリズムを用いて比較した。このBLAST解析のトップGenBankヒットのアクセッション番号は、対応するE値と共に表2に示している。   SEQ ID NO: 24, 26, 28, 30, 31, 32, and ADLE polypeptide of residues 1-648 of SEQ ID NO: 34 (ie, a portion of an ADLF fusion protein representing ADLE protein) is non-redundant in Biotechnology Information (NCBI) Comparison of National Center sequence against protein database with DECIPHER® database sequence of microbial genes, pathways and natural products (Ecopia BioSciences Inc., St-Laurent, Canada) using BLASTP algorithm with default parameter settings did. The accession numbers of the top GenBank hits in this BLAST analysis are shown in Table 2 along with the corresponding E values.

本明細書では、アシルキャリアタンパク質又はACPHという用語は、リポペプチド生合成のN−アシルキャッピングに関与するタンパク質のファミリーのメンバーを意味する。本発明の代表的なアシルキャリアタンパク質としては、Actinoplanes sp.ATCC 33076のラモプラニン生合成遺伝子座に存在するアシルキャリアタンパク質、(配列番号36)、Streptomyces roseosporus NRRL 11379のA21978C座に存在するアシルキャリアタンパク質(配列番号38)、Streptomyces ghanaensis NRRL B−12104のリポペプチド生合成遺伝子座に存在するアシルキャリアタンパク質(配列番号40)、Streptomyces refuineus NRRL 3143のリポペプチド生合成遺伝子座に存在するアシルキャリアタンパク質(配列番号42)、Streptomyces aizunensis NRRL B−11277のリポペプチド生合成遺伝子座に存在するアシルキャリアタンパク質(配列番号44)、及びActinoplanes nipponensis FD 24834 ATCC 31145のリポペプチド生合成遺伝子座に存在するアシルキャリアタンパク質(配列番号46)が挙げられる。アシルキャリアタンパク質は、融合タンパク質の一部であってもよい。例えば、Streptomyces fradiae ATCC 18158のA54145座に存在するアシルキャリアタンパク質は、ADLFと呼ばれる融合タンパク質の残基649〜743である(配列番号34)。ADLF融合タンパク質のACPH部分は、図中で2個の星印「**」を付けて明示している場合がある。   As used herein, the term acyl carrier protein or ACPH refers to a member of a family of proteins involved in N-acyl capping of lipopeptide biosynthesis. Representative acyl carrier proteins of the present invention include Actinoplanes sp. An acyl carrier protein present at the ramoplanin biosynthetic locus of ATCC 33076 (SEQ ID NO: 36), an acyl carrier protein present at the A21978C locus of Streptomyces roseosporus NRRL 11379 (SEQ ID NO: 38), a live Reptopyces ghanaensis NRRL B-12104 peptide An acyl carrier protein (SEQ ID NO: 40) present at a synthetic locus, an acyl carrier protein (SEQ ID NO: 42) present at a lipopeptide biosynthesis locus of Streptomyces refuineus NRRL 3143, a lipopeptide biosynthetic gene of Streptomyces aizunensis NRRL B-11277 Acyl carrier protein present at the locus ( Column number 44), and Actinoplanes nipponensis FD 24834 acyl carrier protein present in lipopeptide biosynthesis locus ATCC 31145 (SEQ ID NO: 46) can be mentioned. The acyl carrier protein may be part of a fusion protein. For example, the acyl carrier protein present at the A54145 locus of Streptomyces fradia ATCC 18158 is residues 649-743 of a fusion protein called ADLF (SEQ ID NO: 34). The ACPH portion of the ADLF fusion protein may be clearly indicated with two asterisks “**” in the figure.

アシルキャリアタンパク質(ACPH)は、BLASTP 2.0.10アルゴリズムを用いて、以下のコンセンサス配列に少なくとも50%の同一性を有する配列が得られるポリペプチド配列として構造上定義される(filter option −F:false、gap opening penalty −G:11、gap extension penalty −E:1、かつ残りのすべてのオプションはデフォルト値):
>コンセンサス配列4
この場合、コンセンサス配列4は、DAPT、A410、009H、024A、RAMO及び023Cリポペプチド座のACPHポリペプチド配列、並びにA541リポペプチド座のADLFポリペプチド配列の残基649〜743に基づいている。「ACPHをコードするポリヌクレオチド」は、上に定義したアシルキャリアタンパク質をコードするヌクレオチド配列として定義する。コンセンサス配列4は、コンセンサス配列1及び2について上に記載したのと同じようにして作製した。
An acyl carrier protein (ACPH) is structurally defined as a polypeptide sequence that uses the BLASTP 2.0.10 algorithm to yield a sequence having at least 50% identity to the following consensus sequence (filter option -F : False, gap opening penalty -G: 11, gap extension penalty -E: 1, and all remaining options are default values):
> Consensus array 4
In this case, consensus sequence 4 is based on residues 649-743 of the ACPH polypeptide sequence of the DAPT, A410, 009H, 024A, RAMO and 023C lipopeptide loci, and the ADLF polypeptide sequence of the A541 lipopeptide locus. “Polynucleotide encoding ACPH” is defined as a nucleotide sequence encoding an acyl carrier protein as defined above. Consensus sequence 4 was made in the same manner as described above for consensus sequences 1 and 2.

「アシルキャリアタンパク質をコードするポリヌクレオチド」又は「ACPHをコードするポリヌクレオチド」とは、リポペプチド生合成のN−アシルキャッピングに関与するタンパク質のACPHファミリーのメンバーをコードするポリヌクレオチドを意味する。本発明のアシルキャリアタンパク質をコードする代表的なポリヌクレオチドとしては、Actinoplanes sp.ATCC 33076 のラモプラニン生合成遺伝子座に存在するアシルキャリアタンパク質をコードするポリヌクレオチド(配列番号35)、Streptomyces roseosporus NRRL 11379のA21978C座に存在するアシルキャリアタンパク質をコードするポリヌクレオチド(配列番号37)、Streptomyces ghanaensis NRRL B−12104のリポペプチド生合成遺伝子座に存在するアシルキャリアタンパク質をコードするポリヌクレオチド(配列番号39)、Streptomyces refuineus NRRL 3143のリポペプチド生合成遺伝子座に存在するアシルキャリアタンパク質をコードするポリヌクレオチド(配列番号41)、Streptomyces aizunensis NRRL B−11277のリポペプチド生合成遺伝子座に存在するアシルキャリアタンパク質をコードするポリヌクレオチド(配列番号43)、及びActinoplanes nipponensis FD 24834 ATCC 31145のリポペプチド生合成遺伝子座に存在するアシルキャリアタンパク質をコードするポリヌクレオチド(配列番号45)が挙げられる。アシルキャリアタンパク質をコードするポリヌクレオチドは、融合タンパク質をコードする遺伝子の一部であってもよい。 例えば、Streptomyces fradiae ATCC 18158のA54145座に存在するアシルキャリアタンパク質をコードするポリヌクレオチドは、ADLFと呼ばれる融合タンパク質をコードするポリヌクレオチドの残基1945〜2229である(配列番号33)。   By “polynucleotide encoding an acyl carrier protein” or “polynucleotide encoding ACPH” is meant a polynucleotide encoding a member of the ACPH family of proteins involved in N-acyl capping of lipopeptide biosynthesis. Representative polynucleotides encoding the acyl carrier proteins of the present invention include Actinoplanes sp. A polynucleotide encoding an acyl carrier protein present in the ramoplanin biosynthesis locus of ATCC 33076 (SEQ ID NO: 35), a polynucleotide encoding an acyl carrier protein present in the A21978C locus of Streptomyces roseosporus NRRL 11379 (SEQ ID NO: 37), Streptomyces Polynucleotide encoding an acyl carrier protein present in the lipopeptide biosynthesis locus of ghanaensis NRRL B-12104 (SEQ ID NO: 39), poly encoding an acyl carrier protein present in the lipopeptide biosynthesis locus of Streptomyces refrainus NRRL 3143 Nucleotide (SEQ ID NO: 41), Streptomyces a polynucleotide encoding an acyl carrier protein present in the lipopeptide biosynthesis locus of aizunensis NRRL B-11277 (SEQ ID NO: 43), and an acyl carrier protein present in the lipopeptide biosynthesis locus of Actinoplanes nipponensis FD24834 ATCC 31145 And the encoding polynucleotide (SEQ ID NO: 45). The polynucleotide encoding the acyl carrier protein may be part of a gene encoding the fusion protein. For example, a polynucleotide encoding an acyl carrier protein present at the A54145 locus of Streptomyces fradia ATCC 18158 is residues 1945 to 2229 of a polynucleotide encoding a fusion protein called ADLF (SEQ ID NO: 33).

配列番号36、38、40、42、44及び46のACPHポリペプチドと配列番号34の残基649〜743(すなわちADLF融合タンパク質のACPH部分)は、Biotechnology Information(NCBI)非冗長タンパク質データベースに対するNational Centerの配列と、微生物の遺伝子、経路及び天然産物のDECIPHER(登録商標)データベースの配列(Ecopia BioSciences Inc.、St−Laurent、Canada)について、デフォルトパラメーター設定のBLASTPアルゴリズムを用いて比較した。このBLAST解析のトップGenBankヒットのアクセッション番号は、対応するE値と共に表3に示している。   The ACPH polypeptides of SEQ ID NOs: 36, 38, 40, 42, 44 and 46 and residues 649-743 of SEQ ID NO: 34 (ie, the ACPH portion of the ADLF fusion protein) are the National Center for Biotechnology Information (NCBI) non-redundant protein database. And DECIPHER® database sequences of microbial genes, pathways and natural products (Ecopia BioSciences Inc., St-Laurent, Canada) were compared using the BLASTP algorithm with default parameter settings. The accession numbers of the top GenBank hits for this BLAST analysis are shown in Table 3 along with the corresponding E values.

本明細書では、「ADLF」という用語は、A54145座に位置する1つのオープンリーディングフレーム(配列番号33)を意味する。この1つのオープンリーディングフレームは、互いに融合したADLE及びACPHタンパク質をコードする遺伝子によって形成されている。配列番号33のオープンリーディングフレームの遺伝子産物は、配列番号34に記載されているが、配列中、配列番号34の残基1〜648はADLEタンパク質を表わし、配列番号34の残基649〜743はACPHタンパク質を表わす。ADLE及びACPH相同体の同様の融合物が他のリポペプチド生合成遺伝子座でも起こり得ることが予想される。また、本発明のタンパク質ファミリーを含む他の置換融合タンパク質、例えば、ADLE及びACPHの融合物、及びアシル特異的Cドメイン、又はACPH及びアシル特異的Cドメインの融合物がリポペプチド座で発見され得ることも予想される。   As used herein, the term “ADLF” refers to one open reading frame (SEQ ID NO: 33) located at the A54145 locus. This one open reading frame is formed by genes encoding ADLE and ACPH proteins fused to each other. The gene product of the open reading frame of SEQ ID NO: 33 is described in SEQ ID NO: 34, wherein residues 1 to 648 of SEQ ID NO: 34 represent the ADLE protein and residues 649 to 743 of SEQ ID NO: 34 are Represents ACPH protein. It is anticipated that similar fusions of ADLE and ACPH homologs may occur at other lipopeptide biosynthetic loci. Also, other substitution fusion proteins comprising the protein family of the invention, such as fusions of ADLE and ACPH, and acyl-specific C domains, or fusions of ACPH and acyl-specific C domains can be found at the lipopeptide locus. It is also expected.

本発明の遺伝子を含有するコスミドクローンとタンパク質は、特許手続きの目的のための微生物寄託の国際承認に関するブダペスト条約の条件下において、カナダ国、R3E 3R2、マニトバ州、ウィニペグ、アーリントンストリート 1015のカナダ国保健省微生物局、カナダ国際寄託局(the International Depositary Authority of Canada、Bureau of Microbiology、Health Canada、1015 Arlington Street、Winnipeg、Manitoba、Canada R3E 3R2)に寄託されている。Actinoplanes sp.ATCC 33076のラモプラニンに関する生合成遺伝子座にACPH遺伝子とアシル特異的Cドメインを含有するコスミドクローン008CHの宿主である大腸菌DH10B株は、2001年9月19日に寄託し、寄託番号IDAC 190901−3が付与されている。Actinoplanes sp.ATCC 33076のラモプラニンに関する生合成遺伝子座にADLE遺伝子を含有するコスミドクローン008COの宿主であるE.coll DH10B株は、2001年9月19日に寄託し、寄託番号IDAC 190901−2が付与されている。Streptomyces refuineus subsp.thermotoleransのリポペプチドに関する生合成遺伝子座にADLE及びACPH遺伝子、並びにアシル特異的Cドメインを含有するコスミドクローン024CKの宿主である大腸菌DH10B株は2002年2月26日に寄託し、寄託番号IDAC 260202−5が付与されている。Streptomyces fradiaeのA54145リポペプチドに関する生合成遺伝子座にADLF融合タンパク質及びアシル特異的Cドメインを含有するコスミドクローン184CMの宿主である大腸菌DH10B株は、2002年2月26日に寄託し、寄託番号IDAC 260202−1が付与されている。大腸菌株の寄託物は、本明細書では「寄託株」と呼称する。   Cosmid clones and proteins containing the genes of the present invention can be obtained from Canada, R3E 3R2, Manitoba, Winnipeg, Arlington Street 1015, Canada, under the conditions of the Budapest Treaty on the International Approval of Deposits of Microorganisms for purposes of patent procedures. Department of Health Microbiology, Canadian International Depository of Canada, Bureau of Microbiology, Health Canada, 1015 Arlington Street, Winnipeg3, Manitoba3, Manitoba Actinoplanes sp. E. coli DH10B strain, the host of cosmid clone 008CH containing the ACPH gene and acyl-specific C domain at the biosynthetic locus for ramoplanin of ATCC 33076, was deposited on September 19, 2001, and deposit number IDAC 190901-3 is Has been granted. Actinoplanes sp. E. coli, the host of cosmid clone 008CO, which contains the ADLE gene at the biosynthetic locus for ramoplanin of ATCC 33076. The coll DH10B strain was deposited on September 19, 2001 and has been assigned the deposit number IDAC 190901-2. Streptomyces refineus subsp. The Escherichia coli DH10B strain, which is the host of the cosmid clone 024CK containing the ADLE and ACPH genes and the acyl-specific C domain at the biosynthetic locus for the lipopeptide of thermotolerans, was deposited on February 26, 2002 and deposited with IDAC 260202- 5 is given. The Escherichia coli DH10B strain, host of cosmid clone 184CM containing the ADLF fusion protein and acyl-specific C domain at the biosynthetic locus for the A54145 lipopeptide of Streptomyces fradiae, was deposited on February 26, 2002, deposit number IDAC 260202. -1 is assigned. Deposits of E. coli strains are referred to herein as “deposited strains”.

本明細書における配列の任意の記載に矛盾がある場合には、これらの寄託株中に存在するタンパク質ファミリーADLE、ADLF、ACPH及び本発明のアシル特異的Cドメインのメンバーをコードするヌクレオチド配列、並びに対応するポリペプチドのアミノ酸配列が優先(controlling)されている。寄託株、寄託株中の核酸、又は寄託株由来の化合物を作製、使用又は販売するには許諾が必要とされているが、かかる許諾は寄託により与えられるものではない。   In the event of any discrepancy in any description of the sequences herein, the nucleotide sequences encoding the protein families ADLE, ADLF, ACPH and members of the acyl-specific C domains of the invention present in these deposited strains, and The amino acid sequence of the corresponding polypeptide is prioritized. A license is required to make, use or sell the deposited strain, the nucleic acid in the deposited strain, or the compound derived from the deposited strain, but such permission is not granted by deposit.

本明細書では、「リポペプチド合成に関与するポリペプチド」という用語は、アシル特異的Cドメイン、アデニル化酵素、又はアシルキャリアタンパク質として本明細書に定義されている任意のポリペプチドを意味する。「リポペプチド合成に関与するポリヌクレオチド」とは、本明細書に定義されているようなリポペプチド合成に関与するポリペプチドをコードするヌクレオチド配列を意味する。   In this specification: The term "polypeptide involved in lipopeptide synthesis" An acyl-specific C domain, Adenylating enzyme, Or any polypeptide as defined herein as an acyl carrier protein. “Polynucleotides involved in lipopeptide synthesis” It means a nucleotide sequence that encodes a polypeptide involved in lipopeptide synthesis as defined herein.

本明細書では、「高ストリンジェンシーな条件」とは、本明細書に記載されているハイブリダイゼーション条件のうちの任意の1つ条件を意味し、かつ当技術分野で知られている他の「高ストリンジェンシーな」条件も含まれる。1つの条件では、まず、固定化した変性核酸を含有する高分子膜を、0.9MのNaCl、50mMのNaHP0(pH7.0)、5.0mMのNaEDTA、0.5%SDS、10× Denhardt’s、及び0.5mg/mlポリリボアデニル酸からなる溶液を用いて、45℃にて30分間、プレハイブリダイズする。次いで、約2×10cpm(比活性4〜9×10cpm/ug)の32P末端標識化オリゴヌクレオチドプローブを前記溶液に添加する。12〜16時間インキュベーションした後、0.5%SDSを含有する1×SET(150mM NaCl、20mMトリス塩酸塩(pH7.8)、1mM NaEDTA)で室温にて30分間前記膜を洗浄し、次いで、オリゴヌクレオチドプローブを、Tm−10℃にて新しい1×SET中で30分間洗浄した。ここで、Tmはプローブの融解温度である。プローブの融解温度より下に変更した温度でハイブリダイゼーションを行うことにより、ストリンジェンシーを変更することができる。プローブの融解温度は次式を用いて計算することができる:14〜70個のヌクレオチド長のオリゴヌクレオチドプローブについては、次式を用いて、摂氏温度の融解温度(Tm)を計算することができる:Tm=81.5+16.6(log[Na])+0.41(画分G+C)−(600/N)(式中、Nはオリゴヌクレオチド長である)。ホルムアミドを含有する溶液でハイブリダイゼーションを実施する場合、融解温度は次の式を用いて計算することができる:Tm=81.5+16.6(log[Na])+0.41(画分G+C)−(0.63%ホルムアミド)−(600/N)(式中、Nはプローブ長さである)。ヌクレオチド長が200を超えるプローブについては、ハイブリダイゼーションは15〜25℃下方のTmで実行することができる。オリゴヌクレオチドプローブなどの短いプローブについては、ハイブリダイゼーションは5〜10℃下方のTmで行うことができる。また、短いプローブについてはハイブリダイゼーションを6×SSCで行い、長いプローブについては、ハイブリダイゼーションを50%ホルムアミド含有溶液で行うのが好ましい。 As used herein, “high stringency conditions” means any one of the hybridization conditions described herein and other “articulation conditions” known in the art. Also included are “high stringency” conditions. In one condition, first, a polymer membrane containing immobilized denatured nucleic acid was treated with 0.9 M NaCl, 50 mM NaH 2 P0 4 (pH 7.0), 5.0 mM Na 2 EDTA, 0.5%. Prehybridize with a solution consisting of SDS, 10 × Denhardt's, and 0.5 mg / ml polyriboadenylic acid at 45 ° C. for 30 minutes. About 2 × 10 7 cpm (specific activity 4-9 × 10 8 cpm / ug) of 32 P-end labeled oligonucleotide probe is then added to the solution. After incubating for 12-16 hours, the membrane was washed with 1 × SET (150 mM NaCl, 20 mM Tris hydrochloride (pH 7.8), 1 mM Na 2 EDTA) containing 0.5% SDS for 30 minutes at room temperature, The oligonucleotide probe was then washed in fresh 1 × SET at Tm-10 ° C. for 30 minutes. Here, Tm is the melting temperature of the probe. By performing hybridization at a temperature that is changed below the melting temperature of the probe, the stringency can be changed. The melting temperature of the probe can be calculated using the following formula: For oligonucleotide probes 14-70 nucleotides in length, the melting temperature (Tm) in degrees Celsius can be calculated using the following formula: : Tm = 81.5 + 16.6 (log [Na + ]) + 0.41 (fraction G + C) − (600 / N) (where N is the length of the oligonucleotide). When performing hybridization with a solution containing formamide, the melting temperature can be calculated using the following formula: Tm = 81.5 + 16.6 (log [Na + ]) + 0.41 (fraction G + C) -(0.63% formamide)-(600 / N), where N is the probe length. For probes with nucleotide lengths greater than 200, hybridization can be performed at Tm below 15-25 ° C. For short probes such as oligonucleotide probes, hybridization can be performed at Tm below 5-10 ° C. For short probes, hybridization is preferably performed at 6 × SSC, and for long probes, hybridization is preferably performed in a 50% formamide-containing solution.

本明細書では、「相同性」という用語は、配列(ヌクレオチド又はアミノ酸のいずれか)の最適アラインメントを意味し、それはアルゴリズムのコンピュータ実装により実施することができる。例えばポリヌクレオチドに関する「相同性」は、デフォルトパラメーター設定のBLASTNバージョン2.0による解析によって検出することができる。また、ポリペプチド(すなわちアミノ酸)に関する「相同性」は、デフォルトパラメーター設定のBLASTPバージョン2.2.2などのプログラムにより検出することができる。この場合、比較するポリペプチド又はフラグメントのアライメントをとり、両者間のアミノ酸同一性又は類似性の程度を決定する。アミノ酸「相同性」には、同族置換(すなわち、同様の特性を有する別のアミノ酸によってポリペプチド中の特定のアミノ酸を置換するもの)が含まれることは理解されるであろう。典型的には、以下の置換を同族置換と見なされる:Ala、Val、Leu及びIleなどの脂肪族アミノ酸の別の脂肪族アミノ酸による置換;ThrによるSerの置換又はその逆;Asp又はGluなどの酸性残基の別の酸性残基による置換;アミド基を有する残基(Asn又はGlnなど)の別のアミド基を有する残基による置換;Lys又はArgなどの塩基性残基の別の塩基性残基による置換;Phe又はTyrなどの芳香族残基の別の芳香族残基による置換。「70%以上の相同性」には、2つ以上のヌクレオチド又はアミノ酸配列の間の、例えば70%、75%、80%、85%、90%、95%及び最高100%(同一)の相同性が含まれる。「少なくとも45%の相同性」には、2つ以上のヌクレオチド又はアミノ酸配列の間の、例えば45%、50%、60%、70%、80%、90%及び最高100%(同一)の相同性が含まれる。   As used herein, the term “homology” means an optimal alignment of sequences (either nucleotides or amino acids), which can be performed by computer implementation of the algorithm. For example, “homology” for a polynucleotide can be detected by analysis with BLASTN version 2.0 with default parameter settings. In addition, “homology” with respect to polypeptides (ie amino acids) can be detected by a program such as BLASTP version 2.2.2 with default parameter settings. In this case, the polypeptides or fragments to be compared are aligned, and the degree of amino acid identity or similarity between them is determined. It will be understood that amino acid “homology” includes cognate substitutions (ie, those that substitute a particular amino acid in a polypeptide by another amino acid having similar properties). Typically, the following substitutions are considered homologous substitutions: substitution of an aliphatic amino acid such as Ala, Val, Leu and Ile with another aliphatic amino acid; substitution of Ser with Thr or vice versa; such as Asp or Glu Replacement of an acidic residue with another acidic residue; Replacement of a residue having an amide group (such as Asn or Gln) with a residue having another amide group; Another basicity of a basic residue such as Lys or Arg Substitution with a residue; substitution of an aromatic residue such as Phe or Tyr with another aromatic residue. “70% or more homology” includes, for example, 70%, 75%, 80%, 85%, 90%, 95% and up to 100% (identical) homology between two or more nucleotide or amino acid sequences Sex is included. “At least 45% homology” includes, for example, 45%, 50%, 60%, 70%, 80%, 90% and up to 100% (identical) homology between two or more nucleotide or amino acid sequences Sex is included.

本発明は、リポペプチド生合成に関与するポリペプチド又はかかるポリペプチドをコードするポリヌクレオチドを検出する方法を提供する。   The present invention provides a method for detecting a polypeptide involved in lipopeptide biosynthesis or a polynucleotide encoding such a polypeptide.

一実施形態では、本発明の方法は、1つ又は複数の基準配列を提供し、候補配列(特定の1つの候補配列又は候補データベース配列のいずれか)を前記の1つ又は複数の基準配列と比較する。配列相同性は、比較した配列に対して検出される。1つ又は複数の基準配列に少なくとも45%の相同性を有している候補配列は、候補ポリペプチド又はリポペプチド生合成に関与している候補ポリペプチドをコードする候補ポリヌクレオチドであると考えられる。好ましくは、コンセンサス配列1又は2に45%の相同性を有する候補ポリペプチド配列をアシル特異的Cドメインポリペプチド候補と考え、コンセンサス配列3に55%の相同性を有する候補ポリペプチド配列をアデニル化酵素候補と考え、コンセンサス配列4に50%の相同性を有する候補ポリペプチド配列をアシルキャリアタンパク質候補と考える。リポペプチド生合成におけるこれらの同定された配列の関与については、まず、ポリヌクレオチド候補のポリペプチドを発現させ、当技術分野で周知であり、実施例1〜2で本明細書に記載されている方法により機能分析を行うことによって確認することができる。   In one embodiment, the method of the present invention provides one or more reference sequences and a candidate sequence (either one particular candidate sequence or a candidate database sequence) with said one or more reference sequences. Compare. Sequence homology is detected against the compared sequences. A candidate sequence having at least 45% homology to one or more reference sequences is considered a candidate polynucleotide that encodes a candidate polypeptide or a candidate polypeptide involved in lipopeptide biosynthesis. . Preferably, a candidate polypeptide sequence having 45% homology to consensus sequence 1 or 2 is considered an acyl-specific C domain polypeptide candidate and a candidate polypeptide sequence having 55% homology to consensus sequence 3 is adenylated A candidate polypeptide sequence having 50% homology to consensus sequence 4 is considered an enzyme candidate and an acyl carrier protein candidate. The involvement of these identified sequences in lipopeptide biosynthesis is first known to express polynucleotide candidate polypeptides and is well known in the art and described herein in Examples 1-2. It can be confirmed by performing functional analysis by the method.

本発明の別の実施形態では、この主題の方法は、1つ又は複数の基準配列を、特定の微生物の候補データベース内の配列と比較する。本方法は、特定の微生物が、リポペプチド生合成に関与するポリペプチド又はかかるポリペプチドをコードするポリヌクレオチドを含有し得るかどうかを検出する。特定の微生物がリポペプチド生合成に関するポリペプチドをコードするかかるポリヌクレオチド配列を含有し得ることが検出された場合、当技術分野で周知であり、かつ実施例1〜2に本明細書に記載されている方法に従って、候補データベース(例えば全体の遺伝子配列の一部)由来のタンパク質を発現させ分析することができる。   In another embodiment of the invention, the subject method compares one or more reference sequences to sequences in a candidate database for a particular microorganism. The method detects whether a particular microorganism can contain a polypeptide involved in lipopeptide biosynthesis or a polynucleotide encoding such a polypeptide. If it is detected that a particular microorganism can contain such a polynucleotide sequence encoding a polypeptide for lipopeptide biosynthesis, it is well known in the art and described herein in Examples 1-2. In accordance with existing methods, proteins from candidate databases (eg, part of the entire gene sequence) can be expressed and analyzed.

好ましい実施形態では、本主題の方法で用いる基準配列は、RAMO、DAPT、A541、009H、024A、023C、A410、070B及びCADAからなる群から選択される1つ又は複数の生合成遺伝子座のアシル特異的Cドメイン、ADLE、ACPH及びADLFを表わすポリヌクレオチド又はポリペプチドの配列からなる群から選択される。   In a preferred embodiment, the reference sequence used in the subject method is an acyl of one or more biosynthetic loci selected from the group consisting of RAMO, DAPT, A541, 009H, 024A, 023C, A410, 070B and CADA. Selected from the group consisting of sequences of polynucleotides or polypeptides representing specific C domains, ADLE, ACPH and ADLF.

別の好ましい実施形態では、基準配列は、配列番号1又は配列番号2に少なくとも45%の配列相同性を有する1つ又は複数の基準ポリペプチド、配列番号3に少なくとも55%の配列相同性を有する1つ又は複数の基準ポリペプチド、配列番号4に少なくとも50%の配列相同性を有する1つ又は複数の基準ポリペプチド、あるいはかかるポリペプチド配列をコードする1つ又は複数の基準ポリヌクレオチドをさらに含んでいてもよい。   In another preferred embodiment, the reference sequence has one or more reference polypeptides having at least 45% sequence homology to SEQ ID NO: 1 or SEQ ID NO: 2, at least 55% sequence homology to SEQ ID NO: 3 Further comprising one or more reference polypeptides, one or more reference polypeptides having at least 50% sequence homology to SEQ ID NO: 4, or one or more reference polynucleotides encoding such polypeptide sequences You may go out.

さらに、本発明の範囲内には、コンピュータによりアクセス可能なデータを格納するメモリシステム、コンピュータプログラム及び配列比較用のデータを含むコンピュータ解読可能媒体、並びに本発明の配列比較を行うコンピュータシステムがある。   Further within the scope of the present invention are a memory system for storing computer accessible data, a computer readable medium containing computer program and sequence comparison data, and a computer system for performing the sequence comparison of the present invention.

本発明のコンピュータシステムは、RAMO、DAPT、A541、009H、024A、023C、A410、070B及びCADAから選択される1つ又は複数の生合成遺伝子座内のアシル特異的Cドメイン、アデニル化酵素(ADLE)又はアシルキャリアタンパク質ACPHあるいはそれら2つの融合物(ADLF)を表すポリヌクレオチド配列又はポリペプチド配列からなる群から選択される、1つ又は複数の基準ポリヌクレオチド配列又は基準ポリペプチド配列を提供する。   The computer system of the present invention comprises an acyl-specific C domain, adenylation enzyme (ADLE) within one or more biosynthetic loci selected from RAMO, DAPT, A541, 009H, 024A, 023C, A410, 070B and CADA. Or one or more reference polynucleotide sequences or reference polypeptide sequences selected from the group consisting of polynucleotide sequences or polypeptide sequences representing acyl carrier protein ACPH or a fusion of the two (ADLF).

さらに、又はあるいは、本発明のコンピュータシステムは、本発明のコンセンサス配列を含む1つ又は複数の基準ポリペプチド、すなわち、配列番号1又は配列番号2に少なくとも45%の配列相同性を有する1つ又は複数の基準ポリペプチド、配列番号3に少なくとも55%の配列相同性を有する1つ又は複数の基準ポリペプチド、配列番号4に少なくとも50%の配列相同性を有する1つ又は複数の基準ポリペプチド、あるいはかかるポリペプチド配列をコードする1つ又は複数の基準ポリヌクレオチドを提供する。   Additionally or alternatively, the computer system of the present invention provides one or more reference polypeptides comprising a consensus sequence of the present invention, ie, one or at least 45% sequence homology to SEQ ID NO: 1 or SEQ ID NO: 2. A plurality of reference polypeptides, one or more reference polypeptides having at least 55% sequence homology to SEQ ID NO: 3, one or more reference polypeptides having at least 50% sequence homology to SEQ ID NO: 4, Alternatively, one or more reference polynucleotides encoding such polypeptide sequences are provided.

また、本発明のコンピュータシステムは、候補ポリヌクレオチド配列又はポリペプチド配列を提供することができる。候補ポリヌクレオチド又はポリペプチドは、特定の一配列として存在してもよく、あるいは、候補データベース(例えば、微生物の全遺伝子配列の一部、又はタンパク質ファミリー配列)であってもよい。   The computer system of the present invention can also provide candidate polynucleotide sequences or polypeptide sequences. Candidate polynucleotides or polypeptides may exist as a particular sequence, or may be a candidate database (eg, part of the entire microbial gene sequence, or protein family sequence).

本発明のコンピュータシステムは、1つ又は複数の候補配列と1つ又は複数の基準配列の間の配列比較を行う。また、本コンピュータシステムは、比較した2つ以上の配列の相同性レベルを検出し、配列番号1又は配列番号2と少なくとも45%の相同性を有する候補配列を同定する。また、ある実施形態では、配列番号3と少なくとも55%の相同性を有する候補配列、又は配列番号4と少なくとも50%の相同性を有する候補配列をさらに同定する。   The computer system of the present invention performs a sequence comparison between one or more candidate sequences and one or more reference sequences. The computer system also detects the homology level of two or more sequences compared and identifies candidate sequences having at least 45% homology with SEQ ID NO: 1 or SEQ ID NO: 2. In some embodiments, candidate sequences having at least 55% homology with SEQ ID NO: 3 or candidate sequences having at least 50% homology with SEQ ID NO: 4 are further identified.

本発明のメモリ及びコンピュータシステムにより、1つ又は複数の基準配列に対する前記配列の相同性について候補データベース及び個別の候補配列を検索する方法を迅速に展開することができる。さらに、本発明のメモリ及びコンピュータシステムにより、ポリヌクレオチド配列からタンパク質配列の予測を、2つ以上のポリペプチド間の相同タンパク質ドメインの予測を、かつ配列データから構造と機能の解析をすることができる。   The memory and computer system of the present invention allows rapid development of methods for searching candidate databases and individual candidate sequences for homology of the sequences to one or more reference sequences. In addition, the memory and computer system of the present invention enables prediction of protein sequences from polynucleotide sequences, prediction of homologous protein domains between two or more polypeptides, and analysis of structure and function from sequence data. .

コンピュータは、ポリペプチド又はポリヌクレオチドの配列の同定、分析又はモデリングを達成する方法を実行するようにプログラムすることができる。一実施形態では、本発明のメモリは、配列番号1、2、3、4、6、8、10、12、14、16、18、20、22、24、26、28、30、32、34、36、38、40、42、44、46及び48からなる群から選択される、任意の1つの配列に70%の配列相同性を有するポリペプチドを表わすデータを含有する。本発明によるソースデータベース用のデータを取得し得る好ましい方法は、図12及び図13に説明している。   The computer can be programmed to perform a method that accomplishes the identification, analysis or modeling of the sequence of the polypeptide or polynucleotide. In one embodiment, the memory of the present invention comprises SEQ ID NO: 1, 2, 3, 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34. , 36, 38, 40, 42, 44, 46 and 48, containing data representing a polypeptide having 70% sequence homology to any one sequence. A preferred method by which data for a source database according to the present invention can be obtained is illustrated in FIGS.

メモリ及びコンピュータシステムの1つの使用には、微生物のゲノム(例えばデータベース候補配列)を調査し、そのゲノム中のポリヌクレオチド/ポリペプチド配列と1つ又は複数の基準ポリヌクレオチド配列又はポリペプチド配列の間の配列相同性を検出することが含まれる。かかる情報における重要な目的は、微生物がリポペプチド生合成遺伝子座又はリポペプチド生合成に関与する任意のポリヌクレオチド/ポリペプチドを含有しているかどうかを判定することである。   One use of a memory and computer system is to examine a microbial genome (eg, a database candidate sequence) and between a polynucleotide / polypeptide sequence and one or more reference polynucleotide sequences or polypeptide sequences in the genome. Detection of sequence homology. An important objective in such information is to determine whether the microorganism contains a lipopeptide biosynthesis locus or any polynucleotide / polypeptide involved in lipopeptide biosynthesis.

メモリ及びコンピュータシステムの別の使用には、1つ又は複数の特定の候補配列を調査し、その特定の候補ポリヌクレオチド/ポリペプチド配列と1つ又は複数の基準ポリヌクレオチド又は基準ポリペプチド配列の間の配列相同性を検出することが含まれる。かかる情報は、特定の候補配列がリポペプチド生合成に関与するかどうかを決定するのに有用である。   Another use of the memory and computer system is to examine one or more particular candidate sequences and between that particular candidate polynucleotide / polypeptide sequence and one or more reference polynucleotides or reference polypeptide sequences. Detection of sequence homology. Such information is useful for determining whether a particular candidate sequence is involved in lipopeptide biosynthesis.

特定のポリヌクレオチド候補配列又はポリヌクレオチドデータベース候補配列が分析されている場合には、メモリ及びコンピュータシステムによって候補配列からオープンリーディングフレーム(ORF)を予測することができる。ORFは、ポリペプチドに翻訳され得るヌクレオチド配列に対応する。かかる配列の伸長は停止コドンによって中断されない。完全長タンパク質のコード配列を表わすORFは、一般にATGの「開始」コドンから開始され、3種類の「停止」コドンのうちの1つで終了する。この用途の目的においては、ORFは、開始コドン及び/又は停止コドンを含むか、あるいは含まない、コード配列の任意の部分であってよい。ORFを正当な細胞タンパク質をコードする良好な候補として考える場合、最小規模の要件として、例えば、50個以上のアミノ酸からなるタンパク質をコードするDNAの伸長が設定させることが多い。   If a particular polynucleotide candidate sequence or polynucleotide database candidate sequence is being analyzed, an open reading frame (ORF) can be predicted from the candidate sequence by a memory and computer system. The ORF corresponds to a nucleotide sequence that can be translated into a polypeptide. Such sequence extension is not interrupted by a stop codon. An ORF that represents the coding sequence of a full-length protein generally begins with an ATG “start” codon and ends with one of three “stop” codons. For purposes of this application, the ORF may be any portion of the coding sequence that may or may not include a start codon and / or a stop codon. When considering the ORF as a good candidate for encoding a legitimate cell protein, as a minimum requirement, for example, extension of a DNA encoding a protein consisting of 50 or more amino acids is often set.

上記の配列情報操作を容易に実施し理解するためには、精巧なコンピュータデータベースシステムを用いることができる。一実施形態では、基準配列は、公共の配列データベースから入手可能な情報により電子的に記録し、かつ注釈が施される。かかるデータベースの例としては、GenBank(NCBI)及びthe Comprehensive Microbial Resource(The Institute for Genomic Research)databaseが挙げられる。得られた情報は、ゲノム内の及びゲノム中の基準配列及び遺伝子の間の相同性を検出するために使用可能なリレーショナルデータベースに格納する。   To easily implement and understand the above sequence information manipulation, an elaborate computer database system can be used. In one embodiment, the reference sequence is electronically recorded and annotated with information available from a public sequence database. Examples of such databases include GenBank (NCBI) and the Comprehensive MicroResource (The Institute for Genomic Research) database. The resulting information is stored in a relational database that can be used to detect homology within and within the genome and between reference sequences and genes.

配列間の相同性を同定するには、例えば、BLAST(Basic Local Alignment Search Tool)又はFAST(スミスウォーターマンアルゴリズムを使用)などの1つ又は複数の配列アラインメントアルゴリズムを用いることができる。特に好ましい実施形態では、これらの2つのアライメントプロトコルを組み合わせて用いる。これらのアルゴリズムは両方とも2つの配列間の類似領域を検索する;スミスウォーターマンアルゴリズムは、一般にギャップに対する許容が高く、BLAST検索による予備マッチを行った後に、より高度な分析マッチを行うために用いられる。これらのアルゴリズムは、(1)2つの配列の類似領域間のアライメントと、(2)配列間の同一性パーセントを検出する。例えば、アライメントは、本質的な類似性の領域をマッチング(各塩基ごと又は各アミノ酸ごと)することにより計算することができる。   To identify homology between sequences, one or more sequence alignment algorithms can be used, such as BLAST (Basic Local Alignment Search Tool) or FAST (using Smithwaterman algorithm). In a particularly preferred embodiment, these two alignment protocols are used in combination. Both of these algorithms search for similar regions between two sequences; the Smithwaterman algorithm is generally more tolerant of gaps and is used to perform more advanced analytical matches after performing a preliminary match with a BLAST search . These algorithms detect (1) alignment between similar regions of two sequences and (2) percent identity between sequences. For example, the alignment can be calculated by matching (for each base or each amino acid) regions of essential similarity.

図11は、本発明の一実施形態によるコンピュータシステムのブロック線図である。図11に示した本発明の配列比較処理の実施に関するシステムは、単独で、又は特定処理コンピュータとの組み合わせで用いられる汎用コンピュータであってよい。かかる処理は、1つのプラットフォームによって、又は分散処理プラットフォームによって実施することができる。さらにかかる処理及び機能性は、特殊目的ハードウェアの形態で、又は汎用コンピュータにより実行されているソフトウェアの形態でインプリメントすることができる。かかる処理で扱われた、又はかかる処理の結果作製された任意のデータは、一時記憶装置に、例えば、一定のコンピュータシステム又はサブシステムのRAMに格納することができる。さらに、又はあるいは、かかるデータは、長期的な記憶装置、例えば磁気ディスク、書換可能な光ディスクなどに格納することができる。本明細書の開示の目的においては、コンピュータ解読可能な媒体は、かかる既存のメモリ技術、並びに、かかる構造の、及びかかるデータのハードウェア表示又は回路表示をはじめとする、データ保存機構のすべての形態を含み得る。   FIG. 11 is a block diagram of a computer system according to an embodiment of the present invention. The system relating to the execution of the sequence comparison process of the present invention shown in FIG. 11 may be a general-purpose computer used alone or in combination with a specific processing computer. Such processing can be performed by one platform or by a distributed processing platform. Further, such processing and functionality can be implemented in the form of special purpose hardware or in the form of software being executed by a general purpose computer. Any data handled in such processing or created as a result of such processing can be stored in a temporary storage device, for example, in a RAM of a certain computer system or subsystem. Additionally or alternatively, such data can be stored on long-term storage devices such as magnetic disks, rewritable optical disks, and the like. For the purposes of this disclosure, computer-readable media includes all such data storage mechanisms, including such existing memory technology and hardware or circuit representations of such structures and such data. It may include a form.

コンピュータシステム40(図11)は、リレーショナルデータベースマネジメントシステム、ワールドワイドウェブアプリケーション及びワールドワイドウェブサーバーを実行するオペレーティングシステム(例えばUNIX(登録商標))を含んでいてもよい。コンピュータシステム上のソフトウェアは多数の構成をとることができる。例えば、それは一台のマシンで提供されるか、あるいは複数のマシンにわたって分配され得る。   The computer system 40 (FIG. 11) may include an operating system (eg, UNIX®) that runs a relational database management system, a world wide web application, and a world wide web server. The software on the computer system can take a number of configurations. For example, it can be provided on a single machine or distributed across multiple machines.

ワールドワイドウェブアプリケーションには、データベース言語ステートメント[例えば、標準照会言語(SQL)ステートメント]の作製に必要な実行可能コードが含まれている。一般に、実行ファイルは埋め込みSQLステートメントを含んでいる。さらに、ワールドワイドウェブアプリケーションには、サーバーを含む種々のソフトウェア実体へのポインター及びアドレスを含有するコンフィギュレーションファイル、サービスユーザリクエストにアクセスが可能でなければならない種々の外部及び内部データベースが含まれていてもよい。また、コンフィギュレーションファイルは、適当なハードウェアにサーバーリソースのレクエストを指示する。必要に応じて、2台以上の個別のコンピュータ上にサーバーを分配すべきである。   World Wide Web applications include executable code necessary to create database language statements [eg, standard query language (SQL) statements]. In general, an executable file contains embedded SQL statements. In addition, the World Wide Web application includes configuration files containing pointers and addresses to various software entities, including servers, and various external and internal databases that must be accessible to service user requests. Also good. The configuration file also directs the request for server resources to appropriate hardware. If necessary, servers should be distributed on two or more separate computers.

ワールドワイドウェブブラウザは、ユーザインターフェース10(図11)を提供するために用いることができる。ウェブブラウザを介して、ユーザは、配列データベース及び/又はゲノムのデータベースからデータを検索することの検索リクエストを作成することができる。したがって、ユーザは典型的には、グラフィカルユーザインターフェースで慣用のボタン、プルダウンメニュー、スクロールバーなどのユーザインターフェースエレメントを指し示しクリックする。ユーザのウェブブラウザでそのように作成されたリクエストはウェブアプリケーションに送信され、そこでは、配列データベース又はゲノムデータベースから関係のある情報を抽出するために使用可能なクエリーを得るためにそれらをフォーマットする。   The world wide web browser can be used to provide the user interface 10 (FIG. 11). Via a web browser, a user can create a search request to retrieve data from a sequence database and / or a genomic database. Thus, the user typically points and clicks on user interface elements such as conventional buttons, pull-down menus, scroll bars, etc. in a graphical user interface. Requests so created in the user's web browser are sent to the web application where they are formatted to obtain a query that can be used to extract relevant information from the sequence database or genomic database.

ネットワーク40がワールドワイドウェブサーバーを用いる場合、TCP/IPプロトコルをサポートする。このようなローカルネットワークを「イントラネット」と称する場合もある。かかるイントラネットの長所は、イントラネットがワールドワイドウェブ上に存在するパブリックドメインデータベース(例えばGenBankワールドワイドウェブサイト)と容易にコミュニケーションすることができるということである。したがって、本発明の特に好ましい実施形態では、ユーザは、ウェブブラウザ及びウェブサーバーにより提供されるHTMLインターフェースを用いて、インターネットデータベース上に存在するデータに(例えば、ハイパーテキストリンクを介して)直接アクセスすることができる。   When the network 40 uses a world wide web server, it supports the TCP / IP protocol. Such a local network may be referred to as an “intranet”. The advantage of such an intranet is that it can easily communicate with a public domain database (eg GenBank world wide web site) that exists on the world wide web. Thus, in a particularly preferred embodiment of the present invention, a user directly accesses data residing on an Internet database (eg, via a hypertext link) using an HTML interface provided by a web browser and web server. Can do.

リポペプチドのN−アシル化に関与する保存された遺伝子及びタンパク質
本発明のアシル特異的Cドメイン並びにADLE、ADLF及びACPHタンパク質ファミリーは、いくつかの完全長の生合成座を同定し、特徴化し、比較することにより発見されており、それぞれ、既知の構造のリポペプチドを産生するとともに、既知の構造のリポペプチドを産生することが報告されている微生物中に存在している。
Conserved genes and proteins involved in N-acylation of lipopeptides The acyl-specific C domains and ADLE, ADLF and ACPH protein families of the present invention identify and characterize several full-length biosynthetic loci, They have been discovered by comparison, and are present in microorganisms that are reported to produce lipopeptides of known structure and to produce lipopeptides of known structure, respectively.

RAMO:ラモプラニンはActinoplanes sp.ATCC 33076により産生されるリポペプチドである(米国特許第4,303,646号を参照されたい)。ラモプラニンは既知の構造のグリコシル化リポデプシペプチドである(例えば、米国特許第4,427,656号を参照されたい)。Actinoplanes sp.由来のラモプラニンに関する完全長の生合成座(RAMO)をクローン化し、配列決定した(図1a)。また、RAMO中のオープンリーディングフレームを同定した。機能はオープンリーディングフレームによりコードされている各タンパク質によるものであった。RAMOは、同時係属中の米国出願第09/976,059号、及びWO 02/31155号として公開されているPCT国際出願PCT/CA01/01462号に詳細に記載される。   RAMO: Ramoplanin is a product of Actinoplanes sp. A lipopeptide produced by ATCC 33076 (see US Pat. No. 4,303,646). Ramoplanin is a glycosylated lipodepsipeptide of known structure (see, eg, US Pat. No. 4,427,656). Actinoplanes sp. The full length biosynthetic locus (RAMO) for ramoplanin from was cloned and sequenced (FIG. 1a). In addition, an open reading frame in RAMO was identified. The function was due to each protein encoded by the open reading frame. RAMO is described in detail in co-pending US application Ser. No. 09 / 976,059 and PCT International Application PCT / CA01 / 01462, published as WO 02/31155.

DAPT:A21978CはStreptomyces roseosporusにより産生されるリポペプチドである。A21978Cの構造は周知である。Streptomyces roseosporus(DAPT)のA21978Cの産生をもたらす生合成座の解明に向けたいくつかの進捗状況が報告されているが、完全長の遺伝子座は知られていなかった。DAPTの位置を確認するためにトランスポゾン突然変異技術が行われており[McHenney et al.(1998)J.Bact.Vol.180 pp.143−151]、DAPT由来のDNA断片を挿入突然変異試験に用いたところ、A21978C産生の不活性化が示された。この断片のDNA配列の解析により、A21978C生合成に関与するNRPS遺伝子の存在が明らかになった。この遺伝子及び生物学上のデータは、紛れもなく、同定された経路がA21978C発現に実際に関与していたことを示していた。しかし、A21978Cに関する完全長の生合成座はこれまで報告されていなかった。   DAPT: A21978C is a lipopeptide produced by Streptomyces roseosporus. The structure of A21978C is well known. Although some progress has been reported towards elucidating the biosynthetic locus that leads to the production of A21978C of Streptomyces roseosporus (DAPT), the full-length locus has not been known. Transposon mutation techniques have been performed to confirm the position of DAPT [McHenney et al. (1998) J. MoI. Bact. Vol. 180 pp. 143-151], a DNA fragment derived from DAPT was used in an insertion mutation test, which showed inactivation of A21978C production. Analysis of the DNA sequence of this fragment revealed the presence of the NRPS gene involved in A21978C biosynthesis. This genetic and biological data clearly showed that the pathway identified was actually involved in A21978C expression. However, the full-length biosynthetic locus for A21978C has not been reported so far.

DAPTのクローン化に用いた方法、すなわち、7つの完全なオープンリーディングフレーム(ORF)及び1つの部分的オープンリーディングフレーム(図1a)から作製された部分的遺伝子座は、米国特許出願第60/342,133号に記載されている。Actinomycetesは一般にNRPSタンパク質を用いてリポペプチドを産生し、発見された多くのORFはNRPSタンパク質に対応していた。さらに、発見されたNRPS ORFの1つは、A21978C座の一部であることが以前に明らかにされていた部分的NRPS配列を含有しており、それによりDAPTの同一性が確認された。米国特許出願第60/342,133号で7〜9と呼称されているORFのモジュール及びドメイン構成解析は、米国特許出願第60/342,133号に詳細に記載されているA21978Cの生合成が予測されていたものと一致している。ORF 7〜9により指定されているアミノ酸残基の性質及び配列は、A21978Cの正確な化学構造と一致する(米国特許出願第60/342,133号の表3及び図1を参照されたい)。米国特許出願第60/342,133号に詳細に記載されているこの解析は、紛れもなく、DAPTが実際にS.roseosporus由来のA21978Cの関する生合成座であることを示している。   The method used to clone DAPT, a partial locus generated from seven complete open reading frames (ORF) and one partial open reading frame (FIG. 1a) is described in US patent application Ser. No. 60/342. , 133. Actinomycetes generally produced lipopeptides using NRPS proteins, and many of the ORFs that were discovered corresponded to NRPS proteins. In addition, one of the discovered NRPS ORFs contained a partial NRPS sequence that was previously revealed to be part of the A21978C locus, thereby confirming DAPT identity. The ORF module and domain structure analysis, designated 7-9 in US Patent Application No. 60 / 342,133, is a biosynthesis of A21978C described in detail in US Patent Application No. 60 / 342,133. It is consistent with what was expected. The nature and sequence of amino acid residues specified by ORF 7-9 is consistent with the exact chemical structure of A21978C (see Table 3 of US Patent Application No. 60 / 342,133 and FIG. 1). This analysis, described in detail in US Patent Application No. 60 / 342,133, is undeniable and DAPT is actually S. It shows that it is a biosynthetic locus related to A21978C derived from roseporus.

A541:Streptomyces fradiae株NRRL 18158は、既知の構造のリポペプチド抗生物質複合体A54145を産生することが周知であった。しかし、Streptomyces fradiae(A541)のA54145に関する生合成座は知られていなかった。本発明者らは、米国特許出願第60/342,133号、米国特許出願第60/372,789号、及び同時係属中で、かつ米国特許出願第60/342,133号及び米国特許出願第60/372,789号の優先権を主張している、米国特許出願第10/XXX,XXX号(本出願と同時に出願され、タイトルが「Genes and Proteins Involved in the Biosynthesis of Lipopeptides」である)に詳細に記載されているようにして、A541をクローン化し、配列決定し、注釈を付した。米国特許出願第10/XXX,XXX号の内容は、すべての目的のためにその全文を本明細書に組み入れるものとする。   A541: Streptomyces fradia strain NRRL 18158 was well known to produce lipopeptide antibiotic complex A54145 of known structure. However, the biosynthetic locus for A54145 of Streptomyces fradiae (A541) was not known. We have identified U.S. Patent Application No. 60 / 342,133, U.S. Patent Application No. 60 / 372,789, and copending and U.S. Patent Application No. 60 / 342,133 and U.S. Patent Application No. US patent application Ser. No. 10 / XXX, XXX claiming priority of 60 / 372,789 (filed simultaneously with this application and entitled “Genes and Proteins Involved in the Biosynthesis of Lipopeptides”) A541 was cloned, sequenced and annotated as described in detail. The contents of US patent application Ser. No. 10 / XXX, XXX are incorporated herein in their entirety for all purposes.

A541は3つの完全な遺伝子と1つの部分的NRPS遺伝子を含んでいる(図1b)。NRPS ORFの解析によりアミノ酸の認識、活性化、改変及び縮合に関与する、保存されたドメインの存在が明らかになった。13個のアミノ酸残基の縮合を担っている合計13個のモジュールは、A54145が13個のアミノ酸から構成されると考えると、予想通りに同定された。アデニル化ドメインを試験して、活性化し、NRPSの同系統のチオール化ドメインに結合するそれらのアミノ酸の特異性を検出した。NRPS ORFによって指定されたアミノ酸残基の性質及び配列は、A54145化学構造で発見されたアミノ酸残基の性質及び配列に正確に一致する(米国特許出願第60/372,789号の表4及び図2を参照されたい)。ORF 8(アミノ酸のグリシンを指定する米国特許出願第60/372,789号に記載されるモジュール5)のメチル化ドメインは、N−メチル化グリシン(サルコシン)であるA54145の第5番目の位置に組み入れられたアミノ酸に一致する。NRPS遺伝子によって指定されたアミノ酸の性質及び配列、並びにアミノ酸のうちの一部の改変に関与するドメインの存在は、A541が実際はS.fradiaeのA54145の生合成座であることを確認するものである。   A541 contains three complete genes and one partial NRPS gene (FIG. 1b). Analysis of the NRPS ORF revealed the existence of conserved domains involved in amino acid recognition, activation, modification and condensation. A total of 13 modules responsible for the condensation of 13 amino acid residues were identified as expected given that A54145 is composed of 13 amino acids. Adenylation domains were tested to detect the specificity of those amino acids that were activated and bound to the same line of thiolated domains of NRPS. The nature and sequence of amino acid residues specified by the NRPS ORF exactly matches the nature and sequence of amino acid residues found in the A54145 chemical structure (Table 4 and Figure of US Patent Application No. 60 / 372,789). 2). The methylation domain of ORF 8 (module 5 described in US Patent Application No. 60 / 372,789 which specifies the amino acid glycine) is in the fifth position of A54145, which is N-methylated glycine (sarcosine). Matches the incorporated amino acid. The nature and sequence of amino acids specified by the NRPS gene, as well as the presence of domains involved in the modification of some of the amino acids, are actually shown in A.S. It is confirmed that it is a biosynthetic locus of A54145 of fradiae.

RAMO、DAPT及びA541を分析し、かつ比較した。3つの遺伝子座はすべて、従来のアデニル化−チオール化ドメインの代わりに縮合ドメインから始まるNRPSローディングモジュールを含有する(図1a及びb、各々、配列番号6、8及び10)。かかるモジュールは、仮定上のペプチド構築を開始することが不可能であり、Cドメインが恐らくこの開始プロセスを妨げるであろうということが一般には考えられる(例えば、Linne and Marahiel、2000、Biochemistry、Vol.39、pp.10439−10447を参照されたい)。RAMO、DAPT及びA541の特異NRPS Cドメインの保存されたファミリーメンバーのヌクレオチド配列は、各々、配列番号5、7及び9に記載されている。RAMO、DAPT及びA541の特異NRPS Cドメインの保存されたファミリーメンバーをコードするポリペプチドは、各々、配列番号6、8及び10に記載されている。   RAMO, DAPT and A541 were analyzed and compared. All three loci contain NRPS loading modules that begin with a condensation domain instead of the conventional adenylation-thiolation domain (FIGS. 1a and b, SEQ ID NOs: 6, 8, and 10, respectively). Such modules are generally unable to initiate hypothetical peptide construction and it is generally considered that the C domain will likely interfere with this initiation process (eg, Linne and Marahiel, 2000, Biochemistry, Vol. .39, pp. 10439-10447). The nucleotide sequences of the conserved family members of RAMO, DAPT and A541 specific NRPS C domains are set forth in SEQ ID NOs: 5, 7 and 9, respectively. Polypeptides encoding conserved family members of the specific NRPS C domains of RAMO, DAPT and A541 are set forth in SEQ ID NOs: 6, 8 and 10, respectively.

これらのCドメインは、BLASTPアルゴリズム(Altschul et al.上掲)を用いて、タンパク質配列のGenBankデータベース(National Center for Biotechnology Information、National Library of Medicine、Bethesda、MD、USA)で確認されたタンパク質とのコンピュータによる比較により判断し、その結果を表1に示している。アミノ酸配列比較の解析によれば、RAMO、DAPT及びA541のCドメインが他のリポペプチドをコードするNRPS系で発見された縮合ドメインと関係があることが明らかにされている。   These C domains were identified in the GenBank database of protein sequences (National Center for Biotechnology Information, National Library of Medicine, Bethesda, MD, USA) using the BLASTP algorithm (Altschul et al., Supra). Judgment was made by computer comparison, and the results are shown in Table 1. Analysis of amino acid sequence comparisons reveals that the C domains of RAMO, DAPT, and A541 are related to condensation domains discovered in NRPS systems encoding other lipopeptides.

RAMO、DAPT及びA541 Cドメインを、GenBankから得られたか、本明細書に記載された種々のリポペプチドNRPSに由来した縮合ドメインのコレクションと比較した。図2にはこれらのCドメインの進化の関連性を示している。RAMO、DAPT、A541とは別に、図2は、4つの文字による呼称を用いて、追加のリポペプチド生合成座を表している。この場合、CADAはカルシウム依存性抗生物質の生合成座であり、FENGはフェンギシン(fengycin)の生合成座であり、SURFはスルファクチン(surfactin)の生合成座であり、SYRIはシリンゴマイシン(syringomycin)の生合成座であり、SERRはセラウェッチン(serrawettin)の生合成座であり、LICHはリチェニシン(lichenysin)の生合成座であり、ITURはイツリン(iturin)の生合成座であり、MYSUはマイコスブチリン(mycosubtilin)の生合成座である。この解析に含まれているCドメインはすべて完全長のCドメインである。図2のCドメインを同定し、識別するために用いられた取り決めは以下のとおりである。GenBankデータベースから得られたNRPS Cドメイン配列は、3文字で始まり、数字(通常5桁)が続くアクセッションによって表示されている。各Cドメインを同定するこれらの第1の8つの特性は、GenBankアクセッション番号に対応する。小文字の「n」は、「NRPSドメイン」であることを表し、「CD」とその後の2桁の数字は、「Cドメイン」とポリペプチド配列上に含まれている他のCドメインと相対するその数字を示す。例えば「AAC80285nCD06|SYRI」は、シリンゴマイシンの生合成座由来のNRPSについてGenBankエントリーAAC80285に含有されている6番目のCドメインに対応するアミノ酸配列を表わす。本出願で、米国仮特許出願第60/342,133号で、又は米国特許出願第09/976,059号で初めて記載されているNRPS Cドメイン配列は、同様の命名法(nCD00)に従うが、3桁の数字で始まる9文字のアクセッションによって表示されている。   The RAMO, DAPT and A541 C domains were compared to collections of condensation domains obtained from GenBank or derived from various lipopeptides NRPS described herein. FIG. 2 shows the evolutionary relevance of these C domains. Apart from RAMO, DAPT, A541, FIG. 2 represents an additional lipopeptide biosynthetic locus using a four letter designation. In this case, CADA is the biosynthetic locus for calcium-dependent antibiotics, FENG is the biosynthetic locus for fengycin, SURF is the biosynthetic locus for sulfactin, and SYRI is syringomycin. ), SERR is the biosynthesis locus of serawetin, LICH is the biosynthesis locus of lichenysin, ITUR is the biosynthesis locus of iturin, and MYSU is the mycosbutillin. (Mycosubtilin) biosynthetic locus. All C domains included in this analysis are full-length C domains. The convention used to identify and identify the C domain of FIG. 2 is as follows. The NRPS C domain sequence obtained from the GenBank database is displayed by an accession starting with 3 letters followed by a number (usually 5 digits). These first eight characteristics that identify each C domain correspond to GenBank accession numbers. A lowercase “n” represents an “NRPS domain”, and “CD” followed by two digits is relative to the “C domain” and other C domains contained on the polypeptide sequence. The number is shown. For example, “AAC80285nCD06 | SYRI” represents an amino acid sequence corresponding to the sixth C domain contained in GenBank entry AAC80285 for NRPS derived from the biosynthesis locus of syringomycin. The NRPS C domain sequences first described in this application, in US Provisional Patent Application No. 60 / 342,133, or in US Patent Application No. 09 / 976,059 follow a similar nomenclature (nCD00) It is displayed with a nine-character accession starting with a three-digit number.

Cドメインのクラスタアライメントの解析によれば、これらのドメインが、数ある中でも(図2)、カルシウム依存性抗生物質(CADA)(図1e、ドメイン22)、スルファクチン(SURF)、シリンゴマイシン(SYRI)及びマイコサブチリン(MYCO)などの既知のN−アシル化リポペプチドの開始モジュールで確認されたCドメインと進化的に関与していることを示唆している。さらに、これらの特定のCドメインは、隣接した2個のアミノ酸間のアミド結合形成と縮合を触媒するNRPSで確認された規則的な縮合ドメインから顕著にかつ進化的に遠位である(図2)。これらの特異Cドメインのアライメントは、それらの触媒活性にとって重要なモチーフ及び特定のアミノ酸残基の保存を示している(図3)。これらの知見に基づくと、この特異Cドメインは、脂肪酸とアミノ酸のアミノ末端基の間のN−アシルペプチド結合を触媒するものと考えられる。   According to the analysis of cluster alignment of C domains, these domains are, among others (FIG. 2), calcium-dependent antibiotics (CADA) (FIG. 1e, domain 22), sulfactin (SURF), syringomycin (SYRI). ) And mycosubtilin (MYCO), suggesting evolutionary involvement with the C domain identified in the initiation module of known N-acylated lipopeptides. Furthermore, these particular C domains are markedly and evolutionarily distant from the regular condensation domains identified in NRPS that catalyze amide bond formation and condensation between two adjacent amino acids (FIG. 2). ). The alignment of these specific C domains shows the conservation of motifs and specific amino acid residues that are important for their catalytic activity (Figure 3). Based on these findings, this specific C domain is thought to catalyze the N-acyl peptide bond between the fatty acid and the amino terminal group of the amino acid.

A541の活性化酵素をコードする遺伝子は、アシルキャリアタンパク質をコードする遺伝子と一緒になって縮合し、1つのORF(ADLF)を形成するが、活性化酵素(ADLE)の保存ファミリーがRAMO、DAPT及びA541に共通であることがさらに確認された。RAMO、DAPT及びA541中の活性化酵素の保存されたファミリーメンバーのヌクレオチド配列は、各々、配列番号23、25及び35として記載されている。また、これらの活性化酵素をコードするポリペプチドは、各々、配列番号24、26及び36として記載されている。ADLF融合タンパク質のADLE活性化酵素部分は、配列番号36として表している。 The gene encoding the activation enzyme of A541 is condensed together with the gene encoding the acyl carrier protein to form one ORF (ADLF), but the conserved family of activation enzymes (ADLE) is RAMO, DAPT And A541 were further confirmed. The nucleotide sequences of conserved family members of activating enzymes in RAMO, DAPT and A541 are set forth as SEQ ID NOs: 23, 25 and 35, respectively. Polypeptides encoding these activating enzymes are described as SEQ ID NOS: 24, 26, and 36, respectively. The ADLE activating enzyme portion of the ADLF fusion protein is represented as SEQ ID NO: 36 * .

A541のアシルキャリアタンパク質をコードする遺伝子は、活性化酵素をコードする遺伝子と一緒になって縮合し、1つのORF(ADLF)を形成するが、アシルキャリアタンパク質(ACPH)の保存されたファミリーがRAMO、DAPT及びA541に共通であることが確認された。RAMO、DAPT及びA541中のアシルキャリアタンパク質の保存されたファミリーのメンバーのヌクレオチド配列は、各々、配列番号37、39及び35として記載されている。これらのアシルキャリアタンパク質をコードするポリペプチドは、各々、配列番号38、40及び36として記載されている。ADLF融合タンパク質のACPHアシルキャリア部分を配列番号36**として表している。 The gene encoding the acyl carrier protein of A541 is condensed together with the gene encoding the activating enzyme to form one ORF (ADLF), but the conserved family of acyl carrier proteins (ACPH) is RAMO , DAPT and A541 were confirmed to be common. The nucleotide sequences of members of the conserved family of acyl carrier proteins in RAMO, DAPT, and A541 are set forth as SEQ ID NOs: 37, 39, and 35, respectively. Polypeptides encoding these acyl carrier proteins are set forth as SEQ ID NOs: 38, 40, and 36, respectively. The ACPH acyl carrier portion of the ADLF fusion protein is represented as SEQ ID NO: 36 ** .

ADLE、ADLF及びACPHのORFについての生物学上の機能は、アミノ酸配列類似性解析によって評価した。タンパク質のADLEファミリーは、各種のアシルCoAリガーゼ酵素との類似性を示した。この場合、タンパク質のACPHファミリーは、アシル縮合ポリケチド合成酵素系で確認されたアシルキャリアタンパク質との配列類似性を有している(表2及び表3)。ADLE ORFのクラスタアライメントは、それらの酵素機能にとって重要なドメイン及び残基の保存を示している(図4)。ACPH ORFのアライメントは、それらの全体の配列保存と、ホスホパンテテイニル化(phosphopantetheinylation)により修飾されて活性ホロ−アシルキャリアタンパク質を形成するセリン残基の絶対的保存を示している(図5)。ADLE及びACPHの両タンパク質ファミリーは、他のリポペプチド遺伝子座由来の対応タンパク質ファミリーに進化的かつ密接に関係している(図6)。   Biological functions for ADLE, ADLF and ACPH ORFs were assessed by amino acid sequence similarity analysis. The ADLE family of proteins showed similarity to various acyl CoA ligase enzymes. In this case, the ACPH family of proteins has sequence similarity to the acyl carrier proteins identified in the acyl condensed polyketide synthase system (Tables 2 and 3). The cluster alignment of the ADLE ORF shows the conservation of domains and residues important for their enzyme function (FIG. 4). The alignments of ACPH ORFs show their overall sequence conservation and the absolute conservation of serine residues that are modified by phosphopantetheylation to form active holo-acyl carrier proteins (FIG. 5). . Both the ADLE and ACPH protein families are evolutionarily and closely related to the corresponding protein families from other lipopeptide loci (FIG. 6).

ADLE及びACPHタンパク質並びに本発明のアシル特異的Cドメインは、グリコシル化リポペプチド及び酸性糖タンパク質をはじめとする、構造上異なったリポペプチドの生合成遺伝子座の全体にわたって広く保存されている。ラモプラニン(A21978C及びA54145)に共通の唯一の構造上の特徴は、N末端アミノ酸残基で脂肪アシル基が付加されているペプチドバックボーンである。これらの相互関係に基づくと、ADLE及びACPHのタンパク質、並びに特異Cドメインは、脂肪アシル基の活性化及び結合、並びにN−アシルペプチド結合の形成の触媒を可能にしているものと考えられる。   The ADLE and ACPH proteins and the acyl-specific C domains of the present invention are widely conserved throughout the biosynthetic loci of structurally distinct lipopeptides, including glycosylated lipopeptides and acidic glycoproteins. The only structural feature common to ramoplanin (A21978C and A54145) is a peptide backbone with a fatty acyl group added at the N-terminal amino acid residue. Based on these interrelationships, it is believed that the ADLE and ACPH proteins and the specific C domain enable catalysis of the activation and binding of fatty acyl groups and the formation of N-acyl peptide bonds.

N−アシル化ペプチドの生合成:
本発明に記載されているリポペプチドを産生する微生物間の有意な全体の進化の距離にかかわらず、それらはすべて密接に関連のある複数のCドメインを含有しており、前記ドメインはペプチドN−アシル化(ペプチド鎖開始ステップの役を兼ねる1つのステップ)に用いられている。任意の特定の生合成スキーム又は作用機構に限定されるものではないが、ADLE、ACPH及び本発明の特異NRPS Cドメインにより、リポペプチドで確認されているN−アシルペプチド結合の形成を説明することができる。図7は、脂肪アシル基がNRPSによるペプチドの合成を準備するNRPS連鎖開始の機構を説明している。CoA結合脂肪アシル前駆体は、第1の代謝プールからチャネルされ、かつ変性され、その上さらに、一次代謝の遺伝子によって、又は生合成遺伝子座内の遺伝子によってコードされている、オキシドレダクターゼ、エポキシダーゼ、デサチュラーゼなど補助酵素によってCoAに結合される。次いで、成熟脂肪酸アシル−CoA中間体は同系統のアデニル化酵素により認識され、遊離のホロ−ACPのホスホパンテテイン補欠分子族上に転送されるが、その工程ではCoA−SHの遊離とATPの利用がある。あるいは、アデニル化酵素が遊離脂肪アシル基質を認識し、工程においてATPを利用しながら、遊離のホロ−ACPのホスホパンテテイン補欠分子族上にそれらを移送することが予測される。一度、遊離のホロ−ACP上に脂肪アシル基を結合すると、第1モジュールのCドメインは、活性化脂肪アシルのカルボニル基が、NRPSの第1モジュールにより前に活性化されており、結合されていたアミノ酸基質のアミノ基で縮合される反応を行う。このため、ペプチド鎖開始とN−アシル化は緊密に結びついている。次いで、その後のペプチド伸長と終結の各ステップは、典型的なNRPSモジュールによるもののようにして進めることができる。
Biosynthesis of N-acylated peptides:
Regardless of the significant overall evolutionary distance between the microorganisms producing the lipopeptides described in the present invention, they all contain multiple closely related C domains, said domains comprising peptide N- It is used for acylation (one step that also serves as a peptide chain initiation step). Explain the formation of N-acyl peptide bonds identified in lipopeptides by ADLE, ACPH and specific NRPS C domains of the present invention, but not limited to any particular biosynthetic scheme or mechanism of action Can do. FIG. 7 illustrates the mechanism of NRPS chain initiation in which fatty acyl groups prepare the synthesis of peptides by NRPS. CoA-linked fatty acyl precursors are channeled from the first metabolic pool and denatured, and further encoded by a gene of primary metabolism or by a gene in a biosynthetic locus, epoxidase It is bound to CoA by an auxiliary enzyme such as desaturase. The mature fatty acyl-CoA intermediate is then recognized by the same family of adenylating enzymes and transferred onto the free holo-ACP phosphopantethein prosthetic group, in which process the release of CoA-SH and ATP There is use. Alternatively, it is expected that adenylating enzymes will recognize free fatty acyl substrates and transfer them onto the free holo-ACP phosphopantethein prosthetic group while utilizing ATP in the process. Once the fatty acyl group is attached onto the free holo-ACP, the C domain of the first module is attached to the activated fatty acyl carbonyl group previously activated by the first module of the NRPS. The reaction is condensed with the amino group of the amino acid substrate. For this reason, peptide chain initiation and N-acylation are closely linked. Subsequent peptide extension and termination steps can then proceed as in a typical NRPS module.

図8は、既知のリポペプチド生合成経路の特定の例を用いて、上記のアミノ酸N−アシル化機構を説明する。ラモプラニン生合成では、ADLE酵素が特定の脂肪酸成分を活性化し、続いて、ACPHのホスホパンテテイン補欠分子族上にそれら成分を結合する(本明細書では、配列番号24及び配列番号38として記載されている)。次いで、活性化された脂肪アシルのカルボニル基は前にNRPSの第1のモジュールにより活性されており、かつそれに結合されていたアスパラギン残基(Asn)のアミノ基に縮合される。この縮合反応は、アシル特異的Cドメインにより触媒される(NRPSの第1のモジュールのもの、本明細書では配列番号6として記載されている)(図1a及び図8)。   FIG. 8 illustrates the amino acid N-acylation mechanism described above using a specific example of a known lipopeptide biosynthesis pathway. In ramoplanin biosynthesis, the ADLE enzyme activates certain fatty acid components and subsequently binds them on the phosphopantethein prosthetic group of ACPH (described herein as SEQ ID NO: 24 and SEQ ID NO: 38). ing). The activated fatty acyl carbonyl group is then condensed to the amino group of the asparagine residue (Asn) previously activated by and attached to the first module of NRPS. This condensation reaction is catalyzed by an acyl-specific C domain (from the first module of NRPS, described herein as SEQ ID NO: 6) (FIGS. 1a and 8).

別の例では、抗生物質A54145のアシル化ペプチド鎖の生合成は、活性化と、本明細書では配列番号36として記載されているADLFタンパク質のACPH成分上の特定の脂肪酸単位の結合により開始される。ADLFは、リポペプチド生合成における脂肪酸の活性化に必要な、2種類のタンパク質ファミリー(ADLE及びACPH)の融合物を表わす。一度、この脂肪酸が活性化されると、第1モジュールのアシル特異的Cドメイン(本明細書では配列番号10として記載されている)は、脂肪アシルのカルボニル基と、NRPSの第1モジュールにより前に活性化されており、それに結合されていたトリプトファン残基(Trp)のアミノ基の縮合を触媒する(図1b及び図8)。   In another example, biosynthesis of the acylated peptide chain of antibiotic A54145 is initiated by activation and binding of specific fatty acid units on the ACPH component of the ADLF protein described herein as SEQ ID NO: 36. The ADLF represents a fusion of two protein families (ADLE and ACPH) required for fatty acid activation in lipopeptide biosynthesis. Once this fatty acid is activated, the acyl-specific C domain of the first module (described herein as SEQ ID NO: 10) is preceded by the fatty acyl carbonyl group and the first module of NRPS. It catalyzes the condensation of the amino group of the tryptophan residue (Trp) bound to it (FIGS. 1b and 8).

ペプチドのN−アシル化についての同一機構が他の微生物に存在するかもしれない。この仮説を立証する証拠としては、非常に多様な微生物中で同定された他のリポペプチドNRPS酵素が、第1モジュール中の特定化Cドメインを含有しているという事実が挙げられる。その例としては、Pseudomonas syringae pv.syringae由来のシリンゴマイシン生合成遺伝子座;(Guenzi et al.(1998)J.Biol.Chem.Vol.273、pp.32857−32863);Serratia liquefasciens MG1由来のセラウェッチンW2生合成遺伝子座(Lindum et al.(1998)Vol.180、pp.6384−6388);Bacillus subtilis b213及びA1/3由来のフェンギシンの生合成遺伝子座(Steller et al.(1999)Chem.Biol.Vol.6、pp.31−41);Bacillus swotilis由来のスルファクチンの生合成遺伝子座;Bacillus licheniformis由来のリケニシンの生合成遺伝子座(Konz et al.(1999)J.Bact.Vol.181、pp.133−140);及びStreptomyces coelicolor A3(2)由来の「カルシウム依存性抗生物質」(CADA)の生合成遺伝子座(Hajati et al.(2002)Chem.Biol.Vol.9、pp.1175−1187)が挙げられる。明らかに、CADAの生合成遺伝子座はアデニル化酵素相同体を有していない。しかし、前記遺伝子座は、N−アシル化機構の第1のNRPSモジュールの特異Cドメインと一緒になって関与し得る遊離アシルキャリアタンパク質を含有している。したがって、ある種の脂肪酸は、アシルキャリアタンパク質上に脂肪アシル成分を移送することを特定の酵素に要求し得る。しかし一度遊離アシルキャリアタンパク質上に結合されると、その機構は図7に概説されているような機構に類似する。また、CDAの脂肪アシル成分が、それがエポキシ修飾を含有しているという点で特異であることが指摘されていることに注目すべきである。このため、かかる脂肪酸は、他のある特定の酵素によりACP上に移送され得る。   The same mechanism for N-acylation of peptides may exist in other microorganisms. Evidence supporting this hypothesis includes the fact that other lipopeptide NRPS enzymes identified in a wide variety of microorganisms contain the specialized C domain in the first module. As an example, Pseudomonas syringae pv. Sylingae derived syringomycin biosynthetic locus; (Guenzi et al. (1998) J. Biol. Chem. Vol. 273, pp. 32857-32863); al. (1998) Vol. 180, pp. 6384-6388); Bacillus subtilis b213 and A1 / 3 derived biosynthetic loci (Steller et al. (1999) Chem. Biol. Vol. 6, pp. 31). -41); sulfactin biosynthesis locus derived from Bacillus swotilis; lichenisin biosynthesis locus derived from Bacillus licheniformis ( onz et al. (1999) J. Bact. Vol.181, pp.133-140); and Streptomyces coelicolor A3 (2) biosynthetic locus (Hadati et al.). (2002) Chem.Biol.Vol.9, pp.1175-1187). Clearly, the CADA biosynthetic locus does not have adenylase homologs. However, the locus contains a free acyl carrier protein that can participate in conjunction with the specific C domain of the first NRPS module of the N-acylation mechanism. Thus, certain fatty acids may require certain enzymes to transfer the fatty acyl component onto the acyl carrier protein. However, once bound on a free acyl carrier protein, the mechanism is similar to that outlined in FIG. It should also be noted that the fatty acyl component of CDA has been pointed out to be unique in that it contains an epoxy modification. For this reason, such fatty acids can be transported onto the ACP by certain other specific enzymes.

本発明のN−アシル化機構が、細菌を越えて、さらに異なる微生物(低真核生物及び他の有機体など)まで及んでいる可能性がある。例えば、カビのAspergillus nidulans var.roseus、Glarea lozoyensis、及びAspergillus japonicus var.aculeatusは、各々、抗菌性のリポペプチド類、エキノカンジンB、プノイモカンジンBO、及びアクレアシンAを産生することが周知である(Hino et al.(2001)Journal of Industrial Microbiology and Biotechnology Vol.27、pp.157−162)。カビの及び細菌のNRPS系の間の相対的類似性と、非常に多様なNRPS系がN−アシル化の同一機構を利用しているという本発明者らが示した事実によれば、本発明に記載されているペプチドN−アシル化の機構は、これらの、及び/又は他のリポペプチドを産生する低真核生物において同様に作用しているであろう。   The N-acylation mechanism of the present invention may extend beyond bacteria to different microorganisms such as low eukaryotes and other organisms. For example, the mold Aspergillus nidulans var. roseus, Glarea lozoyensis, and Aspergillus japanicus var. aculeatus is well known to produce antibacterial lipopeptides, echinocandin B, pneumocandin BO, and acreasin A, respectively (Hino et al. (2001) Journal of Industrial Microbiology and Biotechnology V. 15). -162). According to the relative similarity between the mold and bacterial NRPS systems and the fact that we have shown that a wide variety of NRPS systems utilize the same mechanism of N-acylation, the present invention The mechanism of peptide N-acylation described in is likely to work similarly in lower eukaryotes producing these and / or other lipopeptides.

ペプチドのN−アシル化について記載されている機構は明らかに非常に多様な微生物にわたって広がっているが、それはリポペプチドを産生することができる唯一の手段ではない。例えば、Bacillus subtilis ATCC及びRB14によって各々産生されたリポペプチド類のミコスブチリンとイツリンAは、互いに、融合脂肪酸合成酵素、アミノ転移酵素及びNRPS活性を含む多官能価のハイブリッドポリペプチドによって構築されている(Duitman et al.(1999)Proc.Natl.Acad.Sci USA.Vol.96、pp.13294−13299;Tsuge et al.(2001)J.Bact、Vol.183、pp.6265−6273)。このペプチドN−アシル化の代替機構は、我々の知っている限りにおいては、より進化的に制限される可能性があり、その機構はBacillus属のメンバーにおいてのみ同定されている。また、これらの生合成遺伝子座によって産生されたリポペプチドは、ペプチドコアのアミノ末端に結合されているβ−アミノ脂肪アシル成分を含有するリポペプチドの異なる亜属のメンバーである。N−アシル化のこの機構がADLE及びACPHの相同体に関与していないという事実にかかわらず、図2に示したように、ミコスブチリンとイツリン両方の第1アミノ酸にβ−アミノ脂肪アシル成分を縮合するCドメインが、アシル特異的Cドメインの強調した群内のクラスタで確認されている。   Although the mechanism described for N-acylation of peptides clearly extends across a very wide variety of microorganisms, it is not the only means by which lipopeptides can be produced. For example, the lipopeptides Mycos butyrin and Iturin A, produced by Bacillus subtilis ATCC and RB14, respectively, are constructed from multi-functional hybrid polypeptides that each contain fused fatty acid synthase, aminotransferase and NRPS activity ( (Dutman et al. (1999) Proc. Natl. Acad. Sci USA. Vol. 96, pp. 13294-13299; Tsuge et al. (2001) J. Bact, Vol. 183, pp. 6265-6273). This alternative mechanism of peptide N-acylation, to the best of our knowledge, may be more evolutionary limited and has been identified only in members of the genus Bacillus. Also, lipopeptides produced by these biosynthetic loci are members of different subgenera of lipopeptides containing a β-amino fatty acyl component attached to the amino terminus of the peptide core. Despite the fact that this mechanism of N-acylation is not involved in homologues of ADLE and ACPH, the β-amino fatty acyl component is condensed to the first amino acid of both mycosbutyrin and iturin as shown in FIG. C domains are identified in clusters within the highlighted group of acyl-specific C domains.

ペプチド天然産物についての広範囲なN−アシル化機構により、微生物中のリポペプチド生合成遺伝子座を発見及び同定する知識に基づいた手法を得ることができる。アデニル化酵素、アシルキャリアタンパク質、及び/又はN−アシル化機構に関与する特定のCドメインの特性を識別している高度に保存されたヌクレオチド配列は、対象の微生物中のリポペプチド生合成遺伝子座をすばやく同定し、単離し、特徴付けることを目的として、微生物のゲノムDNAライブラリーをスクリーニングするプローブとして同定、利用することができる。また、ADLE、ACPHタンパク質及びアシル特異的Cドメインの各配列は、微生物の大規模なコレクションのコンピュータ内でのスクリーニングに使用することができる。かかる遺伝子に基づいたスクリーニングは、リポペプチド天然産物の煩雑な発酵、分離及び特徴化を行うことなく、リポペプチド天然産物を産生する遺伝学的な可能性を有する有機体を同定することができるという、従来の発酵手法を超える新たな長所を有する。さらに、非常に定量又は検出不可能な量でのみ通常リポペプチドを産生するそれらの有機体、あるいは非常に特殊な増殖条件下でのみリポペプチドを産生するそれらの有機体は、それにもかかわらず、この遺伝学的手法を用いて容易に同定することができる。   The extensive N-acylation mechanism for peptide natural products can provide a knowledge-based approach to discovering and identifying lipopeptide biosynthetic loci in microorganisms. A highly conserved nucleotide sequence identifying the characteristics of specific C domains involved in adenylation enzymes, acyl carrier proteins, and / or N-acylation mechanisms is the lipopeptide biosynthetic locus in the microorganism of interest. Can be identified and used as probes for screening microbial genomic DNA libraries for the purpose of quickly identifying, isolating, and characterizing. In addition, sequences of ADLE, ACPH protein and acyl-specific C domain can be used for in-computer screening of large collections of microorganisms. Such gene-based screening can identify organisms with genetic potential to produce lipopeptide natural products without the complex fermentation, separation and characterization of lipopeptide natural products. It has new advantages over conventional fermentation methods. Furthermore, those organisms that normally produce lipopeptides only in very quantifiable or undetectable amounts, or those that produce lipopeptides only under very specific growth conditions, nevertheless It can be easily identified using this genetic technique.

推定上のリポペプチド生合成遺伝子座009Hの同定:
ADLE、ACPH及びアシル特異的Cドメインの各配列は、細菌の二次代謝遺伝子座の専用データベースDECIPHER(登録商標)をスクリーニングするためにコンピュータ内で用いた(Ecopia BioSciences Inc;CA 2,352,451)。配列比較を容易にするために、DECIPHER(登録商標)データベースの一部であり、かつNRPS及びポリケチド合成酵素など多重モジュールのタンパク質由来のドメイン、並びに非モジュール性タンパク質で確認された同等のドメインを含む、タンパク質ドメインデータベースを作製した。
Identification of the putative lipopeptide biosynthesis locus 009H:
The sequences of ADLE, ACPH, and acyl-specific C domain were used in a computer to screen a specialized database DECIPHER® for bacterial secondary metabolic loci (Ecopia BioSciences Inc; CA 2,352,451). ). To facilitate sequence comparison, includes domains derived from multi-module proteins such as NRPS and polyketide synthases, as well as equivalent domains identified in non-modular proteins, as part of the DECIPHER® database A protein domain database was created.

配列番号6、8及び10として各々記載されている、アシル特異的Cドメインに対応する遺伝子座のRAMO、DAPT及びA541由来のタンパク質配列、配列番号24、26及び36として記載されている、ADLEのORF、並びに配列番号38、40及び36**として記載されている、ACPHのORFは、BLASTPアルゴリズム(Altschul et al.、上掲)を用いて、DECIPHER(登録商標)ドメインデータベースと比較した。さらにまた、本明細書に記載されるHMMERソフトウェアパッケージを用いて作製され、かつ配列番号1、2、3及び4として記載されている、アシル特異的Cドメイン、ADLE及びACPHタンパク質由来のコンセンサス配列もDECIPHER(登録商標)ドメインデータベースと比較した。 Protein sequences from the RAMO, DAPT and A541 loci corresponding to the acyl-specific C domains, described as SEQ ID NOs: 6, 8 and 10, respectively, ADLE, described as SEQ ID NOs: 24, 26 and 36 * ORPH and the ACPH ORF described as SEQ ID NOs: 38, 40 and 36 ** were compared to the DECIPHER® domain database using the BLASTP algorithm (Altschul et al., Supra). Furthermore, there are also consensus sequences derived from the acyl-specific C domain, ADLE and ACPH proteins, generated using the HMMER software package described herein and described as SEQ ID NOs: 1, 2, 3 and 4. Comparison with DECIPHER® domain database.

配列相同性は、相同性の推論を証明するために2種類の配列が十分な類似性を示すかどうかを示すE値により決定した。E値の0.00は完全な相同体を示す。このE値は、Altschul et al.1990、J.Mol.Biol.215(3):403−410;in Altschul et al.、1993.Nature Genetics 3:226−272に記載されているようにして計算する。   Sequence homology was determined by an E value indicating whether the two sequences show sufficient similarity to prove the inference of homology. An E value of 0.00 indicates a complete homologue. This E value is calculated by Altschul et al. 1990, J.A. Mol. Biol. 215 (3): 403-410; in Altschul et al. 1993. Calculate as described in Nature Genetics 3: 226-272.

DECIPHER(登録商標)データベース中の450を超える遺伝子座由来の配列を用いたアシル特異的Cドメイン配列を比較解析したところ、Streptomyces ghanaensis(NRRL B−12104)で確認された遺伝子座009Hに含まれている、縮合ドメイン(本明細書では配列番号12として記載されている)の存在が明らかになった。表4は、PCT/CA01/01462に詳細に記載されているラモプラニンORF13で確認された第1モジュールのCドメインにより例示されているように、配列番号12が、2種類のアミノ酸の結合を触媒する典型的なNRPS縮合ドメインよりも、RAMO、DAPT及びA541のアシル特異的Cドメイン由来の配列(アミノ酸のアミノ末端基にアシル基を縮合する)と高い配列類似性を示すことを示す。   A comparative analysis of acyl-specific C domain sequences using sequences derived from more than 450 loci in the DECIPHER® database revealed that they were included in the locus 009H identified by Streptomyces ghanaensis (NRRL B-12104). The presence of the condensation domain (described herein as SEQ ID NO: 12) was revealed. Table 4 shows that SEQ ID NO: 12 catalyzes the binding of two amino acids, as exemplified by the C domain of the first module identified in ramoplanin ORF13 described in detail in PCT / CA01 / 01462 It shows higher sequence similarity to sequences from the acyl-specific C domain of RAMO, DAPT and A541 (which condenses an acyl group to the amino terminal group of amino acids) than typical NRPS condensation domains.

同様に、配列番号3、24、26及び36を有するADLEドメイン並びに配列番号4、38、40及び36**を有するACPHドメインをDECIPHER(登録商標)ドメインデータベースと比較した。比較解析によれば、各々配列番号28及び配列番号42として記載され、また、009H遺伝子座で確認された、ADLE及びACPHの配列に高い配列相同性を有するタンパク質の存在が明らかになった。さらに、アシル特異的Cドメイン、ADLE及びACPHタンパク質に対する配列番号12、28及び42の関連性は、特定のタンパク質ドメインの保存を示すクラスタ配列アライメントによって、かつ系統発生解析によって確認した(図3〜図6)。 Similarly, the ADLE domain with SEQ ID NO: 3, 24, 26 and 36 * and the ACPH domain with SEQ ID NO: 4, 38, 40 and 36 ** were compared to the DECIPHER® domain database. Comparative analysis revealed the presence of proteins with high sequence homology to the sequences of ADLE and ACPH, which were described as SEQ ID NO: 28 and SEQ ID NO: 42, respectively, and confirmed at the 009H locus. Furthermore, the relevance of SEQ ID NOs: 12, 28, and 42 to acyl-specific C domains, ADLE and ACPH proteins was confirmed by cluster sequence alignment showing conservation of specific protein domains and by phylogenetic analysis (FIGS. 3-3). 6).

遺伝子座009Hのより詳しい検査により、13個のモジュールからなる4つのNRPS ORFの存在が明らかになった(図1b)。第1のNRPS ORFは、典型的なアデニル化ドメインの代わりに、アシル特異的Cドメイン(配列番号12)から始まる。ADLE及びACPHタンパク質(各々、配列番号28及び42)は、3つの酵素がすべて同一の生合成遺伝子座の一部であることを示すアシル特異的Cドメインを保有するNRPSのすぐ近傍で確認されている。アシル特異的CドメインのN末端位置に伴ったこれらの3つの酵素の同時の存在と、多重酵素のNRPS複合体の存在は、遺伝子座009Hにより指定された、N−アシル化リポペプチドの生合成と一致している。   A more detailed examination of locus 009H revealed the presence of four NRPS ORFs consisting of 13 modules (FIG. 1b). The first NRPS ORF begins with an acyl-specific C domain (SEQ ID NO: 12) instead of the typical adenylation domain. The ADLE and ACPH proteins (SEQ ID NOs: 28 and 42, respectively) have been identified in the immediate vicinity of NRPS carrying an acyl-specific C domain indicating that all three enzymes are part of the same biosynthetic locus. Yes. The simultaneous presence of these three enzymes along with the N-terminal position of the acyl-specific C domain and the presence of the multienzyme NRPS complex is the biosynthesis of the N-acylated lipopeptide specified by locus 009H. Is consistent with

推定上のリポペプチド生合成遺伝子座023Cの同定
コンセンサスタンパク質配列と、配列番号1、2、6、8及び10として各々記載されている、アシル特異的Cドメインに対応するRAMO、DAPT及びA541の座由来の配列を用いたDECIPHER(登録商標)データベースのコンピュータ内スクリーニングは、さらに、Streptomyces aizunensis NRRL B−11277に存在する遺伝子座023Cにアシル特異的Cドメインが存在することを明らかにした。表5に示すように、配列比較解析は、023Cアシル特異的Cドメイン(配列番号16として本明細書に記載されている)は、PCT/CA01/01462に詳細に記載されているラモプラニンORF13で確認された第1モジュールのCドメインによって表わされる典型的なNRPS縮合ドメインに比べて、RAMO、DAPT及びA541由来のN−アシルキャッピングCドメインにより密接に関係があることを明らかにしている。
Identification of Putative Lipopeptide Biosynthesis Locus 023C Consensus Protein Sequences and RAMO, DAPT, and A541 Locus Corresponding to Acyl-Specific C Domains, Described as SEQ ID NOs: 1, 2, 6, 8, and 10, respectively In-computer screening of the DECIPHER® database with derived sequences further revealed the presence of an acyl-specific C domain at locus 023C present in Streptomyces aizunensis NRRL B-11277. As shown in Table 5, sequence comparison analysis confirmed that the 023C acyl-specific C domain (described herein as SEQ ID NO: 16) was identified with ramoplanin ORF13 described in detail in PCT / CA01 / 01462. The N-acyl capping C domain from RAMO, DAPT and A541 is shown to be more closely related to the typical NRPS condensation domain represented by the C domain of the first module.

タンパク質のADLE及びACPHファミリー(配列番号32及び46として本明細書に記載されている)と関係するタンパク質も、遺伝子座023Cで見出された(表5)。さらに、アシル特異的Cドメイン、ADLE及びACPHタンパク質に対する配列番号16、32及び46の関連性は、触媒活性にとって重要な特定のタンパク質ドメイン及びアミノ酸残基の保存を示すクラスタアライメントによって(図3〜5)、及び系統発生解析(図6)によって確認された。   Proteins related to the ADLE and ACPH families of proteins (described herein as SEQ ID NOs: 32 and 46) were also found at locus 023C (Table 5). Furthermore, the relevance of SEQ ID NOs: 16, 32, and 46 to acyl-specific C domains, ADLE and ACPH proteins is shown by cluster alignments that show conservation of specific protein domains and amino acid residues important for catalytic activity (FIGS. 3-5 ) And phylogenetic analysis (FIG. 6).

遺伝子座023Cの解析は、28個のモジュールからなる6つのNRPS ORFの存在を示している(図1c)。第1のNRPS ORFは、N−アシルキャッピング機構を示すアシル特異的Cドメイン(配列番号16)から始まる(図7)。さらに、脂肪酸活性化及び結合に関与するADLE及びACPHタンパク質(各々、配列番号32及び46)もまたNRPS ORFの近傍の023遺伝子座で発見されたが、このことは、遺伝子座023CがN−アシル化リポペプチド代謝産物をコードしている可能性が高いということを示唆している。   Analysis of locus 023C shows the presence of 6 NRPS ORFs consisting of 28 modules (FIG. 1c). The first NRPS ORF begins with an acyl-specific C domain (SEQ ID NO: 16) that exhibits an N-acyl capping mechanism (FIG. 7). Furthermore, the ADLE and ACPH proteins involved in fatty acid activation and binding (SEQ ID NOs: 32 and 46, respectively) were also found at the 023 locus near the NRPS ORF, indicating that locus 023C is N-acyl. This suggests that it is highly likely to encode a modified lipopeptide metabolite.

推定上のリポペプチド生合成遺伝子座024Aの同定:
アシル特異的Cドメイン(配列番号1、2、6、8及び10)に対応する配列を用いたタンパク質相同性解析によるDECIPHER(登録商標)データベースのスクリーニングにより、Streptomyces refuineus NRRL 3143で確認された遺伝子座024Aのアシル特異的Cドメインの存在が明らかになった。表6に示すように、BLASTP解析によると、PCT/CA01/01462に詳細に記載されているラモプラニンORF13で確認された第1モジュールのCドメインにより示されているように、024CにコードされているCドメイン(配列番号14)は、2個のアミノ酸を縮合するドメインよりも、アミノ酸にアシル基を縮合するドメインとより密接に関係があることが明らかである。
Identification of the putative lipopeptide biosynthesis locus 024A:
A locus identified in Streptomyces refuinus NRRL 3143 by screening the DECIPHER® database by protein homology analysis using sequences corresponding to acyl-specific C domains (SEQ ID NOs: 1, 2, 6, 8, and 10) The presence of the acyl-specific C domain of 024A was revealed. As shown in Table 6, according to the BLASTP analysis, it is encoded by 024C as shown by the C domain of the first module identified in ramoplanin ORF13 described in detail in PCT / CA01 / 01462 It is clear that the C domain (SEQ ID NO: 14) is more closely related to the domain that condenses acyl groups to amino acids than the domain that condenses two amino acids.

また、ADLE及びACPH関連タンパク質(配列番号30及び44として本明細書に記載されている)は、遺伝子座024Aで確認された(表6)。3つのすべてのタンパク質の配列アライメント(配列番号14、30及び44)は、対応する酵素の触媒活性にとって重要なドメイン及びアミノ酸残基の保存を示している(図3〜5)。さらに、これらのタンパク質は、系統発生の解析によって示されているように、タンパク質のアシル特異的Cドメイン、ADLE及びACPHファミリーのメンバーと進化的に関係がある(図6)。   Also, ADLE and ACPH-related proteins (described herein as SEQ ID NOs: 30 and 44) were identified at locus 024A (Table 6). Sequence alignments of all three proteins (SEQ ID NOs: 14, 30 and 44) show the conservation of domains and amino acid residues that are important for the catalytic activity of the corresponding enzyme (FIGS. 3-5). Furthermore, these proteins are evolutionarily related to the acyl-specific C domain, ADLE and ACPH family members of the protein, as shown by phylogenetic analysis (FIG. 6).

024Aの完全遺伝子座(図1c、並びに米国特許出願第60/342,133号、米国特許出願第30/372,789号、及び同時係属中の米国特許出願第10/XXX,XXX号)の解析によると、13個のモジュールからなる4つのNRPS ORFの存在が明らかである。N−アシルペプチドキャッピング機構と一致しているので、アシル特異的Cドメイン(配列番号14)は、第1のNRPS ORFのN末端位置に位置する。さらに、ADLE及びACPHのORF(各々、配列番号30及び44)は、3つのタンパク質間の機能的相互作用を示す、アシル特異的Cドメインに近接している。これらの所見に基づくと、遺伝子座024Aは、N−アシル化リポペプチドの生合成を誘導することが予測され、かつ次いで証明された(実施例8を参照)。   Analysis of the complete locus of 024A (FIG. 1c and US patent application 60 / 342,133, US patent application 30 / 372,789, and co-pending US patent application 10 / XXX, XXX) According to the existence of four NRPS ORFs consisting of 13 modules. Consistent with the N-acyl peptide capping mechanism, the acyl-specific C domain (SEQ ID NO: 14) is located at the N-terminal position of the first NRPS ORF. In addition, the ADLE and ACPH ORFs (SEQ ID NOs: 30 and 44, respectively) are in close proximity to the acyl-specific C domain, which shows a functional interaction between the three proteins. Based on these findings, locus 024A was predicted and then proved to induce biosynthesis of N-acylated lipopeptides (see Example 8).

リポペプチド41,012生合成遺伝子座A410の同定:
DECIPHER(登録商標)データベースで確認された配列とアシル特異的Cドメイン(配列番号1、2、6、8及び10)を指定する配列のタンパク質相同性比較により、Actinoplanes nipponensis Routien ATCC 31145で確認された遺伝子座A410にある関連するCドメイン(配列番号18として本明細書に記載されている)の存在が明らかになった。この微生物は、N−アシル化リポペプチドのアンホマイシン群に属する、化学的構造が未決定の酸性ポリペプチド抗生物質(化合物41,012)を合成することがわかっている(米国特許第4,001,397号)。表7に示したように、BLASTPは、PCT/CA01/01462に詳細に記載されているラモプラニンORF13で確認された第1モジュールのCドメインにより示されているように、A410にコードされているCドメイン(配列番号18)が、2個のアミノ酸が縮合しているドメインよりも、アミノ酸にアシル基を縮合するドメインとより密接に関係があることが明らかである。
Identification of lipopeptide 41,012 biosynthetic locus A410:
A protein homology comparison of sequences confirmed in the DECIPHER® database and sequences specifying acyl-specific C domains (SEQ ID NOs: 1, 2, 6, 8, and 10) was confirmed in Actinoplanes nipponensis Rotten ATCC 31145 The presence of the relevant C domain at locus A410 (described herein as SEQ ID NO: 18) was revealed. This microorganism has been found to synthesize an acidic polypeptide antibiotic (compound 41,012) belonging to the amphomycin group of N-acylated lipopeptides (compound 41,012) (US Pat. No. 4,001). , 397). As shown in Table 7, BLASTP is a C encoded in A410 as indicated by the C domain of the first module identified in ramoplanin ORF13 described in detail in PCT / CA01 / 01462. It is clear that the domain (SEQ ID NO: 18) is more closely related to the domain that condenses the acyl group to the amino acid than to the domain where the two amino acids are condensed.

ADLE及びACPH関連タンパク質(配列番号34及び48として本明細書に記載されている)もまた遺伝子座A410で確認された(表7)。3つのすべてのタンパク質の配列アライメント(配列番号18、34及び48)は、これらの酵素の触媒活性にとって重要なドメイン及びアミノ酸残基の保存を示している(図3〜5)。さらに、これらのタンパク質は、系統発生解析によって示されるように、タンパク質のアシル特異的Cドメイン、ADLE及びACPHファミリーのメンバーと進化的に関係している(図6)。   ADLE and ACPH-related proteins (described herein as SEQ ID NOs: 34 and 48) were also identified at locus A410 (Table 7). The sequence alignment of all three proteins (SEQ ID NO: 18, 34 and 48) shows the conservation of domains and amino acid residues important for the catalytic activity of these enzymes (FIGS. 3-5). In addition, these proteins are evolutionarily related to the acyl-specific C domain, ADLE and ACPH family members of the protein, as shown by phylogenetic analysis (FIG. 6).

遺伝子座A410は、11個のモジュールからなる3つのNRPS ORFを指定する(図1d)。N−アシル化ペプチドキャッピング機構と一致しているので、アシル特異的Cドメイン(配列番号18)は、第1のNRPS ORFのN末端位置に位置する。さらに、ADLE及びACPHのORF(各々、配列番号34及び48)は、遺伝子座A410が、複合抗生物質41,012の記載されている特性と一致するN−アシル化リポペプチドを指定することを示す、アシル特異的Cドメインに隣接していることが確認された。   Locus A410 specifies three NRPS ORFs consisting of 11 modules (FIG. 1d). Consistent with the N-acylated peptide capping mechanism, the acyl-specific C domain (SEQ ID NO: 18) is located at the N-terminal position of the first NRPS ORF. Furthermore, the ORF and ACPH ORFs (SEQ ID NOs: 34 and 48, respectively) indicate that locus A410 designates an N-acylated lipopeptide consistent with the described properties of complex antibiotics 41,012. , Adjacent to the acyl-specific C domain.

推定上のリポペプチド生合成遺伝子座070Bの同定:
Streptomyces sp.(Ecopia BioSciences、070株)で発見された遺伝子座070B中のアシル特異的Cドメインの存在が、アシル特異的Cドメイン(配列番号1、2、6、8及び10)に対応する配列を用いたDECIPHER(登録商標)データベースのコンピュータによるスクリーニングで明らかになった。表8から明らかなように、BLASTP解析によれば、070BにコードされているCドメイン(配列番号20)は、PCT/CA01/01462に詳細に記載されているラモプラニンORF13で発見された第1のモジュールのCドメインにより示されているように、2個のアミノ酸を縮合しているドメインよりもアミノ酸にアシル基を縮合しているドメインにより密接に関係している。
Identification of a putative lipopeptide biosynthesis locus 070B:
Streptomyces sp. The presence of the acyl-specific C domain in locus 070B found at (Ecopia BioSciences, strain 070) used sequences corresponding to the acyl-specific C domain (SEQ ID NOs: 1, 2, 6, 8 and 10). This was revealed by computer screening of the DECIPHER® database. As is clear from Table 8, according to BLASTP analysis, the C domain encoded by 070B (SEQ ID NO: 20) is the first one found in ramoplanin ORF13 described in detail in PCT / CA01 / 01462. As shown by the C domain of the module, it is more closely related to domains that condense acyl groups to amino acids than domains that condense two amino acids.

種々のリポペプチド生合成ORF由来の関連ドメインとの070Bアシル特異的Cドメイン(配列番号20)の配列アライメントは、これらの酵素の触媒活性にとって重要なドメイン及びアミノ酸残基の保存を明らかにしている(図3)。さらに、このタンパク質は、系統発生の解析によって明らかなように、アシル特異的Cドメインのメンバーと進化上の関係がある(図6)。   Sequence alignment of the 070B acyl-specific C domain (SEQ ID NO: 20) with related domains from various lipopeptide biosynthetic ORFs reveals conservation of domains and amino acid residues important for the catalytic activity of these enzymes (Figure 3). Furthermore, this protein has an evolutionary relationship with members of the acyl-specific C domain, as evidenced by phylogenetic analysis (FIG. 6).

本明細書に示している他の座とは対照的に、ADLE及びACPHに関連するタンパク質は070Bでは検出されなかった。   In contrast to the other loci shown here, proteins related to ADLE and ACPH were not detected in 070B.

DECIPHER(登録商標)データベースで発見された070B遺伝子座の解析によれば、3つのモジュールからなる不完全NRPS ORFの存在が明らかである(図1d)。N−アシル化リポペプチドの生合成と一致しているので、アシル特異的Cドメインは、NRPS ORFのN末端に位置する。ADLE及びACPHの配列の欠失は、遺伝子座の配列が未だ完全ではないという事実による可能性がある。あるいは、070Bは、N−アシル化リポペプチドを特定化する、あるいはADLE及びACPHに関連する酵素を欠失しているStreptomyces coelicolor A3(2)中のCADA遺伝子座に類似している可能性がある。アシル特異的Cドメインの存在と位置は、070B中のADLE及びACPHの潜在的不在にかかわらず、070BがN−アシル化リポペプチドを特定化することを明らかに示している。   Analysis of the 070B locus found in the DECIPHER® database reveals the presence of a three-module incomplete NRPS ORF (FIG. 1d). Consistent with the biosynthesis of N-acylated lipopeptides, the acyl-specific C domain is located at the N-terminus of the NRPS ORF. The deletion of the sequence of ADLE and ACPH may be due to the fact that the locus sequence is not yet complete. Alternatively, 070B may be similar to the CADA locus in Streptomyces coelicolor A3 (2) that specifies N-acylated lipopeptides or lacks enzymes related to ADLE and ACPH . The presence and position of the acyl-specific C domain clearly indicates that 070B specifies an N-acylated lipopeptide, regardless of the potential absence of ADLE and ACPH in 070B.

遺伝子座024AによるN−アシル化リポペプチドの生合成:
Streptomyces refuineus subsp.thermotolerans NRRL 3143中の遺伝子座024Aは、N−アシル化リポペプチドをコードする遺伝子座のいくつかの特性、すなわち、ポリペプチドのアセンブリー(ADLE及びACPHファミリータンパク質(各々、配列番号30及び44))に関与する第1のNRPS ORFのN末端に位置しているアシル特異的Cドメイン(配列番号14)の存在、並びに、13個のモジュールからなるNRPS多重酵素システムを有することが明らかになった(実施例5及び図1c参照)。
Biosynthesis of N-acylated lipopeptides by locus 024A:
Streptomyces refineus subsp. The locus 024A in the thermotolerans NRRL 3143 is associated with several properties of the locus encoding the N-acylated lipopeptide, ie, assembly of polypeptides (ADLE and ACPH family proteins (SEQ ID NOs: 30 and 44, respectively)). The presence of an acyl-specific C domain (SEQ ID NO: 14) located at the N-terminus of the first NRPS ORF involved, as well as having an NRPS multienzyme system consisting of 13 modules (implementation) See Example 5 and Figure 1c).

DECIPHER(登録商標)データベース中の他のタンパク質によるアシル特異的Cドメイン、ADLE及びACPHタンパク質のタンパク質相同性解析によれば、Streptomyces fradiae NRRL 18158中の抗生物質A54145の産生を指定するA541遺伝子座(配列番号10、36及び36**)で発見された、対応するタンパク質とこれらのタンパク質に高い相同性があることが明らかとなった(実施例5の表6)。この2つの座をより詳しく調べた結果、A54145のもと同一の024Aポリペプチド足場の合成に関与し得る同一のNRPS系の存在が明らかになった(図1b及び図c、並びに米国特許出願第60/342,133号、米国特許出願第30/372,789号及び同時係属中の米国特許出願第10/XXX,XXX号)。 According to protein homology analysis of acyl-specific C domain, ADLE and ACPH proteins by other proteins in the DECIPHER® database, the A541 locus specifying the production of antibiotic A54145 in Streptomyces fradia NRRL 18158 (sequence) These proteins were found to be highly homologous to the corresponding proteins found under numbers 10, 36 * and 36 ** ) (Table 6 in Example 5). A closer examination of the two loci revealed the existence of identical NRPS systems that could be involved in the synthesis of identical 024A polypeptide scaffolds under A54145 (FIGS. 1b and c, as well as US patent application no. 60 / 342,133, US patent application 30 / 372,789 and co-pending US patent application 10 / XXX, XXX).

これらの所見、及びStreptomyces fradiae中のリポペプチドA54145を発現する増殖条件についての周知の事実によれば(米国特許第4,977,083号)、Streptomyces refuineus subsp.thermotoleransは、同一の培養条件下で増殖し、遺伝子座024Aの可能な誘導を判断し、特定の産物の性質を検出した。   According to these findings and the well-known facts about growth conditions expressing lipopeptide A54145 in Streptomyces fradiae (US Pat. No. 4,977,083), Streptomyces refuineus subsp. thermotolerans grew under identical culture conditions, judged possible induction of locus 024A, and detected the nature of a particular product.

Streptomyces fradiae及びStreptomyces refuineus subsp.thermotoleransを、水道水中、グルコース(10g/l)、ジャガイモデンプン(30g/l)、大豆粉(20g/l)、Pharmamedia(20g/l)及びCaCO(2g/l)を含有するシード培地25mL中に接種し、回転式振盪機中、30℃にて48時間増殖させた。4L容バッフルフラスコ(baffled flask)中の産生培地500mLへ接種するために、この種培養物5mLを用いた。産生培地は、水道水に溶解したグルコース(25g/l)、大豆粉(18.75g/l)、廃糖蜜(3.75g/l)、カゼイン(1.25g/l)、酢酸ナトリウム(8g/l)、及びCaCO(3.13g/l)からなり、回転式振盪機上で7日間、30℃にて培養した。産生培養物を遠心分離にかけて濾過し、菌糸体と固形物を除去した。pHを6.4に調節し、Diaion HP20を46mL添加し、30分間撹拌した。HP20樹脂をブーフナー濾過により回収し、140mLの水と90mLの15%CHCN/HOで連続して洗浄し、その洗浄物は廃棄した。次いで、140mLの50%CHCN/HOによりHP20樹脂を溶出した(画分HP20 E2)。このプール5mLをアンバーライトIRA68カラム(アセテートサイクル)にかけ、そのカラムからの流出液(画分IRA FT)をバイオアッセイ用として確保した。25mLの50%CHCN/HOでこのカラムを洗浄し、0.1NのHOAcを含有する25mLの50%CHCN/H0で溶出し(画分IRA E1)、次いで、1.0NのHOAcを含有する25mLの50%CHCN/H0で溶出した(画分IRA E2)。精製に続いて、生物活性は、5mMのCaClを含有する栄養寒天中のMicrococcus luteusを用いたバイオアッセイに従った。 Streptomyces fradiae and Streptomyces refuinus subsp. Thermotolens in tap water in 25 mL of seed medium containing glucose (10 g / l), potato starch (30 g / l), soy flour (20 g / l), Pharmamedia (20 g / l) and CaCO 3 (2 g / l) And grown for 48 hours at 30 ° C. in a rotary shaker. 5 mL of this seed culture was used to inoculate 500 mL of production medium in a 4 L baffled flask. The production medium consisted of glucose (25 g / l), soybean meal (18.75 g / l), molasses (3.75 g / l), casein (1.25 g / l), sodium acetate (8 g / l) dissolved in tap water. 1) and CaCO 3 (3.13 g / l), and cultured at 30 ° C. for 7 days on a rotary shaker. The production culture was centrifuged and filtered to remove mycelium and solids. The pH was adjusted to 6.4, 46 mL of Diaion HP20 was added and stirred for 30 minutes. HP20 resin was collected by Buchner filtration and washed successively with 140 mL water and 90 mL 15% CH 3 CN / H 2 O, and the wash was discarded. The HP20 resin was then eluted with 140 mL of 50% CH 3 CN / H 2 O (fraction HP20 E2). 5 mL of this pool was applied to an Amberlite IRA 68 column (acetate cycle), and an effluent (fraction IRA FT) from the column was secured for bioassay. The column was washed with 50% CH 3 CN / H 2 O in 25mL, eluting with 50% CH 3 CN / H 2 0 of 25mL containing HOAc of 0.1 N (fraction IRA E1), then 1 Eluted with 25 mL of 50% CH 3 CN / H 2 0 containing 0 N HOAc (fraction IRA E2). Following purification, the biological activity followed a bioassay using Micrococcus luteus in nutrient agar containing 5 mM CaCl 2 .

図9aは、Streptomyces fradiae由来の陰イオンリポペプチドの抽出時に得られたプレートの写真である。図9aは、酸性リポペプチドの発現と一致するIRA67陰イオン交換クロマトグラフィーによる活性の増強を示す。溶菌の環の直径が大きくなることから明らかなように、この活性は抽出方法の間に濃縮される。A54145 C、Dの構造と一致する質量イオンES2+=830.5により明らかなように(米国特許第4,994,270号)、A54145が画分IRA E2においてHPLC/MSにより検出された。 FIG. 9a is a photograph of a plate obtained upon extraction of an anionic lipopeptide from Streptomyces fradiae. FIG. 9a shows enhanced activity by IRA67 anion exchange chromatography consistent with the expression of acidic lipopeptides. This activity is concentrated during the extraction process, as evidenced by the increased diameter of the lysis ring. A54145 was detected by HPLC / MS in fraction IRA E2, as evidenced by mass ion ES 2+ = 830.5 consistent with the structure of A54145 C, D (US Pat. No. 4,994,270).

図9bは、Streptomyces refuineus subsp.thermotolerans由来の抽出物で行われた同様の抽出スキーム中に得られたプレートの写真である。図9bは、酸性リポペプチドの発現と一致するIRA67陰イオン交換クロマトグラフィーによる活性が同様に高いことを示している。溶菌の環の直径が大きくなることから明らかなように、この活性は抽出の間、濃化される。A54145のものと同一のES2+=830.5の質量イオンは、A54145C、Dと同一である、N−アシル化酸性リポペプチドがStreptomyces refuineus subsp.thermotolerans中の024Aにより産生されることが確認されている画分IRA E2の中に存在していた。 FIG. 9b shows that Streptomyces refineus subsp. FIG. 2 is a photograph of a plate obtained during a similar extraction scheme performed with an extract from thermotolerans. FIG. 9b shows that the activity by IRA67 anion exchange chromatography, which is consistent with the expression of acidic lipopeptide, is similarly high. This activity is enriched during extraction, as evidenced by the increased diameter of the lysis ring. The mass ion of ES 2+ = 830.5, identical to that of A54145, is identical to A54145C, D, and the N-acylated acidic lipopeptide is Streptomyces refuinus subsp. It was present in fraction IRA E2, which was confirmed to be produced by 024A in thermotolerans.

新規リポペプチドを産生可能なペプチド合成酵素を操作するためのN−アシルキャッピングカセットの使用
リポペプチドN−アシルキャッピング成分の有効性と解明により、操作したペプチド合成酵素によって天然産物又は非天然産物の設計を再編することができる可能性が高まる。既知の分子生物学技術を使用すると、合理的に設計されたペプチド産物を産生可能な機能的なハイブリッドペプチド合成酵素を操作することができることが報告されている(Mootz et at.(2000)Proc.Natl.Acad.Sci.USA.Vol.97 pp.5848−5853)。さらに、ドメイン交換、突然変異生成による基質特異性の変更、及び一定の短縮型産物の放出を達成するための誘導末端を通じて、アンチパイン(Streptomyces roseusにより産生される効き目のあるカテプシン阻害剤であり、その生合成的機構は未知である)を産生する組換えNRPS系を得ることが可能であり得ることが想定されている(Doekel S、Marahiel MA.(2001)Metab.Eng.Vol.3 pp.64−77)。Mootzら(上掲)は、天然産物ではないペプチド産物を産生するためのNRPS系を用いた遺伝子操作について記載しており、Doekel及びMarahiel(上掲)は、既知の天然産物であるアンチパインを得るためのNRPS系を遺伝子操作する机上の実験例を記載している。
Use of N-acyl capping cassettes to engineer peptide synthases capable of producing novel lipopeptides. Design of natural or non-natural products by engineered peptide synthases by the effectiveness and elucidation of lipopeptide N-acyl capping components Increases the possibility of restructuring. Using known molecular biology techniques, it has been reported that functional hybrid peptide synthases capable of producing reasonably designed peptide products can be engineered (Mootz et at. (2000) Proc. Natl.Acad.Sci.USA.Vol.97 pp.5848-5853). Furthermore, anti-pine (a potent cathepsin inhibitor produced by Streptomyces roseus through an inducing end to achieve domain exchange, altered substrate specificity by mutagenesis, and release of certain truncated products, It is envisioned that it may be possible to obtain a recombinant NRPS system that produces (the biosynthetic mechanism of which is unknown) (Doekel S, Marahiel MA. (2001) Metab. Eng. Vol. 3 pp. 64-77). Mootz et al. (Supra) describe genetic manipulations using the NRPS system to produce non-naturally occurring peptide products, and Doekel and Marahiel (supra) describe antipain, a known natural product. A desktop experimental example of genetically manipulating the NRPS system to obtain is described.

非リポペプチド天然産物(コンプレスタチン)のNRPSの生合成上の機構が、コンプレスタチンのN−アシル化類似体を産生するために変性され得る方法について下記に概説する(図10)。   The following outlines how the non-lipopeptide natural product (comprestatin) NRPS biosynthetic mechanism can be modified to produce N-acylated analogs of comprestatin (FIG. 10).

Streptomyces lavendulaeはコンプレスタチンを産生する。コンプレスタチンは、相補体カスケードのC4b、2b複合体の形成、及びHIVライフルサイクル中で結合するgp120−CD4を含む、薬理学的に関連のあるタンパク質間の相互作用を拮抗する環状ペプチド天然産物である。コンプレスタチン(天然産物のバンコマイシン群のメンバー)は、酸化的フェノール結合とハロゲン化によって修飾されているα−ケトアシルヘキサペプチドバックボーンからなる。約50kbに及ぶ完全コンプレスタチンの生合成上の調節遺伝子クラスタは、クローニングされ、かつ配列決定されている(Chiu et al.(2001)Proc.Natl.Acad.Sci.USA Vol.98 pp.8548−8553)。それには、4つのNRPS遺伝子、すなわちcomA、comB、comC及びcomDが含まれている(図10、パネルa)。comA遺伝子は、ヒドロキシフェニルグリシン(HPG;又はその誘導体)を組み込んでいるローディングモジュールと、その後のトリプトファン(Trp)を組み込んでいるモジュールから構成されているNRPSをコードし、コンプレスタチンの第1の2個の残基を有する。そのローディングモジュールと、トリプトファンが組み込まれているCドメインは、ドメイン交換を通じて、本明細書に記載されているアシル特異的Cドメインのうちの1つと置換され得る。好ましくは、A541、DAPT又は024A遺伝子座のアシル特異的Cドメインを用いる。その理由は、これらのドメインが、トリプトファン残基へのアシル成分の縮合に本来特異的であるからである。このドメイン交換に加えて、ADLE遺伝子及びACPH遺伝子をその系へ導入して、アシル特異的Cドメインにより利用可能な、活性化アシル基質を生成する手段を提供する。したがって、図10bには、N−アシル化コンプレスタチン類似体を生じさせるはずである、合理的に遺伝子操作された組換え体NRPS系を記載している。図10b中に記載されている組換え体NRPS系は、適当な組換え宿主を利用してin vivoで用いることができるか、あるいは適当な基質が補充された精製酵素を利用してin vitroで用いることができる。   Streptomyces lavendulae produces comprestatin. Comprestatin is a cyclic peptide natural product that antagonizes the interaction between pharmacologically relevant proteins, including C4b, 2b complex formation of the complement cascade, and gp120-CD4 binding in the HIV rifle cycle. is there. Comprestatin, a member of the natural product vancomycin group, consists of an α-ketoacyl hexapeptide backbone that has been modified by oxidative phenolic linkage and halogenation. A complete synthetic complexin regulatory gene cluster spanning about 50 kb has been cloned and sequenced (Chiu et al. (2001) Proc. Natl. Acad. Sci. USA Vol. 98 pp. 8548- 8553). It contains four NRPS genes, comA, comB, comC and comD (Figure 10, panel a). The comA gene encodes NRPS composed of a loading module incorporating hydroxyphenylglycine (HPG; or a derivative thereof) and a subsequent module incorporating tryptophan (Trp). Has residues. The loading module and C domain incorporating tryptophan can be replaced with one of the acyl-specific C domains described herein through domain exchange. Preferably, the acyl-specific C domain of the A541, DAPT or 024A locus is used. The reason is that these domains are inherently specific for the condensation of acyl components to tryptophan residues. In addition to this domain exchange, the ADLE and ACPH genes are introduced into the system to provide a means to generate activated acyl substrates that can be utilized by acyl-specific C domains. Thus, FIG. 10b describes a reasonably genetically engineered recombinant NRPS system that should yield an N-acylated comprestatin analog. The recombinant NRPS system described in FIG. 10b can be used in vivo using an appropriate recombinant host, or in vitro using a purified enzyme supplemented with an appropriate substrate. Can be used.

N−アシル化コンプレスタチン類似体をin vivoで産生することができる1つの手法には、宿主株として、Streptomyces lavendulae(コンプレスタチン産生体)を使用することが含まれる。簡単に説明すると、N−アシルキャッピングカセットは、comA遺伝子を置換する。これは、Streptomyces lavendulae染色体上のcomA遺伝子の不活性化、次いで、ADLE、ACPH及び組換えのComA誘導体を発現するプラスミドの導入によって、あるいは、二重組換(Keiser et al.、上掲)により、ADLE、ACPH及び組換えComA誘導体をコードする遺伝子を含有するカセットでStreptomyces lavendulae染色体上のcomA遺伝子を物理的に置換することにより実施することができる。得られた組換え型菌株は、アシル成分の生合成に関与する遺伝子を含むようにさらに改変することができ、かつ/又は、発酵培地中にアシル成分又はそれらの前駆体を供給することができる。   One approach by which N-acylated comprestatin analogs can be produced in vivo involves using Streptomyces lavendulae (comprestatin producer) as the host strain. Briefly, the N-acyl capping cassette replaces the comA gene. This can be accomplished by inactivation of the comA gene on the Streptomyces lavendulae chromosome, followed by introduction of plasmids expressing ADLE, ACPH and recombinant ComA derivatives, or by double recombination (Keiser et al., Supra). This can be done by physically replacing the comA gene on the Streptomyces lavendulae chromosome with a cassette containing genes encoding ADLE, ACPH and recombinant ComA derivatives. The resulting recombinant strain can be further modified to include a gene involved in the biosynthesis of the acyl component and / or can supply the acyl component or their precursors in the fermentation medium. .

1種又は複数のN−アシル化コンプレスタチン類似体をin vitroで産生することができる1つの手法には、Mootz et al.(2000)で概説されているように、適当な宿主(例えば大腸菌)におけるADLE、ACPH、組換え型ComA、ComB、ComC及びComDポリペプチドの過剰発現、次いで、これらの抽出物又は精製画分の調製、並びに適当な基質と併用する前記調製物の使用が含まれる。アクセサリータンパク質の不在下では、このin vitro系によって産生される産物は、特定のコンプレスタチンシトクロムP450酵素により触媒される、残基の架橋などのある種の修飾は含まれないであろう。   One approach by which one or more N-acylated comprestatin analogs can be generated in vitro is described by Mootz et al. (2000), overexpression of ADLE, ACPH, recombinant ComA, ComB, ComC, and ComD polypeptides in a suitable host (eg, E. coli), then these extracts or purified fractions. Includes the preparation as well as the use of said preparation in combination with a suitable substrate. In the absence of accessory proteins, the products produced by this in vitro system will not include certain modifications such as residue cross-linking catalyzed by certain comprestatin cytochrome P450 enzymes.

本明細書に引用されているすべての特許、特許出願及び公開されている文献は、参照によりそれらの全体を本明細書に組み入れるものとする。本発明は、これらの好ましい実施形態に関して特に開示し記載したが、形態や詳細における各種修正は、添付の特許請求の範囲によって包含されている本発明の範囲から逸脱することなく実施することができることは、当業者であれば理解されよう。
All patents, patent applications and published literature cited herein are hereby incorporated by reference in their entirety. Although the invention has been particularly disclosed and described with reference to these preferred embodiments, various modifications in form and detail can be made without departing from the scope of the invention as encompassed by the appended claims. Will be understood by those skilled in the art.

図1a、1b、1c、1d及び1eは、(1a)Actinoplanes sp.ATCC 33076(RAMO)由来のラモプラニン、及びStreptomyces roseosporus NRRL 11379(DAPT)由来のA21978C;(1b)Streptomyces fradiae ATCC 18158(A541)由来のA54145、及びStreptomyces ghanaensis NRRL B−12104(009H)由来のリポペプチド;(1c)Streptomyces refuineus NRRL 3143(024A)由来のリポペプチド、及びStreptomyces aizunensis NRRL B−11277(023C)由来のリポペプチド;(1d)Actinoplanes nipponensis FD 24834 ATCC 31145(A410)由来のリポペプチド、及びEcopia’s private culture collectionの有機体070由来の推定上のリポペプチド天然物(070B);並びに(1e)Streptomyces coelicolor A3(CADA)由来のカルシウム依存性抗生物質、についての生合成座の概略図を示し、塩基対中のスケールと、本発明の代表的なアシル特異的Cドメインをコードするオープンリーディングフレーム(ORF)の相対的位置と定位、並びに本発明の代表をアデニル化酵素及びアシルキャリアタンパク質を示している。また、本発明の遺伝子が含まれている寄託コスミドは、RAMO、A541及び024Aについて示している。Figures 1a, 1b, 1c, 1d and 1e show (1a) Actinoplanes sp. Ramopranin from ATCC 33076 (RAMO), and A21978C from Streptomyces roseosporus NRRL 11379 (DAPT); (1c) Lipopeptide from Streptomyces refunueus NRRL 3143 (024A), and Lipopeptide from Streptomyces aizunensis NRRL B-11277 (023C); 410) and a putative lipopeptide natural product (070B) derived from the organism 070 of Ecopia's private culture collection; and (1e) a calcium-dependent antibiotic derived from Streptomyces coelicolor A3 (CADA) Schematic representation of the biosynthetic locus of, and the relative position and orientation of the open reading frame (ORF) encoding the representative acyl-specific C domain of the present invention, as well as the scale in base pairing, as well as representatives of the present invention. 2 shows adenylating enzyme and acyl carrier protein. The deposited cosmids containing the gene of the present invention are shown for RAMO, A541 and 024A. 図2は、灰色で強調したN−アシル化に関与する本発明の代表的なCドメインの明らかな分岐クラスタを有する種々のリポペプチドNRPS由来のCドメインに関する進化の関連性を示す樹状図を表わす。FIG. 2 is a dendrogram showing evolutionary relevance for C domains derived from various lipopeptides NRPS with distinctly branched clusters of representative C domains of the invention involved in N-acylation highlighted in gray. Represent. 図3a及び3bは、RAMO、DAPT、A541、CADA、009H、024A、023C、A410及び070Bの各リポペプチド生合成遺伝子座で発見された本発明の代表的なアシル特異的Cドメインのアミノ酸アライメントを表わす。保存モチーフは強調している。各クラスタアライメントでは、アライメント上のラインは、高度に保存されている位置をマークするために用いている。さらに、3つの記号、すなわち「*」(星印)、「:」(コロン)及び「.」(ピリオド)用いている。「*」は、1つの完全に保存されている残基を有する位置を示し、「:」は、以下の強い基、すなわち、STA、NEQK、NHQK、NDEQ、QHRK、MILV、MILF、HY及びFYWのうちの1つが完全に保存されていることを示し、「.」は、以下のより弱い基、すなわち、CSA、ATV、SAG、STNK、STPA、SGND、SNDEQK、NDEQHK、NEQHRK、FVLIM及びHFYのうちの1つが完全に保存されていることを示す。FIGS. 3a and 3b show amino acid alignments of representative acyl-specific C domains of the present invention found at the lipopeptide biosynthesis loci of RAMO, DAPT, A541, CADA, 009H, 024A, 023C, A410 and 070B. Represent. The conservation motif is emphasized. In each cluster alignment, the alignment line is used to mark a highly conserved position. In addition, three symbols, “*” (star), “:” (colon) and “.” (Period) are used. “*” Indicates a position with one completely conserved residue and “:” indicates the following strong groups: STA, NEQK, NHQK, NDEQ, QHRK, MILV, MILF, HY and FYW Of the following weaker groups: CSA, ATV, SAG, STNK, STPA, SGND, SNDEKK, NDEQHK, NEQHRK, FVLIM, and HFY. Indicates that one of them is fully preserved. 図4a、4b及び4cは、A541遺伝子座由来のADLF融合タンパク質のADLE部分とともに、RAMO、DAPT、009H、024A、023C及びA410座の各々で発見された本発明の代表的なADLEタンパク質のアミノ酸アライメントを表わす。アシルCoAリガーゼの保存されたモチーフは強調されている。Figures 4a, 4b and 4c show amino acid alignments of representative ADLE proteins of the present invention found at each of the RAMO, DAPT, 009H, 024A, 023C and A410 loci along with the ADLE portion of the ADLF fusion protein from the A541 locus. Represents. The conserved motif of acyl CoA ligase is highlighted. 図5は、RAMO、DAPT、009H、024A、023C及びA410座由来の本発明の代表的なACPHタンパク質のアミノ酸アライメントと、A541遺伝子座由来のADLF融合タンパク質の対応する部分である。ホスホパンテテイン基が翻訳後に共有結合で結合されているチオール化ドメインの保存されたセリン残基は強調されている。FIG. 5 is an amino acid alignment of a representative ACPH protein of the present invention from the RAMO, DAPT, 009H, 024A, 023C and A410 loci and the corresponding portion of the ADLF fusion protein from the A541 locus. The conserved serine residue of the thiolation domain where the phosphopantetheine group is covalently attached post-translationally is highlighted. 図6aは、本発明の代表的なNRPS Cドメインの進化の関連性を示す樹状図である。図6bは、本発明の代表的なADLEタンパク質の進化の関連性を示す樹状図である。図6cは、本発明の代表的なACPHタンパク質の進化の関連性を示す樹状図である。FIG. 6a is a dendrogram showing the evolutionary relevance of representative NRPS C domains of the present invention. FIG. 6b is a dendrogram showing the evolutionary relevance of representative ADLE proteins of the present invention. FIG. 6c is a dendrogram showing the evolutionary relevance of representative ACPH proteins of the present invention. 図7a及び7bは、本発明のアシル特異的Cドメイン、ADLEタンパク質及びACPHタンパク質を用いて、リポペプチドにおけるN−アシル化ペプチド結合の形成に関する一般的な生合成のスキームを説明する。Figures 7a and 7b illustrate a general biosynthetic scheme for the formation of N-acylated peptide bonds in lipopeptides using the acyl-specific C domain, ADLE protein and ACPH protein of the present invention. 図8は、ラモプラニンとA54145におけるN−アシル化ペプチド結合の形成に適用される図7a及び7bの生合成のスキームを説明する。FIG. 8 illustrates the biosynthetic scheme of FIGS. 7a and 7b applied to the formation of an N-acylated peptide bond at A54145 with ramoplanin. 図9a及び9bは、陰イオンリポペプチド単離試験のバイオアッセイで得られたプレートの写真であり、IRA67陰イオン交換クロマトグラフィーに基づいた、Streptomyces refuineus subsp.thermotolerans、及びStreptomyces fradiae由来のリポペプチドの活性の強さを示している。FIGS. 9a and 9b are photographs of plates obtained in a bioassay of an anion lipopeptide isolation test, based on Streptomyces refuinus subsp. It shows the strength of the activity of lipopeptides derived from thermotolerans and Streptomyces fradiae. 図10a及び10bは、コンプレスタチンのN−アシル化類似体を産生するために、非リポペプチド天然産物(コンプレスタチン)のNRPSの生合成上の機構を使用することについて説明している。図10aは、コンプレスタチンの生合成を説明している。図10bは、N−アシル化コンプレスタチン類似体を生じさせる合理的に設計された組換え型NRPS系を説明している。Figures 10a and 10b illustrate the use of the non-lipopeptide natural product (comprestatin) NRPS biosynthetic mechanism to produce N-acylated analogs of comprestatin. FIG. 10a illustrates the biosynthesis of comprestatin. FIG. 10b illustrates a rationally designed recombinant NRPS system that yields N-acylated comprestatin analogs. 図11は、本発明の一実施形態によるコンピュータシステムのブロックダイヤグラムである。FIG. 11 is a block diagram of a computer system according to an embodiment of the present invention. 図12は、候補配列を、本発明の一実施形態による1つ又は複数の基準配列と比較するためコンピュータシステムによって実施される方法を表わすフローチャートである。FIG. 12 is a flowchart representing a method performed by a computer system to compare a candidate sequence with one or more reference sequences according to one embodiment of the invention. 図13は、候補配列を1つ又は複数の基準配列と比較するコンピュータシステムによって実施される方法と、本発明の一実施形態による比較結果の表示を表わすフローチャートである。FIG. 13 is a flowchart representing a method implemented by a computer system for comparing candidate sequences to one or more reference sequences and display of comparison results according to one embodiment of the present invention.

Claims (26)

配列番号1及び2から選択される少なくとも1つの配列に少なくとも45%の配列同一性を含むポリペプチドをコードし、アシル特異的Cドメインをコードする単離されたポリヌクレオチド。   An isolated polynucleotide encoding a polypeptide comprising at least 45% sequence identity to at least one sequence selected from SEQ ID NOs: 1 and 2, and encoding an acyl-specific C domain. (a)配列番号5、7、9、11、13、15、17及び19からなる群から選択される配列;
(b)(a)に相補的な配列;
(c)高ストリンジェンシーな条件下で前記の(a)又は(b)の配列にハイブリダイズする配列;及び、
(d)前記の(a)(b)又は(c)の配列に少なくとも70%以上の相同性を有する配列
からなる群から選択される配列を含む、単離されたポリヌクレオチド。
(A) a sequence selected from the group consisting of SEQ ID NOs: 5, 7, 9, 11, 13, 15, 17, and 19;
(B) a sequence complementary to (a);
(C) a sequence that hybridizes to the sequence of (a) or (b) above under high stringency conditions; and
(D) An isolated polynucleotide comprising a sequence selected from the group consisting of a sequence having at least 70% homology to the sequence (a), (b) or (c).
前記アシル特異的Cドメインがリポペプチドアシルキャッピングに関与する、請求項1に記載の単離されたポリヌクレオチド。   2. The isolated polynucleotide of claim 1 wherein the acyl specific C domain is involved in lipopeptide acyl capping. 前記の単離されたポリヌクレオチドが、
(a)アクチノプラネス菌種(Actinoplanes sp.)ATCC 33076由来のラモプラニン(ramoplanin)の生合成遺伝子座;
(b)ストレプトマイセス・ロゼオスポルス(Streptomyces roseosporus)NRRL 11379由来のA21978Cの生合成遺伝子座;
(c)ストレプトマイセス・フラディエ(Streptomyces fradiae)ATCC 18158由来のA54145の生合成遺伝子座;
(d)ストレプトマイセス・コエリカラー(Streptomyces coelicolor)A3(2)由来のカルシウム依存性抗生物質の生合成遺伝子座;
(e)ストレプトマイセス・ガナエンシス(Streptomyces ghanaensis)NRRL B−12104由来のリポペプチド天然産物の生合成遺伝子座;
(f)ストレプトマイセス・レフイノウス(Streptomyces refuineus)NRRL 3143由来のリポペプチド天然産物の生合成遺伝子座;
(g)ストレプトマイセス・アイズネンシス(Streptomyces aizunensis)NRRL B−11277由来のリポペプチド天然産物の生合成遺伝子座;
(h)アクチノプラネス・ニポネンシス(Actinoplanes nipponensis)FD 24834 ATCC 31145由来のリポペプチド天然産物の生合成遺伝子座;及び
(i)ストレプトマイセス菌種(Streptomyces sp.)微生物由来のリポペプチド天然産物の生合成遺伝子座
からなる群から選択される遺伝子座に存在する、請求項3に記載の単離されたポリヌクレオチド。
The isolated polynucleotide is
(A) the biosynthetic locus of ramoplanin from Actinoplanes sp. ATCC 33076;
(B) A21978C biosynthetic locus from Streptomyces roseosporus NRRL 11379;
(C) A54145 biosynthetic locus from Streptomyces fradiae ATCC 18158;
(D) a biosynthetic locus of a calcium-dependent antibiotic from Streptomyces coelicolor A3 (2);
(E) a biosynthetic locus for a natural lipopeptide product derived from Streptomyces ganaensis NRRL B-12104;
(F) the biosynthetic locus of the natural lipopeptide product from Streptomyces refuinus NRRL 3143;
(G) the biosynthetic locus of the natural lipopeptide product from Streptomyces aizunensis NRRL B-11277;
(H) a biosynthetic locus of a lipopeptide natural product derived from Actinoplanes nipponensis FD 24834 ATCC 31145; and (i) a live lipopeptide natural product derived from a Streptomyces sp. 4. The isolated polynucleotide of claim 3 present at a locus selected from the group consisting of synthetic loci.
第1のポリヌクレオチドが請求項1に記載のポリヌクレオチドであり、かつ第2のポリヌクレオチドが、
(j)配列番号3に少なくとも55%の配列同一性を有するポリペプチド、及び
(k)配列番号4に少なくとも50%の配列同一性を有するポリペプチド
からなる群から選択されるポリペプチドをコードするものである、単離された2つ以上のポリヌクレオチド。
The first polynucleotide is the polynucleotide of claim 1 and the second polynucleotide is:
(J) encodes a polypeptide selected from the group consisting of: a polypeptide having at least 55% sequence identity to SEQ ID NO: 3, and (k) a polypeptide having at least 50% sequence identity to SEQ ID NO: 4 Isolated two or more polynucleotides.
(a)配列番号23、25、27、29、31、33、35、37、39、41、43、45及び47からなる群から選択される配列;
(b)(a)に相補的な配列;
(c)高ストリンジェンシーな条件下で前記の(a)又は(b)の配列にハイブリダイズする配列、及び
(d)前記の(a)(b)又は(c)の配列に少なくとも70%以上の相同性を有する配列
からなる群から選択される配列を含む、単離されたポリヌクレオチド。
(A) a sequence selected from the group consisting of SEQ ID NOs: 23, 25, 27, 29, 31, 33, 35, 37, 39, 41, 43, 45 and 47;
(B) a sequence complementary to (a);
(C) a sequence that hybridizes to the sequence (a) or (b) under high stringency conditions; and (d) at least 70% or more to the sequence (a), (b), or (c). An isolated polynucleotide comprising a sequence selected from the group consisting of sequences having homology of:
前記の単離されたポリヌクレオチドが、
(a)アクチノプラネス菌種(Actinoplanes sp.)ATCC 33076由来のラモプラニン(ramoplanin)の生合成遺伝子座;
(b)ストレプトマイセス・ロゼオスポルス(Streptomyces roseosporus)NRRL 11379由来のA21978Cの生合成遺伝子座;
(c)ストレプトマイセス・フラディエ(Streptomyces fradiae)ATCC 18158由来のA54145の生合成遺伝子座;
(d)ストレプトマイセス・ガナエンシス(Streptomyces ghanaensis)NRRL B−12104由来のリポペプチド天然産物の生合成遺伝子座;
(e)ストレプトマイセス・レフイノウス(Streptomyces refuineus)NRRL 3143由来のリポペプチド天然産物の生合成遺伝子座;
(f)ストレプトマイセス・アイズネンシス(Streptomyces aizunensis)NRRL B−11277由来のリポペプチド天然産物の生合成遺伝子座;
(g)アクチノプラネス・ニポネンシス(Actinoplanes nipponensis)FD 24834 ATCC 31145由来のリポペプチド天然産物の生合成遺伝子座;及び
(h)ストレプトマイセス菌種(Streptomyces sp.)微生物由来のリポペプチド天然産物の生合成遺伝子座
からなる群から選択される生合成遺伝子座に存在する、請求項6に記載の単離されたポリヌクレオチド。
The isolated polynucleotide is
(A) the biosynthetic locus of ramoplanin from Actinoplanes sp. ATCC 33076;
(B) A21978C biosynthetic locus from Streptomyces roseosporus NRRL 11379;
(C) A54145 biosynthetic locus from Streptomyces fradiae ATCC 18158;
(D) the biosynthetic locus of the natural lipopeptide product derived from Streptomyces ghanaensis NRRL B-12104;
(E) a biosynthetic locus for a natural lipopeptide product from Streptomyces refinus NRRL 3143;
(F) the biosynthetic locus of the natural lipopeptide product from Streptomyces aizunensis NRRL B-11277;
(G) a biosynthetic locus of a natural lipopeptide product derived from Actinoplanes nipponensis FD 24834 ATCC 31145; and (h) a live natural product of a lipopeptide derived from a Streptomyces sp. 7. The isolated polynucleotide of claim 6 present in a biosynthetic locus selected from the group consisting of synthetic loci.
(a)配列番号5、7、9、11、13、15、17、19からなる群から選択される配列;及び
(b)(a)に相補的な配列;
(c)高ストリンジェンシーな条件下で前記の(a)又は(b)の配列にハイブリダイズする配列;及び
(d)前記の(a)(b)又は(c)の配列に少なくとも70%以上の相同性を有している配列
からなる群から選択される配列を含むポリヌクレオチドによってコードされている、単離されたアシル特異的Cドメイン。
(A) a sequence selected from the group consisting of SEQ ID NOs: 5, 7, 9, 11, 13, 15, 17, 19; and (b) a sequence complementary to (a);
(C) a sequence that hybridizes to the sequence (a) or (b) under high stringency conditions; and (d) at least 70% or more to the sequence (a), (b), or (c). An isolated acyl-specific C domain encoded by a polynucleotide comprising a sequence selected from the group consisting of:
配列番号1及び配列番号2から選択される少なくとも1つの配列に少なくとも45%の配列相同性を有する、単離されたアシル特異的Cドメイン。   An isolated acyl-specific C domain having at least 45% sequence homology to at least one sequence selected from SEQ ID NO: 1 and SEQ ID NO: 2. (a)配列番号6、8、10、12、14、16、18、20及び22からなる群から選択される配列;並びに、
(b)前記の(a)の配列に少なくとも70%以上の相同性を有する配列
からなる群から選択されるポリペプチド配列を含む、単離されたアシル特異的Cドメイン。
(A) a sequence selected from the group consisting of SEQ ID NOs: 6, 8, 10, 12, 14, 16, 18, 20, and 22; and
(B) An isolated acyl-specific C domain comprising a polypeptide sequence selected from the group consisting of a sequence having at least 70% homology to the sequence of (a).
第1の単離されたポリペプチドが、請求項9に記載のアシル特異的Cドメインであり、かつ第2の単離されたポリペプチドが、
(a)配列番号3に少なくとも55%の相同性を有するポリペプチド、及び
(b)配列番号4に少なくとも50%の相同性を有するポリペプチド
からなる群から選択されるものである、単離された2つ以上のポリペプチド。
The first isolated polypeptide is an acyl-specific C domain according to claim 9 and the second isolated polypeptide is
An isolated polypeptide selected from the group consisting of (a) a polypeptide having at least 55% homology to SEQ ID NO: 3, and (b) a polypeptide having at least 50% homology to SEQ ID NO: 4 More than one polypeptide.
(a)配列番号24、26、28、30、32、34、36、38、40、42、44、46及び48;並びに、
(b)前記の(a)の配列に少なくとも70%以上の相同性を有する配列
からなる群から選択されるポリペプチドを含む、単離されたポリペプチド。
(A) SEQ ID NOs: 24, 26, 28, 30, 32, 34, 36, 38, 40, 42, 44, 46 and 48; and
(B) An isolated polypeptide comprising a polypeptide selected from the group consisting of a sequence having at least 70% homology to the sequence of (a).
少なくとも1つのアシル特異的Cドメインポリペプチドと、アデニル化タンパク質及びアシルキャリアタンパク質からなる群から選択される別のポリペプチドとを含む、N−アシルキャッピングカセット。   An N-acyl capping cassette comprising at least one acyl-specific C domain polypeptide and another polypeptide selected from the group consisting of an adenylated protein and an acyl carrier protein. (a)ポリヌクレオチド若しくはポリペプチド配列の同定、分析又は表示のモデル化を行う方法を実行するのに十分な命令を含んでいる媒体上に格納されているコンピュータプログラムと;
(b)i)配列番号1又は配列番号2のいずれかと少なくとも45%の配列同一性を有するポリペプチドをコードし、アシル特異的Cドメインをコードするポリヌクレオチド;
ii)配列番号3と少なくとも55%の配列同一性を有するポリペプチドをコードするポリヌクレオチド;及び、
iii)配列番号4と少なくとも50%の配列同一性を有するポリペプチドをコードするポリヌクレオチド
からなる群から選択されるポリヌクレオチド配列を示す前記媒体上に格納されているデータと;
(c)配列の論理的サブコンポーネントに対応するデータ要素へ前記コンピュータプログラムがアクセスするのを容易にするための前記データの基本的な構成及び構造を反映し、前記データ構造が、前記プログラムに、かつコンピュータプログラムが前記データを系統化しアクセスする方法に固有のものであるデータ構造と
を含むコンピュータ解読可能媒体。
(A) a computer program stored on a medium containing instructions sufficient to carry out a method for identifying, analyzing or modeling a polynucleotide or polypeptide sequence;
(B) i) a polynucleotide encoding a polypeptide having at least 45% sequence identity with either SEQ ID NO: 1 or SEQ ID NO: 2 and encoding an acyl-specific C domain;
ii) a polynucleotide encoding a polypeptide having at least 55% sequence identity to SEQ ID NO: 3; and
iii) data stored on said medium indicating a polynucleotide sequence selected from the group consisting of a polynucleotide encoding a polypeptide having at least 50% sequence identity with SEQ ID NO: 4;
(C) reflects the basic structure and structure of the data for facilitating access of the computer program to data elements corresponding to logical subcomponents of an array, the data structure being in the program; And a computer readable medium comprising a data structure that is specific to a method by which a computer program organizes and accesses the data.
(a)ポリペプチド配列の同定、分析又は表示のモデル化を行う方法を実行するのに十分な命令を含んでいる媒体上に格納されているコンピュータプログラムと;
(b)i)アシル特異的Cドメインを示し、かつ配列番号1又は配列番号2のいずれかと少なくとも45%の配列同一性を有するポリペプチド;
ii)配列番号3と少なくとも55%の配列同一性を有するポリペプチド;及び、
iii)配列番号4と少なくとも50%の配列同一性を有するポリペプチド
からなる群から選択されるポリペプチドの配列を示す媒体上に格納されているデータと;
(c)配列の論理的サブコンポーネントに対応するデータ要素へ前記コンピュータプログラムがアクセスするのを容易にするための前記データの基本的な構成及び構造を反映し、前記データ構造が、前記プログラムに、かつコンピュータプログラムが前記データを系統化しアクセスする方法に固有なものであるデータ構造と
を含むコンピュータ解読可能媒体。
(A) a computer program stored on a medium containing instructions sufficient to carry out a method for identifying, analyzing or modeling a polypeptide sequence;
(B) i) a polypeptide exhibiting an acyl-specific C domain and having at least 45% sequence identity with either SEQ ID NO: 1 or SEQ ID NO: 2;
ii) a polypeptide having at least 55% sequence identity to SEQ ID NO: 3; and
iii) data stored on a medium indicating the sequence of a polypeptide selected from the group consisting of polypeptides having at least 50% sequence identity with SEQ ID NO: 4;
(C) reflects the basic structure and structure of the data for facilitating access of the computer program to data elements corresponding to logical subcomponents of an array, the data structure being in the program; And a data structure that is unique to a method by which a computer program organizes and accesses the data.
(a)配列番号1又は配列番号2のいずれかと少なくとも45%の配列同一性を有するポリペプチドをコードする、アシル特異的Cドメインをコードするポリヌクレオチド;
(b)配列番号3と少なくとも55%の配列同一性を有するポリペプチドをコードするポリヌクレオチド;及び、
(c)配列番号4と少なくとも50%の配列同一性を有するポリペプチドをコードするポリヌクレオチド
からなる群から選択されるポリヌクレオチドを示すデータを含む、ポリヌクレオチド又はポリペプチドの配列の同定、分析又はモデル化を行う方法を実行するようにプログラムされたコンピュータによってアクセス可能なデータを格納するためのメモリ。
(A) a polynucleotide encoding an acyl-specific C domain encoding a polypeptide having at least 45% sequence identity to either SEQ ID NO: 1 or SEQ ID NO: 2;
(B) a polynucleotide encoding a polypeptide having at least 55% sequence identity to SEQ ID NO: 3; and
(C) identifying, analyzing or analyzing the sequence of a polynucleotide or polypeptide comprising data indicative of a polynucleotide selected from the group consisting of a polynucleotide encoding a polypeptide having at least 50% sequence identity with SEQ ID NO: 4 Memory for storing data accessible by a computer programmed to perform the method of modeling.
(a)配列番号1又は配列番号2のいずれかと少なくとも45%の配列同一性を有するポリペプチド;
(b)配列番号3と少なくとも55%の配列同一性を有するポリペプチド;及び、
(c)配列番号4と少なくとも50%の配列同一性を有するポリペプチド
からなる群から選択されるポリペプチドを示すデータを含む、ポリペプチド配列の同定、分析又はモデル化を行う方法を実行するようにプログラムされたコンピュータによってアクセス可能なデータを格納するためのメモリ。
(A) a polypeptide having at least 45% sequence identity with either SEQ ID NO: 1 or SEQ ID NO: 2;
(B) a polypeptide having at least 55% sequence identity to SEQ ID NO: 3; and
(C) performing a method for identifying, analyzing or modeling a polypeptide sequence comprising data indicative of a polypeptide selected from the group consisting of polypeptides having at least 50% sequence identity to SEQ ID NO: 4 A memory for storing data that can be accessed by a computer programmed into the computer.
(a)配列番号1又は配列番号2のいずれかと少なくとも45%の配列同一性を有するポリペプチド、あるいは、
(b)配列番号1又は配列番号2に少なくとも45%の配列同一性を有するポリペプチドをコードするポリヌクレオチド
を同定するステップを含む、リポペプチド生合成に関与するポリペプチド又はかかるポリペプチドをコードするポリヌクレオチドを検出する方法であって、
前記の少なくとも45%の配列同一性が、リポペプチド生合成に関与するポリペプチドを示す、前記方法。
(A) a polypeptide having at least 45% sequence identity with either SEQ ID NO: 1 or SEQ ID NO: 2, or
(B) encoding a polypeptide involved in lipopeptide biosynthesis or such a polypeptide comprising identifying a polynucleotide encoding a polypeptide having at least 45% sequence identity to SEQ ID NO: 1 or SEQ ID NO: 2. A method for detecting a polynucleotide comprising:
Said method wherein said at least 45% sequence identity indicates a polypeptide involved in lipopeptide biosynthesis.
前記同定ステップが、
(a)アシル特異的ドメインを示すポリヌクレオチド又はポリペプチド配列からなる群から選択される基準ポリヌクレオチド又はポリペプチド配列を提供するステップと;
(b)前記基準配列を、コンピュータ解読可能媒体上に格納された1つ以上の候補ポリヌクレオチド又はポリペプチド配列と比較するステップと;
(c)前記基準配列と前記の1つ以上の候補配列との間の相同性レベルを検出するステップと;
(d)基準配列と少なくとも70%の相同性を有する候補配列を同定するステップとを含む、請求項18に記載の方法。
The identification step comprises:
(A) providing a reference polynucleotide or polypeptide sequence selected from the group consisting of a polynucleotide or polypeptide sequence exhibiting an acyl-specific domain;
(B) comparing the reference sequence to one or more candidate polynucleotide or polypeptide sequences stored on a computer readable medium;
(C) detecting a level of homology between the reference sequence and the one or more candidate sequences;
19. The method of claim 18, comprising (d) identifying a candidate sequence having at least 70% homology with a reference sequence.
前記基準配列が、配列番号6、8、10、12、14、16、18、20、22のポリペプチド、又は配列番号6、8、10、12、14、16、18、20若しくは22のポリペプチドをコードするポリヌクレオチドである、請求項19に記載の方法。   The reference sequence is a polypeptide of SEQ ID NO: 6, 8, 10, 12, 14, 16, 18, 20, 22, or a polypeptide of SEQ ID NO: 6, 8, 10, 12, 14, 16, 18, 20, or 22 20. The method of claim 19, wherein the method is a polynucleotide encoding a peptide. 前記候補配列及び前記基準配列に共通する構造モチーフを決定するステップをさらに含む、請求項19に記載の方法。   20. The method of claim 19, further comprising determining a structural motif common to the candidate sequence and the reference sequence. 少なくとも、a)のポリペプチド又はb)のポリヌクレオチドに近接している、
c)配列番号3に少なくとも55%の配列同一性を有する1つのポリペプチド、若しくは配列番号3に少なくとも55%の配列同一性を有するポリペプチドをコードする1つのポリヌクレオチド配列;又は、
d)配列番号4に少なくとも50%の配列同一性を有する1つのポリペプチド、若しくは配列番号4に少なくとも50%の配列同一性を有するポリペプチドをコードする1つのポリヌクレオチド配列
を同定するステップをさらに含む、請求項18に記載の方法。
At least in proximity to the polypeptide of a) or the polynucleotide of b),
c) one polypeptide sequence having at least 55% sequence identity to SEQ ID NO: 3, or one polynucleotide sequence encoding a polypeptide having at least 55% sequence identity to SEQ ID NO: 3; or
d) identifying one polypeptide having at least 50% sequence identity to SEQ ID NO: 4 or one polynucleotide sequence encoding a polypeptide having at least 50% sequence identity to SEQ ID NO: 4 The method of claim 18 comprising.
(a)c)又はd)のポリペプチドが、配列番号24、26、28、30、32、34、36、38若しくは40のポリペプチド、又は配列番号24、26、28、30、32、34、36、38若しくは40のポリペプチドに少なくとも70%の配列同一性を有するポリペプチドである、あるいは、
(b)c)又はd)のヌクレオチドが、配列番号24、26、28、30、32、34、36、38若しくは40のポリペプチドをコードするヌクレオチド、又は配列番号24、26、28、30、32、34、36、38若しくは40のポリペプチドに少なくとも70%の配列同一性を有するポリペプチドをコードするヌクレオチドである、
請求項22に記載の方法。
(A) the polypeptide of c) or d) is the polypeptide of SEQ ID NO: 24, 26, 28, 30, 32, 34, 36, 38 or 40, or SEQ ID NO: 24, 26, 28, 30, 32, 34 A polypeptide having at least 70% sequence identity to 36, 38 or 40 polypeptides, or
(B) a nucleotide wherein the nucleotide of c) or d) encodes a polypeptide of SEQ ID NO: 24, 26, 28, 30, 32, 34, 36, 38 or 40, or SEQ ID NO: 24, 26, 28, 30, A nucleotide encoding a polypeptide having at least 70% sequence identity to a 32, 34, 36, 38 or 40 polypeptide;
The method of claim 22.
(a)脂質生合成に関与するタンパク質をコードし、かつ、
(i)アシル特異的Cドメイン、又はアシル特異的Cドメインをコードするポリヌクレオチドを示すポリペプチド配列の1つ又は複数を含む、
基準配列のデータベースと、
(b)(i)データベース中の各基準配列に対して比較するための試験配列を受け取ることと;
(ii)比較の結果を表示することと、
が可能であるユーザインターフェースと
を含むコンピュータシステム。
(A) encodes a protein involved in lipid biosynthesis, and
(I) comprising one or more of an acyl-specific C domain or a polypeptide sequence representing a polynucleotide encoding an acyl-specific C domain,
A database of reference sequences;
(B) (i) receiving a test sequence for comparison against each reference sequence in the database;
(Ii) displaying the result of the comparison;
A computer system including a user interface capable of:
基準配列が、
(iv)アデニル化酵素を示すポリペプチド配列、又はアデニル化酵素をコードするポリヌクレオチド;及び、
(v)アシルキャリアタンパク質を示すポリペプチド配列、又はアシルキャリアタンパク質をコードするポリヌクレオチド
の1つ又は複数をさらに含む、請求項24に記載のコンピュータシステム。
The reference sequence is
(Iv) a polypeptide sequence representing an adenylating enzyme, or a polynucleotide encoding an adenylating enzyme; and
25. The computer system of claim 24, further comprising one or more of (v) a polypeptide sequence representing an acyl carrier protein or a polynucleotide encoding an acyl carrier protein.
(a)(i)の基準配列が、配列番号1、2、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21及び22から選択され;
(b)(iv)の基準配列が、配列番号3、23、24、25、26、27、28、29、30、31、32、33及び34から選択され;かつ、
(c)(v)の基準配列が、配列番号4、37、38、39、40、41、42、43、44、45、46、47及び48から選択される、
請求項25のコンピュータシステム。
(A) The reference sequence of (i) is SEQ ID NO: 1, 2, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21 And 22;
(B) the reference sequence of (iv) is selected from SEQ ID NOs: 3, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33 and 34; and
(C) The reference sequence of (v) is selected from SEQ ID NOs: 4, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47 and 48.
26. The computer system of claim 25.
JP2003560212A 2001-12-26 2002-12-24 Compositions, methods and systems for finding lipopeptides Pending JP2005514067A (en)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US34213301P 2001-12-26 2001-12-26
US37278902P 2002-04-17 2002-04-17
PCT/CA2002/002022 WO2003060128A2 (en) 2001-12-26 2002-12-24 Compositions, methods and systems for discovery of lipopeptides

Publications (1)

Publication Number Publication Date
JP2005514067A true JP2005514067A (en) 2005-05-19

Family

ID=26992837

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2003560212A Pending JP2005514067A (en) 2001-12-26 2002-12-24 Compositions, methods and systems for finding lipopeptides

Country Status (5)

Country Link
EP (2) EP1458868A2 (en)
JP (1) JP2005514067A (en)
AU (2) AU2002351636A1 (en)
CA (1) CA2412226A1 (en)
WO (2) WO2003060127A2 (en)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE102007017861A1 (en) * 2007-04-13 2008-10-16 Philipps-Universität Marburg Protein for the chemoenzymatic production of L-threo-hydroxyaspartate

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA1337758C (en) * 1988-04-11 1995-12-19 Eli Lilly And Company Peptide antibiotics
JP2002526107A (en) * 1998-10-07 2002-08-20 マキシジェン, インコーポレイテッド DNA shuffling to generate nucleic acids for mycotoxin detoxification
US6927286B1 (en) * 1999-01-06 2005-08-09 The Regents Of The University Of California Bleomycin gene cluster components and their uses
DE19951196A1 (en) * 1999-10-22 2001-05-10 Mohamed A Marahiel Tailored peptide synthetases and their use
WO2001053533A2 (en) * 2000-01-21 2001-07-26 Kosan Biosciences, Inc. Method for cloning polyketide synthase genes
ATE292684T1 (en) * 2000-10-13 2005-04-15 Ecopia Biosciences Inc RAMOPLANIN BIOSYNTHESIS GENE CLUSTERS
WO2002059322A2 (en) * 2000-10-17 2002-08-01 Cubist Pharmaceuticlas, Inc. Compositions and methods relating to the daptomycin biosynthetic gene cluster
CA2352451C (en) * 2001-07-24 2003-04-08 Ecopia Biosciences Inc. High throughput method for discovery of gene clusters

Also Published As

Publication number Publication date
WO2003060128A2 (en) 2003-07-24
CA2412226A1 (en) 2003-06-22
AU2002351637A1 (en) 2003-07-30
AU2002351636A1 (en) 2003-07-30
WO2003060127A2 (en) 2003-07-24
EP1458868A2 (en) 2004-09-22
EP1461434A2 (en) 2004-09-29
WO2003060127A3 (en) 2004-04-29
WO2003060128A3 (en) 2004-06-10

Similar Documents

Publication Publication Date Title
Marcone et al. Old and new glycopeptide antibiotics: From product to gene and back in the post-genomic era
Spohn et al. Overproduction of ristomycin A by activation of a silent gene cluster in Amycolatopsis japonicum MG417-CF17
JP5514185B2 (en) NRPS-PKS genes and their manipulation and utility
US20170081690A1 (en) Moenomycin biosynthesis-related compositions and methods of use thereof
US20100016170A1 (en) High throughput method for discovery of gene clusters
JP6430250B2 (en) Gene cluster for biosynthesis of glyceromycin and methylglyceromycin
JP2010535481A (en) Thiopeptide precursor protein, gene encoding it and use thereof
US20090226964A1 (en) Polymyxin Synthetase and Gene Cluster Thereof
US7462705B2 (en) Nucleic acids encoding an enediyne polyketide synthase complex
CA2365904A1 (en) Mitomycin biosynthetic gene cluster
Wu et al. Structure and biosynthesis of the BT peptide antibiotic from Brevibacillus texasporus
JP7086984B2 (en) Compositions and Methods for Enhancing Enduracididine Production in Recombinant strains of Streptomyces fungicidicus
US8188245B2 (en) Enduracidin biosynthetic gene cluster from streptomyces fungicidicus
JP2005514067A (en) Compositions, methods and systems for finding lipopeptides
US7235651B2 (en) Genes and proteins involved in the biosynthesis of lipopeptides
US20030211567A1 (en) Compositions, methods and systems for discovery of lipopeptides
Morgan Expanding the Ramoplanin Family of Antimicrobial Peptides
WO2003089641A2 (en) Dual condensation/epimerization domain in non-ribosomal peptide synthetase systems
CA2445687C (en) Compositions, methods and systems for the discovery of enediyne natural products
US8329430B2 (en) Polymyxin synthetase and gene cluster thereof
Borg Molecular Genetic and Physical Analysis of Calcium-Dependent Antibiotics from Streptomyces Species
Tan Formation and modification of enduracididine, a nonproteinogenic amino acid
EP2586791A1 (en) Gene cluster for biosynthesis of griselimycin and methylgriselimycin
WO2005021586A2 (en) Metabolic engineering of viomycin biosynthesis

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20051215

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080728

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20080905

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20080912

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20090323