CN101693895A - 编码类黄酮途径酶的基因序列及其用途 - Google Patents

编码类黄酮途径酶的基因序列及其用途 Download PDF

Info

Publication number
CN101693895A
CN101693895A CN200910009746A CN200910009746A CN101693895A CN 101693895 A CN101693895 A CN 101693895A CN 200910009746 A CN200910009746 A CN 200910009746A CN 200910009746 A CN200910009746 A CN 200910009746A CN 101693895 A CN101693895 A CN 101693895A
Authority
CN
China
Prior art keywords
leu
sequence
ala
seq
val
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN200910009746A
Other languages
English (en)
Inventor
F·布鲁里拉
T·A·霍尔顿
M·Z·米查尔
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
International Flower Developments Pty Ltd
Original Assignee
International Flower Developments Pty Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by International Flower Developments Pty Ltd filed Critical International Flower Developments Pty Ltd
Publication of CN101693895A publication Critical patent/CN101693895A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/0004Oxidoreductases (1.)
    • C12N9/0071Oxidoreductases (1.) acting on paired donors with incorporation of molecular oxygen (1.14)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8241Phenotypically and genetically modified plants via recombinant DNA technology
    • C12N15/8242Phenotypically and genetically modified plants via recombinant DNA technology with non-agronomic quality (output) traits, e.g. for industrial processing; Value added, non-agronomic traits
    • C12N15/8243Phenotypically and genetically modified plants via recombinant DNA technology with non-agronomic quality (output) traits, e.g. for industrial processing; Value added, non-agronomic traits involving biosynthetic or metabolic pathways, i.e. metabolic engineering, e.g. nicotine, caffeine
    • C12N15/825Phenotypically and genetically modified plants via recombinant DNA technology with non-agronomic quality (output) traits, e.g. for industrial processing; Value added, non-agronomic traits involving biosynthetic or metabolic pathways, i.e. metabolic engineering, e.g. nicotine, caffeine involving pigment biosynthesis

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Engineering & Computer Science (AREA)
  • Chemical & Material Sciences (AREA)
  • Wood Science & Technology (AREA)
  • Organic Chemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Zoology (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • Biomedical Technology (AREA)
  • Molecular Biology (AREA)
  • Microbiology (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Plant Pathology (AREA)
  • Nutrition Science (AREA)
  • Cell Biology (AREA)
  • Physics & Mathematics (AREA)
  • Biophysics (AREA)
  • Medicinal Chemistry (AREA)
  • Breeding Of Plants And Reproduction By Means Of Culturing (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Saccharide Compounds (AREA)
  • Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Enzymes And Modification Thereof (AREA)
  • Cultivation Of Plants (AREA)
  • Cosmetics (AREA)
  • Pyrane Compounds (AREA)

Abstract

本发明一般涉及编码类黄酮途径中代谢酶,更具体地,类黄酮3’-羟化酶(下文称为“F3’H”)或其衍生物的基因序列及其它们在植物和其它生物中控制色素形成的用途。

Description

编码类黄酮途径酶的基因序列及其用途
本申请是申请日为1997年2月28日、申请号为97193973.X、发 明名称为“编码类黄酮途径酶的基因序列及其用途”的发明专利申 请的分案申请。
本发明一般涉及编码类黄酮途径中代谢酶更具体地,类黄酮3’- 羟化酶(下文称为“F3’H”)或其衍生物的基因序列及其它们在植物 和其它生物中控制色素形成的作用。
本说明书中作者提及的发表文章的文献目录详情收录在说明书结 尾部分。说明书和权利要求书中提及的核苷酸和氨基酸序列的序列鉴定 号(SEQ ID NOS)在文献目录后定义。SEQ ID NOS的概述及其所涉及 的序列在实施例前提供。
在本说明书全文中,除非上下文另有要求,单词“包含”或其诸 如现在时(comprcies)或进行时(comprising)的时态变化将理解为 指包括所述元件或整体或元件或整体组但不排除任何其它元件或整体 或元件或整体组。
重组DNA技术迅速发展的改进极大地促进了与生物技术有关工业 领域的研究和发展。园艺工业已成为该技术最近的受益者,该技术有助 于在扦插后表现出衰老延缓的植物和花中形成疾病抗性。也有些注意力 集中在控制花的颜色上。
花卉工业致力于形成新的和没的开花植物品种。产生这样的新品 种的一个有效的途径是通近控制花的颜色。使用经典育种技术已成功地 产生了大多数商业花卉品种的许多颜色。然而,这种方法因受具体种类 基因库的局限而受到限制,因此,很少使单一种类具有全色谱的有色品 种。另外,传统的育种技术缺乏精确性。花的美学吸引力是诸如形态, 香味和颜色的许多因素的组合:通过杂交对一种特征的修饰常常牺牲一 种同样有价值的特征。在切花和观赏种类中以遗传工程精确改变颜色的 能力在产业上将提供有意义的商业机会,它具有迅速的产品转向且其中 新颖性是重要的市场特征。
花的颜色主要是由于两种类型的色素:类黄酮和类胡萝卜素。类黄 酮提供由黄到红到蓝的颜色范围。类胡萝卜素提供橙色或黄色且通常是 黄色或橙色花中的主要色素。对花的颜色起主要作用的类黄酮分子是花 青苷,它是花青素,花翠素,3’-甲花翠素,甲基花青素,二甲翠雀素 和花葵素的糖基化衍生物,且位于液泡中。不同的花青苷可产生明显不 同的颜色。花的颜色也受无色类黄酮,金属复合物,糖基化,乙酰化和 液泡pH的辅助色素形成作用的影响(Forkmann,1991)。
类黄酮色素的生物合成途径(下文称为“类黄酮途径”)已充分了 解并在表示于图1a和1b中(Ebel和Hahlbrock,1988;Hahlbrock和 Grisebach,1979;Wiering和De Vlaming,1984;Schram等,1984; Stafford,1990;van Tunen和Mol,1990;Dooner等,1991;Martin和 Gerats,1993;Holton和Cornish,1995)。该途径中第一个参与的步骤 涉及3个丙二酰-CoA分子与一个对香豆酰-CoA分子的缩合。该反应 由查耳酮合成酶(CHS)催化。该反应的产物2’,4’,4’,6’-四羟 基查耳酮正常情况下由查耳酮黄烷酮异构酶(CHI)迅速异构化产生 4’,5,7-三羟黄烷酮。4’,5,7-三羟黄烷酮随后由黄烷酮3-羟 化酶(F3H)在中央环的3位羟基化产生二氢四羟基黄酮(DHK)。
DHK B环的羟基化方式在决定花瓣颜色中起着关键性作用。B环 可在3’处或在3’及5’两处羟基化分别产生二氢栎皮黄酮(DHQ)和二 氢杨酶黄酮(DHM)。在该途径中涉及的两个关键酶是类黄酮3’-羟 化酶和类黄酮3’,5’-羟化酶,两者均是细胞色素P450类。细胞色素 P450酶在自然界中广泛分布,已从脊椎动物,昆虫,酵母,真菌,细菌 和植物中分离并测序了它的基因。
类黄酮3’-羟化酶作用于DHK产生DHQ且作用于4’,5,7- 三羟黄烷酮产生圣草酚。DHQ的还原和糖基化产生花青素糖苷和甲基 花青素糖苷色素,在许多植物种类(例如玫瑰,石竹和菊)中这些色素 产生红色和粉红色花色。这些花青苷的合成也可产生其它花色。例如, 兰色矢车菊含有花色素苷。在开花植物中控制类黄酮3’-羟化酶活性或 类黄酮途径中涉及的其它酶的能力可提供控制花瓣颜色的方法。由此可 产生单一栽培品种的不同颜色形式,且在有些情况下,单一种类可产生 更宽色谱的颜色
已克隆了编码矮牵牛属类黄酮3’-羟化酶的核苷酸序列(本文称为 SEQ ID NO:26)(见国际专利申请号PCT/AU93/00127[WO 93/2026])。然而,该序列没有能力调节植物中3’-羟基化花青苷的合成。 因此,需要鉴定其它有效调节植物中类黄酮化合物羟基化的编码类黄酮 3’-羟化酶的进一步的基因序列。更具体地说,需要鉴定有效调节植物中 3’-羟化花青苷合成的编码类黄酮3’-羟化酶的进一步的基因序列。
根据本发明,编码类黄酮3’-羟化酶的基因序列已得到鉴定和克 隆。本发明的重组基因序列可以通过,例如,从头表达,过度表达,抑 制,反义抑制和核酶活性来调节编码该酶的基因的表达。控制植物中类 黄酮3’-羟化酶合成的能力可以调节每个花青苷的组成及改变类黄醇和 花青苷的相对水平,从而能控制组织的颜色,如花瓣,叶,种子和果实 的颜色。下文中描述的本发明涉及花的颜色的控制,但应理解为可延伸 到控制其它植物组织比如叶,种子和果实。
因此,本发明的一个方面提供了分离的核酸分子,包含编码类黄酮 3’-羟化酶或其衍生物的核酸序列,其中所述的类黄酮3’-羟化酶或其 衍生物比SEQ ID NO:26所述的核苷酸序列编码的类黄酮3’-羟化酶能 更有效地调节植物中类黄酮化合物的羟化。
本文所用的效率涉及类黄酮3’-羟化酶在植物细胞中羟化类黄酮化 合物的能力。这给植物提供了类黄酮途径中其它酶的额外底物,从而能 通过,例如,糖基化,酰基化和鼠李糖基化进一步修饰该分子以合成有 助于形成一系列颜色的各种花青苷。由此,3’-羟基化的花青苷可以得 到调节。其效率可以方便地通过选自下列参数的一种或多种参数来估 计:以产生的mRNA的量测定的转录水平;4’,5,7-三羟黄烷酮和 /或DHK的羟基化水平;以合成的翻译产物的量测定的mRNA翻译水 平;DHQ或DHM的花青苷衍生物的合成水平;对组织如,花,种子, 叶或水果的颜色的影响程度。
本发明的另一方面是关于分离的核酸分子,包含定位于矮牵牛属中 名为Ht1或Ht2的遗传基因座上或其它有花植物种类相同的这类基因座 上的核苷酸序列,其中所说的分离的核酸分子编码类黄酮3’-羟化酶或 其互补于编码该酶的序列。
本发明的另一方面包含一种分离的核酸分子,包含对应于矮牵牛属 中名为Ht1或Ht2的遗传基因座,或含控制3’-羟化类黄酮合成的序列 的其它有关植物种类中基因座的核苷酸序列,其中所说的分离的核酸分 子编码类黄酮3’-羟化酶或其衍生物,后者比SEQ ID NO:26所述的类 黄酮3’-羟化酶能更有效地将DHK转化成DHQ。
根据本发明的上述方面,提供了一种核酸分子,它包含基本上如 SEQ ID NO:1所述的或具有与其至少大约60%相似性或能在低度严格 条件下与SEQ ID NO:1所述序列杂交的核苷酸序列或其互补核苷酸序 列。
在有关实施方案中,提供了一种核酸分子,它包含基本上如SEQ ID NO:3所述的或具有与其至少大约60%相似性或能在低度严格条件下与 SEQ ID NO:3所述序列杂交的核苷酸序列或其互补核苷酸序列。
在另一相关实施方案中,本发明涉及一种核酸分子,它包含基本上 如SEQ ID NO:5所述的或具有与其至少大约60%相似性或能在低度严 格条件下与SEQ ID NO:5所述的序列杂交的核苷酸序列或其互补核苷 酸序列。
还有另一个相关的实施方案提供了一种核酸分子,它包含基本上如 SEQ ID NO:7所述的或具有与其至少大约60%相似性或能在低度严格 条件下与SEQ ID NO:7所述序列杂交的核苷酸序列或其互补核苷酸序 列。
还有本发明另一个实施方案涉及一种核酸分子,它包含基本上如 SEQ ID NO:9所述的或具有与其编码区至少大约60%相似性或能在低 度严格条件下与SEQ ID NO:9所述序列杂交的核苷酸序列或其互补核 苷酸序列。
在另一实施方案中,提供了一种核酸分子,它包含基本上如SEQ ID NO:14所述或具有与其至少大约60%相似性或能在低度严格条件下与 SEQ ID NO:14所述序列杂交的核苷酸序列或其互补核苷酸序列。
在另一实施方案中,本发明涉及一种核酸分子。它包含基本上如 SEQ ID NO:16所述或具有与其至少大约60%相似性或能在低度严格条 件下与SEQID NO:16所述序列杂交的核苷酸序列或其互补核苷酸序 列。
还有另一个实施方案提供了一种核酸分子,它包含基本上如SEQ ID NO:18所述的或具有与其至少大约60%相似性或能在低度严格条件下 与SEQ ID NO:18所述的序列杂交的核苷酸序列或其互补核苷酸序列。
而且,本发明的另一实施方案涉及一种核酸分子,它包含基本上如 SEQ ID NO:20所述的或具有与其至少大约60%相似性或能在低等严格 条件下与SEQ ID NO:20所述的序列杂交的核苷酸序列或其互补核苷酸 序列。
还有另一个实施方案涉及一种核酸分子,它包含基本上如SEQ ID NO:22所述的或具有与其至少大约60%相似性或能在低度严格条件下 与SEQ ID NO:22所述的序列杂交的核苷酸序列或其互补核苷酸序列。
在另一实施方案中,本发明提供了一个核酸分子,它包含基本上如 SEQ ID NO:24所述的或具有与其至少大约60%相似性或能在低等严格 条件下与SEQ ID NO:24所述的序列杂交的核苷酸序列或其互补核苷酸 序列。
在一个特别优选的实施方案中,提供了一种分离的核酸分子,它包 含基本上如SEQ ID NO:1所述的或具有与其至少大约60%相似性或能 在低度严格条件下与SEQ ID NO:1所述的序列杂交的核苷酸序列或其 互补核苷酸序列,其中所述的核革酸序列定位到矮牵牛属中称为Ht1或 Ht2的遗传基因座上或在其它开花植物种类中相应的这类基因座上,且其 中所述的分离的核酸分子编码类黄酮3’-羟化酶,或与编码该酶的序列 互补。
本文参考的42℃的低度严格条件包括和包含用于杂交的从至少大 约1%到至少大约15%的甲酰胺和从至少大约1M到至少大约2M的 盐,以及作为洗涤条件的至少大约1M到至少大约2M的盐。如果需要, 可使用替换的严格条件,如中等严格条件,它包括和包含用于杂交的从 至少大约16%到至少大约30%的甲酰胺和从至少大约0.5M到至少大约 0.9M的盐,以及作为洗涤条件的至少大约0.5M到至少大约0.9M的盐, 或高度严格条件,它包括和包含用于杂交的从至少大约31%到至少大约 50%甲酰胺和从至少大约0.01M到至少大约0.15M的盐,以及作为洗涤 条件的至少大约0.01M到至少大约0.15M的盐。杂交可在不同温度下进 行,如果这样,可据此调节其它条件。
本发明的另一方面提供了一种核酸分子,它包括编码基本上如SEQ ID NO:2所述的氨基酸序列或具有与其至少大约50%相似性的氨基酸序 列的核苷酸序列或与该编码序列互补的核苷酸序列。
在有关实施方案中,提供了一种核酸分子,它包括编码基本上如 SEQ ID NO:4所述的氨基酸序列或具有与其至少大约50%相似性的氨 基酸序列的核苷酸序列或与该编码序列互补的核苷酸序列。
本发明的另一相关实施方案涉及一种核酸分子,它包括编码基本上 如SEQ ID NO:6所述的氨基酸序列或具有与其至少大约50%相似性的 氨基酸序列的核苷酸序列或其互补序列。
还有另一相关的实施方案提供了一种核酸分子,它包括编码基本上 如SEQ ID NO:8所述的氨基酸序列或具有与其至少大约50%相似性的 氨基酸序列的核苷酸序列或其互补序列。
还有另一相关的实施方案涉及一种核酸分子,它包括编码基本上如 SEQ ID NO:10或SEQ ID NO:11或SEQ ID NO:12或SEQ ID NO:13 所述的氨基酸序列或具有与其至少大约50%相似性的氨基酸序列或其互 补序列。
在另一实施方案中,本发明涉及一种核酸分子,它包括编码基本上 如SEQ ID NO:15所述的氨基酸序列或具有与其至少大约50%相似性的 氨基酸序列的核苷酸序列或其互补序列。
还有在另一实施方案中,提供子一种核酸分子,它包括编码基本上 如SEQ ID NO:17所述的氨基酸序列或具有与其至少大约50%相似性的 氨基酸序列的核苷酸序列或其互补序列。
在另一实施方案涉及一种核酸分子,它包括编码基本上如SEQ ID NO:19所述的氨基酸序列或具有与其至少大约50%相似性的氨基酸序 列的核苷酸序列或其互补序列。
而且,本发明的另一实施方案涉及一种核酸分子,它包括编码基本 上如SEQ ID NO:21所述的氨基酸序列或具有与其至少大约50%相似性 的氨基酸序列的核苷酸序列或其互补序列。
还有一个实施方案涉及一种核酸分子,它包括编码基本上如SEQ ID NO:23所述的氨基酸序列或具有与其至少大约50%相似性的氨基酸序 列的核苷酸序列或其互补序列。
在另一实施方案中,本发明提供了一种核酸分子,它包括编码基本 上如SEQ ID NO:25所述的氨基酸序列或具有与其至少大约50%相似性 的氨基酸序列的核苷酸序列或其互补序列。
在一个特别优选的实施方案中,提供了一种分离的核酸分子,它包 括编码基本上如SEQ ID NO:2所述的氨基酸序列或具有与其至少大约 50%相似性的氨基酸序列的核苷酸序列或其互补序列,其中所述的核苷 酸序列定位到矮牵牛属中称为Ht1或Ht2的遗传基因座上或其它开花植 物种类中相应的这类基因座上,其中所述的分离的核酸分子编码类黄酮 3’-羟化酶或其衍生物或是该编码序列的互补序列。
本文使用的术语“相似性”包括在核苷酸或氨基酸水平上所比较的 序列间完全相同。在核苷酸水平上没有相同性的地方,“相似性”包括 产生在结构,功能,生物化学和/或构象水平上互相相关的不同氨基酸的 序列之间的差异。在氨基酸水平上没有相同性的地方,“相似性”包括 在结构,功能,生物化学和/或构象水平上互相相关的氨基酸。
SEQ ID NO:1所示的核酸分子编码来自矮牵牛属的类黄酮3’-羟 化酶。其它适合的F3’H基因的例子来自石竹(SEQ ID NO:3),金鱼 草属(SEQ ID NO:5),拟南芥属(SEQ ID NO:7),拟南芥属基因 组DNA克隆(SEQ ID NO:9),玫瑰(SEQ ID NO:14),菊(SEQ ID NO:16),蝴蝶草属(SEQ ID NO:18),日本牵牛花(SEQ ID NO: 20),龙胆(SEQ ID NO:22)和lisianthus(SEQ ID NO:24)。尽 管本发明特别列举了上述F3’H基因,但本发明可延伸到任何植物种类的 F3’H基因,只要这些F3’H基因在核苷酸水平上具有与选自SEQ ID NO: 1或3或5或7或14或16或18或20或22或24的核酸分子至少大约60 %的相似性或在氨基酸水平上具有与选自SEQ ID NO:2或4或6或8或 10,11,12,13或15或17或19或21或23或25的氨基酸分子至少 大约50%的相似性。本发明进一步延伸到来自任何植物种类的F3’H基 因,只要这些F3’H基因在核苷酸水平上具有与SEQ ID NO:9的编码区 域至少大约60%的相似性。
本发明的核酸分子一般是在非天然存在状态下的基因序列。一般来 说,这意味着从其天然状态分离出来或人工合成或在非天然存在环境中 产生。更具体地,它包括体外形成或维持的核酸分子,包括基因组DNA 片段,重组或合成的分子和与异源性核酸连接的核酸。它也延伸到编码 F3’H的基因组DNA或cDNA或其部分,或者相对于其自身的或其它启 动子方向相反的部分。它进一步延伸到相对于其它核酸序列至少部分纯 化的天然存在的序列。
术语“核酸分子”包括核酸分离物和基因序列,在本文中以其最普 遍的含义使用,它包括F3’H中的氨基酸序列直接地或经碱基的互补系列 限定的任何核苷酸碱基的接近系列。该氨基酸序列可组成全长的F3’H或 其有活性的截短形式或可相应于该酶的特定区域,如N-端,C-端或 中间部分。本文涉及的核酸分子也包含作为基因探针或作为能调节植物 中相应基因表达的“反义”分子的寡核苷酸。本文使用的“反义分子” 也可包括含有相对于其自身的或另一启动子反向的结构基因组或cDNA 基因或其部分的基因构建体。因此,本发明的核酸分子可适用于作为共 同抑制分子,核酶分子,有义分子和反义分子以调节3’-羟基化花青苷 的水平。
在另一实施方案中,编码F3’H的核酸分子或其各种衍生物用于减 小内源性F3’H的活性,选择性地,编码该酶的核酸分子或其各种衍生物 以反义方向使用以减小F3’H的活性。尽管不希望以任一理论限制本发 明,但将该核酸分子导入细胞中通过降低同源内源性基因的转录或通过 增加相应mRNA的转换来产生这一结果是可能的。使用含有有义或反义 方向的F3’H核酸分子或其各种衍生物的基因构建体可实现这一点。在更 进一步的改进方案中,可使用核酶灭活靶核酸分子。选择性地,核酸分 子编码一种功能性F3’H且它用于升高植物中该酶的水平。
本文提及的类黄酮F3’H活性的改变涉及将活性升高或降低到正常 内源性或现存活性水平之上或之下达30%,或更优选30-50%,或甚 至更优选50-75%或更优选75%或更大。使用Stotz和Forkmann (1982)所述方法的改进方式(见实施例7)或通过按实施例5所述测 定F3’H产物,比如栎皮黄酮,花青素或甲基花青素的量可较容易地测定 活性水平。
本发明进一步延伸到以寡核苷酸引物或探针形式存在的核酸分子, 该引物或探针在高度,优选在中等,且最优选在低等严格条件下能与上 述核酸分子,特别是选自SEQ ID NO:1,3,5,7,9,14,16, 18,20,22或24中所述的核酸分子的一部分杂交。优选地该部分对应 于F3’H基因的5’或3’端。为了方便,本文所说的5’端定义为基本上在 初级转录子5’端至该基因中央部分之间的区域,本文所说的3’端定义为 基本上在该基因中央部分至初级转录子3’端之间的区域。因此,很明显 寡核苷酸或探针可与5’端或3’端或与5’和3’端共有的区域杂交。
核酸分子或其互补形式可编码全长酶或其部分或其衍生物。“衍生 物”指相对于天然存在的酶有任意单一或多处氨基酸取代,缺失和增加, 且包括部分,片段,分部,融合分子,同源物和类似物。关于这点,核 酸包括天然存在的编码F3’H的核苷酸序列或可包含对所述天然存在的 序列的单一或多个核苷酸取代,缺失和/或增加。融合分子可以是编码2 个或多个F3’H的核苷酸序列之间的融合,或编码F3’H的核酸序列与编 码任何其它蛋白质类分子的核苷酸序列之间的融合。融合分子在改变底 物特异性中有用。
本发明的核酸分子或其互补形式或F3’H的衍生物也可包括不管其 是否具有活性的“部分”。有活性的或有功能的核酸分子是编码具有F3’H 活性的酶的分子。有活性的或有功能的分子进一步包括具有部分活性的 分子,例如,底物特异性降低的F3’H应认为具有部分活性。核酸分子的 衍生物可作为寡核苷酸探针,作为用于聚合酶链式反应或各种突变技术 的引物,用于产生反义分子或核酶构建体。它们也可用于形成共同抑制 构建体。根据本发明这一方面的核酸分子可编码或不编码具有功能的 F3’H。“部分”可来自该核酸分子的5’端或3’端与5’及3’端共有的区域。
本发明的F3’H的氨基酸***衍生物包括氨基和/或羟基末端融合物 以及单个或多个氨基酸的序列内***。***氨基酸序列的变异体是那些 其中将一个或多个氨基酸残基导入了蛋白质的预定位点的变异体,尽管 也可能进行随机***并适当筛选所得的产物。缺失变异体的特征在于从 序列中去掉了一个或多个氨基酸。置换氨基酸变异体是那些其中序列中 的至少一个残基被去掉并在其位置***不同的残基的变异体。典型的置 换是根据下面表1进行的取代。
表1
适合于氨基酸置换的残基
原始残基        典型的置换
Ala             Ser
Arg             Lys
Asn             Gln;His
Asp             Glu
Cys             Ser
Gln             Asn
Glu             Asp
Gly             Pro
His             Asn;Gln
Ile             Leu;Val
Leu             Ile;Val
Lys             Arg;Gln;Glu
Met             Leu;Ile
Phe             Met;Leu;Tyr
Ser             Thr 
Thr             Ser
Trp             Tyr
Tyr             Trp;Phe
Val             Ile;Leu
在F3’H通过氨基酸置换改变时,氨基酸一般被具有相似特性,如 疏水性,亲水性,电负性,侧链大小等的其它氨基酸置换。典型的氨基 酸置换是单一残基。氨基酸***通常是大约1-10个氨基酸残基的级 别,缺失变化范围为1-20个残基。优选地,缺失或***在相邻的碱基 对中进行,即,缺失2个残基或***2个残基。
使用本领域熟知的肽合成技术,如固相肽合成(Merrifield,1964) 等,或经重组DNA操作可较容易地制备上面提及的氨基酸变异体。在含 已知或部分已知序列的DNA的预定位点进行置换突变的技术是熟知 的,包括,例如,M13突变。用以产生表现为置换,***或缺失变异体 的变异蛋白质的DNA序列操作一般在,例如,Sambrook等(1989) 中进行了描述。
本发明的F3’H的重组或合成突变体或衍生物的其它例子包括单个 或多个置换,缺失和/或增加与酶相连的任意分子,如糖类、脂类和/或蛋 白质或多肽。
术语“类似物”和“衍生物”也延伸到F3’H的任意的不管其是否 有功能的化学等效物,还可延伸到上述任意氨基酸衍生物。如果本发明 这个方面的“类似物”和“衍生物”是非功能性的,它们可作为F3’H活 性的***或拮抗剂。为了方便,本文提到的“F3’H”包括提及的任何 衍生物,包括其部分,突变体,片段,同源物或类似物。
本发明用来自矮牵牛属,石竹,玫瑰,金鱼草属,拟南芥属,菊, lisianthus,蝴蝶草属,牵牛花和龙胆的核酸序列为例,因为它们代表了 至今最常见和优选的材料来源。然而,本领域的技术人员将马上意识到 相似的序列可以从任何来源,如从其它植物或某些微生物中分离。其它 植物的例子包括,但不限于玉米,烟草,矢车菊,天竺葵属,苹果,扶 郎花属和非洲紫罗兰。本发明包括所有这些直接或间接编码类黄酮途径 的酶且特别是F3’H的核酸序列,而不考虑它们的来源。
本文期望的核酸分子能以单独的方式存在,也可与载体分子,如表 达载体结合。术语载体分子以其最广的含义使用,包括用于核酸分子的 能帮助将核酸转化入植物细胞和/或帮助整合到植物基因组中的任何中间 载体。例如,中间载体可适合在电穿孔,微粒轰击,土壤杆菌介导的转 化中使用或由DNA或RNA病毒***。本文包含的中间载体和/或核酸分 子可以或不必稳定整合入植物基因组。这样的载体分子也可在原核细胞 中复制和/或表达。优选地,载体分子或其部分能整合到植物基因组中。 核酸分子可另外含有能指导核酸分子在植物细胞中表达的启动子序列。 核酸分子和启动子也可通过如上所述的任何方式导入细胞中。
根据本发明,编码F3’H或其衍生物或其部分的核酸分子可以任一 方向导入植物来允许,许可或促进细胞质内mRNA的生产水平和/或由 mRNA合成酶的水平,从而提供将DHK和/或其它合适的底物(如果在 植物细胞中合成)最终转变成花色素的花青苷衍生物,如花青素和/或甲 基花青素,或选择性地通过降低或消除内源性或现存的F3’H活性来抑制 该代谢物这种转变。细胞质中mRNA的合成和/或由mRNA合成酶在本 文中称为“表达”。花青素的合成有助于产生红或兰色的花色。在植物 中以任一方向表达核酸分子可以是组成型的,诱导型的或发育型的,也 可以是组织特异性的。
根据本发明的这一方面,提供了产生能合成F3’H或其功能性衍生 物的转基因植物的的方法,所述的方法包括在允许所述的核酸分子最终 表达的条件下用含有编码所述的F3’H的核酸序列的核酸分子稳定转化 合适植物的细胞,从该细胞再生转基因植物并在足以允许核酸分子表达 的条件下让所述的转基因植物生长一段时间。由此转基因植物可以产生 相对于可比较的非转基因植物中表达的量更高水平的F3’H活性。
本发明的另一方面涉及一种用于产生减少内源性或现存F3’H活性 的转基因植物的方法,所述的方法包括用含有编码F3’H的核苷酸序列或 其互补序列的核酸分子稳定转化合适植物的细胞,从该细胞再生转基因 植物,且如果需要,则在足以允许该核酸分子表达的条件下让所述的转 基因植物生长。
本发明的另一方面涉及产生内源性或现存F3’H活性减小的遗传修 饰的植物的方法,上述的方法包含通过用导入植物细胞的适当改变的 F3’H基因或其衍生物或部分经同源重组修饰内源性序列来改变F3’H基 因并从该细胞再生遗传修饰的植物。
根据本发明的这些方面,优选的核酸分子基本上如SEQ ID NO:1, 3,5,7,14,16,18,20,22,24所述,或是9的编码区域, 或具有与它们至少大约60%的相似性,或能在低度严格条件下与它们杂 交。
在优选的实施方案中,本发明包含产生表现出改变的花色的转基因 开花植物的方法,上述的方法包含用本发明的核酸分子稳定转化合适的 植物细胞,从这些细胞再生转基因植物并在足以允许该核酸分子表达成 F3’H酶的条件下让上述的转基因植物生长一段时间。选择性地,上述的 方法可包括用本发明的核酸分子或其互补序列稳定转化合适的植物的细 胞,从该细胞再生转基因植物并在足以改变内源性或现存F3’H活性水平 的条件下让上述的转基因植物生长一段时间。优选地,改变了的水平应 低于可比较的非转基因植物中内源性或现存的F3’H活性水平。
在相关实施方案中,本发明包含产生表现了改变的花色的开花植物 的方法,所述的方法包含通过用导入植物细胞的适当改变的F3’H基因或 其衍生物经同源重组修饰内源性序列来改变F3’H基因并从该细胞再生 遗传修饰的植物。
本发明的核酸分子可以是或不是发育调控的。优选地,3’-羟基化 的花青苷水平的调节导致花色改变,包括根据受体植物的生理条件产生 红色花或其它颜色差别。“受体植物”是指能合成F3’H酶的底物或合成 F3’H酶本身,且具有所需颜色发育必需的适当生理特性和基因型的植 物。它可包括但不限于矮牵牛属,石竹,菊,玫瑰,金鱼草属,烟草, 矢车菊,天竺葵属,lisianthus,扶郎花属,苹果,鸢尾,百合花,非洲 紫罗兰,龙胆,蝴蝶草属和日本牵牛花。
因此,本发明推延到产生能调节3’-羟基化的花青苷水平的转基因 植物的方法,所述的方法包括用含有编码F3’H或其衍生物的核苷酸序列 或该编码序列的互补序列的核酸分子稳定转化合适植物的细胞或细胞 团,从所述的细胞或细胞团再生转基因植物。
本领域的技术人员会马上知道可应用于本发明的方法的各种变化, 如增加或减小靶植物中天然存在的酶活性水平使得颜色的差异不同。
因此,本发明延伸到含有全部或部分本发明的核酸元件和/或其任何 同源或相关形式或它们中任何一个的反义形式的所有转基因植物,特别 是那些表现出花色改变的转基因植物。该转基因植物可含有导入的核酸 分子,该核酸分子含有编码F3’H的核苷酸序列或该编码序列的互补序 列。一般来说,该核酸可稳定地导入植物基因组,尽管本发明还延伸到 将F3’H核苷酸序列导入能在植物细胞内复制的自主复制核酸序列,如 DNA或RNA病毒。本发明还延伸到从该转基因植物获得的种子。这类 种子,特别是如果有色,则可用作植物的特有标记。
本发明的另一方面涉及F3’H的重组形式。该酶的重组形式提供 了用于研究的材料来源来发展活性更大的酶,且可用于建立产生有色化 合物的体外***。
本发明还有一个方面涉及本文所述的基因序列在制造用于调节植 物或植物细胞中的3’-羟基化花青苷水平的基因构建体中的用途。
本发明的另一方面提供了表现出花色改变的来自本文所述的转基 因植物的花,特别是切花。
本发明的另一方面涉及含有编码F3’H或其衍生物的核苷酸序列或该 编码序列的互补序列的核酸分子,其中所述的核酸分子能在植物细胞中表 达。术语“表达(expressed)”相当于上文定义的术语“表达(expression)”。
根据本发明的这一和其它方面的核酸分子,相对于国际专利申请 号PCT/AU93/00127[WO 93/20206]公开的质粒PCGP809中包含的 PCGP619cDNA***片段的效率而言允许,许可或促进更高效率地调节3’ -羟基化花青苷。术语“植物细胞”包括单个的植物细胞或植物细胞团, 如愈伤组织中,小植株或植株或其部分,包括花和种子。
本发明的另一方面提供了包括编码F3’H的核苷酸序列或该编码 序列的互补序列的核酸分子,其中所述的核酸分子的翻译产物含有氨基 酸序列RPPNSGA。优选地,所述的核酸分子的翻译含有氨基酸序列 RPPNSGAXHXAYNYXDL,且更优选地,所述的核酸分子的翻译产物包含氨 基酸序列RPPNSGAXHXAYNYXDL[X]nGGEK,其中X代表任意氨基酸,[X]n代表0至500位氨基酸的氨基酸序列。
本发明进一步由以下提及的非限制性的附图和实施例进行描述。 在附图中:
图1(图1a和1b)是P.hybrida花中类黄酮生物合成途径的示意 图,显示了转化中涉及的酶和遗传基因座。该途径中涉及的酶表示如下: PAL=苯丙氨酸氨基裂解酶;C4H=肉桂酸盐-4-羟化酶;4CL=4-香 豆酸;CoA连接酶;CHS=查耳酮合成酶;CHI=查耳酮异构酶;F3H= 黄烷酮-3-羟化酶;F3’H=类黄酮3’-羟化酶;F3’5’H=类黄酮 3’5’羟化酶;FLS=黄烷醇合成酶;DFR=二氢黄烷醇-4-还原酶; ANS=花青苷合成酶;3GT=UDP-葡萄糖:花青苷-3-葡萄糖苷; 3RT=UDP-鼠李糖:花青苷-3-葡萄糖苷鼠李糖苷转移酶;ACT =花青苷-3-芸香糖苷酰基转移酶;5GT=UDP-葡萄糖:花青苷5 -葡萄糖苷转移酶;3’OMT=花青苷O-甲基转移酶;3’,5’OMT=花 青苷3’,5’-O-甲基转移酶。在该途径中的3种类黄酮表示为:P-3 -G=花葵素-3-葡萄糖苷;DHM=二氢杨酶黄酮;DHQ=二氢 栎皮黄酮。在P.hybrida中仅以较低水平合成类黄醇,杨酶黄酮且极少合 成花青苷,花葵素。
图2是质粒pCGP161的示意图,该质粒含有编码来自P.hybrida 的肉桂酸-4-羟化酶的cDNA克隆(F1)。0.7kb EcoR I/XhoI片段 的32P标记的片段用于探测美国国旗红花瓣的cDNA文库。详情见实施例 4。缩写如下:Amp=氨苄青霉素抗性基因;ori=复制起点;T3= T3RNA聚合酶的识别序列;T7=T7RNA聚合酶的识别序列。也标记 了限制性酶位点。
图3是质粒pCGP602的示意图,pCGP602含有编码来自P. hybrida的类黄酮3’5’羟化酶(Hf1)的cDNA克隆(617)。含Hf1编码区的1.6kb Bsp HI/Fsp I片段的32P标记的片段用于探测国旗红花瓣 的cDNA文库。详情见实施例4。缩写如下:Amp=氨苄青霉素抗性基 因;ori=复制起点;T3=T3RNA聚合酶的识别序列;T7=T7RNA 聚合酶的识别序列。还标记了限制性酶位点。
图4是质粒pCGP175的示意图,pCGP175含有编码来自 P.hybrida的类黄酮3’5’羟化酶(Hf2)的cDNA克隆(H2)。一起含 有Hf2编码区的1.3kb EcoRI/Xho I和0.5kb Xho I片段的32P标记的片 段用于探测美国国旗红花瓣cDNA文库。详情见实施例4。缩写如下: Amp=氨苄青霉素抗性基因;ori=复制起点;T3=T3RNA聚合酶的 识别序列;T7=T7RNA聚合酶的识别序列。还标记了限制性酶位点。
图5是质粒pCGP619的示意图,pCGP619含有编码来自P.hybrida 的细胞色素P450的651cDNA克隆。1.8kb EcoR I/Xho I片段的32P标 记的片段用于探测美国国旗红花瓣的cDNA文库。详情见实施例4。缩 写如下:Amp=氨苄青霉素抗性基因;ori=复制起点;T3=T3RNA 聚合酶的识别序列;T7=T7 RNA聚合酶的识别序列。还标记了限制性 酶位点。
图6表示用pCGP1805中包含的OGR-38cDNA克隆的32P标记 的片段探测的RNA印迹的放射自显影照片(见实施例6)。各泳道含有 20μg从V23(ht1/ht1)×VR(Ht1/ht1)回交群体植物的花或叶分 离的总RNA样品。在含高水平栎皮黄酮(Q+)的VR类(Ht1/ht1)花 中检测到1.8kb的转录物(泳道9-14)。在含少量或不含栎皮黄酮(Q -)的V23类(ht1/ht1)花中检测到水平低得多的相同大小的转录物(泳 道3-8)。在VR叶(泳道1)和V23花瓣(泳道2)中也检测到了 减少的转录物水平。这在实施例5中描述。
图7是酵母表达质粒pCGP1646的示意图(见实施例7)。来自 pCGP1805的OGR-38cDNA***片段以“有义”的方向克隆到表达 载体pYE22m中的酵母甘油醛-3-磷酸脱氯酶启动子(PGAP)后。 TRP1=Trp1基因,IR1=2μm质粒的反应重复,TGAP=来自酵母 甘油醛-3-磷酸脱氢的基因的终止子序列。还标记了限制性酶位点。
图8是双元质粒pCGP1867的示意图(实施例8中所述)。 pCGP1805的Ht1 cDNA***片段(OGR-38)以“有义”的方向克 隆到表达载体pCGP293的Mac启动子后。缩写如下:LB=左侧边界; RB=右侧边界;Gm=庆大霉素抗性基因;35S=来自花椰菜花叶病毒 35S基因的启动子区;npt II=新霉素磷酸转移酶II基因;tml 3’=来 自土壤杆菌属tml基因的终止子区;mas 3’=来自土壤杆菌属的甘露碱 合成酶基因的终止子区域。ori pRi=来自毛根土壤杆菌质粒的广谱宿主 范围的复制起点;ori Col E1=来自Colcinin E1质粒的高拷贝复制起 点。还标记了限制性酶位点。
图9是双元质粒pCGP1810的示意图,它的构建在实施例13中描 述。来自pCGP1807的KC-1cDNA***片段(见实施例12)以“有 义”的取向克隆到表达载体p CGP293的Mac启动子后。缩写如下:LB =左侧边界;RB=右侧边界;Gm=庆大霉素抗性基因;35S=来自 花椰菜花叶病毒35S基因的启动子区;nptII=新霉素磷酸转移酶II基 因;tml 3’=来自土壤杆菌属tml基因的终止子区域;mas 3’=来自土 壤杆菌属甘露碱合成酶基因的终止子区域;ori pRi=来自毛根土壤杆菌 质粒的广谱宿主范围的复制起点;ori Col E1=来自Colcinin E1质粒的 高拷贝复制起点。还标记了限制性酶位点。
图10是双元质粒pCGP1813的示意图,其构建在实施例14中描 述。来自pCGP1807的KC-1cDNA***片段(见实施例12)以“有 义”方向克隆到mac启动子和mas终止子之间。Mac:KC-1:mas表达 元件随后克隆到双元载体pWTT2132中。缩写如下:Tet=四环素抗性基 因;LB=左侧边界;RB=右侧边界,sur B=来自乙酰乳酸合成酶基 因的编码区和终止子序列;35S=来自花椰菜花叶病毒35S基因的启动 子区,mas 3’=来自土壤杆菌属甘露碱合成酶基因的终止子区;PVS1 =来自绿脓假单胞菌质粒的广谱宿主范围的复制起点,pACYCori=来 自大肠杆菌pACYC184的修饰的复制子。还标记了限制性酶位点。
图11表示用Am 3Ga差异显示PCR片段的32P标记的片段探测的 Southern印迹的放射自显影照片(如实施例16所述)。各泳道含10μg 从N8(Eos +),K16(eos -)或K16×N8F2群体的植物中分离的EcoRV消化的基因组DNA样品。在来自产花青素的植物(表示为“+”)的基 因组DNA中检测到杂交带(泳道1,3,4,5,6,7,9,10, 12和15)。在来自不生产花青素的植物(用“-”表示)的基因组DNA 样品中没有观察到特异性杂交(泳道2,8,11,13和14)。
图12表示用Am3Ga差异显示PCR片段的32P标记的片段探测的 RNA印迹的放射自显影照片。各泳道含10μg从N8(Eos +)×K16 (eos -)F2群体植物的花或叶分离的总RNA样品。在产生化青素的K16 ×N8F2花(花青素+)(植物#1,#3,#4,#5和#8)中检测到1.8Kb的转 录物。在不产生花青素的K16×N8F2花(花青素-)(植物#6,#11,#12) 中或在花中产生花青素的K16×N8F2植物的叶样品(#13L)中没有检 测到转录物。详情在实施例17中提供。
图13是双元质粒pCGP250的示意图,其构建在实施例20中描述。 含来自pCGP246的1至1711位核苷酸(SEQ ID NO:5)的sd F3’H cDNA***片段(见实施例18)以“有义”方向克隆到表达载体pCGP293 的Mac启动子后。缩写如下:LB=左侧边界;RB=右侧边界;Gm =庆大霉素抗性基因;35S=来自花椰菜花叶病毒35S基因的启动子 区;npt II=新霉素磷酸转移酶II基因;tml 3’=来自土壤杆菌属tml基因的终止子区;mas 3’=来自土壤杆菌属甘露碱合成酶基因的终止子 区;ori pRi=来自毛根土壤杆菌质粒的广谱宿主范围的复制起点;ori Col E1=来自Colcinin E1质粒的高拷贝的复制起。还标记了限制性酶位 点。
图14是双元质粒pCGP231的示意图,其构建在实施例20中描述。 含来自pCGP246的104至1711位核苷酸(SEQ ID NO:5)的sd F3’H cDNA***片段以“有义”方向克隆到表达载体pCGP293的Mac启动 子后。缩写如下:LB=左侧边界;RB=右侧边界;Gm=庆大霉素抗 性基因;35S=来自花椰菜叶病毒35S基因的启动子区;nptII=新霉素 磷酸转移酶II基因;tml 3’=来自土壤杆菌属tml基因的终止子区; mas 3’=来自土壤杆菌属甘露碱合成酶基因的终止子区域;ori pRi=来 自毛根土壤杆菌质粒的广谱宿主范围的复制起点;ori Col E1=来自 colcinin E1质粒的高拷贝复制起点。还标记了限制性酶位点。
图15是双元质粒pBI-Tt 7-2的示意图。将来自E-5的6.5kb EcoRI/Sal I Tt7基因组片段克隆到EcoRI/Sal I切割的pBI101中,代替原有 的GUS基因。所示的Tt7(F3’H)基因的方向(5’至3’)通过DNA 测序确定。缩写如下:LB=左侧边界;RB=右侧边界;nos 5’=来自 土壤杆菌属胭脂碱合成酶基因的启动子区;npt II=新霉素磷酸转移酶 II基因的编码区;nos 3’=来自土壤杆菌属胭脂碱合成酶基因的终止子 区域;npt I=新霉素磷酸转移酶I基因的编码区。还标记了限制性酶位 点。
图16是双元质粒pCGP2166的示意图,其构建在实施例26中描 述。来自pCGP2158的玫瑰#34cDNA***片段(见实施例25)以“有 义”方向克隆到pCGP293表达载体的Mac启动子后。缩写如下:LB =左侧边界;RB=右侧边界;Gm=庆大霉素抗性基因;35S=来自 花椰菜花叶病毒35S基因的启动子区;npt II=新霉素磷酸转移酶II基 因;tml 3’=来自土壤杆菌属tml基因的终止子区域;mas 3’=来自土 壤杆菌属甘露碱合成酶基因的终止子区;ori pBi=来自毛根土壤杆菌质 粒的广谱宿主范围的复制起点;ori Col E1=来自Colcinin E1质粒的高 拷贝复制起点。还标记了限制性酶位点。
图17是双元质粒pCGP2169的示意图,其构建在实施例27中描 述。来自pCGP2158的玫瑰#34cDNA***片段以“有义”方向克隆到 CaMV35S启动子和ocs终止子之间。随后将35S:玫瑰#34:ocs表 达元件克隆到双元载体pWTT2132中。缩写如下:Tet=四环素抗性基 因;LB=左侧边界;RB=右侧边界;sur B=来自乙酰乳酸合成酶基 因的主体区域和终止子区域;35S=来自花椰菜花叶病毒35S基因的启 动子区域,OSS=来自土壤杆菌属章鱼碱合成酶基因的终止子区域; pVS1=来自绿脓假单胞菌质粒的广谱宿主范围的复制起点,pACY Cori =来自大肠杆菌的pACYC184的修饰的复制子。还标记了限制性酶位 点。
图18是双元质粒pLN85的示意图,其构建在实施例28中描述。来 自pCHRM1的菊RM6i cDNA***片段以“反义”方向克隆到花椰菜花 叶病毒35S基因启动子(35S)之后。其它缩写如下:LB=左侧边界; RB=右侧边界;ocs3’=来自土壤杆菌属章鱼碱合成酶基因的终止子区 域;pnos:nptII:nos 3’=含来自土壤杆菌属胭脂碱合成酶基因的启动子 区表达元件;新霉素磷酸转移酶II基因的编码区和来自土壤杆菌属胭脂 碱合成酶基因的终止子区;ori T=复制转移起点;trf A*=顺式作用复 制功能;ori Col E1=来自Colcinin E1质粒的高拷贝复制起点;Tn 7 SpR/StR=来自转座子Tn7的壮观霉素和链霉素抗性基因;ori VRK2 =质粒RK2的广谱宿主范围的复制起点。还标记了限制性酶位点。
图19是酵母表达质粒pYTHT6的示意图,其构建在实施例30中描 述。来自pTHT6的THT6cDNA***片段以“有义”方向克隆到表达载 体pYE22m的酵母甘油醛-3-磷酸脱氢酶启动子(PGAP)后。缩写 如下:TRP1=Trp1基因;IR1=2μm质粒的反向重复;TGAP=来 自酵母甘油醛-3-磷酸脱氢酶基因的终止子序列。还标记了限制性酶 位点。
本说明书中使用的氨基酸缩写在下面表2中显示。
表2
氨基酸缩写符号
氨基酸            3字母符号            单字母符号
L-丙氨酸            Ala                    A
L-精氨酸            Arg                    R
L-天冬酰胺          Asn                    N
L-天冬氨酸          Asp                    D
L-半胱氨酸          Cys                    C
L-谷氨酰胺          Gln                    Q
L-谷氨酸            Glu                    E
L-甘氨酸            Gly                    G
L-组氨酸            His                    H
L-异亮氨酸          Ile                    I
L-亮氨酸            Leu                    L
L-赖氨酸            Lys                    K
L-甲硫氨酸          Met                    M
L-苯丙氨酸          Phe                    F
L-脯氨酸            Pro                    P
L-丝氨酸            Ser                    S
L-苏氨酸            Thr                    T
L-色氨酸            Trp                    W
L-酪氨酸            Tyr                    Y
L-缬氨酸            Val                    V
表3提供了本文提及的序列指定的SEQ ID NO的总结:
表3
序列                       物种            SEQ ID NO
pCGP 1805的cDNA***片段    矮牵牛属        SEQ ID NO:1
相应的氨基酸序列           矮牵牛属        SEQ ID NO:2
pCGP246的cDNA***片段      石竹            SEQ ID NO:3
相应的氨基酸序列             石竹            SEQ ID NO:4
pCGP246的cDNA***片段        金鱼草属        SEQ ID NO:5
相应的氨基酸序列             金鱼草属        SEQ ID NO:6
cDNA部分序列                 拟南芥属        SEQ ID NO:7
相应的氨基酸序列             拟南芥属        SEQ ID NO:8
基因组序列                   拟南芥属        SEQ ID NO:9
外显子I的相应的氨基酸序列    拟南芥属        SEQ ID NO:10
外显子II的相应氨基酸序列     拟南芥属        SEQ ID NO:11
外显子III的相应氨基酸序列    拟南芥属        SEQ ID NO:12
外显子IV的相应氨基酸序列     拟南芥属        SEQ ID NO:13
pCGP2158的cDNA***片段       玫瑰            SEQ ID NO:14
相应的氨基酸序列             玫瑰            SEQ ID NO:15
pCHRM1的cDNA***片段         菊              SEQ ID NO:16
相应的氨基酸序列             菊              SEQ ID NO:17
THT cDNA序列                 蝴蝶草属        SEQ ID NO:18
相应的氨基酸序列             蝴蝶草属        SEQ ID NO:19
MHT 85cDNA序列               日本牵牛花      SEQ ID NO:20
相应的氨基酸序列             日本牵牛花      SEQ ID NO:21
GHT13cDNA序列                龙胆            SEQ ID NO:22
相应的氨基酸序列             龙胆            SEQ ID NO:23
pL3-6的cDNA***片段          Lisianthus      SEQ ID NO:24
相应的氨基酸序列             Lisianthus      SEQ ID NO:25
出自WO 93/20206的cDNA序列    矮牵牛属        SEQ ID NO:26
寡核苷酸poly T-anch A                        SEQ IDNO:27
寡核苷酸poly T-anch C                        SEQ ID NO:28
寡核苷酸ploy T-anch G                        SEQ ID NO:29
保守的氨基酸引物区                           SEQ ID NO:30
相应的寡核苷酸序列                           SEQ ID NO:31
保守的氨基酸引物区                           SEQ ID NO:32
相应的寡核苷酸序列                           SEQ ID NO:33
寡核苷酸引物Pet Haem-New       SEQ ID NO:34
保守的氨基酸引物区             SEQ ID NO:35
相应的寡核苷酸序列             SEQ ID NO:36
寡核苷酸Snapred Race A         SEQ ID NO:37
寡核苷酸Snapred Race C         SEQ ID NO:38
寡核苷酸poly-C Race            SEQ ID NO:39
寡核苷酸引物Pet Haem           SEQ ID NO:40
分别含质粒pCGP 1867,pCGP1810和pCGP231的无毒的微生物 根癌土壤杆菌菌株AGL0(Agrobacterium tumefaciens AGL0)于1996 年2月23日保存于澳大利亚政府分析实验室,1 suakin Street,Pymble, New South Wales,2037,澳大利亚,且指定的保藏号分别为96/10967, 96/10968和96/10969。
分离类黄酮3’-羟化酶和相关的核酸序列
实施例1植物材料
矮牵牛属:
所用的Petunia hybrida品种在表4中提供。
表4
  植物品种   特性   来源/参考文献
  国旗兰(OGB)   杂种   Ball,Seed,USA
  国旗红(OGR)   杂种   Ball Seed,USA
  V23   An1,An2,An3,An4,An6,An8,An9,An10,ph1,Hf1,Hf2,ht1,Rt,po,Bl,Fl   Wallroth等(1986)Doodeman等(1984)
  R51   An1,An2,An3,an4,An6,An8,An9,An10,An11,Ph1,hf1,hf2,Ht1,rt,Po,bl,fl   Wallroth等(1986)Doodeman等(1984)
  VR   V23×R51F1杂种
  SW63   An1,An2,An3,an4,An6,An8,An9,An10,An11,Ph1,Ph2,Ph5,hf1,hf2,ht1,ht2,po,mf1,fl   I.N.R.A.,Dijon,CedexFrance
  植物品种   特性   来源/参考文献
  Skr4   An1,An2,An3,An4,An6,An11,hf1,hf2,ht1,Ph1,Ph2,Ph5,rt,Po,Mf1,Mf2,fl   I.N.R.A.,Dijon,CedexFrance
Skr4×SW63 F1杂种
植物在光强度10,000lux,白昼长度14小时,温度22℃至26℃的 特定生长室中生长。
石竹属:
麝香石竹变种Kortina Chanel的花从Van Wyk和Son Flower Supply,Victoria获得。
麝香石竹花在如下限定的发育阶段收获:
阶段1:封闭的花蕾,花瓣不可见。
阶段2:花蕾张开:花瓣尖端可见。
阶段3:几乎全部花瓣尖端暴露。“画笔阶段”。
阶段4:外侧花瓣与茎成45角。
阶段5:花完全张开。
金鱼草属
使用的金鱼草株系来自亲本株系K16(eos -)和N8(Eos +)。F3’H 活性与Eos基因之间有严格相关性,已知Eos基因控制黄烷酮,黄烷醇 和花青苷的3’羟基化(Forkmann和Stotz,1981)。K16是缺乏F3’H 活性的纯合隐性突变体,而N8是F3’H活性的野生型。这些品系相似, 但不同源。亲本株系和来自自交(K16×N8)F1植物的种子从Dr.C. Martin(John Innes Centre,Norwich,UK)处获得。
拟南芥属
拟南芥株系Columbia(Tt7),Landsberg eracta(Tt7)和 NW88(tt7)从诺丁汉拟南芥贮存中心(Nottingham Arabidopsis Stock Centre)获得。野生型拟南芥(Tt7)种子具有特征性的棕色。tt7突变体的种子具有淡棕色的种子,其植株的特征在于叶中花青苷含量减 小(Koornneef等,1982)。Tt7植物合成花青素,而tt7突变体中积 累花葵素,表明Tt7基因控制类黄酮3’-羟基化。
玫瑰:
Rosa hybrida变种Kardinal的花从Van Wyk和Son Flower Supply, Victoria获得。
Rosa hybrida花发育阶段限定如下:
阶段1:未沉积色素,紧密关闭的花蕾(10-12mm高;5mm宽)。
阶段2:沉积有色素,紧密关闭的花蕾(15mm高;9mm宽)。
阶段3:沉积有色素,关闭的花蕾;萼片刚开始打开(20-25mm 高;13-15mm宽)
阶段4:花蕾开始张开;花瓣着色较重;萼片分离(花蕾25-30mm 高且18mm宽)。
阶段5:萼片完全展开;其中一些卷曲。花瓣着色较重且展开(花 蕾30-33mm高且20mm宽)。
菊花发育阶段限定如下:
阶段0:未见花蕾。
阶段1:花蕾可见:小花完全被苞片覆盖。
阶段2:花蕾张开:小花顶端可见。
阶段3:小花紧紧地重叠。
阶段4:几乎所有小花顶端暴露;外侧小花开放但不水平。
阶段5:外侧小花水平。
阶段6:花达到成熟。
实施例2细菌菌株
使用的大肠杆菌菌株是: 
DH5α  supE44,Δ(lacZYA-ArgF)U169,
Figure G2009100097468D0000251
80lacZΔM15,hsdR17(rk-,mk+),recA1, endA1,gyrA96,thi-1,relA1,deoR(Hanahan,1983和BRL,1986).
XL1-Blue  MRF′Δ(mcr A)183,Δ(mcrCB-hsdSMR-mrr)173,endA1,supE44,thi-1, recA1,gyrA96,relA1,lac[F′proAB,lacIqZΔM15,Tn10(Tet r]c(Stratagene)
XL1-Blue  supE44,hsdR17(rk-,mk+),recA1,endA1,gyrA96,thi-1,relA1, lac[F′proAB,lacIq,lacZΔM15,Tn10(tet r)]
SOLR  e14-(mcrA),Δ(mcrCB-hsdSMR-mrr)171,sbcC,recB,recJ, umuC::Tn5(kan r),uvrC,lac,gyrA96,thi-1,relA1,[F′proAB, lacIqZΔM15],Su-非抑制性的(Stratagene)
DH10B(Zip)F-mcrA,Δ(mrr-hsdRMS-mcrBC),80d lacZΔM15,ΔlacX74, deoR,recA1,araD139,Δ(ara,leu)7697,galU,galK1λ,rspL, nupG
Y1090r- ΔlacU169,(Δlon)?,araD139,strA,supF,mcrA, trpC22::Tn10(Tetr)[pMC9 Ampr,Tetr],mcrB,hsdR
丧失毒性的根癌土壤杆菌菌株AGL0(Lazo等,1991)从 R.Ludwig处(加利福利亚大学,生物学系,Santa Cruz,USA)获得。
克隆载体pBluescript从Stratagene公司获得。
根据Inoue等(1990)所述的方法进行大肠杆菌菌株DH5α细胞 的转化。
实施例3一般方法
DNA探针的32P标记
使用寡聚核苷酸标记试剂盒(Bresatec)用50μci[α-32P]-dCTP 放射性标记DNA片段(50-100ng)。未掺入的[α-32P]-dCTP通过用 Sephadex G-50(Fine)柱层析去除。
DNA序列分析
使用来自应用生物***的PRISMTM Ready反应染色引物循环测序 试剂盒进行DNA测序。按照厂商提供的方法进行。使用Perkin Elmer PCR仪(GeneAmp PCR System 9600)进行循环测序反应并在自动 373A DNA测序仪(应用生物***)上走胶。
使用FASTA和TFASTA程序(Pearson和Lipman,1988)或 BLAST程序(Altschul等,1990)进行与Genbank,SWISS-PROT和 EMBL数据库的同源性研究。使用LFASTA程序(Pearson和Lipman, 1988)获得序列的相似百分数。除非另有说明,在所有情况下核苷酸序 列比较使用的缺口值(ktup)为6,氨基酸序列比较使用的缺口值(ktup) 为2。
使用在MacVectorTM 6.0(Oxford Molecular Ltd.)中应用的 Clustal W程序进行多个序列排列(缺口值为2)。
实施例4从P.hybrida变种国旗红中分离对应于Ht1基因座的类黄酮3’ -羟化酶(F3’H)的cDNA克隆
为了分离连锁到Ht1基因座且编码矮牵牛属类黄酮途径中的类黄酮 3’-羟化酶(F3’H)的cDNA克隆,从阶段1至3的矮牵牛属国旗红 (OGR)花中分离RNA并制备花瓣的cDNA文库。OGR花含以花青 素为基础的色素且有高水平的类黄酮3’-羟化酶活性。用从已知在类黄 酮途径中包含的3种细胞色素P450cDNA克隆和在酵母中具有类黄酮3’ -羟化酶活性的一种细胞色素P450cDNA克隆(651)分离的32P标记 片段的混合物筛选OGR cDNA文库。这些包括一个编码肉桂酸-4-羟 化酶(C4H)的矮牵牛属cDNA克隆和2个编码类黄酮3’,5’-羟化酶 (F3’5’H)(Holton等,1993)的矮牵牛属cDNA克隆(由Hf1Hf2基因座编码)。
矮牵牛属变种OGR cDNA文库的构建
使用Turpen和Griffith(1986)的方法从P.hybrida变种OGR 阶段1至3的花的花瓣组织分离总RNA。使用oligotex-dTTM(Qiagen) 从总RNA筛选Poly(A)+RNA。
用5μg从OGR的1至3阶段分离的poly(A)+RNA作模板, 使用ZAP-cDNA Gigapack III Gold克隆试剂盒(stratagene)在λZAP 中构建定向花瓣cDNA文库。获得的重组子总数为2.46×106
转染XL1-Blue MRF’细胞后,包装的cDNA混合物以每15cm直 径平板50,000pfu涂板。平板在37℃培养8小时,噬菌体在100mM NaCl, 8mM MgSO4,50mM Tris-HCl pH8.0,0.01%(W/V)明胶[噬菌体贮存缓 冲液(PSB)]中洗脱(Sambrook等,1989)。加入氯仿,并在4℃ 贮存作为扩增文库的噬菌体。
转染XL1-Blue MRF’细胞后,100,000pfu的扩增文库以每15cm 平板10,000pfu的密度在NZY平板上铺板(Sambrook等,1989),并 在37℃培养8小时。在4℃放置过夜后,取一式二份转移到Colony/Plaque ScreenTM滤膜(DuPont)上并按厂商建议进行处理。
探针的分离:
F3’5’H探针
按Holton等(1993)和美国专利号5,349,125所述分离的对应于 Hf1Hf2基因座的2个类黄酮3’,5’羟化酶在筛选方法中应用。 来自矮牵牛属的C4H cDNA克隆
在用于分离对应于Hf1Hf2基因座的2个类黄酮3’,5’-羟化酶 cDNA克隆的筛选方法中(Holton等,1993;美国专利号5,349,125) 分离了许多细胞色素P450cDNA克隆。这些cDNA克隆中一个(F1) (包含于pCGP 161中)(图2)根据与以前鉴定的来自绿豆的C4H克 隆的序列相同性鉴定为编码肉桂酸4-羟化酶(C4H)(Mizutani等, 1993)。序列数据从矮牵牛属F1cDNA克隆5’端的295个核苷酸产生。 在测序的295个核苷酸中与绿豆C4H克隆有83.1%的相似性且在推测的 氢基酸序列中有93.9%的相似性。
651cDNA克隆
包含于pCGP619(图5)中的651cDNA克隆的分离与鉴定在公 开号为WO93/20206的国际专利申请中描述。在pYE22m(Tanaka等, 1988)的酵母甘油醛-3-磷酸脱氢酶启动子控制下的含651cDNA克 隆的酵母蛋白质提取物表现出F3’H活性。
OGR文库的筛选
杂交前,一式两份的噬菌斑转移膜于65℃在预洗溶液(50mM Tirs-HCl pH7.5,1M NaCl,1mM EDTA,0.1%(W/N)肌氨酸)中洗涤30 分钟;于65℃在0.4M氢氧化钠中变性30分钟;然后于65℃在0.2M Tris-HCl pH8.0,0.1×ssc,0.1%(W/V)SDS溶液中洗30分钟并最后在2 ×SSC,1.0%(W/V)SDS中漂洗。
用(1)来自含C4H cDNA克隆的pCGP161(图2)的0.7kb EcoRI/Xho I片段,(2)来自含Hf1cDNA克隆的pCGP602(图3)的 1.6kb Bsp HI/Fsp I片段,(3)来自含Hf2 cDNA克隆编码区的pCGP 175(图4)的1.3kb Eco RI/Xho I片段和0.5kb Xho I片段和(4)来 自含651cDNA克隆的pCGP619(图5)的1.8kb Eco RI/Xho I片段的 32P标记片段筛选OGRcDNA文库的转移膜。
杂交条件包括在10%(V/V)甲酰胺,1M NaCl,10%(W/V) 硫酸葡聚糖,1%(W/V)SDS中42℃至少1小时的预杂交步骤。然 后将32P标记的片段(各以1×106cpm/ml)加入杂交溶液中,接着在 42℃下再杂交16小时。然后在2×SSC,1%(W/V)SDS中于42 ℃洗膜2×1小时并用具有增感屏的柯达XAR胶片在-70℃下曝光16 小时。
将230个强杂交噬菌斑挑入PSB中。使用所述的对cDNA文库起始 筛选的杂交条件再次筛选得到其中39个噬菌斑为分离纯化的噬菌斑。找 出包含于λZAP噬菌体载体中的质粒,序列数据从cDNA***片段3’和 5’端产生。根据序列同源性,39个中的27个与矮牵牛属肉桂酸4-羟化 酶cDNA克隆相同,39个中的2个与Hf1 cDNA克隆相同,39个中的7 个不代表细胞色素P450。与筛选方法中所用的细胞色素P450克隆相比, 剩下的3个cDNA克隆(命名为OGR-27,OGR-38,OGR-39) 代表“新”细胞色素P450并将进一步得到鉴定。
实施例5限制性片段长度多态性(RFLP)分析
在P.hybrida中有2个控制类黄酮3’-羟化酶活性的遗传基因座, Ht1Ht2(Tabak等,1978;Wiering和de Vlaming,1984)。Ht1在P.hybrida花的花瓣和花粉管中均有表达且比仅在花粉管中表达的 Ht2产生更高的F3’H活性水平。F3’H能将二氢四羟基黄酮和4’,5, 7-三羟黄烷酮分别转变成二氢栎皮黄酮和圣草酚。在产生以花翠素为基 础的色素的花中,F3’H活性被F3’5’H活性掩盖。因此,F3’H/F3’5’H 测定(Stotz和Forkmann,1982)在测定是否存在F3’H活性中无用。 类黄醇合成酶能将二氢四羟基黄酮转变成四羟基黄酮并将二氢栎皮黄酮 转变成栎皮黄酮(图1a)。在矮牵牛属花中以较低水平合成杨酶黄酮, 3’,5’-羟基化类黄醇。因此,分析花中的3’羟基化类黄醇,栎皮黄酮可 指示F3’H活性的存在。
对从在VR(Ht1/ht1)×V23(ht1/ht1)回交中的植物个体分 离的DNA进行的限制性片段长度多态性(RFLP)分析用于确定哪一种 (如果有的话)代表P450的cDNA克隆与Ht1基因座连锁。对从这些植 物分离的RNA进行的Northern分析用于检测在这些株系中是否存在转 录物。
分析VR(Ht1/ht1)×V23(ht1/ht1)回交群体花中类黄醇, 四羟基黄酮和栎皮黄酮的存在。VR(Ht1/ht1)花积累栎皮黄酮和低水 平的四羟基黄酮,而V23(ht1/ht1)花积累四羟基黄酮但极少或没有栎 皮黄酮。来自VR(Ht1/ht1)×V23(ht1/ht1)回交的植物个体,如 果在花提取物中检测到高水平的栎皮黄酮,则命名为VR类(Ht1/ht1), 如果在花提取物中检测到极少或没有栎皮黄酮但有高水平的四羟基黄 酮,则命名为V23类(ht1/ht1)(见图6)。
基因组DNA的分离
基本上按Dellaporta等(1983)所述从叶组织分离DNA。以CsCl 浮力密度离心进一步纯化该DNA制品(Sambrook等,1989)。
Southern印迹
用60单位的EcoRI消化基因组DNA(10μg)16小时并通过在 TAE电泳缓冲液(40mM Tris-乙酸盐,50mM EDTA)中的0.7% (W/V)琼脂糖凝胶走电泳。然后在变性溶液(1.5M NaCl/0.5M NaOH)中变性DNA1至1.5小时,在0.5M Tris-HCl(pH7.5)/1.5M NaCl 中和2至3小时,然后转移到在20×SSC中的Hybond N(Amersham) 滤膜上。
RNA印迹
使用Turpen和Griffith的方法(1986)从P.hybrida变种OGR 阶段1至3的花的花瓣组织中分离总RNA。
RNA样品使用含40mM吗啉代丙磺酸(pH7.0),5mM乙酸钠, 0.1mM EDTA(pH8.0)的电泳缓冲液通过2.2M甲醛/1.2%(W/V) 琼脂糖凝胶走电泳。按厂商所述将RNA转移到Hybond-N滤膜 (Amersham)上。
杂交和洗涤条件
Southern和RNA印迹用32P标记的cDNA片段(108cpm/μg,2 ×106cpm/mL)探测。预杂交(42℃1小时)和杂交(42℃16小时) 在50%(V/V)甲酰胺,1M NaCl,1%(W/V)SDS,10%(W/V) 硫酸葡聚糖中进行。滤膜在2×SSC,1%(W/V)SDS中于65℃洗 涤1至2小时,然后在0.2×SSC,1%(W/V)SDS中于65℃洗涤 0.5至1小时。滤膜用具有增感屏的柯达XAR胶片在-70℃曝光16小 时。
细胞色素P450片段的RFLP和Northern分析:
使用RFLP分析研究对应于OGR-27,OGR-38和OGR-39 cDNA克隆的基因与Ht1基因座的连锁关系。
OGR-27,OGR-38和OGR-39cDNA克隆的32P标记片段 用于探测从VR×V23回交群体的植物个体中分离的基因组DNA的RNA 印迹和Southern印迹。从VR×V23回交群体分离的EcoRI消化的基因 组DNA的分析揭示了与Ht1连锁的OGR-38探针的RFLP。而且与 在VR类株系中检测到的高水平的转录物相比,在V23类株系中检测到 的转录物水平要低得多(图6)。
这些数据提供了强有力的证据,证明包含于质粒pCGP1805中的 OGR-38cDNA克隆对应于Ht1基因座且代表F3’H。
V23×R51F2回交的RFLP分析
RFLP分析用于研究对应于OGR-38cDNA的基因与已知遗传基 因座的连锁关系。
使用MapMaker图谱程序的Macintosh 2.0版本(Du Pont) (Lander等,1987)进行RFLP连锁分析。LOD分数3.0用来作为连 锁阈值。
从V23×R51 F2群体分离的Eco RI或xba I消化的基因组DNA 的分析揭示了与PAc4连锁的OGR-38探针的RFLP。PAc4,矮牵 牛属肌动蛋白cDNA克隆(Baird和Meagher,1987),是染色体III 的分子标记且与Ht I基因座(Mcbean等,1990)连锁。在44株V23 ×R51F2植株中有36株存在OGR-38与PAc4RFLP的共分离。这 代表8%的重组频率,相似于所报道的Ht1基因座与PAc4之间16%的 重组频率(Cornu等,1990)。
OGR-38的进一步鉴定
通过用OGR-38cDNA***片段的32P标记的片段作为针对含 20μg从5个矮牵牛属OGR花瓣发育阶段的各阶段以及从叶,萼片,根, 茎,花梗,子房,花药和花柱分离的总RNA的RNA印迹的探针测定OGR 花瓣以及其它OGR组织中的发育表达情况。OGR-38探针能与在花 发育的更低的1至3阶段达到高峰的1.8kb转录物杂交。与OGR-38 杂交的转录物在花瓣和子房中最丰富且也在OGR植物的萼片,花梗和花 药中检测到。在茎中也检测到低水平的转录物。在所用的条件下,通过 对从叶,花柱或根分离的总RNA的Northern分析检测不到杂交的转录 物。
实施例6OGR-38的完整序列
通过编辑使用产生随机重叠克隆的标准方法(Sambrook等, 1989)获得的不同PUC18亚克隆的序列来测定OGTR-38cDNA克隆 的完整序列(SEQ ID NO:1)。该序列包含有1536个碱基的开放阅读 框架,该开放阅读框架编码含512个氨基酸的推断的多肽。
使用Ifasta排列(Pearson和Lipman,1988)将OGR-38的核 苷酸及推测的氨基酸序列(SEQ ID NO:1和SEQ ID NO:2)与在筛选 方法中使用的细胞色素P450探针和其它矮牵牛属细胞色素P450序列(美 国专利号5,349,125)比较。OGR-38的核苷酸序列与代表来自 P.hybrida的Hf1Hf2基因座的类黄酮3’,5’-羟化酶的核酸序列最相 近(Holton等,1993)。Hf1克隆在1471个核苷酸上显示出与OGR -38cDNA克隆59.6%的相似性,且在513个氨基酸上显示出49.9%的 相似性,而Hf2克隆在1481个核苷酸上显示出与OGR 38cDNA克隆 59.1%的相似性,在511个氨基酸上显示出49.0%的相似性。
实施例7在酵母中表达的Ht1 cDNA克隆(OGR-38)的F3’H测定。
pCGP1646的构建
通过将来自pCGP1805的OGR-38cDNA***片段以“有义”的 方向克隆到pYE22m的酵母甘油醛-3-磷酸脱氢酶启动子(Tanaka 等,1988)之后构建质粒pCGP1646(图7)。
通过用Asp718消化使质粒pCGP1805线型化。根据标准方法 (Sambrook等,1989)使用DNA聚合酶(Klenow片段)补平突出 的5’端。用smaI消化释放1.8kb的OGR-38cDNA片段。使用 Bresaclean试剂盒(Bresatec)分离和纯化cDNA片段并与补平的 pYE22m的Eco RI末端连接。用Eco RI消化质粒pY22m并根据标准方 法(Sambrook等,1989)使用DNA聚合酶(Klenow片段)除去伸 出的5’端。使用100ng 1.8kb的OGR-38片段和150ng制备的酵母载 体pYE22m用Amersham连接试剂盒进行连接。通过对从氨苄青霉素抗 性转化子分离的质粒DNA的Xho I/Sal I限制性酶分析确认***片段在 pYE22m中的正确***。
酵母转化
用根据Ito等(1983)所述的用pCGP1646转化酵母菌株G-1315 (Matα,trpl)(Ashikari等,1989)。转化子通过它们将G-1315 恢复到色氨酸原养型的能力选择。
制备酵母抽提物以测定F3’H活性
使用G-1315/p CGP1646的单个分离物接种于50ml改良的 Burkholder’s培养基(20.0g/L葡萄糖,2.0g/L L-天冬酰胺,1.5g/L kH2PO4,0.5g/L MgSO4·7H2O,0.33g/L CaCl2,2g/L(NH4)2SO4, 0.1mg/L KI,0.92g/L(NH4)6Mo7O24·4H2O,0.1g/L次氮基三乙酸, 0.99mg/L FeSO4·7H2O,1.25mg/L EDTA,5.47mg/L ZnSO4·7H2O,2.5mg/L FeSO4·7H2O,0.77mg/L MnSO4·7H2O,0.196mg/L CuSO4·5H2O,0.124mg/L Co(NH4)2(SO4)2·6H2O,0.088mg/L Na2B4O7·10H2O,0.2mg/L硫 胺素,0.2mg/L吡哆醇,0.2mg/L烟酸,0.2mg/L泛酸,0.002mg/L生 物素,10mg/L肌醇)中,随后在30℃下进行培养直到OD600值达到1.8。 离心收集细胞并重悬于缓冲液1[含2M山梨醇,0.1mM DTT,0.1mM EDTA,0.4mM苯甲基磺酰氟(PMSF)和酵母裂解酶5mg/mL的10mM Tris-HCl缓冲液(pH7.5)]中。30℃下轻微震荡培养细胞1小时后, 经离心沉淀细胞并在冰冷缓冲液2[含0.65M山梨醇,0.1mM DTT, 0.1mM EDTA,0.4mM PMSF的10mM Tris-HCl(pH7.5)]中洗涤。然后 将细胞重悬于缓冲液2中并使用功率循环(duty cycle)为30%,输出控制 为10%的Branson Sonifier 250 6次15秒释放进行超声波处理。将超声 破碎的悬浮液以10,000rpm离心30分钟且上清以13,000rpm离心90分 钟。将微粒体沉淀重悬于测定缓冲液〔100mM磷酸钾(pH87),1mM EDTA,20mM 2-巯基乙醇〕中并测定100μl中的活性。
F3’H测定
使用stotz和Forkmann(1982)所述方法的改良形式测定F3’H 酶活性。测定反应混合物一般含有100μl酵母提取物,在测定缓冲液 (100mM磷酸钾(pH8.0),1mM EDTA和20mM 2-巯基乙醇)中 的5μl 50mM NADPH和10μCi[3H]-4’,5,7-三羟黄烷酮并用测定缓 冲液调到终体积为210μl。23℃培养2-16小时后,用0.5ml乙基乙酸 抽提反应混合物。在真空条件下干燥乙基乙酸相,然后重悬于10μL乙基 乙酸中。使用氯仿∶乙酸∶水(10∶9∶1V/V)溶剂***在纤维素薄 层平板(Merck Art 5577,德国)上分离氚标记的类黄酮分子。以放射自 显影定位反应产物并与在反应产物旁迁移且在紫外灯下可见的非放射性 4’,5,7-三羟基黄烷酮和圣草酚比较来鉴定。
在G1315/p CGP1646抽提物中检测到F3′H活性,而在非转基因酵 母提取物中检测不到。由此可推断与Ht1基因座连锁的来自pCGP1805 的cDNA片段(OGR-38)编码F3’H。
实施例8Ht1cDNA克隆(OGR-38)在植物中的瞬时表达
pCGP1867的构建:
通过将来自pCGP1805的cDNA***片段以“有义”的方向克隆到 pCGP293(Brugliera等,1994)的Mac启动子(Comai等,1990) 之后来构建质粒pCGP1867(图8)。用Xba I和Kpn I消化质粒p CGP1805以释放cDNA***片段。使用Bresaclean试剂盒(Bresatec) 分离和纯化cDNA片段,并与pCGP293双元载体的Xba I/Kpn I末端连 接。使用Amersham连接试剂盒进行连接。经过对从庆大霉素抗性转化 子分离的DNA进行XbaI/KpnI限制性酶分析确定该片段在pCGP1867 中的正确***。
Ht1 cDNA克隆(OGR-38)在矮牵牛属花瓣中的瞬间表达:
为了迅速测定pCGP1867中的OGR-38cDNA片段是否编码植物 中的功能性F3’H,进行了瞬时表达研究。用以pCGP1867DNA包被的 金粒(1μm直径)轰击突变的P.hybrida株系Skr4×SW63的花瓣。
金微粒载体在100%乙醇中预洗3次并重悬于无菌水中。对于每次 轰击,将1μg pCGP1867DNA,0.5mg金微粒载体,10μl 2.5M CaCl2和2μl 100mM亚精胺(自由基)通过振荡混合2分钟。离心沉淀DNA 包被的金颗粒,用100%乙醇洗2次并最后重悬于10μl 100%乙醇中。 将悬浮液直接滴在大载体的中央并使其干燥。
将阶段1和2的Skr4×SW63花垂直切成两半并部分包埋于MS 固体培养基〔3%(W/V))蔗糖,100mg/L肌醇,1×MS盐, 0.5mg/L吡哆醇-HCl,0.1mg/L硫胺素-HCl,0.5mg/L烟酸和 2mg/L甘氨酸〕中。放置花瓣使花蕾内侧向上。用900psi氦气压和28 英寸汞真空室的Biolistic PDS-1000/He***(Bio-Rad)用于将金微粒 载体轰击进花瓣组织。在22℃的控制植物生长室中光照6-12小时后, 在用pCGP1867包被的颗粒轰击的花瓣组织上表皮层观察到红色花青苷 斑点。在仅用金颗粒轰击的对照花瓣中观察不到有色斑点。这些结果表 明在Mac启动子控制下的OGR-38cDNA克隆在花瓣组织中,至少瞬 间地,是有功能的。
实施例9 Ht1 cDNA克隆(OGR-38)在矮牵牛属花瓣中的稳定表达 -ht1/ht1矮牵牛属栽培品种的补充
根癌土壤杆菌转化
通过加入5μg质粒DNA到100μl感受态AGL0细胞中,将质粒 pCGP1867(图8)导入根癌土壤杆菌菌株AGL0,其中感受态细胞通 过接种50ml MG/L(Garfinkel和Nester,1980)培养物并在28℃振荡 生长16小时来制备。然后沉淀细胞并重悬于0.5ml 85%(V/V)100mM CaCl2/15%(V/V)甘油中。DNA-土壤杆菌混合物通过在液态N2中放置 2分钟冷冻,然后在37℃保温5分钟使其解冻。然后将DNA/细菌混合 物再在冰上放置10分钟。接着将细胞与1mL LB(Sambrook等, 1989)培养基混合并在28℃振荡培养16小时。在含10μg/ml庆大霉素 的LB琼脂平板上选择携带pCGP1867的根癌土壤杆菌细胞。通过对从 庆大霉素抗性转化子分离的DNA进行southern分析证实pCGP1867的 存在。
矮牵牛属转化
(a)植物材料
来自P.hybrida变种Sk4×SW63的成熟植物的叶组织在1.25% (W/V)次氯酸钠中处理2分钟,然后在无菌水中漂洗3次。然后将叶 组织切成25mm2的方块并在补充有0.05mg/L激动素和1.0mg/L 2,4 -二氯苯氧乙酸(2,4-D)的MS培养基(Murashige和Skoog,1962) 中预培养24小时。
(b)土壤杆菌和矮牵牛属组织的共培养
含双元载体pCGP1867(图11)的根癌土壤杆菌菌株AGL0在含 100mg/L庆大霉素的MG/L琼脂平板上于4℃保存。将单个菌落在含1 %(W/V)Bacto-蛋白胨,0.5%(W/V)Bacto-酵母抽提物和1% (W/V)NaCl-的液体培养基中生长过夜。第二天通过在含维生素B5 (Gamborg等,1968)和3%(W/V)蔗糖的液体MS培养基(BPM) 中稀释准备5×108个细胞/ml的终浓度。将叶片浸入含AGL0/pCGP1867 的BPM上2分钟。然后将叶片吸干并放在共同培养基上4天。共同培养 基由补充了0.05mg/L激动素和1.0mg/L 2,4-D的SH培养基(Schenk和 Hildebrandt,1972)组成且包括涂布在共同培养基上的烟草细胞悬液饲 养层,其中在烟草细胞悬液上放置滤纸。
(c)转基因矮牵牛属植物的再生
共同培养后,将叶片转移到选择培养基〔补充了3%(W/V)蔗糖, 2mg/Lα-苄氨基嘌呤(BAP),0.5mg/Lα-萘乙酸(NAA), 300mg/L卡那霉素,350mg/L cefotaxime和0.3%(W/V)Gelrite Gellan Gum(Schweizerhall)的MS培养基〕中。4周后将再生的外 植体转移到新鲜的选择培养基中。分出在卡那霉素选择中存活的不定芽 并转移到含100mg/L卡那霉素和200mg/L cefotaxime的BPM中进行根 诱导。所有的培养物于23±2℃在16小时光周期(60μmol,m-2,s-l白 色冷荧光灯)下保存。当根长度达2-3cm时,将转基因矮牵牛属小植 株转移到8cm试管中的高压灭菌的Debco 51410/2盆栽混合物中。4周 后,将植物再植入使用相同盆栽混合物的15cm小盆中并在23℃14小时 光周期(300μmol,m-2,s-1卤化汞灯)下保存。
实施例10转基因植物表型分析
Skr4×SW63中的pCGP1867
表5显示了用pCGP1867质粒转化Skr4×SW63植物获得的各种 花瓣和花粉颜色表型。转基因植物#593A,590A,571A,589A,592A 和591A产生花瓣颜色改变的花。而且,植物#593A,590A,589A, 与对照Skr4×SW63植物的白色相比,592A和591A的花的花药和花 粉为粉红色。在质粒pCGP1867导入的Skr4×SW63矮牵牛属植物观察 到花药和花粉颜色的改变是未预料到的结果。颜色代码取自皇家园艺学 会颜色图表(RHSCC)。它们提供了描述观察到的颜色表现的可供选 择的方法。然而,指定的数字应仅仅认为是对可见颜色的指南而不应当 作对可获得的可能的颜色的限制。
表5
在用pCGP 1867转化的Skr4×SW63植物中获得的花瓣,花药和 花粉颜色的总结
  登记号   花瓣片颜色  RHSCC代码(花瓣片)   花药和花粉颜色
  Skr4×SW63对照(594A)   极淡的紫色   69B/73D   白色
  593A   暗粉色   67B   粉红色
  590A   暗粉和粉色扇状   扇状67B和73A   粉红色
  571A   粉色   68A和B   粉红色
  589A   暗粉色   68A   粉红色
  592A   粉色和亮粉色扇状   68A和68B   亮粉色
  591A   暗粉色   68A   粉红色
  570A   极淡的紫色   69B/73D   白色
导入的Ht1 cDNA在Skr4×SW63杂种中的表达对花色具有显著 的影响。非转基因对照的雄蕊组织是白色的,而大多数转基因植物中的 相同组织是粉红色。另外,Ht1 cDNA在Skr4×SW63杂种中的表达使 花冠产生暗紫色,其在正常情况下是极淡的紫色。
实施例11产物的分析
以TLC分析用pCGP1867转化的Skr4×SW63植物的花瓣和雄蕊 (包括花粉,花药和花丝)中产生的花青苷和类黄醇。
花青苷和类黄醇的提取
TLC分析前,存在于花瓣和雄蕊抽提物中的花青苷和类黄醇分子经 酸水解从花青苷或类黄醇主链上去掉糖基部分。花青苷和类黄醇标准用 于帮助鉴定在花抽提物中存在的化合物。
通过在1ml 2M盐酸中煮沸100至200mg花瓣片或5个雄蕊30分 钟来抽提并水解花青苷和类黄醇。用200μl异戊醇抽提水解的花青苷和 类黄醇。然后将该混合物在真空中抽干并重悬于更小体积的甲醇/1% (V/V)HCl中。使用甲醇/1%(V/V)HCl的量根据花瓣的起始鲜 重,以便估测花瓣中类黄酮的相对水平。将雄蕊抽提物重悬于1μl甲醇/1 %(V/V)HCl中。将1μl小份的Skr4×SW63花瓣和雄蕊中来自 pCGP1867的抽提物点样到TLC平板上。
花抽提物的TLC分析
酸水解的花抽提物在Forestal溶剂***(HOAc∶水∶HCl;30∶ 10∶3)(Markham,1982)中迁移。表6显示了在用pCGP1867转化 的转基因Skr4×SW63矮牵牛属植物的某些花和雄蕊中存在的花青苷和 类黄醇的TLC分析结果。经过比较在TLC平板上观察到的斑点强度估 测类黄醇和花青苷的指示性相对量(用“+”至“+++”表示)。
表6
在用pCGP 1867转化的Skr4×SW63植物的花瓣片和雄蕊中检测 到的花青苷和类黄醇的相对水平
Figure G2009100097468D0000381
Ht1 cDNA克隆导入Skr4×SW63,导致在花瓣中产生3’-羟 基化的类黄酮,栎皮黄酮,甲基花青素和一些花青素。甲基花青素是花 青素的甲基化衍生物(图1a和1b)。在非转基因Skr4×SW63对照中 仅检测到四羟基黄酮和少量二甲翠雀素(表6)。尽管Skr4×SW63是 Hf1Hf2基因的纯合隐性,但这些突变不能完全阻断F3’5’H的合成(见 美国专利号5,349,125),且合成低水平的二甲翠雀素使花瓣片产生淡紫 色的颜色。
转基因植物#593A产生的具有粉红色花粉和花药的雄蕊含甲基花青 素和栎皮黄酮,而具有白色花粉和花药的非转基因Skr4×SW63对照含 四羟基黄酮和低水平的栎皮黄酮(表6)。
在转基因Skr4×SW63/pCGP1867植物的花瓣和雄蕊中3’-羟基 化的花青苷,甲基花青素的积累与在相同植物花瓣,花药和花粉中观察 到的粉红色和暗粉色有关。
F3’H活性的共同抑制
为了降低F3’H活性的水平,也将质粒pCGP1867导入P.hybrida 变种国旗红(Ht1)中。
按上文实施例9所述的进行矮牵牛属的转化。
38株转基因植物中有2株产生表型改变的花。OGR正常情况下产 生深红色花(RHSCC#4613)。花色改变的2株转基因植物产生亮粉 色或亮红色(RHSCC#54B和#53C)的花。
对从4株转基因植物(二株表型改变的转基因植物,二株具有通常 的深红色花的转基因植物)产生的花分离的RNA进行Northern分析以 检验OGR-38转录物的水平。10mg花瓣的总RNA在1.2%(W/V) 琼脂糖/甲醛凝胶(Sombrook等,1989)上分离并按前所述的方法转移 到Hybond N尼龙膜(Amersham)上。还包括来自未转化的OGR花 的花瓣RNA作为对照。OGR-38cDNA***片段的32P标记的片段用 于探测RNA印迹。
OGR-38探针在转基因植物花中检测到大约2.4kb和1.8kb的转 录物。然而,在亮粉色和亮红色花中检测到的两种转录物的水平比在深 红色转基因花中检测到的要低得多。在未转化的OGR花的RNA中也检 测到内源性1.8kb转录物。为了证实2.4kb转化物来自导入的OGR-38 转化基因,使用mas终止子区的32P标记的片段探测相同的RNA印迹。 mas探针检测到2.4kb的转录物,表明至少该转录物来自导入的OGR- 38转化基因。
花青苷水平的分析
通过分光光度分析测量对照花和亮粉色转基因花中的花青苷水平。 花青苷和类黄醇的提取。
通过将200至300mg花瓣片在2ml甲醇/1%(V/V)HCl中4℃ 保温16小时从花瓣片提取花青苷和类黄醇。然后将50μl该溶液加入 950μl甲醇/1%(V/V)HCl中,在530nm下测定稀释的溶液的吸光率。 使用公式:[(吸收值(530nm)/34,000)×抽提缓冲液体积×稀释系数× 106]/重量克数,测定以每克nmole表示的花青苷水平。
发现亮粉色花中每克花瓣片组织含大约915nmoles的花青苷,而对 照花含大约4000nmoles/克。
这些数据表明导入有义方向的矮牛属F3’H(OGR-38)cDNA 克隆入OGR植物导致内源性和转基因F3’H转录物的“共同抑制”(即, 减少)。观察到更白的花色与花青苷合成减少及F3’H转录水平减少相 关。
实施例12从麝香石竹分离F3’HcDNA克隆
为了分离鹿香石竹(石竹属)F3’H cDNA克隆,使用包含于 pCGP1805(上述)中的矮牵牛属Ht1连锁的F3’H cDNA克隆(OGR -38)在低度严格条件下筛选石竹变种Kortina Chanel花瓣cDNA文 库。
石竹变种Kortina Chanel cDNA文库的构建:
从阶段1,2和3的Kortina Chanel花分离的20mg总RNA(如 前所述),在含1×SuperscriptTM反应缓冲液,10mM二硫苏糖醇 (DTT),500μM dATP,500μm dGTP,500μM dTTP,500μM 5 -甲基-dCTP,2.8μg来自ZAP-cDNA GigapackIII Gold克隆试剂 盒(stratagene)的引物-接头寡聚核苷酸和2μl Superscript逆转录酶 (BRL)的50μl体积中逆转录。反应混合物在37℃保温60分钟,然 后放于冰上。使用ZAP-cDNA Gigapack III  Gold克隆试剂盒 (Stratagene)完成文库构建。重组子的总数为2.4×106
转染XL1-Blue MRF’细胞后以每15cm直径平板10,000pfu涂布 共200,000pfu的包装的cDNA。平板在37℃培养8小时,然后在4℃ 贮存过夜。取一式2分转移到Colony/Plaque ScreenTM滤膜(DuPont) 上并按厂商建议处理。
筛选Kortina Chanel花瓣cDNA文库中的F3’H cDNA克隆。
杂交前,按前述处理一式两份噬菌斑转移膜。用来自pCGP1805的 1.8kb EcoRI/Xho I***片段的32P标记的片段筛选来自Kortina Chanel 花瓣cDNA文库的两份转移膜。使用所述的用于筛选矮牵牛属OGR cDNA文库的低等严格条件。
将一个强烈杂交的噬菌斑挑进PSB中并按上面的详细描述再次筛 选以分离纯化的噬菌斑。找到包含于1ZAP噬菌体载体中的质粒并命名 为pCGP1807。
EcoR I/Xho I消化释放包含于pCGP1807中的KC-1cDNA插 入片段,此片段大约为2Kb。通过对从KC-1cDNA***片段的亚克 隆序列的编辑测定KC-1cDNA克隆的完整序列。覆盖458个核苷酸的 部分序列以前从覆盖KC-13’区的800bp Kpn I片段产生,该片段亚克 隆进p Bluescript产生pCGP1808)。完整序列(SEQ ID NO:3)含编 码500个氨基酸的推测的多肽(SEQ ID NO:4)的1500个碱基的开放 阅读框架。
将石竹KC-1cDNA克隆的核苷酸和推测断的氨基酸序列与矮牵 牛属OGR-38F3’H cDNA克隆的序列(SEQ ID NO:1和SEQ ID NO: 2)进行比较。石竹属KC-1cDNA克隆的序列(SEQ IDNO:3和4) 在1555个核苷酸上显示出与矮牵牛属OGR-38F3’H cDNA克隆67.3 %的相似性,在488个氨基酸上显示出71.5%的相似性。
在本说明书中已公开的矮牵牛属,石竹属,金鱼草属,拟南芥属, 玫瑰,菊和蝴蝶草属序列的序列排列及核苷酸和相应氨基酸序列间的序 列相似性的比较的各种总结分别见表7和表8,9,10,11和12。这 些表见实施例34,在说明书结尾处。
实施例13克隆在矮牵牛属的花瓣中的石竹属F3′H cDNA(KC- 1)的稳定表达-ht1/ht1矮牵牛属栽培品种的补充
制备pCGP1810
通过将来自pCGP 1807的cDNA***片段以“有义”的方向克隆 到pCGP90(美国专利号5,349,125)的Mac启动子(Comai等,1990) 后来构建质粒pCGP1810(图9),其中pCGP90是以pCGP293为基 础的构建体(Brugliera等,1994)。用Bam H I和Apa I消化质粒 pCGP1807来释放KC-1cDNA***片段。使用Bresaclean试剂盒 (Bresatec)分离并纯化cDNA片段。用Bam H I和Apa I消化pCGP90 双元载体来释放线型化的载体和Hf1 cDNA***片段。使用Bresaclean 试剂盒(Bresatec)分离并纯化线型化的载体并与KC-1cDNA克隆的 Bam H I/Apa I末端连接。使用Amersham连接酶进行连接。通过对从 庆大霉素抗性转化子中分离的DNA进行Bam H I/Apa I限制性酶分析确 认***片段在PCGP1810中的正确***。
按实施例9所述,将双元载体pCGP1810导入根癌土壤杆菌菌株 AGLO细胞中。随后使用pCGP1810/AGLO细胞转化Skr4×SW63矮 牵牛属植物(也按实施例9所述)以检测对应于KC-1cDNA克隆的基 因编码的酶的稳定表达和活性。
实施例14转基因植物表现型分析
Skr 4×SW63中的pCGP1810
导入的KC-1cDNA在Skr4×SW63杂种中的表达对花色具有显 著的影响。与Skr4×SW63对照(RHSCC#75C)相比,用pCGP1810 转化的12株转基因植物中有10株产生花瓣颜色改变的花(RHSCC# 73A)。而且,与对照Skr4×SW63植物的花为白色相比,转基因花的 花药和花粉为粉红色。另外,KC-1cDNA在Skr4×SW63杂种中的 表达产生暗粉色花冠,而在正常情况下为淡紫色。颜色代码取自皇家园 艺学会颜色图表(RHSCC)。它们提供了描述观察到的颜色表现型的 可供选择的方法。然而指定的数值应仅用来作为对可见颜色的指南而不 应当作是对可得到的可能的颜色的限制。
酸水解的花提取物(见实施例11)在Forestal溶剂***(HOAc∶ 水∶HCl;30∶10∶3)(Markham,1982)中迁移。3′羟基化的 类黄酮,甲基花青素和栎皮黄酮容易在转基因植物的花瓣片中检测到。 在未转基因的Skr4×SW63对照中仅检测到四羟基黄酮和少量二甲翠崔 素。
在转基因Skr4×SW63/pCGP1810植物的花瓣中3′-羟基化花 青苷,甲基花青素的积累与相同植物花瓣中观察到的暗粉色有关。
pCGP1813的构建
通过将来自pCGP1807的cDNA***片段以“有义”方向克隆到 pCGP1958的MaC启动子(Comai等,1990)后来构建质粒 pCGP1811。质粒pCGP1958含Mac启动子和pUC19骨架中的甘露碱 合成酶(mas)(Comai等,1990)终止子。用PstI和xhoI消化质粒 pCGP1807以释放cDNA***片段。使用DNA聚合酶(Klenow片段)补 平突出的5′端(Sambrook等,1989)。使用Bresaclean试剂盒 (Bresatec)分离并纯化cDNA片段并与pCGP1958载体的Sma I末端连 接以制备pCGP1811。
随后用Pst I消化质粒pCGP1811来释放含有具有mas终止子和启 动的KC-1cDNA的Mac启动子的表达元件,所有这些包含于4kb片 段上。分离表达元件与pWTT2132双元载体(DNA植物技术公司, Oakland,california)的Pst I末端连接以产生pCGP1813(图10)。 用石竹属F3′H cDNA克隆转化麝香石竹变种Kortina Chanel
按实施例9所述将双元载体pCGP1813导入根癌土壤杆菌菌株 AGL0细胞。pCGP1813/AGLO细胞用于转化石竹属植物来减小3′- 羟基化类黄酮的量。
(a)植物材料
从Van WyK和Son Flower Supply,Victoria,Australia获得麝香 石竹(变种Kortina Chanel)插枝。去掉外侧叶并先在70%v/v乙醇中 简单消毒插枝,然后在1.25%w/v次氯酸钠(含Tween 20)中处理6 分钟并用无菌水漂洗3次。共同培养前在解剖显微镜下去掉全部可见叶 和腋芽。
(b)土壤杆菌和石竹属组织的共培养
含双元载体pCGP1813的根癌土壤杆菌菌株AGL0(Lazo等,1991) 在含50mg/L四环素的LB琼脂平板上于4℃保存。单个菌落在含50mg/L 四环素的液体LB培养基中生长过夜并在第二天接种前稀释至5×108个 细胞/ml。将石竹茎组织与土壤杆菌在补充了3%w/v蔗糖,0.5mg/l BAP, 0.5mg/L 2,4-二氯苯氧乙酸(2,4-D),100mM乙酸丁香酮和 0.25%w/v Gelrite(pH5.7)的MS培养基中共同培养5天。
(c)转基因石竹属植物的再生
为了选择转化的茎组织,将每个共同培养的茎顶端6-8mm切成3 -4mm段,然后转移进补充了0.3%w/v蔗糖,0.5mg/L BAP,0.5mg/L 2,4-D,1μg/L氯磺酸(chlorsulfuron),500mg/L ticarcillin和0.25 %w/v Gelrite的MS培养基(Murashige和Skoog,1962)中。2周后, 将外植体转移进含3%蔗糖,0.16mg/L苯基噻二唑基脲(TDZ), 0.5mg/L吲哚-3-丁酸(IBA),2μg/L chlorsulfuron,500mg/L tiearcillin和0.25%w/v Gelrite的新鲜MS培养基中并在此阶段小心地 取出从茎外植体上去掉腋枝。3周后,将健康的不定枝转移进含3%w/v 蔗糖,5μg/L chlorsulfuron,500mg/L ticarcillin,0.25%w/v Gelrite的无 激素MS培养基中。将在5μg/L chlorsulfuron下存活的枝条转移进相同 培养基中使枝条伸长。
为正常化和生根,将伸长的枝条转移进含5μg/L chlorsulfuron, 500mg/L ticarcillin和0.4%w/v Gelrite的无激素MS培养基的玻璃罐 中。所有培养物在16小时光周期(120mE/m2/s冷白色荧光灯)23±2℃保 存。将大约1.5-2cm高的正常化的小植株转移进土壤(75%珍珠石/25 ℃泥炭)中在14小时光周期(200mE/m2/s卤化汞灯)23℃下生长3- 4周。植物用含1g/L CaNO3和0.75g/L加了以4.7∶3.5∶29.2比例的 N∶P∶K的微量元素石竹属混合物施肥。
实施例15使用差异显示方法从金鱼草(金鱼草属)分离F3′HcDNA 克隆
采用新方法从金鱼草(金鱼草属)分离编码F3′H的cDNA序列。 改进方法以(i)使用过剩的寡核苷酸分离植物细胞色素P450序列(Holton 等,1993)和(ii)真核信使RNA的差异显示(Liang和Pardee,1992)方案 的组合为基础,来以比较野生型(EOS+)和F3′H突变体(eos-)金 鱼草株系之间的花瓣细胞色素P450转录物群体。差异表达cDNA片段的 直接克隆允许通过Northern,FRLP和序列分析进行进一步的鉴定以鉴 定推断的F3′H编码序列。使用Frohman等(1988)的RACE方案 获得全长cDNA,并表明该克隆在矮牵牛属花瓣细胞中瞬间和稳定表达 后编码功能性F3′H。
植物材料
所用的金鱼草株系来自亲本株系K16(eos-)和N8(Eos+)。K16是 缺乏F3′H活性的纯合隐性突变体,而N8是F3′H活性的野生型。 这些株系尽管不是同基因的,但是相似的。来自自交K16×N8F1植物 的蒴果E2282的种子(#E228)萌发,对所得的植物(K16×N8F2 植物)是否存在花青素,F3′H活性的产物进行评分(见图1a和1b)。 花青素的存在可通过肉眼评分,因为花为深红色,不同于粉红色(来自 花葵素产生的色素)的突变植物。按实施例11所述进行的花瓣花青苷的 TLC分析证实肉眼评分的精确性。
E2282种子产生的13株植物中,9株(#3,#4,#5,#6, #7,#9,#10,#12,#15)产生具有花青素的花(Eos+/Eos+和Eos+/eos-),而4株(#8,#11,#13,#14)仅合成花葵素 衍生的色素(eos-/eos-)。
cDNA的合成
使用Turpen和Griffith(1986)的方法从金鱼草K16×N8F2分散 群体(E2282)的植物#13的叶及植物#3,#5和#12的花瓣组织 分离总RNA。在40单位
Figure G2009100097468D0000451
核糖核酸酶抑制剂(Promega)存在的条 件下,用1单位RQ1无RNA酶的DNA酶(Promega)在厂家提供的缓冲 液中37℃处理50μg总RNA3小时去除污染的DNA。然后通过用酚/氯 仿/异戊醇(25∶24∶1)抽提进一步纯化RNA并随后用乙醇沉淀。
互补于聚腺苷酸化序列的上游区的锚定poly(T)寡核苷酸用于从金 鱼草花瓣和叶RNA引发cDNA合成。合成的寡核苷酸序列是(5′-3 ′):
poly T-anchA TTTTTTTTTTTTTTTTTA    SEQ ID NO:27
poly T-anchC TTTTTTTTTTTTTTTTTC    SEQ ID NO:28
poly T-anchG TTTTTTTTTTTTTTTTTG    SEQ ID NO:29
2mg总RNA和100pmol合适的引物寡核苷酸加热到70℃10分 钟,然后在冰中冷却。然后将RNA/引物杂交体加入含20单位
Figure G2009100097468D0000452
(Promega)。各25nM的dNTP,10mM DTT和1×Superscript缓冲液 (BRL)的反应体系中。将反应物在37℃加热2分钟,然后加入200 单位的SuperscriptTM逆转录酶(BRL),使反应进行75分钟,然后经 过在95℃加热混合物20分钟灭活逆转录酶。
使用PCR扩增细胞色素P450序列
使用过剩的寡核苷酸(设计成互补于靠近植物细胞色素P450编码 序列3′端的保守区)和polyT锚式寡核苷酸扩增细胞色素P450序列。 以前已有人使用相似方法从Petunia hybrida合成细胞色素P450序列且 在美国专利号5,349,125中进行了描述。
合成4个寡核苷酸(称为上游引物)。它们来自植物细胞色素P450 序列的保守氨基酸区。寡核苷酸(从5′到3′写出)如下:
WAIGRDP       TGG GCI ATI GGI(A/C)GI GA(T/C)CC
SEQ ID NO:30 SEQ ID NO:31
FRPERF        AGG AAT T(T/C)(A/C)GIC CIG A(A/G)(A/C)GIT T
SEQ ID NO:32 SEQ ID NO:33
Pet Haem-New  CCI TT(T/C)GGI GCI GGI(A/C)GI (A/C)GI ATI TG(T/G)
              (C/G)CI GG
              SEQ ID NO:34
EFXPERF       GAI TT(T/C)III CCI GAI(A/C)GI TT
SEQ ID NO:35 SEQ ID NO:36
使用上游引物与每一种polyT锚定寡核苷酸在使用cDNA作模板的 聚合酶链式反应中产生细胞色素P450序列。50pmol的各种寡核苷酸与 2μM的每种dNTP,1.5mM MgCl2,1×PCR缓冲液(Perkin Elmer), 5μCiα-〔33P〕dATP(Bresatec,1500Ci/mmol),2.5单位的
Figure G2009100097468D0000471
DNA聚合酶(Perkin Elmer)和1/10的可引发cDNA反应 的锚定poly T(来自上文)混合。反应混合物(50μl)在94℃下起始 变性2分钟的步骤后,在94℃15秒,42℃15秒,70℃45秒间循环 40次。使用Perkin Elmer 9600 Gene Amp热循环仪进行循环反应。
使用每一种上游引物/锚定引物组合和适当的可引发的cDNA模板 扩增DNA序列。各引物组合与来自E2282植物#3和#5(合成花青素 的花)和#12(不合成花青素的花)花瓣的cDNA一起使用。还包括加 入来自植物#13(合成花青素的花)的叶的cDNA的反应作为阴性对照, 因为在健康的,非逆境的叶组织中不存在明显的F3′H活性水平。 细胞色素P450序列的差异显示。
在5%(w/v)聚丙烯酰胺/尿素变性凝胶(sambrook等,1989)上分离后 可观察到33P标记的PCR片段。在凝胶上包含有33P标记的M13mp18 测序梯度用作大小标记。测序凝胶在Whatman 3MM纸上干燥并用柯达 XAR胶片在室温下曝光。
合成花青素的花瓣样品与无花青素的花瓣样品间的带型比较揭示了 代表在合成花青素的花瓣中特有的mRNA的11条带。在这11条带中, 只有2条也存在(强度降低)于叶样品中。
从测序凝胶分离和克隆PCR片段
从干燥的测序凝胶中纯化PCR产物并用Liang等(1993)所述的 方法再扩增。在1.2%(w/v)琼脂糖/TAE凝胶上电泳分离后,使用 Besaclean试剂盒(Bresatec)纯化扩增的cDNA。然后将纯化的片段直接 连按进或商业上制备的PCR-ScriptTM载体(Stratagene)中或已使用 Marchuk等(1990)的方案加上T尾的Eco RV切开的pBlueseript (Stratagene)中。
F3′H PCR产物的测序
11个克隆的差异显示PCR产物(***片段不超过500bp)中的每 一个的两条链被测序并使用Pearson和Lipman(1988)的FASTA程序与 花青苷生物合成中涉及的其它已知的细胞色素P450序列进行比较。
在11个克隆的cDNA中,2个(Aml Gb和Am3Ga)表现了与矮牵 牛属OGR-38F3′H序列(实施4到11)和F3′5′H序列(Holton 等,1993)较强的同源性。克隆Am1Gb和Am3Ga之间的保守序列表明它 们代表相同mRNA的重叠片段。克隆Am3Ga从编码分子的血红素结合 区的序列(被“Pet Haem-New”寡核苷酸识别;SEQ ID NO:34)延 伸到多腺苷酸化序列。克隆Am1Gb从编码保守的“WAIGRDP”氨基 酸基序列模式的细胞色素P450序列(互补于引物1;SEQ ID NO:30 和SEQ ID NO:31)延伸到被引物1(“WAIGRDP”)寡核苷酸错误 识别的3′非翻译区的一个区域。
实施例16细胞色素P450cDNA的RFLP分析
再次使用限制性片段长度多态性(RFLP)分析研究对应于cDNA 克隆Am3Ga的基因与花瓣中是否存在合成花青素活性的联系。Am3Ga 的32P标记的***片段用于探测从K16×N8F2隔离植物及亲本K16和 N8株系中分离的基因组DNA的Southern印迹。对EcoRV消化的来自 K16×N8F2隔离群体的13株植物的基因组DNA的分析表明仅与表现 出花的花青素合成的N8和K16×N8F2隔离株系的序列杂交(图11)。 在其花瓣中仅合成花葵素衍生的色素的K16×N8F2植物(包括亲本株 系,K16)显示出无特异性杂交(图11,泳道2,8,11,13,14)。 这些数据表明在突变体K16植物中对应于Am3Ga的基因组序列可能缺 失,因此在该株系中F3′H基因至少部分缺失。
实施例17细胞色素P450cDNA的Northern分析
使用Northern分析证实以差异显示表示的推测的细胞色素P450片 段的表达情况。在1.2%(w/v)琼脂糖/甲醛凝胶(sambrook等,1989) 上分离10mg来自8个K16×N8F2隔离群体的花瓣的总RNA并转移到 Hybond N尼龙膜(Amersham)上。还包含来自产花青素的植物#13的 叶RNA作为Northern分析的阴性对照。来自克隆Am3Ga的cDNA插 入片段的32P标记的片段用于探测RNA印迹。
Am3Ga探针识别仅在合成花青素的植物(植物#1,#3,#4, #5,#8)的花瓣中可检测到的大约1.8Kb的转录物。在合成花葵素 的花瓣(植物#6,#11,#12)或来自植物#13的叶样品中检测不 到转录物(图12)。
这些数据与RFLP分析的结果一起提供了强有力的证据,证明 Am3Ga克隆代表负责金鱼草属中F3′H活性的细胞色素P450基因的 强有力的证据。在不合成花青素的株系的花瓣中完全没有可检测的转录 物这一点支持了RFLP分析的发现,即在K16株系(和K16×N8F2 隔离群体的纯合隐性植物)中缺乏合成花青素活性是F3′H结构基因缺
失的结果。
实施例18分离全长的金鱼草属F3′H cDNA
采用Frohman等(1988)的cDNA末端迅速扩增(RACE)方法用已知 的部分Am3Ga克隆的序列分离全长F3′H cDNA克隆。合成基因特异性 引物(“Snapred Race A”-互补于Am3Ga序列361至334)以允许从花 瓣RNA进行逆转录。还合成了3′扩增引物(“Snapred Race C”-互补 于Am 3Ga(3′UTR)序列283至259)以结合“Snaprred Race A”的上游。 使用“poly(C)”引物从cDNA分子5′端扩增序列。
使用的寡核苷酸序列是(从5′-3′写出):
Snapred Race A CCA CAC GAG TAG TTT TGG CAT TTG ACC C
             SEQ ID NO:37
Snapred Race C GTC TTG GAC ATC ACA CTT CAA TCT G
             SEQ ID NO:38
PolyC race   CCG AAT TCC CCC CCC CC
             SEQ ID NO:39
“Snapred Race A-引发的”花瓣cDNA是加了poly(G)尾的,使用 Frohman等(1988)的方法用引物“Snapred Race C”和“polyC race” 扩增的5′cDNA片段。PfuDNA聚合酶(0.15单位)(Stratagenz)与2.5单 位的Ampli
Figure G2009100097468D0000491
DNA聚合酶(Perkin Elmer)结合以增强PCR反应的忠 实性。
所得的1.71kb DNA片段(sd F3′H)直接克隆进使用Marchuk等 (1990)的方法加上T尾的EcoR V切开的
Figure G2009100097468D0000501
(tratagene)载体 中。该质粒命名为pCGP246。
实施例19金鱼草属F3′H cDNA完整序列
采用pCGP246sd F3′H cDNA序列内的常用限制性位点以产生质粒 载体pUC 19中的一系列短的重叠亚克隆。编辑各亚克隆的序列以提供sd F3′H RACE cDNA的完整序列。将sdF3′H cDNA序列与来自克隆 AM3Ga的序列结合以提供金鱼草属F3′H cDNA的完整序列(SEQ ID NO:5)。它含有1711个碱基的开放阅读柜,编码512个氨基酸的推测的 多肽(SEQ ID NO:6)。
将金鱼草属sd F3′H克隆的核苷酸和推测的氨基酸序列与矮牵牛属 OGR-38cDNA克隆的序列(SEQ ID NO:1和SEQ ID NO:2);矮牵牛 属F3′5′H cDNA克隆Hf1Hf2序列;和以前分离的其它矮牵牛属细胞 色素P450序列(美国专利号5,349,125)进行比较。sd F3′H的序列与代 表P.hybrida Ht1基因座的矮牵牛属F3′H cDNA克隆(OGR-38)的序列 最相似,在核酸水平上于1573个核苷酸中有69%的相似性,在氨基酸 水平上于507个氨基酸中有72.2%的相似性。
Hf1克隆与金鱼草属sdF3′H克隆在1563个核苷酸中有57.3%的相 似性,在491个氨基酸中有49.3%的相似性。而Hf2克隆与金鱼草属sd F3′H克隆在1488个核苷酸中有57.7%的相似性,在508个氨基酸中有 50.8%的相似性。
金鱼草属sd F3′H序列含有2个阅读框架内ATG密码子,它们都能 启动翻译。从第一个密码子(SEQ ID NO:5的91位)起始合成增加了10 个N端氨基酸的蛋白质,且根据翻译的扫描模型(Kozak,1989),它是优 选的。
在本说明书中已公开的矮牵牛属,石竹属,金鱼草属,拟南芥属, 玫瑰,菊和蝴蝶草属序列的排列及核苷酸和相应氨基酸序列间的序列相 似性比较的各种总结分别见表7和表8,9,10,11和12。这些表在 实施例34中,在说明书结尾处。
实施例20 sd F3′H在植物中的瞬间表达
pCGP 250的构建
通过将来自pCGP 246的完整的sd F3′H RACE cDNA***片段〔从 位置1至1711(SEQID NO:5)〕以“有义”的方向克隆到pCGP 293(Brugliera等,1994)的Mac启动子(Comai等,1990)之后以构建质 粒pCGP 250(图13)。
EcoRI消化质粒pCGP246以释放cDNA***片段。通过用DNA 聚合酶I的Klenow片段修复伸出端使cDNA片段变成平末端(Sambrook 等,1989),在琼脂糖凝胶电泳后,使用Bresaclean试剂(Bresatec)纯化。 然后将平末端的cDNA片段连接进用XbaI切开的且使用DNA聚合酶I 的klenow片段补平的双元载体pCGP 293中。使用Amersham连接试剂 盒进行连接。通过对从庆大霉素抗性转化子分离的DNA进行Bam HI和 PstI限制性酶分析确认***片段在pCGP 250中的正确***。
pCGP 231的构建
通过将来自pCGP246第一个“阅读框架内”ATG密码子下游的 RACE cDNA***片段〔从位置104至1711(SEQ ID NO:5)〕以“有义” 的方向克隆到pCGP 293(Brugliera等,1994)的Mac启动子(Comai等, 1990)之后产生质粒pCGP231(图14)。用SspI(识别候选ATG密码子之 间的位点)和SmaI(载体多接头序列中的位点)消化质粒pCGP 246以释 放包含第二个推测的起始密码子下游的完整编码区的平末端cDNA片 段。然后将cDNA片段连接进已用XbaI切开并用DNA聚合酶I的klenow 片段补平的双元载体pCGP 293中。使用Amersham连接试剂盒进行连 接。通过对从庆大霉素抗性转化子分离的DNA进行BamHI和PstI限 制性酶分析确认***片段在pCGP231中的正确***。
瞬间表达研究
为了迅速测定pCGP 231和pCGP 250中的pCGP 246序列是否编 码植物中的活性类黄酮3′-羟化酶,进行了瞬间表达试验。使用实施例8 中所述的方法,用pCGP 231或pCGP 250质粒DNA包被的金颗粒(1μm 直径)轰击突变的P.hybrida株系Skr4×SW63的花瓣。
在控制植物生长室中22℃光照下6-12小时后,在用pCGP231 包被的颗粒轰击的花瓣组织的表面观察到红色花青苷斑点。在用pCGP 250轰击的花瓣中或仅用金颗粒轰击的对照花瓣中未观察到有色斑点。这 些结果表明在Mac启动子控制下的pCGP246编码区(在第二个ATG, SEQ ID NO:5的121位起始)在花瓣组织中具有功能。
实施例21金鱼草属F3′H cDNA克隆在矮牵牛属花瓣中的稳定表达- ht1/ht1矮牵牛属栽培品种的补充
按实施例9所述将双元载体pCGP 250和pCGP 231导入根癌土壤 杆菌菌株AGL0细胞中。使用pCGP 250/AGL0和pCGP 231/AGL0细 胞转化Skr4×SW63矮牵牛属植物(也在实验例9中描述)以检测对应于 金鱼草属sd F3′H cDNA克隆的基因编码的酶的活性和稳定表达。
用pCGP 250转化的9株转基因植物中有3株与Skr4×SW63对照 (RHSCC#75C)相比产生花瓣颜色略有改变的花(RHSCC#73A)。在用 pCGP 231转化的11株转基因植物中,一株植物产生花瓣颜色改变的花 (RHSCC#73B)。转基因花的花药和花粉与对照一样,也是白色。代码 来自皇家园艺学会颜色图表(RHSCC)。它们提供了描述观察到的花表型 的一个可供选择的方法。然而,应把指定的数字当作可见颜色的一种指 南,而不应当作对可获得的可能的颜色的限制。
花抽提物的TLC分析
酸水解的花抽提物(见实施例11)在Forestal溶剂***(HOAc∶ 水∶HCl;30∶10∶3)(Markham,1982)中迁移。sd F3′H cDNA克隆导入 Skr4×SW63中导致花瓣中3′-羟基化类黄酮,甲基花青素的生产水平 升高。甲基花青素是花青素的甲基化衍生物(图1a和1b)。
实施例22使用RCR方法从拟南芥分离F3′H cDNA克隆
为了从拟南芥中分离代表类黄酮3′羟化酶的cDNA克隆,使用来自 细胞色素P450保守区的引物合成PCR片段。发现一个PCR产物(p 58092.13)与矮牵牛属OGR-38和金鱼草属F3′H cDNA克隆具有较高 的序列相似性。然后使用PCR片段与来自pCGP 1805的Ht1cDNA插 入片段(OGR-38)一起筛选拟南芥cDNA文库。
寡核苷酸的设计:
从靠近血红素结合区的Petunia hybrida细胞色素P450部分序列的 共有氨基酸序列设计用于PCR DNA扩增的简并寡核苷酸。经过在各密 码子的第三个碱基上包括脱氧次黄苷(下文称为I)(脱氧次黄苷碱基对与 A,T,G和C具有相似的效率)且在非特异性的共有序列上包括可选择 的碱基来形成引物简并性。因此,设计了含有对血红素结合起关键作用 的半胱氨酸残基的密码子的氨基末端定向引物“Pet Haem”(矮牵牛属 血红素结合区)和上游引物“WAIGRDP”(也见实施例15)。
WAIGRDP       TGG GCI ATI GGI(A/C)GI GA(T/C)CC
SEQ ID NO:30 SEQ ID NO:31
Pet Haem      CCI GG(A/G)CAI ATI C(G/T)(C/T)(C/T)TI CCI GCI CC(A/G)AAI GG
              SEQ ID NO:40
使用PCR合成细胞色素P450序列
使用Dellaporta等(1987)所述的方法从拟南芥生态型Columbia分 离基因组DNA。用于扩增细胞色素P450同源物的聚合酶链式反应典型 地含有100-200ng Columbia基因组DNA,10mM Tris-HCl(pH8.3), 50mM Kcl,1.5mM MgCl2,0.01%(w/v)明胶,0.2mM的各种dNTP, 312ng“WAIGRDP”和484ng“Pet Haem”及1.25单位的的Taq聚 合物(Cetus)。反应混合物(50μl)在95℃50秒,45℃50秒及72℃45 秒间循环40次。
使用“WAIGRDP”和“Pet Haem”引物在无内含子的典型的 P450基因模板上产生的特异性PCR扩增产物的预期大小约为150个碱 基对。分离大约140至155个碱基对的PCR片段并使用
Figure G2009100097468D0000531
试剂 盒(BIO 101)纯化。再扩增PCR片段以获得足够的产物用于克隆,然后 使用Pfu DNA聚合酶进行末端修复,最后克隆进pCR-ScriptTM Direct SK(+)(Stratagene)。然后使用连接的DNA转化感受态的DH5α细胞 (Inouc等,1990)。
PCR产物的序列
制备来自15个转化子的质粒DNA(Del Sal等,1989)。从PCR片 段产生的测序数据显示15个中有11个代表单一的克隆。在拟南芥PCR ***片段内编码的翻译序列中也发现了一组特有的细胞色素P450共有 氨基酸。还将PCR片段的序列与矮牵牛属OGR-38F3′H cDNA克隆和 金鱼草属F3′H cDNA克隆的序列进行
Figure G2009100097468D0000541
PCR片段p58092.13与来自矮 牵牛属和金鱼草属的F3′H序列最相似。
实施例23拟南芥cDNA文库的筛选
为了分离p58092.13PCR产物的cDNA克隆,用32p标记的 p58092.13的片段与包含于pCGP1805中的矮牵牛属Ht1cDNA***片段 (OGR-38)的32p标记片段一起筛选拟南芥生态型Columbia CDNA文 库(Newman等,1994;D′Alessio等,1992)。
按D′Alessio等(1992)所述以每15cm直径平板50,000pfus的密度 涂布共600,000pfu的噬菌体,在37℃生长后,将平板于4℃贮存过夜。 取一式二份转移到Colony/Plaque ScreenTM滤膜(DuPont)上并接厂家建 议处理。
杂交前,在预洗涤溶液(50mM Tris-HCl pH7.5,1M NaCl,1mM EDTA,0.1%(w/v)肌氨酸)中65℃洗涤二份噬菌斑转移膜30分钟;在 0.4M氢氧化钠中65℃变性30分钟,然后在0.2M Tris-HCl pH8.0,0.1 ×SSC,0.1%(w/v)SDS溶液中65℃洗涤30分钟,最后在2×SSC, 0.1%(w/v)SDS中漂洗。
杂交条件包括在50%(v/v)甲酰胺,1M NaCl,10%(w/v)硫酸葡聚 糖,1%(w/v)SDS中42℃下至少1小时的预杂交步骤。然后向杂交溶液 中加入32p标记的p58092.13的片段(2×106cpm/mD,杂交在42℃下 再继续16小时。然后滤膜在2×SSC,1%(w/v)SDS中42℃下洗涤2 ×1小时并用具有增感屏的柯达XAR胶片在-70℃曝光16小时。
将11个强烈杂交的噬菌斑挑进PSB中并按上面的详细描述再次筛 选以分离纯化噬菌斑。也用包含于pCGP1805中的矮牵牛属Ht1cDNA ***片段(OGR-38)的32p标记的片段在低度严格条件下探测这些滤 膜。低度严格条件包括42℃下在20%(v/v)甲酰胺,1M NaCl,10%(w/v) 硫酸葡聚糖,1%(w/v)SDS中的预杂交和杂交及65℃下在6×SSC, 1%(W/V)SDS(W/V)中洗涤1小时。
OGR-38和p58092.13探针与相同的噬菌斑杂交。将11个纯化噬 菌斑挑进PSB并使用细菌菌株DH10B(Zip)存活含cDNA克隆的质粒载 体pZL1。制备质粒DNA(Del Sal等,1989)并用BamHI和EcoRI 消化释放cDNA***片段。11个质粒含有800bp至1kb的cDNA***片 段。从cDNA***片段5′端得到的序列数据表明这些克隆中的9个是相 同的。序列数据从所有9个cDNA***片段的5′端和一个cDNA***片 段的3′端得到。编辑从所有克隆得到的序列数据以得到SEQ ID NO:7和 SEQ ID NO:8所示的核苷酸和其翻译序列。
将拟南芥推测的F3′H序列与矮牵牛属OGR-38F3′H cDNA克隆 的序列(SEQ ID NO:1和SEQ ID NO:2)进行比较。在745个核苷酸中与 矮牵牛属F3′H cDNA克隆有64.7%相似性,在248个氨基酸中有63.7% 相似性。
在本说明书中已公开的矮牵牛属,石竹属,金鱼草属,拟南芥属玫 瑰,菊和蝴蝶草属序列的序列排列及核苷酸和相应氨基酸序列间相似性 的序列比较的各种总结分别可在表7和在表8,9,10,11和12中发 现。这些表见实施例34,在说明书结尾处。
从拟南芥分离F3′H基因组克隆
为了分离拟南芥F3′H基因的基因组克隆,用32p标记的p60606.04 片段筛选拟南芥生态型Landsberg erecta基因组DNA文库。经过克隆 Bam HI消化的λ噬菌体EMBL4臂间的Mbo I部分消化的基因组DNA 得到该文库。筛选前扩增一次含30,000克隆的一级文库。
Bam HI/Eco RI消化含拟南芥F3′HcDNA的1kb片段的 p60606.04克隆以切下***片段,并使用GeneClean(Bio 101)纯化。使 用缺口转移方法(Sambrook等,1989)以32p标记探针。在高度严格条件 (50%甲酰胺,37℃)下探测大约20,000个噬菌斑并在2×SSPE;2× SSPE,0.1%(w/v)SDS;0.1×SSPE中65℃下洗膜。在相同条件下 进行再筛选。
从3个阳性噬菌斑(λTT7-1,λTT7-5和λTT7-6)中纯化DNA 并通过用Eco RI和Eco RI/Sal I消化建立图谱。所有3个克隆都具有一 个共同的Eco RI片段。λTT7-1和λTT7-5重叠但限制性图谱不同。 按上文所述探测这些消化产物的Southern印迹,对于λTT7-1和λTT7 -5,杂交上了一个共同的6.5kb的Eco RI/Sal I片段,在λTT7-6中 也杂交上了一个较小的Eco RI/Sal I片段并很可能在***片段的边界 处。
将来自1TT7-5的Eco RI/Sal I片段克隆进pBlue Script SK+中, 通过杂交(如上)和***片段的大小鉴定含6.5kb片段的克隆,命名为E- 5。使用Eco RI,Sal I,Kpn I,Hind III和Bgl II的各种组合制定该片段 的限制性图谱,并通过与来自拟南芥F3′H cDNA克隆的用Bam HI/EcoRI消化的***片段的Southern杂交编辑。
Tt7基因组克隆的完整序列
使用标准技术(Sambrook等,1989)将来自pTt 7-2,含有大多数 Tt7基因组片段的6.4kb的Bam HI片段纯化,自连,超声处理,末端修 复,根据大小分离(450bp至800bp)并克隆进Sma I切割的pUC19中。 分离重组克隆,纯化质粒DNA并使用M13-21或M13逆向测序引物 测序。将来自重叠克隆的序列组合进一个邻近的片段。经过用-21和 REV引物测序也获得了Tt7基因组片段末端的序列。将所有的序列组合 起来以获得来自E-5(WEQ ID NO:9)的6.5kb Eco RI/Sal I片段的完整 序列。
将拟南芥属Tt7基因组克隆编码区的序列(SEQ IDNO:10,11, 12和13)与矮牵牛属OGR-38F3′H cDNA克隆的序列(SEQ ID NO:1 和2)比较。拟南芥属Tt7编码区与矮牵牛属OGR-38F3′H cDNA克隆 编码区在1066个核苷酸中具有65.4%的相似性,在511个氨基酸中具有 67.1%的相似性。
拟南芥属突变体tt7的转化
双元载体的制备:
将来自E-5的Eco RI/Sal I片段克隆进Eco RI/Sal I切割的pBI 101(Jefferson等,1987)中。鉴定了2个分离的但相同的克隆:pBI-Tt7- 2(图15)和pBI-Tt7-4。使用2个克隆转化根癌土壤杆菌。
植物转化
经电穿孔将质粒pBI-Tt7-2,pBI-Tt7-4和pBI 101转化进土壤杆 菌属菌株GV3101pMP90中。在含50μg/ml卡那霉素(及50μg/ml庆大霉 素来选择残余的pMP90)的培养基中选择转化子。
分离来自各克隆的4个转化子菌落的质粒DNA并用Eco RI/Sal I 消化,电泳,并用Tt7 cDNA***片段探测Southern印迹。对于pBI-Tt7-2 和pBI-Tt7-4,预期的***片段条带得到鉴定。
使用基本上如Bechtold等(1993)所述的方法,将各质粒的一个转化 子(即:一个对照〔pBI101C4〕,2个Tt7克隆〔pBI-Tt7-2-3和pBI Tt7-4-4〕各一个)用于真空渗入拟南芥tt7突变株系NW88(每种构建体用 4盆各10株的植物)。
从各盆收获种子。将100mg种子(大约5,000个)涂布到含50μg/ml 卡那霉素的营养培养基(Haughn和Somerville,1986所述)上。7至10天 后可见卡那霉素抗性转化子。对于pBI-Tt7-2-3和pBI-Tt7-4-4,从5个不 同的种子群(即:盆)分离到总共11个转化子,所有的卡那霉素抗性转化子 在表型上可见是Tt7,且在叶和胚轴边缘表现出特征性红色/紫色花青苷 色素。从4盆对照转化子的一盆中分离单个卡那霉素抗性转化子,它不 表现出“野生型”Tt7表型。
tt7突变体的互补
种植这些转化子并生长至成熟,逐一收获种子。在每种情况下,对 于pBI-Tt7-2-3和pBI-Tt7-4-4转化子,其种子在视觉上比tt7突变植物 的淡棕色种子棕色更深。来自对照转化子的种子与tt7突变亲本不可区 分。将这些种子种植在营养培养基和添加有卡那霉素的营养培养基上, 评价Tt7表型(子叶边缘和胚轴有红色/紫色花青苷色素)和卡那霉素抗 性。检查至少一个转化子后代的各种子群体,因为它们明显不依赖于转 化事件。
无一例外,卡那霉素抗性幼苗表现出Tt7表型,而卡那霉素敏感的 个体是tt7。在有些情况下,卡那霉素抗性微弱且在一个种子家族中具有 可变性,难以明确测定该个体是卡那霉素抗性还是卡那霉素敏感性。
实施例24从Rosa hybrida分离F3′H cDNA克隆
为了分离玫瑰F3′H cDNA克隆,用32p标记的包含于pCGP1805 中的矮牵牛属Ht1 cDNA克隆(OGR-38)片段和包含于pCGP246中的 金鱼草属F3′H cDNA克隆(sd F3′H)筛选Rosa hybrida变种Kardinal花 瓣cDNA文库。
从玫瑰变种Kardinal构建花瓣cDNA文库
从Rosa hybrida变种Kardinal阶段2的花蕾制备总RNA。在此阶 段,紧闭的花芽1.5cm高,约0.9cm宽,具有淡粉色花瓣。
冷冻的组织(1-3g)在淡氮中用杵臼研磨,放入25ml预冷的缓冲液 A〔0.2M硼酸,10mM EDTA(钠盐)(pH7.6)〕中并快速匀浆。抽提物在 旋转摇床上混合至其达到室温,加入用缓冲液A平衡的等体积的酚/氯仿 (1∶1 v/v)。再混合10分钟后,RNA制备物以10,000xg 20℃下离心10 分钟。保留上部水相且如上所述再次抽提酚界面。合并水相并调到0.1M 乙酸钠(pH6.0),加入2.5体积95%的乙醇,混合物于-20℃贮存过夜。
制备物以10,000xg于4℃下离心10分钟,沉淀轻轻溶于20ml缓冲 液B〔25mM硼酸,1.25mM EDTA(钠盐),0.1M NaCl(pH7.6)〕并加 入0.4体积的2-丁氧乙醇(2BE)。该溶液在冰上保温30分钟。然后将其 以10,000xg在0℃离心10分钟,小心收集上清液。加入1.0体积的2BE 并在冰上再保温30分钟后,将上清以10,000xg在0℃下再次离心10分 钟。用缓冲液A∶2BE(1∶1 v/v)轻轻洗涤所得的沉淀,然后用70%(v/v)轻 轻洗涤所得的沉淀,然后用70%(v/v)乙醇,0.1M乙酸钾洗涤,最后用 95%乙醇洗涤。沉淀在空气中干燥并溶于1ml焦碳酸二乙酯(DEPC)处理 的水中。将它调至3M氯化锂,在冰上放置60分钟并以10,000xg在0℃ 下离心10分钟。沉淀用3M LiCl洗涤2次,然后用70%乙醇,0.1M乙 酸钾洗涤。
所得的RNA沉淀溶于400μl DEPC处理的水中并用等体积的酚/氯 仿抽提。将RNA混合物以10,000xg在20℃下离心5分钟,收集水相并 调节至0.1M乙酸钠,再加入2.5体积的95%乙醇。在冰上保温30分钟 后,混合物以13,000rpm(5,000xg)在20℃离心20分钟,RNA沉淀轻轻 重悬于400μl DEPC处理的水中。
按照厂家方案以Oligotex dT-30(Takara,日本)从总RNA中选择 Poly(A)+RNA。根据Brugliera等(1994)的方法合成cDNA并用于在 λZAP II(Stratagene)的EcoR I位点中构建非定向花瓣cDNA文库。获 得的重组子的总数为3.5×105个。
转染XL 1-Blue细胞后,将包装的cDNA混合物以每15cm直径 平板50,000pfu涂板。平板在37℃下培养8小时。噬菌体在100mM NaCl,8mM MgSO4,50mM Tris-HCl pH8.0,0.01%(w/v)明胶〔噬菌体 贮存缓冲液(PSB)〕(Sambrook等,1989)中洗脱。加入氯仿并将噬菌体 在4℃贮存作为扩增的文库。
将200,000pfu扩增文库在转染XL1-BlueMRF′细胞后以每15cm 平板10,000pfu的密度涂布到NZY平板(Sambrook等,1989)上,并在 37℃下培养8小时。在4℃培养过夜后,取二份转移到Colony/Plaque ScreenTM滤膜(DuPont)上(标记的A组和B组)并按厂家建议处理。 筛选Kardinal cDNA文库中的F3′H cDNA克隆
杂交前,将2份噬菌斑转移膜在预洗溶液(50mM Tris-HCl pH7.5, 1M NaCl,1mM EDTA,0.1%w/v)肌氨酸)中65℃洗30分钟,在0.4M氢 氧化钠中65℃变性30分钟;然后在0.2M Tris-HCl pH8.0,0.1× SSC,0.1%(w/v)SDS溶液中65℃洗30分钟并最后在2×SSC,1.0% (w/v)SDS中漂洗。
32P标记的来自pCGP1805的含矮牵牛属Ht1(OGR-38)cDNA 克隆的NcoI片段筛选Kardinal cDNA文库的2份转移膜的A组滤膜, 而用32P标记的来自pCGP 246的含金鱼草属F3′H克隆的EcoR I/Ssp I 片段筛选B组转移膜。
杂交条件包括在10%(v/v)甲酰胺,1M NaCl,10%(w/v)硫酸葡聚 糖,1%(w/v)SDS中42℃至少1小时的预杂交步骤。然后将32p标记的 片段(2×106cmp/ml)加入杂交溶液中并在42℃继续杂交16小时。然后 转移膜在42℃下在2×SSC,1%(w/v)SDS中洗涤2小时,然后以1 ×SSC,1%(w/v)SDS洗涤1小时,最后在0.2×SSC/1%(w/v)SDS 中洗涤2小时。将滤膜用具有增感屏的Kodak XAR胶片于-70℃下曝 光16小时。
将4个强烈杂交的噬菌斑(R1,R2,R3,R4)挑入PSB中并再次 筛选以分离纯化的噬菌斑。提取包含于λZAP噬菌体载体中的质粒并用 EcoR I消化以释放cDNA***片段。克隆R1含1.0kb的***片段而克 隆R2,R3和R4各含大约1.3kb的***片段。从R4cDNA***片段的 3′和5′端产生序列数据。
比较玫瑰R4推测的F3′H序列与矮牵牛属OGR-38F3′H序列。 在核苷酸水平上,R4cDNA克隆在5′端的389个核苷酸中及在3′端的 330个核苷酸中分别显示出63.2%和62.1%的相似性。在氨基酸水平上, R4克隆在5′端的130个氨基酸中和在3′端的69个氨基酸中分别显示出 65.4%和73.9%的相似性。根据玫瑰R4cDNA克隆与矮牵牛属F3′H cDNA克隆(OGR-38)的高度序列相似性,按下面实施例25所述分离了 相应的“全长”cDNA克隆。
实施例25分离全长玫瑰F3′H cDNA
为了从玫瑰分离“全长”F3′H cDNA克隆,用上述玫瑰R4cDNA 克隆的32p标记的片段筛选实施例24所述的Rosa hybrida变种Kordinal 花瓣的cDNA文库。
在转染XL1-Blue MRF′细胞后、将总共1.9×106pfu的扩增文 库以每15cm直径平板100,000pfus的密度涂布到NZY平板上,并在37 ℃培养8小时。4℃培养过夜后,取2份转移到Colony/Plaque ScreenTM滤膜(DuPont)上并按厂家建议处理。
筛选Kardinal cDNA文库中的全长F3′H cDNA克隆
杂交前,按实施例24所述处理二份噬菌斑转移膜。
用32p标记的来自玫瑰R4cDNA克隆的EcoRI片段筛选来自 Kardinal cDNA文库的二份转移膜。
杂交条件包括在50%(v/v)甲酰胺,1M NaCl,10%(w/v)硫酸葡聚 糖,1%(w/v)SDS中42℃下至少1小时的预杂交步骤。然后向杂交溶 液中加入32p标记的玫瑰cDNA克隆的片段(1×106cpm/ml)并在42℃ 下继续杂交16小时。然后在2×SSC,1%(w/v)SDS中42℃下洗涤滤 膜2×1小时并用具有增感屏的柯达XAR胶片在-70℃曝光16小时。
将73个强杂交噬菌斑(1-73)挑入1ml PSB中并在4℃贮存过夜。 然后将各100μl的等份按顺序排列分配进微滴定盘中。
将XL1-Blue MRF′细胞加入10ml熔化的NZY顶级琼脂中,例 在NZY平板(15cm直径)上使其固着。使用重复的涂布装置将73个噬菌 体分离株按顺序排列转移到以前用XL1-Blue MRF′细胞接种的NZY 平板上。37℃培养6小时,接着4℃过夜后,取三份(1,2和3列)转移 到Colony/Plaque ScreenTM滤膜(DuPont)上并按厂家建议处理。
杂交前,按实施例24所述处理二份噬菌斑转移膜。
32p标记的a)含有玫瑰R4cDNA克隆5′端的Eco RI/SalI片段, b)含有玫瑰R4cDNA克隆5′端的EcoRI/ClaI片段或c)完整的玫瑰R4 cDNA克隆的EcoRI片段筛选3列,其中使用上述杂交和洗涤条件,除 了最后一次洗涤是在0.1×SSC,0.1%(w/v)SDS中65℃30分钟。将 滤膜用具有增强屏的柯达XAR胶片于-70℃曝光16小时。
73个噬菌斑均与全长R4cDNA克隆(EcoR I片段)杂交,而总共仅 17个噬菌斑与R4cDNA克隆5′端(EcoR I/Sal I或EcoR I/Cla I片段)杂 交。按上述再筛选17个噬菌斑分离株以分离纯化的噬菌斑。纯化噬菌斑 从17个中的9个(2,4,26,27,34,38,43,44,56)中获得。 提取包含于λZAP噬菌体载体中的质粒,并使用EcoR I消化测定cDNA ***片段的大小。cDNA***片段大小从0.9kb到1.9kb。在9个噬菌斑 中,仅#34(命名为pCG2158)和#38(命名为pCG2159)含大约1.9kb的 cDNA***片段。序列数据从cDNA***片段的3′和5′端得到且表明克 隆#34和#38代表相同的基因。
经过编辑使用产生随机重叠克隆的标准方法(Sambrook等,1989) 获得的不同pUC18亚克隆的序列测定包含于质粒pCG2158中的玫瑰 cDNA克隆(#34)的完整序列。该序列(SEQ ID NO:14)包含了1696个碱 基的开放阅读柜,它编码520个氨基酸(SEQ ID NO:15)的推测多肽。
比较了玫瑰F3′H#34cDNA克隆的核苷酸和预期的氨基酸序列 (SEQ ID NO:14和SEQ ID NO:15)与矮牵牛属OGR-38F3′H cDNA克隆(SEQ ID NO:1和SEQ ID NO:2)及金鱼草属sdF3′H克 隆(SEQ ID NO:5和SEQ ID NO:6)的序列。玫瑰F3′H#34cDNA 克隆与矮牵牛属OGR-38cDNA克隆在1651个核苷酸中显示出64.7 %的相似性,在509个氨基酸中显示出7217%的相似性,与金鱼草属 dF3′H克隆在1507个核苷酸上显示出67.2%的相似性,在502个氨基酸 上显示出68.9%的相似性。
本说明书中已公开的矮牵牛属,石竹属,金鱼草属,拟南芥属,玫 瑰,菊和蝴蝶草属序列的序列排列及核苷酸和相应氨基酸序列间的序列 相似性比较的各种总结分别见表7和表8,9,10,11和12。这些表 见实施例34,在说明书结尾处。
实施例26玫瑰F3′H cDNA克隆(#34)在矮牵牛属花瓣中的稳定表 达-ht1/ht1矮牵牛属栽培品种的互补
pCGP2166的制备
通过将来自pCGP2158的cDNA***片段以“有义”方向克隆到 pCGP293(Brugliera等,1994)的Mac启动子(Comai等,1990)之 后构建质粒pCGP2166(图16)。用EcoR I消化质粒pCGP2158以释 放cDNA***片段,使用DNA聚合酶(Klenow片段)(Sambrook等, 1989)补平伸出的5′端。分离cDNA片段并与pCGP293双元载体补平 的BamH I端连接。经过对从庆大霉素抗性转化子分离的DNA进行限制 性酶分析确认该片段在pCGP 2166中的正确***。
按实施例9所述将双元载体pCGP2166导入根癌土壤杆菌菌株 AGL0细胞。然后使用pCGP2166/AGL0细胞转化Skr4×SW63矮牵牛 属植物(也在实施例9中描述)以试验相应于玫瑰#34cDNA克隆的基 因编码的酶的活性和稳性表达。
实施例27转基因植物表型分析
Skr4×SW63中的pCGP2166
导入的玫瑰F3′H cDNA在Skr4×SW63杂种中的表达对花色具有 显著的影响。非转基因对照的雄蕊组织为白色,而大多数转基因植物中 的相同组织为粉红色。另外,玫瑰F3′H cDNA在Skr4×SW63杂种中 的表达产生暗粉色(RHSCC#64C和74C)花冠,而在正常情况下, 它是淡紫色(RHSCC#75C)。颜色代码取自皇家园艺学会颜色图表 (RHSCC)。它们提供了描述观察到的颜色表型的一种可供选择的方 法。然而指定的数值应当作是对可见色的指南而不应当作是对可获得的 可能的颜色的限制。
酸水解的花提取物(见实施例11)在Forestal溶剂***(HOAc∶ 水∶HCl;30∶10∶3)(Markham,1982)中迁移。3′羟基化的类黄酮, 甲基花青素和栎皮黄酮很容易在转基因植物的花瓣中检测到。在非转基 因Skr4×SW63对照中仅检测到四羟基黄酮和少量二甲翠雀素。
3羟基花青苷,甲基花青素和类黄醇,栎皮黄酮在转基因Skr4× SW63/pCGP2166植物花瓣中的积累与在观察到的相同植物的花的粉红 和暗粉色相关。
pCGP2169的制备
经过将来自pCGP2158的cDNA***片段以“有义”方向克隆到 CaMV 35S启动子(Franck等,1980;Guilley等,1982)和OCS 终止子(De Greve等,1982)之间来制备双元构建体pCGP2169(图 17)。质粒pCGP1634含CaMV 35S启动子,由大肠杆菌uidA基因编 码的β-葡糖苷酸酶(GUS)报告基因(Jefferson等,1987)和pUC19 载体中的OCS终止子区。用Nco I/Xba I消化质粒pCGP2158以释放 cDNA***片段。还用Nco I/Xba I消化质粒pCGP1634以释放含 CaMV35S启动子和OCS终止子的骨架载体。分离这些片段并连接起来 以产生pCGP2167,随后用Pvu II消化质粒pCGP2167以释放含 CaMV35S启动子,玫瑰F3′H cDNA克隆和OCS终止子的表达元件。分 离该表达元件片段并与pWTT2132双元载体(DNA植物技术公司; Oakland,California)的Sma I末端连接以产生pCGP2169(图17)。
按实施例9所述将双元载体pCGP2169/AGL0细胞转化玫瑰植物以 减少3′羟基化类黄酮的量。
实施例28从菊分离推断的F3′H cDNA克隆
为了分离菊F3′H cDNA克隆,用32p标记的包含于pCGP1805中的 矮牵牛属Ht1cDNA克隆(OGR-38)片段筛选菊变种Red Minstral 花瓣cDNA文库。
从菊变种Red Minstral构建花瓣cDNA文库
使用TrizolTM试剂(Life Technologies)(Chomczynski和Sacchi, 1987)根据厂家建议从菊变种Red MTnstral的花瓣(阶段3至5)制 备总RNA。使用依赖于oligo-(dT)的亲和旋转柱色谱的mRNA分离试剂 盒(Pharmacia)从总RNA富集Poly(A)+RNA。
使用SuperscriptTM cDNA合成试剂盒(Life Technologies)在 Ziplox中构建花瓣cDNA文库,其中使用5μg从Red Minstral阶段3至 5分离的poly(A)+RNA作模板。
转染Y1090r-后将30,000pfus的文库以每15cm平板3,000pfus的密 度涂布到LB平板(Sambrook等,1989)上,并在37℃下培养16小 时。在4℃下培养1小时后,取2份转移到Hybond N+TM滤膜 (Amersham)上并按厂家建议处理。
筛选Red Minstral cDNA文库
32p标记的来自pCGP1805的1.8kb Asp718/BamHI***片段筛 选来自Red Minstral花瓣cDNA文库的二份转移膜。
杂交条件包括在1mM EDTA(pH8.0),0.5M Na2HPO4(pH7.2),7% (w/v)SDS(Church和Gilbert,1984)中65℃下至少1小时的预杂交步 骤。然后将32P标记的片段(1×106cpm/ml)加入杂交溶液中并在65 ℃下继续杂交16小时。滤膜在2×SSC,0.1%(w/v)SDS中65℃下洗 涤2×1小时,并用具有增感屏的柯达BioMaxTM胶片在-70℃下曝光 48小时。
将8个强烈杂交的噬菌斑挑入PSB(Sambrook等,1989)中。 其中,对2个(RM6i和RM6ii)进行再筛选以分离纯化的噬菌斑,其 中所用的杂交条件如对cDNA文库的起始筛选所述。根据厂家方法提取 包含于λZiplox噬菌体载体中的质粒,序列数据从cDNA***片段的3′ 和5′端产生。比较RM6i和RM6ii cDNA***片段的部分序列与矮牵牛 属OGR-38F3′H cDNA克隆的完整序列。RM6i cDNA克隆与矮牵牛 属OGR-38cDNA克隆表现出相当高的序列相似性,且对其进行进一 步的鉴定。
Eco RI消化释放包含于pCHRM1中的RM6i cDNA***片段, 该片段大约为1.68kb。通过编辑来自RM6i cDNA***片段的亚克隆的 序列测定包含于质粒pCHRM1中的RM6i cDNA克隆的完整序列(SEQ ID NO:16)。
比较菊RM6i cDNA***片段的核苷酸和预期的氨基酸序列(SEQ ID NO:16和SEQ ID NO:17)与矮牵牛属OGR-38F3′H cDNA克隆 的序列(SEQ ID NO:1和SEQ ID NO:2)。菊RM6i cDNA***片段 的序列与矮牵牛属OGR-38F3′H cDNA克隆在1532核苷酸上显示出 68.5%的相似性,在511个氨基酸上显示出73.6%的相似性。
在本说明书中已公开的矮牵牛属,石竹属,金鱼草属,拟南芥属, 玫瑰,菊和蝴蝶草属序列的序列排列和核苷酸及相应氨基酸序列间序列 相似性比较的各种总结分别见表7和表8,9,10,11和12。这些表 见实施例34,在说明书结尾处。
pLN 85(反义双元载体)的构建
经过将来自pCHRM1的RM6i cDNA***片段以“反义”方向克 隆到包含于pART7(Gleave 1992)中的完整CaMV35S启动子之后来构建 命名为pLN 84的质粒。用NotI消化质粒pCHRM1以释放cDNA*** 片段。使用T4DNA聚合酶(Sambrook等,1989)补平RM6i cDNA 片段并经过琼脂糖凝胶电泳和GELase(Epicentre Technologies)纯化。纯 化的片段与pART7穿梭载体Sma I末端连接以产生pLN 84。随后用 NotI消化质粒pLN 84以释放含CaMV35S:RM6icDNA:ocs的表达 元件。分离该表达元件的单一片段并与pART27双元载体(Gleave, 1992)的NotI端连接以产生pLN 85(图18)。经过对从链霉素抗性 大肠杆菌转化子分离的DNA进行限制性酶分析确认该片段的正确插 入。
经过Ledger等1991所述的土壤杆菌属介导的转化将双元载体pLM 85导入菊植株中以降低3′-羟基化类黄酮的量。
实施例29从蓝猪耳分离推断的F3′H cDNA克隆
为了分离蝴蝶草属F3′H cDNA克隆,使用包含于pCGO1805中的 矮牵牛属Ht1连锁的F3′H cDNA克隆(OGR-38)在低度严格条件 下筛选蓝猪耳变种Summer Wave花瓣cDNA文库。
蓝猪耳变种Summer Wave花瓣cDNA文库的构建
基本上按实施例4所述从Summer Wave花制备定向花瓣cDNA文 库。
筛选Summer Wave花瓣cDNA文库
用DIG标记的来自pCGP1805的1.8kb OGR-38cDNA***片段 筛选总共200,000个扩增的Summer Wave花瓣cDNA文库的转移膜。根 据厂家建议使用来自Boehringer-Mannheim的DIG DNA标记和检测试 剂盒。
杂交在30%(v/v)甲酰胺,5×SSC,1%(w/v)SDS中37℃ 下进行16小时。然后将滤膜在5×SSC,1%(w/v)SDS中65℃下 洗涤1小时。根据DIG DNA标记和检测试剂盒的方法观察该信号。
将12个强烈杂交的噬菌斑挑进PSB中,并再次筛选以分离纯化的 噬菌斑。提取包含于λZAPII噬菌体载体中的质粒并用EcoR I/Xho I消化 以释放DNA***片段。一个克隆,即THT52含有最长的5′非编码区序 列。经过编辑使用产生随机重叠克隆的标准方法(Sambrook等1989) 获得的不同pUC18亚克隆的序列测定包含于质粒pTHT52中的蝴蝶草属 cDNA克隆(THT52)的完整序列。该序列(SEQ ID NO:18)包含有 1524个碱基的开放阅读框架,它编码有508个氨基酸的推断的多肽 SEQ ID NO:19)。
比较了蝴蝶草属THT52cDNA克隆的核苷酸和预期的氨基酸序列 (SEQ ID NO:18和SEQ ID NO:19)与矮牵牛属OGR-38F3′H cDNA克隆的序列(SEQ ID NO:1和SEQ IDNO:2)。蝴蝶草属THT52 cDNA克隆与矮牵牛属OGR-38cDNA克隆在1694个核苷酸中有63.6 %的相似性,在515个氨基酸中有67.4%的相似性。
在本说明书中已公开的矮牵牛属,石竹属,金鱼草属,拟南芥属, 玫瑰,菊和蝴蝶草属序列的序列排列及核苷酸和相应氨基酸序列间序列 相似性比较的各种总结分别见表7和表8,9,10,11和12。这些表 见实施例34,在本说明书的结尾处。
实施例30在酵母中表达的蝴蝶草属THTcDNA克隆的F3′H测定 pYTHT6的构建:
经过将来自pTHT6的cDNA***片段以“有义”方向克隆到 pYE22(Tanaka等,1988)的酵母甘油醛-3-磷酸脱氢酶启动子之后来 构建质粒pYTHT6(图19)。质粒pTHT6含THT6cDNA克隆。THT6 与THT52相同,除了其5′非编码区少了75bp外。
经过用EcoR I/Xho I消化从质粒pTHT6释放1.7kb的THT6cDNA ***片段。分离THT6cDNA片段,纯化并与pYE22m的Eco RI/Sal I 末端连接以产生pYTHT6。
酵母转化,酵母抽提物的制备和F3′H测定在实施例6中描述。
在G1315/pYTHT6提取物中检测到F3′H活性,而在非转基因酵母 的提取物中检测不到。从此可推断包含于pYTHT6中的THT6cDNA插 入片段编码F3′H。
实施例31从大花牵牛(日本牵牛花)分离推断的F3′H cDNA克隆
为了分离牵牛花F3′H cDNA克隆,使用包含于pCGP1805中的矮 牵牛属Ht1连锁的F3′H cDNA克隆(OGR-38)在低等严格条件下 筛选日本牵牛花花瓣cDNA文库。
构建日本牵牛花花瓣cDNA文库
从Dr Iida(国家基础生物学研究所,日本)获得来自大花牵牛(日 本牵牛花)早期花瓣的花瓣cDNA文库。
筛选日本牵牛花花瓣cDNA文库
用DIG标记的来自pCGP1805的1.8kb OGR-38cDNA***片段的 片段筛选总共200,000个扩增的日本牵牛花花瓣cDNA文库的转移膜。 根据厂家建议使用来自Boehringer-Mannheim的DIG DNA标记和检测 试剂盒。
杂交在30%(v/v)甲酰胺,5×SSC,1%(w/v)SDS中37 ℃进行16小时。然后在5×SSC,1%(w/v)SDS中65℃下洗涤滤 膜1小时。按DIG DNA标记和检测试剂盒的方案观察信号。
将20个强烈杂交的噬菌斑挑进PSB中并再次筛选以分离纯化的噬 菌斑。提取包含于λZAP II噬菌体载体中的质粒并用EcoR I/Xho I消化 以释放cDNA***片段。一个克隆(MHT85)含有1.8kb的***片段。 通过编辑使用产生随机重叠克隆的标准方法(Sambrook等,1989)获 得的不同pUC18亚克隆的序列测定包含于质粒pMHT85中的日本牵牛 花cDNA克隆(MHT85)的完整序列(SEQ ID NO:20)。MHT85 序列似乎比“全长”短5个碱基。
比较日本牵牛花MHT85cDNA克隆的核苷酸和预期的氨基酸序列 (SEQ ID NO:20和SEQ ID NO:21)与矮牵牛属OGR-38F3′H cDNA克隆的序列(SEQ ID NO:1和SEQ ID NO:2)。日本牵牛花 MHT85cDNA克隆与矮牵牛属OGR-38cDNA克隆在869个核苷酸上 显示出69.6%的相似性,在515个氨基酸上显示出74.8%的相似性。
本说明书已公开的矮牵牛属,石竹属,金鱼草属,拟南芥属,玫瑰, 菊和蝴蝶草属序列的序列排列及核苷酸和相应氨基酸序列间的序列相似 性的比较的各种总结分别见表7和表8,9,10,11和12。这些表见 实施例34,在说明书结尾处。
实施例32从三花龙胆分离推断的F3′H cDNA克隆
为了分离龙胆F3′H cDNA克隆,使用包含于pCGP1805中的矮牵 牛属Ht1连锁的F3′H cDNA克隆(OGR-38)在低度严格条件下筛 选三花龙胆Pall变种japonica Hara花瓣cDNA文库。
构建龙胆花瓣cDNA文库
按Tanaka等,1996所述从三花龙胆Pall变种japonica Hara花制 备花瓣cDNA文库。
龙胆花瓣cDNA文库的筛选
用DIG标记的来自pCGP1805的1.8kb OGR-38cDNA***片段 的片段筛选总共200,000个扩增的龙胆花瓣cDNA文库的转移膜。根据 厂家建议使用来自Boehringer-Mannheim的DIG DNA标记和检测试剂 盒。
杂交在30%(v/v)甲酰胺,5×SSC,1%(w/v)SDS中37 下进行16小时。然后在5×SSC,1%(w/v)SDS中65℃下洗涤滤 膜1小时。按DIG DNA标记和检测试剂盒的方案观察信号。
将15个强烈杂交的噬菌体挑入PSB中并再次筛选以分离纯化的噬 菌斑。提取包含于λZAP II噬菌体载体中的质粒并用EcoR I/Xho I消化 以释放cDNA***片段。一个克隆(GHT 13)含有1.8kb的***片段。 经过编辑使用产生随机重叠克隆的标准方法(Sambrook等,1989)获 得的不同pUC18亚克隆的序列测定包含于质粒pGHT13中的部分龙胆 cDNA克隆(GHT13)的序列(SEQ ID NO:22)。
比较龙胆GHT13 cDNA克隆的核苷酸和预期的氨基酸序列(SEQ ID NO:22和SEQ ID NO:23)与矮牵牛属OGR-38F3′H cDNA克隆 的序列。龙胆GHT13cDNA克隆与矮牵牛属OGR-38cDNA克隆在 1519个核苷酸中有68.3%的相似性,在475个氨基酸中有71.8%的相似 性。
在本说明书中已公开的矮牵牛属,石竹属,金鱼草属,拟南芥属, 玫瑰菊和蝴蝶草属序列的序列排列及核苷酸和相应氨基酸序列间的序列 相似性比较的各种总结分别见表7和表8,9,10,11和12。这些表 见实施例34,在说明书结尾处。
实施例33从Lisianthus分离推断的F3′H cDNA克隆
为了分离LisianthusF3′H cDNA克隆,使用包含于pCGP1805中 的矮牵牛属Ht1连锁的F3′HcDNA克隆(OGR-38)在低度严格条 件下筛选Lisianthus花瓣cDNA文库。
构建和筛选Lisianthus花瓣cDNA文库
将Davies等(1993)和Markham和Offman(1993)所述的 10,000pfus Lisianthus花瓣cDNA文库在转染Y1090r-后以每15cm平板 3,000pfu的密度涂布到LB平板(Sambrook等,1989)上,在37℃下 培养16小时。在4℃放置1小时后,取二份转移到Hybond N+TM滤膜 (Amersham)上并接厂家建议进行处理。
32P标记的来自pCGP1805的1.8kb Asp718/BamHI***片段筛 选来自Lisianthus品系#54花瓣cDNA文库的二份转移膜。
杂交杂件包括在1mM EDTA(pH8.0),0.5M Na2HPO4(pH7.2),7% (w/v)SDS(Church和Gilbert,1984)中55℃下至少1小时的预杂交步 骤。然后向杂交溶液中加入32p标记的片段(1×106cpm/ml),杂交在 55℃下继续16小时。滤膜在2×SSC,0.1%(w/v)SDS中55℃下洗 涤2×15分钟,并用具有增感屏的柯达BioMaxTM胶片在-70℃下曝 光18小时。
将12个强烈杂交的噬菌斑挑进PSB(Sambrook等,1989)中并 使用对cDNA文库起始筛选所述的杂交条件再次筛选以分离纯化的噬菌 斑。序列数据从四个克隆的cDNA***片段的3′和5′端产生。
根据序列比较,pL3-6与矮牵牛属OGR-38F3′H cDNA克隆 显示出相似性且对其进行进一步的鉴定。
随后发现包含于pL3-6中的2.2kb cDNA***片段含有3个截短的 cDNA克隆,最长的一个(L3-6)与矮牵牛属OGR-38cDNA序列 具有高度序列相似性。经过编辑L3-6cDNA***片段(SEQ ID NO: 24)的亚克隆序列测定包含于质粒pL3-6中的该L3-6部分cDNA 克隆的序列。
比较了Lisianthus L3-6cDNA克隆的核苷酸和预期的氨基酸序列 (SEQ ID NO:24和SEQ ID NO:25)与矮牵牛属OGR-38F3′H cDNA克隆的序列在1087个核苷酸中有71.4%的相似性,在362个氨基 酸中有74.6%的相似性。
在本说明书中已公开的矮牵牛属,石竹属,金鱼草属,拟南芥属, 玫瑰,菊和蝴蝶草属序列的序列排列及核苷酸和相应氨基酸序列间的序 列相似性比较的各种总结分别见表7和表8,9,10,11和12。这些 表见实施例34,在说明书结尾处。
对从Lisianthus文库的筛选分离的剩余克隆的进一步研究鉴定了另 一个推断的F3′H cDNA克隆(L3-10),它包含于质粒pL3-10中。 L3-10cDNA***片段大约1.8kb长且似乎代表“全长”克隆。
实施例34本文公开的核苷酸和氨基酸序列间的序列排列和对比
使用实施例3所述的Clustal W程序进行多序列排列。表7(下面) 提供了矮牵牛属OGR-38(A);石竹属(B);金鱼草属(C); 拟南芥属Tt7编码区(D);玫瑰(E),菊(F);蝴蝶草属(G); 牵牛花(H);龙胆(部分序列)(I);Lisianthus(部分序列)(J) 和矮牵牛属651cDNA(K)的预期的氨基酸序列的多序列排列。保守 的氨基酸以黑体大写字母和方框及阴影表示。相似氨基酸以大写字母表 示且仅有轻微的阴影。不相似的氨基酸以小写字母表示。
使用实施例3所示的LFATA程序比较来自上述种类的F3′H cDNA 克隆的核苷酸和氨基酸序列和来自拟南芥属基因组克隆的编码区。相似 性比较的总结在下文表8中至12中提供。
表7
  i
  ii
  iii
iv
v
Figure G2009100097468D0000731
Figure G2009100097468D0000741
Figure G2009100097468D0000751
Figure G2009100097468D0000761
Figure G2009100097468D0000771
表8
矮牵牛属OGR-38的F3′H序列与来自其它种类的F3′H序列及 其它P450分子的序列相似性的百分数
Figure G2009100097468D0000781
Figure G2009100097468D0000791
表9
金鱼草属F3′H序列与其它种类的F3′H序列及其它P450分子间序 列相似性百分数
Figure G2009100097468D0000801
表10
拟南芥属F3′H序列与其它种类的F3′H序列及其它P450分子间的 序列相似性百分数
表11
玫瑰F3′H序列和其它种类的F3′H序列及其它P450分子间的序列 相似性的百分数
Figure G2009100097468D0000821
表12
拟南芥属tt7基因组序列的编码区与其它种类的F3′H cDNA序列及 其它P450分子间的序列相似性百分数
本领域的技术人员将会预料到本文描述的本发明可容许在具体描述 的内容外做出一些变化和修改。应理解本发明也包括所有这些变化和修 改。本发明还包括在本说明书中单独或集中提及的或表示的所有步骤、 特征,组合物和化合物和任意2个或多个所说的步骤或特征的任意和全 部组合。
参考文献
Altschul,S.F.,Gish,W.,Miller.W.,Myers,E.W.和Lipman,D.J. 分子生物学杂志215:403-410,1990。
Ashikari,T.,Kiuchi-Goto,N.,Tanaka,Y.,Shibano,Amachi,T., 和Yoshizumi,H.应用微生物学生物技术30:515-520,1989。
Baird,W.V.和Meagher,R.B.EMBO J.6,3223-3231,1987。
Bechtold,N.,Ellis,J.和Pelletier,G.C.R.Acad.Sci.Paris,科学de la vie 316:1194-1199,1993。
Bethesda研究实验室。BRL pUC宿主:大肠杆菌DH5αTM感受态 细胞Bethesda Res.Lab.Focus.8(2):9,1986.
Brugliera,F.,Holton,T.A.,Stevenson,T.W.,Farcy,E.,Lu,C-Y和 Cornish,E.C.植物杂志5(1):81-92,1994。
Church,G.M.和Gilbert,W.PNAS USA,81:1991-1995.
Chomczynski,P.和Sacchi,N.生化年鉴162:156-159.
Comai,L.,Moran,P.和Maslyar,D.,植物分子生物学15:373-381, 1990.
Cornu,A.,Farcy,E.,Maizonnier,D.,Haring,M.,Veerman,W.和 Gerats,A.G.M.,在:遗传学图谱-复合基因组的基因座图谱.第5版, Stephen J.O′Brien(ed.),冷泉港实验室出版社,美国,1990.
Davies等,植物科学,95:67-77.1993.
D′Alessio等,焦点,14:76-79,1992
De Greve,H.,Dhaese,P.,Seurinck,J.,Lemmers,M.,Van Montagu,M和Schell.J.分子应用遗传学。1:499-511.
Dellaporta,S.J.,Wood,J.和Hick,J.B.,植物分子生物学报道, 1:19-21,1983.
Del Sal,G.,Manfioletti,G.和Schneider,C.生物技术。7(5): 514-519,1989.
Doodeman,M.,Gerats,A.G.M.,Schram,A.W.,De Vlaming,P. 和Bianchi,F.,理论和应用遗传学。67:357-366,1984.
Dooner,H.K.,Robbins,T.R.和Jorgensen,R.A.遗传学年鉴。25: 173-199,1991.
Ebel,J.and Hahlbrock,K.,于:类黄酮:1980以来的研究进展。
Harbourne,J.B.,(ed.),学术出版社,New York,USA,641-679, 1988.
Forkmann,G.and Stotz,G.Z.Naturforsch.36c:411-416,1981. Forkmann,G.植物培育106:1-26,1991.
Franck,A.,Guilley,H.,Jonard,G.Richards,K和Hirth,L.细 胞,21,285-294,1980.
Frohman,M.A.,Dush,M.K.,Martin,G.R.美国国家科学院院报。 85:8998-9002,1988.
Gamborg,O.L.,Miller,R.A.和Ojima,K.,细胞研究实验50:151- 158,1968.
Garfinkel,D.J.,和Nester,E.W.细菌学杂志。144:732-743,1980.
Gleave,A.P.植物分子生物学20:1203-1207,1992.
Guilley,H.,Dudley,R.K.,Jonard,G.,Balazs,E.和Richards,K.E. 细胞,30,763-773,1982.
Hahlbrock,K.和Grisebach,H.,植物生理学年鉴。30:105-130, 1979.
Hanahan,D.,分子生物学杂志。166:557,1983.
Haughn,G.W.和Somerville,C.分子和普通遗传学204:430-434, 1986.
Holton,T.A.,Brugliera,F.Lester,D.R.,Tanaka,Y.,Hyland,C.D., Menting,J.G.T.,Lu,C.,Farcy,E.,Stevenson,T.W.和Cornish,E.C.,自 然,366,276-279,1993.
Holton,T.A.和Cornish,E.C.植物细胞,7:1071-1083,1995.
Inoue,H.,Nojima,H.and Okayama,H.基因,96:23-28,1990.
Ito.H.,Fukuda,Y.,Murata,K.和Kimura,A.细菌学杂志153: 163-168,1983.
Jefferson,R.A.植物分子生物学报道。5:387-405,1987.
Jefferson,R.A.,Kavanagh,T.A.,和Bevan,M.W.EMBO J.6: 3901-3907,1987
Koornneef,M,Luiten,W.,de Vlaming,P.和Schram.A.W. Arabidopsis Information Service 19:113-115,1982.
Kozak,M.细胞生物学杂志。108:229,1989.
Lander,E.S.,Green,P.,Abrahamson,J.,Barlow,A.,Day,M.J., Lincoln.S.E.和Newberg,L.基因组,121,185-199,1987.
Lazo,G.R.,Pascal,A.S.和Ludwig,R.A.,生物/技术,9:963-967, 1991.
Ledger,S.E.,Delores,S.C.和Given,N.K.植物细胞报道,10:195- 199,1991.
Liang,P.和Pardee,A.B.科学,257:967-971,1992
Liang,P.,Averboukh,L.和Pardee,A.B.核酸研究,21:3269-3275, 1993
Marchuk,D.,Drumm,M.,Saulino,A.,Collins,F.S.核酸研究。19: 1154,1990
Markham,K.R.,类黄酮鉴定技术。伦敦:学术出版社,1982.
Markham,K.R和Offman,D.J.植物化学.,34:679-685.
Martin,C.和Gerats,T.在:开花的分子生物学。(Jordan,B.R.ed), UK,CAB International,219-255,1993.
McLeaan,M.,Gerats,A.G.M.,Baird,W.V.and Meagher,R.B.遗传 杂志81:341-346,1990.
Merrifield,美国化学协会杂志。85:2149,1964.
Mizutani,M.,Ward.E.,DiMaio,J.,Ohta,D.,Ryals,J.和Sato,R. Biochem.Biophys.Res.Commun.190:875-880,1993.
Murashige,T.和Skoog,F.,植物生理学,15:73-97,1962.
Newman,T.,de Bruijn,F.J.,Green,P.,Keegstra,K.,Kende,H., McIntosh,L.,Ohlrogge,J.,Raikhel,N.,Somerville,S.,Thomashow,M. 植物生理学。106:1241-1255,1994.
Pearson,W.R.和Lipman,D.J.,美国国家科学院院报85:2444- 2448,1988.
Sambrook,J.,Fritsch,E.F.和Maniatis,T.分子克隆:实验室手册 (第二版),冷泉港实验室出版社,美国,1989.
Schenk,R.U.和Hilderbrandt,A.C.,Can.J.Bot.50:199-204,1972.
Schram,A.W.,Jonsson,L.M.V.和Bennink,G.J.H.,矮牵牛杂种中 的类黄酮合成的生物化学。In:矮牵牛库,K.C.(ed.),Springer-Verlag, Berlin,Germany,pp 68-75,1984。
Stafford,H.A.,类黄酮代谢。CRC出版社,Inc.Boca Raton, Florida,USA,1990.
Stota,G.和Forkmann,G.Z.Naturforsch 37c:19-23,1982.
Tabak,A.J.H.,Meyer,H.和Bennink,G.J.H.,植物139,67-71, 1978.
Tannaka,Y.,Ashikari,T.,Shibano,Y.,Amachi,T.,Toshizumi,H. 和Matsubara,H.J.生化杂志。103:954-961,1988.
Tanaka,Y.,Yonekura,K.,Fukuchi-Mizutani,M.,Fukui,Y., Fnjiwara,H.,Ashikari,T.和Kusumi,T.植物细胞生理学。37(5):711- 716,1996.
Turpen,T.H.和Griffith,O.M.生物技术,4:11-15,1986.
van Tunen A.J.,和Mol J.N.M.在:植物生物技术(Grierson,D.ed.) Glasgow:Blackie,2:9-31,1990.
Wiering,H.和de Vlaming,P.,色素的遗传和生物化学。In:Petunia Sink,K.C.(ed.),Springer-Verlag,Berlin,Germany,pp 49-65,1984.
Wallroth,M.,Gerats,A.G.M.,Rogers,S.G.,Fraley,R.T.和Horsch, R.B.,分子普通遗传学。202:6-15,1986.
本发明的优选实施方式如下:
1.一种分离的核酸分子,它含有编码类黄酮3′-羟化酶或其衍生物的 核苷酸序列,其中所述的类黄酮3′-羟化酶或其衍生物能比SEQ ID NO: 26所述的核苷酸序列编码的类黄酮3′-羟化酶更有效地调节类黄酮化合 物的羟化。
2.根据项目1所述的分离的核酸分子,含有对应于矮牵牛属中称为Ht1 或Ht2所述的遗传基因座或其它有花植物种类中含控制3′羟化类黄酮合成 的序列的基因座的核苷酸序列。
3.根据项目2所述的分离的核酸分子,含有基本上如SEQ ID NO:1所 述或具有与其至少60%相似性或能在低等严格条件下与SEQ ID NO:1所 述的序列杂交的核苷酸序列或其互补核苷酸序列并且为SEQ ID NO:1的 功能等同物。
4.根据项目2所述的分离的核酸分子,含有基本上如SEQ ID NO:3所 述的或具有与其至少60%相似性或能在低等严格条件下与SEQ ID NO:3 所述序列杂交的核苷酸序列或其互补核苷酸序列并且为SEQ ID NO:3的 功能等同物。
5.根据项目2所述的分离的核酸分子,含有基本上如SEQ ID NO:5所 述或具有与其至少60%的相似性或能与SEQ ID NO:5所述的序列在低等 严格条件下杂交的核苷酸序列或其互补核苷酸序列并且为SEQ ID NO:5 的功能等同物。
6.根据项目2所述的分离的核酸分子,含有基本上如SEQ ID NO:7所 述或具有与其至少60%的相似性或能与SEQ ID NO:7所述的序列在低等 严格条件下杂交的核苷酸序列或其互补核苷酸序列并且为SEQ ID NO:7 的功能等同物。
7.根据项目2所述的分离的核酸分子,含有基本上如SEQ ID NO:9所 述或具有与其编码序列至少60%的相似性或能与SEQ ID NO:9所述的序 列在低等严格条件下杂交的核苷酸序列或其互补核苷酸序列并且为SEQ ID NO:9的功能等同物。
8.根据项目2所述的分离的核酸分子,含有基本上如SEQ ID NO:14 所述或具有与其至少60%的相似性或能与SEQ ID NO:14所述的序列在 低等严格条件下杂交的核苷酸序列或其互补核苷酸序列并且为SEQ ID NO:14的功能等同物。
9.根据项目2所述的分离的核酸分子,含有基本上如SEQ ID NO:16 所述的或具有与其至少60%的相似性或能与SEQ ID NO:16所述的序列 在低等严格条件下杂交的核苷酸序列或其互补核苷酸序列并且为SEQ ID NO:16的功能等同物。
10.根据项目2所述的分离的核酸分子,含有基本上如SEQ ID NO:18 所述或具有与其至少60%的相似性或能与SEQ ID NO:18所述的序列在 低等严格条件下杂交的核苷酸序列或其互补核苷酸序列并且为SEQ ID NO:18的功能等同物。
11.根据项目2所述的分离的核酸分子,含有基本上如SEQ ID NO:20 所述或具有与其至少60%的相似性或能与SEQ ID NO:20所述的序列在 低等严格条件下杂交的核苷酸序列或其互补核苷酸序列并且为SEQ ID NO:20的功能等同物。
12.根据项目2所述的分离的核酸分子,含有基本上如SEQ ID NO:22 所述或具有与其至少60%的相似性或能与SEQ ID NO:22所述的序列在 低等严格条件下杂交的核苷酸序列或其互补核苷酸序列并且为SEQ ID NO:22的功能等同物。
13.根据项目2所述的分离的核酸分子,含有基本上如SEQ ID NO:24 所述或具有与其至少60%的相似性或能与SEQ ID NO:24所述的序列在 低等严格条件下杂交的核苷酸序列或其互补核苷酸序列并且为SEQ ID NO:24的功能等同物。
14.根据项目2所述的分离的核酸分子,含有编码或其互补于编码基本 上如SEQ ID NO:2所述的氨基酸序列或具有与其至少50%的相似性的氨 基酸序列的核苷酸序列并且为SEQ ID NO:2的功能等同物。
15.根据项目2所述的分离的核酸分子,含有编码或其互补于编码基本 上如SEQ ID NO:4所述的氨基酸序列或具有与其至少50%的相似性的氨 基酸序列的核苷酸序列并且为SEQ ID NO:4的功能等同物。
16.根据项目2所述的分离的核酸分子,含有编码或其互补于编码基本 上如SEQ ID NO:6所述的氨基酸序列或具有与其至少50%的相似性的氨 基酸序列的核苷酸序列并且为SEQ ID NO:6的功能等同物。
17.根据项目2所述的分离的核酸分子,含有编码或其互补于编码基本 上如SEQ ID NO:8所述的氨基酸序列或具有与其至少50%的相似性的氨 基酸序列的核苷酸序列并且为SEQ ID NO:8的功能等同物。
18.根据项目2所述的分离的核酸分子,含有编码或其互补于编码基本 上如SEQ ID NO:10或SEQ ID NO:11或SEQ ID NO:12或SEQ ID NO: 13所述的氨基酸序列或具有与其至少50%的相似性的氨基酸序列的核苷 酸序列并且为SEQ ID NO:10或SEQ ID NO:11或SEQ ID NO:12或SEQ ID NO:13的功能等同物。
19.根据项目2所述的分离的核酸分子,含有编码或其互补于编码基本 上如SEQ ID NO:15所述的氨基酸序列或具有与其至少50%的相似性的 氨基酸序列的核苷酸序列并且为SEQ ID NO:15的功能等同物。
20.根据项目2所述的分离的核酸分子,含有编码或其互补于编码基本 上如SEQ ID NO:17所述的氨基酸序列或具有与其至少50%的相似性的 氨基酸序列的核苷酸序列并且为SEQ ID NO:17的功能等同物。
21.根据项目2所述的分离的核酸分子,含有编码或其互补于编码基本 上如SEQ ID NO:19所述的氨基酸序列或具有与其至少50%的相似性的 氨基酸序列的核苷酸序列并且为SEQ ID NO:19的功能等同物。
22.根据项目2所述的分离的核酸分子,含有编码或其互补于编码基本 上如SEQ ID NO:21所述的氨基酸序列或具有与其至少50%的相似性的 氨基酸序列的核苷酸序列并且为SEQ ID NO:21的功能等同物。
23.根据项目2所述的分离的核酸分子,含有编码或其互补于编码基本 上如SEQ ID NO:23所述的氨基酸序列或具有与其至少50%的相似性的 氨基酸序列的核苷酸序列并且为SEQ ID NO:23的功能等同物。
24.根据项目2所述的分离的核酸分子,含有编码或其互补于编码基本 上如SEQ ID NO:25所述的氨基酸序列或具有与其至少50%的相似性的 氨基酸序列的核苷酸序列并且为SEQ ID NO:25的功能等同物。
25.一种能在植物中减少编码类黄酮3′羟化酶的内源性基因表达的基因 构建体,所述的基因构建体包含选自下列的核苷酸序列:
(i)编码SEQ ID NO:2,4,6,8,10,11,12,13,15,17,19,21, 23或25之一所述的氨基酸序列的核苷酸序列或其互补形式;
(ii)SEQ ID NO:1,3,5,7,14,16,18,20,22或24之一所述的 核苷酸序列或SEQ ID NO:9中的编码区或其互补形式:
(iii)具有与(i)或(ii)至少60%相似性的核苷酸序列;和
(iv)能在低等严格条件下与(i),(ii)和或(iii)杂交的核苷酸序列。
26.一种生产能合成类黄酮3′羟化酶或其功能性衍生物的转基因植物的 方法,所述的方法包含用含有编码所述的类黄酮3′羟化酶或其衍生物的核 苷酸序列的核酸分子在允许所述的核酸分子最终表达的条件下稳定地转 化合适植物的细胞,从该细胞再生转基因植物并在足以允许该核酸分子表 达的条件下让所述的转基因植物生长一段时间。
27.一种生产降低了内源性或现存类黄酮3′羟化酶活性的转基因植物的 方法,所述的方法包含用含有编码或其互补于编码类黄酮3′羟化酶或其衍 生物的核苷酸序列的核酸分子稳定地转化合适植物的细胞,从该细胞再生 转基因植物,并且,如果需要,在足以允许该核酸分子表达的条件下让所 述的转基因植物生长。
28.根据项目26或27所述的方法,其中导入的核酸分子含有选自下列 序列的核苷酸序列或其互补核苷酸序列:
(i)编码SEQ ID NO:2,4,6,8,10,11,12,13,15,17,19,21, 23或25之一所述的氨基酸序列的核苷酸序列或其互补形式;
(ii)SEQ ID NO:1,3,5,7,14,16,18,20,22或24之一所述的 核苷酸序列或SEQ ID NO:9的编码区或其互补形式;
(iii)具有与(i)或(ii)至少60%的相似性的核苷酸序列并且为所述序列 的功能等同物;和
(iv)能在低等严格条件下与(i),(ii)和/或(iii)杂交的核苷酸序列。
29.根据项目26或27的方法,其中受体植物选自矮牵牛属,石竹属, 菊,玫瑰,金鱼草属,烟草,矢车菊,天竺葵属,lisianthus,扶郎花属, 苹果,蝴蝶花,百合属,非洲紫罗兰和牵牛花。
30.一种生产能调节类黄酮化合物羟基化的转基因植物的方法,所述的 方法包括用含有编码或其互补于编码类黄酮3′羟化酶或其衍生物的核苷酸 序列的核酸分子稳定地转化合适植物的细胞或细胞团并从所述的细胞或 细胞团再生转基因植物。
31.根据项目30所述的方法,其中转化的核酸分子含有选自下列序列 的核苷酸序列:
(i)编码SEQ ID NO:2,4,6,8,10,11,12,13,15,17,19,21, 23或25之一所述的氨基酸序列的核苷酸序列或其互补形式;
(ii)SEQ ID NO:1,3,5,7,14,16,18,20,22或24之一所述的 核苷酸序列或SEQ ID NO:9的编码区或其互补形式;
(iii)具有与(i)或(ii)至少60%的相似性的核苷酸序列并且为所述序列 的功能等同物;和
(iv)能在低等严格条件下与(i),(ii)和/或(iii)杂交的核苷酸序列并且为 所述序列的功能等同物。
32.如项目1的含有编码类黄酮3′羟化酶的核苷酸序列的核酸分子在制 备能调节植物或植物细胞中类黄酮化合物羟基化的基因构建体中的用途。
33.根据项目32所述的用途,其中的核苷酸序列选自:
(i)编码SEQ ID NO:2,4,6,8,10,11,12,13,15,17,19,21, 23或25之一所述的氨基酸序列的核苷酸序列或其互补形式;
(ii)SEQ ID NO:1,3,5,7,14,16,18,20,22或24之一所述的 核苷酸序列或SEQ ID NO:9的编码区或其互补形式;
(iii)具有与(i)或(ii)至少60%的相似性的核苷酸序列并且为所述序列 的功能等同物;和
(iv)能在低等严格条件下与(i),(ii)和/或(iii)杂交的核苷酸序列并且为 所述序列的功能等同物
序列表
(1)基本信息:
(i)申请人:(除美国外):Florigene limited
(仅在美国):Filippa BRUGLIERA,Timothy Albert
Holton,Michael Zenon MICHAEL
(ii)发明名称:编码类黄酮途径酶的基因序列及其用途。
(iii)序列数目:40
(iv)联系地址:
(A)联系人:Davies Collison Cave
(B)街名:1 little collins street
(C)城市:MelBourne
(D)州名:Victoria
(E)国家:澳大利亚
(F)邮政编码(Zip):3000
(v)计算机可读形式:
(A)介质类型:Floppy软盘
(B)计算机:IBM PC兼容机
(C)操作***:PC-DOS/MS-DOS
(D)软件:PatentIn Release#1.0,Version#1.25.
(vi)目前申请资料:
(A)申请号:
(B)申请日:1997年2月28日
(C)分类:
(vii)在先申请资料:
(A)申请号:PN8386
(B)申请日:1996年2月28日
(C)分类:
(viii)律师/代理人信息:
(A)姓名:Hughes,Dr E.John L.
(C)参考/摘要号:EJH/AF.
(ix)电信信息:
(A)电话:+61392542777
(B)传真:+61392542770
(C)电报:AA 31787
(2)关于SEQ ID NO:1的信息
(i)序列特征
(A)长度:1789个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑结构:线型
(ii)分子类型:DNA
(ix)特征:
(A)名称/键:CDS
(B)位置:50..1586
(xi)序列描述:SEQ ID NO:1
GCAGGAATTG GTGAACCCCA TAGAAGTAAA ATACTCCTAT CTTTATTTC ATG GAA         55
                                                      Met Glu
                                                        1
ATC TTA AGC CTA ATT CTG TAC ACC GTC ATT TTC TCA TTT CTT CTA CAA       103
Ile Leu Ser Leu Ile Leu Tyr Thr Val Ile Phe Ser Phe Leu Leu Gln
          5                  10                  15
TTC ATT CTT AGA TCA TTT TTC CGT AAA CGT TAC CCT TTA CCA TTA CCA       151
Phe Ile Leu Arg Ser Phe Phe Arg Lys Arg Tyr Pro Leu Pro Leu Pro
     20                  25                  30
CCA GGT CCA AAA CCA TGG CCA ATT ATA GGA AAC CTA GTC CAT CTT GGA       199
Pro Gly Pro Lys Pro Trp Pro Ile Ile Gly Asn Leu Val His Leu Gly
 35                  40                  45                  50
CCC AAA CCA CAT CAA TCA ACT GCA GCC ATG GCT CAA ACT TAT GGA CCA       247
Pro Lys Pro His Gln Ser Thr Ala Ala Met Ala Gln Thr Tyr Gly Pro
                 55                  60                  65
CTC ATG TAT CTT AAG ATG GGG TTC GTA GAC GTG GTG GTT GCA GCC TCG         295
Leu Met Tyr Leu Lys Met Gly Phe Val Asp Val Val Val Ala Ala Ser
             70                  75                  80
GCA TCG GTT GCA GCT CAG TTC TTG AAA ACT CAT GAT GCT AAT TTC TCG         343
Ala Ser Val Ala Ala Gln Phe Leu Lys Thr His Asp Ala Asn Phe Ser
         85                  90                  95
AGC CGT CCA CCA AAT TCT GGT GCA GAA CAT ATG GCT TAT AAT TAT CAG         391
Ser Arg Pro Pro Asn Ser Gly Ala Glu His Met Ala Tyr Asn Tyr Gln
    100                 105                 110
GAT CTT GTT TTT GCA CCT TAT GGA CCT AGA TGG CGT ATG CTT AGG AAA         439
Asp Leu Val Phe Ala Pro Tyr Gly Pro Arg Trp Arg Met Leu Arg Lys
115                 120                 125                 130
ATT TGC TCA GTT CAC CTT TTC TCT ACC AAG GCT TTA GAT GAC TTC CGC         487
Ile Cys Ser Val His Leu Phe Ser Thr Lys Ala Leu Asp Asp Phe Arg 
                135                 140                 145
CAT GTC CGC CAG GAT GAA GTG AAA ACA CTG ACG CGC GCA CTA GCA AGT         535
His Val Arg Gln Asp Glu Val Lys Thr Leu Thr Arg Ala Leu Ala Ser
            150                 155                 160
GCA GGC CAA AAG CCA GTC AAA TTA GGT CAG TTA TTG AAC GTG TGC ACG         583
Ala Gly Gln Lys Pro Val Lys Leu Gly Gln Leu Leu Asn Val Cys Thr
        165                 170                 175
ACG AAC GCA CTC GCG CGA GTA ATG CTA GGT AAG CGA GTA TTT GCC GAC         631
Thr Asn Ala Leu Ala Arg Val Met Leu Gly Lys Arg Val Phe Ala Asp
    180                 185                 190
GGA AGT GGC GAT GTT GAT CCA CAA GCG GCG GAG TTC AAG TCA ATG GTG         679
Gly Ser Gly Asp Val Asp Pro Gln Ala Ala Glu Phe Lys Ser Met Val
195                 200                 205                 210
GTG GAA ATG ATG GTA GTC GCC GGT GTT TTT AAC ATT GGT GAT TTT ATT         727
Val Glu Met Met Val Val Ala Gly Val Phe Asn Ile Gly Asp Phe Ile
                215                 220                 225
CCG CAA CTT AAT TGG TTA GAT ATT CAA GGT GTA GCC GCT AAA ATG AAG         775
Pro Gln Leu Asn Trp Leu Asp Ile Gln Gly Val Ala Ala Lys Met Lys
            230                 235                 240
AAG CTC CAC GCG CGT TTC GAC GCG TTC TTG ACT GAT ATA CTT GAA GAG         823
Lys Leu His Ala Arg Phe Asp Ala Phe Leu Thr Asp Ile Leu Glu Glu
        245                 250                 255
CAT AAG GGT AAA ATT TTT GGA GAA ATG AAA GAT TTG TTG AGT ACT TTG         871
His Lys Gly Lys Ile Phe Gly Glu Met Lys Asp Leu Leu Ser Thr Leu
    260                 265                 270
ATC TCT CTT AAA AAT GAT GAT GCG GAT AAT GAT GGA GGG AAA CTC ACT         919
Ile Ser Leu Lys Asn Asp Asp Ala Asp Asn Asp Gly Gly Lys Leu Thr
275                 280                 285                 290
GAT ACA GAA ATT AAA GCA TTA CTT TTG AAC TTG TTT GTA GCT GGA ACA         967
Asp Thr Glu Ile Lys Ala Leu Leu Leu Asn Leu Phe Val Ala Gly Thr
                295                 300                 305
GAC ACA TCT TCT AGT ACA GTT GAA TGG GCC ATT GCT GAG CTT ATT CGT         1015
Asp Thr Ser Ser Ser Thr Val Glu Trp Ala Ile Ala Glu Leu Ile Arg
            310                 315                 320
AAT CCA AAA ATA CTA GCC CAA GCC CAG CAA GAG ATC GAC AAA GTC GTT         1063
Asn Pro Lys Ile Leu Ala Gln Ala Gln Gln Glu Ile Asp Lys Val Val
        325                 330                 335
GGA AGG GAC CGG CTA GTT GGC GAA TTG GAC CTA GCC CAA TTG ACA TAC         1111
Gly Arg Asp Arg Leu Val Gly Glu Leu Asp Leu Ala Gln Leu Thr Tyr
    340                 345                 350
TTG GAA GCT ATA GTC AAG GAA ACC TTT CGG CTT CAT CCA TCA ACC CCT         1159
Leu Glu Ala Ile Val Lys Glu Thr Phe Arg Leu His Pro Ser Thr Pro
355                 360                 365                 370
CTT TCA CTT CCT AGA ATT GCA TCT GAG AGT TGT GAG ATC AAT GGC TAT       1207
Leu Ser Leu Pro Arg Ile Ala Ser Glu Ser Cys Glu Ile Asn Gly Tyr
                375                 380                 385
TTC ATT CCA AAA GGC TCA ACG CTT CTC CTT AAT GTT TGG GCC ATT GCT       1255
Phe Ile Pro Lys Gly Ser Thr Leu Leu Leu Asn Val Trp Ala Ile Ala
            390                 395                 400
CGT GAT CCA AAT GCA TGG GCT GAT CCA TTG GAG TTT AGG CCT GAA AGG       1303
Arg Asp Pro Asn Ala Trp Ala Asp Pro Leu Glu Phe Arg Pro Glu Arg
        405                 410                 415
TTT TTG CCA GGA GGT GAG AAG CCC AAA GTT GAT GTC CGT GGG AAT GAC       1351
Phe Leu Pro Gly Gly Glu Lys Pro Lys Val Asp Val Arg Gly Asn Asp
    420                 425                 430
TTT GAA GTC ATA CCA TTT GGA GCT GGA CGT AGG ATT TGT GCT GGA ATG       1399
Phe Glu Val Ile Pro Phe Gly Ala Gly Arg Arg Ile Cys Ala Gly Met
435                 440                 445                 450
AAT TTG GGT ATA CGT ATG GTC CAG TTG ATG ATT GCA ACT TTA ATA CAT       1447
Asn Leu Gly Ile Arg Met Val Gln Leu Met Ile Ala Thr Leu Ile His
                455                 460                 465
GCA TTT AAC TGG GAT TTG GTC AGT GGA CAA TTG CCG GAG ATG TTG AAT       1495
Ala Phe Asn Trp Asp Leu Val Ser Gly Gln Leu Pro Glu Met Leu Asn
            470                 475                 480
ATG GAA GAA GCA TAT GGG CTG ACC TTA CAA CGG GCT GAT CCA TTG GTT       1543
Met Glu Glu Ala Tyr Gly Leu Thr Leu Gln Arg Ala Asp Pro Leu Val
        485                 490                 495
GTG CAC CCA AGG CCT CGC TTA GAA GCC CAA GCG TAC ATT GGG T             1586
Val His Pro Arg Pro Arg Leu Glu Ala Gln Ala Tyr Ile Gly
    500                 505                 510
GAGCAGCAAC AGCCCATGGA GATAACATGA GTGTTAAATG TATGAGTCTC CATATCTTGT    1646
TTAGTTTGTT TATGCTTTGG ATTTAGTAGT TTTTATATTG ATAGATCAAT GTTTGCATTG    1706
TCAGTAAGAA TATCCGTTGC TTGTTTCATT AACTCCAGGT GGACAATAAA AGAAGTAATT    1766
TGTATGAAAA AAAAAAAAAA AAA                                            1789
(2)关于SEQ ID NO:2的信息
(i)序列特征
(A)长度:512个氨基酸
(B)类型:氨基酸
(D)拓扑结构:线型
(ii)分子类型:蛋白质
(ix)序列描述:SEQ ID NO:2
Met Glu Ile Leu Ser Leu Ile Leu Tyr Thr Val Ile Phe Ser Phe Leu
  1               5                  10                  15
Leu Gln Phe Ile Leu Arg Ser Phe Phe Arg Lys Arg Tyr Pro Leu Pro
             20                  25                  30
Leu Pro Pro Gly Pro Lys Pro Trp Pro Ile Ile Gly Asn Leu Val His
         35                  40                  45
Leu Gly Pro Lys Pro His Gln Ser Thr Ala Ala Met Ala Gln Thr Tyr
     50                  55                  60
Gly Pro Leu Met Tyr Leu Lys Met Gly Phe Val Asp Val Val Val Ala
 65                  70                  75                  80
Ala Ser Ala Ser Val Ala Ala Gln Phe Leu Lys Thr His Asp Ala Asn
                 85                  90                  95
Phe Ser Ser Arg Pro Pro Asn Ser Gly Ala Glu His Met Ala Tyr Asn
            100                 105                 110
Tyr Gln Asp Leu Val Phe Ala Pro Tyr Gly Pro Arg Trp Arg Met Leu
        115                 120                 125
Arg Lys Ile Cys Ser Val His Leu Phe Ser Thr Lys Ala Leu Asp Asp
    130                 135                 140
Phe Arg His Val Arg Gln Asp Glu Val Lys Thr Leu Thr Arg Ala Leu
145                 150                 155                 160
Ala Ser Ala Gly Gln Lys Pro Val Lys Leu Gly Gln Leu Leu Asn Val
                165                 170                 175
Cys Thr Thr Asn Ala Leu Ala Arg Val Met Leu Gly Lys Arg Val Phe
            180                 185                 190
Ala Asp Gly Ser Gly Asp Val Asp Pro Gln Ala Ala Glu Phe Lys Ser
        195                 200                 205
Met Val Val Glu Met Met Val Val Ala Gly Val Phe Asn Ile Gly Asp
    210                 215                 220
Phe Ile Pro Gln Leu Asn Trp Leu Asp Ile Gln Gly Val Ala Ala Lys
225                 230                 235                 240
Met Lys Lys Leu His Ala Arg Phe Asp Ala Phe Leu Thr Asp Ile Leu
                245                 250                 255
Glu Glu His Lys Gly Lys Ile Phe Gly Glu Met Lys Asp Leu Leu Ser
            260                 265                 270
Thr Leu Ile Ser Leu Lys Asn Asp Asp Ala Asp Asn Asp Gly Gly Lys
        275                 280                 285
Leu Thr Asp Thr Glu Ile Lys Ala Leu Leu Leu Asn Leu Phe Val Ala
    290                 295                 300
Gly Thr Asp Thr Ser Ser Ser Thr Val Glu Trp Ala Ile Ala Glu Leu
305                 310                 315                 320
Ile Arg Asn Pro Lys Ile Leu Ala Gln Ala Gln Gln Glu Ile Asp Lys
                325                 330                 335
Val Val Gly Arg Asp Arg Leu Val Gly Glu Leu Asp Leu Ala Gln Leu
            340                 345                 350
Thr Tyr Leu Glu Ala Ile Val Lys Glu Thr Phe Arg Leu His Pro Ser
        355                 360                 365
Thr Pro Leu Ser Leu Pro Arg Ile Ala Ser Glu Ser Cys Glu Ile Asn
    370                 375                 380
Gly Tyr Phe Ile Pro Lys Gly Ser Thr Leu Leu Leu Asn Val Trp Ala
385                 390                 395                 400
Ile Ala Arg Asp Pro Asn Ala Trp Ala Asp Pro Leu Glu Phe Arg Pro
                405                 410                 415
Glu Arg Phe Leu Pro Gly Gly Glu Lys Pro Lys Val Asp Val Arg Gly
            420                 425                 430
Asn Asp Phe Glu Val Ile Pro Phe Gly Ala Gly Arg Arg Ile Cys Ala
        435                 440                 445
Gly Met Asn Leu Gly Ile Arg Met Val Gln Leu Met Ile Ala Thr Leu
    450                 455                 460
Ile His Ala Phe Asn Trp Asp Leu Val Ser Gly Gln Leu Pro Glu Met
465                 470                 475                 480
Leu Asn Met Glu Glu Ala Tyr Gly Leu Thr Leu Gln Arg Ala Asp Pro
                485                 490                 495
Leu Val Val His Pro Arg Pro Arg Leu Glu Ala Gln Ala Tyr Ile Gly
            500                 505                 510
(2)关于SEQ ID NO:3的信息
(i)序列特征
(A)长度:1745个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑结构:线型
(ii)分子类型:DNA
(ix)特征:
(A)名称/键:CDS
(B)位置:50..1586
(xi)序列描述:SEQ ID NO:3
AAGTTCGGCA CGAGCGTCAC ATTCACACCG TCACATTACT ATTCAAACCA CTCATTTTCT      60
ACCTCTCTTT TCTACCCACC AAAACAAAAC AAAACAAAAA AAAACACATA AAAAAACTCA      120
AAAAAAAATT ATAATGTCAC CCTTAGAGGT AACTTTCTAC ACCATAGTCC T ATG CAC       177
                                                         Met His
                                                           1
AAT CTC TAC TAC CTC ATC ACC ACC GTC TTC CGC GGC CAC CAA AAA CCG        225
Asn Leu Tyr Tyr Leu Ile Thr Thr Val Phe Arg Gly His Gln Lys Pro
          5                  10                  15
CTT CCT CCA GGG CCA CGA CCA TGG CCC ATC GTG GGA AAC CTC CCA CAT        273
Leu Pro Pro Gly Pro Arg Pro Trp Pro Ile Val Gly Asn Leu Pro His
     20                  25                  30
ATG GGC CAG GCA CCG CAC CAG GGC TTA GCA GCC CTG GCG CAA AAG TAT       321
Met Gly Gln Ala Pro His Gln Gly Leu Ala Ala Leu Ala Gln Lys Tyr
 35                  40                  45                  50
GGC CCT CTA TTG TAT ATG AGA CTG GGG TAC GTG GAC GTT GTT GTG GCC       369
Gly Pro Leu Leu Tyr Met Arg Leu Gly Tyr Val Asp Val Val Val Ala
                 55                  60                  65
GCC TCA GCG TCT GTA GCG ACC CAG TTT CTT AAG ACA CAT GAC CTA AAT       417
Ala Ser Ala Ser Val Ala Thr Gln Phe Leu Lys Thr His Asp Leu Asn
             70                  75                  80
TTT TCG AGT AGG CCA CCG AAT TCG GGG GCT AAA CAC ATT GCT TAT AAC       465
Phe Ser Ser Arg Pro Pro Asn Ser Gly Ala Lys His Ile Ala Tyr Asn
         85                  90                  95
TAT CAA GAC CTT GTT TTT GCA CCT TAT GGA CCT AAA TGG CGC ATG CTT       513
Tyr Gln Asp Leu Val Phe Ala Pro Tyr Gly Pro Lys Trp Arg Met Leu
    100                 105                 110
AGG AAA ATT TGT TCC TTA CAC ATG TTT TCT TCT AAG GCT TTG GAC GAT       561
Arg Lys Ile Cys Ser Leu His Met Phe Ser Ser Lys Ala Leu Asp Asp
115                 120                 125                 130
TTT AGA CTT GTC CGT CAG GAA GAA GTA TCT ATA CTG GTA AAT GCG ATA       609
Phe Arg Leu Val Arg Gln Glu Glu Val Ser Ile Leu Val Asn Ala Ile
                135                 140                 145
GCA AAA GCA GGA ACA AAG CCA GTA CAA CTA GGA CAA CTA CTC AAC GTG       657
Ala Lys Ala Gly Thr Lys Pro Val Gln Leu Gly Gln Leu Leu Asn Val
            150                 155                 160
TGC ACC ACA AAT GCC TTA TCG AGG GTG ATG CTA GGG AAG CGA GTT CTC       705
Cys Thr Thr Asn Ala Leu Ser Arg Val Met Leu Gly Lys Arg Val Leu
        165                 170                 175
GGT GAT GGC ACA GGG AAA AGC GAC CCA AAA GCC GAG GAA TTT AAG GAC       753
Gly Asp Gly Thr Gly Lys Ser Asp Pro Lys Ala Glu Glu Phe Lys Asp
    180                 185                 190
ATG GTG CTG GAG TTA ATG GTT CTC ACC GGA GTT TTT AAC ATT GGC GAT         801
Met Val Leu Glu Leu Met Val Leu Thr Gly Val Phe Asn Ile Gly Asp
195                 200                 205                 210
TTT GTA CCG GCA TTG GAA TGT CTA GAC TTA CAA GGT GTT GCA TCT AAA         849
Phe Val Pro Ala Leu Glu Cys Leu Asp Leu Gln Gly Val Ala Ser Lys
                215                 220                 225
ATG AAG AAA TTA CAT AAA AGA CTT GAT AAT TTT ATG AGT AAC ATT TTG         897
Met Lys Lys Leu His Lys Arg Leu Asp Asn Phe Met Ser Asn Ile Leu
            230                 235                 240
GAG GAA CAC AAG AGT GTT GCA CAT CAA CAA AAT GGT GGA GAT TTG CTA         945
Glu Glu His Lys Ser Val Ala His Gln Gln Asn Gly Gly Asp Leu Leu
        245                 250                 255
AGC ATT TTG ATA TCT TTG AAG GAT AAT TGT GAT GGT GAA GGT GGC AAG         993
Ser Ile Leu Ile Ser Leu Lys Asp Asn Cys Asp Gly Glu Gly Gly Lys
    260                 265                 270
TTT AGT GCC ACA GAA ATT AAG GCC TTG CTA TTG GAT TTA TTT ACA GCT         1041
Phe Ser Ala Thr Glu Ile Lys Ala Leu Leu Leu Asp Leu Phe Thr Ala
275                 280                 285                 290
GGA ACA GAC ACA TCA TCT AGT ACA ACT GAA TGG GCC ATA GCC GAA CTA         1089
Gly Thr Asp Thr Ser Ser Ser Thr Thr Glu Trp Ala Ile Ala Glu Leu
                295                 300                 305
ATT CGC CAT CCA AAA ATC TTA GCC CAA GTT CAA CAA GAA ATG GAC TCA         1137
Ile Arg His Pro Lys Ile Leu Ala Gln Val Gln Gln Glu Met Asp Ser
            310                 315                 320
GTC GTG GGC CGA GAC CGA CTC ATA GCC GAA GCT GAC ATA CCG AAC CTA         1185
Val Val Gly Arg Asp Arg Leu Ile Ala Glu Ala Asp Ile Pro Asn Leu
        325                 330                 335
ACC TAC TTC CAA GCC GTA ATC AAA GAG GTT TTC CGA CTT CAC CCG TCC       1233
Thr Tyr Phe Gln Ala Val Ile Lys Glu Val Phe Arg Leu His Pro Ser
    340                 345                 350
ACC CCG CTT TCC CTA CCA CGG GTC GCA AAC GAA TCG TGC GAA ATA AAC       1281
Thr Pro Leu Ser Leu Pro Arg Val Ala Asn Glu Ser Cys Glu Ile Asn
355                 360                 365                 370
GGG TAC CAC ATT CCC AAA AAC ACC ACT TTA TTG GTA AAT GTG TGG GCC       1329
Gly Tyr His Ile Pro Lys Asn Thr Thr Leu Leu Val Asn Val Trp Ala
                375                 380                 385
ATC GCA CGC GAC CCT GAG GTT TGG GCC GAC CCG TTA GAG TTT AAA CCC       1377
Ile Ala Arg Asp Pro Glu Val Trp Ala Asp Pro Leu Glu Phe Lys Pro
            390                 395                 400
GAA AGA TTT TTG CCG GGC GGC GAA AAG CCC AAT GTG GAT GTG AAA GGA       1425
Glu Arg Phe Leu Pro Gly Gly Glu Lys Pro Asn Val Asp Val Lys Gly
        405                 410                 415
AAC GAT TTT GAG CTG ATT CCG TTC GGG GCG GGC CGA CGG ATT TGT GCT       1473
Asn Asp Phe Glu Leu Ile Pro Phe Gly Ala Gly Arg Arg Ile Cys Ala
    420                 425                 430
GGG CTG AGT TTG GGC CTG CGT ATG GTC CAG TTG ATG ACA GCC ACT TTG       1521
Gly Leu Ser Leu Gly Leu Arg Met Val Gln Leu Met Thr Ala Thr Leu
435                 440                 445                 450
GCC CAT ACT TAT GAT TGG GCC TTA GCT GAT GGG CTT ATG CCC GAA AAG       1569
Ala His Thr Tyr Asp Trp Ala Leu Ala Asp Gly Leu Met Pro Glu Lys
                455                 460                 465
CTT AAC ATG GAT GAG GCT TAT GGG CTT ACC TTA CAG CGT AAG GTG CCA       1617
Leu Asn Met Asp Glu Ala Tyr Gly Leu Thr Leu Gln Arg Lys Val Pro
            470                 475                 480
CTT AAT GGT CCA CCC GAC CCC GTC GGC TTC TCG GCC CGT GTT T               1660
Leu Asn Gly Pro Pro Asp Pro Val Gly Phe Ser Ala Arg Val
        485                 490                 495
AATAATTCCG GGGTTTTTAA AAGCGGGTTA CTTTTGTTTA TGTATTATTC CGTACTAGTT       1720
TGAAAATAAT GGTATTAGAG AAATG                                             1745
(2)关于SEQ ID NO:4的信息
(i)序列特征
(A)长度:496个碱基对
(B)类型:氨基酸
(D)拓扑结构:线型
(ii)分子类型:蛋白质
(xi)序列描述:SEQ ID NO:4
Met His Asn Leu Tyr Tyr Leu Ile Thr Thr Val Phe Arg Gly His Gln
  1               5                  10                  15
Lys Pro Leu Pro Pro Gly Pro Arg Pro Trp Pro Ile Val Gly Asn Leu
             20                  25                  30
Pro His Met Gly Gln Ala Pro His Gln Gly Leu Ala Ala Leu Ala Gln
         35                  40                  45
Lys Tyr Gly Pro Leu Leu Tyr Met Arg Leu Gly Tyr Val Asp Val Val
     50                  55                  60
Val Ala Ala Ser Ala Ser Val Ala Thr Gln Phe Leu Lys Thr His Asp
 65                  70                  75                  80
Leu Asn Phe Ser Ser Arg Pro Pro Asn Ser Gly Ala Lys His Ile Ala 
                 85                  90                  95
Tyr Asn Tyr Gln Asp Leu Val Phe Ala Pro Tyr Gly Pro Lys Trp Arg
            100                 105                 110
Met Leu Arg Lys Ile Cys Ser Leu His Met Phe Ser Ser Lys Ala Leu
        115                 120                 125
Asp Asp Phe Arg Leu Val Arg Gln Glu Glu Val Ser Ile Leu Val Asn
    130                 135                 140
Ala Ile Ala Lys Ala Gly Thr Lys Pro Val Gln Leu Gly Gln Leu Leu
145                 150                 155                 160
Asn Val Cys Thr Thr Asn Ala Leu Ser Arg Val Met Leu Gly Lys Arg
                165                 170                 175
Val Leu Gly Asp Gly Thr Gly Lys Ser Asp Pro Lys Ala Glu Glu Phe
            180                 185                 190
Lys Asp Met Val Leu Glu Leu Met Val Leu Thr Gly Val Phe Asn Ile
        195                 200                 205
Gly Asp Phe Val Pro Ala Leu Glu Cys Leu Asp Leu Gln Gly Val Ala
    210                 215                 220
Ser Lys Met Lys Lys Leu His Lys Arg Leu Asp Asn Phe Met Ser Asn
225                 230                 235                 240
Ile Leu Glu Glu His Lys Ser Val Ala His Gln Gln Asn Gly Gly Asp
                245                 250                 255
Leu Leu Ser Ile Leu Ile Ser Leu Lys Asp Asn Cys Asp Gly Glu Gly
            260                 265                 270
Gly Lys Phe Ser Ala Thr Glu Ile Lys Ala Leu Leu Leu Asp Leu Phe
        275                 280                 285
Thr Ala Gly Thr Asp Thr Ser Ser Ser Thr Thr Glu Trp Ala Ile Ala
    290                 295                 300
Glu Leu Ile Arg His Pro Lys Ile Leu Ala Gln Val Gln Gln Glu Met
305                 310                 315                 320
Asp Ser Val Val Gly Arg Asp Arg Leu Ile Ala Glu Ala Asp Ile Pro
                325                 330                 335
Asn Leu Thr Tyr Phe Gln Ala Val Ile Lys Glu Val Phe Arg Leu His
            340                 345                 350
Pro Ser Thr Pro Leu Ser Leu Pro Arg Val Ala Asn Glu Ser Cys Glu
        355                 360                 365
Ile Asn Gly Tyr His Ile Pro Lys Asn Thr Thr Leu Leu Val Asn Val
    370                 375                 380
Trp Ala Ile Ala Arg Asp Pro Glu Val Trp Ala Asp Pro Leu Glu Phe
385                 390                 395                 400
Lys Pro Glu Arg Phe Leu Pro Gly Gly Glu Lys Pro Asn Val Asp Val
                405                 410                 415
Lys Gly Asn Asp Phe Glu Leu Ile Pro Phe Gly Ala Gly Arg Arg Ile
            420                 425                 430
Cys Ala Gly Leu Ser Leu Gly Leu Arg Met Val Gln Leu Met Thr Ala
        435                 440                 445
Thr Leu Ala His Thr Tyr Asp Trp Ala Leu Ala Asp Gly Leu Met Pro
    450                 455                 460
Glu Lys Leu Asn Met Asp Glu Ala Tyr Gly Leu Thr Leu Gln Arg Lys
465                 470                 475                 480
Val Pro Leu Asn Gly Pro Pro Asp Pro Val Gly Phe Ser Ala Arg Val
                485                 490                 495
(2)关于SEQ ID NO:5的信息
(i)序列特征
(A)长度:1711个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑结构:线型
(ii)分子类型:DNA
(ix)特征:
(A)名称/键:CDS
(B)位置:91..1629
(xi)序列描述:SEQ ID NO:5
CGAATTCCCC CCCCCCCACA CCATTCAATG CCTAAGTCCT CCATTTGCCG GCCTAATAAC     60
TAAAAGCCCA CTCTTTCCGA CCATCTATAC ATG CAA CAC CAA TAT TAT TCT TTA      114
                                 Met Gln His Gln Tyr Tyr Ser Leu
                                   1               5
ATT ACG ATG GAT GAT ATT AGC ATA ACC AGC TTA TTG GTG CCA TGT ACT       162
Ile Thr Met Asp Asp Ile Ser Ile Thr Ser Leu Leu Val Pro Cys Thr
     10                  15                  20
TTT ATA TTA GGG TTC TTG CTT CTA TAT TCC TTC CTC AAC AAA AAA GTA       210
Phe Ile Leu Gly Phe Leu Leu Leu Tyr Ser Phe Leu Asn Lys Lys Val
 25                  30                  35                  40
AAG CCA CTG CCA CCT GGA CCG AAG CCA TGG CCC ATC GTC GGA AAT CTG       258
Lys Pro Leu Pro Pro Gly Pro Lys Pro Trp Pro Ile Val Gly Asn Leu
                 45                  50                  55
CCA CAT CTT GGG CCG AAG CCC CAC CAG TCG ATG GCG GCG CTG GCA CGG       306
Pro His Leu Gly Pro Lys Pro His Gln Ser Met Ala Ala Leu Ala Arg
             60                  65                  70
GTG CAC GGC CCA TTA ATT CAT CTG AAG ATG GGC TTT GTG CAT GTG GTT         354
Val His Gly Pro Leu Ile His Leu Lys Met Gly Phe Val His Val Val
         75                  80                  85
GTG GCC TCC TCA GCA TCC GTT GCG GAG AAA TTT CTG AAG GTG CAT GAC         402
Val Ala Ser Ser Ala Ser Val Ala Glu Lys Phe Leu Lys Val His Asp
     90                  95                 100
GCA AAC TTC TCG AGC AGG CCT CCC AAT TCG GGT GCA AAA CAC GTG GCC         450
Ala Asn Phe Ser Ser Arg Pro Pro Asn Ser Gly Ala Lys His Val Ala
105                 110                 115                 120
TAC AAC TAT CAG GAC TTG GTC TTT GCT CCT TAT GGC CCA CGC TGG CGG         498
Tyr Asn Tyr Gln Asp Leu Val Phe Ala Pro Tyr Gly Pro Arg Trp Arg
                125                 130                 135
ATG CTC AGG AAA ATC TGT GCA CTC CAC CTC TTC TCC GCC AAA GCC TTG         546
Met Leu Arg Lys Ile Cys Ala Leu His Leu Phe Ser Ala Lys Ala Leu
            140                 145                 150
AAC GAC TTC ACA CAC GTC AGA CAG GAT GAG GTG GGG ATC CTC ACT CGC         594
Asn Asp Phe Thr His Val Arg Gln Asp Glu Val Gly Ile Leu Thr Arg
        155                 160                 165
GTT CTA GCA GAT GCA GGA GAA ACG CCG TTG AAA TTA GGG CAG ATG ATG         642
Val Leu Ala Asp Ala Gly Glu Thr Pro Leu Lys Leu Gly Gln Met Met
    170                 175                 180
AAC ACA TGC GCC ACC AAT GCA ATA GCG CGT GTT ATG TTG GGT CGA CGC         690
Asn Thr Cys Ala Thr Asn Ala Ile Ala Arg Val Met Leu Gly Arg Arg
185                 190                 195                 200
GTG GTT GGA CAC GCA GAC TCA AAG GCG GAG GAG TTT AAG GCA ATG GTA         738
Val Val Gly His Ala Asp Ser Lys Ala Glu Glu Phe Lys Ala Met Val
                205                 210                 215
GTG GAG TTG ATG GTA TTA GCT GGT GTG TTC AAC TTA GGT GAT TTT ATC         786
Val Glu Leu Met Val Leu Ala Gly Val Phe Asn Leu Gly Asp Phe Ile
            220                 225                 230
CCA CCT CTT GAA AAA TTG GAT CTT CAA GGT GTC ATT GCT AAG ATG AAG         834
Pro Pro Leu Glu Lys Leu Asp Leu Gln Gly Val Ile Ala Lys Met Lys
        235                 240                 245
AAG CTT CAC TTG CGT TTC GAC TCG TTC TTG AGT AAG ATC CTT GGA GAC         882
Lys Leu His Leu Arg Phe Asp Ser Phe Leu Ser Lys Ile Leu Gly Asp
    250                 255                 260
CAC AAG ATC AAC AGC TCA GAT GAA ACC AAA GGC CAT TCG GAT TTG TTG         930
His Lys Ile Asn Ser Ser Asp Glu Thr Lys Gly His Ser Asp Leu Leu
265                 270                 275                 280
AAC ATG TTA ATT TCT TTG AAG GAC GCT GAT GAT GCC GAA GGA GGG AGG         978
Asn Met Leu Ile Ser Leu Lys Asp Ala Asp Asp Ala Glu Gly Gly Arg
                285                 290                 295
CTC ACC GAC GTA GAA ATT AAA GCG TTG CTC TTG AAC TTG TTT GCT GCA         1026
Leu Thr Asp Val Glu Ile Lys Ala Leu Leu Leu Asn Leu Phe Ala Ala
            300                 305                 310
GGA ACT GAC ACA ACA TCA AGC ACT GTG GAA TGG TGC ATA GCT GAG TTA         1074
Gly Thr Asp Thr Thr Ser Ser Thr Val Glu Trp Cys Ile Ala Glu Leu
        315                  320                 325
GTA CGA CAT CCT GAA ATC CTT GCC CAA GTC CAA AAA GAA CTC GAC TCT         1122
Val Arg His Pro Glu Ile Leu Ala Gln Val Gln Lys Glu Leu Asp Ser
    330                 335                 340
GTT GTT GGT AAG AAT CGG GTG GTG AAG GAG GCT GAT CTG GCC GGA TTA         1170
Val Val Gly Lys Asn Arg Val Val Lys Glu Ala Asp Leu Ala Gly Leu
345                 350                 355                 360
CCA TTC CTC CAA GCG GTC GTC AAG GAA AAT TTC CGA CTC CAT CCC TCC       1218
Pro Phe Leu Gln Ala Val Val Lys Glu Asn Phe Arg Leu His Pro Ser
                365                 370                 375
ACC CCG CTC TCC CTA CCG AGG ATC GCA CAT GAG AGT TGT GAA GTG AAT       1266
Thr Pro Leu Ser Leu Pro Arg Ile Ala His Glu Ser Cys Glu Val Asn
            380                 385                 390
GGA TAC TTG ATT CCA AAG GGT TCG ACA CTT CTT GTC AAT GTT TGG GCA       1314
Gly Tyr Leu Ile Pro Lys Gly Ser Thr Leu Leu Val Asn Val Trp Ala
        395                 400                 405
ATT GCT CGC GAT CCA AAT GTG TGG GAT GAA CCA CTA GAG TTC CGG CCT       1362
Ile Ala Arg Asp Pro Asn Val Trp Asp Glu Pro Leu Glu Phe Arg Pro
    410                 415                 420
GAA CGA TTC TTG AAG GGC GGG GAA AAG CCT AAT GTC GAT GTT AGA GGG       1410
Glu Arg Phe Leu Lys Gly Gly Glu Lys Pro Asn Val Asp Val Arg Gly
425                 430                 435                 440
AAT GAT TTC GAA TTG ATA CCG TTC GGA GCG GGC CGA AGA ATT TGT GCA       1458
Asn Asp Phe Glu Leu Ile Pro Phe Gly Ala Gly Arg Arg Ile Cys Ala
                445                 450                 455
GGA ATG AGC TTA GGA ATA CGT ATG GTC CAG TTG TTG ACA GCA ACT TTG       1506
Gly Met Ser Leu Gly Ile Arg Met Val Gln Leu Leu Thr Ala Thr Leu
            460                 465                 470
AAC CAT GCG TTT GAC TTT GAT TTG GCG GAT GGA CAG TTG CCT GAA AGC       1554
Asn His Ala Phe Asp Phe Asp Leu Ala Asp Gly Gln Leu Pro Glu Ser
        475                 480                 485
TTA AAC ATG GAG GAA GCT TAT GGG CTG ACC TTG CAA CGA GCT GAC CCT       1602
Leu Asn Met Glu Glu Ala Tyr Gly Leu Thr Leu Gln Arg Ala Asp Pro
    490                 495                 500
TTG GTA GTG CAC CCG AAG CCT AGG TAGGCACCTC ATGTTTATCA AACTTAGGAC      1656
Leu Val Val His Pro Lys Pro Arg
505                 510
TCATGTTTAG AGAACCTCTT GTTGTTTTAT CAGATTGAAG TGTGATGTCC AAGAC           1711
(2)关于SEQ ID NO:6的信息
(i)序列特征
(A)长度:512个氨基酸
(B)类型:氨基酸
(D)拓扑结构:线型
(ii)分子类型:蛋白质
(xi)序列描述:SEQ ID NO:6
Met Gln His Gln Tyr Tyr Ser Leu Ile Thr Met Asp Asp Ile Ser Ile
  1               5                  10                  15
Thr Ser Leu Leu Val Pro Cys Thr Phe Ile Leu Gly Phe Leu Leu Leu
             20                  25                  30
Tyr Ser Phe Leu Asn Lys Lys Val Lys Pro Leu Pro Pro Gly Pro Lys
         35                 40                 45
Pro Trp Pro Ile Val Gly Asn Leu Pro His Leu Gly Pro Lys Pro His
     50                  55                  60
Gln Ser Met Ala Ala Leu Ala Arg Val His Gly Pro Leu Ile His Leu
 65                  70                  75                  80
Lys Met Gly Phe Val His Val Val Val Ala Ser Ser Ala Ser Val Ala
                 85                  90                  95
Glu Lys Phe Leu Lys Val His Asp Ala Asn Phe Ser Ser Arg Pro Pro
            100                 105                 110
Asn Ser Gly Ala Lys His Val Ala Tyr Asn Tyr Gln Asp Leu Val Phe
        115                 120                 125
Ala Pro Tyr Gly Pro Arg Trp Arg Met Leu Arg Lys Ile Cys Ala Leu
    130                 135                 140
His Leu Phe Ser Ala Lys Ala Leu Asn Asp Phe Thr His Val Arg Gln
145                 150                 155                 160
Asp Glu Val Gly Ile Leu Thr Arg Val Leu Ala Asp Ala Gly Glu Thr
                165                 170                 175
Pro Leu Lys Leu Gly Gln Met Met Asn Thr Cys Ala Thr Asn Ala Ile
            180                 185                 190
Ala Arg Val Met Leu Gly Arg Arg Val Val Gly His Ala Asp Ser Lys
        195                 200                 205
Ala Glu Glu Phe Lys Ala Met Val Val Glu Leu Met Val Leu Ala Gly
    210                 215                 220
Val Phe Asn Leu Gly Asp Phe Ile Pro Pro Leu Glu Lys Leu Asp Leu
225                 230                 235                 240
Gln Gly Val Ile Ala Lys Met Lys Lys Leu His Leu Arg Phe Asp Ser
                245                 250                 255
Phe Leu Ser Lys Ile Leu Gly Asp His Lys Ile Asn Ser Ser Asp Glu
            260                 265                 270
Thr Lys Gly His Ser Asp Leu Leu Asn Met Leu Ile Ser Leu Lys Asp
        275                 280                 285
Ala Asp Asp Ala Glu Gly Gly Arg Leu Thr Asp Val Glu Ile Lys Ala
    290                 295                 300
Leu Leu Leu Asn Leu Phe Ala Ala Gly Thr Asp Thr Thr Ser Ser Thr
305                 310                 315                 320
Val Glu Trp Cys Ile Ala Glu Leu Val Arg His Pro Glu Ile Leu Ala
                325                 330                 335
Gln Val Gln Lys Glu Leu Asp Ser Val Val Gly Lys Asn Arg Val Val
            340                 345                 350
Lys Glu Ala Asp Leu Ala Gly Leu Pro Phe Leu Gln Ala Val Val Lys
        355                 360                 365
Glu Asn Phe Arg Leu His Pro Ser Thr Pro Leu Ser Leu Pro Arg Ile
    370                 375                 380
Ala His Glu Ser Cys Glu Val Asn Gly Tyr Leu Ile Pro Lys Gly Ser
385                 390                 395                 400
Thr Leu Leu Val Asn Val Trp Ala Ile Ala Arg Asp Pro Asn Val Trp
                405                 410                 415
Asp Glu Pro Leu Glu Phe Arg Pro Glu Arg Phe Leu Lys Gly Gly Glu
            420                 425                 430
Lys Pro Asn Val Asp Val Arg Gly Asn Asp Phe Glu Leu Ile Pro Phe
        435                 440                 445
Gly Ala Gly Arg Arg Ile Cys Ala Gly Met Ser Leu Gly Ile Arg Met
    450                 455                 460
Val Gln Leu Leu Thr Ala Thr Leu Asn His Ala Phe Asp Phe Asp Leu
465                 470                 475                 480
Ala Asp Gly Gln Leu Pro Glu Ser Leu Asn Met Glu Glu Ala Tyr Gly 
                485                 490                 495
Leu Thr Leu Gln Arg Ala Asp Pro Leu Val Val His Pro Lys Pro Arg
            500                 505                 510
(2)关于SEQ ID NO:7的信息
(i)序列特征
(A)长度:971个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑结构:线型
(ii)分大类型:DNA
(ix)特征:
(A)名称/键:CDS
(B)位置:1..811
序列描述:SEQ ID NO:7
GAT ATG CTT AGC ACT TTA ATC TCC CTT AAA GGA ACT GAT CTT GAC GGT         48
Asp Met Leu Ser Thr Leu Ile Ser Leu Lys Gly Thr Asp Leu Asp Gly
  1               5                  10                  15
GAC GGA GGA AGC TTA ACG GAT ACT GAG ATT AAA GCC TTG CTA TTG AAC         96
Asp Gly Gly Ser Leu Thr Asp Thr Glu Ile Lys Ala Leu Leu Leu Asn
             20                  25                  30
ATG TTC ACA GCT GGA ACT GAC ACG TCA GCA AGT ACG GTG GAC TGG GCT         144
Met Phe Thr Ala Gly Thr Asp Thr Ser Ala Ser Thr Val Asp Trp Ala
         35                  40                  45
ATA GCT GAA CTT ATC CGT CAC CCG GAT ATA ATG GTT AAA GCC CAA GAA         192
Ile Ala Glu Leu Ile Arg His Pro Asp Ile Met Val Lys Ala Gln Glu
     50                  55                  60
GAA CTT GAT ATT GTT GTG GGC CGT GAC AGG CCT GTT AAT GAA TCA GAC         240
Glu Leu Asp Ile Val Val Gly Arg Asp Arg Pro Val Asn Glu Ser Asp
 65                  70                  75                  80
ATC GCT CAG CTT CCT TAC CTT CAG GCG GTT ATC AAA GAG AAT TTC AGG        288
Ile Ala Gln Leu Pro Tyr Leu Gln Ala Val Ile Lys Glu Asn Phe Arg
                 85                  90                  95
CTT CAT CCA CCA ACA CCA CTC TCG TTA CCA CAC ATC GCG TCA GAG AGC        336
Leu His Pro Pro Thr Pro Leu Ser Leu Pro His Ile Ala Ser Glu Ser
            100                 105                 110
TGT GAG ATC AAC GGC TAC CAT ATC CCG AAA GGA TCG ACT CTA TTT GAC        384
Cys Glu Ile Asn Gly Tyr His Ile Pro Lys Gly Ser Thr Leu Phe Asp
        115                 120                 125
GGA CAT ATG GGC CTA GGC CGT GAC CCG GAT CAA TGG TCC GAC CCG TTA        432
Gly His Met Gly Leu Gly Arg Asp Pro Asp Gln Trp Ser Asp Pro Leu
    130                 135                 140
GCA TTT AAA CCC GAG AGA TTC TTA CCC GGT GGT GAA AAA TCC GGC GTT        480
Ala Phe Lys Pro Glu Arg Phe Leu Pro Gly Gly Glu Lys Ser Gly Val
145                 150                 155                 160
GAT GTG AAA GGA AGC GAT TTC GAG CTA ATA CCG TTC GGG GCT GGG AGG        528
Asp Val Lys Gly Ser Asp Phe Glu Leu Ile Pro Phe Gly Ala Gly Arg
                165                 170                 175
CCA ATC TGT GCA GGT TTA AGT TTA GGG CTA CGT ACA GAT TTA AGT TGC        576
Pro Ile Cys Ala Gly Leu Ser Leu Gly Leu Arg Thr Asp Leu Ser Cys
            180                 185                 190
CTT CAC GCC AAC GTT GCT CAC AAG CAT TTG ATT GGG AAC TTC AGC TGG        624
Leu His Ala Asn Val Ala His Lys His Leu Ile Gly Asn Phe Ser Trp
        195                 200                 205
AGA AGT TAC GCC GCA CAA CCT GAA TAT CGC AGG AAA AGT TTA CTG GGC        672
Arg Ser Tyr Ala Gly Gln Pro Glu Tyr Arg Arg Lys Ser Leu Leu Gly
    210                 215                 220
TTT ACA CTG CAA AGA GCG GTT CCT TCG GTG GTA CAC CCT AAG CCA AGG        720
Phe Thr Leu Gln Arg Ala Val Pro Ser Val Val His Pro Lys Pro Arg
225                 230                 235                 240
TTG GCC CCG AAC GTT TAT GGA CCC CGG GTC GGC TTA AAA TTT AAC TTT        768
Leu Ala Pro Asn Val Tyr Gly Pro Arg Val Gly Leu Lys Phe Asn Phe
                245                 250                 255
GCT TCT TGG ACA AGG TAT ATG GCT TGC ACG AAA CTA ACG TTT T              811
Ala Ser Trp Thr Arg Tyr Met Ala Cys Thr Lys Leu Thr Phe
            260                 265                 270
AACACACCGT AGTTTGATCC GGAGTTAGCT TTATGTAAGA ACGTGTAACG CCAAATCAAG      871
CCATTATCAA CTACCGTGAG CTGTTTGTAC CCTATCTATA AATCTTGAAG AGGAACATTT      931
CAGAACTCTT GACTATGTTT CAGGAACAAA AAAAAAAAAA                            971
(2)关于SEQ ID NO:8的信息
(i)序列特征
(A)长度:270个氨基酸
(B)类型:氨基酸
(D)拓扑结构:线型
(ii)分子类型:蛋白质
(xi)序列描述:SEQ ID NO:8
Asp Met Leu Ser Thr Leu Ile Ser Leu Lys Gly Thr Asp Leu Asp Gly
  1               5                  10                  15
Asp Gly Gly Ser Leu Thr Asp Thr Glu Ile Lys Ala Leu Leu Leu Asn
             20                  25                  30
Met Phe Thr Ala Gly Thr Asp Thr Ser Ala Ser Thr Val Asp Trp Ala
         35                  40                  45
Ile Ala Glu Leu Ile Arg His Pro Asp Ile Met Val Lys Ala Gln Glu
     50                  55                  60
Glu Leu Asp Ile Val Val Gly Arg Asp Arg Pro Val Asn Glu Ser Asp
 65                  70                  75                  80
Ile Ala Gln Leu Pro Tyr Leu Gln Ala Val Ile Lys Glu Asn Phe Arg
                 85                  90                  95
Leu His Pro Pro Thr Pro Leu Ser Leu Pro His Ile Ala Ser Glu Ser
            100                 105                 110
Cys Glu Ile Asn Gly Tyr His Ile Pro Lys Gly Ser Thr Leu Phe Asp
        115                 120                 125
Gly His Met Gly Leu Gly Arg Asp Pro Asp Gln Trp Ser Asp Pro Leu
    130                 135                 140
Ala Phe Lys Pro Glu Arg Phe Leu Pro Gly Gly Glu Lys Ser Gly Val
145                 150                 155                 160
Asp Val Lys Gly Ser Asp Phe Glu Leu Ile Pro Phe Gly Ala Gly Arg
                165                 170                 175
Pro Ile Cys Ala Gly Leu Ser Leu Gly Leu Arg Thr Asp Leu Ser Cys
            180                 185                 190
Leu His Ala Asn Val Ala His Lys His Leu Ile Gly Asn Phe Ser Trp
        195                 200                 205
Arg Ser Tyr Ala Gly Gln Pro Glu Tyr Arg Arg Lys Ser Leu Leu Gly
    210                 215                 220
Phe Thr Leu Gln Arg Ala Val Pro Ser Val Val His Pro Lys Pro Arg
225                 230                 235                 240
Leu Ala Pro Asn Val Tyr Gly Pro Arg Val Gly Leu Lys Phe Asn Phe
                245                 250                 255
Ala Ser Trp Thr Arg-Tyr Met Ala Cys Thr Lys Leu Thr Phe
            260                 265                 270
(2)关于SEQ ID NO:9的信息
(i)序列特征
(A)长度:6595个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑结构:线型
(ii)分大类型:DNA
(ix)特征:
(A)名称/键:CDS
(B)位置:1478..1927
(ix)特征
(A)名称/键:CDS  
(B)位置:2651..3091
(ix)特征
(A)名称/键:CDS
(B)位置:3170..3340
(ix)特征
(A)名称/键:CDS
(B)位置:3421..3900
(xi)序列描述:SEQ IDNO:9
GTCGACTCTC TCCCTTTCGC TTGCTACTTT TTCTACATAA ATAAATGCAA TGATAAATTT  60
GTGCACACAT TCGTATGTTT GAAACATGGT AGGATCCACA ATTTATACTT TATAGACTCA  120
AAATGGAAAA GAAACGTACA TTATAAATTT ATCTGCAATT TGTTTTCTCT TGCTAAACTA  180
GACTGTATAA TAACCTCTGT ATATGCTATT ACTCGATTGT AAACGTACCC CGCAAGTCGC  240
AAGCAAGGTA AATAAAGTAT AATTATATTT TCACACACGA AACTTTAATT ATTATTTTTA  300
TCACTTGCAG ATTAACAGTA AAAAAAAAAA AAATGTGACT TTAACGGCGA CAAAAACTAC             360
TGATCTTTCT CCAATATTTA AATAATATAA TTAATAAACG TCTTTTCATA CTTGTATTTT             420
CCGACCCGAG TTCTGAAAGT GAAAACATAT GGTACTAGAT ATTCTCGATT TGTTTTGTAG             480
CCACTAGACT CTAAACAGAA AAAAGAAGCC AAAAGGACAA CGTTAAAAAA GAGACACTGT             540
TATTAAAAGT TAGAAACCAA ACGGTGAAAA TCCAGCTACA TACATAAAAT AAAGCCAAGG             600
TACCAAACTA ATGAACTGTA ACCTCTTTTT TCTTTTCTTT TTTGTTAAAG GATTTATGAA             660
CTGTAACTTA GAATGCTTGG TTTGTGGGCA GTGTAATATA TGACACACAT GCATTTTTTT             720
TGTTTGTCAA ATAGGAAGAC TTCTTTTTTC TTTATCAACT TCCTTATTTT CATAAAACAA             780
AACACTGAAA AAAGTACAGA TGTTCTCACG TACGTCACGT GTACATACAT ATATATTAGA             840
CCACTATATA ATAAGATATG AAGTGTTAGG TTTAAATCAA TTAACGAATC CCATCCAAAT             900
GATGAAACAG TTAACAAGAA ATCAAAATAG TTTATTAGGG TTACAATGAT TTTATACTTT             960
TAAGAAATCT TAGAACCTAT CACTTACAAA TGAGTAAATG ACCATTACTC CTCGAGAATC             1020
TAAGGCGCTT AAGGAAGCAT TGCGAATCGG GTGTGAAAAA GATCTATTTT TTGAATTATT             1080
TCACACAATT TCTTAATGTC AATTTTCGAT GCTCCCATAT TCTCCACGGT TTAAAGCAAG             1140
ATTGGTGGGA AAGGGATATT CTCGCATCGA TTACAATGAA ATATGGGTTG AAAAAAAAAA             1200
AAAAAAATTA CTCAATGTTG CACCAAAAAC CAGAAAACTC TAAGTTGCGC TAATAAAAAA             1260
AAAAGTTATA AACCCAACAT CAAACCAAAA CCGTACTAAA CTGTCCCATA TGAGATTTAG             1320
CTTTAAATAA ATTAGTACTT CTCATAACGA TAACTAAATT AAATTTCCCT AGCCAAGACA             1380
TACATATAGT TTTGATTGAC AAAAAAAAAA AAAACTCCTC TATTTATAGC TTGTGTTTTG             1440
TTTCCTCATT TTTCACTTAC CATTCAAACC CAACACT ATG GCA ACT CTA TTT CTC              1495
                                         Met Ala Thr Leu Phe Leu
                                           1               5
ACA ATC CTC CTA GCC ACT GTC CTC TTC CTC ATC CTC CGT ATC TTC TCT       1543
Thr Ile Leu Leu Ala Thr Val Leu Phe Leu Ile Leu Arg Ile Phe Ser
             10                  15                  20
CAC CGT CGC AAC CGC AGC CAC AAC AAC CGT CTT CCA CCG GGG CCA AAC       1591
His Arg Arg Asn Arg Ser His Asn Asn Arg Leu Pro Pro Gly Pro Asn
         25                  30                  35
CCA TGG CCC ATC ATC GGA AAC CTC CCT CAC ATG GGC ACT AAG CCT CAT       1639
Pro Trp Pro Ile Ile Gly Asn Leu Pro His Met Gly Thr Lys Pro His
     40                  45                  50
CGA ACC CTT TCC GCC ATG GTT ACT ACT TAC GGC CCT ATC CTC CAC CTC       1687
Arg Thr Leu Ser Ala Met Val Thr Thr Tyr Gly Pro Ile Leu His Leu
 55                  60                  65                  70
CGA CTA GGG TTC GTA GAC GTC GTG GTC GCC GCT TCT AAA TCC GTG GCC       1735
Arg Leu Gly Phe Val Asp Val Val Val Ala Ala Ser Lys Ser Val Ala
                 75                  80                  85
GAG CAG TTC TTG AAA ATA CAC GAC GCC AAT TTC GCT AGC CGA CCA CCA       1783
Glu Gln Phe Leu Lys Ile His Asp Ala Asn Phe Ala Ser Arg Pro Pro
             90                  95                 100
AAC TCA GGA GCC AAA CAC ATG GCA TAT AAC TAT CAA GAT CTT GTC TTT       1831
Asn Ser Gly Ala Lys His Met Ala Tyr Asn Tyr Gln Asp Leu Val Phe
        105                 110                 115
GCA CCT TAC GGA CAC CGA TGG AGA CTG TTG AGA AAG ATT AGT TCT GTT       1879
Ala Pro Tyr Gly His Arg Trp Arg Leu Leu Arg Lys Ile Ser Ser Val
    120                 125                 130
CAT CTA TTT TCA GCT AAA GCT CTC GAA GAT TTC AAA CAT GTT CGA CAG       1927
His Leu Phe Ser Ala Lys Ala Leu Glu Asp Phe Lye His Val Arg Gln
135                 140                 145                 150
GTAAAACAAT TATAAACGGT ATTCTCATTT TCTAACGCTA TAGCTCACTG GCCTGTAATC     1987
ATGTCATTTC AATGTTTTGA CTTTTTCTTT ATATATACAT AATTATAATT TATAATTGGG     2047
ATTTCAAACC CTATCTCTCA CTATTTCAAG ACTAGACCGG ATTGGAATTT GAACTTTTGT     2107
AATGAATATT AGTATCTGCA CATAAATTTT ATGTTAAAGT TGGGTTTTCT TAAAGTGAAT     2167
TTATATATTA AAAATATATA AACGATTGGG TTTTACTCAA ATGAATTTAC ATAAGAGCTA     2227
GGTATAAGTG CAAATATGCA ATACTGTCAT TGTCGTGGAT GTATAAAAGT ATGATCTAAC     2287
TTTGATGATG CCATGGAAAA ATTGGAAAGT TCAGATCCAG AGGAAACATT GCTTGAATTA     2347
TAAAATGTAT GGACCACATT GTTTCCTTAA ATGGAAGGTC TCACGAGTTT CTCAATTTCA     2407
GACTACTGAT AATATATGCT ATTATAGATT TTATTTTCTG ATTATTTTTT TTGGTTTAAT     2467
TTAATTAGAG TAAATTTTTA AAAAGAAATA TATGGTTTTG TTAACCGTGT TTTAAAATTT     2527
GATAGAGCTT TTAGATCATA ATCATAATTT TTTCGTATTA ATTGTGATTA TGTTGGACGA     2587
AAATACTTAA TTAGTATTCA AGAAAACTCT TATTCTAAAA ACAGAAATAA ATGAATTTTA     2647
CAG GAA GAG GTT GGA ACG CTA ACG CGG GAG CTA GTG CGT GTT GGC ACG       2695
    Glu Glu Val Gly Thr Leu Thr Arg Glu Leu Val Arg Val Gly Thr
      1               5                  10                  15
AAA CCC GTG AAT TTA GGC CAG TTG GTG AAC ATG TGT GTA GTC AAC GCT       2743
Lys Pro Val Asn Leu Gly Gln Leu Val Asn Met Cys Val Val Asn Ala
                 20                  25                  30
CTA GGA CGA GAG ATG ATC GGA CGG CGA CTG TTC GGC GCC GAC GCC GAT       2791
Leu Gly Arg Glu Met Ile Gly Arg Arg Leu Phe Gly Ala Asp Ala Asp
             35                  40                  45
CAT AAA GCT GAC GAG TTT CGA TCG ATG GTG ACG GAA ATG ATG GCT CTC       2839
His Lys Ala Asp Glu Phe Arg Ser Met Val Thr Glu Met Met Ala Leu
         50                  55                  60
GCC GGA GTA TTT AAC ATC GGA GAT TTC GTG CCG TCA CTT GAT TGG TTA       2887
Ala Gly Val Phe Asn Ile Gly Asp Phe Val Pro Ser Leu Asp Trp Leu
     65                  70                  75
GAT TTA CAA GGC GTC GCT GGT AAA ATG AAA CGG CTT CAC AAA AGA TTC       2935
Asp Leu Gln Gly Val Ala Gly Lys Met Lys Arg Leu His Lys Arg Phe
 80                  85                  90                  95
GAC GCT TTT CTA TCG TCG ATT TTG AAA GAG CAC GAA ATG AAC GGT CAA       2983
Asp Ala Phe Leu Ser Ser Ile Leu Lys Glu His Glu Met Asn Gly Gln
                100                 105                 110
GAT CAA AAG CAT ACA GAT ATG CTT AGC ACT TTA ATC TCC CTT AAA GGA       3031
Asp Gln Lys His Thr Asp Met Leu Ser Thr Leu Ile Ser Leu Lys Gly
            115                 120                 125
ACT GAT CTT GAC GGT GAC GGA GGA AGC TTA ACG GAT ACT GAG ATT AAA       3079
Thr Asp Leu Asp Gly Asp Gly Gly Ser Leu Thr Asp Thr Glu Ile Lys
        130                 135                 140
GCC TTG CTA TTG GTCAGTTTTT TGACAATTAA TTTCCTTAAA AATCGTATAT           3131
Ala Leu Leu Leu
    145
AATGAAAGTT AGATTGTTTT TTTTGGTTGT AAATACAG AAC ATG TTC ACA GCT         3184
                                          Asn Met Phe Thr Ala
                                            1               5
GGA ACT GAC ACG TCA GCA AGT ACG GTG GAC TGC GCT ATA GCT GAA CTT       3232
Gly Thr Asp Thr Ser Ala Ser Thr Val Asp Trp Ala Ile Ala Glu Leu
                 10                  15                  20
ATC CGT CAC CCG GAT ATA ATG GTT AAA GCC CAA GAA GAA CTT GAT ATT       3280
Ile Arg His Pro Asp Ile Met Val Lys Ala Gln Glu Glu Leu Asp Ile
             25                  30                  35
GTT GTG GGC CGT GAC AGG CCT GTT AAT GAA TCA GAC ATC GCT CAG CTT       3328
Val Val Gly Arg Asp Arg Pro Val Asn Glu Ser Asp Ile Ala Gln Leu
         40                  45                  50
CCT TAC CTT CAG GTACCGTTAA CCCAAACCGG AATTTGGAAT TGTTTTGGTT           3380
Pro Tyr Leu Gln
     55
AGCGAGCTAT TGTTGTTAAT CCGGTTTTGG TTTAAAACAG GCG GTT ATC AAA GAG       3435
                                            Ala Val Ile Lys Glu
                                              1               5
AAT TTC AGG CTT CAT CCA CCA ACA CCA CTC TCG TTA CCA CAC ATC GCG        3483
Asn Phe Arg Leu His Pro Pro Thr Pro Leu Ser Leu Pro His Ile Ala
                 10                  15                  20
TCA GAG AGC TGT GAG ATC AAC GGC TAC CAT ATC CCG AAA GGA TCG ACT        3531
Ser Glu Ser Cys Glu Ile Asn Gly Tyr His Ile Pro Lys Gly Ser Thr
             25                  30                  35
CTA TTG ACG AAC ATA TGG GCC ATA GCC CGT GAC CCG GAT CAA TGG TCC        3579
Leu Leu Thr Asn Ile Trp Ala Ile Ala Arg Asp Pro Asp Gln Trp Ser
         40                  45                  50
GAC CCG TTA GCA TTT AAA CCC GAG AGA TTC TTA CCC GGT GGT GAA AAA        3627
Asp Pro Leu Ala Phe Lys Pro Glu Arg Phe Leu Pro Gly Gly Glu Lys
     55                  60                  65
TCC GGC GTT GAT GTG AAA GGA AGC GAT TTC GAG CTA ATA CCG TTC GGA        3675
Ser Gly Val Asp Val Lys Gly Ser Asp Phe Glu Leu Ile Pro Phe Gly
 70                  75                  80                  85
GCT GGG AGG AGA ATC TGT GCC GGT TTA AGT TTA GGG TTA CGT ACG ATT        3723
Ala Gly Arg Arg Ile Cys Ala Gly Leu Ser Leu Gly Leu Arg Thr Ile
                 90                  95                 100
CAG TTT CTT ACG GCG ACG TTG GTT CAA GGA TTT GAT TGG GAA TTA GCT        3771
Gln Phe Leu Thr Ala Thr Leu Val Gln Gly Phe Asp Trp Glu Leu Ala
            105                 110                 115
GGA GGA GTT ACG CCG GAG AAG CTG AAT ATG GAG GAG AGT TAT GGG CTT        3819
Gly Gly Val Thr Pro Glu Lys Leu Asn Met Glu Glu Ser Tyr Gly Leu
        120                 125                 130
ACA CTG CAA AGA GCG GTT CCT TTG GTG GTA CAT CCT AAG CCA AGG TTG        3867
Thr Leu Gln Arg Ala Val Pro Leu Val Val His Pro Lys Pro Arg Leu
    135                 140                 145
GCT CCG AAC GTT TAT GGA CTC GGG TCG GGT TAAAATTTAA CTTTGCTTCT          3917
Ala Pro Asn Val Tyr Gly Leu Gly Ser Gly
150                 155                 160
TGGACAAGGT ATATGGCTTG CACGAAAATA AAGTTTTAAA ACAGCGTAGT TTGATCCGGA      3977
GTTAGCTTTA TGTAAGAACG TGTAACGCCA AATCAAGTCA TTATTAAATA TTGTGAGTTG   4037
TTTGTAACCT ATATATAAAT CTTGAAGAGG AAGATTTCAG AAATCTTGAA TATGTTTTAG   4097
GAAAAACATT GTTTTTTTTA CAGTAGCGCA AGTTGAATTA AAACCTATTC CTTACAGAAC   4157
CAAATGCATT AATAATTCTA GATATTTTTG GCCAAGACAA TCAGATTTTT CAATATTTCA   4217
TATATACTAG GTGGAACACC ACCACCTGCA ACTCTGCAAC ACATGTTACG TTACACAATC   4277
ACTTTTGGCG GTTTTCAATT ATTTATATAA AATTGTAAAT GTTTGTACAC AGTAGAAAAT   4337
TAGTAATAGT GAATTTTGTT TCTCCGAATA TGTATAGCAA TATATATGGC ATGGATCAAA   4397
CTAGCCGACA TCCTAACTTG TTCACAGCTT TCCTTTTTAC TTATCTAGTC GATTAAGCAT   4457
CAGAAAGTAT GTTTTAATTT TTAAATTTGA AAAAGGTGTA CTTACAAGTT CGGGTGTTCA   4517
CACGGAGGAG AGCTACAATA ATGAAAAAGC TGACTCAAGA AGGGCTATAG AAGAAACAAG   4577
AGTCACGGAA CAAGTTGTCA CTCTCAATCT CCAGTACACT AGCTTCCATA ACTCTCTCTC   4637
TTTCTCTCTT TCTTCTCTCT CTAAAAGTTA TCAGAATAGA AATCTCTCTC TCTCAACAAG   4697
TCTAACAGTG CCATTTGTAT CTCTGAACTC CAACATGGCT CCTCTGGTTC TCTACCTTCT   4757
CACTCTCCTC ATGGCTGGCC ATTCCAGTAA GAACTCTCAC TGATCTTCTT CACCTTTGTT   4817
TATGGATTTG GTCTCTCAGT CTCACTCTCG CTTACCCTTT CACATTCAGC TCTGGCTCTC   4877
TGGTTTAAGA AACCCTTAAT CTACAAAGCT TGCTTTCCTC GCAAATGAAC TACCTTACTT   4937
ATCTCTTATG CAACTCTTGT TGATGATTTG CAAACATCTT AACCTCTCGA AACAAGATTT   4997
ACAAATCTTA CTGGCTTCAC TTACAATTTT GTTCCCATTT TTTTCTTCTT TGGTAGGTGC   5057
CTCATGGTGT GTGTGCAAAA CAGGGCTGAG TGACTCAGTG CTACAAAAGA CATTAGACTA   5117
TGCTTGTGGA AATGGAGCTG ACTGTAACCC AACTCACCCA AAAGGCTCTT GCTTCAATCC   5177
TGACAATGTT AGGGCTCATT GCAACTATGC AGTCAATAGC TTCTTCCAAA AGAAAGGTCA   5237
AGCTTCTGAG TCTTGTAACT TCACTGGTAC TGCCACTCTT ACCACCACCG ATCCCAGTAA   5297
GTTTTCAGAA TGTTAACACT CTTGTGATCT TTAGAACCCT ACAAAATTTT GAGTCTCAGA   5357
AAGTTCAAGT TCAAGGTCTT TTGGTTAGAG TACTAAAGAT TCAAGTAGAG ACTAGGCGTG   5417
AGATATTTTT TCTCTGATGT GTGATTTTTT GGCACAGGCT ATACAGGATG TGCATTCCCT   5477
TCTAGTGCTA GGTACGGCTC TTTGCTTCTC TACACATTTA TTTTCTTAAT GGCTTTATCT   5537
AGAACTTTGA AGGATACCAT TTTATTTTTT TTGGACAAAG AAGGATAGCC ATTTAATACT   5597
ACACTTTAAT GTTGGATTAA CTAACTTATT ATGCCTATTT AATGGCCTAC ACTTTAAGTG   5657
GACACAAGCT TGATTTGGTT ATAAAAAAAG TGCACTATAA TCTTATTTTA CTGAACCCTT   5717
TTTTCTATGA TTTTTTTACT AAACTTTAGA TAACATCTAC AACAATTCAA TTGCCTTTTT   5777
TTGGGGATTG TATAAGTTTG AACCTATGGT TAGTGTATTG ACTTGCGCGT CTCTTATTGC   5837
AACGGTTCTT TGAAAACACA TTAATGATAA ATAAATTGAA AAGTATAGAG ATGGCAATTG   5897
TTTCAAAAGC TAATCTTTCT GCTTGCTAAT ACTTTACATA AAAAACAAAA AATTAAGAAG   5957
ATTTTCAAAC AATACAACTT TTTTACCTTG TCCTAACAAA TTCAACTCAA ATGACATGTG   6017
TTTGCTTTAA AATAGTAACA ACTGTAAATT CATTTGCTCT TGAGACATAA GTGCAAGCTA   6077
AAGATAAACG CAAGCAATAC AATTAGGCCT AATTAAGATT ACGAATATTG TTGTTTGTTT   6137
ATAGTGGTTC TAGTGGAAGC GGTAGCACCA CCGTGACGCC AGGCAAAAAC AGTCCAAAAG   6197
GAAGCAACAG CATCACCACA TTTCCCGGCG GAAACAGTCC ATACACTGGC ACACCATCCA   6257
CCGGATTATT AGGAGGCAAT ATCACTGATG CAACTGGAAC CGGGTTGAAC CCGGATTACT   6317
CAACCGAAAG CAGTGGATTT GCGCTCTATT ACTCCAACAA CCTTCTGTTA ACCGGCTTTT   6377
GTTCTCTCGT GATGATGCTC TGAAGAAGAA TCACCGTCTT CTTTTAGTTT ATGCTTAGTC   6437
AAAAAAATAT GTTATTTATA TGTTCTTGTT GTTTTAGAGA TAATTTAATC TGGATTTCGG   6497
TTCTTTTTTA CTTTCCGGTT TTAAGAAAAC AATTATCAAT GTAAAACCAA ATCTACTATC   6557
GATCGGTTTG GTACGAATTC CTGCAGCCCG GGGGATCC                           6595
(2)关于SEQ ID NO:10的信息
(i)序列特征
(A)长度:149个氨基酸
(B)类型:氨基酸
(D):拓扑结构:线型
(ii)分子类型:蛋白质
(xi)序列描述:SEQ ID NO:10
Met Ala Thr Leu Phe Leu Thr Ile Leu Leu Ala Thr Val Leu Phe Leu
  1               5                  10                  15
Ile Leu Arg Ile Phe Ser His Arg Arg Asn Arg Ser His Asn Asn Arg
             20                  25                  30
Leu Pro Pro Gly Pro Asn Pro Trp Pro Ile Ile Gly Asn Leu Pro His
         35                  40                  45
Met Gly Thr Lys Pro His Arg Thr Leu Ser Ala Met Val Thr Thr Tyr
     50                  55                  60
Gly Pro Ile Leu His Leu Arg Leu Gly Phe Val Asp Val Val Val Ala
 65                  70                  75                  80
Ala Ser Lys Ser Val Ala Glu Gln Phe Leu Lys Ile His Asp Ala Asn 
                 85                  90                  95
Phe Ala Ser Arg Pro Pro Asn Ser Gly Ala Lys His Met Ala Tyr Asn
            100                 105                 110
Tyr Gln Asp Leu Val Phe Ala Pro Tyr Gly His Arg Trp Arg Leu Leu
        115                 120                 125
Arg Lys Ile Ser Ser Val His Leu Phe Ser Ala Lys Ala Leu Glu Asp
    130                 135                 140
Phe Lys His Val Arg Gln
145                 150
(2)关于SEQ ID NO:11的信息
(i)序列特征
(A)长度:147个氨基酸
(B)类型:氨基酸
(D)拓扑结构:线型
(ii)分子类型:蛋白质
(xi)序列描述:SEQ ID NO:11
Glu Glu Val Gly Thr Leu Thr Arg Glu Leu Val Arg Val Gly Thr Lys
  1               5                  10                  15
Pro Val Asn Leu Gly Gln Leu Val Asn Met Cys Val Val Asn Ala Leu
             20                  25                  30
Gly Arg Glu Met Ile Gly Arg Arg Leu Phe Gly Ala Asp Ala Asp His
         35                  40                  45
Lys Ala Asp Glu Phe Arg Ser Met Val Thr Glu Met Met Ala Leu Ala
     50                  55                  60
Gly Val Phe Asn Ile Gly Asp Phe Val Pro Ser Leu Asp Trp Leu Asp 
 65                  70                  75                  80
Leu Gln Gly Val Ala Gly Lys Met Lys Arg Leu His Lys Arg Phe Asp
                85                  90                  95
Ala Phe Leu Ser Ser Ile Leu Lys Glu His Glu Met Asn Gly Gln Asp
                100             105                 110
Gln Lys His Thr Asp Met Leu Ser Thr Leu Ile Ser Leu Lys Gly Thr
        115                 120                 125
Asp Leu Asp Gly Asp Gly Gly Ser Leu Thr Asp Thr Glu Ile Lys Ala
    130                 135                 140
Leu Leu Leu
145
(2)关于SEQ ID NO:12的信息
(i)序列特征
(A)长度:57个氨基酸
(B)类型:氨基酸
(D)拓扑结构:线型
(ii)分子类型:蛋白质
(xi)序列描述:SEQ ID NO:12
Asn Met Phe Thr Ala Gly Thr Asp Thr Ser Ala Ser Thr Val Asp Trp
  1               5                  10                  15
Ala Ile Ala Glu Leu Ile Arg His Pro Asp Ile Met Val Lys Ala Gln
             20                  25                  30
Glu Glu Leu Asp Ile Val Val Gly Arg Asp Arg Pro Val Asn Glu Ser
         35                  40                  45
Asp Ile Ala Gln Leu Pro Tyr Leu Gln
     50                  55
(2)关于SEQ ID NO:13的信息
(i)序列特征
(A)长度:160个氨基酸
(B)类型:氨基酸
(D)拓扑结构:线型
(ii)分子类型:蛋白质
(xi)序列描述:SEQ ID NO:13
Ala Val Ile Lys Glu Asn Phe Arg Leu His Pro Pro Thr Pro Leu Ser
  1               5                  10                  15
Leu Pro His Ile Ala Ser Glu Ser Cys Glu Ile Asn Gly Tyr His Ile
             20                  25                  30
Pro Lys Gly Ser Thr Leu Leu Thr Asn Ile Trp Ala Ile Ala Arg Asp
         35                  40                  45
Pro Asp Gln Trp Ser Asp Pro Leu Ala Phe Lys Pro Glu Arg Phe Leu
     50                  55                  60
Pro Gly Gly Glu Lys Ser Gly Val Asp Val Lys Gly Ser Asp Phe Glu
 65                  70                  75                  80
Leu Ile Pro Phe Gly Ala Gly Arg Arg Ile Cys Ala Gly Leu Ser Leu
                 85                  90                  95
Gly Leu Arg Thr Ile Gln Phe Leu Thr Ala Thr Leu Val Gln Gly Phe
            100                 105                 110
Asp Trp Glu Leu Ala Gly Gly Val Thr Pro Glu Lys Leu Asn Met Glu
        115                 120                 125
Glu Ser Tyr Gly Leu Thr Leu Gln Arg Ala Val Pro Leu Val Val His
    130                 135                 140
Pro Lys Pro Arg Leu Ala Pro Asn Val Tyr Gly Leu Gly Ser Gly
145                 150                 155
(2)关于SEQ ID NO:14的信息
(i)序列特征
(A)长度:1748个氨基酸
(B)类型:核酸
(C)链型:单链
(D)拓扑结构:线型
(ii)分子类型:DNA
(ix)特征:
(A)名称/键:CDS
(B)位置:22..1563
(xi)序列描述:SEQ ID NO:14
TGTCGAGAAA GAAGAACAGC C ATG TTT CTC ATA GTA GTG ATC ACC TTC CTC    51
                        Met Phe Leu Ile Val Val Ile Thr Phe Leu
                          1               5                  10
TTC GCC GTG TTT TTG TTC CGG CTT CTT TTC TCC GGC AAA TCC CAA CGC    99
Phe Ala Val Phe Leu Phe Arg Leu Leu Phe Ser Gly Lys Ser Gln Arg
                 15                  20                  25
CAC TCG CTC CCT CTC CCT CCT GGC CCC AAA CCA TGG CCG GTG GTT GGC    147
His Ser Leu Pro Leu Pro Pro Gly Pro Lys Pro Trp Pro Val Val Gly
             30                  35                  40
AAC TTA CCT CAC TTG GGC CCC TTC CCG CAC CAC TCC ATC GCG GAG TTG          195
Asn Leu Pro His Leu Gly Pro Phe Pro His His Ser Ile Ala Glu Leu
         45                  50                  55
GCG AAG AAA CAC GGG CCG CTC ATG CAC CTC CGC CTC GGC TAC GTT GAC          243
Ala Lys Lys His Gly Pro Leu Met His Leu Arg Leu Gly Tyr Val Asp
     60                  65                  70
GTA GTC GTG GCG GCA TCA GCA TCC GTA GCG GCC CAG TTC TTG AAG ACT          291
Val Val Val Ala Ala Ser Ala Ser Val Ala Ala Gln Phe Leu Lys Thr
 75                  80                  85                  90
CAC GAC GCC AAT TTC TCC AGC CGA CCG CCC AAC TCC GGC GCC AAG CAC          339
His Asp Ala Asn Phe Ser Ser Arg Pro Pro Asn Ser Gly Ala Lys His
                 95                 100                 105
CTC GCC TAT AAC TAC CAG GAC CTC GTG TTC AGG CCG TAC GGT CCA CGG          387
Leu Ala Tyr Asn Tyr Gln Asp Leu Val Phe Arg Pro Tyr Gly Pro Arg
            110                 115                 120
TGG CGC ATG TTC CGG AAG ATC AGC TCC GTC CAT CTG TTC TCC GGC AAA          435
Trp Arg Met Phe Arg Lys Ile Ser Ser Val His Leu Phe Ser Gly Lys
        125                 130                 135
GCC TTG GAT GAT CTT AAA CAC GTC CGG CAG GAG GAG GTA AGT GTG CTA          483
Ala Leu Asp Asp Leu Lys His Val Arg Gln Glu Glu Val Ser Val Leu
    140                 145                 150
GCG CAT GCC TTG GCA AAT TCA GGG TCA AAG GTA GTG AAC CTG GCG CAA          531
Ala His A la Leu Ala Asn Ser Gly Ser LysVal Val Asn Leu Ala Gln
155                 160                 165                 170
CTG CTG AAC CTG TGC ACG GTC AAT GCT CTA GGA AGG GTG ATG GTA GGG          579
Leu Leu Asn Leu Cys Thr Val Asn Ala Leu Gly Arg Val Met Val Gly
                175                 180                 185
CGG AGG GTT TTC GGC GAC GGC AGC GGA GGC GAC GAT CCG AAG GCG GAC          627
Arg Arg Val Phe Gly Asp Gly Ser Gly Gly Asp Asp Pro Lys Ala Asp
            190                 195                 200
GAG TTC AAA TCG ATG GTG GTG GAG ATG ATG GTG TTG GCA GGA GTG TTC         675
Glu Phe Lys Ser Met Val Val Glu Met Met Val Leu Ala Gly Val Phe
        205                 210                 215
AAC ATA GGT GAC TTC ATC CCC TCT CTC GAA TGG CTT GAC TTG CAA GGC         723
Asn Ile Gly Asp Phe Ile Pro Ser Leu Glu Trp Leu Asp Leu Gln Gly
    220                 225                 230
GTG GCG TCC AAG ATG AAG AAG CTC CAC AAG AGA TTC GAC GAC TTC TTG         771
Val Ala Ser Lys Met Lys Lys Leu His Lys Arg Phe Asp Asp Phe Leu
235                 240                 245                 250
ACA GCC ATT GTC GAG GAC CAC AAG AAG GGC TCC GGC ACG GCG GGG CAC         819
Thr Ala Ile Val Glu Asp His Lys Lys Gly Ser Gly Thr Ala Gly His
                255                 260                 265
GTC GAC ATG TTG ACC ACT CTG CTC TCG CTC AAG GAA GAC GCC GAC GGC         867
Val Asp Met Leu Thr Thr Leu Leu Ser Leu Lys Glu Asp Ala Asp Gly
            270                 275                 280
GAA GGA GGC AAG CTC ACC GAT ACT GAA ATC AAA GCT TTG CTT TTG AAC         915
Glu Gly Gly Lys Leu Thr Asp Thr Glu Ile Lys Ala Leu Leu Leu Asn
        285                 290                 295
ATG TTC ACG GCT GGC ACT GAT ACG TCA TCG AGC ACG GTG GAA TGG GCA         963
Met Phe Thr Ala Gly Thr Asp Thr Ser Ser Ser Thr Val Glu Trp Ala
    300                 305                 310
ATA GCT GAA CTC ATT CGG CAC CCT CAT ATG CTA GCG CGA GTT CAG AAA         1011
Ile Ala Glu Leu Ile Arg His Pro His Met Leu Ala Arg Val Gln Lys
315                 320                 325                 330
GAG CTT GAC GAT TTT GTT GGC CAT GAC CGA CTT GTG ACC GAA TCC GAC         1059
Glu Leu Asp Asp Phe Val Gly His Asp Arg Leu Val Thr Glu Ser Asp
                335                 340                 345
ATA CCC AAC CTC CCT TAC CTC CAA GCC GTG ATC AAG GAA ACG TTC CGA        1107
Ile Pro Asn Leu Pro Tyr Leu Gln Ala Val Ile Lys Glu Thr Phe Arg
            350                 355                 360
CTC CAC CCA TCC ACT CCT CTC TCG TTG CCT CGT ATG GCA GCC GAG AGT        1155
Leu His Pro Ser Thr Pro Leu Ser Leu Pro Arg Met Ala Ala Glu Ser
        365                 370                 375
TGC GAA ATC AAC GGG TAC CAC ATC CCG AAA GGC TCC ACA CTC TTG GTC        1203
Cys Glu Ile Asn Gly Tyr His Ile Pro Lys Gly Ser Thr Leu Leu Val
    380                 385                 390
AAT GTA TGG GCC ATA TCG CGT GAC CCG GCT GAA TGG GCC GAC CCA CTG        1251
Asn Val Trp Ala Ile Ser Arg Asp Pro Ala Glu Trp Ala Asp Pro Leu
395                 400                 405                 410
GAG TTC AAG CCC GAG AGG TTC CTG CCG GGG GGC GAA AAG CCT AAT GTT        1299
Glu Phe Lys Pro Glu Arg Phe Leu Pro Gly Gly Glu Lys Pro Asn Val
                415                 420                 425
GAT ATT AGA GGA AAC GAT TTT GAA GTC ATA CCC TTC GGT GCC GGG CGA        1347
Asp Ile Arg Gly Asn Asp Phe Glu Val Ile Pro Phe Gly Ala Gly Arg
            430                 435                 440
AGA ATA TGT GCC GGG ATG AGC TTG GGC CTG CGT ATG GTC CAT TTA ATG        1395
Arg Ile Cys Ala Gly Met Ser Leu Gly Leu Arg Met Val His Leu Met
        445                 450                 455
ACT GCA ACA TTG GTC CAC GCA TTT AAT TGG GCC TTG GCT GAT GGG CTG        1443
Thr Ala Thr Leu Val His Ala Phe Asn Trp Ala Leu Ala Asp Gly Leu
    460                 465                 470
ACC GCT GAG AAG TTA AAC ATG GAT GAA GCA TAT GGG CTC ACT CTA CAA        1491
Thr Ala Glu Lys Leu Asn Met Asp Glu Ala Tyr Gly Leu Thr Leu Gln
475                 480                 485                 490
CGA GCT GCA CCG TTA ATG GTG CAC CCG CGC ACC AGG CTG GCC CCA CAG       1539
Arg Ala Ala Pro Leu Met Val His Pro Arg Thr Arg Leu Ala Pro Gln
                495                 500                 505
GCA TAT AAA ACT TCA TCA TCT TAATTAGAGA GCTATGTTCT GGGTGTGCCC          1590
Ala Tyr Lys Thr Ser Ser Ser
            510
GGTTTGATGT CTCCATGTTT TCTATTTAGG TTTAAATCTG TAAGATAAGG TGATTCTATG     1650
CTGAATCACA AAAGTTGCTA TCTAAATTCC ATGTCCAATG AAAACGTTCT TCTTCCCTTC     1710
TTATAATTTA TGAATACTTA TGATATAGGC GACAGCAA                             1748
(2)关于SEQ ID NO:15的信息
(i)序列特征
(A)长度:513个氨基酸
(B)类型:氨基酸
(D)拓扑结构:线型
(ii)分子类型:蛋白质
(xi)序列描述:SEQ ID NO:15
Met Phe Leu Ile Val Val Ile Thr Phe Leu Phe Ala Val Phe Leu Phe
  1               5                  10                  15
Arg Leu Leu Phe Ser Gly Lys Ser Gln Arg His Ser Leu Pro Leu Pro
             20                  25                  30
Pro Gly Pro Lys Pro Trp Pro Val Val Gly Asn Leu Pro His Leu Gly
         35                  40                  45
Pro Phe Pro His His Ser Ile Ala Glu Leu Ala Lys Lys His Gly Pro
     50                  55                  60
Leu Met His Leu Arg Leu Gly Tyr Val Asp Val Val Val Ala Ala Ser
 65                  70                  75                  80
Ala Ser Val Ala Ala Gln Phe Leu Lys Thr His Asp Ala Asn Phe Ser
                 85                  90                  95
Ser Arg Pro Pro Asn Ser Gly Ala Lys His Leu Ala Tyr Asn Tyr Gln
            100                 105                 110
Asp Leu Val Phe Arg Pro Tyr Gly Pro Arg Trp Arg Met Phe Arg Lys
        115                 120                 125
Ile Ser Ser Val His Leu Phe Ser Gly Lys Ala Leu Asp Asp Leu Lys
    130                 135                 140
His Val Arg Gln Glu Glu Val Ser Val Leu Ala His Ala Leu Ala Asn
145                 150                 155                 160
Ser Gly Ser Lys Val Val Asn Leu Ala Gln Leu Leu Asn Leu Cys Thr
                165                 170                 175
Val Asn Ala Leu Gly Arg Val Met Val Gly Arg Arg Val Phe Gly Asp
            180                 185                 190
Gly Ser Gly Gly Asp Asp Pro Lys Ala Asp Glu Phe Lys Ser Met Val
        195                 200                 205
Val Glu Met Met Val Leu Ala Gly Val Phe Asn Ile Gly Asp Phe Ile
     210                 215                 220
Pro Ser Leu Glu Trp Leu Asp Leu Gln Gly Val Ala Ser Lys Met Lys
225                 230                 235                 240
Lys Leu His Lys Arg Phe Asp Asp Phe Leu Thr Ala Ile Val Glu Asp
                245                 250                 255
His Lys Lys Gly Ser Gly Thr Ala Gly His Val Asp Met Leu Thr Thr
            260                 265                 270
Leu Leu Ser Leu Lys Glu Asp Ala Asp Gly Glu Gly Gly Lys Leu Thr
        275                 280                 285
Asp Thr Glu Ile Lys Ala Leu Leu Leu Asn Met Phe Thr Ala Gly Thr
    290                 295                 300
Asp Thr Ser Ser Ser Thr Val Glu Trp Ala Ile Ala Glu Leu Ile Arg
305                 310                 315                 320
His Pro His Met Leu Ala Arg Val Gln Lys Glu Leu Asp Asp Phe Val
                325                 330                 335
Gly His Asp Arg Leu Val Thr Glu Ser Asp Ile Pro Asn Leu Pro Tyr
            340                 345                 350
Leu Gln Ala Val Ile Lys Glu Thr Phe Arg Leu His Pro Ser Thr Pro
        355                 360                 365
Leu Ser Leu Pro Arg Met Ala Ala Glu Ser Cys Glu Ile Asn Gly Tyr
    370                 375                 380
His Ile Pro Lys Gly Ser Thr Leu Leu Val Asn Val Trp Ala Ile Ser
385                 390                 395                 400
Arg Asp Pro Ala Glu Trp Ala Asp Pro Leu Glu Phe Lys Pro Glu Arg
                405                 410                 415
Phe Leu Pro Gly Gly Glu Lys Pro Asn Val Asp Ile Arg Gly Asn Asp
            420                 425                 430
Phe Glu Val Ile Pro Phe Gly Ala Gly Arg Arg Ile Cys Ala Gly Met
        435                 440                 445
Ser Leu Gly Leu Arg Met Val His Leu Met Thr Ala Thr Leu Val His
    450                 455                 460
Ala Phe Asn Trp Ala Leu Ala Asp Gly Leu Thr Ala Glu Lys Leu Asn
465                 470                 475                 480
Met Asp Glu Ala Tyr Gly Leu Thr Leu Gln Arg Ala Ala Pro Leu Met
                485                 490                 495
Val His Pro Arg Thr Arg Leu Ala Pro Gln Ala Tyr Lys Thr Ser Ser
            500                 505                 510
Ser
(2)关于SEQ ID NO:16的信息
(i)序列特征
(A)长度:1660个氨基酸
(B)类型:核酸
(C)链型:单链
(D)拓扑结构:线型
(ii)分子类型:DNA
(ix)特征:
(A)名称/键:CDS
(B)位置:4..1528
(xi)序列描述:SEQ ID NO:16
AAA ATG ACC ATT TTA GCT TTC GTA TTT TAC GCC CTC ATC CTC GGG TCA     48
    Met Thr Ile Leu Ala Phe Val Phe Tyr Ala Leu Ile Leu Gly Ser
      1               5                  10                  15
GTA CTC TAT GTA TTT CTT AAC TTA AGT TCA CGT AAA TCC GCC AGA CTC     96
Val Leu Tyr Val Phe Leu Asn Leu Ser Ser Arg Lys Ser Ala Arg Leu
                 20                  25                  30
CCA CCC GGG CCA ACA CCA TGG CCT ATA GTC GGG AAC TTA CCA CAC CTT          144
Pro Pro Gly Pro Thr Pro Trp Pro Ile Val Gly Asn Leu Pro His Leu
             35                  40                  45
GGC CCA ATC CCA CAC CAC GCA CTC GCG GCC TTA GCC AAG AAG TAC GGG          192
Gly Pro Ile Pro His His Ala Leu Ala Ala Leu Ala Lys Lys Tyr Gly
         50                  55                  60
CCA TTG ATG CAC CTG CGG CTC GGG TGT GTG GAC GTG GTT GTG GCC GCG          240
Pro Leu Met His Leu Arg Leu Gly Cys Val Asp Val Val Val Ala Ala
     65                  70                  75
TCT GCT TCC GTA GCT GCA CAG TTT TTA AAA GTT CAC GAC GCA AAT TTT          288
Ser Ala Ser Val Ala Ala Gln Phe Leu Lys Val His Asp Ala Asn Phe
 80                  85                  90                  95
GCT AGT AGG CCG CCA AAT TCT GGC GCG AAA CAT GTG GCG TAT AAT TAT          336
Ala Ser Arg Pro Pro Asn Ser Gly Ala Lys His Val Ala Tyr Asn Tyr
                100                 105                 110
CAG GAT CTT GTG TTT GCA CCT TAT GGT CCA AGG TGG CGT TTG TTA AGG          384
Gln Asp Leu Val Phe Ala Pro Tyr Gly Pro Arg Trp Arg Leu Leu Arg
            115                 120                 125
AAG ATT TGT TCG GTC CAT TTG TTT TCT GCT AAA GCA CTT GAT GAT TTT          432
Lys Ile Cys Ser Val His Leu Phe Ser Ala Lys Ala Leu Asp Asp Phe
        130                 135                 140
CGT CAT GTT CGA CAG GAG GAG GTA GCA GTC CTA ACC CGC GTA CTA CTG          480
Arg His Val Arg Gln Glu Glu Val Ala Val Leu Thr Arg Val Leu Leu
    145                 150                 155
AGT GCT GGA AAC TCA CCG GTA CAG CTT GGC CAA CTA CTT AAC GTG TGT          528
Ser Ala Gly Asn Ser Pro Val Gln Leu Gly Gln Leu Leu Asn Val Cys
160                 165                 170                 175
GCC ACA AAC GCC TTA GCA CGG GTA ATG TTA GGT AGG AGA GTT TTC GGA         576
Ala Thr Asn Ala Leu Ala Arg Val Met Leu Gly Arg Arg Val Phe Gly
                180                 185                 190
GAC GGA ATT GAC AGG TCA GCC AAT GAG TTC AAA GAT ATG GTA GTA GAG         624
Asp Gly Ile Asp Arg Ser Ala Asn Glu Phe Lys Asp Met Val Val Glu
            195                 200                 205
TTA ATG GTA TTA GCA GGA GAA TTT AAC CTT GGT GAC TTT ATT CCT GTA         672
Leu Met Val Leu Ala Gly Glu Phe Asn Leu Gly Asp Phe Ile Pro Val
        210                 215                 220
CTT GAC CTA TTC GAC CTA CAA GGC ATT ACT AAA AAA ATG AAG AAG CTT         720
Leu Asp Leu Phe Asp Leu Gln Gly Ile Thr Lys Lys Met Lys Lys Leu
    225                 230                 235
CAT GTT CGG TTC GAT TCA TTT CTT AGT AAG ATC GTT GAG GAG CAT AAA         768
His Val Arg Phe Asp Ser Phe Leu Ser Lys Ile Val Glu Glu His Lys
240                 245                 250                 255
ACG GCA CCT GGT GGG TTG GGT CAT ACT GAT TTG CTG AGC ACG TTG ATT         816
Thr Ala Pro Gly Gly Leu Gly His Thr Asp Leu Leu Ser Thr Leu Ile
                260                 265                 270
TCA CTT AAA GAT GAT GCT GAT ATT GAA GGT GGG AAG CTT ACA GAT ACT         864
Ser Leu Lys Asp Asp Ala Asp Ile Glu Gly Gly Lys Leu Thr Asp Thr
            275                 280                 285
GAA ATC AAA GCT TTG CTT CTG AAT TTA TTC GCT GCG GGA ACA GAC ACA         912
Glu Ile Lys Ala Leu Leu Leu Asn Leu Phe Ala Ala Gly Thr Asp Thr
        290                 295                 300
TCC TCT AGT ACA GTA GAA TGG GCA ATA GCC GAA CTC ATT CGT CAT CCA         960
Ser Ser Ser Thr Val Glu Trp Ala Ile Ala Glu Leu Ile Arg His Pro
    305                 310                 315
CAA ATA TTA AAA CAA GCC CGA GAA GAG ATA GAC GCT GTA GTT GGT CAA    1008
Gln Ile Leu Lys Gln Ala Arg Glu Glu Ile Asp Ala Val Val Gly Gln
320                 325                 330                 335
GAC CGG CTT GTA ACA GAA TTG GAC TTG AGC CAA CTA ACA TAC CTC CAG    1056
Asp Arg Leu Val Thr Glu Leu Asp Leu Ser Gln Leu Thr Tyr Leu Gln
                340                 345                 350
GCT CTT GTG AAA GAG GTG TTT AGG CTC CAC CCT TCA ACG CCA CTC TCC    1104
Ala Leu Val Lys Glu Val Phe Arg Leu His Pro Ser Thr Pro Leu Ser
            355                  360                 365
TTA CCA AGA ATA TCA TCC GAG AGT TGT GAG GTC GAT GGG TAT TAT ATC    1152
Leu Pro Arg Ile Ser Ser Glu Ser Cys Glu Val Asp Gly Tyr Tyr Ile
        370                 375                 380
CCT AAG GGA TCC ACA CTC CTC GTT AAC GTG TGG GCC ATT GCG CGA GAC    1200
Pro Lys Gly Ser Thr Leu Leu Val Asn Val Trp Ala Ile Ala Arg Asp
    385                 390                 395
CCA AAA ATG TGG GCG GAT CCT CTT GAA TTT AGG CCT TCT CGG TTT TTA    1248
Pro Lys Met Trp Ala Asp Pro Leu Glu Phe Arg Pro Ser Arg Phe Leu
400                 405                 410                 415
CCC GGG GGA GAA AAG CCC GGT GCT GAT GTT AGG GGA AAT GAT TTT GAA    1296
Pro Gly Gly Glu Lys Pro Gly Ala Asp Val Arg Gly Asn Asp Phe Glu
                420                 425                 430
GTT ATA CCA TTT GGG GCA GGA CGA AGG ATT TGT GCG GGT ATG AGC CTA    1344
Val Ile Pro Phe Gly Ala Gly Arg Arg Ile Cys Ala Gly Met Ser Leu
            435                 440                 445
GGC TTG AGA ATG GTC CAG TTG CTC ATT GCA ACA TTG GTC CAA ACT TTT    1392
Gly Leu Arg Met Val Gln Leu Leu Ile Ala Thr Leu Val Gln Thr Phe
        450                 455                 460
GAT TGG GAA CTG GCT AAC GGG TTA GAG CCG GAG ATG CTC AAC ATG GAA    1440
Asp Trp Glu Leu Ala Asn Gly Leu Glu Pro Glu Met Leu Asn Met Glu
    465                 470                 475
GAA GCG TAT GGA TTG ACC CTT CAA CGG GCT GCA CCC TTG ATG GTT CAC        1488
Glu Ala Tyr Gly Leu Thr Leu Gln Arg Ala Ala Pro Leu Met Val His
480                 485                 490                 495
CCG AAG CCG AGG TTA GCT CCC CAC GTA TAT GAA AGT ATT T AAGGACTAGT       1538
Pro Lys Pro Arg Leu Ala Pro His Val Tyr Glu Ser Ile
                500                 505
TTCTCTTTTG CCTTTTTGTT TCGCAAAGGT TAATGAATAA ACGATTTCAT GACTCAGATA      1598
GTTATGTAAA CAATTGTGTT TGCTGTTTAT ATATTTATCT ATTTTTCTAG AACAAAAAAA      1658
AA                                                                     1660
(2)关于SEQ ID NO:17的信息
(i)序列特征
(A)长度:508个氨基酸
(B)类型:氨基酸
(D)拓扑结构:线型
(ii)分子类型:蛋白质
(xi)序列描述:SEQ ID NO:17
Met Thr Ile Leu Ala Phe Val Phe Tyr Ala Leu Ile Leu Gly Ser Val
  1               5                  10                  15
Leu Tyr Val Phe Leu Asn Leu Ser Ser Arg Lys Ser Ala Arg Leu Pro
             20                  25                  30
Pro Gly Pro Thr Pro Trp Pro Ile Val Gly Asn Leu Pro His Leu Gly 
         35                  40                  45
Pro Ile Pro His His Ala Leu Ala Ala Leu Ala Lys Lys Tyr Gly Pro
     50                  55                  60
Leu Met His Leu Arg Leu Gly Cys Val Asp Val Val Val Ala Ala Ser
 65                  70                  75                  80
Ala Ser Val Ala Ala Gln Phe Leu Lys Val His Asp Ala Asn Phe Ala
                 85                  90                  95
Ser Arg Pro Pro Asn Ser Gly Ala Lys His Val Ala Tyr Asn Tyr Gln
            100                 105                 110
Asp Leu Val Phe Ala Pro Tyr Gly Pro Arg Trp Arg Leu Leu Arg Lys
        115                 120                 125
Ile Cys Ser Val His Leu Phe Ser Ala Lys Ala Leu Asp Asp Phe Arg
    130                 135                 140
His Val Arg Gln Glu Glu Val Ala Val Leu Thr Arg Val Leu Leu Ser
145                 150                 155                 160
Ala Gly Asn Ser Pro Val Gln Leu Gly Gln Leu Leu Asn Val Cys Ala
                165                 170                 175
Thr Asn Ala Leu Ala Arg Val Met Leu Gly Arg Arg Val Phe Gly Asp
            180                 185                 190
Gly Ile Asp Arg Ser Ala Asn Glu Phe Lys Asp Met Val yal Glu Leu
        195                 200                 205
Met Val Leu Ala Gly Glu Phe Asn Leu Gly Asp Phe Ile Pro Val Leu
    210                 215                 220
Asp Leu Phe Asp Leu Gln Gly Ile Thr Lys Lys Met Lys Lys Leu His
225                 230                 235                 240
Val Arg Phe Asp Ser Phe Leu Ser Lys Ile Val Glu Glu His Lys Thr
                245                 250                 255
Ala Pro Gly Gly Leu Gly His Thr Asp Leu Leu Ser Thr Leu Ile Ser
            260                 265                 270
Leu Lys Asp Asp Ala Asp Ile Glu Gly Gly Lys Leu Thr Asp Thr Glu
        275                 280                 285
Ile Lys Ala Leu Leu Leu Asn Leu Phe Ala Ala Gly Thr Asp Thr Ser
    290                 295                 300
Ser Ser Thr Val Glu Trp Ala Ile Ala Glu Leu Ile Arg His Pro Gln
305                 310                 315                 320
Ile Leu Lys Gln Ala Arg Glu Glu Ile Asp Ala Val Val Gly Gln Asp
                325                 330                 335
Arg Leu Val Thr Glu Leu Asp Leu Ser Gln Leu Thr Tyr Leu Gln Ala
            340                 345                 350
Leu Val Lys Glu Val Phe Arg Leu His Pro Ser Thr Pro Leu Ser Leu
        355                 360                 365
Pro Arg Ile Ser Ser Glu Ser Cys Glu Val Asp Gly Tyr Tyr Ile Pro
    370                 375                 380
Lys Gly Ser Thr Leu Leu Val Asn Val Trp Ala Ile Ala Arg Asp Pro
385                 390                 395                 400
Lys Met Trp Ala Asp Pro Leu Glu Phe Arg Pro Ser Arg Phe Leu Pro
                405                 410                 415
Gly Gly Glu Lys Pro Gly Ala Asp Val Arg Gly Asn Asp Phe Glu Val
            420                 425                 430
Ile Pro Phe Gly Ala Gly Arg Arg Ile Cys Ala Gly Met Ser Leu Gly
        435                 440                 445
Leu Arg Met Val Gln Leu Leu Ile Ala Thr Leu Val Gln Thr Phe Asp
    450                 455                 460
Trp Glu Leu Ala Asn Gly Leu Glu Pro Glu Met Leu Asn Met Glu Glu
465                 470                 475                 480
Ala Tyr Gly Leu Thr Leu Gln Arg Ala Ala Pro Leu Met Val His Pro
                485                 490                 495
Lys Pro Arg Leu Ala Pro His Val Tyr Glu Ser Ile
            500                 505
(2)关于SEQ ID NO:18的信息
(i)序列特征
(A)长度:1815个氨基酸
(B)类型:核酸
(D)拓扑结构:线型
(ii)分子类型:DNA    
(ix)特征:
(A)名称/键:CDS
(B)位置107..1631
(xi)序列描述:SEQ ID NO:18
CTAAATTAAT TAATAAATAC ACACACGACG AGATGTATGT AATGTAATGT AATATTATTA            60
CATACATCAT CACCGAATAC GCACGCTACT ACCACTGCGA TTAGCC ATG AGT CCC               115
                                                   Met Ser Pro
                                                     1
TTA GCC TTG ATG ATC ATA AGT ACC TTA TTA GGG TTT CTC CTA TAC CAC              163
Leu Ala Leu Met Ile Ile Ser Thr Leu Leu Gly Phe Leu Leu Tyr His
      5                  10                  15
TCT CTT CGC TTA CTA CTC TTC TCC GGC CAA GGT CGC CGA CTA CTA CCA         211
Ser Leu Arg Leu Leu Leu Phe Ser Gly Gln Gly Arg Arg Leu Leu Pro
 20                  25                  30                  35
CCA GGT CCA CGC CCG TGG CCG CTG GTG GGA AAT CTC CCG CAC TTA GGC         259
Pro Gly Pro Arg Pro Trp Pro Leu Val Gly Asn Leu Pro His Leu Gly
                 40                  45                  50
CCG AAG CCA CAC GCC TCC ATG GCC GAG CTC GCG CGA GCC TAC GGA CCC         307
Pro Lys Pro His Ala Ser Met Ala Glu Leu Ala Arg Ala Tyr Gly Pro
             55                  60                  65
CTC ATG CAC CTA AAG ATG GGG TTC GTC CAC GTC GTG GTG GCT TCG TCG         355
Leu Met His Leu Lys Met Gly Phe Val His Val Val Val Ala Ser Ser
         70                  75                  80
GCG AGC GCG GCG GAG CAG TGC CTG AGG GTT CAC GAC GCG AAT TTC TTG         403
Ala Ser Ala Ala Glu Gln Cys Leu Arg Val His Asp Ala Asn Phe Leu
     85                  90                  95
AGC AGG CCA CCC AAC TCC GGC GCC AAG CAC GTC GCT TAC AAC TAC GAG         451
Ser Arg Pro Pro Asn Ser Gly Ala Lys His Val Ala Tyr Asn Tyr Glu
100                 105                 110                 115
GAC TTG GTT TTC AGA CCG TAC GGT CCC AAG TGG AGG CTG TTG AGG AAG         499
Asp Leu Val Phe Arg Pro Tyr Gly Pro Lys Trp Arg Leu Leu Arg Lys
                120                 125                 130
ATA TGC GCT CAG CAT ATT TTC TCC GTC AAG GCT ATG GAT GAC TTC AGG         547
Ile Cys Ala Gln His Ile Phe Ser Val Lys Ala Met Asp Asp Phe Arg
            135                 140                 145
CGC GTC AGA GAG GAA GAG GTG GCC ATC CTG AGT CGC GCT CTA GCA GGC         595
Arg Val Arg Glu Glu Glu Val Ala Ile Leu Ser Arg Ala Leu Ala Gly
        150                 155                 160
AAA AGG GCC GTA CCC ATA GGC CAA ATG CTC AAC GTG TGC GCC ACA AAC         643
Lys Arg Ala Val Pro Ile Gly Gln Met Leu Asn Val Cys Ala Thr Asn
    165                 170                 175
GCC CTA TCT CGC GTC ATG ATG GGG CGG CGC GTG GTG GGC CAC GCG GAT         691
Ala Leu Ser Arg Val Met Met Gly Arg Arg Val Val Gly His Ala Asp
180                 185                 190                 195
GGA ACC AAC GAC GCC AAG GCG GAG GAG TTC AAA GCC ATG GTC GTC GAG         739
Gly Thr Asn Asp Ala Lys Ala Glu Glu Phe Lys Ala Met Val Val Glu
                200                 205                 210
CTC ATG GTC CTC TCC GGC GTC TTC AAC ATC GGT GAT TTC ATC CCC TTC         787
Leu Met Val Leu Ser Gly Val Phe Asn Ile Gly Asp Phe Ile Pro Phe
            215                 220                 225
CTC GAG CCT CTC GAC TTG CAG GGA GTG GCT TCC AAG ATG AAG AAA CTC         835
Leu Glu Pro Leu Asp Leu Gln Gly Val Ala Ser Lys Met Lys Lys Leu
        230                 235                 240
CAC GCG CGG TTC GAT GCA TTC TTG ACC GAG ATT GTA CGA GAG CGT TGT         883
His Ala Arg Phe Asp Ala Phe Leu Thr Glu Ile Val Arg Glu Arg Cys
    245                 250                 255
CAT GGG CAG ATC AAC AAC AGT GGT GCT CAT CAG GAT GAT TTG CTT AGC         931
His Gly Gln Ile Asn Asn Ser Gly Ala His Gln Asp Asp Leu Leu Ser
260                 265                 270                 275
ACG TTG ATT TCG TTC AAA GGG CTT GAC GAT GGC GAT GGT TCC AGG CTC         979
Thr Leu Ile Ser Phe Lys Gly Leu Asp Asp Gly Asp Gly Ser Arg Leu
                280                 285                 290
ACT GAC ACA GAA ATC AAG GCG CTG CTC TTG AAC CTT TTG GAC ACG ACG         1027
Thr Asp Thr Glu Ile Lys Ala Leu Leu Leu Asn Leu Leu Asp Thr Thr
            295                 300                 305
TCG AGC ACG GTG GAA TGG GCC GTA GCC GAA CTC CTA CGC CAC CCT AAG       1075
Ser Ser Thr Val Glu Trp Ala Val Ala Glu Leu Leu Arg His Pro Lys
        310                 315                 320
ACA TTA GCC CAA GTC CGG CAA GAG CTC GAC TCG GTC GTG GGT AAG AAC       1123
Thr Leu Ala Gln Val Arg Gln Glu Leu Asp Ser Val Val Gly Lys Asn
    325                 330                 335
AGG CTC GTG TCC GAG ACC GAT CTG AAT CAG CTG CCC TAT CTA CAA GCT       1171
Arg Leu Val Ser Glu Thr Asp Leu Asn Gln Leu Pro Tyr Leu Gln Ala
340                 345                 350                 355
GTC GTC AAA GAA ACT TTC CGC CTC CAT CCT CCG ACG CCG CTC TCT CTA       1219
Val Val Lys Glu Thr Phe Arg Leu His Pro Pro Thr Pro Leu Ser Leu
                360                 365                 370
CCG AGA CTC GCG GAA GAT GAT TGC GAG ATC GAC GGA TAC CTC ATC CCC       1267
Pro Arg Leu Ala Glu Asp Asp Cys Glu Ile Asp Gly Tyr Leu Ile Pro
            375                 380                 385
AAG GGC TCG ACC CTT CTG GTG AAC GTT TGG GCC ATA GCC CGC GAT CCC       1315
Lys Gly Ser Thr Leu Leu Val Asn Val Trp Ala Ile Ala Arg Asp Pro
        390                 395                 400
AAG GTT TGG GCC GAT CCG TTG GAG TTT AGG CCC GAA CGA TTC TTG ACG       1363
Lys Val Trp Ala Asp Pro Leu Glu Phe Arg Pro Glu Arg Phe Leu Thr
    405                 410                 415
GGC GGA GAA AAG GCC GAC GTC GAT GTC AAG GGG AAC GAT TTC GAA GTG       1411
Gly Gly Glu Lys Ala Asp Val Asp Val Lys Gly Asn Asp Phe Glu Val
420                 425                 430                 435
ATA CCG TTC GGG GCG GGT CGT AGG ATC TGC GCT GGC GTT GGC TTG GGA       1459
Ile Pro Phe Gly Ala Gly Arg Arg Ile Cys Ala Gly Val Gly Leu Gly
                440                 445                 450
ATA CGT ATG GTC CAA CTG TTG ACG GCG AGT TTG ATC CAT GCA TTC GAT       1507
Ile Arg Met Val Gln Leu Leu Thr Ala Ser Leu Ile His Ala Phe Asp
            455                 460                 465
CTG GAC CTT GCT AAT GGG CTT TTG GCC CAA AAT CTG AAC ATG GAA GAA         1555
Leu Asp Leu Ala Asn Gly Leu Leu Ala Gln Asn Leu Asn Met Glu Glu
        470                 475                 480
GCA TAT GGG CTT ACG CTA CAA CGG GCT GAG CCT TTG TTG GTC CAC CCT         1603
Ala Tyr Gly Leu Thr Leu Gln Arg Ala Glu Pro Leu Leu Val His Pro
    485                 490                 495
AGG CCG CGG TTG GCC ACT CAT GTC TAT T AATTAAATTA GGCCTAAACT             1651
Arg Pro Arg Leu Ala Thr His Val Tyr
500                 505
ACGATGAATG ACCCATTTAA CGTTAATAAG AGTTTTCAAT TTATGTGAGT TTGCATGGTA       1711
TGGTATGGTA TGGTGCTTGT AATAAATTGT ATCTGTTAGG TGTGTTCATT GATGATAAAT       1771
CTAGTTTGTA CTGCTGCTCA AAAAAAAAAA AAAAAAAAAA AAAA                        1815
(2)关于SEQ ID NO:19的信息
(i)序列特征
(A)长度:508个氨基酸
(B)类型:氨基酸
(D)拓扑结构:线型
(ii)分子类型:蛋白质
(xi)序列描述:SEQ ID NO:19
Met Ser Pro Leu Ala Leu Met Ile Ile Ser Thr Leu Leu Gly Phe Leu
  1               5                  10                  15
Leu Tyr His Ser Leu Arg Leu Leu Leu Phe Ser Gly Gln Gly Arg Arg
             20                  25                  30
Leu Leu Pro Pro Gly Pro Arg Pro Trp Pro Leu Val Gly Asn Leu Pro
         35                  40                  45
His Leu Gly Pro Lys Pro His Ala Ser Met Ala Glu Leu Ala Arg Ala
     50                  55                  60
Tyr Gly Pro Leu Met His Leu Lys Met Gly Phe Val His Val Val Val
 65                  70                  75                  80
Ala Ser Ser Ala Ser Ala Ala Glu Gln Cys Leu Arg Val His Asp Ala
                 85                  90                  95
Asn Phe Leu Ser Arg Pro Pro Asn Ser Gly Ala Lys His Val Ala Tyr
            100                 105                 110
Asn Tyr Glu Asp Leu Val Phe Arg Pro Tyr Gly Pro Lys Trp Arg Leu
        115                 120                 125
Leu Arg Lys Ile Cys Ala Gln His Ile Phe Ser Val Lys Ala Met Asp
    130                 135                 140
Asp Phe Arg Arg Val Arg Glu Glu Glu Val Ala Ile Leu Ser Arg Ala
145                 150                 155                 160
Leu Ala Gly Lys Arg Ala Val Pro Ile Gly Gln Met Leu Asn Val Cys
                165                 170                 175
Ala Thr Asn Ala Leu Ser Arg Val Met Met Gly Arg Arg Val Val Gly
            180                 185                 190
His Ala Asp Gly Thr Asn Asp Ala Lys Ala Glu Glu Phe Lys Ala Met
        195                 200                 205
Val Val Glu Leu Met Val Leu Ser Gly Val Phe Asn Ile Gly Asp Phe
    210                 215                 220
Ile Pro Phe Leu Glu Pro Leu Asp Leu Gln Gly Val Ala Ser Lys Met
225                 230                 235                 240
Lys Lys Leu His Ala Arg Phe Asp Ala Phe Leu Thr Glu Ile Val Arg
                245                 250                 255
Glu Arg Cys His Gly Gln Ile Asn Asn Ser Gly Ala His Gln Asp Asp
            260                 265                 270
Leu Leu Ser Thr Leu Ile Ser Phe Lys Gly Leu Asp Asp Gly Asp Gly
        275                 280                 285
Ser Arg Leu Thr Asp Thr Glu Ile Lys Ala Leu Leu Leu Asn Leu Leu 
    290                 295                 300
Asp Thr Thr Ser Ser Thr Val Glu Trp Ala Val Ala Glu Leu Leu Arg
305                 310                 315                 320
His Pro Lys Thr Leu Ala Gln Val Arg Gln Glu Leu Asp Ser Val Val
                325                 330                 335
Gly Lys Asn Arg Leu Val Ser Glu Thr Asp Leu Asn Gln Leu Pro Tyr
            340                 345                 350
Leu Gln Ala Val Val Lys Glu Thr Phe Arg Leu His Pro Pro Thr Pro
        355                 360                 365
Leu Ser Leu Pro Arg Leu Ala Glu Asp Asp Cys Glu Ile Asp Gly Tyr
    370                 375                 380
Leu Ile Pro Lys Gly Ser Thr Leu Leu Val Asn Val Trp Ala Ile Ala
385                 390                 395                 400
Arg Asp Pro Lys Val Trp Ala Asp Pro Leu Glu Phe Arg Prc Glu Arg
                405                 410                 415
Phe Leu Thr Gly Gly Glu Lys Ala Asp Val Asp Val Lys Gly Asn Asp
            420                 425                 430
Phe Glu Val Ile Pro Phe Gly Ala Gly Arg Arg Ile Cys Ala Gly Val
        435                 440                 445
Gly Leu Gly Ile Arg Met Val Gln Leu Leu Thr Ala Ser Leu Ile His
    450                 455                 460
Ala Phe Asp Leu Asp Leu Ala Asn Gly Leu Leu Ala Gln Asn Leu Asn
465                 470                 475                 480
Met Glu Glu Ala Tyr Gly Leu Thr Leu Gln Arg Ala Glu Pro Leu Leu
                485                 490                 495
Val His Pro Arg Pro Arg Leu Ala Thr His Val Tyr
            500                 505
(2)关于SEQ ID NO:20的信息
(i)序列特征
(A)长度:1824个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑结构:线型
(ii)分子类型:DNA
(ix)特征:
(A)名称/键:CDS
(B)位置:2..1553
(xi)序列描述:SEQID NO:20
G AGC TTA ACC TTA ATT TTC TGC ACT TTA GTT TTT GCA ATC TTT CTA        46
  Ser Leu Thr Leu Ile Phe Cys Thr Leu Val Phe Ala Ile Phe Leu
    1               5                   10                  15
TAT TTT CTT ATT CTC AGG GTG AAA CAG CGT TAC CCT TTA CCT CTC CCA         94
Tyr Phe Leu Ile Leu Arg Val Lys Gln Arg Tyr Pro Leu Pro Leu Pro
                 20                  25                  30
CCC GGA CCA AAA CCA TGG CCG GTG TTA GGA AAC CTT CCC CAC CTG GGC         142
Pro Gly Pro Lys Pro Trp Pro Val Leu Gly Asn Leu Pro His Leu Gly
             35                  40                  45
AAG AAG CCT CAC CAG TCG ATT GCG GCC ATG GCT GAG AGG TAC GGC CCC         190
Lys Lys Pro His Gln Ser Ile Ala Ala Met Ala Glu Arg Tyr Gly Pro
         50                  55                 60
CTC ATG CAC CTC CGC CTA GGA TTC GTG GAC GTG GTT GTG GCC GCC TCC         238
Leu Met His Leu Arg Leu Gly Phe Val Asp Val Val Val Ala Ala Ser
     65                  70                  75
GCC GCC GTG GCC GCT CAG TTC TTG AAA GTT CAC GAC TCG AAC TTC TCC         286
Ala Ala Val Ala Ala Gln Phe Leu Lys Val His Asp Ser Asn Phe Ser
 80                  85                  90                  95
AAC CGG CCG CCG AAC TCC GGC GCG GAA CAC ATT GCT TAT AAC TAT CAA         334
Asn Arg Pro Pro Asn Ser Gly Ala Glu His Ile Ala Tyr Asn Tyr Gln
                100                 105                 110
GAC CTC GTC TTC GCG CCC TAC GGC CCG CGG TGG CGC ATG CTT AGG AAG         382
Asp Leu Val Phe Ala Pro Tyr Gly Pro Arg Trp Arg Met Leu Arg Lys
            115                 120                 125
ATC ACC TCC GTG CAT CTC TTC TCG GCC AAG GCG TTG GAT GAC TTC TGC         430
Ile Thr Ser Val His Leu Phe Ser Ala Lys Ala Leu Asp Asp Phe Cys
        130                 135                 140
CAT GTT CGC CAG GAA GAG GTT GCA ACT CTG ACA CGC AGT CTA GCA AGT         478
His Val Arg Gln Glu Glu Val Ala Thr Leu Thr Arg Ser Leu Ala Ser
    145                 150                 155
GCA GGC AAA ACT CCA GTA AAA CTA GGG CAG TTA CTA AAC GTG TGC ACC         526
Ala Gly Lys Thr Pro Val Lys Leu Gly Gln Leu Leu Asn Val Cys Thr
160                 165                 170                 175
ACG AAC GCC CTA GCT CGT GTA ATG CTA GGG CGG AAG GTC TTT AAT GAC         574
Thr Asn Ala Leu Ala Arg Val Met Leu Gly Arg Lys Val Phe Asn Asp
                180                 185                 190
GGA GGT AGC AAG AGC GAC CCA AAG GCG GAG GAG TTC AAG TCG ATG GTG         622
Gly Gly Ser Lys Ser Asp Pro Lys Ala Glu Glu Phe Lys Ser Met Val
            195                 200                 205
GAG GAG ATG ATG GTG TTG GCC GGA AGT TTT AAC ATC GGC GAT TTC ATT         670
Glu Glu Met Met Val Leu Ala Gly Ser Phe Asn Ile Gly Asp Phe Ile
        210                 215                 220
CCG GTC TTG GGT TGG TTT GAC GTT CAG GGT ATC GTA GGG AAG ATG AAG         718
Pro Val Leu Gly Trp Phe Asp Val Gln Gly Ile Val Gly Lys Met Lys
    225                 230                 235
AAA CTA CAC GCG CGT TTT GAT GCG TTC TTG AAC ACC ATT CTA GAG GAA         766
Lys Leu His Ala Arg Phe Asp Ala Phe Leu Asn Thr Ile Leu Glu Glu 
240                 245                 250                 255
CAC AAA TGT GTC AAC AAT CAA CAC ACG ACG TTG TCG AAA GAT GTG GAC         814
His Lys Cys Val Asn Asn Gln His Thr Thr Leu Ser Lys Asp Val Asp
                260                 265                 270
TTC TTG AGC ACC CTA ATT AGG CTC AAA GAT AAT GGG GCT GAT ATG GAT         862
Phe Leu Ser Thr Leu Ile Arg Leu Lys Asp Asn Gly Ala Asp Met Asp
            275                 280                 285
TGT GAA GAG GGA AAA CTC ACC GAC ACT GAA ATT AAG GCT TTG CTC TTG         910
Cys Glu Glu Gly Lys Leu Thr Asp Thr Glu Ile Lys Ala Leu Leu Leu
        290                 295                 300
AAC CTG TTC ACA GCT GGG ACT GAT ACA TCA TCT AGC ACT GTG GAG TGG         958
Asn Leu Phe Thr Ala Gly Thr Asp Thr Ser Ser Ser Thr Val Glu Trp
    305                 310                 315
GCA ATC GCA GAA CTA CTA CGC AAC CCA AAA ATC TTA AAC CAA GCA CAA       1006
Ala Ile Ala Glu Leu Leu Arg Asn Pro Lys Ile Leu Asn Gln Ala Gln
320                 325                 330                 335
CAA GAG CTT GAC TTA GTG GTG GGT CAA AAT CAG CTA GTC ACA GAA TCT       1054
Gln Glu Leu Asp Leu Val Val Gly Gln Asn Gln Leu Val Thr Glu Ser
                340                 345                 350
GAC TTA ACC GAT CTA CCT TTC CTG CAA GCA ATA GTG AAG GAG ACC TTC       1102
Asp Leu Thr Asp Leu Pro Phe Leu Gln Ala Ile Val Lys Glu Thr Phe
            355                 360                 365
AGG CTA CAC CCA TCC ACC CCA CTC TCT CTT CCA AGA ATG GGA GCT CAG       1150
Arg Leu His Pro Ser Thr Pro Leu Ser Leu Pro Arg Met Gly Ala Gln
        370                 375                 380
GGT TGC GAG ATC AAT GGC TAC TTC ATC CCC AAA GGC GCA ACG CTT TTG       1198
Gly Cys Glu Ile Asn Gly Tyr Phe Ile Pro Lys Gly Ala Thr Leu Leu
    385                 390                 395
GTC AAC GTT TGG GCC ATA GCT CGT GAT CCC AAT GTG TGG ACA AAT CCT       1246
Val Asn Val Trp Ala Ile Ala Arg Asp Pro Asn Val Trp Thr Asn Pro
400                 405                 410                 415
CTT GAG TTC AAC CCA CAC CGA TTC TTG CCT GGT GGA GAA AAG CCC AAC       1294
Leu Glu Phe Asn Pro His Arg Phe Leu Pro Gly Gly Glu Lys Pro Asn
                420                 425                 430
GTG GAT ATT AAA GGG AAT GAC TTT GAA GTG ATT CCT TTT GGA GCC GGG       1342
Val Asp Ile Lys Gly Asn Asp Phe Glu Val Ile Pro Phe Gly Ala Gly
            435                 440                 445
CGT AGA ATA TGC TCT GGG ATG AGT TTG GGG ATA AGG ATG GTT CAC CTG       1390
Arg Arg Ile Cys Ser Gly Met Ser Leu Gly Ile Arg Met Val His Leu
        450                 455                 460
TTG GTT GCA ACT TTG GTG CAT GCT TTT GAT TGG GAT TTG GTG AAT GGA        1438
Leu Val Ala Thr Leu Val His Ala Phe Asp Trp Asp Leu Val Asn Gly
    465                 470                 475
CAA TCT GTA GAG ACG CTC AAT ATG GAG GAA GCT TAT GGT CTC ACC CTT        1486
Gln Ser Val Glu Thr Leu Asn Met Glu Glu Ala Tyr Gly Leu Thr Leu
480                 485                 490                 495
CAA CGA GCT GTT CCT TTG ATG TTG CAT CCA AAG CCC AGA TTA CAA CCA        1534
Gln Arg Ala Val Pro Leu Met Leu His Pro Lys Pro Arg Leu Gln Pro
                500                 505                 510
CAT CTC TAT ACT CTC AAT T AAATTGCAAT TTGATTTTGG TGATTATACA             1583
His Leu Tyr Thr Leu Asn
            515
ATTATAATCG AGGGACATAG GATCCCCATT TATTTATATT CAGTTATAAG AGACTTCCAA      1643
CAAAGGTCTA GCTTTCGACC TTAAAAGTTG TAAAAGAGGT CCTACATATG TAAAAGCCCG      1703
CCAAAGGAAA ACTGGTTGTA TTCAATTCCG CTAGGCCTTG TCCGAAAGAC CTCATGAAGA      1763
CTACAAAGGT CATATATAAT GGTAAACCCA GTGTATTTGT TGTAAAAAAA AAAAAAAAAA      1823
A                                                                      1824
(2)关于SEQ ID NO:21的信息
(i)序列特征
(A)长度:517个氨基酸
(B)类型:氨基酸
(D)拓扑结构:线型
(ii)分子类型:蛋白质
(xi)序列描述:SEQ ID NO:21
Ser Leu Thr Leu Ile Phe Cys Thr Leu Val Phe Ala Ile Phe Leu Tyr
  1               5                  10                  15
Phe Leu Ile Leu Arg Val Lys Gln Arg Tyr Pro Leu Pro Leu Pro Pro
             20                  25                  30
Gly Pro Lys Pro Trp Pro Val Leu Gly Asn Leu Pro His Leu Gly Lys
         35                  40                  45
Lys Pro His Gln Ser Ile Ala Ala Met Ala Glu Arg Tyr Gly Pro Leu
     50                  55                  60
Met His Leu Arg Leu Gly Phe Val Asp Val Val Val Ala Ala Ser Ala
 65                  70                  75                  80
Ala Val Ala Ala Gln Phe Leu Lys Val His Asp Ser Asn Phe Ser Asn
                 85                  90                  95
Arg Pro Pro Asn Ser Gly Ala Glu His Ile Ala Tyr Asn Tyr Gln Asp
            100                 105                 110
Leu Val Phe Ala Pro Tyr Gly Pro Arg Trp Arg Met Leu Arg Lys Ile
        115                 120                 125
Thr Ser Val His Leu Phe Ser Ala Lys Ala Leu Asp Asp Phe Cys His
    130                 135                 140
Val Arg Gln Glu Glu Val Ala Thr Leu Thr Arg Ser Leu Ala Ser Ala
145                 150                 155                 160
Gly Lys Thr Pro Val Lys Leu Gly Gln Leu Leu Asn Val Cys Thr Thr
                165                 170                 175
Asn Ala Leu Ala Arg Val Met Leu Gly Arg Lys Val Phe Asn Asp Gly
            180                 185                 190
Gly Ser Lys Ser Asp Pro Lys Ala Glu Glu Phe Lys Ser Met Val Glu
        195                 200                 205
Glu Met Met Val Leu Ala Gly Ser Phe Asn Ile Gly Asp Phe Ile Pro
    210                 215                 220
Val Leu Gly Trp Phe Asp Val Gln Gly Ile Val Gly Lys Met Lys Lys
225                 230                 235                 240
Leu His Ala Arg Phe Asp Ala Phe Leu Asn Thr Ile Leu Glu Glu His
                245                 250                 255
Lys Cys Val Asn Asn Gln His Thr Thr Leu Ser Lys Asp Val Asp Phe
            260                 265                 270
Leu Ser Thr Leu Ile Arg Leu Lys Asp Asn Gly Ala Asp Met Asp Cys
        275                 280                 285
Glu Glu Gly Lys Leu Thr Asp Thr Glu Ile Lys Ala Leu Leu Leu Asn
    290                 295                 300
Leu Phe Thr Ala Gly Thr Asp Thr Ser Ser Ser Thr Val Glu Trp Ala
305                 310                 315                 320
Ile Ala Glu Leu Leu Arg Asn Pro Lys Ile Leu Asn Gln Ala Gln Gln
                325                 330                 335
Glu Leu Asp Leu Val Val Gly Gln Asn Gln Leu Val Thr Glu Ser Asp
            340                 345                 350
Leu Thr Asp Leu Pro Phe Leu Gln Ala Ile Val Lys Glu Thr Phe Arg
        355                 360                 365
Leu His Pro Ser Thr Pro Leu Ser Leu Pro Arg Met Gly Ala Gln Gly
    370                 375                 380
Cys Glu Ile Asn Gly Tyr Phe Ile Pro Lys Gly Ala Thr Leu Leu Val
385                 390                 395                 400
Asn Val Trp Ala Ile Ala Arg Asp Pro Asn Val Trp Thr Asn Pro Leu
                405                 410                 415
Glu Phe Asn Pro His Arg Phe Leu Pro Gly Gly Glu Lys Pro Asn Val
            420                 425                 430
Asp Ile Lys Gly Asn Asp Phe Glu Val Ile Pro Phe Gly Ala Gly Arg
        435                 440                 445
Arg Ile Cys Ser Gly Met Ser Leu Gly Ile Arg Met Val His Leu Leu
    450                 455                 460
Val Ala Thr Leu Val His Ala Phe Asp Trp Asp Leu Val Asn Gly Gln
465                 470                 475                 480
Ser Val Glu Thr Leu Asn Met Glu Glu Ala Tyr Gly Leu Thr Leu Gln
                485                 490                 495
Arg Ala Val Pro Leu Met Leu His Pro Lys Pro Arg Leu Gln Pro His
            500                 505                 510
Leu Tyr Thr Leu Asn
        515
(2)关于SEQ ID NO:22的信息
(i)序列特征
(A)长度:1667个氨基酸
(B)类型:核酸
(C)链型:单链
(D)拓扑结构:线型
(ii)分子类型:DNA
(ix)特征:
(A)名称/键:CDS
(B)位置:1..1429
(xi)序列描述:SEQ ID NO:22
CCC ATC CTC GGA AAC ATC CCC CAT CTC GGC TCC AAA CCG CAC CAA ACA         48
Pro Ile Leu Gly Asn Ile Pro His Leu Gly Ser Lys Pro His Gln Thr
  1               5                  10                  15
CTC GCG GAA ATG GCG AAA ACC TAC GGT CCG CTC ATG CAC TTG AAG TTC         96
Leu Ala Glu Met Ala Lys Thr Tyr Gly Pro Leu Met His Leu Lys Phe
             20                  25                  30
GGG CTT AAG GAC GCG GTG GTG GCG TCG TCT GCG TCG GTG GCA GAG CAG         144
Gly Leu Lys Asp Ala Val Val Ala Ser Ser Ala Ser Val Ala Glu Gln
         35                  40                  45
TTT CTG AAG AAA CAC GAC GTG AAT TTC TCG AAC CGG CCG CCA AAC TCC         192
Phe Leu Lys Lys His Asp Val Asn Phe Ser Asn Arg Pro Pro Asn Ser
     50                  55                  60
GGG GCC AAA CAT ATA GCT TAT AAC TAT CAG GAC CTG GTA TTC GCT CCC         240
Gly Ala Lys His Ile Ala Tyr Asn Tyr Gln Asp Leu Val Phe Ala Pro
 65                  70                  75                  80
TAT GGA CCC CGG TGG CGG TTG CTT AGG AAA ATC TGT TCC GTC CAT CTT         288
Tyr Gly Pro Arg Trp Arg Leu Leu Arg Lys Ile Cys Ser Val His Leu
                 85                  90                  95
TTC TCG TCT AAG GCC TTG GAT GAC TTT CAG CAT GTT CGA CAT GAG GAG         336
Phe Ser Ser Lys Ala Leu Asp Asp Phe Gln His Val Arg His Glu Glu
            100                 105                 110
ATA TGC ATC CTT ATA CGA GCA ATA GCG AGT GGC GGT CAT GCT CCG GTG         384
Ile Cys Ile Leu Ile Arg Ala Ile Ala Ser Gly Gly His Ala Pro Val
        115                 120                 125
AAT TTA GGC AAG TTA TTA GGA GTG TGC ACA ACC AAT GCC CTG GCA AGA         432
Asn Leu Gly Lys Leu Leu Gly Val Cys Thr Thr Asn Ala Leu Ala Arg
    130                 135                 140
GTG ATG CTT GGA AGA AGA GTA TTC GAA GGC GAC GGC GGC GAG AAT CCG         480
Val Met Leu Gly Arg Arg Val Phe Glu Gly Asp Gly Gly Glu Asn Pro
145                 150                 155                 160
CAT GCC GAC GAG TTT AAA TCA ATG GTG GTG GAG ATT ATG GTG TTA GCC         528
His Ala Asp Glu Phe Lys Ser Met Val Val Glu Ile Met Val Leu Ala
                165                 170                 175
GGT GCA TTC AAC TTG GGT GAT TTC ATC CCG GTT CTA GAT TGG TTC GAT         576
Gly Ala Phe Asn Leu Gly Asp Phe Ile Pro Val Leu Asp Trp Phe Asp
            180                 185                 190
TTG CAA GGA ATT GCT GGT AAA ATG AAG AAA CTT CAT GCC CGT TTC GAC         624
Leu Gln Gly Ile Ala Gly Lys Met Lys Lys Leu His Ala Arg Phe Asp
        195                 200                 205
AAG TTT TTA AAT GGG ATC CTA GAA GAT CGT AAA TCT AAC GGC TCT AAT         672
Lys Phe Leu Asn Gly Ile Leu Glu Asp Arg Lys Ser Asn Gly Ser Asn
    210                 215                 220
GGA GCT GAA CAA TAC GTG GAC TTG CTC AGT GTG TTG ATC TCT CTT CAA         720
Gly Ala Glu Gln Tyr Val Asp Leu Leu Ser Val Leu Ile Ser Leu Gln  
225                 230                 235                 240
GAT AGT AAT ATC GAC GGT GGT GAC GAA GGA ACC AAA CTC ACA GAT ACT         768
Asp Ser Asn Ile Asp Gly Gly Asp Glu Gly Thr Lys Leu Thr Asp Thr     
                245                 250                 255
GAA ATC AAA GCT CTC CTT TTG AAC TTG TTC ATA GCC GGA ACA GAC ACT         816
Glu Ile Lys Ala Leu Leu Leu Asn Leu Phe Ile Ala Gly Thr Asp Thr
            260                 265                 270
TCA TCA AGT ACT GTA GAA TGG GCC ATG GCA GAA CTA ATC CGA AAC CCA       864
Ser Ser Ser Thr Val Glu Trp Ala Met Ala Glu Leu Ile Arg Asn Pro
        275                 280                 285
AAG TTA CTA GTC CAA GCC CAA GAA GAG CTA GAC AGA GTA GTC GGG CCG       912
Lys Leu Leu Val Gln Ala Gln Glu Glu Leu Asp Arg Val Val Gly Pro
    290                 295                 300
AAC CGA TTC GTA ACC GAA TCT GAT CTT CCT CAA CTG ACA TTC CTT CAA       960
Asn Arg Phe Val Thr Glu Ser Asp Leu Pro Gln Leu Thr Phe Leu Gln
305                 310                 315                 320
GCC GTC ATC AAA GAG ACT TTC AGG CTT CAT CCA TCC ACC CCA CTC TCT       1008
Ala Val Ile Lys Glu Thr Phe Arg Leu His Pro Ser Thr Pro Leu Ser
                325                 330                 335
CTT CCA CGA ATG GCG GCG GAG GAC TGT GAG ATC AAT GGG TAT TAT GTC       1056
Leu Pro Arg Met Ala Ala Glu Asp Cys Glu Ile Asn Gly Tyr Tyr Val
            340                 345                 350
TCA GAA GGT TCG ACA TTG CTC GTC AAT GTG TGG GCC ATA GCT CGT GAT       1104
Ser Glu Gly Ser Thr Leu Leu Val Asn Val Trp Ala Ile Ala Arg Asp
        355                 360                 365
CCA AAT GCG TGG GCC AAT CCA CTA GAT TTC AAC CCG ACT CGT TTC TTG       1152
Pro Asn Ala Trp Ala Asn Pro Leu Asp Phe Asn Pro Thr Arg Phe Leu
    370                 375                 380
GCC GGT GGA GAG AAG CCT AAT GTT GAT GTT AAA GGG AAT GAT TTT GAA       1200
Ala Gly Gly Glu Lys Pro Asn Val Asp Val LysGly Asn Asp Phe Glu
385                 390                 395                 400
GTG ATA CCT TTC GGT GCT GGG CGC AGG ATA TGT GCC GGA ATG AGC TTA       1248
Val Ile Pro Phe Gly Ala Gly Arg Arg Ile Cys Ala Gly Met Ser Leu
                405                 410                 415
GGT ATA CGG ATG GTT CAA CTA GTA ACG GCT TCG TTA GTT CAT TCG TTT       1296
Gly Ile Arg Met Val Gln Leu Val Thr Ala Ser Leu Val His Ser Phe
            420                 425                 430
GAT TGG GCT TTG TTG GAT GGA CTT AAA CCC GAG AAG CTT GAC ATG GAG       1344
Asp Trp Ala Leu Leu Asp Gly Leu Lys Pro Glu Lys Leu Asp Met Glu
        435                 440                 445
GAA GGT TAT GGA CTA ACG CTT CAA CGA GCT TCA CCT TTA ATC GTC CAT       1392
Glu Gly Tyr Gly Leu Thr Leu Gln Arg Ala Ser Pro Leu Ile Val His
    450                 455                 460
CCA AAG CCG AGG CTC TCG GCT CAA GTT TAT TGT ATG T AACAAGTTTG          1439
Pro Lys Pro Arg Leu Ser Ala Gln Val Tyr Cys Met
465                 470                 475
TGAAGCCAGT CTGATTTCAG TTGGATTTGT AGTTATTTTA TGATCATTTG GTATTTTATT     1499
TTGTATTTCG GTTGAATACA ATAAAGGGAA GGTGGATCGT CTGCTGTATA ATAGCGACGT     1559
TTTAACGTGT TGTGATAGTA CCGTGTTTTA CTAAAACGAT GTCGTTTGAT TTTTTATAGT     1619
ATTAAAAAAA TAAACAGCTG GATTTTGAAC CAAAAAAAAAAAAAAAAA                   1667
(2)关于SEQ ID NO:23的信息
(i)序列特征
(A)长度:476个氨基酸
(B)类型:氨基酸
(D)拓扑结构:线型
(ii)分子类型:蛋白质
(xi)序列描述:SEQ ID NO:23
Pro Ile Leu Gly Asn Ile Pro His Leu Gly Ser Lys Pro His Gln Thr
  1               5                  10                  15
Leu Ala Glu Met Ala Lys Thr Tyr Gly Pro Leu Met His Leu Lys Phe
             20                  25                  30
Gly Leu Lys Asp Ala Val Val Ala Ser Ser Ala Ser Val Ala Glu Gln
         35                  40                  45
Phe Leu Lys Lys His Asp Val Asn Phe Ser Asn Arg Pro Pro Asn Ser
     50                  55                  60
Gly Ala Lys His Ile Ala Tyr Asn Tyr Gln Asp Leu Val Phe Ala Pro
 65                  70                  75                  80
Tyr Gly Pro Arg Trp Arg Leu Leu Arg Lys Ile Cys Ser Val His Leu
                 85                  90                  95
Phe Ser Ser Lys Ala Leu Asp Asp Phe Gln His Val Arg His Glu Glu
            100                 105                 110
Ile Cys Ile Leu Ile Arg Ala Ile Ala Ser Gly Gly His Ala Pro Val
        115                 120                 125
Asn Leu Gly Lys Leu Leu Gly Val Cys Thr Thr Asn Ala Leu Ala Arg
    130                 135                 140
Val Met Leu Gly Arg Arg Val Phe Glu Gly Asp Gly Gly Glu Asn Pro
145                 150                 155                 160
His Ala Asp Glu Phe Lys Ser Met Val Val Glu Ile Met Val Leu Ala
                165                 170                 175
Gly Ala Phe Asn Leu Gly Asp Phe Ile Pro Val Leu Asp Trp Phe Asp
            180                 185                 190
Leu Gln Gly Ile Ala Gly Lys Met Lys Lys Leu His Ala Arg Phe Asp
        195                 200                 205
Lys Phe Leu Asn Gly Ile Leu Glu Asp Arg Lys Ser Asn Gly Ser Asn
    210                 215                 220
Gly Ala Glu Gln Tyr Val Asp Leu Leu Ser Val Leu Ile Ser Leu Gln
225                 230                 235                 240
Asp Ser Asn Ile Asp Gly Gly Asp Glu Gly Thr Lys Leu Thr Asp Thr
                245                 250                 255
Glu Ile Lys Ala Leu Leu Leu Asn Leu Phe Ile Ala Gly Thr Asp Thr
            260                 265                 270
Ser Ser Ser Thr Val Glu Trp Ala Met Ala Glu Leu Ile Arg Asn Pro
        275                 280                 285
Lys Leu Leu Val Gln Ala Gln Glu Glu Leu Asp Arg Val Val Gly Pro
    290                 295                 300
Asn Arg Phe Val Thr Glu Ser Asp Leu Pro Gln Leu Thr Phe Leu Gln
305                 310                 315                 320
Ala Val Ile Lys Glu Thr Phe Arg Leu His Pro Ser Thr Pro Leu Ser
                325                 330                 335
Leu Pro Arg Met Ala Ala Glu Asp Cys Glu Ile Asn Gly Tyr Tyr Val
            340                 345                 350
Ser Glu Gly Ser Thr Leu Leu Val Asn Val Trp Ala Ile Ala Arg Asp
        355                 360                 365
Pro Asn Ala Trp Ala Asn Pro Leu Asp Phe Asn Pro Thr Arg Phe Leu
    370                 375                 380
Ala Gly Gly Glu Lys Pro Asn Val Asp Val Lys Gly Asn Asp Phe Glu
385                 390                 395                 400
Val Ile Pro Phe Gly Ala Gly Arg Arg Ile Cys Ala Gly Met Ser Leu
                405                 410                 415
Gly Ile Arg Met Val Gln Leu Val Thr Ala Ser Leu Val His Ser Phe
            420                 425                 430
Asp Trp Ala Leu Leu Asp Gly Leu Lys Pro Glu Lys Leu Asp Met Glu
        435                 440                 445
Glu Gly Tyr Gly Leu Thr Leu Gln Arg Ala Ser Pro Leu Ile Val His
    450                 455                 460
Pro Lys Pro Arg Leu Ser Ala Gln Val Tyr Cys Met
465                 470                 475
(2)关于SEQ ID NO:24的信息
(i)序列特征
(A)长度:1214个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑结构:线型
(ii)分子类型:DNA
(ix)特征:
(A)名称/键:CDS
(B)位置:2..1091
(xi)序列描述:SEQ ID NO:24
T CGC ATC CTC ACG CGA TCT ATA GCG AGT GCT GGG GAA AAT CCG ATT        46
  Arg Ile Leu Thr Arg Ser Ile Ala Ser Ala Gly Glu Asn Pro Ile
    1               5                  10                  15
AAC TTA GGT CAA TTA CTC GGG GTG TGT ACC ACA AAT GCT CTG GCG AGA      94
Asn Leu Gly Gln Leu Leu Gly Val Cys Thr Thr Asn Ala Leu Ala Arg
                 20                  25                  30
GTG ATG CTT GGA AGG AGG GTA TTC GGC GAT GGG AGC GGC GGC GTA GAT         142
Val Met Leu Gly Arg Arg Val Phe Gly Asp Gly Ser Gly Gly Val Asp
             35                  40                  45
CCT CAG GCG GAC GAG TTC AAA TCC ATG GTG GTG GAA ATC ATG GTG TTG         190
Pro Gln Ala Asp Glu Phe Lys Ser Met Val Val Glu Ile Met Val Leu
         50                  55                  60
GCC GGC GCG TTT AAT CTA GGT GAT TTT ATT CCC GCT CTT GAT TGG TTC         238
Ala Gly Ala Phe Asn Leu Gly Asp Phe Ile Pro Ala Leu Asp Trp Phe
     65                  70                  75
GAT CTG CAG GGA ATT ACG GCA AAA ATG AAG AAA GTT CAC GCT CGT TTC         286
Asp Leu Gln Gly Ile Thr Ala Lys Met Lys Lys Val His Ala Arg Phe
 80                  85                  90                  95
GAT GCG TTC TTA GAC GCG ATC CTT GAG GAG CAC AAA TCC AAC GGC TCT         334
Asp Ala Phe Leu Asp Ala Ile Leu Glu Glu His Lys Ser Asn Gly Ser
                100                 105                 110
CGC GGA GCT AAG CAA CAC GTT GAC TTG CTG AGT ATG TTG ATC TCC CTT         382
Arg Gly Ala Lys Gln His Val Asp Leu Leu Ser Met Leu Ile Ser Leu
            115                 120                 125
CAA GAT AAT AAC ATT GAT GGT GAA AGT GGC GCC AAA CTC ACT GAT ACA         430
Gln Asp Asn Asn Ile Asp Gly Glu Ser Gly Ala Lys Leu Thr Asp Thr
        130                 135                 140
GAA ATC AAA GCT TTG CTT CTG AAC TTG TTC ACG GCT GGA ACA GAC ACG         478
Glu Ile Lys Ala Leu Leu Leu Asn Leu Phe Thr Ala Gly Thr Asp Thr
    145                 150                 155
TCA TCA AGT ACT GTG GAG TGG GCA ATC GCA GAG CTA ATC CGA AAC CCA         526
Ser Ser Ser Thr Val Glu Trp Ala Ile Ala Glu Leu Ile Arg Asn Pro
160                 165                 170                 175
GAA GTA TTG GTT CAA GCC CAA CAA GAG CTC GAT AGA GTA GTT GGG CCA         574
Glu Val Leu Val Gln Ala Gln Gln Glu Leu Asp Arg Val Val Gly Pro
                180                 185                 190
AGT CGT CTT GTG ACC GAA TCT GAT CTG CCT CAA TTG GCA TTC CTT CAA         622
Ser Arg Leu Val Thr Glu Ser Asp Leu Pro Gln Leu Ala Phe Leu Gln
            195                 200                 205
GCT GTC ATC AAA GAG ACT TTC AGA CTT CAT CCA TCC ACT CCA CTC TCT         670
Ala Val Ile Lys Glu Thr Phe Arg Leu His Pro Ser Thr Pro Leu Ser
        210                 215                 220
CTT CCA CGA ATG GCT TCA GAG GGT TGT GAA ATC AAT GGA TAC TCC ATC         718
Leu Pro Arg Met Ala Ser Glu Gly Cys Glu Ile Asn Gly Tyr Ser Ile
    225                 230                 235
CCA AAG GGT TCG ACA TTG CTC GTT AAC GTA TGG TCC ATA GCC CGT GAT         766
Pro Lys Gly Ser Thr Leu Leu Val Asn Val Trp Ser Ile Ala Arg Asp
240                 245                 250                 255
CCT AGT ATA TGG GCC GAC CCA TTA GAA TTT AGG CCG GCA CGT TTC TTG         814
Pro Ser Ile Trp Ala Asp Pro Leu Glu Phe Arg Pro Ala Arg Phe Leu
                260                 265                 270
CCC GGC GGA GAA AAG CCC AAT GTT GAT GTG AGA GGC AAT GAT TTT GAG         862
Pro Gly Gly Glu Lys Pro Asn Val Asp Val Arg Gly Asn Asp Phe Glu
            275                 280                 285
GTC ATA CCA TTT GGT GCT GGA CGT AGG ATA TGT GCT GGA ATG AGC TTG         910
Val Ile Pro Phe Gly Ala Gly Arg Arg Ile Cys Ala Gly Met Ser Leu
        290                 295                 300
GGT TTA AGA ATG GTT CAA CTT TCG ACA GCT ACT TTG GTT CAT TCG TTT         958
Gly Leu Arg Met Val Gln Leu Ser Thr Ala Thr Leu Val His Ser Phe
    305                 310                 315
AAT TGG GAT TTG CTG AAT GGG ATG AGC CCA GAT AAA CTT GAC ATG GAA         1006
Asn Trp Asp Leu Leu Asn Gly Met Ser Pro Asp Lys Leu Asp Met Glu
320                 325                 330                 335
GAA GCT TAT GGG CTT ACA TTG CAA CGG GCT TCA CCT TTG ATT GTC CAC       1054
Glu Ala Tyr Gly Leu Thr Leu Gln Arg Ala Ser Pro Leu Ile Val His
                340                 345                 350
CCA AAG CCC AGG CTT GCT AGC TCT ATG TAT GTT AAA T GAAATTATGC          1101
Pro Lys Pro Arg Leu Ala Ser Ser Met Tyr Val Lys
            355                 360
TGTGCGAATA ATTCCTTATT TATAGCAGGAAATGTCATCT TGAATTATGT GTAATGTTCT      1161
TCTAACTTTC GATGGAAGTG CAAAACAAGT TTTATTAAAA AAAAAAAAAA AAA            1214
(2)关于SEQ ID NO:25的信息
(i)序列特征
(A)长度:363个氨基酸
(B)类型:氨基酸
(D)拓扑结构:线型
(ii)分子类型:蛋白质
(xi)序列描述:SEQ ID NO:25
Arg Ile Leu Thr Arg Ser Ile Ala Ser Ala Gly Glu Asn Pro Ile Asn
  1               5                  10                  15
Leu Gly Gln Leu Leu Gly Val Cys Thr Thr Asn Ala Leu Ala Arg Val
             20                  25                  30
Met Leu Gly Arg Arg Val Phe Gly Asp Gly Ser Gly Gly Val Asp Pro
         35                  40                  45
Gln Ala Asp Glu Phe Lys Ser Met Val Val Glu Ile Met Val Leu Ala
     50                  55                  60
Gly Ala Phe Asn Leu Gly Asp Phe Ile Pro Ala Leu Asp Trp Phe Asp
 65                  70                  75                  80
Leu Gln Gly Ile Thr Ala Lys Met Lys Lys Val His Ala Arg Phe Asp
                 85                  90                  95
Ala Phe Leu Asp Ala Ile Leu Glu Glu His Lys Ser Asn Gly Ser Arg
            100                 105                 110
Gly Ala Lys Gln His Val Asp Leu Leu Ser Met Leu Ile Ser Leu Gln
        115                 120                 125
Asp Asn Asn Ile Asp Gly Glu Ser Gly Ala Lys Leu Thr Asp Thr Glu
    130                 135                 140
Ile Lys Ala Leu Leu Leu Asn Leu Phe Thr Ala Gly Thr Asp Thr Ser
145                 150                 155                 160
Ser Ser Thr Val Glu Trp Ala Ile Ala Glu Leu Ile Arg Asn Pro Glu
                165                 170                 175
Val Leu Val Gln Ala Gln Gln Glu Leu Asp Arg Val Val Gly Pro Ser
            180                 185                 190
Arg Leu Val Thr Glu Ser Asp Leu Pro Gln Leu Ala Phe Leu Gln Ala
        195                 200                 205
Val Ile Lys Glu Thr Phe Arg Leu His Pro Ser Thr Pro Leu Ser Leu
    210                 215                 220
Pro Arg Met Ala Ser Glu Gly Cys Glu Ile Asn Gly Tyr Ser Ile Pro
225                 230                 235                 240
Lys Gly Ser Thr Leu Leu Val Asn Val Trp Ser Ile Ala Arg Asp Pro
                245                 250                 255
Ser Ile Trp Ala Asp Pro Leu Glu Phe Arg Pro Ala Arg Phe Leu Pro
            260                 265                 270
Gly Gly Glu Lys Pro Asn Val Asp Val Arg Gly Asn Asp Phe Glu Val
        275                 280                 285
Ile Pro Phe Gly Ala Gly Arg Arg Ile Cys Ala Gly Met Ser Leu Gly
    290                 295                 300
Leu Arg Met Val Gln Leu Ser Thr Ala Thr Leu Val His Ser Phe Asn
305                 310                 315                 320
Trp Asp Leu Leu Asn Gly Met Ser Pro Asp Lys Leu Asp Met Glu Glu
                325                 330                 335
Ala Tyr Gly Leu Thr Leu Gln Arg Ala Ser Pro Leu Ile Val His Pro
            340                 345                 350
Lys Pro Arg Leu Ala Ser Ser Met Tyr Val Lys
        355                 360
(2)关于SEQ ID NO:26的信息
(i)序列特征
(A)长度:1757个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑结构:线型
(ii)分子类型:DNA 
(ix)特征:
(A)名称/键:CDS
(B)位置:35..1522
(xi)序列描述:SEQ ID NO:26
CCGTTGCTGT CGAGAAAACA GAAAGAAGAG AAAA ATG GAC TAC GTG AAT ATT          52
                                      Met Asp Tyr Val Asn Ile
                                        1               5
TTG CTG GGA CTG TTT TTC ACT TGG TTC TTG GTG AAT GGA CTC ATG TCA        100
Leu Leu Gly Leu Phe Phe Thr Trp Phe Leu Val Asn Gly Leu Met Ser
             10                  15                  20
CTT CGA AGA AGA AAA ATC TCT AAG AAA CTT CCA CCA GGT CCA TTT CCT        148
Leu Arg Arg Arg Lys Ile Ser Lys Lys Leu Pro Pro Gly Pro Phe Pro
         25                  30                  35
TTG CCT ATC ATC GGA AAT CTT CAC TTA CTT GGT AAT CAT CCT CAC AAA        196
Leu Pro Ile Ile Gly Asn Leu His Leu Leu Gly Asn His Pro His Lys
     40                  45                  50
TCA CTT GCT CAA CTT GCA AAA ATT CAT GGT CCT ATT ATG AAT CTC AAA        244
Ser Leu Ala Gln Leu Ala Lys Ile His Gly Pro Ile Met Asn Leu Lys
 55                  60                  65                  70
TTA GGC CAA CTA AAC ACA GTG GTC ATT TCA TCA TCA GTC GTG GCA AGA        292
Leu Gly Gln Leu Asn Thr Val Val Ile Ser Ser Ser Val Val Ala Arg
                 75                  80                  85
GAA GTC TTG CAA AAA CAA GAC TTA ACA TTT TCC AAT AGG TTT GTC CCG        340
Glu Val Leu Gln Lys Gln Asp Leu Thr Phe Ser Asn Arg Phe Val Pro
             90                  95                 100
GAC GTA GTC CAT GTC CGA AAT CAC TCC GAT TTT TCT GTT GTT TGG TTA        388
Asp Val Val His Val Arg Asn His Ser Asp Phe Ser Val Val Trp Let
        105                 110                 115
CCA GTC AAT TCT CGA TGG AAA ACG CTT CGC AAA ATC ATG AAC TCT AGC        436
Pro Val Asn Ser Arg Trp Lys Thr Leu Arg Lys Ile Met Asn Ser Ser
    120                 125                 130
ATC TTT TCT GGT AAC AAG CTT GAT GGT AAT CAA CAT CTG AGG TCT AAA        484
Ile Phe Ser Gly Asn Lys Leu Asp Gly Asn Gln His Leu Arg Ser Lys
135                 140                 145                 150
AAG GTC CAA GAG TTA ATT GAT TAT TGT CAA AAG TGT GCC AAG AAT GGC        532
Lys Val Gln Glu Leu Ile Asp Tyr Cys Gln Lys Cys Ala Lys Asn Gly
                155                 160                 165
GAA GCA GTG GAT ATA GGA AGA GCA ACT TTT GGA ACT ACT TTG AAT TTG        580
Glu Ala Val Asp Ile Gly Arg Ala Thr Phe Gly Thr Thr Leu Asn Leu
            170                 175                 180
CTA TCC AAC ACC ATT TTC TCT AAA GAT TTG ACT AAT CCG TTT TCT GAT        628
Leu Ser Asn Thr Ile Phe Ser Lys Asp Leu Thr Asn Pro Phe Ser Asp
        185                 190                 195
TCT GCT AAA GAG TTT AAG GAA TTG GTT TGG AAC ATT ATG GTT GAG GCT        676
Ser Ala Lys Glu Phe Lys Glu Leu Val Trp Asn Ile Met Val Glu Ala
    200                 205                 210
GGA AAA CCC AAT TTG GTG GAC TAC TTT CCT TTC CTT GAG AAA ATT GAT        724
Gly Lys Pro Asn Leu Val Asp Tyr Phe Pro Phe Leu Glu Lys Ile Asp
215                 220                 225                 230
CCG CAA GGT ATA AAG CGA CGC ATG ACT AAT AAT TTT ACT AAG TTT CTT        772
Pro Gln Gly Ile Lys Arg Arg Met Thr Asn Asn Phe Thr Lys Phe Leu
                235                 240                 245
GGC CTT ATC AGC GGT TTG ATT GAT GAC CGG TTA AAG GAA AGG AAT CTA        820
Gly Leu Ile Ser Gly Leu Ile Asp Asp Arg Leu Lys Glu Arg Asn Leu
            250                 255                 260
AGG GAC AAT GCA AAT ATT GAT GTT TTA GAC GCC CTT CTC AAC ATT AGC        868
Arg Asp Asn Ala Asn Ile Asp Val Leu Asp Ala Leu Leu Asn Ile Ser
        265                 270                 275
CAA GAG AAC CCA GAA GAG ATT GAC AGG AAT CAA ATC GAG CAG TTG TGT        916
Gln Glu Asn Pro Glu Glu Ile Asp Arg Asn Gln Ile Glu Gln Leu Cys
    280                 285                 290
CTG GAC TTG TTT GCA GCA GGG ACT GAT ACT ACA TCG AAT ACC TTG GAG        964
Leu Asp Leu Phe Ala Ala Gly Thr Asp Thr Thr Ser Asn Thr Leu Glu
295                 300                 305                 310
TGG GCA ATG GCA GAA CTA CTT CAG AAT CCA CAC ACA TTG CAG AAA GCA        1012
Trp Ala Met Ala Glu Leu Leu Gln Asn Pro His Thr Leu Gln Lys Ala
                315                 320                 325
CAA GAA GAA CTT GCA CAA GTC ATT GGT AAA GGC AAA CAA GTA GAA GAA        1060
Gln Glu Glu Leu Ala Gln Val Ile Gly Lys Gly Lys Gln Val Glu Glu
            330                 335                 340
GCA GAT GTT GGA CGA CTA CCT TAC TTG CGA TGC ATA GTG AAA GAA ACC        1108
Ala Asp Val Gly Arg Leu Pro Tyr Leu Arg Cys Ile Val Lys Glu Thr
        345                 350                 355
TTA CGA ATA CAC CCA GCG GCT CCT CTC TTA ATT CCA CGT AAA GTG GAG        1156
Leu Arg Ile His Pro Ala Ala Pro Leu Leu Ile Pro Arg Lys Val Glu
    360                 365                 370
GAA GAC GTT GAG TTG TCT ACC TAT ATT ATT CCA AAG GAT TCA CAA GTT        1204
Glu Asp Val Glu Leu Ser Thr Tyr Ile Ile Pro Lys Asp Ser Gln Val
375                 380                 385                 390
CTA GTG AAC GTA TGG GCA ATT GGA CGC AAC TCT GAT CTA TGG GAA AAT        1252
Leu Val Asn Val Trp Ala Ile Gly Arg Asn Ser Asp Leu Trp Glu Asn
                395                 400                 405
CCT TTG GTC TTT AAG CCA GAA AGG TTT TGG GAG TCA GAA ATA GAT ATC        1300
Pro Leu Val Phe Lys Pro Glu Arg Phe Trp Glu Ser Glu Ile Asp Ile
            410                 415                 420
CGA GGT CGA GAT TTT GAA CTC ATT CCA TTT GGT GCT GGT CGA AGA ATT        1348
Arg Gly Arg Asp Phe Glu Leu Ile Pro Phe Gly Ala Gly Arg Arg Ile
        425                 430                 435
TGC CCT GGA TTG CCT TTG GCT ATG AGG ATG ATT CCA GTA GCA CTA GGT        1396
Cys Pro Gly Leu Pro Leu Ala Met Arg Met Ile Pro Val Ala Leu Gly
    440                 445                 450
TCA TTG CTA AAC TCA TTT AAT TGG AAA CTA TAT GGT GGA ATT GCA CCT        1444
Ser Leu Leu Asn Ser Phe Asn Trp Lys Leu Tyr Gly Gly Ile Ala Pro
455                 460                 465                 470
AAA GAT TTG GAC ATG CAG GAA AAG TTT GGC ATT ACC TTG GCG AAA GCC        1492
Lys Asp Leu Asp Met Gln Glu Lys Phe Gly Ile Thr Leu Ala Lys Ala
                475                 480                 485
CAA CCT CTG CTA GCT ATC CCA ACT CCC CTG TAGCTATAGG GATAAATTAA          1542
Gln Pro Leu Leu Ala Ile Pro Thr Pro Leu
            490                 495
GTTGAGGTTT TAAGTTACTA GTAGATTCTA TTGCAGCTAT AGGATTTCTT TCACCATCAC      1602
GTATGCTTTA CCGTTGGATG ATGGAAAGAA ATATCTATAG CTTTGGGTTT GTTTAGTTTG      1662
CACATAAAAA TTGAATGAAT GGAATACCAT GGAGTTATAA GAAATAATAA GACTATGATT      1722
CTTACCCTAC TTGAACAATG ACATGGCTAT TTCAC                                 1757
(2)关于SEQ ID NO:27的信息
(i)序列特征
(A)长度:18个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑结构:线型
(ii)分子类型:DNA
(xi)序列描述:SEQ ID NO:27
TTTTTTTTTT TTTTTTTA                                                    18
(2)关于SEQ ID NO:28的信息
(i)序列特征
(A)长度:18个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑结构:线型
(ii)分子类型:DNA
(xi)序列描述:SEQ ID NO:28
TTTTTTTTTT TTTTTTTC
(2)关于SEQ ID NO:29的信息
(i)序列特征
(A)长度:18个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑结构:线型
(ii)分子类型:DNA    
(xi)序列描述:SEQ ID NO:29
TTTTTTTTTT TTTTTTTG                                                       18
(2)关于SEQ ID NO:30的信息
(i)序列特征
(A)长度:7个氨基酸
(B)类型:氨基酸
(C)链型:单链
(D)拓扑结构:线型
(ii)分子类型:蛋白质
(xi)序列描述:SEQ ID NO:30
Trp Ala Ile Gly Arg Asp Pro
                  5
(2)关于SEQ ID NO:31的信息
(i)序列特征
(A)长度:20个氨基酸
(B)类型:核酸
(C)链型:单链
(D)拓扑结构:线型
(ii)分子类型:DNA
(xi)序列描述:SEQ ID NO:31
TGGGCIATIG GI(A/C)GIGA(T/C)CC                                      20
(2)关于SEQ ID NO:32的信息
(i)序列特征
(A)长度:6个氨基酸
(B)类型:氨基酸
(C)链型:单链
(D)拓扑结构:线型
(ii)分子类型:蛋白质
(xi)序列描述:SEQ ID NO:32
Phe Arg Pro Glu Arg Phe
                  5
(2)关于SEQ ID NO:33的信息
(i)序列特征
(A)长度:22个氨基酸
(B)类型:核酸
(C)链型:单链
(D)拓扑结构:线型
(ii)分子类型:DNA
(xi)序列描述:SEQ ID NO:33
AGGAATT(T/C)(A/C)G ICCIGA(A/G)(A/C)GITT                            22
(2)关于SEQ ID NO:34的信息
(i)序列特征
(A)长度:32个核苷酸
(B)类型:核酸
(D)拓扑结构:线型
(C)链型:单链
(ii)分子类型:DNA
(xi)序列描述:SEQ ID NO:34
CCITT(T/C)GGIG CIGGI(A/C)GI(A/C)G IATITG(T/G)(C/G)CI GG                          32
(2)关于SEQ ID NO:35的信息
(i)序列特征
(A)长度:7个氨基酸
(B)类型:氨基酸
(C)链型:单链
(D)拓扑结构:线型
(ii)分子类型:蛋白质
(xi)序列描述:SEQ ID NO:35
Glu Phe Xaa Pro Glu Arg Phe
                  5
(2)关于SEQ ID NO:36的信息
(i)序列特征
(A)长度:20个核苷酸
(B)类型:核酸
(C)链型:单链
(D)拓扑结构:线型
(ii)分子类型:DNA
(xi)序列描述:SEQ IDNO:36
GAITT (T/C)IIIC CIGAI(A/C)GITT                                                   20
(2)关于SEQ ID NO:37的信息
(i)序列特征
(A)长度:28个核苷酸
(B)类型:核酸
(C)链型:单链
(D)拓扑结构:线型
(ii)分子类型:DNA
(xi)序列描述:SEQ ID NO:37
CCACACGAGT AGTTTTGGCA TTTGACCC                                                   28
(2)关于SEQ ID NO:38的信息
(i)序列特征
(A)长度:25个碱基酸
(B)类型:核酸
(C)链型:单链
(D)拓扑结构:线型
(ii)分子类型:DNA
(xi)序列描述:SEQ ID NO:38
GTCTTGGACA TCACACTTCA ATCTG                                                      25
(2)关于SEQ ID NO:39的信息
(i)序列特征
(A)长度:17个核苷酸
(B)类型:核酸
(C)链型:单链
(D)拓扑结构:线型
(ii)分子类型:DNA    
(xi)序列描述:SEQ ID NO:39
CCGAATTCCC CCCCCCC                                                               17
(2)关于SEQ ID NO:40的信息
(i)序列特征
(A)长度:32个核苷酸
(B)类型:核酸
(C)链型:单链
(D)拓扑结构:线型
(ii)分子类型:蛋白质
(xi)序列描述:SEQ ID NO:40
(ii)分子类型:DNA 
(xi)序列描述:SEQ ID NO:40
CCIGG(A/G)CAIA TIC(G/T)(C/T)(C/T)TICC IGCICC(A/G)AAI GG                     32

Claims (8)

1.一种分离的核酸分子,它含有编码类黄酮3′-羟化酶的核苷酸序列,其中所述核苷酸序列能在高度严格条件下与
(1)SEQ ID NO:1、3、5、7、9或14的核苷酸序列,或
(2)编码SEQ ID NO:2、6、8、10、11、12、13或15之一所示氨基酸序列或表7序列B所示氨基酸序列的核苷酸序列或其互补形式杂交,而且
其中所述核苷酸序列编码类黄酮3′-羟化酶,该酶有比SEQ ID NO:26所示核苷酸序列编码的类黄酮3′-羟化酶更有效地在植物中羟化类黄酮化合物的能力。
2.权利要求1的分离的核酸分子,其中该核酸分子含有编码SEQ IDNO:2、6、8、10、11、12、13或15之一所示氨基酸序列或表7序列B所示氨基酸序列的核苷酸序列。
3.权利要求1所述的分离的核酸分子,含有选自SEQ ID NO:1、5、7、9、14和16的核苷酸序列。
4.一种能在植物中减少编码类黄酮3′-羟化酶的内源性基因表达的基因构建体,所述的基因构建体包含权利要求1-3任一项的核酸分子。
5.一种生产能合成类黄酮3′-羟化酶的转基因植物的方法,所述方法包含用权利要求1-3任一项的核酸分子,在允许所述的核酸分子最终表达的条件下稳定地转化合适植物的细胞,从该细胞再生转基因植物,并在足以允许该核酸分子表达的条件下让所述的转基因植物生长一段时间。
6.一种生产降低了内源性或现存类黄酮3′-羟化酶活性的转基因植物的方法,所述方法包含用权利要求1-3任一项的核酸分子稳定地转化合适植物的细胞,从该细胞再生转基因植物,并且,如果需要,在足以允许该核酸分子表达的条件下让所述的转基因植物生长。
7.一种生产能调节类黄酮化合物羟基化的转基因植物的方法,所述方法包括用权利要求1-3任一项的核酸分子,稳定地转化合适植物的细胞或细胞团,并从所述的细胞或细胞团再生转基因植物。
8.根据权利要求1-3任一项的含有编码类黄酮3′-羟化酶的核苷酸序列的核酸分子在制备能调节植物或植物细胞中类黄酮化合物羟基化的基因构建体中的用途。
CN200910009746A 1996-03-01 1997-02-28 编码类黄酮途径酶的基因序列及其用途 Pending CN101693895A (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
AUPN8386 1996-03-01
AUPN8386A AUPN838696A0 (en) 1996-03-01 1996-03-01 Genetic sequences encoding flavonoid pathway enzymes and uses therefor

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
CN97193973A Division CN1216583A (zh) 1996-03-01 1997-02-28 编码类黄酮途径酶的基因序列及其用途

Publications (1)

Publication Number Publication Date
CN101693895A true CN101693895A (zh) 2010-04-14

Family

ID=3792699

Family Applications (3)

Application Number Title Priority Date Filing Date
CN97193973A Pending CN1216583A (zh) 1996-03-01 1997-02-28 编码类黄酮途径酶的基因序列及其用途
CNA2008100876496A Pending CN101381736A (zh) 1996-03-01 1997-02-28 编码类黄酮途径酶的基因序列及其用途
CN200910009746A Pending CN101693895A (zh) 1996-03-01 1997-02-28 编码类黄酮途径酶的基因序列及其用途

Family Applications Before (2)

Application Number Title Priority Date Filing Date
CN97193973A Pending CN1216583A (zh) 1996-03-01 1997-02-28 编码类黄酮途径酶的基因序列及其用途
CNA2008100876496A Pending CN101381736A (zh) 1996-03-01 1997-02-28 编码类黄酮途径酶的基因序列及其用途

Country Status (12)

Country Link
US (2) US6774285B1 (zh)
EP (1) EP0929676B1 (zh)
JP (9) JP2001513621A (zh)
CN (3) CN1216583A (zh)
AT (1) ATE406445T1 (zh)
AU (2) AUPN838696A0 (zh)
CA (1) CA2247922C (zh)
DE (1) DE69738942D1 (zh)
DK (1) DK0929676T3 (zh)
ES (1) ES2313732T3 (zh)
NZ (1) NZ331603A (zh)
WO (1) WO1997032023A1 (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106318920A (zh) * 2016-09-14 2017-01-11 中国科学院天津工业生物技术研究所 黄酮‑6‑羟化酶及其在灯盏乙素合成中的应用
CN116042692A (zh) * 2022-09-30 2023-05-02 山东和正生态农业开发有限公司 一种萱草的遗传转化方法及其应用

Families Citing this family (36)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB9801598D0 (en) * 1998-01-26 1998-03-25 Unilever Plc Methods and compositions for modulating flavonoid content
ATE358731T1 (de) * 1998-10-09 2007-04-15 Arborgen Llc Polypeptide mit 4-cumarate:coa ligase-aktivität und deren verwendungen.
DE19918365A1 (de) * 1999-04-22 2000-10-26 Stefan Martens Genetische Sequenz, die für Flavonsynthase II Enzyme kodiert, und deren Verwendung
NZ507150A (en) * 1999-07-19 2003-11-28 Suntory Ltd Genes coding for flavone synthases
US6521748B2 (en) 1999-08-06 2003-02-18 E. I. Du Pont De Nemours And Company Polynucleotide encoding a mutant Rhodotorula glutinis tyrosine ammonia lyase polypeptide
US6368837B1 (en) 1999-08-06 2002-04-09 E. I. Du Pont Nemours And Company Bioproduction of para-hydroxycinnamic acid
US6951751B2 (en) 2002-05-23 2005-10-04 E. I. Du Pont De Nemours And Company DNA and amino acid sequences of a tyrosine-inducible tyrosine ammonia lyase enzyme from the yeast Trichosporon cutaneum
WO2004020637A1 (en) * 2002-08-30 2004-03-11 International Flower Developments Pty. Ltd. Flavonoid 3',5'hydroxylase gene sequences and uses therefor
WO2005017147A1 (ja) 2003-08-13 2005-02-24 International Flower Developments Proprietary Limited 花色が変更されたバラの製造方法
CN1871353B (zh) * 2003-08-21 2013-04-24 孟山都技术有限公司 来自报春的脂肪酸去饱和酶
US8685478B2 (en) 2005-11-21 2014-04-01 Philip Morris Usa Inc. Flavor pouch
JP5322924B2 (ja) 2006-06-01 2013-10-23 フェレニギング フォール クリステリューク ホーゲル オンデルウィース ウェテンシャッペリューク オンデルツォイク エン パティエンテンツォーク 細胞pHに関連する植物核酸およびその使用
JP5285304B2 (ja) 2007-03-15 2013-09-11 石原産業株式会社 ツユクサのフラボノイド3’,5’−水酸化酵素遺伝子
JP5144347B2 (ja) * 2007-04-26 2013-02-13 石原産業株式会社 花色を改変したコチョウランの製造方法
US9888712B2 (en) 2007-06-08 2018-02-13 Philip Morris Usa Inc. Oral pouch products including a liner and tobacco beads
US8124147B2 (en) 2007-07-16 2012-02-28 Philip Morris Usa Inc. Oral pouch products with immobilized flavorant particles
WO2009010884A2 (en) 2007-07-16 2009-01-22 Philip Morris Products S.A. Tobacco-free oral flavor delivery pouch product
AU2008323629B2 (en) * 2007-11-15 2014-06-05 Suntory Holdings Limited Genetically modified plants with altered inflorescence
US8377215B2 (en) 2008-12-18 2013-02-19 Philip Morris Usa Inc. Moist botanical pouch processing
US8863755B2 (en) * 2009-02-27 2014-10-21 Philip Morris Usa Inc. Controlled flavor release tobacco pouch products and methods of making
US9052304B2 (en) 2009-03-13 2015-06-09 Terrasep, Llc Methods and apparatus for centrifugal liquid chromatography
AT508554B1 (de) * 2009-08-26 2011-02-15 Univ Wien Tech Chalkon-hydroxylase
US8747562B2 (en) * 2009-10-09 2014-06-10 Philip Morris Usa Inc. Tobacco-free pouched product containing flavor beads providing immediate and long lasting flavor release
US10051884B2 (en) 2010-03-26 2018-08-21 Philip Morris Usa Inc. Controlled release mentholated tobacco beads
WO2012122333A1 (en) 2011-03-08 2012-09-13 Arizona Board Of Regents, A Body Corporate Of The State Of Arizona, Acting For And On Behalf Of Arizona State University Microbial conversion of glucose to styrene and its derivatives
KR101340958B1 (ko) * 2012-07-04 2013-12-13 한국원자력연구원 국화에서 분리된 신규 f3'h 유전자 및 이를 이용한 화색 돌연변이체 선별 방법
CN104101675B (zh) * 2014-07-28 2016-05-18 云南省烟草农业科学研究院 一种液相色谱-质谱联用对烟草中类黄酮物质进行分离鉴定的方法
CN104865337B (zh) * 2015-06-10 2017-05-31 云南省烟草农业科学研究院 一种定量分析烟草花瓣中14种类黄酮物质的检测方法
CN106636145B (zh) * 2017-02-10 2020-03-17 沈阳师范大学 Nemesia strumosa KLM花青素生物合成基因及编码蛋白和应用
US11613768B2 (en) 2017-07-25 2023-03-28 Arizona Board Of Regents On Behalf Of Arizona State University Microbial production of 2-phenylethanol from renewable substrates
CN107653338B (zh) * 2017-11-15 2020-06-05 洛阳师范学院 一种影响牡丹品种和花色相关性状的分子标记及其应用
CN112391300B (zh) * 2020-11-04 2022-08-23 江南大学 水飞蓟来源的黄酮3β-羟化酶及其辅酶的应用
CN112391362B (zh) * 2020-11-04 2022-07-05 江南大学 催化活性提高的黄酮3β-羟化酶突变体及其应用
CN112391397B (zh) * 2020-11-25 2023-01-31 云南中烟工业有限责任公司 一种烟草黄酮单加氧酶基因NtCYP75B2及其应用
CN114686615A (zh) * 2022-03-17 2022-07-01 上海市农业科学院 一种f3’h同源基因的分子标记及其应用
CN117683109B (zh) * 2024-02-04 2024-04-19 云南师范大学 ScF3'H基因在提高马铃薯抗寒性中的应用

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3087246B2 (ja) * 1991-07-11 2000-09-11 インターナショナル フラワー ディベロップメンツ プロプライアタリー リミティド フラボノイド経路の酵素をコードする遺伝子配列及びその使用
JP3403196B2 (ja) * 1992-03-02 2003-05-06 協和醗酵工業株式会社 新規植物遺伝子
DK0640136T3 (da) * 1992-03-27 2003-09-01 Int Flower Dev Pty Ltd Gensekvenser der koder for enzymer i flavonoidstofskiftevejen med en flavonoid-3'-hydroxylaseaktivitet samt deres anvendelse

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106318920A (zh) * 2016-09-14 2017-01-11 中国科学院天津工业生物技术研究所 黄酮‑6‑羟化酶及其在灯盏乙素合成中的应用
CN116042692A (zh) * 2022-09-30 2023-05-02 山东和正生态农业开发有限公司 一种萱草的遗传转化方法及其应用

Also Published As

Publication number Publication date
DE69738942D1 (de) 2008-10-09
JP4309462B2 (ja) 2009-08-05
JP2001513621A (ja) 2001-09-04
DK0929676T3 (da) 2009-01-12
CA2247922C (en) 2012-01-10
NZ331603A (en) 2000-08-25
JP2008194047A (ja) 2008-08-28
JP4116665B2 (ja) 2008-07-09
US20050081264A1 (en) 2005-04-14
US6774285B1 (en) 2004-08-10
ES2313732T3 (es) 2009-03-01
JP2008148703A (ja) 2008-07-03
JP2008167763A (ja) 2008-07-24
JP4227186B2 (ja) 2009-02-18
JP2009005710A (ja) 2009-01-15
AUPN838696A0 (en) 1996-03-21
EP0929676A4 (en) 2002-01-30
JP4435842B2 (ja) 2010-03-24
JP2007244390A (ja) 2007-09-27
CN1216583A (zh) 1999-05-12
WO1997032023A1 (en) 1997-09-04
AU708920B2 (en) 1999-08-19
ATE406445T1 (de) 2008-09-15
EP0929676B1 (en) 2008-08-27
JP4116668B2 (ja) 2008-07-09
CN101381736A (zh) 2009-03-11
JP2010042018A (ja) 2010-02-25
AU1862197A (en) 1997-09-16
EP0929676A1 (en) 1999-07-21
JP2009148274A (ja) 2009-07-09
JP2009022286A (ja) 2009-02-05
JP4435849B2 (ja) 2010-03-24
JP4227185B2 (ja) 2009-02-18
CA2247922A1 (en) 1997-09-04

Similar Documents

Publication Publication Date Title
CN101693895A (zh) 编码类黄酮途径酶的基因序列及其用途
Holton et al. Cloning and expression of flavonol synthase from Petunia hybrida
AU640644B2 (en) Genetic engineering of novel plant phenotypes
JP3585932B2 (ja) 変更された花の色を示すトランスジェニック植物及びその製造方法
US5231020A (en) Genetic engineering of novel plant phenotypes
US5859329A (en) Genetic sequences encoding flavonol synthase enzymes and uses therefor
PL177743B1 (pl) Sposób uzyskiwania nowej barwy rośliny ozdobnej i wektor binarny zawierający rekombinowany gen chimeryczny
JPH07505772A (ja) フラボノイド経路の酵素をコードする遺伝子配列およびその用途
Wang et al. Cosuppression of tobacco chalcone synthase using Petunia chalcone synthase construct results in white flowers
AU667392B2 (en) Genetic sequences encoding flavonol synthase enzymes and uses therefor

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication

Open date: 20100414