CN110121556A - 甜菊醇糖苷己糖转移酶及编码该物质的基因 - Google Patents

甜菊醇糖苷己糖转移酶及编码该物质的基因 Download PDF

Info

Publication number
CN110121556A
CN110121556A CN201780080859.XA CN201780080859A CN110121556A CN 110121556 A CN110121556 A CN 110121556A CN 201780080859 A CN201780080859 A CN 201780080859A CN 110121556 A CN110121556 A CN 110121556A
Authority
CN
China
Prior art keywords
amino acid
acid residue
sequence
sequence number
leu
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201780080859.XA
Other languages
English (en)
Inventor
小埜栄一郎
落合美佐
岩城一考
平井正良
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Suntory Holdings Ltd
Original Assignee
Suntory Holdings Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Suntory Holdings Ltd filed Critical Suntory Holdings Ltd
Publication of CN110121556A publication Critical patent/CN110121556A/zh
Pending legal-status Critical Current

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/10Transferases (2.)
    • C12N9/1048Glycosyltransferases (2.4)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/10Transferases (2.)
    • C12N9/1048Glycosyltransferases (2.4)
    • C12N9/1051Hexosyltransferases (2.4.1)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/70Vectors or expression systems specially adapted for E. coli
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/80Vectors or expression systems specially adapted for eukaryotic hosts for fungi
    • C12N15/81Vectors or expression systems specially adapted for eukaryotic hosts for fungi for yeasts
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8241Phenotypically and genetically modified plants via recombinant DNA technology
    • C12N15/8242Phenotypically and genetically modified plants via recombinant DNA technology with non-agronomic quality (output) traits, e.g. for industrial processing; Value added, non-agronomic traits
    • C12N15/8243Phenotypically and genetically modified plants via recombinant DNA technology with non-agronomic quality (output) traits, e.g. for industrial processing; Value added, non-agronomic traits involving biosynthetic or metabolic pathways, i.e. metabolic engineering, e.g. nicotine, caffeine
    • C12N15/8245Phenotypically and genetically modified plants via recombinant DNA technology with non-agronomic quality (output) traits, e.g. for industrial processing; Value added, non-agronomic traits involving biosynthetic or metabolic pathways, i.e. metabolic engineering, e.g. nicotine, caffeine involving modified carbohydrate or sugar alcohol metabolism, e.g. starch biosynthesis
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P19/00Preparation of compounds containing saccharide radicals
    • C12P19/44Preparation of O-glycosides, e.g. glucosides
    • C12P19/56Preparation of O-glycosides, e.g. glucosides having an oxygen atom of the saccharide radical directly bound to a condensed ring system having three or more carbocyclic rings, e.g. daunomycin, adriamycin

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Engineering & Computer Science (AREA)
  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • Biomedical Technology (AREA)
  • Molecular Biology (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Microbiology (AREA)
  • Plant Pathology (AREA)
  • Biophysics (AREA)
  • Physics & Mathematics (AREA)
  • Mycology (AREA)
  • Nutrition Science (AREA)
  • Medicinal Chemistry (AREA)
  • Cell Biology (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • General Chemical & Material Sciences (AREA)
  • Saccharide Compounds (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)
  • Enzymes And Modification Thereof (AREA)
  • Coloring Foods And Improving Nutritive Qualities (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Medicinal Preparation (AREA)

Abstract

本发明的目的在于提供一种甜菊醇糖苷己糖转移酶及使用该酶的含有葡萄糖及/或鼠李糖的甜菊醇糖苷的制造方法。本发明提供一种甜菊醇糖苷己糖转移酶及使用该酶的含有葡萄糖及/或鼠李糖的甜菊醇糖苷的制造方法。本发明提供一种导入了甜菊醇糖苷己糖转移酶基因的转化体及该转化体的制作方法。

Description

甜菊醇糖苷己糖转移酶及编码该物质的基因
技术领域
本发明涉及一种对于甜菊醇糖苷具有转移己糖活性的蛋白质及编码该蛋白质的多核苷酸、利用该蛋白的甜菊醇糖苷的制造方法、对甜菊醇糖苷化酶进行高表达的转化体及根据所述方法制作的甜菊醇糖苷以及其利用。
背景技术
在菊科甜菊(Stevia rebaudiana)的叶中包含作为二萜的一种的被称作甜菊醇(Steviol)的次级代谢产物,由于甜菊醇糖苷呈现砂糖的约300倍的甜味而作为低热量的甜味剂在食品产业中被利用。肥胖作为深刻的社会问题在国际上日益严峻,从增进健康及削减医疗费的观点出发低热量甜味剂的需求也日益增大。目前,人工合成的氨基酸衍生物阿斯巴甜(Aspartame)、乙酰磺胺酸钾(Acesulfame Potassium)作为人工甜味剂被利用,但像甜菊醇糖苷这样天然存在的低热量甜味剂更为安全,从而期待其容易得到消费者理解(Public Acceptance)。
甜菊的主要甜菊醇糖苷,以糖最终修饰为附加了4个糖的被称为瑞鲍迪苷A(Rebaudioside A;Reb.A)的糖苷(图1)。作为其前体的甜菊醇3糖糖苷的甜菊苷(Stevioside)在量上最多,这两种物质是甜菊的甜味的核心物质。已知甜菊苷在甜菊叶中的含有最多,且呈现砂糖的250~300倍程度的甜味。Reb.A是甜味高(砂糖的350~450倍)且味道好的甜菊醇4糖糖苷,这些作为低热量甜味剂受瞩目。除此以外,已知存在被认为是反应中间体的糖苷或糖的种类不同的类似物。例如,Reb.A的4个糖苷糖均为葡萄糖,但是已知有在其中13位的葡萄糖的2位上添加了并非葡萄糖而是鼠李糖的瑞鲍迪苷C(Reb.C)或在同位置上添加了木糖的瑞鲍迪苷F(Reb.F)。
生物合成Reb.A的酶基因通过分析甜菊的表达序列标签(EST)进行分离(非专利文献1及2、专利文献1)。植物激素即二萜的赤霉素的前体即贝壳杉烯酸的13位由贝壳杉烯酸13位羟基化酶(EK13H)而羟基化从而生成甜菊醇(图2)(专利文献1)。首先甜菊醇的13位的羧基通过甜菊的UDP糖依赖性糖基转移酶(UDP-sugar dependent glycosyltransferase:UGT)即UGT85C2而糖苷化(葡糖基化)从而生成甜菊单糖苷(steviolmonoside)(非专利文献1、2)。甜菊单糖苷的13位的葡萄糖的2位进一步葡糖基化从而生成甜菊双糖苷(steviolbioside),或者甜菊单糖苷的19位的羧基葡糖基化生成名为甜叶悬钩子苷(Rubusoside)的甜菊醇的二糖糖苷。UGT91D2作为对甜菊单糖苷或甜叶悬钩子苷的13位葡萄糖的2位进行葡糖基化的酶被报告。(专利文献2:另外,UGT91D2在该文献中被称为UGT91D-like3)。一方面,已有报告指出13位的葡萄糖的3位由于UGT76G1而葡糖基化,对于19位的羧酸分别由于UGT74G1而葡糖基化(非专利文献2)。正如已报告的那样,像这样确定负责糖苷化直至Reb.A的酶基因,使甜菊醇糖苷的生物合成酶群在酵母菌中异位表达,通过培养而生产甜菊醇糖苷(专利文献3),甜菊酶的产业上的利用正在进行中。另一方面,负责含有葡萄糖以外的糖苷糖的Reb.C或Reb.F的生物合成的UGT酶尚不清楚。
现有技术文献
专利文献
专利文献1:EP 1 897 951 B1
专利文献2:WO2013/137487
专利文献3:WO2014 122328
非专利文献
非专利文献1:Brandle and Telmer(2007)Phytochemistry 68,1855-1863
非专利文献2:Richman et al(2005)Plant J.41,56-67
发明内容
本发明的课题在于提供一种甜菊醇糖苷己糖转移酶及使用该酶的含有葡萄糖及/或鼠李糖的甜菊醇糖苷的制造方法。
本发明者们为了解决上述课题进行了深入研究,结果成功的确认了甜菊中对甜菊醇糖苷即甜叶悬钩子苷的13位葡萄糖的2位上的鼠李糖添加反应进行催化的UGT91D2L#16酶,以及编码这些蛋白质的基因序列。此外,明确了UGT91D2L#16酶也可催化葡萄糖的转移。
此外,本发明者们从存在于对甜菊的甜菊醇糖苷的葡萄糖转移酶(UGT91D2)和鼠李糖转移酶(UGT91D2L#16)之间的7种氨基酸变异之中,通过同源建模分析及变异体蛋白质的评估,确定了实际上与糖供体的选择相关的氨基酸残基。
本发明基于以上见识。
通过利用本发明的酶,可以提供一种甜菊醇糖苷己糖转移酶及使用该酶的含有葡萄糖及/或鼠李糖的甜菊醇糖苷的制造方法。此外,通过促进或阻碍本发明的酶的作用,可以控制在甜菊植物体中表达的甜菊醇糖苷的种类。进一步基于本酶基因的序列及表达量,使选择含有特定的甜菊醇糖苷的个体,或代谢工程学上生产含有葡萄糖及/或鼠李糖的甜菊醇糖苷的生产成为可能。
此外,通过使本发明的蛋白质及编码该蛋白质的多核苷酸和其他的甜菊醇糖苷己糖转移酶或编码该酶的多核苷酸在同一宿主细胞中共表达,可以制作更高程度的糖苷化的甜菊醇糖苷(例如,瑞鲍迪苷C、N及O等)。
进一步,通过利用本发明,可以有效的对UGT的糖供体选择性进行设计,对天然的UGT的活性以及累积的代谢物的糖苷糖进行推断。此外,通过对本发明中确定的与糖供体的选择相关的氨基酸残基在基因组编辑技术等中进行特异性的氨基酸取代,可以应用到对不仅仅是Reb.C等含有鼠李糖的甜菊醇糖苷,还有植物二次代谢物的糖苷糖的控制中。
附图说明
图1表示甜菊醇糖苷群的名称和结构。图1中,“Glc-Glc(β2→1)”表示“Glc-Glc”由β2,1糖苷键的方式键合,“Glc-Glc(β3→1)”表示“Glc-Glc”由β3,1糖苷键的方式键合。
图2表示甜菊醇糖苷的生物合成路径。
图3表示由0.8%琼脂糖凝胶对PCR产物进行电泳,溴化乙锭染色的结果。
图4表示使其在大肠杆菌中表达的甜菊UGT蛋白质的蛋白质印迹和SDS-PAGE结果。
图5-1表示在负对照区中,将甜叶悬钩子苷葡糖基化生成甜菊苷的活性。
图5-2表示在SrUGT91D2中,将甜叶悬钩子苷葡糖基化生成甜菊苷的活性。
图5-3表示在SrUGT91D2L#16中,将甜叶悬钩子苷葡糖基化生成甜菊苷的活性。
图6-1表示负对照区中,将甜叶悬钩子苷鼠李糖苷化生成杜克苷A的活性。
图6-2表示在SrUGT91D2中,将甜叶悬钩子苷鼠李糖苷化生成杜克苷A的活性。
图6-3表示在SrUGT91D2L#16中,将甜叶悬钩子苷鼠李糖苷化生成杜克苷A的活性。
图7表示关于甜叶悬钩子苷的葡糖基化及鼠李糖苷化,UGT91D2及UGT91D2L#16的对比活性。
图8表示利用UGT91D2和UGT91D2L#16的甜菊醇糖苷的糖苷化路径。
图9为表示由在酵母菌中的甜菊醇糖苷的生产(甜菊醇添加量0.5μg/ml)得到的甜菊醇糖苷的HPLC分析结果的图。
图10为表示由在酵母菌中的甜菊醇糖苷的生产(甜菊醇添加量2μg/ml)得到的甜菊醇糖苷的HPLC分析结果的图。图10中,Reb.C表示瑞鲍迪苷C,SteE表示甜菊醇单葡糖基酯,SteM表示甜菊醇葡糖苷。
图11为表示甜菊醇添加量为2μg/ml时,A-5678株及A-56R78株中生成的Reb.C的量LC-MS结果。
图12为表示UDP-葡萄糖和与其对接的UGT91D2的同源模型的图。
图13为图12的框内的扩大图。表示UDP-葡萄糖(UDP-Glc)和与其接近的第156位的氨基酸(Thr156)及第233位的氨基酸(Ser233)的位置关系。
图14为表示使其在大肠杆菌中表达的野生型UGT91D2和变异体1的in vitro下的葡糖基化活性(A)及鼠李糖苷化活性(B)的比较、野生型UGT91D2L#16和变异体2的in vitro下的葡糖基化活性(C)及鼠李糖苷化活性(D)的比较的图表。数值表示将野生型UGT91D2或野生型UGT91D2L#16作为100%时,变异体1或2的相对活性。
图15为表示在导入了各种UGT的酵母菌中,基于野生型UGT91D2、野生型UGT91D2L#16及变异体1~6的葡糖基化活性(A)及鼠李糖苷化活性(B~D)的比较的图表。数值表示由LC-MS测定的各生成物的信号强度。
具体实施方式
以下对本发明进行详细的说明。以下的实施方式为用于说明本发明的例示,并非将本发明仅限定于该实施方式的意思。本发明,只要不脱离该主旨,可以用各种各样的方式实施。且,本说明书中引用的所有的文献及公开公报、专利公报其他的专利文献,作为参考纳入本说明书中。
本发明者们最先明确了负责向甜菊醇糖苷的13位葡萄糖的2位进行的葡萄糖及/或鼠李糖添加反应的酶蛋白为UGT91D2及UGT91D2L#16。UGT91D2及UGT91D2L#16的CDS序列及推断的氨基酸序列分别为序列号1~4。上述多核苷酸及酶可以由后述的实施例中记载的方法、公知的遗传学的方法、公知的合成方法等获得。
1.甜菊醇糖苷己糖转移酶
本发明提供选自以下(a)~(c)中的任一项所记载的蛋白质(以下称“本发明的蛋白质”)。
(a)由序列号2的氨基酸序列构成的蛋白质;
(b)由序列号2的氨基酸序列中除氨基酸残基X7以外的1~48个氨基酸缺失、取代、***、及/或添加的氨基酸序列构成的,且具有向下述通式(I)所示的化合物的13位葡萄糖的2位上添加己糖的活性的蛋白质;
(c)具有对于序列号2的氨基酸序列具有90%以上的序列一致性,且与氨基酸残基X7对应的氨基酸为同一氨基酸的氨基酸序列的,且具有向下述通式(I)所示的化合物的13位葡萄糖的2位上添加己糖的活性的蛋白质
式中,R1表示H、C1~C20烷基、C2~C20烯基、C2~C20炔基、C4~C20烷基二烯基(alkyldienyl)、C6~C18芳基、C6~C20烷基芳基、C6~C20芳基烷基、C4~C20环烷基、C4~C20环烯基、(C3~C10环烷基)C1~C10烷基或糖残基。
本发明的蛋白质,根据其他实施方式,为,
(b')由序列号2的氨基酸序列中除氨基酸残基X1~X7以外的1~48个氨基酸缺失、取代、***、及/或添加的氨基酸序列构成的,且具有向上述通式(I)所示的化合物的13位葡萄糖的2位上添加己糖的活性的蛋白质;或
(c')具有对于序列号2的氨基酸序列具有90%以上的序列一致性,且与氨基酸残基X1~X7对应的氨基酸为同一氨基酸的氨基酸序列的,且具有向上述通式(I)所示的化合物的13位葡萄糖的2位上添加己糖的活性的蛋白质。
本发明的蛋白质,根据其他实施方式,为,
(b”)由序列号2的氨基酸序列中除氨基酸残基X2及/或X3以外的1~48个氨基酸缺失、取代、***、及/或添加的氨基酸序列构成的,且具有向上述通式(I)所示的化合物的13位葡萄糖的2位上添加己糖的活性的蛋白质;或
(c”)具有对于序列号2的氨基酸序列具有90%以上的序列一致性,且与氨基酸残基X2及/或X3对应的氨基酸为同一氨基酸的氨基酸序列的,且具有向上述通式(I)所示的化合物的13位葡萄糖的2位上添加己糖的活性的蛋白质。
本发明的蛋白质,根据其他的实施方式,为,
(d)由在序列号4的氨基酸序列中,第156位的氨基酸残基为Val,及/或第233位的氨基酸残基为Phe的氨基酸序列构成的蛋白质;或
(e)由上述(d)的蛋白质中,1~48个氨基酸缺失、取代、***、及/或添加,与序列号4的第156位的氨基酸残基对应的氨基酸残基为Val,及/或与序列号4的第233位的氨基酸残基对应的氨基酸残基为Phe的氨基酸序列构成的,且具有向上述通式(I)所示的化合物的13位葡萄糖的2位上添加己糖的活性的蛋白质;或
(f)具有对于上述(d)的蛋白质的氨基酸序列具有90%以上的序列一致性,且与序列号4的第156位的氨基酸残基对应的氨基酸残基为Val,及/或与序列号4的第233位的氨基酸残基对应的氨基酸残基为Phe的氨基酸序列的,且具有向上述通式(I)所示的化合物的13位葡萄糖的2位上添加己糖的活性的蛋白质。
本发明的蛋白质,根据其他实施方式,为,
(g)序列号2的氨基酸序列中氨基酸残基X2为Thr,及/或氨基酸残基X3为Ser的蛋白质;或
(h)由上述(g)的蛋白质中,1~48个氨基酸缺失、取代、***、及/或添加,与氨基酸残基X2对应的氨基酸残基为Thr,及/或与氨基酸残基X3对应的氨基酸残基为Ser的氨基酸序列构成的,且具有向上述通式(I)所示的化合物的13位葡萄糖的2位上添加己糖的活性的蛋白质;或
(i)具有对于上述(g)的蛋白质的氨基酸序列具有90%以上的序列一致性,且与氨基酸残基X2对应的氨基酸残基为Thr,及/或与氨基酸残基X3对应的氨基酸残基为Ser的氨基酸序列的,且具有向上述通式(I)所示的化合物的13位葡萄糖的2位上添加己糖的活性的蛋白质。
上述(b)、(b')、(b”)、(c)、(c')、(c”)、(d)~(i)中记载的蛋白质,代表性而言,为天然存在的序列号2或4的多肽的变异体,但是也包含可以利用例如,"Sambrook&Russell,Molecular Cloning:A Laboratory Manual Vol.3,Cold Spring Harbor LaboratoryPress 2001"、"Ausubel,Current Protocols in Molecular Biology,John Wiley&Sons1987-1997"、"Nuc.Acids.Res.,10,6487(1982)"、"Proc.Natl.Acad.Sci.USA,79,6409(1982)"、"Gene,34,315(1985)"、"Nuc.Acids.Res.,13,4431(1985)"、"Proc.Natl.Acad.Sci.USA,82,488(1985)"等中记载的定点突变法而人为获取的蛋白质。
本说明书中,作为“由序列号2的氨基酸序列中除氨基酸残基X7以外的1~48个氨基酸缺失、取代、***、及/或添加的氨基酸序列构成的,且具有向通式(I)所示的化合物的13位葡萄糖的2位上添加己糖的活性的蛋白质”,可列举在序列号2的氨基酸序列中,除氨基酸残基X7以外,例如1~48个、1~47个、1~46个、1~45个、1~44个、1~43个、1~42个、1~41个、1~40个、1~39个、1~38个、1~37个、1~36个、1~35个、1~34个、1~33个、1~32个、1~31个、1~30个、1~29个、1~28个、1~27个、1~26个、1~25个、1~24个、1~23个、1~22个、1~21个、1~20个、1~19个、1~18个、1~17个、1~16个、1~15个、1~14个、1~13个、1~12个、1~11个、1~10个、1~9个(1~数个)、1~8个、1~7个、1~6个、1~5个、1~4个、1~3个、1~2个或1个氨基酸缺失、取代、***、及/或添加的氨基酸序列构成的,且具有向通式(I)所示的化合物的13位葡萄糖的2位上添加己糖的活性的蛋白质。上述氨基酸残基的缺失、取代、***、及/或添加的数,一般而言越小越优选。
此外,作为上述蛋白质,可列举具有与序列号2的氨基酸序列具有90%以上、91%以上、92%以上、93%以上、94%以上、95%以上、96%以上、97%以上、98%以上、99%以上、99.1%以上、99.2%以上、99.3%以上、99.4%以上、99.5%以上、99.6%以上、99.7%以上、99.8%以上或99.9%以上的序列一致性的氨基酸序列的,且具有与氨基酸残基X7对应的氨基酸为同一氨基酸的氨基酸序列的,且具有向通式(I)所示的化合物的13位葡萄糖的2位上添加己糖的活性的蛋白质。上述序列一致性的数值一般而言越大越优选。
同样的,本说明书中,作为“由序列号2的氨基酸序列中除氨基酸残基X1~X7以外的1~48个氨基酸缺失、取代、***、及/或添加的氨基酸序列构成的,且具有向通式(I)所示的化合物的13位葡萄糖的2位上添加己糖的活性的蛋白质”,可列举在序列号2的氨基酸序列中,氨基酸残基X1~X7以外,例如1~48个、1~47个、1~46个、1~45个、1~44个、1~43个、1~42个、1~41个、1~40个、1~39个、1~38个、1~37个、1~36个、1~35个、1~34个、1~33个、1~32个、1~31个、1~30个、1~29个、1~28个、1~27个、1~26个、1~25个、1~24个、1~23个、1~22个、1~21个、1~20个、1~19个、1~18个、1~17个、1~16个、1~15个、1~14个、1~13个、1~12个、1~11个、1~10个、1~9个(1~数个)、1~8个、1~7个、1~6个、1~5个、1~4个、1~3个、1~2个或1个氨基酸缺失、取代、***、及/或添加的氨基酸序列构成的,且具有向通式(I)所示的化合物的13位葡萄糖的2位上添加己糖的活性的蛋白质。上述氨基酸残基的缺失、取代、***、及/或添加的数,一般而言越小越优选。
此外,作为上述蛋白质,可列举具有与序列号2的氨基酸序列具有90%以上、91%以上、92%以上、93%以上、94%以上、95%以上、96%以上、97%以上、98%以上、99%以上、99.1%以上、99.2%以上、99.3%以上、99.4%以上、99.5%以上、99.6%以上、99.7%以上、99.8%以上或99.9%以上的序列一致性的氨基酸序列的,且具有与氨基酸残基X1~X7对应的氨基酸为同一氨基酸的氨基酸序列的,且具有向通式(I)所示的化合物的13位葡萄糖的2位上添加己糖的活性的蛋白质。上述序列一致性的数值一般而言越大越优选。
本说明书中,作为“序列号2的氨基酸序列中除氨基酸残基X2及/或X3以外的1~48个氨基酸缺失、取代、***、及/或添加的氨基酸序列构成的,且具有向通式(I)所示的化合物的13位葡萄糖的2位上添加己糖的活性的蛋白质”,可列举在序列号2的氨基酸序列中,氨基酸残基X2及/或X3以外,例如1~48个、1~47个、1~46个、1~45个、1~44个、1~43个、1~42个、1~41个、1~40个、1~39个、1~38个、1~37个、1~36个、1~35个、1~34个、1~33个、1~32个、1~31个、1~30个、1~29个、1~28个、1~27个、1~26个、1~25个、1~24个、1~23个、1~22个、1~21个、1~20个、1~19个、1~18个、1~17个、1~16个、1~15个、1~14个、1~13个、1~12个、1~11个、1~10个、1~9个(1~数个)、1~8个、1~7个、1~6个、1~5个、1~4个、1~3个、1~2个或1个氨基酸残基缺失、取代、***、及/或添加的氨基酸序列构成的,且具有向通式(I)所示的化合物的13位葡萄糖的2位上添加己糖的活性的蛋白质。上述氨基酸残基的缺失、取代、***、及/或添加的数,一般而言越小越优选。
此外,作为上述蛋白质,可列举具有与序列号2的氨基酸序列具有90%以上、91%以上、92%以上、93%以上、94%以上、95%以上、96%以上、97%以上、98%以上、99%以上、99.1%以上、99.2%以上、99.3%以上、99.4%以上、99.5%以上、99.6%以上、99.7%以上、99.8%以上或99.9%以上的序列一致性,且与氨基酸残基X2及/或X3对应的氨基酸与序列号2的氨基酸序列的氨基酸为同一氨基酸的氨基酸序列的,且具有向通式(I)所示的化合物的13位葡萄糖的2位上添加己糖的活性的蛋白质。上述序列一致性的数值一般而言越大越优选。
本说明书中,作为“由在(d)的蛋白质中,1~48个氨基酸缺失、取代、***、及/或添加,与序列号4的第156位的氨基酸残基对应的氨基酸残基为Val,及/或与序列号4的第233位的氨基酸残基对应的氨基酸残基为Phe的氨基酸序列构成的,且具有向通式(I)所示的化合物的13位葡萄糖的2位上添加己糖的活性的蛋白质”,可列举由在(d)的蛋白质的氨基酸序列中,例如1~48个、1~47个、1~46个、1~45个、1~44个、1~43个、1~42个、1~41个、1~40个、1~39个、1~38个、1~37个、1~36个、1~35个、1~34个、1~33个、1~32个、1~31个、1~30个、1~29个、1~28个、1~27个、1~26个、1~25个、1~24个、1~23个、1~22个、1~21个、1~20个、1~19个、1~18个、1~17个、1~16个、1~15个、1~14个、1~13个、1~12个、1~11个、1~10个、1~9个(1~数个)、1~8个、1~7个、1~6个、1~5个、1~4个、1~3个、1~2个或1个氨基酸残基缺失、取代、***、及/或添加,且与序列号4的第156位的氨基酸残基对应的氨基酸残基为Val,及/或与序列号4的第233位的氨基酸残基对应的氨基酸残基为Phe的氨基酸序列构成的,且具有向通式(I)所示的化合物的13位葡萄糖的2位上添加己糖的活性的蛋白质。上述氨基酸残基的缺失、取代、***、及/或添加的数,一般而言越小越优选。
此外,作为上述蛋白质,可列举具有与(d)的蛋白质的氨基酸序列具有90%以上、91%以上、92%以上、93%以上、94%以上、95%以上、96%以上、97%以上、98%以上、99%以上、99.1%以上、99.2%以上、99.3%以上、99.4%以上、99.5%以上、99.6%以上、99.7%以上、99.8%以上或99.9%以上的序列一致性,且与序列号4的第156位的氨基酸残基对应的氨基酸残基为Val,及/或与序列号4的第233位的氨基酸残基对应的氨基酸残基为Phe的氨基酸序列的,且具有向通式(I)所示的化合物的13位葡萄糖的2位上添加己糖的活性的蛋白质。上述序列一致性的数值一般而言越大越优选。
本说明书中,作为“由在(g)的蛋白质中,1~48个氨基酸缺失、取代、***、及/或添加,与氨基酸残基X2对应的氨基酸残基为Thr,及/或与氨基酸残基X3对应的氨基酸残基为Ser的氨基酸序列构成的,且具有向通式(I)所示的化合物的13位葡萄糖的2位上添加己糖的活性的蛋白质”,可列举由在(g)的蛋白质的氨基酸序列中,氨基酸残基X1~X7以外,例如1~48个、1~47个、1~46个、1~45个、1~44个、1~43个、1~42个、1~41个、1~40个、1~39个、1~38个、1~37个、1~36个、1~35个、1~34个、1~33个、1~32个、1~31个、1~30个、1~29个、1~28个、1~27个、1~26个、1~25个、1~24个、1~23个、1~22个、1~21个、1~20个、1~19个、1~18个、1~17个、1~16个、1~15个、1~14个、1~13个、1~12个、1~11个、1~10个、1~9个(1~数个)、1~8个、1~7个、1~6个、1~5个、1~4个、1~3个、1~2个或1个氨基酸残基缺失、取代、***、及/或添加,且与氨基酸残基X2对应的氨基酸残基为Thr,及/或与氨基酸残基X3对应的氨基酸残基为Ser的氨基酸序列构成的,且具有向通式(I)所示的化合物的13位葡萄糖的2位上添加己糖的活性的蛋白质。上述氨基酸残基的缺失、取代、***、及/或添加的数,一般而言越小越优选。
此外,作为上述蛋白质,可列举具有与(g)的蛋白质的氨基酸序列具有90%以上、91%以上、92%以上、93%以上、94%以上、95%以上、96%以上、97%以上、98%以上、99%以上、99.1%以上、99.2%以上、99.3%以上、99.4%以上、99.5%以上、99.6%以上、99.7%以上、99.8%以上或99.9%以上的序列一致性,且与氨基酸残基X2对应的氨基酸残基为Thr,及/或与氨基酸残基X3对应的氨基酸残基为Ser的氨基酸序列的,且具有向通式(I)所示的化合物的13位葡萄糖的2位上添加己糖的活性的蛋白质。上述序列一致性的数值一般而言越大越优选。
在此,所谓“向通式(I)所示的化合物的13位葡萄糖的2位上添加己糖的活性”,是指向下述通式(I)所示的化合物的13位葡萄糖的2位上,添加己糖的活性。
在通式(I)中,Glc表示葡萄糖残基。此外,在通式(I)中,R1表示H、C1~C20烷基、C2~C20烯基、C2~C20炔基、C4~C20烷基二烯基、C6~C18芳基、C6~C20烷基芳基、C6~C20芳基烷基、C4~C20环烷基、C4~C20环烯基、(C3~C10环烷基)C1~C10烷基或糖残基。
本说明书中,“C1~C20烷基”优选为C1~C10烷基,更优选为C1~C6烷基。作为烷基的例子,并无限制,可列举甲基、乙基、丙基、异丙基、正丁基、仲丁基、叔丁基、戊基、己基、十二碳烯基(dodecanyl)等。
本说明书中,“C2~C20烯基”优选为C2~C10烯基,更优选为C2~C6烯基。作为烯基的例子,并无限制,可列举乙烯基、烯丙基、丙烯基、异丙烯基、2-甲基-1-丙烯基、2-甲基烯丙基、2-丁烯基等。
本说明书中,“C2~C20炔基”优选为C2~C10炔基,更优选为C2~C6炔基。作为炔基的例子,并无限制,可列举乙炔基、2-丙炔基、2-丁炔基等。
本说明书中,“C4~C20烷基二烯基”优选为C4~C10烷基二烯基,更优选为C4~C6烷基二烯基。作为烷基二烯基的例子,并无限制,可列举1,3-丁二烯等。
本说明书中,“C6~C18芳基”优选为C6~C10芳基。作为芳基的例子,并无限制,可列举苯基、1-萘基、2-萘基、茚基、联苯基、蒽基、菲基等。
本说明书中,“C6~C20烷基芳基”优选为C6~C12烷基芳基。作为烷基芳基的例子,并无限制,可列举邻甲苯基、间甲苯基、对甲苯基、2,3-二甲苯基、2,4-二甲苯基、2,5-二甲苯基、邻异丙苯基、间异丙苯基、对异丙苯基、莱基等。
本说明书中,“C6~C20芳基烷基”优选为C6~C12芳基烷基。作为芳基烷基的例子,并无限制,可列举苯甲基、苯乙基、二苯甲基、三苯甲基、1-萘基甲基、2-萘基甲基、2,2-二苯甲基、3-苯丙基、4-苯丁基、5-苯戊基等。
本说明书中,“C4~C20环烷基”优选为C4~C10环烷基。作为环烷基的例子,并无限制,可列举环丙基、环丁基、环戊基、环己基等。
本说明书中,“C4~C20环烯基”优选为C4~C10环烯基。作为环烯基的例子,并无限制,可列举环丙烯基、环丁烯基、2-环戊烯-1-基、2-环己烯-1-基、3-环己烯-1-基等。
本说明书中,作为“(C3~C10环烷基)C1~C10烷基”的例子,可列举甲基环丙基、乙基环丙基、甲基环丁基、乙基环戊基、甲基环己基等。
本说明书中,“糖残基”并无特别限定,可以为由1以上的戊糖、己糖(包括脱氧己糖)或其组合构成的糖的残基。
作为戊糖的例子,可列举核糖、***糖及来苏糖,作为己糖的例子,可列举阿洛糖、阿卓糖、葡萄糖、甘露糖、古洛糖、艾杜糖、半乳糖、塔罗糖、鼠李糖。
“糖残基”优选为由1以上的己糖单元构成的糖的残基,更优选为葡萄糖单体(-Glc)或葡萄糖二聚体(-Glc-Glc)的糖残基。在葡萄糖二聚体的糖残基中,优选葡萄糖彼此以β2,1糖苷键的方式键合。
通式(I)的化合物优选为甜菊单糖苷或甜叶悬钩子苷。
根据本发明的蛋白质,向通式(I)所示化合物的13位葡萄糖的2位添加的己糖,并无特别限定,优选为选自葡萄糖、鼠李糖、甘露糖及半乳糖中的己糖,更优选为葡萄糖或鼠李糖。上述己糖最优选为鼠李糖。在上述(a)、(b')、(b”)、(c')、(c”)、(d)~(f)所记载的蛋白质中,作为上述己糖,鼠李糖可被特别有利地使用。此外,在上述(g)~(i)所记载地蛋白质中,作为上述己糖,葡萄糖可被特别有利地使用。
向通式(I)所示的化合物的13位葡萄糖的2位上添加己糖的活性,可以通过以下方法进行验证:在含有被检测蛋白质、UDP糖(例如,UDP-葡萄糖)1~1000μM(优选100~700μM,最优选500μM)及底物化合物(通式(I)的化合物)1~500μM(优选100~500μM,最优选250μM)的pH6.0~8.0的中性区域的缓冲液(例如,磷酸钠缓冲液或磷酸钾缓冲液)中,于20~40℃的温度下培养10分~2小时后,将上述底物化合物提纯,通过LC-MS分析(LiquidChromatography-Mass Spectrometry)等公知的方法对提纯后的单萜进行分析。
LC-MS分析的结果,当检测出在通式(I)所示的化合物的13位葡萄糖的2位上添加了己糖时,可以称所述被检测蛋白质具有向通式(I)所示的化合物的13位葡萄糖的2位上添加己糖的活性。
上述己糖添加反应一般于1分~12小时左右结束。
所谓本发明的蛋白质的氨基酸序列中,1个或复数个氨基酸残基缺失、取代、***及/或添加,是指在同一序列中任意且1个或复数个的氨基酸序列中的位置上,有1个或复数个氨基酸残基缺失、取代、***及/或添加,也可同时发生缺失、取代、***及添加中的2种以上。
以下示出可相互取代的氨基酸残基的例子。包含于同一组的氨基酸残基可以相互取代。A组:亮氨酸、异亮氨酸、正亮氨酸、缬氨酸、正缬氨酸、丙氨酸、2-氨基丁酸、蛋氨酸、邻甲基丝氨酸、叔丁基甘氨酸、叔丁基丙氨酸、环己基丙氨酸;B组:天冬氨酸、谷氨酸、异天冬氨酸、异谷氨酸、2-氨基己二酸、2-氨基辛二酸;C组:天冬酰胺、谷氨;D组:赖氨酸、精氨酸、鸟氨酸、2,4-二氨基丁酸、2,3-二氨基丙酸;E组:脯氨酸、3-羟基脯氨酸、4-羟基脯氨酸;F组:丝氨酸、苏氨酸、高丝氨酸;G群:苯基丙氨酸、酪氨酸。
本发明的蛋白质,可以通过使编码该蛋白质的多核苷酸(参考后述的“本发明的多核苷酸”)在适合的宿主细胞内表达而获取,也可以根据Fmoc法(芴甲氧羰基法)、tBoc法(叔丁氧基羰基法)等化学合成法来制造。此外,还可以利用Advanced Automation PeptideProtein Technologies公司制、Perkin Elmer公司制、Protein Technologies公司制、PerSeptive公司制、Applied Biosystems公司制、SHIMADZU公司制等肽合成机进行化学合成。
2.甜菊醇糖苷的制造方法。
通过利用本发明的蛋白质具有的,向通式(I)所示的化合物的13位的葡萄糖的2位添加己糖的活性,可以简单且大量的制造甜菊醇糖苷。
于是,在其他的实施方式中,本发明提供一种包含使本发明的蛋白质与UDP-糖和下述通式(I)及/或下述通式(II)所示的化合物反应,向通式(I)所示的化合物的13位葡萄糖的2位添加己糖的工序的,甜菊醇糖苷的第1制造方法。
通式(I)的Glc及R1的定义如上所述。通式(I)的化合物优选为甜菊单糖苷或甜叶悬钩子苷。
本说明书中,所谓“UDP-糖”,是尿苷二磷酸(Uridine DiPhosphate:UDP)键合型的糖。作为UDP-糖中糖部分的优选例子可列举由1个以上的己糖构成的糖。己糖的例子如上所述。UDP-糖优选为UDP-己糖,更优选为选自葡萄糖、鼠李糖、甘露糖及半乳糖中的己糖。上述UDP-糖最优选为UDP-鼠李糖。作为本发明的蛋白质,使用上述(a)、(b')、(b”)、(c')、(c”)、(d)~(f)所记载的蛋白质时,作为UDP-糖,UDP-鼠李糖可被特别有利地使用。此外,作为本发明的蛋白质,使用上述(g)~(i)所记载的蛋白质时,作为UDP-糖,UDP-葡萄糖可被特别有利地使用。
本发明涉及的甜菊醇糖苷的第1制造方法包含本发明的蛋白质与UDP-糖和通式(I)所示的化合物反应,向通式(I)所示的化合物的13位葡萄糖的2位添加己糖的工序。本发明的第1制造方法可以进一步包含对所述工序中生成的甜菊醇糖苷进行提纯的工序。此外,本发明第1制造方法还可包含向所述工序中生成的甜菊醇糖苷上进一步添加糖的工序。
作为通过第1制造方法而生成的甜菊醇糖苷的例子,可列举甜菊双糖苷、甜菊苷、杜克苷A、Reb.E或Reb.C或者上述物质的组合,但并不仅限于此。
生成的甜菊醇糖苷,通过适当的溶剂(水等水性溶液或醇、醚及丙酮等有机溶剂)萃取,可通过利用乙酸乙酯、其他有机溶剂:水的梯度、高效液相色谱法(High PerformanceLiquid Chromatography:HPLC)、超高效液相色谱(Ultra(High)Performance Liquidchromatography:UPLC)等公知的方法提纯。
3.甜菊醇糖苷高含量的非人类转化体
甜菊醇糖苷也可通过使用本发明的的蛋白质在细菌(大肠杆菌或酵母菌等)、植物、昆虫、除人类以外的哺乳动物等的细胞内生成。本发明的蛋白质为来自甜菊的酶或其变异体,所以期待其在细胞内环境中也具有高活性。此时,可以通过将编码本发明的蛋白质的多核苷酸(参考后述的“本发明的多核苷酸”)导入来自细菌、植物、昆虫、除人类以外的哺乳动物等的宿主细胞中从而表达本发明的蛋白质,使本发明的蛋白质和在上述细胞内存在的UDP-糖及通式(I)所示的化合物反应而生成甜菊醇糖苷。
于是本发明提供一种导入了选自以下(a)~(e)中的任一项所记载的多核苷酸(以下称“本发明的多核苷酸”)的非人类转化体(以下称“本发明的转化体”)。
(a)含有序列号1的碱基序列的多核苷酸;
(b)编码由序列号2的氨基酸序列构成的蛋白质的多核苷酸;
(c)编码由序列号2的氨基酸序列中除氨基酸残基X7以外1~48个氨基酸缺失、取代、***及/或添加的氨基酸序列构成的,且具有向上述通式(I)所示的化合物的13位葡萄糖的2位添加己糖的活性的蛋白质的多核苷酸;
(d)编码具有对于序列号2的氨基酸序列具有90%以上的序列一致性,且与氨基酸残基X7对应的氨基酸为同一氨基酸的氨基酸序列的,且具有向上述通式(I)所示的化合物的13位葡萄糖的2位上添加己糖的活性的蛋白质的多核苷酸。
此外,根据本发明的一种实施方式提供,
(c')编码由序列号2的氨基酸序列中除氨基酸残基X1~X7以外1~48个氨基酸缺失、取代、***及/或添加的氨基酸序列构成的,且具有向上述通式(I)所示的化合物的13位葡萄糖的2位添加己糖的活性的蛋白质的多核苷酸;或
(d')编码具有对于序列号2的氨基酸序列具有90%以上的序列一致性,且与氨基酸残基X1~X7对应的氨基酸为同一氨基酸的氨基酸序列的,且具有向上述通式(I)所示的化合物的13位葡萄糖的2位上添加己糖的活性的蛋白质的多核苷酸。
根据本发明的其他实施方式提供,
(c”)编码在序列号2的氨基酸序列中除氨基酸残基X2及/或X3以外的1~48个氨基酸缺失、取代、***、及/或添加的氨基酸序列构成的,且具有向上述通式(I)所示的化合物的13位葡萄糖的2位上添加己糖的活性的蛋白质的多核苷酸;或
(d”)编码具有对于序列号2的氨基酸序列具有90%以上的序列一致性,且与氨基酸残基X2及/或X3对应的氨基酸为同一氨基酸的氨基酸序列的,且具有向上述通式(I)所示的化合物的13位葡萄糖的2位上添加己糖的活性的蛋白质的多核苷酸。
根据本发明的其他实施方式提供,
(e)编码由序列号4的氨基酸序列中,第156位的氨基酸残基为Val,及/或第233位的氨基酸残基为Phe的氨基酸序列构成的蛋白质的多核苷酸;或
(f)编码由上述(e)所述的蛋白质中,1~48个氨基酸缺失、取代、***、及/或添加,与序列号4的第156位的氨基酸残基对应的氨基酸残基为Val,及/或与序列号4的第233位的氨基酸残基对应的氨基酸残基为Phe的氨基酸序列构成的,且具有向上述通式(I)所示的化合物的13位葡萄糖的2位上添加己糖的活性的蛋白质的多核苷酸;或
(g)编码具有对于上述(e)所述的蛋白质的氨基酸序列具有90%以上的序列一致性,且与序列号4的第156位的氨基酸残基对应的氨基酸残基为Val,及/或与序列号4的第233位的氨基酸残基对应的氨基酸残基为Phe的氨基酸序列的,且具有向上述通式(I)所示的化合物的13位葡萄糖的2位上添加己糖的活性的蛋白质的多核苷酸。
根据本发明的其他实施方式提供,
(h)编码序列号2的氨基酸序列中,氨基酸残基X2为Thr,及/或氨基酸残基X3为Ser的蛋白质的多核苷酸;或
(i)编码由在上述(h)所述的蛋白质中1~48个氨基酸缺失、取代、***、及/或添加,与氨基酸残基X2对应的氨基酸残基为Thr,及/或与氨基酸残基X3对应的氨基酸残基为Ser的氨基酸序列构成的,且具有向上述通式(I)所示的化合物的13位葡萄糖的2位上添加己糖的活性的蛋白质的多核苷酸;或
(j)编码具有对于上述(h)所述的蛋白质的氨基酸序列具有90%以上的序列一致性,且与氨基酸残基X2对应的氨基酸残基为Thr,及/或与氨基酸残基X3对应的氨基酸残基为Ser的氨基酸序列的,且具有向上述通式(I)所示的化合物的13位葡萄糖的2位上添加己糖的活性的蛋白质的多核苷酸。
通式(I)的定义及具体例正如已述内容,此外,向通式(I)所示化合物的13位葡萄糖的2位上添加的己糖的定义及具体例也如前所述。
本说明书中,所谓多核苷酸,是指DNA或RNA。
本说明书中,所谓“高严格的条件下杂交的多核苷酸”是指,例如,将由与序列号1的碱基序列所构成的多核苷酸或由编码序列号2的氨基酸序列的碱基序列构成的多核苷酸的全部或者一部分作为探针,通过使用菌落杂交法、噬菌斑杂交法或Southern杂交法等获得的多核苷酸。作为杂交的方法,例如,可以利用"Sambrook&Russell,Molecular Cloning:A Laboratory Manual Vol.3,Cold Spring Harbor,Laboratory Press 2001"及"Ausubel,Current Protocols in Molecular Biology,John Wiley&Sons 1987-1997"等中所记载的方法。
本说明书中,所谓“高严格的条件”,例如,为(1)5×SSC、5×Denhardt's溶液、0.5%SDS、50%甲酰胺、50℃、(2)0.2×SSC、0.1%SDS、60℃、(3)0.2×SSC、0.1%SDS、62℃、(4)0.2×SSC、0.1%SDS、65℃或(5)0.1×SSC、0.1%SDS、65℃的条件,但并不限定于此。在这些条件中,越将温度提高越期待可以高效的获取具有高度序列一致性的DNA。但是,作为影响杂交的严格度的要素,需要考虑温度、探针浓度、探针长度、离子强度、时间、盐浓度等复数个要素,若是本领域的技术人员,适当选择这些要素,可以实现同样的严格度。
另外,在杂交中使用市售的试剂盒时,例如可以使用Alkphos Direct Labellingand Detection System(GE Healthcare)。此时,依照试剂盒所附规程,与已标识的探针培育一晚后,于55~60℃的条件下以含有0.1%(w/v)SDS的1次洗净缓冲液将膜洗净后,可以检测出杂交后的DNA。或者,在基于与序列号1的碱基序列互补的碱基序列、或与编码序列号2的氨基酸序列的碱基序列的全部或一部分互补的序列制作探针时,利用市售的药剂(例如,PCR Labeling Mix(Roche·Diagnostics公司)等)对该探针进行地高辛(DIG)标记时,可以利用DIG核酸检测试剂盒(Roche·Diagnostics公司)检测杂交。
作为上述之外可能杂交的多核苷酸,可列举,通过FASTA、BLAST等相同性检索软件,利用默认参数进行计算时,与序列号1的DNA或编码序列号2的氨基酸序列的DNA具有80%以上、81%以上、82%以上、83%以上、84%以上、85%以上、86%以上、87%以上、88%以上、89%以上、90%以上、91%以上、92%以上、93%以上、94%以上、95%以上、96%以上、97%以上、98%以上、99%以上、99.1%以上、99.2%以上、99.3%以上、99.4%以上、99.5%以上、99.6%以上、99.7%以上、99.8%以上或99.9%以上的序列一致性的DNA。
另外,氨基酸序列或碱基序列的序列一致性可以使用FASTA(Science 227(4693):1435-1441,(1985))或Karlin及Altschul提出的算法BLAST(Basic Local AlignmentSearch Tool)(Proc.Natl.Acad.Sci.USA 872264-2268,1990;Proc Natl Acad Sci USA90:5873,1993)来确定。基于BLAST的算法的称作blastn、blastx、blastp、tblastn或tblastx程序已被开发(Altschul SF,et al:J Mol Biol 215:403,1990)。使用blastn对碱基序列进行分析时,例如参数设置为score=100、wordlength=12。此外,使用blastp对氨基酸序列进行分析时,例如参数设置为score=50、wordlength=3。使用BLAST和GappedBLAST程序时,使用各程序的默认参数。
上述本发明的多核苷酸可以由公知的基因工程学的方法或公知的合成方法获得。
本发明的多核苷酸优选以***适当的表达载体的状态导入宿主。
适当的表达载体,通常由含有下述物质而构成。
(i)在宿主细胞内可以转录的启动子
(ii)与该启动子结合的本发明的多核苷酸;及
(iii)和RNA分子的转录终止及聚腺苷酸化相关,作为在宿主细胞内发挥作用的信号的构成要素而含有的表达盒
作为表达载体的制作方法,可列举利用质粒、噬菌体或粘粒的方法,并无特别限定。
载体的具体种类并特别限定,可以适当选择在宿主细胞中可以表达的载体。即,根据宿主细胞的种类,为了确切地使本发明的多核苷酸进行表达而选择适当的启动子序列,将此启动子和本发明的多核苷酸编入各种质粒等中的载体作为表达载体使用即可。
本发明的表达载体,依赖于需要导入的宿主的种类,含有表达控制区域(例如,启动子、终止子及/或复制起点等)。作为细菌用表达载体的启动子,使用惯用的启动子(例如,trc启动子、tac启动子、lac启动子等),作为酵母菌用启动子,例如可列举GAL1启动子、GAL10启动子、甘油醛-3-磷酸脱氢酶启动子、PH05启动子等,作为丝状真菌用启动子,例如可列举淀粉酶、trpC等。此外,作为使植物细胞内的目的基因表达的启动子的例子,可列举花椰菜花叶病毒的35S RNA启动子、rd29A基因启动子、rbcS启动子、将上述花椰菜花叶病毒的35S RNA启动子的增强子序列添加到来自农杆菌的甘露碱合成酶启动子序列的5’侧的mac-1启动子等。作为动物细胞宿主用启动子,可列举病毒性启动子(例如,SV40初期启动子、SV40后期启动子等)。
表达启动子优选含有至少一种的选择标记。作为上述标记,可以利用营养缺陷型标记(ura5、niaD、TRP1、URA3、HIS3、LEU2)、耐药性标记(潮霉素、博来霉素)、耐遗传霉素性基因(G418r)、耐铜性基因(CUP1)(Marin et al.,Proc.Natl.Acad.Sci.USA,vol.81,p.337,1984)、耐浅蓝霉素性基因(fas2m、PDR4)(分别为,猪腰淳嗣等,生物化学,vol.64,p.660,1992;Hussain et al.,Gene,vol.101,p.149,1991)等。
本发明的转化体的制作方法(生产方法)并无特别限定,例如可列举将含有本发明的多核苷酸的表达载体导入宿主的转化方法。
期待本发明的转化体能高效地生成甜菊醇糖苷。用于转化的宿主细胞并非特别限定,可以适当使用公知的各种细胞。例如,作为宿主细胞的例子,可列举大肠杆菌(Escherichia coli)等细菌,酵母菌(出芽酵母Saccharomyces cerevisiae、裂殖酵母Schizosaccharomyces pombe)、植物细胞、除人类以外的动物细胞等。宿主细胞可以是异种细胞(来自甜菊以外的细胞)、也可以是同种细胞(来自甜菊的细胞)。作为转化体使用同种细胞时,本发明的转化体在内在性表达的蛋白质之外,还表达外在导入的本发明的蛋白质,因此相比于野生型甜菊细胞更促进酶反应。
宿主细胞优选为能生成通式(I)所示的化合物的宿主细胞。在此,宿主细胞并不限定于在天然状态下可生成通式(I)所示的化合物的细胞,例如,也可以为经过由公知的基因的重组而变得可以生成通式(I)所示的化合物的细胞。
作为编码有助于通式(I)所示的化合物的合成的酶的基因,可列举EK13H、UGT74G1及UGT76G1(非专利文献2)等公知的基因,但并非仅限于此。
宿主细胞为不能生成通式(I)所示的化合物的细胞时,通过向该宿主细胞中导入本发明的基因而得到的转化体的培养系中,作为底物添加通式(I)的化合物或含有该化合物的植物萃取物,即使不导入编码有助于通式(I)所示的化合物的合成的酶的基因,也能制造甜菊醇糖苷。
进一步,使用导入了可编码与从甜菊醇至瑞鲍迪苷A的一系列的糖苷合成相关的糖苷化酶的基因的宿主细胞,通过在该宿主细胞内使本发明的多核苷酸表达,能够制作更高度的糖苷化的甜菊醇糖苷(例如,甜菊醇双糖苷、瑞鲍迪苷A、甜菊苷及瑞鲍迪苷B等)。作为与从甜菊醇至瑞鲍迪苷A的一系列的糖苷合成相关的糖苷化酶及其基因的例子,可列举UGT85C2(CDS序列:序列号7、氨基酸序列:序列号8)、UGT74G1(CDS序列:序列号9、氨基酸序列:序列号10)、UGT76G1(CDS序列:序列号11、氨基酸序列:序列号12)等。
用于上述的宿主细胞的适当的培养基及培养条件在该领域中众所周知。此外,作为转化体的对象的生物也非特别限定,可列举上述由宿主细胞而例示的各种微生物或植物或除人类以外的动物。
此外,关于一般分子生物学的方法,可参考"Sambrook&Russell,MolecularCloning:A Laboratory Manual Vol.3,Cold Spring Harbor Laboratory Press 2001"、"Methods in Yeast Genetics、A laboratory manual(Cold Spring Harbor LaboratoryPress、Cold Spring Harbor,NY)"等。
通过培养如此得到的转化体,可以使转化体生产甜菊醇糖苷。如上所述,通过在转化体的培养系中作为底物添加通式(I)的化合物或含有该化合物的植物萃取物,可以促进甜菊醇糖苷的制造。通过对累积的甜菊醇糖苷进行萃取、提纯,可以得到目的物的甜菊醇糖苷。
从而,本发明提供一种以使用本发明的转化体为特征的甜菊醇糖苷的第2制造方法。适当的培养基及培养条件在该领域众所周知。此外,关于甜菊醇糖苷的萃取、提纯如上所述。
甜菊醇糖苷并无特别限定,优选为选自甜菊双糖苷、甜菊苷、杜克苷A、Reb.E或Reb.C或者上述物质的组合中的物质。
在本发明的1种实施方式中,作为转化的宿主细胞可以使用任意的酵母菌。具体而言,可列举酵母菌(Saccharomyces)属等的酵母菌,但并不仅限于此。
作为酵母的转化方法,可利用通常所用的公知的方法。例如可以通过电穿孔法"Meth.Enzym.,194,p182(1990)"、原生质球法"Proc.Natl.Acad.Sci.USA,75p1929(1978)"、醋酸锂法"J.Bacteriology,153,p163(1983)"、Methods in yeast genetics,2000Edition:A Cold Spring Harbor Laboratory Course Manual等中记载的方法来实施,但并不限定于此。转化株,通过选择于具有与使用的选择标记相符的选择压的培养基(例如,含有抗生素的培养基或缺失营养素的培养基)上培育的株群而获得。
在本发明的1种实施方式中,转化体可以是植物转化体。本实施方式所涉及的植物转化体,通过将含有本发明所涉及的多核苷酸的重组载体导入植物中从而使由该多核苷酸而编码的多肽得到表达而获取。或者,因为本发明的基因会遗传给后代,从而通过将本发明的转化体作为杂交亲本使用,可以得到具有该基因的新型植物体。
使用重组表达载体时,植物体的转化所使用的重组表达载体,只要是该植物内可以使本发明涉及的多核苷酸表达的载体就无特别限定。作为上述载体,例如可列举具有使植物细胞内多核苷酸进行组成性表达的启动子的载体或具有由于外在刺激活化为诱导型的启动子的载体。
作为使多核苷酸在植物细胞内进行组成性表达的启动子的例子,可列举椰菜花叶病毒的35S RNA启动子、rd29A基因启动子、rbcS启动子、mac-1启动子等。
作为由于外在刺激活化为诱导型的启动子的例子,可列举小鼠乳腺瘤病毒(MMTV)启动子、四环霉素应答性启动子、金属硫蛋白启动子及热休克蛋白启动子等。
本发明中成为转化的对象的植物是指植物体全体、植物器官(例如叶、花瓣、茎、根、种子等)、植物组织(例如表皮、韧皮部、软组织、木质部、维管束、栅栏薄壁组织、海绵状组织等)或植物培养细胞、又或者各种形态的植物细胞(例如悬浊培养细胞)、原生质体、叶的切片、愈伤组织的任意一种。作为转化所使用的植物,并无特别限定,可以是属于单子叶植物纲或双子叶植物纲的植物的任意一种。
在对植物的基因导入中,使用本领域的技术人员所公知的转化方法(例如,农杆菌法、基因枪法、PEG法、电穿孔法、粒子枪等)。
导入了基因的细胞或植物组织,首先通过潮霉素抗性等耐药性的选择,然后依照常规再生为植物体。由转化细胞到植物体的再生可以根据植物细胞的种类通过本领域的技术人员所公知的方法实施。
对本发明的多核苷酸是否导入到植物中的确认,可以通过PCR法、Southern杂交法、Northern杂交法等来实施。
一旦获得本发明的多核苷酸编入基因组的转化植物体,就可以通过该植物体的有性繁殖或无性繁殖得到后代。此外,由该植物体或其后代,又或者其克隆,得到例如种子、果实、插枝、块茎、块根、植物株、愈伤组织、原生质体等,以这些为基础可以对该植物体进行量产。因此,本发明包含,将本发明所涉及的多核苷酸可表达性地导入的植物体,或和该植物体具有相同性质的该植物的后代,或来自这些的组织。
此外,各种各样针对植物的转化方法已经被报告。作为本发明涉及的转化体植物并没有限制,作为特别优选的例子,希望使用以甜菊醇作为糖苷配基的各种对糖苷进行生物合成而被熟知植物,作为这样的植物,可列举甜菊或甜叶悬钩子(Rubus suavissimus)等。
以本发明的多核苷酸进行转化的植物体(以下“本发明的植物”或“本发明的植物体”),在具有适当的底物时,或者由外部添加适当的底物时,相比其野生型可以大量生产甜菊醇糖苷。
本发明的植物可以通过培育本发明的植物的种子、插枝、球根等简单的获得完整的植物体。
因此,本发明的植物包含,植物体全体、植物器官(例如叶、花瓣、茎、根、种子、球根等)、植物组织(例如表皮、韧皮部、软组织、木质部、维管束、栅栏薄壁组织、海绵状组织等)或植物培养细胞、又或者各种形态的植物细胞(例如悬浊培养细胞)、原生质体、叶的切片、愈伤组织等。
4.转化体的萃取物及其利用
本发明在其他的实施方式中,提供上述转化体的萃取物。本发明的转化体在具有适当的底物时,或者由外部添加适当的底物时,相比其野生型甜菊醇糖苷的含量高,因此认为其萃取物中以高浓度含有甜菊醇糖苷。
本发明的转化体的萃取物,即使转化体为来自甜菊的细胞,相比野生型甜菊的萃取物,相对于甜菊醇糖苷全体中的糖苷配基的己糖的比例,特别是鼠李糖及/或葡萄糖的比例高。本发明的转化体中,被导入的本发明的蛋白质进行表达,向甜菊醇糖苷上添加己糖,因此在集中性的捕捉到甜菊醇糖苷全体时,相比于所涉及的蛋白质未表达的细胞(例如,野生型甜菊细胞),单位数量的甜菊醇糖苷配基上添加的己糖的残基数多。相对于甜菊醇糖苷全体中的糖苷配基的己糖的比例的变化,对萃取物的特性,例如甜味等感官性特性有影响。
本发明的转化体的萃取物,可以通过对转化体用玻璃珠、均化机或超声破碎仪等进行破碎,对该破碎物进行离心处理,回收其上清液而获得。进一步,根据上述甜菊醇糖苷的萃取方法,可以施加进一步的萃取工序。
本发明的转化体的萃取物可以依照常规用于,例如食品、医药品、工业原料的制造等的用途。
此外本发明在其他的实施方式中,提供含有本发明的转化体的萃取物的食品、医药、工业原料(食品等的原料)。含有本发明的转化体的萃取物的食品、医药、工业原料的制备依照常规。如此,含有本发明的转化体的萃取物的食品、医药、工业原料等含有利用本发明的转化体而生成的甜菊醇糖苷。上述食品、医药、工业原料也可以含有非天然成分。作为非天然成分,可列举天然条件下不存在的化合物,例如合成调味剂、合成防腐剂等合成添加物、发酵产物等。
作为本发明的食品的例子,可列举营养补充食品、健康食品、机能性食品、幼儿用食品、老人用食品等。本说明书中,食品为固体、流体及液体,以及他们的混合物,是可摄食物品的总成。
所谓营养补充食品,是指强化特定的营养成分的食品。所谓健康食品,是指健康的或者对健康有利的食品,包含营养补充食品、自然食品、减肥食品等。所谓机能性食品,是指为了补充起到对身体的调节机能的营养成分的食品,和特定保健用食品意思相同。所谓幼儿用食品,是指用于提供给约至6岁的儿童的食品。所谓老人用食品,是指相比于没有处理的食品,为了容易消化及吸收而处理过的食品。
本发明的食品,作为甜味剂使用低热量的甜菊醇糖苷。因此,本发明的食品为低热量的,具有有利于增进健康或维持健康的优点。
作为这些食品的形态的例子,可以是面包、面类、意大利面、米饭、糕点类(蛋糕、冰淇淋、棒冰、炸面包圈、烤制点心、糖果、口香糖、橡皮糖、片剂糖,以及丸子及馒头等日本糕点)、豆腐及其加工品等农产食品、清酒、药用酒、甜料酒、食醋、酱油、日本大酱等发酵食品、酸奶、火腿、培根、香肠等畜产食品、鱼糕、炸天妇罗、鱼肉山芋饼等水产食品、果汁饮料、清凉饮料、运动饮料、酒精饮料、茶等或者调味料。作为进一步的食品的形态的例子,可列举低热量饮料、无糖饮料、水果罐头、乳制饮料、粉末饮料、酸奶、果冻、调味汁、面蘸汁、腌菜、日本佃煮(Tsukudani)、酱油、日本大酱、腌制食品、Vermont醋、糖醋藠头、糖醋生姜、醋藕,此外,腌菜、天妇罗及蒲烧的酱汁、烤肉的酱汁、酱等,口香糖、糖及饴糖、牙膏、炸鱼饼、日式煎蛋卷、炒荞麦面酱、中华冷面汁、醋腌青花鱼、冰点心、雪葩、甜筒冰淇淋鱼肉加工食品、点心、脆米饼、玉米杯、调味海苔、油炸面团、鱼粉拌紫菜等。
本发明的食品包含任意的加工食品。在一种实施方式中,加工食品虽以天然物质为原料,但其特性(例如,弹性、粘性、硬度等物理特性、味道、气味、口感等感官特性)与天然物不同。现存的多数加工食品属于该种类。在其他的实施方式中,加工食品含有非天然成分。
此外,本发明的食品包含任意的饮料。在一种实施方式中,饮料虽以天然物质为原料,但其特性(例如,粘性、凝聚力等物理特性、味道、气味、口感等感官特性)与天然物不同。作为所涉及的饮料的例子,可列举发酵饮料(例如,乳酸饮料、清酒、红酒、啤酒、药用酒等酒精饮料、乌龙茶等半发酵茶、红茶等全发酵茶、普洱茶等后发酵茶)、思慕雪(Smoothie)、奶昔等。在其他的实施方式中,饮料含有非天然成分。
本发明的医药品(组合物)的剂型并无特别限定,可以为溶液状、膏状、凝胶状、固体状、粉末状等任意的剂型。此外,本发明的医药品(组合物)可以用于,油、化妆水、乳霜、乳液、凝胶、洗发水、护发素、润发精、指甲油、粉底、口红、粉、面膜、软膏、散粉、牙膏、喷雾式药剂、洗面奶等皮肤外用药、沐浴用剂、生发剂、皮肤美容液、防晒等。
本发明的医药组合物根据需要,可以进一步含有其他的医药活性成分(例如,消炎成分)或辅助成分(例如,润滑成分、载体成分)。医药活性成分或辅助成分,可以是天然成分也可以是非天然成分。
5.筛选具有鼠李糖基的甜菊醇糖苷高含量的植物的方法
本发明提供一种筛选具有鼠李糖基的甜菊醇糖苷高含量的植物的方法。具体而言,上述方法含有以下(1)~(3)的工序。
(1)从被检植物中提取mRNA的工序
(2)使上述mRNA或由上述mRNA制备的cDNA和由与本发明的多核苷酸互补的碱基序列所构成的多核苷酸和高严格条件下杂交的多核苷酸杂交的工序
(3)检测上述杂交的工序
上述工序(1)可以通过由从被检植物中提取mRNA来实施。对mRNA进行提取的被检植物的部位并无特别限定,优选花瓣。提取mNRA后,可以通过反转录由mRNA制备cDNA。
工序(2)可以通过对于上述工序中提取的mRNA,以由与本发明的多核苷酸互补的碱基序列所构成的多核苷酸或寡核苷酸作为探针或引物,在高严格条件下使其杂交而实施。高严格的条件如前所述。多核苷酸或寡核苷酸的长度优选为5~500bp,更优选为10~200bp,进一步优选为10~100bp。多核苷酸或寡核苷酸,可以使用各种自动合成装置(例如,AKTA oligopilot plus 10/100(GE Healthcare))而简单的合成,或者可以委托第三机构(例如,Promega公司或者Takara公式)等。
工序(2)中将由与本发明的多核苷酸互补的碱基序列所构成的多核苷酸作为探针使用时,工序(3)可以根据通常的Southern印迹杂交、Northern印迹杂交(Sambrook,Fritsch and Maniatis,”Molecular Cloning:A Laboratory Manual”2nd Edition(1989),Cold Spring Harbor Laboratory Press)、微阵列(参考Affymetrix公司;美国专利第6,045,996号、同第5,925,525号、及び同第5,858,659号)、TaqMan PCR(Sambrook,Fritsch and Maniatis,”Molecular Cloning:A Laboratory Manual”2nd Edition(1989),Cold Spring Harbor Laboratory Press)、Fluorescent In Situ Hybridization(FISH)(Sieben V.J.et al.,(2007-06).IET Nanobiotechnology 1(3):27-35)等杂交检测方法来实施。另一方面,工序(2)中将由与本发明的多核苷酸互补的碱基序列所构成的多核苷酸作为引物使用时,工序(3)可以通过实施PCR扩增反应,对得到的扩增产物通过电泳或测序(Sambrook,Fritsch and Maniatis,”Molecular Cloning:A Laboratory Manual”2nd Edition(1989),Cold Spring Harbor Laboratory Press)等进行分析,对杂交进行检测。
更加大量的检测出杂交的植物体可谓,相比于其他的植物体,更多的表达了具有向下述通式(I)所示的化合物的13位葡萄糖的2位上添加己糖,特别是鼠李糖的活性的蛋白质,因此预测具有鼠李糖基的甜菊醇糖苷的含量高。
6.制造改变了糖供体选择性的UGT的方法
在其他侧面,本发明提供一种制造改变了糖供体选择性的UGT的方法。在一种实施方式中,上述方法含有以下(1)~(2)的工序。
(1)UGT的氨基酸序列中,对与选自序列号2的氨基酸残基X2、序列号2的氨基酸残基X3、序列号4的第156位的氨基酸残基及/或序列号4的第233位的氨基酸残基的氨基酸残基对应的氨基酸残基进行确定的工序,及
(2)与序列号2的氨基酸残基X2或序列号4的第156位的氨基酸残基对应的氨基酸残基为Thr或Ser,优选为Thr时,将其取代为Val、Leu、Ile、Ala或Met,优选为Val,为Val、Leu、Ile、Ala或Met,优选为Val时,将其取代为Thr或Ser,优选为Thr,及/或与序列号2的氨基酸残基X3或序列号4的第233位的氨基酸残基对应的氨基酸残基为Ser或Thr,优选为Ser时,将其取代为Phe或Tyr,优选为Phe,为Phe或Tyr,优选为Phe时,将其取代为Ser或Thr,优选为Ser的工序。
在特定的实施方式中,本发明提供一种制造糖供体选择性由UDP-葡萄糖变为UDP-鼠李糖的UGT的方法。在一种实施方式中,上述方法含有以下(1)~(2)的工序。
(1)对具有与序列号2的氨基酸残基X2或序列号4的第156位的氨基酸残基对应的氨基酸残基为Thr或Ser,优选为Thr的,及/或与序列号2的氨基酸残基X3或序列号4的第233位的氨基酸残基对应的氨基酸残基为Ser或Thr,优选为Ser的氨基酸序列的UGT进行确定的工序,
(2)(1)中确定的UGT的氨基酸序列中,与序列号2的氨基酸残基X2或序列号4的第156位的氨基酸残基对应的氨基酸残基为Thr或Ser,优选为Thr时,将其取代为Val、Leu、Ile、Ala或Met,优选为Val,及/或与序列号2的氨基酸残基X3或序列号4的第233位的氨基酸残基对应的氨基酸残基为Ser或Thr,优选为Ser时,将其取代为Phe或Tyr,优选为Phe的工序。
在其他的实施方式中,上述方法含有以下(1)~(3)的工序。
(1)确定对于UDP-葡萄糖具有糖供体选择性的UGT的工序,
(2)(1)中确定的UGT的氨基酸序列中,对与选自序列号2的氨基酸残基X2、序列号2的氨基酸残基X3、序列号4的第156位的氨基酸残基及/或序列号4的第233位的氨基酸残基的氨基酸残基对应的氨基酸残基进行确定的工序,及
(3)与序列号2的氨基酸残基X2或序列号4的第156位的氨基酸残基对应的氨基酸残基为Thr或Ser,优选为Thr时,将其取代为Val、Leu、Ile、Ala或Met,优选为Val,及/或与序列号2的氨基酸残基X3或序列号4的第233位的氨基酸残基对应的氨基酸残基为Ser或Thr,优选为Ser时,将其取代为Phe或Tyr,优选为Phe的工序。
在其他特定的实施方式中,本发明提供一种制造糖供体选择性由UDP-鼠李糖变为UDP-葡萄糖的UGT的方法。在一种实施方式中,上述方法含有以下(1)~(2)的工序。
(1)对具有与序列号2的氨基酸残基X2或序列号4的第156位的氨基酸残基对应的氨基酸残基为Val、Leu、Ile、Ala或Met,优选为Val的,及/或与序列号2的氨基酸残基X3或序列号4的第233位的氨基酸残基对应的氨基酸残基为Phe或Tyr,优选为Phe的氨基酸序列的UGT进行确定的工序,
(2)(1)中确定的UGT的氨基酸序列中,与序列号2的氨基酸残基X2或序列号4的第156位的氨基酸残基对应的氨基酸残基为Val、Leu、Ile、Ala或Met,优选为Val时,将其取代为Thr或Ser,优选为Thr,及/或与序列号2的氨基酸残基X3或序列号4的第233位的氨基酸残基对应的氨基酸残基为Phe或Tyr,优选为Phe时,将其取代为Ser或Thr,优选为Ser的工序。
在其他实施方式,上述方法含有以下(1)~(3)的工序。
(1)确定对于UDP-鼠李糖具有糖供体选择性的UGT的工序,
(2)(1)中确定的UGT的氨基酸序列中,对与选自序列号2的氨基酸残基X2、序列号2的氨基酸残基X3、序列号4的第156位的氨基酸残基及/或序列号4的第233位的氨基酸残基的氨基酸残基相对应的氨基酸残基进行确定的工序,及(3)与序列号2的氨基酸残基X2或序列号4的第156位的氨基酸残基对应的氨基酸残基为Val、Leu、Ile、Ala或Met,优选为Val时,将其取代为Thr或Ser,优选为Thr,及/或与序列号2的氨基酸残基X3或序列号4的第233位的氨基酸残基对应的氨基酸残基为Phe或Tyr,优选为Phe时,将其取代为Ser或Thr,优选为Ser的工序。
在上述制造改变了糖供体选择性的UGT的各种方法中,作为对象的UGT的氨基酸序列中,与特定的氨基酸序列相对应的氨基酸序列的确定可通过任意的已知的方法,例如,作为对象的UGT的氨基酸序列和作为标准的氨基酸序列(序列号2或4)的比对,或以由序列号2或4的氨基酸序列构成的蛋白质为模板的同源建模等来实施。
作为对象的UGT中氨基酸的取代可通过例如,上述的部位定点突变法等来实施。此外在具有作为对象UGT的植物的基因组中,通过对编码糖供体选择性所涉及的上述氨基酸的多核苷酸进行基因组编辑等,可以改变为使所希望的氨基酸得到表达。
对于UDP-葡萄糖或UDP-鼠李糖具有糖供体选择性的UGT的确定,可以通过理论性或实验性的方法来实施。对上述UGT进行实验性确定时,可以对例如,使作为对象的UGT和UDP-葡萄糖或UDP-鼠李糖及糖受体底物(例如,通式(I)所示的化合物)在适宜糖苷化反应的条件下反应的结果与,除作为糖供体使用与上述反应中所使用的物质不同的化合物以外,在相同条件下进行反应的结果进行对比。使用了UDP-葡萄糖或UDP-鼠李糖的反应,相比于使用了除此之外的糖供体的反应效率好时,可以确定该UGT对于UDP-葡萄糖或UDP-鼠李糖具有糖供体选择性。
通过上述各方法,可以简单的设计或制造对于UDP-葡萄糖或UDP-鼠李糖具有糖供体选择性的UGT。此外,通过在基因组水平上对UGT的氨基酸残基进行取代,可以改变植物体内表达的UGT的糖供体选择性,从而可以控制植物体中累积的糖苷糖的种类。
7.推断UGT的糖供体选择性的方法
在其他的侧面,本发明提供一种推断UGT的糖供体选择性的方法。在一种实施方式中,上述方法含有以下(1)~(2)的工序。
(1)在UGT的氨基酸序列中,对与选自序列号2的氨基酸残基X2、序列号2的氨基酸残基X3、序列号4的第156位的氨基酸残基及/或序列号4的第233位的氨基酸残基的氨基酸残基对应的氨基酸残基进行确定的工序,及
(2)与序列号2的氨基酸残基X2或序列号4的第156位的氨基酸残基对应的氨基酸残基为Thr或Ser,优选为Thr时,及/或与序列号2的氨基酸残基X3或序列号4的第233位的氨基酸残基对应的氨基酸残基为Ser或Thr,优选为Ser时,推断上述UGT具有对UDP-葡萄糖的糖供体选择性,与序列号2的氨基酸残基X2或序列号4的第156位的氨基酸残基对应的氨基酸残基为Val、Leu、Ile、Ala或Met,优选为Val时,及/或与序列号2的氨基酸残基X3或序列号4的第233位的氨基酸残基对应的氨基酸残基为Phe或Tyr,优选为Phe时,推断上述UGT具有对UDP-鼠李糖的糖供体选择性的工序。
在上述方法的工序(1)中,作为对象的UGT的氨基酸序列中与特定的氨基酸残基相对应的氨基酸残基的确定,可以与制造改变了糖供体选择性的UGT的方法一样地实施。
根据本方法通过推断UGT的糖供体选择性,可以合理的实施与UGT的特征赋予相关的实验设计,削减不需要的实验。
8.推断在植物体中累积的与甜菊醇糖苷的13位葡萄糖的2位键合的糖的种类的方法。
在其他的侧面,本发明提供一种推断与植物体中累积的甜菊醇糖苷的13位葡萄糖的2位键合的糖的种类的方法。在一种实施方式中,上述方法含有以下(1)~(3)的工序。
(1)确定植物体所表达的UGT的氨基酸序列的工序,
(2)在(1)中确定的UGT的氨基酸序列中,对与选自序列号2的氨基酸残基X2、序列号2的氨基酸残基X3、序列号4的第156位的氨基酸残基及/或序列号4的第233位的氨基酸残基的氨基酸残基对应的氨基酸残基进行确定的工序,及
(3)与序列号2的氨基酸残基X2或序列号4的第156位的氨基酸残基对应的氨基酸残基为Thr或Ser,优选为Thr时,及/或与序列号2的氨基酸残基X3或序列号4的第233位的氨基酸残基对应的氨基酸残基为Ser或Thr,优选为Ser时,推断在与植物体中累积的甜菊醇糖苷的13位葡萄糖的2位键合的糖中葡萄糖所占比例高,与序列号2的氨基酸残基X2或序列号4的第156位的氨基酸残基对应的氨基酸残基为Val、Leu、Ile、Ala或Met,优选为Val时,及/或与序列号2的氨基酸残基X3或序列号4的第233位的氨基酸残基对应的氨基酸残基为Phe或Tyr,优选为Phe时,推断在与植物体中累积的甜菊醇糖苷的13位葡萄糖的2位键合的糖中鼠李糖所占比例高的工序。
上述方法的工序(1)中,植物体所表达的UGT的氨基酸序列的确定,可以通过理论性的或已知的任意的实验方法来实施。作为UGT的氨基酸序列的实验性的确定方法,例如可列举,从作为对象的植物体中提取mRNA,利用已知的UGT的碱基序列为基础制作的探针或引物取得具有类似的碱基序列的基因,并以此为基础对氨基酸序列进行确定的方法。
上述方法的工序(2)中,作为对象的UGT的氨基酸序列中,与特定的氨基酸残基相对应的氨基酸残基的确定,可以与制造改变了糖供体选择性的UGT的方法一样地实施。
在上述方法的工序(3)中,所谓于与植物体中累积的甜菊醇糖苷的13位葡萄糖的2位键合的糖葡萄糖中所占比例高是指,在上述植物体所表达的UGT的氨基酸序列中,与序列号2的氨基酸残基X2或序列号4的第156位的氨基酸残基对应的氨基酸残基为Thr或Ser,优选为Thr时,及/或与序列号2的氨基酸残基X3或序列号4的第233位的氨基酸残基对应的氨基酸残基为Ser或Thr,优选为Ser时,与并非这样的植物体,例如对具有与序列号2的氨基酸残基X2或序列号4的第156位的氨基酸残基对应的氨基酸残基为Val,且与序列号2的氨基酸残基X3或序列号4的第233位的氨基酸残基对应的氨基酸残基为Phe的氨基酸序列的UGT进行表达的植物体相比,在与植物体中累积的甜菊醇糖苷的13位葡萄糖的2位键合的糖中葡萄糖所占比例高。上述葡萄糖的比例,例如,与对具有与序列号2的氨基酸残基X2或序列号4的第156位的氨基酸残基对应的氨基酸残基为Val,且与序列号2的氨基酸残基X3或序列号4的第233位的氨基酸残基对应的氨基酸残基为Phe的氨基酸序列的UGT进行表达的植物体相比,可以高约10%以上、约20%以上、约30%以上、约40%以上、约50%以上、约60%以上、约70%以上、约80%以上、约90%以上、约100%以上。
在上述方法的工序(3)中,所谓在与植物体中累积的甜菊醇糖苷的13位葡萄糖的2位键合的糖鼠李糖中所占比例高是指,在上述植物体所表达的UGT的氨基酸序列中,与序列号2的氨基酸残基X2或序列号4的第156位的氨基酸残基对应的氨基酸残基为Val、Leu、Ile、Ale或Met,优选为Val时,及/或与序列号2的氨基酸残基X3或序列号4的第233位的氨基酸残基对应的氨基酸残基为Phe或Tyr,优选为Phe时,与并非这样的植物体,例如对具有与序列号2的氨基酸残基X2或序列号4的第156位的氨基酸残基对应的氨基酸残基为Thr,且与序列号2的氨基酸残基X3或序列号4的第233位的氨基酸残基对应的氨基酸残基为Ser的氨基酸序列的UGT进行表达的植物体相比,在与植物体中累积的甜菊醇糖苷的13位葡萄糖的2位键合的糖中鼠李糖所占比例高。上述鼠李糖的比例,例如,与对具有与序列号2的氨基酸残基X2或序列号4的第156位的氨基酸残基对应的氨基酸残基为Thr,且与序列号2的氨基酸残基X3或序列号4的第233位的氨基酸残基对应的氨基酸残基为Ser的氨基酸序列的UGT进行表达的植物体相比,可以高约10%以上、约20%以上、约30%以上、约40%以上、约50%以上、约60%以上、约70%以上、约80%以上、约90%以上、约100%以上。
根据本方法通过对植物体中累积的糖苷糖进行推断,可以合理的实施与糖苷糖的特征赋予相关的实验设计,消减不需要的实验,对具有所希望的糖苷糖轮廓的植物体的筛选进行有效的实施。
9.筛选作为甜菊醇糖苷累积含有葡萄糖或鼠李糖的糖苷的植物体的方法
在其他的侧面,本发明提供一种筛选作为甜菊醇糖苷累积在13位葡萄糖的2位上含有葡萄糖或鼠李糖的糖苷的植物体的方法。在一种实施方式中,上述方法含有以下(1)~(3)的工序。
(1)确定植物体所表达的UGT的氨基酸序列的工序,
(2)(1)中确定的UGT的氨基酸序列中,对与选自序列号2的氨基酸残基X2、序列号2的氨基酸残基X3、序列号4的第156位的氨基酸残基及/或序列号4的第233位的氨基酸残基的氨基酸残基对应的氨基酸残基进行确定的工序,及
(3)与序列号2的氨基酸残基X2或序列号4的第156位的氨基酸残基对应的氨基酸残基为Thr或Ser,优选为Thr时,及/或与序列号2的氨基酸残基X3或序列号4的第233位的氨基酸残基对应的氨基酸残基为Ser或Thr,优选为Ser时,判定植物体具有作为甜菊醇糖苷会累积在13位葡萄糖的2位上含有葡萄糖的糖苷的可能性,与序列号2的氨基酸残基X2或序列号4的第156位的氨基酸残基对应的氨基酸残基为Val、Leu、Ile、Ala或Met,优选为Val时,及/或与序列号2的氨基酸残基X3或序列号4的第233位的氨基酸残基相对应的氨基酸残基为Phe或Tyr,优选为Phe时,判定植物体具有作为甜菊醇糖苷会累积在13位葡萄糖的2位上含有鼠李糖的糖苷的可能性的工序。
上述方法的工序(1)及(2),可以和“推断在植物体中累积的与甜菊醇糖苷的13位葡萄糖的2位键合的糖的种类的方法”一样地实施。在同一植物体中调查的UGT可以是1个也可是复数个。当调查的UGT存在复数个时,有时对于某一UGT判定为植物体具有作为甜菊醇糖苷会累积在13位葡萄糖的2位上含有葡萄糖的糖苷的可能性,对于其他的UGT判定为植物体具有作为甜菊醇糖苷累积在13位葡萄糖的2位上含有鼠李糖的糖苷的可能性,这时可以判定为植物体作为甜菊醇糖苷累积在13位葡萄糖的2位上含有葡萄糖的糖苷及含有鼠李糖的糖苷的两者。
根据本方法不需要直接检测出植物体中含有的糖苷,就可以筛选出累积有所希望的糖苷的植物体,并可以使食品原料的选择效率化。
实施例
以下通过使用实施例对本发明进行更加具体的说明,但是本发明的范围并非由这些实施例而被限制。
[实施例1]甜菊醇糖苷己糖转移酶的候选基因的分离
本实施例中使用的分子生物学的方法,只要无其他详述,依照Molecular Cloning(Sambrook et al.,Cold Spring Harbor Laboratory Press,2001)中所记载的方法。
关于甜菊叶cDNA是通过用RNeasy Plant Mini试剂盒(QIAGEN)从甜菊叶中提取总RNA,将其中0.5μg通过Random Oligo-dT引物进行反转录(RT)反应而获得。
PCR反应液(50μl)由来自甜菊叶的cDNA 1μl、1×ExTaq buffer(TaKaRaBio)、0.2mM dNTPs、各引物0.4pmol/μl、ExTaq polymerase 2.5U所组成。作为引物使用了下述物质。
UGT91D2及UGT91D2#16基因扩增用引物集
SrUGT91D2-pET15b-FW
5’-TGCCGCGCGGCAGCCATATGTACAACGTTACTTATCATC-3’(序列号37)
SrUGT91D2-pET15b-RV
5’-GTTAGCAGCCGGATCCTTAACTCTCATGATCGATGGCAA-3’(序列号38)
PCR反应,于94℃下反应3分钟后,对94℃下1分钟、50℃下1分钟、72℃下2分钟的反应进行了总计30个循环的扩增。通过0.8%琼脂糖凝胶对PCR产物进行电泳、溴化乙锭染色,结果得到了由各自的模板DNA推断的约1.4kb大小的扩增带(图3)。
此PCR产物用制造商所推荐的方法亚克隆到了pENTR-TOPO Directional载体(Invitrogen)。利用DNA Sequencer model 3100(Applied Biosystems),通过依据合成寡核苷酸引物的引物步移法确定序列,结果明确了存在2种基因。
其中之一为已知的UGT91D2(CDS序列:序列号3、氨基酸序列:序列号4),另一个为与UGT91D2具有高相同性的新型甜菊UGT基因(CDS序列:序列号1、氨基酸序列:序列号2)。此相同基因(UGT91D2L#16),与UGT91D2在DNA水平上显示了99%(9碱基不同)、氨基酸水平上显示了98%(7残基不同)的序列一致性。
[实施例2]表达载体的构建
利用添加到引物的NdeI及BamHI的限制酶部位(序列号5及6的下划线部)将约1.4kb的UGT91D2及UGT91D2L#16的ORF片段切出,与作为大肠杆菌表达载体的pET15b(Novagen公司)的NdeI及BamHI位点连接,得到本酶基因的大肠杆菌表达载体。位于本载体NdeI位点上游的His标签和***的基因的开放阅读框相匹配,为了使融合了UGT和His标签的嵌合蛋白进行表达而设计。
[实施例3]重组蛋白质的表达及提纯
为了明确本酶的生物化学机能,使本酶在大肠杆菌中表达。利用上述得到的2种UGT91D2基因的大肠杆菌表达用质粒依照常规对大肠杆菌BL21(DE3)进行了转化。将得到的转化体,在含有50μg/ml的氨苄青霉素的LB培养基(10g/l tryptone pepton,5g/l yeastextract,1g/l NaCl)4ml中,于37℃下振动培养一晚。将达到静止期的培养液4ml接种于相同组成的培养基中,于37℃下振动培养。在菌体浓度(OD600)大约达到0.5的时间点添加最终浓度0.5mM的IPTG,于18℃下振动培养20小时。
以下所有操作于4℃下实施。通过将培养的转化体进行离心分离(5,000×g,10min)收集菌群,添加Buffer S[20mM HEPES缓冲液(pH 7.5)、20mM imidazol,14mMβ-巯基乙醇]1ml/g cell,并悬浊。接下来,实施超声波破碎(15sec×8回),并实施离心分离(15,000×g、15min)。将得到的上清液作为粗酶液进行了回收。将粗酶液负荷于用Buffer S进行了平衡化的His SpinTrap(GE Healthcare)中,并进行了离心(70×g、30sec)。用缓冲液洗净后,用含有100mM及500mM的imidazole的Buffer S各5ml,对与层析柱结合的蛋白质进行了阶段性的洗脱。利用Microcon YM-30(Amicon)对各洗脱部分向20mM HEPES缓冲液(pH7.5)、14mMβ-巯基乙醇中进行了缓冲液置换(透析倍数约500倍)。
制备的酶的SDS-PAGE分离后的CBB染色及利用了抗HisTag抗体的蛋白质印迹的结果,在200mM imidazole洗脱部分中,在HisTag融合UGT91D2及UGT91D2L#16的嵌合蛋白的推断分子量的约50kDa附近确定了蛋白质,因此将该部分用于酶分析(图4)。
[实施例4]UGT91D2及UGT91D2L#16的酶活性测定
标准的酶反应条件如以下所示。用蒸馏水制备50μl反应液(2mM UDP-葡萄糖、0.1mM糖受体底物、100mM磷酸钾缓冲液(pH 7.5)、提纯酶溶液25μl)、30℃、使其反应1小时。对酶反应液5μl在下述条件下进行了LC-MS分析。
LC条件
色谱柱:Imtakt SM-C18 3.0um 4.6mm I.D.×250mm
流动相:A:MilliQ Water(+0.2%acetic acid),B:Methanol
梯度:0-5min(B conc 10%恒定)、5-20min(B conc 10%→70%)、20-25min(Bconc 70%→100%)、25-35min(B conc 100%恒定)、35-36min(B conc 100%→10%)、45min分析结束
流速:0.4mL/min
色谱柱温箱:40℃
MS条件
ESI(负模式)
选择的离子监测:m/z 641.3、787.3、803.3、935.4、949.4、965.4、1111.4、1127.4、1259.5、1273.5、1289.5、1435.5
如现有文献(专利文献2)中所记载的,使重组SrUGT91D2蛋白质和UDP-葡萄糖一起与甜叶悬钩子苷进行反应时,13位的葡萄糖的2位葡糖基化生成了甜菊苷(图5-2)。在同样的条件下SrUGT91D2L#16也具有使甜叶悬钩子苷葡糖基化而生产甜菊苷的活性,但是相比于SrUGT91D2活性较弱(图5-3)。另一方面在负对照区,未在甜叶悬钩子苷中确认己糖转移反应(图5-1)。
接下来,使重组SrUGT91D2蛋白质和UDP-鼠李糖一起与甜叶悬钩子苷进行反应时,13位的葡萄糖的2位鼠李糖苷化生成了杜克苷A(图6-2)。在同样的条件下SrUGT91D2L#16具有使甜叶悬钩子苷鼠李糖苷化而生产杜克苷A的活性,但是相比于SrUGT91D2活性显著较高(图6-3)。另一方面在负对照区,未在甜叶悬钩子苷中确认己糖转移反应(图6-1)。基于上述结果将UGT91D2及UGT91D2L#16的对比活性总结至图7中。此外,将使用UGT91D2和UGT91D2L#16的甜菊醇糖苷的糖苷化路径总结至图8。
根据以上结果,明确了SrUGT91D2及SrUGT91D2L#16具有使甜叶悬钩子苷的13位的葡萄糖的2位鼠李糖苷化,生成杜克苷A的活性。特别与SrUGT91D2相比具有7残基的氨基酸不同的SrUGT91D2L#16具有显著的鼠李糖转移活性,认为是有助于在甜菊中杜克苷A及其衍生物即Reb.C的合成的物质。
[实施例5]通过利用酵母菌发酵生产合成Reb.C
在酵母菌中,由甜菊醇使其生成各种甜菊醇糖苷。首先,培育了来自甜菊的糖苷化酶基因UGT85C2(序列号7)、UGT91D2(序列号3)、UGT74G1(序列号9)、UGT76G1(序列号11)的4种或UGT85C2、UGT91D2L#16、UGT74G1、UGT76G1的4种和来自拟南芥的UDP-鼠李糖合成酶基因AtRHM2(序列号13)同时表达的酵母菌。
糖苷化酶基因及鼠李糖合成酶基因cDNA的克隆
来自甜菊的UGT91D2及UGT91D2L#16的cDNA的克隆如上所述的进行了实施。为了克隆其他来自甜菊的各UGT基因,制成了以下的引物集。
UGT85C2基因扩增用引物集
CACC-NdeI-SrUGT85C2-Fw(下划线部为NdeI识别部位):
5’-CACCCATATGGATGCAATGGCTACAACTGAGAA-3’(序列号14)
BglII-SrUGT85C2-Rv(下划线部为BglII识别部位):
5’-AGATCTCTAGTTTCTTGCTAGCACGGTGATTT-3’(序列号15)
UGT74G1基因扩增用引物集
CACC-NdeI-SrUGT74G1-Fw(下划线部为NdeI识别部位):
5’-CACCCATATGGCGGAACAACAAAAGATCAAGAAAT-3’(序列号16)
BamHI-SrUGT74G1-Rv(下划线部为BamHI识别部位):
5’-GGATCCTTAAGCCTTAATTAGCTCACTTACAAATT-3’(序列号17)
UGT76G1基因扩增用引物集
CACC-NdeI-SrUGT76G1-Fw(下划线部为NdeI识别部位):
5’-CACCCATATGGAAAATAAAACGGAGACCA-3’(序列号18)
BamHI-SrUGT76G1-Rv(下划线部为BamHI识别部位):
5’-GGATCCTTACAACGATGAAATGTAAGAAACTA-3’(序列号19)
PCR反应液(50μl)由来自甜菊叶的cDNA 1μl、1×KOD plus buffer(TOYOBO)、0.2mM dNTPs、各引物0.4pmol/μl、1mM MgSO4,1U耐热性KOD plus polymerase所组成。PCR反应,于95℃下反应5分钟后,对94℃下0.5分钟、50℃下0.5分钟、68℃下2分钟的反应进行了总计30个循环的扩增。通过0.8%琼脂糖凝胶对各PCR产物进行电泳、溴化乙锭染色,结果得到了由各自的模板DNA推断的约1.4kb大小的扩增带。
此PCR产物用制造商所推荐的方法亚克隆到了pENTR-TOPO Directional载体(Invitrogen)。利用DNA Sequencer model 3100(Applied Biosystems),通过依据合成寡核苷酸引物的引物步移法确定序列,确定了作为目标的UGT基因,即UGT85C2、UGT74G1、UGT76G1的全部UGT基因完成了克隆。
酵母菌用表达载体的构建
为了将上述UGT基因及UDP-鼠李糖合成酶基因,以及来自拟南芥的UDP-鼠李糖合成酶基因AtRHM2(J Biol Chem 2007Oka et.al)编入酵母菌表达载体而设计了下述引物集。
SrUGT85C2集
Bgl2-UGT85C2-F(下划线部为BglII识别部位):
5’-ACAGATCTATGGATGCAATGGCTACAACTGAGA-3’(序列号20)Sal-UGT85C2-R(下划线部为SalI识别部位):
5’-TAGTCGACTAGTTTCTTGCTAGCACGGTGATTTC-3’(序列号21)
SrUGT91D2集
NotI-UGT91DIL3-F(下划线部为NotI识别部位):
5’-AAGCGGCCGCATGTACAACGTTACTTATCATCAAAATTCAAA-3’(序列号22)
Pac-UGT91D1L3-R(下划线部为PacI识别部位):
5’-CGTTAATTAACTCTCATGATCGATGGCAACC-3’(序列号23)
SrUGT74G1集
Not-UGT74G1-F(下划线部为NotI识别部位):
5’-AAGCGGCCGCATGGCGGAACAACAAAAGATCAAG-3’(序列号24)
Pac-UGT74G1-R(下划线部为PacI识别部位):
5’-CGTTAATTAAGCCTTAATTAGCTCACTTACAAATTCG-3’(序列号25)
SrUGT76G1集
Bam-UGT76G1-F(下划线部为BamHI识别部位):
5’-AAGGATCCATGGAAAATAAAACGGAGACCACCG-3’(序列号26)
Sal-UGT76G1-R(下划线部为SalI识别部位):
5’-GCGTCGACTTACAACGATGAAATGTAAGAAACTAGAGACTCTAA-3’(序列号27)
AtRHM2集
Bam-AtRHM2-F(下划线部为BamHI识别部位):
5’-GGATCCATGGATGATACTACGTATAAGCCAAAG-3’(序列号28)
Xho-AtRHM2-R(下划线部为XhoI识别部位):
5’-CTCGAGTTAGGTTCTCTTGTTTGGTTCAAAGA-3’(序列号29)
通过将UGT85C2作为模板与SrUGT85C2集、将UGT91D2或UGT91D2L#16作为模板与SrUGT91D2集、将UGT74G1作为模板与SrUGT74G1集、将UGT76G1作为模板与SrUGT76G1集、将AtAHM2作为模板与AtAHM2集、组成模板与引物的组合,利用耐热性KOD DNA聚合酶(东洋纺),通过PCR扩增,在各自的ORF的两端附加了限制酶部位。利用Zero Blunt TOPO PCRCloning Kit(Invitrogen)对得到的DNA片段进行亚克隆,利用DNA Sequencer model 3100(Applied Biosystems),通过依据合成寡核苷酸引物的引物步移法确定序列,确认了作为目标的UGT基因分别被克隆。
利用pESC酵母菌表达***(Stratagene)为了使上述基因在酵母菌中表达,构建了以下表达载体。
(1)质粒pESC-URA-UGT56或pESC-URA-UGT56R的构建
以限制酶BglII和限制酶SalI将UGT85C2切出,与以限制酶BamHI和限制酶SalI将载体pESC-URA(Stratagene)切断的产物进行连接,得到质粒pESC-URA-UGT-1。将以限制酶NotI和限制酶PacI对UGT91D2或UGT91D2L#16进行切断的产物和以限制酶NotI和限制酶PacI将该质粒pESC-URA-UGT-1切断的产物连接,得到pESC-URA-UGT56或pESC-URA-UGT56R。
(2)质粒pESC-HIS-UGT78的构建
以限制酶BamHI和限制酶SalI将UGT76G1切出,与以相同限制酶将载体pESC-HIS(Stratagene)切断的产物进行连接,得到质粒pESC-HIS-UGT-8。将以限制酶NotI和限制酶PacI对UGT74G1进行切断的产物和以限制酶NotI和限制酶PacI将该质粒pESC-HIS-UGT-8切断的产物连接,得到pESC-HIS-UGT78。
(3)质粒pESC-TRP-AtRHM2的构建
以限制酶BamHI和限制酶XhoI将AtAHM2切出,与以相同限制酶将载体pESC-TRP(Stratagene)切断的产物进行连接,得到质粒pESC-TRP-AtAHM2。
酵母菌的转化
将Saccharomyces cerevisiae YPH499株(ura3-52lys2-801amberade2-101ochretrp1-Δ63his3-Δ200leu2-Δ1a)作为宿主,用醋酸锂法,导入了表1的质粒。作为转化株,选择了用SC-Trp&Ura&His琼脂培养基(每1L中,Yeast nitrogen base without aminoacids 6.7g、葡萄糖20g、氨基酸混合粉-Trp&Ura&His 1.3g、Bacto agar 20g)培育的酵母酵母菌。
[表1]
表l
另外氨基酸混合粉-Trp&Ura&His是将腺嘌呤硫酸盐2.5g、L-精氨酸盐酸盐1.2g、L-天冬氨酸6.0g、L-乙酰谷氨酸6.0g、L-亮氨酸3.6g、L-赖氨酸1.8g、L-蛋氨酸1.2g、L-苯丙氨酸3.0g、L-丝氨酸22.5g、L-苏氨酸12g、L-酪氨酸1.8g、L-缬氨酸9.0g混合调制而成。
导入基因的表达诱导与表达分析
将得到的转化株以下述方式培养。
首先,作为预培养在SC-Trp&Ura&His液体培养基(去除SC-Trp&Ura&His琼脂培养基Bacto agar)10ml中,分别接种各转化株,于30℃下震动培养1天。接下来,作为正式培养,将预培养液的1ml接种到10ml的SG-Trp&Ura&His液体培养基(每1L中,Yeast nitrogenbase without amino acids 6.7g、半乳糖20g、氨基酸混合粉-Trp&Ura&His 1.3g),于30℃下震动培养2天。
为了确认导入转化株的基因是否进行了表达,从培养液中收集菌体,用RNeasyMini Kit,提取总RNA。
取总RNA 1μg,以Superscript II逆转录酶(Thermo Fisher Scientific)、随机六聚体作为引物,合成了cDNA。
为了确认导入基因的表达,制作了以下引物。
UGT85C2表达确认用
UGT85C2-r1:
5’-CAAGTCCCCAACCAAATTCCGT-3’(序列号30)
UGT91D2及UGT91D2L3#16表达确认用
UGT91D1L3-r1:
5’-CACGAACCCGTCTGGCAACTC-3’(序列号31)
UGT74G1表达确认用
UGT74G1-r1:
5’-CCCGTGTGATTTCTTCCACTTGTTC-3’(序列号32)
UGT76G1表达确认用
UGT76G1-r1:
5’-CAAGAACCCATCTGGCAACGG-3’(序列号33)
AtAHM2表达确认用
AtAHM2-r1
5’-GCTTTGTCACCAGAATCACCATT-3’(序列号34)
GAL10p区域(启动子区域)
PGAL10-f3:
5’-GATTATTAAACTTCTTTGCGTCCATCCA-3’(序列号35)
GAL1p区域(启动子区域)
PGAL1-f3:
5’-CCTCTATACTTTAACGTCAAGGAGAAAAAACC-3’(序列号36)
各导入基因的表达通过以下引物的组合,将之前合成的cDNA作为模板,利用ExTaq(TAKARA BIO)实施PCR,通过对该产物进行琼脂糖凝胶电泳进行了确认。
UGT85C2:UGT85C2-r1(序列号30)与PGAL1-f3(序列号36)
UGT91D2或UGT91D2L3:UGT91D1L3-r1(序列号31)与PGAL10-f3(序列号35)
UGT74G1:UGT74G1-r1(序列号32)与PGAL1-f3(序列号36)
UGT76G1:UGT76G1-r1(序列号33)与PGAL10-f3(序列号35)
AtAHM2:AtAHM2-r1(序列号34)与PGAL10-f3(序列号35)
由此,确认了导入的基因在转化株中进行了表达。
Reb.C的生产
向在正式培养用的液体培养基中,添加每1ml培养基0.5μg或2μg的甜菊醇(ChromaDex Inc.)之外,在与上述实验里相同的条件下进行了培养。培养结束后,通过将培养液离心分离,分离成上清液和菌体。用乙腈对培养上清液进行洗涤后,提供给用水平衡后的Sep-Pak C18层析柱,用20%乙腈进行洗净后,用80%乙腈进行洗脱,干燥固化后,溶解至少量的80%乙腈中调制成糖苷样本。将该糖苷样本提供给以下的分析。
根据HPLC的分析
使用高效液相色谱法(High Performance Liquid Chromatography:HPLC),对得到的糖苷样品进行了分析。HPLC条件如下所示。
色谱柱:COSMOSIL 5C18-AR-II 4.6mm I.D.×250mm(NACALAI TESQUE)流动相:A:乙腈、B:10mM磷酸钠缓冲液(pH2.6)梯度:40min B conc70%→30%线性梯度
流速:1mL/分
温度:40℃
检测:UV 210nm
根据LC-MS的分析
根据LC-MS的分析在下述条件下进行了实施。
LC条件
色谱柱:Imtakt SM-C18 3.0um 4.6mm I.D.×250mm
流动相:A:MilliQ Water(+0.2%acetic acid),B:Methanol
梯度:0-5min(B conc 10%恒定)、5-20min(B conc 10%→70%)、20-25min(Bconc 70%→100%)、25-35min(B conc 100%恒定)、35-36min(B conc 100%→10%)、45min分析结束
流速:0.4mL/min
色谱柱温箱:40℃
MS条件
ESI(负模式)
选择的离子监测:m/z 641.3、787.3、803.3、935.4、949.4、965.4、1111.4、1127.4、1259.5、1273.5、1289.5、1435.5
结果如图9~11所示。使UDP-鼠李糖合成酶基因和甜菊醇糖苷化酶基因共表达的A-5678株及A-56R78株中生成了Reb.C。使UGT91D2L#16表达的A-56R78株相比于使UGT91D2表达的A-5678株的Reb.C的生成量较多。
[实施例6]SrUGT91D2L#16的分析
同源结构分析
对于UGT91D2L#16进行了对有助于显著的鼠李糖转移活性的氨基酸残基的推断。UGT91D2L#16与UGT91D2之间不同的7个残基中,为了推断哪个残基与活性相关联进行了同源结构分析。将已明确结晶结构的豆科苜蓿的UGT85H2的结构信息(RCSB Protein DataBank(PDB)、PDB ID:2PQ6)作为蛋白质结构的模板,以糖供体的UDP-葡萄糖(PDB ID:2C1Z)作为底物进行对接,用现有的方法(Noguchi et al(2009)Plant Cell.21(5):1556-152)制作了UGT91D2的同源模型。
在构建的UGT91D2同源模型中,在确认和UGT91D2#16不同的7个残基的位置时,第156位的Thr残基与UDP-葡萄糖接近,启示了对UDP-糖的选择性的贡献。此外,第233位的Ser残疾也与Thr残基接近,启示了对UDP-糖的选择性的贡献(图12~13)。
变异体的制作
制作了对由同源模型推断的氨基酸在UGT91D2及UGT91DL#16中进行了取代的变异体。变异体1及2用于基于大肠杆菌表达蛋白质的in vitro化验,变异体1~6提供给基于酵母菌的in vitro化验。
变异体1:UGT91D2-T156V(UGT91D2的第156位的Thr残基取代为Val残基)
变异体2:UGT91D2L#16-V156T(UGT91D2L#16的第156位的Val残基取代为Thr残基)
变异体3:UGT91D2-S233F(UGT91D2的第233位的Ser残基取代为Phe残基)
变异体4:UGT91D2L#16-F233S(UGT91D2L#16的第233位的Phe残基取代为Ser残基)
变异体5:UGT91D2-T156V/S233F(分别将UGT91D2的第156位的Thr残基取代为Val残基、第233位的Ser残基取代为Phe残基)
变异体6:UGT91D2L#16-V156T/F233(分别将UGT91D2L#16的第156位的Val残基取代为Thr残基、第233位的Phe残基取代为Ser残基)
如下所述对含有编码变异体的DNA的质粒进行了制备。以变异体1为例,将用下述SrUGT91D2-T156V-FW和SrUGT91D2-pET15b-RV的引物集(序列号39及序列号38)通过以UT91D2的cDNA为模板的PCR得到的DNA片段与,用SrUGT91D2-T156V-RV和SrUGT91D2-pET15b-FW的引物集(序列号40及序列号37)通过以UT91D2的cDNA为模板的PCR得到的DNA片段混合,用SrUGT91D2-pET15b-FW和SrUGT91D2-pET15b-RV的引物集(序列号37及序列号38)再次进行PCR,得到2个片段连接的扩增片段。通过用GeneArt Seamless Cloning andAssembly(Thermo Fisher Scientific公司)将该连接片段***NdeI和BamHI进行消化的大肠杆菌表达载体pET15b(Novagen)中,得到含有编码UGT91D2-T156V变异体的DNA的大肠杆菌表达质粒。关于编码UGT91D2-T156V变异体的DNA,使用DNA Sequencer model 3100(Applied Biosystems)通过依据合成寡核苷酸引物的引物步移法确定序列,确认了在目标变异以外不存在变异。含有编码其他的变异体的DNA的质粒也用同样的方法进行了制备。
SrUGT91D2-pET15b-FW:
5’-TGCCGCGCGGCAGCCATATGTACAACGTTACTTATCATC-3’(序列号37)
SrUGT91D2-pET15b-RV:
5’-GTTAGCAGCCGGATCCTTAACTCTCATGATCGATGGCAA-3’(序列号38)
SrUGT91D2-T156V-FW:
5’-CACTTCTCCGTCGTCACTCCATG-3’(序列号39)
SrUGT91D2-T156V-RV:
5’-CATGGAGTGACGACGGAGAAGTG-3’(序列号40)
SrUGT91D2-Like-V156T-FW
5’-CACTTCTCCGTCACCACTCCATG-3’(序列号41)
SrUGT91D2-Like-V156T-RV
5’-CATGGAGTGGTGACGGAGAAGTG-3’(序列号42)
SrUGT91D2-S233F-FW
5’-CTGATTGTTTGCTTTTCAAATGTTACCATGAG-3’(序列号43)
SrUGT91D2-S233F-RV
5’-CTCATGGTAACATTTGAAAAGCAAACAATCAG-3’(序列号44)
SrUGT91D2L-F233S-FW
5’-CTGATTGTTTGCTTTCCAAATGTTACCATGAG-3’(序列号45)
SrUGT91D2L-F233S-RV
5’-CTCATGGTAACATTTGGAAAGCAAACAATCAG-3’(序列号46)
基于大肠杆菌的评估
用与实施例3及4同样的方法在大肠杆菌中表达的6种的变异型蛋白质均在通过CBB染色及蛋白质印迹分析在推断的55kDa附近确认了条带。
接下来,对于变异体1及2与实施例4同样地使用大肠杆菌中表达的蛋白质进行了评估。作为糖受体的底物使用甜叶悬钩子苷,糖受体使用UDP-葡萄糖对葡糖基化活性(GlcT),使用UDP-鼠李糖对鼠李糖苷化活性(RhaT)分别进行了评估。在前者中作为反应生成物生成甜菊苷,在后者中作为反应生成物生成杜克苷A。
变异体1中,将野生型UGT91D2的GlcT活性作为100%的相对GlcT活性降低至5.5%(图14A),但是将野生型UGT91D2的RhaT活性作为100%的相对RhaT活性显示了约4.4倍的高活性(图14B)。另一方面,变异体2中,将野生型UGT91D2L#16的GlcT活性作为100%的相对GlcT活性显示了约3.7倍的高活性(图14C),但是将野生型UGT91D2L#16的RhaT活性作为100%的相对RhaT活性显示了35%的低活性(图14D)。由以上结果,UGT91D2的第156号的位置的氨基酸为Thr残基时,主要转为对UDP-葡萄糖的糖供体选择性,同位置为Val残基时主要转为对UDP-鼠李糖的糖供体选择性。
基于酵母菌的评估
接下来为了在酵母菌中确认变异体的特异性,对变异体1~6的酶活性与UGT91D2及UGT91D2L#16进行了比较,评估。另外,导入各转化酵母菌并表达的基因设置为各种UGT91的任意1个,UGT85C2、UGT74G1及AtAHM2的4个。
(1)质粒pESC-URA-UGT56M的构建
变异体的酵母菌表达用载体如下进行了构建。将上述制作的含有编码各种变异体的DNA的质粒作为模板,使用SrUGT91D2集的引物(序列号22、23)通过PCR进行了DNA扩增。与实施例5同样地,将用限制酶进行切断的DNA片段,编入质粒pESC-URA-UGT-1中,构建了可以使UGT85C2和各种的UGT91D2变异体进行共表达的pESC-URA-UGT56M1~pESC-URA-UGT56M6。
(2)质粒pESC-HIS-UGT7的构建
用限制酶NotI和PacI将UGT74G1切出,与用相同的限制酶对载体pESC-HIS进行切断的产物连接,得到质粒pESC-HIS-UGT7。
另外,作为UGT91D2、UGT91D2L#16和AtAHM2的载体,分别使用了实施例5中使用的pESC-URA-UGT56、pESC-URA-UGT56R和pESC-TRP-AtAHM2。
酵母菌的转化
将Saccharomyces cerevisiae YPH499株作为宿主,用醋酸锂法,将质粒pESC-TRP-AtAHM2与、pESC-HIS-UGT7与、pESC-URA-UGT56M1~pESC-URA-UGT56M6、pESC-URA-UGT56及pESC-URA-UGT56R中的任意1个组合导入,与实施例5同样地进行了选拔。如此,由于UGT91D2的不同,得到了8种类的转化体。与实施例5同样的确认了在得到的转化体中导入的基因有表达。各转化株的培养和培养上清液的甜菊醇糖苷的分析,除向每1ml培养基中添加了2μg的甜菊醇以外,与实施例5同样地进行了实施。
酵母的培养上清液中的甜菊醇糖苷的分析的结果,在使基于UGT91D2的变异体(变异体1、3、5)表达的酵母菌中,GlcT活性生成物即甜菊苷的生成量有降低的趋势。例如,在使变异体5表达的酵母菌中,将使野生型的UGT91D表达的酵母菌中的甜菊苷的生成量作为100%时,有低至37.5%的降低,该活性和UGT91D2L#16的野生型等同(图15A)。另一方面,基于UGT91D2L#16的变异体(变异体2、4、6)的GlcT活性,皆比野生型UGT91D2L#16高,变异体6的活性升高至野生型UGT91D2L#16的约2.7倍,与野生型UGT91D2等同(图15A)。
关于RhaT活性生成物即杜克苷的生成量,相比使野生型的UGT91D2表达的酵母菌的杜克苷A的生成量,在使变异体1、3及5表达的酵母菌中确认了约1.5倍以上的增加(图15B)。另一方面,关于基于UGT91D2L#16的变异体的Rhat活性,任意一个变异体中皆确认了与野生型UGT91D2L#16相比30%以上的降低。
此外关于杜克苷A以外的2种甜菊醇鼠李糖苷(甜菊醇13位-Glc-Rha(α1,2)、19位-Glc-Rha(α1,2)及甜菊醇13位-Glc-Rha(α1,2)、19位-H)也显示了与杜克苷A同样的生成物举动(图15C~D)。
由上述结果,和大肠杆菌重组蛋白质的结果相同,确认了通过酵母菌的De novo表达,UGT91D2的第156位的残基为Val时,甜菊醇糖苷的糖转为鼠李糖,为Thr时转为葡萄糖。进一步表示了对于第233位的残基,为Phe时转为鼠李糖、为Ser时转为葡萄糖。
产业上的可利用性
根据本发明,利用SrUGT91D2L#16基因可以使甜菊醇的13位葡萄糖的2位鼠李糖苷化,可以控制甜菊醇糖苷的甜度及味道。将这些基因作为标记可以选拔Reb.C的含量不同的植物体。此外,本发明提供,不仅在植物中,在微生物中用于生产以Reb.C为代表的含有鼠李糖的甜菊醇糖苷的分子工具。
序列表文本
序列号2中,所谓氨基酸残基X1表示第42位的氨基酸残基Phe,所谓氨基酸残基X2表示第156位的氨基酸残基Val,所谓氨基酸残基X3表示第233位的氨基酸残基Phe,所谓氨基酸残基X4表示第298位的氨基酸残基Ala,所谓氨基酸残基X5表示第394位的氨基酸残基Leu,所谓氨基酸残基X6表示第439位的氨基酸残基Asn,所谓氨基酸残基X7表示第471位的氨基酸残基Phe。
SEQUENCE LISTING
<110> SUNTORY HOLDINGS LIMITED
<120> 甜菊(Stevia rebaudiana)醇糖苷己糖转移酶及编码该物质的基因
<130> G1647WO
<150> JP 2016-252643
<151> 2016-12-27
<160> 46
<170> PatentIn version 3.5
<210> 1
<211> 1458
<212> DNA
<213> 甜菊(Stevia rebaudiana)
<220>
<221> CDS
<222> (1)..(1458)
<400> 1
atg tac aac gtt act tat cat caa aat tca aaa gca atg gct acc agt 48
Met Tyr Asn Val Thr Tyr His Gln Asn Ser Lys Ala Met Ala Thr Ser
1 5 10 15
gac tcc ata gtt gac gac cgt aag cag ctt cat gtt gcg acg ttc cca 96
Asp Ser Ile Val Asp Asp Arg Lys Gln Leu His Val Ala Thr Phe Pro
20 25 30
tgg ctt gct ttc ggt cac atc ctc cct ttc ctt cag ctt tcg aaa ttg 144
Trp Leu Ala Phe Gly His Ile Leu Pro Phe Leu Gln Leu Ser Lys Leu
35 40 45
ata gct gaa aag ggt cac aaa gtc tcg ttt ctt tct acc acc aga aac 192
Ile Ala Glu Lys Gly His Lys Val Ser Phe Leu Ser Thr Thr Arg Asn
50 55 60
att caa cgt ctc tct tct cat atc tcg cca ctc ata aat gtt gtt caa 240
Ile Gln Arg Leu Ser Ser His Ile Ser Pro Leu Ile Asn Val Val Gln
65 70 75 80
ctc aca ctt cca cgt gtc caa gag ctg ccg gag gat gca gag gcg acc 288
Leu Thr Leu Pro Arg Val Gln Glu Leu Pro Glu Asp Ala Glu Ala Thr
85 90 95
act gac gtc cac cct gaa gat att cca tat ctc aag aag gct tct gat 336
Thr Asp Val His Pro Glu Asp Ile Pro Tyr Leu Lys Lys Ala Ser Asp
100 105 110
ggt ctt caa ccg gag gtc acc cgg ttt cta gaa caa cac tct ccg gac 384
Gly Leu Gln Pro Glu Val Thr Arg Phe Leu Glu Gln His Ser Pro Asp
115 120 125
tgg att att tat gat tat act cac tac tgg ttg cca tcc atc gcg gct 432
Trp Ile Ile Tyr Asp Tyr Thr His Tyr Trp Leu Pro Ser Ile Ala Ala
130 135 140
agc ctc ggt atc tca cga gcc cac ttc tcc gtc gtc act cca tgg gcc 480
Ser Leu Gly Ile Ser Arg Ala His Phe Ser Val Val Thr Pro Trp Ala
145 150 155 160
att gct tat atg gga ccc tca gct gac gcc atg ata aat ggt tca gat 528
Ile Ala Tyr Met Gly Pro Ser Ala Asp Ala Met Ile Asn Gly Ser Asp
165 170 175
ggt cga acc acg gtt gag gat ctc acg aca ccg ccc aag tgg ttt ccc 576
Gly Arg Thr Thr Val Glu Asp Leu Thr Thr Pro Pro Lys Trp Phe Pro
180 185 190
ttt ccg acc aaa gta tgc tgg cgg aag cat gat ctt gcc cga ctg gtg 624
Phe Pro Thr Lys Val Cys Trp Arg Lys His Asp Leu Ala Arg Leu Val
195 200 205
cct tac aaa gct ccg ggg ata tct gat gga tac cgt atg ggg ctg gtt 672
Pro Tyr Lys Ala Pro Gly Ile Ser Asp Gly Tyr Arg Met Gly Leu Val
210 215 220
ctt aag gga tct gat tgt ttg ctt ttc aaa tgt tac cat gag ttt gga 720
Leu Lys Gly Ser Asp Cys Leu Leu Phe Lys Cys Tyr His Glu Phe Gly
225 230 235 240
act caa tgg cta cct ctt ttg gag aca cta cac caa gta ccg gtg gtt 768
Thr Gln Trp Leu Pro Leu Leu Glu Thr Leu His Gln Val Pro Val Val
245 250 255
ccg gtg gga tta ctg cca ccg gaa ata ccc gga gac gag aaa gat gaa 816
Pro Val Gly Leu Leu Pro Pro Glu Ile Pro Gly Asp Glu Lys Asp Glu
260 265 270
aca tgg gtg tca atc aag aaa tgg ctc gat ggt aaa caa aaa ggc agt 864
Thr Trp Val Ser Ile Lys Lys Trp Leu Asp Gly Lys Gln Lys Gly Ser
275 280 285
gtg gtg tac gtt gca tta gga agc gag gct ttg gtg agc caa acc gag 912
Val Val Tyr Val Ala Leu Gly Ser Glu Ala Leu Val Ser Gln Thr Glu
290 295 300
gtt gtt gag tta gca ttg ggt ctc gag ctt tct ggg ttg cca ttt gtt 960
Val Val Glu Leu Ala Leu Gly Leu Glu Leu Ser Gly Leu Pro Phe Val
305 310 315 320
tgg gct tat aga aaa cca aaa ggt ccc gcg aag tca gac tcg gtg gag 1008
Trp Ala Tyr Arg Lys Pro Lys Gly Pro Ala Lys Ser Asp Ser Val Glu
325 330 335
ttg cca gac ggg ttc gtg gaa cga act cgt gac cgt ggg ttg gtc tgg 1056
Leu Pro Asp Gly Phe Val Glu Arg Thr Arg Asp Arg Gly Leu Val Trp
340 345 350
acg agt tgg gca cct cag tta cga ata ctg agc cat gag tcg gtt tgt 1104
Thr Ser Trp Ala Pro Gln Leu Arg Ile Leu Ser His Glu Ser Val Cys
355 360 365
ggt ttc ttg act cat tgt ggt tct gga tca att gtg gaa ggg cta atg 1152
Gly Phe Leu Thr His Cys Gly Ser Gly Ser Ile Val Glu Gly Leu Met
370 375 380
ttt ggt cac cct cta atc atg cta ccg ctt ttt ggg gac caa cct ctg 1200
Phe Gly His Pro Leu Ile Met Leu Pro Leu Phe Gly Asp Gln Pro Leu
385 390 395 400
aat gct cga tta ctg gag gac aaa cag gtg gga atc gag ata cca aga 1248
Asn Ala Arg Leu Leu Glu Asp Lys Gln Val Gly Ile Glu Ile Pro Arg
405 410 415
aat gag gaa gat ggt tgc ttg acc aag gag tcg gtt gct aga tca ctg 1296
Asn Glu Glu Asp Gly Cys Leu Thr Lys Glu Ser Val Ala Arg Ser Leu
420 425 430
agg tcc gtt gtt gtg gaa aac gaa ggg gag atc tac aag gcg aac gcg 1344
Arg Ser Val Val Val Glu Asn Glu Gly Glu Ile Tyr Lys Ala Asn Ala
435 440 445
agg gag ctg agt aaa atc tat aac gac act aag gtg gaa aaa gaa tat 1392
Arg Glu Leu Ser Lys Ile Tyr Asn Asp Thr Lys Val Glu Lys Glu Tyr
450 455 460
gta agc caa ttc gta gac ttt ttg gaa aag aat gcg cgt gcg gtt gcc 1440
Val Ser Gln Phe Val Asp Phe Leu Glu Lys Asn Ala Arg Ala Val Ala
465 470 475 480
atc gat cat gag agt taa 1458
Ile Asp His Glu Ser
485
<210> 2
<211> 485
<212> PRT
<213> 甜菊(Stevia rebaudiana)
<400> 2
Met Tyr Asn Val Thr Tyr His Gln Asn Ser Lys Ala Met Ala Thr Ser
1 5 10 15
Asp Ser Ile Val Asp Asp Arg Lys Gln Leu His Val Ala Thr Phe Pro
20 25 30
Trp Leu Ala Phe Gly His Ile Leu Pro Phe Leu Gln Leu Ser Lys Leu
35 40 45
Ile Ala Glu Lys Gly His Lys Val Ser Phe Leu Ser Thr Thr Arg Asn
50 55 60
Ile Gln Arg Leu Ser Ser His Ile Ser Pro Leu Ile Asn Val Val Gln
65 70 75 80
Leu Thr Leu Pro Arg Val Gln Glu Leu Pro Glu Asp Ala Glu Ala Thr
85 90 95
Thr Asp Val His Pro Glu Asp Ile Pro Tyr Leu Lys Lys Ala Ser Asp
100 105 110
Gly Leu Gln Pro Glu Val Thr Arg Phe Leu Glu Gln His Ser Pro Asp
115 120 125
Trp Ile Ile Tyr Asp Tyr Thr His Tyr Trp Leu Pro Ser Ile Ala Ala
130 135 140
Ser Leu Gly Ile Ser Arg Ala His Phe Ser Val Val Thr Pro Trp Ala
145 150 155 160
Ile Ala Tyr Met Gly Pro Ser Ala Asp Ala Met Ile Asn Gly Ser Asp
165 170 175
Gly Arg Thr Thr Val Glu Asp Leu Thr Thr Pro Pro Lys Trp Phe Pro
180 185 190
Phe Pro Thr Lys Val Cys Trp Arg Lys His Asp Leu Ala Arg Leu Val
195 200 205
Pro Tyr Lys Ala Pro Gly Ile Ser Asp Gly Tyr Arg Met Gly Leu Val
210 215 220
Leu Lys Gly Ser Asp Cys Leu Leu Phe Lys Cys Tyr His Glu Phe Gly
225 230 235 240
Thr Gln Trp Leu Pro Leu Leu Glu Thr Leu His Gln Val Pro Val Val
245 250 255
Pro Val Gly Leu Leu Pro Pro Glu Ile Pro Gly Asp Glu Lys Asp Glu
260 265 270
Thr Trp Val Ser Ile Lys Lys Trp Leu Asp Gly Lys Gln Lys Gly Ser
275 280 285
Val Val Tyr Val Ala Leu Gly Ser Glu Ala Leu Val Ser Gln Thr Glu
290 295 300
Val Val Glu Leu Ala Leu Gly Leu Glu Leu Ser Gly Leu Pro Phe Val
305 310 315 320
Trp Ala Tyr Arg Lys Pro Lys Gly Pro Ala Lys Ser Asp Ser Val Glu
325 330 335
Leu Pro Asp Gly Phe Val Glu Arg Thr Arg Asp Arg Gly Leu Val Trp
340 345 350
Thr Ser Trp Ala Pro Gln Leu Arg Ile Leu Ser His Glu Ser Val Cys
355 360 365
Gly Phe Leu Thr His Cys Gly Ser Gly Ser Ile Val Glu Gly Leu Met
370 375 380
Phe Gly His Pro Leu Ile Met Leu Pro Leu Phe Gly Asp Gln Pro Leu
385 390 395 400
Asn Ala Arg Leu Leu Glu Asp Lys Gln Val Gly Ile Glu Ile Pro Arg
405 410 415
Asn Glu Glu Asp Gly Cys Leu Thr Lys Glu Ser Val Ala Arg Ser Leu
420 425 430
Arg Ser Val Val Val Glu Asn Glu Gly Glu Ile Tyr Lys Ala Asn Ala
435 440 445
Arg Glu Leu Ser Lys Ile Tyr Asn Asp Thr Lys Val Glu Lys Glu Tyr
450 455 460
Val Ser Gln Phe Val Asp Phe Leu Glu Lys Asn Ala Arg Ala Val Ala
465 470 475 480
Ile Asp His Glu Ser
485
<210> 3
<211> 1458
<212> DNA
<213> 甜菊(Stevia rebaudiana)
<220>
<221> CDS
<222> (1)..(1458)
<400> 3
atg tac aac gtt act tat cat caa aat tca aaa gca atg gct acc agt 48
Met Tyr Asn Val Thr Tyr His Gln Asn Ser Lys Ala Met Ala Thr Ser
1 5 10 15
gac tcc ata gtt gac gac cgt aag cag ctt cat gtt gcg acg ttc cca 96
Asp Ser Ile Val Asp Asp Arg Lys Gln Leu His Val Ala Thr Phe Pro
20 25 30
tgg ctt gct ttc ggt cac atc ctc cct tac ctt cag ctt tcg aaa ttg 144
Trp Leu Ala Phe Gly His Ile Leu Pro Tyr Leu Gln Leu Ser Lys Leu
35 40 45
ata gct gaa aag ggt cac aaa gtc tcg ttt ctt tct acc acc aga aac 192
Ile Ala Glu Lys Gly His Lys Val Ser Phe Leu Ser Thr Thr Arg Asn
50 55 60
att caa cgt ctc tct tct cat atc tcg cca ctc ata aat gtt gtt caa 240
Ile Gln Arg Leu Ser Ser His Ile Ser Pro Leu Ile Asn Val Val Gln
65 70 75 80
ctc aca ctt cca cgt gtc caa gag ctg ccg gag gat gca gag gcg acc 288
Leu Thr Leu Pro Arg Val Gln Glu Leu Pro Glu Asp Ala Glu Ala Thr
85 90 95
act gac gtc cac cct gaa gat att cca tat ctc aag aag gct tct gat 336
Thr Asp Val His Pro Glu Asp Ile Pro Tyr Leu Lys Lys Ala Ser Asp
100 105 110
ggt ctt caa ccg gag gtc acc cgg ttt cta gaa caa cac tct ccg gac 384
Gly Leu Gln Pro Glu Val Thr Arg Phe Leu Glu Gln His Ser Pro Asp
115 120 125
tgg att att tat gat tat act cac tac tgg ttg cca tcc atc gcg gct 432
Trp Ile Ile Tyr Asp Tyr Thr His Tyr Trp Leu Pro Ser Ile Ala Ala
130 135 140
agc ctc ggt atc tca cga gcc cac ttc tcc gtc acc act cca tgg gcc 480
Ser Leu Gly Ile Ser Arg Ala His Phe Ser Val Thr Thr Pro Trp Ala
145 150 155 160
att gct tat atg gga ccc tca gct gac gcc atg ata aat ggt tca gat 528
Ile Ala Tyr Met Gly Pro Ser Ala Asp Ala Met Ile Asn Gly Ser Asp
165 170 175
ggt cga acc acg gtt gag gat ctc acg aca ccg ccc aag tgg ttt ccc 576
Gly Arg Thr Thr Val Glu Asp Leu Thr Thr Pro Pro Lys Trp Phe Pro
180 185 190
ttt ccg acc aaa gta tgc tgg cgg aag cat gat ctt gcc cga ctg gtg 624
Phe Pro Thr Lys Val Cys Trp Arg Lys His Asp Leu Ala Arg Leu Val
195 200 205
cct tac aaa gct ccg ggg ata tct gat gga tac cgt atg ggg ctg gtt 672
Pro Tyr Lys Ala Pro Gly Ile Ser Asp Gly Tyr Arg Met Gly Leu Val
210 215 220
ctt aag gga tct gat tgt ttg ctt tcc aaa tgt tac cat gag ttt gga 720
Leu Lys Gly Ser Asp Cys Leu Leu Ser Lys Cys Tyr His Glu Phe Gly
225 230 235 240
act caa tgg cta cct ctt ttg gag aca cta cac caa gta ccg gtg gtt 768
Thr Gln Trp Leu Pro Leu Leu Glu Thr Leu His Gln Val Pro Val Val
245 250 255
ccg gtg gga tta ctg cca ccg gaa ata ccc gga gac gag aaa gat gaa 816
Pro Val Gly Leu Leu Pro Pro Glu Ile Pro Gly Asp Glu Lys Asp Glu
260 265 270
aca tgg gtg tca atc aag aaa tgg ctc gat ggt aaa caa aaa ggc agt 864
Thr Trp Val Ser Ile Lys Lys Trp Leu Asp Gly Lys Gln Lys Gly Ser
275 280 285
gtg gtg tac gtt gca tta gga agc gag gtt ttg gtg agc caa acc gag 912
Val Val Tyr Val Ala Leu Gly Ser Glu Val Leu Val Ser Gln Thr Glu
290 295 300
gtt gtt gag tta gca ttg ggt ctc gag ctt tct ggg ttg cca ttt gtt 960
Val Val Glu Leu Ala Leu Gly Leu Glu Leu Ser Gly Leu Pro Phe Val
305 310 315 320
tgg gct tat aga aaa cca aaa ggt ccc gcg aag tca gac tcg gtg gag 1008
Trp Ala Tyr Arg Lys Pro Lys Gly Pro Ala Lys Ser Asp Ser Val Glu
325 330 335
ttg cca gac ggg ttc gtg gaa cga act cgt gac cgt ggg ttg gtc tgg 1056
Leu Pro Asp Gly Phe Val Glu Arg Thr Arg Asp Arg Gly Leu Val Trp
340 345 350
acg agt tgg gca cct cag tta cga ata ctg agc cat gag tcg gtt tgt 1104
Thr Ser Trp Ala Pro Gln Leu Arg Ile Leu Ser His Glu Ser Val Cys
355 360 365
ggt ttc ttg act cat tgt ggt tct gga tca att gtg gaa ggg cta atg 1152
Gly Phe Leu Thr His Cys Gly Ser Gly Ser Ile Val Glu Gly Leu Met
370 375 380
ttt ggt cac cct cta atc atg cta ccg att ttt ggg gac caa cct ctg 1200
Phe Gly His Pro Leu Ile Met Leu Pro Ile Phe Gly Asp Gln Pro Leu
385 390 395 400
aat gct cga tta ctg gag gac aaa cag gtg gga atc gag ata cca aga 1248
Asn Ala Arg Leu Leu Glu Asp Lys Gln Val Gly Ile Glu Ile Pro Arg
405 410 415
aat gag gaa gat ggt tgc ttg acc aag gag tcg gtt gct aga tca ctg 1296
Asn Glu Glu Asp Gly Cys Leu Thr Lys Glu Ser Val Ala Arg Ser Leu
420 425 430
agg tcc gtt gtt gtg gaa aaa gaa ggg gag atc tac aag gcg aac gcg 1344
Arg Ser Val Val Val Glu Lys Glu Gly Glu Ile Tyr Lys Ala Asn Ala
435 440 445
agg gag ctg agt aaa atc tat aac gac act aag gtt gaa aaa gaa tat 1392
Arg Glu Leu Ser Lys Ile Tyr Asn Asp Thr Lys Val Glu Lys Glu Tyr
450 455 460
gta agc caa ttc gta gac tat ttg gaa aag aat gcg cgt gcg gtt gcc 1440
Val Ser Gln Phe Val Asp Tyr Leu Glu Lys Asn Ala Arg Ala Val Ala
465 470 475 480
atc gat cat gag agt taa 1458
Ile Asp His Glu Ser
485
<210> 4
<211> 485
<212> PRT
<213> 甜菊(Stevia rebaudiana)
<400> 4
Met Tyr Asn Val Thr Tyr His Gln Asn Ser Lys Ala Met Ala Thr Ser
1 5 10 15
Asp Ser Ile Val Asp Asp Arg Lys Gln Leu His Val Ala Thr Phe Pro
20 25 30
Trp Leu Ala Phe Gly His Ile Leu Pro Tyr Leu Gln Leu Ser Lys Leu
35 40 45
Ile Ala Glu Lys Gly His Lys Val Ser Phe Leu Ser Thr Thr Arg Asn
50 55 60
Ile Gln Arg Leu Ser Ser His Ile Ser Pro Leu Ile Asn Val Val Gln
65 70 75 80
Leu Thr Leu Pro Arg Val Gln Glu Leu Pro Glu Asp Ala Glu Ala Thr
85 90 95
Thr Asp Val His Pro Glu Asp Ile Pro Tyr Leu Lys Lys Ala Ser Asp
100 105 110
Gly Leu Gln Pro Glu Val Thr Arg Phe Leu Glu Gln His Ser Pro Asp
115 120 125
Trp Ile Ile Tyr Asp Tyr Thr His Tyr Trp Leu Pro Ser Ile Ala Ala
130 135 140
Ser Leu Gly Ile Ser Arg Ala His Phe Ser Val Thr Thr Pro Trp Ala
145 150 155 160
Ile Ala Tyr Met Gly Pro Ser Ala Asp Ala Met Ile Asn Gly Ser Asp
165 170 175
Gly Arg Thr Thr Val Glu Asp Leu Thr Thr Pro Pro Lys Trp Phe Pro
180 185 190
Phe Pro Thr Lys Val Cys Trp Arg Lys His Asp Leu Ala Arg Leu Val
195 200 205
Pro Tyr Lys Ala Pro Gly Ile Ser Asp Gly Tyr Arg Met Gly Leu Val
210 215 220
Leu Lys Gly Ser Asp Cys Leu Leu Ser Lys Cys Tyr His Glu Phe Gly
225 230 235 240
Thr Gln Trp Leu Pro Leu Leu Glu Thr Leu His Gln Val Pro Val Val
245 250 255
Pro Val Gly Leu Leu Pro Pro Glu Ile Pro Gly Asp Glu Lys Asp Glu
260 265 270
Thr Trp Val Ser Ile Lys Lys Trp Leu Asp Gly Lys Gln Lys Gly Ser
275 280 285
Val Val Tyr Val Ala Leu Gly Ser Glu Val Leu Val Ser Gln Thr Glu
290 295 300
Val Val Glu Leu Ala Leu Gly Leu Glu Leu Ser Gly Leu Pro Phe Val
305 310 315 320
Trp Ala Tyr Arg Lys Pro Lys Gly Pro Ala Lys Ser Asp Ser Val Glu
325 330 335
Leu Pro Asp Gly Phe Val Glu Arg Thr Arg Asp Arg Gly Leu Val Trp
340 345 350
Thr Ser Trp Ala Pro Gln Leu Arg Ile Leu Ser His Glu Ser Val Cys
355 360 365
Gly Phe Leu Thr His Cys Gly Ser Gly Ser Ile Val Glu Gly Leu Met
370 375 380
Phe Gly His Pro Leu Ile Met Leu Pro Ile Phe Gly Asp Gln Pro Leu
385 390 395 400
Asn Ala Arg Leu Leu Glu Asp Lys Gln Val Gly Ile Glu Ile Pro Arg
405 410 415
Asn Glu Glu Asp Gly Cys Leu Thr Lys Glu Ser Val Ala Arg Ser Leu
420 425 430
Arg Ser Val Val Val Glu Lys Glu Gly Glu Ile Tyr Lys Ala Asn Ala
435 440 445
Arg Glu Leu Ser Lys Ile Tyr Asn Asp Thr Lys Val Glu Lys Glu Tyr
450 455 460
Val Ser Gln Phe Val Asp Tyr Leu Glu Lys Asn Ala Arg Ala Val Ala
465 470 475 480
Ile Asp His Glu Ser
485
<210> 5
<211> 39
<212> DNA
<213> 人造的(Artificial)
<220>
<223> 人造核酸(Artificial Nucleic Acid)
<400> 5
tgccgcgcgg cagccatatg tacaacgtta cttatcatc 39
<210> 6
<211> 39
<212> DNA
<213> 人造的(Artificial)
<220>
<223> 人造核酸(Artificial Nucleic Acid)
<400> 6
gttagcagcc ggatccttaa ctctcatgat cgatggcaa 39
<210> 7
<211> 1446
<212> DNA
<213> 甜菊(Stevia rebaudiana)
<220>
<221> CDS
<222> (1)..(1446)
<400> 7
atg gat gca atg gct aca act gag aag aaa cca cac gtc atc ttc ata 48
Met Asp Ala Met Ala Thr Thr Glu Lys Lys Pro His Val Ile Phe Ile
1 5 10 15
cca ttt cca gca caa agc cac att aaa gcc atg ctc aaa cta gca caa 96
Pro Phe Pro Ala Gln Ser His Ile Lys Ala Met Leu Lys Leu Ala Gln
20 25 30
ctt ctc cac cac aaa gga ctc cag ata acc ttc gtc aac acc gac ttc 144
Leu Leu His His Lys Gly Leu Gln Ile Thr Phe Val Asn Thr Asp Phe
35 40 45
atc cac aac cag ttt ctt gaa tca tcg ggc cca cat tgt ttg gac ggt 192
Ile His Asn Gln Phe Leu Glu Ser Ser Gly Pro His Cys Leu Asp Gly
50 55 60
tca ccg ggt ttc cgg ttc gaa acc atc ccg gat ggt gtt tct cac agt 240
Ser Pro Gly Phe Arg Phe Glu Thr Ile Pro Asp Gly Val Ser His Ser
65 70 75 80
ccg gaa gcg agc atc cca atc aga gaa tca ctc ttg aga tcc att gaa 288
Pro Glu Ala Ser Ile Pro Ile Arg Glu Ser Leu Leu Arg Ser Ile Glu
85 90 95
acc aac ttc ttg gat cgt ttc att gat ctt gta acc aaa ctt ccg gat 336
Thr Asn Phe Leu Asp Arg Phe Ile Asp Leu Val Thr Lys Leu Pro Asp
100 105 110
cct ccg act tgt att atc tca gat ggg ttc ttg tcg gtt ttc aca att 384
Pro Pro Thr Cys Ile Ile Ser Asp Gly Phe Leu Ser Val Phe Thr Ile
115 120 125
gac gct gca aaa aag ctt gga att ccg gtc atg atg tat tgg aca ctt 432
Asp Ala Ala Lys Lys Leu Gly Ile Pro Val Met Met Tyr Trp Thr Leu
130 135 140
gct gcc tgt ggg ttc atg ggt ttt tac cat att cat tct ctc att gag 480
Ala Ala Cys Gly Phe Met Gly Phe Tyr His Ile His Ser Leu Ile Glu
145 150 155 160
aaa gga ttt gca cca ctt aaa gat gca agt tac ttg aca aat ggg tat 528
Lys Gly Phe Ala Pro Leu Lys Asp Ala Ser Tyr Leu Thr Asn Gly Tyr
165 170 175
ttg gac acc gtc att gat tgg gtt ccg gga atg gaa ggc atc cgt ctc 576
Leu Asp Thr Val Ile Asp Trp Val Pro Gly Met Glu Gly Ile Arg Leu
180 185 190
aag gat ttc ccg ctg gac tgg agc act gac ctc aat gac aaa gtt ttg 624
Lys Asp Phe Pro Leu Asp Trp Ser Thr Asp Leu Asn Asp Lys Val Leu
195 200 205
atg ttc act aca gaa gct cct caa agg tca cac aag gtt tca cat cat 672
Met Phe Thr Thr Glu Ala Pro Gln Arg Ser His Lys Val Ser His His
210 215 220
att ttc cac acg ttc gat gag ttg gag cct agt att ata aaa act ttg 720
Ile Phe His Thr Phe Asp Glu Leu Glu Pro Ser Ile Ile Lys Thr Leu
225 230 235 240
tca ttg agg tat aat cac att tac acc atc ggc cca ctg caa tta ctt 768
Ser Leu Arg Tyr Asn His Ile Tyr Thr Ile Gly Pro Leu Gln Leu Leu
245 250 255
ctt gat caa ata ccc gaa gag aaa aag caa act gga att acg agt ctc 816
Leu Asp Gln Ile Pro Glu Glu Lys Lys Gln Thr Gly Ile Thr Ser Leu
260 265 270
cat gga tac agt tta gta aaa gaa gaa cca gag tgt ttc cag tgg ctt 864
His Gly Tyr Ser Leu Val Lys Glu Glu Pro Glu Cys Phe Gln Trp Leu
275 280 285
cag tct aaa gaa cca aat tcc gtc gtt tat gta aat ttt gga agt act 912
Gln Ser Lys Glu Pro Asn Ser Val Val Tyr Val Asn Phe Gly Ser Thr
290 295 300
aca gta atg tct tta gaa gac atg acg gaa ttt ggt tgg gga ctt gct 960
Thr Val Met Ser Leu Glu Asp Met Thr Glu Phe Gly Trp Gly Leu Ala
305 310 315 320
aat agc aac cat tat ttc ctt tgg atc atc cga tca aac ttg gtg ata 1008
Asn Ser Asn His Tyr Phe Leu Trp Ile Ile Arg Ser Asn Leu Val Ile
325 330 335
ggg gaa aat gca gtt ttg ccc cct gaa ctt gag gaa cat ata aag aaa 1056
Gly Glu Asn Ala Val Leu Pro Pro Glu Leu Glu Glu His Ile Lys Lys
340 345 350
aga ggc ttt att gct agc tgg tgt tca caa gaa aag gtc ttg aag cac 1104
Arg Gly Phe Ile Ala Ser Trp Cys Ser Gln Glu Lys Val Leu Lys His
355 360 365
cct tcg gtt gga ggg ttc ttg act cat tgt ggg tgg gga tcg acc atc 1152
Pro Ser Val Gly Gly Phe Leu Thr His Cys Gly Trp Gly Ser Thr Ile
370 375 380
gag agc ttg tct gct ggg gtg cca atg ata tgc tgg cct tat tcg tgg 1200
Glu Ser Leu Ser Ala Gly Val Pro Met Ile Cys Trp Pro Tyr Ser Trp
385 390 395 400
gac cag ctg acc aac tgt agg tat ata tgc aaa gaa tgg gag gtt ggg 1248
Asp Gln Leu Thr Asn Cys Arg Tyr Ile Cys Lys Glu Trp Glu Val Gly
405 410 415
ctc gag atg gga acc aaa gtg aaa cga gat gaa gtc aag agg ctt gta 1296
Leu Glu Met Gly Thr Lys Val Lys Arg Asp Glu Val Lys Arg Leu Val
420 425 430
caa gag ttg atg gga gaa gga ggt cac aaa atg agg aac aag gct aaa 1344
Gln Glu Leu Met Gly Glu Gly Gly His Lys Met Arg Asn Lys Ala Lys
435 440 445
gat tgg aaa gaa aag gct cgc att gca ata gct cct aac ggt tca tct 1392
Asp Trp Lys Glu Lys Ala Arg Ile Ala Ile Ala Pro Asn Gly Ser Ser
450 455 460
tct ttg aac ata gac aaa atg gtc aag gaa atc acc gtg cta gca aga 1440
Ser Leu Asn Ile Asp Lys Met Val Lys Glu Ile Thr Val Leu Ala Arg
465 470 475 480
aac tag 1446
Asn
<210> 8
<211> 481
<212> PRT
<213> 甜菊(Stevia rebaudiana)
<400> 8
Met Asp Ala Met Ala Thr Thr Glu Lys Lys Pro His Val Ile Phe Ile
1 5 10 15
Pro Phe Pro Ala Gln Ser His Ile Lys Ala Met Leu Lys Leu Ala Gln
20 25 30
Leu Leu His His Lys Gly Leu Gln Ile Thr Phe Val Asn Thr Asp Phe
35 40 45
Ile His Asn Gln Phe Leu Glu Ser Ser Gly Pro His Cys Leu Asp Gly
50 55 60
Ser Pro Gly Phe Arg Phe Glu Thr Ile Pro Asp Gly Val Ser His Ser
65 70 75 80
Pro Glu Ala Ser Ile Pro Ile Arg Glu Ser Leu Leu Arg Ser Ile Glu
85 90 95
Thr Asn Phe Leu Asp Arg Phe Ile Asp Leu Val Thr Lys Leu Pro Asp
100 105 110
Pro Pro Thr Cys Ile Ile Ser Asp Gly Phe Leu Ser Val Phe Thr Ile
115 120 125
Asp Ala Ala Lys Lys Leu Gly Ile Pro Val Met Met Tyr Trp Thr Leu
130 135 140
Ala Ala Cys Gly Phe Met Gly Phe Tyr His Ile His Ser Leu Ile Glu
145 150 155 160
Lys Gly Phe Ala Pro Leu Lys Asp Ala Ser Tyr Leu Thr Asn Gly Tyr
165 170 175
Leu Asp Thr Val Ile Asp Trp Val Pro Gly Met Glu Gly Ile Arg Leu
180 185 190
Lys Asp Phe Pro Leu Asp Trp Ser Thr Asp Leu Asn Asp Lys Val Leu
195 200 205
Met Phe Thr Thr Glu Ala Pro Gln Arg Ser His Lys Val Ser His His
210 215 220
Ile Phe His Thr Phe Asp Glu Leu Glu Pro Ser Ile Ile Lys Thr Leu
225 230 235 240
Ser Leu Arg Tyr Asn His Ile Tyr Thr Ile Gly Pro Leu Gln Leu Leu
245 250 255
Leu Asp Gln Ile Pro Glu Glu Lys Lys Gln Thr Gly Ile Thr Ser Leu
260 265 270
His Gly Tyr Ser Leu Val Lys Glu Glu Pro Glu Cys Phe Gln Trp Leu
275 280 285
Gln Ser Lys Glu Pro Asn Ser Val Val Tyr Val Asn Phe Gly Ser Thr
290 295 300
Thr Val Met Ser Leu Glu Asp Met Thr Glu Phe Gly Trp Gly Leu Ala
305 310 315 320
Asn Ser Asn His Tyr Phe Leu Trp Ile Ile Arg Ser Asn Leu Val Ile
325 330 335
Gly Glu Asn Ala Val Leu Pro Pro Glu Leu Glu Glu His Ile Lys Lys
340 345 350
Arg Gly Phe Ile Ala Ser Trp Cys Ser Gln Glu Lys Val Leu Lys His
355 360 365
Pro Ser Val Gly Gly Phe Leu Thr His Cys Gly Trp Gly Ser Thr Ile
370 375 380
Glu Ser Leu Ser Ala Gly Val Pro Met Ile Cys Trp Pro Tyr Ser Trp
385 390 395 400
Asp Gln Leu Thr Asn Cys Arg Tyr Ile Cys Lys Glu Trp Glu Val Gly
405 410 415
Leu Glu Met Gly Thr Lys Val Lys Arg Asp Glu Val Lys Arg Leu Val
420 425 430
Gln Glu Leu Met Gly Glu Gly Gly His Lys Met Arg Asn Lys Ala Lys
435 440 445
Asp Trp Lys Glu Lys Ala Arg Ile Ala Ile Ala Pro Asn Gly Ser Ser
450 455 460
Ser Leu Asn Ile Asp Lys Met Val Lys Glu Ile Thr Val Leu Ala Arg
465 470 475 480
Asn
<210> 9
<211> 1383
<212> DNA
<213> 甜菊(Stevia rebaudiana)
<220>
<221> CDS
<222> (1)..(1383)
<400> 9
atg gcg gaa caa caa aag atc aag aaa tca cca cac gtt cta ctc atc 48
Met Ala Glu Gln Gln Lys Ile Lys Lys Ser Pro His Val Leu Leu Ile
1 5 10 15
cca ttc cct tta caa ggc cat ata aac cct ttc atc cag ttt ggc aaa 96
Pro Phe Pro Leu Gln Gly His Ile Asn Pro Phe Ile Gln Phe Gly Lys
20 25 30
cga tta atc tcc aaa ggt gtc aaa aca aca ctt gtt acc acc atc cac 144
Arg Leu Ile Ser Lys Gly Val Lys Thr Thr Leu Val Thr Thr Ile His
35 40 45
acc tta aac tca acc cta aac cac agt aac acc acc acc acc tcc atc 192
Thr Leu Asn Ser Thr Leu Asn His Ser Asn Thr Thr Thr Thr Ser Ile
50 55 60
gaa atc caa gca att tcc gat ggt tgt gat gaa ggc ggt ttt atg agt 240
Glu Ile Gln Ala Ile Ser Asp Gly Cys Asp Glu Gly Gly Phe Met Ser
65 70 75 80
gca gga gaa tca tat ttg gaa aca ttc aaa caa gtt ggg tct aaa tca 288
Ala Gly Glu Ser Tyr Leu Glu Thr Phe Lys Gln Val Gly Ser Lys Ser
85 90 95
cta gct gac tta atc aag aag ctt caa agt gaa gga acc aca att gat 336
Leu Ala Asp Leu Ile Lys Lys Leu Gln Ser Glu Gly Thr Thr Ile Asp
100 105 110
gca atc att tat gat tct atg act gaa tgg gtt tta gat gtt gca att 384
Ala Ile Ile Tyr Asp Ser Met Thr Glu Trp Val Leu Asp Val Ala Ile
115 120 125
gag ttt gga atc gat ggt ggt tcg ttt ttc act caa gct tgt gtt gta 432
Glu Phe Gly Ile Asp Gly Gly Ser Phe Phe Thr Gln Ala Cys Val Val
130 135 140
aac agc tta tat tat cat gtt cat aag ggt ttg att tct ttg cca ttg 480
Asn Ser Leu Tyr Tyr His Val His Lys Gly Leu Ile Ser Leu Pro Leu
145 150 155 160
ggt gaa act gtt tcg gtt cct gga ttt cca gag ctt caa cgg tgg gag 528
Gly Glu Thr Val Ser Val Pro Gly Phe Pro Glu Leu Gln Arg Trp Glu
165 170 175
aca ccg tta att ttg cag aat cat gag caa ata cag agc cct tgg tct 576
Thr Pro Leu Ile Leu Gln Asn His Glu Gln Ile Gln Ser Pro Trp Ser
180 185 190
cag atg ttg ttt ggt cag ttt gct aat att gat caa gca cgt tgg gtc 624
Gln Met Leu Phe Gly Gln Phe Ala Asn Ile Asp Gln Ala Arg Trp Val
195 200 205
ttc aca aat agt ttt tac aag ctc gag gaa gag gta ata gag tgg acg 672
Phe Thr Asn Ser Phe Tyr Lys Leu Glu Glu Glu Val Ile Glu Trp Thr
210 215 220
aga aag ata tgg aac ttg aag gta atc ggg cca aca ctt cca tcc atg 720
Arg Lys Ile Trp Asn Leu Lys Val Ile Gly Pro Thr Leu Pro Ser Met
225 230 235 240
tac ctt gac aaa cga ctt gat gat gat aaa gat aac gga ttt aat ctc 768
Tyr Leu Asp Lys Arg Leu Asp Asp Asp Lys Asp Asn Gly Phe Asn Leu
245 250 255
tac aaa gca aac cat cat gag tgc atg aac tgg tta gac gat aag cca 816
Tyr Lys Ala Asn His His Glu Cys Met Asn Trp Leu Asp Asp Lys Pro
260 265 270
aag gaa tca gtt gtt tac gta gca ttt ggt agc ctg gtg aaa cat gga 864
Lys Glu Ser Val Val Tyr Val Ala Phe Gly Ser Leu Val Lys His Gly
275 280 285
ccc gaa caa gtg gaa gaa atc aca cgg gct tta ata gat agt gat gtc 912
Pro Glu Gln Val Glu Glu Ile Thr Arg Ala Leu Ile Asp Ser Asp Val
290 295 300
aac ttc ttg tgg gtt atc aaa cat aaa gaa gag gga aag ctc cca gaa 960
Asn Phe Leu Trp Val Ile Lys His Lys Glu Glu Gly Lys Leu Pro Glu
305 310 315 320
aat ctt tcg gaa gta ata aaa acc gga aag ggt ttg att gta gca tgg 1008
Asn Leu Ser Glu Val Ile Lys Thr Gly Lys Gly Leu Ile Val Ala Trp
325 330 335
tgc aaa caa ttg gat gtg tta gca cac gaa tca gta gga tgc ttt gtt 1056
Cys Lys Gln Leu Asp Val Leu Ala His Glu Ser Val Gly Cys Phe Val
340 345 350
aca cat tgt ggg ttc aac tca act ctt gaa gca ata agt ctt gga gtc 1104
Thr His Cys Gly Phe Asn Ser Thr Leu Glu Ala Ile Ser Leu Gly Val
355 360 365
ccc gtt gtt gca atg cct caa ttt tcg gat caa act aca aat gcc aag 1152
Pro Val Val Ala Met Pro Gln Phe Ser Asp Gln Thr Thr Asn Ala Lys
370 375 380
ctt cta gat gaa att ttg ggt gtt gga gtt aga gtt aag gct gat gag 1200
Leu Leu Asp Glu Ile Leu Gly Val Gly Val Arg Val Lys Ala Asp Glu
385 390 395 400
aat ggg ata gtg aga aga gga aat ctt gcg tca tgt att aag atg att 1248
Asn Gly Ile Val Arg Arg Gly Asn Leu Ala Ser Cys Ile Lys Met Ile
405 410 415
atg gag gag gaa aga gga gta ata atc cga aag aat gcg gta aaa tgg 1296
Met Glu Glu Glu Arg Gly Val Ile Ile Arg Lys Asn Ala Val Lys Trp
420 425 430
aag gat ttg gct aaa gta gcc gtt cat gaa ggt ggt agc tca gac aat 1344
Lys Asp Leu Ala Lys Val Ala Val His Glu Gly Gly Ser Ser Asp Asn
435 440 445
gat att gtc gaa ttt gta agt gag cta att aag gct taa 1383
Asp Ile Val Glu Phe Val Ser Glu Leu Ile Lys Ala
450 455 460
<210> 10
<211> 460
<212> PRT
<213> 甜菊(Stevia rebaudiana)
<400> 10
Met Ala Glu Gln Gln Lys Ile Lys Lys Ser Pro His Val Leu Leu Ile
1 5 10 15
Pro Phe Pro Leu Gln Gly His Ile Asn Pro Phe Ile Gln Phe Gly Lys
20 25 30
Arg Leu Ile Ser Lys Gly Val Lys Thr Thr Leu Val Thr Thr Ile His
35 40 45
Thr Leu Asn Ser Thr Leu Asn His Ser Asn Thr Thr Thr Thr Ser Ile
50 55 60
Glu Ile Gln Ala Ile Ser Asp Gly Cys Asp Glu Gly Gly Phe Met Ser
65 70 75 80
Ala Gly Glu Ser Tyr Leu Glu Thr Phe Lys Gln Val Gly Ser Lys Ser
85 90 95
Leu Ala Asp Leu Ile Lys Lys Leu Gln Ser Glu Gly Thr Thr Ile Asp
100 105 110
Ala Ile Ile Tyr Asp Ser Met Thr Glu Trp Val Leu Asp Val Ala Ile
115 120 125
Glu Phe Gly Ile Asp Gly Gly Ser Phe Phe Thr Gln Ala Cys Val Val
130 135 140
Asn Ser Leu Tyr Tyr His Val His Lys Gly Leu Ile Ser Leu Pro Leu
145 150 155 160
Gly Glu Thr Val Ser Val Pro Gly Phe Pro Glu Leu Gln Arg Trp Glu
165 170 175
Thr Pro Leu Ile Leu Gln Asn His Glu Gln Ile Gln Ser Pro Trp Ser
180 185 190
Gln Met Leu Phe Gly Gln Phe Ala Asn Ile Asp Gln Ala Arg Trp Val
195 200 205
Phe Thr Asn Ser Phe Tyr Lys Leu Glu Glu Glu Val Ile Glu Trp Thr
210 215 220
Arg Lys Ile Trp Asn Leu Lys Val Ile Gly Pro Thr Leu Pro Ser Met
225 230 235 240
Tyr Leu Asp Lys Arg Leu Asp Asp Asp Lys Asp Asn Gly Phe Asn Leu
245 250 255
Tyr Lys Ala Asn His His Glu Cys Met Asn Trp Leu Asp Asp Lys Pro
260 265 270
Lys Glu Ser Val Val Tyr Val Ala Phe Gly Ser Leu Val Lys His Gly
275 280 285
Pro Glu Gln Val Glu Glu Ile Thr Arg Ala Leu Ile Asp Ser Asp Val
290 295 300
Asn Phe Leu Trp Val Ile Lys His Lys Glu Glu Gly Lys Leu Pro Glu
305 310 315 320
Asn Leu Ser Glu Val Ile Lys Thr Gly Lys Gly Leu Ile Val Ala Trp
325 330 335
Cys Lys Gln Leu Asp Val Leu Ala His Glu Ser Val Gly Cys Phe Val
340 345 350
Thr His Cys Gly Phe Asn Ser Thr Leu Glu Ala Ile Ser Leu Gly Val
355 360 365
Pro Val Val Ala Met Pro Gln Phe Ser Asp Gln Thr Thr Asn Ala Lys
370 375 380
Leu Leu Asp Glu Ile Leu Gly Val Gly Val Arg Val Lys Ala Asp Glu
385 390 395 400
Asn Gly Ile Val Arg Arg Gly Asn Leu Ala Ser Cys Ile Lys Met Ile
405 410 415
Met Glu Glu Glu Arg Gly Val Ile Ile Arg Lys Asn Ala Val Lys Trp
420 425 430
Lys Asp Leu Ala Lys Val Ala Val His Glu Gly Gly Ser Ser Asp Asn
435 440 445
Asp Ile Val Glu Phe Val Ser Glu Leu Ile Lys Ala
450 455 460
<210> 11
<211> 1377
<212> DNA
<213> 甜菊(Stevia rebaudiana)
<220>
<221> CDS
<222> (1)..(1377)
<400> 11
atg gaa aat aaa acg gag acc acc gtt cgc cgg cgc cgg aga ata ata 48
Met Glu Asn Lys Thr Glu Thr Thr Val Arg Arg Arg Arg Arg Ile Ile
1 5 10 15
tta ttc ccg gta cca ttt caa ggc cac att aac cca att ctt cag cta 96
Leu Phe Pro Val Pro Phe Gln Gly His Ile Asn Pro Ile Leu Gln Leu
20 25 30
gcc aat gtg ttg tac tct aaa gga ttc agt atc acc atc ttt cac acc 144
Ala Asn Val Leu Tyr Ser Lys Gly Phe Ser Ile Thr Ile Phe His Thr
35 40 45
aac ttc aac aaa ccc aaa aca tct aat tac cct cac ttc act ttc aga 192
Asn Phe Asn Lys Pro Lys Thr Ser Asn Tyr Pro His Phe Thr Phe Arg
50 55 60
ttc atc ctc gac aac gac cca caa gac gaa cgc att tcc aat cta ccg 240
Phe Ile Leu Asp Asn Asp Pro Gln Asp Glu Arg Ile Ser Asn Leu Pro
65 70 75 80
act cat ggt ccg ctc gct ggt atg cgg att ccg att atc aac gaa cac 288
Thr His Gly Pro Leu Ala Gly Met Arg Ile Pro Ile Ile Asn Glu His
85 90 95
gga gct gac gaa tta cga cgc gaa ctg gaa ctg ttg atg tta gct tct 336
Gly Ala Asp Glu Leu Arg Arg Glu Leu Glu Leu Leu Met Leu Ala Ser
100 105 110
gaa gaa gat gaa gag gta tcg tgt tta atc acg gat gct ctt tgg tac 384
Glu Glu Asp Glu Glu Val Ser Cys Leu Ile Thr Asp Ala Leu Trp Tyr
115 120 125
ttc gcg caa tct gtt gct gac agt ctt aac ctc cga ccg ctt gtt ttg 432
Phe Ala Gln Ser Val Ala Asp Ser Leu Asn Leu Arg Pro Leu Val Leu
130 135 140
atg aca agc agc ttg ttt aat ttt cat gca cat gtt tca ctt cct cag 480
Met Thr Ser Ser Leu Phe Asn Phe His Ala His Val Ser Leu Pro Gln
145 150 155 160
ttt gat gag ctt ggt tac ctc gat cct gat gac aaa acc cgt ttg gaa 528
Phe Asp Glu Leu Gly Tyr Leu Asp Pro Asp Asp Lys Thr Arg Leu Glu
165 170 175
gaa caa gcg agt ggg ttt cct atg cta aaa gtg aaa gac atc aag tct 576
Glu Gln Ala Ser Gly Phe Pro Met Leu Lys Val Lys Asp Ile Lys Ser
180 185 190
gcg tat tcg aac tgg caa ata ctc aaa gag ata tta ggg aag atg ata 624
Ala Tyr Ser Asn Trp Gln Ile Leu Lys Glu Ile Leu Gly Lys Met Ile
195 200 205
aaa caa aca aaa gca tct tca gga gtc atc tgg aac tca ttt aag gaa 672
Lys Gln Thr Lys Ala Ser Ser Gly Val Ile Trp Asn Ser Phe Lys Glu
210 215 220
ctc gaa gag tct gag ctc gaa act gtt atc cgt gag atc ccg gct cca 720
Leu Glu Glu Ser Glu Leu Glu Thr Val Ile Arg Glu Ile Pro Ala Pro
225 230 235 240
agt ttc ttg ata cca ctc ccc aag cat ttg aca gcc tct tcc agc agc 768
Ser Phe Leu Ile Pro Leu Pro Lys His Leu Thr Ala Ser Ser Ser Ser
245 250 255
tta cta gac cac gat cga acc gtt ttt caa tgg tta gac caa caa ccg 816
Leu Leu Asp His Asp Arg Thr Val Phe Gln Trp Leu Asp Gln Gln Pro
260 265 270
cca agt tcg gta ctg tat gtt agt ttt ggt agt act agt gaa gtg gat 864
Pro Ser Ser Val Leu Tyr Val Ser Phe Gly Ser Thr Ser Glu Val Asp
275 280 285
gag aaa gat ttc ttg gaa ata gct cgt ggg ttg gtt gat agc aag cag 912
Glu Lys Asp Phe Leu Glu Ile Ala Arg Gly Leu Val Asp Ser Lys Gln
290 295 300
tcg ttt tta tgg gtg gtt cga cct ggg ttt gtc aag ggt tcg acg tgg 960
Ser Phe Leu Trp Val Val Arg Pro Gly Phe Val Lys Gly Ser Thr Trp
305 310 315 320
gtc gaa ccg ttg cca gat ggg ttc ttg ggt gaa aga gga cgt att gtg 1008
Val Glu Pro Leu Pro Asp Gly Phe Leu Gly Glu Arg Gly Arg Ile Val
325 330 335
aaa tgg gtt cca cag caa gaa gtg cta gct cat gga gca ata ggc gca 1056
Lys Trp Val Pro Gln Gln Glu Val Leu Ala His Gly Ala Ile Gly Ala
340 345 350
ttc tgg act cat agc gga tgg aac tct acg ttg gaa agc gtt tgt gaa 1104
Phe Trp Thr His Ser Gly Trp Asn Ser Thr Leu Glu Ser Val Cys Glu
355 360 365
ggt gtt cct atg att ttc tcg gat ttt ggg ctc gat caa ccg ttg aat 1152
Gly Val Pro Met Ile Phe Ser Asp Phe Gly Leu Asp Gln Pro Leu Asn
370 375 380
gct aga tac atg agt gat gtt ttg aag gta ggg gtg tat ttg gaa aat 1200
Ala Arg Tyr Met Ser Asp Val Leu Lys Val Gly Val Tyr Leu Glu Asn
385 390 395 400
ggg tgg gaa aga gga gag ata gca aat gca ata aga aga gtt atg gtg 1248
Gly Trp Glu Arg Gly Glu Ile Ala Asn Ala Ile Arg Arg Val Met Val
405 410 415
gat gaa gaa gga gaa tac att aga cag aat gca aga gtt ttg aaa caa 1296
Asp Glu Glu Gly Glu Tyr Ile Arg Gln Asn Ala Arg Val Leu Lys Gln
420 425 430
aag gca gat gtt tct ttg atg aag ggt ggt tcg tct tac gaa tca tta 1344
Lys Ala Asp Val Ser Leu Met Lys Gly Gly Ser Ser Tyr Glu Ser Leu
435 440 445
gag tct cta gtt tct tac att tca tcg ttg taa 1377
Glu Ser Leu Val Ser Tyr Ile Ser Ser Leu
450 455
<210> 12
<211> 458
<212> PRT
<213> 甜菊(Stevia rebaudiana)
<400> 12
Met Glu Asn Lys Thr Glu Thr Thr Val Arg Arg Arg Arg Arg Ile Ile
1 5 10 15
Leu Phe Pro Val Pro Phe Gln Gly His Ile Asn Pro Ile Leu Gln Leu
20 25 30
Ala Asn Val Leu Tyr Ser Lys Gly Phe Ser Ile Thr Ile Phe His Thr
35 40 45
Asn Phe Asn Lys Pro Lys Thr Ser Asn Tyr Pro His Phe Thr Phe Arg
50 55 60
Phe Ile Leu Asp Asn Asp Pro Gln Asp Glu Arg Ile Ser Asn Leu Pro
65 70 75 80
Thr His Gly Pro Leu Ala Gly Met Arg Ile Pro Ile Ile Asn Glu His
85 90 95
Gly Ala Asp Glu Leu Arg Arg Glu Leu Glu Leu Leu Met Leu Ala Ser
100 105 110
Glu Glu Asp Glu Glu Val Ser Cys Leu Ile Thr Asp Ala Leu Trp Tyr
115 120 125
Phe Ala Gln Ser Val Ala Asp Ser Leu Asn Leu Arg Pro Leu Val Leu
130 135 140
Met Thr Ser Ser Leu Phe Asn Phe His Ala His Val Ser Leu Pro Gln
145 150 155 160
Phe Asp Glu Leu Gly Tyr Leu Asp Pro Asp Asp Lys Thr Arg Leu Glu
165 170 175
Glu Gln Ala Ser Gly Phe Pro Met Leu Lys Val Lys Asp Ile Lys Ser
180 185 190
Ala Tyr Ser Asn Trp Gln Ile Leu Lys Glu Ile Leu Gly Lys Met Ile
195 200 205
Lys Gln Thr Lys Ala Ser Ser Gly Val Ile Trp Asn Ser Phe Lys Glu
210 215 220
Leu Glu Glu Ser Glu Leu Glu Thr Val Ile Arg Glu Ile Pro Ala Pro
225 230 235 240
Ser Phe Leu Ile Pro Leu Pro Lys His Leu Thr Ala Ser Ser Ser Ser
245 250 255
Leu Leu Asp His Asp Arg Thr Val Phe Gln Trp Leu Asp Gln Gln Pro
260 265 270
Pro Ser Ser Val Leu Tyr Val Ser Phe Gly Ser Thr Ser Glu Val Asp
275 280 285
Glu Lys Asp Phe Leu Glu Ile Ala Arg Gly Leu Val Asp Ser Lys Gln
290 295 300
Ser Phe Leu Trp Val Val Arg Pro Gly Phe Val Lys Gly Ser Thr Trp
305 310 315 320
Val Glu Pro Leu Pro Asp Gly Phe Leu Gly Glu Arg Gly Arg Ile Val
325 330 335
Lys Trp Val Pro Gln Gln Glu Val Leu Ala His Gly Ala Ile Gly Ala
340 345 350
Phe Trp Thr His Ser Gly Trp Asn Ser Thr Leu Glu Ser Val Cys Glu
355 360 365
Gly Val Pro Met Ile Phe Ser Asp Phe Gly Leu Asp Gln Pro Leu Asn
370 375 380
Ala Arg Tyr Met Ser Asp Val Leu Lys Val Gly Val Tyr Leu Glu Asn
385 390 395 400
Gly Trp Glu Arg Gly Glu Ile Ala Asn Ala Ile Arg Arg Val Met Val
405 410 415
Asp Glu Glu Gly Glu Tyr Ile Arg Gln Asn Ala Arg Val Leu Lys Gln
420 425 430
Lys Ala Asp Val Ser Leu Met Lys Gly Gly Ser Ser Tyr Glu Ser Leu
435 440 445
Glu Ser Leu Val Ser Tyr Ile Ser Ser Leu
450 455
<210> 13
<211> 2004
<212> DNA
<213> 拟南芥(Arabidopsis thaliana)
<400> 13
atggatgata ctacgtataa gccaaagaac attctcatta ctggagctgc tggatttatt 60
gcttctcatg ttgccaacag attaatccgt aactatcctg attacaagat cgttgttctt 120
gacaagcttg attactgttc agatctgaag aatcttgatc cttctttttc ttcaccaaat 180
ttcaagtttg tcaaaggaga tatcgcgagt gatgatctcg ttaactacct tctcatcact 240
gaaaacattg atacgataat gcattttgct gctcaaactc atgttgataa ctcttttggt 300
aatagctttg agtttaccaa gaacaatatt tatggtactc atgttctttt ggaagcctgt 360
aaagttacag gacagatcag gaggtttatc catgtgagta ccgatgaagt ctatggagaa 420
accgatgagg atgctgctgt aggaaaccat gaagcttctc agctgttacc gacgaatcct 480
tactctgcaa ctaaggctgg tgctgagatg cttgtgatgg cttatggtag atcatatgga 540
ttgcctgtta ttacgactcg cgggaacaat gtttatgggc ctaaccagtt tcctgaaaaa 600
atgattccta agttcatctt gttggctatg agtgggaagc cgcttcccat ccatggagat 660
ggatctaatg tccggagtta cttgtactgc gaagacgttg ctgaggcttt tgaggttgtt 720
cttcacaaag gagaaatcgg tcatgtctac aatgtcggca caaaaagaga aaggagagtg 780
atcgatgtgg ctagagacat ctgcaaactt ttcgggaaag accctgagtc aagcattcag 840
tttgtggaga accggccctt taatgatcaa aggtacttcc ttgatgatca gaagctgaag 900
aaattggggt ggcaagagcg aacaaattgg gaagatggat tgaagaagac aatggactgg 960
tacactcaga atcctgagtg gtggggtgat gtttctggag ctttgcttcc tcatccgaga 1020
atgcttatga tgcccggtgg aagactttct gatggatcta gtgagaagaa agacgtttca 1080
agcaacacgg tccagacatt tacggttgta acacctaaga atggtgattc tggtgacaaa 1140
gcttcgttga agtttttgat ctatggtaag actggttggc ttggtggtct tctagggaaa 1200
ctatgtgaga agcaagggat tacatatgag tatgggaaag gacgtctgga ggatagagct 1260
tctcttgtgg cggatattcg tagcatcaaa cctactcatg tgtttaatgc tgctggttta 1320
actggcagac ccaacgttga ctggtgtgaa tctcacaaac cagagaccat tcgtgtaaat 1380
gtcgcaggta ctttgactct agctgatgtt tgcagagaga atgatctctt gatgatgaac 1440
ttcgccaccg gttgcatctt tgagtatgac gctacacatc ctgagggttc gggtataggt 1500
ttcaaggaag aagacaagcc aaatttcttt ggttctttct actcgaaaac caaagccatg 1560
gttgaggagc tcttgagaga atttgacaat gtatgtacct tgagagtccg gatgccaatc 1620
tcctcagacc taaacaaccc gagaaacttc atcacgaaga tctcgcgcta caacaaagtg 1680
gtggacatcc cgaacagcat gaccgtacta gacgagcttc tcccaatctc tatcgagatg 1740
gcgaagagaa acctaagagg catatggaat ttcaccaacc caggggtggt gagccacaac 1800
gagatattgg agatgtacaa gaattacatc gagccaggtt ttaaatggtc caacttcaca 1860
gtggaagaac aagcaaaggt cattgttgct gctcgaagca acaacgaaat ggatggatct 1920
aaactaagca aggagttccc agagatgctc tccatcaaag agtcactgct caaatacgtc 1980
tttgaaccaa acaagagaac ctaa 2004
<210> 14
<211> 33
<212> DNA
<213> 人造的(Artificial)
<220>
<223> 人造核酸(Artificial Nucleic Acid)
<400> 14
cacccatatg gatgcaatgg ctacaactga gaa 33
<210> 15
<211> 32
<212> DNA
<213> 人造的(Artificial)
<220>
<223> 人造核酸(Artificial Nucleic Acid)
<400> 15
agatctctag tttcttgcta gcacggtgat tt 32
<210> 16
<211> 35
<212> DNA
<213> 人造的(Artificial)
<220>
<223> 人造核酸(Artificial Nucleic Acid)
<400> 16
cacccatatg gcggaacaac aaaagatcaa gaaat 35
<210> 17
<211> 35
<212> DNA
<213> 人造的(Artificial)
<220>
<223> 人造核酸(Artificial Nucleic Acid)
<400> 17
ggatccttaa gccttaatta gctcacttac aaatt 35
<210> 18
<211> 29
<212> DNA
<213> 人造的(Artificial)
<220>
<223> 人造核酸(Artificial Nucleic Acid)
<400> 18
cacccatatg gaaaataaaa cggagacca 29
<210> 19
<211> 32
<212> DNA
<213> 人造的(Artificial)
<220>
<223> 人造核酸(Artificial Nucleic Acid)
<400> 19
ggatccttac aacgatgaaa tgtaagaaac ta 32
<210> 20
<211> 33
<212> DNA
<213> 人造的(Artificial)
<220>
<223> 人造核酸(Artificial Nucleic Acid)
<400> 20
acagatctat ggatgcaatg gctacaactg aga 33
<210> 21
<211> 34
<212> DNA
<213> 人造的(Artificial)
<220>
<223> 人造核酸(Artificial Nucleic Acid)
<400> 21
tagtcgacta gtttcttgct agcacggtga tttc 34
<210> 22
<211> 42
<212> DNA
<213> 人造的(Artificial)
<220>
<223> 人造核酸(Artificial Nucleic Acid)
<400> 22
aagcggccgc atgtacaacg ttacttatca tcaaaattca aa 42
<210> 23
<211> 31
<212> DNA
<213> 人造的(Artificial)
<220>
<223> 人造核酸(Artificial Nucleic Acid)
<400> 23
cgttaattaa ctctcatgat cgatggcaac c 31
<210> 24
<211> 34
<212> DNA
<213> 人造的(Artificial)
<220>
<223> 人造核酸(Artificial Nucleic Acid)
<400> 24
aagcggccgc atggcggaac aacaaaagat caag 34
<210> 25
<211> 37
<212> DNA
<213> 人造的(Artificial)
<220>
<223> 人造核酸(Artificial Nucleic Acid)
<400> 25
cgttaattaa gccttaatta gctcacttac aaattcg 37
<210> 26
<211> 33
<212> DNA
<213> 人造的(Artificial)
<220>
<223> 人造核酸(Artificial Nucleic Acid)
<400> 26
aaggatccat ggaaaataaa acggagacca ccg 33
<210> 27
<211> 44
<212> DNA
<213> 人造的(Artificial)
<220>
<223> 人造核酸(Artificial Nucleic Acid)
<400> 27
gcgtcgactt acaacgatga aatgtaagaa actagagact ctaa 44
<210> 28
<211> 33
<212> DNA
<213> 人造的(Artificial)
<220>
<223> 人造核酸(Artificial Nucleic Acid)
<400> 28
ggatccatgg atgatactac gtataagcca aag 33
<210> 29
<211> 32
<212> DNA
<213> 人造的(Artificial)
<220>
<223> 人造核酸(Artificial Nucleic Acid)
<400> 29
ctcgagttag gttctcttgt ttggttcaaa ga 32
<210> 30
<211> 22
<212> DNA
<213> 人造的(Artificial)
<220>
<223> 人造核酸(Artificial Nucleic Acid)
<400> 30
caagtcccca accaaattcc gt 22
<210> 31
<211> 21
<212> DNA
<213> 人造的(Artificial)
<220>
<223> 人造核酸(Artificial Nucleic Acid)
<400> 31
cacgaacccg tctggcaact c 21
<210> 32
<211> 25
<212> DNA
<213> 人造的(Artificial)
<220>
<223> 人造核酸(Artificial Nucleic Acid)
<400> 32
cccgtgtgat ttcttccact tgttc 25
<210> 33
<211> 21
<212> DNA
<213> 人造的(Artificial)
<220>
<223> 人造核酸(Artificial Nucleic Acid)
<400> 33
caagaaccca tctggcaacg g 21
<210> 34
<211> 23
<212> DNA
<213> 人造的(Artificial)
<220>
<223> 人造核酸(Artificial Nucleic Acid)
<400> 34
gctttgtcac cagaatcacc att 23
<210> 35
<211> 28
<212> DNA
<213> 人造的(Artificial)
<220>
<223> 人造核酸(Artificial Nucleic Acid)
<400> 35
gattattaaa cttctttgcg tccatcca 28
<210> 36
<211> 32
<212> DNA
<213> 人造的(Artificial)
<220>
<223> 人造核酸(Artificial Nucleic Acid)
<400> 36
cctctatact ttaacgtcaa ggagaaaaaa cc 32
<210> 37
<211> 39
<212> DNA
<213> 人造的(Artificial)
<220>
<223> 人造核酸(Artificial Nucleic Acid)
<400> 37
tgccgcgcgg cagccatatg tacaacgtta cttatcatc 39
<210> 38
<211> 39
<212> DNA
<213> 人造的(Artificial)
<220>
<223> 人造核酸(Artificial Nucleic Acid)
<400> 38
gttagcagcc ggatccttaa ctctcatgat cgatggcaa 39
<210> 39
<211> 23
<212> DNA
<213> 人造的(Artificial)
<220>
<223> 人造核酸(Artificial Nucleic Acid)
<400> 39
cacttctccg tcgtcactcc atg 23
<210> 40
<211> 23
<212> DNA
<213> 人造的(Artificial)
<220>
<223> 人造核酸(Artificial Nucleic Acid)
<400> 40
catggagtga cgacggagaa gtg 23
<210> 41
<211> 23
<212> DNA
<213> 人造的(Artificial)
<220>
<223> 人造核酸(Artificial Nucleic Acid)
<400> 41
cacttctccg tcaccactcc atg 23
<210> 42
<211> 23
<212> DNA
<213> 人造的(Artificial)
<220>
<223> 人造核酸(Artificial Nucleic Acid)
<400> 42
catggagtgg tgacggagaa gtg 23
<210> 43
<211> 32
<212> DNA
<213> 人造的(Artificial)
<220>
<223> 人造核酸(Artificial Nucleic Acid)
<400> 43
ctgattgttt gcttttcaaa tgttaccatg ag 32
<210> 44
<211> 32
<212> DNA
<213> 人造的(Artificial)
<220>
<223> 人造核酸(Artificial Nucleic Acid)
<400> 44
ctcatggtaa catttgaaaa gcaaacaatc ag 32
<210> 45
<211> 32
<212> DNA
<213> 人造的(Artificial)
<220>
<223> 人造核酸(Artificial Nucleic Acid)
<400> 45
ctgattgttt gctttccaaa tgttaccatg ag 32
<210> 46
<211> 32
<212> DNA
<213> 人造的(Artificial)
<220>
<223> 人造核酸(Artificial Nucleic Acid)
<400> 46
ctcatggtaa catttggaaa gcaaacaatc ag 32

Claims (25)

1.选自以下(a)~(c)中的任一项所记载的蛋白质:
(a)由序列号2的氨基酸序列构成的蛋白质;
(b)由序列号2的氨基酸序列中除氨基酸残基X7以外的1~48个氨基酸缺失、取代、***、及/或添加的氨基酸序列构成的,且具有向下述通式(I)所示的化合物的13位葡萄糖的2位上添加己糖的活性的蛋白质;
(c)具有对于序列号2的氨基酸序列具有90%以上的序列一致性,且与氨基酸残基X7对应的氨基酸为同一氨基酸的氨基酸序列的,且具有向下述通式(I)所示的化合物的13位葡萄糖的2位上添加己糖的活性的蛋白质,
式中,R1表示H、C1~C20烷基、C2~C20烯基、C2~C20炔基、C4~C20烷基二烯基、C6~C18芳基、C6~C20烷基芳基、C6~C20芳基烷基、C4~C20环烷基、C4~C20环烯基、(C3~C10环烷基)C1~C10烷基或糖残基。
2.根据权利要求1所述的蛋白质,其特征在于,为,
(b')由序列号2的氨基酸序列中除氨基酸残基X1~X7以外的1~48个氨基酸缺失、取代、***、及/或添加的氨基酸序列构成的,且具有向所述通式(I)所示的化合物的13位葡萄糖的2位上添加己糖的活性的蛋白质;或
(c')具有对于序列号2的氨基酸序列具有90%以上的序列一致性,且与氨基酸残基X1~X7对应的氨基酸为同一氨基酸的氨基酸序列的,且具有向所述通式(I)所示的化合物的13位葡萄糖的2位上添加己糖的活性的蛋白质。
3.选自以下(b”)、(c”)、(d)~(i)中的任一项所记载的蛋白质:
(b”)由序列号2的氨基酸序列中除氨基酸残基X2及/或X3以外的1~48个氨基酸缺失、取代、***、及/或添加的氨基酸序列构成的,且具有向下述通式(I)所示的化合物的13位葡萄糖的2位上添加己糖的活性的蛋白质;
(c”)具有对于序列号2的氨基酸序列具有90%以上的序列一致性,且与氨基酸残基X2及/或X3对应的氨基酸为同一氨基酸的氨基酸序列的,且具有向下述通式(I)所示的化合物的13位葡萄糖的2位上添加己糖的活性的蛋白质;
(d)由序列号4的氨基酸序列中第156位的氨基酸残基为Val,及/或第233位的氨基酸残基为Phe的氨基酸序列构成的蛋白质;
(e)由上述(d)的蛋白质中,1~48个氨基酸缺失、取代、***、及/或添加,与序列号4的第156位的氨基酸残基对应的氨基酸残基为Val,及/或与序列号4的第233位的氨基酸残基对应的氨基酸残基为Phe的氨基酸序列构成的,且具有向下述通式(I)所示的化合物的13位葡萄糖的2位上添加己糖的活性的蛋白质;
(f)具有对于上述(d)的蛋白质的氨基酸序列具有90%以上的序列一致性,且与序列号4的第156位的氨基酸残基对应的氨基酸残基为Val,及/或与序列号4的第233位的氨基酸残基对应的氨基酸残基为Phe的氨基酸序列的,且具有向下述通式(I)所示的化合物的13位葡萄糖的2位上添加己糖的活性的蛋白质;
(g)序列号2的氨基酸序列中氨基酸残基X2为Thr,及/或氨基酸残基X3为Ser的蛋白质;
(h)由上述(g)的蛋白质中,1~48个氨基酸缺失、取代、***、及/或添加,与氨基酸残基X2对应的氨基酸残基为Thr,及/或与氨基酸残基X3对应的氨基酸残基为Ser的氨基酸序列构成的,且具有向下述通式(I)所示的化合物的13位葡萄糖的2位上添加己糖的活性的蛋白质;
(i)具有对于上述(g)的蛋白质的氨基酸序列具有90%以上的序列一致性,且与氨基酸残基X2对应的氨基酸残基为Thr,及/或与氨基酸残基X3对应的氨基酸残基为Ser的氨基酸序列的,且具有向下述通式(I)所示的化合物的13位葡萄糖的2位上添加己糖的活性的蛋白质,
式中,R1表示H、C1~C20烷基、C2~C20烯基、C2~C20炔基、C4~C20烷基二烯基、C6~C18芳基、C6~C20烷基芳基、C6~C20芳基烷基、C4~C20环烷基、C4~C20环烯基、(C3~C10环烷基)C1~C10烷基或糖残基。
4.根据权利要求1~3中任一项所述的蛋白质,其特征在于,所述己糖为选自葡萄糖或鼠李糖中的物质。
5.根据权利要求1~4中任一项所述的蛋白质,其特征在于,所述R1为H或葡萄糖单体或葡萄糖二聚体的糖残基。
6.根据权利要求1~5中任一项所述的蛋白质,其特征在于,所述化合物为甜菊单糖苷或甜叶悬钩子苷。
7.选自以下(a)~(d)中的多核苷酸:
(a)含有序列号1的碱基序列的多核苷酸;
(b)编码由序列号2的氨基酸序列构成的蛋白质的多核苷酸;
(c)编码由序列号2的氨基酸序列中除氨基酸残基X7以外1~48个氨基酸缺失、取代、***及/或添加的氨基酸序列构成的,且具有向下述通式(I)所示的化合物的13位葡萄糖的2位添加己糖的活性的蛋白质的多核苷酸;
(d)编码具有对于序列号2的氨基酸序列具有90%以上的序列一致性,且与氨基酸残基X7对应的氨基酸为同一氨基酸的氨基酸序列的,且具有向下述通式(I)所示的化合物的13位葡萄糖的2位上添加己糖的活性的蛋白质的多核苷酸,
式中,R1表示H、C1~C20烷基、C2~C20烯基、C2~C20炔基、C4~C20烷基二烯基、C6~C18芳基、C6~C20烷基芳基、C6~C20芳基烷基、C4~C20环烷基、C4~C20环烯基、(C3~C10环烷基)C1~C10烷基或糖残基。
8.根据权利要求7所述的多核苷酸,其特征在于,为,
(c')编码由序列号2的氨基酸序列中除氨基酸残基X1~X7以外1~48个氨基酸缺失、取代、***及/或添加的氨基酸序列构成的,且具有向所述通式(I)所示的化合物的13位葡萄糖的2位添加己糖的活性的蛋白质的多核苷酸;或
(d')编码具有对于序列号2的氨基酸序列具有90%以上的序列一致性,且与氨基酸残基X1~X7对应的氨基酸为同一氨基酸的氨基酸序列的,且具有向所述通式(I)所示的化合物的13位葡萄糖的2位上添加己糖的活性的蛋白质的多核苷酸。
9.选自以下(c”)、(d”)、(e)~(j)中的多核苷酸:
(c”)编码在序列号2的氨基酸序列中除氨基酸残基X2及/或X3以外的1~48个氨基酸缺失、取代、***、及/或添加的氨基酸序列构成的,且具有向下述通式(I)所示的化合物的13位葡萄糖的2位上添加己糖的活性的蛋白质的多核苷酸;
(d”)编码具有对于序列号2的氨基酸序列具有90%以上的序列一致性,且与氨基酸残基X2及/或X3对应的氨基酸为同一氨基酸的氨基酸序列的,且具有向下述通式(I)所示的化合物的13位葡萄糖的2位上添加己糖的活性的蛋白质的多核苷酸;
(e)编码序列号4的氨基酸序列中,第156位的氨基酸残基为Val,及/或第233位的氨基酸残基为Phe的蛋白质的多核苷酸;
(f)编码由上述(e)所述的蛋白质中,1~48个氨基酸缺失、取代、***、及/或添加,与序列号4的第156位的氨基酸残基对应的氨基酸残基为Val,及/或与序列号4的第233位的氨基酸残基对应的氨基酸残基为Phe的氨基酸序列构成的,且具有向下述通式(I)所示的化合物的13位葡萄糖的2位上添加己糖的活性的蛋白质的多核苷酸;
(g)编码具有对于上述(e)所述的蛋白质的氨基酸序列具有90%以上的序列一致性,且与序列号4的第156位的氨基酸残基对应的氨基酸残基为Val,及/或与序列号4的第233位的氨基酸残基对应的氨基酸残基为Phe的氨基酸序列的,且具有向下述通式(I)所示的化合物的13位葡萄糖的2位上添加己糖的活性的蛋白质的多核苷酸;
(h)编码序列号2的氨基酸序列中,氨基酸残基X2为Thr,及/或氨基酸残基X3为Ser的蛋白质的多核苷酸;
(i)编码由在上述(h)所述的蛋白质中1~48个氨基酸缺失、取代、***、及/或添加,与氨基酸残基X2对应的氨基酸残基为Thr,及/或与氨基酸残基X3对应的氨基酸残基为Ser的氨基酸序列构成的,且具有向下述通式(I)所示的化合物的13位葡萄糖的2位上添加己糖的活性的蛋白质的多核苷酸;
(j)编码具有对于上述(h)所述的蛋白质的氨基酸序列具有90%以上的序列一致性,且与氨基酸残基X2对应的氨基酸残基为Thr,及/或与氨基酸残基X3对应的氨基酸残基为Ser的氨基酸序列的,且具有向下述通式(I)所示的化合物的13位葡萄糖的2位上添加己糖的活性的蛋白质的多核苷酸,
式中,R1表示H、C1~C20烷基、C2~C20烯基、C2~C20炔基、C4~C20烷基二烯基、C6~C18芳基、C6~C20烷基芳基、C6~C20芳基烷基、C4~C20环烷基、C4~C20环烯基、(C3~C10环烷基)C1~C10烷基或糖残基。
10.根据权利要求7~9中任一项所述的多核苷酸,其特征在于,所述己糖为选自葡萄糖或鼠李糖中的物质。
11.根据权利要求7~10中任一项所述的多核苷酸,其特征在于,所述R1为H或葡萄糖单体或葡萄糖二聚体的糖残基。
12.根据权利要求7~11中任一项所述的多核苷酸,其特征在于,所述化合物为甜菊单糖苷或甜叶悬钩子苷。
13.导入了权利要求7~12中任一项所述的多核苷酸的非人类转化体。
14.根据权利要求13所述的转化体,其特征在于,所述多核苷酸为***到表达载体中的物质。
15.根据权利要求13或14所述的转化体,其特征在于,为植物体。
16.权利要求13~15中任一项所述的转化体的萃取物。
17.含有权利要求16中所述的萃取物的饮食品、医药品或工业原料。
18.一种方法,其为以培养权利要求13~15中任一项所述的非人类转化体为特征的蛋白质的制造方法,其特征在于,所述蛋白质具有向下述通式(I)所示的化合物的13位葡萄糖的2位上添加己糖的活性:
式中,R1表示H、C1~C20烷基、C2~C20烯基、C2~C20炔基、C4~C20烷基二烯基、C6~C18芳基、C6~C20烷基芳基、C6~C20芳基烷基、C4~C20环烷基、C4~C20环烯基、(C3~C10环烷基)C1~C10烷基或糖残基。
19.一种甜菊醇糖苷的制造方法,其特征在于,以使用权利要求13~15中任一项所述的非人类转化体为特征。
20.根据权利要求19所述的方法,其特征在于,所述甜菊醇糖苷为甜菊双糖苷、甜菊苷、杜克苷A、Reb.E或Reb.C或者这些物质的组合。
21.一种甜菊醇糖苷的制造方法,其特征在于,含有使权利要求1~6中任一项所述的蛋白质与UDP-糖和下述通式(I)所示的化合物反应的工序:
式中,R1表示H、C1~C20烷基、C2~C20烯基、C2~C20炔基、C4~C20烷基二烯基、C6~C18芳基、C6~C20烷基芳基、C6~C20芳基烷基、C4~C20环烷基、C4~C20环烯基、(C3~C10环烷基)C1~C10烷基或糖残基。
22.根据权利要求21所述的方法,其特征在于,所述UDP-糖中的糖为葡萄糖或鼠李糖。
23.根据权利要求21或22所述的方法,其特征在于,所述甜菊醇糖苷为甜菊双糖苷、甜菊苷、杜克苷A、Reb.E或Reb.C或者这些物质的组合。
24.推断与在植物体中累计的甜菊醇糖苷的13位葡萄糖的2位上键合的糖的种类的方法,其特征在于,所述方法含有:
(1)确定植物体所表达的UDP糖依赖性糖基转移酶(UGT)的氨基酸序列的工序,
(2)于所述(1)中确定的UGT的氨基酸序列中,对与选自序列号2的氨基酸残基X2、序列号2的氨基酸残基X3、序列号4的第156位的氨基酸残基及/或序列号4的第233位的氨基酸残基的氨基酸残基对应的氨基酸残基进行确定的工序,及
(3)与序列号2的氨基酸残基X2或序列号4的第156位的氨基酸残基对应的氨基酸残基为Thr或Ser时,及/或与序列号2的氨基酸残基X3或序列号4的第233位的氨基酸残基对应的氨基酸残基为Ser或Thr时,推断在与植物体中累积的甜菊醇糖苷的13位葡萄糖的2位键合的糖中葡萄糖所占比例高,与序列号2的氨基酸残基X2或序列号4的第156位的氨基酸残基对应的氨基酸残基为Val、Leu、Ile、Ala或Met时,及/或与序列号2的氨基酸残基X3或序列号4的第233位的氨基酸残基相对应的氨基酸残基为Phe或Tyr时,推断在与植物体中累积的甜菊醇糖苷的13位葡萄糖的2位键合的糖中鼠李糖所占比例高的工序。
25.筛选作为甜菊醇糖苷累积在13位葡萄糖的2位上含有葡萄糖或鼠李糖的糖苷的植物体的方法,其特征在于,所述方法含有:
(1)确定植物体所表达的UGT的氨基酸序列的工序,
(2)于所述(1)中确定的UGT的氨基酸序列中,对与选自序列号2的氨基酸残基X2、序列号2的氨基酸残基X3、序列号4的第156位的氨基酸残基及/或序列号4的第233位的氨基酸残基的氨基酸残基对应的氨基酸残基进行确定的工序,及
(3)与序列号2的氨基酸残基X2或序列号4的第156位的氨基酸残基对应的氨基酸残基为Thr或Ser时,及/或与序列号2的氨基酸残基X3或序列号4的第233位的氨基酸残基对应的氨基酸残基为Ser或Thr时,判定植物体具有作为甜菊醇糖苷会累积在13位葡萄糖的2位上含有葡萄糖的糖苷的可能性,与序列号2的氨基酸残基X2或序列号4的第156位的氨基酸残基对应的氨基酸残基为Val、Leu、Ile、Ala或Met时,及/或与序列号2的氨基酸残基X3或序列号4的第233位的氨基酸残基对应的氨基酸残基为Phe或Tyr时,判定植物体具有作为甜菊醇糖苷会累积在13位葡萄糖的2位上含有鼠李糖的糖苷的可能性的工序。
CN201780080859.XA 2016-12-27 2017-12-26 甜菊醇糖苷己糖转移酶及编码该物质的基因 Pending CN110121556A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2016-252643 2016-12-27
JP2016252643 2016-12-27
PCT/JP2017/046804 WO2018124141A1 (ja) 2016-12-27 2017-12-26 ステビオール配糖体ヘキソース転移酵素およびそれをコードする遺伝子

Publications (1)

Publication Number Publication Date
CN110121556A true CN110121556A (zh) 2019-08-13

Family

ID=62707474

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201780080859.XA Pending CN110121556A (zh) 2016-12-27 2017-12-26 甜菊醇糖苷己糖转移酶及编码该物质的基因

Country Status (5)

Country Link
US (2) US11702641B2 (zh)
EP (1) EP3564369A4 (zh)
JP (1) JP7214477B2 (zh)
CN (1) CN110121556A (zh)
WO (1) WO2018124141A1 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116286712A (zh) * 2023-05-11 2023-06-23 中国中医科学院中药研究所 鼠李糖基转移酶突变体、编码基因、制备方法及应用

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
MX2022000996A (es) * 2019-07-31 2022-02-16 Suntory Holdings Ltd Nuevo glucosido de esteviol, metodo para su produccion y composicion endulzante que contiene al mismo.
CN114921431B (zh) * 2022-05-05 2023-04-25 湖北大学 糖基转移酶突变体及其在发酵生产芳香醇糖苷中的应用
WO2024010074A1 (ja) * 2022-07-07 2024-01-11 サントリーホールディングス株式会社 ステビオール配糖体生合成変異酵素とその利用

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TW201343915A (zh) * 2012-03-16 2013-11-01 Suntory Holdings Ltd 蛇菊醇糖基轉移酶及編碼該轉移酶之基因
CN103732753A (zh) * 2011-08-08 2014-04-16 埃沃尔瓦公司 甜菊醇糖苷类的重组生产
CN105051195A (zh) * 2013-02-06 2015-11-11 埃沃尔瓦公司 用于提高莱鲍迪苷d和莱鲍迪苷m之产生的方法
CN105671108A (zh) * 2010-06-02 2016-06-15 沃维公司 甜菊糖苷的重组生产

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5925525A (en) 1989-06-07 1999-07-20 Affymetrix, Inc. Method of identifying nucleotide differences
US5858659A (en) 1995-11-29 1999-01-12 Affymetrix, Inc. Polymorphism detection
US6045996A (en) 1993-10-26 2000-04-04 Affymetrix, Inc. Hybridization assays on oligonucleotide arrays
US7927851B2 (en) 2006-03-21 2011-04-19 Vineland Research And Innovation Centre Compositions having ent-kaurenoic acid 13-hydroxylase activity and methods for producing same
US8530527B2 (en) * 2011-06-23 2013-09-10 Purecircle Sdn Bhd Food ingredients from Stevia rebaudiana
KR20150128705A (ko) 2013-02-11 2015-11-18 에볼바 에스아 재조합 숙주에서 스테비올 글리코시드의 효율적인 생성

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105671108A (zh) * 2010-06-02 2016-06-15 沃维公司 甜菊糖苷的重组生产
CN103732753A (zh) * 2011-08-08 2014-04-16 埃沃尔瓦公司 甜菊醇糖苷类的重组生产
TW201343915A (zh) * 2012-03-16 2013-11-01 Suntory Holdings Ltd 蛇菊醇糖基轉移酶及編碼該轉移酶之基因
EP2826861A1 (en) * 2012-03-16 2015-01-21 Suntory Holdings Limited Steviol glycosyltransferase and gene encoding same
CN105051195A (zh) * 2013-02-06 2015-11-11 埃沃尔瓦公司 用于提高莱鲍迪苷d和莱鲍迪苷m之产生的方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116286712A (zh) * 2023-05-11 2023-06-23 中国中医科学院中药研究所 鼠李糖基转移酶突变体、编码基因、制备方法及应用
CN116286712B (zh) * 2023-05-11 2023-08-25 中国中医科学院中药研究所 鼠李糖基转移酶突变体、编码基因、制备方法及应用

Also Published As

Publication number Publication date
US20230340429A1 (en) 2023-10-26
EP3564369A1 (en) 2019-11-06
US11702641B2 (en) 2023-07-18
JPWO2018124141A1 (ja) 2019-11-21
US20200123509A1 (en) 2020-04-23
WO2018124141A1 (ja) 2018-07-05
EP3564369A4 (en) 2020-07-29
JP7214477B2 (ja) 2023-01-30

Similar Documents

Publication Publication Date Title
EP2826861B1 (en) Steviol glycosyltransferase and gene encoding same
CN110121556A (zh) 甜菊醇糖苷己糖转移酶及编码该物质的基因
JP6230529B2 (ja) ステビオール配糖体化酵素およびそれをコードする遺伝子
CA2867572C (en) Method for producing steviol glycoside
EP3359654B1 (en) Kaurenoic acid hydroxylases
TW201307566A (zh) 單萜烯糖化酵素之利用方法
JP6153336B2 (ja) チャ由来モノテルペン配糖体化酵素及びその利用方法
EP3645714B1 (en) Udp-glycosyltransferases
CN110494564A (zh) 来自甜菊的鼠李糖合成酶及基因
CN104093837B (zh) 来自啤酒花的单萜糖基转移酶及其利用方法
AU2017373570A1 (en) Kaurenoic acid hydroxylases
JP2013158298A (ja) モノテルペン配糖体化酵素の利用方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination