CN109576241A - 基因表达的调控 - Google Patents

基因表达的调控 Download PDF

Info

Publication number
CN109576241A
CN109576241A CN201811249667.XA CN201811249667A CN109576241A CN 109576241 A CN109576241 A CN 109576241A CN 201811249667 A CN201811249667 A CN 201811249667A CN 109576241 A CN109576241 A CN 109576241A
Authority
CN
China
Prior art keywords
sequence
seq
identity
uorf
plant
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201811249667.XA
Other languages
English (en)
Inventor
威廉·阿利斯特·莱恩
罗格·保罗·海伦斯
理查德·科林·麦克奈特
肖恩·迈克尔·温斯利·布利
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nz Inst For Crop & Food Res
New Zealand Insitiute for Plant and Food Research Ltd
Original Assignee
Nz Inst For Crop & Food Res
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nz Inst For Crop & Food Res filed Critical Nz Inst For Crop & Food Res
Publication of CN109576241A publication Critical patent/CN109576241A/zh
Pending legal-status Critical Current

Links

Classifications

    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01HNEW PLANTS OR NON-TRANSGENIC PROCESSES FOR OBTAINING THEM; PLANT REPRODUCTION BY TISSUE CULTURE TECHNIQUES
    • A01H1/00Processes for modifying genotypes ; Plants characterised by associated natural traits
    • A01H1/06Processes for producing mutations, e.g. treatment with chemicals or with radiation
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8216Methods for controlling, regulating or enhancing expression of transgenes in plant cells
    • C12N15/8237Externally regulated expression systems
    • C12N15/8238Externally regulated expression systems chemically inducible, e.g. tetracycline
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8241Phenotypically and genetically modified plants via recombinant DNA technology
    • C12N15/8242Phenotypically and genetically modified plants via recombinant DNA technology with non-agronomic quality (output) traits, e.g. for industrial processing; Value added, non-agronomic traits
    • C12N15/8243Phenotypically and genetically modified plants via recombinant DNA technology with non-agronomic quality (output) traits, e.g. for industrial processing; Value added, non-agronomic traits involving biosynthetic or metabolic pathways, i.e. metabolic engineering, e.g. nicotine, caffeine
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/10Transferases (2.)
    • C12N9/12Transferases (2.) transferring phosphorus containing groups, e.g. kinases (2.7)
    • C12N9/1241Nucleotidyltransferases (2.7.7)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6888Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for detection or identification of organisms
    • C12Q1/6895Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for detection or identification of organisms for plants, fungi or algae

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Engineering & Computer Science (AREA)
  • Organic Chemistry (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Biotechnology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • Molecular Biology (AREA)
  • Biomedical Technology (AREA)
  • General Health & Medical Sciences (AREA)
  • Biochemistry (AREA)
  • Microbiology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Analytical Chemistry (AREA)
  • Biophysics (AREA)
  • Physics & Mathematics (AREA)
  • Plant Pathology (AREA)
  • Cell Biology (AREA)
  • Botany (AREA)
  • Medicinal Chemistry (AREA)
  • General Chemical & Material Sciences (AREA)
  • Immunology (AREA)
  • Mycology (AREA)
  • Nutrition Science (AREA)
  • Developmental Biology & Embryology (AREA)
  • Environmental Sciences (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Breeding Of Plants And Reproduction By Means Of Culturing (AREA)
  • Peptides Or Proteins (AREA)
  • Chemical Kinetics & Catalysis (AREA)

Abstract

本发明提供了一种分离的多核苷酸,其包含编码uORF肽的序列、或其变体或片段。本发明也提供了包含所述多核苷酸的构建体和载体。本发明还提供了转化了所述多核苷酸和构建体的细胞、植物细胞和植物。本发明也提供了使用所述多核苷酸控制可操作地连接的多核苷酸的表达的方法。本发明也提供了利用本发明的多核苷酸在植物中操纵GDP‑L‑半乳糖磷酸化酶(GGP)的表达和抗坏血酸产生的方法。

Description

基因表达的调控
本申请是申请号为2013800676751、申请日为2013年12月20日、发明名称为“基因表达的调控”的专利申请的分案申请。
技术领域
本发明涉及GDP-L-半乳糖磷酸化酶(GGP)表达的控制和操纵以及抗坏血酸的制备。本发明也涉及控制所述表达和制备的序列元件,及其使用。
背景技术
抗坏血酸是植物中最丰富的可溶性抗氧化剂,并且对于人和一些其它动物也是必需的营养素。抗坏血酸显著地促进人类膳食中“游离自由基清除剂”或“抗氧化代谢产物”的全面摄入。令人信服的证据现在表明,这种代谢产物单独或者联合地作为抗癌症形成剂和预防冠心病而有利于健康和身体。
人类摄入的几乎全部膳食抗坏血酸都来源于植物产品。然而,植物组织的抗坏血酸含量显著不同。虽然在草本和木本植物中,叶子的抗坏血酸含量通常很高并且相对一致,但是在非绿色的可食用植物组织中,发现抗坏血酸含量有巨大的无法解释的差异。例如,在果实中,其水平在Mirciaria dubia的卡姆果(camu camu)中高达30mg gFW-1 AsA,而在Mespilus germanica的欧楂果(medlar)中低于3μg gFW-1 AsA(Rodriguez等,1992,JChromatogr Sci,30:433-437)。据报道猕猴桃中抗坏血酸值的变化很大(Ferguson,A.R.,Botanical nominclature:Actinidia chinensis,Actinidia deliciosa,and Actinidiasetosa.Kiwifruit:science and management,ed.I.J.Warrington和G.C.Weston.1990,Palmerston North;New Zealand:New Zealand Society for HorticulturalScience.576.Beever,D.J.和G.Hopkirk,Fruit development and fruitphysiology.Kiwifruit:science and management,ed.I.J.Warrington andG.C.Weston.1990,Palmerston North;New Zealand:New Zealand Society forHorticultural Science.576.)。不同的藤本植物水果的抗坏血酸含量,对于美味猕猴桃(A.deliciosa)范围是30-400mg/100g(Ferguson,A.R.,1991Acta Hort.290:p.603-656,Spano,D.等,1997Acta Hort.,.444:p.501-506.),而对于栽培品种“Hayward”报道的范围在80-120mg/100g(Beever,D.J.和G.Hopkirk,Fruit development and fruitphysiology.Kiwifruit:science and management,ed.I.J.Warrington和G.C.Weston.1990,Palmerston North;New Zealand:New Zealand Society forHorticultural Science.576.)。据报道,软枣猕猴桃(A.arguta)、中华猕猴桃(A.chinensis)(Muggleston,S.等,Orchardist,1998.71(8):p.38-40,Chen,Q.和Q.Chen,Crop Genetic Resources,1998(2):p.3,Coggiatti,S.,1971 Ital Agr,Oct,.108(10):p.935-941)、金花猕猴桃(A.chrysantha)和葛枣猕猴桃(A.polygama)的果实中含有较高浓度的抗坏血酸,在毛花猕猴桃(A.eriantha)和阔叶猕猴桃(A.latifolia)中水平非常高(>1%鲜重)(Ferguson 1991 Acta Hort.290:p.603-656.和A.kolomikta (Kola,J.andJ.Pavelka,1988Nahrung,.32(5):p.513-515)。
已经提出植物中生物合成抗坏血酸的三种途径,一种是通过L-半乳糖(L-Gal)(Wheeler等,1998,Nature 393,365-369),另一种是由肌醇(myo-inositol)合成(Loewus和Kelly,1961,Arch.Biochem.Biophys.95,483-493;Lorence等,(2004)Plant Physiol.134,1200-1205),以及第三种途径是通过半乳糖醛酸(Agius等,2003,Nat Biotechnol 21,177-81)。L-Gal途径通过L-半乳糖生产半乳糖酸-1,4-内酯(galactono-1,4-lactone),并由此形成抗坏血酸(Wheeler等,1998,Nature 393,365-369)。
对于L-半乳糖途径,已经鉴定并且至少部分表征出来编码这些酶的所有基因和它们相关的酶活性。
被表征的基因和酶活性包括GDP-D-甘露糖焦磷酸化酶(Conklin,1998,TrendsPlant Sci 3:329-330.;Conklin等,1999Proc Natl Acad Sci U S A 96:4198-4203.;Keller等,1999Plant J 19:131-141.)、GDP-D-甘露糖3',5'-茶香异构酶(Wolucka etal.,2001,Anal Biochem 294:161-168;Wolucka and Van Montagu,2003,J.Biol.Chem.278:47483-47490;Watanabe et al.,2006Phytochemistry 67:338-346.)、L-半乳糖-1-P磷酸酶(Laing等,2004,Proceedings of the National Academy ofSciences(USA)101:16976-16981.;Conklin等,2006,J.Biol.Chem.281:15662-15670.)、L-半乳糖脱氢酶(Wheeler等,1998,Nature 393:365-369.;Gatzek等,2002,Plant J.30,541(2002;Laing等,2004Proceedings of the National Academy of Sciences(USA)101:16976-16981)、L-半乳糖酸-1,4-内酯脱氢酶(Imai等,1998Plant and Cell Physiology39:1350-1358.;Bartoli等,2005,Plant,Cell and Environment 28:1073-1081.)和GDP-L半乳糖磷酸化酶(GGP)(Laing等,2007,Proceedings of the National Academy ofSciences(USA)104:9534-9)。申请人之前已经示出了GDP-L半乳糖磷酸化酶在决定抗坏血酸的产生中是重要的(Bulley S等,2012Plant Biotechnol J 2012,10:390-397)。
抗坏血酸的浓度是根据需求调控的。当在高光强度下对高抗坏血酸的需求最高时,叶子中抗坏血酸浓度升高(Bartoli等,J.Exp.Bot.57,1621(2006);Gatzek,等,PlantJ.30,541(2002))。然而,对植物中抗坏血酸的生物合成的调控机制知之甚少(Bulley等,Plant Biotechnol J 10,390(2012);Bulley等,J.Exp.Bot.60,765(2009))。了解抗坏血酸的生物合成如何调控可以为在植物中操纵生物合成提供工具。了解基因表达的调控、以及控制所述表达的因子/元件也能为基因操纵提供有价值的工具。
本发明的一个目的在于提供用于调节GGP(也称为GDP-L-半乳糖磷酸化酶)活性;和/或植物中的抗坏血酸含量的改进组合物和方法;和/或提供可用于遗传操纵的改进工具;或至少为公众提供有用的选择。
发明内容
第一方面,本发明提供了一种分离的多核苷酸,包含编码具有以下氨基酸序列的多肽或其变体或片段的序列,所述氨基酸序列选自:SEQ ID NO:1至20、以及132至134(uORF肽)。
在一个实施方案中,所述变体或片段包含与选自SEQ ID NO:21至40、以及135至137的氨基酸序列(uORF肽的保守区域)有至少70%同一性的序列。
在另一个实施方案中,所述变体或片段包含选自SEQ ID NO:21至40、以及135至137的氨基酸序列(uORF肽的保守区域)。
在一个实施方案中,所述变体或片段包含与选自氨基酸序列SEQ ID NO:21至30、33至37以及135至137(双子叶植物uORF肽的保守区域)有至少70%同一性的序列。
在另一个实施方案中,所述变体或片段包含选自SEQ ID NO:21至30、33至37以及135至137的氨基酸序列(双子叶植物uORF肽的保守区域)。
在一个实施方案中,所述变体或片段包含与氨基酸序列SEQ ID NO:108(uORF肽共有基序)有至少70%同一性的序列。
在另一个实施方案中,所述变体或片段包含氨基酸序列SEQ ID NO:108(uORF肽共有基序)。
在另一个实施方案中,所述变体包含与选自SEQ ID NO:1至20、以及132至134的氨基酸序列(uORF肽)有至少70%同一性的序列。
在另一个实施方案中,所述变体包含选自SEQ ID NO:1至20、以及132至134的氨基酸序列(uORF肽)。
在另一个实施方案中,所述变体包含与选自SEQ ID NO:1至10、13至17以及132至134的氨基酸序列(双子叶植物uORF肽)有至少70%同一性的序列。
在另一个实施方案中,所述变体包含选自SEQ ID NO:1至10、13至17以及132至134的氨基酸序列(双子叶植物uORF肽)。
在另一个实施方案中,所述分离的多核苷酸包含与选自SEQ ID NO:61至80、以及138至140的序列(uORF DNA序列保守区域)有至少70%同一性的序列。
在另一个实施方案中,所述分离的多核苷酸包含选自SEQ ID NO:61至80、以及138至140的序列(uORF DNA序列保守区域)。
在另一个实施方案中,所述分离的多核苷酸包含与选自SEQ ID NO:61至70、73至77以及138至140的序列(双子叶植物uORF DNA序列保守区域)有至少70%同一性的序列。
在另一个实施方案中,所述分离的多核苷酸包含选自SEQ ID NO:61至70、73至77以及138至140的序列(双子叶植物uORF DNA序列保守区域)。
在另一个实施方案中,所述分离的多核苷酸包含与选自SEQ ID NO:41至60、以及129至131的序列(uORF DNA序列)有至少70%同一性的序列。
在另一个实施方案中,所述分离的多核苷酸包含选自SEQ ID NO:41至60、以及129至131的序列(uORF DNA序列)。
在另一个实施方案中,所述分离的多核苷酸包含与选自SEQ ID NO:41至50、53至57以及129至131的序列(双子叶植物uORF DNA序列)有至少70%同一性的序列。
在另一个实施方案中,所述分离的多核苷酸包含选自SEQ ID NO:41至50、53至57以及129至131的序列(双子叶植物uORF DNA序列)。
在另一个实施方案中,所述分离的多核苷酸包含与选自SEQ ID NO:111至125的序列(5’-UTR子序列)有至少70%同一性的序列。
在另一个实施方案中,所述分离的多核苷酸包含选自SEQ ID NO:111至125的序列(5’-UTR子序列)。
在另一个实施方案中,所述分离的多核苷酸包含与选自SEQ ID NO:81至100、以及126至128的序列(完整5’-UTR序列)有至少70%同一性的序列。
在另一个实施方案中,所述分离的多核苷酸包含选自SEQ ID NO:81至100、以及126至128的序列(完整5’-UTR序列)。
在另一个实施方案中,所述分离的多核苷酸包含与选自SEQ ID NO:81至90、93至97以及125至128的序列(完整双子叶植物5’-UTR序列)有至少70%同一性的序列。
在另一个实施方案中,所述分离的多核苷酸包含选自SEQ ID NO:81至90、93至97以及125至128的序列(完整双子叶植物5’-UTR序列)。
在另一个方面,本发明提供了一种分离的多核苷酸,包含选自于SEQ ID NO:41至60、以及129至131(uORF DNA序列)、或其变体或片段的序列。
在一个实施方案中,所述变体或片段包含与选自SEQ ID NO:61至80、以及138至140的序列(uORF DNA序列保守区域)有至少70%同一性的序列。
在一个实施方案中,所述变体或片段包含选自SEQ ID NO:61至80、以及138至140的序列(uORF DNA序列保守区域)。
在另一个实施方案中,所述分离的多核苷酸包含选自SEQ ID NO:41至60、以及129至131的序列(uORF DNA序列)。
在一个实施方案中,所述变体包含与选自SEQ ID NO:41至60、以及129至131的序列(uORF DNA序列)有至少70%同一性的序列。
在一个实施方案中,所述变体包含与选自SEQ ID NO:41至50、53至57以及129至131的序列(双子叶植物uORF DNA序列)有至少70%同一性的序列。
在另一个实施方案中,所述分离的多核苷酸包含与选自SEQ ID NO:111至125的序列(5’-UTR子序列)有至少70%同一性的序列。
在另一个实施方案中,所述分离的多核苷酸包含选自SEQ ID NO:111至125的序列(5’-UTR子序列)。
在另一个实施方案中,所述分离的多核苷酸包含与选自SEQ ID NO:81至100、以及126至128的序列(完整5’-UTR序列)有至少70%同一性的序列。
在另一个实施方案中,所述分离的多核苷酸包含选自SEQ ID NO:81至100、以及126至128的序列(完整5’-UTR序列)。
在另一个实施方案中,所述分离的多核苷酸包含与选自SEQ ID NO:81至90、93至97以及126至128的序列(完整双子叶植物5’-UTR序列)有至少70%同一性的序列。
在另一个实施方案中,所述分离的多核苷酸包含选自SEQ ID NO:81至90、93至97以及126至128的序列(完整双子叶植物5’-UTR序列)。
在另一个方面,本发明提供了一种分离的多核苷酸,具有选自SEQ ID NO:81至100、以及126至128(完整5’-UTR序列)、或其变体或片段的序列。
在一个实施方案中,所述变体与选自SEQ ID NO:81至100、以及126至128(完整5’-UTR序列)有至少70%同一性的序列。
在另一个方面,本发明提供了一种分离的多核苷酸,具有选自SEQ ID NO:111至125(5’-UTR子序列)、或其变体或片段的序列。
在一个实施方案中,所述变体与选自SEQ ID NO:111至125(5’-UTR子序列)的序列有至少70%同一性。
在另一个实施方案中,所述变体或片段包含与选自SEQ ID NO:41至60、以及129至131(uORF DNA序列)有至少70%同一性的序列。
在另一个实施方案中,所述变体或片段包含选自SEQ ID NO:41至60、以及129至131的序列(uORF DNA序列)。
在另一个实施方案中,所述变体或片段包含与选自SEQ ID NO:41至50、53至57以及129至131(双子叶植物uORF DNA序列)有至少70%同一性的序列。
在另一个实施方案中,所述变体或片段包含选自SEQ ID NO:41至50、53至57以及129至131的序列(双子叶植物uORF DNA序列)。
在另一个实施方案中,所述变体或片段包含与选自SEQ ID NO:61至80、以及138至140的序列(uORF DNA序列保守区域)有至少70%同一性的序列。
在另一个实施方案中,所述变体或片段包含选自SEQ ID NO:61至80、以及138至140的序列(uORF DNA序列保守区域)的序列。
在另一个实施方案中,所述变体或片段包含与选自SEQ ID NO:61至70、73至77以及138至140的序列(双子叶植物uORF DNA序列保守区域)有至少70%同一性的序列。
在另一个实施方案中,所述变体或片段包含选自SEQ ID NO:61至70、73至77以及138至140的序列(双子叶植物uORF DNA序列保守区域)。
在另一个实施方案中,所述变体编码与SEQ ID NO:21至40、以及135至137(uORF肽的保守区域)中任一者有至少70%同一性的序列。
在另一个实施方案中,所述变体编码选自SEQ ID NO:21至40、以及135至137(uORF肽的保守区域)中任一者的序列。
在另一个实施方案中,所述变体编码与SEQ ID NO:21至30、33至37以及135至137(双子叶植物uORF肽的保守区域)中至少一者有至少70%同一性的序列。
在另一个实施方案中,所述变体编码选自SEQ ID NO:21至30、33至37以及135至137(双子叶植物uORF肽的保守区域)中的至少一者的序列。
在一个实施方案中,所述变体或片段包含与氨基酸序列SEQ ID NO:108(uORF肽共有基序)有至少70%同一性的序列。
在另一个实施方案中,所述变体或片段包含氨基酸序列SEQ ID NO:108(uORF肽共有基序)。
在另一个实施方案中,所述变体编码与SEQ ID NO:1至20、以及132至134(uORF肽)中的至少一者有至少70%同一性的序列。
在另一个实施方案中,所述变体或片段编码选自SEQ ID NO:1至20、以及132至134(uORF肽)中至少一者的序列。
在另一个实施方案中,所述变体编码与SEQ ID NO:1至10、13至17以及132至134(双子叶植物uORF肽)中至少一者有至少70%同一性的序列。
在另一个实施方案中,所述变体或片段编码选自SEQ ID NO:1至10、13至17以及132至134(双子叶植物uORF肽)中至少一者的序列。
在一个实施方案中,所述分离的多核苷酸是修饰的。
在一个实施方案中,所述修饰为在编码5'-UTR的序列中至少一个核苷酸的缺失、添加或置换的至少一者。
在一个实施方案中,所述修饰减少、干扰或阻止uORF多肽或其变体的翻译,所述uORF多肽具有SEQ ID NO:1和20以及132至134(uORF肽)中任一者的序列。
在另一个实施方案中,所述修饰减少、干扰或破坏uORF多肽或其变体的活性,所述uORF多肽具有SEQ ID NO:1和20以及132至134(uORF肽)中任一者的序列。
在一个实施方案中,所述变体包含与SEQ ID NO:1和20以及132至134(uORF肽)中任一者有至少70%同一性的序列。
在另一个实施方案中,所述变体包含与SEQ ID NO:1至10、13至17以及132至134(双子叶植物uORF肽)中任一者有至少70%同一性的序列。
在另一个实施方案中,所述变体包含与SEQ ID NO:21至40、以及135至137(uORF肽保守区域)中至少一者有至少70%同一性的序列。
在另一个实施方案中,所述变体包含具有SEQ ID NO:21至40、以及135至137(uORF肽保守区域)中至少一者的序列。
在另一个实施方案中,所述变体包含与SEQ ID NO:1至30、33至37以及135至137(双子叶植物uORF肽保守区域)中至少一者有至少70%同一性的序列。
在另一个实施方案中,所述变体包含具有SEQ ID NO:1至30、33至37以及135至137(双子叶植物uORF肽保守区域)中至少一者的序列。
在一个实施方案中,所述变体或片段包含与氨基酸序列SEQ ID NO:108(uORF肽共有基序)有至少70%同一性的序列。
在另一个实施方案中,所述变体或片段包含氨基酸序列SEQ ID NO:108(uORF肽共有基序)。
在一个实施方案中,所述多核苷酸、或变体或片段可操作地连接至目标核酸序列。
在另一个实施方案中,所述目标核酸序列编码目标蛋白。
在一个实施方案中,所述多核苷酸和核酸序列在自然界中通常不相连。
当如上所述修饰多核苷酸时,为了干扰uORF多肽的表达或活性,可操作地连接的序列可以为GGP序列。在该实施方案中,所述修饰除去通过抗坏血酸对uORF的阻遏。在经修饰的多核苷酸的控制下表达GGP可以有利地保留与天然GGP启动子和5'-UTR的控制类似的空间和/或时间表达,但是停止了抗坏血酸经由uORF多肽的负向调控表达。在该实施方案中,所述多核苷酸与目标核酸序列在自然界可以正常地相连,但是所述多核苷酸处于如上所述的修饰形式。
多肽
在另一个方面,本发明提供了一种分离的多肽,其包含选自SEQ ID NO:1至20以及132至134(uORF肽)、或其变体或片段中任一者的序列。
在一个实施方案中,所述变体或片段包含与选自SEQ ID NO:21至40、以及135至137(uORF肽的保守区域)的序列有至少70%同一性的序列。
在另一个实施方案中,所述变体或片段包含选自SEQ ID NO:21至40、以及135至137(uORF肽的保守区域)的序列。
在一个实施方案中,所述变体或片段包含与选自SEQ ID NO:21至30、33至37以及135至137的序列(双子叶植物uORF肽的保守区域)有至少70%同一性的序列。
在另一个实施方案中,所述变体或片段包含选自SEQ ID NO:21至30、33至37以及135至137的序列(双子叶植物uORF肽的保守区域)。
在一个实施方案中,所述变体或片段包含与氨基酸序列SEQ ID NO:108(uORF肽保守基序)有至少70%同一性的序列。
在另一个实施方案中,所述变体或片段包含氨基酸序列SEQ ID NO:108(uORF肽保守基序)。
在另一个实施方案中,所述变体包含与选自SEQ ID NO:1至20、以及132至134的序列(uORF肽)有至少70%同一性的序列。
在另一个实施方案中,所述变体包含选自SEQ ID NO:1至10、13至17以及132至134的序列(双子叶植物uORF肽)有至少70%同一性的序列。
构建体
在另一个实施方案中,本发明提供了一种构建体,包含本发明的多核苷酸。
在一个实施方案中,所述多核苷酸可操作地连接至目标核酸序列。
在另一个实施方案中,所述多核苷酸与核酸序列在自然界中通常不相连。
在另一个实施方案中,所述目标核酸序列编码目标蛋白。
多核苷酸的活性
在一个实施方案中,本发明的多核苷酸受到化合物的调控。
在该实施方案中,可操作地连接至本发明的多核苷酸的任意核酸序列的表达受到所述化合物的调控。
在一个优选的实施方案中,调控为转录后的。
优选地,由可操作地连接的核酸编码的多肽的表达受到化合物的调控。
在一个实施方案中,所述可操作地连接的核酸的表达是由所述化合物与所述uORF肽之间的相互作用调控的,所述uORF肽由本发明的多核苷酸表达。在一个实施方案中,相互作用是直接的。在另一个实施方案中,相互作用是间接的。在另一个实施方案中,该间接相互作用是通过另一种蛋白进行的。
在一个实施方案中,所述化合物为抗坏血酸、或相关代谢物。在一个优选的实施方案中,所述化合物为抗坏血酸。
在如上所述修饰时,所述多核苷酸可能不再受到所述化合物的调控。该实施方案的应用可以在经修饰的多核苷酸序列的控制下表达GGP编码序列。在该实施方案中,所述修饰导致该化合物阻遏的减轻或消除。当该化合物为抗坏血酸时,这导致对GGP翻译阻遏的降低,因此导致了升高的GGP产生和升高的抗坏血酸积聚。在该实施方案中,uORF或uORF编码序列的修饰可能处于启动子和5'-UTR序列中。完整GGP启动子和5'-UTR序列的例子参见SEQID NO:101至107或其变体。在启动子和5'-UTR序列中,使用经修饰的uORF可保留天然GGP序列的一些时空表达,而不会导致抗坏血酸经由uORF多肽对GGP翻译的阻遏。
细胞
在另一个实施方案中,本发明提供了一种细胞,包含本发明的多核苷酸或本发明的构建体。
优选地,所述细胞或其前体细胞已经经过遗传修饰从而包含了本发明的多核苷酸或本发明的构建体。
优选地,所述细胞或其前体细胞已经经过转化从而包含了本发明的多核苷酸或本发明的构建体。
植物细胞和植物
在另一个实施方案中,本发明提供了一种植物细胞或植物,其包含本发明的多核苷酸或本发明的构建体。
优选地,所述植物细胞或植物、或其前体植物细胞或植物已经经过遗传修饰从而包含了本发明的多核苷酸或本发明的构建体。
优选地,所述植物细胞或植物、或其前体植物细胞或植物已经经过转化从而包含了本发明的多核苷酸或本发明的构建体。
还表达差向异构酶
在一个实施方案中,所述细胞或植物还经过遗传修饰或经过转化从而表达编码GDP-D-甘露糖差向异构酶的多核苷酸。
优选地,所述细胞或植物还包含本发明的表达构建体,所述表达构建体能够表达GDP-D-甘露糖差向异构酶。
植物部分或繁殖体
在另一个实施方案中,本发明提供了一种植物部分或繁殖体,其包含本发明的多核苷酸或本发明的构建体。
优选地,所述植物部分或繁殖体、或其前体植物细胞或植物已经经过遗传修饰从而包含了本发明的多核苷酸或本发明的构建体。
优选地,所述植物部分或繁殖体、或其前体植物细胞或植物已经经过转化从而包含了本发明的多核苷酸或本发明的构建体。
在另一个方面,本发明提供了一种在细胞中控制或调节至少一种核酸序列的表达的方法,包括用本发明的多核苷酸或构建体转化所述细胞。
在另一个方面,本发明提供了一种在植物细胞或植物中控制或调节至少一种核酸序列的表达的方法,包括用本发明的多核苷酸或构建体转化植物细胞或植物。
在另一个方面,本发明提供了一种制备具有修饰基因表达的细胞的方法,所述方法包括用本发明的多核苷酸或构建体转化所述细胞。
在另一个方面,本发明提供了一种制备具有修饰基因表达的植物细胞或植物的方法,所述方法包括用本发明的多核苷酸或构建体转化植物细胞或植物。
在另一个方面,本发明提供了一种改变植物表型的方法,所述方法包括将本发明的多核苷酸或构建体稳定整合进所述植物的基因组中。
本领域技术人员能够理解,将本发明的多核苷酸引入细胞、植物细胞或植物中可能导致在这些序列引入之前,对与核酸序列可操作地连接的序列的调节或控制。在这样的实施方案中,本发明的多核苷酸和可操作地连接的目标核酸将一起引入到例如本发明的构建体中。
在可选的实施方案中,本发明的多核苷酸可***基因组,并控制或调节***位点附近的核酸序列(如编码蛋白质的核酸序列)的表达。
在一个优选的实施方案中,所述细胞、植物细胞或植物产生这样的化合物,所述化合物通过引入的本发明的多核苷酸、或是通过由引入的本发明的多核苷酸编码的uORF多肽调控或控制表达。
可选地,所述化合物可施用于细胞、植物细胞或植物。
在另一个方面,本发明提供了由本发明的方法制备的植物细胞或植物。
在一个方面,本发明提供了一种制备具有以下至少一者的植物细胞或植物的方法:
a)增多的GGP翻译,
b)增多的GGP产生,
c)增强的GGP活性,以及
d)增多的抗坏血酸产生,
所述方法包括在所述植物细胞或植物中GGP基因的5’-UTR的修饰。
在一个实施方案中,所述5'-UTR位于选自SEQ ID NO:101至107(具有启动子5'-UTR的GGP基因组序列)中任一者或其变体的多核苷酸序列中。
优选地,所述变体与SEQ ID NO:101至107(具有启动子5'-UTR的GGP基因组序列)中任一者有至少70%同一性。
在另一个实施方案中,所述5'-UTR具有选自SEQ ID NO:81至100、以及126至128(完整5'-UTR序列)中任一者或其变体的多核苷酸序列。
优选地,所述变体与SEQ ID NO:81至100、以及126至128(完整5'-UTR序列)中任一者有至少70%同一性。
在一个优选的实施方案中,所述修饰位于5'-UTR中的uORF序列中。
在一个优选的实施方案中,所述uORF具有选自SEQ ID NO:41至60、以及129至131(uORF DNA序列)中任一者或其变体的序列。
在一个优选的实施方案中,所述变体与SEQ ID NO:41至60、以及129至131(uORFDNA序列)中任一者有至少70%同一性。
在一个优选的实施方案中,所述变体与SEQ ID NO:41至50、53至57、以及129至131(双子叶植物uORF DNA序列)中任一者有至少70%同一性。
在另一个实施方案中,所述变体包含与选自SEQ ID NO:61至80、以及138至140(uORF DNA序列保守区域)中任一者有至少70%同一性的序列。
在另一个实施方案中,所述变体包含选自SEQ ID NO:61至80、以及138至140(uORFDNA序列保守区域)中任一者的序列。
在另一个实施方案中,所述变体包含与选自SEQ ID NO:61至70、73至77、以及138至140(双子叶植物uORF DNA序列保守区域)中任一者有至少70%同一性的序列。
在另一个实施方案中,所述变体包含SEQ ID NO:61至70、73至77、以及138至140(双子叶植物uORF DNA序列保守区域)中任一者的序列。
在另一个实施方案中,所述uORF具有选自SEQ ID NO:1至20、以及132至134(uORF多肽序列)中任一者或其变体的序列。
在另一个实施方案中,所述变体包含与选自SEQ ID NO:1至20、以及132至134(uORF多肽序列)中任一者有至少70%同一性的序列。
在另一个实施方案中,所述变体包含选自SEQ ID NO:1至20、以及132至134(uORF多肽序列)中任一者的序列。
在另一个实施方案中,所述变体包含与选自SEQ ID NO:1至10、13至17以及132至134(双子叶植物uORF多肽序列)中任一者有至少70%同一性的序列。
在另一个实施方案中,所述变体包含选自SEQ ID NO:1至10、13至17以及132至134(双子叶植物uORF多肽序列)中任一者的序列。
在另一个实施方案中,所述变体包含与选自SEQ ID NO:21至40、以及135至137(uORF多肽序列的保守区域)中任一者有至少70%同一性的序列。
在另一个实施方案中,所述变体包含SEQ ID NO:21至40、以及135至137(uORF多肽序列的保守区域)中任一者的序列。
在另一个实施方案中,所述变体包含与选自SEQ ID NO:21至30、33至37以及135至137(双子叶植物uORF多肽序列的保守区域)中任一者有至少70%同一性的序列。
在另一个实施方案中,所述变体包含SEQ ID NO:21至30、33至37以及135至137(双子叶植物uORF多肽序列的保守区域)中任一者的序列。
在一个实施方案中,所述变体或片段包含与氨基酸序列SEQ ID NO:108(uORF肽共有基序)有至少70%同一性的序列。
在另一个实施方案中,所述变体或片段包含氨基酸序列SEQ ID NO:108(uORF肽共有基序)。
修饰
在一个实施方案中,所述修饰为在编码5'-UTR的序列中至少一个核苷酸的缺失、添加或置换。
在一个实施方案中,所述修饰减少、干扰或阻止uORF多肽的翻译,所述uORF多肽具有与SEQ ID NO:1和20、以及132至134(uORF肽)中任一者或其变体的序列。
在另一个实施方案中,所述修饰减少、干扰或破坏uORF多肽的活性,所述uORF多肽具有SEQ ID NO:1和20、以及132至134(uORF肽)中任一者或其变体的序列。
在一个实施方案中,所述变体包含与SEQ ID NO:1和20、以及132至134(uORF肽)中任一者有至少70%同一性的序列。
在另一个实施方案中,所述变体包含与SEQ ID NO:1至10、13至17以及132至134(双子叶植物uORF肽)中任一者有至少70%同一性的序列。
在另一个实施方案中,所述变体包含与SEQ ID NO:21至40、以及135至137(uORF肽保守区域)中至少一者有至少70%同一性的序列。
在另一个实施方案中,所述变体包含SEQ ID NO:21至40、以及135至137(uORF肽保守区域)中至少一者的序列。
在另一个实施方案中,所述变体包含与SEQ ID NO:21至30、33至37以及135至137(双子叶植物uORF肽保守区域)中至少一者有至少70%同一性的序列。
在另一个实施方案中,所述变体包含SEQ ID NO:21至30、33至37以及135至137(双子叶植物uORF肽保守区域)中至少一者的序列。
在一个实施方案中,所述变体或片段包含与氨基酸序列SEQ ID NO:108(uORF肽共有基序)有至少70%同一性的序列。
在另一个实施方案中,所述变体或片段包含氨基酸序列SEQ ID NO:108(uORF肽共有基序)。
在另一个方面,本发明提供了一种筛选具有以下至少一者的植物的方法:
a)增多的GGP翻译,
b)增多的GGP产生,
c)增强的GGP活性,以及
d)增多的抗坏血酸产生,
所述方法包括在检测植物是否存在本发明的多核苷酸的第一多态性,或与所述第一多态性相关的另一多态性。
在一个实施方案中,第一多态性的存在、或与所述第一多态性相关的另一多态性的存在表明具有a)至d)中任一者。
在另一个实施方案中,另一多态性与第一多态性有连锁不平衡(LD)。
在另一个实施方案中,所述方法包括从一种或多种未经筛选的植物中分离选定的植物。
在另一个方面,本发明提供了由本发明的方法选定的植物。
在另一个方面,本发明提供了一种由本发明的方法选定的一组植物。优选地,该组包含至少2种、更优选至少3种、更优选至少4种、更优选至少5种、更优选至少6种、更优选至少7种、更优选至少8种、更优选至少9种、更优选至少10种、更优选至少11种、更优选至少12种、更优选至少13种、更优选至少14种、更优选至少15种、更优选至少16种、更优选至少17种、更优选至少18种、更优选至少19种、更优选至少20种植物。
在另一个方面,本发明提供了一种制备抗坏血酸的方法,所述方法包括从本发明的植物细胞或植物中提取抗坏血酸。
在另一个方面,本发明提供了一种针对本发明的多核苷酸的抗体。在另一个方面,本发明提供了一种对本发明的多核苷酸有特异性的抗体。
本发明的多核苷酸、多肽、变体或片段可以来源于任意物种。所述多核苷酸、多肽、变体或片段可以是自然存在的或非自然存在的。多核苷酸、多肽、变体或片段可以由重组制备,也可以是“基因改组”方法的产物。
在一个实施方案中,所述多核苷酸、多肽、变体或片段来源于任意植物物种。在本发明的方法中用于转化或修饰的植物可以来源于任意植物物种。在本发明的方法中用于转化或修饰的细胞可以来源于任意植物物种。
在另一个实施方案中,所述植物来源于裸子植物物种。
在另一个实施方案中,所述植物来源于被子植物物种。
在另一个实施方案中,所述植物来源于双子叶植物物种。
在另一个实施方案中,所述植物来源于选自下列但不限于下列属的水果物种:猕猴桃属(Actinidia)、苹果属(Malus)、柑橘属(Citrus)、草莓属(Fragaria)或越桔属(Vaccinium)。
特别优选的水果植物物种是:美味猕猴桃(Actidinia deliciosa)、中华猕猴桃(A.chinensis)、毛花猕猴桃(A.eriantha)、软枣猕猴桃(A.arguta)、四种猕猴桃物种的杂交品种、苹果(Malus domestica)和三叶海棠(Malus sieboldii)。
在另一个实施方案中,所述植物选自由下列物种构成的组:毛花猕猴桃(Actinidia eriantha)、黄瓜(Cucumis sativus)、大豆(Glycine max)、番茄(Solanumlycopersicum)、葡萄(Vitis vinifera)、拟南芥(Arabidopsis thaliana)、苹果(Malus xdomesticus)、蒺藜苜蓿(Medicago truncatula)、毛果杨(Populus trichocarpa)、软枣猕猴桃(Actinidia arguta)、中华猕猴桃(Actinidia chinensis)、草莓(Fragariavulgaris)、马铃薯(Solanum tuberosum)和玉米(Zea mays)。
在另一个实施方案中,所述植物选自来源于下列但不限于下列属的蔬菜物种:芸苔属(Brassica)、番茄属(Lycopersicon)和茄属(Solanum)。
特别优选的蔬菜植物物种是:番茄和马铃薯。
在另一个实施方案中,所述植物来源于单子叶植物物种。
在另一个实施方案中,所述植物选自来源于下列但不限于下列属的农作物物种:大豆属(Glycine)、玉蜀黍属(Zea)、大麦属(Hordeum)和稻属(Oryza)。
特别优选的农作物物种是:水稻(Oryza sativa)、大豆和玉米。
在另一个实施方案中,所述植物选自由下列物种构成的组:毛花猕猴桃、黄瓜、大豆、番茄、葡萄、拟南芥、苹果、蒺藜苜蓿、毛果杨、软枣猕猴桃、中华猕猴桃、草莓、马铃薯和玉米。
发明详述
在本说明书中引用专利说明书、其他外部文件或其他来源的信息处,通常是为讨论本发明的特征提供的背景。除非另外特别说明,否则对这类外部文献的参考不应解释为以任何权限承认这类文献、或这类信息来源是现有技术、或形成本领域的一般公知常识的一部分。
本说明书中所使用的术语“包含”意味着“至少由...部分组成”。当在本说明书中解释每个包括术语“包含”的陈述时,其他特征或者那些以该术语开始的特征也可存在。相关术语如“包括”和“含有”以相同方式解释。
在某些实施方案中,术语“包含”及其相关术语可以用“由...构成”及其相关术语替代。
多核苷酸和片段
本文中所用术语“多核苷酸”是指,任何长度但优选至少15个核苷酸的单链或双链脱氧核糖核苷酸或核糖核苷酸聚合物,包括以下非限制性实例:基因的编码及非编码序列、有义及反义互补序列、外显子、内含子、基因组DNA、cDNA、pre-mRNA、mRNA、rRNA、siRNA、miRNA、tRNA、核酸酶、重组多肽、分离和纯化的天然存在的DNA或RNA序列、合成的RNA和DNA序列、核酸探针、引物和片段。
优选地,术语“多核苷酸”包括指定序列及其互补序列。
本文提供的多核苷酸序列的“片段”是连续核苷酸的子序列,例如至少长度为15个核苷酸的序列。本发明所述的片段包含本发明所述的多核苷酸的连续核苷酸中的15个核苷酸,优选至少20个核苷酸,更优选至少30个核苷酸,更优选至少50个核苷酸,更优选至少60个核苷酸。
术语“引物”是指通常有自由的3’OH的短的多核苷酸,其与模板杂交并用于引发与靶体互补的多核苷酸的聚合。
多肽和片段
本文中所用术语“多肽”包括任何长度但优选至少5个氨基酸的氨基酸链,包括全长蛋白,其中氨基酸残基通过共价肽键相连。本发明的多肽可为纯化的天然产物,或可使用重组或合成技术部分地或整体地制备。该术语可指多肽、多肽的聚体(如二聚体或其他多聚体)、融合多肽、多肽片段、多肽变体或其衍生物。
多肽的“片段”是多肽的子序列。优选地,所述片段执行对于该多肽的生物学活性所需的功能和/或提供该多肽的三维结构。
本发明用于多核苷酸或多肽序列的术语“分离的”是指从它们的天然细胞环境中提取出来的序列。在一个实施方案中,所述序列从其自然界发现的侧翼序列中分离出来。分离的分子可通过任何方法或方法的组合获得,包括生物化学的、重组的及合成的技术。
术语“重组”是指在其天然环境中从其周围的序列中提取出来的多核苷酸序列,和/或与其在天然环境中不存在的序列重组的多核苷酸序列。
通过从“重组的”多核苷酸序列翻译,制备“重组的”多肽序列。
就源自特定属或种的本发明的多核苷酸或多肽而言,术语“源自”是指,所述多核苷酸或多肽具有与在该属或种中天然发现的多核苷酸或多肽相同的序列。源自特定属或种的多核苷酸或多肽因此可以合成地或重组地产生。
变体
本文中所用术语“变体”是指,不同于具体鉴别出的序列的多核苷酸或多肽序列,其中缺失、置换或添加了一个或多个核苷酸或氨基酸残基。变体可为天然存在的等位基因变体或非天然存在的变体。变体可来自同一物种或来自其它物种,且可包括同系物、旁系同源物及直系同源物。在某些实施方案中,本发明多肽的变体具有与本发明多肽相同或类似的生物活性。就多肽而言,术语“变体”包括所有形式的多肽和如本文所定义的多肽。
多核苷酸变体
变体多核苷酸序列优选地与本发明的序列表现出至少50%、更优选至少51%、更优选至少52%、更优选至少53%、更优选至少54%、更优选至少55%、更优选至少56%、更优选至少57%、更优选至少58%、更优选至少59%、更优选至少60%、更优选至少61%、更优选至少62%、更优选至少63%、更优选至少64%、更优选至少65%、更优选至少66%、更优选至少67%、更优选至少68%、更优选至少69%、更优选至少70%、更优选至少71%、更优选至少72%、更优选至少73%、更优选至少74%、更优选至少75%、更优选至少76%、更优选至少77%、更优选至少78%、更优选至少79%、更优选至少80%、更优选至少81%、更优选至少82%、更优选至少83%、更优选至少84%、更优选至少85%、更优选至少86%、更优选至少87%、更优选至少88%、更优选至少89%、更优选至少90%、更优选至少91%、更优选至少92%、更优选至少93%、更优选至少94%、更优选至少95%、更优选至少96%、更优选至少97%、更优选至少98%和最优选至少99%的同一性。在本发明的核苷酸的至少20个核苷酸位置、优选至少50个核苷酸位置、更优选至少100个核苷酸位置且最优选本发明多核苷酸的全长范围的比较窗口上,存在同一性。
可以如下方式测定多核苷酸序列同一性。在bl2seq(Tatiana A.Tatusova,ThomasL.Madden(1999),“Blast 2sequences-a new tool for comparing protein andnucleotide sequences”,FEMS Microbiol Lett.174:247-250)中,使用BLASTN(来自BLAST程序套件,2.2.5版[2002年11月]),将主题多核苷酸序列与候选多核苷酸序列进行比较,所述bl2seq可从NCBI(ftp://ftp.ncbi.nih.gov/blast/)公开获得。除应关闭对低复杂性部分的过滤以外,利用bl2seq的预设参数。
可使用以下unix命令行参数检验多核苷酸序列的同一性:
bl2seq–i nucleotideseq1–j nucleotideseq2–F F–p blastn
参数-F F关闭对低复杂性区段的过滤。参数-p为序列对选出适当算法。bl2seq程序在“Identities=”行中将序列同一性报告为相同核苷酸的数量及百分比。
使用总体序列比对程序(例如Needleman,S.B.和Wunsch,C.D.(1970)J.Mol.Biol.48,443-453),也可以在候选序列与主题多核苷酸序列之间的重叠部分的整个长度上计算多核苷酸序列同一性。Needleman-Wunsch总体比对算法的一个完整实现,参见EMBOSS套件(Rice,P.Longden,I.and Bleasby,A.EMBOSS:The European MolecularBiology Open Software Suite,Trends in Genetics June 2000,第16卷,第6期,第276-277页)中的needle程序。该EMBOSS套件可从http://www.hgmp.mrc.ac.uk/Software/EMBOSS/得到。EuropeanBioinformatics Institute服务器也在http:/www.ebi.ac.uk/emboss/align/上在线提供执行两个序列之间的EMBOSS-needle总体比对的工具。
或者,可使用GAP程序,其计算两个序列在无处罚末端空隙的情况下的最佳总体比对。GAP描述在以下论文中:Huang,X.(1994)On Global Sequence Alignment.ComputerApplications in the Biosciences 10,227-235。
计算多核苷酸%序列同一性的优选方法是基于使用Clustal X(Jeanmougin等人,1998,Trends Biochem.Sci.23,403-5.)对比待比较的序列。
本发明的多核苷酸变体也涵盖这样的变体:所述变体展现与可能保留那些序列的功能等效性的一个或多个特别鉴别的序列的相似性,且不能恰当地预期随机发生。使用从来从NCBI(ftp://ftp.ncbi.nih.gov/blast/)的BLAST程序套件(2.2.5版[2002年11月])可公开获得的bl2seq程序,可以测定有关多肽的这种序列相似性。
可使用以下unix命令行参数检验多核苷酸序列的相似性:
bl2seq–i nucleotideseq1–j nucleotideseq2–F F–p tblastx
参数-F F关闭对低复杂性区段的过滤。参数-p为序列对选出适当算法。该程序发现序列之间的相似性区域,且为每个这样的区域报导一个“E值”,所述E值为预期在含有随机序列的固定参考尺寸的数据库中找到该偶然匹配的预期次数。此数据库的尺寸是由bl2seq程序中的默认值设定。对于远小于1的小E值而言,E值大致为这样的随机匹配的机率。
当与任一个特别鉴别的序列相比较时,变体多核苷酸序列优选地表现出小于1x10-6、更优选地小于1x 10-9、更优选地小于1x10-12、更优选地小于1x 10-15、更优选地小于1x10-18、更优选地小于1x 10-21、更优选地小于1x 10-30、更优选地小于1x 10-40、更优选地小于1x 10-50、更优选地小于1x 10-60、更优选地小于1x 10-70、更优选地小于1x 10-80、更优选地小于1x 10-90和最优选地小于1x 10-100的E值。
或者,本发明的变体多核苷酸在严谨条件下与指定的多核苷酸序列或其互补序列杂交。
术语“在严谨条件下杂交”及其语法等效描述是指,多核苷酸分子在限定的温度及盐浓度条件下与靶多核苷酸分子(诸如固定于DNA或RNA印迹(诸如DNA印迹或RNA印迹)上的靶多核苷酸分子)杂交的能力。通过最初在更低严谨性条件下杂交,随后将严谨性增加至希望的严谨性,可以测定在严谨杂交条件下杂交的能力。
关于长度大于约100个碱基的多核苷酸分子,典型的严谨杂交条件为,比天然双链体的解链温度(Tm)低不超过25至30℃(例如10℃)(一般参见,Sambrook等人编,1987,Molecular Cloning,A Laboratory Manual,第2版.Cold Spring Harbor Press;Ausubel等人,1987,Current Protocols in Molecular Biology,Greene Publishing)。大于约100个碱基的多核苷酸分子的Tm可通过下式来计算:Tm=81.5+0.41%(G+C-log(Na+).(Sambrook等人,Eds,1987,Molecular Cloning,A Laboratory Manual,第2版.ColdSpring Harbor Press;Bolton and McCarthy,1962,PNAS 84:1390)。长度大于100个碱基的多核苷酸的典型严谨条件是这样的杂交条件,诸如在6×SSC、0.2%SDS的溶液中预洗涤;在65℃,在6×SSC、0.2%SDS中杂交过夜;随后在1×SSC、0.1%SDS中在65℃进行两次各30分钟的洗涤,并在0.2×SSC、0.1%SDS中在65℃进行两次各30分钟的洗涤。
关于长度小于100个碱基的多核苷酸分子,示例性的严谨杂交条件是,比Tm低5至10℃。平均而言,长度小于100碱基对的多核苷酸分子的Tm降低大约(500/寡核苷酸长度)℃。
关于称为肽核酸(PNA)的DNA模拟物(Nielsen等人,Science.1991年12月6日;254(5037):1497-500),Tm值高于DNA-DNA或DNA-RNA杂交物的Tm值,且可使用Giesen等人,Nucleic Acids Res.1998年11月1日;26(21):5004-6中所述的公式来计算。长度小于100个碱基的DNA-PNA杂交物的示例性的严谨杂交条件为,比Tm低5至10℃。
本发明的变体多核苷酸也涵盖这样的多核苷酸:其不同于本发明的序列,但因遗传密码的简并性而编码具有与由本发明的多核苷酸所编码的多肽相似的活性的多肽。不改变多肽的氨基酸序列的序列变化是“沉默修饰”。除ATG(甲硫氨酸)和TGG(色氨酸)以外,同一氨基酸的其它密码子可通过本领域认可的技术发生改变,例如,以优化在特定宿主有机体中的密码子表达。
引起编码的多肽序列中的一个或若干个氨基酸的保守置换但不显著改变其生物活性的多核苷酸序列变化,也包括于本发明中。技术人员知晓制造表型沉默的氨基酸置换的方法(参见,例如,Bowie等人,1990,Science 247,1306)。
使用从NCBI(ftp://ftp.ncbi.nih.gov/blast/)公开获得的来自BLAST程序套件(2.2.5版[2002年11月])的bl2seq程序,通过先前所述的tblastx算法,可以测定由于编码的多肽序列中的沉默修饰及保守置换而产生的变体多核苷酸。
本发明所述的变体多核苷酸作为GGP的功能可通过(例如)如在实施例的部分所述的通过这种序列在细菌中的表达,并检测其编码的蛋白质的活性而评价。变体的功能还可通过其改变植物中的GGP活性或抗坏血酸含量的能力而检测,该方法在本文的实施例的部分也做了描述。
本发明所述的变体多核苷酸作为GDP-D-甘露糖差向异构酶的功能可通过(例如)如在实施例的部分所述的通过这种序列在细菌中的表达,并检测其编码的蛋白质的活性而评价。变体的功能还可通过其改变植物中的GDP-D-甘露糖差向异构酶活性或抗坏血酸含量的能力而检测,该方法在本文的实施例的部分也做了描述。
多肽变体
就多肽而言,术语“变体”涵盖天然存在的、重组地和合成地生产的多肽。变体多肽序列优选地与本发明的序列表现出至少50%、更优选至少51%、更优选至少52%、更优选至少53%、更优选至少54%、更优选至少55%、更优选至少56%、更优选至少57%、更优选至少58%、更优选至少59%、更优选至少60%、更优选至少61%、更优选至少62%、更优选至少63%、更优选至少64%、更优选至少65%、更优选至少66%、更优选至少67%、更优选至少68%、更优选至少69%、更优选至少70%、更优选至少71%、更优选至少72%、更优选至少73%、更优选至少74%、更优选至少75%、更优选至少76%、更优选至少77%、更优选至少78%、更优选至少79%、更优选至少80%、更优选至少81%、更优选至少82%、更优选至少83%、更优选至少84%、更优选至少85%、更优选至少86%、更优选至少87%、更优选至少88%、更优选至少89%、更优选至少90%、更优选至少91%、更优选至少92%、更优选至少93%、更优选至少94%、更优选至少95%、更优选至少96%、更优选至少97%、更优选至少98%和最优选至少99%同一性。在本发明的多肽的至少20个氨基酸位置、优选至少50个氨基酸位置、更优选至少100个氨基酸位置且最优选整个长度的比较窗上,存在同一性。
多肽序列同一性可以如下方式测定。在bl2seq中使用BLASTP(来自BLAST程序套件,2.2.5版[2002年11月])将主题多肽序列与候选多肽序列进行比较,bl2seq可从NCBI(ftp://ftp.ncbi.nih.gov/blast/)公开获得。除应关闭对低复杂性区域的过滤以外,利用bl2seq的默认参数。
使用总体序列比对程序,也可在候选序列与主题多核苷酸序列之间的重叠部分的整个长度上计算多肽序列同一性。如上文所论述的EMBOSS-needle(可获自http:/www.ebi.ac.uk/emboss/align/)及GAP(Huang.X.(1994)On Global SequenceAlignment.Computer Applications in the Biosciences 10,227-235.),也是适用于计算多肽序列同一性的总体序列比对程序。
用于计算多肽%序列同一性的优选方法,是基于使用Clustal X(Jeanmougin等人,1998,Trends Biochem.Sci.23,403-5)比对待比较的序列。
本发明的多肽变体也涵盖这样的多肽变体:其展现与可能保留序列的功能等效性的一个或多个特别鉴别的序列的相似性,且不能恰当预期随机发生。使用从NCBI(ftp://ftp.ncbi.nih.gov/blast/)公开获得的来自BLAST程序套件(2.2.5版[2002年11月])的bl2seq程序,可以测定有关多肽的这种序列相似性。可使用以下unix命令行参数检验多肽序列的相似性:
bl2seq–i peptideseq1–j peptideseq2-F F–p blastp
当与任一个特别鉴别的序列相比较时,变体多肽序列优选地表现出小于1x 10-6、更优选地小于1x 10-9、更优选地小于1x 10-12、更优选地小于1x 10-15、更优选地小于1x 10-18、更优选地小于1x 10-21、更优选地小于1x 10-30、更优选地小于1x 10-40、更优选地小于1x10-50、更优选地小于1x 10-60、更优选地小于1x 10-70、更优选地小于1x 10-80、更优选地小于1x 10-90和最优选地小于1x 10-100的E值。
参数-F F关闭对低复杂性区段的过滤。参数-p为序列对选出适当算法。该程序发现序列之间的相似性区域,且为每一个这样的区域报导一个“E值”,所述E值为预期在含有随机序列的固定参考尺寸的数据库中找到该偶然匹配的预期次数。对于远小于1的小E值而言,E值大致为该随机匹配的机率。
所述多肽序列的一个或若干个氨基酸的保守置换(不显著改变其生物活性)也包括于本发明中。技术人员知晓制造表型沉默的氨基酸置换的方法(参见,例如,Bowie等人,1990,Science 247,1306)。
变体多肽包括这样的多肽,其中氨基酸序列与本文的多肽存在一个或多个保守的氨基酸置换、缺失、添加或***而不影响所述多肽的生物学活性。保守置换通常包括用另一个具有类似性质的另一个氨基酸置换一个氨基酸,例如在下列组内的置换:缬氨酸、甘氨酸;甘氨酸、丙氨酸;缬氨酸、异亮氨酸、亮氨酸;天冬氨酸、谷氨酸酸;天冬酰胺、谷氨酰胺;丝氨酸、苏氨酸;赖氨酸,精氨酸;以及苯丙氨酸、酪氨酸。
非保守置换将引起这些组中一个组中的成员变为另一组中的成员。
对进化生物学序列的分析示出并非所有序列改变的可能性相等,这至少部分反应了在生物学水平上保守置换与非保守置换之间的差异。例如,某些氨基酸置换可能频繁发生,而其它氨基酸置换却很少发生。氨基酸残基的进化修饰或置换可由记分矩阵(也称为置换矩阵)作为模型。这些矩阵用于生物统计学分析仪鉴定序列之间的关系,一个例子为如下示出的BLOSUM62矩阵(表A)。
表A:含有所有可能置换分数的BLOSUM62矩阵[Henikoff和Henikoff,1992]。
所示的BLOSUM62矩阵用于在对应列和行交叉处的每个比对的氨基酸对生成分数。例如,谷氨酸残基(E)置换为天冬氨酸残基(D)的置换分数为2。对角线示出了未改变的氨基酸的分数。大部分置换的改变分数为负。该矩阵仅包含整数。
据信本领域技术人员熟知如何确定合适的记分矩阵为指定组的序列产生最佳的比对。尽管未做限定,表1所示的BLOSUM62矩阵也用作BLAST检索中的缺省矩阵。
其它变体包括具有能影响肽稳定性的修饰的肽。这样的类似物可包含例如肽序列中的一个或多个非肽键(其替换肽键)。也包括含有天然存在的L-氨基酸之外的残基(如D-氨基酸)、或非天然存在的合成氨基酸(如β或γ氨基酸和环形类似物)的类似物,
多肽变体作为GGP的功能可由本文中实施例的部分所述的方法来评价。
多肽变体作为GDP-D-甘露糖差向异构酶的功能可由本文中实施例的部分所述的方法来评价。
构建体、载体及其组分
术语“遗传构建体”是指多核苷酸分子,通常为双链DNA,其中可能已***另一个多核苷酸分子(***多核苷酸分子),例如,但不限于,cDNA分子。遗传构建体可含有允许转录所述***多核苷酸分子且任选地将转录物翻译为多肽的必需元件。所述***多核苷酸分子可源自宿主细胞,或可源自不同细胞或有机体,和/或可为重组多核苷酸。一旦在宿主细胞内,遗传构建体则可整合进宿主染色体DNA中。所述遗传构建体可连接至载体上。
术语“载体”是指多核苷酸分子,通常为双链DNA,其用于将遗传构建体转运至宿主细胞中。所述载体可能能够在至少一个额外宿主***(诸如大肠杆菌)中复制。
术语“表达构建体”是指这样的遗传构建体:其包括允许转录所述***多核苷酸分子且任选地将转录物翻译为多肽的必需元件。表达构建体通常在5’至3’方向包含:
a)在宿主细胞(构建体将转化进其中)中具有功能的启动子,
b)待表达的多核苷酸,和
c)在宿主细胞(构建体将转化进其中)中具有功能的终止子。
术语“编码区”或“开放读码框”(ORF)是指,能够在适当调控序列控制下生产转录产物和/或多肽的基因组DNA序列或cDNA序列的有义链。在某些情况下,编码序列可通过5’翻译起始密码子和3’翻译终止密码子的存在来鉴别。当***遗传构建体中时,“编码序列”在可操作地连接至启动子及终止子序列的情况下能够被表达。
“可操作地连接”是指,将目的序列,如待表达的序列放置在与含有调控元件的另一序列的控制下,并且通常与所述的另一序列连接,所述调控元件可包括启动子、组织特异性调控元件、临时调控元件、增强子、抑制子及终止子、5'-UTR序列、包括uORF的5'-UTR序列以及uORF。
在一个优选的实施方案中,所述调控元件包括本发明的多核苷酸序列。
优选地,本发明的序列包含5'-UTR序列。优选地所述5'-UTR序列包含uORF。
术语“非编码区”是指,在翻译起始位点的上游并在翻译终止位点的下游的非翻译序列。这些序列也分别称为5’UTR和3’UTR。这些区域包括转录起始及终止及调节翻译效率所需的元件。
5'-UTR序列位于转录起始位点以及翻译起始位点之间。
5'-UTR序列是由基因组DNA编码的mRNA序列。然而,如本文所用,术语5'-UTR序列包括编码5'-UTR序列的基因组序列、以及该基因组序列的互补序列、以及5'-UTR mRNA序列。
终止子为终止转录的序列,且见于翻译序列的下游基因的3’不翻译端。终止子为mRNA稳定性的重要决定因素,且在有些情况下,已发现具有空间调节功能。
术语“uORF”或“上游开放读码框”为这样的mRNA元件,其在5'-UTR由起始密码子(任意三个碱基对密码子,其中至少两个碱基为如下顺序:AUG)限定,其中框终止密码子(UAA、UAG、UGA)主要编码序列的上游(即以5’方向)并且与其不重叠。
术语“启动子”是指,在编码区上游的调节基因转录的顺式调控元件。启动子包含指定转录起始位点的顺式引发元件及保守盒(诸如TATA盒),及被转录因子结合的基序。
“转基因”是这样的多核苷酸:其取自一种有机体,且通过转化引入不同的有机体中。转基因可源自与引入该转基因的有机体物种相同的物种或不同的物种。
“转基因植物”是指,含有经遗传操纵或转化而得到的新遗传物质的植物。所述新遗传物质可源自与所得转基因植物相同的物种或不同物种的植物。
“反向重复序列”是存在重复的序列,其中重复序列的另一半是在互补链中,例如
(5’)GATCTA…….TAGATC(3’)
(3’)CTAGAT…….ATCTAG(5’)
通读转录将产生这样的转录物:其经历互补碱基配对,以形成发夹结构,条件是,在重复区之间存在3-5碱基对间隔物。
涉及本发明的多核苷酸或多肽的术语“改变...的表达”和“表达改变”旨在包含这种情况:本发明的多核苷酸对应的基因组DNA经修饰,从而改变本发明的多核苷酸或多肽的表达。基因组DNA的修饰可通过遗传转化或本领域已知引入突变的其它方法。“表达改变”能与信使RNA和/或产生的多肽的量的增加或减少相关,且还可由于多核苷酸和所产生多肽的序列改变而导致多肽活性改变。
分离或制备多核苷酸的方法
使用本领域普通技术人员已知的多种技术,可以分离本发明的多核苷酸分子。作为实例,通过使用在Mullis等人编,1994版,The Polymerase Chain Reaction,Birkhauser(通过引用并入本文)中所述的聚合酶链式反应(PCR),可以分离这样的多肽。使用源自本发明的多核苷酸序列的如本文所定义的引物,可以扩增本发明的多肽。
用于分离本发明的多核苷酸的其它方法包括:使用具有本文所述的序列的所有或部分多肽作为杂交探针。使标记的多核苷酸探针与固定在固体支持物(诸如硝化纤维素滤膜或尼龙膜)上的多核苷酸杂交的技术,可以用于筛选基因组或cDNA文库。示例性的杂交及洗涤条件为:在65℃,在5.0X SSC、0.5%十二烷基硫酸钠、1X登哈特溶液中杂交20小时;在1.0X SSC、1%(w/v)十二烷基硫酸钠中洗涤(在55℃进行三次各20分钟的洗涤),和任选地在60℃、在0.5×SSC、1%(w/v)十二烷基硫酸钠中洗涤一次(20分钟)。可选的进一步洗涤(20分钟)可在60℃、在0.1×SSC、1%(w/v)十二烷基硫酸钠的条件下进行。
通过本领域中熟知的技术,诸如限制性核酸内切酶消化、寡核苷酸合成及PCR扩增,可以生产本发明的多核苷酸片段。
可在本领域熟知的方法中使用部分多核苷酸序列来鉴别相应的全长多核苷酸序列。这样的方法包括基于PCR的方法、5’RACE(Frohman MA,1993,Methods Enzymol.218:340-56)及基于杂交的方法、基于计算机/数据库的方法。此外,作为实例,反向PCR允许获取未知序列,所述序列侧接本文中所公开的多核苷酸序列,从基于已知区域的引物起始(Triglia等人,1998,Nucleic Acids Res 16,8186,通过引用并入本文)。该方法使用若干限制酶,以产生在基因的已知区域中的合适片段。随后通过分子内连接环化该片段,且将其用作PCR模板。从已知区域设计不同引物。为了以物理方式装配全长克隆,可利用标准分子生物学方法(Sambrook等,Molecular Cloning:A Laboratory Manual,第2版,Cold SpringHarbor Press,1987)。
当从特定物种生产转基因植物时,有益地用源自该物种的一个或多个序列转化这样的植物。所述益处可以是,减少公众对于生产转基因有机体中的跨物种转化的关注。另外,当基因减量调节是希望的结果时,可能必须利用与需要减少其表达的植物中的序列相同(或至少高度相似)的序列。尤其出于这些原因,希望能够在若干不同植物物种中鉴别及分离特定基因的直系同源物。
变体(包括直系同源物)可通过所述方法来鉴别。
鉴别变体的方法
物理方法
变体多肽可使用基于PCR的方法来鉴别(Mullis等人编,1994 The PolymeraseChain Reaction,Birkhauser)。通常,引物的多核苷酸序列用于通过PCR扩增本发明的多核苷酸分子的变体,所述引物的多核苷酸序列可以是基于编码相应氨基酸序列的保守区的序列。
或者,可使用本领域技术人员熟知的文库筛选法(Sambrook等人,MolecularCloning:A Laboratory Manual,第2版,Cold Spring Harbor Press,1987)。当鉴别探针序列的变体时,通常相对地降低杂交和/或洗涤严谨性,直至找到确切序列匹配。
也可通过物理方法鉴别多肽变体,例如使用针对本发明多肽产生的抗体筛选表达文库(Sambrook等人,Molecular Cloning:A Laboratory Manual,第2版,Cold SpringHarbor Press,1987),或借助于这样的抗体鉴别来自天然来源的多肽。
基于计算机的方法
通过本领域技术人员熟知的基于计算机的方法,使用公共域序列比对算法及用于搜寻序列数据库的序列相似性搜寻工具(公共域数据库包括Genbank、EMBL、Swiss-Prot、PIR和其它),也可以鉴别本发明的变体序列(包括多核苷酸及多肽变体)。关于在线资源的实例,参见,例如,Nucleic Acids Res.29:1-10和11-16,2001。相似性搜寻会检索及比对目标序列,以供与待分析的序列(即,查询序列)进行比较。序列比较算法使用计分矩阵来为每一比对指派总分。
可用于鉴别序列数据库中的变体的程序的一个示例性家族为BLAST程序套件(2.2.5版[2002年11月]),包括BLASTN、BLASTP、BLASTX、tBLASTN和tBLASTX,它们可从(ftp://ftp.ncbi.nih.gov/blast/)或国家生物技术信息中心(National Center forBiotechnology Information,NCBI)、国立医学图书馆(National Library of Medicine,Building 38A,Room 8N805,Bethesda,MD 20894USA)公开获得。NCBI服务器也提供了使用程序来筛选许多可公开获得的序列数据库的设施。BLASTN对照核苷酸序列数据库比较核苷酸查询序列。BLASTP对照蛋白序列数据库比较氨基酸查询序列。BLASTX对照蛋白序列数据库比较在所有阅读框架中翻译的核苷酸查询序列。tBLASTN对照核苷酸序列数据库比较在所有阅读框架中动态翻译的蛋白查询序列。tBLASTX对照核苷酸序列数据库的六-框架翻译物比较核苷酸查询序列的六-框架翻译物。BLAST程序可以预设参数来使用,或可视需要改变参数以改进筛选。
算法的BLAST家族(包括BLASTN、BLASTP及BLASTX)的应用,描述于Altschul等人,Nucleic Acids Res.25:3389-3402,1997的出版物中。
通过BLASTN、BLASTP、BLASTX、tBLASTN、tBLASTX或相似算法产生的查询序列对一个或多个数据库序列的“命中”,会比对及鉴别序列的相似部分。以相似性程度及序列重叠部分的长度的顺序,排列命中。命中一个数据库序列,一般表示仅在查询序列的一小部分序列长度上具有重叠。
BLASTN、BLASTP、BLASTX、tBLASTN及tBLASTX算法也产生比对的“预期”值。预期值(E)指示,当搜寻含有随机邻接序列的相同尺寸的数据库时,可“预期”偶然见到的命中数目。预期值系用作判定命中数据库是否表明真正相似性的有效阈值。例如,指派给多核苷酸命中的0.1的E值解释为是指,在所筛选数据库的尺寸的数据库中,可能预期在具有相似分数的序列的比对部分上仅偶然见到0.1匹配。对于在比对及匹配部分上具有0.01或小于0.01的E值的序列而言,使用BLASTN、BLASTP、BLASTX、tBLASTN或tBLASTX算法发现数据库中偶然匹配的机率为1%或1%以下。
可以用CLUSTALW(Thompson,J.D.,Higgins,D.G.and Gibson,T.J.(1994)CLUSTALW:improving the sensitivity of progressive multiple sequence alignmentthrough sequence weighting,positions-specific gap penalties and weight matrixchoice.Nucleic Acids Research,22:4673-4680,http://www-igbmc.u-strasbg.fr/ BioInfo/ClustalW/Top.html)或T-COFFEE(Cedric Notredame,Desmond G.Higgins,JaapHeringa,T-Coffee:A novel method for fast and accurate multiple sequencealignment,J.Mol.Biol.(2000)302:205-217)),或使用渐进成对比对的PILEUP(Feng和Doolittle,1987,J.Mol.Evol.25,351),进行一组相关序列的多重序列比对。
可利用图样识别软件应用来找到基序或标签序列。例如,MEME(用于基序引出的多个Em)在一组序列中找到基序及标签序列,且MAST(基序比对及搜寻工具)使用这些基序在查询序列中鉴别相似或相同基序。提供MAST结果作为与适当统计资料及所找到基序的目视全览的一系列比对。在圣地亚哥的加利福尼亚大学(University of California,SanDiego)开发出MEME和MAST。
PROSITE(Bairoch和Bucher,1994,Nucleic Acids Res.22,3583;Hofmann等人,1999,Nucleic Acids Res.27,215)是鉴别从基因组或cDNA序列翻译的未表征蛋白的功能的方法。PROSITE数据库(www.expasy.org/prosite)含有生物学显著图样及特性,且被设计成使得其可与适当计算工具一起使用,以向已知蛋白家族指派新序列或判定哪个已知域存在于该序列中(Falquet等人,2002,Nucleic Acids Res.30,235)。Prosearch是可以用既定序列图样或标签搜寻SWISS-PROT及EMBL数据库的工具。
分离多肽的方法
本发明的多肽(包括变体多肽)可使用本领域中熟知的肽合成方法来制备,诸如使用固相技术进行直接肽合成(例如Stewart等人,1969,Solid-Phase Peptide Synthesis,WH Freeman Co,San Francisco California),或(例如)使用Applied Biosystems 431A肽合成仪(Foster City,California)进行自动合成。多肽的突变形式也可在所述合成期间产生。
本发明的多肽及变体多肽也可使用本领域中熟知的多种技术(例如Deutscher编,1990,Methods in Enzymology,第182卷,Guide to Protein Purification)从天然来源纯化。
或者,本发明的多肽及变体多肽可在合适的宿主细胞中重组表达,并与细胞分离,如下文所论述。
修饰序列的方法
对蛋白质序列、或编码所述蛋白质序列的多核苷酸序列进行修饰的方法是本领域技术人员熟知的。可以通过改变/修饰编码蛋白质的序列并表达经修饰的蛋白质来方便地修饰蛋白质序列。诸如定点突变等方法也可以用于修饰现有的多核苷酸序列。或者,可使用限制性内切酶来切割现有序列的部分。改变的多核苷酸序列也可以方便地以修饰的形式表达。
制备构建体及载体的方法
本发明的遗传构建体包含一个或多个本发明的多核苷酸序列和/或编码本发明的多肽的多核苷酸,且可用于转化例如细菌、真菌、昆虫、哺乳动物或植物有机体。本发明的遗传构建体意欲包括如本文中所定义的表达构建体。
生产及使用遗传构建体及载体的方法是本领域中熟知的,且一般描述于:Sambrook等人,Molecular Cloning:A Laboratory Manual,第2版,Cold Spring HarborPress,1987;Ausube1等人,Current Prot
生产包含多核苷酸、构建体或载体的宿主细胞的方法
本发明提供了一种宿主细胞,其包含本发明的遗传构建体或载体。宿主细胞可以来源于例如细菌、真菌、昆虫、哺乳动物或植物有机体。
包含本发明的遗传构建体(诸如表达构建体)的宿主细胞可用于本领域熟知的方法中(例如Sambrook等人,Molecular Cloning:A Laboratory Manual,第2版Cold SpringHarbor Press,1987;Ausubel 等人,Current Protocols in Molecular Biology,GreenePublishing,1987),用于重组生产本发明的多肽。这样的方法可能包括,在适用于或有助于表达本发明的多肽的条件下,在适当介质中培养宿主细胞。随后,通过本领域熟知的方法(例如Deutscher编,1990,Methods in Enzymology,第182卷,Guide to ProteinPurification),可以将表达的重组多肽(其可以任选地分泌至培养物中)与介质、宿主细胞或培养基分离。
生产包含构建体及载体的植物细胞及植物的方法
本发明另外提供了包含本发明的遗传构建体的植物细胞,及经修饰以改变本发明多核苷酸或多肽的表达的植物细胞。包含这样的细胞的植物也形成本发明的一个方面。
用多肽转化植物细胞、植物及其部分的方法,参见:Draper等人,1988,PlantGenetic转化and Gene Expression.A Laboratory Manual.Blackwell Sci.Pub.Oxford,第365页;Potrykus and Spangenburg,1995,Gene Transfer to Plants.Springer-Verlag,Berlin.;和Gelvin等人,1993,Plant Molecular Biol.Manual.KluwerAcad.Pub.Dordrecht。对转基因植物(包括转化技术)的综述,参见:Galun和Breiman,1997,Transgenic Plants.Imperial College Press,London。
植物的遗传操纵方法
可利用许多植物转化策略(例如,Birch,1997,Ann Rev Plant Phys Plant MolBiol,48,297,Hellens RP,等人(2000)Plant Mol Biol 42:819-32,Hellens R等人PlantMeth 1:13)。例如,策略可设计成增加多核苷酸/多肽在通常表达所述多核苷酸/多肽的植物细胞、器官中和/或在特定发育阶段的表达,或在通常不表达所述多核苷酸/多肽的细胞、组织、器官中和/或在特定发育阶段异位表达所述多核苷酸/多肽。表达的多核苷酸/多肽可源自待转化的植物物种,或可源自不同植物物种。
转化策略可设计成降低多核苷酸/多肽在通常表达所述多核苷酸/多肽的植物细胞、组织、器官中或在特定发育阶段的表达。这样的策略称为基因沉默策略。
用于在转基因植物中表达基因的遗传构建体通常包括:用于驱动一个或多个克隆的多核苷酸的表达的启动子,终止子,及用于检测遗传构建体在转化植物中的存在的选择标记序列。
适用于本发明的构建体中的启动子在单子叶植物或双子叶植物的细胞、组织或器官中具有功能,且包括细胞特异性的、组织特异性的及器官特异性的启动子、细胞周期特异性的启动子、时间启动子、诱导型启动子、在大多数植物组织中具有活性的组成型启动子、及重组启动子。在必要时,启动子的选择将取决于克隆的多核苷酸的时间及空间表达。启动子可为通常与目标转基因有关的启动子,或源自其它植物、病毒及植物病原性细菌及真菌的基因的启动子。本领域技术人员无需过多试验就能够选出适用于使用包含本发明的多核苷酸序列的遗传构建体改良及调节植物特性的启动子。组成型植物启动子的实例包括:CaMV 35S启动子、胆脂碱合酶启动子及章鱼碱合酶启动子、及来自玉蜀黍的Ubi 1启动子。在特定组织中具有活性的植物启动子,会对内部发育信号或外部非生物的或生物的应激做出响应,这描述于科学文献中。示例性的启动子描述于例如WO 02/00894中,该文献通过引用并入本文中。
常用于植物转化遗传构建体中的示例性的终止子包括,例如,花椰菜花叶病毒(CaMV)35S终止子、根瘤土壤杆菌(Agrobacterium tumefaciens)胆脂碱合酶或章鱼碱合酶终止子、玉蜀黍zein基因终止子、水稻(Oryza sativa)ADP-葡萄糖焦磷酸化酶终止子及马铃薯PI-II终止子。
常用于植物转化中的选择标记包括:赋予卡那霉素抗性的新霉素磷酸转移酶II基因(NPT II)、赋予壮观霉素及链霉素抗性的aadA基因、赋予Ignite(AgrEvo)及Basta(Hoechst)抗性的草胺膦乙酰转移酶(bar基因)及赋予潮霉素抗性的潮霉素磷酸转移酶基因(hpt)。
也预见到遗传构建体的应用,所述遗传构建体包含可用于植物及植物组织中的启动子表达分析的报告基因(表达对于宿主而言外来的活性、通常为酶活性和/或可见信号(例如荧光素酶、GUS、GFP)的编码序列)。报告基因文献论述于Herrera-Estrella等人,1993,Nature 303,209,和Schrott,1995,见:Gene Transfer to Plants(Potrykus,T.,Spangenberg编)Springer Verlag.Berline,第325-336页。
关于基因沉默策略,人们关注基因本身或影响编码多肽表达的调节元件。本文所用的“调节元件”具有最广泛的可能的意义,并且包括与目标基因相互作用的其它基因。
设计减少或沉默本发明所述的多核苷酸/多肽表达的遗传构建体可包括本发明所述多核苷酸的反义拷贝。在这种构建体内,多核苷酸被置于与启动子和终止子反义的方向上。
“反义”多核苷酸通过使多核苷酸或多核苷酸的片段倒置,使得产生的转录本与该基因的mRNA转录本互补而获得,例如
5’GATCTA 3’(编码链)3’CTAGAT 5’(反义链)
3’CUAGAU 5’mRNA 5’GAUCUCG 3’反义RNA
设计用于基因沉默的遗传构建体还包括倒置重复序列。“倒置重复序列”是其中重复的第二半部分在互补链上的重复序列,例如:
5’-GATCTA………TAGATC-3’
3’-CTAGAT………ATCTAG-5’
形成的转录本可进行互补性碱基配对以形成发卡结构。通常,需要重复区域间至少3-5bp的间隔物来形成发卡。
另一种沉默方法包括使用靶向等同于miRNA的转录本的小反义RNA(Llave等,2002,Science 297,2053)。使用这种与本发明的多核苷酸对应的小反义RNA是明确包含的。
如本文所用的术语遗传构建体也包括小反义RNA和影响基因沉默的其它这样的多肽。
以本文所定义的表达构建体进行转化也可通过称之为正义抑制的过程导致基因沉默(例如,Napoli等,1990,Plant Cell 2,279;de Carvalho Niebel等,1995,PlantCell,7,347)。在某些情况下,正义抑制可包括完整或部分编码序列过表达,还可包括基因的非编码区的表达,基因的非编码区例如为内含子或5’或3’非翻译区(UTR)。嵌合的部分正义构建体能够协同用于使多个基因沉默(Abbott等,2002,Plant Physiol.128(3):844-53;Jones等,1998,Planta 204:499-505)。使用这种正义抑制策略来使本发明的多核苷酸的表达沉默也是包含在本文中。
插在设计用于基因沉默的遗传构建体中的多核苷酸可对应于编码序列和/或非编码序列,如启动子和/或内含子和/或5’或3’-UTR序列、或对应的基因。
其它基因沉默的策略包括显性抑制(dominant negative)方法和使用核酸酶构建体(McIntyre,1996,Transgenic Res,5,257)。
转录前沉默可通过基因本身或其调节元件的突变而产生。这种突变可包括点突变、移码、***、缺失或置换。
下面是公开了可用于遗传转化以下植物物种的遗传转化方案的代表性出版物:稻米(Alam等,1999,Plant Cell Rep.18,572);苹果(Yao等,1995,Plant Cell Reports 14,407-412);玉米(美国专利第5,177,010号及第5,981,840号);小麦(Ortiz等,1996,PlantCell Rep.15,1996,877);西红柿(美国专利第5,159,135号)、马铃薯(Kumar等人,1996Plant J.9,:821);木薯(Li等,1996Nat.Biotechnology 14,736);莴苣(Michelmore等,1987,Plant Cell Rep.6,439);烟草(Horsch等,1985,Science 227,1229);棉花(美国专利第5,846,797号及第5,004,863号)、草类(美国专利第5,187,073号及第6.020,539号);胡椒薄荷(Niu等人,1998,Plant Cell Rep.17,165);橘类植物(Pena等,1995,PlantSci.104,183);香菜(Krens等,1997,Plant Cell Rep,17,39);香蕉(美国专利第5,792,935号);大豆(美国专利第5,416,011号、第5,569,834号、第5,824,877号、第5,563,04455号及第5,968,830);菠萝(美国专利第5,952,543号);杨树(美国专利第4,795,855号);单子叶统称(美国专利第5,591,616号及第6,037,522号);芸苔属(美国专利第5,188,958号、第5,463,174号及第5,750,871号);谷类(美国专利第6,074,877号);梨(Matsuda等,2005,PlantCell Rep.24(1):45-51);李属(Ramesh等,2006Plant Cell Rep.25(8):821-8;Song andSink 2005Plant Cell Rep.2006;25(2):117-23;Gonzalez Padilla等,2003Plant CellRep.22(1):38-45);草莓(Oosumi等,2006Planta.223(6):1219-30;Folta等,2006PlantaApr 14;PMID:16614818)、玫瑰(Li等,2003)、树莓(Graham等,1995Methods MolBiol.1995;44:129-33)、西红柿(Dan等,2006,Plant Cell Reports V25:432-441)、苹果(Yao等,1995,Plant Cell Rep.14,407–412)及毛花猕猴桃(Wang等,2006,Plant CellRep.25,5:425-31)。本发明也涵盖其它物种的转化。合适的方法及方案可获自科学文献中。
可使用本领域已知的几种其它方法来改变本发明的核苷酸和/或多肽的表达。这些方法包括但不限于Tilling(Till等,2003,Methods Mol Biol,2%,205)所谓的“Deletagene”技术(Li等,2001,Plant Journal 27(3),235)、以及使用人工转录因子如合成锌指转录因子(例如,Jouvenot等,2003,Gene Therapy 10,513)。另外,靶向特定多肽的抗体或其片段也可在植物中表达来调节那种多肽的活性(Jobling等,2003,Nat.Biotechnol.,21(1),35)。还可使用转座子示踪法。此外,与本发明的多肽相互作用的肽可通过如相显示(phase-display)(Dyax公司)等技术来鉴定。这种相互作用的肽可在植物中表达或应用于植物以影响本发明的多肽的活性。改变本发明的核苷酸和/或多肽表达的上述方法中每一种方法的使用也特别地包含在本文中。
在植物中修饰内源DNA序列的方法
在植物中修饰内源基因组DNA序列的方法是本领域人员已知的。这些方法可包括使用序列特异性核酸酶,其在目标基因中产生靶向双链DNA断裂。用于植物的这些方法可包括:锌指核酸酶(Curtin等,2011.Plant Physiol.156:466–473.;Sander,等,2011.Nat.Methods 8:67–69.)、转录激活样效应因子核酸酶或“TALENs”(Cermak等,2011,Nucleic Acids Res.39:e82;Mahfouz等,2011Proc.Natl.Acad.Sci.USA 108:2623–2628;Li等,2012Nat.Biotechnol.30:390–392)、以及LAGLIDADG归位内切酶,也称为“巨核酶”(Tzfira等,2012.Plant Biotechnol.J.10:373–389)。
在本发明的一些实施方案中,这些技术中的一者(如TALEN或锌指核酸酶)可用于改性uORF中的一个或多个碱基对以使其失去能力,从而不能翻译。
在一个实施方案中,ACG起始密码子的第一个碱基对变为TCG以实现该过程。这将使抗坏血酸对GGP翻译的反馈调控失去活性,并允许植物中抗坏血酸浓度升高。
或者,uORF中高度保守的氨基酸的密码子可改变以在抗坏血酸浓度高时停止uORF下调GGP翻译。例如,在uORF的保守区域中的组氨酸残基可以变为亮氨酸。
在另一个实施方案中,将uORF的早期碱基对改变以引入终止密码子,从而使uORF在早期终止,从而停止抗坏血酸对GGP翻译的反馈调控。
因此,本领域技术人员能够理解存在众多方式来干扰uORF以除去抗坏血酸引起的负向调控以及提高抗坏血酸的产生。任意这样的方法包括在本发明的范围中。
植物
术语“植物”意欲包括整个植物、植物的任何部分、植物的繁殖体及子代。
术语“繁殖体”是指植物中可用于繁殖或增殖的任何部分,其为有性或无性的,包括种子及插枝。
可培养本发明的植物,并自交或与不同植物品系杂交,且由两代或更多代得到的后代也构成了本发明的一个方面,条件是它们保留本发明的转基因或修饰。
从植物中提取和测定抗坏血酸的方法
还提供了通过从本发明的植物中提取抗坏血酸,以生产抗坏血酸的方法。可按照如下方式从植物中提取抗坏血酸:
将冰冻组织样品在Cryomill中在液氮温度下研碎成精细的粉末。然后将约200mg冰冻粉末组织用5倍体积的含2mM TCEP(Pierce公司)的7%偏磷酸中悬浮,振荡混合20秒,并在40℃在加热块中孵育2小时。在提取溶液中使用TCEP是因为其在酸性条件下是比DTT更有效的还原试剂,确保所有维生素C是抗坏血酸的还原形式。提取物在4℃离心,且将20μL上清液注射入Rocket柱内,并用两种溶剂A(0.28%正磷酸,0.1mM EDTA和0.25%甲醇)和B(乙腈)洗脱。使用5分钟梯度(直至90%B)洗脱抗坏血酸及其它组分。每批或处理20个样品后运行标准试样。根据在240nm处洗脱1分钟的吸收曲线下方的面积计算抗坏血酸。
该方法可使用本领域人员熟知的方法为大规模抗坏血酸提取扩大规模。
本发明还可以宽泛得解释为包括本申请说明书中分别或一起提及或所提示的各部分、元素和特征,和任意两个或更多个所述部分、元素或特征的任一种或所有组合,并且在本文中提及特定整体的情况下,所述整体具有本发明所涉及领域内的已知等同物,这种已知的等同物被认为是引入本文中,好像其被独立地阐述那样。
附图简要说明
参考下列附图可更好地理解本发明,其中:
图1示出了抗坏血酸对由GGP启动子或对照启动子驱动的报告基因活性的影响。A:对于GGP启动子,LUC/REN比作为叶抗坏血酸浓度的函数;B:对于TT8启动子,LUC/REN比作为叶抗坏血酸浓度的函数。▲低抗坏血酸(KO)叶,■对照叶,○高抗坏血酸(GGP)叶。
图2示出了在GGP基因的5'-UTR中存在的ACG uORF的各种改变形式下,抗坏血酸对GGP启动子强度的影响(图S7B)。A:LUC/REN比;B:相同处理中抗坏血酸的浓度。VTC2是野生型GGP 5'-UTR和启动子。ACG1是ACG1的启动ACG变为TCG,不再为起始密码子。ACG2是在uORF的高保守区域(图S5、S7B)中第一个组氨酸His变为亮氨酸Leu。加入GGP以操纵抗坏血酸浓度。在A中,VTC2+GGP处理比所有其它处理(差异不显著)具有显著更低的LUC/REN值(p=0.001)。在B中,向叶中加入GGP显著提高了抗坏血酸(p=0.001),但是高或低抗坏血酸的处理之间的差异不显著。棒为标准误差,n=4。
图3示出了检测GGP 5'-UTR的非典型uORF是以顺式还是反式的方式作用的结果。VTC2wt是指抗坏血酸阻遏启动子和5'-UTR,ACG1指uORF的突变ACG密码子(无响应),uORF是指添加了由35S驱动子驱动的uORF并且GGP是指添加了也由35S驱动的GGP编码序列以提高抗坏血酸。
图4示出了对于来自猕猴桃和拟南芥的GGP全长启动子构建体,报告基因对抗坏血酸的反应的比较。GGP用于如图1所示提高抗坏血酸的水平。■拟南芥GGP(启动子和5'-UTR),□标准猕猴桃GGP(启动子和5'-UTR)。其他的细节可见方法部分。
图5示出了在瞬时转化的烟叶中用抗LUC抗体测量(由GGP启动子或对照TT8启动子驱动),高抗坏血酸浓度对LUC蛋白的量的影响。如图1所示的那样进行试验。在319998(GGP)泳道中抗坏血酸的浓度为55至63mg/100g FW,而没有GGP的泳道中抗坏血酸浓度为21mg/100g FW。其他的细节可见方法部分。
图6示出了独立于提高叶抗坏血酸的GGP酶,在不同的GGP水平下通过使用进一步提高抗坏血酸的GME来操纵抗坏血酸浓度的效果。A:GGP和GME的不同组合对LUC/REN比的影响;B:GGP和GME的不同组合对抗坏血酸浓度的影响。在A和B中,具有相同的字母的柱在5%水平无显著差异。C:单个叶片LUC/REN和叶抗坏血酸之间的关系。其他的细节可见方法部分。在C中,■,对照;●,GME;◆,0.33x GGP;▲,1x GGP;□,0.33x GGP+1x GME;▼,1x GGP+GME。1和0.33指注入叶中的GGP和GME的相对量。
图7示出了对来自一系列双子叶物种的5'-UTR序列的比对。使用Clustal X完成比对,用Vector NTI执行。后缀字母表示5'-UTR序列来自的物种:Aa为软枣猕猴桃,Ae为毛花猕猴桃并且Ac为中华猕猴桃,MXd为苹果,Fv为野草莓,Sl为番茄,St为马铃薯,Vv为葡萄,Gm为大豆,Mt为蒺藜苜蓿,Pt为毛果杨,Cs为黄瓜。各名之前的前缀为GenBank登陆号。两种基因组序列来自公开的来源(T.P.G.S.Consortium,2011Nature 475,189);Velasco等,2010Nat Genet 42,833)。以ATG起始的短uORF为粗体,而以ACG起始的高度保守的非典型uORF用下划线粗体(ACG1)示出。各序列括号内的数字表示其5'-UTR的总长度。下方的图示出了5'-UTR的高保守区域以及用于检测它们功能的三个缺失。着色区域为高保守区域,其单独删除(从左至右缺失2和3)或是完整删除(缺失1)。黄色基序为以ATG起始的小的保守uORF(ATG1),而橙色基序为以ACG起始的两个非典型uORF(ACG1底部、ACG2顶部)。所有3个uORF在物种间保守,而ACG2(家族间同一性为~40%至~60%)在蛋白质水平方面比ACG1(~60%至~80%)保守性差。
图8示出了GGP基因5'-UTR区域的缺失对抗坏血酸下调启动子的影响。缺失如图S4标记。底部图示出了测量LUC/REN比时相同叶中对应的抗坏血酸浓度。棒表示标准误差。
图9示出了GGP CDS前方5'-UTR存在或缺失对叶抗坏血酸的影响的时间过程。所有构建体由35S启动子驱动。其他的细节可见方法部分。■,对照(仅P19);●,-5'-UTR GGP;▲,+5'-UTR GGP;▼,-5'-UTR GGP+GME;◆,+5'-UTR GGP;○,GME。
图10示出了对来自一大系列物种的GGP的5'-UTR中的ACG uORF的预测肽序列的比对。用Clustal X完成比对,用Vector NTI执行(Thompson等,Nucleic Acids Res 25,4876(1997).)。后缀字母如图7所示,还增加了双子叶植物植物之外的植物。Cr,莱茵衣藻(Chlamydomonas rheinhardtii);Pp,小立碗藓(Physcomitrella patens);Ps,北美云杉(Picea sitchensis);Sm,江南卷柏(Selaginella moellendorffi);Zm,玉米。各名之前的前缀为GenBank登陆号。还示出了完整uORF的共有序列。此外标记下划线的为高度保守的共有基序NPSPHGGRGALPSEGGSPSDLLFLAGGG(SEQ ID NO:108)。
图11示出了小ATG uORF对报告基因的活性对抗坏血酸浓度反应的影响,报告基因的活性由GGP启动子和5'-UTR驱动。5'-UTR中小的30bp ORF的起始密码子通过将起始的ATG变为TTG而失活。□,失活uORF;■,uORF起始密码子存在。在该试验以及重复试验中,受到不具有起始密码子的5'-UTR控制的报告基因的活性在低和高的抗坏血酸浓度下的表达都高于uORF完整的基因。实心线为对数据的多项拟合。其他的细节可见方法部分。
图12示出了抗坏血酸的还原状态作为叶中的总抗坏血酸的函数。这些数据来自三个独立的试验。使用GGP操纵抗坏血酸,用还原剂和不用还原剂测量。当抗坏血酸浓度分为低(27±0.7mg/100g FW)、中(59±2.7)和高(179±17.5)(平均值±标准误差)时,氧化还原电势值显著不同并且随抗坏血酸的升高而下降:74.8±1.0、70.1±1.2和65.6±0.8(p=0.05)。实线是还原%数据的双曲线拟合,而虚线是对氧化还原电势的线性拟合。
图13示出了抗坏血酸对报告基因活性的影响,报告基因的活性受到GGP启动子或对照启动子驱动。A,对GGP启动子,LUC活性对比REN活性;B,对TT8启动子,LUC活性对比REN活性。在A中的三个斜率差异显著(p<0.001),而在B中只有低抗坏血酸斜率明显(p<0.001)比斜率差异不显著的其他两条线的斜率更低。
图14示出了基于pGreen 0800的报告基因构建体的位置的图,所述构建体被设计用于检测来源于不同物种的GGP的5’UTR。
图15示出了来源于马铃薯、番茄和苹果的GGP基因的5’UTR序列。uORF用粗体示出。
图16示出了对番茄5’UTR而言,高(+319998)和低抗坏血酸下LUC值对REN的图。
图17示出了对马铃薯5’UTR而言,高(+319998)和低抗坏血酸下LUC值对REN的图。
图18示出了对苹果5’UTR而言,高(+319998)和低抗坏血酸下LUC值对REN的图。
图19示出了对于对照启动子-5’UTR-LUC构建体而言,高(+319998)和低抗坏血酸下LUC值对REN的图。
图20示出了对于野生型猕猴桃GGP启动子-5’UTR-LUC构建体而言,高(+319998)和低抗坏血酸下LUC值对REN的图。
例子
现在参考下列非限制性例子来说明本发明。
不能认为本发明的范围仅限于上述的例子。本领域技术人员能够理解,在不脱离本发明的范围的情况下可对本发明进行多种变形。
实施例1:对GGP的表达控制的阐明
概要
抗坏血酸(维生素C)是植物和动物体内必需的抗氧化剂和辅酶因子。在植物中抗坏血酸浓度受到密切调节,部分地对应激反应。申请人已经示出了通过GDP-L-半乳糖磷酸化酶(GGP)的转录后阻遏来控制抗坏血酸浓度,GGP是抗坏血酸生物合成途径中的限速酶。该调节要求顺式作用的uORF(上游开放读码框)的翻译,其由非典型的起始密码子启动并在高抗坏血酸浓度下阻遏下游GGP ORF的翻译。除去该uORF允许植物产生高浓度的抗坏血酸。更高级和低级的植物中GGP基因中uORF的存在表明其是控制抗坏血酸的一种古老的机制。
抗坏血酸(维生素C)是在大部分生物体中发现的必需生物化学品,其主要作用在于控制细胞的氧化还原电势(Asensi-Fabado等,2010,Trends Plant Sci.15,582;Foyer等,Plant Physiol.155,2(2011))以及作为酶辅因子(Mandl等,2009,Br.J.Pharmacol.157,1097)。根据需要调节抗坏血酸的浓度;例如,在高光强度下对抗坏血酸的需要最高时,叶抗坏血酸浓度升高(Bartoli等,2006,J.Exp.Bot.57,1621;Gatzek等,2002,Plant J.30,541)。然而,如何调节抗坏血酸生物合成的机制是未知的。申请人之前已经示出了酶GDP L-半乳糖磷酸化酶(GGP)对决定植物中抗坏血酸是重要的(Bulley等,2012,Plant Biotechnol J 10,390;Bulley等,2009,J.Exp.Bot.60,765),表明其可能具有调节作用。
结果和讨论
为了研究GGP基因是否受到抗坏血酸水平的调节,申请人将猕猴桃GGP启动子及其5'-UTR(SEQ ID NO:101)与荧光素酶(LUC)报告基因融合,并在本氏烟(Nicotianabenthamiana)叶中瞬时表达该构建体(Hellens等,2005,Plant Methods 1,13.)。申请人也在强的组成型启动子下仅表达GGP编码序列来操纵抗坏血酸。抗坏血酸浓度从2mM(20mg/100g FW)翻倍到4mM足以将相对LUC活性降低50%,并且当抗坏血酸升高至接近10mM时,>90%的LUC活性被破坏(图1)。类似地,拟南芥GGP(VTC2;At4g26850)启动子和5'-UTR(SEQID NO:102)也对LUC报告基因赋予抗坏血酸依赖性的阻遏(图4)。
相反,使用与抗坏血酸代谢不相关的基因的对照启动子(TT8:控制多酚生物合成的拟南芥bHLH转录因子),高抗坏血酸对相对LUC活性无影响(图1)。其它的对照示出该调控对GGP序列是特异的,与转基因的表达水平无关,并且由LUC蛋白的改变体现(表1-3,图5)。
表1:LUC或REN的绝对值不显著影响LUC/REN比。LUC和REN之间的关系在超过200倍的范围内是线性的。下标P是指整个启动子,包括得自该基因的任意5'-UTR基因。其他的细节可见方法部分。
表2:抗坏血酸对一系列对照基因的效果比较。+GGP是指为了提高抗坏血酸,共转化处于35S启动子控制下的来源于猕猴桃的GGP CDS(GenBank登录号FG528585)。LUC REN斜率是LUC值相对于REN值的绘图强制通过原点的斜率,以作为与LUC/REN比的比较。N是独立LUC/REN比的测量次数。下标P是指整个启动子,包括得自该基因的任意5'-UTR基因。在一组两行内,具有相同字母的LUC/REN值没有显著差异p<0.01。其他的细节可见方法部分。
3.对用来操纵抗坏血酸浓度的基因添加对照基因的影响。为了检测额外基因(GGP)的表达增加抗坏血酸并不直接影响LUC/REN比,我们用另一个对抗坏血酸浓度无直接影响的对照基因进行置换(GenBank登录号FG429343),猕猴桃甲基转移酶。下标P是指整个启动子。在一组三行内,具有相同字母的LUC/REN值没有显著差异p<0.01。其他的细节可见方法部分。
在所述的试验中,通过GGP编码序列的表达变化操纵叶抗坏血酸。为了将抗坏血酸的影响与GGP蛋白的可能影响分开(P.,2008,Plant Mol.Biol.68,31),申请人将GGP和GME分别和一起表达。申请人之前已经示出了(Bulley等,2009,J.Exp.Bot.60,765.)在烟草中单独表达GGP有中度影响、GME影响很小,而当一起表达时对抗坏血酸浓度有很强的协同刺激。因此,通过改变这两个基因的比率,可以独立于GGP蛋白量来操纵抗坏血酸(图6)。尽管不同的GGP蛋白水平,但是该比率对抗坏血酸的响应为与不同抗坏血酸浓度相关的平滑曲线(图6),表明了抗坏血酸或相关代谢物是降低LUC活性的因子。
为了检测抗坏血酸的影响是否是通过非转录的启动子或5’-UTR介导,申请人进行了两个试验。首先,申请人在GGP TT8启动子之间交换5'-UTR。我们在叶中瞬时表达这些物质并测量相对LUC活性。仅在GGP的5'-UTR存在时,升高的抗坏血酸降低LUC活性(表4)。其次,申请人删除了5'-UTR中物种间在DNA水平高度保守的两个区域。第一个是从387到432bp,并且第二个是从514到597bp(图7),而GGP启动子的其余部分不变,并且使用报告分析对它们进行检测。所有的缺失引起抗坏血酸对报告基因表达下调的能力的损失(图8)。这些试验表明,5’-UTR是抗坏血酸实现下调所必要的和充分地。
表4:抗坏血酸下调GGP启动子通过该基因的5'-UTR区进行表达。下标UTR指基因的5'-UTR,并且下标P’是指相应基因的非转录启动子。GGP是指共转化了35S启动子控制下的GGP CDS从而提高抗坏血酸水平,而FG429343为甲基转移酶对照基因。LUC REN斜率是LUC值相对于REN值的绘图强制通过原点的斜率。N是独立LUC/REN比的测量次数。在一组三行内,具有相同字母的LUC/REN值没有显著差异p<0.01。其他的细节可见方法部分。
为了研究抗坏血酸控制是在转录水平还是在转录后水平,申请人测量了报告基因构建体的转录水平。我们的数据示出抗坏血酸对LUC mRNA水平的影响不大(表5),表明抗坏血酸直接地或间接地通过5'-UTR控制GGP的翻译起作用。
表5:抗坏血酸水平对LUC RNA水平的影响(通过GGP启动子或TT8对照基因驱动)。在相同的RNA制备品中,相对于REN的表达测量基因表达。所得值为三个生物学重复的平均值,每个包括三个合并的叶。标准误差在括号中表示。在每个启动子对内,对于TT8启动子,基因表达或LUC活性没有显著差异。对于GGP启动子,LUC活性的改变是显著的(p<0.001),如同两种启动子的抗坏血酸改变(p<0.003)那样。
为了验证5'-UTR直接起作用以影响叶抗坏血酸浓度,我们构建了35S启动子驱动的GGP编码序列,在该编码序列前方具有或不具有GGP 5'-UTR。两种构建体都能在瞬时体系中增强叶抗坏血酸,但是不含5'-UTR的构建体比具有5'-UTR的构建体多约30%的抗坏血酸(图9)。此外,将GME共渗透入叶中从而使抗坏血酸比仅由GGP还高(Bulley等,2009,J.Exp.Bot.60,765.),这使得在不含5'-UTR的构建体的情况下抗坏血酸浓度是含5'-UTR的构建体的两倍。因此,在高抗坏血酸情况下,GGP 5'-UTR同时限制了GGP的产生和抗坏血酸的合成。除去该调控提供了一种制备具有高抗坏血酸水平的植物的方式。
考虑到抗坏血酸的影响是通过GGP的5'-UTR区介导的,我们研究了5'-UTR的性能。在具有严格保守元件的许多物种中,GGP是不同寻常的,具有超过500bp的长5'-UTR(图7)。比较来自不同物种(包括藻类和苔藓)的GGP 5'-UTR,示出了存在高度保守的uORF,其可能编码60-65个氨基酸的肽(图10)。有趣的是,为了制备该肽,需要在非典型ACG起始密码子启动翻译。已经描述了多个非典型翻译起始的例子(Ivanov等,2008,Proc.Natl.Acad.Sci.USA 105,10079)。高效的翻译需要Kozak序列,对于该ORF也是这种情况(图8)。为了检测这种uORF是否是GGP基因的抗坏血酸依赖性调控所需要的,申请人将可能的ACG起始密码子突变为TCG。来自突变构建体的LUC活性仍然很高,即使在高抗坏血酸的存在下也是如此(图2)。为了进一步检测对uORF的需要,申请人将残基36处的高度保守的His(CGG密码子)突变为Leu(CTG)。再次,这破坏了抗坏血酸依赖性调控(图2)。突变内部ATG密码子(可能编码10个氨基酸的短uORF)将相对LUC活性提高了超过两倍,这可能是因为它移除了竞争的起始密码子,但并没有改变该启动子对抗坏血酸浓度的相对灵敏度(图11)。
申请人然后用对抗坏血酸没有反应的ACG uORF突变体检测预计的uORF是以顺式还是反式构型起作用。申请人检测了独立表达ACG uORF是否能在该突变载体中恢复抗坏血酸对LUC活性的阻遏。在图3中,申请人示出了ACG uORF的存在对任何处理无影响,并且不能补偿ACG uORF的突变形式。这与GGP CDS情况下uORF以顺式构象起作用是一致的。
在该工作中,申请人提供的证据表明,抗坏血酸或抗坏血酸的前体通过中间物与由GGP 5'-UTR中的非典型uORF产生的肽(抗坏血酸生物合成的关键调控基因)直接或间接相互作用,导致对GGP酶的翻译的抑制。在真核细胞中通过生物合成途径的产物控制蛋白表达的报导是罕见的。通常,基因表达是通过借助于单独受体到转录因子的信号级联或通过目标蛋白的翻译后修饰来控制的(Smeekens等,2010,Curr.Opin.Plant Biol.13,273)。虽然已经报导5'-UTR序列在控制蛋白表达中是重要的(Hulzink等,2003,PlantPhysiol.132,75),但是在真核生物中报告利用小分子通过mRNA的5'-UTR控制基因表达是罕见的(Rahmani等,2009,Plant Physiol.150,1356),并且通过非典型起始密码子uORF进行控制是极其罕见的。
一个简单的作用模型可能是ACG uORF被翻译,但在高抗坏血酸存在时,核糖体停留在uORF。在低抗坏血酸时,翻译在终止密码子终止,并且在GGP的起始ATG下游立即重新启动。没有明显的Kozak序列与GGP主要起始密码子相关,但有相当强的Kozak序列与ACG1相关。这有效地引起在高抗坏血酸时,准备进行翻译的GGP mRNA水平的核糖体快速应对应激条件下抗坏血酸的任意减少。
似乎该反馈环的作用需要另一个因素。这是因为来源于毛花猕猴桃(具有很高抗坏血酸的猕猴桃物种)的GGP 5'-UTR(Bulley等,2009,J.Exp.Bot.60,765.)的抗坏血酸调控,在本氏烟中起作用。猕猴桃有高抗坏血酸表明毛花猕猴桃中发生突变干扰了抗坏血酸对GGP翻译的反馈。然而,抗坏血酸对毛花猕猴桃GGP的控制在本氏烟中起作用表明在抗坏血酸和ACG1uORF之间介导的因素在本氏烟中起作用。该因素可能是蛋白质。
有两种类型的uORF(Tran等,2008.BMC Genomics 9,361):序列独立性uORF,其中uORF翻译影响下游ORF的重新启动的效率,从而影响整体翻译(Calvo等,2009.Proc.Natl.Acad.Sci.USA 106,7507),但uORF编码的肽序列是不重要的(GGP 5'-UTR中短ATG 10氨基酸uORF似乎符合该类(图7)),以及序列依赖的ORF,其中新生uORF肽在翻译延伸和终止期间引起核糖体停止。事实上,GGP uORF在很宽范围的植物分类学中编码高度保守的肽,并且通过uORF中的单个氨基酸突变破坏抗坏血酸阻遏,这表明是后一种类型的uORF。植物中的两个例子,多胺和蔗糖调节(Rahmani等,2009,Plant Physiol.150,1356;Gong and Pua,2005,Plant Physiol.138,276)涉及序列依赖uORF。我们的新的例子的不同之处在于其由高度保守的非典型密码子启动翻译。
总之,我们已经示出,叶片中抗坏血酸的水平可以通过抗坏血酸生物合成的控制基因GGP的长5'-UTR中的非典型uORF介导的抗坏血酸反馈来控制。我们的证据表明,这种反馈作用是通过控制GGP酶的水平通过转录后控制起作用的。我们认为这是一个重要的机制,即在抗坏血酸生物合成的L-半乳糖途径控制抗坏血酸浓度。
材料和方法:
植物材料和化学分析
如之前记载,本氏烟叶瞬时报告基因体系使用荧光素酶(LUC)作为启动子特异报告因子,以及海肾(REN)作为转化报告因子(Hellens等,2005,Plant Methods 1,13)。通过以下方法操纵叶中抗坏血酸浓度:共注射在pGreen(Hellens等,2000,Plant Mol.Biol.42,819)中的中华猕猴桃GGP的编码序列,pGreen受到35S启动子的控制,并且被转化入土壤农杆菌(Agrobacterium tumifaciens)(Bulley等,2009,J.Exp.Bot.60,765.);或是共注射使用来源于本氏烟的GGP序列(由如(Snowden等,The Plant Cell 17,746)所述从GenBank中的七个EST构建)作为模板构建的KO载体。另外,之前所述(Bulley等,2009,J.Exp.Bot.60,765.)的毛花猕猴桃GME(GenBank登录号FG424114)的CDS版本用于与GGP一起协同增强抗坏血酸。还如前所述,通过基于HPLC的分析法测定相同叶子的提取物中的抗坏血酸(Rassam等,2005,J.Agric.Food Chem.53,2322)。通过在HPLC之前还原提取物测定抗坏血酸作为总抗坏血酸(Rassam等,2005,J.Agric.Food Chem.53,2322)。对抗坏血酸氧化还原状态的测量发现,随着抗坏血酸浓度的增加,氧化还原电势显著降低(图12)。这就提出了一个可能性,抗坏血酸的影响可能是通过抗坏血酸本身或通过抗坏血酸升高时氧化还原电势降低而进行的。
图13示出了其中每个点(两到三个测量的平均值)表示本氏烟的不同叶的典型试验,其示出了抗坏血酸如何影响LUC活性但对REN活性影响不大。这个数据也绘制在图1,其中每个叶子的平均LUC/REN比值相对于抗坏血酸浓度进行作图。
为了检测抗坏血酸的影响是否是通过启动子或5'-UTR介导的,我们构建了两个载体,其中在GGP启动子和TT8启动子之间交换5'-UTR区域。由此得到的构建体包括TT8核心启动子(TT8P’)之后是GGP 5'-UTR(GGPUTR),反之亦然。我们在叶中瞬时表达这些构建体,并测量相对LUC活性。
为了检测位于GGP编码序列前方的5'-UTR对抗坏血酸浓度的影响,使用了不同的GGP基因(GenBank登录号FG460629)替代在其它试验中的GGP。在蛋白质水平,其与标准GGP有96%一致,并且在5'-UTR缺乏时,升高的抗坏血酸浓度达到通常GGP所见的类似水平。具有5'-UTR的版本具有全长5'-UTR,而不具有UTR的标记版本使用XhoI限制酶将起始ATG上游除37bp之外的部分完整删除。在5'-UTR的3’端的该区域,GGP之间几乎没有同源性(图8)。两个版本均连接到pART277载体中(Gleave,A.,1992,Plant Mol.Biol.20,1203(1992)。
通过Western印迹使用LUC抗体(Promega公司)测定LUC蛋白量,每个泳道采用来自在本氏烟叶中瞬时表达的各种构建体的50μg可溶细胞内蛋白进行(提取到40mM磷酸盐缓冲液中,pH值7.4,150mM NaCl)。用SYPRO橘蛋白凝胶染色的Rubisco大亚基作为加载对照。
为了将抗坏血酸和GGP蛋白的影响分开,我们初步尝试用抗坏血酸或其前体直接用注射器注入叶。但是我们不可能得到叶中抗坏血酸持久的变化。我们也尝试让离体叶片或之前注射了农杆菌LUC/REN构建体的叶片吸收抗坏血酸。虽然这些叶子中抗坏血酸非常显著增加,但是在LUC/REN值上升到能够测量之前叶片变质。然后我们试图通过敲除参与抗坏血酸生物合成途径中的两个基因(编码半乳糖脱氢酶和GDP甘露糖差向异构酶)来降低抗坏血酸而不降低GGP浓度。然而,我们也没有看到叶中抗坏血酸显著变化,表明其表达的酶可能比较稳定或七天的试验范围中是过量的。
试验至少重复两次得到类似的结果,虽然在某些情况下,高抗坏血酸降低REN的表达以及LUC的表达,这并没有改变抗坏血酸对降低GGP启动子(而非TT8)关系的斜率(即LUC/REN比)的影响。
基因克隆和质粒
通过基因组步移法克隆来自毛花猕猴桃的GGP启动子(SEQ ID NO:101),其已经以登录号JX486682记录在GenBank中。使用下列七种平末端限制性内切酶对毛花猕猴桃gDNA(2.0μg)进行酶切:DraI、EclII 136、EcoRV、HpaI、MScI、ScaI、SspI和StuI。纯化酶切产物并用PCR清洁和离心浓缩柱(Zymogen公司)用10μL洗脱。使用T4快速连接酶(Roche公司),在16℃下将含有巢式PCR引物位点的双链接头序列(Clontech公司)与酶切片段过夜连接。连接产物用柱纯化第二次,并用30μL洗脱。使用1uL各酶切产物以及引物319998NRWLK1、RPH-149和Ex Taq聚合酶(Takara公司),通过以下两步循环条件进行第一轮PCR。对于第一高严谨步骤,一个循环是在94℃下变性2分钟,随后七个循环是在94℃下变性25秒,并在72℃下延伸/退火3分钟。第二步由32个循环构成,每个循环中在94℃下25秒以及67℃下3分钟,最后67℃延伸3分钟。第一轮的产物在1%琼脂糖凝胶中电泳,并使用1μL 1:50的稀释物作为第二轮PCR的模板,其中第二轮PCR加入319998NRWLK2和RPH-150。第二轮PCR也是两步PCR,最初在94℃下变性2分钟,之后5个循环是在94℃下25秒以及72℃下3分钟。之后是另外20个循环:94℃下25秒以及67℃下3分钟,然后67℃延伸3分钟。根据制造商说明,使用凝胶电泳鉴定大小在500-2kb之间的PCR产物,将其克隆进pGem T Easy载体(Promega公司)。对克隆进行DNA测序证实为与已知的5'-UTR重叠。设计的第二组嵌套引物在第一个启动子的步移末端,以使已知的毛花猕猴桃启动子序列延伸至2kb。然后使用猕猴桃gDNA PCR 5’和319998NRWLK2引物由从毛花猕猴桃gDNA对该2kb的启动子序列进行PCR扩增,并使用EcoRV和NcoI限制性酶将其亚克隆入pGreen0800-5’_LUC(Hellens等,2000,Plant Mol.Biol.42,819)。最终构建体称为GGP-启动子-pGreenII 0800-5LUC载体。
通过PCR克隆来源于拟南芥的GGP启动子(At4g26850)(SEQ ID NO:102)以及来源于各种来源的对照启动子。对照启动子为TT8(AT4G09820)、EF1α(AT1G07940)、Act2P(AT3G18780)和Act7P(AT5G09810)。
起始密码子失活或5'-UTR的uORF中的其他缺失以及突变的产生是由突变和对照序列的化学合成(GenScript,www.genscript.com)实现的。在失活版本中,uORF中的ATG或ACG起始密码子变为TTG。其他改变是通过点特异性突变完成的。在5'-UTR中UTR 28bp的5’侧有StuI位点,其用作合成片段的5’边界。我们在合成基因的3’端添加了额外的CC以产生NcoI位点(ccatgg),并用StuI和NcoI酶切移去相当于来自GGP-启动子-pGreenII 0800-5LUC的合成片段的序列。然后将合成片段分别克隆入载体以得到含有和不含uORF的两个版本。
RNA分离和cDNA合成:
使用RNeasy Plant Mini试剂盒,从100mg的叶组织中提取总RNA,使用Nanodrop1000分光光度计(Thermo Fisher Scientific公司)测量浓度。然后由1μg总RNA合成互补DNA,并且使用BluePrint Reagent试剂盒根据制造商的说明用总体积10μl的随机引物进行实时PCR(Takara Bio公司)。cDNA合成后,将制备物稀释75倍以用于实时定量PCR。
定量PCR
使用480实时PCR体系(Roche Diagnostics公司),以5μl的总体积进行定量PCR,使用以下引物对:LUC1/2:5’-TATCCGCTGGAAGATGGAAC-3’(SEQ ID NO:109);5’-TCCACCTCGATATGTGCATC-3’(SEQ ID NO:110)。使用Primer3设计具有60℃的退火温度的引物(Rozen and Skaletsky,2000,Methods Mol Biol.132,365)。荧光素酶引物对从荧光素酶开放读码框5’-端的区域进行扩增。反应组分(使用LightCyclerSYBR GreenIMaster Mix)如下:各引物2μM、1.25μl稀释的cDNA制备物。标准循环方案使用60℃的Tm,并且使用480软件(Roche Diagnostics公司)针对Renilla转录本对相对定量分析进行校正。
所用体系的对照检测
由于对照基因启动子TT8的表达比GGT启动子高约10倍,因此我们考虑了TT8启动子可能使烟草细胞表达转录本或翻译LUC的能力饱和,因此无法观测到任何抑制的可能性。为了检验这一点,我们在200倍的范围内滴定了含有TT8-LUC构建体的农杆菌。LUC/REN比以及LUC和REN之间关系的斜率不受到注入农杆菌的量的影响(表1),表明几乎没有报告基因的表达发生饱和的迹象。TT8启动子驱动的LUC值与使用GGP启动子表达的LUC值重叠。我们还测试了几种不同的可供选择的启动子是否被抗坏血酸抑制。这些包括EF1α、Act2P和Act7P。这些启动子都没有受到抗坏血酸负面影响(表2),但是在该试验中,TT8启动子的强度实际上被抗坏血酸增强。在第三个测试中,通过检测来自拟南芥GGP的相同启动子(At4g26850),我们证实了抗坏血酸对GGP启动子强度的影响不限于猕猴桃GGP基因启动子。如图4所示,对于来自不同物种的两种启动子而言,LUC/REN比对抗坏血酸的反应基本上是相同的。在最后的测试中,我们检查是否表达基因以提高抗坏血酸(猕猴桃GGP)本身可能影响结果。因此,我们增加了额外的对照基因,其为甲基转移酶的形式。在该试验中,虽然增加的基因的LUC/REN比少量降低(表3),但是这没有改变以下结论,即升高的抗坏血酸降低GGP启动子强度但对其它对照启动子的影响很小。
实施例2:在LUC/REN报告检验中检测抗坏血酸对其它5’UTR序列的影响。
方法
35S驱动的-LUC构建体来源于pGreen 0800LUC(Hellens等,2000,PlantMol.Biol.42,819),其中不含5’UTR的35S启动子的第二拷贝克隆入位于LUC编码序列前方的多克隆位点,并且在该35S启动子和LUC编码序列起始点之间***来源于苹果、马铃薯和番茄的5’UTR(分别为SEQ ID NO:126、127和128)以替代35S 5’UTR(图14)。5’UTR序列如图15所示。
按照如上实施例1中对其它GGP启动子构建体所述的那样检测这些构建体。
结果
对于由不同的GGP 5’UTR***物驱动的每种LUC基因,其均被抗坏血酸下调(图16、17和18,表6)。在每种情况下,LUC/REN比以及LUC和REN之间关系的斜率被抗坏血酸降低。在这些试验中,抗坏血酸的升高小于实施例1所示(表6),这可能是由于不同的生长条件(更少的光照和更高的温度)所致,而升高的抗坏血酸仍然显著降低了LUC值。还示出了典型的非反应性启动子-5’UTR(EF1alpha:图19)以及标准GGP启动子-5’UTR(图20)的对应数据。其它的变体5'UTR序列当然可以以同样的方式进行测试。
表6:对来源于三个不同物种的GGP的各种5’UTR的LUC/REN比以及LUC相对于REN作图的斜率进行表格化。我们也包括了对照启动子及其本身的5’UTR;以及之前所用的初始GGP启动子及5’UTR作为对照。p值为各构建体高和低抗坏血酸之间差异的统计学显著性。
结论
对来源于三个不同物种的GGP 5'UTR构建体的检测均示出了由升高的抗坏血酸所实现的显著下调。连同来自拟南芥和猕猴桃的GGP的5’UTR(实施例1),这共检测了5种不同的GGP 5’UTR,它们均示出了由升高的抗坏血酸下调,强烈暗示这是普遍的现象。
序列总结
序列表
<110> 新西兰植物和食品研究院有限公司
<120> 基因表达的调控
<130> 685038 HCF/tab
<150> US 61/740,751
<151> 2012-12-21
<160> 140
<170> PatentIn version 3.5
<210> 1
<211> 60
<212> PRT
<213> 毛花猕猴桃(A. eriantha)
<400> 1
Thr Ala Ile Phe Gly Val Ser Arg Ala Leu Val His Val Arg Ser Val
1 5 10 15
Arg Arg Lys Gly Cys Val Val Glu Ser Asn Pro Ser Pro His Gly Gly
20 25 30
Arg Gly Ala Leu Pro Ser Glu Gly Gly Ser Pro Ser Asp Leu Leu Phe
35 40 45
Leu Ala Gly Gly Gly His Phe Ala Phe Ser Val Tyr
50 55 60
<210> 2
<211> 62
<212> PRT
<213> 黄瓜(Cucumis sativus)
<400> 2
Thr Ala Ile His Val Val Ser Arg Ser Phe Phe His Val Arg Ala Val
1 5 10 15
Arg Arg Lys Gly Cys Ile Thr Pro Thr Asn Pro Ser Pro His Gly Gly
20 25 30
Arg Gly Ala Leu Pro Ser Glu Gly Gly Ser Pro Ser Asp Leu Leu Phe
35 40 45
Leu Ala Gly Gly Gly Phe Ser Cys Phe Phe Ser Ser Ser Tyr
50 55 60
<210> 3
<211> 58
<212> PRT
<213> 大豆(Glycine max)
<400> 3
Thr Ala Ile Leu Arg Val Ser Arg Ser Leu Ile His Val Pro Thr Val
1 5 10 15
Arg Arg Arg Thr Gly Cys Val Thr Ala Thr Asn Pro Ser Pro His Gly
20 25 30
Gly Arg Gly Ala Leu Pro Ser Glu Gly Gly Ser Pro Ser Asp Leu Leu
35 40 45
Phe Leu Ala Gly Gly Gly Ser Ala Val Phe
50 55
<210> 4
<211> 61
<212> PRT
<213> 番茄(Solanum lycopersicum)
<400> 4
Thr Ala Ile His Lys Val Asn Arg Arg Pro Leu Leu His Val Pro Ala
1 5 10 15
Val Arg Arg Lys Gly Cys Val Thr Ala Thr Asn Pro Ala Pro His Gly
20 25 30
Gly Arg Gly Ala Leu Pro Ser Glu Gly Gly Ser Pro Ser Asp Leu Leu
35 40 45
Phe Leu Ala Gly Gly Gly Ser Phe Leu Ser Phe Ser Tyr
50 55 60
<210> 5
<211> 59
<212> PRT
<213> 葡萄(Vitis vinifera)
<400> 5
Thr Ala Ile Gln Arg Ile Pro Pro Pro Leu Ile His Val Arg Ala Val
1 5 10 15
Arg Arg Lys Gly Cys Val Ile Glu Ser Asn Pro Ser Pro His Gly Gly
20 25 30
Arg Gly Ala Leu Pro Ser Glu Gly Gly Ser Pro Ser Asp Leu Leu Phe
35 40 45
Leu Ala Gly Gly Gly Ser Asn Ala Phe Leu Cys
50 55
<210> 6
<211> 64
<212> PRT
<213> 拟南芥(Arabidopsis thaliana)
<400> 6
Thr Ala Ile His Gly Ile Ser Arg Gly Val Ser Ser His Val His Ile
1 5 10 15
Val Arg Gln Lys Gly Cys Leu Ile Glu Thr Asn Pro Leu Pro His Gly
20 25 30
Gly Arg Gly Ala Leu Pro Ser Glu Gly Gly Ser Pro Ser Asp Leu Leu
35 40 45
Phe Leu Ala Gly Gly Gly Ser Ser Phe Asn Phe Phe Ser Phe Arg Phe
50 55 60
<210> 7
<211> 57
<212> PRT
<213> 拟南芥(Arabidopsis thaliana)
<400> 7
Thr Ala Ile Tyr Gly Ile Lys Pro Arg Pro Leu Ser Phe His Val Gln
1 5 10 15
Arg Lys Gly Cys Leu Ile Ile Thr Asn Pro Leu Pro His Gly Gly Arg
20 25 30
Gly Ala Leu Pro Ser Glu Gly Gly Ser Pro Ser Asp Leu Leu Phe Leu
35 40 45
Ala Gly Gly Gly Ser Thr Asn Ser His
50 55
<210> 8
<211> 64
<212> PRT
<213> 苹果(Malus x domesticus)
<400> 8
Thr Ala Ile Pro Arg Ala Pro Arg Pro Leu Val His Val Arg Gly Val
1 5 10 15
Gly Arg Lys Gly Cys Val Ile Glu Ser Asn Pro Ser Pro His Gly Gly
20 25 30
Arg Gly Ala Leu Pro Ser Glu Gly Gly Ser Pro Ser Asp Leu Leu Phe
35 40 45
Leu Ala Gly Gly Gly Ser Pro Ser Ser Val Phe Leu Phe Cys Phe Tyr
50 55 60
<210> 9
<211> 61
<212> PRT
<213> 蒺藜苜蓿(Medicago truncatula)
<400> 9
Thr Ala Phe Leu Arg Val Tyr Arg Ser Leu Ser His Ala Arg Thr Val
1 5 10 15
Arg Arg Lys Gly Cys Cys Leu Thr Pro Thr Asn Pro Ser Pro His Gly
20 25 30
Gly Arg Gly Ala Leu Pro Ser Glu Gly Gly Ser Pro Ser Asp Leu Leu
35 40 45
Phe Leu Ala Gly Gly Gly Val Phe Ala Pro Ser Ser Phe
50 55 60
<210> 10
<211> 63
<212> PRT
<213> 毛果杨(Populus trichocarpa)
<400> 10
Thr Ala Ile His Gly Val Thr Arg Ser Leu Ile His Val Arg Ala Val
1 5 10 15
Arg Arg Lys Gly Cys Val Ile Glu Ser Ser Asn Pro Ser Pro His Gly
20 25 30
Gly Arg Gly Ala Leu Pro Ser Glu Gly Gly Ser Pro Ser Asp Leu Leu
35 40 45
Phe Leu Ala Gly Gly Gly Phe Phe Phe Phe Cys Leu Val Val Val
50 55 60
<210> 11
<211> 80
<212> PRT
<213> 北美云杉(Picea sitchensis)
<400> 11
Thr Ala Ile Lys Arg Ile Leu Arg Phe Gln Pro His Asp Arg Arg Arg
1 5 10 15
Ile Leu Arg Ser Arg Asn Ala Gly Cys Ala Leu Glu Ser Thr Pro Ser
20 25 30
Pro His Gly Gly Arg Gly Ala Leu Pro Ser Glu Gly Gly Ser Pro Ser
35 40 45
Asp Leu Leu Phe Leu Ala Gly Gly Gly Cys Asp Arg Ala Leu Phe Cys
50 55 60
Leu Ala His Pro Phe Leu Leu Ser Arg Gly Glu Ile Ile Trp Glu Arg
65 70 75 80
<210> 12
<211> 57
<212> PRT
<213> 小立碗藓(Physcomitrella patens)
<400> 12
Met Ser Lys Asp Phe Tyr Arg Ala Gly Ile Gln Leu Ser Arg Ser Leu
1 5 10 15
Ser Ser Ser Leu Ser Leu His Gly Gly Arg Gly Ala Ala Pro Ser Glu
20 25 30
Gly Gly Arg Pro Ser Asp Leu Ser Ala Leu Ala Gly Gly Gly Phe Leu
35 40 45
Ser Asn Phe His His Gly Ala Asp Pro
50 55
<210> 13
<211> 60
<212> PRT
<213> 软枣猕猴桃(A. arguta)
<400> 13
Thr Ala Ile Leu Gly Val Ser Arg Pro Leu Ile His Val Arg Ser Val
1 5 10 15
Arg Arg Lys Gly Cys Val Val Glu Ser Asn Pro Ser Pro His Gly Gly
20 25 30
Arg Gly Ala Leu Pro Ser Glu Gly Gly Ser Pro Ser Asp Leu Leu Phe
35 40 45
Leu Ala Gly Gly Gly His Phe Ala Phe Ser Val Tyr
50 55 60
<210> 14
<211> 60
<212> PRT
<213> 毛花猕猴桃(A. eriantha)
<400> 14
Thr Ala Ile Leu Gly Val Ser Arg Pro Leu Ile His Val Arg Ser Val
1 5 10 15
Arg Arg Lys Gly Cys Val Val Glu Ser Asn Pro Ser Pro His Gly Gly
20 25 30
Arg Gly Ala Leu Pro Ser Glu Gly Gly Ser Pro Ser Asp Leu Leu Phe
35 40 45
Leu Ala Gly Gly Gly His Phe Ala Phe Ser Val Tyr
50 55 60
<210> 15
<211> 60
<212> PRT
<213> 中华猕猴桃(A. chinensis)
<400> 15
Thr Ala Ile Leu Gly Val Ser Arg Pro Leu Ile His Val Arg Ser Val
1 5 10 15
Arg Arg Lys Gly Cys Val Val Glu Ser Asn Pro Ser Pro His Gly Gly
20 25 30
Arg Gly Ala Leu Pro Ser Glu Gly Gly Ser Pro Ser Asp Leu Leu Phe
35 40 45
Leu Ala Gly Gly Gly His Phe Ala Phe Ser Val Tyr
50 55 60
<210> 16
<211> 64
<212> PRT
<213> 草莓(Fragaria)
<400> 16
Thr Ala Ile His Arg Val Ser Arg Pro Leu Ile His Val Arg Arg Thr
1 5 10 15
Val Arg Arg Lys Gly Cys Val Ile Glu Ser Asn Pro Ser Pro His Gly
20 25 30
Gly Arg Gly Ala Leu Pro Ser Glu Gly Gly Ser Pro Ser Asp Leu Leu
35 40 45
Phe Leu Ala Gly Gly Gly Val His Val Ser Asp Leu Arg Phe Phe Phe
50 55 60
<210> 17
<211> 61
<212> PRT
<213> 马铃薯(Solanum tuberosum)
<400> 17
Thr Ala Ile His Lys Val Asn Arg Arg Pro Leu Leu His Val Pro Ala
1 5 10 15
Val Arg Arg Lys Gly Cys Val Thr Ala Thr Asn Pro Ala Pro His Gly
20 25 30
Gly Arg Gly Ala Leu Pro Ser Glu Gly Gly Ser Pro Ser Asp Leu Leu
35 40 45
Phe Leu Ala Gly Gly Gly Ser Phe Leu Ser Phe Ser Tyr
50 55 60
<210> 18
<211> 55
<212> PRT
<213> 莱茵衣藻(Chlamydomonas rheinhardtii)
<400> 18
Met His Leu Arg Glu Pro Val Lys Thr Ala Phe Ser Glu Ala Ala Arg
1 5 10 15
Val Gln Ser Ala Ala Ser Gln Pro Ala Thr Ala Asn Arg Cys Ser Gly
20 25 30
Gly Arg Gly Ala Ala Pro Ser Cys Gly Gly Lys Pro Lys Asp Ala Leu
35 40 45
Ser Lys Ala Gly Gly Gly Gln
50 55
<210> 19
<211> 58
<212> PRT
<213> 玉米(Zea mays)
<220>
<221> misc_feature
<222> (56)..(56)
<223> Xaa可以为任意天然存在的氨基酸。
<400> 19
Thr Ala Ser Val Ala Ala Pro Arg Arg Gly Pro Ala Ala Ala Gln Val
1 5 10 15
Glu Pro Thr Gly Thr Ile Ala Ser Ala Val Ala Ser Ser Pro Ala Pro
20 25 30
His Gly Gly Arg Gly Ala Leu Pro Ser Ala Gly Gly Ser Pro Ser Asp
35 40 45
Leu Leu Phe Leu Ala Gly Gly Xaa Arg Leu
50 55
<210> 20
<211> 61
<212> PRT
<213> 江南卷柏(Selaginella moellendorffi)
<400> 20
Thr Ala Ser Ile Glu Leu Leu Ser Arg His Pro Ile Ile Cys Tyr Gly
1 5 10 15
His Ser Val Ser Ser Cys Lys Thr Leu Leu Ser Ser Leu Ser Cys His
20 25 30
Gly Gly Arg Gly Ala Ser Pro Ser Glu Gly Gly His Pro Ser Asp Leu
35 40 45
Thr Phe Leu Ala Gly Gly Gly Leu Leu Leu Gly Ala Pro
50 55 60
<210> 21
<211> 28
<212> PRT
<213> 毛花猕猴桃(A. eriantha)
<400> 21
Asn Pro Ser Pro His Gly Gly Arg Gly Ala Leu Pro Ser Glu Gly Gly
1 5 10 15
Ser Pro Ser Asp Leu Leu Phe Leu Ala Gly Gly Gly
20 25
<210> 22
<211> 28
<212> PRT
<213> 黄瓜(Cucumis sativus)
<400> 22
Asn Pro Ser Pro His Gly Gly Arg Gly Ala Leu Pro Ser Glu Gly Gly
1 5 10 15
Ser Pro Ser Asp Leu Leu Phe Leu Ala Gly Gly Gly
20 25
<210> 23
<211> 28
<212> PRT
<213> 大豆(Glycine max)
<400> 23
Asn Pro Ser Pro His Gly Gly Arg Gly Ala Leu Pro Ser Glu Gly Gly
1 5 10 15
Ser Pro Ser Asp Leu Leu Phe Leu Ala Gly Gly Gly
20 25
<210> 24
<211> 28
<212> PRT
<213> 番茄(Solanum lycopersicum)
<400> 24
Asn Pro Ala Pro His Gly Gly Arg Gly Ala Leu Pro Ser Glu Gly Gly
1 5 10 15
Ser Pro Ser Asp Leu Leu Phe Leu Ala Gly Gly Gly
20 25
<210> 25
<211> 28
<212> PRT
<213> 葡萄(Vitis vinifera)
<400> 25
Asn Pro Ser Pro His Gly Gly Arg Gly Ala Leu Pro Ser Glu Gly Gly
1 5 10 15
Ser Pro Ser Asp Leu Leu Phe Leu Ala Gly Gly Gly
20 25
<210> 26
<211> 28
<212> PRT
<213> 拟南芥(Arabidopsis thaliana)
<400> 26
Asn Pro Leu Pro His Gly Gly Arg Gly Ala Leu Pro Ser Glu Gly Gly
1 5 10 15
Ser Pro Ser Asp Leu Leu Phe Leu Ala Gly Gly Gly
20 25
<210> 27
<211> 28
<212> PRT
<213> 拟南芥(Arabidopsis thaliana)
<400> 27
Asn Pro Leu Pro His Gly Gly Arg Gly Ala Leu Pro Ser Glu Gly Gly
1 5 10 15
Ser Pro Ser Asp Leu Leu Phe Leu Ala Gly Gly Gly
20 25
<210> 28
<211> 28
<212> PRT
<213> 苹果(Malus x domesticus)
<400> 28
Asn Pro Ser Pro His Gly Gly Arg Gly Ala Leu Pro Ser Glu Gly Gly
1 5 10 15
Ser Pro Ser Asp Leu Leu Phe Leu Ala Gly Gly Gly
20 25
<210> 29
<211> 28
<212> PRT
<213> 蒺藜苜蓿(Medicago truncatula)
<400> 29
Asn Pro Ser Pro His Gly Gly Arg Gly Ala Leu Pro Ser Glu Gly Gly
1 5 10 15
Ser Pro Ser Asp Leu Leu Phe Leu Ala Gly Gly Gly
20 25
<210> 30
<211> 28
<212> PRT
<213> 毛果杨(Populus trichocarpa)
<400> 30
Asn Pro Ser Pro His Gly Gly Arg Gly Ala Leu Pro Ser Glu Gly Gly
1 5 10 15
Ser Pro Ser Asp Leu Leu Phe Leu Ala Gly Gly Gly
20 25
<210> 31
<211> 28
<212> PRT
<213> 北美云杉(Picea sitchensis)
<400> 31
Thr Pro Ser Pro His Gly Gly Arg Gly Ala Leu Pro Ser Glu Gly Gly
1 5 10 15
Ser Pro Ser Asp Leu Leu Phe Leu Ala Gly Gly Gly
20 25
<210> 32
<211> 28
<212> PRT
<213> 小立碗藓(Physcomitrella patens)
<400> 32
Ser Leu Ser Leu His Gly Gly Arg Gly Ala Ala Pro Ser Glu Gly Gly
1 5 10 15
Arg Pro Ser Asp Leu Ser Ala Leu Ala Gly Gly Gly
20 25
<210> 33
<211> 28
<212> PRT
<213> 软枣猕猴桃(A. arguta)
<400> 33
Asn Pro Ser Pro His Gly Gly Arg Gly Ala Leu Pro Ser Glu Gly Gly
1 5 10 15
Ser Pro Ser Asp Leu Leu Phe Leu Ala Gly Gly Gly
20 25
<210> 34
<211> 28
<212> PRT
<213> 毛花猕猴桃(A. eriantha)
<400> 34
Asn Pro Ser Pro His Gly Gly Arg Gly Ala Leu Pro Ser Glu Gly Gly
1 5 10 15
Ser Pro Ser Asp Leu Leu Phe Leu Ala Gly Gly Gly
20 25
<210> 35
<211> 28
<212> PRT
<213> 中华猕猴桃(A. chinensis)
<400> 35
Asn Pro Ser Pro His Gly Gly Arg Gly Ala Leu Pro Ser Glu Gly Gly
1 5 10 15
Ser Pro Ser Asp Leu Leu Phe Leu Ala Gly Gly Gly
20 25
<210> 36
<211> 28
<212> PRT
<213> 草莓(Fragaria)
<400> 36
Asn Pro Ser Pro His Gly Gly Arg Gly Ala Leu Pro Ser Glu Gly Gly
1 5 10 15
Ser Pro Ser Asp Leu Leu Phe Leu Ala Gly Gly Gly
20 25
<210> 37
<211> 28
<212> PRT
<213> 马铃薯(Solanum tuberosum)
<400> 37
Asn Pro Ala Pro His Gly Gly Arg Gly Ala Leu Pro Ser Glu Gly Gly
1 5 10 15
Ser Pro Ser Asp Leu Leu Phe Leu Ala Gly Gly Gly
20 25
<210> 38
<211> 28
<212> PRT
<213> 莱茵衣藻(Chlamydomonas rheinhardtii)
<400> 38
Ala Asn Arg Cys Ser Gly Gly Arg Gly Ala Ala Pro Ser Cys Gly Gly
1 5 10 15
Lys Pro Lys Asp Ala Leu Ser Lys Ala Gly Gly Gly
20 25
<210> 39
<211> 26
<212> PRT
<213> 玉米(Zea mays)
<400> 39
Pro Ala Pro His Gly Gly Arg Gly Ala Leu Pro Ser Ala Gly Gly Ser
1 5 10 15
Pro Ser Asp Leu Leu Phe Leu Ala Gly Gly
20 25
<210> 40
<211> 28
<212> PRT
<213> 江南卷柏(Selaginella moellendorffi)
<400> 40
Ser Leu Ser Cys His Gly Gly Arg Gly Ala Ser Pro Ser Glu Gly Gly
1 5 10 15
His Pro Ser Asp Leu Thr Phe Leu Ala Gly Gly Gly
20 25
<210> 41
<211> 180
<212> DNA
<213> 毛花猕猴桃(A. eriantha)
<400> 41
acggctatac tcggagtttc tcggccgctc atacatgtcc ggtctgtacg acgcaagggt 60
tgtgtagtcg agagcaaccc ttcgccgcac ggaggacgtg gcgccttgcc gtccgaaggc 120
ggtagcccct ccgacctcct cttcctcgcc ggcggcggtc acttcgcttt ctccgtctac 180
<210> 42
<211> 186
<212> DNA
<213> 黄瓜(Cucumis sativus)
<400> 42
acggctatac acgtagtttc ccggtcgttc tttcatgtca gggctgtacg acggaagggt 60
tgtataactc cgacaaaccc ttcgccgcac ggcggacgtg gtgctttgcc ttccgaaggt 120
ggtagtcctt ctgatcttct ttttctcgcc ggcggtggtt tctcttgctt cttctcttct 180
tcgtat 186
<210> 43
<211> 174
<212> DNA
<213> 大豆(Glycine max)
<400> 43
acggctattc taagagtgtc tcgctctctc attcatgtcc caactgtacg acggaggaca 60
ggttgcgtaa ctgccaccaa cccttcgccg cacggtgggc gtggtgcttt gccttctgaa 120
ggtggtagcc cttcagactt gctcttctta gctggtggtg gttctgctgt cttc 174
<210> 44
<211> 183
<212> DNA
<213> 番茄(Solanum lycopersicum)
<400> 44
acggctatac acaaagtaaa ccgccgacca cttttacatg ttccagcagt acgtcgtaag 60
ggttgtgtaa cagctactaa ccctgcgccg cacggtggac gtggcgcttt gccttctgaa 120
ggtggtagtc cttccgacct cctcttcctt gccggcggcg gttctttcct ctccttctcc 180
tac 183
<210> 45
<211> 177
<212> DNA
<213> 葡萄(Vitis vinifera)
<400> 45
acggctatac aaagaattcc gccgcctctc atacatgtcc gggcggtacg acgcaagggy 60
tgtgtaattg agagcaaccc ttcgccgcac ggcgggcgtg gcgctttgcc ttcagaaggc 120
ggtagtccct ctgatctgct cttcctcgcc ggcggtggtt ccaacgcttt cctctgc 177
<210> 46
<211> 192
<212> DNA
<213> 拟南芥(Arabidopsis thaliana)
<400> 46
acggctatac acgggatatc acggggtgtt agctcacatg tccatattgt ccgacagaag 60
ggttgtttaa tcgaaactaa tcctttgccg cacggaggac gtggagctct gccgtctgaa 120
ggcggcagcc cttccgatct cctctttctc gccggtggcg gttccagctt taacttcttt 180
tcctttaggt tt 192
<210> 47
<211> 183
<212> DNA
<213> 拟南芥(Arabidopsis thaliana)
<400> 47
acggcttttc ttagagttta tcggtcactt tcacatgccc gaactgtacg acgtaagggt 60
tgttgcttaa ctccgactaa cccttcgccg cacggtgggc gtggtgctct gccttctgaa 120
ggtggtagcc cctccgatct tctcttcctc gccggtggtg gtgtctttgc tccttcttcc 180
ttc 183
<210> 48
<211> 192
<212> DNA
<213> 苹果(Malus x domesticus)
<400> 48
acggctatac ccagagctcc tcggccgctc gttcatgtcc ggggtgtcgg acgaaagggt 60
tgtgtaattg agagcaaccc ttcgccgcac ggcgggcgtg gtgctttgcc ttccgaaggc 120
ggtagcccgt ctgacctcct cttcctcgcc ggtggcggct ccccttcctc tgtttttctc 180
ttctgctttt at 192
<210> 49
<211> 183
<212> DNA
<213> 蒺藜苜蓿(Medicago truncatula)
<400> 49
acggcttttc ttagagttta tcggtcactt tcacatgccc gaactgtacg acgtaagggt 60
tgttgcttaa ctccgactaa cccttcgccg cacggtgggc gtggtgctct gccttctgaa 120
ggtggtagcc cctccgatct tctcttcctc gccggtggtg gtgtctttgc tccttcttcc 180
ttc 183
<210> 50
<211> 189
<212> DNA
<213> 毛果杨(Populus trichocarpa)
<400> 50
acggctatac acggagtaac tcggtcccta attcatgtcc gggctgttcg acgtaagggc 60
tgtgtaatag agagcagcaa cccttcgccg cacggtggac gtggtgcttt accctcggaa 120
ggcggtagcc cttctgatct cctctttcta gctggtggcg gtttcttctt cttctgttta 180
gtagtagtt 189
<210> 51
<211> 240
<212> DNA
<213> 北美云杉(Picea sitchensis)
<400> 51
acggctatta aacgtatttt gcggttccag ccccatgatc gcagaagaat tctgcggagc 60
aggaacgctg gttgtgcact agagagtacc ccgtcgccgc acggtgggag aggagccttg 120
ccctcggaag gcgggagccc ctctgatctc ctctttctcg caggaggcgg ttgcgaccga 180
gcccttttct gcctcgccca tccatttctt ctgagcagag gagaaataat ttgggagagg 240
<210> 52
<211> 171
<212> DNA
<213> 小立碗藓(Physcomitrella patens)
<400> 52
atgagcaaag acttctaccg tgcaggaatc caactgtccc gatctctctc ttcctctctt 60
tccttgcacg gtggtcgggg ggccgccccc agtgaaggcg gtcgtccctc tgacctatct 120
gcacttgctg ggggaggttt tctctcaaac tttcaccacg gtgctgatcc t 171
<210> 53
<211> 180
<212> DNA
<213> 软枣猕猴桃(A. arguta)
<400> 53
acggctatac tcggagtttc tcggccgctc atacatgtcc ggtctgtacg acgcaagggt 60
tgtgtagtcg agagcaaccc ttcgccgcac ggcggacgtg gcgccttgcc gtccgaaggc 120
ggtagcccct ccgacctcct cttcctcgcc ggtggcggtc acttcgcttt ctccgtctac 180
<210> 54
<211> 180
<212> DNA
<213> 毛花猕猴桃(A. eriantha)
<400> 54
acggctatac tcggagtttc tcggccgctc atacatgtcc ggtctgtacg acgcaagggt 60
tgtgtagtcg agagcaaccc ttcgccgcac ggaggacgtg gcgccttgcc gtccgaaggc 120
ggtagcccct ccgacctcct cttcctcgcc ggcggcggtc acttcgcttt ctccgtctac 180
<210> 55
<211> 180
<212> DNA
<213> 中华猕猴桃(A. chinensis)
<400> 55
acggctatac tcggagtttc tcggccgctc atacatgtcc ggtctgtacg acgcaagggt 60
tgtgtagtcg agagcaaccc ttcgccgcac ggcggacgtg gcgccttgcc gtccgaaggc 120
ggtagcccct ccgacctcct cttcctcgcc ggcggcggtc acttcgcttt ctccgtctac 180
<210> 56
<211> 192
<212> DNA
<213> 草莓(Fragaria)
<400> 56
acggctatac acagagtttc acggccactc attcatgtcc gccggactgt ccgacgtaag 60
ggttgtgtaa ttgagagcaa cccttcgccg cacggcgggc gtggtgcttt gccgtccgaa 120
ggaggaagtc cttccgacct ccttttcctc gccggcggtg gtgtccacgt ttccgacttg 180
cgtttctttt tc 192
<210> 57
<211> 183
<212> DNA
<213> 马铃薯(Solanum tuberosum)
<400> 57
acggctatac acaaagtaaa ccgccgacca cttttacatg ttccagcagt acgtcgtaag 60
ggttgtgtaa cagctactaa ccctgcgccg cacggtggac gtggcgcttt gccctctgaa 120
ggtggcagtc cttccgacct cctcttcctt gccggcggcg gttctttcct ctccttctcc 180
tac 183
<210> 58
<211> 165
<212> DNA
<213> 莱茵衣藻(Chlamydomonas rheinhardtii)
<400> 58
atgcatttgc gtgagccggt aaaaacggcg ttctctgagg cagcccgcgt tcagtcggct 60
gcgtcgcagc ctgcgaccgc caatcggtgc tccggtggcc gtggtgcagc cccctcgtgc 120
ggtggcaagc ccaaggacgc tctgagcaag gcgggcggtg gccag 165
<210> 59
<211> 174
<212> DNA
<213> 玉米(Zea mays)
<400> 59
acggctagcg ttgcagcccc ccggcgcggc cccgcagctg cgcaggtgga gcccacgggc 60
accatcgcct ccgctgtcgc gtccagcccc gctccgcacg gcggccgcgg ggcgctgccc 120
tcggccggag gaagcccgtc cgatctcctc ttcctcgccg gcggsgktcg cctc 174
<210> 60
<211> 183
<212> DNA
<213> 江南卷柏(Selaginella moellendorffi)
<400> 60
acggcttcaa ttgagctttt gagtcgacac cccatcattt gttatggaca cagtgtttcc 60
agttgtaaga ctctgctgag ttccctctct tgccacggtg gtcgaggggc tagcccctcg 120
gaaggaggac acccttcaga tcttaccttt cttgctggtg gtggccttct tctcggagca 180
cca 183
<210> 61
<211> 105
<212> DNA
<213> 毛花猕猴桃(A. eriantha)
<400> 61
aagggttgtg tagtcgagag caacccttcg ccgcacggag gacgtggcgc cttgccgtcc 60
gaaggcggta gcccctccga cctcctcttc ctcgccggcg gcggt 105
<210> 62
<211> 105
<212> DNA
<213> 黄瓜(Cucumis sativus)
<400> 62
aagggttgta taactccgac aaacccttcg ccgcacggcg gacgtggtgc tttgccttcc 60
gaaggtggta gtccttctga tcttcttttt ctcgccggcg gtggt 105
<210> 63
<211> 108
<212> DNA
<213> 大豆(Glycine max)
<400> 63
aggacaggtt gcgtaactgc caccaaccct tcgccgcacg gtgggcgtgg tgctttgcct 60
tctgaaggtg gtagcccttc agacttgctc ttcttagctg gtggtggt 108
<210> 64
<211> 105
<212> DNA
<213> 番茄(Solanum lycopersicum)
<400> 64
aagggttgtg taacagctac taaccctgcg ccgcacggtg gacgtggcgc tttgccttct 60
gaaggtggta gtccttccga cctcctcttc cttgccggcg gcggt 105
<210> 65
<211> 105
<212> DNA
<213> 葡萄(Vitis vinifera)
<400> 65
aagggytgtg taattgagag caacccttcg ccgcacggcg ggcgtggcgc tttgccttca 60
gaaggcggta gtccctctga tctgctcttc ctcgccggcg gtggt 105
<210> 66
<211> 105
<212> DNA
<213> 拟南芥(Arabidopsis thaliana)
<400> 66
aagggttgtt taatcgaaac taatcctttg ccgcacggag gacgtggagc tctgccgtct 60
gaaggcggca gcccttccga tctcctcttt ctcgccggtg gcggt 105
<210> 67
<211> 105
<212> DNA
<213> 拟南芥(Arabidopsis thaliana)
<400> 67
aagggttgtt taatcataac taatcctttg cctcacggag gacgtggagc tctgccgtct 60
gaaggcggca gtccctccga tctcctcttc ctcgccggag gcggt 105
<210> 68
<211> 105
<212> DNA
<213> 苹果(Malus x domesticus)
<400> 68
aagggttgtg taattgagag caacccttcg ccgcacggcg ggcgtggtgc tttgccttcc 60
gaaggcggta gcccgtctga cctcctcttc ctcgccggtg gcggc 105
<210> 69
<211> 107
<212> DNA
<213> 蒺藜苜蓿(Medicago truncatula)
<400> 69
aagggttgtt gcttaactcc gactaaccct tcgccgcacg gtgggcgtgg tgctctgcct 60
tctgaaggtg gtagcccctc cgatcttctc ttcctcgccg gtggtgg 107
<210> 70
<211> 108
<212> DNA
<213> 毛果杨(Populus trichocarpa)
<400> 70
aagggctgtg taatagagag cagcaaccct tcgccgcacg gtggacgtgg tgctttaccc 60
tcggaaggcg gtagcccttc tgatctcctc tttctagctg gtggcggt 108
<210> 71
<211> 102
<212> DNA
<213> 北美云杉(Picea sitchensis)
<400> 71
ggttgtgcac tagagagtac cccgtcgccg cacggtggga gaggagcctt gccctcggaa 60
ggcgggagcc cctctgatct cctctttctc gcaggaggcg gt 102
<210> 72
<211> 78
<212> DNA
<213> 小立碗藓(Physcomitrella patens)
<400> 72
tccttgcacg gtggtcgggg ggccgccccc agtgaaggcg gtcgtccctc tgacctatct 60
gcacttgctg ggggaggt 78
<210> 73
<211> 105
<212> DNA
<213> 软枣猕猴桃(A. arguta)
<400> 73
aagggttgtg tagtcgagag caacccttcg ccgcacggcg gacgtggcgc cttgccgtcc 60
gaaggcggta gcccctccga cctcctcttc ctcgccggtg gcggt 105
<210> 74
<211> 105
<212> DNA
<213> 毛花猕猴桃(A. eriantha)
<400> 74
aagggttgtg tagtcgagag caacccttcg ccgcacggag gacgtggcgc cttgccgtcc 60
gaaggcggta gcccctccga cctcctcttc ctcgccggcg gcggt 105
<210> 75
<211> 105
<212> DNA
<213> 中华猕猴桃(A. chinensis)
<400> 75
aagggttgtg tagtcgagag caacccttcg ccgcacggcg gacgtggcgc cttgccgtcc 60
gaaggcggta gcccctccga cctcctcttc ctcgccggcg gcggt 105
<210> 76
<211> 105
<212> DNA
<213> 草莓(Fragaria)
<400> 76
aagggttgtg taattgagag caacccttcg ccgcacggcg ggcgtggtgc tttgccgtcc 60
gaaggaggaa gtccttccga cctccttttc ctcgccggcg gtggt 105
<210> 77
<211> 105
<212> DNA
<213> 马铃薯(Solanum tuberosum)
<400> 77
aagggttgtg taacagctac taaccctgcg ccgcacggtg gacgtggcgc tttgccctct 60
gaaggtggca gtccttccga cctcctcttc cttgccggcg gcggt 105
<210> 78
<211> 69
<212> DNA
<213> 莱茵衣藻(Chlamydomonas rheinhardtii)
<400> 78
ggtggccgtg gtgcagcccc ctcgtgcggt ggcaagccca aggacgctct gagcaaggcg 60
ggcggtggc 69
<210> 79
<211> 81
<212> DNA
<213> 玉米(Zea mays)
<400> 79
cccgctccgc acggcggccg cggggcgctg ccctcggccg gaggaagccc gtccgatctc 60
ctcttcctcg ccggcggsgk t 81
<210> 80
<211> 72
<212> DNA
<213> 江南卷柏(Selaginella moellendorffi)
<400> 80
cacggtggtc gaggggctag cccctcggaa ggaggacacc cttcagatct tacctttctt 60
gctggtggtg gc 72
<210> 81
<211> 655
<212> DNA
<213> 毛花猕猴桃(A. eriantha)
<220>
<221> misc_feature
<222> (219)..(219)
<223> n为a、c、g或t。
<220>
<221> misc_feature
<222> (356)..(356)
<223> n为a、c、g或t。
<220>
<221> misc_feature
<222> (364)..(364)
<223> n为a、c、g或t。
<400> 81
tctctccgtc cctctcaata gttgtctcca ttcgcagtaa aatcactaag gccgctcgtc 60
cctcagtgca caccacggcc cctccacagc cgcattcacc tctctctctc tctctctgct 120
ctatctatat atccccccaa tctggcctct cttcacctca cccccaaaat ctacacaaaa 180
tcaatccttc atcttccaca tcggcctcca aaacccacnc tcttctccac aatccagaca 240
caccttgagc ggctggcgtt gagcgaatag atagagatag agagagagat tttctgcttc 300
gatcgggggt aaaacccggt gtttgacaag ttgtagacat cacggctata ctcggnagtt 360
tctncggccg ctcatacatg tccggtctgt acgacgcaag ggttgtgtag tcgagagcaa 420
cccttcgccg cacggcggac gtggcgcctt gccgtccgaa ggcggtagcc cctccgacct 480
cctcttcctc gccggcggcg gtcacttcgc tttctccgtc tactagctta ttaggtttat 540
tcttacttag tgagtaattc gtcctattat agttcgtaag ttcatcaaag atctgttact 600
tgattcgtct ttcgttgctc gagtcttggt gttttttgcg ttttctgagt tcgag 655
<210> 82
<211> 600
<212> DNA
<213> 黄瓜(Cucumis sativus)
<400> 82
tccctttcta tataattgct tcattcccca cctttccatg ttcgtgcagc ccattcaatc 60
ccctcatttt aacccacttc ctctttttct ttttctcctt cctcttccag ttcccttttc 120
cccatctggg ttctcttgat ttctcttaaa atccaacaac ccatgttcga ctttgaggaa 180
ttggtgcgtt ggaattgagt tttcggagaa gatttttcgt tttttatcac aacccatcta 240
ctccaggtaa ggggtaaaac ccgggttcgt caggctgtag acatcacggc tatacacgta 300
gtttcccggt cgttctttca tgtcagggct gtacgacgga agggttgtat aactccgaca 360
aacccttcgc cgcacggcgg acgtggtgct ttgccttccg aaggtggtag tccttctgat 420
cttctttttc tcgccggcgg tggtttctct tgcttcttct cttcttcgta ttagctttcc 480
gtttgtgttt tagctctacc ggtttaggat ttgacatcag caagtttctg tttcgcgttt 540
atttcttttg ggtgggggag attttggtgt tcggtttggt ttgaattaga agcagacgat 600
<210> 83
<211> 429
<212> DNA
<213> 大豆(Glycine max)
<400> 83
gacaaactca caccacatcc atctttgcct tctgcatgtt ggttctctgt aaacagatac 60
tgcaaaagaa gaataatatt gaatatttgg ttgggttgaa tccctgggtt gaagcgttgc 120
agacatcacg gctattctaa gagtgtctcg ctctctcatt catgtcccaa ctgtacgacg 180
gaggacaggt tgcgtaactg ccaccaaccc ttcgccgcac ggtgggcgtg gtgctttgcc 240
ttctgaaggt ggtagccctt cagacttgct cttcttagct ggtggtggtt ctgctgtctt 300
ctagcttctt cttaactctt ttttcttttt actactttta agctaccttg ttttcaaaat 360
aacaaaaaca aacactttct tacttcataa gatcaccttt tcttcatctt ctacttctcc 420
ttcactaaa 429
<210> 84
<211> 680
<212> DNA
<213> 番茄(Solanum lycopersicum)
<400> 84
atttgttcgg tatactgtaa ccccctgttt gcgattggcc ttgtagcccc gttttacatc 60
ttccagagac tccatttgta tcggttcaca tacagtagca aagcgccatt atcttactct 120
accccattgg caaacccaca gccacaattt tccaatcctc cattatccct tctacaattt 180
tctatataaa tacccacatc tctctgctct actcccttat tatcaacaac aaccaccaaa 240
tttcttcttt tttttcttcg atagtagcaa tctatcaaca aaaacagaga ccccatcaca 300
agaatcttgg aattttagtg ttgggtttaa gaggaaaagg ggttattgta ttttgcagtt 360
ttgagggtaa agcccagttt aacaagttgt agacatcacg gctatacaca aagtaaaccg 420
ccgaccactt ttacatgttc cagcagtacg tcgtaagggt tgtgtaacag ctactaaccc 480
tgcgccgcac ggtggacgtg gcgctttgcc ttctgaaggt ggtagtcctt ccgacctcct 540
cttccttgcc ggcggcggtt ctttcctctc cttctcctac tagatatagt tatacttact 600
atagatctct agcttattac gtacagttgt atctagtatt ctattgatta ttcgaagaaa 660
acacacaaaa agaagtaaag 680
<210> 85
<211> 600
<212> DNA
<213> 葡萄(Vitis vinifera)
<400> 85
acacaaaagc ctctcaagtc caacagatag gccgccttct tcctcatttc actgcagcta 60
gcttcctatt tttcttcttc caaaatccag ggatttcaag agaagagaaa gagaaataag 120
ggttctgcgg gttgtgggtc ggtgtgtttt gtggttttct atatagggtt tctaaggagg 180
gagggatttt gatttgggtt gtgacggtgg tggggtaaaa cccttgttcg acgagttgta 240
gacatcacgg ctatacaaag aattccgccg cctctcatac atgtccgggc ggtacgacgc 300
aagggytgtg taattgagag caacccttcg ccgcacggcg ggcgtggcgc tttgccttca 360
gaaggcggta gtccctctga tctgctcttc ctcgccggcg gtggttccaa cgctttcctc 420
tgctagttta ggcttatatt ctgcataata tagctactgt ctttaggatt agatcaacca 480
atccgtatcg aacactcgat ctctcgcttt agccatttct ttagatcaat caatccgtat 540
cgaacaatcg atctctcgct ttagccattt ctttaggttg gtgtttgagt tcttgaaaaa 600
<210> 86
<211> 503
<212> DNA
<213> 拟南芥(Arabidopsis thaliana)
<400> 86
gtatcatcaa aaaacacctc aaagaattat tcattcaggc atcttctcaa atttttgttt 60
gtgaaaaaaa cccacatcaa aagatctctc atttattcgt ttcgtttctg ctgttttgag 120
tgtcgggttc gttttagctg taatcttttt ttccggcgtt cgatttgaaa aaatccgggg 180
aacaggtgat cggaatcacg gctatacacg ggatatcacg gggtgttagc tcacatgtcc 240
atattgtccg acagaagggt tgtttaatcg aaactaatcc tttgccgcac ggaggacgtg 300
gagctctgcc gtctgaaggc ggcagccctt ccgatctcct ctttctcgcc ggtggcggtt 360
ccagctttaa cttcttttcc tttaggtttt aggagttagg gtttgttagt gttttttcct 420
tcttcttttt ttggtgctct tgaatcgctt ttttcttggg ggaagttttt tcttttgctc 480
ttcgaaattt gtcttttttg aga 503
<210> 87
<211> 420
<212> DNA
<213> 拟南芥(Arabidopsis thaliana)
<400> 87
caaaatctca cacatcaaac acgtgaattt gctctctttc tggttcactc acctaccatt 60
actataagtc tgaaagagtg attgaaaccc acctcgaaaa atctatcctt ttttttgttt 120
tccttctccg gcgaatcccc ggggagattg gtaatcggta atcacggcta tttacgggat 180
aaagccacgg cctttgagct ttcatgtcca acgaaagggt tgtttaatca taactaatcc 240
tttgcctcac ggaggacgtg gagctctgcc gtctgaaggc ggcagtccct ccgatctcct 300
cttcctcgcc ggaggcggtt ccacaaatag ccactaaccc taaccctttt tctaattagg 360
tttttagttc ttagagtcct gtattaatct gttatttcga gattataata tttgtgagca 420
<210> 88
<211> 554
<212> DNA
<213> 苹果(Malus x domesticus)
<400> 88
ccccacctgc tcccccaatt ccccagtacc catttgtgtt tttcgattca gttcgaaacc 60
aggcggtctt cacctttctg gttgttttcc tatctcggtt ttaaggagga agaagaaagg 120
aaggcgtttt gatcattttc ttttcgaatt tcttttgggg taagacccag gttcgacgag 180
ttgtagacat cacggctata cccagagctc ctcggccgct cgttcatgtc cggggtgtcg 240
gacgaaaggg ttgtgtaatt gagagcaacc cttcgccgca cggcgggcgt ggtgctttgc 300
cttccgaagg cggtagcccg tctgacctcc tcttcctcgc cggtggcggc tccccttcct 360
ctgtttttct cttctgcttt tattagtttt atttttatag agtttcttgc ttagattttt 420
agagattttt tgttctataa agcgctcgag tagatcgtat ttttgttttc gggggttttt 480
tttttttgtg gtgtttgatt tttactgaga aatcgagaaa aaaagggaga gagagagaga 540
gaaagaaggc gagt 554
<210> 89
<211> 600
<212> DNA
<213> 蒺藜苜蓿(Medicago truncatula)
<400> 89
aacaaaacac cctcctcgtg cttgattcta gtacaagtat accaaactca ttcacaacca 60
catttcctta atctcttttc attttctctt atctatataa cactttacaa tctccacctc 120
attttcttca tcaaaaacaa ttcatctttc ttctttgcta tcatcactaa attttcttga 180
gaattcagaa aataaaagag agatttgaat gtttgggttg attccctgta ttgacacgtt 240
gtagacatca cggcttttct tagagtttat cggtcacttt cacatgcccg aactgtacga 300
cgtaagggtt gttgcttaac tccgactaac ccttcgccgc acggtgggcg tggtgctctg 360
ccttctgaag gtggtagccc ctccgatctt ctcttcctcg ccggtggtgg tgtctttgct 420
ccttcttcct tctaatttct tgtttttagt ttaactttct ttagattttt acgactcaaa 480
actataagct aaaactagac tttgtaagta agatttattt gaaggtgctt cttcttcttc 540
ttctttcttc ttcttgttgt taaaaaaaaa agtatttttg tgtttggttt ggtgaaaatg 600
<210> 90
<211> 621
<212> DNA
<213> 毛果杨(Populus trichocarpa)
<400> 90
gaaccattag tgtgtaccct cctcaccaaa aaagaataaa aactctcaca accaaacccc 60
aattcacagc aaaaccataa ccacaattcc cacttctctc ttatctatac aatatcccat 120
ctcctttttc ttcttttatc tcttgctctc atcaaaatcc cagcacctct cctctcgctg 180
ctaataaact tcaactccca tttctgcggc ggcggctgca gcccagtggt tcttgttttt 240
tctttattta ttgtgatctg taaaaaaaaa tctaaagagt acaagaacaa gggttaaaat 300
cccagggtag acaagttgta gacatcacgg ctatacacgg agtaactcgg tccctaattc 360
atgtccgggc tgttcgacgt aagggctgtg taatagagag cagcaaccct tcgccgcacg 420
gtggacgtgg tgctttaccc tcggaaggcg gtagcccttc tgatctcctc tttctagctg 480
gtggcggttt cttcttcttc tgtttagtag tagtttagtg ctattgttgt tgttaattat 540
tattattatt attattaaat ctaaaataaa aggccagtct gcaaataagt aaaagtatta 600
gatctcgaat aagcgaacaa g 621
<210> 91
<211> 640
<212> DNA
<213> 北美云杉(Picea sitchensis)
<400> 91
cggtgaagaa gtggtgagaa gtgggtttgt ggttaacgtt tgttcagccg tcctctgata 60
tctcttcagc cttacacgta ttttctggta taaacgtatt gtcatctgaa tctgaattta 120
ttagctgcgt ctttatgagg ttcgaaagcg ggatctcctc agcttcagag tttactttct 180
ggacggaaag aaatctgtat tcatagtttg tgaaggcagg gaggggattc gatccggtgc 240
agttgtggag gaaattcgga gggtaacatc acggggactg gtgtcgggag acgaaaataa 300
ggccattcaa gaagggaaag aaaggtctgg caagttgggg caacacggct attaaacgta 360
ttttgcggtt ccagccccat gatcgcagaa gaattctgcg gagcaggaac gctggttgtg 420
cactagagag taccccgtcg ccgcacggtg ggagaggagc cttgccctcg gaaggcggga 480
gcccctctga tctcctcttt ctcgcaggag gcggttgcga ccgagccctt ttctgcctcg 540
cccatccatt tcttctgagc agaggagaaa taatttggga gaggtagagg tggtttagcc 600
taatttaggc gtcaatcaat cgctcatatt aaccaccacc 640
<210> 92
<211> 253
<212> DNA
<213> 小立碗藓(Physcomitrella patens)
<400> 92
cgcgtccata tgagcaaaga cttctaccgt gcaggaatcc aactgtcccg atctctctct 60
tcctctcttt ccttgcacgg tggtcggggg gccgccccca gtgaaggcgg tcgtccctct 120
gacctatctg cacttgctgg gggaggtttt ctctcaaact ttcaccacgg tgctgatcct 180
tagggggggg tgctagggag aattttctgc tcaggtaaca ggaagtgtct aggagactat 240
tcaacctgca aaa 253
<210> 93
<211> 477
<212> DNA
<213> 软枣猕猴桃(A. arguta)
<400> 93
gcaaaatcaa cccttcatct tccacatcgg cctcccaaac ccacctcttc tccacaatcc 60
aggcacacct tgagcggctg gcgttgaggg aatagagaga gagagagaga gagattttct 120
gcttcgatcg ggggtaaaac ccggtgtttg acaagttgta gacatcacgg ctatactcgg 180
agtttctcgg ccgctcatac atgtccggtc tgtacgacgc aagggttgtg tagtcgagag 240
caacccttcg ccgcacggcg gacgtggcgc cttgccgtcc gaaggcggta gcccctccga 300
cctcctcttc ctcgccggtg gcggtcactt cgctttctcc gtctactagc ttattaggtt 360
tattcttact tagtgagtaa tttgtcctat tatagttcgt aagttcgtcg aagatctgtt 420
gcttgattcg tctttcgttg ctcgagtctt ggtgtttttg cgttttctga gttcgag 477
<210> 94
<211> 655
<212> DNA
<213> 毛花猕猴桃(A. eriantha)
<220>
<221> misc_feature
<222> (219)..(219)
<223> n为a、c、g或t。
<220>
<221> misc_feature
<222> (356)..(356)
<223> n为a、c、g或t。
<220>
<221> misc_feature
<222> (364)..(364)
<223> n为a、c、g或t。
<400> 94
tctctccgtc cctctcaata gttgtctcca ttcgcagtaa aatcactaag gccgctcgtc 60
cctcagtgca caccacggcc cctccacagc cgcattcacc tctctctctc tctctctgct 120
ctatctatat atccccccaa tctggcctct cttcacctca cccccaaaat ctacacaaaa 180
tcaatccttc atcttccaca tcggcctcca aaacccacnc tcttctccac aatccagaca 240
caccttgagc ggctggcgtt gagcgaatag atagagatag agagagagat tttctgcttc 300
gatcgggggt aaaacccggt gtttgacaag ttgtagacat cacggctata ctcggnagtt 360
tctncggccg ctcatacatg tccggtctgt acgacgcaag ggttgtgtag tcgagagcaa 420
cccttcgccg cacggcggac gtggcgcctt gccgtccgaa ggcggtagcc cctccgacct 480
cctcttcctc gccggcggcg gtcacttcgc tttctccgtc tactagctta ttaggtttat 540
tcttacttag tgagtaattc gtcctattat agttcgtaag ttcatcaaag atctgttact 600
tgattcgtct ttcgttgctc gagtcttggt gttttttgcg ttttctgagt tcgag 655
<210> 95
<211> 473
<212> DNA
<213> 中华猕猴桃(A. chinensis)
<400> 95
cacaaaatca atccttcatc ttccacatcg gcctccaaaa cccacctctt ctccacaatc 60
cagacacacc ttgagctgct ggcgttgagc gaatagatag agagagagat tttctgcttc 120
gatcgggggt aaaacccggt gtttgacaag ttgtagacat cacggctata ctcggagttt 180
ctcggccgct catacatgtc cggtctgtac gacgcaaggg ttgtgtagtc gagagcaacc 240
cttcgccgca cggcggacgt ggcgccttgc cgtccgaagg cggtagcccc tccgacctcc 300
tcttcctcgc cggcggcggt cacttcgctt tctccgtcta ctagcttatt aggtttattc 360
ttacttagtg agtaattcgt cctattatag ttcgtaagtt catcaaagat ctgttacttg 420
attcgtcttt cgttgctcga gtcttggtgt tttttgcgtt ttctgagttc gag 473
<210> 96
<211> 444
<212> DNA
<213> 草莓(Fragaria)
<400> 96
aatacaccac cacataacca aaacccactg ccccattttc tcgattctca ttcgcatctg 60
actaggaagg agagattttc tgcgttgggt ttgattccgg tttggggtaa aacccgggtc 120
gacgagttgt agacatcacg gctatacaca gagtttcacg gccactcatt catgtccgcc 180
ggactgtccg acgtaagggt tgtgtaattg agagcaaccc ttcgccgcac ggcgggcgtg 240
gtgctttgcc gtccgaagga ggaagtcctt ccgacctcct tttcctcgcc ggcggtggtg 300
tccacgtttc cgacttgcgt ttctttttct agctttttgt agattcgggt ttagctcaaa 360
gattattgtt tcgcaagtag atcgtgtttg ctgtcgttgc tgtgctttga tttttctttt 420
gagaagaaca agaacataac aaaa 444
<210> 97
<211> 600
<212> DNA
<213> 马铃薯(Solanum tuberosum)
<400> 97
ccatttgtat cggttcacac acagtaagca agcgccatta tccatctcta cccccattgg 60
caaacccaca gccacaattt tcctatcctc cattatccct tctccaattt attatataaa 120
tacccacatc tccctgctct ttctccctta tcatcaacaa caacaaccaa atttcttctt 180
tttttcttcc acagtagcaa tctatcaaca aaacagagac cccattacaa gaatcttgga 240
attttagttt tgggtttaag aggaaggggt tattgtattt gcagttttga gggtaaagcc 300
cagtttaaca aggtgtagac atcacggcta tacacaaagt aaaccgccga ccacttttac 360
atgttccagc agtacgtcgt aagggttgtg taacagctac taaccctgcg ccgcacggtg 420
gacgtggcgc tttgccctct gaaggtggca gtccttccga cctcctcttc cttgccggcg 480
gcggttcttt cctctccttc tcctactaga tatagttata cttaccgtag atctctagct 540
tattacgtac agttctatct agtattctct tgattattcg aagaaaaaca caaaaagatg 600
<210> 98
<211> 499
<212> DNA
<213> 莱茵衣藻(Chlamydomonas rheinhardtii)
<400> 98
cagcttccaa actttgtctg tattatctgc cacgcttgct cgagctgcat tacctgagag 60
tgcgacaaag cgacctcgcg taaattgaat ggcttgtgcg gctactttct cccaacttct 120
tcatgcattt gcgtgagccg gtaaaaacgg cgttctctga ggcagcccgc gttcagtcgg 180
ctgcgtcgca gcctgcgacc gccaatcggt gctccggtgg ccgtggtgca gccccctcgt 240
gcggtggcaa gcccaaggac gctctgagca aggcgggcgg tggccagtaa ccttcctcgc 300
gcaacacacc gcgcgagcgc ctgcggctgt tggacagcca gcagcgtgtg tcgaccccgc 360
gccaggacac cggcagcgac gtcgacggct agtatcatct agcctttagc aactctagcc 420
tagaaactta gtattcgctc acgaaacttt taggagcttt tcgtcgatca acatcgcctc 480
gctcgtcgcc gcggacaca 499
<210> 99
<211> 480
<212> DNA
<213> 玉米(Zea mays)
<400> 99
aaaccaaacc cagctcaggc acaaccccaa cgcaccgccg ccgctcgcct ggcctcacct 60
cgccggagaa gagttataag acaggagaac cccgtccccg gggcgcaggc ctcggcagct 120
tccgtgacca ccgcccaatc ctgccacagc tgccctccct cctcccctct gggcgtggcc 180
gagttgtagg catcacggct agcgttgcag ccccccggcg cggccccgca gctgcgcagg 240
tggagcccac gggcaccatc gcctccgctg tcgcgtccag ccccgctccg cacggcggcc 300
gcggggcgct gccctcggcc ggaggaagcc cgtccgatct cctcttcctc gccggcggsg 360
ktcgcctctg agccgttcct gtctctcacc ttcttccttt cctagcaatt agtcccttct 420
gctaaccccc ccggaccccg acgagttctc accccgagag taactgaccg acctaccggc 480
<210> 100
<211> 337
<212> DNA
<213> 江南卷柏(Selaginella moellendorffi)
<400> 100
gcttttgatt caggtatggt tgctccccaa ttcagcacat ttcctttctt tttccttgca 60
gggtttattc ttatgcactg actagcctgg aagaaggcta gtccgtgcca aaattttgac 120
aaccacggct tcaattgagc ttttgagtcg acaccccatc atttgttatg gacacagtgt 180
ttccagttgt aagactctgc tgagttccct ctcttgccac ggtggtcgag gggctagccc 240
ctcggaagga ggacaccctt cagatcttac ctttcttgct ggtggtggcc ttcttctcgg 300
agcaccatag tgggggtttc aatcttattg gctaaag 337
<210> 101
<211> 2130
<212> DNA
<213> 毛花猕猴桃(A. eriantha)
<220>
<221> misc_feature
<222> (556)..(556)
<223> n为a、c、g或t。
<220>
<221> misc_feature
<222> (1261)..(1261)
<223> n为a、c、g或t。
<220>
<221> misc_feature
<222> (1750)..(1750)
<223> n为a、c、g或t。
<220>
<221> misc_feature
<222> (1754)..(1755)
<223> n为a、c、g或t。
<400> 101
atcccaaaat atttgttcac ttagaaaatt aactgataaa ataatgcaaa ctctcctttt 60
tgttctcctc ttttgaattg acgtgacaca tttatctttt taattttaga taatttcgaa 120
ttattgaaaa aaaattaaac tgttttccaa ataataattt tttagaaata atgcaaataa 180
tagtttttta aactattttc caaatatttt ttttcaaaaa taatgcatta ttaagaataa 240
tattaaaaaa tatcttcaaa tattaaaaaa tatatttttg ataaaattta ataatatata 300
aaaataaatg aatgtttttg tttgcataaa caatttctaa taaaatattt tgcgaaaatg 360
tttttgtttg cataaacaat ttctaataaa atattttgcg aaaatgtttt tgttcgcata 420
aacaatttct gataaaattt tttgcaaaac taaacctaac acaaatgggt agcatttttg 480
cttctttaaa atcttggatt ccctaaatta gacaaataaa ttgggacgga tcaacattta 540
ttttcttctt aattwntttc tctaacacta caacaaaata attaaataga taagaaaaga 600
gaaaaaggaa cttgagaacc cacccaactt ttaaacattg cagttgggtc cttccgtacg 660
ttgcagtggt cctccacaac gtccacatga accacatggg cgtggttaat acaacgcacc 720
ccactctctc tctctctctc tctctctcga taattgtctc cattcgcagt aaaattacca 780
aggccactcg tcccacagtg cacaccacgg ccgatccaca gccacactca ccaatcacct 840
ctctctctct ctctctctct agaatttatt tgttgctctt ggagcaacac gtcacttttt 900
gacacgtggt ggtcggatcc aatcatctca cgccatccaa gcactcagtt tcatgtgttt 960
gccacgtcac cacaacaatt ccaccacaaa cccaggtaaa cacaagacta acagaacctc 1020
actccgttaa tgccatcttc ctgtcgctga ctcgcatgaa ataccaccac ttttggaaac 1080
caaacgccag aaaagattac tctcaccaat attctctatg aacaaagaaa ttgggttatt 1140
atttattatt tacaagaaat aaatggcacc aaccaaattt aaaaagacgt ctctgcagcg 1200
attttcacct cattttattt tttgagcttt taggtgtctc gtccgaaacc gacgccttct 1260
ntattatgca atttttcact cttctttgcc ttctcagtcc cgaaatgact attttcaggc 1320
aacatcatag ggtgattggg ttgtttagct atgtaggtac gaaatctaaa aatttgaatt 1380
tgtaaagttt atgaatattt catcgcatcg agtactggcg gaatgttcac ggggttaaca 1440
ggatttgaac tccgttattt ctttcttgag taaacggacg tggctgaata cacggacaac 1500
caattaaatg gtgtatgata tttcgtgtgg agcaccacgc gtagaaagtg aggtgttgcg 1560
tcaagagcat caaataattt ctcctctctc tctctccctc ttctctatct atatatcccc 1620
caatctggcc tctcctcacc tcacccccaa agtctacaca gaatcaaccc ttcatctccc 1680
gcataggcct cccaaaccca cctcttctcc acaatccaga cacacctcga gtggccggag 1740
tttagagagn aganngagag agagattttc tgcttcgatc ggggggtaaa acccggtgtt 1800
tgacaagttg tagacatcac ggctataatc ggagtttctc ggccgctcat acatgtccgg 1860
tctgtacgac gcaagggttg tgtagtcgag agcaaccctt cgccgcacgg cggacgtggc 1920
gccttgccgt ccgaaggcgg tagcccctcc gacctcctct tcctcgccgg cggcggtcac 1980
ttcgctttct ccgtctacta gcttattagg tttattctta cttagtgagt aattcgtcct 2040
attatagttc gtaagttcat caaagatctg ttacttgatt cgtctttcgt tgctcgagtc 2100
ttggtgtttt ttgcgttttc tgagttcgag 2130
<210> 102
<211> 1959
<212> DNA
<213> 拟南芥(Arabidopsis thaliana)
<400> 102
ttttgatact tgtcctctcg aaattgatgt ttactgacgc acgattattg ggaatttggg 60
acttagtggt gtaccaatag catctcagct ttcatggtta caaagaggcc agtgaaagag 120
gcttggtcaa ccgcaattat gatccgttac ttgcactgac taccaccgat ccaccgccgt 180
aactctttaa atcttaatgc aatactaatt cgaattacat gtcgaggtct taaaacatga 240
taaatggttg tttaaagtaa aaaaagaaaa gaaacaataa ataaaacaaa cggtgatgga 300
aggagggacg tacgatcgta gtcgtagaga ctgccaaata aataatggac cactattatg 360
tggttcaaga actatatcct tttcttagat tccgaatctt aacttgtgtt tcttgccttg 420
tttggttttt tttttgttta ttttgtagtt ttgtctcata aaataacgaa caaaaagcaa 480
tggtctaaat atttctcaat atatgtattt aaaaattata tcatagtttc gcaaaaaaac 540
gaccgaacga acgatggtag tcatttgccc aaattgagcc tcgtagtagt tgctacgacc 600
acacccccgt cccatgaata aacacgacca tgtaaatatt atctataaag acaacataaa 660
tttacaaatt aatgttgaac agaaaaagtc aaaaagaaaa tttcgttaat ataataataa 720
tattctatga taatataaaa cgtggcataa cacatgactt cacatgacat cataagaaga 780
catatgccac atgaactctt catcgcctcc atccttttag tctcgtttac atgcagcaaa 840
ctacgatcta cgattatata caatgaaatt caaattcata atcaattggc attaaacata 900
cgtatatcat aattcataag gttaactagg tttagcaaat gttattctct ttggataaac 960
gtttagcaat tgtttatctc aaatttaatt gaaaatactt gtaagacaca gttacaatta 1020
gttctcaatt tccaatctac acaagattta aatctttctt tagttcattc tgatctattt 1080
ttctctcaaa gaaaatgtag tgctccaact tttctcccaa gactaataaa aattttctta 1140
attgcatgca aaaatatttt ttccaacttt aatcttatca aacttagatc tcattttatc 1200
ttccgaataa gatttttgtt ttggtccttt gcctaatcaa actaactaat tagattagaa 1260
gaaaaataca attagacaaa ataatatcga tgaaaaaata aaatccacaa gaaaggacct 1320
aagaaatttc acgtccgaat cacaaccaca gaaaaaaaga gagaaatatt agtatataat 1380
taaaattttg tcgtctgtct tctctggttc actcatctcc tatctattta aagcccattc 1440
gatatcctaa aacactgtat catcaaaaaa cacctcaaag aattattcat tcaggcatct 1500
tctcaaattt ttgtttgtga aaaaaaccca catcaaaaga tctctcattt attcgtttcg 1560
tttctgctgt tttgagtgtc gggttcgttt tagctgtaat ctttttttcc ggcgttcgat 1620
ttgaaaaaat ccggggaaca ggtgatcgga atcacggcta tacacgggat atcacggggt 1680
gttagctcac atgtccatat tgtccgacag aagggttgtt taatcgaaac taatcctttg 1740
ccgcacggag gacgtggagc tctgccgtct gaaggcggca gcccttccga tctcctcttt 1800
ctcgccggtg gcggttccag ctttaacttc ttttccttta ggttttagga gttagggttt 1860
gttagtgttt tttccttctt ctttttttgg tgctcttgaa tcgctttttt cttgggggaa 1920
gttttttctt ttgctcttcg aaatttgtct tttttgaga 1959
<210> 103
<211> 1161
<212> DNA
<213> 拟南芥(Arabidopsis thaliana)
<400> 103
acgcgtgatg aatcaatcat tcattcacgc caacgtaaaa aaaaaaaaaa aaaaaaaatt 60
taactaaaat tatacggatg atttatttac atggacgctg attaaaaaag gtcggtccaa 120
ttaattattt acttaataat taattaaagt gttgtgtgta tttttggatt cccataatgt 180
tttgaggggt atataaagga gattattttt tctattttca atgtctacga ataaaatgga 240
acatcctcgt tccaatatat actgctgttt tattactaag gtttataatt ggagtgtata 300
aaaacactcc aaaataatat catgaataat gtttttatac gtataataca taaaataaaa 360
tctctttcct catagctggt cctctgatta ctatcaaaca tatgattcaa ttgcaaattt 420
gcaattatta atgcaagaag aatgagtgga acattaaagt tagatcaaaa actcttcatt 480
acaaacataa ataaattcat tttggtgctt tctaaattaa tttattgatc attttttggt 540
atgtagctag gggttaactc atcaggaaga acattaccta gatgatgtca ttgtcaaagt 600
caataggttg acttatccga tggatactaa tccaacgggt caaaaagtgc caaatcgggt 660
caaaatcaaa aacctcaaag atgacccgtg aacacttgtt tttatcttcc tcacaaaatc 720
cacacgtcca aatcacaacc tcaaaatctc acacatcaaa cacgtgaatt tgctctcttt 780
ctggttcact cacctaccat tactataagt ctgaaagagt gattgaaacc cacctcgaaa 840
aatctatcct tttttttgtt ttccttctcc ggcgaatccc cggggagatt ggtaatcggt 900
aatcacggct atttacggga taaagccacg gcctttgagc tttcatgtcc aacgaaaggg 960
ttgtttaatc ataactaatc ctttgcctca cggaggacgt ggagctctgc cgtctgaagg 1020
cggcagtccc tccgatctcc tcttcctcgc cggaggcggt tccacaaata gccactaacc 1080
ctaacccttt ttctaattag gtttttagtt cttagagtcc tgtattaatc tgttatttcg 1140
agattataat atttgtgagc a 1161
<210> 104
<211> 2003
<212> DNA
<213> 苹果(Malus x domesticus)
<400> 104
gacgagatca gcacgatgtt ggaggagtta gaggcctgac agaaaaaaaa aayattaaaa 60
caggcgtcta acgtcagatc cacctcaggc tctcgggccg gcgagaatcg acgggcctgg 120
ggctcggggt tgctcaggct cccttgccag ccaacgctgg acttcctacc tcgggcaacc 180
aagctcgggg ttgttcaaca tctttctctc tctccctctt tcacatattc ccatcaattt 240
tttctctctt ctttcacctc acccatccaa aactacaata ttcggtttta ttttttttat 300
ggaaaataaa tttaktaaag agaaaatcat ctcgaacaac atgttccaac tccmaattca 360
attaaagttc aaagcatcta actccgaagc awggaggcaa taattctaaa agtggggatt 420
ggacaccaac accccaacgt aagcaagctt atcaaccaca aaattgattt tattatgttt 480
ccagaagaag tcgattgcaa cacttggaaa ataaaccaac agctacggaa aatcaaaaca 540
aacacaacag aatttctata taaaaatgct tgtacacatt gccataccct aattttcacc 600
atgttatgaa attttcaatc tgaattttag caattgtaaa tttccgaaat cttgaacaat 660
tttcttcatt tcaacaaaag agaaatgttg taaacgggaa ttgacatatt tttaatccga 720
taaacycttt ctctktctca attaattcaa gagaacttta acgaaaaact ytcgttactg 780
ttcaytttaa taaaaaatca catttttaaa ctaaaaagtc aatcmtkgta ctatwcactt 840
taccctttat tttgtcctta tcattaaaac ttttcragtt tttttcatta gtttcytttt 900
aattcaaarc sgtttaagta ttatatattt caaccctcat tttcttgcat ataaagtcaa 960
gtcttttttc cctcsatccg tacacaaagt ggtccatata cggcaatcat aagtaccagt 1020
gaacctcaat ctctcacaca ttttttttct caattattgt cccaaaaaag gacccggctt 1080
ttcttcgttc tcactttcta tacactttca actcttctta atttatttat gcarttacgs 1140
ttaagttatg ttaatatttt atattaattt ttttttataa arataataaa acaaaaaaya 1200
ataataatat aaaatattaa trtaayttaa ccgtaatygc ayaaataaaa aaaataasaa 1260
tgtattaaar rtgggaggac aaagaagtca ggtccctaga aaatacacca tcaaaccaac 1320
caaggccacg aaacccccca aaatacaaac acaaacccca cggcacatcc tctaccacaa 1380
atccactttt cctccccatg cctataaatc caccccctca tctcctctcc acacccccac 1440
aaccacaaac cccacctgct cccccaattc cccagtaccc atttgtgttt ttcgattcag 1500
ttcgaaacca ggcggtcttc acctttctgg ttgttttcct atctgggttt taaggaggaa 1560
gaagaaagga aggcgttttg atcattttct tttcgaattt cttttggggt aagacccagg 1620
ttcgacgagt tgtagacatc acggctatac ccagagctcc tcggccgctc gttcatgtcc 1680
ggggtgtcgg acgaaagggw tgtgtaattg agagcaaccc ttcgccgcac ggcgggcgtg 1740
gtgctttgcc ttccgaaggc ggtagcccgt ctgacctcct cttcctcgcc ggtggcggct 1800
ccccttcctc tgtttttctc ttctgctttt attagtttta tttttataga gtttcttgct 1860
tagattttta gagatttttt gttctataaa gcgctcgagt agatcgtatt tttgttttcg 1920
ggggtttttt ttttttgtgg tgtttgattt ttactgagaa atcgagaaaa aaagrgagag 1980
agagagagag agagaaagaa ggc 2003
<210> 105
<211> 2000
<212> DNA
<213> 苹果(Malus x domesticus)
<400> 105
tgcccttctc aataacaata acatagaatg atactttgca kaactcaaay agactagggc 60
tcatctggac trcttttaaa atgattaaaa sygtttttkg tgaaaatatt ttaatatcaa 120
tcyttagtaa aaattcaagt ggaycctcaa aaacayttgg agtgcttcct ataagaatca 180
tattggtgct tcttccaaca aacaattgaa gtgctttttg aactcaaaat tcatttcacc 240
aaaaacactt tcaaatatta ctatgcttcc tcttttgtag ttaagttcaa atcatctatc 300
gctatgtcca aaaacaaaac attaaaaaaa tgtgagatca tattaaaaaa aagaaaattg 360
gaactttgtc ttcttgaact aaaatatcat gagtactctt gaacttgtca aatatagaac 420
aatggccatc tagataactt gttaggactt acataactta tttgctcctt taattcttta 480
ttttttatga aagttctaac tgtrttatct aaagaggtta ttgctccaca ttacgacaag 540
ctcaaaaaat tcatcaaaat taattaggta taaaatctct tattgttggt tacatgttca 600
atttactaaa cttcagcgtt ggataccaat atatatgtgt ttaggtacaa gctttagaaa 660
caaggataat gcagccatst agtgaaactg gcatgaagac cccatgtttt tatggtcacc 720
gcccacaccc atgtgagcaa gacatggaca atggataagg tgattgtcct tggatattmt 780
ggggcatgtc ccttaatttt aaggacgacg actgctacta gtctactacc accacttttt 840
gctttgcata gtactttggg ccctgtgcgt ccttgaatgt yctggtgcat ttactataac 900
tttaaggacg acgacttaga ctactattta tttattttaa ttaactgtta ttaagagaaa 960
aagatgggag ttcgaactat tacaaaaaat aaaagagmgg gtttagaatt cataatgcat 1020
agataaaaat ttaacattct attcattaag atattgaact acatgcacta ctaatacttc 1080
tttagttggg ragttgcagg caaaacaact cgtgcatgtg aacacattgt gatttggttt 1140
tctctcgagt acaacacact atcattttgg ttttctctag agttttagcg agttgtcatg 1200
aaattagttt ttatttttat ttgttattca acgacatrgt tacaccaagt gtagatgcat 1260
aatttgggaa aaccayataa taagctaact ataacaattt aatatcaaat gcrtcatcta 1320
tgaagttgag ccttgagctc ctacttatgt acaaatgaaa atgaataccg tartactaaa 1380
tgactaactt agacatcaag aaattgataa aataaaawtt aaaaaaaaaa actacaagca 1440
tgatgatgag gaatgaggat cctatctgaa tcctctttat gaggactcta aagattctcc 1500
aatcacgtcc gtttattata gatcgtacga cttgtttttg ttagatgtta tttatattca 1560
atttaaaaaa aattacaata atatataatc acatgatata caataaaata gatataatta 1620
aaagattcct ataattaaag aatcctcaca aagagatttc cgaacgctct ttcgaccatg 1680
agggtagtta ggctcctaaa tacttgaaag gtacagtaca tcatcatggt aggtttgaag 1740
ttataagtcc acctcatcca aaacacagca tatagaatga ttccctcatg gatcccgaat 1800
cctaaatttt tatttcaatt aaaatttgtg tgcttgcttt gtggaatgcg gaccgtcttc 1860
ttgtaaattt cgtaggaaga ctcggctcca attttttawg attaaaatcc gctgccatgg 1920
tcaattcact gtcgtctaat tatcaacagg cagccttcca acccacgtgt ttgtttgcac 1980
gcattagaat attcactgtc 2000
<210> 106
<211> 2018
<212> DNA
<213> 苹果(Malus x domesticus)
<400> 106
ccgaggacct cagaagcgag ggggcaatgt ttgggcccaa aataacagtt tgggccgagt 60
gtagggtcat tctcggcccg gaaggcctta cgacaagaat actatggatc gttcagtacg 120
tgggcatcca aacctaggtc agctaggtca taacgcaaga ggtcgaatcc tagtgcaata 180
aggagtctcg gcaggacccg gaagtgaatc cggctcagtt agggactagg ttcacagtcc 240
tagtgaaggt aggactggtc gagttgatgc tgatcagggg aagaaaacct agtccgagta 300
ggtttttaac tcgaccttgg ggggagccat tgctataaat agaaaaggtt gcacatcctt 360
caatgacccc tgcaaatcaa tacaaaattg ccctgcgcaa attctcacaa cttgtgattt 420
ttctttttcc ttttttcgct gacacatctt ccgttggcat caacagcact gtggaagcaa 480
ccggtgatat cttaagtcgg catagatagc tctgtcaccg tagagttagt cggtctcgca 540
gtatcttccg ttggcatcaa cagcactgcg gcgagaaygg ttgattacct atccaagtct 600
cggtcragaa gggtttctaa atccttattg gtcgaggtca tctcatcagc cttctcggcg 660
ragtgaggtg ttacagttat tacattcggc acattgaaag ccgaatttga tattgaactt 720
cktaagaata gtaaccttgt cttcaggttc gagagcccaa gaggycgaga cgtgttcctt 780
tctcggccgc aatcgcaaga cgcagaagtc agtagcgcga cccaacgcaa catcaayaaa 840
tttactcmtc ggccgagctc ggcckacgag ttggcacgcc ccgcattcac cgaaggacgt 900
agttagctca ttaattactc ggcctgcgcg ccacgtaggc tttgtagttt ctagggtcaa 960
caaggtgaaa ttcttgaatt tatgaaagac aaacaattac aaaaatgttt gctaatgatg 1020
ttttcattaa ttaagaatga aaattggaaa tccgaagatg atcacatacc aatgggcttt 1080
gtgatgtcat ttatgtttta gaccgatgcc cctctcgaat gaggatcctc tctggatcct 1140
ctctgtgaga atcatctccg gatcctcttt ttaagaatct cgagaattct caaatcgtgt 1200
tcgtttatcg tacatcatgc gatcaagttt cttcagttat tgttcatgtt taattttaaa 1260
taaaaatatt taaaatgatt tttgatcgaa caatgtacga taaaagaaca cgatttaaga 1320
attttcagaa ttatagtaaa gaatatccga agaggatcct cattcgcccc ctctataccc 1380
aaaaaaccaa taaatagatc cgaccgaata tccaaaatcc aaaaacagtt gcgtaatatc 1440
tttacacatg aacggttggg atcggtcaaa ggacggaaaa ccagaacaca cgtgtccgtc 1500
tccgttcgtc ccagtagcag accgtagacc ggaactctgt atcgcgaaat caaaagacgt 1560
cacgatatag aagaagaaga gaaagagaaa cggagataga tatttgatac agattttccg 1620
atcgcacaat catcgacatt ctcgaccaat ttgaagactc ggaatcgctg gtccggcgag 1680
ggctggcttc gtagatgcaa tcacggctct aatcaaagca atcactagta ttaagatttc 1740
gagaggcagc agagaatgca tgagagcctt ccctaattcc ctgcttgcat gcccttcgtt 1800
tcacggcggt cgcggtgccc taccctccgc cggtgggcat ccatccgatc tcacctacct 1860
ggccggcggc ggttgcttct gaaaacgacg accgcctgtg tttccccttc tgggttttga 1920
gtgtacttcg ttttttatta agcagtaatc aatggttacg gttaagcagc ttcaagatgg 1980
taactttacg tcgcaattcc ctccattttc tctgcaag 2018
<210> 107
<211> 2000
<212> DNA
<213> 中华猕猴桃(A. chinensis)
<400> 107
ttggtgtata aagatgagta aatagggatc ccggcaaatg gtctccacaa aagtgtagtg 60
tcttaggggc actatagaga ttccaaatct ccctagatat tttgttccac agtatatgat 120
ccacaatgag ccatgtattt tatataattt tatttatttt tttataatta ctcataggtt 180
atgtttgaat gctagtaatc acaaggagaa tagcaatatg atttcaaatc tttggaattt 240
taccatttgg ataaagtagg aataagaata taatatttat tgatatttta aattagattc 300
ataaagtaac gaggaatctg attctgcaaa gatcctaatt aatttcaaat ttctccgtca 360
tttttttata aatttgataa caaatataaa tcctttttta aaatattatt tcgtgattaa 420
gattctgaac aaaggcaagt acttgaataa gattaactct ttcattaaat tattaaaaat 480
tatattatta ataacgaaaa cgatcatcca aacacagcat aggggaatgg atatattccg 540
tggtatcaat gaaatttgca aatgtgcgtg agaacccaac tttattcatg gtgaaaataa 600
gcgaatagga agggcaaatt tcgccaatgg tctctgtagt ttaacaaaag tttcactttg 660
gttcttataa ttttaatata aacaattaaa attttgaact tttaatttta tttttatata 720
gttgttctat ctataatcgt taagaatttg aatggaaagt gagaacatag agctcacgta 780
ggcccttttt agaggataat tttactacta tttttgctta taatttggtt aaaattttac 840
tttagtcctt ataaataatc acgagttttc acatgctttt tctccattta tgttattaat 900
ttttattgac agagggaagc tacattgaaa tccaattgaa actttagaga tataactgtc 960
caaattgaaa ataaaggaac taaagtgaac ttttaatcaa attacaaaga caagatgaaa 1020
ttttcccgaa taacaactta gcacattggc atattcgtcg ctctcttgtg tatagacaac 1080
actgccctca actattcact gttactacaa aattgccaca cattcaagct aaagcatcaa 1140
cccactatga tactatgatg ctgcaacaca gccttgaata ttaggtattt attgtagttg 1200
agtttatatt taaattgaat ttttattaaa aattaaatat ttaaaaatag aagttaaaaa 1260
atattaaaat aaactttttt aaaatttaac tttttaattt tttagaagtt atttatagtc 1320
cataagtaga aaaactataa taaacacaga ctttaaggca aaataaatca aaagtttcta 1380
ctaataagta acaacaaaac atgggtgttt gatagagtga acttacacta taattgccaa 1440
tttaaaaata aaatttaaaa aattttaaaa taaagatttt aagaatcagc tatttttcaa 1500
ctttcgtagt ttgttttggc ccataagtag aagtagacgc aaaaactgtg ctaaacactt 1560
tggcgcaact tttaagacaa aaatggctat aagttgtatg ccaaacatgc aatattcgct 1620
ctaaaattgc caagtatgtc accattggtc attccgatta aacccagggg tacttttgtc 1680
tttaaatttc tataatttat gtactttttc attttttttt tgctttttgt tataattata 1740
aattaatgat gtccactctg ttcttccatg taccacctga aagatcaaga agcaagatat 1800
atatattgtt attctaccat tctctctctc tctctctctc tctcatcaga caattctctt 1860
tcaaaaaaca aaggaatggc caaaaacggt acggccccat taatctctct tctgtgtgtg 1920
tgtgtgtgtg tgtgtgtgtg taaatgtgta tattgtgtac aatgtatttg ttatctgtgt 1980
ttcgatggat ttgttgtgtg 2000
<210> 108
<211> 28
<212> PRT
<213> 人工序列(Artificial sequence)
<220>
<223> 构建体
<400> 108
Asn Pro Ser Pro His Gly Gly Arg Gly Ala Leu Pro Ser Glu Gly Gly
1 5 10 15
Ser Pro Ser Asp Leu Leu Phe Leu Ala Gly Gly Gly
20 25
<210> 109
<211> 20
<212> PRT
<213> 人工序列(Artificial sequence)
<220>
<223> 引物
<400> 109
Thr Ala Thr Cys Cys Gly Cys Thr Gly Gly Ala Ala Gly Ala Thr Gly
1 5 10 15
Gly Ala Ala Cys
20
<210> 110
<211> 20
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> 引物
<400> 110
tccacctcga tatgtgcatc 20
<210> 111
<211> 246
<212> DNA
<213> 黄瓜(Cucumis sativus)
<400> 111
gggtaaaacc cgggttcgtc aggctgtaga catcacggct atacacgtag tttcccggtc 60
gttctttcat gtcagggctg tacgacggaa gggttgtata actccgacaa acccttcgcc 120
gcacggcgga cgtggtgctt tgccttccga aggtggtagt ccttctgatc ttctttttct 180
cgccggcggt ggtttctctt gcttcttctc ttcttcgtat tagctttccg tttgtgtttt 240
agctct 246
<210> 112
<211> 254
<212> DNA
<213> 毛花猕猴桃(A. eriantha)
<400> 112
gggtaaaacc cggtgtttga caagttgtag acatcacggc tataatcgga gtttctcggc 60
cgctcataca tgtccggtct gtacgacgca agggttgtgt agtcgagagc aacccttcgc 120
cgcacggcgg acgtggcgcc ttgccgtccg aaggcggtag cccctccgac ctcctcttcc 180
tcgccggcgg cggtcacttc gctttctccg tctactagct tattaggttt attcttactt 240
agtgagtaat tcgt 254
<210> 113
<211> 253
<212> DNA
<213> 软枣猕猴桃(A. arguta)
<400> 113
ggtaaaaccc ggtgtttgac aagttgtaga catcacggct atactcggag tttctcggcc 60
gctcatacat gtccggtctg tacgacgcaa gggttgtgta gtcgagagca acccttcgcc 120
gcacggcgga cgtggcgcct tgccgtccga aggcggtagc ccctccgacc tcctcttcct 180
cgccggtggc ggtcacttcg ctttctccgt ctactagctt attaggttta ttcttactta 240
gtgagtaatt tgt 253
<210> 114
<211> 255
<212> DNA
<213> 毛花猕猴桃(A. eriantha)
<220>
<221> misc_feature
<222> (49)..(49)
<223> n为a、c、g或t。
<220>
<221> misc_feature
<222> (57)..(57)
<223> n为a、c、g或t。
<400> 114
ggtaaaaccc ggtgtttgac aagttgtaga catcacggct atactcggna gtttctncgg 60
ccgctcatac atgtccggtc tgtacgacgc aagggttgtg tagtcgagag caacccttcg 120
ccgcacggcg gacgtggcgc cttgccgtcc gaaggcggta gcccctccga cctcctcttc 180
ctcgccggcg gcggtcactt cgctttctcc gtctactagc ttattaggtt tattcttact 240
tagtgagtaa ttcgt 255
<210> 115
<211> 253
<212> DNA
<213> 中华猕猴桃(A. chinensis)
<400> 115
ggtaaaaccc ggtgtttgac aagttgtaga catcacggct atactcggag tttctcggcc 60
gctcatacat gtccggtctg tacgacgcaa gggttgtgta gtcgagagca acccttcgcc 120
gcacggcgga cgtggcgcct tgccgtccga aggcggtagc ccctccgacc tcctcttcct 180
cgccggcggc ggtcacttcg ctttctccgt ctactagctt attaggttta ttcttactta 240
gtgagtaatt cgt 253
<210> 116
<211> 254
<212> DNA
<213> 苹果(Malus x domesticus)
<400> 116
ggtaagaccc aggttcgacg agttgtagac atcacggcta tacccagagc tcctcggccg 60
ctcgttcatg tccggggtgt cggacgaaag ggttgtgtaa ttgagagcaa cccttcgccg 120
cacggcgggc gtggtgcttt gccttccgaa ggcggtagcc cgtctgacct cctcttcctc 180
gccggtggcg gctccccttc ctctgttttt ctcttctgct tttattagtt ttatttttat 240
agagtttctt gctt 254
<210> 117
<211> 247
<212> DNA
<213> 草莓(Fragaria)
<400> 117
ggtaaaaccc gggtcgacga gttgtagaca tcacggctat acacagagtt tcacggccac 60
tcattcatgt ccgccggact gtccgacgta agggttgtgt aattgagagc aacccttcgc 120
cgcacggcgg gcgtggtgct ttgccgtccg aaggaggaag tccttccgac ctccttttcc 180
tcgccggcgg tggtgtccac gtttccgact tgcgtttctt tttctagctt tttgtagatt 240
cgggttt 247
<210> 118
<211> 256
<212> DNA
<213> 拟南芥(Arabidopsis thaliana)
<400> 118
tgaaaaaatc cggggaacag gtgatcggaa tcacggctat acacgggata tcacggggtg 60
ttagctcaca tgtccatatt gtccgacaga agggttgttt aatcgaaact aatcctttgc 120
cgcacggagg acgtggagct ctgccgtctg aaggcggcag cccttccgat ctcctctttc 180
tcgccggtgg cggttccagc tttaacttct tttcctttag gttttaggag ttagggtttg 240
ttagtgtttt ttcctt 256
<210> 119
<211> 245
<212> DNA
<213> 拟南芥(Arabidopsis thaliana)
<400> 119
aatccccggg gagattggta atcggtaatc acggctattt acgggataaa gccacggcct 60
ttgagctttc atgtccaacg aaagggttgt ttaatcataa ctaatccttt gcctcacgga 120
ggacgtggag ctctgccgtc tgaaggcggc agtccctccg atctcctctt cctcgccgga 180
ggcggttcca caaatagcca ctaaccctaa ccctttttct aattaggttt ttagttctta 240
gagtc 245
<210> 120
<211> 256
<212> DNA
<213> 毛果杨(Populus trichocarpa)
<400> 120
ggttaaaatc ccagggtaga caagttgtag acatcacggc tatacacgga gtaactcggt 60
ccctaattca tgtccgggct gttcgacgta agggctgtgt aatagagagc agcaaccctt 120
cgccgcacgg tggacgtggt gctttaccct cggaaggcgg tagcccttct gatctcctct 180
ttctagctgg tggcggtttc ttcttcttct gtttagtagt agtttagtgc tattgttgtt 240
gttaattatt attatt 256
<210> 121
<211> 252
<212> DNA
<213> 大豆(Glycine max)
<400> 121
ggttgaatcc ctgggttgaa gcgttgcaga catcacggct attctaagag tgtctcgctc 60
tctcattcat gtcccaactg tacgacggag gacaggttgc gtaactgcca ccaacccttc 120
gccgcacggt gggcgtggtg ctttgccttc tgaaggtggt agcccttcag acttgctctt 180
cttagctggt ggtggttctg ctgtcttcta gcttcttctt aactcttttt tctttttact 240
acttttaagc ta 252
<210> 122
<211> 253
<212> DNA
<213> 蒺藜苜蓿(Medicago truncatula)
<400> 122
ggttgattcc ctgtattgac acgttgtaga catcacggct tttcttagag tttatcggtc 60
actttcacat gcccgaactg tacgacgtaa gggttgttgc ttaactccga ctaacccttc 120
gccgcacggt gggcgtggtg ctctgccttc tgaaggtggt agcccctccg atcttctctt 180
cctcgccggt ggtggtgtct ttgctccttc ttccttctaa tttcttgttt ttagtttaac 240
tttctttaga ttt 253
<210> 123
<211> 252
<212> DNA
<213> 番茄(Solanum lycopersicum)
<400> 123
gggtaaagcc cagtttaaca agttgtagac atcacggcta tacacaaagt aaaccgccga 60
ccacttttac atgttccagc agtacgtcgt aagggttgtg taacagctac taaccctgcg 120
ccgcacggtg gacgtggcgc tttgccttct gaaggtggta gtccttccga cctcctcttc 180
cttgccggcg gcggttcttt cctctccttc tcctactaga tatagttata cttactatag 240
atctctagct ta 252
<210> 124
<211> 252
<212> DNA
<213> 马铃薯(Solanum tuberosum)
<400> 124
gggtaaagcc cagtttaaca aggtgtagac atcacggcta tacacaaagt aaaccgccga 60
ccacttttac atgttccagc agtacgtcgt aagggttgtg taacagctac taaccctgcg 120
ccgcacggtg gacgtggcgc tttgccctct gaaggtggca gtccttccga cctcctcttc 180
cttgccggcg gcggttcttt cctctccttc tcctactaga tatagttata cttaccgtag 240
atctctagct ta 252
<210> 125
<211> 258
<212> DNA
<213> 葡萄(Vitis vinifera)
<400> 125
gggtaaaacc cttgttcgac gagttgtaga catcacggct atacaaagaa ttccgccgcc 60
tctcatacat gtccgggcgg tacgacgcaa gggytgtgta attgagagca acccttcgcc 120
gcacggcggg cgtggcgctt tgccttcaga aggcggtagt ccctctgatc tgctcttcct 180
cgccggcggt ggttccaacg ctttcctctg ctagtttagg cttatattct gcataatata 240
gctactgtct ttaggatt 258
<210> 126
<211> 682
<212> DNA
<213> 番茄(Solanum lycopersicum)
<400> 126
atttgttcgg tatactgtaa ccccctgttt gcgattggcc ttgtagcccc gttttacatc 60
ttccagagac tccatttgta tcggttcaca tacagtagca aagcgccatt atcttactct 120
accccattgg caaacccaca gccacaattt tccaatcctc cattatccct tctacaattt 180
tctatataaa tacccacatc tctctgctct actcccttat tatcaacaac aaccaccaaa 240
tttcttcttt tttttcttcg atagtagcaa tctatcaaca aaaacagaga ccccatcaca 300
agaatcttgg aattttagtg ttgggtttaa gaggaaaagg ggttattgta ttttgcagtt 360
ttgagggtaa agcccagttt aacaagttgt agacatcacg gctatacaca aagtaaaccg 420
ccgaccactt ttacatgttc cagcagtacg tcgtaagggt tgtgtaacag ctactaaccc 480
tgcgccgcac ggtggacgtg gcgctttgcc ttctgaaggt ggtagtcctt ccgacctcct 540
cttccttgcc ggcggcggtt ctttcctctc cttctcctac tagatatagt tatacttact 600
atagatctct agcttattac gtacagttgt atctagtatt ctattgatta ttcgaagaaa 660
acacacaaaa agaagtaaag cc 682
<210> 127
<211> 472
<212> DNA
<213> 马铃薯(Solanum tuberosum)
<400> 127
taagggggtg cttatataaa gttggggagt ctaccaatga gacgaactca ttgaccaaat 60
acgtctgcag gagaaagacc accggagcac caaacgccac ccaacaacca cccattaaat 120
tcttccagaa aaaaacatct tcctcaaaat tatcgatgaa ggatcgttcc ttagtagttg 180
ttcgttgatc ctacaaattc aatcacggct cttcttggat ctttcgtttg tattctcaca 240
attcatcatc accgcaaagt gttgaccctt aatccaactc ttctggtgga cgataagcac 300
cggacccctt cccctcacgg aggtaggggt gcctcacccg ctgaaggcgg ttgcccctcc 360
gatctcctct tcctcgccgg cggcggtcca attcttcctt tctctttctc cttctcctaa 420
tttttcgtgt aagaattgta tttttgatta tccatccaag aacaggaccg cc 472
<210> 128
<211> 607
<212> DNA
<213> 苹果(Malus x domesticus)
<400> 128
ccacggtaca ccctcagcca cgaacacccc ttcttctccc cacacctata aatccacccc 60
ctcatctcct ccccacaccc ccactcactt cagttcgaaa caggcgatcc tcgcctttct 120
gggttgtttc ctattttatc tgagggagaa gaaaggaagg tgtttgatca attttttggt 180
atatttttag gggtaagacc caggttcgac gagttgtaga catcacggct atacacggag 240
ctcctcggcc gctcattcat gtccgggctg tccgacgaaa gggttgtgta attgagagca 300
acccttcgcc gcacggcggg cgtggcgctt tgccttccga aggcggtagc ccctccgacc 360
tgctcttcct cgctggtggc ggttctgcat cctctgtttt tctcttctgc ttatattagc 420
ttttttagac tttcttggtt agattcttag gagattttag agattttttt tcttctataa 480
agcgcacgag tagatcgtat tgttgttttc ggggggtttt gggtttggtg gtgtttgatt 540
ttactgagaa ttaagaaaaa ataaaaggaa aaaaaagaga gagagaaaga aggggaggga 600
gcatgcc 607
<210> 129
<211> 183
<212> DNA
<213> 番茄(Solanum lycopersicum)
<400> 129
acggctatac acaaagtaaa ccgccgacca cttttacatg ttccagcagt acgtcgtaag 60
ggttgtgtaa cagctactaa ccctgcgccg cacggtggac gtggcgcttt gccttctgaa 120
ggtggtagtc cttccgacct cctcttcctt gccggcggcg gttctttcct ctccttctcc 180
tac 183
<210> 130
<211> 213
<212> DNA
<213> 马铃薯(Solanum tuberosum)
<400> 130
acggctcttc ttggatcttt cgtttgtatt ctcacaattc atcatcaccg caaagtgttg 60
acccttaatc caactcttct ggtggacgat aagcaccgga ccccttcccc tcacggaggt 120
aggggtgcct cacccgctga aggcggttgc ccctccgatc tcctcttcct cgccggcggc 180
ggtccaattc ttcctttctc tttctccttc tcc 213
<210> 131
<211> 192
<212> DNA
<213> 苹果(Malus x domesticus)
<400> 131
acggctatac acggagctcc tcggccgctc attcatgtcc gggctgtccg acgaaagggt 60
tgtgtaattg agagcaaccc ttcgccgcac ggcgggcgtg gcgctttgcc ttccgaaggc 120
ggtagcccct ccgacctgct cttcctcgct ggtggcggtt ctgcatcctc tgtttttctc 180
ttctgcttat at 192
<210> 132
<211> 61
<212> PRT
<213> 番茄(Solanum lycopersicum)
<400> 132
Thr Ala Ile His Lys Val Asn Arg Arg Pro Leu Leu His Val Pro Ala
1 5 10 15
Val Arg Arg Lys Gly Cys Val Thr Ala Thr Asn Pro Ala Pro His Gly
20 25 30
Gly Arg Gly Ala Leu Pro Ser Glu Gly Gly Ser Pro Ser Asp Leu Leu
35 40 45
Phe Leu Ala Gly Gly Gly Ser Phe Leu Ser Phe Ser Tyr
50 55 60
<210> 133
<211> 71
<212> PRT
<213> 马铃薯(Solanum tuberosum)
<400> 133
Thr Ala Leu Leu Gly Ser Phe Val Cys Ile Leu Thr Ile His His His
1 5 10 15
Arg Lys Val Leu Thr Leu Asn Pro Thr Leu Leu Val Asp Asp Lys His
20 25 30
Arg Thr Pro Ser Pro His Gly Gly Arg Gly Ala Ser Pro Ala Glu Gly
35 40 45
Gly Cys Pro Ser Asp Leu Leu Phe Leu Ala Gly Gly Gly Pro Ile Leu
50 55 60
Pro Phe Ser Phe Ser Phe Ser
65 70
<210> 134
<211> 64
<212> PRT
<213> 苹果(Malus x domesticus)
<400> 134
Thr Ala Ile His Gly Ala Pro Arg Pro Leu Ile His Val Arg Ala Val
1 5 10 15
Arg Arg Lys Gly Cys Val Ile Glu Ser Asn Pro Ser Pro His Gly Gly
20 25 30
Arg Gly Ala Leu Pro Ser Glu Gly Gly Ser Pro Ser Asp Leu Leu Phe
35 40 45
Leu Ala Gly Gly Gly Ser Ala Ser Ser Val Phe Leu Phe Cys Leu Tyr
50 55 60
<210> 135
<211> 28
<212> PRT
<213> 番茄(Solanum lycopersicum)
<400> 135
Asn Pro Ala Pro His Gly Gly Arg Gly Ala Leu Pro Ser Glu Gly Gly
1 5 10 15
Ser Pro Ser Asp Leu Leu Phe Leu Ala Gly Gly Gly
20 25
<210> 136
<211> 28
<212> PRT
<213> 马铃薯(Solanum tuberosum)
<400> 136
Thr Pro Ser Pro His Gly Gly Arg Gly Ala Ser Pro Ala Glu Gly Gly
1 5 10 15
Cys Pro Ser Asp Leu Leu Phe Leu Ala Gly Gly Gly
20 25
<210> 137
<211> 28
<212> PRT
<213> 苹果(Malus x domesticus)
<400> 137
Asn Pro Ser Pro His Gly Gly Arg Gly Ala Leu Pro Ser Glu Gly Gly
1 5 10 15
Ser Pro Ser Asp Leu Leu Phe Leu Ala Gly Gly Gly
20 25
<210> 138
<211> 84
<212> DNA
<213> 番茄(Solanum lycopersicum)
<400> 138
aaccctgcgc cgcacggtgg acgtggcgct ttgccttctg aaggtggtag tccttccgac 60
ctcctcttcc ttgccggcgg cggt 84
<210> 139
<211> 84
<212> DNA
<213> 马铃薯(Solanum tuberosum)
<400> 139
accccttccc ctcacggagg taggggtgcc tcacccgctg aaggcggttg cccctccgat 60
ctcctcttcc tcgccggcgg cggt 84
<210> 140
<211> 84
<212> DNA
<213> 苹果(Malus x domesticus)
<400> 140
aacccttcgc cgcacggcgg gcgtggcgct ttgccttccg aaggcggtag cccctccgac 60
ctgctcttcc tcgctggtgg cggt 84

Claims (22)

1.一种分离的多核苷酸,其具有编码具有氨基酸序列的uORF多肽的序列,所述氨基酸序列具有以下至少一者:
a)与选自SEQ ID NO:1至20、以及132至134的氨基酸序列有70%同一性,
b)与SEQ ID NO:1至20、以及132至134中的任一者有90%同一性,
c)与选自SEQ ID NO:21至40、以及135至137的氨基酸序列有70%同一性,以及
d)与选自SEQ ID NO:21至40、以及135至137的氨基酸序列有90%同一性,
其中所述uORF多肽调节GDP-L-半乳糖磷酸化酶GGP翻译,并且其中多核苷酸包含减少、干扰或阻止uORF多肽翻译的修饰。
2.权利要求1所述的多核苷酸,其中所述uORF多肽具有与氨基酸序列SEQ ID NO:108有至少70%同一性的序列。
3.权利要求1所述的多核苷酸,其中所述uORF多肽具有与氨基酸序列SEQ ID NO:108有至少90%同一性的序列。
4.权利要求1所述的多核苷酸,所述多核苷酸具有以下至少一者:
a)与选自SEQ ID No:61至80、以及138至140的序列有至少70%同一性的序列,
b)与选自SEQ ID NO:61至80、以及138至140的序列有至少90%同一性的序列,
c)与选自SEQ ID No:41至60、以及129至131的序列有至少70%同一性的序列,
d)与选自SEQ ID NO:41至60、以及129至131的序列有至少90%同一性的序列,
e)与选自SEQ ID No:81至100、以及126至128的序列有至少70%同一性的序列,
f)与选自SEQ ID NO:81至100、以及126至128的序列有至少90%同一性的序列。
5.一种多核苷酸,所述多核苷酸具有以下至少一者:
a)与选自SEQ ID NO:61至80、以及138至140的序列有至少70%同一性的序列,
b)与选自SEQ ID NO:61至80、以及138至140的序列有至少90%同一性的序列,
c)与选自SEQ ID NO:41至60、以及129至131的序列有至少70%同一性的序列,
d)与选自SEQ ID NO:41至60、以及129至131的序列有至少90%同一性的序列,
e)与选自SEQ ID NO:81至100、以及126至128的序列有至少70%同一性的序列,
f)与选自SEQ ID NO:81至100、以及126至128的序列有至少90%同一性的序列,
其中所述多核苷酸包含减少、干扰或阻止uORF多肽翻译的修饰,所述uORF多肽调节GDP-L-半乳糖磷酸化酶GGP翻译。
6.权利要求5所述的多核苷酸,其中所述uORF多肽具有氨基酸序列,所述氨基酸序列具有以下至少一者:
a)与选自SEQ ID NO:1至20、以及132至134的氨基酸序列有70%同一性,
b)与SEQ ID NO:1至20、以及132至134中的任一者有90%同一性,
c)与选自SEQ ID NO:21至40、以及135至137的氨基酸序列有70%同一性,以及
d)与选自SEQ ID NO:21至40、以及135至137的氨基酸序列有90%同一性。
7.一种构建体,包括前述权利要求中任一项所述的多核苷酸。
8.权利要求7所述的构建体,其中所述多核苷酸可操作地连接至目标核酸序列。
9.权利要求8所述的构建体,其中所述多核苷酸和核酸序列在自然界中通常不相连。
10.权利要求7至9中任一项所述的构建体,其中所述多核苷酸能够受到抗坏血酸的调控。
11.权利要求10所述的构建体,其中可操作地连接的核酸的表达是由所述抗坏血酸与所述uORF肽之间的相互作用调控的,所述uORF肽由所述多核苷酸表达。
12.一种在细胞、植物细胞或植物中调节或控制至少一种核酸序列表达的方法,包括用权利要求1至6中任一项所述的多核苷酸或权利要求7至11中任一项所述的构建体转化所述的细胞、植物细胞或植物。
13.一种制备具有改变的基因表达的细胞、植物细胞或植物的方法,该方法包括用权利要求1至6中任一项所述的多核苷酸或权利要求7至11中任一项所述的构建体转化细胞、植物细胞或植物。
14.权利要求12或13所述的方法,其中所述的细胞、植物细胞或植物产生了通过引入的多核苷酸、或通过由引入的多核苷酸编码的uORF多肽调节或改变表达的抗坏血酸。
15.一种制备具有以下至少一者的植物细胞或植物的方法:
a)增多的GGP翻译,
b)增多的GGP产生,
c)增强的GGP活性,以及
d)增多的抗坏血酸产生,
所述方法包括在所述植物细胞或植物中修饰GGP基因的5’-UTR,其中所述5’-UTR具有以下至少一者:
a)与选自SEQ ID NO:61至80、以及138至140的序列有至少70%同一性的序列,
b)与选自SEQ ID NO:61至80、以及138至140的序列有至少90%同一性的序列,
c)与选自SEQ ID NO:41至60、以及129至131的序列有至少70%同一性的序列,
d)与选自SEQ ID NO:41至60、以及129至131的序列有至少90%同一性的序列,
e)与选自SEQ ID No:81至100、以及126至128的序列有至少70%同一性的序列,
f)与选自SEQ ID NO:81至100、以及126至128的序列有至少90%同一性的序列,
g)编码与选自SEQ ID NO:1至20、以及132至134的氨基酸序列有至少70%同一性的uORF多肽的序列,
h)编码uORF多肽的序列,所述uORF多肽具有至少一个编码与SEQ ID NO:1至20、以及132至134中的任一者有至少90%同一性的uORF多肽的序列。
i)编码与选自SEQ ID NO:21至40、以及135至137的氨基酸序列有至少70%同一性的uORF多肽的序列,以及
j)编码与选自SEQ ID NO:21至40、以及135至137的氨基酸序列有至少90%同一性的uORF多肽的序列,
以及其中所述修饰干扰由5'UTR编码的uORF多肽的功能。
16.权利要求15所述的方法,其中所述5'-UTR位于具有以下至少一者的多核苷酸序列内:
a)与SEQ ID NO:101至107中的任一者有至少70%同一性的序列,以及
b)与SEQ ID NO:101至107中的任一者有至少90%同一性的序列。
17.权利要求16或17所述的方法,其中所述5'-UTR具有选自以下任一者的多核苷酸序列:
a)与SEQ ID NO:81至100的序列有至少70%同一性的序列,以及
b)与SEQ ID NO:81至100的序列有至少90%同一性的序列。
18.权利要求15或16所述的方法,其中所述修饰位于所述5'-UTR的uORF序列内。
19.权利要求18所述的方法,其中所述uORF序列具有以下至少一者:
a)与SEQ ID NO:41至60以及129至131中任一者有70%同一性的序列,以及
b)与SEQ ID NO:41至60以及129至131中任一者有90%同一性的序列。
20.一种筛选具有以下至少一者的植物的方法:
a)增多的GGP翻译,
b)增多的GGP产生,
c)增强的GGP活性,以及
d)增多的抗坏血酸产生,
所述方法包括检测所述植物是否存在多核苷酸的多态性,所述多核苷酸具有编码具有氨基酸序列的uORF多肽的序列,所述氨基酸序列具有以下至少一者:
a)与选自SEQ ID NO:1至20、以及132至134的氨基酸序列有70%同一性,
b)与SEQ ID NO:1至20、以及132至134中的任一者有90%同一性,
c)与选自SEQ ID NO:21至40、以及135至137的氨基酸序列有70%同一性,以及
d)与选自SEQ ID NO:21至40、以及135至137的氨基酸序列有90%同一性,
其中所述多态性减少、干扰或阻止uORF多肽翻译。
21.权利要求20所述的方法,包括从一种或多种未经筛选的植物中分离所筛选的植物的步骤。
22.一种制备抗坏血酸的方法,所述方法包括从权利要求15至19中任一项所述的植物细胞或植物中提取抗坏血酸。
CN201811249667.XA 2012-12-21 2013-12-20 基因表达的调控 Pending CN109576241A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201261740751P 2012-12-21 2012-12-21
US61/740,751 2012-12-21
CN201380067675.1A CN104884622B (zh) 2012-12-21 2013-12-20 基因表达的调控

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
CN201380067675.1A Division CN104884622B (zh) 2012-12-21 2013-12-20 基因表达的调控

Publications (1)

Publication Number Publication Date
CN109576241A true CN109576241A (zh) 2019-04-05

Family

ID=50979339

Family Applications (2)

Application Number Title Priority Date Filing Date
CN201380067675.1A Active CN104884622B (zh) 2012-12-21 2013-12-20 基因表达的调控
CN201811249667.XA Pending CN109576241A (zh) 2012-12-21 2013-12-20 基因表达的调控

Family Applications Before (1)

Application Number Title Priority Date Filing Date
CN201380067675.1A Active CN104884622B (zh) 2012-12-21 2013-12-20 基因表达的调控

Country Status (9)

Country Link
US (1) US9648813B2 (zh)
EP (1) EP2935590A4 (zh)
CN (2) CN104884622B (zh)
AU (1) AU2013365731B2 (zh)
CA (1) CA2894979A1 (zh)
CL (1) CL2015001764A1 (zh)
NZ (1) NZ708313A (zh)
WO (1) WO2014097226A2 (zh)
ZA (1) ZA201504442B (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113293162A (zh) * 2020-08-24 2021-08-24 山东舜丰生物科技有限公司 一种提高植物中维生素c含量的方法
CN115029359A (zh) * 2022-06-10 2022-09-09 云南师范大学 一种兼顾农作物产量和品质的改良方法
CN115058403A (zh) * 2022-06-10 2022-09-16 云南师范大学 一种提高马铃薯薯块中维生素c含量的方法
WO2023230631A1 (en) * 2022-05-27 2023-11-30 Roger Paul Hellens Novel methods for identification and use of upstream open reading frames

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10822369B2 (en) 2014-11-14 2020-11-03 Ionis Pharmaceuticals, Inc. Compounds and methods for the modulation of proteins
BR112019015848A2 (pt) * 2017-02-02 2020-03-31 Duke University Constructo de dna, vetor, célula, planta, e, método de controle da expressão de um polipeptídeo heterólogo em uma célula
AR113458A1 (es) * 2017-10-19 2020-05-06 Inst Genetics & Developmental Biology Cas Método para regular la expresión génica
WO2024077110A2 (en) 2022-10-05 2024-04-11 Roger Paul Hellens Uorf::reporter gene fusions to select sequence changes to gene edit into uorfs to regulate ascorbate genes

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101687907A (zh) * 2007-03-08 2010-03-31 新西兰植物和食品研究院有限公司 转移酶、差向异构酶、编码它们的多核苷酸及其用途

Family Cites Families (63)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5753475A (en) 1985-01-17 1998-05-19 Calgene, Inc. Methods and compositions for regulated transcription and expression of heterologous genes
US4943674A (en) 1987-05-26 1990-07-24 Calgene, Inc. Fruit specific transcriptional factors
US4795855A (en) 1985-11-14 1989-01-03 Joanne Fillatti Transformation and foreign gene expression with woody species
US5750871A (en) 1986-05-29 1998-05-12 Calgene, Inc. Transformation and foreign gene expression in Brassica species
US5188958A (en) 1986-05-29 1993-02-23 Calgene, Inc. Transformation and foreign gene expression in brassica species
US5187073A (en) 1986-06-30 1993-02-16 The University Of Toledo Process for transforming gramineae and the products thereof
US5177010A (en) 1986-06-30 1993-01-05 University Of Toledo Process for transforming corn and the products thereof
US5004863B2 (en) 1986-12-03 2000-10-17 Agracetus Genetic engineering of cotton plants and lines
US5416011A (en) 1988-07-22 1995-05-16 Monsanto Company Method for soybean transformation and regeneration
US5639952A (en) 1989-01-05 1997-06-17 Mycogen Plant Science, Inc. Dark and light regulated chlorophyll A/B binding protein promoter-regulatory system
US5086169A (en) 1989-04-20 1992-02-04 The Research Foundation Of State University Of New York Isolated pollen-specific promoter of corn
US5837848A (en) 1990-03-16 1998-11-17 Zeneca Limited Root-specific promoter
US5498830A (en) 1990-06-18 1996-03-12 Monsanto Company Decreased oil content in plant seeds
WO1992009696A1 (en) 1990-11-23 1992-06-11 Plant Genetic Systems, N.V. Process for transforming monocotyledonous plants
US5591616A (en) 1992-07-07 1997-01-07 Japan Tobacco, Inc. Method for transforming monocotyledons
ATE147434T1 (de) 1992-07-09 1997-01-15 Pioneer Hi Bred Int Pollen spezifische polygalacturonase gen aus mais
HUT70467A (en) 1992-07-27 1995-10-30 Pioneer Hi Bred Int An improved method of agrobactenium-mediated transformation of cultvred soyhean cells
US5545169A (en) 1993-04-01 1996-08-13 Yarger; Richard J. Laparoscopic delivery device
DK77393D0 (da) 1993-06-29 1993-06-29 Novo Nordisk As Aktivering af enzymer
JPH09508786A (ja) 1993-12-09 1997-09-09 ザ、テクサス、エイアンドエム、ユーニヴァーサティ、システィム バショウ種のアグロバクテリウム・ツメファシエンス(agrobacterium tumefaciens)形質転換
GB9421286D0 (en) 1994-10-21 1994-12-07 Danisco Promoter
US5536653A (en) 1994-11-04 1996-07-16 Monsanto Company Tomato fruit promoters
US5846797A (en) 1995-10-04 1998-12-08 Calgene, Inc. Cotton transformation
GB9606062D0 (en) 1996-03-22 1996-05-22 Zeneca Ltd Promoters
US6127179A (en) 1996-04-17 2000-10-03 Dellapenna; Dean Gene promoter for tomato fruit
DE19644478A1 (de) 1996-10-25 1998-04-30 Basf Ag Blattspezifische Expression von Genen in transgenen Pflanzen
US5981840A (en) 1997-01-24 1999-11-09 Pioneer Hi-Bred International, Inc. Methods for agrobacterium-mediated transformation
US5952543A (en) 1997-02-25 1999-09-14 Dna Plant Technology Corporation Genetically transformed pineapple plants and methods for their production
US5968830A (en) 1997-03-28 1999-10-19 Mississippi State University Soybean transformation and regeneration methods
WO1998055631A1 (en) 1997-06-05 1998-12-10 Calgene Llc Diacylglycerol acyl transferase proteins
US20090077685A1 (en) 1998-06-16 2009-03-19 Buehler Robert E Nucleic acid molecules and other molecules associated with plants
US6037522A (en) 1998-06-23 2000-03-14 Rhone-Poulenc Agro Agrobacterium-mediated transformation of monocots
US6344548B1 (en) 1998-06-24 2002-02-05 The Regents Of The University Of California Diacylglycerol o-acyltransferase
US7135617B2 (en) 1998-07-02 2006-11-14 Calgene Llc Diacylglycerol acyl transferase proteins
ATE442435T1 (de) 1998-07-02 2009-09-15 Calgene Llc Diacylglyzerin-acyltransferase proteine
US6100077A (en) 1998-10-01 2000-08-08 The Trustees Of Columbia University In The City Of New York Isolation of a gene encoding diacylglycerol acyltransferase
EP1135473A2 (en) 1998-12-02 2001-09-26 E.I. Dupont De Nemours And Company Sequenzes of a putative plant diacylglycerol acyltransferases
US6342657B1 (en) 1999-05-06 2002-01-29 Rhone-Poulenc Agro Seed specific promoters
US20040031072A1 (en) 1999-05-06 2004-02-12 La Rosa Thomas J. Soy nucleic acid molecules and other molecules associated with transcription plants and uses thereof for plant improvement
US7560542B2 (en) 1999-05-07 2009-07-14 Monsanto Technology Llc Nucleic acid molecule SEQ ID NO. 68811 and other molecules associated with plants
US7642346B2 (en) 1999-08-27 2010-01-05 Sembiosys Genetics Inc. Flax seed specific promoters
MXPA02007130A (es) 2000-01-21 2002-12-13 Pioneer Hi Bred Int Elementos promotores novedosos preferidos de raiz y metodos de uso..
US8106174B2 (en) 2000-05-08 2012-01-31 Monsanto Technology Llc Nucleic acid molecules and other molecules associated with plants and uses thereof for plant improvement
AU2001291656A1 (en) 2000-06-30 2002-01-08 Willem Broekaert Gene silencing vector
WO2003014347A2 (en) 2000-12-01 2003-02-20 Michigan State University Plant seed specific promoters
US20040067506A1 (en) 2000-12-04 2004-04-08 Ben Scheres Novel root specific promoter driving the expression of a novel lrr receptor-like kinase
EP1256629A1 (en) 2001-05-11 2002-11-13 Société des Produits Nestlé S.A. Leaf specifc gene promoter of coffee
US7417176B2 (en) 2002-07-31 2008-08-26 Monsanto Technology Llc Diacylglycerol acyltransferase nucleic acid sequences and associated products
WO2004044205A1 (en) 2002-11-11 2004-05-27 Korea Chungang Educational Foundation Plant seed-specific expression promoter derived from sesame and seed-specific expression vector comprising the promoter
KR100537955B1 (ko) 2003-10-29 2005-12-20 학교법인고려중앙학원 꽃가루 특이적 유전자 발현 프로모터
EP1528104A1 (en) 2003-11-03 2005-05-04 Biogemma MEG1 endosperm-specific promoters and genes
US7667097B2 (en) 2004-04-14 2010-02-23 Bayer Bioscience N.V. Rice pollen-preferential promoters and uses thereof
US7273746B2 (en) 2004-11-04 2007-09-25 E.I. Dupont De Nemours And Company Diacylglycerol acyltransferases for alteration of polyunsaturated fatty acids and oil content in oleaginous organisms
MY187548A (en) 2005-06-13 2021-09-29 Government Of Malaysia As Represented By The Mini Of Science Tehnology And Innovation Malaysia Leaf-specific chlorophyll a/b binding protein promoter
US8299318B2 (en) 2007-07-05 2012-10-30 Ceres, Inc. Nucleotide sequences and corresponding polypeptides conferring modulated plant characteristics
US8362325B2 (en) 2007-10-03 2013-01-29 Ceres, Inc. Nucleotide sequences and corresponding polypeptides conferring modulated plant characteristics
NZ568190A (en) 2008-05-12 2010-09-30 Nz Inst Plant & Food Res Ltd Chimeric compositions and methods for regulating plant gene expression
BRPI0909611B8 (pt) 2008-05-23 2022-12-06 Pioneer Hi Bred Int Método de aumento do teor total de ácido graxo de uma célula de oleaginosa, ácido nucleico recombinante, construção de dna recombinante e método de produção de uma semente oleaginosa
KR20090123710A (ko) 2008-05-28 2009-12-02 동아대학교 산학협력단 애기장대 AN 유전자의 탈수소효소 활성 및 uORF조절에 관한 서열
BR122019021594B1 (pt) 2009-10-30 2021-10-05 Agresearch Limited Oleosina modificada célula hospedeira, corpo oleoso e seu método de produção, emulsão, ração animal, e método para produção de uma planta que acumula mais óleo que uma planta controle adequada
CN105473718A (zh) 2012-10-30 2016-04-06 农业研究有限公司 增强的酰基转移酶的多核苷酸、多肽、及其使用方法
CN105121646B (zh) 2012-10-30 2020-07-21 农业研究有限公司 新的酰基转移酶多核苷酸、多肽、及其使用方法
WO2014068439A2 (en) 2012-10-30 2014-05-08 Agresearch Limited Improved acyltransferase polynucleotides, polypeptides, and methods of use

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101687907A (zh) * 2007-03-08 2010-03-31 新西兰植物和食品研究院有限公司 转移酶、差向异构酶、编码它们的多核苷酸及其用途

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
PATRICIA MÜLLER-MOULÉ: "An expression analysis of the ascorbate biosynthesis enzyme VTC2", 《PLANT MOL BIOL》 *
金勇丰: "高等植物基因上游可译框架(uORF)的分析", 《农业生物技术学报》 *

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113293162A (zh) * 2020-08-24 2021-08-24 山东舜丰生物科技有限公司 一种提高植物中维生素c含量的方法
WO2022042446A1 (zh) * 2020-08-24 2022-03-03 山东舜丰生物科技有限公司 一种提高植物中维生素c含量的方法
CN113293162B (zh) * 2020-08-24 2022-04-01 山东舜丰生物科技有限公司 一种提高植物中维生素c含量的方法
WO2023230631A1 (en) * 2022-05-27 2023-11-30 Roger Paul Hellens Novel methods for identification and use of upstream open reading frames
CN115029359A (zh) * 2022-06-10 2022-09-09 云南师范大学 一种兼顾农作物产量和品质的改良方法
CN115058403A (zh) * 2022-06-10 2022-09-16 云南师范大学 一种提高马铃薯薯块中维生素c含量的方法

Also Published As

Publication number Publication date
EP2935590A2 (en) 2015-10-28
CN104884622B (zh) 2018-11-13
CN104884622A (zh) 2015-09-02
WO2014097226A2 (en) 2014-06-26
WO2014097226A3 (en) 2014-11-13
ZA201504442B (en) 2021-05-26
AU2013365731A1 (en) 2015-06-11
US9648813B2 (en) 2017-05-16
EP2935590A4 (en) 2016-09-28
US20160130597A1 (en) 2016-05-12
AU2013365731B2 (en) 2018-11-22
CA2894979A1 (en) 2014-06-26
NZ708313A (en) 2019-08-30
CL2015001764A1 (es) 2015-10-30

Similar Documents

Publication Publication Date Title
CN104884622B (zh) 基因表达的调控
AU2008221696B2 (en) Transferases, epimerases, polynucleotides encoding these and uses thereof
CA2889985C (en) Improved acyltransferase polynucleotides, polypeptides, and methods of use
AU2013340443B2 (en) Enhanced acyltransferase polynucleotides, polypeptides, and methods of use
CN1810977B (zh) 增强植物和真菌中的2-乙酰基-1-吡咯的合成的核酸
CN101969759A (zh) 具有增强的产量相关性状的植物及其制备方法
CN107636155A (zh) 红冬孢酵母属和红酵母属的d‑氨基酸诱导型基因表达***
KR20130035268A (ko) 향상된 수확량 관련 형질을 갖는 식물 및 이의 제조 방법
AU2013340444B2 (en) Novel acyltransferase polynucleotides, polypeptides, and methods of use
EP2285968B1 (en) Chimeric compositions and methods for regulating plant gene expression
WO2009061214A1 (en) Compositions and methods for modulating pigment production in plants
JP2023514687A (ja) グリコシルトランスフェラーゼ、これらをコードするポリヌクレオチドおよび使用方法
CN112708603B (zh) 水稻are2基因在植物氮代谢调控中的应用
CN109295024A (zh) 降低OsSAMS1蛋白及其编码基因表达在提高植物对水稻矮缩病毒抗性中的应用
Wang et al. Cloning, biochemical identification, and expression analysis of a gene encoding S-adenosylmethionine decarboxylase in navel orange (Citrus sinensis Osbeck)
WO2008140334A1 (en) Compositions and methods for regulating plant gene expression
NZ553705A (en) Transferases, polynucleotides encoding these and uses thereof
WO2006011815A2 (en) Phosphatases, polynucleotides encoding these and uses thereof

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20190405