CN101617047A - 用于甘蔗属复合组的基于微卫星的指纹分析*** - Google Patents

用于甘蔗属复合组的基于微卫星的指纹分析*** Download PDF

Info

Publication number
CN101617047A
CN101617047A CN200880004444A CN200880004444A CN101617047A CN 101617047 A CN101617047 A CN 101617047A CN 200880004444 A CN200880004444 A CN 200880004444A CN 200880004444 A CN200880004444 A CN 200880004444A CN 101617047 A CN101617047 A CN 101617047A
Authority
CN
China
Prior art keywords
sequence
dna
seq
primer
sample
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN200880004444A
Other languages
English (en)
Inventor
S·玛特斯沃卡
W·小麦克切罗尼
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Monsanto do Brasil Ltda
Original Assignee
CanaVialis SA
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by CanaVialis SA filed Critical CanaVialis SA
Publication of CN101617047A publication Critical patent/CN101617047A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01HNEW PLANTS OR NON-TRANSGENIC PROCESSES FOR OBTAINING THEM; PLANT REPRODUCTION BY TISSUE CULTURE TECHNIQUES
    • A01H1/00Processes for modifying genotypes ; Plants characterised by associated natural traits
    • A01H1/04Processes of selection involving genotypic or phenotypic markers; Methods of using phenotypic markers for selection
    • A01H1/045Processes of selection involving genotypic or phenotypic markers; Methods of using phenotypic markers for selection using molecular markers
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6888Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for detection or identification of organisms
    • C12Q1/6895Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for detection or identification of organisms for plants, fungi or algae
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/156Polymorphic or mutational markers

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Organic Chemistry (AREA)
  • Genetics & Genomics (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Analytical Chemistry (AREA)
  • Botany (AREA)
  • Zoology (AREA)
  • Biotechnology (AREA)
  • Wood Science & Technology (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Developmental Biology & Embryology (AREA)
  • Biophysics (AREA)
  • Immunology (AREA)
  • Microbiology (AREA)
  • Molecular Biology (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Mycology (AREA)
  • Environmental Sciences (AREA)
  • Biochemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本发明涉及甘蔗的微卫星及其侧翼序列、微卫星分离的方法、适于使用这些序列进行指纹分析的方法以及可以用于如下应用的方法:甘蔗属复合组成员的鉴定、种质收集物的管理、祖先的选择、品种之间的鉴别、杂交体的鉴定、需要的基因组序列的基因渗入、亲子关系的确定、基因和数量性状基因座(QTL)的作图和MAS(标记辅助的选择)程序的开发。

Description

用于甘蔗属复合组的基于微卫星的指纹分析***
相关申请
本申请要求2007年1月12提交的美国临时申请第60/884,705号的优先权,本文将其完整引入作为参考。
发明领域
本发明涉及甘蔗属复合组成员(accession)的分子分析。本发明涉及甘蔗(Saccharum spp.)的微卫星及其侧翼序列、微卫星分离的方法、适于使用这些序列进行指纹分析的方法以及可以用于如下应用的方法:甘蔗属复合组成员的鉴定、种质收集物的管理、祖先的选择、品种之间的鉴别、杂交体的鉴定、需要的基因组序列的基因渗入、亲子关系的确定、基因和数量性状基因座(QTL)的作图和MAS(标记辅助的选择)程序的开发。
发明背景
对可再生能源的寻找将甘蔗置于世界农作物中的突出的位置。从这种多年生禾本科植物的多汁茎中提取的汁液分别占全球糖和乙醇生产的75%和30%以上(Ming等人,2006,Plant Breed.Rev.27:15-118;Orellana和Bonalume Neto,2006,Nat.Biotechnol.24:232)。
随着全球对于乙醇的需求的增长,甘蔗种植正在向新的地区扩展,而且对于更高的田间产量具有持续的需求(Thomas和Kwong,2001,Energy Policy 29:1133-1143;Geller等人,2004,Energy Policy32:1437-1450;Gantz,2005,Renewable Fuel News 17(27):1-6)。与改良的品种一样,需要适应新环境的新品种和改进的栽培技术,以提高糖和生物质的产量。在全世界范围内已经利用几个育种程序进行了甘蔗的遗传改良和用于粗放耕作的品种的开发(Tew,1987,NewVarieties In:Heinz DJ(编著)Sugarcane Improvement through Breeding,Elsevier Press,Amsterdam:559-592;Machado,2001,SugarcaneVariety Notes″An Internacional Directory″第7版)。总之,目前通过超过一个世纪的主要基于种质交换和育种技术发展的常规育种获得的结果,已经允许农作物在热带和亚热带地区广泛地种植,而且在甘蔗和糖产量方面已经产生了连年的持续增长(Hogarth等人,1977,Sugarcane Improvement:past achievements and future prospects In:Manjit SK(编著)Crop Improvement for the 21st Century,LouisianaState University,Louisiana:29-55;Miocque和Machado,1977,Sugar J.40:9-13;Heinz和Tew,1987,Hybridization procedures In:Heinz DJ(编著)Sugarcane Improvement through Breeding,Elsevier Press,Amsterdam:313-342;Matsuoka等人,1999,Melhoramento decana-de-acúcar In:Borém A(编著)Melhoramento de espéciescultivadas,Imprensa Universitária,205-251;Berding等人,2000,Advances in breeding technology for sugarcane In:Keating BA和Wilson J(编著)Intensive Sugarcane Production:Meeting the Chalengesbeyond 2000,CABI Publishing,UK:141-156;Edmé等人,2005,Crop.Sci.45:92-97;Jackson,2005,Field Crops Res.92:277-290)。
甘蔗属于禾本科(Poaceae)、蜀黍族(tribe Andropogoneae)、甘蔗属,公认具有6个种:热带种(S.officinarum)、大茎野生种(S.robustum)、印度种(S.barberi)、中国种(S.sinense)、细茎野生种(S.spontaneum)和野生肉质花穗种(S.edule)。印度种和中国种被认为是热带种和细茎野生种之间的天然的杂交体,而热带种起源于其发源地新几内亚巴布亚岛(Papua,New Guinea)中心的大茎野生种的野生群体。如蔗茅属(Erianthus)、硬蔗草属(Sclerostachya)、河八王属(Narenga)和芒属(Miscanthus)的其它属在种系发生学上与甘蔗相关,它们一起形成“甘蔗属复合组”(Daniels和Roach,1987,Taxonomy and evolution in sugarcane In:Heinz DJ(编著)Sugarcane Improvement through Breeding,Elsevier Press,Amsterdam:  7-84)。目前的品种是由主要涉及热带种、细茎野生种、印度种和中国种这4个种的初始种间杂交产生的杂交体(Irvine,1999,Theor.Appl.Genet.98:186-194)。甘蔗杂交体的基因组的主要部分来自富含糖的著名的热带种甘蔗(80%),10-15%来自适应环境应激且耐受病虫害的乡间细茎野生种甘蔗,很少一部分是杂交染色体(D′Hont等人,1996,Mol.Gen.Genet.250:405-413;Price,1957,Bot.Gaz.118:146-159;Roach,1969,Proc.Int.Soc.Sugar Cane Technol.13:901-920)。大部分品种在一定程度上彼此相关,因为它们来自20世纪早期在爪哇(印度尼西亚)和印度进行的同样的初始杂交。从已知的谱系量化的杂交体的遗传基础局限于一小群热带种克隆,且很少来自其它种(Arcenaux,1967,Proc.Int.Soc.Sugarcane Technol.12:844-854;Tew,1987,New Varieties In:Heinz DJ(编著)SugarcaneImprovement through Breeding,Elsevier Press,Amsterdam:559-592)。但是,由于甘蔗属的多倍性本质加上出现于种间杂交体中的非整倍性,通过分子方法评估的遗传多样性仍然较高(Jannoo等人,1999,Theor.Appl.Genet.99:171-184)。热带种的真正克隆具有2n=80(x=10)的基本染色体数,而细茎野生种具有2n=40-128(x=8)的染色体数。由于在甘蔗的早期遗传改良中发生的转移过程(nobilisationprocess)(与热带种的反复的回交)中出现的非整倍性,杂交体的总染色体数可能在100-130之间变化(Bremer,1961,Euphytica 10:59-78)。
商业品种的培育可能要花费12-15年才能完成一个周期,新性状的渗入(introgression)可能需要几十年时间(Skinner等人,1987,Selection methods,criteria and indices In:Heinz DJ(编著)SugarcaneImprovement through Breeding,Elsevier Press,Amsterdam:409-452)。由种间杂交产生的祖先中的等位基因的高度杂合性(heterosigozity)、多倍性和非整倍性以及如田间表现、糖累积、纤维含量和病虫害耐受性等最重要的性状的定量遗传本质,使得后代的表现非常不可预测(Hogarth,1987,Genetics of sugarcane In:Heinz DJ(编著)Sugarcane Improvement through Breeding,Elsevier Press,Amsterdam:255-271;Grivet和Arruda,2001,Curr.Opin.Plant Biol.5:122-127;Hoarau等人,2002,Theor.Appl.Genet.105:1027-1037;Ming等人,2006,Plant Breed.Rev.27:15-118;Wei等人,2006,Theor.Appl.Genet.114:155-164)。需要涉及亲代测试的大量的杂交来鉴定良好的对,而且筛选计划包括大的原始群体。为了克服这些瓶颈问题,育种人员已经在开发在品种选择的几个阶段使用的DNA标记,增加发现良好的亲本的机会,并减少开发的时间和费用(Butterfield等人,2004,S.Afr.J.Bot.70:167-172;Manners等人,2004,Proceedings of the 4thInternational Crop Science Congress;Casu等人,2005,Field Crop Res.92:137-147;McIntyre等人,2005,Mol Breed.16:151-161;Moore,2005,Int.Sugar J.107:27-31;Aitken等人,2006,Theor.Appl.Genet.112:1306-1317)。
微卫星,也称为简单序列、简单序列重复(SSR)、简单重复DNA序列、短串联重复(STR)或简单序列基序(SSM),是在每种活生物体的基因组的编码区和非编码区发现的DNA段(stretches)。它们由许多串联重复的短核苷酸基序或重复单位组成。微卫星由1-6个串联重复的核苷酸单元形成,在基因组染色体拷贝之间其长度变化,且可以通过PCR(聚合酶链反应)检测,并通过不同的色谱方法显现为由大小不同的扩增DNA片组成的条码***。微卫星的特征是它们是高度多态性的。即,每个微卫星“基因座”可能具有许多根据多倍性的值(染色体拷贝数)而变化较大的“等位”形式。多态性STR基因座是每种生物体中对于鉴定、亲子关系检测和遗传学作图非常有用的标记。多态性是微卫星的一个特征,极大地有助于其在指纹分析中的实用性。
最初描述了人类中的微卫星(Litt和Luty,1989,Am.J.Hum.Genet.44:397-401),后来描述了如小鼠(Love等人,1990,Nucl.AcidsRes.18(14):4123-4130)、猪(Johansson等人,1992,J.Hered.83(3):196-198)和牛(Kemp等人,1993,Animal Genet.24:363-365)等其它哺乳动物种中的微卫星。在人类中,微卫星的多态性已被广泛地用于个体鉴定,例如,在亲子关系和法医案例中,以及用于与遗传疾病相关的基因的作图中。例如,Caskey等人的美国专利第5,364,759号公开了用于法医和医学目的的人类个体指纹分析的定型分析,以及从DNA数据库鉴定微卫星序列的技术。也公开了具有适于包含于DNA序型分析中的特征的存在于人类基因组中的特定三聚和四聚短串联重复(STR)。Weber的美国专利第5,582,979号提供了从人类基因组DNA分离的多种具体的序列,其侧面为CA和GT二核苷酸重复,用于利用重复区域的多态性的法医和亲子关系检测。
Perlin的美国专利第5,580,728号公开了使用含有显示DNA样品之间多态性的重复序列的扩增DNA序列的基因型分型方法和自动化***。该专利描述了使用短串联重复(STR)的自动数据获取和解释技术和基于这样的聚合酶链反应(PCR)扩增的标记建立遗传图谱所需的步骤。Buard等人的美国专利第5,573,912号描述了以下方案:使用大小分离的限制性内切酶消化物从DNA获得新的短串联重复区域,接着与相同种的基因组DNA杂交,并将杂交谱与使用含有可变串联重复区域的已知探针获得的杂交谱进行比较。没有公开直接用于基因型分型的具体序列。
Polymeropoulos等人的美国专利第5,369,004号和第5,378,602号公开了适合作为用于医学目的和遗传学作图的人类DNA重复多态性检测的PCR(聚合酶链反应)引物的具体序列。Navot等人的美国专利第5,650,277号公开了一种确定微卫星中寡核苷酸重复的确切数目的方法,其中,每个重复长2个或3个核苷酸。该专利没有记载任何具体引物,而需要以前对于微卫星中的重复序列或微卫星侧翼序列的确定。
微卫星已被用于包括水稻、玉米、大豆、大麦和番茄的各种植物的基因组作图,因而成为制作基因组图谱的重要工具。Zhao等人,1996,in Applications of repetitive DNA sequences in plant genomeanalysis In:Paterson AH(编著)Genome Mapping in Plants,R.G.Landes Co.,New York:111-125公开了DNA重复基序在植物基因组作图中的应用的综述。除了遗传学作图,微卫星还可以用于物理作图。例如,某些类型的重复可以显示在染色体上的特异性分布(Schmidt和Heslop-Harrison,1996,Proc.Natl.Acad.Sci.USA 93(16):8761-8765),因而不同的微卫星可以用于基因组的不同区域的物理作图。
微卫星也已经用于许多农作物的指纹分析,以及评估植物栽培品种、亚种之间的遗传多样性等。微卫星的主要优势在于它们甚至在种内和栽培品种之内也经常是高度多态性的。另外,微卫星的侧翼序列通常是基因座特异性的,因而提供了用于可靠地分离该基因组区域的特异性引物。微卫星在植物鉴定中的应用的例子包括葡萄藤栽培品种鉴定和栽培品种的遗传关联性的评估(Thomas等人,1994,Plant Mol.Biol.25(6):939-949);为了天然种群中的共同亲本鉴定野生薯蓣的个体(Terauchi和Konuma,1994,Genome 37(5):794-801);芥菜种质的品种鉴定(Bhatia等人,1995,Electrophoresis 16(9):1750-1754);鹰嘴豆品种的鉴定(Sharma等人,1995,Electrophoresis16(9):1755-1761);玉米栽培品种种质遗传分析(Taramino和Tingey,1996,Genome 39(2):277-287);和水稻遗传多样性的栽培品种内变异的评估(Olufowote等人,1997,Genome 40(3):370-380)。
正在越来越多地使用微卫星标记,以通过连锁分析在植物基因组中定位特异的、经济上有用的基因。例如,通过聚合酶链反应(PCR)扩增和微卫星多态性的连锁分析,利用STR对靠近水稻Rfl基因(一种对于杂交水稻生产不可缺少的育性恢复基因)的微卫星标记作图(Akagi等人,1996,Genome 39(6):1205-1209)。该标记不仅可用于培育育性恢复系和保持系,而且可用于控制杂交水稻种子的纯度。
微卫星是一类如上所述的基于DNA的分子标记,通常在植物改良中用于基因和性状作图和随后的MAS(标记辅助的选择)程序的开发(Rakoczy-Trojanowska和Bolibok,2004,Cell Mol.Biol.Lett.9:221-238;Varshney等人,2005,TIB 23:48-55)。由于标记和区分种群共有的特异性基因组区域的能力,微卫星用作区分个体的指纹分析***。在植物育种计划中,微卫星和其它DNA标记已被成功地用于种质收集物的鉴定、分类和管理、亲本选择、品种区别、需要的性状的渗入和亲子关系的确定(Lee,1995,Adv Agron.55:265-344;Eagles等人,2001,Aust.J.Agric.Res.52:1349-1356;Kirst等人,2005,J.Hered.96:161-166),而且经UPOV(植物新品种保护协会)的审查成为用于涉及所有权问题的品种鉴定的支持性鉴别工具(UPOV2005)。UPOV通过被称为区别性、均匀性和稳定性(DUS)测试的标准化程序评估调整的描述信息(descriptor)。满足DUS测试的要求的分子标记在UPOV考虑下,可用于与植物育种人的权利的实施相关的品种鉴定、技术检验和必要的推导的考虑因素。
甘蔗改良中由种间或属间杂交产生的杂交后代在可以用于渗入研究之前,其验证是必需的(Lee等人,1998,Aust.J.Agri.Res.49:915-921)。甘蔗杂交体鉴定的传统的形态学方法是不可靠的,因为难以区分真正的杂交体与自花授粉后代或由花粉混杂产生的后代。分子标记提供了鉴定真正的杂交体的可靠的方法。
甘蔗亲本的选择一般包括潜在候选物的初始测试,其中,通过特定的育种程序的常规选择方案评估双亲本杂交或多向杂交产生的少量的后代或家族(Heinz和Tew,1987,Hybridization procedures In:Heinz DJ(编著)Sugarcane Improvement through Breeding,ElsevierPress,Amsterdam:313-342)。那些产生优良个体的雄性和雌性的成对组合成为证实的亲本。然后重复同样的杂交以产生大量的后代用于品种选择。在多向杂交中,在第一阶段只可证明母本,但可以在发现正确的父本之前测试几个雄性。因此,多向杂交在理论上具有更高的揭示证实的亲本的可能性,而双亲杂交可以常规且大量地进行,具有显示优良个体的优势。在多向杂交***中育种人员可以尽快地鉴定所选择的克隆的父本,这可以减少开发新品种的时间和花费,而且对于实现改良的程度应当具有明显的影响(Buteler等人,1997,Euphytica 96:353-361)。
确定亲子关系的方法非常重要,因为在甘蔗中育种效率非常低;例如,从1970年直到1989年,在巴西的IAA/PlanalSucar育种计划中,从评估的7.000.000株幼苗中只有不到0.0003%的后代被开发为商业品种。甚至在大多数用于育种计划的优良亲本之间进行全部的杂交组合实际上也是不可能的。传统上,使用只有一个母本和只有一个父本的双亲杂交。经常使用的其它策略是开放授粉中只涉及一个母本和8-40个父本的多亲本杂交(或多向杂交)。多向杂交方法已被用于甘蔗育种,以使处于幼苗测试阶段的后代中代表的杂交组合数最大化。反对使用多向杂交方法的主要理由是幼苗产生过程中发生谱系信息的快速丢失。提出了基于微卫星的亲子关系分析作为鉴定由多向杂交产生的后代的父本的有效方法。在某些例子中,确认母本也是必需的。
在杂交之前根据活花粉的百分比将甘蔗祖先分为父本或母本。通常雄性比雌性具有生存能力更强的花粉,但自花授粉不能被自然的自交不亲和性机制完全避免,预期其会发生,尽管其水平未知。可预知自花授粉产生的后代具有较低的活力,因而高水平的自殖可能影响高水平的家族的性能,掩盖祖先的育种价值。量化杂交中的自殖水平的标记方法是基于鉴定或不鉴定后代样品中的父本特异性等位基因(McIntyre和Jackson,2001,Euphytica 117:245-249)。用一组基因座对一定数量的幼苗进行基因型分型,那些没有父本特异性等位基因的幼苗被认为是自花授粉的产物。
开发微卫星标记的常规技术是昂贵、耗时的,且一般需要几个步骤(Cordeiro等人,1999,Plant Mol.Biol.Rep.17:225-229)。
在专业文献中,只有有限数量的微卫星标记可用于甘蔗,另外,这些标记的质量不完全适合指纹分析的目的(Aitken等人,2005,Theor.Appl.Genet.110:789-801;Arro,2005,In:MS Thesis GeneticDiversity Among Sugarcane Clones Using Target Region AmplificationPolymorphism(Trap)Markers and Pedigree Relationships,LouisianaState University,Louisiana;Casu等人,2005,Field Crops Res.92:137-147;Cordeiro,2001,Molecular marker systems for sugarcanegermplasm analysis In:Henry RJ(编著)Plant Genotyping-The DNAFingerprinting of Plants,.CABI Publishing,Wallingford:129-146;Cordeiro等人,1999,Plant Mol.Biol.Rep.17:225-229;Cordeiro等人,2000,Plant Sci.155:161-168;Cordeiro等人,2003,Plant Sci.165:181-189;Garcia等人,2006,Theor.Appl.Genet.112:298-314;Jannoo等人,2001,Proc.Intl Soc.Sugar Cane Technol.24:637-639;Pan等人,2003,Maydica 48:319-329;Pan等人,2003,Plant and Animal GenomeAbstract XI Abstract Book W189:43;Pinto等人,2004,Genome 47:795-804)。
由EST(表达序列标签)代表的表达的甘蔗基因组已被测序,且成为微卫星标记的丰富的来源(Silva,2001,Gen.Mol.Biol.24:155-159;Vettore等人,2001,Gen.Mol.Biol.24:1-7)。开发稳定性足以在标准条件下重现并且区别个体的分子标记***已成为甘蔗培育者的一个主要的关注点(Cordeiro,2001,Molecular marker systems forsugarcane germplasm analysis In:Henry RJ(编著)Plant Genotyping-The DNA Fingerprinting of Plants,CABI Publishing,Wallingford:129-146)。
发明概述
本发明公开了用于鉴定、评估和确认来自甘蔗属复合组、尤其是来自甘蔗属的种的基因组中存在的、作为表达序列标签-序列获得的微卫星标记的方法和手段,和这些标记在甘蔗属复合组成员的指纹分析中的应用。
本发明的一个目的是,提供选择一套能够区分大量甘蔗属复合组成员的表达序列标签衍生的微卫星标记的方法和手段,所述甘蔗属复合组成员共有不同水平的家系:以(a)建立在用于检测DNA标记多态性的两种常用和普及的技术聚丙烯酰胺凝胶电泳(PAGE)和DNA序列分析仪分析之后用于结果重现的技术条件;(b)使用标记组作为甘蔗属复合组育种中的工具;和(c)作为所有权问题的候选支持***。
本发明也提供了可从甘蔗获得的分离的微卫星序列,以及对于本发明的微卫星序列特异性的侧翼序列。也提供了使用由这些微卫星和侧翼序列设计的探针和引物的方法,以及包含这些探针和引物的试剂盒。
第一方面,本发明提供了分离的多核苷酸,其包含至少一种微卫星重复和至少两种相关的侧翼序列。在一种实施方式中,本发明的分离的多核苷酸包含选自以下的序列:(i)SEQ ID NO:1-10所示的序列;(ii)与SEQ ID NO:1-10所示的序列互补的序列;和(iii)微卫星中的重复数有变化的(i)或(ii)的序列的变体。
第二方面,本发明提供了用于扩增位于甘蔗或相关属(甘蔗属复合组)的DNA中的微卫星的、包括正向引物和反向引物的引物对。适于聚合酶链反应(PCR)扩增微卫星的引物对可以选自SEQ ID NO:11-30。
第三方面,本发明提供了用于确定甘蔗属复合组的样品中的基因型的方法。该方法包括确定甘蔗属复合组的基因型,并将所述打分结果与预定的已知样品的DNA的分析结果进行比较。使用该方法可以鉴定未知样品。鉴定方法可以用于种质收集物的管理;用于鉴定属于或不属于两种不同的种的不同基因型之间的杂交体;用于鉴定贴错标签的通过组织培养程序产生的小植株样品;用于鉴定甘蔗地中的植物的品种混合物;用***基因的特异性引物通过多重标记组鉴定和检测转基因。
第四方面,本发明提供了希望的基因组序列从甘蔗属复合组样品的一个成员向另一个成员渗入的方法。
第五方面,本发明提供了通过利用本发明的微卫星评估祖先之间的遗传相似性的能力,从甘蔗属复合组中选择祖先的方法。
第六方面,本发明提供了在父本和/或母本未知的情况下确定祖先的方法。
第七方面,本发明提供了用于量化在涉及一个或多个甘蔗属复合组祖先的特定杂交产生的幼苗样品中的自花授粉的方法。
本发明的第八方面,本文提供了使用可商购的聚合酶链反应(PCR)装置来检测甘蔗属复合组的样品的成员的试剂盒。
第九方面,本发明提供了用于开发MAS(标记辅助的选择)程序的与数量性状基因座(QTL)的等位基因相关联的基因的定位(作图)方法。
附图简述
图1显示简单序列重复(SSR)指纹识别***区分甘蔗属复合组成员和共有不同水平的亲缘关系的相关种的能力,如实施例5所述。
图2显示简单序列重复(SSR)指纹识别***区分品种RB855002的48个自花授粉的F1后代的能力,如实施例5所述。
图3显示多向杂交中亲子关系的确定。如实施例7所述,RB966928是母本,有30种可能的父本,29种父本加上也可以作为父本的母本(自花授粉)。
发明详述
本发明公开了通过在甘蔗属复合组的基因组中的微卫星分析基因型分型和鉴定,检测和鉴定甘蔗属复合组成员的方法和手段。本发明提供了新型的分离的微卫星DNA序列和这些微卫星侧翼的DNA序列,这些序列可从甘蔗成员获得。特别地,本发明提供了:(i)SEQ ID NO:1-10的分离的多核苷酸序列;和(ii)SEQ ID NO:1-10序列的互补序列;和(iii)其变体。
第一方面,本发明提供了分离的多核苷酸,其包含至少一种微卫星重复和至少两种相关的侧翼序列。在一种实施方式中,本发明的分离的多核苷酸包含选自以下的序列:(i)SEQ ID NO:1-10所示的序列;(ii)与SEQ ID NO:1-10所示的序列互补的序列;和(iii)微卫星中的重复数有变化的(i)或(ii)的序列的变体。
本发明的分离的多核苷酸序列在以下方面具有实用性:(a)甘蔗属复合组成员的鉴定,(b)DNA多态性的检测,(c)基因组作图,和(d)植物组织、群体、栽培品种、种和种组别之内和之间的遗传变异性的评估。
具有单拷贝侧翼序列的分离的微卫星重复提供了基因座特异性的标记。侧翼序列可以用来设计基因座特异性的引物,以扩增并检测植物基因组中微卫星序列的存在。
甘蔗属复合组植物DNA可以是基因组DNA或cDNA。一般地,微卫星更频繁地出现于基因组的非编码区域,但这不排除分离可能存在于转录区域的微卫星,如存在于由其衍生的mRNA和cDNA中的微卫星,本领域的技术人员熟知该过程。在本发明中,DNA优选地是cDNA。
筛查352,122个甘蔗表达序列标签EST的数据库,搜索具有简单序列重复(SSR)基序的序列。通过将来自SUCEST计划(Vettore等人,2001,Gen.Mol.Biol.24:1-7)和已经存储于GenBank的其它来源(Benson等人,2006,Nucleic Acids Res.34:16-20)的公共可以获得的序列与个人创建的数据库(www.alellyx.com.br)相结合,获得352,122个甘蔗EST序列(读数)的丰余数据库。
使用微卫星鉴定软件,在这种具体的例子中使用MISA软件,筛查丰余表达序列标签EST数据库,搜索单一的和复合的简单序列重复(SSR)基序(Thiel等人,2003,Theor.Appl.Genet.106:411-422)。将计划设置为鉴定大小为1(一)、2(二)、3(三)、4(四)、5(五)和6(六)个核苷酸的重复基序。设置基序中的重复单元数的下限为:对于一个核苷酸的基序为至少10个重复、对于二个核苷酸的基序为6个重复,对于四、五、六个核苷酸的基序为至少5个重复。复合基序被定义为具有被100个或更少的碱基分隔的两个或多个重复基序的基序。
装配确认的含有简单序列重复(SSR)的表达序列标签EST序列的亚数据库,以形成如Telles和Silva,2001,Gen.Mol.Biol.24:17-23记载的丰余序列的群。根据简单序列重复(SSR)基序的类型将群分类。对于基序的每种类型,按照两种标准分别进行候选标记的选择:具有最大数目的重复单位数不同的读数的群(计算机模拟的多态性),和具有含有最大数目重复单位的读数的群(潜在的多态性)。
本发明的第二方面,提出了用于扩增位于甘蔗属复合组成员的DNA中的微卫星的、包含正向引物和反向引物的引物对。适于聚合酶链反应(PCR)扩增微卫星的引物对选自SEQ ID NO:11-30。
借助用于设计聚合酶链反应(PCR)引物的程序,如软件Primer3(Rozen和Skaletsky,1998,Primer3 on the WWW for general users forbiologist programmers In:Krawetz S.和Misener S.(编著)Bioinformatics Methods and Protocols:methods in molecular biology,Human Press,Totowa:365-382),为每种计算机选择的群设计引物对。将程序设定为在装配的共有序列中鉴定解链温度(Tm)为大约64℃、长度分别为19-22个碱基、包含简单序列重复(SSR)基序侧翼序列(距基序的5′和3′端至少5个碱基)的引物对,并扩增100-250bp的片段。
本发明的第三方面,提出了用于确定甘蔗属复合组的样品中的基因型的方法。该方法包括以下步骤:(i)从样品获得DNA;(ii)扩增选自以下的简单序列重复(SSR)基因座:(i)SEQ ID NO:1-10所示的序列;和(ii)与SEQ ID NO:1-10所示的序列互补的序列;该扩增使用选自以下的DNA中的一套引物:(i)SEQ ID NO:11-30所示的序列;(ii)与SEQ ID NO:11-30所示的序列互补的序列;和(iii)包含SEQ ID NO.11-30引物对的SEQ ID NO:11-30所示序列的至少6个连续核苷酸的序列,以形成具有各种大小和标记的扩增产物;(iii)根据大小分离扩增产物;(iv)对所述分离的结果打分;和(v)比较所述打分结果与预先已经分析并确定的已知种的DNA的分析结果。该方法允许鉴定用于将甘蔗属复合组的样品与植物来源相关联的成员,包括以下步骤:(i)用本方法确定所述样品中的DNA的身份,(ii)用本方法确定已知植物基因型的样品中的DNA的身份;和(iii)比较两种样品的基因型以确定样品(i)的身份。
用于确定甘蔗属复合组样品的基因型的鉴定方法可以用于不同的应用,例如:
(a)种质收集物的管理、分类类似的克隆、排除复本和鉴定贴错标签的成员。国际甘蔗技术人员协会已经确认种质的指纹分析是一项重要的事项;
(b)鉴定属于或不属于两个不同种、属的不同基因型之间的杂交体;
(c)通过鉴定贴错标签的由组织培养程序产生的小植株样品证实“质量控制”;
(d)鉴定来自甘蔗地证明苗圃的植物的品种混合物;和
(e)使用***基因的特异性引物通过多重标记组鉴定和检测转基因。
第四方面,本发明提供了希望的基因组序列从甘蔗属复合组样品中的一个成员向其它成员渗入的方法,使用标记组在后代中鉴定那些具有来自在杂交中使用的母本和父本的等位基因的杂交体。该方法包括利用以下步骤鉴定母本和父本的等位基因:(i)从样品(例如:母本和父本和后代)获得DNA,(ii)利用选自SEQ ID NO.11-30的引物对的DNA中的一套引物扩增简单序列重复(SSR)基因座,以形成具有各种大小和标记的扩增产物;(iii)根据大小分离扩增产物;(iv)鉴定父本和母本的专有等位基因(exclusives alleles);(v)鉴定兼有父本和母本的专有等位基因的后代个体(杂交体个体)。结果可以用来选择具有可在即将进行的杂交中使用的、具有希望的渗入基因组序列的杂交体个体。
第五方面,本发明提供了通过利用微卫星评估成员之间的遗传相似性的能力来选择祖先的方法。该方法包括确定将要用作杂交亲本的选择的一组甘蔗属复合组样品的基因型,和借助于特定的遗传相似性评估软件(例如,NTSys)进行所述打分结果的比较。该分析的结果将会提供成员之间的遗传相似性的指数,该指数可以用来推进具有更高的产生改良后代(杂种优势)的可能性的双亲杂交(一个父本和一个母本)。该方法包括利用以下步骤确定选择的一组甘蔗属复合组样品的基因组:(i)从样品(如一组甘蔗成员)获得DNA,(ii)用选自SEQ ID NO.11-30的引物对的DNA中的一套引物扩增简单序列重复(SSR)基因座,以形成具有各种大小和标记的扩增产物;(iii)根据大小分离扩增产物;(iv)产生具有打分结果的微卫星二进制数据;和(v)借助特定的遗传相似性评估软件,对含有打分结果的二进制数据进行数学处理,以产生亲本选择指数。产生的指数可以用来选择将要在杂交中使用的亲本。
利用甘蔗属复合组育种群体中的遗传多样性的评估产生遗传距离指数,育种人员使用该指数可以预测亲本的杂种优势和后代的性能(Lima等人,2002,Theor.Appl.Genet.104:30-38)。使用在指纹分析育种群体后产生的微卫星二进制数据可以容易地计算这些指数,且这些指数已经用来指导亲本的选择。杂种优势的预测使得杂交和待筛选的后代的数量减少,并且对于开发新品种的费用和耗时具有直接的影响。预期在重要基因和性状的作图以及随后标记辅助选择方案的开发中使用这种微卫星组和其它DNA标记将会产生同样的效应(McIntyre等人,2005,Mol.Breed.16:151-161)。
第六方面,本发明提供了在父本和/或母本未知的情况下确定甘蔗属复合组成员的亲子关系的方法。该方法包括确定甘蔗属复合组(后代)的基因型,并比较所述得分结果与来自母本和可能的父本成员的DNA的分析结果。结果首先比较后代的等位基因和母本的专有等位基因。一旦确认了母本等位基因,后代中的其余等位基因就是父本特异性的。进行搜索以鉴定可能的父本,其具有全部父本特异性的等位基因,且应该是后代的真正的父本。甘蔗属复合组的基因型的亲本鉴定包括以下步骤:(i)从成员(例如:后代、已知的母本和可能的父本)获得DNA,(ii)用选自SEQ ID NO.11-30的引物对的所述DNA中的一套引物扩增简单序列重复(SSR)基因座,以形成具有各种大小和标记的扩增产物;(iii)根据大小分离扩增产物;(iv)鉴定母本和父本特异性的等位基因;和(v)鉴定真正的父本。
第七方面,本发明提供了用于量化由涉及一种或多种祖先的特定杂交产生的甘蔗属复合组幼苗样品中的自花授粉的方法。该方法包括确定甘蔗属复合组的基因型,并比较所述打分结果与来自亲本成员的DNA的分析结果。该结果比较后代的等位基因与母本和父本的专有等位基因。确认为不含有父本专有等位基因的后代是自花授粉的产物。通过在几个后代中进行这样的分析,可以计算特异性杂交产生的幼苗样品中的自花授粉百分比。幼苗样品中的自花授粉的确定包括以下步骤:(i)从样品(例如后代和亲本)获得DNA,(ii)用选自SEQ ID NO.11-30的引物对的DNA中的一套引物扩增简单序列重复(SSR)基因座,以形成具有各种大小和标记的扩增产物;(iii)根据大小分离扩增产物;(iv)鉴定父本和母本特异性的等位基因;和(v)鉴定只含有母本的专有等位基因的后代。
本发明的第八方面,提供了使用聚合酶链反应(PCR)装置检测甘蔗属复合组成员的试剂盒。该试剂盒包括一种或多种适于通过聚合酶链反应扩增复合组样品中的核苷酸序列的引物对,其中,该核苷酸序列包括SEQ ID No 1-10的序列。优选地,该试剂盒包括具有SEQ ID NO:11-30的引物对。试剂盒可以利用多重方法。
试剂盒可以进一步包括引物、酶、Taq聚合酶,例如,适于通过聚合酶链反应进行扩增的盐和缓冲液。试剂盒也优选地包括阳性对照。在试剂盒的某些优选的实施方式中,引物包含标记,借此可以检测到扩增的微卫星。在试剂盒的其它优选的实施方式中,提供了标记的核酸。可观察的标记优选荧光分子或放射性核苷酸。试剂盒也可包括用于容纳这些试剂和/或方便使用的合适的容器和瓶。
第九方面,本发明提供了用于开发MAS(标记辅助的选择)程序的基因和数量性状基因座(QTL)的定位(作图)方法。标记辅助的选择(MAS)基于以下概念:可以从紧密连接基因的标记的存在推断该基因的存在。如果标记和基因相距较远,那么由于双重交叉重组事件,它们一起传递给后代个体的可能性会减少。因此,在这样的选择中使用标记的先决条件是它们应该紧密地连接感兴趣的基因。为了这个目标,遗传连锁图谱上的区域(包括感兴趣的基因座)的饱和是必需的。饱和是相对项,且饱和度取决于需要图谱的目的。饱和度是被标记以一定密度覆盖的基因组的比例,该密度使得标记之间的最大分离不大于几个厘摩(centimorgan)。
定义
如本文所用,“微卫星”也称为简单序列、简单序列重复(SSR)、简单重复DNA序列、短串联重复(STR)或简单序列基序(SSM),是在每种活生物体的基因组的编码区和非编码区发现的DNA段。它们由许多串联的重复短核苷酸基序或重复单位组成。微卫星由1-6个串联重复的核苷酸单位形成,在基因组染色体拷贝之间其长度变化。微卫星是高度多态性的。
如本文所用,术语“侧翼序列”指与微卫星相邻的非重复的核苷酸序列。“独特侧翼序列”是那些只在基因组内的一个位置发现的侧翼序列。
如本文所用,“成员”指组成甘蔗属复合组的任何种、属、种间杂交体、属间杂交体的个体。
甘蔗属复合组是甘蔗属的所有种,以及与甘蔗在***发生学上相关的属:蔗茅属和芒属、硬蔗草属和河八王属的种。
如本文所用,术语“多核苷酸”包括正义链和反义链的DNA和RNA分子,并包括cDNA、基因组DNA、重组DNA和完全或部分合成的多核苷酸。本发明提供的所有多核苷酸都是分离的和纯化的,这些术语在本领域中普遍使用。
如本文所用,术语“引物”是单链寡核苷酸,当置于诱导合成互补的引物延伸产物的条件下时,其能够作为从特定的序列合成DNA或RNA的起点。“引物对”是两条引物,包括在待扩增的DNA序列的一个末端与单链杂交的引物1和与待扩增的DNA序列的互补链的另一个末端杂交的引物2。
选择“引物对”以检测特定的微卫星。选择每个引物对的每个引物与待扩增的每个特定微卫星序列的侧翼序列或侧翼序列的变体的不同链互补。尽管引物序列不需要反映天然存在的侧翼序列的准确序列,但是3’末端越接近地反映准确的序列,在退火阶段的结合越好。可以如Caskey等人的美国专利第5,364,759号所述,采用不同的标记,以区分延伸产物。
“聚合酶链反应”或“PCR”是一项技术,其利用变性、与引物退火和用DNA聚合酶延伸的循环将靶DNA序列的拷贝数扩大大约106倍或以上。Mullis等人的美国专利第4,683,195号和Mullis的美国专利第4,683,202号涵盖了用于扩增核酸的聚合酶链反应方法,本文引入这两篇文献作为描述该方法的参考。
如本文所用,术语“序列的变体”包括进入微卫星的重复数量具有改变的序列。引物变体异意味着具有碱基缺失、添加或取代,其不改变引物用于扩增微卫星的能力。
如本文所用,“等位基因”是与DNA的片段有关的遗传变异,即,占据同样的基因座的DNA序列的两种或多种替代形式之一。
“DNA多态性”是DNA序列中的两种或多种不同的核苷酸序列共存于同一种间杂交群体中的状态。
“多态性信息含量”或“PIC”是存在于基因座中的多态性的量的量度值(Botstein等人,1980,Am.J.Hum.Genet.32:314-331)。PIC值的范围是0-1.0,该值越高表示多态性程度越大。该量度值一般显示比其它常用的量度值(例如杂合性)更小的值。对于信息高度丰富(超过大约70%的杂合性)的标记,杂合性和PIC之间的区别微小。
本文使用的所有技术术语是生物化学、分子生物学和农学中常用的术语,且可以被本发明所属的技术领域的技术人员所理解。这些技术术语可以在以下文献中找到:Molecular Cloning:A LaboratoryManual,第3版,卷1-3,Sambrook和Russel编著,Cold Spring HarborLaboratory Press,Cold Spring Harbor,N.Y.,2001;Current Protocols inMolecular Biology,Ausubel等人编著,Greene Publishing Associatesand Wiley-Interscience,New York,1988(定期更新);Short Protocolsin Molecular Biology:A Compendium of Methods from CurrentProtocols in Molecular Biology,第5版,1-2卷,Ausubel等人编著,John Wiley & Sons,Inc:,2002;Genome Analysis:A Laboratory Manual,1-2卷,Green等人编著,Gold Spring Harbor Laboratory Press,ColdSpring Harbor,N.Y.,1997。涉及植物生物学技术的方法在本文中描述,且在如Methods in Plant Molecular Biology:A Laboratory CourseManual,Maliga等人编著,Cold Spring Harbor Laboratory Press,ColdSpring Harbor,N.Y.,1995的方法学论述中详细描述。例如,在Innis等人,PCR Protocols:A Guide to Methods and Applications,AcademicPress,San Diego,1990和Dieffenbach和Dveksler,PCR Primer:ALaboratory Manual,第2版,Cold Spring Harbor Laboratory Press,Cold Spring Harbor,N.Y.,2003中描述了使用PCR的各种技术。
通过下面的具体的实施例进一步说明本发明。提供实施例只是为了说明,而非以任何方式限制本发明的范围或内容。
实施例
实施例1..:
甘蔗微卫星重复序列的鉴定
甘蔗EST序列的数据库
通过将来自SUCEST计划(Vettore等人,2001,Gen.Mol.Biol.24:1-7)和已经存储于GenBank的其它来源(Benson等人,2006,NucleicAcids Res.34:16-20)的公共可以获得的序列与个人创建的数据库(www.alellyx.com.br)相结合,获得352,122个甘蔗EST序列(读数)的丰余数据库。
简单序列重复(SSR)标记的计算机选择
使用用于微卫星鉴定软件,在这种具体的例子中使用MISA软件(Thiel等人,2003,Theor.Appl.Genet.106:411-422),筛查丰余EST数据库,搜索单一的和复合的简单序列重复(SSR)基序,该搜索的结果总结于表1中。
软件鉴定了36,950个简单序列重复(SSR)基序,并检索了33,324个丰余序列(9.46%)。将数据库汇编为79,526个群,其中14,291个包含简单重复SSR基序(18%)。在这些群中,10,580个(75%)具有单一基序,3,705个具有两种或多种基序。表2显示根据基序的类型分类的36,950个含有SSR的丰余序列的分布。最丰富的单位大小基序是三基序(48%),接着是一基序(32%)和二基序(16%)。在1,414个序列中确认了四、五和六基序,占含有SSR的数据库序列的不到5%。
为了选择用于开发简单序列重复(SSR)标记的序列,将36,950个含有SSR的丰余序列与涉及读数和群名称和重复单位大小、数量和序列的信息一起组织在亚数据库中。首先,根据重复单位大小对候选简单序列重复SSR标记的这种亚数据库进行分类,并分为7个读数子集(复合、一、二、三、四、五和六基序)。由于我们自己关于这些单位重复在聚丙烯酰胺凝胶电泳(PAGE)和DNA序列分析仪中的低分辨率的经验,具有一和二基序的序列没有进一步在标记选择中使用。如下分别处理其余5个读数子集。按照群的名称对每个子集进行分组。对属于同一群的读数的检查显示了共有具有相同单位大小和序列的基序,但重复单位数不同的序列。选用计算机观察到的这种多态性作为选择标准。然后对于具有最大数目的在重复单位数方面不同的读数的群,将每个子集分类。单独对于排序最高的群检查足以设计引物的5′和3′序列,并且选择63个共有序列进一步表征。第二轮的计算机选择包括根据含有具有最大数目的重复单位的读数(因而具有含大量等位基因的可能性)的群对子集进行分类。此时,不能被读数较好地代表而且可能在第一轮选择中遗漏的群被良好地排序。检查排序最高的群的足够的5′和3′序列,并且选择49个共有序列进一步表征。,选择总共112个群用于设计引物和进一步由确认程序评估。表3概括了在两种选择标准下进行的含有SSR的群的计算机选择结果。
引物设计
借助用于设计聚合酶链反应的程序,在该情况下使用软件Primer3(Rozen和Skaletsky,1998,Primer3 on the WWW for generalusers for biologist programmers In:Krawetz S.和Misener S.(编著)Bioinformatics Methods and Protocols:methods in molecular biology,Human Press,Totowa:365-382),设计用于每种计算机选择的群的一对引物。程序设定为鉴定装配的共有序列中解链温度为大约64℃、长度分别为19-22个碱基、包含SSR基序的侧翼序列(距基序的5′和3′端至少5个碱基)的引物对,并扩增100-250bp的片段。根据表4,在序列表中描述了这些序列。
表1.在甘蔗EST数据库中搜索SSR基序的结果的总结
Figure A20088000444400251
Figure A20088000444400261
*括号中的值指根据每个序列中基序的数量,含有SSR的装配序列的分布。
表2.甘蔗EST单一序列数据库中SSR基序根据单位大小的分布
Figure A20088000444400262
表3.根据“计算机模拟的多态性”和“可能的多态性”标准进行的112个群的选择
Figure A20088000444400263
表4.微卫星和具有序列表中所示的序列的引物之间的关系
Figure A20088000444400271
实施例2
在计算机验证之后,用于聚丙烯酰胺凝胶电泳(PAGE)和DNA序列分析仪***中的甘蔗属复合组指纹分析的一套含有SSR的基因座的选择
建立具有两个阶段的验证过程,目标为选择适于在聚丙烯酰胺凝胶电泳(PAGE)和DNA片段检测***中进行甘蔗属复合组指纹分析的10对引物(基因座)。第一阶段(排除)包括使用选择的所有引物对从4个甘蔗属复合组成员(Caiana、Q136、RB835054和RB855036,表5)扩增DNA,和在聚丙烯酰胺凝胶电泳(PAGE)中分析片段。观察序型并根据关于扩增序型的视觉质量(visualquality)(片段在预期大小范围之内并且强度和分辨率足够打分)、片段的多态性(至少4个不同大小的片段)和如残迹(stutters)的PCR(聚合酶链反应)伪迹的低发生率的标准对其打分。在排除候选标记(引物对)之前,进行聚合酶链反应和聚丙烯酰胺凝胶电泳(PAGE)3次。数据如表6所示。
总之,序型的质量不足(聚合酶链反应质量和伪迹标准)导致57%的候选基因座(64个)被排除,而低多态性导致25%(28个)被排除。在该验证阶段结束时选择代表5种类型的简单序列重复(SSR)基序的总共20个基因座(18%)。
验证程序的第二阶段(分类)包括使用在第一阶段预先选择的20对引物(基因座)从27个甘蔗属复合组成员(表5)扩增DNA,接着分析。在聚丙烯酰胺凝胶电泳(PAGE)和DNA序列分析仪(使用以荧光染料标记的正向引物)上分析扩增反应产物,根据3个标准评估并排序:PCR(聚合酶链反应)反应的质量(片段在预期大小范围之内并且强度和分辨率足够打分);序型的多态性(具有高PIC值的至少6个不同大小的片段);和如残迹的PCR伪迹的低发生率。由27个用于验证的甘蔗属复合组成员中的等位基因的总数和频率计算每个基因座的PIC值(表7)。所有基因座的多态性信息含量(PIC)值足够高(0.774-0.918),因而,序型的视觉质量是分类的强制性标准。在已经对序型评估和排序之后,选择前10个基因座,以组成基于简单序列重复的指纹分析***。
数据打分和分析
每种成员的等位基因显现为条带(聚丙烯酰胺凝胶电泳-PAGE)或峰(DNA序列分析仪),并由至少两名分析员人工打分为存在(1)或不存在(0)。通过以下公式计算标记的多态性信息含量(PIG)的值(Weber,1990,Genomics 7:524-530;Anderson等人,1993,Genome 36:181-186),其中,Pij是基因型(i)中的第j个等位基因的频率。将打分的等位基因作为离散变量输入二进制数据矩阵(matrix)。
使用用于确定遗传相似性的软件,尤其是NTSYSpc版本2.20(Rohlf,2002,NTSYSpc:Numerical Taxonomy System,ver.2.2,ExeterPublishing Ltd.,Setauket,NY),进行群分析。用Jaccard系数评估成员之间的相似性(Sneath和Sokal,1973,Numerical Taxonomy:theprinciples and practice of numerical classification,Freeman,SanFrancisco,573p),并且根据用未加权对组法(unweighted pair groupmethod)以算术平均数(UPGMA)计算的评估的相似性描述这些群。使用简单匹配(SM)系数(Sokal和Michener,1958,Univ.Kansas Sci.Bull.38:1409-1438)来计算区别两种成员的等位基因数[(1-SM)x等位基因的总数=区别性等位基因的数目]。使用公式Pid=∑χ2计算代表两个随机选择的个体共有相同基因型的可能性的遗传一致性的概率(Pid),在公式中,χ是基因型频率(Paetkau等人,1995,Mol.Ecol.4:347-358)。通过乘以所涉及的每种基因座的相应Pid值计算基因座组合的Pid。
表5.在SSR标记验证程序的第二阶段中进行指纹分析的27个甘蔗成员和相应的直接谱系的列表
Figure A20088000444400291
Figure A20088000444400301
*成员S1到S8是半近亲品种RB835054和RB855036之间杂交产生的F1后代。
表6.显示在112个候选物中选择20个基因座的SSR标记验证程序第一阶段的结果的概括。
Figure A20088000444400311
*根据PCR质量的排除包括未扩增、低扩增和预期大小范围之外的片段的扩增。PCR伪迹主要指残迹(stutter)的频率和强度。等位基因数指单一形态的序型或具有少于4个的不同片段的组合序型。
表7.显示为形成甘蔗属复合组指纹分析***而选择的前10个基因座的SSR标记验证程序第二阶段的结果的概括
Figure A20088000444400312
Figure A20088000444400321
*下面的符号用来评估聚丙烯酰胺凝胶电泳(PAGE)和DNA序列分析仪***中的伪迹的片段分辨率和强度:+(满意/高)、++(好/中等)和+++(优秀/低)。分类标准的重要性次序是:分辨率>伪迹>多态性信息含量PIC值。用在27个用来验证的成员中观察到的等位基因数和频率计算多态性信息含量PIC值。
实施例3
使用选择的微卫星甘蔗标记进行基因型分型
植物材料和组织样品
选择1,205个甘蔗属复合组成员和来自于几个国家和国际育种计划和种质库的相关种,用于本研究(表8)。自殖(自花授粉)和种间杂交的后代和巴西商业品种的体外小植物分别由公司的育种站和组织培养设施生产。Alellyx Applied Genomics(Campinas,Sao Paulo,Brazil)提供了由愈伤组织再生的转基因植物。位于巴西主产区(东北和中南部州)的工厂提供了由普通种子甘蔗繁殖的田间生长的植物。为了确保最均质的材料,收集组织样品,并送交由标准化协议指定的分析。为了避免贴错标签并具有跟踪能力,在用条码标签标识的塑料袋或试管中储存样品。
该基因型分型方法可以应用于鉴定起源于世界范围内的所有成员和相关的种。
DNA提取程序
从甘蔗属复合组和相关种的叶、根和芽中提取总DNA。如下进行大规模制备。将大约100mg组织粉末(用液态N2研磨)悬浮于700μL提取缓冲液中(100mM Tris-HCl pH 8.0、20mM EDTA、2%CTAB、1% PVP 40、1.4M NaCl、0.3%2-巯基乙醇、50μg核糖核酸酶A)。充分混合悬浮物,并在65℃温育30分钟。用800μL氯仿/异戊醇(24∶1)提取总DNA,离心(室温下,12,000g,10分钟)后回收上清液(大约600μL),补充60μL提取溶液(10%CTAB、1.4M NaCl),并充分混合。如上所述提取总DNA,并用450μL异丙醇沉淀。通过离心(室温下,12,000g,5分钟)回收DNA之后,用1mL 70%的乙醇洗涤沉淀物,室温下干燥,并溶解于100μL TE缓冲液(10mM Tris-HCl pH 8.0、1mM EDTA)中。用分光光度计测定DNA浓度,并调整为标准10ng/μL溶液。
为了进行大量样品的高通量处理,开发了96样品平台,如上所述,略加改进,进行微量制备提取。向96深孔微板(SSI)的孔中引入植物材料(通常为100-200mg嫩叶)。每孔接受200μL提取缓冲液。向孔中引入具有96个销钉的金属装置,用来碾压植物材料30次。向孔中加入另外的300μL提取缓冲液,再碾压植物材料10次。用橡胶盖密封板,并置于65℃30分钟,接着加入500μL氯仿/异戊醇(24∶1)。将板振荡30秒,并在4℃以3,200g离心30分钟。将上清液(~200μL)转移到另一个深孔微板中,加入20μL提取溶液,并如上所述用氯仿/异戊醇提取样品。将上清液(80μL)转移到常规96孔微板中,加入80μL异丙醇。密封微板,置于室温下20分钟,并通过离心(在4℃下,3,200g,15分钟)回收总DNA。用150μL70%的乙醇洗涤沉淀物,室温下干燥,并溶解于25μL TE缓冲液中。分光光度计测量显示典型的30ng/μL的DNA浓度。
聚合酶链反应PCR扩增
在含有2μL DNA(20ng用于大量制备,60ng用于微量制备)、4μL反应混合物(50单位/mL Taq DNA聚合酶、400μM dATP、400μM dCTP、400μM dGTP、400μM dTTP、100mM Tris-HCl pH 9.0、100mM NaCl、5mM MgCl2、0.2%IGepal)、0.5μL的每种引物(10μM)和3μL水的10μL反应液中,进行简单序列重复(SSR)标记的扩增。用以荧光染料(ABI)标记的正向引物扩增将要在DNA序列分析仪中分析的反应物。如下在设计好程序的循环变温器中进行扩增。初次变性在94℃进行5分钟,94℃30秒、64℃30秒和72℃30秒的35个循环,并在72℃进行60分钟的最终延伸。
片段检测
在聚丙烯酰胺凝胶电泳(PAGE)和自动DNA序列分析仪***中分析片段。在0.5×TBE缓冲液中用6%聚丙烯酰胺(19∶1)和7M尿素制备变性聚丙烯酰胺凝胶(Sambrook等人,1989,MolecularCloning:a Laboratory Manual,第2版,Cold Spring HarbourLaboratory Press,New York)。用6μL PCR反应物、3μL甲酰胺和1μL加样缓冲液(甲酰胺、1mM EDTA、0.01%溴酚蓝和0.01%二甲苯腈蓝)制备样品,在95℃变性5分钟,保持在冰上,并加入预热凝胶的孔中(以120W进行60分钟)。以90W电泳样品3小时,并通过银染色使片段显现。将凝胶浸没于固定溶液(10%乙醇、5%乙酸)中10分钟,用去离子水漂洗,浸没于预处理溶液(1.5%硝酸)中3分钟,用去离子水漂洗,浸没于0.3%硝酸银溶液中30分钟,用去离子水漂洗两次,浸没于显色溶液(283mM Na2CO3)中15-30分钟,或直至片段显现。通过目视检查打分,并通过与大小标准25bpLadder(Promega)比较估计片段大小。用具有50cm毛细管阵列、负载有POP7聚合物的ABI3730 XL DNA序列分析仪分析用标记的引物扩增的样品,设定为8.5kV下10秒注射时间,在8.5kV下电泳,烘箱温度为60℃,运行时间为2小时。用软件STRand(Hughes,1998,Regents of the University of California,Davis,http://www.vgl.ucdavis.edu/STRand)显现由序列分析仪产生的片段数据。通过目视检查进行打分,并通过与大小标准GeneScan 500 Liz(ABI)比较和与用6-FAM或NED标记的专有大小标准比较来估计片段大小。
表8.通过呼号(sign call)(育种计划)分类的1,205个甘蔗属复合组品种成员、经选择(CanaVialis程序)的CV克隆和相关种的集合和来源国。
Figure A20088000444400351
Figure A20088000444400361
实施例4
在对1,205个甘蔗属复合组成员和相关种的集合进行基因型分型之后,在指纹分析***中对等位基因的表征
使用DNA序列分析仪检测***,在10个选择的基因座处对1,205个甘蔗属复合组品种成员、经选择(CV程序)的克隆和具有世界范围的起源且共有不同水平的亲缘关系的相关种的集合(表8)进行指纹分析(表9)。鉴定总共150个等位基因(平均每个基因座有15个),借助于两个不同的大小标准评估其大小。基因座CV38显示有最大数目的等位基因(27个),接下来是CV78(25个)。CV29、CV37、CV22、CV79和CV94显示范围为14-17个的等位基因,而CV104、CV106和CV60显示范围为7-8个的等位基因。指纹分析的群体中等位基因的频率表明基因座内和基因座间的大的变异性。观察到的多态性信息含量PIC值(0.77-0.92)与等位基因数正相关。通过任何具体基因座中的等位基因大小的差异来判断,选择的基因座均没有显示由其各自的重复单元预测的理想的片段梯度。例如,选择基因座CV22作为来自其群共有序列的理想的四核苷酸重复基序,但显示有2个、3个和5个核苷酸不同的片段。仔细检查用于引物设计的每种共有序列,显示几个位于引物位点和软件MISA鉴定的简单序列重复(SSR)基序之间的短单一和二重重复。这样的短基序在软件的阈值之内,但也可以是多态性的,因而,它们是造成在等位基因阶梯中观察到的缺陷的原因。需要对对应于等位基因的片段进行测序来回答这个问题。然而,尽管自动化片段打分存在困难,但是这些缺陷产生更大的变异性(多态性),因而增加了每个基因座的区别能力。
不只一次地在指纹分析同样的成员之后观察到与某些等位基因有关的一定的不一致性。这些不稳定位置在色谱图中的定位显示分布于基因座CV37(2)、CV38(4)和CV78(2)中的8个等位基因。关于在同样的基因座中的其它等位基因,这些等位基因中的大部分具有一贯较低的PCR扩增,且经常与通常出现残迹的位置有关。这种类型的等位基因可以存在于某些基因型中,但会由于PCR反应产量的小的波动而在打分的过程中遗漏。另一方面,在低扩增等位基因位置出现的残迹经常错误地被认为是真正的等位基因。由于这些等位基因的易于出错的性质,用142个等位基因进一步分析在指纹分析的集合中由基因座组产生的数据(没有考虑8个低扩增等位基因)。
表9.在1,205个甘蔗属复合组品种成员和相关的种的集合中属于SSR指纹分析***的等位基因的表征和不稳定位置的作图a
Figure A20088000444400381
Figure A20088000444400391
实施例5
指纹分析***区分甘蔗属复合组成员的能力
利用对具有10个基因座的1,205个成员集合进行基因型分型之后获得的二进制数据矩阵来评估指纹分析***的区分能力。表10显示每个基因座、所有组合的基因座和区分具有至少两处不同的所有成员的基因座最小组合(区别性等位基因)各自的能力。区分能力表示为遗传一致性的概率(Pid,对于基因座或基因座的组合发现相同基因型的概率),以及对于基因座或基因座的组合,具有独特基因型的成员的百分比。没有基因座能够单独地区分所有的成员。所有10个基因座组合起来可以区分具有至少3个差异的所有的成员。从中搜索能够区分具有至少2个差异的集合的最小数量的基因座的组合。尽管基因座CV78能够区分最高比例(60%)的成员,但由于其PCR(聚合酶链反应)伪迹(表7),不选择它与其它基因座构成最佳组合。因此,基因座CV38(44%)、CV29(33%)和CV37(8%)用于此目的,其与良好的打分特性有关的Pid值(100亿种可能性中有1个一致的基因型)反映了信息最丰富的组合。图1证明该组合的区别能力。树状图显示了属于指纹分析的集合的54种基因型,其中,21种是全近亲(full-sib)的商业品种和品种RB72454和SP70-1143之间杂交产生的祖先品种,其余的是来自一些其它的外国育种计划和相关种的某些成员的基因型。在这种具体的成员的子集中,发现在这两个个体之间的区别性等位基因的最小数量是5个。
预期育种计划中的两种甘蔗属复合组基因型之间的遗传相似性的最极端的例子来自自花授粉杂交的后代。因此,评估指纹分析***区分品种RB855002的48个自花授粉杂交的F1后代群体的能力。测试基因座的所有可能的组合,在这种特别的情况下,7个基因座(CV29、CV37、CV38、CV60、CV79、CV94和CV106)的组合对于区分所有具有至少2个差异的个体是必需的(图2)。值得注意的是,当测试3个基因座的最佳组合时(结果未显示),独特基因型的百分比达到87.5%(Pid=0.001),没有区分3对基因型。基因座CV106的加入使独特基因型增至100%(Pid=0.0005),但具有至少1个差异。只在上述的7个基因座的组合中观察到2个差异(Pid=0.00002)。
表10.在共有不同水平的亲缘关系的1,205个甘蔗属复合组成员和相关种的集合中评估的SSR指纹分析***的区分能力*
Figure A20088000444400411
*从该分析中排除低扩增的等位基因
实施例6
指纹分析***的再现性
为了评估指纹分析***的再现性,进行了一些实验,以比较10个选择的基因座的DNA序列分析仪序型(结果未显示)。这些实验包括从以下样品来源提取的DNA的扩增:i)同一甘蔗基因型的不同组织(叶、芽和根);ii)来自同一基因型但来源于几个彼此远离的工厂的叶;iii)来自同一基因型但来自不同发育阶段(植物的龄期)和生命周期(植物甘蔗、第一宿根等)的叶;和iv)由分生组织和愈伤组织产生的体外小植物。在所有情况下,在指纹分析的任何基因座处同一基因型产生的两种高质量序型之间没有观察到任何不一致性。在进行的最大再现性实验中,在基因座CV29、CV37和CV38处指纹分析从30个商业品种的分生组织培养的小植株收集的783个叶样品,而在可比较的序型中没有观察到任何不一致性。
实施例7
多向杂交中的亲子关系的确定
亲本的选择一般包括潜在的候选者的初始测试,其中,通过特定育种计划的常规选择方案评估双亲或多向杂交产生的少量后代或家族。那些产生优良个体的父本和母本的成对组合成为已证明的亲本。然后进行同样的杂交以产生大量的后代用于品种选择。在多向杂交中,在第一阶段只可证明母本,但在发现正确的父本之前,必须测试几种成对组合。因此,多向杂交在理论上具有更大的显示证实的亲本的机会,而双亲杂交可以常规且大量地进行,具有更高的显示优良个体的可能性。在多向杂交***中育种员可以尽快地鉴定所选择的克隆的父本,这可以减少开发新品种的时间和费用,对于实现改良的程度(糖、纤维、适应性等)应该具有明显的影响。
本文描述的指纹分析***已经用来为我们的育种计划所选择的、来自涉及超过30种雄性祖先的多向杂交的有希望的甘蔗克隆鉴定父本。为人类种群研究和法医应用开发了用来获得用于建立亲子关系的分类答案的方法。该方法包括:(i)从具有未知父本、母本和所有假设的杂交涉及的父本的幼苗获得DNA;(ii)用一套引物扩增样品中的SSR基因座;(iii)根据大小分离扩增产物;(iv)对所述分离的结果打分;(v)比较后代的基因型与母本基因型,减去母本的贡献,并比较其余的父本配子的贡献与所有假定的父本基因型。排除不能产生父本配子的贡献(“父本等位基因”)的个体,并给剩余的组指定亲子关系(Ellstrand,1984,Am.Natur.123:819-828)。
一旦确认每个克隆的父本,则进行涉及它们和以前已知的母本的双亲杂交,播种产生的种子,将产生的幼苗纳入正常的选择程序。每年重复该方案:用指纹分析***确定第一选择阶段中评估的有希望的克隆的亲子关系,在接下来的杂交季节进行双亲杂交,将这些杂交产生的种子纳入下一年的选择方案。
图3中,RB966928是母本,且有30个可能的父本、29个父本加上母本(自花授粉)。在本文所述的指纹分析***中分析所有样品、幼苗、母本和所有的父本,比较后代基因型与母本基因型,减去母本的贡献,并比较剩余的父本配子的贡献与所有假定的父本基因型。排除不能产生父本配子的贡献(“父本等位基因”)的个体,并给剩余的组指定亲子关系。父本RB936071是唯一的具有所有MPA父本等位基因(专有等位基因)的父本。
序列表
<110>Sizuo Matsuoka
Walter Maccheroni Jr.
<120>用于甘蔗属复合组的基于微卫星的指纹分析***
<160>30
<210>1
<211>806
<212>DNA
<213>甘蔗(Saccharum spp.)
<220>
<400>1
cggacgcgtg ggcgcggcac tactcgcccc gatttccctc cggctgccgg cgtccgtgtc     60
gcgggaatcg ttcgtggaag cggccggatc ccggcttttg atcggagaga gagggaggga    120
gggagggagg ggatggaccc ggcggcggtg tgtgtgcaga tggagaagca ctcgacggag    180
gcgggcttcg tggatggcgg tgtccaggac gcctgcgacg acgcctgcag catctggctg    240
gaggccttct ccgaacagga ccccttcggg gtgaccagct ggaggcacga ggtccacctt    300
cagtgcatgc tcgagtggtg ccgaagagct tccaagtgtc catgggttgg ctagccattc    360
agctgtacgg ccccatgagc ccagagcttc ctgcagcttg ttagggatga gcggaacgct    420
ccagaagatt actccggaac cacaaccatt ttgtcgcctt cacttgttcg ggaactttac    480
gtcccatccg ttcacgagat ggtggagggg gggagggggt cctcctttct ttgtttctgt    540
ttcttgccat tacaggatcg cctggcttgc atgacaagag gccggtcagt atggtggatg    600
gtcatgggct tggtatggcc acgccccagt ccgttcgttt cactgtcgtg agggatccag    660
ggggtgctat tttcgttttt ccttccccct cagaggggga ccggtcatgt cttcagtggt    720
cttccttcta agcgcttgct cttggggctc gcgagagaaa ccagttgaaa acgcgtttga    780
ctcccacggc tcatgatcgg ccctgt                                         806
<210>2
<211>947
<212>DNA
<213>甘蔗
<220>
<400>2
ggactgcgac gtcgacggcg aggaccaggg ctgcgagggc ggcctcatgg acgacgcgtt     60
ccagttcatc cagcgccgcg gcgggctggc ctcggagtcc gggtacccgt accagggcga    120
ggacgggtcg tgccgctcgt ccgccgcatc cgcgctggtg gcatccatcc ggggccacga    180
ggacgtgccg cgcaacaacg aggccgcgct ggcggcggcc gtggcgaacc agcccgtgtc    240
cgtggccatc aacggcgagg actacgcgtt ccggttctac gacagcggcg tgttgggcgg    300
ggagtgcggc acggacctca accacgccat caccgccgtc gggtacggca cggcggccga    360
cggcagcagg tactggctga tgaagaactc gtggggcgcg tcgtggggcg agggcggcta    420
cgtccgcatc cgccgcggcg tccgcgggga gggcgtctgc ggcctcgcca agctgccgtc    480
ctaccccgtc taattaagcc aggcccagcg gcgtgcgtgc gggccgatcg cgtccaccaa    540
tgtaaccatc gcagcataca gtacgcatga tactgttaca tctatctatc tatctatcta    600
tctatctatc tatctatcta tctatctatc tatctatcga agacacaagc gatgcacgca    660
cggctttcgt ggtcctatag ctagcacgta caccgcgcgc acggcatgtc acacgtgcat    720
ggcatatttg actagctacg aatttactac ttattagatt atatatcctt tatatgacta    780
tgatgtgtgt agtatagtga tggtcgaaat cacgacccaa gcatcatata ttgtacgtac    840
tctcagccaa aagaacgtcg ctgaggtatt agttggacct tacgtgtgaa gtgaagccca    900
cgtgtattgt aatgtgcaga ttggcttgaa tgaaaccagt taagtgt                  947
<210>3
<211>496
<212>DNA
<213>甘蔗
<220>
<400>3
ccagtcgatt ttggatggac gacgtgtcct ggaattagga aggtatgggt gctatgctct     60
aactctaacg gcttcttttg tttctttctt tctttctttc tttctttctt tctttctttc    120
tttctttctt tctttctttc attcctgacc aattcaatcc aagcggccac tttatatata    180
caactacccc tgttattgcc ctgttgggct caataagtaa cttaggatat cgatatatcc    240
atctctcagg tttttcttct ttgctgttag cactgacttg aggcatgtga tgtgtttttt    300
tatcatgctg tcaaaacttt gcaaaaccat tcctactgtg tcaacccacc agaaaattgt    360
agtcctaagc agctggttgg atgatgtgat aatgattccg ttgtatactg gtataataaa    420
caaaaggcta tttcatttga cctgaatacc ctactgtaat aatgattttg tggtgcagca    480
aacaaaatct ctattt                                                    496
<210>4
<211>559
<212>DNA
<213>甘蔗
<220>
<400>4
ctactctgaa gattgaagag gaatttaagc agctgatggg tacatacagg taaggccatt     60
aacttatggc tggtgcatct agtgatgctg aggcctactc atgaaggtct ccatcatcta    120
tttccctcca tatattggca aaagaacagt taacttatca ttgtgttctt ctagtgaagc    180
aggggcctca agttgttctt attcttacct aaaaataccg tgttattgtc cttttctttt    240
cttttctttt cttttctttt cttttctttt cttttctttt cttttctttt cttttctttt    300
cttttctttt cttttctttt cagtaaacct attgagccag atcgcctgtt tgactgtcta    360
cccaagtctc tgcggccaac aaaaggtgac catgagaccg atggaggtgg ccgttctgat    420
catccatcca aaggcttgga gactgccgta tacaggaccc caacactaat tcctcccaga    480
atattgcctc tcatgaatga catagctcag cagttggttc aggctggaaa tcagcaaact    540
tgctacaaaa tctacagag                                                 559
<210>5
<211>852
<212>DNA
<213>甘蔗
<220>
<400>5
ctgctgctgt acattctgtt gcctttgcaa ttgatggtga tatgtcaaca ggttcttaga     60
ttacatggat ttttcgtggg aactaaacta ctccaaaact atcagttgtt cattctttac    120
tatgtacaca tctggttcaa caggcctaca aagagagcag tatacattat tattcttaag    180
aagaagaggt aatgatgaat ccatccaaag gtatggtacc ttctaaaccg aattaatcgg    240
aaataccaag aactacaaac agcagccacc gtgagacatt tttccattca gactcgtcct    300
attacttgca tctgcattcc ttgctttttt acaactcttt gacaatgcac ttctcacaat    360
ctgcaccctg ccctctccag acctcagctg catgtgttgt ctgtcagcct aggaaaataa    420
tggaaactgc tagtatcagt cagtttgcta gctctccctc tccctctccc tctccctctc    480
cggggtgatc cctgccatgc ggaggaaggt tcatctccat ccatgctcca gctgctgaag    540
atgtcggtat gtttctaaga ctgaacaatt tcaattgaat ccagataaat ccatatcatc    600
tactcctctg aactgatttg cagaggcacc cggggatcgg atttgagtag aagtattcct    660
cctgccttgg acttgcacca cgcaatctct catacggacc tccgagtcta ttctcatggt    720
gcttcctcag cacaatctgg aactcactcc aggacataga accttcatcc agcttgtcaa    780
taagctccac aaacttcagc ctgtcagggt ttatggtttt tctgaaccct tcaaatctcc    840
tgtgcccttg ga                                                        852
<210>6
<211>408
<212>DNA
<213>甘蔗
<220>
<400>6
catagtaaat ctggaacaaa atagaatatc acacccacat ggaccgaatc atattcctcg     60
agtatcacca tacacaaata gttagggtat aaaacaacaa aagaaggaat gtacaattgc    120
aacgcaaacc gccatccatc ggtacacagc cttcataggc tatctactga cgaggccacc    180
atagaacatg tatgtatcaa tgtatacgtt cgtgtgtgta tatatactat tatattagga    240
aaaccaaaag ctcttccaaa cacatcacca aaagtatata ctgtgctgtg ctgtgctgtg    300
ctgtgctgtg ctgtgctgtg ctgtgctgcg ccgccattcc tctcctccca attgccgctg    360
atccatgctc acagcacaat caccttgtgc ttgctgcgga atggtgac                 408
<210>7
<211>1343
<212>DNA
<213>甘蔗
<220>
<400>7
cgcgtccgac cacacgcaga ccgtggccgg ttgggccgtc atgaacgagt ctggcaaggt     60
cgagcccttc gtcttcaaga gaagggagaa cggcgtggac gacgtgacga tcaaggtgca    120
gtactgcggc atgtgccaca ccgacctgca cttcatccag aacgactggg gcatcaccat    180
gtacccgctg gtcccggggc acgagatcac cggcgtggtg accagggtgg ggagcaacgt    240
ctccggcttc cgcgccggcg accgcgtcgg cgtgggctgc atcgccgccg cctgcctcga    300
ctgcgaccac tgccgccggt ccgaggagaa ctactgcgac aaggtgacgc tcacctacaa    360
cggcgtcttc tgggacggca gcgtcacgta cggcggctac tcccggatgc tggtggcgca    420
caagcggttc gtggtgcgcg tcccggacac gctcccgctg gacgccgcgg cgccgctgct    480
gtgcgcgggg atcaccgtgt acagccccat gaagcaccac ggcatgctgc ggtcacccgg    540
cggcagcctg ggcgtggtgg ggctgggagg actggggcac gtcgccgtca agttcgccaa    600
ggcgttcggc ctccgcgtca ccgtcatcag cacgtcgccg gccaaggaga gggaggcgag     660
ggagcggctc ggcgccgacc atttcgtcgt cagcaccgac cagaagcaga tgcaggccat     720
ggcgagaagc ctcgactacg tcatcgacac cgtctcggcc aagcactcgc tgggccccat     780
cctggagctg ctcaaggtga acggcaagct cgtgctcgtc gccgcgccgg accagcccgt     840
cgagctcccg tcgttcccgc tcatctttgg gaagaggacg gtgagcggga gcatgacggg     900
aggaatgaag gagacgcagg agatgctgga cctgtgcggc cagcacaaca tcacctgcga     960
catcgagctc gtctccacgg acgggatcaa cgaggcgctc gcgcgcctcg cgcgcaacga    1020
cgtccgctac cgcttcgtca tcgacatcgc cggcgactca aactcaaagc tgtagttcaa    1080
ttaattcgtt gcattatatc aagtctcaac aatcaacatt gccggcactg ctggtggttg    1140
attgctatat ctatatctat atctatatct atatctatat ctatatctat atctatatct    1200
atatctatat ctatgtctat atctatagtg tgtgtcagct ttagcaatat gatcagtggt    1260
gatcacttga gccacgagag tgtatgtaat ggttgatgta ctagctgcct cttgatgtgg    1320
gacagtttgg acgactttaa ttt                                            1343
<210>8
<211>465
<212>DNA
<213>甘蔗
<220>
<400>8
acaaaaagaa acacctttgt atatatattt gtagtacaca ataatctcgt atgtaccaat      60
gtcttctgtt cctctgacca agcaggagca gagtatacag aaaaagagta aaaaaaaaag     120
agtgtgtatc atgggctaga acaaaattaa catattggtt actacgtaca atccctaatc     180
ttccaaatgc gtcttcttct tcttcctctt gtctgtaaaa acgtagggga atgggtggat     240
aattcaggga ggaaaggcag gccaagatga atgaagggcc aaaaagaaaa agaaaaagaa     300
aaagaaaaag gatcagaatt cagaagtatt ccaagttgaa gtcgaaatgc gccaggctct    360
gctcctggcc gcagggcagc aagaacttgt gatccagcgc gtcgtcgtcg tcgtccacca    420
cctgcccccc gccgctgccg taccctccgc tgtgctgctg ctgct                    465
<210>9
<211>913
<212>DNA
<213>甘蔗
<220>
<400>9
gtctccgatc gcgaccccga tcgaaatccc gtcaagcttc agcggggcat ccatccccgt     60
cgtaccaacc caccagtgtt cttcctccct tcctcccttc cctgtataaa aacgccacca    120
ccgatcgtgg tttcgtgctc tcgcttcgct cccttaattt atcatcactc ctaatttatt    180
ttatttctta ttatcatatg tattgatttc gctcgccctc ctttcccgac tgttcccgtg    240
cctcacaccg gctcggattg cttgctctcg cttgcttgtg tcagaataag attccgcgca    300
agtttggatt caccgaatcc accgatctct cgcgccccgc ggtcgcgcgc ggtggaattt    360
cggcctgggc ggctgggcgc cgccgattcg ggcctctccg gaagggtgac cccgggtgtg    420
gttcgcctaa tctccgccca aatttcagct gccttagtgt ggaactcgtc gtgattttcg    480
actgtgcgct tggctttcct gtcctgtcct gtcctgtcct gtcctgtccc gtgttgtggc    540
ttcagcattt caggggatgg ggcgccgcgg gttgctcacg gccgcgcttc tgctgtgctt    600
ccttgctgtt tgctccggca gagaacttac gatcaaacag aacccttcca ctaccatata    660
caactcgact cttgcccaga tacttgtgga gtatgctgct gcaatctata ctgctgattt    720
gacagaattg tttacttgga catgtgccag atgtggtgac ttgatcaagg ggttcgagat    780
gatagagatc attgtagatg tggagaactg cttgcaggca tatgttggtt ttgccagcga    840
tataaacgcc gtcgtcgttg tttttagagg aactcaagag aacagcatcc agaattggat    900
agaagacttg cta                                                       913
<210>10
<211>737
<212>DNA
<213>甘蔗
<220>
<400>10
ttgggtttga actacaacct tgtgggaggc tccaacacaa aacagagcat actcgaggcc     60
atggacgtaa aagtgtagct accaagtcta ctgctcgaac taaccagaaa gatggcggcg    120
gcggcggcgg ctgggcggcg ggttctccgg cgacgttccg atcttccacg cggaaaacct    180
cgtcagcaac gtcaaatcaa tcaactacag ccggacattc ttgtcaatca ttagtggagt    240
tgttgctgga atatgggggt ttacaggctt gatgggattt gtgttctact ttcttgtgat    300
gatggttgca tctctgatgc ttttggtgaa ggccaaattt tcggtccata catactttga    360
cagttggaac aggattataa ttgaaggagt tcttgggggc ctgatgtctt tcgtgttgtt    420
ttggacattt gcctatgaca ttgtccacat cttctgatgg atgaaacaag agctctctga    480
agaactgagg aaccatgtaa tccctccctg tatgagacgg aattattgtg taattgcacc    540
tactccgcca tctggggact atgttcagtg gactaccgtc ctcaattagt ctcttgctgt    600
atactagtca gaagcctgaa cttcagaaag ttacaagact ataaatgaac tcaggttagc    660
agactgtcag acttgtgtaa ccccgcagct gtctggaagc gtggtgctcg gttctgcctg    720
ctaaatggac atgcagt                                                   737
<210>11
<211>19
<212>DNA
<213>人工序列
<220>
<223>合成的寡核苷酸
<400>11
cactactcgc cccgatttc                                                  19
<210>12
<211>19
<212>DNA
<213>人工序列
<220>
<223>合成的寡核苷酸
<400>12
cgagtgcttc tccatctgc                                19
<210>13
<211>20
<212>DNA
<213>人工序列
<220>
<223>合成的寡核苷酸
<400>13
tcgcgtccac caatgtaacc                               20
<210>14
<211>20
<212>DNA
<213>人工序列
<220>
<223>合成的寡核苷酸
<400>14
gcgtgcatcg cttgtgtctt                               20
<210>15
<211>20
<212>DNA
<213>人工序列
<220>
<223>合成的寡核苷酸
<400>15
ggatggacga cgtgtcctgg                               20
<210>16
<211>22
<212>DNA
<213>人工序列
<220>
<223>合成的寡核苷酸
<400>16
ataaagtggc cgcttggatt ga                             22
<210>17
<211>20
<212>DNA
<213>人工序列
<220>
<223>合成的寡核苷酸
<400>17
gaagcagggg cctcaagttg                                20
<210>18
<211>21
<212>DNA
<213>人工序列
<220>
<223>合成的寡核苷酸
<400>18
gtcaaacagg cgatctggct c                              21
<210>19
<211>20
<212>DNA
<213>人工序列
<220>
<223>合成的寡核苷酸
<400>19
aatctgcacc ctgccctctc                                20
<210>20
<211>20
<212>DNA
<213>人工序列
<220>
<223>合成的寡核苷酸
<400>20
cagctggagc atggatggag                                20
<210>21
<211>21
<212>DNA
<213>人工序列
<220>
<223>合成的寡核苷酸
<400>21
acgaggccac catagaacat g                            21
<210>22
<211>21
<212>DNA
<213>人工序列
<220>
<223>合成的寡核苷酸
<400>22
gcaattggga ggagaggaat g                            21
<210>23
<211>21
<212>DNA
<213>人工序列
<220>
<223>合成的寡核苷酸
<400>23
ggcactgctg gtggttgatt g                            21
<210>24
<211>21
<212>DNA
<213>人工序列
<220>
<223>合成的寡核苷酸
<400>24
tcccacatca agaggcagct a                            21
<210>25
<211>21
<212>DNA
<213>人工序列
<220>
<223>合成的寡核苷酸
<400>25
ggcaggccaa gatgaatgaa g                                21
<210>26
<211>19
<212>DNA
<213>人工序列
<220>
<223>合成的寡核苷酸
<400>26
agcacagcgg agggtacgg                                   19
<210>27
<211>21
<212>DNA
<213>人工序列
<220>
<223>合成的寡核苷酸
<400>27
gattttcgac tgtgcgcttg g                                21
<210>28
<211>21
<212>DNA
<213>人工序列
<220>
<223>合成的寡核苷酸
<400>28
aagttctctg ccggagcaaa c                                21
<210>29
<211>21
<212>DNA
<213>人工序列
<220>
<223>合成的寡核苷酸
<400>29
aaacagagca tactcgaggc c                                21
<210>30
<211>21
<212>DNA
<213>人工序列
<220>
<223>合成的寡核苷酸
<400>30
acgttgctga cgaggttttc c                                    21

Claims (13)

1.一种分离的多核苷酸,其包含选自以下的序列:
(i)SEQ ID NO:1-10所示的序列;和
(ii)与SEQ ID NO:1-10所示的序列互补的序列;
(iii)微卫星中重复数有变化的(i)或(ii)序列的变体。
2.一种特异性地结合选自SEQ ID NO:1-10的分离的多核苷酸的引物,其中,所述引物包含与SEQ ID NO:1-10所示的序列互补的序列中的至少6个连续核苷酸。
3.一种分离的引物,其包含选自以下的序列:
(i)SEQ ID NO:11-30所示的序列;
(ii)与SEQ ID NO:11-30所示的序列互补的序列;和
(iii)包含SEQ ID NO:11-30所示的序列的至少6个连续核苷酸的序列。
4.一种用于确定甘蔗属复合组的样品中的基因型的方法,包括以下步骤:
(i)从样品获得DNA;
(ii)扩增选自以下的简单序列重复基因座:(i)SEQ ID NO:1-10所示的序列;和(ii)与SEQ ID NO:1-10所示的序列互补的序列;该扩增使用选自以下的DNA中的一套引物:(i)SEQ ID NO:11-30所示的序列;(ii)与SEQ ID NO:11-30所示的序列互补的序列;和(iii)包含SEQ ID NO:11-30所示序列的至少6个连续核苷酸的序列,以形成具有各种大小和标记的扩增产物;
(iii)根据大小分离扩增产物;
(iv)对分离的结果打分;和
(v)将打分结果与来自已知种的DNA的分析结果进行比较。
5.一种用于鉴定将甘蔗属复合组样品与植物来源相关联的成员的方法,包括:
(i)通过使用权利要求4所述的方法确定样品中的DNA的身份;和
(ii)通过使用权利要求4所述的方法确定已知植物基因型的样品中的DNA的身份;和
(iii)比较两种样品的基因型以确定样品(i)的身份。
6.一种用于确定来自甘蔗属复合组样品的需要的基因组序列的基因渗入的方法,包括以下步骤:
(i)从样品获得DNA;
(ii)用选自SEQ ID NO.11-30引物对的DNA中的一套引物扩增简单序列重复基因座;
(iii)根据大小分离扩增产物;
(iv)鉴定父本和母本的专有等位基因;和
(v)鉴定兼有父本和母本的专有等位基因的后代个体。
7.一种用于选择甘蔗属复合组的祖先的方法,包括以下步骤:
(i)从祖先获得DNA;
(ii)用选自SEQ ID NO.11-30引物对的DNA中的一套引物扩增简单序列重复基因座,以形成具有各种大小和标记的扩增产物;
(iii)根据大小分离扩增产物;
(iv)产生具有打分结果的微卫星二进制数据;和
(v)借助于特定遗传相似性评估软件,对含有打分结果的二进制数据进行数学处理,以产生亲本选择指数。
8.一种用于确定甘蔗属复合组成员的亲子关系的方法,包括以下步骤:
(i)从该成员获得DNA;
(ii)用选自SEQ ID NO.11-30引物对的DNA中的一套引物扩增简单序列重复基因座,以形成具有各种大小和标记的扩增产物;
(iii)根据大小分离扩增产物;
(iv)鉴定母本和父本特异性的等位基因;和
(v)鉴定真正的父本。
9.一种用于量化甘蔗属复合组的幼苗样品中的自花授粉的方法,包括以下步骤:
(i)从成员获得DNA;
(ii)用选自SEQ ID NO.11-30引物对的DNA中的一套引物扩增简单序列重复基因座,以形成具有各种大小和标记的扩增产物;
(iii)根据大小分离扩增产物;
(iv)鉴定父本和母本特异性的等位基因;和
(v)鉴定只含有母本的专有等位基因的后代。
10.一种用于检测甘蔗属复合组成员的试剂盒,包括一种或多种适于扩增甘蔗属复合组的样品中的核苷酸序列的引物对。
11.一种用于检测多态性遗传标记的试剂盒,包括一种或多种适于扩增甘蔗属复合组的样品中的核苷酸序列的引物对。
12.如权利要求11所述的试剂盒,其中,所述多核苷酸序列包括选自以下的序列:(i)SEQ ID NO:1-10所示的序列;(ii)与SEQ IDNO:1-10所示的序列互补的序列;(iii)SEQ ID NO:11-30所示的序列;(iv)与SEQ ID NO:11-30所示的序列互补的序列;和(v)包含SEQ ID NO:11-30所示的序列的至少6个连续核苷酸的序列。
13.一种用于开发MAS(标记辅助的选择)程序的与数量性状基因座(QTL)的等位基因相关联的基因的定位(作图)方法。
CN200880004444A 2007-01-12 2008-01-10 用于甘蔗属复合组的基于微卫星的指纹分析*** Pending CN101617047A (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US88470507P 2007-01-12 2007-01-12
US60/884,705 2007-01-12

Publications (1)

Publication Number Publication Date
CN101617047A true CN101617047A (zh) 2009-12-30

Family

ID=39608274

Family Applications (1)

Application Number Title Priority Date Filing Date
CN200880004444A Pending CN101617047A (zh) 2007-01-12 2008-01-10 用于甘蔗属复合组的基于微卫星的指纹分析***

Country Status (5)

Country Link
US (1) US20100021916A1 (zh)
CN (1) CN101617047A (zh)
AU (1) AU2008204740A1 (zh)
BR (1) BRPI0806546A2 (zh)
WO (1) WO2008083456A1 (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101974617B (zh) * 2009-12-31 2012-06-27 北京林业大学 一种尾叶紫薇微卫星dna分子标记及应用
CN103540678A (zh) * 2013-11-05 2014-01-29 广西壮族自治区农业科学院甘蔗研究所 甘蔗毛细管电泳dna指纹图谱的构建及甘蔗品种资源鉴定的方法
CN106803026A (zh) * 2016-12-29 2017-06-06 华南农业大学 一种利用ssr标记信息提高林木遗传评估精确度的方法

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5428596B2 (ja) 2009-07-07 2014-02-26 トヨタ自動車株式会社 サトウキビ属植物の品種・系統識別マーカーとその利用
JP2012115239A (ja) * 2010-12-03 2012-06-21 Toyota Motor Corp サトウキビの茎数関連マーカーとその利用
JP2012115238A (ja) * 2010-12-03 2012-06-21 Toyota Motor Corp サトウキビの一茎重関連マーカーとその利用
JP2012115241A (ja) * 2010-12-03 2012-06-21 Toyota Motor Corp サトウキビの茎重関連マーカーとその利用
ES2578521B1 (es) * 2015-01-26 2017-02-14 Fundación Universidad Francisco De Vitoria (Fufv) Método de identificación de cepas de levaduras vínicas a partir de muestras de mosto
CN110592266B (zh) * 2019-11-01 2022-03-29 天津农学院 甜高粱茎秆出汁率相关基因及其应用
CN110643736B (zh) * 2019-11-15 2022-12-30 中国农业科学院蔬菜花卉研究所 基于SSRseq分子标记的大蒜种质资源分类方法
CN115198030B (zh) * 2022-06-07 2023-09-01 上海市农业科学院 用于朱顶红杂交后代鉴定的ssr分子标记组合、ssr引物组合及其应用

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6605439B2 (en) * 1995-08-17 2003-08-12 Eberhard-Karls Universität Tübingen Universitätsklinikum Extraction, amplification and sequential hybridization of fungal cell DNA and process for detection of fungal cells in clinical material
AU6277599A (en) * 1998-10-01 2000-04-17 Monsanto Company Methods for breeding for and screening of soybean plants with enhanced yields, and soybean plants with enhanced yields
US20090087878A9 (en) * 1999-05-06 2009-04-02 La Rosa Thomas J Nucleic acid molecules associated with plants
AU2591501A (en) * 1999-12-30 2001-07-16 Pioneer Hi-Bred International, Inc. Mqm mapping using haplotyped putative qtl-alleles: a simple approach for mappingqtl's in plant breeding populations
US7834146B2 (en) * 2000-05-08 2010-11-16 Monsanto Technology Llc Recombinant polypeptides associated with plants
WO2003031937A2 (en) * 2001-10-12 2003-04-17 Morphotek, Inc. Genetic hypermutability of plants for gene discovery and diagnosis
US20030211483A1 (en) * 2002-05-09 2003-11-13 Schroeder Benjamin G. Methods for the enrichment of low-abundance polynucleotides
IL155137A0 (en) * 2003-03-27 2003-10-31 Yissum Res Dev Co A method for generating plant diversity
US7732664B2 (en) * 2006-03-08 2010-06-08 Universidade De Sao Paulo - Usp. Genes associated to sucrose content

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101974617B (zh) * 2009-12-31 2012-06-27 北京林业大学 一种尾叶紫薇微卫星dna分子标记及应用
CN103540678A (zh) * 2013-11-05 2014-01-29 广西壮族自治区农业科学院甘蔗研究所 甘蔗毛细管电泳dna指纹图谱的构建及甘蔗品种资源鉴定的方法
CN106803026A (zh) * 2016-12-29 2017-06-06 华南农业大学 一种利用ssr标记信息提高林木遗传评估精确度的方法
CN106803026B (zh) * 2016-12-29 2019-06-25 华南农业大学 一种利用ssr标记信息提高林木遗传评估精确度的方法

Also Published As

Publication number Publication date
US20100021916A1 (en) 2010-01-28
AU2008204740A1 (en) 2008-07-17
WO2008083456A1 (en) 2008-07-17
BRPI0806546A2 (pt) 2014-04-29

Similar Documents

Publication Publication Date Title
CN101617047A (zh) 用于甘蔗属复合组的基于微卫星的指纹分析***
Karp Molecular tools in plant genetic resources conservation: a guide to the technologies
Smýkal et al. Genetic diversity and population structure of pea (Pisum sativum L.) varieties derived from combined retrotransposon, microsatellite and morphological marker analysis
Guimarães Marker-assisted selection: current status and future perspectives in crops, livestock, forestry and fish
Bharathi Phenotypic and genotypic diversity of global finger millet (Eleusine coracana (L.) Gaertn.) composite collection
Liu et al. DArT, SNP, and SSR analyses of genetic diversity in Lolium perenne L. using bulk sampling
CN106282394A (zh) 高通量检测玉米南方锈病抗性基因分型的方法及其试剂盒
Robichaud et al. A robust set of black walnut microsatellites for parentage and clonal identification
US20220010325A1 (en) Quantitative trait loci (qtl) associated with shattering-resistant capsules in sesame and uses thereof
Arbeiter et al. Identification and validation of novel EST-SSR markers in olives
Li et al. Comparison of AFLP and SSR for genetic diversity analysis of Brassica napus hybrids
Liu et al. Transposon mutagenesis and analysis of mutants in UniformMu maize (Zea mays)
Meusnier et al. Polymerase chain reaction–single strand conformation polymorphism analyses of nuclear and chloroplast DNA provide evidence for recombination, multiple introductions and nascent speciation in the Caulerpa taxifolia complex
CN108486266A (zh) 玉米叶绿体基因组的分子标记及在品种鉴定中的应用
Wang et al. Nuclear simple sequence repeat markers are superior to DNA barcodes for identification of closely related Rhododendron species on the same mountain
US20130040826A1 (en) Methods for trait mapping in plants
Sun et al. Low-Cot DNA sequences for fingerprinting analysis of germplasm diversity and relationships in Amaranthus
Zhao et al. Genetic diversity and population structure of Chinese Corylus heterophylla and Corylus kweichowensis using simple sequence repeat markers
CN101213312A (zh) 用于筛选基因特异杂交多态性(gshp)的方法及其在遗传作图和标记开发中的用途
Alonso-Blanco et al. QTL analysis
Sivolap Molecular markers and plant breeding
KR101174409B1 (ko) 초위성체 마커를 이용한 오이 품종 식별 방법
CN106701967A (zh) 调控玉米叶夹角主效qtl的分子标记及其应用方法
Dida Molecular Markers in Breeding of Crops: Recent Progress and Advancements
AU2004234996A1 (en) Array having substances fixed on support arranged with chromosomal order or sequence position information added thereto, process for producing the same, analytical system using the array and use of these

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20091230