CN116732222A - 一种基于全基因组高效预测菊花耐盐性的方法 - Google Patents

一种基于全基因组高效预测菊花耐盐性的方法 Download PDF

Info

Publication number
CN116732222A
CN116732222A CN202310603907.6A CN202310603907A CN116732222A CN 116732222 A CN116732222 A CN 116732222A CN 202310603907 A CN202310603907 A CN 202310603907A CN 116732222 A CN116732222 A CN 116732222A
Authority
CN
China
Prior art keywords
chrysanthemum
salt tolerance
value
whole genome
salt
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202310603907.6A
Other languages
English (en)
Other versions
CN116732222B (zh
Inventor
张飞
周迎雪
苏江硕
张雪峰
管志勇
房伟民
陈发棣
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nanjing Agricultural University
Original Assignee
Nanjing Agricultural University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nanjing Agricultural University filed Critical Nanjing Agricultural University
Priority to CN202310603907.6A priority Critical patent/CN116732222B/zh
Publication of CN116732222A publication Critical patent/CN116732222A/zh
Application granted granted Critical
Publication of CN116732222B publication Critical patent/CN116732222B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6888Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for detection or identification of organisms
    • C12Q1/6895Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for detection or identification of organisms for plants, fungi or algae
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/13Plant traits
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/156Polymorphic or mutational markers

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Analytical Chemistry (AREA)
  • Health & Medical Sciences (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Organic Chemistry (AREA)
  • Physics & Mathematics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biotechnology (AREA)
  • Zoology (AREA)
  • Biophysics (AREA)
  • Genetics & Genomics (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Wood Science & Technology (AREA)
  • Biochemistry (AREA)
  • Mycology (AREA)
  • Microbiology (AREA)
  • General Engineering & Computer Science (AREA)
  • Immunology (AREA)
  • Botany (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Medical Informatics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Theoretical Computer Science (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本发明公开了一种基于全基因组高效预测菊花耐盐性的方法。本发明通过全基因组关联分析鉴定菊花耐盐性显著相关的13个SNP标记,在此基础上,比较了不同统计模型和不同密度SNP标记对全基因组预测效果的影响,并基于GWAS分析中与菊花耐盐性显著关联的SNP位点,构建了菊花耐盐性全基因组选择预测模型,选择效率可提高2.96~13.09倍。本发明不仅能够实现菊花育种工作中耐盐性品种的早期选择,缩短育种周期,还有效克服了耐盐性田间鉴定工作量大、周期长、易受环境因素和人为主观因素的影响等技术难题,为耐盐性分子标记辅助选择和基因组选择育种提供重要理论依据,在菊花耐盐性育种领域具有广阔的应用前景。

Description

一种基于全基因组高效预测菊花耐盐性的方法
技术领域
本发明涉及一种基于全基因组高效预测菊花耐盐性的方法,属于植物抗逆分子育种领域。
背景技术
菊花(Chrysanthemum morifolium Ramat.)是中国四大传统花卉之一,其观赏和经济价值极高,在全球花卉市场中占有重要地位(Mekapogu etal.,2022)。然而,菊花是盐敏感型植物,在生长发育过程中容易受到盐胁迫影响。随着全球环境和生态不断恶化,菊花产业良性土壤面积不断缩减,在周年生产和集约化栽培中,土壤盐渍化已经成为制约菊花产业可持续健康发展的关键因素,严重影响菊花产量和品质(Wang et al.,2022)。植物长期处于高盐浓度生长环境时,不能正常吸收生长所需水分和营养,根系吸收的外界盐离子在体内不断聚积,导致植株生长受到抑制,叶片萎蔫、出现黑色斑点,根系腐烂,严重时还会导致整株坏死干枯,影响其观赏品质和经济效益。尽管生产上采用多种方法来降低盐胁迫给植物带来的影响,但由于环境不断恶化、长期不合理耕作和缺乏科学排灌设施等因素引起的土壤盐渍化问题依旧制约着菊花产业发展。因此,筛选优异耐盐菊花种质资源是加快培育菊花耐盐性新品种的基础,对菊花产业的良性发展具有重要理论意义和实际应用价值。
常规育种方法为提高植物耐盐性做出了一定贡献,然而植物耐盐性为数量性状,受许多微效基因控制,且受环境因素影响较大,常规杂交育种费时费力且带有一定盲目性,难以通过常规育种方法高效改良耐盐性(Gupta etal.,2014)。随着现代分子标记技术的发展,分子标记辅助选择(MAS)为数量性状改良提供了思路。MAS利用与目标性状紧密连锁的遗传标记进行基因型分析,在分离群体中筛选具有目标基因的优良个体,实现精准选择,从而加快育种进程(岳庆春等,2019)。但MAS具有一定的局限性,由于数量性状由许多微效基因/QTL控制,受环境的影响较大,且许多微效基因控制的数量性状的QTL定位结果不能有效运用于育种群体(Singh etal.,2021)。由于菊花基因组的复杂性、杂合性和有限的基因库可用性,常规和分子育种方法在菊花各种关键性状的应用上均受到了一定阻碍。因此,迫切需要找到一种能高效选择和改良菊花耐盐性的新方法。
随着基因组测序技术的进步和作物基因组序列的不断公布,全基因组选择(GS)已成为育种计划中强大的选择工具,为提高植物育种效率开辟了新途径。全基因组选择通过对训练群体的表型数据和基因型数据进行分析,使用特定的模型估计分子标记的效应值或个体育种值,利用待测群体的基因型数据和模型拟合结果实现对待测群体的育种值进行预测(Anilkumar et al.,2022)。全基因组选择能快速从大量种质资源中选择具有优异性状的基因型,通过增加选择强度和准确性来加速育种周期,降低育种成本,进而定向、高效地实现育种改良,解决生产问题(Mir et al.,2023)。GS非常适合研究复杂的多基因性状,目前已被应用于改善复杂性状育种,包括对生物和非生物胁迫的耐受性(Krishnappa etal.,2021)。目前,全基因组选择育种在动物育种,小麦、玉米和水稻等粮食作物育种中有了一定的研究,但是在园艺作物上却鲜有报道,菊花耐盐性GS分析也尚未见报道。菊花基因组序列的公布使得建立一种高效菊花耐盐性GS预测体系成为了可能,为菊花耐盐性育种工作提供技术支撑。
发明内容
发明目的:本发明所要解决的技术问题是提供了一种选择效率可提高2.96~13.09倍的基于全基因组高效预测菊花耐盐性的方法。
技术方案:为解决上述技术问题,本发明提供了SNP位点在筛选菊花耐盐性全基因组选择预测模型和/或预测菊花耐盐性中的应用,所述SNP位点包括以下13个SNP位点:Chr2染色体206663369bp位置的A或G、Chr3染色体85429506bp位置的A或G、Chr4染色体270317168bp位置的C或T、Chr7染色体55466105bp位置的A或G、Chr8染色体244393279bp位置的A或G、Chr9染色体28717618bp位置的A或G、Chr10染色体113391110位置的A或G、Chr11染色体164738021bp位置的A或G、Chr16染色体219081871bp位置的G或T、Chr17染色体7096122bp位置的G或T、Chr18染色体256987813bp位置的G或T、Chr21染色体9336198bp位置的C或T、Chr24染色体26216950bp位置的C或T。
本发明还提供了一种菊花耐盐性全基因组选择预测模型的筛选方法,包括以下步骤:
(1)选取多份来源不同且无直接亲缘关系的代表性菊品种,采用水培法对其进行耐盐性鉴定;利用各性状耐盐系数的最佳线性无偏估计值,结合主成分分析、综合隶属函数法对不同菊花品种的耐盐性进行综合评价,获得不同品种的耐盐性综合评价值D值;
(2)采用GBS简化基因组测序技术和Illumina HiSeq测序平台对步骤(1)中所述的菊花品种进行双末端PE150测序;以菊花‘钟山紫桂’基因组为参考进行序列比对,使用SAMtools软件进行群体变异检测,获得存储SNP基因分型数据的VCF文件;并采用Plink和VCFtools软件,根据测序深度>6X、完整度>0.85、最小等位基因频率≥0.05,缺失率和杂合率<20%的标准进行基因型过滤,最终获得320,407高质量SNP多态性位点用于后续分析;
(3)利用GCTA软件对步骤(2)中所述的高质量SNP多态性位点进行主成分分析和亲缘关系分析,得到所有个体的特征向量PCs矩阵和两两个体之间亲缘关系系数Kinship矩阵,用以控制群体结构造成GWAS分析的假阳性,获得过滤后的SNP位点;
(4)基于步骤(3)中所述的过滤后的SNP位点,利用3VmrMLM软件的单环境模型进行菊花耐盐性全基因组关联分析,同时控制群体结构和亲缘关系,阈值设置为P<1.0×10-3,估计每个SNP位点的P值和表型变异解释率;
(5)以步骤(1)中所述的不同品种的耐盐性综合评价值D值作为菊花耐盐性全基因组选择分析的表型数据;当基因型和表型数据存在缺失,对其进行空缺值填补;首先使用VCFtools软件的“--012”参数将纯合非突变基因型编码为0,杂合基因型编码为1,纯合突变基因型编码为2;再利用R软件Hmisc包中的impute()函数和rrBLUP包中的A.mat()函数进行表型平均值自动插补和基因型填补;
(6)为了比较不同SNP密度及GWAS鉴定获得的显著位点对GS预测准确性的影响,共选取了三类SNP数据集;第一类为步骤(2)中根据与菊花综合耐盐值D值的关联性选取GWAS分析得到的P<0.005的显著位点,按照P值从小到大排序,取前100、200、400、700、1100、1600、2200、2900、3700和4700SNP位点集合;第二类为步骤(2)中GWAS关联分析得到的与菊花综合耐盐值D值集合;第三类为用于全基因组关联分析的全部SNP中选择与第一类和第二类方案相同数量的SNP集合;
(7)采用5-倍交叉验证方法,抽取80%的菊花品种作为训练群体,剩余20%作为测试群体,重复500次以消除取样误差。在训练群体中利用基因型数据和表型数据建立菊花耐盐性全基因组选择模型,在验证群体中利用基因型数据和预测模型估算基因组估计育种值。重复500次以消除取样误差,并以验证群体GEBV和实际观测值的决定系数(r2)重复500次的均值作为评价全基因组选择预测准确性的指标,得到最佳全基因组选择预测体系。
其中,步骤(6)中所述全基因组选择统计模型为岭回归rrBLUP、BayesA、BayesB和RF经典机器学习算法,共4个统计模型;所述rrBLUP、贝叶斯和RF模型分别通过R包‘rrBLUP’、‘BGLR’和‘randomForest’实现。
其中,当标记密度为100~4700,所述rrBLUP、BayesA、BayesB和RF四个模型的预测准确度分别为0.401~0.826,0.496~0.815,0.521~0.823和0.340~0.515。
本发明还提供了所述的方法筛选的菊花耐盐性全基因组选择预测模型在预测耐盐性菊花中的应用。
本发明还提供了所述的方法筛选的菊花耐盐性全基因组选择预测模型在筛选菊花品种中的应用。
本发明还提供了基于全基因组预测模型预测菊花耐盐性的方法,包括以下步骤:
(1)根据所述方法筛选的全基因组预测模型,利用rrBLUP模型分别估计每个菊花品种耐盐性的育种值;
(2)当所述菊花品种的育种值大于等于0.8时,则所述菊花品种为耐盐菊花品种;当所述菊花品种的育种值育种值小于0.8时,则所述菊花品种为不耐盐菊花品种。
有益效果:与现有技术相比,本发明具有如下显著优点:本发明通过全基因组关联分析鉴定菊花耐盐性显著相关SNP标记,在此基础上,比较了不同统计模型和不同密度SNP标记对全基因组预测效果的影响,并基于GWAS分析中与菊花耐盐性显著关联的SNP位点,构建了菊花耐盐性全基因组选择预测模型,选择效率可提高2.96~13.09倍。本发明不仅能够实现菊花育种工作中耐盐性品种的早期选择,缩短育种周期,还有效克服了耐盐性田间鉴定工作量大、周期长、易受环境因素和人为主观因素的影响等技术难题,为耐盐性分子标记辅助选择和基因组选择育种提供重要理论依据,在菊花耐盐性育种领域具有广阔的应用前景。
附图说明
图1为菊花苗期盐胁迫受害指数分级;
图2为实施例2中菊花耐盐性综合D值关联分析得到的曼哈顿图;
图3为基于全基因组选择分析的D值显著关联位点的菊花耐盐性预测。
具体实施方式
下面结合附图对本发明的技术方案作进一步说明。
实施例1菊花耐盐性鉴定
1、试验材料和盐胁迫处理方法
供试的119个切花菊品种资源选取自保存于南京农业大学“中国菊花种质资源保存中心”,本领域技术人员可以从“中国菊花种质资源保存中心”中获得上述种质。
试验于2021年5月~8月在南京农业大学中国菊花种质资源保存中心的玻璃温室内进行,先后进行两次试验(EXP1和EXP2)。首先选取长势相同、生长良好的119个切花菊品种的脚芽扦插于穴盘中(其中,蛭石与珍珠岩的体积比为1:1),待插穗生根并展开8~9片叶后,挑选长势一致的植株,用清水将根系清洗干净后转移至装有10L营养液(0.315g/L霍格兰营养液+0.237g/L钙盐;试剂由福州飞净生物科技有限公司提供)的塑料周转箱中(65cm×43cm×16cm)中,用经消毒浸泡后的海绵球固定于EPE(60cm×35cm×2cm)漂浮板上缓苗6d,之后对处理组进行盐胁迫处理(120mM NaCl+10L营养液),对照组营养液培养,每3d更换1次营养液,气泵24h持续通气,自然光照。试验采取完全随机区组设计,设置处理和对照组,3次重复,每个品种重复3株。
2、盐害指标测定与分析
盐胁迫3d、6d、9d观察植株盐害症状,并根据植株盐害程度进行打分,盐害症状打分标准见图1,其中,1级:植株生长正常,叶片自然生长,未出现盐害症状;2级:基层1~2片叶片出现黑斑或萎蔫,中上层叶片正常生长,植株总体保持挺直;3级:植株上层叶片正常生长,植株一半的叶片明显发黑或萎蔫;4级:植株生长受阻,植株顶端萎蔫弯曲,一半以上叶片发黑或萎蔫;5级:植株严重受害,整株枯萎。
盐胁迫处理9d后,用清水将幼苗根部冲洗干净并去除残余水分,用标准直尺分别测量处理组和对照组株高(SH,cm),株高为植株基部至植株顶端的高度;利用电子天平称量地上部鲜重(SFW,g)和地下部鲜重(RFW,g);最后将植株地上部和地下部分别置于信封袋内,于烘箱105℃杀青30min,80℃烘48h,烘干至恒重测定地上部干重(SDW,g)和地下部干重(RDW,g)。计算每个指标的耐盐系数(耐盐系数=9d后的处理测定值/对照测定值),采用隶属函数法求出每个品种的隶属函数值,提取前两个主成分的隶属函数值和主成分权重进行耐盐性综合评价值(D值)计算。D值越大,说明该品种耐盐性越好。利用Microsoft Excel与IBM SPSS Statistics 25软件对菊花耐盐性鉴定表型数据进行基本描述性统计分析和方差分析(Analysis of variance,ANOVA),利用R 4.2.1软件进行主成分分析、相关性分析及可视化图表制作。
对119个切花菊品种进行两次耐盐性试验,实验过程中发现不同品种的盐害症状差异明显。利用R软件的‘pastecs’包对119个切花菊品种的不同耐盐性状进行描述统计分析;利用‘lm4’包计算各性状的耐盐系数两年最佳线性无偏估计值(BLUE值)。结果如表1所示,SH、SFW、SDW和RDW的耐盐系数小于1,而RFW的盐胁迫系数大于1,说明盐胁迫对不同指标的影响有显著差异。各指标耐盐系数均表现出不同的表型变异,变异系数在8.75%(株高(SH))~26.73%(score_6d)。且119个切花菊品种各性状的耐盐系数基本呈正态分布趋势,表明菊花的耐盐性是受多基因控制的数量性状。为降低数据的冗余性,完成利用R软件的prcomp()函数对各胁迫系数进行主成分分析,将原来的8个指标转化成两个相互独立的综合指标PC1和PC2,特征值分别为2.00和1.27,贡献率分别为50.28%和19.75%,累计贡献率为70.03%。基于耐盐相关性状的主成分分析结果,计算两个综合指标的隶属函数值。根据主成分因子贡献率大小,计算两个主成分因子的权重,分别为0.718和0.282(表2)。得到综合指标的隶属函数值和权重后,算得每个菊花品种的综合耐盐指数值D值(表3)。获得的综合耐盐指数值D值用于后续全基因组关联分析。
表1 119个切花菊盐胁迫下各性状耐盐系数描述性统计
表2菊花耐盐相关性状的主成分分析
表3 119个供试切花菊品种和综合耐盐指数值D值
实施例2全基因组关联分析鉴定菊花耐盐性显著位点
1、基因型数据分型
采用GBS(genotyping by sequencing)简化基因组测序技术和IlluminaHiSeq测序平台对上述119个切花菊品种进行双末端PE150测序。利用Plink和VCFtools软件,根据测序深度>6X、完整度>0.85、最小等位基因频率(MAF)≥0.05,缺失率和杂合率<20%的标准进行基因型过滤,从119份菊花材料中共获得320407个高质量SNP多态性位点用于后续分析。利用GCTA软件进行主成分分析(PCA)和亲缘关系分析,得到所有个体的前10个主成分特征向量PCs矩阵和两两个体之间亲缘关系系数Kinship矩阵,用以控制群体结构造成GWAS分析的假阳性。
2、全基因组关联分析
基于过滤获得的320,407个SNP位点,采用基于3方差组分多位点SNP随机效应混合线性模型(three-variance-component multi-locus random-SNP-effect mixed linear,3VmrMLM)的软件IIIVmrMLM(https://github.com/YuanmingZhang65/IIIVmrMLM)进行GWAS分析,利用综合耐盐指数值D值进行关联分析。通过设置参数“method=‘Single_env’”进行单环境关联分析,同时控制群体结构和亲缘关系,阈值设置为P<1.0×10-3。共检测到13个与综合耐盐指数值D值显著关联的SNP位点(见图2所示的曼哈顿图),表型变异解释率介于2.61%~7.63%之间(表4)。
表4GWAS检测到的菊花综合耐盐性显著SNPs(P<1E-3)
实施例3最优全基因组选择预测模型
1、表型和基因型文件准备
以119个菊花品种的综合耐盐值D值作为菊花耐盐性全基因组选择分析的表型数据。首先使用VCFtools软件的“--012”参数将纯合非突变基因型编码为0,杂合基因型编码为1,纯合突变基因型编码为2。再利用R软件Hmisc包中的impute()函数和rrBLUP包中的A.mat()函数进行表型平均值自动插补和基因型填补。
2、核心参数设置及GS分析
选取岭回归最佳线性无偏预测(rrBLUP)、贝叶斯统计模型(BayesA和BayesB)这3个统计模型。rrBLUP和贝叶斯统计模型分别通过R包‘rrBLUP’和‘BGLR’实现,BGLR模型的Gibbs抽样设置迭代次数5000(nlter=5000),舍弃样本500(burnIn=1000)。RF模型的决策树数目设置为500(ntree=500)。为了比较不同SNP密度及GWAS鉴定获得的显著位点对GS预测准确性的影响,共选取了三类SNP数据集。第一类为根据与菊花综合耐盐值D值的关联性选取GWAS第一步分析得到的P<0.005的显著位点,按照p值从小到大排序,取前100、200、400、700、1100、1600、2200、2900、3700和4700SNP位点集合;第二类为GWAS第二步分析得到的与菊花综合耐盐值D值(13个SNP)集合;第三类为用于全基因组关联分析的全部SNP中选择与第一类和第二类方案相同数量的SNP集合。
采用5-倍交叉验证方法,抽取80%的菊花品种作为训练群体,剩余20%作为测试群体,重复500次以消除取样误差。在训练群体中利用基因型数据和表型数据建立菊花耐盐性全基因组选择模型,在验证群体中利用基因型数据和预测模型估算基因组估计育种值(GEBV)。重复500次以消除取样误差,并以验证群体GEBV和实际观测值的决定系数(r2)重复500次的均值作为评价全基因组选择预测准确性的指标。
3、SNP密度和不同模型选择
利用上述4个统计模型和不同密度SNP数据集对菊花综合耐盐值D值进行GS分析。从表5可知,rrBLUP和2个贝叶斯模型(BayesA和BayesB)的预测准确度均显著优于随机森林模型(RF模型)。基于不同密度的关联位点建立的全基因组选择模型的预测准确性显著优于相同数目随机位点建立的预测模型,随着标记密度从100~4 700逐渐增加,rrBLUP、BayesA、BayesB和RF四个模型的预测准确度也分别从0.401~0.826,0.496~0.815,0.521~0.823和0.340~0.515不断提高;与随机位点相比,利用不同密度的关联位点进行预测,在rrBLUP、BayesA、BayesB和RF四个模型中的准确度分别可提升2.96~6.41倍、3.94~12.01倍、5.59~11.93倍、3.42~12.65倍((显著位点的精确度-随机位点的精确度)/随机位点的精确度)。当SNP数量达到3700后,预测准确度趋于稳定,且rrBLUP模型的预测准确性最高,可达0.823。可见,在预测模型中应用GWAS分析关联的显著性位点能大大提高GS预测的准确度。综上,选择rrBLUP模型和3700的SNP数据集为菊花耐盐性全基因组预测的最优体系。
表5不同模型和SNP标记的全基因组选择预测准确度
4、GWAS显著关联位点与菊花耐盐性预测
利用上述rrBLUP和贝叶斯(BayesA和BayesB)统计模型,分别通过R包‘rrBLUP’和‘BGLR’对全基因组关联分析挖掘到的与菊花综合耐盐值D值显著关联的13个SNP位点进行菊花耐盐性预测分析。结果表明,与菊花综合耐盐值D值显著关联的13个SNP位点在rrBLUP、BayesA和BayesB三个模型中,预测准确度分别可达0.750、0.749和0.761,而在随机位点中的预测准确度平均值均不到0.1,利用与菊花综合耐盐值D值显著关联的13个SNP位点建立的全基因组选择预测模型准确度分别可提升7.62、11.69和13.09倍(图3)。利用与D值显著关联的13个SNP位点进行预测可达到与利用前1 100~2 200个SNP位点(P<0.005)预测的准确度。综上,GWAS关联分析挖掘到的与菊花综合耐盐值D值显著关联的13个SNP位点能很好地对菊花耐盐性进行预测。
实施例4根据最优预测体系选择育种值较高的优良材料
根据实施例3中确定的最佳SNP数据集以及13个显著关联SNP数据集,利用predict(rrBLUP_fit,Markers_test)函数估计每个品种耐盐性的育种值GEBV,其中rrBLUP_fit为构建的rrBLUP模型,Markers_test为13个显著关联位点和SNP密度为3700的标记集。利用cor()函数对119个切花菊品种耐盐指数值D值的真实值和育种值进行相关性分析表明,得到利用SNP密度为3700估计的GEBV与真实值之间的相关性为0.940(P<0.001),利用13个显著关联位点SNP数据集估计的GEBV与真实值之间的相关性为0.796(P<0.001)。为筛选候选耐盐优异材料,以10%的选择强度筛选育种值排名在前的品种,排名前12的品种名称及其GEBV参见表6。其中,‘南农鬼脸’、‘淡绿天赞’、‘马罗’和‘甘娜须’4个品种的估计综合耐盐值D值(育种值)均大于0.8,可用于后续的菊花耐盐育种和分子机制研究。
表6筛选到的高度耐盐品种
/>

Claims (7)

1.SNP位点在筛选菊花耐盐性全基因组选择预测模型和/或预测菊花耐盐性中的应用,其特征在于,所述SNP位点包括以下13个SNP位点:Chr2染色体206663369bp位置的A或G、Chr3染色体85429506bp位置的A或G、Chr4染色体270317168bp位置的C或T、Chr7染色体55466105bp位置的A或G、Chr8染色体244393279bp位置的A或G、Chr9染色体28717618bp位置的A或G、Chr10染色体113391110位置的A或G、Chr11染色体164738021bp位置的A或G、Chr16染色体219081871bp位置的G或T、Chr17染色体7096122bp位置的G或T、Chr18染色体256987813bp位置的G或T、Chr21染色体9336198bp位置的C或T、Chr24染色体26216950bp位置的C或T。
2.一种菊花耐盐性全基因组选择预测模型的筛选方法,其特征在于,包括以下步骤:
(1)选取多份来源不同且无直接亲缘关系的代表性菊花品种,采用水培法对其进行耐盐性鉴定;利用各性状耐盐系数的最佳线性无偏估计值,结合主成分分析、综合隶属函数法对不同菊花品种的耐盐性进行综合评价,获得不同品种的耐盐性综合评价值D值;
(2)采用GBS简化基因组测序技术和Illumina HiSeq测序平台对步骤(1)中所述的菊花品种进行双末端PE150测序;以菊花‘钟山紫桂’基因组为参考进行序列比对,使用SAMtools软件进行群体变异检测,获得存储SNP基因分型数据的VCF文件;并采用Plink和VCFtools软件,根据测序深度>6X、完整度>0.85、最小等位基因频率≥0.05,缺失率和杂合率<20%的标准进行基因型过滤,最终获得320,407高质量SNP多态性位点用于后续分析;
(3)利用GCTA软件对步骤(2)中所述的高质量SNP多态性位点进行主成分分析和亲缘关系分析,得到所有个体的特征向量PCs矩阵和两两个体之间亲缘关系系数Kinship矩阵,用以控制群体结构造成GWAS分析的假阳性;
(4)基于步骤(2)中所述的过滤后的SNP位点和步骤(3)中的GWAS分析,利用3VmrMLM软件的单环境模型进行菊花耐盐性全基因组关联分析,同时控制群体结构和亲缘关系,阈值设置为P<1.0×10-3,估计每个SNP位点的P值和表型变异解释率;
(5)以步骤(1)中所述的不同品种的耐盐性综合评价值D值作为菊花耐盐性全基因组选择分析的表型数据;当基因型和表型数据存在缺失,对其进行空缺值填补;首先使用VCFtools软件的“--012”参数将纯合非突变基因型编码为0,杂合基因型编码为1,纯合突变基因型编码为2;再利用R软件Hmisc包中的impute()函数和rrBLUP包中的A.mat()函数进行表型平均值自动插补和基因型填补;
(6)为了比较不同SNP密度及GWAS鉴定获得的显著位点对GS预测准确性的影响,共选取了三类SNP数据集;第一类为步骤(4)中根据与菊花综合耐盐值D值的关联性选取GWAS分析得到的P<0.005的显著位点,按照P值从小到大排序,取前100、200、400、700、1100、1600、2200、2900、3700和4700SNP位点集合;第二类为步骤(4)中GWAS关联分析得到的与菊花综合耐盐值D值集合;第三类为用于全基因组关联分析的全部SNP中选择与第一类和第二类方案相同数量的SNP集合;
(7)采用5-倍交叉验证方法,抽取80%的菊花品种作为训练群体,剩余20%作为测试群体,重复500次以消除取样误差;在训练群体中利用基因型数据和表型数据建立菊花耐盐性全基因组选择模型,在验证群体中利用基因型数据和预测模型估算基因组估计育种值;重复500次以消除取样误差,并以验证群体GEBV和实际观测值的决定系数(r2)重复500次的均值作为评价全基因组选择预测准确性的指标,得到最佳全基因组选择预测体系。
3.根据权利要求2所述的方法,其特征在于,步骤(6)中所述全基因组选择统计模型为岭回归rrBLUP、BayesA、BayesB和RF经典机器学习算法,共4个统计模型;所述rrBLUP、贝叶斯和RF模型分别通过R包‘rrBLUP’、‘BGLR’和‘randomForest’实现。
4.根据权利要求3所述的方法,其特征在于,当标记密度为100~4700,所述rrBLUP、BayesA、BayesB和RF四个模型的预测准确度分别为0.401~0.826,0.496~0.815,0.521~0.823和0.340~0.515。
5.权利要求2所述的方法筛选的菊花耐盐性全基因组选择预测模型在预测耐盐性菊花中的应用。
6.权利要求2所述的方法筛选的菊花耐盐性全基因组选择预测模型在筛选菊花品种中的应用。
7.基于全基因组预测模型预测菊花耐盐性的方法,其特征在于,包括以下步骤:
(1)根据权利要求2所述的方法筛选的全基因组预测模型,利用rrBLUP模型分别估计每个菊花品种耐盐性的育种值;
(2)当所述菊花品种的育种值大于等于0.8时,则所述菊花品种为耐盐菊花品种;
当所述菊花品种的育种值育种值小于0.8时,则所述菊花品种为不耐盐菊花品种。
CN202310603907.6A 2023-05-26 2023-05-26 一种基于全基因组高效预测菊花耐盐性的方法 Active CN116732222B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310603907.6A CN116732222B (zh) 2023-05-26 2023-05-26 一种基于全基因组高效预测菊花耐盐性的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310603907.6A CN116732222B (zh) 2023-05-26 2023-05-26 一种基于全基因组高效预测菊花耐盐性的方法

Publications (2)

Publication Number Publication Date
CN116732222A true CN116732222A (zh) 2023-09-12
CN116732222B CN116732222B (zh) 2024-03-15

Family

ID=87907107

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310603907.6A Active CN116732222B (zh) 2023-05-26 2023-05-26 一种基于全基因组高效预测菊花耐盐性的方法

Country Status (1)

Country Link
CN (1) CN116732222B (zh)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105112403A (zh) * 2015-09-15 2015-12-02 南京农业大学 菊花耐盐性关联分子标记及其获得方法和应用
CN106446596A (zh) * 2016-07-15 2017-02-22 南京农业大学 一种与菊花耐涝性显著相关的分子标记及其鉴定方法和应用
CN111524545A (zh) * 2020-04-30 2020-08-11 天津诺禾致源生物信息科技有限公司 全基因组选择育种的方法和装置
CN112582023A (zh) * 2020-12-17 2021-03-30 河南省农业科学院粮食作物研究所 一种基于全基因组关联分析和多环境预测模型的玉米分子育种方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105112403A (zh) * 2015-09-15 2015-12-02 南京农业大学 菊花耐盐性关联分子标记及其获得方法和应用
CN106446596A (zh) * 2016-07-15 2017-02-22 南京农业大学 一种与菊花耐涝性显著相关的分子标记及其鉴定方法和应用
CN111524545A (zh) * 2020-04-30 2020-08-11 天津诺禾致源生物信息科技有限公司 全基因组选择育种的方法和装置
CN112582023A (zh) * 2020-12-17 2021-03-30 河南省农业科学院粮食作物研究所 一种基于全基因组关联分析和多环境预测模型的玉米分子育种方法

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
刘策;孟焕文;程智慧;: "植物全基因组选择育种技术原理与研究进展", 分子植物育种, no. 16 *
李沛?;迟天华;刘颖鑫;范宏虹;王海滨;管志勇;房伟民;陈发棣;张飞;: "异色菊×菊花脑种间杂交F_1代SSR遗传多态性分析、耐旱性鉴定及关联分析", 南京农业大学学报, no. 02 *
范宏虹;徐婷婷;苏江硕;孙炜;种昕冉;管志勇;房伟民;陈发棣;张飞;: "切花菊耐寒性相关SNP位点挖掘与候选基因分析", 园艺学报, no. 11 *
许莉莉;陈发棣;陈素梅;房伟民;朱文莹;王海滨;李佩玲;: "栽培菊花与菊属-近缘属属间杂种杂交后代耐盐性的遗传分析", 生态学报, no. 16 *

Also Published As

Publication number Publication date
CN116732222B (zh) 2024-03-15

Similar Documents

Publication Publication Date Title
Gali et al. Genome-wide association mapping for agronomic and seed quality traits of field pea (Pisum sativum L.)
Loudet et al. Quantitative trait loci controlling root growth and architecture in Arabidopsis thaliana confirmed by heterogeneous inbred family
Tar’an et al. Genetic mapping of ascochyta blight resistance in chickpea (Cicer arietinum L.) using a simple sequence repeat linkage map
Park et al. Multi-varietal forestry integrating genomic selection and somatic embryogenesis
Chitwood et al. Population structure and association analysis of bolting, plant height, and leaf erectness in spinach
Guo et al. Functional phenomics and genetics of the root economics space in winter wheat using high‐throughput phenotyping of respiration and architecture
Lopez et al. QTLs associated with crown root angle, stomatal conductance, and maturity in sorghum
US11044884B1 (en) High yield sesame
CN116564407B (zh) 一种基于全基因组选择高效预测菊花花期的方法
Mackay et al. Statistical methods for plant breeding
CN114107550B (zh) 一种与大豆百粒重相关的qtl、分子标记、扩增引物及应用
CN116469466B (zh) 一种高效预测菊花耐涝性的方法及其应用
CN113801952A (zh) 一种海雀稗根系富集镉含量性状的snp分子标记及其应用
CN116732222B (zh) 一种基于全基因组高效预测菊花耐盐性的方法
CN114410746B (zh) 一种东星斑分子溯源选择育种方法及其应用
Asselin et al. Genetic characterization of maximilian sunflower for the development of a locally adapted perennial grain oilseed
Dujak et al. Genomic analysis of fruit size and shape traits in apple: unveiling candidate genes through GWAS analysis
Walley et al. Biotechnology and genomics: exploiting the potential of CWR
Bhandari Genetic Architecture of Horticultural Traits in Fresh-Market Tomato
US11730133B2 (en) High yield sesame
Schmitz Enabling marker-assisted breeding for fruit texture traits in progeny of the apple cultivar Honeycrisp
CN117594129A (zh) 一种基于全基因组选择的杨树生长性状最优预测体系及其构建方法和应用
MacLachlan Selective breeding of lodgepole pine and interior spruce generates growth gains but maintains phenotypic and genomic adaptation to climate
Sidhu Subcellular Root Phenes Regulate Root Metabolic Cost
Zambelli The importance of deep genotyping in crop breeding

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
CB02 Change of applicant information
CB02 Change of applicant information

Address after: 210043 Jiangsu Nanjing Qixia District Bagua Zhou street Jiangsu Qixia modern agriculture industrial park Nanjing Agricultural University modern horticulture industry science and Technology Innovation Center

Applicant after: NANJING AGRICULTURAL University

Address before: Weigang Xuanwu District of Nanjing Jiangsu province 210095 No. 1

Applicant before: NANJING AGRICULTURAL University

GR01 Patent grant
GR01 Patent grant