CN117165601A - 一种抑制胡萝卜抽薹基因及其应用 - Google Patents

一种抑制胡萝卜抽薹基因及其应用 Download PDF

Info

Publication number
CN117165601A
CN117165601A CN202311142334.8A CN202311142334A CN117165601A CN 117165601 A CN117165601 A CN 117165601A CN 202311142334 A CN202311142334 A CN 202311142334A CN 117165601 A CN117165601 A CN 117165601A
Authority
CN
China
Prior art keywords
bolting
carrot
gene
genes
analysis
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202311142334.8A
Other languages
English (en)
Inventor
孔小平
严湘萍
刘思思
徐少南
张倩
周红伟
张生田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Vegetable Technology Service Center
Original Assignee
Vegetable Technology Service Center
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Vegetable Technology Service Center filed Critical Vegetable Technology Service Center
Priority to CN202311142334.8A priority Critical patent/CN117165601A/zh
Publication of CN117165601A publication Critical patent/CN117165601A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本发明公开了一种抑制胡萝卜抽薹基因及其应用,属于分子生物学领域,该基因的核苷酸序列如SEQ ID NO:1所示。本发明利用240份胡萝卜种质资源构建的群体,调查其抽薹性状,并鉴定耐抽薹优异种质,利用全基因组关联分析检测获得与抽薹时间、抽薹率等相关性状显著关联的SNP位点和候选基因,通过关联BLUE值共筛选出3个候选抑制抽薹基因,并对这3个基因进行RT‑qPCR验证,根据检测结果显示出gene‑LOC108205243在3个品种间的差异与性状趋势相一致,说明该基因为胡萝卜抗抽薹相关重要基因,为后续挖掘耐抽薹数量性状位点和胡萝卜耐抽薹品种的选育奠定基础。

Description

一种抑制胡萝卜抽薹基因及其应用
技术领域
本发明涉及分子生物学领域,特别是涉及一种抑制胡萝卜抽薹基因及其应用。
背景技术
胡萝卜(Daucus carotaL.)是一种多年生经济作物,具有广阔的应用前景。胡萝卜以其特有的味道被誉为“土人参”和“金笋”,其高营养、高品质被广泛认可。目前,我国胡萝卜的种植面积达到48万hm2,占世界总量的42%,是世界上最大的胡萝卜种植国。抽薹开花是胡萝卜在生产中的重要的农艺性状,在气候冷凉、日照时间较长的地方如青海等地,胡萝卜易受到气候的影响发生先期抽薹现象。而先期抽薹会对肉质根的膨大产生抑制作用,从而导致肉质根木质化,会对胡萝卜的产量和品质造成巨大的影响,制约胡萝卜产业发展。目前对胡萝卜抽薹现象的相关报道中,认为培育耐抽薹品种是解决这难题最有效的途径之一。因此,挖掘与抽薹开花相关的调控位点和基因、培育耐抽薹品种是提高胡萝卜的品质、产量和降低损失的重要手段。
近年来,全基因组关联分析(Genome-Wide Association Study,GWAS)分析作为发掘影响农艺性状的关键基因的重要手段,并被广泛应用于多种农作物。这种分析方法是通过将需要关注的表型和基因型数据进行关联分析,以获得与该性状有关的位点。运用GWAS分析已经定位到玉米、萝卜、白菜等作物的抽薹开花相关基因和位点,为胡萝卜先期抽薹研究打下基础。如在小麦种定位到与开花期相关的基因有qFL-3,qCulmL-3,qPH-3;在玉米中鉴定到RAP2.7基因是开花期的关联基因;在大豆中寻找到的与花期相关基因GmSOC1,Dt1;在大白菜中找到耐抽薹显著关联5个SNP;在萝卜中找到253个抽薹开花相关的基因。虽然GWAS分析已广泛应用于农作物中,但有关胡萝卜先期抽薹研究尚未涉足。
发明内容
本发明的目的是提供一种抑制胡萝卜抽薹基因及其应用,以解决上述现有技术存在的问题,本发明发现gene-LOC108205243为胡萝卜抗抽薹相关重要基因,为后续挖掘耐抽薹数量性状位点和胡萝卜耐抽薹品种的选育奠定基础。
为实现上述目的,本发明提供了如下方案:
本发明提供一种抑制胡萝卜抽薹基因gene-LOC108205243,其核苷酸序列如SEQID NO:1所示。
本发明还提供一种检测所述抑制胡萝卜抽薹基因gene-LOC108205243的引物对,所述引物对的核苷酸序列如SEQ ID NO:3-4所示。
本发明还提供一种所述的引物对在制备鉴别胡萝卜抽薹性状的产品中的应用。
进一步地,所述产品包括试剂或试剂盒。
本发明还提供一种所述的抑制胡萝卜抽薹基因gene-LOC108205243在鉴别胡萝卜抽薹性状中的应用。
本发明还提供一种鉴别胡萝卜抽薹性状的方法,包括以下步骤:以胡萝卜DNA为待测样本,采用权利要求2所述的引物对进行PCR扩增,根据扩增结果鉴别胡萝卜抽薹性状。
进一步地,若扩增结果显示扩增产物显著高表达,则胡萝卜为耐抽薹性状;若扩增结果显示扩增产物显著低表达,则胡萝卜为易抽薹性状。
本发明还提供一种所述的抑制胡萝卜抽薹基因gene-LOC108205243在胡萝卜分子育种、培育转基因胡萝卜或胡萝卜种质资源改良中的应用。
本发明公开了以下技术效果:
本发明利用240份胡萝卜种质资源构建的群体,调查其抽薹性状,并鉴定耐抽薹优异种质,利用全基因组关联分析检测获得与抽薹时间、抽薹率等相关性状显著关联的SNP位点和候选基因,通过关联BLUE值共筛选出3个候选抑制抽薹基因,并对这3个基因进行RT-qPCR验证,根据检测结果显示出gene-LOC108205243在3个品种间的差异与性状趋势相一致,说明这个基因为胡萝卜抗抽薹相关重要基因,为后续挖掘耐抽薹数量性状位点(Quantitative Trait Loci,QTL)和胡萝卜耐抽薹品种的选育奠定基础。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明的技术路线图;
图2为胡萝卜质量性状统计频次分布图;
图3为胡萝卜抽薹相关性状的相关性分析;
图4为抽薹性状BLUE值的频率分布直方图;
图5为抽薹相关性状的聚类分析;
图6为供试胡萝卜群体结构分析;A:K值;B:群体结构分析;
图7为主成分分析结果;
图8为群体***进化树;
图9为连锁不平衡分析结果;
图10为2021年抽薹相关性状的GWAS分析结果;A:抽薹时间的GWAS分析结果;B:抽薹率的GWAS分析结果;C:薹高的GWAS分析结果;D:抽薹速度的GWAS分析结果;(a)曼哈顿图;(b)分数位-分数位图;
图11为2022年抽薹相关性状的GWAS分析结果;A:抽薹时间的GWAS分析结果;B:抽薹率的GWAS分析结果;C:薹高的GWAS分析结果;D:抽薹速度的GWAS分析结果。(a)曼哈顿图;(b)分数位-分数位图;
图12为抽薹相关性状BLUE值的GWAS分析结果;A:曼哈顿图;B:分数位-分数位图;
图13为胡萝卜中3个候选基因在抽薹性状上的表达分析;a:gene-LOC108205243;b:gene-LOC108215545;c:gene-LOC108219548。
具体实施方式
本发明从中国农业科学院和西宁市蔬菜技术服务中心收集到的240份胡萝卜品种、主推品种和品系构建自然群体,在4个地点进行了准确的表型鉴定。利用抽薹相关性状进行胡萝卜耐抽薹鉴定;并利用二代重测序技术对自然群体全基因组变异进行扫描,质控后获得19056107个SNP位点。最后结合群体结构分析结果、亲缘关系分析对收集到的4个抽薹性状和B LUE值进行关联分析,共筛选出3个候选基因,并对这3个基因进行RT-qPCR验证,根据检测结果显示出gene-LOC108205243、gene-LOC108215545在3个品种间的差异与性状趋势相一致,说明这两个基因为抑制抽薹的重要基因。其中gene-LOC108205243和gene-LOC108215545基因的扩增序列如如下:
基因gene-LOC108205243扩增片段(SEQ ID NO:1):TCCTTCACGGTCATGGTTCT TTTCCAAGAGCTAGAAGTCCATTCGTCCCTTCACTTAATCATCCGGGCAATATTACTCGG GCCCATGATAGGATCCAGGTTTCCCATGTCAGCCATCATTCACAAGGCAATCCTACGAAT TTGATATCACCTATCGTGCCTGCTG;
基因gene-LOC108215545扩增片段(SEQ ID NO:2):CAGCTCACACTTTCAGGTA GCTGAGCGTGCATTATTCCTATGGAATAATGATCATATACGGACTCTGATTACCCAGAATC GGAGGGTTATACTACCCATAATCATCCCGGCCTTGGAAA。
本研究的技术路线图如图1所示,具体研究如下:
实施例1
1材料与方法
1.1材料来源
240份胡萝卜种质资源均由西宁市蔬菜技术服务中心提供,收集于日本、韩国、荷兰、德国及国内科研单位和市场,详细信息见表1:
表1试验材料
1.2田间试验设计
共进行2年2点的试验,于2021年4月种植于湟中区田家寨镇(N36°27′40″、E101°47′46″)、6月种植于西宁市生物园区(N36°41′34″、E101°45′19″),2022年4月种植于湟中区拦隆口镇(N36°46′24″、E101°29′34″),6月种植于湟源县星泉村(N36°43′34″、E101°12′58″)。试验点田间试验均采用随机区组试验设计。播种方式采用条植,整地方式为起垄覆膜,垄高20cm,垄宽80cm,株距5cm,每垄种4行,行宽1.5m。出苗期覆盖无纺布保墒,齐苗后撤除无纺布。其他田间管理措施与生产田相同。
1.3测定内容与方法
田间农艺性状依据《胡萝卜种质资源描述规计和数据标准》,共统计分析了240份胡萝卜材料的表型性状在田间的表现,记录肉质根长、根粗、单根重、中心柱粗等四个数量性状。自胡萝卜出现现蕾开始,每天统每份资源的抽薹时间、抽薹数和薹高,直到肉质根完全成熟后采收期为止,计算各试材的抽薹率和抽苔速度。抽薹时间指从种植日起到开始抽薹的天数;薹高:自抽薹开始由抽薹基部质花茎顶端的距离;抽薹率=抽薹株数/总株数;抽薹速度=薹高/抽薹时间。
1.4数据分析
利用软件SPSS26.0对胡萝卜的表型性状进行统计分析,遗传变异分析、相关性分析及主成分分析。利用公式计算不同胡萝卜品种标准化后数据的综合指标的隶属函数值:耐抽薹性正、负相关指标的平均隶属度计算公式如下:
Uij=(Xij-Xjmin)/(Xjmax-Xjmin) (1)
Uij=1-(Xij-Xjmin)/(Xjmax-Xjmin)
式中,i代表不同种源种质;j代表性状;Uij代表隶属函数值;Xij代表i种质j性状的观察值;Xjmin代表最小值;Xjmax代表最大值。
权重计算公式:
Wj=Pj/n∑j=1Pj,j=1,2,3,···,n, (2)
式中,Pj表示不同胡萝卜品种第j个综合指标的贡献率;
综合评价U值计算公式:
U=n∑j=1[u(Xj)×Wj],j=1,2,3,···,n. (3)
同时,按照综合评价将耐抽薹性分为5组:平均隶属函数值为0.00~0.19为极不耐抽薹(susceptible,S),0.20~0.39为不耐抽薹(low tolerance,LT),0.40~0.59为中等耐抽薹(middle tolerance,MT)0.60~0.79为耐抽薹(tolerance,T)0.80~1.00为极耐抽薹(high tolerance,HT)。
2结果与分析
2.1胡萝卜抽薹相关性状统计分析
对240份胡萝卜资源的4个抽薹性状和7个其他农艺性状进行统计分析。其中7个农艺性状中质量性状分别为肉质根根尖型、中心柱形状、表皮状况、肉质根颜色。质量性状的频次分布图见图2。另外3个数量性状与4个抽薹相关性状的统计分析结果如表2,由表2可知,7个性状的Shannon多样性指数有较大差异其变化范围为1.38~2.09,说明240份胡萝卜材料的7个性状的遗传多样性较丰富。抽薹性状中抽薹速度的遗传多样性指数最高,肉质根性状中中心柱粗的遗传多样性指数最高。
表2胡萝卜农艺性状遗传变异分析
2.2胡萝卜抽薹相关性状的相关性分析
利用软件对胡萝卜的4个抽薹性状及7个农艺性状进行相关性分析,结果如图3所示,几个性状之间为极显著相关的有10对,显著相关的有7对,其中与抽薹时间、抽薹率、薹高、抽薹速度之间互为极显著正相关,相关系数分别为0.29、0.75、0.65、0.57、0.65、0.98,抽薹速度与薹高的相关系数最大。抽薹率和其他几个抽薹性状间相比,与抽薹速度的系数最大为0.65。另外7个性状与抽薹率的相关关系为抽薹率与肉质根表皮状况呈显著性正相关,与根尖型、根粗、中心柱粗呈显著性负相关,中心柱形状与抽薹速度为显著性正相关。中心柱形状与单根重呈显著性相关,肉质根表皮状况与跟粗呈显著性负相关,与中心柱粗呈极显著性负相关,根粗与中心柱粗和单根重均呈极显著正相关,除上述情况外,其他性状间均无显著性相关。可选择与抽薹性状由显著相关的农艺性状作为后续耐抽薹胡萝卜资源的综合评价的性状。
2.3胡萝卜资源耐抽薹性综合评价
对240份胡萝卜与抽薹性状有显著相关的性状进行主成分分析,结果显示,特征值在1.0之上的主成分共有4个,这些主成分能充分反映各品种之间指标的信息。
第1主成分特征值最大,为3.04,贡献率为33.75%。抽薹速度和薹高的载荷正向值最大,为0.53,为抽薹性主要的衡量指标。第2主成分特征值为1.84,贡献率为20.43%。中心柱粗的载荷正向值最大为0.67,这些性状与肉质根品质有关,与抽薹性的关联性比较密切。第3主成分特征值为1.09,贡献率为12.09%;肉质根表皮状况的载荷正向值最大,为0.67,说明第3主成分与胡萝卜根品质有关,与抽薹性关联度较小。第4主成分特征值为1.04,贡献率为11.56%,以根尖型(0.80)的载荷最大,说明第4主成分与胡萝卜根型有关,与抽薹性无关。
表3胡萝卜抽薹相关性状主成分分析
表3显示,在对胡萝卜进行主成分分析时,由于4个主因子对胡萝卜的贡献率不同,所以采用隶属函数法结合各个主成分的贡献率进行综合评价,协调主成分之间的关系,再利用各主成分得到的综合得分来计算隶属函数值u(Xj),以此作为评价指标,然后计算4个主成分的权重分别为0.43、0.26、0.16、0.15,最后计算综合指标U值在0.24~0.92之间。按照分级标准可将240份胡萝卜材料分为4组:不耐抽薹材料(LT)有38份、中等耐抽薹材料(MT)有125份、耐抽薹材料(T)有71份、极耐抽薹材料(HT)有6份。对240份胡萝卜种植资源的抽薹性状进行多重比较,结果表明,耐抽薹材料(T)与极耐抽薹材料(HT)在抽薹时间、抽薹率、薹高、抽薹速度之间不存在显著差异,与另外两个级别之间存在显著差别,且不耐抽薹材料(LT)和中等耐抽薹材料(MT)与4个性状之间也存在显著差异。不耐抽薹材料(LT)的4个性状平均值分别为77.45、30.41、115.37、1.51,他们均大于另外3个耐抽薹级别。由此筛选出极耐抽薹材料6份,分别为B122、B152、B196、B180、B115、B130。
表4胡萝卜资源耐抽薹性的多重比较
注:表中同列数据后不同小写字母表示差异显著(P<0.05)
3胡萝卜抽薹相关性状全基因组关联分析
3.1试验材料和方法
3.1.1材料来源、田间试验设计和抽薹相关性状调查同1.1-1.3。
3.1.2表型数据分析
利用SPSS26.0对2年2点的胡萝卜抽薹率、抽薹时间、薹高、抽薹速度进行描述性统计分析,包括平均值、最大值、最小值、标准差、变异系数、广义遗传力。
最佳线性无偏估计(Best Linear Unbiased Estimator,BLUE),通过将整合多个环境的数据来降低环境效应,以此获的个体间稳定遗传的表型性状。利用lme4软件,对2021年和2022年胡萝卜抽薹性状数据进行分析,胡萝卜抽薹性状的BLUE值使用混合线性模型:
y=lmer(BH~lines+(1|env)+(1|lines)+(1|BR:BT)+(1|BT:BH)+(1|BR:BH)+(1|BR:lines)
+(1|BH:lines)+(1|BT:lines),data=dat) (4)
其中lines为品种效应,env为环境效应;(1|BT:BR)为两个抽薹性状间的效应;(1|ines:BT)是抽薹天数与品种之间的效应。
3.2基因组检测
3.2.1胡萝卜基因组DNA提取与检测
2022年在胡萝卜肉质根膨大期从每份试验材料中选取1株新鲜、健康、幼嫩的胡萝卜叶尖1g,放入准备好的取样袋中,再放在-80℃冰箱中保存,后续使用DNA secure新型植物基因组DNA试剂盒(购自上海生物工程有限公司)提取试验材料的DNA。具体操作步骤参照说明书。DNA提取完成后,对其进行检测,检测DNA的完整性:用琼脂糖凝胶电泳法检测;检测DNA的纯度:用Nanodrop检测;检测DNA的浓度:用Qubit3.0荧光定量仪检测。
3.2.2全基因组重测序
基因组测序工作委托武汉迈特维尔生物科技有限公司完成。利用IlluminaNovaseqTMPE150测序平台,进行全基因组测序,每个样品的测序深度为10X,获得240份材料的序列。
3.2.3测序数据质控
测序得到原始测序数据后,按照以下过滤方法:将含有接头序列的reads pairs去除;去除单端测序中N的含量超过该序列总长度的10%的序列;当单端测序中质量值Q≤5的碱基数超过该条序列总长度的50%时,移除此序列。经过去除低质量序列、接头序列、不准确序列后得到高质量的clean data,进行下一步的序列比对。
3.2.4SNP标记检测
经过质量控制得到的clean reads,需要通过BWA软件比对定位到胡萝卜参考基因组(Daucus carota v2.0)上,利用软件SAMTOOLS对群体SNP进行检测,利用贝叶斯模型来对群体中的多态性位点进行检测,过滤标准为:单样本测序深度>4X;缺失比例<0.2;MAF(最小等位基因频率)>0.05;过滤后得到高质量的SNPs,利用ANNOVAR对这些SNP检测结果进行注释。
3.2.5群体结构与亲缘关系分析
本研究中使用ADMIXTURE进行群体结构分析,分群数K设定为2至18,根据每个K值计算出来的CV error值确定最佳分群数。通过邻接法(neighbor-joining method)构建***进化树。使用GCTA软件对过滤后的SNP进行PCA分析,获得各个样本在各PC中的得分矩阵。取前3个PC的值进行绘图PCA分析。
3.2.6连锁不平衡分析
本研究使用Pop LD decay软件计算群体LD衰减距离(r2)。
3.2.7抽薹性状关联分析
本研究中使用软件GEMMA对混合线性模型(LMM)进行抽薹性状关联分析,将群体遗传结构作为固定效应,个体亲缘关系作为随机效应,已校正群体结构和个体亲缘关系的影响:
y=Xα+Zβ+Wμ+e (5)
y为表型性状,X为固定效应的指示矩阵,α为固定效应的估计参数;Z为SNP的指示矩阵,β为SNP的效应;W为随机效应的只是矩阵,μ为预测的随机个体,e是随机残差,服从使用R语言中qqman程序包绘制曼哈顿图和Q-Q图。
3.2.8候选基因RT-qPCR验证
根据筛选出的目标基因和内参基因tublin设计引物,由诺敏科达公司合成。序列如下:
表5胡萝卜抽薹目标基因RT-qPCR分析引物
RNA提取参照康为试剂,全能型植物RNA提取试剂盒说明书,cDNA合成采用Monad试剂盒和Real Time PCR参照QIAGEN试剂盒说明书。RT-qPCR反应体系如下:
表6
程序如下:
表7
反应结束后通过2-ΔΔCt法计算基因的相对表达量。
3.3结果与分析
3.3.1抽薹性状的BLUE值及统计分析
利用lme4软件对试验材料的抽薹相关性的BLUE值进行计算,使用混合线性模型:将品种(lines)作为固定因子,地点和年限设置为环境(env)作为随机因子,设置混合线性模型y=lmer(BH~lines+(1|env)+(1|lines)+(1|BR:BT)+(1|BT:BH)+(1|BR:BH)+(1|BR:lines)+(1|BH:lines)+(1|BT:lines),data=dat),算出预测均值为BLUE值。对计算出的BLUE值的频率分布情况如图4,可见抽薹性状基本呈正态分布。
2年2点进行试验材料的栽培,降低了误差,提高了准确性。测量的抽薹相关性状分别是抽薹时间(BT)、抽薹率(BR)、薹高(BH)、抽薹速度(BS)4个数量性状。4个抽薹相关性状及BLUE值的数据统计分析结果如表8,结果说明不同材料胡萝卜之间抽薹率差异极大,离散程度最高,稳定性最差,变异性最高,供选择范围最广。BLUE值是降低了环境所带来的误差,其变异系数最小为22.53%。由上述可知,2021年抽薹性状的变异系数均大于2022年的变异系数,说明这些性状受环境影响较大。
各性状的广义遗传力也表现出明显差异,而BLUE值的广义遗传力为100%,说明计算BLUE值的混合线性模型较好,能够消除环境的影响。
表8胡萝卜抽薹性状的年度统计分析
/>
3.3.2抽薹相关性状的相关性分析
相关分析表明,2021年抽薹时间与其他3个抽薹性状均互相呈极显著相关性,而与2022年的4个抽薹性状和BLUE值均无显著相关性。2021年抽薹率与2022年的抽薹性状呈显著正相关,与BLUE值为极显著相关。2022年抽薹率与2021年抽薹时间、薹高、抽薹速度等均无显著性。BLUE值除与2021年的抽薹时间无显著相关外,与其他性状均为极显著相关。除上述情况外,个性状之间均呈极显著相关,说明这几个抽薹性状指标均能用来评价胡萝卜的耐抽薹性。
表9 4组抽薹指标相关系数
**在0.01级别(双尾),相关性显著。*在0.05级别(双尾),相关性显著。
3.3.3抽薹相关性状的聚类分析
对240份胡萝卜资源的4个抽薹相关性状采用Word法进行聚类分析,将其分为四大类群,如图5所示。再根据聚类结果对四个类群的抽薹相关性状进行统计分析(表10)。第1类包括71份材料,两年抽薹率均为0,属于极耐抽薹品种,计算出的BLUE值均为77.27。第2类包括122份材料,其抽薹率、薹高、抽薹速度、BLUE值的平均值大于其他3类材料,说明此类材料抽薹时间短,抽薹率高,抽薹速度快,属于易抽薹材料。第3类有30份材料,其抽薹率较低,小于所有材料的平均值,且BLUE值均为77.27。第4类材料有17份,其抽薹时间最长,抽薹率却较低,属于较易抽薹材料。
表10基于聚类结果的各抽薹相关性状均值
3.3.4DNA样本检测与重测序质量评估
240份胡萝卜种质资源提取的DNA浓度在1.41~109.14ng/μl之间,平均为34.48ng/μl,总量在0.08~6.55μg范围内,平均为2.07μg,表明DNA质量符合重测序的要求。供试材料经IlluminaNovaseqTM重测序后获得原始序列数据(raw data)4608020196bp,原始测序数据质控后统计每个样品的raw reads、clean reads、effective rate、errorrate、Q20、Q30、GC含量,统计结果平均值如表11所示。经过质控后获得4568433023bp的Clean reads,有91.76%的碱基质量值≥30%,说明有91.76%的碱基准确率为99.9%。
表11序列质控结果与质量评估
原始测序数据质控后得到的clean reads与参考基因组在BWA软件中进行序列比对,参考基因组选用胡萝卜Daucus carota v2.0参考基因组,该基因组完整性、连续性较好。统计与参考基因组比对上的序列数目、比对率、测序深度、覆盖度。从表12中可看出质控后94.69%的测序序列能比对到参考基因组上;群体样本平均比对率为94.69%,对基因组(排除gap区)的平均测序深度为9.89X,平均覆盖度为87.74%,说明测序结果良好,较高的比对率、测序深度、覆盖率也为后续变异检测提供了可靠的依据。
表12序列比对结果
3.3.5高质量SNP位点的分布
经重测序240份胡萝卜样本共获得50596401个SNP位点,经过滤筛选后获得19056107个高质量SNP位点,通过ANNOVAR软件对过滤后的SNP位点进行注释,注释结果如表13所示。这些SNP位点将用于240份关联群体的遗传多样性分析以及后续的GWAS分析。
表13SNP检测结果注释
3.3.6群体结构分析
为了明确各亚群分化情况和基因交流情况,利用ADMIXTURE软件对该自然群体进行群体结构划分,亚群数K设置为2到18,推算分群结果。为了确定较为准确的分群数K值,在ADMIXTURE软件中分别计算了K从2到18的错误率CV error,并依据K值的CV error值绘制折线图,最小CV error对应的K值为最佳K值。由下图中不同K值(2-18)对应的CV error值可看出(图6的A),当K=4时,CV error值最小,因此最恰当的亚群数是4,所以将胡萝卜群体分为4个组,分别是第1组(group1,G1)为蓝色、第2组(group2,G2)为绿色、第3组(group3,G3)为粉色、第4组(group4,G4)为浅蓝色。利用样本间基因型差异,在ADMIXTURE软件中设置不同的K值(2-8)模拟分群效果,不同K值群体结构结果如图6的B所示,每个图分别表示不同K值的群体结构,每一列表示一个个体,同一列中不同颜色代表不同的祖先亲缘,而不同的长度是指该亲缘在此个体中所占的比例。结果显示仅少部分个体亲缘来自同一祖先,大多数个体内含有不同祖先亲缘。
使用GCTA软件对高质量的SNP进行主成分分析(PAC),获得各个样本在各PC中的得分矩阵。根据试验材料的来源进行标注,图中一个小形状表示一个样本,同一颜色表示样本属于一个种群。根据三维PC图(图7)结果可知,不同国家和地区的品种交叉分布,没有明显的地理亚群存在,与进化树聚类结果一致。本试验中出现群体分层,可将PCA或structure分析结果作为后续关联分析的协变量(Q矩阵)。
为了进一步确定品种之间的关系,利用软件TreeBeST计算距离矩阵,并将该矩阵作为构建进化树的基础,通过邻接法将1000设置为引导值,从而构建群体***进化树(图8)。可将试验材料主要分为4个组,G4包含了102个胡萝卜品种,是4个组中最大的,其次是G3,包含了55个胡萝卜品种,G1中有49个胡萝卜品种,G2是最小的组,共有34个胡萝卜品种。根据进化树分析确定品种之间的亲缘关系,结合以上群体结构分析的结果,选择K=4时的群体结构矩阵(Q矩阵)结合亲缘关系矩阵(K矩阵)作为后续全基因组关联分析的协变量。
3.3.7连锁不平衡分析
利用1222620个高质量SNP对240份胡萝卜种质群体的LD水平进行分析,通过PLINK软件计算LD水平的度量值r2,并利用Pop LD decay软件绘制LD衰减图,当阈值设为r2=0.1时,240份材料的连锁不平衡衰减距离约为35Kb,如图9所示,LD decay曲线基本没有波动,说明参考基因组组装质量较好本试验所使用的SNP分子标记密度合适。
3.3.8抽薹性状的全基因组关联分析
本研究中以胡萝卜抽薹相关性状作为表型数据,在GEMMA中利用Q+K矩阵作为协变量的混合线性模型进行抽薹性状的GWAS分析,通过关联的显著度(P-value),筛选与抽薹相关的SNPs。抽薹性状的Manhattan图和Q-Q图能够利用R语言进行绘制。
胡萝卜种质资源的抽薹时间(BT)、抽薹率(BR)、薹高(BH)、抽薹速度(BS)等抽薹性状数据与全基因组关联分析后,结果如图10中a所示,其中横坐标为基因组坐标,纵坐标为log10P,P值越小关联性越强,黑色虚线为Bonferroni校正线-lg(1/SNP标记数),在所有SNPs中检测到超过校正线的信号,说明该位点与抽薹相关性状性状显著相关。如QQ plot图所示,期望值与观测值大致相等,说明选用LMM模型进行的GWAS分析的结果较为可靠。
根据图10结果显示,2021年抽薹时间在所有SNPs中检测到2个超过校正线-lg(1/SNP标记数)=5的信号,说明这2个位点与2021年抽薹时间显著相关。且这2个位点分别位于染色体NC_030383.1、NC_030389.1上。且所选的统计模型正确,期望值与观测值大致相等,蓝点大部分分布在红线上,在中途上有蓝点稍微下移,但不影响试验结果。2021年抽薹率的校正线-lg=4.5,有196个SNPs超过校正线,9个染色体上均有分布。由2021年薹高据的GWAS分析结果可知,在所有SNPs中检测到6个超过校正线-lg=5的信号,说明这6个位点与2021年的薹高显著相关,位于染色体NC_030383.1、NC_030384.1、NC_030385.1、NC_030387.1、NC_030389.1上。由图10的D可知在所有SNPs检测中出8个与2021年抽薹速度有显著相关的位点,分别位于染色体NC_030382.1、NC_030384.1、NC_030385.1、NC_030387.1、NC_030389.1上。由A、D中的QQ plot中可知,蓝点基本没有偏离红线,所以选择的LMM进行的GWAS分析结果较好。
如图11所示,2022年胡萝卜抽薹时间与抽薹速度通过全基因组关联分析后,结果表明,当校正线-lg(1/SNP标记数)=5时,在染色体上共检测出36个与2022年胡萝卜抽薹时间显著相关的位点,共检测出11个与抽薹速度相关的位点。与抽薹时间相关的位点分布在基因组坐标NC_030381.1、NC_030382.1、NC_030383.1、NC_030385.1、NC_030386.1、NC_030387.1、NC_030388.1上,与抽薹速度相关的位点分别分布在染色体NC_030381.1、NC_030386.1、NC_030387.1、NC_030389.1。在抽薹率和薹高的GWAS分析结果中可知,以-lg=4.5作为校正线,筛选出与抽薹率显著相关的位点有47个,与薹高显著相关的位点有20个,在9个染色体上均有分布。根据QQ plot结果表明,所选的统计模型正确,期望值与观测值大致相等,说明选用的LMM模型进行GWAS分析的结果较为可靠。
BLUE值与全基因组关联分析,结果如图12中A,Bonferroni校正线-lg(1/SNP标记数)=5,在所有SNPs中检测到18个超过校正线的信号,说明这18个位点与抽薹性状显著相关。且这几个位点分别位于染色体NC_030381.1、NC_030382.1、NC_030383.1、NC_030384.1、NC_030386.1、NC_030387.1、NC_030389.1上。如图12中B所示,期望值与观测值大致相等,说明选用LMM模型进行的GWAS分析的结果较为可靠。
综上所述,利用LMM模型,对表型BLUE值进行全基因组关联分析,对获得的显著相关的SNP位点进行过滤,其中有3个位点上下游没有找到候选基因。对15个显著关联的SNP位点的功能注释信息分析可知,有6个位点位于基因区间,3个位点位于内含子,3个位于外显子同义突变区域,剩下3个位点分别位于基因上游、基因下游和3’端。如表14所示。
表14与BLUE值显著关联的SNP标记
结合抽薹相关性状与BLUE值的显著关联的SNP位点发现,有部分位点的位置相同为同一个SNP,但P-value不相同。其中2021年的抽薹时间与2021年的抽薹速度有4个相同位点,与2021年的抽薹率有两个相同位点,有一个位点在BH、BR和、BS上均有显示。BLUE值与2021、2022年的BH、BS均有一个位点相同的SNP,2022年的抽薹时间、抽薹速度、薹高有一个位点相同的SNP,薹高与抽薹时间有7个,抽薹时间与抽薹速度有5个,抽薹速度与抽薹率有1个,如表15所示。
表15不同抽薹性状相同SNP位点
/>
3.3.9候选基因预测
根据2年抽薹性状的整合数据获得BLUE值GWAS分析后获得178个候选基因,通过功能注释发现有40个基因未被注释,因注释的基因中共找到3个与抽薹相关的候选基因gene-LOC108205243、gene-LOC108215545、gene-LOC108219548(见表16),这3个基因中gene-LOC108205243在BLUE和2022年的抽薹速度中找到。基因gene-LOC108215545的蛋白为丝氨酸/苏氨酸蛋白磷酸酶2A 59kDa调节亚基B'伽马亚型(AtB'伽马),它能通过抑制FLC参与开花时间的调节。gene-LOC108219548蛋白为染色质重塑蛋白EBS(Chromatin remodelingprotein EBS),其注释信息通过参与染色质介导对花起抑制作用并控制调节开花的基因。通过防止高水平的H3乙酰化,在表观遗传学上负调节花整合物FT的表达,从而维持FT位点的无活性染色质构象。
表16胡萝卜抽薹性状的候选基因及功能注释
3.3.10候选基因验证
根据生物信息学和基因功能注释选择与BLUE值关联的3个可能影响胡萝卜的抽薹候选基因,通过对240份胡萝卜资源的抽薹性状调查,选取3个抽薹率呈高中低的品种(品种数量样本及抽薹情况见表17),采用RT-qPCR对上述3个基因进行表达验证。图13结果表明,gene-LOC108205243在21DL-10中的表达量显著高于B227、B228,表达量差异在0.644-5.10之间;21DL-10中gene-LOC108215545的表达量显著高于B227、B228,表达量差异在0.13-2.68之间;gene-LOC108219548在21DL-10中表达量最高,其次是B228,表达量差异在1-1.85之间。gene-LOC108219548与另外2个基因相比其表达量最低,但在B228中该基因的表达量最高。结果显示基因gene-LOC108205243、gene-LOC108215545在3个品种中的表达量与性状表型趋势一致,出现了差异表达,说明这2个基因为胡萝卜抗抽薹相关重要基因。
表17 3种胡萝卜用于抽薹性状RT-qPCR分析的供试材料
以上所述的实施例仅是对本发明的优选方式进行描述,并非对本发明的范围进行限定,在不脱离本发明设计精神的前提下,本领域普通技术人员对本发明的技术方案做出的各种变形和改进,均应落入本发明权利要求书确定的保护范围内。

Claims (8)

1.一种抑制胡萝卜抽薹基因gene-LOC108205243,其特征在于,其核苷酸序列如SEQ IDNO:1所示。
2.一种检测权利要求1所述抑制胡萝卜抽薹基因gene-LOC108205243的引物对,其特征在于,所述引物对的核苷酸序列如SEQ ID NO:3-4所示。
3.一种如权利要求2所述的引物对在制备鉴别胡萝卜抽薹性状的产品中的应用。
4.根据权利要求3所述的应用,其特征在于,所述产品包括试剂或试剂盒。
5.一种如权利要求1所述的抑制胡萝卜抽薹基因gene-LOC108205243在鉴别胡萝卜抽薹性状中的应用。
6.一种鉴别胡萝卜抽薹性状的方法,其特征在于,包括以下步骤:以胡萝卜DNA为待测样本,采用权利要求2所述的引物对进行PCR扩增,根据扩增结果鉴别胡萝卜抽薹性状。
7.根据权利要求6所述的方法,其特征在于,若扩增结果显示扩增产物显著高表达,则胡萝卜为耐抽薹性状;若扩增结果显示扩增产物显著低表达,则胡萝卜为易抽薹性状。
8.一种如权利要求1所述的抑制胡萝卜抽薹基因gene-LOC108205243在胡萝卜分子育种、培育转基因胡萝卜或胡萝卜种质资源改良中的应用。
CN202311142334.8A 2023-09-06 2023-09-06 一种抑制胡萝卜抽薹基因及其应用 Pending CN117165601A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202311142334.8A CN117165601A (zh) 2023-09-06 2023-09-06 一种抑制胡萝卜抽薹基因及其应用

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202311142334.8A CN117165601A (zh) 2023-09-06 2023-09-06 一种抑制胡萝卜抽薹基因及其应用

Publications (1)

Publication Number Publication Date
CN117165601A true CN117165601A (zh) 2023-12-05

Family

ID=88929513

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202311142334.8A Pending CN117165601A (zh) 2023-09-06 2023-09-06 一种抑制胡萝卜抽薹基因及其应用

Country Status (1)

Country Link
CN (1) CN117165601A (zh)

Similar Documents

Publication Publication Date Title
Pavan et al. Genotyping-by-sequencing of a melon (Cucumis melo L.) germplasm collection from a secondary center of diversity highlights patterns of genetic variation and genomic features of different gene pools
Wei et al. Rapid identification of fruit length loci in cucumber (Cucumis sativus L.) using next-generation sequencing (NGS)-based QTL analysis
Mandozai et al. Genome-wide association study of root and shoot related traits in spring soybean (Glycine max L.) at seedling stages using SLAF-seq
AU2019303422B2 (en) Genes and SNP markers associated with lint percentage trait in cotton, and use thereof
CN105238866B (zh) 一个与陆地棉早熟性状相关的snp位点及其应用
CN113046467B (zh) 一组与小麦条锈病抗性显著关联的snp位点及其在遗传育种中的应用
Liao et al. Genetic basis of vascular bundle variations in rice revealed by genome-wide association study
Bhandari et al. Genetic architecture of fresh-market tomato yield
CN113421612A (zh) 玉米收获期籽粒含水量预测模型、其构建方法和相关snp分子标记组合
CN111088389B (zh) 玉米叶宽紧密连锁的ssr分子标记及其扩增引物和应用
Bentley et al. Linkage mapping and QTL analysis of pecan (Carya illinoinensis) full-siblings using genotyping-by-sequencing
CN108456740A (zh) 一个水稻稻瘟病抗性位点‘Pi-jx’及其Indel标记引物和育种应用
CN109055593B (zh) 提高棉花衣分的snp标记以及高产棉的鉴定和育种方法
CN105907755A (zh) 与辣椒抗黄瓜花叶病毒紧密连锁的分子标记及其应用
CN115786567A (zh) 一种具有半显性的玉米矮化相关分子标记及其应用
CN117165601A (zh) 一种抑制胡萝卜抽薹基因及其应用
CN117230081A (zh) 一种胡萝卜抽薹相关性状基因及其应用
CN113197089A (zh) 一种便于早代选择软质弱筋小麦的育种方法
CN115948591B (zh) 一种鉴定玉米苗期耐旱性相关的单体型ZmC10.HapDR及其应用
CN117683938B (zh) 与番茄果实宽度紧密连锁的kasp分子标记及其应用
CN116240307B (zh) 一种用于花生高产育种鉴定的分子标记及应用
Cao et al. Discovery of a key gene associated with fruit maturity date and analysis of its regulatory pathway in peach
CN116926230B (zh) 一种与棉花纤维长度相关的分子标记及其应用
Wang et al. QTL localisation of seed-related traits in Tibetan hulless barley based on a high-density single-nucleotide polymorphism genetic map.
CN116855621A (zh) 玉米根毛长度相关的snp标记及其应用

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination