CN115305289A - 一种整合snp点集先验信息的鸡腹脂率降低的基因组选择方法 - Google Patents

一种整合snp点集先验信息的鸡腹脂率降低的基因组选择方法 Download PDF

Info

Publication number
CN115305289A
CN115305289A CN202210789308.3A CN202210789308A CN115305289A CN 115305289 A CN115305289 A CN 115305289A CN 202210789308 A CN202210789308 A CN 202210789308A CN 115305289 A CN115305289 A CN 115305289A
Authority
CN
China
Prior art keywords
snp
breeding
matrix
abdominal fat
genome
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202210789308.3A
Other languages
English (en)
Other versions
CN115305289B (zh
Inventor
崔焕先
郑麦青
文杰
赵桂苹
王一东
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Institute of Animal Science of CAAS
Original Assignee
Institute of Animal Science of CAAS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Institute of Animal Science of CAAS filed Critical Institute of Animal Science of CAAS
Priority to CN202210789308.3A priority Critical patent/CN115305289B/zh
Publication of CN115305289A publication Critical patent/CN115305289A/zh
Application granted granted Critical
Publication of CN115305289B publication Critical patent/CN115305289B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6888Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for detection or identification of organisms
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6806Preparing nucleic acids for analysis, e.g. for polymerase chain reaction [PCR] assay
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • G16B20/20Allele or variant detection, e.g. single nucleotide polymorphism [SNP] detection
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B40/00ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/124Animal traits, i.e. production traits, including athletic performance or the like
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/156Polymorphic or mutational markers
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P60/00Technologies relating to agriculture, livestock or agroalimentary industries
    • Y02P60/80Food processing, e.g. use of renewable energies or variable speed drives in handling, conveying or stacking
    • Y02P60/87Re-use of by-products of food processing for fodder production

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Physics & Mathematics (AREA)
  • Organic Chemistry (AREA)
  • Analytical Chemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biophysics (AREA)
  • Biotechnology (AREA)
  • General Health & Medical Sciences (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Genetics & Genomics (AREA)
  • Medical Informatics (AREA)
  • Molecular Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Microbiology (AREA)
  • Immunology (AREA)
  • Theoretical Computer Science (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Biochemistry (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Biology (AREA)
  • Bioethics (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Epidemiology (AREA)
  • Evolutionary Computation (AREA)
  • Public Health (AREA)
  • Software Systems (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本发明公开一种整合SNP点集先验信息的鸡腹脂率降低的基因组选择方法。本发明利用“京芯一号”55K基因组芯片,通过全基因组关联分析和选择准确性验证分析,最终挖掘到与鸡腹脂率性状相关的8647个SNP可作为先验信息加入到育种值估计模型中,预测准确性可提升2.57%。

Description

一种整合SNP点集先验信息的鸡腹脂率降低的基因组选择 方法
技术领域
本发明涉及分子育种技术领域,更具体地,涉及一组影响鸡的腹脂率的SNP点集及其基因组选择方法的应用。
背景技术
我国肉鸡年出栏105亿只,产肉量1580万吨。鸡肉是世界第一、中国第二大肉类产品。鸡腹脂蓄积过多已成为一个突出问题,腹脂的大量沉积会降低饲料转化效率和分割肉的产量并成为屠宰后的废弃物污染环境。低腹脂是世界范围内肉鸡育种领域的一个重要目标。
随着单核苷酸多态性(Single Nucleotide Polymorphism,SNP)等分子标记的开发与应用,将部分功能验证的候选标记联合BLUP计算育种值的分子标记辅助选择不仅可以提高选择准确性,还可以实现早期选择,缩短世代间隔。但是大多数畜禽的经济性状都是受到微效多基因控制的数量性状,获取具有大效应的变异位点较为困难,这也是分子标记辅助选择存在的局限。
全基因组SNP变异检测是开展基因组育种(Genomic selection,GS)和准确度量群体遗传多样性的基础。继国外开发出60K和600K鸡SNP芯片后,中国农业科学院北京畜牧兽医研究所等单位,针对国产化鸡育种和地方种质资源保护的现状和需求,自主研发出了“京芯一号”55K SNP高性价比的商业化检测芯片(参见中国专利:201780023241.X)。芯片特点包括:①包含中国地方鸡种特有遗传变异信息,兼顾国外商业化鸡种基因组信息;②整合大量的功能基因相关SNP位点;③在基因组上均匀分布;④密度适中,性价比高等。应用实践证明,鸡基因组SNP芯片在基因组选择育种、种质资源多样性分析、亲缘关系鉴定、基因组关联研究、基因定位等方面可发挥重要作用。
基因组选择方法主要包括以GBLUP为代表的直接法和以贝叶斯类方法为代表的间接法。间接法虽有计算准确性较高的优势,但是计算时间长,占用计算资源大的问题导致其在生产中的应用受限。而GBLUP凭借计算时间短,使用简单的优势广泛应用在猪、牛、羊、鸡等畜禽的实际选育当中。
在GBLUP模型中,默认所有的SNP位点对性状均有效应且效应相同,这一假设显然是不合理的。因此GBLUP方法存在一定的改进空间。有学者将较大效应的QTL作为固定效应,剩余标记作为随机效应加入到模型中,这一策略可以提升预测准确性,但是对于数量性状选择出效应较大的QTL存在一定困难。也有学者提出基因组特征BLUP、BayesRC等可以整合生物学先验信息的GS方法。对基因组关系矩阵进行优化,构建性状特异关系矩阵,即TABLUP,其基于间接法Bayes及rrBLUP方法给所有标记分配不同的权重,相较于GBLUP有显著的提升,但是BayesB计算时间较长、复杂程度高,预测准确性较高,基于BayesB提升GBLUP的准确性意义不大。基于rrBLUP计算每个标记的效应值,并按照绝对值大小进行排序,分别构建两个不同的矩阵并相加,显著提升了预测准确性。同时,使用全基因组关联分析对标记分配权重也能提高预测准确性。
全基因组关联分析(Genome Wide Association Study,GWAS)作为挖掘畜禽经济性状候选位点的重要手段,是基因组水平上最常用的先验信息获取方式。在人类复杂性状、畜禽重要经济性状以及模拟数据的研究结果中均表明,整合GWAS先验信息可以提高GS的准确性。先验信息的获取群体与验证群体应为不同群体,避免造成假阳性的结果,本专利使用金陵花鸡1至3世代作为先验信息获取群体,使用4世代作为先验信息验证群体。
在数量遗传学中,数量性状是指受到效应微小数量众多的基因调控的性状,其遗传力较低,难以定位到效应较大的QTL。畜禽中大多数的经济性状均属于数量性状,肉鸡的腹脂率性状也属于数量性状。因此在GWAS结果中很少定位到影响显著的SNP位点。故提取P值最显著的SNP合集作为先验信息加入到基因组选择模型。
基于“京芯一号”55K基因检测芯片,对腹脂率性状的选育效果进一步提升,优化芯片基因分型的使用策略。常规育种值计算默认芯片中所获得的基因组位点均具有相同的作用,通过全基因组关联分析可获取与腹脂率表型相关的SNP,对获取到显著相关的SNP位点作为先验信息进行加权使用,可提升育种值计算的准确性。
发明内容
本发明的目的是基于“京芯一号”55K基因组芯片,进行全基因组关联分析获取最佳SNP位点集合,作为先验信息加入到育种值计算模型,应用于鸡低腹脂率基因组选育,提升鸡腹脂率选育进展。
针对育种和生产实践需求,以快大型黄羽肉鸡为素材,通过腹脂表型和全基因组SNP测定,筛选并获得显著影响黄羽肉鸡腹脂率的SNP位点集。通过在GBLUP方法估计中增加显著SNP权重的方法,提高育种值估计的准确性。为实现腹脂率的早期选择和性状相关等位基因的快速纯和,加快遗传选择进展提供技术支撑。
具体地,本发明的技术方案如下:
本发明提供一种利用整合分子标记进行低腹脂率基因组选择的方法,其特征在于,包括:
1、参考群个体选择:
根据半同胞家系选择,均匀覆盖每家系个体,防止参考群亲缘关系过近;
2、血液采集与保存:
采集翅静脉抗凝血,-20℃保存备用;或将翅静脉抗凝血直接均匀涂抹在血卡上,待其晾干后,干燥环境保存备用。
3、DNA提取:
采用磁珠法提取血卡DNA,用75%酒精消毒后的剪刀剪取用量合适5mm的血斑卡片放入对应编号的2.0ml裂解管中,每取一个样本都需用75%酒精擦拭剪刀;
4、琼脂糖凝胶电泳检测gDNA完整性
电泳:加6.5μL的1×Lodding buffer至一次性凝胶板里,并加入相应体积的DNA溶液。将点胶板的液体转移至0.8%琼脂糖凝胶的胶孔里,加液完成后,设置电泳参数为170V、14min、400mA,进行电泳。
5、基因分型
基于Illumina测序平台使用“京芯一号”鸡55K基因组芯片进行基因型检测。
6、基因型质控与填充
使用PLINK v1.9软件对数据进行质量控制处理,质控标准为:位点检出率大于0.90;最小等位基因频率(MAF)大于0.05;个体检出率大于0.90,缺失的SNP使用Beaglev5.0软件进行填充。
本发明的有益效果在于:
本发明采用鸡腹脂率性状改良分子育种技术,涉及整合利用SNP分子标记的基因组选择方法,通过选育降低腹脂率。
利用本发明中全基因组关联分析结果top25%(8647个)SNP进行整合的基因组选择法对腹脂率进行选择,相比常规不对top25%(8647个)SNP设置权重的GEBV估计结果,能够显著提高预测准确性。top25%SNP构建G矩阵后与常规G矩阵的最优权重比是0.49:0.51,GBLUP的方法预测准确性提高2.57%
通过本发明进行低腹脂率选育,节省生产中的饲养成本,减少生产屠宰浪费,对肉鸡的生产选育具有重大的指导意义。
附图说明
图1基于测定的AFP性状,将1-3个世代进行GWAS分析,获得的曼哈顿图。
图2GWAS分析获得的QQ图
具体实施方式
实施例1:通过全基因组关联分析获取低腹脂率选取的先验信息
1、全基因组关联分析(GWAS)获得不同染色体上存在与腹脂率(AFP)显著相关的SNP标记。
试验动物和目标性状的测定:
本发明使用金陵花鸡E系1-3世代群体为素材,以56日龄腹脂率为目标性状,进行GWAS分析;
表型数据测定计算腹脂率(AFP)公式如下:
腹脂率=腹脂重/全净膛重*100,其中全净膛是在肉鸡宰杀之后,放血、脱毛,并去除气管、食管、嗉囊、肠、脾脏、胰腺、心脏、肝脏、腺胃、肌胃、腹脂和生殖器官。
腹脂率表型描述性统计
Figure BDA0003733182340000041
基因型数据合并与质控:
将金陵花鸡E系1-3世代基因型数据使用PLINK v1.9软件常规方法对基因型数控进行合并,合并后使用PLINK v1.9软件对数据进行质量控制处理,质控标准为:位点检出率大于0.90;最小等位基因频率(MAF)大于0.05;个体检出率大于0.90,缺失的SNP使用Beaglev5.0软件进行填充,最终保留35337个位点。
将试验群体1-3世代作为先验标记信息发现群体,用于GWAS分析。所用模型为混合线性模型(LMM),具体为:
y=Xα+Zp+Wμ+e#
其中,y为研究的性状,即AFP,Xα为固定效应(Fixed Effect),影响y的其他因素,主要指群体结构;Zβ为标记效应(Marker Effect SNP);Wμ为随机效应(RandomEffect),这里一般指个体的亲缘关系;e为残差。将每个SNP作为固定因子进行回归分析,进行显著性检验,获取每一个SNP的P值,并分别提取P值较小的top 5%、top 10%、top 15%、top 20%、top 25%、top 30%的SNP位点作为4世代的先验标记信息。
全基因组关联分析结果:
基于测定的AFP性状,将1-3个世代进行GWAS分析,并绘制曼哈顿图(图1)。获取最显著的top 5%、top 10%、top 15%、top 20%、top 25%、top 30%的SNP位点作为4世代的先验标记信息。
实施例2:利用整合不同梯度SNP标记进行黄羽肉鸡腹脂率的基因组选择效果评估
本实施例中,基因组选择的目标性状为AFP。对金陵花鸡4世代鸡只采血保存,提取DNA,采用55K SNP芯片进行全基因组SNP分型,提取全基因组关联分析结果中不同梯度先验信息,分别构建亲缘关系矩阵,给予不同的权重拟合为新的权重矩阵。采用5倍交叉验证法获取准确性,即将GS分析群体随机分为5组,其中4组合并为参考群,剩下一组作为验证群,将得到的基因组育种值与表型值的皮尔逊相关系数除以遗传力开方作为预测准确性,最后将重复10次得到的均值作为评价预测准确性的标准。比较不同梯度先验信息加权的预测准确性,获取预测准确性更高的SNP点集用于腹脂率GEBV计算,为腹脂率的选育提供理论与技术支持。
性状表型统计,结果如实施例1
采用55K SNP芯片进行全基因组分型及基因标记质控
采用常用标准进行全基因组SNP的质量控制:位点检出率大于0.90;最小等位基因频率(MAF)大于0.05;个体检出率大于0.90,缺失的SNP使用Beagle v5.0软件进行填充,最终保留34916个位点,确保统计准确率和有效性。
权重G矩阵构建
结合GWAS先验信息的GS所用的亲缘关系矩阵构建方式如下,使用GWAS结果中的先验标记信息构建亲缘关系矩阵G1,剩余的位点构建亲缘关系矩阵G2,分别计算G1和G2对腹脂率解释的遗传方差和遗传力,并以解释遗传方差的比例为权重拟合出亲缘关系矩阵Gt
Gt=λG1+(1-λ)G2#
其中
Figure BDA0003733182340000051
为G1矩阵遗传方差,
Figure BDA0003733182340000052
为G2矩阵的遗传方差。使用亲缘关系矩阵G和结合不同先验标记信息的亲缘关系矩阵Gt进行GS分析,并比较不同方法计算腹脂率的遗传参数和预测准确性结果。
遗传参数和预测准确性结果:
使用4世代基因型构建亲缘关系G矩阵计算的遗传方差和环境方差分别为0.336和0.261,计算遗传力为0.563。五倍交叉验证的预测准确性结果为0.364。
筛选最显著的top 5%的SNP位点构建亲缘关系矩阵G1,计算得到的遗传方差和环境方差分别为0.240和0.356,遗传力为0.402,预测准确性为0.327;剩余95%的SNP构建矩阵G2,解释的遗传方差和环境方差分别为0.329和0.268,遗传力为0.552,预测准确性为0.361。计算G1权重为0.42,G2权重为0.58。使用结合GWAS先验标记信息的亲缘关系矩阵Gt计算遗传方差和环境方差分别为0.333和0.265,计算遗传力为0.557,预测准确性为0.365,准确性提升0.41%。
筛选最显著的top 10%的SNP位点构建亲缘关系矩阵G1,计算得到的遗传方差和环境方差分别为0.274和0.322,遗传力为0.460,预测准确性为0.353;剩余90%的SNP构建矩阵G2,解释的遗传方差和环境方差分别为0.329和0.268,遗传力为0.550,预测准确性为0.360。计算G1权重为0.45,G2权重为0.55。使用结合GWAS先验标记信息的亲缘关系矩阵Gt计算遗传方差和环境方差分别为0.333和0.264,计算遗传力为0.558,预测准确性为0.367,准确性提升0.95%。
筛选最显著的top 15%的SNP位点构建亲缘关系矩阵G1,计算得到的遗传方差和环境方差分别为0.298和0.297,遗传力为0.501,预测准确性为0.361;剩余85%的SNP构建矩阵G2,解释的遗传方差和环境方差分别为0.324和0.273,遗传力为0.543,预测准确性为0.359。计算G1权重为0.48,G2权重为0.52。使用结合GWAS先验标记信息的亲缘关系矩阵Gt计算遗传方差和环境方差分别为0.340和0.257,计算遗传力为0.569,预测准确性为0.369,准确性提升1.30%。
筛选最显著的top 20%的SNP位点构建亲缘关系矩阵G1,计算得到的遗传方差和环境方差分别为0.309和0.285,遗传力为0.521,预测准确性为0.370;剩余80%的SNP构建矩阵G2,解释的遗传方差和环境方差分别为0.320和0.277,遗传力为0.536,预测准确性为0.355。计算G1权重为0.49,G2权重为0.51。使用结合GWAS先验标记信息的亲缘关系矩阵Gt计算遗传方差和环境方差分别为0.342和0.255,计算遗传力为0.572,预测准确性为0.371,准确性提升2.01%。
筛选最显著的top 25%的SNP位点构建亲缘关系矩阵G1,计算得到的遗传方差和环境方差分别为0.324和0.271,遗传力为0.545,预测准确性为0.377;剩余75%的SNP构建矩阵G2,解释的遗传方差和环境方差分别为0.312和0.284,遗传力为0.524,预测准确性为0.350。计算G1权重为0.49,G2权重为0.51。使用结合GWAS先验标记信息的亲缘关系矩阵Gt计算遗传方差和环境方差分别为0.346和0.252,计算遗传力为0.578,预测准确性为0.373,准确性提升2.57%。
筛选最显著的top 30%的SNP位点构建亲缘关系矩阵G1,计算得到的遗传方差和环境方差分别为0.324和0.272,遗传力为0.544,预测准确性为0.368;剩余70%的SNP构建矩阵G2,解释的遗传方差和环境方差分别为0.312和0.284,遗传力为0.524,预测准确性为0.351。计算G1权重为0.49,G2权重为0.51。使用结合GWAS先验标记信息的亲缘关系矩阵Gt计算遗传方差和环境方差分别为0.342和0.255,计算遗传力为0.573,预测准确性为0.369,准确性提升1.33%。
遗传参数
Figure BDA0003733182340000071
注:G为所有SNP构建的亲缘关系矩阵;G1为先验标记信息构建的亲缘关系矩阵;G2为除先验标记以外的SNP构建的亲缘关系矩阵;Gt为G1和G2根据遗传方差结合后的矩阵
通过比较加入不同数量先验信息的预测准确性结果,发现使用top25%SNP作为先验信息(见文末附表表1)加入GS模型对预测准确性的提升最显著,相比常规不对先验信息SNP标记设置权重的GEBV估计准确性得到提升。对于腹脂率,top25%SNP构建G矩阵后与常规G矩阵的最优权重比是0.49:0.51,GBLUP的方法预测准确性提高2.57%。
实施例3:利用整合显著SNP作为先验信息进行低腹脂率基因组选择的育种方法
(1)参考群体的建立,表型性状测定和基因型测定
每个品系建立独立的参考群,参考群的来源要求覆盖到品系已有的全部家系。
当参考群鸡饲养接近其商品鸡上市日龄时,组建1500-2000只鸡的群体作为参考群体。
参考群有明确的表型记录、系谱记录
对确定构建参考群的个体进行翅静脉抗凝血采集,-20℃环境或使用血卡进行血液样品保存,使用磁珠法提取血液DNA,用于个体基因型检测
使用“京芯一号”鸡55K SNP商业化芯片(参见中国专利:201780023241.X)进行基因分型,获取参考群个体基因型信息。并对基因分型后的数据进行处理和质量控制;质控标准为:位点检出率大于0.90;最小等位基因频率(MAF)大于0.05;个体检出率大于0.90,缺失的SNP使用Beagle v5.0软件进行填充。用于下一步育种值的估计。
参考群个体进行屠宰,获取参考群表型信息,屠宰测定腹脂重、全净膛重表型,计算腹脂率,腹脂率计算公式为:腹脂率=腹脂重/全净膛重*100,其中全净膛是在肉鸡宰杀之后,放血、脱毛,并去除气管、食管、嗉囊、肠、脾脏、胰腺、心脏、肝脏、腺胃、肌胃、腹脂和生殖器官。
(2)待测群体的建立与全基因组基因型采集
待测群是指没有表型性状记录,且准备用于繁育下一代的候选种鸡群。
待测群要求与参考群具有5个世代以内的亲缘关系。
待测群在不影响鸡成活率和生长发育的前提下,应尽早采集血液样本,提取DNA,使用“京芯一号”鸡55K SNP商业化芯片进行基因分型,获取待测群个体基因型信息。并对基因分型后的数据进行处理和质量控制;质控标准为:位点检出率大于0.90;最小等位基因频率(MAF)大于0.05;个体检出率大于0.90,缺失的SNP使用Beagle v5.0软件进行填充。
(3)拟合加权矩阵进行参考群和候选群个体的育种值计算
育种值计算需利用参考群和所有待留种个体的系谱记录
参考群个体的腹脂率表型值和全基因组SNP位点的基因型信息,获取方式见步骤(1)
待测群体个体的全基因组SNP基因型信息,获取方式见步骤(2)
先验信息获取:
通过全基因组关联分析,获取显著性高的SNP位点作为先验信息,本专利使用金陵花鸡1至3世代进行全基因组关联分析,挖掘低腹脂率选育的先验信息
先验信息验证:
将全基因组关联分析获取到的显著位点加入基因组选育模型进行验证位点效果,验证群体应避免与先验信息获取群体为同一群体,避免假阳性的结果产生,本专利使用金陵花鸡4世代作为先验信息验证群体,验证结果表明使用全基因组关联分析结果top25%(8647)SNP作为先验信息加入基因组选育模型可提升选择准确性,选择准确性提升2.57%。
A矩阵构建:
A矩阵构建为常用方法,基于系谱信息构建的个体间亲缘关系矩阵
权重G矩阵构建:
根据全基因组关联分析结果提取显著性高的SNP标记作为先验信息构建权重亲缘关系矩阵,G1代表基于8647个分子标记构建的亲缘关系矩阵,G2代表基于鸡全基因组SNP芯片构建的基因组亲缘关系矩阵,c为G1亲缘关系矩阵权重,d为G2亲缘关系矩阵权重,权重通过G1和G2分别计算腹脂率遗传方差的比值进行设置
设置G1和G2的相对权重公式为:
Gt=c*G1+d*G2
公式中,Gt代表权重G矩阵,c=0.49,d=0.51;
H矩阵构建:
H矩阵构建为常用方法,将基于系谱构建的A矩阵和基于基因型信息构建的G矩阵进行拟合生成H矩阵,使用R软件中asreml包进行育种值计算
(4)鸡低腹脂品系的选择方法
根据结合先验信息构建的权重矩阵计算的育种值进行选择,对候选留种群体的育种值进行评估和排序,进行低腹脂率品系选育目的为降低个体腹脂率,应选择育种值低的候选群体个体作为亲本,一般公鸡选择100~500,母鸡选择1000~2000,留种组建家系。
附表1 top25%SNP先验信息
Figure BDA0003733182340000101
Figure BDA0003733182340000111
Figure BDA0003733182340000121
Figure BDA0003733182340000131
Figure BDA0003733182340000141
Figure BDA0003733182340000151
Figure BDA0003733182340000161
Figure BDA0003733182340000171
Figure BDA0003733182340000181
Figure BDA0003733182340000191
Figure BDA0003733182340000201
Figure BDA0003733182340000211
Figure BDA0003733182340000221
Figure BDA0003733182340000231
Figure BDA0003733182340000241
Figure BDA0003733182340000251
Figure BDA0003733182340000261
Figure BDA0003733182340000271
Figure BDA0003733182340000281
Figure BDA0003733182340000291
Figure BDA0003733182340000301
Figure BDA0003733182340000311
Figure BDA0003733182340000321
Figure BDA0003733182340000331
Figure BDA0003733182340000341
Figure BDA0003733182340000351
Figure BDA0003733182340000361
Figure BDA0003733182340000371
Figure BDA0003733182340000381
Figure BDA0003733182340000391
Figure BDA0003733182340000401
Figure BDA0003733182340000411
Figure BDA0003733182340000421
Figure BDA0003733182340000431
Figure BDA0003733182340000441
Figure BDA0003733182340000451

Claims (9)

1.一种基于现有鸡55K芯片的整合SNP点集先验信息提升选择准确性来降低鸡腹脂率的基因组选择方法,其特征在于所述方法包括如下步骤:
1)对4世代群体样本采血保存,提取DNA,采用55K SNP芯片进行全基因组SNP分型,提取全基因组关联分析结果中不同梯度先验信息,分别构建亲缘关系矩阵,给予不同的权重拟合为新的权重矩阵;
2)采用5倍交叉验证法获取准确性,即将GS分析群体随机分为5组,其中4组合并为参考群,剩下一组作为验证群,将得到的基因组育种值与表型值的皮尔逊相关系数除以遗传力开方作为预测准确性,最后将重复10次得到的均值作为评价预测准确性的标准;
3)比较不同梯度先验信息加权的预测准确性,获取预测准确性更高的SNP点集用于腹脂率GEBV计算,根据结合先验信息构建的权重矩阵计算的育种值进行选择,对候选留种群体的育种值进行评估和排序,进行低腹脂率品系选育。
2.如权利要求1所述的方法,其中步骤1中先验信息的获取方法包括如下步骤:
1)参考群个体选择:针对样本1-3世代群体,根据半同胞家系选择,均匀覆盖每家系个体,防止参考群亲缘关系过近;
2)血液采集与保存:采集翅静脉抗凝血,-20℃保存备用;或将翅静脉抗凝血直接均匀涂抹在血卡上,待其晾干后,干燥环境保存备用;
3)DNA提取:采用磁珠法提取血卡DNA,用75%酒精消毒后的剪刀剪取用量合适5mm的血斑卡片放入对应编号的2.0ml裂解管中,每取一个样本都需用75%酒精擦拭剪刀;
4)琼脂糖凝胶电泳检测gDNA完整性;
5)电泳:加6.5μL的1×Lodding buffer至一次性凝胶板里,按照点胶位置表向对应的孔位置加入相应体积的DNA溶液;将点胶板的液体转移至0.8%的胶孔里,加液完成后确认电泳仪是否是170V、14min、400mA,确认无误后,进行电泳。
6)基因分型:基于Illumina测序平台使用“京芯一号”鸡55K基因组芯片进行基因型检测;
7)基因型质控与填充:使用PLINK v1.9软件对数据进行质量控制处理,质控标准为:位点检出率大于0.90;最小等位基因频率(MAF)大于0.05;个体检出率大于0.90,缺失的SNP使用Beagle v5.0软件进行填充;
8)利用GWAS分析方法进行数据分析,所用模型为混合线性模型(LMM):
y=Xα+Zβ+Wμ+e#
其中,y为研究的性状,即AFP,Xα为固定效应(Fixed Effect),影响y的其他因素,主要指群体结构;Zβ为标记效应(Marker Effect SNP);Wμ为随机效应(RandomEffect),这里一般指个体的亲缘关系;e为残差。将每个SNP作为固定因子进行回归分析,进行显著性检验,获取每一个SNP的P值,并分别提取P值较小的top 5%、top 10%、top 15%、top 20%、top25%、top 30%的SNP位点作为4世代的先验标记信息。
3.如权利要求2所述的方法,其中亲缘关系矩阵的构建方式如下,使用上述先验标记信息构建亲缘关系矩阵G1,剩余的位点构建亲缘关系矩阵G2,分别计算G1和G2对腹脂率解释的遗传方差和遗传力,并以解释遗传方差的比例为权重拟合出亲缘关系矩阵Gt
Gt=λG1+(1-λ)G2#
其中
Figure FDA0003733182330000021
Figure FDA0003733182330000022
为G1矩阵遗传方差,
Figure FDA0003733182330000023
为G2矩阵的遗传方差。
4.如权利要求3所述的方法,其中,选择top25%SNP作为先验信息加入GS模型,对于腹脂率,top25%SNP构建G矩阵后与常规G矩阵的最优权重比是0.49∶0.51,GBLUP的方法预测准确性提高2.57%。
5.如权利要求1和2所述的方法,其特征在于,基于商业化鸡基因组育种芯片优化使用策略,提供了一种提升具体性状选育效果的基因组选择方法。
6.如权利要求2所述的方法在鸡育种中的应用,其特征在于,所述鸡群体包括肉鸡和蛋鸡。
7.如权利要求6所述在鸡育种中的应用,其特征在于,提供的方法策略所适用的性状不局限于鸡的腹脂率,同样使用于鸡的其他数量性状。
8.如权利要求6所述在鸡育种中的应用,其特征在于,提供的方法策略所适用的性状,数量上既可以一个具体的数量性状,也可以是对两个性状的平衡选育使用。
9.如权利要求4所述的方法,其中所使用的先验信息如说明书附表1所示。
CN202210789308.3A 2022-07-06 2022-07-06 一种整合snp点集先验信息的鸡腹脂率降低的基因组选择方法 Active CN115305289B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210789308.3A CN115305289B (zh) 2022-07-06 2022-07-06 一种整合snp点集先验信息的鸡腹脂率降低的基因组选择方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210789308.3A CN115305289B (zh) 2022-07-06 2022-07-06 一种整合snp点集先验信息的鸡腹脂率降低的基因组选择方法

Publications (2)

Publication Number Publication Date
CN115305289A true CN115305289A (zh) 2022-11-08
CN115305289B CN115305289B (zh) 2024-06-04

Family

ID=83856058

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210789308.3A Active CN115305289B (zh) 2022-07-06 2022-07-06 一种整合snp点集先验信息的鸡腹脂率降低的基因组选择方法

Country Status (1)

Country Link
CN (1) CN115305289B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN118136103A (zh) * 2024-05-08 2024-06-04 中国农业科学院北京畜牧兽医研究所 一种整合snp点集先验信息的鸡肌内脂肪与腹脂的基因组平衡选育方法及其生物基因芯片

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110867208A (zh) * 2019-11-29 2020-03-06 中国科学院海洋研究所 一种提高水产动物全基因组选择育种效率的方法
CN111225986A (zh) * 2017-10-10 2020-06-02 中国农业科学院北京畜牧兽医研究所 一种鸡全基因组snp芯片及其应用
CN112226516A (zh) * 2020-07-15 2021-01-15 华南农业大学 一种影响鸡的腹脂率的分子标记及其应用
CN112266965A (zh) * 2020-10-10 2021-01-26 中国农业科学院北京畜牧兽医研究所 一种提高黄羽肉鸡剩余采食量遗传进展的基因组选择方法
CN113699250A (zh) * 2021-08-13 2021-11-26 中国农业科学院北京畜牧兽医研究所 与肉鸡饲料转化效率性状相关的分子标记及其应用

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111225986A (zh) * 2017-10-10 2020-06-02 中国农业科学院北京畜牧兽医研究所 一种鸡全基因组snp芯片及其应用
CN110867208A (zh) * 2019-11-29 2020-03-06 中国科学院海洋研究所 一种提高水产动物全基因组选择育种效率的方法
CN112226516A (zh) * 2020-07-15 2021-01-15 华南农业大学 一种影响鸡的腹脂率的分子标记及其应用
CN112266965A (zh) * 2020-10-10 2021-01-26 中国农业科学院北京畜牧兽医研究所 一种提高黄羽肉鸡剩余采食量遗传进展的基因组选择方法
CN113699250A (zh) * 2021-08-13 2021-11-26 中国农业科学院北京畜牧兽医研究所 与肉鸡饲料转化效率性状相关的分子标记及其应用

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
朱军: "遗传学 第3版", 31 January 2002, 北京:中国农业出版社, pages: 326 - 327 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN118136103A (zh) * 2024-05-08 2024-06-04 中国农业科学院北京畜牧兽医研究所 一种整合snp点集先验信息的鸡肌内脂肪与腹脂的基因组平衡选育方法及其生物基因芯片
CN118136103B (zh) * 2024-05-08 2024-07-12 中国农业科学院北京畜牧兽医研究所 一种整合snp点集先验信息的鸡肌内脂肪与腹脂的基因组平衡选育方法及其生物基因芯片

Also Published As

Publication number Publication date
CN115305289B (zh) 2024-06-04

Similar Documents

Publication Publication Date Title
CN114480673B (zh) 一种基于靶向捕获测序的鸡低密度snp液相芯片及其应用
CN110218798B (zh) 位于猪7号染色体上与眼肌面积、眼肌厚度相关的snp分子标记及应用
CN107365853B (zh) 一种影响猪有效总***数性状的分子标记及应用
CN110117665A (zh) 位于猪16号染色体上与猪瘦肉率和眼肌面积相关的snp分子标记及应用
CN108728552A (zh) 一种影响杜洛克猪眼肌面积性状的分子标记及应用
CN112002371A (zh) 一种白羽肉鸡剩余采食量的基因组选择方法
EP3882360B1 (en) Genomic selection method of huaxi cattle
CN114921561B (zh) 杜洛克猪全基因组低密度snp芯片及其制备方法和应用
CN110106255A (zh) 位于猪7号染色体上与杜洛克猪日增重性状相关的分子标记及应用
CN116516029A (zh) 一种金鲳全基因组育种芯片及应用
CN115305289B (zh) 一种整合snp点集先验信息的鸡腹脂率降低的基因组选择方法
CN104862388B (zh) 与猪有效***对数性状相关的snp分子标记及应用
CN110144408A (zh) 位于猪7号染色体上与总***数相关的snp分子标记及应用
CN110273006A (zh) 一种公猪有效***数相关的分子遗传标记
CN113549699A (zh) 一种白羽肉鸡产蛋数的基因组选择方法
CN112980962B (zh) 一种与猪初生重性状相关的snp标记及应用
US20240043912A1 (en) Genomic selection (gs) breeding chip of huaxi cattle and use thereof
CN117431324A (zh) 一种奶牛全基因组中高密度snp芯片及其应用
CN107868832A (zh) 与猪多个经济性状相关的snp分子标记及其应用
CN113322333B (zh) 基于全基因组测序筛选的与广西麻鸡体尺和屠宰性状相关的cnv分子标记组合及应用
CN114300042A (zh) 一种基于全基因组关联分析筛选大白猪繁殖性能相关候选标记的方法
CN113355427B (zh) 一种与猪背膘厚相关的snp标记及其利用方法
CN110878363B (zh) Vipr1基因与鸡种睾丸性状相关性的检测方法及应用
CN110438237B (zh) 肉用西门塔尔牛6号染色体上与后腱子、和尚头重相关的snp位点及应用
CN113528675A (zh) 一种基于肌抑制素基因mstn鉴定鸭屠宰性状的分子标记及其鉴定方法和应用

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant