CN105238859B - 一种获取鸡全基因组高密度snp标记位点的方法 - Google Patents
一种获取鸡全基因组高密度snp标记位点的方法 Download PDFInfo
- Publication number
- CN105238859B CN105238859B CN201510657602.9A CN201510657602A CN105238859B CN 105238859 B CN105238859 B CN 105238859B CN 201510657602 A CN201510657602 A CN 201510657602A CN 105238859 B CN105238859 B CN 105238859B
- Authority
- CN
- China
- Prior art keywords
- seq
- joint
- purifying
- chicken
- bar code
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 241000287828 Gallus gallus Species 0.000 title claims abstract description 43
- 238000000034 method Methods 0.000 title claims abstract description 27
- 239000003550 marker Substances 0.000 title claims abstract description 17
- 238000012163 sequencing technique Methods 0.000 claims abstract description 32
- 230000029087 digestion Effects 0.000 claims abstract description 22
- 108090000623 proteins and genes Proteins 0.000 claims abstract description 14
- 238000009826 distribution Methods 0.000 claims abstract description 11
- 108010005054 Deoxyribonuclease BamHI Proteins 0.000 claims abstract description 7
- 238000012408 PCR amplification Methods 0.000 claims abstract description 7
- 108010092265 CCWGG-specific type II deoxyribonucleases Proteins 0.000 claims abstract description 3
- 108010074230 endodeoxyribonuclease MseI Proteins 0.000 claims abstract description 3
- 239000000047 product Substances 0.000 claims description 24
- 239000011324 bead Substances 0.000 claims description 21
- 239000006228 supernatant Substances 0.000 claims description 19
- LFQSCWFLJHTTHZ-UHFFFAOYSA-N Ethanol Chemical compound CCO LFQSCWFLJHTTHZ-UHFFFAOYSA-N 0.000 claims description 15
- 238000000137 annealing Methods 0.000 claims description 13
- 238000005119 centrifugation Methods 0.000 claims description 13
- 238000005352 clarification Methods 0.000 claims description 12
- 239000000203 mixture Substances 0.000 claims description 12
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 claims description 12
- 238000006243 chemical reaction Methods 0.000 claims description 11
- 108091008146 restriction endonucleases Proteins 0.000 claims description 10
- 238000009413 insulation Methods 0.000 claims description 9
- 238000004321 preservation Methods 0.000 claims description 9
- 238000001556 precipitation Methods 0.000 claims description 8
- 239000012264 purified product Substances 0.000 claims description 8
- 230000004048 modification Effects 0.000 claims description 7
- 238000012986 modification Methods 0.000 claims description 7
- 108020004414 DNA Proteins 0.000 claims description 6
- 239000000872 buffer Substances 0.000 claims description 6
- 238000011534 incubation Methods 0.000 claims description 6
- 238000002156 mixing Methods 0.000 claims description 6
- 238000010009 beating Methods 0.000 claims description 4
- 230000026731 phosphorylation Effects 0.000 claims description 4
- 238000006366 phosphorylation reaction Methods 0.000 claims description 4
- 230000004044 response Effects 0.000 claims description 4
- 102000053602 DNA Human genes 0.000 claims description 3
- 102000012410 DNA Ligases Human genes 0.000 claims description 3
- 108010061982 DNA Ligases Proteins 0.000 claims description 3
- 239000002773 nucleotide Substances 0.000 claims description 3
- 125000003729 nucleotide group Chemical group 0.000 claims description 3
- 101710148289 DNA ligase 2 Proteins 0.000 claims description 2
- 238000005859 coupling reaction Methods 0.000 claims description 2
- 238000004519 manufacturing process Methods 0.000 claims 2
- 101710163270 Nuclease Proteins 0.000 claims 1
- 230000001934 delay Effects 0.000 claims 1
- 238000007169 ligase reaction Methods 0.000 claims 1
- 238000005516 engineering process Methods 0.000 abstract description 11
- 235000013330 chicken meat Nutrition 0.000 description 34
- 102000004190 Enzymes Human genes 0.000 description 11
- 108090000790 Enzymes Proteins 0.000 description 11
- 238000003205 genotyping method Methods 0.000 description 10
- 238000004458 analytical method Methods 0.000 description 9
- 230000008859 change Effects 0.000 description 6
- 239000000243 solution Substances 0.000 description 6
- 101000702488 Rattus norvegicus High affinity cationic amino acid transporter 1 Proteins 0.000 description 5
- 238000002474 experimental method Methods 0.000 description 5
- 230000003321 amplification Effects 0.000 description 3
- 230000000052 comparative effect Effects 0.000 description 3
- 230000007423 decrease Effects 0.000 description 3
- 238000002372 labelling Methods 0.000 description 3
- 238000002493 microarray Methods 0.000 description 3
- 238000003199 nucleic acid amplification method Methods 0.000 description 3
- 238000011160 research Methods 0.000 description 3
- 238000012360 testing method Methods 0.000 description 3
- 238000011161 development Methods 0.000 description 2
- 239000012634 fragment Substances 0.000 description 2
- 238000012214 genetic breeding Methods 0.000 description 2
- 239000007788 liquid Substances 0.000 description 2
- BASFCYQUMIYNBI-UHFFFAOYSA-N platinum Chemical compound [Pt] BASFCYQUMIYNBI-UHFFFAOYSA-N 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 238000000746 purification Methods 0.000 description 2
- 239000002096 quantum dot Substances 0.000 description 2
- 239000011535 reaction buffer Substances 0.000 description 2
- 241000894007 species Species 0.000 description 2
- 239000003643 water by type Substances 0.000 description 2
- 235000010894 Artemisia argyi Nutrition 0.000 description 1
- 241000271566 Aves Species 0.000 description 1
- 235000017166 Bambusa arundinacea Nutrition 0.000 description 1
- 235000017491 Bambusa tulda Nutrition 0.000 description 1
- 240000001548 Camellia japonica Species 0.000 description 1
- 108010042407 Endonucleases Proteins 0.000 description 1
- 102000004533 Endonucleases Human genes 0.000 description 1
- 241001465754 Metazoa Species 0.000 description 1
- 244000082204 Phyllostachys viridis Species 0.000 description 1
- 235000015334 Phyllostachys viridis Nutrition 0.000 description 1
- 244000030166 artemisia Species 0.000 description 1
- 238000003556 assay Methods 0.000 description 1
- 239000011425 bamboo Substances 0.000 description 1
- 238000009412 basement excavation Methods 0.000 description 1
- 230000033228 biological regulation Effects 0.000 description 1
- 239000008280 blood Substances 0.000 description 1
- 210000004369 blood Anatomy 0.000 description 1
- 238000009395 breeding Methods 0.000 description 1
- 230000001488 breeding effect Effects 0.000 description 1
- 210000000349 chromosome Anatomy 0.000 description 1
- 235000018597 common camellia Nutrition 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 239000003480 eluent Substances 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 230000004907 flux Effects 0.000 description 1
- 230000002068 genetic effect Effects 0.000 description 1
- 238000009396 hybridization Methods 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 235000013372 meat Nutrition 0.000 description 1
- 230000011987 methylation Effects 0.000 description 1
- 238000007069 methylation reaction Methods 0.000 description 1
- 238000005065 mining Methods 0.000 description 1
- 108020004707 nucleic acids Proteins 0.000 description 1
- 102000039446 nucleic acids Human genes 0.000 description 1
- 150000007523 nucleic acids Chemical class 0.000 description 1
- 229910052697 platinum Inorganic materials 0.000 description 1
- 102000054765 polymorphisms of proteins Human genes 0.000 description 1
- 239000002244 precipitate Substances 0.000 description 1
- 238000003908 quality control method Methods 0.000 description 1
- 230000003252 repetitive effect Effects 0.000 description 1
- 238000013518 transcription Methods 0.000 description 1
- 230000035897 transcription Effects 0.000 description 1
- 238000012070 whole genome sequencing analysis Methods 0.000 description 1
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6869—Methods for sequencing
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6813—Hybridisation assays
- C12Q1/6827—Hybridisation assays for detection of mutation or polymorphism
Landscapes
- Chemical & Material Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Organic Chemistry (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- Health & Medical Sciences (AREA)
- Engineering & Computer Science (AREA)
- Microbiology (AREA)
- Immunology (AREA)
- Biotechnology (AREA)
- Molecular Biology (AREA)
- Biophysics (AREA)
- Analytical Chemistry (AREA)
- Physics & Mathematics (AREA)
- Biochemistry (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Genetics & Genomics (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
Abstract
本发明属于基因工程技术领域,提供了一种获取鸡全基因组高密度SNP标记位点的方法,包括以下步骤:(1)预测用EcoRI与MseI的双酶切鸡基因组所获得的酶切片段分布情况;(2)根据EcoRI与MseI的酶切片段分布特点设计通用接头、条形码接头及PCR扩增引物;(3)构建简化基因组测序文库;(4)利用步骤(3)构建的文库进行上机测序;(5)根据测序结果获得SNP标记位点。为不同品种的鸡利用双酶切GBS构建全基因组高密度SNP图谱提供了一种通用的策略,使得获取每个SNP标记位点的成本比传统芯片技术降低一个数量级,该方法技术稳定,重复性高。
Description
技术领域
本发明涉及生物技术领域,具体的,涉及一种基于测序基因分型技术的获取鸡全基因组高密度SNP标记位点的方法。
背景技术
作为禽类的模式生物,鸡在2004年成为第一个完成全基因测序的农业经济动物,由于不同的鸡品种具有巨大的生物多样性,其作为优质的遗传学模型,被越来越多地应用到数量遗传学及分子育种、功能基因定位、基因的调控及发育等领域。分子标记是研究生物遗传变异的重要工具,单核苷酸多态性(Single nucleotide polymorphisms,SNP)作为第三代分子标记,具有数量多、分布广、遗传稳定等特点,被广泛应用于连锁分析、全基因组关联分析和基因组选择等遗传育种领域。因此了解鸡基因组中的SNP信息,是鸡的遗传育种过程中非常关键的一环。
目前主流的鸡全基因组SNP分型技术主要有基因分型芯片和二代测序两种方法。基因分型芯片的特点是技术稳定,结果重复率高,但芯片技术分型一个实验样本的成本很高,对于群体遗传学研究领域,群体分型的成本代价太大,并且芯片技术由于技术所限,还存在着SNP多态位点在不同群体中通用性差,标记密度低(目前鸡主流的SNP芯片密度为60kSNP芯片),不能满足精细功能基因定位和全基因组关联分析等问题。下一代测序技术的发展使得基因组学和转录组学的研究能够更加深入,测序能获得全基因组水平的高密度标记图谱,但同时也存在着单位样本成本过高的缺点。
简化基因组测序技术(reduced-representation sequencing)使得群体分析研究所需的覆盖全基因组的高通量分子标记的鉴定与分型成为可能。但不同的简化基因组测序方法在建库策略、单酶切/双酶切的组合选择、测序平台的选择等方面均有较大差别,这些都会显著影响后续分型的效率和成本。举例来说,RAD测序的方法的建库策略复杂,过多的步骤会干扰后续实验结果;不同的限制性内切酶在不同的物种基因组上酶切频率和分布均有较大不同,对于特定物种,选用哪种酶进行实验就成为决定实验获取SNP数量和成本的决定因素;2b-RAD技术使用ⅡB型限制性内切酶,但这种酶切的片段大小只有25-35bp,2b-RAD技术虽然可以得到全基因组水平的酶切片段,但根据全基因组变异的频率,过短的酶切片段很难富含SNP 位点,造成大量数据损失,同时由于酶切片段过短,还会带来许多在基因组重复区域比对的错误,使得SNP分型可靠性大幅下降,严重干扰下游应用。
因此有必要开发一种新的鸡基因组SNP标记位点的分析方法,提供适合鸡基因组SNP标记位点分析的酶切组合,以降低基因分型的成本,为基因分型后的下游应用提供便利。
发明内容
针对现有技术的不足,本发明的目的在于提供一种基于测序基因分型技术获取鸡全基因组高密度SNP标记位点的方法。
测序基因分型(Genotyping By Sequencing,GBS)技术是由康奈尔大学的Elshire等人开发的,其建库方法最为简单,DNA经过酶切后,连接上特定接头,通过控制PCR过程中延伸的时间,来选择酶切产物中100-500bp的部分,从而实现简化基因组测序的目的;然而这一方法的缺陷在于,小片段酶切产物不仅在建库过程中扩增效率更高,在测序仪的模板扩增中也较快生长,容易造成测序数据可利用部分较少、数据质量较差的问题。
本发明提供了一种基于测序基因分型技术的获取鸡全基因组高密度SNP标记位点的方法,包括以下步骤:
(1)预测用EcoRI与MseI的双酶切鸡基因组所获得的酶切片段分布情况;
(2)根据EcoRI与MseI的酶切片段分布特点设计通用接头、条形码接头及PCR扩增引物;
(3)构建简化基因组测序文库;
(4)利用步骤(3)构建的文库进行上机测序;
(5)根据测序结果获得SNP标记位点。
可选的,步骤(2)中所述的通用接头带有与限制性内切酶MseI 相同的粘性末端序列,所述的条形码接头带有与限制性内切酶EcoRI 相同的粘性末端序列。
可选的,所述通用接头是由SEQ ID NO:1和SEQ ID NO:2 所示序列退火形成的双链DNA,其中SEQ ID NO:1经过5’磷酸化修饰。
可选的,所述条形码接头是由SEQ ID NO:3和SEQ ID NO:4 所示序列退火形成的双链DNA;其中SEQ ID NO:4经过5’磷酸化修饰,SEQ ID NO:3和SEQ ID NO:4中的n和m表示长度为6-9bp 的任意短核苷酸条形码序列。
可选的,步骤(2)所述的PCR扩增引物如SEQ ID NO:5和 SEQ ID NO:6所示。
可选的,步骤(3)中包括以下步骤:
(a)利用限制性内切酶组合EcoRI-MseI对鸡基因组进行酶切;
(b)制备通用接头和条形码接头;
(c) 将通用接头和条形码接头按一定比例混合以形成接头混合物,然后将其与酶切产物进行连接反应 ,获得连接产物;
(d)将连接产物等比例进行混池,获得混池后的连接产物;
(e)在混池后的连接产物中加入1.2-1.4倍体积的磁珠进行第一纯化获得第一纯化产物;
(f)在所述第一纯化产物中加入0.8-0.9倍体积的磁珠进行第二纯化获得第二纯化产物;
(g)对第二纯化产物进行PCR扩增获得PCR产物;
(h)在PCR产物中加入1.2-1.4倍体积的磁珠进行第三纯化获得第三纯化产物;
(i)在第三纯化产物中加入0.8-0.9倍体积的磁珠进行第四纯化获得简化基因组测序文库。
可选的,所述第一纯化和第三纯化的步骤相同,具体包括:加入磁珠后,在旋转仪上室温孵育18-22min获得孵育后体系;孵育结束后放置在磁力架上弃去上清,加入480-520μL的70%乙醇,静置 30-40s后缓慢旋转,使磁珠在管壁上移动,待溶液澄清后,去除上清液,再重复此步骤一次获得沉淀;再在所获得的沉淀中加入Low TE,用移液器上下吸打后,振荡10s,离心后静置澄清获得上清液;其中,相对于100μL所述沉淀,Low TE的添加量为140-160μL。
可选的,第二纯化和第四纯化的步骤相同,具体包括:加入磁珠后,在旋转仪上室温孵育13-16min;孵育结束后放置在磁力架上弃去上清,加入480-520μL的70%乙醇,静置30-40s后缓慢旋转,使磁珠在管壁上移动,待溶液澄清后,去除上清液,重复此步骤一次获得沉淀;再在所获得的沉淀中加入Low TE,用移液器上下吸打后,振荡10s,离心后静置澄清获得上清液;其中,相对于100μL所述沉淀,Low TE的添加量为30-50μL。
可选的,步骤(c)中所述的通用接头的退火体系为:100μM SEQ ID NO:15μL;100μMSEQ ID NO:25μL,5×Annealing Buffer 10μL,无核酸酶水30μL;退火程序为:加热至95℃,并以1℃/min 的速度降温至25℃,25℃保温30min后于4℃保存。
条形码接头的退火体系为:100μM SEQ ID NO:35μL;100μM SEQ ID NO:45μL,5×Annealing Buffer 10μL,无核酸酶水30μL;反应程序为:95℃3min,以1℃/min的速度降温,直至降到25℃, 25℃保温30min后于4℃保存。
接头混合的体系Adapters Mix:通用接头0.8μL,条形码接头 15μL,无核酸酶水84.2μL,总体系100μL。
可选的,步骤(c)中所述的连接反应的体系为:酶切产物20μL, 5×DNA LigaseReaction Buffer 8μL,DNA连接酶2μL,无核酸酶水 5μL,接头混合物5μL;混匀后置于PCR上,反应程序为:22℃保温1h,65℃保温30min,降温至4℃保存。
本发明开发了一种基于EcoR I–Mse I双酶切测序进行基因分型的方法,为不同品种的鸡利用双酶切GBS构建全基因组高密度 SNP图谱提供了一种通用的策略,使得获取每个SNP标记位点的成本比传统芯片技术降低一个数量级,该方法技术稳定,重复性高。
附图说明
图1为本发明提供的测序文库Agilent 2100检测结果。
图2为本发明提供的测序质量报告。
具体实施方式
下面将结合实施例对本发明的优选实施方式进行详细说明。需要理解的是以下实施例的给出仅是为了起到说明的目的,并不是用于对本发明的范围进行限制。本领域的技术人员在不背离本发明的宗旨和精神的情况下,可以对本发明进行各种修改和替换。
以下实施例中使用的测序试剂盒为NextSeq 500High Output Kit (75cycles)。
以下实施例中使用的测序数据比对基因组的软件为bowtie2(版本号bowtie2-2.2.3)(基于Linux操作***),SNP鉴定软件为Tassel (版本号tassel-4.3.13)。
实施例1
实施例1用于说明本发明所述的方法
1、实验材料:
采集红色原鸡,商业蛋鸡品种白来航鸡,商业肉鸡品种艾拔益加肉鸡、岭南黄鸡,中国地方鸡种惠阳胡须鸡、文昌鸡、河南斗鸡、清远麻鸡、黑狼山鸡、茶花鸡、北京油鸡、藏鸡、丝羽乌骨鸡、寿光鸡、竹丝鸡、石岐杂鸡、仙居鸡、隐形白鸡、矮脚黄鸡各4-6个个体血液样本,共计96个个体,提取基因组,并将基因组浓度稀释至50ng/μL备用。
2、接头和引物序列:
合成一对通用接头序列,96对条形码接头序列,一对PCR引物序列。
3、测序文库构建:
将96只鸡样本提取基因组后进行基因组酶切。反应体系为 20μL,包括15μLNuclease-free water,2μL10×CutSmart Buffer,0.5μL 酶1,0.5μL酶2(0.5μL EcoR I,0.5μL Mse I),200ng样本DNA,混匀,离心,置于PCR仪,反应条件为:37℃90min,65℃30min,4℃保存。
4、接头退火与混合:
通用接头反应体系为:共50μL,包括30μL无核酸酶水,10μL 5×Annealingbuffer,SEQ ID NO:1(100μM)5μL,SEQ ID NO:2 (100μM)5μL,混匀离心,反应条件为95℃3min,下降1℃/min,直至降到25℃,25℃30min,4℃保存。
条形码接头反应体系为:共50μL,包括30μL无核酸酶水,10 μL 5×Annealingbuffer,SEQ ID NO:3(100μM)5μL,SEQ ID NO: 4(100μM)5μL,混匀离心,反应条件为95℃3min,下降1℃/min,直至降到25℃,25℃30min,4℃保存。
接头混合的体系Adapters Mix:通用接头0.8μL,条形码接头 15μL,无核酸酶水84.2μL,总体系100μL。
5、接头连接:
反应体系为40μL,包括20μL酶切产物,5μLNuclease-free water, 8μL 5×DNALigase Reaction Buffer,2μLExpressLink T4 DNALigase, 5μL Adapters Mix,充分混匀,离心,反应条件为22℃保温1h,65℃ 30min,4℃保存。
6、混池:
将96个样本的连接产物中各5μL混合到一起,取出240μL用于下步纯化。
7、磁珠纯化连接产物:
在240μL连接产物中加入312μL AMPure XP Beads,将离心管置于旋转仪上,15-25℃孵育20min,然后放置于磁力架上3min,弃上清;加入500μL70%乙醇,将离心管置于磁力架上,30s后慢慢旋转管子,旋转两圈,使磁珠在管壁上移动,待溶液澄清后,去除上清液,然后将此步再重复一次;取下离心管,短暂离心,将离心管放置于磁力架上,用小枪头去除残留乙醇,晾干3min;加入150μL Low TE,用枪头上下吸打几次,震荡10s,短暂离心置于磁力架上, 3min,待溶液澄清后,将上清液转移到新的离心管中;向150μL Low TE洗脱液中加入120μL AMPure XP Beads,将离心管置于旋转仪上,15-25℃孵育15min,然后放置于磁力架上3min,弃上清;加入 500μL70%乙醇,将离心管置于磁力架上,30s后慢慢旋转管子,旋转两圈,使磁珠在管壁上移动,待溶液澄清后,去除上清液,然后将此步再重复一次;取下离心管,短暂离心,将离心管放置于磁力架上,用小枪头去除残留乙醇,晾干3min;加入50μL LowTE,用枪头上下吸打几次,震荡10s,短暂离心,置于磁力架上,3min,待溶液澄清后,将上清液转移到新的离心管中,再将离心管置于磁力架上2min,将上清转移至新的离心管,得到纯化后的连接产物。
浓度测定及PCR扩增。Qubit 2.0测定纯化后的连接产物浓度,用以确定PCR过程纯化后连接产物的量。扩增体系为60μL,包括 50μL Platinum PCR SuperMix HighFidelity,10ng纯化后的连接产物,1.2μL10μM Primer A,1.2μL10μM Primer B,补无核酸酶水至 60μL,反应条件为95℃5min,17×(95℃30s,62℃30s,68℃ 30s),72℃5min,4℃保存。
重复步骤5)纯化,最后用30μL Low TE洗脱。Qubit 2.0测定文库浓度,Agilent2100检测文库片段大小分布。检测报告见附图1。 8、测序平台的选择:
利用Illumina二代测序平台的NextSeq500测序***,使用单端 75bp测序试剂盒。由于NextSeq500测序仪单次可以产生400M的测序reads,因此该试验平台和方法可最大化降低测序成本,相对于 Hiseq测序***速度也更快。测序质量报告见附图2。
9、SNP标记的挖掘分析:
利用TASSEL软件对测序数据进行SNP的挖掘,基因组mapping 软件采用bowtie2进行。共检测出291,772个SNP标记,检出SNP 后对其进行位置分布的分析及功能注释,可知SNP在基因组上分布均匀,结果详见表1,说明利用本发明所提供的分析方法可以获得数据质量高的SNP标记位点分析结果。
表1SNP位点在不同染色体的分布及注释结果。
染色体 | 染色体长度 | SNP数 | SNP间距(bp) |
1 | 195276750 | 58839 | 3318 |
2 | 148809762 | 45818 | 3247 |
3 | 110447801 | 34272 | 3222 |
4 | 90216835 | 38865 | 3125 |
5 | 59580361 | 19024 | 3131 |
6 | 34951654 | 11675 | 2993 |
7 | 36245040 | 11281 | 3212 |
8 | 28767244 | 8776 | 3277 |
9 | 23441680 | 7518 | 3118 |
10 | 19911089 | 6244 | 3188 |
11 | 19401079 | 5881 | 3298 |
12 | 19897011 | 5958 | 3339 |
13 | 17760035 | 5256 | 3379 |
14 | 15161805 | 4337 | 3495 |
15 | 12656803 | 3616 | 3500 |
16 | 535270 | 134 | 3994 |
17 | 10454150 | 2749 | 3802 |
18 | 11219875 | 3913 | 3851 |
19 | 9983394 | 2658 | 3755 |
20 | 14302601 | 3914 | 3654 |
21 | 6802778 | 1983 | 3430 |
22 | 4081097 | 825 | 4946 |
23 | 5723239 | 1568 | 3650 |
24 | 6323281 | 1533 | 4124 |
25 | 2191139 | 401 | 5464 |
26 | 5329985 | 1123 | 4746 |
27 | 5209285 | 1176 | 4429 |
28 | 4742627 | 1073 | 4419 |
Z | 82363669 | 12313 | 6689 |
W | 1248174 | 49 | 25472 |
合计 | 1003035513 | 291772 | 3437 |
对比例1传统芯片方法获取及鸡基因组SNP标记
对比例1为实施例1的对照例。对比例1中样本与实施例1相同,所有样本都用Illumina公司鸡的60KSNP芯片进行基因分型。芯片的杂交、扫描检测工作由加拿大DNALandmarks公司(DNA Landmarks Inc.,Quebec,Canada)完成。经过质控,最后剩余47,965 个SNP可用于下一步数据分析。每个SNP获取的资金成本约为实施例1中的10倍,实验时间成本约为实施例1中的5倍。
实施例2鸡基因组最适内切酶组合的选择
实施例2用于说明本发明所使用的酶切组合。
发明人考虑不同酶切位点识别特点(如识别碱基数、GC含量、甲基化情况)等,共设计8组双酶切组合,通过3个岭南黄鸡与惠阳胡须鸡个体进行不同酶切组合的测序实验,实验流程同实施例1,实验结果如表2所示。可知,EcoR I–Mse I酶切组合的SNP个数为134,291个(SNP个数会随着实验个体数目的变化而变化),酶切片段数目为 414,294,与基因组的比对率最高,在一次Nextseq500测序实验中可进行96个样本的分型实验,试验投入产出比达到最优。
表2不同酶切组合在鸡基因组中分型结果
酶切组合 | SNP个数 | 酶切片段 | 比对率 |
Pst I–Mse I | 402,083 | 1,247,742 | 97.26% |
Pst I–ApeK I | 195,960 | 761,797 | 96.90% |
EcoR I–Mse I | 134,291 | 414,294 | 98.37% |
Bgl II–ApeK I | 133,770 | 436,503 | 97.82% |
Pst I–Mse I | 117,571 | 498,114 | 94.28% |
HinP1 I-Mse I | 94,724 | 491,451 | 95.03% |
HinP1 I-ApeK I | 71,751 | 389,479 | 91.77% |
EcoR I–Mse I | 26,112 | 96,527 | 96.25% |
虽然,上文中已经用一般性说明及具体实施方案对本发明作了详尽的描述,但在本发明基础上,可以对之作一些修改或改进,这对本领域技术人员而言是显而易见的。因此,在不偏离本发明精神的基础上所做的这些修改或改进,均属于本发明要求保护的范围。
Claims (1)
1.一种获取鸡全基因组高密度SNP标记位点的方法,其特征在于,包括以下步骤:
(1)预测用EcoRI与MseI双酶切鸡基因组所获得的酶切片段分布情况;
(2)根据EcoRI与MseI的酶切片段分布特点设计通用接头、条形码接头及PCR扩增引物;
(3)构建简化基因组测序文库;
(4)利用步骤(3)构建的文库进行上机测序;
(5)根据测序结果获得SNP标记位点;
步骤(2)中所述的通用接头带有与限制性内切酶MseI相同的粘性末端序列,所述的条形码接头带有与限制性内切酶EcoRI相同的粘性末端序列;
所述通用接头是由SEQ ID NO:1和SEQ ID NO:2所示序列退火形成的双链DNA,其中SEQID NO:1经过5’磷酸化修饰;
所述条形码接头是由SEQ ID NO:3和SEQ ID NO:4所示序列退火形成的双链DNA;其中SEQ ID NO:4经过5’磷酸化修饰,SEQ ID NO:3和SEQ ID NO:4中的n和m表示长度为6-9bp的任意短核苷酸条形码序列;
步骤(2)所述的PCR扩增引物如SEQ ID NO:5和SEQ ID NO:6所示;
步骤(3)中包括以下步骤:
(a)利用限制性内切酶组合EcoRI-MseI对鸡基因组进行酶切;
(b)制备通用接头和条形码接头;
(c)将通用接头和条形码接头按一定比例混合以形成接头混合物,然后将其与酶切产物进行连接反应,获得连接产物;
(d)将连接产物等比例进行混池,获得混池后的连接产物;
(e)在混池后的连接产物中加入1.2-1.4倍体积的磁珠进行第一纯化获得第一纯化产物;
(f)在所述第一纯化产物中加入0.8-0.9倍体积的磁珠进行第二纯化获得第二纯化产物;
(g)对第二纯化产物进行PCR扩增获得PCR产物;
(h)在PCR产物中加入1.2-1.4倍体积的磁珠进行第三纯化获得第三纯化产物;
(i)在第三纯化产物中加入0.8-0.9倍体积的磁珠进行第四纯化获得简化基因组测序文库;
所述第一纯化和第三纯化的步骤相同,具体包括:加入磁珠后,在旋转仪上室温孵育18-22min获得孵育后体系;孵育结束后放置在磁力架上弃去上清,加入480-520μL的70%乙醇,静置30-40s后缓慢旋转,使磁珠在管壁上移动,待溶液澄清后,去除上清液,再重复此步骤一次获得沉淀;再在所获得的沉淀中加入Low TE,用移液器上下吸打后振荡,离心后静置澄清获得上清液;其中,相对于100μL所述沉淀,Low TE的添加量为140-160μL;
第二纯化和第四纯化的步骤相同,具体包括:加入磁珠后,在旋转仪上室温孵育13-16min;孵育结束后放置在磁力架上弃去上清,加入480-520μL的70%乙醇,静置30-40s后缓慢旋转,使磁珠在管壁上移动,待溶液澄清后,去除上清液,重复此步骤一次获得沉淀;再在所获得的沉淀中加入Low TE,用移液器上下吸打后振荡,离心后静置澄清获得上清液;其中,相对于100μL所述沉淀,Low TE的添加量为30-50μL;
步骤(b)中所述的通用接头的退火体系为:100μM SEQ ID NO:1 5μL;100μM SEQ IDNO:2 5μL,5×Annealing Buffer 10μL,无核酸酶水30μL;退火程序为:加热至95℃,并以1℃/min的速度降温至25℃,25℃保温30min后于4℃保存;
条形码接头的退火体系为:100μM SEQ ID NO:3 5μL;100μM SEQ ID NO:4 5μL,5×Annealing Buffer 10μL,无核酸酶水30μL;反应程序为:95℃3min,以1℃/min的速度降温,直至降到25℃,25℃保温30min后于4℃保存;
步骤(c)中接头混合的体系Adapters Mix:通用接头0.8μL,条形码接头15μL,无核酸酶水84.2μL,总体系100μL;
步骤(c)中所述的连接反应的体系为:酶切产物20μL,5×DNA Ligase ReactionBuffer 8μL,DNA连接酶2μL,无核酸酶水5μL,接头混合物5μL;混匀后置于PCR上,反应程序为:22℃保温1h,65℃保温30min,降温至4℃保存。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510657602.9A CN105238859B (zh) | 2015-10-13 | 2015-10-13 | 一种获取鸡全基因组高密度snp标记位点的方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510657602.9A CN105238859B (zh) | 2015-10-13 | 2015-10-13 | 一种获取鸡全基因组高密度snp标记位点的方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN105238859A CN105238859A (zh) | 2016-01-13 |
CN105238859B true CN105238859B (zh) | 2018-03-16 |
Family
ID=55036677
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201510657602.9A Active CN105238859B (zh) | 2015-10-13 | 2015-10-13 | 一种获取鸡全基因组高密度snp标记位点的方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN105238859B (zh) |
Families Citing this family (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105671174B (zh) * | 2016-03-14 | 2019-04-09 | 中国农业大学 | 鸡匍匐性状基因及与鸡匍匐性状相关的dna分子标记 |
CN106191253B (zh) * | 2016-07-14 | 2019-04-16 | 中国农业大学 | 基于gbs技术的北京鸭简化基因测序方法 |
CN106434867A (zh) * | 2016-07-28 | 2017-02-22 | 江苏省家禽科学研究所 | 监测家禽保种效果的snp标记筛选方法及其在鸡保种上的应用、以及snp标记的鉴定方法 |
US11578365B2 (en) | 2017-10-10 | 2023-02-14 | Inst. Of Animal Sci., Chinese Acad. Of Ag. Science | Chicken whole-genome SNP chip and use thereof |
CN110452990B (zh) * | 2018-05-07 | 2021-03-23 | 华中农业大学 | 用于选择母鸡产蛋后期产蛋率的snp分子标记及其应用 |
CN108913797A (zh) * | 2018-06-22 | 2018-11-30 | 中国农业科学院蔬菜花卉研究所 | Gbs获取白菜类作物基因组snp构建指纹图谱的方法 |
WO2020062160A1 (zh) * | 2018-09-29 | 2020-04-02 | 中国农业大学 | 一种蛋鸡全基因组snp芯片及其应用 |
CN109680041A (zh) * | 2018-12-25 | 2019-04-26 | 上海派森诺生物科技股份有限公司 | 一种基于简化基因组测序的测序样品的处理方法 |
CN113322333B (zh) * | 2021-07-06 | 2022-07-05 | 广西大学 | 基于全基因组测序筛选的与广西麻鸡体尺和屠宰性状相关的cnv分子标记组合及应用 |
CN114480673B (zh) * | 2022-03-04 | 2022-12-23 | 江苏省家禽科学研究所 | 一种基于靶向捕获测序的鸡低密度snp液相芯片及其应用 |
CN115679012B (zh) * | 2022-10-18 | 2023-07-04 | 武汉市农业科学院 | 一种辣椒全基因组SNP-Panel及其应用 |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8932812B2 (en) * | 2009-12-17 | 2015-01-13 | Keygene N.V. | Restriction enzyme based whole genome sequencing |
CN104480217A (zh) * | 2014-12-26 | 2015-04-01 | 上海派森诺生物科技有限公司 | 一种简化基因组测序方法 |
CN104562214A (zh) * | 2014-12-26 | 2015-04-29 | 上海派森诺生物科技有限公司 | 一种基于ⅱb型限制性内切酶酶切的简化基因组建库方法 |
CN104694635B (zh) * | 2015-02-12 | 2017-10-10 | 北京百迈客生物科技有限公司 | 一种高通量简化基因组测序文库的构建方法 |
-
2015
- 2015-10-13 CN CN201510657602.9A patent/CN105238859B/zh active Active
Also Published As
Publication number | Publication date |
---|---|
CN105238859A (zh) | 2016-01-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN105238859B (zh) | 一种获取鸡全基因组高密度snp标记位点的方法 | |
CN105696088B (zh) | 一种双酶切简化基因组二代测序文库构建方法及配套试剂盒 | |
CN108699598A (zh) | 通过测序确定修饰的胞嘧啶的组合物和方法 | |
CN109593757B (zh) | 一种探针及其适用于高通量测序的对目标区域进行富集的方法 | |
CN107075513A (zh) | 分离的寡核苷酸及其在核酸测序中的用途 | |
CN113308562B (zh) | 棉花全基因组40k单核苷酸位点及其在棉花基因分型中的应用 | |
CN108611398A (zh) | 通过新一代测序进行基因分型 | |
WO2002086163A1 (en) | Methods for high throughput genome analysis using restriction site tagged microarrays | |
CN105368930B (zh) | 测序基因分型技术中测序酶切组合的确定方法 | |
JP7051677B2 (ja) | 次世代シークエンシングのための高分子量dnaサンプル追跡タグ | |
CN108753954B (zh) | 痴呆相关基因的捕获探针组、试剂盒、文库构建方法和用途 | |
EP3320111B1 (en) | Sample preparation for nucleic acid amplification | |
CN108715902A (zh) | 梅花垂枝性状snp分子标记及其应用 | |
CN106939342B (zh) | 一种与谷子米色连锁的snp标记、引物及应用 | |
CN104894233B (zh) | 一种多样本多片段dna甲基化高通量测序方法 | |
CN109112217A (zh) | 一种与猪体长和***数显著关联的遗传标记及应用 | |
CN107475449A (zh) | 一种适用于矮缩病毒科和双生病毒科病毒基因组拼接的转录组测序方法 | |
KR102121570B1 (ko) | 인삼 품종 또는 자원의 판별 및 분류를 위한 snp 기반 kasp용 프라이머 세트 및 이의 용도 | |
CN115109843A (zh) | 一种多个水稻性状控制基因变异检测功能标记方法 | |
CN102559856B (zh) | 去除测序文库中的载体片段的方法 | |
CN108642209B (zh) | 一种小麦植株千粒重判断标记及其应用 | |
CN114875118B (zh) | 确定细胞谱系的方法、试剂盒和装置 | |
CN107365873B (zh) | 与谷子叶鞘色性状连锁的分子标记及其应用 | |
CN106566872A (zh) | 基于测序基因分型技术的猪snp标记位点的分析方法 | |
CN114250279B (zh) | 一种单倍型的构建方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
TR01 | Transfer of patent right |
Effective date of registration: 20240625 Address after: 511466 1205, Floor 12, Building 9 (Building 8), No. 6, Nanjiang Second Road, the Pearl River Street, Nansha District, Guangzhou, Guangdong Patentee after: Guangzhou Tian Derivatives Technology Co.,Ltd. Country or region after: China Address before: 100193 No. 2 Old Summer Palace West Road, Beijing, Haidian District Patentee before: CHINA AGRICULTURAL University Country or region before: China |