CN104561294A - 基因分型测序文库的构建方法和测序方法 - Google Patents
基因分型测序文库的构建方法和测序方法 Download PDFInfo
- Publication number
- CN104561294A CN104561294A CN201410835787.3A CN201410835787A CN104561294A CN 104561294 A CN104561294 A CN 104561294A CN 201410835787 A CN201410835787 A CN 201410835787A CN 104561294 A CN104561294 A CN 104561294A
- Authority
- CN
- China
- Prior art keywords
- sequence
- library
- label
- construction process
- endonuclease bamhi
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6869—Methods for sequencing
-
- C—CHEMISTRY; METALLURGY
- C40—COMBINATORIAL TECHNOLOGY
- C40B—COMBINATORIAL CHEMISTRY; LIBRARIES, e.g. CHEMICAL LIBRARIES
- C40B50/00—Methods of creating libraries, e.g. combinatorial synthesis
- C40B50/06—Biochemical methods, e.g. using enzymes or whole viable microorganisms
Landscapes
- Chemical & Material Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Organic Chemistry (AREA)
- Health & Medical Sciences (AREA)
- Biochemistry (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Molecular Biology (AREA)
- Zoology (AREA)
- Engineering & Computer Science (AREA)
- Wood Science & Technology (AREA)
- Microbiology (AREA)
- Immunology (AREA)
- Analytical Chemistry (AREA)
- Biotechnology (AREA)
- Physics & Mathematics (AREA)
- Biophysics (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Genetics & Genomics (AREA)
- Chemical Kinetics & Catalysis (AREA)
- General Chemical & Material Sciences (AREA)
- Medicinal Chemistry (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
Abstract
本发明公开了一种基因分型测序文库的构建方法和测序方法。其中,构建方法包括以下步骤:S1,在对基因组DNA进行第一次酶切产生第一酶切片段的同时,在第一酶切片段的两端连上样本标签序列,得到带标签的第一酶切片段;S2,利用带文库标签序列的扩增引物对第一酶切片段进行PCR扩增,得到基因分型测序文库。本发明的上述构建方法,通过在第一次酶切产生酶切片段的同时在酶切片段两端直接连上样本标签序列,使得所构建的文库在上机测序时能够在读取样本标签信息之后直接进入目的酶切片段序列的读取,进而使得目的酶切片段序列的读长增加,减少了无效数据量,提高了测序数据的有效量。
Description
技术领域
本发明涉及高通量测序领域,具体而言,涉及一种基因分型测序文库的构建方法和测序方法。
背景技术
GBS(Genotyping-by-Sequencing)技术主要应用于对样品进行分子标记开发、超高密度遗传图谱构建、群体遗传分析及群体GWAS分析等。基于SLAF-seq(Specific Length AmplifiedFragments sequencing)是一种大规模样品基因分型的方法,是在二代测序基础上发展起来的一项基于全基因组酶切位点的简化基因组测序方法。SLAF-seq的基本原理是:利用限制性内切酶对基因组DNA样品进行酶切,降低基因组复杂度并进行高通量测序,进而对大规模样品进行标记开发及遗传图谱绘制、全基因组关联分析等。
SLAF-seq文库构建的主要实验流程如下:首先,用第一种内切酶对基因组进行第一次酶切,在酶切后的基因组片段两端各连上一段连接序列,且两端的连接序列相同,连接完成后,65℃使酶失活,终止酶切连接反应;接着,通过PCR的方法在上述连接有上述连接序列的第一次酶切片段的两端连上样本标签序列;然后,用第二种和第三种限制性内切酶对前一步骤得到的两端带有特定碱基组合形成的序列和样本标签序列的基因组DNA酶切片段进行第二次酶切,以对该类酶切片段中存在第二种和/或第三种限制性内切酶酶切位点的片段进行去除;接着,将第二次酶切后的产物进行PCR扩增,并在PCR产物的两端连接上相同的样本标签序列(barcode序列)以区分样本来源;接下来,采用Omega纯化试剂盒(E.Z.N.ACycle PureKit)纯化PCR产物,然后对不同样本的上述纯化后的PCR产物进行混池;最后,连接solexa的标准接头;连接产物纯化后进行2%的琼脂糖凝胶电泳;选择450-500bp的范围进行切胶,用Qiagen的胶回收试剂盒回收后的产物再进行PCR扩增,连接文库标签序列(index);然后再进行片段选择,切胶回收,纯化后即可出库。
然而,现有技术中的上述SLAF-seq基因分型测序文库的构建方法不仅建库流程繁琐,时间长,且所构建的文库中可以混样的数量有限,测序后得到的测序数据的质量不高,往往造成测序数据的浪费。
因此,仍需要提供一种新的通过测序对基因进行分型的文库构建方法,一方面简化建库流程,缩短建库所需时间;另一方面提高文库测序数据的质量,提高有效数据量。
发明内容
本发明的主要目的在于提供一种基因分型测序文库的构建方法和测序方法,以提高文库测序数据的有效量。
为了实现上述目的,根据本发明的一个方面,提供了一种基因分型测序文库的构建方法,该构建方法包括以下步骤:S1,在对基因组DNA进行第一次酶切产生第一酶切片段的同时,在第一酶切片段的两端连上样本标签序列,得到带标签的第一酶切片段;以及S2,利用带文库标签序列的扩增引物对第一酶切片段进行PCR扩增,得到基因分型测序文库。
进一步地,在步骤S1中,样本标签序列为6~12个碱基随机组合形成的序列,且相邻碱基的类型不同。
进一步地,样本标签序列在远离第一酶切片段的方向上还包括接头序列。
进一步地,当第一次酶切所用的内切酶为两种能够产生不同粘性末端的内切酶时,步骤S1在第一酶切片段的两端连上不同的样本标签序列,得到带标签的第一酶切片段。
进一步地,当第一次酶切产生的第一酶切片段的数量大于所需的数量时,构建方法还包括:对带标签的第一酶切片段进行第二次酶切纯化的步骤,得到去除多余片段的带标签的第一酶切片段。
进一步地,第二次酶切纯化的步骤中所使用的内切酶为一种或两种,且第二次酶切纯化的步骤中所使用的内切酶与第一次酶切步骤中所使用的内切酶不同。
进一步地,步骤S2包括:利用带文库标签序列的扩增引物对第二酶切片段进行PCR扩增,得到扩增文库;以及利用等体积的磁珠对扩增文库进行纯化,得到基因分型测序文库。
进一步地,在步骤S2中,带文库标签序列的扩增引物包括上游引物和下游引物,上游引物为P5序列,下游引物为P7序列和文库标签序列,文库标签序列为6~12个碱基随机组合形成的序列。
根据本发明的另一方面,提供了一种基因分型测序文库的测序方法,方法包括将基因分型测序文库进行上机测序的步骤,在上机测序的步骤之前,还包括将多个基因分型测序文库进行混池的步骤,其中,多个基因分型测序文库利用上述任一种构建方法构建而成。
进一步地,将多个基因分型测序文库进行混池的步骤包括:对多个基因分型测序文库进行定量;以及对多个基因分型测序文库进行等量混池。
应用本发明的技术方案,通过在第一次酶切产生酶切片段的同时在酶切片段两端直接连上样本标签序列,使得所构建的文库在上机测序时能够在读取样本标签信息之后直接进入目的酶切片段序列的读取,使得测序数据中目的酶切片段序列的长度增加,减少了无效数据量,提高了测序数据的有效量;同时,本发明的建库方法能够将第一次酶切与样本标签序列连接在同一步骤中完成,不仅简化了建库流程,而且提高了建库效率。
附图说明
构成本申请的一部分的说明书附图用来提供对本发明的进一步理解,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1示出了根据本发明的一种优选的实施例中基因分型测序文库的构建方法的流程示意图;以及
图2示出了本发明的实验八中对文库大小检测的结果图。
具体实施方式
需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本发明。
针对现有技术中基因分型测序文库的构建方法存在的建库流程繁琐,时间长,且所构建的文库测序得到的测序数据质量不高,造成数据浪费等缺点,在本发明一种典型的实施方式中,提供了一种基因分型测序文库的构建方法,如图1所示,该方法包括以下步骤:S1,在对基因组DNA进行第一次酶切产生第一酶切片段的同时,在第一酶切片段的两端连上样本标签序列,得到带标签的第一酶切片段;S2,利用带文库标签序列的扩增引物对第一酶切片段进行PCR扩增,得到基因分型测序文库。
本发明的上述基因分型测序文库的构建方法,通过在第一次酶切产生酶切片段的同时在酶切片段两端直接连上样本标签序列,使得所构建的文库在上机测序时能够在读取样本标签信息之后直接进入目的酶切片段序列的读取,使得测序数据中目的酶切片段序列的长度增加,减少了无效数据量,提高了测序数据的有效量;同时,本发明的建库方法能够将第一次酶切与样本标签序列连接在同一步骤中完成,不仅简化了建库流程,而且提高了建库效率。
在本发明的上述构建方法中,上述样本标签序列直接连接在第一次酶切片段的两端,而现有技术中的该步骤是在第一次酶切片段的两端连上了一段固定序列,该段固定序列与酶切片段的粘性末端形成的序列不再是第一内切酶的酶切位点,从而防止在第一次酶切连接的过程中酶切片段之间的再次连接(自连);然后再通过PCR的方法将样本标签序列连上。本发明上述直接在酶切片段的两端连上样本标签序列,虽然不可避免地存在极少量的酶切片段之间的再次连接,但在该酶切体系中,酶切与自连是动态的过程,在样本标签序列的数量远大于再次连接的酶切片段的数量的情况下,酶切片段之间的再次连接可以忽略不计。
上述第一次酶切片段两端连接的样本标签序列,可以根据所欲混池样本数量的多少决定所用的标签序列相同或不同。相同时,两端的标签序列只能标记一个样本,在文库混池时所能混池的样本数目相对较少,测序通量相对较低。不同时,两端的标签序列可以标记两个不同的样本,文库所能混池的数目大大增加,测序通量也大大提高,,比如,假如样本标签序列的数目为10,当两端样本标签序列相同时,仅能标记10个样本的文库,那么混池时也仅能混10个样本的文库;然而,当两端的样本标签序列不同时,同样的10个样本标签序列能够组合形成90组不同样本标签序列的组合,即可以使测序的通量提高9倍。在本发明一种优选的实施例中,上述步骤S1中,样本标签序列为6~12个碱基随机组合形成的序列,且相邻碱基的类型不同;更优选,上述酶切片段的两端的样本标签序列不同。采用相邻碱基类型不同的标签序列能够提高样本标签序列的测序质量。
在本发明的上述构建方法中,上述样本标签序列可以以单独的形式与第一酶切片段连接,也可以与接头序列合在一条序列上与第一酶切片段相连。在本发明一种优选的实施例中,样本标签序列在远离第一酶切片段的方向上还包括接头序列,即样本标签序列与接头序列合在一条序列上,这样通过第一步酶切连接步骤即可完成酶切、样本标签序列的连接以及接头序列的连接,简化了建库流程,提高建库效率。
在本发明的上述构建方法中,内切酶的选择根据所欲得到的酶切片段的数量来决定。在本发明一种优选的实施例中,上述第一次酶切所用的内切酶为两种能够产生不同粘性末端的内切酶,步骤S1在第一酶切片段的两端连上不同的样本标签序列,得到带标签的第一酶切片段。当使用两种不同的内切酶进行酶切时,所产生的酶切片段有三种,第一种:酶切片段的两端都是第一种内切酶酶切后的粘性末端;第二种:酶切片段的两端都是第二种内切酶酶切后的粘性末端;第三种:酶切片段的两端一端是第一种内切酶酶切后的粘性末端,另一端是第二种内切酶酶切后的粘性末端。当用不同的样本标签序列进行连接时,在后续的PCR扩增步骤中能够把第三种酶切片段筛选出来进行文库构建测序。
在本发明的上述构建方法中,上述第一次酶切步骤中所使用的内切酶的数量可以根据所欲酶切得到的片段的数量的多少进行合理选择内切酶的数量和种类。当第一次酶切产生的第一酶切片段的数量大于所需的数量时,构建方法还包括:对带标签的第一酶切片段进行第二次酶切纯化的步骤,得到去除多余片段的带标签的第一酶切片段。通过第二次酶切把第一次酶切片段中包括第二次酶切所用的内切酶的酶切位点的序列去除,得到合适数量的酶切片段。因此,第二次酶切纯化的步骤中所使用的内切酶与第一次酶切步骤中所使用的内切酶不同,且第二次酶切纯化的步骤中所使用的内切酶为一种或两种。
在本发明的上述构建方法中,第二次酶切的步骤中所用的内切酶为一种或两种是根据所欲去除的第一酶切片段的数量的多少进行调整。在本发明一种优选的实施例中,第一次酶切步骤中用的内切酶为MseⅠ和PstI,第二酶切步骤中所用的内切酶为NlaⅢ和EcoRⅠ。这几种酶在实际文库构建中的使用频率较高。
在本发明的上述构建方法中,在步骤S2中,带文库标签序列的扩增引物包括上游引物和下游引物,上游引物为P5序列,下游引物为P7序列和文库标签序列,文库标签序列为6~12个碱基随机组合形成的序列。具有上述带文库标签序列的扩增引物能够与常用的Illumina测序平台的其他试剂联用,简化测序流程,提高测序效率。
在本发明的上述构建方法中,上述步骤S1可以在现有技术的边酶切边连接的步骤进行适当调整,使其适用于本发明的样本标签序列的变化即可。在本发明一种优选的实施例中,上述步骤S1包括以下步骤:将第一内切酶、DNA连接酶以及样本标签序列与基因组DNA混合,得到混合物;对混合物进行酶切连接反应,得到两端带接头的第一酶切片段。将酶切连接所用的原料混合到同一体系中反应,不仅能够实现酶切连接的目的,而且还能提高效率。在本发明一种更优选的实施例中,上述样本标签序列的外端还包括了接头序列,因而,通过上述一步酶切连接反应还可以实现接头的连接,更节约建库所用时间。
在本发明的上述构建方法中,在第一次酶切和第二次酶切步骤之后,还包括对第一次酶切和/或第二次酶切步骤中的内切酶进行变性处理的步骤,优选采用在65~95℃的高温条件下进行变性处理。由于上述酶切步骤中,酶切体系中的酶始终能够起到酶切的作用,在酶切完全之后,对上述内切酶进行变性失活,是防止在后续的步骤中反应条件不是酶切反应的适合条件,内切酶的存在会对酶切片段产生不利影响。而在65~95℃的高温条件下进行变性处理方便、简单、快速。
在本发明的上述构建方法中,为了进一步提高后续扩增步骤中扩增引物的有效利用率,优选在步骤S1之后,以及步骤S2之前,还包括对第二酶切片段进行纯化的步骤,更优选纯化采用磁珠对第二酶切片段进行纯化。对第二酶切片段进行纯化,能够将第二内切酶和/或第三内切酶切断的片段进行除去,仅剩余不能被切断的序列,使得第二酶切片段的纯度更高。采用磁珠进行纯化,纯化效率高且省时。
在本发明的上述构建方法中,步骤S2包括:利用带文库标签序列的扩增引物对第二酶切片段进行PCR扩增,得到扩增文库;利用等体积的磁珠对扩增文库进行纯化,得到基因分型测序文库。通过用等体积的磁珠对扩增文库进行纯化,能够对扩增文库中在扩增步骤引入的酶或引物等其他杂质进行去除,同时对特定文库大小的片段进一步优化富集。
在本发明另一种优选的实施方式中,还提供了一种基因分型测序文库的测序方法,该方法包括将基因分型测序文库进行上机测序的步骤,在上机测序的步骤之前,还包括将多个基因分型测序文库进行混池的步骤,其中,多个基因分型测序文库利用上述任一种构建方法构建而成。利用本发明的上述构建方法所构建的多个基因分型测序文库在上机测序之前,通过混池能够提高测序的通量。尤其是,当多个基因分型测序文库中目的酶切片段的两端所连接的样本标签序列不同时,能大大提高文库的混池数量。
在本发明的上述测序方法中,将多个基因分型测序文库进行混池的步骤可以根据本领域常规的经验进行混池,也可以定量之后进行混池。本发明优选上述混池的步骤包括:对多个基因分型测序文库进行定量;以及对多个基因分型测序文库进行等量混池。通过对文库进行定量,然后按照各文库等量混池,能够使测序所得数据中的来源于不同样本的测序数据量相对均等,数据的有效性较高。
下面将结合具体的实施例来进一步说明本发明的有益效果,下列实施例按照图1所示的流程进行建库:
实验一第一限制性内切酶消化基因组DNA、样本标签序列及连接接头
1.通过Qubit(荧光定量计,life technologies)对基因组DNA进行定量,确定来源于玉米的22个样本的浓度分别为40.7ng/μl、22.7ng/μl、29.5ng/μl、23.2ng/μl、20.3ng/μl、22.9ng/μl、26.3ng/μl、37.6ng/μl、34.6ng/μl、26.6ng/μl、35.5ng/μl、21.4ng/μl、26.8ng/μl、24.6ng/μl、27.0ng/μl、20.0ng/μl、22.0ng/μl、27.4ng/μl、18.4ng/μl、20.3ng/μl、21.4ng/μl、20.2ng/μl;
2.用限制性内切酶MseⅠ对基因组DNA进行酶切,酶切体系如下表1:
表1:
基因组DNA | 150ng |
10×cutsmart缓冲液 | 5μl |
MseⅠ(10000U/ml) | 0.5μl |
PstI-HF(20000U/ml) | 1μl |
ATP(10mM) | 5μl |
MseⅠY接头序列1(10μM) | 2μl |
PstI-HF接头序列2(500nM) | 1ul |
T4DNA连接酶(40000U/ml) | 0.5μl |
补去离子水至总体积 | 50μl |
其中,接头的具体序列为:接头1的正义链的序列如SEQ ID NO:1所示:5′-ACACTCTTTCCCTACACGACGCTCTTCCGATCTNNNNNN-3’;其中,NNNNNN表示5’端的样本标签序列,黑色粗体标示的12个碱基显示的是正向测序引物序列;而ACACTCTTTCCCTACACGAC是P5接头序列的一部分,与后续的PCR扩增步骤中的扩增引物的部分序列互补。
同样,接头2的正义链的序列如SEQ ID NO:2所示:5’-(PO4)TANNNNNNAGATCGGAAGAGCACACGTCTGAACTCCAGTC-3′;其中,NNNNNN表示3’端的样本标签序列,黑色粗体标示的12个碱基显示的是反向测序引物序列;而ACACGTCTGAACTCCAGTC是P7接头序列的一部分,与后续的PCR扩增步骤中的扩增引物的部分序列互补。
上述接头序列中N表示A、T、C、G中的任何一种碱基,22个样本中每个样本的两端的标签序列是不同的,且各样本的标签序列也不同,具体各接头序列中所含的各样本两端的标签序列参见表2。
表2:
样本编号 | 5’端样本标签序列 | 3’端样本标签序列 |
样本1 | CAGATC | GATCTG |
样本2 | GATCAG | CTGATC |
样本3 | CTTGTA | TACAAG |
样本4 | ATGTCA | TGACAT |
样本5 | GTAGAG | CTCTAC |
样本6 | CGTACG | CGTACG |
样本7 | GGTAGC | GCTACC |
样本8 | ATGAGC | GCTCAT |
样本9 | CACTCA | TGAGTG |
样本10 | CATGGC | GCCATG |
样本11 | CTATAC | GTATAG |
样本12 | CTCAGA | TCTGAG |
样本13 | GACGAC | GTCGTC |
样本14 | TCGGCA | TGCCGA |
样本15 | GCTCCA | CTATCT |
样本16 | AGATAG | TATATC |
样本17 | GATATA | TTCTCG |
样本18 | CGAGAA | TGCGCT |
样本19 | AGCGCA | GACGAT |
样本20 | ATCGTC | GAGCGC |
样本21 | GCGCTC | GAGTCT |
样本22 | TGCATA | TATGCA |
3.将上述体系充分混匀后,置于PCR仪上,37℃反应6h,65摄氏度变性处理20min;
实验二第二次酶切
1.根据玉米基因组大小及所欲酶切得到的酶切片段数量,选取下表3所示的限制性内切酶,进行二次酶切,补齐酶切连接体系至60μl。第二次酶切反应的体系如下表3:
表3:
10×cutsmart缓冲液 | 1μl |
NlaⅢ(10000U/ml) | 0.5μl |
EcoRⅠ(10000U/ml) | 0.5μl |
补去离子水至总体积 | 10μl |
2.将上述体系充分混匀后,置于PCR仪上,37℃反应6h或者过夜,65℃变性处理20min;
实验三酶切连接终产物纯化
用0.8倍体积的XP磁珠纯化一次,使用50μl无核酸酶水进行溶解;然后再用0.8倍体积的XP磁珠纯化一次,使用20μl无核酸酶水进行溶解。
实验四PCR扩增连接文库标签序列
1.对上述纯化产物进行PCR扩增,冰上配制反应体系,反应体系如下表4:
表4:
上一步纯化后的产物 | 2~5ng |
Phusion MM(2×) | 25μl |
Universal Primer(25μM) | 1μl |
Index Primer(25μM) | 1μl |
去离子水 | 22μl |
总共 | 50μl |
其中,带文库标签序列的扩增引物序列的上游序列如SEQ ID NO:3所示:
5′-AATGATACGGCGACCACCGAGATCTACACTCTTTCCCTACACGACGCTCTTCCGATCT-3’;
带文库标签序列的扩增引物序列的下游序列如SEQ ID NO:4所示:5′-CAAGCAGAAGACGGCATACGAGATNNNNNNGTGACTGGAGTTCAGACGTGTGCTCTTCCGATCT-3’
2.将上述反应体系充分混匀后,置于PCR仪上,PCR反应的程序如下表5:
表5:
实验五PCR产物磁珠纯化
上述PCR产物使用等体积的XP磁珠纯化一次,使用30μl无核酸酶水进行溶解。
实验六定量混池、片段选择
1.使用Qubit对上述每个纯化后的样品进行浓度测定;
2.根据测得的浓度进行等量混池,将混样样品使用真空浓缩仪进行浓缩,浓缩至体积为30ul。
3.使用浓度为2%的琼脂糖进行电泳,100伏电泳2个小时,切胶回收375~400bp范围,使用凝胶回收试剂盒(Qiagen)进行回收,使用50μl无核酸酶水进行洗脱。
4.使用等体积的XP磁珠纯化上述回收产物,使用20μl无核酸酶水进行溶解。
实验七文库出库送检
取1μl进行Qubit(荧光定量计)定量,将文库用无核酸酶水稀释到2ng/μl备用。适量文库按照Qubit浓度稀释至2ng/μl,交至上机组进行库检上机。
实验八文库***片段和浓度检测
用Aglilent 2100生物分析仪对文库***片段大小进行检测,用q-PCR仪对文库浓度进行检测;检测结果见图2,从图2中可以看出,采用本发明所构建的文库的大小在380bp左右,无杂峰、主峰明显、无接头和引物二聚体,符合双端测序要求的***片段大小。
实验九库检合格上机
从本发明的上述实验结果看出,本发明的上述实施例通过对高通量测序领域中基于SLAF-seq技术的文库构建方法进行了优化和调整,设计了含有样本标签序列的接头,利用第一内切酶消化基因组DNA,然后通过边酶切边连接实现在基因组片段两端连接含有不同样本标签序列信息的接头;相比现有技术中,基于SLAF-seq(Specific Length Amplified Fragmentssequencing)的大规模样品基因分型方法中,边酶切边连接的过程只是连接上一段固定的序列,而样本标签序列是通过后续的PCR反应连接上的,而且基因组DNA片段两端连接的是相同的样本标签序列的建库方法,既节省了时间,又增加了混样数目,降低了建库成本。
而且,基于SLAF-seq(Specific Length Amplified Fragments sequencing)的技术构建的文库在DNA片段的两端连接的是一段固定的序列(大约有20个碱基)。在测序过程中,开始的前6个碱基测的是样本标签序列信息,从第7个开始测的便是这一固定序列,待这一固定序列测完之后才是目的片段序列信息,因而,测序数据中的这一段固定序列属于无效数据,浪费数据量。而利用本发明所构建的文库在开始测序时前6个碱基也是测样本标签序列信息,但由于样本标签序列与目的片段序列之间不存在那段固定序列,因而从第7个碱基所测的数据便是目的片段的测序数据。因而,应用本发明所提供的文库构建方法所构建的文库在测序时既能提高测序质量,同时也不会造成数据的浪费,从而提高测序数据的有效量。
以上仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (10)
1.一种基因分型测序文库的构建方法,其特征在于,所述构建方法包括以下步骤:
S1,在对基因组DNA进行第一次酶切产生第一酶切片段的同时,在所述第一酶切片段的两端连上样本标签序列,得到带标签的第一酶切片段;以及
S2,利用带文库标签序列的扩增引物对所述第一酶切片段进行PCR扩增,得到所述基因分型测序文库。
2.根据权利要求1所述的构建方法,其特征在于,在所述步骤S1中,所述样本标签序列为6~12个碱基随机组合形成的序列,且相邻碱基的类型不同。
3.根据权利要求1或2所述的构建方法,其特征在于,所述样本标签序列在远离所述第一酶切片段的方向上还包括接头序列。
4.根据权利要求1所述的构建方法,其特征在于,当所述第一次酶切所用的内切酶为两种能够产生不同粘性末端的内切酶时,所述步骤S1在所述第一酶切片段的两端连上不同的样本标签序列,得到所述带标签的第一酶切片段。
5.根据权利要求1所述的构建方法,其特征在于,当所述第一次酶切产生的第一酶切片段的数量大于所需的数量时,所述构建方法还包括:
对所述带标签的第一酶切片段进行第二次酶切纯化的步骤,得到去除多余片段的所述带标签的第一酶切片段。
6.根据权利要求5所述的构建方法,其特征在于,所述第二次酶切纯化的步骤中所使用的内切酶为一种或两种,且所述第二次酶切纯化的步骤中所使用的内切酶与所述第一次酶切步骤中所使用的内切酶不同。
7.根据权利要求1所述的构建方法,其特征在于,所述步骤S2包括:
利用带文库标签序列的扩增引物对所述第二酶切片段进行PCR扩增,得到扩增文库;以及
利用等体积的磁珠对所述扩增文库进行纯化,得到所述基因分型测序文库。
8.根据权利要求1或7所述的构建方法,其特征在于,在所述步骤S2中,所述带文库标签序列的扩增引物包括上游引物和下游引物,所述上游引物为P5序列,所述下游引物为P7序列和文库标签序列,所述文库标签序列为6~12个碱基随机组合形成的序列。
9.一种基因分型测序文库的测序方法,所述方法包括将所述基因分型测序文库进行上机测序的步骤,其特征在于,在所述上机测序的步骤之前,还包括将多个所述基因分型测序文库进行混池的步骤,其中,多个所述基因分型测序文库利用权利要求1至8中任一项所述的构建方法构建而成。
10.根据权利要求9所述的测序方法,其特征在于,将多个所述基因分型测序文库进行混池的步骤包括:
对多个所述基因分型测序文库进行定量;以及
对所述多个所述基因分型测序文库进行等量混池。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410835787.3A CN104561294B (zh) | 2014-12-26 | 2014-12-26 | 基因分型测序文库的构建方法和测序方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410835787.3A CN104561294B (zh) | 2014-12-26 | 2014-12-26 | 基因分型测序文库的构建方法和测序方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN104561294A true CN104561294A (zh) | 2015-04-29 |
CN104561294B CN104561294B (zh) | 2018-03-30 |
Family
ID=53078368
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201410835787.3A Active CN104561294B (zh) | 2014-12-26 | 2014-12-26 | 基因分型测序文库的构建方法和测序方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN104561294B (zh) |
Cited By (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105320848A (zh) * | 2015-07-06 | 2016-02-10 | 北京百迈客生物科技有限公司 | 一种基于slaf简化基因组测序数据的二次数据识别方法 |
CN105401222A (zh) * | 2015-12-30 | 2016-03-16 | 安诺优达基因科技(北京)有限公司 | 一种构建测序用dna文库的方法 |
CN105602936A (zh) * | 2015-11-18 | 2016-05-25 | 中国人民解放军第四军医大学 | 一种双barcode二代测序文库的构建方法 |
CN106086189A (zh) * | 2016-06-22 | 2016-11-09 | 杭州和壹基因科技有限公司 | 一种提高数据均一性的rad建库方法 |
CN106676099A (zh) * | 2016-12-21 | 2017-05-17 | 中国水稻研究所 | 构建简化基因组文库的方法及试剂盒 |
WO2018041062A1 (zh) * | 2016-08-29 | 2018-03-08 | 厦门艾德生物医药科技股份有限公司 | 一种用于检测基因突变的多定位双标签接头组及其制备方法和应用 |
CN108315240A (zh) * | 2018-01-19 | 2018-07-24 | 武汉永瑞康华医学检验所有限公司 | 一种可以用于基因测序的流程质控标准技术 |
WO2019001168A1 (zh) * | 2017-06-27 | 2019-01-03 | 中国水稻研究所 | 测序数据结果分析方法和装置、测序文库构建和测序方法 |
CN109295050A (zh) * | 2018-09-26 | 2019-02-01 | 刘强 | 血液微量cfDNA文库的双端标签特异性接头、试剂盒和建库方法 |
CN109517882A (zh) * | 2018-11-09 | 2019-03-26 | 广州燃石医学检验所有限公司 | 一种用于检测独特双端文库标签组合的质控方法及应用 |
CN111524552A (zh) * | 2020-04-24 | 2020-08-11 | 深圳市儒翰基因科技有限公司 | 简化基因组测序文库构建分析方法、检测设备及存储介质 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101921840A (zh) * | 2010-06-30 | 2010-12-22 | 深圳华大基因科技有限公司 | 一种基于dna分子标签技术和dna不完全打断策略的pcr测序方法 |
CN102203287A (zh) * | 2008-08-26 | 2011-09-28 | 弗卢迪格姆公司 | 增加样本和/或靶通量的测定方法 |
CN103088120A (zh) * | 2012-11-29 | 2013-05-08 | 北京百迈客生物科技有限公司 | 基于SLAFseq技术的大规模样品基因分型方法 |
CN103233072A (zh) * | 2013-05-06 | 2013-08-07 | 中国海洋大学 | 一种高通量全基因组dna甲基化检测技术 |
CN103882147A (zh) * | 2014-04-17 | 2014-06-25 | 中国热带农业科学院热带生物技术研究所 | 基因组随机扩增序列snp多态性及甲基化多态性的方法 |
-
2014
- 2014-12-26 CN CN201410835787.3A patent/CN104561294B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102203287A (zh) * | 2008-08-26 | 2011-09-28 | 弗卢迪格姆公司 | 增加样本和/或靶通量的测定方法 |
CN101921840A (zh) * | 2010-06-30 | 2010-12-22 | 深圳华大基因科技有限公司 | 一种基于dna分子标签技术和dna不完全打断策略的pcr测序方法 |
CN103088120A (zh) * | 2012-11-29 | 2013-05-08 | 北京百迈客生物科技有限公司 | 基于SLAFseq技术的大规模样品基因分型方法 |
CN103233072A (zh) * | 2013-05-06 | 2013-08-07 | 中国海洋大学 | 一种高通量全基因组dna甲基化检测技术 |
CN103882147A (zh) * | 2014-04-17 | 2014-06-25 | 中国热带农业科学院热带生物技术研究所 | 基因组随机扩增序列snp多态性及甲基化多态性的方法 |
Non-Patent Citations (1)
Title |
---|
言普: "基于Golden Gate技术的载体构建新方法", 《万方数据知识服务平台》 * |
Cited By (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105320848B (zh) * | 2015-07-06 | 2018-06-19 | 北京百迈客生物科技有限公司 | 一种基于slaf简化基因组测序数据的二次数据识别方法 |
CN105320848A (zh) * | 2015-07-06 | 2016-02-10 | 北京百迈客生物科技有限公司 | 一种基于slaf简化基因组测序数据的二次数据识别方法 |
CN105602936A (zh) * | 2015-11-18 | 2016-05-25 | 中国人民解放军第四军医大学 | 一种双barcode二代测序文库的构建方法 |
CN105401222A (zh) * | 2015-12-30 | 2016-03-16 | 安诺优达基因科技(北京)有限公司 | 一种构建测序用dna文库的方法 |
CN106086189A (zh) * | 2016-06-22 | 2016-11-09 | 杭州和壹基因科技有限公司 | 一种提高数据均一性的rad建库方法 |
WO2018041062A1 (zh) * | 2016-08-29 | 2018-03-08 | 厦门艾德生物医药科技股份有限公司 | 一种用于检测基因突变的多定位双标签接头组及其制备方法和应用 |
US11286524B2 (en) | 2016-08-29 | 2022-03-29 | Amoy Diagnostics Co., Ltd. | Multi-position double-tag connector set for detecting gene mutation and preparation method therefor and application thereof |
CN106676099B (zh) * | 2016-12-21 | 2019-07-02 | 中国水稻研究所 | 构建简化基因组文库的方法及试剂盒 |
CN106676099A (zh) * | 2016-12-21 | 2017-05-17 | 中国水稻研究所 | 构建简化基因组文库的方法及试剂盒 |
US11912988B2 (en) | 2016-12-21 | 2024-02-27 | China National Rice Research Institute | Method and kit for constructing a simplified genomic library |
WO2019001168A1 (zh) * | 2017-06-27 | 2019-01-03 | 中国水稻研究所 | 测序数据结果分析方法和装置、测序文库构建和测序方法 |
CN108315240A (zh) * | 2018-01-19 | 2018-07-24 | 武汉永瑞康华医学检验所有限公司 | 一种可以用于基因测序的流程质控标准技术 |
CN109295050A (zh) * | 2018-09-26 | 2019-02-01 | 刘强 | 血液微量cfDNA文库的双端标签特异性接头、试剂盒和建库方法 |
CN109517882A (zh) * | 2018-11-09 | 2019-03-26 | 广州燃石医学检验所有限公司 | 一种用于检测独特双端文库标签组合的质控方法及应用 |
CN109517882B (zh) * | 2018-11-09 | 2021-08-17 | 广州燃石医学检验所有限公司 | 一种用于检测独特双端文库标签组合的质控方法及应用 |
CN111524552A (zh) * | 2020-04-24 | 2020-08-11 | 深圳市儒翰基因科技有限公司 | 简化基因组测序文库构建分析方法、检测设备及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN104561294B (zh) | 2018-03-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN104561294A (zh) | 基因分型测序文库的构建方法和测序方法 | |
CN106555226B (zh) | 一种构建高通量测序文库的方法和试剂盒 | |
CN102373288B (zh) | 一种对目标区域进行测序的方法及试剂盒 | |
CN103642912B (zh) | 基于转录组测序开发绿豆ssr引物的方法 | |
CN103060924B (zh) | 微量核酸样本的文库制备方法及其应用 | |
JP2021515579A (ja) | 配列決定用途および他の核酸物質インテロゲーションのための核酸物質を濃縮するための方法および試薬 | |
CN109689872A (zh) | 一种dna末端修复与加a的方法 | |
CN104389026A (zh) | 单细胞转录组测序文库的构建方法及其应用 | |
CN105671644A (zh) | 一种基因组混样测序文库的制备方法 | |
CN104032377A (zh) | 单细胞转录组测序文库的构建方法及其应用 | |
CN110734967B (zh) | 一种接头组合物及其应用 | |
CN102653784A (zh) | 用于多重核酸测序的标签及其使用方法 | |
CN110114472A (zh) | 将线性测序文库转换为环状测序文库的方法 | |
CN108517567B (zh) | 用于cfDNA建库的接头、引物组、试剂盒和建库方法 | |
CN102604934B (zh) | 一种基于固相载体进行扩增及进行核酸测序的方法 | |
CN105754995A (zh) | 构建待测基因组的dna测序文库的方法及其应用 | |
CN105734048A (zh) | 一种基因组DNA的PCR-free测序文库制备方法 | |
Mathot et al. | Automated serial extraction of DNA and RNA from biobanked tissue specimens | |
CN102766688A (zh) | 一种检测基因序列的方法 | |
CN107002080A (zh) | 一种基于多重pcr的目标区域富集方法和试剂 | |
CN110970091B (zh) | 标签质控的方法及装置 | |
CN109486912A (zh) | 一种用于数字pcr扩增的探针引物组合及设计方法 | |
CN109136217A (zh) | 一种测序文库构建的方法、建库试剂及其应用 | |
CN114277114B (zh) | 一种扩增子测序添加唯一性标识符的方法及应用 | |
CN102831331A (zh) | 基于酶切建库双末端测序的长度多态性标记的引物设计开发方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
CB02 | Change of applicant information |
Address after: 102200 Beijing City, Changping District small town life innovation road No. 29 building room B258 Applicant after: Beijing Polytron Technologies Inc Address before: 102200 Beijing City, Changping District small town life innovation road No. 29 building room B258 Applicant before: Nuo Hezhi source, Beijing bioinformation Science and Technology Ltd. |
|
CB02 | Change of applicant information | ||
GR01 | Patent grant | ||
GR01 | Patent grant |