CN105861710B

CN105861710B - 测序接头、其制备方法及其在超低频变异检测中的应用

Info

Publication number: CN105861710B
Application number: CN201610342219.9A
Authority: CN
Inventors: 周晔; 刘倩; 唐宇; 徐寒黎; 李伟伟; 郭现超; 李箐
Original assignee: Beijing Kexun Biotechnology Co Ltd
Current assignee: Beijing Kexun Biotechnology Co Ltd
Priority date: 2016-05-20
Filing date: 2016-05-20
Publication date: 2018-03-30
Anticipated expiration: 2036-05-20
Also published as: CN105861710A

Abstract

本发明提供了测序接头、其制备方法及其在超低频变异检测中的应用。其中，测序接头包括依次相连的文库扩增引物序列、目的片段扩增引物序列以及错误提示序列，错误提示序列位于靠近目的片段的一侧，文库扩增引物序列位于远离目的片段的一侧，错误提示序列为已知碱基顺序的序列。通过在靠近目的片段的一侧增设了已知碱基顺序的错误提示序列，错误提示序列能够为每个双链的DNA模板加上特有的外源标记。便于后续得到目的片段的测序数据后，根据测序序列是否带有相同的错误提示序列筛选或剔除测序本身或者文库扩增步骤中引入的突变，然后将在两条链同一位置都出现变异的位点确定为真实的突变，而将只有一条链有突变的位点认定为扩增或者测序误差，从而提高变异检测精度。

Description

测序接头、其制备方法及其在超低频变异检测中的应用

技术领域

本发明涉及高通量测序文库构建领域，具体而言，涉及一种测序接头、其制备方法及其在超低频变异检测中的应用。

背景技术

随着高通量测序技术的逐步成熟，其应用领域也越来越广泛，不仅能够实现由大量样本到微量样本的检测，而且还实现了由高频突变到超低频变异的检测。但由于目前最准确的高通量测序本身的单个碱基的错误率就在10^-3～10^-2左右，再加上众所周知的DNA聚合酶的固有错误率(10^-7～10^-5)，因而，目前常规的实验建库方法是不可能做到1％甚至更高的检测精度的，而这种误差使得我们很难检测到一些罕见的变异(又叫做超低频变异，突变率为0.5％～0.1％)。尽管目前已经有多种针对超低频变异的改进的建库测序方法，在实际应用中还是存在诸多局限性。

现有针对低频检测类的方法大致分为以下三类，其特点及相应的局限性如下：

一、特异性的富集突变分子

代表性的方法包括Transgenomic公司采用的Multiplexed ICE COLD-PCR(MX-ICP)以及Boreal公司的Synchronous coefficient of drag alteration(SCODA)技术，所需测序数据量较低，但是需要额外的仪器用来富集突变分子，而且只能用于检测单核苷酸多态性(SNP)，仪器的额外采购以及检测种类的单一限制了上述方法的应用范围。

二、重叠序列矫正和信息分析优化

1.个体化建档深度测序分析方法(Cancer Personalized Profiling by deepsequencing CAPP-seq)的实验流程并没有进行大的改动，只是在深度测序的前提下对信息分析流程进行了一些优化，这种方法不能消除实验方法带来的误差；

2.通过对双端测序的重叠部分的原始reads进行重叠序列矫正降低测序错误率来提高检测精度，但是这种方法并不能消除建库方法带来的错误。

三、单分子滚环扩增(circle sequencing)

利用单分子滚环复制的形式对模板分子进行多次扩增，形成一种来源于同一模板的序列连接在一起的长链，将长链进行打断处理后进行文库的构建，随后对这些来源于同一模板的扩增子进行测序，通过后期的信息分析方法对这些来源同一模板的扩增产物进行分析来降低测序以及实验带来的错误。但是这种方法应用有两个限制点：1)单链分子环化效率较低，对于微量样本会造成模板丢失；2)需要比较长的测序读长。

因而，仍需要对现有的超低频变异的建库检测方法进行改进，以提高对超低频变异的检测精度。

发明内容

本发明的主要目的在于提供一种测序接头、其制备方法及其在超低频变异检测中的应用，以解决现有技术中检测精度不够高的问题。

为了实现上述目的，根据本发明的一个方面，提供了一种测序接头，该测序接头包括依次相连的文库扩增引物序列、目的片段扩增引物序列以及错误提示序列，错误提示序列位于靠近目的片段的一侧，文库扩增引物序列位于远离目的片段的一侧，其中，错误提示序列为已知碱基顺序的序列。

进一步地，测序接头为Y字型接头。

进一步地，Y字型接头包括第一链和与第一链部分互补的第二链，第一链和第二链中较长的链的长度为30～67bp，优选为40～50bp，更优选，第一链的序列为SEQ ID NO:1：5’-ACACTCTTTCCCTACACGACGCTCTTCCGATCTNNNNNNT-3’，第二链的序列为SEQ ID NO:2：5’-NNNNNNAGATCGGAAGAGCACACGTCTGAACTCCAGTCAC-3’，其中，6个N所形成的序列代表碱基序列已知的错误提示序列。

进一步地，错误提示序列的长度为4～12bp，优选为6bp。

进一步地，文库扩增引物序列的长度为15～30bp。

根据本发明的另一个方面，还提供了一种测序接头的制备方法，该制备方法包括：设计测序接头的两条单链序列，每条单链序列中包含错误提示序列，且错误提示序列位于单链序列靠近所欲连接的目的片段的一侧，错误提示序列为已知碱基顺序的序列；分别合成两条单链序列；将合成的两条单链序列进行特异性退火，得到双链的测序接头。

进一步地，测序接头为多对，制备方法在得到双链的测序接头之后还包括：将多对测序接头进行等比例混合，得到混合的测序接头的步骤。

根据本发明的一个方面，还提供了一种测序接头，该测序接头通过上述任一种制备方法制备而成。

根据本发明的又一个方面，还提供了一种构建超低频变异测序文库的试剂盒，该试剂盒中包括测序接头，该测序接头为上述任一种测序接头，或者上述任一种测序接头的制备方法制备而成的测序接头。

根据本发明的再一个方面，还提供了一种超低频变异测序文库的构建方法，该构建方法包括：步骤S1，构建含有目的片段的测序文库；步骤S2，对测序文库进行杂交捕获，得到捕获后文库；以及步骤S3，对捕获后文库进行扩增，得到目的文库；其中，步骤S1中采用上述构建超低频变异测序文库的试剂盒构建含有目的片段的测序文库。

根据本发明的另一个方面，还提供了一种超低频变异测序文库，该超低频变异测序文库采用上述超低频变异测序文库的构建方法构建而成。

本发明还提供了一种超低频变异的检测方法，该检测方法包括：对上述超低频变异测序文库进行高通量测序，获得测序数据；以及对测序数据进行变异位点分析，获得变异位点数据。

应用本发明的技术方案，通过在目的片段测序引物的内侧(靠近目的片段的一侧)增设了能够对目的模板进行标记的具有已知碱基顺序的错误提示序列，错误提示序列为每个双链的DNA模板加上特有的外源标记，由于该外源标记的碱基顺序是已知的，便于后续得到目的片段的测序数据后，根据测序序列是否带有相同的错误提示序列筛选或剔除测序本身或者文库扩增步骤中引入的突变，然后将在两条链的同一位置都出现突变的突变确定为真实的突变，而只有一条链有突变的突变认定为实验误差或者测序误差，从而实现提高真实突变的检测精度。

附图说明

构成本申请的一部分的说明书附图用来提供对本发明的进一步理解，本发明的示意性实施例及其说明用于解释本发明，并不构成对本发明的不当限定。在附图中：

图1示出了根据本发明的实施例1和对照例的方法所构建的文库的电泳检测结果图；以及

图2A至图2D示出了本发明一种优选的实施例中不同样本所构建的文库的库检结果；其中，图2A为文库YF00CTDNACL00003(0.1％)的2100检测图；图2B为文库YF00CTDNACL00005(5％)的2100检测图；图2C为文库YF00CTDNACL00006(0.1％)的2100检测图；图2D为文库YF00CTDNACL00007(5％)的2100检测图。

具体实施方式

需要说明的是，在不冲突的情况下，本申请中的实施例及实施例中的特征可以相互组合。下面将结合实施例来详细说明本发明。

需要说明的是，现有技术中的接头序列通常包括文库扩增引物序列、目的片段扩增引物序列以及样本标签序列(即index序列)。其中，样本标签序列是位于目的片段引物扩增序列和文库扩增序列中间的，而目的片段扩增引物序列是与目的片段直接相连的序列，而文库扩增序列是目的扩增片段最外侧的序列，如Illumina测序平台的P5和P7序列。而本申请中的错误提示序列，也称分子模板识别序列，其位置是在目的片段与目的片段扩增引物序列之间，即错误提示序列是与目的片段直接连接的序列。

如背景技术部分所提到的，目前针实验流程对超低频变异的检测精度不够高，为了改进上述现状，在本申请一种优选的实施方式中，提供了一种测序接头，该测序接头包括依次相连的文库扩增引物序列、目的片段扩增引物序列以及错误提示序列，错误提示序列位于靠近目的片段的一侧，文库扩增引物序列位于远离目的片段的一侧，其中，错误提示序列为已知碱基顺序的序列。

本申请的测序接头通过在目的片段测序引物的内侧(靠近目的片段的一侧)增设了能够对目的模板进行标记的具有已知碱基顺序的错误提示序列，错误提示序列为每个双链的DNA模板加上特有的外源标记，由于该外源标记的碱基顺序是已知的，便于后续得到目的片段的测序数据后，根据测序序列是否带有相同的错误提示序列筛选或剔除测序本身或者文库扩增步骤中引入的突变，然后将在两条链的同一位置都出现突变的突变确定为真实的突变，而只有一条链有突变的突变认定为实验误差或者测序误差，从而实现提高真实突变的检测精度。

上述测序接头与现有的文库扩增用测序接头类似，根据具体使用的测序平台的不同，可以为不同的现有的双链接头，也可以是根据现有双链接头适当改进的双链接头，还可以是实验人员自行设计的双链接头。在本申请中，优选上测序链接头为应用广泛的Y字型接头。与现有的Y字型接头类似，Y字型接头中包括第一链和与第一链部分互补的第二链，且两条链中通常有一条链的长度相对较长，在本申请一种优选的实施例中，优选较长的那条链的长度为30～67bp，优选为40～50bp，更优选，第一链的序列为：SEQ ID NO:1：5’-ACACTCTTTCCCTACACGACGCTCTTCCGATCTNNNNNNT-3’，第二链的序列为：SEQ ID NO:2：5’-NNNNNNAGATCGGAAGAGCACACGTCTGAACTCCAGTCAC-3’,其中，N所形成的序列代表碱基顺序已知的错误提示序列。

对于上述测序接头中错误提示序列的长度是根据实际需要进行合理调整的，并不局限于某一特定的长度。错误提示序列长度越长，序列多态性就越多，能够标记的模板分子就越多，但序列越长，占用产出的测序数据的长度也越长，实际获得的目的DNA分子的长度就会相应缩短。在本申请一种优选的实施例中错误提示序列的长度为4～8bp，优选为6bp。将错误提示序列长度控制在4～8bp范围内，基本能够满足所有实验所用的模板DNA分子，而且对实际获得的目的DNA分子的长度的影响相对较小。

在本申请另一种优选的实施例中，将上述用于对目的片段测序引物序列进行扩增的序列的长度控制在5～20bp范围内。这样有助于缩短所构建的测序接头的总长度，从而减少测序接头在PCR扩增、测序过程中引入的错误，而导致减少测序产出的有效数据量。

在本申请另一种典型的实施方式中，还提供了一种测序接头的制备方法，该制备方法包括：设计测序接头的两条单链序列，每条单链序列中包含错误提示序列，且该错误提示序列位于单链序列靠近所欲连接的目的片段的一侧，错误提示序列为已知碱基顺序的序列；分别合成两条单链序列；将合成的两条单链序列进行特异性退火，形成双链的测序接头。

上述制备方法中的合成是指化学合成通常是由提供化学合成服务的公司合成。而非生物合成，即不是指通过以一条链为模板，另一条通过复制延伸的方式进行合成。本申请的上述测序接头的制备方法，通过根据实验需求分别合成双链测序接头中的每条单链序列，然后再通过特异性退火的方式形成双链的测序接头。该接头制作方法简单，而且由于合成的单链序列是根据预先设计好的序列进行合成的，因而每个接头上携带的错误提示序列是确定。进而在用于构建文库对超低频变异进行检测时，能够通过将每个模板DNA分子的正义链和反义链上相同位置发生的碱基突变确定为真实的突变，而将单独发生在一条链上的突变或者发生在正义链和反义链上不同位置的碱基突变确定为假突变。这样便能够排除文库扩增或者测序错误导致的突变，从而不仅能够提高检测的精确度，而且有助于降低假阳性率。

相对于常规测序接头，本申请的上述制备方法所提供的测序接头用于突变检测时，可以不仅识别出目标片段的PCR错误、测序错误，还可以通过已知碱基序列的错误提示序列，实现错误提示序列的自我矫正，从而提高检测精度。

上述制备方法中，通过合成单链以及单链退火形成双链接头的方式分别得到每对测序接头之后，根据实验操作习惯和实验目的的不同，在使用测序接头时可以分成两步来连接两端的接头，也可以一步完成连接。在一步完成连接的情况下，为了进一步提高两端测序接头所携带的各种不同错误提示的均一性，在本申请一种优选的实施例中，测序接头有多对，在得到双链的测序接头之后，上述制备方法还包括：将多对双链接头进行等比例混合，得到混合的测序接头的步骤。

上述优选的实施例中，利用上述混合测序接头对目的片段连接时，对各种不同错误提示序列的利用几率均等，使来源与基因组不同位置的相同DNA分子片段带上不同错误提示序列的多样性增加，进而可以排除来源于不同位置的相同模板DNA分子在第一位置的正义链中某一位置的碱基突变与第二位置的反义链中相同位置的相同碱基突被误认为是阳性突变，从而提高检测精度。

在本申请另一种典型的实施方式中，还提供了一种测序接头，该测序接头采用上述任一种制备方法制备而成。在本申请又一种典型的实施方式中，还提供了一种构建超低频变异测序文库的试剂盒，该试剂盒中包括上述任一种测序接头或者上述任一种制备方法制备而成的测序接头。上述测序接头或试剂盒，通过预先设计的、已知的具有特定的碱基顺序形成的测序接头，便于后续在对测序数据进行分析的过程中对实验错误所引入的突变进行筛选和剔除，提高真实突变检测的精确度。

在本申请另一种典型的实施方式中，还提供了一种超低频变异测序文库的构建方法，该构建方法包括：步骤S1，构建含有目的片段的测序文库；步骤S2，对测序文库进行杂交捕获，得到捕获后文库；以及步骤S3，对捕获后文库进行扩增，得到目的文库；其中，步骤S1中采用上述试剂盒构建含有目的片段的测序文库。

通过利用上述测序接头的制备方法制备而成的接头具有序列确定性，便于区分接头序列在扩增建库或者测序过程中所引入的碱基突变，进而能够排除实验操作步骤中的误差，同时，更利于后续分析步骤中对真阳性和假阳性突变的确定，从而有利于提高所构建的测序文库对超低频变异的检测精度。

在本申请又一种典型的实施方式中，还提供了一种超低频变异测序文库，该超低频变异测序文库采用上述构建方法构建而成，该超低频变异测序文库对超低频变异的检出率提高，而且假阳性率降低，检测精度也有很大提高。

在本申请另一种优选的实施方式中，还提供了一种超低频变异的检测方法，该检测方法包括将上述超低频变异测序文库进行高通量测序，得到测序数据；对测序数据进行变异位点分析，获得变异位点数据。该检测方法通过采用具有已知序列的错误提示序列来标记每个模板DNA分子，在对测序数据进行变异位点分析的过程中，不仅能够通过同一DNA模板分子两端的错误提示序列来排除目的DNA分子在PCR扩增中引入的错误、测序过程中引入的错误，而且还可以通过检测测序得到的错误提示序列是否与已知碱基序列一致来对错误提示序列进行自我矫正或剔除，从而提高变异检测结果的精度。

本申请的上述测序接头及其在超低频突变检测中的应用，能够适用于所有物种(如植物、微生物、动物或人)中核苷酸中存在的各种超低频突变，包括单核苷酸突变、***缺失、基因融合、拷贝数变异以及染色体易位等。在应用的过程中，所使用的样本DNA可以是***固定后石蜡包埋的组织(FFPE)样品、细胞系、血液、尿液、组织液、唾液等多种形式的DNA。

下面将结合具体的实施例来进一步说明本申请的有益效果。需要说明的是，下列实施例中的所用试剂除特别说明外，均为市售产品。其中，浓度单位μM是μM/L的缩写。所列序列如无特殊说明，均是指从5’端到3’端方向的序列。

下列实施例选取两个正常人的血浆样本(样本A、样本B)，进行常规捕获建库后进行测序以及生物信息分析，得到两个正常样品的阳性集，选出两个样本各自特有的30个纯合位点用于准确性评估。

本发明利用A样本对B样本进行不同比例的稀释，最终得到B样本30个阳性位点频率分别为5％和0.1％的两个样本，分别命名为样本1和样本2。以现有文献方法作为对照例，本发明对两种突变频率的样本进行检出比例以及检出频率进行统计分析，具体流程如下：

一、接头合成

1.对照例接头(1)的制作方法

(1)引物合成

S51：SEQ ID NO:3

AATGATACGGCGACCACCGAGATCTACACTCTTTCCCTACACGACGCTCTTCCGATCT，

S55:SEQ ID NO:4

TCTTCTACAGTCAAGATCGGAAGAGCACACGTCTGAACTCCAGTCAC。

备注：加粗部分为两条链的反向互补区域。

(2)退火

使用无核酸酶水对两条引物的粉末进行稀释，得到100uM浓度的母液，分别取等量的2条引物于PCR管中，放置在ABI 2720PCR仪上进行梯度退火，95℃降至25℃，每秒下降0.1℃。反应体系如下表1。

表1：

(3)延伸

在PCR管里按下表2配置反应液，用枪轻柔地上下吹吸混匀。放入ABI 2720PCR仪，37℃孵育30min。

表2：

(4)无水乙醇沉淀，纯化

将延伸后的产物转移至1.5ml的离心管中，加入7μL 3M NaAc(PH 5.2)和192.5μL预冷的无水乙醇，-20℃放置30min后，12000g，4℃离心30min，75％乙醇洗涤一次，晾干。加入100μL无核酸酶的水溶解。

(5)酶切

在PCR管里按下表3配置反应液，用枪轻柔地上下吹吸混匀。放入PCR仪，37℃孵育16h。

表3：

(6)无水乙醇沉淀，纯化

将酶切后的产物转移至新的1.5ml离心管中，加入20μL 3M NaAc(PH 5.2)和550μL预冷的无水乙醇，-20℃放置30min后，12000g，4℃离心30min，75％乙醇洗涤一次，晾干。加入40μL无核酸酶的水溶解。

2.实施例1接头(2)制作方法

(1)接头序列合成

ERROR-top：ACACTCTTTCCCTACACGACGCTCTTCCGATCTNNNNNNT(SEQ ID NO:5)；

ERROR-bot：P*NNNNNNAGATCGGAAGAGCACACGTCTGAACTCCAGTCAC(SEQ ID NO:6：)。备注：P*为磷酸化修饰

该实施例1专门针对N部分的错误提示序列进行特异设置了100种，ERROR-bot标签序列跟对应ERROR-top错误提示序列反向互补。其中，表4示出了100种ERROR-top序列。合成时分别ERROR-top和对应的ERROR-bot进行分别合成。其中，粗体显示的7碱基中，除了末位的T是为了与目的片段3’端凸出的A相连之外，其余6个碱基是错误提示序列。

表4：

(2)使用无核酸酶水对每条引物的粉末进行稀释，得到100uM浓度的母液，分别取等量的互补配对的引物于PCR管中，放置在ABI 2720PCR仪上进行梯度退火，95℃降至25℃，每秒下降0.1℃。反应体系如下表5。

表5：

(3)将退火好的100种双链接头序列进行等比例混合，接头制作完成。

二、血浆游离DNA(cfDNA)样本制备

采用Qiagen血浆游离核酸提取试剂盒提取A、B两个健康人各24ml血浆。然后将提取好的cfDNA按5％和0.1％进行混合，得到样本1和样本2，样本量都为60ng，其中30ng作为对照例样本，另外30ng为实施例1的样本进行后续的捕获建库测序。

三、文库构建：

(1)末端修复

在PCR管里按下表6配置反应液，用枪轻柔地上下吹吸混匀。

表6：

放入PCR仪，按下表7的程序进行反应。

表7：

(2)接头连接

在PCR管里按下表8配置反应液，用枪轻柔地上下吹吸混匀。

表8：

将配置好的反应体系均分成2管，放于PCR仪上，20℃温浴15min。最后，用1倍体积的AMPure XP磁珠纯化连接好接头的文库，23μL无核酸酶的水洗脱。

(4)扩增连接上了接头的文库

在PCR管里按下表9配置反应液，用枪轻柔地上下吹吸混匀。

表9：

放入PCR仪，按下表10设置的程序进行反应。

表10：

将扩增好的PCR产物用1.8倍的AMPure XP磁珠纯化，30μL无核酸酶的水洗脱。再分别取8μL中间文库，2％琼脂糖电泳(115V，35min)检测接头残留情况，结果如下图1所示。在图1中，M为100bp分子标记(Marker)；1为对照-样本1；2为对照-样本2；3为实施例1-样本1；4为实施例1-样本2。通过电泳图比较发现，说明本申请的方法可以显著降低接头污染比例。

(5)文库杂交、捕获和洗脱

取中间文库于一个新的离心管中，用真空抽干机进行浓缩直至文库的体积为6.4μL。使用安捷伦公司的QXT试剂盒进行杂交捕获和洗脱。杂交过程中务必保证管盖盖紧，最小化减少杂交混合液体积的蒸发，否则将会影响杂交效果。杂交程序如下表11。

表11：

(6)PCR扩增

在冰上按照下表12体系配制PCR反应液。

表12：

确认将含有磁珠的反应液混匀后，将管子放入PCR仪中进行扩增，反应程序如下表13所示。

表13：

用1.8倍体积的AMPure XP磁珠纯化PCR扩增后的产物，20μL无核酸酶的水洗脱。出库情况如下表14所示。

表14：

通过上表中文库的出库库容来看，实施例1的文库库容显著高于对照例。

四、库检上机

文库库检合格后上机，上机平台选择illumina平台的nexseq 500测序仪，测序策略为PE 75，每个样本数据量为5G。文库库检结果如图2A、图2B、图2C以及图2D所示。其中，图2A为文库YF00CTDNACL00003(0.1％)的2100检测图；图2B为文库YF00CTDNACL00005(5％)的2100检测图；图2C为文库YF00CTDNACL00006(0.1％)的2100检测图；图2D为文库YF00CTDNACL00007(5％)的2100检测图。由于血浆cfDNA的是以核小体的形式进行断裂的，所以cfDNA的大小一般为170bp的整数倍，2100检测图中就会显示多个峰，但由于PCR扩增过程中小片段的扩增效率高于长片段，文库中小片段会居多，所以小片段的主峰是最高的。峰图2A中129bp为接头自连的峰(文库中有接头残留)，294bp为连接上了接头的文库主峰(170bp+120bp)，后面的小峰为较大的目的片段连接上了接头的峰。

五、数据分析结果：

对两个混合样品采用常规建库测序方法，得到两个正常样品的阳性集。共有30个SNP位点。分别对现有方法和本申请的方法所构建的文库的产出数据进行性能比较，比较结果具体如下表15至表18。

(1)SNP位点分析结果

对照例的SNP检出统计结果见表15：

表15：

实施例1的SNP检出统计结果见表16：

表16：

分别对表15和表16中对照例和实施例1的检出比进行比较，比较结果如下表17。

表17：

混合比/方法	对照例	实施例1
			阳性位点总数	30	30
5％混合文库	23	30
			5％检出比	％	100％
0.1％混合文库	11	28
			0.1％检出比	36.67％	93.33％

从表17可以看出，实施例1的方法在阳性位点检出比率优于对照例，而且实施例1检出的突变位点的频率与混合比率具有很好的一致性，因而在每个位点检出SNP位点突变频率也优于对比例1。

此外，还对两种方法对假阳性突变位点的检出比例进行了统计和比较，比较结果见表18。

表18：

混合比/方法	对照例	实施例1
			阳性位点总数	30	30
5％混合文库	108	0
			5％假阳性率	0.108％	0.00％
0.1％混合文库	1321	2
			0.1％假阳性率	1.321％	0.002％

由于实施例1中的接头相对对比例中的接头序列的长度较短，从上述比较结果可以看出，截短后减少了产出数据中接头的污染，因而，为了检测接头的长度对产出数据的污染的影响，申请人设计了一系列不同长度的接头(具体见下表19，序列编号由上至下依次为：SEQ ID NO:107～SEQ ID NO:114)，采用与实施例1相同的方法，以30个阳性位点频率为0.1％的样本2为处理对象进行文库构建，然后对产出数据中的接头污染比率进行了比较。

表19：

上述实施例2中所使用8碱基N形成的100个错误提示序的和实施例5中所使用的4碱基N形成的100个错误提示序列分别如下表20，而实施例3和4中所使用的100个错误提示序列与实施例1所用的100个错误提示序列相同，此处不再重述。

表20：

然后对实施例2至实施例5的方法构建的文库测序得到的数据在接头污染率、SNP检出率和假阳性率等方面进行了统计，统计结果见表21。

表21：

实施例	总序列数	SNP检出率(％)	假阳性率(％)
				实施例2	45,979,351	90.00％	0.005％
实施例3	46,525,342	86.67％	0.006％
				实施例4	46,241,752	93.33％	0.004％
实施例5	48,476,249	90.00％	0.005％

从以上的描述中，可以看出，本发明上述的实施例实现了如下技术效果：通过根据实验需求分别合成双链接头中的单链序列，然后再通过特异性退火的方式形成双链接头。该接头制作方法简单，而且由于合成的单链序列是根据预先设计好的序列进行合成的，因而每个接头上携带的错误提示序列是确定。进而在用于构建文库对超低频变异进行检测时，能够通过将每个模板DNA分子的正义链和反义链上相同位置发生的碱基突变确定为真实的突变，而将单独发生在一条链上的突变或者发生在正义链和反义链上不同位置的碱基突变确定为假突变。这样便能够排除文库扩增或者测序错误导致的突变，从而不仅能够提高检测的精确度，而且有助于降低假阳性率。

相比现有技术，本申请的上述接头的制备方法及利用这种方法制备的接头在制备超低频变异检测文库中的应用具有如下优势：1)接头制作流程大大简化，提高接头质量；2)显著减少接头污染，提高建库质量；3)提高SNP位点检出率，提高检测精度，可以准确检测到0.1％甚至更低的突变频率。

以上所述仅为本发明的优选实施例而已，并不用于限制本发明，对于本领域的技术人员来说，本发明可以有各种更改和变化。凡在本发明的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。

Claims

1.一种测序接头，其特征在于，所述测序接头包括依次相连的文库扩增引物序列、目的片段扩增引物序列以及错误提示序列，所述错误提示序列位于靠近所述目的片段的一侧，所述文库扩增引物序列位于远离所述目的片段的一侧，其中，所述错误提示序列为已知碱基顺序的序列；所述测序接头为Y字型接头，所述错误提示序列的长度为4～12bp。

2.根据权利要求1所述的测序接头，其特征在于，所述Y字型接头包括第一链和与所述第一链部分互补的第二链，所述第一链和所述第二链中较长的链的长度为30～67bp。

3.根据权利要求2所述的测序接头，其特征在于，所述第一链和所述第二链中较长的链的长度为40～50bp。

4.根据权利要求2所述的测序接头，其特征在于，所述第一链的序列为SEQ ID NO:1：5’-ACACTCTTTCCCTACACGACGCTCTTCCGATCTNNNNNNT-3’，所述第二链的序列为SEQ ID NO:2：5’-NNNNNNAGATCGGAAGAGCACACGTCTGAACTCCAGTCAC-3’，其中，6个N所形成的序列代表碱基序列已知的所述错误提示序列。

5.根据权利要求1所述的测序接头，其特征在于，所述错误提示序列的长度为6bp。

6.根据权利要求1至4中任一项所述的测序接头，其特征在于，所述文库扩增引物序列的长度为15～30bp。

7.一种权利要求1至6中任一项所述的测序接头的制备方法，其特征在于，所述制备方法包括：

设计测序接头的两条单链序列，每条所述单链序列中包含错误提示序列，且所述错误提示序列位于所述单链序列靠近所欲连接的目的片段的一侧，所述错误提示序列为已知碱基顺序的序列；

分别合成两条所述单链序列；

将合成的两条所述单链序列进行特异性退火，得到双链的所述测序接头。

8.根据权利要求7所述的制备方法，其特征在于，所述测序接头为多对，所述制备方法在得到双链的所述测序接头之后还包括：将多对所述测序接头进行等比例混合，得到混合的测序接头的步骤。

9.一种测序接头，其特征在于，所述测序接头通过权利要求7或8所述的制备方法制备而成。

10.一种构建超低频变异测序文库的试剂盒，所述试剂盒中包括测序接头，其特征在于，所述测序接头为权利要求1至6中任一项所述测序接头，或者权利要求7或8所述的制备方法制备而成的测序接头。

11.一种超低频变异测序文库的构建方法，其特征在于，所述构建方法包括：

步骤S1，构建含有目的片段的测序文库；

步骤S2，对所述测序文库进行杂交捕获，得到捕获后文库；以及

步骤S3，对所述捕获后文库进行扩增，得到目的文库；

其中，所述步骤S1中采用权利要求10所述的构建超低频变异测序文库的试剂盒构建所述含有目的片段的测序文库。

12.一种超低频变异测序文库，其特征在于，所述超低频变异测序文库采用权利要求11的构建方法构建而成。

13.一种超低频变异的检测方法，其特征在于，所述检测方法包括：

对权利要求12所述的超低频变异测序文库进行高通量测序，获得测序数据；以及

对所述测序数据进行变异位点分析，获得变异位点数据。