CN104480534B

CN104480534B - 一种建库方法

Info

Publication number: CN104480534B
Application number: CN201410847648.2A
Authority: CN
Inventors: 盛司潼; 钟茂春
Original assignee: SHENZHEN HYK GENE TECHNOLOGY Co Ltd
Current assignee: SHENZHEN HYK GENE TECHNOLOGY Co Ltd
Priority date: 2014-12-29
Filing date: 2014-12-29
Publication date: 2017-02-22
Anticipated expiration: 2034-12-29
Also published as: CN104480534A

Abstract

本发明涉及基因工程及分子生物学领域，提供了一种建库方法、SNP分型方法和测序方法。所述建库方法包括步骤：A、PCR扩增待测序样本，得扩增产物；所述PCR扩增过程中用于PCR扩增的PCR引物对中至少有一种PCR引物上含有可断裂位点或可切除序列；B、将扩增产物加至切割‑连接反应体系中进行切割和连接，得含接头一的文库分子；所述切割‑连接反应体系包括：连接酶、断裂剂、接头一和连接缓冲液；所述断裂剂，用于对扩增产物中的可断裂位点或可切除序列进行特异性切割，形成第一粘性末端；所述接头一为核酸分子，含有与第一粘性末端完全互补配对的第二粘性末端。本发明简化了实验步骤，提高了建库效率。

Description

一种建库方法

技术领域

本发明涉及基因工程及分子生物学领域，更具体地说，涉及一种建库方法、SNP分型方法和测序方法。

背景技术

在现阶段，通过测序技术对目标区域的序列进行测定，往往需要构建文库分子，构建文库分子的方法一般包括以下步骤：一）通过PCR扩增获得含待测定目标区域的核酸分子；二）在含待测定目标区域的核酸分子的两端分别连接不同的接头分子，获得测序文库。但是，在步骤二）中，为了实现这两种接头分子与含待测定目标区域的核酸分子的定向连接，需要依次进行切割、连接，或连接、切割、连接的反应，且为了保证获得文库分子的纯度，减少非目标产物（两种接头自身或相互之间连接的产物、接头连接位置错误的产物）的生成，在上述2步或3步反应中需要进行1至2次的分离纯化步骤，建库步骤繁杂，效率低。

在上述方法基础上进行的SNP分型方法和测序方法，均存在步骤繁杂，建库效率低的问题。

因此，需要一种新的建库方法、SNP分型方法和测序方法，简化实验步骤，提高建库效率。

发明内容

本发明的目的在于提供一种建库方法、SNP分型方法和测序方法，旨在解决现有技术中步骤繁杂，建库效率低的问题。

为了实现发明目的，发明人提供了一种建库方法，包括以下步骤：

A、PCR扩增待测序样本，得扩增产物；所述PCR扩增过程中用于PCR扩增的PCR引物对中至少有一种PCR引物上含有可断裂位点或可切除序列；

B、将扩增产物加至切割-连接反应体系中进行切割和连接，得含接头一的文库分子；所述切割-连接反应体系包括：连接酶、断裂剂、接头一和连接缓冲液；

所述断裂剂，用于对扩增产物中的可断裂位点或可切除序列进行特异性切割，形成第一粘性末端；

所述接头一为核酸分子，含有与第一粘性末端完全互补配对的第二粘性末端。

其中，所述可断裂位点或可切除序列为核糖核苷酸、RNA序列或限制性内切酶识别序列。

其中，所述断裂剂为USER酶、RNase H或限制性内切酶。

其中，所述切割-连接反应体系还包括接头二，所述接头二用于与第一粘性末端所在末端的相对端连接。

其中，步骤A中PCR扩增使用的聚合酶为pfu酶或Taq酶，进一步的，所述聚合酶为Taq酶。

其中，所述接头二的一端为单碱基突出末端；所述单碱基突出末端为T，其位于所在链的3’端。

其中，所述接头一为双链核酸分子，其第二粘性末端所在链的5’末端含生物素标记。

进一步的，所述接头一被预先固定在磁珠上。

其中，PCR引物上的所述可断裂位点或可切除序列的3’端与其所在链5’末端的距离为1至8个碱基。

其中，步骤A中用于扩增的PCR引物对的两种引物上均含有可断裂位点或可切除序列，且同一对PCR引物对中的可断裂位点或可切除序列所形成的第一粘性末端之间不能互补配对。本方案中，接头一和接头二在步骤B分别与扩增产物两端被切割形成的不同的第一粘性末端连接。

为了更好地实现发明目的，本发明还提供了一种基于上述任一种建库方法的SNP分型方法，包括以下步骤：

A、PCR扩增待测序样本，得含待测SNP位点的扩增产物；所述PCR扩增过程中用于PCR扩增的PCR引物对中至少有一种PCR引物上含有可断裂位点或可切除序列；

B、将含待测SNP位点的扩增产物加至切割-连接反应体系中进行切割和连接，得含接头一的文库分子；所述切割-连接反应体系包括：连接酶、断裂剂、接头一和连接缓冲液；所述断裂剂，用于对扩增产物中的可断裂位点或可切除序列进行特异性切割，形成第一粘性末端；所述接头一为核酸分子，含有与第一粘性末端完全互补配对的第二粘性末端；

C、将含接头一的文库分子可寻址的固定在固相载体上；

D、对固定在固相载体上的文库分子进行测序，进而确定待测SNP位点的基因型。

其中，当检测的待测序样本有多个时，根据待测序样本的不同分别进行步骤A和B。

进一步的，所述接头一或接头二含有标签序列，用于识别不同的待测序样本和待测SNP位点的类型。

进一步的，所述接头一被预先固定在含链霉亲和素标记的磁珠上。

其中，步骤A中PCR扩增使用的聚合酶为Taq酶。

进一步的，所述接头二的一端为单碱基突出末端；所述单碱基突出末端为T，其位于所在链的3’端。

其中，所述步骤D中的测序方法为基于连接测序法或合成测序法。

其中，所述步骤D进行测序反应时的锚定引物为待测SNP位点所在位置的3’端的互补序列或待测SNP位点所在位置的5’端的互补序列。

为了更好地实现发明目的，本发明还提供了一种基于上述任一种建库方法的DNA测序方法，包括以下步骤：

A、PCR扩增待测序样本，得含待测序列的扩增产物；所述PCR扩增过程中用于PCR扩增的PCR引物对中至少有一种PCR引物上含有可断裂位点或可切除序列；

B、将含待测序列的扩增产物加至切割-连接反应体系中进行切割和连接，得含接头一和接头二的文库分子；所述切割-连接反应体系包括：连接酶、断裂剂、接头一、接头二和连接缓冲液；所述断裂剂，用于对扩增产物中的可断裂位点或可切除序列进行特异性切割，形成第一粘性末端；所述接头一为核酸分子，含有与第一粘性末端完全互补配对的第二粘性末端；所述接头二用于与第一粘性末端所在末端的相对端连接；

C、单分子扩增含接头一和接头二的文库分子，得单分子扩增产物；

D、对单分子扩增产物进行高通量测序，得待测序列的序列信息。

其中，步骤A中PCR扩增使用的聚合酶为Taq酶。

其中，步骤A中用于扩增的PCR引物对的两种引物上均含有可断裂位点或可切除序列，且同一对PCR引物对中的可断裂位点或可切除序列所形成的第一粘性末端之间不能互补配对。

由上可知，本发明通过对PCR引物和切割-连接反应体系的特殊设计，使得在建库过程中，PCR扩增后的切割和连接反应能在同一反应体系中进行，简化了实验步骤，提高了建库效率。本发明同时还将上述建库方法应用于SNP分型方法和测序方法中，以简化实验步骤，提高建库效率。

附图说明

图1是本发明一个实施例中的建库方法的原理示意图。

图2是本发明的可断裂位点或可切除序列在PCR引物对中所处位置与PCR引物和待测序样本互补配对区域之间的位置关系示意图。

图3是本发明一个实施例中分叉型接头的结构示意图。

图4是本发明一个实施例中带茎环结构的接头的结构示意图。

图5是本发明一个具体实施例中验证实验的结果图。

具体实施方式

为了使本发明的目的、技术方案及优点更加清楚明白，以下结合附图及实施例，对本发明进行进一步详细说明。

如图1所示，本发明提出第一实施例，一种建库方法，包括以下步骤：

需要说明的是：

所述待测序样本为含核酸的任意形式的样品，包括但不限于经纯化后的DNA、cDNA或RNA（包括但不限于mRNA和rRNA），或是含有核酸的石蜡包埋组织、全血、血清、血浆或细胞。

所述切割-连接反应体系为使连接酶和断裂剂同时具有活性的反应体系。

所述PCR引物对，用于扩增待测序样本中的目标区域序列。所述目标区域序列长度不限，至少含有1个碱基。

通过上述对PCR扩增引物和切割-连接反应体系的特殊设计，使得在建库过程中，PCR扩增后的切割和连接反应能在同一反应体系中进行；一旦断裂剂完成对可断裂位点或可切除序列进行特异性切割，形成第一粘性末端，接头一即可在连接酶的作用下，与被切割后的扩增产物连接，省去了切割反应和连接反应中的纯化步骤，切割、连接反应在同一反应体系中进行；即，减少了建库的步骤，提高了建库效率。

其中，连接酶和断裂剂的最佳活性温度可相同或不同，只要断裂剂的活性温度范围覆盖或部分覆盖连接酶的活性温度范围即可。

优选的，所述切割-连接反应在反应过程中温度恒定不变，这样可简化实验条件，降低对实验仪器的要求，例如，采用普通水浴锅即可完成反应。

更优选的，所述连接酶和断裂剂的最佳活性温度相同，此时，采用最佳活性温度进行切割反应和连接反应，能进一步提高反应效率。

当然，所述切割-连接反应在反应过程中温度也可以根据需要进行调节，尤其是断裂剂的最佳活性温度和连接酶的最佳活性温度不同的时候，可先在断裂剂的最佳活性温度进行切割反应，待切割反应完成后再将反应温度调节至连接酶的最佳活性温度进行连接反应，从而进一步提高反应效率。

其中，所述可断裂位点或可切除序列为PCR引物上能够被断裂剂特异性切割的位点或序列。

优选的，所述可断裂位点或可切除序列为核糖核苷酸、RNA序列或限制性内切酶识别序列。其中，可断裂位点可为单个的核糖核苷酸；可切除序列可为RNA序列或限制性内切酶识别序列，且该限制性内切酶识别序列中含有限制性内切酶切割位点。

本方案中，所述断裂剂能够与连接酶在同一反应体系中均具有较好的活性，提高切割-连接步骤的反应效率。

与上述的可断裂位点、可切除序列相对应，所述断裂剂可分别为RNase H、USER酶或限制性内切酶。

更优选的，所述可断裂位点或可切除序列为U或RNA序列，此时，相应的断裂剂为USER酶或RNase H。

本方案中，所述断裂剂——USER酶或RNase H，在切割-连接反应体系中能够与连接酶完美的配合，并在连接缓冲液中充分发挥它们自身的活性，达到特异性切割的目的。

此外，需要特别说明的是，如图2所示，所述可断裂位点或可切除序列在PCR引物对中所处位置可在PCR引物与待测序样本互补配对区域中；也可在PCR引物与待测序样本互补配对区域的5’端，与待测序样本不互补配对。

优选的，所述可断裂位点或可切除序列在PCR引物对中所处位置在与待测序样本互补配对区域的5’端，与待测序样本不互补配对。本方案尤其适用于对多个待测序样本进行测序，可统一多个待测序样本建库过程中所使用的接头一，减少试剂种类，降低建库成本。

其中，所述第一粘性末端的长度不限，优选在1-6bp之间，此时，第一粘性末端与接头一的第二粘性末端的互补配对连接反应效率较高，更优选为4或5bp，此时连接反应的效率最高。

其中，所述第二粘性末端位于其所在核酸分子的3’端。

针对接头一，需要进一步说明的是，接头一可为单链核酸分子，也可为双链核酸分子。优选的，所述接头一的第二粘性末端不是反向互补序列，本方案能够避免第二粘性末端之间的互补配对进而发生接头一的自连。

当接头一为单链核酸分子时，该单链核酸分子含有反向互补序列，且形成一端为茎环结构，另一端为与第一粘性末端完全互补配对的第二粘性末端。

优选的，该单链核酸分子的反向互补序列中含有限制性内切酶酶切识别序列。该限制性内切酶酶切识别序列可在接头一与扩增产物完成连接反应后或发生连接反应时，被相应的限制性内切酶酶切，最终获得双链结构的文库分子。

更优选的，该单链核酸分子的反向互补序列中的限制性内切酶酶切识别序列与EGFR特异性引物中的可切除序列相同。本方案中，接头一的酶切可以与与步骤B中的切割、连接同时发生，简化了实验步骤，提高了实验效率，同时减少了试剂种类，降低了反应成本和具体实验方案的设计难度。

当接头一为双链核酸分子时，针对接头一的结构，需要说明的是，接头一可为单突出末端接头或双突出末端接头。当接头一为单突出末端接头时，该单突出末端位于其所在核酸链的3’端。当接头一为双突出末端接头时，第二粘性末端与另一端的突出末端可位于同一核酸链上，也可位于不同的核酸链上。

针对接头一为双链核酸分子的方案，为了避免接头一在步骤B中发生自连，干扰实验，针对接头一结构的不同，可分别采用以下策略。

当接头一为单突出末端接头时，第二粘性末端所在核酸链的5’端无磷酸基团，这样可以避免接头一平末端部分之间的相互连接。

当接头一为双突出末端接头时，接头一的两个突出末端相互之间不能互补配对，这样可以避免存在多个接头一分子时，其自身的两个突出末端相互之间互补配对连接。或者采取第二粘性末端所在核酸链的5’端无磷酸基团，同样能够避免存在多个接头一分子时，其自身的两个突出末端相互之间互补配对连接。当然，同时采用以上两个方案最优。

针对接头一为双链核酸分子的方案，进一步优选在所述第二粘性末端所在链的另一端（5’端），含有生物素标记。本方案中，利用该生物素标记，可以在步骤B中的切割、连接反应后，很方便的将文库分子纯化出来，并进而进行后续的应用，提高了反应效率。

更优选的，所述接头一通过其上的生物素标记被预先固定在含链霉亲和素或亲和素的固相载体表面上，且步骤B是在周期性震动中进行的。本方案中接头一被预先固定在固相载体上，当固相载体的密度与步骤B中的反应体系的密度不一致时，固相载体会发生沉降或上浮，若步骤B在静置状态下反应，会导致固定在固相载体上的接头一与步骤B中被切割后的扩增产物的第一粘性末端接触不充分，连接效率低。本方案能够让接头一与步骤B中被切割后的扩增产物的第一粘性末端充分接触，提高连接效率。

需要说明的是，所述周期性震动的实现方式有多种，包括但不限于：在旋转仪上进行反应，或按一定的时间间隔，吹打或震荡反应体系。

为了进一步实现在待测样本两端接上不同的接头的目的，所述切割-连接反应体系还可包括接头二，所述接头二用于与第一粘性末端所在末端的相对端连接。

本方案与现有技术相比，避免了第一个接头连接上去后第二接头连接之前的纯化步骤，在同一个反应体系中，同时实现了待测样本两端的接头的连接，提高了反应效率。

根据步骤A中用于扩增的PCR引物对的两种引物上含有可断裂位点或可切除序列的不同，接头二可采用不同的方案。

在第二实施例中，用于PCR扩增的PCR引物对中只有一种PCR引物上含有可断裂位点或可切除序列，此时接头二可为平末端接头、突出末端接头、分叉接头或含茎环结构的接头。

所述平末端接头是指双链之间完全互补配对的双链核酸接头。优选的，所述平末端接头的两条链的5’末端均不含磷酸基团，其可避免连接过程中接头自连现象的出现，减少对后续实验的干扰。

所述突出末端接头，是指双链核酸分子中的至少一端带有突出核苷酸序列，而其余核苷酸则完全互补的双链核酸接头。突出末端接头可为单突出末端，也可以是含有两个突出末端的双突出末端，这两个突出末端可在一条核苷酸链上或在不同的核苷酸链上。所述突出末端接头能够避免连接过程中接头自连现象的出现，减少对后续实验的干扰。

当接头二为单突出末端接头时，该突出末端为其所在链的3’末端，碱基为T；该接头能够与步骤A中通过Taq酶扩增的含A尾的PCR扩增产物直接连接，提高连接效率。为了进一步避免步骤B中多个接头二的平末端之间相互发生连接，平末端中的5’端核酸链无磷酸基团。

当接头二为双突出末端接头时，其中一个突出末端为单T碱基突出末端，且该突出末端为其所在链的3’末端。该接头同样能够与步骤A中通过Taq酶扩增的含A尾的PCR扩增产物直接连接，提高连接效率。优选的，接头二中单T碱基突出末端的相对突出末端为非单A碱基的突出末端，这样能够避免步骤B中多个接头二分子之间发生的互补配对连接。当然，采用接头二中单T碱基突出末端所在核酸链的5’端无磷酸基团的方案，能够达到同样的技术效果。同时采用上述两种方案最佳。

所述分叉型接头包括互补区和分叉区，其基本结构如图3所示，互补区双链的核苷酸互补配对，配对的核苷酸对数不限。互补区末端可为平末端或突出末端。所述分叉型接头能够在结构上就避免步骤B中接头二自连现象的出现，减少对后续实验的干扰。在本实施例的具体实施方式中，所述接头优选为互补区的3’末端为突出末端，且突出末端最后一个碱基为T的T末端分叉接头；该接头能够与通过Taq酶扩增的含A尾的PCR扩增产物直接连接，提高连接效率。

所述带茎环结构的接头，如图4所示。该接头为单链核酸分子，该单链核酸分子包括第一互补配对区1、茎环区2和第二互补配对区3（图4a），第一互补配对区1能够与第二互补配对区3互补配对。如图4b所示，带茎环结构的接头还可带有突出末端4，该突出末端可位于单链核酸分子的3’端。突出末端4的存在能够防止接头自连现象的发生，减少对后续实验的干扰。该突出末端优选为T；该接头能够与通过Taq酶扩增的含A尾的PCR扩增产物直接连接，提高连接效率。

优选的，所述第一互补配对区和第二互补配对区中含有限制性内切酶酶切识别序列。该限制性内切酶酶切识别序列可在接头二与扩增产物完成连接反应后或发生连接反应时，被相应的限制性内切酶酶切，最终获得双链结构的文库分子。

更优选的，该单链核酸分子的反向互补序列中的限制性内切酶酶切识别序列与EGFR特异性引物中的可切除序列相同。本方案中，接头二的酶切可以与步骤B中的切割、连接同时发生，简化了实验步骤，提高了实验效率，同时减少了试剂种类，降低了反应成本和具体实验方案的设计难度。

在第三实施例中，用于PCR扩增的PCR引物对中两种PCR引物上均含有可断裂位点或可切除序列，且同一对PCR引物对中的可断裂位点或可切除序列所形成的第一粘性末端之间不能互补配对。

本实施例中，通过对PCR引物对的特殊设计，使得步骤A所得的扩增产物在步骤B中，可被切割成两端为不同第一粘性末端的核酸片段，进而再分别与接头一、接头二分别连接，形成文库分子；既提高了接头与扩增产物的连接效率，又避免了接头自连等非目标产物的产生。

本实施例中，接头二可为突出末端接头、分叉接头或含茎环结构的接头。

当接头二为单突出末端接头时，该突出末端为其所在链的3’末端，所述接头二与接头一分别与步骤A所得产物在步骤B中被切割后获得的两个不同的第一粘性末端连接。

当接头二为双突出末端接头时，其中一个突出末端为其所在链的3’末端，用于与步骤A所得产物在步骤B中被切割后获得的其中一个第一粘性末端互补配对连接；另一突出末端则既可为其所在链的3’末端，也可为其所在链的5’末端。优选的，这两个突出末端相互之间不能互补配对，以避免步骤B中多个接头二相互之间发生连接。当然，使上述“用于与步骤A所得产物在步骤B中被切割后获得的其中一个第一粘性末端互补配对连接”的末端所在链的5’端无磷酸基团，能够达到同样的技术效果。同时采用上述两种方案最佳。

所述分叉型接头包括互补区和分叉区，其基本结构如图3所示，互补区双链的核苷酸互补配对，配对的核苷酸对数不限。互补区末端可为平末端或突出末端。所述分叉型接头能够在结构上就避免步骤B中接头二自连现象的出现，减少对后续实验的干扰。在本实施例的具体实施方式中，所述接头优选为互补区的3’末端为突出末端，该突出末端用于与步骤A所得产物在步骤B中被切割后获得的其中一个第一粘性末端互补配对连接，提高连接效率。

所述带茎环结构的接头，如图4b所示。该接头为单链核酸分子，该单链核酸分子包括第一互补配对区1、茎环区2和第二互补配对区3，第一互补配对区1能够与第二互补配对区3互补配对，所述带茎环结构的接头还带有突出末端4，该突出末端4位于单链核酸分子的3’端。突出末端4用于与步骤A所得产物在步骤B中被切割后获得的其中一个第一粘性末端互补配对连接。

针对，接头二为双链核酸分子的方案，进一步优选“用于与步骤A所得产物在步骤B中被切割后获得的其中一个第一粘性末端互补配对连接”的末端所在链的5’端含有生物素标记。本方案中，利用该生物素标记，可以在步骤B中的切割、连接反应后，很方便的将文库分子纯化出来，并进而进行后续的应用，提高了反应效率。

更优选的，所述接头二通过其上的生物素标记被预先固定在含链霉亲和素或亲和素的固相载体上，且步骤B是在周期性震动中进行的。本方案中接头二被预先固定在固相载体上，当固相载体的密度与步骤B中的反应体系的密度不一致时，固相载体会发生沉降或上浮，若步骤B在静置状态下反应，会导致固定在固相载体上的接头二与步骤B中被切割后的扩增产物的第一粘性末端接触不充分，连接效率低。本方案能够让接头二与步骤B中被切割后的扩增产物的第一粘性末端充分接触，提高连接效率。

进一步的，用于扩增的PCR引物对的两种引物上含有的均为可断裂位点，它们可相同或不同。优选相同，这样可减少步骤Ｂ中反应体系的复杂度，降低实验设计难度，减少试剂种类，降低成本。

进一步的，用于扩增的PCR引物对的两种引物上含有的均为可切除序列。优选均为RNA序列，该方案与采用两种不同的限制性内切酶识别序列相比，在步骤B中，可仅用RNaseH就实现对可切除序列的特异性切割，降低了实验成本和实验方案的设计难度。

上述任一方案中，步骤A中PCR扩增使用的聚合酶无特殊限制，可使用高保真的pfu酶，也可以用Taq酶。优选为Taq酶，本方案获得扩增产物的3’端为单碱基（A）突出末端，可以避免扩增产物在连接过程中发生自连。

上述任一方案中，所述连接酶无特殊限制，能够实现DNA片段连接即可，例如：E.coli DNA连接酶、T4 DNA连接酶、热稳定DNA连接酶、Tth DNA连接酶。优选为T4 DNA连接酶，适用性广，且既可连接粘性末端，又能连接平末端。

进一步的，所述用于PCR扩增的PCR引物对中只有一种PCR引物上含有可断裂位点或可切除序列，另一种PCR引物的5’端含有标签序列，所述标签序列用于识别不同的待测序样本和/或同一待测序样本中的不同扩增区域。

本方案尤其适用于对多个待测序样本和/或多个待测序区域的测序，通过分别进行上述步骤A和B，然后对所得文库分子中扩增的待测序区域和标签序列的测序，即可获得多个待测序样本和/或多个待测序区域的序列信息，提高测序通量。

为了更好的实现本发明的目的，本发明在上述任一种建库方法的基础上，提出了一种SNP分型方法，包括以下步骤：

C、将含接头一的文库分子可寻址的固定在固相载体上；

需要说明的是，通过上述对PCR扩增引物和切割-连接反应体系的特殊设计，使得在建库过程中，PCR扩增后的切割和连接反应能在同一反应体系中进行；一旦断裂剂完成对可断裂位点或可切除序列进行特异性切割，形成第一粘性末端，接头一即可在连接酶的作用下，与被切割后的扩增产物连接，省去了切割反应和连接反应中的纯化步骤，切割、连接反应在同一反应体系中进行；减少了上述SNP分型方法中建库的步骤，提高了SNP分型效率；而且本方案避免了现有技术中基于芯片技术的SNP分型方法中不同探针之间的相互干扰，SNP位点的检测通量和准确性仅受限于所采用的测序技术，大大的提高了对SNP位点进行检测的通量；与现有技术相比，还能同时保证准确性保持在一个较高的水平，不因通量的增加而急剧下降。

此外，步骤A中所述的扩增可为单分子扩增，也可为非单分子扩增。

所述单分子扩增是指在扩增开始前，各模板分子以极微量甚至单分子的形式在空间上隔离（但这些模板分子整体上还是属于同一个反应体系），并且在各自的空间内实现扩增的方法，例如：乳液PCR、桥式PCR、乳液桥式PCR。

所述非单分子扩增是指在进行扩增时，各模板分子在同一个反应体系中进行扩增，且相互之间并未发生空间上的隔离，包括但不限于：普通PCR扩增、RT-PCR、不对称PCR、固相PCR、原位PCR、反转录PCR、巢式PCR、兼并引物PCR、免疫PCR、反向PCR和递减PCR等。

与通过对单分子扩增产物进行测序获得SNP位点序列信息相比，非单分子扩增方法无需特殊的前处理步骤，更简单，且扩增效率更高、更快速（循环数更少），能够显著的提高SNP分型方法的效率。

本发明所述步骤D中的测序方法可为第二代高通量基因测序技术，包括但不限于连接测序法或合成测序法。

所述连接测序法是基于连接酶在核酸片段之间进行连接反应的过程中的保真性来实现的，以待测序核酸片段为模板，锚定引物（又称测序引物，其与待测序核酸片段所在链互补）和寡核苷酸探针（该探针的特定位置上带有荧光标记）进行连接反应，通过检测连接产物上的荧光标记从而确定寡核苷酸探针上带有荧光标记的特定位置对应的序列的信息。目前，市场上常见的连接测序法有多种，包括但不限于：深圳华因康基因科技有限公司的Pstar连接测序法、ABI公司的连接测序法、Complete Genomics公司的连接测序法。

所述合成测序法是基于聚合酶在延伸核酸链过程中的保真性来实现的，以待测序核酸片段为模板，锚定引物（又称测序引物，其与待测序核酸片段所在链互补）互补结合至待测序核酸片段上，通过检测在延伸过程中产生的信号来确定待测序核酸片段上相应位置的序列信息。目前，市场上常见的合成测序法有多种，包括但不限于：Illumina公司的Solexa合成测序法、Roche公司的454合成测序法、Life Technologies公司的Ion torrent、Ion Proton合成测序法。

上述常见的测序方法的通量均在GB以上，能够同时对成百上千甚至上万个样本的成百上千甚至上万个SNP位点进行检测，且准确度均在99.9%以上。

所述可寻址的固定，是指能够确定位置信息的固定。即，固相载体上每一具***置上所固定的含接头一的文库分子与其它具***置上所固定的含接头一的文库分子之间是能够明确区分的。该区分可通过在固定前划定区域并设定对应关系来确定；也可通过后续的实验结果的观察分析，从而倒推确定不同位置上固定的含接头一的文库分子。

优选的，所述非单分子扩增为普通PCR扩增、不对称PCR和巢式PCR。

当非单分子扩增为巢式PCR时，对应每个SNP位点，用于PCR扩增的PCR引物对均有两对，可断裂位点或可切除序列位于内引物对中的一种或两种引物上。

当非单分子扩增为不对称PCR时，对应每个SNP位点，可断裂位点或可切除序列位于用于大量单链扩增的引物上。

其中，普通PCR扩增设计最为简单，扩增条件宽松，只需要通过简单的设计即可实现本发明；不对称PCR能够实现待测SNP位点靶链的大量单链扩增；巢式PCR能够显著提高扩增的特异性，得到高质量的扩增产物，保证后续待测SNP位点检测的正确性。

进一步的，含接头一的文库分子可通过直接或间接的方式可寻址的固定在固相载体上。

针对通过间接的方式实现含接头一的文库分子的可寻址固定，本发明提出一实施例：含接头一的文库分子先固定在微球上，然后再将微球固定在固相载体上，从而实现含接头一的文库分子的可寻址固定。

更进一步的，所述接头一含有生物素标记，其通过生物素与链霉亲和素或亲和素的特异性结合而固定在含链霉亲和素或亲和素的微球上，进而将微球可寻址的固定在固相载体上。

上述方案中，对于含接头一的文库分子固定在微球上这一步骤，其可在步骤B实现，也可在步骤C实现，区别在于接头一是否预先固定在微球上。若接头一预先固定在微球上，则在步骤B实现；若接头一未被预先固定在微球上，则在步骤C中实现。当接头一被预先固定在微球上时，步骤B实在周期性震动中进行的，可避免因为微球与步骤B中的反应体系的密度不一致导致的连接效率低的问题，提高连接效率。

针对通过直接的方式实现含接头一的文库分子的可寻址固定，本发明提出一实施例：将含接头一的文库分子直接固定在固相载体上，从而实现含接头一的文库分子的可寻址固定。该固相载体优选为玻片。

本方案中，接头一优选含有生物素标记；本方案实际是通过物理分区的方式实现可寻址固定的，例如：将用于固定含接头一的文库分子的固相载体人为划分成多个区域，各区域固定的含接头一的文库分子通过物理位置而建立对应关系；固相载体具体可为多通道测序反应小室中的各个通道，或多测序反应小室中的不同测序反应小室，或同一测序反应小室通道中的不同区域。

优选的，所述接头一为双链核酸分子，其第二粘性末端所在链的5’末端含生物素标记。

上述两种含接头一的文库分子的可寻址固定方案中，间接固定的方案较直接固定的方案更适于多待测序样本的SNP分型，不受固相载体所能被物理分区的区域数量的限制，通量更高。

在上述任一方案中，优选所述切割-连接反应体系还包括接头二，所述接头二用于与第一粘性末端所在末端的相对端连接。

本方案可在待测样本两端接上不同的接头，与现有技术相比，避免了第一个接头连接上去后第二接头连接之前的纯化步骤，在同一个反应体系中，同时实现了待测样本两端的接头的连接，提高了反应效率。

本方案中，文库分子能够有接头二，因此可用接头二替换上述方案中的接头一，实现含接头一的文库分子的直接或间接的可寻址的固定。

针对通过间接的方式实现含接头二的文库分子的可寻址固定，本发明提出一实施例：含接头一的文库分子先固定在微球上，然后再将微球固定在固相载体上，从而实现含接头一的文库分子的可寻址固定。

更进一步的，所述接头二含有生物素标记，其通过生物素与链霉亲和素或亲和素的特异性结合而固定在含链霉亲和素或亲和素的微球上，进而将微球可寻址的固定在固相载体上。

上述方案中，对于含接头一的文库分子固定在微球上这一步骤，其可在步骤B实现，也可在步骤C实现，区别在于接头二是否预先固定在微球上。若接头二预先固定在微球上，则在步骤B实现；若接头二未被预先固定在微球上，则在步骤C中实现。当接头二被预先固定在微球上时，步骤B实在周期性震动中进行的，可避免因为微球与步骤B中的反应体系的密度不一致导致的连接效率低的问题，提高连接效率。

本方案中，接头二优选含有生物素标记；本方案实际是通过物理分区的方式实现可寻址固定的，例如：将用于固定含接头一的文库分子的固相载体人为划分成多个区域，各区域固定的含接头一的文库分子通过物理位置而建立对应关系；固相载体具体可为多通道测序反应小室中的各个通道，或多测序反应小室中的不同测序反应小室，或同一测序反应小室通道中的不同区域。

在上述实施例中，当步骤D中对待测SNP位点进行测序反应时，对应的锚定引物一般可设计为：

a、接头中的一段序列；或

b、特异性引物对中的一段序列；或

c、特异性引物对中的一段序列的互补序列；或

d、接头的3’端的部分序列与特异性引物对中与之相连的5’端的部分序列；或

e、接头的3’端的部分序列与特异性引物对中与之相连的5’端的部分序列所组成的核酸链的互补序列；或

f、待测SNP位点所在位置的3’端的互补序列；或

g、待测SNP位点所在位置的5’端的互补序列。

其中，当检测的待测序样本有多个，待测SNP位点也有多个时，根据待测序样本和待测SNP位点的不同分别进行步骤A和B。

进一步的，所述接头一或接头二含有标签序列，用于识别不同的待测序样本和待测SNP位点的类型。本方案可以提高SNP分型方法的通量，实现对不同样本和/或不同SNP位点的SNP分型。

进一步的，所述用于PCR扩增的PCR引物对中只有一种PCR引物上含有可断裂位点或可切除序列，另一种PCR引物的5’端含有标签序列，所述标签序列用于识别不同的待测序样本和/或同一待测序样本中的不同待测SNP位点。

本方案尤其适用于对多个待测序样本和/或多个待测SNP位点的测序，通过分别进行上述步骤A和B，然后对所得文库分子中扩增的待测序区域和标签序列的测序，即可获得多个待测序样本和/或多个待测SNP位点的碱基信息，提高SNP分型通量。

其中，步骤A中PCR扩增使用的聚合酶为Taq酶。

进一步的，所述接头二的一端为单碱基突出末端；所述单碱基突出末端为T，其位于所在链的3’端。本方案中的接头二可直接与通过Taq酶扩增的含待测SNP位点的扩增产物中的A尾特异性的定向连接。

为了进一步实现本发明的目的，本发明在上述任一种建库方法的基础上提出了一种DNA测序方法，包括以下步骤：

需要说明的是，本方案通过对PCR扩增引物和切割-连接反应体系的特殊设计，使得在建库过程中，PCR扩增后的切割和连接反应能在同一反应体系中进行；一旦断裂剂完成对可断裂位点或可切除序列进行特异性切割，形成第一粘性末端，接头一即可在连接酶的作用下，与被切割后的扩增产物连接，省去了切割反应和连接反应中的纯化步骤，切割、连接反应在同一反应体系中进行；减化了建库的步骤，提高了建库效率，进而提高了测序效率。

本方案中的PCR引物对、接头一、接头二、连接酶和断裂剂等均可参考上述方案中的阐述，在此不再赘述。

其中，步骤C所述单分子扩增过程中所使用的单分子扩增引物优选分别为接头一和接头二上的核酸序列，或为分别与接头一和接头二上的核酸序列互补的核酸序列。

其中，步骤C所述单分子扩增优选为乳液PCR、桥式PCR或乳液桥式PCR。

其中，步骤D中的高通量测序方法可为第二代高通量基因测序技术，包括但不限于连接测序法或合成测序法。

其中，步骤A中PCR扩增使用的聚合酶为Taq酶；所述接头二的一端为单碱基突出末端；所述单碱基突出末端为T，其位于所在链的3’端。

进一步的，所述用于PCR扩增的PCR引物对中只有一种PCR引物上含有可断裂位点或可切除序列，另一种PCR引物的5’端含有标签序列，所述标签序列用于识别不同的待测序样本和/或同一待测序样本中的不同待测SNP位点。本方案尤其适用于对多个待测序样本和/或多个待测区域的测序，通过分别进行上述步骤A和B，然后对所得文库分子中扩增的待测序区域和标签序列的测序，即可获得多个待测序样本和/或多个待测区域的序列信息，提高测序通量。

以下将通过具体实施例来进一步说明本发明所记载技术方案的技术效果及优越性。

在一具体实施例中，以正常人的血液基因组DNA为模板，针对SLC6A4基因上的一个片段构建文库分子。其中，用于扩增SLC6A4基因的上下游引物分别是：SEQ ID NO:1和SEQID NO:2。其中，SEQ ID NO:2中的U为可断裂位点，本引物在扩增完成后，5’端的CGGU会形成一个可切除序列。

一、扩增产物的获得。

按下述配比配置PCR反应体系：SEQ ID NO:1（10μM），0.5μL；SEQ ID NO:2（10μM），0.5μL；dNTP（各2.5mM），2μL；血液基因组DNA，20ng；Ex Taq（5U/μL），0.15μL；10×Ex TaqBuffer，2μL；ddH₂O加至20μL。

PCR反应条件如下：95℃ 3min；94℃ 15s，56℃ 20s，72℃ 30s；重复20个循环；72℃ 3min。PCR反应完成后，即得SLC6A4基因的扩增产物。

二、文库分子的构建。

按下述反应体系配置溶液：步骤一所得扩增产物20μL；USER酶（1U/μL，NEB，Cat#M5505S），10μL；10×T4连接酶缓冲液，4μL；T4 DNA连接酶，2μL；接头一，100ng；接头二，100ng；加ddH₂O至40μL。

接头一由SEQ ID NO:3和SEQ ID NO:4组成，其中，SEQ ID NO:3-4链上的5’末端无磷酸基团。

接头二由SEQ ID NO:5和SEQ ID NO:6组成，其中，SEQ ID NO:5-6链上的5’末端无磷酸基团。

25℃反应20分钟，得连接产物。

三、含接头一的文库分子的获得的验证。

以SEQ ID NO:7和SEQ ID NO:8分别为上下游引物，以步骤二所得产物为模板，进行PCR扩增。按下述配比配置PCR反应体系：SEQ ID NO:7（10μM），0.5μL；SEQ ID NO:8（10μM），0.5μL；dNTP（各2.5mM），2μL；步骤二所得产物，1μL；Ex Taq（5U/μL），0.15μL；10×Ex TaqBuffer，2μL；ddH₂O加至20μL。

PCR反应条件如下：95℃ 3min；94℃ 15s，58℃ 30s，72℃ 30s；重复20个循环；72℃ 3min。PCR反应完成后，即得验证产物。

验证产物经琼脂糖凝胶电泳，结果如图5所示，在190bp位置附近出现了目标条带，即SLC6A4基因上的目标片段与接头一和接头二的连接产物。步骤二中的连接产物经琼脂糖凝胶电泳后，同样在190bp位置附近出现了目标条带，且在100-200bp之间还出现了另外三条弥散的条带，大小分别为120bp、140bp、170bp附近，与理论预期完全相符。说明本发明的方法可以实现待测序样本建库。

此外，为了进一步实现所得文库分子的快速和有效分离，可在接头二或接头一中的某一条核酸链的5’端设置生物素标记。然后，在步骤二完成后，加入带链霉亲和素标记的磁珠（invitrogen，Dynabeads MyOneTM Streptavidin C1）吸附连接产物，18至25℃孵育大约1小时，每10至15min轻弹管壁或短暂涡旋混匀磁珠，使带生物素的连接产物充分结合到磁珠上。反应完成后，用磁铁吸附磁珠，移除上清液；用100 μL 1×NEBuffer 4冲洗磁珠，然后再用磁铁吸附磁珠，重复3次，移除上清，得目标连接产物（即，SLC6A4基因上的目标片段与接头一和接头二的连接产物）。优选设置在接头一分子中的SEQ ID NO:4的5’末端或接头二分子中的SEQ ID NO:5的5’末端，当设置在接头一分子中的SEQ ID NO:4的5’末端时，可保证富集的分子中均为含有接头一的文库分子。

参照上述实施例，结合本发明在说明书中的阐述，本发明的方法可对任意的待测序样本的目标区域进行快速的文库构建。例如：PPP1R1B基因中的目标区域（对应的引物对为：SEQ ID NO:9-10），MPV17L2基因中的目标区域（对应的引物对为：SEQ ID NO:11-12），ABCC9基因中的目标区域（对应的引物对为：SEQ ID NO:13-14）等。

此外，本具体实施例中的PCR扩增方法为普通PCR扩增，还可采用巢式PCR或不对称PCR等扩增方法。同样以对上述具体实施例中的目标区域建库为例，可在步骤一的PCR扩增过程中增加一对PCR引物，它们分别位于SEQ ID NO:1-2的上游和下游，对应的序列为SEQID NO:15-16，引物量可与SEQ ID NO:1-2相同或少一些；PCR反应条件修改成：95℃ 3min；94℃ 15s，52℃ 20s，72℃ 30s；重复7个循环；94℃ 15s，56℃ 20s，72℃ 30s；重复13个循环；72℃ 3min。即，整个PCR反应过程中增加了一个退火温度较低的阶段。本方案可以在待测序样本较少的情况下，快速实现对目标区域的扩增，并提高扩增的特异性。

还有，本具体实施例中可断裂位点位于在与待测序样本互补配对区域的5’端，与待测序样本不互补配对，且仅有一个；该可断裂位点的设计仅是对应上述具体实施例的较佳实施例，并不用于限制本发明。本具体实施例中的可断裂位点（SEQ ID NO:2的5’端数起第4位为U）的设计，还可用使SEQ ID NO:2的5’端的第1-4的碱基均用相应的核苷酸代替的方案来替代，并实现相同的效果；此外，断裂剂可为USER酶，更优选为RNase H。

本发明的可断裂位点可有多个；优选相同，本方案可确保在切割-连接反应过程中，第一粘性末端的快速有效生成；同样，本发明的可断裂位点或可切除序列在断裂或切除后形成的第一粘性末端的长度不限，对应的序列也没有特殊的要求，适用性好。

同样的，上述具体实施例中的接头一、接头二仅是对应上述具体实施例的较佳实施例，并不用于限制本发明，它们均可参考本发明说明书的记载进行相应的变换，且接头二可以视情况不要。

本发明还提出另一具体实施例来进一步说明本发明所记载技术方案的技术效果及优越性。

在本具体实施例中，以同一人的血液基因组DNA为模版，同时检测SLC6A4基因的SNP位点rs147867056、PPP1R1B基因的SNP位点rs8796060、MPV17L2基因的SNP位点rs11552158这三个SNP位点，这三个SNP位点分别对应的用于PCR扩增的引物对（F引物和R引物）分别为：SEQ ID NO:1-2，SEQ ID NO:9-10，SEQ ID NO:11-12。

一、扩增产物的获得。

以血液基因组DNA为模版，SEQ ID NO:1-2，SEQ ID NO:9-10，SEQ ID NO:11-12等引物对组合分别对上述各SNP位点所在区域进行扩增，反应体系为：F引物（10μM），0.5μL；R引物（10μM），0.5μL；dNTP（各2.5mM），2μL；血液基因组DNA，20ng；Ex Taq（5U/μL），0.15μL；10×Ex Taq Buffer，2μL；ddH₂O加至20μL。

PCR反应条件如下：95℃ 3min；94℃ 15s，56℃ 30s，72℃ 30s；重复20个循环；72℃ 3min。

上述PCR反应完成后，所得即为各SNP位点的扩增产物。

二、含接头一的文库分子的构建。

接头一和接头二同上一具体实施例，其中接头二中SEQ ID NO:5链上的5’末端还含有生物素标记。

25℃反应20分钟，得连接产物。

反应完成后，分别在上述连接产物中加入10μL带链霉亲和素标记的磁珠（invitrogen，Dynabeads MyOneTM Streptavidin C1）吸附连接产物，18至25℃孵育大约1小时，每10至15min轻弹管壁或短暂涡旋混匀磁珠，使带生物素的连接产物充分结合到磁珠上。反应完成后，用磁铁吸附磁珠，移除上清液；用100 μL 1×NEBuffer 4冲洗磁珠，然后再用磁铁吸附磁珠，重复3次，移除上清，分别得到针对上述3个SNP位点的文库分子。

三、文库分子的可寻址固定。

将得到的针对上述3个SNP位点的文库分子混合，然后将混合物点样至异硫氰基修饰的载样片（玻片），于37℃固定1h，即完成文库分子的可寻址固定。

四、测序。

对步骤三所得的固定在固相载体上的文库分子进行测序。在本具体实施例中采用深圳华因康基因科技有限公司的高通量基因测序仪Pstar IIA测序仪，以连接测序法进行测序，进而获得本具体实施例样本来源人的上述3个SNP位点的碱基信息。结果显示，上述3个SNP位点的碱基信息分别为：C/C、A/A、C/T。即，rs147867056和rs8796060为纯合子，rs11552158为杂合子。

参照本具体实施例，结合本发明在说明书中的阐述，本发明的方法可对任意的待测序样本中的SNP位点完成快速测序，且能进一步实现对多个样本的多个SNP位点实现快速测定。以本具体实施例为基础，如果需要同时实现对多个不同来源人的上述3个SNP位点的测定，仅需根据来源人的不同，利用相同的扩增引物，在不同反应体系中进行步骤一，并根据来源人的不同，连接含有不同标签序列的接头二，具体可表现为令上述接头二分子中的SEQ ID NO:5中从5’端数起第23-26位（ACGT）为标签序列位（SEQ ID NO:6的相应位置进行适应性改变），这四个位置共有256种组合，即可区分256种不同来源人的样本，进而在后续的步骤三中进行不同来源人的文库分子的混合、可寻址固定，然后在步骤四中额外针对这个标签序列位进行检测，进而确定不同来源人的上述3个SNP位点的碱基信息。

与上一具体实施例相同，本具体实施例中的PCR扩增方法同样可以采用其他的方法；可断裂位点或可去除序列在断裂或切除后形成的第一粘性末端的长度不限，对应的序列也没有特殊的要求，适用性好。

在本具体实施例中，以同一人的血液基因组DNA为模版，同时检测SLC6A4基因、PPP1R1B基因、MPV17L2基因、ABCC9基因和FOXO3基因，这些基因对应的用于PCR扩增的引物对（F引物和R引物）分别为：SEQ ID NO:1-2，SEQ ID NO:9-10，SEQ ID NO:11-12，SEQ IDNO:13-14，SEQ ID NO:17-18。

一、扩增产物的获得。

以血液基因组DNA为模版，SEQ ID NO:1-2，SEQ ID NO:9-10，SEQ ID NO:11-12，SEQ ID NO:13-14，SEQ ID NO:15-16等引物对组合分别对上述基因进行扩增，反应体系为：F引物（10μM），0.5μL；R引物（10μM），0.5μL；dNTP（各2.5mM），2μL；血液基因组DNA，20ng；ExTaq（5U/μL），0.15μL；10×Ex Taq Buffer，2μL；ddH₂O加至20μL。

上述PCR反应完成后，所得即为各基因的扩增产物。

二、含接头一的文库分子的构建。

25℃反应20分钟，得连接产物。

反应完成后，分别在上述连接产物中加入10μL带链霉亲和素标记的磁珠（invitrogen，Dynabeads MyOneTM Streptavidin C1）吸附连接产物，18至25℃孵育大约1小时，每10至15min轻弹管壁或短暂涡旋混匀磁珠，使带生物素的连接产物充分结合到磁珠上。反应完成后，用磁铁吸附磁珠，移除上清液；用100 μL 1×NEBuffer 4冲洗磁珠，然后再用磁铁吸附磁珠，重复3次，移除上清，分别得到针对上述5个基因的文库分子。

三、单分子扩增。

在高温变性条件下，分别将步骤二所得文库分子（双链）变性，然后用磁铁吸附磁珠，取上清作为单分子扩增的模板。

以SEQ ID NO:7和SEQ ID NO:8为单分子扩增引物，分别对单分子扩增模版进行乳液PCR扩增，得单分子扩增产物。其中，SEQ ID NO：7的5’末端含有生物素标记，且被预先固定在磁珠上。

四、测序。

将步骤三所得单分子扩增产物混合，并点样至异硫氰基修饰的载样片（玻片），于37℃固定1h，即完成文库分子的可寻址固定。进而采用深圳华因康基因科技有限公司的高通量基因测序仪Pstar IIA测序仪，以连接测序法进行测序，进而获得上述SLC6A4基因、PPP1R1B基因、MPV17L2基因、ABCC9基因和FOXO3基因的序列信息，它们分别为SEQ ID NO:19-23。

本具体实施例实现了对SLC6A4基因、PPP1R1B基因、MPV17L2基因、ABCC9基因和FOXO3基因中相应目标区域的快速测序。

参照本具体实施例，结合本发明在说明书中的阐述，本发明的方法可对任意的待测序样本中的目标区域完成快速测序，且能进一步实现对多个样本的多个目标区域实现快速测定。以本具体实施例为基础，如果需要同时实现对多个不同来源人的上述5个基因的目标区域序列的测定，仅需根据来源人的不同，利用相同的扩增引物，在不同反应体系中进行步骤一，并根据来源人的不同，连接含有不同标签序列的接头二，具体可表现为令上述接头二分子中的SEQ ID NO:5中从5’端数起第23-26位（ACGT）为标签序列位（SEQ ID NO:6的相应位置进行适应性改变），这四个位置共有256种组合，即可区分256种不同来源人的样本，进而在后续的步骤三中分别进行单分子扩增，并在步骤四中将单分子扩增产物混合、可寻址固定，进而进行测序，从而确定不同来源人的上述5个基因的目标区域的序列信息。

以上所述仅为本发明的较佳实施例而已，并不用以限制本发明，凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等，均应包含在本发明的保护范围之内。

SEQUENCE LISTING

<110> 深圳华因康基因科技有限公司

<120> 一种建库方法

<160> 23

<170> PatentIn version 3.3

<210> 1

<211> 20

<212> DNA

<213> 人工序列

<400> 1

aggaaatcca ccttcttgcc 20

<210> 2

<211> 24

<212> DNA

<213> 人工序列

<400> 2

cgguagttcc aagtcctggt gcgg 24

<210> 3

<211> 24

<212> DNA

<213> 人工序列

<400> 3

cgagctgtca gtcgatcgat gaga 24

<210> 4

<211> 29

<212> DNA

<213> 人工序列

<400> 4

tctcatcgat cgactgacag ctcgtcggt 29

<210> 5

<211> 46

<212> DNA

<213> 人工序列

<400> 5

cctccctgca gtctctatgg gcacgtctgc tagtcgctga agtagt 46

<210> 6

<211> 42

<212> DNA

<213> 人工序列

<400> 6

ctacttcagc gactagcaga cgtgcccata gagactgcag gg 42

<210> 7

<211> 20

<212> DNA

<213> 人工序列

<400> 7

tctcatcgat cgactgacag 20

<210> 8

<211> 20

<212> DNA

<213> 人工序列

<400> 8

cctccctgca gtctctatgg 20

<210> 9

<211> 22

<212> DNA

<213> 人工序列

<400> 9

atcccactcc tatgagcaac ac 22

<210> 10

<211> 25

<212> DNA

<213> 人工序列

<400> 10

cgguatcttc tggaattggg gtcag 25

<210> 11

<211> 19

<212> DNA

<213> 人工序列

<400> 11

aacttttggg ggccgactc 19

<210> 12

<211> 24

<212> DNA

<213> 人工序列

<400> 12

cgguagccac caatccagag ctcc 24

<210> 13

<211> 19

<212> DNA

<213> 人工序列

<400> 13

tccgacgggc catgtattc 19

<210> 14

<211> 24

<212> DNA

<213> 人工序列

<400> 14

cgguccctcg catcctgtta tccc 24

<210> 15

<211> 16

<212> DNA

<213> 人工序列

<400> 15

tccagagtga gcacag 16

<210> 16

<211> 16

<212> DNA

<213> 人工序列

<400> 16

gacctgtgac caagat 16

<210> 17

<211> 25

<212> DNA

<213> 人工序列

<400> 17

tgaaagtagt gtggtttaaa tgcac 25

<210> 18

<211> 25

<212> DNA

<213> 人工序列

<400> 18

cggugtgacc catttccaag tgtcc 25

<210> 19

<211> 120

<212> DNA

<213> 人工序列

<400> 19

aggaaatcca ccttcttgcc ccaggtctcc cgttcccctt gatgaagctc agccactagg 60

gtggtggtgg tcgctgggat agagtgccgt gtgtcatctc ccgcaccagg acttggaact 120

<210> 20

<211> 86

<212> DNA

<213> 人工序列

<400> 20

atcccactcc tatgagcaac actctggacc tcctgccacc ctttccctca cccccagagt 60

gggccctgac cccaattcca gaagat 86

<210> 21

<211> 99

<212> DNA

<213> 人工序列

<400> 21

aacttttggg ggccgactcc aggcctgagc ctgctctgag gggatcagtc aygtccccgc 60

cttagtccca ggacctgagg gagctctgga ttggtggct 99

<210> 22

<211> 112

<212> DNA

<213> 人工序列

<400> 22

tccgacgggc catgtattca agagaagcca aagcccagat ggaggacgaa gacgaaggta 60

gatctttttt cttttatctg gaacattcta atgggataac aggatgcgag gg 112

<210> 23

<211> 96

<212> DNA

<213> 人工序列

<400> 23

tgaaagtagt gtggtttaaa tgcacatgca tgcttccaaa atgactaatc atgacaagaa 60

tcaactccta aacttggaca cttggaaatg ggtcac 96

Claims

1.一种建库方法，其特征在于，包括以下步骤：

A、PCR扩增待测序样本，得扩增产物；所述PCR扩增过程中用于PCR扩增的PCR引物对中至少有一种PCR引物上含有可断裂位点或可切除序列；所述可断裂位点为U，所述可切除序列为RNA序列；

所述断裂剂为USER酶或RNase H，用于对扩增产物中的可断裂位点或可切除序列进行特异性切割，形成第一粘性末端；

所述接头一为核酸分子，含有与第一粘性末端完全互补配对的第二粘性末端；所述可断裂位点或可切除序列在PCR引物对中所处位置在与待测序样本互补配对区域的5’端，与待测序样本不互补配对。

2.根据权利要求1所述的建库方法，其特征在于，所述切割-连接反应体系还包括接头二，所述接头二用于与第一粘性末端所在末端的相对端连接；所述接头一和接头二不相同；所述接头一或接头二通过其上的生物素标记被预先固定在含链霉亲和素或亲和素的固相载体上，且步骤B是在周期性震动中进行的。

3.根据权利要求1或2所述的建库方法，其特征在于，步骤A中用于扩增的PCR引物对的两种引物上均含有可断裂位点或可切除序列，且同一对PCR引物对中的可断裂位点或可切除序列所形成的第一粘性末端之间不能互补配对。

4.根据权利要求2所述的建库方法，其特征在于，步骤A中PCR扩增使用的聚合酶为Taq酶；所述接头二的一端为单碱基突出末端；所述单碱基突出末端为T，其位于所在链的3’端。

5.一种SNP分型方法，其特征在于，包括以下步骤：

A、PCR扩增待测序样本，得含待测SNP位点的扩增产物；所述PCR扩增过程中用于PCR扩增的PCR引物对中至少有一种PCR引物上含有可断裂位点或可切除序列；所述可断裂位点为U，所述可切除序列为RNA序列；

B、将含待测SNP位点的扩增产物加至切割-连接反应体系中进行切割和连接，得含接头一的文库分子；所述切割-连接反应体系包括：连接酶、断裂剂、接头一和连接缓冲液；所述断裂剂为USER酶或RNase H，用于对扩增产物中的可断裂位点或可切除序列进行特异性切割，形成第一粘性末端；所述接头一为核酸分子，含有与第一粘性末端完全互补配对的第二粘性末端；所述可断裂位点或可切除序列在PCR引物对中所处位置在与待测序样本互补配对区域的5’端，与待测序样本不互补配对；

C、将含接头一的文库分子可寻址的固定在固相载体上；

6.根据权利要求5所述的SNP分型方法，其特征在于，所述切割-连接反应体系还包括接头二，所述接头二用于与第一粘性末端所在末端的相对端连接；所述接头一和接头二不相同。

7.根据权利要求5所述的SNP分型方法，其特征在于，当检测的待测序样本有多个时，根据待测序样本的不同分别进行步骤A和B。

8.根据权利要求5所述的SNP分型方法，其特征在于，步骤A中PCR扩增使用的聚合酶为Taq酶；所述接头二的一端为单碱基突出末端；所述单碱基突出末端为T，其位于所在链的3’端。

9.根据权利要求5所述的SNP分型方法，其特征在于，所述接头一为双链核酸分子，其第二粘性末端所在链的5’末端含生物素标记，其被预先固定在含链霉亲和素标记的磁珠上；所述步骤B是在周期性震动中进行的。

10.一种DNA测序方法，其特征在于，包括以下步骤：

A、PCR扩增待测序样本，得含待测序列的扩增产物；所述PCR扩增过程中用于PCR扩增的PCR引物对中至少有一种PCR引物上含有可断裂位点或可切除序列；所述可断裂位点为U，所述可切除序列为RNA序列；

B、将含待测序列的扩增产物加至切割-连接反应体系中进行切割和连接，得含接头一和接头二的文库分子；所述切割-连接反应体系包括：连接酶、断裂剂、接头一、接头二和连接缓冲液；所述断裂剂为USER酶或RNase H，用于对扩增产物中的可断裂位点或可切除序列进行特异性切割，形成第一粘性末端；所述接头一为核酸分子，含有与第一粘性末端完全互补配对的第二粘性末端；所述接头二用于与第一粘性末端所在末端的相对端连接；所述可断裂位点或可切除序列在PCR引物对中所处位置在与待测序样本互补配对区域的5’端，与待测序样本不互补配对；

11.根据权利要求10所述的DNA测序方法，其特征在于，步骤A中PCR扩增使用的聚合酶为Taq酶；所述接头二的一端为单碱基突出末端；所述单碱基突出末端为T，其位于所在链的3’端；所述接头一或接头二通过其上的生物素标记被预先固定在含链霉亲和素或亲和素的固相载体上，且步骤B是在周期性震动中进行的。

12.根据权利要求10所述的DNA测序方法，其特征在于，步骤A中用于扩增的PCR引物对的两种引物上均含有可断裂位点或可切除序列，且同一对PCR引物对中的可断裂位点或可切除序列所形成的第一粘性末端之间不能互补配对。