CN110158157A

CN110158157A - 基于模板材料合成长度固定和特定末端序列dna文库的方法

Info

Publication number: CN110158157A
Application number: CN201810150519.6A
Authority: CN
Inventors: 贾俊岭; 潘辰; 李然
Original assignee: Zhejiang University ZJU
Current assignee: Zhejiang University ZJU
Priority date: 2018-02-13
Filing date: 2018-02-13
Publication date: 2019-08-23
Anticipated expiration: 2038-02-13
Also published as: CN110158157B

Abstract

本发明涉及生物领域，具体提供一种基于模板材料合成固定长度和特定末端序列DNA文库的方法，所述方法包括：片段化双链DNA的获取；DNA末端修复与3’端加尾；3’Biotin修饰的A1接头的连接；连接产物的纯化；DNA固定在有链霉亲和素的固相上；双链DNA变性为单链；引物1杂交；使用脱氧核糖基团3’端羟基具有可逆的化学修饰的dNTPs延伸碱基；五碳糖3’端羟基恢复；固定长度的DNA延伸；5’末端修平；末端序列的选择；末端序列的去除；用于分子克隆的接头的连接。本发明方法能够方便地进行无参考基因组、序列变异性高的区域固定长度和特定末端序文库构建，大幅降低了文库构建成本。

Description

基于模板材料合成长度固定和特定末端序列DNA文库的方法

技术领域

本发明涉及合成生物学领域，具体涉及一种基于模板材料合成长度固定和特定末端序列的DNA文库的制备方法。

背景技术

生命过程和生物行为的背后都有一套调控的分子生物学机制，这些分子机制的规律则是中心法则，即DNA、RNA、蛋白质三者之间信息传递的法则。近30年来，研究生物学机制的手段主要是正向遗传学和反向遗传学，正向遗传学是由现象出发寻找关键分子及机制，反向遗传学则是由分子出发，通过操控分子，揭示机制，并寻找所对应的生物学过程。对于正向遗传学研究，一大技术手段是遗传学筛选，早期针对细胞机制，多采用无偏的筛选，而随着RNA干扰技术，CRISPR(Clustered Regularly Interspaced Short PalindromicRepeats)技术的面世，文库池进行筛选也成为了重要的基因筛选方式之一。

CRISPR***是细菌抗噬菌体免疫的一个部分，约40％的细菌和90％古生菌都会以该***抵抗噬菌体感染。当细菌被噬菌体或者质粒攻击时，一小部分细菌可以将感染源的DNA整合入CRISPR的DNA簇中，当再次被相同的病原感染时，即可启动该区域的转录，与Cas9蛋白可以形成复合物，清除病原的DNA。

在2013年左右，张峰等人根据细菌该免疫防御***，在哺乳动物中实现了基因组DNA的编辑。该***主要有2个组分，一个是根据碱基互补配对识别基因组DNA的导向RNA，另一个是被导向RNA招募的核酸内切酶 Cas9，当它们与基因组DNA上形成复合物，即可导致DNA的双链断裂，由于哺乳动物的的非同源末端修复机制，断裂处会产生***或缺失突变，从而编辑了基因组DNA序列。技术开发之初，主要作为基因组DNA的操作工具，在细胞系或活体中实现基因敲除或敲入。由于导向RNA设计的简便性，多个团队将该技术变为强大的基因组学研究工具，如张峰利用该技术筛选出黑色素瘤耐药相关基因NF1、NF2、与CUL3。由于导向RNA针对基因操作的方便，科学家还将Cas9蛋白设计为激活或抑制的版本，方便的实现了基因的激活或抑制。相较于果蝇等低等生物，哺乳动物细胞以顺式调控为主。张峰等人利用CRISPR技术研究了CUL3基因周围的非编码区 DNA的功能，他们发现转录因子如CTCF,YY1的结合位点对CUL3具有调控作用。任兵等人利用CRISPR技术研究了人胚胎干细胞中POU5F1基因周围的顺式作用元件，他们发现调控POU5F1的顺式作用元件存在于其他基因内部，而张峰等人***的研究lncRNA的时，发现在基因组上激活 lncRNA转录可产生细胞耐药，而lncRNA本身却并不导致耐药，这都提示了对于基因组的注释可能需要多层注释，而不仅仅注释为一种状态。而 Klann TS等人发现，不同细胞中需要不同的顺式作用元件调控基因转录，这提示了本发明对于基因组DNA的注释需要在不同的组织细胞中展开。综合以上，利用组学研究基因组DNA功能，逐渐成为一个重要的领域。

WO2015065964公开了一种利用生物信息学工具，针对参考基因组设计 sgRNA，利用引物池合成sgRNA文库。目前引物池合成的方法价格较高，如果合成上千万条sgRNA，成本十分高昂；同时该策略必须依赖参考基因组，因而无参考序列基因组的物种，如肠道微生物或未知的物种，无法进行CRISPR文库构建；同时，同一物种不同个体之间具有差异的核苷酸序列，在未进行测序的情况下，根据参考基因组设计的sgRNA在个体中可能不起作用。降低成本，同时使用天然核酸作为材料构建gRNA文库是当前一大技术开发方向。

WO 2017081097 A1公开了一种使用二型S限制性内切酶获得20bp短片段文库，能构建天然核酸的gRNA文库的，但该方法操作过程较复杂，且需要固定的几个酶切位点会大量损失sgRNA多样性，故需要更简便，价格低廉的方法制作gRNA文库。

因此，有必要进一步研究开发新的更加简单、有效gRNA文库的新制备方法。

发明内容

针对目前的技术现状，本发明可将天然存在的DNA或核酸，转变为 sgRNA文库，该方法不需要参考序列设计sgRNA，而是直接将天然DNA 转变为固定长度的DNA，如19-24bp，这些长度固定的片段来源于DNA材料，因而不存在参考序列设计不准确的情况。

本发明提供了一种特定末端的序列选择方法并与生成固定长度的DNA 联用，即可获得sgRNA文库。

本发明基于模板材料合成长度固定和特定末端序列的DNA文库的制备方法，所述包括如下步骤：

1)引物杂交：取固定到具有链霉亲和素的固定相上的具有接头A1的单链DNA，

作为实施方案之一，所述步骤1)中接头A1为具有SEQ ID NO:1和/ 或SEQ ID NO:2所示的核苷酸序列，或接头A1为CMV、EF1a、SV40、 PGK1、Ubc、human beta actin、CAG、TRE、UAS、Ac5、Polyhedrin、CaMKIIa、 (Gal1,10)、TEF1、GDS、ADH1、CaMV35s、Ubi、H1、U6；或T7、T7lac、 Sp6、araBAD、trp、lac、Ptac或Pl的3’端序列；

所述A1接头用于将最终产物克隆至克隆载体启动子区域，因而该序列源于克隆载体的启动子区域序列，通常为启动子区域3’端的序列，可增长 A1接头5’端序列；作为实施方案之一，用于真核细胞表达的克隆载体启动子序列包括CMV、EF1a、SV40、PGK1、Ubc、humanbeta actin、CAG、 TRE、UAS、Ac5、Polyhedrin、CaMKIIa、(Gal1,10)、TEF1、GDS、ADH1、CaMV35s、Ubi、H1或U6；作为另一实施方案之一，用于原核细胞表达的克隆载体启动子包括T7、T7lac、Sp6、araBAD、trp、lac、Ptac、pL。

作为实施方案之一，优选所述步骤1)中接头A1为具有SEQ ID NO:1 和/或SEQ IDNO:2所示的核苷酸序列；

作为实施方案之一，所述步骤1)中引物1为SEQ ID NO：11所示的核苷酸序列；

其中，所述引物1和引物2分别为与A1-R和A1-F互补的序列；

作为实施方案之一，所述步骤1)中梯度退火为85度30s，65度1分钟，以0.1度/s缓慢降温至40度，40度5min；

作为实施方案之一，所述步骤1)中所述DNA杂交缓冲溶液为5x SSC 缓冲液，其为(0.75M氯化钠,0.075M醋酸钠，pH 7.0)/0.1％Tween 20 的混合溶液。

2)碱基延长：然后加入DNA聚合酶和3’端具有可逆化学修饰的dNTPs 以延长碱基，之后恢复3’端羟基；

作为实施方案之一，所述步骤2)中DNA聚合酶为9°N (D141A/E143A/A485L)DNA聚合酶；

作为实施方案之一，所述步骤2)中具有可逆化学修饰dNTPs为 3’-O-azidomethyl-dNTPs，3’-O-allyl-dNTPs或3’-O-allyloxycarbony-dNTPs；

作为实施方案之一，所述步骤2)中采用三(2-羧乙酸)膦盐酸盐、TECP 或DTT进行恢复3’端羟基；

作为实施方案之一，所述步骤2)中进一步包括延长碱基时加入延伸缓冲液，65度孵育2min，用清洗缓冲液1清洗磁珠2次，然后用3‘端羟基恢复缓冲液65度孵育1min，清洗缓冲液2清洗2次，必要时，重复以上过程；

作为实施方案之一，所述步骤2)中所述延伸缓冲液为1μM 3'-O- azidomethyl-dNTPs mix,0.015μg/ml 9°N DNA polymerase,50mM Tris pH 9.0,50mM NaCl,6mM MgSO4,1mM EDTA和0.05％Tween 20混合溶液；

作为实施方案之一，所述步骤2)中所述清洗缓冲液1为50mM Tris pH 9.0,50mMNaCl,1mM EDTA和0.05％Tween 20的混合溶液；

作为实施方案之一，所述步骤2)中所述3’端羟基恢复缓冲液为100mM TCEP(Tris-(2-Carboxyethyl)phosphine，三(2-羧乙基)膦盐酸盐),100mM Tris pH 9.0,100mM NaCl,50mM sodium ascorbate,和0.05％Tween 20的混合溶液；

作为实施方案之一，所述步骤2)中所述清洗缓冲液2为100mM Tris pH 9.0,100mMNaCl,和0.05％Tween 20的混合溶液；

3)固定长度DNA延伸：重复步骤2)的循环15～100次，优选为20～30pb，进一步优选20～23次；

4)末端修平：加入单链核酸酶除去5’-末端，

作为实施方案之一，所述步骤4)中单链核酸酶为绿豆酸核酸酶或S1 核酸酶CELI；作为进一步实施方案之一，优选使用绿豆核酸酶；

5)末端序列的选择：加入DNA连接酶和接头B1已进行末端序列的选择；或者替换为在所需选择的序列的位置对应的循环中加入用于延伸的碱基，然通过聚丙烯酰胺凝胶电泳，纯化出完整长度的DNA，完成末端选择；

作为实施方案之一，所述步骤5)中所述DNA连接酶为T4DNA连接酶或平末端/TA连接酶；

作为实施方案之一，所述步骤5)中接头B1包含AscI，Acc65I,AccB1I, ApaI,Asp718I,AspS9I,AvaII,BamHI,BanI,BbeI,Bme18I,BmgT120I,BmiI, BshFI,BshNI,BsnI,Bsp120I,BspLI,BstEII,BstPI,BsuRI,BtsCI,Eco91I, EheI,FseI,HaeIII,KasI,KpnI,PhoI,SanDI,SfoI,SgsI,或SspDI酶切位点的序列；优选接头B1为SEQ ID NO:3和/或SEQ IDNO:4所示的核苷酸序列，或为AsiSI,BsePI,BssHII,NotI,HhaI,PauI,SfaAI的序列；

作为实施方案之一，可选择地，所述步骤5)进一步包括在利用B1接头进行末端序列的选择后，或利用B2接头再次进行末端序列的选择，所述接头B2为SEQ ID NO:5和/或SEQID NO:6所示的核苷酸序列。

6)末端序列的去除：加入DNA连接酶和接头B3，除去末端序列；

本发明方法中，作为实施方案之一，所述DNA连接酶为T4DNA连接酶,或平末端/TA连接酶；

本发明方法中，作为实施方案之一，所述接头B3为包含Type II S限制性内切酶的序列，优选为包含BbsI、AcuI、AlwI、BaeI、BccI、BceAI、BbvI、 BcoDI、BfuAI、BpuEI、BsaXI、BsaXI、BseRI、BsgI、BsmBI、BsmFI、 BsmI、BspCNI、BspMI、BspQI、BtgZI、EarI、Ecil、FauI、HgaI、HphI、 HpyAV、MmeI、MnII、SapI或StaNIType II S限制性内切酶的序列；进一步优选接头B3为SEQ ID NO:7和/或SEQ ID NO:8所述的核苷酸序列；

7)克隆接头的连接：加入DNA连接酶和接头B4进行克隆接头的连接；本发明方法中，作为实施方案之一，所述DNA连接酶为T4DNA连接酶,平末端/TA连接酶；

本发明方法中，作为实施方案之一，所述接头B4包含：1)cas9敲除相关的嵌合RNA序列(addgene：#52961,LentiCRISPR V2)；2)cas9激活相关嵌合RNA序列(addgene:#73797)；3)cpf1相关的克隆序列(addgene： #84739和#84740)。

本发明方法中，作为实施方案之一，所述步骤2)中，使用脱氧核糖基团3’端羟基具有可逆的化学修饰的dNTPs延伸1个碱基：向步骤1)的磁珠DNA复合物加入含有DNA聚合酶和3’端具有可逆的化学修饰的dNTPs；本发明方法优选为3’端O-azidomethyl，但本发明还可以采用其他具有脱氧核糖基团3’羟基以及具有可逆的化学修饰的dNTPs可以替代本方法使用的 3’-O-azidomethyl-dNTPs，本发明包括但不限于3’-O-azidomethyl-dNTPs， 3’-O-allyl-dNTPs或3’-O-allyloxycarbony-dNTPs。

3’端羟基具有可逆化学修饰的dNTPs有2个特点，a)可被DNA聚合酶掺入延伸链；b)该修饰能被能够被高效率切除，并将3’恢复为羟基；因此具有上述两个特点的可逆末端修饰均可用于本发明方法中。

本发明方法中，作为实施方案之一，所述步骤3)中固定长度DNA延伸中；本领域技术人员根据实际需要来进行碱基对的延伸，如包括但不限于15～100pb，例如需要延伸23bp，只需再重复步骤2)二十二次即可。本发明所述重复步骤2)进行多轮循环的可逆末端反应后经过步骤3)的单链核酸酶反应，可获得固定长度的序列，该长度可由15bp至100bp；经过步骤3)，可经过DNA变性步骤如热变性或其他变性剂量，获得延伸的DNA 单链，而后使用DNA单链连接酶连接PAM选择相关的单链寡核苷酸SEQ ID NO：4，经过PCR反应可获得步骤5)中的DNA结构。

本发明方法中，作为实施方案之一，所述步骤5)为可选择性的，其中在进行步骤3)循环时，在第1个循环反应中加入了特定的 3’-O-azidomethyl-dNTPs，在完成具有特定特征的序列延伸后，则不需再进行步骤5)的操作；

步骤5)中加入DNA连接酶和B1接头，是与延伸的DNA末端组合形成一个酶切位点，并利用该酶切位点选择出所需的片段。所述B1接头包含1个酶切位点部分，与步骤2)延伸出的末端几位核酸可组成1个酶切位点，经过DNA内切酶切开后可选择出带有特定末端的序列。

本发明方法中，所述步骤6)中，加入DNA连接酶和B3接头，用于以后PCR扩增出连接产物；其中所述B3接头含有1个2型S限制性内切酶位点，可以对DNA进行切割，切除需要的碱基数。

本发明方法中，所述步骤7)中，加入DNA连接酶和B4接头，所述步骤7)用于连接分子克隆所需要的序列，可通过现有克隆的技术如传统克隆技术或无缝连接技术，将片段克隆到载体上以用于试验,；该序列可由本领域技术人员根据最终的载体及本领域技术常识进行选择，本发明可用载体包括但不限于嵌合RNA序列、LentiCRISPR,LentiCRISPR V2或Lenti-guide序列等其他可供目前商业化载体。

本发明方法中，作为实施方案之一，所述步骤1)中的固定到具有链霉亲和素的固定相上的具有接头A1的单链DNA，可以采用本领域常用的的方法进行制备，例如可先通过热变性或变性剂氢氧化钠将双链DNA变性为单链,将溶液恢复为1M氯化钠环境，用于链霉亲和素和生物学的亲和反应，从而将带有A1接头的DNA固定在固定相上。

作为实施方案之一，本发明包括但不限于采用如下方法制备：

1-1)片段化双链DNA的获取：双链DNA可使用超声或片段化的RNA 逆转录以获得10bp-40Kbp的片段；

1-2)DNA末端修复与3’端加尾:将步骤(1)的DNA与DNA聚合酶混合进行DNA3’末端修平，以及将3’末端加A或G；

本发明方法中中，作为实施方案之一，所述DNA聚合酶包括：3’端加 A尾，使用klenow片段(3'→5'exo^-)；3‘端加G尾，使用Taq DNA聚合酶。

1-3)3’-Biotin修饰的A1接头的连接：将步骤(2)的产物与文库连接酶混合，加入A1接头；所述连接酶为平末端/TA连接酶；

1-4)连接产物的纯化：使用1X体积Ampure XP beads纯化双链DNA，或使用乙醇或异丙醇沉淀法或DNA硅膜柱纯化试剂盒进行DNA回收。

1-5)DNA结合到固相上：将步骤1-4)中的DNA与等体积的带有连和素的固定相进行混合，室温孵育；

本发明方法中，作为实施方案之一，步骤1-5)中所述固相包括2X B&W buffer重悬的T1磁珠、可控多孔玻璃(Controlled Pore Glass)、硅胶(silica gel)、多孔树脂(porousresin)、微阵列玻片(glass slides)、硅基芯片(silicon chips)或者尼龙膜(nylonmembrane)；本发明方法中，作为实施方案之一，室温孵育的时间包括但不限于15min。

1-6)双链DNA变性为单链：使用0.1N NaOH变性在磁珠上的DNA 为单链即得；

本发明方法中，作为实施方案之一，所述步骤1-6)中的变性包括热变性或使用DNA变性剂变性，所述变性剂为氢氧化钠、甲酰胺或尿素；优选氢氧化钠。

本发明方法中，作为实施方案之一，所述步骤1-1)中的双链DNA可以为任意来源的核酸样品，包括任意物种的基因组DNA、由RNA逆转录获得的cDNA、靶向捕获技术获得的DNA文库，和染色质免疫共沉淀获得的DNA等，由生物基因组DNA生成的DNA克隆、如基因cDNA克隆，细菌人工染色体克隆，酵母人工染色体克隆，其片段大小范围为 10bp-40Kbp。

本发明方法中，作为实施方案之一，所述步骤1-2)中，所述DNA聚合酶可以使DNA3’末端修平，并在3’末端加A或G；作为实施方案之一，所述DNA聚合酶包括：当DNA3’端加A尾，则使用Klenow片段(3'→5' exo^-)；当DNA 3’端加G尾，则使用Taq DNA聚合酶；作为实施方案之一，若使用Taq DNA聚合酶进行3’端加G，则A1接头的正向引物的3‘端需将 T改为G；

所述DNA连接上A1接头，以为后续接入3’具有可逆化学修饰的dNTPs 反应准备；同时接头A1包含部分用于分子克隆的序列，如更改载体，则该接头的部分序列可根据载体进行适应性设计，其中更改A1更改主要是根据克隆的目标载体进行更改。

本发明方法制得的DNA文库可克隆至DNA载体上，根据目前主流的克隆文库克隆方法如无缝克隆方法(seamless cloning method)，若设计为无缝克隆的文库，则该A1序列应该为装配时所需要的装配臂序列相同，一侧通常是启动子序列，如A1可更改为mU6或T7启动子的3‘端序列；传统克隆方法－限制性内切酶制作文库时，A1需包含载体序列至酶切位点处。

本发明方法中，作为实施方案之一，所述步骤1-4)中，所述其他PCR 纯化试剂包括但不限于DNA纯化试剂盒，目前实验室主要常用的DNA纯化方法包括乙醇或异丙醇沉淀法，硅膜柱纯化法与核酸磁珠纯化法；优选核酸磁珠纯化法，例如包括但不限Beckman品牌的Ampure XP磁珠。

本发明方法中，作为实施方案之一，所述步骤1-5)中，在使用2X B&W buffer时，将DNA与等体积的2X B&W buffer重悬的T1磁珠混合，室温孵育15min。

作为实施方案之一，所述步骤1-5)中，其他用于DNA单核苷酸链合成的主要固相包括但不限于例如Controlled Pore Glass、silica gel、porous resin，或使用芯片合成DNA单核苷酸链方法中的glass slides or silicon chips 或者nylon membrane时，其中可先将特定序列的DNA单核苷酸链固定在其表面，以用于杂交DNA文库，进行合成固定长度的DNA前，将DNA 通过DNA单链变性和退火杂交即可，即可先固定DNA单核苷酸链在其表面；或者利用DNA文库具有特殊的化学修饰如biotin修饰，将DNA直接固定到strepatvidin resin或磁珠，这些材料的特征为使用一对具有强如共价结合的相互作用的分子，其他具有共价键相互作用的分子修饰，可用用于本发明方法合成DNA文库。

本发明方法中，将DNA固定到固定相上能够高效的将上一步骤反应的 DNA高效快速的切换至一种溶液中，特别是在固定长度的DNA延伸步骤。

本发明方法中，作为实施方案之一，所述步骤1-6)中，所述变性为热变性，或利用氢氧化钠、甲酰胺或尿素等DNA变性剂变性；优选氢氧化钠。

作为实施方案之一，本发明将DNA变性而后与引物杂交，以为可逆末端反应提供一种DNA结构，该结构可利用DNA聚合酶在引物的3’端掺入具有3’端可逆修饰的dNTPs，实现延伸链固定长度的延伸，也可以使用其他方法形成该结构，如将引物1设计为具有biotin修饰的形式，而后与文库进行热变性退火及固定到固相上。

本发明方法中，作为实施方案之一，所述固定长度为15～100bp，优选为20～30pb，进一步优选为20～23pb，作为示例性的说明，可以是15、16、 17、18、19、20、21、22、23、24、25、26、30、35、40、45、50、60、 70、80、90或100pb。本领域技术人员可以理解，所述固定长度是指所得 DNA样品均具有相同的长度，例如均为20、21、22或23bp长度；而且在所述固定长度序列中可以是相同碱基，也可以是不同碱基；所述碱基相同或不同，主要取决于模板链，若所述碱基与模板链碱基是相同的，如果模板只有一种碱基，则所产物序列中的碱基相同；如果有多种模版，则产物的碱基不相同。

本发明方法中，作为实施方案之一，所述末端特定序列为DNA文库的或采用本发明文库筛选出的目标DNA样品末端带有NGG、NAG或NAA序列；作为实施方案之一，优选为SpCas93'NGG；SpCas9VRER:3'NGCG； SpCas9EQR:3'NGAG；SpCas9VQR:3'NGAN or NGNG；SaCas9:3'NNGRRT or NNGRR(N)；AsCpf1and LbCpf1:5'TTTV；AsCpf1RR:5'TYCV； LbCpf1RR 5'TYCV；AsCpf1RVR:5'TATV；Neisseria meningitidis(NM):3' NNNNGATT；Streptococcusthermophilus(ST):3'NNAGAAW；或Treponema denticola(TD):3'NAAAAC。

作为实施方案之一，本发明方法不仅可以用于crispr载体的固定长度 DNA的构建，还可以用于shRNA文库构建。

本发明第二方面提供了一中序列选择的方法，所述方法包括：在循环中掺入特定的可逆末端dNTPs而不是所有的dNTPs，结合高准确性的变性聚丙烯酰胺电泳，即可直接获得有特征的序列，该方法中，在末端序列合成时只掺入特定的dNTP,目标序列的长度为目标长度，而非目标序列的长度短于目标序列长度，通过凝胶电泳区分目标长度DNA与非目标长度DNA，纯化出目标长度DNA即完成特定序列的筛选。

本发明方法可方便地进行无参考基因组，序列变异性高的区域的固定长度和特定末端序文库构建，同时该方法可极大的降低文库构建成本。本发明通过实际的实例证明了本发明依据模板链，合成长度固定和具有末端特定序列文库的方法，本方法合成的DNA文库的序列结构如附图2-D所示，中间是20bp序列来源于起始的DNA材料，文库的固定长度即指该20bp长度固定，末端是特定序列即在获得图2-D中的20bp DNA前，其20bp后所跟的序列如图2-A所示，经过本专利提供的2种方法进行筛选，即可获得图2-C所示的结果，按图中从左往右方向，20bp右边的序列为NGG,末端的序列在这里即NGG序列。

附图说明

图1：本发明构建sgRNA文库构建的流程图；

图2：本发明实施例1中连接B1-B4接头后PCR产物的DNA序列；

图3：实施例1中采用DNA琼脂糖凝胶电泳对本发明在末端序列选择与切除步骤中产生的结果图。A.模板DNA经过23次1bp延伸和3’端羟基恢复，第5个泳道内中出现144bp的条带，其序列如图2-A。B.经过AscI 酶切，和B2接头连接，第4个泳道上出现142bp的条带，其序列如图2-B 所示。C.图B中的DNA经AscI酶切，在第5个泳道内产生81bp左右的条带。D.经过BbsI酶切去除末端碱基，DNA 5’末端补齐和连接B4接头，第 4个泳道产生141bp的条带，该DNA序列如图2-D所示。D.经过短引物的扩增与变性聚丙烯酰胺电泳，第三个泳道中的DNA分布约59bp－60bp；

图4：本发明实施例1中产生20bp序列文库中序列在鼠基因组中分布的代表图；绿色的部分是起始DNA材料－鼠胚胎干细胞H3K4me3染色质免疫共沉淀的DNA在鼠基因组的分布，红色的部分是由起始材料经本发明的操作步骤，产生的20bp文库在鼠基因组中的代表性分布图；

图5：本发明实施例1方法依据模板链合成鼠胚胎干细胞H3K4me3区域20bp sgRNA文库与起始DNA的情况比较比较图：图A是实施例1起始材料DNA比对到鼠胚胎干细胞H3K4me3的情况，图C是实施例1获得的文库比对到鼠胚胎干细胞H3K4me3的情况；图B是实施例1起始材料DNA 紧跟NGG序列的情况，图D是实施1获得文库紧跟NGG序列的比例；

图6：本发明实施例2方法依据模板链合成人胚胎干细胞H3K4me3区域20bp sgRNA文库与起始DNA的情况比较比较图：图A是实施例2起始材料DNA比对到人胚胎干细胞H3K4me3的情况，图C是实施例2获得的文库比对到人胚胎干细胞H3K4me3的情况；图B是实施例2起始材料DNA 紧跟NGG序列的情况，图D是实施例2获得文库紧跟NGG序列的比例；

图7：本发明实施例2方法合成文库与引物池合成文库的比较图：图A 是实施例2合成获得各长度DNA的比例图，图B是实施例2中19和20bp DNA后紧跟NGG序列的比例，图C是商业化引物池合成获得各长度DNA 的比例图，图D是商业化引物池合成法获得的20bp后紧跟NGG序列的比例。

具体实施方式

结合一下实施例或试验例对本发明进行进一步的说明，但本发明并受限于此。

以下实施例中，以鼠胚胎干细胞(实施例1)和人胚胎干细胞(实施例 2)H3K4me3修饰区域DNA为起始材料，合成了20bp的文库，实施例1 和2都是依据以下步骤构建，区别只是起始材料不一样。这些文库都是20bp 长，但不以任何的方式限制本发明合成其他长度文库应用。其中图1和图2 为本发明文库构建的工艺流程图，其中实施例1和2使用的试剂和材料如下：

一、试剂：

1.实施例1起始材料：鼠胚胎干细胞H3K4me3染色质免疫共沉淀DNA

2.实施例2起始材料：人胚胎干细胞H3K4me3染色质免疫共沉淀DNA

3.NEBNext超快速末端修复/加dA尾模块,NEB,E7442

4.NEBNext超快速连接模块,NEB,E7445；

5.Ampure XP beads,Beckman，A63881；

6.Dynabeads^TM T1磁珠,英维捷基,65602；

7.2X结合和清洗缓冲液；

8.无核酸酶的水,Ambion,10977023；

9.1M氢氧化钠,Sigma,S2770-100ML；

10.杂交缓冲液；

11.延伸缓冲液；

12.3’羟基恢复缓冲液；

13.清洗缓冲液1；

14.清洗缓冲液2；

15.10X MBN缓冲液,NEB,M0250；

16.MBN(10U/μL),NEB,M0250；

17.10X T4DNA连接缓冲液,NEB,B0202；

18.T4多聚核苷酸激酶,NEB,M0201；

19.T4DNA连接酶,NEB,M0202；

20.Qiaquick胶回收试剂盒,Qiagen,28704；

21.Qiaquick PCR产物回收试剂盒,Qiagen,28104；

22.10X Cutsmart缓冲液,NEB,B7204；

23.10X NEBuffer 2.1,NEB,B7202；

24.T4DNA聚合酶(3U/μl),NEB,M0203；

25.AscI,NEB,R0558；

26.BbsI,NEB,R3559；

27.5X Q5反应缓冲液,NEB,M0491；

28.dNTPs 10mM,NEB,N0447；

29.Q5DNA聚合酶,NEB,M0491；

30.40％丙烯酰胺：甲叉双丙烯酰胺(29:1),Sangon,B546013；

31.10X TBE缓冲液,Sangon,B540024；

32.尿素，Sangon,A510907；

33.过硫酸铵，Sangon,A00486；

TEMED(N,N,N',N'-四甲基乙二胺),Sangon,A100761；

32.2x尿素-TBE buffer，Sangon,C506046。

实施例1

(1)准备所有的接头

1.接头的准备

使用下面的体系分别磷酸化A1-R-3’-biotin(SEQ ID NO.1),B1-F(SEQ IDNO.3),B2-F(SEQ ID NO.5),B3–F(SEQ ID NO.7),B4-F(SEQ ID NO.9):

加入3μl分别加入反向引物A1-F(SEQ ID NO.2),B1-R(SEQ ID NO.4),B2-R(SEQID NO.6),B3-R(SEQ ID NO.8)，B4-R(SEQ ID NO.10), 7ul H2O，在PCR仪上94度2分钟，以0.1度/s降温至25度，将接头保存在负20的冰箱保存。

(2)DNA末端修复与3’端加尾:

2.DNA末端修复与3’端加A:按下面的体系进行反应体系配置

20度孵育30min，65度孵育30min。

(3)3’-Biotin修饰的A1接头的连接和连接产物的纯化:

3.连接A1接头

20度孵育4小时.用80μl Ampure XP beads纯化DNA，以100μl H2O洗脱DNA。

(4)DNA结合到固相上:

4.固定DNA至链霉亲和素磁珠：

取50μl Dynabeads^TM T1磁珠到1个eppendorf管，加入200μl 1X结合和清洗缓冲液，将eppendorf管放在磁架上1min，弃上清，重复洗一次，以100μl结合和清洗缓冲液重悬Dynabeads^TM T1磁珠，加入100μl DNA，混匀，室温孵育15min，将eppendorf管在磁架上1min，弃上清.用200μl 1X 结合和清洗缓冲液洗磁珠2次，100μl 0.1M NaOH清洗磁珠1次

(5)双链DNA变性为单链

5.双链DNA变性为单链：

用100μl 0.1M NaOH重悬磁珠，室温孵育10分钟，将eppendorf管放置在磁架1–2分钟，弃上清，用100μL 0.1M NaOH洗1次,100μl杂交缓冲液清洗2次。

(6)引物杂交

6.引物1(SEQ ID NO.11)杂交：

稀释5μl 10μM引物1至95μl杂交缓冲液，并重悬磁珠中,85℃孵育30s,65℃ 60s,以0.1℃/s的速度降温至40℃,40℃孵育5分钟，将 Eppendorf管放置在磁架上，弃上清,洗液1清洗磁珠2次。

(7)碱基延长和固定长度DNA延伸：

7.23个循环可逆末端反应：

加入延伸缓冲液，65℃孵育1min，将Eppendorf放在磁架上，弃上清，清洗缓冲1清洗磁珠2次；加入3’羟基恢复缓冲液，65℃孵育30s，将tube 放在磁架上，弃上清，加入清洗缓冲液2，65℃孵育30s，将Eppendorf管放在磁架上，弃上清，清洗缓冲液2洗1次，清洗缓冲液1洗一次，此为一个循环，重复以上步骤，直至23个循环完成。

(8)末端修平：

8.DNA 5’端悬挂臂修平

用TE清洗磁珠2次，按下面表格准备试剂重悬磁珠：

30℃孵育30min，TE清洗磁珠3次。

9.DNA 5’端磷酸化

按下面表格准备试剂重悬磁珠:

37℃孵育30min，TE清洗磁珠2次

(9)末端序列的选择：

10.B1接头连接

按下面表格准备试剂重选磁珠:

16℃孵育过夜,TE清洗磁珠2次

11.PCR扩增

按下表配置PCR体系：

将PCR管放置在热循环仪上，按下面的程序进行PCR反应：

12.DNA琼脂糖凝胶电泳与DNA回收

步骤11产生的DNA序列如图2-A所示。准备含有50μg/ml溴化乙锭的1.8％的低熔点琼脂糖TAE胶，将PCR产物与上样缓冲液混合，然后加入到胶点样孔中，70V运行35分钟，在300nm紫外光下显影，如图3-A 所示，会产生144bp的条带，割下该条带并利用gelextraction kit纯化出 DNA,。

13.DNA5’端加biotin修饰.

按下面的表格准备PCR体系：

将PCR管放在热循环仪上，按下面的程序执行：

使用PCR clean-up试剂盒进行DNA回收，40μl水洗脱，浓度约70ng/μl

14.第一轮NGG PAM选择

将200ng Biotin-DNA固定至链霉亲和素磁珠上，按下面的体系配置酶切体系：:

将Eppendorf管放在37℃水浴中，过夜孵育。

15.B2接头连接

按下面的表格准备反应体系:

室温反应2小时，用TE清洗磁珠2次.

16.PCR扩增

按下面的表格准备PCR反应体系：

将PCR管放入热循环仪中，按下面的程序进行PCR反应：

17.DNA琼脂糖胶凝胶电泳与DNA回收

步骤16产生的DNA如图2-B所示准备含有50ug/ml溴化乙锭的1.8％的低熔点琼脂糖TAE胶，将PCR产物与上样缓冲液混合，然后加入到胶点样孔中，70V运行35分钟，在300nm紫外光下显影，如图3-B所示的142bp 的条带，割下该条带，使用Qiagen胶回收试剂盒纯化DNA。

18.第二轮NGG PAM选择：

按下面的体系准备酶切反应：

37度孵育过夜。

19.DNA琼脂糖胶凝胶电泳与DNA回收

准备含有50ug/ml溴化乙锭的2％的低熔点琼脂糖TAE胶，将酶切产物与上样缓冲液混合，然后加入到胶点样孔中，35V运行90分钟，在300nm 紫外光下显影，如图2-C割下81bp左右的条带，使用Qiagen胶回收试剂盒纯化DNA，44.8μl水洗脱。

20.DNA5’端悬挂臂修平

按下面的体系准备反应体系：

30度孵育30min，使用100μl Ampure XP磁珠纯化DNA,17.5μl水洗脱。

21.DNA5’端磷酸化

按下面的体系准备反应体系：

37度孵育30分钟，65℃孵育20min。

(10)末端序列的去除

22.按下面的体系准备反应体系：

16℃孵育过夜。60ul Ampure XP beads纯化DNA，34.5μl H2O洗脱DNA。

23.PCR

按下面的体系准备反应体系：

将PCR管放置在热循环仪中，按下面的程序进行PCR反应

24.DNA琼脂糖胶凝胶电泳和DNA回收：

步骤23产生的DNA序列入图2-C所示，准备含有50μg/ml溴化乙锭的1.8％的低熔点琼脂糖TAE胶，将PCR产物与上样缓冲液混合，然后加入到胶点样孔中，70V运行35分钟，在300nm紫外光下显影，割下143bp 的条带，使用Qiagen胶回收试剂盒纯化DNA。

25.DNA5’端加上biotin修饰.

按下面的表格准备PCR体系：

将PCR管放在热循环仪上，按下面的程序执行：

使用Qiagen PCR产物纯化试剂盒进行DNA回收，40μl水洗脱，浓度约70ng/μl

26.NGG PAM去除

将Eppendorf管放在37℃水浴中，过夜孵育。

步骤27-31对应权利要求1-7)：

27.DNA3’末端补齐

按下面的体系准备反应体系：

12度孵育15min，TE清洗磁珠2次。

28.DNA5’端磷酸化

按下面的体系准备反应体系：

37度孵育30分钟，TE清洗磁珠2次。

(11)克隆接头的连接

29.按下面的体系准备反应体系：

16℃孵育过夜，TE缓冲液清洗磁珠2次。

30.PCR扩增:

按下面的体系准备反应体系：

将PCR管放置在热循环仪中，按下面的程序进行PCR反应

31.DNA琼脂糖凝胶电泳与DNA回收

步骤30产生的DNA序列如图2-D所示。准备含有50μg/ml溴化乙锭的1.8％的低熔点琼脂糖TAE胶，将PCR产物与上样缓冲液混合，然后加入到胶点样孔中，70V运行35分钟，在300nm紫外光下显影，如图2-D所示，200bp以下有一条141bp的条带，割下该条带，并使用Qiagen胶回收试剂盒纯化DNA。

(12)短DNA链制备

32.短DNA链制备

按下面的体系准备反应体系：

将PCR管放置在热循环仪中，按下面的程序进行PCR反应

100％乙醇沉淀纯化DNA.

33.变性聚丙烯酰胺凝胶电泳纯化DNA

配置DNA变性聚丙烯酰胺胶：

凝固后，以180V预跑30min，混合步骤32中的DNA与2x urea-TBE buffer,90度变性5min，直接放置在冰上，立刻开始上样，以180V运行40 个小时，剥胶后，以0.1％甲苯安蓝进行染色30min，以水脱色，切除60nt 以上的部分，在TE中65度孵育过夜。

(13)构建高通量测序文库

34.构建高通量测序文库，分析文库中20bp的内容；

将PCR管放置在热循环仪中，按下面的程序进行PCR反应

1.8％DNA琼脂糖凝胶电泳回收215bp的片段。

本发明构建了实施例1的文库，并通过实施例1验证了了1)依据模板合成；2)固定长度DNA；3)末端序列选择。

其中附图3：采用DNA琼脂糖凝胶电泳对本发明在末端序列选择与切除步骤中产生的结果图。A.模板DNA经过23次1bp延伸和3’端羟基恢复，第5个泳道内中出现144bp的条带，其序列如图2-A。B.经过AscI酶切，和B2接头连接，第4个泳道上出现142bp的条带，其序列如图2-B所示。 C.图B中的DNA经AscI酶切，在第5个泳道内产生81bp左右的条带。D. 经过BbsI酶切去除末端碱基，DNA 5’末端补齐和连接B1接头，第4个泳道产生141bp的条带，该DNA序列如图2-D所示。D.经过短引物的扩增与变性聚丙烯酰胺电泳，第三个泳道中的DNA分布约59bp－60bp。

从附图4中，可以看出20bp的序列是比对到鼠H3K4me3修饰的区域，该方法的得到的序列是来自于本发明的起始材料DNA。从附图5A、C可看出，20bp gRNA与起始的DNA在目标区域的比例上基本一致，这证明了本发明的方法，可以将目标区域的DNA构建成固定长度的DNA文库。

从图5-B、D可以看出本发明中，鼠胚胎干细胞H3K4me3区域的gRNA 在基因组上约96.65％紧跟着NGG序列，这证明该方法可从文库中挑选出特定末端序列的DNA。

综合以上两点，通过本发明，本发明可以构建出定长的，能与spCas9 联用的鼠胚胎干细胞H3K4me3区域的文库。

实施例2人H9胚胎干细胞的文库的制备

本实施例2使用人胚胎干细胞H3K4me3染色质免疫共沉淀DNA构建了定长的文库，除模板不同外，其他方法与实施例1相同。结果如图6和图7所示。

如图6中所示，合成的文库是与起始材料一致的，都位于人胚胎干细胞H3K4me3区域，同时这些DNA之后紧跟的是NGG序列，这证明了本发明的筛选末端序列也可以完美重现。

图6：为依据模板链合成人胚胎干细胞H3K4me3区域20bp sgRNA文库与起始DNA的情况比较比较图：图A是起始材料DNA比对到人胚胎干细胞H3K4me3的情况，图C是获得的文库比对到人胚胎干细胞H3K4me3 的情况；图B是起始材料DNA紧跟NGG序列的情况，图D是获得文库紧跟NGG序列的比例；从图6可以看出，该文库与起始DNA材料在H3K4me3 修饰区的比例一致，并且20bp后紧跟的都是NGG序列。

图7：本发明方法合成文库与引物池合成文库的比较图：图A是合成获得各长度DNA的比例图，图B是19和20bp DNA后紧跟NGG序列的比例，图C是商业化引物池合成获得各长度DNA的比例图，图D是商业化引物池合成法获得的20bp后紧跟NGG序列的比例。

目前主流的gRNA合成文库的方法是引物池合成法，本发明人将本发明和引物池合成法进行了比较，主要表现在是否需要参考序列，是否需要大型仪器以及成本。可以看出本发明能够实现引物池合成方法不能实现的无参考序列的gRNA合成，同时保证了最终的文库能够实现功能的gRNA 更多。本发明不需要大型设备，这为普通实验室进行gRNA合成提供了便利，从成本上看，目前本发明人制作过一个文库约含有13万种gRNA,通过精算，该文库构建的成本约1000元左右，远低于引物池的合成成本；从附图7中，可以看出在质量上本专利的文库约85％左右为20bp和19bp(都可作为gRNA，因为它们在基因组上紧跟的序列都是NGG),引物池合成的 gRNA约89％为20bp，但本发明的20bp和19bp百分之90以上都是在基因组上紧跟NGG序列的，而引物池合成的文库该比例仅有89％，因而本发明的方法具有很大的潜力替代当前价格高昂的引物池合成法。

	本专利	引物池合成序列
			是否需要参考基因组	不需要	需要
是否需要精密仪器	不需要	需要
			成本精算	目前合成13万条，约1000元	1万元起，约1元1条

综合实施例1和实施例2，可以看出本发明方法不仅能能够稳健地实现根据起始材料合成固定长度和特定末端序列的文库，还大幅节约了成本。

序列表

<110> 浙江大学

<120> 基于模板材料合成长度固定和特定末端序列DNA文库的方法

<130> LAC170846P

<160> 16

<170> SIPOSequenceListing 1.0

<210> 1

<211> 18

<212> DNA/RNA

<213> 人工序列(Artificial Sequence)

<400> 1

gaaaggacga aacaccgt 18

<210> 2

<211> 41

<212> DNA/RNA

<213> 人工序列(Artificial Sequence)

<400> 2

cggtgtttcg tcctttccac aagatagatc ggaagagcgt c 41

<210> 3

<211> 58

<212> DNA/RNA

<213> 人工序列(Artificial Sequence)

<400> 3

cgcgcccaca cgtctgaact ccagtcacag tcaacaatct cgtatgccgt cttctgct 58

<210> 4

<211> 60

<212> DNA/RNA

<213> 人工序列(Artificial Sequence)

<400> 4

caagcagaag acggcatacg agattgttga ctgtgactgg agttcagacg tgtgggcgcg 60

<210> 5

<211> 56

<212> DNA/RNA

<213> 人工序列(Artificial Sequence)

<400> 5

cgcgcctcat cgcgtcgacc aatccatatg actagtagat cctctagagt cgacct 56

<210> 6

<211> 54

<212> DNA/RNA

<213> 人工序列(Artificial Sequence)

<400> 6

gaaggtcgac tctagaggat ctactagtca tatggattgg tcgacgcgat gagg 54

<210> 7

<211> 58

<212> DNA/RNA

<213> 人工序列(Artificial Sequence)

<400> 7

tcttcaagct tggcgtaatc atggtcatag ctgtttcctg tgtgaaattg ttatccgc 58

<210> 8

<211> 59

<212> DNA/RNA

<213> 人工序列(Artificial Sequence)

<400> 8

agcggataac aatttcacac aggaaacagc tatgaccatg attacgccaa gcttgaaga 59

<210> 9

<211> 28

<212> DNA/RNA

<213> 人工序列(Artificial Sequence)

<400> 9

gttttagagc tagaaatagc aagttaaa 28

<210> 10

<211> 60

<212> DNA/RNA

<213> 人工序列(Artificial Sequence)

<400> 10

actttttcaa gttgataacg gactagcctt attttaactt gctatttcta gctctaaaac 60

<210> 11

<211> 44

<212> DNA/RNA

<213> 人工序列(Artificial Sequence)

<400> 11

tggacgctct tccgatctat cttgtggaaa ggacgaaaca ccgt 44

<210> 12

<211> 60

<212> DNA/RNA

<213> 人工序列(Artificial Sequence)

<400> 12

taacttgaaa gtatttcgat ttcttggctt tatatatctt gtggaaagga cgaaacaccg 60

<210> 13

<211> 19

<212> DNA/RNA

<213> 人工序列(Artificial Sequence)

<400> 13

tggaaaggac gaaacaccg 19

<210> 14

<211> 21

<212> DNA/RNA

<213> 人工序列(Artificial Sequence)

<400> 14

tgctatttct agctctaaaa c 21

<210> 15

<211> 106

<212> DNA/RNA

<213> 人工序列(Artificial Sequence)

<400> 15

caagcagaag acggcatacg agatcgatta gtgactggag ttcagacgtg tgctcttccg 60

acgtgtgctc ttccgatccc ttattttaac ttgctatttc tagctc 106

<210> 16

<211> 82

<212> DNA/RNA

<213> 人工序列(Artificial Sequence)

<400> 16

aatgatacgg cgaccaccga gatctacact ctttccctac acgacgctct tccgatcttc 60

ttgtggaaag gacgaaacac cg 82

Claims

1.一种基于模板材料合成长度固定和特定末端序列DNA文库的方法，其特征在于，所述方法包括：

1)引物杂交：取固定到具有链酶亲和素的固定相上的带有接头A1的单链DNA，将所述单链DNA加入到DNA杂交缓冲溶液和引物1中，梯度退火；

所述接头A1为SEQ ID NO:1和/或SEQ ID NO:2所示的核苷酸序列；或为包含CMV、EF1a、SV40、PGK1、Ubc、human beta actin、CAG、TRE、UAS、Ac5、Polyhedrin、CaMKIIa、(Gal1,10)、TEF1、GDS、ADH1、CaMV35s、Ubi、H1、U6；或T7、T7lac、Sp6、araBAD、trp、lac、Ptac或Pl的序列；

所述引物1具有SEQ ID NO：11所示的核苷酸序列。

2)碱基延长：然后向步骤1)产物中加入DNA聚合酶和3’端具有可逆化学修饰的dNTPs以延长碱基，之后恢复3’端羟基。

4)末端修平：加入单链核酸酶除去5’-末端，其中，所述单链核酸酶为绿豆酸核酸酶、S1核酸酶或CEL I核酸酶；

5)末端序列的选择：加入DNA连接酶和接头B1，所述接头B1为包含AscI,Acc65I,AccB1I,ApaI,Asp718I,AspS9I,AvaII,BamHI,BanI,BbeI,Bme18I,BmgT120I,BmiI,BshFI,BshNI,BsnI,Bsp120I,BspLI,BstEII,BstPI,BsuRI,BtsCI,Eco91I,EheI,FseI,HaeIII,KasI,KpnI,PhoI,SanDI,SfoI,SgsI,或SspDI酶切位点的序列；优选接头B1为SEQ ID NO:3和/或SEQ ID NO:4所示的核苷酸序列，或AsiSI,BsePI,BssHII,NotI,HhaI,PauI,或SfaAI序列，以完成末端选择；或

替换为在所需选择的序列的位置对应的循环中加入用于延伸的碱基，然后通过聚丙烯酰胺凝胶电泳，纯化出完整长度的DNA，从而完成末端选择；

6)末端序列的去除：加入DNA连接酶和接头B3以除去末端序列，其中所述接头B3为包含Type II S限制性内切酶的序列，优选为包含BbsI、AcuI、AlwI、BaeI、BccI、BceAI、BbvI、BcoDI、BfuAI、BpuEI、BsaXI、BsaXI、BseRI、BsgI、BsmBI、BsmFI、BsmI、BspCNI、BspMI、BspQI、BtgZI、EarI、Ecil、FauI、HgaI、HphI、HpyAV、MmeI、MnII、SapI或StaNITypeII S限制性内切酶的序列；更优选接头B3为SEQ ID NO:7和SEQ ID NO:8所示的核苷酸序列；

7)克隆接头的连接：加入DNA连接酶和接头B4，以连接接头B4，所述接头B4为具有SEQID NO:9和/或SEQ ID NO:10所示的核苷酸序列。

2.根据权利要求1所述的方法，其特征在于，所述步骤1)中所述DNA杂交缓冲溶液为5xSSC缓冲液。

3.根据权利要求1所述的方法，其特征在于，所述步骤1)中梯度退火为85℃30s，65℃1分钟，以0.1度/s缓慢降温至40℃，40℃5分钟。

4.根据权利要求1所述的方法，其特征在于，所述步骤2)进一步包括：

所述DNA聚合酶为9°N(D141A/E143A/A485L)DNA聚合酶；

所述具有可逆化学修饰dNTPs为3’-O-azidomethyl-dNTPs，3’-O-allyl-dNTPs或3’-O-allyloxycarbony-dNTPs；或

采用三(2-羧乙酸)膦盐酸盐、TECP或DTT恢复3’端羟基。

5.根据权利要求1所述的方法，其特征在于，所述步骤2)中进一步包括延长碱基时加入延伸缓冲液，孵育，用清洗缓冲液1清洗磁珠，然后用3’端羟基恢复缓冲液孵育，清洗缓冲液2清洗。

6.根据权利要求5所述的方法，其特征在于，所述步骤2)中，

所述延伸缓冲液的成分是1μM 3'-O-azidomethyl-dNTPs mix,0.015μg/ml 9°NDNApolymerase,50mM Tris pH 9.0,50mM NaCl,6mM MgSO4,1mM EDTA和0.05％Tween 20的混合溶液；

所述清洗缓冲液1的成分是50mM Tris pH 9.0,50mM NaCl,1mM EDTA和0.05％Tween20的混合溶液；

所述3’端羟基恢复缓冲液的成分是100mM TCEP,100mM Tris pH 9.0,100mM NaCl,50mM sodium ascorbate和0.05％Tween 20的混合溶液；或

所述清洗缓冲液2的成分是100mM Tris pH 9.0,100mM NaCl和0.05％Tween 20的混合溶液。

7.根据权利要求1所述的方法，其特征在于，所述步骤5)中所述DNA连接酶为T4DNA连接酶或平末端/TA连接酶，连接的B1接头用于末端序列选择。

8.根据权利要求1所述的方法，其特征在于，所述步骤5)进一步包括：在利用B1接头进行末端序列的选择后，或利用B2接头再次进行末端序列的选择，所述接头B2为SEQ ID NO:5和/或SEQ ID NO:6所示的核苷酸序列。

9.根据权利要求1所述的方法，其特征在于，所述步骤6)中所述DNA连接酶为T4DNA连接酶或平末端/TA连接酶，连接的B3接头用于末端切除。

10.根据权利要求1所述的方法，其特征在于，所述步骤7)中所述DNA连接酶为T4DNA连接酶或平末端/TA连接酶，连接的B4用于克隆接头连接。

11.根据权利要求1所述的方法，其特征在于，所述步骤7)并一步包括：所述载体序列为嵌合RNA序列。

12.根据权利要求1所述的方法，其特征在于，所述步骤1)中的固定到具有链霉亲和素的固定相上的具有接头A1的单链DNA采用如下方法制备：

1-1)片段化双链DNA的获取：双链DNA可使用超声或片段化的RNA逆转录以获得10bp-40Kbp的片段；

1-2)DNA末端修复与3’端加尾:将步骤1-1)所得DNA与DNA聚合酶混合进行DNA 3’末端修平，以及3’末端加A或G；

1-3)3’-Biotin修饰的A1接头的连接：将步骤1-2)的产物与连接酶混合，加入A1接头；所述连接酶为平末端/TA DNA连接酶；

1-4)连接产物的纯化：使用1X体积Ampure XP beads纯化双链DNA，或使用乙醇或异丙醇沉淀法或DNA硅膜柱纯化试剂盒进行DNA回收；

1-5)DNA结合到固相上：将步骤1-4)中的DNA与等体积的带有链霉亲和素的固定相进行混合，室温孵育；

1-6)双链DNA变性为单链：将磁珠上的DNA变性为单链，即得。

13.根据权利要求11所述的方法，其特征在于，所述步骤1-2)中，所述DNA聚合酶包括：当DNA 3’端加A尾，则使用Klenow片段(3'→5'exo^-)；当DNA3’端加G尾，则使用Taq DNA聚合酶。

14.根据权利要求12所述的方法，其特征在于，所述步骤1-5)中固相包括2X B&Wbuffer重悬的T1磁珠，可控多孔玻璃(Controlled PoreGlass)、硅胶(silica gel)、多孔树脂(porous resin)、微阵列玻片(glass slides)、硅基芯片(silicon chips)或者尼龙膜(nylon membrane)。

15.根据权利要求12所述的方法，其特征在于，所述步骤1-6)中所述变性为热变性或DNA变性剂变性；优选所述DNA变性剂为氢氧化钠、甲酰胺或尿素。

16.根据权利要求1所述的方法，其特征在于，所述固定长度是指15～100bp，优选为20～30pb，进一步优选为20～23pb。

17.根据权利要求1所述的方法，其特征在于，所述特定末端序列为DNA文库或筛选出的DNA样品末端带有NGG、NAG或NAA序列；优选为SpCas9：3'NGG；或SpCas9VRER突变体:3'NGCG；SpCas9EQR突变体:3'NGAG；SpCas9VQR突变体:3'NGAN or NGNG；SaCas9突变体:3'NNGRRTor NNGRR(N)；AsCpf1and LbCpf1:5'TTTV；AsCpf1RR突变体:5'TYCV；LbCpf1RR突变体：5'TYCV；AsCpf1RVR突变体:5'TATV；Neisseria meningitidis(NM):3'NNNNGATT；Streptococcus thermophilus(ST):3'NNAGAAW；或Treponema denticola(TD):3'NAAAAC的Cas9蛋白所需的末端序列。