CN114317529B - 一种寡核苷酸链随机拼合方法 - Google Patents

一种寡核苷酸链随机拼合方法 Download PDF

Info

Publication number
CN114317529B
CN114317529B CN202111522088.XA CN202111522088A CN114317529B CN 114317529 B CN114317529 B CN 114317529B CN 202111522088 A CN202111522088 A CN 202111522088A CN 114317529 B CN114317529 B CN 114317529B
Authority
CN
China
Prior art keywords
oligonucleotide
primer
chain
random
splicing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202111522088.XA
Other languages
English (en)
Other versions
CN114317529A (zh
Inventor
夏朋延
王硕
朱芳蕊
钱言
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Peking University
Original Assignee
Peking University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Peking University filed Critical Peking University
Priority to CN202111522088.XA priority Critical patent/CN114317529B/zh
Publication of CN114317529A publication Critical patent/CN114317529A/zh
Application granted granted Critical
Publication of CN114317529B publication Critical patent/CN114317529B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本发明涉及分子生物学技术领域,具体涉及一种寡核苷酸链随机拼合方法。本发明提供的随机拼合方法为以磁珠为载体,采用用于寡核苷酸链随机拼合的引物组,将n条寡核苷酸链中的任意k条寡核苷酸链随机拼合为长链寡核苷酸。该方法能够以较高的效率将短链寡核苷酸随机拼合为长链寡核苷酸,通过降低合成核苷酸随机序列的长度,更好地保证短链寡核苷酸中核苷酸的随机性和序列的多态性,而后再通过随机拼合来达到目标寡核苷酸链的长度。由此构建的长链寡核苷酸库和随机肽库具有较大的库容,且多态性较高,具有较好的应用前景。

Description

一种寡核苷酸链随机拼合方法
技术领域
本发明涉及分子生物学技术领域,具体涉及用于寡核苷酸链随机拼合的引物组以及寡核苷酸链随机拼合方法。
背景技术
肽库(peptide libraries)是大量特定长度且序列不同的短肽的集合,它包括了该长度短肽中各种(或绝大部分)氨基酸序列的排列组合。目前,利用随机肽库进行筛选已广泛应用于蛋白质间相互作用、药物设计及筛选等多个领域。
合成随机肽库较为常用的方法是在长链DNA合成时设计核苷酸回文序列,其中编码随机核苷酸序列的前两个核苷酸为任意核苷酸N(A/T/C/G),最后一个核苷酸根据密码子的简并性设计为K(G/T)。根据载体及酶切位点的情况,设计出两条寡核苷酸单链(Christian RB,Zuckermann RN,Kerr JM,Wang L,Malcolm BA.Simplified methods forconstruction,assessment and rapid screening of peptide libraries inbacteriophage.J Mol Biol.1992;227(3):711-718.doi:10.1016/0022-2836(92)90219-a.)。在PCR扩增中,两条寡核苷酸单链在Taq酶作用下互补延伸成双链。通过优化PCR反应条件及参数,可以更好地保证构建寡核苷酸库时随机序列DNA的多样性(胡又佳,高枫,朱春宝,等.随机序列八肽库的构建及其在双杂交***中的应用[J].生物技术,2007,17(2):82-86.DOI:10.3969/j.issn.1004-311X.2007.02.030.)。
目前,市售的常用肽库主要是NEB公司提供的3种随机肽库,包括7肽库(Ph.D.-7)、12肽库(Ph.D.-12)和含有二硫键的环7肽库(Ph.D.-C7C),其中,Ph.D.-C7C随机肽库所展示的多肽两侧各加了一个半胱氨酸,所有肽库的容量超过20亿个克隆。
体外合成随机肽库主要有两种方法。第一种是Split and Mix,该方法分为三个基本步骤:平分(Split)、偶联(Couple)和混合(Mix)。首先平分,将树脂球平分为若干等份,等份数量与肽库的氨基酸种类相同;其次偶联,每一等份加入一份特定对应的氨基酸组份进行彻底反应;最后混匀,这一步将所有等份完全混匀。然后重新平分为与之前相同数目的等份,这样可以得到均匀的等量的多肽混合物。重复这三个基本步骤N次(N为一条目标肽的氨基酸个数),可以快速生成一系列新分子,而树脂球数量不变。树脂球每次只与一种反应物反应,每个树脂球只会产生一种化合物(One-bead one-compound:OBOC library,一树脂球一种肽)。由于每一次都是完全反应,因此混合物中所有的多肽都是等比例的。在除去保护基团后,树脂球上的多肽便可以用于测试。
第二种是Pre-mix,由于OBOC方法合成较大的肽库存在其局限性,常用氨基酸预混合液的方法合成混合肽库。该方法中用于肽库合成的氨基酸经提前混合后偶联到一批树脂球上。在偶联最后一个氨基酸之前,将树脂球平分为N等份(N等于肽库中氨基酸种类的数量),然后分别添加一种氨基酸进行反应。这样可以得到N末端残基标志的子库。由于每个树脂球都是在相同环境下、由相同的试剂反应,因此,该方法合成的肽库中每个树脂球上都包含子库的所有肽的集合。
目前的随机肽库合成方法一般仅在应用于生成短肽序列(5-10aa)时,才能够较好地保证短肽库的丰富性与多样性。但是,肽段长度较短,会导致其与目的蛋白结合位点小进而使得相互作用力较弱,这可能会影响整体筛选效率与特异性。在采用现有的方法直接随机合成更长肽链的多肽库时,由于长度限制,每个位点氨基酸的随机性较差,合成多肽种类的多样性会受到限制,较难符合理想的建库筛选标准。
目前,DNA拼接方法主要有核酸外切酶法、尿嘧啶-DNA糖基化酶法、特殊限制性内切酶方法和PCR技术。前三种方法的主要原理都是在DNA片段两侧产生互补序列或通过重叠序列进行连接,需要额外增加酶切位点,因此会引入额外的干扰序列,对于以构建短肽库进行筛选为目的的DNA拼接并不适用。而利用PCR技术进行DNA拼接需要在每个片段之间设计10-25bp的互补区域,该互补区域的长度往往已经超出了想要拼接的寡核苷酸链的长度,因此也无法适用于较短的寡核苷酸链的多片段拼接。
发明内容
本发明的目的之一是提供一种用于寡核苷酸链随机拼合的引物组、试剂盒。本发明的另一目的是提供寡核苷酸链的随机拼合方法以及利用该方法构建随机长链肽库的方法。
在利用生物体表达、合成随机肽库时,寡核苷酸链库的合成是随机肽库合成的关键。寡核苷酸链随机文库的随机序列DNA的多样性决定了肽库的丰富性和多样性。对于长链肽库,直接合成随机寡核苷酸链会导致核苷酸分布的随机性较差,进而影响随机DNA序列的多样性。若可以先合成较短的寡核苷酸链,再将其进行拼接,则能够更好地保证核苷酸分布的随机性。然而,本发明在研发时发现,现有技术中常用的DNA重组、拼接方法在用于短片段(20bp以内)寡核苷酸链的连接时,存在拼合效率低、无法保留短片段特性进行连接、无法进行相对较为无缝的连接(引入过多的干扰序列)、无法在同一反应体系内完成随机拼合、无法满足平末端连接等问题。为解决上述问题,本发明开发了一种高效的寡核苷酸链的随机拼合方法。该随机拼合方法以磁珠为载体,利用具有特异设计的组成结构的引物、连接子和不同的DNA聚合酶的配合作用,实现了较高的寡核苷酸链的拼合效率。
具体地,本发明提供以下技术方案:
首先,本发明提供用于寡核苷酸链随机拼合的引物组,将n条寡核苷酸链中的任意k条寡核苷酸链随机拼合为长链寡核苷酸,所述引物组包含n×k条引物,n和k均为大于1的整数,且k<n;
为使每个寡核苷酸链均在拼合后的长链寡核苷酸的任意拼合位置出现,将n×k条引物分为n个亚组,每个亚组包含k条引物,每个亚组的k条引物如下:
位于拼合后的长链寡核苷酸的5’端的第1条寡核苷酸链的引物自5’-3’方向依次包含第1连接子序列的反向互补序列、第1条寡核苷酸链的反向互补序列;
位于拼合后的长链寡核苷酸的5’端的第2条寡核苷酸链的引物自5’-3’方向依次包含第2连接子的反向互补序列或第2连接子除3’末端A以外序列的反向互补序列、第2条寡核苷酸链的反向互补序列和第1连接子的反向互补序列;
位于拼合后的长链寡核苷酸的5’端的第i条寡核苷酸链的引物自5’-3’方向依次包含第i连接子的反向互补序列或第i连接子除3’末端A以外序列的反向互补序列、第i条寡核苷酸链的反向互补序列和第i-1连接子的反向互补序列,其中,2<i≤k-1,且为整数;
位于拼合后的长链寡核苷酸的5’端的第k条寡核苷酸链的引物自5’-3’方向依次包含第k条寡核苷酸链的反向互补序列和第k-1连接子的反向互补序列。
以上所述的寡核苷酸链在拼合后的长链寡核苷酸上的位置为自5’-3’方向各寡核苷酸链顺次排列的位置。
本发明发现,由于寡核苷酸链的长度较短,需要在任意两个寡核苷酸链之间加入连接子(linker)来完成拼接,通过连接子区域的配对延伸,可以实现多个短链寡核苷酸的拼接。
对于第i条寡核苷酸链,2<i≤k-1,若其对应的第i连接子的3’末端不为A,则其引物自5’-3’方向依次包含第i连接子的反向互补序列、第i条寡核苷酸链的反向互补序列和第i-1连接子的反向互补序列。若其对应的第i连接子的3’末端为A,则其引物自5’-3’方向依次包含第i连接子除3’末端A以外序列的反向互补序列、第i条寡核苷酸链的反向互补序列和第i-1连接子的反向互补序列。
对于各寡核苷酸链之间的连接子的设计,本发明发现,连接子的长度和序列是否相同对于拼合效率存在明显影响,当连接子的长度小于6nt时,正确拼合的效率明显降低,当各连接子的长度不相同或者某些连接子的序列相同时,也会导致拼合效率的明显降低。
优选地,以上所述的连接子的长度≥6nt,第1~k-1连接子的长度相同且各连接子的序列彼此之间均不相同。
上述序列彼此之间均不相同是指各连接子之间序列相似性不为100%。
在表达随机肽库时,通常需要先将合成的寡核苷酸链库与载体连接,为便于与载体连接,上述引物组的两端引物还可包含与载体序列互补的序列。
优选地,位于拼合后的长链寡核苷酸的5’端的第1条寡核苷酸链的引物的3’端还含有与用于克隆所述长链寡核苷酸的载体序列和/或酶切位点序列互补的序列。
位于拼合后的长链寡核苷酸的5’端的第k条寡核苷酸链的引物的5’端还含有与用于将拼合后的长链寡核苷酸单链进行PCR扩增形成平末端双链的引物的3’端重叠的序列。
上述与载体序列和酶切位点序列互补的序列只需保证能够与载体高效连接即可,优选的互补序列长度为10-45bp。互补序列根据选择的表达载体的不同而不同。
上述与用于将拼合后的长链寡核苷酸单链进行PCR扩增形成平末端双链的引物的3’端重叠的序列优选为10-30bp,更优选为15-20bp。根据需要,若引入终止密码子,可在该重叠序列的3’端引入终止密码子。
作为本发明的一种实施方式,所用载体为pGADT7-Rec(载体序列如SEQ ID NO.40所示)。
本发明的随机拼合引物组可用于不同长度的寡核苷酸链的拼合,待拼合的寡核苷酸链的长度可以是相同的,也可以是不同的,经实验验证,上述随机拼合引物组至少可满足长度为10-20nt的寡核苷酸链的高效拼合。
优选地,待拼合的寡核苷酸链的长度为10-20nt。
作为本发明的一种实施方案,所述待拼合的寡核苷酸链的长度为12nt。
随着n的数量增加,随机拼合的组合方式增加,引物的数量增加吗,但是n的大小不会影响拼合效率,因此,对于上述引物组中的n没有特殊的数量限制。
对于上述引物组中的k理论上也没有特殊数量限制,但随着用于拼合形成一条长链寡核苷酸的寡核苷酸链的数量不断增加,拼合效率可能会下降。
经验证,本发明至少能够实现4个寡核苷酸链的高效拼合。
作为本发明的一种优选方案,k=4,第1~k-1连接子的序列(5’-3’方向)依次为GGTGCA、GCTGCA、GGAGCA。
本发明发现,上述3个连接子更有利于保证较高的拼合效率。
除上述引物外,本发明所述的引物组还包含Block引物,所述Block引物为n条寡核苷酸链的反向互补链的混合物。
以上所述的Block引物的作用在于,阻止寡核苷酸链自动互补形成的双链,避免在拼合延伸至2条以上寡核苷酸后,寡核苷酸链自动互补形成的双链在后续反应中作为模板,进而导致阻止继续拼合延伸的可能,保证单向拼接的可控性。
优选地,所述引物组还包含:
F1引物,用于与oligo dT偶联,并将拼合后的长链寡核苷酸与用于克隆的载体连接;
F2引物和R引物,用于将拼合后的长链寡核苷酸单链进行PCR扩增形成平末端双链,并与用于克隆的载体连接。
其中,F1引物作为与载体互补的接头片段,使得拼合后的长链寡核苷酸能够与用于其克隆的载体进行连接;F2引物和R引物配合使用,用于最后的长链寡核苷酸随机文库的PCR扩增,使得拼合后的长链寡核苷酸单链在PCR扩增过程中补齐成为平末端的双链,同时可供测序使用。
优选地,F1引物自5’-3’方向依次包含载体***位点上游20-45bp的反向互补序列以及能够偶联至oligo dT的polyA尾端(优选为10-14bp)。
F2引物自5’-3’方向包含载体***位点上游15-35bp的与载体相同的正向序列,可用于测序。
R引物自5’-3’方向依次包含载体***位点下游20-45bp的反向互补序列以及与位于拼合后的长链寡核苷酸的5’端的第k条寡核苷酸链的引物重叠的6-8个核苷酸。
优选地,F2引物序列与F1引物序列的poly A尾端之前的25-35bp完全互补。
作为本发明的一种实施方式,以6个12nt DNA片段(SEQ ID NO.1-6)为待拼合寡核苷酸链,将任意4个寡核苷酸链进行随机拼合。用于拼合的引物组包含24条(n×k)引物,24条引物的序列如SEQ ID NO.13-36所示。
拼合后用于克隆的载体为pGADT7-Rec,F1引物、R引物和F2引物的序列依次如SEQID NO.37-39所示。
在上述引物组的基础上,本发明提供一种试剂盒,其包含所述用于寡核苷酸链随机拼合的引物组。
以上所述的试剂盒用于寡核苷酸链的随机拼合。该试剂盒还可包含其它用于寡核苷酸链的随机拼合的试剂,例如:DNA聚合酶、dNTPs、Klenow酶、反应缓冲液、磁珠、ddH2O等。
本发明提供所述用于寡核苷酸链随机拼合的引物组或所述试剂盒在随机寡核苷酸链文库构建或随机肽库构建中的应用。
进一步地,本发明提供一种寡核苷酸链随机拼合方法,所述方法为以磁珠为载体,采用上述用于寡核苷酸链随机拼合的引物组,将n条寡核苷酸链中的任意k条寡核苷酸链随机拼合为长链寡核苷酸。
优选地,所述方法包括如下步骤:
(1)PCR:以磁珠为载体,采用F1引物以及第一引物混合物,在高保真DNA聚合酶的作用下进行PCR,PCR结束后经固液分离得到第一反应产物;
所述第一引物混合物为N亚组中每个亚组位于拼合后的长链寡核苷酸的5’端的第1条寡核苷酸链的引物的混合物;
(2)洗脱:将所述第一反应产物与Block引物混合,待寡核苷酸互补配对后,经洗脱得到第一次洗脱产物;将第一次洗脱产物再与Block引物混合,待寡核苷酸互补配对后,经洗脱得到第二次洗脱产物;
(3)延伸:在步骤(2)的第二次洗脱产物的基础上,采用Block引物、第二引物混合物,以dNTPs为原料在Klenow酶的作用下进行延伸反应,得到第二反应产物;
所述第二引物混合物为N亚组中每个亚组位于拼合后的长链寡核苷酸的5’端的第2条寡核苷酸链的引物的混合物;
本发明发现,与其它DNA聚合酶相比,在延伸时采用Klenow酶能够显著提高寡核苷酸链之间的拼合效率;
(4)重复步骤(2)-(3),逐个拼合k条寡核苷酸链中剩余的寡核苷酸链,其中,在第i个寡核苷酸链的延伸步骤,采用Block引物以及第i引物混合物;
所述第i引物混合物为N亚组中每个亚组位于拼合后的长链寡核苷酸的5’端的第i条寡核苷酸链的引物的混合物,其中,2<i≤k-1,且为整数;
最后再重复步骤(2)-(3)进行第k条寡核苷酸链的拼合,在第k个寡核苷酸链的延伸步骤,采用Block引物以及第k引物混合物;
所述第k引物混合物为N亚组中每个亚组位于拼合后的长链寡核苷酸的5’端的第k条寡核苷酸链的引物的混合物;
(5)洗脱:步骤(4)的拼合结束后,将拼合产物与Block引物混合,经洗脱得到洗脱产物;
(6)以步骤(5)的洗脱产物为模板,采用F2引物和R引物进行PCR,回收PCR产物,得到随机拼合的寡核苷酸库。
以上所述的步骤(1)中,所用磁珠为偶联有oligo dT的磁珠。优选偶联25nt的oligo dT。
所述高保真DNA聚合酶可为任意的高保真DNA聚合酶,只需保证扩增产物为平末端即可,例如:Phanta Max Master Mix等。
所述固液分离可采用磁力架分离上清和沉淀,然后去除上清,回收沉淀作为第一反应产物。
PCR的反应体系中,F1引物的终浓度为0.3-0.5μM,第一引物混合物的终浓度为0.3-0.5μM。
优选的50μl的PCR反应体系如下:磁珠10μl,2×高保真DNA聚合酶25μl,高保真DNA聚合酶对应的反应缓冲液,F1引物0.4μM,第一引物混合物0.4μM,以水补足反应体系。
PCR的反应程序包括:94-98℃、5-30s,55℃、10-30s,72℃、10-20s,18-25个循环。
以上所述方法的步骤(2)中,Block引物的终浓度为18-22μM。洗脱为先于90-95℃孵育2min,再于0-4℃孵育1-3min。
以上所述方法的步骤(3)中,延伸的反应体系中Block引物的终浓度为1-3μM,引物混合物的终浓度为0.5-2μM。
优选的延伸反应体系如下(总体积20μL):第一洗脱产物、Block引物2μM,dNTPs0.5mM,1×Klenow酶的反应缓冲液,Klenow酶1μl,引物混合物1μM,以水补足反应体系。
其中,所述引物混合物优选先经94℃变性2min后于37℃保温。
上述反应体系的加样顺序优选为:先将Block引物、水、dNTPs,反应缓冲液混匀,于94℃孵育1-3min,再于0-4℃孵育1-3min。
延伸的反应条件为:37℃反应15-25min。
以上所述的步骤(6)中,PCR反应体系中,F2引物、R引物的终浓度为0.3-0.8μM。
优选的PCR反应体系为(总体积50μL):2×高保真DNA聚合酶Mix25μl,,F2引物0.4μM,R引物0.4μM,以水补足反应体系。
优选的PCR反应程序为:
PCR的反应程序包括:94-98℃、5-30s,55℃、10-30s,72℃、10-20s,18-35个循环。
本发明还提供一种随机肽库的构建方法,该方法包括以下步骤:采用所述寡核苷酸链随机拼合方法将编码短链肽库的短链寡核苷酸进行随机拼合,得到随机长链寡核苷酸库,将随机长链寡核苷酸库与载体连接后,转入宿主细胞中进行表达,得到随机长链肽库。
以上所述的随机肽库的构建方法中,寡核苷酸链随机拼合过程中,待拼合的寡核苷酸链可以为采用NNK(其中,N代表任意核苷酸,K代表G或T)编码方式构建的随机寡核苷酸链;
或者,待拼合的寡核苷酸链也可以为采用NNK(其中,N代表任意核苷酸,K代表G或T)编码方式构建的随机寡核苷酸链、经连接载体、在宿主细胞中表达短肽库并经初步筛选得到的初筛肽库对应的寡核苷酸链。
通过选择初筛中与靶标结合较强的短肽序列进行后续的拼合、长链肽库的构建和再筛选,可以减轻肽库构建和筛选的工作量,提高工作效率,同时对初筛结果进行验证,增强筛选结果的可靠性。
作为本发明的一种实施方案,本发明提供一种16aa随机肽库的构建方法,该方法包括以下步骤:
(1)采用NNK(其中,N代表任意核苷酸,K代表G或T)编码方式合成的4aa的随机寡核苷酸链、经连接载体、在宿主细胞中表达短肽库并经初步筛选得到的初筛肽库;
(2)合成初筛肽库中各多肽对应的寡核苷酸链,采用所述寡核苷酸链随机拼合方法进行拼合,得到编码随机肽库的随机寡核苷酸库,将随机寡核苷酸库与载体连接后,转入宿主细胞中进行表达,得到16aa随机肽库;
其中,所述寡核苷酸链随机拼合方法中,n条寡核苷酸链的长度为12nt,k=4。
与随机短肽库相比,16aa随机肽库可以通过多结合位点与目的蛋白的相互作用,提高筛选效率与特异性。
本发明的有益效果至少包括:本发明提供的用于寡核苷酸链随机拼合的引物组和随机拼合方法解决了在随机长链寡核苷酸库合成过程中,某些位点会出现一定偏好性而导致整体DNA双链中某些位点核苷酸分布的随机性不足,以致整体文库的多态性不足、筛选效果不理想等问题。本发明提供的寡核苷酸链随机拼合方法能够以较高的效率将短链寡核苷酸随机拼合为长链寡核苷酸,通过降低直接合成核苷酸随机序列的长度,很好地保证了短链寡核苷酸库中DNA的随机性与多态性,而后再通过高效率的随机拼合来达到目标寡核苷酸链的长度。由此构建的长链寡核苷酸库和随机肽库具有较大的库容,且能够很好地保证每个位点的随机性和文库的序列多态性。
利用本发明的随机拼合方法构建的随机肽库可应用于酵母双杂交、噬菌体展示等筛选,具有较好的应用前景。
附图说明
图1为本发明实施例1中寡核苷酸链的拼合流程示意图。
图2为本发明实施例1中拼合阳性克隆的***序列测序结果。
图3为本发明实施例1采用6nt连接子和对比例1中不采用连接子进行寡核苷酸拼合的拼合产物的电泳检测结果,其中,泳道1~5依次为:marker、无连接子33个循环终产物(对比例1)、6nt连接子20个循环终产物(实施例1)、6nt连接子(实施例1)33个循环终产物以及132bp阳性对照。
图4为对比例2中拼合错误克隆的测序结果。
图5为对比例3中拼合错误克隆的测序结果。
图4和图5中,insert num代表12nt寡核苷酸链数量,insert length代表***片段长度,insert sequence代表***片段的测序结果序列。
具体实施方式
以下实施例用于说明本发明,但不用来限制本发明的范围。
以下实施例中使用的磁珠为偶联25nt的oligo dT的磁珠,购自Invitrogen,商品牌号为DynabeadsTM Oligo(dT)25,货号:61002;2×Phanta Max Master Mix为Vazyme货号为P515-01的产品;Klenow酶为NEB的3'-5'exo-产品。
实施例1寡核苷酸链的拼合
本实施例以6个12nt DNA片段为待拼合寡核苷酸链,将任意4个寡核苷酸链(命名为A、B、C、D)进行随机拼合,基本流程为:以磁珠为载体,先将Smart3_RC连接到磁珠的oligo-dT后,再将A、B、C、D按照不同的排列顺序连接至磁珠上,最后用AdrecF引物和CDSIII_RC引物将拼合的长链寡核苷酸进行扩增。拼合后的长链寡核苷酸的结构为:寡核苷酸链A-第1连接子-寡核苷酸链B-第2连接子-寡核苷酸链C-第3连接子-寡核苷酸链D,使用的第1连接子、第2连接子和第3连接子的序列(5’-3’)分别为GGTGCA、GCTGCA、GGAGCA。
具体的随机拼合方法如下,主要流程如图1所示:
1、PCR:取10μl磁珠,加入50μl水混匀,室温洗涤,共洗涤两次;
在洗涤后的磁珠中加入2μl F1引物(10μM),2μl A_RC(10μM),21μl H2O,25μl 2×Phanta Mix,混匀,得到PCR反应体系;
将PCR反应体系进行如下程序的PCR:95℃、15s,55℃、15s,72℃、15s,20个循环,每隔10min用移液器吹打混匀;
PCR反应结束后用移液器吹打均匀,于室温条件下,置于磁力架上去除上清,得到第一反应产物;
2、洗脱:在步骤1得到的第一反应产物中加入20μl Block引物(20μM),混匀,于94℃孵育2min,冰上放置2min,置于磁力架上去除上清,重复Block引物洗脱一次,置于磁力架上去除上清,得到洗脱产物;
3、延伸:在步骤2得到的洗脱产物中加入2μl Block引物(20μM),12μl H2O,1μldNTPs(10mM each),2μl 10×NEB Buffer 2,吹打均匀,于94℃孵育2min,再于冰上放置2min,然后再加入1μL Klenow(exo-,NEB),最后加入经94℃变性2min后于37℃保温的B_RCprimer(10μM)2μl混匀,于37℃反应20min,每10min用移液器吹打混匀;
4、洗脱:重复步骤2;
5、延伸:重复步骤3,区别仅在于,使用2μl C_RC primer(10μM)替换B_RC primer(10μM);
6、洗脱:重复步骤(2);
7、延伸:重复步骤3,区别仅在于,使用2μl D_RC primer(10μM)替换B_RC primer(10μM);
8、洗脱:重复步骤2,得到洗脱产物;
9、以步骤8的洗脱产物为模板,采用F2引物和R引物进行PCR扩增,回收扩增产物,得到随机拼合的寡核苷酸库;
其中,PCR扩增的反应体系如下(总体积50μL):2×Phanta Max Master Mix 25μl,AdrecF引物0.4μM,Cds3_RC引物0.4μM,以水补足反应体系。
PCR扩增的反应程序如下PCR的反应程序包括:95℃、30s,55℃、15s,72℃、15s,20个循环或33个循环。
以上方法中,6个12nt的寡核苷酸链的序列如下(方向为5’-3’,以下所有引物序列的方向也均为5’-3’):
GTGGCGATTCAG;
TGGGCTAGTGAT;
CGGGTGCCGCTT;
TTGCTTGTTCAG;
AATGCTACTGGT;
CCGTGTACGGCT;
Block引物是6个12nt的寡核苷酸链的反向互补寡核苷酸链的混合物,其包含的引物序列如下:
CTGAATCGCCAC;
ATCACTAGCCCA;
AAGCGGCACCCG;
CTGAACAAGCAA;
ACCAGTAGCATT;
AGCCGTACACGG;
引物A_RC为6个12nt的寡核苷酸链在拼合后的长链寡核苷酸5’-3’方向的第1个寡核苷酸链位置时所有引物(6个引物)的混合物;
这6个引物的序列如下:
A_RC1:TGCACCCTGAATCGCCACGGGCCATAATGGCCACTC;
A_RC2:TGCACCATCACTAGCCCAGGGCCATAATGGCCACTC;
A_RC3:TGCACCAAGCGGCACCCGGGGCCATAATGGCCACTC;
A_RC4:TGCACCCTGAACAAGCAAGGGCCATAATGGCCACTC;
A_RC5:TGCACCACCAGTAGCATTGGGCCATAATGGCCACTC;
A_RC6:TGCACCAGCCGTACACGGGGGCCATAATGGCCACTC。
引物B_RC为6个12nt的寡核苷酸链在拼合后的长链寡核苷酸5’-3’方向的第2个寡核苷酸链位置时所有引物(6个引物)的混合物;
这6个引物的序列如下:
B_RC1:GCAGCCTGAATCGCCACTGCACC;
B_RC2:GCAGCATCACTAGCCCATGCACC;
B_RC3:GCAGCAAGCGGCACCCGTGCACC;
B_RC4:GCAGCCTGAACAAGCAATGCACC;
B_RC5:GCAGCACCAGTAGCATTTGCACC;
B_RC6:GCAGCAGCCGTACACGGTGCACC。
引物C_RC为6个12nt的寡核苷酸链在拼合后的长链寡核苷酸5’-3’方向的第3个寡核苷酸链位置时所有引物(6个引物)的混合物;
这6个引物的序列如下:
C_RC1:GCTCCCTGAATCGCCACTGCAGC;
C_RC2:GCTCCATCACTAGCCCATGCAGC;
C_RC3:GCTCCAAGCGGCACCCGTGCAGC;
C_RC4:GCTCCCTGAACAAGCAATGCAGC;
C_RC5:GCTCCACCAGTAGCATTTGCAGC;
C_RC6:GCTCCAGCCGTACACGGTGCAGC。
引物D_RC为6个12nt的寡核苷酸链在拼合后的长链寡核苷酸5’-3’方向的第4个寡核苷酸链位置时所有引物(6个引物)的混合物。
这6个引物的序列如下:
D_RC1:GAGGCGGCCGACATGCTACTGAATCGCCACTGCTCC;
D_RC2:GAGGCGGCCGACATGCTAATCACTAGCCCATGCTCC;
D_RC3:GAGGCGGCCGACATGCTAAAGCGGCACCCGTGCTCC;
D_RC4:GAGGCGGCCGACATGCTACTGAACAAGCAATGCTCC;
D_RC5:GAGGCGGCCGACATGCTAACCAGTAGCATTTGCTCC;
D_RC6:GAGGCGGCCGACATGCTAAGCCGTACACGGTGCTCC。
F1引物的序列如下:
GGGCCATAATGGCCACTCTGCGTTGATACCACTGCTTGGGTGGAAAAAAAAAAAAAAAA。
R引物的序列如下:
GTATCGATGCCCACCCTCTAGAGGCCGAGGCGGCCGACATGCTA。
F2引物的序列如下:
TTCCACCCAAGCAGTGGTATCAACGCAGAGT。
对比例1
本对比例提供一种寡核苷酸链的拼合方法,其与实施例1的区别仅在于:在待拼合的短链寡核苷酸之间不设置连接子,相应地删除实施例1中各引物序列中的连接子序列,其它方法均与实施例1相同。
对比例2
本对比例提供一种寡核苷酸链的拼合方法,其与实施例1的区别仅在于:将实施例1中的连接子替换为以下连接子:
第1连接子为GGA,第2连接子为GGA,第3连接子为GGA。
相应地替换各引物序列中的连接子序列,其它方法均与实施例1相同。
对比例3
本对比例提供一种寡核苷酸链的拼合方法,其与实施例1的区别仅在于:将实施例1中的连接子替换为以下连接子:
第1连接子为GGGGGA,第2连接子为GGGGGA,第3连接子为GGGGGA。
相应地替换各引物序列中的连接子序列,其它方法均与实施例1相同。
实验例
对上述实施例和对比例构建的随机寡核苷酸链文库进行拼合效率、库容和多态性的检测,具体过程如下:
1、文库浓度检测
利用琼脂糖凝胶电泳检测实施例1以及对比例1中步骤9的PCR扩增循环数分别为20个和33个循环得到的拼合后的终产物。结果如图3所示,对比例1无连接子时,扩增33个循环仍然无清晰的产物条带,表明无连接子时无法获得成功拼合的产物,拼合效率为0,因此不进行后续的克隆和测序检测;而实施例1扩增20个循环和33个循环得到的拼合终产物均可以看到清晰条带,表明终产物含量为100ng左右。
根据以下公式计算,20个循环的扩增可以看到清晰条带,拼合所得的16aa肽库对应的随机寡核苷酸链文库的容量约在8千万拷贝。
其中,N为循环数,M为拷贝量,质量单位为ng。
以上结果表明,利用本发明实施例1的随机拼合方法构建的随机寡核苷酸链文库能够达到筛选文库容量的要求。
2、拼合效率和多态性检测
将实施例1和各对比例得到的拼合后的终产物进行DNA琼脂糖凝胶电泳,对DNA产物进行胶回收纯化并连接T载体进行克隆,将得到的克隆送测序。实施例1的成功拼合后的长链寡核苷酸的长度应为66nt,因此,阳性克隆的***片段应该为66bp。
其中,实施例1的拼合终产物20个循环、33个循环各随机选取50个进行测序,总计100个,排除无法连入载体的克隆,共获得81个存在片段***的克隆,对这81个克隆进行DNA测序验证,PCR扩增20个循环获得的拼合终产物的克隆测序结果统计如表1所示,其中,成功拼合(***片段长度为66bp)的克隆中的突变情况和各待拼合的短链寡核苷酸在所有成功拼合的克隆中出现的比例统计如表2所示;PCR扩增33个循环获得的拼合终产物的克隆测序结果统计如表3所示,其中,成功拼合(***片段长度为66bp)的克隆中的突变情况和各待拼合的短链寡核苷酸在所有成功拼合的克隆中出现的比例统计如表4所示。部分成功拼合的长链寡核苷酸的测序结果如图2所示。
结果表明,实施例1的短链寡核苷酸的拼合成功率为46%,表明本发明的拼合方法具有较高的拼合效率。在成功拼合的克隆中,6种12bp的短链寡核苷酸链出现的比率相对较为平均,可见长链寡核苷酸文库的多态性较高,能够满足肽库筛选时对寡核苷酸文库的多态性要求。
表1扩增20个循环的拼合终产物克隆测序情况统计
克隆数 克隆数占比(%)
存在***片段 42 ——
***片段长度为66bp 17 40.50%
***片段长度为30bp 1 2.40%
***片段长度为48bp 7 16.60%
其它长度 17 40.50%
表2扩增20个循环的成功拼合终产物克隆测序情况统计
注:表2中,无突变中各种核苷酸的占比为其出现占全部无突变克隆的占比,有突变占比为突变在共计68个克隆中的占比。
表3扩增33个循环的拼合终产物克隆测序情况统计
克隆数 克隆数占比(%)
存在***片段 39 ——
***片段长度为66bp 20 51.30
***片段长度为30bp 2 5.10
***片段长度为48bp 9 23.10
其它长度 8 20.50
表4扩增33个循环的成功拼合终产物克隆测序情况统计
注:表4中,无突变中各种核苷酸的占比为其出现占全部无突变克隆的占比,有突变占比为突变在共计80个克隆中的占比。
对比例2和3经PCR扩增33个循环得到的拼合终产物经克隆分别获得21个和36个存在片段***的克隆。对这些克隆进行DNA测序验证。其中,对比例2的成功拼合后的长链寡核苷酸的长度应为57nt,对比例3的成功拼合后的长链寡核苷酸的长度应为66nt,其阳性克隆的***片段应该分别为57bp和66bp。
对比例2和3的克隆测序统计结果如图4和图5所示,结果显示,对比例2和对比例3的所有克隆中均未出现符合拼合后57bp及66bp的克隆,因此,对比例2和对比例3的拼合方法的阳性率均为0。
虽然,上文中已经用一般性说明及具体实施方案对本发明作了详尽的描述,但在本发明基础上,可以对之作一些修改或改进,这对本领域技术人员而言是显而易见的。因此,在不偏离本发明精神的基础上所做的这些修改或改进,均属于本发明要求保护的范围。
序列表
<110> 北京大学
<120> 一种寡核苷酸链随机拼合方法
<130> KHP211121626.2
<160> 40
<170> SIPOSequenceListing 1.0
<210> 1
<211> 12
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 1
gtggcgattc ag 12
<210> 2
<211> 12
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 2
tgggctagtg at 12
<210> 3
<211> 12
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 3
cgggtgccgc tt 12
<210> 4
<211> 12
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 4
ttgcttgttc ag 12
<210> 5
<211> 12
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 5
aatgctactg gt 12
<210> 6
<211> 12
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 6
ccgtgtacgg ct 12
<210> 7
<211> 12
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 7
ctgaatcgcc ac 12
<210> 8
<211> 12
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 8
atcactagcc ca 12
<210> 9
<211> 12
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 9
aagcggcacc cg 12
<210> 10
<211> 12
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 10
ctgaacaagc aa 12
<210> 11
<211> 12
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 11
accagtagca tt 12
<210> 12
<211> 12
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 12
agccgtacac gg 12
<210> 13
<211> 36
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 13
tgcaccctga atcgccacgg gccataatgg ccactc 36
<210> 14
<211> 36
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 14
tgcaccatca ctagcccagg gccataatgg ccactc 36
<210> 15
<211> 36
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 15
tgcaccaagc ggcacccggg gccataatgg ccactc 36
<210> 16
<211> 36
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 16
tgcaccctga acaagcaagg gccataatgg ccactc 36
<210> 17
<211> 36
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 17
tgcaccacca gtagcattgg gccataatgg ccactc 36
<210> 18
<211> 36
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 18
tgcaccagcc gtacacgggg gccataatgg ccactc 36
<210> 19
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 19
gcagcctgaa tcgccactgc acc 23
<210> 20
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 20
gcagcatcac tagcccatgc acc 23
<210> 21
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 21
gcagcaagcg gcacccgtgc acc 23
<210> 22
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 22
gcagcctgaa caagcaatgc acc 23
<210> 23
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 23
gcagcaccag tagcatttgc acc 23
<210> 24
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 24
gcagcagccg tacacggtgc acc 23
<210> 25
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 25
gctccctgaa tcgccactgc agc 23
<210> 26
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 26
gctccatcac tagcccatgc agc 23
<210> 27
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 27
gctccaagcg gcacccgtgc agc 23
<210> 28
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 28
gctccctgaa caagcaatgc agc 23
<210> 29
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 29
gctccaccag tagcatttgc agc 23
<210> 30
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 30
gctccagccg tacacggtgc agc 23
<210> 31
<211> 36
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 31
gaggcggccg acatgctact gaatcgccac tgctcc 36
<210> 32
<211> 36
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 32
gaggcggccg acatgctaat cactagccca tgctcc 36
<210> 33
<211> 36
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 33
gaggcggccg acatgctaaa gcggcacccg tgctcc 36
<210> 34
<211> 36
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 34
gaggcggccg acatgctact gaacaagcaa tgctcc 36
<210> 35
<211> 36
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 35
gaggcggccg acatgctaac cagtagcatt tgctcc 36
<210> 36
<211> 36
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 36
gaggcggccg acatgctaag ccgtacacgg tgctcc 36
<210> 37
<211> 59
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 37
gggccataat ggccactctg cgttgatacc actgcttggg tggaaaaaaa aaaaaaaaa 59
<210> 38
<211> 44
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 38
gtatcgatgc ccaccctcta gaggccgagg cggccgacat gcta 44
<210> 39
<211> 31
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 39
ttccacccaa gcagtggtat caacgcagag t 31
<210> 40
<211> 8058
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 40
tgcatgcctg caggtcgaga tccgggatcg aagaaatgat ggtaaatgaa ataggaaatc 60
aaggagcatg aaggcaaaag acaaatataa gggtcgaacg aaaaataaag tgaaaagtgt 120
tgatatgatg tatttggctt tgcggcgccg aaaaaacgag tttacgcaat tgcacaatca 180
tgctgactct gtggcggacc cgcgctcttg ccggcccggc gataacgctg ggcgtgaggc 240
tgtgcccggc ggagtttttt gcgcctgcat tttccaaggt ttaccctgcg ctaaggggcg 300
agattggaga agcaataaga atgccggttg gggttgcgat gatgacgacc acgacaactg 360
gtgtcattat ttaagttgcc gaaagaacct gagtgcattt gcaacatgag tatactagaa 420
gaatgagcca agacttgcga gacgcgagtt tgccggtggt gcgaacaata gagcgaccat 480
gaccttgaag gtgagacgcg cataaccgct agagtacttt gaagaggaaa cagcaatagg 540
gttgctacca gtataaatag acaggtacat acaacactgg aaatggttgt ctgtttgagt 600
acgctttcaa ttcatttggg tgtgcacttt attatgttac aatatggaag ggaactttac 660
acttctccta tgcacatata ttaattaaag tccaatgcta gtagagaagg ggggtaacac 720
ccctccgcgc tcttttccga tttttttcta aaccgtggaa tatttcggat atccttttgt 780
tgtttccggg tgtacaatat ggacttcctc ttttctggca accaaaccca tacatcggga 840
ttcctataat accttcgttg gtctccctaa catgtaggtg gcggagggga gatatacaat 900
agaacagata ccagacaaga cataatgggc taaacaagac tacaccaatt acactgcctc 960
attgatggtg gtacataacg aactaatact gtagccctag acttgatagc catcatcata 1020
tcgaagtttc actacccttt ttccatttgc catctattga agtaataata ggcgcatgca 1080
acttcttttc tttttttttc ttttctctct cccccgttgt tgtctcacca tatccgcaat 1140
gacaaaaaaa tgatggaaga cactaaagga aaaaattaac gacaaagaca gcaccaacag 1200
atgtcgttgt tccagagctg atgaggggta tctcgaagca cacgaaactt tttccttcct 1260
tcattcacgc acactactct ctaatgagca acggtatacg gccttccttc cagttacttg 1320
aatttgaaat aaaaaaaagt ttgctgtctt gctatcaagt ataaatagac ctgcaattat 1380
taatcttttg tttcctcgtc attgttctcg ttccctttct tccttgtttc tttttctgca 1440
caatatttca agctatacca agcatacaat caactccaag ctttgcaaag atggataaag 1500
cggaattaat tcccgagcct ccaaaaaaga agagaaaggt cgaattgggt accgccgcca 1560
attttaatca aagtgggaat attgctgata gctcattgtc cttcactttc actaacagta 1620
gcaacggtcc gaacctcata acaactcaaa caaattctca agcgctttca caaccaattg 1680
cctcctctaa cgttcatgat aacttcatga ataatgaaat cacggctagt aaaattgatg 1740
atggtaataa ttcaaaacca ctgtcacctg gttggacgga ccaaactgcg tataacgcgt 1800
ttggaatcac tacagggatg tttaatacca ctacaatgga tgatgtatat aactatctat 1860
tcgatgatga agatacccca ccaaacccaa aaaaagagat ctttaatacg actcactata 1920
gggcgagcgc cgccatggag tacccatacg acgtaccaga ttacgctcat atggccatgg 1980
aggccagtga attccaccca agcagtggta tcaacgcaga gtggccatta tggcccggga 2040
aaaaacatgt cggccgcctc ggcctctaga gggtgggcat cgatacggga tccatcgagc 2100
tcgagctgca gatgaatcgt agatactgaa aaaccccgca agttcacttc aactgtgcat 2160
cgtgcaccat ctcaatttct ttcatttata catcgttttg ccttctttta tgtaactata 2220
ctcctctaag tttcaatctt ggccatgtaa cctctgatct atagaatttt ttaaatgact 2280
agaattaatg cccatctttt ttttggacct aaattcttca tgaaaatata ttacgagggc 2340
ttattcagaa gctttggact tcttcgccag aggtttggtc aagtctccaa tcaaggttgt 2400
cggcttgtct accttgccag aaatttacga aaagatggaa aagggtcaaa tcgttggtag 2460
atacgttgtt gacacttcta aataagcgaa tttcttatga tttatgattt ttattattaa 2520
ataagttata aaaaaaataa gtgtatacaa attttaaagt gactcttagg ttttaaaacg 2580
aaaattctta ttcttgagta actctttcct gtaggtcagg ttgctttctc aggtatagca 2640
tgaggtcgct cttattgacc acacctctac cggccggtcg aaattcccct accctatgaa 2700
catattccat tttgtaattt cgtgtcgttt ctattatgaa tttcatttat aaagtttatg 2760
tacaaatatc ataaaaaaag agaatctttt taagcaagga ttttcttaac ttcttcggcg 2820
acagcatcac cgacttcggt ggtactgttg gaaccaccta aatcaccagt tctgatacct 2880
gcatccaaaa cctttttaac tgcatcttca atggccttac cttcttcagg caagttcaat 2940
gacaatttca acatcattgc agcagacaag atagtggcga tagggttgac cttattcttt 3000
ggcaaatctg gagcagaacc gtggcatggt tcgtacaaac caaatgcggt gttcttgtct 3060
ggcaaagagg ccaaggacgc agatggcaac aaacccaagg aacctgggat aacggaggct 3120
tcatcggaga tgatatcacc aaacatgttg ctggtgatta taataccatt taggtgggtt 3180
gggttcttaa ctaggatcat ggcggcagaa tcaatcaatt gatgttgaac cttcaatgta 3240
ggaaattcgt tcttgatggt ttcctccaca gtttttctcc ataatcttga agaggccaaa 3300
acattagctt tatccaagga ccaaataggc aatggtggct catgttgtag ggccatgaaa 3360
gcggccattc ttgtgattct ttgcacttct ggaacggtgt attgttcact atcccaagcg 3420
acaccatcac catcgtcttc ctttctctta ccaaagtaaa tacctcccac taattctctg 3480
acaacaacga agtcagtacc tttagcaaat tgtggcttga ttggagataa gtctaaaaga 3540
gagtcggatg caaagttaca tggtcttaag ttggcgtaca attgaagttc tttacggatt 3600
tttagtaaac cttgttcagg tctaacacta cctgtacccc atttaggacc acccacagca 3660
cctaacaaaa cggcatcagc cttcttggag gcttccagcg cctcatctgg aagtgggaca 3720
cctgtagctt cgatagcagc accaccaatt aaatgatttt cgaaatcgaa cttgacattg 3780
gaacgaacat cagaaatagc tttaagaacc ttaatggctt cggctgtgat ttcttgacca 3840
acgtggtcac ctggcaaaac gacgatcttc ttaggggcag acattagaat ggtatatcct 3900
tgaaatatat atatatattg ctgaaatgta aaaggtaaga aaagttagaa agtaagacga 3960
ttgctaacca cctattggaa aaaacaatag gtccttaaat aatattgtca acttcaagta 4020
ttgtgatgca agcatttagt catgaacgct tctctattct atatgaaaag ccggttccgg 4080
cgctctcacc tttccttttt ctcccaattt ttcagttgaa aaaggtatat gcgtcaggcg 4140
acctctgaaa ttaacaaaaa atttccagtc atcgaatttg attctgtgcg atagcgcccc 4200
tgtgtgttct cgttatgttg aggaaaaaaa taatggttgc taagagattc gaactcttgc 4260
atcttacgat acctgagtat tcccacagtt gggggatctc gactctagct agaggatcaa 4320
ttcgtaatca tgtcatagct gtttcctgtg tgaaattgtt atccgctcac aattccacac 4380
aacatacgag ccggaagcat aaagtgtaaa gcctggggtg cctaatgagt gagctaactc 4440
acattaattg cgttgcgctc actgcccgct ttccagtcgg gaaacctgtc gtgccagctg 4500
ataacttcgt ataatgtatg ctatacgaag ttattaggtc tgaagaggag tttacgtcca 4560
gccaagctag cttggctgca ggtcgagcgg ccgcgatccg gaacccttaa tataacttcg 4620
tataatgtat gctatacgaa gttatcagct gcattaatga atcggccaac gcgcggggag 4680
aggcggtttg cgtattgggc gctcttccgc ttcctcgctc actgactcgc tgcgctcggt 4740
cgttcggctg cggcgagcgg tatcagctca ctcaaaggcg gtaatacggt tatccacaga 4800
atcaggggat aacgcaggaa agaacatgtg agcaaaaggc cagcaaaagg ccaggaaccg 4860
taaaaaggcc gcgttgctgg cgtttttcca taggctccgc ccccctgacg agcatcacaa 4920
aaatcgacgc tcaagtcaga ggtggcgaaa cccgacagga ctataaagat accaggcgtt 4980
tccccctgga agctccctcg tgcgctctcc tgttccgacc ctgccgctta ccggatacct 5040
gtccgccttt ctcccttcgg gaagcgtggc gctttctcat agctcacgct gtaggtatct 5100
cagttcggtg taggtcgttc gctccaagct gggctgtgtg cacgaacccc ccgttcagcc 5160
cgaccgctgc gccttatccg gtaactatcg tcttgagtcc aacccggtaa gacacgactt 5220
atcgccactg gcagcagcca ctggtaacag gattagcaga gcgaggtatg taggcggtgc 5280
tacagagttc ttgaagtggt ggcctaacta cggctacact agaagaacag tatttggtat 5340
ctgcgctctg ctgaagccag ttaccttcgg aaaaagagtt ggtagctctt gatccggcaa 5400
acaaaccacc gctggtagcg gtggtttttt tgtttgcaag cagcagatta cgcgcagaaa 5460
aaaaggatct caagaagatc ctttgatctt ttctacgggg tctgacgctc agtggaacga 5520
aaactcacgt taagggattt tggtcatgag attatcaaaa aggatcttca cctagatcct 5580
tttaaattaa aaatgaagtt ttaaatcaat ctaaagtata tatgagtaaa cttggtctga 5640
cagttaccaa tgcttaatca gtgaggcacc tatctcagcg atctgtctat ttcgttcatc 5700
catagttgcc tgactccccg tcgtgtagat aactacgata cgggagggct taccatctgg 5760
ccccagtgct gcaatgatac cgcgagaccc acgctcaccg gctccagatt tatcagcaat 5820
aaaccagcca gccggaaggg ccgagcgcag aagtggtcct gcaactttat ccgcctccat 5880
ccagtctatt aattgttgcc gggaagctag agtaagtagt tcgccagtta atagtttgcg 5940
caacgttgtt gccattgcta caggcatcgt ggtgtcacgc tcgtcgtttg gtatggcttc 6000
attcagctcc ggttcccaac gatcaaggcg agttacatga tcccccatgt tgtgcaaaaa 6060
agcggttagc tccttcggtc ctccgatcgt tgtcagaagt aagttggccg cagtgttatc 6120
actcatggtt atggcagcac tgcataattc tcttactgtc atgccatccg taagatgctt 6180
ttctgtgact ggtgagtact caaccaagtc attctgagaa tagtgtatgc ggcgaccgag 6240
ttgctcttgc ccggcgtcaa tacgggataa taccgcgcca catagcagaa ctttaaaagt 6300
gctcatcatt ggaaaacgtt cttcggggcg aaaactctca aggatcttac cgctgttgag 6360
atccagttcg atgtaaccca ctcgtgcacc caactgatct tcagcatctt ttactttcac 6420
cagcgtttct gggtgagcaa aaacaggaag gcaaaatgcc gcaaaaaagg gaataagggc 6480
gacacggaaa tgttgaatac tcatactctt cctttttcaa tattattgaa gcatttatca 6540
gggttattgt ctcatgagcg gatacatatt tgaatgtatt tagaaaaata aacaaatagg 6600
ggttccgcgc acatttcccc gaaaagtgcc acctgacgtc taagaaacca ttattatcat 6660
gacattaacc tataaaaata ggcgtatcac gaggcccttt cgtctcgcgc gtttcggtga 6720
tgacggtgaa aacctctgac acatgcagct cccggagacg gtcacagctt gtctgtaagc 6780
ggatgccggg agcagacaag cccgtcaggg cgcgtcagcg ggtgttggcg ggtgtcgggg 6840
ctggcttaac tatgcggcat cagagcagat tgtactgaga gtgcaccata acgcatttaa 6900
gcataaacac gcactatgcc gttcttctca tgtatatata tatacaggca acacgcagat 6960
ataggtgcga cgtgaacagt gagctgtatg tgcgcagctc gcgttgcatt ttcggaagcg 7020
ctcgttttcg gaaacgcttt gaagttccta ttccgaagtt cctattctct agctagaaag 7080
tataggaact tcagagcgct tttgaaaacc aaaagcgctc tgaagacgca ctttcaaaaa 7140
accaaaaacg caccggactg taacgagcta ctaaaatatt gcgaataccg cttccacaaa 7200
cattgctcaa aagtatctct ttgctatata tctctgtgct atatccctat ataacctacc 7260
catccacctt tcgctccttg aacttgcatc taaactcgac ctctacattt tttatgttta 7320
tctctagtat tactctttag acaaaaaaat tgtagtaaga actattcata gagtgaatcg 7380
aaaacaatac gaaaatgtaa acatttccta tacgtagtat atagagacaa aatagaagaa 7440
accgttcata attttctgac caatgaagaa tcatcaacgc tatcactttc tgttcacaaa 7500
gtatgcgcaa tccacatcgg tatagaatat aatcggggat gcctttatct tgaaaaaatg 7560
cacccgcagc ttcgctagta atcagtaaac gcgggaagtg gagtcaggct ttttttatgg 7620
aagagaaaat agacaccaaa gtagccttct tctaacctta acggacctac agtgcaaaaa 7680
gttatcaaga gactgcatta tagagcgcac aaaggagaaa aaaagtaatc taagatgctt 7740
tgttagaaaa atagcgctct cgggatgcat ttttgtagaa caaaaaagaa gtatagattc 7800
tttgttggta aaatagcgct ctcgcgttgc atttctgttc tgtaaaaatg cagctcagat 7860
tctttgtttg aaaaattagc gctctcgcgt tgcatttttg ttttacaaaa atgaagcaca 7920
gattcttcgt tggtaaaata gcgctttcgc gttgcatttc tgttctgtaa aaatgcagct 7980
cagattcttt gtttgaaaaa ttagcgctct cgcgttgcat ttttgttcta caaaatgaag 8040
cacagatgct tcgttgct 8058

Claims (12)

1.用于寡核苷酸链随机拼合的引物组,其特征在于,将n条寡核苷酸链中的任意k条寡核苷酸链随机拼合为长链寡核苷酸,所述引物组包含n×k条引物,n和k均为大于1的整数,且k<n;
将n×k条引物分为n个亚组,每个亚组包含k条引物,每个亚组的k条引物如下:
位于拼合后的长链寡核苷酸的5’端的第1条寡核苷酸链的引物自5’-3’方向依次包含第1连接子序列的反向互补序列、该寡核苷酸链的反向互补序列;
位于拼合后的长链寡核苷酸的5’端的第2条寡核苷酸链的引物自5’-3’方向依次包含第2连接子的反向互补序列或第2连接子除3’末端A以外序列的反向互补序列、该寡核苷酸链的反向互补序列和第1连接子的反向互补序列;
位于拼合后的长链寡核苷酸的5’端的第i条寡核苷酸链的引物自5’-3’方向依次包含第i连接子的反向互补序列或第i连接子除3’末端A以外序列的反向互补序列、该寡核苷酸链的反向互补序列和第i-1连接子的反向互补序列,其中,2<i≤k-1,且为整数;
位于拼合后的长链寡核苷酸的5’端的第k条寡核苷酸链的引物自5’-3’方向依次包含第k条寡核苷酸链的反向互补序列和第k-1连接子的反向互补序列;
所述连接子的长度≥6nt,第1~k-1连接子的长度相同且各连接子的序列彼此之间均不相同;
其中,k=4,第1~k-1连接子的序列依次为GGTGCA、GCTGCA、GGAGCA。
2.根据权利要求1所述的用于寡核苷酸链随机拼合的引物组,其特征在于,位于拼合后的长链寡核苷酸的5’端的第1条寡核苷酸链的引物的3’端还含有与用于克隆所述长链寡核苷酸的载体序列和/或酶切位点序列互补的序列;
位于拼合后的长链寡核苷酸的5’端的第k条寡核苷酸链的引物的5’端还含有与用于将拼合后的长链寡核苷酸单链进行PCR扩增形成平末端双链的引物的3’端重叠的序列。
3.根据权利要求1所述的用于寡核苷酸链随机拼合的引物组,其特征在于,待拼合的寡核苷酸链的长度为10-20nt。
4.根据权利要求1~3任一项所述的用于寡核苷酸链随机拼合的引物组,其特征在于,所述引物组还包含Block引物;
所述Block引物为n条寡核苷酸链的反向互补链的混合物。
5.根据权利要求1~3任一项所述的用于寡核苷酸链随机拼合的引物组,其特征在于,所述引物组还包含:
F1引物,用于与oligo dT偶联,并将拼合后的长链寡核苷酸与用于克隆的载体连接;
F2引物和R引物,用于将拼合后的长链寡核苷酸单链进行PCR扩增形成平末端的双链,并与用于克隆的载体连接。
6.试剂盒,其特征在于,其包含权利要求1~5任一项所述的用于寡核苷酸链随机拼合的引物组。
7.权利要求1~5任一项所述的用于寡核苷酸链随机拼合的引物组或权利要求6所述的试剂盒在随机寡核苷酸链文库构建或随机肽库构建中的应用。
8.一种寡核苷酸链随机拼合方法,其特征在于,所述方法为以磁珠为载体,采用权利要求1~5任一项所述的用于寡核苷酸链随机拼合的引物组,将n条寡核苷酸链中的任意k条寡核苷酸链随机拼合为长链寡核苷酸。
9.根据权利要求8所述的寡核苷酸链随机拼合方法,其特征在于,所述方法包括如下步骤:
(1)PCR:以磁珠为载体,采用F1引物以及第一引物混合物,在高保真DNA聚合酶的作用下进行PCR,PCR结束后经固液分离得到第一反应产物;
所述第一引物混合物为N亚组中每个亚组位于拼合后的长链寡核苷酸的5’端的第1条寡核苷酸链的引物的混合物;
(2)洗脱:将所述第一反应产物与Block引物混合,待寡核苷酸互补配对后,经洗脱得到第一次洗脱产物;将第一次洗脱产物再与Block引物混合,待寡核苷酸互补配对后,经洗脱得到第二次洗脱产物;
(3)延伸:在步骤(2)的第二次洗脱产物的基础上,采用Block引物、第二引物混合物,以dNTPs为原料在Klenow酶的作用下进行延伸反应,得到第二反应产物;
所述第二引物混合物为N亚组中每个亚组位于拼合后的长链寡核苷酸的5’端的第2条寡核苷酸链的引物的混合物;
(4)重复步骤(2)-(3),逐个拼合k条寡核苷酸链中剩余的寡核苷酸链,其中,在第i个寡核苷酸链的延伸步骤,采用Block引物以及第i引物混合物;
所述第i引物混合物为N亚组中每个亚组位于拼合后的长链寡核苷酸的5’端的第i条寡核苷酸链的引物的混合物,其中,2<i≤k-1,且为整数;
最后再重复步骤(2)-(3)进行第k条寡核苷酸链的拼合,在第k个寡核苷酸链的延伸步骤,采用Block引物以及第k引物混合物;
所述第k引物混合物为N亚组中每个亚组位于拼合后的长链寡核苷酸的5’端的第k条寡核苷酸链的引物的混合物;
(5)洗脱:步骤(4)的拼合结束后,将拼合产物与Block引物混合,经洗脱得到洗脱产物;
(6)以步骤(5)的洗脱产物为模板,采用F2引物和R引物进行PCR,回收PCR产物,得到随机拼合的寡核苷酸库。
10.根据权利要求9所述的寡核苷酸链随机拼合方法,其特征在于,步骤(3)中,延伸的反应体系中Block引物的终浓度为1-3μM,引物混合物的终浓度为0.5-2μM,
和/或,延伸的反应条件为:37℃反应15-25min。
11.根据权利要求9或10所述的寡核苷酸链随机拼合方法,其特征在于,步骤(1)中,PCR的反应体系中,F1引物的终浓度为0.3-0.5μM,第一引物混合物的终浓度为0.3-0.5μM;
PCR的反应程序包括:94-98℃、5-30s,55℃、10-30s,72℃、10-20s,18-25个循环;
和/或,
步骤(2)中,Block引物的终浓度为18-22μM;
所述洗脱为先于90-95℃孵育2min,再于0-4℃孵育1-3min。
12.一种随机长链肽库的构建方法,其特征在于,包括:采用权利要求8~11任一项所述的寡核苷酸链随机拼合方法将编码短链肽库的短链寡核苷酸进行随机拼合,得到随机长链寡核苷酸库,将所述随机长链寡核苷酸库与载体连接后,转入宿主细胞中进行表达,得到随机长链肽库。
CN202111522088.XA 2021-12-13 2021-12-13 一种寡核苷酸链随机拼合方法 Active CN114317529B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111522088.XA CN114317529B (zh) 2021-12-13 2021-12-13 一种寡核苷酸链随机拼合方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111522088.XA CN114317529B (zh) 2021-12-13 2021-12-13 一种寡核苷酸链随机拼合方法

Publications (2)

Publication Number Publication Date
CN114317529A CN114317529A (zh) 2022-04-12
CN114317529B true CN114317529B (zh) 2023-12-01

Family

ID=81051477

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111522088.XA Active CN114317529B (zh) 2021-12-13 2021-12-13 一种寡核苷酸链随机拼合方法

Country Status (1)

Country Link
CN (1) CN114317529B (zh)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002330796A (ja) * 1998-11-09 2002-11-19 Eiken Chem Co Ltd 核酸の合成方法
WO2007067907A1 (en) * 2005-12-06 2007-06-14 Ambion, Inc. Reverse transcription primers and methods of design
CN104212791A (zh) * 2013-06-03 2014-12-17 无锡青兰生物科技有限公司 一种基于双向等温延伸的核酸合成方法
CN111041026A (zh) * 2019-12-26 2020-04-21 北京优迅医学检验实验室有限公司 一种高通量测序用核酸接头和文库构建方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002330796A (ja) * 1998-11-09 2002-11-19 Eiken Chem Co Ltd 核酸の合成方法
WO2007067907A1 (en) * 2005-12-06 2007-06-14 Ambion, Inc. Reverse transcription primers and methods of design
CN104212791A (zh) * 2013-06-03 2014-12-17 无锡青兰生物科技有限公司 一种基于双向等温延伸的核酸合成方法
CN111041026A (zh) * 2019-12-26 2020-04-21 北京优迅医学检验实验室有限公司 一种高通量测序用核酸接头和文库构建方法

Also Published As

Publication number Publication date
CN114317529A (zh) 2022-04-12

Similar Documents

Publication Publication Date Title
US6582904B2 (en) Method of quantifying tumour cells in a body fluid and a suitable test kit
US5286636A (en) DNA cloning vectors with in vivo excisable plasmids
CN110527737B (zh) 一种转基因油菜及其产品转化体鉴定阳性质粒分子pYCID-1905及应用
CN112921054B (zh) 一种用于治疗β-地中海贫血的慢病毒载体及其制备方法和应用
CN104593413A (zh) 利用家蚕后部丝腺合成分泌人血清白蛋白的方法
CN105368732B (zh) 一株产木糖醇的工业酿酒酵母菌株及构建方法
CN104962576B (zh) 一种柱状黄杆菌基因定向敲除质粒及应用
CN101838663A (zh) 一种大肠杆菌-棒状杆菌穿梭组成型表达载体及其构建方法
CN112266914B (zh) 一种熊蜂生假丝酵母强组成型启动子及其应用
CN114317529B (zh) 一种寡核苷酸链随机拼合方法
CN110804559B (zh) 一株重组产黄青霉基因工程菌及其构建方法与应用
CN110452893B (zh) 一种高保真CRISPR/AsCpf1突变体的构建及其应用
CN112813038A (zh) 一株表达asfv结构囊膜蛋白的prrs病毒及其构建方法与应用
CN109234318B (zh) 一种提高红曲霉菌胞外色素的方法
CN114540355A (zh) Hhex软骨组织特异性敲除小鼠动物模型及其构建方法
CN113151276A (zh) 一种il-4基因缺失斑马鱼
CN107267538B (zh) 一种植物质体表达载体的构建方法及应用
CN114107369A (zh) 一种myc标签融合表达载体的制备方法及其应用
CN1295337C (zh) 在大肠杆菌或芽孢杆菌中分泌表达外源基因的表达载体及其构建
CN110117622B (zh) 一种CRISPR/Cas基因编辑***及其制备方法和应用
CN111378684B (zh) 一种热诱导的基因编辑***CRISPR-Cas12b在陆地棉中的应用
CN109777829A (zh) 一种基因编辑U6启动子驱动的sgRNA表达组件的构建方法
CN110331170A (zh) 一种双重gRNA的基因表达元件及其构建方法与应用
CN101191133B (zh) 一种捕获分泌序列的载体及其构建方法和应用
CN112159819B (zh) 小黄鱼生长激素生物反应器家蚕品系的构建方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant