CN114317528A - 特异分子标签umi组、混合特异分子标签接头及应用 - Google Patents

特异分子标签umi组、混合特异分子标签接头及应用 Download PDF

Info

Publication number
CN114317528A
CN114317528A CN202011061421.7A CN202011061421A CN114317528A CN 114317528 A CN114317528 A CN 114317528A CN 202011061421 A CN202011061421 A CN 202011061421A CN 114317528 A CN114317528 A CN 114317528A
Authority
CN
China
Prior art keywords
specific molecular
sequence
molecular tag
umi
linker
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202011061421.7A
Other languages
English (en)
Inventor
楚玉星
李奇
杨玲
陈蓉蓉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Jiyinjia Medical Laboratory Co ltd
Geneplus-Beijing
Original Assignee
Beijing Jiyinjia Medical Laboratory Co ltd
Geneplus-Beijing
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Jiyinjia Medical Laboratory Co ltd, Geneplus-Beijing filed Critical Beijing Jiyinjia Medical Laboratory Co ltd
Priority to CN202011061421.7A priority Critical patent/CN114317528A/zh
Publication of CN114317528A publication Critical patent/CN114317528A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本发明涉及核酸测序技术领域,具体涉及一种特异分子标签UMI组、混合特异分子标签接头及应用,提供的特异分子标签UMI组包括:序列长度为5bp的第一特异分子标签UMI,序列长度为6bp的第二特异分子标签UMI,序列长度为7bp的第三特异分子标签UMI,和序列长度为8bp的第四特异分子标签。使用上述混合特异分子标签构建的双index文库可保证分子标签下游固定碱基对的碱基平衡,实现携带分子标签的文库在不混合平衡文库的情况下直接上机测序。同时,本发明提供的混合特异分子标签接头及配套的双index接头引物在不同分子标签接头连接均一性和不同index间扩增均一性方面亦显著优于现有的双index文库体系。

Description

特异分子标签UMI组、混合特异分子标签接头及应用
技术领域
本发明涉及核酸测序技术领域,具体涉及一种特异分子标签UMI组、混合特异分子标签接头和双index建库体系以及应用。
背景技术
特异分子标签(Unique Molecular Identifier,UMI)为一段短核苷酸序列,可看做“条形码”,在文库构建时通过连接接头将分子标签连接到DNA分子中,标记原始样品中的每个分子,对同一来源扩增产物进行追踪和最终提取分组,用于排除PCR扩增偏好性和测序偏好性引入的深度偏差以及由于PCR错误和测序错误引入的低频假突变噪音。排除cfDNA天然重复序列带来的深度虚低。由于分子标签位于接头连接端,为保证正常的T-A连接,通常会在分子标签下游1bp引入固定T-A碱基对。该碱基对在Gene+Seq 2000、Gene+Seq200和DNBSEQ-T7平台会导致整张芯片信号过曝光,造成分子标签及下游序列测序错误。为避免该问题发生,通常将携带分子标签文库与不低于50%数据量权重的无分子标签文库(平衡文库)混合测序。该方法限制了分子标签文库上机通量同时也造成了不必要的数据浪费。基于此,申请人独创性的在现用特异双端index文库结构基础上,对接头、引物和分子标签序列进行优化。测试结果显示,优化后的吉因加特异双端index文库体系避免了分子标签下游固定A-T碱基对带来的芯片信号过曝光,携带分子标签的文库可独立上机测序,无需混合平衡文库。且相比现用特异双端index文库体系,其不同分子标签接头连接均一性以及不同index间扩增均一性亦具有显著优势。
发明内容
因此,本发明要解决的技术问题在于克服现有特异双端index文库体系中分子标签下游A-T固定碱基测序信号过曝光的问题,进而提供一种特异分子标签UMI组、混合特异分子标签接头和双index建库体系以及应用,实现携带分子标签的文库在无平衡文库混合情况下独立上机而不出现A-T固定碱基测序信号过曝光,同时,通过对双端index、不同分子标签的混合特异分子标签接头的优化设计,使得不同的接头连接DNA无偏好性,均匀连接,index的扩增效率接近一致。
为此,本发明提供了如下的技术方案:
第一方面,本发明提供了一种特异分子标签UMI组,包括:序列长度为5bp的第一特异分子标签UMI,序列长度为6bp的第二特异分子标签UMI,序列长度为7bp的第三特异分子标签UMI,和序列长度为8bp的第四特异分子标签UMI。
可选的,所述特异性分子标签UMI组的正义分子标签的序列如表2所示,反义分子标签的序列如表2所示。
可选的,各分子标签摩尔数相同。
第二方面,本发明提供了一种混合特异分子标签接头,所述混合特异分子标签接头的正义分子标签和反义分子标签均使用所述的特异分子标签UMI组。
可选的,第一特异分子标签UMI、第二特异分子标签UMI、第三特异分子标签UMI和第四特异分子标签UMI在所述的混合特异分子标签接头中的摩尔数相同。
可选的,所述的混合特异分子标签接头,包括两条部分互补的接头寡核苷酸链:
接头寡核苷酸链1,由5’端到3’端依次包括index2引物结合区、正义接头互补区、正义分子标签、至少一个具有碱基平衡作用的碱基S和1个突出的固定碱基T;
接头寡核苷酸链2,由5’端到3’端依次包括与接头寡核苷酸链1中碱基S互补的碱基、与接头寡核苷酸链1中的正义分子标签反向互补的反义分子标签、与接头寡核苷酸链1正义接头互补区反向互补的反义接头互补区和index1引物结合区。
可选的,“S”表示G/C两种碱基中的任一种碱基。
可选的,在所述的接头寡核苷酸链1中,所述index2引物结合区的长度为15-42bp,所述正义接头互补区长度为8-10bp,所述正义分子标签的长度为5-8bp;所述正义接头互补区全部或部分与index2引物结合区的3’末端序列重合;
可选的,在所述的接头寡核苷酸链2中,所述反义分子标签长度为5-8bp,所述反义接头互补区长度为8-10bp,所述index1引物结合区长度为15-30bp;所述反义接头互补区全部或部分与index1引物结合区的5’末端序列重合。
可选的,在所述的接头寡核苷酸链1中,由正义分子标签、平衡碱基S和固定碱基T组成的序列中的A/T/G/C 4种碱基各自的个数分别占所述正义分子标签的总碱基数的6.25%~43.75%之间;
可选的,在所述的接头寡核苷酸链2中,反义分子标签和平衡碱基S互补组成的序列中A/T/G/C 4种碱基各自的个数分别占所述反义分子标签的总碱基数的6.25%~43.75%之间。
可选的,接头寡核苷酸链2的5’端磷酸化修饰。
可选的,所述混合特异分子标签接头为Y型混合特异分子标签接头。
可选的,所述index1序列和index2序列选自表1,保证了构建文库的扩增效率。
表1 index1和index2序列信息
Figure BDA0002712504480000031
Figure BDA0002712504480000041
Figure BDA0002712504480000051
Figure BDA0002712504480000061
Figure BDA0002712504480000071
第三方面,本发明提供了一种双index文库结构,包括利用所述的混合特异分子标签和/或所述的混合特异分子标签接头制备而成。
第四方面,本发明提供了一种双index建库体系,包括利用所述的混合特异分子标签和/或所述的混合特异分子标签接头。
第五方面,本发明提供了一种文库构建方法,包括利用所述的混合特异分子标签和/或所述的混合特异分子标签接头。
第六方面,本发明提供了一种测序方法,包括利用所述的文库结构。
可选的,测序平台为Gene+Seq 2000、Gene+Seq200和DNBSEQ-T7。
本发明技术方案,具有如下优点:
1.本发明提供的一种特异分子标签UMI组,不同的长度的UMI有效避免了碱基过度曝光导致测序质量差的问题,实现携带分子标签文库在无平衡文库混合情况下独立上机。不同分子标签连接效率无偏好,连接均一。
2.本发明提供的一种混合特异分子标签接头,所述混合特异分子标签接头的正义分子标签和反义分子标签均使用所述的特异分子标签UMI组;通过使用本发明的特异分子标签UMI组,所述混合特异分子标签接头在建库时,解决了碱基不平衡问题,且能提高接头与目标DNA序列的连接效率及目标DNA序列的有效利用率。
3.本发明提供的一种混合特异分子标签接头,第一特异分子标签UMI、第二特异分子标签UMI、第三特异分子标签UMI和第四特异分子标签UMI在所述的混合特异分子标签接头中的摩尔数相同,由于各分子标签无明显的偏好性,为了保证连接的均匀性,因此,将各分子标签在所述的混合特异分子标签接头中的摩尔数相同。
4.本发明提供的一种混合特异分子标签接头,包括两条部分互补的接头寡核苷酸链:接头寡核苷酸链1,由5’端到3’端依次包括index2引物结合区、正义接头互补区、正义分子标签、至少一个具有碱基平衡作用的碱基S和1个突出的碱基T;接头寡核苷酸链2,由5’端到3’端依次包括与接头寡核苷酸链1中碱基S互补的碱基、与接头寡核苷酸链1中的正义分子标签反向互补的反义分子标签、与接头寡核苷酸链1正义接头互补区反向互补的反义接头互补区和index1引物结合区;使用上述混合特异分子标签接头构建的双index文库体系可保证分子标签下游的固定碱基对(A-T)的碱基平衡,实现携带分子标签的文库在不混合平衡文库的情况下直接上机测序。同时,本发明提供的混合特异分子标签接头及配套的双index接头引物在不同分子标签接头连接均一性和不同index间扩增均一性方面亦显著优于现有的双index文库体系。
5.本发明提供的一种混合特异分子标签接头,所述index2引物结合区的长度为15-42bp,所述正义接头互补区长度为8-10bp,所述正义分子标签的长度为5-8bp;所述正义接头互补区全部或部分与index2引物结合区的3’末端序列重合;所述反义分子标签长度为5-8bp,所述反义接头互补区长度为8-10bp,所述index1引物结合区长度为15-30bp;所述反义接头互补区全部或部分与index1引物结合区的5’末端序列重合;通过增加引物结合区域长度提高引物结合效率。
6.本发明提供的一种混合特异分子标签接头,在所述的接头寡核苷酸链1中,由正义分子标签、平衡碱基S和固定碱基T组成的序列中的A/T/G/C4种碱基各自的个数分别占所述正义分子标签的总碱基数的6.25%~43.75%之间;优选的,在所述的接头寡核苷酸链2中,反义分子标签和平衡碱基S互补组成的序列中A/T/G/C 4种碱基各自的个数分别占所述反义分子标签的总碱基数的6.25%~43.75%之间;通过在上述范围内,能够进一步避免在测序时碱基曝光过度的情况。
7.本发明提供的一种双index建库体系,包括特异分子标签UMI组和/或所述的混合特异分子标签接头。上述双index建库体系所构建的双index文库体系可保证分子标签下游固定碱基对的碱基平衡,实现携带分子标签的文库在不混合平衡文库的情况下直接上机测序。同时,本发明提供的混合特异分子标签接头及其配套的双index接头引物在不同分子标签接头连接均一性和不同index间扩增均一性方面亦显著优于现有的双index文库体系。
附图说明
为了更清楚地说明本发明具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明中混合特异分子标签接头和双index接头引物的结构示意图;
图2是本发明实验例3中本发明方案1的文库产量数据;横坐标为文库编号;
图3是本发明实验例3中本发明方案2的文库产量数据;横坐标为文库编号;
图4是本发明实验例4中本发明测试文库正向测序和反向测序每个碱基平均Q30分布;横坐标为测序时的每一个循环;纵坐标为Q30值。
具体实施方式
提供下述实施例是为了更好地进一步理解本发明,并不局限于所述最佳实施方式,不对本发明的内容和保护范围构成限制,任何人在本发明的启示下或是将本发明与其他现有技术的特征进行组合而得出的任何与本发明相同或相近似的产品,均落在本发明的保护范围之内。
实施例中未注明具体实验步骤或条件者,按照本领域内的文献所描述的常规实验步骤的操作或条件即可进行。所用试剂、细胞或仪器未注明生产厂商者,均为可以通过市购获得的常规产品。
实施例1特异分子标签UMI组
本实施例提供了一种特异分子标签UMI组,包括:序列长度为5bp的第一特异分子标签UMI,序列长度为6bp的第二特异分子标签UMI,序列长度为7bp的第三特异分子标签UMI,和序列长度为8bp的第四特异分子标签UMI。
作为优选的实施方式,本实施例提供了一组最优的特异分子标签UMI组,正义分子标签的序列如表2所示,反义分子标签的序列如表2所示。
作为更优选的实施方式,上述的最优的特异分子标签UMI组中,各分子标签摩尔数相同。
实施例2混合特异分子标签接头
本实施例提供了一种混合特异分子标签接头,如图1所示,包括:接头寡核苷酸链1,由5’端到3’端依次包括index2引物结合区、正义接头互补区、正义分子标签、至少一个具有碱基平衡作用的碱基S和1个突出的碱基T,所述正义接头互补区全部或部分与index2引物结合区的3’末端序列重合,所述正义分子标签为实施例1中最优的特异分子标签UMI组中的;接头寡核苷酸链1的核苷酸序列以及最优的特异分子标签UMI组(正义分子标签)如下表2所示;
所述接头寡核苷酸链2由5’端到3’端依次包括与接头寡核苷酸链1中碱基S互补的碱基、与接头寡核苷酸链1中的正义分子标签反向互补的反义分子标签、与接头寡核苷酸链1正义接头互补区反向互补的反义接头互补区和index1引物结合区,所述反义接头互补区全部或部分与index1引物结合区的5’末端序列重合,所述反义分子标签为实施例1中最优的特异分子标签UMI组中的;接头寡核苷酸链2核苷酸序列以及最优的特异分子标签UMI组(反义分子标签)如下表2所示;示例具体如下:
接头寡核苷酸链1(正向接头序列)5’-3’:
GGCTCACAGAACGACATGGCTACGATCCGACTTNNNNNST;
接头寡核苷酸链2(反向接头序列)5’-3’:
/5hos/SNNNNNAAGTCGGAGGCCAAGCGGTCTTAGGAA;
上述序列中,“/5Phos/”表示5’端磷酸化修饰,“S”表示G/C两种碱基中的任一种碱基”,“N”表示A\T\G\C四种碱基中的任一种碱基;“NNNNN”表示正义分子标签和与正义分子标签互补的反义分子标签。
设计的混合特异分子标签接头Adapter 1~Adapter 48如下表2:
表2混合特异分子标签接头Adapter序列
Figure BDA0002712504480000101
Figure BDA0002712504480000111
Figure BDA0002712504480000121
Figure BDA0002712504480000131
上述表2中的接头序列按照以下步骤制备:
(1)根据接头寡核苷酸链1及接头寡核苷酸链2的合成总量,分别加入相应体积的接头退火缓冲液,经充分混匀、短暂离心以及室温静置溶解10min,制备成摩尔浓度为100μM的接头寡核苷酸链退火工作液;
(2)对应分子标签的接头寡核苷酸链1和接头寡核苷酸链2退火工作液,各取25μL至新的PCR管中,震荡混匀后,置于PCR仪(Applied Biosystems Veriti热循环仪,VeritiTM96-Well Thermal Cycler)中按照表3程序进行梯度降温退火,得到包含各分子标签的Adapter 1~Adapter48接头母液(50μM)。使用Agilent DNA 1000芯片对各接头母液进行质控。
表3接头退火PCR程序
Figure BDA0002712504480000132
(3)质控合格的接头母液,按等比例进行混合,得到混合接头母液。使用时使用TE缓冲液根据需要进行稀释并分装保存在-20±5℃中。
实施例3双index接头引物
本实施例提供了混合特异分子标签接头的配套的双index接头引物,包括正向接头引物和反向接头引物;
正向接头引物,由5’端到3’端依次包括GF引物序列、index2序列和index2引物结合区序列;
反向接头引物,由5’端到3’端依次包括GR引物序列、index1序列、index1引物结合区反向互补序列;
如图1所示:所述正向接头引物的核苷酸序列和所述反向接头引物的核苷酸序列的示例如下:
正向接头引物5’-3’:
Figure BDA0002712504480000141
反向接头引物5’-3’:
Figure BDA0002712504480000142
上述序列中,正向接头引物中的“NNNNNNNNNN”表示样本标签index2序列,单下划线部分的序列为GF引物序列,双下划线部分的序列为index2引物结合区序列;反向接头引物中的“NNNNNNNNNN”表示样本标签index1序列,单下划线部分的序列为GR引物序列,双下划线部分的序列为index1引物结合区反向互补序列;样本标签index1序列和样本标签index2序列可相同或不相同。进一步的,所述index1序列和index2序列选自表1。
按照上述混合特异分子标签接头的配套的双index接头引物的设计原则设计实施例2中表2中混合特异分子标签接头Adapter序列的双index接头引物。
实施例4双index接头封阻序列
本实施例提供了混合特异分子标签接头的配套的双index接头封阻序列:包括正向接头封阻序列和反向接头封阻序列;
正向接头封阻序列,由5’端到3’端依次包括正义接头互补区反向互补序列、index2引物结合区反向互补序列、index2序列反向互补序列和GF引物序列反向互补序列;正义接头互补区反向互补序列全部或部分与index2引物结合区反向互补序列5’末端序列重合;
反向接头封阻序列,由5’端到3’端依次包括GR引物序列、index1序列、index1引物结合区反向互补序列和反义接头互补区反向互补序列;所述反义接头互补区反向互补序列全部或部分与index1引物结合区反向互补序列3’末端序列重合;
如所述正向接头封阻序列的核苷酸序列和所述反向接头封阻序列的核苷酸序列的示例如下:
正向接头封阻序列5’-3’:
Figure BDA0002712504480000151
反向接头封阻序列5’-3’:
Figure BDA0002712504480000152
上述序列中,“/3phos/”表示3’端磷酸化修饰;正向接头封阻序列中“NNNNNNNNNN”表示样本标签index2序列的反向互补序列,由5’端到3’端依次包括正义接头互补区反向互补序列、index2引物结合区反向互补序列、index2序列反向互补序列和GF引物序列反向互补序列,波浪线的序列为正义接头互补区反向互补序列,单下划线部分的序列表示index2引物结合区的反向互补序列,正义接头互补区反向互补序列部分与index2引物结合区反向互补序列5’末端序列重合,双下划线部分的序列为GF引物序列反向互补序列;反向接头封阻序列中“NNNNNNNNNN”表示样本标签index1序列,由5’端到3’端依次包括GR引物序列、index1序列、index1引物结合区反向互补序列和反义接头互补区反向互补序列;所述反义接头互补区反向互补序列全部或部分与index1引物结合区反向互补序列3’末端序列重合,双下划线部分的序列为GR引物序列,单下划线部分的序列表示index1引物结合区反向互补序列,波浪线部分的序列表示反义接头互补区反向互补序列;正向接头封阻序列和反向接头封阻序列的样本标签index可相同或不相同。进一步的,所述index1序列和index2序列选自表1。
按照上述混合特异分子标签接头的配套的双index接头封阻序列的设计原则设计实施例2中表2中混合特异分子标签接头Adapter序列的双index接头封阻序列。
实施例5双index目标区域捕获建库流程
本实施例提供了一种利用双index建库体系构建文库的方法,包括如下步骤:
(1)末端修复及加“A”
提前将NEBNext Ultra II End Prep Reaction Buffer和NEBNext Ultra II EndPrep Enzyme Mix置于冰盒,待试剂溶解后振荡混匀并离心。按照表4配制末端修复及加“A”反应mix(Mix1),振荡混匀并离心。
表4 Mix1配制表
组分 单反应体积(μL)
NEBNext Ultra II End Prep Reaction Buffer 7
NEBNext Ultra II End Prep Enzyme Mix 3
总体积 10
**注:Mix1置于冰盒上配制。
配置后的Mix1按照每个反应10μL,依次分装至50μL DNA样本中,振荡混匀并离心。按照表5反应条件在恒温混匀仪或PCR仪上孵育。孵育完成后,降至室温,高速离心机短暂离心,将蒸发起的液滴收集入管内。
表5末端修复及加“A”反应程序
Figure BDA0002712504480000161
(2)接头连接
将溶解后的NEBNext Ultra II Ligation Master Mix、NEBNext LigationEnhancer及实施例2的接头振荡混匀并离心。向样本中单独加入2μL接头工作液并吹打混匀。按照表6配制接头连接反应mix(Mix 2),充分振荡混匀并离心后按照每个反应31μL于冰上分装至各反应管,振荡混匀并离心后将反应管置于恒温混匀仪20℃,孵育15min。
表6 Mix2配制表
组分 单反应体积(μL)
NEBNext Ultra II Ligation Master Mix 30
NEBNext Ligation Enhancer 1
总体积 31
**注:Mix2置于冰盒上配制。
(3)连接反应后纯化
向每个反应管中加入87μL AMPure XP磁珠,振荡混匀后,室温孵育10min。孵育结束,将离心管短暂离心并置于磁力架上至澄清,弃上清。保持离心管于磁力架上,向各离心管中依次加入400μL体积分数为80%乙醇溶液,关紧管盖颠倒漂洗3次,弃上清,重复漂洗一次。第二次漂洗弃上清后,将离心管短暂离心,用20μL移液器吸去离心管中残余液体。将离心管打开盖子置于磁力架上晾干至磁珠表面哑光。从磁力架上取下离心管,加入22μL TE缓冲液(pH 8.0),用移液器将磁珠与TE吹打混匀,室温下孵育5min。孵育结束,将离心管短暂离心,置于磁力架上至完全澄清。将上清纯化产物转移到新的1.5mL离心管中备用。
(4)捕获前PCR(Non-C-PCR)
提前将实施例3的双index接头引物工作液及2×KAPA HiFi HotStart ReadyMix置于室温解冻,解冻后试剂振荡混匀并离心。按照表7,依次向PCR管中添加对应反应组分并混匀离心。将样本置于PCR仪中,按照表8程序进行PCR扩增。
表7 Non-C-PCR Mix配制表
组分 单反应体积(μL)
正向接头引物工作液(10μM) 2.5
反向接头引物工作液(10μM) 2.5
2×KAPA HiFi HotStart ReadyMix 25
Adapter-Ligated library 20
总体积 50
表8 Non-C-PCR反应程序
Figure BDA0002712504480000171
Figure BDA0002712504480000181
(5)Non-C-PCR产物纯化
使用45μL AMPure XP磁珠对PCR产物进行纯化,最终溶解在31μL TE(pH 8.0)中(操作流程同步骤(3))。将纯化产物转移至全新的1.5mL离心管中用于文库质控、杂交或置于-20℃保存。
(6)蒸干Mix配制
将实施例4的双index接头封阻序列工作液、Cot-1 DNA和待杂交文库置于4℃解冻。融化后震荡混匀并离心,按照表9加入1.5mL离心管中,震荡混匀并离心。
表9蒸干Mix配制表
Figure BDA0002712504480000182
蒸干Mix管盖扎洞,置于真空浓缩仪中60℃浓缩蒸干,蒸干后使用封口膜封闭管盖上的孔。蒸干过程中将待杂交探针置于4℃解冻。将xGen 2X Hybridization Buffer、xGenHybridization Buffer Enhancer置于室温溶解,并振荡离心;
(7)按照表10配制变性Mix,振荡混匀后分装至蒸干的混合物中,充分振荡混匀并离心,置于恒温混匀仪上95℃变性10min;
表10变性Mix配制表
组分 单反应体积(μL)
xGen 2X Hybridization Buffer 8.5
xGen Hybridization Buffer Enhancer 2.7
Nuclease-Free Water 1.8
总体积 13
样本文库变性完成前2-3分钟,将溶解的探针分装至0.2mL PCR管中,每个反应探针用量4μL;变性完成后,将样本文库用高速离心机全速离心1min,后快速转移至PCR管中,振荡离心;
(8)将PCR管置于PCR仪上65℃杂交过夜(热盖温度75℃);
(9)过夜孵育后进行洗脱实验。洗脱实验前提前至少30分钟从-20℃冰箱中取出Wash BufferⅡ、Ⅲ、Stringent Wash Buffer和Bead Wash Buffer原液,室温解冻,按照表11中单反应用量配制浓度为1×的洗脱工作液并置于对应温度环境下提前预热。将M-270磁珠和AMPure XP磁珠置于室温平衡;
表11 1×洗脱工作液配制量
组分 单反应使用量(μL)
xGen 10×Stringent Wash Buffer 400(65℃)
xGen 10×Wash BufferⅠ 100(65℃)+200(RT)
xGen 10×Wash BufferⅡ 200
xGen 10×Wash BufferⅢ 200
xGen 2×Bead Wash Buffer 500
(10)平衡至室温的M-270磁珠充分振荡混匀后,吸取20μL到新的1.5mL离心管中,上磁力架吸弃上清。从磁力架上取下,使用200μL 1×Bead Wash Buffer漂洗磁珠3次,最后一次吸弃上清后加100μL 1×Bead Wash Buffer重悬磁珠并转移至新的0.2mL PCR管中备用;
(11)将装有磁珠的PCR管上磁力架吸弃上清,将过夜孵育的杂交体系转移至磁珠管中震荡混匀并置于65℃PCR仪(热盖75℃)中孵育45分钟。孵育期间每隔15分钟取出反应管快速震荡混匀1次;
(12)按照表12试剂顺序、用量和次数进行磁珠漂洗;
表12磁珠漂洗顺序及方法
Figure BDA0002712504480000191
Figure BDA0002712504480000201
(13)提前将2×KAPA HiFi HotStart ReadyMix和杂交后PCR引物(GF Primer:/5Phos/TCTCAGTACGTCAGCAGTT;GR Primer:GGCATGGCGACCTTATCAG;)置于4℃解冻,并充分振荡混匀离心。按照表13配制杂交后PCR Mix备用;
表13杂交后PCR Mix配制表
组分 单反应体积(μL)
2×KAPA HiFi HotStart ReadyMix 25
GF Primer(10μM) 2.5
GR Primer(10μM) 2.5
总体积 30
(14)将20μL漂洗后重悬磁珠转移至杂交后PCR Mix中,移液器吹打混匀后置于PCR仪中,运行表14程序进行杂交后PCR;
表14杂交后PCR反应程序
Figure BDA0002712504480000202
(15)使用60μL AMPure XP磁珠对PCR产物进行纯化,最终溶解在31μL TE(pH 8.0)中(操作流程同步骤3)。纯化后的文库用于文库质控、测序或置于-20℃保存。
对比例1
本对比例提供了一种利用现有的双index接头引物体系构建文库的方法,包括如下步骤:
1)现有双index接头引物体系,混合特异分子标签接头具体如下:
接头寡核苷酸链1(正向接头序列)5’-3’:
Figure BDA0002712504480000211
接头寡核苷酸链2(反向接头序列)5’-3’:
Figure BDA0002712504480000212
正向接头引物5’-3’:
TCTCAGTACGTCAGCAGTTNNNNNNNNNNCAACTCCTTGGCTCACAGAACGACATGGCTACGATCCGACT;
反向接头引物5’-3’:
GGCATGGCGACCTTATCAGNNNNNNNNNNTTGTCTTCCTAAGACCGCTTGGCC;
上述序列中,双下划线处的序列为分子标签(选自表15),“/5Phos/”表示5’端磷酸化修饰;正向接头引物的“NNNNNNNNNN”表示样本标签index2,反向接头引物的“NNNNNNNNNN”表示样本标签index1,正向接头引物和反向接头引物的样本标签index可相同或不相同。所述index序列选自表1。
按照上述混合特异分子标签接头设计原则设计包含不同分子标签的混合特异分子标签接头Adapter 1~Adapter 16,所述分子标签选自表15。
表15现用混合特异分子标签
接头链 接头编号 分子标签序列 接头链 接头编号 分子标签序列
正向接头序列 AD-1-1 CAATA 反向接头序列 AD-2-1 TATTG
正向接头序列 AD-1-2 CCACT 反向接头序列 AD-2-2 AGTGG
正向接头序列 AD-1-3 TTAGG 反向接头序列 AD-2-3 CCTAA
正向接头序列 AD-1-4 CAGAC 反向接头序列 AD-2-4 GTCTG
正向接头序列 AD-1-5 ATCGA 反向接头序列 AD-2-5 TCGAT
正向接头序列 AD-1-6 TAGAT 反向接头序列 AD-2-6 ATCTA
正向接头序列 AD-1-7 CTAAG 反向接头序列 AD-2-7 CTTAG
正向接头序列 AD-1-8 GTCTC 反向接头序列 AD-2-8 GAGAC
正向接头序列 AD-1-9 CCGAA 反向接头序列 AD-2-9 TTCGG
正向接头序列 AD-1-10 ACTAT 反向接头序列 AD-2-10 ATAGT
正向接头序列 AD-1-11 TCCAG 反向接头序列 AD-2-11 CTGGA
正向接头序列 AD-1-12 AGCTC 反向接头序列 AD-2-12 GAGCT
正向接头序列 AD-1-13 AACTA 反向接头序列 AD-2-13 TAGTT
正向接头序列 AD-1-14 CCCAT 反向接头序列 AD-2-14 ATGGG
正向接头序列 AD-1-15 CTTAG 反向接头序列 AD-2-15 CTAAG
正向接头序列 AD-1-16 ATCTC 反向接头序列 AD-2-16 GAGAT
本对比例的双index接头引物序列为实施例3中设计的双index接头引物。本对比例的双index接头封阻序列为实施例4中设计的双index接头封阻序列。
2)文库构建方法
文库构建方法与实施例5相同。
实验例1建库、捕获性能比较
本实验对本发明的混合特异分子标签接头和现有接头体系进行比较。评估片段转化效率及目标区域捕获性能。
一、建库体系
方案1、包括实施例2的混合特异分子标签接头和实施例3的双index接头引物以及实施例4的双index接头封阻序列。其中index1序列和index2序列选自表1。具体的,用于该实施例的index组合为1~6号index;
方案2、包括对比例1中的双index建库体系,index1序列和index2序列选自表1。具体的,用于该实验例的index组合为1~6号index;
二、接头性能比较测试
(1)实验方法:50ng gDNA打断后分别使用上述方案1-2的双index建库体系建库,详细建库方法参考实施例5步骤(1)~步骤(5),取部分的步骤(5)中纯化后的中间文库进行WGS测序。其余文库使用商品化液态捕获探针(IDT生产)进行目标区域捕获(即实施例5步骤(6)~步骤(15)获得的文库)并上机测序(测序平台为Gene+Seq 2000)。上机时,方案1无需进行暗反应设置,方案2则需要设置暗反应。
(2)评估指标:湿实验指标包括:文库总量;干实验指标包括:平均深度、捕获效率、比对率、覆盖均一性(1×平均深度覆盖度)。
文库浓度使用Life technology Qubit 3.0荧光定量仪搭配QubitTM dsDNA HSAssay Kit进行定量获得;
平均深度、捕获效率、比对率、覆盖均一性(1×平均深度覆盖度)(上述4个指标是测序领域中周知的基础评价指标,均是通过对数据的计算得到的,在本实验中是由吉因加检测),在截取相同数据量后,对其进行计算,比较方案间对应指标差异;
(3)测试结果
1)湿实验指标:2种方案文库体系建库质控数据统计结果如表16所示,本发明文库体系平均文库产量较对比例提升9%,优于对比例文库体系。表明,本发明片段转化率优于对比例体系。
表16两种建库体系文库产量
index序号 对比例 本发明
1 1152 1296
2 1212 1320
3 1194 1260
4 1152 1302
5 1242 1350
6 1194 1266
平均产量(ng) 1191 1299
2)干实验指标:2种文库体系方案捕获后干实验质控数据统计结果如表17所示,两种文库体系比对率无显著差异。结合文库产量数据和相同数据量下平均深度数据可证明,本发明文库体系片段转化效率优于对比例文库体系。相同数据量下,捕获效率和1×mean覆盖度比较结果表明,本发明能够应用于目标区域捕获测序且性能显著优于对比例文库体系。
表17干实验测序指标汇总
建库体系 比对率 平均深度 捕获效率 1.0×mean覆盖度
对比例 99.85% 2123 47.69% 50.92%
本发明 99.88% 2385 57.42% 51.36%
(4)测试结论
综上比较,本发明的文库体系从DNA片段转化效率和捕获性能方面均显著优于对比例文库体系。
实验例2分子标签连接均一性比较
一、建库体系:
方案1:包括实施例2的混合特异分子标签接头和实施例3的双index接头引物,正向接头引物和反向接头引物的样本标签index序列组合信息选自表1。具体的,用于该实验例的index组合为1~3号index;
方案2:包括对比例1的混合特异分子标签接头及双index接头引物;index1序列和index2序列选自表1。具体的,用于该实验例的index组合为1~3号index;
二、分子标签连接均一性比较
(1)实验方法:1000ng gDNA片段化后分别使用方案1和方案2建库体系按照实施例5步骤(1)~步骤(5)建库,并上机测序(测序平台为Gene+Seq 2000)。
(2)评估指标:不同分子标签支持reads数变异系数(cv)
不同分子标签支持reads数进行统计,变异系数(cv)根据如下公式计算:
不同分子标签支持reads数cv=不同分子标签支持reads数标准差/平均支持reads数
(3)测试结果:
两种方案各分子标签支持reads数如表18所示。
表18两种方案各分子标签支持reads数统计结果
Figure BDA0002712504480000241
本发明文库体系各分子标签支持reads数cv显著优于对比例。表明,本发明不同分子标签接头连接水平较对比例均一性更优。
实验例3 index对扩增均一性比较
一、建库体系:
方案1:包括实施例2的混合特异分子标签接头和实施例3的双index接头引物,正向接头引物和反向接头引物的样本标签index序列组合信息选自表1;
方案2:包括对比例1的混合特异分子标签接头及双index接头引物,正向接头引物和反向接头引物的样本标签index序列组合信息选自表19;
表19 index1和index2序列信息
Figure BDA0002712504480000251
Figure BDA0002712504480000261
Figure BDA0002712504480000271
二、index对扩增均一性比较测试
(1)实验方法:1000ng gDNA片段化后分别使用方案1和方案2建库体系按照实施例5步骤(1)~步骤(3)制备接头连接产物。纯化后的接头连接产物平均分配并分别使用方案1和方案2双index接头引物扩增。扩增产物纯化后使用Qubit ds DNA HS Assay Kit进行定量。
(2)评估指标:各index间文库产量变异系数(cv)。
不同index间文库产量变异系数按照如下公式进行计算:
Index间文库产量cv=不同index文库浓度标准差/平均文库浓度
(3)测试结果:
方案1 483对index组合文库产量cv为7.9%,文库产量数据如图2所示。对比例96对index组合文库产量cv为8.08%,文库产量数据如图3所示。方案1index组合均一性优于对比例。
实验例4分子标签测序质量改善评估
一、测试方案:包括实施例2的混合特异分子标签接头和实施例3的双index接头引物,正向接头引物和反向接头引物的样本标签index序列组合信息选自表1;
二、分子标签测序质量改善评估测试
(1)实验方法:1000ng gDNA片段化后分别使用上述测试方案建库体系按照实施例5步骤(1)~步骤(5)建库,并上机测序(测序平台为Gene+Seq2000)。
(2)评估指标:正向测序和反向测序前10bp碱基测序Q30>85%。
(3)测试结果:
测试文库正向测序和反向测序每个碱基平均Q30分布如图4所示。正向测序和反向测序前10bp(分子标签及其下游固定碱基区域)测序Q30均>85%,满足预期要求。
显然,上述实施例仅仅是为清楚地说明所作的举例,而并非对实施方式的限定。对于所属领域的普通技术人员来说,在上述说明的基础上还可以做出其它不同形式的变化或变动。这里无需也无法对所有的实施方式予以穷举。而由此所引伸出的显而易见的变化或变动仍处于本发明创造的保护范围之中。
序列表
<110> 北京吉因加科技有限公司
北京吉因加医学检验实验室有限公司
<120> 特异分子标签UMI组、混合特异分子标签接头及应用
<160> 96
<170> SIPOSequenceListing 1.0
<210> 1
<211> 40
<212> DNA
<213> 人工合成(artificial synthesis)
<400> 1
ggctcacaga acgacatggc tacgatccga cttagactgt 40
<210> 2
<211> 40
<212> DNA
<213> 人工合成(artificial synthesis)
<400> 2
ggctcacaga acgacatggc tacgatccga cttcgcatgt 40
<210> 3
<211> 40
<212> DNA
<213> 人工合成(artificial synthesis)
<400> 3
ggctcacaga acgacatggc tacgatccga cttgcgatct 40
<210> 4
<211> 40
<212> DNA
<213> 人工合成(artificial synthesis)
<400> 4
ggctcacaga acgacatggc tacgatccga ctttctagct 40
<210> 5
<211> 40
<212> DNA
<213> 人工合成(artificial synthesis)
<400> 5
ggctcacaga acgacatggc tacgatccga ctttagacgt 40
<210> 6
<211> 40
<212> DNA
<213> 人工合成(artificial synthesis)
<400> 6
ggctcacaga acgacatggc tacgatccga ctttcgcagt 40
<210> 7
<211> 40
<212> DNA
<213> 人工合成(artificial synthesis)
<400> 7
ggctcacaga acgacatggc tacgatccga ctttgcgact 40
<210> 8
<211> 40
<212> DNA
<213> 人工合成(artificial synthesis)
<400> 8
ggctcacaga acgacatggc tacgatccga cttgtctact 40
<210> 9
<211> 40
<212> DNA
<213> 人工合成(artificial synthesis)
<400> 9
ggctcacaga acgacatggc tacgatccga ctttagacgt 40
<210> 10
<211> 40
<212> DNA
<213> 人工合成(artificial synthesis)
<400> 10
ggctcacaga acgacatggc tacgatccga ctttcgcagt 40
<210> 11
<211> 40
<212> DNA
<213> 人工合成(artificial synthesis)
<400> 11
ggctcacaga acgacatggc tacgatccga ctttgcgact 40
<210> 12
<211> 40
<212> DNA
<213> 人工合成(artificial synthesis)
<400> 12
ggctcacaga acgacatggc tacgatccga cttgtctact 40
<210> 13
<211> 41
<212> DNA
<213> 人工合成(artificial synthesis)
<400> 13
ggctcacaga acgacatggc tacgatccga cttacatggg t 41
<210> 14
<211> 41
<212> DNA
<213> 人工合成(artificial synthesis)
<400> 14
ggctcacaga acgacatggc tacgatccga cttcactgag t 41
<210> 15
<211> 41
<212> DNA
<213> 人工合成(artificial synthesis)
<400> 15
ggctcacaga acgacatggc tacgatccga cttgagtctc t 41
<210> 16
<211> 41
<212> DNA
<213> 人工合成(artificial synthesis)
<400> 16
ggctcacaga acgacatggc tacgatccga ctttatgccc t 41
<210> 17
<211> 41
<212> DNA
<213> 人工合成(artificial synthesis)
<400> 17
ggctcacaga acgacatggc tacgatccga cttgacatgg t 41
<210> 18
<211> 41
<212> DNA
<213> 人工合成(artificial synthesis)
<400> 18
ggctcacaga acgacatggc tacgatccga cttgcactag t 41
<210> 19
<211> 41
<212> DNA
<213> 人工合成(artificial synthesis)
<400> 19
ggctcacaga acgacatggc tacgatccga cttcgagttc t 41
<210> 20
<211> 41
<212> DNA
<213> 人工合成(artificial synthesis)
<400> 20
ggctcacaga acgacatggc tacgatccga cttctatgcc t 41
<210> 21
<211> 41
<212> DNA
<213> 人工合成(artificial synthesis)
<400> 21
ggctcacaga acgacatggc tacgatccga cttgacatgg t 41
<210> 22
<211> 41
<212> DNA
<213> 人工合成(artificial synthesis)
<400> 22
ggctcacaga acgacatggc tacgatccga cttgcactag t 41
<210> 23
<211> 41
<212> DNA
<213> 人工合成(artificial synthesis)
<400> 23
ggctcacaga acgacatggc tacgatccga cttcgagttc t 41
<210> 24
<211> 41
<212> DNA
<213> 人工合成(artificial synthesis)
<400> 24
ggctcacaga acgacatggc tacgatccga cttctatgcc t 41
<210> 25
<211> 42
<212> DNA
<213> 人工合成(artificial synthesis)
<400> 25
ggctcacaga acgacatggc tacgatccga cttatagcag gt 42
<210> 26
<211> 42
<212> DNA
<213> 人工合成(artificial synthesis)
<400> 26
ggctcacaga acgacatggc tacgatccga cttctcgaag gt 42
<210> 27
<211> 42
<212> DNA
<213> 人工合成(artificial synthesis)
<400> 27
ggctcacaga acgacatggc tacgatccga cttgtgcatc ct 42
<210> 28
<211> 42
<212> DNA
<213> 人工合成(artificial synthesis)
<400> 28
ggctcacaga acgacatggc tacgatccga ctttgtcatc ct 42
<210> 29
<211> 42
<212> DNA
<213> 人工合成(artificial synthesis)
<400> 29
ggctcacaga acgacatggc tacgatccga cttcatagag gt 42
<210> 30
<211> 42
<212> DNA
<213> 人工合成(artificial synthesis)
<400> 30
ggctcacaga acgacatggc tacgatccga cttactcgag gt 42
<210> 31
<211> 42
<212> DNA
<213> 人工合成(artificial synthesis)
<400> 31
ggctcacaga acgacatggc tacgatccga cttagtgctc ct 42
<210> 32
<211> 42
<212> DNA
<213> 人工合成(artificial synthesis)
<400> 32
ggctcacaga acgacatggc tacgatccga cttatgtctc ct 42
<210> 33
<211> 42
<212> DNA
<213> 人工合成(artificial synthesis)
<400> 33
ggctcacaga acgacatggc tacgatccga cttcatagag gt 42
<210> 34
<211> 42
<212> DNA
<213> 人工合成(artificial synthesis)
<400> 34
ggctcacaga acgacatggc tacgatccga cttactcgag gt 42
<210> 35
<211> 42
<212> DNA
<213> 人工合成(artificial synthesis)
<400> 35
ggctcacaga acgacatggc tacgatccga cttagtgctc ct 42
<210> 36
<211> 42
<212> DNA
<213> 人工合成(artificial synthesis)
<400> 36
ggctcacaga acgacatggc tacgatccga cttatgtctc ct 42
<210> 37
<211> 43
<212> DNA
<213> 人工合成(artificial synthesis)
<400> 37
ggctcacaga acgacatggc tacgatccga cttatcagca ggt 43
<210> 38
<211> 43
<212> DNA
<213> 人工合成(artificial synthesis)
<400> 38
ggctcacaga acgacatggc tacgatccga cttcagctaa cgt 43
<210> 39
<211> 43
<212> DNA
<213> 人工合成(artificial synthesis)
<400> 39
ggctcacaga acgacatggc tacgatccga cttgctgata cct 43
<210> 40
<211> 43
<212> DNA
<213> 人工合成(artificial synthesis)
<400> 40
ggctcacaga acgacatggc tacgatccga ctttgatcga gct 43
<210> 41
<211> 43
<212> DNA
<213> 人工合成(artificial synthesis)
<400> 41
ggctcacaga acgacatggc tacgatccga cttgatcaca ggt 43
<210> 42
<211> 43
<212> DNA
<213> 人工合成(artificial synthesis)
<400> 42
ggctcacaga acgacatggc tacgatccga ctttcagcaa cgt 43
<210> 43
<211> 43
<212> DNA
<213> 人工合成(artificial synthesis)
<400> 43
ggctcacaga acgacatggc tacgatccga cttagctgta cct 43
<210> 44
<211> 43
<212> DNA
<213> 人工合成(artificial synthesis)
<400> 44
ggctcacaga acgacatggc tacgatccga cttctgatga gct 43
<210> 45
<211> 43
<212> DNA
<213> 人工合成(artificial synthesis)
<400> 45
ggctcacaga acgacatggc tacgatccga cttgctaaca ggt 43
<210> 46
<211> 43
<212> DNA
<213> 人工合成(artificial synthesis)
<400> 46
ggctcacaga acgacatggc tacgatccga ctttgaccaa cgt 43
<210> 47
<211> 43
<212> DNA
<213> 人工合成(artificial synthesis)
<400> 47
ggctcacaga acgacatggc tacgatccga cttatcggta cct 43
<210> 48
<211> 43
<212> DNA
<213> 人工合成(artificial synthesis)
<400> 48
ggctcacaga acgacatggc tacgatccga cttcagttga gct 43
<210> 49
<211> 33
<212> DNA
<213> 人工合成(artificial synthesis)
<400> 49
cagtctaagt cggaggccaa gcggtcttag gaa 33
<210> 50
<211> 33
<212> DNA
<213> 人工合成(artificial synthesis)
<400> 50
catgcgaagt cggaggccaa gcggtcttag gaa 33
<210> 51
<211> 33
<212> DNA
<213> 人工合成(artificial synthesis)
<400> 51
gatcgcaagt cggaggccaa gcggtcttag gaa 33
<210> 52
<211> 33
<212> DNA
<213> 人工合成(artificial synthesis)
<400> 52
gctagaaagt cggaggccaa gcggtcttag gaa 33
<210> 53
<211> 33
<212> DNA
<213> 人工合成(artificial synthesis)
<400> 53
cgtctaaagt cggaggccaa gcggtcttag gaa 33
<210> 54
<211> 33
<212> DNA
<213> 人工合成(artificial synthesis)
<400> 54
ctgcgaaagt cggaggccaa gcggtcttag gaa 33
<210> 55
<211> 33
<212> DNA
<213> 人工合成(artificial synthesis)
<400> 55
gtcgcaaagt cggaggccaa gcggtcttag gaa 33
<210> 56
<211> 33
<212> DNA
<213> 人工合成(artificial synthesis)
<400> 56
gtagacaagt cggaggccaa gcggtcttag gaa 33
<210> 57
<211> 33
<212> DNA
<213> 人工合成(artificial synthesis)
<400> 57
cgtctaaagt cggaggccaa gcggtcttag gaa 33
<210> 58
<211> 33
<212> DNA
<213> 人工合成(artificial synthesis)
<400> 58
ctgcgaaagt cggaggccaa gcggtcttag gaa 33
<210> 59
<211> 33
<212> DNA
<213> 人工合成(artificial synthesis)
<400> 59
gtcgcaaagt cggaggccaa gcggtcttag gaa 33
<210> 60
<211> 33
<212> DNA
<213> 人工合成(artificial synthesis)
<400> 60
gtagacaagt cggaggccaa gcggtcttag gaa 33
<210> 61
<211> 34
<212> DNA
<213> 人工合成(artificial synthesis)
<400> 61
cccatgtaag tcggaggcca agcggtctta ggaa 34
<210> 62
<211> 34
<212> DNA
<213> 人工合成(artificial synthesis)
<400> 62
ctcagtgaag tcggaggcca agcggtctta ggaa 34
<210> 63
<211> 34
<212> DNA
<213> 人工合成(artificial synthesis)
<400> 63
gagactcaag tcggaggcca agcggtctta ggaa 34
<210> 64
<211> 34
<212> DNA
<213> 人工合成(artificial synthesis)
<400> 64
gggcataaag tcggaggcca agcggtctta ggaa 34
<210> 65
<211> 34
<212> DNA
<213> 人工合成(artificial synthesis)
<400> 65
ccatgtcaag tcggaggcca agcggtctta ggaa 34
<210> 66
<211> 34
<212> DNA
<213> 人工合成(artificial synthesis)
<400> 66
ctagtgcaag tcggaggcca agcggtctta ggaa 34
<210> 67
<211> 34
<212> DNA
<213> 人工合成(artificial synthesis)
<400> 67
gaactcgaag tcggaggcca agcggtctta ggaa 34
<210> 68
<211> 34
<212> DNA
<213> 人工合成(artificial synthesis)
<400> 68
ggcatagaag tcggaggcca agcggtctta ggaa 34
<210> 69
<211> 34
<212> DNA
<213> 人工合成(artificial synthesis)
<400> 69
ccatgtcaag tcggaggcca agcggtctta ggaa 34
<210> 70
<211> 34
<212> DNA
<213> 人工合成(artificial synthesis)
<400> 70
ctagtgcaag tcggaggcca agcggtctta ggaa 34
<210> 71
<211> 34
<212> DNA
<213> 人工合成(artificial synthesis)
<400> 71
gaactcgaag tcggaggcca agcggtctta ggaa 34
<210> 72
<211> 34
<212> DNA
<213> 人工合成(artificial synthesis)
<400> 72
ggcatagaag tcggaggcca agcggtctta ggaa 34
<210> 73
<211> 35
<212> DNA
<213> 人工合成(artificial synthesis)
<400> 73
cctgctataa gtcggaggcc aagcggtctt aggaa 35
<210> 74
<211> 35
<212> DNA
<213> 人工合成(artificial synthesis)
<400> 74
ccttcgagaa gtcggaggcc aagcggtctt aggaa 35
<210> 75
<211> 35
<212> DNA
<213> 人工合成(artificial synthesis)
<400> 75
ggatgcacaa gtcggaggcc aagcggtctt aggaa 35
<210> 76
<211> 35
<212> DNA
<213> 人工合成(artificial synthesis)
<400> 76
ggatgacaaa gtcggaggcc aagcggtctt aggaa 35
<210> 77
<211> 35
<212> DNA
<213> 人工合成(artificial synthesis)
<400> 77
cctctatgaa gtcggaggcc aagcggtctt aggaa 35
<210> 78
<211> 35
<212> DNA
<213> 人工合成(artificial synthesis)
<400> 78
cctcgagtaa gtcggaggcc aagcggtctt aggaa 35
<210> 79
<211> 35
<212> DNA
<213> 人工合成(artificial synthesis)
<400> 79
ggagcactaa gtcggaggcc aagcggtctt aggaa 35
<210> 80
<211> 35
<212> DNA
<213> 人工合成(artificial synthesis)
<400> 80
ggagacataa gtcggaggcc aagcggtctt aggaa 35
<210> 81
<211> 35
<212> DNA
<213> 人工合成(artificial synthesis)
<400> 81
cctctatgaa gtcggaggcc aagcggtctt aggaa 35
<210> 82
<211> 35
<212> DNA
<213> 人工合成(artificial synthesis)
<400> 82
cctcgagtaa gtcggaggcc aagcggtctt aggaa 35
<210> 83
<211> 35
<212> DNA
<213> 人工合成(artificial synthesis)
<400> 83
ggagcactaa gtcggaggcc aagcggtctt aggaa 35
<210> 84
<211> 35
<212> DNA
<213> 人工合成(artificial synthesis)
<400> 84
ggagacataa gtcggaggcc aagcggtctt aggaa 35
<210> 85
<211> 36
<212> DNA
<213> 人工合成(artificial synthesis)
<400> 85
cctgctgata agtcggaggc caagcggtct taggaa 36
<210> 86
<211> 36
<212> DNA
<213> 人工合成(artificial synthesis)
<400> 86
cgttagctga agtcggaggc caagcggtct taggaa 36
<210> 87
<211> 36
<212> DNA
<213> 人工合成(artificial synthesis)
<400> 87
ggtatcagca agtcggaggc caagcggtct taggaa 36
<210> 88
<211> 36
<212> DNA
<213> 人工合成(artificial synthesis)
<400> 88
gctcgatcaa agtcggaggc caagcggtct taggaa 36
<210> 89
<211> 36
<212> DNA
<213> 人工合成(artificial synthesis)
<400> 89
cctgtgatca agtcggaggc caagcggtct taggaa 36
<210> 90
<211> 36
<212> DNA
<213> 人工合成(artificial synthesis)
<400> 90
cgttgctgaa agtcggaggc caagcggtct taggaa 36
<210> 91
<211> 36
<212> DNA
<213> 人工合成(artificial synthesis)
<400> 91
ggtacagcta agtcggaggc caagcggtct taggaa 36
<210> 92
<211> 36
<212> DNA
<213> 人工合成(artificial synthesis)
<400> 92
gctcatcaga agtcggaggc caagcggtct taggaa 36
<210> 93
<211> 36
<212> DNA
<213> 人工合成(artificial synthesis)
<400> 93
cctgttagca agtcggaggc caagcggtct taggaa 36
<210> 94
<211> 36
<212> DNA
<213> 人工合成(artificial synthesis)
<400> 94
cgttggtcaa agtcggaggc caagcggtct taggaa 36
<210> 95
<211> 36
<212> DNA
<213> 人工合成(artificial synthesis)
<400> 95
ggtaccgata agtcggaggc caagcggtct taggaa 36
<210> 96
<211> 36
<212> DNA
<213> 人工合成(artificial synthesis)
<400> 96
gctcaactga agtcggaggc caagcggtct taggaa 36

Claims (16)

1.一种特异分子标签UMI组,其特征在于,包括:序列长度为5bp的第一特异分子标签UMI,序列长度为6bp的第二特异分子标签UMI,序列长度为7bp的第三特异分子标签UMI,和序列长度为8bp的第四特异分子标签UMI。
2.根据权利要求1所述的特异分子标签UMI组,其特征在于,所述特异性分子标签UMI组的正义分子标签的序列如表2所示,反义分子标签的序列如表2所示。
3.根据权利要求1或2所述的特异分子标签UMI组,其特征在于,各分子标签摩尔数相同。
4.权利要求1-3任一项所述的特异分子标签UMI组在测序、建库中的用途。
5.一种混合特异分子标签接头,其特征在于,所述混合特异分子标签接头的正义分子标签和反义分子标签均使用权利要求1-3任一项所述的特异分子标签UMI组。
6.根据权利要求5所述的混合特异分子标签接头,其特征在于,第一特异分子标签UMI、第二特异分子标签UMI、第三特异分子标签UMI和第四特异分子标签UMI在所述的混合特异分子标签接头中的摩尔数相同。
7.根据权利要求5或6所述的混合特异分子标签接头,其特征在于,包括两条部分互补的接头寡核苷酸链:
接头寡核苷酸链1,由5’端到3’端依次包括index2引物结合区、正义接头互补区、正义分子标签、至少一个具有碱基平衡作用的碱基S和1个突出的固定碱基T;
接头寡核苷酸链2,由5’端到3’端依次包括与接头寡核苷酸链1中碱基S互补的碱基、与接头寡核苷酸链1中的正义分子标签反向互补的反义分子标签、与接头寡核苷酸链1正义接头互补区反向互补的反义接头互补区和index1引物结合区。
8.根据权利要求7所述的混合特异分子标签接头,其特征在于,
在所述的接头寡核苷酸链1中,所述index2引物结合区的长度为15-42bp,所述正义接头互补区长度为8-10bp,所述正义分子标签的长度为5-8bp;所述正义接头互补区全部或部分与index2引物结合区的3’末端序列重合;
优选的,在所述的接头寡核苷酸链2中,所述反义分子标签长度为5-8bp,所述反义接头互补区长度为8-10bp,所述index1引物结合区长度为15-30bp;所述反义接头互补区全部或部分与index1引物结合区的5’末端序列重合。
9.根据权利要求5-8任一项所述的混合特异分子标签接头,其特征在于,在所述的接头寡核苷酸链1中,由正义分子标签、平衡碱基S和固定碱基T组成的序列中的A/T/G/C 4种碱基各自的个数分别占所述正义分子标签的总碱基数的6.25%~43.75%之间;
优选的,在所述的接头寡核苷酸链2中,反义分子标签和平衡碱基S互补组成的序列中A/T/G/C 4种碱基各自的个数分别占所述反义分子标签的总碱基数的6.25%~43.75%之间。
10.根据权利要求5-9任一项所述的混合特异分子标签接头,其特征在于,接头寡核苷酸链2的5’端磷酸化修饰;优选的,所述混合特异分子标签接头为Y型混合特异分子标签接头。
11.根据权利要求5-10任一项所述的混合特异分子标签接头,其特征在于,所述index1序列和index2序列选自表1。
12.一种双index文库结构,其特征在于,包括利用权利要求1-3所述的混合特异分子标签和/或权利要求5-11任一项所述的混合特异分子标签接头制备而成。
13.一种双index建库体系,其特征在于,包括利用权利要求1-3所述的混合特异分子标签和/或权利要求5-11任一项所述的混合特异分子标签接头。
14.一种文库构建方法,其特征在于,包括利用权利要求1-3所述的混合特异分子标签和/或权利要求5-11任一项所述的混合特异分子标签接头。
15.一种测序方法,其特征在于,包括利用权利要求12所述的文库结构。
16.根据权利要求15所述的测序方法,其特征在于,测序平台为Gene+Seq 2000、Gene+Seq200或DNBSEQ-T7。
CN202011061421.7A 2020-09-30 2020-09-30 特异分子标签umi组、混合特异分子标签接头及应用 Pending CN114317528A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011061421.7A CN114317528A (zh) 2020-09-30 2020-09-30 特异分子标签umi组、混合特异分子标签接头及应用

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011061421.7A CN114317528A (zh) 2020-09-30 2020-09-30 特异分子标签umi组、混合特异分子标签接头及应用

Publications (1)

Publication Number Publication Date
CN114317528A true CN114317528A (zh) 2022-04-12

Family

ID=81011321

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011061421.7A Pending CN114317528A (zh) 2020-09-30 2020-09-30 特异分子标签umi组、混合特异分子标签接头及应用

Country Status (1)

Country Link
CN (1) CN114317528A (zh)

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107475352A (zh) * 2016-06-08 2017-12-15 深圳华大基因股份有限公司 一种用于边合成边测序的测序仪的通用型pcr扩增融合引物
CN107829146A (zh) * 2017-11-29 2018-03-23 广州赛哲生物科技股份有限公司 一种用于构建16SrRNA基因扩增子测序文库的引物组及构建方法
US20180245072A1 (en) * 2015-11-11 2018-08-30 Resolution Bioscience, Inc. High efficiency construction of dna libraries
CN109439729A (zh) * 2018-12-27 2019-03-08 上海鲸舟基因科技有限公司 检测低频变异用的接头、接头混合物及相应方法
CN110257480A (zh) * 2019-07-04 2019-09-20 北京京诺玛特科技有限公司 核酸序列测序接头及其构建测序文库的方法
CN111349699A (zh) * 2018-12-24 2020-06-30 深圳华大智造科技有限公司 试剂盒及从宫颈分泌物中检测brca基因突变的方法
WO2020136440A2 (en) * 2018-12-28 2020-07-02 National University Of Singapore Methods for targeted complementary dna enrichment

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20180245072A1 (en) * 2015-11-11 2018-08-30 Resolution Bioscience, Inc. High efficiency construction of dna libraries
CN107475352A (zh) * 2016-06-08 2017-12-15 深圳华大基因股份有限公司 一种用于边合成边测序的测序仪的通用型pcr扩增融合引物
CN107829146A (zh) * 2017-11-29 2018-03-23 广州赛哲生物科技股份有限公司 一种用于构建16SrRNA基因扩增子测序文库的引物组及构建方法
CN111349699A (zh) * 2018-12-24 2020-06-30 深圳华大智造科技有限公司 试剂盒及从宫颈分泌物中检测brca基因突变的方法
CN109439729A (zh) * 2018-12-27 2019-03-08 上海鲸舟基因科技有限公司 检测低频变异用的接头、接头混合物及相应方法
WO2020136440A2 (en) * 2018-12-28 2020-07-02 National University Of Singapore Methods for targeted complementary dna enrichment
CN110257480A (zh) * 2019-07-04 2019-09-20 北京京诺玛特科技有限公司 核酸序列测序接头及其构建测序文库的方法

Similar Documents

Publication Publication Date Title
CN112626189A (zh) 基因测序仪的短接头、双index接头引物和双index建库体系
CN110129415B (zh) 一种ngs建库分子接头及其制备方法和用途
CN111808854B (zh) 带有分子条码的平衡接头及快速构建转录组文库的方法
CN108456713A (zh) 接头封闭序列、文库构建试剂盒及测序文库的构建方法
EP1597395A2 (en) Method for producing second-generation library
CN110218781B (zh) 21个微单倍型位点的复合扩增体系、下一代测序分型试剂盒及分型方法
CN109234357B (zh) 一种用于检测靶基因是否发生融合突变的方法、引物组合、试剂盒及其应用
CN112322788B (zh) 一种检测SARS-CoV-2的mNGS引物组及试剂盒
CN112708622A (zh) 一种用于文库构建的接头引物组合及其试剂盒
CN112410331A (zh) 带分子标签和样本标签的接头及其单链建库方法
WO2023036271A1 (zh) 一种构建高检测性能捕获文库的方法和试剂盒
CN111471746A (zh) 检测低突变丰度样本的ngs文库制备接头及其制备方法
CN111748637A (zh) 一种用于亲缘关系分析鉴定的snp分子标记组合、多重复合扩增引物组、试剂盒及方法
CN114032288A (zh) 一种试剂盒及其制备测序用靶核苷酸的方法
CN116790718B (zh) 一种多重扩增子文库的构建方法及其应用
CN114807300A (zh) 单引物多重扩增技术在检测片段化稀有特征核酸分子中的应用及试剂盒
CN110872609A (zh) 对小rna分子精准建库和测序的方法以及应用
CN114317528A (zh) 特异分子标签umi组、混合特异分子标签接头及应用
CN111501106A (zh) 外泌体rna的高通量测序文库的构建方法及装置、用途
CN115807056B (zh) 一种bcr或tcr重排序列模板池及其应用
CN113462759B (zh) 基于多重扩增和探针捕获的组合对单链dna序列富集测序的方法及在突变检测中的应用
CN117580959A (zh) 用于基于小珠的核酸的组合索引的方法和组合物
CN116536308A (zh) 测序封闭剂及其应用
CN112391442B (zh) 核酸样本处理方法、测序方法和试剂盒
CN112538657A (zh) 一种脑脊液基因测序建库、检测方法及其应用

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination