CN109337956B

CN109337956B - 基于ngs技术富集多基因茎环探针设计方法及试剂盒

Info

Publication number: CN109337956B
Application number: CN201811048119.0A
Authority: CN
Inventors: 孙虎林
Original assignee: Shanghai 3D Medicines Co Ltd
Current assignee: Shanghai 3D Medicines Co Ltd
Priority date: 2018-09-07
Filing date: 2018-09-07
Publication date: 2022-08-19
Anticipated expiration: 2038-09-07
Also published as: CN109337956A

Abstract

本发明提供了捕获探针的设计方法，包括：设计基础探针序列；在基础探针序列的5’游离区与3’游离区之间每间隔一定碱基数量***一定长度的人类基因组无关序列；其中，第一个***序列与最后一个***序列互补，并且第一个***序列与最后一个***序列不与其它***序列互补。本发明还提供了捕获探针，包括：5’游离区、3’游离区和位于5’游离区与3’游离区之间的区域，其中，位于5’游离区与3’游离区之间的区域包括多个依次交替排列的间隔区和***区。本发明还提供了高通量检测人循环肿瘤DNA基因变异的捕获探针组，和包括捕获探针组的试剂盒。本发明的捕获探针和捕获探针组具有捕获特异性好和检测灵敏度高的优点。

Description

基于NGS技术富集多基因茎环探针设计方法及试剂盒

技术领域

本发明属于基因检测领域，具体地，本发明涉及捕获探针的设计方法、捕获探针、捕获探针组和试剂盒，更具体地，本发明涉及高通量检测人循环肿瘤DNA基因变异的捕获探针的设计方法、捕获探针、捕获探针组和试剂盒。

背景技术

自2015年1月20日，美国总统奥巴马在国情咨文中提出“精准医学计划”后，一时间“精准医疗”成为覆盖全球的热门话题，并引得医药健康产业市场风起云涌。此后，中国也提出了自己的发展计划，将发展精准医疗写入“十三五生物产业发展规划”中。预计2030年前，我国将在精准医疗领域投入600亿元。以第二代测序技术、化学发光技术为代表的新兴诊断技术为精准医疗及相关产业带来了前所未有的发展机遇。

恶性肿瘤是危害人类健康的重大疾病种类之一，全球尚无十分有效的治疗和控制手段。我国每年约新增各类癌症病人300余万，入院病人600余万，死亡病人200余万。根据2017年国家癌症中心最新发布的统计数据显示，2013年我国肺癌、子宫癌、胃癌、结直肠癌、食管癌、卵巢癌、肝癌新发病人数分别73.3万、6.2万、42.7万、34.8万、27.7万、5万、36.2万。我国癌症新发人数正呈现逐年上升趋势，而且多数患者在发现时已是晚期。全身性化疗一直是癌症患者的主要治疗方式，缺乏特异性，副作用大。随着在肿瘤中一些重要基因变异的发现，针对这些基因变异的靶向药物被研制出来并已用于临床治疗。如克唑替尼是针对ALK基因变异的靶向治疗药物；吉非替尼、厄洛替尼、阿法替尼、埃克替尼针对EGFR基因19外显子缺失、18外显子G719X变异和21外显子L858R变异的靶向治疗药物；奥希替尼针对EGFR基因20外显子T790M变异的靶向治疗药物；吉非替尼针对EGFR基因20外显子S768I变异的靶向治疗药物。基因诊断与免疫治疗法逐渐被发现和证实为相对有效的治疗和控制癌症的医疗手段，并逐渐被广泛研究与应用。DNA测序(DNA sequencing)作为一种重要的基因突变检测技术，在生物学研究中有着广泛的应用。早在DNA双螺旋结构(Watson和Crick，1953)被发现后不久就有人报道过DNA测序技术，但是当时的操作流程复杂，没能形成规模。随后在1977年Sanger发明了具有里程碑意义的末端终止测序法，同年A.M.Maxam和W.Gilbert发明了化学降解法。然而随着科学的发展，传统的Sanger测序已经不能完全满足研究的需要，对模式生物进行基因组重测序以及对一些非模式生物的基因组测序，都需要费用更低、通量更高、速度更快的测序技术，第二代测序技术(Next-generation sequencing)应运而生。第二代测序技术作为新一种新兴技术相比于传统的PCR方法有灵敏度低、通量高、结果直观等优势，并被应用于多种领域，其中包括与人类疾病监测密切相关的体外诊断领域。由于第二代测序技术的广泛应用，体外诊断试剂正面临新老技术迭代，越来越多的基于第二代测序技术的体外诊断检测试剂盒被开发和应用。

在测序文库制备过程中，一种重要的方法是根据核酸分子碱基互补杂交原理设计与目标区域互补的探针序列，通过在杂交体系中加入捕获探针和文库DNA在合适的条件下进行靶向捕获，获取目标区域片段。靶向捕获技术所使用的探针其设计方式多为根据目标区域序列进行分段互补设计，长度约为120bp的单链线性探针。该种探针设计方法所设计的探针靶向捕获产物中非特异性捕获较多，导致目标区域占比降低，无法获得较高灵敏度，对于样本中变异比例极低的突变检测能力不足。此外，由于非特异性捕获的核酸片段较多，导致测序数据量显著升高，大幅增加了测序成本。

现有探针(或称常规探针)的设计缺陷有：1)捕获特异性不好。捕获产物中出现大量非特异性捕获片段，可根据测序结果下机数据的靶区域占比和非目标区域占比来评估，目标区域占比越高则捕获特异性越好，捕获产物中非特异性结合的其它区域片段越少；2)检测灵敏度低。由于大量非特异性捕获核酸片段的存在影响了目标区域片段的检出率，导致变异位点检测灵敏度低。

发明内容

本发明的目的是针对现有探针存在捕获特异性差、检测灵敏度低的缺陷，提供了能够对人循环肿瘤DNA基因变异进行高通量检测的捕获探针的设计方法、捕获探针、捕获探针组及试剂盒。

一方面，本发明提供了一种捕获探针的设计方法，包括：

(1)设计基础探针序列；

(2)在基础探针序列的5’游离区与3’游离区之间每间隔一定碱基数量***一定长度的人类基因组无关序列；

其中，在基础探针序列的5’游离区与3’游离区之间的第一个***序列与最后一个***序列互补，并且第一个***序列与最后一个***序列不与其它***序列互补。

另一方面，本发明提供了一种捕获探针，包括：5’游离区、3’游离区和位于5’游离区与3’游离区之间的区域；其中，位于5’游离区与3’游离区之间的区域包括多个依次交替排列的间隔区和***区，其中***区是人类基因组无关序列。

另一方面，本发明提供了一种高通量检测人循环肿瘤DNA基因变异的捕获探针组，包括本发明的捕获探针。

另一方面，本发明提供了一种高通量检测人循环肿瘤DNA基因变异的试剂盒，包括本发明的捕获探针组。

另一方面，本发明提供了捕获探针组在制备用于检测人循环肿瘤DNA基因变异的制剂中的应用。

本发明的技术方案具有如下有益效果：本发明的捕获探针具有茎环二级结构，从而使探针稳定性增强；本发明的捕获探针的捕获特异性强、检测灵敏度高。

附图说明

图1是本发明一种优选具体实施方式的捕获探针的一级结构示意图。

图2是本发明一种优选具体实施方式的捕获探针的二级结构示意图。

图3是本发明一种优选具体实施方式的捕获探针的捕获原理示意图。

具体实施方式

为了充分了解本发明的目的、特征及功效，通过下述具体实施方式，对本发明作详细说明。除非另有说明，否则本发明中涉及的技术术语均具有本领域技术人员通常理解的含义。

捕获探针的设计方法

针对现有探针存在捕获特异性差、检测灵敏度低的缺陷，本发明的发明人通过研究创造性的提出一种捕获探针的设计方法。因此，本发明的第一方面提供了一种捕获探针的设计方法，该方法包括：(1)设计基础探针序列；(2)在基础探针序列的5’游离区与3’游离区之间每间隔一定碱基数量***一定长度的人类基因组无关序列；其中，在基础探针序列的5’游离区与3’游离区之间的第一个***序列与最后一个***序列互补，并且第一个***序列与最后一个***序列不与其它***序列互补。

在本发明的设计方法中，基础探针序列根据常规探针设计方法获得，例如，根据目标区域序列设计与之互补的序列。

优选地，在步骤(2)中，在基础探针序列的5’游离区与3’游离区之间至少依次设置茎1区、间隔1区、***1区、间隔2区和茎2区；其中，茎1区、***1区和茎2区是***的人类基因组无关序列。

因此，在一种优选的具体实施方式中，本发明的捕获探针的设计方法包括：根据常规探针设计方法设计基础探针序列，然后在基础探针序列的基础上按照5’端至3’端的顺序依次设置5’游离区、茎1区、间隔1区、***1区、间隔2区、茎2区和3’游离区，具体如图1所示。

在该优选具体实施方式中，茎1区、***1区和茎2区是***的人类基因组无关序列，其中，茎1区和茎2区为互补序列，在二级结构中形成茎环二级结构，具体如图2所示。

在该优选具体实施方式中，5’游离区、间隔1区、间隔2区和3’游离区是与目标区域互补的序列。在本发明中，目标区域是指包含人基因组上的任何一个或多个变异的区域。

在该优选具体实施方式中，间隔1区的长度是1bp至299bp，优选是30bp；间隔2区的长度是1bp至299bp，优选是30bp。***1区的长度是1bp至300bp，优选是10bp。茎1区和茎2区的长度分别是10bp至800bp，采用这种长度有利于形成茎环二级结构，过长或过短会导致无法形成二级结构。通过本发明的设计方法得到的捕获探针的长度是50bp至1.5kb，优选是150bp。

进一步，还可以在捕获探针的5’端连接生物标记。生物标记可以是氨基酸、生物素、多肽标签、肝素、多糖或脂类；优选地，生物标记是生物素。

采用本发明的设计方法得到的捕获探针具有茎环结构的二级结构，如图2所示。在捕获探针的茎环二级结构中，茎结构由茎1区和茎2区互补配对成DNA双链构成，环结构至少由间隔1区、***1区和间隔2区的DNA单链构成。当捕获探针以茎环二级结构的形式存在时，其具有较弱的捕获作用，发挥作用的主要功能区域为5’游离区和3’游离区。

采用该捕获探针进行杂交捕获的原理如图3所示，捕获探针经过变性后二级结构打开，呈现线性化DNA，随后与变性后的目标核酸片段进行混合，在一定条件下进行退火杂交。可与捕获探针区域互补配对的核酸片段会优先结合而形成稳定杂交状态，经过磁分离，可将目标区域核酸捕获。不能与捕获探针互补配对或只能部分互补配对的序列则无法形成稳定形态。捕获探针多数区域被自身二级结构保护，降低非特异性结合，经过磁分离后非目标区域核酸被去除。

本发明的设计方法通过设计捕获探针的二级结构，使其在捕获杂交时那些未与目标区域片段匹配的多余探针呈现茎-环二级结构，避免茎环内部区域与其它目的片段非特异性结合，从而显著提高捕获产物中目标区域占比，提高检测灵敏度和特异性，降低测序数据量。

应当说明的是，根据待捕获的目标区域的情况，除***1区之外，在茎1区和茎2区之间还可以***其它的***区(人类基因组无关序列)，除间隔1区和间隔2区之外，茎1区和茎2区之间还可以包括其它的间隔区(与目标区域互补的序列)，***区与间隔区交替设置，这些都在本发明的保护范围之内。

捕获探针

本发明的第二方面提供了一种捕获探针，采用上述设计方法设计得到，该捕获探针包括：5’游离区、3’游离区和位于5’游离区与3’游离区之间的区域；其中，位于5’游离区与3’游离区之间的区域包括多个依次交替排列的间隔区和***区，其中***区是人类基因组无关序列。

优选地，位于5’游离区与3’游离区之间的区域至少依次包括茎1区、间隔1区、***1区、间隔2区和茎2区。

在一种优选的具体实施方式中，如图1所示，本发明的捕获探针依次包括5’游离区、茎1区、间隔1区、***1区、间隔2区、茎2区和3’游离区。其中，5’游离区、间隔1区、间隔2区和3’游离区是与目标区域互补的序列；茎1区、***1区和茎2区是与人类基因组不相关的序列；并且，茎1区与茎2区互补。

该捕获探针具有茎环结构的二级结构，如图2所示。在捕获探针的茎环二级结构中，茎结构由茎1区和茎2区互补配对成DNA双链构成，环结构至少由间隔1区、***1区和间隔2区的DNA单链构成。当捕获探针以茎环二级结构的形式存在时，其具有较弱的捕获作用，发挥作用的主要功能区域为5’游离区和3’游离区。当捕获探针经过变性后二级结构打开，呈现线性化DNA，随后与变性后的目标核酸片段进行混合，在一定条件下进行退火杂交。可与捕获探针区域互补配对的核酸片段会优先结合而形成稳定杂交状态，经过磁分离，可将目标区域核酸捕获。不能与捕获探针互补配对或只能部分互补配对的序列则无法形成稳定形态。捕获探针多数区域被自身二级结构保护，降低非特异性结合，经过磁分离后非目标区域核酸被去除。

优选地，该捕获探针的长度可以是50bp至1.5kb，其中，间隔1区的长度可以是1bp至299bp，间隔2区的长度可以是1bp至299bp，***1区的长度可以是1bp至300bp。更优选地，该捕获探针的长度可以是150bp，其中，间隔1区的长度可以是30bp，间隔2区的长度可以是30bp，***1区的长度可以是10bp。

在一种特别优选的具体实施方式中，本发明的捕获探针是序列表中SEQ ID NO:1至SEQ ID NO:68中的任意一条序列。其结构是由5’游离区、茎1区、间隔1区、***1区、间隔2区、茎2区和3’游离区构成，其中茎1区、***1区和茎2区是***的与人类基因组不相关的序列，具体地，茎1区对应序列中第31至40位碱基，***1区对应序列中第71至80位碱基，茎2区对应序列中第111至120位碱基。

优选地，捕获探针的5’端具有生物标记。生物标记可以是氨基酸、生物素、多肽标签、肝素、多糖或脂类；优选地，生物标记是生物素。

本发明的捕获探针按照本发明的设计方法进行设计之后，具体可以采用常规化学合成方法来合成。

捕获探针组

本发明的第三方面提供了一种捕获探针组，用于对人循环肿瘤DNA基因变异进行高通量检测。本发明的捕获探针组包括一条或多条本发明的捕获探针，以能够覆盖全部目标区域为准。

在一种优选的具体实施方式中，本发明的捕获探针组包括序列表中SEQ ID NO:1至SEQ ID NO:68中的任意一条序列或多条序列。优选地，序列的5’端具有生物标记。生物标记可以是氨基酸、生物素、多肽标签、肝素、多糖或脂类；优选地，生物标记是生物素。

在一种特别优选的具体实施方式中，本发明的捕获探针组包括序列表中SEQ IDNO:1至SEQ ID NO:68的全部序列，各序列按照相同的比例进行混合，并且每一序列的5’端具有生物素标记。采用此种捕获探针组，其所涉及的探针序列覆盖了人循环肿瘤DNA基因的全部目标区域，并且各探针序列之间存在重叠区，使得所有目标区域均被两条以上探针序列覆盖。

优选地，捕获探针组的工作浓度是0.1皮摩尔/升至25皮摩尔/升，更优选是1.5皮摩尔/升。

试剂盒

本发明的第四方面提供了一种试剂盒，用于对人循环肿瘤DNA基因变异进行高通量检测。该试剂盒包括本发明的捕获探针组，优选地，该试剂盒包括序列表中SEQ ID NO:1至SEQ ID NO:68按照相同的比例进行混合得到的捕获探针组，例如，序列表中SEQ ID NO:1至SEQ ID NO:68按照相同的比例进行混合之后以TE缓冲溶液稀释至工作浓度，放入试剂盒中即可。

进一步，本发明的试剂盒还包括末端修复酶混合物、末端修复反应缓冲液、DNA连接酶、连接反应缓冲液、含分子标签的接头、文库扩增引物、PCR预混液、接头封闭剂、DNA封闭剂、杂交缓冲液、杂交增强剂、磁珠洗液、杂交洗液、捕获文库PCR引物、阴性对照和阳性对照、核酸纯化磁珠和链霉亲合素磁珠中的任意一种或多种。优选地，本发明的试剂盒还包括末端修复酶混合物、末端修复反应缓冲液、DNA连接酶、连接反应缓冲液、含分子标签的接头、文库扩增引物、PCR预混液、接头封闭剂、DNA封闭剂、杂交缓冲液、杂交增强剂、磁珠洗液、杂交洗液、捕获文库PCR引物、阴性对照和阳性对照、核酸纯化磁珠和链霉亲合素磁珠。

本发明的试剂盒中各组分配置的量可以由本领域技术人员根据预定目的来确定，包括任意配置量的上述各组分的试剂盒均在本发明的保护范围内。

本发明的试剂盒还可包括使用说明书。“使用说明书”通常包括描述在使用试剂盒的组分来实现所需结果时采用的技术的明确表述。任选地，试剂盒还可含有其它适用组分，如稀释剂、缓冲剂、药学上可接受的载体或将易于由本领域技术人员认识到的其它适用附件。

实施例

下面通过实施例的方式进一步说明本发明，但并不因此将本发明限制在所述的实施例范围之中。下列实施例中未注明具体条件的实验方法，按照常规方法和条件，或按照商品说明书选择。

下述实施例中采用的临床样本是肺癌患者血浆样本。

下述实施例中涉及的基因变异检测是针对EGFR、KRAS、ALK基因变异进行的检测。下述实施例中采用的常规探针是根据目标区域序列设计的互补序列，长度为120bp，由Thermo Fisher Scientific Inc.公司合成，服务为生物素标记。具体地，下述实施例中采用的常规探针即SEQ ID NO:1至SEQ ID NO:68分别去除茎1区、***1区和茎2区后对应的序列。

实施例1：捕获探针组的获得

委托Thermo Fisher Scientific Inc.公司合成与纯化。根据捕获探针序列SEQID NO:1至SEQ ID NO:68，在全自动DNA合成仪上合成相应Oligo序列，经脱盐纯化***纯化后，真空冷冻制备成干燥的Oligo DNA。

实施例2：临床样本的核酸提取和文库构建

采用核酸提取试剂盒(天根生化(北京)科技有限公司生产，货号：DP710-01)分别对选定样本进行核酸提取。将样本平衡至室温，取样本200μL加入到1.5mL离心管中。分别加入组织裂解液200μL和蛋白酶20μL。加入4μL RNA酶A(100mg/mL)，震荡混匀，56℃孵育10min后的短暂离心。加入200μL无水乙醇，震荡混匀，短暂离心。将全部液体转移至离心柱1中，8000rpm离心1min，弃掉废液。加入500μL洗液1，8000rpm离心1min，弃掉废液。加入500μL洗液2，8000rpm离心1min，弃掉废液。将离心柱1转移至新的2mL收集管中，14000rpm离心2min，旋转180°后，14000rpm离心2min。将离心柱1转移至新的1.5mL离心管中，开盖晾干3min。加入100μL洗脱液1于滤膜中央，室温孵育5min，8000rpm离心2min，弃掉离心柱2，收集洗脱液1并做好标记。

向0.2mL PCR反应管加入30ng提取后的核酸，用Low EDTA TE补齐至50μL，震荡混匀，短暂离心。分别加入1μL末端修复酶混合物和6μL末端修复反应缓冲液，震荡混匀短暂离心后在37℃保温5min，随后在65℃保温30min，37℃保温5min，进行末端修复。反应结束后取出PCR反应管，将产物全部转移至新的1.5mL离心管中；在每个离心管中加入108μL核酸纯化磁珠，充分混匀后室温孵育5min。将离心管转移至磁力架上，室温静置2min后，小心吸弃上清。加入200μL 80％乙醇，室温静置30s后，小心吸弃上清，重复操作一次，确保无液体残留。将离心管保持在磁力架上，室温干燥5min。在每个离心管中分别加入30μL Low EDTA TE、18μL缓冲液、1μL修复酶G3、1μL修复酶G4，充分混匀后，于20℃孵育20min。取出离心管，分别加入50μL PEG NaCl，吹打混匀后室温孵育5min。将离心管转移至磁力架上，室温静置2min后，小心吸弃上清。加入200μL 80％乙醇，室温静置30s后，小心吸弃上清。重复操作一次，确保无液体残留。将离心管保持在磁力架上，室温干燥5min。向干燥后的离心管中分别单独加入5μL接头，并做好标记；分别加入20μL Low EDTA TE、3μL接头缓冲液、2μL连接酶，充分混匀并重悬磁珠后，25℃恒温孵育15min。加入49.5μL PEG NaCl，充分混匀后室温孵育5min。将离心管转移至磁力架上静置2min，小心吸弃上清。加入200μL 80％乙醇，室温静置30s后，小心吸弃上清，重复操作一次，确保无液体残留。将离心管保持在磁力架上，室温干燥5min。分别加入30μL Low EDTA TE、16μL缓冲液、3μL连接酶，充分混匀并重悬磁珠后，40℃恒温孵育10min。加入82.5μL PEG NaCl，充分混匀后室温孵育5min。将离心管转移至磁力架上静置2min，小心吸弃上清。加入200μL 80％乙醇，室温静置30s后，小心吸弃上清，重复操作一次，确保无液体残留，室温干燥5min(不可使磁珠过度干燥)。加入20μL Low EDTA TE，室温孵育3min。将离心管转移至磁力架上，静置2min，小心吸取上清至新的1.5mL离心管中。分别加入25μL PCR扩增酶混合物、5μL引物混合物进行PCR扩增。向反应完成的离心管中，加入1.65倍的PEG NaCl溶液，并吹打混合均匀，室温孵育。孵育完成后，将离心管置于磁力架上静置2-3min，待溶液澄清后，吸弃溶液，期间切忌接触磁珠。在离心管中加入新鲜的80％乙醇200μL，静置30s后，吸弃乙醇，切勿接触磁珠，重复操作一次。吸弃乙醇后，将磁珠晾干至表明呈磨砂状，切勿使磁珠过干，出现许多裂缝，磁珠晾干后，加入Low EDTA TE buffer 20μL，并室温孵育。孵育完成后，置于磁力架上，静置2-3min，待溶液澄清后，吸取溶液，转移至新的1.5mL LoBind离心管中，得到构建好的文库。

实施例3：文库捕获

采用本发明的试剂盒进行文库捕获，试剂盒中的捕获探针组是序列SEQ ID NO:1至SEQ ID NO:68按照相同的比例混合的混合物，工作浓度是1.5皮摩尔/升，具体方法如下：

将构建好的文库混合在一个样品池中进行杂交捕获，将文库按量混合于1.5mLLoBind离心管中成为一个样品池，样本用量不低于125ng，样品池总量不超过1μg。向样品池中加入2μL接头封闭剂和5μL DNA封闭剂，震荡混匀，短暂离心后冷冻真空抽干。加入8.5μL杂交缓冲液(2×)、2.7μL杂交增强剂和3.8μL PCR-级水，震荡混匀，短暂离心后，室温静置5min重溶。将重溶后的液体全部转移至新的0.2mL PCR反应管中，95℃保温10min。取出PCR反应管，短暂离心后向各PCR管中分别加入2μL捕获探针混合物和常规探针，震荡混匀3-5s，短暂离心后在68℃保温4h以上，热盖温度为78℃。取链霉亲合素磁珠洗涤后加入1倍体积磁珠洗液，振荡重悬后按每管100μL分装到不同的0.2mL PCR反应管中。将PCR反应管取出，短暂离心后将全部杂交产物转移至含有链霉亲和素磁珠的PCR反应管中，充分悬浮后于PCR仪上65℃孵育45min，期间每隔12min吸打混匀一次。孵育结束后，每管加入100μL65℃预热的1×洗液Ⅰ，将全部悬液转移至1.5mL LoBind离心管中，震荡混匀，短暂离心后转移至磁力架上静置20s，吸弃上清。加入200μL 65℃预热的1×杂交洗液，震荡混匀，短暂离心后65℃孵育5min，转移至磁力架上静置20s，吸弃上清，重复操作一次。再用磁珠洗液充分洗脱后加入18μL无核酸酶水，震荡重悬后全部转移至0.2mL PCR反应管中备用。向上述PCR反应管中分别加入25μL 2×PCR预混液和捕获文库PCR引物各2.5μL，充分混匀短暂离心后按下述程序进行PCR扩增：95℃3min；10个循环，每个循环为98℃20s，60℃30s，72℃30s；72℃1min；4℃保存备用。将PCR反应管短暂离心后，将产物全部转移至1.5mL离心管中。加入75μL核酸纯化磁珠，震荡混匀，室温静置10min后短暂离心，转移至磁力架上静置1min，吸弃上清。加入200μL80％乙醇，静置30s后，吸弃上清。重复洗涤一次，开盖晾干至无液滴残留。加入21.6μL无核酸酶水震荡重悬磁珠，室温静置5min，转移至磁力架上静置1min，取20μL上清至新的1.5mL LoBind离心管中备用。取2μL捕获文库进行定量(使用Qubit荧光定量仪)。取稀释后的文库进行上机测序(基因序列自动分析仪CN500)。

对结果进行分析：从测序仪上下载获得原始测序数据后，与参比数据库比对，进行变异分析和解读。临床样本突变位点信息详见表1所示，两种探针下机数据对比详见表2所示，检测结果对比详见表3所示。

表1临床样本突变位点及检测结果

表2常规探针与本发明探针下机数据对比分析

其中：

重复率：测序重复的数据量与测序得到的总数据量之比；

目标区占比：目标区域测序测得的数据量与测序得到的总数据量之比；

目标区边缘占比：目标区边缘区域测得的数据量与测序得到的总数据量之比；

非目标区占比：非目标区域测得的数据量与测序得到的总数据量之比。

表3本发明探针与常规探针检测结果对比分析

表2分析结果显示，本发明捕获探针组最终测到目标区域的数据量远高于常规探针，表明本发明捕获探针组对目标区域的捕获量高于常规探针，探针特异性好于常规探针；此外，本发明捕获探针组最终测到非目标区域的数据量远低于常规探针，表明本发明捕获探针组对非目标区域的核酸非特异性结合能力低于常规探针，也表明本发明捕获探针组通过独特的二级结构保护了探针裸露序列，降低与其它核酸片段结合的概率，从而体现了较好的特异性。表3分析结果显示，本发明捕获探针组可检测到变异核酸比例低至0.01％的变异(见4号样本检测结果)，而常规探针对于变异核酸比例低于1％的样本检测有一定困难，会出现漏检；表3数据表明本发明捕获探针组由于对目标区域捕获效率更高，可测得更多目标区域数据量，目标区域数据量内含有变异信息的数据更多，因此也能测到其中含量更低的变异，分析结果也更可靠，更准确。

上述实施例为本发明较佳的实施方式，但本发明的实施方式并不受上述实施例的限制，其它的任何未背离本发明的精神实质与原理下所作的替代、修饰、组合、改变、简化等，均应为等效的置换方式，都包含在本发明的保护范围之内。

序列表

<110> 上海思路迪生物医学科技有限公司

<120> 捕获探针的设计方法、捕获探针、捕获探针组和试剂盒

<160> 68

<170> SIPOSequenceListing 1.0

<210> 1

<211> 150

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 1

ctatgaaaca tagaagcagc taattctgac catccaccgg tacattgaag cgagacacac 60

acaatttgaa acttgctaga agaagcataa ccaagtatac aacaaacatg gtaggtggcc 120

cataaaaacc ttatgcaacc acatctccgc 150

<210> 2

<211> 150

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 2

cttgtattta tcactcattt ttatgatatt catccaccgg ttcttctttc gaaagaatag 60

gatgaaccca acttgctaga tgctcaaaac ctttctaaag cattttcaaa gtaggtggcc 120

atacgatctt tttcctccta cttcaaaata 150

<210> 3

<211> 150

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 3

ccttcccaca aaacaaaacg tgacatttcc catccaccgg ctcttccttt gtgaaccagc 60

cattgcctct acttgctaga cctctctcca ccctcttacc gatcccaacc gtaggtggcc 120

agagaaagtg agtgtgcgac cccatccacc 150

<210> 4

<211> 150

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 4

gcccaccctg gttcatgcta ttcttgcttt catccaccgg tcagaatcct atcctcgtaa 60

tgaccgatcc acttgctaga cacccccagt agccccttct aaccgcaagc gtaggtggcc 120

cctgttgctg gtagccgtaa ttgacattcc 150

<210> 5

<211> 150

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 5

cacaaccgaa gtgacgtagc ctgaacgaga catccaccgg gtacctcctt catattccca 60

gtcagcgaag acttgctaga accgctctag gagcagtgag gcccccccaa gtaggtggcc 120

gctctccagt tgcaacgtta cctccgacag 150

<210> 6

<211> 150

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 6

tacgactctc ctccagcccc accttacccc catccaccgg tgtcgtgtcc ctccttcttt 60

gctataccat acttgctaga tattcttttt cctccgtttc tctgtaaacc gtaggtggcc 120

accagccgta cgttccgttc cacagatccc 150

<210> 7

<211> 150

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 7

tccgcttgtt tctccatccg tccaccttgt catccaccgg gcaactccga accaccgttg 60

gactccagaa acttgctaga atgccatatt cacgtgtccc ccttccaccc gtaggtggcc 120

ccccccctct accgactcga acgagaatct 150

<210> 8

<211> 150

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 8

ctgcgatcgt ccgtttcttt gcagccttgc catccaccgg cgagagacct cctacccaga 60

cctcctcccc acttgctaga cgatcccgct gcgctcctcc tcccgttttg gtaggtggcc 120

cctgttgaga gaccaccaga ccaccaaccc 150

<210> 9

<211> 150

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 9

cctcaccgtc cttccgcctc acacccactt catccaccgg ctctttcctc ttccacaagt 60

ccaccatatt acttgctaga ctatccccaa agccctgttg attacatccg gtaggtggcc 120

cctcctgccg taccccaaat tattaaaact 150

<210> 10

<211> 150

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 10

gagaaaatgt tttacctccg tgcagtattc catccaccgg aatccctctc aaaatgatcc 60

caaagttccg acttgctaga cctgtcttca ccctgatgtt gccagcactg gtaggtggcc 120

agtcattatc ccctatctaa aagaagaagc 150

<210> 11

<211> 150

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 11

atcttaaaga agcatatgtg gctctccata catccaccgg ttttttgaaa agaaaaactg 60

cttagtaact acttgctaga agcagaagtg ttcctaaaag agtcatacac gtaggtggcc 120

acccccaccg cagttcttcc gtccgtccat 150

<210> 12

<211> 150

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 12

cccccctcca ctcctgacaa actccagaac catccaccgg ttcctccttg cttttgctcc 60

cctatcccat acttgctaga atatccaaga gaaaagattt cccatagcag gtaggtggcc 120

cactccaaag gacctccgca tccgacgaga 150

<210> 13

<211> 150

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 13

tttgtccgtt gtgagacaca ccgagagacc catccaccgg acacccctca ccgtcctgtg 60

gcctccaacc acttgctaga ccattctctt tcctcttcca ccgtgtgcac gtaggtggcc 120

tatatcttca ccccagtccc gttgttatca 150

<210> 14

<211> 150

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 14

ccattctctt tcctcttcca ccgtgtgcac catccaccgg tatatcttca ccccagtccc 60

gttgttatca acttgctaga tcacccgtcc gtccgtaccg gaatattata gtaggtggcc 120

aacattgtaa tcgagacaaa aaatagtgtc 150

<210> 15

<211> 150

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 15

aaatatatat ttccattatt gttcataaaa catccaccgg tctgttcatc gtcagtgctt 60

gcacttattc acttgctaga tatattccct tatgtcctca tttcgtcagt gtaggtggcc 120

tttctatcgt agtaatagtt gcaccacctg 150

<210> 16

<211> 150

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 16

tatattccct tatgtcctca tttcgtcagt catccaccgg tttctatcgt agtaatagtt 60

gcaccacctg acttgctaga agaaatagtt ttcacgtcct gcagttatca gtaggtggcc 120

tcacctctca aatagtaccc cagttgtccc 150

<210> 17

<211> 150

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 17

agaaatagtt ttcacgtcct gcagttatca catccaccgg tcacctctca aatagtaccc 60

cagttgtccc acttgctaga cgttcttcag gcgttagtgt ccagccagta gtaggtggcc 120

gtctattcac ccttcataaa agcgtcgtca 150

<210> 18

<211> 150

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 18

cgttcttcag gcgttagtgt ccagccagta catccaccgg gtctattcac ccttcataaa 60

agcgtcgtca acttgctaga ctatatataa atcacctaga agccaataga gtaggtggcc 120

gtaaaatata tatttcttcc agccccaccg 150

<210> 19

<211> 150

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 19

ctatatataa atcacctaga agccaataga catccaccgg gtaaaatata tatttcttcc 60

agccccaccg acttgctaga tgtcacagaa tcagtgtacc cctcgacatc gtaggtggcc 120

gtctaccccc cccttcatgt gccttagcgt 150

<210> 20

<211> 150

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 20

tcgcagtcca tatcgctcat gtccgctata catccaccgg tcacctgacc gcagcctcat 60

gccccttcta acttgctaga cttcagtcgt ctatacctgc tcgtgtatat gtaggtggcc 120

tttgtacagt aaaacagtct tagtacatag 150

<210> 21

<211> 150

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 21

cttcagtcgt ctatacctgc tcgtgtatat catccaccgg tttgtacagt aaaacagtct 60

tagtacatag acttgctaga cagcgtgttt cctacagtag tctacacaag gtaggtggcc 120

gcccaccgca gttctgtcct ccgtcctcac 150

<210> 22

<211> 150

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 22

cagcgtgttt cctacagtag tctacacaag catccaccgg gcccaccgca gttctgtcct 60

ccgtcctcac acttgctaga cccctcccat ccgtcaaaca tccagacatt gtaggtggcc 120

ccgtgtgtct ttgtcgtccg ttaccctata 150

<210> 23

<211> 149

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 23

cccctcccat ccgtcaaaca tccagacatt catccaccgg ccgtgtgtct ttgtcgtccg 60

ttaccctata acttgctaga tcaccgtaga cagttattcc ctcgtcagca gtaggtggcc 120

ctcccaccta ccgtccctag cccagagag 149

<210> 24

<211> 150

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 24

cccctttagt tatctctctt tttccctccc catccaccgg tcatacacaa cccgctcccg 60

gcttgagata acttgctaga tgagatcctt gtgcccacca gccaccactt gtaggtggcc 120

tacccgtcag cctacacgtg acctagtacc 150

<210> 25

<211> 150

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 25

tgagatcctt gtgcccacca gccaccactt catccaccgg tacccgtcag cctacacgtg 60

acctagtacc acttgctaga cgtcattcac taccttcgtt tttagcgtgt gtaggtggcc 120

atatatcctt cctagccctc ctcgtccccc 150

<210> 26

<211> 150

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 26

cgtcattcac taccttcgtt tttagcgtgt catccaccgg atatatcctt cctagccctc 60

ctcgtccccc acttgctaga tcaccattaa cgtgcgatca ccccaagcct gtaggtggcc 120

ccctttctta agtgatccgc ccgtgtccga 150

<210> 27

<211> 150

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 27

tcaccattaa cgtgcgatca ccccaagcct catccaccgg ccctttctta agtgatccgc 60

ccgtgtccga acttgctaga accgagagaa acacaacata cctcagtgag gtaggtggcc 120

taccctataa gctcagtccc gtcgtccaaa 150

<210> 28

<211> 150

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 28

accgagagaa acacaacata cctcagtgag catccaccgg taccctataa gctcagtccc 60

gtcgtccaaa acttgctaga gtgtagcagt gtgcacaata tcgtctctac gtaggtggcc 120

ctatcacctt cgtaatataa cctgagatcc 150

<210> 29

<211> 150

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 29

accggacgac aggccacctc gtcggcgtcc catccaccgg gcccgagtcc ccgcctcgcc 60

gccaacgcca acttgctaga caaccaccgc gcacggcccc ctgactccgt gtaggtggcc 120

ccagtattga tcgggagagc cggagcgagc 150

<210> 30

<211> 150

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 30

caaccaccgc gcacggcccc ctgactccgt catccaccgg ccagtattga tcgggagagc 60

cggagcgagc acttgctaga tcttcgggga gcagcgatgc gaccctccgg gtaggtggcc 120

gacggccggg gcagcgctcc tggcgctgct 150

<210> 31

<211> 150

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 31

agatcatcag aggaaatatg tactacgaaa catccaccgg attcctatgc cttagcagtc 60

ttatctaact acttgctaga atgatgcaaa taaaaccgga ctgaaggagc gtaggtggcc 120

tgcccatgag aaatttacag gaaatcctgc 150

<210> 32

<211> 150

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 32

atggcgccgt gcggttcagc aacaaccctg catccaccgg ccctgtgcaa cgtggagagc 60

atccagtggc acttgctaga gggacatagt cagcagtgac tttctcagca gtaggtggcc 120

acatgtcgat ggacttccag aaccacctgg 150

<210> 33

<211> 150

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 33

ctggaattga agtaaaatgg atagtgagcc catccaccgg tctgtgtatg tgaaggcccg 60

catctggaac acttgctaga atgaaagaac ctgtctgatg tgttctagtc gtaggtggcc 120

aggaaagcag gtagccaata ctatttatag 150

<210> 34

<211> 150

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 34

gggcgcagtt tcagaaaacc attgggctgc catccaccgg acctgcgtga gcacagctgc 60

aggagcaaaa acttgctaga gtcagaaagg tcagcaaagg atttcaggag gtaggtggcc 120

caaaggtcag aagaaaccct caaggtggtt 150

<210> 35

<211> 150

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 35

ttttggtaaa atgaaaccca ttgtctctgt catccaccgg tgattacttt gatgagtcaa 60

gaagtaacat acttgctaga cctgggaatg attggccagt ttaaatgagt gtaggtggcc 120

gcctcaggtt tttggaatac aagaaatcaa 150

<210> 36

<211> 150

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 36

agatagctct tggtctgtca tccacgcagc catccaccgg tgcctggtgc aagagccaag 60

tttgtgcagc acttgctaga ctgcagagca ctcttcctga gctgtgggct gtaggtggcc 120

gccaggtcgg ggggcagggg gggcctcact 150

<210> 37

<211> 150

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 37

tgatatagtc actttatgct gcaggggtgc catccaccgg ccctttataa agtgcttgta 60

caatggatgt acttgctaga ttgcttttga ttttggattt ggagtctaat gtaggtggcc 120

gaatgttcta aattattatt agaggagctt 150

<210> 38

<211> 150

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 38

aggattattg taaaaacgcc aagcacattg catccaccgg cctacacaaa ctaaatattc 60

agtcaatggc acttgctaga tgctattttc atgagttcgt tttaacatat gtaggtggcc 120

atttattgtc ctctactgga tttaagaagt 150

<210> 39

<211> 150

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 39

gcagctgcca aaagtgtgat ccaagctgtc catccaccgg ccaatgggag ctgctggggt 60

gcaggagagg acttgctaga agaactgcca gaaactgacc aaaatcatct gtaggtggcc 120

gtgcccagca gtgctccggg cgctgccgtg 150

<210> 40

<211> 150

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 40

caggaatggg tgagtctctg tgtggagaga catccaccgg gtgaagaaac tgctaccctt 60

aatacctgga acttgctaga ccttgaggga ttgttttatt ttagtttttc gtaggtggcc 120

tgcatttctc agtatttcat gtgatatctg 150

<210> 41

<211> 150

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 41

ccttgaggga ttgttttatt ttagtttttc catccaccgg tgcatttctc agtatttcat 60

gtgatatctg acttgctaga tctttttctt ccagtttgcc aaggcacgag gtaggtggcc 120

taacaagctc acgcagttgg gcacttttga 150

<210> 42

<211> 150

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 42

gccccgctct cagccccggg aaaggccact catccaccgg ggaaaccacc tcacatggta 60

gggccttgcg acttgctaga ggagccagta ataaccttat ctccgtcaac gtaggtggcc 120

atgttctgtc agattgaatg gggcagccag 150

<210> 43

<211> 150

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 43

agatcatttt ctcagcctcc agaggatgtt catccaccgg caataactgt gaggtggtcc 60

ttgggaattt acttgctaga ggaaattacc tatgtgcaga ggaattatga gtaggtggcc 120

tctttccttc ttaaaggttg gtgactttga 150

<210> 44

<211> 150

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 44

ggaaattacc tatgtgcaga ggaattatga catccaccgg tctttccttc ttaaaggttg 60

gtgactttga acttgctaga ttttcctaca caaataaaat tggagaaaat gtaggtggcc 120

ctaagtggag aaaggcctgg gcagaattcc 150

<210> 45

<211> 150

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 45

ttttcctaca caaataaaat tggagaaaat catccaccgg ctaagtggag aaaggcctgg 60

gcagaattcc acttgctaga acttgaagtg tgtttatttt tgctatggca gtaggtggcc 120

atgacaagtc ttacagagct acaaacgaga 150

<210> 46

<211> 150

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 46

agcactcgtg tgcattaggg ttcaactggg catccaccgg cgtcctaggg ctccctggac 60

ccattttaga acttgctaga ccttgagttc ttgagttcct caaaagagaa gtaggtggcc 120

atcacgcatt tatgttttct cttcttagac 150

<210> 47

<211> 150

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 47

aacagtctgc atggagcagg aaaaaaatta catccaccgg ggtaatgcta aaacaaatgc 60

taataattta acttgctaga gtgtaatgta caaaaattac cacttgtact gtaggtggcc 120

agtatgcctt aagaaaaaag tacaaattgt 150

<210> 48

<211> 150

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 48

gtgtaatgta caaaaattac cacttgtact catccaccgg agtatgcctt aagaaaaaag 60

tacaaattgt acttgctaga atttacataa ttacacactt tgtctttgac gtaggtggcc 120

ttctttttct tctttttacc atctttgctc 150

<210> 49

<211> 150

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 49

atttacataa ttacacactt tgtctttgac catccaccgg ttctttttct tctttttacc 60

atctttgctc acttgctaga atcttttctt tatgttttcg aatttctcga gtaggtggcc 120

actaatgtat agaaggcatc atcaacaccc 150

<210> 50

<211> 150

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 50

atcttttctt tatgttttcg aatttctcga catccaccgg actaatgtat agaaggcatc 60

atcaacaccc acttgctaga tgaaatacat aaaaagtatt aaaatgtgaa gtaggtggcc 120

tatatacgat ggcttcatgt gtacaggtaa 150

<210> 51

<211> 150

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 51

tgaaatacat aaaaagtatt aaaatgtgaa catccaccgg tatatacgat ggcttcatgt 60

gtacaggtaa acttgctaga caaatttcat taatggaaaa aatattaaga gtaggtggcc 120

aaggattctt tatgtttctc ttcaggcaac 150

<210> 52

<211> 150

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 52

ttttaatact tcaagttaga atactacacc catccaccgg taagtagttc taaagtggtt 60

gccaccttgt acttgctaga tacctttaaa agacatctgc tttctgccaa gtaggtggcc 120

aattaatgtg ctgaacttaa acttaccaga 150

<210> 53

<211> 150

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 53

tacctttaaa agacatctgc tttctgccaa catccaccgg aattaatgtg ctgaacttaa 60

acttaccaga acttgctaga ttacattata atgcattttt taattttcac gtaggtggcc 120

acagccagga gtcttttctt ctttgctgat 150

<210> 54

<211> 150

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 54

ttacattata atgcattttt taattttcac catccaccgg acagccagga gtcttttctt 60

ctttgctgat acttgctaga ttttttcaat ctgtattgtc ggatctccct gtaggtggcc 120

caccaatgta taaaaagcat cctccactct 150

<210> 55

<211> 150

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 55

ttttttcaat ctgtattgtc ggatctccct catccaccgg caccaatgta taaaaagcat 60

cctccactct acttgctaga ctgcattgta aaacacaact tctttaaagt gtaggtggcc 120

ctgttgcatt ggtaagagta atttactggg 150

<210> 56

<211> 150

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 56

ctgcattgta aaacacaact tctttaaagt catccaccgg ctgttgcatt ggtaagagta 60

atttactggg acttgctaga aaagccatgt gcaagaagtt tgagattatg gtaggtggcc 120

agcttgagat tttttttttt ttaaacagac 150

<210> 57

<211> 150

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 57

acaaaaacat ttactaaata ttgttttatt catccaccgg tcctagtata gcataattga 60

gagaaaaact acttgctaga gatatattaa atgacataac agttatgatt gtaggtggcc 120

ttgcagaaaa cagatctgta tttatttcag 150

<210> 58

<211> 150

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 58

gatatattaa atgacataac agttatgatt catccaccgg ttgcagaaaa cagatctgta 60

tttatttcag acttgctaga tgttacttac ctgtcttgtc tttgctgatg gtaggtggcc 120

tttcaataaa aggaattcca taacttcttg 150

<210> 59

<211> 150

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 59

tgttacttac ctgtcttgtc tttgctgatg catccaccgg tttcaataaa aggaattcca 60

taacttcttg acttgctaga ctaagtcctg agcctgtttt gtgtctactg gtaggtggcc 120

ttctagaagg caaatcacat ttatttccta 150

<210> 60

<211> 150

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 60

ctaagtcctg agcctgtttt gtgtctactg catccaccgg ttctagaagg caaatcacat 60

ttatttccta acttgctaga ctaggaccat aggtacatct tcagagtcct gtaggtggcc 120

taactctttt aatttgttct ctgggaaaga 150

<210> 61

<211> 150

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 61

ctaggaccat aggtacatct tcagagtcct catccaccgg taactctttt aatttgttct 60

ctgggaaaga acttgctaga aaaaaaagtt atagcacagt cattagtaac gtaggtggcc 120

acaaatatct ttcaaaacct gtccacaact 150

<210> 62

<211> 150

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 62

aaaaaaagtt atagcacagt cattagtaac catccaccgg acaaatatct ttcaaaacct 60

gtccacaact acttgctaga tttgtcataa aatttggctg aaagaaaaca gtaggtggcc 120

atgtaattcc tagtttccac tacaccaaat 150

<210> 63

<211> 150

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 63

tatgcatggc attagcaaag actcaaaaaa catccaccgg taaaaactat aattactcct 60

taatgtcagc acttgctaga ttattatatt caatttaaac ccacctataa gtaggtggcc 120

tggtgaatat cttcaaatga tttagtatta 150

<210> 64

<211> 150

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 64

gcttattata ttcaatttaa acccacctat catccaccgg aatggtgaat atcttcaaat 60

gatttagtat acttgctaga tatttatggc aaatacacaa agaaagccct gtaggtggcc 120

ccccagtcct catgtactgg tccctcattg 150

<210> 65

<211> 150

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 65

attatttatg gcaaatacac aaagaaagcc catccaccgg ctccccagtc ctcatgtact 60

ggtccctcat acttgctaga tgcactgtac tcctcttgac ctgctgtgtc gtaggtggcc 120

gagaatatcc aagagacagg tttctccatc 150

<210> 66

<211> 150

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 66

attgcactgt actcctcttg acctgctgtg catccaccgg tcgagaatat ccaagagaca 60

ggtttctcca acttgctaga tcaattacta cttgcttcct gtaggaatcc gtaggtggcc 120

tgagaaggga gaaacacagt ctggattatt 150

<210> 67

<211> 148

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 67

catcaattac tacttgcttc ctgtaggaat catccaccgg cctgagaagg gagaaacaca 60

gtctggatta acttgctaga ttacagtgca ccttttactt caaaaaaggt gtaggtggcc 120

gttatataca actcaacaac aaaaaatt 148

<210> 68

<211> 150

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 68

cagataactt aactttcagc ataattatct catccaccgg tgtaataagt actcatgaaa 60

atggtcagag acttgctaga aaacctttat ctgtatcaaa gaatggtcct gtaggtggcc 120

gcaccagtaa tatgcatatt aaaacaagat 150

Claims

1.一种捕获探针的设计方法，其特征在于，包括：

（1）设计基础探针序列；

（2）在基础探针序列的5’游离区与3’游离区之间每间隔一定碱基数量***一定长度的人类基因组无关序列；

其中，在基础探针序列的5’游离区与3’游离区之间的第一个***序列与最后一个***序列互补，并且第一个***序列与最后一个***序列不与其它***序列互补；

其中，在步骤（2）中，在基础探针序列的5’游离区与3’游离区之间至少依次设置茎1区、间隔1区、***1区、间隔2区和茎2区；其中，茎1区、***1区和茎2区是***的人类基因组无关序列；

其中，所述5’游离区、所述间隔1区、所述间隔2区和所述3’游离区是与目标区域互补的序列；

其中，所述茎1区与所述茎2区互补，在二级结构中形成茎环二级结构；

其中，所述捕获探针的长度是150bp，所述间隔1区的长度是30bp，所述间隔2区的长度是30bp，所述***1区的长度是10bp。

2.根据权利要求1所述的捕获探针的设计方法，其特征在于，在所述基础探针序列的5’端连接生物标记。

3.根据权利要求2所述的捕获探针的设计方法，其特征在于，所述生物标记是生物素、多肽标签、肝素、多糖或脂类。

4.根据权利要求3所述的捕获探针的设计方法，其特征在于，所述生物标记是生物素。

5.一种捕获探针，其特征在于，包括：5’游离区、3’游离区和位于5’游离区与3’游离区之间的区域；

其中，位于5’游离区与3’游离区之间的区域包括多个依次交替排列的间隔区和***区，其中***区是人类基因组无关序列；

其中，所述位于5’游离区与3’游离区之间的区域至少依次包括茎1区、间隔1区、***1区、间隔2区和茎2区；

其中，所述茎1区、所述***1区和所述茎2区是人类基因组无关序列；

其中，所述茎1区与所述茎2区互补；

其中，所述捕获探针具有茎环二级结构；

6.根据权利要求5所述的捕获探针，其特征在于，所述捕获探针是SEQ ID NO:1至SEQID NO:68中的任意一条序列。

7.根据权利要求5或6所述的捕获探针，其特征在于，所述捕获探针的5’端具有生物标记。

8.根据权利要求7所述的捕获探针，其特征在于，所述生物标记是生物素、多肽标签、肝素、多糖或脂类。

9.根据权利要求8所述的捕获探针，其特征在于，所述生物标记是生物素。

10.一种高通量检测人循环肿瘤DNA基因变异的捕获探针组，其特征在于，所述捕获探针组包括SEQ ID NO:1至SEQ ID NO:68中的任意一条序列或多条序列。

11.根据权利要求10所述的捕获探针组，其特征在于，所述捕获探针组包括SEQ ID NO:1至SEQ ID NO:68的全部序列。

12.根据权利要求11所述的捕获探针组，其特征在于，所述捕获探针组是SEQ ID NO:1至SEQ ID NO:68按照相同比例混合而成的。

13.根据权利要求11所述的捕获探针组，其特征在于，SEQ ID NO:1至SEQ ID NO:68中的任意一条序列或多条序列的5’端具有生物标记。

14.根据权利要求13所述的捕获探针组，其特征在于，SEQ ID NO:1至SEQ ID NO:68的每一条序列的5’端具有生物标记。

15.根据权利要求13所述的捕获探针组，其特征在于，所述生物标记是生物素、多肽标签、肝素、多糖或脂类。

16.根据权利要求15所述的捕获探针组，其特征在于，所述生物标记是生物素。

17.根据权利要求14所述的捕获探针组，其特征在于，所述生物标记是生物素、多肽标签、肝素、多糖或脂类。

18.根据权利要求17所述的捕获探针组，其特征在于，所述生物标记是生物素。

19.根据权利要求10至18任一项所述的捕获探针组，其特征在于，所述捕获探针组的工作浓度是0.1皮摩尔/升至25皮摩尔/升。

20.根据权利要求19所述的捕获探针组，其特征在于，所述捕获探针组的工作浓度是1.5皮摩尔/升。

21.一种高通量检测人循环肿瘤DNA基因变异的试剂盒，其特征在于，包括权利要求10至20任一项所述的捕获探针组。

22.根据权利要求21所述的试剂盒，其特征在于，所述试剂盒还包括：末端修复酶混合物、末端修复反应缓冲液、DNA连接酶、连接反应缓冲液、含分子标签的接头、文库扩增引物、PCR预混液、接头封闭剂、DNA封闭剂、杂交缓冲液、杂交增强剂、磁珠洗液、杂交洗液、捕获文库PCR引物、阴性对照和阳性对照、核酸纯化磁珠和链霉亲合素磁珠中的任意一种或多种。

23.根据权利要求22所述的试剂盒，其特征在于，所述试剂盒还包括：末端修复酶混合物、末端修复反应缓冲液、DNA连接酶、连接反应缓冲液、含分子标签的接头、文库扩增引物、PCR预混液、接头封闭剂、DNA封闭剂、杂交缓冲液、杂交增强剂、磁珠洗液、杂交洗液、捕获文库PCR引物、阴性对照和阳性对照、核酸纯化磁珠和链霉亲合素磁珠。