CN112176419B

CN112176419B - 一种检测ctDNA中肿瘤特异基因的变异和甲基化的方法

Info

Publication number: CN112176419B
Application number: CN201910983038.8A
Authority: CN
Inventors: 焦宇辰; 曲春枫; 王宇婷; 王沛; 陈坤; 宋欠欠; 刘慧�; 王京京; 王思振; 阎海
Original assignee: Genetron Health Beijing Co ltd; Cancer Hospital and Institute of CAMS and PUMC
Current assignee: Genetron Health Beijing Co ltd; Cancer Hospital and Institute of CAMS and PUMC
Priority date: 2019-10-16
Filing date: 2019-10-16
Publication date: 2022-03-22
Anticipated expiration: 2039-10-16
Also published as: CN112176419A; WO2021073490A1; US20230272475A1; KR20220088724A; JP2022551688A; EP4023795A1; EP4023795A4

Abstract

本发明公开了一种检测ctDNA中肿瘤特异基因的变异和甲基化的方法，该方法可以在一份样本中同时检测ctDNA中的肿瘤特异基因的变异(包括点突变、***缺失突变、HBV整合等多种突变形式)和/或甲基化的方法，不仅样本量需求低，而且该方法制备的MC文库可以支持10‑20次的后续检测，每次检测的结果都可以代表全部原始ctDNA标本的突变状况及酶切位点覆盖区域的甲基化修饰情况，且不会造成灵敏度和特异性的降低。本发明对肿瘤早期筛查、病情追踪、疗效评估、预后预测等具有重要的临床意义，有重大的应用价值。

Description

一种检测ctDNA中肿瘤特异基因的变异和甲基化的方法

技术领域

本发明属于生物医学领域，具体涉及一种检测ctDNA中肿瘤特异基因的变异和甲基化的方法。

背景技术

循环肿瘤DNA(circulating tumor DNA，ctDNA)来源于肿瘤细胞的凋亡、坏死或分泌产生的DNA片段，含有与肿瘤组织DNA相同的基因变异和表观修饰，如点突变、基因重排、融合、拷贝数变异、甲基化修饰等。ctDNA的检测可以应用于癌症早期筛查、诊断和分期、指导靶向用药、疗效评估、复发监测等各方面。结合ctDNA携带的肿瘤特异基因的变异和甲基化两方面信息，有助于提高检测的灵敏度和特异性，更早发现癌症踪迹，对于肿瘤早筛有重要意义。

现有的基因变异检测和甲基化检测需要遵循不同的技术路线。ctDNA基因变异的检测，由于受到ctDNA在cfDNA中占比较低的限制，实质上是低频突变的检测，现有技术分为两类：1)基于PCR的热点突变检测法，通常检测一个或几个热点突变或已知突变，无法检测基因融合等复杂突变，无法检测未知突变，覆盖范围较小；2)捕获测序法：适合多重靶标检测，包括复杂突变，但捕获试剂盒一般价格昂贵、操作复杂、耗时较长。在应用过程中，需要根据靶标的数量和特性，选取适合的检测方法。ctDNA甲基化标志物的优点在于成簇分布，与基因变异相比特异性更高，具有组织特异性，可以追溯肿瘤来源，标志物数量更多，可以达到更高的灵敏度；其检测方法包括：1)甲基化PCR，由于重亚硫酸盐转化步骤造成DNA损失及序列多样性降低，这种方法难以实现多重靶标检测；2)基于探针杂交的甲基化捕获：可覆盖8％-13％的CpG位点，同时检测大量标志物，但受到有限的ctDNA起始量的限制，并且经重亚硫酸盐处理后，基因组序列丰富度下降，探针特异性不易保证；3)基于MspI酶切的RRBS(Reduced representation bisulfite sequencing，RRBS)，它所覆盖的CpG位点由酶切位点“CCGG”决定，约占8％-10％的CpG位点，对甲基化C碱基的识别同样依赖于重亚硫酸盐转化。RRBS检测的甲基化位点集中在CpG岛和启动子区，成本较低。上述3种方法甲基化PCR覆盖位点有限；甲基化捕获可覆盖较多位点，相比RRBS数据更稳定；RRBS成本最低，也可以覆盖大量甲基化位点，在应用过程中需要根据靶标的数量和特性进行取舍。

目前没有简单、低成本和可靠的方案，实现同时检测ctDNA中的基因变异和甲基化这两种重要的肿瘤特异标志物。主要存在以下困难：1)一次抽血获得ctDNA标本量有限，通常仅够支持1-2次检测，这就造成ctDNA临床检测中通常是单平台、一次性的，难以在一份样本中同时实现突变检测和甲基化检测，尤其是依赖于重亚硫酸盐转化的甲基化检测技术，处理过程中会造成较多的DNA损失；2)甲基化检测技术的重亚硫酸盐转化步骤，将导致DNA序列无法呈现大部分突变信息，这部分DNA携带信息的损失可能会导致低频突变检测灵敏度的降低；3)临床检测中经常需要根据首次检测的结果判断后续检测的目标和方案，这就需要在后续检测中重新抽血，检测周期延长；另外，ctDNA相关临床检测或研究中经常需要比较多种技术的优劣，这就需要数倍于正常抽血量的标本，患者通常无法接受；4)无论是PCR法还是捕获法，扩增过程中产生的噪音突变会严重干扰ctDNA低频突变的检测，造成假阳性结果，误导患者的诊断和治疗；5)ctDNA突变含量低，操作过程中易发生污染，造成假阳性结果。

发明内容

本发明的目的是同时检测ctDNA中多种肿瘤特异基因的变异和/或甲基化。

本发明首先保护一种测序文库构建方法，可依次包括如下步骤：

(1)取DNA样本，用甲基化敏感限制性内切酶酶切；

(2)将步骤(1)酶切后的DNA样本依次进行末端修复和3’端加A处理；

(3)将步骤(2)处理后的DNA样本与接头混合物中的接头连接，经过PCR扩增后得到文库；

所述接头混合物由n个接头组成；

每个接头均由一条上游引物甲和一条下游引物甲形成部分双链结构得到；上游引物甲中具有测序接头甲、随机标签、锚定序列甲和位于末端(如3’末端)的碱基T；下游引物甲中具有锚定序列乙和测序接头乙；所述部分双链结构由锚定序列甲和锚定序列乙反向互补形成；

所述测序接头甲和测序接头乙为根据不同测序平台选择对应的测序接头；

所述随机标签为8-14bp(如8-10bp、10-14bp、8bp、10bp或14bp)的随机碱基；

所述锚定序列甲长度为12-20bp(如12-16bp、16-20bp、12bp、16bp或20bp)，连续重复碱基≤3个；

n个接头采用n个不同的锚定序列甲，且每个锚定序列甲中四种碱基平衡，错配碱基数>3；

n为≥8的任意自然数。

通常，建库用的接头由两条序列退火而成，呈“Y”型结构，两条序列间互补配对的部分(即锚定序列甲和锚定序列乙)称之为锚定序列。所述锚定序列可作为序列固定的内置标签，用于标记原始模板分子。

所述锚定序列不与引物其它部分相互作用(如形成发卡结构、二聚体等)。

所述上游引物甲自5’端依次可包括测序接头甲、随机标签、锚定序列甲和碱基T。

所述上游引物甲自5’端依次可由测序接头甲、随机标签、锚定序列甲和碱基T组成。

所述下游引物甲自5’端依次可包括锚定序列乙和测序接头乙。

所述下游引物甲自5’端依次可由锚定序列乙和测序接头乙组成。

所述“每个锚定序列甲中四种碱基平衡”即A、T、C和G均匀分布。

所述“错配碱基数>3”可为所述接头混合物包含n个锚定序列甲，各个锚定序列甲之间的碱基至少有3个不同。该不同可为位置不同或顺序不同。

所述DNA样本可为基因组DNA、cDNA、ct DNA或cf DNA样本。

所述n具体可为12。

所述随机标签具体可为8bp的随机碱基。

所述锚定序列甲长度具体可为12bp。

当n＝12时，所述锚定序列甲的核苷酸序列具体分别可为序列表的序列1自5’端第30-41位、序列表的序列3自5’端第30-41位、序列表的序列5自5’端第30-41位、序列表的序列7自5’端第30-41位、序列表的序列9自5’端第30-41位、序列表的序列11自5’端第30-41位、序列表的序列13自5’端第30-41位、序列表的序列15自5’端第30-41位、序列表的序列17自5’端第30-41位、序列表的序列19自5’端第30-41位、序列表的序列21自5’端第30-41位、序列表的序列23自5’端第30-41位所示。

所述测序接头甲具体可为来自Illumina公司的Truseq测序试剂盒的测序接头。所述测序接头甲具体可如序列表的序列1自5’端第1-29位所示。

所述测序接头乙具体可为来自Illumina公司的nextera测序试剂盒的测序接头。所述测序接头乙具体可如序列表的序列2自5’端第13-41位所示。

当n＝12时，所述12个接头如下：

接头1可由序列表的序列1所示的单链DNA分子和序列2所示的单链DNA分子形成部分双链结构得到；接头2可由序列表的序列3所示的单链DNA分子和序列4所示的单链DNA分子形成部分双链结构得到；接头3可由序列表的序列5所示的单链DNA分子和序列6所示的单链DNA分子形成部分双链结构得到；接头4可由序列表的序列7所示的单链DNA分子和序列8所示的单链DNA分子形成部分双链结构得到；接头5可由序列表的序列9所示的单链DNA分子和序列10所示的单链DNA分子形成部分双链结构得到；接头6可由序列表的序列11所示的单链DNA分子和序列12所示的单链DNA分子形成部分双链结构得到；接头7可由序列表的序列13所示的单链DNA分子和序列14所示的单链DNA分子形成部分双链结构得到；接头8可由序列表的序列15所示的单链DNA分子和序列16所示的单链DNA分子形成部分双链结构得到；接头9可由序列表的序列17所示的单链DNA分子和序列18所示的单链DNA分子形成部分双链结构得到；接头10可由序列表的序列19所示的单链DNA分子和序列20所示的单链DNA分子形成部分双链结构得到；接头11可由序列表的序列21所示的单链DNA分子和序列22所示的单链DNA分子形成部分双链结构得到；接头12可由序列表的序列23所示的单链DNA分子和序列24所示的单链DNA分子形成部分双链结构得到。

所述接头可以通过将上游引物甲和下游引物甲进行退火得到。

所述接头混合物中，每个接头可等摩尔混合。

所述方法还可包括对步骤(3)得到的文库进行扩增的步骤。所述扩增的引物是根据接头序列设计的，即所述扩增的引物至少要有一段序列与接头的某段序列完全一致。所述扩增采用的引物对具体可由序列表的序列25和序列26所示的两条单链DNA分子组成。

序列表的序列25所示的单链DNA分子即为测序接头甲自5’端第1至19位。

序列表的序列26所示的单链DNA分子即为测序接头乙自3’端第1至22位。

本发明还保护以上所述的方法构建得到的DNA文库。

本发明还保护一种用于构建测序文库的试剂盒，可包括上述任一所述的接头混合物和甲基化敏感限制性内切酶。

所述用于构建测序文库的试剂盒具体可由上述任一所述的接头混合物和甲基化敏感限制性内切酶组成。

本发明还保护一种用于检测DNA样本中肿瘤突变和/或甲基化的试剂盒，包括上述任一所述接头混合物和引物组合；所述引物组合包括引物组Ⅰ、引物组Ⅱ、引物组Ⅲ、引物组Ⅳ、引物组Ⅴ、引物组Ⅵ、引物组Ⅶ和引物组Ⅷ；

所述引物组Ⅰ和所述引物组Ⅱ中的各个引物是根据与肿瘤突变相关的区域设计的特异性引物，作用是定位于基因组特定位置，实现目标区域的PCR富集；所述引物组Ⅰ和所述引物组Ⅱ分别从正负两个方向检测突变位点；

所述引物组Ⅲ和所述引物组Ⅳ中的各个引物是根据肿瘤特异高甲基化区域设计的特异性引物，作用是定位于基因组特定位置，实现目标区域的PCR富集；所述引物组Ⅲ和所述引物组Ⅳ分别从正负两个方向检测甲基化位点；

所述引物组Ⅴ、所述引物组Ⅵ、所述引物组Ⅶ和所述引物组Ⅷ中的各个引物均包括接头序列和特异序列，特异序列用于目标区域进行进一步富集；

所述引物组Ⅴ和所述引物组Ⅰ中，针对同一突变位点设计的两个引物为“巢式”关系；

所述引物组Ⅵ和所述引物组Ⅱ中，针对同一突变位点设计的两个引物为“巢式”关系；

所述引物组Ⅶ和所述引物组Ⅲ中，针对同一甲基化位点设计的两个引物为“巢式”关系；

所述引物组Ⅷ和所述引物组Ⅳ中，针对同一甲基化位点设计的两个引物为“巢式”关系。

所述“根据与肿瘤突变相关的区域设计的特异性引物”具体可为根据肿瘤特异基因变异(如点突变、***缺失突变、HBV整合等多种突变形式)的区域，设计对应的基因特异引物。

所述“根据肿瘤特异高甲基化区域设计的特异性引物”具体可为根据肿瘤特异甲基化区域，设计对应的基因特异引物。

所述试剂盒中，所述肿瘤可为肝脏恶性肿瘤，即肝细胞癌。

所述与肝细胞癌突变相关的区域具体可为肝细胞癌高频突变基因(TP53、CTNNB1、AXIN1、TERT)的相关区域和针对HBV整合热点区域。

上述任一所述试剂盒中，所述引物组Ⅰ包括78个单链DNA分子，78个单链DNA分子的核苷酸序列依次如序列表的序列28至序列105所示。所述引物组Ⅱ包括82个单链DNA分子，82个单链DNA分子的核苷酸序列依次如序列表的序列106至序列187所示。所述引物组Ⅲ包括14个单链DNA分子，14个单链DNA分子的核苷酸序列依次如序列表的序列188至序列201所示。所述引物组Ⅳ包括15个单链DNA分子，15个单链DNA分子的核苷酸序列依次如序列表的序列202至序列216所示。所述引物组Ⅴ包括75个单链DNA分子，75个单链DNA分子依次包括如序列表的序列220至序列294自5’末端起第16位至3’末端所示的核苷酸序列。所述引物组Ⅵ包括79个单链DNA分子，79个单链DNA分子依次包括如序列表的序列295至序列373自5’末端起第16位至3’末端所示的核苷酸序列。所述引物组Ⅶ包括14个单链DNA分子，14个单链DNA分子依次包括如序列表的序列374至序列387自5’末端起第16位至3’末端所示的核苷酸序列。所述引物组Ⅷ包括15个单链DNA分子，15个单链DNA分子依次包括如序列表的序列388至序列402自5’末端起第16位至3’末端所示的核苷酸序列。

所述引物组Ⅴ中75个单链DNA分子的核苷酸序列依次可如序列表的序列220至序列294所示。所述引物组Ⅵ中79个单链DNA分子的核苷酸序列依次可如序列表的序列295至序列373所示。所述引物组Ⅶ中14个单链DNA分子的核苷酸序列依次可如序列表的序列374至序列387所示。所述引物组Ⅷ中15个单链DNA分子的核苷酸序列依次可如序列表的序列388至序列402所示。

所述引物组Ⅰ具体可由所述78个单链DNA分子组成。

所述引物组Ⅱ具体可由所述82个单链DNA分子组成。

所述引物组Ⅲ具体可由其所述14个单链DNA分子组成。

所述引物组Ⅳ具体可由其所述15个单链DNA分子组成。

所述引物组Ⅴ具体可由所述75个单链DNA分子组成。

所述引物组Ⅵ具体可由所述79个单链DNA分子组成。

所述引物组Ⅶ具体可由其所述14个单链DNA分子组成。

所述引物组Ⅷ具体可由其所述15个单链DNA分子组成。

上述任一所述试剂盒具体可由上述任一所述接头混合物和所述引物组合组成。

上述任一所述引物组合具体可由所述引物组Ⅰ、所述引物组Ⅱ、所述引物组Ⅲ、所述引物组Ⅳ、所述引物组Ⅴ、所述引物组Ⅵ、所述引物组Ⅶ和所述引物组Ⅷ组成。

上述任一所述试剂盒还可包括用于DNA提取的试剂、用于DNA建库的试剂、用于文库纯化的试剂、用于文库捕获的试剂等用于文库构建的材料。

本发明还保护上述任一所述引物组合。所述引物组合的用途可为检测DNA样本中肿瘤突变和/或甲基化。

本发明还保护S1)或S2)或S3)：

S1)上述任一所述的引物组合在制备用于检测DNA样本中肿瘤突变和/或甲基化的试剂盒中的应用；

S2)上述任一所述的引物组合在区分肿瘤患者血液样本和非肿瘤患者血液样本中的应用；

S3)上述任一所述试剂盒在区分肿瘤患者血液样本和非肿瘤患者血液样本中的应用。

上述应用中，所述肿瘤可为肝脏恶性肿瘤，即肝细胞癌。

本发明还保护一种检测DNA样本中目标突变和/或甲基化的方法，可包括如下步骤：

(1)按照上述任一所述的方法构建文库；

(2)对步骤(1)得到的文库进行两轮巢式PCR扩增，对产物进行测序，根据测序结果分析DNA样本中目标突变和/或甲基化发生情况；

所述步骤(2)中，采用引物组合甲进行第一轮PCR扩增；

引物组合甲由上游引物甲和下游引物组合甲组成；

所述上游引物甲为文库扩增引物，用于步骤(1)的文库扩增；

所述下游引物组合甲为根据X个目标靶点设计的Y条引物的组合；X和Y均为1以上的自然数，且X≤Y；

以第一轮PCR的产物为模板，采用引物组合乙进行第二轮PCR扩增；

引物组合乙由上游引物乙、下游引物组合乙和index引物组成；

所述上游引物乙为文库扩增引物且3’末端与所述上游引物甲部分相同，用于第一轮PCR的产物的扩增；

所述index引物自5’端包括用于测序的区段A、用于区分样本的index序列和用于测序的区段B；

所述下游引物组合乙中的引物具有所述区段B且与下游引物组合甲中检测相同目标靶点的引物形成巢式关系。

所述上游引物乙的核苷酸序列可如序列表的序列217所示。

所述index引物自5’端具体可由所述区段A、所述index序列和所述区段B组成。

所述区段A的核苷酸序列可如序列表的序列218所示。

所述区段B的核苷酸序列可如序列表的序列219所示。

所述上游引物甲的部分序列与“每个接头的上游引物甲的测序接头甲”的序列完全相同。

所述上游引物乙用于补全文库分子的接头序列，使得扩增产物可以直接进行测序。所述上游引物乙和所述上游引物甲(第一轮PCR扩增使用的引物)的部分核苷酸序列完全相同。

所述上游引物甲的核苷酸序列具体可如序列表的序列27所示。

所述上游引物乙的核苷酸序列具体可如序列表的序列188所示。

当所述目标突变为肝细胞癌突变时，所述下游引物组合甲由上述任一所述引物组Ⅰ和引物组Ⅱ组成。所述下游引物组合乙由上述任一所述引物组Ⅴ和引物组Ⅵ组成。使用引物组Ⅰ和引物组Ⅱ分别对模板进行第一轮PCR扩增。使用引物组Ⅰ进行扩增的产物作为第二轮扩增的模板采用引物组Ⅴ进行扩增。使用引物组Ⅱ进行扩增的产物作为第二轮扩增的模板采用引物组Ⅵ进行扩增。最后将扩增产物等体积混合。

当所述目标甲基化为肝细胞癌甲基化时，所述下游引物组合甲由上述任一所述引物组Ⅲ和引物组Ⅳ组成。所述下游引物组合乙由上述任一所述引物组Ⅶ和引物组Ⅷ组成。

使用引物组Ⅲ和引物组Ⅳ分别对模板进行第一轮PCR扩增。使用引物组Ⅲ进行扩增的产物作为第二轮扩增的模板采用引物组Ⅶ进行扩增。使用引物组Ⅳ进行扩增的产物作为第二轮扩增的模板采用引物组Ⅷ进行扩增。最后将扩增产物等体积混合。

上述方法中，所述DNA样本中目标突变的分析方法可为：将测序数据满足标准甲的DNA分子回溯到一个分子簇；将满足标准乙的分子簇标记为一对duplex分子簇；对某一突变来说，如果满足下述(a1)或(a2)，则该突变为来自原始DNA样本的真实突变：(a1)至少有一对duplex分子簇支持；(a2)至少有4个分子簇支持；标准甲即同时满足①、②和③；①DNA***片段长度相同；②DNA***片段两端断点序列相同；③随机标签序列相同；标准乙即同时满足④、⑤和⑥；④DNA***片段长度相同且除突变点外序列一致；⑤分子簇两端的锚定序列相同但位置相反；⑥同一个起始DNA双链。

上述方法中，所述DNA样本中甲基化的分析方法可为：将测序数据满足标准丙的DNA分子标记为一个簇，分别计算片段末端为关注酶切位点的簇的数量，记录为未甲基化的片段；计算扩增片段达到或超过第一个酶切位点的全部簇的数量，记录为片段总数；根据两种片段数量计算对应区域的平均甲基化水平；区域的甲基化水平＝(1-未甲基化片段数/片段总数)×100％；标准丙即同时满足⑦、⑧、⑨和⑩；⑦随机标签序列相同；⑧内置标签序列相同；⑨DNA***片段长度相同；⑩DNA***片段两端断点序列相同。

本发明还保护一种检测DNA样本中多种目标突变和/或甲基化的方法，可包括如下步骤：

(1)按照上述任一所述的方法构建文库；

(2)对步骤(1)的文库进行靶区域富集并进行测序，根据测序结果分析DNA样本中目标突变和/或甲基化的发生情况。

所述靶区域富集可采用现有商购的靶向捕获试剂盒(例如Agilent sureselectXT靶向捕获试剂盒，Agilent5190-8646)进行，将其中最后一步PCR扩增的引物对更换为由引物甲和引物乙组成的引物对。所述引物甲的核苷酸序列可如序列表的序列403所示。所述引物乙可包括区段甲、index序列和区段乙。所述引物乙具体可由所述区段甲、所述index序列和所述区段乙组成。所述区段甲的核苷酸序列可如序列表的序列404所示。所述区段乙的核苷酸序列可如序列表的序列405所示。

上述任一所述方法中，所述目标突变和/或甲基化可为肿瘤突变和/或甲基化。所述肿瘤可为肝脏恶性肿瘤，即肝细胞癌。

上文中，通常多个不同样本的文库会混合在一起测序，所述index序列用于标记不同的样本。测序完成后，根据不同的index序列对总的测序数据进行拆分。Index的设计原则与之前描述的锚定序列的设计原则基本相似。

上文中，DNA样本用甲基化敏感限制性内切酶酶切后，形成DNA片段(此时的DNA片段两端均形成粘末端，末端的单链部分的核苷酸序列即为断点序列)；DNA片段进行末端修复后与接头连接(5’末端和3’末端各连接一个接头，可能是相同接头也可能是相反接头)，对于此时的DNA分子来说，两个接头之间的DNA片段即为DNA***片段。

本发明提供了一种可以在一份样本中(不少于2mL的血浆)同时检测ctDNA中的肿瘤特异基因的变异(包括点突变、***缺失突变、HBV整合等多种突变形式)和/或甲基化的方法，不仅样本量需求低，而且该方法制备的MC文库可以支持10-20次的后续检测，每次检测的结果都可以代表全部原始ctDNA标本的突变状况及酶切位点覆盖区域的甲基化修饰情况，且不会造成灵敏度和特异性的降低。使用该方法构建的文库可以同时用于PCR的热点检测和捕获法测序，加入的DNA barcode可以有效滤除假阳性结果，实现基于duplex高特异性测序。同时，文库的构建方法不仅适用于cfDNA样本，也适用于基因组DNA或cDNA样本。本发明对肿瘤早期筛查、病情追踪、疗效评估、预后预测等具有重要的临床意义，有重大的应用价值。

附图说明

图1为adapter和引物架构示意图。

图2为RaceSeq靶区富集和文库构建示意图。

图3为MC文库进行捕获和进行duplex测序的示意图。

图4为Padlock方法和突变/甲基化共检法(即本发明提供的方法)对AK055957基因的甲基化水平检测结果。

图5为单独检测突变法和突变/甲基化共检法检测突变和突变频率的结果。

具体实施方式

以下的实施例便于更好地理解本发明，但并不限定本发明。

下述实施例中的实验方法，如无特殊说明，均为常规方法。

下述实施例中所用的试验材料，如无特殊说明，均为自常规生化试剂商店购买得到的。

以下实施例中的定量试验，均设置三次重复实验，结果取平均值。

下述实施例中的TE缓冲液为ThermoFisher公司的产品，产品目录号为12090015。

下述实施例中，肝细胞癌患者对本发明进行的内容均知情同意。

实施例1、MC文库的构建

一、甲基化敏感限制性内切酶酶切

取5-40ng cfDNA，按照表1所示配置反应体系，然后按照表2的程序在PCR仪进行酶切处理，得到酶切产物(4℃保存)。

Restriction Enzyme和Restriction Enzyme 10×Buffer均为ThermoFisher公司的产品。Restriction Enzyme和Restriction Enzyme 10×Buffer可以根据不同的待测靶标区域进行选择，选择标准为在待测区域内含有至少1个该甲基化敏感限制性内切酶的酶切位点。

表1.反应体系

成分	体积
		cfDNA	16.8μl
Restriction Enzyme 10×Buffer	2μl
		Acetylated BSA(浓度为10μg/μl)	0.2μl
Restriction Enzyme(浓度为10U/μl)	1μl
		总体积	20μl

表2.反应程序

温度	时间
		37℃	2h

二、酶切产物的纯化

取步骤一得到的酶切产物，采用Apostle MiniMax^TM高效游离DNA富集分离试剂盒(标准版)(Apostle公司的产品，产品目录号为A17622-50)进行纯化、富集，得到纯化产物。

三、纯化产物的平末端修复和加A处理

取步骤二得到的纯化产物，按照表3所示配置反应体系，然后按照表4的反应程序在PCR仪进行末端修复及3’末端加A处理，得到反应产物(4℃保存)。

表3.反应体系

成分	体积
		纯化产物	50μl
End Repair&A-Tailing Buffer(KAPA KK8505)	7μl
		End Repair&A-Tailing Enzyme Mix(KAPA KK8505)	3μl
总体积	60μl

表4.反应程序

四、反应产物与adapter连接

按照表5配置反应体系，20℃反应15min，得到连接产物(4℃保存)。

表5.反应体系

成分	体积
		步骤三得到的反应产物	60μl
Adapter Mix(50μM)	1.5μl
		DNase/RNase-Free Water	8.5μl
Ligation Buffer(KAPA KK8505)	30μl
		DNA Ligase(KAPA KK8505)	10μl
总体积	110μl

Adapter序列信息见表6。

分别将表6中的单链DNA分子用TE缓冲液溶解并稀释至浓度为100μM。将同一组中的两条单链DNA分子等体积混合(各50μl)，然后进行退火(退火程序：95℃，15min；25℃，2h)，得到12组DNA溶液，将12组DNA溶液等体积混合，得到Adapter Mix。

表6.Adapter序列信息

表6中，8个N表示8bp的随机标签。实际应用中，随机标签长度可为8-14bp。

下划线表示12bp的锚定序列，每一组的上游序列(名称中含有“F”的为上游序列)和下游序列(名称中含有“R”的为下游序列)中，下划线部分反向互补，通过退火可使上游序列和下游序列结合在一起形成接头。同时，锚定序列可作为序列固定的内置标签，用于标记原始模板分子。实际应用中，锚定序列长度可为12-20bp，连续重复碱基不超过3个，且不能与引物其它部分相互作用(如形成发卡结构、二聚体等)，12组每一个位置碱基平衡(即A、T、C和G均匀分布)，错配碱基数>3(即各个锚定序列之间的碱基至少有3个不同；不同可为位置不同或顺序不同)。

上游序列中末端加粗的T与原始分子末端加的“A”互补，进行TA连接。

上游序列中，自5’端第1至21位(来自Illumina公司的Truseq测序试剂盒)为测序引物结合序列，其中，自5’端第1至19位为文库扩增引物部分。

下游序列中，非下划线部分(来自Illumina公司的nextera测序试剂盒)为测序引物结合序列，其中，自3’端第1至22位为文库扩增引物的部分。

表6中共包含12组接头，可以形成12×12＝144种标记组合，结合分子本身的序列信息，足以区分原始样品中的所有分子，实际应用中也可适当增加(合成成本增高)或减少(区分效果略弱)组数。

连接产物结构如图1所示。其中，a为接头部分，b和f分别为文库扩增引物，c为8bp随机标签(表6中的8个N表示)，d为12bp锚定序列(表6中的下划线表示)，e为***片段(cfDNA)。

五、连接产物纯化

向步骤四得到的连接产物中加入110-220μl(即1-2倍体积)的AMPure XP磁珠(贝克曼A63880)，涡旋混匀，室温放置10min，磁力架吸附5min；待溶液澄清后弃上清，然后加入200μl 80％(体积百分含量)乙醇水溶液清洗2次，弃上清；待乙醇晾干后，加入30μl DNase/RNase-Free Water，涡旋混匀，室温放置10min，磁力架吸附5min，吸取上清溶液至PCR管内，作为PCR模板。

六、文库扩增及纯化

1、取步骤五得到的PCR模板，按照表7配置反应体系，按照表8进行PCR扩增，得到PCR扩增产物(4℃保存)。

表7.反应体系

成分	体积
		HIFI(KAPA KK8505)	35μl
MC_F(33μM)	2.5μl
		MC_R(33μM)	2.5μl
PCR模板	30μl
		总体积	70μl

表7中，引物信息如下：

MC_F(序列25)：5’-GACACGACGCTCTTCCGAT-3’；

MC_R(序列26)：5’-GTGGGCTCGGAGATGTGTATAA-3’。

表8.反应程序

2、向步骤1得到的PCR扩增产物中加入70-140μl(即1-2倍体积)的AMPure XP磁珠，涡旋混匀，室温放置10min，磁力架吸附5min；待溶液澄清后弃上清，然后加入200μl 80％(体积百分含量)乙醇水溶液清洗2次，弃上清；待乙醇晾干后，加入100μlDNase/RNase-FreeWater，涡旋混匀，室温放置10min，磁力架吸附5min，吸取上清溶液，得到产物(-20℃储存)。产物即为可长期保存、反复使用的MC文库。

经检测，MC文库可以支持10-20次的后续检测，每次检测的结果都可以代表全部原始样本的突变状况及酶切位点覆盖区域的甲基化修饰情况，不会造成灵敏度和特异性的降低。同时，文库的构建方法不仅适用于cfDNA样本，也适用于基因组DNA或cDNA样本。

实施例2、RaceSeq富集靶区并构建测序文库

如图2所示，使用针对我国肝细胞癌高频突变基因(TP53、CTNNB1、AXIN1、TERT)的相关区域、HBV整合热点区域和肝细胞癌特异高甲基化区域(EMX1、LRRC4、BDH1等)设计的引物，和固定引物配合，对MC文库进行两轮PCR扩增，扩增产物即为测序文库。

图2中，a为第一轮文库扩增上游引物，b为第二轮文库扩增上游引物，c为第一轮文库扩增下游引物库，用于特异目标序列富集，d为第二轮文库扩增下游引物库，用于特异目标序列富集，e为index primer，用于添加index序列。

1、取300ng实施例1制备的MC文库，分为两份，配置表9的反应体系(一份加入GSP1Amix，另一份加入GSP1B mix)，按照表11的反应程序进行第一轮PCR扩增，得到第一轮扩增产物(共得到两份第一轮扩增产物，一份为GSP1A mix的扩增产物，一份为GSP1B mix的扩增产物)。

表9.反应体系

表9中，引物信息如下：

上游引物1355(序列27)：5’-TCTTTCCCTACACGACGCTCTTCCGAT-3’。

GSP1A mix：将表10中属于引物池GSP1A中的各条引物用TE缓冲液溶解并稀释至浓度为100μM，然后等体积混合，用TE缓冲液稀释至0.3μM。引物池GSP1A中的引物用于扩增模板的正链。

GSP1B mix：将表10中属于引物池GSP1B中的各条引物用TE缓冲液溶解并稀释至浓度为100μM，然后等体积混合，用TE缓冲液稀释至0.3μM。引物池GSP1B中的引物用于扩增模板的负链。

引物池GSP1A和引物池GSP1B中，相同编号的引物(即引物编号的后四位相同)从正负两个方向检测同一突变位点，同时使用可最大限度的富集原始分子信息。

表10.引物信息

表11.反应程序

2、分别将步骤1得到的两份第一轮扩增产物用30-60μl(即1-2倍体积)的AMPureXP磁珠进行纯化，然后用25μlDNase/RNase-Free Water洗脱，得到第一轮纯化产物。

3、分别以步骤2得到的第一轮纯化产物为模板，配置表12的反应体系(采用GSP1Amix扩增产物作为模板时，采用GSP2A mix扩增；采用GSP1Bmix扩增产物作为模板时，采用GSP2B mix扩增)，按照表14的反应程序进行第二轮PCR扩增，得到第二轮扩增产物(4℃保存)。

表12.反应体系

成分	体积
		KapaHifi	15μl
上游引物3355	2μl
		GSP2Amix/GSP2Bmix	1μl
Index引物(10μM)	2μl
		模板(GSP1A mix/GSP1Bmix)	10μl
总体积	30μl

表12中，引物信息如下：

上游引物3355(序列217)：5’-AATGATACGGCGACCACCGAGATCTACACTCTTTCCCTACACG ACGCTCT-3’；下划线部分为第一轮的上游引物1355相同的部分，3355及1355均为Illumina测序平台测序的固定序列(也可更换为可在其他测序平台测序的序列)。

GSP2A mix：将表13中属于引物池GSP2A中的各条引物用TE缓冲液溶解并稀释至浓度为100μM，然后等体积混合，用TE缓冲液稀释至0.3μM。引物池GSP2A中的引物用于扩增模板的正链。

GSP2B mix：将表13中属于引物池GSP2B中的各条引物用TE缓冲液溶解并稀释至浓度为100μM，然后等体积混合，用TE缓冲液稀释至0.3μM。引物池GSP2B中的引物用于扩增模板的负链。

表13中，自5’端第1至15位为与Index引物结合的部分。

GSP2A mix与GSP1A mix中引物编号相同的引物(即引物编号的后四位相同)为针对同一突变位点设计，两条引物形成巢式关系。

GSP2B mix与GSP2A mix中引物编号相同的引物(即引物编号的后四位相同)为针对同一突变位点设计，两条引物形成巢式关系。

Index引物：5’-CAAGCAGAAGACGGCATACGAGAT(序列218)********GTGACTGGAGTTCCTTGGCACCCGAGAA-3’(序列219)；下划线部分为与GSP2 mix结合的部分。********为index序列位置，index的长度为6-8bp，作用是区分样本间的序列，方便多个样本混合测序。除index序列外，其余都是来自Illumina的small RNA测序试剂盒的固定序列。

表13.引物信息

注：NA表示无引物。

表14.反应程序

4、步骤3得到的采用GSP2A mix进行第二轮扩增的产物和采用GSP1B mix进行第二轮扩增的产物等体积混合，利用AMPure XP磁珠按1：(1-2)的比例进行纯化，然后用50μlDNase/RNase-Free Water洗脱，得到第二轮纯化产物，即为可以在Illumina Hiseq X平台测序的测序文库。

MC文库上的DNA随机标签与cfDNA序列一起被添加到测序文库的Read1序列下游。在测序中，依次获得DNA随机标签序列、锚定序列、cfDNA序列(图1中的c、d、e序列)。

肝细胞癌特异基因变异的分析方法为：将测序数据满足标准甲的DNA分子回溯到一个分子簇；将满足标准乙的分子簇标记为一对duplex分子簇；对某一突变来说，如果满足下述(a1)或(a2)，则该突变为来自原始DNA样本的真实突变：(a1)至少有一对duplex分子簇支持；(a2)至少有4个分子簇支持；标准甲即同时满足①、②和③；①DNA***片段长度相同；②DNA***片段两端断点序列相同；③随机标签序列相同；标准乙即同时满足④、⑤和⑥；④DNA***片段长度相同且除突变点外序列一致；⑤分子簇两端的锚定序列相同但位置相反；⑥同一个起始DNA双链。

肝细胞癌特异甲基化修饰程度的分析方法为：将测序数据满足标准丙的DNA分子标记为一个簇，分别计算片段末端为关注酶切位点的簇的数量，记录为未甲基化的片段；计算扩增片段达到或超过第一个酶切位点的全部簇的数量，记录为片段总数；根据两种片段数量计算对应区域的平均甲基化水平；区域的甲基化水平＝(1-未甲基化片段数/片段总数)×100％；标准丙即同时满足⑦、⑧、⑨和⑩；⑦随机标签序列相同；⑧内置标签序列相同；⑨DNA***片段长度相同；⑩DNA***片段两端断点序列相同。

实施例3、MC文库的捕获及测序

如图3所示，靶区域富集可基于现有商业化的靶向捕获试剂盒进行优化设计而捕获。例如：基于甲基化区域的捕获可参考Roche SeqCap Epi CpGiant Enrichment Kit(Roche07138881001)或Illumina Infinium Methylation EPIC BeadChipWG-317-1001)，甲基化区域靶向捕获的设计需要根据酶切位点覆盖程度进行筛选，并调整探针中基于重亚硫酸盐处理所转换的碱基。基于基因变异区域的捕获可参考Agilent sureselect XT靶向捕获试剂盒(Agilent5190-8646)，仅将最后一步PCR扩增的引物更换为如下引物：

上游引物为：5’-AATGATACGGCGACCACCGAGATCTACACTCTTTCCCTACACGACGCTCTTCCG ATCT-3’(序列403)(图3中的“a”)，下划线部分与引物MC_F部分相同)，作用为扩增文库，其余部分为illumina测序平台测序所需的固定序列。

下游引物为：5’-CAAGCAGAAGACGGCATACGAGAT(序列404)********GTCTCGTGGGCTCGGAGATGTGTATAA-3’(序列405)(图3中的“b”)，下划线部分为与引物MC_R相同，作用为扩增文库。********为index序列位置，index长度为6-8bp，作用是区分样本间的序列，方便多个样本混合测序。其余部分为illumina测序平台测序所需的固定序列。

捕获后的文库与MC文库具有相同的DNA随机标签序列、锚定序列和cfDNA序列，依次位于Read1下游。

将测序数据满足标准甲的DNA分子回溯到一个分子簇；标准甲即同时满足①、②和③；①DNA***片段长度相同；②DNA***片段两端断点序列相同；③随机标签序列相同。将满足标准乙的分子簇标记为一对duplex分子簇；标准乙即同时满足④、⑤和⑥；④DNA***片段长度相同且除突变点外序列一致；⑤分子簇两端的锚定序列相同但位置相反；⑥同一个起始DNA双链。对某一突变来说，如果满足下述(a1)或(a2)，则该突变为来自原始DNA样本的真实突变：(a1)至少有一对duplex分子簇支持；(a2)至少有4个分子簇支持。在一对duplex分子簇共同支持的突变可靠性更高，可减少90％的假阳性突变。

将测序数据满足标准丙的DNA分子标记为一个簇，分别计算片段末端为关注酶切位点的簇的数量，记录为未甲基化的片段；计算扩增片段达到或超过第一个酶切位点的全部簇的数量，记录为片段总数；根据两种片段数量计算对应区域的平均甲基化水平；区域的甲基化水平＝(1-未甲基化片段数/片段总数)×100％；标准丙即同时满足⑦、⑧、⑨和⑩；⑦随机标签序列相同；⑧内置标签序列相同；⑨DNA***片段长度相同；⑩DNA***片段两端断点序列相同。

实施例4、检测方法的对比

一、检测方法的对比一

1、收集21例肝细胞癌患者的cfDNA标本。

2、完成步骤1后，取各个cfDNA标本，按照实施例1中的方法构建MC文库，然后按照实施例2中的方法进行RaceSeq靶区富集，测序，得到AK055957基因的甲基化水平。

3、完成步骤1后，取各个cfDNA标本，采用Padlock方法(Xu R H,Wei W,KrawczykM,et al.Circulating tumour DNA methylation markers for diagnosis andprognosis of hepatocellular carcinoma[J].Nature Materials,2017,16(11):1155.)检测AK055957基因的甲基化水平。Padlock是一种甲基化靶向测序技术，Padlock探针构象与挂锁类似，可应用于高通量甲基化靶向测序，属于高效的亚硫酸氢盐转化后建库方法，被称为“BSPP”。cfDNA经亚硫酸氢盐转化后，与亚硫酸盐锁式探针(BSPP)的捕获臂互补配对时可以扩增并连接成环形，用核酸外切酶可以筛选出连接成环装的锁式探针，对扩增产物进行测序得到相应的DNA甲基化信息。

检测结果见图4。结果表明，Padlock方法和突变/甲基化共检法(即本发明提供的方法)对AK055957基因(属于肝细胞癌特异基因)的甲基化水平检测结果基本一致。

二、检测方法的对比二

1、采用突变/甲基化共检法检测突变和突变频率

(1)收集某肝细胞癌患者的cfDNA。

(2)完成步骤(1)后，取5-40ngcfDNA，按照表1所示配置反应体系，然后在PCR仪进行酶切处理，得到酶切产物(4℃保存)。其中酶切处理的时间为0h、0.2h、0.4h、0.6h、0.8h或1h。

(3)完成步骤(2)后，取所述酶切产物，按照实施例1中二至六的方法构建MC文库，然后按照实施例2中的方法进行RaceSeq靶区富集，测序。在数据分析时，将随机标签序列相同、DNA***片段长度相同、DNA***片段两端断点均相同的DNA分子测序数据回溯到一个分子簇，如果簇内分子数>5个并且簇内分子突变一致率>80％并且簇个数≥5，则该突变为来自原始DNA样本的真实突变。含该分子突变的簇的比例即为突变频率。

2、采用单独检测突变法检测突变和突变频率

(1)收集某肝细胞癌患者的cfDNA。

(2)完成步骤(1)后，取5-40ng cfDNA，按照表3所示配置反应体系，然后按照表4的反应程序在PCR仪进行末端修复及3’末端加A处理，得到反应产物(4℃保存)。

(3)完成步骤(2)后，取所述反应产物，按照实施例1中四至六的方法构建MC文库，然后按照实施例2中的方法进行RaceSeq靶区富集，测序。在数据分析时，将随机标签序列相同、DNA***片段长度相同、DNA***片段两端断点均相同的DNA分子测序数据回溯到一个分子簇，如果簇内分子数>5个并且簇内分子突变一致率>80％并且簇个数≥5，则该突变为来自原始DNA样本的真实突变。含该分子突变的簇的比例即为突变频率。

3、将各突变位点根据突变/甲基化共检法得到的突变频率作为横坐标，单独检测突变法得到的突变频率作为纵坐标，绘制散点图，添加线性拟合曲线及相关系数R²。

结果见图5。结果表明，突变/甲基化共检法和单独检测突变法对于突变和突变频率的检测结果基本一致，即甲基化检测并未影响对突变的检出。

实施例5、准确性实验

突变标准品为Horizon Discovery公司的产品，产品目录号为HD701。

一、准确性实验一

1、取突变标准品，按照实施例1中一至六的方法构建MC文库，然后按照实施例2中的方法(仅将步骤3中的GSP2A mix替换为GSP2A mix-1，GSP2B mix替换为GSP2B mix-1)进行RaceSeq靶区富集，测序。

GSP2A mix-1：将表15中属于引物池GSP2A中的各条引物用TE缓冲液溶解并稀释至浓度为100μM，然后等体积混合，用TE缓冲液稀释至0.3μM。引物池GSP2A中的引物用于扩增模板的正链。

GSP2B mix-1：将表15中属于引物池GSP2B中的各条引物用TE缓冲液溶解并稀释至浓度为100μM，然后等体积混合，用TE缓冲液稀释至0.3μM。引物池GSP2B中的引物用于扩增模板的负链。

表15

2、根据测序结果，得到突变位点的突变频率。

检测结果见表16。结果表明，采用突变/甲基化共检法检测突变标准品，得到的突变位点的突变频率与理论值基本接近。由此可见，突变/甲基化共检法对肝细胞癌特异基因(如CTNNB1基因、TP53基因、AXIN1基因)的变异检测具有较高的准确性。

表16.准确性实验

注：geneID代表基因在Ensemble数据库中编号，Ref为正常类型，Alt为基因变异后类型，INS代表***，DEL代表缺失，SNP代表单碱基突变。

二、准确性实验二

人甲基化和非甲基化标准品为Zymo Research公司的产品，产品目录号为D5014。

1、将人甲基化和非甲基化标准品中的甲基化标准品和非甲基化标准品按照不同比例进行混合，得到待测样本。待测样本中，甲基化标准品的比例为0％、20％或100％，即肿瘤特异基因(BDH1基因、EMX1基因、LRRC4基因、CLEC11A基因、HOXA1基因、AK055957基因、COTL1基因、ACP1基因或DAB2IP基因)甲基化的比例为0％、20％或100％。

2、取待测样本，按照实施例1中的方法构建MC文库，然后按照实施例2中的方法进行RaceSeq靶区富集，测序，得到甲基化位点的检测值。

检测结果见表17和表18(样本类型的后四位为肿瘤特异基因的名称)。采用突变/甲基化共检法检测甲基化标准品，检测值与理论值基本接近。由此可见，突变/甲基化共检法对肿瘤特异基因(如BDH1基因、EMX1基因、LRRC4基因、CLEC11A基因、HOXA1基因、AK055957基因、COTL1基因、ACP1基因、DAB2IP基因)的甲基化水平检测具有较高的准确性。

表17.甲基化标准品准确度检测结果(正链)

样本类型	0％甲基化标准品	20％甲基化标准品	100％甲基化标准品
				CA2001_BDH1	2％	18％	97％
CA2002_EMX1	3％	19％	96％
				CA2003_LRRC4	2％	9％	100％
CA2004_LRRC4	3％	32％	97％
				CA2006_CLEC11A	2％	20％	97％
CA2007_CLEC11A	2％	25％	99％
				CA2008_HOXA1	3％	20％	99％
CA2009_HOXA1	3％	23％	99％
				CA2010_EMX1	3％	32％	99％
CA2011_AK055957	3％	23％	99％
				CA2012_COTL1	3％	18％	98％
CA2013_ACP1	4％	27％	98％
				CA2014_DAB2IP	2％	21％	98％

表18.甲基化标准品准确度检测结果(负链)

样本类型	0％甲基化标准品	20％甲基化标准品	100％甲基化标准品
				CB2001_BDH1	3％	21％	96％
CB2002_LRRC4	3％	17％	98％
				CB2004_LRRC4	2％	9％	96％
CB2005_DAB2IP	2％	3％	99％
				CB2007_CLEC11A	4％	50％	94％
CB2008_CLEC11A	3％	18％	97％
				CB2009_HOXA1	2％	20％	98％
CB2011_EMX1	3％	23％	99％
				CB2012_AK055957	4％	19％	100％
CB2013_RASSF2	7％	60％	94％
				CB2015_DAB2IP	3％	23％	99％

实施例6、突变/甲基化共检法在肝细胞癌患者cfDNA中的应用

1、收集1例正常人、1例肝硬化患者和3例肝细胞癌患者的血液样本，提取cfDNA。

2、取540ng cfDNA，按照实施例1进行MC文库构建，按照实施例2中的方法进行RaceSeq靶区富集，测序。

3、甲基化检测结果见表19和表20。

结果显示肝细胞癌特异高甲基化的基因，在所检测的肝细胞癌样本中的甲基化水平高于非肝细胞癌样本中的甲基化水平。突变/甲基化共检法可以应用于肝细胞癌cfDNA样本的检测。

表19.cfDNA样本靶标区域甲基化水平检测结果(正链)

样本类型	正常	肝硬化	肝细胞癌1	肝细胞癌2	肝细胞癌3
						CA2001_BDH1	3％	3％	28％	25％	47％
CA2002_EMX1	4％	6％	11％	26％	4％
						CA2003_LRRC4	3％	5％	16％	28％	28％
CA2004_LRRC4	3％	6％	29％	46％	48％
						CA2006_CLEC11A	3％	4％	11％	20％	2％
CA2007_CLEC11A	3％	5％	22％	25％	10％
						CA2008_HOXA1	4％	4％	24％	33％	5％
CA2009_HOXA1	8％	7％	10％	11％	11％
						CA2010_EMX1	7％	9％	21％	47％	8％
CA2011_AK055957	5％	9％	40％	43％	45％
						CA2012_COTL1	5％	9％	17％	19％	5％
CA2013_ACP1	1％	3％	5％	5％	14％
						CA2014_DAB2IP	5％	7％	19％	27％	50％

表20.cfDNA样本靶标区域甲基化水平检测结果(负链)

样本类型	正常	肝硬化	肝细胞癌1	肝细胞癌2	肝细胞癌3
						CB2001_BDH1	5％	5％	24％	23％	56％
CB2002_LRRC4	4％	13％	40％	47％	50％
						CB2004_LRRC4	1％	4％	11％	17％	28％
CB2005_DAB2IP	4％	5％	10％	16％	27％
						CB2007_CLEC11A	11％	8％	17％	38％	6％
CB2008_CLEC11A	2％	5％	22％	23％	7％
						CB2009_HOXA1	4％	2％	10％	21％	3％
CB2011_EMX1	12％	11％	20％	39％	7％
						CB2012_AK055957	3％	9％	39％	38％	43％
CB2013_RASSF2	5％	1％	4％	18％	4％
						CB2015_DAB2IP	9％	6％	18％	31％	57％

<110> 中国医学科学院肿瘤医院北京泛生子基因科技有限公司

<120> 一种检测ctDNA中肿瘤特异基因的变异和甲基化的方法

<160> 405

<170> PatentIn version 3.5

<210> 1

<211> 42

<212> DNA

<213> Artificial sequence

<220>

<221> misc_feature

<222> (22)..(29)

<223> n is a, c, g, or t

<400> 1

gacacgacgc tcttccgatc tnnnnnnnnc cactagtagc ct 42

<210> 2

<211> 41

<212> DNA

<213> Artificial sequence

<400> 2

ggctactagt ggctgtctct tatacacatc tccgagccca c 41

<210> 3

<211> 42

<212> DNA

<213> Artificial sequence

<220>

<221> misc_feature

<222> (22)..(29)

<223> n is a, c, g, or t

<400> 3

gacacgacgc tcttccgatc tnnnnnnnng gactgtgtcg gt 42

<210> 4

<211> 41

<212> DNA

<213> Artificial sequence

<400> 4

ccgacacagt ccctgtctct tatacacatc tccgagccca c 41

<210> 5

<211> 42

<212> DNA

<213> Artificial sequence

<220>

<221> misc_feature

<222> (22)..(29)

<223> n is a, c, g, or t

<400> 5

gacacgacgc tcttccgatc tnnnnnnnng gtactgacag gt 42

<210> 6

<211> 41

<212> DNA

<213> Artificial sequence

<400> 6

cctgtcagta ccctgtctct tatacacatc tccgagccca c 41

<210> 7

<211> 42

<212> DNA

<213> Artificial sequence

<220>

<221> misc_feature

<222> (22)..(29)

<223> n is a, c, g, or t

<400> 7

gacacgacgc tcttccgatc tnnnnnnnnc ctagtacagc ct 42

<210> 8

<211> 41

<212> DNA

<213> Artificial sequence

<400> 8

ggctgtacta ggctgtctct tatacacatc tccgagccca c 41

<210> 9

<211> 42

<212> DNA

<213> Artificial sequence

<220>

<221> misc_feature

<222> (22)..(29)

<223> n is a, c, g, or t

<400> 9

gacacgacgc tcttccgatc tnnnnnnnng gtagtcagag gt 42

<210> 10

<211> 41

<212> DNA

<213> Artificial sequence

<400> 10

cctctgacta ccctgtctct tatacacatc tccgagccca c 41

<210> 11

<211> 42

<212> DNA

<213> Artificial sequence

<220>

<221> misc_feature

<222> (22)..(29)

<223> n is a, c, g, or t

<400> 11

gacacgacgc tcttccgatc tnnnnnnnnt tctcacgtgt tt 42

<210> 12

<211> 41

<212> DNA

<213> Artificial sequence

<400> 12

aacacgtgag aactgtctct tatacacatc tccgagccca c 41

<210> 13

<211> 42

<212> DNA

<213> Artificial sequence

<220>

<221> misc_feature

<222> (22)..(29)

<223> n is a, c, g, or t

<400> 13

gacacgacgc tcttccgatc tnnnnnnnna actccacgta at 42

<210> 14

<211> 41

<212> DNA

<213> Artificial sequence

<400> 14

ttacgtggag ttctgtctct tatacacatc tccgagccca c 41

<210> 15

<211> 42

<212> DNA

<213> Artificial sequence

<220>

<221> misc_feature

<222> (22)..(29)

<223> n is a, c, g, or t

<400> 15

gacacgacgc tcttccgatc tnnnnnnnnt tctcgagaat tt 42

<210> 16

<211> 41

<212> DNA

<213> Artificial sequence

<400> 16

aattctcgag aactgtctct tatacacatc tccgagccca c 41

<210> 17

<211> 42

<212> DNA

<213> Artificial sequence

<220>

<221> misc_feature

<222> (22)..(29)

<223> n is a, c, g, or t

<400> 17

gacacgacgc tcttccgatc tnnnnnnnna aactcttcca at 42

<210> 18

<211> 41

<212> DNA

<213> Artificial sequence

<400> 18

ttggaagagt ttctgtctct tatacacatc tccgagccca c 41

<210> 19

<211> 42

<212> DNA

<213> Artificial sequence

<220>

<221> misc_feature

<222> (22)..(29)

<223> n is a, c, g, or t

<400> 19

gacacgacgc tcttccgatc tnnnnnnnnt tggaacgtct tt 42

<210> 20

<211> 41

<212> DNA

<213> Artificial sequence

<400> 20

aagacgttcc aactgtctct tatacacatc tccgagccca c 41

<210> 21

<211> 42

<212> DNA

<213> Artificial sequence

<220>

<221> misc_feature

<222> (22)..(29)

<223> n is a, c, g, or t

<400> 21

gacacgacgc tcttccgatc tnnnnnnnnc cggactcctc ct 42

<210> 22

<211> 41

<212> DNA

<213> Artificial sequence

<400> 22

ggaggagtcc ggctgtctct tatacacatc tccgagccca c 41

<210> 23

<211> 42

<212> DNA

<213> Artificial sequence

<220>

<221> misc_feature

<222> (22)..(29)

<223> n is a, c, g, or t

<400> 23

gacacgacgc tcttccgatc tnnnnnnnna aggaggagta at 42

<210> 24

<211> 41

<212> DNA

<213> Artificial sequence

<400> 24

ttactcctcc ttctgtctct tatacacatc tccgagccca c 41

<210> 25

<211> 19

<212> DNA

<213> Artificial sequence

<400> 25

gacacgacgc tcttccgat 19

<210> 26

<211> 22

<212> DNA

<213> Artificial sequence

<400> 26

gtgggctcgg agatgtgtat aa 22

<210> 27

<211> 27

<212> DNA

<213> Artificial sequence

<400> 27

tctttcccta cacgacgctc ttccgat 27

<210> 28

<211> 20

<212> DNA

<213> Artificial sequence

<400> 28

tgtattaggg tgcagcgctc 20

<210> 29

<211> 18

<212> DNA

<213> Artificial sequence

<400> 29

cgctcggatc tggacctg 18

<210> 30

<211> 19

<212> DNA

<213> Artificial sequence

<400> 30

tggagccctg tgactcgaa 19

<210> 31

<211> 21

<212> DNA

<213> Artificial sequence

<400> 31

gtgaccagga catggatgag g 21

<210> 32

<211> 21

<212> DNA

<213> Artificial sequence

<400> 32

tcctccagta gacggtacag c 21

<210> 33

<211> 18

<212> DNA

<213> Artificial sequence

<400> 33

tgctgcttgt ccccacac 18

<210> 34

<211> 18

<212> DNA

<213> Artificial sequence

<400> 34

ccgcttggca ccacttcc 18

<210> 35

<211> 18

<212> DNA

<213> Artificial sequence

<400> 35

ggcacgggaa gcacgtac 18

<210> 36

<211> 18

<212> DNA

<213> Artificial sequence

<400> 36

ccttgcagtg ggaaggtg 18

<210> 37

<211> 23

<212> DNA

<213> Artificial sequence

<400> 37

gacagaaaag cggctgttag tca 23

<210> 38

<211> 19

<212> DNA

<213> Artificial sequence

<400> 38

ccgacctcag ctacagcat 19

<210> 39

<211> 21

<212> DNA

<213> Artificial sequence

<400> 39

acttgagcaa cccggagtct g 21

<210> 40

<211> 20

<212> DNA

<213> Artificial sequence

<400> 40

ctcctagctc tgcagtccga 20

<210> 41

<211> 18

<212> DNA

<213> Artificial sequence

<400> 41

gcgcctggct ccatttcc 18

<210> 42

<211> 21

<212> DNA

<213> Artificial sequence

<400> 42

cgcctgagaa cctgcaaaga g 21

<210> 43

<211> 18

<212> DNA

<213> Artificial sequence

<400> 43

gtccagggag caatgcgt 18

<210> 44

<211> 19

<212> DNA

<213> Artificial sequence

<400> 44

cgggttaccc cacagccta 19

<210> 45

<211> 18

<212> DNA

<213> Artificial sequence

<400> 45

ggctcccagt ggattcgc 18

<210> 46

<211> 18

<212> DNA

<213> Artificial sequence

<400> 46

gtcctgcccc ttcacctt 18

<210> 47

<211> 22

<212> DNA

<213> Artificial sequence

<400> 47

ccgactactg cctcacccat at 22

<210> 48

<211> 26

<212> DNA

<213> Artificial sequence

<400> 48

gggtttttct tgttgacaag aatcct 26

<210> 49

<211> 22

<212> DNA

<213> Artificial sequence

<400> 49

ccaacctcca atcactcacc aa 22

<210> 50

<211> 28

<212> DNA

<213> Artificial sequence

<400> 50

ggcgttttat catattcctc ttcatcct 28

<210> 51

<211> 26

<212> DNA

<213> Artificial sequence

<400> 51

ctacttccag gaacatcaac taccag 26

<210> 52

<211> 23

<212> DNA

<213> Artificial sequence

<400> 52

ctgcacttgt attcccatcc cat 23

<210> 53

<211> 27

<212> DNA

<213> Artificial sequence

<400> 53

tcagtttact agtgccattt gttcagt 27

<210> 54

<211> 28

<212> DNA

<213> Artificial sequence

<400> 54

tacaacatct tgagtccctt tttacctc 28

<210> 55

<211> 23

<212> DNA

<213> Artificial sequence

<400> 55

agaattgtgg gtcttttggg ctt 23

<210> 56

<211> 30

<212> DNA

<213> Artificial sequence

<400> 56

tgtaaacaat atctgaacct ttaccctgtt 30

<210> 57

<211> 20

<212> DNA

<213> Artificial sequence

<400> 57

gcatgcgtgg aacctttgtg 20

<210> 58

<211> 23

<212> DNA

<213> Artificial sequence

<400> 58

aactctgttg tcctctctcg gaa 23

<210> 59

<211> 18

<212> DNA

<213> Artificial sequence

<400> 59

ctgaatcccg cggacgac 18

<210> 60

<211> 21

<212> DNA

<213> Artificial sequence

<400> 60

ccgtctgtgc cttctcatct g 21

<210> 61

<211> 19

<212> DNA

<213> Artificial sequence

<400> 61

gaacgcccac caggtcttg 19

<210> 62

<211> 24

<212> DNA

<213> Artificial sequence

<400> 62

ccttgaggcg tacttcaaag actg 24

<210> 63

<211> 23

<212> DNA

<213> Artificial sequence

<400> 63

ggaggctgta ggcataaatt ggt 23

<210> 64

<211> 22

<212> DNA

<213> Artificial sequence

<400> 64

gtcctactgt tcaagcctcc aa 22

<210> 65

<211> 22

<212> DNA

<213> Artificial sequence

<400> 65

gggcttctgt ggagttactc tc 22

<210> 66

<211> 22

<212> DNA

<213> Artificial sequence

<400> 66

ttgtatcggg aggccttaga gt 22

<210> 67

<211> 21

<212> DNA

<213> Artificial sequence

<400> 67

ttctgtgttg gggtgagttg a 21

<210> 68

<211> 25

<212> DNA

<213> Artificial sequence

<400> 68

ccagcatcca gggaattagt agtca 25

<210> 69

<211> 27

<212> DNA

<213> Artificial sequence

<400> 69

ttcctgtctt acctttggaa gagaaac 27

<210> 70

<211> 25

<212> DNA

<213> Artificial sequence

<400> 70

ccggaaacta ctgttgttag acgta 25

<210> 71

<211> 23

<212> DNA

<213> Artificial sequence

<400> 71

cgtcgcagaa gatctcaatc tcg 23

<210> 72

<211> 28

<212> DNA

<213> Artificial sequence

<400> 72

aaactccctc ctttcctaac attcattt 28

<210> 73

<211> 26

<212> DNA

<213> Artificial sequence

<400> 73

tatgcctgct aggttctatc ctaacc 26

<210> 74

<211> 27

<212> DNA

<213> Artificial sequence

<400> 74

ggcattattt acatactctg tggaagg 27

<210> 75

<211> 22

<212> DNA

<213> Artificial sequence

<400> 75

gttggtcttc caaacctcga ca 22

<210> 76

<211> 22

<212> DNA

<213> Artificial sequence

<400> 76

ttcaacccca acaaggatca ct 22

<210> 77

<211> 20

<212> DNA

<213> Artificial sequence

<400> 77

ttccaccaat cggcagtcag 20

<210> 78

<211> 21

<212> DNA

<213> Artificial sequence

<400> 78

gccctgctca gaatactgtc t 21

<210> 79

<211> 20

<212> DNA

<213> Artificial sequence

<400> 79

attcgcagtc ccaaatctcc 20

<210> 80

<211> 21

<212> DNA

<213> Artificial sequence

<400> 80

catcttcctc tgcatcctgc t 21

<210> 81

<211> 22

<212> DNA

<213> Artificial sequence

<400> 81

ttccaggatc atcaaccacc ag 22

<210> 82

<211> 18

<212> DNA

<213> Artificial sequence

<400> 82

gtccctttat gccgctgt 18

<210> 83

<211> 29

<212> DNA

<213> Artificial sequence

<400> 83

acccttataa agaatttgga gctactgtg 29

<210> 84

<211> 22

<212> DNA

<213> Artificial sequence

<400> 84

ctcctgaaca ttgctcacct ca 22

<210> 85

<211> 18

<212> DNA

<213> Artificial sequence

<400> 85

agactgcctt ccgggtca 18

<210> 86

<211> 22

<212> DNA

<213> Artificial sequence

<400> 86

cctgtgggaa gcgaaaattc ca 22

<210> 87

<211> 19

<212> DNA

<213> Artificial sequence

<400> 87

acctggtcct ctgactgct 19

<210> 88

<211> 24

<212> DNA

<213> Artificial sequence

<400> 88

aagcaatgga tgatttgatg ctgt 24

<210> 89

<211> 20

<212> DNA

<213> Artificial sequence

<400> 89

gacccaggtc cagatgaagc 20

<210> 90

<211> 18

<212> DNA

<213> Artificial sequence

<400> 90

tcctggcccc tgtcatct 18

<210> 91

<211> 22

<212> DNA

<213> Artificial sequence

<400> 91

gtgccctgac tttcaactct gt 22

<210> 92

<211> 18

<212> DNA

<213> Artificial sequence

<400> 92

caactggcca agacctgc 18

<210> 93

<211> 20

<212> DNA

<213> Artificial sequence

<400> 93

cgccatggcc atctacaagc 20

<210> 94

<211> 18

<212> DNA

<213> Artificial sequence

<400> 94

ggtccccagg cctctgat 18

<210> 95

<211> 22

<212> DNA

<213> Artificial sequence

<400> 95

gagtggaagg aaatttgcgt gt 22

<210> 96

<211> 19

<212> DNA

<213> Artificial sequence

<400> 96

gcactggcct catcttggg 19

<210> 97

<211> 26

<212> DNA

<213> Artificial sequence

<400> 97

ccatccacta caactacatg tgtaac 26

<210> 98

<211> 24

<212> DNA

<213> Artificial sequence

<400> 98

tttccttact gcctcttgct tctc 24

<210> 99

<211> 20

<212> DNA

<213> Artificial sequence

<400> 99

gggacggaac agctttgagg 20

<210> 100

<211> 23

<212> DNA

<213> Artificial sequence

<400> 100

cacagaggaa gagaatctcc gca 23

<210> 101

<211> 26

<212> DNA

<213> Artificial sequence

<400> 101

tgcctcagat tcacttttat cacctt 26

<210> 102

<211> 30

<212> DNA

<213> Artificial sequence

<400> 102

ctcaggtact gtgtatatac ttacttctcc 30

<210> 103

<211> 19

<212> DNA

<213> Artificial sequence

<400> 103

cgtgagcgct tcgagatgt 19

<210> 104

<211> 22

<212> DNA

<213> Artificial sequence

<400> 104

gtgatgtcat ctctcctccc tg 22

<210> 105

<211> 25

<212> DNA

<213> Artificial sequence

<400> 105

tgaagtccaa aaagggtcag tctac 25

<210> 106

<211> 20

<212> DNA

<213> Artificial sequence

<400> 106

gggagcatct tcggtgaaac 20

<210> 107

<211> 22

<212> DNA

<213> Artificial sequence

<400> 107

caggcttatc ccatcttggt ca 22

<210> 108

<211> 18

<212> DNA

<213> Artificial sequence

<400> 108

ttggtggctg gcttggtc 18

<210> 109

<211> 21

<212> DNA

<213> Artificial sequence

<400> 109

gctgtaccgt ctactggagg a 21

<210> 110

<211> 21

<212> DNA

<213> Artificial sequence

<400> 110

gcttgttctc cagctctcgg a 21

<210> 111

<211> 18

<212> DNA

<213> Artificial sequence

<400> 111

gggaagtggt gccaagcg 18

<210> 112

<211> 18

<212> DNA

<213> Artificial sequence

<400> 112

gcacacgctg tacgtgct 18

<210> 113

<211> 18

<212> DNA

<213> Artificial sequence

<400> 113

gcctccacct gctccttg 18

<210> 114

<211> 22

<212> DNA

<213> Artificial sequence

<400> 114

ccctcaatga tccactgcat ga 22

<210> 115

<211> 24

<212> DNA

<213> Artificial sequence

<400> 115

ctcatacagg acttgggagg tatc 24

<210> 116

<211> 18

<212> DNA

<213> Artificial sequence

<400> 116

cacaaccgca ggacagct 18

<210> 117

<211> 18

<212> DNA

<213> Artificial sequence

<400> 117

ctccaagcct cggactgc 18

<210> 118

<211> 19

<212> DNA

<213> Artificial sequence

<400> 118

gcctcacacc agccacaac 19

<210> 119

<211> 20

<212> DNA

<213> Artificial sequence

<400> 119

tccccaccat gagcaaacca 20

<210> 120

<211> 18

<212> DNA

<213> Artificial sequence

<400> 120

gtgcctccct gcaacact 18

<210> 121

<211> 18

<212> DNA

<213> Artificial sequence

<400> 121

gcaccacgaa tgccggac 18

<210> 122

<211> 18

<212> DNA

<213> Artificial sequence

<400> 122

gtggggtaac ccgaggga 18

<210> 123

<211> 18

<212> DNA

<213> Artificial sequence

<400> 123

gaggaggcgg agctggaa 18

<210> 124

<211> 18

<212> DNA

<213> Artificial sequence

<400> 124

agcgctgcct gaaactcg 18

<210> 125

<211> 17

<212> DNA

<213> Artificial sequence

<400> 125

cgcacgaacg tggccag 17

<210> 126

<211> 19

<212> DNA

<213> Artificial sequence

<400> 126

gagccaccag caggaaagt 19

<210> 127

<211> 24

<212> DNA

<213> Artificial sequence

<400> 127

ctaggaatcc tgatgttgtg ctct 24

<210> 128

<211> 22

<212> DNA

<213> Artificial sequence

<400> 128

cgcgagtcta gactctgtgg ta 22

<210> 129

<211> 24

<212> DNA

<213> Artificial sequence

<400> 129

atagccagga caaattggag gaca 24

<210> 130

<211> 21

<212> DNA

<213> Artificial sequence

<400> 130

gacaaacggg caacatacct t 21

<210> 131

<211> 23

<212> DNA

<213> Artificial sequence

<400> 131

ccgaaggttt tgtacagcaa caa 23

<210> 132

<211> 23

<212> DNA

<213> Artificial sequence

<400> 132

ctgagccagg agaaacggac tga 23

<210> 133

<211> 26

<212> DNA

<213> Artificial sequence

<400> 133

gggactcaag atgttgtaca gacttg 26

<210> 134

<211> 21

<212> DNA

<213> Artificial sequence

<400> 134

gttaagggag tagccccaac g 21

<210> 135

<211> 25

<212> DNA

<213> Artificial sequence

<400> 135

caggcagttt tcgaaaacat tgctt 25

<210> 136

<211> 27

<212> DNA

<213> Artificial sequence

<400> 136

ttaaagcagg atagccacat tgtgtaa 27

<210> 137

<211> 25

<212> DNA

<213> Artificial sequence

<400> 137

ggcaacaggg taaaggttca gatat 25

<210> 138

<211> 19

<212> DNA

<213> Artificial sequence

<400> 138

ccacaaaggt tccacgcat 19

<210> 139

<211> 24

<212> DNA

<213> Artificial sequence

<400> 139

tggaaaggaa gtgtacttcc gaga 24

<210> 140

<211> 18

<212> DNA

<213> Artificial sequence

<400> 140

gtcgtccgcg ggattcag 18

<210> 141

<211> 18

<212> DNA

<213> Artificial sequence

<400> 141

aaggcacaga cggggaga 18

<210> 142

<211> 18

<212> DNA

<213> Artificial sequence

<400> 142

tcacggtggt ctccatgc 18

<210> 143

<211> 22

<212> DNA

<213> Artificial sequence

<400> 143

ggtcgttgac attgctgaga gt 22

<210> 144

<211> 22

<212> DNA

<213> Artificial sequence

<400> 144

aacctaatct cctcccccaa ct 22

<210> 145

<211> 23

<212> DNA

<213> Artificial sequence

<400> 145

gcagaggtga aaaagttgca tgg 23

<210> 146

<211> 18

<212> DNA

<213> Artificial sequence

<400> 146

ccacccaagg cacagctt 18

<210> 147

<211> 18

<212> DNA

<213> Artificial sequence

<400> 147

actccacaga agccccaa 18

<210> 148

<211> 20

<212> DNA

<213> Artificial sequence

<400> 148

gcctcccgat acaaagcaga 20

<210> 149

<211> 24

<212> DNA

<213> Artificial sequence

<400> 149

gattcatcaa ctcaccccaa caca 24

<210> 150

<211> 27

<212> DNA

<213> Artificial sequence

<400> 150

acatagctga ctactaattc cctggat 27

<210> 151

<211> 25

<212> DNA

<213> Artificial sequence

<400> 151

atccacactc caaaagacac caaat 25

<210> 152

<211> 22

<212> DNA

<213> Artificial sequence

<400> 152

gcgagggagt tcttcttcta gg 22

<210> 153

<211> 25

<212> DNA

<213> Artificial sequence

<400> 153

cagtaaagtt tcccaccttg tgagt 25

<210> 154

<211> 27

<212> DNA

<213> Artificial sequence

<400> 154

cctcctgtaa atgaatgtta ggaaagg 27

<210> 155

<211> 26

<212> DNA

<213> Artificial sequence

<400> 155

gtttaatgcc tttatccaag ggcaaa 26

<210> 156

<211> 27

<212> DNA

<213> Artificial sequence

<400> 156

ctcttatata gaatcccagc cttccac 27

<210> 157

<211> 22

<212> DNA

<213> Artificial sequence

<400> 157

cttgtcgagg tttggaagac ca 22

<210> 158

<211> 20

<212> DNA

<213> Artificial sequence

<400> 158

gtttgagttg gctccgaacg 20

<210> 159

<211> 18

<212> DNA

<213> Artificial sequence

<400> 159

ctgagggctc caccccaa 18

<210> 160

<211> 23

<212> DNA

<213> Artificial sequence

<400> 160

gtgaagagat gggagtaggc tgt 23

<210> 161

<211> 26

<212> DNA

<213> Artificial sequence

<400> 161

cccatctttt tgttttgtga gggttt 26

<210> 162

<211> 26

<212> DNA

<213> Artificial sequence

<400> 162

ttaaagcagg atatccacat tgcgta 26

<210> 163

<211> 22

<212> DNA

<213> Artificial sequence

<400> 163

ttgctgaaag tccaagagtc ct 22

<210> 164

<211> 23

<212> DNA

<213> Artificial sequence

<400> 164

ggtgagcaat gttcaggaga ttc 23

<210> 165

<211> 22

<212> DNA

<213> Artificial sequence

<400> 165

actactagat ccctggacgc tg 22

<210> 166

<211> 23

<212> DNA

<213> Artificial sequence

<400> 166

ggtggagata agggagtagg ctg 23

<210> 167

<211> 20

<212> DNA

<213> Artificial sequence

<400> 167

tgcccttcca atggatccac 20

<210> 168

<211> 18

<212> DNA

<213> Artificial sequence

<400> 168

gtccccagcc caaccctt 18

<210> 169

<211> 20

<212> DNA

<213> Artificial sequence

<400> 169

ctctggcatt ctgggagctt 20

<210> 170

<211> 22

<212> DNA

<213> Artificial sequence

<400> 170

tggtaggttt tctgggaagg ga 22

<210> 171

<211> 21

<212> DNA

<213> Artificial sequence

<400> 171

tgtcccagaa tgcaagaagc c 21

<210> 172

<211> 24

<212> DNA

<213> Artificial sequence

<400> 172

ggcattgaag tctcatggaa gcca 24

<210> 173

<211> 20

<212> DNA

<213> Artificial sequence

<400> 173

acctccgtca tgtgctgtga 20

<210> 174

<211> 21

<212> DNA

<213> Artificial sequence

<400> 174

ctcaccatcg ctatctgagc a 21

<210> 175

<211> 18

<212> DNA

<213> Artificial sequence

<400> 175

gcaaccagcc ctgtcgtc 18

<210> 176

<211> 21

<212> DNA

<213> Artificial sequence

<400> 176

gcaccaccac actatgtcga a 21

<210> 177

<211> 21

<212> DNA

<213> Artificial sequence

<400> 177

ttaacccctc ctcccagaga c 21

<210> 178

<211> 24

<212> DNA

<213> Artificial sequence

<400> 178

ttccagtgtg atgatggtga ggat 24

<210> 179

<211> 18

<212> DNA

<213> Artificial sequence

<400> 179

cagcaggcca gtgtgcag 18

<210> 180

<211> 18

<212> DNA

<213> Artificial sequence

<400> 180

ccggtctctc ccaggaca 18

<210> 181

<211> 20

<212> DNA

<213> Artificial sequence

<400> 181

gtgaggctcc cctttcttgc 20

<210> 182

<211> 19

<212> DNA

<213> Artificial sequence

<400> 182

tggtctcctc caccgcttc 19

<210> 183

<211> 26

<212> DNA

<213> Artificial sequence

<400> 183

gaaactttcc acttgataag aggtcc 26

<210> 184

<211> 18

<212> DNA

<213> Artificial sequence

<400> 184

ctcccccctg gctccttc 18

<210> 185

<211> 19

<212> DNA

<213> Artificial sequence

<400> 185

ggggagtagg gccaggaag 19

<210> 186

<211> 23

<212> DNA

<213> Artificial sequence

<400> 186

gcccttctgt cttgaacatg agt 23

<210> 187

<211> 18

<212> DNA

<213> Artificial sequence

<400> 187

gtgggaggct gtcagtgg 18

<210> 188

<211> 16

<212> DNA

<213> Artificial sequence

<400> 188

gccacccgga cgcttc 16

<210> 189

<211> 21

<212> DNA

<213> Artificial sequence

<400> 189

caaacgaaac cccacacgaa c 21

<210> 190

<211> 17

<212> DNA

<213> Artificial sequence

<400> 190

gcggagggag cgagttc 17

<210> 191

<211> 20

<212> DNA

<213> Artificial sequence

<400> 191

aacatagtcc ccgctggcta 20

<210> 192

<211> 18

<212> DNA

<213> Artificial sequence

<400> 192

ggagcgctca aacccaca 18

<210> 193

<211> 18

<212> DNA

<213> Artificial sequence

<400> 193

tacaactggc ccgtgtgg 18

<210> 194

<211> 20

<212> DNA

<213> Artificial sequence

<400> 194

gtccttcttc gcctggcatc 20

<210> 195

<211> 17

<212> DNA

<213> Artificial sequence

<400> 195

tgggctggga gaccgtg 17

<210> 196

<211> 19

<212> DNA

<213> Artificial sequence

<400> 196

ccaccggctc ttcaagctc 19

<210> 197

<211> 16

<212> DNA

<213> Artificial sequence

<400> 197

catcgtcgcc gctgca 16

<210> 198

<211> 20

<212> DNA

<213> Artificial sequence

<400> 198

aacgcatagg aggggtggaa 20

<210> 199

<211> 22

<212> DNA

<213> Artificial sequence

<400> 199

cctttgggtt gggagaagaa aa 22

<210> 200

<211> 18

<212> DNA

<213> Artificial sequence

<400> 200

cacccgccgt gtacgttt 18

<210> 201

<211> 20

<212> DNA

<213> Artificial sequence

<400> 201

cggaatcggg gtctaagtgg 20

<210> 202

<211> 18

<212> DNA

<213> Artificial sequence

<400> 202

cctagcgatc agggcacc 18

<210> 203

<211> 20

<212> DNA

<213> Artificial sequence

<400> 203

gatgagagag cagtctgcgt 20

<210> 204

<211> 20

<212> DNA

<213> Artificial sequence

<400> 204

cgttctcgcg ctctgcttac 20

<210> 205

<211> 16

<212> DNA

<213> Artificial sequence

<400> 205

gacccccgct gctcac 16

<210> 206

<211> 17

<212> DNA

<213> Artificial sequence

<400> 206

ccccctaagc cgctgtt 17

<210> 207

<211> 18

<212> DNA

<213> Artificial sequence

<400> 207

ccacacgggc cagttgta 18

<210> 208

<211> 22

<212> DNA

<213> Artificial sequence

<400> 208

tggccgtttt cgaagaggta ga 22

<210> 209

<211> 17

<212> DNA

<213> Artificial sequence

<400> 209

caccgttggg ctggtcc 17

<210> 210

<211> 19

<212> DNA

<213> Artificial sequence

<400> 210

cgagcttgaa gagccggtg 19

<210> 211

<211> 17

<212> DNA

<213> Artificial sequence

<400> 211

cgcccacccg agttcct 17

<210> 212

<211> 16

<212> DNA

<213> Artificial sequence

<400> 212

tggccgggac tggagg 16

<210> 213

<211> 22

<212> DNA

<213> Artificial sequence

<400> 213

ggtaatacgt tccggcactt cg 22

<210> 214

<211> 19

<212> DNA

<213> Artificial sequence

<400> 214

gcccccactt tccaactcc 19

<210> 215

<211> 18

<212> DNA

<213> Artificial sequence

<400> 215

gcggttccga agtccctg 18

<210> 216

<211> 17

<212> DNA

<213> Artificial sequence

<400> 216

ctctccagcc ctcggtg 17

<210> 217

<211> 50

<212> DNA

<213> Artificial sequence

<400> 217

aatgatacgg cgaccaccga gatctacact ctttccctac acgacgctct 50

<210> 218

<211> 24

<212> DNA

<213> Artificial sequence

<400> 218

caagcagaag acggcatacg agat 24

<210> 219

<211> 33

<212> DNA

<213> Artificial sequence

<400> 219

gtgactggag ttccttggca cccgagaa 33

<210> 220

<211> 38

<212> DNA

<213> Artificial sequence

<400> 220

cttggcaccc gagaattcca ttgttccttg acgcagag 38

<210> 221

<211> 40

<212> DNA

<213> Artificial sequence

<400> 221

cttggcaccc gagaattcca gacctggggt atgagcctga 40

<210> 222

<211> 38

<212> DNA

<213> Artificial sequence

<400> 222

cttggcaccc gagaattcca aggctgaagc tggcgaga 38

<210> 223

<211> 40

<212> DNA

<213> Artificial sequence

<400> 223

cttggcaccc gagaattcca tgaggacgat ggcagagacg 40

<210> 224

<211> 40

<212> DNA

<213> Artificial sequence

<400> 224

cttggcaccc gagaattcca gtacagcgaa ggcagagagt 40

<210> 225

<211> 41

<212> DNA

<213> Artificial sequence

<400> 225

cttggcaccc gagaattcca cacacaggag gaggaaggtg a 41

<210> 226

<211> 39

<212> DNA

<213> Artificial sequence

<400> 226

cttggcaccc gagaattcca tgtgtggaca tgggctgtg 39

<210> 227

<211> 38

<212> DNA

<213> Artificial sequence

<400> 227

cttggcaccc gagaattcca acccaagtca ggggcgaa 38

<210> 228

<211> 44

<212> DNA

<213> Artificial sequence

<400> 228

cttggcaccc gagaattcca gcgtgcaaaa gaaatgccaa gaag 44

<210> 229

<211> 41

<212> DNA

<213> Artificial sequence

<400> 229

cttggcaccc gagaattcca tagtcactgg cagcaacagt c 41

<210> 230

<211> 38

<212> DNA

<213> Artificial sequence

<400> 230

cttggcaccc gagaattcca ctgcaaggcc tcgggaga 38

<210> 231

<211> 41

<212> DNA

<213> Artificial sequence

<400> 231

cttggcaccc gagaattcca attcctggga agtcctcagc t 41

<210> 232

<211> 38

<212> DNA

<213> Artificial sequence

<400> 232

cttggcaccc gagaattcca gcttggagcc aggtgcct 38

<210> 233

<211> 43

<212> DNA

<213> Artificial sequence

<400> 233

cttggcaccc gagaattcca catttcccac cctttctcga cgg 43

<210> 234

<211> 38

<212> DNA

<213> Artificial sequence

<400> 234

cttggcaccc gagaattcca acgggcctgt gtcaagga 38

<210> 235

<211> 38

<212> DNA

<213> Artificial sequence

<400> 235

cttggcaccc gagaattcca atgcgtcctc gggttcgt 38

<210> 236

<211> 38

<212> DNA

<213> Artificial sequence

<400> 236

cttggcaccc gagaattcca agcctaggcc gattcgac 38

<210> 237

<211> 38

<212> DNA

<213> Artificial sequence

<400> 237

cttggcaccc gagaattcca gattcgcggg cacagacg 38

<210> 238

<211> 38

<212> DNA

<213> Artificial sequence

<400> 238

cttggcaccc gagaattcca ttccagctcc gcctcctc 38

<210> 239

<211> 44

<212> DNA

<213> Artificial sequence

<400> 239

cttggcaccc gagaattcca cccatatcgt caatcttctc gagg 44

<210> 240

<211> 45

<212> DNA

<213> Artificial sequence

<400> 240

cttggcaccc gagaattcca tcacagtacc acagagtcta gactc 45

<210> 241

<211> 44

<212> DNA

<213> Artificial sequence

<400> 241

cttggcaccc gagaattcca aacctcttgt cctccaattt gtcc 44

<210> 242

<211> 42

<212> DNA

<213> Artificial sequence

<400> 242

cttggcaccc gagaattcca cctgctgcta tgcctcatct tc 42

<210> 243

<211> 39

<212> DNA

<213> Artificial sequence

<400> 243

cttggcaccc gagaattcca cacgggacca tgcaagacc 39

<210> 244

<211> 42

<212> DNA

<213> Artificial sequence

<400> 244

cttggcaccc gagaattcca tgggctttcg caagattcct at 42

<210> 245

<211> 39

<212> DNA

<213> Artificial sequence

<400> 245

cttggcaccc gagaattcca cgtagggctt tcccccact 39

<210> 246

<211> 51

<212> DNA

<213> Artificial sequence

<400> 246

cttggcaccc gagaattcca cctctattac caattttctt ttgtctttgg g 51

<210> 247

<211> 42

<212> DNA

<213> Artificial sequence

<400> 247

cttggcaccc gagaattcca acacaatgtg gctatcctgc tt 42

<210> 248

<211> 38

<212> DNA

<213> Artificial sequence

<400> 248

cttggcaccc gagaattcca ggcaacggtc aggtctct 38

<210> 249

<211> 43

<212> DNA

<213> Artificial sequence

<400> 249

cttggcaccc gagaattcca ctctgccgat ccatactgcg gaa 43

<210> 250

<211> 42

<212> DNA

<213> Artificial sequence

<400> 250

cttggcaccc gagaattcca cacttccttt ccatggctgc ta 42

<210> 251

<211> 39

<212> DNA

<213> Artificial sequence

<400> 251

cttggcaccc gagaattcca ccgtttggga ctctaccgt 39

<210> 252

<211> 38

<212> DNA

<213> Artificial sequence

<400> 252

cttggcaccc gagaattcca cgtgtgcact tcgcttca 38

<210> 253

<211> 44

<212> DNA

<213> Artificial sequence

<400> 253

cttggcaccc gagaattcca ttgcccaagg tcttacataa gagg 44

<210> 254

<211> 45

<212> DNA

<213> Artificial sequence

<400> 254

cttggcaccc gagaattcca gtttgtttaa ggactgggag gagtt 45

<210> 255

<211> 41

<212> DNA

<213> Artificial sequence

<400> 255

cttggcaccc gagaattcca ggtctgttca ccagcaccat g 41

<210> 256

<211> 38

<212> DNA

<213> Artificial sequence

<400> 256

cttggcaccc gagaattcca ctgtgccttg ggtggctt 38

<210> 257

<211> 47

<212> DNA

<213> Artificial sequence

<400> 257

cttggcaccc gagaattcca ttgccttctg atttctttcc ttctatt 47

<210> 258

<211> 43

<212> DNA

<213> Artificial sequence

<400> 258

cttggcaccc gagaattcca gagtctccgg aacattgttc acc 43

<210> 259

<211> 41

<212> DNA

<213> Artificial sequence

<400> 259

cttggcaccc gagaattcca agttgatgaa tctggccacc t 41

<210> 260

<211> 48

<212> DNA

<213> Artificial sequence

<400> 260

cttggcaccc gagaattcca cagctatgtt aatgttaata tgggccta 48

<210> 261

<211> 46

<212> DNA

<213> Artificial sequence

<400> 261

cttggcaccc gagaattcca tatttggtgt cttttggagt gtggat 46

<210> 262

<211> 41

<212> DNA

<213> Artificial sequence

<400> 262

cttggcaccc gagaattcca tagaggcagg tcccctagaa g 41

<210> 263

<211> 46

<212> DNA

<213> Artificial sequence

<400> 263

cttggcaccc gagaattcca caatgttagt atcccttgga ctcaca 46

<210> 264

<211> 47

<212> DNA

<213> Artificial sequence

<400> 264

cttggcaccc gagaattcca acaggaggac attattgata gatgtca 47

<210> 265

<211> 43

<212> DNA

<213> Artificial sequence

<400> 265

cttggcaccc gagaattcca aaccttacca agtatttgcc ctt 43

<210> 266

<211> 45

<212> DNA

<213> Artificial sequence

<400> 266

cttggcaccc gagaattcca tctgtggaag gctgggattc tatat 45

<210> 267

<211> 42

<212> DNA

<213> Artificial sequence

<400> 267

cttggcaccc gagaattcca gggacaaatc tttctgttcc ca 42

<210> 268

<211> 39

<212> DNA

<213> Artificial sequence

<400> 268

cttggcaccc gagaattcca ggccagaggc aaatcaggt 39

<210> 269

<211> 42

<212> DNA

<213> Artificial sequence

<400> 269

cttggcaccc gagaattcca cagtcaggaa gacagcctac tc 42

<210> 270

<211> 44

<212> DNA

<213> Artificial sequence

<400> 270

cttggcaccc gagaattcca aatactgtct ctgccatatc gtca 44

<210> 271

<211> 42

<212> DNA

<213> Artificial sequence

<400> 271

cttggcaccc gagaattcca gtgtgtttca tgagtgggag ga 42

<210> 272

<211> 44

<212> DNA

<213> Artificial sequence

<400> 272

cttggcaccc gagaattcca tttgccttct gacttctttc cgtc 44

<210> 273

<211> 40

<212> DNA

<213> Artificial sequence

<400> 273

cttggcaccc gagaattcca cacagcactc aggcaagcta 40

<210> 274

<211> 39

<212> DNA

<213> Artificial sequence

<400> 274

cttggcaccc gagaattcca gtcactgcca tggaggagc 39

<210> 275

<211> 40

<212> DNA

<213> Artificial sequence

<400> 275

cttggcaccc gagaattcca ccatgggact gactttctgc 40

<210> 276

<211> 43

<212> DNA

<213> Artificial sequence

<400> 276

cttggcaccc gagaattcca actgctcttt tcacccatct aca 43

<210> 277

<211> 41

<212> DNA

<213> Artificial sequence

<400> 277

cttggcaccc gagaattcca tgtccccgga cgatattgaa c 41

<210> 278

<211> 42

<212> DNA

<213> Artificial sequence

<400> 278

cttggcaccc gagaattcca cagatgaagc tcccagaatg cc 42

<210> 279

<211> 42

<212> DNA

<213> Artificial sequence

<400> 279

cttggcaccc gagaattcca tgtcatcttc tgtcccttcc ca 42

<210> 280

<211> 44

<212> DNA

<213> Artificial sequence

<400> 280

cttggcaccc gagaattcca caactctgtc tccttcctct tcct 44

<210> 281

<211> 39

<212> DNA

<213> Artificial sequence

<400> 281

cttggcaccc gagaattcca tgtgcagctg tgggttgat 39

<210> 282

<211> 42

<212> DNA

<213> Artificial sequence

<400> 282

cttggcaccc gagaattcca caagcagtca cagcacatga cg 42

<210> 283

<211> 43

<212> DNA

<213> Artificial sequence

<400> 283

cttggcaccc gagaattcca cctctgattc ctcactgatt gct 43

<210> 284

<211> 42

<212> DNA

<213> Artificial sequence

<400> 284

cttggcaccc gagaattcca ttgcgtgtgg agtatttgga tg 42

<210> 285

<211> 42

<212> DNA

<213> Artificial sequence

<400> 285

cttggcaccc gagaattcca tcttgggcct gtgttatctc ct 42

<210> 286

<211> 44

<212> DNA

<213> Artificial sequence

<400> 286

cttggcaccc gagaattcca acatgtgtaa cagttcctgc atgg 44

<210> 287

<211> 46

<212> DNA

<213> Artificial sequence

<400> 287

cttggcaccc gagaattcca cttgcttctc ttttcctatc ctgagt 46

<210> 288

<211> 41

<212> DNA

<213> Artificial sequence

<400> 288

cttggcaccc gagaattcca ctttgaggtg cgtgtttgtg c 41

<210> 289

<211> 39

<212> DNA

<213> Artificial sequence

<400> 289

cttggcaccc gagaattcca gcaagaaagg ggagcctca 39

<210> 290

<211> 43

<212> DNA

<213> Artificial sequence

<400> 290

cttggcaccc gagaattcca atcacctttc cttgcctctt tcc 43

<210> 291

<211> 40

<212> DNA

<213> Artificial sequence

<400> 291

cttggcaccc gagaattcca ttctccccct cctctgttgc 40

<210> 292

<211> 41

<212> DNA

<213> Artificial sequence

<400> 292

cttggcaccc gagaattcca cttcgagatg ttccgagagc t 41

<210> 293

<211> 41

<212> DNA

<213> Artificial sequence

<400> 293

cttggcaccc gagaattcca cctccctgct tctgtctcct a 41

<210> 294

<211> 40

<212> DNA

<213> Artificial sequence

<400> 294

cttggcaccc gagaattcca tcagtctacc tcccgccata 40

<210> 295

<211> 40

<212> DNA

<213> Artificial sequence

<400> 295

cttggcaccc gagaattcca gaaacttgct ccgaggtcca 40

<210> 296

<211> 40

<212> DNA

<213> Artificial sequence

<400> 296

cttggcaccc gagaattcca catccagcag ggaatgcagt 40

<210> 297

<211> 44

<212> DNA

<213> Artificial sequence

<400> 297

cttggcaccc gagaattcca gacacgatgc cattgttatc aaga 44

<210> 298

<211> 40

<212> DNA

<213> Artificial sequence

<400> 298

cttggcaccc gagaattcca ctgtctccag gagcagcttc 40

<210> 299

<211> 42

<212> DNA

<213> Artificial sequence

<400> 299

cttggcaccc gagaattcca cggaggtgag tacagaaagt gg 42

<210> 300

<211> 39

<212> DNA

<213> Artificial sequence

<400> 300

cttggcaccc gagaattcca ggaggcagct tgtgacacg 39

<210> 301

<211> 40

<212> DNA

<213> Artificial sequence

<400> 301

cttggcaccc gagaattcca ctcgtccagg atgctctcag 40

<210> 302

<211> 38

<212> DNA

<213> Artificial sequence

<400> 302

cttggcaccc gagaattcca gtggtggacg tggtggtg 38

<210> 303

<211> 44

<212> DNA

<213> Artificial sequence

<400> 303

cttggcaccc gagaattcca tgattttctg gttcttctcc gcat 44

<210> 304

<211> 44

<212> DNA

<213> Artificial sequence

<400> 304

cttggcaccc gagaattcca gaggtatcca catcctcttc ctca 44

<210> 305

<211> 40

<212> DNA

<213> Artificial sequence

<400> 305

cttggcaccc gagaattcca aggacttccc aggaatccag 40

<210> 306

<211> 38

<212> DNA

<213> Artificial sequence

<400> 306

cttggcaccc gagaattcca agctaggagg cccgactt 38

<210> 307

<211> 38

<212> DNA

<213> Artificial sequence

<400> 307

cttggcaccc gagaattcca acaacggcct tgaccctg 38

<210> 308

<211> 43

<212> DNA

<213> Artificial sequence

<400> 308

cttggcaccc gagaattcca ccaccccaaa tctgttaatc acc 43

<210> 309

<211> 40

<212> DNA

<213> Artificial sequence

<400> 309

cttggcaccc gagaattcca aacacttccc cgcgacttgg 40

<210> 310

<211> 38

<212> DNA

<213> Artificial sequence

<400> 310

cttggcaccc gagaattcca cgtgaagggg aggacgga 38

<210> 311

<211> 38

<212> DNA

<213> Artificial sequence

<400> 311

cttggcaccc gagaattcca ggggccatga tgtggagg 38

<210> 312

<211> 38

<212> DNA

<213> Artificial sequence

<400> 312

cttggcaccc gagaattcca aaggtgaagg ggcaggac 38

<210> 313

<211> 38

<212> DNA

<213> Artificial sequence

<400> 313

cttggcaccc gagaattcca gcggaaagga aggggagg 38

<210> 314

<211> 37

<212> DNA

<213> Artificial sequence

<400> 314

cttggcaccc gagaattcca gcagcacctc gcggtag 37

<210> 315

<211> 42

<212> DNA

<213> Artificial sequence

<400> 315

cttggcaccc gagaattcca ggaaagtata ggcccctcac tc 42

<210> 316

<211> 38

<212> DNA

<213> Artificial sequence

<400> 316

cttggcaccc gagaattcca ctctccatgt tcggggca 38

<210> 317

<211> 47

<212> DNA

<213> Artificial sequence

<400> 317

cttggcaccc gagaattcca gaggattctt gtcaacaaga aaaaccc 47

<210> 318

<211> 43

<212> DNA

<213> Artificial sequence

<400> 318

cttggcaccc gagaattcca acaagaggtt ggtgagtgat tgg 43

<210> 319

<211> 46

<212> DNA

<213> Artificial sequence

<400> 319

cttggcaccc gagaattcca gtccagaaga accaacaaga agatga 46

<210> 320

<211> 45

<212> DNA

<213> Artificial sequence

<400> 320

cttggcaccc gagaattcca catagaggtt ccttgagcag gaatc 45

<210> 321

<211> 43

<212> DNA

<213> Artificial sequence

<400> 321

cttggcaccc gagaattcca cactcccata ggaatcttgc gaa 43

<210> 322

<211> 43

<212> DNA

<213> Artificial sequence

<400> 322

cttggcaccc gagaattcca cccccaatac cacatcatcc ata 43

<210> 323

<211> 47

<212> DNA

<213> Artificial sequence

<400> 323

cttggcaccc gagaattcca agggttcaaa tgtataccca aagacaa 47

<210> 324

<211> 48

<212> DNA

<213> Artificial sequence

<400> 324

cttggcaccc gagaattcca agttttagta caatatgttc ttgcggta 48

<210> 325

<211> 41

<212> DNA

<213> Artificial sequence

<400> 325

cttggcaccc gagaattcca cattgtgtaa aaggggcagc a 41

<210> 326

<211> 46

<212> DNA

<213> Artificial sequence

<400> 326

cttggcaccc gagaattcca tgtttacaca gaaaggcctt gtaagt 46

<210> 327

<211> 39

<212> DNA

<213> Artificial sequence

<400> 327

cttggcaccc gagaattcca catgcggcga tggccaata 39

<210> 328

<211> 45

<212> DNA

<213> Artificial sequence

<400> 328

cttggcaccc gagaattcca ttccgagaga ggacaacaga gttgt 45

<210> 329

<211> 41

<212> DNA

<213> Artificial sequence

<400> 329

cttggcaccc gagaattcca gacgggacgt aaacaaagga c 41

<210> 330

<211> 40

<212> DNA

<213> Artificial sequence

<400> 330

cttggcaccc gagaattcca ggagaccgcg taaagagagg 40

<210> 331

<211> 40

<212> DNA

<213> Artificial sequence

<400> 331

cttggcaccc gagaattcca gtgcagaggt gaagcgaagt 40

<210> 332

<211> 45

<212> DNA

<213> Artificial sequence

<400> 332

cttggcaccc gagaattcca tccaagagtc ctcttatgta agacc 45

<210> 333

<211> 43

<212> DNA

<213> Artificial sequence

<400> 333

cttggcaccc gagaattcca caactcctcc cagtccttaa aca 43

<210> 334

<211> 40

<212> DNA

<213> Artificial sequence

<400> 334

cttggcaccc gagaattcca ggtgctggtg aacagaccaa 40

<210> 335

<211> 42

<212> DNA

<213> Artificial sequence

<400> 335

cttggcaccc gagaattcca cttggaggct tgaacagtag ga 42

<210> 336

<211> 45

<212> DNA

<213> Artificial sequence

<400> 336

cttggcaccc gagaattcca aattctttat acgggtcaat gtcca 45

<210> 337

<211> 38

<212> DNA

<213> Artificial sequence

<400> 337

cttggcaccc gagaattcca cagaggcggt gtcgagga 38

<210> 338

<211> 40

<212> DNA

<213> Artificial sequence

<400> 338

cttggcaccc gagaattcca acacagaaca gcttgcctga 40

<210> 339

<211> 44

<212> DNA

<213> Artificial sequence

<400> 339

cttggcaccc gagaattcca ctgggtcttc caaattactt ccca 44

<210> 340

<211> 46

<212> DNA

<213> Artificial sequence

<400> 340

cttggcaccc gagaattcca gtttctcttc caaaggtaag acagga 46

<210> 341

<211> 43

<212> DNA

<213> Artificial sequence

<400> 341

cttggcaccc gagaattcca acctgcctct acgtctaaca aca 43

<210> 342

<211> 47

<212> DNA

<213> Artificial sequence

<400> 342

cttggcaccc gagaattcca ttgtgagtcc aagggatact aacattg 47

<210> 343

<211> 44

<212> DNA

<213> Artificial sequence

<400> 343

cttggcaccc gagaattcca gggagtttgc cactcaggat taaa 44

<210> 344

<211> 47

<212> DNA

<213> Artificial sequence

<400> 344

cttggcaccc gagaattcca gggcaaatac ttggtaaggt taggata 47

<210> 345

<211> 49

<212> DNA

<213> Artificial sequence

<400> 345

cttggcaccc gagaattcca ccttccacag agtatgtaaa taatgccta 49

<210> 346

<211> 42

<212> DNA

<213> Artificial sequence

<400> 346

cttggcaccc gagaattcca ctcccatgct gtagctcttg tt 42

<210> 347

<211> 40

<212> DNA

<213> Artificial sequence

<400> 347

cttggcaccc gagaattcca gctgggtcca actggtgatc 40

<210> 348

<211> 40

<212> DNA

<213> Artificial sequence

<400> 348

cttggcaccc gagaattcca ccccaaaaga ccaccgtgtg 40

<210> 349

<211> 41

<212> DNA

<213> Artificial sequence

<400> 349

cttggcaccc gagaattcca tcttcctgac tgccgattgg t 41

<210> 350

<211> 40

<212> DNA

<213> Artificial sequence

<400> 350

cttggcaccc gagaattcca caagaccttg ggcaggttcc 40

<210> 351

<211> 43

<212> DNA

<213> Artificial sequence

<400> 351

cttggcaccc gagaattcca attctaaggc ttcccgatac aga 43

<210> 352

<211> 46

<212> DNA

<213> Artificial sequence

<400> 352

cttggcaccc gagaattcca acgctggatc ttctaaatta ttaccc 46

<210> 353

<211> 43

<212> DNA

<213> Artificial sequence

<400> 353

cttggcaccc gagaattcca gatccactca cagtttccat agg 43

<210> 354

<211> 40

<212> DNA

<213> Artificial sequence

<400> 354

cttggcaccc gagaattcca cagcccaacc cttgtcctta 40

<210> 355

<211> 41

<212> DNA

<213> Artificial sequence

<400> 355

cttggcaccc gagaattcca tgggagcttc atctggacct g 41

<210> 356

<211> 41

<212> DNA

<213> Artificial sequence

<400> 356

cttggcaccc gagaattcca gaagggacag aagatgacag g 41

<210> 357

<211> 41

<212> DNA

<213> Artificial sequence

<400> 357

cttggcaccc gagaattcca caagaagccc agacggaaac c 41

<210> 358

<211> 38

<212> DNA

<213> Artificial sequence

<400> 358

cttggcaccc gagaattcca cccctcaggg caactgac 38

<210> 359

<211> 44

<212> DNA

<213> Artificial sequence

<400> 359

cttggcaccc gagaattcca gtgctgtgac tgcttgtaga tggc 44

<210> 360

<211> 41

<212> DNA

<213> Artificial sequence

<400> 360

cttggcaccc gagaattcca atctgagcag cgctcatggt g 41

<210> 361

<211> 38

<212> DNA

<213> Artificial sequence

<400> 361

cttggcaccc gagaattcca ccctgtcgtc tctccagc 38

<210> 362

<211> 47

<212> DNA

<213> Artificial sequence

<400> 362

cttggcaccc gagaattcca ctatgtcgaa aagtgtttct gtcatcc 47

<210> 363

<211> 41

<212> DNA

<213> Artificial sequence

<400> 363

cttggcaccc gagaattcca gagaccccag ttgcaaacca g 41

<210> 364

<211> 38

<212> DNA

<213> Artificial sequence

<400> 364

cttggcaccc gagaattcca tgggcctccg gttcatgc 38

<210> 365

<211> 38

<212> DNA

<213> Artificial sequence

<400> 365

cttggcaccc gagaattcca gtgcagggtg gcaagtgg 38

<210> 366

<211> 39

<212> DNA

<213> Artificial sequence

<400> 366

cttggcaccc gagaattcca gacaggcaca aacacgcac 39

<210> 367

<211> 44

<212> DNA

<213> Artificial sequence

<400> 367

cttggcaccc gagaattcca ttcttgcgga gattctcttc ctct 44

<210> 368

<211> 40

<212> DNA

<213> Artificial sequence

<400> 368

cttggcaccc gagaattcca cgcttcttgt cctgcttgct 40

<210> 369

<211> 46

<212> DNA

<213> Artificial sequence

<400> 369

cttggcaccc gagaattcca acttgataag aggtcccaag acttag 46

<210> 370

<211> 38

<212> DNA

<213> Artificial sequence

<400> 370

cttggcaccc gagaattcca agcctgggca tccttgag 38

<210> 371

<211> 38

<212> DNA

<213> Artificial sequence

<400> 371

cttggcaccc gagaattcca caggaagggg ctgaggtc 38

<210> 372

<211> 44

<212> DNA

<213> Artificial sequence

<400> 372

cttggcaccc gagaattcca catgagtttt ttatggcggg aggt 44

<210> 373

<211> 41

<212> DNA

<213> Artificial sequence

<400> 373

cttggcaccc gagaattcca cagtggggaa caagaagtgg a 41

<210> 374

<211> 34

<212> DNA

<213> Artificial sequence

<400> 374

cttggcaccc gagaaggacg cttctacacg cgaa 34

<210> 375

<211> 38

<212> DNA

<213> Artificial sequence

<400> 375

cttggcaccc gagaacacga acgaaaagga acatgtct 38

<210> 376

<211> 32

<212> DNA

<213> Artificial sequence

<400> 376

cttggcaccc gagaacgagt tcgcggcttc gg 32

<210> 377

<211> 31

<212> DNA

<213> Artificial sequence

<400> 377

cttggcaccc gagaacagca gcagcagcgg g 31

<210> 378

<211> 39

<212> DNA

<213> Artificial sequence

<400> 378

cttggcaccc gagaacaaac ccacagggta tctatcagg 39

<210> 379

<211> 32

<212> DNA

<213> Artificial sequence

<400> 379

cttggcaccc gagaagctgg gcgtgcacga tc 32

<210> 380

<211> 32

<212> DNA

<213> Artificial sequence

<400> 380

cttggcaccc gagaacctgg catcgctcac cc 32

<210> 381

<211> 32

<212> DNA

<213> Artificial sequence

<400> 381

cttggcaccc gagaagaccg tggggctgtg ag 32

<210> 382

<211> 35

<212> DNA

<213> Artificial sequence

<400> 382

cttggcaccc gagaactctt caagctcgga atgga 35

<210> 383

<211> 31

<212> DNA

<213> Artificial sequence

<400> 383

cttggcaccc gagaagccgc tgcagacgga t 31

<210> 384

<211> 33

<212> DNA

<213> Artificial sequence

<400> 384

cttggcaccc gagaaaggag gggtggaacc cag 33

<210> 385

<211> 40

<212> DNA

<213> Artificial sequence

<400> 385

cttggcaccc gagaatggga gaagaaaaaa acacacacac 40

<210> 386

<211> 35

<212> DNA

<213> Artificial sequence

<400> 386

cttggcaccc gagaatttcg cgggacaaaa accac 35

<210> 387

<211> 35

<212> DNA

<213> Artificial sequence

<400> 387

cttggcaccc gagaatctaa gtggccaggg cactg 35

<210> 388

<211> 33

<212> DNA

<213> Artificial sequence

<400> 388

cttggcaccc gagaagatca gggcaccttg ggc 33

<210> 389

<211> 32

<212> DNA

<213> Artificial sequence

<400> 389

cttggcaccc gagaactgca acaccgcgag cc 32

<210> 390

<211> 35

<212> DNA

<213> Artificial sequence

<400> 390

cttggcaccc gagaacgctc tgcttacgtg ctgac 35

<210> 391

<211> 31

<212> DNA

<213> Artificial sequence

<400> 391

cttggcaccc gagaagccgc tgcagcagtc c 31

<210> 392

<211> 32

<212> DNA

<213> Artificial sequence

<400> 392

cttggcaccc gagaacgctg ttgccttggc ga 32

<210> 393

<211> 33

<212> DNA

<213> Artificial sequence

<400> 393

cttggcaccc gagaagccag ttgtagggag cga 33

<210> 394

<211> 35

<212> DNA

<213> Artificial sequence

<400> 394

cttggcaccc gagaacgaag aggtagaggc cctcg 35

<210> 395

<211> 32

<212> DNA

<213> Artificial sequence

<400> 395

cttggcaccc gagaagtccg ggctgagcgg at 32

<210> 396

<211> 35

<212> DNA

<213> Artificial sequence

<400> 396

cttggcaccc gagaagccct ccaccacggt tctat 35

<210> 397

<211> 33

<212> DNA

<213> Artificial sequence

<400> 397

cttggcaccc gagaagagtt cctcccagcc agc 33

<210> 398

<211> 34

<212> DNA

<213> Artificial sequence

<400> 398

cttggcaccc gagaagggac tggagggcgt agag 34

<210> 399

<211> 31

<212> DNA

<213> Artificial sequence

<400> 399

cttggcaccc gagaaacttc gcggcggctc a 31

<210> 400

<211> 34

<212> DNA

<213> Artificial sequence

<400> 400

cttggcaccc gagaaccaac tccacggttc ctgc 34

<210> 401

<211> 32

<212> DNA

<213> Artificial sequence

<400> 401

cttggcaccc gagaatgagg gcgaaggcct ga 32

<210> 402

<211> 34

<212> DNA

<213> Artificial sequence

<400> 402

cttggcaccc gagaaggtgg taccgatgag agcg 34

<210> 403

<211> 58

<212> DNA

<213> Artificial sequence

<400> 403

aatgatacgg cgaccaccga gatctacact ctttccctac acgacgctct tccgatct 58

<210> 404

<211> 24

<212> DNA

<213> Artificial sequence

<400> 404

caagcagaag acggcatacg agat 24

<210> 405

<211> 27

<212> DNA

<213> Artificial sequence

<400> 405

gtctcgtggg ctcggagatg tgtataa 27

Claims

1.一种测序文库构建方法，依次包括如下步骤：

(1)取DNA样本，用甲基化敏感限制性内切酶酶切；

所述接头混合物由n个接头组成；

每个接头均由一条上游引物甲和一条下游引物甲形成部分双链结构得到；上游引物甲中具有测序接头甲、随机标签、锚定序列甲和位于末端的碱基T；下游引物甲中具有锚定序列乙和测序接头乙；所述部分双链结构由锚定序列甲和锚定序列乙反向互补形成；

所述随机标签为8-14bp的随机碱基；

所述锚定序列甲长度为12-20bp，连续重复碱基≤3个；

n为≥8的任意自然数。

2.权利要求1所述方法构建得到的DNA文库。

3.一种用于构建测序文库的试剂盒，包括权利要求1中所述的接头混合物和甲基化敏感限制性内切酶。

4.一种用于检测DNA样本中肿瘤突变和/或甲基化的试剂盒，包括权利要求1中所述接头混合物和引物组合；所述引物组合由引物组Ⅰ、引物组Ⅱ、引物组Ⅲ、引物组Ⅳ、引物组Ⅴ、引物组Ⅵ、引物组Ⅶ和引物组Ⅷ组成；

所述引物组Ⅷ和所述引物组Ⅳ中，针对同一甲基化位点设计的两个引物为“巢式”关系；

所述肿瘤为肝脏恶性肿瘤；

所述引物组Ⅰ包括78个单链DNA分子，78个单链DNA分子的核苷酸序列依次如序列表的序列28至序列105所示；

所述引物组Ⅱ包括82个单链DNA分子，82个单链DNA分子的核苷酸序列依次如序列表的序列106至序列187所示；

所述引物组Ⅲ包括14个单链DNA分子，14个单链DNA分子的核苷酸序列依次如序列表的序列188至序列201所示；

所述引物组Ⅳ包括15个单链DNA分子，15个单链DNA分子的核苷酸序列依次如序列表的序列202至序列216所示；

所述引物组Ⅴ包括75个单链DNA分子，75个单链DNA分子依次包括如序列表的序列220至序列294自5’末端起第16位至3’末端所示的核苷酸序列；

所述引物组Ⅵ包括79个单链DNA分子，79个单链DNA分子依次包括如序列表的序列295至序列373自5’末端起第16位至3’末端所示的核苷酸序列；

所述引物组Ⅶ包括14个单链DNA分子，14个单链DNA分子依次包括如序列表的序列374至序列387自5’末端起第16位至3’末端所示的核苷酸序列；

所述引物组Ⅷ包括15个单链DNA分子，15个单链DNA分子依次包括如序列表的序列388至序列402自5’末端起第16位至3’末端所示的核苷酸序列。

5.权利要求4所述的引物组合。

6.S1)或S2)或S3)：

S1)权利要求4所述的引物组合在制备用于检测DNA样本中肿瘤突变和/或甲基化的试剂盒中的应用；

S2)权利要求4所述的引物组合在制备用于区分肿瘤患者血液样本和非肿瘤患者血液样本的产品中的应用；

S3)权利要求4所述试剂盒在制备用于区分肿瘤患者血液样本和非肿瘤患者血液样本的产品中的应用。

7.一种检测DNA样本中目标突变和/或甲基化的方法，包括如下步骤：

(1)按照权利要求1所述的方法构建文库；

所述步骤(2)中，采用引物组合甲进行第一轮PCR扩增；

引物组合甲由上游引物甲和下游引物组合甲组成；

所述上游引物甲为文库扩增引物，用于步骤(1)的文库扩增；

所述下游引物组合乙中的引物具有所述区段B且与下游引物组合甲中检测相同目标靶点的引物形成巢式关系；

所述方法为非疾病诊断和治疗的方法。

8.如权利要求7所述的方法，其特征在于：

所述DNA样本中目标突变的分析方法为：将测序数据满足标准甲的DNA分子回溯到一个分子簇；将满足标准乙的分子簇标记为一对duplex分子簇；对某一突变来说，如果满足下述(a1)或(a2)，则该突变为来自原始DNA样本的真实突变：(a1)至少有一对duplex分子簇支持；(a2)至少有4个分子簇支持；标准甲即同时满足①、②和③；①DNA***片段长度相同；②DNA***片段两端断点序列相同；③随机标签序列相同；标准乙即同时满足④、⑤和⑥；④DNA***片段长度相同且除突变点外序列一致；⑤分子簇两端的锚定序列相同但位置相反；⑥同一个起始DNA双链；

所述DNA样本中甲基化的分析方法为：将测序数据满足标准丙的DNA分子标记为一个簇，分别计算片段末端为关注酶切位点的簇的数量，记录为未甲基化的片段；计算扩增片段达到或超过第一个酶切位点的全部簇的数量，记录为片段总数；根据两种片段数量计算对应区域的平均甲基化水平；区域的甲基化水平＝(1-未甲基化片段数/片段总数)×100％；标准丙即同时满足⑦、⑧、⑨和⑩；⑦随机标签序列相同；⑧内置标签序列相同；⑨DNA***片段长度相同；⑩DNA***片段两端断点序列相同。

9.一种检测DNA样本中多种目标突变和/或甲基化的方法，包括如下步骤：

(1)按照权利要求1所述的方法构建文库；

(2)对步骤(1)的文库进行靶区域富集并进行测序，根据测序结果分析DNA样本中目标突变和/或甲基化的发生情况；

所述方法为非疾病诊断和治疗的方法。

10.如权利要求9所述的方法，其特征在于：