CN112176419B - 一种检测ctDNA中肿瘤特异基因的变异和甲基化的方法 - Google Patents

一种检测ctDNA中肿瘤特异基因的变异和甲基化的方法 Download PDF

Info

Publication number
CN112176419B
CN112176419B CN201910983038.8A CN201910983038A CN112176419B CN 112176419 B CN112176419 B CN 112176419B CN 201910983038 A CN201910983038 A CN 201910983038A CN 112176419 B CN112176419 B CN 112176419B
Authority
CN
China
Prior art keywords
dna
primer
sequence
artificial sequence
mutation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910983038.8A
Other languages
English (en)
Other versions
CN112176419A (zh
Inventor
焦宇辰
曲春枫
王宇婷
王沛
陈坤
宋欠欠
刘慧�
王京京
王思振
阎海
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Genetron Health Beijing Co ltd
Cancer Hospital and Institute of CAMS and PUMC
Original Assignee
Genetron Health Beijing Co ltd
Cancer Hospital and Institute of CAMS and PUMC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Genetron Health Beijing Co ltd, Cancer Hospital and Institute of CAMS and PUMC filed Critical Genetron Health Beijing Co ltd
Priority to CN201910983038.8A priority Critical patent/CN112176419B/zh
Priority to KR1020227016270A priority patent/KR20220088724A/ko
Priority to EP20876690.7A priority patent/EP4023795A4/en
Priority to PCT/CN2020/120560 priority patent/WO2021073490A1/zh
Priority to US17/768,891 priority patent/US20230272475A1/en
Priority to JP2022521219A priority patent/JP2022551688A/ja
Publication of CN112176419A publication Critical patent/CN112176419A/zh
Application granted granted Critical
Publication of CN112176419B publication Critical patent/CN112176419B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/1034Isolating an individual clone by screening libraries
    • C12N15/1093General methods of preparing gene libraries, not provided for in other subgroups
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/1034Isolating an individual clone by screening libraries
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/1034Isolating an individual clone by screening libraries
    • C12N15/1065Preparation or screening of tagged libraries, e.g. tagged microorganisms by STM-mutagenesis, tagged polynucleotides, gene tags
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6806Preparing nucleic acids for analysis, e.g. for polymerase chain reaction [PCR] assay
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • C12Q1/6886Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer
    • CCHEMISTRY; METALLURGY
    • C40COMBINATORIAL TECHNOLOGY
    • C40BCOMBINATORIAL CHEMISTRY; LIBRARIES, e.g. CHEMICAL LIBRARIES
    • C40B40/00Libraries per se, e.g. arrays, mixtures
    • C40B40/04Libraries containing only organic compounds
    • C40B40/06Libraries containing nucleotides or polynucleotides, or derivatives thereof
    • CCHEMISTRY; METALLURGY
    • C40COMBINATORIAL TECHNOLOGY
    • C40BCOMBINATORIAL CHEMISTRY; LIBRARIES, e.g. CHEMICAL LIBRARIES
    • C40B50/00Methods of creating libraries, e.g. combinatorial synthesis
    • CCHEMISTRY; METALLURGY
    • C40COMBINATORIAL TECHNOLOGY
    • C40BCOMBINATORIAL CHEMISTRY; LIBRARIES, e.g. CHEMICAL LIBRARIES
    • C40B50/00Methods of creating libraries, e.g. combinatorial synthesis
    • C40B50/06Biochemical methods, e.g. using enzymes or whole viable microorganisms
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6844Nucleic acid amplification reactions
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/118Prognosis of disease development
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/154Methylation markers
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/156Polymorphic or mutational markers

Abstract

本发明公开了一种检测ctDNA中肿瘤特异基因的变异和甲基化的方法,该方法可以在一份样本中同时检测ctDNA中的肿瘤特异基因的变异(包括点突变、***缺失突变、HBV整合等多种突变形式)和/或甲基化的方法,不仅样本量需求低,而且该方法制备的MC文库可以支持10‑20次的后续检测,每次检测的结果都可以代表全部原始ctDNA标本的突变状况及酶切位点覆盖区域的甲基化修饰情况,且不会造成灵敏度和特异性的降低。本发明对肿瘤早期筛查、病情追踪、疗效评估、预后预测等具有重要的临床意义,有重大的应用价值。

Description

一种检测ctDNA中肿瘤特异基因的变异和甲基化的方法
技术领域
本发明属于生物医学领域,具体涉及一种检测ctDNA中肿瘤特异基因的变异和甲基化的方法。
背景技术
循环肿瘤DNA(circulating tumor DNA,ctDNA)来源于肿瘤细胞的凋亡、坏死或分泌产生的DNA片段,含有与肿瘤组织DNA相同的基因变异和表观修饰,如点突变、基因重排、融合、拷贝数变异、甲基化修饰等。ctDNA的检测可以应用于癌症早期筛查、诊断和分期、指导靶向用药、疗效评估、复发监测等各方面。结合ctDNA携带的肿瘤特异基因的变异和甲基化两方面信息,有助于提高检测的灵敏度和特异性,更早发现癌症踪迹,对于肿瘤早筛有重要意义。
现有的基因变异检测和甲基化检测需要遵循不同的技术路线。ctDNA基因变异的检测,由于受到ctDNA在cfDNA中占比较低的限制,实质上是低频突变的检测,现有技术分为两类:1)基于PCR的热点突变检测法,通常检测一个或几个热点突变或已知突变,无法检测基因融合等复杂突变,无法检测未知突变,覆盖范围较小;2)捕获测序法:适合多重靶标检测,包括复杂突变,但捕获试剂盒一般价格昂贵、操作复杂、耗时较长。在应用过程中,需要根据靶标的数量和特性,选取适合的检测方法。ctDNA甲基化标志物的优点在于成簇分布,与基因变异相比特异性更高,具有组织特异性,可以追溯肿瘤来源,标志物数量更多,可以达到更高的灵敏度;其检测方法包括:1)甲基化PCR,由于重亚硫酸盐转化步骤造成DNA损失及序列多样性降低,这种方法难以实现多重靶标检测;2)基于探针杂交的甲基化捕获:可覆盖8%-13%的CpG位点,同时检测大量标志物,但受到有限的ctDNA起始量的限制,并且经重亚硫酸盐处理后,基因组序列丰富度下降,探针特异性不易保证;3)基于MspI酶切的RRBS(Reduced representation bisulfite sequencing,RRBS),它所覆盖的CpG位点由酶切位点“CCGG”决定,约占8%-10%的CpG位点,对甲基化C碱基的识别同样依赖于重亚硫酸盐转化。RRBS检测的甲基化位点集中在CpG岛和启动子区,成本较低。上述3种方法甲基化PCR覆盖位点有限;甲基化捕获可覆盖较多位点,相比RRBS数据更稳定;RRBS成本最低,也可以覆盖大量甲基化位点,在应用过程中需要根据靶标的数量和特性进行取舍。
目前没有简单、低成本和可靠的方案,实现同时检测ctDNA中的基因变异和甲基化这两种重要的肿瘤特异标志物。主要存在以下困难:1)一次抽血获得ctDNA标本量有限,通常仅够支持1-2次检测,这就造成ctDNA临床检测中通常是单平台、一次性的,难以在一份样本中同时实现突变检测和甲基化检测,尤其是依赖于重亚硫酸盐转化的甲基化检测技术,处理过程中会造成较多的DNA损失;2)甲基化检测技术的重亚硫酸盐转化步骤,将导致DNA序列无法呈现大部分突变信息,这部分DNA携带信息的损失可能会导致低频突变检测灵敏度的降低;3)临床检测中经常需要根据首次检测的结果判断后续检测的目标和方案,这就需要在后续检测中重新抽血,检测周期延长;另外,ctDNA相关临床检测或研究中经常需要比较多种技术的优劣,这就需要数倍于正常抽血量的标本,患者通常无法接受;4)无论是PCR法还是捕获法,扩增过程中产生的噪音突变会严重干扰ctDNA低频突变的检测,造成假阳性结果,误导患者的诊断和治疗;5)ctDNA突变含量低,操作过程中易发生污染,造成假阳性结果。
发明内容
本发明的目的是同时检测ctDNA中多种肿瘤特异基因的变异和/或甲基化。
本发明首先保护一种测序文库构建方法,可依次包括如下步骤:
(1)取DNA样本,用甲基化敏感限制性内切酶酶切;
(2)将步骤(1)酶切后的DNA样本依次进行末端修复和3’端加A处理;
(3)将步骤(2)处理后的DNA样本与接头混合物中的接头连接,经过PCR扩增后得到文库;
所述接头混合物由n个接头组成;
每个接头均由一条上游引物甲和一条下游引物甲形成部分双链结构得到;上游引物甲中具有测序接头甲、随机标签、锚定序列甲和位于末端(如3’末端)的碱基T;下游引物甲中具有锚定序列乙和测序接头乙;所述部分双链结构由锚定序列甲和锚定序列乙反向互补形成;
所述测序接头甲和测序接头乙为根据不同测序平台选择对应的测序接头;
所述随机标签为8-14bp(如8-10bp、10-14bp、8bp、10bp或14bp)的随机碱基;
所述锚定序列甲长度为12-20bp(如12-16bp、16-20bp、12bp、16bp或20bp),连续重复碱基≤3个;
n个接头采用n个不同的锚定序列甲,且每个锚定序列甲中四种碱基平衡,错配碱基数>3;
n为≥8的任意自然数。
通常,建库用的接头由两条序列退火而成,呈“Y”型结构,两条序列间互补配对的部分(即锚定序列甲和锚定序列乙)称之为锚定序列。所述锚定序列可作为序列固定的内置标签,用于标记原始模板分子。
所述锚定序列不与引物其它部分相互作用(如形成发卡结构、二聚体等)。
所述上游引物甲自5’端依次可包括测序接头甲、随机标签、锚定序列甲和碱基T。
所述上游引物甲自5’端依次可由测序接头甲、随机标签、锚定序列甲和碱基T组成。
所述下游引物甲自5’端依次可包括锚定序列乙和测序接头乙。
所述下游引物甲自5’端依次可由锚定序列乙和测序接头乙组成。
所述“每个锚定序列甲中四种碱基平衡”即A、T、C和G均匀分布。
所述“错配碱基数>3”可为所述接头混合物包含n个锚定序列甲,各个锚定序列甲之间的碱基至少有3个不同。该不同可为位置不同或顺序不同。
所述DNA样本可为基因组DNA、cDNA、ct DNA或cf DNA样本。
所述n具体可为12。
所述随机标签具体可为8bp的随机碱基。
所述锚定序列甲长度具体可为12bp。
当n=12时,所述锚定序列甲的核苷酸序列具体分别可为序列表的序列1自5’端第30-41位、序列表的序列3自5’端第30-41位、序列表的序列5自5’端第30-41位、序列表的序列7自5’端第30-41位、序列表的序列9自5’端第30-41位、序列表的序列11自5’端第30-41位、序列表的序列13自5’端第30-41位、序列表的序列15自5’端第30-41位、序列表的序列17自5’端第30-41位、序列表的序列19自5’端第30-41位、序列表的序列21自5’端第30-41位、序列表的序列23自5’端第30-41位所示。
所述测序接头甲具体可为来自Illumina公司的Truseq测序试剂盒的测序接头。所述测序接头甲具体可如序列表的序列1自5’端第1-29位所示。
所述测序接头乙具体可为来自Illumina公司的nextera测序试剂盒的测序接头。所述测序接头乙具体可如序列表的序列2自5’端第13-41位所示。
当n=12时,所述12个接头如下:
接头1可由序列表的序列1所示的单链DNA分子和序列2所示的单链DNA分子形成部分双链结构得到;接头2可由序列表的序列3所示的单链DNA分子和序列4所示的单链DNA分子形成部分双链结构得到;接头3可由序列表的序列5所示的单链DNA分子和序列6所示的单链DNA分子形成部分双链结构得到;接头4可由序列表的序列7所示的单链DNA分子和序列8所示的单链DNA分子形成部分双链结构得到;接头5可由序列表的序列9所示的单链DNA分子和序列10所示的单链DNA分子形成部分双链结构得到;接头6可由序列表的序列11所示的单链DNA分子和序列12所示的单链DNA分子形成部分双链结构得到;接头7可由序列表的序列13所示的单链DNA分子和序列14所示的单链DNA分子形成部分双链结构得到;接头8可由序列表的序列15所示的单链DNA分子和序列16所示的单链DNA分子形成部分双链结构得到;接头9可由序列表的序列17所示的单链DNA分子和序列18所示的单链DNA分子形成部分双链结构得到;接头10可由序列表的序列19所示的单链DNA分子和序列20所示的单链DNA分子形成部分双链结构得到;接头11可由序列表的序列21所示的单链DNA分子和序列22所示的单链DNA分子形成部分双链结构得到;接头12可由序列表的序列23所示的单链DNA分子和序列24所示的单链DNA分子形成部分双链结构得到。
所述接头可以通过将上游引物甲和下游引物甲进行退火得到。
所述接头混合物中,每个接头可等摩尔混合。
所述方法还可包括对步骤(3)得到的文库进行扩增的步骤。所述扩增的引物是根据接头序列设计的,即所述扩增的引物至少要有一段序列与接头的某段序列完全一致。所述扩增采用的引物对具体可由序列表的序列25和序列26所示的两条单链DNA分子组成。
序列表的序列25所示的单链DNA分子即为测序接头甲自5’端第1至19位。
序列表的序列26所示的单链DNA分子即为测序接头乙自3’端第1至22位。
本发明还保护以上所述的方法构建得到的DNA文库。
本发明还保护一种用于构建测序文库的试剂盒,可包括上述任一所述的接头混合物和甲基化敏感限制性内切酶。
所述用于构建测序文库的试剂盒具体可由上述任一所述的接头混合物和甲基化敏感限制性内切酶组成。
本发明还保护一种用于检测DNA样本中肿瘤突变和/或甲基化的试剂盒,包括上述任一所述接头混合物和引物组合;所述引物组合包括引物组Ⅰ、引物组Ⅱ、引物组Ⅲ、引物组Ⅳ、引物组Ⅴ、引物组Ⅵ、引物组Ⅶ和引物组Ⅷ;
所述引物组Ⅰ和所述引物组Ⅱ中的各个引物是根据与肿瘤突变相关的区域设计的特异性引物,作用是定位于基因组特定位置,实现目标区域的PCR富集;所述引物组Ⅰ和所述引物组Ⅱ分别从正负两个方向检测突变位点;
所述引物组Ⅲ和所述引物组Ⅳ中的各个引物是根据肿瘤特异高甲基化区域设计的特异性引物,作用是定位于基因组特定位置,实现目标区域的PCR富集;所述引物组Ⅲ和所述引物组Ⅳ分别从正负两个方向检测甲基化位点;
所述引物组Ⅴ、所述引物组Ⅵ、所述引物组Ⅶ和所述引物组Ⅷ中的各个引物均包括接头序列和特异序列,特异序列用于目标区域进行进一步富集;
所述引物组Ⅴ和所述引物组Ⅰ中,针对同一突变位点设计的两个引物为“巢式”关系;
所述引物组Ⅵ和所述引物组Ⅱ中,针对同一突变位点设计的两个引物为“巢式”关系;
所述引物组Ⅶ和所述引物组Ⅲ中,针对同一甲基化位点设计的两个引物为“巢式”关系;
所述引物组Ⅷ和所述引物组Ⅳ中,针对同一甲基化位点设计的两个引物为“巢式”关系。
所述“根据与肿瘤突变相关的区域设计的特异性引物”具体可为根据肿瘤特异基因变异(如点突变、***缺失突变、HBV整合等多种突变形式)的区域,设计对应的基因特异引物。
所述“根据肿瘤特异高甲基化区域设计的特异性引物”具体可为根据肿瘤特异甲基化区域,设计对应的基因特异引物。
所述试剂盒中,所述肿瘤可为肝脏恶性肿瘤,即肝细胞癌。
所述与肝细胞癌突变相关的区域具体可为肝细胞癌高频突变基因(TP53、CTNNB1、AXIN1、TERT)的相关区域和针对HBV整合热点区域。
上述任一所述试剂盒中,所述引物组Ⅰ包括78个单链DNA分子,78个单链DNA分子的核苷酸序列依次如序列表的序列28至序列105所示。所述引物组Ⅱ包括82个单链DNA分子,82个单链DNA分子的核苷酸序列依次如序列表的序列106至序列187所示。所述引物组Ⅲ包括14个单链DNA分子,14个单链DNA分子的核苷酸序列依次如序列表的序列188至序列201所示。所述引物组Ⅳ包括15个单链DNA分子,15个单链DNA分子的核苷酸序列依次如序列表的序列202至序列216所示。所述引物组Ⅴ包括75个单链DNA分子,75个单链DNA分子依次包括如序列表的序列220至序列294自5’末端起第16位至3’末端所示的核苷酸序列。所述引物组Ⅵ包括79个单链DNA分子,79个单链DNA分子依次包括如序列表的序列295至序列373自5’末端起第16位至3’末端所示的核苷酸序列。所述引物组Ⅶ包括14个单链DNA分子,14个单链DNA分子依次包括如序列表的序列374至序列387自5’末端起第16位至3’末端所示的核苷酸序列。所述引物组Ⅷ包括15个单链DNA分子,15个单链DNA分子依次包括如序列表的序列388至序列402自5’末端起第16位至3’末端所示的核苷酸序列。
所述引物组Ⅴ中75个单链DNA分子的核苷酸序列依次可如序列表的序列220至序列294所示。所述引物组Ⅵ中79个单链DNA分子的核苷酸序列依次可如序列表的序列295至序列373所示。所述引物组Ⅶ中14个单链DNA分子的核苷酸序列依次可如序列表的序列374至序列387所示。所述引物组Ⅷ中15个单链DNA分子的核苷酸序列依次可如序列表的序列388至序列402所示。
所述引物组Ⅰ具体可由所述78个单链DNA分子组成。
所述引物组Ⅱ具体可由所述82个单链DNA分子组成。
所述引物组Ⅲ具体可由其所述14个单链DNA分子组成。
所述引物组Ⅳ具体可由其所述15个单链DNA分子组成。
所述引物组Ⅴ具体可由所述75个单链DNA分子组成。
所述引物组Ⅵ具体可由所述79个单链DNA分子组成。
所述引物组Ⅶ具体可由其所述14个单链DNA分子组成。
所述引物组Ⅷ具体可由其所述15个单链DNA分子组成。
上述任一所述试剂盒具体可由上述任一所述接头混合物和所述引物组合组成。
上述任一所述引物组合具体可由所述引物组Ⅰ、所述引物组Ⅱ、所述引物组Ⅲ、所述引物组Ⅳ、所述引物组Ⅴ、所述引物组Ⅵ、所述引物组Ⅶ和所述引物组Ⅷ组成。
上述任一所述试剂盒还可包括用于DNA提取的试剂、用于DNA建库的试剂、用于文库纯化的试剂、用于文库捕获的试剂等用于文库构建的材料。
本发明还保护上述任一所述引物组合。所述引物组合的用途可为检测DNA样本中肿瘤突变和/或甲基化。
本发明还保护S1)或S2)或S3):
S1)上述任一所述的引物组合在制备用于检测DNA样本中肿瘤突变和/或甲基化的试剂盒中的应用;
S2)上述任一所述的引物组合在区分肿瘤患者血液样本和非肿瘤患者血液样本中的应用;
S3)上述任一所述试剂盒在区分肿瘤患者血液样本和非肿瘤患者血液样本中的应用。
上述应用中,所述肿瘤可为肝脏恶性肿瘤,即肝细胞癌。
本发明还保护一种检测DNA样本中目标突变和/或甲基化的方法,可包括如下步骤:
(1)按照上述任一所述的方法构建文库;
(2)对步骤(1)得到的文库进行两轮巢式PCR扩增,对产物进行测序,根据测序结果分析DNA样本中目标突变和/或甲基化发生情况;
所述步骤(2)中,采用引物组合甲进行第一轮PCR扩增;
引物组合甲由上游引物甲和下游引物组合甲组成;
所述上游引物甲为文库扩增引物,用于步骤(1)的文库扩增;
所述下游引物组合甲为根据X个目标靶点设计的Y条引物的组合;X和Y均为1以上的自然数,且X≤Y;
以第一轮PCR的产物为模板,采用引物组合乙进行第二轮PCR扩增;
引物组合乙由上游引物乙、下游引物组合乙和index引物组成;
所述上游引物乙为文库扩增引物且3’末端与所述上游引物甲部分相同,用于第一轮PCR的产物的扩增;
所述index引物自5’端包括用于测序的区段A、用于区分样本的index序列和用于测序的区段B;
所述下游引物组合乙中的引物具有所述区段B且与下游引物组合甲中检测相同目标靶点的引物形成巢式关系。
所述上游引物乙的核苷酸序列可如序列表的序列217所示。
所述index引物自5’端具体可由所述区段A、所述index序列和所述区段B组成。
所述区段A的核苷酸序列可如序列表的序列218所示。
所述区段B的核苷酸序列可如序列表的序列219所示。
所述上游引物甲的部分序列与“每个接头的上游引物甲的测序接头甲”的序列完全相同。
所述上游引物乙用于补全文库分子的接头序列,使得扩增产物可以直接进行测序。所述上游引物乙和所述上游引物甲(第一轮PCR扩增使用的引物)的部分核苷酸序列完全相同。
所述上游引物甲的核苷酸序列具体可如序列表的序列27所示。
所述上游引物乙的核苷酸序列具体可如序列表的序列188所示。
当所述目标突变为肝细胞癌突变时,所述下游引物组合甲由上述任一所述引物组Ⅰ和引物组Ⅱ组成。所述下游引物组合乙由上述任一所述引物组Ⅴ和引物组Ⅵ组成。使用引物组Ⅰ和引物组Ⅱ分别对模板进行第一轮PCR扩增。使用引物组Ⅰ进行扩增的产物作为第二轮扩增的模板采用引物组Ⅴ进行扩增。使用引物组Ⅱ进行扩增的产物作为第二轮扩增的模板采用引物组Ⅵ进行扩增。最后将扩增产物等体积混合。
当所述目标甲基化为肝细胞癌甲基化时,所述下游引物组合甲由上述任一所述引物组Ⅲ和引物组Ⅳ组成。所述下游引物组合乙由上述任一所述引物组Ⅶ和引物组Ⅷ组成。
使用引物组Ⅲ和引物组Ⅳ分别对模板进行第一轮PCR扩增。使用引物组Ⅲ进行扩增的产物作为第二轮扩增的模板采用引物组Ⅶ进行扩增。使用引物组Ⅳ进行扩增的产物作为第二轮扩增的模板采用引物组Ⅷ进行扩增。最后将扩增产物等体积混合。
上述方法中,所述DNA样本中目标突变的分析方法可为:将测序数据满足标准甲的DNA分子回溯到一个分子簇;将满足标准乙的分子簇标记为一对duplex分子簇;对某一突变来说,如果满足下述(a1)或(a2),则该突变为来自原始DNA样本的真实突变:(a1)至少有一对duplex分子簇支持;(a2)至少有4个分子簇支持;标准甲即同时满足①、②和③;①DNA***片段长度相同;②DNA***片段两端断点序列相同;③随机标签序列相同;标准乙即同时满足④、⑤和⑥;④DNA***片段长度相同且除突变点外序列一致;⑤分子簇两端的锚定序列相同但位置相反;⑥同一个起始DNA双链。
上述方法中,所述DNA样本中甲基化的分析方法可为:将测序数据满足标准丙的DNA分子标记为一个簇,分别计算片段末端为关注酶切位点的簇的数量,记录为未甲基化的片段;计算扩增片段达到或超过第一个酶切位点的全部簇的数量,记录为片段总数;根据两种片段数量计算对应区域的平均甲基化水平;区域的甲基化水平=(1-未甲基化片段数/片段总数)×100%;标准丙即同时满足⑦、⑧、⑨和⑩;⑦随机标签序列相同;⑧内置标签序列相同;⑨DNA***片段长度相同;⑩DNA***片段两端断点序列相同。
本发明还保护一种检测DNA样本中多种目标突变和/或甲基化的方法,可包括如下步骤:
(1)按照上述任一所述的方法构建文库;
(2)对步骤(1)的文库进行靶区域富集并进行测序,根据测序结果分析DNA样本中目标突变和/或甲基化的发生情况。
上述方法中,所述DNA样本中目标突变的分析方法可为:将测序数据满足标准甲的DNA分子回溯到一个分子簇;将满足标准乙的分子簇标记为一对duplex分子簇;对某一突变来说,如果满足下述(a1)或(a2),则该突变为来自原始DNA样本的真实突变:(a1)至少有一对duplex分子簇支持;(a2)至少有4个分子簇支持;标准甲即同时满足①、②和③;①DNA***片段长度相同;②DNA***片段两端断点序列相同;③随机标签序列相同;标准乙即同时满足④、⑤和⑥;④DNA***片段长度相同且除突变点外序列一致;⑤分子簇两端的锚定序列相同但位置相反;⑥同一个起始DNA双链。
上述方法中,所述DNA样本中甲基化的分析方法可为:将测序数据满足标准丙的DNA分子标记为一个簇,分别计算片段末端为关注酶切位点的簇的数量,记录为未甲基化的片段;计算扩增片段达到或超过第一个酶切位点的全部簇的数量,记录为片段总数;根据两种片段数量计算对应区域的平均甲基化水平;区域的甲基化水平=(1-未甲基化片段数/片段总数)×100%;标准丙即同时满足⑦、⑧、⑨和⑩;⑦随机标签序列相同;⑧内置标签序列相同;⑨DNA***片段长度相同;⑩DNA***片段两端断点序列相同。
所述靶区域富集可采用现有商购的靶向捕获试剂盒(例如Agilent sureselectXT靶向捕获试剂盒,Agilent5190-8646)进行,将其中最后一步PCR扩增的引物对更换为由引物甲和引物乙组成的引物对。所述引物甲的核苷酸序列可如序列表的序列403所示。所述引物乙可包括区段甲、index序列和区段乙。所述引物乙具体可由所述区段甲、所述index序列和所述区段乙组成。所述区段甲的核苷酸序列可如序列表的序列404所示。所述区段乙的核苷酸序列可如序列表的序列405所示。
上述任一所述方法中,所述目标突变和/或甲基化可为肿瘤突变和/或甲基化。所述肿瘤可为肝脏恶性肿瘤,即肝细胞癌。
上文中,通常多个不同样本的文库会混合在一起测序,所述index序列用于标记不同的样本。测序完成后,根据不同的index序列对总的测序数据进行拆分。Index的设计原则与之前描述的锚定序列的设计原则基本相似。
上文中,DNA样本用甲基化敏感限制性内切酶酶切后,形成DNA片段(此时的DNA片段两端均形成粘末端,末端的单链部分的核苷酸序列即为断点序列);DNA片段进行末端修复后与接头连接(5’末端和3’末端各连接一个接头,可能是相同接头也可能是相反接头),对于此时的DNA分子来说,两个接头之间的DNA片段即为DNA***片段。
本发明提供了一种可以在一份样本中(不少于2mL的血浆)同时检测ctDNA中的肿瘤特异基因的变异(包括点突变、***缺失突变、HBV整合等多种突变形式)和/或甲基化的方法,不仅样本量需求低,而且该方法制备的MC文库可以支持10-20次的后续检测,每次检测的结果都可以代表全部原始ctDNA标本的突变状况及酶切位点覆盖区域的甲基化修饰情况,且不会造成灵敏度和特异性的降低。使用该方法构建的文库可以同时用于PCR的热点检测和捕获法测序,加入的DNA barcode可以有效滤除假阳性结果,实现基于duplex高特异性测序。同时,文库的构建方法不仅适用于cfDNA样本,也适用于基因组DNA或cDNA样本。本发明对肿瘤早期筛查、病情追踪、疗效评估、预后预测等具有重要的临床意义,有重大的应用价值。
附图说明
图1为adapter和引物架构示意图。
图2为RaceSeq靶区富集和文库构建示意图。
图3为MC文库进行捕获和进行duplex测序的示意图。
图4为Padlock方法和突变/甲基化共检法(即本发明提供的方法)对AK055957基因的甲基化水平检测结果。
图5为单独检测突变法和突变/甲基化共检法检测突变和突变频率的结果。
具体实施方式
以下的实施例便于更好地理解本发明,但并不限定本发明。
下述实施例中的实验方法,如无特殊说明,均为常规方法。
下述实施例中所用的试验材料,如无特殊说明,均为自常规生化试剂商店购买得到的。
以下实施例中的定量试验,均设置三次重复实验,结果取平均值。
下述实施例中的TE缓冲液为ThermoFisher公司的产品,产品目录号为12090015。
下述实施例中,肝细胞癌患者对本发明进行的内容均知情同意。
实施例1、MC文库的构建
一、甲基化敏感限制性内切酶酶切
取5-40ng cfDNA,按照表1所示配置反应体系,然后按照表2的程序在PCR仪进行酶切处理,得到酶切产物(4℃保存)。
Restriction Enzyme和Restriction Enzyme 10×Buffer均为ThermoFisher公司的产品。Restriction Enzyme和Restriction Enzyme 10×Buffer可以根据不同的待测靶标区域进行选择,选择标准为在待测区域内含有至少1个该甲基化敏感限制性内切酶的酶切位点。
表1.反应体系
成分 体积
cfDNA 16.8μl
Restriction Enzyme 10×Buffer 2μl
Acetylated BSA(浓度为10μg/μl) 0.2μl
Restriction Enzyme(浓度为10U/μl) 1μl
总体积 20μl
表2.反应程序
温度 时间
37℃ 2h
二、酶切产物的纯化
取步骤一得到的酶切产物,采用Apostle MiniMaxTM高效游离DNA富集分离试剂盒(标准版)(Apostle公司的产品,产品目录号为A17622-50)进行纯化、富集,得到纯化产物。
三、纯化产物的平末端修复和加A处理
取步骤二得到的纯化产物,按照表3所示配置反应体系,然后按照表4的反应程序在PCR仪进行末端修复及3’末端加A处理,得到反应产物(4℃保存)。
表3.反应体系
成分 体积
纯化产物 50μl
End Repair&A-Tailing Buffer(KAPA KK8505) 7μl
End Repair&A-Tailing Enzyme Mix(KAPA KK8505) 3μl
总体积 60μl
表4.反应程序
Figure BDA0002235814990000081
Figure BDA0002235814990000091
四、反应产物与adapter连接
按照表5配置反应体系,20℃反应15min,得到连接产物(4℃保存)。
表5.反应体系
成分 体积
步骤三得到的反应产物 60μl
Adapter Mix(50μM) 1.5μl
DNase/RNase-Free Water 8.5μl
Ligation Buffer(KAPA KK8505) 30μl
DNA Ligase(KAPA KK8505) 10μl
总体积 110μl
Adapter序列信息见表6。
分别将表6中的单链DNA分子用TE缓冲液溶解并稀释至浓度为100μM。将同一组中的两条单链DNA分子等体积混合(各50μl),然后进行退火(退火程序:95℃,15min;25℃,2h),得到12组DNA溶液,将12组DNA溶液等体积混合,得到Adapter Mix。
表6.Adapter序列信息
Figure BDA0002235814990000092
Figure BDA0002235814990000101
表6中,8个N表示8bp的随机标签。实际应用中,随机标签长度可为8-14bp。
下划线表示12bp的锚定序列,每一组的上游序列(名称中含有“F”的为上游序列)和下游序列(名称中含有“R”的为下游序列)中,下划线部分反向互补,通过退火可使上游序列和下游序列结合在一起形成接头。同时,锚定序列可作为序列固定的内置标签,用于标记原始模板分子。实际应用中,锚定序列长度可为12-20bp,连续重复碱基不超过3个,且不能与引物其它部分相互作用(如形成发卡结构、二聚体等),12组每一个位置碱基平衡(即A、T、C和G均匀分布),错配碱基数>3(即各个锚定序列之间的碱基至少有3个不同;不同可为位置不同或顺序不同)。
上游序列中末端加粗的T与原始分子末端加的“A”互补,进行TA连接。
上游序列中,自5’端第1至21位(来自Illumina公司的Truseq测序试剂盒)为测序引物结合序列,其中,自5’端第1至19位为文库扩增引物部分。
下游序列中,非下划线部分(来自Illumina公司的nextera测序试剂盒)为测序引物结合序列,其中,自3’端第1至22位为文库扩增引物的部分。
表6中共包含12组接头,可以形成12×12=144种标记组合,结合分子本身的序列信息,足以区分原始样品中的所有分子,实际应用中也可适当增加(合成成本增高)或减少(区分效果略弱)组数。
连接产物结构如图1所示。其中,a为接头部分,b和f分别为文库扩增引物,c为8bp随机标签(表6中的8个N表示),d为12bp锚定序列(表6中的下划线表示),e为***片段(cfDNA)。
五、连接产物纯化
向步骤四得到的连接产物中加入110-220μl(即1-2倍体积)的AMPure XP磁珠(贝克曼A63880),涡旋混匀,室温放置10min,磁力架吸附5min;待溶液澄清后弃上清,然后加入200μl 80%(体积百分含量)乙醇水溶液清洗2次,弃上清;待乙醇晾干后,加入30μl DNase/RNase-Free Water,涡旋混匀,室温放置10min,磁力架吸附5min,吸取上清溶液至PCR管内,作为PCR模板。
六、文库扩增及纯化
1、取步骤五得到的PCR模板,按照表7配置反应体系,按照表8进行PCR扩增,得到PCR扩增产物(4℃保存)。
表7.反应体系
成分 体积
HIFI(KAPA KK8505) 35μl
MC_F(33μM) 2.5μl
MC_R(33μM) 2.5μl
PCR模板 30μl
总体积 70μl
表7中,引物信息如下:
MC_F(序列25):5’-GACACGACGCTCTTCCGAT-3’;
MC_R(序列26):5’-GTGGGCTCGGAGATGTGTATAA-3’。
表8.反应程序
Figure BDA0002235814990000111
2、向步骤1得到的PCR扩增产物中加入70-140μl(即1-2倍体积)的AMPure XP磁珠,涡旋混匀,室温放置10min,磁力架吸附5min;待溶液澄清后弃上清,然后加入200μl 80%(体积百分含量)乙醇水溶液清洗2次,弃上清;待乙醇晾干后,加入100μlDNase/RNase-FreeWater,涡旋混匀,室温放置10min,磁力架吸附5min,吸取上清溶液,得到产物(-20℃储存)。产物即为可长期保存、反复使用的MC文库。
经检测,MC文库可以支持10-20次的后续检测,每次检测的结果都可以代表全部原始样本的突变状况及酶切位点覆盖区域的甲基化修饰情况,不会造成灵敏度和特异性的降低。同时,文库的构建方法不仅适用于cfDNA样本,也适用于基因组DNA或cDNA样本。
实施例2、RaceSeq富集靶区并构建测序文库
如图2所示,使用针对我国肝细胞癌高频突变基因(TP53、CTNNB1、AXIN1、TERT)的相关区域、HBV整合热点区域和肝细胞癌特异高甲基化区域(EMX1、LRRC4、BDH1等)设计的引物,和固定引物配合,对MC文库进行两轮PCR扩增,扩增产物即为测序文库。
图2中,a为第一轮文库扩增上游引物,b为第二轮文库扩增上游引物,c为第一轮文库扩增下游引物库,用于特异目标序列富集,d为第二轮文库扩增下游引物库,用于特异目标序列富集,e为index primer,用于添加index序列。
1、取300ng实施例1制备的MC文库,分为两份,配置表9的反应体系(一份加入GSP1Amix,另一份加入GSP1B mix),按照表11的反应程序进行第一轮PCR扩增,得到第一轮扩增产物(共得到两份第一轮扩增产物,一份为GSP1A mix的扩增产物,一份为GSP1B mix的扩增产物)。
表9.反应体系
Figure BDA0002235814990000112
Figure BDA0002235814990000121
表9中,引物信息如下:
上游引物1355(序列27):5’-TCTTTCCCTACACGACGCTCTTCCGAT-3’。
GSP1A mix:将表10中属于引物池GSP1A中的各条引物用TE缓冲液溶解并稀释至浓度为100μM,然后等体积混合,用TE缓冲液稀释至0.3μM。引物池GSP1A中的引物用于扩增模板的正链。
GSP1B mix:将表10中属于引物池GSP1B中的各条引物用TE缓冲液溶解并稀释至浓度为100μM,然后等体积混合,用TE缓冲液稀释至0.3μM。引物池GSP1B中的引物用于扩增模板的负链。
引物池GSP1A和引物池GSP1B中,相同编号的引物(即引物编号的后四位相同)从正负两个方向检测同一突变位点,同时使用可最大限度的富集原始分子信息。
表10.引物信息
Figure BDA0002235814990000122
Figure BDA0002235814990000131
Figure BDA0002235814990000141
Figure BDA0002235814990000151
Figure BDA0002235814990000161
Figure BDA0002235814990000171
表11.反应程序
Figure BDA0002235814990000172
2、分别将步骤1得到的两份第一轮扩增产物用30-60μl(即1-2倍体积)的AMPureXP磁珠进行纯化,然后用25μlDNase/RNase-Free Water洗脱,得到第一轮纯化产物。
3、分别以步骤2得到的第一轮纯化产物为模板,配置表12的反应体系(采用GSP1Amix扩增产物作为模板时,采用GSP2A mix扩增;采用GSP1Bmix扩增产物作为模板时,采用GSP2B mix扩增),按照表14的反应程序进行第二轮PCR扩增,得到第二轮扩增产物(4℃保存)。
表12.反应体系
成分 体积
KapaHifi 15μl
上游引物3355 2μl
GSP2Amix/GSP2Bmix 1μl
Index引物(10μM) 2μl
模板(GSP1A mix/GSP1Bmix) 10μl
总体积 30μl
表12中,引物信息如下:
上游引物3355(序列217):5’-AATGATACGGCGACCACCGAGATCTACACTCTTTCCCTACACG ACGCTCT-3’;下划线部分为第一轮的上游引物1355相同的部分,3355及1355均为Illumina测序平台测序的固定序列(也可更换为可在其他测序平台测序的序列)。
GSP2A mix:将表13中属于引物池GSP2A中的各条引物用TE缓冲液溶解并稀释至浓度为100μM,然后等体积混合,用TE缓冲液稀释至0.3μM。引物池GSP2A中的引物用于扩增模板的正链。
GSP2B mix:将表13中属于引物池GSP2B中的各条引物用TE缓冲液溶解并稀释至浓度为100μM,然后等体积混合,用TE缓冲液稀释至0.3μM。引物池GSP2B中的引物用于扩增模板的负链。
表13中,自5’端第1至15位为与Index引物结合的部分。
GSP2A mix与GSP1A mix中引物编号相同的引物(即引物编号的后四位相同)为针对同一突变位点设计,两条引物形成巢式关系。
GSP2B mix与GSP2A mix中引物编号相同的引物(即引物编号的后四位相同)为针对同一突变位点设计,两条引物形成巢式关系。
Index引物:5’-CAAGCAGAAGACGGCATACGAGAT(序列218)********GTGACTGGAGTTCCTTGGCACCCGAGAA-3’(序列219);下划线部分为与GSP2 mix结合的部分。********为index序列位置,index的长度为6-8bp,作用是区分样本间的序列,方便多个样本混合测序。除index序列外,其余都是来自Illumina的small RNA测序试剂盒的固定序列。
表13.引物信息
Figure BDA0002235814990000181
Figure BDA0002235814990000191
Figure BDA0002235814990000201
Figure BDA0002235814990000211
Figure BDA0002235814990000221
注:NA表示无引物。
表14.反应程序
Figure BDA0002235814990000222
Figure BDA0002235814990000231
4、步骤3得到的采用GSP2A mix进行第二轮扩增的产物和采用GSP1B mix进行第二轮扩增的产物等体积混合,利用AMPure XP磁珠按1:(1-2)的比例进行纯化,然后用50μlDNase/RNase-Free Water洗脱,得到第二轮纯化产物,即为可以在Illumina Hiseq X平台测序的测序文库。
MC文库上的DNA随机标签与cfDNA序列一起被添加到测序文库的Read1序列下游。在测序中,依次获得DNA随机标签序列、锚定序列、cfDNA序列(图1中的c、d、e序列)。
肝细胞癌特异基因变异的分析方法为:将测序数据满足标准甲的DNA分子回溯到一个分子簇;将满足标准乙的分子簇标记为一对duplex分子簇;对某一突变来说,如果满足下述(a1)或(a2),则该突变为来自原始DNA样本的真实突变:(a1)至少有一对duplex分子簇支持;(a2)至少有4个分子簇支持;标准甲即同时满足①、②和③;①DNA***片段长度相同;②DNA***片段两端断点序列相同;③随机标签序列相同;标准乙即同时满足④、⑤和⑥;④DNA***片段长度相同且除突变点外序列一致;⑤分子簇两端的锚定序列相同但位置相反;⑥同一个起始DNA双链。
肝细胞癌特异甲基化修饰程度的分析方法为:将测序数据满足标准丙的DNA分子标记为一个簇,分别计算片段末端为关注酶切位点的簇的数量,记录为未甲基化的片段;计算扩增片段达到或超过第一个酶切位点的全部簇的数量,记录为片段总数;根据两种片段数量计算对应区域的平均甲基化水平;区域的甲基化水平=(1-未甲基化片段数/片段总数)×100%;标准丙即同时满足⑦、⑧、⑨和⑩;⑦随机标签序列相同;⑧内置标签序列相同;⑨DNA***片段长度相同;⑩DNA***片段两端断点序列相同。
实施例3、MC文库的捕获及测序
如图3所示,靶区域富集可基于现有商业化的靶向捕获试剂盒进行优化设计而捕获。例如:基于甲基化区域的捕获可参考Roche SeqCap Epi CpGiant Enrichment Kit(Roche07138881001)或Illumina Infinium Methylation EPIC BeadChipWG-317-1001),甲基化区域靶向捕获的设计需要根据酶切位点覆盖程度进行筛选,并调整探针中基于重亚硫酸盐处理所转换的碱基。基于基因变异区域的捕获可参考Agilent sureselect XT靶向捕获试剂盒(Agilent5190-8646),仅将最后一步PCR扩增的引物更换为如下引物:
上游引物为:5’-AATGATACGGCGACCACCGAGATCTACACTCTTTCCCTACACGACGCTCTTCCG ATCT-3’(序列403)(图3中的“a”),下划线部分与引物MC_F部分相同),作用为扩增文库,其余部分为illumina测序平台测序所需的固定序列。
下游引物为:5’-CAAGCAGAAGACGGCATACGAGAT(序列404)********GTCTCGTGGGCTCGGAGATGTGTATAA-3’(序列405)(图3中的“b”),下划线部分为与引物MC_R相同,作用为扩增文库。********为index序列位置,index长度为6-8bp,作用是区分样本间的序列,方便多个样本混合测序。其余部分为illumina测序平台测序所需的固定序列。
捕获后的文库与MC文库具有相同的DNA随机标签序列、锚定序列和cfDNA序列,依次位于Read1下游。
将测序数据满足标准甲的DNA分子回溯到一个分子簇;标准甲即同时满足①、②和③;①DNA***片段长度相同;②DNA***片段两端断点序列相同;③随机标签序列相同。将满足标准乙的分子簇标记为一对duplex分子簇;标准乙即同时满足④、⑤和⑥;④DNA***片段长度相同且除突变点外序列一致;⑤分子簇两端的锚定序列相同但位置相反;⑥同一个起始DNA双链。对某一突变来说,如果满足下述(a1)或(a2),则该突变为来自原始DNA样本的真实突变:(a1)至少有一对duplex分子簇支持;(a2)至少有4个分子簇支持。在一对duplex分子簇共同支持的突变可靠性更高,可减少90%的假阳性突变。
将测序数据满足标准丙的DNA分子标记为一个簇,分别计算片段末端为关注酶切位点的簇的数量,记录为未甲基化的片段;计算扩增片段达到或超过第一个酶切位点的全部簇的数量,记录为片段总数;根据两种片段数量计算对应区域的平均甲基化水平;区域的甲基化水平=(1-未甲基化片段数/片段总数)×100%;标准丙即同时满足⑦、⑧、⑨和⑩;⑦随机标签序列相同;⑧内置标签序列相同;⑨DNA***片段长度相同;⑩DNA***片段两端断点序列相同。
实施例4、检测方法的对比
一、检测方法的对比一
1、收集21例肝细胞癌患者的cfDNA标本。
2、完成步骤1后,取各个cfDNA标本,按照实施例1中的方法构建MC文库,然后按照实施例2中的方法进行RaceSeq靶区富集,测序,得到AK055957基因的甲基化水平。
3、完成步骤1后,取各个cfDNA标本,采用Padlock方法(Xu R H,Wei W,KrawczykM,et al.Circulating tumour DNA methylation markers for diagnosis andprognosis of hepatocellular carcinoma[J].Nature Materials,2017,16(11):1155.)检测AK055957基因的甲基化水平。Padlock是一种甲基化靶向测序技术,Padlock探针构象与挂锁类似,可应用于高通量甲基化靶向测序,属于高效的亚硫酸氢盐转化后建库方法,被称为“BSPP”。cfDNA经亚硫酸氢盐转化后,与亚硫酸盐锁式探针(BSPP)的捕获臂互补配对时可以扩增并连接成环形,用核酸外切酶可以筛选出连接成环装的锁式探针,对扩增产物进行测序得到相应的DNA甲基化信息。
检测结果见图4。结果表明,Padlock方法和突变/甲基化共检法(即本发明提供的方法)对AK055957基因(属于肝细胞癌特异基因)的甲基化水平检测结果基本一致。
二、检测方法的对比二
1、采用突变/甲基化共检法检测突变和突变频率
(1)收集某肝细胞癌患者的cfDNA。
(2)完成步骤(1)后,取5-40ngcfDNA,按照表1所示配置反应体系,然后在PCR仪进行酶切处理,得到酶切产物(4℃保存)。其中酶切处理的时间为0h、0.2h、0.4h、0.6h、0.8h或1h。
(3)完成步骤(2)后,取所述酶切产物,按照实施例1中二至六的方法构建MC文库,然后按照实施例2中的方法进行RaceSeq靶区富集,测序。在数据分析时,将随机标签序列相同、DNA***片段长度相同、DNA***片段两端断点均相同的DNA分子测序数据回溯到一个分子簇,如果簇内分子数>5个并且簇内分子突变一致率>80%并且簇个数≥5,则该突变为来自原始DNA样本的真实突变。含该分子突变的簇的比例即为突变频率。
2、采用单独检测突变法检测突变和突变频率
(1)收集某肝细胞癌患者的cfDNA。
(2)完成步骤(1)后,取5-40ng cfDNA,按照表3所示配置反应体系,然后按照表4的反应程序在PCR仪进行末端修复及3’末端加A处理,得到反应产物(4℃保存)。
(3)完成步骤(2)后,取所述反应产物,按照实施例1中四至六的方法构建MC文库,然后按照实施例2中的方法进行RaceSeq靶区富集,测序。在数据分析时,将随机标签序列相同、DNA***片段长度相同、DNA***片段两端断点均相同的DNA分子测序数据回溯到一个分子簇,如果簇内分子数>5个并且簇内分子突变一致率>80%并且簇个数≥5,则该突变为来自原始DNA样本的真实突变。含该分子突变的簇的比例即为突变频率。
3、将各突变位点根据突变/甲基化共检法得到的突变频率作为横坐标,单独检测突变法得到的突变频率作为纵坐标,绘制散点图,添加线性拟合曲线及相关系数R2
结果见图5。结果表明,突变/甲基化共检法和单独检测突变法对于突变和突变频率的检测结果基本一致,即甲基化检测并未影响对突变的检出。
实施例5、准确性实验
突变标准品为Horizon Discovery公司的产品,产品目录号为HD701。
一、准确性实验一
1、取突变标准品,按照实施例1中一至六的方法构建MC文库,然后按照实施例2中的方法(仅将步骤3中的GSP2A mix替换为GSP2A mix-1,GSP2B mix替换为GSP2B mix-1)进行RaceSeq靶区富集,测序。
GSP2A mix-1:将表15中属于引物池GSP2A中的各条引物用TE缓冲液溶解并稀释至浓度为100μM,然后等体积混合,用TE缓冲液稀释至0.3μM。引物池GSP2A中的引物用于扩增模板的正链。
GSP2B mix-1:将表15中属于引物池GSP2B中的各条引物用TE缓冲液溶解并稀释至浓度为100μM,然后等体积混合,用TE缓冲液稀释至0.3μM。引物池GSP2B中的引物用于扩增模板的负链。
表15
Figure BDA0002235814990000251
Figure BDA0002235814990000261
2、根据测序结果,得到突变位点的突变频率。
检测结果见表16。结果表明,采用突变/甲基化共检法检测突变标准品,得到的突变位点的突变频率与理论值基本接近。由此可见,突变/甲基化共检法对肝细胞癌特异基因(如CTNNB1基因、TP53基因、AXIN1基因)的变异检测具有较高的准确性。
表16.准确性实验
Figure BDA0002235814990000262
注:geneID代表基因在Ensemble数据库中编号,Ref为正常类型,Alt为基因变异后类型,INS代表***,DEL代表缺失,SNP代表单碱基突变。
二、准确性实验二
人甲基化和非甲基化标准品为Zymo Research公司的产品,产品目录号为D5014。
1、将人甲基化和非甲基化标准品中的甲基化标准品和非甲基化标准品按照不同比例进行混合,得到待测样本。待测样本中,甲基化标准品的比例为0%、20%或100%,即肿瘤特异基因(BDH1基因、EMX1基因、LRRC4基因、CLEC11A基因、HOXA1基因、AK055957基因、COTL1基因、ACP1基因或DAB2IP基因)甲基化的比例为0%、20%或100%。
2、取待测样本,按照实施例1中的方法构建MC文库,然后按照实施例2中的方法进行RaceSeq靶区富集,测序,得到甲基化位点的检测值。
检测结果见表17和表18(样本类型的后四位为肿瘤特异基因的名称)。采用突变/甲基化共检法检测甲基化标准品,检测值与理论值基本接近。由此可见,突变/甲基化共检法对肿瘤特异基因(如BDH1基因、EMX1基因、LRRC4基因、CLEC11A基因、HOXA1基因、AK055957基因、COTL1基因、ACP1基因、DAB2IP基因)的甲基化水平检测具有较高的准确性。
表17.甲基化标准品准确度检测结果(正链)
样本类型 0%甲基化标准品 20%甲基化标准品 100%甲基化标准品
CA2001_BDH1 2% 18% 97%
CA2002_EMX1 3% 19% 96%
CA2003_LRRC4 2% 9% 100%
CA2004_LRRC4 3% 32% 97%
CA2006_CLEC11A 2% 20% 97%
CA2007_CLEC11A 2% 25% 99%
CA2008_HOXA1 3% 20% 99%
CA2009_HOXA1 3% 23% 99%
CA2010_EMX1 3% 32% 99%
CA2011_AK055957 3% 23% 99%
CA2012_COTL1 3% 18% 98%
CA2013_ACP1 4% 27% 98%
CA2014_DAB2IP 2% 21% 98%
表18.甲基化标准品准确度检测结果(负链)
样本类型 0%甲基化标准品 20%甲基化标准品 100%甲基化标准品
CB2001_BDH1 3% 21% 96%
CB2002_LRRC4 3% 17% 98%
CB2004_LRRC4 2% 9% 96%
CB2005_DAB2IP 2% 3% 99%
CB2007_CLEC11A 4% 50% 94%
CB2008_CLEC11A 3% 18% 97%
CB2009_HOXA1 2% 20% 98%
CB2011_EMX1 3% 23% 99%
CB2012_AK055957 4% 19% 100%
CB2013_RASSF2 7% 60% 94%
CB2015_DAB2IP 3% 23% 99%
实施例6、突变/甲基化共检法在肝细胞癌患者cfDNA中的应用
1、收集1例正常人、1例肝硬化患者和3例肝细胞癌患者的血液样本,提取cfDNA。
2、取540ng cfDNA,按照实施例1进行MC文库构建,按照实施例2中的方法进行RaceSeq靶区富集,测序。
3、甲基化检测结果见表19和表20。
结果显示肝细胞癌特异高甲基化的基因,在所检测的肝细胞癌样本中的甲基化水平高于非肝细胞癌样本中的甲基化水平。突变/甲基化共检法可以应用于肝细胞癌cfDNA样本的检测。
表19.cfDNA样本靶标区域甲基化水平检测结果(正链)
样本类型 正常 肝硬化 肝细胞癌1 肝细胞癌2 肝细胞癌3
CA2001_BDH1 3% 3% 28% 25% 47%
CA2002_EMX1 4% 6% 11% 26% 4%
CA2003_LRRC4 3% 5% 16% 28% 28%
CA2004_LRRC4 3% 6% 29% 46% 48%
CA2006_CLEC11A 3% 4% 11% 20% 2%
CA2007_CLEC11A 3% 5% 22% 25% 10%
CA2008_HOXA1 4% 4% 24% 33% 5%
CA2009_HOXA1 8% 7% 10% 11% 11%
CA2010_EMX1 7% 9% 21% 47% 8%
CA2011_AK055957 5% 9% 40% 43% 45%
CA2012_COTL1 5% 9% 17% 19% 5%
CA2013_ACP1 1% 3% 5% 5% 14%
CA2014_DAB2IP 5% 7% 19% 27% 50%
表20.cfDNA样本靶标区域甲基化水平检测结果(负链)
样本类型 正常 肝硬化 肝细胞癌1 肝细胞癌2 肝细胞癌3
CB2001_BDH1 5% 5% 24% 23% 56%
CB2002_LRRC4 4% 13% 40% 47% 50%
CB2004_LRRC4 1% 4% 11% 17% 28%
CB2005_DAB2IP 4% 5% 10% 16% 27%
CB2007_CLEC11A 11% 8% 17% 38% 6%
CB2008_CLEC11A 2% 5% 22% 23% 7%
CB2009_HOXA1 4% 2% 10% 21% 3%
CB2011_EMX1 12% 11% 20% 39% 7%
CB2012_AK055957 3% 9% 39% 38% 43%
CB2013_RASSF2 5% 1% 4% 18% 4%
CB2015_DAB2IP 9% 6% 18% 31% 57%
<110> 中国医学科学院肿瘤医院 北京泛生子基因科技有限公司
<120> 一种检测ctDNA中肿瘤特异基因的变异和甲基化的方法
<160> 405
<170> PatentIn version 3.5
<210> 1
<211> 42
<212> DNA
<213> Artificial sequence
<220>
<221> misc_feature
<222> (22)..(29)
<223> n is a, c, g, or t
<400> 1
gacacgacgc tcttccgatc tnnnnnnnnc cactagtagc ct 42
<210> 2
<211> 41
<212> DNA
<213> Artificial sequence
<400> 2
ggctactagt ggctgtctct tatacacatc tccgagccca c 41
<210> 3
<211> 42
<212> DNA
<213> Artificial sequence
<220>
<221> misc_feature
<222> (22)..(29)
<223> n is a, c, g, or t
<400> 3
gacacgacgc tcttccgatc tnnnnnnnng gactgtgtcg gt 42
<210> 4
<211> 41
<212> DNA
<213> Artificial sequence
<400> 4
ccgacacagt ccctgtctct tatacacatc tccgagccca c 41
<210> 5
<211> 42
<212> DNA
<213> Artificial sequence
<220>
<221> misc_feature
<222> (22)..(29)
<223> n is a, c, g, or t
<400> 5
gacacgacgc tcttccgatc tnnnnnnnng gtactgacag gt 42
<210> 6
<211> 41
<212> DNA
<213> Artificial sequence
<400> 6
cctgtcagta ccctgtctct tatacacatc tccgagccca c 41
<210> 7
<211> 42
<212> DNA
<213> Artificial sequence
<220>
<221> misc_feature
<222> (22)..(29)
<223> n is a, c, g, or t
<400> 7
gacacgacgc tcttccgatc tnnnnnnnnc ctagtacagc ct 42
<210> 8
<211> 41
<212> DNA
<213> Artificial sequence
<400> 8
ggctgtacta ggctgtctct tatacacatc tccgagccca c 41
<210> 9
<211> 42
<212> DNA
<213> Artificial sequence
<220>
<221> misc_feature
<222> (22)..(29)
<223> n is a, c, g, or t
<400> 9
gacacgacgc tcttccgatc tnnnnnnnng gtagtcagag gt 42
<210> 10
<211> 41
<212> DNA
<213> Artificial sequence
<400> 10
cctctgacta ccctgtctct tatacacatc tccgagccca c 41
<210> 11
<211> 42
<212> DNA
<213> Artificial sequence
<220>
<221> misc_feature
<222> (22)..(29)
<223> n is a, c, g, or t
<400> 11
gacacgacgc tcttccgatc tnnnnnnnnt tctcacgtgt tt 42
<210> 12
<211> 41
<212> DNA
<213> Artificial sequence
<400> 12
aacacgtgag aactgtctct tatacacatc tccgagccca c 41
<210> 13
<211> 42
<212> DNA
<213> Artificial sequence
<220>
<221> misc_feature
<222> (22)..(29)
<223> n is a, c, g, or t
<400> 13
gacacgacgc tcttccgatc tnnnnnnnna actccacgta at 42
<210> 14
<211> 41
<212> DNA
<213> Artificial sequence
<400> 14
ttacgtggag ttctgtctct tatacacatc tccgagccca c 41
<210> 15
<211> 42
<212> DNA
<213> Artificial sequence
<220>
<221> misc_feature
<222> (22)..(29)
<223> n is a, c, g, or t
<400> 15
gacacgacgc tcttccgatc tnnnnnnnnt tctcgagaat tt 42
<210> 16
<211> 41
<212> DNA
<213> Artificial sequence
<400> 16
aattctcgag aactgtctct tatacacatc tccgagccca c 41
<210> 17
<211> 42
<212> DNA
<213> Artificial sequence
<220>
<221> misc_feature
<222> (22)..(29)
<223> n is a, c, g, or t
<400> 17
gacacgacgc tcttccgatc tnnnnnnnna aactcttcca at 42
<210> 18
<211> 41
<212> DNA
<213> Artificial sequence
<400> 18
ttggaagagt ttctgtctct tatacacatc tccgagccca c 41
<210> 19
<211> 42
<212> DNA
<213> Artificial sequence
<220>
<221> misc_feature
<222> (22)..(29)
<223> n is a, c, g, or t
<400> 19
gacacgacgc tcttccgatc tnnnnnnnnt tggaacgtct tt 42
<210> 20
<211> 41
<212> DNA
<213> Artificial sequence
<400> 20
aagacgttcc aactgtctct tatacacatc tccgagccca c 41
<210> 21
<211> 42
<212> DNA
<213> Artificial sequence
<220>
<221> misc_feature
<222> (22)..(29)
<223> n is a, c, g, or t
<400> 21
gacacgacgc tcttccgatc tnnnnnnnnc cggactcctc ct 42
<210> 22
<211> 41
<212> DNA
<213> Artificial sequence
<400> 22
ggaggagtcc ggctgtctct tatacacatc tccgagccca c 41
<210> 23
<211> 42
<212> DNA
<213> Artificial sequence
<220>
<221> misc_feature
<222> (22)..(29)
<223> n is a, c, g, or t
<400> 23
gacacgacgc tcttccgatc tnnnnnnnna aggaggagta at 42
<210> 24
<211> 41
<212> DNA
<213> Artificial sequence
<400> 24
ttactcctcc ttctgtctct tatacacatc tccgagccca c 41
<210> 25
<211> 19
<212> DNA
<213> Artificial sequence
<400> 25
gacacgacgc tcttccgat 19
<210> 26
<211> 22
<212> DNA
<213> Artificial sequence
<400> 26
gtgggctcgg agatgtgtat aa 22
<210> 27
<211> 27
<212> DNA
<213> Artificial sequence
<400> 27
tctttcccta cacgacgctc ttccgat 27
<210> 28
<211> 20
<212> DNA
<213> Artificial sequence
<400> 28
tgtattaggg tgcagcgctc 20
<210> 29
<211> 18
<212> DNA
<213> Artificial sequence
<400> 29
cgctcggatc tggacctg 18
<210> 30
<211> 19
<212> DNA
<213> Artificial sequence
<400> 30
tggagccctg tgactcgaa 19
<210> 31
<211> 21
<212> DNA
<213> Artificial sequence
<400> 31
gtgaccagga catggatgag g 21
<210> 32
<211> 21
<212> DNA
<213> Artificial sequence
<400> 32
tcctccagta gacggtacag c 21
<210> 33
<211> 18
<212> DNA
<213> Artificial sequence
<400> 33
tgctgcttgt ccccacac 18
<210> 34
<211> 18
<212> DNA
<213> Artificial sequence
<400> 34
ccgcttggca ccacttcc 18
<210> 35
<211> 18
<212> DNA
<213> Artificial sequence
<400> 35
ggcacgggaa gcacgtac 18
<210> 36
<211> 18
<212> DNA
<213> Artificial sequence
<400> 36
ccttgcagtg ggaaggtg 18
<210> 37
<211> 23
<212> DNA
<213> Artificial sequence
<400> 37
gacagaaaag cggctgttag tca 23
<210> 38
<211> 19
<212> DNA
<213> Artificial sequence
<400> 38
ccgacctcag ctacagcat 19
<210> 39
<211> 21
<212> DNA
<213> Artificial sequence
<400> 39
acttgagcaa cccggagtct g 21
<210> 40
<211> 20
<212> DNA
<213> Artificial sequence
<400> 40
ctcctagctc tgcagtccga 20
<210> 41
<211> 18
<212> DNA
<213> Artificial sequence
<400> 41
gcgcctggct ccatttcc 18
<210> 42
<211> 21
<212> DNA
<213> Artificial sequence
<400> 42
cgcctgagaa cctgcaaaga g 21
<210> 43
<211> 18
<212> DNA
<213> Artificial sequence
<400> 43
gtccagggag caatgcgt 18
<210> 44
<211> 19
<212> DNA
<213> Artificial sequence
<400> 44
cgggttaccc cacagccta 19
<210> 45
<211> 18
<212> DNA
<213> Artificial sequence
<400> 45
ggctcccagt ggattcgc 18
<210> 46
<211> 18
<212> DNA
<213> Artificial sequence
<400> 46
gtcctgcccc ttcacctt 18
<210> 47
<211> 22
<212> DNA
<213> Artificial sequence
<400> 47
ccgactactg cctcacccat at 22
<210> 48
<211> 26
<212> DNA
<213> Artificial sequence
<400> 48
gggtttttct tgttgacaag aatcct 26
<210> 49
<211> 22
<212> DNA
<213> Artificial sequence
<400> 49
ccaacctcca atcactcacc aa 22
<210> 50
<211> 28
<212> DNA
<213> Artificial sequence
<400> 50
ggcgttttat catattcctc ttcatcct 28
<210> 51
<211> 26
<212> DNA
<213> Artificial sequence
<400> 51
ctacttccag gaacatcaac taccag 26
<210> 52
<211> 23
<212> DNA
<213> Artificial sequence
<400> 52
ctgcacttgt attcccatcc cat 23
<210> 53
<211> 27
<212> DNA
<213> Artificial sequence
<400> 53
tcagtttact agtgccattt gttcagt 27
<210> 54
<211> 28
<212> DNA
<213> Artificial sequence
<400> 54
tacaacatct tgagtccctt tttacctc 28
<210> 55
<211> 23
<212> DNA
<213> Artificial sequence
<400> 55
agaattgtgg gtcttttggg ctt 23
<210> 56
<211> 30
<212> DNA
<213> Artificial sequence
<400> 56
tgtaaacaat atctgaacct ttaccctgtt 30
<210> 57
<211> 20
<212> DNA
<213> Artificial sequence
<400> 57
gcatgcgtgg aacctttgtg 20
<210> 58
<211> 23
<212> DNA
<213> Artificial sequence
<400> 58
aactctgttg tcctctctcg gaa 23
<210> 59
<211> 18
<212> DNA
<213> Artificial sequence
<400> 59
ctgaatcccg cggacgac 18
<210> 60
<211> 21
<212> DNA
<213> Artificial sequence
<400> 60
ccgtctgtgc cttctcatct g 21
<210> 61
<211> 19
<212> DNA
<213> Artificial sequence
<400> 61
gaacgcccac caggtcttg 19
<210> 62
<211> 24
<212> DNA
<213> Artificial sequence
<400> 62
ccttgaggcg tacttcaaag actg 24
<210> 63
<211> 23
<212> DNA
<213> Artificial sequence
<400> 63
ggaggctgta ggcataaatt ggt 23
<210> 64
<211> 22
<212> DNA
<213> Artificial sequence
<400> 64
gtcctactgt tcaagcctcc aa 22
<210> 65
<211> 22
<212> DNA
<213> Artificial sequence
<400> 65
gggcttctgt ggagttactc tc 22
<210> 66
<211> 22
<212> DNA
<213> Artificial sequence
<400> 66
ttgtatcggg aggccttaga gt 22
<210> 67
<211> 21
<212> DNA
<213> Artificial sequence
<400> 67
ttctgtgttg gggtgagttg a 21
<210> 68
<211> 25
<212> DNA
<213> Artificial sequence
<400> 68
ccagcatcca gggaattagt agtca 25
<210> 69
<211> 27
<212> DNA
<213> Artificial sequence
<400> 69
ttcctgtctt acctttggaa gagaaac 27
<210> 70
<211> 25
<212> DNA
<213> Artificial sequence
<400> 70
ccggaaacta ctgttgttag acgta 25
<210> 71
<211> 23
<212> DNA
<213> Artificial sequence
<400> 71
cgtcgcagaa gatctcaatc tcg 23
<210> 72
<211> 28
<212> DNA
<213> Artificial sequence
<400> 72
aaactccctc ctttcctaac attcattt 28
<210> 73
<211> 26
<212> DNA
<213> Artificial sequence
<400> 73
tatgcctgct aggttctatc ctaacc 26
<210> 74
<211> 27
<212> DNA
<213> Artificial sequence
<400> 74
ggcattattt acatactctg tggaagg 27
<210> 75
<211> 22
<212> DNA
<213> Artificial sequence
<400> 75
gttggtcttc caaacctcga ca 22
<210> 76
<211> 22
<212> DNA
<213> Artificial sequence
<400> 76
ttcaacccca acaaggatca ct 22
<210> 77
<211> 20
<212> DNA
<213> Artificial sequence
<400> 77
ttccaccaat cggcagtcag 20
<210> 78
<211> 21
<212> DNA
<213> Artificial sequence
<400> 78
gccctgctca gaatactgtc t 21
<210> 79
<211> 20
<212> DNA
<213> Artificial sequence
<400> 79
attcgcagtc ccaaatctcc 20
<210> 80
<211> 21
<212> DNA
<213> Artificial sequence
<400> 80
catcttcctc tgcatcctgc t 21
<210> 81
<211> 22
<212> DNA
<213> Artificial sequence
<400> 81
ttccaggatc atcaaccacc ag 22
<210> 82
<211> 18
<212> DNA
<213> Artificial sequence
<400> 82
gtccctttat gccgctgt 18
<210> 83
<211> 29
<212> DNA
<213> Artificial sequence
<400> 83
acccttataa agaatttgga gctactgtg 29
<210> 84
<211> 22
<212> DNA
<213> Artificial sequence
<400> 84
ctcctgaaca ttgctcacct ca 22
<210> 85
<211> 18
<212> DNA
<213> Artificial sequence
<400> 85
agactgcctt ccgggtca 18
<210> 86
<211> 22
<212> DNA
<213> Artificial sequence
<400> 86
cctgtgggaa gcgaaaattc ca 22
<210> 87
<211> 19
<212> DNA
<213> Artificial sequence
<400> 87
acctggtcct ctgactgct 19
<210> 88
<211> 24
<212> DNA
<213> Artificial sequence
<400> 88
aagcaatgga tgatttgatg ctgt 24
<210> 89
<211> 20
<212> DNA
<213> Artificial sequence
<400> 89
gacccaggtc cagatgaagc 20
<210> 90
<211> 18
<212> DNA
<213> Artificial sequence
<400> 90
tcctggcccc tgtcatct 18
<210> 91
<211> 22
<212> DNA
<213> Artificial sequence
<400> 91
gtgccctgac tttcaactct gt 22
<210> 92
<211> 18
<212> DNA
<213> Artificial sequence
<400> 92
caactggcca agacctgc 18
<210> 93
<211> 20
<212> DNA
<213> Artificial sequence
<400> 93
cgccatggcc atctacaagc 20
<210> 94
<211> 18
<212> DNA
<213> Artificial sequence
<400> 94
ggtccccagg cctctgat 18
<210> 95
<211> 22
<212> DNA
<213> Artificial sequence
<400> 95
gagtggaagg aaatttgcgt gt 22
<210> 96
<211> 19
<212> DNA
<213> Artificial sequence
<400> 96
gcactggcct catcttggg 19
<210> 97
<211> 26
<212> DNA
<213> Artificial sequence
<400> 97
ccatccacta caactacatg tgtaac 26
<210> 98
<211> 24
<212> DNA
<213> Artificial sequence
<400> 98
tttccttact gcctcttgct tctc 24
<210> 99
<211> 20
<212> DNA
<213> Artificial sequence
<400> 99
gggacggaac agctttgagg 20
<210> 100
<211> 23
<212> DNA
<213> Artificial sequence
<400> 100
cacagaggaa gagaatctcc gca 23
<210> 101
<211> 26
<212> DNA
<213> Artificial sequence
<400> 101
tgcctcagat tcacttttat cacctt 26
<210> 102
<211> 30
<212> DNA
<213> Artificial sequence
<400> 102
ctcaggtact gtgtatatac ttacttctcc 30
<210> 103
<211> 19
<212> DNA
<213> Artificial sequence
<400> 103
cgtgagcgct tcgagatgt 19
<210> 104
<211> 22
<212> DNA
<213> Artificial sequence
<400> 104
gtgatgtcat ctctcctccc tg 22
<210> 105
<211> 25
<212> DNA
<213> Artificial sequence
<400> 105
tgaagtccaa aaagggtcag tctac 25
<210> 106
<211> 20
<212> DNA
<213> Artificial sequence
<400> 106
gggagcatct tcggtgaaac 20
<210> 107
<211> 22
<212> DNA
<213> Artificial sequence
<400> 107
caggcttatc ccatcttggt ca 22
<210> 108
<211> 18
<212> DNA
<213> Artificial sequence
<400> 108
ttggtggctg gcttggtc 18
<210> 109
<211> 21
<212> DNA
<213> Artificial sequence
<400> 109
gctgtaccgt ctactggagg a 21
<210> 110
<211> 21
<212> DNA
<213> Artificial sequence
<400> 110
gcttgttctc cagctctcgg a 21
<210> 111
<211> 18
<212> DNA
<213> Artificial sequence
<400> 111
gggaagtggt gccaagcg 18
<210> 112
<211> 18
<212> DNA
<213> Artificial sequence
<400> 112
gcacacgctg tacgtgct 18
<210> 113
<211> 18
<212> DNA
<213> Artificial sequence
<400> 113
gcctccacct gctccttg 18
<210> 114
<211> 22
<212> DNA
<213> Artificial sequence
<400> 114
ccctcaatga tccactgcat ga 22
<210> 115
<211> 24
<212> DNA
<213> Artificial sequence
<400> 115
ctcatacagg acttgggagg tatc 24
<210> 116
<211> 18
<212> DNA
<213> Artificial sequence
<400> 116
cacaaccgca ggacagct 18
<210> 117
<211> 18
<212> DNA
<213> Artificial sequence
<400> 117
ctccaagcct cggactgc 18
<210> 118
<211> 19
<212> DNA
<213> Artificial sequence
<400> 118
gcctcacacc agccacaac 19
<210> 119
<211> 20
<212> DNA
<213> Artificial sequence
<400> 119
tccccaccat gagcaaacca 20
<210> 120
<211> 18
<212> DNA
<213> Artificial sequence
<400> 120
gtgcctccct gcaacact 18
<210> 121
<211> 18
<212> DNA
<213> Artificial sequence
<400> 121
gcaccacgaa tgccggac 18
<210> 122
<211> 18
<212> DNA
<213> Artificial sequence
<400> 122
gtggggtaac ccgaggga 18
<210> 123
<211> 18
<212> DNA
<213> Artificial sequence
<400> 123
gaggaggcgg agctggaa 18
<210> 124
<211> 18
<212> DNA
<213> Artificial sequence
<400> 124
agcgctgcct gaaactcg 18
<210> 125
<211> 17
<212> DNA
<213> Artificial sequence
<400> 125
cgcacgaacg tggccag 17
<210> 126
<211> 19
<212> DNA
<213> Artificial sequence
<400> 126
gagccaccag caggaaagt 19
<210> 127
<211> 24
<212> DNA
<213> Artificial sequence
<400> 127
ctaggaatcc tgatgttgtg ctct 24
<210> 128
<211> 22
<212> DNA
<213> Artificial sequence
<400> 128
cgcgagtcta gactctgtgg ta 22
<210> 129
<211> 24
<212> DNA
<213> Artificial sequence
<400> 129
atagccagga caaattggag gaca 24
<210> 130
<211> 21
<212> DNA
<213> Artificial sequence
<400> 130
gacaaacggg caacatacct t 21
<210> 131
<211> 23
<212> DNA
<213> Artificial sequence
<400> 131
ccgaaggttt tgtacagcaa caa 23
<210> 132
<211> 23
<212> DNA
<213> Artificial sequence
<400> 132
ctgagccagg agaaacggac tga 23
<210> 133
<211> 26
<212> DNA
<213> Artificial sequence
<400> 133
gggactcaag atgttgtaca gacttg 26
<210> 134
<211> 21
<212> DNA
<213> Artificial sequence
<400> 134
gttaagggag tagccccaac g 21
<210> 135
<211> 25
<212> DNA
<213> Artificial sequence
<400> 135
caggcagttt tcgaaaacat tgctt 25
<210> 136
<211> 27
<212> DNA
<213> Artificial sequence
<400> 136
ttaaagcagg atagccacat tgtgtaa 27
<210> 137
<211> 25
<212> DNA
<213> Artificial sequence
<400> 137
ggcaacaggg taaaggttca gatat 25
<210> 138
<211> 19
<212> DNA
<213> Artificial sequence
<400> 138
ccacaaaggt tccacgcat 19
<210> 139
<211> 24
<212> DNA
<213> Artificial sequence
<400> 139
tggaaaggaa gtgtacttcc gaga 24
<210> 140
<211> 18
<212> DNA
<213> Artificial sequence
<400> 140
gtcgtccgcg ggattcag 18
<210> 141
<211> 18
<212> DNA
<213> Artificial sequence
<400> 141
aaggcacaga cggggaga 18
<210> 142
<211> 18
<212> DNA
<213> Artificial sequence
<400> 142
tcacggtggt ctccatgc 18
<210> 143
<211> 22
<212> DNA
<213> Artificial sequence
<400> 143
ggtcgttgac attgctgaga gt 22
<210> 144
<211> 22
<212> DNA
<213> Artificial sequence
<400> 144
aacctaatct cctcccccaa ct 22
<210> 145
<211> 23
<212> DNA
<213> Artificial sequence
<400> 145
gcagaggtga aaaagttgca tgg 23
<210> 146
<211> 18
<212> DNA
<213> Artificial sequence
<400> 146
ccacccaagg cacagctt 18
<210> 147
<211> 18
<212> DNA
<213> Artificial sequence
<400> 147
actccacaga agccccaa 18
<210> 148
<211> 20
<212> DNA
<213> Artificial sequence
<400> 148
gcctcccgat acaaagcaga 20
<210> 149
<211> 24
<212> DNA
<213> Artificial sequence
<400> 149
gattcatcaa ctcaccccaa caca 24
<210> 150
<211> 27
<212> DNA
<213> Artificial sequence
<400> 150
acatagctga ctactaattc cctggat 27
<210> 151
<211> 25
<212> DNA
<213> Artificial sequence
<400> 151
atccacactc caaaagacac caaat 25
<210> 152
<211> 22
<212> DNA
<213> Artificial sequence
<400> 152
gcgagggagt tcttcttcta gg 22
<210> 153
<211> 25
<212> DNA
<213> Artificial sequence
<400> 153
cagtaaagtt tcccaccttg tgagt 25
<210> 154
<211> 27
<212> DNA
<213> Artificial sequence
<400> 154
cctcctgtaa atgaatgtta ggaaagg 27
<210> 155
<211> 26
<212> DNA
<213> Artificial sequence
<400> 155
gtttaatgcc tttatccaag ggcaaa 26
<210> 156
<211> 27
<212> DNA
<213> Artificial sequence
<400> 156
ctcttatata gaatcccagc cttccac 27
<210> 157
<211> 22
<212> DNA
<213> Artificial sequence
<400> 157
cttgtcgagg tttggaagac ca 22
<210> 158
<211> 20
<212> DNA
<213> Artificial sequence
<400> 158
gtttgagttg gctccgaacg 20
<210> 159
<211> 18
<212> DNA
<213> Artificial sequence
<400> 159
ctgagggctc caccccaa 18
<210> 160
<211> 23
<212> DNA
<213> Artificial sequence
<400> 160
gtgaagagat gggagtaggc tgt 23
<210> 161
<211> 26
<212> DNA
<213> Artificial sequence
<400> 161
cccatctttt tgttttgtga gggttt 26
<210> 162
<211> 26
<212> DNA
<213> Artificial sequence
<400> 162
ttaaagcagg atatccacat tgcgta 26
<210> 163
<211> 22
<212> DNA
<213> Artificial sequence
<400> 163
ttgctgaaag tccaagagtc ct 22
<210> 164
<211> 23
<212> DNA
<213> Artificial sequence
<400> 164
ggtgagcaat gttcaggaga ttc 23
<210> 165
<211> 22
<212> DNA
<213> Artificial sequence
<400> 165
actactagat ccctggacgc tg 22
<210> 166
<211> 23
<212> DNA
<213> Artificial sequence
<400> 166
ggtggagata agggagtagg ctg 23
<210> 167
<211> 20
<212> DNA
<213> Artificial sequence
<400> 167
tgcccttcca atggatccac 20
<210> 168
<211> 18
<212> DNA
<213> Artificial sequence
<400> 168
gtccccagcc caaccctt 18
<210> 169
<211> 20
<212> DNA
<213> Artificial sequence
<400> 169
ctctggcatt ctgggagctt 20
<210> 170
<211> 22
<212> DNA
<213> Artificial sequence
<400> 170
tggtaggttt tctgggaagg ga 22
<210> 171
<211> 21
<212> DNA
<213> Artificial sequence
<400> 171
tgtcccagaa tgcaagaagc c 21
<210> 172
<211> 24
<212> DNA
<213> Artificial sequence
<400> 172
ggcattgaag tctcatggaa gcca 24
<210> 173
<211> 20
<212> DNA
<213> Artificial sequence
<400> 173
acctccgtca tgtgctgtga 20
<210> 174
<211> 21
<212> DNA
<213> Artificial sequence
<400> 174
ctcaccatcg ctatctgagc a 21
<210> 175
<211> 18
<212> DNA
<213> Artificial sequence
<400> 175
gcaaccagcc ctgtcgtc 18
<210> 176
<211> 21
<212> DNA
<213> Artificial sequence
<400> 176
gcaccaccac actatgtcga a 21
<210> 177
<211> 21
<212> DNA
<213> Artificial sequence
<400> 177
ttaacccctc ctcccagaga c 21
<210> 178
<211> 24
<212> DNA
<213> Artificial sequence
<400> 178
ttccagtgtg atgatggtga ggat 24
<210> 179
<211> 18
<212> DNA
<213> Artificial sequence
<400> 179
cagcaggcca gtgtgcag 18
<210> 180
<211> 18
<212> DNA
<213> Artificial sequence
<400> 180
ccggtctctc ccaggaca 18
<210> 181
<211> 20
<212> DNA
<213> Artificial sequence
<400> 181
gtgaggctcc cctttcttgc 20
<210> 182
<211> 19
<212> DNA
<213> Artificial sequence
<400> 182
tggtctcctc caccgcttc 19
<210> 183
<211> 26
<212> DNA
<213> Artificial sequence
<400> 183
gaaactttcc acttgataag aggtcc 26
<210> 184
<211> 18
<212> DNA
<213> Artificial sequence
<400> 184
ctcccccctg gctccttc 18
<210> 185
<211> 19
<212> DNA
<213> Artificial sequence
<400> 185
ggggagtagg gccaggaag 19
<210> 186
<211> 23
<212> DNA
<213> Artificial sequence
<400> 186
gcccttctgt cttgaacatg agt 23
<210> 187
<211> 18
<212> DNA
<213> Artificial sequence
<400> 187
gtgggaggct gtcagtgg 18
<210> 188
<211> 16
<212> DNA
<213> Artificial sequence
<400> 188
gccacccgga cgcttc 16
<210> 189
<211> 21
<212> DNA
<213> Artificial sequence
<400> 189
caaacgaaac cccacacgaa c 21
<210> 190
<211> 17
<212> DNA
<213> Artificial sequence
<400> 190
gcggagggag cgagttc 17
<210> 191
<211> 20
<212> DNA
<213> Artificial sequence
<400> 191
aacatagtcc ccgctggcta 20
<210> 192
<211> 18
<212> DNA
<213> Artificial sequence
<400> 192
ggagcgctca aacccaca 18
<210> 193
<211> 18
<212> DNA
<213> Artificial sequence
<400> 193
tacaactggc ccgtgtgg 18
<210> 194
<211> 20
<212> DNA
<213> Artificial sequence
<400> 194
gtccttcttc gcctggcatc 20
<210> 195
<211> 17
<212> DNA
<213> Artificial sequence
<400> 195
tgggctggga gaccgtg 17
<210> 196
<211> 19
<212> DNA
<213> Artificial sequence
<400> 196
ccaccggctc ttcaagctc 19
<210> 197
<211> 16
<212> DNA
<213> Artificial sequence
<400> 197
catcgtcgcc gctgca 16
<210> 198
<211> 20
<212> DNA
<213> Artificial sequence
<400> 198
aacgcatagg aggggtggaa 20
<210> 199
<211> 22
<212> DNA
<213> Artificial sequence
<400> 199
cctttgggtt gggagaagaa aa 22
<210> 200
<211> 18
<212> DNA
<213> Artificial sequence
<400> 200
cacccgccgt gtacgttt 18
<210> 201
<211> 20
<212> DNA
<213> Artificial sequence
<400> 201
cggaatcggg gtctaagtgg 20
<210> 202
<211> 18
<212> DNA
<213> Artificial sequence
<400> 202
cctagcgatc agggcacc 18
<210> 203
<211> 20
<212> DNA
<213> Artificial sequence
<400> 203
gatgagagag cagtctgcgt 20
<210> 204
<211> 20
<212> DNA
<213> Artificial sequence
<400> 204
cgttctcgcg ctctgcttac 20
<210> 205
<211> 16
<212> DNA
<213> Artificial sequence
<400> 205
gacccccgct gctcac 16
<210> 206
<211> 17
<212> DNA
<213> Artificial sequence
<400> 206
ccccctaagc cgctgtt 17
<210> 207
<211> 18
<212> DNA
<213> Artificial sequence
<400> 207
ccacacgggc cagttgta 18
<210> 208
<211> 22
<212> DNA
<213> Artificial sequence
<400> 208
tggccgtttt cgaagaggta ga 22
<210> 209
<211> 17
<212> DNA
<213> Artificial sequence
<400> 209
caccgttggg ctggtcc 17
<210> 210
<211> 19
<212> DNA
<213> Artificial sequence
<400> 210
cgagcttgaa gagccggtg 19
<210> 211
<211> 17
<212> DNA
<213> Artificial sequence
<400> 211
cgcccacccg agttcct 17
<210> 212
<211> 16
<212> DNA
<213> Artificial sequence
<400> 212
tggccgggac tggagg 16
<210> 213
<211> 22
<212> DNA
<213> Artificial sequence
<400> 213
ggtaatacgt tccggcactt cg 22
<210> 214
<211> 19
<212> DNA
<213> Artificial sequence
<400> 214
gcccccactt tccaactcc 19
<210> 215
<211> 18
<212> DNA
<213> Artificial sequence
<400> 215
gcggttccga agtccctg 18
<210> 216
<211> 17
<212> DNA
<213> Artificial sequence
<400> 216
ctctccagcc ctcggtg 17
<210> 217
<211> 50
<212> DNA
<213> Artificial sequence
<400> 217
aatgatacgg cgaccaccga gatctacact ctttccctac acgacgctct 50
<210> 218
<211> 24
<212> DNA
<213> Artificial sequence
<400> 218
caagcagaag acggcatacg agat 24
<210> 219
<211> 33
<212> DNA
<213> Artificial sequence
<400> 219
gtgactggag ttccttggca cccgagaa 33
<210> 220
<211> 38
<212> DNA
<213> Artificial sequence
<400> 220
cttggcaccc gagaattcca ttgttccttg acgcagag 38
<210> 221
<211> 40
<212> DNA
<213> Artificial sequence
<400> 221
cttggcaccc gagaattcca gacctggggt atgagcctga 40
<210> 222
<211> 38
<212> DNA
<213> Artificial sequence
<400> 222
cttggcaccc gagaattcca aggctgaagc tggcgaga 38
<210> 223
<211> 40
<212> DNA
<213> Artificial sequence
<400> 223
cttggcaccc gagaattcca tgaggacgat ggcagagacg 40
<210> 224
<211> 40
<212> DNA
<213> Artificial sequence
<400> 224
cttggcaccc gagaattcca gtacagcgaa ggcagagagt 40
<210> 225
<211> 41
<212> DNA
<213> Artificial sequence
<400> 225
cttggcaccc gagaattcca cacacaggag gaggaaggtg a 41
<210> 226
<211> 39
<212> DNA
<213> Artificial sequence
<400> 226
cttggcaccc gagaattcca tgtgtggaca tgggctgtg 39
<210> 227
<211> 38
<212> DNA
<213> Artificial sequence
<400> 227
cttggcaccc gagaattcca acccaagtca ggggcgaa 38
<210> 228
<211> 44
<212> DNA
<213> Artificial sequence
<400> 228
cttggcaccc gagaattcca gcgtgcaaaa gaaatgccaa gaag 44
<210> 229
<211> 41
<212> DNA
<213> Artificial sequence
<400> 229
cttggcaccc gagaattcca tagtcactgg cagcaacagt c 41
<210> 230
<211> 38
<212> DNA
<213> Artificial sequence
<400> 230
cttggcaccc gagaattcca ctgcaaggcc tcgggaga 38
<210> 231
<211> 41
<212> DNA
<213> Artificial sequence
<400> 231
cttggcaccc gagaattcca attcctggga agtcctcagc t 41
<210> 232
<211> 38
<212> DNA
<213> Artificial sequence
<400> 232
cttggcaccc gagaattcca gcttggagcc aggtgcct 38
<210> 233
<211> 43
<212> DNA
<213> Artificial sequence
<400> 233
cttggcaccc gagaattcca catttcccac cctttctcga cgg 43
<210> 234
<211> 38
<212> DNA
<213> Artificial sequence
<400> 234
cttggcaccc gagaattcca acgggcctgt gtcaagga 38
<210> 235
<211> 38
<212> DNA
<213> Artificial sequence
<400> 235
cttggcaccc gagaattcca atgcgtcctc gggttcgt 38
<210> 236
<211> 38
<212> DNA
<213> Artificial sequence
<400> 236
cttggcaccc gagaattcca agcctaggcc gattcgac 38
<210> 237
<211> 38
<212> DNA
<213> Artificial sequence
<400> 237
cttggcaccc gagaattcca gattcgcggg cacagacg 38
<210> 238
<211> 38
<212> DNA
<213> Artificial sequence
<400> 238
cttggcaccc gagaattcca ttccagctcc gcctcctc 38
<210> 239
<211> 44
<212> DNA
<213> Artificial sequence
<400> 239
cttggcaccc gagaattcca cccatatcgt caatcttctc gagg 44
<210> 240
<211> 45
<212> DNA
<213> Artificial sequence
<400> 240
cttggcaccc gagaattcca tcacagtacc acagagtcta gactc 45
<210> 241
<211> 44
<212> DNA
<213> Artificial sequence
<400> 241
cttggcaccc gagaattcca aacctcttgt cctccaattt gtcc 44
<210> 242
<211> 42
<212> DNA
<213> Artificial sequence
<400> 242
cttggcaccc gagaattcca cctgctgcta tgcctcatct tc 42
<210> 243
<211> 39
<212> DNA
<213> Artificial sequence
<400> 243
cttggcaccc gagaattcca cacgggacca tgcaagacc 39
<210> 244
<211> 42
<212> DNA
<213> Artificial sequence
<400> 244
cttggcaccc gagaattcca tgggctttcg caagattcct at 42
<210> 245
<211> 39
<212> DNA
<213> Artificial sequence
<400> 245
cttggcaccc gagaattcca cgtagggctt tcccccact 39
<210> 246
<211> 51
<212> DNA
<213> Artificial sequence
<400> 246
cttggcaccc gagaattcca cctctattac caattttctt ttgtctttgg g 51
<210> 247
<211> 42
<212> DNA
<213> Artificial sequence
<400> 247
cttggcaccc gagaattcca acacaatgtg gctatcctgc tt 42
<210> 248
<211> 38
<212> DNA
<213> Artificial sequence
<400> 248
cttggcaccc gagaattcca ggcaacggtc aggtctct 38
<210> 249
<211> 43
<212> DNA
<213> Artificial sequence
<400> 249
cttggcaccc gagaattcca ctctgccgat ccatactgcg gaa 43
<210> 250
<211> 42
<212> DNA
<213> Artificial sequence
<400> 250
cttggcaccc gagaattcca cacttccttt ccatggctgc ta 42
<210> 251
<211> 39
<212> DNA
<213> Artificial sequence
<400> 251
cttggcaccc gagaattcca ccgtttggga ctctaccgt 39
<210> 252
<211> 38
<212> DNA
<213> Artificial sequence
<400> 252
cttggcaccc gagaattcca cgtgtgcact tcgcttca 38
<210> 253
<211> 44
<212> DNA
<213> Artificial sequence
<400> 253
cttggcaccc gagaattcca ttgcccaagg tcttacataa gagg 44
<210> 254
<211> 45
<212> DNA
<213> Artificial sequence
<400> 254
cttggcaccc gagaattcca gtttgtttaa ggactgggag gagtt 45
<210> 255
<211> 41
<212> DNA
<213> Artificial sequence
<400> 255
cttggcaccc gagaattcca ggtctgttca ccagcaccat g 41
<210> 256
<211> 38
<212> DNA
<213> Artificial sequence
<400> 256
cttggcaccc gagaattcca ctgtgccttg ggtggctt 38
<210> 257
<211> 47
<212> DNA
<213> Artificial sequence
<400> 257
cttggcaccc gagaattcca ttgccttctg atttctttcc ttctatt 47
<210> 258
<211> 43
<212> DNA
<213> Artificial sequence
<400> 258
cttggcaccc gagaattcca gagtctccgg aacattgttc acc 43
<210> 259
<211> 41
<212> DNA
<213> Artificial sequence
<400> 259
cttggcaccc gagaattcca agttgatgaa tctggccacc t 41
<210> 260
<211> 48
<212> DNA
<213> Artificial sequence
<400> 260
cttggcaccc gagaattcca cagctatgtt aatgttaata tgggccta 48
<210> 261
<211> 46
<212> DNA
<213> Artificial sequence
<400> 261
cttggcaccc gagaattcca tatttggtgt cttttggagt gtggat 46
<210> 262
<211> 41
<212> DNA
<213> Artificial sequence
<400> 262
cttggcaccc gagaattcca tagaggcagg tcccctagaa g 41
<210> 263
<211> 46
<212> DNA
<213> Artificial sequence
<400> 263
cttggcaccc gagaattcca caatgttagt atcccttgga ctcaca 46
<210> 264
<211> 47
<212> DNA
<213> Artificial sequence
<400> 264
cttggcaccc gagaattcca acaggaggac attattgata gatgtca 47
<210> 265
<211> 43
<212> DNA
<213> Artificial sequence
<400> 265
cttggcaccc gagaattcca aaccttacca agtatttgcc ctt 43
<210> 266
<211> 45
<212> DNA
<213> Artificial sequence
<400> 266
cttggcaccc gagaattcca tctgtggaag gctgggattc tatat 45
<210> 267
<211> 42
<212> DNA
<213> Artificial sequence
<400> 267
cttggcaccc gagaattcca gggacaaatc tttctgttcc ca 42
<210> 268
<211> 39
<212> DNA
<213> Artificial sequence
<400> 268
cttggcaccc gagaattcca ggccagaggc aaatcaggt 39
<210> 269
<211> 42
<212> DNA
<213> Artificial sequence
<400> 269
cttggcaccc gagaattcca cagtcaggaa gacagcctac tc 42
<210> 270
<211> 44
<212> DNA
<213> Artificial sequence
<400> 270
cttggcaccc gagaattcca aatactgtct ctgccatatc gtca 44
<210> 271
<211> 42
<212> DNA
<213> Artificial sequence
<400> 271
cttggcaccc gagaattcca gtgtgtttca tgagtgggag ga 42
<210> 272
<211> 44
<212> DNA
<213> Artificial sequence
<400> 272
cttggcaccc gagaattcca tttgccttct gacttctttc cgtc 44
<210> 273
<211> 40
<212> DNA
<213> Artificial sequence
<400> 273
cttggcaccc gagaattcca cacagcactc aggcaagcta 40
<210> 274
<211> 39
<212> DNA
<213> Artificial sequence
<400> 274
cttggcaccc gagaattcca gtcactgcca tggaggagc 39
<210> 275
<211> 40
<212> DNA
<213> Artificial sequence
<400> 275
cttggcaccc gagaattcca ccatgggact gactttctgc 40
<210> 276
<211> 43
<212> DNA
<213> Artificial sequence
<400> 276
cttggcaccc gagaattcca actgctcttt tcacccatct aca 43
<210> 277
<211> 41
<212> DNA
<213> Artificial sequence
<400> 277
cttggcaccc gagaattcca tgtccccgga cgatattgaa c 41
<210> 278
<211> 42
<212> DNA
<213> Artificial sequence
<400> 278
cttggcaccc gagaattcca cagatgaagc tcccagaatg cc 42
<210> 279
<211> 42
<212> DNA
<213> Artificial sequence
<400> 279
cttggcaccc gagaattcca tgtcatcttc tgtcccttcc ca 42
<210> 280
<211> 44
<212> DNA
<213> Artificial sequence
<400> 280
cttggcaccc gagaattcca caactctgtc tccttcctct tcct 44
<210> 281
<211> 39
<212> DNA
<213> Artificial sequence
<400> 281
cttggcaccc gagaattcca tgtgcagctg tgggttgat 39
<210> 282
<211> 42
<212> DNA
<213> Artificial sequence
<400> 282
cttggcaccc gagaattcca caagcagtca cagcacatga cg 42
<210> 283
<211> 43
<212> DNA
<213> Artificial sequence
<400> 283
cttggcaccc gagaattcca cctctgattc ctcactgatt gct 43
<210> 284
<211> 42
<212> DNA
<213> Artificial sequence
<400> 284
cttggcaccc gagaattcca ttgcgtgtgg agtatttgga tg 42
<210> 285
<211> 42
<212> DNA
<213> Artificial sequence
<400> 285
cttggcaccc gagaattcca tcttgggcct gtgttatctc ct 42
<210> 286
<211> 44
<212> DNA
<213> Artificial sequence
<400> 286
cttggcaccc gagaattcca acatgtgtaa cagttcctgc atgg 44
<210> 287
<211> 46
<212> DNA
<213> Artificial sequence
<400> 287
cttggcaccc gagaattcca cttgcttctc ttttcctatc ctgagt 46
<210> 288
<211> 41
<212> DNA
<213> Artificial sequence
<400> 288
cttggcaccc gagaattcca ctttgaggtg cgtgtttgtg c 41
<210> 289
<211> 39
<212> DNA
<213> Artificial sequence
<400> 289
cttggcaccc gagaattcca gcaagaaagg ggagcctca 39
<210> 290
<211> 43
<212> DNA
<213> Artificial sequence
<400> 290
cttggcaccc gagaattcca atcacctttc cttgcctctt tcc 43
<210> 291
<211> 40
<212> DNA
<213> Artificial sequence
<400> 291
cttggcaccc gagaattcca ttctccccct cctctgttgc 40
<210> 292
<211> 41
<212> DNA
<213> Artificial sequence
<400> 292
cttggcaccc gagaattcca cttcgagatg ttccgagagc t 41
<210> 293
<211> 41
<212> DNA
<213> Artificial sequence
<400> 293
cttggcaccc gagaattcca cctccctgct tctgtctcct a 41
<210> 294
<211> 40
<212> DNA
<213> Artificial sequence
<400> 294
cttggcaccc gagaattcca tcagtctacc tcccgccata 40
<210> 295
<211> 40
<212> DNA
<213> Artificial sequence
<400> 295
cttggcaccc gagaattcca gaaacttgct ccgaggtcca 40
<210> 296
<211> 40
<212> DNA
<213> Artificial sequence
<400> 296
cttggcaccc gagaattcca catccagcag ggaatgcagt 40
<210> 297
<211> 44
<212> DNA
<213> Artificial sequence
<400> 297
cttggcaccc gagaattcca gacacgatgc cattgttatc aaga 44
<210> 298
<211> 40
<212> DNA
<213> Artificial sequence
<400> 298
cttggcaccc gagaattcca ctgtctccag gagcagcttc 40
<210> 299
<211> 42
<212> DNA
<213> Artificial sequence
<400> 299
cttggcaccc gagaattcca cggaggtgag tacagaaagt gg 42
<210> 300
<211> 39
<212> DNA
<213> Artificial sequence
<400> 300
cttggcaccc gagaattcca ggaggcagct tgtgacacg 39
<210> 301
<211> 40
<212> DNA
<213> Artificial sequence
<400> 301
cttggcaccc gagaattcca ctcgtccagg atgctctcag 40
<210> 302
<211> 38
<212> DNA
<213> Artificial sequence
<400> 302
cttggcaccc gagaattcca gtggtggacg tggtggtg 38
<210> 303
<211> 44
<212> DNA
<213> Artificial sequence
<400> 303
cttggcaccc gagaattcca tgattttctg gttcttctcc gcat 44
<210> 304
<211> 44
<212> DNA
<213> Artificial sequence
<400> 304
cttggcaccc gagaattcca gaggtatcca catcctcttc ctca 44
<210> 305
<211> 40
<212> DNA
<213> Artificial sequence
<400> 305
cttggcaccc gagaattcca aggacttccc aggaatccag 40
<210> 306
<211> 38
<212> DNA
<213> Artificial sequence
<400> 306
cttggcaccc gagaattcca agctaggagg cccgactt 38
<210> 307
<211> 38
<212> DNA
<213> Artificial sequence
<400> 307
cttggcaccc gagaattcca acaacggcct tgaccctg 38
<210> 308
<211> 43
<212> DNA
<213> Artificial sequence
<400> 308
cttggcaccc gagaattcca ccaccccaaa tctgttaatc acc 43
<210> 309
<211> 40
<212> DNA
<213> Artificial sequence
<400> 309
cttggcaccc gagaattcca aacacttccc cgcgacttgg 40
<210> 310
<211> 38
<212> DNA
<213> Artificial sequence
<400> 310
cttggcaccc gagaattcca cgtgaagggg aggacgga 38
<210> 311
<211> 38
<212> DNA
<213> Artificial sequence
<400> 311
cttggcaccc gagaattcca ggggccatga tgtggagg 38
<210> 312
<211> 38
<212> DNA
<213> Artificial sequence
<400> 312
cttggcaccc gagaattcca aaggtgaagg ggcaggac 38
<210> 313
<211> 38
<212> DNA
<213> Artificial sequence
<400> 313
cttggcaccc gagaattcca gcggaaagga aggggagg 38
<210> 314
<211> 37
<212> DNA
<213> Artificial sequence
<400> 314
cttggcaccc gagaattcca gcagcacctc gcggtag 37
<210> 315
<211> 42
<212> DNA
<213> Artificial sequence
<400> 315
cttggcaccc gagaattcca ggaaagtata ggcccctcac tc 42
<210> 316
<211> 38
<212> DNA
<213> Artificial sequence
<400> 316
cttggcaccc gagaattcca ctctccatgt tcggggca 38
<210> 317
<211> 47
<212> DNA
<213> Artificial sequence
<400> 317
cttggcaccc gagaattcca gaggattctt gtcaacaaga aaaaccc 47
<210> 318
<211> 43
<212> DNA
<213> Artificial sequence
<400> 318
cttggcaccc gagaattcca acaagaggtt ggtgagtgat tgg 43
<210> 319
<211> 46
<212> DNA
<213> Artificial sequence
<400> 319
cttggcaccc gagaattcca gtccagaaga accaacaaga agatga 46
<210> 320
<211> 45
<212> DNA
<213> Artificial sequence
<400> 320
cttggcaccc gagaattcca catagaggtt ccttgagcag gaatc 45
<210> 321
<211> 43
<212> DNA
<213> Artificial sequence
<400> 321
cttggcaccc gagaattcca cactcccata ggaatcttgc gaa 43
<210> 322
<211> 43
<212> DNA
<213> Artificial sequence
<400> 322
cttggcaccc gagaattcca cccccaatac cacatcatcc ata 43
<210> 323
<211> 47
<212> DNA
<213> Artificial sequence
<400> 323
cttggcaccc gagaattcca agggttcaaa tgtataccca aagacaa 47
<210> 324
<211> 48
<212> DNA
<213> Artificial sequence
<400> 324
cttggcaccc gagaattcca agttttagta caatatgttc ttgcggta 48
<210> 325
<211> 41
<212> DNA
<213> Artificial sequence
<400> 325
cttggcaccc gagaattcca cattgtgtaa aaggggcagc a 41
<210> 326
<211> 46
<212> DNA
<213> Artificial sequence
<400> 326
cttggcaccc gagaattcca tgtttacaca gaaaggcctt gtaagt 46
<210> 327
<211> 39
<212> DNA
<213> Artificial sequence
<400> 327
cttggcaccc gagaattcca catgcggcga tggccaata 39
<210> 328
<211> 45
<212> DNA
<213> Artificial sequence
<400> 328
cttggcaccc gagaattcca ttccgagaga ggacaacaga gttgt 45
<210> 329
<211> 41
<212> DNA
<213> Artificial sequence
<400> 329
cttggcaccc gagaattcca gacgggacgt aaacaaagga c 41
<210> 330
<211> 40
<212> DNA
<213> Artificial sequence
<400> 330
cttggcaccc gagaattcca ggagaccgcg taaagagagg 40
<210> 331
<211> 40
<212> DNA
<213> Artificial sequence
<400> 331
cttggcaccc gagaattcca gtgcagaggt gaagcgaagt 40
<210> 332
<211> 45
<212> DNA
<213> Artificial sequence
<400> 332
cttggcaccc gagaattcca tccaagagtc ctcttatgta agacc 45
<210> 333
<211> 43
<212> DNA
<213> Artificial sequence
<400> 333
cttggcaccc gagaattcca caactcctcc cagtccttaa aca 43
<210> 334
<211> 40
<212> DNA
<213> Artificial sequence
<400> 334
cttggcaccc gagaattcca ggtgctggtg aacagaccaa 40
<210> 335
<211> 42
<212> DNA
<213> Artificial sequence
<400> 335
cttggcaccc gagaattcca cttggaggct tgaacagtag ga 42
<210> 336
<211> 45
<212> DNA
<213> Artificial sequence
<400> 336
cttggcaccc gagaattcca aattctttat acgggtcaat gtcca 45
<210> 337
<211> 38
<212> DNA
<213> Artificial sequence
<400> 337
cttggcaccc gagaattcca cagaggcggt gtcgagga 38
<210> 338
<211> 40
<212> DNA
<213> Artificial sequence
<400> 338
cttggcaccc gagaattcca acacagaaca gcttgcctga 40
<210> 339
<211> 44
<212> DNA
<213> Artificial sequence
<400> 339
cttggcaccc gagaattcca ctgggtcttc caaattactt ccca 44
<210> 340
<211> 46
<212> DNA
<213> Artificial sequence
<400> 340
cttggcaccc gagaattcca gtttctcttc caaaggtaag acagga 46
<210> 341
<211> 43
<212> DNA
<213> Artificial sequence
<400> 341
cttggcaccc gagaattcca acctgcctct acgtctaaca aca 43
<210> 342
<211> 47
<212> DNA
<213> Artificial sequence
<400> 342
cttggcaccc gagaattcca ttgtgagtcc aagggatact aacattg 47
<210> 343
<211> 44
<212> DNA
<213> Artificial sequence
<400> 343
cttggcaccc gagaattcca gggagtttgc cactcaggat taaa 44
<210> 344
<211> 47
<212> DNA
<213> Artificial sequence
<400> 344
cttggcaccc gagaattcca gggcaaatac ttggtaaggt taggata 47
<210> 345
<211> 49
<212> DNA
<213> Artificial sequence
<400> 345
cttggcaccc gagaattcca ccttccacag agtatgtaaa taatgccta 49
<210> 346
<211> 42
<212> DNA
<213> Artificial sequence
<400> 346
cttggcaccc gagaattcca ctcccatgct gtagctcttg tt 42
<210> 347
<211> 40
<212> DNA
<213> Artificial sequence
<400> 347
cttggcaccc gagaattcca gctgggtcca actggtgatc 40
<210> 348
<211> 40
<212> DNA
<213> Artificial sequence
<400> 348
cttggcaccc gagaattcca ccccaaaaga ccaccgtgtg 40
<210> 349
<211> 41
<212> DNA
<213> Artificial sequence
<400> 349
cttggcaccc gagaattcca tcttcctgac tgccgattgg t 41
<210> 350
<211> 40
<212> DNA
<213> Artificial sequence
<400> 350
cttggcaccc gagaattcca caagaccttg ggcaggttcc 40
<210> 351
<211> 43
<212> DNA
<213> Artificial sequence
<400> 351
cttggcaccc gagaattcca attctaaggc ttcccgatac aga 43
<210> 352
<211> 46
<212> DNA
<213> Artificial sequence
<400> 352
cttggcaccc gagaattcca acgctggatc ttctaaatta ttaccc 46
<210> 353
<211> 43
<212> DNA
<213> Artificial sequence
<400> 353
cttggcaccc gagaattcca gatccactca cagtttccat agg 43
<210> 354
<211> 40
<212> DNA
<213> Artificial sequence
<400> 354
cttggcaccc gagaattcca cagcccaacc cttgtcctta 40
<210> 355
<211> 41
<212> DNA
<213> Artificial sequence
<400> 355
cttggcaccc gagaattcca tgggagcttc atctggacct g 41
<210> 356
<211> 41
<212> DNA
<213> Artificial sequence
<400> 356
cttggcaccc gagaattcca gaagggacag aagatgacag g 41
<210> 357
<211> 41
<212> DNA
<213> Artificial sequence
<400> 357
cttggcaccc gagaattcca caagaagccc agacggaaac c 41
<210> 358
<211> 38
<212> DNA
<213> Artificial sequence
<400> 358
cttggcaccc gagaattcca cccctcaggg caactgac 38
<210> 359
<211> 44
<212> DNA
<213> Artificial sequence
<400> 359
cttggcaccc gagaattcca gtgctgtgac tgcttgtaga tggc 44
<210> 360
<211> 41
<212> DNA
<213> Artificial sequence
<400> 360
cttggcaccc gagaattcca atctgagcag cgctcatggt g 41
<210> 361
<211> 38
<212> DNA
<213> Artificial sequence
<400> 361
cttggcaccc gagaattcca ccctgtcgtc tctccagc 38
<210> 362
<211> 47
<212> DNA
<213> Artificial sequence
<400> 362
cttggcaccc gagaattcca ctatgtcgaa aagtgtttct gtcatcc 47
<210> 363
<211> 41
<212> DNA
<213> Artificial sequence
<400> 363
cttggcaccc gagaattcca gagaccccag ttgcaaacca g 41
<210> 364
<211> 38
<212> DNA
<213> Artificial sequence
<400> 364
cttggcaccc gagaattcca tgggcctccg gttcatgc 38
<210> 365
<211> 38
<212> DNA
<213> Artificial sequence
<400> 365
cttggcaccc gagaattcca gtgcagggtg gcaagtgg 38
<210> 366
<211> 39
<212> DNA
<213> Artificial sequence
<400> 366
cttggcaccc gagaattcca gacaggcaca aacacgcac 39
<210> 367
<211> 44
<212> DNA
<213> Artificial sequence
<400> 367
cttggcaccc gagaattcca ttcttgcgga gattctcttc ctct 44
<210> 368
<211> 40
<212> DNA
<213> Artificial sequence
<400> 368
cttggcaccc gagaattcca cgcttcttgt cctgcttgct 40
<210> 369
<211> 46
<212> DNA
<213> Artificial sequence
<400> 369
cttggcaccc gagaattcca acttgataag aggtcccaag acttag 46
<210> 370
<211> 38
<212> DNA
<213> Artificial sequence
<400> 370
cttggcaccc gagaattcca agcctgggca tccttgag 38
<210> 371
<211> 38
<212> DNA
<213> Artificial sequence
<400> 371
cttggcaccc gagaattcca caggaagggg ctgaggtc 38
<210> 372
<211> 44
<212> DNA
<213> Artificial sequence
<400> 372
cttggcaccc gagaattcca catgagtttt ttatggcggg aggt 44
<210> 373
<211> 41
<212> DNA
<213> Artificial sequence
<400> 373
cttggcaccc gagaattcca cagtggggaa caagaagtgg a 41
<210> 374
<211> 34
<212> DNA
<213> Artificial sequence
<400> 374
cttggcaccc gagaaggacg cttctacacg cgaa 34
<210> 375
<211> 38
<212> DNA
<213> Artificial sequence
<400> 375
cttggcaccc gagaacacga acgaaaagga acatgtct 38
<210> 376
<211> 32
<212> DNA
<213> Artificial sequence
<400> 376
cttggcaccc gagaacgagt tcgcggcttc gg 32
<210> 377
<211> 31
<212> DNA
<213> Artificial sequence
<400> 377
cttggcaccc gagaacagca gcagcagcgg g 31
<210> 378
<211> 39
<212> DNA
<213> Artificial sequence
<400> 378
cttggcaccc gagaacaaac ccacagggta tctatcagg 39
<210> 379
<211> 32
<212> DNA
<213> Artificial sequence
<400> 379
cttggcaccc gagaagctgg gcgtgcacga tc 32
<210> 380
<211> 32
<212> DNA
<213> Artificial sequence
<400> 380
cttggcaccc gagaacctgg catcgctcac cc 32
<210> 381
<211> 32
<212> DNA
<213> Artificial sequence
<400> 381
cttggcaccc gagaagaccg tggggctgtg ag 32
<210> 382
<211> 35
<212> DNA
<213> Artificial sequence
<400> 382
cttggcaccc gagaactctt caagctcgga atgga 35
<210> 383
<211> 31
<212> DNA
<213> Artificial sequence
<400> 383
cttggcaccc gagaagccgc tgcagacgga t 31
<210> 384
<211> 33
<212> DNA
<213> Artificial sequence
<400> 384
cttggcaccc gagaaaggag gggtggaacc cag 33
<210> 385
<211> 40
<212> DNA
<213> Artificial sequence
<400> 385
cttggcaccc gagaatggga gaagaaaaaa acacacacac 40
<210> 386
<211> 35
<212> DNA
<213> Artificial sequence
<400> 386
cttggcaccc gagaatttcg cgggacaaaa accac 35
<210> 387
<211> 35
<212> DNA
<213> Artificial sequence
<400> 387
cttggcaccc gagaatctaa gtggccaggg cactg 35
<210> 388
<211> 33
<212> DNA
<213> Artificial sequence
<400> 388
cttggcaccc gagaagatca gggcaccttg ggc 33
<210> 389
<211> 32
<212> DNA
<213> Artificial sequence
<400> 389
cttggcaccc gagaactgca acaccgcgag cc 32
<210> 390
<211> 35
<212> DNA
<213> Artificial sequence
<400> 390
cttggcaccc gagaacgctc tgcttacgtg ctgac 35
<210> 391
<211> 31
<212> DNA
<213> Artificial sequence
<400> 391
cttggcaccc gagaagccgc tgcagcagtc c 31
<210> 392
<211> 32
<212> DNA
<213> Artificial sequence
<400> 392
cttggcaccc gagaacgctg ttgccttggc ga 32
<210> 393
<211> 33
<212> DNA
<213> Artificial sequence
<400> 393
cttggcaccc gagaagccag ttgtagggag cga 33
<210> 394
<211> 35
<212> DNA
<213> Artificial sequence
<400> 394
cttggcaccc gagaacgaag aggtagaggc cctcg 35
<210> 395
<211> 32
<212> DNA
<213> Artificial sequence
<400> 395
cttggcaccc gagaagtccg ggctgagcgg at 32
<210> 396
<211> 35
<212> DNA
<213> Artificial sequence
<400> 396
cttggcaccc gagaagccct ccaccacggt tctat 35
<210> 397
<211> 33
<212> DNA
<213> Artificial sequence
<400> 397
cttggcaccc gagaagagtt cctcccagcc agc 33
<210> 398
<211> 34
<212> DNA
<213> Artificial sequence
<400> 398
cttggcaccc gagaagggac tggagggcgt agag 34
<210> 399
<211> 31
<212> DNA
<213> Artificial sequence
<400> 399
cttggcaccc gagaaacttc gcggcggctc a 31
<210> 400
<211> 34
<212> DNA
<213> Artificial sequence
<400> 400
cttggcaccc gagaaccaac tccacggttc ctgc 34
<210> 401
<211> 32
<212> DNA
<213> Artificial sequence
<400> 401
cttggcaccc gagaatgagg gcgaaggcct ga 32
<210> 402
<211> 34
<212> DNA
<213> Artificial sequence
<400> 402
cttggcaccc gagaaggtgg taccgatgag agcg 34
<210> 403
<211> 58
<212> DNA
<213> Artificial sequence
<400> 403
aatgatacgg cgaccaccga gatctacact ctttccctac acgacgctct tccgatct 58
<210> 404
<211> 24
<212> DNA
<213> Artificial sequence
<400> 404
caagcagaag acggcatacg agat 24
<210> 405
<211> 27
<212> DNA
<213> Artificial sequence
<400> 405
gtctcgtggg ctcggagatg tgtataa 27

Claims (10)

1.一种测序文库构建方法,依次包括如下步骤:
(1)取DNA样本,用甲基化敏感限制性内切酶酶切;
(2)将步骤(1)酶切后的DNA样本依次进行末端修复和3’端加A处理;
(3)将步骤(2)处理后的DNA样本与接头混合物中的接头连接,经过PCR扩增后得到文库;
所述接头混合物由n个接头组成;
每个接头均由一条上游引物甲和一条下游引物甲形成部分双链结构得到;上游引物甲中具有测序接头甲、随机标签、锚定序列甲和位于末端的碱基T;下游引物甲中具有锚定序列乙和测序接头乙;所述部分双链结构由锚定序列甲和锚定序列乙反向互补形成;
所述测序接头甲和测序接头乙为根据不同测序平台选择对应的测序接头;
所述随机标签为8-14bp的随机碱基;
所述锚定序列甲长度为12-20bp,连续重复碱基≤3个;
n个接头采用n个不同的锚定序列甲,且每个锚定序列甲中四种碱基平衡,错配碱基数>3;
n为≥8的任意自然数。
2.权利要求1所述方法构建得到的DNA文库。
3.一种用于构建测序文库的试剂盒,包括权利要求1中所述的接头混合物和甲基化敏感限制性内切酶。
4.一种用于检测DNA样本中肿瘤突变和/或甲基化的试剂盒,包括权利要求1中所述接头混合物和引物组合;所述引物组合由引物组Ⅰ、引物组Ⅱ、引物组Ⅲ、引物组Ⅳ、引物组Ⅴ、引物组Ⅵ、引物组Ⅶ和引物组Ⅷ组成;
所述引物组Ⅰ和所述引物组Ⅱ中的各个引物是根据与肿瘤突变相关的区域设计的特异性引物,作用是定位于基因组特定位置,实现目标区域的PCR富集;所述引物组Ⅰ和所述引物组Ⅱ分别从正负两个方向检测突变位点;
所述引物组Ⅲ和所述引物组Ⅳ中的各个引物是根据肿瘤特异高甲基化区域设计的特异性引物,作用是定位于基因组特定位置,实现目标区域的PCR富集;所述引物组Ⅲ和所述引物组Ⅳ分别从正负两个方向检测甲基化位点;
所述引物组Ⅴ、所述引物组Ⅵ、所述引物组Ⅶ和所述引物组Ⅷ中的各个引物均包括接头序列和特异序列,特异序列用于目标区域进行进一步富集;
所述引物组Ⅴ和所述引物组Ⅰ中,针对同一突变位点设计的两个引物为“巢式”关系;
所述引物组Ⅵ和所述引物组Ⅱ中,针对同一突变位点设计的两个引物为“巢式”关系;
所述引物组Ⅶ和所述引物组Ⅲ中,针对同一甲基化位点设计的两个引物为“巢式”关系;
所述引物组Ⅷ和所述引物组Ⅳ中,针对同一甲基化位点设计的两个引物为“巢式”关系;
所述肿瘤为肝脏恶性肿瘤;
所述引物组Ⅰ包括78个单链DNA分子,78个单链DNA分子的核苷酸序列依次如序列表的序列28至序列105所示;
所述引物组Ⅱ包括82个单链DNA分子,82个单链DNA分子的核苷酸序列依次如序列表的序列106至序列187所示;
所述引物组Ⅲ包括14个单链DNA分子,14个单链DNA分子的核苷酸序列依次如序列表的序列188至序列201所示;
所述引物组Ⅳ包括15个单链DNA分子,15个单链DNA分子的核苷酸序列依次如序列表的序列202至序列216所示;
所述引物组Ⅴ包括75个单链DNA分子,75个单链DNA分子依次包括如序列表的序列220至序列294自5’末端起第16位至3’末端所示的核苷酸序列;
所述引物组Ⅵ包括79个单链DNA分子,79个单链DNA分子依次包括如序列表的序列295至序列373自5’末端起第16位至3’末端所示的核苷酸序列;
所述引物组Ⅶ包括14个单链DNA分子,14个单链DNA分子依次包括如序列表的序列374至序列387自5’末端起第16位至3’末端所示的核苷酸序列;
所述引物组Ⅷ包括15个单链DNA分子,15个单链DNA分子依次包括如序列表的序列388至序列402自5’末端起第16位至3’末端所示的核苷酸序列。
5.权利要求4所述的引物组合。
6.S1)或S2)或S3):
S1)权利要求4所述的引物组合在制备用于检测DNA样本中肿瘤突变和/或甲基化的试剂盒中的应用;
S2)权利要求4所述的引物组合在制备用于区分肿瘤患者血液样本和非肿瘤患者血液样本的产品中的应用;
S3)权利要求4所述试剂盒在制备用于区分肿瘤患者血液样本和非肿瘤患者血液样本的产品中的应用。
7.一种检测DNA样本中目标突变和/或甲基化的方法,包括如下步骤:
(1)按照权利要求1所述的方法构建文库;
(2)对步骤(1)得到的文库进行两轮巢式PCR扩增,对产物进行测序,根据测序结果分析DNA样本中目标突变和/或甲基化发生情况;
所述步骤(2)中,采用引物组合甲进行第一轮PCR扩增;
引物组合甲由上游引物甲和下游引物组合甲组成;
所述上游引物甲为文库扩增引物,用于步骤(1)的文库扩增;
所述下游引物组合甲为根据X个目标靶点设计的Y条引物的组合;X和Y均为1以上的自然数,且X≤Y;
以第一轮PCR的产物为模板,采用引物组合乙进行第二轮PCR扩增;
引物组合乙由上游引物乙、下游引物组合乙和index引物组成;
所述上游引物乙为文库扩增引物且3’末端与所述上游引物甲部分相同,用于第一轮PCR的产物的扩增;
所述index引物自5’端包括用于测序的区段A、用于区分样本的index序列和用于测序的区段B;
所述下游引物组合乙中的引物具有所述区段B且与下游引物组合甲中检测相同目标靶点的引物形成巢式关系;
所述方法为非疾病诊断和治疗的方法。
8.如权利要求7所述的方法,其特征在于:
所述DNA样本中目标突变的分析方法为:将测序数据满足标准甲的DNA分子回溯到一个分子簇;将满足标准乙的分子簇标记为一对duplex分子簇;对某一突变来说,如果满足下述(a1)或(a2),则该突变为来自原始DNA样本的真实突变:(a1)至少有一对duplex分子簇支持;(a2)至少有4个分子簇支持;标准甲即同时满足①、②和③;①DNA***片段长度相同;②DNA***片段两端断点序列相同;③随机标签序列相同;标准乙即同时满足④、⑤和⑥;④DNA***片段长度相同且除突变点外序列一致;⑤分子簇两端的锚定序列相同但位置相反;⑥同一个起始DNA双链;
所述DNA样本中甲基化的分析方法为:将测序数据满足标准丙的DNA分子标记为一个簇,分别计算片段末端为关注酶切位点的簇的数量,记录为未甲基化的片段;计算扩增片段达到或超过第一个酶切位点的全部簇的数量,记录为片段总数;根据两种片段数量计算对应区域的平均甲基化水平;区域的甲基化水平=(1-未甲基化片段数/片段总数)×100%;标准丙即同时满足⑦、⑧、⑨和⑩;⑦随机标签序列相同;⑧内置标签序列相同;⑨DNA***片段长度相同;⑩DNA***片段两端断点序列相同。
9.一种检测DNA样本中多种目标突变和/或甲基化的方法,包括如下步骤:
(1)按照权利要求1所述的方法构建文库;
(2)对步骤(1)的文库进行靶区域富集并进行测序,根据测序结果分析DNA样本中目标突变和/或甲基化的发生情况;
所述方法为非疾病诊断和治疗的方法。
10.如权利要求9所述的方法,其特征在于:
所述DNA样本中目标突变的分析方法为:将测序数据满足标准甲的DNA分子回溯到一个分子簇;将满足标准乙的分子簇标记为一对duplex分子簇;对某一突变来说,如果满足下述(a1)或(a2),则该突变为来自原始DNA样本的真实突变:(a1)至少有一对duplex分子簇支持;(a2)至少有4个分子簇支持;标准甲即同时满足①、②和③;①DNA***片段长度相同;②DNA***片段两端断点序列相同;③随机标签序列相同;标准乙即同时满足④、⑤和⑥;④DNA***片段长度相同且除突变点外序列一致;⑤分子簇两端的锚定序列相同但位置相反;⑥同一个起始DNA双链;
所述DNA样本中甲基化的分析方法为:将测序数据满足标准丙的DNA分子标记为一个簇,分别计算片段末端为关注酶切位点的簇的数量,记录为未甲基化的片段;计算扩增片段达到或超过第一个酶切位点的全部簇的数量,记录为片段总数;根据两种片段数量计算对应区域的平均甲基化水平;区域的甲基化水平=(1-未甲基化片段数/片段总数)×100%;标准丙即同时满足⑦、⑧、⑨和⑩;⑦随机标签序列相同;⑧内置标签序列相同;⑨DNA***片段长度相同;⑩DNA***片段两端断点序列相同。
CN201910983038.8A 2019-10-16 2019-10-16 一种检测ctDNA中肿瘤特异基因的变异和甲基化的方法 Active CN112176419B (zh)

Priority Applications (6)

Application Number Priority Date Filing Date Title
CN201910983038.8A CN112176419B (zh) 2019-10-16 2019-10-16 一种检测ctDNA中肿瘤特异基因的变异和甲基化的方法
KR1020227016270A KR20220088724A (ko) 2019-10-16 2020-10-13 ctDNA에서 종양 특이적 유전자의 돌연변이 및 메틸화를 검출하는 방법
EP20876690.7A EP4023795A4 (en) 2019-10-16 2020-10-13 METHOD FOR DETECTING MUTATION AND METHYLATION OF TUMOR-SPECIFIC GENE IN CTDNA
PCT/CN2020/120560 WO2021073490A1 (zh) 2019-10-16 2020-10-13 一种检测ctDNA中肿瘤特异基因的变异和甲基化的方法
US17/768,891 US20230272475A1 (en) 2019-10-16 2020-10-13 A method for detecting the mutation and methylation of tumor-specific genes in ctdna
JP2022521219A JP2022551688A (ja) 2019-10-16 2020-10-13 ctDNA中の腫瘍特異的遺伝子の変異及びメチル化の検出方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910983038.8A CN112176419B (zh) 2019-10-16 2019-10-16 一种检测ctDNA中肿瘤特异基因的变异和甲基化的方法

Publications (2)

Publication Number Publication Date
CN112176419A CN112176419A (zh) 2021-01-05
CN112176419B true CN112176419B (zh) 2022-03-22

Family

ID=73919743

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910983038.8A Active CN112176419B (zh) 2019-10-16 2019-10-16 一种检测ctDNA中肿瘤特异基因的变异和甲基化的方法

Country Status (6)

Country Link
US (1) US20230272475A1 (zh)
EP (1) EP4023795A4 (zh)
JP (1) JP2022551688A (zh)
KR (1) KR20220088724A (zh)
CN (1) CN112176419B (zh)
WO (1) WO2021073490A1 (zh)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112397150B (zh) * 2021-01-20 2021-04-20 臻和(北京)生物科技有限公司 基于目标区域捕获测序的ctDNA甲基化水平预测装置及方法
CN112852934B (zh) * 2021-04-16 2022-02-18 武汉友芝友医疗科技股份有限公司 检测基因甲基化的引物、试剂和试剂盒
CN113674802B (zh) * 2021-08-20 2022-09-09 深圳吉因加医学检验实验室 一种基于甲基化测序数据进行变异检测的方法及装置
CN113718034A (zh) * 2021-09-27 2021-11-30 中国医学科学院肿瘤医院 一种指导卵巢癌铂耐药患者用药及疗效评估的标志物、检测试剂盒及检测方法
CN114093428B (zh) * 2021-11-08 2023-04-14 南京世和基因生物技术股份有限公司 一种ctDNA超高测序深度下低丰度突变的检测***和方法
CN115410649B (zh) * 2022-04-01 2023-03-28 北京吉因加医学检验实验室有限公司 一种同时检测甲基化和突变信息的方法及装置

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102943074A (zh) * 2012-10-25 2013-02-27 盛司潼 一种接头和构建测序文库的方法
CN106497920A (zh) * 2016-11-21 2017-03-15 深圳华大基因研究院 一种用于非小细胞肺癌基因突变检测的文库构建方法及试剂盒
WO2018144813A1 (en) * 2017-02-02 2018-08-09 New York Genome Center Methods and compositions for identifying or quantifying targets in a biological sample
CN108893466A (zh) * 2018-06-04 2018-11-27 苏州人人基因科技有限公司 测序接头、测序接头组和超低频突变的检测方法
WO2019158722A1 (en) * 2018-02-15 2019-08-22 Qiagen Gmbh Sequencing method

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AU2003903430A0 (en) * 2003-07-04 2003-07-17 Johnson & Johnson Research Pty Limited Method for detection of alkylated cytosine in dna
CN102877136B (zh) * 2012-09-24 2014-03-12 上海交通大学 基于基因组简化与二代测序dna文库构建方法及试剂盒
RU2016147914A (ru) * 2014-05-09 2018-06-18 Лайфкодекс Аг Обнаружение днк, которая происходит из специфического клеточного типа, и относящиеся к нему способы
PL3262190T3 (pl) * 2015-02-24 2021-12-20 Ruprecht-Karls-Universität Heidelberg Panel biomarkerów do wykrywania nowotworu
CA3020628A1 (en) * 2016-04-14 2017-10-19 Mayo Foundation For Medical Education And Research Detecting pancreatic high-grade dysplasia
CN107723352A (zh) * 2016-08-12 2018-02-23 嘉兴允英医学检验有限公司 一种循环肿瘤dna肝癌驱动基因高通量检测方法
WO2018045322A1 (en) * 2016-09-02 2018-03-08 Mayo Foundation For Medical Education And Research Detecting hepatocellular carcinoma
CA3046636A1 (en) * 2016-12-12 2018-06-21 Cepheid Integrated purification and measurement of dna methylation and co-measurement of mutations and/or mrna expression levels in an automated reaction cartridge
WO2019099420A1 (en) * 2017-11-15 2019-05-23 Yan Wang A method for detecting multiple dna mutations and copy number variations
CN108103060A (zh) * 2017-12-27 2018-06-01 广州赛哲生物科技股份有限公司 ctDNA甲基化建库的标签接头、引物组、试剂盒和建库方法
CN110669823B (zh) * 2018-07-03 2022-05-24 中国医学科学院肿瘤医院 一种同时检测多种肝癌常见突变的ctDNA文库构建和测序数据分析方法
US20220162709A1 (en) * 2019-04-03 2022-05-26 Mayo Foundation For Medical Education And Research Detecting pancreatic ductal adenocarcinoma in plasma
CN110904225B (zh) * 2019-11-19 2022-04-12 中国医学科学院肿瘤医院 用于肝癌检测的组合标志物及其应用

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102943074A (zh) * 2012-10-25 2013-02-27 盛司潼 一种接头和构建测序文库的方法
CN106497920A (zh) * 2016-11-21 2017-03-15 深圳华大基因研究院 一种用于非小细胞肺癌基因突变检测的文库构建方法及试剂盒
WO2018144813A1 (en) * 2017-02-02 2018-08-09 New York Genome Center Methods and compositions for identifying or quantifying targets in a biological sample
WO2019158722A1 (en) * 2018-02-15 2019-08-22 Qiagen Gmbh Sequencing method
CN108893466A (zh) * 2018-06-04 2018-11-27 苏州人人基因科技有限公司 测序接头、测序接头组和超低频突变的检测方法

Also Published As

Publication number Publication date
CN112176419A (zh) 2021-01-05
WO2021073490A1 (zh) 2021-04-22
US20230272475A1 (en) 2023-08-31
KR20220088724A (ko) 2022-06-28
JP2022551688A (ja) 2022-12-13
EP4023795A1 (en) 2022-07-06
EP4023795A4 (en) 2023-09-06

Similar Documents

Publication Publication Date Title
CN112176419B (zh) 一种检测ctDNA中肿瘤特异基因的变异和甲基化的方法
JP6968894B2 (ja) メチル化dnaの多重検出方法
Kim et al. Deep sequencing reveals distinct patterns of DNA methylation in prostate cancer
WO2019144582A1 (zh) 用于检测基因突变和已知、未知基因融合类型的高通量测序靶向捕获目标区域的探针和方法
CN110669823B (zh) 一种同时检测多种肝癌常见突变的ctDNA文库构建和测序数据分析方法
CN110760936B (zh) 构建dna甲基化文库的方法及其应用
CN110117574B (zh) 一种基于多重pcr富集循环肿瘤dna的方法和试剂盒
WO2019062289A1 (zh) 一种探针及其适用于高通量测序的对目标区域进行富集的方法
CN107012221A (zh) 基于阻断物的富集***及其应用
CN116445581A (zh) 少突胶质细胞瘤相关基因高通量扩增子文库的制备方法、多重pcr引物对及应用
CN112094914B (zh) 一种联合检测急性髓细胞白血病的试剂盒
KR20220077907A (ko) 라이브러리 구축 방법 및 응용
CN114774553A (zh) 一种利用高通量测序技术检测多基因位点突变的方法
CN110714077A (zh) 同时检测brca1/2外显子序列和化疗用药位点的引物及应用
CN112266963B (zh) 一种联合检测慢性粒细胞白血病检测试剂盒
CN112063690A (zh) 单分子探针多重靶向捕获文库的构建方法及应用
CN117305466B (zh) 一种能够识别单碱基甲基化状态的检测方法
CN114774514B (zh) 一种适用于高通量靶向基因组甲基化检测的文库构建方法及其试剂盒
EP3012328B1 (en) Methods for detecting oncogenic mutations
CN113186286A (zh) 一种多重巢式pcr方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant