CN110527714B - 用于检测hpv在宿主基因组的整合位点的方法 - Google Patents

用于检测hpv在宿主基因组的整合位点的方法 Download PDF

Info

Publication number
CN110527714B
CN110527714B CN201910840742.8A CN201910840742A CN110527714B CN 110527714 B CN110527714 B CN 110527714B CN 201910840742 A CN201910840742 A CN 201910840742A CN 110527714 B CN110527714 B CN 110527714B
Authority
CN
China
Prior art keywords
hpv
sequence
host genome
genome
sequencing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910840742.8A
Other languages
English (en)
Other versions
CN110527714A (zh
Inventor
孟博
田埂
王伟伟
董如一
杨文娟
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Geneis Beijing Co ltd
Original Assignee
Geneis Beijing Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Geneis Beijing Co ltd filed Critical Geneis Beijing Co ltd
Priority to CN201910840742.8A priority Critical patent/CN110527714B/zh
Publication of CN110527714A publication Critical patent/CN110527714A/zh
Application granted granted Critical
Publication of CN110527714B publication Critical patent/CN110527714B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/70Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving virus or bacteriophage
    • C12Q1/701Specific hybridization probes
    • C12Q1/708Specific hybridization probes for papilloma

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Organic Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Health & Medical Sciences (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Engineering & Computer Science (AREA)
  • Immunology (AREA)
  • Microbiology (AREA)
  • Biotechnology (AREA)
  • Molecular Biology (AREA)
  • Biophysics (AREA)
  • Analytical Chemistry (AREA)
  • Physics & Mathematics (AREA)
  • Biochemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Virology (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本发明公开一种用于检测HPV在宿主基因组的整合位点的方法,包括以下步骤:从来自受试者的生物样本中提取宿主基因组DNA,并将其打断至主峰为800bp‑4kb的片段;利用探针组对得到的片段中进行第一检测获得目标序列;对获得的目标序列进行预处理以提高检测灵敏度;和基于电信号测序技术在不进行PCR扩增的情况下对目标序列进行第二检测,从而确认HPV在宿主基因组的整合位点。本发明的方法能够快速、及时分析HPV病毒存在于宿主细胞内的状态判断,具有显著的临床应用优势,应用本方法在无需错误纠正分析的情况下即可更有效地判断HPV的整合信息。

Description

用于检测HPV在宿主基因组的整合位点的方法
技术领域
本发明涉及病毒整合位点的检测,具体地涉及用于检测HPV在宿主基因组的整合位点的方法。
背景技术
HPV病毒整合入人基因组是引发癌症发生的重要过程事件,目前对该过程的了解还比较有限,越来越多的研究表明HPV整合是作为分子诊断和个体化治疗的潜在分子标志物,也是非常有价值的预后指标。对于HPV整合的研究方法目前多应用基于二代测序技术的探针捕获方法获得。例如,CN107739761A公开了一种HPV分型及整合的高通量测序检测方法。该方法选取目前HPV亚型的基因,结合第二代高通量测序技术,更全面的检测患者感染HPV的类型,克服了传统检测方法准确率低、假阳性高、重复性差、漏诊率高等困难。在分子诊断领域,最直接而明确的技术是基因测序,第二代高通量测序技术比目前多采用经典的Sanger测序方法有检通量更大、测序速度更快、精确度更高、成本更低和信息量更丰富等优点。该方法在第二代高通量测序技术帮助下,可以对高危型HPV及低危型HPV进行精确分型并检测其是否发生人类基因组的整合,对检测者进行精确地个体化评估,预防病变发生的风险,从而预防肿瘤的发生。虽然基于二代测序的捕获技术比较成熟,但都针对于短片段DNA的探针捕获或者目的片段扩增,并且二代测序读长较短且灵敏性太高,极易导致假阳性结果,而且二代方法仅对断点位置进行检出,对于长序列的整合结构很难鉴定。
近来,三代测序越来越凸显其长读长及快速检测病原的特点,但对于病毒整合位点的检出还比较少见,而且三代测序结果的错误率较高,目前公认的错误率为10-15%,给结果的可信性带来问题,因此对于三代测序数据的分析一般需要增加错误校正的步骤,从而提高测序结果的准确性和可信度。尽管现有许多错误校正的方法,比如根据二代和三代的测序结果对三代进行校正,或者将三代结果进行多次自校正从而降低错误率,但是由于校正软件的结果差异和用户选择能力的限制,对于其应用造成较大地限制。
发明内容
为解决现有技术中的至少部分技术问题,本发明提供一种用于检测HPV在宿主基因组的整合位点的方法。具体地,本发明包括以下内容。
本发明的第一方面,提供一种用于检测HPV在宿主基因组的整合位点的方法,其包括以下步骤:
(1)从来自受试者的生物样本中提取宿主基因组DNA,并将所述宿主基因组DNA打断至主峰为800bp-4kb的片段;
(2)利用探针组在步骤(1)所得到的片段中进行第一检测获得目标序列,其中,所述探针组由多个探针组成,且各探针分别包括能够与HPV基因组的特定区域选择性杂交的序列,所述目标序列包含来源于HPV基因的序列和来源于宿主基因组的序列;
(3)对步骤(2)中获得的目标序列进行预处理得到预处理后的目标序列以提高检测灵敏度;和
(4)基于电信号测序在不进行PCR扩增的情况下对目标序列进行第二检测,从而确认HPV在宿主基因组的整合位点。
优选地,根据本发明的用于检测HPV在宿主基因组的整合位点的方法,所述生物样本为宫颈脱落细胞或***组织。
优选地,根据本发明的用于检测HPV在宿主基因组的整合位点的方法,所述探针组中的各探针设计为针对HPV全基因组的连续性区域。
优选地,根据本发明的用于检测HPV在宿主基因组的整合位点的方法,所述步骤(3)中的预处理包括对所述目标序列进行富集。
优选地,根据本发明的用于检测HPV在宿主基因组的整合位点的方法,所述步骤(3)中的预处理包括在所述目标序列的两端添加第一接头,然后通过与所述第一接头选择性杂交的引物进行PCR扩增。
优选地,根据本发明的用于检测HPV在宿主基因组的整合位点的方法,所述步骤(4)的第二检测包括在预处理后的目标序列的末端加A,然后依次连接条形码,接下来进行纳米孔测序。
优选地,根据本发明的用于检测HPV在宿主基因组的整合位点的方法,所述纳米孔测序的深度为5000×至10000×。
本发明的第二方面,提供另一种用于检测HPV在宿主基因组的整合位点的方法,其包括以下步骤:
(1)从来自受试者的生物样本中提取宿主基因组DNA,并将所述宿主基因组DNA打断至主峰为800bp-4kb的片段;
(2)在所述片段的一端连接第三接头,利用由多个特异性引物组成的引物组和与所述第三接头选择性杂交的通用引物扩增得到目标序列,其中,所述多个特异性引物分别设计为能够与HPV基因组中的连续性序列选择性杂交,从而使所述引物组覆盖整个HPV基因组序列;和
(3)基于电信号测序在不进行PCR扩增的情况下对目标序列进行检测,从而确认HPV在宿主基因组的整合位点。
本发明的第三方面,提供另一种用于检测HPV在宿主基因组的整合位点的方法,其包括以下步骤:
(1)从来自受试者的生物样本中提取宿主基因组DNA,并将所述宿主基因组DNA打断至主峰为800bp-4kb的片段;
(2)在所述片段的一端连接第三接头,利用多个特异性引物组成的引物组和与所述第三接头选择性杂交的通用引物扩增得到目标序列,其中,所述多个特异性引物分别设计为能够与已知的一种HPV整合位点一侧的基因序列选择性杂交;和
(3)基于电信号测序在不进行PCR扩增的情况下对目标序列进行检测,从而确认HPV在宿主基因组的整合位点。
进一步地,根据本发明的用于检测HPV在宿主基因组的整合位点的方法,所述确认HPV在宿主基因组的整合位点进一步包括数据分析步骤,其包括:对原始测序数据进行质控,除去噪音数据,得到待分析数据;使所述待分析数据与HPV基因组序列和宿主基因组序列分别进行比对,得到含有比对质量分值、比对序列位置信息的结果;按照UCSC的公式,计算比对结果的分值和一致性,分别选取HPV和宿主比对最好的结果,将两个结果组合到一起的结果输出列表;保留列表中既与HPV基因组序列又与宿主基因组序列完全比对的测序读长并比较两者的位置关系,当两种比对序列在该序列上的位置距离为间隔或者重叠10个碱基时,判断该序列即为HPV整合序列;合并相同断点序列并统计断点序列数,有5条以上序列被检出具有该相同断点时,则判断为正确的HPV整合位点。
本发明首次采用利用探针或引物对宿主基因组的打断片段进行初步检测,然后对初步检测得到的目标序列制定了优化建库及分析策略,从而建立了一套从实验方法建立到准确地进行HPV病毒断点分析的方法,通过无需错误校正的生物信息学分析流程,可以快速准确地鉴定出HPV病毒在人基因组中的整合位点,为满足科研和临床需要提供新的策略。
附图说明
图1本发明方法中示例性验证断点的引物和序列信息。
图2本发明方法中新的断点PCR扩增结果示意图。该图为针对本发明方法检出的特定整合位点设计的人与HPV病毒序列的引物PCR扩增后的DNA片段产物进行1%琼脂糖凝胶电泳的结果。其中,A-O的每个字母分别代表十三个不同的断点位置。该图说明了每对引物都成功地扩增出了本方法测序获得的整合位点序列。
图3本发明方法中基于Sanger测序断点结果示意图。A-O的每个字母分别代表十三个不同的断点位置。结果中显示的为图2扩增产物的一代Sanger法测序结果,这些测序结果经过NCBI blast网站比对后证明均有部分人和HPV的序列,位置与本方法的测序结果一直。全长测序信息于图1中。
图4为被Sanger法验证的13个断点位置信息。
图5为检出的17个已知断点。
图6为基于不同方法鉴定出的HPV断点数比较Venn图。其中,Nanopore结果为本发明的方法鉴定结果,NGS为二代测序方法鉴定结果,Paper为已发表的已知断点结果。
具体实施方式
现详细说明本发明的多种示例性实施方式,该详细说明不应认为是对本发明的限制,而应理解为是对本发明的某些方面、特性和实施方案的更详细的描述。
应理解本发明中所述的术语仅仅是为描述特别的实施方式,并非用于限制本发明。另外,对于本发明中的数值范围,应理解为具体公开了该范围的上限和下限以及它们之间的每个中间值。在任何陈述值或陈述范围内的中间值以及任何其他陈述值或在所述范围内的中间值之间的每个较小的范围也包括在本发明内。这些较小范围的上限和下限可独立地包括或排除在范围内。
除非另有说明,否则本文使用的所有技术和科学术语具有本发明所述领域的常规技术人员通常理解的相同含义。虽然本发明仅描述了优选的方法和材料,但是在本发明的实施或测试中也可以使用与本文所述相似或等同的任何方法和材料。本说明书中提到的所有文献通过引用并入,用以公开和描述与所述文献相关的方法和/或材料。在与任何并入的文献冲突时,以本说明书的内容为准。
目前对病毒在基因组上的整合位点的确定多通过Sanger测序和二代测序的方法,一方面,二代测序有一定的优势,但其读长短对长序列的病毒整合结构很难检出,其可信度较低。另一方面,纳米测序技术需要多次自校正以降低其错误率。考虑到上述两点,本发明通过研究发现,采用多组探针的设计富集HPV病毒的整合位点序列,优化建库的测序及分析策略,建立一套从实验方法到进行HPV病毒断点分析的方法,以及通过无需错误校对的生物信息学分析流程,可以快速准确地鉴定出HPV病毒在人基因组中的整合位点,能够为满足科研和临床需要提供新的策略。
本发明的方法一般包括以下步骤:(一)提取基因组DNA并得到打断片段的步骤;(二)获取目标序列的步骤;和(三)确认HPV在宿主基因组的整合位点。下面详细说明各步骤。
步骤(一):
本发明的步骤(一)为提取基因组DNA并得到打断片段的步骤。在示例性实施方案中,其包括从来自受试者的生物样本中提取宿主基因组DNA,并将其打断至主峰为800bp-4kb的片段,即为步骤(1)。
本发明的受试者一般为哺乳动物或人类,优选为人。生物样本一般为宫颈相关的样本,包括宫颈脱落细胞或***组织。宿主基因组为对应于受试者的基因组,一般为人基因组。
本发明的基因组打断方式可采用已知手段。这些手段可参考已知的教科书,例如冷泉港的《分子克隆实验指南》第四版等公开出版物等。打断的片段的长度需要主峰为800bp-4kb,优选1kb-4kb,更优选1.5kb-3.5kb,例如2.5kb。
步骤(二):
本发明的步骤(二)为从所得到的片段中获取目标序列的步骤。其中目标序列是指包含来源于HPV基因的序列和来源于宿主基因组的序列。来源于HPV基因的序列可以位于目标序列的5’端,也可以位于其3’端。对此不特别限定。类似地,来源于HPV基因的序列可以位于目标序列的5’端,也可以位于其3’端。
在某些实施方案中,本发明的步骤(二)包括下述步骤:
(2)利用探针组对得到的片段中进行第一检测获得目标序列,其中,探针组由多个探针组成,且各探针分别包括能够与HPV基因组的特定区域选择性杂交的序列;(3)对获得的目标序列进行预处理以提高检测灵敏度。
本发明的第一检测步骤的目的是通过特定的探针组获得含HPV基因的宿主基因组片段,即含有整合位点的目标序列。本发明的探针组为特别设计的多个探针组成的探针组合。优选地,探针组中的各探针对HPV全基因组的不同区域,且这些不同区域为连续性区域,从而覆盖HPV全基因组。优选地,探针组对于HPV全基因组的覆盖度为2×。这里的HPV全基因组为包括编码致癌蛋白重要因子的基因区,其包括早期基因区、晚期基因区及长调控区。
在步骤(3),即对获得的目标序列进行预处理以提高检测灵敏度中,预处理可包括对目标序列进行富集的过程。预处理还可包括在目标序列的两端分别添加第一接头,然后通过利用与第一接头的至少一部分选择性杂交的引物进行PCR扩增。第一接头的序列长度一般为6-50nt,优选10-30nt,更优选10-20nt。第一接头的序列只要能够与宿主基因组和HPV基因组中的序列区分开,则不特别限定。第一接头序列可包括已知序列和随机序列。例如,已知序列可以是6至13个连续的碱基,随机序列可以是1至13个连续的碱基。例如,第一接头序列可以如TATGGGCAGTCGT所示。第一接头可采用本领域已知接头。在一种示例性实施方案中,使用的第一接头优选为适用于A-T连接型文库所用接头,再优选地,例如Intergrated DNA Technologies的封阻序列
Figure BDA0002193618710000071
Universal Blocker-TS Mix序列和封闭基因组重复序列的Human Cot-1DNA,然后通过两端连接的方式与宿主DNA片段连接,然后与所述第一接头选择性杂交的引物进行PCR扩增。富集后的PCR产物使用Agilent HighSensitivity DNA2100芯片检测其大小和丰度。
在某些实施方案中,本发明的步骤(二)包括通过特异性引物与通用引物的组合来得到目标序列。本发明的特异性引物一般为多个,由此组成引物组。本发明的通用引物一般为一个。通用引物与引物组组合使用。
本发明的特异性引物分别设计为能够与HPV基因组中的特定区域选择性杂交,多个特异性引物对应的特定区域组成连续性区域或序列,从而使引物组覆盖整个HPV基因组序列。
为此引入通用引物,本发明需要在打断片段的一端连接第三接头。第三接头的序列长度一般为6-50nt,优选10-30nt,更优选10-20nt。第三接头的序列只要能够与宿主基因组和HPV基因组中的序列区分开,则不特别限定。第三接头序列可包括已知序列和随机序列。例如,已知序列可以是6至13个连续的碱基,随机序列可以是1至13个连续的碱基。例如,第三接头序列可以如TATGGGCAGTCGT所示。第三接头可采用本领域已知接头。第三接头可以与上述第一接头相同,也可以不同。需要说明的是,与第一接头不同,第三接头只能连接至打断片段的单端,而不能连接至两端。
在某些实施方案中,本发明的特异性引物设计为能够与HPV已知的一种整合位点一侧的基因序列选择性杂交,多个特异性引物则能够与HPV已知的多个整合位点一侧的基因序列选择性杂交,从而能够特异性获取特定的整合位点的信息。已知的整合位点一般是指高发性整合热点。例如,非同源性重组高发整合热点位置,发生区域包括脆性位点、异位断裂位点、转录活跃位点。
步骤(三):
本发明的步骤(三)为确认HPV在宿主基因组的整合位点。具体地,其可包括基于电信号测序在不进行PCR扩增的情况下对目标序列进行第二检测,从而确认HPV在宿主基因组的整合位点,即步骤(4)。示例性方案中,步骤(4)包括对第一检测后得到的目标序列末端加A,然后依次连接条形码和第二接头,进行纳米孔测序。需要注意的是,这里的测序流程并不包括PCR的步骤,在示例性实施方案中,测序深度为10000×,以达到对HPV整合位点序列的深度检测。具体来说,通过第一检测得到的生物样本的DNA末端使用NEBNext末端修复或加dA尾模块试剂盒,优选地,使用例如NEBNext End Repair/dA-tailed试剂来进行DNA末端修复和dA尾添加,纯化后添加原生条形码连接,进一步纯化后添加第二接头连接到制备好的DNA末端,优选地,第二接头为Oxford Nanopore Technology公司的Ligation SequencingKit试剂盒中提供的测序接头,纯化后连接条形码的DNA产物连接第二接头后进行磁珠纯化,然后进行纳米孔测序。磁珠纯化步骤采用已知方法进行,在示例性实施方案中,使用AMPure XP磁珠进行产物纯化。原生条形码和第二接头可以通过已知方法合成或购于已知商品,例如使用无PCR条形码接头或Barcode模块试剂盒,优选地,采用Oxford NanoporeTechnology公司的Ligation Sequencing Kit试剂盒中提供的原生条形码和条形码接头,适配于本发明方法中无PCR的纳米孔测序机器和后续的生物信息学流程分析。
本发明的步骤(三)还包括数据处理或分析的步骤。已知纳米孔测序结果错误率较高,目前错误率为10%-15%。目前错误校正通过分析软件进行。考虑到软件输出结果的差异和用户选择能力的限制,且应用于病毒的整合研究非常少见。通过本发明的生物信息学分析流程,基于整合序列的鉴定需求,合并两种序列比对方法,并优化筛选断点的参数,从而可以显著提高分析的速度和准确性,找到准确可验证的病毒整合位点信息。具体来说,本发明的生物信息分析流程包括:对原始测序数据进行质控,除去噪音数据,得到待分析数据,质控流程不做特别限定,在示例性实施方案中,按照Oxford Nanopore Technologies公司的EPI2ME agent Barcoding分析流程进行质控,最小的qscore值为7;使待分析数据与HPV基因组序列和宿主基因组序列分别进行比对,得到含有比对质量分值、比对序列位置信息的结果,优选地,其对比参数为blat-stepSize=5-repMatch=2253-minScore=20-minIdentity=0-noHead refence_database input.fa output.psl;按照UCSC的公式,计算比对结果的分值和一致性,分别选取HPV和宿主比对最好的结果,将两个结果组合到一起的结果输出列表;保留列表中既与HPV基因组序列又与宿主基因组序列完全比对的测序读长并比较两者的位置关系,当两种比对序列在该序列上的位置距离为间隔或者重叠10个碱基时,判断该序列即为HPV整合序列;合并相同断点序列并统计断点序列数,有5条以上序列被检出具有该相同断点时,则判断为正确的HPV整合位点;对该序列中的HPV和人基因组上的断点位置通过annovar软件进行基因组上的功能注释。需要说明的是,本发明采用的以HPV整合位点检出作为分析依据,其适用于其他DNA整合病毒在宿主中的整合位点检出分析过程。
进一步地,通过以上说明的优化的建库流程和分析方法,本发明准确鉴定出多个HPV整合阳性样品中的断点位置,并通过Sanger法进行了验证,结果证明了该套鉴定HPV病毒的策略非常有效。
实施例
本实施例用于示例性说明本发明方法。
一、样本信息
选择一例IIIb宫颈鳞状细胞癌的新鲜癌组织作为样本进行HPV整合检测。
二、实验步骤
1、基因组DNA提取
基因组DNA的提取采用盐析法,并分别使用Nanodrop 2000、Qubit方式定量和1.0%琼脂糖凝胶进行片段大小质控。基因组DNA产量大于3μg,片段大于5kb。
2、DNA打断
样品打断方法采用microTUBE-50打断管,打断体积50μl,打断参数采用Peakincident Power(W):75;Duty Factor:5%;Cycles Per Burst:200。将基因组DNA打断成主峰在不同长度800bp的片段,2.0%琼脂糖凝胶跑胶质检,合格的样品接下来的杂交捕获和富集步骤。
3、HPV探针杂交
目标区域根据NCBI网站的HPV基因序列为参考基因组序列,目标捕获区域为HPV全基因组区域,在全基因组区域进行连续性的探针设计。依据HPV全基因组设计并合成DNA探针(Intergrated DNA Technolaogy),参照xGen hybridization capture of DNAlibraries(Intergrated DNA Technolaogy)使用说明书对病毒序列进行杂交捕获,获取目标序列并使用PCR进行富集。富集后的PCR产物使用Agilent High Sensitivity DNA 2100芯片检测大小和丰度,符合要求的DNA量和质量的样品用于下一步实验。
4、其他目的区段扩增方法
对于起始DNA量不能达到捕获要求的样品,采用扩增模板的方法进行富集。具体策略为:a.将DNA打断为目的片段长度,单端连接接头,用HPV基因组序列覆盖的多条引物和单端接头通用引物扩增,将扩增产物纯化后进行下一步建库;b.针对数据库中已有报道的高发整合热点位置设计引物,将断点序列包含在扩增产物区域内,扩增产物纯化质检,符合条件的进行下一步建库。
5、测序文库的构建
5.1 DNA末端修复,加“A”和纯化
反应体系如表1所示,将配置好的反应混合液震荡混匀,反应条件:20℃,30min;65℃,30min;4℃保持。反应结束后,使用60μl(1×)AMPure XP磁珠进行产物纯化,回收DNA溶于25μl无核酶水中。
表-1末端修复体系
Figure BDA0002193618710000111
Figure BDA0002193618710000121
5.2条形码连接
条形码连接反应体系如表2所示,将配置好的反应混合液震荡混匀,25℃孵育15min。使用50μl(1×)AMPure XP磁珠进行产物纯化,回收DNA溶于26μl无核酶水中。
表-2条形码连接体系
Figure BDA0002193618710000122
5.3接头连接
接头连接体系如表3所示,将配置好的反应混合液震荡混匀,室温孵育10min。使用40μl(0.4×)AMPure XP磁珠进行产物纯化,然后加入140μl接头磁珠结合反应液(ABB)洗涤2遍,回收DNA溶于15μl洗脱缓冲液(ELB)中。产物使用Qubit方式定量。
表-3接头连接体系
Figure BDA0002193618710000123
6、上机测序
使用纳米孔测序仪(Oxford Nanopore Technology MinION)进行测序。
6.1准备芯片制备液
芯片制备液体系如表4所示,准备一个测序芯片,并打开芯片制备口,先消除内壁气泡,然后加入800μl表4中的混合液,静止5min。
表-4芯片制备液体系
Figure BDA0002193618710000131
6.2预测序溶液制备及上样
上样体系如表5所示,保持芯片制备孔打开的同时,打开加样孔,首先缓慢将200μl芯片制备液注入芯片制备孔,然后将75μl预测序溶液逐滴加入加样口。最后,关闭加样口和芯片制备口,开始测序,使目标区域平均测序深度达到10000×以上。
表-5上样体系
Figure BDA0002193618710000132
三、数据分析
7.1数据质控
原始下机数据FASTQ文件质控按照Oxford Nanopore Technologies公司的EPI2MEagent Barcoding分析流程进行质控,最小的qscore值为7。
7.2序列比对
使用Blat分析流程将干净序列与HPV和人基因组序列进行比对,得到含有比对质量分值、比对序列位置信息等的结果,比对参数为blat-stepSize=5-repMatch=2253-minScore=20-minIdentity=0-noHead refence_database input.fa output.psl。
7.3分值和一致性结果输出
按照UCSC的公式,计算比对结果的分值和一致性,分别选取HPV和human比对最好的结果,将两个结果组合到一起的结果输出列表;
7.4 HPV整合序列位置判断
保留列表中既比对上HPV序列又比对上人基因组序列的测序读长并比较HPV和人序列在测序读长上的位置关系,两种比对序列在该序列上的位置距离为间隔或者重叠10个碱基以内的情况,认为该序列即为HPV整合序列;合并相同断点序列并统计断点序列数,有5条以上序列被检出具有该相同断点的判断为正确的HPV整合位点。
7.5功能注释
对该序列中的HPV和人基因组上的断点位置通过annovar软件进行基因组上的功能注释;
8、结果验证
采用本发明对已知整合位点测定其检出率,在检出的这些位点中,通过二代测序方法和Sanger验证并计算其验证率。
四、实验结果
应用本发明的方法对已知整合位点的检出率为17检出/19已知(89.5%)。此外,该方法还检出了其他未知整合位点39个,在检出的这些位点中,有15个被二代测序方法验证,另外抽取了13个位点进行Sanger验证,其中13个位点全部被验证为正确的整合位点,验证率为抽样的100%,13个整合位点的引物信息见图1,PCR扩增结果见图2所示,Sanger测序断点结果见图3,4所示。检出的17个已知断点见图5。综上所述,利用该分析流程对一例已知HPV整合阳性的样品的整合位点检出结果中共发现59个整合位点,其中45个被其他方法验证,剩下的14个位点未进行验证,位点的总验证率为76.3%。据不同方法鉴定出的HPV断点数比较Venn图见图6所示。
尽管本发明已经参考示例性实施方案进行了描述,但应理解本发明不限于公开的示例性实施方案。在不背离本发明的范围或精神的情况下,可对本发明说明书的示例性实施方案做多种调整或变化。权利要求的范围应基于最宽的解释以涵盖所有修改和等同结构与功能。

Claims (4)

1.一种基于纳米孔测序检测HPV在宿主基因组的整合位点的方法,其特征在于,包括以下步骤:
(1)从来自受试者的生物样本中提取宿主基因组DNA,并将所述宿主基因组DNA打断至主峰为800bp-4kb的片段;
(2)利用对于HPV全基因组的覆盖度为2×的探针组在步骤(1)所得到的片段中进行第一检测获得目标序列,其中,所述探针组由多个探针组成,且各探针分别包括能够与HPV基因组的早期基因区、晚期基因区和长调控区的区域选择性杂交的序列,各探针设计为针对HPV全基因组的连续性区域,所述目标序列包含来源于HPV基因的序列和来源于宿主基因组的序列;
(3)对步骤(2)中获得的目标序列进行预处理得到预处理后的目标序列以提高检测灵敏度,所述预处理包括在所述目标序列的两端添加第一接头,然后通过利用与所述第一接头选择性杂交的引物进行PCR扩增;和
(4)基于电信号测序在不进行PCR扩增的情况下对目标序列进行第二检测,从而基于包括以下步骤的分析来确认HPV在宿主基因组的整合位点:
对原始测序数据进行质控,除去噪音数据,得到待分析数据;
使所述待分析数据与HPV基因组序列和宿主基因组序列分别进行比对,得到含有比对质量分值、比对序列位置信息的结果;
按照UCSC的公式,计算比对结果的分值和一致性,分别选取HPV和宿主比对最好的结果,将两个结果组合到一起的结果输出列表;
保留列表中既与HPV基因组序列又与宿主基因组序列完全比对的测序读长并比较两者的位置关系,当两种比对序列在该序列上的位置距离为间隔或者重叠10个碱基时,判断该序列即为HPV整合序列;
合并相同断点序列并统计断点序列数,有5条以上序列被检出具有该相同断点时,则判断为正确的HPV整合位点。
2.根据权利要求1所述的基于纳米孔测序检测HPV在宿主基因组的整合位点的方法,其特征在于,所述生物样本为宫颈脱落细胞或***组织。
3.根据权利要求1所述的基于纳米孔测序检测HPV在宿主基因组的整合位点的方法,其特征在于,所述步骤(4)的第二检测包括在预处理后的目标序列的末端加A,然后依次连接条形码和第二接头,接下来进行纳米孔测序。
4.根据权利要求3所述的基于纳米孔测序检测HPV在宿主基因组的整合位点的方法,其特征在于,所述纳米孔测序的深度为5000×至10000×。
CN201910840742.8A 2019-09-06 2019-09-06 用于检测hpv在宿主基因组的整合位点的方法 Active CN110527714B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910840742.8A CN110527714B (zh) 2019-09-06 2019-09-06 用于检测hpv在宿主基因组的整合位点的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910840742.8A CN110527714B (zh) 2019-09-06 2019-09-06 用于检测hpv在宿主基因组的整合位点的方法

Publications (2)

Publication Number Publication Date
CN110527714A CN110527714A (zh) 2019-12-03
CN110527714B true CN110527714B (zh) 2023-03-28

Family

ID=68667418

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910840742.8A Active CN110527714B (zh) 2019-09-06 2019-09-06 用于检测hpv在宿主基因组的整合位点的方法

Country Status (1)

Country Link
CN (1) CN110527714B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110957008B (zh) * 2020-02-26 2020-06-23 广州市金域转化医学研究院有限公司 检测人类基因组病毒整合位点的方法及装置
CN111020019B (zh) * 2020-03-06 2020-06-19 元码基因科技(北京)股份有限公司 基于纳米孔技术进行基因融合检测的方法
CN113096735B (zh) * 2021-03-01 2023-05-16 重庆医科大学 从离体血清中分析hbv dna整合事件的***及方法

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110093454A (zh) * 2019-04-24 2019-08-06 南京格致医学检验有限公司 用于多种hpv分型鉴定和基因组整合分析的扩增测序方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103320522B (zh) * 2013-07-16 2016-03-30 深圳华大基因研究院 确定人***样本基因组中hpv整合位点的方法和***

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110093454A (zh) * 2019-04-24 2019-08-06 南京格致医学检验有限公司 用于多种hpv分型鉴定和基因组整合分析的扩增测序方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
Genome-wide profiling of the human papillomavirus DNA integration in cervical intraepithelial neoplasia and normal cervical epithelium by HPV capture technology;Ying Liu et al;《Scientific Reports》;20161019;1-6 *
基因测序技术及其临床应用;陈丹等;《中华临床实验室管理电子杂志》;20141128(第04期);216-222 *

Also Published As

Publication number Publication date
CN110527714A (zh) 2019-12-03

Similar Documents

Publication Publication Date Title
CN110527714B (zh) 用于检测hpv在宿主基因组的整合位点的方法
Babarinde et al. Computational methods for mapping, assembly and quantification for coding and non-coding transcripts
CN110628880A (zh) 一种同步使用信使rna与基因组dna模板检测基因变异的方法
CN108103164B (zh) 一种利用多重荧光竞争性pcr检测拷贝数变异的方法
WO2019076018A1 (zh) 一种用于检测目的基因低频突变的扩增子文库的构建方法
CN111961729A (zh) 一种用于检测5-羟甲基胞嘧啶含量的试剂盒及其应用
WO2023035889A1 (zh) 基因融合的检测方法和装置
CN112094916B (zh) 一种血浆游离dna肺癌基因联合检测试剂盒
CN107849569A (zh) 肺腺癌生物标记物及其应用
CN104995314A (zh) 用于基因型鉴定结核分枝杆菌的引物、snp标记及方法
CN115341031A (zh) 一种泛癌甲基化生物标志物的筛选方法、生物标志物及应用
CN105803054A (zh) 试剂盒及其在检测唇腭裂相关基因中的用途
CN113564266B (zh) Snp分型遗传标记组合、检测试剂盒及用途
CN112259165B (zh) 用于检测微卫星不稳定性状态的方法及***
CN115948607B (zh) 同时检测多种病原体基因的方法和试剂盒
Bock et al. Genome-wide mapping of DNA methylation: a quantitative technology comparison
CN111575349A (zh) 一种接头序列及其应用
CN116121360A (zh) 一种用于检测dba致病基因集合的试剂盒及检测方法
CN117051136A (zh) 一种结核分枝杆菌复合群鉴定及耐药检测引物组
CN111235270B (zh) 一种基于高通量测序法的肿瘤抗原表达检测引物及试剂盒
CN114807302B (zh) 扩增子文库构建方法及用于地中海贫血突变型与缺失型基因检测的试剂盒
CN112251512A (zh) 用于非小细胞肺癌患者基因检测的目标基因组以及相关的评估方法、用途和试剂盒
CN117821596B (zh) 用于高灵敏度甲状腺结节良恶性辅助诊断的ngs检测方法
CN117625778B (zh) 用于检测色素失禁症ikbkg基因多种突变的方法及引物和试剂盒
CN114277096B (zh) 鉴别地中海贫血αααanti4.2杂合型和HKαα杂合型的方法和试剂盒

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant