CN114005490B - 基于二代测序技术的循环肿瘤dna融合检测方法 - Google Patents

基于二代测序技术的循环肿瘤dna融合检测方法 Download PDF

Info

Publication number
CN114005490B
CN114005490B CN202111640988.4A CN202111640988A CN114005490B CN 114005490 B CN114005490 B CN 114005490B CN 202111640988 A CN202111640988 A CN 202111640988A CN 114005490 B CN114005490 B CN 114005490B
Authority
CN
China
Prior art keywords
sequence
read
sequencing
dna
sequences
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202111640988.4A
Other languages
English (en)
Other versions
CN114005490A (zh
Inventor
姬晓勇
汪彦荣
潘晓西
高司航
王欢欢
伍启熹
王建伟
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Youxun Medical Devices Co ltd
Original Assignee
Beijing Youxun Medical Devices Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Youxun Medical Devices Co ltd filed Critical Beijing Youxun Medical Devices Co ltd
Priority to CN202111640988.4A priority Critical patent/CN114005490B/zh
Publication of CN114005490A publication Critical patent/CN114005490A/zh
Application granted granted Critical
Publication of CN114005490B publication Critical patent/CN114005490B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids
    • G16B30/10Sequence alignment; Homology search
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/1003Extracting or separating nucleic acids from biological samples, e.g. pure separation or isolation methods; Conditions, buffers or apparatuses therefor
    • C12N15/1006Extracting or separating nucleic acids from biological samples, e.g. pure separation or isolation methods; Conditions, buffers or apparatuses therefor by means of a solid support carrier, e.g. particles, polymers
    • C12N15/1013Extracting or separating nucleic acids from biological samples, e.g. pure separation or isolation methods; Conditions, buffers or apparatuses therefor by means of a solid support carrier, e.g. particles, polymers by using magnetic beads
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Organic Chemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Wood Science & Technology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Zoology (AREA)
  • Biotechnology (AREA)
  • Physics & Mathematics (AREA)
  • Genetics & Genomics (AREA)
  • Analytical Chemistry (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Biochemistry (AREA)
  • Microbiology (AREA)
  • Molecular Biology (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Plant Pathology (AREA)
  • Evolutionary Biology (AREA)
  • Medical Informatics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Theoretical Computer Science (AREA)
  • Immunology (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本发明涉及基因检测领域,具体涉及一种基于二代测序技术的循环肿瘤DNA融合检测方法。本发明提供了一种基于分割序列的基因融合检测方法,其在计算的整个过程中不涉及序列的拼装,有利于节省运行速度;在采用序列‑数字转换方法比较序列的相似性时,运行速度更快。此外,本发明还优化了提取方法和损伤修复方法,其进一步有利于融合基因的检测效果。

Description

基于二代测序技术的循环肿瘤DNA融合检测方法
技术领域
本发明涉及基因检测领域,具体涉及一种基于二代测序技术的循环肿瘤DNA融合检测方法。
背景技术
早在1948年,Mandel和Métais首次报道了人体血液中游离核苷酸(cfNA)的存在。在报道初期并未引起科学家们对cfNA存在的重视,直到在1994年一篇关于癌症患者的血液中检测到了RAS基因的突变,人们才意识到了cfDNA的重要性。随着细胞游离DNA (cell-free DNA)在癌症患者的血液中被检测到了微卫星体变异,在过去的十几年中研究人员对于癌症病人血液中cfNAs (DNA, mRNA, microRNAs)研究的大量投入,cfDNA的潜在研究价值越来越显著。
液体活检(Liquid Biopsy)与传统的组织活检相比有着迅速、便捷、损伤性小等众多优点。临床医生可以用它来监测肿瘤对治疗的反应,预测肿瘤复发。从长远角度来看,液体活检还能够帮助医生在患者未出现任何症状的时候发现最初期的肿瘤。同时cfDNA的含量水平不单单只反映肿瘤生长进展,也可以在正常人体内呈现相关的波动性变化。一般来说,恶性肿瘤患者cfDNA的含量高于无肿瘤患者,但是人们依旧可以在良性病变、炎症、组织创伤中进行定量化来进行区分。到现今为止,是什么生理因素的改变导致癌症的发生和进展依旧没有研究彻底,但是可以通过对循环肿瘤细胞游离DNA(ctDNA)的研究就能对肿瘤的发生及其进展进行监测,了解其相关突变基因。此外,循环miRNAs最近也被证明是潜在的癌症生物标记物。
癌症治疗手段多种多样,包括放疗、化疗以及新兴的靶向治疗和免疫治疗;其中,靶向治疗是精准医学的重要组成,而对于靶向基因特异性人群的筛选尤为重要,癌症的基因检测直接关系到药物对于患者的治疗效率。目前,用于检测的主要样本类型是肿瘤组织或穿刺样本;但是组织样本均为有创操作,有时难以实施,且这些操作受肿瘤大小、部位、患者一般情况等影响,有时不能取得满意的组织,存在一系列的局限性。肿瘤细胞坏死及脱落的肿瘤细胞进入血液后凋亡释放ctDNA进入外周血。近些年血浆游离肿瘤DNA(ctDNA)被认为是一种可检测肿瘤特异性改变的样本。
ctDNA用于肿瘤突变检测优势在于:操作无创或微创;在疾病的任一进程中都可获取;可以作为一种肿瘤标记物,实现实时检测和动态检测;克服肿瘤组织的异质性。然而,目前使用ctDNA检测基因突变仍有一些技术上的挑战,主要表现为:1)ctDNA含量因人而异,并且大多数人含量较低;2)ctDNA片段相对小,大部分约为180bp,片段分布在100bp~400bp;3)ctDNA中肿瘤相关的DNA所占比例不同人差别较大,并且常因比例小而难以测出。这些限制了ctDNA在肿瘤检测中的广泛应用,因此,高效的便捷的ctDNA的提取是影响ctDNA在肿瘤检测中广泛应用的重要因素。
现有检测循环肿瘤DNA突变的方法有很多,但基于二代测序的方法应用最多,检测手段也最为丰富。在基于二代测序的方法中最为主要的技术实现手段有两种:一种为高深度测序的目标区域捕获或扩增方法,另一种为加分子条形码或分子标签的建库测序方法。这两种方法在实验上依据常规二代测序建库方法,不仅可以有效的检测到样本循环肿瘤DNA的高频突变,而且还能有效地检测到低频甚至超低频突变(>=0.1%)。
基因融合在基因组中是普遍存在的,它是由两个不相关的基因发生了染色体易位、中间缺失或染色体倒置形成一个新基因的过程。诸多研究表明,基因融合与各种疾病,特别是癌症的发生发展紧密相关,甚至是一些癌症的直接诱因,所以基因融合也成为了当前组学大数据分析中的一项重要研究内容。因此,基因融合可能与各种癌症的发生发展紧密相关,这些融合基因还可能是潜在的药物靶点,非常有必要对它们进行深入的研究。
目前结构变异检测软件计算的结果断点坐标准确度低,然而进行验证实验时,不仅需要知道精准的断裂位置,以方便后续的引物设计;而且多数需要序列组装。同时,目前结构变异检测软件还存在检测速度慢、资源要求高等特点。
发明内容
本发明的目的是提供一种基于分割序列的融合检测方法,可以提供准确的断点坐标,且不需要进行序列拼装,从而提高融合检测的运行速度。
具体而言,本发明首先提供一种基于二代测序技术的检测融合基因的方法,其包括:
将测序序列与参考基因组进行比对,得到原始BAM文件,去除重复序列和比对到多个位置上的序列后,得到用于进一步检测的最终BAM文件;;
从最终的BAM文件中,提取包含软截断的读段,按照读段断裂的坐标和方向拆分成不同的读段组;
将同一个读段组的读段进行两两比较,去除长度过短、与读段组其余读段序列相似性过低、或包含重复序列的读段,并进一步提取与其余读段匹配度最高的一条读段进行下一步的检测,将此时读段组的读段数作为支持变异的读段数;
将上一步提取出的读段序列软截断部分重新比对到参考基因组上,若比对打分过低或重新比对到的基因组位置与原序列比对到的基因组位置过近,则不进行下一步的检测;
将原序列比对坐标和重新比对坐标进行注释;将原序列比对坐标对应的深度做为深度,支持变异的读段数与深度的比值做为变异频率,同时输出到结果文件中。
作为优选,所述包含软截断的读段的提取及分组具体包括:
根据每条测序读段的cigar信息,确定测序读段的比对模式,若测序读段没有软截断,则cigar的模式为“M”,若测序读段左侧有软截断,则cigar的模式为“SM”,若测序读段右侧有软截断,则cigar的模式为“MS”,将携带软截断的测序读段的原比对染色体、坐标做为key,软截断部分的序列做为value读入一个哈希表中,该哈希表同时保留测序序列的正负链和软截断部分的测序碱基质量信息。
作为优选,所述将同一个读段组的读段进行两两比较具体包括:
(1)提取读段组与其余读段匹配度最高的一条读段,假设读段的长度为L,则从原读段的断裂处按照1个碱基的步长,提取L条序列,按照下列规则对这些序列进行数字转换:
S1、构建二进制序列:根据一条读段分别按A、T、C、G构建4条二进制序列,用1代表和读段上相同的碱基,用0代表和读段上不同的碱基,对于每一种碱基得到一条长度为L的二进制序列;然后按照A、T、C、G的顺序将4条长度为L的二进制序列连接在一起,得到1条长度为4L的二进制序列;
S2、首先设置二阶矩阵
Figure 369029DEST_PATH_IMAGE001
代表1,二阶矩阵
Figure 970912DEST_PATH_IMAGE002
代表0;其次用上一步得到的 4L二进制序列的顺序,依次做矩阵的乘法,最后得到一个二阶的矩阵,使用该二阶矩阵,左 乘权重矩阵
Figure 430843DEST_PATH_IMAGE003
,得到最终的矩阵,计算该矩阵的迹,将其定义为该序列的“序列数 字”;计算出L个序列数字,将其存入一个数组;
(2)设置变量T和F的初始值分别为0,依次遍历原读段比对到同一坐标的剩余软截断序列,分别计算其序列数字,看是否存在于数组中,如存在则T加1,如不存在则F加1;遍历完成后,比较数值T和F,如T大于阈值(默认为4)且大于设定阈值的倍数(默认0.5倍),则认为这一组的软截断序列通过过滤,并将长度最长的这条测序序列的原比对位置和T值做为ID,将序列及测序质量输出;其中,T值即为支持变异的序列数。
在采用上述序列-数字转换方法比较序列的相似性时,有利于提高软件的运行速度,降低软件对资源的需求。
在进行具体实施时,可在将测序序列与参考基因组进行比对前,先对测序序列进行预处理,去除低质量、含N以及含有adapter的测序序列。
作为本发明的一种优选实施方式,所述的基于二代测序技术的检测融合基因的方法包括如下步骤:
1、数据预处理:使用fqtools软件,去除低质量、含N以及含有adapter的测序序列;
2、数据比对、去重、提取唯一比对序列:将经过上一步数据预处理的测序序列,与人类基因组hg19进行比对获得bam文件,利用Picard和Samtools分别去除比对到的重复序列和比对到多个位置上的序列;
3、提取可能携带基因融合信号的测序序列的软截断部分:根据每条测序读段的cigar信息,确定测序读段的比对模式,若测序读段没有软截断,则cigar的模式为“M”,若测序序列左侧有软截断,则cigar的模式为“SM”,若测序序列右侧有软截断,则cigar的模式为“MS”,将携带软截断的测序序列的原比对染色体、坐标做为key,软截断部分的序列做为value读入一个哈希表中,该哈希表同时保留测序读段的正负链和软截断部分的测序碱基质量信息;
4、对提取的软截断的信息进行过滤:
将原读段比对到基因组同一坐标的所有软截断部分的序列进行比较,步骤如下所示:
(1)提取读段组与其余读段匹配度最高的一条读段,假设读段的长度为L,则从读段在原序列的断裂处从1个碱基的步长,提取L条序列,按照下列规则对这些序列进行数字转换(以长度为L的序列为例):
S1、构建二进制序列:序列由A、G、C、T 4种碱基组成,分别按A、T、C、G根据一条序列构建4条二进制序列,用1代表和序列上相同的碱基,用0代表和序列上不同的碱基。因此,对于每一种碱基可以得到一条长度为L的二进制序列。然后按照A、T、C、G的顺序将4条长度为L的二进制序列连接在一起,得到1条长度为4L的二进制序列;
S2、首先设置二阶矩阵
Figure 286935DEST_PATH_IMAGE001
代表1,二阶矩阵
Figure 439699DEST_PATH_IMAGE002
代表0。其次用上一步得到的 4L二进制序列的顺序,依次做矩阵的乘法,最后会得到一个二阶的矩阵,使用该二阶矩阵, 左乘权重矩阵
Figure 997719DEST_PATH_IMAGE003
,得到最终的矩阵,计算该矩阵的迹,将其定义为该序列的“序列数 字”;
由于序列长度为L,则可计算出L个序列数字,将其存入一个数组;
(2)设置变量T和F的初始值分别为0,依次遍历原序列比对到同一坐标的剩余软截断序列,分别计算其序列数字,看是否存在于数组中,如存在则T加1,如不存在则F加1。遍历完成后,比较数值T和F,如T大于4且大于F的0.5倍,则认为这一组的软截断序列通过过滤,并将长度最长的这条测序序列的原比对位置和T值做为ID,将序列、测序质量以FASTQ的格式输出到新的文件;
5、重新比对:采用BWA,将新生成的FASTQ格式文件比对到参考基因组上;
6、根据重新比对坐标、比对质量进行过滤:将上一步提取出的读段序列软截断部分重新比对到参考基因组上,若比对打分过低或重新比对到的基因组位置与原序列比对到的基因组位置过近,则不进行下一步的检测;;
7、坐标位置注释:将原序列比对坐标和重新比对坐标进行注释,并输出到结果文件中;
8、变异频率及深度:将T值做为支持变异的读段数,将原读段比对坐标对应的深度做为深度,支持变异的序列数比上深度做为变异频率,同时输出到结果文件中。
本发明的检测方法虽然可以降低软件对资源的需求,但较好的提取效率将进一步有利于对实际样本的检测。而在检测ctDNA的融合基因时,目前商品化的ctDNA提取试剂盒主要有柱提法和磁珠法,柱提法提取效率高,但柱提法受样本基质干扰较大,需要离心机、真空泵等复杂仪器;磁珠法提取简单快捷,不需要复杂仪器,并且可以结合提取工作站等减少手工操作,但目前商品化的磁珠提取试剂盒提取效率一般,亟待解决提取效率的问题。
为此,本发明进一步对ctDNA的提取方法进行了优化,得到如下的优选方案。
作为优选,在检测ctDNA的融合基因时,作为优选,所述方法还包括:
使用核酸助沉剂提取待测样品中的ctDNA,并进行测序,以得到测序序列;
所述核酸助沉剂中含有1μg/μL~5μg/μLCarrier RNA和3±0.5M醋酸钠。
本发明发现,通过上述的核酸助沉剂可以游离循环肿瘤DNA的提取效率。
作为优选,采用磁珠法提取待测样品中的ctDNA,具体包括:
将待测样品与蛋白酶K溶液、磁珠悬浮液、裂解结合液和核酸助沉剂混合,使ctDNA结合到磁珠上,而后用洗涤磁珠,最后从磁珠上将ctDNA洗脱下来;
其中,所述裂解结合液中含有1%~10%的十二烷基硫酸钠、45mmol/L Tris-Hcl、120mmol/LNaCl、30 mmol/L乙二胺四乙酸二钠、10~30mol/L异硫氰酸胍、2~4 mol/L醋酸钾和5~10 wt%吐温20,pH值为4.8±0.2。
作为优选,所述的蛋白酶K溶液中含有45~75mmol/L Tris-Hcl和100~120 mmol/LNaCl。
作为优选,所述洗涤磁珠具体包括:通过第一洗涤液和第二洗涤液依次洗涤磁珠;
所述第一洗涤液中含有45~75mmol/L Tris-Hcl、100~120mmol/LNaCl、30~60mmol/L乙二胺四乙酸二钠和1.5±0.2wt%曲拉通,pH值为5.5±0.2;
所述第二洗涤液包含45~75mmol/L Tris-Hcl和75±5 vol%的乙醇。
作为优选,在进行洗脱时,洗脱液为无核酸酶水。
作为一种优选的实施方案,提取待测样品中的ctDNA的方法具体包括:1)按1mg/500~1000μL的比例预先将蛋白酶K预先溶于蛋白酶溶解缓冲液中形成蛋白酶K溶液,向离心管中加入20μL蛋白酶K溶液和20μL 磁珠悬浮液;2)转移300μL血清或血浆样品至含离心管中;3)加入450μL 裂解结合液至离心管中,涡旋混匀30秒,再加入2μL核酸助沉剂,室温颠倒混匀15分钟;4)转移至磁力架上,静置3分钟吸附磁珠,吸弃溶液;5)加入500μL 第一洗涤液,涡旋混匀30秒;6)转移至磁力架上,静置3分钟吸附磁珠,吸弃溶液;7)加入500μL 第二洗涤液,涡旋混匀30秒;8)转移至磁力架上,静置3分钟吸附磁珠,吸弃溶液;9)重复步骤7)和8)一次;10)离心,收集管离心管壁上的液滴,转移至磁力架上,吸弃溶液;11)空气干燥10分钟;12)加35μL的洗脱液,涡旋打散磁珠,室温放置5~10分钟,期间震荡2~3次加速DNA溶解;13)转移至磁力架上,静置3分钟,转移溶解的DNA至新的离心管中保存,溶解的DNA即为游离循环肿瘤DNA。
现有方法所提取的ctDNA(4mL血浆样本)所得到的ctDNA在10~1000ng范围内波动,为了满足一些用药位点的低频率检测,甚至肿瘤早筛的目的,有限的建库起始输入对ctDNA有效文库转化是及其重要的。目前的技术,检测想达到1%的检出率,稳定的建库起始用量在50ng以上是比较可靠的。即使提取达到50ng以上,有的样本依旧有不少样本无法构建出足够量的文库(至少1000ng的文库),用于去做杂交捕获。而为了满足杂交捕获,需要增加循环数,导致后期生物信息分析结果的重复(Duplication)数值高,浪费上机数据量及其成本。何况依然有较高比例的样本低于50ng的建库起始量,在0.5%甚至更低的频率检测,结果的真实性不理想。
本发明发现,ctDNA存在某种未知的损伤,在文库构建前先对损伤进行修复,并对修复后的DNA进行文库构建,能够增加部分文库的转化,满足杂交捕获的用量,并且能够提高所构建得到的文库的质量,提高目的片段的测序深度,降低产出数据中的重复序列,从而提高检测准确性,降低上机成本。
以下方法不仅适用于ctDNA,同样适用于基因组DNA 打断后的DNA片段,或者其他方式受损伤的DNA片段。
作为优选,在检测ctDNA或受损伤的DNA的融合基因时,所述方法还包括:
采用修复工作液对提取得到的DNA进行修复后,再进行测序;
所述修复工作液中含有DNA损伤修复酶,所述DNA损伤修复酶为UDG(Uracil-DNAGlycocasylase,尿嘧啶-DNA糖基化酶)、内切核酸酶IV和T4 PDG的混合物;在每μL修复工作液中,UDG的含量为3~4U,内切核酸酶IV的含量为6~8U,T4 PDG的含量为6~8U。
本发明发现,上述DNA损伤修复酶对DNA损伤修复的效果更佳,同时,ctDNA所能构建的文库的量的增加尤为明显,所构建的文库中的目的片段的测序深度较深,有效数据量也相对比较高,因而测序结果也更准确,能够实现对低频突变的检测。
作为优选,所述基于二代测序技术的检测融合基因的方法还包括:对修复后的DNA进行文库构建,得到DNA文库。
进一步优选的,在构建DNA文库时,采用修复工作液对提取得到的DNA进行修复;
所述修复工作液中含有所述DNA损伤修复酶和DNA末端修复酶;所述DNA末端修复酶为T4 DNA 聚合酶和PNK激酶的混合物;在每μL修复工作液中,T4 DNA 聚合酶的含量为50~100U,PNK激酶的含量为100~200U。
通过上述方法,有助于在末端修复步骤中同时实现对DNA损伤的修复,进而提高所构建的文库的量,从而产出较多的有效数据量。
更优选地,所述DNA酶和DNA酶的体积比为1:0.8-1.2,进一步优选为1:1时,更有利于修复反应的充分进行。
在另一种优选的实施例中,所述修复工作液还包括末端修复缓冲液,末端修复缓冲液可以选自现有的末端修复缓冲体系,也可以自行配制,本申请中采用的是自行配制的缓冲体系,其主要成分包括Tris-Hcl、dNTP、ATP、H2O。
更优选地,所述修复在20-30℃下进行;优选修复时间为20-30min。在该温度下进行修复上述时间范围,对损伤DNA的修复成功率高,且效率高。
经过损伤修复后的DNA进行文库构建要比直接进行文库构建得到的DNA文库量更高。另外,对于直接建库无法得到足够量的DNA文库用于杂交捕获,或者建库不成功的样本,在建库前经过DNA修复方法所得到的文库的量显著提高。
采用本发明的方法所构建的文库的量能够满足文库捕获所需,且文库产出数据中重复序列小,有效数据量较高,能够实现低频突变的检测。
针对现有的ctDNA的提取方法所得到的DNA的量有些无法满足低频突变检测的要求的状况,一种方式是采用本发明的提取方法提升提取效率,也可以通过本发明所提供的修复方法对所提取到的DNA进行修复,其均可实现不错的检测效果。在一些情况下,当待测样品的基质较为复杂、DNA受损较为严重或DNA含量较低时,可以同时使用本发明的提取方法和修复方法,以保证上机前的DNA质量。
本领域人员可对上述方案进行组合,得到有关本发明方法的较优实施例。
基于上述技术方案,本发明的有益效果包括:
(1)本发明提供了一种基于分割序列的基因融合检测方法,其在计算的整个过程中不涉及序列的拼装,有利于节省运行速度;在采用序列-数字转换方法比较序列的相似性时,运行速度更快。
(2)本发明所提供的提取方法能够显著提供ctDNA的提取效率和提取产量,进而有利于融合基因的检测效果。
(3)通过本发明所提供的DNA损伤修复体系修复后的ctDNA可以对当前建库起始量的输入进行文库构建后,增加部分文库转化,满足杂交捕获的用量,能够有效的保证20ng的建库起始用量的结果真实性和可靠性。同时,本发明的文库构建方法能够在原先的工艺基础上降低1-2个Pre-PCR循环数。采用该文库对产出数据后期进行分析,有利于降低重复序列的占有量,提高有效数据量,降低上机成本。
附图说明
图1为实施例1中样本通过IGV在ALK处看到的断点图。
图2为实施例1中样本通过IGV在EML4处看到的断点图。
图3为实施例1的步骤4中分割得到的序列。
具体实施方式
以下实施例用于说明本发明,但不用来限制本发明的范围。
实施例中未注明具体技术或条件者,按照本领域内的文献所描述的技术或条件,或者按照产品说明书进行。所用试剂或仪器未注明生产厂商者,均为可通过正规渠道商购买得到的常规产品。
实施例1
本实施例提供一种基于二代测序技术的检测融合基因的方法,以一个真实的样本数据为例,该样本携带经典的EML4-ALK融合,其通过IGV在ALK处和EML4处看到的断点图分别如图1、图2所示。具体检测方法如下:
1、将该样本进行捕获测序,测序策略为PE100;
2、将原始下机数据,进行数据预处理、比对、去重、提取唯一比对序列,形成最终的BAM文件,采用Samtools建立BAM文件的索引;
3、提取可能携带基因融合信号的测序读段的软截断部分:将BAM文件中的测序序列,cigar标签为“MS”或“SM”模式的读段软截断部分按照格式规则提取出来;
4、按照读段断裂的坐标和方向拆分成不同的读段组,将同一个读段组的读段进行两两比较:
(1)如提取比对到2号染色体坐标29446853的最长读段为23个碱基长度的“CTAAAAAGCATAAATGCCCATCT”(SEQ ID No.1),从发生断裂的位点到整条读段末尾可以分割成23条序列,如图3所示,每条序列计算一个序列数字(具体方法见发明内容部分),存储进一个数组中;
(2)预设变量T和F的原始值为0,将原序列比对相同位置的软截断序列,依次计算序列数字,看是否存在于数组中,如存在则T加1,如不存在则F加1。遍历完成后,比较数值T和F,如T大于4且大于F的0.5倍,则将长度最长的测序序列的原比对位置和T值做为ID,序列、测序质量以FASTQ的格式输出到新的文件,以上述序列为例,假设T值为11,则输出:
@Chr2_29446853_11
CTAAAAAGCATAAATGCCCATCT
+
EBDGEGEGEGEGEGEFEGEFEFEG
5、将上一步生成FASTQ文件重新和参考基因组进行比对,生成新的BAM文件;
6、根据重新比对坐标、比对质量进行过滤:如重新比对的比对打分小于10,或与原序列比对到同一条染色体且坐标值相差5000以内,认为没有通过过滤,否则认为通过过滤;
7、坐标位置注释:将原序列比对坐标和重新比对坐标进行注释,并输出到最终的结果文件;
8、变异频率及深度:将T值做为支持变异的序列数,将原序列比对坐标对应的深度做为深度,支持变异的序列数比上深度做为变异频率,同时输出到结果文件中。结果如表1所示。
表1
Figure 255482DEST_PATH_IMAGE004
试验例1
针对实施例1的样本,运用实施例1的检测方法,同多个目前常用的找融合变异软件进行比较,比较结果如下表2所示。由该结果可知,本发明方法无论在准确性方面还是运行速度方面均具有明显优势。
表2
Figure 28397DEST_PATH_IMAGE005
实施例2
本实施例提供一种基于二代测序技术的检测融合基因的方法,对临床外周血血浆样本进行检测。
具体的,其提取方法如下:1)按1mg/550μL的比例预先将蛋白酶K预先溶于蛋白酶溶解缓冲液中形成蛋白酶K溶液,向离心管中加入20μL蛋白酶K溶液和20μL 磁珠悬浮液;2)转移300μL血清或血浆样品至含离心管中;3)加入450μL 裂解结合液至离心管中,涡旋混匀30秒,再加入2μL核酸助沉剂,室温颠倒混匀15分钟;4)转移至磁力架上,静置3分钟吸附磁珠,吸弃溶液;5)加入500μL 第一洗涤液,涡旋混匀30秒;6)转移至磁力架上,静置3分钟吸附磁珠,吸弃溶液;7)加入500μL 第二洗涤液,涡旋混匀30秒;8)转移至磁力架上,静置3分钟吸附磁珠,吸弃溶液;9)重复步骤7)和8)一次;10)离心,收集管离心管壁上的液滴,转移至磁力架上,吸弃溶液;11)空气干燥10分钟;12)加35μL的洗脱液,涡旋打散磁珠,室温放置10分钟,期间震荡3次加速DNA溶解;13)转移至磁力架上,静置3分钟,转移溶解的DNA至新的离心管中保存,溶解的DNA即为游离循环肿瘤DNA。
其中,所述核酸助沉剂中含有2 5μg/μLCarrier RNA和3M醋酸钠。所述裂解结合液中含有10%的十二烷基硫酸钠、45mmol/L Tris-Hcl、120mmol/LNaCl、30 mmol/L乙二胺四乙酸二钠、20mol/L异硫氰酸胍、3 mol/L醋酸钾和6 wt%吐温20,pH值为4.8。所述的蛋白酶K溶液中含有50mmol/L Tris-Hcl和115mmol/LNaCl。所述第一洗涤液中含有50mmol/L Tris-Hcl、110mmol/LNaCl、50 mmol/L乙二胺四乙酸二钠和0.2wt%曲拉通,pH值为5.5;所述第二洗涤液包含50mmol/L Tris-Hcl和80 vol%的乙醇。洗脱液为无核酸酶水。
检测方法如下:
1、将该样本进行捕获测序,测序策略为PE100;
2、将原始下机数据,进行数据预处理、比对、去重、提取唯一比对序列,形成最终的BAM文件,采用Samtools建立BAM文件的索引;
3、提取可能携带基因融合信号的测序读段的软截断部分:将BAM文件中的测序序列,cigar标签为“MS”或“SM”模式的读段软截断部分按照格式规则提取出来;
4、按照读段断裂的坐标和方向拆分成不同的读段组,将同一个读段组的读段进行两两比较:
(1)每条序列组中的不同发生断裂的读段,假设长度为n,从发生断裂的位点到整条读段末尾可以分割成n条序列,每条序列计算一个序列数字(具体方法见发明内容部分),存储进一个数组中;
(2)预设变量T和F的原始值为0,将原序列比对相同位置的软截断序列,依次计算序列数字,看是否存在于数组中,如存在则T加1,如不存在则F加1。遍历完成后,比较数值T和F,如T大于4且大于F的0.5倍,则将长度最长的测序序列的原比对位置和T值做为ID,序列、测序质量以FASTQ的格式输出到新的文件,以本实施例的样本为例,所有序列组中最大T值为3,没有融合变异检出。
实施例3
本实施例提供一种基于二代测序技术的检测融合基因的方法,对低频样本突变进行检测。
具体的,其提取方法如下:1)按1mg/550μL的比例预先将蛋白酶K预先溶于蛋白酶溶解缓冲液中形成蛋白酶K溶液,向离心管中加入20μL蛋白酶K溶液和20μL 磁珠悬浮液;2)转移300μL血清或血浆样品至含离心管中;3)加入450μL 裂解结合液至离心管中,涡旋混匀30秒,再加入2μL核酸助沉剂,室温颠倒混匀15分钟;4)转移至磁力架上,静置3分钟吸附磁珠,吸弃溶液;5)加入500μL 第一洗涤液,涡旋混匀30秒;6)转移至磁力架上,静置3分钟吸附磁珠,吸弃溶液;7)加入500μL 第二洗涤液,涡旋混匀30秒;8)转移至磁力架上,静置3分钟吸附磁珠,吸弃溶液;9)重复步骤7)和8)一次;10)离心,收集管离心管壁上的液滴,转移至磁力架上,吸弃溶液;11)空气干燥10分钟;12)加35μL的洗脱液,涡旋打散磁珠,室温放置10分钟,期间震荡3次加速DNA溶解;13)转移至磁力架上,静置3分钟,转移溶解的DNA至新的离心管中保存,溶解的DNA即为游离循环肿瘤DNA。
其中各试剂的配方同实施例2。
而后通过损伤修复酶体系进行DNA修复及文库构建,具体步骤如下:
1)末端修复及加A
先将末端修复缓冲液置于室温融化彻底后,涡旋 10s,瞬时离心3s;
末端修复缓冲液-20°C冻存时为白色固体,室温彻底融化后为无色透明液体,如果液体中有白色晶体或者白色颗粒存在,需要进一步的延长室温平衡时间,可以涡旋处理加速晶体或颗粒溶解,保证修复缓冲液变为无色澄清的液体性状后方可使用;
2)按照下表3配制末端修复工作液:
表3
Figure 211116DEST_PATH_IMAGE006
其中,DNA损伤修复酶为UDG、内切核酸酶IV和T4 PDG的混合物,在每μL末端修复工作液中,UDG的含量为3.5U,内切核酸酶IV的含量为7U,T4 PDG的含量为7U。
末端修复酶为T4 DNA 聚合酶和PNK激酶的混合物,在每μL末端修复工作液中,T4DNA 聚合酶的含量为60U,PNK激酶的含量为150U。
3)向片段化 DNA体系中加入末端修复工作液(每个样本13μL),涡旋 10s,瞬时离心3s后,按照下表4进行PCR仪器程序设定,进行末端修复反应温育;PCR仪器热盖温度85°C;
表4
Figure 662957DEST_PATH_IMAGE007
4)在末端修复反应进行时,将连接反应缓冲液(连接 Buffer)静置于4℃冰箱进行融化;根据任务单拿出所需Adapter,静置于4°C冰箱;
5)在末端修复反应结束后,从PCR仪中拿出样本后,再按紧一下PCR管盖,涡旋 4s,瞬时离心3s。
按下表5配制连接反应工作液(连接反应缓冲液+连接酶)。
表5
Figure 340058DEST_PATH_IMAGE008
配制好的连接工作液涡旋3s,瞬时离心3s后静置于冰上;
按下表6向末端修复反应体系中先加入Adapter;
表6
Figure 29796DEST_PATH_IMAGE009
加完Adapter之后,涡旋 10s,瞬时离心3s之后再加入配制好45 μL的连接反应工作液;加完连接反应工作液后再涡旋10s,瞬时离心3s;
6)连接反应需要按照下表7进行PCR仪器程序设置;PCR仪器热盖温度设置45°C。
表7
Figure 648996DEST_PATH_IMAGE010
7)用AMPure XP磁珠纯化连接产物,充分混匀AMPure XP Bead悬浮液,在1.5 mL新的离心管中加入0.8 x混匀的AMPure XP Bead悬浮液,转移70µL连接产物至离心管中,涡旋混匀5s,室温放置10min孵育;磁力架吸附3min,弃上清,80%的乙醇洗两次,晾干,加入23µLnuclease-free water洗脱DNA。
8)在洗脱的时候开始按照下表8配制PCR扩增工作液:
表8
Figure 994658DEST_PATH_IMAGE011
配制好的PCR扩增工作液静置于冰上;
9)将离心管放入PCR仪,热盖温度105°C
按下表9设置程序进行反应:
表9
Figure 600083DEST_PATH_IMAGE012
10)用AMPure XP磁珠纯化连接产物,充分混匀AMPure XP Bead悬浮液,在1.5 mL新的离心管中加入1.0 x混匀的AMPure XP Bead悬浮液,转移50µL连接产物至离心管中,涡旋混匀5s,室温放置10min孵育;磁力架吸附3min,弃上清,80%的乙醇洗两次,晾干,加入23µL nuclease-free water洗脱DNA。
11)取1µL用Qubit® 3.0 Fluorometer检测DNA浓度,并吸取大约23µL上清到一个新的1.5ml管中,在此步可以丢弃磁珠。
而后进行检测,检测方法如下:
1、将该样本进行捕获测序,测序策略为PE100;
2、将原始下机数据,进行数据预处理、比对、去重、提取唯一比对序列,形成最终的BAM文件,采用Samtools建立BAM文件的索引;
3、提取可能携带基因融合信号的测序读段的软截断部分:将BAM文件中的测序序列,cigar标签为“MS”或“SM”模式的读段软截断部分按照格式规则提取出来;
4、按照读段断裂的坐标和方向拆分成不同的读段组,将同一个读段组的读段进行两两比较:
(1)每条序列组中的不同发生断裂的读段,假设长度为n,从发生断裂的位点到整条读段末尾可以分割成n条序列,每条序列计算一个序列数字(具体方法见发明内容部分),存储进一个数组中;
(2)预设变量T和F的原始值为0,将原序列比对相同位置的软截断序列,依次计算序列数字,看是否存在于数组中,如存在则T加1,如不存在则F加1。遍历完成后,比较数值T和F,如T大于4且大于F的0.5倍,则将长度最长的测序序列的原比对位置和T值做为ID,序列、测序质量以FASTQ的格式输出到新的文件,以本实施例的样本为例,比对到6号染色体坐标117649657处的序列超过了阈值,则按照fastq格式输出序列,继续下一步检测;
5、将上一步生成FASTQ文件重新和参考基因组进行比对,生成新的BAM文件,本实施例另一端比对到了4号染色体坐标25679566处;
6、根据重新比对坐标、比对质量进行过滤:如重新比对的比对打分小于10,或与原序列比对到同一条染色体且坐标值相差5000以内,认为没有通过过滤,否则认为通过过滤;
7、坐标位置注释:将原序列比对坐标和重新比对坐标进行注释,并输出到最终的结果文件,该样本一端注释到了基因ROS1 32号到33号外显子之间,另一端可以注释到基因SLC34A2的13号外显子上;
8、变异频率及深度:将T值做为支持变异的序列数,将原序列比对坐标对应的深度做为深度,支持变异的序列数比上深度做为变异频率,同时输出到结果文件中。检测结果为SLC34A2_13:ROS1_33,频率0.036。
试验例2
以实施例2的提取方法作为实验组,以优化前的提取方法作为对照组,对多个样本进行提取,并统计提取到的核酸浓度及总量。各组实验分别设置3组平行试验,统计结果取其平均值。统计结果见表10。
其中,优化前的提取方法与实施例2的提取方法的区别仅在于:未使用核酸助沉剂进行助沉。
表10
Figure 268962DEST_PATH_IMAGE013
由该结果可见,实施例2的提取方法的核酸提取效率显著高于未优化组,核酸提取总量平均提升了7.6倍。可见本发明的提取方法可以显著提升核酸提取效率,并且抑制了其它基质对于核酸定量的干扰。
试验例3
以实施例3的修复及建库方法作为实验组,以不修复直接建库方法(建库方法同实施例3)作为对照组,对多个DNA样本进行文库构建,并统计文库出库量。各组实验分别设置3组平行试验,统计结果取其平均值。统计结果见表11-表12。
表11
Figure 934429DEST_PATH_IMAGE014
表12
Figure 964790DEST_PATH_IMAGE015
如表11、表12所示,DNA经过损伤修复方法建库,比直接建库的效率高,样本S1-S10得到优化后的平均建库量为248%。而通过直接建库达不到杂交捕获用量的样本S11-S20,经过DNA损伤修复的方法建库,不仅达到了杂交捕获所需的文库量而且优化后的平均建库量为优化前的11.9倍。
虽然,上文中已经用一般性说明及具体实施方案对本发明作了详尽的描述,但在本发明基础上,可以对之作一些修改或改进,这对本领域技术人员而言是显而易见的。因此,在不偏离本发明精神的基础上所做的这些修改或改进,均属于本发明要求保护的范围。
序列表
<110> 北京优迅医疗器械有限公司
<120> 基于二代测序技术的循环肿瘤DNA融合检测方法
<130> KHP211117803.4YS
<160> 1
<170> SIPOSequenceListing 1.0
<210> 1
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 1
ctaaaaagca taaatgccca tct 23

Claims (9)

1.一种基于二代测序技术的检测融合基因的方法,其特征在于,包括:
将测序序列与参考基因组进行比对,得到原始BAM文件,去除重复序列和比对到多个位置上的序列后,得到用于进一步检测的最终BAM文件;
从最终的BAM文件中,提取包含软截断的读段,按照读段断裂的坐标和方向拆分成不同的读段组;
将同一个读段组的读段进行两两比较,去除长度过短、与读段组其余读段序列相似性过低、或包含重复序列的读段,并进一步提取与其余读段匹配度最高的一条读段进行下一步的检测,将此时读段组的读段数作为支持变异的读段数;其中,所述将同一个读段组的读段进行两两比较具体包括:
(1)提取读段组与其余读段匹配度最高的一条读段,假设读段的长度为L,则从原读段的断裂处按照1个碱基的步长,提取L条序列,按照下列规则对这些序列进行数字转换:
S1、构建二进制序列:根据一条读段分别按A、T、C、G构建4条二进制序列,用1代表和读段上相同的碱基,用0代表和读段上不同的碱基,对于每一种碱基得到一条长度为L的二进制序列;然后按照A、T、C、G的顺序将4条长度为L的二进制序列连接在一起,得到1条长度为4L的二进制序列;
S2、首先设置二阶矩阵
Figure DEST_PATH_IMAGE001
代表1,二阶矩阵
Figure 236767DEST_PATH_IMAGE002
代表0;其次用上一步得到的4L二 进制序列的顺序,依次做矩阵的乘法,最后得到一个二阶的矩阵,使用该二阶矩阵,左乘权 重矩阵
Figure DEST_PATH_IMAGE003
,得到最终的矩阵,计算该矩阵的迹,将其定义为该序列的“序列数字”;计 算出L个序列数字,将其存入一个数组;
(2)设置变量T和F的初始值分别为0,依次遍历原读段比对到同一坐标的剩余软截断序列,分别计算其序列数字,看是否存在于数组中,如存在则T加1,如不存在则F加1;遍历完成后,比较数值T和F,如T大于阈值且大于F的设定阈值的倍数,则认为这一组的软截断序列通过过滤,并将长度最长的这条测序序列的原比对位置和T值做为ID,将序列及测序质量以FASTQ的格式输出到新的文件;其中,T值即为支持变异的序列数;
将上一步新生成的FASTQ格式文件重新比对到参考基因组上,若比对打分过低或重新比对到的基因组位置与原序列比对到的基因组位置过近,则不进行下一步的检测;
将原序列比对坐标和重新比对坐标进行注释;将原序列比对坐标对应的深度做为深度,支持变异的读段数与深度的比值做为变异频率,同时输出到结果文件中。
2.根据权利要求1所述的基于二代测序技术的检测融合基因的方法,其特征在于,所述包含软截断的读段的提取及分组具体包括:
根据每条测序读段的cigar信息,确定测序读段的比对模式,若测序序列没有软截断,则cigar的模式为“M”,若测序序列左侧有软截断,则cigar的模式为“SM”,若测序序列右侧有软截断,则cigar的模式为“MS”,将携带软截断的测序序列的原比对染色体、坐标做为key,软截断部分的序列做为value读入一个哈希表中,该哈希表同时保留测序序列的正负链和软截断部分的测序碱基质量信息。
3.根据权利要求1或2所述的基于二代测序技术的检测融合基因的方法,其特征在于,在检测ctDNA的融合基因时,所述方法还包括:
使用核酸助沉剂提取待测样品中的ctDNA,并进行测序,以得到测序序列;
所述核酸助沉剂中含有1μg/μL~5μg/μLCarrier RNA和3±0.5M醋酸钠。
4.根据权利要求3所述的基于二代测序技术的检测融合基因的方法,其特征在于,采用磁珠法提取待测样品中的ctDNA,具体包括:
将待测样品与蛋白酶K溶液、磁珠悬浮液、裂解结合液和核酸助沉剂混合,使ctDNA结合到磁珠上,而后用洗涤磁珠,最后从磁珠上将ctDNA洗脱下来;
其中,所述裂解结合液中含有1%~10%的十二烷基硫酸钠、45mmol/L Tris-Hcl、120mmol/LNaCl、30 mmol/L乙二胺四乙酸二钠、10~30mol/L异硫氰酸胍、2~4 mol/L醋酸钾和5~10 wt%吐温20,pH值为4.8±0.2。
5.根据权利要求4所述的基于二代测序技术的检测融合基因的方法,其特征在于,所述蛋白酶K溶液中含有45~75mmol/L Tris-Hcl和100~120 mmol/LNaCl。
6.根据权利要求4或5所述的基于二代测序技术的检测融合基因的方法,其特征在于,所述洗涤磁珠具体包括:通过第一洗涤液和第二洗涤液依次洗涤磁珠;
所述第一洗涤液中含有45~75mmol/L Tris-Hcl、100~120mmol/LNaCl、30~60 mmol/L乙二胺四乙酸二钠和1.5±0.2wt%曲拉通,pH值为5.5±0.2;
所述第二洗涤液包含45~75mmol/L Tris-Hcl和75±5 vol%的乙醇;
和/或,在进行洗脱时,洗脱液为无核酸酶水。
7.根据权利要求1或2所述的基于二代测序技术的检测融合基因的方法,其特征在于,在检测ctDNA或受损伤的DNA的融合基因时,所述方法还包括:
采用修复工作液对提取得到的DNA进行修复后,再进行测序;
所述修复工作液中含有DNA损伤修复酶,所述DNA损伤修复酶为UDG、内切核酸酶IV和T4PDG的混合物;在每μL修复工作液中,UDG的含量为3~4U,内切核酸酶IV的含量为6~8U,T4PDG的含量为6~8U。
8.根据权利要求7所述的基于二代测序技术的检测融合基因的方法,其特征在于,所述方法还包括:对修复后的DNA进行文库构建,得到DNA文库。
9.根据权利要求8所述的基于二代测序技术的检测融合基因的方法,其特征在于,在构建DNA文库时,采用修复工作液对提取得到的DNA进行修复;
所述修复工作液中含有所述DNA损伤修复酶和DNA末端修复酶;所述DNA末端修复酶为T4 DNA 聚合酶和PNK激酶的混合物;在每μL修复工作液中,T4 DNA 聚合酶的含量为50~100U,PNK激酶的含量为100~200U。
CN202111640988.4A 2021-12-30 2021-12-30 基于二代测序技术的循环肿瘤dna融合检测方法 Active CN114005490B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111640988.4A CN114005490B (zh) 2021-12-30 2021-12-30 基于二代测序技术的循环肿瘤dna融合检测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111640988.4A CN114005490B (zh) 2021-12-30 2021-12-30 基于二代测序技术的循环肿瘤dna融合检测方法

Publications (2)

Publication Number Publication Date
CN114005490A CN114005490A (zh) 2022-02-01
CN114005490B true CN114005490B (zh) 2022-04-22

Family

ID=79932273

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111640988.4A Active CN114005490B (zh) 2021-12-30 2021-12-30 基于二代测序技术的循环肿瘤dna融合检测方法

Country Status (1)

Country Link
CN (1) CN114005490B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116564415B (zh) * 2023-07-10 2023-10-17 深圳华大基因科技服务有限公司 流式测序分析方法、装置、存储介质及计算机设备

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106845150A (zh) * 2016-12-29 2017-06-13 安诺优达基因科技(北京)有限公司 一种用于检测循环肿瘤dna样本基因融合的装置
CN107368708A (zh) * 2017-08-14 2017-11-21 东莞博奥木华基因科技有限公司 一种精准分析dmd基因结构变异断点的方法及***
CN111326212A (zh) * 2020-02-18 2020-06-23 福建和瑞基因科技有限公司 一种结构变异的检测方法
CN112687341A (zh) * 2021-03-12 2021-04-20 上海思路迪医学检验所有限公司 一种以断点为中心的染色体结构变异鉴定方法
CN112802553A (zh) * 2020-12-29 2021-05-14 北京优迅医疗器械有限公司 一种基于后缀树算法的基因组测序序列与参考基因组比对的方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10964410B2 (en) * 2017-05-25 2021-03-30 Koninklijke Philips N.V. System and method for detecting gene fusion

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106845150A (zh) * 2016-12-29 2017-06-13 安诺优达基因科技(北京)有限公司 一种用于检测循环肿瘤dna样本基因融合的装置
CN107368708A (zh) * 2017-08-14 2017-11-21 东莞博奥木华基因科技有限公司 一种精准分析dmd基因结构变异断点的方法及***
CN111326212A (zh) * 2020-02-18 2020-06-23 福建和瑞基因科技有限公司 一种结构变异的检测方法
CN112802553A (zh) * 2020-12-29 2021-05-14 北京优迅医疗器械有限公司 一种基于后缀树算法的基因组测序序列与参考基因组比对的方法
CN112687341A (zh) * 2021-03-12 2021-04-20 上海思路迪医学检验所有限公司 一种以断点为中心的染色体结构变异鉴定方法

Also Published As

Publication number Publication date
CN114005490A (zh) 2022-02-01

Similar Documents

Publication Publication Date Title
JP7119014B2 (ja) まれな変異およびコピー数多型を検出するためのシステムおよび方法
US20230323474A1 (en) Compositions and methods for isolating cell-free dna
JP7300989B2 (ja) 核酸分子を解析するための方法およびシステム
CN108893466B (zh) 测序接头、测序接头组和超低频突变的检测方法
EP3359695B1 (en) Methods and applications of gene fusion detection in cell-free dna analysis
CN107190329B (zh) 基于dna的融合基因定量测序建库、检测方法及其应用
EP3329010B1 (en) Nucleic acids and methods for detecting chromosomal abnormalities
AU2016305103C1 (en) Single-molecule sequencing of plasma DNA
JP2018522531A (ja) 診断方法
CN105442054B (zh) 对血浆游离dna进行多目标位点扩增建库的方法
KR20160141680A (ko) 바코드 서열을 포함하는 어댑터를 이용한 차세대 염기서열 분석 방법
EP3976822A1 (en) Methods and systems for improving patient monitoring after surgery
WO2023035889A1 (zh) 基因融合的检测方法和装置
US20230203590A1 (en) Methods and means for diagnosing lung cancer
JP2020521216A (ja) 挿入および欠失を検出するための方法およびシステム
CN114005490B (zh) 基于二代测序技术的循环肿瘤dna融合检测方法
EP3688195A1 (en) Biomarkers for colorectal cancer detection
KR20220060198A (ko) 유전자 복제수 변이 정보를 이용하여 췌장암 환자의 생존 예후를 예측하는 방법
JP2022514010A (ja) 核酸分子の回収率を改善するための方法、組成物、およびシステム
CN113215663B (zh) 一种基于高通量测序的胃癌靶向治疗基因组文库的构建方法及引物
CN114746560A (zh) 改进甲基化多核苷酸结合的方法、组合物和***
CN112391474A (zh) 一种基于瘤内具核梭杆菌预测食管鳞癌转移的方法
CN111073872B (zh) Dna损伤修复体系、dna文库构建试剂盒及文库构建方法
JP2022512848A (ja) エピジェネティック区画アッセイを較正するための方法、組成物およびシステム
EP4179111B1 (en) Methods of detecting genomic rearrangements using cell free nucleic acids

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant