CN106845150A - 一种用于检测循环肿瘤dna样本基因融合的装置 - Google Patents

一种用于检测循环肿瘤dna样本基因融合的装置 Download PDF

Info

Publication number
CN106845150A
CN106845150A CN201710067169.2A CN201710067169A CN106845150A CN 106845150 A CN106845150 A CN 106845150A CN 201710067169 A CN201710067169 A CN 201710067169A CN 106845150 A CN106845150 A CN 106845150A
Authority
CN
China
Prior art keywords
breakpoint
information
fusion
submodule
pos
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201710067169.2A
Other languages
English (en)
Other versions
CN106845150B (zh
Inventor
董永芳
荆瑞琳
陈利斌
隋光磊
董超
玄兆伶
李大为
梁峻彬
陈重建
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
ANNOROAD (YIWU) MEDICAL INSPECTION Co.,Ltd.
ANNOROAD GENE TECHNOLOGY (BEIJING) Co.,Ltd.
ZHEJIANG ANNOROAD BIO-TECHNOLOGY Co.,Ltd.
Original Assignee
ANNOROAD GENETIC TECHNOLOGY (BEIJING) Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ANNOROAD GENETIC TECHNOLOGY (BEIJING) Co Ltd filed Critical ANNOROAD GENETIC TECHNOLOGY (BEIJING) Co Ltd
Publication of CN106845150A publication Critical patent/CN106845150A/zh
Application granted granted Critical
Publication of CN106845150B publication Critical patent/CN106845150B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B25/00ICT specially adapted for hybridisation; ICT specially adapted for gene or protein expression

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biotechnology (AREA)
  • Theoretical Computer Science (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Engineering & Computer Science (AREA)
  • Medical Informatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Biophysics (AREA)
  • Evolutionary Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Analytical Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Genetics & Genomics (AREA)
  • Molecular Biology (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本发明涉及一种用于检测循环肿瘤DNA样本基因融合的装置,其包括测序数据获取模块、比对模块、再比对模块、真实融合断点判断模块、以及输出模块。本发明的用于检测循环肿瘤DNA样本基因融合的装置具有检测速度快、资源要求低、稳定性高的优点。

Description

一种用于检测循环肿瘤DNA样本基因融合的装置
技术领域
本发明涉及基因融合检测领域,尤其涉及一种用于检测循环肿瘤DNA样本基因融合的装置及方法。
背景技术
肿瘤细胞会向血液中释放基因组DNA,这些变异DNA也随之释放到外周血中,被称为循环肿瘤DNA(circulating tumor DNA,ctDNA)。有文献报道称,癌变人群血浆中游离100~400bp大小的DNA片段浓度明显高于正常人,可以作为筛查的标志物。又有研究发现,循环肿瘤DNA在早期原位癌(primary cancer)患者血液中就已经开始出现。由于外周血循环DNA半衰期短,因此循环肿瘤DNA能够真实反映患者病变组织基因突变的真实情况。循环肿瘤DNA在恶性肿瘤诊疗中的应用越来越受到关注和重视,作为研究的热点和突破口将有可能为临床肿瘤的早期诊断、预后判定及疗效监测等提供一系列方便、快捷、特异、无创的分子生物学检测手段。
融合基因(Fusion gene)是指两个基因的全部或一部分序列相互融合为一个新的基因的过程,通常具有致癌性,在各种不同的肿瘤中普遍存在。1973年,芝加哥大学的JaneRowley在血液病中发现了第一个融合基因。随后,在诸多实体瘤如肺癌、乳腺癌、***癌、卵巢癌等中相继发现了融合基因的存在。目前越来越多的融合基因在不同肿瘤中被报道。基因融合是一类在临床上非常重要的染色体结构变异,在癌症发生发展过程中起着关键的作用。精准的融合基因检测结果可以为临床抗癌靶点用药治疗和预后评估提供参考依据。
传统上用于检测融合基因的检测技术主要基于遗传学方法,如FISH。然而,相对较低的分辨率和通量限制了该种方法在复杂的上皮组织癌的检测中的应用。
随着二代测序技术的发展,涌现了大量用于检测融合基因的检测方法。基因融合检测方法中,断点的确认直接影响到检测结果的判定。CREST是当前检测Fusion gene的主流算法之一,该算法利用组装算法实现两次组装,从而排除假阳性,因此其主要优点是假阳性低,但同时由于需要进行两次组装,导致存在检测速度慢、资源要求高、需要进行组装等缺点;同时,组装效果还会受到覆盖度、***片段长度的影响。血浆中游离DNA含量极微,片段化严重,且循环肿瘤DNA仅占血浆游离DNA总量的0.02%-50%,加之ctDNA的释放量会受到患者病情,癌种,分期,用药情况等各类综合因素的影响,使得ctDNA样本的覆盖度降低,导致这一问题在肿瘤循环DNA样本中表现尤为明显,从而影响融合检测结果。因此,如何应对融合基因检测过程中检测速度慢、***资源要求高、需要进行组装的问题,特别是低覆盖度样本的检测成为本领域面临的一大难题。
发明内容
本发明所要解决的技术问题
现有技术算法由于需要进行两次组装和三次比对,导致存在检测速度慢、资源要求高等不足之处,同时由于循环肿瘤DNA样本的组装序列均较短且覆盖度较低,对于重复序列的组装存在一定的不确定性,可能会导致检测结果错误。
鉴于上述现有技术中存在的问题,本发明的目的在于提供一种用于检测基因融合的装置及方法,其具有检测速度快、资源要求低、稳定性高的优点。
与现有技术算法相比,本发明的检测装置充分利用了PE测序下机测序片段(reads)的信息,减少了比对次数,只需要两次比对,而且不需要组装,提高了检测的稳定性。
即,本发明包括:
一种用于检测循环肿瘤DNA样本基因融合的装置,其包括以下模块:
测序数据获取模块,用于获取循环肿瘤DNA样本的测序数据;优选地,所述测序数据是采用双端测序(Paired-end Sequencing,PE测序)方法获得的测序数据;
比对模块:其与所述测序数据获取模块相连接,用于将获取的测序数据与参考序列进行比对,获取比对结果。所述比对结果包括测序片段在基因中对应的位置信息。所述位置信息包括软剪切信息和成功比对信息。所述测序片段中带有软剪切信息的部分为所述测序片段的软剪切部,所述测序片段中带有成功比对信息的部分为所述测序片段的成功比对部。优选地,该模块可以利用bwa软件,查找测序片段在基因中对应的位置,并形成bam格式文件;优选地,该bam文件中,包括每条测序片段的描述信息(qname),序列信息(seq),比对位置(POS),位标识(flag),比对质量值(MAPQ),简要比对表达信息(Cigar),模板长度(Tlen);
再比对模块:其与所述比对模块相连接,用于将带有软剪切信息的测序片段与参考基因组再次比对,获取再比对结果;
真实融合断点判断模块:其与所述再比对模块相连接,用于判断所述测序片段的融合断点;以及
输出模块:其与所述真实融合断点判断模块相连接,用于输出基因融合检测结果,例如,基因融合断点位置(如left_pos,right_pos),染色体编号(如left_chr,right_chr),支持度(如sup)等。
优选地,所述再比对模块例如可以包括以下子模块:
长度过滤子模块:其与所述比对模块相连接,用于过滤去除含有软剪切(soft-clipping)信息的测序片段中长度小于一定值的测序片段;优选地,所述一定值可以是例如15~30bp,优选20~25bp。
断点判断子模块:其与所述长度过滤子模块相连接,用于根据所述长度过滤子模块的结果数据,将测序片段中带有软剪切信息的部分与带有正常比对信息的部分的结合处作为断点;
区分子模块:其与所述断点判断子模块相连接,用于将所述带有软剪切信息的部分和所述带有正常比对信息的部分在断点处分开,并将这两部分的序列信息分别保存至两个文件(例如fastq文件)中;
再比对子模块:其与所述区分子模块相连接,用于对所述分别保存了序列信息的两个文件与参考序列再次进行比对,获取再比对结果;优选地,所述再比对结果包括下述信息:每条测序片段的描述信息(qname)、序列信息(seq)、比对位置(POS)、位标识(flag),比对质量值(MAPQ),简要比对表达信息(Cigar),模板长度(Tlen)。优选地,例如可以利用bwa软件对上述两个fastq文件,再次进行比对,形成bam格式文件。所述bam格式文件包含每条测序片段的描述信息(qname),序列信息(seq)、位标识(flag),比对位置(POS),比对质量值(MAPQ),简要比对表达信息(Cigar),模板长度(Tlen)。
优选地,所述真实融合断点判断模块可以包括下述子模块:过滤子模块:其与所述再比对子模块相连接,用于根据位标识(flag)值过滤去除未成功比对(unmapped)的测序片段以及低比对质量值(MAPQ)的测序片段;
断点信息获取子模块:其与所述过滤子模块相连接,用于查找具有相同片段描述信息(qname)的测序片段,并获取断点信息;优选地,断点信息包括:(1)Left/right_chr,断点左/右侧序列的染色体编号;(2)left/right_pos,断点左/右侧首个碱基的比对位置;(3)left/right_seq,断点左/右侧碱基的序列;(4)sup,断点支持度,支持该断点的测序片段个数。
融合断点筛选子模块:其与所述断点信息获取子模块相连接,用于在断点信息中筛选融合断点;
融合断点初次合并子模块:其与所述融合断点筛选子模块相连接,用于将具有相同的断点信息的融合断点合并为一个真实融合断点,并将具有相同断点信息的融合断点个数作为真实融合断点的支持度。其中,相同的断点信息是指left_chr、left_pos、right_chr和right_pos均相同。
融合断点再次合并子模块:其与所述断点初次合并子模块相连接,用于将left_chr和right_chr相同,right_pos或left_pos相差一定值(例如3bp)以内的融合断点合并为一个真实融合断点。
优选地,所述断点信息包括:
left_chr:断点左侧序列的染色体编号,read1对应的参考序列编号。
left_pos:断点左侧首个碱基的比对位置,read1对应的比对位置加上read1的序列长度。
left_seq:断点左侧碱基的序列。
right_chr:断点右侧序列的染色体编号,read2对应的参考序列编号。
right_pos:断点右侧首个碱基的比对位置,read2对应的比对位置加上read2的序列长度。
right_seq:断点右侧碱基的序列。
sup:断点支持度,支持该断点的测序片段的个数,默认为1。
此外,断点信息还可以包括,ort:根据测序片段中片段描述信息中的比对结果模式判断所得,“+”表示clean测序片段中断点右侧发生软剪切,“-”表示clean测序片段中断点左侧发生软剪切。
优选地,所述融合断点筛选子模块包括如下元件:
断点质量过滤元件:用于过滤低质量断点,若存在断点A,A中sup个数大于一定值(例如5),且left_seq和right_seq中比对质量值均大于一定值(例如30),且错配率均小于一定值(例如0.05)或/和断点支持度/断点右侧或左侧位置深度大于一定值(例如0.1),则该断点A为融合断点。
相同断点合并元件:用于合并相同断点,若存在断点A和B,A中left_chr等于B中right_chr,A中right_chr等于B中left_chr,A中left_pos等于B中right_pos,A中right_pos等于B中left_pos,则将断点A和B合并为一个融合断点;
优选地,所述融合断点再次合并子模块根据上述融合断点信息,若存在融合断点A中right_pos与融合断点B中right_pos小于一定值(例如5),且融合断点A中left_pos与融合断点B中left_pos小于一定值(例如5),则将此融合断点A和融合断点B合并为一个真实融合断点。从而最终得到基因融合(gene fusion)检测结果。
此外,本发明还包括:
一种用于检测循环肿瘤DNA样本基因融合的方法,其包括以下步骤:
测序数据获取步骤,获取FFPE样本的测序数据;优选地,所述测序数据是采用双端测序(Paired-end Sequencing,PE测序)方法获得的测序数据;
比对步骤:将获取的测序数据与参考序列进行比对,获取比对结果。所述比对结果包括测序片段在基因中对应的位置信息。所述位置信息包括软剪切信息和成功比对信息。所述测序片段中带有软剪切信息的部分为所述测序片段的软剪切部,所述测序片段中带有成功比对信息的部分为所述测序片段的成功比对部。优选地,该模块可以利用bwa软件,查找测序片段在基因中对应的位置,并形成bam格式文件;优选地,该bam文件中,包括每条测序片段的描述信息(qname),序列信息(seq),比对位置(POS),位标识(flag),比对质量值(MAPQ),简要比对表达信息(Cigar),模板长度(Tlen);
再比对步骤:将带有软剪切信息的测序片段与参考基因组再次比对,获取再比对结果;
真实融合断点判断步骤:判断所述测序片段的融合断点;以及
输出步骤:输出基因融合检测结果,例如,断点位置(如left_pos,right_pos),染色体编号(如left_chr,right_chr),支持度(如sup)等。
优选地,所述再比对步骤例如可以包括以下子步骤:
长度过滤子步骤:过滤去除含有软剪切(soft-clipping)信息的测序片段中长度小于一定值的测序片段;优选地,所述一定值可以是例如15~30bp,优选20~25bp。
断点判断子步骤:根据所述长度过滤子模块的结果数据,将测序片段中带有软剪切信息的部分与带有正常比对信息的部分的结合处作为断点;
区分子步骤:将所述带有软剪切信息的部分和所述带有正常比对信息的部分在断点处分开,并将这两部分的序列信息分别保存至两个文件(例如fastq文件)中;
再比对子步骤:对所述分别保存了序列信息的两个文件与参考序列再次进行比对,获取再比对结果;优选地,所述再比对结果包括下述信息:每条测序片段的描述信息(qname)、序列信息(seq)、比对位置(POS)、位标识(flag),比对质量值(MAPQ),简要比对表达信息(Cigar),模板长度(Tlen)。优选地,例如可以利用bwa软件对上述两个fastq文件,再次进行比对,形成bam格式文件。所述bam格式文件包含每条测序片段的描述信息(qname),序列信息(seq)、位标识(flag),比对位置(POS),比对质量值(MAPQ),简要比对表达信息(Cigar),模板长度(Tlen)。
优选地,所述真实融合断点判断步骤可以包括下述子步骤:过滤子步骤:根据位标识(flag)值过滤去除未成功比对(unmapped)的测序片段以及低比对质量值(MAPQ)的测序片段;
断点信息获取子步骤:查找具有相同片段描述信息(qname)的测序片段,并获取断点信息;优选地,断点信息包括:(1)Left/right_chr,断点左/右侧序列的染色体编号;(2)left/right_pos,断点左/右侧首个碱基的比对位置;(3)left/right_seq,断点左/右侧碱基的序列;(4)sup,断点支持度,支持该断点的测序片段个数。
融合断点筛选子步骤:在断点信息中筛选融合断点;
融合断点初次合并子步骤:将具有相同的断点信息的融合断点合并为一个真实融合断点,并将具有相同断点信息的融合断点个数作为真实融合断点的支持度。其中,相同的断点信息是指left_chr、left_pos、right_chr和right_pos均相同。
融合断点再次合并子步骤:将left_chr和right_chr相同,right_pos或left_pos相差一定值(例如3bp)以内的融合断点合并为一个真实融合断点。
优选地,所述断点信息包括:
left_chr:断点左侧序列的染色体编号,read1对应的参考序列编号。
left_pos:断点左侧首个碱基的比对位置,read1对应的比对位置加上read1的序列长度。
left_seq:断点左侧碱基的序列。
right_chr:断点右侧序列的染色体编号,read2对应的参考序列编号。
right_pos:断点右侧首个碱基的比对位置,read2对应的比对位置加上read2的序列长度。
right_seq:断点右侧碱基的序列。
sup:断点支持度,支持该断点的测序片段的个数,默认为1。
优选地,所述断点筛选子模块包括如下步骤:
若存在断点A,A中sup个数大于一定值(例如5),且left_seq和right_seq中比对质量值均大于一定值(例如30),且错配率均小于一定值(例如0.05)或/和断点支持度/断点右侧或左侧位置深度大于一定值(例如0.1),则判断该断点A为融合断点。
若存在断点A和B,A中left_chr等于B中right_chr,A中right_chr等于B中left_chr,A中left_pos等于B中right_pos,A中right_pos等于B中left_pos,则将断点A和B合并为一个融合断点。
优选地,所述融合断点再次合并子步骤根据上述融合断点信息,若存在融合断点A中right_pos与融合断点B中right_pos小于一定值(例如5),且融合断点A中left_pos与融合断点B中left_pos小于一定值(例如5),则将此融合断点A和融合断点B合并为一个真实融合断点,从而最终得到基因融合(gene fusion)检测结果。
根据本发明,能够提供一种检测速度快、资源要求低、稳定性高的用于循环肿瘤DNA样本检测基因融合的装置及方法。现有算法的第二次和第三次比对过程中,每次只比对一条序列,长时间占用***资源。与现有算法相比,本发明发生算法充分利用了PE测序的优势,减少比对次数仅采用两次比对。第一次比对时即过滤得到所有可能发生融合的片段(含有软剪切信息的测序片段);第二次比对是同时对所有序列进行比对,提高了***资源的利用率。此外,本发明算法不需要对序列进行组装,没有组装导致的不稳定性,从而实现了对循环肿瘤DNA样本的基因融合检测。
附图说明
图1是实施例1的用于检测循环肿瘤DNA样本基因融合的的示意图。
图2现有技术的用于检测基因融合的装置的一例的示意图。
发明的具体实施方式
本说明书中提及的科技术语具有与本领域技术人员通常理解的含义相同的含义,如有冲突以本说明书中的定义为准。
一般而言,本说明书中采用的术语具有如下含义。
参考序列(Refseq):物种参考标准基因组序列。
融合基因(Fusion gene):是指两个基因的全部或一部分的序列相互融合为一个新的基因的过程。其有可能是染色体易位、中间缺失或染色体导致所致的结果。
Reads:基因组或转录组序列片段。
PE测序:双端测序,一种测序方法。
read1/2:PE测序下机数据中,read1是第一轮测试得到的碱基序列,read2是第二轮测试得到的碱基序列。
bwa:一种比对方法软件,用于查找reads所在Refseq中的位置,最终可得到bam格式文件。
adapter序列:测序中DNA片段两侧的接头序列。
断点(breakpoint):融合基因中两个基因序列相互连接的点。
soft-clipping reads:软剪切序列片段,在reads进行比对后,若存在部分序列比对到Refseq某位置,另一部分比对到Refseq另一位置或不能比对到Refseq,则该reads被称为soft-clipping reads。
flag:bam格式文件中,用于描述序列比对模式、方向等信息的一个值
cigar:简要比对信息表达式,其以参考序列为基础,使用数据加字母表示比对结果。
unmapped reads:指reads未比对到Refseq中某一位置。
duplication:重复序列,指由PCR扩增的序列。
片段描述信息:Qname,比对片段(template)的描述信息。
错配率:在比对过程中,可以容许reads与Refseq存在一定的差异,差异值与reads长度之比对错配率。
比对质量值:表示比对到错误位置的可能性,值越高表示可能性越低。
实施例
以下给出实施例,对本发明进行更具体的说明,但本发明不限于这些实施例。
实施例1本发明的用于检测循环肿瘤DNA基因融合的装置
采用本发明的检测循环肿瘤DNA样本基因融合的装置对一例肺癌患者的外周血样本的基因融合情况进行检测。
1.1提取外周血样本的cfDNA
采用MagMAX Cell-Free DNA Isolation Kit试剂盒(Life公司)提取血液cfDNA,得到提取的cfDNA,提取方法参照使用手册。
1.2末端修复(End Repair)
(1)预先从-20℃保存的试剂盒中取出所需试剂,单个样本配制量参见表1。
表1
(2)末端修复反应:加入DNA样本后将1.5mL离心管置于Thermomixer中20℃温浴30分钟。反应结束后使用1.8×核酸纯化磁珠回收纯化反应体系中的DNA,溶于32μLEB。
1.3末端加“A”(A-Tailing)
(1)预先从-20℃保存的试剂盒中取出所需试剂,单个样本配制量参见表2:
表2
(2)末端加“A”反应:加入32μL上一步纯化回收的DNA后将1.5mL离心管置于Thermomixer中37℃温浴30分钟。使用1.8×核酸纯化磁珠回收纯化反应体系中的DNA,溶于18μL EB中。
1.4接头的连接(Adapter Ligation)
(1)预先从-20℃保存的试剂盒中取出所需试剂,单个样本配制量参见表3:
表3
(2)接头的连接反应:加入18μL上一步纯化回收的DNA后将样本管置于Thermomixer中20℃温浴15分钟。使用1.8×核酸纯化磁珠回收纯化反应体系中的DNA,溶于30μL的EB中。
1.5 PCR反应
(1)从-20℃保存的试剂盒中取出所需试剂,2mL的PCR管中配制PCR反应体系:
表4
(2)设定PCR程序,PCR反应的程序设定如下:
反应结束及时将样品取出放入4℃冰箱保存并按要求退出或关闭仪器。
(3)用0.9×核酸纯化磁珠回收纯化反应体系中的DNA,纯化后的文库溶于20μL的ddH2O中。对文库进行Qubit检测,将文库送检安捷伦2100。
1.6肺癌目标区域捕获芯片文库杂交
(1)本实验中,用于提供杂交捕获反应的离子环境的缓冲液、以及用于洗脱物理吸附或非特异性杂交的清洗液、漂洗液均可从商业途径获得。
(2)准备杂交文库:将待杂交的DNA文库在冰上融化,取总质量1μg(在后续操作步骤中将此DNA文库称为样本文库)。
(3)制备Ann引物Pool:将样本文库Index对应的标签引物In1(100μM)及公共引物(1000μM)各取1000pmol混合,(在后续操作步骤中将此混合物称为Ann引物pool)。
(4)杂交样本的制备:向1.5mL EP管中加入5μL COT DNA(Human Cot-1DNA,Lifetechnologies,1mg/mL)、1μg样本文库、Ann引物pool。用封口膜密封制备好的杂交样本EP管,将盛有样本文库pool/COT DNA/Ann引物pool的EP管置于真空装置中直到完全干燥。
(5)杂交样本的溶液:向样本文库pool/COT DNA/Ann引物pool的干粉中加入:
7.5μL 2×杂交缓冲液
3μL 杂交组分A
(6)充分混匀后将上述混合物置于预先准备好的95℃加热模块上变性10分钟。
(7)将上述混合物转移至含有4.5μL捕获芯片的0.2mL平盖PCR管中。充分涡旋震荡3秒,将杂交样品混合物置于47℃加热模块上16小时。加热模块的热盖温度需设定为57℃,杂交后产物需进行后续洗脱回收操作。
(8)将10×清洗液(Ⅰ,Ⅱ与Ⅲ)、10×漂洗液和2.5×磁珠清洗液配置成1×工作液。
表5
(9)将下列试剂在47℃加热模块中预热:
400μL 1×漂洗液
100μL 1×清洗液I
1.7制备亲和吸附磁珠
(1)将链霉亲和素磁珠(Dynabeads M-280Streptavidin,以下简称磁珠)在室温下平衡30分钟后,将磁珠充分涡旋混匀15秒。
(2)向1.5mL离心管中分装100μL磁珠,将盛有100μL磁珠的离心管置于磁力架上,约5分钟后小心吸弃上清,加两倍于磁珠初始体积的1×磁珠清洗液,涡旋混匀10秒。将盛有磁珠的离心管放回磁力架,吸附磁珠。待溶液澄清,吸弃上清。重复次步骤,共洗涤两次。
(3)洗涤完毕后吸弃磁珠清洗液,用磁珠初始体积的1×磁珠清洗液涡旋重悬磁珠转入0.2mL的PCR管中。将PCR管置于磁力架上吸附磁珠澄清后吸弃上清。
1.8 DNA与亲和吸附磁珠的结合及漂洗
(1)将杂交的样本文库转入盛有亲和吸附磁珠的0.2mL PCR管中,涡旋振荡混匀。
(2)将0.2mL PCR管置于47℃加热模块45分钟,每隔15分钟涡旋混匀一次,使DNA与磁珠结合。
(3)45分钟孵育后,向15μL捕获的DNA样本中加入47℃预热的1×清洗液I 100μL。涡旋混匀10秒。将0.2mL PCR管中的全部组分转入1.5mL离心管中。将1.5mL离心管置于磁力架上吸附磁珠,弃上清。
(4)将1.5mL离心管从磁力架上取下,加入200μL预热47℃的1×漂洗液。吸打混匀10次(需迅速操作,防止试剂、样品温度低于47℃)。混匀后样本置于47℃加热模块上5分钟。重复此步骤,用47℃的1×漂洗液共洗涤两次。将1.5mL的离心管置于磁力架上,吸附磁珠,弃上清。
(5)向上述1.5mL离心管中加入200μL室温的1×清洗液I,涡旋混匀2分钟。将离心管置于磁力架上,吸附磁珠,弃上清。向上述1.5mL离心管中加入200μL室温的1×清洗液Ⅱ,涡旋混匀1分钟。将离心管置于磁力架上,吸附磁珠,弃上清。向上述1.5mL离心管中加入200μL室温的1×清洗液Ⅲ,涡旋混匀30秒。将离心管置于磁力架上,吸附磁珠,弃上清。
(6)1.5mL离心管从磁力架上取下,加入45μL PCR水,溶解洗脱磁珠捕获样本。
1.9捕获DNA的PCR扩增
(1)按下表制备捕获后PCR mix,制备好后涡旋震荡混匀。富集引物F和富集引物R均购自英潍捷基公司。
(2)磁珠吸附DNA PCR的扩增程序设定如下:
(3)杂交捕获DNA PCR产物的回收纯化:用核酸纯化磁珠回收纯化反应体系中的DNA,磁珠使用量为0.9×,纯化后的文库溶于30μL的ddH2O中。
1.10文库定量
对文库进行2100Bio Analyzer(Agilent)/LabChip GX(Caliper)及QPCR检测,记录文库浓度。
1.11文库上机测序
构建好的文库用NextSeq 550AR(PE100)进行测序。
1.12数据处理及分析
采用本发明的检测循环肿瘤DNA样本基因融合的装置对1.12文库上机测序的结果进行处理分析。
本发明的用于检测基因融合的装置具备:
测序数据获取模块,用于获取使用肺癌目标区域捕获芯片对待检测的肺癌外周血样本进行捕获测序而获得测序数据。
比对模块:其与所述测序数据获取模块相连接,用于将获取的测序数据与参考序列进行比对,获取比对结果。所述比对结果包括测序片段在参考序列中对应的位置。所述位置信息包括软剪切信息和成功比对信息。所述测序片段中带有软剪切信息的部分为所述测序片段的软剪切部,所述测序片段中带有成功比对信息的部分为所述测序片段的成功比对部。该模块利用bwa软件,查找测序片段在基因中对应的位置,并形成bam格式文件;该bam文件中包括每条测序片段的描述信息(qname),序列信息(seq),比对位置(POS),位标识(flag),比对质量值(MAPQ),简要比对表达信息(Cigar)、模板长度(Tlen)。
再比对模块:其与所述比对模块相连接,用于将带有软剪切信息的测序片段与参考基因组再次比对,获取再比对结果。
所述再比对模块包括以下子模块:
长度过滤子模块:其与所述比对模块相连接,用于过滤去除含有软剪切(soft-clipping)信息的测序片段中长度小于20bp的测序片段。
断点判断子模块:其与所述长度过滤子模块相连接,用于根据所述长度过滤子模块的结果数据,将测序片段中带有软剪切信息的部分与带有正常比对信息的部分的结合处作为断点。
区分子模块:其与所述断点判断子模块相连接,用于将所述带有软剪切信息的部分和所述带有正常比对信息的部分在断点处分开,并将这两部分的序列信息分别保存至两个fastq文件中。
再比对子模块:其与所述区分子模块相连接,用于对所述分别保存了序列信息的两个文件与参考序列再次进行比对,获取再比对结果;再比对结果包括:每条测序片段的描述信息(qname)、序列信息(seq)、比对位置(POS)、位标识(flag),比对质量值(MAPQ),简要比对表达信息(Cigar),模板长度(Tlen)。利用bwa软件对上述两个fastq文件,再次进行比对,形成bam格式文件。所述bam格式文件包含每条测序片段的描述信息(qname),序列信息(seq)、位标识(flag),比对位置(POS),比对质量值(MAPQ),简要比对表达信息(Cigar),模板长度(Tlen)。
真实融合断点判断模块:其与所述再比对模块相连接,用于判断所述测序片段的融合断点。
所述真实融合断点判断模块包括下述子模块:
过滤子模块:其与所述再比对子模块相连接,用于根据位标识(flag)值过滤去除未成功比对(unmapped)的测序片段以及低比对质量值(MAPQ)的测序片段;
断点信息获取子模块:其与所述过滤子模块相连接,用于查找具有相同片段描述信息的测序片段,并获取断点信息。断点信息包括:(1)left_chr:断点左侧序列的染色体编号,read1对应的参考序列编号。(2)left_pos:断点左侧首个碱基的比对位置,read1对应的比对位置加上read1的序列长度。(3)left_seq:断点左侧碱基的序列。(4)right_chr:断点右侧序列的染色体编号,read2对应的参考序列编号。(5)right_pos:断点右侧首个碱基的比对位置,read2对应的比对位置加上read2的序列长度。(6)right_seq:断点右侧碱基的序列。(7)sup:断点支持度,支持该断点的测序片段个数,默认为1。
融合断点筛选子模块:其与所述断点信息获取子模块相连接,用于在断点信息中筛选融合断点。
融合断点筛选子模块包括如下元件:
断点质量过滤元件:用于过滤去掉低质量断点。若存在断点A,A中sup个数大于5,且left_seq和right_seq中比对质量值均大于30,且错配率均小于0.05,则该断点A判断为融合断点。
相同断点合并元件:用于合并相同断点。若存在断点A和B,A中left_chr等于B中right_chr,A中right_chr等于B中left_chr,A中left_pos等于B中right_pos,A中right_pos等于B中left_pos。A和B为同一个断点的两种形式,则该断点A和断点B合并为一个融合断点。
融合断点初次合并子模块:其与所述融合断点筛选子模块相连接,用于将具有相同的断点信息(left_chr、left_pos、right_chr和right_pos均相同)的断点合并为一个真实融合断点,并将具有相同断点信息的断点个数作为真实融合断点的支持度。
融合断点再次合并子模块:其与所述断点初次合并子模块相连接,将left_chr和right_chr相同,但right_pos或left_pos相差5bp以内的融合断点合并为一个真实融合断点。所述融合断点再次合并模块根据上述融合断点信息,若存在融合断点A中right_pos与融合断点B中right_pos小于5,且融合断点A中left_pos与融合断点B中left_pos小于5,则将此融合断点A和融合断点B合并为一个基因融合断点(gene fusion)。从而最终得到基因融合检测结果。以及
输出模块:其与所述真实融合断点判断模块相连接,用于输出基因融合检测结果。
检测结果如下表所示。
1.13结果验证
采用QPCR方法对同一患者的组织FFPE样本进行验证,检测其是否发生EML4-ALK的融合。检测结果表明EML4与ALK发生融合,验证结果与1.12检测结果一致。本发明的检测装置能够成功检出肿瘤循环DNA样本的基因融合。
工业实用性
根据本发明,提供了一种检测速度快、资源要求低、稳定性高的用于检测循环肿瘤DNA样本基因融合的装置及方法。

Claims (9)

1.一种用于检测循环肿瘤DNA样本基因融合的装置,其包括以下模块:
测序数据获取模块,用于获取循环肿瘤DNA样本的测序数据;优选地,所述测序数据是采用双端测序方法获得的测序数据;
比对模块:其与所述测序数据获取模块相连接,用于将获取的测序数据与参考序列进行比对,获取比对结果,所述比对结果包括所述测序片段的软剪切信息和成功比对信息;
再比对模块:其与所述比对模块相连接,用于将带有软剪切信息的测序片段与参考基因组再次比对,获取再比对结果;
真实融合断点判断模块:其与所述再比对模块相连接,用于判断所述测序片段的真实融合断点;以及
输出模块:其与所述真实融合断点判断模块相连接,用于输出基因融合检测结果。
2.根据权利要求1所述的装置,其特征在于,所述比对模块利用bwa软件,查找测序片段在参考序列中对应的位置,获取测序片段的软剪切信息和成功比对信息并形成bam格式文件。
3.根据权利要求1或2所述的装置,其特征在于,所述再比对模块包括下述子模块:
长度过滤子模块:其与所述比对模块相连接,用于过滤去除含有软剪切信息的测序片段中长度小于一定值的测序片段;
断点判断子模块:其与所述长度过滤子模块相连接,用于根据所述长度过滤子模块的结果数据,将测序片段中带有软剪切信息的部分与带有正常比对信息的部分的结合处作为断点;
区分子模块:其与所述断点判断子模块相连接,用于将所述带有软剪切信息的部分和所述带有正常比对信息的部分在断点处分开,并将这两部分的序列信息分别保存至两个文件中;
再比对子模块:其与所述区分子模块相连接,用于对所述分别保存了序列信息的两个文件与参考序列再次进行比对,获取再比对结果;优选地,所述再比对结果包括:每条测序片段的描述信息(qname)、序列信息(seq)、比对位置(POS)、比对质量值(MAPQ)。
4.根据权利要求3所述的装置,其特征在于,所述再比对子模块利用bwa软件对所述两个fastq文件再次进行比对,并形成bam格式文件。
5.根据权利要求3所述的装置,其中,所述长度过滤子模块过滤含有软剪切信息的测序片段中长度小于15~25bp的测序片段。
6.根据权利要求3所述的装置,其特征在于,所述区分子模块将获取的序列信息保存至fastq文件中。
7.根据权利要求1或2所述的装置,其特征在于,所述真实融合断点判断模块包括下述子模块:
过滤子模块:其与所述再比对子模块相连接,用于过滤去除未成功比对的测序片段和低比对质量值的测序片段;
断点信息获取子模块:其与所述过滤子模块相连接,用于查找具有相同片段描述信息的测序片段,并获取断点信息;
优选地,断点信息包括:
left/right_chr,断点左/右侧序列的染色体编号;
left/right_pos,断点左/右侧首个碱基的比对位置;
left/right_seq,断点左/右侧碱基的序列;
sup,断点支持度,支持该断点的测序片段的个数。
融合断点筛选子模块:其与所述断点信息获取子模块相连接,用于在断点信息中筛选融合断点;
融合断点初次合并子模块:其与所述融合断点筛选子模块相连接,用于将具有相同断点信息的融合断点合并为一个真实融合断点,并将具有相同断点信息的融合断点个数作为真实融合断点的支持度,其中,相同的断点信息是指left_chr、left_pos、right_chr和right_pos均相同;
融合断点再次合并子模块:其与所述断点初次合并子模块相连接,用于将left_chr和right_chr相同,right_pos或left_pos相差一定值以内的融合断点合并为一个真实融合断点。
8.根据权利要求7所述的装置,其特征在于,所述融合断点筛选子模块包括如下元件:
断点质量过滤元件:用于过滤低质量断点,若存在断点A,A的sup个数大于一定值(例如5)、且left_seq和right_seq中比对质量值均大于一定值(例如30)、且错配率均小于一定值(例如0.05),则该断点A为融合断点;以及
相同断点合并元件:用于合并相同断点,若存在断点A和B,A中left_chr等于B中right_chr,A中right_chr等于B中left_chr,A中left_pos等于B中right_pos,A中right_pos等于B中left_pos,则将断点A和B合并为一个融合断点。
9.根据权利要求6所述的装置,其中,所述融合断点再次合并子模块根据上述融合断点信息,若存在融合断点A中right_pos与融合断点B中right_pos小于一定值(例如5)、且融合断点A中left_pos与融合断点B中left_pos小于一定值(例如5),则将此融合断点A和B合并为一个真实融合断点。
CN201710067169.2A 2016-12-29 2017-02-07 一种用于检测循环肿瘤dna样本基因融合的装置 Active CN106845150B (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN201611251266 2016-12-29
CN2016112512669 2016-12-29

Publications (2)

Publication Number Publication Date
CN106845150A true CN106845150A (zh) 2017-06-13
CN106845150B CN106845150B (zh) 2021-11-16

Family

ID=59122756

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710067169.2A Active CN106845150B (zh) 2016-12-29 2017-02-07 一种用于检测循环肿瘤dna样本基因融合的装置

Country Status (1)

Country Link
CN (1) CN106845150B (zh)

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107267646A (zh) * 2017-08-02 2017-10-20 广东国盛医学科技有限公司 一种基于下一代测序的多基因融合检测方法
CN107368708A (zh) * 2017-08-14 2017-11-21 东莞博奥木华基因科技有限公司 一种精准分析dmd基因结构变异断点的方法及***
CN107480472A (zh) * 2017-07-21 2017-12-15 广州漫瑞生物信息技术有限公司 一种基因融合的检测方法和装置
CN107944225A (zh) * 2017-11-28 2018-04-20 慧算医疗科技(上海)有限公司 基因高通量测序数据突变检测方法
CN108229103A (zh) * 2018-01-15 2018-06-29 臻和(北京)科技有限公司 循环肿瘤dna重复序列的处理方法及装置
CN108319817A (zh) * 2018-01-15 2018-07-24 臻和(北京)科技有限公司 循环肿瘤dna重复序列的处理方法及装置
CN108595918A (zh) * 2018-01-15 2018-09-28 臻和(北京)科技有限公司 循环肿瘤dna重复序列的处理方法及装置
CN111180013A (zh) * 2019-12-23 2020-05-19 北京橡鑫生物科技有限公司 检测血液病融合基因的装置
CN114005490A (zh) * 2021-12-30 2022-02-01 北京优迅医疗器械有限公司 基于二代测序技术的循环肿瘤dna融合检测方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104204221A (zh) * 2011-12-31 2014-12-10 深圳华大基因科技服务有限公司 一种检验融合基因的方法及***
CN104894271A (zh) * 2015-06-10 2015-09-09 天津诺禾致源生物信息科技有限公司 一种检测基因融合的方法及装置
CN105543380A (zh) * 2016-01-27 2016-05-04 北京诺禾致源生物信息科技有限公司 一种检测基因融合的方法及装置
WO2016114009A1 (ja) * 2015-01-16 2016-07-21 国立研究開発法人国立がん研究センター 融合遺伝子解析装置、融合遺伝子解析方法、及びプログラム

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104204221A (zh) * 2011-12-31 2014-12-10 深圳华大基因科技服务有限公司 一种检验融合基因的方法及***
WO2016114009A1 (ja) * 2015-01-16 2016-07-21 国立研究開発法人国立がん研究センター 融合遺伝子解析装置、融合遺伝子解析方法、及びプログラム
CN104894271A (zh) * 2015-06-10 2015-09-09 天津诺禾致源生物信息科技有限公司 一种检测基因融合的方法及装置
CN105543380A (zh) * 2016-01-27 2016-05-04 北京诺禾致源生物信息科技有限公司 一种检测基因融合的方法及装置

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
HYLAND F.;ET AL: "《Cloud-based informatics enables the design and analysis of massively multiplex custom gene fusion panels for next-generation sequencing on FFPE RNA samples》", 《CANCER RESEARCH》 *
NOME TORFINN,ET AL: "《Common Fusion Transcripts Identified in Colorectal Cancer Cell Lines by High-Throughput RNA Sequencing》", 《TRANSLATIONAL ONCOLOGY》 *
张勇,等: "《不依赖于剪接位点信号的高精度转录组序列比对算法》", 《计算机***应用》 *

Cited By (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107480472A (zh) * 2017-07-21 2017-12-15 广州漫瑞生物信息技术有限公司 一种基因融合的检测方法和装置
CN107480472B (zh) * 2017-07-21 2021-06-01 广州漫瑞生物信息技术有限公司 一种基因融合的检测方法和装置
CN107267646A (zh) * 2017-08-02 2017-10-20 广东国盛医学科技有限公司 一种基于下一代测序的多基因融合检测方法
CN107368708A (zh) * 2017-08-14 2017-11-21 东莞博奥木华基因科技有限公司 一种精准分析dmd基因结构变异断点的方法及***
CN107944225B (zh) * 2017-11-28 2020-04-24 慧算医疗科技(上海)有限公司 基因高通量测序数据突变检测方法
CN107944225A (zh) * 2017-11-28 2018-04-20 慧算医疗科技(上海)有限公司 基因高通量测序数据突变检测方法
CN108229103A (zh) * 2018-01-15 2018-06-29 臻和(北京)科技有限公司 循环肿瘤dna重复序列的处理方法及装置
CN108595918A (zh) * 2018-01-15 2018-09-28 臻和(北京)科技有限公司 循环肿瘤dna重复序列的处理方法及装置
CN108229103B (zh) * 2018-01-15 2020-12-25 无锡臻和生物科技有限公司 循环肿瘤dna重复序列的处理方法及装置
CN108319817B (zh) * 2018-01-15 2020-12-25 无锡臻和生物科技有限公司 循环肿瘤dna重复序列的处理方法及装置
CN108595918B (zh) * 2018-01-15 2021-03-16 无锡臻和生物科技有限公司 循环肿瘤dna重复序列的处理方法及装置
CN108319817A (zh) * 2018-01-15 2018-07-24 臻和(北京)科技有限公司 循环肿瘤dna重复序列的处理方法及装置
CN111180013A (zh) * 2019-12-23 2020-05-19 北京橡鑫生物科技有限公司 检测血液病融合基因的装置
CN111180013B (zh) * 2019-12-23 2023-11-03 北京橡鑫生物科技有限公司 检测血液病融合基因的装置
CN114005490A (zh) * 2021-12-30 2022-02-01 北京优迅医疗器械有限公司 基于二代测序技术的循环肿瘤dna融合检测方法
CN114005490B (zh) * 2021-12-30 2022-04-22 北京优迅医疗器械有限公司 基于二代测序技术的循环肿瘤dna融合检测方法

Also Published As

Publication number Publication date
CN106845150B (zh) 2021-11-16

Similar Documents

Publication Publication Date Title
CN106845150A (zh) 一种用于检测循环肿瘤dna样本基因融合的装置
CN107475375B (zh) 一种用于与微卫星不稳定性相关微卫星位点进行杂交的dna探针库、检测方法和试剂盒
Ignatiadis et al. Circulating tumor cells and circulating tumor DNA: challenges and opportunities on the path to clinical utility
CN106845153A (zh) 一种用于利用循环肿瘤dna样本检测体细胞突变的装置
CN106650312A (zh) 一种用于循环肿瘤dna拷贝数变异检测的装置
CN106570349B (zh) 用于目标区域捕获高通量测序的特异性肿瘤探针区域设计方法和装置以及探针
CN106845155A (zh) 一种用于检测内部串联重复的装置
CN107475370A (zh) 用于肺癌诊断的基因群和试剂盒及诊断方法
CN109811055A (zh) 肉瘤融合基因检测试剂盒及***
CN108950018A (zh) 用于检测基因融合突变的引物/探针组合、试剂盒及其使用方法
CN115572760A (zh) 免疫组库正常性评估方法及其应用
WO2018133546A1 (zh) 无创产前胎儿α型地贫基因突变检测文库构建方法、检测方法和试剂盒
CN109652525A (zh) 肺血栓栓塞症基因面板试剂盒及其应用
CN106755506A (zh) 用于检测肿瘤ffpe样本中基因变异的试剂盒
CN116631508B (zh) 肿瘤特异性突变状态的检测方法及其应用
CN106815491A (zh) 一种用于检测ffpe样本基因融合的装置
CN114410766A (zh) 一种血栓与出凝血性疾病检测panel及其应用
CN109234357A (zh) 一种用于检测靶基因是否发生融合突变的方法、引物组合、试剂盒及其应用
CN105779432A (zh) 试剂盒及其用途
Li et al. The cornerstone of integrating circulating tumor DNA into cancer management
CN108977534B (zh) 一种靶向测序试剂盒及其使用方法及靶向测序方法
CN109790570B (zh) 获取来源于脊椎动物的单细胞的碱基序列信息的方法
CN106874710A (zh) 一种用于利用肿瘤ffpe样本检测体细胞突变的装置
CN107502679A (zh) 鉴别prrsv毒株基因亚型的lamp引物及鉴别方法和应用
CN106282361A (zh) 用于捕获血液病相关基因的基因捕获试剂盒

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
TA01 Transfer of patent application right

Effective date of registration: 20171215

Address after: 100176 Beijing branch of Beijing economic and Technological Development Zone Street 88 Hospital No. 8 Building 2 unit 701 room

Applicant after: Annoroad Genetic Technology (Beijing) Co., Ltd.

Applicant after: Zhejiang Annuo uni-data Biotechnology Co. Ltd.

Applicant after: Annuo uni-data (Yiwu) Medical Inspection Co. Ltd.

Address before: 100176 Beijing branch of Daxing District economic and Technological Development Zone Street 88 Hospital No. 8 Building 2 unit 701 room

Applicant before: Annoroad Genetic Technology (Beijing) Co., Ltd.

TA01 Transfer of patent application right
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right

Effective date of registration: 20211012

Address after: 322000 1st floor, building 9, standard workshop, No.10 Gaoxin Road, Houjiang street, Yiwu City, Jinhua City, Zhejiang Province

Applicant after: ZHEJIANG ANNOROAD BIO-TECHNOLOGY Co.,Ltd.

Applicant after: ANNOROAD GENE TECHNOLOGY (BEIJING) Co.,Ltd.

Applicant after: ANNOROAD (YIWU) MEDICAL INSPECTION Co.,Ltd.

Address before: 100176 room 701, unit 2, building 8, courtyard 88, Kechuang 6th Street, Beijing Economic and Technological Development Zone, Beijing

Applicant before: ANNOROAD GENE TECHNOLOGY (BEIJING) Co.,Ltd.

Applicant before: ZHEJIANG ANNOROAD BIO-TECHNOLOGY Co.,Ltd.

Applicant before: ANNOROAD (YIWU) MEDICAL INSPECTION Co.,Ltd.

TA01 Transfer of patent application right
GR01 Patent grant
GR01 Patent grant