CN106845154B - 一种用于ffpe样本拷贝数变异检测的装置 - Google Patents

一种用于ffpe样本拷贝数变异检测的装置 Download PDF

Info

Publication number
CN106845154B
CN106845154B CN201710067086.3A CN201710067086A CN106845154B CN 106845154 B CN106845154 B CN 106845154B CN 201710067086 A CN201710067086 A CN 201710067086A CN 106845154 B CN106845154 B CN 106845154B
Authority
CN
China
Prior art keywords
module
sample
sequencing
window
value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201710067086.3A
Other languages
English (en)
Other versions
CN106845154A (zh
Inventor
荆瑞琳
张萌萌
董永芳
王旺
李雪峰
玄兆伶
李大为
梁峻彬
陈重建
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Annoroad Gene Technology Beijing Co ltd
Beijing Annoroad Medical Laboratory Co ltd
Original Assignee
Annoroad Gene Technology Beijing Co ltd
Annoroad Yiwu Medical Inspection Co ltd
Zhejiang Annoroad Bio Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Annoroad Gene Technology Beijing Co ltd, Annoroad Yiwu Medical Inspection Co ltd, Zhejiang Annoroad Bio Technology Co ltd filed Critical Annoroad Gene Technology Beijing Co ltd
Publication of CN106845154A publication Critical patent/CN106845154A/zh
Application granted granted Critical
Publication of CN106845154B publication Critical patent/CN106845154B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids

Landscapes

  • Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Analytical Chemistry (AREA)
  • Biophysics (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Biotechnology (AREA)
  • Evolutionary Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Theoretical Computer Science (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本发明涉及一种FFPE样本拷贝数变异检测装置,其检测灵敏度高。本发明的FFPE样本拷贝数变异检测装置包括测序数据获取模块、序列比对模块、前期数据处理模块、归一化模块、背景库筛选模块、数据波动消除模块、GC校正模块以及输出模块。

Description

一种用于FFPE样本拷贝数变异检测的装置
技术领域
本发明属于分子生物学检测领域,具体涉及FFPE样本拷贝数变异检测装置及检测方法。
背景技术
***固定石蜡包埋(Formalin-fixed and Paraffin-embedded,FFPE)方法制备的组织标本称为***固定石蜡包埋组织样本,简称FFPE样本。FFPE样本能够长时间保存,特别是,有大量的肿瘤组织切片被以FFPE样本的形式保存。FFPE样本常用于临床病理检验、肿瘤基因检测和医学科学研究,为阐明疾病机制、发现治疗靶标和指示预后等方面提供了宝贵的资源。
基因的拷贝数变异(Copy Number Variation,CNV)是一类在临床上非常重要的结构变异,与多种肿瘤的预后,靶向药物的敏感性相关。可靠的CNV检测结果可以为临床用药以及病情评估等提供十分重要的依据。目前临床上所使用的CNV检测技术大多为基于PCR或免疫组化的实验手段(如FISH,IHC等)。此类方法单次检测仅可覆盖一个基因,且检测结果灵敏度较低。
基于新一代测序(Next-Generation Sequencing,NGS)平台的CNV检测,可以在保证检测性能的前提下一次性给出多个基因的CNV检测结果。传统的NGS平台CNV检测技术大多基于全基因组测序技术平台完成研发,随着NGS技术的不断进步,基于目标区域捕获的高深度测序技术在临床检测的应用场景下逐渐表现出优势。
但是,由于全基因组测序数据与目标区域捕获测序数据存在根本差别,目前传统NGS平台的CNV检测方法对于目标区域捕获测序数据并不适用,在检测CNV的准确性上难以保证,且检测灵敏度有待提高。这一问题在FFPE样本中表现尤为明显。FFPE样本的DNA片段化较为严重,会对目标基因DNA捕获以及NGS测序等过程产生影响,并最终影响到目标区域的有效深度等关键技术指标。因此,低质量FFPE样本所产生的低深度测序数据的可用性,成为了较大的技术挑战。
发明内容
鉴于上述现有技术中存在的不足,本发明的目的在于提供一种对FFPE样本的CNV的检测灵敏度更高的检测装置及检测方法。
本发明的发明人为解决上述技术问题进行了深入研究,结果发现:在FFPE样本的CNV检测方法中,是否对数据进行合理的降噪处理,是否使用了合适的背景库,会直接影响到检测结果,特别是在捕获测序中此种影响尤为显著。通过更为合理全面的降噪处理,动态背景库的应用,能够提高FFPE样本CNV检测的灵敏度,从而完成了本发明。
即,本发明包括:
一种用于FFPE样本拷贝数变异(所述拷贝数变异可以发生在基因区域,也可以发生在非基因区域)检测的装置,其包括:
测序数据获取模块,用于获取来自待检FFPE样本的捕获测序数据以及来自健康人群样本的测序数据,所述健康人群样本为多个健康人(健康正常人)样本;
序列比对模块,其与所述测序数据获取模块连接,用于将所述测序数据获取模块获得的测序数据与参考基因组序列进行比对,得到比对结果(包含例如,每条可以与参考基因组比对上的短序列所在的染色体,坐标,短序列与参考基因组的匹配情况等信息),根据该比对结果计算每一个位点(指基因组上的每个位点,但捕获测序中可能有一些位点的深度值为0)的深度值;
前期数据处理模块,其与所述序列比对模块连接,用于将目标区域(100k~100M,全基因组或者重点关注区域)划分为一定长度(50~1000bp)的有重叠(10~70%)的窗口,去掉窗口内位点的深度极值(极大值和极小值)并计算深度均值或中值,且计算该窗口内的参考基因组序列的GC含量;
归一化模块,其与所述前期数据处理模块连接,用于对所述前期数据处理模块所得到的每一个窗口内的深度均值或中值进行归一化,计算得到待检FFPE样本和健康人群样本每个窗口内的Z值;
背景库筛选模块,其与所述归一化模块连接,用于根据待检FFPE样本与健康人群样本的Z值,筛选出n个健康人样本(每个健康人样本对应一个健康人),得到n个健康人样本的背景库样本集,然后使用该n个健康人样本在m个窗口内的Z值构建m行n列的矩阵Xm×n
数据波动消除模块,其与所述背景库筛选模块连接,用于消除捕获测序带来的固有数据波动;
GC校正模块,其与所述数据波动消除模块连接,用于根据各窗口内的GC含量进行GC矫正;
输出模块,其与所述GC校正模块连接,用于输出CNV检测结果(包括例如,用于展示CNV检测结果的图,CNV变异的阴性/阳性的判定结果等)。
本发明的用于FFPE样本拷贝数变异检测的装置的测序数据获取模块获取采用二代测序方法对待检FFPE样本中的DNA进行测序而得到的测序数据。二代测序的主流平台一般均采用边合成边测序(Sequencing By Synthesis,SBS)技术进行核酸测序。测序前,需要对核酸(DNA或RNA)样本进行测序文库的构建,基本流程如下:首先将片段化后的DNA进行片段的末端修复,之后在修复后的片段3'端加“A”碱基,然后将上述DNA片段与含有测序引物结合位点的DNA接头(Adapter)连接,最后通过PCR进行扩增,完成测序文库构建。对于具体的二代测序方法没有特殊限制,可以采用任何本领域技术人员已知的二代测序方法。
优选地,所述测序数据是采用捕获测序方法获得的测序数据;
所述捕获测序的目标基因可以因不同的目标疾病而异。所述目标疾病可以是例如实体癌(例如胃癌、乳腺、结肠直肠癌、肺癌等)。
具体例如,在所述目标疾病是乳腺癌的情况下,所述目标基因可以是例如EGFR基因、ERBB2基因、FGFR1基因、KIT基因、PIK3CA基因或/和PTEN基因;在所述目标疾病是结肠直肠癌的情况下,所述目标基因可以是例如EGFR基因、ERBB2基因、FGFR2基因、KRAS基因、MET基因、PTEN基因;在所述目标疾病是胃癌的情况下,所述目标基因可以是例如EGFR基因、ERBB2基因、FGFR1基因、FGFR2基因、KRAS基因、MET基因、PIK3CA基因或/和PTEN基因;在所述目标疾病是肺癌的情况下,所述目标基因可以是例如ALK基因、BRAF基因、EGFR基因、ERBB2基因、FGFR1基因、KRAS基因、MET基因、PIK3CA或/和PTEN。
优选地,所述前期数据处理模块采用滑动窗口法划分所述窗口。
优选地,所述归一化模块依据下述公式(1)计算得到待检样本每个窗口内的Z值,公式(1)中Zi表示第i个窗口的Z值,
Zi=trimScale(Zi,Zi)……(1)。
优选地,定义公式(2):
定义
Figure BDA0001221588410000041
其中,chr表示染色体,St表示待检生物样本,SN表示健康人群样本;
所述背景库筛选模块根据待检FFPE样本与健康人群样本的Z值,筛选出使得所述d值最小的n个健康人样本,得到筛选后的背景库样本集S1,S2,S3,…,Sn(N和n均为自然数且n<N)。
优选地,所述数据波动消除模块对背景库矩阵Xm×n做奇异值分解,得到m行r列因子矩阵Um×r,r为因子个数,然后取贡献率最大的k个因子(即排名靠前的k个因子,k一般为4-10)进行LOESS回归,得到残差Zp
优选地,所述GC校正模块根据各窗口内的GC含量,对Zp基于LOESS回归做GC矫正,得到残差Zpg
优选地,所述FFPE样本拷贝数变异检测装置还包括:
数据质检模块,其与所述测序模块和所述序列比对模块连接,用于对所述测序模块获得的测序数据进行质检。质检包括但不限于例如去除低质量的短序列、去除N含量较高的短序列、去除与Adapter相关的短序列、并最终统计各项相关的质控指标。
此外,本发明还包括:
一种用于FFPE样本拷贝数变异(所述拷贝数变异可以发生在基因区域,也可以发生在非基因区域)检测的方法,其包括:
测序数据获取步骤,获取来自待检FFPE样本的捕获测序数据以及来自健康人群样本的测序数据,所述健康人群样本为多个健康人样本;
序列比对步骤,将所述测序数据获取步骤获得的测序数据与参考基因组序列进行比对,得到比对结果(包含例如,每条可以与参考基因组比对上的短序列所在的染色体,坐标,短序列与参考基因组的匹配情况等信息),根据该比对结果计算每一个位点(指基因组上的每个位点,但捕获测序中可能有一些位点的深度值为0)的深度值;
前期数据处理步骤,将目标区域(100k~100M,全基因组或者重点关注区域)划分为一定长度(50~1000bp)的有重叠(10~70%)的窗口,去掉窗口内位点的深度极值(极大值和极小值)并计算深度均值或中值,且计算该窗口内的参考基因组序列的GC含量;
归一化步骤,对前期数据处理步骤所得到的每一个窗口内的深度均值或中值进行归一化,计算得到待检FFPE样本和健康人群样本每个窗口内的Z值;
背景库筛选步骤,根据待检FFPE样本与健康人群样本的Z值,筛选出n个健康人样本(健康人样本,每个背景库样本对应一个健康人),得到背景库样本集,然后使用该n个健康人样本在m个窗口内的Z值构建m行n列的矩阵Xm×n
数据波动消除步骤,消除捕获测序带来的固有数据波动;
GC校正步骤,根据各窗口内的GC含量进行GC矫正;以及
输出步骤,输出CNV检测结果(包括例如,用于展示CNV检测结果的图,CNV变异的阴性/阳性的判定结果等)。
本发明的用于FFPE样本拷贝数变异检测的方法的测序数据获取步骤获取采用二代测序方法对待检FFPE样本中的DNA进行测序而得到的测序数据。二代测序的主流平台一般均采用边合成边测序(Sequencing By Synthesis,SBS)技术进行核酸测序。测序前,需要对核酸(DNA或RNA)样本进行测序文库的构建,基本流程如下:首先将片段化后的DNA进行片段的末端修复,之后在修复后的片段3'端加“A”碱基,然后将上述DNA片段与含有测序引物结合位点的DNA接头(Adapter)连接,最后通过PCR进行扩增,完成测序文库构建。对于具体的二代测序方法没有特殊限制,可以采用任何本领域技术人员已知的二代测序方法。
优选地,所述测序数据是采用捕获测序方法获得的测序数据;
所述捕获测序的目标基因可以因不同的目标疾病而异。所述目标疾病可以是例如实体癌(例如胃癌、乳腺、结肠直肠癌、肺癌等)。
具体例如,在所述目标疾病是乳腺癌的情况下,所述目标基因可以是例如EGFR基因、ERBB2基因、FGFR1基因、KIT基因、PIK3CA基因或/和PTEN基因;在所述目标疾病是结肠直肠癌的情况下,所述目标基因可以是例如EGFR基因、ERBB2基因、FGFR2基因、KRAS基因、MET基因、PTEN基因;在所述目标疾病是胃癌的情况下,所述目标基因可以是例如EGFR基因、ERBB2基因、FGFR1基因、FGFR2基因、KRAS基因、MET基因、PIK3CA基因或/和PTEN基因;在所述目标疾病是肺癌的情况下,所述目标基因可以是例如ALK基因、BRAF基因、EGFR基因、ERBB2基因、FGFR1基因、KRAS基因、MET基因、PIK3CA或/和PTEN。
优选地,所述前期数据处理步骤采用滑动窗口法划分所述窗口。
优选地,所述归一化步骤依据下述公式(1)计算得到待检样本每个窗口内的Z值,公式(1)中Zi表示第i个窗口的Z值,
Zi=trimScale(Zi,Zi)……(1)。
优选地,定义公式(2):
定义
Figure BDA0001221588410000071
其中,chr表示染色体,ST表示待检FFPE样本,SN表示健康人群样本;
所述背景库筛选步骤根据待检FFPE样本与健康人群样本的Z值,筛选出使得所述d值最小的n个健康人样本,得到筛选后的背景库样本集S1,S2,S3,…,Sn(N,n均为自然数且n<N)。
优选地,所述数据波动消除步骤对背景库矩阵Xm×n做奇异值分解,得到m行r列因子矩阵Um×r,r为因子个数,然后取贡献率最大的k个因子(即排名靠前的k个因子,k一般为4-10)进行LOESS回归,得到残差Zp
优选地,所述GC校正步骤根据各窗口内的GC含量,对Zp基于LOESS回归做GC矫正,得到残差Zpg
优选地,所述拷贝数变异检测方法还包括:
数据质检步骤,对所述测序步骤获得的测序数据进行质检。质检包括但不限于例如去除低质量的短序列、去除N含量较高的短序列、去除与Adapter相关的短序列、并最终统计各项相关的质控指标。
其中,上述各步骤的优选实施方式可参照前述。
根据本发明,提供一种对FFPE样本CNV的检测灵敏度更高的检测装置及检测方法。
附图说明
图1为本发明的用于FFPE样本拷贝数变异检测的装置的示意图。
图2为实施例1对乳腺癌多个基因的CNV检测结果的图。
发明的具体实施方式
本说明书中提及的科技术语具有与本领域技术人员通常理解的含义相同的含义,如有冲突以本说明书中的定义为准。
定义
参考基因组:一个细胞或者生物体所携带的一套完整的单倍体序列,包括全套基因和间隔序列。
比对:一般指序列比对,指为确定两个或多个序列之间的相似性以至于同源性,而将它们按照一定的规律排列的过程。
深度值:对于基因组上的某个位点,根据比对结果,覆盖到该位点的短序列数量即为该位点的深度值。
窗口(滑动窗口):一般指基因组上的一段固定长度的区域。
背景库:由多例(一般认为≥20例)健康人样本所组成的样本库。
捕获测序:通过预先设计好的探针,对基因组上的特定区域(感兴趣的区域)进行DNA片段抓取,并最终对抓取到的DNA片段进行NGS测序的过程。
NGS(高通量测序):高通量测序技术(High-throughput sequencing)又称“下一代”测序技术("Next-generation"sequencing technology),以能一次并行对几十万到几百万条DNA分子进行序列测定和一般读长较短等为标志。
归一化(Z值):
Figure BDA0001221588410000081
trimScale(w,v):定义w为某个需要进行归一化的值,v为某个数据集
a.去掉v上下一定百分比的数据得到
Figure BDA0001221588410000082
b.计算
Figure BDA0001221588410000083
的均值μ和标准差σ
c.计算得到
Figure BDA0001221588410000084
作为最终结果
SVD(奇异值分解):SVD是线性代数中一种重要的矩阵分解,是矩阵分析中正规矩阵酉对角化的推广。在信号处理、统计学等领域有重要应用。其作用是把数据集映射到低维空间中去。数据集的特征值(在SVD中用奇异值表征)按照重要性排列,降维的过程就是舍弃不重要的特征向量的过程,而剩下的特征向量组成的空间即为降维后的空间。
实施例
以下通过实施例对本发明进行更具体的说明。应当理解,此处所描述的实施例是用于解释本发明,而非用于限定本发明。
实施例1
采用本发明的用于FFPE样本拷贝数变异检测的装置对一例女性乳腺癌患者的组织FFPE样本的CNV情况进行检测。
1.1提取FFPE样本的DNA
采用GeneRead DNA FFPE Kit(QIAGEN公司),按照手册说明进行提取操作,得到FFPE样本DNA。
1.2样本打断
使用Biorupter打断仪器进行打断,设定打断条件30个循环,30s ON/30s OFF,将FFPE样本DNA打断成200bp左右的片段,得到打断后的DNA片段。
1.3末端修复(End Repair)
(1)预先从-20℃保存的试剂盒中取出所需试剂,单个样本配制量参见表1。
表1
Figure BDA0001221588410000091
(2)末端修复反应:加入DNA样本后将1.5mL离心管置于Thermomixer中20℃温浴30分钟。反应结束后使用1.8×核酸纯化磁珠回收纯化反应体系中的DNA,溶于32μLEB。
1.4末端加“A”(A-Tailing)
(1)预先从-20℃保存的试剂盒中取出所需试剂,单个样本配制量参见表2:
表2
Figure BDA0001221588410000101
(2)末端加“A”反应:加入32μL上一步纯化回收的DNA后将1.5mL离心管置于Thermomixer中37℃温浴30分钟。使用1.8×核酸纯化磁珠回收纯化反应体系中的DNA,溶于18μL EB中。
1.5接头的连接(Adapter Ligation)
(1)预先从-20℃保存的试剂盒中取出所需试剂,单个样本配制量参见表3:
表3
Figure BDA0001221588410000102
(2)接头的连接反应:加入18μL上一步纯化回收的DNA后将样本管置于Thermomixer中20℃温浴15分钟。使用1.8×核酸纯化磁珠回收纯化反应体系中的DNA,溶于30μL的EB中。
1.6 PCR反应
(1)从-20℃保存的试剂盒中取出所需试剂,2mL的PCR管中配制PCR反应体系:
表4
Figure BDA0001221588410000111
(2)设定PCR程序,PCR反应的程序设定如下:
Figure BDA0001221588410000112
反应结束及时将样品取出放入4℃冰箱保存并按要求退出或关闭仪器。
(3)用0.9×核酸纯化磁珠回收纯化反应体系中的DNA,纯化后的文库溶于20μL的ddH2O中。对文库进行Qubit检测,将文库送检安捷伦2100。
1.7乳腺癌目标区域捕获芯片文库杂交
(1)本实验中,用于提供杂交捕获反应的离子环境的缓冲液、以及用于洗脱物理吸附或非特异性杂交的清洗液、漂洗液均可从商业途径获得。
(2)准备杂交文库:将待杂交的DNA文库在冰上融化,取总质量1μg(在后续操作步骤中将此DNA文库称为样本文库)。
(3)制备Ann引物Pool:将样本文库Index对应的标签引物In1(100μM)及公共引物(1000μM)各取1000pmol混合,(在后续操作步骤中将此混合物称为Ann引物pool)。
(4)杂交样本的制备:向1.5mL EP管中加入5μL COT DNA(Human Cot-1DNA,Lifetechnologies,1mg/mL)、1μg样本文库、Ann引物pool。用封口膜密封制备好的杂交样本EP管,将盛有样本文库pool/COT DNA/Ann引物pool的EP管置于真空装置中直到完全干燥。
(5)杂交样本的溶液:向样本文库pool/COT DNA/Ann引物pool的干粉中加入:
7.5μL 2×杂交缓冲液
3μL 杂交组分A
(6)充分混匀后将上述混合物置于预先准备好的95℃加热模块上变性10分钟。
(7)将上述混合物转移至含有4.5μL捕获芯片的0.2mL平盖PCR管中。充分涡旋震荡3秒,将杂交样品混合物置于47℃加热模块上16小时。加热模块的热盖温度需设定为57℃,杂交后产物需进行后续洗脱回收操作。
(8)将10×清洗液(Ⅰ,Ⅱ与Ⅲ)、10×漂洗液和2.5×磁珠清洗液配置成1×工作液。
表5
Figure BDA0001221588410000121
(9)将下列试剂在47℃加热模块中预热:
400μL 1×漂洗液
100μL 1×清洗液I
1.8制备亲和吸附磁珠
(1)将链霉亲和素磁珠(Dynabeads M-280Streptavidin,以下简称磁珠)在室温下平衡30分钟后,将磁珠充分涡旋混匀15秒。
(2)向1.5mL离心管中分装100μL磁珠,将盛有100μL磁珠的离心管置于磁力架上,约5分钟后小心吸弃上清,加两倍于磁珠初始体积的1×磁珠清洗液,涡旋混匀10秒。将盛有磁珠的离心管放回磁力架,吸附磁珠。待溶液澄清,吸弃上清。重复次步骤,共洗涤两次。
(3)洗涤完毕后吸弃磁珠清洗液,用磁珠初始体积的1×磁珠清洗液涡旋重悬磁珠转入0.2mL的PCR管中。将PCR管置于磁力架上吸附磁珠澄清后吸弃上清。
1.9 DNA与亲和吸附磁珠的结合及漂洗
(1)将杂交的样本文库转入盛有亲和吸附磁珠的0.2mL PCR管中,涡旋振荡混匀。
(2)将0.2mL PCR管置于47℃加热模块45分钟,每隔15分钟涡旋混匀一次,使DNA与磁珠结合。
(3)45分钟孵育后,向15μL捕获的DNA样本中加入47℃预热的1×清洗液I 100μL。涡旋混匀10秒。将0.2mL PCR管中的全部组分转入1.5mL离心管中。将1.5mL离心管置于磁力架上吸附磁珠,弃上清。
(4)将1.5mL离心管从磁力架上取下,加入200μL预热47℃的1×漂洗液。吸打混匀10次(需迅速操作,防止试剂、样品温度低于47℃)。混匀后样本置于47℃加热模块上5分钟。重复此步骤,用47℃的1×漂洗液共洗涤两次。将1.5mL的离心管置于磁力架上,吸附磁珠,弃上清。
(5)向上述1.5mL离心管中加入200μL室温的1×清洗液I,涡旋混匀2分钟。将离心管置于磁力架上,吸附磁珠,弃上清。向上述1.5mL离心管中加入200μL室温的1×清洗液Ⅱ,涡旋混匀1分钟。将离心管置于磁力架上,吸附磁珠,弃上清。向上述1.5mL离心管中加入200μL室温的1×清洗液Ⅲ,涡旋混匀30秒。将离心管置于磁力架上,吸附磁珠,弃上清。
(6)1.5mL离心管从磁力架上取下,加入45μL PCR水,溶解洗脱磁珠捕获样本。
1.10捕获DNA的PCR扩增
(1)按下表制备捕获后PCR mix,制备好后涡旋震荡混匀。富集引物F和富集引物R均购自英潍捷基公司。
Figure BDA0001221588410000141
(2)磁珠吸附DNA PCR的扩增程序设定如下:
Figure BDA0001221588410000142
(3)杂交捕获DNA PCR产物的回收纯化:用核酸纯化磁珠回收纯化反应体系中的DNA,磁珠使用量为0.9×,纯化后的文库溶于30μL的ddH2O中。
1.11文库定量
对文库进行2100 Bio Analyzer(Agilent)/LabChip GX(Caliper)及QPCR检测,记录文库浓度。
1.12文库上机测序
构建好的文库用NextSeq 550AR进行测序。
1.13数据处理及分析
采用本发明的FFPE样本拷贝数变异检测装置对1.12文库上机测序的结果进行处理分析。
实施例1的FFPE样本拷贝数变异检测装置包括下述模块。
测序数据获取模块:
用于获取使用乳腺癌目标区域捕获芯片对待检测的乳腺癌FFPE样本进行捕获测序获得测序数据。
数据质检模块:
对测序数据进行数据质检,过滤掉平均质量值低的短序列,过滤掉N含量高的短序列,过滤掉与Adapter相关的短序列,得到过滤的测序数据C。
序列比对模块:
使用经过过滤的测序数据C,与人参考基因组HG19进行短序列比对,获得比对结果A。根据该比对结果A计算基因组上的每个位点的深度值,得到结果D。
前期数据处理模块:
将癌症目标区域划分为一定长度且有重叠的窗口,去掉窗口内的深度极值并计算深度中值,且计算该窗口内的参考基因组序列的GC含量,得到结果X。
归一化模块:
结合结果X与D,依据公式Zi=trimScale(Zi,Zi)计算得到待检测基因组DNA每个窗口内的Z值。
背景库筛选模块:
定义
Figure BDA0001221588410000151
chr是染色体的意思,St表示待检测样本,Sn表示背景库样本。
根据待检基因组DNA与背景库的Z值,筛选出使得d值最小的背景库样本,得到筛选后的背景库样本集S1,S2,S3,…,Sn
使用这n个样本在m个窗口内的Z值构建矩阵Xm×n作为背景库待用。
数据波动消除模块:
对背景库矩阵Xm×n做奇异值分解,得到m行n列因子矩阵Um×n,n为因子个数。取贡献率最大的几个因子进行LOESS回归,得到残差Zp
GC校正模块:
根据m个窗口内的GC含量,对Zp基于LOESS回归做GC矫正,得到残差Zpg
输出模块:
输出模块用于展示CNV检测结果的图。
检测结果如图2所示,图中的每一个小圆点为一个窗口的Zpg值。其中,PIK3CA与ERBB2两个基因均检出拷贝数增加。
1.14结果验证
同一患者原肿瘤新鲜组织提取RNA后进行反转录,使用QPCR方法验证PIK3CA和ERBB2基因的表达量是否升高,验证结果与1.13检测结果一致。本发明的检测装置能够成功检出FFPE样本的拷贝数变异。
工业实用性
本发明的FFPE样本CNV检测装置及检测方法能够显著地提高CNV的检测灵敏度。

Claims (7)

1.一种用于FFPE样本拷贝数变异检测的装置,其包括:
测序数据获取模块,用于获取来自待检FFPE样本的捕获测序数据以及来自健康人群样本的测序数据,所述健康人群样本为多个健康人样本;
序列比对模块,其与所述测序数据获取模块连接,用于将所述测序数据获取模块获取的测序数据与参考基因组序列进行比对,得到比对结果,根据该比对结果计算每一个位点的深度值;
前期数据处理模块,其与所述序列比对模块连接,用于将目标区域划分为一定长度的有重叠的窗口,去掉窗口内位点的深度极值并计算深度均值或中值,且计算该窗口内的参考基因组序列的GC含量;
归一化模块,其与所述前期数据处理模块连接,用于对所述前期数据处理模块所得到的每一个窗口内的深度均值或中值进行归一化,计算得到待检FFPE样本和健康人群样本每个窗口内差异的Z值;
背景库筛选模块,其与所述归一化模块连接,用于根据待检FFPE样本与健康人群样本的Z值,筛选出n个健康人样本,每个背景库样本对应一个健康人,得到n个健康人样本的背景库样本集,然后使用该n个健康人样本在m个窗口内的Z值构建m行n列的矩阵Xm×n
数据波动消除模块,其与所述背景库筛选模块连接,用于消除捕获测序带来的固有数据波动;
GC校正模块,其与所述数据波动消除模块连接,用于根据各窗口内的GC含量进行GC矫正;
输出模块,其与所述GC校正模块连接,用于输出CNV检测结果,
其中,所述数据波动消除模块对背景库矩阵Xm×n做奇异值分解,得到m行r列因子矩阵Um×r,r为因子个数,然后取贡献率最大的k个因子进行LOESS回归,得到残差Zp
2.根据权利要求1所述的装置,其中,所述测序数据是采用捕获测序方法获得的测序数据。
3.根据权利要求1所述的装置,其中,所述前期数据处理模块采用滑动窗口法划分所述窗口。
4.根据权利要求1所述的装置,其中,所述归一化模块依据下述公式(1)计算得到待检生物样本每个窗口内的Z值,公式(1)中Zi表示第i个窗口的Z值,
Zi=trimScale(Zi,Zi) (1)。
5.根据权利要求1所述的装置,其中,定义公式(2):
定义
Figure FDA0003430058150000021
其中,chr表示染色体,ST表示待检样本,SN表示健康人群样本,
所述背景库筛选模块根据待检FFPE样本与健康人群样本差异的Z值,筛选出使得所述d值最小的n个健康人样本,得到筛选后的背景库样本集S1,S2,S3,…,Sn
6.根据权利要求1所述的装置,其中,所述GC校正模块根据各窗口内的GC含量,对Zp基于LOESS回归做GC矫正,得到残差Zpg
7.根据权利要求1所述的装置,还包括数据质检模块,其与所述测序模块和所述序列比对模块连接,用于对所述测序模块获得的测序数据进行质检。
CN201710067086.3A 2016-12-29 2017-02-07 一种用于ffpe样本拷贝数变异检测的装置 Active CN106845154B (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN201611247393 2016-12-29
CN2016112473931 2016-12-29

Publications (2)

Publication Number Publication Date
CN106845154A CN106845154A (zh) 2017-06-13
CN106845154B true CN106845154B (zh) 2022-04-08

Family

ID=59121511

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710067086.3A Active CN106845154B (zh) 2016-12-29 2017-02-07 一种用于ffpe样本拷贝数变异检测的装置

Country Status (1)

Country Link
CN (1) CN106845154B (zh)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108733979A (zh) * 2017-10-30 2018-11-02 成都凡迪医疗器械有限公司 Nipt的gc含量校准方法、装置及计算机可读存储介质
CN109979535B (zh) * 2017-12-28 2021-03-02 浙江安诺优达生物科技有限公司 一种胚胎植入前遗传学筛查装置
CN109979529B (zh) * 2017-12-28 2021-01-08 北京安诺优达医学检验实验室有限公司 Cnv检测装置
CN110797088B (zh) * 2019-10-17 2020-09-15 南京医基云医疗数据研究院有限公司 全基因组重测序分析及用于全基因组重测序分析的方法
CN111477275B (zh) * 2020-04-02 2020-12-25 上海之江生物科技股份有限公司 微生物目标片段中多拷贝区域的识别方法、装置及应用

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104133914A (zh) * 2014-08-12 2014-11-05 厦门万基生物科技有限公司 一种消除高通量测序引入的gc偏差及对染色体拷贝数变异的检测方法
CN104560697A (zh) * 2015-01-26 2015-04-29 上海美吉生物医药科技有限公司 一种基因组拷贝数不稳定性的检测装置
CN104662156A (zh) * 2012-08-17 2015-05-27 美国陶氏益农公司 玉米非翻译区域用于植物中转基因表达的用途
CN105483229A (zh) * 2015-12-21 2016-04-13 广东腾飞基因科技有限公司 一种检测胎儿染色体非整倍体的方法及***
CN105555968A (zh) * 2013-05-24 2016-05-04 塞昆纳姆股份有限公司 遗传变异的非侵入性评估方法和过程
CN105574361A (zh) * 2015-11-05 2016-05-11 上海序康医疗科技有限公司 一种检测基因组拷贝数变异的方法
CN105722994A (zh) * 2013-06-17 2016-06-29 维里纳塔健康公司 用于确定性染色体中的拷贝数变异的方法
CN105760712A (zh) * 2016-03-01 2016-07-13 西安电子科技大学 一种基于新一代测序的拷贝数变异检测方法
CN105814574A (zh) * 2013-10-04 2016-07-27 塞昆纳姆股份有限公司 遗传变异的非侵入性评估的方法和过程
CN106156543A (zh) * 2016-06-22 2016-11-23 厦门艾德生物医药科技股份有限公司 一种肿瘤ctDNA信息统计方法

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104662156A (zh) * 2012-08-17 2015-05-27 美国陶氏益农公司 玉米非翻译区域用于植物中转基因表达的用途
CN105555968A (zh) * 2013-05-24 2016-05-04 塞昆纳姆股份有限公司 遗传变异的非侵入性评估方法和过程
CN105722994A (zh) * 2013-06-17 2016-06-29 维里纳塔健康公司 用于确定性染色体中的拷贝数变异的方法
CN105814574A (zh) * 2013-10-04 2016-07-27 塞昆纳姆股份有限公司 遗传变异的非侵入性评估的方法和过程
CN104133914A (zh) * 2014-08-12 2014-11-05 厦门万基生物科技有限公司 一种消除高通量测序引入的gc偏差及对染色体拷贝数变异的检测方法
CN104560697A (zh) * 2015-01-26 2015-04-29 上海美吉生物医药科技有限公司 一种基因组拷贝数不稳定性的检测装置
CN105574361A (zh) * 2015-11-05 2016-05-11 上海序康医疗科技有限公司 一种检测基因组拷贝数变异的方法
CN105483229A (zh) * 2015-12-21 2016-04-13 广东腾飞基因科技有限公司 一种检测胎儿染色体非整倍体的方法及***
CN105760712A (zh) * 2016-03-01 2016-07-13 西安电子科技大学 一种基于新一代测序的拷贝数变异检测方法
CN106156543A (zh) * 2016-06-22 2016-11-23 厦门艾德生物医药科技股份有限公司 一种肿瘤ctDNA信息统计方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
"CODEX:a normalization and copy number variation detection method for whole exome sequencing";Yuchao Jiang等;《Nucleic Acids Research》;20150123;第43卷(第6期);第1-12页 *
"新一代测序的拷贝数变异检测算法研究与设计";李燕等;《生物信息学》;20150930;第13卷(第3期);第186-191页 *
"苏尼特羊拷贝数变异的基因组分布特征研究";刘佳森等;《中国畜牧兽医》;20131231;第40卷(第10期);第173-178页 *

Also Published As

Publication number Publication date
CN106845154A (zh) 2017-06-13

Similar Documents

Publication Publication Date Title
CN106650312B (zh) 一种用于循环肿瘤dna拷贝数变异检测的装置
CN106845154B (zh) 一种用于ffpe样本拷贝数变异检测的装置
CN107475375B (zh) 一种用于与微卫星不稳定性相关微卫星位点进行杂交的dna探针库、检测方法和试剂盒
CN106845150B (zh) 一种用于检测循环肿瘤dna样本基因融合的装置
CN114736968A (zh) 血浆游离dna甲基化标志物在肺癌早筛中的用途以及肺癌早筛装置
CN108595918B (zh) 循环肿瘤dna重复序列的处理方法及装置
CN114317762B (zh) 用于检测早期肝癌的三标记物组合物及其试剂盒
CN114164276B (zh) 用于肺癌诊断的试剂盒、装置及方法
CN106815491B (zh) 一种用于检测ffpe样本基因融合的装置
CN106282361B (zh) 用于捕获血液病相关基因的基因捕获试剂盒
CN109971857A (zh) 乳腺癌诊治用生物标志物
CN115011695A (zh) 基于游离环状dna基因的多癌种识别标志物、试剂盒及应用
CN109811052A (zh) 一种检测特发性无精症的试剂盒及基因panel
CN116656830B (zh) 用于胃癌辅助诊断的甲基化标志物、装置、设备和存储介质
CN118207322A (zh) 胆汁cfDNA中的HDR信号通路突变在胆管癌预后评估中的应用
CN116779025A (zh) 用于癌症筛查的***
CN117070627A (zh) 一种检测肺腺癌肿瘤突变负荷的基因组合物及其应用
CN117059163A (zh) 筛选大片段甲基化标志物的***及其方法
CN114807310A (zh) 一种基于多重pcr靶向高通量测序检测肺癌多基因突变的引物对、试剂盒及方法
CN112251506A (zh) 一种基于Taqman探针法的UIMC1基因突变位点检测试剂盒及其用途
CN117165679A (zh) 肝癌肝移植术后复发标志物及其应用
CN117165678A (zh) 肝癌肝移植术后复发标志物及其应用
CN114250297A (zh) 基因突变在结肠癌、肺癌易感基因变异检测中的应用
WO2018148903A1 (zh) 泌尿***肿瘤的辅助诊断方法
CN115807069A (zh) 一种用于胶质瘤诊断的捕获探针试剂盒及其应用

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
TA01 Transfer of patent application right
TA01 Transfer of patent application right

Effective date of registration: 20171215

Address after: 100176 Beijing branch of Beijing economic and Technological Development Zone Street 88 Hospital No. 8 Building 2 unit 701 room

Applicant after: ANNOROAD GENE TECHNOLOGY (BEIJING) Co.,Ltd.

Applicant after: ZHEJIANG ANNOROAD BIO-TECHNOLOGY Co.,Ltd.

Applicant after: ANNOROAD (YIWU) MEDICAL INSPECTION CO.,LTD.

Address before: 100176 Beijing branch of Daxing District economic and Technological Development Zone Street 88 Hospital No. 8 Building 2 unit 701 room

Applicant before: ANNOROAD GENE TECHNOLOGY (BEIJING) Co.,Ltd.

SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
CB02 Change of applicant information
CB02 Change of applicant information

Address after: 322000 1 building, No. 2 building, No. 10 standard building, Gaoxin Road, Chou Jiang Street, Yiwu, Zhejiang.

Applicant after: ZHEJIANG ANNOROAD BIO-TECHNOLOGY Co.,Ltd.

Applicant after: ANNOROAD GENE TECHNOLOGY (BEIJING) Co.,Ltd.

Applicant after: ANNOROAD (YIWU) MEDICAL INSPECTION CO.,LTD.

Address before: 100176 room 701, unit 2, building 8, courtyard 88, Kechuang 6th Street, Beijing Economic and Technological Development Zone, Beijing

Applicant before: ANNOROAD GENE TECHNOLOGY (BEIJING) Co.,Ltd.

Applicant before: ZHEJIANG ANNOROAD BIO-TECHNOLOGY Co.,Ltd.

Applicant before: ANNOROAD (YIWU) MEDICAL INSPECTION CO.,LTD.

GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right

Effective date of registration: 20240618

Address after: Room 101 and Room 201, unit 2, building 8, yard 88, Kechuang 6th Street, Daxing District, Beijing 100176

Patentee after: BEIJING ANNOROAD MEDICAL LABORATORY Co.,Ltd.

Country or region after: China

Patentee after: ANNOROAD GENE TECHNOLOGY (BEIJING) Co.,Ltd.

Address before: 322000 1 building, No. 2 building, No. 10 standard building, Gaoxin Road, Chou Jiang Street, Yiwu, Zhejiang.

Patentee before: ZHEJIANG ANNOROAD BIO-TECHNOLOGY Co.,Ltd.

Country or region before: China

Patentee before: ANNOROAD GENE TECHNOLOGY (BEIJING) Co.,Ltd.

Patentee before: ANNOROAD (YIWU) MEDICAL INSPECTION CO.,LTD.