CN108733982B - 孕妇nipt结果校正方法、装置及计算机可读存储介质、设备 - Google Patents

孕妇nipt结果校正方法、装置及计算机可读存储介质、设备 Download PDF

Info

Publication number
CN108733982B
CN108733982B CN201710883645.8A CN201710883645A CN108733982B CN 108733982 B CN108733982 B CN 108733982B CN 201710883645 A CN201710883645 A CN 201710883645A CN 108733982 B CN108733982 B CN 108733982B
Authority
CN
China
Prior art keywords
cnv
pregnant woman
interval
result
sequencing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201710883645.8A
Other languages
English (en)
Other versions
CN108733982A (zh
Inventor
钱雨飞
岑忠
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Find Genetech Co ltd
Original Assignee
Shanghai Find Genetech Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Find Genetech Co ltd filed Critical Shanghai Find Genetech Co ltd
Priority to CN201710883645.8A priority Critical patent/CN108733982B/zh
Publication of CN108733982A publication Critical patent/CN108733982A/zh
Application granted granted Critical
Publication of CN108733982B publication Critical patent/CN108733982B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

一种孕妇NIPT结果校正方法、装置及计算机可读存储介质、设备,所述校正方法包括:获取原始孕妇CNV结果,并判断在预设的染色体上是否存在CNV;当在所述预设的染色体上存在CNV时,计算孕妇CNV区间内的测序序列数目;根据正常孕妇在所述孕妇CNV区间内的参考测序序列数目,对所述孕妇CNV区间的测序序列数目进行校正,使得校正后的孕妇CNV区间的测序序列数目与所述参考测序序列数目的差值处于预设范围之内;根据所述校正后的孕妇CNV区间测序序列数目,计算得到更新后的孕妇NIPT Z值结果以及更新后的孕妇CNV结果;当所述更新后的孕妇CNV结果在所述预设的染色体上不存在CNV时,输出所述更新后的孕妇NIPT Z值结果。上述方案能够提高NIPT结果的准确率。

Description

孕妇NIPT结果校正方法、装置及计算机可读存储介质、设备
技术领域
本发明实施例涉及生物检测领域,尤其涉及一种孕妇NIPT结果校正方法、装置及计算机可读存储介质、设备。
背景技术
无创产前基因检测(Non Invasive Prenatal Testing,NIPT)技术,仅需采集孕妇静脉血,利用新一代DNA测序技术对孕妇外周血浆中的游离DNA片段进行测序,并将测序结果进行生物信息分析,即可从中得到胎儿的遗传信息,从而检测胎儿是否患有染色体疾病。
然而,已有相关研究表明,NIPT技术仍有0.09%的假阳性率,即在很小的几率下有假阳、假阴结果存在。
发明内容
本发明实施例解决的是如何提高NPIT结果的准确率。
为解决上述技术问题,本发明实施例提供一种孕妇NIPT结果校正方法,包括:获取原始孕妇CNV结果,并判断在预设的染色体上是否存在CNV;当在所述预设的染色体上存在CNV时,计算孕妇CNV区间内的测序序列数目;根据正常孕妇在所述孕妇CNV区间内的参考测序序列数目,对所述孕妇CNV区间的测序序列数目进行校正,使得校正后的孕妇CNV区间的测序序列数目与所述参考测序序列数目的差值处于预设范围之内;根据所述校正后的孕妇CNV区间测序序列数目,计算得到更新后的孕妇NIPT Z值结果以及更新后的孕妇CNV结果;当所述更新后的孕妇CNV结果在所述预设的染色体上不存在CNV时,输出所述更新后的孕妇NIPT Z值结果。
可选的,所述根据正常孕妇在所述孕妇CNV区间内的参考测序序列数目,对所述孕妇CNV区间的测序序列数目进行校正,包括:将所述原始孕妇CNV结果中的CNV区间划分成多个子区间;计算每一个子区间的GC含量,并从所有子区间中提取出GC含量位于预设GC含量区间内的子区间;根据所述参考测序序列数目以及所述孕妇CNV区间的测序序列数目,计算CNV校正系数;采用所述CNV校正系数,对所述孕妇CNV区间的测序序列数目进行校正。
可选的,采用如下公式计算所述参考测序序列数目:
Figure BDA0001419693710000021
其中,i∈[1,n'],n'<n,m'<m,m为正常孕妇参考库中的孕妇样本数目,n为人类参考基因组屏蔽重复区域与N区域按预设区间长度不重叠分隔得到的区间个数,n'为孕妇CNV结果中的CNV区间的子区间个数,
Figure BDA0001419693710000022
为第i个区间的参考测序序列数目,m'为GC含量位于预设GC含量区间内的所有子区间的个数,S为孕妇对应的所有染色体上的测序序列总数据量,K为常数,Rij为所述正常孕妇参照库中第j个样本的第i区间的归一化测序序列数目。
可选的,采用如下公式所述计算CNV校正系数:
Figure BDA0001419693710000023
其中,ri为第i个子区间对应的CNV校正系数,Si为所述孕妇CNV区间的第i个子区间的测序序列数目。
可选的,所述根据所述CNV校正系数,对所述孕妇CNV区间的测序序列数目进行校正,包括:将所述校正系数r向上取整,得到r’;将所述孕妇CNV区间的测序序列数目与r’相乘;将所述校正系数与随机数k进行比较,所述随机数k的取值范围为:0<k<r’;当所述校正系数r大于所述随机数k时,随机去除与r’相乘后所述孕妇CNV区间的测序序列数据,以减少所述孕妇CNV区间的测序序列数目。
可选的,采用如下公式计算Rij
Figure BDA0001419693710000024
其中,Sij为正常孕妇参考库中第j个孕妇数据在第i个区间上的测序序列数目,Sj为第j个孕妇对应的所有染色体上的测序序列总数据量,K为常数。
可选的,所述预设的染色体包括以下至少一种:第13号染色体、第18号染色体以及第21号染色体。
本发明实施例还提供了一种孕妇NIPT结果校正装置,包括:获取单元,用于获取原始孕妇CNV结果;判断单元,用于判断所述原始CNV结果在预设的染色体上是否存在CNV;第一计算单元,用于当在所述预设的染色体上存在CNV时,计算孕妇CNV区间内的测序序列数目;校正单元,用于根据正常孕妇在所述孕妇CNV区间内的参考测序序列数目,对所述孕妇CNV区间的测序序列数目进行校正,使得校正后的孕妇CNV区间的测序序列数目与所述参考测序序列数目的差值处于预设范围之内;第二计算单元,用于根据所述校正后的孕妇CNV区间测序序列数目,计算得到更新后的孕妇NIPT Z值结果以及更新后的孕妇CNV结果;第二计算单元,用于根据所述校正后的孕妇CNV区间测序序列数目,计算得到更新后的孕妇NIPT Z值结果以及更新后的孕妇CNV结果;
可选的,所述校正单元,用于将所述原始孕妇CNV结果中的CNV区间划分成多个子区间;计算每一个子区间的GC含量,并从所有子区间中提取出GC含量位于预设GC含量区间内的所有子区间;根据所述参考测序序列数目以及所述孕妇CNV区间的测序序列数目,计算CNV校正系数;采用所述CNV校正系数,对所述孕妇CNV区间的测序序列数目进行校正。
可选的,采用如下公式计算所述参考测序序列数目:
Figure BDA0001419693710000031
其中,i∈[1,n'],n'<n,m'<m,m为正常孕妇参考库中的孕妇样本数目,n为人类参考基因组屏蔽重复区域与N区域按预设区间长度不重叠分隔得到的区间个数,n'为孕妇CNV结果中的CNV区间的子区间个数,
Figure BDA0001419693710000032
为第i个区间的参考测序序列数目,m'为GC含量位于预设GC含量区间内的所有子区间的个数,S为孕妇对应的所有染色体上的测序序列总数据量,K为常数,Rij为所述正常孕妇参照库中第j个样本的第i区间的归一化测序序列数目。
可选的,采用如下公式所述计算CNV校正系数:
Figure BDA0001419693710000033
其中,ri为所述CNV校正系数,Si为所述孕妇CNV区间的第i个子区间的测序序列数目。
可选的,所述校正单元,用于将所述校正系数r向上取整,得到r’;将所述孕妇CNV区间的测序序列数目与r’相乘;将所述校正系数与随机数k进行比较,所述随机数k的取值范围为:0<k<r’;当所述校正系数r大于所述随机数k时,随机去除与r’相乘后所述孕妇CNV区间的测序序列数据,以减少所述孕妇CNV区间的测序序列数目。
可选的,采用如下公式计算Rij
Figure BDA0001419693710000041
其中,Sij为正常孕妇参考库中第j个孕妇数据在第i个区间上的测序序列数目,Sj为第j个孕妇对应的所有染色体上的测序序列总数据量,K为常数。
可选的,所述预设的染色体包括以下至少一种:第13号染色体、第18号染色体以及第21号染色体。
本发明实施例还提供了一种计算机可读存储介质,其上存储有计算机指令,所述计算机指令运行时执行上述任一种所述的孕妇NIPT结果校正方法的步骤。
本发明实施例还提供了一种数据处理设备,包括存储器和处理器,所述存储器上存储有计算机指令,所述计算机指令运行时执行上述任一种所述的孕妇NIPT结果校正方法的步骤。
与现有技术相比,本发明实施例的技术方案具有以下有益效果:
当原始孕妇CNV结果在预设染色体上存在CNV时,采用正常孕妇参考库CNV区间的参考测序序列数目,对孕妇CNV区间内的测序序列数目进行校正,并根据校正后的孕妇CNV区间测序序列数目计算得到更新后的孕妇NIPT Z值结果以及更新后的孕妇CNV结果。当更新后的孕妇CNV结果在预设的染色体上不存在CNV时,输出更新后的孕妇NIPT Z值结果,作为校正后的孕妇NIPT结果。由于对原始孕妇CNV结果进行校正,将在预设染色体上存在CNV的原始孕妇CNV结果校正为在预设染色体上不存在CNV,并重新计算NIPT Z值结果,从而避免因原始孕妇CNV结果阳性对NIPT Z值结果造成假阳性影响,因此可以提高NPIT的准确率。
附图说明
图1是本发明实施例中的一种孕妇NIPT结果校正方法的流程图;
图2是本发明实施例中的一种孕妇NIPT结果校正装置的结构示意图。
具体实施方式
如前所述,已有相关研究表明,NIPT技术仍有0.09%的假阳性率,即在很小的几率下有假阳、假阴结果存在,导致上述情况出现的原因包括胎盘嵌合、母体拷贝数变异(CopyNumber Variation,CNV)、胎儿浓度以及其他生物学原因。
在本发明实施例中,由于对原始孕妇CNV结果进行校正,将在预设染色体上存在CNV的原始孕妇CNV结果校正为在预设染色体上不存在CNV,并重新计算NIPT Z值结果,从而避免因原始孕妇CNV结果阳性对NIPT Z值结果造成假阳性影响,因此可以提高NPIT的准确率。
为使本发明实施例的上述目的、特征和有益效果能够更为明显易懂,下面结合附图对本发明的具体实施例做详细的说明。
本发明实施例提供了一种孕妇NIPT结果校正方法,参照图1,以下通过具体步骤进行详细说明。
步骤S101,获取原始孕妇CNV结果。
在具体实施中,可以根据现有的计算方法,来计算得到孕妇对应的原始孕妇CNV结果,本发明实施例不再对现有的CNV计算方法进行详细描述。
步骤S102,判断在预设的染色体上是否存在CNV。
在具体实施中,在获取到原始孕妇CNV结果之后,可以判断原始孕妇CNV结果在预设的染色体上是否存在CNV。当在预设的染色体上存在CNV时,执行步骤S103;当在预设的染色体上不存在CNV时,执行步骤S107。
在具体实施中,预设的染色体可以包括第13号染色体、第18号染色体以及第21号染色体中的任一种或多种。在本发明实施例中,预设的染色体可以同时包括第13号染色体、第18号染色体以及第21号染色体,也即在本发明实施例中,分别在第13号染色体、第18号染色体以及第21号染色体上,判断原始孕妇CNV结果是否存在CNV。
步骤S103,计算孕妇CNV区间内的测序序列数目。
在具体实施中,当原始孕妇CNV结果在预设的染色体上存在CNV时,可以计算得到孕妇CNV区间内的测序序列(read)数目。
步骤S104,对所述孕妇CNV区间的测序序列数目进行校正。
在具体实施中,可以根据正常孕妇在孕妇CNV区间内的参考测序序列数目,对孕妇CNV区间的测序序列数目进行校正,校正后的孕妇CNV区间的测序序列数目与参考测序序列数目的差值处于预设范围之内。
在具体应用中,可以预先计算得到正常孕妇在孕妇CNV区间内的参考测序序列数目。参考测序序列数目可以理解为:在孕妇CNV区间内,正常孕妇所对应的测序序列数目,也即正常情况下在孕妇CNV区间内应有的测序序列数目。
下面对参考测序序列数目的计算过程进行举例说明。
首先,挑选正常孕妇样本数据。
从预先建立的正常孕妇数据库中,选取GC含量在[37.98%,43.28%]的样本,同时满足在每个GC区间端样本分布均匀。选取的样本数据量在6M以上,选取的样本比对率M0比对率满足80%以上,且正常孕妇数据库中的样本数在1000以上。GC含量中的G表示为鸟嘌呤(Guanine),C表示为胞嘧啶(Cytosine)。
之后,正常孕妇数据库进行预处理。
对挑选出的正常孕妇样本数据的人类参考基因组屏蔽重复区域与N区域按区间长度100K不重叠分隔,得到n个区间,标号依次为{1,2,3,……,n}。计算每一个区间归一化后的测序序列数目。假设挑选出的正常孕妇样本数据的个数为m个,则第j个孕妇样本数据满足:
Figure BDA0001419693710000061
其中,i表示第i个区间,j表示第j个孕妇样本数据,Sij为第j个孕妇样本数据在第i个区间上的测序序列数目,Sj为第j个孕妇对应的所有染色体上的测序序列总数据量,Rij为正常孕妇参照库中第j个样本的第i区间的归一化测序序列数目。
将原始孕妇CNV结果中的CNV区间进行划分,将其划分为多个长度相同的子区间。在对原始孕妇CNV结果中的CNV区间进行划分时,可以先将CNV区间的位置与正常孕妇参考库中的区间位置进行对应,使得所划分的每一个子区间位置在正常孕妇参考库中所划分的子区间对应。
在实际应用中,在对原始孕妇CNV结果中的CNV区间进行划分时,可以按照正常孕妇参考库中的区间划分长度进行设定。例如,正常孕妇参考库中,以100K为单位长度对测序序列进行划分,则将原始孕妇CNV结果中的CNV区间拆分成n’个长度为100K的CNV子区间。
在对原始孕妇CNV结果中的CNV区间进行划分之后,可以分别计算每一个子区间的GC含量。
在具体实施中,可以从所拆分出的n’个子区间中,选取出GC含量在预设GC含量区间内的m’个子区间。预设GC含量区间可以根据实际的应用场景进行设定。在本发明实施例中,预设GC含量区间的取值可以为[GC+1%,GC-1%],GC的取值范围为[37.98%,43.28%]。
在取出m’个子区间之后,采用如下公式(2),计算正常孕妇参考库CNV区间的参考测序序列数目:
Figure BDA0001419693710000071
其中,i∈[1,n'],n'<n,m'<m,m为正常孕妇参考库中的孕妇样本数目,n为人类参考基因组屏蔽重复区域与N区域按预设区间长度不重叠分隔得到的区间个数,n'为孕妇CNV结果中的CNV区间的子区间个数,
Figure BDA0001419693710000072
为第i个区间的参考测序序列数目,m'为GC含量位于预设GC含量区间内的所有子区间的个数,S为孕妇对应的所有染色体上的测序序列总数据量,K为常数,Rij为所述正常孕妇参照库中第j个样本的第i区间的归一化测序序列数目。
根据计算得到的参考测序序列数目以及孕妇CNV区间的测序序列数目,可以计算得到CNV校正系数。在本发明实施例中,可以采用下式(3)计算得到CNV校正系数:
Figure BDA0001419693710000073
其中,ri为第i个区间的CNV校正系数,Si为所述孕妇CNV区间的第i个子区间的测序序列数目。
在得到CNV校正系数之后,即可对孕妇CNV区间的测序序列数目进行校正。
在具体实施中,在对孕妇CNV区间的测序序列数目进行校正时,可以先对校正系数r进行向上取整运算,得到r’。之后,将孕妇CNV区间的测序序列数目与r’相乘。将校正系数r与随机数k进行比较,当校正系数r大于随机数k时,随机去除与r’相乘后的孕妇CNV区间的测序序列数据,以较少孕妇CNV区间的测序序列数目,随机数k的取值范围为:0<k<r’。当校正系数r小于或等于随机数k时,则无需对孕妇CNV区间的测序序列数据进行处理。
在对孕妇CNV区间的测序序列数目进行校正后,校正后的孕妇CNV区间的测序序列数目与参考测序序列数目的差值处于预设范围之内。在实际应用中,可以对预设范围进行设定,使得在参考测序序列数目的基础上,在预设范围内,测序序列数目仍处于正常孕妇对应的区域。换而言之,校正后的孕妇CNV区间的测序序列数目仍处于正常孕妇对应的范围之内,也即将孕妇CNV区间的测序序列数目校正至正常范围之内。
可以理解的是,在本发明其他实施例中,也可以采用其他的方法来对孕妇CNV区间的测序序列数目进行校正,以使得校正后的孕妇CNV区间的测序序列数目与参考测序序列数目的差值处于预设范围之内,也即校正后的孕妇CNV区间的测序序列数目处于正常范围值之内。对孕妇CNV区间的测序序列数目进行校正的方法并不仅限于本发明上述实施例中提供的方法。
步骤S105,根据所述校正后的孕妇CNV区间测序序列数目,计算得到更新后的孕妇NIPT Z值结果以及更新后的孕妇CNV结果。
在具体实施中,在得到校正后的孕妇CNV区间测序序列数目后,可以重新计算孕妇NIPT Z值结果以及孕妇CNV结果,得到更新后的孕妇NIPT Z值结果以及更新后的孕妇CNV结果。
步骤S106,当所述更新后的孕妇CNV结果在所述预设的染色体上不存在CNV时,输出所述更新后的孕妇NIPT Z值结果。
在具体实施中,在计算得到更新后的孕妇CNV结果之后,可以先判断更新后的孕妇CNV结果在预设的染色体上是否仍存在CNV。当更新后的孕妇CNV结果在预设的染色体上存在CNV时,则可以重新执行步骤S103;当更新后的孕妇CNV结果在预设的染色体上不存在CNV时,则可以输出更新后的孕妇NIPT Z值结果。
在具体实施中,当更新后的孕妇CNV结果在预设的染色体上不存在CNV时,则可以判定更新后的NIPT Z值结果不会受到CNV阳性的干扰,因此,更新后的NIPT Z值结果的精确度更高。
步骤S107,输出原始孕妇NIPT Z值结果。
在具体实施中,当原始孕妇CNV结果在预设的染色体上没有存在CNV时,则可以判定原始孕妇CNV结果为阴性,因此,无需考虑原始孕妇CNV结果阳性所导致的NIPT Z值结果假阳性的情况,故可以直接输出原始孕妇NIPT Z值结果,无需执行步骤S103~步骤S106。
由此可见,由于对原始孕妇CNV结果进行校正,将在预设染色体上存在CNV的原始孕妇CNV结果校正为在预设染色体上不存在CNV,并重新计算NIPT Z值结果,从而避免因原始孕妇CNV结果阳性对NIPT Z值结果造成假阳性影响,因此可以提高NPIT的准确率。
参照图2,本发明实施例提供了一种孕妇NIPT结果校正装置20,包括:获取单元201、判断单元202、第一计算单元203、校正单元204、第二计算单元205以及输出单元206,其中:
所述获取单元201,用于获取原始孕妇CNV结果;
所述判断单元202,用于判断所述原始CNV结果在预设的染色体上是否存在CNV;
所述第一计算单元203,用于当在所述预设的染色体上存在CNV时,计算孕妇CNV区间内的测序序列数目;
所述校正单元204,用于根据正常孕妇在所述孕妇CNV区间内的参考测序序列数目,对所述孕妇CNV区间的测序序列数目进行校正,使得校正后的孕妇CNV区间的测序序列数目与所述参考测序序列数目的差值处于预设范围之内;
所述第二计算单元205,用于根据所述校正后的孕妇CNV区间测序序列数目,计算得到更新后的孕妇NIPT Z值结果以及更新后的孕妇CNV结果;
所述输出单元206,用于当所述更新后的孕妇CNV结果在所述预设的染色体上不存在CNV时,输出所述更新后的孕妇NIPT Z值结果。
在具体实施中,所述校正单元204,可以用于将所述原始孕妇CNV结果中的CNV区间划分成多个子区间;计算每一个子区间的GC含量,并从所有子区间中提取出GC含量位于预设GC含量区间内的所有子区间;根据所述参考测序序列数目以及所述孕妇CNV区间的测序序列数目,计算CNV校正系数;采用所述CNV校正系数,对所述孕妇CNV区间的测序序列数目进行校正。
在具体实施中,可以采用如下公式计算所述参考测序序列数目:
Figure BDA0001419693710000101
其中,i∈[1,n'],n'<n,m'<m,m为正常孕妇参考库中的孕妇样本数目,n为人类参考基因组屏蔽重复区域与N区域按预设区间长度不重叠分隔得到的区间个数,n'为孕妇CNV结果中的CNV区间的子区间个数,
Figure BDA0001419693710000102
为第i个区间的参考测序序列数目,m'为GC含量位于预设GC含量区间内的所有子区间的个数,S为孕妇对应的所有染色体上的测序序列总数据量,K为常数,Rij为所述正常孕妇参照库中第j个样本的第i区间的归一化测序序列数目。
在具体实施中,可以采用如下公式所述计算CNV校正系数:
Figure BDA0001419693710000103
其中,ri为所述CNV校正系数,Si为所述孕妇CNV区间的第i个子区间的测序序列数目。
在具体实施中,所述校正单元204,用于将所述校正系数r向上取整,得到r’;将所述孕妇CNV区间的测序序列数目与r’相乘;将所述校正系数与随机数k进行比较,所述随机数k的取值范围为:0<k<r’;当所述校正系数r大于所述随机数k时,随机去除与r’相乘后所述孕妇CNV区间的测序序列数据,以减少所述孕妇CNV区间的测序序列数目。
在具体实施中,可以采用如下公式计算Rij
Figure BDA0001419693710000111
其中,Sij为正常孕妇参考库中第j个孕妇数据在第i个区间上的测序序列数目,Sj为第j个孕妇对应的所有染色体上的测序序列总数据量,K为常数。
在具体实施中,所述预设的染色体可以包括:第13号染色体、第18号染色体以及第21号染色体。
本发明实施例还提供了一种计算机可读存储介质,其上存储有计算机指令,所述计算机指令运行时执行本发明上述任一实施例中提供的孕妇NIPT结果校正方法的步骤。
本发明实施例还提供了一种数据处理设备,包括存储器和处理器,所述存储器上存储有计算机指令,所述计算机指令运行时执行本发明上述任一实施例中提供的孕妇NIPT结果校正方法的步骤。
本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指示相关的硬件来完成,该程序可以存储于一计算机可读存储介质中,存储介质可以包括:ROM、RAM、磁盘或光盘等。
虽然本发明披露如上,但本发明并非限定于此。任何本领域技术人员,在不脱离本发明的精神和范围内,均可作各种更动与修改,因此本发明的保护范围应当以权利要求所限定的范围为准。

Claims (12)

1.一种孕妇NIPT结果校正方法,其特征在于,包括:
获取原始孕妇CNV结果,并判断在预设的染色体上是否存在CNV;
当在所述预设的染色体上存在CNV时,计算孕妇CNV区间内的测序序列数目;
根据正常孕妇在所述孕妇CNV区间内的参考测序序列数目,对所述孕妇CNV区间的测序序列数目进行校正,使得校正后的孕妇CNV区间的测序序列数目与所述参考测序序列数目的差值处于预设范围之内;所述对所述孕妇CNV区间的测序序列数目进行校正,包括:将所述原始孕妇CNV结果中的CNV区间划分成多个子区间;计算每一个子区间的GC含量,并从所有子区间中提取出GC含量位于预设GC含量区间内的子区间;根据所述参考测序序列数目以及所述孕妇CNV区间的测序序列数目,计算CNV校正系数;采用所述CNV校正系数,对所述孕妇CNV区间的测序序列数目进行校正;采用如下公式计算所述参考测序序列数目:
Figure FDA0002830471490000011
其中,i∈[1,n'],n'<n,m'<m,m为正常孕妇参考库中的孕妇样本数目,n为人类参考基因组屏蔽重复区域与N区域按预设区间长度不重叠分隔得到的区间个数,n'为孕妇CNV结果中的CNV区间的子区间个数,
Figure FDA0002830471490000012
为第i个区间的参考测序序列数目,m'为GC含量位于预设GC含量区间内的所有子区间的个数,S为孕妇对应的所有染色体上的测序序列总数据量,K为常数,Rij为所述正常孕妇参考库中第j个样本的第i区间的归一化测序序列数目;
根据所述校正后的孕妇CNV区间测序序列数目,计算得到更新后的孕妇NIPT Z值结果以及更新后的孕妇CNV结果;
当所述更新后的孕妇CNV结果在所述预设的染色体上不存在CNV时,输出所述更新后的孕妇NIPT Z值结果。
2.如权利要求1所述的孕妇NIPT结果校正方法,其特征在于,采用如下公式所述计算CNV校正系数:
Figure FDA0002830471490000013
其中,ri为第i个子区间对应的CNV校正系数,Si为所述孕妇CNV区间的第i个子区间的测序序列数目。
3.如权利要求2所述的孕妇NIPT结果校正方法,其特征在于,所述采用所述CNV校正系数,对所述孕妇CNV区间的测序序列数目进行校正,包括:
将所述校正系数r向上取整,得到r’;
将所述孕妇CNV区间的测序序列数目与r’相乘;
将所述校正系数与随机数k进行比较,所述随机数k的取值范围为:0<k<r’;
当所述校正系数r大于所述随机数k时,随机去除与r’相乘后所述孕妇CNV区间的测序序列数据,以减少所述孕妇CNV区间的测序序列数目。
4.如权利要求1所述的孕妇NIPT结果校正方法,其特征在于,采用如下公式计算Rij
Figure FDA0002830471490000021
其中,Sij为正常孕妇参考库中第j个孕妇数据在第i个区间上的测序序列数目,Sj为第j个孕妇对应的所有染色体上的测序序列总数据量,K为常数。
5.如权利要求1~4任一项所述的孕妇NIPT结果校正方法,其特征在于,所述预设的染色体包括以下至少一种:第13号染色体、第18号染色体以及第21号染色体。
6.一种孕妇NIPT结果校正装置,其特征在于,包括:
获取单元,用于获取原始孕妇CNV结果;
判断单元,用于判断在预设的染色体上是否存在CNV;
第一计算单元,用于当在所述预设的染色体上存在CNV时,计算孕妇CNV区间内的测序序列数目;
校正单元,用于根据正常孕妇在所述孕妇CNV区间内的参考测序序列数目,对所述孕妇CNV区间的测序序列数目进行校正,使得校正后的孕妇CNV区间的测序序列数目与所述参考测序序列数目的差值处于预设范围之内;所述对所述孕妇CNV区间的测序序列数目进行校正,包括:将所述原始孕妇CNV结果中的CNV区间划分成多个子区间;计算每一个子区间的GC含量,并从所有子区间中提取出GC含量位于预设GC含量区间内的子区间;根据所述参考测序序列数目以及所述孕妇CNV区间的测序序列数目,计算CNV校正系数;采用所述CNV校正系数,对所述孕妇CNV区间的测序序列数目进行校正;采用如下公式计算所述参考测序序列数目:
Figure FDA0002830471490000031
其中,i∈[1,n'],n'<n,m'<m,m为正常孕妇参考库中的孕妇样本数目,n为人类参考基因组屏蔽重复区域与N区域按预设区间长度不重叠分隔得到的区间个数,n'为孕妇CNV结果中的CNV区间的子区间个数,
Figure FDA0002830471490000032
为第i个区间的参考测序序列数目,m'为GC含量位于预设GC含量区间内的所有子区间的个数,S为孕妇对应的所有染色体上的测序序列总数据量,K为常数,Rij为所述正常孕妇参考库中第j个样本的第i区间的归一化测序序列数目;
第二计算单元,用于根据所述校正后的孕妇CNV区间测序序列数目,计算得到更新后的孕妇NIPT Z值结果以及更新后的孕妇CNV结果;
输出单元,用于当所述更新后的孕妇CNV结果在所述预设的染色体上不存在CNV时,输出所述更新后的孕妇NIPT Z值结果。
7.如权利要求6所述的孕妇NIPT结果校正装置,其特征在于,采用如下公式所述计算CNV校正系数:
Figure FDA0002830471490000033
其中,ri为所述CNV校正系数,Si为所述孕妇CNV区间的第i个子区间的测序序列数目。
8.如权利要求7所述的孕妇NIPT结果校正装置,其特征在于,所述校正单元,用于将所述校正系数r向上取整,得到r’;将所述孕妇CNV区间的测序序列数目与r’相乘;将所述校正系数与随机数k进行比较,所述随机数k的取值范围为:0<k<r’;当所述校正系数r大于所述随机数k时,随机去除与r’相乘后所述孕妇CNV区间的测序序列数据,以减少所述孕妇CNV区间的测序序列数目。
9.如权利要求6所述的孕妇NIPT结果校正装置,其特征在于,采用如下公式计算Rij
Figure FDA0002830471490000034
其中,Sij为正常孕妇参考库中第j个孕妇数据在第i个区间上的测序序列数目,Sj为第j个孕妇对应的所有染色体上的测序序列总数据量,K为常数。
10.如权利要求6~9任一项所述的孕妇NIPT结果校正装置,其特征在于,所述预设的染色体包括以下至少一种:第13号染色体、第18号染色体以及第21号染色体。
11.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器运行时执行权利要求1~5任一项所述的孕妇NIPT结果校正方法的步骤。
12.一种数据处理设备,包括存储器和处理器,所述存储器上存储有计算机程序,其特征在于,所述计算机程序被所述处理器运行时执行权利要求1~5任一项所述的孕妇NIPT结果校正方法的步骤。
CN201710883645.8A 2017-09-26 2017-09-26 孕妇nipt结果校正方法、装置及计算机可读存储介质、设备 Active CN108733982B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710883645.8A CN108733982B (zh) 2017-09-26 2017-09-26 孕妇nipt结果校正方法、装置及计算机可读存储介质、设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710883645.8A CN108733982B (zh) 2017-09-26 2017-09-26 孕妇nipt结果校正方法、装置及计算机可读存储介质、设备

Publications (2)

Publication Number Publication Date
CN108733982A CN108733982A (zh) 2018-11-02
CN108733982B true CN108733982B (zh) 2021-02-19

Family

ID=63940161

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710883645.8A Active CN108733982B (zh) 2017-09-26 2017-09-26 孕妇nipt结果校正方法、装置及计算机可读存储介质、设备

Country Status (1)

Country Link
CN (1) CN108733982B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113643755B (zh) * 2021-08-11 2023-10-13 上海小海龟科技有限公司 一种nipt试剂盒阳性率校正方法、装置、计算机设备和介质

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20110245085A1 (en) * 2010-01-19 2011-10-06 Rava Richard P Methods for determining copy number variations
JP2013530727A (ja) * 2010-07-23 2013-08-01 エソテリックス ジェネティック ラボラトリーズ, エルエルシー 差次的に提示される胎児のゲノム領域もしくは母親のゲノム領域の同定およびそれらの使用
CN104120181B (zh) * 2011-06-29 2017-06-09 深圳华大基因股份有限公司 对染色体测序结果进行gc校正的方法及装置
CN103215349B (zh) * 2013-03-26 2015-02-18 赛业(苏州)生物信息技术有限公司 一种染色体特异位点的筛选方法及应用
US10741269B2 (en) * 2013-10-21 2020-08-11 Verinata Health, Inc. Method for improving the sensitivity of detection in determining copy number variations
CN103525939B (zh) * 2013-10-28 2015-12-02 博奥生物集团有限公司 无创检测胎儿染色体非整倍体的方法和***
AU2015266665C1 (en) * 2014-05-30 2021-12-23 Verinata Health, Inc. Detecting fetal sub-chromosomal aneuploidies and copy number variations
CN105986008A (zh) * 2015-01-27 2016-10-05 深圳华大基因科技有限公司 Cnv检测方法和装置
CN104789686B (zh) * 2015-05-06 2018-09-07 浙江安诺优达生物科技有限公司 检测染色体非整倍性的试剂盒和装置
CN104789466B (zh) * 2015-05-06 2018-03-13 安诺优达基因科技(北京)有限公司 检测染色体非整倍性的试剂盒和装置

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
三甲医院PCR实验室环境下的无创产前检测;许泽辉 等;《中国生育健康杂志》;20170511;第28卷(第3期);第221-224页 *
无创DNA检测在诊断高龄孕妇胎儿非整倍体中的应用;龙洋 等;《实用妇产科杂志》;20170531;第33卷(第5期);第373-375页 *

Also Published As

Publication number Publication date
CN108733982A (zh) 2018-11-02

Similar Documents

Publication Publication Date Title
CN108573125B (zh) 一种基因组拷贝数变异的检测方法及包含该方法的装置
KR102540202B1 (ko) 유전적 변이의 비침습 평가를 위한 방법 및 프로세스
RU2654575C2 (ru) Способ и устройство для детектирования хромосомных структурных аномалий
EP3621080A1 (en) Reducing error in predicted genetic relationships
CN111755068B (zh) 基于测序数据识别肿瘤纯度和绝对拷贝数的方法及装置
CN107133491B (zh) 一种获取胎儿游离dna浓度的方法
US20180330046A1 (en) Methods for detecting copy-number variations in next-generation sequencing
EP3871232A1 (en) Methods and apparatus for phenotype-driven clinical genomics using a likelihood ratio paradigm
CN115064209B (zh) 一种恶性细胞鉴定方法及***
EP3023504B1 (en) Method and device for detecting chromosomal aneuploidy
CN108733982B (zh) 孕妇nipt结果校正方法、装置及计算机可读存储介质、设备
US20180300451A1 (en) Techniques for fractional component fragment-size weighted correction of count and bias for massively parallel DNA sequencing
CN110970089B (zh) 胎儿浓度计算的预处理方法、预处理装置及其应用
EP3635138B1 (en) Method for analysing cell-free nucleic acids
WO2017051996A1 (ko) 비침습적 태아 염색체 이수성 판별 방법
CN114703263B (zh) 一种群组染色体拷贝数变异检测方法及装置
WO2024140881A1 (zh) 胎儿dna浓度的确定方法及装置
CN117153258A (zh) 校正测序数据、检测染色体非整倍体的方法和装置
US20180089367A1 (en) Techniques for fine grained correction of count bias in massively parallel DNA sequencing
EP4123653A1 (en) Method of evaluating a mutational burden
KR102532991B1 (ko) 태아의 염색체 이수성 검출방법
CN114067909B (zh) 一种矫正同源重组缺陷评分的方法、装置和存储介质
KR102287096B1 (ko) 모체 시료 중 태아 분획을 결정하는 방법
CN112823391B (zh) 基于检测限的质量控制度量
CN115630131B (zh) 一种轨迹数据时空切片方法、***及电子设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant