CN103525939B - 无创检测胎儿染色体非整倍体的方法和*** - Google Patents

无创检测胎儿染色体非整倍体的方法和*** Download PDF

Info

Publication number
CN103525939B
CN103525939B CN201310517694.1A CN201310517694A CN103525939B CN 103525939 B CN103525939 B CN 103525939B CN 201310517694 A CN201310517694 A CN 201310517694A CN 103525939 B CN103525939 B CN 103525939B
Authority
CN
China
Prior art keywords
karyomit
chromosome
value
cent
sample
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201310517694.1A
Other languages
English (en)
Other versions
CN103525939A (zh
Inventor
糜庆丰
彭春芳
刘海量
何铮
章芬
陈样宜
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
CapitalBio Technology Co Ltd
Original Assignee
CapitalBio Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by CapitalBio Corp filed Critical CapitalBio Corp
Priority to CN201310517694.1A priority Critical patent/CN103525939B/zh
Publication of CN103525939A publication Critical patent/CN103525939A/zh
Application granted granted Critical
Publication of CN103525939B publication Critical patent/CN103525939B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6881Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for tissue or cell typing, e.g. human leukocyte antigen [HLA] probes

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Health & Medical Sciences (AREA)
  • Organic Chemistry (AREA)
  • Zoology (AREA)
  • Analytical Chemistry (AREA)
  • Wood Science & Technology (AREA)
  • Immunology (AREA)
  • Engineering & Computer Science (AREA)
  • Biotechnology (AREA)
  • Microbiology (AREA)
  • Molecular Biology (AREA)
  • Biophysics (AREA)
  • Physics & Mathematics (AREA)
  • Cell Biology (AREA)
  • Biochemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本发明属于医疗检测领域,公开了一种无创检测胎儿染色体非整倍体的方法和***。在本发明公开的检测方法和***中还涉及了消除染色体内和染色体间测序GC偏好性的方法和***以及用于构建正常男胎中X、Y染色体的Z值之间的关系模型的方法和***。本发明通过消除染色体内和染色体间测序GC偏好性的影响,构建正常男胎中X、Y染色体的Z值之间的关系模型,建立X染色体的Z值理论值与实际值差异的判定阈值,实现了胎儿染色体非整倍体,特别是性染色体非整倍体的准确检测。

Description

无创检测胎儿染色体非整倍体的方法和***
技术领域
本发明涉及医疗检测领域,具体涉及一种无创检测胎儿染色体非整倍体的方法以及用于无创检测胎儿染色体非整倍体的***。
背景技术
染色体非整倍体病变是胎儿最常见的染色体畸形,依据染色体类别不同可分为常染色体非整倍体和性染色体非整倍体。常染色体非整倍体主要包括21-三体(唐氏综合征)、18-三体(爱德华氏综合征)和13-三体(帕陶氏综合征),其中以21-三体最为常见,发病率约为1/800。性染色体非整倍体主要包括Klinefelter综合征(47,XXY)、XYY综合征、特纳氏综合征(45,X)和超雌综合征(47,XXX),男性发病率约为1/500,女性发病率约为1/850。对胎儿染色体非整倍体病变的产前诊断是降低出生缺陷、提高出生人口素质的重要手段。
目前,染色体异常的产前诊断技术是通过侵入性方法获取胎儿组织,如羊膜腔穿刺、绒毛活检、脐静脉穿刺等,进行FISH分析或者染色体核型分析。这些技术均为有创性的,可能引起流产、胎儿损伤、出血、感染等。而临床血清学筛查和超声检查虽然无创,但检测结果的假阳性率和假阴性率都比较高。因此,开发一种精确且灵敏度高的无创产前检测方法,是一项迫切且意义深远的工作。
孕妇外周血中胎儿游离DNA(cffDNA)的发现,为非侵入性的无创检测技术的研发奠定了坚实的基础。但由于孕妇血浆中胎儿游离DNA的含量少,是处于一种高母体DNA的背景下,这使得许多检测方法呈现出假阴性的结果。为了克服以上缺点,高通量测序技术被运用于染色体非整倍体疾病的无创检测。
2008年,RossaW.K.Chiu等发表在《美国科学院院刊》上的研究论文,详细描述了一种利用大规模高通量测序进行胎儿染色体非整倍体的无创产前诊断的方法。所述方法为:通过提取孕妇外周血血浆中的DNA,并对其进行第二代高通量测序,通过分析得到每条染色体上检测到的碱基占所有检测到的碱基的百分比,并将该值与由正常血样所构建的阈值做比较,以确定胎儿是否具有非整倍体异常。该方法中,测序的GC偏好性使得计算获得的碱基百分比存在偏差,这在很大程度上降低了胎儿非整倍体检测的灵敏度。针对这一问题,H.ChristinaFan等通过研究建立了一种消除短序列测序数据的GC偏好性的方法,即在计算染色体碱基百分比之前,首先将整个染色体划分成20kb片段大小的非重叠区域,进而计算每个区域内各测序序列的GC值;以0.1%GC值差异对染色体上每个非重叠区域内的测序序列进行分组;统计每个GC值组内测序序列的数目,并将其与其他所有二倍体染色体该区域内测序序列平均数的比值作为该组测序序列的GC权重,达到消除GC偏好的目的。
然而,上述检测方法也存在着自身的局限性:首先,测序的GC偏向不仅存在于同一条染色体的内部,同时存在于不同的染色体之间,而上述方法在解决GC偏好性时,只考虑了每条染色体内各序列因GC含量的差异而造成的测序偏好性,未考虑染色体间序列的这种偏好性。这就使得计算获得的染色体的碱基百分比与真实值之间存在较大偏差,影响最终结果的准确性。其次,由于男胎中性染色体的分布情况与常染色体不同,而上述方法在进行非整倍体分析时未单独对性染色体数据构建优化模型,因此上述方法只能判断出常染色体非整倍体异常,而对于性染色体的非整倍体异常不能做出很好的判断。
发明内容
针对现有技术中存在的上述缺陷,本发明一方面提供了一种消除染色体内和染色体间测序GC偏好性的方法,包括以下步骤:
1、全基因组测序:利用高通量测序平台对待测样品进行全基因组测序;
2、测序数据的准确定位:将测序得到的碱基序列与人类基因组标准序列hg19进行比对,确定测序获得的每条碱基序列在染色体上的确切位置;
3、测序数据的质控:剔除处于基因组串联重复位置及转座子重复位置的碱基序列,同时去除低质量、多匹配和非完全匹配到染色体上的碱基序列;
4、统计Unique碱基百分比:对步骤(2)中获得的序列,统计每条染色体的唯一匹配碱基数即Unique碱基数,并计算每条染色体的Unique碱基数占该样品所有染色体碱基序列的百分比;
5、优化染色体Unique碱基百分比:对步骤(4)中获得的样品的染色体的碱基百分比进行k均值聚类分析,然后根据每条常染色体所在的类别,在每个类别内分别运用H.ChristinaFan提供的方法进行GC校正。
在本发明优选的实施方案中,步骤5中GC校正的步骤为:首先将整个染色体划分成20kb片段大小的非重叠区域,进而计算每个区域内各测序序列的GC值;以0.1%GC值差异对染色体上每个非重叠区域内的测序序列进行分组;统计每个GC值组内测序序列的数目,并将其与类别内所有染色体该区域内测序序列平均数的比值作为该组测序序列的GC权重,重新计算每条染色体的Unique碱基数及碱基百分比,进而实现对每条染色体上的Unique碱基百分比的GC校正。
本发明另一方面还提供了一种用于消除染色体内和染色体间测序GC偏好性的***,其包括:
1、测序模块:用于利用高通量测序平台对待测样品进行全基因组测序;
2、比对模块:用于将测序得到的碱基序列与人类基因组标准序列hg19进行比对,确定测序获得的每条碱基序列在染色体上的确切位置;
3、质控模块:用于剔除处于基因组串联重复位置及转座子重复位置的碱基序列,同时去除低质量、多匹配和非完全匹配到染色体上的碱基序列;
4、统计模块:用于对比对模块中获得的序列,统计每条染色体的唯一匹配碱基数即Unique碱基数,并计算每条染色体的Unique碱基数占该样品所有染色体碱基序列的百分比;
5、优化模块:用于对统计模块中获得的样品的染色体的碱基百分比进行k均值聚类分析,然后根据每条常染色体所在的类别,在每个类别内分别运用H.ChristinaFan提供的方法进行GC校正。
本发明另一方面还提供了一种用于构建正常男胎中X、Y染色体的Z值之间的关系模型的方法,包括以下步骤:
1、选取对照样品:选取一定数量孕周大于等于12周且核型分析无染色体异常的孕妇样品作为参考数据库A(ReferenceA)中的对照样品,其中,必须包含一定数量怀有正常核型女胎的孕妇样品,单独作为X、Y性染色体分析的参考数据库B(ReferenceB)中的对照样品;
2、按照本发明所述的方法消除染色体内和染色体间测序GC偏好性,对碱基百分比进行GC校正;
3、构建参考数据库的统计学参数:根据步骤(2)中获得的Unique碱基百分比,计算ReferenceA中每条常染色体Unique碱基百分比的均值和标准误差以及ReferenceB中X染色体Unique碱基百分比的均值和标准误差;
4、计算男胎中X、Y染色体的Z值:以ReferenceB作为参考数据库,根据公式1分别计算怀有正常男胎的孕妇样品中胎儿X、Y染色体的Z值,即ZX和ZY
Zi=(xii)/σi(公式1)
i:染色体编号;
xi:分析数据中第i号染色体的Unique碱基百分比;
μi:参考数据库中第i号染色体的Unique碱基百分比的平均值;
σi:参考数据库中第i号染色体的Unique碱基百分比的标准误差;
5、根据公式2,构建男胎中ZX和ZY间的关系模型:
Z′X=r*ZY+b(公式2)
Z′X:X染色体Z值的理论值;
ZY:Y染色体的Z值;
r:X、Y染色体Z值间的相关系数;
b:误差和剩余项;
根据最小二乘法估算出上述公式2中的r值和b值,于是,对应于每个已知的ZY,都可以得到唯一的一个Z′X
本发明另一方面还提供了一种用于构建正常男胎中X、Y染色体的Z值之间的关系模型的***,其包括:
1、对照样品设置模块:用于选取一定数量孕周大于等于12周且核型分析无染色体异常的孕妇样品作为参考数据库A(ReferenceA)中的对照样品,其中,必须包含一定数量怀有正常核型女胎的孕妇样品,单独作为X、Y性染色体分析的参考数据库B(ReferenceB)中的对照样品;
2、本发明所述的用于消除染色体内和染色体间测序GC偏好性的***,用于消除染色体内和染色体间测序GC偏好性,对碱基百分比进行GC校正;
3、统计学参数构建模块:用于根据本发明所述的***获得的Unique碱基百分比,计算ReferenceA中每条常染色体Unique碱基百分比的均值和标准误差以及ReferenceB中X染色体Unique碱基百分比的均值和标准误差;
4、Z值计算模块:用于以ReferenceB作为参考数据库,根据公式1分别计算怀有正常男胎的孕妇样品中胎儿X、Y染色体的Z值,即ZX和ZY
Zi=(xii)/σi(公式1)
i:染色体编号;
xi:分析数据中第i号染色体的Unique碱基百分比;
μi:参考数据库中第i号染色体的Unique碱基百分比的平均值;
σi:参考数据库中第i号染色体的Unique碱基百分比的标准误差;
5、ZX和ZY间的关系模型构建模块:用于根据公式2,构建男胎中ZX和ZY间的关系模型:
Z′X=r*ZY+b(公式2)
Z′X:X染色体Z值的理论值;
ZY:Y染色体的Z值;
r:X、Y染色体Z值间的相关系数;
b:误差和剩余项;
根据最小二乘法估算出上述公式2中的r值和b值,于是,对应于每个已知的ZY,都可以得到唯一的一个Z′X
本发明另一方面还提供了一种无创检测胎儿染色体非整倍体的方法,包括以下步骤:
1、按照本发明所述的方法构建正常男胎中X、Y染色体的Z值之间的关系模型;
2、构建男胎中X染色体非整倍体判定阈值:根据公式3,计算怀有正常男胎孕妇样品中胎儿的ZX与Z′X的值所对应的R值,通过统计分析获得R值的取值区间;然后用怀有X染色体非整倍体男胎的孕妇样品数据对R的取值区间进行验证,
R=log2(|ZX/Z′X|)(公式3);
3、计算待测样品中染色体Unique碱基百分比:按照本发明所述的方法,对每个待测样品消除染色体内和染色体间测序GC偏好性,对碱基百分比进行GC校正,获得GC校正和类别优化后的Unique碱基百分比;
4、计算待测样品中每条染色体的Z值:以ReferenceA作为参考数据库,根据公式1,计算待测样品中每条常染色体的Z值;以ReferenceB作为参考数据库,根据公式1,计算待测样品中X、Y染色体的Z值;
5、计算R值
若步骤(4)中计算所得ZY>3,则根据公式2计算X染色体Z值的理论值Z′X,进而根据公式3计算R值;
6、常染色体非整倍体的判定:
若Zi>3(i=1,2,…,22),则判定第i号染色体为非整倍体;
7、X、Y染色体非整倍体的判定:
若ZY<3且ZX<-3,则判定为XO;
若ZY<3且|ZX|<3,则判定为XX,正常女胎;
若ZY<3且|ZX|>3之间,则判定为XXX;
若ZY>3,|ZX|<3且ZX>Z′X,则判定为XXY;
若ZY>3,ZX<-3且ZX>Z′X,则判定为XYY;
若ZY>3且R∈[-0.8,0.8],即ZX与Z′X无显著差异,则判定为XY,正常男胎。
本发明最后一方面还提供了一种用于无创检测胎儿染色体非整倍体的***,其包括:
1、本发明所述的用于构建正常男胎中X、Y染色体的Z值之间的关系模型的***,用于构建正常男胎中X、Y染色体的Z值之间的关系模型;
2、非整倍体判定阈值构建模块:用于根据公式3,计算怀有正常男胎孕妇样品中胎儿的ZX与Z′X的值所对应的R值,通过统计分析获得R值的取值区间;然后用怀有X染色体非整倍体男胎的孕妇样品数据对R的取值区间进行验证,
R=log2(|ZX/Z′X|)(公式3);
3、本发明所述的用于消除染色体内和染色体间测序GC偏好性的***,用于对每个待测样品消除染色体内和染色体间测序GC偏好性,对碱基百分比进行GC校正,获得GC校正和类别优化后的Unique碱基百分比;
4、Z值计算模块:用于以ReferenceA作为参考数据库,根据公式1,计算待测样品中每条常染色体的Z值;以ReferenceB作为参考数据库,根据公式1,计算待测样品中X、Y染色体的Z值;
5、R值计算模块:若Z值计算模块中计算所得ZY>3,则根据公式2计算X染色体Z值的理论值Z′X,进而根据公式3计算R值;
6、常染色体非整倍体判定模块:用于判定常染色体是否为非整倍体,即:
若Zi>3(i=1,2,…,22),则判定第i号染色体为非整倍体;
7、X、Y染色体非整倍体判定模块:用于判定X和Y染色体是否为非整倍体,即:
若ZY<3且ZX<-3,则判定为XO;
若ZY<3且|ZX|<3,则判定为XX,正常女胎;
若ZY<3且|ZX|>3之间,则判定为XXX;
若ZY>3,|ZX|<3且ZX>Z′X,则判定为XXY;
若ZY>3,ZX<-3且ZX>Z′X,则判定为XYY;
若ZY>3且R∈[-0.8,0.8],即ZX与Z′X无显著差异,则判定为XY,正常男胎。
在本发明优选的实施方案中,样品优选来自孕妇的含有胎儿DNA的外周血,更加优选来自于孕妇外周血的血浆。
在本发明优选的实施方案中,染色体选自21号染色体、18号染色体、13号染色体、X染色体和Y染色体或上述染色体的片段序列。
本发明通过消除染色体内和染色体间测序GC偏好性的影响,构建正常男胎中X、Y染色体的Z值之间的关系模型,建立X染色体的Z值理论值与实际值差异的判定阈值,实现了胎儿染色体非整倍体,特别是性染色体非整倍体的准确检测。
具体而言,发明人基于高通量测序数据,分析发现染色体间的碱基量具有相关性,进而通过对染色体的碱基百分比进行k均值聚类分析和GC校正,消除了染色体内和染色体间测序GC偏好性的影响;且以怀有正常核型女胎的孕妇其外周血DNA测序结果中X、Y染色体碱基百分比作为参考数据,通过构建正常男胎中X、Y染色体的Z值之间的关系模型,获得男胎中X染色体的Z值的理论值,进而获得X染色体的Z值理论值与实际值差异的阈值范围,并将其用于X、Y性染色体非整倍体异常的判定。
由此可见,本发明建立了一种利用高通量测序数据进行胎儿染色体非整倍体无创检测的新方法。与原有方法相比,本发明的方法不仅解决了染色体内和染色体间因序列GC含量的差异而造成的测序偏好性对检测结果准确性的影响;同时还扩大了检测范围:不仅可以检测常染色体非整倍体,还可检测性染色体非整倍体。一方面,本发明的方法可用于胎儿染色体非整倍体无创产前诊断,帮助有效控制染色体非整倍体胎儿的出生率。另一方面,本发明中所建立的染色体非整倍体的判定方法的扩展性好,应用范围广泛。它不仅能对染色体非整倍体进行检测,还可扩展到一些感兴趣的染色体片段。
附图说明
图1:基于IonProtonTM测序数据进行胎儿染色体非整倍体判定的分析流程图。
具体实施方式
下面通过实施例对本发明作进一步的详细说明,旨在用于说明本发明而非限定本发明。应当指出,对于本领域技术人员而言,在不脱离本发明原理的前提下,还可以对本发明进行若干改进和修饰,这些改进和修饰也同样落入本发明的保护范围之内。
实施例1:构建参考数据库
1、选取对照血样
选取500个孕周大于等于12周且核型分析无染色体异常的孕妇外周血样组成参考数据库A(ReferenceA)中的对照血样。其中,200例怀有正常女胎的孕妇血样组成参考数据库B(ReferenceB)中的对照血样。
2、测序数据的准确定位
将测序数据与人类基因组标准序列hg19进行比对,确定碱基序列在染色体上的准确位置。
3、测序数据的质控
为了保证测序结果的质量及避免一些重复序列的干扰,剔除低质量的序列,并对位于基因组串联重复及转座重复区域的碱基进行过滤。最终约2/3的测序碱基被完全定位到基因组上的唯一位置,故也称为Unique碱基。
4、统计Unique碱基百分比
统计每条染色体上的Unique碱基数目,并计算每条染色体上Unique碱基占所有常染色体的碱基数的百分比。
5、优化常染色体Unique碱基百分比
对4中得到的每个对照血样的22条常染色体的碱基百分比进行k均值聚类分析,将22条常染色体分为3类。然后根据每条常染色体所在的类别,在每个类别内分别运用H.ChristinaFan等提供的方法,即首先将整个染色体划成20kb片段大小的非重叠区域并计算每个区域内各测序序列的GC含量;然后以染色体上每个非重叠区域内各测序序列的数目与类别内所有染色体该区域内测序序列平均数的比值作为相应测序序列的GC权重,重新计算每条染色体的Unique碱基数及碱基百分比,进而实现对每条染色体上的Unique碱基百分比的GC校正。
6、构建参考数据库的统计学参数
将4和5中计算获得的所有对照血样中各类染色体的碱基百分比作为一个样本空间,计算这个血样空间中每条染色体碱基百分比的均值和标准误差。
实施例2:构建男胎中X染色体非整倍体的判定参数及其阈值范围
1、计算男胎中X、Y染色体的Z值
以ReferenceB作为参考数据库,根据公式1分别计算怀有正常男胎的孕妇血样中胎儿X、Y染色体的Z值,即ZX和ZY
Zi=(xii)/σi(公式1)
i:染色体编号;
xi:分析数据中第i号染色体的Unique碱基百分比;
μi:参考数据库中第i号染色体的Unique碱基百分比的平均值;
бi:参考数据库中第i号染色体的Unique碱基百分比的标准误差。
2、构建男胎中ZX和ZY间的关系模型
由Z值的计算公式可知,ZX和ZY都与胎儿DNA浓度相关,通过统计学分析发现ZX和ZY之间存在线性关系。鉴于此,发明者构建了怀有正常男胎的孕妇血样中胎儿X染色体的Z值的理论值Z′X和ZY之间的关系模型:
Z′X=r*ZY+b(公式2)
Z′X:X染色体Z值的理论值;
ZY:Y染色体的Z值;
r:X、Y染色体Z值间的相关系数;
b:误差和剩余项。
根据最小二乘法估算出上述公式2中的r值为-0.2808、b值为-2.1535。
3、构建判定参数R的阈值范围
根据公式3,计算怀有正常男胎孕妇血样中胎儿的ZX与Z′X的值所对应的R值,通过统计分析获得R值的取值区间为[-0.8,0.8];用X染色体非整倍体阳性数据进行验证,证实其R值完全落于上述取值区间之外。
R=log2(|ZX/Z′X|)(公式3)
实施例3:待测血样的检测
1、待测血样的全基因组测序
7名孕妇志愿者参与本项检测,血样编号为N1-N7。核型分析结果显示:1名怀有21号染色体三体胎儿,1名怀有13号染色体三体胎儿,1名怀有18号染色体三体胎儿,1名怀有多一条Y染色体的男胎,1名怀有缺一条X染色体的女胎,1名怀有正常女胎,1名怀有正常男胎。
抽取每个孕妇的外周血液,进行离心,获得血浆,再从血浆中提取DNA,利用Life公司的IonProtonTM测序仪进行大规模的高通量测序。上述血样均由广州市妇女儿童医疗中心采集获得。
2、统计待测血样中染色体的Unique碱基百分比
通过比对、过滤,统计每条染色体上的碱基序列百分比。表1中列出了7个血样在优化前染色体13、18、21、X、Y的碱基序列百分比。
表1优化前部分染色体碱基序列百分比
3、对常染色体的Unique碱基百分比进行优化
对22条常染色体的Unique碱基百分比进行k均值聚类分析,将其分为3类:第一类包括2、3、4、5、6、13、18号染色体;第二类包括1、11、15、16、19、20、22号染色体;第三类包括7、9、10、12、14、21号染色体。
根据每条染色体所在类别,运用H.ChristinaFan等提供的方法分别进行优化,优化后的百分比数据如表2所示。
表2优化后部分染色体碱基序列百分比
4、计算待测血样中每条染色体的Z值
以ReferenceA作为参考数据库,根据公式1,计算待测血样中每条常染色体的Z值;以ReferenceB作为参考数据库,根据公式1,计算待测血样中X、Y染色体的Z值;表3中列出每个血样部分染色体的Z值,其余染色体的Z值的绝对值均小于3。
表3待测血样中部分染色体对应的Z值
5、计算R值
若上述步骤4中计算所得ZY>3,则根据公式2计算X染色体Z值的理论值Z′X,进而根据公式3计算R值,结果见表4。
表4N5、N6和N7三个血样对应的Z′X值和R值
6、染色体非整倍体的判定
据表3和表4中数据作出如下推断:
ⅰ)N1的Z13为12.1375,大于3,则认为多一条13号染色体,ZX大于-3小于3且ZY大于-3小于3,故判断N1为47,XX,T13;
ⅱ)同i)可推断出N2为47,XX,T21;
ⅲ)同i)可推断出N4为46,XX;
ⅳ)对于N3,其Z21、Z18和Z13都处于正常范围,故没有常染色体异常。但其ZX明显小于-3,且ZY为0.491,介于-3和+3之间,因此Y染色体不存在。所以样品N3只有一条X染色体且无Y染色体,很可能为特纳综合症(45,X)患儿;
ⅴ)对于N5,其ZY>3、Z′X为-6.79且R值落在[-0.8,0.8]区间内,故判定为46,XY;
ⅵ)对于N6,鉴于其ZY>3,Z′X为-6.17且R值落在[-0.8,0.8]区间内,可确定其性染色体正常;但其Z18>3,故多一条18号染色体,故判定为47,XY,T18;
ⅶ)对于N7,其Z13、Z18、Z21都处于正常范围,故没有常染色体异常。但其ZY>3、Z′X为-20.63且R值为-1.1373,超出了阈值范围,故判定为47,XYY。
综合以上,本检测实例中7个血样的检测结果见表5。由表5中数据可知,本检测实例中7个血样的检测结果与核型分析结果完全一致。
表5本检测实例中7个血样的检测结果

Claims (20)

1.一种消除染色体内和染色体间测序GC偏好性的方法,包括以下步骤:
(1)全基因组测序:利用高通量测序平台对待测样品进行全基因组测序;
(2)测序数据的准确定位:将测序得到的碱基序列与人类基因组标准序列hg19进行比对,确定测序获得的每条碱基序列在染色体上的确切位置;
(3)测序数据的质控:剔除处于基因组串联重复位置及转座子重复位置的碱基序列,同时去除低质量、多匹配和非完全匹配到染色体上的碱基序列;
(4)统计Unique碱基百分比:对步骤(2)中获得的序列,统计每条染色体的唯一匹配碱基数即Unique碱基数,并计算每条染色体的Unique碱基数占该样品所有染色体碱基序列的百分比;
(5)优化染色体Unique碱基百分比:对步骤(4)中获得的样品的染色体的碱基百分比进行k均值聚类分析,然后根据每条常染色体所在的类别,在每个类别内分别运用H.ChristinaFan提供的方法进行GC校正,即首先将整个染色体划分成20kb片段大小的非重叠区域,进而计算每个区域内各测序序列的GC值;以0.1%GC值差异对染色体上每个非重叠区域内的测序序列进行分组;统计每个GC值组内测序序列的数目,并将其与类别内所有染色体该区域内测序序列平均数的比值作为该组测序序列的GC权重,重新计算每条染色体的Unique碱基数及碱基百分比,进而实现对每条染色体上的Unique碱基百分比的GC校正。
2.一种用于消除染色体内和染色体间测序GC偏好性的***,其包括:
(1)测序模块:用于利用高通量测序平台对待测样品进行全基因组测序;
(2)比对模块:用于将测序得到的碱基序列与人类基因组标准序列hg19进行比对,确定测序获得的每条碱基序列在染色体上的确切位置;
(3)质控模块:用于剔除处于基因组串联重复位置及转座子重复位置的碱基序列,同时去除低质量、多匹配和非完全匹配到染色体上的碱基序列;
(4)统计模块:用于对比对模块中获得的序列,统计每条染色体的唯一匹配碱基数即Unique碱基数,并计算每条染色体的Unique碱基数占该样品所有染色体碱基序列的百分比;
(5)优化模块:用于对统计模块中获得的样品的染色体的碱基百分比进行k均值聚类分析,然后根据每条常染色体所在的类别,在每个类别内分别运用H.ChristinaFan提供的方法进行GC校正,即首先将整个染色体划分成20kb片段大小的非重叠区域,进而计算每个区域内各测序序列的GC值;以0.1%GC值差异对染色体上每个非重叠区域内的测序序列进行分组;统计每个GC值组内测序序列的数目,并将其与类别内所有染色体该区域内测序序列平均数的比值作为该组测序序列的GC权重,重新计算每条染色体的Unique碱基数及碱基百分比,进而实现对每条染色体上的Unique碱基百分比的GC校正。
3.一种用于构建正常男胎中X、Y染色体的Z值之间的关系模型的方法,包括以下步骤:
(1)选取对照样品:选取一定数量孕周大于等于12周且核型分析无染色体异常的孕妇样品作为参考数据库A(ReferenceA)中的对照样品,其中,必须包含一定数量怀有正常核型女胎的孕妇样品,单独作为X、Y性染色体分析的参考数据库B(ReferenceB)中的对照样品;
(2)按照权利要求1所述的方法消除染色体内和染色体间测序GC偏好性,对碱基百分比进行GC校正;
(3)构建参考数据库的统计学参数:根据步骤(2)中获得的Unique碱基百分比,计算ReferenceA中每条常染色体Unique碱基百分比的均值和标准误差以及ReferenceB中X染色体Unique碱基百分比的均值和标准误差;
(4)计算男胎中X、Y染色体的Z值:以ReferenceB作为参考数据库,根据公式1分别计算怀有正常男胎的孕妇样品中胎儿X、Y染色体的Z值,即ZX和ZY
Zi=(xii)/σi(公式1)
i:染色体编号;
xi:分析数据中第i号染色体的Unique碱基百分比;
μi:参考数据库中第i号染色体的Unique碱基百分比的平均值;
σi:参考数据库中第i号染色体的Unique碱基百分比的标准误差;
(5)根据公式2,构建男胎中ZX和ZY间的关系模型:
Z′X=r*ZY+b(公式2)
Z′X:X染色体Z值的理论值;
ZY:Y染色体的Z值;
r:X、Y染色体Z值间的相关系数;
b:误差和剩余项;
根据最小二乘法估算出上述公式2中的r值和b值,于是,对应于每个已知的ZY,都可以得到唯一的一个Z′X
4.一种用于构建正常男胎中X、Y染色体的Z值之间的关系模型的***,其包括:
(1)对照样品设置模块:用于选取一定数量孕周大于等于12周且核型分析无染色体异常的孕妇样品作为参考数据库A(ReferenceA)中的对照样品,其中,必须包含一定数量怀有正常核型女胎的孕妇样品,单独作为X、Y性染色体分析的参考数据库B(ReferenceB)中的对照样品;
(2)权利要求2所述的用于消除染色体内和染色体间测序GC偏好性的***,用于消除染色体内和染色体间测序GC偏好性,对碱基百分比进行GC校正;
(3)统计学参数构建模块:用于根据权利要求2所述的***获得的Unique碱基百分比,计算ReferenceA中每条常染色体Unique碱基百分比的均值和标准误差以及ReferenceB中X染色体Unique碱基百分比的均值和标准误差;
(4)Z值计算模块:用于以ReferenceB作为参考数据库,根据公式1分别计算怀有正常男胎的孕妇样品中胎儿X、Y染色体的Z值,即ZX和ZY
Zi=(xii)/σi(公式1)
i:染色体编号;
xi:分析数据中第i号染色体的Unique碱基百分比;
μi:参考数据库中第i号染色体的Unique碱基百分比的平均值;
σi:参考数据库中第i号染色体的Unique碱基百分比的标准误差;
(5)ZX和ZY间的关系模型构建模块:用于根据公式2,构建男胎中ZX和ZY间的关系模型:
Z′X=r*ZY+b(公式2)
Z′X:X染色体Z值的理论值;
ZY:Y染色体的Z值;
r:X、Y染色体Z值间的相关系数;
b:误差和剩余项;
根据最小二乘法估算出上述公式2中的r值和b值,于是,对应于每个已知的ZY,都可以得到唯一的一个Z′X
5.一种用于无创检测胎儿染色体非整倍体的***,其包括:
(1)权利要求4所述的用于构建正常男胎中X、Y染色体的Z值之间的关系模型的***,用于构建正常男胎中X、Y染色体的Z值之间的关系模型;
(2)非整倍体判定阈值构建模块:用于根据公式3,计算怀有正常男胎孕妇样品中胎儿的ZX与Z′X的值所对应的R值,通过统计分析获得R值的取值区间;然后用怀有X染色体非整倍体男胎的孕妇样品数据对R的取值区间进行验证,
R=log2(|ZX/Z′X|)(公式3);
(3)权利要求2所述的用于消除染色体内和染色体间测序GC偏好性的***,用于对每个待测样品消除染色体内和染色体间测序GC偏好性,对碱基百分比进行GC校正,获得GC校正和类别优化后的Unique碱基百分比;
(4)Z值计算模块:用于以ReferenceA作为参考数据库,根据公式1,计算待测样品中每条常染色体的Z值;以ReferenceB作为参考数据库,根据公式1,计算待测样品中X、Y染色体的Z值;
(5)R值计算模块:若Z值计算模块中计算所得ZY>3,则根据公式2计算X染色体Z值的理论值Z′X,进而根据公式3计算R值;
(6)常染色体非整倍体判定模块:用于判定常染色体是否为非整倍体,即:
若Zi>3(i=1,2,…,22),则判定第i号染色体为非整倍体;
(7)X、Y染色体非整倍体判定模块:用于判定X和Y染色体是否为非整倍体,即:
若ZY<3且ZX<-3,则判定为XO;
若ZY<3且|ZX|<3,则判定为XX,正常女胎;
若ZY<3且|ZX|>3之间,则判定为XXX;
若ZY>3,|ZX|<3且ZX>Z′X,则判定为XXY;
若ZY>3,ZX<-3且ZX>Z′X,则判定为XYY;
若ZY>3且R∈[-0.8,0.8],即ZX与Z′X无显著差异,则判定为XY,正常男胎。
6.根据权利要求1所述的一种消除染色体内和染色体间测序GC偏好性的方法,其中所述的样品是来自孕妇的含有胎儿DNA的外周血。
7.根据权利要求3所述的一种用于构建正常男胎中X、Y染色体的Z值之间的关系模型的方法,其中所述的样品是来自孕妇的含有胎儿DNA的外周血。
8.根据权利要求2所述的一种用于消除染色体内和染色体间测序GC偏好性的***,其中所述的样品是来自孕妇的含有胎儿DNA的外周血。
9.根据权利要求4所述的一种用于构建正常男胎中X、Y染色体的Z值之间的关系模型的***,其中所述的样品是来自孕妇的含有胎儿DNA的外周血。
10.根据权利要求5所述的一种用于无创检测胎儿染色体非整倍体的***,其中所述的样品是来自孕妇的含有胎儿DNA的外周血。
11.根据权利要求6所述的一种消除染色体内和染色体间测序GC偏好性的方法,其中所述的样品来自于孕妇外周血的血浆。
12.根据权利要求7所述的一种用于构建正常男胎中X、Y染色体的Z值之间的关系模型的方法,其中所述的样品来自于孕妇外周血的血浆。
13.根据权利要求8所述的一种用于消除染色体内和染色体间测序GC偏好性的***,其中所述的样品来自于孕妇外周血的血浆。
14.根据权利要求9所述的一种用于构建正常男胎中X、Y染色体的Z值之间的关系模型的***,其中所述的样品来自于孕妇外周血的血浆。
15.根据权利要求10所述的一种用于无创检测胎儿染色体非整倍体的***,其中所述的样品来自于孕妇外周血的血浆。
16.根据权利要求1所述的一种消除染色体内和染色体间测序GC偏好性的方法,其中所述的染色体选自21号染色体、18号染色体、13号染色体、X染色体和Y染色体或上述染色体的片段序列。
17.根据权利要求3所述的一种用于构建正常男胎中X、Y染色体的Z值之间的关系模型的方法,其中所述的染色体选自21号染色体、18号染色体、13号染色体、X染色体和Y染色体或上述染色体的片段序列。
18.根据权利要求2所述的一种用于消除染色体内和染色体间测序GC偏好性的***,其中所述的染色体选自21号染色体、18号染色体、13号染色体、X染色体和Y染色体或上述染色体的片段序列。
19.根据权利要求4所述的一种用于构建正常男胎中X、Y染色体的Z值之间的关系模型的***,其中所述的染色体选自21号染色体、18号染色体、13号染色体、X染色体和Y染色体或上述染色体的片段序列。
20.根据权利要求5所述的一种用于无创检测胎儿染色体非整倍体的***,其中所述的染色体选自21号染色体、18号染色体、13号染色体、X染色体和Y染色体或上述染色体的片段序列。
CN201310517694.1A 2013-10-28 2013-10-28 无创检测胎儿染色体非整倍体的方法和*** Active CN103525939B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201310517694.1A CN103525939B (zh) 2013-10-28 2013-10-28 无创检测胎儿染色体非整倍体的方法和***

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201310517694.1A CN103525939B (zh) 2013-10-28 2013-10-28 无创检测胎儿染色体非整倍体的方法和***

Publications (2)

Publication Number Publication Date
CN103525939A CN103525939A (zh) 2014-01-22
CN103525939B true CN103525939B (zh) 2015-12-02

Family

ID=49928285

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201310517694.1A Active CN103525939B (zh) 2013-10-28 2013-10-28 无创检测胎儿染色体非整倍体的方法和***

Country Status (1)

Country Link
CN (1) CN103525939B (zh)

Families Citing this family (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104156631B (zh) * 2014-07-14 2017-07-18 天津华大基因科技有限公司 染色体三倍体检验方法
SI3178941T1 (sl) * 2014-07-25 2022-04-29 Bgi Genomics Co., Limited Postopek za določanje deleža brezceličnih fetalnih nukleinskih kislin v vzorcu periferne krvi nosečnice in njegova uporaba
WO2016090583A1 (zh) * 2014-12-10 2016-06-16 深圳华大基因研究院 测序数据处理装置和方法
CN105825076B (zh) * 2015-01-08 2018-12-14 杭州天译基因科技有限公司 消除常染色体内和染色体间gc偏好的方法及检测***
CN104951671B (zh) * 2015-06-10 2017-09-19 东莞博奥木华基因科技有限公司 基于单样本外周血检测胎儿染色体非整倍性的装置
CN105354443A (zh) * 2015-12-14 2016-02-24 孔祥军 无创产前基因检测分析软件
CN105483229B (zh) * 2015-12-21 2018-10-16 广东腾飞基因科技股份有限公司 一种检测胎儿染色体非整倍体的方法及***
CN106096330B (zh) * 2016-05-31 2019-02-01 北京百迈客医学检验所有限公司 一种无创产前生物信息检测分析方法
CN106951737B (zh) * 2016-11-18 2019-06-14 南方医科大学 一种检测流产组织dna拷贝数变异和嵌合体的方法
CN107133495B (zh) * 2017-05-04 2018-07-13 北京医院 一种非整倍性生物信息的分析方法和分析***
CN108342455B (zh) * 2017-06-25 2021-11-30 北京新羿生物科技有限公司 一种从母体外周血检测胎儿非整倍体染色体的方法及其试剂盒
CN108733982B (zh) * 2017-09-26 2021-02-19 上海凡迪基因科技有限公司 孕妇nipt结果校正方法、装置及计算机可读存储介质、设备
CN108060218A (zh) * 2017-11-14 2018-05-22 广州精科医学检验所有限公司 核酸测序文库中预定范围的核酸片段的筛选方法
CN117766020A (zh) * 2018-05-07 2024-03-26 深圳市真迈生物科技有限公司 检测染色体非整倍性的方法、装置及***
CN109554485B (zh) * 2018-12-26 2022-04-19 北京迈基诺基因科技股份有限公司 一种用于无创检测待测胎儿染色体是否为非整倍体的试剂盒及其专用探针组
CN110211654A (zh) * 2019-05-30 2019-09-06 湖南自兴智慧医疗科技有限公司 一种自动隐藏性别信息的核型检测***及方法
CN110428873B (zh) * 2019-06-11 2021-07-23 西安电子科技大学 一种染色体倍数异常检测方法及检测***
CN111445953B (zh) * 2020-03-27 2022-04-26 武汉古奥基因科技有限公司 一种利用全基因组比对拆分四倍体鱼类亚基因组的方法
CN112037846A (zh) * 2020-07-14 2020-12-04 广州市达瑞生物技术股份有限公司 一种cffDNA非整倍体检测方法、***、储存介质以及检测设备
CN113012759B (zh) * 2020-12-09 2022-08-12 人和未来生物科技(长沙)有限公司 一种基于X染色体的男胎cffDNA含量计算方法
CN112662756A (zh) * 2021-01-26 2021-04-16 上海博奥颐和医学检验所有限公司 一种胎儿染色体非整倍体基因组测序检测方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2010033578A3 (en) * 2008-09-20 2010-05-14 The Board Of Trustees Of The Leland Stanford Junior University Noninvasive diagnosis of fetal aneuploidy by sequencing
WO2013000100A1 (en) * 2011-06-29 2013-01-03 Bgi Shenzhen Co., Limited Noninvasive detection of fetal genetic abnormality
CN103177196A (zh) * 2011-12-22 2013-06-26 上海聚类生物科技有限公司 基于小波变换识别基因组核小体占位边界的方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2010033578A3 (en) * 2008-09-20 2010-05-14 The Board Of Trustees Of The Leland Stanford Junior University Noninvasive diagnosis of fetal aneuploidy by sequencing
WO2013000100A1 (en) * 2011-06-29 2013-01-03 Bgi Shenzhen Co., Limited Noninvasive detection of fetal genetic abnormality
CN103177196A (zh) * 2011-12-22 2013-06-26 上海聚类生物科技有限公司 基于小波变换识别基因组核小体占位边界的方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
Sensitivity of Noninvasive Prenatal Detection of Fetal Aneuploidy from Maternal Plasma Using Shotgun Sequencing Is Limited Only by Counting Statistics;Fan,H.C.等;《PLoS ONE》;20100331;第5卷(第5期);1-5 *

Also Published As

Publication number Publication date
CN103525939A (zh) 2014-01-22

Similar Documents

Publication Publication Date Title
CN103525939B (zh) 无创检测胎儿染色体非整倍体的方法和***
CA2956105C (en) Method and device for determining fraction of cell-free nucleic acids in biological sample and use therof
CN105483229B (zh) 一种检测胎儿染色体非整倍体的方法及***
JP2013509870A5 (zh)
CN105143466B (zh) 通过大规模平行rna测序分析母亲血浆转录组
CN104169929B (zh) 用于确定胎儿是否存在性染色体数目异常的***和装置
CN105825076B (zh) 消除常染色体内和染色体间gc偏好的方法及检测***
CN104951671B (zh) 基于单样本外周血检测胎儿染色体非整倍性的装置
CN106096330B (zh) 一种无创产前生物信息检测分析方法
CN104156631B (zh) 染色体三倍体检验方法
CN104232777A (zh) 同时确定胎儿核酸含量和染色体非整倍性的方法及装置
CN112365927B (zh) Cnv检测装置
CN104830986A (zh) 一种检测胎儿基因信息的方法、装置和***
CN105555970A (zh) 同时进行单体型分析和染色体非整倍性检测的方法和***
EP3023504B1 (en) Method and device for detecting chromosomal aneuploidy
CN107133491A (zh) 一种获取胎儿游离dna浓度的方法
KR101678962B1 (ko) 대규모 병렬형 게놈서열분석 방법을 이용한 비침습적 산전검사 장치 및 방법
WO2018149114A1 (zh) 确定胎儿染色体中微缺失微重复的方法及设备
CN106795551B (zh) 单细胞染色体的cnv分析方法和检测装置
AU2019480813A8 (en) Methods for determining chromosome aneuploidy and constructing classification model, and device
CN106591451A (zh) 测定胎儿游离dna含量的方法及其用于实施该方法的装置
CN112712853A (zh) 一种无创产前检测装置
CN108229099B (zh) 数据处理方法、装置、存储介质及处理器
CN107239676B (zh) 一种针对胚胎染色体的序列数据处理装置
CN103069004B (zh) 一种细胞染色体分析方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
ASS Succession or assignment of patent right

Owner name: CAPITALBIO CORPORATION CO., LTD.

Free format text: FORMER OWNER: GUANGZHOU IGENOMICS CO., LTD.

Effective date: 20140916

C41 Transfer of patent application or patent right or utility model
COR Change of bibliographic data

Free format text: CORRECT: ADDRESS; FROM: 510005 GUANGZHOU, GUANGDONG PROVINCE TO: 102206 CHANGPING, BEIJING

TA01 Transfer of patent application right

Effective date of registration: 20140916

Address after: 102206 Beijing City, Changping District Life Science Park Road No. 18

Applicant after: CAPITALBIO CORPORATION

Address before: 510005, Guangzhou International Biological Island, Guangdong, four spiral Road, No. 1 production zone, fifth, 503 units

Applicant before: GUANGZHOU IGENOMICS CO., LTD.

C14 Grant of patent or utility model
GR01 Patent grant
CB03 Change of inventor or designer information

Inventor after: Mi Qingfeng

Inventor after: Peng Chunfang

Inventor after: Liu Hailiang

Inventor after: He Zheng

Inventor after: Zhang Fen

Inventor after: Chen Yangyi

Inventor before: Mi Qingfeng

Inventor before: Peng Chunfang

Inventor before: Liu Hailiang

Inventor before: He Zheng

Inventor before: Zhang Fen

Inventor before: Chen Yangyi

CB03 Change of inventor or designer information
TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20180416

Address after: 101111 Beijing branch of Beijing economic and Technological Development Zone Street 88 Hospital No. 10 Building Room 101

Patentee after: CAPITALBIO TECHNOLOGY CO., LTD.

Address before: 102206 Beijing City, Changping District Life Science Park Road No. 18

Patentee before: CAPITALBIO CORPORATION