CN110770341A - 非整倍性无创产前筛查方法 - Google Patents

非整倍性无创产前筛查方法 Download PDF

Info

Publication number
CN110770341A
CN110770341A CN201880015541.8A CN201880015541A CN110770341A CN 110770341 A CN110770341 A CN 110770341A CN 201880015541 A CN201880015541 A CN 201880015541A CN 110770341 A CN110770341 A CN 110770341A
Authority
CN
China
Prior art keywords
chromosome
trisomy
region
specific test
zone
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201880015541.8A
Other languages
English (en)
Inventor
C·罗兰
R·欧文
C·斯特罗姆
张克
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Diagnostics Investment Ltd
Quest Diagnostics Investments LLC
Original Assignee
Diagnostics Investment Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Diagnostics Investment Ltd filed Critical Diagnostics Investment Ltd
Publication of CN110770341A publication Critical patent/CN110770341A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/53Immunoassay; Biospecific binding assay; Materials therefor
    • G01N33/5308Immunoassay; Biospecific binding assay; Materials therefor for analytes not provided for elsewhere, e.g. nucleic acids, uric acid, worms, mites
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • G16B20/20Allele or variant detection, e.g. single nucleotide polymorphism [SNP] detection
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids
    • G16B30/10Sequence alignment; Homology search
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids
    • G16B30/20Sequence assembly
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/156Polymorphic or mutational markers
    • CCHEMISTRY; METALLURGY
    • C40COMBINATORIAL TECHNOLOGY
    • C40BCOMBINATORIAL CHEMISTRY; LIBRARIES, e.g. CHEMICAL LIBRARIES
    • C40B20/00Methods specially adapted for identifying library members
    • C40B20/04Identifying library members by means of a tag, label, or other readable or detectable entity associated with the library members, e.g. decoding processes
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N2800/00Detection or diagnosis of diseases
    • G01N2800/36Gynecology or obstetrics
    • G01N2800/368Pregnancy complicated by disease or abnormalities of pregnancy, e.g. preeclampsia, preterm labour
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • G16B20/10Ploidy or copy number detection

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Analytical Chemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Health & Medical Sciences (AREA)
  • Biotechnology (AREA)
  • Biophysics (AREA)
  • Molecular Biology (AREA)
  • Genetics & Genomics (AREA)
  • Organic Chemistry (AREA)
  • Theoretical Computer Science (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Medical Informatics (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Immunology (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Microbiology (AREA)
  • Biochemistry (AREA)
  • Pathology (AREA)
  • General Engineering & Computer Science (AREA)
  • Urology & Nephrology (AREA)
  • Hematology (AREA)
  • Biomedical Technology (AREA)
  • General Physics & Mathematics (AREA)
  • Cell Biology (AREA)
  • Food Science & Technology (AREA)
  • Medicinal Chemistry (AREA)
  • Tropical Medicine & Parasitology (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Investigating Or Analysing Biological Materials (AREA)

Abstract

本公开文本提供了用于胎儿非整倍性的无创产前筛查(NIPS)的方法。本发明方法基于通过下一代测序(NGS)技术分析在孕妇循环中发现的游离胎儿DNA(cff DNA)。特别地,本发明方法分析母体样品中存在的不同的胎儿基因组片段的相对丰度,其中所述片段可以与胎儿基因组的特定染色***置对齐。相对丰度信息指示与正常个体相比特定染色体在胎儿基因组中是否过度表示或表示不足,因此可用于检测胎儿非整倍性。另外,还提供了通过排除假阳性检测来增加NIPS的阳性预测值(PPV)的方法。

Description

非整倍性无创产前筛查方法
相关申请的交叉引用
本申请要求2017年1月11日提交的美国临时申请号62/445,196的权益和优先权,将其披露内容通过引用以其整体并入本文。
技术领域
本公开文本提供了用于胎儿非整倍性的无创产前筛查(NIPS)的方法。本发明方法基于通过下一代测序(NGS)技术分析在孕妇循环中发现的游离胎儿DNA(cff DNA)。特别地,本发明方法分析母体样品中存在的不同的胎儿基因组片段的相对丰度,所述片段可以与胎儿基因组的特定染色***置对齐。相对丰度信息指示与正常个体相比特定染色体在胎儿基因组中是否过度表示或表示不足,因此可用于检测胎儿非整倍性。另外,还提供了通过排除假阳性检测来增加NIPS的阳性预测值(PPV)的方法。
背景技术
本发明总体上涉及无创产前筛查(NIPS)领域,特别是使用在母体血浆中发现的游离胎儿DNA(cff DNA)的NIPS。由于生物学和技术问题,目前的NIPS方法可能产生假阳性结果,促使医生开具通过创伤性手术的进一步诊断检测,例如羊膜穿刺术或绒毛膜绒毛取样(CVS),这些都带有与手术相关的流产和其他并发症的风险。有相当多的女性没有接受此类手术,而是在没有进行额外的检测的情况下基于胎儿非整倍性的高风险的NIPS报告终止了妊娠。因此,本领域需要开发新的NIPS方法,特别是那些具有提高的阳性预测值的方法。
发明内容
在一个方面,本文提供了通过无创产前筛查(NIPS)检测胎儿中染色体非整倍性的假阳性诊断的方法。所述方法包括(a)将被诊断为非整倍体的目标染色体分成多个区,每个区具有染色***置;(b)获得每个区的区特异性测试参数;(c)相对于相应区的染色***置绘制所述区特异性测试参数,以产生所述目标染色体的核型模式图;和(d)当所述核型模式图在所述目标染色体的少于实质部分上显示一致的区特异性测试参数时,检测假阳性诊断。在一些实施方案中,目标染色体是所检查物种的一个或多个染色体。
在一些实施方案中,检测步骤(d)通过当核型模式图显示在至少一个区中与剩余的区相比的区特异性测试参数大规模增加时检测假阳性诊断来执行。特别地,在一些实施方案中,所述大规模增加为至少1.2倍、至少1.5倍、至少2倍、至少2.5倍、至少3倍、至少3.5倍、至少4倍、至少4.5倍、至少5倍、至少5.5倍、至少6倍、至少6.5倍或至少7倍。
在一些实施方案中,所述方法还包括针对目标染色体之外的确认性染色体重复步骤(a)至(d)。特别地,在一些实施方案中,所述确认性染色体是所检查物种的一个或多个染色体。
在一些实施方案中,所述目标染色体的实质部分代表超过目标染色体的约2%、5%、10%、20%、30%、40%、50%、60%、70%、80%或90%。
在一些实施方案中,所述区特异性参数反映了对应于母体测试样品中的区的遗传物质的相对丰度。特别地,在一些实施方案中,获得所述区特异性测试参数包括对来自怀有胎儿的孕妇的母体测试样品的游离DNA测序以提供序列读数。在一些实施方案中,获得所述区特异性测试参数包括将序列读数与包含目标染色体的参考基因组的一个或多个区对齐。在一些实施方案中,获得所述区特异性测试参数包括基于与每个区对齐的序列读数的总数来计算所述区特异性测试参数。在一些实施方案中,所述区特异性测试参数是归一化的区读数计数。在一些实施方案中,所述区特异性测试参数通过NIPS产生。
在一些实施方案中,本发明方法将对于人21三体、人18三体和/或人13三体的NIPS的阳性预测值(PPV)提高至至少30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%或95%。特别地,在一些实施方案中,对于人21三体的PPV提高至至少93%,对于人18三体的PPV提高至至少72%,和/或对于人13三体的PPV提高至至少39%。在一些实施方案中,对于21三体的PPV对于人21三体提高至98%,对于人18三体的PPV提高至92%,和/或对于人13三体的PPV提高至69%。
在一些实施方案中,本发明方法将对于人21三体、人18三体和/或人13三体的NIPS的阳性预测值(PPV)提高至少4%、10%、20%、30%、40%和50%。特别地,在一些实施方案中,人21三体的PPV提高至少4%,人18三体的PPV提高至少20%,和/或人13三体的PPV提高至少30%。
另一方面,本文提供了通过无创产前筛查(NIPS)检测胎儿中染色体非整倍性的假阳性诊断的方法。特别地,所述方法包括(a)将参考染色体分成多个区,每个区具有染色***置;(b)获得每个区的区特异性参数;(c)计算位于确认性染色体上的相应区的区特异性测试参数的第一总和;其中所述确认性染色体不同于被诊断为非整倍体的目标染色体;(d)计算位于一个或多个常染色体上的相应区的区特异性测试参数的第二总和;(e)通过将所述第一总和除以所述第二总和来计算所述确认性染色体的染色体表示值;(f)将所述染色体表示值与参考组进行比较,以产生染色体特异性比较结果;(g)当所述染色体特异性比较结果达到预定阈值时检测假阳性诊断。在一些实施方案中,所述确认性染色体是参考基因组中的一个或多个染色体。
在一些实施方案中,通过对怀有胎儿的孕妇的母体测试样品中的游离DNA进行测序以提供序列读数,来获得每个区的区特异性参数;其中胎儿已被诊断为目标染色体的非整倍体;将序列读数与参考基因组的一个或多个区对齐;基于与每个区对齐的序列读数的总数来计算所述区特异性测试参数。在一些实施方案中,所述区特异性测试参数是归一化的区读数计数。
在一些实施方案中,所述参考组包括从未受影响的妊娠的随机样品中获得的确认性染色体的多个染色体表示值。
在一些实施方案中,步骤(f)通过计算所述测试染色体表示值相对于参考组的Z得分来执行。在一些实施方案中,当Z得分大于4或大于8时达到阈值。
此外,在上述任何实施方案中,胎儿非整倍性可以是完整的或部分的染色体重复或染色体三体,例如人基因组的13三体、18三体或21三体。所述参考基因组可以是人参考基因组,并且胎儿可以是非整倍体嵌合个体。另外,在上述任何实施方案中,所述方法还可以包括在进行步骤(a)之前首先评估母体测试样品中游离DNA的胎儿分数。在一些实施方案中,当胎儿分数少于4%时排除所述母体测试样品。
附图说明
图1显示了进行GC含量校正之前(原始数据)和之后(GC归一化)以及使用专有软件算法进行统计平滑(任务报告(Quest Report))的21、18和13三体的本发明NIPS测定的Z得分。如图所示,即使未经调整,所述测定也为受21三体影响和未受影响的妊娠提供了完全区分。GC校正和统计平滑消除了受18和13三体影响和未受影响的妊娠的实质重叠、以及21三体的增强分离。
图2显示了使用21三体阳性的产前样品构建的21号染色体的核型模式图。每个点代表特定染色体上特定区的归一化计数;Y轴上的整倍体值为1.0。如图所示,整个21号染色体显示出重复的物质。该样品的Z得分为36.96。
图3显示了来自具有母体微重复的患者的21号染色体的核型模式图。
图4显示了图3中患者的母体DNA的微阵列数据。
图5显示了来自具有母体微重复的患者的18号染色体的核型模式图。
图6显示了图5中患者的母体DNA的微阵列数据。
图7显示了来自在DiGeorge区域中具有胎儿微缺失的患者的22号染色体的核型模式图。
具体实施方式
本公开文本提供了用于胎儿非整倍性的无创产前筛查(NIPS)的方法。本发明方法基于通过下一代测序(NGS)技术分析在孕妇循环中发现的游离胎儿DNA(cff DNA)。特别地,本发明方法分析母体样品中存在的不同的胎儿基因组片段的相对丰度,其中所述片段可以与胎儿基因组的特定染色***置对齐。相对丰度信息指示与正常个体相比特定染色体在胎儿基因组中是否过度表示或表示不足,因此可用于检测胎儿非整倍性。另外,还提供了通过排除假阳性检测来增加NIPS的阳性预测值(PPV)的方法。
术语“核型”在本领域中是公认的,并且是指生物体染色体的有组织的概况,表明基因组中每个染色体的拷贝数。不同物种的生物体在其基因组中可能具有不同数量的染色体,因此具有不同的核型。例如,正常人核型包含22对常染色体(常染色体)和一对性染色体(异染色体)。女性的正常核型包含两个X异染色体;而正常的男性同时拥有X和Y异染色体。
术语“倍性”是指物种基因组中包含的染色体组的数量。特别地,单倍体物种具有单组染色体,每条染色体不是一对染色体的一部分。二倍体物种具有每条染色体的两个同源拷贝。通过扩展,如果细胞核是单倍体或二倍体,则细胞可称为单倍体或二倍体,并且如果其体细胞是单倍体或二倍体,则生物体可称为单倍体或二倍体。几乎所有哺乳动物(包括人)都是二倍体生物。
术语“非整倍性”和“非整倍体”是本领域公认的术语,并且指生物体细胞中存在异常数量的染色体,其与该物种通常的核型不同。例如,因为正常人细胞具有46条染色体,包括22对常染色体和1对性染色体,所以具有45或47条染色体而不是通常的46条染色体的人细胞是非整倍体。非整倍性可能是由细胞***过程中的错误引起的,其中形成的“子”细胞具有错误数量的染色体。在某些情况下,存在染色体缺失(单体),而在另一些情况下存在额外的染色体(三体)。单体和三体都是人遗传性疾病的常见原因,包括某些先天性缺陷和癌症。在人中,除了性染色体疾病外,大多数非整倍性病例都会导致流产。活产中最常见的常染色体三体是21号染色体、18号染色体或13号染色体的三体。例如,唐氏综合症是由21号染色体的第三个拷贝的全部或部分存在引起的遗传性疾病。
术语“三体”是指二倍体生物体中的一种非整倍性,其中存在特定染色体的额外拷贝(三个拷贝),而不是正常的一对两个拷贝。术语“单体”还指二倍体生物体中的非整倍性形式,其中存在特定染色体的一个拷贝缺失(仅一个拷贝),而不是正常的一对中两个拷贝。
如本文所用的术语“嵌合”或“嵌合的”是指在同一个体中存在两种或更多种具有不同核型的细胞系。例如,在一些实施方案中,嵌合个体可具有某些非整倍体体细胞群,而其他细胞具有正常核型。
如本文所用的术语“胎儿非整倍性”是指妊娠期胎儿的非整倍性。这种疾病的诊断可以通过侵入性或无创性方法进行。
术语“无创产前检测(NIPT)”和“无创产前筛查(NIPS)”在本文中可互换使用,并且是指基于检测母体样品(例如母体血液样品)中存在的游离胎儿DNA,针对胎儿非整倍性的母体样品检测,例如选择的染色体三体。
如本文所用的术语“侵入性产前检查”是指通过置于孕妇体内含有胎儿的空间的或直接连接胎儿的母体组织(例如子宫、胎盘或脐带)的一个或多个探针对胎儿进行产前检查的方法。已经考虑与本公开文本结合使用的侵入性产前检查包括但不限于羊膜穿刺术和绒毛膜绒毛取样。
如本文所用的术语“染色体重复”是指整个染色体或部分染色体的重复。根据上下文,术语“完整染色体重复”可以指整个染色体的重复,术语“部分染色体重复”可以指染色体的一部分的重复。例如,在一些实施方案中,部分染色体重复是指存在与基因组中特定染色体的超过2%、5%、10%、20%、30%、40%、50%、60%、70%、80%或90%相对应的重复的遗传物质。在其他实施方案中,部分染色体重复是指基因组中特定染色体的遗传物质的数百千碱基对至数十兆碱基对的重复。
如本文所用的术语“染色体缺失”是指整个染色体或部分染色体的缺失。在一些实施方案中,在部分染色体缺失的情况下,基因组可能丢失超过2%、5%、10%、20%、30%、40%、50%、60%、70%、80%或90%的特定染色体。在一些实施方案中,部分染色体缺失是指基因组中特定染色体的遗传物质的数百千碱基对至数十兆碱基对的丢失。
染色体重复或缺失可能是DNA复制或修复机制中各种类型错误的产物,也可能通过染色体偶然捕获遗传元件。如本文所用,染色体的重复或缺失区域可以包含或不包含任何基因。
如本文使用的“基因”是指包含产生RNA所必需的调节和编码序列的DNA序列,所述RNA可以具有非编码功能(例如,核糖体或转移RNA)或可以包括多肽或多肽前体。所述RNA或多肽可以由全长编码序列或编码序列的任何部分编码,只要保留所需的活性或功能即可。尽管核酸序列可以以DNA的形式显示,但是本领域普通的技术人员认识到相应的RNA序列具有与胸腺嘧啶被尿嘧啶取代的相似序列,即T换成U。
如本文所用的术语“染色体变异”是指染色体在物种个体之间的组成和大小轻微变化的现象。例如,拷贝数变异是指观察到的物种基因组的区段重复并且在基因组中的重复数量在群体中的个体之间不同的现象。另外,微重复和微缺失是指染色体变异,其中染色体上的少量遗传物质在个体的基因组中异常复制或缺失。此外,染色体重复或缺失可以在基因组区域的延长范围内发生。根据上下文,染色体变异可能会或可能不会在个体中产生可观察到的表型异常。因此,由于遗传或从头染色体变异,染色体的组成和大小可能在物种的不同个体之间变化。
如本文所用的术语“游离DNA(cfDNA)”是指样品(例如怀孕患者的血浆)中存在的任何自由浮动的DNA。在孕妇血液中发现的游离DNA可能含有源自母亲和胎儿的DNA。如本文所用的术语“游离胎儿DNA(cffDNA)”是指在母体***中自由循环的胎儿DNA,例如在母亲的血流中。通过各种机制,cffDNA可以(例如)源自构成胎盘的滋养细胞。在一些情况下,胎儿DNA可以被片段化并通过胎盘微粒脱落到母体血流中而进入母体血流。在一些情况下,早在妊娠7周时就可以首先在母体血液中观察到cffDNA,并且数量随着妊娠的进展而增加。可以通过母亲静脉穿刺对cffDNA进行取样,并为无创产前诊断和检测提供基础。
如本文所用的术语“胎儿分数(ff)”是指在怀孕母亲的测试样品中发现的来自胎儿的游离DNA的百分比。例如,如果母亲血液样品中发现的10%游离DNA是胎儿来源,则胎儿分数(ff)确定为10%。在一些实施方案中,胎儿分数用作样品质量的参数并用于确定母体样品是否应包括在分析中。特别地,在一些实施方案中,当样品的胎儿分数低于预定阈值时,则排除所述母体样品。在一些实施方案中,所述阈值范围为约1%至约5%。在一些实施方案中,所述阈值为约4%。
如本文所用的“下一代测序(NGS)”是指任何测序方法,其以高通量平行方式(例如,大于103、104、105或更多分子同时测序)确定单个核酸分子的核苷酸序列(例如,在单分子测序中)或克隆扩增的单个核酸分子的代理物。在一个实施方案中,可以通过计数由测序实验产生的数据中其同源序列的相对出现次数来估计文库中核酸种类的相对丰度。下一代测序方法是本领域已知的,并且描述于例如,Metzker,M.Nature BiotechnologyReviews11:31-46(2010)中。
如本文所用,术语“文库”是指核酸序列的集合,例如,来源于全基因组、亚基因组片段、cDNA、cDNA片段、RNA、RNA片段或其组合的核酸集合。在一个实施方案中,部分或全部文库核酸序列包含衔接子序列。所述衔接子序列可以位于一个末端或两个末端。衔接子序列可用于,例如,测序方法(例如,NGS方法)、扩增、逆转录或克隆到载体中。
术语“测序区”或简称“区”在本领域中是公认的,并且是指具有已知对该染色体区域独特的特征DNA序列的染色体区域。因此,区具有对应于染色体上特定区域的染色***置。在各种实施方案中,区可以是长度5千碱基对(kbp)、10kbp、20kbp、30kbp、40kbp、50kbp、70kbp、80kbp、90kbp、100kbp、150kbp、200kbp、300kbp、400kbp或500kbp。
如本文所用的“序列读数”或简称“读数”是指通过测序方法(例如下一代测序(NGS)方法)获得的核酸片段的序列信息。因此,如果序列读数与区的特征序列对齐,则序列读数可以明确地映射到区及其特定的染色***置。术语“区读数计数”或简称为“区计数”是指映射到区的读取总数。在一些实施例中,区读数计数可以是原始的区读数计数或归一化区读数计数。
术语“参考基因组”是指核酸序列数据库,组装为物种的部分或完整遗传结构的代表性实例,例如物种基因组中包含的特定染色体的DNA序列。例如,在一个实施方案中,通过基因组参考组织(GRC)维持和改进人参考基因组。GRC通过构建包含较少基因组缺口的新序列比对来持续改进参考基因组。例如,人参考基因组GRCh38是GRC发布的人参考基因组的第20版。
术语“Z得分”是指所讨论的值(样品值)与数据点所属的数据集之间的关系的数值测量。特别地,Z得分根据数据点集的分布的扩展来测量样品值与分布的中心性之间的差异。在一些实施方案中,分布的中心性可以被测量为数据集的中值或平均值。在一些实施方案中,分布的扩展可以被测量为数据集的标准偏差或中值绝对偏差。更具体地,在一些实施方案中,Z得分指示样品值高于或低于中值多少个中值绝对偏差。特别地,Z得分可以通过z=(X–μ)/σ来计算,其中X表示样品值;μ表示中值;σ表示数据集的中值绝对偏差。因此,z值等于零表示样品值与中值相同。正z值表示样品值大于中值,负Z得分表示样品值小于中值。
如本文所用的术语“核型模式图”是指一个或多个染色体的示意图。核型模式图可以显示染色体的相对大小及其带型,当紧密卷曲的染色体区域被染色并在显微镜下观察时可出现带型。如本文所用,核型模式图还可以显示特征DNA序列(包括但不限于已知的基因序列、标记序列、区序列)到特定染色***置的映射。在一些实施方案中,特征DNA序列到染色***置的映射与分配给该染色***置的值相关联。在一些实施例中,这样的值可以是区读数计数或Z得分。
疾病测试的“阳性预测值(PPV)”与测试的特异性和群体中疾病的患病率成正比。例如,对于患病率为1:100(1%)的疾病,具有100%灵敏度和99%特异性(假阳性率1%)的测试将具有仅50%的PPV,因为每100次测试将有大约1个真阳性和1个假阳性结果。在一些实施方案中,21三体的患病率设定为1:185,18三体为1:470,13三体性为1:1500。
用于检测胎儿非整倍性的某些创伤性手术带有与手术相关的流产和其他并发症的风险。参见例如Tabor等人,“Update on procedure-related risks for prenataldiagnosis techniques.”Fetal Diagn Ther.2010;27:1-7和Benn等人,“Positionstatement from the Aneuploidy Screening Committee on behalf of the Board ofthe International Society for Prenatal Diagnosis.”Prenat Diagn.2013;33:622-629。
因此,在本公开文本的一个方面,提供了使用母体测试样品中包含的游离胎儿DNA进行无创产前筛查的方法。对于无创产前检测,母体测试样品可以在没有物理性侵入身体的含胎儿空间的情况下从孕妇或直接连接到胎儿的任何母体组织获得。母体测试样品的示例性实施方案包括全血样品、血浆样品、组织样品、尿液样品、唾液样品、毛发样品、粪便和可以从孕妇无创地收集的其他类型的生物样品。
特别地,母体测试样品还含有足够量的游离胎儿DNA,从而可以根据本文提供的方法分析胎儿基因组的信息。在某些实施方案中,母体测试样品还可含有源自母体基因组的游离DNA。例如,孕妇血浆中循环的游离DNA可以是胎盘胎儿DNA和母体DNA的混合物。在一些实施方案中,游离胎儿DNA存在于母系起源的DNA的广泛背景中。因此,可归因于胎儿基因组的遗传物质的量的变动可以通过母体贡献来稀释。因此,在一些实施方案中,针对游离DNA的胎儿分数评估母体测试样品。优选地,胎儿分数足以使得可以根据本文提供的方法分析胎儿基因组的遗传组成。
在一些实施方案中,测量母体样品中包含的游离DNA的胎儿分数。胎儿分数低于某一阈值的样品可以从分析中排除。在一些实施方案中,排除了小于约1%胎儿分数的母体测试样品。在一些实施方案中,排除了小于约2%胎儿分数的母体测试样品。在一些实施方案中,排除了小于约3%胎儿分数的母体测试样品。在一些实施方案中,排除了小于约4%胎儿分数的母体测试样品。在一些实施方案中,排除了小于约5%胎儿分数的母体测试样品。
各种方法可用于量化游离胎儿DNA并建立样品的胎儿分数。例如,在一些实施方案中,对于男性胎儿妊娠,可以量化Y染色体特异性序列(例如SRY)的存在以建立母体样品中游离DNA的胎儿分数。在其他实施方案中,对于男性或女性胎儿妊娠,可以定量父本遗传的胎儿单核苷酸多态性(SNP)等位基因以建立胎儿分数。在其他实施方案中,对于男性或女性胎儿妊娠,可以区分胎儿DNA和母体DNA的不同甲基化特征并分别定量以建立胎儿分数。在各种实施方案中,可以使用DNA定量技术,例如实时聚合酶链式反应(RT-PCR)。
在一些实施方案中,建立胎儿分数可以基于下一代测序(NGS)数据。特别地,在一些实施方案中,通过下一代测序技术对母体测试样品中的总游离DNA进行测序以产生多个DNA序列读数。然后,将所述序列读数与位于参考基因组的一个或多个染色体上的不同区对齐。
在一些实施方案中,对于男性胎儿妊娠,胎儿分数可以计算为:
Figure BDA0002188491860000101
其中
Figure BDA0002188491860000102
是染色体X的平均区读数计数,其归一化为所有常染色体的平均区读数计数。
在一些实施方案中,基于测试样品中X染色体表示不足来估计男性胎儿分数。特别地,在一些实施方案中,NGS数据由公开的可靠精确产前无创诊断R包(RAPIDR)处理。在其他实施方案中,X染色体表示不足用非妊娠女性作为两个X染色体拷贝参考,用男性作为单个X染色体拷贝参考或用已知胎儿分数的怀孕样品作为标准对照进行估计。
在一些实施方案中,基于样品中Y染色体过度表示来估计男性胎儿分数。特别地,在一些实施方案中,Y染色体过度表示用非妊娠女性作为Y染色体缺失(0%Y)参考,用男性作为Y染色体存在(100%Y)参考以及用已知胎儿分数的怀孕样品作为标准对照进行估计。
在一些实施方案中,对于女性胎儿妊娠,使用正则化回归模型估计胎儿分数。例如,在一些实施方案中,针对多个男性胎儿妊娠的训练集估计男性胎儿分数。估计的男性胎儿分数用于对胎儿分数建模作为样品的区计数的函数,样品的区计数通过GC偏差校正之前样品的总读数计数归一化。然后所述模型用于估计女性胎儿妊娠的胎儿分数。在一些实施方案中,位于13号染色体、18号染色体、21号染色体、X染色体或Y染色体上的区被排除在建模过程之外。在一些实施方案中,所述模型是正则化线性回归模型。特别地,在一些实施方案中,所述模型是Lasso和弹性网规则化广义线性模型(GLMNET)。在一些实施方案中,使用α参数1的十倍交叉验证来选择具有最小交叉验证误差的λ参数,以用于构建最终模型。
进一步在一些实施方案中,胎儿分数的估计基于如上所述的多于一种方法。例如,在一些实施方案中,将由两种或更多种不同方法给出的胎儿分数估计值平均以产生样品中胎儿分数的最终估计值。
在一些实施方案中,分析母体样品中包含的游离DNA以检测胎儿非整倍性。特别地,在一些实施方案中,母体测试样品是从孕妇无创地收集的。在一些实施方案中,孕妇在先前已确定处于产生非整倍体后代的高风险中。在一些实施方案中,妊娠在先前已确定处于是非整倍体的高风险中。在一些实施方案中,被认为具有高风险的个体或妊娠包括35岁或以上的女性,超声检查结果表明胎儿非整倍性的风险增加,先前的妊娠受到与21、13三体相关的非整倍性或亲本平衡罗伯逊易位的影响以及通过常规第一或第二孕期筛选试验筛选出高风险非整倍性阳性的那些。在一些实施方案中,本发明方法用于检测单胎或双胎妊娠的胎儿非整倍性。
特别地,在一些实施方案中,来自从孕妇获得的母体测试样品的游离DNA用下一代测序技术测序。特别地,在一些实施方案中,使用鸟枪(全基因组范围)大规模平行测序(s-MPS)。在一些实施方案中,s-MPS依赖于母体标本中大量DNA片段的鉴定和计数。MPS用于同时对数百万个全基因组胎儿和母体片段进行测序,并将信息序列映射到所有染色体上的离散位置。因此,例如,如果存在胎儿三体,则对于给定染色体将存在相对过量的计数,并且存在单体缺陷。
在一些实施方案中,对母体测试样品中包含的核酸片段进行测序以产生多个序列读数。在一些实施方案中,多个序列读数与参考基因组的一个或多个区比对,每个区位于参考基因组的染色体上并具有染色***置。通过对映射到区的序列读数的总数进行计数,计算每个区的原始区读数计数。
在一些实施方案中,对原始区读数计数进行归一化以去除诸如个体样品变化、GC排序偏差和由于染色体的高阶结构引起的其他假象等的假象。在各种实施方案中,可以通过如下所述的一个或多个归一化步骤处理相应的原始区读数计数获得归一化的区读数计数。
特别地,在一些实施方案中,原始区读数计数可以通过将原始区读数计数除以样品的常染色体区读数计数的总和进行缩放。在一些实施方案中,通过减去由跨基因组改变GC含量引起的测序偏差来进一步校正缩放的区读数计数,并且结果集中在缩放的常染色体区读数计数的中值处。在一些实施方案中,通过乘以测定中的区总数来进一步缩放校正的区读数计数。
在一些实施方案中,还获得并分析来自可能未受影响的妊娠的参考群体的样品。特别地,对于每个参考样品,如上所述获得并处理原始区读数计数。因此,所述参考群体为针对所讨论的样品分析的每个区提供一组参考区读数计数。在一些实施方案中,基于每个区的参考区读数计数集计算中值。
在一些实施方案中,所讨论的样品的区读数计数也通过相应区的中值参考区读数计数缩放(除以相应区的中值参考区读数计数)。结果以1为中心,并通过减去样品的常染色体区读数计数的中值进一步校正。
在一些实施方案中,高阶假象按照样品的归一化区读数计数相比于从可能未受影响的样品的参考群体确定的归一化区读数计数中的前十个主要成分的回归进行校正。
在一些实施方案中,基于与区对齐的序列读数的总数,为每个区计算区特异性测试参数。在一些实施方案中,所述区特异性测试参数是原始的区读数计数。在其他实施方案中,所述区特异性测试参数是归一化的区读数计数,其通过上述一个或多个归一化步骤处理原始区读数计数而生成。
在一些实施方案中,确定源自样品中个体胎儿染色体的遗传物质的相对丰度用于检测胎儿非整倍性。特别地,在一些实施方案中,计算样品中一个或多个目标染色体的表示。单个染色体的表示水平反映了样品胎儿基因组中存在的单个染色体的相对丰度。特别地,在一些实施方案中,特定目标染chrRepi色体的染色体表示可以计算为
Figure BDA0002188491860000121
其中chrTotalRCi表示位于目标染色体上的区的区特异性参数的总和,∑j= 1...22chrTotalRCj表示位于参考基因组的所有常染体上的区的区特异性参数的总和。
在一些实施方案中,为了确定样品中特定目标染色体是否过表示或表示不足,将样品的染色体表示值与指示正常表示的参考进行比较。特别地,在一些实施方案中,对于从可能未受影响的妊娠的参考群体收集的样品确定目标染色体的表示。然后将所讨论样品的染色体表示值与从参考群体确定的染色体表示值集进行比较。特别地,在一些实施方案中,指示样品染色体表示与参考染色体表示值集之间的关系的染色体特异性Z得分计算如下:
Z=(x-μ)/σ
其中X是样品染色体表示;μ是参考染色体表示集的中值;σ是所述参考染色体表示集的中值绝对偏差(MAD)。
Z得分表示样品值高于或低于平均值多少个标准偏差。因此,在一些实施方案中,Z得分等于或接近于零表示目标染色体的样品染色体表示与未受影响的妊娠中的平均染色体表示相同或非常相似;显著大于零的Z得分表明与未受影响的妊娠相比,样品中目标染色体过表示;并且显著低于零的Z得分表明与未受影响的妊娠相比,样品中目标染色体的表示不足。特别地,在一些实施方案中,Z得分>4表示染色体过表示。在一些实施方案中,Z得分>4表明胎儿染色体三体的高风险。在一些实施方案中,Z得分>3但<8表明对于怀孕患者建议进一步的胎儿非整倍性诊断测试,例如侵入性产前诊断测试。在一些实施方案中,Z得分≥8表示染色体过表示。在一些实施方案中,Z得分≥8表明胎儿染色体三体的高风险。在一些实施方案中,Z得分≥8表明对于怀孕患者建议进一步的胎儿非整倍性诊断测试,例如侵入性产前诊断测试。
母体测试样品中的游离DNA可含有母体和胎儿DNA的混合物。因为存活的非整倍体个体通常具有明显的表型异常,在一些实施方案中,表型正常的孕妇被认为是整倍体。因此,如本数据所表明的染色体表示异常可以合理地归因于胎儿基因组中的异常。
因此,在一些实施方案中,Z得分用作检测胎儿基因组中非整倍性的指示参数。在各种实施方案中,异常可以是染色体三体或单体,或部分染色体重复或缺失。在一些实施方案中,胎儿可以是染色体嵌合。在一些实施方案中,胎儿基因组可具有一个或多个染色体易位。
特别地,在一些实施方案中,Z得分>4表明在胎儿基因组中存在某种遗传异常。在一些实施方案中,Z得分>4表明胎儿染色体三体的高风险。在一些实施方案中,Z得分>3但<8表明对于怀孕患者建议进一步的胎儿非整倍性诊断测试,例如侵入性产前诊断测试。在一些实施方案中,Z得分≥8表明胎儿基因组中存在某种非整倍性。在一些实施方案中,Z得分≥8表明胎儿染色体三体的高风险。在一些实施方案中,Z得分≥8表明对于怀孕患者建议进一步的胎儿非整倍性诊断测试,例如侵入性产前诊断测试。
因此,可以理解,本发明方法提供了检测胎儿非整倍性(例如高风险妊娠的三体或单体)的有效选择。特别地,可以用本发明方法检测的胎儿非整倍性包括但不限于人13三体、18三体、21三体和性染色体异常。
特别地,在一些实施方案中,与传统方法(例如母体血清筛选或颈背透明层检测)相比,本发明NIPS方法提供了提高的阳性预测值(PPV)。更具体地,在各种实施方案中,本发明方法对于21三体、18三体和/或13三体的PPV可以是至少30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%或95%。特别地,在一些实施方案中,本发明方法对于21三体的PPV是至少94%,对于18三体是至少72%,对于13三体是至少39%。
在一些实施方案中,本发明方法的NIPS法进一步考虑到由于个体基因组中存在相对较小的变异,染色体的组成和大小可能因人而异。这些微小变异可能会或可能不会在怀孕个体中产生任何可观察到的表型,但可能通过无创方法影响胎儿非整倍性的诊断。
因此,在一个方面,本发明方法进一步提供了用于区分胎儿非整倍性与母体染色体变异的机制,例如母体拷贝数变异、微重复或微缺失。一些母体染色体变异可能是整体性的,影响母体基因组中的多个或所有染色体。或者,一些母体染色体变异可以是局部的并且与母体基因组中的特定染色体相关。
特别地,母体整体拷贝数异常可能同时影响多个染色体,而具有多个染色体非整倍性的胎儿的情况往往是罕见的。因此,在一些实施方案中,本发明方法提供了用于通过检查胎儿基因组中的多个或所有染色体来检查胎儿基因组核型的机制。特别地,在一些实施方案中,获得样品中一个或多个染色体的染色体表示值,并将其与相应的参考值进行比较,例如从可能未受影响的妊娠估计的预期正常值。在一些实施方案中,计算一个或多个染色体的染色体特异性Z得分。特别地,在一些实施方案中,通过本发明方法检查的一个或多个染色体包括至少一个染色体,所述染色体不是先前已被诊断为受非整倍性影响的目标染色体。在一些实施方案中,所述检查的一个或多个染色体包括胎儿基因组中的所有染色体。
在一些实施方案中,当数据表明包括或加上目标染色体的多个胎儿染色体同时受非整倍性影响时,本发明方法可识别母体贡献并将检测作为假阳性排除。特别地,在一些实施方案中,针对多个染色体中的每一个计算染色体特异性Z得分。特别地,在一些实施方案中,当样品中多个染色体特异性Z得分高于4时,本发明方法将检测作为假阳性排除。特别地,在一些实施方案中,当样品中多个染色体特异性Z得分不小于8时,本发明方法将检测作为假阳性排除。
某些母体染色体变异,例如微重复或微缺失,仅影响染色体的有限区域,而胎儿非整倍性通常影响整个染色体或其大部分。因此,另外地或可替代地,在一些实施方案中,本发明方法提供了通过将观察到的遗传变异的来源精确定位于离散的染色体一个或多个区域来区分胎儿非整倍性与母体贡献的机制。
特别地,在一些实施方案中,当观察到的遗传变异在整个染色体或其实质部分上一致时,本发明方法可以检测目标染色体的非整倍性。另外地或可替代地,在其他实施方案中,当观察到的遗传变异仅源自代表少于目标染色体实质部分的一个或多个区域时,本发明方法可以排除目标染色体的非整倍性为假阳性的检测。
特别地,在一些实施方案中,本发明方法分析位于目标染色体上的区的区特异性测试参数是否在整个或实质部分的染色体上是一致的。在一些实施方案中,通过相比于相应的区的染色***置绘制区特异性测试参数组来生成目标染色体的核型模式图。在一些实施方案中,如果核型模式图在整个目标染色体或其实质部分上显示一致的区特异性测试参数,则本发明方法检测目标染色体的非整倍性。
在一些实施方案中,基于与区对齐的序列读数的总数,为每个区计算区特异性测试参数。在一些实施方案中,所述区特异性测试参数是归一化的区读数计数,其通过上述的一个或多个归一化步骤处理相应的原始区读数计数而获得。
在一些实施方案中,所述目标染色体的实质部分代表超过目标染色体的约2%、5%、10%、20%、30%、40%、50%、60%、70%、80%或90%。在一些实施方案中,一致性表明该组区特异性测试参数之间的差异(如果有的话)在统计上是不显著的。在其他实施方案中,一致性表明该组区特异性测试参数之间的任何差异小于5%、10%或20%。在又其他实施方案中,按照如下确定一组区特异性测试参数是否一致:(a)将残差定义为特定区的区特异性测试参数与目标染色体的所有区特异性测试参数的平均值或中值之间的差异;和(b)计算这些残差的标准偏差。特别地,在一些实施方案中,如果这些残差的标准偏差小于0.15,则确定该组区特异性测试参数是一致的。在一些实施方案中,如果所有残差在标准偏差的1、2或3倍内,则确定该组区特异性测试参数是一致的。在一些实施方案中,如果所有残差在距平均值或中值的±0.15、±0.3或±0.45单位内,则确定该组区特异性测试参数是一致的。
在一些实施方案中,当与染色体的其余区域相比,核型模式图显示小染色体区域中的区特异性测试参数的大规模差异时,检测母体微重复或微缺失。特别地,在一些实施方案中,所述大规模差异指与其他区域相比特定区域的区特异性测试参数至少1.2倍,至少1.5倍、至少2倍、至少2.5倍、至少3倍、至少3.5倍、至少4倍、至少4.5、至少5倍、至少5.5倍、至少6倍、至少6.5倍或至少7倍的增加或减少。
在一些实施方案中,大规模差异定义如下:(a)将残差定义为特定区的区特异性测试参数与目标染色体的所有区特异性测试参数的平均值或中值之间的差异;和(b)计算这些残差的标准偏差。特别地,在一些实施方案中,将大于标准偏差1、2或3倍的残差定义为大规模差异。在一些实施方案中,将距平均值或中值大于±0.15、±0.3或±0.45单位的残差定义为大规模差异。在一些实施方案中,当所述核型模式图显示在染色体的至少一个区中的区特异性测试参数的大规模差异时,检测母体贡献。
在一些实施方案中,当所述核型模式图表现出与正常值相比的区特异性测试参数的小规模增加时,确认胎儿非整倍性。特别地,在一些实施方案中,基于随机的一组未受影响的妊娠来估计正常值。特别地,在一些实施方案中,小规模增加指与正常值相比,区特异性测试参数增加小于1.5倍、小于1.4倍、小于1.3倍、小于1.2倍、小于1.15倍或小于1.1倍。此外,在一些实施方案中,观察到的小规模增加在整个目标染色体或其实质部分上是一致的。特别地,在一些实施方案中,所述目标染色体的实质部分代表超过目标染色体的约2%、5%、10%、20%、30%、40%、50%、60%、70%、80%或90%。在一些实施方案中,一致性表明该组区特异性测试参数之间的差异(如果有的话)在统计上是不显著的。在其他实施方案中,一致性表明该组区特异性测试参数之间的任何差异小于5%、10%或20%。在又其他实施方案中,按照如下确定一组区特异性测试参数是否一致:(a)将残差定义为特定区的区特异性测试参数与目标染色体的所有区特异性测试参数的平均值或中值之间的差异;和(b)计算这些残差的标准偏差。特别地,在一些实施方案中,如果这些残差的标准偏差小于0.15,则确定该组区特异性测试参数是一致的。在一些实施方案中,如果所有残差在标准偏差的1、2或3倍内,则确定该组区特异性测试参数是一致的。在一些实施方案中,如果所有残差在距平均值或中值的±0.15、±0.3或±0.45单位内,则确定该组区特异性测试参数是一致的。
在一个方面,本文提供了用于提高无创产前测试的阳性预测值的方法。特别地,在一些实施方案中,母体测试样品获自怀有胎儿的孕妇,所述胎儿先前已被诊断为一个或多个目标染色体的非整倍体。在一些实施方案中,对母体测试样品中包含的游离DNA进行测序以产生序列读数。在一些实施方案中,序列读数与位于参考基因组的一个或多个染色体上的不同区域对齐。
在一些实施方案中,基于与区对齐的序列读数的总数,为每个区计算区特异性测试参数。在一些实施方案中,所述区特异性测试参数是归一化的区读数计数,其通过上述的一个或多个归一化步骤处理相应的原始区读数计数而获得。
在一些实施方案中,针对与目标染色体不同的至少一个确认性染色体计算染色体特异性Z得分。在一些实施方案中,当至少一个确认性染色体的Z得分大于4时,所述方法将先前的诊断作为假阳性排除。在一些实施方案中,当至少一个确认性染色体的Z得分不小于8时,所述方法将先前的诊断作为假阳性排除。
另外地或替代地,在一些实施方案中,分析位于目标染色体上的相应区的区特异性测试参数组,以确定该组区特异性测试参数是否在整个目标染色体或其实质部分上是一致的。特别地,通过相比于相应的区的染色***置绘制区特异性测试参数组来构建目标染色体的核型模式图。在一些实施方案中,如果核型模式图显示区特异性测试参数在目标染色体的实质部分上不一致,则本发明方法将先前的诊断作为假阳性排除。
特别地,在一些实施方案中,所述目标染色体的实质部分代表超过的标染色体的约2%、5%、10%、20%、30%、40%、50%、60%、70%、80%或90%。在一些实施方案中,一致性表明该组区特异性测试参数之间的差异(如果有的话)在统计上是不显著的。在其他实施方案中,一致性表明该组区特异性测试参数之间的任何差异小于5%、10%或20%。
在又其他实施方案中,按照如下确定一组区特异性测试参数是否一致:(a)将残差定义为特定区的区特异性测试参数与目标染色体的所有区特异性测试参数的平均值或中值之间的差异;和(b)计算这些残差的标准偏差。特别地,在一些实施方案中,如果这些残差的标准偏差小于0.15,则确定该组区特异性测试参数是一致的。在一些实施方案中,如果所有残差在标准偏差的1、2或3倍内,则确定该组区特异性测试参数是一致的。在一些实施方案中,如果所有残差在距平均值或中值的±0.15、±0.3或±0.45单位内,则确定该组区特异性测试参数是一致的。
因此,现在可以理解,本公开文本提供了将先前诊断的胎儿非整倍性作为假阳性排除的方法,从而提高了先前测试的阳性预测值(PPV)。特别地,在一些实施方案中,先前对胎儿非整倍性的测试可以通过目前公开的方法进行。在其他实施方案中,胎儿非整倍性的先前测试可以通过本领域当前可获得的或将来开发的其他方法。可以与本发明方法结合使用的用于检测胎儿非整倍性的示例性方法包括但不限于超声诊断、羊膜穿刺术和用于母体血清中包含的生物标志物的常规第一或第二孕期筛查。在一些实施方案中,对于21三体、18三体和/或13三体,本发明方法可以将NIPS方法的阳性预测值提高至少4%、10%、20%、30%、40%和50%。在一些实施方案中,对于21三体,本发明方法可以将NIPS方法的阳性预测值提高至少4%,特别是对于21三体至少5%。在一些实施方案中,对于18三体,本发明方法可以将NIPS方法的阳性预测值提高至少20%,特别是至少28%。在一些实施方案中,对于13三体,本发明方法可以将NIPS方法的阳性预测值提高至少25%,特别是至少30%。
在一些实施方案中,使用下一代测序(NGS)方法,包括许多不同的现代高通量测序技术。在一些实施方案中,优选能够产生大量区计数的测序方法,因为游离DNA的胎儿分数通常较低,并且指定的DNA片段中的过量或不足很小。在一些实施方案中,使用鸟枪(基因组范围)大规模平行测序(s-MPS)。在一些实施方案中,s-MPS依赖于母体标本中大量DNA片段的鉴定和计数。特别地,在一些实施方案中,同时对数百万个全基因组胎儿和母体片段进行测序,并将信息序列映射到所有染色体上的离散位置。因此,例如,如果存在胎儿三体,则对于给定染色体将存在相对过量的计数,并且存在单体缺陷。
在一些实施方案中,高通量、大规模平行测序采用可逆染料终止子的合成测序。在其他实施方案中,通过连接测序进行测序。在又其他实施方案中,测序是单分子测序。下一代测序技术的实例包括但不限于焦磷酸测序、可逆染料终止子测序、SOLiD测序、离子半导体测序、Helioscope单分子测序等。
Ion TorrentTM(Life Technologies,加利福尼亚州卡尔斯巴德)扩增子测序***采用基于流的方法,所述方法检测在DNA复制中掺入未经修饰的核苷酸期间氢离子释放引起的pH变化。为了与该***一起使用,最初通过产生两侧为测序衔接子的DNA片段产生测序文库。在一些实施方案中,这些片段可以通过乳液PCR在颗粒上克隆扩增。然后将具有经扩增的模板的颗粒置于硅半导体测序芯片中。在复制期间,芯片被一个接一个地核苷酸淹没,并且如果核苷酸互补芯片的特定微孔中的DNA分子,则其将被掺入。当核苷酸通过DNA分子中的聚合酶掺入时,质子自然释放,导致可检测的pH局部变化。然后溶液的pH在该孔中发生变化并且被离子传感器检测。如果模板序列中存在均聚物重复,则将在单个循环中掺入多个核苷酸。这导致相应数量的释放的氢和比例更高的电子信号。
454TM GS FLX TM测序***(Roche,德国)在大规模并行焦磷酸测序***中采用基于光的检测方法。焦磷酸测序使用DNA聚合,一次添加一个核苷酸种类,并通过附着的焦磷酸盐释放所发出的光检测和定量添加到给定位置的核苷酸的数量。为了与454TM***一起使用,将衔接子连接的DNA片段固定在油包水乳液中的小DNA捕获珠上,并通过PCR(乳液PCR)扩增。将每个DNA结合的珠置于皮可滴定板上的孔中,并将测序试剂递送到板的孔中。在测序运行期间,四种DNA核苷酸以固定顺序依次添加在整个皮可滴定板装置上。在核苷酸流动期间,与每个珠结合的数百万拷贝的DNA被平行测序。当将与模板链互补的核苷酸添加到孔中时,核苷酸被掺入到现有的DNA链上,产生由仪器中的CCD相机记录的光信号。
测序技术基于可逆染料终止子:首先将DNA分子附着在载玻片上的引物上并扩增,以形成局部克隆集落。添加四种类型的可逆终止子碱基(RT碱基),并且洗涤掉非掺入的核苷酸。与焦磷酸测序不同,DNA一次只能延伸一个核苷酸。相机拍摄经荧光标记的核苷酸的图像,然后从DNA中化学除去染料和末端3'阻断剂,这允许下一个循环。
Helicos的单分子测序使用DNA片段和添加的poly-A尾衔接子,它们附着在流动池表面。在每个循环中,加入DNA聚合酶和单种经荧光标记的核苷酸,导致表面固定的引物-模板双链体的模板依赖性延伸。读数由Helioscope测序仪执行。在获得平铺整个阵列的图像之后,化学切割和荧光标记的释放允许随后的延伸和成像循环。
合成测序(SBS),如“旧式”染料终止电泳测序,依赖通过DNA聚合酶掺入核苷酸来确定碱基序列。将具有固定衔接子的DNA文库变性为单链并移植到流动池中,然后桥式扩增以在玻璃芯片上形成高密度点阵列。可逆终止子方法使用可逆形式的染料终止子,每次添加一个核苷酸,通过重复去除阻断基团以允许另一个核苷酸的聚合来检测每个位置的荧光。核苷酸掺入的信号可以随所有已经使用的经荧光标记的核苷酸、磷酸盐驱动的光反应和氢离子传感而变化。SBS平台的示例包括Illumina GA和HiSeq 2000。
Figure BDA0002188491860000201
个人测序***(Illumina,Inc.)也采用可逆终止子化学合成测序。
与合成测序方法相反,通过连接方法的测序使用DNA连接酶来确定靶序列。该测序方法依赖于通过模板DNA链上的局部互补性相邻的寡核苷酸的酶促连接。该技术使用固定长度的根据测序位置标记的所有可能的寡核苷酸的划分。对寡核苷酸进行退火和连接,DNA连接酶用于匹配序列的优先连接导致在该位置产生二核苷酸编码的颜色空间信号(通过释放经荧光标记的探针,所述探针对应于沿着寡核苷酸的已知位置的已知核苷酸)。该方法主要由Life Technologies’SOLiDTM测序仪使用。在测序之前,通过乳液PCR扩增DNA。将所得珠(每个珠仅含有相同DNA分子的拷贝)沉积在固体平面基底上。
SMRT测TM序基于合成测序方法。DNA在零模波导(ZMW)(带有位于孔底的捕获工具的小孔状容器)中合成。使用未经修饰的聚合酶(附着于ZMW底部)和在溶液中自由流动的经荧光标记的核苷酸进行测序。以这样的方式构建孔,即仅检测在孔底部发生的荧光。荧光标记在其掺入DNA链中时与核苷酸分离,留下未经修饰的DNA链。
某些测序方法产生由于序列中不同的鸟嘌呤-胞嘧啶(G-C)碱基含量而有偏差的结果。因此,在一些实施方案中,GC测序偏差在数据处理期间校正。根据本公开文本,用于校正GC测序偏差的各种方法可以与本发明方法结合使用。在下面的示例部分中提供了示例性过程。本领域技术人员能够鉴定其他合适的方法,这些方法可以在本领域容易获得或有待将来开发。
实施例
实施例1:测定开发
以下部分描述了用于执行本发明NIPS测定的材料和方法。
1.患者样品采集
在一个实施例中,对于测定开发、检验和验证研究,申请人从孕妇获得样品,所述孕妇来自Sequenom(加利福尼亚州圣地亚哥)、Precision Medicine和知情同意志愿者。对于单胎妊娠,申请人从Sequenom获得了3,750个样品,从Precision Medicine获得了165个样品,从志愿者中获得了10个样品;Sequenom还提供了115对双胎妊娠的样品。所述Sequenom样品计划丢弃并在发送给申请人之前进行了去识别化。来自Precision Medicine的样品使用他们的方案是经知情同意的。志愿者通过西方机构审查委员会(WesternInstitutional Review Board)批准的签字表格提供书面知情同意书,所述委员会专门审查并批准了本研究。本研究是根据赫尔辛基宣言(Declaration of Helsinki)中的原则进行的。
2:下一代测序
在一个实施例中,将全血收集在两个10mL无细胞DNA BCT血液收集管(Streck,内布拉斯加州奥马哈)中,并在室温下运输。在抽取后4天内处理血液管。使用Tecan EVO 200液体处理器(Tecan,瑞士门内多夫)分离这些样品中每一个样品的血浆。Tecan EVO 200液体处理器执行以下活动:将Streck血液管在22℃下以2,500x g离心10分钟,将血浆转移至15mL锥形管,将15mL锥形管在22℃下以3,200x g离心20分钟,将血浆转移至最终的15mL锥形管。然后根据制造商的建议,借助于Kingfisher Flex纯化***(Thermo FisherScientific),使用DynaMax化学(Thermo Fisher Scientific,马萨诸塞州沃尔瑟姆)从4mL血浆中提取游离DNA(cfDNA)。根据制造商的建议,使用
Figure BDA0002188491860000212
UltraTMDNA文库制备试剂盒
Figure BDA0002188491860000211
(New England BioLabs Inc,马萨诸塞州伊普斯威奇)将cfDNA制成测序就绪文库。在PCR期间,使用反向PCR引物将10bp条形码扩增到每个样品上,所有反应使用通用正向引物。通用正向引物序列是:
AATGATACGGCGACCACCGAGATCTACACTCTTTCCCTACACGACGCTCTTCCGATCT;
反向引物是:
CAAGCAGAAGACGGCATACGAGATXXXXXXXXXXGTGACTGGAGTTCAGACGTGTGCTCTTCCGATCT,其中X表示10碱基条形码位置。在SimpliAmp热循环仪(Thermo Fisher Scientific)上进行PCR。PCR条件如下:98℃初始变性30秒,10个循环的98℃变性10秒、65℃退火30秒和72℃延伸30秒,72℃最终延伸5分钟,最后保持4℃。PCR后,根据制造商的建议,使用AgencourtAMPure XP PCR纯化珠(Beckman Coulter,加利福尼亚州布雷亚)纯化PCR产物。AMPure珠与PCR产物的比例为1:1。根据制造商的建议使用Quant-It PicoGreen dsNDA测定试剂盒(Thermo Fisher Scientific)定量纯化的PCR产物,并在Infinate 200PRO微量板读数器(Tecan)上读数。将样品归一化至2nM,并在每个文库中池化12个样品。将文库池变性并进一步稀释至15pM。将5%PhiX对照(Illumina,加利福尼亚州圣地亚哥)加入每个池中。使用来自Illumina的cBot***将池化的文库克隆扩增并结合至高输出流动细胞(Illumina)。通过单次读取36个循环在HiSeq2500***上进行测序,然后进行10个循环以对索引进行测序。生物信息学过程至少需要900万次读取。数据从HiSeq2500***流式传输到Isilon(EMCIsilon,华盛顿州西雅图)服务器,在此数据分析管道自动开始。
申请人在平均测序深度为0.6X在一个方向上使用36个碱基对的读取长度。所有质量得分“Q得分”均>30。
3:胎儿分数估计
在一些实施方案中,使用以下方法基于X染色体表示不足或Y染色体过表示来计算胎儿分数(FF)。
a)胎儿分数估计为
Figure BDA0002188491860000221
其中
Figure BDA0002188491860000222
是染色体X的每个区归一化为常染色体区平均值的平均读数计数。b)申请人使用基于X染色体表示不足的R软件包RAPIDR来估计基于表示不足的X染色体的男性FF。c)基于X染色体表示不足来估计FF,其中非妊娠女性作为两个X染色体拷贝参考,非妊娠男性作为单个X染色体拷贝参考,并且已知的FF样品作为标准对照。d)基于Y染色体过表示来估计FF,其中非妊娠女性作为Y染色体缺失(0%Y)参考,非妊娠男性作为Y染色体存在(100%Y)参考,并且已知的FF样品作为标准对照。为了更好的男性FF估计,将这四个计算的中值用作我们的最终的男性FF,并且这样的四个FF的中值与一组已知的FF样品(共享R2=0.9752(y截距=0))非常相关。
对于女性胎儿,使用正则回归模型估计胎儿分数。简而言之,使用来自已知的男性胎儿的3281个样品的训练组来将胎儿分数(如上所述估计)建模为样品区读数计数的函数,所述样品区读数计数通过样品总读数计数归一化但未校正GC含量。位于13号染色体、18号染色体、21号染色体、X染色体或Y染色体上的区被排除在建模过程之外。所述模型是使用R软件包“glmnet”(版本1.9-8)实施的正则化线性回归模型。使用α参数1的十倍交叉验证来选择具有最小交叉验证误差的λ参数,以用于构建最终模型,所述最终模型随后用于估计女性胎儿的胎儿分数。
使用Y染色体特异性序列计算男性胎儿的胎儿分数。对于女性胎儿,申请人开发了一种专有生物信息学方法。
4:GC校正
某些基因组区域(例如,13号染色体和18号染色体)相对于其他基因组区域富含GC,导致测序偏差,所述偏差可能使映射到那些染色体的读数计数百分比偏斜。因此,在一些实施方案中,关于GC含量和观察到的读数计数之间的关系的大小,进行GC校正以减少由于样品差异引起的可变性。
特别地,与经测序的区的基因组位置相对应的区域的GC含量是从UCSC基因组浏览器(https://genome.ucsc.edu/)中的HG19参考基因组材料获得的。然后通过将GC含量值四舍五入到3个小数位来离散GC含量,使得多个区对应于GC含量的每个唯一值。在GC含量的每个唯一水平确定缩放的(通过总常染色体读数计数缩放的)常染色体区计数的中位数。然后,执行局部多项式回归(loess)来估计作为GC含量的平滑函数的区计数。最后,GC归一化的区计数被计算为缩放的常染色体读数计数的中值加上观察到的读数计数和通过loess回归模型预测的读数的差(残差)。
5:计算染色体特异性Z得分
在一些实施方案中,针对每种目标染色体计算染色体特异性Z得分。特别地,区读数计数(RC)数据首先通过其自己的样品常染色体总读数计数来缩放(除以其自己的样品常染色体总读数计数)。然后使用局部多项式回归拟合R loess函数和hg19数据进行GC校正(参见实施例3)。将pca模型应用于这种归一化的数据来去除高阶假象。特别地,如样品的归一化区读数计数相比于从可能未受影响的样品的参考群体确定的归一化区读数计数中的前十个主要成分的回归所定义,减去高阶假象。
然后,染色体表示被计算为位于目标染色体上的归一化的各区读数计数的总和通过所有常染色体的归一化的各区读数计数的总和缩放(除以所有常染色体的归一化的各区读数计数的总和),特别是
chrTotalRCi:位于目标染色体上的归一化的各区读数计数的总和;和
j=1...22chrTotalRCj:所有常染色体的归一化的各区读数计数的总和(1号染色体到22号染色体)。
然后,每个染色体特异性Z得分计算为
x:样品染色体表示(chrRepi);
μ:染色体表示板中值(即,运行目标样品的板上所有样品中染色体表示值的中值);和
σ:染色体表示中值绝对偏差(MAD),使用可能未受影响的样品的5406个样品的参考集计算。
6:生成染色体核型模式图
在一些实施方案中,为目标染色体生成核型模式图。特别地,原始区读数计数(RC)数据首先通过其自己的样品常染色体总读数计数来缩放(除以其自己的样品常染色体总读数计数)。然后使用局部多项式回归拟合Rloess函数和hg19数据进行GC校正(参见实施例3)。然后,数据以缩放的常染色体区读数计数的中值为中心。然后,进一步通过区的总数来缩放(乘以区的总数)数据。然后通过来自可能未受影响的样品的参考群体的相应归一化区计数的中值来对每个区计数进行缩放(除以来自可能未受影响的样品的参考群体的相应归一化区计数的中值)。然后将数据以1为中心并通过样品的归一化常染色体区计数的中值进行校正(减去样品的归一化常染色体区计数的中值)。如样品的归一化区读数计数相比于从可能未受影响的样品的参考群体确定的归一化区读数计数中的前十个主要成分的回归所定义,减去高阶假象。最后,将得到的归一化的区读数计数相对于相应的区的染色***置作图,来获得染色体核型模式图。
7:NIPS结果的临床确认
对通过参考实验室的临床检测获得的每个阳性NIPS结果获得随访信息。遗传咨询小组与转诊医师联系,以确定妊娠的结果。
实施例2:测定检验和验证
一旦建立了测定的性能参数,就测试了一系列检验样品,包括已知的未受影响的妊娠和已知的非整倍体妊娠。该系列的2,085个样品包括21三体(n=69)、18三体(n=20)和13三体(n=17)。没有未受影响的妊娠Z得分>4且没有受影响的妊娠Z得分<8。在测定检验后,分析了包含552个样品的验证组,包括已知为21三体(n=21)、18三体(n=10)、13三体(n=1)和XO(n=1)阳性的样品。再次,没有未受影响的妊娠Z得分>4且没有受影响的妊娠Z得分<8。
由于检验和验证研究之间的性能没有差异,因此将结果合并用于分析。GC校正的影响对于具有正常的GC含量的21号染色体最小,对于具有中等的增加和GC含量的18号染色体居中,并且对于具有最高GC含量的13号染色体最大(图1)。使用原始数据,Z得分阈值为4,在2,498个未受影响的妊娠和90个21三体样品之间产生绝对区分;没有未受影响的妊娠Z得分>4,并且没有受影响的妊娠Z得分<8。然而,GC校正改进了对13号染色体和18号染色体的区分:没有GC校正,大多数13三体样品的Z得分小于4;GC校正后,所有13三体样品的Z得分均超过8。GC校正还允许完全区分18三体与未受影响的妊娠。因此,在GC校正和生物统计学平滑之后,在受影响和未受影响的妊娠之间提供了100%区分(图1,右图)的所述测定证明了GC校正与统计平滑的组合进一步改进了测定性能。
还分析了来自双胎妊娠的一系列115个样品(其具有已知的非整倍性状态,包括10个21三体、4个18三体和13个13三体样品)作为测定验证的一部分。在GC校正和平滑后,所有具有常染色体三体的样品的Z得分>11并且所有未受影响的妊娠的Z得分<4。总体而言,双胎而不是单胎样品的区分程度更高(数据未显示),尽管预计大多数双胎对于常染色体三体不一致。
作为三体检测的最终验证,从100名知情同意志愿孕妇中获得样品,并在我们的实验室和Sequenom之间分开样品。结果在所有情况下都是一致的。这个系列有99个未受影响的和1个来自由两个实验室预测的怀有胎儿21三体的女性的样品。
为了评估NIPS测定对胎儿性别确定的准确性,在6种不同的测定设置的过程中测试了372个(188个男性)样品。先前已使用Sequenom Maternity21 Plus测定确定了胎儿性别,但未进行表型证实。目前的NIPS测定在除1个样品(其中当预期有一个女性胎儿时结果表明男性胎儿)之外的所有样品中产生了一致的结果。因此,总体准确率为99.7%(371/372)。然而,该样品的胎儿分数(2.75%)低于报告的5%阈值(未显示),并且将提示在临床检测中请求新样品。
上述数据表明,本发明NIPS测定已经过检验和验证,可用于临床实施。
实施例3:临床实施
以下部分描述了示例性临床实施中的本发明NIPS测定的结果。特别地,接受从第10个孕周开始的样品。收到的样品中超过90%来自妊娠第10周和第15周之间。
基于上述检验和验证结果,对于临床实施,Z得分截止值≤4用于未受影响的妊娠,>8用于受影响的妊娠。Z得分>3但是<8提示进一步检查。对前10,000个临床样品的回顾显示在180(1.8%)个中的异常NIPS结果(表1)。21三体的总体阳性率为1.0%,18三体为0.36%,13三体为0.21%,性别非整倍性为0.17%。一个样品对DiGeorge微缺失呈阳性,并且2例有2个异常。在测试的前10,713个样品中,结果无法报告的为94个(0.88%);原因是63例(0.59%)的低胎儿分数和31个样品(0.29%)中无DNA模式信息,未达到质量指标,或其他技术问题。
表1:对无创产前筛查胎儿非整倍性阳性临床样品的随访
Figure BDA0002188491860000261
a根据报告规则的变化,排除重新分类为真阴性的假阳性的PPV。
b重新评估数据显示多种染色体变异。
c双胎妊娠,其中一个胎儿有肿块,感觉是畸胎瘤。
d 1名患有显著肌瘤的患者。
e母体45,X/46,XX。
1:母体微重复
NIPS使用全基因组鸟枪测序(一种涉及DNA片段的测序的方法,其总体上代表几乎所有基因组)进行。这允许产生核型图,其以图形方式表示整个基因组中的Z得分。Snyder等人描述了两例18三体的假阳性NIPS结果,后来被发现是18号染色体母体微重复的结果。拷贝数变异和假阳性的产前非整倍性筛查结果。N.Engl.J.Med.2015;372(17):1639-1645。因此,建立了一个过程,其中对于NIPS获得的每个阳性结果,产生并检查受影响染色体的核型图。对于真正的阳性结果,序列读数在整个染色体中增加。当存在母体微重复时,通过增加数量的序列读数仅染色体的小区域(即,重复的区域)得以表示。所述过程能够在一系列31,278名筛查的孕妇中鉴定出61名女性,其中在13号染色体、18号染色体和21号染色体上发生的母体微重复产生了假阳性结果。
直到申请人确信核型图正确预测了母体微重复,才通过微阵列分析(Affymetrix
Figure BDA0002188491860000271
HD)证实了可疑的微重复。随后,由主治医师自行决定进行母体微阵列分析。遗传咨询师与医生联系并提供报告,其中包括对疑似母体微重复的描述以及确诊性微阵列分析的提供(对保额不足的患者免费)。
例如,在临床试验期间的早期,遇到2例在3和8之间的中间Z得分病例。一例的21三体的Z得分为5.11,另一例的18三体的Z得分为6.93。“假阳性”NIPS结果可能是由于母体微重复,因此染色体核型模式图用于研究这些中间Z得分是否代表母体微重复。图2显示经证实具有21三体的胎儿的典型NIPS结果的核型模式图。在两种病例下,核型模式图清楚地显示重复在受影响的染色体的一小部分中(图3)。在主治医师的许可下,对母体血沉棕黄层细胞进行微阵列分析,其证实了21号染色体(图4)和18号染色体(图5和图6)上的母体微重复。此后,在报告异常结果之前,检查每个具有升高的Z得分的染色体的核型模式图,以确保整个染色体重复并且结果不是由于母体微重复。
微阵列分析显示在所有进行的证实性测试中存在母体微重复。对作为假阳性结果的来源的母体微重复的鉴定可分别将我们的筛查对于21、18和13三体的PPV提高到98%、92%和69%(表2)。通过羊膜细胞的核型和/或微阵列分析证实了21三体的真阳性。特征性超声检查异常的存在证实了13和18三体的一些真阳性。
如果没有来自接生医生或新生儿医生的联系,则认为分娩未受影响。母体双胞胎出生儿都不是三体。没有报告的患有13或18三体的受影响的出生儿,导致NPV为100%。有一个患有21三体的新生儿,导致NPV>99.9999%。
表2:对无创产前筛查胎儿非整倍性阳性临床样品的随访
这些结果表明,本发明NIPS测定可以区分母体微重复与真正的胎儿三体,从而避免由母体重复引起的假阳性结果。
2:母体整体拷贝数异常
在一个案例中,NIPS对21三体产生阳性结果,Z得分为21,但是羊膜穿刺术显示出整倍体胎儿。因此检查了整个基因组的NIPS数据,揭示了多个染色体上的拷贝数变化,所述变化通过3号染色体、9号染色体和21号染色体的Z得分升高和4号染色体、6号染色体和11号染色体的负Z得分(<-8)反映出来。母体有大块肌瘤。子宫肌瘤可将DNA释放到循环中,导致NIPS分析中的人工拷贝数变化。在此病例之后,建立了一个程序来检查阳性NIPS病例的整个基因组,以避免由于整个循环的非整倍性而报告的假阳性结果。对于13号染色体、18号染色体或21号染色体总共有6个具有升高的Z得分的样品,其在几个其他染色体上也具有多个拷贝数异常。所有微阵列原始数据已上传至:http://www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=GSE84810,检索号:GSE84810。
这些结果表明,本发明NIPS测定可以区分母体整体拷贝数异常与真正的胎儿三体,从而避免由母体整体拷贝数变异引起的假阳性结果。
3:嵌合和易位
有一例具有14:21罗伯逊易位的唐氏综合症患者。该病例的Z得分高达30.78,这并不出乎意料,因为大多数21号染色体物质是重复的。另一名患者具有21号染色体中位间Z得分(3.57)。在咨询医生后提交的第二个样品的Z得分为4.22,第三个样品的Z得分为5.57。羊膜穿刺术后羊水细胞的G带分析显示,嵌合21三体具有7个三体细胞和29个整倍体细胞计数。具有高度升高的21号染色体的Z得分(24.43)的病例的羊膜穿刺术表明15个三体细胞和5个整倍体细胞。对于21号染色体,最终的嵌合病例的Z得分为8.41,唐氏综合症的胎儿嵌合通过羊膜穿刺术诊断出来。羊膜细胞核型由另一个实验室进行,我们无法获得所述比率。在Z得分10.79之后,本发明NIPS测定检测到单个13三体嵌合胎儿。该样品具有三体:整倍体细胞比例为16:4。
在所有嵌合案例中,本发明NIPS分析没有预测嵌合现象。当获得有关高风险病例的后续信息时,报告了嵌合。
因为羊水细胞中三体嵌合的百分比可能没有反映绒毛膜中的百分比,所以很难估计我们对于嵌合唐氏综合症的测定的分析灵敏度。然而,这些结果表明,本发明NIPS测定可以检测到具有低至25%三体细胞的胎儿。
4:性染色体非整倍性
母体遗传变异也可能影响性染色体非整倍性筛查。在一例45,X(特纳综合征)阳性的病例中,估计的胎儿分数>50%,并且羊膜穿刺术显示出整倍体胎儿。母体DNA分析显示45,X的母体嵌合。其他三例病例显示NIPS负的胎儿分数;所有3名女性都是47XXX的非嵌合体。除了所述特纳综合征的母体嵌合的单一病例外,所有确认的性非整倍性都被正确鉴别。
这些结果表明,本发明NIPS测定至少能够在母体非嵌合时检测胎儿性染色体非整倍性。
5:双胎病例
对于21三体,四组双胎的Z得分升高。一例妊娠在没有基因检测的情况下导致一双胎之一死亡。在2例妊娠中,双胎之一确诊唐氏综合症。在第三病例中,双胎之一患有畸胎瘤并且两者都具有正常的核型。18三体阳性的双胎之一妊娠未经基因检测而流产。
在本研究中没有获得这些双胎妊娠是单绒毛膜还是双绒毛膜的信息。由于80%的双胎妊娠是双绒毛膜的,因此假设在本病例中也是这种情况。可能会预期双胎三体不一致的Z得分低于单胎,但这似乎并非如此。在得出关于双胎妊娠中循环胎儿DNA的机制的任何结论之前,将需要更多数据。
这些结果表明,本发明NIPS测定可以在如单胎病例那样,在双胎妊娠病例中产生类似的结果。
6:先前可用方法的阳性预测值(PPV)。
进行一项研究来评估先前可用的NIPS方法的阳性预测值。特别地,分析了211个连续样品以及来自最近公开的组合数据,在组合数据集中总共1547个样品(表3)。21三体的累积PPV为91%,18三体为73%,13三体为39%,性染色体非整倍性为49%。这些数字表明对于先前可用的第一代NIPS测试,PPV经过多年并没有提高。Meck及其同事最近报告了在一系列216例样品中的类似PPV结果,这些样品在NIPS之后进行了侵入性检测(参见Meck等人Noninvasive prenatal screening for aneuploidy:positive predictive valuesbased on cytogenetic findings.Am J Obstet Gynecol.2015;213:214.e1-5.)这些数据表明,为了提高NIPS对于非整倍体的PPV,必须进一步降低假阳性率。
表3.第三方实验室进行的无创产前筛查的阳性预测值
Figure BDA0002188491860000301
a基于在Quest Diagnostics进行的侵入性随访检测的结果;NIPS在别处执行。执行的实验室已知在86个样品中,包括Natera(43个样品)、Sequenom(20个)、Ariosa(16个)和Verinata(7个)。
7:本发明方法的阳性预测值(PPV)。
21三体的阳性NIPS结果的确认基于侵入性检测。确认21三体的超声检查结果被排除在外,因为大多数“软”结果缺乏特异性。侵入性检测和异常的超声证据被接受作为18和13三体的确认,因为在两种疾病中都有明确的超声检查结果以确认NIPS结果。
总共有103例妊娠样品为21三体阳性,包括99例单胎和4例双胎妊娠。其中87例成功随访;10名患者待访;以及6例失访。随访的病例中有42例(48%)通过侵入性检查或分娩时的身体检查确认,包括3例双胎妊娠(表1)。除1例21三体外,所有的阳性NIPS结果都被确认,并且所有双胎妊娠均有1个受影响和1个未受影响胎儿。因此,21三体的PPV为98%。所述单个假阳性21三体NIPS结果与多个母体遗传异常相关(如上所述),并且使用新的报告标准不会报告为阳性。因此,根据目前的实践,21三体的PPV将是100%。由于许多妊娠无法确认,这些数据必须视为是初步的。除确诊病例外,21三体NIPS阳性的8例妊娠(7例单胎,双胎之一)经历了自发性流产(表1),这与非整倍体妊娠的增加的自发流产率一致。具有阳性21三体NIPS结果的11名(13%)女性选择不通过侵入性检测确认而终止妊娠,而26名(30%)未经侵入性检测继续妊娠。
在18三体的35例单胎和双胎之一妊娠中,30例成功随访。25例(83%)可获得直接(侵入性检测)或间接(怀疑基于超声检查结果)确认阳性结果。除了2例之外的所有病例都被证实具有18三体,产生了92%的PPV(表1)。一个假阳性结果涉及双胎妊娠,其中双胎之一具有被认为是畸胎瘤的尾骨肿块(如上所述)。鉴于与肿瘤相关的常见染色体异常,该病例应该从NIPS中排除。没有该病例情况下,18三体的PPV将为96%。四名(13%)具有阳性18三体NIPS结果的女性拒绝进一步检测并继续妊娠。在18三体阳性的妊娠中,只有1例自然流产。
二十一个样品为13三体阳性,包括17例(81%)完全随访:9例根据侵入性检测或基于超声检查结果为疑似阳性被确诊阳性,4例为假阳性。因此,13三体的PPV为69%。在4例假阳性病例中,1例涉及子宫肌瘤(如上所述);其他仍然无法解释。可以获得胎盘材料以研究受限胎盘嵌合的可能性。这些病例可能代表消失的双胎或受限的胎盘嵌合,因为它们具有高Z得分且没有整体异常。
这些结果表明,本发明NIPS测定的阳性预测值对于21三体是至少是98%,对于18三体是92%,对于13三体是69%,与常规方法相比显著提高。
8:性染色体非整倍性和微缺失
特纳综合征(45,X)阳性的9个样品(表1)中,有7个可用的随访数据;1个为假阳性(PPV=86%)。这是上述特纳综合征的母体嵌合病例。使用本报告规则,由于胎儿分数>50%,该病例将被报告为疑似母体变异。排除这一点将导致特纳综合征的理论的100%PPV。
47,XXX阳性的5例中,2例有随访信息;这两例都被证实有这种核型。两例Klinefelter综合征阳性,并且获得的单胎基因型证实了47,XXY核型。只有一个样品为47,XYY阳性,但随访信息不可用。只有一例涉及22号染色体DiGeorge区域的微缺失(图7)。所述DiGeorge特异性Z得分为-7。羊膜穿刺术确认所述异常。两个样品有2个异常:1个流产的患有21三体和特纳综合征,另一例具有21和18三体综合征高风险,未收到随访数据。
这些结果表明,本发明NIPS测定能够检测性染色体非整倍性和微缺失,理论上对于特纳综合征100%PPV。
等同物
本发明技术并非受限于本申请中描述的具体实施方案,计划将所述实施方案作为本发明技术的个别方面的一对一说明。如本领域技术人员所明了,可在不背离本技术的精神和范围的情况下,对本技术进行多种修改和改变。本领域技术人员根据前述说明将明了,除了本文中列举的方法和装置以外,在本发明技术范围内的功能上等效的方法和装置。所述修改和改变旨在落于本发明技术的范围内。应理解,本技术不受限于具体方法、试剂、化合物、组合物或生物***,本技术当然是可变的。还应理解,本文中所用术语仅用于描述具体实施方案的目的,而不意图具有限制性。
另外,当本公开文本的特征或方面是按马库什组(Markush group)来描述时,本领域技术人员将意识到,本公开文本也由此是按马库什组的任何个别成员或成员子组来描述。
如本领域技术人员可理解,出于任一和所有目的,特别在提供书面说明方面,本文中公开的所有范围还涵盖任一和所有可能的子范围以及其子范围的组合。任何所列范围都可容易地识别为充分描述相同范围并且使得相同范围能分解为至少相等的二分之一、三分之一、四分之一、五分之一、十分之一等。作为非限制性例子,本文中论述的每个范围可容易地分解为下三分之一、中三分之一和上三分之一等。同样如本领域技术人员可理解,所有诸如“高达”、“至少”、“大于”、“小于”等言辞都包括所述数字并且涉及随后可分解为如上所述的子范围的范围。最后,如本领域技术人员可理解,范围包括每一个别成员。因此,例如,具有1-3个细胞的组是指具有1、2或3个细胞的组。类似地,具有1-5个细胞的组是指具有1、2、3、4或5个细胞的组,等等。
本文所提到或引用的所有专利、专利申请、待决申请和公开案都是通过引用以其整体并入本文,包括所有图形和表格,结合至其与本说明书的明确教导一致的程度。

Claims (34)

1.一种通过无创产前筛查(NIPS)检测胎儿中染色体非整倍性的假阳性诊断的方法,其包括
(a)将被诊断为非整倍体的目标染色体分成多个区,每个区具有染色***置;
(b)获得每个区的区特异性测试参数;
(c)相对于相应区的染色***置绘制所述区特异性测试参数,以产生所述目标染色体的核型模式图;和
(d)当所述核型模式图在所述目标染色体的少于实质部分上显示一致的区特异性测试参数时,检测假阳性诊断。
2.权利要求1的方法,其中步骤(d)通过当所述核型模式图显示在至少一个区中与剩余的区相比的区特异性测试参数大规模增加时检测假阳性诊断来执行。
3.权利要求2的方法,其中所述大规模增加为至少1.2倍、至少1.5倍、至少2倍、至少2.5倍、至少3倍、至少3.5倍、至少4倍、至少4.5倍、至少5倍、至少5.5倍、至少6倍、至少6.5倍或至少7倍。
4.前述权利要求中任一项的方法,其还包括针对所述目标染色体之外的确认性染色体重复步骤(a)至(d)。
5.前述权利要求中任一项的方法,其中所述实质部分代表超过所述目标染色体的约2%、5%、10%、20%、30%、40%、50%、60%、70%、80%或90%。
6.前述权利要求中任一项的方法,其中所述区特异性参数反映了对应于母体测试样品中的区的遗传物质的相对丰度。
7.前述权利要求中任一项的方法,其中获得所述区特异性测试参数包括对来自怀有所述胎儿的孕妇的母体测试样品的游离DNA测序以提供序列读数。
8.前述权利要求中任一项的方法,其中获得所述区特异性测试参数包括将所述序列读数与包含所述目标染色体的参考基因组的一个或多个区对齐。
9.前述权利要求中任一项的方法,其中获得所述区特异性测试参数包括基于与每个区对齐的序列读数的总数来计算所述区特异性测试参数。
10.前述权利要求中任一项的方法,其中所述区特异性测试参数是归一化的区读数计数。
11.前述权利要求中任一项的方法,其中所述区特异性测试参数通过NIPS产生。
12.前述权利要求中任一项的方法,其中所述方法将对于人21三体、人18三体和/或人13三体的NIPS的阳性预测值(PPV)提高至至少30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%或95%。
13.权利要求12的方法,其中对于人21三体的PPV提高至至少93%,对于人18三体的PPV提高至至少72%,和/或对于人13三体的PPV提高至至少39%。
14.权利要求12的方法,其中对于21三体的PPV对于人21三体提高至98%,对于人18三体的PPV提高至92%,和/或对于人13三体的PPV提高至69%。
15.前述权利要求中任一项的方法,其中所述方法将对于人21三体、人18三体和/或人13三体的NIPS的阳性预测值(PPV)提高至少4%、10%、20%、30%、40%和50%。
16.权利要求15的方法,其中对于人21三体的PPV提高至少4%,对于人18三体的PPV提高至少20%,和/或对于人13三体的PPV提高至少30%。
17.前述权利要求中任一项的方法,其中每个区长约50kb。
18.前述权利要求中任一项的方法,其中所述目标染色体是一个或多个染色体。
19.权利要求4的方法,其中所述确认性染色体是一个或多个染色体。
20.一种通过无创产前筛查(NIPS)检测胎儿中染色体非整倍性的假阳性诊断的方法,其包括
(a)对来自怀有所述胎儿的孕妇的母体测试样品的游离DNA测序以提供序列读数;
其中所述胎儿已经通过NIPS被诊断为目标染色体的非整倍体;
(b)将所述目标染色体分成多个区,每个区具有染色***置;
(c)将所述序列读数与一个或多个区对齐;
(d)基于与每个区对齐的序列读数的总数来计算区特异性测试参数;
(e)相对于相应区的染色***置绘制所述区特异性测试参数,以产生所述目标染色体的核型模式图;和
(f)当所述核型模式图在所述目标染色体的少于实质部分上显示一致的区特异性测试参数时,检测假阳性诊断。
21.一种通过无创产前筛查(NIPS)检测胎儿中染色体非整倍性的假阳性诊断的方法,其包括:
(a)将参考染色体分成多个区,每个区具有染色***置;
(b)获得每个区的区特异性参数;
(c)计算位于确认性染色体上的相应区的区特异性测试参数的第一总和;其中所述确认性染色体不同于被诊断为非整倍体的目标染色体;
(d)计算位于一个或多个常染色体上的相应区的区特异性测试参数的第二总和;
(e)通过将所述第一总和除以所述第二总和来计算所述确认性染色体的染色体表示值;
(f)将所述染色体表示值与参考组进行比较,以产生染色体特异性比较结果;
(g)当所述染色体特异性比较结果达到预定阈值时检测假阳性诊断。
22.权利要求21的方法,其中获得所述区特异性测试参数包括对来自怀有所述胎儿的孕妇的母体测试样品的游离DNA测序以提供序列读数。
23.权利要求21或22的方法,其中获得所述区特异性测试参数还包括将所述序列读数与参考基因组的一个或多个区对齐。
24.权利要求21至23中任一项的方法,其中获得所述区特异性测试参数还包括基于与每个区对齐的序列读数的总数来计算所述区特异性测试参数。
25.权利要求24的方法,其中所述区特异性测试参数是归一化的区读数计数。
26.权利要求21至25中任一项的方法,其中所述确认性染色体是所述参考基因组中的一个或多个染色体。
27.权利要求21至26中任一项的方法,其中所述参考组包括从未受影响的妊娠的随机样品中获得的所述确认性染色体的多个染色体表示值。
28.权利要求21至27中任一项的方法,其中步骤(f)通过计算所述测试染色体表示值相对于所述参考组的Z得分来执行。
29.权利要求21至28中任一项的方法,其中当Z得分大于4或大于8时达到所述阈值。
30.权利要求21至29中任一项的方法,其中所述方法还包括在进行步骤(a)之前评估所述母体测试样品中游离DNA的胎儿分数。
31.权利要求30的方法,其还包括当所述胎儿分数小于4%时排除所述母体测试样品。
32.前述权利要求中任一项的方法,其中所述染色体非整倍性是完整或部分染色体重复或染色体三体。
33.前述权利要求中任一项的方法,其中所述染色体非整倍性是人13三体、人18三体或人21三体。
34.前述权利要求中任一项的方法,其中所述胎儿是非整倍体嵌合体。
CN201880015541.8A 2017-01-11 2018-01-10 非整倍性无创产前筛查方法 Pending CN110770341A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201762445196P 2017-01-11 2017-01-11
US62/445,196 2017-01-11
PCT/US2018/013055 WO2018132400A1 (en) 2017-01-11 2018-01-10 Method for non-invasive prenatal screening for aneuploidy

Publications (1)

Publication Number Publication Date
CN110770341A true CN110770341A (zh) 2020-02-07

Family

ID=62840332

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201880015541.8A Pending CN110770341A (zh) 2017-01-11 2018-01-10 非整倍性无创产前筛查方法

Country Status (7)

Country Link
US (1) US20200255896A1 (zh)
EP (1) EP3568472A4 (zh)
CN (1) CN110770341A (zh)
BR (1) BR112019014208A2 (zh)
CA (1) CA3049442A1 (zh)
MX (1) MX2019008320A (zh)
WO (1) WO2018132400A1 (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111951890A (zh) * 2020-08-13 2020-11-17 北京博昊云天科技有限公司 染色体和单基因病同步产前筛查的方法、试剂盒和分析***
CN112037846A (zh) * 2020-07-14 2020-12-04 广州市达瑞生物技术股份有限公司 一种cffDNA非整倍体检测方法、***、储存介质以及检测设备
CN113643755A (zh) * 2021-08-11 2021-11-12 上海小海龟科技有限公司 一种nipt试剂盒阳性率校正方法、装置、计算机设备和介质
CN113744892A (zh) * 2021-09-02 2021-12-03 上海宝藤生物医药科技股份有限公司 胚胎整倍性预测方法、装置、电子设备及存储介质
WO2024140881A1 (zh) * 2022-12-30 2024-07-04 深圳市真迈生物科技有限公司 胎儿dna浓度的确定方法及装置

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2020023509A1 (en) * 2018-07-24 2020-01-30 Affymetrix, Inc. Array based method and kit for determining copy number and genotype in pseudogenes
RU2712175C1 (ru) * 2019-11-14 2020-01-24 Общество с ограниченной ответственностью "НИПТ" (ООО "НИПТ") Способ неинвазивного пренатального скрининга анеуплоидий плода
EP4086356A4 (en) * 2019-12-31 2023-09-27 BGI Clinical Laboratories (Shenzhen) Co., Ltd. METHOD FOR DETERMINING CHROMOSOME ANEUPLOIDY AND CONSTRUCTION CLASSIFICATION MODEL AND APPARATUS
CN113046430B (zh) * 2021-03-15 2022-02-01 北京阅微基因技术股份有限公司 一种染色体非整倍体数目异常的扩增组合物及其应用

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101849236A (zh) * 2007-07-23 2010-09-29 香港中文大学 利用基因组测序诊断胎儿染色体非整倍性
WO2014043763A1 (en) * 2012-09-20 2014-03-27 The Chinese University Of Hong Kong Non-invasive determination of methylome of fetus or tumor from plasma
US20140195164A1 (en) * 2013-01-10 2014-07-10 The Chinese University Of Hong Kong Noninvasive prenatal molecular karyotyping from maternal plasma
US20160217251A1 (en) * 2015-01-23 2016-07-28 The Chinese University Of Hong Kong Combined size- and count-based analysis of maternal plasma for detection of fetal subchromosomal aberrations

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101849236A (zh) * 2007-07-23 2010-09-29 香港中文大学 利用基因组测序诊断胎儿染色体非整倍性
WO2014043763A1 (en) * 2012-09-20 2014-03-27 The Chinese University Of Hong Kong Non-invasive determination of methylome of fetus or tumor from plasma
US20140195164A1 (en) * 2013-01-10 2014-07-10 The Chinese University Of Hong Kong Noninvasive prenatal molecular karyotyping from maternal plasma
US20160217251A1 (en) * 2015-01-23 2016-07-28 The Chinese University Of Hong Kong Combined size- and count-based analysis of maternal plasma for detection of fetal subchromosomal aberrations

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
H. ZHANG等: "Non-invasive prenatal testing for trisomies 21, 18 and 13:clinical experience from 146 958 pregnancies", ULTRASOUND OBSTET GYNECOL, pages 530 - 538 *
MATTHEW W. SNYDER等: "Copy-Number Variation and False Positive Prenatal Aneuploidy Screening Results", pages 1639 - 1645 *

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112037846A (zh) * 2020-07-14 2020-12-04 广州市达瑞生物技术股份有限公司 一种cffDNA非整倍体检测方法、***、储存介质以及检测设备
CN111951890A (zh) * 2020-08-13 2020-11-17 北京博昊云天科技有限公司 染色体和单基因病同步产前筛查的方法、试剂盒和分析***
CN113643755A (zh) * 2021-08-11 2021-11-12 上海小海龟科技有限公司 一种nipt试剂盒阳性率校正方法、装置、计算机设备和介质
CN113643755B (zh) * 2021-08-11 2023-10-13 上海小海龟科技有限公司 一种nipt试剂盒阳性率校正方法、装置、计算机设备和介质
CN113744892A (zh) * 2021-09-02 2021-12-03 上海宝藤生物医药科技股份有限公司 胚胎整倍性预测方法、装置、电子设备及存储介质
WO2024140881A1 (zh) * 2022-12-30 2024-07-04 深圳市真迈生物科技有限公司 胎儿dna浓度的确定方法及装置

Also Published As

Publication number Publication date
EP3568472A1 (en) 2019-11-20
BR112019014208A2 (pt) 2020-03-17
WO2018132400A1 (en) 2018-07-19
CA3049442A1 (en) 2018-07-19
US20200255896A1 (en) 2020-08-13
EP3568472A4 (en) 2020-08-12
MX2019008320A (es) 2019-09-09

Similar Documents

Publication Publication Date Title
CN110770341A (zh) 非整倍性无创产前筛查方法
US10767228B2 (en) Fetal chromosomal aneuploidy diagnosis
KR102184868B1 (ko) 카피수 변이를 판정하기 위한 dna 단편 크기의 사용
JP5659319B2 (ja) 胎児の遺伝的異常の非侵襲的検出
US20190318805A1 (en) Detecting fetal sub-chromosomal aneuploidies
JP6161607B2 (ja) サンプルにおける異なる異数性の有無を決定する方法
US20210130900A1 (en) Multiplexed parallel analysis of targeted genomic regions for non-invasive prenatal testing
US20210090687A1 (en) Methods of quality control using single-nucleotide polymorphisms in pre-implantation genetic screening
EP3662479A1 (en) A method for non-invasive prenatal detection of fetal sex chromosomal abnormalities and fetal sex determination for singleton and twin pregnancies
TWI767888B (zh) 藉由母體血漿dna之淺深度測序以準確定量胎兒dna含量
Gómez-Manjón et al. Noninvasive Prenatal Testing: Comparison of Two Mappers and Influence in the Diagnostic Yield
WO2015181718A1 (en) Method of prenatal diagnosis
TWI489305B (zh) 對胎兒遺傳異常的無創性檢測
GB2564846A (en) Prenatal screening and diagnostic system and method

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 40023960

Country of ref document: HK