CN108778287B - 用于早产结果的早期风险评估的方法和*** - Google Patents

用于早产结果的早期风险评估的方法和*** Download PDF

Info

Publication number
CN108778287B
CN108778287B CN201780018749.0A CN201780018749A CN108778287B CN 108778287 B CN108778287 B CN 108778287B CN 201780018749 A CN201780018749 A CN 201780018749A CN 108778287 B CN108778287 B CN 108778287B
Authority
CN
China
Prior art keywords
abundance
value
values
microbiome
dsr
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201780018749.0A
Other languages
English (en)
Other versions
CN108778287A (zh
Inventor
沙尔米拉·谢卡尔·曼德
***·蒙佐尔·哈克
阿尼班·杜塔
尼什尔·库马尔·平纳
米塔利·麦钱特
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tata Consultancy Services Ltd
Original Assignee
Tata Consultancy Services Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tata Consultancy Services Ltd filed Critical Tata Consultancy Services Ltd
Publication of CN108778287A publication Critical patent/CN108778287A/zh
Application granted granted Critical
Publication of CN108778287B publication Critical patent/CN108778287B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/30ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for calculating health indices; for individual health risk assessment
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B5/00Measuring for diagnostic purposes; Identification of persons
    • A61B5/43Detecting, measuring or recording for evaluating the reproductive systems
    • A61B5/4306Detecting, measuring or recording for evaluating the reproductive systems for evaluating the female reproductive systems, e.g. gynaecological evaluations
    • A61B5/4343Pregnancy and labour monitoring, e.g. for labour onset detection
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B25/00ICT specially adapted for hybridisation; ICT specially adapted for gene or protein expression
    • G16B25/10Gene or protein expression profiling; Expression-ratio estimation or normalisation
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B40/00ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B40/00ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
    • G16B40/20Supervised data analysis
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6888Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for detection or identification of organisms
    • C12Q1/689Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for detection or identification of organisms for bacteria
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/158Expression markers
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A90/00Technologies having an indirect contribution to adaptation to climate change
    • Y02A90/10Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Medical Informatics (AREA)
  • General Health & Medical Sciences (AREA)
  • Biophysics (AREA)
  • Public Health (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biotechnology (AREA)
  • Chemical & Material Sciences (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Molecular Biology (AREA)
  • Databases & Information Systems (AREA)
  • Epidemiology (AREA)
  • Genetics & Genomics (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Analytical Chemistry (AREA)
  • Bioethics (AREA)
  • Evolutionary Computation (AREA)
  • Software Systems (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Artificial Intelligence (AREA)
  • Pathology (AREA)
  • Biomedical Technology (AREA)
  • Organic Chemistry (AREA)
  • Heart & Thoracic Surgery (AREA)
  • Reproductive Health (AREA)
  • Surgery (AREA)
  • Animal Behavior & Ethology (AREA)
  • Veterinary Medicine (AREA)
  • Gynecology & Obstetrics (AREA)
  • Pregnancy & Childbirth (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Primary Health Care (AREA)

Abstract

公开了用于评估怀孕受试者的早产风险的***和方法。现有的早产风险评估方法在妊娠的晚第二个或第三个三个月提供结果,因此可用于医疗建议的时间很少。本文公开的方法和***在妊娠的15周内预测早产风险。从来自怀孕受试者的微生物组样本获得微生物组表征数据。根据微生物组表征数据生成的“微生物分类丰度简档”包含微生物组样本中存在的微生物的丰度值。针对“微生物分类丰度简档”计算“分类构成偏度”值和分布特征值,量化来自微生物分类丰度简档的微生物的丰度值的偏差。基于集合DSR的分布特征值或“分类构成偏度”值确定早产的风险,其中集合DSR包括量化了来自微生物组样本的微生物的丰度值中的偏差的值。

Description

用于早产结果的早期风险评估的方法和***
相关申请的交叉引用
本申请要求2016年2月16日提交的印度临时专利申请号201621005426的优先权,其整体通过引用借此被并入。
技术领域
本文所描述的实施例总体涉及用于怀孕受试者的早产结果的风险评估的方法和***,并且更具体地涉及用于怀孕受试者的早产结果的早期风险评估的基于微生物组的方法。
背景技术
根据世界卫生组织(WHO)最近的估计,早产(即在妊娠的37个完整周之前出生)是导致全球新生儿死亡的主要原因。与痢疾、疟疾或艾滋病相比,由于早产相关并发症导致更多儿童死亡。在妊娠总数的5%-18%中观察到早产(PTD)病例(www.who.int/mediacentre/factsheets/fs363/en/)。与PTD结果相关联的产前和/或产后成本显著较高。PTD通常与母亲以及所分娩的儿童两者的风险相关联。显著部分的早产儿会出现几种危及生命的并发症,包括中度或重度呼吸窘迫、免疫***受损、黄疸、贫血、脑瘫以及视力和听力问题。鉴于此,每年有超过一百万儿童由于早产引起的并发症而死亡,集中于早产的诊断、预测和预防的研究具有很高重要性。用于预测早产风险的物理和/或生物化学诊断标记物很少,然而这些物理和/或生物化学诊断标记物大多适合应用于中期或晚期妊娠阶段。
目前,尚未完全了解导致早产(PTD)的病理-生理事件的级联(cascade)。然而,一些可以潜在地促进健康的足月妊娠结果的干预方法(例如孕酮补剂、宫颈环扎术等)是可用的。鉴于此,能够在妊娠早期准确地指示早产结果的风险/“进展可能性”的诊断标记物具有很大意义。目前,可以在妊娠的各个阶段采用以预测早产结果的风险的多个诊断方法是可用的。然而,其中只有少数适合在妊娠早期(即前三个月)应用。此外,它们的总体准确性(就敏感性和特异性而言)较低使得它们不适合在常规临床实践中使用。此外,可以注意到,在现有的PTB诊断方法中,那些具有相对较好的诊断/预测能力的方法,大多仅适用于妊娠的中期或晚期(即妊娠的第二和第三个三个月)。虽然这种诊断能力(在妊娠的中期或晚期)有助于将孕妇重新安置到适合的医疗环境(其中孕妇可以被更好/持续地监视),但诊断和分娩之间相对较短的持续时间使得难以采取促进足月的健康妊娠的有意义的干预策略。这突出了目前对诊断方法的需求,该方法可以在妊娠的非常“早”期(理想地是前三个月)预测早产结果的可能性。这种“早期”诊断/风险评估程序将为执业医师提供足够的时间来采用可以潜在地/可能促进足月的健康妊娠的可用的干预/监视策略。
此外,评估早产结果风险的许多现有诊断技术依赖于怀孕受试者(a)自身呈现出***感染,(b)在放射学程序中检测到异常,或(c)在更早的分娩中具有早产史。因此,依赖于上述讨论的指标使得这种诊断技术不适用于第一次怀孕或不是由已知风险因素(即***感染和/或“胎儿/子宫”异常)驱动的早产结果的情况。此外,一些现有的诊断方法需要本质上是侵入性的采样技术,从而可能对经受测试的受试者造成/施加身体和/或情感上的不便。
现有的早产风险评估方法的主要缺点在于这些方法仅在妊娠的“后”期(即在妊娠的晚第二个三个月或第三个(即最后的)三个月)提供具有实际效用的诊断结果。因此,受试者很少有时间采取预防性或矫正性医疗建议来减少或避免早产风险。因此,在妊娠早期(特别是妊娠的15周内(即在妊娠中尽可能早))准确预测早产结果的风险极为重要。对早产结果的早期预测为孕妇/受试者(检测到有PTD风险)提供了足够的时间来采取可能会降低或消除早产结果的风险的必要的预防性或矫正性医疗程序。
发明内容
以下描述呈现出本公开的一些实施例的简化概述以提供对这些实施例的基本理解。该概述不是对这些实施例的广泛概要。不旨在识别这些实施例的关键/重要元件或描绘这些实施例的范围。其唯一目的在于以简化的形式呈现一些实施例,作为以下呈现的更详细的描述的前奏。鉴于上文,本文的实施方式提供了用于怀孕受试者的早产结果的早期风险评估的***和方法。
在本公开的一个方面,公开了一种用于评估怀孕受试者的早产风险的方法。为了评估早产风险,从处于妊娠的前15周内或处于妊娠的前三个月内或处于妊娠的第二个三个月内的怀孕受试者获得微生物组样本,并且其中所述怀孕受试者是孕妇。该方法包括由硬件处理器接收微生物组样本的“微生物分类丰度简档(microbial taxonomic abundanceprofile)”。从怀孕受试者获得微生物组样本。微生物分类丰度简档包含微生物组样本中存在的多种微生物中的每种的丰度值。该方法还包括由硬件处理器针对“微生物分类丰度简档”计算“分类构成偏度”值和分布特征值中的至少一个。“分类构成偏度”值和分布特征值量化来自微生物分类丰度简档的多种微生物的丰度值中的偏差。“分类构成偏度”值和分布特征值的计算包括,在步骤(a)中,通过计算来自微生物分类丰度简档的多种微生物的丰度值之和来获得总种群数“M”。此外,在步骤(b)中,该方法包括创建包含来自微生物分类丰度简档的多种微生物中的每种的丰度值的经排序的列表“L”。经排序列表“L”包括存在于“微生物分类丰度简档”中按丰度值的递增次序或递减次序排名的多种微生物中的每种的丰度值。当列表L按丰度值的递增次序排序时,经排序的列表“L”中排名靠前的一个或多个条目对应于“稀疏分类群”,并且经排序的列表“L”中排名垫底的一个或多个条目对应于“优势分类群”,并且当列表L按丰度值的递减次序排序时,经排序的列表“L”中排名靠前的一个或多个条目对应于“优势分类群”,并且经排序的列表“L”中排名垫底的一个或多个条目对应于“稀疏分类群”。此外,在步骤(c)中,该方法包括:计数以下“稀疏分类群”的最小数量(STi),其累积丰度≥总种群计数“M”的i%,其中当列表L按递增次序排序时,丰度值按经排序的列表“L”中每种微生物的递增排名的次序逐渐累积,或者,计数以下“稀疏分类群”的最小数量(STi),其累积丰度≥总种群计数“M”的i%,其中当列表L按递减次序排序时,丰度值按经排序的列表“L”中每种微生物的递减排名的次序逐渐累积,并且其中“i”是整数或分数。此外,在步骤(d)中,在一个选项中,该方法包括:计数以下“优势分类群”的最小数量(DTj),其累积丰度≥总种群计数“M”的j%,其中当所述列表L按递增次序排序时,丰度值按经排序的列表“L”中每种微生物的递减排名的次序逐渐累积,或者在另一选项中,该方法包括:计数以下“优势分类群”的最小数量(DTj),其累积丰度≥总种群计数“M”的j%,其中当所述列表L按递减次序排序时,丰度值按经排序的列表“L”中每种微生物的递增排名的次序逐渐累积,并且其中“j”是整数或分数。此外,在步骤(e)中,重复步骤“c”和“d”以获得针对预定义范围的“i”值和“j”值的STi和DTj的计数,以分别生成两个值集合“ST”和“DT”,其中i和j属于预定义范围内的两个相同的算术级数,并且其中所述算术级数的连续项之间的公差是预定义的整数或预定义的分数值。此外,在步骤(f)中,该方法包括计算集合“DT”和集合“ST”的笛卡尔乘积,以获得包含对应于DTj值和STi值的多个有序对的集合“C”,并且在步骤(g)中,该方法包括通过对集合“C”中的每个有序对而计算(DTj÷STi)来导出集合“DSR”。在获得集合DSR之后,该方法还包括,在步骤(h)中,计算集合“DSR”的分布特征值,其中集合“DSR”的分布特征值包括集合DSR的集中趋势值。此外,在步骤(i)中,该方法包括通过对包括集合“DSR”的集中趋势值的分布特征值应用数学变换来计算“分类构成偏度”值。该方法还包括由硬件处理器基于集合DSR的集中趋势值、集合“DSR”的分布特征值或“分类构成偏度”值中的至少一个来确定怀孕受试者的早产风险。
该方法包括经由微生物组表征平台108,通过应用以下一种或多种技术获得微生物组样本的微生物组表征数据,所述一种或多种技术包括:测序技术、显微镜检查、流式细胞术方法、基于体外培养的方法、一种或多种酶或荧光测定、或涉及对来自复杂微生物种群的信号的光谱鉴定和筛选的一种或多种测定,其中所述微生物组表征数据包括经测序的微生物DNA数据、显微镜成像数据、流式细胞术细胞测量数据、体外培养中生长的微生物的菌落计数和细胞表型数据、信号强度数据。
该方法还包括通过由硬件处理器使用一种或多种分类学分类技术以计算方式分析微生物组表征数据,以生成微生物组样本的“微生物分类丰度简档”。
在另一方面,该方法还包括获得微生物组样本的经测序的微生物DNA数据。获得经测序的微生物DNA数据包括使用至少一种DNA提取技术分离对应于微生物组样本中存在的多种微生物的微生物DNA;并且使用至少一种DNA测序技术对微生物DNA进行测序以获得经测序的微生物DNA数据。该方法还包括通过由硬件处理器使用一种或多种分类学分类技术以计算方式分析经测序的微生物DNA数据,以生成微生物组样本的“微生物分类丰度简档”。
在本公开的另一方面,公开了一种用于评估怀孕受试者的早产风险的***100。***100包括计算***102,所述计算***102还包括硬件处理器202;以及被耦合到硬件处理器202的存储器206。硬件处理器202执行存储在存储器206中的多个模块208。多个模块208包括微生物分类丰度简档生成模块210和计算模块212。计算模块212接收从怀孕受试者获得的微生物组样本的“微生物分类丰度简档”。微生物分类丰度简档包含微生物组样本中存在的多种微生物的丰度值。计算模块212还针对“微生物分类丰度简档”计算“分类构成偏度”值和分布特征值中的至少一个。“分类构成偏度”值和分布特征值量化来自微生物分类丰度简档的多种微生物的丰度值中的偏差。为了计算“分类构成偏度”值和分布特征值,计算模块212在步骤(a)中通过计算来自微生物分类丰度简档的多种微生物的丰度值的总和来获得总种群数“M”。此外,在步骤(b)中,计算模块212创建包含来自微生物分类丰度简档的多种微生物中的每种的丰度值的经排序的列表“L”。经排序的列表“L”包括存在于“微生物分类丰度简档”中按丰度值的递增次序或递减次序排名的多种微生物(即,分类群)中的每种的丰度值。当列表L按丰度值的递增次序排序时,经排序的列表“L”中排名靠前的一个或多个条目对应于“稀疏分类群”并且经排序的列表“L”中排名垫底的一个或多个条目对应于“优势分类群”,而当列表L按丰度值的递减次序排序时,经排序的列表“L”中排名靠前的一个或多个条目对应于“优势分类群”并且经排序的列表“L”中排名垫底的一个或多个条目对应于“稀疏分类群”。此外,在步骤(c)中,计算模块212计数其累积丰度≥总种群计数“M”的i%的“稀疏分类群”的最小数量(STi),其中当列表L按递增次序排序时,丰度值按经排序的列表“L”中每种微生物的递增排名的次序逐渐累积,或者,计数其累积丰度≥总种群计数“M”的i%的“稀疏分类群”的最小数量(STi),其中当列表L按递减次序排序时,丰度值按经排序的列表“L”中每种微生物的递减排名逐渐累积,并且其中“i”是整数或分数。此外,在步骤(d)中,计算模块212计数其累积丰度≥总种群计数“M”的j%的“优势分类群”的最小数量(DTj),其中当列表L按递增次序排序时,丰度值按经排序的列表“L”中每种微生物的递减排名的次序逐渐累积,或者,计数其累积丰度≥总种群计数“M”的j%的“优势分类群”的最小数量(DTj),其中当列表L按递减次序排序时,丰度值按经排序的列表“L”中每种微生物的递增排名逐渐累积,并且其中“j”是整数或分数。此外,在步骤(e)中,计算模块212重复执行步骤(c)和(d),以获得针对预定义范围的“i”值和“j”值的STi和DTj的计数,以分别生成两个值集合“ST”和“DT”,其中i和j属于预定义范围内的两个相同的算术级数,并且其中所述算术级数的连续项之间的公差是预定义的整数或预定义的分数值。此外,在步骤(f)中,计算模块212,计算集合“DT”和集合“ST”的笛卡尔乘积,以获得包含对应于DTj值和STi值的多个有序对的集合“C”。此外,在步骤(g)中,计算模块212通过针对集合“C”中的每个有序对而计算(DTj÷STi)来导出集合“DSR”。此外,在步骤(h)中,计算模块212计算集合“DSR”的分布特征值,其中集合“DSR”的分布特征值包括集合DSR的集中趋势值。此外,在步骤(i)中,计算模块212通过对包括集合“DSR”的集中趋势值的分布特征值应用数学变换来计算“分类构成偏度”值。计算模块212基于集合DSR的集中趋势值、集合“DSR”的分布特征值或“分类构成偏度”值中的至少一个来确定怀孕受试者的早产风险。
***100包括微生物组样本接收器110和微生物组表征平台108。微生物组样本接收器110从怀孕受试者接收微生物组样本。微生物组表征平台108包括测序平台112、显微镜平台114、核酸杂交平台116或细胞分选平台118中的至少一个,以从微生物组样本获得/生成微生物组表征数据。
微生物组表征平台108从微生物组样本接收器110接收微生物组样本。微生物组表征平台(108)通过对微生物组样本应用以下至少一个技术来从微生物组样本中获得微生物组表征数据,其中所述至少一种技术选自包括以下的技术组:测序技术、显微镜检查、流式细胞术方法、基于体外培养的方法、一种或多种酶或荧光测定、或涉及对来自复杂微生物种群的信号的光谱鉴定和筛选的一种或多种测定。微生物组表征数据包括经测序的微生物核酸数据、显微镜成像数据、流式细胞术细胞测量数据、体外培养中生长的微生物的菌落计数和细胞表型数据、以及信号强度数据。
在一个方面,测序平台112从微生物组样本接收器110接收微生物组样本。测序平台112使用至少一种DNA提取技术来分离对应于微生物组样本中存在的多种微生物的微生物DNA。测序平台112还使用至少一种DNA测序技术对微生物DNA进行测序,以获得经测序的微生物DNA数据。微生物分类丰度简档生成模块210使用一种或多种分类学分类技术以计算方式分析经测序的微生物DNA数据,以生成微生物组样本的微生物分类丰度简档。
在本公开的另一方面,公开了一种非暂时性计算机可读介质,其体现可由硬件处理器在计算设备中执行以用于评估怀孕受试者的早产风险的程序。该程序包括用于接收从怀孕受试者获得的微生物组样本的“微生物分类丰度简档”的程序代码,其中微生物分类丰度简档包含微生物组样本中存在的多种微生物中的每个的丰度值。该程序还包括用于针对“微生物分类丰度简档”计算“分类构成偏度”值和分布特征值中的至少一个的程序代码,其中“分类构成偏度”值和分布特征值量化来自微生物分类丰度简档的多种微生物的丰度值的偏差。“分类构成偏度”值和分布特征值的计算包括以下步骤(a)至(i)。在步骤(a)中,通过计算来自微生物分类丰度简档的多种微生物的丰度值之和来获得总种群数“M”。此外,在步骤(b)中,创建包含来自微生物分类丰度简档的多种微生物中的每种的丰度值的经排序的列表“L”,其中所述经排序的列表“L”包括存在于所述微生物分类丰度简档中按丰度值的递增次序或递减次序排名的多种微生物中的每种的丰度值,并且其中,当列表L按丰度值的递增次序排序时,经排序的列表“L”中排名靠前的一个或多个条目对应于“稀疏分类群”并且经排序的列表“L”中排名垫底的一个或多个条目对应于“优势分类群”,而当列表L按丰度值的递减次序排序时,经排序的列表“L”中排名靠前的一个或多个条目对应于“优势分类群”并且经排序的列表“L”中排名垫底的一个或多个条目对应于“稀疏分类群”。此外,在步骤(c)中,计数其累积丰度≥总种群计数“M”的i%的“稀疏分类群”的最小数量(STi),其中当列表L按递增次序排序时,丰度值按经排序的列表“L”中每种微生物的递增排名的次序逐渐累积,或者计数其累积丰度≥总种群计数“M”的i%的“稀疏分类群”的最小数量(STi),其中当列表L按递减次序排序时,丰度值按经排序的列表“L”中每种微生物的递减排名逐渐累积,并且其中“i”是整数或分数。此外,在步骤(d)中,计数其累积丰度≥总种群计数“M”的j%的“优势分类群”的最小数量(DTj),其中当列表L按递增次序排序时,丰度值按经排序的列表“L”中每种微生物的递减排名的次序逐渐累积,或者计数其累积丰度≥总种群计数“M”的j%的“优势分类群”的最小数量(DTj),其中当列表L按递减次序排序时,丰度值按经排序的列表“L”中每种微生物的递增排名逐渐累积,并且其中“j”是整数或分数。此外,在步骤(e)中,重复步骤(c)和(d),以获得针对预定义范围的“i”值和“j”值的STi和DTj的计数,以分别生成两个值集合“ST”和“DT”,其中i和j属于预定义范围内的两个相同的算术级数,并且其中所述算术级数的连续项之间的公差是预定义的整数或预定义的分数值。此外,在步骤(f)中,计算集合“DT”和集合“ST”的笛卡尔乘积,以获得包含对应于DTj值和STi值的多个有序对的集合“C”。此外,在步骤(g)中,通过对集合“C”中的每个有序对而计算(DTj÷STi)来导出集合“DSR”。此外,在步骤(h)中,计算集合“DSR”的分布特征值,其中集合“DSR”的分布特征值包括集合DSR的集中趋势值。此外,在步骤(i)中,通过对包括集合“DSR”的集中趋势值的分布特征值应用数学变换来计算“分类构成偏度”值。该程序还包括用于基于集合DSR的集中趋势值、集合“DSR”的分布特征值或“分类构成偏度”值中的至少一个来确定怀孕受试者的早产风险的程序代码。
该程序还包括以下程序代码,其用于通过由硬件处理器使用一种或多种分类学分类技术以计算方式分析经测序的微生物DNA数据,以生成微生物组样本的“微生物分类丰度简档”。使用测序平台112从微生物组样本获得经测序的微生物DNA数据。该程序还包括以下程序代码,其用于通过由硬件处理器使用一种或多种分类学分类技术以计算方式分析微生物组表征数据,以生成微生物组样本的“微生物分类丰度简档”,其中所述微生物组表征数据从微生物组样本获得。通过对微生物组样本应用至少一种技术来从微生物组样本获得微生物组表征数据,其中所述至少一种技术选自包括以下的技术组:测序技术、显微镜检查、流式细胞术方法、基于体外培养的方法、一种或多种酶或荧光测定、或涉及对来自复杂微生物种群的信号的光谱鉴定和筛选的一种或多种测定。微生物组表征数据包括经测序的微生物核酸数据、显微镜成像数据、流式细胞术细胞测量数据、体外培养中生长的微生物的菌落计数和细胞表型数据、以及信号强度数据。
附图说明
本领域技术人员应理解,本文的任何框图表示体现本主题的原理的说明性***和方法的概念视图。类似地,应理解,任何流程图、流程图表、状态转换图、伪代码等表示可以基本上在计算机可读介质中表示并且因此由计算设备或处理器执行的各种过程,而不管这种计算设备或处理器是否被明确地示出。
参照附图从下列详细描述中将更好地理解本文所提到的实施例,其中:
图1示出了根据本公开的实施例的用于评估怀孕受试者的早产风险的***的网络实施方式。
图2示出了根据本公开实施例的用于评估怀孕受试者的早产风险的***。
图3示出了根据本公开的实施例的用于针对给定多样性度量的给定值集合计算分离程度(ES)的公式。
图4示出了根据本公开一个实施例的用于评估怀孕受试者早产结果的风险的方法。
图5-a和图5-b示出了根据本公开的实施例的用于从怀孕受试者的微生物组样本中存在的多种微生物中的每种的丰度值计算“分类构成偏度”(taxonomic compositionskew,TCS)值的方法,以进一步确定怀孕受试者的早产风险。
具体实施方式
参照在附图中示出并且在下列描述中详细说明的非限制性实施例来更充分地解释本文的实施例及其各种特征和有利细节。本文使用的示例仅旨在促进对以之可以实践本文的实施例的方式的理解,并且进一步使本领域技术人员能够实践本文的实施例。因此,这些示例不应被解释为限制本文的实施例的范围。
根据一个实施例,公开了一种用于评估怀孕受试者的早产(PTD)风险的***和方法。在一个方面,公开了用于定性和定量评估孕妇早产(PTD)风险的***和方法。更具体地,公开了通过分析从处于妊娠的前15周内或妊娠的前三个月内的怀孕受试者获得的微生物组样本来评估PTD风险的***和方法。该***生成微生物组样本的“微生物分类丰度简档”。微生物组样本从怀孕受试者获得,并且“微生物分类丰度简档”包含被识别为存在于微生物组样本中的多种微生物中的每种的丰度值。该***进一步计算分布特征值(诸如集合DSR的集中趋势值和集合DSR的“分类构成偏度”值),其中集合DSR包括量化对应于微生物组样本中存在的多种微生物的丰度值中的偏差的值(以微生物分类丰度简档形式表示)。此外,***基于如此计算的分布特征值或“分类构成偏度”值中的至少一个来确定怀孕受试者的早产风险。该***和方法提供早期风险评估程序,以基于对从处于妊娠的前15周内或妊娠的前三个月内的怀孕受试者收集到的微生物组样本的分析,准确且可靠地预测怀孕受试者的早产风险。因此,从本文公开的方法和***实现的风险评估使得怀孕受试者能够很好地及时地采取预防性或矫正性医疗建议或预防性程序,以降低或消除早产风险。
根据本公开,示出了本公开的一些目的。主要目的在于提供用于针对怀孕受试者的早产结果的早期风险评估的方法和***。在一个实施例中,怀孕受试者是孕妇。更具体地,在妊娠的尽可能早的阶段(例如,当怀孕受试者是孕妇时的妊娠的前三个月)针对怀孕受试者的早产结果提供准确的风险评估。
本公开的另一目的在于提供用于通过量化从怀孕受试者获得的微生物组样本中的微生物的多样性来对怀孕受试者的早产进行早期风险评估的方法和***。更具体地,本公开的目的在于通过从对应于从怀孕受试者获得的微生物组样本的微生物分类丰度简档中量化多种微生物的丰度值的偏差来对怀孕受试者的早产进行早期风险评估。
本公开的另一目的在于提供一种早期诊断程序,其可以基于从处于妊娠的前15周内或处于妊娠的前三个月内的怀孕受试者收集到的微生物组样本而准确且可靠地预测怀孕受试者的早产风险,其中怀孕受试者是孕妇。
本公开的另一目的在于通过根据丰度值量化“分类构成偏度”(TCS)值来评估怀孕受试者的早产(PTD)风险,所述丰度值以微生物分类丰度简档的形式表示,对应于微生物组样本中存在的多种微生物。该方法和***采用TCS值来执行对早产(PTD)结果风险的定性和定量评估。
本公开的另一目的在于通过计算分布特征值(诸如集合DSR的集中趋势值)来评估怀孕受试者的PTD风险,其中集合DSR包括量化对应于微生物组样本中存在的多种微生物的丰度值中的偏差的值(以微生物分类丰度简档形式表示)。该方法和***采用分布特征值(诸如集合DSR的集中趋势值)来提供对早产(PTD)结果风险的定性和定量评估。
本公开的另一目的在于提供一种方法和***,其在妊娠的前15周内或在妊娠的前三个月内预测怀孕受试者对早产结果的预处置,从而使怀孕受试者能够采取可以可能降低或避免早产结果的风险的预防性或矫正性医疗建议或程序。
当结合附图阅读以下描述时,本发明的其他目的和优点将更加显而易见,所述附图并不旨在限制本公开的范围。
根据本公开的实施例,参照图1和图2,描述了用于评估怀孕受试者的早产(PTD)风险的***100。示出了优选实施例,并且在以下示例性***和/或方法的上下文中描述了这些实施例。
然而,应理解,保护的范围被扩展至其中具有消息的这种程序以及计算机可读的装置,这种计算机可读的存储装置包含程序代码装置,其用于当程序在服务器或与移动设备或任何适合的可编程的设备上运行时实施本方法的一个或多个步骤。硬件设备可以是可以被编程的任何种类的设备,包括例如任何种类的像服务器或个人计算机等的计算机,或其任何组合。该设备还可以包括可以是例如像例如专用集成电路(ASIC)、现场可编程门阵列(FPGA)的硬件装置或硬件装置和软件装置的组合,例如,ASIC和FPGA,或者具有硬件模块位于其中的至少一个微处理器和至少一个存储器。因此,该装置可以包括硬件装置和软件装置二者。可以在硬件和软件中实施本文所描述的方法实施例。该设备还可以包括软件装置。可替选地,可以在不同硬件设备上实施这些实施例,例如使用多个CPU。
本文的实施例可以包括硬件元件和软件元件。在硬件中实施的实施例包括但不限于固件、常驻软件、微码等。可以在其他模块或其他模块的组合中实施由本文所描述的各种模块执行的功能。为了本描述的目的,计算机可用的或计算机可读的介质可以是可以包括、存储、通信、传播或传输程序的用于由指令执行***、装置或设备使用或与其连接的任何装置。
介质可以是电、磁、光、电磁、红外或半导体***(或装置或设备)或传播介质。计算机可读的介质的示例包括半导体或固态存储器、磁带、可移动计算机软磁盘、随机存取存储器(RAM)、只读存储器(ROM)、硬磁盘和光盘。光盘当前的示例包括光盘只读存储器(CD-ROM)、可读写光盘(CD-R/W)和DVD。
适于存储和/或执行程序代码的数据处理***包括通过***总线而被直接或间接耦合至存储元件的至少一个处理器。存储元件可以包括在程序代码的实际执行期间采用的本地存储器、大容量存储器和提供对至少一些程序代码的临时存储以减少在执行期间必须从大容量存储器检索代码的次数的高速缓冲存储器。
虽然所描述的***和方法的各方面可以被实施在任何数量的不同计算***、环境和/或配置中,但是在以下示例性***的上下文中描述了实施例。
参照图1,示出了根据本主题的实施例的用于评估怀孕受试者的早产(PTD)风险的***100的网络实施方式。在一个实施例中,***100是计算***102、微生物组表征平台108和微生物组样本接收器110的组合。
***100包括计算***102,但是在一个实施例中,考虑到***100通过计算***102实施来解释本主题,可以理解的是,计算***102也可以被实施为多种计算***,诸如膝上型计算机、台式计算机、笔记本、工作站、大型计算机、服务器、网络服务器、平板电脑、移动电话等。在一个实施方式中,计算***102可以被实施在基于云的环境中。应当理解,计算***102可以由多个用户通过一个或多个用户设备104-1,104-2…104-N(下文中统称为用户104)或驻留在用户设备104上的应用来访问。用户设备104的示例可以包括但不限于便携式计算机、个人数字助理、手持设备和工作站。用户设备104通过网络106被通信地耦合到计算***102。
在一个实施方式中,网络106可以是无线网络、有线网络或其组合。网络106可以被实施为不同类型的网络(诸如内联网、局域网(LAN)、广域网(WAN)、英特网等)中的一个。网络106可以是专用网络或共享网络。共享网络表示使用各种协议(例如,超文本传输协议(HTTP)、传输控制协议/网际协议(TCP/IP)、无线应用协议(WAP)等)来相互通信的不同类型网络的关联。此外,网络106可以包括各种网络设备,包括路由器、网桥、服务器、算设备、存储设备等。
现在参照图2,示出了根据本主题的实施例的计算***102。在一个实施例中,计算***102可以包括至少一个硬件处理器202、输入/输出(I/O)接口204和存储器206。至少一个硬件处理器202可以被实施为一个或多个微处理器、微计算机、微控制器、数字信号处理器、中央处理单元、状态机、逻辑电路和/或基于操作指令而操纵信号的任何设备。除其他能力外,至少一个硬件处理器202被配置为获取并执行被存储在存储器206中的计算机可读指令或模块208。
I/O接口204可以包括各种软件和硬件接口,例如,web接口、图形用户接口等。I/O接口204可以允许***102直接与用户进行交互或通过客户端设备104与用户进行交互。此外,I/O接口204可以使得计算***102能够与诸如web服务器和外部数据服务器(未示出)的其他计算设备进行通信。I/O接口204可以促进各种网络和协议类型中的多种通信,包括有线网络(例如LAN,电缆等),以及无线网络(例如WLAN、蜂窝或卫星等)。I/O接口204可以包括一个或多个端口,以用于将多个设备彼此连接或连接到另一服务器。
存储器206可以包括本领域中已知的任何计算机可读介质或计算机程序产品,包括例如易失性存储器(诸如静态随机存取存储器(SRAM)和动态随机存取存储器(DRAM))和/或非易失性存储器(诸如只读存储器(ROM)、可擦除可编程ROM、闪存、硬盘、光碟、光盘(CD)、数字多功能盘或数字视频光盘(DVD)和磁带)。存储器206可以包括模块208和数据222。
模块208包括执行特定任务或实施特定抽象数据类型的例程、程序、编程指令、对象、组件、数据结构等。在一个实施方式中,模块208可以包括微生物分类丰度简档生成模块210、计算模块212和其他模块220。其他模块220可以包括补充计算***102的应用和功能的程序或编码指令。
除其他外,数据222用作用于存储由模块208和微生物组表征平台108中的一个或多个处理、接收和生成的数据的储存库。数据222还可以包括数据库224和其他数据226。
在一个实施例中,***100包括微生物组表征平台108和微生物组样本接收器110。在一个实施例中,微生物分类丰度简档生成模块210被动态连接到微生物组表征平台108。微生物组表征平台108可以包括测序平台(sequencing platform)112、显微镜平台(114)、核酸杂交平台(116)、细胞分选平台(118)和其他平台(120)中的至少一种。在本公开的一个实施例中,微生物组表征平台108经由微生物组样本接收器110接收从怀孕受试者获得的微生物组样本。
在一个实施例中,为了评估怀孕受试者的早产(PTD)的风险,微生物组样本接收器110接收从怀孕受试者获得的微生物组样本。在一个方面,怀孕受试者是孕妇。在另一方面,怀孕受试者可以是任何雌性胎生怀孕动物。在一个方面,其中怀孕受试者是孕妇,可以在妊娠的前15周内或妊娠的前三个月内的任何时间点处获得微生物组样本。在另一方面,其中怀孕受试者是孕妇,可以在妊娠的前28周内从孕妇获得微生物组样本。在又一方面,其中怀孕受试者是孕妇,可以在妊娠的前37周内从孕妇获得微生物组样本。在另一方面,可以在整个妊娠期期间的任何时间点处从怀孕受试者收集微生物组样本,以用于评估PTD结果的风险。在一个方面,微生物组样本是怀孕受试者的***拭子样本。从怀孕受试者的口腔、皮肤、肠、***或任何其他身体部位获得生物组样本。从怀孕受试者获得的微生物组样本可以是以下中的至少一个:***拭子样本、***样本、宫颈拭子样本、***拭子(包括***穹窿的拭子样本)、尿液样本、羊水样本、血液样本(全血样本)、血清样本、血浆样本、胎盘拭子、脐带拭子、粪便样本、皮肤拭子、口腔拭子、唾液样本、牙周拭子、咽喉拭子、鼻拭子、囊泡液样本、鼻咽拭子、鼻孔拭子、结膜拭子、生殖器拭子、直肠拭子、气管抽吸物以及支气管拭子。
此外,在另一实施例中,可以在整个妊娠期期间的不同时间点处从怀孕受试者收集多种微生物组样本。早产具有如现有技术中所描述的含义。一般而言,根据定义,早产是在“胎儿活力”日期和妊娠的第37周末尾之间发生的分娩,其中“胎儿活力”被定义为胎儿在自然出生或诱发出生后在子宫外存活的可能性。胎儿活力通常在妊娠的约7个月(28周完成)时进行,但在一些情况下,胎儿活力可能更早发生,甚至在妊娠的24周完成。早产给予婴儿在子宫中发育较少的时间。
在本公开的一个实施例中,微生物组表征平台(108)从微生物组样本接收器110接收微生物组样本,并且从微生物组样本获得微生物组表征数据。微生物组表征平台(108)通过对微生物组样本应用至少一个技术来从微生物组样本中获得微生物组表征数据,其中所述至少一种技术包括测序技术、显微镜检查、流式细胞术方法、基于体外培养的方法、一种或多种酶或荧光测定、或涉及对来自复杂微生物种群的信号的光谱鉴定和筛选的一种或多种测定。微生物组表征数据包括经测序的微生物DNA数据、显微镜成像数据、流式细胞术细胞测量数据、体外培养中生长的微生物的菌落计数和细胞表型数据、以及信号强度数据。本领域技术人员认识到,存在许多技术可用于从微生物组样本中获得微生物组表征数据,并且因此这里不再详细描述。
微生物组表征平台(108)包括测序平台(112)、显微镜平台(114)、核酸杂交平台(116)或细胞分选平台(118)中的至少一个,以从微生物组样本获得/生成微生物组表征数据。各种微生物组表征平台在相关的研究领域中被广泛实践并且已经被很好地建立,因此没有详细描述。
在一个实施例中,微生物组表征平台(108)包括测序平台112,并且测序平台112从微生物组样本接收器110接收微生物组样本,其中微生物组样本从怀孕受试者获得。测序平台110使用至少一种DNA提取技术来分离对应于微生物组样本中存在的多种微生物的微生物DNA。在分离微生物DNA后,测序平台112使用至少一种DNA测序技术对微生物DNA进行测序以获得经测序的微生物DNA数据。测序技术可以选自下一代测序技术。下一代测序技术可以包括全基因组鸟枪法(WGS)测序技术、基于片段库的测序技术、配对库、基于双端库的测序技术或其组合。本领域技术人员认识到存在多个用于DNA测序的方法,并且因此这里不再详细描述。
在一个方面,测序平台112根据微生物DNA对细菌16S rRNA标记基因进行扩增和测序,其中微生物DNA提取自微生物组样本。在另一方面,测序平台112可以根据微生物DNA对细菌23S rRNA标记基因进行扩增和测序。测序平台可以使用下一代测序技术来根据微生物DNA对细菌16S rRNA或23S rRNA标记基因的全长或特定可变区域进行测序。此外,在另一方面,可以根据微生物DNA对不同于细菌16S rRNA和23S rRNA标记基因或除细菌16S rRNA和23S rRNA标记基因之外还有的一个或多个***发育(phylogenetic)标记基因进行扩增和测序。测序平台112将经测序的微生物DNA数据提供给微生物分类丰度简档生成模块210。
在另一实施例中,显微镜平台114可以从微生物组样本接收器110接收从怀孕受试者获得的微生物组样本。显微镜平台114被用于执行自动或半自动显微镜检查或成像,其中可以从显微镜成像数据计算接收到的微生物组样本中存在的微生物细胞的数量和类型。
在又一实施例中,核酸杂交平台116可以接收从怀孕受试者获得的微生物组样本。核酸杂交平台116从微生物组样本接收器110接收微生物组样本。核酸杂交平台116执行来源于微生物组样本中存在的总微生物核酸含量的短单链核酸序列与预先合成的核酸序列探针阵列(其用作特定微生物分类群的标记)的杂交,其中使用诸如X射线、放射自显影或显色方法的成像技术来捕获和可视化杂交事件,并且其中可以从成像数据计算微生物组样本中存在的微生物细胞的数量和类型。
在又一实施例中,细胞分选平台118可以接收从怀孕受试者获得的微生物组样本。细胞分选平台118从微生物组样本接收器110接收微生物组样本。细胞分选平台118执行基于体外培养的方法、一种或多种酶或荧光测定、或涉及对来自复杂微生物种群的信号的光谱鉴定和筛选的一种或多种测定,以获得微生物组表征数据(诸如在体外培养物中生长的微生物的菌落计数和细胞表型数据以及信号强度数据)。
在又一实施例中,其他平台120可以接收从怀孕受试者获得的微生物组样本。其他平台120可以对微生物组样本执行本领域技术人员已知的一种或多种微生物组表征征技术,以获得微生物组表征数据。在又一实施例中,其他平台120可以接收从怀孕受试者获得的微生物组样本。其他平台执行一种或多种微生物组表征技术以获得从其可以计算出接收到的微生物组样本中存在的微生物细胞的数量和类型的数据。
在本公开的另一实施例中,微生物分类丰度简档生成模块210通过分析从微生物组表征平台(108)接收到的微生物组表征数据,生成微生物组样本的“微生物分类丰度简档”。微生物分类丰度简档生成模块210由硬件处理器使用一种或多种分类学分类技术以计算方式分析微生物组表征数据,以生成微生物组样本的“微生物分类丰度简档”。计算模块212从微生物分类丰度简档生成模块210接收“微生物分类丰度简档”。
根据本公开的另一实施例,微生物分类丰度简档生成模块210由硬件处理器使用一种或多种分类学分类技术以计算方式分析经测序的微生物DNA数据,以生成“微生物分类丰度简档”。“微生物分类丰度简档”包括指示对应于微生物组样本的经测序的微生物DNA数据中存在的多种微生物的各种单独“分类群(taxonomic group)”的丰度的值。微生物分类丰度简档包含微生物组样本中存在的多种微生物中的每种的丰度值。在一个实施例中,使用基于分配的分类学分类(分箱)方法来生成“微生物分类丰度简档”。基于分配的分类学分类(分箱)方法可以涉及将来自经测序的微生物DNA数据的序列与现有的参考序列数据库进行比较和/或经测序的微生物DNA数据与现有的参考序列数据库的构成水平相似性。在一个示例中,可以通过将DNA序列分离成操作分类单位(OTU),以计算方式分析对应于16S rRNA标记基因、23S rRNA标记基因或任何其他***发育标记基因中的至少一个的经测序的微生物DNA数据,来生成“微生物分类丰度简档”,并且分离成“操作分类单位”(OTU)基于对序列的聚类。对序列的聚类进一步基于操作分类单位(OTU)的序列水平相似性。
在另一实施例中,可以通过基于DNA序列的构成相似性对DNA序列进行分离或聚类或者通过将经测序的微生物DNA数据与现有的参考序列数据库进行比较,而以计算方式分析对应于***发育标记基因或对应于微生物组样本中存在的多种微生物的微生物DNA的全基因组鸟枪法(WGS)序列数据的经测序的微生物DNA数据,来生成“微生物分类丰度简档”。计算模块212从微生物分类丰度简档生成模块210接收“微生物分类丰度简档”。
在接收到“微生物分类丰度简档”之后,计算模块212针对“微生物分类丰度简档”计算分布特征值和“分类构成偏度”值。“分类构成偏度”值和分布特征值量化来自微生物分类丰度简档的多种微生物的丰度值中的偏差。下面解释“分类构成偏度”值和分布特征值的计算。
为了针对对应于微生物组样本中存在的多种微生物的“微生物分类丰度简档”计算“分类构成偏度”值和分布特征值,在步骤(a)中,计算模块212通过计算来自微生物分类丰度简档的多种微生物的丰度值的总和来获得总种群计数“M”。
此外,在步骤(b)中,计算模块212根据“微生物分类丰度简档”创建各种单独分类群(存在于微生物组样本中)的列表“L”。列表“L”被创建为包含来自微生物分类丰度简档的多种微生物中的每种的丰度值。以下将单独分类群称为与来自微生物组样本的每种微生物相关联的“分类单元/分类群(taxon/taxa)”。此外,在步骤b中,计算模块212将包含来自微生物分类丰度简档的多种微生物的丰度值的列表“L”进行排序以创建经排序的列表L。经排序的列表“L”包括存在于“微生物分类丰度简档”中按丰度值的递增次序或递减次序排名的多种微生物中的每种的丰度值,因此列表L分别按丰度值的递增次序或按丰度值的递减次序进行排序。当列表L按丰度值的递增次序排序时,经排序的列表“L”中的一个或多个排名靠前的条目对应于“稀疏分类群”,并且经排序的列表“L”中的一个或多个排名垫底的条目对应于“优势分类群”。当列表L按丰度值的递减次序排序时,经排序的列表“L”中的一个或多个排名靠前的条目对应于“优势分类群”,并且经排序的列表“L”中的一个或多个排名垫底的条目对应于“稀疏分类群”。
在步骤(c)中,计算模块212计数其累积丰度≥总种群计数“M”的i%的“稀疏分类群”的最小数量(STi),其中当列表L按递增次序排序时,丰度值按经排序的列表“L”中每种微生物的递增排名的次序逐渐累积。否则,计算模块212计数其累积丰度≥总种群计数“M”的i%的“稀疏分类群”的最小数量(STi),其中当列表L按递减次序排序时,丰度值按经排序的列表“L”中每种微生物的递减排名的次序逐渐累积。这里,“i”是整数或分数。
此外,在步骤(d)中,计算模块212计数其累积丰度≥总种群计数“M”的j%的“优势分类群”的最小数量(DTj),其中当列表L按递增次序排序时,丰度值按经排序的列表“L”中每种微生物的递减排名的次序逐渐累积。否则,计算模块216计算其累积丰度≥总种群计数“M”的j%的“优势分类群”的最小数量(DTj),其中当列表L按递减次序排序时,丰度值按经排序的列表“L”中每种微生物的递增排名的次序逐渐累积。这里,“j”是整数或分数。
此外,在步骤(e)中,计算模块212重复执行如上所述的步骤c和d,以获得针对预定义范围的“i”值和“j”值的STi和DTj的计数,以分别生成两个值集合“ST”和“DT”。这里,i和j属于预定义范围内的两个相同的算术级数,并且其中算术级数的连续项之间的公差是预定义的整数或预定义的分数值。在一个示例中,集合ST和集合DT分别被示出在下面的等式(1)和(2)中。
ST={ST1,ST2,ST3,…ST50}…………等式(1),其中,根据定义,STi是非零整数,并且ST(i+1)≥STi,并且“i”在1到50的范围内变化(使得0<i≤50)。DT={DT1,DT2,DT3,…DT50}…………等式(2),其中,根据定义,DTj是非零整数,并且DT(j+1)≥DTj,并且“j”在1到50的范围内变化(使得0<j≤50)。
在一个方面,“i”值和“j”值的预定义范围在0到50之间(使得0<i≤50且0<j≤50)。在另一方面,“i”值和“j”值的预定义范围在0到100的范围内(使得0<i≤100且0<j≤100)。i和j的预定义范围被定义为使得i+j等于100。
此外,在步骤(f)中,计算模块212计算集合“DT”和集合“ST”的笛卡尔乘积,以获得包含对应于DTj值和STi值的多个有序对的集合“C”。
在一个示例中,参考来自等式(1)和(2)的集合ST和集合DT,计算集合“ST”和“DT”的笛卡尔乘积以获得集合“C”。因此,参考等式1和2以及步骤(f),如下面的等式(3)所示,集合“C”包含对应于DTj值和STi值的2500个对(即有序对)。在另一实施例中,集合ST和集合DT的笛卡尔乘积中的有序对的数量可以取决于集合ST和集合DT的大小。
C=DT×ST={(DTj,STi)|其中DTj∈DT且STi∈ST且“i”和“j”是正整数≤50}…………等式(3)
在另一实施例中,累积丰度之间的差异(在生成连续的STi和/或DTj值时计算)可以具有除1之外的任何适当的分数值或整数值。例如,在替代实施方式中,其中i和j的最大值是50,集合ST可以包含100个STi值(其中i=0.5,1,1.5,2,...,50)并且集合DT可以包含100个DTj值(其中j=0.5,1,1.5,2,..,50)。在另一示例中,集合ST和集合DT的笛卡尔乘积中的有序对的数量可以取决于集合ST和集合DT的大小。
此外,在步骤(g)中,计算模块212基于来自集合C的值DTj和STi导出集合“DSR”。在一个实施例中,在步骤(g)中,计算模块212通过针对集合“C”中的每个有序对而计算(DTj÷STi)来导出集合“DSR”。如下面的等式(4)所示,导出包括通过针对集合“C”中的每个有序对而计算(DTj÷STi)来获得的值的集合“DSR”。因此,如下面的等式(4)所示,集合“DSR”包括通过针对集合“C”中的每个有序对将DTj值除以STi值而获得的值。
DSR={(DTj÷STi)|其中(DTj,STi)∈C,并且“i”和“j”是正整数≤50}…………等式(4)
此外,在步骤(h)中,计算模块212计算集合“DSR”的分布特征值。集合“DSR”的分布特征值包括集合DSR的集中趋势值。集合DSR的分布特征值可以包括以下中的一个:集合DSR的最大值、集合DSR的最小值、集合DSR的方差、集合DSR的偏度、或者表征集合DSR中的值的分布的模态、对称性、变异性的度量。
计算模块212计算统计测度(诸如集合“DSR”的集中趋势值)。集合“DSR”的集中趋势值是平均值、中值、众数或将单个值标识为对集合DSR中的值的整体分布的表示的任何统计测度中的一个。
计算模块212通过对分布特征值应用数学变换来计算“分类构成偏度”值。计算模块212通过对包括集合“DSR”的集中趋势值的分布特征值应用数学变换来计算“分类构成偏度”值。在计算集中趋势值之后,在步骤(i)中,计算模块212通过对集合DSR的集中趋势值应用数学变换来计算“分类构成偏度”(TCS)值。应用于集中趋势值的数学变换包括:从1中减去集中趋势值或计算集中趋势值的倒数、或导致针对较低集中趋势值生成较高数值的分类构成偏度(反之亦然)的数学变换方法。“分类构成偏度”(TCS)值使用如下面的等式(5)或等式(6)中所示的以下公式来计算。
TCS=1-集中趋势值…………等式(5)或
TCS=1/集中趋势值…………等式(6)
在另一示例性实施例中,在步骤(i)中,计算模块212通过使用集合DSR的分布特征值来计算TCS值。计算模块212通过对集合DSR的分布特征值应用数学变换来计算TCS值。集合DSR的分布特征值可以包括:集合DSR的最大值、集合DSR的最小值、集合DSR的方差、集合DSR的偏度、或者表征集合DSR中的值的分布的模态、对称性、变异性的度量。
在一个示例性实施例中,在微生物组样本中的分类群完全均匀分布的情况下,对应于(DTj÷STi)的值可具有最大值1。因此,任何微生物组样本的分类构成偏度(TCS)值可在以下范围内变化:0≤分类构成偏度(TCS)值<1。任何微生物组样本的集合DSR的集中趋势值可以在以下范围内变化:0≤集中趋势值<1。
此外,计算模块212基于集合DSR的集中趋势值、集合“DSR”的分布特征值或“分类构成偏度”值中的至少一个来确定怀孕受试者的早产风险。计算模块212还基于集合DSR的集中趋势值、集合“DSR”的分布特征值或“分类构成偏度”值中的至少一个将怀孕受试者分类为针对早产的一个或多个风险类别。一个或多个风险类别包括低早产风险类别、中度早产风险类别和高早产风险类别。
在一个示例中,当从孕妇获得***微生物组样本时,并且当使用集合DSR的“中值”作为集合DSR的集中趋势值(如步骤“h”中计算的)时,并且当通过使用等式(5)生成TCS值时,并且其中早产风险类别基于基于上述集合DSR的集中趋势值获得的TCS值,对于大于0.922的分类构成偏度值,指示低早产风险类别,对于在0.887至0.922(含两个值)的范围内的分类构成偏度值,指示中度早产风险类别,并且对于小于或等于0.887的分类构成偏度值,指示高早产风险类别。
在另一实施例中,可以基于集合DSR的集中趋势值来指示怀孕受试者的早产风险类别。对于大于0.113的集合DSR的集中趋势值,指示高早产风险类别,对于在0.078至0.113(含两个值)范围内的集合DSR的集中趋势值,指示中度早产风险类别,对于小于0.078的集合DSR的集中趋势值,指示低早产风险类别,并且其中集合DSR的集中趋势值是集合DSR的中值,并且其中从孕妇获得的微生物组样本是***微生物组样本。
下面通过示例描述用于确定上述各种早产风险类别的阈值所采用的程序。仅通过说明提供而非通过限制提供以下实施例。
根据一个示例性实施例,基于具有几乎相似的测序覆盖度的三个假设微生物组样本(序列数:每个样本中约49350)计算“分类构成偏度”值所涉及的各种步骤如下所示。下面示出的计算出的示例描绘了通过分析从怀孕受试者获得的微生物组样本中各种微生物的丰度值来计算“分类构成偏度”值/度量所采用的各种步骤。多种微生物的丰度值已经以表格的形式表示(下文称为“微生物分类丰度简档”)。表1(a-c)(下面)描绘了三种微生物组样本的微生物分类丰度简档。
Figure BDA0001806259290000241
表1(a-c)描绘了微生物分类丰度简档,其包含存在于三个微生物组样本(S1-S3)中的各种微生物的丰度值(按每种微生物的丰度的升序排序)。在每个丰度简档下面,还指示“M”(即总种群计数)的值。通过计算来自微生物分类丰度简档的多种微生物的丰度值的总和来获得M的值。必须指出的是,针对每个分类群ID(微生物)提供的“丰度”的数值表示:通过所采用的分类学分类技术分配给该分类群ID的经测序微生物组样本中的DNA序列的绝对计数。
从给定的“微生物分类丰度简档”开始(如表1a-c所示),以下步骤涉及对“分类构成偏度”值的计算。
在步骤1中,通过计算来自微生物分类丰度简档的多种微生物的丰度值的总和来获得总种群计数“M”。表1a-c中示出了对“M”的计算。此外,在步骤2中,创建了包含来自微生物分类丰度简档的多种微生物中的每种的丰度值的经排序的列表“L”。经排序的列表“L”包括存在于微生物分类丰度简档中按丰度值的递增次序或递减次序排名的多种微生物中的每种的丰度值,并且其中,当列表L按丰度值的递增次序排序时,经排序的列表“L”中排名靠前的一个或多个条目对应于“稀疏分类群”,并且经排序的列表“L”中排名垫底的一个或多个条目对应于“优势分类群”,并且当列表L按丰度值的递减次序排序时,经排序的列表“L”中排名靠前的一个或多个条目对应于“优势分类群”,并且经排序的列表“L”中排名垫底的一个或多个条目对应于“稀疏分类群”。在本示例中,表1a-c中指示的3个样本(S1,S2和S3)的经排序的列表(L)如下所示:
L(S1)={1,1,1,1,76,...,9852,11974}
L(S2)={1,1,1,1,6,...,12456,13879}
L(S3)={1,1,1,1,6,...,14725,19521}
在上述集合的每个中,对应的列表L按相应的微生物组样本中各个微生物的丰度值的递增次序排序。因此,一个或多个排名靠前的条目(即,从所描绘的列表的左手侧开始)对应于“稀疏分类群”,并且一个或多个排名垫底的条目(即,从所描绘的列表的右手侧开始)对应于“优势分类群”。这里,L(S1)的“稀疏分类群”对应于{1,1,1,1,76…},并且L(S1)的“优势分类群”对应于{...,9852,11974}。
在步骤3中,当丰度值按经排序的列表“L”中的每种微生物的丰度值的递增次序的次序(当列表按递增次序排序时)逐渐累积时,计数其累积丰度≥总种群计数“M”的i%的“稀疏分类群”的最小数量(STi)。
在步骤3(a)中,考虑i值=1,下面描绘了三个微生物组样本中的每个中包括≥总种群计数“M”的1%的“稀疏分类群”的最小数量(ST1)(其中经排序的微生物丰度按每种微生物的丰度值的递增次序累积)。
S1={1,1,1,1,76,241,745,1027,2786,3598,4863,6721,7458,9852,11974}。
在上面的样本中,前7个稀疏分类群(以粗体字体突出显示)的累积丰度(1066)即包括≥总种群计数(即49345)的1%。因此,S1的ST1=7。
类似地,S2={1,1,1,1,6,7,23,56,110,2028,3075,7354,10326,12456,13879}。对于S2,前10个稀疏分类群(以粗体字体突出显示)的累积丰度(2234)包括≥总种群计数(即49324)的1%。因此,S2的ST1=10。
类似地,S3={1,1,1,1,6,7,23,56,78,226,897,3954,9876,14725,19521}。对于S3,前11个稀疏分类群(以粗体字体突出显示)的累积丰度(1297)包括≥总种群计数(即49373)的1%。因此,S3的ST1=11。
在步骤3(b)中,类似地,考虑i值=2,下面描绘了三个微生物组样本中的每个中包括总种群计数“M”的≥2%的“稀疏分类群”的最小数量(ST2)(其中经排序的微生物丰度按每种微生物的丰度值的递增次序累积)。
S1={1,1,1,1,76,241,745,1027,2786,3598,4863,6721,7458,9852,11974}。
在上面的样本中,前7个稀疏分类群(以粗体字体突出显示)的累积丰度(1066)包括≥总种群计数(即49345)的2%。因此,S1的ST2=7。
类似地,S2={1,1,1,1,6,7,23,56,110,2028,3075,7354,10326,12456,13879}。对于S2,前10个稀疏分类群(以粗体字体突出显示)的累积丰度(2234)包括≥总种群计数(即49324)的2%。因此,S2的ST2=10。
类似地,S3={1,1,1,1,6,7,23,56,78,226,897,3954,9876,14725,19521}。对于S3,前11个稀疏分类群(以粗体字体突出显示)的累积丰度(1297)包括≥总种群计数(即49373)的2%。因此,S3的ST2=11。
在步骤3(c)中,类似地,考虑i值=3,下面描绘了三个微生物组样本中的每个中包括≥3总种群计数“M”的%的“稀疏分类群”的最小数量(ST3)(其中经排序的微生物丰度按每种微生物的丰度值的递增次序累积)。
S1={1,1,1,1,76,241,745,1027,2786,3598,4863,6721,7458,9852,11974}。在上面的样本中,前7个稀疏分类群(以粗体字体突出显示)的累积丰度(1066)包括≥总种群计数(即49345)的3%。因此,S1的ST3=7。
类似地,S2={1,1,1,1,6,7,23,56,110,2028,3075,7354,10326,12456,13879}。对于S2,前10个稀疏分类群(以粗体字体突出显示)的累积丰度(2234)包括≥总种群计数(即49324)的3%。因此,S2的ST3=10。
类似地,S3={1,1,1,1,6,7,23,56,78,226,897,3954,9876,14725,19521}。对于S3,前12个稀疏分类群(以粗体字体突出显示)的累积丰度(5251)包括≥总种群计数(即49373)的3%。因此,S3的ST3=12。
在步骤3(d)中,重复步骤3a、3b和3c以获得针对每个样本的STi计数,其中i包括范围从1到50的50个整数值(包括1和50两者)。这针对每个样本生成各自包括50个值的集合(STSampleName)。
STSampleName={ST1,ST2,ST3,.....,ST50}
STS1={7,7,8,8,9,9,9,9,9,10,10,10,10,10,10,10,10,11,11,11,11,11,11,11,11,11,11,12,12,12,12,12,12,12,12,12,12,12,12,12,13,13,13,13,13,13,13,13,13,13}
STS2={10,10,10,10,11,11,11,11,11,11,12,12,12,12,12,12,12,12,12,12,12,12,12,12,12,13,13,13,13,13,13,13,13,13,13,13,13,13,13,13,13,13,13,13,13,13,14,14,14,14}
STS3={11,11,12,12,12,12,12,12,12,12,13,13,13,13,13,13,13,13,13,13,13,13,13,13,13,13,13,13,13,13,14,14,14,14,14,14,14,14,14,14,14,14,14,14,14,14,14,14,14,14}
此外,在步骤4中,当丰度值按经排序的列表“L”中的每种微生物的丰度值的递增排名(当列表按递增次序排序时)逐渐累积时,计算其累积丰度≥总种群计数“M”的j%的“优势分类群”的最小数量(DTi)。
此外,在步骤4(a)中,考虑j值=1,下面描绘了三个微生物组样本中的每个中包括总种群计数“M”的≥1%的“优势分类群”的最小数量(DT1)(其中经排序的微生物丰度按每种微生物的丰度值的递增次序累积)。
S1={1,1,1,1,76,241,745,1027,2786,3598,4863,6721,7458,9852,11974}。在上面的样本中,最后1个分类群(以粗体字体突出显示)的累积丰度(11974)包括≥总种群计数(即49345)的1%。因此,S1的DT1=1。
类似地,S2={1,1,1,1,6,7,23,56,110,2028,3075,7354,10326,12456,13879}。对于S2,最后1个优势分类群(以粗体字体突出显示)的累积丰度(13879)包括≥总种群计数(即49324)的1%。因此,S2的DT1=1。
类似地,S3={1,1,1,1,6,7,23,56,78,226,897,3954,9876,14725,19521}。对于S3,最后1个优势分类群(以粗体字体突出显示)的累积丰度(19521)包括≥总种群计数(即49373)的1%。因此,S3的DT1=1。
此外,在步骤4(b)中,类似地,考虑j值=2,下面描绘了三个微生物组样本中的每个中包括总种群计数“M”的≥2%的“优势分类群”的最小数量(DT2)(其中经排序的微生物丰度按每种微生物的丰度值的递增次序累积)。
S1={1,1,1,1,76,241,745,1027,2786,3598,4863,6721,7458,9852,11974}。在上面的样本中,最后1个优势分类群(以粗体字体突出显示)的累积丰度(11974)≥包括总种群计数(即49345)的2%。因此,S1的DT2=1。
类似地,S2={1,1,1,1,6,7,23,56,110,2028,3075,7354,10326,12456,13879}。对于S2,最后1个优势分类群(以粗体字体突出显示)的累积丰度(13879)包括≥总种群计数(即49324)的2%。因此,S2的DT2=1。
类似地,S3={1,1,1,1,6,7,23,56,78,226,897,3954,9876,14725,19521}。对于S3,最后1个分类群(以粗体字体突出显示)的累积丰度(19521)包括≥总种群计数(即49373)的2%。因此,S3的DT2=1。
此外,在步骤4(c),重复步骤4a和4b以获得针对每个样本的DTi计数,其中j包括范围从1到50的50个整数值(包括1和50两者)。该计算针对每个样本计算生成各自包括50个值的集合(DTSampleName)。
DTSampleName={DT1,DT2,DT3,.....,DT50}
DTS1={1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,3,3,3,3,3,3}
DTS2={1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2}
DTS3={1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,2,2,2,2,2,2,2,2,2,2,2}
此外,在步骤5中,计算集合“DT”和集合“ST”的笛卡尔乘积以获得包含对应于DTj值和STi值的多个有序对的集合“C”。例如,对于样本S1,以下面的方式获得集合CS1
DTS1={1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,3,3,3,3,3,3}
STS1={7,7,8,9,9,9,9,9,9,10,10,10,10,10,10,10,11,11,11,11,11,11,11,11,11,11,12,12,12,12,12,12,12,12,12,12,12,12,12,13,13,13,13,13,13,13,13,13,13}
CS1=集合DTS1和集合STS1的笛卡尔乘积,笛卡尔积集合CS1如下表2所示。
DT<sub>1</sub> DT<sub>2</sub> DT<sub>3</sub> DT<sub>4</sub> DT<sub>5</sub> DT<sub>6</sub> DT<sub>7</sub> DT<sub>8</sub> ..... ..... DT<sub>50</sub>
ST<sub>1</sub> (1,7) (1,7) (1,7) (1,7) (1,7) (1,7) (1,7) (1,7) ..... ..... (3,7)
ST<sub>2</sub> (1,7) (1,7) (1,7) (1,7) (1,7) (1,7) (1,7) (1,7) ..... ..... (3,7)
ST<sub>3</sub> (1,8) (1,8) (1,8) (1,8) (1,8) (1,8) (1,8) (1,8) ..... ..... (3,8)
ST<sub>4</sub> (1,8) (1,8) (1,8) (1,8) (1,8) (1,8) (1,8) (1,8) ..... ..... (3,8)
ST<sub>5</sub> (1,9) (1,9) (1,9) (1,9) (1,9) (1,9) (1,9) (1,9) ..... ..... (3,9)
ST<sub>6</sub> (1,9) (1,9) (1,9) (1,9) (1,9) (1,9) (1,9) (1,9) ..... ..... (3,9)
ST<sub>7</sub> (1,9) (1,9) (1,9) (1,9) (1,9) (1,9) (1,9) (1,9) ..... ..... (3,9)
ST<sub>8</sub> (1,9) (1,9) (1,9) (1,9) (1,9) (1,9) (1,9) (1,9) ..... ..... (3,9)
..... ..... ..... ..... ..... ..... ..... ..... ..... ..... ..... .....
..... ..... ..... ..... ..... ..... ..... ..... ..... ..... ..... .....
ST<sub>50</sub> (1,13) (1,13) (1,13) (1,13) (1,13) (1,13) (1,13) (1,13) ..... ..... (3,13)
表2:针对样本S1的笛卡尔积集合:CS1
以类似的方式,分别针对样本2和样本3获得集合CS2和集合CS3。此外,在步骤6中,对于每个样本,通过针对相应的集合CS1、集合CS2和集合CS3中的每个有序对而计算(DTj÷STi)来导出集合“DSR”。
例如,对于样本1,通过针对集合CS1中的每个有序对而计算(DTj÷STi)来导出集合DSRS1(在表3中表示如下)。
Figure BDA0001806259290000301
Figure BDA0001806259290000311
表3:集合DSRS1
以类似的方式,通过针对集合CS2和集合CS3(分别对应于样本2和样本3)中的每个有序对而计算(DTj÷STi)来导出集合DSRS2和集合DSRS3
此外,在步骤7中,针对每个单独的样本计算集合“DSR”的集中趋势值(或分布特征值)。在该示例中,集合DSR的“中值”被认为是集合DSR的集中趋势值。
集合DSRS1的集中趋势(中值)值=0.1538
集合DSRS2的集中趋势(中值)值=0.0909
集合DSRS3的集中趋势(中值)值=0.0769
此外,在步骤8中,通过对集中趋势值应用数学变换来计算“分类构成偏度”(TCS)值。在该示例中,数学变换步骤包括从1(即,单位一(unity))减去集中趋势值。
TCS=1-(集合DSR)的集中趋势值
样本S1的TCS值/度量=1-中值(集合DSRS1)=1-0.1538=0.8461
样本S2的TCS值/度量=1-中值(DSRS2)=1-0.0909=0.909
样本S3的TCS值/度量=1-中值(DSRS3)=1-0.0769=0.932
表4(下面)描绘了使用三个样本S1、S2和S3的微生物分类丰度简档计算出的集合DSR的“集中趋势值”(集合DSR的中值)、“分类构成偏度”(TCS)值的值,如表4所示。
Figure BDA0001806259290000321
表4:样本S1、S2和S3的集中趋势值(中值(DSR))和分类构成偏度。
此外,在步骤9中,应指出的是,预定的早产风险类别阈值如下-
“高PTD风险”:集中趋势值(中值(DSR))>0.113;
“中度PTD风险”:0.078<=集中趋势值(中值(DSR))<=0.113;并且
“低PTD风险”:集中趋势值(中值(DSR))<0.078。
“高PTD风险”:分类构成偏度(TCS)值<0.887;
“中度PTD风险”:0.887<=分类构成偏度(TCS)值<=0.922;并且
“低PTD风险”:分类构成偏度(TCS)>0.922。
因此,在应用这些风险类别后,如上面的示例中分析的3个样本可分类如下-
样本S1→高TD风险
样本S2→中度TD风险
样本S3→低TD风险
如下所示来评估作为在应用中确定早产结果风险上的度量的TCS值的效率。此外,在示例性实施例中,可以采用交叉验证策略来评估分类构成偏度(TCS)值在使用孕妇的***微生物组样本(在妊娠的15周内取样)预测早产(病例)和足月产(对照)结果上的效率。该示例性实施例还可以被用于将TCS值的不同早产风险类别阈值确定为度量。
针对对应于具有已知/记录的分娩结果的怀孕受试者/孕妇的微生物组样本计算若干多样性/不等性度量值。将基于给定多样性/不等性度量预测的分娩结果与已知/记录的分娩结果进行比较,以评估预测效率。对于给定的多样性/不等性度量,马修斯相关系数(MCC)是捕获用于预测分娩结果的度量的特异性和敏感性的测度。为+1的完美MCC值指示对应于从其妊娠进行到记录的早产结果的怀孕受试者获得的微生物组样本以及从其妊娠进行到记录的足月产结果(即正常的足月妊娠)的怀孕受试者获得的微生物组样本的多样性/不等性度量值的完全分离。此外,参照图3,根据本公开的示例性实施例,分离程度(ES)值指示两个值集合DTD和DPTD之间的分离程度,其中DTD表示针对来自对应于具有已知/记录的足月产结果的怀孕受试者的样本的给定多样性度量计算的值的范围,并且其中DPTD表示针对来自对应于具有已知/记录的一个或多个早产结果的怀孕受试者的样本的给定多样性度量计算的值的范围。较高的ES值指示值集合之间的更好分离。观察分类构成偏度(TCS)值以获得为+1的完美MCC值(例如在妊娠的第15周之前的每周)。因此,可以假设在第15孕周之时或之前的妊娠中的任何时间点处从怀孕受试者(孕妇)获得的单个***微生物组样本可以被用于准确预测早产(PTD)结果的风险(使用TCS值作为度量)。
对取自数据语料库(data corpus)的***微生物组样本(n=211)的子集执行验证研究。如本文所述导出数据语料库。来自三个先前公布的研究的公开可用的***微生物组样本数据被用于本评估。在每个研究中,对应于足月产和早产结果的样本数量如下表5所示。
Figure BDA0001806259290000331
表5:对应于足月产和早产结果的样本数量
获得针对上述***微生物组样本数据的分类简档的操作分类单位(OTU)水平(对应于Greengenes OTU版本13.5)。在整个评估过程期间分析对应于总共1045个样本的数据,每个样本具有至少500个分类学分配的序列。计算1045个微生物组样本中的每个的“分类构成偏度”(TCS)值。除了TCS值之外,还针对可用的微生物组样本计算了以下已建立和广泛使用的生态多样性指数,即分别表示物种多样性、均匀度和丰富度的Shannon、Simpson和Chao。还计算了用于确定经济不等性的统计测度,即基尼系数、Ricci-Schutz、Atkinson、Theil和Decile比率(90:10),以检查这些指数是否也能捕获到分类构成分布的偏度。
将可用的微生物组样本分成33个周组。组“第N周”包括在妊娠的第N周内的任何时间点处取样的***微生物组(N范围在8-40之间)。每组中的微生物组样本被标记为分别表示报告的“足月”产结果或“早产”结果的“足月产”或“早产”。对于每个组,依据“马修斯相关系数(MCC)”来估计各个指数区分足月产与早产的诊断值/能力。如下面的等式(6)所示,马修斯相关系数(MCC)是使用选定的阈值来捕获预测/分类的特异性和敏感性两者的测度。如等式6中所示的术语TP、TN、FP、FN通常被用于计算敏感性/特异性或类似测度,其用于量化分类技术的预测准确性。
Figure BDA0001806259290000341
其中,在等式(6)中,TP、TN、FP和FN分别表示真阳性预测、真阴性预测、假阳性预测和假阴性预测的数量。
为+1的完美MCC值指示对应于早产和足月产的微生物组样本之间的完全分离。对于每个组,通过首先针对给定的指数针对不同的选定的阈值计算“马修斯相关系数(MCC)”并且随后选择在其处获得最大MCC值的阈值,来估计各个指数用以区分足月产与早产的诊断值/能力。在给定指数(多样性或不等性测度)的选定阈值可以完全区分/分离对应于足月产和早产的微生物组样本(即MCC=+1)的情况下,分离程度(ES)被进一步评估。较高的ES值指示两组微生物组样本(即足月产样本和早产样本)之间的更好分离。
参照图3,分离程度(ES)是示意性地描绘的附加特征,其可以量化生态多样性/经济不等性度量的区分能力。通过使用如下所示的等式7和等式8来计算分离程度(ES)。
Figure BDA0001806259290000351
Figure BDA0001806259290000352
其中,在等式7中,DTD表示针对对应于足月产结果的所有样本的给定多样性/不等性度量而计算的值集合。DPTD表示针对对应于早产结果的所有样本的给定多样性/不等性度量而计算的值集合。δ(maxD_TD,minD_PTD)表示集合DTD的最大值与集合DPTD的最小值之间的绝对差。δ(maxD_PTD,minD_TD)表示集合DPTD的最大值与集合DTD的最小值之间的绝对差。此外,B和A的值可以参照图3。
鉴于本公开的主要目的在于提供用于孕妇早产结果的“早期”风险评估的***和方法,使用仅对应于妊娠的前15周的样本获得的评估结果被示出在表6中。表6提供了各种多样性和不等性指数在根据处于妊娠的前15周内的孕妇的***微生物组预测早产结果上的效用的比较评估。表6中所示的数据子集仅包括那些在妊娠15周内获得的***微生物组样本。样本被适当地标记为分别表示(报告)“足月”产结果或“早产”结果的“足月产”或“早产”。
在表6中,为+1的完美MCC值指示对应于病例(早产)和对照(足月产)的微生物组样本之间的完全分离。在每个妊娠周处指示的样本的数量包括在相应的妊娠周之时或之前的任何时间点处采样的所有***微生物组样本。在阈值多样性或不等性测度可以完全区分/分离对应于足月产和早产结果的样本(即MCC=+1)的情况下,分离程度(ES)被进一步评估并且被指示在与MCC值相邻的括号中。较高的ES值指示两组样本之间的分离更好。在每个孕周处,获得的最佳MCC和ES值以粗体字体指示。
如表6中所示获得的结果指示出从具有足月产或早产结果的孕妇获得的***微生物组样本之间的生态多样性/经济不等性测度的显著差异。观察一个或多个指数以获得为+1的完美MCC值(即,使用选定阈值将与足月产相关联的样本和与早产相关联的样本完全分离),其中在妊娠的15周内(即第8周至第15周)收集微生物组样本。表6示出了各种多样性和不等性指数在根据处于妊娠的前15周内的孕妇的***微生物组预测早产结果上的效用的比较性评估。在每个妊娠周处,获得的最佳MCC值以粗体字体指示,并且ES值被指示在与MCC值相邻的括号中。在每个妊娠周处指示的样本的数量包括在相应的妊娠周之时或之前的任何时间点处采样的***微生物组样本。
Figure BDA0001806259290000361
表6:各种多样性和不等性指数在根据处于妊娠的前15周内的孕妇的***微生物组预测早产结果上的效用的比较评估。
如表6中所示,在所比较的指数中,观察到如本公开中公开的作为度量的“分类构成偏度”(TCS)值优于所有其他指数。此外,观察TCS值以获得为+1的完美MCC值(每周,直到妊娠的第15周为止),从而表明了在第15孕周之时或之前的妊娠的任何时间点处从孕妇获得的单个微生物组样本(例如***微生物组样本)可以被用于以有效和可靠的方式准确地诊断或预测早产结果的风险。更重要的是,针对各种度量/指数获得的ES(分离程度)值的比较(在获得为+1的MCC值的情况下)指示出以TCS值获得的ES比以其他比较的度量/指数获得的ES高5-9%。较高的ES值指示出关于度量/指数的区分能力的较高置信度。虽然原则上,从个体***微生物组样本(在第15孕周之前获得)的分类简档中获得的TCS值可以帮助确定早产风险,但在现实环境中,只要有可能,可以理想的是,在发起任何预防性、治疗性或咨询性措施之前,从相同受试者获得多个样本(例如每周)以确定早产风险。
观察TCS值以获得为+1的完美MCC值(例如每周,直到妊娠的第15周为止)。因此,可以假设在第15孕周之时或之前的妊娠中的任何时间点处从受试者(孕妇)获得的单个***微生物组样本可以被用于准确地预测早产(PTD)结果的风险(使用TCS值作为度量)。
执行重复的随机子采样交叉验证实验,以进一步评估TCS的效率,以及预测妊娠结果的各种多样性和不等性指标。这些实验还被用于确定TCS度量的早产风险类别阈值。对于一个或多个交叉验证实验,随机选择三分之二的样本,并且随机选择的样本用作“训练集”,以用于确定提供了对应于早产(病例)结果的微生物组样本与足月产(对照)结果之间的最大分离的TCS值的阈值(依据MCC值进行量化)。随后使用包括剩余的三分之一的微生物组样本的“测试集”评估如此确定的阈值的效率。迭代上述程序1000次。在每次迭代中,在六个参数(即准确性、敏感性、特异性,阳性预测值(PPV)、阴性预测值(NPV)和马修斯相关系数(MCC))方面对TCS值的阈值的效率进行评估。在下面的表7中提供了1000次迭代中的六个评估参数的平均值。表7还包括以其他“生态多样性/经济不等性”度量(包括Shannon、Simpson、Chaol、基尼系数、Ricci-Schutz、Atkinson、Theil、Decile比率)执行的一个或多个相同交叉验证实验的结果。
表7示出了交叉验证实验的结果(***微生物组样本取自妊娠15周内的孕妇),提供了各种评估度量在准确性、敏感性、特异性、阳性预测值(PPV)、阴性预测值(NPV)和马修斯相关系数(MCC)方面的效率的比较。PPV=TP/(TP+FP);NPV=TN/(TN+FN);准确性=(TP+TN)/(TP+TN+FP+FN);敏感性=TP/(TP+FN);特异性=TN/(TN+FP)。在表7中提供了以每个度量的1000次交叉验证迭代中的六个评估参数的平均值,并且以粗体字体指示最佳的获得值。标准偏差值被指示在相应的平均值下方的括号中。表7中的值已四舍五入到小数点后第二位。
Figure BDA0001806259290000381
表7:交叉验证实验的结果(其中***微生物组样本取自妊娠的15周内的孕妇)
从表7中显示的数据可以看出,用作度量的TCS值获得了显著更高的准确性、敏感性、特异性、PPV和NPV值,这清楚地指示TCS值在根据在妊娠的15周内取出的单个***微生物组样本而准确诊断/预测早产风险中的效用。
根据示例性实施例,采用以下程序来定义针对早产“风险分类”的TCS值的阈值。根据一个示例,在如上所述的交叉验证实验中,从1000个随机选择的训练集获得的TCS值(度量)(其在1000次迭代中的每次中提供最高的MCC值)的最小阈值和最大阈值被识别为0.887和0.922。这些最小TCS阈值和最大TCS阈值被考虑用于定义三种早产“风险类别”。这些类别旨在为孕妇提供临床环境中早产(PTD)结果风险的定性评估。类别详述如下:TCS<0.887→“高PTD风险”,0.887<=TCS<=0.922→“中度PTD风险”和TCS>0.922→“低PTD风险”。
在本公开的另一实施例中,早产风险类别模块可以利用适合于以下的不同组的预定义风险类别阈值:1)在妊娠期间的不同时间点处收集的一个或多种微生物组样本,2)从除了***以外的身体部位收集的一个或多种微生物组样本,以及3)从属于不同地理区域、种族的受试者或者以各种早产结果的产妇风险因素进行评估的受试者收集的一个或多种微生物组样本。可以通过分析从相关群组(cohort)获得的微生物组数据来计算这种预定义的风险分类阈值。
根据实施例,本公开的一个或多个优点如本文所公开。然而,本文所描述的本公开的优点不限于下面提到的优点。
在一个实施例中,该***和方法评估妊娠的15周内或早于15周的早产结果的风险,并且以显著高的阳性预测值(PPV)准确预测早产风险或倾向。
在另一实施例中,该***和方法在妊娠期间的任何时间评估早产结果的风险,并且以显著高的阳性预测值(PPV)准确预测早产风险或倾向。
该***和方法使能够基于从微生物组样本的微生物分类丰度简档获得的集合“DSR”的分布特征值或基于微生物组样本的微生物分类丰度简档计算出的分类构成偏度值中的至少一个来确定怀孕受试者的早产风险。集合“DSR”的分布特征值包括集合DSR的集中趋势值。
该***和方法使能基于分布特征值(诸如从微生物组样本的微生物分类丰度简档获得的集合“DSR”的集中趋势值)或者分类构成偏度值中的至少一个的对怀孕受试者的早产风险的确定在预测怀孕受试者的足月产或早产上示出足够的分离程度,因此集合“DSR”的集中趋势值、分布特征值和分类构成偏度具有预测准确性以及在怀孕受试者的足月产和早产上更好的区分能力。
通过本文公开的方法和***获得的高PPV显著地使与不具有这种早产风险的怀孕受试者相比具有潜在早产风险的怀孕受试者错误分类的一个或多个机会最小化。
此外,本文公开的***和方法为孕妇/受试者(检测到具有PTD结果的风险)提供足够的时间来采取减少或消除PTD风险的所需“预防性/矫正性”医疗建议或程序。
作为基于微生物组的方法,本公开甚至可应用于第一次怀孕或者不是由***感染或胎儿或子宫异常或先前已知的风险因素(例如先前的早产史)驱动的早产结果。
本公开中公开的采样方法和***包括非侵入性样本收集技术,因此本文公开的用于评估早产风险的方法和***对于怀孕受试者更舒适。此外,单个样本足以在本文公开的方法中进行准确诊断。
此外,该***和方法需要在妊娠的前15周内的任何时间获得样本,并且与现有技术采用的采样技术(其在某些情况下是侵入性的,并且通常适用于妊娠的后期)相比,由采样程序引起的怀孕受试者所经历的任何不适都显著降低。
一些现有技术提出细菌性***病(BV)作为PTD的诱发因素。因此,一些现有技术方法涉及监视***拭子中“特定”细菌病原体的丰度或存在,以预测PTD的倾向。本公开指示涉及研究从怀孕受试者获得的微生物组样本的预测方法,但在几个方面不同于这些现有技术。本公开内容不仅仅基于特定细菌病原体的丰度变化来预测或评估PTD风险。本文公开的用于评估PTD结果风险的***和方法基于的是微生物组样本中存在的种群水平的微生物群落的特征(不管受试者是否具有BV)。
使用来自本文给出的以下出版物的公开可获得的***微生物组数据来测试和验证用于评估怀孕受试者的早产结果风险的***和方法所述出版物包括Romero et al.,Microbiome,May 2014,Romero et al.,Microbiome,February 2014,以及D B DiGiulioet al.,PNAS,September 2015。
现在参照图4,示出了根据本主题的实施例的用于怀孕受试者的早产结果的早期风险评估的方法400。可以在计算机可执行指令的广义语境中描述方法400。通常,计算机可执行指令可以包括执行特定功能或实施特定抽象数据类型的例程、程序、对象、组件、数据结构、过程、模块、功能等。方法400还可以在分布式计算环境中实践,其中功能由通过通信网络链接的远程处理设备执行。在分布式计算环境中,计算机可执行指令可以位于本地和远程计算机存储介质(包括存储器存储设备)中。
描述方法400的次序不旨在被解释为限制,并且可以以任何次序组合任何数量的所描述的方法框以实施方法400或替代方法。此外,单独块可以从方法400中删除而不脱离本文所描述的主题的精神和范围。此外,该方法可以被实施在任何适合的硬件、软件、固件或其组合中。然而,为了便于解释,在下面描述的实施例中,可以认为方法400被实施在上述***100中。
在步骤402处,可以获得来自怀孕受试者的微生物组样本。来自怀孕受试者的微生物组样本可以在妊娠的前15周内或在妊娠的前三个月内或在妊娠的第二个三个月内获得,其中怀孕受试者是孕妇。在另一方面,可以在妊娠的前28周内或在妊娠的前37周内接收来自怀孕受试者的微生物组样本,其中怀孕受试者是孕妇。可以在妊娠期间的任何时间点处接收来自怀孕受试者的微生物组样本。在一个实施例中,怀孕受试者是孕妇。在另一实施例中,怀孕受试者是雌性胎生动物。在另一实施例中,可以在整个妊娠期的任何时间点处从怀孕受试者收集微生物组样本,以用于评估怀孕受试者的PTD结果的风险。
在一个实施例中,微生物组样本接收器110可以从怀孕受试者收集或接收微生物组样本。微生物组样本可以从怀孕受试者的口腔、皮肤、肠、***或其他身体部位获得。微生物组样本选自包括以下的组:***拭子样本、***样本、宫颈拭子样本、***拭子(包括穹窿的拭子样本)、尿液样本、羊水样本、血液样本、血清样本、血浆样本、胎盘拭子、脐带拭子、粪便样本、皮肤拭子、口腔拭子、唾液样本、牙周拭子、咽喉拭子、鼻拭子、囊泡液样本、鼻咽拭子、鼻孔拭子、结膜拭子、生殖器拭子、直肠拭子、气管抽吸物以及支气管拭子。
此外,在一个实施例中,步骤404处的方法包括经由微生物组表征平台108获得微生物组样本的微生物组表征数据。通过应用以下一种或多种技术获得微生物组表征数据,所述一种或多种技术包括:测序技术、显微镜检查、流式细胞术方法、基于体外培养的方法、一种或多种酶或荧光测定、或涉及对来自复杂微生物种群的信号的光谱鉴定和筛选的一种或多种测定,并且其中所述微生物组表征数据包括经测序的微生物DNA数据、显微镜成像数据、流式细胞术细胞测量数据、体外培养中生长的微生物的菌落计数和细胞表型数据、以及信号强度数据。
在一个实施例中,在接收微生物组样本后,在步骤404处,经由针对微生物组样本的测序平台112获得经测序的微生物DNA数据。获得经测序的微生物DNA数据包括:使用至少一种DNA提取技术分离对应于微生物组样本中存在的多种微生物的微生物DNA。在一个实施例中,测序平台106使用至少一种DNA提取技术分离对应于微生物组样本中存在的多种微生物的微生物DNA。
此外,在步骤404中,使用至少一种DNA测序技术对微生物DNA进行测序,以获得经测序的微生物DNA数据。在一个实施例中,测序平台112使用至少一种DNA测序技术对微生物DNA进行测序,以获得经测序的微生物DNA数据。在一个方面,根据微生物DNA对细菌16SrRNA或23S rRNA标记基因进行扩增和测序。在另一方面,根据微生物DNA对细菌16S rRNA或23S rRNA标记基因的全长或一个或多个特定区域进行扩增和测序。在一个实施例中,测序平台212根据从微生物组样本中提取的微生物DNA对细菌16S rRNA或23S rRNA标记基因进行扩增和测序。
在一个实施例中,可以根据微生物DNA对一种或多种***发育标记基因进行扩增和测序。DNA测序技术可选自下一代测序技术,其中所述下一代测序技术包括全基因组鸟枪法(WGS)测序、基于片段库的测序技术、配对库或基于双端库的测序技术、或其组合。
此外,在一个实施例中,在获得微生物组表征数据之后,在步骤406中,可以通过由硬件处理器使用一种或多种分类学分类技术以计算方式分析微生物组表征数据,从而生成微生物组样本的“微生物分类丰度简档”。
在又一实施例中,在步骤406中,通过由硬件处理器使用一种或多种分类学分类技术以计算方式分析经测序的微生物DNA数据,从而生成微生物组样本的“微生物分类丰度简档”。“微生物分类丰度简档”包括微生物组样本中存在的各种“分类群”的丰度值。在一个实施方式中,微生物分类丰度简档生成模块210由硬件处理器使用一种或多种分类学分类技术以计算方式分析经测序的微生物DNA数据,以生成微生物组样本的“微生物分类丰度简档”。在本公开的另一方面,可以通过使用一种或多种技术分析微生物组样本来生成微生物组样本的微生物分类丰度简档,所述一种或多种技术包括显微镜检查、流式细胞术方法、基于体外培养的方法、一种或多种酶或荧光测定、或涉及对来自复杂微生物种群的信号的光谱鉴定和筛选的一种或多种测定。
在生成“微生物分类丰度简档”之后,在步骤408中,计算模块212接收“微生物分类丰度简档”。微生物分类丰度简档包含微生物组样本中存在的多种微生物中的每种的丰度值。此外,在步骤408中,计算针对“微生物分类丰度简档”的分布特征值和“分类构成偏度”值。“分类构成偏度”值和分布特征值量化了来自微生物分类丰度简档的多种微生物的丰度值中的偏差。“分类构成偏度”值和分布特征值的计算包括以下步骤。在步骤408中计算“分类构成偏度”值和分布特征值还包括如下所述的多个步骤。步骤408还包括步骤502-518,如图5-a和图5-b所示。
参照图5-a和图5-b,这里解释步骤502-518。在步骤502中,通过计算来自微生物分类丰度简档的多种微生物的丰度值的总和来获得总种群计数“M”。此外,在步骤504中,创建包含来自微生物分类丰度简档的多种微生物的丰度值的经排序的列表“L”。经排序的列表“L”包括存在于“微生物分类丰度简档”中按丰度值的递增次序或递减次序排名的多种微生物中的每种的丰度值。当列表L按丰度值的递增次序排序时,经排序的列表“L”中排名靠前的一个或多个条目对应于“稀疏分类群”并且经排序的列表“L”中排名垫底的一个或多个条目对应于“优势分类群”,而当列表L按丰度值的递减次序排序时,经排序的列表“L”中排名靠前的一个或多个条目对应于“优势分类群”并且经排序的列表“L”中排名垫底的一个或多个条目对应于“稀疏分类群”。
此外,在步骤506中,计数以下“稀疏分类群”的最小数量(STi),其累积丰度≥总种群计数“M”的i%。当列表L按递增次序排序时,丰度值按经排序的列表“L”中每种微生物的递增排名的次序逐渐累积,或者计数以下“稀疏分类群”的最小数量(STi),其累积丰度≥总种群计数“M”的i%,其中当列表L按递减次序排序时,丰度值按经排序的列表“L”中每种微生物的递减排名逐渐累积。“i”是整数或分数。在一个方面,“i”值和“j”值的预定义范围在0到50之间(使得0<i≤50且0<j≤50)。在另一方面,“i”值和“j”值的预定义范围在0与100之间(使得0<i≤100且0<j≤100)。
此外,在步骤508中,计数以下“优势分类群”的最小数量(DTj),其累积丰度≥总种群计数“M”的j%,其中当列表L按递增次序排序时,丰度值按经排序的列表“L”中每种微生物的递减排名的次序逐渐累积,或者计数以下“优势分类群”的最小数量(DTj),其累积丰度≥总种群计数“M”的j%,其中当列表L按递减次序排序时,丰度值按经排序的列表“L”中每种微生物的递增排名逐渐累积。“j”是整数或分数。
此外,在步骤510中,重复步骤506和508以获得针对预定义范围的“i”值和“j”值的STi和DTj的计数,以分别生成两个值集合“ST”和“DT”,其中i和j属于预定义范围内的两个相同的算术级数。算术级数的连续项之间的公差是预定义的整数或预定义的分数值。
此外,在步骤512中,计算集合“DT”和集合“ST”的笛卡尔乘积以获得包含对应于DTj值和STi值的多个有序对的集合“C”。
此外,在步骤514中,通过针对集合“C”中的每个有序对而计算(DTj÷STi)来导出集合“DSR”。通过针对一系列i值和j值,将每个DTj项除以每个STi项来导出集合“DSR”。i值和j值在预定义的范围内变化。i和j的预定义范围被定义为使得i+j等于100。
此外,在步骤516中,计算集合“DSR”的分布特征值。在一个示例中,集合“DSR”的分布特征值包括集合DSR的集中趋势值。集合DSR的分布特征值还包括:集合DSR的最大值、集合DSR的最小值、集合DSR的方差、集合DSR的偏度、或者表征集合DSR中的值的分布的模态、对称性、变异性的度量。在一个方面,集合“DSR”的集中趋势值是以下中的一个:平均值、中值、众数或将单个值标识为对集合DSR中的值的整体分布的表示的任何统计测度。在本公开的一个方面,基于“微生物分类丰度简档”计算集合“DSR”的分布特征值,并且基于集合“DSR”的分布特征值确定怀孕受试者的早产风险。
在计算出集合DSR的分布特征值之后,在步骤518中,通过对分布特征值应用数学变换来计算“分类构成偏度”值。通过对包括集合“DSR”的集中趋势值的分布特征值应用数学变换来计算“分类构成偏度”值。通过对集合DSR的分布特征值应用数学变换来计算“分类构成偏度”值,其中集合DSR的分布特征值包括以下中的一个:集合DSR的最大值、集合DSR的最小值、集合DSR的方差、集合DSR的偏度、或者表征集合DSR中的值的分布的模态、对称性、变异性的度量。应用于集中趋势值的数学变换包括:从单位一(unity)中减去集中趋势值、计算集中趋势值的倒数、或导致针对集合DSR的较低集中趋势值生成较高数值的分类构成偏度(反之亦然)的数学变换方法。
此外,参照图4,在步骤410中,由硬件处理器基于集合DSR的集中趋势值、集合DSR的分布特征值或“分类构成偏度”值中的至少一个来确定怀孕受试者的早产风险。
此外,在步骤412中,确定怀孕受试者的早产风险还包括将怀孕受试者分类为针对早产的一个或多个风险类别,其中分类基于集合DSR的集中趋势值、集合DSR的分布特征值或“分类构成偏度”值中的至少一个。一个或多个风险类别包括低早产风险类别、中度早产风险类别和高早产风险类别。
当微生物组样本是从孕妇获得的***微生物组样本时,对于大于0.922的“分类构成偏度”值,指示低早产风险类别,对于在0.887至0.922的范围内的“分类构成偏度”值,指示中度早产风险类别,并且对于小于0.887的“分类构成偏度”值,指示高早产风险类别,并且其中“分类构成偏度”值通过从单位一减去计算出的集合DSR的中值而获得。
当微生物组样本是从孕妇获得的***微生物组样本时,对于大于0.113的集合DSR的集中趋势值,指示高早产风险类别,对于在0.078至0.113范围内的集合DSR的集中趋势值,指示中度早产风险类别,对于小于0.078的集合DSR的集中趋势值,指示低早产风险类别,并且其中集合DSR的集中趋势值是集合DSR的中值。
在一个实施方式中,在步骤408中,对应于计算集合DSR的“分类构成偏度”值和分布特征值的步骤502-518由计算模块212执行。
已经参照各种实施例呈现了前面的描述。本申请所属领域的普通技术人员将理解,在不有意脱离本发明的原理、精神和范围的情况下,可以对所描述的结构和操作方法进行变更和改变。

Claims (29)

1.一种用于对从怀孕受试者获得的微生物组样本中的多种微生物的丰度值的偏差进行量化的方法,所述方法包括:
由硬件处理器(202)接收微生物组样本的“微生物分类丰度简档”,其中所述微生物组样本从怀孕受试者获得;并且其中所述微生物分类丰度简档包含所述微生物组样本中存在的多种微生物中的每种的丰度值;
由所述硬件处理器(202)针对所述“微生物分类丰度简档”,计算“分类构成偏度”值和分布特征值中的至少一个,其中所述“分类构成偏度”值和所述分布特征值量化了来自所述微生物分类丰度简档的所述多种微生物的丰度值的偏差,其中对所述“分类构成偏度”值和所述分布特征值的计算包括,
a)通过计算来自所述微生物分类丰度简档的所述多种微生物的丰度值的总和来获得总种群计数“M”;
b)创建包含来自所述微生物分类丰度简档的所述多种微生物中的每种的丰度值的经排序的列表“L”,其中所述经排序的列表“L”包括存在于所述微生物分类丰度简档中按丰度值的递增次序或递减次序排名的多种微生物中的每种的丰度值,并且其中,当列表L按丰度值的递增次序排序时,经排序的列表“L”中排名靠前的一个或多个条目对应于“稀疏分类群”并且经排序的列表“L”中排名垫底的一个或多个条目对应于“优势分类群”,而当列表L按丰度值的递减次序排序时,经排序的列表“L”中排名靠前的一个或多个条目对应于“优势分类群”并且经排序的列表“L”中排名垫底的一个或多个条目对应于“稀疏分类群”;
c)计数其累积丰度≥总种群计数“M”的i%的“稀疏分类群”的最小数量(STi),其中当列表L按递增次序排序时,丰度值按经排序的列表“L”中每种微生物的递增排名的次序逐渐累积,或者,计数其累积丰度≥总种群计数“M”的i%的“稀疏分类群”的最小数量(STi),其中当列表L按递减次序排序时,丰度值按经排序的列表“L”中每种微生物的递减排名的次序逐渐累积,并且其中“i”是整数或分数;
d)计数其累积丰度≥总种群计数“M”的j%的“优势分类群”的最小数量(DTj),其中当列表L按递增次序排序时,丰度值按经排序的列表“L”中每种微生物的递减排名的次序逐渐累积,或者计数其累积丰度≥总种群计数“M”的j%的“优势分类群”的最小数量(DTj),其中当列表L按递减次序排序时,丰度值按经排序的列表“L”中每种微生物的递增排名的次序逐渐累积,并且其中“j”是整数或分数;
e)重复步骤“c”和“d”以获得针对预定义范围的“i”值和“j”值的STi和DTj的计数,以分别生成两个值集合“ST”和“DT”,其中i和j属于预定义范围内的两个相同的算术级数,并且其中所述算术级数的连续项之间的公差是预定义的整数或预定义的分数值;
f)计算集合“DT”和集合“ST”的笛卡尔乘积,以获得包含对应于DTj值和STi值的多个有序对的集合“C”;
g)通过针对所述集合“C”中的每个有序对而计算(DTj÷STi)来导出集合“DSR”;
h)计算所述集合“DSR”的所述分布特征值,其中所述集合“DSR”的所述分布特征值包括所述集合DSR的集中趋势值;
i)通过对包括所述集合“DSR”的集中趋势值的所述分布特征值应用数学变换来计算所述“分类构成偏度”值;其中所述集合DSR的所述集中趋势值、所述集合“DSR”的所述分布特征值或所述“分类构成偏度”值中的至少一个指示出所述怀孕受试者向着早产的趋势。
2.根据权利要求1所述的方法,其中,所述微生物组样本从处于妊娠的前15周内或处于妊娠的前三个月内的所述怀孕受试者获得,其中所述怀孕受试者是孕妇。
3.根据权利要求1所述的方法,其中,所述微生物组样本从处于妊娠期期间的任何时间处的所述怀孕受试者获得。
4.根据权利要求1所述的方法,其中,所述怀孕受试者是孕妇。
5.根据权利要求1所述的方法,其中,所述怀孕受试者是雌性胎生动物。
6.根据权利要求1所述的方法,其中,所述微生物组样本从所述怀孕受试者的口腔、皮肤、肠、***或其他身体部位获得,并且其中所述微生物组样本选自包括以下的组:***拭子样本、宫颈拭子样本、尿液样本、羊水样本、血液样本、血清样本、血浆样本、胎盘拭子、脐带拭子、粪便样本、皮肤拭子、口腔拭子、唾液样本、牙周拭子、咽喉拭子、鼻拭子、囊泡液样本、鼻咽拭子、鼻孔拭子、结膜拭子、直肠拭子以及支气管拭子。
7.根据权利要求1所述的方法,包括生成所述微生物组样本的“微生物分类丰度简档”,其中,生成所述“微生物分类丰度简档”还包括:
从所述怀孕受试者获得所述微生物组样本,
经由测序平台(112)从所述微生物组样本获得经测序的微生物DNA数据,其中获得所述经测序的微生物DNA数据包括:
使用至少一种DNA提取技术分离对应于所述微生物组样本中存在的所述多种微生物的微生物DNA;以及
使用至少一种DNA测序技术对所述微生物DNA进行测序以获得经测序的微生物DNA数据;并且
通过由所述硬件处理器(202)使用一种或多种分类学分类技术以计算方式分析所述经测序的微生物DNA数据,而生成所述微生物组样本的所述“微生物分类丰度简档”。
8.根据权利要求1所述的方法,包括生成所述微生物组样本的所述“微生物分类丰度简档”,其中,生成所述“微生物分类丰度简档”还包括:
经由微生物组样本接收器(110),从所述怀孕受试者获得所述微生物组样本;
通过应用以下一种或多种技术经由微生物组表征平台(108)而获得所述微生物组样本的微生物组表征数据,所述一种或多种技术包括:显微镜检查、流式细胞术方法、基于体外培养的方法、一种或多种酶或荧光测定、或涉及对来自复杂微生物种群的信号的光谱鉴定和筛选的一种或多种测定,其中所述微生物组表征数据包括:显微镜成像数据、流式细胞术细胞测量数据、体外培养中生长的微生物的菌落计数和细胞表型数据、信号强度数据;并且
通过由所述硬件处理器使用一种或多种分类学分类技术以计算方式分析所述微生物组表征数据,而生成所述微生物组样本的所述“微生物分类丰度简档”。
9.根据权利要求7所述的方法,还包括以下中的至少一种:1)根据所述微生物DNA对细菌16S rRNA或23S rRNA标记基因进行扩增和测序,2)根据所述微生物DNA对细菌16S rRNA或23S rRNA标记基因的全长或一个或多个特定区域进行扩增和测序,或者3)根据所述微生物DNA对一个或多个***发育标记基因进行扩增和测序。
10.根据权利要求7所述的方法,其中,所述至少一种DNA测序技术选自下一代测序技术,其中所述下一代测序技术包括:全基因组鸟枪法(WGS)测序、基于片段库的测序技术、配对库或基于双端库的测序技术或其组合。
11.根据权利要求1所述的方法,其中,“i”值和“j”值的预定义范围在0到100的范围内,并且其中i和j的预定义范围被定义为使得i+j等于100。
12.根据权利要求1所述的方法,其中,所述分类构成偏度在0到1的范围内取值。
13.根据权利要求1所述的方法,其中,所述集合“DSR”的所述集中趋势值是平均值、中值、众数或将单个值标识为对所述集合DSR中的值的整体分布的表示的任何统计测度中的一个。
14.根据权利要求1所述的方法,其中,所述集合DSR的所述分布特征值包括以下中的一个:所述集合DSR的最大值、所述集合DSR的最小值、所述集合DSR的方差、所述集合DSR的偏度、或者表征所述集合DSR中的值的分布的模态、对称性、变异性的度量。
15.根据权利要求1所述的方法,其中,应用于所述集中趋势值的所述数学变换包括以下中的一个的数学变换方法:从单位一中减去所述集中趋势值、计算所述集中趋势值的倒数、或导致了针对所述集合DSR的较低集中趋势值生成较高数值的分类构成偏度以及反之亦然。
16.根据权利要求1所述的方法,其中,所述怀孕受试者被分类为针对向着早产的趋势的一个或多个风险类别,其中所述分类基于所述集合DSR的所述集中趋势值、所述集合“DSR”的所述分布特征值或所述“分类构成偏度”值中的至少一个,并且其中所述一个或多个风险类别包括低早产风险类别、中度早产风险类别和高早产风险类别。
17.根据权利要求16所述的方法,其中,针对从孕妇获得的***微生物组样本,对于大于0.922的所述“分类构成偏度”值,指示所述低早产风险类别,对于在0.887至0.922的范围内的所述“分类构成偏度”值,指示所述中度早产风险类别,并且对于小于0.887的所述“分类构成偏度”值,指示所述高早产风险类别,并且其中所述“分类构成偏度”值通过从单位一减去计算出的所述集合DSR的中值而获得。
18.根据权利要求16所述的方法,其中,针对从孕妇获得的***微生物组样本,对于大于0.113的所述集合DSR的所述集中趋势值,指示所述高早产风险类别,对于在0.078至0.113范围内的所述集合DSR的所述集中趋势值,指示所述中度早产风险类别,对于小于0.078的所述集合DSR的所述集中趋势值,指示所述低早产风险类别,并且其中所述集合DSR的所述集中趋势值是所述集合DSR的中值。
19.一种用于评估怀孕受试者的早产风险的***(100),所述***(100)包括计算***(102),所述计算***(102)进一步包括:
硬件处理器(202);以及
存储器(204),其被耦合到所述硬件处理器(202),其中所述硬件处理器(202)执行被存储在所述存储器(204)中的多个模块(208),并且其中所述多个模块(208)包括:
计算模块(212),用于:
接收从怀孕受试者获得的微生物组样本的“微生物分类丰度简档”,其中所述微生物分类丰度简档包含所述微生物组样本中存在的多种微生物的丰度值;并且
针对所述“微生物分类丰度简档”,计算“分类构成偏度”值和分布特征值中的至少一个,其中所述“分类构成偏度”值和所述分布特征值量化了来自所述微生物分类丰度简档的所述多种微生物的丰度值的偏差,其中对所述“分类构成偏度”值和所述分布特征值的计算包括:
(a)通过计算来自所述微生物分类丰度简档的所述多种微生物的丰度值之和来获得总种群数“M”;
(b)创建包含来自所述微生物分类丰度简档的所述多种微生物的丰度值的经排序的列表“L”,其中所述经排序的列表“L”包括存在于所述微生物分类丰度简档中按丰度值的递增次序或递减次序排名的多种微生物,并且其中,当列表L按丰度值的递增次序排序时,经排序的列表“L”中排名靠前的一个或多个条目对应于“稀疏分类群”,并且经排序的列表“L”中排名垫底的一个或多个条目对应于“优势分类群”,并且当列表L按丰度值的递减次序排序时,经排序的列表“L”中排名靠前的一个或多个条目对应于“优势分类群”,并且经排序的列表“L”中排名垫底的一个或多个条目对应于“稀疏分类群”;
(c)计数其累积丰度≥总种群计数“M”的i%的“稀疏分类群”的最小数量(STi),其中当列表L按递增次序排序时,丰度值按经排序的列表“L”中每种微生物的递增排名的次序逐渐累积,或者计数其累积丰度≥总种群计数“M”的i%的“稀疏分类群”的最小数量(STi),其中当列表L按递减次序排序时,丰度值按经排序的列表“L”中每种微生物的递减排名逐渐累积,并且其中“i”是整数或分数;
(d)计数其累积丰度≥总种群计数“M”的j%的“优势分类群”的最小数量(DTj),其中当列表L按递增次序排序时,丰度值按经排序的列表“L”中每种微生物的递减排名的次序逐渐累积,或者计数其累积丰度≥总种群计数“M”的j%的“优势分类群”的最小数量(DTj),其中当列表L按递减次序排序时,丰度值按经排序的列表“L”中每种微生物的递增排名逐渐累积,并且其中“j”是整数或分数;
(e)重复步骤c和d以获得针对预定义范围的“i”值和“j”值的STi和DTj的计数,以分别生成两个值集合“ST”和“DT”,其中i和j属于预定义范围内的两个相同的算术级数,并且其中所述算术级数的连续项之间的公差是预定义的整数或预定义的分数值;
(f)计算集合“DT”和集合“ST”的笛卡尔乘积,以获得包含对应于DTj值和STi值的多个有序对的集合“C”;
(g)通过针对所述集合“C”中的每个有序对而计算(DTj÷STi)来导出集合“DSR”;
(h)计算所述集合“DSR”的所述分布特征值,其中所述集合“DSR”的所述分布特征值包括所述集合DSR的集中趋势值;
(i)通过对包括所述集合“DSR”的集中趋势值的所述分布特征值应用数学变换来计算所述“分类构成偏度”值;并且
基于所述集合DSR的所述集中趋势值、所述集合“DSR”的所述分布特征或所述“分类构成偏度”值中的至少一个来确定所述怀孕受试者的早产风险。
20.根据权利要求19所述的***,包括:
微生物组样本接收器(110),用于从所述怀孕受试者接收所述微生物组样本;
微生物组表征平台(108),用于:
从所述微生物组样本接收器(110)接收所述微生物组样本;以及
通过应用来自以下技术组的至少一种技术来获得所述微生物组样本的微生物组表征数据,所述技术组包括:测序技术、显微镜检查、流式细胞术方法、基于体外培养的方法、一种或多种酶或荧光测定、或涉及对来自复杂微生物种群的信号的光谱鉴定和筛选的一种或多种测定,其中所述微生物组表征数据包括显微镜成像数据、流式细胞术细胞测量数据、体外培养中生长的微生物的菌落计数和细胞表型数据、信号强度数据;并且
所述微生物分类丰度简档生成模块(210)由所述硬件处理器使用一种或多种分类学分类技术以计算方式分析所述微生物组表征数据,以生成所述微生物组样本的所述微生物分类丰度简档。
21.根据权利要求20所述的***,包括
测序平台(112),用于:
从所述微生物组样本接收器(110)接收所述微生物组样本;
使用至少一种DNA提取技术分离对应于所述微生物组样本中存在的所述多种微生物的微生物DNA;并且
使用至少一种DNA测序技术对所述微生物DNA进行测序以获得经测序的微生物DNA数据;并且
所述微生物分类丰度简档生成模块(210)使用一种或多种分类学分类技术以计算方式分析所述经测序的微生物DNA数据,以生成所述微生物组样本的所述微生物分类丰度简档。
22.根据权利要求19所述的***,其中,所述怀孕受试者是女性或雌性胎生动物。
23.根据权利要求20所述的***,其中,所述微生物组表征平台(108)包括测序平台(112)、显微镜平台(114)、核酸杂交平台(116)或细胞分选平台(118)中的至少一个。
24.根据权利要求19所述的***,其中,“i”值和“j”值的预定义范围在0到100的范围内,并且其中i和j的预定义范围被定义为使得i+j等于100。
25.根据权利要求19所述的***,其中,所述分类构成偏度在0到1的范围内取值。
26.根据权利要求19所述的***,其中,通过将所述怀孕受试者分类为针对早产的一个或多个风险类别来确定所述怀孕受试者的早产风险,其中所述怀孕受试者的分类基于所述集合DSR的所述集中趋势值、所述集合“DSR”的所述分布特征值或所述“分类构成偏度”值中的至少一个,并且其中所述一个或多个风险类别包括低早产风险类别、中度早产风险类别和高早产风险类别。
27.根据权利要求26所述的***,其中,针对从孕妇获得的***微生物组样本,对于大于0.922的所述“分类构成偏度”值,指示所述低早产风险类别,对于在0.887至0.922的范围内的所述“分类构成偏度”值,指示所述中度早产风险类别,并且对于小于0.887的所述“分类构成偏度”值,指示所述高早产风险类别,并且其中所述“分类构成偏度”值通过从单位一减去计算出的所述集合DSR的中值而获得。
28.根据权利要求26所述的***,其中,针对从孕妇获得的***微生物组样本,对于大于0.113的所述集合DSR的所述集中趋势值,指示所述高早产风险类别,对于在0.078至0.113范围内的所述集合DSR的所述集中趋势值,指示所述中度早产风险类别,对于小于0.078的所述集合DSR的所述集中趋势值,指示所述低早产风险类别,并且其中所述集合DSR的所述集中趋势值是所述集合DSR的中值。
29.一种非暂时性计算机可读介质,其体现可由硬件处理器在计算设备中执行以用于评估怀孕受试者的早产风险的程序,所述程序包括:
用于接收从怀孕受试者获得的微生物组样本的“微生物分类丰度简档”的程序代码,其中所述微生物分类丰度简档包含所述微生物组样本中存在的多种微生物的丰度值;以及
用于针对所述“微生物分类丰度简档”计算“分类构成偏度”值和分布特征值中的至少一个的程序代码,其中所述“分类构成偏度”值和所述分布特征值量化了来自所述微生物分类丰度简档的所述多种微生物的丰度值的偏差,其中对所述“分类构成偏度”值和所述分布特征值的计算包括:
a)通过计算来自所述微生物分类丰度简档的所述多种微生物的丰度值的总和来获得总种群计数“M”;
b)创建包含来自所述微生物分类丰度简档的所述多种微生物的丰度值的经排序的列表“L”,其中所述经排序的列表“L”包括存在于所述微生物分类丰度简档中按丰度值的递增次序或递减次序排名的多种微生物,并且其中,当列表L按丰度值的递增次序排序时,经排序的列表“L”中排名靠前的一个或多个条目对应于“稀疏分类群”并且经排序的列表“L”中排名垫底的一个或多个条目对应于“优势分类群”,并且当所述列表L按丰度值的递减次序排序时,经排序的列表“L”中排名靠前的一个或多个条目对应于“优势分类群”并且经排序的列表“L”中排名垫底的一个或多个条目对应于“稀疏分类群”;
c)计数其累积丰度≥总种群计数“M”的i%的“稀疏分类群”的最小数量(STi),其中当所述列表L按递增次序排序时,丰度值按经排序的列表“L”中每种微生物的递增排名的次序逐渐累积,或者,计数其累积丰度≥总种群计数“M”的i%的“稀疏分类群”的最小数量(STi),其中当所述列表L按递减次序排序时,丰度值按经排序的列表“L”中每种微生物的递减排名逐渐累积,并且其中“i”是整数或分数;
d)计数其累积丰度≥总种群计数“M”的j%的“优势分类群”的最小数量(DTj),其中当所述列表L按递增次序排序时,丰度值按经排序的列表“L”中每种微生物的递减排名的次序逐渐累积,或者计数其累积丰度≥总种群计数“M”的j%的“优势分类群”的最小数量(DTj),其中当所述列表L按递减次序排序时,丰度值按经排序的列表“L”中每种微生物的递增排名逐渐累积,并且其中“j”是整数或分数;
e)重复步骤c和d以获得针对预定义范围的“i”值和“j”值的STi和DTj的计数,以分别生成两个值集合“ST”和“DT”,其中i和j属于预定义范围内的两个相同的算术级数,并且其中所述算术级数的连续项之间的公差是预定义的整数或预定义的分数值;
f)计算集合“DT”和集合“ST”的笛卡尔乘积,以获得包含对应于DTj值和STi值的多个有序对的集合“C”;
g)通过针对所述集合“C”中的每个有序对而计算(DTj÷STi)来导出集合“DSR”;
h)计算集合“DSR”的所述分布特征值,其中所述集合“DSR”的所述分布特征值包括所述集合DSR的集中趋势值;
i)通过对包括所述集合“DSR”的所述集中趋势值的所述分布特征值应用数学变换来计算所述“分类构成偏度”值;
用于基于所述集合DSR的所述集中趋势值、所述集合“DSR”的所述分布特征或所述“分类构成偏度”值中的至少一个来确定所述怀孕受试者的早产风险的程序代码。
CN201780018749.0A 2016-02-16 2017-02-15 用于早产结果的早期风险评估的方法和*** Active CN108778287B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
IN201621005426 2016-02-16
IN201621005426 2016-02-16
PCT/IB2017/050840 WO2017141169A1 (en) 2016-02-16 2017-02-15 Method and system for early risk assessment of preterm delivery outcome

Publications (2)

Publication Number Publication Date
CN108778287A CN108778287A (zh) 2018-11-09
CN108778287B true CN108778287B (zh) 2021-08-31

Family

ID=59624818

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201780018749.0A Active CN108778287B (zh) 2016-02-16 2017-02-15 用于早产结果的早期风险评估的方法和***

Country Status (7)

Country Link
US (1) US11062808B2 (zh)
EP (1) EP3416653B1 (zh)
JP (1) JP7060518B2 (zh)
CN (1) CN108778287B (zh)
AR (1) AR107737A1 (zh)
AU (1) AU2017220785B2 (zh)
WO (1) WO2017141169A1 (zh)

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
RU2699733C1 (ru) * 2018-03-30 2019-09-09 Федеральное государственное бюджетное образовательное учреждение высшего образования "Московская государственная академия ветеринарной медицины и биотехнологии - МВА имени К.И. Скрябина" (ФГБОУ ВО МГАВМиБ - МВА имени К.И. Скрябина) Способ лабораторной ультразвуковой диагностики ранних стадий жеребости
US20200115766A1 (en) * 2018-08-10 2020-04-16 Tata Consultancy Services Limited Method and system for improving amplicon sequencing based taxonomic resolution of microbial communities
SG11202108405VA (en) 2019-02-14 2021-08-30 Mirvie Inc Methods and systems for determining a pregnancy-related state of a subject
CN112587089B (zh) * 2020-11-19 2023-04-21 新希望六和股份有限公司 基于人工智能的妊娠检测方法、装置、计算机设备和介质
CA3211735A1 (en) * 2021-03-18 2022-09-22 Brice Gaudilliere Systems and methods to generate a surgical risk score and uses thereof
KR102559223B1 (ko) * 2021-07-19 2023-07-26 주식회사 디앤피바이오텍 기계 학습에 기반한 조산 위험도 예측 장치
US11664100B2 (en) * 2021-08-17 2023-05-30 Birth Model, Inc. Predicting time to vaginal delivery
KR20230150145A (ko) 2022-04-21 2023-10-30 이화여자대학교 산학협력단 마이크로바이옴을 분석하는 학습 모델을 이용한 조산 예측 방법 및 분석장치
CN115227295B (zh) * 2022-09-19 2023-01-24 深圳市雄帝科技股份有限公司 咽拭子采样设备

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8068990B2 (en) * 2003-03-25 2011-11-29 Hologic, Inc. Diagnosis of intra-uterine infection by proteomic analysis of cervical-vaginal fluids
US7627437B2 (en) 2005-01-14 2009-12-01 Idaho Research Foundation Categorization of microbial communities
WO2008073491A1 (en) * 2006-12-11 2008-06-19 University Of Florida Research Foundation, Inc. System and method for analyzing progress of labor and preterm labor
WO2009134452A2 (en) * 2008-05-01 2009-11-05 Swedish Health Services Preterm delivery diagnostic assay
CA2779270A1 (en) * 2009-10-29 2011-05-05 The Trustees Of The University Of Pennsylvania Method of predicting risk of preterm birth
US20110152840A1 (en) 2009-12-23 2011-06-23 Drugtech Corporation Methods for reducing the occurrence of preterm delivery and other pregnancy-related conditions
US20140186332A1 (en) * 2012-12-28 2014-07-03 NX Pharmagen Biomarkers of preterm birth
WO2014152985A1 (en) * 2013-03-14 2014-09-25 Children's Hospital Medical Center Biomarkers of preterm necrotizing enterocolitis
US20140287948A1 (en) 2013-03-15 2014-09-25 Sera Prognostics, Inc. Biomarkers and methods for predicting preterm birth
US10633714B2 (en) * 2013-07-21 2020-04-28 Pendulum Therapeutics, Inc. Methods and systems for microbiome characterization, monitoring and treatment
EP3125905A4 (en) * 2014-04-04 2017-11-08 Ritter Pharmaceuticals, Inc. Methods and compositions for microbiome alteration
ES2767527T3 (es) * 2014-06-30 2020-06-17 Univ Hong Kong Chinese Detección de taxones bacterianos para predecir resultados adversos del embarazo

Also Published As

Publication number Publication date
AU2017220785A1 (en) 2018-09-27
AR107737A1 (es) 2018-05-30
EP3416653B1 (en) 2022-05-25
EP3416653A4 (en) 2019-06-19
CN108778287A (zh) 2018-11-09
EP3416653A1 (en) 2018-12-26
JP7060518B2 (ja) 2022-04-26
US20190046105A1 (en) 2019-02-14
JP2019511922A (ja) 2019-05-09
US11062808B2 (en) 2021-07-13
AU2017220785B2 (en) 2019-02-21
WO2017141169A1 (en) 2017-08-24

Similar Documents

Publication Publication Date Title
CN108778287B (zh) 用于早产结果的早期风险评估的方法和***
Serrano et al. Racioethnic diversity in the dynamics of the vaginal microbiome during pregnancy
Fettweis et al. The vaginal microbiome and preterm birth
Norton et al. Non-Invasive Chromosomal Evaluation (NICE) Study: results of a multicenter prospective cohort study for detection of fetal trisomy 21 and trisomy 18
Robinson et al. Intricacies of assessing the human microbiome in epidemiologic studies
US11869661B2 (en) Systems and methods for determining whether a subject has a cancer condition using transfer learning
KR20200093438A (ko) 체성 돌연변이 클론형성능을 결정하기 위한 방법 및 시스템
EP3023504B1 (en) Method and device for detecting chromosomal aneuploidy
WO2021134513A1 (zh) 确定染色体非整倍性、构建分类模型的方法和装置
Xu et al. Informative priors on fetal fraction increase power of the noninvasive prenatal screen
Bybjerg-Grauholm et al. RNA sequencing of archived neonatal dried blood spots
CN112823391B (zh) 基于检测限的质量控制度量
KR102519739B1 (ko) 2단계 Z-score에 기반한 비침습적 산전 검사 방법 및 장치
WO2023102786A1 (zh) 基因标志物在预测孕妇早产风险中的应用
WO2023246808A1 (zh) 利用癌症中剪接异常的短外显子辅助癌症诊断和预后
WO2022269566A1 (en) Systems and methods for determining oral microbiome compositions and health outcomes
JP2023109481A (ja) 妊娠関連有害事象の発生を予測する方法、予測装置及びコンピュータプログラム
WO2021112236A1 (ja) 絨毛膜羊膜炎の発症予測方法
Huang et al. A noninvasive prenatal test pipeline with a well-generalized machine-learning approach for accurate fetal trisomy detection using low-depth short sequence data
JP2024527329A (ja) 染色体および亜染色体のコピー数多型検出
Li et al. Effect of maternal age on foetal chromosomal defects: an investigation based on non-invasive prenatal testing
CN117941002A (zh) 染色体和亚染色体拷贝数变异检测
CN113450874A (zh) 预测ipf患者预后的8基因模型及应用
CN115831218A (zh) 一种孕妇早产风险预测模型及其构建方法与应用
GB2564846A (en) Prenatal screening and diagnostic system and method

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant