CN109215775A - 用于监视个体的肠道健康的方法和*** - Google Patents

用于监视个体的肠道健康的方法和*** Download PDF

Info

Publication number
CN109215775A
CN109215775A CN201810699986.4A CN201810699986A CN109215775A CN 109215775 A CN109215775 A CN 109215775A CN 201810699986 A CN201810699986 A CN 201810699986A CN 109215775 A CN109215775 A CN 109215775A
Authority
CN
China
Prior art keywords
path
acetonate
abundance
organism
ratio
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201810699986.4A
Other languages
English (en)
Other versions
CN109215775B (zh
Inventor
沙尔米拉·谢卡尔·曼德
思沃迪哈·安纳德
昌德拉尼·达斯
库恩塔尔·库马尔·布山
哈里什安姆·考尔
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tata Consultancy Services Ltd
Original Assignee
Tata Consultancy Services Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tata Consultancy Services Ltd filed Critical Tata Consultancy Services Ltd
Publication of CN109215775A publication Critical patent/CN109215775A/zh
Application granted granted Critical
Publication of CN109215775B publication Critical patent/CN109215775B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/20ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6809Methods for determination or identification of nucleic acids involving differential detection
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6813Hybridisation assays
    • C12Q1/6816Hybridisation assays characterised by the detection means
    • C12Q1/6825Nucleic acid detection involving sensors
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • C12Q1/6886Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6888Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for detection or identification of organisms
    • C12Q1/689Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for detection or identification of organisms for bacteria
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B10/00ICT specially adapted for evolutionary bioinformatics, e.g. phylogenetic tree construction or analysis
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B40/00ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
    • G16B40/10Signal processing, e.g. from mass spectrometry [MS] or from PCR
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B45/00ICT specially adapted for bioinformatics-related data visualisation, e.g. displaying of maps or networks
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B5/00ICT specially adapted for modelling or simulations in systems biology, e.g. gene-regulatory networks, protein interaction networks or metabolic networks
    • G16B5/20Probabilistic models
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/30ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for calculating health indices; for individual health risk assessment

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Chemical & Material Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Organic Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • General Health & Medical Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Analytical Chemistry (AREA)
  • Medical Informatics (AREA)
  • Biotechnology (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Biophysics (AREA)
  • Molecular Biology (AREA)
  • Genetics & Genomics (AREA)
  • Immunology (AREA)
  • Pathology (AREA)
  • Public Health (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Data Mining & Analysis (AREA)
  • Biochemistry (AREA)
  • Microbiology (AREA)
  • Evolutionary Biology (AREA)
  • Biomedical Technology (AREA)
  • Databases & Information Systems (AREA)
  • Epidemiology (AREA)
  • Physiology (AREA)
  • Primary Health Care (AREA)
  • Probability & Statistics with Applications (AREA)
  • Hospice & Palliative Care (AREA)
  • Oncology (AREA)
  • Bioethics (AREA)
  • Artificial Intelligence (AREA)
  • Animal Behavior & Ethology (AREA)
  • Computer Vision & Pattern Recognition (AREA)

Abstract

已经提供了使用无创技术来预测个体的肠道健康的***和方法。该***正在利用两种类型的路径,即一种对肠道健康有益的路径,以及另一种对肠道健康有害的路径。这两种类型的路径在肠道细菌的基因组中注明。将这些能够区分肠道共生物和病原体的路径的子集的最佳组合指定为路径生物标志物。所识别的路径生物标志物然后用于开发预测肠道健康状态的方案。

Description

用于监视个体的肠道健康的方法和***
相关申请的交叉引用
本申请要求于2017年6月29日提交的印度临时说明书No.201721022811的优先权,其全部公开整体通过引用并入本文。
技术领域
本申请大体上涉及监视个体的健康的领域。更具体地但并非特别地,本发明涉及用于使用路径(pathway)生物标记物来监视和预测个体的肠道健康的方法和***。
背景技术
宏基因组学的出现已经在理解与人类中不同身体部位共生相关的细菌微生物组方面取得了重大进展。胃肠(GT)道是细菌定植的主要部位,并且肠道微生物组的分类学构成影响宿主的肠道健康已被证实。驻留在人体内/上的微生物群反复被证明是健康的重要调节剂。病原体表示对肠有害的细菌,而共生物表示有益或共生的肠道细菌。
就营养物同化、免疫调节等而言,胃肠道的驻留微生物组(肠)的有益效果在本领域中已得到充分证实。像短链脂肪酸(SCFA)(诸如丁酸盐和丙酸盐)的肠道细菌生物合成的代谢物已显示出对宿主发挥抗炎作用。另一方面,肠道微生物组的生态失调与像肥胖、糖尿病、炎症性肠病、结直肠癌、营养不良等多种疾病有关。因此,了解肠道微生物群在健康和生态***疾病状态下的功能作用变得重要。
致病菌在肠道微生物组中的有害作用之一已归因于它们发酵未消化的蛋白质的能力。这种发酵过程的几种产物/副产物(诸如氨、对甲酚、腐胺、吲哚、苯酚等)已被认为对肠道健康有害后果。另外,产生有益代谢物(像SCFA)的很少路径也涉及导致氨释放的氨基酸发酵,其已经显示出提高肠道中的炎症反应。
因此,不仅有益/有害的产物而且细菌使用其来进行其生产的路径都形成了用于评估肠道微生物组的代谢能力的关键基础。鉴于肠道微生物群在保持生理和代谢稳态方面的重要性,它们的功能潜力可用于评估肠道健康状态。对功能潜能的预测需要对个体微生物群内的路径进行准确的标注。
基于微生物组来评估肠道健康的现有方法包括分类学生物标记物。宏基因组测序已被广泛用于分配样本中的分类组成,而差异丰富的分类群(健康的对比患病的)已与不同疾病相关联。这些基于分类学的生物标记物可能随种群(population)地理位置和饮食模式而有所不同。因此,针对特定地理区域而识别出的分类生物标记物可能不适用于不同地区/地理区域。
另一种方法涉及粪便样本中的代谢物检测。粪便物中某些代谢物(像SCFA、氨等)的存在被用于描述肠道微生物群的代谢库。这些方法没有说明其生产所涉及的代谢路径以及促成这些代谢物生物合成的肠道微生物组成员。此外,这些方法不能识别这些路径的副产物,这可能对肠道健康有害。
发明内容
以下给出本公开的一些实施例的简要概述以便提供对实施例的基本理解。该总结不是实施例的广泛概述。这并不意图识别实施例的关键/关键元件或描绘实施例的范围。其唯一目的是以简化的形式呈现一些实施例作为下面呈现的更详细描述的序言。
鉴于前述内容,本文的实施例提供了用于预测个体的肠道健康的***。该***包括输入模块、提取器、测序器、生物体路径矩阵、存储器和处理器。输入模块在两个时间戳,时间戳1和时间戳2处获得个体的肠道样本。提取器从获得的样本中提取核酸。测序器对样本进行测序以生成多个核苷酸序列。生物体路径矩阵包括作为病原体生物标志物的氨释放路径组和作为共生物生物标志物的丙酮酸盐路径。处理器还包括氨释放路径丰度计算模块、丙酮酸盐路径丰度计算模块、第一比率计算模块、第二比率计算模块、氨中值评估模块、丙酮酸盐中值评估模块和健康状态预测模块。氨释放路径丰度计算模块使用'生物体-路径矩阵'从多个核苷酸序列中获得氨释放路径组的累积丰度。丙酮酸盐路径丰度计算模块使用'生物体-路径矩阵'从多个核苷酸序列中获得丙酮酸盐路径的累积丰度。第一比率计算模块基于两个时间戳中的值计算氨释放路径组的累积丰度的第一比率。第二比率计算模块基于两个时间戳中的值计算丙酮酸盐路径的累积丰度的第二比率。氨中值评估模块评估氨释放路径组的累积丰度的氨中值。丙酮酸盐中值评估模块评估丙酮酸盐路径的累积丰度的丙酮酸盐中值。健康状况预测模块使用第一和第二比率、氨中值和丙酮酸盐中值基于预定义标准来预测个体的肠健康状态。
另一个实施例提供了一种用于预测个体的肠道健康的处理器实现的方法。最初,在两个时间戳,时间戳1和时间戳2处获得个体的肠道样本。在下一步中,从获得的样本中提取核酸。在下一步中,使用测序器对获得的样本进行测序以生成多个核苷酸序列。在下一步中,获得'生物体-路径矩阵',其中所述矩阵包括作为病原体生物标志物的氨释放路径组和作为共生物生物标志物的丙酮酸盐路径。在下一步中,使用'生物体-路径矩阵'从多个核苷酸序列中获得氨释放路径组的累积丰度。类似地,也使用“生物体-路径矩阵”从多个核苷酸序列中获得丙酮酸盐路径的累积丰度。在下一步中,基于两个时间戳中的值计算氨释放路径组的累积丰度的第一比率。类似地,还基于两个时间戳中的值计算丙酮酸盐路径的累积丰度的第二比率。在下一步中,评估氨释放路径组的累积丰度的氨中值。类似地,也评估了丙酮酸盐路径的累积丰度的丙酮酸盐中值。最后,使用第一和第二比率、氨中值和丙酮酸盐中值基于预定义标准预测个体的肠道健康状态。
在另一个实施例中,一种具有在其上实施用于预测个体的肠道健康的计算机程序的非暂时性计算机可读介质。最初,在两个时间戳,时间戳1和时间戳2处获得个体的肠道样本。在下一步中,从获得的样本中提取核酸。在下一步中,使用测序器对获得的样本进行测序以生成多个核苷酸序列。在下一步中,获得'生物体-路径矩阵',其中所述矩阵包括作为病原体生物标志物的氨释放路径组和作为共生物生物标志物的丙酮酸盐路径。在下一步中,使用'生物体-路径矩阵'从多个核苷酸序列中获得氨释放路径组的累积丰度。类似地,也使用“生物体-路径矩阵”从多个核苷酸序列中获得丙酮酸盐路径的累积丰度。在下一步中,基于两个时间戳中的值计算氨释放路径组的累积丰度的第一比率。类似地,还基于两个时间戳中的值计算丙酮酸盐路径的累积丰度的第二比率。在下一步中,评估氨释放路径组的累积丰度的氨中值。类似地,也评估了丙酮酸盐路径的累积丰度的丙酮酸盐中值。最后,使用第一和第二比率、氨中值和丙酮酸盐中值基于预定义标准预测个体的肠道健康状态。
本领域技术人员应该理解,本文的任何框图表示体现本主题原理的说明性***的概念图。类似地,可以理解的是,任何流程图、流程图、状态转换图、伪代码等都表示可以基本上在计算机可读介质中表示并且由计算设备或处理器执行的各种过程,无论是否这样计算设备或处理器被明确示出。
附图说明
根据以下参考附图的详细描述,将更好地理解本文中的实施例,其中:
图1示出了根据本公开的实施例的用于预测个体的肠道健康的***的框图;
图2示出了根据本公开的实施例的丙酮酸盐至丁酸盐、赖氨酸至丁酸盐和戊二酸盐至丁酸盐路径;
图3示出了根据本公开的实施例的组氨酸至谷氨酸和组氨酸至四氢叶酸路径;
图4示出了根据本公开的实施例的用于创建肠道生物体的数据库的流程图;
图5a-5b示出了根据本公开的实施例的用于创建“生物体-路径”矩阵的流程图;
图6示出了根据本公开的实施例的用于获取对应于氨释放和丙酮酸盐路径的路径测量的示意性流程图;
图7示出了根据本公开的实施例的用于预测T1或T2彼此相比更健康的预定标准;和
图8a-8b示出了根据本公开的实施例的说明在预测个体的肠道健康时所涉及的步骤的流程图。
具体实施方式
本文中的实施例及其各种特征和有利细节将参考在附图中示出并在以下描述中详细描述的非限制性实施例而更全面地解释。本文所使用的示例仅旨在便于理解其中可以实践本文的实施例的方式,并且进一步使得本领域技术人员能够实践本文的实施例。因此,示例不应被解释为限制本文实施例的范围。
现在参考附图,并且更具体地参考图1至图8,其中类似的附图标记在所有附图中一致地表示对应的特征,示出了优选实施例并且这些实施例在以下示例***和/或方法的上下文中被描述。
图1示出了用于使用无创技术来预测个体的肠道健康的***100的示意性框图。***100利用两种类型的路径,即对肠道健康有益的一种路径和对肠道健康有害的第二种路径。这两种类型的路径使用基于隐马尔可夫模型(HMM)的分析在肠道细菌的基因组中被注释。应该认识到,使用任何其他模型的分析完全在本公开的范围内。能够在肠道共生物和病原体之间进行区分的这些路径的子集的最佳组合被指定为路径标记,其进一步用于开发预测肠道健康状态的方案。
***100包括输入模块102、提取器104、测序器106、生物体路径矩阵108、存储器110和与存储器110通信的处理器112。处理器112被配置为读取被存储在存储器中以执行各种功能的算法。处理器112还包括用于执行各种功能的多个模块。多个模块包括氨释放路径丰度计算模块114、丙酮酸盐路径丰度计算模块116、第一比率计算模块118、第二比率计算模块120、氨中值评估模块122、丙酮酸盐中值评估模块124和健康状况预测模块126。
输入模块102被配置为充当***100的输入用户界面。输入模块102被配置为在两个时间戳(即,时间戳1和时间戳2)处从个体的肠道获取样本。应该认识到,时间戳1和时间戳2对应于任何两个不同的时间点。例如,可以在所述个体的例行健康筛查期间、在健康顾问/医师规定的所述个体的健康筛查期间、在所述个体的任何治疗方案的过程期间等的两个不同时间点处获取样本。在另一个实施例中,对应于时间戳1和时间戳2的肠道样本是指两个不同个体的肠道样本。在另一个实施例中,时间戳1和时间戳2对应于其中两个种群的肠道健康正被比较的两个不同种群数据。
在本公开的实施例中,从个体的粪便、拭子、组织、液体中的至少一种中获取肠道样本。应该理解,可以从扩增子测序或宏基因组测序中获取样本。在另一个实施例中,样本还可以使用像聚合酶链式反应(PCR)的技术来获取,其中使用引物来扩增所提到的路径的每个基因。此外,样本也可以从所提到的路径的组成基因的表达数据中获取。在示例中,输入模块102可以被称为用户界面或输入/输出界面102。I/O界面用户可以允许***100直接或通过客户端设备与用户交互。输入模块102可以促进多种网络和协议类型内的多种通信,包括有线网络(例如LAN、电缆等)和无线网络(诸如WLAN、蜂窝或卫星)。输入模块102可以包括一个或多个端口,用于将包括残疾人使用的辅助技术设备或自适应产品的多个设备彼此连接或连接到另一个服务器。
从输入模块102接收到的样本被用于使用提取器104提取核酸。此外,然后使用测序器106对DNA样本进行测序。使用高通量测序技术来执行测序。测序导致产生多个核苷酸序列。
根据本公开的实施例,***100利用一组氨释放路径作为病原体的生物标记物并且利用丙酮酸盐路径作为共生物的生物标记物。应该理解,如图2和图3所示,一组氨释放路径对应于组氨酸->谷氨酸盐、组氨酸->四氢叶酸(THF)、赖氨酸->丁酸盐和戊二酸盐->丁酸盐中的一种或多种。丙酮酸盐路径(丙酮酸盐->丁酸盐)被示出在图2中。应当理解,***100不限于仅使用上述路径。例如,可以使用任何其他氨基酸氧化路径作为病原体的生物标记物。
尽管应该理解,为了清楚和更好的理解,但是本公开将使用一组氨释放路径和丙酮酸盐路径来预测个体的肠道健康。
根据本公开的实施例,如图4的流程图200中所示,使用文献挖掘策略来创建肠道生物体DGO的数据库。最初在步骤202处,为每个生物创建搜索查询字符串Qn,每个生物体n来自基因组列表。在本示例中,使用NCBI数据库中完整的细菌基因组。因此查询将如下所示:
['名称字符串']+[(肠)或(肠溶)或(胃肠)]
该搜索字符串的任何其他同义词或任何其他变体的使用都在本公开的范围内。
在下一个步骤204中,像Pubmed一样的策划文献搜索引擎与查询字符串Qn一起用作输入并且获取摘要An的列表作为针对每个查询字符串Qn的输出。然后在步骤206处,列表An中的每个被用于查找具有字符串“共生”或“有益”的生物体n的出现。在接下来的步骤208中,列表An中的每个被用于查找具有字符串“病原体”或“有害”或“疾病”的生物体n的出现。在步骤210处,对与病原生物体和共生生物体相对应的生物体的出现的查找被整理以创建肠道生物体的数据库。最后在步骤212处,手动搜索还可以被用于进一步填充肠道生物体DGO的数据库。还创建了与此数据库相对应的哈希DGO,其中键是生物体名称,并且值是‘P’(病原体)或‘C’(共生物)。
根据本公开的实施例,***100还被配置为创建基因组路径矩阵。最初在步骤302处,从典型的基因组中创建序列的数据库‘DS’,其中本公开中所处理的丙酮酸盐(丙酮酸盐->丁酸盐)和腐烂路径(戊二酸盐->丁酸盐、赖氨酸->丁酸盐、4-氨基丁酸盐->丁酸盐、组氨酸->谷氨酸盐、组氨酸->四氢叶酸盐、色氨酸->吲哚、酪氨酸->苯酚、精氨酸->腐胺、酪氨酸->甲酚)已经通过实验表征。‘DS’中的序列对应于上述路径中涉及的蛋白质。在接下来的步骤304中,在DS上执行基于HMM的搜索以识别对应的Pfam域并将这些域存储在数据库DPF中。任何其他同源搜索/注释方法以及域/蛋白质数据库都在本发明的范围内。因此所识别出的Pfam域被存储在数据库‘DPF’中。在步骤306处,利用作为路径(P)的键和作为值的对应的PFAM列表来创建哈希PD。
在下一个步骤308中,使用DPF作为域数据库而在DGO上执行基于HMM的蛋白质搜索。任何其他同源搜索/注释方法以及域/蛋白质数据库都在本发明的范围内。在步骤310处,对于DGO中的每个基因组G,使用基因组的位置图作为参考(在此情况下从NCBI数据库中提供的‘ptt文件’获取)来创建位置阵列LAG。类似地,对于哈希PD中的每个键P,考虑了使用基因组G的LAG作为参考位于彼此的10个基因的窗口内的所有值(这是本实施方式中的Pfam)。在步骤312处,利用基因组名称和路径来创建矩阵M,其中如果路径Pfams不存在于LAG的10个基因的窗口内则值为0,并且如果路径Pfams存在于LAG的10个基因内则值为1。进一步在步骤314处,来自矩阵M的共生物子矩阵MC利用具有为1的丙酮酸盐路径值的基因组来提取。类似地,在步骤316处,来自矩阵M的病原体子矩阵MP利用具有为1的氨释放路径值的基因组来提取。
根据本公开的实施例,***100还被配置为查找能够区分共生物和病原体的路径组的最佳组合。最初,来自M的子矩阵MC利用使丙酮酸盐路径值为1的基因组来提取。将子矩阵MC中的每个基因组映射到哈希DGO的健并记录对应的值。观察到丙酮酸盐路径(如图2所示)与共生肠道细菌具有绝对相关性。
进一步,所有可能的独特组合用2至8个腐烂路径(在段落[032]中提到)构建。对于每个组合,来自M的子矩阵MP利用使路径中的至少一个的值为1的基因组来提取。然后将子矩阵MP中的每个基因组映射到哈希DGO的键并且记录对应的值。获得四个路径组(赖氨酸->丁酸盐、戊二酸盐->丁酸盐、组氨酸->谷氨酸盐和组氨酸->四氢叶酸盐)作为可表示致病性肠道细菌的最佳组合(在DGO中被列出)。这四条路径已经在图2和图3中描绘。
根据本公开的实施例,***100还被配置为使用氨释放路径丰度计算模块114和丙酮酸盐路径丰度计算模块116来分别计算氨释放路径组和丙酮酸盐路径的累积丰度。如果样本根据标记基因已经被测序,则计算累积路径丰度的步骤还包括:首先,在两个时间标记处为个体或者为具有表示健康的亚种群的一个矩阵以及表示消化不良的亚种群的其他矩阵(或者在治疗期间的疾病的两个阶段)的种群提供属丰度的输入矩阵M1和M2。共生物的路径丰度矩阵可以计算如下:
对应于属丰度矩阵M1的共生物路径丰度矩阵AM1C=MC*M1
对应于属丰度矩阵M2的共生物路径丰度矩阵AM2C=MC*M2。
类似地,病原体的路径丰度矩阵可以如下计算:
对应于属丰度矩阵M1的病原路径丰度矩阵AM1P=MP*M1
对应于属丰度矩阵M2的病原路径丰度矩阵AM2P=MP*M2。
根据本公开的实施例,如果样本已经从宏基因组、基因表达数据中的至少一种被测序或者从引物扩增(PCR)获取,则计算累积路径丰度的步骤进一步包括:首先,计算病原体路径的累积基因丰度。随后计算共生物路径的累积基因丰度。
根据本公开的实施例,***100还被配置为计算个体的路径比率,如图6的示意性流程图中所示。路径比率使用第一比率计算模块118和第二比率计算模块120来计算。如上面在本示例中所述,氨释放路径组和丙酮酸盐路径被用于预测个体的肠道健康。如图6所示,赖氨酸(L)、戊二酸(G)、四氢叶酸(T)和组氨酸(H)对应于氨释放路径组,并且丙酮酸盐(P)对应于丙酮酸盐路径。该图示出了在两个不同时间戳T1和T2处的对应路径丰度,其中V是对特定路径有贡献的分类群的累积丰度的对应值。首先,在步骤402处,对于氨释放路径(L、G、T和H)中的每个,使用氨释放路径丰度计算模块114来计算在T1和T2处的分类群(具有该路径)的累积丰度的比率RA(第一比率)。在步骤404处,检查RA是否大于1.5。如果RA大于1.5,则在步骤406处将路径丰度置于组1中。如果RA小于1.5,则在步骤408处检查RA是否小于0.6。如果RA不小于0.6,则在步骤410处丢弃RA。如果RA小于0.6,则在步骤412处将路径丰度置于组2中。在下一个步骤414处,查找组中值丰度并从组1和组2中选择具有较高值的组。最后在步骤416处,记录所选组的RA值和组中值丰度,被称为“氨中值”(AM)。
类似地,在步骤418处,使用丙酮酸盐路径丰度计算模块116计算对应于T1和T2处的丙酮酸盐路径的分类群的累积丰度的比率RP(第二比率)。在步骤420处,检查比率RP是否大于1.5或小于0.6。如果RP既不大于1.5也不小于0.6,则在步骤422处丢弃RP。如果RP大于1.5或小于0.6,则在步骤424处记录RP和组中值丰度,称为“丙酮酸盐中值”(PM)。
根据本公开的实施例,***100还包括氨中值评估模块120和丙酮酸盐中值评估模块122。氨中值评估模块120和丙酮酸盐中值评估模块122被配置为分别计算氨中值和丙酮酸盐中值。氨中值是具有氨释放路径组的细菌分类群的丰度的中值。丙酮酸盐中值是具有丙酮酸盐至丁酸盐路径的细菌分类群丰度的中值。
根据本公开的实施例,***100进一步被配置为基于预定义的标准集合基于RA、RP、AM和PM的值来预测个体的健康,也如图7所示。健康状态预测模块126使用预定义的标准来确定人的健康。预定义的标准包括基于以下条件预测相比于彼此是T1还是T2更健康:
如果比率RA和RP均大于1.5,并且氨中值(AM)大于丙酮酸盐中值(PM),则预测T2更健康;
如果比率RA和RP均大于1.5,并且AM小于PM,则预测T1更健康;
如果比率RA和RP均小于0.6,并且AM大于PM,则预测T1更健康;
如果比率RA和RP均小于0.6,并且氨中值小于丙酮酸盐中值,则预测T2更健康;
如果第一比率RA小于0.6,并且第二比率RP大于1.5,则预测T1更健康;并且如果第一比率RA大于1.5,并且第二比率RP小于0.6,则预测T2更健康。
应该理解的是,路径丰度也可以通过各种其他技术来预测。在一个实施例中,可以使用宏基因组样本来预测分类丰度和基因丰度。然后可以利用该信息来预测路径丰度并且从而使用本公开中所讨论的方法和***来监视肠道健康。
在另一个实施例中,可以(通过如PCR的技术)扩增对应于所提到的路径的每个基因的引物。然后可以利用该信息来预测路径丰度并且从而使用本发明中所讨论的方法和***来监视肠道健康。因此,上面的两种方法提供了基因信息,这将允许预测实际路径丰度,而不是从分类丰度中推断它。
在又一个实施例中,所提到的路径的组成基因的表达数据可以被用于预测路径丰度,并且从而使用本公开中所讨论的方法和***来监视肠道健康。
在操作中,在图8a-8b中示出了示出预测个体的肠道健康所涉及的步骤的流程图500。首先,在步骤502处,在两个时间戳(时间戳1和时间戳2)处获得个体的肠道样本。在一个示例中,样本可以从同一个人的两种生理状况中获得。在步骤504处,从获得的样本中提取核酸。并且在步骤506处,然后使用测序器106对所获得的样本进行测序以生成多个核苷酸序列。
在下一步骤508处,获得生物体路径矩阵,其中所述矩阵包括作为病原体的生物标记物的氨释放路径组以及作为共生物的生物标记物的丙酮酸盐路径。病原体表示对肠道有害的细菌,并且共生物表示对肠道有益或与肠道共生的细菌。
在步骤510a处,使用生物体路径矩阵从多个核苷酸序列获得氨释放路径组的累积丰度。类似地,在步骤510b处,使用生物体路径矩阵从多个核苷酸序列获得丙酮酸盐路径的累积丰度。可以同时执行步骤510a和510b。尽管应该理解的是,在另一个实施例中,任何其他路径也可以被用作病原体或共生物的生物标记物。贯穿该实施例,对应于特定路径的细菌分类群的累积丰度被称为“路径丰度”。在下一步骤512a中,使用第一比率计算模块118针对氨释放路径组计算两个时间戳处的分类群的累积丰度的第一比率。并且在步骤512b处,使用第二比率计算模块120对应于丙酮酸盐路径计算两个时间点处的分类群的累积丰度的第二比率。
在下一步骤514中,评估氨释放路径组的累积丰度的氨中值。类似地,在步骤516处,评估丙酮酸盐路径的累积丰度的丙酮酸盐中值。并且最后在步骤518处,使用健康状态预测模块118,使用第一比率和第二比率基于预定义标准来预测个体的健康状态。
根据本公开的实施例,***100还可以被提供为用于评估个体的健康的工具或工具组。该工具可以包括用于将肠道样本接收作为输入的输入模块。该工具进一步包括处理器和输出模块。处理器将处理输入数据,并且可以在输出模块上显示个体的健康状态。
根据本公开的一个实施例,工具组可以包含两个隔间,其中第一隔间可以包含用于标记物基因(例如16S rRNA)检测的探针,而第二隔间包括与构成本公开内容所述的路径(路径生物标记物)的每个基因(或基因的一部分)互补的一系列cDNA。这将允许预测路径以及两个时间戳之间基于分类的变化。此外,可以使基于分类的变化与路径变化相关联,以理解每个分类群的贡献并且设计更具体的个性化治疗方法(regime)。
对于第一隔间,输入可以是时间戳中的每个的肠道样本的标记物基因的提取,接着进行PCR扩增和测序。这些扩增子(regime)在被添加到隔间时可以通过如荧光团、化学发光等的信号检测到。而对于第二个隔间,输入可以是来针对每个时间点的样本的mRNA/cDNA提取,接着与互补于上述路径域的对应的cDNA探针杂交。杂交可以使用如荧光团、化学发光等的视觉信号来检测,并且被用作为路径中的每个的表达以及两个时间戳之间的差异表达的指示符(indicator)。
根据本公开的一个实施例,***100还可以借助以下实验数据来验证:
案例研究1
该数据集涉及公众可获得的序列数据,其对应于从来自西班牙群体(population)的患有结肠直肠癌的58个个体获得的代表性肠道微生物组样本。以下研究论文被引用以获得数据集:“Genomic analysis identifies association of Fusobacterium withcolorectal carcinoma-by Kostic AD,Gevers D,Pedamallu CS,Michaud M,Duke F,EarlAM,Ojesina AI,Jung J,Bass AJ,Tabernero J,Baselga J,Liu C,Shivdasani RA,OginoS,Birren BW,Huttenhower C,Garrett WS,Meyerson M.2012.Genome Res 22:292-298”。对于每个受试者,考虑对应于结肠的受癌症影响区域以及侧翼未受影响的区域的两组16SrRNA序列。使用RDP分类器对所获得的序列执行***分类,并且获得了分类丰度矩阵。这个矩阵被归一化并且提取出了五个路径的代表性分类群的丰度以用于进一步分析。下面使用来自所研究的数据集的样本C0355讨论使用图4和图5中所描述的方法获得的结果的示例。
(i)代表性样本中对应于不同路径的丰度值
表I
上表中提到的缩写所表示的路径如下:
L:赖氨酸->丁酸盐
G:戊二酸盐->丁酸盐
T:组氨酸->四氢叶酸盐
H:组氨酸->谷氨酸盐
P:丙酮酸盐->丁酸盐
上面的表格指示了包含所提到的路径中的每个的分类群的总丰度。例如,第二列指示在样本T1中具有赖氨酸路径的分类群的总归一化丰度为0.257(VL1),而在样本T2中为0.03(VL2)。针对其他路径(VG1-VG2、VH1-VH2、VT1-VT2和VP1-VP2)描绘了类似值。
(ii)两个时间戳处输入样本中的路径丰度的比例
下一步骤涉及计算两个样本之间的这些路径中的每一个的丰度的倍数变化。
因此,上表指示与T2相比,利用细菌的赖氨酸的丰度在T1中为~8.7倍。可以对其他路径作出类似的推论。注意,氨释放路径(赖氨酸、戊二酸盐、组氨酸和THF)的R RA>1.5,丙酮酸盐路径的R RP<0.6。
(iii)对肠道健康状态(GHS)的预测
可以注意到,尽管组氨酸路径的丰度存在大约四倍的变化,但在两个宏基因组样本中这些路径的平均丰度非常少(T1中为0.004,并且T2中为0.001)。相反,除了其比率高(~8.7)之外,赖氨酸路径的丰度也非常高。这些观察表明,除了比率之外,应该向路径的归一化的丰度给予权重(考虑两个样本)。因此,在预测肠道健康状态时,将两种样本(T1和T2)中每种路径的平均丰度考虑在内。对于氨释放路径(赖氨酸、戊二酸盐、组氨酸和THF),基于RA(比率)的值形成组。由于所有四个路径的值均大于1.5,因此所有四个路径均被包括在组1中。此外,RP被获得为<0.6。因此,由于RP<0.6并且RA>1.5(图6中的情况4),预测对应于T2的样本比T1更健康。
该预测符合本研究提供的样本C0355的元数据,其中样本1和样本2分别对应于CRC和正常样本。在研究中对所有58个样本执行类似的分析。结果显示,在大多数样本(70.69%)中,共生物以及病原性路径生物标记物两者都能够捕捉肠道健康状态。在其余案例中(29.31%),可以基于两种路径生物标记物中的任何一种来预测肠道健康状态。
案例研究2
本研究中使用的数据集包括来自美国明尼苏达州的14名患有艰难梭菌感染(CDI)的粪便样本。以下研究论文被引用以获得数据集:“Recovery of the Gut Microbiomefollowing Fecal Microbiota Transplantation-by Seekatz,A.M.,Aas,J.,Gessert,C.E.,Rubin,T.A.,Saman,D.M.,Bakken,J.S.,and Young,V.B.2014.mBio 5:e00893-14。这些患者受到抗生素治疗,然后进行粪便微生物组移植。我们使用我们新颖的GHS预测方案针对这些样本评估了肠道健康的变化。结果显示共生物以及病原性路径生物标记物能够在64.3%的样本中捕获肠道健康状态,而对于其余的案例(35.7%),路径生物标记物中的至少一种可以预测肠道健康状态。
书面描述描述了本文的主题,以使任何本领域技术人员能够制造和使用这些实施例。主题实施例的范围由权利要求定义并且可以包括本领域技术人员想到的其他修改。如果这些其他修改具有与权利要求的字面语言并无不同的相似要素,或者如果其包括与权利要求的字面语言无实质区别的等同要素,则这样的其他修改旨在在权利要求的范围内。
这里本公开的实施例提供了一种用于预测个体的肠道健康的***和方法。
然而,应理解,保护的范围被扩展至其中具有消息(message)的这种程序以及计算机可读的装置,这种计算机可读的存储装置包含程序代码装置,其用于当程序在服务器或与移动设备或任何适合的可编程的设备上运行时实施本方法的一个或多个步骤。硬件设备可以是可以被编程的任何种类的设备,包括例如任何种类的像服务器或个人计算机等的计算机,或其任何组合。该设备还可以包括可以是例如像例如专用集成电路(ASIC)、现场可编程门阵列(FPGA)的硬件装置或硬件装置和软件装置的组合,例如,ASIC和FPGA,或者具有硬件模块位于其中的至少一个微处理器和至少一个存储器。因此,该装置可以包括硬件装置和软件装置二者。可以在硬件和软件中实施本文描述的方法实施例。该设备还可以包括软件装置。可替选地,可以在不同硬件设备上实施这些实施例,例如使用多个CPU。
本文的实施例可以包括硬件元件和软件元件。在硬件中实施的实施例包括但不限于固件、常驻软件、微码等。可以在其他模块或其他模块的组合中实施由本文描述的各种模块执行的功能。为了本描述的目的,计算机可用的或计算机可读的介质可以是可以包括、存储、通信、传播或传输程序的用于由指令执行***、装置或设备使用或与其连接的任何装置。
介质可以是电、磁、光、电磁、红外或半导体***(或装置或设备)或传播介质。计算机可读的介质的示例包括半导体或固态存储器、磁带、可移动计算机软磁盘、随机存取存储器(RAM)、只读存储器(ROM)、硬磁盘和光盘。光盘当前的示例包括光盘只读存储器(CD-ROM)、可读写光盘(CD-R/W)和DVD。
适于存储和/或执行程序代码的数据处理***将包括通过***总线而被直接或间接耦合至存储元件的至少一个处理器。存储元件可以包括在程序代码的实际执行期间采用的本地存储器、大容量存储器和提供对至少一些程序代码的临时存储以减少在执行期间必须从大容量存储器检索代码的次数的高速缓冲存储器。
可以直接或通过中间I/O控制器将输入/输出(I/O)设备(包括但不限于键盘、显示器、指向设备等)耦合至该***。网络适配器也可以被耦合至***,以使得数据处理***能够通过中间私人或公共网络与其他数据处理***或远程打印机或存储设备耦合。调制解调器、电缆调制解调器和以太网卡只是当前可用类型的网络适配器中的几个。
用于实践这些实施例的代表性硬件环境可以包括根据本文的实施例的信息处理/计算机***的硬件配置。本文的***包括至少一个处理器或中央处理单元(CPU)。经由***总线将CPU与诸如随机存取存储器(RAM)、只读存储器(ROM)和输入/输出(I/O)适配器的各种设备进行互连。I/O适配器可以连接至诸如磁盘单元和磁带驱动器或***可读的其他程序存储设备的***设备。该***可以读取程序存储设备上的发明指令(inventiveinstructions),并按照这些指令来执行本文实施例的方法。
该***进一步包括用户界面适配器,其将键盘、鼠标、扬声器、麦克风和/或诸如触摸屏设备(未示出)的其他用户界面设备连接至总线以收集用户输入。此外,通信适配器将总线连接至数据处理网络,并且显示适配器将该总线连接至显示设备,该显示设备可以例如被体现为诸如监视器、打印机或发射机的输出设备,。
已经参照各种实施例呈现了前面的描述。本申请所属领域的普通技术人员将理解,在不有意脱离本发明的原理、精神和范围的情况下,可以对所描述的结构和操作方法进行变更和改变。

Claims (19)

1.一种用于预测个体的肠道健康的方法,所述方法包括以下步骤:
在两个时间戳,时间戳1和时间戳2,处获得所述个体的肠道样本(502);
从获得的样本中提取核酸(504);
从提取的核酸样本中生成多个核苷酸序列(506);
获得'生物体-路径矩阵',其中所述矩阵包括作为病原肠道细菌的生物标志物的氨释放路径组以及作为共生肠道细菌的生物标志物的丙酮酸盐路径的存在/不存在状态(508);
使用'生物体-路径矩阵'评估来自所述多个核苷酸序列的氨释放路径组的累积丰度(510a);
使用'生物体-路径矩阵'评估来自所述多个核苷酸序列的丙酮酸盐路径的累积丰度(510b);
基于所述两个时间戳中的值计算所述氨释放路径组的累积丰度的第一比率(512a);
基于所述两个时间戳中的值计算所述丙酮酸盐路径的累积丰度的第二比率(512b);
评估所述氨释放路径组的累积丰度的氨中值(514);
评估所述丙酮酸盐路径的累积丰度的丙酮酸盐中值(516);和
使用所述第一比率和所述第二比率、所述氨中值和所述丙酮酸盐中值,基于预定义标准来预测所述个体的肠道健康状态(518)。
2.根据权利要求1所述的方法,其中,所述肠道样本从所述个体的粪便、肠拭子、肠组织或肠液中的至少一种获得。
3.根据权利要求1所述的方法,其中,所述时间戳1和所述时间戳2指示两个不同的时间点。
4.根据权利要求1所述的方法,其中,对应于所述时间戳1和所述时间戳2 的肠道样本是指两个不同个体的肠道样本。
5.根据权利要求1所述的方法,其中,所述时间戳1和所述时间戳2对应于两个不同的种群,其中两个种群的肠道健康正被比较。
6.根据权利要求1所述的方法,其中,所述多个核苷酸序列通过以下中的至少一个生成:
基于16S rRNA基因或任何其他细菌分类学标记基因的扩增子测序,
全基因组测序或宏基因组测序,
用于靶向测序路径基因的PCR(聚合酶链式反应)技术,或
用于测量基因表达水平的微阵列或RNA测序技术。
7.根据权利要求1所述的方法,其中,所述氨释放路径组对应于组氨酸至谷氨酸盐、组氨酸至四氢叶酸盐(THF)、赖氨酸至丁酸盐和戊二酸盐至丁酸盐中的一种或多种,其中从通过一次性过程设定的亲本路径中将所述氨释放路径组选择作为'病原体路径',其中所述一次性过程包括使用'生物体-路径矩阵'选择代表肠道生物体数据库'DGO'中列出的病原肠道细菌组的最佳氨释放路径组。
8.根据权利要求1所述的方法,其中,所述丙酮酸盐路径对应于丙酮酸盐至丁酸盐,其中通过一次性过程将所述丙酮酸盐路径选择作为'共生物路径',其中所述一次性过程包括使用'生物体-路径矩阵'将丙酮酸盐路径的存在与在肠道生物体数据库'DGO'中列出的共生细菌组相关联。
9.根据权利要求1所述的方法,还包括如下创建'生物体-路径矩阵'的步骤:
创建对应于丙酮酸盐和氨释放路径的蛋白质序列数据库(DS),其中所述蛋白质序列来自实验识别的含有所述路径的细菌(302);
在所述数据库DS上执行基于隐马尔可夫模型(HMM)的搜索(304);
识别对应的PFAM域并存储在数据库DPF中(304);
利用作为路径的键和作为值的对应的PFAM列表来创建哈希PD(306);
使用所述数据库DPF在预定义的'肠道生物体(DGO)数据库'的蛋白质序列上执行基于HMM的PFAM域搜索(308);
使用所述DGO的每个生物体的基因位置图在DGO的每个生物体中创建针对所识别的PFAM域的'PFAM位置阵列'(310);和
创建'生物体-路径矩阵',其中'1'的值表示所述路径的存在并且'0'的值表示所述路径的不存在,其中对于每个路径(即,所述哈希PD的每个键'i'),如果对应的PFAM(即,与所述哈希PD的键'i'相对的值)出现在针对DGO中的生物体的所述PFAM位置阵列的10个基因的窗口内,则分配'1'的值,否则分配'0'的值(312);。
10.根据权利要求1所述的方法,还包括以下步骤:
获得共生物子矩阵包括提取与具有为1的丙酮酸盐路径值的生物体相对应的子矩阵(314);和
获得病原体子矩阵包括提取与具有为1的氨释放路径值的生物体相对应的子矩阵(316)。
11.根据权利要求1所述的方法,其进一步包括如下步骤:如果使用扩增子测序、全基因组测序或宏基因组测序中的至少一个对所述样本进行测序,则如下计算所述累积路径丰度:
在所述时间戳1处获得个体的细菌属丰度的第一输入矩阵;
在所述时间戳2处获得个体的细菌属丰度的第二输入矩阵;
通过将预定义的共生物子矩阵与所述第一输入矩阵相乘来计算所述第一输入矩阵的共生物路径的累积丰度;
通过将预定义的共生物子矩阵与所述第二输入矩阵相乘来计算所述第二输入矩阵的共生物路径的累积丰度;
通过将预定义的病原体子矩阵和所述第一输入矩阵相乘来计算所述第一输入矩阵的病原体路径的累积丰度;和
通过将预定义的病原体子矩阵和所述第二输入矩阵相乘来计算所述第二输入矩阵的病原体路径的累积丰度。
12.根据权利要求1所述的方法,还包括如下步骤:如果已经使用PCR、微阵列或RNA测序技术对所述样本进行测序,则如下计算所述累积路径丰度:
计算病原体路径的累积基因丰度;和
计算共生物路径的累积基因丰度。
13.根据权利要求1所述的方法,还包括计算氨中值的步骤,其中氨中值是具有氨释放路径组的细菌分类群丰度的中值。
14.根据权利要求1的方法,还包括计算丙酮酸盐中值的步骤,其中丙酮酸盐中值是具有丙酮酸盐至丁酸盐路径的细菌分类群丰度的中值。
15.根据权利要求1所述的方法,其中,所述预定义标准包括:
如果所述第一比率大于1.5并且所述第二比率大于1.5并且所述氨中值大于所述丙酮酸盐中值,则预测时间戳2更健康;
如果所述第一比率大于1.5并且所述第二比率大于1.5并且所述氨中值小于所述丙酮酸盐中值,则预测时间戳1更健康;
如果所述第一比率小于0.6并且所述第二比率小于0.6并且所述氨中值大于所述丙酮酸盐中值,则预测时间戳1更健康;
如果所述第一比率小于0.6并且所述第二比率小于0.6并且所述氨中值小于所述丙酮酸盐中值,则预测时间戳2更健康;
如果所述第一比率小于0.6并且所述第二比率大于1.5,则预测时间戳1更健康;和
如果所述第一比率大于1.5并且所述第二比率小于0.6,则预测时间戳2更健康。
16.根据权利要求8所述的方法,还包括使用文献挖掘策略如下创建所述肠道生物体的数据库(DGO)的步骤:
从细菌生物体列表中为每个生物体创建查询字符串(202);
用策划文献搜索引擎单独搜索每个查询字符串作为输入,其中所述搜索导致为每个查询字符串生成摘要列表作为输出(204);
从每个查询字符串的摘要列表中查找具有对应于有益生物体的字符串的生物体的出现(206);
从每个查询字符串的摘要列表中查找具有对应于病原生物体的字符串的生物体的出现(208);
整理所挖掘的信息,以标记肠道细菌为'病原体'或'共生物'以创建肠道生物体数据库(210);和
手动搜索以进一步填充肠道生物体数据库(212)。
17.一种用于预测个体的肠道健康的***,所述***包括:
输入模块(102),用于在两个时间戳,时间戳1和时间戳2,处获得所述个体的肠道样本;
提取器(104),用于从获得的样本中提取核酸;
测序器(106),用于测序所述样本以生成多个核苷酸序列;
'生物体路径矩阵'(102),其中所述矩阵包括作为病原体的生物标志物的氨释放路径组和作为共生物的生物标志物的丙酮酸盐路径;
存储器(110);和
与所述存储器通信的处理器(112),其中所述处理器还包括:
氨释放路径丰度计算模块(114),其被配置为使用所述'生物体-路径矩阵'从所述多个核苷酸序列中获得所述氨释放路径组的累积丰度;
丙酮酸盐路径丰度计算模块(116),其被配置为使用所述'生物体-路径矩阵'从所述多个核苷酸序列中获得丙酮酸盐路径的累积丰度;
第一比率计算模块(118),其被配置为基于所述两个时间戳中的值计算所述氨释放路径组的累积丰度的第一比率;
第二比率计算模块(120),其被配置为基于所述两个时间戳中的值计算所述丙酮酸盐路径的累积丰度的第二比率;
氨中值评估模块(122),其被配置为评估所述氨释放路径组的累积丰度的氨中值;
丙酮酸盐中值评估模块(124),其被配置为评估所述丙酮酸盐路径的累积丰度的丙酮酸盐中值;和
健康状况预测模块(126),其被配置为使用所述第一比率和所述第二比率、所述氨中值和所述丙酮酸盐中值,基于预定义标准来预测所述个体的肠道健康状态。
18.一种用于预测个体的肠道健康的工具,包括:
输入模块,用于接收输入样本;
处理器,其被配置为使用如权利要求1至权利要求17中的任一项中执行的方法分析所述输入样本,其中所述处理器还包括:
第一隔室,用于检测标记物基因,和
第二隔室,其包括与构成多个路径的每个域互补的一系列cDNA;和
输出模块,用于基于所述处理器的分析来显示所述个体的健康。
19.一种具有在其上实施用于预测个体的肠道健康的计算机程序的非暂时性计算机可读介质,所述计算机程序包括以下步骤:
在两个时间戳,时间戳1和时间戳2,处获得所述个体的肠道样本;
从获得的样本中提取核酸;
从提取的核酸样本中生成多个核苷酸序列;
获得'生物体-路径矩阵',其中所述矩阵包括作为病原肠道细菌的生物标志物的氨释放路径组以及作为共生肠道细菌的生物标志物的丙酮酸盐路径的存在/不存在状态;
使用'生物体-路径矩阵'评估来自所述多个核苷酸序列的氨释放路径组的累积丰度;
使用'生物体-路径矩阵'评估来自所述多个核苷酸序列的丙酮酸盐路径的累积丰度;
基于所述两个时间戳中的值计算所述氨释放路径组的累积丰度的第一比率;
基于所述两个时间戳中的值计算所述丙酮酸盐路径的累积丰度的第二比率;
评估所述氨释放路径组的累积丰度的氨中值;
评估所述丙酮酸盐路径的累积丰度的丙酮酸盐中值;和
使用所述第一比率和所述第二比率、所述氨中值和所述丙酮酸盐中值,基于预定义标准来预测所述个体的肠道健康状态。
CN201810699986.4A 2017-06-29 2018-06-29 用于监视个体的肠道健康的方法和*** Active CN109215775B (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
IN201721022811 2017-06-29
IN201721022811 2017-06-29

Publications (2)

Publication Number Publication Date
CN109215775A true CN109215775A (zh) 2019-01-15
CN109215775B CN109215775B (zh) 2022-03-18

Family

ID=62841846

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810699986.4A Active CN109215775B (zh) 2017-06-29 2018-06-29 用于监视个体的肠道健康的方法和***

Country Status (4)

Country Link
US (1) US11688519B2 (zh)
EP (1) EP3421616A1 (zh)
CN (1) CN109215775B (zh)
CA (1) CA3010042A1 (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109055517A (zh) * 2018-07-27 2018-12-21 成都大熊猫繁育研究基地 一种基于肠道微生物检测获得大熊猫饲喂食物配方的方法以及饲喂方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2014190229A1 (en) * 2013-05-24 2014-11-27 President And Fellows Of Harvard College Methods of isolating microorganisms and uses thereof
CN104204810A (zh) * 2012-03-22 2014-12-10 雀巢产品技术援助有限公司 苯乙酰谷氨酰胺作为健康性老化的生物标志物
CN104781669A (zh) * 2012-07-09 2015-07-15 谢鲍生物科技股份公司 同时验证在粪便中的生物标记物用于检测在胃肠道内,特别是肠内病理变化的检验试剂盒(组合快速检验)
CN104884959A (zh) * 2012-10-05 2015-09-02 雀巢产品技术援助有限公司 作为ibs的诊断标志物的微生物组抗体、应激因子和肥大细胞标志物
CN105046094A (zh) * 2015-08-26 2015-11-11 深圳谱元科技有限公司 肠道菌群的检测***及其方法和动态式数据库

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2008076696A2 (en) 2006-12-18 2008-06-26 Washington University In St. Louis The gut microbiome as a biomarker and therapeutic target for treating obesity or an obesity related disorder
DK2955232T3 (da) * 2014-06-12 2017-11-27 Peer Bork Fremgangsmåde til diagnosticering af adenomer og/eller colorektal cancer (CRC) baseret på analyse af tarmmikrobiom
WO2016008954A1 (en) * 2014-07-15 2016-01-21 Institut National De La Recherche Agronomique Gut bacterial species in hepatic diseases
CN106822119A (zh) * 2017-02-28 2017-06-13 丹诺医药(苏州)有限公司 一种利福霉素‑硝基咪唑偶联分子的新用途

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104204810A (zh) * 2012-03-22 2014-12-10 雀巢产品技术援助有限公司 苯乙酰谷氨酰胺作为健康性老化的生物标志物
CN104781669A (zh) * 2012-07-09 2015-07-15 谢鲍生物科技股份公司 同时验证在粪便中的生物标记物用于检测在胃肠道内,特别是肠内病理变化的检验试剂盒(组合快速检验)
CN104884959A (zh) * 2012-10-05 2015-09-02 雀巢产品技术援助有限公司 作为ibs的诊断标志物的微生物组抗体、应激因子和肥大细胞标志物
WO2014190229A1 (en) * 2013-05-24 2014-11-27 President And Fellows Of Harvard College Methods of isolating microorganisms and uses thereof
CN105046094A (zh) * 2015-08-26 2015-11-11 深圳谱元科技有限公司 肠道菌群的检测***及其方法和动态式数据库

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
DE WEIRDT, ROSEMARIE: "Micromanagement in the gut: microenvironmental factors govern colon mucosal biofilm structure and functionality", 《NPJ BIOFILMS AND MICROBIOMES》 *
李婷华: "肠道噬菌体作为健康与疾病的标志物的研究进展", 《中国微生态学杂志》 *
江振作: "基于肠道微生物代谢产物的人结直肠癌诊断方法研究", 《分析化学》 *

Also Published As

Publication number Publication date
CA3010042A1 (en) 2018-12-29
US11688519B2 (en) 2023-06-27
EP3421616A1 (en) 2019-01-02
US20190139645A1 (en) 2019-05-09
CN109215775B (zh) 2022-03-18

Similar Documents

Publication Publication Date Title
Lesker et al. An integrated metagenome catalog reveals new insights into the murine gut microbiome
Asgari et al. MicroPheno: predicting environments and host phenotypes from 16S rRNA gene sequencing using a k-mer based representation of shallow sub-samples
Goodrich et al. The relationship between the human genome and microbiome comes into view
US20190367995A1 (en) Biomarkers for colorectal cancer
Guo et al. Identification of cancer subtypes by integrating multiple types of transcriptomics data with deep learning in breast cancer
Turnbaugh et al. The human microbiome project
WO2019191649A1 (en) Methods and systems for analyzing microbiota
Kerkhof Is Oxford Nanopore sequencing ready for analyzing complex microbiomes?
Robinson et al. Intricacies of assessing the human microbiome in epidemiologic studies
Krause et al. Following the community development of SIHUMIx–a new intestinal in vitro model for bioreactor use
EP3245298B1 (en) Biomarkers for colorectal cancer related diseases
CN111315899A (zh) 与鼻部微生物组相关的鼻有关表征
Shaffer et al. SCNIC: Sparse correlation network investigation for compositional data
Denef Peering into the genetic makeup of natural microbial populations using metagenomics
Subudhi et al. Shift in cyanobacteria community diversity in hot springs of India
Fu et al. The gene expression data of Mycobacterium tuberculosis based on Affymetrix gene chips provide insight into regulatory and hypothetical genes
CN109215775A (zh) 用于监视个体的肠道健康的方法和***
Su et al. Bacterial extracellular vesicles in biofluids as potential diagnostic biomarkers
Torres-Morales et al. Site-specialization of human oral Gemella species
Lee et al. Characterizing the cancer-associated microbiome with small RNA sequencing data
Senavirathna et al. Complete genome sequences of twelve strains of Leptospira interrogans isolated from humans in Sri Lanka
CN114974432A (zh) 一种生物标志物的筛选方法及其相关应用
Chen et al. Genome-wide association study of esophageal squamous cell cancer identifies shared and distinct risk variants in African and Chinese populations
Huang et al. Gut microbial genomes with paired isolates from China illustrate probiotic and cardiometabolic effects
Rao et al. Metaomics approaches to unravel the functioning of multispecies microbial communities

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant