CN118201545A - 使用分析物测量特征和机器学习的疾病预测 - Google Patents

使用分析物测量特征和机器学习的疾病预测 Download PDF

Info

Publication number
CN118201545A
CN118201545A CN202280069731.4A CN202280069731A CN118201545A CN 118201545 A CN118201545 A CN 118201545A CN 202280069731 A CN202280069731 A CN 202280069731A CN 118201545 A CN118201545 A CN 118201545A
Authority
CN
China
Prior art keywords
analyte
features
health
data
user
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202280069731.4A
Other languages
English (en)
Inventor
J·H·朴
S·T·弗兰克
D·A·普赖斯
K·C·哈梅斯
C·R·斯特罗耶克
J·J·贝克
A·潘奇·桑塔南
P·C·辛普森
A·吉贝利
J·Y-K·李
Q·安
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Dexcom Inc
Original Assignee
Dexcom Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Dexcom Inc filed Critical Dexcom Inc
Publication of CN118201545A publication Critical patent/CN118201545A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H10/00ICT specially adapted for the handling or processing of patient-related medical or healthcare data
    • G16H10/40ICT specially adapted for the handling or processing of patient-related medical or healthcare data for data related to laboratory analysis, e.g. patient specimen analysis
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B5/00Measuring for diagnostic purposes; Identification of persons
    • A61B5/145Measuring characteristics of blood in vivo, e.g. gas concentration, pH value; Measuring characteristics of body fluids or tissues, e.g. interstitial fluid, cerebral tissue
    • A61B5/14532Measuring characteristics of blood in vivo, e.g. gas concentration, pH value; Measuring characteristics of body fluids or tissues, e.g. interstitial fluid, cerebral tissue for measuring glucose, e.g. by tissue impedance measurement
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B5/00Measuring for diagnostic purposes; Identification of persons
    • A61B5/72Signal processing specially adapted for physiological signals or for diagnostic purposes
    • A61B5/7235Details of waveform analysis
    • A61B5/7264Classification of physiological signals or data, e.g. using neural networks, statistical classifiers, expert systems or fuzzy systems
    • A61B5/7267Classification of physiological signals or data, e.g. using neural networks, statistical classifiers, expert systems or fuzzy systems involving training the classification device
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H15/00ICT specially adapted for medical reports, e.g. generation or transmission thereof
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H20/00ICT specially adapted for therapies or health-improving plans, e.g. for handling prescriptions, for steering therapy or for monitoring patient compliance
    • G16H20/10ICT specially adapted for therapies or health-improving plans, e.g. for handling prescriptions, for steering therapy or for monitoring patient compliance relating to drugs or medications, e.g. for ensuring correct administration to patients
    • G16H20/17ICT specially adapted for therapies or health-improving plans, e.g. for handling prescriptions, for steering therapy or for monitoring patient compliance relating to drugs or medications, e.g. for ensuring correct administration to patients delivered via infusion or injection
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H20/00ICT specially adapted for therapies or health-improving plans, e.g. for handling prescriptions, for steering therapy or for monitoring patient compliance
    • G16H20/60ICT specially adapted for therapies or health-improving plans, e.g. for handling prescriptions, for steering therapy or for monitoring patient compliance relating to nutrition control, e.g. diets
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H40/00ICT specially adapted for the management or administration of healthcare resources or facilities; ICT specially adapted for the management or operation of medical equipment or devices
    • G16H40/20ICT specially adapted for the management or administration of healthcare resources or facilities; ICT specially adapted for the management or operation of medical equipment or devices for the management or administration of healthcare resources or facilities, e.g. managing hospital staff or surgery rooms
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H40/00ICT specially adapted for the management or administration of healthcare resources or facilities; ICT specially adapted for the management or operation of medical equipment or devices
    • G16H40/60ICT specially adapted for the management or administration of healthcare resources or facilities; ICT specially adapted for the management or operation of medical equipment or devices for the operation of medical equipment or devices
    • G16H40/63ICT specially adapted for the management or administration of healthcare resources or facilities; ICT specially adapted for the management or operation of medical equipment or devices for the operation of medical equipment or devices for local operation
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H40/00ICT specially adapted for the management or administration of healthcare resources or facilities; ICT specially adapted for the management or operation of medical equipment or devices
    • G16H40/60ICT specially adapted for the management or administration of healthcare resources or facilities; ICT specially adapted for the management or operation of medical equipment or devices for the operation of medical equipment or devices
    • G16H40/67ICT specially adapted for the management or administration of healthcare resources or facilities; ICT specially adapted for the management or operation of medical equipment or devices for the operation of medical equipment or devices for remote operation
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/20ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/30ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for calculating health indices; for individual health risk assessment
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/50ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for simulation or modelling of medical disorders
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/70ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for mining of medical data, e.g. analysing previous cases of other patients
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H80/00ICT specially adapted for facilitating communication between medical practitioners or patients, e.g. for collaborative diagnosis, therapy or health monitoring

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Public Health (AREA)
  • General Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Primary Health Care (AREA)
  • Epidemiology (AREA)
  • Pathology (AREA)
  • Data Mining & Analysis (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • General Business, Economics & Management (AREA)
  • Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • Software Systems (AREA)
  • Evolutionary Computation (AREA)
  • Mathematical Physics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Surgery (AREA)
  • Veterinary Medicine (AREA)
  • Heart & Thoracic Surgery (AREA)
  • Biophysics (AREA)
  • Animal Behavior & Ethology (AREA)
  • Molecular Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • Computing Systems (AREA)
  • General Physics & Mathematics (AREA)
  • Nutrition Science (AREA)
  • Chemical & Material Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Medicinal Chemistry (AREA)
  • Signal Processing (AREA)
  • Physiology (AREA)
  • Emergency Medicine (AREA)
  • Fuzzy Systems (AREA)
  • Psychiatry (AREA)
  • Optics & Photonics (AREA)

Abstract

描述了使用分析物测量结果和机器学习进行疾病预测。在一个或多个具体实施中,能够基于分析物测量结果的特征的组合的稳健性度量和性能度量从分析物测量结果的多个特征中选择该组合,并且能够训练机器学习模型以使用该组合预测健康状况分类。该性能度量能够与预测该健康状况分类的准确性相关联,并且该稳健性度量能够与对分析物传感器制造可变性在准确性上的不灵敏度相关联。一旦被训练,该机器学习模型基于由可穿戴分析物监测装置收集的用户的分析物测量结果来预测用户的该健康状况分类。该特征的组合能够从该用户的分析物测量结果中提取并被输入到该机器学习模型中以预测分类。

Description

使用分析物测量特征和机器学习的疾病预测
相关申请
本申请要求2021年10月27日提交的并且名称为“一般化诊断连续葡萄糖监测器(Generalized Diagnostic Continuous Glucose Monitor)”的美国临时专利申请63/263,106号的权益,该美国临时专利申请的全部公开内容据此以引用方式并入。
背景技术
一些健康状况(例如,医学状况)产生或改变血液和/或间质液中的分析物水平。作为示例,糖尿病是影响数亿人的代谢性病症,其导致升高的血糖水平。虽然糖尿病是世界范围内死亡的主要原因之一,但是通过早期检测和适当治疗,可以在很大程度上避免由于糖尿病造成的对心脏、血管、眼睛、肾脏和神经的损害。
临床和监管团体接受的针对糖尿病的常规检测包括血红蛋白A1c(HbA1c)、空腹血浆葡萄糖(FPG)和2小时血浆葡萄糖(2Hr-PG)。FPG和2Hr-PG均是口服葡萄糖耐量检测(OGTT)的一部分,但是FPG可以与OGTT分开检测。对于FPG检测,采集血液样本并将结果用于将人分类为“正常”(例如,没有糖尿病),患有糖尿病前期,或患有糖尿病。一般来讲,如果一个人的空腹葡萄糖水平低于100毫克每分升(mg/dL),则认为该人正常,而如果该人的空腹葡萄糖水平在100mg/dL至125mg/dL之间,则该人被归类为糖尿病前期,如果该人的空腹血糖水平在两次单独的检测中高于126mg/dL,则患有糖尿病。
在为FPG检测测量人的空腹葡萄糖后,OGTT要求人饮用含糖液体以使人的血糖水平达到峰值。许多人难以忍受这种含糖饮液,尤其是孕妇。然后在接下来的两个小时内,使用额外的血液样本定期检测该人的葡萄糖水平,以进行2Hr-PG。血糖水平低于140mg/dL被认为是“正常”,而饮用含糖饮液两小时后血糖水平超过200mg/dL则表明患有糖尿病。读数在140mg/dL和199mg/dL之间表明糖尿病前期。
与OGTT的FPG和2Hr-PG检测不同,它们都在单个时间点测量一个人的葡萄糖水平,而HbA1c检测则测量用户在过去两到三个月内的平均葡萄糖水平。然而,HbA1c检测不是直接测量葡萄糖,而是测量附着在血红蛋白上的葡萄糖的百分比。当葡萄糖在人的血液中积聚时,它会附着在血红蛋白上,血红蛋白是红细胞中的携氧蛋白。红细胞在一个人体内的寿命大约为二到三个月,并且因此HbA1c检测显示了过去二到三个月血液中的平均葡萄糖水平。与FPG和2Hr-PG检测类似,从人采集血液样本并用于测量人的HbA1c水平。然而,与FPG和2Hr-PG检测不同,在进行HbA1c检测时,该人不需要处于禁食状态。在两次单独的检测中,HbA1c水平为6.5%或更高的表明该人患有糖尿病,而HbA1c水平在5.7%至6.4%之间通常表明该人患有糖尿病前期。HbA1c水平低于5.7%被认为是正常的。
施用以筛查(或诊断)糖尿病的这些常规检测中的每一种常规检测都具有各种缺陷,这些缺陷常常导致不正确的诊断。常规的糖尿病检测通常不准确,因为在不同日期施用于个体的给定检测可以导致诊断不一致,这是由于各种外部因素(诸如疾病、压力、运动增加或怀孕)导致葡萄糖水平波动。相比之下,即使HbA1c检测测量的是前两到三个月的平均葡萄糖水平,但HbA1c检测结果也会受到用户在检测前几周的葡萄糖水平的极大影响。因此,HbA1c检测结果可能会受到三个月期间血液特性变化的极大影响,例如由于怀孕或疾病。此外,由于HbA1c检测不是对血糖的直接测量,因此此类检测可能对于患有各种血液状况诸如贫血的人或患有血红蛋白异常的那些人不准确。
此外,此类常规检测通常具有较差的一致性。换句话说,这些检测不一定能检测出同一个人的糖尿病。检测类型之间缺乏一致性可能导致诊断不准确或无法确定适当的治疗计划。例如,用户可以有高空腹葡萄糖,但HbA1c分数在正常范围内。在此类场景中,关于用户是否患有糖尿病以及针对用户的治疗计划类型,不同的医生可以得出不同的结论。
最后,对不同的人(例如孕妇)进行这些检测也存在各种限制和缺点。例如,这些常规糖尿病检测要求用户去医生办公室或实验室采集血液样本,这对于一些用户来说可能是耗时、昂贵和痛苦的。这些因素中的每个因素单独或结合起来可以造成心理障碍,阻止用户接受糖尿病检测,从而降低与早期检测相关联的益处。此外,许多这些常规检测要求用户处于禁食状态,这对于包括孕妇在内的一些用户来说可能是困难的,或者甚至是危险的。
发明内容
为了克服这些问题,利用了使用从分析物测量结果和机器学习中提取的稳健准确特征的健康状况预测,包括糖尿病预测。在一个或多个具体实施中,可以基于分析物测量结果的特征的组合的稳健性度量和性能度量从分析物测量结果的多个特征中选择该组合,并且可以训练机器学习模型以使用该组合预测健康状况分类。性能度量可以与预测健康状况分类的准确性相关联,并且稳健性度量可以与对分析物传感器制造可变性在准确性上的不灵敏度相关联。一旦被训练,机器学习模型基于由可穿戴分析物监测装置收集的用户的分析物测量结果来预测用户的健康状况分类。特征的组合可以从用户的分析物测量结果中提取并被输入到机器学习模型中以预测分类。
这一发明内容以简化的形式介绍一些概念,这些概念将在下面的具体实施方式中进一步描述。因此,这一发明内容不旨在识别要求保护的主题的必要特征,也不旨在用于帮助确定要求保护的主题的范围。
附图说明
参考附图描述具体实施方式。
图1是一个具体实施的示例中的环境图,该示例可操作地采用本文所述技术。
图2更详细地描绘可穿戴分析物监测装置的示例。
图3描绘了其中分析物数据被路由到与健康状况分类相关的不同***的具体实施的示例。
图4更详细地描绘了预测***的具体实施的示例,其中选择对分析物传感器可变性稳健且对于预测健康状况分类准确的所提取分析物特征的组合。
图5示出了说明基于性能和稳健性度量的分析物特征分类和选择的示例性曲线图。
图6更详细地描绘了预测***的具体实施的示例,其中训练机器学习模型以使用所提取的分析物特征的所选择的组合来预测健康状况分类。
图7更详细地描绘了预测***的具体实施的示例,其中使用机器学习和所提取的分析物特征的所选择的组合来预测健康状况分类。
图8描绘了为通知用户关于健康状况预测而显示的用户界面的具体实施的示例,该健康状况预测基于在观察期期间收集的分析物测量结果而生成。
图9描绘了为报告用户的健康状况预测以及与健康状况预测有关的其他信息而显示的用户界面的具体实施的示例。
图10描绘了为收集附加数据而显示的用户界面的具体实施的示例,这些附加数据可用作对机器学习模型的输入以生成健康状况预测。
图11描绘了具体实施的示例中的过程,其中基于用户群体的历史分析物测量结果和结果数据来学习用于稳健地预测健康状况分类的分析物特征。
图12描绘了具体实施的示例中的过程,其中机器学习模型被训练以基于用户群体的历史分析物测量结果和结果数据来预测健康状况分类。
图13描绘了具体实施的示例中的过程,其中机器学习模型基于在观察期间由可穿戴分析物监测装置收集的用户的分析物测量结果来预测健康状况分类。
图14示出了针对具有不同糖尿病分类的参与者的高于预先确定的葡萄糖水平的百分比时间和四分位范围的示例性图表。
图15示出了包括装置的示例的各种部件的***的示例,该装置可以被实现为如参考图1至图13所描述和/或用于实现本文中所描述的技术的实施方案的任何类型的计算装置。
具体实施方式
概述
如上所述,临床和监管团体接受的针对糖尿病的常规检测包括血红蛋白A1c(HbA1c)、空腹血浆葡萄糖(FPG)和2小时血浆葡萄糖(2Hr-PG)。FPG和2Hr-PG均可以是口服葡萄糖耐量检测(OGTT)的一部分,或者FPG可以与OGTT分开检测。然而,此类常规检测关于在相同个体中检测糖尿病通常一致性较差,或者可能由于影响血糖水平的各种因素而在不同的日期产生不同的结果。对不同的人(例如孕妇)进行这些检测也存在各种限制和缺点。
因此,机器学习可用于健康状况预测,诸如糖尿病预测。健康状况预测可以通过处理由分析物监测装置经由一个或多个机器学习模型(例如,回归模型、神经网络、增强学习代理)获得的分析物测量结果(例如,葡萄糖测量结果)来执行。例如,分析物监测装置可包括针,该针被构造成穿过用户的皮肤***以接触血液和/或间质液,从而经由监测装置的传感器在观察期内测量与识别健康状况相关的一种或多种分析物。使用用户群体的历史分析物测量结果和历史结果数据来生成一个或多个机器学习模型以预测个体用户的健康状况分类(例如,糖尿病分类)。用户群体的历史分析物测量结果可以由用户群体的用户穿戴的分析物监测装置提供。此外,用于训练的历史结果数据可以因机器学习模型被配置为输出的分类而异。一般来讲,历史结果数据包括从独立于分析物监测装置的来源获得的一种或多种诊断测量。例如,历史结果数据可以表明,基于一种或更多种诊断测量,例如HbA1c、FPG或2Hr-PG(或作为FPG和2Hr-PG的组合的OGTT),用户群体的相应用户是否被临床诊断为糖尿病。因此,历史结果数据可以指示临床确定的健康状况分类。
与传统上在实验室或医生办公室进行的常规检测不同,使用可穿戴分析物监测装置使得能够远程收集分析物测量结果。例如,分析物监测装置可以例如从分析物监测装置的提供者、药房、医学检测实验室、远程医疗服务等邮寄或以其他方式提供给用户。然后,用户可以诸如通过在家中和/或工作中持续穿戴分析物监测装置而在观察期的过程中穿戴该装置。
用户可以诸如通过使用自动传感器施加器将可穿戴分析物监测装置的传感器***用户体内。与诸如HbA1c、FPG和2Hr-PG的常规检测所需的抽血不同,用户启动的分析物监测装置的应用几乎是无痛的并且不利用抽血、饮用含糖饮液或禁食。此外,自动传感器施加器可以使用户能够将传感器嵌入到用户的皮肤中,而无需临床医生或医疗保健提供者的帮助。尽管讨论了自动传感器施加器,但分析物监测装置可以以其他方式应用于人或由人以其他方式穿戴而不脱离本文所描述的技术的精神或范围,诸如在没有自动传感器施加器的情况下,在医疗保健专业人员的帮助下(或医疗保健专业人员可以简单的将可穿戴装置应用到人身上),或者通过剥离粘合剂的保护层并将粘合剂固定在人身上,仅举几例。一旦将传感器***用户的皮肤中,分析物监测装置在可能跨越多天的观察期内监测人的分析物水平。还应当理解,在一些具体实施中,传感器可以不***人的皮肤中。相反,在这种具体实施中,传感器可以简单地贴在人的皮肤上,就像贴片一样。无论如何,分析物监测装置的传感器可连续地检测分析物并使得能够产生分析物测量结果。
然而,分析物监测装置的传感器可具有制造可变性,这导致其对分析物的响应的传感器与传感器差异。例如,在不同制造批次、不同传感器品牌、相同品牌的不同传感器型号等之间可能存在制造可变性。这些制造可变性可能诸如由于传感器偏差(例如,正的或负的基线偏移)导致不同的传感器对于血液或间质液中的相同分析物水平产生不同的分析物测量结果。因此,如果一个或多个机器学习模型没有考虑制造可变性,则这些模型可能错误地预测一些用户的健康状况状态。
为了克服这些问题,从分析物测量结果中提取表示例如分析物测量结果中的值和模式的特征,并且选择对传感器的制造可变性不敏感的特征的稳健组合,并且将其用于经由机器学习模型预测健康状况。在一个或多个具体实施中,基于特征的多个候选组合中的每个候选组合的稳健性度量和性能度量来选择特征的稳健组合。特征的每个候选组合的性能度量指示使用候选组合预测健康状况分类的准确性,并且每个候选组合的稳健性度量指示对制造可变性在准确性上的不灵敏度。
为了确定稳健性度量,方差模拟器将不同百分比的模拟方差添加到历史分析物测量结果,并且用每个百分比的模拟方差来评估每个候选组合的性能。例如,稳健性度量可以测量模拟方差中每百分比变化的性能度量的平均百分比变化。在一些具体实施中,模拟方差是从具有固定标准偏差和在第一较低百分比与第二较高百分比之间的平均扫描的正态分布得出的乘法百分比偏差。具有高稳健性度量的候选组合在模拟方差中每百分比变化表现出性能度量的较低变化。可以诸如通过在滤除稳健性度量低于阈值的候选组合之后选择具有最高性能度量的候选组合来选择特征的稳健组合,以有效地平衡性能度量与稳健性度量。
一旦选择了特征的稳健组合,就训练机器学习模型以基于从用户群体的历史分析物测量结果和结果数据(例如,没有添加模拟方差)提取的特征的稳健组合来预测健康状况分类。经训练的机器学习模型处理由可穿戴分析物监测装置在观察期内收集的用户的新分析物测量结果,以预测用户的健康状况分类。特别地,经训练的机器学习模型处理从用户的新分析物测量结果提取的特征的稳健组合,以预测健康状况分类。
广义地讲,健康状况分类描述了在观察期期间关于针对其训练机器学***,诸如发展健康状况的高风险、低风险或无风险。在操作中,可以(例如,由医疗保健专业人员)使用机器学习模型预测的健康状况分类治疗该人或制定治疗计划,类似于如果使用常规检测临床诊断该人时的治疗方式(例如,患有某种类型的糖尿病和/或容易出现不利影响)。
值得注意的是,与常规糖尿病检测不同,机器学***变化的影响),机器学习模型预测的健康状况分类是基于当前观察时间段期间直接获得的葡萄糖测量结果。
然后诸如通过经由用户界面向用户、医生或用户的监护人显示健康状况分类的指示来呈现健康状况分类预测。还可以呈现其他信息,诸如分析物测量结果的可视化以及从分析物测量结果得出的其他统计数据。在一些情况下,健康状况分类预测呈现在分析物观察报告中,该报告还可以包括用户的一个或多个治疗选项、分析物监测装置在观察期期间收集的分析物测量结果的视觉表示、基于所收集的分析物测量结果生成的用户的分析物水平统计数据、严重程度、后续步骤(例如,对于医生、医疗保健专业人员或用户)、跟进请求、为分析物监测装置订购更多传感器的请求、活动水平、分析物水平或其他标记物的趋势、分析物水平或其他标记物的模式、运动模式、分析物测量结果的解释或与分析物水平相关的活动。因此,与对于糖尿病的常规血糖检测结果不同,由一个或多个机器学习模型生成的分析物观察报告可以包括对预测的详细分析以及各种治疗选项。应当理解,健康状况分类和与此类分类相关联的信息可以以多种方式提供,包括例如经由扬声器或数字助理作为音频信号输出。
有利地,利用可穿戴分析物监测装置和对分析物监测装置的传感器的制造可变性不敏感的机器学习模型来生成对用户的健康状况分类的预测增加了预测的准确性并且消除了上述诊断检测的许多不舒适方面并且不限制谁可以被检测。例如,与HbA1c不同,孕妇可以在观察期内安全地穿戴分析物监测装置。此外,由于机器学习模型应用于从多天内收集的分析物测量结果提取的特征的稳健组合,与基于单个血液样本的常规检测相比,减少了与常规检测相关的不一致性,从而提高了预测的准确性。通过准确地预测健康状况分类并通知用户、医疗保健提供者和/或远程医疗服务,所描述的机器学习模型允许早期检测健康状况,诸如糖尿病,并且识别可以减轻潜在不利健康状况的治疗选项。这样做,可以在很大程度上避免因糖尿病而对心脏、血管、眼睛、肾脏和神经造成的严重损害和死亡。
基于与准确预测健康状况分类相关联的性能度量和与对获得分析物测量结果的分析物传感器的制造可变性的不灵敏度相关联的稳健性度量来选择从分析物测量结果提取的特征的稳健组合的技术效果在于,经训练以用特征的稳健组合来预测健康状况分类的机器学习模型与用单个分析物特征或不稳健的特征的组合来训练的机器学习模型相比可具有增加的准确性。
在一些方面,本文中所描述的技术涉及一种方法,该方法包括:获得分析物测量结果的多个特征;基于与对分析物传感器的制造可变性的不灵敏度相关联的稳健性度量和与预测健康状况分类相关联的性能度量来选择多个特征中的特征的组合;以及训练一个或多个机器学习模型以使用特征的组合来预测健康状况分类。
在一些方面,本文中所描述的技术涉及一种方法,其中分析物测量结果是来自与用户群体的结果数据相关联的用户群体的历史分析物测量结果,并且其中基于稳健性度量和性能度量选择多个特征中的特征的组合包括:针对多个特征的多个候选组合中的每个候选组合生成健康状况分类的模型预测;以及基于健康状况分类相对于用户群体的结果数据的模型预测来针对多个候选组合中的每个候选组合确定性能度量。
在一些方面,本文中所描述的技术涉及一种方法,其中性能度量指示用于预测健康状况分类的灵敏度和用于基于健康状况分类相对于多个候选组合中的每个候选组合的结果数据的模型预测来预测健康状况分类的特异性中的一者或两者。
在一些方面,本文中所描述的技术涉及一种方法,其中结果数据指示用户群体的每个用户的临床确定的健康状况分类。
在一些方面,本文中所描述的技术涉及一种方法,其中基于稳健性度量和性能度量选择多个特征中的特征的组合还包括:在多个模拟轮次中模拟分析物测量结果中的分析物传感器的制造可变性,该多个模拟轮次各自向分析物测量结果引入不同百分比的模拟可变性;以及基于模拟可变性的每百分比的性能度量的变化来确定多个候选组合中的每个候选组合的稳健性度量。
在一些方面,本文中所描述的技术涉及一种方法,其中在多个模拟轮次内模拟分析物测量结果中的分析物传感器的制造可变性包括模拟不同的性能可变性和分析物传感器特性,以在每个模拟轮次中向分析物测量结果引入不同百分比的模拟可变性。
在一些方面,本文中所描述的技术涉及一种方法,其中基于稳健性度量和性能度量选择多个特征中的特征的组合还包括:基于多个候选组合中的每个候选组合相对于稳健性阈值的稳健性度量来过滤多个特征的多个候选组合;以及选择具有性能度量的最高值的所过滤的候选组合作为特征的组合。
在一些方面,本文中所描述的技术涉及一种方法,其中多个特征中的特征的组合包括第一特征和第二特征,并且其中该方法还包括使用多个特征中的每个特征的健康状况分类的模型预测来确定多个特征中的每个特征的单独性能度量和单独稳健性度量。
在一些方面,本文中所描述的技术涉及一种方法,其中第一特征和第二特征中的至少一者是分析物测量结果的趋势相关特征。
在一些方面,本文中所描述的技术涉及一种方法,其中第二特征是分析物测量结果的可变性和稳定性特征。
在一些方面,本文中所描述的技术涉及一种方法,该方法还包括:在训练一个或多个机器学习模型以使用特征的组合来预测健康状况分类之后:从由用户穿戴的分析物测量装置在观察期内获得新分析物测量结果;从新分析物测量结果中提取特征的组合的特征;将特征的组合的所提取的特征输入到一个或多个机器学习模型中;以及接收用户的健康状况分类作为一个或多个机器学习模型的输出。
在一些方面,本文中所描述的技术涉及一种装置,该装置包括:一个或多个处理器;以及存储器,该存储器上存储有可由一个或多个处理器执行以执行包括以下步骤的操作的计算机可读指令:获得由分析物传感器测量的用户的分析物数据;提取分析物数据的至少两个特征,该至少两个特征包括在分析物特征的多变量模型中,该多变量模型基于对用户群体的历史分析物数据执行的方差模拟被确定为对分析物传感器的制造可变性是稳健的;将至少两个特征的组合输入到机器学习模型;通过机器学习模型预测用户的健康状况分类;以及接收健康状况分类作为机器学习模型的输出。
在一些方面,本文中所描述的技术涉及一种装置,其中由分析物传感器在观察期内测量用户的分析物数据,并且其中健康状况分类是描述观察期期间用户关于健康状况的状态的指示。
在一些方面,本文中所描述的技术涉及一种装置,其中健康状况为糖尿病,并且其中健康状况分类为糖尿病状态、糖尿病前期状态及没有糖尿病状态中的一者。
在一些方面,本文中所描述的技术涉及一种装置,其中用训练输入部分和预期输出部分来训练机器学习模型,该训练输入部分包括从用户群体的历史分析物数据提取的至少两个特征的组合,该预期输出部分包括表示用户群体中的每个用户的健康状况分类的标签。
在一些方面,本文中所描述的技术涉及一种***,该***包括:可穿戴分析物监测装置,该可穿戴分析物监测装置包括传感器,该传感器被皮下***到用户的皮肤中以在观察期期间收集用户的分析物测量结果;存储装置,该存储装置用以维持在观察期期间收集的用户的分析物测量结果;以及预测***,该预测***用以通过从用户的分析物测量结果中提取稳健的分析物特征组合并且使用一个或多个机器学习模型处理稳健的分析物特征组合来预测用户的健康状况分类。
在一些方面,本文中所描述的技术涉及一种***,其中一个或多个机器学习模型是基于用户群体的历史分析物测量结果和历史结果数据而生成的,并且该***还包括模型管理器,该模型管理器用以:获得用户群体的历史分析物测量结果和历史结果数据,该历史分析物测量结果由用户群体中的用户所穿戴的分析物监测装置提供;从历史分析物测量结果中提取稳健的分析物特征组合;并且通过以下方式来生成一个或多个机器学习模型:向一个或多个机器学习模型提供从历史分析物测量结果提取的稳健分析物特征组合;以及基于从一个或多个机器学习模型接收的训练健康状况分类与由历史结果数据指示的临床验证的健康状况分类的比较来调整一个或多个机器学习模型的权重。
在一些方面,本文中所描述的技术涉及一种***,其中由历史结果数据指示的临床验证的健康状况分类与独立于由用户群体中的用户穿戴的分析物监测装置提供的历史分析物测量结果的一个或多个诊断测量相关联。
在一些方面,本文中所描述的技术涉及一种***,其中存储装置和预测***中的一者或两者至少部分地在可穿戴分析物监测装置处实现。
在一些方面,本文中所描述的技术涉及一种***,其中预测***在远离可穿戴分析物监测装置的一个或多个计算装置处实现。
在以下讨论中,首先描述了一个可以采用本文所述技术的环境的示例。例如,分析物监测装置可用于诸如根据图1所示的示例性具体实施在观察期内测量来自用户的一种或多种分析物。分析物监测装置可采用诸如图2所示的传感器来测量一种或多种分析物。根据本文中所描述的技术,由分析物监测装置生成的分析物数据可被路由到与健康状况分类相关的不同***,诸如图3所示。然后描述可以在讨论的环境以及其他环境中执行的具体实施的示例的细节和过程。例如,如图4的具体实施和图11的过程(例如,方法)所示,模型管理器可以对用户群体的历史分析物测量结果执行方差模拟,以识别即使在存在模拟方差的情况下也产生准确的健康状况预测的分析物特征的组合。图5中描绘了示出单独和组合的多个分析物特征的性能度量和方差灵敏度度量的示例性曲线图。一旦选择了分析物特征的组合,模型管理器可以训练机器学习模型以利用用户群体的历史分析物测量结果的分析物特征和结果数据的组合来预测健康状况分类,诸如图6的具体实施和图12的过程中所示。一旦被训练,机器学习模型可用于诸如根据图7中所示的具体实施和图13的过程基于从用户的分析物数据提取的分析物特征的组合来预测用户的健康状况分类。健康状况分类可经由图8和图9中所示的示例性用户界面输入。此外,可用于预测健康状况分类的附加健康数据可经由图10的示例性用户界面输入。关于于图14讨论如何可在糖尿病分类算法中使用从葡萄糖测量结果导出的度量的一个示例。图15示出包括可被实现为用于实现和执行上述技术的任何类型的计算装置的各种部件的示例性***。这些过程的执行不限于环境的示例,且环境的示例不限于这些过程的执行。
示例性环境
图1是可操作以采用如本文所描述的使用分析物测量结果和机器学***台108。
在所示环境100中,分析物监测装置104被描绘为由观察套件提供者106提供给人102,例如,作为观察套件的一部分。分析物监测装置104可以被提供为观察套件的一部分,例如,用于在持续多天或持续不同时间量(例如,数分钟、数小时等)的观察期内监测人102的血液和/或间质液中的一种或多种分析物的目的。如本文所用,术语“分析物”可以是指在确定用户关于健康状况的状态时经受分析的生化或化学物质。例如,术语“分析物”可以是指存在于血液和/或间质液中的代谢物或其他化学物质、蛋白质(例如,酶)或健康状况的严重性或存在(或其不存在)的另一种可测量的指示物。例如,分析物监测装置104可被配置为测量葡萄糖、乳酸盐、酮、钾、胰岛素、磷酸盐、碳酸氢盐、钙、镁、钠和血尿素氮中的一种或多种。通过示例,人102可以监测他或她的葡萄糖以预测他或她是否患有糖尿病(例如,1型糖尿病、2型糖尿病、妊娠期糖尿病(GDM)、囊性纤维化糖尿病等),是否处于发展糖尿病(例如,糖尿病前期)的风险之中,和/或是否被预测将经历与糖尿病相关的不利影响(例如,合并症、血糖异常、需要剖宫产(C-section)的巨大儿和新生儿低血糖症,仅举几例)。作为另一个示例,分析物监测装置104可以监测一种或多种分析物以预测人102是具有急性病症(例如,酮血症、酸中毒或败血症)还是具有慢性病症(例如,肝病、肾病或睡眠呼吸暂停)。
结合观察期,可以向人102提供操作指南,指示人102在观察期间执行一项或多项活动,例如指示人102饮用饮料或特定膳食(例如,与OGTT相关的相同的饮料),避免一种或更多种特定食物、锻炼和休息,仅举几例。在一个或更多个具体实施中,操作指南可以作为观察套件的一部分提供,例如书面说明。另选地或附加地,观察分析平台108可以使指令经由与人102相关联的一个或多个计算装置被传送和输出(例如,用于显示或音频输出)。观察分析平台108可以在观察期内的预定时间量已经过去(例如,两天)之后和/或基于所获得的分析物测量结果中的模式来提供这些指令用于输出。结合提供此类指令,分析物监测装置104在执行指示的活动之后自动监测人102的分析物水平,诸如通过监测人102在食用指示的膳食、执行指示的运动等后葡萄糖的变化量。
尽管在一个或多个具体实施中自始至终讨论的是持续多天,但观察期的持续时间可以是可变的,使得当已经收集到足够的分析物测量结果以准确地预测人102的健康状况分类时,观察期可以结束。作为示例,在某些情况下,人102在仅仅几个小时内的葡萄糖测量结果可以被处理,以利用统计确定性预测人102患有糖尿病。在这种情况下,观察期的持续时间可以是几个小时而不是几天。然而,一般而言,观察期持续多天以获得数据,使得可以提取特征来描述例如分析物水平的逐日变化,并防止可能由异常测量结果或观察以其他方式引起的错误预测。
为此,观察套件提供者106可以表示与获得关于人102是否具有健康状况或被预测将经历健康状况的不利影响的预测相关联的多种实体中的一个或多个实体。例如,观察套件提供者106可以表示分析物监测装置104的提供者以及监测和分析从其获得的测量结果的平台(诸如观察分析平台108)的提供者,当其也对应于分析物监测装置104的提供者时。另选地或附加地,观察套件提供者106可以对应于医疗保健提供者(例如,初级保健医师、妇产科医生(OB/GYN)、内分泌学家)、医生办公室、医院、保险提供者、医学检测实验室或远程医疗服务,仅举几例。另选地或附加地,观察套件提供者106可以对应于药剂师或药房,药剂师或药房可以具有线下实体店和/或在线提供服务。应当理解,这些只是几个示例,并且观察套件提供者106可以表示不同的实体而不脱离所描述的技术的精神或范围。
鉴于此,根据所描述的技术,可以通过各种方式向人102提供分析物监测装置104。例如,分析物监测装置104可以在医生办公室、医院、医学检测实验室或实体药房(例如,作为观察套件的一部分)交给人102。另选地,分析物监测装置104可以例如从分析物监测装置104的提供者、药房、医学检测实验室、远程医疗服务等邮寄给人102。在一个或多个具体实施中,人102可以以其他方式获得用于观察期的分析物监测装置104。
不管人102如何获得分析物监测装置104,分析物监测装置104被配置为在观察期期间监测人102的一种或多种预先确定的分析物(例如,葡萄糖),该观察期持续跨越多天的时间段。在一个或多个具体实施中,分析物监测装置104是可穿戴装置,使得其在装置执行各种操作时由人102穿戴。附加地或另选地,分析物监测装置104在被人102穿戴之前或之后执行一个或多个操作。例如,分析物监测装置104可被配置有分析物传感器,该分析物传感器检测指示人102中的分析物的一个或多个信号并且使得能够生成分析物测量结果或估计(例如,估计的葡萄糖值)。那些分析物测量结果(例如,葡萄糖测量结果)可对应于计算装置或观察分析平台108中的一者或多者或以其他方式经封装以作为分析物测量结果110(其为传感器数据118的一个示例)传送到该计算装置或观察分析平台中的一者或多者。
在至少一个具体实施中,分析物监测装置104是葡萄糖监测***。作为示例,分析物监测装置104可以被配置为连续葡萄糖监测(CGM)***,例如,可穿戴CGM***。如本文与分析物监测结合所用,术语“连续”可以是指装置基本上连续地产生测量结果的能力,使得装置可被配置为以规律或不规律的时间间隔(例如,大约每小时、大约每30分钟、大约每5分钟等),响应于与不同装置建立通信耦接(例如,当观察分析平台108与分析物监测装置104建立无线连接以检索这些测量结果中的一个或多个测量结果时)等产生分析物测量结果。然而,在其他具体实施中,葡萄糖(或其他分析物)监测可能不是“连续的”,而是在被请求时提供葡萄糖测量结果。例如,分析物监测装置104可响应于来自计算装置的请求将当前葡萄糖测量结果传送至计算装置。该请求可以以多种不同方式发起,诸如响应于对由计算装置显示的用户界面的用户输入、响应于计算装置在接近分析物监测装置104的阈值内的放置、响应于计算装置与分析物监测装置104进行物理接触、响应于来自在计算装置处实现的应用的请求等。关于图2更详细地讨论该功能以及分析物监测装置104的配置的另外方面。
除了产生传感器数据118(包括分析物测量结果110)之外,分析物监测装置104还将所产生的传感器数据118传输到例如观察分析平台108。分析物监测装置104可使用分析物传感器或其他传感器实时传送数据(例如,当产生数据时)。另选地或除此之外,分析物监测装置104可以以预定义的时间间隔将数据传送到观察分析平台108。例如,分析物监测装置104可以被配置为大约每五分钟将传感器数据118传送到观察分析平台108。在不脱离所描述的技术的精神或范围的情况下,分析物监测装置104传送传感器数据118的间隔可与上述示例不同。传感器数据118可由分析物监测装置104传送到其他计算装置(例如,根据所描述的技术,除了观察分析平台108之外或作为其替代)。
尽管分析物监测装置104可以与用于治疗健康状况(诸如用于治疗糖尿病)的可穿戴分析物监测装置类似的方式配置,但在一个或多个具体实施中,分析物监测装置104可以不同于用于治疗的装置进行配置。可以部署这些不同的配置以控制观察期的混杂因素,以便获得准确反映用户正常的日常行为的影响的测量结果。例如,这可以包括限制和/或完全阻止用户在观察期间检查这些测量结果。通过防止用户在观察期的过程中检查分析物测量结果110,观察配置进一步防止用户看到或以其他方式观察分析物测量事件(例如,葡萄糖的峰值)并改变他们的行为以抵消这些事件。
在一些情况下,分析物监测装置104可以是专门设计用于在跨越多天或一些其他时间段的观察期期间为用户收集葡萄糖测量结果的专用装置,使得可以生成糖尿病分类,该糖尿病分类可以以一种或多种方式与用户为治疗糖尿病而穿戴的可穿戴葡萄糖监测装置区分开来。在其他情况下,分析物监测装置104可以具有与用于治疗糖尿病的可穿戴葡萄糖监测装置具有相同的硬件特性,但可以包括禁用或启用不同功能的软件,诸如在观察期期间阻止用户检查分析物测量结果110的软件。在这些情况下,可以在观察期结束后启用在观察期期间禁用的功能,以使得用户可以访问先前禁用的功能,诸如能够基本上实时查看葡萄糖测量结果。
不同的配置也可以基于分析物测量结果110在健康状况预测的观察期有关的使用方式和与在健康状况的治疗有关的使用方式之间的差异。在其中健康状况为糖尿病并且分析物为葡萄糖的示例中,在治疗中,葡萄糖测量结果连续或几乎连续地接收和输出,基本上随着这些测量结果的产生,可以用于告知治疗决策,例如,以帮助一个人或者他或她的看护人决定吃什么、如何施用胰岛素、是否联系医疗保健提供者等。在这些场景中,及时(例如,基本上实时)了解测量结果和/或测量结果趋势可能对于有效减轻潜在的严重不利影响是关键的。相比之下,在这些场景中,对被观察的人(或对看护人)进行葡萄糖测量结果的接收和基本上实时输出可能不必与糖尿病预测相关。相反,为糖尿病预测产生的葡萄糖测量结果被处理,以便在观察期结束时,或在某个其他范围之后(例如,当已经产生足够的测量结果以实现统计确定性时),可以产生关于糖尿病的准确预测。
基于关于如何使用分析物测量结果的此类差异,分析物监测装置104可以具有比用于治疗(例如,糖尿病治疗)的可穿戴分析物测量装置更多的本地存储。通过示例而非限制,对于观察配置可以提供值得10至15天的分析物测量存储,而对于治疗配置可以提供值得3小时的分析物测量存储。分析物监测装置104的较大存储容量可以适合于在观察期的持续时间内存储分析物测量结果110。相比之下,用于治疗的可穿戴分析物测量装置可以被配置为卸载分析物测量结果,使得一旦测量结果被适当卸载,它们就不再本地存储在那些装置上。通过示例,用于治疗糖尿病的可穿戴葡萄糖装置可以通过经由无线连接将葡萄糖测量结果传输到外部计算装置来卸载葡萄糖测量结果,例如,以预定时间间隔和/或响应于建立或重新建立与计算装置的连接。
就分析物监测装置104可以被配置为在整个观察期存储分析物测量结果110而言,在一个或多个具体实施中,分析物监测装置104可以被配置为没有无线传输装置,例如,没有用于对分析物测量结果110进行无线传输的任何天线,并且没有用于为这种无线传输生成数据包的硬件或固件。相反,分析物监测装置104可以配置有用于经由物理、有线耦合来传送分析物测量结果110的硬件。在此类场景中,分析物监测装置104可以被“***”以从装置的存储装置中提取分析物测量结果110。
因此,分析物监测装置104可以配置有一个或多个端口,以便能够将分析物测量结果110有线传输到外部计算装置。这种物理耦合的示例可以包括微型通用串行总线(USB)连接、迷你USB连接和USB-C连接,仅举几例。尽管分析物监测装置104可被配置用于经由如上述的有线连接提取分析物测量结果110,但在不同的场景中,分析物监测装置104可以另选地或附加地被配置成通过一个或多个无线连接卸载分析物测量结果110。下面将进一步讨论涉及分析物测量结果110的有线和/或无线通信的具体实施。
除了存储和通信差异之外,分析物监测装置104还可以包括一个或多个传感器或传感器电路,该一个或多个传感器或传感器电路与为治疗健康状况设计的装置不同地进行配置。例如,用于治疗糖尿病的可穿戴式葡萄糖监测设备的传感器和电路(例如,包括测量结果算法)可以针对范围从40mg/dL到400mg/dL的测量结果进行优化。这是因为糖尿病的治疗通常涉及决定采取什么行动来减轻可能发生在范围末端的严重血糖事件,例如低血糖和高血糖。然而,为了预测糖尿病,可以不需要在这么宽的范围内进行保真度测量。相反,糖尿病预测可以适当地生成与较小的范围相关的预测,例如从120mg/dL到240mg/dL的葡萄糖测量结果范围。因此,分析物监测装置104可以包括一个或多个传感器或传感器电路,该一个或多个传感器或传感器电路被优化以在这种较小范围内产生测量结果。应当理解,以上讨论的差异仅仅是分析物监测装置104可以如何不同于被配置用于治疗健康状况的可穿戴分析物监测装置的示例,并且分析物监测装置104可以以不同的方式不同于那些装置而不脱离所描述的技术的精神或范围。
一旦分析物监测装置104产生分析物测量结果110,就将测量结果提供给观察分析平台108。如上所述,分析物测量结果110可以通过有线和/或无线连接传送到观察分析平台108作为传感器数据118。在观察分析平台108部分或完全地在分析物监测装置104上实现的场景中,例如,分析物测量结果110可以通过总线从装置的本地存储装置传输到装置的处理***。在分析物监测装置104被配置为通过处理分析物测量结果110来生成对健康状况分类的预测的场景中,分析物监测装置104还可以被配置为例如通过将健康状况分类传送到外部计算装置来提供预测的健康状况分类作为输出。在其他场景中,分析物测量结果110可以由被配置为预测健康状况分类的外部计算装置处理。
在一个或多个具体实施中,分析物监测装置104被配置为通过与外部装置的有线连接(例如,经由USB-C或一些其他物理、通信耦合)将分析物测量结果110传输到外部装置。这里,连接器可以***分析物监测装置104,或者分析物监测装置104可以***具有插座的设备中,该插座与该装置的相应触点对接。分析物测量结果110然后可以经由该有线连接从分析物监测装置104的存储装置中获得,例如,通过有线连接传输到外部装置。这样的连接可以用在如下场景中:观察期结束后,人102将分析物监测装置104诸如邮寄给医疗保健提供者、远程医疗服务、分析物监测装置104的提供者或医学检测实验室。为此,观察套件(未示出)可以包括包装(例如,信封或盒子),以在观察之后将分析物监测装置104邮寄给这样的实体。这样的连接还可以用在如下场景中:观察期结束后,人102将分析物监测装置104诸如放在医生办公室或医院(或医疗保健提供者的其他机构)、药房或医学检测实验室。另选地或附加地,涉及有线连接的场景可以涉及人102在检测期之后例如使用作为观察套件的一部分提供的电线将分析物监测装置104***外部计算装置。在这些场景中,外部计算装置可以通过网络(未示出),诸如互联网,将分析物测量结果110传送到观察分析平台108。
另选地或附加地,将分析物测量结果110提供给观察分析平台108可以涉及分析物监测装置104通过一个或多个无线连接传送分析物测量结果110。例如,分析物监测装置104可以将分析物测量结果110无线传送到外部计算装置,诸如移动电话、平板装置、膝上型计算机、智能手表、其他可穿戴健康***等。因此,分析物监测装置104可以被配置为使用一个或多个无线通信协议或技术与外部装置通信。通过示例,分析物监测装置104可以使用蓝牙(例如,蓝牙低能量链路)、近场通信(NFC)、诸如5G的长期演进(LTE)标准等中的一者或多者与外部装置通信。在分析物测量结果110被传送到外部装置以进行处理的场景中,分析物监测装置104可以配置有相应的天线和其他无线传输装置。在那些情况中,分析物测量结果110可以各种方式传送到观察分析平台108,诸如以预定的时间间隔(例如,每天、每小时或每五分钟),响应于某些事件的发生(例如,填充分析物监测装置104的存储缓冲区),或响应于观察期的结束,仅举几例。
因此,无论在何处实现观察分析平台108,观察分析平台108都获得由分析物监测装置104产生的分析物测量结果110。在一个或多个具体实施中,观察分析平台108可以全部或部分地在分析物监测装置104处实现。另选地或附加地,观察分析平台108可以全部或部分地使用分析物监测装置104外部的一个或多个计算装置来实现,该一个或多个计算装置诸如与人102相关联的一个或多个计算装置(例如,移动电话、平板装置、膝上型计算机、台式机或智能手表)或与服务提供者(例如,医疗保健提供者、远程医疗服务、对应于分析物监测装置104的提供者的服务、医学检测实验室服务等)相关联的一个或多个计算装置。在后一种场景中,观察分析平台108可以至少部分地在一个或更多个服务器装置上实现。
在所示环境100中,观察分析平台包括存储装置112。根据所描述的技术,存储装置112被配置为维持分析物测量结果110。存储装置112可以表示一个或多个数据库以及能够存储分析物测量结果110的其他类型的存储装置。存储装置112可以还存储各种其他数据,例如描述人102的人口统计信息、关于医疗保健提供者的信息、关于保险提供者的信息、支付信息、处方信息、确定的健康指标、账户信息(例如,用户名和密码)等等。如以下更详细讨论的,存储装置112可以还维持用户群体的其他用户的数据。
在所示环境100中,观察分析平台108还包括预测***114。预测***114表示处理分析物测量结果110以生成疾病和状况预测的功能,诸如预测人102是否患有糖尿病(例如,2型糖尿病、GDM、囊性纤维化糖尿病等),是否处于发展糖尿病(例如,糖尿病前期)的风险之中,和/或是否被预测将经历与糖尿病相关的不利影响(例如,合并症、血糖异常、需要剖宫产的巨大儿和新生儿低血糖症,仅举几例)。如以下更详细讨论的,预测***114使用机器学习来预测健康状况分类。机器学习的使用可以包括,例如,利用使用机器学习技术以及使用用户群体的历史分析物测量结果和历史结果数据生成的一个或多个模型来识别用于预测健康状况分类的分析物测量结果的稳健特征。
所示环境100还包括健康状况分类116,其可以由预测***114输出。根据所描述的技术,健康状况分类116可以指示是否预测该人具有所指示的健康状况或是否预测会经历与健康状况相关联的不利影响。健康状况分类116还可以用于基于分类生成一个或多个通知或用户界面,诸如包括健康状况分类(例如,该人被预测具有健康状况,诸如糖尿病)的针对医疗保健提供者的报告,或指示人102联系他或她的医疗保健提供者的针对人102的通知。可以基于健康状况分类116生成的用户界面的示例将结合图8和图9进行更详细的描述。在测量分析物的上下文中,诸如连续分析一种或多种感兴趣的分析物,以及获得描述这种测量的数据,考虑图2的以下讨论。
图2更详细地描绘了图1的分析物监测装置104的具体实施的示例200。因此,先前在图1中介绍的部件被相同地编号并且将不被重新介绍。具体地,所示示例200包括分析物监测装置104的顶视图和对应的侧视图。应当理解,在不脱离所描述的技术的精神或范围的情况下,分析物监测装置104可以各种方式根据以下讨论在具体实施中变化。
在该示例200中,分析物监测装置104被示出为包括分析物传感器202(例如,葡萄糖传感器)和传感器模块204。这里,分析物传感器202在侧视图中被描绘成已皮下地***到例如图1的人102的皮肤206中。传感器模块204在顶视图中近似为虚线矩形。在所示示例200中,分析物监测装置104还包括发射器208。传感器模块204的虚线矩形的使用指示其可被容纳在发射器208中或以其他方式在该发射器的壳体内实现。用于使得发射器208能够产生用于例如通过到观察分析平台108的无线连接传达数据的信号的天线和/或其他硬件也可容纳在发射器208的壳体内或以其他方式在该发射器的壳体内实现。在该示例200中,分析物监测装置104还包括粘结垫210。
在操作中,分析物传感器202、粘结垫210可被组装以形成施加组件,其中施加组件被配置为被施加至皮肤206,使得分析物传感器202如所描绘的那样皮下***。在此类场景中,发射器208可在该组件施加至皮肤206之后经由附接机构(未示出)附接到该组件。另选地,发射器208可作为施加组件的一部分并入,使得分析物传感器202、粘结垫210、和发射器208(具有传感器模块204)可全部同时施加至皮肤206。在一个或多个具体实施中,使用单独的传感器施加器(未示出)将该施加组件施加至皮肤206。例如,与常规血糖仪所需的手指针刺不同,对具有传感器施加器的分析物监测装置104的用户启动施加几乎是无痛的并且无需抽血。此外,自动传感器施加器通常使得人102能够将分析物传感器202皮下嵌入到皮肤206中,而无需临床医生或医疗保健提供者的协助。
也可通过将粘结垫210从皮肤206剥离来移除分析物监测装置104。应当理解,分析物监测装置104及其各种部件被示出为一个示例性形状因数,并且分析物监测装置104及其部件可具有不同的形状因数而不脱离所描述的技术的精神或范围。
在操作中,分析物传感器202经由可以是无线连接或有线连接的至少一个通信信道可通信地耦接到传感器模块204。可主动地或被动地实现从分析物传感器202到传感器模块204或从传感器模块204到分析物传感器202的通信,并且这些通信可以是连续的(例如,模拟的)或离散的(例如,数字的)。
分析物传感器202可以是响应于至少部分地独立于分析物传感器202的事件而改变或引起改变的装置、分子和/或化学物质。传感器模块204被实现来接收分析物传感器202的改变或由分析物传感器202引起的改变的指示。例如,分析物传感器202可包括葡萄糖氧化酶,该葡萄糖氧化酶与葡萄糖和氧反应以形成能够由可包括电极的传感器模块204以电化学方式检测到的过氧化氢。在该示例中,分析物传感器202可被配置为或可包括被配置为使用一种或多种测量技术来检测血液或间质液中指示葡萄糖水平的分析物的葡萄糖传感器。在一个或多个具体实施中,分析物传感器202也可被配置为检测血液或间质液中指示其他标记物(诸如乳酸水平、酮、钾离子)的分析物,这可提高识别或预测基于葡萄糖的事件(例如,高血糖症或低血糖症)的准确性。附加地或另选地,分析物监测装置104可包括分析物传感器202的附加传感器和/或架构以检测指示其他标记物的那些分析物。
在另一个示例中,分析物传感器202(或分析物监测装置104的附加传感器—未示出)可包括第一电导体和第二电导体,并且传感器模块204可以电的方式检测跨分析物传感器202的第一电导体和第二电导体的电位的改变。在该示例中,传感器模块204和分析物传感器202被配置为热电偶,使得电位的改变对应于温度改变。在一些示例中,传感器模块204和分析物传感器202被配置为检测单一分析物,例如葡萄糖。在其他示例中,传感器模块204和分析物传感器202被配置为使用各种不同的感测模式来检测多种分析物,例如,钠离子、钾离子、二氧化碳和葡萄糖。另选地或附加地,分析物监测装置104包括多个传感器以不仅检测一种或多种分析物(例如,钠离子、钾离子、二氧化碳、葡萄糖和胰岛素),而且检测一种或多种环境条件(例如,温度、湿气、移动)。因此,传感器模块204和分析物传感器202(以及任何附加传感器)可检测一种或多种分析物的存在、一种或多种分析物的不存在和/或一种或多种环境条件的改变。此外,传感器模块204和分析物传感器202(以及任何附加传感器)可以被配置为输出指示血液或间质液中的一种或多种分析物的量(例如,水平)的信号。如上所述,分析物监测装置104可被配置为产生描述单个分析物(例如,葡萄糖)或多个分析物的数据。
在一个或多个具体实施中,传感器模块204可以包括处理器和存储器(未示出)。通过利用处理器,传感器模块204可基于与分析物传感器202的指示上文所讨论的改变的通信来生成分析物测量结果110。基于来自分析物传感器202的上述通信,传感器模块204被进一步配置为生成包括至少一个分析物测量结果110的可通信数据包。在该示例200中,传感器数据118表示这些数据包。附加地或另选地,传感器模块204可将传感器数据118配置为包括附加数据,以举例的方式,该附加数据包括补充传感器信息214。补充传感器信息214可包括传感器标识符、传感器状态、对应于分析物测量结果110的温度、对应于分析物测量结果110的其他分析物的测量结果等。应当理解,在不脱离所描述的技术的精神或范围的情况下,补充传感器信息214可包括补充至少一个分析物测量结果110的多种数据。
在分析物监测装置104被配置用于无线传输的具体实施中,发射器208可以将传感器数据118作为数据流传输至计算装置(例如,图1的观察分析平台108的计算装置)。另选地或附加地,传感器模块204可(例如,在传感器模块204的存储器和/或分析物监测装置104的其他物理计算机可读存储介质中)缓冲分析物测量结果110和/或补充传感器信息214,并且使得发射器208稍后以各种规律或不规律的间隔(例如,时间间隔(大约每秒、大约每三十秒、大约每分钟、大约每五分钟、大约每小时等)、存储间隔(当所缓冲的分析物测量结果110和/或补充传感器信息214达到阈值数据量或测量结果数量时)等)传输所缓冲的传感器数据118。应当理解,在一些具体实施中,分析物监测装置104可以以多种方式与上述示例不同,而不偏离所描述的技术的精神或范围。
关于补充传感器信息214,传感器标识符表示从其他传感器(诸如其他分析物监测装置的其他传感器、之前或随后植入皮肤206中的其他传感器等)唯一地识别分析物传感器202的信息。通过唯一识别分析物传感器202,传感器标识符还可以用于识别关于分析物传感器202的其他方面,诸如分析物传感器202的制造批次、分析物传感器202的包装细节、分析物传感器202的运输细节等等。以此方式,以与分析物传感器202类似的方式制造、包装和/或运输的传感器的检测到的各种问题可以以不同方式识别和使用,例如以校准分析物测量结果110、以通知用户有缺陷的传感器、以通知制造工厂加工问题等。
补充传感器信息214的传感器状态表示分析物传感器202在给定时间的状态,例如,在产生分析物测量结果110中的一个分析物测量结果的同时传感器的状态。为此,传感器状态可包括针对分析物测量结果110中的每个分析物测量结果的条目,使得在分析物测量结果110与补充传感器信息214中捕获的状态之间存在一对一关系。例如,传感器状态可以描述分析物传感器202的操作状态。在一个或多个具体实施中,传感器模块204可识别针对给定分析物测量结果110的多个预定操作状态中的一个预定操作状态。所识别的操作状态可基于来自分析物传感器202的通信和/或这些通信的特性。
以举例的方式,传感器模块204可包括(例如,在存储器或其他存储装置中)具有预定数量的操作状态和用于从另一状态选择一个状态的基础的查找表。例如,预定状态可以包括“正常”操作状态,其中选择该状态的基础可以是来自分析物传感器202的通信落在指示正常操作的阈值内,例如,在预期时间的阈值内,在预期信号强度的阈值内,环境温度在合适温度的阈值内以按预期继续操作,等等。预定状态还可以包括指示分析物传感器202的通信的一个或多个特性在正常活动之外并且可能导致分析物测量结果110中的潜在错误的操作状态。
例如,这些非正常操作状态的基础可以包括在阈值预期时间之外接收来自分析物传感器202的通信,检测分析物传感器202在预期信号强度阈值之外的信号强度,检测合适温度之外的环境温度以按预期继续操作,检测到人102已经滚压(例如,在床上)到分析物监测装置104上,等等。在不脱离所描述的技术的精神或范围的情况下,传感器状态可以指示关于分析物传感器202和分析物监测装置104的多个方面。
在考虑了环境的示例和可穿戴分析物监测装置的示例之后,现在考虑根据一个或多个具体实施,讨论在数字媒体环境中使用分析物测量结果和机器学习的健康状况预测技术的细节的一些示例。
健康状况预测
图3描绘了具体实施300的示例,其中包括分析物测量结果的健康相关数据被路由到与健康状况预测相关的不同***。
所示示例性具体实施300包括来自图1的部件,包括观察分析平台108和人102。因此,先前在图1中介绍的部件被相同地编号并且将不被重新介绍。如下面将阐述的,具体实施300可以用于关于特定健康状况对人102的状态进行分类。例如,状态可以包括特定健康状况的不存在、特定健康状况的存在、和/或特定健康状况的严重性。在一些示例中,状态还可以包括预测人102将经历的健康状况的症状或其他不利影响、预测人102将经历的副发病变等。可以理解,如本文所用,术语“健康状况”广泛地包括可以接受医学治疗的疾病、病症和非病理状况。术语“疾病”可以指损害身体的正常功能的任何健康状况。因此,疾病诸如糖尿病在本文中可被称为健康状况。此外,“疾病”或“健康状况”可包括可被细分为不同类型的一组疾病或健康状况。例如,糖尿病可被细分为1型糖尿病、2型糖尿病、GDM、囊性纤维化糖尿病等。
所示示例性具体实施300还描绘了与人102相关联的装置302,该装置可以将分析物测量结果110提供给与健康状况预测相关的观察分析平台108和/或存储装置112。所描绘的装置302包括人102在观察期期间穿戴以产生分析物测量结果110的分析物监测装置104,以及分析物监测装置104外部的附加装置。具体地,所描绘的附加外部装置包括移动电话和智能手表,但在一个或多个具体实施中,各种其他装置可以被配置为向观察分析平台108和/或存储装置112提供分析物测量结果110。装置302的其他示例可以包括膝上型计算机、平板装置、可穿戴健康***等。
如上所述,分析物测量结果110可以经由有线或无线连接传送或以其他方式提供到观察分析平台108和/或存储装置112。例如,分析物监测装置104可以经由如上所述的有线或无线连接将分析物测量结果110提供给观察分析平台108和/或存储装置112。在附加外部装置302中的一个附加外部装置提供分析物测量结果110的场景中,分析物测量结果110可以首先从分析物监测装置104提供给附加外部装置,使得该附加外部装置将分析物测量结果110传送或以其他方式提供到观察分析平台108和/或存储装置112。
在这些场景中,附加外部装置302可以充当分析物监测装置104与观察分析平台108和存储装置112之间的中介,使得外部装置302被用来将分析物测量结果110从分析物监测装置104路由到观察分析平台108和/或存储装置112。另选地或附加地,其他装置可以将分析物测量结果110从分析物监测装置104路由到观察分析平台108和/或存储装置112。那些其他装置可以包括被配置为从分析物监测装置104提取数据并且与参与健康状况预测的实体(诸如医疗保健提供者、医院、药房、远程医疗服务、医学检测实验室等)相关联的专用装置。
所示示例性具体实施300还包括用户群体304。用户群体304表示对应于已穿戴分析物监测装置(诸如分析物监测装置104)的人的多个用户。然后,这些其他用户的分析物测量结果110由他们的相应监测装置和/或由外部计算装置提供给观察分析平台108和/或存储装置112。在一个或多个具体实施中,用户群体304包括作为至少部分地为了收集数据(包括分析物测量结果110)而进行的一项或多项研究的一部分而被选择的用户,使得数据可以用于使用机器学习(例如,使用可用于对特定健康状况进行分类的监督学习、无监督学习、强化学习等)生成一个或多个模型。
另选地或附加地,用户群体304可以包括这样的用户,对于该用户,以与针对人102生成健康状况预测类似的方式,基于在涉及分析物监测装置104的观察期期间产生的他或她的分析物测量结果,预先生成针对健康状况的分类。在对人102进行健康状况预测之前产生的并且与为收集数据而进行的研究相关的数据被称为“历史”数据,因为它们是在产生人102的分析物测量结果110之前的某个时间点产生的。类似地,在人102的健康状况预测之前产生的并且与其他用户的健康状况预测相关的数据也是历史数据。根据所描述的技术,历史数据包括例如历史分析物测量结果和历史结果数据。这些历史数据与机器学习一起用于训练或以其他方式学习针对健康状况预测和/或分类的基础模型,如关于图5更详细地描述的。与用户群体304的历史分析物测量结果相比,针对人102的健康状况预测的分析物测量结果110可以是新的分析物测量结果。
通过示例,收集与健康状况预测相关的数据的研究可以涉及参与者在多天的时间段内穿戴分析物监测装置,以便产生针对这些参与者的分析物测量结果110。在不脱离所描述的技术的精神或范围的情况下,该时间段可以具有与用于产生人102的分析物测量结果110的观察期相同或不同的持续时间。除了收集分析物测量结果110之外,可以利用这些研究来获得关于参与者的其他数据。结果数据306对应于这些其他数据中的至少一些其他数据,并且可以描述关于用户群体304的用户的各种方面。
与用于预测糖尿病一项研究有关,例如,参与者除了穿戴分析物(例如,葡萄糖)监测装置外,还可以使用产生一种或多种诊断测量的常规技术(诸如HbA1c、FPG和/或2Hr-PG)进行检测。独立诊断测量308表示描述与用户群体304的用户相关的一个或更多个这样的检测的结果的数据。例如,独立诊断测量308可以描述与用户群体304的用户相关的HbA1c、FPG、2Hr-PG(或作为FPG和2Hr-PG的组合的OGTT)和/或随机血浆葡萄糖(RPG)的结果。因此,独立诊断测量308可以表示用户群体304的临床确定的健康状况分类。鉴于此,研究参与者的分析物测量结果110可以例如通过对测量结果进行标记而与相应参与者的独立诊断测量308相关联。如以下更详细讨论的,机器学习可以通过训练过程学习分析物测量结果110中指示独立诊断测量308的特定值的模式,诸如分析物测量结果110中指示相应的人的HbA1c可能为10.0的模式。可以理解,当研究包括预测不是糖尿病的疾病和病症时,独立诊断测量308可以不同于上述那些独立诊断测量。
如图所示,结果数据306还包括观察到的不利影响310和临床诊断312。观察到的不利影响310表示描述用户群体304的用户所经历的不利影响的数据。通过与预测糖尿病相关的示例,观察到的不利影响310可以描述用户是否经历过与2型糖尿病相关联的一种或多种不利影响中的任一种不利影响,诸如糖尿病性视网膜病、白内障、青光眼、失明、严重的高血糖症或低血糖症、心脏和血管疾病、神经病变、***功能障碍、肾衰竭或终末期肾病、愈合缓慢、听力障碍、皮肤病(例如,细菌和真菌感染)、睡眠呼吸暂停和阿尔茨海默病,仅举几例。
附加地或另选地,观察到的不利影响310可以描述用户是否经历过与GDM相关联的一种或多种不利影响中的任一种不利影响,诸如她的婴儿出生体重过重(需要剖宫产)、早产(早产儿)、她的婴儿患有呼吸窘迫综合征、新生儿低血糖、她的婴儿在以后的生活中变得肥胖或发展为2型糖尿病、死产等。
附加地或另选地,观察到的不利影响310可以描述用户是否经历过与其他类型的糖尿病相关联的一种或多种不利影响,诸如与1型糖尿病、囊性纤维化糖尿病、胰腺糖尿病等相关联的影响。可以理解,观察到的不利影响310对于预测除糖尿病之外的疾病和病症可以是不同的,并且糖尿病预测是作为示例提供的。鉴于此,研究参与者的分析物测量结果110可以例如通过对测量结果进行标记而与相应参与者的观察到的不利影响310相关联。如下文更详细讨论的,机器学习可以通过训练过程学习分析物测量结果110中指示观察到的不利影响310的发生和未发生的模式,诸如分析物测量结果110中指示相应的人有一个出生体重超重需要剖宫产的婴儿的概率的模式。
临床诊断312表示描述用户群体304的用户是否已经被临床医生诊断(或未)具有健康状况或者他们是否已经被暂时或初步诊断具有健康状况的数据。举例来说,诊断可以由临床医生基于独立诊断测量308和/或观察到的不利影响310中的一个或更多个来做出。因此,诊断可以提供临床验证的健康状况分类。附加地或替代地,临床诊断312可以被配置为表示基于诊断检测的标记,这些诊断检测未被例如食品和药物管理局(FDA)或整个临床团体批准用于诊断。在糖尿病的示例中,临床诊断312的值可以指示相应用户被临床诊断为糖尿病(或某种类型的糖尿病)、被临床诊断为糖尿病前期(或任何不同类型的糖尿病前期)、被暂时或初步诊断为糖尿病、没有糖尿病(即,被筛查),使用未经批准的检测被诊断为糖尿病,或使用未经批准的检测被诊断为糖尿病前期,仅举几例。鉴于此和独立诊断测量308,例如,分析物测量结果110可以与相应研究参与者的独立诊断测量308和相应参与者的临床诊断312相关联。
机器学习可以通过训练来学习分析物测量结果110中指示独立诊断测量308的特定值并且进一步指示不同的临床诊断312的模式。作为示例性示例,机器学习可以学习分析物测量结果110中指示人的HbA1c可能为6.0(例如,“估计的A1c”)并且进一步指示临床医生的分析可能导致对糖尿病前期的诊断的模式。虽然该示例是结合人的HbA1c进行讨论的,但应当理解,可以基于不同的测量结果(例如FPG)和/或观察(例如体重增加、神经病变和睡眠呼吸暂停)来进行对糖尿病前期或糖尿病的临床诊断而不脱离所描述的技术的精神或范围。
在一个或多个具体实施中,结果数据306可以包括或可用作标签。例如,每个独立诊断测量308的值可以用于标记用户群体304的相应用户的分析物测量结果110。另选地或附加地,指示相应用户经历的观察到的不利影响310的标签可以用于标记相应用户的分析物测量结果110。另选地或附加地,指示临床诊断312的标签可以用于标记相应用户的分析物测量结果110。例如,临床诊断为糖尿病前期的用户的分析物测量结果110可以与“糖尿病前期”标签相关联,而临床诊断为糖尿病的不同用户的分析物测量结果110可以与“糖尿病”标签相关联。尽管在示例性具体实施300中描绘了独立诊断测量308、观察到的不利影响310和临床诊断312,但应当而理解,结果数据306可以包括描述用户群体304的用户的不同、额外或更少方面的数据而不脱离所描述的技术的精神或范围。
如所示示例性具体实施300中所描绘的,用户群体304的用户的分析物测量结果110和结果数据306被传送或以其他方式提供到观察分析平台108和/或存储装置112。除了分析物测量结果110和结果数据306之外,描述用户群体304的用户的其他方面的附加数据可以通过观察分析平台108和/或存储装置112获得。举例来说,这种附加数据可以包括人口统计学数据(例如,年龄、性别、种族)、病史数据(例如,身高、体重、体重指数(BMI)、体脂百分比、各种状况的存在或不存在)、压力数据、营养数据、运动数据、处方数据、身高体重数据、职业数据等。在不脱离本文所描述的技术的精神或范围的情况下,这些类型的附加数据仅仅是示例,并且附加数据可以包括更多、更少或不同类型的数据。在一个或更多个具体实施中,观察分析平台108和/或存储装置112可以获得关于人102以及关于用户群体304的用户的这样的附加数据(或至少一些附加数据)。
值得注意的是,所示示例性具体实施300分别描绘了观察分析平台108和存储装置112,并且还描绘了存储装置112和观察分析平台108之间的虚线箭头。一般而言,该箭头表示存储装置112中所维持的数据可以由观察分析平台108从存储装置112中获取。换句话说,由存储装置112维持的数据可以提供给观察分析平台108。如上所讨论的,存储装置112可以存储人102的分析物测量结果110,以及用户群体304的分析物测量结果110和结果数据306。
在一个或多个具体实施中,观察分析平台108和存储装置112可以对应于相同的实体,诸如分析物监测装置(例如,分析物测装置104)和与分析物监测相关的服务的提供者。在这样的具体实施中,观察分析平台108和存储装置112可以在“云端”中实现,跨越多个计算装置(例如,服务器)和分配给实体或以其他方式与实体相关联的存储资源(例如,通过订阅或所有权)。为此,人102的分析物测量结果110以及用户群体304的分析物测量结果110和结果数据306可以由观察分析平台108从存储装置112获得,其方式是与服务提供者相关联的服务器从与该服务提供者相关联的存储装置中获得数据。
在其他具体实施中,观察分析平台108和存储装置112可以对应于不同的实体。通过示例,存储装置112可以对应于第一实体,诸如人102的计算装置(例如,移动电话或平板装置),并且观察分析平台108可以对应于第二实体,诸如分析物监测装置和与分析物监测相关的服务的提供者。在该示例中,观察分析平台108可以至少部分地实现,作为在人102的计算装置上运行的第二实体的应用。另选地或附加地,观察分析平台108可以使用第二实体的服务器装置来实现。在应用具体实施中,第二实体的应用可以从计算机装置上本地实现的存储装置112(例如,通过总线或计算装置的其他本地传输装置)获得人102的分析物测量结果110、用户群体304的分析物测量结果110或用户群体304的结果数据中的一者或多者。在服务器的具体实施中,第二实体的服务器可以通过一个或更多个网络,例如因特网,从在计算装置上实现的存储装置112获得数据。
在观察分析平台108和存储装置112对应于不同的实体的另一个示例中,存储装置112可以对应于第一实体,诸如分析物监测装置和与分析物监测相关的服务(或与分析物监测相关的有限服务)的提供者。在再一个示例中,观察分析平台108可以对应于第二不同实体,例如服务提供商,例如第一实体的数据伙伴。在该示例中,第二实体可以被认为是与对应于存储装置112(和分析物监测装置104)的实体相关的“第三方”。当对应于数据伙伴时,观察分析平台108可以根据第一和第二实体之间的一个或更多个法律协议从第一实体(即,存储装置112)获取数据。将维持在存储装置112中的数据提供给观察分析平台108可以由应用编程接口(API)控制。
在这种类型的场景中,这种API可以被认为是针对数据(诸如分析物测量结果110和结果数据306)的“出口”。“出口”是指数据流通常从第一实体向外流向第三方(例如,第二实体)。以数据提供为背景,API可以向第三方公开一个或多个“调用”(例如,针对数据请求的特定格式)。通过示例,API可以在第三方(例如,与对应于第一实体的企业)签订协议后将这些调用公开给第三方,该协议允许第三方经由API从存储装置112获得数据。作为本协议的一部分,第三方可以同意交换支付(exchange payment)以便从第一实体获得数据。另选地或附加地,第三方可以同意(例如,经由相关联的装置)交换其产生的数据,以便从第一实体获得数据。签订协议以经由API从第一实体获得数据(例如,分析物测量结果110)的各方可称为“数据合作伙伴”。在操作中,API允许第三方以特定请求格式请求存储装置112中保存的数据(例如,分析物测量结果110和/或结果数据306),如果以特定格式进行请求,则第一实体以特定的响应格式提供所请求的数据。所请求的数据可以在网络(例如,因特网)上的一个或更多个通信(例如,数据包)中以特定响应格式提供。可以被视为“第三方”的第二实体的示例包括各种服务提供商,例如提供一个或更多个健康监测/跟踪服务、健身相关服务、远程医疗服务、医学检测实验室服务等的服务提供商。实际上,存储装置112和观察分析平台108可以使用各种装置和/或资源(例如,计算、通信、存储等)来实现,并且对应于各种装置和/或资源的实体之间的划分(或不划分)可以不同于上述的划分,而不脱离本文所描述的技术的精神或范围。
无论如何,观察分析平台108被配置为获得人102的分析物测量结果110以及用户群体304的分析物测量结果110和结果数据306并且根据所描述的技术处理它们。例如,使用用户群体304的分析物测量结果110和结果数据306,预测***114被配置为生成一个或多个机器学习模型,例如回归模型、神经网络和/或强化学习代理。一旦生成了一个或多个这样的模型,预测***114就被配置为使用那些一个或多个模型来处理人102的分析物测量结果110以预测人102的健康状况分类116,如关于图7将进一步描述的。
在所示示例性具体实施300中,预测***114被示出为输出通知314。通知314可基于健康状况分类116(图3中未示出)或包括健康状况分类116。考虑到示例,其中由预测***114的一个或多个机器学习模型输出的健康状况分类116是指示人102被预测患有糖尿病的标签,例如“1”(其中“0”指示没有糖尿病)或文本标签,诸如“糖尿病”。在这种情况下,简单地向人102提供健康状况分类116可能是不合需要的。如果这些信息没有与相关的教育材料一起提供,或者没有在适当的环境中以个性化的方式提供,那么这些信息的提供可以会以各种负面的方式影响人102,例如造成混乱、愤怒、抑郁等等。因此,通知314可以简单地基于健康状况分类116,诸如通过向人102通知观察期的结果是可用的,并指示他们安排与他或她的相关医疗保健提供者的预约。
作为对比,向人102的医疗保健提供者提供健康状况分类116可能是不合需要的。相反,(与不提供分类相比)向医疗保健提供者提供健康状况分类116可能是优选的,使得医疗保健提供者可以适当地通知人102并且为人102制定治疗计划。在此类场景中,通知314可以简单地对应于健康状况分类116。另选地,传送给医疗保健提供者(或其他人)的通知可以被配置为包括健康状况分类116以及其他信息的报告,诸如人102的分析物测量结果110在观察期内的轨迹,根据那些分析物测量结果110得出的测量、(例如,从用户群体304的历史数据中得知的)治疗建议等等。这些通知的示例将结合图8和图9进行更详细的讨论。
如上文所提及且下文进一步详细论述(例如,关于图6),可用来自用户群体304的分析物测量结果110的各种特征来训练预测***114的一个或多个机器学习模型,从而预测人102的健康状况分类116。然而,可能期望选择不仅具有用于对健康状况进行分类的临床相关性、而且对分析物监测装置104(例如,图2中所描绘的分析物监测装置104的分析物传感器202)的制造可变性稳健(或不敏感)的特征(或特征的组合),以便增加分类的准确性。相比之下,使用对制造可变性(诸如传感器偏差)敏感的分析物测量结果110的特征来预测健康状况分类116可导致误分类。例如,误分类可以包括对健康状况的假阳性、对健康状况的假阴性等。
因此,图4描绘了用于选择用于训练的特征并使用一个或多个机器学习模型来对健康状况进行分类的具体实施400的示例。先前在图1至图3中介绍的部件被相同地编号并且将不被重新介绍。
具体实施400包括模型管理器402,该模型管理器被配置为在其他任务中评估和选择分析物测量结果110的特征,该特征对于准确地分类目标健康状况是稳健的,即使在分析物测量结果110中存在可由分析物传感器202(图4中未示出)的制造变化引起的观察到的变化的情况下也是如此。模型管理器402被描绘为包括多个模块,包括预处理管理器404、方差模拟器406、特征构造器408、预测器410和评估器412。“模块”可包括操作以执行一个或多个功能(诸如下文将描述的功能)的硬件和/或软件***。例如,模块可包括或可被包括在计算机处理器、控制器、或基于存储在有形和非暂态计算机可读存储介质(诸如计算机存储器)上的指令来执行操作的另一基于逻辑的装置中。另选地,模块可以包括基于装置的硬连线逻辑来执行操作的硬连线装置。附图(包括图4)中所示的各种模块可表示基于软件或硬连线指令操作的硬件、指导硬件执行操作的软件、或它们的组合。硬件可以包括电子电路,该电子电路包括和/或连接到一个或多个基于逻辑的装置,诸如微处理器、处理器、控制器等,如将关于图15阐述的。可以理解,在不脱离本公开的范围的情况下,模型管理器402可以包括比图4中示出的模块更多、更少或不同的模块。
在所示具体实施400中,模型管理器402被示为例如从存储装置112获得分析物测量结果110以及用户群体304的结果数据306。一般而言,预处理管理器404被配置为预处理分析物测量结果110,以根据相应的时间戳确定分析物测量结果110的按时间排序的序列。由于损坏和通信错误,由预测***114获得的分析物测量结果110可能不仅是无序的,而且可能丢失一个或多个测量结果。例如,在时间有序序列中可能存在间隙,其中期望一个或多个测量结果。在这些情况下,预处理管理器404还可以配置为对缺失的分析物测量结果进行插值,并将其合并到时序序列中。附加地或另选地,预处理管理器404可以被配置为根据预定标准过滤出分析物测量结果110的部分,诸如以移除损坏的或差的信号质量数据。尽管对该功能进行了讨论,但在一种或多种具体实施中,由预测***114获得的分析物测量结果110可以已经处于时间顺序(例如,分析物测量结果110的一个或多个时间序列),使得预处理管理器404不执行对那些测量结果进行排序和对缺失测量结果进行内插。
在所说明的具体实施400中,预处理管理器404被描绘为输出经预处理的数据414,其包括呈连续时间序列格式的分析物测量结果110,如上文所讨论的。经预处理的数据414被输入到方差模拟器406中。方差模拟器406被配置为通过执行方差模拟将制造相关的传感器可变性引入到经预处理的数据414中。例如,方差模拟器406可以在多个模拟轮次上执行多个方差模拟,每个模拟轮次具有在数据被输入到特征构造器408中之前被添加到预处理数据414的模拟的制造相关的分析物传感器可变性的不同百分比。作为一个示例,方差模拟器406可以在多个模拟轮次的每个模拟轮次期间将不同的性能可变性和分析物传感器特性应用于经预处理的数据414。在一些示例中,方差模拟器406可模拟具有针对经预处理数据414的每一轨迹施加的固定方差(例如,标准偏差)的偏差。通过示例,乘法可变性(例如,百分比可变性)可从具有固定标准偏差和针对每个模拟轮次在第一百分比可变性与第二百分比可变性之间的平均扫描的正态分布得出且应用于经预处理的数据414。第二百分比可变性可以大于第一百分比可变性。作为非限制性示例,第一百分比可变性可为负值(例如,-8%,或介于-10%与-5%之间的值),并且第二百分比可变性可为正值(例如,11%,或介于10%与15%之间的值)。作为另一非限制性示例,固定标准偏差可以是8。
经预处理的数据414(包括没有模拟可变性(例如,0%可变性)的数据和具有已知量的模拟可变性的数据)被输入到特征构造器408中。特征构造器408可被配置为生成可结合预测健康状况分类来评估的数据(例如,一个或多个特征向量)。在所示具体实施400中,特征构造器408被描绘为输出诸如来自用户群体304的每个用户的经预处理的数据414的所提取的分析物特征416。特征构造器408可以通过根据一种或多种预定算法或函数处理经预处理的数据414来确定所提取的分析物特征416。至少在一些示例中,不同的所提取分析物特征416中的每个所提取分析物特征可以对应于特征构造器408处理经预处理的数据414所用的不同算法或函数。
此处,所提取的分析物特征416包括趋势相关特征418、时间和日期相关特征420、可变性和稳定特征422、频率相关特征424和基于值的特征426。应当理解,所提取的分析物特征416可以不同于所示的组合而不脱离所描述的技术的精神或范围。如上所讨论的,经预处理的数据414可以被配置为时间序列数据,使得每个测量的分析物水平与时间点相关联并且关于时间被测序。也就是说,在时间序列数据中,在较早时间获得的第一分析物测量结果布置在较晚时间处获得的第二分析物测量结果之前。经预处理的数据414的这种时间序列布置可以使得特征构造器408能够提取与分析物测量结果110的时间趋势和稳定性相关的特征,这可以提供对于由于分析物传感器202的制造可变性而导致的分析物传感器202的输出的差异较不敏感的特征的候选。
趋势相关特征418可以包括描述时间序列数据中的模式或趋势的特征。例如,趋势相关特征418可以包括描述在不同时间点(例如,间隔5分钟、间隔10分钟、间隔15分钟)获得的分析物值(例如,水平)之间的关系的特征,诸如自相关特征。趋势相关特征418还可以包括变化率特征。这些变化率特征可以对应于用户群体304的给定用户在单位时间内的分析物测量结果110的差异。作为示例,预处理管理器404可以在至少两次测量之间确定测量的分析物量的差异和时间的差异,使得可以确定分析物量在某个时间单位内的变化。应当理解,这样的变化率可以使用经预处理的数据414中的分析物测量结果110中的多于两个分析物测量结果来确定。在一些示例中,变化率特征可以包括关于分析物测量结果110的变化率的统计,诸如分析物测量结果110的变化率的标准偏差。
时间和日期相关特征420可以包括描述分析物动态特性如何逐日和/或基于一天中的时间而不同的特征。时间和日期相关特征420的示例可以包括例如特定日期的平均分析物水平、一天中特定时间的平均分析物水平、特定日期的分析物水平的变化率、一天中特定时间之间的分析物水平的变化率以及对应的统计(例如,标准偏差、变异系数、偏斜、峰度等)。例如,时间和日期相关特征420可以包括按日期特征的统计和按一天中的时间特征的统计。作为另一个示例,时间和日期相关特征420可以包括不同日期的分析物测量结果110的平均值之间的差值(例如,每日差异的平均值)、不同一天中时间的分析物测量结果110的平均值之间(例如,在清醒时间与睡眠时间之间)的差值、不同一天中时间的分析物测量结果110的标准偏差之间的差值等。
可变性和稳定性特征422可包括指示分析物测量结果如何稳定或可变的特征。例如,可变性和稳定性特征422可以包括设定点频率特征和峰值特征。设定点频率特征可测量例如分析物水平在设定点值的预定义范围内的频繁程度。例如,设定点值可以是分析物测量结果110的模式。峰值特征可以包括表示分析物测量结果110中的峰值期间(例如,其中分析物水平达到局部最大值)的分析物动态的统计。例如,峰值特征可测量相对于用户的稳定基线分析物水平的峰宽度和/或高度。稳定的基线分析物水平可以是例如模式或模式代理。
频率相关特征424可以包括从时间序列预处理数据414的频率变换数据中提取的特征。例如,频率相关特征424可以指示分析物可变性的主导频率。频率相关特征424可使得能够从时域数据提取附加信息,诸如时域数据可分解成的不同频率。
基于值的特征426可以包括例如针对用户群体304的给定用户的分析物测量结果110的平均分析物值和/或中值分析物值以及对应的统计测量(例如,标准偏差、偏斜、峰度、变异系数、统计分布等)。基于值的特征426还可以包括分位数间范围差和基于时间的阈值测量。例如,基于值的特征426可以包括范围内时间测量,其对应于数据收集期期间用户的分析物测量结果110处于第一分析物水平与小于第一分析物水平的第二分析物水平之间的时间量,该第一分析物水平和该第二分析物水平分别对应于范围的上限和下限。作为另一个示例,预处理管理器404可以确定范围外时间测量,其对应于在观察期的过程中用户的分析物测量结果110在这样的范围之外的时间量。附加地或另选地,基于值的特征426可以包括基于事件发生的特征,其可以指示用户的分析物测量结果110的发生增加到第一分析物水平以上(例如,高血糖症事件)和/或减少到第二分析物水平以下(例如,低血糖症事件)。基于值的特征426的附加示例可包含对应于分析物的阈值百分位的值(例如,统计上显著的阈值百分位,诸如第94百分位或更大)、分析物的10百分位到90百分位范围及基于振幅的特征(例如,分析物水平偏移的平均振幅),仅举几例。
预测器410被配置为单独地或组合地提供所提取的分析物特征416的模型预测428。例如,模型预测428可以是针对由方差模拟器406模拟的每个制造可变性量(或缺乏制造可变性,诸如当百分比可变性为0%时)的每个提取的分析物特征416的健康状况预测的二进制或基于概率的输出。预测器410可以利用包括所提取的分析物特征416中的一个特征的单变量特征模型和组合所提取的分析物特征416中的至少两个特征的多变量模型(例如,二元模型)两者。作为非限制性示例,预测器410可利用所提取的分析物特征416的回归模型(例如,线性或逻辑回归模型)以及它们的各种组合。
评估器412被配置为接收模型预测428并根据一个或多个度量对一个或多个提取的分析物特征416进行分类。此处,评估器412被示为确定性能度量430和稳健性度量432。性能度量430可以提供一个或多个所提取的分析物特征416中的每个所提取的分析物特征与模型预测428相比基于针对用户群体304的给定用户的结果数据306对健康状况进行分类的良好程度的指示,并且稳健性度量432可以提供一个或多个所提取的分析物特征416中的每个所提取的分析物特征对模拟制造差异的不敏感程度的指示,如将在下面阐述的。
性能度量430可以测量一个或多个提取的分析物特征416的模型预测428准确地预测用户群体304的相关联用户具有健康状况的真阳性率(例如,灵敏度)和一个或多个提取的分析物特征416的模型预测428准确地预测用户群体304的相关联用户不具有健康状况的真阴性率(例如,特异性)中的一者或两者。例如,性能度量430越高,预测一个或多个提取的分析物特征416对于对健康状况进行分类的灵敏度和特异性越高。作为示例,性能度量430可以在预定义的尺度上对一个或多个提取的分析物特征416进行排名,诸如从0到1的尺度,其中0是指对应的模型预测428中没有一个(例如,0%)是准确的,而1是指对应的模型预测428中全部(例如,100%)是准确的。
稳健性度量432可测量由方差模拟器406添加到经预处理数据414的每百分比可变性的性能度量430改变多少,如跨用户群体304的每个用户的重复而平均的。例如,稳健性度量432可组合真阳性率和真阴性率的方差灵敏度。稳健性度量432可以在预定义的尺度上对一个或多个提取的分析物特征416进行排名,其中最高值指示性能度量430没有响应于模拟的可变性的变化,并且最低值指示性能度量430响应于模拟的可变性的最大变化。稳健性度量432越高,预测对应的一个或多个提取的分析物特征416对分析物传感器的制造变化越不敏感。在一些示例中,除了稳健性度量432之外或作为其替代,评估器412可以确定方差灵敏度度量,其可以是稳健性度量432的倒数。例如,方差灵敏度度量越高,对应的一个或多个提取的分析物特征416被预测为对于可能影响分析物测量结果110的分析物传感器中的制造变化越敏感(并且越不稳健)。一般而言,高度稳健的分析物特征(例如,具有高稳健性度量432或低可变性灵敏度度量的那些分析物特征)对应于表现出性能度量430随各种量的模拟方差的微小变化的所提取的分析物特征416。作为非限制性示例,趋势相关特征418以及可变性和稳定性特征422可产生具有相对高稳健性度量432(和相对低方差灵敏度度量)的提取的分析物特征416。
基于各种提取的分析物特征416的稳健性度量432和性能度量430,评估器412被配置为选择并输出稳健的分析物特征组合434。稳健的分析物特征组合434可以平衡性能和稳健性以便生成健康状况分类模型,该健康状况分类模型以高灵敏度和特异性准确地预测健康状况,该高灵敏度和特异性相对不受可能影响分析物传感器输出和性能的制造变化的影响。如以下将关于图5进一步描述的,稳健的分析物特征组合434可以包括所提取的分析物特征416中的至少两个特征。例如,从至少两个提取的分析物特征416构建的模型可以表现出大于单个提取的分析物特征416的稳健性和性能的组合。作为示例,稳健的分析物特征组合434的分析物特征中的第一分析物特征可以具有比稳健的分析物特征组合434中的第二分析物特征更高的性能度量430,并且第二分析物特征可以具有比第一分析物特征更高的稳健性度量432。在另一个示例中,与稳健的分析物特征组合434中的第二分析物特征相比,第一分析物特征可以具有更高的性能度量430和更高的稳健性度量432。
作为糖尿病是健康状况并且葡萄糖是分析物的非限制性示例,基于值的特征426(诸如平均葡萄糖)可以具有相对高的性能度量430,因为升高的葡萄糖是糖尿病的标志。然而,基于值的特征426中的至少一些特征也可以对分析物传感器202的制造变化相对敏感。例如,由于模型错误地预测没有糖尿病的用户由于偏差升高的葡萄糖水平而患有糖尿病,因此增加模拟的正偏差(其中葡萄糖测量结果偏移得较高)可以降低至少一些基于值的特征426的单变量模型的真阴性率。类似地,由于模型错误地预测患有糖尿病的用户由于偏差降低的葡萄糖水平而不患有糖尿病,因此增加模拟的负偏差(其中葡萄糖测量结果偏移得较低)可降低至少一些基于值的特征426的单变量模型的真阳性率。因此,基于值的特征426中的至少一些基于值的特征的单变量模型可以具有相对低的稳健性度量432。因此,在示例中,基于值的特征426中的一个特征可以与稳健分析物特征组合434中的具有高稳健性度量432的特征(诸如趋势相关特征418中的一个特征)平衡。
尽管上述示例将稳健的分析物特征组合434描述为包括属于不同类别(或类型)的特征,但是可以理解,在其他示例中,稳健的分析物特征组合434可以包括来自相同类别的特征。例如,稳健的分析物特征组合434的特征中的每个特征可以是趋势相关特征418中的一个特征。作为另一个示例,稳健的分析物特征组合434的特征中的每个特征可以是基于值的特征426中的一个特征。因此,应当理解,提供上述示例是为了说明而非限制。
为了选择稳健分析物特征组合434,评估器412可过滤出具有小于预先确定阈值的稳健性度量432的多变量模型预测428。评估器412可以选择剩余候选中具有最高性能度量430的多变量模型预测428,并且相关联的所提取分析物特征416可作为稳健分析物特征组合434输出。
现在参见图5,示出了用于对所提取的分析物特征(例如,图4的所提取的分析物特征416)进行分类以识别稳健的分析物特征组合434的一组曲线图500的示例。曲线图500包括单变量特征模型的第一曲线图502和双变量特征模型的第二曲线图504,其中每个曲线图的竖直轴表示方差灵敏度度量,并且每个曲线图的水平轴表示性能度量。例如,方差灵敏度度量可以是图4的稳健性度量432的倒数,并且性能度量可以是图4的性能度量430。每个数据点表示用于使用相关联的提取的分析物特征来预测健康状况分类的每个单变量(第一曲线图502)或双变量(第二曲线图504)模型预测(例如,图4的模型预测428)的方差灵敏度度量和性能度量。即,第一曲线图502示出了单独使用每个提取的分析物特征的模型预测的单独性能度量和单独方差灵敏度度量,而第二曲线图504示出了组合使用两个提取的分析物特征的模型预测的性能度量和方差灵敏度度量。
首先参见第一曲线图502,键506表示根据数据点的填充模式的每个提取的分析物特征的类别。在该示例中,高性能特征508由黑点阴影指示且具有比其他特征相对较高的性能度量,例如至少0.97的性能度量。如以上关于图4所解释的,性能度量可以在从0到1的标度上对每个所提取的分析物特征进行排名,其中0是指该特征的单变量模型预测中没有一个(例如,0%)在预测健康状况分类方面是准确的,并且1是指该特征的单变量模型预测的全部(例如,100%)在预测健康状况分类方面是准确的。在第一曲线图502中所描绘的示例中,高性能特征508也全部具有相对高的方差灵敏度度量,从而指示这些高性能特征508在预测健康状况分类中对制造变化对分析物测量结果的影响敏感。
中间特征510由比高性能特征508的黑点阴影浅的中等点阴影来指示。根据所描述的技术,中间特征510是具有中间性能度量和中间方差灵敏度度量两者的特征。例如,在图5的第一曲线图502中所示的示例中,中间特征510具有在0.75和0.97之间的性能度量以及在0.3和1.2之间的方差灵敏度度量。可以使用不同范围的性能度量和方差灵敏度来定义处于变化的中间特征510(以及其他类型的特征)。
在该示例中,高稳健性特征512由水平线阴影指示并且具有比其他特征相对更低的方差灵敏度度量,例如,在本发明示例中小于0.2的方差灵敏度度量。如以上关于图4所解释的,当模拟的制造相关的变化被添加到分析物测量结果中时,高度稳健的特征被识别为在性能上经历很小的变化。第一曲线图502中所示的高稳健性特征512具有在0.80与0.95之间的范围内的性能度量。
在该示例中,低性能特征514由白色填充(例如,无阴影)指示。此处,低性能特征514被定义为具有小于0.65的性能度量的特征,指示这些特征对于使用机器学习模型预测健康状况分类而言可能不是可靠性准确的。然而,在各种场景中,低性能特征514也具有高稳健性,如由其低方差灵敏度度量所指示。
因此,在一些示例中,诸如图5中所示的示例,组合至少两个提取的分析物特征以便产生具有比任何单个提取的分析物特征更高的性能度量和更低的方差灵敏度度量的特征组合可能是有益的。现在参见第二曲线图504,键516指示在每个数据点中根据它们的填充所描绘的分析物特征组合的类别。在第二曲线图504中所描绘的示例中,包括第一曲线图502的两个高性能特征的高性能特征组合518由黑点阴影指示。包括第一曲线图502的一个高性能特征和中间特征的高性能和中间特征组合520由竖直线阴影指示;包括来自第一曲线图502的两个中间特征中间特征组合522由中等点阴影指示;包括第一曲线图502的一个高稳健性特征和一个中间特征的高稳健性和中间特征组合524由对角线阴影指示;包括第一曲线图502的两个高稳健性特征的高稳健性特征组合526由水平线阴影指示;并且包括第一曲线图502的两个低性能特征的低稳健性特征组合528由白色填充(或无填充)指示。
第二曲线图504中所示的稳健性阈值530可用于(例如,由评估器412)过滤出二元模型的特征组合以考虑作为稳健分析物特征组合434。在一个或多个具体实施中,稳健性阈值530是非零、预先确定方差灵敏度度量值,其被校准以将对分析物传感器制造变化稳健的特征组合与对分析物传感器制造变化不稳健的特征组合区分开。因此,具有低于稳健性阈值530的方差灵敏度度量的特征组合被认为是稳健的。作为非限制性示例,稳健性阈值530可为0.5,如图5中所描绘。在其他示例中,稳健性阈值530可设定为另一值,诸如0.4。
在其他示例中,可以使用稳健性度量来代替方差灵敏度度量。在此类示例中,稳健性阈值530可以是非零、预先确定的稳健性度量值,高于该值,特征组合被认为对分析物传感器制造变化是稳健的。因此,当使用稳健性度量代替方差灵敏度度量时,可以过滤出小于稳健性阈值530的特征组合而不考虑稳健的分析物特征组合434。
在一些示例中,诸如图5中所示的示例,具有未被稳健性阈值530滤除的最大性能度量(例如,当稳健性阈值530是方差灵敏度度量值时小于稳健性阈值530)的特征组合被选择作为稳健分析物特征组合434。稳健分析物特征组合434在第二曲线图504中所描绘的示例中是高稳健性和中间特征组合524,但在其他示例中,稳健分析物特征组合434可以是不同类别的特征组合。因此,可以理解,图5中所示的示例是为了说明而非限制。
在一些实施方案中,可在选择稳健分析物特征组合434时评估附加方面(例如,除了性能度量和稳健性阈值530之外)。附加方面可包括但不限于易于计算特征组合中的特征、仅使用硬件确定特征组合中的特征的能力、计算特征组合中的特征所需的数据量(例如,多天内的集合与几小时内的集合)等。因此,在一些具体实施中,可基于这些附加方面(例如,经由评估器412)针对具有未被稳健性阈值530滤除的最高性能度量的选定数量的最高候选特征组合确定附加度量(或分数)。作为非限制性示例,可针对具有三个最大性能度量的候选特征组合确定附加度量。在一些实施方案中,可将附加度量添加到选定数量的最高候选特征组合中的每一者的性能度量,并且可选择具有最高总和的最高候选特征组合作为稳健分析物特征组合434。以此方式,稳健的分析物特征组合434可以包括比具有最大性能度量的特征组合更容易分析的特征组合。
此外,尽管图5示出使用稳健性阈值530来过滤第二曲线图504的特征组合,但在其他示例中,可使用性能度量阈值来过滤特征组合而不是稳健性阈值530或除该稳健性阈值之外还过滤特征组合。例如,具有大于性能度量阈值的最低方差灵敏度度量(或最高稳健性度量)的特征组合可被选择为稳健分析物特征组合434。下文将关于图11描述可如何基于方差灵敏度度量(或稳健性度量)和性能度量来选择稳健分析物特征组合434的附加示例。
经由图4的示例性具体实施400确定并且在图5的第二曲线图504中示出的稳健分析物特征组合434可用于训练机器学习模型以预测健康状况分类。现在参见图6,更详细地示出了预测***114的实现600的示例,其中经由模型管理器402来训练机器学习模型602。先前在图1至图4中介绍的部件被相同地编号并且将不被重新介绍。
在所示具体实施600中,预测***114包括机器学习模型602和管理机器学习模型602的模型管理器402。根据所描述的技术,机器学习模型602可以表示单个机器学习模型或多个模型的集合。机器学习模型602可以对应于不同类型的机器学习模型,其中使用不同方法(诸如使用监督学习、无监督学习和/或强化学习)来学习基础模型。举例来说,这些模型可以包括回归模型(例如,线性、多项式和/或逻辑回归模型)、分类器、神经网络和基于强化学习的模型,仅举几例。
在不脱离所描述的技术的精神或范围的情况下,机器学习模型602可以被配置为或包括其他类型的模型。这些不同的机器学习模型可以分别使用不同的算法来构建或训练(或以其他方式学习的模型),至少部分的原因是由于不同的结构和/或学习范式。因此,应当理解的是,模型管理器402的功能的以下讨论适用于各种机器学习模型。然而,为了解释的目的,模型管理器402在训练机器学习模型602时的功能将关于统计模型和神经网络进行一般性描述。
广义地讲,模型管理器402被配置为管理机器学习模型,包括机器学习模型602。例如,该模型管理包括建立机器学习模型602、训练机器学习模型602、更新该模型等等。具体地,模型管理器402被配置为至少部分地使用在存储装置112中保存的大量数据来执行该模型管理。如图所示,该数据包括用户群体304的分析物测量结果110和结果数据306。换言之,模型管理器402使用用户群体304的分析物测量结果110和结果数据306来建立机器学习模型602,训练机器学习模型602(或以其他方式学习基础模型),并更新该模型。例如,模型管理器402可根据上文关于图4所讨论的具体实施400基于用户群体304的分析物测量结果110和结果数据306来选择稳健分析物特征组合434,并且使用稳健分析物特征组合434作为用于训练机器学习模型602的输入。在机器学习模型602接收除了稳健分析物特征组合434之外的数据作为输入(诸如来自用户群体304的附加数据)的具体实施中,模型管理器402还使用这样的附加数据来构建、训练和更新机器学习模型602。
在一个或多个具体实施中,模型管理器402生成训练数据以训练机器学习模型602或以其他方式学习模型的参数。广义地讲,训练数据的生成取决于机器学习模型被设计输出的健康状况分类。该训练数据将是不同的,例如,如果机器学习模型602被配置为生成对人的诊断测量、预测该人将经历的不利影响或该人的临床诊断的预测。不管要预测的结果如何,生成训练数据可以包括对用户群体304的分析物测量结果110进行时间排序(如果分析物测量结果110尚未进行时间排序)以及从那些时间排序的分析物测量结果110中提取分析物特征,诸如上文关于图4所描述。模型管理器402可以利用预处理管理器404的功能来形成时间排序的分析物测量结果110的经预处理的数据414,并且利用特征构造器408来提取分析物特征,例如以与以上关于生成所提取的分析物特征416所讨论的方式类似的方式。作为示例,一旦选择了稳健的分析物特征组合434,模型管理器402就可以使用特征构造器408来从训练数据提取稳健的分析物特征组合434。至少在一些示例中,模型管理器402在训练机器学习模型602时可以不利用方差模拟器406。
生成训练数据还包括将从分析物测量结果110提取的分析物测量结果110或稳健分析物特征组合434的轨迹与用户群体304的相应用户的结果数据306相关联。鉴于此,对应于特定用户的分析物轨迹或提取的分析物特征与特定用户的结果数据306相关联。举例来说,特定用户可以已经被临床诊断为患有糖尿病,并且他或她的葡萄糖可以在相当于观察期27%的时间量内一直高于阈值。鉴于此,模型管理器402可以形成训练实例,该训练实例包括具有指示用户的高于阈值的时间为27%的值的输入部分,并且具有相关联的输出部分,该相关联的输出部分具有指示人患有糖尿病的值,例如“1”或其他一些对应的值。
在一个或多个具体实施中,模型管理器402可以通过从结果数据306中提取与至少一种结果类型相对应的观察值或标签(诸如临床诊断312的值,例如“糖尿病”,“糖尿病前期”,“没有糖尿病”或指示这些标签的值)来建立统计模型。一旦建立,统计模型被配置为预测该至少一种结果类型的值或标签并将其输出为健康状况分类116;指示该至少一种结果类型的值或标签不用作对模型的输入。例如,在统计模型是回归模型的场景中,结果值或标记可以对应于一个或更多个因变量。相比之下,从分析物测量结果110中提取的稳健分析物特征组合434的每个特征可用作对模型的输入。因此,在机器学习模型602被配置为统计模型的场景中,稳健分析物特征组合434的至少两个分析物特征可以对应于至少两个说明性(或独立)变量。
鉴于来自结果数据306的结果值或标签集合以及从分析物测量结果110提取的稳健分析物特征组合434的值集合,模型管理器402使用一种或多种已知方法将这些值集合“拟合”到方程,使得在一定公差范围内产生响应于提取的分析物特征值的输入的结果值或标签。这种拟合方法的示例包括使用最小二乘法、使用最小绝对偏差回归、最小化最小二乘代价函数的惩罚版本(例如,岭回归或lasso)等。所谓“拟合”是指模型管理器402使用一种或多种方法和训练数据的这些值集合来估计方程的模型参数。
估计的参数包括,例如,当自变量(例如,稳健分析物特征组合434)在操作期间被输入到机器学习模型时应用于它们的值的权重。模型管理器402将通过拟合用户群体304的观察值而估计的这些参数并入方程以生成机器学习模型602作为统计模型。在操作中,预测***114将自变量的值(例如,稳健分析物特征组合434的值)输入到统计模型(例如,作为一个或多个向量或矩阵),统计模型将估计的权重应用于这些输入值,并且然后输出用于一个或多个因变量的值或标签。该输出对应于健康状况分类116。
在以下讨论中,模型管理器402建立和训练机器学习模型的能力是关于对应于或包括至少一个神经网络的机器学习模型602的配置来讨论的。
关于所使用的训练数据,如上所述,模型管理器402可以生成训练数据的实例,其包括输入部分和预期输出部分,即,用于在训练期间与模型的输出进行比较的地面实况(ground truth)。训练数据实例的输入部分可以对应于分析物测量结果110的一个或多个轨迹和/或针对特定用户的稳健分析物特征组合434中的一个或多个提取特征。输出部分可以对应于特定用户的结果数据306的一个或多个值,例如指示健康状况的临床诊断的值或确证的临床诊断值(例如,当健康状况是糖尿病时,用户观察到的HbA1c)。同样,轨迹是否用于训练以及稳健分析物特征组合434中的特征是否用于训练以及哪些结果数据用于训练,取决于机器学习模型602被设计(和训练)以接收作为输入的数据以及该机器学习模型被设计(和训练)以输出的数据。
模型管理器402使用训练输入部分以及相应的预期输出部分来训练机器学习模型602。以训练为背景,模型管理器402可以通过将来自训练输入部分的集合的数据实例提供给机器学习模型602来训练机器学习模型602。响应于此,机器学习模型602诸如通过预测指示临床诊断的值来生成状况分类的疾病的预测。模型管理器402从机器学习模型602获得该训练预测作为输出,并将训练预测与对应于训练输入部分的预期输出部分进行比较。例如,如果机器学习模型602输出指示用户患有糖尿病的糖尿病分类,则将该预测与输出数据(例如,该输出数据将用户分类为患有糖尿病或没有糖尿病)进行比较以确定预测是否正确。基于该比较,模型管理器调整机器学习模型602的内部权重,使得机器学习模型在将来提供相应的训练输入部分作为输入时可以基本上再产生预期输出部分。
将训练输入部分的实例输入到机器学习模型602中、从机器学习模型602接收训练预测、将训练预测与对应于输入实例的(观察到的)预期输出部分进行比较(例如,使用损失函数,诸如均方根误差)以及基于这些比较来调整机器学习模型602的内部权重的这一过程可以重复数百次、数千次或者甚至数百万次迭代——每次迭代使用训练数据的实例。
模型管理器402可以执行这样的迭代,直到机器学习模型602能够生成与预期输出部分一致且基本匹配的预测。机器学习模型一致地生成与预期输出部分基本上匹配的预测的能力可称为“收敛”。考虑到这一点,可以说模型管理器402训练机器学习模型602直到其“收敛”于解,例如,由于训练迭代,已适当地调整模型的内部权重,使得该模型一致地生成与预期输出部分基本上匹配的预测。
如上所述,在一个或多个具体实施中,机器学习模型602可以被配置为接收除了分析物测量结果110和/或从这些测量结果中提取的稳健分析物特征组合434之外的输入。在此类具体实施中,模型管理器402可以形成训练实例,其包括训练输入部分、相应的预期输出部分以及描述用于预测健康状况分类的用户群体304的任何其他方面的附加输入数据,例如人口统计数据、病史、运动和/或压力。该附加数据以及训练输入部分可以由模型管理器402根据一种或多种已知技术处理以产生输入向量。然后可以将描述训练输入部分以及其他方面的这个输入向量提供给机器学习模型602。作为响应,机器学习模型602可以以与如上所述类似的方式生成健康状况分类的预测,使得可以将该预测与训练实例的预期输出部分进行比较,并且基于该比较调整模型的权重。
可以理解,在一些示例中,图4的具体实施400和图6的具体实施600的至少部分可以组合地执行。例如,当调整机器学习模型602时,方差模拟器406可引入制造相关的传感器可变性。通过示例,模拟的制造相关传感器可变性可以在交叉验证内并且在验证折叠上评估候选模型之前应用于机器学习模型602的候选模型的验证折叠。
一旦训练了机器学习模型602,就将其用于预测健康状况分类。在根据人102的分析物测量结果110预测人102的健康状况分类116的背景下,考虑图7的以下讨论。
图7更详细地描绘了图1的预测***的具体实施700的示例,其中使用机器学习预测健康状况分类。因此,先前在图1至图6中介绍的部件被相同地编号并且将不被重新介绍。
在所示具体实施700中,预测***114被示为例如从存储装置112(图7中未示出)获得分析物测量结果110。此处,分析物测量结果110可以对应于人102。在具体实施700中,预测***114被描绘为包括预处理管理器404、特征构造器408和机器学习模型602,它们被配置为基于人102的分析物测量结果110来生成健康状况分类116的预测。尽管预测***114被描绘为包括这三个部件,但是应当理解,预测***114可以具有更多、更少和/或不同的部件,以基于分析物测量结果110生成健康状况分类116,而不脱离所描述的技术的精神或范围。
在一个或多个具体实施中,分析物测量结果110被配置为时序数据,使得每个分析物测量结果110对应于时间戳,如上文关于图4所述。因此,预处理管理器404可以被配置为根据相应的时间戳来确定人102的分析物测量结果110的按时间排序的序列并且生成经预处理的数据414。经预处理的数据414可被输入到特征构造器408中,该特征构造器可被配置为从经预处理的数据414(例如,特征向量)提取分析物特征,该经预处理的数据可作为输入被提供给机器学习模型602以及可结合健康状况分类116报告的数据(例如,作为图3中示出的通知314的一部分被包括)。特别地,机器学习模型602可以被训练为使用经由图4的具体实施400选择的稳健分析物特征组合434来预测状况分类116,诸如以上关于图6的具体实施600所描述的。因此,在所示具体实施700中,特征构造器408被描绘为输出稳健的分析物特征组合434。特征构造器408可以通过根据一个或多个预先确定的算法或函数进一步处理分析物测量结果110的预处理数据414来确定稳健的分析物特征组合434。稳健分析物特征组合434的不同提取的分析物特征中的每个特征可以对应于特征构造器408用来处理分析物测量结果110的预处理数据414的不同算法或函数。
除了稳健的分析物特征组合434之外,至少在一些示例中,特征构造器408还可以并入来自描述人102的不同方面的附加数据的特征。该附加数据可以包括与分析物测量结果110不同的第二分析物的数据(例如,当分析物测量结果110是葡萄糖测量结果时的乳酸盐测量结果)、环境数据(例如,人的体温)、已经观察到的不利影响数据(例如,描述与已被观察到的健康状况分类相关联的多种不利影响中的任何一种的数据)、通过问卷调查或以其他方式获得的人口统计学数据(例如,描述年龄、性别、种族)、病史数据、压力数据、营养数据、运动数据、处方数据、身高和体重数据、职业数据等等。换言之,在一个或多个具体实施中,作为输入提供给机器学习模型602或机器学习模型的集合的数据可以描述除了稳健分析物特征组合434之外,关于人102的多个方面(例如,作为输入特征向量的特征),而不脱离所描述的技术的精神或范围。在此类场景中,机器学习模型602使用用户群体304的类似历史数据进行训练(参见图6)。
尽管所示具体实施700描绘了特征构造器408处理经预处理的数据414以产生稳健的分析物特征组合434,并且使用这些特征作为机器学习模型602的输入(例如,指示所提取的特征的特征向量),但是在一个或多个具体实施中,特征构造器408还可以生成(单独地或与其他特征一起)表示分析物测量结果110的一个或多个时间序列(例如,轨迹)的特征向量。因此,对机器学习模型602的输入数据可以对应于或以其他方式包括分析物测量结果110的向量化时间序列或分析物测量结果110的多个向量化时间序列。在分析物测量结果110的时间序列被向量化的具体实施中,机器学习模型602可以例如对应于神经网络。在稳健分析物特征组合434被向量化的具体实施中,机器学习模型可以例如对应于多变量回归模型,例如多变量线性或逻辑回归模型。
响应于从特征构造器408接收输入数据,机器学习模型602被配置为生成和输出健康状况分类116。具体地,可以训练机器学习模型602以输出健康状况分类116。通过示例并且如上文关于图6所阐述的,基于一种或多种训练方法并使用可从中导出健康状况分类的历史分析物数据和结果数据(诸如使用用户群体304的分析物测量结果110和结果数据306),可以训练机器学习模型602,或者可以学习基础表示。根据所描述的技术,机器学习模型602可以表示一个或多个模型,包括例如被训练以预测该人是否具有健康状况的模型,以及在一个或多个具体实施中,用于预测该人是否不具有健康状况的附加模型(例如,可用于有一定把握将该人筛查为没有糖尿病的糖尿病分类)。多模型配置的模型中的每个模型可以接收描述不同方面的不同配置的输入数据,例如,具有表示与健康状况相关的不同方面的特征的特征向量。应当理解,在其他具体实施中,单个模型可以被配置为生成两种类型的预测。在一个或多个具体实施中,机器学习模型602可以被配置为模型的集合,每个模型产生的与健康状况相关的预测与其他模型不同。
健康状况分类116可以根据一个或多个结果对人102进行分类,这些结果对应于由用于训练机器学习模型602的结果数据306所描述的结果。在使用用户群体304的临床诊断312来训练或学习机器学习模型602的具体实施中,则机器学习模型602可以将人102的分析物测量结果110分类为对应于诊断中的一种诊断的类别。在健康状况是糖尿病的示例性具体实施中,机器学习模型602可以将人102的分析物测量结果110分类为糖尿病、糖尿病前期或没有糖尿病。为此,医疗保健提供者可以使用健康状况分类116来治疗人102或制定类似于医疗保健提供者在人102根据常规技术(例如HbA1c、FPG和/或2Hr-PG)被诊断为糖尿病时将如何进行治疗的治疗计划。
类似地,在使用用户群体的观察到的不利影响310来训练或学习机器学习模型602的情况下,则机器学习模型602可以输出人102的分析物测量结果110指示人正在经历不同的不利影响的概率,例如,该人将经历与健康状况相关联的各种不利影响的从零到一的概率。在一些具体实施中,可以存在针对每种影响训练或构建的机器学习模型,使得机器学习模型602表示模型的集合,该模型的集合能够生成关于人102是否会经历每种影响(或人经历每种影响的概率)的预测。
在使用用户群体的独立诊断测量308来训练或学习机器学习模型的具体实施中,则机器学习模型602可以输出对特定诊断测量的值的预测。继续健康状况是糖尿病的示例性具体实施,机器学习模型602可以输出HbA1c值、FPG值、2Hr-PG值或OGTT值的预测。输出的健康状况分类116很大程度上取决于如何训练机器学习模型602,并且信息(具体地,健康状况分类116所表示的信息)取决于训练。例如,状况分类116可以表示指示人是否具有健康状况或处于发展健康状况的风险中的标签(例如,糖尿病标签、糖尿病前期标签或没有糖尿病标签)、指示人是否具有特定类型的健康状况(例如,1型糖尿病、2型糖尿病和GDM)的标签、概率或测量值。此外,不同类型的机器学习模型可能更好地适合于生成与不同类型的结果相关的预测,这些结果可以由健康状况分类116表示。
另外,机器学习模型602输出的状况分类116可以用作提供给与生成预测相关的人102以及与该人相关联的其他人的各种信息的基础,诸如该人102的医疗保健提供者、护理人员、远程医疗或健康跟踪服务等。在可以基于预测输出的信息的背景下,考虑图8至图9的以下讨论。
图8描绘了为通知用户关于健康状况预测而显示的用户界面的具体实施800的示例,该健康状况预测基于在观察期期间产生的分析物测量结果而生成。在下面的描述中,将参考图1至图7中示出的用于生成健康状况预测的部件和特征。然而,可以理解,具体实施800可以使用其他特征和部件来通知用户关于健康状况预测生成,而不脱离本公开的范围。
所示示例性具体实施800包括显示用户界面804的计算装置802。在该示例性具体实施800中,用户界面804可以对应于图3的通知314。该示例性具体实施800表示(例如,经由用户界面804输出的)通知314基于图1中介绍的健康状况分类116生成,但不包括健康状况分类116的场景。此处,显示装置802可以与人102相关联,该人的分析物测量结果是在观察期期间收集的的,并且健康状况分类116是关于该人生成的。另选地,计算装置802可以与跟人102有关联的另一个人(诸如护理人员)相关联。
为此,可以显示用户界面804以通知人102(或与人102有关联的人)关于健康状况分类116而不透露预测的分类。这是因为健康状况分类116对人102的输出可能以各种负面方式(诸如通过造成混乱、愤怒、抑郁等)影响人102。在该示例性具体实施800中,用户界面804包括关于对人102的分析物测量结果的处理的总结。用户界面804还包括基于健康状况分类的可动作行为的建议——在这种情况下推荐人102跟进他或她的医疗保健提供者。此外,用户界面804包括可选择以执行推荐可动作行为的图形用户界面元素806。图形用户界面元素806中的每个图形用户界面元素都可以选择,以安排与人102的医疗保健提供者的后续预约,诸如在医疗保健提供者的物理位置处预约或经由例如与远程医疗保健和/或远程医疗服务有关的电话或视频会议预约。应当理解,基于健康状况分类116生成但不包括该分类的通知可以以不同方式配置而不脱离所描述的技术的精神或范围。
图9描绘了为报告用户的健康状况预测以及与健康状况预测有关的其他信息而显示的用户界面的具体实施900的示例。在下面的描述中,将参考图1至图7中示出的用于生成健康状况预测的部件和特征。然而,可以理解,具体实施900可以基于使用其他特征和部件生成和分析的数据来报告健康状况预测,而不脱离本公开的范围。示例性具体实施900包括糖尿病作为基于从用户获得的葡萄糖测量结果确定的健康状况。然而,可以理解,在不脱离本公开的范围的情况下,具体实施900可以适于报告针对其他疾病和状况的预测和相关联的信息。
所示的示例性具体实施900包括显示被配置为报告的用户界面904的显示装置902。在该示例中,用户界面904可以对应于图3的通知314。与图8所描绘的示例性具体实施800相比,该示例性具体实施900表示通知包括图1中介绍的健康状况分类116的场景。在该所示示例性具体实施900中,图形诊断元素906表示或以其他方式指示健康状况分类116。此处,显示装置902可以与医疗保健提供者相关联,该医疗保健提供者与人102有关联,该人的分析物测量结果是在观察期期间收集的,并且健康状况分类116是针对该人生成的。
为此,可以显示用户界面904以将健康状况分类116报告给医疗保健提供者,并报告可能与该分类有关的附加信息。在操作中,医疗保健提供者可以独立地分析所报告的附加信息并提供与由健康状况分类116所指示的诊断不同的诊断。在该示例性具体实施900中,附加信息包括葡萄糖轨迹908、910。葡萄糖轨迹908、910表示在观察期的两天内收集的人102的分析物测量结果110。用户界面904被描绘为具有可以允许用户导航到所收集的其他分析物测量结果110(诸如对应于观察期的前几天或后几天的轨迹)的控件。
用户界面904还包括图形葡萄糖特征元素912,其表示或以其他方式指示特征构造器408基于人102的分析物测量结果110确定的所提取分析物特征416中的一个或多个所提取分析物特征。除了预测的临床诊断外,如图形诊断元素906所指示,用户界面904还包括预测的不利影响元素914和概率元素916。包含预测的不利影响元素914和概率元素916指示图6中介绍的机器学习模型602可以(例如,经由配置为模型的集合和/或基于架构和训练)被配置为生成多于一种类型的糖尿病分类的预测。通过示例,机器学习模型602可以被配置为预测人102的临床诊断、与糖尿病相关联的多个临床诊断值(例如HbA1c、FPG、2Hr-PG和OGTT)中的一者或多者的值,以及人102将经历糖尿病的多种不利影响中的一种或多种不利影响的概率。
特别地,预测的不利影响元素914对应于糖尿病分类指示人102更有可能经历而不是没有经历的不利影响,例如,基于机器学习模型输出的经历这些影响的概率大于50%。应当理解,机器学习模型602预测具有任何发生概率的不利影响也可以在一个或多个场景中与对应的概率一起输出。概率元素916包括由元素914指示的不利影响将发生的概率。在一个或多个具体实施中,由这些概率元素916指示的概率可以由机器学习模型602输出。应当理解,包括健康状况分类116的报告可以以不同方式配置而不脱离所描述的技术的精神或范围,诸如适合打印的文档。
图10描绘了为收集附加数据而显示的用户界面的具体实施1000的示例,这些附加数据可用作对机器学习模型的输入以生成健康状况预测。在下面的描述中,将参考图1至图7中示出和上文所述的用于生成健康状况预测的部件和特征。然而,可以理解,具体实施1000可收集附加数据以供其他特征和部件使用而不脱离本公开的范围。
所示示例性具体实施1000包括显示用户界面1004的计算装置1002。在该示例性具体实施1000中,可以显示用户界面1004以除了在观察期期间收集的分析物测量结果110之外,还收集关于人102的数据。这些附加数据连同分析物测量结果110的轨迹和/或所提取分析物特征416中的一个或多个所提取分析物特征可作为输入提供给机器学习模型602。即,附加数据可以以输入到模型的特征向量的特征来表示。为了训练机器学习模型602,这些附加数据还可以从用户群体304的用户收集。因此,可以向用户群体304的用户显示用户界面1004,以从那些用户收集这些附加数据。附加数据可以包括例如描述人口统计、病史、运动和/或压力的数据。
在所示示例性具体实施1000中,用户界面1004包括多种图形元素1006,用户可以与该多种图形元素交互(例如,选择或输入值)以提供关于他自己或她自己的附加数据。然而,应当理解,所包括的图形元素1006仅仅是示例,用于收集此类附加数据的用户界面可以以不同的方式配置为包括更多、更少或不同的元素,这些元素使得能够收集各种附加数据而不脱离所描述的技术的精神或范围。
已经讨论了使用分析物测量结果和机器学习进行健康状况预测的技术的细节的示例之后,现在考虑一些过程的示例来说明该技术的其他方面。
过程的示例
该章节描述了使用分析物测量和机器学习进行健康状况预测的过程(例如,方法)的示例。过程的各方面可在硬件、固件、软件、或它们的组合中实现。过程被示为指定由一个或多个装置执行的操作的一组块并且不一定限于所示的用于由各个块执行操作的次序。在一些示例中,多线程或并行处理可用于执行所描述的过程。在至少一些具体实施中,这些过程由预测***执行,诸如利用图4的模型管理器402的图1的预测***114。因此,将参考以上关于图1至图6描述的特征和部件,但是可以理解,在不脱离本公开的范围的情况下,可以使用类似或不同的部件来执行这些过程。
图11描绘了具体实施的示例中的过程1100,其中基于用户群体的历史分析物测量结果和结果数据,选择用于预测健康状况分类的稳健分析物特征组合。
获得由用户群体的用户穿戴的可穿戴分析物监测装置收集的分析物测量结果(框1102)。通过示例,模型管理器402获得用户群体304的用户的分析物测量结果110。在一些示例中,模型管理器402诸如经由模型管理器402的预处理管理器404根据分析物测量结果110生成分析物数据。分析物数据可以是经预处理的数据(例如,图4的经预处理的数据414),其可以包括分析物测量结果110的按时间排序和/或过滤的序列。
获得描述用户群体的用户的与健康状况相关的一个或多个方面的结果数据(框1104)。通过示例,模型管理器402获得结果数据306。在上述的示例中,结果数据描述了示例方面,例如用户群体304的用户的一个或更多个独立诊断测量308、用户群体304的用户的观察到的不利影响310以及用户群体304中用户的临床诊断312。
在分析物数据中模拟分析物传感器制造相关的可变性(框1106)。通过示例,模型管理器402的方差模拟器406将分析物传感器制造相关的可变性引入到根据分析物测量结果110生成的分析物数据中。分析物传感器制造相关的可变性可以指不同的分析物传感器(例如,图2的分析物传感器202)对相同的分析物水平的响应的差异,这是由于例如传感器偏差、不同的传感器型号、不同的传感器批次、不同的传感器制造商等。例如,方差模拟器406可以对分析物数据的每个部分(例如,每个轨迹)执行多个模拟,并且每个模拟可以将不同百分比的模拟制造相关可变性引入到分析物数据。例如,方差模拟器406可以通过向分析物数据的每个部分应用乘法或加法方差来模拟制造相关的可变性。作为一个示例,从具有固定标准偏差和在制造相关可变性百分比的预定范围内的平均扫描的正态分布得出方差。作为非限制性示例,标准偏差可设定为8,并且制造相关可变性百分比的预先确定范围可从-8%到11%。因此,在每一轮模拟期间,可针对分析物数据的每一部分确定新的制造相关可变性值。作为非限制性示例,模拟可执行20轮到40轮(例如,30轮)。
从分析物数据中提取多个特征(框1108)。通过示例,模型管理器402的特征构造器408可从每一轮模拟接收分析物数据并输出所提取的分析物特征416,该分析物数据包括不具有模拟的分析物传感器制造相关可变性的分析物数据和具有不同量的模拟的分析物传感器制造相关可变性的分析物数据。因此,所提取的分析物特征416可针对具有模拟制造相关可变性的每个百分比(包含0%)的分析物数据而输出。
针对与分析物传感器制造相关的可变性的灵敏度相关联的稳健性度量和与预测健康状况分类相关联的性能度量来评估多个特征的组合(框1110)。通过示例,将所述多个特征中的至少两个特征组合为多变量模型(例如,双变量模型),并且生成健康状况分类的模型预测并且将其与结果数据306进行比较。另选地,多个特征中的单个特征可用于单变量模型中。如关于图4所描述的,性能度量(例如,性能度量430)可以根据预测疾病状况分类的准确性来对多个特征的每个候选组合进行排名,并且稳健性度量(例如,稳健性度量432)可以用于根据模拟的制造相关可变性中每百分比变化的性能度量的百分比变化来对多个特征的每个候选组合进行排名。更高的性能度量可以指示候选组合对于预测疾病状况更敏感和特异性,并且更高的稳健性度量可以指示候选组合的性能更少地受到分析物传感器制造相关的可变性的影响。另选地,代替稳健性度量,可以使用作为稳健性度量的倒数的方差灵敏度度量。较高的方差灵敏度度量可指示候选组合的性能更受分析物传感器制造相关的可变性影响(例如,对制造相关的可变性更敏感)。
基于稳健性度量和性能度量,经由机器学习模型将多个特征的组合选择为用于预测健康状况分类的稳健特征组合(框1112)。作为一个示例,稳健性阈值(例如,图5的稳健性阈值530)可用于过滤多个特征的候选组合,使得具有低于稳健性阈值的稳健性度量(或高于稳健性阈值的灵敏度度量)的候选组合被排除在进一步考虑之外。在一些示例中,具有最高性能度量的所过滤的候选组合可被选择为稳健特征组合(例如,图4的稳健分析物特征组合434)。因此,稳健特征组合可以是稳健性度量大于稳健性阈值(或方差灵敏度度量小于稳健性阈值)的候选组合中具有最大性能度量的候选组合。
作为另一示例,代替稳健性阈值或者除了稳健性阈值之外,可以使用性能度量阈值。例如,性能度量阈值可用于过滤出具有小于性能度量阈值的性能度量的多个特征的候选组合。具有最高稳健性度量(或最低方差灵敏度度量)的剩余候选组合可被选择为稳健特征组合。
作为再一个示例,可在选择稳健特征组合时评估附加方面。如上文关于图5所提及,这些附加方面可包括但不限于易于计算候选特征组合中的特征、仅使用硬件确定候选特征组合中的特征的能力、计算候选特征组合中的特征所需的数据量(例如,多天内的集合与几小时内的集合)等。因此,在一些具体实施中,可针对选定数目的最高候选特征组合(例如,具有未被稳健性阈值滤除的最高性能度量或具有未被性能度量阈值滤除的最高稳健性度量的那些特征组合)确定附加度量。在一些具体实施中,可将附加度量与最高候选特征组合中的每一者的性能度量和/或稳健性度量相加(例如,作为加权或非加权和),并且可将具有最高总数的最高候选特征组合选择为稳健特征组合。
作为又一个示例,可基于每个候选组合的稳健性度量与性能度量的总和来选择稳健特征组合,以便最大化稳健性度量与性能度量的组合。例如,具有稳健性度量和性能度量的最高和的候选组合可以被选择为稳健特征组合。在一些示例中,该和可以是加权和,以便相对于稳健性度量向性能度量给出更多或更少的权重。
以此方式,可选择稳健的分析物特征组合,其可产生机器学***衡。
图12描绘了具体实施的示例中的过程1200,其中机器学习模型被训练来预测基于从用户群体的历史分析物测量结果和结果数据提取的稳健分析物特征的健康状况分类。
获得由用户群体的用户穿戴的可穿戴分析物监测装置收集的分析物测量结果(框1202)。通过示例,模型管理器402获得用户群体304的用户的分析物测量结果110。获得描述用户群体的用户的与健康状况相关的一个或多个方面的结果数据(框1204)。通过示例,模型管理器402获得结果数据306。在上述的示例中,结果数据描述了示例方面,例如用户群体304的用户的一个或更多个独立诊断测量308、用户群体304的用户的观察到的不利影响310以及用户群体304中用户的临床诊断312。
生成包括训练输入部分和预期输出部分的训练数据的实例,训练输入部分包括基于稳健性度量和性能度量选择的用户的分析物测量结果的特征的组合,并且预期输出部分包括对应于用户的结果数据的一个或多个值(框1206)。根据本文讨论的原理,特征的组合包括每个用户的分析物测量结果的至少两个提取的特征(例如,关于图4引入的稳健的分析物特征组合434)。以上关于图11的过程1100进一步描述了基于稳健性度量和性能度量来选择特征的组合。此外,预期输出部分包括与每个用户对应的一个或多个结果数据的值。通过示例,模型管理器402通过将从在框1202处获得的用户的分析物测量结果中提取的特征组合与在框1204处获得的用户的结果数据的一个或多个值相关联,为用户群体304的每个用户生成训练数据的实例。在一个或多个具体实施中,模型管理器402用表示与用户对应的结果数据的值的一个或多个标签来“标记”特征的组合。例如,结果数据可以包括健康状况分类的临床验证指示。
此处,可以重复框1208-1214直到机器学习模型被适当地训练,诸如直到机器学习模型“收敛”于解,例如,由于训练迭代,已适当地调整模型的内部权重,使得该模型一致地生成与预期输出部分基本上匹配的预测。另选地或附加地,可以针对训练数据的多个实例(例如,所有实例)重复框1208-1214。
向机器学习模型提供训练数据实例的训练输入部分作为输入(框1208)。通过示例,模型管理器402向机器学习模型602提供在框1206生成的训练数据实例的训练输入部分作为输入。
从机器学习模型接收健康状况分类的预测作为输出(框1210)。根据本文讨论的原理,健康状况分类的预测对应于与训练实例中包括的用户的结果数据的一个或多个值相同的与健康状况相关的方面。通过示例,机器学习模型602基于在框1208提供的训练输入部分预测健康状况分类(例如,用户在“健康状况存在”类别、“处于发展健康状况的风险中”类别、“健康状况不存在”类别中的分类或指示这些类别中的一种类别的值),并且模型管理器402接收健康状况分类作为机器学习模型602的输出。
将健康状况分类的预测与训练数据实例的预期输出部分进行比较(框1212)。通过示例,模型管理器402例如通过使用损失函数(诸如均方误差(MSE))将框1210处预测的健康状况分类与框1206处生成的训练实例的预期输出部分进行比较。应当理解,在不脱离所描述的技术的精神或范围的情况下,模型管理器402可以在训练期间使用其他损失函数,以将机器学习模型602的预测与预期输出进行比较。
基于上述比较来调整机器学习模型的权重(框1214)。通过示例,模型管理器402可以基于该比较来调整机器学习模型602的内部权重。在一个或多个具体实施中,模型管理器402可以可选地在训练期间利用一种或多种超参数优化技术来调整所使用的学习算法的超参数。
图13描绘了具体实施的示例中的过程1300,其中机器学习模型基于在观察期期间由可穿戴分析物监测装置收集的用户的分析物测量结果来预测健康状况分类。例如,可以根据过程1200来训练机器学习模型。
获得用户的分析物测量结果,其中在观察期期间由用户穿戴的可穿戴分析物监测装置收集分析物测量结果(框1302)。通过示例,机器学***,该观察期通常持续跨越多天的时间段。例如,分析物监测装置104可被配置有分析物传感器202,该分析物传感器可以皮下地***人102的皮肤中并且用于测量人102的血液或间质液中的分析物。
尽管自始至终讨论将分析物传感器202皮下地***人102的皮肤中,但是在一个或多个具体实施中,该分析物传感器可以不被皮下地***。在这样的具体实施中,分析物传感器202可以替代地设置在人102的皮肤或肌肉上。例如,分析物传感器202可以是在观察期内贴在人102的皮肤上的贴片。然后可以剥离该贴片。另选地或附加地,非侵入式分析物传感器可以是基于光学的,例如使用光电体积描记术(PPG)。分析物传感器202可以以多种方式配置以获得指示人102的分析物水平的测量结果而不脱离所描述的技术的精神或范围。
从分析物测量结果中提取稳健特征组合,其中稳健特征组合对分析物传感器202的制造可变性不敏感并且对于预测健康状况分类是准确的(框1304)。如以上关于图4至图5和图11所描述,稳健特征组合可包括来自多个提取的分析物特征416的至少两个提取的分析物特征。通过示例,稳健特征组合的第一分析物特征可具有用于准确预测健康状况分类的较高性能度量(例如,图4的性能度量430)以及用于对分析物传感器的制造可变性(诸如分析物传感器偏差)的不灵敏度的较低稳健性度量(例如,图4的稳健性度量432),并且稳健特征组合的第二分析物特征可具有较高稳健性度量和较低性能度量(例如,与第一分析物特征相比)。作为示例性示例,第一分析物特征可以表示人102的血液中的分析物水平或分析物升高程度,诸如图4的基于值的特征426中的一者。作为另一个示例性示例,第二分析物特征可以表示分析物模式或趋势,诸如图4的趋势相关特征418或可变性和稳定性特征422中的一者。
通过使用一个或多个机器学***衡以获得一致和准确的模型性能。
输出健康状况分类(框1308)。通过示例,机器学习模型602输出健康状况分类116。如通篇所讨论的,健康状况分类116可以指示是否预测该人具有健康状况或是否预测会经历与健康状况相关的不利影响。健康状况分类116还可以用于基于分类生成一个或多个通知或用户界面,诸如包括健康状况分类(例如,该人被预测具有健康状况)的针对医疗保健提供者的报告,或指示人102联系他或她的医疗保健提供者的针对该人的通知。
具体实施示例:使用工厂校准的CGM***来诊断2型糖尿病
2型糖尿病(T2D)是影响全世界超过4亿人的进行性疾病,其可导致长期血管并发症。在进展到T2D之前,许多人首先发展为糖尿病前期,其特征在于轻度升高的葡萄糖水平。对于患有糖尿病前期和T2D的患者,正确的诊断和管理可以改善血糖控制,降低与糖尿病相关的并发症的风险。
如前所述,临床和管理团体已经开发了诊断T2D的标准,其通常基于空腹血浆葡萄糖(FPG)、2小时血浆葡萄糖(2Hr-PG)、随机血浆葡萄糖(RPG)值和血红蛋白HbA1c(HbA1c)。FPG和2Hr-PG均是口服葡萄糖耐量检测(OGTT)的一部分,但是FPG可以与OGTT分开检测。每个检测具有几个长处和限制。FPG测试易于在临床中进行,但依赖于在抽血之前禁食过夜。来自OGTT的2Hr-PG测量结果比单独的FPG更敏感,并且捕获指示糖尿病的餐后葡萄糖尖峰。低于140mg/dL的血糖水平被认为是“正常”,而超过200mg/dL的读数指示糖尿病。读数在140mg/dL和199mg/dL之间表明糖尿病前期。然而,该检测依赖于禁食和饮食准备,在2小时内至少两次抽血是耗时的,并且具有相对差的再现性(例如,在60%-80%范围内)。因此,推荐重复OGTT以确认诊断,除非FPG和2Hr-PG值均高于诊断阈值。
尽管RPG检测可以在任何时间进行,但其本身不是可接受的诊断,除非伴有明显的糖尿病症状。HbA1c监测不依赖于禁食并且是准确和可重复的。然而,HbA1c不是葡萄糖的直接测量,并且HbA1c值可能受到包括贫血、血红蛋白病、种族以及对应于HbA1c与果糖胺测量结果之间的不一致的所谓“糖化间隙”的因素的影响。这些状况以及HbA1c与OGTT结果之间的次优一致性可能导致误诊和延迟治疗,这可能具有不利的健康和经济后果。
连续葡萄糖监测(CGM)***以例如预先确定的间隔报告来自血或间质液的葡萄糖水平。作为非限制性示例,预先确定的间隔是5分钟间隔。在各种具体实施中,CGM***包括分析物监测装置104。因此,关于CGM***的附加细节在上文关于图1和图2描述。其中CGM***被持续穿戴(例如,没有移除)的单独传感器会话可以持续预定义的观察期,诸如10天,并且葡萄糖浓度数据可以对CGM***穿戴者(例如,用户)可用以帮助糖尿病管理。另选地或附加地,对于以“盲模式”运行的会话,传感器数据可以被记录但不被显示。实时CGM数据包括例如当前葡萄糖浓度估计和可以通知即时治疗决定的趋势。此外,CGM数据的回顾性分析可以产生汇总统计,其通知长期干预、调整或糖尿病相关并发症风险。
给定当前标准的护理诊断检测的限制并且根据所描述的技术,算法使用来自观察期的CGM数据作为T2D的另选诊断。在本示例中,使用二元分类诊断CGM(dCGM)算法来生成针对T2D的分类。在一个或多个具体实施中,HbA1c测量结果与将测量结果分类为对应于正常血糖、糖尿病前期或T2D的糖尿病状态的标签配对。观察到的CGM导出的度量还可以与观察到的HbA1c测量结果配对,使得糖尿病状态可以在训练数据中与此类CGM导出的度量配对。广泛范围的CGM导出的度量(例如,特征),包括用于血糖可变性、范围内的时间、风险评估分数等的度量,可以与糖尿病状态配对以用于在变化中训练dGCM算法。此类度量的另外示例由所提取的分析物特征416表示,并且关于图4进行描述。在一个或多个具体实施中,特征重要性在k折交叉验证中被评估,并且期望的CGM度量可以基于区分能力、可解释性和共线性而被向下选择。
在一个或多个具体实施中,dCGM算法被训练以利用评估血糖水平(例如,高于140mg/dL的时间)和量化的可变性(例如,四分位距)的度量的组合作为输入。为了进一步说明这些CGM数据导出的度量的效用,图14中示出了血糖水平与关于糖尿病状态的可变性之间的相关性。图14描绘了高于140mg/dL的百分比时间(竖直轴)和四分位距(水平轴)的图表1400。键1402根据填充和形状表示与每个数据点相关联的糖尿病状态。在该示例中,来自正常血糖用户1404(例如,具有小于5.7%的HbA1c测量结果的用户)的数据点由黑色填充倒三角形表示,来自糖尿病前期用户1406(例如,具有大于或等于5.7%且小于6.5%的HbA1c测量结果的用户)的数据点由斜对阴影圆表示,并且来自T2D用户1408(例如,具有至少6.5%的HbA1c测量结果的用户)的数据点由白色填充三角形(例如,无阴影)表示。
如图表1400所示,将高于140mg/dL的百分比时间对四分位差距作图导致具有和不具有T2D的用户的分离。例如,T2D用户1408在高于140mg/dL值的较高百分比时间和较高四分位距值处(例如,在图表1400的右上方)被相对地聚类,而正常血糖用户1404和糖尿病前期用户1406在高于140mg/dL值的较低百分比时间和较低四分位距值处(例如,在图表1400的左下方)被相对地聚类。因为高于140mg/dL的所花费的时间在健康个体中是不常见的,所以该CGM度量可以用作诊断T2D或评估发展T2D的风险的阈值。
由在现实生活条件下测量的CGM数据生成的大量信息使得能够进行用于训练基于机器学习的算法的特征提取和特征选择,以用于筛查糖尿病和预测糖尿病风险,诸如以上关于图4至图7和图11至图13详细描述的。虽然本发明示例采用穿戴几天并且盲的工厂校准的CGM***,来自单个传感器穿戴会话的回顾性数据,但是其他示例可以使用来自具有其他校准、其他穿戴持续时间、多于一个传感器穿戴会话等的CGM传感器的数据。此外,虽然本发明示例描述了用以诊断T2D的二元分类算法,但是dCGM算法可以适于分类糖尿病的类型、发展糖尿病的风险、发展与糖尿病相关的不利健康影响的预测等。
高于140mg/dL的百分比时间和四分位距代表可解释的一组CGM度量的一个示例,其对于具有和不具有T2D的那些的分类具有高区分能力。然而,应当理解,可以使用基于高密度CGM数据的不同和/或附加度量的其他组合来解决其他dCGM算法中这些用户之间的血糖代谢障碍的差异。
在描述了根据一个或多个具体实施的过程的示例后,现在考虑可用于实现本文所述的各种技术的***和装置的示例。
***和装置的示例
图15示出通常以1500表示的***的示例,该***包括计算装置1502的示例,该计算装置代表可实现本文所述的各种技术的一个或多个计算***和/或装置。这一点可以通过在平台级别和单个计算装置级别包含预测***114来说明。预测***114可以在一个级别或另一个级别或至少部分地在两个级别上实现。例如,计算装置1502可以是服务提供者的服务器、与客户端相关联的装置(例如,客户端装置)、片上***和/或任何其他合适的计算装置或计算***。
如图所示的计算装置1502的示例包括处理***1504、一个或多个计算机可读介质1506、以及一个或多个相互通信耦接的输入/输出(I/O)接口1508。尽管未示出,但计算装置1502还可包括将各种部件彼此耦接的***总线或其他数据和命令转移***。***总线可包括不同总线结构中的任一总线结构或它们的组合,诸如存储器总线或存储器控制器、***总线、通用串行总线和/或利用多种总线架构中的任一总线架构的处理器或本地总线。还可以设想多种其他示例,诸如控制线和数据线。
处理***1504表示使用硬件执行一个或多个操作的功能。因此,处理***1504被示出为包括可被配置为处理器、功能块等的硬件元件1510。这可包括在硬件中实现为专用集成电路或使用一个或多个半导体形成的其他逻辑装置。硬件元件1510不受形成它们的材料或其中所采用的处理机制的限制。例如,处理器可由半导体和/或晶体管(例如,电子集成电路(IC))组成。在这种上下文中,处理器可执行指令可以是电子可执行指令。
计算机可读介质1506被示出为包括存储器/存储装置1512。存储器/存储装置1512表示与一个或多个计算机可读介质相关联的存储器/存储装置容量。存储器/存储装置1512可包括易失性介质(诸如随机存取存储器(RAM))和/或非易失性介质(诸如只读存储器(ROM)、闪存存储器、光盘、磁盘等)。存储器/存储装置1512可包括固定介质(例如,RAM、ROM、固定硬盘驱动器等)以及可移动介质(例如,闪存存储器、可移动硬盘驱动器、光盘等)。计算机可读介质1506可以如下文进一步描述的多种其他方式来配置。
输入/输出接口1508表示允许用户向计算装置1502输入命令和信息并且还允许使用各种输入/输出装置向用户和/或其他部件或装置呈现信息的功能。输入装置的示例包括键盘、光标控制装置(例如,鼠标)、麦克风、扫描仪、触摸功能(例如,电容传感器或被配置成检测物理触摸的其他传感器)、相机(例如,其可采用可见波长或不可见波长(诸如红外频率)来将移动识别为不涉及触摸的手势)等。输出装置的示例包括显示装置(例如,监测器或投影仪)、扬声器、打印机、网卡、触觉响应装置等。因此,计算装置1502可以如下文进一步描述的多种方式来配置以支持用户交互。
本文可在软件、硬件元件或程序模块的一般上下文中描述各种技术。一般来讲,此类模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、元件、部件、数据结构等。本文使用的术语“模块”、“功能”和“部件”通常表示软件、固件、硬件或其组合。本文所述的技术的特征是平台无关的,这意味着这些技术可在具有多种处理器的多种商业计算平台上实现。
所描述的模块和技术的具体实施可存储在某种形式的计算机可读介质上或跨某种形式的计算机可读介质(诸如计算机可读介质1506)传输。计算机可读介质可包括可由计算装置1502访问的多种介质。以举例而非限制的方式,计算机可读介质可包括“计算机可读存储介质”和“计算机可读信号介质”。
“计算机可读存储介质”可指能够持久地和/或非暂态地存储信息的介质和/或装置,而不仅仅是信号传输、载波或信号本身。因此,计算机可读存储介质是指非信号承载介质。计算机可读存储介质包括诸如易失性和非易失性、可移动和不可移动介质和/或存储装置的硬件,该硬件以适合于存储诸如计算机可读指令、数据结构、程序模块、逻辑元件/电路或其他数据的信息的方法或技术实现。计算机可读存储介质的示例可包括但不限于RAM、ROM、EEPROM、闪存存储器或其他存储技术、CD-ROM、数字多功能盘(DVD)或其他光学存储装置、硬盘、盒式磁带、磁带、磁盘存储装置或其他磁存储装置、或其他存储装置、有形介质、或适于在其上存储所需信息并可由计算机访问的制品。
“计算机可读信号介质”可指被配置为诸如经由网络向计算装置1502的硬件传输指令的信号承载介质。信号介质通常可在调制数据信号(诸如载波、数据信号或其他传送机制)中体现计算机可读指令、数据结构、程序模块或其他数据。信号介质还包括任何信息递送介质。术语“调制数据信号”是指其特性中的一个或多个特性以编码信号中信息的方式设置或改变的信号。以举例而非限制的方式,通信介质包括诸如有线网络或直接有线连接的有线介质,以及诸如声介质、RF介质、红外介质和其他无线介质的无线介质。
如先前所述,硬件元件1510和计算机可读介质1506表示可在一些实施方案中用以实现本文中所描述的技术的至少一些方面(诸如执行一个或多个指令)的以硬件形式实现的模块、可编程装置逻辑部件和/或固定装置逻辑部件。硬件可包括集成电路或片上***、专用集成电路(ASIC)、现场可编程门阵列(FPGA)、复杂可编程逻辑器件(CPLD)以及硅或其他硬件中的其他具体实施的部件。在此上下文中,硬件可作为执行由硬件体现的指令和/或逻辑定义的程序任务的处理装置,以及用于存储用于执行的指令的硬件(例如,先前描述的计算机可读存储介质)来操作。
也可采用前述的组合来实现本文所述的各种技术。因此,软件、硬件或可执行模块可被实现为在某种形式的计算机可读存储介质上和/或由一个或多个硬件元件1510体现的一个或多个指令和/或逻辑部件。计算装置1502可被配置为实现对应于软件和/或硬件模块的特定指令和/或功能。因此,可由计算装置1502作为软件来执行的模块的具体实施可例如通过使用计算机可读介质1506和/或处理***1504的硬件元件1510至少部分地在硬件中实现。指令和/或功能可由一个或多个制品(例如,一个或多个计算装置1502和/或处理***1504)来执行/操作,以实现本文所述的技术、模块和示例。
本文所述的技术可由计算装置1502的各种配置来支持,并且不限于本文所述的技术的具体示例。该功能还可全部或部分地通过使用分布式***诸如经由如下所述的平台1516通过“云”1514来实现。
云1514包括和/或表示用于资源1518的平台1516。平台1516抽象化云1514的硬件(例如,服务器)和软件资源的底层功能。资源1518可包括在远离计算装置1502的服务器上执行计算机处理时可利用的应用程序和/或数据。资源1518还可包括通过互联网和/或通过用户网络诸如蜂窝或Wi-Fi网络提供的服务。
平台1516可抽象化资源和功能以将计算装置1502与其他计算装置连接。平台1516还可用于抽象化资源的缩放以提供对应的缩放级别,以满足对经由平台1516实现的资源1518的需求。因此,在互连的装置实施方案中,本文所述的功能的具体实施可分布在整个***1500中。例如,该功能可部分地在计算装置1502上实现以及经由抽象化云1514的功能的平台1516来实现。
在一些方面,本文中所描述的技术涉及一种方法,其中基于稳健性度量和性能度量选择多个特征中的特征的组合还包括:基于多个候选组合中的每个候选组合相对于性能阈值的性能度量来过滤多个特征的多个候选组合;以及选择具有稳健性度量的最高值的所过滤的候选组合作为特征的组合。
在一些方面,本文中所描述的技术涉及一种方法,其中基于稳健性度量和性能度量选择多个特征中的特征的组合还包括:从特征的多个候选组合中选择使稳健性度量和性能度量的组合最大化的候选组合作为特征的组合。
在一些方面,本文中所描述的技术涉及一种方法,还包括训练一个或多个机器学习模型以使用用户群体的结果数据来预测健康状况分类。
在一些方面,本文中所描述的技术涉及一种方法,其中第一特征的单独性能度量高于第二特征,并且第二特征的单独稳健性度量高于第一特征。
在一些方面,本文中所描述的技术涉及一种方法,其中第一特征的单独性能度量和单独稳健性度量两者均高于第二特征。
在一些方面,本文中所描述的技术涉及一种方法,其中第一特征和第二特征中的至少一者是分析物测量结果的基于值的特征。
在一些方面,本文中所描述的技术涉及一种方法,其中健康状况分类是描述健康状况的存在、健康状况的不存在、健康状况的严重性程度、与健康状况相关联的不利影响和/或与健康状况相关联的临床诊断值的指示。
在一些方面,本文中所描述的技术涉及一种方法,还包括:基于用户的健康状况分类生成通知。
在一些方面,本文中所描述的技术涉及一种方法,其中通知包括针对用户的医疗保健提供者的报告,该报告包括用户的健康状况分类。
在一些方面,本文中所描述的技术涉及一种方法,其中通知被输出给用户并且包括用以联系用户的医疗保健提供者的指令。
在一些方面,本文中所描述的技术涉及一种装置,其中由分析物传感器在观察期内测量用户的分析物数据,并且其中观察期跨越多天。
在一些方面,本文中所描述的技术涉及一种装置,其中用户关于健康状况的状态是不存在健康状况、存在健康状况、健康状况的严重性、健康状况的类型和用户经历与健康状况相关联的不利影响的概率中的至少一者。
在一些方面,本文中所描述的技术涉及一种方法,包括:经由用户在观察期期间穿戴的分析物监测装置的分析物传感器在观察期期间获得用户的分析物测量结果;从用户的分析物测量结果中提取第一特征和第二特征;将第一特征和第二特征的组合提供给机器学习模型;以及从机器学习模型接收健康状况分类的预测。
在一些方面,本文中所描述的技术涉及一种方法,其还包括基于从机器学习模型接收的健康状况分类的预测而生成通知。
在一些方面,本文中所描述的技术涉及一种方法,其中生成通知包括生成输出到用户并且包括不包含健康状况分类的预测的指令的第一通知以及输出到用户的医疗保健提供者并且包括健康状况分类的预测的第二通知中的至少一者。
在一些方面,本文中所描述的技术涉及一种方法,其中第一特征包括基于振幅的特征、基于范围内的时间的特征、基于范围外的时间的特征、基于稳定性的特征或基于事件发生的特征。
在一些方面,本文中所描述的技术涉及一种方法,其中第二特征包括基于趋势的特征、基于可变性的特征、频率相关特征或自相关特征。
在一些方面,本文中所描述的技术涉及一种方法,其中健康状况分类是糖尿病分类,并且分析物测量结果是葡萄糖测量结果。
在一些方面,本文中所描述的技术涉及一种方法,其中糖尿病分类是表示在观察期期间用户的状态为患有妊娠期糖尿病或无妊娠期糖尿病。
在一些方面,本文中所描述的技术涉及一种方法,其中糖尿病分类是将用户在观察期期间的状态描述为患有糖尿病、没有糖尿病或糖尿病前期的指示。
在一些方面,本文中所描述的技术涉及一种方法,其中糖尿病分类是预测用户将经历的糖尿病的一种或多种不利影响的指示。
在一些方面,本文中所描述的技术涉及一种方法,其中第一特征是分析物测量结果的基于值的特征,并且第二特征是分析物测量结果的基于模式的特征。
在一些方面,本文中所描述的技术涉及一种方法,其中第一特征和第二特征中的每一者是分析物测量结果的基于值的特征。
在一些方面,本文中所描述的技术涉及一种方法,其中第一特征和第二特征中的每一者是分析物测量结果的基于模式的特征。
在一些方面,本文中所描述的技术涉及一种方法,其中基于第一特征和第二特征的组合在预测用户群体的临床确定的健康状况分类同时模拟用户群体的历史分析物测量结果中的制造相关分析物传感器变化时的性能来选择第一特征和第二特征的组合。
在一些方面,本文中所描述的技术涉及一种方法,包括:经由用户在观察期期间穿戴的分析物监测装置的分析物传感器在观察期期间获得用户的分析物测量结果;从用户的分析物测量结果中提取特征;将该特征提供给机器学习模型;以及从机器学习模型接收健康状况分类的预测。
在一些方面,本文中所描述的技术涉及一种方法,还包括基于与对分析物传感器的制造可变性的不灵敏度相关联的稳健性度量和与预测健康状况分类相关联的性能度量来选择特征。
在一些方面,本文中所描述的技术涉及一种方法,还包括生成包括不包含对健康状况分类的预测的指令的第一通知以及包括对健康状况分类的预测的第二通知中的至少一者。
结论
尽管已经以结构特征和/或方法动作专用的语言描述了***和技术,但应当理解,所附权利要求中定义的***和技术不一定限于所描述的特定特征或动作。相反,具体特征和动作被公开为实现要求保护的主题的形式的示例。

Claims (15)

1.一种方法,包括:
获得分析物测量结果的多个特征;
基于与对分析物传感器的制造可变性的不灵敏度相关联的稳健性度量和与预测健康状况分类相关联的性能度量来选择所述多个特征中的特征的组合;以及
训练一个或多个机器学习模型以使用所述特征的组合来预测所述健康状况分类。
2.根据权利要求1所述的方法,其中所述分析物测量结果是来自与用户群体的结果数据相关联的所述用户群体的历史分析物测量结果,并且其中基于所述稳健性度量和所述性能度量来选择所述多个特征中的所述特征的组合包括:
针对所述多个特征的多个候选组合中的每个候选组合生成所述健康状况分类的模型预测;以及
基于所述健康状况分类相对于所述用户群体的所述结果数据的所述模型预测来针对所述多个候选组合中的每个候选组合确定所述性能度量。
3.根据权利要求2所述的方法,其中所述性能度量指示用于预测所述健康状况分类的灵敏度和用于基于所述健康状况分类相对于所述多个候选组合中的每个候选组合的所述结果数据的所述模型预测来预测所述健康状况分类的特异性中的一者或两者。
4.根据权利要求2或3所述的方法,其中所述结果数据指示所述用户群体的每个用户的临床确定的健康状况分类。
5.根据权利要求2至4中任一项所述的方法,其中基于所述稳健性度量和所述性能度量来选择所述多个特征中的所述特征的组合还包括:
在多个模拟轮次内模拟所述分析物测量结果中的所述分析物传感器的所述制造可变性,每个模拟轮次向所述分析物测量结果引入不同百分比的模拟可变性;以及
基于所述模拟可变性的每百分比的所述性能度量的变化来确定所述多个候选组合中的每个候选组合的所述稳健性度量。
6.根据权利要求5所述的方法,其中在所述多个模拟轮次内模拟所述分析物测量结果中的所述分析物传感器的所述制造可变性包括模拟不同的性能可变性和分析物传感器特性,以在每个模拟轮次向所述分析物测量结果引入所述不同百分比的模拟可变性。
7.根据权利要求2至6中任一项所述的方法,其中基于所述稳健性度量和所述性能度量来选择所述多个特征中的所述特征的组合还包括:
基于所述多个候选组合中的每个候选组合相对于稳健性阈值的所述稳健性度量来过滤所述多个特征的所述多个候选组合;以及
选择具有所述性能度量的最高值的所过滤的候选组合作为所述特征的组合。
8.根据权利要求1至7中任一项所述的方法,其中所述多个特征中的所述特征的组合包括第一特征和第二特征,并且其中所述方法还包括使用所述多个特征中的每个特征的所述健康状况分类的模型预测来确定所述多个特征中的每个特征的单独性能度量和单独稳健性度量。
9.根据权利要求8所述的方法,其中所述第一特征和所述第二特征中的至少一者是所述分析物测量结果的趋势相关特征。
10.根据权利要求8所述的方法,其中所述第二特征是所述分析物测量结果的可变性和稳定性特征。
11.根据权利要求1至10中任一项所述的方法,还包括:
在训练所述一个或多个机器学习模型以使用所述特征的组合来预测所述健康状况分类之后:
从由用户穿戴的分析物测量装置在观察期内获得新分析物测量结果;
从所述新分析物测量结果中提取所述特征的组合的特征;
将所述特征的组合的所提取的特征输入到所述一个或多个机器学习模型中;以及
接收所述用户的所述健康状况分类作为所述一个或多个机器学习模型的输出。
12.一种装置,包括:
一个或多个处理器;和
存储器,所述存储器上存储有计算机可读指令,所述计算机可读指令能够由所述一个或多个处理器执行以执行包括以下的操作:
获得由分析物传感器测量的用户的分析物数据;
提取所述分析物数据的至少两个特征,所述至少两个特征包括在分析物特征的多变量模型中,所述多变量模型基于对用户群体的历史分析物数据执行的方差模拟被确定为对所述分析物传感器的制造可变性是稳健的;
将所述至少两个特征的组合输入到机器学习模型;
通过所述机器学习模型预测所述用户的健康状况分类;以及
接收所述健康状况分类作为所述机器学习模型的输出。
13.根据权利要求12所述的装置,其中由所述分析物传感器在观察期内测量所述用户的所述分析物数据,并且其中所述健康状况分类是描述所述观察期期间所述用户关于健康状况的状态的指示。
14.根据权利要求13所述的装置,其中所述健康状况为糖尿病,并且其中所述健康状况分类为糖尿病状态、糖尿病前期状态及没有糖尿病状态中的一者。
15.根据权利要求12至14中任一项所述的装置,其中用训练输入部分和预期输出部分来训练所述机器学习模型,所述训练输入部分包括从所述用户群体的所述历史分析物数据提取的所述至少两个特征的所述组合,所述预期输出部分包括表示所述用户群体中的每个用户的所述健康状况分类的标签。
CN202280069731.4A 2021-10-27 2022-10-21 使用分析物测量特征和机器学习的疾病预测 Pending CN118201545A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US202163263106P 2021-10-27 2021-10-27
US63/263,106 2021-10-27
PCT/US2022/047462 WO2023076121A1 (en) 2021-10-27 2022-10-21 Disease prediction using analyte measurement features and machine learning

Publications (1)

Publication Number Publication Date
CN118201545A true CN118201545A (zh) 2024-06-14

Family

ID=84362512

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202280069731.4A Pending CN118201545A (zh) 2021-10-27 2022-10-21 使用分析物测量特征和机器学习的疾病预测

Country Status (5)

Country Link
US (1) US20230129902A1 (zh)
CN (1) CN118201545A (zh)
AU (1) AU2022379460A1 (zh)
CA (1) CA3234020A1 (zh)
WO (1) WO2023076121A1 (zh)

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2494364A1 (en) * 2009-10-29 2012-09-05 Tethys Bioscience, Inc. Protein and lipid biomarkers providing consistent improvement to the prediction of type 2 diabetes
CN103959291B (zh) * 2011-04-20 2018-05-11 诺沃—诺迪斯克有限公司 基于具有自适应选择的核和正则化参数的正则化网络的葡萄糖预测器
CN107403072A (zh) * 2017-08-07 2017-11-28 北京工业大学 一种基于机器学习的2型糖尿病预测预警方法
CA3162455A1 (en) * 2019-11-26 2021-06-03 Dexcom, Inc. Recommendations based on continuous glucose monitoring

Also Published As

Publication number Publication date
US20230129902A1 (en) 2023-04-27
AU2022379460A1 (en) 2024-05-23
CA3234020A1 (en) 2023-05-04
WO2023076121A1 (en) 2023-05-04

Similar Documents

Publication Publication Date Title
US11998322B2 (en) Intermittent monitoring
US11426102B2 (en) Diabetes prediction using glucose measurements and machine learning
US11653860B2 (en) Recommendations based on continuous glucose monitoring
US20220273204A1 (en) Intermittent Monitoring
US11712182B2 (en) Multi-state engagement with continuous glucose monitoring systems
CN113679348A (zh) 血糖预测方法、血糖预测装置、设备及存储介质
US20230129902A1 (en) Disease Prediction Using Analyte Measurement Features and Machine Learning
US20230136188A1 (en) Glycemic Impact Prediction For Improving Diabetes Management
US20240013915A1 (en) Systems and methods for generating models for determining blood glucose levels using voice
WO2023219847A1 (en) Cost-effective therapy recommendations
CN117256032A (zh) 用于连续葡萄糖监测的自适应***

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication