CN109564782B - 基于医院人口统计的电子临床决策支持设备 - Google Patents

基于医院人口统计的电子临床决策支持设备 Download PDF

Info

Publication number
CN109564782B
CN109564782B CN201780048722.6A CN201780048722A CN109564782B CN 109564782 B CN109564782 B CN 109564782B CN 201780048722 A CN201780048722 A CN 201780048722A CN 109564782 B CN109564782 B CN 109564782B
Authority
CN
China
Prior art keywords
training
covariates
cds
covariate
trained
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201780048722.6A
Other languages
English (en)
Other versions
CN109564782A (zh
Inventor
B·康罗伊
C·M·波特斯布兰东
许敏男
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Koninklijke Philips NV
Original Assignee
Koninklijke Philips NV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Koninklijke Philips NV filed Critical Koninklijke Philips NV
Publication of CN109564782A publication Critical patent/CN109564782A/zh
Application granted granted Critical
Publication of CN109564782B publication Critical patent/CN109564782B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N7/00Computing arrangements based on specific mathematical models
    • G06N7/01Probabilistic graphical models, e.g. probabilistic networks
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/20ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H10/00ICT specially adapted for the handling or processing of patient-related medical or healthcare data
    • G16H10/20ICT specially adapted for the handling or processing of patient-related medical or healthcare data for electronic clinical trials or questionnaires
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H10/00ICT specially adapted for the handling or processing of patient-related medical or healthcare data
    • G16H10/60ICT specially adapted for the handling or processing of patient-related medical or healthcare data for patient-specific data, e.g. for electronic patient records
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/70ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for mining of medical data, e.g. analysing previous cases of other patients
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/30ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for calculating health indices; for individual health risk assessment
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H70/00ICT specially adapted for the handling or processing of medical references
    • G16H70/60ICT specially adapted for the handling or processing of medical references relating to pathologies

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Public Health (AREA)
  • Data Mining & Analysis (AREA)
  • Biomedical Technology (AREA)
  • General Health & Medical Sciences (AREA)
  • Primary Health Care (AREA)
  • Epidemiology (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • Pathology (AREA)
  • Software Systems (AREA)
  • General Physics & Mathematics (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Computing Systems (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Molecular Biology (AREA)
  • Computational Mathematics (AREA)
  • Mathematical Analysis (AREA)
  • Algebra (AREA)
  • Probability & Statistics with Applications (AREA)
  • Mathematical Optimization (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Pure & Applied Mathematics (AREA)
  • Medical Treatment And Welfare Office Work (AREA)

Abstract

一种电子临床决策支持(CDS)设备(10)采用经训练的CDS算法(30),所述经训练的CDS算法在协变量的集合的值上进行操作以输出医学状况的预测。所述CDS算法在训练数据集(22)上进行训练。所述CDS设备包括计算机(12),所述计算机被编程为提供用于使用显示器和一个或多个用户输入设备来完成临床调查问题的用户接口(62)。根据所完成的临床调查问题来生成针对协变量的所述集合中的所述协变量的边际概率分布(42)。使用所述边际概率分布针对协变量偏移来调节所述经训练的CDS算法。使用在协变量的所述集合中的所述协变量的针对医学对象的值上进行操作的针对协变量偏移调节的经训练的CDS算法(50)来生成针对所述医学对象的所述医学状况的预测。

Description

基于医院人口统计的电子临床决策支持设备
技术领域
下文总体上涉及电子临床决策支持(CDS)领域、临床领域等。
背景技术
电子临床决策支持(CDS)设备包括计算机或其他电子处理器,其被编程为基于关于医学对象的输入信息来提供临床信息。输入信息包括可量化的协变量(在某些情况下其可以是二元值)的集合,例如实验室测试结果、放射学研究结果、关于医学对象的人口统计信息(例如年龄、性别等)、体重等等。将机器学习应用到协变量的集合以产生形式为P(y|x)的预测器,其中,x是其元素存储针对对象的协变量的值的向量,并且y是要预测的医学状况的值(在某些情况下其同样可以是二元值,例如“1”表示患者具有该医学状况,“0”表示患者不具有该医学状况;或者,yi可以是实值或具有某种其他类型的值,例如yi可以是可以呈现几个可能值中的任何一个值的癌症阶段)。
电子CDS设备通常通过收集训练样本来构建,训练样本在本文中不失一般性地被表示为(xi,yi),i=1,…,n,其中,n是训练样本的数量(即训练对象的数量),xi是针对第i个训练对象的协变量值的向量,并且yi是针对第i个训练对象的医学状况的(已知)值。该训练数据集优选是大的,并且应当足够多样化以代表电子CDS设备期望适用的医学对象的完整范围。所收集的训练样本集用于通过机器学***方和误差最小化,其中,/>是针对第i个训练对象的预测。
在典型的商业实施方式中,电子CDS由供应商使用从各种来源获取的训练样本集来构建。优选地,样本是匿名的以维持患者的保密性(例如,以符合美国的HIPAA要求)。然后,构建的电子CDS可以销售给各种医学机构,例如医院、医院网络等,用于在提供临床诊断辅助中使用。
发明内容
在一个公开的方面,一种电子临床决策支持(CDS)设备采用经训练的CDS算法,所述经训练的算法在协变量的集合中的协变量的值上进行操作以输出医学状况的预测。所述经训练的CDS算法在训练样本的训练数据集上进行训练。所述CDS设备包括计算机,所述计算机包括显示器和一个或多个用户输入设备。所述计算机被编程为通过使用针对协变量的所述集合中的所述协变量的边际概率分布计算针对所述训练数据集的所述训练样本的协变量偏移调节权重并在具有由所述协变量偏移调节权重加权的所述训练样本的所述训练数据集上执行更新训练针对协变量偏移来调节所述经训练的CDS算法。所述计算机还被编程为通过将针对协变量偏移调节的经训练的CDS算法应用到所述协变量的集合中的所述协变量的针对医学对象的值来生成针对所述医学对象的所述医学状况的预测,并且在所述显示器上显示针对所述医学对象的所述医学状况的所生成的预测。
在另一个公开的方面,一种电子CDS设备采用经训练的CDS算法,所述经训练的CDS算法在协变量的集合中的协变量的值上进行操作以输出医学状况的预测。所述经训练的CDS算法在训练样本的训练数据集上进行训练。所述CDS设备包括计算机,所述计算机包括显示器和一个或多个用户输入设备。所述计算机被编程为提供用于使用所述显示器和所述一个或多个用户输入设备来完成临床调查问题的用户接口,根据所完成的临床调查问题来生成针对协变量的所述集合中的所述协变量的边际概率分布,并使用所述边际概率分布针对协变量偏移来调节所述经训练的CDS算法。所述计算机还被编程为使用在协变量的所述集合中的所述协变量的针对医学对象的值上进行操作的针对协变量偏移调节的经训练的CDS算法来生成针对所述医学对象的所述医学状况的预测。
在另一个公开的方面,一种电子CDS方法采用CDS算法,所述CDS算法在协变量的集合中的协变量的值上进行操作以输出医学状况的预测。在CDS方法中,使用第一计算机在训练样本的训练数据集上训练所述CDS算法。在训练之后,使用与所述第一计算机不同的第二计算机来执行CDS操作。所述CDS操作包括:使用针对协变量的所述集合中的所述协变量的边际概率分布针对协变量偏移来调节经训练的CDS算法;通过将针对协变量偏移调节的经训练的CDS算法应用到协变量的所述集合中的所述协变量的针对医学对象的值来生成针对所述医学对象的所述医学状况的预测;在显示器上显示针对所述医学对象的所述医学状况的所生成的预测。
一个优点在于提供针对由特定医院或其他特定医学机构服务的群体定制的更准确的电子临床决策支持(CDS)设备。
另一个优点在于提供这种改进的准确性,而不需要收集代表由特定医学机构或组织服务的医学对象的训练样本。
另一个优点在于利用不包含潜在的个人识别信息(PII)的可用的或容易收集的统计来提供这种改进的准确性。
另一个优点在于以计算高效的方式提供这种改进的准确性,从而通过使电子CDS设备能够以减少的存储器和/或降低的计算能力来实施而改进电子CDS设备本身。
另一个优点在于提供一种电子CDS设备,其可以被高效地更新以针对由特定医院或其他特定医学机构或组织服务的变化的群体进行调节。
给定实施例可以不提供前述优点中的任何一个,可以提供前述优点中的一个、两个、更多或全部,并且/或者可以提供其他优点,这对于本领域普通技术人员而言在阅读和理解本公开时将变得显而易见。
附图说明
本发明可以采取各种部件和部件的布置,以及各个步骤和步骤的安排的形式。附图仅用于说明优选实施例的目的,而不应被解释为限制本发明。除非另有说明,否则附图是图解性的,而不应被解释为按比例的或示出不同部件的相对尺寸。
图1图解性地示出了电子临床决策支持(CDS)设备,其包括制造和客户侧安装以及用户接***互部件。
图2图解性地示出了图1的电子CDS设备的实施方式,其采用供应商训练的CDS医学状况预测算法和客户训练的协变量偏移预测器。
图3图解性地示出了图1的电子CDS设备,其包括协变偏移调节更新特征。
具体实施方式
商业CDS设备可能出现的问题是CDS算法可能已经在训练样本集(即训练群体)上进行训练,该训练样本集在统计上不同于客户遇到的患者的群体(例如,医院购买并使用CDS设备,以帮助诊断临床环境中的患者)。这些差异可能是由于各种因素中的任何因素造成的:不同年龄的人口统计;不同种族的人口统计;不同收入水平(其可以由于不同水平的预防性护理而间接影响医学状况统计);不同地理区域;不同目标群体(例如,城市医院可能服务于统计数据不同于农村医院的群体);等等。
可以认为,只要用于在供应商处开发CDS设备的训练集足够大且多样化以包含代表由客户服务的群体的统计上显著数量的样本,群体中的这种差异不应当有问题。然而,即使假设CDS设备供应商成功收集适当大的且多样化的训练集并在其上训练,也已经发现由于形式为y=f(x)的经训练的预测器的经验性质,其中,x是协变量向量且f(…)是经训练的预测器,如果推理(例如客户)群体中遇到的协变量统计与(例如CDS设备供应商所依赖的)训练群体的协变量统计显著偏离,则实际性能可能会降低。该问题有时被称为“协变量偏移”,因为协变量x的统计已经改变或“偏移”。
可以通过从推理分布(例如,客户)获取数据来解决协变量偏移,以便对训练与推理分布之间的差异进行建模。然而,在CDS设备的背景下,这可能不是令人满意的方法。生成推理分布需要从客户(例如医院)收集患者数据,这具有许多缺点。CDS设备供应商可以分析客户患者数据,以便提供针对客户定制的CDS设备产品,但是由于担心违反患者隐私法(例如美国的HIPAA),医院可能不愿意将其敏感的患者数据提供给CDS设备供应商。数据可能在交付给CDS设备供应商之前是匿名的,但这需要采集后处理,并且可能容易留下一些罕见的可识别患者(例如,如果协变量包括年龄、性别和种族,那么非常高龄的并且已知为特定客户医院的患者可以根据匿名数据而识别出来)。
反过来,CDS供应商可能不愿意向客户提供其专有的CDS算法训练流程,以便使得客户能够使用医院患者数据来执行协变量偏移调节,因为该训练流程可以是供应商拥有的有价值的商业秘密信息。
此外,即使可以解决这些逻辑问题,使得可以更新CDS算法以考虑协变量偏移(在供应商端或在客户侧),客户忙于为患者提供临床护理,可能无法或没有能力收集必需的患者数据以针对协变量偏移进行调节。
在本文公开的实施例中,通过使用针对各个协变量的群体级统计来执行协变量偏移更新而克服这些困难。这些高级统计可以以可靠的匿名形式生成和分布,因为它们不是患者特定的数据。群体级协变量统计可以被视为针对各种协变量的边际概率分布。如本文中所公开的,这些边际概率分布足以提供针对CDS设备的协变量偏移调节。有利地,该方法避免了可能受患者隐私法律保护的患者级训练样本的收集(和分布)。
此外,在一些实施例中,通过训练额外的协变量偏移预测器来执行协变量偏移调节,该额外的协变量偏移预测器接收由在CDS设备供应商处使用供应商的训练数据训练的“库存”CDS算法产生的预测作为输入。协变量偏移预测器然后输出经协变量偏移调节的预测。以这种方式,可以在客户端(例如在医院)执行更新,而不将供应商的专有CDS算法训练流程暴露给客户。由于协变量偏移调节被预期是相对小的调节,所以协变量偏移调节预测器可以采用被分布给客户而不用担心损害专有商业秘密信息的逻辑回归或另一相对简单的预测器算法。
参考图1,电子临床决策支持(CDS)设备10包括计算机12,该计算机具有用户接***互部件,例如,说明性显示器14(例如,LCD或等离子显示器监视器)以及一个或多个用户输入设备(例如,说明性键盘16、说明性鼠标18或触控板20或其他指点设备、显示器14的触摸屏叠加、语音识别接口、其各种组合、等等)。说明性计算机是台式或笔记本计算机,其具有执行在实施CDS设备中所需的计算的内置处理器;在其他实施例中,可以采用更分散的计算架构,例如,用户接***互部件14、16、18、20可以是“哑”终端的部件,其提供对执行CDS处理的远程服务器计算机的访问,该远程服务器计算机通过医院数据网络和/或因特网访问,或者在更分散的架构中,CDS处理可以由云计算资源或其他分布式计算网络执行,如本文中所使用的术语“计算机”旨在包含所有这样的分布式或分散式计算***以及说明性的集中式单计算机设计。
CDS设备10采用经训练的CDS算法,该经训练的CDS算法在协变量的集合中的协变量的值上进行操作以输出医学状况的预测。经训练的CDS算法最初使用计算机24在训练样本22的训练数据集上训练,该计算机通常(但不一定)与计算机12不同。例如,在供应商提供给医院或其他客户的CDS的说明性示例中,CDS设备10的计算机12可以是“客户”计算机,并且计算机24可以是“供应商”计算机。在这种背景下,CDS设备10执行“客户侧”处理,而计算机24执行“供应商侧”处理。这仅仅是说明性的商业模型,并且可以预见到其他类型的商业化,例如,计算机24可以由医院网络、大学、政府机构或其他大型机构维护,而CDS设备10可以是由医院、医学中心、医学网络等拥有和/或维护。
训练样本22的训练数据集在本文中不失一般性地被表示为集合{(xi,yi)}i=1,…,n,其中,n是训练样本的数量(即训练对象的数量),xi是针对第i个训练对象的协变量值的向量,并且yi是针对第i个训练对象的医学状况的(已知)值。同样不失一般性,协变量的集合中的协变量的数量被表示为m。术语“群组”是指一组医学对象,其对于协变量的集合中的协变量具有相同的值。在一些实际应用中,每个协变量具有二元值,在这种情况下,存在协变量的2m个可能的不同组合,即2m个可能的群组。二元值协变量在计算上是方便的并且可以有用地表示许多具有诊断价值的数据项,例如医学测试的结果(阳性或阴性),状况的存在/不存在(例如,“1”表示充血性心力衰竭,“0”表示其他情况),等等。为了全面,训练集22应包括属于每个群组的至少一个患者;然而,这不是必需的。此外,在一些实施例中,协变量中的一个或多个协变量可能不是二元值,例如,“年龄”协变量可以具有整数值(年龄)。一个或多个协变量可以额外地/备选地具有其他数据类型,例如,癌症等级协变量可以呈现在由所采用的癌症分级方案定义的范围内的整数值。同样地,要预测的医学状况y可以是二元的(例如,医学对象是否具有该医学状况)或者可以是更复杂的值(例如,根据癌症分级方案由整数表示的癌症等级)。
供应商计算机24被编程为实施机器学***方和误差其中,/>是由预测器30针对第i个训练对象提供的预测。预测器30通常可以采用任何类型的预测函数或算法,例如,逻辑回归、朴素贝叶斯、随机森林等。通常,预测器30具有一组参数,其值由机器学***方和误差或其他选择的目标。
在一些实施例中,由机器学习26执行的训练可以包括使用训练数据集22来选择协变量的集合中的协变量。例如,通过应用保留最相关特征的特征选择技术,协变量的初始(相对大的)集合可以被简化为协变量的更小的最终集合,其中,“相关性”可以通过诸如互信息的量化来测量。例如,在一些实施例中可以应用最小冗余度最大相关性(mRMR)特征选择。
供应商计算机24还可以被编程为执行验证过程32以验证经训练的CDS算法30针对测试样本集34的样本预测医学状况的准确性。为了执行验证,测试样本集34也被标记,即医学状况的地面真值y对于每个测试样本是先验已知的。在一些实施例中,使用交叉验证方法,其中,单个训练集22被不同地划分为训练子集和测试子集以执行训练和验证。将认识到,机器学习部件26可以是由供应商开发和拥有的商业上有价值的商业秘密,并且因此供应商可能不愿意将该机器学习部件26分布给第三方(例如客户),即使以编译格式。在其他情况下,供应商可能愿意分布该机器学习部件26,可能具有一些保护,例如与客户的保密性协议,和/或其他保护,例如仅以编译格式分布机器学习部件26。
向客户提供训练经训练的CDS算法30和训练数据集22,该训练数据集优选地是匿名的以移除个人识别信息(PII)。虽然经训练的CDS算法30可以直接用于预测医学对象(例如患者)中的医学状况(y),但是由于与由训练数据集22所代表的群体相比由客户服务的群体的协变量偏移,该方法易于降低准确度。在本文的说明性实施例中,使用针对协变量的集合中的协变量的边际概率分布来执行针对协变量偏移对经训练的CDS算法30的调节。每个边际概率分布是针对由客户服务的群体中的协变量的集合中的一个协变量的概率分布,而与协变量的集合中的任何其他协变量无关。例如,如果(同样,不失一般性)m个协变量被表示为v1,v2,…,vm,则这些具有对应的m个边际概率分布Pcust(v1),Pcust(v2),…,Pcust(vm),其中,下标·cust表示边际概率是针对由客户服务的群体的。在本文的说明性实施例中,通过使用针对协变量的集合中的协变量的边际概率分布42计算针对训练数据集22的训练样本的协变量偏移调节权重40并在具有由协变量偏移调节权重40加权的训练样本的训练数据集22上执行更新训练来执行针对协变量偏移的调节。在说明性实施例中,更新训练由在客户侧计算机12上执行的机器学习(更新)部件44执行,然而,也可以预见到更新训练将在供应商侧被执行,即由供应商计算机24执行。机器学习(更新)部件44的输出是针对协变量偏移调节的经训练的CDS算法50。
在本文描述的说明性实施例中,医学对象的群组被定义为在协变量的集合中的所有协变量上的联合配置。例如,考虑其中仅针对两个协变量v1和v2执行协变量偏移调节的示例。(通常,可以针对协变量的集合中的所有协变量执行协变量偏移,或者针对协变量的集合中的一些选择的子集执行协变量偏移)。出于说明性目的,协变量v1被定义为机械通气状态,并且是二元值:医学对象启用机械通气,或者医学对象未启用机械通气。协变量v2被定义为入住重症监护病房(ICU)时的败血症状态,并且同样是二元值:医学对象在入住ICU时患有败血症,或者没有败血症。通过这两个协变量,可以定义总共四个医学对象群组,其被列于表1中。
表1–针对两个协变量的集合的群组的说明性集合
群组 通气状态 入院时败血症状态
1 无机械通气 入院时没有败血症
2 无机械通气 入院时患有败血症
3 机械通气 入院时没有败血症
4 机械通气 入院时患有败血症
通常,m个二元值协变量定义了医学对象的2m个群组。然而,将认识到,所公开的协变量偏移调节方法容易应用到在协变量的集合上操作的CDS算法,该协变量的集合包括能够呈现多于两个值和/或能够呈现连续值的一个、多个或甚至所有协变量。
如前所述,训练集22包括n个样本(训练对象),每个样本由数据对(xi,yi)表示,其中,xi是针对协变量的集合中的协变量的值的向量,并且yi是要预测的医学状况的已知(地面真)值。此外,令Ci表示训练示例(xi,yi)所属的医学对象的群组。
此外,令P供应商(Ci)表示由供应商在训练CDS算法30中使用的训练集22中的群组Ci的概率;并且令Pcust(Ci)表示由客户(例如医院)服务的群体中的群组Ci的概率。由于群组Ci由训练对象的协变量值向量xi定义(并且不依赖于针对医学状况的值yi),因此推断出概率P供应商(Ci)是存储在训练数据集22中的xi中的协变量值的联合概率;并且同样,概率Pcust(Ci)是存储在客户侧群体中的xi中的协变量值的联合概率。使用标准协变量偏移公式,可以将协变量偏移调节权重分配给训练示例i作为这两个概率的比率:
等式(1)假设在为了生成训练的CDS算法30而执行的供应商侧训练期间不对样本进行加权。另一方面,可以在供应商侧训练期间对训练样本进行加权。例如,这可以向CDS算法引入期望的偏差来完成,如图所示,如果优选CDS算法倾向于输出医学对象在模糊情况下具有医学状况的预测,那么这可以通过比阴性样本(对此,yi表示不存在医学状况)相对更多地加权阳性样本(对此,yi表示存在医学状况)来实现。如果在CDS算法30的供应商侧训练期间应用到第i个的权重被表示为则这可以通过如下修改等式(1)来解决:
由于训练数据集22可供客户使用,因此可以根据针对训练数据集22中的这些群组的统计来获得“供应商群体”群组统计P供应商(C1),P供应商(C2),…,P供应商(Cn)的估计。例如:
而先前使用的n是训练数据集22中的训练样本的总数,并且是属于群组Ci的那些训练样本的数量。显然,/>因为根据定义,至少第i个样本属于群组Ci,并且对于任何有用的训练集/>因为训练集22被构建为包含跨度由m个协变量的集合中的协变量的允许值的各种组合表示的群组范围的训练示例。
在说明性实施例中,训练数据集22可供客户使用,并且权重在客户侧计算,例如,在图1所示的客户侧CD设备10处计算。在另一个实施例中,不向客户提供训练数据集22。在该变型实施例中,边际概率分布Pcust(v1),Pcust(v2),…,Pcust(vm)由客户提供给供应商。该信息被加载到供应商计算机24,并且根据等式(1)、(2)和/或(3)在供应商侧(例如,由供应商计算机24)执行协变量偏移调节。然后将具有协变量偏移调节的模型传达给客户侧,例如,加载到CDS设备10上。因此,在这些实施例中,协变量偏移调节由供应商计算机24执行,而不是由客户计算机12执行。
如果可以获得从客户方群体(例如,在该说明性示例中由ICU服务的患者的群体)中公平抽取的医学对象的等效数据库,则可以使用等式(3)的客户侧模拟来计算概率Pcust(Ci),并且然后应用等式(1)或(2)来生成权重。但是,如前所述,存在关于生成这样的客户侧数据库的大量问题,例如关于损害患者隐私的问题,难以由忙于提供临床护理而不是编制统计数据库的医院来编制这样的数据库,等等。对于前面的示例,编制这样的客户侧数据库只能由有权访问进入ICU的每个患者的电子病历(EMR)文件的实体来完成,并且该实体将需要具有这些患者中的每个患者在入院时掘取呼吸机状态和败血症状态的(优选自动化的)能力。值得注意的是,许多实用的CDS算法将在两个以上的协变量上操作,并且协变量可以是多种类型的,例如,医学测试结果、预先存在的状况信息、人口统计数据、等等。
在图1的说明性实施例中,根据针对各个协变量的边际概率分布42获得针对客户群体的群组概率Pcust(C1),…,Pcust(Cn)60。从概念上讲,如果组成一个群组的协变量的各个值的边际概率很高,那么该群组的概率应当很高;相反,如果组成一个群组的协变量的各个值的边际概率较低,那么该群组的概率应当较低。为了说明,如果平均95%的患者进行机械通气,那么我们可以推断出表1中的群组3和群组4比群组1和群组2更可能。
在数学上,根据定义协变量向量xi的值的边际概率推断出Pcust(Ci)值相当于根据其m个边际概率分布推断出在m个协变量上的联合概率分布。通常,这是一个具有许多可能解的欠定***。为了克服这个问题,可以通过找到关于训练数据集22最大化有效样本大小的分布Pcust(Ci)来可选地使推理问题正规化。有效样本大小是通过等式(1)或(2)的权重加权的训练数据集的统计功效的度量。因此,最大化有效样本大小增加了从经加权的训练数据集22导出的估计器(例如机器学习分类器)的统计功效。这有利于在更新训练CDS算法30以针对协变量偏移进行调节时降低过拟合的风险。
在更具体的说明性方法中,令v1,v2,…,vm表示共同定义群组的m个协变量,使得每个群组Ci可以由针对协变量v1,v2,…,vm的值的特定联合配置来表示。进一步将边际分布表示为Pcust(v1),Pcust(v2),…,Pcust(vm)。针对这些边际分布的估计可以被表示为p1,p2,…,pm,例如集合Pcust(v1)=p1。根据定义,通过使联合分布中的所有其他协变量边缘化来计算边际分布,使得将边际概率Pcust(v1),Pcust(v2),…,Pcust(vm)约束到指定的相应估计p1,p2,…,pm用作关于联合分布的直接约束。为了估计在群组Pcust(Ci)上的联合分布,求解以下优化问题:
其受以下边际概率估计约束:
在等式(4)中,符号表示群组概率Pcust(Ci)被优化以最小化求和的值(受等式(5)中所述的约束)。可以证明,等式(4)和(5)的优化问题使有效样本大小最大化受等式(5)的边际分布约束。这个优化问题是凸的,因此其对于求解唯一的全局最优解是高效的。
根据等式(4)和(5)的优化,推断出群组概率60(即,概率Pcust(C1),Pcust(C2),…,Pcust(Cn))。然后,根据等式(1)或(2)计算对应的协变量偏移调节加权值40(即,权重w1,w2,…,wn)。如图1所示,然后将这些权重与原始训练数据集22一起馈送到机器学习更新部件44中。该训练部件44的输出是针对协变量偏移调节的经训练的CDS算法50。
前述假设边际概率分布的可用性Pcust(v1)=p1,Pcust(v2)=p2,…,Pcust(vm)=pm。在说明性实施例中,这些边际概率分布是从由医院人员(或更一般地,由客户或客户代理)使用由CDS设备10提供的临床调查用户接口62完成的临床调查问题的答案获得的。例如,对于表1的范例,可以将临床调查归结为两个问题的调查:
1.平均而言,多少百分比的患者启用了机械通气?
2.平均而言,多少百分比的患者在入住ICU时患有败血症?
对于非二元值的协变量,可以相应地格式化调查问题。例如,肺癌分期协变量可以是CDS算法的输入,用于指示是否指示放射疗法。用于获得数据以生成针对肺癌分期协变量的边际概率分布的调查问题可以被适当地表示如下:
请说明以下癌症阶段中的每个中的肺癌患者的百分比(百分比应加起来为100%):
第0阶段____%
第I阶段____%
第II阶段____%
第III阶段____%
第IV阶段____%
临床调查用户接口62优选地对百分比值执行数据检查以确保分数加起来为100%。
通常,临床调查用户接口62可以利用显示器14向客户或客户代理呈现调查问题,并且可以利用一个或多个用户输入设备16、18、20来接收来自客户/代理的响应,例如,通过使它们经由键盘16键入或通过使用指点设备18、20移动从0%-100%运行的滑块。有利地,临床调查问题收集“粗略”统计,即针对医院或其他客户的群体级统计。这些调查问题的答案不包含个体患者级信息,因此不包括患者识别信息(PII)。因此,临床调查问题通常不会引起患者隐私问题。此外,即使边际概率分布仅是近似的,也可以有用地执行协变量偏移调节,因此,获得仅仅是近似的调查问题的答案可能就足够了,例如,即使客户或客户代理(例如护士、ICU部门主管等)没有确切的信息,提供估计也可能就足够了。例如,客户代理可能估计20%的患者在入住ICU时患有败血症,即使确切的百分比略有不同(例如15%或30%),协变量调节仍可用于在供应商训练数据22的情况下在(例如)50%的患者在进入ICU时患有败血症的情况下校正协变量偏移。
在完成协变量偏移更新的情况下,可以通过将针对协变量偏移调节的经训练的CDS算法50应用到针对协变量的集合中的协变量的医学对象的值来生成针对医学对象的医学状况的预测。为此,提供电子CDS用户接口64,医生、护士或其他医学专业人员可通过该电子CDS用户接口输入针对患者的协变量的值(例如,使用一个或多个用户输入设备16、18、20)并且可以呈现医学状况的预测,例如通过显示在显示器14上。根据CDS设备10的连接性,可以通过访问医学对象的电子病历(EMR)文件来自动获得协变量值中的一些,从而减少所需的手动数据输入量。在一些实施例中,CDS设备10可以被编程为根据其他信息来计算或导出一个或多个协变量值,例如,可以基于对入院时患者的生命体征测量结果的分析来确定入住ICU时的败血症。
在下文中,描述了执行协变量偏移调节的机器学习更新部件44的一些说明性实施例。在一种方法中,机器学习更新部件44是机器学习部件26的副本,其在供应商计算机24上执行以生成经训练的CDS算法30。在该方法中,更新CDS算法本身。更新训练适当地使用经训练的CDS算法30的参数作为初始参数值,并且由于协变量偏移的影响预期相对较小,因此预期这些初始参数是用于更新训练的良好起始值,从而允许CDS算法更新训练将在几次迭代中在客户计算机12上执行。对于该方法,由机器学习部件26采用的训练过程需要接受针对数据集22的数据样本的权重(或者,备选地,修改在客户计算机12上运行的副本以接受这些权重)。此外,这要求供应商愿意向每个CDS设备客户提供其机器学习部件26的可执行版本。如果学习部件26被认为是商业秘密或其他机密信息,则供应商可能不愿意与客户共享学习部件26。
继续参考图1并进一步参考图2,公开了一种备选方法,其允许更新经训练的CDS算法30以在客户侧针对协变量偏移进行调节,而无需与客户共享学习部件26。在该方法中,针对协变量偏移调节的经训练的CDS算法50包括(如图2所示):(i)由在供应商计算机24上执行的机器学习部件26训练的经训练的CDS算法30,以及(ii)由在客户计算机12上执行的机器学习更新部件44训练的协变量偏移预测器70,其在由经训练的CDS算法30输出的医学状况的预测上进行操作。因此,如图2所示,在推断阶段期间,针对客户诊断中的医学对象的协变量(x)72的值输入被输入到操作用于输出预测的经训练的CDS算法30,然后该预测被输入到协变量偏移预测器70以生成针对医学对象的预测(y)74。在该实施例中,机器学习更新部件44通过在具有由协变量偏移调节权重40加权的训练样本的训练数据集22上训练协变量偏移预测器70来执行更新训练,并且协变量偏移预测器70的这种训练不修改由供应商提供的经训练的CDS算法30。因此,客户不需要访问供应商的(可能专有的)机器学习部件26。此外,因为预期协变量偏移相对较小,所以协变量偏移预测器70可以在计算上相对简单。例如,在一些实施例中,协变量偏移预测器70包括逻辑回归预测器。
参考图3,可以偶尔重复协变量偏移调节,以便考虑医学对象人口统计随时间的变化或者在客户侧的协变量统计随时间的其他偏移。例如,图3示出了这种检查由触发器80启动,该触发器可以是例如针对群体偏移的年度检查,和/或触发器80可以在某些其他基础上,例如附近的医院关闭,以及随后之前在现已关闭的邻近医院接受治疗的患者的涌入。触发器80导致通过用户接口62重新呈现临床调查问题,并且生成边际概率分布42。然后可以将这些与在最后的协变量偏移调节期间生成的边际概率分布进行比较。在判定82中,如果边际概率分布的变化低于某个阈值,则在84处终止检查而不执行更新协变量偏移调节。另一方面,如果一个或多个边际概率分布已经显著改变,则重新计算群组概率60和权重40,并且调用机器学习更新部件44以执行更新协变量偏移调节,如已经参考图1描述的那样。
在图1的实施例中,边缘概率分布是根据使用临床调查用户接口62呈现给客户或客户代理的调查问题的答案生成的。具体地,在一些实施例中,针对协变量偏移进行调节的更新训练不使用除训练样本的训练数据集22之外的任何训练样本。
然而,可以使用额外的和/或其他的信息源来生成边际概率分布。例如,参考图3,当采用电子CDS用户接口64来执行医学对象诊断时,CDS设备10可以收集关于被诊断的医学对象的信息。当这些医学对象中的每个医学对象由针对该医学对象的协变量的值(x)的集合表示时,这些累积数据可用于构建代表客户侧群体的数据集90。数据集90可用于估计边际概率分布,例如,针对协变量的值v的概率由下式给出:
其中,N是数据集90中的医学对象的总数,并且Nv是具有针对协变量的值v的那些医学对象的数量。然后该数据可以用作协变量的边际概率分布42。
已经参考优选实施例描述了本发明。在阅读和理解前面的详细描述时,其他人可以进行修改和变更。本发明旨在被解释为包括所有这些修改和变更,只要它们落入所附权利要求或其等效方案的范围内。

Claims (13)

1.一种采用经训练的CDS算法(30)的电子CDS设备,所述经训练的CDS算法在协变量的集合中的协变量的值上进行操作以输出医学状况的预测,所述经训练的CDS算法已经在来自训练群体的训练样本的训练数据集(22)上进行训练,所述CDS设备包括:
计算机(12、24),其包括显示器(14)和一个或多个用户输入设备(16、18、20),所述计算机被编程为:
经由所述一个或多个用户输入设备接收对临床调查问题的响应,其中,所述临床调查问题被配置为以匿名形式收集关于与用于训练所述CDS算法的所述训练群体不同的群体的、针对协变量的所述集合中的各个协变量的群体级统计,使得所述群体级统计不包含患者级信息;
使用针对协变量的所述集合中的所述各个协变量的所述群体级统计生成针对协变量的所述集合中的所述各个协变量的边际概率分布(42),其中,每个边际概率分布对应于与用于训练所述CDS算法的所述训练群体不同的所述群体中的协变量的所述集合中的每个协变量的概率分布;
通过使用针对协变量的所述集合中的所述各个协变量的所述边际概率分布(42)计算针对所述训练数据集的所述训练样本的协变量偏移调节权重(40)并在具有由所述协变量偏移调节权重加权的所述训练样本的所述训练数据集上执行更新训练来针对协变量偏移调节所述经训练的CDS算法;
通过将针对协变量偏移调节的经训练的CDS算法(50)应用到协变量的所述集合中的所述协变量的针对医学对象的值来生成针对所述医学对象的所述医学状况的预测;并且
在所述显示器上显示针对所述医学对象的所述医学状况的所生成的预测。
2.根据权利要求1所述的电子CDS设备,其中:
针对协变量偏移调节的经训练的CDS算法(50)包括所述经训练的CDS算法(30)和协变量偏移预测器(70),所述协变量偏移预测器在由所述经训练的CDS算法输出的所述医学状况的所述预测和所述经训练的CDS算法操作用于输出所述预测的协变量的值上进行操作;并且
执行更新训练包括在具有由所述协变量偏移调节权重(40)加权的所述训练样本的所述训练数据集(22)上训练所述协变量偏移预测器,其中,对所述协变量偏移预测器的所述训练不修改所述经训练的CDS算法。
3.根据权利要求2所述的电子CDS设备,其中,所述协变量偏移预测器(70)包括逻辑回归预测器。
4.根据权利要求1-3中的任一项所述的电子CDS设备,其中,针对协变量偏移对所述经训练的CDS算法(30)的所述调节不使用除训练样本的所述训练数据集(22)之外的任何训练样本。
5.根据权利要求1-3中的任一项所述的电子CDS设备,其中,使用所述边际概率分布(42)来计算针对所述训练数据集(22)的所述训练样本的协变量偏移调节权重(40)包括:
关于由针对协变量的所述集合中的所述各个协变量的所述边际概率分布(42)约束的所述训练数据集(22)优化在协变量的所述集合上的联合概率分布(60);并且
根据优化的联合概率分布来计算针对所述训练数据集的所述训练样本的所述协变量偏移调节权重(40)。
6.根据权利要求5所述的电子CDS设备,其中,优化所述联合概率分布(60)包括使所述训练数据集(22)的有效样本大小最大化。
7.根据权利要求1-3中的任一项所述的电子CDS设备,其中,所述经训练的CDS算法(30)是在不使用除训练样本的所述训练数据集(22)之外的任何训练样本的情况下针对协变量偏移进行调节的。
8.一种采用CDS算法(30)的电子CDS方法,所述CDS算法在协变量的集合中的协变量的值上进行操作以输出医学状况的预测,所述电子CDS方法包括:
使用第一计算机(24)在来自训练群体的训练样本的训练数据集(22)上训练所述CDS算法;
在所述训练之后,使用与所述第一计算机不同的第二计算机(12)来执行CDS操作,所述CDS操作包括:
接收对临床调查问题的响应,其中,所述临床调查问题被配置为以匿名形式收集关于与用于训练所述CDS算法的所述训练群体不同的群体的、针对协变量的所述集合中的各个协变量的群体级统计,使得所述群体级统计不包含患者级信息;
使用针对协变量的所述集合中的所述各个协变量的所述群体级统计生成针对协变量的所述集合中的所述各个协变量的边际概率分布(42),其中,每个边际概率分布对应于与用于训练所述CDS算法的所述训练群体不同的所述群体中的协变量的所述集合中的每个协变量的概率分布;
通过使用针对协变量的所述集合中的所述各个协变量的所述边际概率分布(42)计算针对所述训练数据集(22)的所述训练样本的协变量偏移调节权重(40)并在具有由所述协变量偏移调节权重加权的所述训练样本的所述训练数据集上执行更新训练来针对协变量偏移调节经训练的CDS算法(30);
通过将针对协变量偏移调节的经训练的CDS算法(50)应用到协变量的所述集合中的所述协变量的针对医学对象的值来生成针对所述医学对象的所述医学状况的预测;并且
在显示器(14)上显示针对所述医学对象的所述医学状况的所生成的预测。
9.根据权利要求8所述的电子CDS方法,其中,计算针对所述训练数据集(22)的所述训练样本的协变量偏移调节权重(40)包括:
关于由针对协变量的所述集合中的所述各个协变量的所述边际概率分布(42)约束的所述训练数据集优化在协变量的所述集合上的联合概率分布(60);并且
根据优化的联合概率分布来计算针对所述训练数据集的所述训练样本的所述协变量偏移调节权重(40)。
10.根据权利要求9所述的电子CDS方法,其中,优化所述联合概率分布(60)包括使所述训练数据集(22)的有效样本大小最大化。
11.根据权利要求8-10中的任一项所述的电子CDS方法,其中:
针对协变量偏移调节的经训练的CDS算法(50)包括所述经训练的CDS算法(30)和协变量偏移预测器(70),所述协变量偏移预测器在由所述经训练的CDS算法输出的所述医学状况的所述预测和所述经训练的CDS算法操作用于输出所述预测的协变量的值上进行操作;并且
执行更新训练包括在具有由所述协变量偏移调节权重(40)加权的所述训练样本的所述训练数据集(22)上训练所述协变量偏移预测器,其中,对所述协变量偏移预测器的所述训练不修改所述经训练的CDS算法。
12.根据权利要求8-10中的任一项所述的电子CDS方法,其中,所述经训练的CDS算法(30)是在不使用除训练样本的所述训练数据集(22)之外的任何训练样本的情况下针对协变量偏移进行调节的。
13.根据权利要求8-10中的任一项所述的电子CDS方法,其中,所述训练包括使用所述训练数据集(22)来选择协变量的所述集合中的所述协变量。
CN201780048722.6A 2016-08-08 2017-08-01 基于医院人口统计的电子临床决策支持设备 Active CN109564782B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201662371886P 2016-08-08 2016-08-08
US62/371886 2016-08-08
PCT/EP2017/069365 WO2018029028A1 (en) 2016-08-08 2017-08-01 Electronic clinical decision support device based on hospital demographics

Publications (2)

Publication Number Publication Date
CN109564782A CN109564782A (zh) 2019-04-02
CN109564782B true CN109564782B (zh) 2024-03-08

Family

ID=59520895

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201780048722.6A Active CN109564782B (zh) 2016-08-08 2017-08-01 基于医院人口统计的电子临床决策支持设备

Country Status (5)

Country Link
US (1) US11620554B2 (zh)
EP (1) EP3497597A1 (zh)
JP (1) JP2019525343A (zh)
CN (1) CN109564782B (zh)
WO (1) WO2018029028A1 (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20200285771A1 (en) * 2019-03-05 2020-09-10 Abhishek Dey System and method for removing personally identifiable information from medical data
EP3882922A1 (en) * 2020-03-21 2021-09-22 Tata Consultancy Services Limited Discriminating features based sepsis prediction

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2015031576A1 (en) * 2013-08-28 2015-03-05 Siemens Aktiengesellschaft Systems and methods for estimating physiological heart measurements from medical images and clinical data
WO2015066564A1 (en) * 2013-10-31 2015-05-07 Cancer Prevention And Cure, Ltd. Methods of identification and diagnosis of lung diseases using classification systems and kits thereof
CN105593860A (zh) * 2013-09-30 2016-05-18 皇家飞利浦有限公司 患者健康状态复合评分分布和/或基于其的代表性复合评分

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1388812A1 (en) * 2002-07-04 2004-02-11 Ronald E. Dr. Kates Method for training a learning-capable system
WO2009076551A2 (en) * 2007-12-12 2009-06-18 The Regents Of The University Of California Systems and methods for predicting response of biological samples
US20140088989A1 (en) * 2012-09-27 2014-03-27 Balaji Krishnapuram Rapid Learning Community for Predictive Models of Medical Knowledge
US10304006B2 (en) * 2013-02-15 2019-05-28 The Charles Stark Draper Laboratory, Inc. Method for integrating and fusing heterogeneous data types to perform predictive analysis
US10950353B2 (en) * 2013-09-20 2021-03-16 Georgia Tech Research Corporation Systems and methods for disease progression modeling
US9858534B2 (en) 2013-11-22 2018-01-02 California Institute Of Technology Weight generation in machine learning
US20170068789A1 (en) * 2014-02-19 2017-03-09 H. Lee Moffitt Cancer Center And Research Institute, Inc. Evidence-based clinical decision system
JP6410289B2 (ja) * 2014-03-20 2018-10-24 日本電気株式会社 医薬品有害事象抽出方法及び装置
WO2016094330A2 (en) 2014-12-08 2016-06-16 20/20 Genesystems, Inc Methods and machine learning systems for predicting the liklihood or risk of having cancer
US20160188822A1 (en) * 2014-12-30 2016-06-30 Cerner Innovation, Inc. Clinical decision support rule generation and modification system and methods
US20160321748A1 (en) * 2015-04-29 2016-11-03 International Business Machines Corporation Method for market risk assessment for healthcare applications

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2015031576A1 (en) * 2013-08-28 2015-03-05 Siemens Aktiengesellschaft Systems and methods for estimating physiological heart measurements from medical images and clinical data
CN105474219A (zh) * 2013-08-28 2016-04-06 西门子公司 用于根据医学图像和临床数据来估计生理学心脏测量的***和方法
CN105593860A (zh) * 2013-09-30 2016-05-18 皇家飞利浦有限公司 患者健康状态复合评分分布和/或基于其的代表性复合评分
WO2015066564A1 (en) * 2013-10-31 2015-05-07 Cancer Prevention And Cure, Ltd. Methods of identification and diagnosis of lung diseases using classification systems and kits thereof

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
可迁移测度准则下的协变量偏移修正多源集成方法;杨兴明等;《电子与信息学报》;第37卷(第12期);第2913-2919页 *

Also Published As

Publication number Publication date
WO2018029028A1 (en) 2018-02-15
EP3497597A1 (en) 2019-06-19
US11620554B2 (en) 2023-04-04
CN109564782A (zh) 2019-04-02
JP2019525343A (ja) 2019-09-05
US20190164648A1 (en) 2019-05-30

Similar Documents

Publication Publication Date Title
Simpson et al. Multiple self-controlled case series for large-scale longitudinal observational databases
Liu et al. Missed opportunities in preventing hospital readmissions: Redesigning post‐discharge checkup policies
WO2018228852A1 (en) Systems and methods for dynamic monitoring of patient conditions and prediction of adverse events
Speiser et al. Random forest classification of etiologies for an orphan disease
US20230351204A1 (en) Selecting a training dataset with which to train a model
Jin et al. Prospective stratification of patients at risk for emergency department revisit: resource utilization and population management strategy implications
Estes et al. Time-dynamic profiling with application to hospital readmission among patients on dialysis
Zhou et al. How do tumor cytogenetics inform cancer treatments? dynamic risk stratification and precision medicine using multi-armed bandits
Hong et al. Semi‐supervised validation of multiple surrogate outcomes with application to electronic medical records phenotyping
CN109564782B (zh) 基于医院人口统计的电子临床决策支持设备
Cai et al. Improving the efficiency of clinical trial recruitment using an ensemble machine learning to assist with eligibility screening
Shaoibi et al. Shared decision making: from decision science to data science
US20230252305A1 (en) Training a model to perform a task on medical data
Mohi Uddin et al. XML‐LightGBMDroid: A self‐driven interactive mobile application utilizing explainable machine learning for breast cancer diagnosis
Rawat et al. Case based Reasoning Technique in Digital Diagnostic System for Lung Cancer Detection
Chen et al. Enabling cost-effective population health monitoring by exploiting spatiotemporal correlation: An empirical study
Wang et al. An optimal learning method for developing personalized treatment regimes
Yan et al. Observability and its impact on differential bias for clinical prediction models
Qiu et al. HFS‐LightGBM: A machine learning model based on hybrid feature selection for classifying ICU patient readmissions
Daignault et al. Doubly robust estimator for indirectly standardized mortality ratios
Wang et al. Adaptive treatment strategies for chronic conditions: shared-parameter G-estimation with an application to rheumatoid arthritis
McHaney et al. Iterative conceptual modeling: A case study in cardiac patient survival simulation
Debray et al. Methods for comparative effectiveness based on time to confirmed disability progression with irregular observations in multiple sclerosis
Feng et al. Statistical tests for replacing human decision makers with algorithms
Bobb et al. Accounting for spatial confounding in epidemiological studies with individual-level exposures: An exposure-penalized spline approach

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant