CN105389454B - 用于预测与患者相关联的住院风险的方法、***和介质 - Google Patents

用于预测与患者相关联的住院风险的方法、***和介质 Download PDF

Info

Publication number
CN105389454B
CN105389454B CN201510516201.1A CN201510516201A CN105389454B CN 105389454 B CN105389454 B CN 105389454B CN 201510516201 A CN201510516201 A CN 201510516201A CN 105389454 B CN105389454 B CN 105389454B
Authority
CN
China
Prior art keywords
model
momentum
score
features
hospitalization
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201510516201.1A
Other languages
English (en)
Other versions
CN105389454A (zh
Inventor
D·卡罗尔
C·林奇
G·阿库纳
A-H·沃
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Accenture Global Services Ltd
Original Assignee
Accenture Global Services Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Accenture Global Services Ltd filed Critical Accenture Global Services Ltd
Publication of CN105389454A publication Critical patent/CN105389454A/zh
Application granted granted Critical
Publication of CN105389454B publication Critical patent/CN105389454B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/04Inference or reasoning models
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/70ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for mining of medical data, e.g. analysing previous cases of other patients
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/20ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/30ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for calculating health indices; for individual health risk assessment

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Public Health (AREA)
  • Medical Informatics (AREA)
  • Data Mining & Analysis (AREA)
  • Biomedical Technology (AREA)
  • Primary Health Care (AREA)
  • Pathology (AREA)
  • Epidemiology (AREA)
  • General Health & Medical Sciences (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Computational Linguistics (AREA)
  • Physics & Mathematics (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Artificial Intelligence (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明的各实施方式总体上涉及预测模型生成器。具体地,涉及方法、***和装置(包括编码在计算机存储介质上的计算机程序)可以被实现为执行包括接收限定预测模型的输入数据的动作,预测模型包括多个特征。动作进一步包括使用包括用于群体内的多个实体的每个特征的值的实际数据,通过以下方式对于每个特征迭代地加权预测模型:以动量迭代地调整用于特征的当前权重直到动量等于零,基于模型得分是否改善以动量因子迭代地调整动量,基于实际数据计算模型得分。动作进一步包括使用加权的预测模型来计算实体的值得分。

Description

用于预测与患者相关联的住院风险的方法、***和介质
技术领域
本发明的各实施方式总体上涉及医疗保健领域,具体地涉及预测模型生成器。
背景技术
在诸如医疗保健行业之类的一些行业中,预测的结果可以用于制订向消费者提供的各种服务。用医疗保健行业作为示例,可以分析患者的医疗特征,以基于先前已住院患者可用的住院数据来预测未来住院的可能性。在一些示例中,患者服务提供者(例如,医疗从业者)和付款人(例如,保险提供者)可能对以有效方式预测患者的住院风险感兴趣。在其它示例中,预测的结果可以用于影响其它非医疗保健有关行业中的商业行为。
发明内容
本公开的实施方式包括用于预测与实体相关联的值的计算机实现的方法。在一些实施方式中,动作包括由一个或多个处理器,接收限定预测模型的输入数据,预测模型包括多个特征。在一些实施方式中,动作进一步包括由一个或多个处理器,使用包括用于群体内的多个实体的每个特征的值的实际数据,通过以下方式对于每个特征迭代地加权预测模型:以动量迭代地调整用于特征的当前权重直到动量等于零,基于模型得分是否改善以动量因子迭代地调整动量,基于实际数据计算模型得分。在一些实施方式中,动作进一步包括由一个或多个处理器,使用加权的预测模型来计算实体的值得分。这一方面的其它实施方式包括对应***、装置和计算机程序,计算机程序被配置为执行方法的动作、编码在计算机存储设备上。
本公开的实施方式还包括用于确定患者的计划外住院风险的计算机实现的方法。在一些实施方式中,动作包括由一个或多个处理器,接收限定预测模型的输入数据,预测模型包括多个特征。在一些实施方式中,动作进一步包括由一个或多个处理器,使用包括用于先前住院的多个患者的每个特征的值的住院数据,通过以下方式对于每个特征迭代地加权预测模型:以动量迭代地调整用于特征的当前权重直到动量等于零,基于模型得分是否改善以为2的因子迭代地调整动量,基于住院数据计算模型得分。在一些实施方式中,动作进一步包括由一个或多个处理器,使用加权的预测模型来计算患者的住院风险得分。这一方面的其它实施方式包括对应***、装置和计算机程序,计算机程序被配置为执行方法的动作、编码在计算机存储设备上。
这些和其它实施方式均可以可选地包括以下特征中的一个或多个特征。在一些实施方式中,以动量迭代地调整用于特征的当前权重包括使用先前确定的用于每个特征的权重作为当前迭代中用于每个特征的初始权重。在一些实施方式中,预测模型包括代数模型和基于树的模型之一。在一些实施方式中,预测模型进一步包括向多个特征中的一个或多个特征指派的相应初始权重。在一些实施方式中,相应初始权重中的一个或多个相应初始权重等于1。在一些实施方式中,相应初始权重中的一个或多个相应初始权重等于0。
在一些实施方式中,多个特征表示医疗参数和人口统计参数中的一个或多个。在一些实施方式中,医疗参数包括DSM代码、ICD-9代码、ICD-10代码、SNOMED代码、LOINC代码、RxNORM代码、CPT代码以及非编码参数中的一个或多个。在一些实施方式中,方法进一步包括基于输入数据生成预测模型。在一些实施方式中,动量包括当前权重调整的量。
在一些实施方式中,模型得分与先前计算的最佳模型得分进行比较。在一些实施方式中,模型得分基于在使用预测模型确定的预测值和从住院数据确定的实际值之间的差值。在一些实施方式中,当对于当前迭代的差值与对应于先前计算的最佳模型得分的差值相比减少时,模型得分得到改善。
在一些实施方式中,在正方向上调整当前权重。在一些实施方式中,对于为1的初始动量,如果模型得分未以阈值得到改善,则应用动量规则以将动量设置为-1。在一些实施方式中,在负方向上调整当前权重。在一些实施方式中,用于特征的当前权重以动量进行调整,直到已经达到用于调整当前权重的最大迭代数目。在一些实施方式中,对于其中模型得分不再改善的情况,一旦动量返回到为1或-1的值,就应用动量规则以将动量设置为0。在一些实施方式中,用于确定相应权重的迭代被限于对于多个特征中的每个特征的最大迭代数目。
在一些实施方式中,向医疗记录***提供住院风险得分。在一些实施方式中,住院风险得分由服务提供者用于制订针对患者的一个或多个服务。在一些实施方式中,方法进一步包括将预测模型存储到计算机可读存储器。
依照本公开的实施方式,相比于其可以被采用用于生成预测模型的常规技术,被采用用于分析数据的技术可以相对快速地执行以提供通用预测模型。此外,本公开的实施方式可以用于快速生成几种形式的预测模型中的任何一种,几种形式的预测模型基于各种群体并且可以预测几个不同输出值中的任何一个输出值。即,本公开的实施方式足够灵活以用于多个应用,并且可以跨多种多样的行业或多学科行业来使用。
本公开进一步提供用于实现本文中提供的方法的***。***包括一个或多个处理器以及计算机可读存储介质,计算机可读存储介质耦合到一个或多个处理器、具有存储在其上的指令,指令当由一个或多个处理器执行时使得一个或多个处理器执行依照本文中提供的方法的实施方式的操作。
应当理解,依照本公开的方法可以包括本文中描述的方面和特征的任何组合。即,依照本公开的方法不限于本文中具体描述的方面和特征的组合,而是还包括所提供的方面和特征的任何组合。
在附图和下面的描述中阐述了本公开的一个或多个实施方式的细节。本公开的其他特征和优势将从说明书和附图以及权利要求书中变得容易理解。
附图说明
图1描绘其可以执行本公开的实施方式的示例***。
图2描绘依照本公开的实施方式的示例计算环境。
图3A描绘示例代数模型。
图3B描绘示例的基于树的模型。
图4A和图4B描绘依照本公开的实施方式的提供示例动量确定的示例表。
图5描绘其可以在本公开的实施方式中执行的示例处理。
图6描绘其可以执行本公开的实施方式的示例计算***。
具体实施方式
本公开的实施方式总体上涉及提供预测模型。在一些示例中,预测模型基于一个或多个输入值来预测输出值。在一些实施方式中,基于迭代细化处理来提供预测模型。更特别地,基于修改的模拟退火和动量乘数来提供动量分析。在一些示例中,如本文中描述的,对模型参数的改变的动量被用于迭代地调整参数。在一些示例中,计算机***的一个或多个设备上实现的一个或多个计算机程序可以接收存储在计算机***的一个或多个设备上的数据,并且可以处理数据以提供预测模型。在一些示例中,该数据是历史数据。在一些示例中,该数据是实时数据。一个或多个计算机程序可以分析数据以产生预测模型的初始版本,并且随后细化预测模型的初始版本以提供预测模型的最终版本。依照本公开的实施方式,相比于其可以被采用用于生成预测模型的常规技术,被采用用于分析数据的技术可以相对快速地执行以提供通用的预测模型。此外,本公开的实施方式可以用于快速生成几种形式的预测模型中的任何一种,几种形式的预测模型基于各种群体并且可以预测几个不同输出值中的任何一个输出值。
本公开的实施方式在本文中被描述在非限制性、示例上下文中。示例上下文包括医疗保健行业。鉴于该示例上下文,本公开的实施方式在本文中参考示例预测(输出)值更详细地进行描述。示例值包括患者住院风险(例如计划外的住院风险)。在这一示例中,可以基于实际住院数据(例如现有的历史数据)来预测特定患者的住院风险,实际住院数据从先前已住院患者群体(例如样本或池)可得或者被提供为实时数据(如正从一个或多个患者收集的数据)。然而,应当理解,本公开的实施方式适用于其它上下文和/或其它值。总体上,本公开涉及提供用于基于可用数据来预测值的预测模型。据此,对于医疗保健行业的示例上下文,除了若干其它预测值之外,其可以由模型预测的其它值可以包括住院的持续时间、基于母体健康史的新生儿围产期成本、以及充血性心脏衰竭的风险。本公开的实施方式还可以用于预测与诸如其它服务行业、汽车行业、农业行业以及任何数目的其它行业之类的其它非医疗保健行业有关的值。即,本公开的实施方式足够灵活以用于多个应用,并且可以跨多种多样的行业或多学科行业来使用。
图1描绘其可以执行本公开的实施方式的示例***100。在所描绘的示例中,***100包括其通过网络110与服务器***108通信的计算设备102。在一些示例中,计算设备102可以表示各种形式的处理设备,包括但不限于台式计算机、膝上型计算机、平板计算机、手持式计算机、个人数字助理(PDA)、蜂窝电话、网络家电、相机、智能电话、增强型通用分组无线业务(EGPRS)移动电话、媒体播放器、导航设备、电子邮件设备、游戏控制台、或者这些数据处理设备或其它数据处理设备中的任何两个或更多的组合。如本文中更详细讨论的,计算设备102可以与服务器***108中提供的应用软件交互。
在一些实施方式中,服务器***108可以包括一个或多个服务器112和数据库114。在一些示例中,服务器112可以表示各种形式的服务器,包括但不限于web服务器、应用服务器、代理服务器、网络服务器或服务器农场。例如,服务器112可以是其执行由计算设备102、104访问的软件的应用服务器。在操作中,多个计算设备102、104(例如,客户端)可以通过网络110的方式与服务器112通信。在一些实施方式中,用户可以在计算设备102上运行的用户接口应用(例如,web浏览器)中调用服务器112上可用的应用。每个应用可以单独访问来自一个或多个储存库资源(例如,数据库114)的数据。
在一些实施方式中,***100可以是其跨越诸如网络110之类的一个或多个网络的分布式客户端/服务器***。网络110可以是大的计算机网络,诸如连接任何数目的移动客户端、固定客户端和服务器的局域网(LAN)、广域网(WAN)、因特网、蜂窝网络或者它们的组合。在一些实施方式中,每个客户端(例如计算设备102)可以通过虚拟私人网络(VPN)、安全外壳(SSH)隧道或其它安全的网络连接与服务器***108通信。在一些实施方式中,网络110可以包括因特网、无线服务网络,并且可以包括公共交换电话网(PSTN)。在其它实施方式中,网络110可以包括公司网络(例如,内联网)以及一个或多个无线接入点。
在上面讨论的非限制性示例上下文内,将针对确定患者的住院风险(例如,计划外的住院风险)的示例预测来描述本公开的实施方式。在一些示例中,住院风险可以由向患者提供服务的一个或多个关系人利用,以便做出关于如何制订或修改那些服务的确定。例如,医疗从业者(例如,医生、护士或治疗师)可以将住院风险用于生成针对患者的预后和治疗计划中的一个或多个。在一些示例中,诸如保险提供者(例如,健康保险提供者或生命保险提供者)之类的付款人可以将住院风险用于执行选择保险覆盖特征(例如,符合条件的医疗服务、符合条件的医疗提供者、覆盖期或覆盖量)、确定保险费、以及分配治疗设施内的医疗资源(例如,医疗设备或人员)中的一个或多个。
在一些实施方式中,基于从由于各种情况先前已经住院的患者群体可得的实际住院数据,或者基于以实时数据可得的数据(如正在从一个或多个患者收集的数据),可以预测患者的住院风险。更特别地,***100的服务器***108上实现的计算机程序可以执行其部分基于模拟退火和二分搜索分析的混合算法,从而使用实际住院数据来生成用于根据一个或多个特征(例如,生物学参数、医疗条件、其他患者特性、或其它医疗史参数)来预测住院风险的模型。在这种方式中,预测模型可以标识哪些条件很可能造成计划外的住院。一旦生成,预测模型就可以用于计算在一个或多个特征方面特定患者的预测住院风险。参考阈值风险,因此预测模型可以标识易受计划外住院的患者。
图2描绘依照本公开的实施方式的示例计算环境200。在一些实施方式中,计算环境200可以包括数据储存库208和模型生成器202,模型生成器202接收(例如,间接地接收)来自数据储存库208的实际(例如,历史或实时)数据(例如,患者群体的住院数据)作为输入。例如,计算环境200可以包括其在模型生成器202和数据储存库208之间调和(mediate)的检索服务204。在一些示例中,检索服务204可以查询数据储存库208、响应于查询从数据储存库208接收实际数据、并且向模型生成器202提供实际数据。模型生成器202和检索服务204可以实现在***100的服务器112中的一个或多个服务器上,并且数据储存库208可以提供***100的数据库114中的一个或多个数据库的实施方式。数据储存库208可以填入其接收数据文件并且将来自数据文件的数据加载到数据储存库中的提取、变换、加载(ETL)部件。对于实际数据中表示的每个实体(例如,患者),实际数据可以包括与目标参数相关联的目标值(例如与住院风险对应的值)以及与多个特征相关联的多个特征值(例如,与各种测量的或以其它方式量化的医疗参数或其它患者特性对应的值)。在一些示例中,当体现为医疗参数时,多个特征可以反映精神障碍诊断及统计手册(DSM)代码(codes)、当前程序术语(CPT)代码、国际疾病分类(ICD)-9诊断代码、分层条件代码(HCC)、医学***化命名法(SNOMED)代码、逻辑观察标识符名称和代码(LOINC)实验室数据、RxNORM处方数据、或者其反映各种病态或病理生理学的其它类型的代码。在一些示例中,多个特征可以包括或反映诸如年龄、性别、种族、收入或邮政编码之类的人口统计信息。在一些示例中,实际数据可以被存储在一个或多个表中,其中每个行或列对应于实际数据中表示的特定实体。在一些示例中,对于实际数据中表示的每个实体,实际数据可以包括分别与多个目标参数相关联的多个目标值。
在一些实施方式中,模型生成器202可以生成用于预测与存储在数据储存库208中的实际数据中表示的目标参数相关联的目标值的模型。在一些示例中,用户可以选择要由模型生成器202生成的预测模型的类型(例如,代数模型、基于树的模型或者任何适当的模型类型)或者预测模型的变体。在一些实施方式中,基于已经针对实际数据执行的一个或多个分析(例如,回归分析或另一类型的分析),用户可以选择类型。
在一些示例中,基于从数据储存库208接收的实际数据,模型生成器202可以选择与预测模型中表示的特征中的每个特征对应的初始权重。在一些示例中,权重可以被初始化有为零、一的值或另一非零值。
在一些示例中,模型生成器202调整初始预测模型,并且迭代地调整预测模型的后续版本,以细化预测模型。例如,与预测模型中表示的特征相关联的权重可以被调整,以试图相对于初始(例如,未调整的)状态或者相对于经调整的(例如,中间的、非最终化的)状态来改善预测模型。在一些实施方式中,对模型的调整可以由其包括在计算环境200中但是与模型生成器202分立提供的模块(例如,模型调整器)来执行。这样的模型调整器可以实现在***100的服务器112中的一个或多个服务器上。
在一些实施方式中,计算环境200可以进一步包括模型评分器206,其接收经调整的预测模型的例示和存储在数据储存库208中的实际数据。在一些示例中,模型评分器206基于实际数据给预测模型评分。模型评分器206可以实现在***100的服务器112中的一个或多个服务器上。在一些示例中,一旦与特定特征相关联的一个或多个权重已经由模型生成器202进行了调整,则模型评分器206可以使用实际数据中包括的特征值来给预测模型评分。例如,模型评分器206可以使用作为到模型生成器202调整的模型的输入的分别与实际数据中的每个实体相关联的特征值,来计算针对实际数据中表示的每个实体的预测目标值。在一些示例中,模型评分器206可以计算作为针对实际数据中表示的所有或某个数目的实体所计算的预测目标值的合计(例如,总和)、平均或中值的有效预测值。此外,模型评分器206可以计算作为针对实际数据中表示的所有或某个数目的实体所提供的实际目标值的合计、平均或中值的有效实际值。在一些实施方式中,替代地,评分功能可以连同预测模型的每个版本(例如每个经调整的模型)一起提供,并且被执行为给相关联的预测模型评分。在一些示例中,模型评分器206或者这样的评分功能可以包括其可以被实现为给模型评分的评分插件。
在一些实施方式中,模型评分器206可以计算作为在有效预测值(例如,使用作为到预测模型的输入的实际数据中包括的特征值计算的)和有效实际值(例如,使用实际数据中包括的目标值计算的)之间的差值的模型得分。在一些实施方式中,降低的模型得分(例如,相比于先前计算的最佳模型得分)指示当前模型调整已经改善了模型,或者换言之,有效预测值已经逼近有效实际值。在一些实施方式中,增加的模型得分(例如,相比于先前计算的最佳模型得分)指示当前模型调整尚未改善模型,或者换言之,参考最佳模型得分,有效预测值尚未进一步逼近有效实际值。
在一些实施方式中,模型评分器206可以包括其可以例如对群体的每个实体的预测值进行排序或排名的修改功能。然后,这样的排名可以与群体的每个实体的实际排名进行比较。在一些实施方式中,对于密切匹配的排名实现相对高的模型得分,而对于不密切匹配的排名实现相对低的模型得分。
在一些实施方式中,模型评分器206可以将有效预测值映射(例如,根据分类评分)到预测值的若干预定类别之一,并且然后比较预定类别与实际类别。在这样的实施方式中,预定类别与实际类别的匹配可以指示模型已被改善,而与实际类别不同的预定类别可以指示模型尚未改善。在一些示例中,这样的预定类别可以包括值的定义范围。在一些示例中,这样的预定类别可以对应于“低风险”、“中等风险”或“高风险”患者类别。
在一些实施方式中,模型得分可以与阈值得分进行比较。在一些示例中,如果模型得分超过阈值得分,则预测模型是不能令人满意的,并且模型生成器202再次调整预测模型的一个或多个权重。在一些示例中,如果模型得分未超过阈值得分,则预测模型是令人满意的。在一些示例中,如果预测模型是令人满意的并且不要做出进一步的调整(例如,对一个或多个其它权重),则预测模型的当前版本被提供作为预测模型的最终版本。在一些示例中,如果预测模型是令人满意的,仍然可以确定一个或多个其它权重要被调整,并且模型生成器202再次调整预测模型。
在一些实施方式中,模型生成器202基于动量分析来迭代地调整预测模型。更特别地,并且依照本公开的实施方式,使用基于修改的模拟退火和动量因子的动量分析来调整预测模型的权重。在一些示例中,动量是特定权重针对当前迭代被调整的量(例如,包括幅度以及符号或方向)。在一些示例中,并且如本文中描述的,权重在第一迭代期间被调整某一增量,并且权重在后续迭代中被调整增量的倍数。在一些示例中,增量反映对权重的改变的动量,并且在每次迭代时基于预测模型的改善或缺乏改善进行调整。在一些示例中,重复迭代直到动量达到最小值(例如,零)或者直到最大迭代数目已经完成。在一些示例中,施加这样的最大迭代数目可以防止模型包括“失控”特性(例如,单个特征的显著超重)。
在一些实施方式中,动量值M可以被提供为标量值。在一些示例中,计算环境200可以采用其使用动量值M以规定方式调整预测模型的方法。在一些实施方式中,模型评分器206迭代地给预测模型评分,并且据此模型生成器202在特定特征方面迭代地调整预测模型,直到已经确定针对特定特征的最终调整因子(例如,最终权重)。在这种方式中,计算环境200可以采用模拟退火方法,其反复改变预测模型,测试响应于改变的预测模型的性能,并且基于性能而选择性地改变预测模型。在一些实施方式中,针对预测模型中表示的特征中的每个特征迭代地调整预测模型,直到已经确定针对每个特征的最终调整因子。在一些实施方式中,基于向数据储存库208提供的修订(例如,更新)或新数据,可以周期性地或实时地更新预测模型。
在一些示例中,计算环境200可以进一步包括模型储存库210,一旦已经确定针对预测模型中表示的每个特征的最终调整因子,模型储存库210就从模型评分器206接收预测模型(例如,模型的最终化版本)。模型储存库210可以提供***100的数据库114中的一个或多个数据库的实施方式。在一些示例中,模型储存库210可以被提供为XML文件的目录。
在一些实施方式中,示例计算环境可被实现为基于云的环境。例如,模型调整器可以被提供在web服务应用编程接口(API)中,web服务应用编程接口(API)从相应数据库接收实际数据和预测模型并且然后向评分模块提供数据,评分模块基于接收的数据给模型评分。
在一些实施方式中,并且如上面介绍的,可以以各种形式提供预测模型。本文中进一步详细描述的示例形式包括代数模型和基于树的模型。然而,设想本公开的实施方式可以使用任何适当的模型类型来实现。
图3A描绘其可以由模型生成器202生成的示例代数模型300a。在一些实施方式中,代数模型300a可以提供作为多个变量a1…am的函数f的y,其中y可以对应于实际数据中表示的目标参数,a1…am可以对应于实际数据中表示的多个特征,并且w1…wm可以表示分别与多个特征相关联的权重。例如,w1…wm可以被提供为标量值。在一些实施方式中,模型300a可以提供线性函数。在一些实施方式中,模型300a可以提供非线性函数。在一些示例中,初始代数模型可以反映先前基于不同群体生成的模型。在一些示例中,使用这样的先前生成的模型作为预测模型的起点可以改善预测模型的准确性或者预测模型收敛于解的速度。在一些示例中,可以基于实际数据(例如,从图2的数据储存库208提供的)来提供初始代数模型。例如,可以基于曲线拟合处理来提供初始代数模型。
图3B描绘其可以由模型生成器202生成的示例基于树的模型300b。在一些实施方式中,基于树的模型300b可以提供其分别与乘数wN1…wNm相关联的多个节点N1…Nm(例如,在示例基于树的模型300b中m=4)。例如,wN1…wNm可以被提供为标量值。在基于树的模型300b中,N1是根(例如最顶部的)节点并且还是N2和N3的母节点。N2和N3是中间节点并且还是N1的子节点。N3是N4的母节点,并且N4是N3的子节点。N2和N4还是基于树的模型300b的叶(例如,终端)节点。
在一些示例中,根节点N1可以对应于实际数据中表示的目标参数,并且子节点N2、N3、N4可以对应于实际数据中表示的多个特征。基于树的模型300b的每个节点N1…Nm考虑其分别与多个权重wn,1…wn,z相关联的包括在实际数据中的多个特征值an,1…an,z,其中n对应于节点N1…Nm之一,并且z是节点考虑的值的数目(例如,基于树的模型300b中的q、r、s和t)。基于树的模型300b的每个节点N1…Nm进一步考虑与节点直接或间接地相关联的任何子节点。例如,N1考虑N2、N3和N4,并且N3考虑N4。通过使每个节点N1…Nm的结果乘以其相关联的乘数wN1…wNm,可以从最终端叶节点(例如,N4)高达根节点(例如,N1)遍历基于树的模型300b(例如,根据深度优先树遍历),以计算预测目标值。据此,通过使N1的结果乘以wN1,可以计算预测目标值。在一些示例中,wN1可以具有为一的值。在一些示例中,存在于节点N1…Nm处的每个特征an,1…an,z可以乘以其相关联的权重wn,1…wn,z。然后,节点N1…Nm可以递归地乘以其相关联的乘数wN1…wNm。然后可以合计(例如,根据总和或计数)由节点N1…Nm限定的所有值,并且在一些情况下,条件可以应用到节点。然后可以返回节点N1…Nm的值。在一些实施方式中,模型生成器202可以提供其与基于树的模型300b不同的基于树的模型。例如,模型生成器202可以提供其提供多于四个节点或少于四个节点的基于树的模型。
图4A和图4B描绘依照本公开的实施方式的基于模拟退火和动量搜索技术来提供示例动量确定的示例表400a、400b。虽然400a、400b的示例表使用作为2和1/2的倍数进行处理,但是应当理解,本公开的实施方式可以基于使用任何倍数。例如,其它动量确定可以基于诸如3、1/3、4、1/4、5、1/5等之类的倍数的任何组合。
参考示例表400a、400b,将详细描述本公开的动量分析。表400a、400b图示动量分析,其组合模拟退火和动量搜索技术以调整由模型生成器202生成的预测模型(例如,预测模型300a、300b)。表400a、400b包括表示处理中的步骤(迭代)的列402a、402b、表示针对相应迭代的预测模型中表示的特征(例如医疗参数或患者特性)的初始权重wi的列404a、404b、表示针对相应迭代的应用于初始权重wi的初始动量Mi的列406a、406b、表示针对相应迭代的预测模型中表示的特征的测试权重wt的列408a、408b、指示针对相应迭代的用测试权重wt实现的预测模型结果的列410a、410b、表示针对相应迭代的处理的下一迭代中要应用的下一动量Mn的列412a、412b、以及图示处理中的相应迭代的图形表示的列414a、414b。
在一些实施方式中,在处理的第一迭代执行前,模型评分器206从模型生成器202接收预测模型(例如,包括初始权重的预测模型的初始未调整版本),并且使用从数据储存库208接收的实际数据来给预测模型评分。在一些示例中,与预测模型中表示的特定特征或参数(例如,模型300a的a1…am或者模型300b的an,1…an,z或N1…Nm)相关联的权重(例如,模型300a的w1…wm或者模型300b的wN1…wNm或wn,1…wn,z)可以根据下一动量Mn迭代地进行调整,直到改变下一动量Mn不再改善预测模型,并且下一动量Mn因此可以设置为0。例如,如果根据Mn改变预测模型改善了模型,则动量的幅度增加,而如果根据Mn改变预测模型未改善模型,则动量的幅度减少。在一些示例中,在执行处理时,可以在正方向上调整权重(例如,权重可以增加)。在一些示例中,在执行处理时,可以在负方向上调整权重(例如,权重可以减少)。在一些示例中,权重的符号可以改变。在一些示例中,权重可以被调整成为0的最终值。在一些实施方式中,针对预测模型中表示的每个特征,处理可以限于最大迭代数目。在一些实施方式中,可以针对预测模型中表示的每个特征来执行处理,以提供其可以存储在模型储存库210中的预测模型的最终化版本。
特别参考示例表400a,考虑预测模型的特定特征,在这一示例中,特定特征针对第一迭代具有为0的初始权重wi。在一些示例中,对于其中特征具有为0的初始权重wi的情况,预测模型由模型评分器206进行评分。在处理的第一迭代中,为1的第一初始动量Mi被添加至为0的第一初始权重wi,以提供为1的测试权重wt。在一些示例中,第一初始动量Mi可以由模型生成器202选择。在一些示例中,第一初始动量Mi可以被选择为任何非零标量值。对于其中特征具有为1的测试权重wt的情况,预测模型由模型评分器206进行评分。在这种情况下,模型得分相对于初始模型得分得到改善。即,使用经调整的预测模型确定的有效预测值和有效实际值之间的差值降低(相比于针对初始预测模型所计算的差值)。在图4A的示例中,改善由星号指示。因为为1的测试权重wt改善了预测模型,为1的测试权重wt被保持以用作针对处理的下一迭代的初始权重wi,并且初始动量Mi乘以为2的动量因子(例如,在这一示例中使用二分搜索,所以倍数被提供为2和1/2)以提供用于应用于下一迭代中的初始权重wi的为2的下一动量Mn
在处理的下一迭代(步骤2)中,为2的初始动量Mi(例如,从步骤1提供的下一动量Mn)被添加至为1的初始权重wi(例如,从步骤1提供的测试权重wt),以提供为3的测试权重wt。即,为1的初始权重wi增加动量,该动量对于当前迭代被提供为2。对于其中特征具有为3的测试权重wt的情况,预测模型由模型评分器206进行评分。在这种情况下,模型得分相对于最佳模型得分(先前迭代中计算的模型得分)得到改善。即,使用经调整的预测模型确定的有效预测值和有效实际值之间的差值再次降低。因为为3的测试权重wt改善了预测模型,为3的测试权重wt被保持以用作针对处理的下一迭代的初始权重wi,并且为2的初始动量Mi乘以为2的动量因子(例如,在这一示例中使用二分搜索,所以倍数被提供为2和1/2)以提供用于应用于下一迭代中的初始权重wi的为4的下一动量Mn
在处理的下一迭代(步骤3)中,为4的初始动量Mi(例如,从步骤2提供的下一动量Mn)被添加至为3的初始权重wi(例如,从步骤2提供的测试权重wt),以提供为7的测试权重wt。即,为3的初始权重wi增加动量,该动量对于当前迭代被提供为4。对于其中特征具有为7的测试权重wt的情况,预测模型由模型评分器206进行评分。在这种情况下,模型得分相对于最佳模型得分(先前迭代中计算的模型得分)得到改善。即,使用经调整的预测模型确定的有效预测值和有效实际值之间的差值再次降低。因为为7的测试权重wt改善了预测模型,为7的测试权重wt被保持以用作针对处理的下一迭代的初始权重wi,并且为4的初始动量Mi乘以为2的动量因子(例如,在这一示例中使用二分搜索,所以倍数被提供为2和1/2)以提供用于应用于下一迭代中的初始权重wi的为8的下一动量Mn
在处理的下一迭代(步骤4)中,为8的初始动量Mi(例如,从步骤3提供的下一动量Mn)被添加至为7的初始权重wi(例如,从步骤3提供的测试权重wt),以提供为15的测试权重wt。即,为7的初始权重wi增加动量,该动量对于当前迭代被提供为8。对于其中特征具有为15的测试权重wt的情况,预测模型由模型评分器206进行评分。在这种情况下,模型得分相对于最佳模型得分(先前迭代中计算的模型得分)未得到改善。即,使用经调整的预测模型确定的有效预测值和有效实际值之间的差值增加。在图4A的示例中,劣化由X指示。例如,测试权重wt在当前迭代中增加太多(例如,从7到15),从而导致预测模型未改善。因为为15的测试权重wt未改善模型,为15的测试权重wt被丢弃,为7的初始权重wi被保持以用于在处理的下一迭代中使用。在这种情况下,为8的初始动量Mi除以为2的动量因子(例如,乘以1/2,其中在这一示例中使用二分搜索,所以倍数被提供为2和1/2)以提供用于应用于下一迭代中的为7的初始权重wi的为4的下一动量Mn
在处理的下一迭代(步骤5)中,为4的初始动量Mi(例如,从步骤4提供的下一动量Mn)被添加至为7的初始权重wi(例如,从处理的步骤4提供的初始权重wi),以提供为11的测试权重wt。即,为7的初始权重wi增加动量,该动量对于当前迭代被提供为4。对于其中特征具有为11的测试权重wt的情况,预测模型由模型评分器206进行评分。在这种情况下,模型得分相对于最佳模型得分(处理的第三迭代(步骤3)中计算的模型得分)得到改善。即,使用经调整的预测模型确定的有效预测值和有效实际值之间的差值降低(相对于第三迭代中计算的差值)。因为为11的测试权重wt改善了预测模型,为11的测试权重wt被保持以用作针对处理的下一迭代的初始权重wi。在这种情况下,为4的初始动量Mi乘以为2的动量因子(例如,在这一示例中使用二分搜索,所以倍数被提供为2和1/2)以提供用于应用于下一迭代中的初始权重wi的为8的下一动量Mn
跟随处理的第五迭代(步骤5)之后,处理的接下来的示例迭代(步骤6-10)可以以与先前迭代(步骤1-5)相同的方式执行,以根据下一动量Mn调整特征的测试权重wt,直到针对当前迭代的初始动量Mi已经返回到1,但是测试权重wt未改善模型。这发生在图4A的示例的第十一迭代(步骤11)中。例如,特别参考步骤11,为1的初始动量Mi(例如,从步骤10提供的下一动量Mn)被添加至为12的初始权重wi(例如,从步骤10提供的初始权重wi),以提供为13的测试权重wt。对于其中特征具有为13的测试权重wt的情况,预测模型由模型评分器206进行评分。在这种情况下,模型得分相对于最佳模型得分(处理的第九迭代(步骤9)中计算的模型得分)未得到改善。即,使用经调整的预测模型确定的有效预测值和有效实际值之间的差值大于第九迭代中计算的差值,使得模型得分仍然大于步骤9中计算的模型得分。因为在其中初始动量Mi已经返回到1的情况下为13的测试权重wt未改善预测模型,丢弃为13的测试权重wt,为12的初始权重wi被保持以用作处理的下一迭代中的初始权重wi,并且应用动量规则,以将下一动量Mn设置为0以应用于下一迭代中的初始权重wi
在所描绘的示例的最终迭代(步骤12)中,处理结束,因为初始动量Mi(例如,从步骤11提供的下一动量Mn)是0。为12的初始权重wi被保持作为最终权重,以应用于预测模型中表示的特定特征。对应图形表示图示了因为对于当前迭代,初始动量Mi是0,处理结束。
在一些实施方式中,将为1的第一初始动量Mi应用于第一初始权重wi可能未改善预测模型。例如,特别参考示例表400b,预测模型包括其具有为12的第一初始权重wi的特定特征。对于其中特征具有为12的初始权重wi的情况,预测模型由模型评分器206进行评分。在处理的第一迭代(步骤1)中,为1的第一初始动量Mi被添加至为12的第一初始权重wi,以提供为13的测试权重wt。对于其中特征具有为13的测试权重wt的情况,预测模型由模型评分器206进行评分。在这种情况下,模型得分相对于初始模型得分未得到改善。即,使用经调整的预测模型确定的有效预测值和有效实际值之间的差值大于针对初始预测模型所计算的差值,使得模型得分大于初始模型得分。因为对于其中第一初始动量Mi是1的情况为13的测试权重wt未改善模型,为13的测试权重wt被丢弃,并且为12的初始权重wi被保持以用于在处理的下一迭代中使用,并且应用动量规则,以使初始动量Mi乘以为-1的动量因子以逆转调整权重的方向(例如,从正方向到负方向)。为-1的下一动量Mn被提供以应用于处理的下一迭代中的为12的初始权重wi
在处理的下一迭代(步骤2)中,为-1的初始动量Mi(例如,从步骤1提供的下一动量Mn)被添加至为12的初始权重wi(例如,从步骤1提供的测试权重wt),以提供为11的测试权重wt。对于其中特征具有为11的测试权重wt的情况,预测模型由模型评分器206进行评分。在这种情况下,模型得分相对于最佳模型得分得到改善(例如,模型得分小于初始模型得分)。因为为11的测试权重wt改善了预测模型,为11的测试权重wt被保持以用作针对处理的下一迭代的初始权重wi,并且为-1的初始动量Mi乘以为2的动量因子(例如,在这一示例中使用二分搜索,所以倍数被提供为2和1/2)以提供用于应用于下一迭代中的初始权重wi的为-2的下一动量Mn
在一些实施方式中,如果使第一初始动量Mi乘以为-1的动量因子未使模型得分改善最小阈值,则处理可以结束,并且用不同的第一初始权重wi重新开始。
跟随处理的第二迭代(步骤2)之后,处理的接下来的示例迭代(步骤3至步骤7)可以以与先前迭代(例如,递归地)相同的方式执行,以根据下一动量Mn调整特征的测试权重wt,直到初始动量Mi已经返回到-1,但是测试权重wt未改善预测模型。这发生在图4B的示例的步骤8中。例如,特别参考步骤8,为-1的初始动量Mi(例如,从步骤7提供的下一动量Mn)被添加至为7的初始权重wi(例如,从步骤7提供的初始权重wi),以提供为6的测试权重wt。对于其中特征具有为6的测试权重wt的情况,预测模型由模型评分器206进行评分。在这种情况下,模型得分相对于最佳模型得分(处理的第五迭代(步骤5)中计算的模型得分)未得到改善。即,模型得分仍然大于步骤5中计算的模型得分。因为在其中初始动量Mi已经返回到-1的情况下为6的测试权重wt未改善预测模型,丢弃为6的测试权重wt,为7的初始权重wi被保持以用作处理的下一迭代中的初始权重wi,并且应用动量规则,以将下一动量Mn设置为0以应用于处理的下一迭代中的初始权重wi
在处理的下一迭代(步骤9)中,处理结束,因为初始动量Mi(例如,从步骤8提供的下一动量Mn)是0。为7的初始权重wi被保持作为最终权重,以应用于预测模型中表示的特定特征。对应图形表示图示了因为初始动量Mi是0,处理结束。
在一些实施方式中,调整初始权重wi以生成测试权重wt,使用测试权重wt对预测模型进行评分,并且然后保持测试权重wt,如果模型得分改善,则提供修改的模拟退火方法以用于改善由模型生成器202生成的预测模型。在一些实施方式中,向初始动量Mi应用动量因子(例如,使初始动量Mi乘以或除以动量因子)以提供下一动量Mn提供了用于改善由模型生成器202生成的预测模型的搜索方法。据此,模型生成器202和模型评分器206可以执行表400a、400b中图示的处理,以产生由模型生成器202生成的预测模型300a、300b的最终版本。在一些示例中,相比于其它类型的模型生成技术,使用这样的动量搜索技术可以大幅降低生成预测模型所需要的资源(例如,计算能力)和/或时间(例如,从数周或数月到数小时)。
图5描绘其可以在本公开的实施方式中执行的示例处理500。示例处理500可以例如通过图1的示例环境100来实现。在一些示例中,示例处理500可以由使用一个或多个计算设备执行的一个或多个计算机可执行程序来提供。
在一些实施方式中,接收限定包括多个特征的数据模型的输入数据(502)。例如,模型生成器202可以从用户接收这样的输入以生成预测模型(例如,预测模型300a、预测模型300b)。预测模型可以表示存储在数据储存库208中的实际数据中表示的多个特征。在一些示例中,相应初始权重被提供用于预测模型的一个或多个特征。在一些实施方式中,接收实际数据(504)。例如,模型评分器206可以从数据储存库208接收实际数据。
在一些实施方式中,用于多个特征中的一个或多个特征的相应权重被迭代地确定以提供预测模型(506)。例如,基于由模型评分器206迭代地生成的模型得分,模型生成器202可以迭代地调整与预测模型中表示的特征对应的权重。在一些示例中,迭代地确定相应权重,使得对于每个特征,用于特征的当前权重被迭代地调整动量,直到动量等于零,其中动量基于模型得分是否改善而被迭代地调整倍数,并且其中使用实际数据来计算模型得分。在一些示例中,进一步迭代地确定相应权重,使得对于每个特征,当动量等于零时,当前权重被指派作为用于特征的最终权重。例如,通过将初始动量Mi添加至初始权重wi,模型生成器202可以迭代地调整用于相应特征的初始权重wi,直到由模型评分器206计算的最佳模型得分未得到改善。在一些示例中,模型生成器202可以实现动量规则,在其中初始动量Mi已经返回到为1或-1的值的情况下,一旦测试权重wt不再改善预测模型,动量规则设置等于0的下一动量Mn。在一些示例中,模型生成器202可以使初始动量Mi迭代地乘以或除以动量因子(例如,2)以获得下一动量Mn
在一些实施方式中,预测模型被存储到计算机可读存储器(508)。例如,一旦已经迭代地确定用于模型中表示的每个特征的最终化权重(例如,一旦已经确定预测模型的最终化版本),模型评分器206就可以向模型储存库210提供预测模型。
在一些实施方式中,通过选择(例如,在一些情况下,随机地选择)要调整特征权重的节点,基于树的模型300b可以根据由400a、400b的示例表图示的方法来进行处理。然后可以实现方法,以调整节点中包括的每个特征权重的权重。在一些示例中,可以针对数中的每个节点来实现方法。在一些实施方式中,对基于树的模型300b的处理可以包括添加节点、移除节点、向节点添加特征、从节点移除特征、改变节点的操作、以及改变节点的比较值中的一个或多个。如果这样的改变改善了模型(例如,基于用于调整特征权重的由400a、400b的示例表图示的方法),则保持改变,而如果改变未改善模型,则丢弃改变。
在一些实施方式中,仅给潜在地受预测模型调整影响的记录重新评分。例如,在做出对基于树的模型300b的节点的改变时,可以使用假设分析(what-if)评分对改变进行评分。在一些示例中,假设分析评分可以允许算法确定潜在改变的影响,而无须实际改变模型300b。在一些示例中,假设分析评分仅重新计算模型300b中已经实际改变的部分。在这样的情况下,中间值可以被高速缓存(例如,保存)。在一些实施方式中,假设分析评分仅重新计算针对改变影响的记录的得分。在一些示例中,这样的评分可以大幅改善性能。
在一些实施方式中,可以使用特征-记录映射给模型300b评分。例如,模型300b可以引用其均包括特定特征的记录的列表。在一些示例中,每当用于特定特征的权重改变,仅包括特定特征的记录需要重新评分。这样的评分可以改善性能(例如,在一些情况下,以100的因子),特别是在医疗应用中,其中许多诊断具有相对低的发生率。
在一些实施方式中,预测模型中包括的最终化权重的比较可以标识哪些特征(例如,医疗参数或其它患者特性)很可能贡献于实际数据中表示的目标参数(例如,计划外的住院)。在一些实施方式中,并且在上面描述的示例上下文内,一个或多个服务提供者(例如医疗从业者和保险提供者)可以使用如由预测模型预测的患者住院风险来确定如何制订或修改向患者提供的服务。在一些示例中,参考阈值风险,服务提供者可以使用预测模型来标识易受计划外住院的患者。例如,具有大于阈值风险的预测住院风险的患者可以被分类为高风险患者,而具有小于或等于阈值风险的预测住院风险的患者可以被分类为低风险患者。
在一些实施方式中,可以向一个或多个医疗记录***(例如,集成电子医疗记录(EMR)***)提供由预测模型计算的住院风险。在一些示例中,医疗从业者可以从一个或多个医疗记录***访问患者的住院风险,并且在针对患者生成预后或开发治疗计划中,将住院风险作为因素进行考虑。例如,基于高住院风险(例如,参考阈值风险),医疗从业者可以选择安装针对患者的一个或多个后续医疗预约。在一些实施方式中,高住院风险可以触发指示特定患者的风险的通知。在一些示例中,可以经由一个或多个医疗记录***向医疗从业者提供该通知。在一些示例中,指示高风险的通知可以直接提供给患者(例如,经由电子邮件、文本消息或语音消息)。
可以在数字电子电路中,或者在计算机软件、固件或硬件,包括在本说明书中公开的结构和它们的结构等价形式中,或者在它们中的一个或多个的组合中来实现本说明书中描述的实施方式和所有功能操作。实施方式可以被实现为在计算机可读介质上编码的一个或多个计算机程序产品,即计算机程序指令的一个或多个模块,以用于由数据处理装置执行或者控制数据处理装置的操作。计算机可读介质可以是机器可读存储设备、机器可读存储基板、存储器设备、实现机器可读传播信号的物质的组合物、或者它们中的一个或多个的组合。术语“计算***”包含用于处理数据的所有装置、设备和机器,通过示例的方式包括可编程处理器、计算机、或者多个处理器或计算机。除了硬件,装置可以包括其创建用于考虑中的计算机程序的执行环境的代码,例如其构成处理器固件、协议栈、数据库管理***、操作***、或者它们中的一个或多个的组合的代码。传播信号是人工生成的信号,例如机器生成的电、光或电磁信号,其被生成为编码信息以传输到适合的接收器装置。
可以以任何适当形式的编程语言(包括编译性或解释性语言)来编写计算机程序(还称为程序、软件、软件应用、脚本或代码),并且计算机程序可以以任何适当形式来部署,包括作为独立的程序或作为模块、部件、子例程、或其他适合用于在计算环境中使用的单元。计算机程序不必要对应于文件***中的文件。程序可以被存储在保持其他程序或数据的文件的一部分中(例如,在标记语言文档中存储的一个或多个脚本)、存储在专用于考虑中的程序的单个文件中、或者存储在多个协调文件(例如,存储一个或多个模块、子程序或代码的部分的文件)中。计算机程序可以被部署为执行在一台计算机上或者执行在位于一个站点处或跨多个站点分布的并且通过通信网络互连的多台计算机上。
通过执行一个或多个计算机程序以通过对输入数据进行操作和生成输出来执行功能的一个或多个可编程处理器,可以执行本说明书中描述的处理和逻辑流程。处理和逻辑流程还可以通过专用逻辑电路(例如FPGA(现场可编程门阵列)或ASIC(专用集成电路))来执行并且装置也可以被实现为专用逻辑电路。
适合于执行计算机程序的处理器包括(通过示例的方式)通用和专用微处理器两者、以及任何适当种类的数字计算机的任何一个或多个处理器。通常,处理器将接收来自只读存储器或随机存取存储器或两者的指令和数据。计算机的元件可以包括用于执行指令的处理器以及用于存储指令和数据的一个或多个存储器设备。通常,计算机还将包括或者***作性地耦合以接收来自用于存储数据的一个或多个大容量存储设备(例如,磁盘、磁光盘或光盘)的数据或者向用于存储数据的一个或多个大容量存储设备传输数据或者两者。然而,计算机不需要具有这种设备。此外,计算机可以嵌入在另一设备中,例如移动电话、个人数字助理(PDA)、移动音频播放器、全球定位***(GPS)接收器(仅举几例)。适合用于存储计算机程序指令和数据的计算机可读介质包括所有形式的非易失性存储器、介质和存储器设备,包括(通过示例的方式)半导体存储器设备(例如EPROM、EEPROM和闪存设备);磁盘(例如,内部硬盘或可移除盘);磁光盘;以及CD ROM和DVD-ROM盘。处理器和存储器可以通过专用逻辑电路来补充或并入在专用逻辑电路中。
为了提供与用户的交互,实施方式可以实现在具有用于向用户显示信息的显示设备(例如CRT(阴极射线管)或LCD(液晶显示器)监控器))以及用户可以通过其向计算机提供输入的键盘和指向设备(例如,鼠标或轨迹球)的计算机上。其他种类的设备也可以被用来提供与用户的交互;例如,向用户提供的反馈可以是任何适当形式的感觉反馈,例如视觉反馈、听觉反馈或触觉反馈;并且来自用户的输入可以以任何适当形式被接收,包括声学、语音或触觉输入。
实施方式可以实现在计算***中,该计算***包括例如作为数据服务器的后端部件,或者包括例如应用服务器的中间件部件,或者包括例如客户端计算机的前端部件,该客户端计算机具有图形用户界面或Web浏览器,用户可以通过图形用户界面或Web浏览器与实施方式来交互,或者一个或多个这种后端、中间件或前端部件的任何适当组合。可以通过数字数据通信的任何适当形式或介质(例如通信网络)来互连***的部件。通信网络的示例包括局域网(“LAN”)和广域网(“WAN”),例如因特网。
计算***可以包括客户端和服务器。客户端和服务器通常相互远离并且通常通过通信网络交互。客户端和服务器的关系借助在相应计算机上运行并相互具有客户端-服务器关系的计算机程序而出现。
图6描绘其可以执行本公开的实施方式的示例计算***600。根据一个实施方式,***600可以用于与先前描述的计算机实现的方法中的任何方法相关联地描述的操作。***600包括处理器610、存储器620、存储设备630和输入/输出设备640。部件610、620、630和640中的每一个都使用***总线650互连。处理器610能够处理用于在***600内执行的指令。在一个实施方式中,处理器610是单线程处理器。在另一实施方式中,处理器610是多线程处理器。处理器610能够处理存储在存储器620中或者存储设备630上的指令,以显示用于输入/输出设备640上的用户界面的图形信息。
存储器620存储***600内的信息。在一个实施方式中,存储器620是计算机可读介质。在一个实施方式中,存储器620是易失性存储器单元。在另一实施方式中,存储器620是非易失性存储器单元。
存储设备630能够为***600提供大容量存储。在一个实施方式中,存储设备630是计算机可读介质。在各种不同的实施方式中,存储设备630可以是软盘设备、硬盘设备、光盘设备或磁带设备。
输入/输出设备640为***600提供输入/输出操作。在一个实施方式中,输入/输出设备640包括键盘和/或指向设备。在另一实施方式中,输入/输出设备640包括用于显示图形用户界面的显示单元。
虽然本说明书包含了许多细节,但这些不应被视为对公开内容或可能要求保护的范围的限制,而更确切地作为特定于具体实施方式的特征的描述。还可以在单个实施方式中组合地实现在分离实施方式的上下文中在本说明书中描述的某些特征。相反,在单个实施方式的上下文中描述的各个特征还可以分离地或者以任何适当的子组合在多个实施方式中实现。此外。尽管上面可以将特征描述为在某些组合下作用并且甚至如此初始地要求保护,但是来自所要求保护的组合的一个或多个特征在一些情况下可以从该组合中脱离,并且所要求保护的组合可以被导向子组合或子组合的变型。
类似地,虽然以特定的顺序在附图中描绘了操作,但这不应被理解为要求以所示特定顺序或以连续的顺序执行这些操作,或者所有图示的操作都被执行以实现期望的结果。在某些环境下,多任务和并行处理可以是有利的。此外,上述实施方式中的各个***部件的分离不应被理解为在所有实施方式中都要求这种分离,并且应该理解,所描述的程序部件和***通常可以在单个软件产品中被集成到一起或者被封装成多个软件产品。
已经描述了若干实施方式。尽管如此,应当理解在不脱离本公开的精神和范围的情况下可以做出各种修改。例如,上面所示的各种形式的流程可以在步骤重新排序、添加或移除的情况下使用。据此,其它实施方式也在所附权利要求的范围内。

Claims (15)

1.一种用于预测与患者相关联的住院风险的方法,所述方法由一个或多个处理器执行,并且包括:
由所述一个或多个处理器,接收限定基于树的模型(300b)的输入数据,其中所述基于树的模型(300b):
包括根节点、中间节点和终端节点,其中所述根节点对应于住院风险值,并且所述中间节点和所述终端节点对应于多个特征,所述多个特征包括生物学参数、医疗条件、患者特性、或医疗史参数,以及其中每个节点:
与一个乘数相关联;
考虑到了所述多个特征中分别与多个权重相关联的多个特征的值,
考虑到了与所述节点直接或间接相关联的任何子节点,以及
其中所述基于树的模型从终端节点到所述根节点被遍历,以通过将每个节点的结果与其相关联的乘数相乘来计算预测的住院风险值;
由所述一个或多个处理器,使用住院数据针对所述多个特征中的每个特征迭代地加权所述基于树的模型(300b),针对先前住院的人群中的多个患者中的每个患者,所述住院数据包括:
住院风险值,以及
所述多个特征中的每个特征的值,
针对所述多个特征中的每个特征,所述加权包括:
通过向当前权重(404a,404b)添加动量(406a,406b)来迭代地调整与所述特征相对应的所述当前权重(404a,404b),所述动量基于模型得分是否改善而被迭代地乘以或除以动量因子并且直到所述动量等于零为止,所述模型得分基于所述住院数据被计算,其中所述模型得分包括使用所述基于树的模型被确定的预测值与根据所述住院数据被确定的值之间的差,并且在当前迭代的所述差与对应于先前计算的最佳模型得分的差相比减小时,所述模型得分改善;以及
由所述一个或多个处理器,使用加权的所述基于树的模型(300b)来计算所述患者的住院风险得分。
2.根据权利要求1所述的方法,其中基于模型得分是否改善而将所述动量迭代地乘以动量因子包括执行二分搜索。
3.根据权利要求1所述的方法,其中通过向当前权重(404a,404b)添加动量来迭代地调整与所述特征相对应的所述当前权重包括:在当前迭代中,使用针对所述多个特征中的每个特征的先前所确定的权重作为针对所述多个特征中的每个特征的初始权重。
4.根据权利要求1所述的方法,其中所述基于树的模型(300b)还包括向所述多个特征中的一个或多个特征指派的相应初始权重,其中所述相应初始权重中的一个或多个相应初始权重等于1,或者所述相应初始权重中的一个或多个相应初始权重等于0。
5.根据权利要求1所述的方法,其中所述多个特征表示医疗参数和人口统计参数中的一个或多个,其中所述医疗参数包括DSM代码、ICD-9代码、ICD-10代码、SNOMED代码、LOINC代码、RxNORM代码、CPT代码以及非编码参数中的一个或多个。
6.根据权利要求1所述的方法,进一步包括基于所述输入数据生成所述基于树的模型(300b)。
7.根据权利要求1所述的方法,其中所述模型得分与先前计算的最佳模型得分进行比较。
8.根据权利要求1所述的方法,其中在正方向上调整所述当前权重。
9.根据权利要求1所述的方法,其中对于为1的初始动量,如果所述模型得分未以阈值得到改善,则应用动量规则以将所述动量设置为-1,其中所述当前权重在负方向上被调整。
10.根据权利要求1所述的方法,其中用于所述特征的所述当前权重以所述动量进行调整,直到已经达到用于调整所述当前权重的最大迭代数目。
11.根据权利要求1所述的方法,其中对于其中所述模型得分不再改善的情况,一旦所述动量返回到为1或-1的值,就应用动量规则以将所述动量设置为0。
12.根据权利要求1所述的方法,其中用于确定所述权重的迭代被限于对于所述多个特征中的每个特征的最大迭代数目。
13.根据权利要求1所述的方法,其中所述住院风险得分被提供给医疗记录***,或者由服务提供者用于制订针对所述患者的一个或多个服务,其中医疗从业者使用所述住院风险得分生成针对所述患者的预后和治疗计划中的一个或多个,或者付款人使用所述住院风险得分分配治疗设施内的医疗资源。
14.一种非瞬态计算机可读存储介质,其耦合到一个或多个处理器并且具有存储在其上的指令,所述指令当由所述一个或多个处理器执行时使得所述一个或多个处理器执行用于确定患者的计划外住院风险的操作,所述操作包括权利要求1至13中任一项所述的方法。
15.一种用于预测与患者相关联的住院风险的***,包括:
一个或多个处理器;以及
计算机可读存储设备,其耦合到所述一个或多个处理器并且具有存储在其上的指令,所述指令当由所述一个或多个处理器执行时使得所述一个或多个处理器执行用于确定患者的计划外住院风险的操作,所述操作包括权利要求1至13中任一项所述的方法。
CN201510516201.1A 2014-08-20 2015-08-20 用于预测与患者相关联的住院风险的方法、***和介质 Active CN105389454B (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US14/464,330 2014-08-20
US14/464,330 US20160055412A1 (en) 2014-08-20 2014-08-20 Predictive Model Generator

Publications (2)

Publication Number Publication Date
CN105389454A CN105389454A (zh) 2016-03-09
CN105389454B true CN105389454B (zh) 2020-06-23

Family

ID=54035129

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510516201.1A Active CN105389454B (zh) 2014-08-20 2015-08-20 用于预测与患者相关联的住院风险的方法、***和介质

Country Status (5)

Country Link
US (1) US20160055412A1 (zh)
EP (1) EP2988236B1 (zh)
CN (1) CN105389454B (zh)
AU (1) AU2015215881B2 (zh)
CA (1) CA2901073C (zh)

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20160162647A1 (en) * 2014-12-05 2016-06-09 analyticsMD, Inc. System for Processing Medical Operational Performance Information and Root Causes Thereof
US20180146919A1 (en) * 2015-06-16 2018-05-31 Quantum Dental Technologies Inc. System and method of monitoring consumable use based on correlations with diagnostic testing
US10565657B2 (en) * 2015-10-02 2020-02-18 Engie Storage Services Na Llc Methods and apparatuses for risk assessment and insuring intermittent electrical systems
EP3371723A1 (en) * 2015-11-03 2018-09-12 Koninklijke Philips N.V. Prediction of acute respiratory disease syndrome (ards) based on patients' physiological responses
US10999652B2 (en) 2017-05-24 2021-05-04 Engie Storage Services Na Llc Energy-based curtailment systems and methods
US10658841B2 (en) 2017-07-14 2020-05-19 Engie Storage Services Na Llc Clustered power generator architecture
EP3435379A1 (en) * 2017-07-27 2019-01-30 Roche Diagnostics GmbH Augmenting measurement values of biological samples
US10902065B1 (en) * 2018-05-04 2021-01-26 Massachusetts Mutual Life Insurance Company Systems and methods for computational risk scoring based upon machine learning
CN109036579B (zh) * 2018-08-22 2021-11-26 泰康保险集团股份有限公司 基于区块链的信息预测方法、装置、介质及电子设备
CN112383625B (zh) * 2020-11-16 2023-06-20 每日互动股份有限公司 区域人口数量的预测方法、装置、计算机设备及存储介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5398302A (en) * 1990-02-07 1995-03-14 Thrift; Philip Method and apparatus for adaptive learning in neural networks
US6269351B1 (en) * 1999-03-31 2001-07-31 Dryken Technologies, Inc. Method and system for training an artificial neural network
CN103635908A (zh) * 2011-06-24 2014-03-12 皇家飞利浦有限公司 离开就绪性指标

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8949082B2 (en) * 2001-11-02 2015-02-03 Siemens Medical Solutions Usa, Inc. Healthcare information technology system for predicting or preventing readmissions
US20040242972A1 (en) * 2003-05-28 2004-12-02 General Electric Company Method, system and computer product for prognosis of a medical disorder
US7480640B1 (en) * 2003-12-16 2009-01-20 Quantum Leap Research, Inc. Automated method and system for generating models from data
US7499897B2 (en) * 2004-04-16 2009-03-03 Fortelligent, Inc. Predictive model variable management
CA2587715A1 (en) * 2004-11-16 2006-05-26 David E. Wennberg Systems and methods for predicting healthcare related risk events and financial risk
US20080275729A1 (en) * 2007-04-09 2008-11-06 Nina Mithi Taggart System and method for population health management
US8751257B2 (en) * 2010-06-17 2014-06-10 Cerner Innovation, Inc. Readmission risk assessment
US8533222B2 (en) * 2011-01-26 2013-09-10 Google Inc. Updateable predictive analytical modeling
US20120271612A1 (en) * 2011-04-20 2012-10-25 Barsoum Wael K Predictive modeling
US8909564B1 (en) * 2011-06-21 2014-12-09 Google Inc. Predictive model evaluation and training based on utility
US8489632B1 (en) * 2011-06-28 2013-07-16 Google Inc. Predictive model training management
US9536052B2 (en) * 2011-10-28 2017-01-03 Parkland Center For Clinical Innovation Clinical predictive and monitoring system and method
JP2016519807A (ja) * 2013-03-15 2016-07-07 ザ クリーブランド クリニック ファウンデーションThe Cleveland ClinicFoundation 自己進化型予測モデル

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5398302A (en) * 1990-02-07 1995-03-14 Thrift; Philip Method and apparatus for adaptive learning in neural networks
US6269351B1 (en) * 1999-03-31 2001-07-31 Dryken Technologies, Inc. Method and system for training an artificial neural network
CN103635908A (zh) * 2011-06-24 2014-03-12 皇家飞利浦有限公司 离开就绪性指标

Also Published As

Publication number Publication date
CA2901073A1 (en) 2016-02-20
US20160055412A1 (en) 2016-02-25
AU2015215881B2 (en) 2017-03-09
EP2988236A1 (en) 2016-02-24
AU2015215881A1 (en) 2016-03-10
CA2901073C (en) 2023-06-13
EP2988236B1 (en) 2019-06-05
CN105389454A (zh) 2016-03-09

Similar Documents

Publication Publication Date Title
CN105389454B (zh) 用于预测与患者相关联的住院风险的方法、***和介质
Xu et al. Regularized outcome weighted subgroup identification for differential treatment effects
Antonelli et al. Doubly robust matching estimators for high dimensional confounding adjustment
US11694109B2 (en) Data processing apparatus for accessing shared memory in processing structured data for modifying a parameter vector data structure
US20180268320A1 (en) Machine learning models in location based episode prediction
US20120271612A1 (en) Predictive modeling
US20170103164A1 (en) System and method for dynamic autonomous transactional identity management
US11222731B2 (en) Balancing provenance and accuracy tradeoffs in data modeling
US20180285969A1 (en) Predictive model training and selection for consumer evaluation
US20200151627A1 (en) Adherence monitoring through machine learning and computing model application
Neelon et al. Bayesian two-part spatial models for semicontinuous data with application to emergency department expenditures
US11195601B2 (en) Constructing prediction targets from a clinically-defined hierarchy
US20210133605A1 (en) Method, apparatus, and computer program products for hierarchical model feature analysis and decision support
US11748820B1 (en) Computer network architecture with automated claims completion, machine learning and artificial intelligence
Hilbert et al. Using decision trees to manage hospital readmission risk for acute myocardial infarction, heart failure, and pneumonia
Pimentel et al. Optimal matching approaches in health policy evaluations under rolling enrolment
Brzan et al. Contribution of temporal data to predictive performance in 30-day readmission of morbidly obese patients
Talukdar et al. Artificial intelligence in healthcare
Chen et al. Generalized partially linear models for incomplete longitudinal data in the presence of population-level information
CN109564782B (zh) 基于医院人口统计的电子临床决策支持设备
Jochmann What belongs where? Variable selection for zero-inflated count models with an application to the demand for health care
US20150170068A1 (en) Determining analysis recommendations based on data analysis context
Cheng et al. Doubly robust estimation and sensitivity analysis for marginal structural quantile models
CN115563399A (zh) 利用协同过滤、强化学习和消极反馈的包容性集合来生成数字推荐
Hu et al. Marginal regression analysis of recurrent events with coarsened censoring times

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant