WO2021151355A1

WO2021151355A1 - 基于强化学习模型的疾病排序方法、装置、设备及介质

Info

Publication number: WO2021151355A1
Application number: PCT/CN2020/135340
Authority: WO
Inventors: 唐蕊
Original assignee: 平安科技（深圳）有限公司
Priority date: 2020-09-07
Filing date: 2020-12-10
Publication date: 2021-08-05
Also published as: CN112017788A; CN112017788B

Abstract

一种基于强化学习模型的疾病排序方法、装置、设备及介质，所述方法包括：获取病人的病情数据，并将病人的病情数据输入辅助诊断模型（S10）；获取辅助诊断模型输出的疾病排序结果（S20）；根据预设权重模型确定多个疑似疾病在病人所属地区的权重（S30）；根据多个疑似疾病在病人所属地区的权重对疑似疾病排序结果进行更新，以获得更新后的疾病排序结果（S40）；根据更新后的疾病排序结果确定病人的疑似疾病排序结果并进行输出（S50）。所述方法在已有的辅助诊断模型的基础上，考虑了不同地区的实际疾病情况，使得最终获得的疑似疾病排序结果更加优化，从而提高了疑似疾病输出结果准确性。

Description

基于强化学习模型的疾病排序方法、装置、设备及介质

本申请要求于2020年09月07日提交中国专利局、申请号为202010929683.4，发明名称“基于强化学习模型的疾病排序方法、装置、设备及介质”的中国发明专利申请的优先权，其全部内容通过引用结合在本申请中。

技术领域

本申请涉及人工智能技术领域，尤其涉及一种基于强化学习模型的疾病排序方法、装置、设备及介质。

背景技术

随着人工智能技术的快速发展，在临床决策支持***中的辅助诊断技术通常通过机器学习或深度学习方法建立辅助诊断模型来实现。即，将病人的病情信息输入辅助诊断模型，辅助诊断模型输出针对病人的疑似疾病列表，医生通过参考辅助诊断模型给出的疑似疾病列表，可对病人的病情进行参考性诊断，从而实现辅助诊断模型对医生诊断的辅助。

一般来说，已有的辅助诊断模型会支持多个疾病，多个疾病在模型中的性能基本稳定，根据多种疾病在模型中的性能确定了多个疾病种类为优势病种，即在已有的辅助诊断模型中，优势病种及其对应的疾病性能是不变的，以使得各地区医生在使用辅助诊断模型时具有统一的判断标准。

技术问题

但是，发明人发现，不同地区中的病人对不同疾病的获得概率不同，即在不同的地区中的优势病种(在当地出现频率较高的多个疾病种类)不同，而现有的辅助诊断模型中，各个疾病在辅助诊断模型中的性能是统一确定的，未考虑不同地区的优势病种需求，辅助诊断模型的诊断性能不够优化，导致获得的疾病输出结果与当地实际的疾病诊断情况不同，准确性降低。

技术解决方案

本申请提供一种基于强化学习模型的疾病排序方法、装置、设备及介质，以解决现有技术中，辅助诊断模型未考虑不同地区的疾病情况，导致疾病输出结果准确性较低的问题。

一种基于强化学习模型的疾病排序方法，包括：

获取病人的病情数据，并将所述病人的病情数据输入辅助诊断模型；

获取所述辅助诊断模型输出的疾病排序结果，所述疾病排序结果为根据所述病人获得各疾病的概率大小对多个疑似疾病进行排序的结果；

根据预设权重模型确定所述多个疑似疾病在所述病人所属地区的权重，所述预设权重模型为根据所述病人所属地区的疾病诊断数据进行疾病权重学习获得的强化学习模型；

根据所述多个疑似疾病在所述病人所属地区的权重对所述疑似疾病排序结果进行更新，以获得更新后的疾病排序结果；

根据所述更新后的疾病排序结果确定所述病人的疑似疾病排序结果，并进行输出。

一种基于强化学习模型的疾病排序装置，包括：

第一获取模块，用于获取病人的病情数据，并将所述病人的病情数据输入辅助诊断模型；

第二获取模块，用于获取所述辅助诊断模型输出的疾病排序结果，所述疾病排序结果为根据所述病人获得各疾病的概率大小对多个疑似疾病进行排序的结果；

第一确定模块，用于根据预设权重模型确定所述多个疑似疾病在所述病人所属地区的权重，所述预设权重模型为根据所述病人所属地区的疾病诊断数据进行疾病权重学习获得的强化学习模型；

更新模块，用于根据所述多个疑似疾病在所述病人所属地区的权重对所述疑似疾病排序结果进行更新，以获得更新后的疾病排序结果；

第二确定模块，用于根据所述更新后的疾病排序结果确定所述病人的疑似疾病排序结果，并进行输出。

一种计算机设备，包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机可读指令，所述处理器执行所述计算机可读指令时实现如下步骤：

一个或多个存储有计算机可读指令的可读存储介质，所述计算机可读指令被一个或多个处理器执行时，使得所述一个或多个处理器执行如下步骤：

有益效果

本申请中，通过训练获得基于各地区的疾病诊断数据的预设权重模型，然后根据预设权重模型确定各疑似疾病在病人所属地区的权重，进而根据各疑似疾病的权重对疾病排序结果进行重新排序，在已有的辅助诊断模型的基础上，考虑了不同地区的实际疾病情况，使得最终获得的疑似疾病排序结果更加优化，从而提高了疑似疾病输出结果准确性。

本申请的一个或多个实施例的细节在下面的附图和描述中提出，本申请的其他特征和优点将从说明书、附图以及权利要求变得明显。

附图说明

为了更清楚地说明本申请实施例的技术方案，下面将对本申请实施例的描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本申请的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动性的前提下，还可以根据这些附图获得其他的附图。

图1是本申请一实施例中基于强化学习模型的疾病排序方法的一应用环境示意图；

图2是本申请一实施例中基于强化学习模型的疾病排序方法的一流程示意图；

图3是本申请图2中步骤S30的一实现流程示意图；

图4是本申请图2中步骤S40的一实现流程示意图；

图5是本申请图2中步骤S50的一实现流程示意图；

图6是本申请一实施例中预设权重模型的一获取流程示意图；

图7是本申请图6中步骤S04的一实现流程示意图；

图8是本申请一实施例中基于强化学习模型的疾病排序装置的一结构示意图；

图9是本申请一实施例中计算机设备的一结构示意图。

具体实施方式

下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本申请一部分实施例，而不是全部的实施例。基于本申请中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本申请保护的范围。

本申请实施例提供的基于强化学习模型的疾病排序方法，可应用在如图1的应用环境中，其中，终端设备通过网络与服务器进行通信。服务器通过获取终端设备中病人的病情数据，并将病人的病情数据输入辅助诊断模型，再获取辅助诊断模型输出的疾病排序结果，疾病排序结果为根据病人获得各疾病的概率大小对多个疑似疾病进行排序的结果，然后根据预设权重模型确定多个疑似疾病在病人所属地区的权重，预设权重模型为根据病人所属地区的疾病诊断数据进行疾病权重学习获得的强化学习模型，进而根据多个疑似疾病在病人所属地区的权重对疑似疾病排序结果进行更新，以获得更新后的疾病排序结果，最后根据更新后的疾病排序结果确定病人的疑似疾病排序结果，并输出至终端设备，从而提高了疑似疾病输出结果准确性。

其中，终端设备可以但不限于各种个人计算机、笔记本电脑、智能手机、平板电脑和便携式可穿戴设备。服务器可以用独立的服务器或者是多个服务器组成的服务器集群来实现。

在本实施例中，辅助诊断模型、预设权重模型以及模型输入和输出的相关数据均保存在区块链网络中。区块链是分布式数据存储、点对点传输、共识机制、加密算法等计算机技术的新型应用模式。区块链(Blockchain)，本质上是一个去中心化的数据库，是一串使用密码学方法相关联产生的数据块，每一个数据块中包含了一批次网络交易的信息，用于验证其信息的有效性(防伪)和生成下一个区块。区块链可以包括区块链底层平台、平台产品服务层以及应用服务层。本实施例中将辅助诊断模型、预设权重模型即相关数据保存在区块链网络，便于对辅助诊断模型、预设权重模型和相关数据进行快速查询、处理，提高处理速度。

在一实施例中，如图2所示，提供一种基于强化学习模型的疾病排序方法，以该方法应用在图1中的服务器为例进行说明，包括如下步骤：

S10：获取病人的病情数据，并将病人的病情数据输入辅助诊断模型。

获取病人的病情数据，并将病人的病情数据输入辅助诊断模型。其中，病情数据为病人的病历数据，包括病人的基本信息、病人自述的病情信息和检查数据。其中，基本信息包括病人的年龄、所属地区、性别等常规数据，检查数据包括影像数据、图像数据等。

S20：获取辅助诊断模型输出的疾病排序结果，疾病排序结果为根据病人获得疾病概率的大小对多个疑似疾病进行排序的结果。

在传统方法中，在将病人的病情数据输入辅助诊断模型之后，辅助诊断模型会输出针对病人的疾病排序结果，即输出根据病人获得疾病概率的大小对多个疑似疾病进行排序的结果，以便医生根据辅助诊断模型输出的疾病排序结果辅助诊断，最终确定病人获得的疾病。而在本实施例中，在辅助诊断模型输出的疾病排序结果之后，需要获取辅助诊断模型输出的疾病排序结果，以根据多个疑似疾病在病人所属地区的权重对疾病排序结果进行优化，进而提高病人疾病输出结果的准确性，从而提高对医生的辅助作用。

S30：根据预设权重模型确定多个疑似疾病在病人所属地区的权重，预设权重模型为根据病人所属地区的疾病诊断数据进行疾病权重学习获得的强化学习模型。

在获取辅助诊断模型输出的疾病排序结果之后，根据预设权重模型确定多个疑似疾病在病人所属地区的权重，其中，预设权重模型为根据病人所属地区的疾病诊断数据进行疾病权重学习获得的强化学习模型。病人所属地区可以是病人的长居地区，也可以病人的户籍地区，还可以是病人的就诊地区。

S40：根据多个疑似疾病在病人所属地区的权重对疑似疾病排序结果进行更新，以获得更新后的疾病排序结果。

在根据预设权重模型确定多个疑似疾病在病人所属地区的权重之后，根据多个疑似疾病在病人所属地区的权重对疑似疾病排序结果进行更新，根据更新后的获得疾病概率的大小对多个疑似疾病进行重新排序，以获得更新后的疾病排序结果，使得更新后的疾病排序结果具有更高的准确性。

S50：根据更新后的疾病排序结果确定病人的疑似疾病排序结果，并进行输出。

在获得更新后的疾病排序结果之后，根据更新后的疾病排序结果确定病人的疑似疾病排序结果，并将病人的疑似疾病排序结果输出，以便医生在准确性更高的疑似疾病排序结果的辅助下对病人的疾病进行诊断。

在本实施例中，通过将病人的病情数据输入辅助诊断模型，获得辅助诊断模型的输出的疾病排序结果，在此基础上，根据预设权重模型确定多个疑似疾病在病人所属地区的权重，并根据多个疑似疾病的权重对疾病排序结果进行优化更新，可自动获得更加优化、贴近各地区实际疾病情况的疑似疾病排序结果，实现了人工智能+疾病识别的自动化处理过程，无需人工参与即可获得较优的疑似疾病排序结果，便于医生后续进行诊断时作为参考，从而提高了疾病诊断的准确性。本方案可应用于智慧医疗领域中，从而推动智慧城市的建设。

上述基于强化学习模型的疾病排序方法中，通过获取病人的病情数据，并将病人的病情数据输入辅助诊断模型，再获取辅助诊断模型输出的疾病排序结果，然后根据预设权重模型确定多个疑似疾病在病人所属地区的权重，进而根据多个疑似疾病在病人所属地区的权重对疑似疾病排序结果进行更新，以获得更新后的疾病排序结果，最后根据更新后的疾病排序结果确定病人的疑似疾病排序结果；通过训练获得基于各地区的疾病诊断数据的预设权重模型，然后根据预设权重模型确定各疑似疾病在病人所属地区的权重，进而根据各疑似疾病的权重对疾病排序结果进行重新排序，在已有的辅助诊断模型的基础上，考虑了不同地区的实际疾病情况，使得最终获得的疑似疾病排序结果更加优化，从而提高了疑似疾病输出结果准确性。

在一实施例中，如图3所示，步骤S30中，即根据预设权重模型确定多个疑似疾病在病人所属地区的权重，具体包括如下步骤：

S31：将病人所属地区的预设权重模型输出的状态作为病人所属地区中多个优势病种的权重。

在获取辅助诊断模型输出的疾病排序结果之后，需要获取训练好的病人所属地区的预设权重模型，并将病人所属地区的预设权重模型输出的状态作为病人所属地区中多个优势病种的权重，以根据病人所属地区中多个优势病种的权重对辅助诊断模型的疾病排序结果进行更新。

S32：确定多个疑似疾病中各疑似疾病的疾病种类。

在确定病人所属地区中多个优势病种的权重之后，根据多个疑似疾病的疾病相似性将多个疾病划分为不同疾病种类，即确定多个疑似疾病中各疑似疾病的疾病种类。将疾病按照相似性分类是为了在后续根据疑似疾病的权重更新疑似疾病的排序结果时，减少对其他相似疾病种类的疾病的性能的影响。

例如，多个疑似疾病包括疾病A、疾病B、疾病C和疾病D四种疾病，其中，疾病B与疾病D为不同的疾病种类，疾病A和疾病C为同一疾病种类，且与疾病B和疾病D的疾病种类不同，则辅助诊断模型输出的疾病排序结果中包括三个疾病种类。

本实施例中，多个疑似疾病和疾病种类确定过程仅为示例性说明，在其他实施例中，还可以通过其他方式确定多个疑似疾病的疾病种类，在此不再赘述。

S33：确定各疑似疾病的疾病种类是否为病人所属地区的多个优势病种。

在确定各疑似疾病的疾病种类之后，确定各疑似疾病的疾病种类是否为病人所属地区的多个优势病种，以根据确定结果确定各疾病的权重。

S34：若疑似疾病的疾病种类为病人所属地区的多个优势病种，则将优势病种的权重作为对应疑似疾病的权重，以获得多个疑似疾病的权重。

在确定各疑似疾病的疾病种类是否为病人所属地区的多个优势病种之后，若疑似疾病的疾病种类为病人所属地区的多个优势病种，则将优势病种的权重作为对应疑似疾病的权重，以获得多个疑似疾病的权重。

在确定各疑似疾病的疾病种类是否为病人所属地区的多个优势病种之后，若疑似疾病的疾病种类为病人所属地区的多个优势病种，则疾病种类的权重则为匹配的优势病种的权重，对应的，疾病种类对应的疑似疾病的权重也为该优势病种的权重，从而获得多个疾病的权重。由于不同疑似疾病之间存在相似性，通过将多个疑似疾病进行疾病种类划分，对疑似疾病按照疾病种类设置权重，减少了相似疑似疾病之间对彼此的影响。即对相似的疾病统一进行考虑，而不是对单个疾病进行考虑，保证相似的疾病的权重都同同时更新，从而减少了对某一疾病进行优化导致对其他疾病的影响。

例如，多个疑似疾病包括疾病A、疾病B、疾病C和疾病D四种疾病，疾病A和疾病C的疾病种类为病种1，疾病B的疾病种类为病种2，疾病D为疾病种类为病种3，若病种1为病人所属地区的优势病种，则将优势病种的权重为病种1的权重，疾病A和疾病C的权重为病种1的权重；若病种2为病人所属地区的优势病种，则将优势病种的权重为病种1的权重，疾病B的权重为病种1的权重。

本实施例中，病种1为病人所属地区的优势病种或者病种2为病人所属地区的优势病种仅为示例性说明，在其他实施例中，病种3也可以为优势病种。

在确定各疑似疾病的疾病种类是否为病人所属地区的多个优势病种之后，若疑似疾病的疾病种类不为病人所属地区的多个优势病种，则不对疑似疾病的获得概率进行更新。

本实施例中，通过将所属地区的预设权重模型输出的状态作为所属地区中多个优势病种的权重，再确定多个疑似疾病中各疑似疾病的疾病种类，进而确定各疑似疾病的疾病种类是否为病人所属地区的多个优势病种，若疑似疾病的疾病种类为病人所属地区的多个优势病种，则将优势病种的权重作为对应疑似疾病的权重，以获得多个疑似疾病的权重，细化了根据预设权重模型确定多个疑似疾病在病人所属地区的权重的过程，还通过对疾病按照类别进行考虑，将疾病类别的权重作为各相应疾病的权重，减少了对相似疑似疾病的影响，从而使得权重准确性更高，进而使得后续更新的疾病排序结果具有更高的准确性。

在一实施例中，如图4所示，步骤S40中，即根据多个疑似疾病在病人所属地区的权重对疑似疾病排序结果进行更新，具体包括如下步骤：

S41：根据疑似疾病排序结果确定各疑似疾病的获得概率。

在根据预设权重模型确定多个疑似疾病在病人所属地区的权重之后，根据疑似疾病排序结果确定各疑似疾病的获得概率。即疑似疾病排序结果包括多个疑似疾病和各疑似疾病的获得概率，在疑似疾病排序结果中提取出各疑似疾病的获得概率。

S42：确定疑似疾病在病人所属地区的权重与疑似疾病的获得概率之间的乘积，以作为疑似疾病的最终获得概率。

在根据疑似疾病排序结果确定各疑似疾病的获得概率之后，确定疑似疾病在病人所属地区的权重与疑似疾病的获得概率之间的乘积，以作为疑似疾病的最终获得概率。

例如，表1中的第一列为辅助诊断模型输出的疑似疾病和各疑似疾病的获得概率，第三列和第四列为疑似疾病的疾病种类和疑似疾病的权重，第五列为疑似疾病更新后的获得概率，即疑似疾病的最终获得概率。

表1

从表1可知，根据疑似疾病的权重对辅助诊断模型输出的各疑似疾病获得概率之后，部分疑似疾病的获得概率发生了变化，获得概率最高的疑似疾病从疾病3变为了疾病2，使得更新后的结果更贴近病人所属地区的实际情况。

S43：根据各疑似疾病的最终获得概率对多个疑似疾病的排序进行更新。

在确定疑似疾病的最终获得概率之后，根据各疑似疾病的最终获得概率对多个疑似疾病的排序进行更新，以获得更新后的疾病排序结果。例如，可以根据最终获得概率的大小，按照获得概率从大到小的顺序对多个疑似疾病进行排序，进而获得更新后的疾病排序结果。

本实施例中，按照获得概率从大到小的顺序对多个疑似疾病进行排序仅为示例性说明，在其他实施例中，还可以以其他的方式对多个疑似疾病进行排序，例如，可以根据疾病种类的平均获得概率进行排序，按照疾病种类的平均获得概率由大到小的顺序对不同的疾病种类进行排序，然后按照疑似疾病的获得概率对同一疾病类别的疑似疾病进行排序，从而获得更新后的疾病排序结果。

本实施例中，通过根据疑似疾病排序结果确定各疑似疾病的获得概率，再确定疑似疾病在病人所属地区的权重与疑似疾病的获得概率之间的乘积，以作为疑似疾病的最终获得概率，然后根据各疑似疾病的最终获得概率对多个疑似疾病的排序进行更新，细化了根据多个疑似疾病在病人所属地区的权重对疑似疾病排序结果进行更新的步骤。

在一实施例中，如图5所示，步骤S50中，即根据更新后的疾病排序结果确定病人的疑似疾病排序结果，具体包括如下步骤：

S51：在更新后的疾病排序结果中确定疑似疾病的获得概率。

在获得更新后的疾病排序结果之后，在更新后的疾病排序结果中确定疑似疾病的获得概率，即确定根据权重进行更新后的最终获得概率。

S52：根据疑似疾病的获得概率的大小对疑似疾病进行由高到低的排序，获得疑似疾病排序列表。

在确定疑似疾病的获得概率之后，根据疑似疾病的获得概率的大小对疑似疾病进行由高到低的排序，获得疑似疾病排序列表。

S53：在疑似疾病排序列表中选取前预设数量个疑似疾病和疑似疾病的获得概率作为病人的疑似疾病排序结果。

在获得疑似疾病排序列表之后，在疑似疾病排序列表中选取前预设数量个疑似疾病和疑似疾病的获得概率作为病人的疑似疾病排序结果。

例如，预设数量为10，则在疑似疾病排序列表中选取前10个疑似疾病和疑似疾病的获得概率作为病人的疑似疾病排序结果，以将前10个疑似疾病和疑似疾病的获得概率输出，使得最终的疾病排序结果一目了然，便于医生的快速浏览和参考，进而辅助医生的诊断病人的实际患病情况，提高了最终的疾病排序结果的输出效率。

本实施例中，预设数量为10仅为示例性说明，在其他实施例中，预设数量还可以是其他数值，在此不再赘述。

本实施例中，通过在更新后的疾病排序结果中确定疑似疾病的获得概率，再根据疑似疾病的获得概率的大小对疑似疾病进行由高到低的排序，然后获得疑似疾病排序列表，最后在疑似疾病排序列表中选取前预设数量个疑似疾病和疑似疾病的获得概率作为病人的疑似疾病排序结果，细化了根据更新后的疾病排序结果确定病人的疑似疾病排序结果的步骤，提高了最终的疾病排序结果的输出效率，使得最终的疾病排序结果一目了然，便于医生的快速浏览和参考。

在一实施例中，在根据预设权重模型确定多个疑似疾病在病人所属地区的权重之前，还需要根据病人所属地区的疾病诊断数据进行疾病权重学习以获得预设权重模型，进而才能根据预设权重模型获得更加准确的多个疑似疾病权重。如图6所示，步骤S30之前，预设权重模型具体通过如下方式获取：

S01：确定病人所属地区的k个优势病种，优势病种为病人所属地区中疾病出现频率高于预设频率的多个疾病种类。

确定病人所属地区的k个优势病种，其中，优势病种为病人所属地区中疾病出现频率高于预设频率的多个疾病种类，且优势病种为辅助诊断模型中的疾病种类，即确定病人所属地区中疾病出现频率高于预设频率的k个疾病种类，并将出现频率高于预设频率的k个疾病种类作为优势病种，以便于训练预设权重模型。

S02：将k个优势病种的权重定义为预训练模型的状态，状态为k维的向量。

在确定病人所属地区的k个优势病种之后，将k个优势病种的权重定义为预训练模型的状态，其中，预训练模型的状态为一个k维的向量。

预训练模型可以是一个DQN(Deep Q-learning Network)模型，在其他实施例，预训练模型还可以是其他强化学习模型，在此不再赘述。本实施例中以预训练模型为例进行说明。

S03：将k维的向量输入预训练模型的神经网络中，以获得预训练模型的动作。

在确定预训练模型的动作之后，将表示k个优势病种的权重的向量输入DQN模型的神经网络中，以作为DQN模型的动作。即对于病人所属地区的k个优势病种，每一个优势病种的权重增加或减少，同样用k维的向量表示，即为动作。

例如，在DQN模型中，状态state为一个k维向量，表示当前k类疾病的权重；动作action，用k维的one-hot向量表示，例如k为3，动作的三维向量([疾病类别1，疾病类别2，疾病类别3])，动作的三维向量[0，1，0]表示疾病类别2的权重增加，动作的三维向量[0，0，-1]表示疾病类别3的权重减少，每个动作只有1个对应的疾病类别有变化，DQN模型中状态的更新是根据当前的状态和动作进行的。

本实施例中，k为3仅为示例性说明，在其他实施例中，k还可以是其他数值，在此不再赘述。

S04：根据病人所属地区的疾病诊断数据确定预训练模型的奖励。

根据病人所属地区的疾病诊断数据确定预训练模型的奖励。奖励reward是在预训练模型发训练过程中起作用的，通过奖励来更新预训练模型当前的状态。

例如，病人所属地区的疾病诊断数据包括了辅助诊断模型对确诊病人的疾病排序结果，在训练预训练模型的过程中，状态一种在更新变化，每次状态更新后，根据更新状态对辅助诊断模型的疾病排序结果进行更新，获得不同状态下的疾病性能，若当前状态下的疾病性能提高，则奖励为1；若当前状态下的疾病性能不变，则奖励为0；若当前状态下的疾病性能降低，则奖励为-1。

本实施例中，奖励的确定仅为示例性说明，在其他实施例中，还可以将奖励设置为其他在此不再赘述。

S05：调整状态、动作和奖励以对预训练模型进行权重学习，获得预设权重模型。

在对预训练模型进行权重学习放入过程中，不断地调整状态、动作和奖励，以使得预训练模型的损失函数不再变化，此时预训练模型的状态达到稳定，表示预训练模型的性能与病人所属地区的疾病诊断数据相比不再发生变化，预训练模型训练完成，则将稳定状态下的预训练模型作为预设权重模型，此时，稳定状态所表示的k维的向量为预设权重模型的输出结果，即预设权重模型输出的k维的向量为k个优势病种的权重。

本实施例中，通过确定病人所属地区的k个优势病种，优势病种为病人所属地区中疾病出现频率高于预设频率的多个疾病种类，并将k个优势病种的权重定义为预训练模型的状态，状态为k维的向量，然后将k维的向量输入预训练模型的神经网络中，以获得预训练模型的动作，再根据病人所属地区的疾病诊断数据确定预训练模型的奖励，最后调整状态、动作和奖励以对预训练模型进行权重学习，获得预设权重模型，明确了获取预设权重模型的过程，根据病人所属地区的疾病诊断数据训练获得预设权重模型，使得预设权重模型贴近病人所属地区的数据情况，提高了预设权重模型的准确性，为后续对辅助诊断模型的疾病排序结果进行优化提供了基础。

在一实施例中，病人所属地区的疾病诊断数据包括多个确诊病人的疾病诊断结果和辅助诊断模型针对多个确诊病人的疾病排序结果，如图7所示，步骤S04中，即根据病人所属地区的疾病诊断数据确定预训练模型的奖励，具体包括如下步骤：

S041：根据各状态下优势病种的权重更新辅助诊断模型针对多个确诊病人的疾病排序结果，以确定各状态下多个确诊病人的更新疾病结果，更新疾病结果为更新确诊病人的疾病排序结果后的获得概率最高的疾病。

病人所属地区的疾病诊断数据包括多个确诊病人的疾病诊断结果和辅助诊断模型针对多个确诊病人的疾病排序结果，在更新预训练模型的状态的过程中，需要获取各状态下优势病种的权重，然后根据各状态下优势病种的权重对辅助诊断模型针对多个确诊病人的疾病排序结果进行更新，以获得各状态对疾病排序结果进行更新的更新排序结果，然后根据各更新排序结果确定各状态下多个确诊病人的更新疾病结果。其中，更新疾病结果为更新确诊病人的疾病排序结果后的获得概率最高的疾病。

S042：根据多个确诊病人的疾病诊断结果确定各状态下多个确诊病人的更新疾病结果的准确率，以获得各状态下的疾病结果准确率。

在获得各状态下多个确诊病人的更新疾病结果之后，根据多个确诊病人的疾病诊断结果确定各状态下多个确诊病人的更新疾病结果的准确率，以获得各状态下的疾病结果准确率。

例如，在某状态下，有m个确诊病人的疾病诊断结果，该状态下也对应的有m个确诊病人的更新疾病结果，其中，m个确诊病人的更新疾病结果中，有n个确诊病人的更新疾病结果与确诊病人的疾病诊断结果一致，则该状态下更新疾病结果的准确率为n/m，重复上述步骤，最终获得不同状态下的更新疾病结果的准确率。

其中，预训练模型的初始状态的k维向量，是各类优势病种的平均准确率，即在初始状态下对辅助诊断模型的多个疾病排序结果进行更新，获得的多个更新疾病结果的平均准确率。

S043：根据前后两个状态下的疾病结果准确率确定预训练模型中下一状态的奖励。

在获得各状态下的疾病结果准确率之后，根据前后两个状态下的疾病结果准确率确定预训练模型中下一状态的奖励。

例如，accu _before表示根据上一次状态下的疾病结果准确率，accu _now表示当前状态下的疾病结果准确率，限值threshold为0.01，预设训练模型确定奖励的过程为：若|accu _before-accu _now|>threshold，且accu _before<accu _now，表示更新后的疾病结果的准确性得到提升，则预设训练模型的奖励值为1；若|accu _before-accu _now|<threshold，表示更新后的疾病结果的准确性不变，则预设训练模型的奖励值为0；|accu _before—accu _now|>threshold，且accu _before>accu _now，表示更新后的疾病结果的准确性下降，则预设训练模型的奖励值为-1。

本实施例中，threshold为0.01仅为示例性说明，在其他实施例中，threshold还可以是其他小于0.01的值，在此不再赘述。

本实施例中，通过根据各状态下优势病种的权重更新辅助诊断模型针对多个确诊病人的疾病排序结果，以确定各状态下多个确诊病人的更新疾病结果，进而根据多个确诊病人的疾病诊断结果确定各状态下多个确诊病人的更新疾病结果的准确率，以获得各状态下的疾病结果准确率，根据前后两个状态下的疾病结果准确率确定预训练模型中下一状态的奖励，细化了根据病人所属地区的疾病诊断数据确定预训练模型的奖励的过程，为奖励的确定提供了基础，使得训练过程中的预训练模型结合辅助诊断模型输出的疾病性能接近确诊病人的实际疾病诊断结果，从而提高了预设权重模型的准确性。

应理解，上述实施例中各步骤的序号的大小并不意味着执行顺序的先后，各过程的执行顺序应以其功能和内在逻辑确定，而不应对本申请实施例的实施过程构成任何限定。

在一实施例中，提供一种基于强化学习模型的疾病排序装置，该基于强化学习模型的疾病排序装置与上述实施例中基于强化学习模型的疾病排序方法一一对应。如图8所示，该基于强化学习模型的疾病排序装置包括第一获取模块801、第二获取模块802、第一确定模块803、更新模块804和第二确定模块805。各功能模块详细说明如下：

第一获取模块801，用于获取病人的病情数据，并将所述病人的病情数据输入辅助诊断模型；

第二获取模块802，用于获取所述辅助诊断模型输出的疾病排序结果，所述疾病排序结果为根据所述病人获得各疾病的概率大小对多个疑似疾病进行排序的结果；

第一确定模块803，用于根据预设权重模型确定所述多个疑似疾病在所述病人所属地区的权重，所述预设权重模型为根据所述病人所属地区的疾病诊断数据进行疾病权重学习获得的强化学习模型；

更新模块804，用于根据所述多个疑似疾病在所述病人所属地区的权重对所述疑似疾病排序结果进行更新，以获得更新后的疾病排序结果；

第二确定模块805，用于根据所述更新后的疾病排序结果确定所述病人的疑似疾病排序结果，并进行输出。

进一步地，所述第一确定模块803具体用于：

将所述病人所属地区的预设权重模型输出的状态作为所述病人所属地区中多个优势病种的权重；

确定所述多个疑似疾病中各所述疑似疾病的疾病种类；

确定各所述疑似疾病的疾病种类是否为所述病人所属地区的多个优势病种；

若所述疑似疾病的疾病种类为所述病人所属地区的多个优势病种，则将所述优势病种的权重作为对应疑似疾病的权重，以获得所述多个疑似疾病的权重。

进一步地，所述更新模块804具体用于：

根据所述疑似疾病排序结果确定各所述疑似疾病的获得概率；

确定所述疑似疾病在所述病人所属地区的权重与所述疑似疾病的获得概率之间的乘积，以作为所述疑似疾病的最终获得概率；

根据各所述疑似疾病的最终获得概率对多个所述疑似疾病的排序进行更新。

进一步地，所述第二确定模块805具体用于：

在所述更新后的疾病排序结果中确定所述疑似疾病的获得概率；

根据所述疑似疾病的获得概率的大小对所述疑似疾病进行由高到低的排序，获得疑似疾病排序列表；

在所述疑似疾病排序列表中选取前预设数量个所述疑似疾病和所述疑似疾病的获得概率作为所述病人的疑似疾病排序结果。

进一步地，所述基于强化学习模型的疾病排序装置还包括模型训练模块806，所述模型训练模块806具体用于：

确定所述病人所属地区的k个优势病种，所述优势病种为所述病人所属地区中疾病出现频率较高的多个疾病种类；

将k个优势病种的权重定义为预训练模型的状态，所述状态为k维的向量；

将所述k维的向量输入所述预训练模型的神经网络中，以获得所述预训练模型的动作；

根据所述病人所属地区的疾病诊断数据确定所述预训练模型的奖励；

调整所述状态、所述动作和所述奖励以对所述预训练模型进行权重学习，获得所述预设权重模型。

进一步地，所述病人所属地区的疾病诊断数据包括多个确诊病人的疾病诊断结果和所述辅助诊断模型针对多个确诊病人的疾病排序结果，所述模型训练模块806具体还用于：

根据各状态下优势病种的权重更新所述辅助诊断模型针对多个确诊病人的疾病排序结果，以确定各状态下所述多个确诊病人的更新疾病结果，所述更新疾病结果为更新所述确诊病人的疾病排序结果后的获得概率最高的疾病；

根据所述多个确诊病人的疾病诊断结果确定所述各状态下所述多个确诊病人的更新疾病结果的准确率，以获得各状态下的疾病结果准确率；

根据前后两个状态下的疾病结果准确率确定所述预训练模型中下一状态的奖励。

关于基于强化学习模型的疾病排序装置的具体限定可以参见上文中对于基于强化学习模型的疾病排序方法的限定，在此不再赘述。上述基于强化学习模型的疾病排序装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中，也可以以软件形式存储于计算机设备中的存储器中，以便于处理器调用执行以上各个模块对应的操作。

在一个实施例中，提供了一种计算机设备，该计算机设备可以是服务器，其内部结构图可以如图9所示。该计算机设备包括通过***总线连接的处理器、存储器、网络接口和数据库。其中，该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作***、计算机可读指令和数据库。该内存储器为非易失性存储介质中的操作***和计算机可读指令的运行提供环境。该计算机设备的数据库用于存储辅助诊断模型、预设权重模型和疾病排序结果等。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机可读指令被处理器执行时以实现一种基于强化学习模型的疾病排序方法。

在一个实施例中，提供了一种计算机设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机可读指令，处理器执行计算机可读指令时实现以下步骤：

在一个实施例中，提供了一种计算机可读存储介质，其上存储有计算机可读指令，计算机可读指令被处理器执行时实现以下步骤：

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程，是可以通过计算机可读指令来指令相关的硬件来完成，计算机可读指令可存储于计算机可读取存储介质中，所述计算机可读存储介质可以是非易失性，也可以是易失性，该计算机可读指令在执行时，可包括如上述各方法的实施例的流程。其中，本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用，均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限，RAM以多种形式可得，诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。

所属领域的技术人员可以清楚地了解到，为了描述的方便和简洁，仅以上述各功能单元、模块的划分进行举例说明，实际应用中，可以根据需要而将上述功能分配由不同的功能单元、模块完成，即将装置的内部结构划分成不同的功能单元或模块，以完成以上描述的全部或者部分功能。

以上实施例仅用以说明本申请的技术方案，而非对其限制；尽管参照前述实施例对本申请进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围，均应包含在本申请的保护范围之内。

Claims

一种基于强化学习模型的疾病排序方法，其中，包括：

获取病人的病情数据，并将所述病人的病情数据输入辅助诊断模型；

获取所述辅助诊断模型输出的疾病排序结果，所述疾病排序结果为根据所述病人获得各疾病的概率大小对多个疑似疾病进行排序的结果；

根据预设权重模型确定所述多个疑似疾病在所述病人所属地区的权重，所述预设权重模型为根据所述病人所属地区的疾病诊断数据进行疾病权重学习获得的强化学习模型；

根据所述多个疑似疾病在所述病人所属地区的权重对所述疑似疾病排序结果进行更新，以获得更新后的疾病排序结果；

根据所述更新后的疾病排序结果确定所述病人的疑似疾病排序结果，并进行输出。
如权利要求1所述的基于强化学习模型的疾病排序方法，其中，所述预设权重模型通过如下方式获取：

确定所述病人所属地区的k个优势病种，所述优势病种为所述病人所属地区中疾病出现频率高于预设频率的多个疾病种类；

将k个优势病种的权重定义为预训练模型的状态，所述状态为k维的向量；

将所述k维的向量输入所述预训练模型的神经网络中，以获得所述预训练模型的动作；

根据所述病人所属地区的疾病诊断数据确定所述预训练模型的奖励；

调整所述状态、所述动作和所述奖励以对所述预训练模型进行权重学习，获得所述预设权重模型。
如权利要求2所述的基于强化学习模型的疾病排序方法，其中，所述病人所属地区的疾病诊断数据包括多个确诊病人的疾病诊断结果和所述辅助诊断模型针对多个确诊病人的疾病排序结果，所述根据所述病人所属地区的疾病诊断数据确定所述预训练模型的奖励，包括：

根据各状态下优势病种的权重更新所述辅助诊断模型针对多个确诊病人的疾病排序结果，以确定各状态下所述多个确诊病人的更新疾病结果，所述更新疾病结果为更新所述确诊病人的疾病排序结果后的获得概率最高的疾病；

根据所述多个确诊病人的疾病诊断结果确定所述各状态下所述多个确诊病人的更新疾病结果的准确率，以获得各状态下的疾病结果准确率；

根据前后两个状态下的疾病结果准确率确定所述预训练模型中下一状态的奖励。
如权利要求1所述的基于强化学习模型的疾病排序方法，其中，所述根据预设权重模型确定所述多个疑似疾病在所述病人所属地区的权重，包括：

将所述病人所属地区的预设权重模型输出的状态作为所述病人所属地区中多个优势病种的权重；

确定所述多个疑似疾病中各所述疑似疾病的疾病种类；

确定各所述疑似疾病的疾病种类是否为所述病人所属地区的多个优势病种；

若所述疑似疾病的疾病种类为所述病人所属地区的多个优势病种，则将所述优势病种的权重作为对应疑似疾病的权重，以获得所述多个疑似疾病的权重。
如权利要求1-4任一项所述的基于强化学习模型的疾病排序方法，其中，所述根据所述多个疑似疾病在所述病人所属地区的权重对所述疑似疾病排序结果进行更新，包括：

根据所述疑似疾病排序结果确定各所述疑似疾病的获得概率；

确定所述疑似疾病在所述病人所属地区的权重与所述疑似疾病的获得概率之间的乘积，以作为所述疑似疾病的最终获得概率；

根据各所述疑似疾病的最终获得概率对多个所述疑似疾病的排序进行更新。
如权利要求1-4任一项所述的基于强化学习模型的疾病排序方法，其中，所述根据所述更新后的疾病排序结果确定所述病人的疑似疾病排序结果，包括：

在所述更新后的疾病排序结果中确定所述疑似疾病的获得概率；

根据所述疑似疾病的获得概率的大小对所述疑似疾病进行由高到低的排序，获得疑似疾病排序列表；

在所述疑似疾病排序列表中选取前预设数量个所述疑似疾病和所述疑似疾病的获得概率作为所述病人的疑似疾病排序结果。
一种基于强化学习模型的疾病排序装置，其中，包括：

第一获取模块，用于获取病人的病情数据，并将所述病人的病情数据输入辅助诊断模型；

第二获取模块，用于获取所述辅助诊断模型输出的疾病排序结果，所述疾病排序结果为根据所述病人获得各疾病的概率大小对多个疑似疾病进行排序的结果；

第一确定模块，用于根据预设权重模型确定所述多个疑似疾病在所述病人所属地区的权重，所述预设权重模型为根据所述病人所属地区的疾病诊断数据进行疾病权重学习获得的强化学习模型；

更新模块，用于根据所述多个疑似疾病在所述病人所属地区的权重对所述疑似疾病排序结果进行更新，以获得更新后的疾病排序结果；

第二确定模块，用于根据所述更新后的疾病排序结果确定所述病人的疑似疾病排序结果，并进行输出。
如权利要求7所述的基于强化学习模型的疾病排序装置，其中，所述第一确定模块具体用于：

将所述所属地区的预设权重模型输出的状态作为所述所属地区中多个优势病种的权重；

确定所述多个疑似疾病中各所述疑似疾病的疾病种类；

确定各所述疑似疾病的疾病种类是否为所述病人所属地区的多个优势病种；

若所述疑似疾病的疾病种类为所述病人所属地区的多个优势病种，则将所述优势病种的权重作为所述疑似疾病的权重，以获得所述多个疾病的权重。
一种计算机设备，包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机可读指令，其中，所述处理器执行所述计算机可读指令时实现如下步骤：

获取病人的病情数据，并将所述病人的病情数据输入辅助诊断模型；

获取所述辅助诊断模型输出的疾病排序结果，所述疾病排序结果为根据所述病人获得各疾病的概率大小对多个疑似疾病进行排序的结果；

根据预设权重模型确定所述多个疑似疾病在所述病人所属地区的权重，所述预设权重模型为根据所述病人所属地区的疾病诊断数据进行疾病权重学习获得的强化学习模型；

根据所述多个疑似疾病在所述病人所属地区的权重对所述疑似疾病排序结果进行更新，以获得更新后的疾病排序结果；

根据所述更新后的疾病排序结果确定所述病人的疑似疾病排序结果，并进行输出。
如权利要求9所述的计算机设备，其中，所述预设权重模型通过如下方式获取：

确定所述病人所属地区的k个优势病种，所述优势病种为所述病人所属地区中疾病出现频率高于预设频率的多个疾病种类；

将k个优势病种的权重定义为预训练模型的状态，所述状态为k维的向量；

将所述k维的向量输入所述预训练模型的神经网络中，以获得所述预训练模型的动作；

根据所述病人所属地区的疾病诊断数据确定所述预训练模型的奖励；

调整所述状态、所述动作和所述奖励以对所述预训练模型进行权重学习，获得所述预设权重模型。
如权利要求10所述的计算机设备，其中，所述病人所属地区的疾病诊断数据包括多个确诊病人的疾病诊断结果和所述辅助诊断模型针对多个确诊病人的疾病排序结果，所述根据所述病人所属地区的疾病诊断数据确定所述预训练模型的奖励，包括：

根据各状态下优势病种的权重更新所述辅助诊断模型针对多个确诊病人的疾病排序结果，以确定各状态下所述多个确诊病人的更新疾病结果，所述更新疾病结果为更新所述确诊病人的疾病排序结果后的获得概率最高的疾病；

根据所述多个确诊病人的疾病诊断结果确定所述各状态下所述多个确诊病人的更新疾病结果的准确率，以获得各状态下的疾病结果准确率；

根据前后两个状态下的疾病结果准确率确定所述预训练模型中下一状态的奖励。
如权利要求9所述的计算机设备，其中，所述根据预设权重模型确定所述多个疑似疾病在所述病人所属地区的权重，包括：

将所述病人所属地区的预设权重模型输出的状态作为所述病人所属地区中多个优势病种的权重；

确定所述多个疑似疾病中各所述疑似疾病的疾病种类；

确定各所述疑似疾病的疾病种类是否为所述病人所属地区的多个优势病种；

若所述疑似疾病的疾病种类为所述病人所属地区的多个优势病种，则将所述优势病种的权重作为对应疑似疾病的权重，以获得所述多个疑似疾病的权重。
如权利要求9-12任一项所述的计算机设备，其中，所述根据所述多个疑似疾病在所述病人所属地区的权重对所述疑似疾病排序结果进行更新，包括：

根据所述疑似疾病排序结果确定各所述疑似疾病的获得概率；

确定所述疑似疾病在所述病人所属地区的权重与所述疑似疾病的获得概率之间的乘积，以作为所述疑似疾病的最终获得概率；

根据各所述疑似疾病的最终获得概率对多个所述疑似疾病的排序进行更新。
如权利要求9-12任一项所述的计算机设备，其中，所述根据所述更新后的疾病排序结果确定所述病人的疑似疾病排序结果，包括：

在所述更新后的疾病排序结果中确定所述疑似疾病的获得概率；

根据所述疑似疾病的获得概率的大小对所述疑似疾病进行由高到低的排序，获得疑似疾病排序列表；

在所述疑似疾病排序列表中选取前预设数量个所述疑似疾病和所述疑似疾病的获得概率作为所述病人的疑似疾病排序结果。
一个或多个存储有计算机可读指令的可读存储介质，其中，所述计算机可读指令被一个或多个处理器执行时，使得所述一个或多个处理器执行如下步骤：

获取病人的病情数据，并将所述病人的病情数据输入辅助诊断模型；

获取所述辅助诊断模型输出的疾病排序结果，所述疾病排序结果为根据所述病人获得各疾病的概率大小对多个疑似疾病进行排序的结果；

根据预设权重模型确定所述多个疑似疾病在所述病人所属地区的权重，所述预设权重模型为根据所述病人所属地区的疾病诊断数据进行疾病权重学习获得的强化学习模型；

根据所述多个疑似疾病在所述病人所属地区的权重对所述疑似疾病排序结果进行更新，以获得更新后的疾病排序结果；

根据所述更新后的疾病排序结果确定所述病人的疑似疾病排序结果，并进行输出。
如权利要求15所述的可读存储介质，其中，所述预设权重模型通过如下方式获取：

确定所述病人所属地区的k个优势病种，所述优势病种为所述病人所属地区中疾病出现频率高于预设频率的多个疾病种类；

将k个优势病种的权重定义为预训练模型的状态，所述状态为k维的向量；

将所述k维的向量输入所述预训练模型的神经网络中，以获得所述预训练模型的动作；

根据所述病人所属地区的疾病诊断数据确定所述预训练模型的奖励；

调整所述状态、所述动作和所述奖励以对所述预训练模型进行权重学习，获得所述预设权重模型。
如权利要求16所述的可读存储介质，其中，所述病人所属地区的疾病诊断数据包括多个确诊病人的疾病诊断结果和所述辅助诊断模型针对多个确诊病人的疾病排序结果，所述根据所述病人所属地区的疾病诊断数据确定所述预训练模型的奖励，包括：

根据各状态下优势病种的权重更新所述辅助诊断模型针对多个确诊病人的疾病排序结果，以确定各状态下所述多个确诊病人的更新疾病结果，所述更新疾病结果为更新所述确诊病人的疾病排序结果后的获得概率最高的疾病；

根据所述多个确诊病人的疾病诊断结果确定所述各状态下所述多个确诊病人的更新疾病结果的准确率，以获得各状态下的疾病结果准确率；

根据前后两个状态下的疾病结果准确率确定所述预训练模型中下一状态的奖励。
如权利要求15所述的可读存储介质，其中，所述根据预设权重模型确定所述多个疑似疾病在所述病人所属地区的权重，包括：

将所述病人所属地区的预设权重模型输出的状态作为所述病人所属地区中多个优势病种的权重；

确定所述多个疑似疾病中各所述疑似疾病的疾病种类；

确定各所述疑似疾病的疾病种类是否为所述病人所属地区的多个优势病种；

若所述疑似疾病的疾病种类为所述病人所属地区的多个优势病种，则将所述优势病种的权重作为对应疑似疾病的权重，以获得所述多个疑似疾病的权重。
如权利要求15-18任一项所述的可读存储介质，其中，所述根据所述多个疑似疾病在所述病人所属地区的权重对所述疑似疾病排序结果进行更新，包括：

根据所述疑似疾病排序结果确定各所述疑似疾病的获得概率；

确定所述疑似疾病在所述病人所属地区的权重与所述疑似疾病的获得概率之间的乘积，以作为所述疑似疾病的最终获得概率；

根据各所述疑似疾病的最终获得概率对多个所述疑似疾病的排序进行更新。
如权利要求15-18任一项所述的可读存储介质，其中，所述根据所述更新后的疾病排序结果确定所述病人的疑似疾病排序结果，包括：

在所述更新后的疾病排序结果中确定所述疑似疾病的获得概率；

根据所述疑似疾病的获得概率的大小对所述疑似疾病进行由高到低的排序，获得疑似疾病排序列表；

在所述疑似疾病排序列表中选取前预设数量个所述疑似疾病和所述疑似疾病的获得概率作为所述病人的疑似疾病排序结果。