CN113779635A

CN113779635A - 一种医疗数据的校验方法、装置、设备及存储介质

Info

Publication number: CN113779635A
Application number: CN202111091637.2A
Authority: CN
Inventors: 于剑文
Original assignee: Ping An Medical and Healthcare Management Co Ltd
Current assignee: Shenzhen Ping An Medical Health Technology Service Co Ltd
Priority date: 2021-09-17
Filing date: 2021-09-17
Publication date: 2021-12-10
Anticipated expiration: 2041-09-17
Also published as: CN113779635B

Abstract

本申请涉及人工智能和数字医疗领域，应用于智慧医疗领域中，揭露了一种医疗数据的校验方法、装置、设备及存储介质，所述方法包括：接收用户请求；基于所述用户请求，获取对应的医疗数据；将所述医疗数据以及所述用户请求中的产品信息，利用匹配模型进行匹配，得到所述医疗数据对应的疾病标签；将所述医疗数据以及所述医疗数据对应的所述疾病标签，输入校验模型进行校验，得到所述医疗数据对应的校验结果；输出所述校验结果。本申请还涉及区块链技术，医疗数据存储于区块链中。本申请能有效提高对医疗数据的校验准确率和处理效率。

Description

一种医疗数据的校验方法、装置、设备及存储介质

技术领域

本申请涉及人工智能和数字医疗领域，尤其涉及一种医疗数据的校验方法、装置、设备及存储介质。

背景技术

随着社会的不断发展，越来越多的个人为使其自身的利益不受损害或保障健康，越来越多的人来购买金融产品，例如保险产品等，对于产品出售机构而言，在用户购买保险产品购买时的审核过程中，较为麻烦和困难，常存在数据不透明、不互通和审核困难等问题。在现有技术中常仅根据用户提供的信息，进行购买审核，且机构审核的手段常以人工方式进行，导致效率较低且数据不互通，或者通过机械的与机器对话的方式，获取信息，并根据对话信息来进行匹配映射处理，进而输出审核结果，其准确率较低。因此，如何提高产品购买时的审核效率及准确率成为了亟待解决的问题。

发明内容

本申请提供了一种医疗数据的校验方法、装置、设备及存储介质，以解决现有技术中对产品购买时的审核效率以及准确率较低的问题。

为解决上述问题，本申请提供了一种医疗数据的校验方法，包括：

接收用户请求；

基于所述用户请求，获取对应的医疗数据；

将所述医疗数据以及所述用户请求中的产品信息，利用匹配模型进行匹配，得到所述医疗数据对应的疾病标签；

将所述医疗数据以及所述医疗数据对应的所述疾病标签，输入校验模型进行校验，得到所述医疗数据对应的校验结果；

输出所述校验结果。

进一步的，所述获取对应的医疗数据包括：

向预设知识库发送调用请求，所述调用请求携带验签令牌；

接收所述知识库返回的验签结果，并在验签结果为通过时，调用所述知识库中的医疗数据，所述验签结果为所述知识库根据所述验签令牌进行RSA非对称加密方式验证得到。

进一步的，所述将所述医疗数据以及所述用户请求中的产品信息，利用匹配模型进行匹配，得到所述医疗数据对应的疾病标签包括：

获取所述用户请求中的产品信息，基于所述产品信息提取对应的疾病清单；

将所述疾病清单与医学疾病编码库进行匹配，得到所述疾病清单对应的疾病标签；

利用所述匹配模型将所述医疗数据与所述疾病清单对应的疾病标签进行匹配，若匹配成功，则输出所述医疗数据对应的所述疾病标签，若匹配不成功，则将所述医疗数据确定为正常数据并输出，所述匹配模型为基于深度语义匹配模型训练得到的。

进一步的，在所述将所述医疗数据以及所述医疗数据对应的所述疾病标签，输入校验模型进行校验之前，还包括：

将所述医疗数据以及所述医疗数据对应的所述疾病标签输入预设的判断引擎进行校验，其中，所述判断引擎预设有多条判断条件；

将未通过所述判断引擎校验的所述医疗数据，确定为异常数据并输出。

对所述医疗数据中的缺失数据和错误数据进行热卡填充处理，对所述医疗数据中的重复数据进行删除处理。

进一步的，所述将所述医疗数据以及所述医疗数据对应的所述疾病标签，输入校验模型进行校验，得到所述医疗数据对应的校验结果包括：

根据所述用户请求中的产品信息，获取对应的所述校验模型；

所述医疗数据以及所述医疗数据对应的所述疾病标签经所述校验模型校验处理，得到对应的校验分值，所述校验模型为基于轻量梯度提升树模型训练得到的；

将所述校验分值与预设数值进行比较判断；

当所述校验分值大于等于预设数值时，确定所述医疗数据为异常数据，当所述校验分值小于所述预设数值时，确定所述医疗数据为正常数据。

进一步的，在所述将所述校验分值与预设数值进行判断之前，还包括：

基于所述医疗数据中的数据类型，对所述医疗数据进行拆分；

根据将所述医疗数据拆分后得到的多种类型的子数据，对应生成多个问题及答案；

将由所述多个问题组成的问卷并发送至客户端；

接收所述客户端发送的所述问卷对应的答复，并将所述答复与对应的所述答案进行比较判断；

根据判断结果，对所述校验分值进行调整。

为了解决上述问题，本申请还提供一种医疗数据的校验装置，所述装置包括：

接收模块，用于接收用户请求；

获取模块，用于基于所述用户请求，获取对应的医疗数据；

匹配模块，用于将所述医疗数据以及所述用户请求中的产品信息，利用匹配模型进行匹配，得到所述医疗数据对应的疾病标签；

校验模块，用于将所述医疗数据以及所述医疗数据对应的所述疾病标签，输入校验模型进行校验，得到所述医疗数据对应的校验结果；

输出模块，用于输出所述校验结果。

为了解决上述问题，本申请还提供一种计算机设备，包括：

至少一个处理器；以及，

与所述至少一个处理器通信连接的存储器；其中，

所述存储器存储有可被所述至少一个处理器执行的指令，所述指令被所述至少一个处理器执行，以使所述至少一个处理器能够执行如上所述的医疗数据的校验方法。

为了解决上述问题，本申请还提供一种非易失性的计算机可读存储介质，所述计算机可读存储介质上存储有计算机可读指令，所述计算机可读指令被处理器执行时实现如上所述的医疗数据的校验方法。

根据本申请实施例提供的一种医疗数据的校验方法、装置、设备及存储介质，与现有技术相比至少具有以下有益效果：

通过接收用户请求，所述用户请求中包含有用户个人信息及预选择的产品信息，基于所述用户请求中的用户个人信息，从数据库中获取对应的医疗数据，根据医疗数据中的信息与所述用户请求中的产品信息利用匹配模型进行匹配，以得到所述医疗数据对应的疾病标签，来明确与用户存在的疾病与产品是否有关联，再将所述医疗数据以及所述医疗数据对应的所述疾病标签，来输入所述校验模型中进行校验，得到并输出所述医疗数据对应的校验分数，通过先确定用户对应的医疗数据中的疾病标签，并将所述医疗数据以及对应的疾病标签输入至校验模型处理，从而提高了医疗数据对应校验结果的准确率，且提高了处理效率。

附图说明

为了更清楚地说明本申请中的方案，下面将对本申请实施例描述中所需要使用的附图做一个简单介绍，显而易见地，下面描述中的附图是本申请的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1为本申请一实施例提供的医疗数据的校验方法的流程示意图；

图2为本申请一实施例提供的医疗数据的校验装置的模块示意图；

图3为本申请一实施例的计算机设备的结构示意图。

具体实施方式

除非另有定义，本文所使用的所有的技术和科学术语与属于本申请的技术领域的技术人员通常理解的含义相同；本文中在申请的说明书中所使用的术语只是为了描述具体的实施例的目的，不是旨在于限制本申请；本申请的说明书和权利要求书及上述附图说明中的术语“包括”和“具有”以及它们的任何变形，意图在于覆盖不排他的包含。本申请的说明书和权利要求书或上述附图中的术语“第一”“第二”等是用于区别不同对象，而不是用于描述特定顺序。

在本文中提及“实施例”意味着，结合实施例描述的特定特征、结构或特性可以包含在本申请的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是是相同的实施例，也不是与其它实施例相互排斥的独立的或备选的实施例。本领域技术人员显式地或隐式地理解的是，本文所描述的实施例可以与其它实施例相结合。

本申请提供一种医疗数据的校验方法。参照图1所示，为本申请一实施例提供的医疗数据的校验方法的流程示意图。

在本实施例中，医疗数据的校验方法包括：

S1、接收用户请求；

在本申请中，接收用户在前端输入的数据后生成的用户请求，其中用户在前端输入姓名、住址、身份证号等个人信息数据，并且用户在前端还选择预购买的产品，所述产品包括保险产品等。并且在获取到用户的个人信息后，还将接收用户的同意授权信息，若未收到用户的同意授权信息，将不会对个人信息进行处理。

S2、基于所述用户请求，获取对应的医疗数据；

具体的，基于用户请求中的个人信息，调用数据库中个人信息对应的医疗数据，所述医疗数据包括疾病信息、费用信息、就诊医院和就诊时间等。

进一步的，所述获取对应的医疗数据包括：

向预设知识库发送调用请求，所述调用请求携带验签令牌；

由于医疗数据，可能会涉及用户的隐私数据，所以对于医疗数据都会保存至预设数据库中，所以在获取医疗数据时，数据库会进行验签步骤，以保证数据的安全，避免泄露数据等问题。

并且，在向知识库调用数据时，还对调用时间进行判断，若调用时间超过预设时间，则将判断流程转到线下进行处理。

整个过程为，客户端计算消息m的第一消息摘要，并用RSA非对称加密方式对第一消息摘要进行加密(利用客户端的私钥)，得到签名s，将消息m和签名s再利用知识库的公钥，得到密文c,发送至知识库，知识库使用自己的私钥对密文c进行解密，得到消息m和签名s,知识库使用客户端的公钥对签名s进行解密，得到第一消息摘要；同时知识库用同样的方法对消息m进行摘要提取，得到第二消息摘要，判断第一消息摘要和第二消息摘要是否相同，相同则验证成功；不同则验证失败。

通过在调取数据时，需要进行验签，保证了存储在数据库中的数据的安全，避免数据泄露。

S3、将所述医疗数据以及所述用户请求中的产品信息，利用匹配模型进行匹配，得到所述医疗数据对应的疾病标签；

具体的，根据所述产品信息，获取到产品信息对应的高风险疾病清单或拦截清单，通过现有的疾病库对高风险疾病清单或拦截清单中的疾病进行细化，得到疾病标签，例如，高风险疾病清单中有“糖尿病”，通过细化后得到“1型糖尿病”、“2型糖尿病”和“妊娠糖尿病”等疾病标签，通过匹配模型来将细化后的疾病标签与医疗数据，利用匹配模型进行匹配，得到所述医疗数据对应的疾病标签。

具体的，由于前端发送用户请求前，用户根据需要预选择保险产品，后端通过用户请求可以获取到用户选择的产品信息，基于所述产品信息提取对应的疾病清单，每个产品信息都预先对应设置有高风险疾病清单或拦截清单，例如对于某一保险产品，其高风险疾病清单中有“糖尿病”和“癌症”等。通过将疾病清单与医学疾病编码库进行匹配，来对疾病清单进行细化，得到所述疾病清单对应的疾病标签，即将“糖尿病”进行细化，得到“1型糖尿病”、“2型糖尿病”和“妊娠糖尿病”；将“癌症”进行细化，得到具体的“肝癌”和“胃癌”等。从而得到疾病清单对应的大量的疾病标签。

通过利用匹配模型将医疗数据与所述疾病清单对应的疾病标签进行匹配，若匹配成功，则输出对应的所述疾病标签，具体的，通过将医疗数据中的疾病信息与所述疾病标签通过匹配模型来进行配对，若匹配不成功，即证明所述用户对应的医疗数据中没有疾病，或者所述医疗数据中的疾病不在其选择投保产品的高风险疾病清单中，则可直接将所述医疗数据作为正常数据输出，所以公司对于其投保产品的理赔风险很低。

所述深度语义匹配(DSSM，Deep Structured Semantic Models)是一种用于语义相似度计算的深度网络。

通过将疾病标签与医疗数据利用匹配模型进行匹配，以判断所述人员所患疾病是否在其选择产品的高风险清单内，实现风险的预筛选，筛选掉风险较小的疾病情况，并且得到医疗数据对应的疾病标签后便于后续将医疗数据输入模型进一步判断。

S4、将所述医疗数据以及所述医疗数据对应的所述疾病标签，输入校验模型进行校验，得到所述医疗数据对应的校验结果；

具体的，通过将所述医疗数据以及所述医疗数据对应的所述疾病标签，输入到所述校验模型中，得到所述医疗数据对应的校验分值；再通过将校验分值与预设数值进行判断，当所述校验分值大于等于预设数值时，确定所述医疗数据为异常数据，当所述校验分值小于所述预设数值时，确定所述医疗数据为正常数据。

具体的，首先将所述医疗数据输入预设的判断引擎来对医疗数据进行初筛，所述预设的判断引擎中预设有多条判断条件，从而来判断所述医疗数据能否通过所述判断引擎的处理，即能否通过其中预设的多条判断条件。

若所述医疗数据未通过所述判断引擎中预设的任一项判断条件时，则确定所述医疗数据为异常数据，并输出所述用户对应的保险产品为高风险。若所述医疗数据通过所述判断引擎中预设的所有判断条件时，则将所述医疗数据再输入下一步骤进行处理。

在本申请中，判断引擎采用的是Drools引擎，Drools引擎是一个基于CharlesForgy's的RETE算法的，易于访问企业策略、易于调整以及易于管理的开源业务规则引擎，符合业内标准，速度快、效率高。

在输入将医疗数据输入校验模型之前，还将医疗数据输入判断引擎进行初筛，实现对医疗数据的多级校验，提高校验准确率和校验效率。

具体的，热卡填充，又称就近补齐，对于一个包含空值的对象，在完整数据中找到一个与它最相似的对象，然后用这个相似对象的值进行填充。该方法利用了数据间的关系来进行空值估计。

将错误数据当做缺失值来进行处理，即对缺失数据和错误数据都进行热卡填充处理。

通过对缺失数据、错误数据和重复数据进行处理，以规范医疗数据，便于后续校验模型校验。

将所述校验分值与预设数值进行比较判断；

具体的，对于各个保险产品，都预设有对应的校验模型，根据用户请求中的产品信息，来获取对应的校验模型，在获取到所述校验模型后，将所述医疗数据以及对应的所述疾病标签输入所述校验模型进行校验，得到对应的校验分值。通过将校验分值与预设数值进行判断，当所述校验分值大于等于预设数值时，确定所述医疗数据为异常数据，即用户对应的医疗数据，对于其预选的产品而言是高风险的。当所述校验分值小于所述预设数值时，确定所述医疗数据为正常数据，即用户对应的医疗数据，对于其预选的产品而言是低风险的。

所述高风险和低风险是指，保险公司对于用户选择的保险产品，可能理赔用户的风险，高风险即在保险产品有效期内理赔的风险较高，低风险即在保险产品有效期内理赔的风险较低。

并且还可设置多组预设数值，来实现对风险进行分级。

所述校验模型根据大量的历史医疗数据进行训练，所述历史医疗数据包括：费用信息，疾病信息，就诊医院和就诊时间等。

并且，在将医疗数据输入校验模型之前，还对医疗数据中的类型，对医疗数据进行拆分和提取，例如将医疗数据拆分为费用信息、疾病信息、就诊信息和个人信息等后，并对拆分后的信息，进行提取得到费用信息、疾病信息和就诊信息等，从而将提取后的信息输入至校验模型中。

轻量梯度提升树(LightGBM，Light Gradient Boosting Machine)模型为使用基于学习算法的决策树，其相较于XGBOOST在模型的训练速度上进行了优化，最主要的是LightGBM使用了基于直方图的决策树算法，基本思想是先把连续的浮点特征值离散化成k个整数，同时构造一个宽度为k的直方图。在遍历数据的时候，根据离散化后的值作为索引在直方图中累积统计量，当遍历一次数据后，直方图累积了需要的统计量，当遍历一次数据后，直方图累积了需要的统计量，然后根据直方图的离散值，遍历寻找最优的分割点。

通过将医疗数据输入对应的校验模型进行处理，得到对应的校验分值，并与预设数值进行判断，进而得出医疗数据为正常数据或异常数据，通过利用校验模型提高了校验的准确率以及校验效率。

再进一步的，在所述将所述校验分值与预设数值进行判断之前，还包括：

将由所述多个问题组成的问卷并发送至客户端；

根据判断结果，对所述校验分值进行调整。

具体的，在对医疗数据进行数据清洗完毕后，还基于所述医疗数据中的数据类型，来对所述医疗数据进行拆分。例如将医疗数据拆分为费用信息、疾病信息、就诊信息和个人信息等子数据。

上述将医疗数据拆分为费用信息、疾病信息、就诊信息和个人信息等子数据，根据各子数据的内容，对应生成多个问题及答案，即每一子数据生成一个或多个问题及答案，例如对于疾病信息中生成如“您之前是否患有疾病”，若有紧接着“您之前患哪种疾病”，并将上述问题组成问卷发送给用户所在客户端，由于之前的流程中已将未患病的数据筛选出去，所以对于第一个问题的正确答案一定为“是”，对于第二问题的答案则还根据疾病信息来获取，且第二问题对应的选项可预设为疾病的分类，例如“癌症”、“心血管疾病”等，根据用户选择的答复与在疾病信息中提取的答案进行比对，若问题比对成功，则证明对应的用户，较为诚实，可在校验分值上减去预设分数；若有问题比对失败，则证明对应的用户，对其信息隐瞒等，可在其校验分值上加预设分数，从而实现对校验分值的调整。

通过还设置问卷调查的形式，根据客户的数据与客户针对问卷的答复进行判断，得到判断结果，并根据判断结果对校验分值进行调整，实现对用户的一个诚信判断或者是再确认，提高最终结果的准确性。

S5、输出所述校验结果。

具体的，输出所述校验结果，当所述医疗数据确定为异常数据时，输出校验结果为高风险，当所述医疗数据确定为正常数据时，输出校验结果为低风险。

并且，在输出校验结果的同时，还输出其对应的疾病标签。

需要强调的是，为了进一步保证数据的私密性和安全性，所述网络安全数据以及安全知识图谱所有数据还可以存储于一区块链的节点中。

本申请所指区块链是分布式数据存储、点对点传输、共识机制、加密算法等计算机技术的新型应用模式。区块链(Blockchain)，本质上是一个去中心化的数据库，是一串使用密码学方法相关联产生的数据块，每一个数据块中包含了一批次网络交易的信息，用于验证其信息的有效性(防伪)和生成下一个区块。区块链可以包括区块链底层平台、平台产品服务层以及应用服务层等。

本申请实施例可以基于人工智能技术对相关的数据进行获取和处理。其中，人工智能(Artificial Intelligence，AI)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能，感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用***。

人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互***、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、机器人技术、生物识别技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等几大方向。

本实施例还提供一种医疗数据的校验装置，如图2所示，是本申请医疗数据的校验装置的功能模块图。

本申请所述医疗数据的校验装置100可以安装于电子设备中。根据实现的功能，所述医疗数据的校验装置100可以包括接收模块101、获取模块102、匹配模块103、校验模块104和输出模块105。本申请所述模块也可以称之为单元，是指一种能够被电子设备处理器所执行，并且能够完成固定功能的一系列计算机程序段，其存储在电子设备的存储器中。

在本实施例中，关于各模块/单元的功能如下：

接收模块101，用于获取网络安全数据；

具体的，接收模块101接收用户在前端输入的数据后生成的用户请求，其中用户在前端输入姓名、住址、身份证号等个人信息数据，并且用户在前端还选择预购买的产品，所述产品包括保险产品等。并且在获取到用户的个人信息后，还将接收用户的同意授权信息，若未收到用户的同意授权信息，将不会对个人信息进行处理。

获取模块102，用于基于所述用户请求，获取对应的医疗数据；

具体的，获取模块102基于用户请求中的个人信息，调用数据库中个人信息对应的医疗数据。

进一步的，所述获取模块102包括请求发送子模块和数据调用子模块；

所述请求发送子模块，用于向预设知识库发送调用请求，所述调用请求携带验签令牌；

所述数据调用子模块，用于接收所述知识库返回的验签结果，并在验签结果为通过时，调用所述知识库中的医疗数据，所述验签结果为所述知识库根据所述验签令牌进行RSA非对称加密方式验证得到。

通过请求发送子模块和数据调用子模块配合在调取数据时，需要进行验签，保证了存储在数据库中的数据的安全，避免数据泄露。

匹配模块103，用于将所述医疗数据以及所述用户请求中的产品信息，利用匹配模型进行匹配，得到所述医疗数据对应的疾病标签；

具体的，匹配模块103根据所述产品信息，获取到产品信息对应的高风险疾病清单或拦截清单，通过现有的疾病库对高风险疾病清单或拦截清单中的疾病进行细化，得到疾病标签，例如，高风险疾病清单中有“糖尿病”，通过细化后得到“1型糖尿病”、“2型糖尿病”和“妊娠糖尿病”等疾病标签，通过匹配模型来将细化后的疾病标签与医疗数据，利用匹配模型进行匹配，得到所述医疗数据对应的疾病标签。

进一步的，所述匹配模块103包括清单提取子模块、细化子模块和标签匹配子模块；

所述清单提取子模块，用于获取所述用户请求中的产品信息，基于所述产品信息提取对应的疾病清单；

所述细化子模块，用于将所述疾病清单与医学疾病编码库进行匹配，得到所述疾病清单对应的疾病标签；

所述标签匹配子模块，用于利用所述匹配模型将所述医疗数据与所述疾病清单对应的疾病标签进行匹配，若匹配成功，则输出所述医疗数据对应的所述疾病标签，若匹配不成功，则将所述医疗数据确定为正常数据并输出，所述匹配模型为基于深度语义匹配模型训练得到的。

具体的由于前端发送用户请求前，用户根据需要预选择保险产品，所述清单提取子模块用于通过用户请求可以获取到用户选择的产品信息，基于所述产品信息提取对应的疾病清单，每个产品信息都预先对应设置有高风险疾病清单或拦截清单，例如对于某一保险产品，其高风险疾病清单中有“糖尿病”和“癌症”等。所述细化子模块通过将疾病清单与医学疾病编码库进行匹配，来对疾病清单进行细化，得到所述疾病清单对应的疾病标签，即将“糖尿病”进行细化，得到“1型糖尿病”、“2型糖尿病”和“妊娠糖尿病”；将“癌症”进行细化，得到具体的“肝癌”和“胃癌”等。从而得到疾病清单对应的大量的疾病标签。

所述标签匹配子模块通过利用匹配模型将医疗数据与所述疾病清单对应的疾病标签进行匹配，若匹配成功，则输出对应的所述疾病标签，具体的，通过将医疗数据中的疾病信息与所述疾病标签通过匹配模型来进行配对，若匹配不成功，即证明所述用户对应的医疗数据中没有疾病，或者所述医疗数据中的疾病不在其选择投保产品的高风险疾病清单中，则可直接将所述医疗数据作为正常数据输出，所以公司对于其投保产品的理赔风险很低。

通过清单提取子模块、细化子模块和标签匹配子模块的配合，将疾病标签与医疗数据利用匹配模型进行匹配，以判断所述人员所患疾病是否在其选择产品的高风险清单内，实现风险的预筛选，筛选掉风险较小的疾病情况，并且得到医疗数据对应的疾病标签后便于后续将医疗数据输入模型进一步判断。

校验模块104，用于将所述医疗数据以及所述医疗数据对应的所述疾病标签，输入校验模型进行校验，得到所述医疗数据对应的校验结果；

具体的，校验模块104通过将所述医疗数据以及所述医疗数据对应的所述疾病标签，输入到所述校验模型中，得到所述医疗数据对应的校验分值；再通过将校验分值与预设数值进行判断，当所述校验分值大于等于预设数值时，确定所述医疗数据为异常数据，当所述校验分值小于所述预设数值时，确定所述医疗数据为正常数据。

进一步的，所述医疗数据的校验装置100还包括引擎初筛模块和异常输出模块；

所述引擎初筛模块，用于将所述医疗数据以及所述医疗数据对应的所述疾病标签输入预设的判断引擎进行校验，其中，所述判断引擎预设有多条判断条件；

所述异常输出模块，用于将未通过所述判断引擎校验的所述医疗数据，确定为异常数据并输出。

具体的，所述引擎初筛模块将所述医疗数据输入预设的判断引擎来对医疗数据进行初筛，所述预设的判断引擎中预设有多条判断条件，从而来判断所述医疗数据能否通过所述判断引擎的处理，即能否通过其中预设的多条判断条件。

所述异常输出模块若所述医疗数据未通过所述判断引擎中预设的任一项判断条件时，则确定所述医疗数据为异常数据，并输出所述用户对应的保险产品为高风险。若所述医疗数据通过所述判断引擎中预设的所有判断条件时，则将所述医疗数据再输入下一步骤进行处理。

通引擎初筛模块和异常输出模块的配合，在输入将医疗数据输入校验模型之前，还将医疗数据输入判断引擎进行初筛，实现对医疗数据的多级校验，提高校验准确率和校验效率。

进一步的，所述医疗数据的校验装置100还包括预处理模块；

所述预处理模块，用于对所述医疗数据中的缺失数据和错误数据进行热卡填充处理，对所述医疗数据中的重复数据进行删除处理。

所述预处理模块通过对缺失数据、错误数据和重复数据进行处理，以规范医疗数据，便于后续校验模型校验。

进一步的，所述校验模块104包括模型获取子模块、模型校验子模块、判断子模块和结果输出子模块；

获取子模块，用于根据所述用户请求中的产品信息，获取对应的所述校验模型；

模型校验子模块，用于所述医疗数据以及所述医疗数据对应的所述疾病标签经所述校验模型校验处理，得到对应的校验分值，所述校验模型为基于轻量梯度提升树模型训练得到的；

判断子模块，用于将所述校验分值与预设数值进行比较判断；

结果输出子模块，用于当所述校验分值大于等于预设数值时，确定所述医疗数据为异常数据，当所述校验分值小于所述预设数值时，确定所述医疗数据为正常数据。

具体的，对于各个保险产品，都预设有对应的校验模型，获取子模块根据用户请求中的产品信息，来获取对应的校验模型，在获取到所述校验模型后，模型校验子模块将所述医疗数据以及对应的所述疾病标签输入所述校验模型进行校验，得到对应的校验分值。判断子模块通过将校验分值与预设数值进行判断，结果输出子模块当所述校验分值大于等于预设数值时，确定所述医疗数据为异常数据，即用户对应的医疗数据，对于其预选的产品而言是高风险的。当所述校验分值小于所述预设数值时，确定所述医疗数据为正常数据，即用户对应的医疗数据，对于其预选的产品而言是低风险的。

通过模型获取子模块、模型校验子模块、判断子模块和结果输出子模块的配合，将医疗数据输入对应的校验模型进行处理，得到对应的校验分值，并与预设数值进行判断，进而得出医疗数据为正常数据或异常数据，通过利用校验模型提高了校验的准确率以及校验效率。

再进一步的，所述校验模块104还包括拆分子模块、问题生成子模块、问卷发送子模块、答复判断子模块和微调子模块；

拆分子模块，用于基于所述医疗数据中的数据类型，对所述医疗数据进行拆分；

问题生成子模块，用于根据将所述医疗数据拆分后得到的多种类型的子数据，对应生成多个问题及答案；

问卷发送子模块，用于将由所述多个问题组成的问卷并发送至客户端；

答复判断子模块，用于接收所述客户端发送的所述问卷对应的答复，并将所述答复与对应的所述答案进行比较判断；

微调子模块，用于根据判断结果，对所述校验分值进行调整。

具体的，拆分子模块在对医疗数据进行数据清洗完毕后，还基于所述医疗数据中的数据类型，来对所述医疗数据进行拆分。例如将医疗数据拆分为费用信息、疾病信息、就诊信息和个人信息等子数据。

上述将医疗数据拆分为费用信息、疾病信息、就诊信息和个人信息等子数据，问题生成子模块根据各子数据的内容，对应生成多个问题及答案，即每一子数据生成一个或多个问题及答案，例如对于疾病信息中生成如“您之前是否患有疾病”，若有紧接着“您之前患哪种疾病”，问卷发送子模块将上述问题组成问卷发送给用户所在客户端，由于之前的流程中已将未患病的数据筛选出去，所以对于第一个问题的正确答案一定为“是”，对于第二问题的答案则还根据疾病信息来获取，且第二问题对应的选项可预设为疾病的分类，例如“癌症”、“心血管疾病”等，答复判断子模块根据用户选择的答复与在疾病信息中提取的答案进行比对，微调子模块若问题比对成功，则证明对应的用户，较为诚实，可在校验分值上减去预设分数；若有问题比对失败，则证明对应的用户，对其信息隐瞒等，可在其校验分值上加预设分数，从而实现对校验分值的调整。

通过拆分子模块、问题生成子模块、问卷发送子模块、答复判断子模块和微调子模块的配合，设置问卷调查的形式，根据客户的数据与客户针对问卷的答复进行判断，得到判断结果，并根据判断结果对校验分值进行调整，实现对用户的一个诚信判断或者是再确认，提高最终结果的准确性。

输出模块105，用于输出所述校验结果。

具体的，输出模块105输出所述校验结果，当所述医疗数据确定为异常数据时，输出校验结果为高风险，当所述医疗数据确定为正常数据时，输出校验结果为低风险。

通过采用上述装置，所述医疗数据的校验装置100通过接收模块101、获取模块102、匹配模块103、校验模块104和输出模块105的配合使用，接收用户请求，所述用户请求中包含有用户个人信息及预选择的产品信息，基于所述用户请求中的用户个人信息，从数据库中获取对应的医疗数据，根据医疗数据中的信息与所述用户请求中的产品信息利用匹配模型进行匹配，以得到所述医疗数据对应的疾病标签，来明确与用户存在的疾病与产品是否有关联，再将所述医疗数据以及所述医疗数据对应的所述疾病标签，来输入所述校验模型中进行校验，得到并输出所述医疗数据对应的校验分数，通过先确定用户对应的医疗数据中的疾病标签，并将所述医疗数据以及对应的疾病标签输入至校验模型处理，从而提高了医疗数据对应校验结果的准确率，且提高了处理效率。

本申请实施例还提供一种计算机设备。具体请参阅图3，图3为本实施例计算机设备基本结构框图。

所述计算机设备4包括通过***总线相互通信连接存储器41、处理器42、网络接口43。需要指出的是，图中仅示出了具有组件41-43的计算机设备4，但是应理解的是，并不要求实施所有示出的组件，可以替代的实施更多或者更少的组件。其中，本技术领域技术人员可以理解，这里的计算机设备是一种能够按照事先设定或存储的指令，自动进行数值计算和/或信息处理的设备，其硬件包括但不限于微处理器、专用集成电路(ApplicationSpecific Integrated Circuit，ASIC)、可编程门阵列(Field－Programmable GateArray，FPGA)、数字处理器(Digital Signal Processor，DSP)、嵌入式设备等。

所述计算机设备可以是桌上型计算机、笔记本、掌上电脑及云端服务器等计算设备。所述计算机设备可以与用户通过键盘、鼠标、遥控器、触摸板或声控设备等方式进行人机交互。

所述存储器41至少包括一种类型的可读存储介质，所述可读存储介质包括闪存、硬盘、多媒体卡、卡型存储器(例如，SD或DX存储器等)、随机访问存储器(RAM)、静态随机访问存储器(SRAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、可编程只读存储器(PROM)、磁性存储器、磁盘、光盘等。在一些实施例中，所述存储器41可以是所述计算机设备4的内部存储单元，例如该计算机设备4的硬盘或内存。在另一些实施例中，所述存储器41也可以是所述计算机设备4的外部存储设备，例如该计算机设备4上配备的插接式硬盘，智能存储卡(Smart Media Card,SMC)，安全数字(Secure Digital,SD)卡，闪存卡(FlashCard)等。当然，所述存储器41还可以既包括所述计算机设备4的内部存储单元也包括其外部存储设备。本实施例中，所述存储器41通常用于存储安装于所述计算机设备4的操作***和各类应用软件，例如医疗数据的校验方法的计算机可读指令等。此外，所述存储器41还可以用于暂时地存储已经输出或者将要输出的各类数据。

所述处理器42在一些实施例中可以是中央处理器(Central Processing Unit，CPU)、控制器、微控制器、微处理器、或其他数据处理芯片。该处理器42通常用于控制所述计算机设备4的总体操作。本实施例中，所述处理器42用于运行所述存储器41中存储的计算机可读指令或者处理数据，例如运行所述医疗数据的校验方法的计算机可读指令。

所述网络接口43可包括无线网络接口或有线网络接口，该网络接口43通常用于在所述计算机设备4与其他电子设备之间建立通信连接。

本实施例通过处理器执行存储在存储器的计算机可读指令时实现如上述实施例医疗数据的校验方法的步骤，通过接收用户请求，所述用户请求中包含有用户个人信息及预选择的产品信息，基于所述用户请求中的用户个人信息，从数据库中获取对应的医疗数据，根据医疗数据中的信息与所述用户请求中的产品信息利用匹配模型进行匹配，以得到所述医疗数据对应的疾病标签，来明确与用户存在的疾病与产品是否有关联，再将所述医疗数据以及所述医疗数据对应的所述疾病标签，来输入所述校验模型中进行校验，得到并输出所述医疗数据对应的校验分数，通过先确定用户对应的医疗数据中的疾病标签，并将所述医疗数据以及对应的疾病标签输入至校验模型处理，从而提高了医疗数据对应校验结果的准确率，且提高了处理效率。

本申请实施例还提供一种计算机可读存储介质，所述计算机可读存储介质存储有计算机可读指令，所述计算机可读指令可被至少一个处理器执行，以使所述至少一个处理器执行如上述的医疗数据的校验方法的步骤，通过接收用户请求，所述用户请求中包含有用户个人信息及预选择的产品信息，基于所述用户请求中的用户个人信息，从数据库中获取对应的医疗数据，根据医疗数据中的信息与所述用户请求中的产品信息利用匹配模型进行匹配，以得到所述医疗数据对应的疾病标签，来明确与用户存在的疾病与产品是否有关联，再将所述医疗数据以及所述医疗数据对应的所述疾病标签，来输入所述校验模型中进行校验，得到并输出所述医疗数据对应的校验分数，通过先确定用户对应的医疗数据中的疾病标签，并将所述医疗数据以及对应的疾病标签输入至校验模型处理，从而提高了医疗数据对应校验结果的准确率，且提高了处理效率。

通过以上的实施方式的描述，本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现，当然也可以通过硬件，但很多情况下前者是更佳的实施方式。基于这样的理解，本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中，包括若干指令用以使得一台终端设备(可以是手机，计算机，服务器，空调器，或者网络设备等)执行本申请各个实施例所述的方法。

本申请上述实施例的医疗数据的校验装置、计算机设备、计算机可读存储介质具有与上述实施例的医疗数据的校验方法相同的技术效果，在此不作展开。

显然，以上所描述的实施例仅仅是本申请一部分实施例，而不是全部的实施例，附图中给出了本申请的较佳实施例，但并不限制本申请的专利范围。本申请可以以许多不同的形式来实现，相反地，提供这些实施例的目的是使对本申请的公开内容的理解更加透彻全面。尽管参照前述实施例对本申请进行了详细的说明，对于本领域的技术人员来而言，其依然可以对前述各具体实施方式所记载的技术方案进行修改，或者对其中部分技术特征进行等效替换。凡是利用本申请说明书及附图内容所做的等效结构，直接或间接运用在其他相关的技术领域，均同理在本申请专利保护范围之内。

Claims

1.一种医疗数据的校验方法，其特征在于，所述方法包括：

接收用户请求；

基于所述用户请求，获取对应的医疗数据；

输出所述校验结果。

2.根据权利要求1所述的医疗数据的校验方法，其特征在于，所述获取对应的医疗数据包括：

向预设知识库发送调用请求，所述调用请求携带验签令牌；

3.根据权利要求1所述的医疗数据的校验方法，其特征在于，所述将所述医疗数据以及所述用户请求中的产品信息，利用匹配模型进行匹配，得到所述医疗数据对应的疾病标签包括：

4.根据权利要求1所述的医疗数据的校验方法，其特征在于，在所述将所述医疗数据以及所述医疗数据对应的所述疾病标签，输入校验模型进行校验之前，还包括：

5.根据权利要求1所述的医疗数据的校验方法，其特征在于，在所述将所述医疗数据以及所述医疗数据对应的所述疾病标签，输入校验模型进行校验之前，还包括：

6.根据权利要求1至5中任一项所述的医疗数据的校验方法，其特征在于，所述将所述医疗数据以及所述医疗数据对应的所述疾病标签，输入校验模型进行校验，得到所述医疗数据对应的校验结果包括：

将所述校验分值与预设数值进行比较判断；

7.根据权利要求6所述的医疗数据的校验方法，其特征在于，在所述将所述校验分值与预设数值进行判断之前，还包括：

将由所述多个问题组成的问卷并发送至客户端；

根据判断结果，对所述校验分值进行调整。

8.一种医疗数据的校验装置，其特征在于，所述装置包括：

接收模块，用于接收用户请求；

获取模块，用于基于所述用户请求，获取对应的医疗数据；

输出模块，用于输出所述校验结果。

9.一种计算机设备，其特征在于，所述计算机设备包括：

至少一个处理器；以及，

与所述至少一个处理器通信连接的存储器；其中，

所述存储器存储有计算机可读指令，所述处理器执行所述计算机可读指令时实现如权利要求1至7中任一所述的医疗数据的校验方法。

10.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质上存储有计算机可读指令，所述计算机可读指令被处理器执行时实现如权利要求1至7中任一所述的医疗数据的校验方法。