CN109492095A

CN109492095A - 理赔数据处理方法、装置、计算机设备及存储介质

Info

Publication number: CN109492095A
Application number: CN201811201175.3A
Authority: CN
Inventors: 何晨巍; 龙科家; 孙剑立
Original assignee: Ping An Health Insurance Company of China Ltd
Current assignee: Ping An Health Insurance Company of China Ltd
Priority date: 2018-10-16
Filing date: 2018-10-16
Publication date: 2019-03-19

Abstract

本发明公开了一种理赔数据处理方法、装置、计算机设备及存储介质，所述方法包括：识别理赔案件文档，获取所述理赔案件文档中的理赔信息；在预设的神经网络模型中输入所述理赔信息，根据所述神经网络模型对输入的所述理赔信息进行归类，并获取所述神经网络模型输出的归类后的所述理赔信息的预设归类值；根据归类后的所述理赔信息的预设归类值评估所述理赔案件是否存在理赔风险；在理赔案件不存在理赔风险时，输出所述理赔案件对应的理赔结果。本发明通过对理赔信息进行大数据处理，从而实现全程无人工操作的自动理赔，提高了理赔效率，缩短了理赔时间验，为客户提供了极速理赔体验。

Description

理赔数据处理方法、装置、计算机设备及存储介质

技术领域

本发明涉及大数据处理领域，具体涉及一种理赔数据处理方法、装置、计算机设备及存储介质。

背景技术

目前，随着保险业务量的增多，保险理赔的需求也随之增多。在现有技术中，虽然一些保险公司已引入了自动理赔***，但该自动理赔***还是需要客户自行填写理赔资料，该方案的不足之处在于：由于理赔案件的理赔资料是由客户自助填写或提供的，由于客户不具有保险行业的专业知识，导致很多理赔案件的理赔资料填写有误，而无法通过自动理赔***的自动审核，并且，无法通过审核的依旧需要进行人工审核，如此，会导致理赔效率低，理赔速度慢。因此，当前需要一种可以进一步提高理赔处理效率的自动理赔方案。

发明内容

本发明实施例提供一种理赔数据处理方法、装置、计算机设备及存储介质，本发明可以通过对理赔信息进行大数据处理，从而实现全程无人工操作的自动理赔，提高了理赔效率，缩短了理赔时间验，为客户提供了极速理赔体验。

一种理赔数据处理方法，包括：

识别理赔案件文档，获取所述理赔案件文档中的理赔信息；

在预设的神经网络模型中输入所述理赔信息，根据所述神经网络模型对输入的所述理赔信息进行归类，并获取所述神经网络模型输出的归类后的所述理赔信息的预设归类值；

根据归类后的所述理赔信息的预设归类值评估所述理赔案件是否存在理赔风险；

在理赔案件不存在理赔风险时，输出所述理赔案件对应的理赔结果。

一种理赔数据处理装置，包括：

识别模块，用于识别理赔案件文档，获取所述理赔案件文档中的理赔信息；

归类模块，用于在预设的神经网络模型中输入所述理赔信息，根据所述神经网络模型对输入的所述理赔信息进行归类，并获取所述神经网络模型输出的归类后的所述理赔信息的预设归类值；

评估模块，用于根据归类后的所述理赔信息的预设归类值评估所述理赔案件是否存在理赔风险；

输出模块，用于在理赔案件不存在理赔风险时，输出所述理赔案件对应的理赔结果。

一种计算机设备，包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序，所述处理器执行所述计算机程序时实现上述理赔数据处理方法的步骤。

一种计算机可读存储介质，所述计算机可读存储介质存储有计算机程序，所述计算机程序被处理器执行时实现上述理赔数据处理方法的步骤。

本发明提供的理赔数据处理方法、装置、计算机设备及存储介质，通过光学字符识别模型对所述理赔案件文档进行自动识别，获取理赔信息；并根据预设的神经网络模型对所述理赔信息进行归类，同时在根据归类之后的理赔信息自动评估所述理赔案件不存在理赔风险之后，进行自动理赔。本提案可以通过对理赔信息进行大数据处理，从而实现全程无人工操作的自动理赔，提高了理赔效率，缩短了理赔时间验，为客户提供了极速理赔体验。

附图说明

为了更清楚地说明本发明实施例的技术方案，下面将对本发明实施例的描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1是本发明一实施例中理赔数据处理方法的应用环境示意图；

图2是本发明一实施例中理赔数据处理方法的流程图；

图3是本发明一实施例中理赔数据处理方法的步骤S10的流程图；

图4是本发明另一实施例中理赔数据处理方法的步骤S10的流程图；

图5是本发明一实施例中理赔数据处理方法的步骤S20的流程图；

图6是本发明一实施例中理赔数据处理方法的步骤S202的流程图；

图7是本发明一实施例中理赔数据处理装置的原理框图；

图8是本发明一实施例中理赔数据处理装置的识别模块的原理框图；

图9是本发明另一实施例中理赔数据处理装置的原理框图；

图10是本发明一实施例中计算机设备的示意图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

本发明提供的理赔数据处理方法，可应用在如图1的应用环境中，其中，客户端(计算机设备)通过网络与服务器进行通信。其中，客户端(计算机设备)包括但不限于为各种个人计算机、笔记本电脑、智能手机、平板电脑、摄像头和便携式可穿戴设备。服务器可以用独立的服务器或者是多个服务器组成的服务器集群来实现。

在一实施例中，如图2所示，提供一种理赔数据处理方法，以该方法应用在图1中的服务器为例进行说明，包括以下步骤：

S10、识别理赔案件文档，获取所述理赔案件文档中的理赔信息。

也即，在本实施例中，首先需要获取需要进行理赔的理赔案件的文档，进而根据所述理赔案件文档获取其中的理赔信息，从而根据所述理赔信息自动计算理赔结果，进而实现自动理赔。

在一实施例中，如图3所示，所述步骤S10包括以下步骤：

S101，接收识别指令，根据所述识别指令中包含的案件信息调取理赔案件文档。

其中，所述识别指令是指用户在客户端通过点击或滑动等触发方式触发预设按钮之后发送至服务器的识别指令。由于客户端在点击预设按钮发送识别指令之前，就必然已经确认需要进行自动理赔的理赔案件并对其进行选择，因此，所述识别指令中包含了所述理赔案件的案件信息，所述案件信息中必然包括案件名称、案件唯一编码、案件类型等用于区分该理赔案件与其他理赔案件的信息。

而在服务器的数据库中，在建立该理赔案件时，已经存储有该理赔案件的相关文档(也即理赔案件文档)，所述理赔案件文档包括该理赔案件进行理赔时必须要提交的理赔材料的扫描件等，比如，一个意外伤害保险理赔案件中，需要提供的理赔案件文档包括医学诊断证明、有关部门出具的意外伤害事故证明、医疗费原始***及处方、本人身份证或户籍证明等。

在一实施例中，在所述步骤S101之前，理赔案件当事人(接收理赔的用户)或理赔服务管理员(管理该理赔案件的管理员)已将所述理赔案件文档上传(可以在扫描所述理赔案件文档之后将扫描件上传，或在自助服务设备上提交理赔案件文档纸件的同时扫描该纸件并将扫描件上传)至所述服务器的数据库中，并将所述理赔案件文档与所述案件信息关联存储。

服务器在接收到所述识别指令之后，根据所述识别指令中包含的案件信息(比如案件名称或案件唯一编码)调取数据库中与所述案件信息对应的理赔案件文档，并在步骤S102中进行识别。

S102，通过光学字符识别模型对所述理赔案件文档进行识别，获取所述理赔案件文档中的理赔信息。

也即，在本实施例中，可以通过光学字符识别(Optical Character Recognition，简称为OCR)模型对所述理赔案件文档进行识别，以提取所述理赔案件文档中的具体的理赔信息，比如，针对理赔案件文档中的医疗费原始***，可以读取医疗费原始***中的医疗项目及该项目对应的数字(代表费用)，并将该医疗项目及对应的数字自动关联存储。又比如，还可以读取病人的病史，并获取该病史对应的时间，并将所述病史与时间关联存储。在本实施例中，通过光学字符识别模型对理赔案件文档进行识别，时效更快、差错率更低、数据颗粒度更好；且该识别过程无需人工进行操作，不会产生人工操作需要停歇的时间间断，因此识别速度可保持一致，且同时可以对多个理赔案件文档进行识别，识别效率更高。

可理解地，在一实施例中，所述步骤S102之前还包括：获取待识别文档，并根据所述待识别文档训练生成光学字符识别模型。

所述待识别文档为理赔案件进行理赔时必须要提交的理赔材料的扫描件；比如，在训练所述光学字符识别模型识别医疗费原始***时，可以使用2000张同类型的医疗费原始***作为待训练文档，在每一次根据一张医疗费原始***进行学习之后，均需要根据学习内容校正结果，在经过反复学习之后，生成可以识别医疗费原始***的光学字符识别模型。进一步地，在该学习过程中，还可以增加所述光学字符识别模型对***等的真伪区分的训练，该训练过程可以通过学习文档的格式、出具文档单位的公章的具体形状及构造来进行。

在一实施例中，如图4所示，所述步骤S102之前，也即通过光学字符识别模型对所述理赔案件文档进行识别，获取所述理赔案件文档中的理赔信息之前，还包括以下步骤：

S103，提取所述理赔案件文档中的敏感关键词，获取所述敏感关键词在所述理赔案件文档中所处的敏感位置以及所述敏感位置上包含所述敏感关键词的敏感内容，对所述敏感位置上的所述敏感内容进行删除处理或马赛克处理。

在该实施例中，由于理赔案件文档的识别过程中，可能会存在将理赔案件文档外发进行识别的情况(比如，该步骤S102的识别过程是调用外部接口连接的识别模块进行识别时)，因此，在将所述理赔案件文档进行外发时，需要对其先进行脱敏处理，此时首先将所述理赔案件文档中的敏感内容去除(比如理赔人身份信息等)，再将脱敏之后的理赔案件文档进行识别即可。

因此，在本实施例中，首先需要提取所述理赔案件文档中的敏感关键词，所述敏感关键词可以预先设定，比如，将所述敏感关键词设定为姓名、身份证号，此时，所述理赔案件文档中的所述敏感位置上的敏感内容可能为下述包含所述敏感关键词“姓名”和“身份证号”的下述内容：“姓名：王小二；身份证号：XX…XX”。且所述敏感位置即为所述敏感内容对应的位置。

所述删除处理与马赛克处理均为脱敏处理方式中的一种，本发明中的脱敏处理方式亦可不限定于上述，只要能达到可以将所述理赔案件文档中的敏感内容去除的效果即可。

S20，在预设的神经网络模型中输入所述理赔信息，根据所述神经网络模型对输入的所述理赔信息进行归类，并获取所述神经网络模型输出的归类后的所述理赔信息的预设归类值。

其中，所述理赔信息为上述步骤S10中获取的理赔案件文档中的理赔信息，所述预设归类值是指该理赔信息在进行归类之后的指定值；比如，可以将医疗费原始***中的“检查费”设定为指定值，但是在有一些医疗费原始***中会将“检查费”写为“检察费”或“检验费”等，此时，识别出来的理赔信息(“检察费”或“检验费”)与预设归类值不同，可以通过所述神经网络模型将其统一归类为“检查费”这个指定值(也即上述预设归类值)。

进行归类之后，可以直接将所述理赔信息标注为预设归类值或者对应修改为预设归类值，以便于在理赔案件文档中提取所述理赔信息之后，可以方便快捷地对应存储该理赔信息。

在一实施例中，如图5所示，所述步骤S20之前，也即所述根据预设的神经网络模型对所述理赔信息进行归类之前，还包括：

S201，获取归类训练样本；所述归类训练样本为历史理赔案件文档中的历史理赔信息；

也即，将上述经过脱敏之后的理赔案件文档的理赔信息作为归类训练样本。

S202，获取通过包含初始参数的神经网络模型对所述归类训练样本进行归类时的整体偏差度，所述整体偏差度为归类之后得到的理赔信息值与预设归类值之间的整体偏差程度。

S203，判断所述整体偏差度是否大于预设的第一阈值；所述第一阈值可以根据需求进行设定。

S204，若所述整体偏差度大于所述第一阈值，则对所述神经网络模型的初始参数进行调整，并返回执行所述计算使用神经网络模型对所述归类训练样本进行归类时的整体偏差度，直至所述整体偏差度小于或等于所述第一阈值；

S205，若所述整体偏差度小于或等于所述第一阈值，则提示所述神经网络模型训练完成。此时，所述神经网络模型训练完成。确定出来的神经网络模型经过了大量的样本训练，且其整体偏差度保持在一个较小的范围(小于或等于第一阈值)内，使用该神经网络模型对与预设归类值实质相同但表现形式不符的理赔信息进行处理，即可得到预设归类值。

在一实施例中，如图6所示，所述步骤S202中，所述获取通过包含初始参数的神经网络模型对所述归类训练样本进行归类时的整体偏差度，包括以下步骤：

S2021，从所述归类训练样本中选取一个尚未被选取进行归类的归类训练样本作为当前样本。样本的选取顺序可以是随机的，也可以是按照预设的顺序进行的，例如，预先可以对所述归类训练样本进行标号，然后按照标号从小到大的顺序依次进行选取。

S2022，使用所述神经网络模型对所述当前样本中的理赔信息进行处理，得到所述当前样本归类之后的理赔信息值。也即，对于第一个当前样本，是使用包含初始参数的神经网络模型对其中的理赔信息进行处理，得到第一个当前样本归类之后的理赔信息值。但对于后续的其他当前样本，就是用步骤S204中调整过所述初始参数之后的所述神经网络模型进行处理，对其中的理赔信息进行处理，得到第该样本归类之后的理赔信息值。

S2023，根据预设的偏差判定规则确定所述当前样本归类之后的理赔信息值与所述预设归类值之间的样本偏差度。所述偏差判定规则中根据字与词之间的语义关联关系等设定了不同的理赔信息值与所述预设归类值之间的偏差比例。本实施例中，根据预设的偏差判定规则获取所述当前样本归类之后的理赔信息值与所述预设归类值之间的所述偏差比例，将所述偏差比例记录为样本偏差度即可。

S2024，判断所述归类训练样本中是否存在尚未被选取进行归类的归类训练样本。

S2025，若存在尚未被选取进行归类的归类训练样本，则继续从所述归类训练样本中选取一个尚未被选取进行归类的归类训练样本作为当前样本；也即，回执行步骤S2021以及后续步骤。

S2026，若不存在尚未被选取进行归类的归类训练样本，将被选取进行归类的所有归类训练样本的样本偏差度之和确定为整体偏差度。

在一实施例中，所述步骤S20之后还包括：

获取理赔数据列表中与归类后的所述理赔信息对应的属性值，并将归类之后的所述理赔信息存储至理赔数据列表中与所述属性值对应的位置。

本实施例中，在对所有理赔信息进行归类之后，也即使得各理赔信息的表述变得标准统一之后，可以将其对应***理赔数据列表中，所述理赔数据列表中包含各理赔信息及其属性；所述属性包括医院名称、金额、检查或医药项目等内容；在获取所述理赔信息之后，***会根据获取到的理赔信息对应的理赔案件文档中的所有理赔信息(比如若该理赔信息对应有金额，应该预判对应于金额的为检查或医药项目；若检测到数字且后面带有“元”等字样，可以预判为检查或医药项目的费用)及文档格式等预判该理赔信息的属性，并在该步骤中，在理赔数据列表中找到与预判的所述属性匹配的属性值；此后，将所述理赔信息对应***至所述理赔数据列表中与所述属性值对应的位置。

S30，根据归类后的所述理赔信息的预设归类值评估所述理赔案件是否存在理赔风险。

其中，理赔风险可以通过归类之后的所述理赔信息的预设归类值进行评估，比如，通过与该理赔案件的案件类型(案件类型为所述理赔信息的预设归类值中的一个，在步骤S10中即获取理赔案件的案件类型，比如为意外险、重疾险中的某种病情等案件类型)对应的理赔金额最高额度进行评估，在根据上述理赔信息计算得出的理赔金额超过预设的理赔金额最高额度时，评估得出所述理赔案件存在理赔风险。

理赔风险也可以通过与该理赔案件的案件类型对应的理赔项目及费用列表(理赔项目及费用列表也为所述理赔信息的预设归类值，具体地，所述理赔项目及费用列表包括该案件类型对应的理赔项目及该理赔项目的最高费用)进行评估，在根据上述理赔信息中的理赔项目比所述理赔项目及费用列表中的理赔项目多、或多出的理赔项目超过预设阈值、多出的理赔项目对应的费用总额超过预设的超标费用值、某一个或多个理赔项目的费用超过其正常费用范围等情况中的一项或多项出现时，评估得出所述理赔案件存在理赔风险。

在评估得出所述理赔案件评存在理赔风险时，提示理赔风险及存在理赔风险的原因；可以将该案件转入预设的业务员进行人工审核。

S40，在理赔案件不存在理赔风险时，输出所述理赔案件对应的理赔结果。

可理解地，在评估理赔风险的过程中，若一切理赔信息均与预判的该案件类型的同类理赔案件的理赔金额相符，此时，评估结果为该理赔案件正常，可以进入自动理赔流程，输出该理赔案件对应的理赔结果。所述理赔结果包括根据所述理赔信息计算的理赔金额并将所述理赔金额自动通过预设的结算方支付给理赔案件当事人；实现了全程无人工操作的自动理赔，大大优化了理赔效率。

本发明提供的理赔数据处理方法，通过光学字符识别模型对所述理赔案件文档进行自动识别，获取理赔信息；并根据预设的神经网络模型对所述理赔信息进行归类，同时在根据归类之后的理赔信息自动评估所述理赔案件不存在理赔风险之后，进行自动理赔。本提案可以通过对理赔信息进行大数据处理，从而实现全程无人工操作的自动理赔，提高了理赔效率，缩短了理赔时间验，为客户提供了极速理赔体验。

在一实施例中，如图7所示，提供一种理赔数据处理装置，该理赔数据处理装置与上述实施例中理赔数据处理方法一一对应。所述理赔数据处理装置包括：

识别模块11，用于识别理赔案件文档，获取所述理赔案件文档中的理赔信息；

归类模块12，用于在预设的神经网络模型中输入所述理赔信息，根据所述神经网络模型对输入的所述理赔信息进行归类，并获取所述神经网络模型输出的归类后的所述理赔信息的预设归类值；

评估模块13，用于根据归类后的所述理赔信息的预设归类值评估所述理赔案件是否存在理赔风险；

输出模块14，用于在理赔案件不存在理赔风险时，输出所述理赔案件对应的理赔结果。

本发明提供的理赔数据处理装置，通过光学字符识别模型对所述理赔案件文档进行自动识别，获取理赔信息；并根据预设的神经网络模型对所述理赔信息进行归类，同时在根据归类之后的理赔信息自动评估所述理赔案件不存在理赔风险之后，进行自动理赔。本提案可以通过对理赔信息进行大数据处理，从而实现全程无人工操作的自动理赔，提高了理赔效率，缩短了理赔时间验，为客户提供了极速理赔体验。

在一实施例中，如图8所示，所述识别模块11包括：

调取子模块111，用于接收识别指令，根据所述识别指令中包含的案件信息调取理赔案件文档；

获取子模块112，用于通过光学字符识别模型对所述理赔案件文档进行识别，获取所述理赔案件文档中的理赔信息。

在一实施例中，所述识别模块11还包括：

脱敏模块，用于提取所述理赔案件文档中的敏感关键词，获取所述敏感关键词在所述理赔案件文档中所处的敏感位置以及所述敏感位置上包含所述敏感关键词的敏感内容，对所述敏感位置上的所述敏感内容进行删除处理或马赛克处理。

在一实施例中，如图9所示，所述装置还包括：

样本获取模块15，用于获取归类训练样本；所述归类训练样本为历史理赔案件文档中的历史理赔信息；

偏差获取模块16，用于获取通过包含初始参数的神经网络模型对所述归类训练样本进行归类时的整体偏差度，所述整体偏差度为归类之后得到的理赔信息值与预设归类值之间的整体偏差程度；

判断模块17，用于判断所述整体偏差度是否大于预设的第一阈值；

调整模块18，用于在所述整体偏差度大于所述第一阈值时，对所述神经网络模型的初始参数进行调整，并返回执行所述计算使用神经网络模型对所述归类训练样本进行归类时的整体偏差度，直至所述整体偏差度小于或等于所述第一阈值；

提示模块19，用于在所述整体偏差度小于或等于所述第一阈值时，提示所述神经网络模型训练完成。

在一实施例中，所述偏差获取模块16还包括：

选取子模块，用于从所述归类训练样本中选取一个尚未被选取进行归类的归类训练样本作为当前样本；

处理子模块，用于使用所述神经网络模型对所述当前样本中的理赔信息进行处理，得到所述当前样本归类之后的理赔信息值；

设定子模块，用于根据预设的偏差判定规则确定所述当前样本归类之后的理赔信息值与所述预设归类值之间的样本偏差度；

判断子模块，用于判断所述保险理赔样本库中是否存在尚未被选取进行归类的归类训练样本；

继续选取子模块，用于在存在尚未被选取进行归类的归类训练样本时，继续从所述归类训练样本中选取一个尚未被选取进行归类的归类训练样本作为当前样本；

确定子模块，用于在不存在尚未被选取进行归类的归类训练样本时，将被选取进行归类的所有归类训练样本的样本偏差度之和确定为整体偏差度。

关于理赔数据处理装置的具体限定可以参见上文中对于理赔数据处理方法的限定，在此不再赘述。上述理赔数据处理装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中，也可以以软件形式存储于计算机设备中的存储器中，以便于处理器调用执行以上各个模块对应的操作。

在一个实施例中，提供了一种计算机设备，该计算机设备可以是服务器，其内部结构图可以如图10所示。该计算机设备包括通过***总线连接的处理器、存储器、网络接口和数据库。其中，该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作***、计算机程序和数据库。该内存储器为非易失性存储介质中的操作***和计算机程序的运行提供环境。。该计算机程序被处理器执行时以实现一种理赔数据处理方法。

在一个实施例中，提供了一种计算机设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，处理器执行计算机程序时实现以下步骤：

识别理赔案件文档，获取所述理赔案件文档中的理赔信息；在预设的神经网络模型中输入所述理赔信息，根据所述神经网络模型对输入的所述理赔信息进行归类，并获取所述神经网络模型输出的归类后的所述理赔信息的预设归类值；根据归类后的所述理赔信息的预设归类值评估所述理赔案件是否存在理赔风险；在理赔案件不存在理赔风险时，输出所述理赔案件对应的理赔结果。

本发明提供的计算机设备，通过光学字符识别模型对所述理赔案件文档进行自动识别，获取理赔信息；并根据预设的神经网络模型对所述理赔信息进行归类，同时在根据归类之后的理赔信息自动评估所述理赔案件不存在理赔风险之后，进行自动理赔。本提案可以通过对理赔信息进行大数据处理，从而实现全程无人工操作的自动理赔，提高了理赔效率，缩短了理赔时间验，为客户提供了极速理赔体验。

在一个实施例中，提供了一种计算机可读存储介质，其上存储有计算机程序，计算机程序被处理器执行时实现以下步骤：

本发明提供的存储介质，通过光学字符识别模型对所述理赔案件文档进行自动识别，获取理赔信息；并根据预设的神经网络模型对所述理赔信息进行归类，同时在根据归类之后的理赔信息自动评估所述理赔案件不存在理赔风险之后，进行自动理赔。本提案可以通过对理赔信息进行大数据处理，从而实现全程无人工操作的自动理赔，提高了理赔效率，缩短了理赔时间验，为客户提供了极速理赔体验。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程，是可以通过计算机程序来指令相关的硬件来完成，所述的计算机程序可存储于一非易失性计算机可读取存储介质中，该计算机程序在执行时，可包括如上述各方法的实施例的流程。其中，本发明所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用，均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限，RAM以多种形式可得，诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路DRAM(SLDRAM)、存储器总线直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。

所属领域的技术人员可以清楚地了解到，为了描述的方便和简洁，仅以上述各功能单元或模块的划分进行举例说明，实际应用中，可以根据需要而将上述功能分配由不同的功能单元或模块完成，即将所述装置的内部结构划分成不同的功能单元或模块，以完成以上描述的全部或者部分功能。

以上所述实施例仅用以说明本发明的技术方案，而非对其限制；尽管参照前述实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围，均应包含在本发明的保护范围之内。

Claims

1.一种理赔数据处理方法，其特征在于，包括：

识别理赔案件文档，获取所述理赔案件文档中的理赔信息；

2.如权利要求1所述的理赔数据处理方法，其特征在于，所述识别理赔案件文档，获取所述理赔案件文档中的理赔信息，包括：

接收识别指令，根据所述识别指令中包含的案件信息调取理赔案件文档；

通过光学字符识别模型对所述理赔案件文档进行识别，获取所述理赔案件文档中的理赔信息。

3.如权利要求2所述的理赔数据处理方法，其特征在于，所述通过光学字符识别模型对所述理赔案件文档进行识别，获取所述理赔案件文档中的理赔信息之前，还包括：

提取所述理赔案件文档中的敏感关键词，获取所述敏感关键词在所述理赔案件文档中所处的敏感位置以及所述敏感位置上包含所述敏感关键词的敏感内容，对所述敏感位置上的所述敏感内容进行删除处理或马赛克处理。

4.如权利要求1所述理赔数据处理的方法，其特征在于，所述根据预设的神经网络模型对所述理赔信息进行归类之前，还包括：

获取归类训练样本；所述归类训练样本为历史理赔案件文档中的历史理赔信息；

获取通过包含初始参数的神经网络模型对所述归类训练样本进行归类时的整体偏差度，所述整体偏差度为归类之后得到的理赔信息值与预设归类值之间的整体偏差程度；

判断所述整体偏差度是否大于预设的第一阈值；

若所述整体偏差度大于所述第一阈值，则对所述神经网络模型的初始参数进行调整，并返回执行所述计算使用神经网络模型对所述归类训练样本进行归类时的整体偏差度，直至所述整体偏差度小于或等于所述第一阈值；

若所述整体偏差度小于或等于所述第一阈值，则提示所述神经网络模型训练完成。

5.如权利要求4所述的理赔数据处理方法，其特征在于，所述获取通过包含初始参数的神经网络模型对所述归类训练样本进行归类时的整体偏差度，包括：

从所述归类训练样本中选取一个尚未被选取进行归类的归类训练样本作为当前样本；

使用所述神经网络模型对所述当前样本中的理赔信息进行处理，得到所述当前样本归类之后的理赔信息值；

根据预设的偏差判定规则确定所述当前样本归类之后的理赔信息值与所述预设归类值之间的样本偏差度；

判断所述保险理赔样本库中是否存在尚未被选取进行归类的归类训练样本；

若存在尚未被选取进行归类的归类训练样本，则继续从所述归类训练样本中选取一个尚未被选取进行归类的归类训练样本作为当前样本；

若不存在尚未被选取进行归类的归类训练样本，将被选取进行归类的所有归类训练样本的样本偏差度之和确定为整体偏差度。

6.一种理赔数据处理装置，其特征在于，包括：

7.如权利要求6所述的理赔数据处理装置，其特征在于，所述识别模块包括：

调取子模块，用于接收识别指令，根据所述识别指令中包含的案件信息调取理赔案件文档；

获取子模块，用于通过光学字符识别模型对所述理赔案件文档进行识别，获取所述理赔案件文档中的理赔信息。

8.如权利要求6所述的理赔数据处理装置，其特征在于，所述装置还包括：

样本获取模块，用于获取归类训练样本；所述归类训练样本为历史理赔案件文档中的历史理赔信息；

偏差获取模块，用于获取通过包含初始参数的神经网络模型对所述归类训练样本进行归类时的整体偏差度，所述整体偏差度为归类之后得到的理赔信息值与预设归类值之间的整体偏差程度；

判断模块，用于判断所述整体偏差度是否大于预设的第一阈值；

调整模块，用于在所述整体偏差度大于所述第一阈值时，对所述神经网络模型的初始参数进行调整，并返回执行所述计算使用神经网络模型对所述归类训练样本进行归类时的整体偏差度，直至所述整体偏差度小于或等于所述第一阈值；

提示模块，用于在所述整体偏差度小于或等于所述第一阈值时，提示所述神经网络模型训练完成。

9.一种计算机设备，包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序，其特征在于，所述处理器执行所述计算机程序时实现如权利要求1至5任一项所述理赔数据处理方法的步骤。

10.一种计算机可读存储介质，所述计算机可读存储介质存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现如权利要求1至5任一项所述理赔数据处理方法的步骤。