CN107146160B

CN107146160B - 投保客户健康状况分析方法及服务器

Info

Publication number: CN107146160B
Application number: CN201610105653.5A
Authority: CN
Inventors: 王春亮; 蔡宁; 项同德; 钱慧敏
Original assignee: Ping An Technology Shenzhen Co Ltd
Current assignee: Ping An Technology Shenzhen Co Ltd
Priority date: 2016-02-26
Filing date: 2016-02-26
Publication date: 2021-04-20
Anticipated expiration: 2036-02-26
Also published as: CN107146160A

Abstract

一种投保客户健康状况分析方法，包括：获取多个已投保客户的预设类型数据，基于所述已投保客户的预设类型数据，按照预设的模型生成规则，生成一个健康风险等级分析模型；在收到针对一待投保客户的健康风险等级分析指令时，接收该客户的投保数据；从所述客户的投保数据中获取预设类型数据作为健康风险数据，确定各个预设类型数据对应的风险因子数据；及将各个预设类型数据对应的风险因子对应的数据代入生成的所述健康风险等级分析模型中，以分析出该客户对应的健康风险等级。本发明还提供一种适用于上述方法的服务器。本发明可以快速评估投保客户的健康风险等级，避免传统人工评估所耗费的大量人力、物力。

Description

投保客户健康状况分析方法及服务器

技术领域

本发明涉及数据分析评估技术领域，特别是一种投保客户健康状况分析方法及服务器。

背景技术

目前，针对一个客户的寿险投保申请，通常由风险评估人员对该客户的当前投保数据按照预设的评估规则进行人工风险分析。例如，预设的评估规则中可以设置理赔额风险评估规则，若一个受理赔人预设时间内多次发生理赔额超过阈值的理赔事件时，则分析人员会对将该受理赔人列入高理赔风险人。这种人工风险评估方式对分析人的风险分析的专业性有很高的要求，且这种方式的准确性通常很低，需要投入的人力、物力会非常大。

发明内容

鉴于以上内容，有必要提供一种投保客户健康状况分析方法，其可以快速评估投保客户的健康风险等级，避免传统人工评估所耗费的大量人力、物力。

一种投保客户健康状况分析方法，包括：

获取多个已投保客户的预设类型数据，基于所述已投保客户的预设类型数据，按照预设的模型生成规则，生成一个健康风险等级分析模型；

在收到针对一待投保客户的健康风险等级分析指令时，接收该客户的投保数据；

从所述客户的投保数据中获取预设类型数据作为健康风险数据，确定各个预设类型数据对应的风险因子数据；及

将各个预设类型数据对应的风险因子对应的数据代入生成的所述健康风险等级分析模型中，以分析出该客户对应的健康风险等级。

优选地，所述预设的模型生成规则包括：

获取预设数量已投保客户的预设类型数据；

获得各个已投保客户的预设类型数据对应的风险因子数据；

对各个已投保客户的预设类型数据，按照预设分析规则进行健康风险等级划分，将不同健康风险等级的客户的预设类型数据对应的各个风险因子数据分发到不同的文件夹里；

从不同文件夹下各提取第一预设比例的各个风险因子数据作为训练数据进行模型训练，从不同文件夹下各取剩下的第二预设比例的各个风险因子数据作为测试数据以对生成的模型进行准确性验证；及

若生成的SVM模型准确率小于预设准确率，则增加预设类型数据的获取数量，重复上述模型的生成过程，直到生成的模型准确率大于等于预设准确率。

优选地，所述预设的模型生成规则包括：

获取预设数量已投保客户的预设类型数据；

获得各个已投保客户的预设类型数据对应的风险因子数据；

若生成的SVM模型准确率小于预设准确率，则按照预设的因子调优规则对确定的风险因子进行删除和/或增加处理，重复上述模型的生成过程，直到生成的模型准确率大于等于预设准确率。

优选地，所述因子调优规则包括确定生成的模型中的各个风险因子对应的权重系数；找出权重系数最小的风险因子；从生成的SVM模型中的各个风险因子中删除找出的风险因子，和/或新增其他风险因子。

优选地，所述预设类型数据包括：门诊数据、体检数据、个人特征数据；以及所述预设类型数据对应的风险因子数据包括：门诊数据对应的固定时间内的门诊次数、慢性病、突发性疾病及固定时间内门诊的平均花费，体检数据对应的血压、血糖、心率及身体质量指数，及个人特征数据对应的年龄、性别、生活地域及职业。

鉴于以上内容，还有必要提供一种适用于上述方法的服务器，其可以快速评估投保客户的健康风险等级，避免传统人工评估所耗费的大量人力、物力。

一种服务器，该服务器包括存储设备以及处理器，其中：

所述存储设备，用于存储一个投保客户健康状况分析***；

所述处理器，用于调用并执行所述投保客户健康状况分析***，以执行如下步骤：

优选地，其特征在于，所述预设的模型生成规则包括：

获取预设数量已投保客户的预设类型数据；

获得各个已投保客户的预设类型数据对应的风险因子数据；

优选地，所述预设的模型生成规则包括：

获取预设数量已投保客户的预设类型数据；

获得各个已投保客户的预设类型数据对应的风险因子数据；

优选地，所述因子调优规则为：确定生成的模型中的各个风险因子对应的权重系数；找出权重系数最小的风险因子；从生成的SVM模型中的各个风险因子中删除找出的风险因子，和/或新增其他风险因子。

本发明所述投保客户健康状况分析方法及适用于上述方法的服务器及终端设备，通过建立健康风险等级的分析模型，快速评估投保客户的健康风险等级，避免传统人工评估所耗费的大量人力、物力。

附图说明

图1是本发明投保客户健康状况分析***第一实施例的硬件环境图。

图2是本发明投保客户健康状况分析***第二实施例的硬件环境图。

图3是本发明投保客户健康状况分析***较佳实施例的功能模块图。

图4是本发明投保客户健康状况分析方法较佳实施例的方法实施流程图。

图5是图4所示投保客户健康状况分析方法中生成健康风险等级分析模型的第一较佳实施例的实施流程图。

图6是图4所示投保客户健康状况分析方法中生成健康风险等级分析模型的第二较佳实施例的实施流程图。

具体实施方式

参阅图1所示，是本发明投保客户健康状况分析***第一实施例的硬件环境图。

本实施例所述投保客户健康状况分析***2可以安装并运行于一台服务器1中。所述服务器1可以通过通讯模块(未图示)与至少一台终端设备3通讯连接，所述终端设备3可以是个人电脑、智能手机、平板电脑等设备。所述终端设备3包括输入设备30及显示设备31。

所述服务器1可以包括有处理器以及存储设备(未图示)。所述处理器是服务器1的运算核心(Core Unit)和控制核心(Control Unit)，用于解释计算机指令以及处理计算机软件中的数据。所述存储设备可以是一个或者多个非易失性存储单元，如ROM、EPROM或Flash Memory(快闪存储单元)等。所述存储设备可以内置或者外接于服务器1。

本实施例中，所述投保客户健康状况分析***2可以是一种计算机软件，其包括计算机可执行的程序指令代码，该程序指令代码可以存储于所述存储设备中，在所述处理器的执行下，实现下述功能：从与所述服务器1连接的数据库4中获取多个已投保客户的预设类型数据，基于所述已投保客户的预设类型数据，按照预设的模型生成规则，生成一个健康风险等级分析模型，并在收到终端设备3发出的针对一待投保客户的健康风险等级分析指令时，利用所述健康风险等级分析模型分析该待投保客户对应的健康风险等级，并将所述待投保客户对应的健康风险等级传送给所述终端设备3。

本实施例中，所述已投保客户的预设类型数据包括，例如，门诊数据、体检数据、个人特征数据等。

本实施例中，所述健康风险等级分析模型为一支持向量机(Support VectorMachine，SVM)模型。

所述预设的模型生成规则为：获取预设数量(例如，10万)已投保客户的预设类型数据；获得各个已投保客户的预设类型数据对应的风险因子数据，例如，门诊数据对应的风险因子数据可以包括固定时间内的门诊次数、慢性病、突发性疾病、固定时间内门诊的平均花费等，体检数据对应的风险因子数据可以包括血压、血糖、心率、身体质量指数，即体重公斤数除以身高米数平方得出的指数等，个人特征数据对应的风险因子可以包括年龄、性别、生活地域、职业等；对各个已投保客户的预设类型数据，按照预设分析规则进行健康风险等级划分。

例如，所述预设分析规则为：发生过的理赔额大于等于第一阈值或者发生过的理赔次数大于预设次数，例如，10次的客户的预设类型数据为一级健康风险等级数据；发生过的理赔次数小于等于预设次数，及有发生过的理赔额小于第一阈值且大于等于第二阈值的客户的预设类型数据为二级健康风险等级数据；发生过的理赔次数小于等于预设次数，及发生过的所有理赔额均小于第二阈值的客户的预设类型数据为三级健康风险等级数据；及未发生过理赔的客户的预设类型数据为四级健康风险等级数据。

将不同健康风险等级的客户的预设类型数据对应的各个风险因子数据分发到不同的文件夹里。例如，一级健康风险等级的预设类型数据的风险因子数据分发到第一文件夹里；二级健康风险等级的预设类型数据的风险因子数据分发到第二文件夹里；三级健康风险等级的预设类型数据的风险因子数据分发到第三文件夹里；四级健康风险等级的预设类型数据的风险因子数据分发到第四文件夹里。从不同文件夹下各提取第一预设比例，例如，70％的各个风险因子数据作为训练数据进行支持向量机(SVM)模型的训练，从不同文件夹下各取剩下的第二预设比例，例如，30％的各个风险因子数据作为测试数据以对生成的SVM模型进行准确性验证。

若生成的SVM模型准确率小于预设准确率，例如，99％，则增加预设类型数据的获取数量，重复上述SVM模型的生成过程，直到生成的SVM模型准确率大于等于预设准确率，例如，99％。

本发明其他较佳实施例中，若生成的SVM模型准确率小于预设准确率，例如，99％，则按照预设的因子调优规则对确定的风险因子进行删除和/或增加处理，重复上述SVM模型的生成过程，直到生成的SVM模型准确率大于等于预设准确率，例如，99％。

优选地，所述预设的因子调优规则为：在确定的风险因子中新增其他风险因子。

优选地，所述预设的因子调优规则为：确定生成的SVM模型中的各个风险因子对应的权重系数；找出权重系数最小的风险因子；从生成的SVM模型中的各个风险因子中删除找出的风险因子，和/或新增其他风险因子。

优选地，所述预设的因子调优规则为：确定生成的SVM模型中的各个风险因子对应的权重系数；找出权重系数最小的风险因子；若找出的风险因子的权重系数小于预设权重阈值，则从生成的SVM模型中的风险因子中删除找出的风险因子；若找出的风险因子的权重系数大于等于预设权重阈值，则新增其他风险因子。

在本发明的其他实施例中，如图2所示，所述的投保客户健康状况分析***2也可以安装并运行于终端设备3中，所述投保客户健康状况分析***2的程序代码可以存储于所述终端设备3的存储设备(未图示)中，并在终端设备3的处理器的执行下，实现上述描述的功能。

参阅图3所示，是本发明投保客户健康状况分析***较佳实施例的功能模块图。

所述投保客户健康状况分析***2的程序代码根据其不同的功能，可以划分为多个功能模块。本发明较佳实施例中，所述投保客户健康状况分析***2可以包括模型建立模块20、获取模块21、预处理模块22及等级分析模块23。

所述模型建立模块20用于获取多个已投保客户的预设类型数据，基于所述已投保客户的预设类型数据，按照预设的模型生成规则，生成一个健康风险等级分析模型。

所述多个已投保客户的预设类型数据可以从，例如，一数据库4中获取。

优选地，所述预设的因子调优规则为：确定生成的SVM模型中的各个风险因子对应的权重系数；找出权重系数最小的风险因子；从生成的SVM模型中的各个风险因子中删除找出的风险因子，及新增其他风险因子。

所述获取模块21用于在收到终端设备3的用户通过其输入设备30发出的针对一待投保客户的健康风险等级分析指令时，接收该客户的投保数据。

所述预处理模块22用于从所述客户的投保数据中获取预设类型数据作为健康风险数据，确定各个预设类型数据对应的风险因子数据。

本实施例中，所述预设类型数据包括，例如，门诊数据、体检数据、个人特征数据等。所述预设类型数据对应的风险因子数据，例如，门诊数据对应的风险因子数据可以包括固定时间内的门诊次数、慢性病、突发性疾病、固定时间内门诊的平均花费等，体检数据对应的风险因子数据可以包括血压、血糖、心率、身体质量指数，即体重公斤数除以身高米数平方得出的指数等，个人特征数据对应的风险因子可以包括年龄、性别、生活地域、职业等。

所述等级分析模块23用于将各个预设类型数据对应的风险因子对应的数据代入生成的所述健康风险等级分析模型中，以分析出该客户对应的健康风险等级，将所述客户对应的健康风险等级发送给所述终端设备3。所述客户对应的健康风险等级可以显示在终端设备3的显示设备31上。

参阅图4所示，是本发明投保客户健康状况分析方法较佳实施例的方法实施流程图。本实施例所述投保客户健康状况分析方法并不限于流程图中所示步骤，此外流程图中所示步骤中，某些步骤可以省略、步骤之间的顺序可以改变。

步骤S10，模型建立模块20获取多个已投保客户的预设类型数据，基于所述已投保客户的预设类型数据，按照预设的模型生成规则，生成一个健康风险等级分析模型。

本实施例中，所述已投保客户的预设类型数据包括，例如，门诊数据、体检数据、个人特征数据等。所述生成健康风险等级分析模型的详细流程可以参照下述图5及图6中的描述。

步骤S11，获取模块21在收到终端设备3的用户通过其输入设备30发出的针对一待投保客户的健康风险等级分析指令时，接收该客户的投保数据。

步骤S12，预处理模块22从所述客户的投保数据中获取预设类型数据作为健康风险数据，确定各个预设类型数据对应的风险因子数据。

步骤S13，等级分析模块23将各个预设类型数据对应的风险因子对应的数据代入生成的所述健康风险等级分析模型中，以分析出该客户对应的健康风险等级。

步骤S13，所述等级分析模块23将所述客户对应的健康风险等级发送给所述终端设备3，并显示在终端设备3的显示设备31上。

参阅图5所示，是图4所示投保客户健康状况分析方法中生成健康风险等级分析模型的第一较佳实施例的实施流程图。本实施例所述投保客户健康状况分析方法并不限于流程图中所示步骤，此外流程图中所示步骤中，某些步骤可以省略、步骤之间的顺序可以改变。

步骤S100，模型建立模块20获取预设数量(例如，10万)已投保客户的预设类型数据。

步骤S101，模型建立模块20获得各个已投保客户的预设类型数据对应的风险因子数据，例如，门诊数据对应的风险因子数据可以包括固定时间内的门诊次数、慢性病、突发性疾病、固定时间内门诊的平均花费等，体检数据对应的风险因子数据可以包括血压、血糖、心率、身体质量指数，即体重公斤数除以身高米数平方得出的指数等，个人特征数据对应的风险因子可以包括年龄、性别、生活地域、职业等。

步骤S102，模型建立模块20对各个已投保客户的预设类型数据，按照预设分析规则进行健康风险等级划分，将不同健康风险等级的客户的预设类型数据对应的各个风险因子数据分发到不同的文件夹里。

例如，一级健康风险等级的预设类型数据的风险因子数据分发到第一文件夹里；二级健康风险等级的预设类型数据的风险因子数据分发到第二文件夹里；三级健康风险等级的预设类型数据的风险因子数据分发到第三文件夹里；四级健康风险等级的预设类型数据的风险因子数据分发到第四文件夹里。

步骤S103，模型建立模块20从不同文件夹下各提取第一预设比例，例如，70％的各个风险因子数据作为训练数据进行支持向量机(SVM)模型的训练，从不同文件夹下各取剩下的第二预设比例，例如，30％的各个风险因子数据作为测试数据以对生成的SVM模型进行准确性验证。

步骤S104，模型建立模块20判断生成的SVM模型准确率是否小于预设准确率，例如，99％。

若生成的SVM模型准确率小于预设准确率，则执行步骤S105，模型建立模块20增加预设类型数据的获取数量，并返回上述步骤S100，直到生成的SVM模型准确率大于所述预设准确率。

参阅图6所示，是图4所示投保客户健康状况分析方法中生成健康风险等级分析模型的第二较佳实施例的实施流程图。本实施例所述投保客户健康状况分析方法并不限于流程图中所示步骤，此外流程图中所示步骤中，某些步骤可以省略、步骤之间的顺序可以改变。

步骤S110，模型建立模块20获取预设数量(例如，10万)已投保客户的预设类型数据。

步骤S111，模型建立模块20获得各个已投保客户的预设类型数据对应的风险因子数据，例如，门诊数据对应的风险因子数据可以包括固定时间内的门诊次数、慢性病、突发性疾病、固定时间内门诊的平均花费等，体检数据对应的风险因子数据可以包括血压、血糖、心率、身体质量指数，即体重公斤数除以身高米数平方得出的指数等，个人特征数据对应的风险因子可以包括年龄、性别、生活地域、职业等.

步骤S112，模型建立模块20对各个已投保客户的预设类型数据，按照预设分析规则进行健康风险等级划分，将不同健康风险等级的客户的预设类型数据对应的各个风险因子数据分发到不同的文件夹里。

步骤S113，模型建立模块20从不同文件夹下各提取第一预设比例，例如，70％的各个风险因子数据作为训练数据进行支持向量机(SVM)模型的训练，从不同文件夹下各取剩下的第二预设比例，例如，30％的各个风险因子数据作为测试数据以对生成的SVM模型进行准确性验证。

步骤S114，模型建立模块20判断生成的SVM模型准确率是否小于预设准确率，例如，99％。

若生成的SVM模型准确率小于预设准确率，则执行步骤S115，模型建立模块20按照预设的因子调优规则对确定的风险因子进行删除和/或增加处理，并返回执行上述的步骤S111，直到生成的SVM模型准确率大于所述预设准确率。

其中，所述预设的因子调优规则为：在确定的风险因子中新增其他风险因子。

在其他实施例中，所述预设的因子调优规则可以为：确定生成的SVM模型中的各个风险因子对应的权重系数；找出权重系数最小的风险因子；从生成的SVM模型中的各个风险因子中删除找出的风险因子，和/或新增其他风险因子。

在其他实施例中，所述预设的因子调优规则为：确定生成的SVM模型中的各个风险因子对应的权重系数；找出权重系数最小的风险因子；若找出的风险因子的权重系数小于预设权重阈值，则从生成的SVM模型中的风险因子中删除找出的风险因子；若找出的风险因子的权重系数大于等于预设权重阈值，则新增其他风险因子。

最后所应说明的是，以上实施例仅用以说明本发明的技术方案而非限制，尽管参照较佳实施例对本发明进行了详细说明，本领域的普通技术人员应当理解，可以对本发明的技术方案进行修改或等同替换，而不脱离本发明技术方案的精神和范围。

Claims

1.一种投保客户健康状况分析方法，其特征在于，该方法包括：

将各个预设类型数据对应的风险因子对应的数据代入生成的所述健康风险等级分析模型中，以分析出该客户对应的健康风险等级，发生过的理赔额大于等于第一阈值或者发生过的理赔次数大于预设次数为一级健康风险等级数据，发生过的理赔次数小于等于预设次数及有发生过的理赔额小于第一阈值且大于等于第二阈值的客户的预设类型数据为二级健康风险等级数据，发生过的理赔次数小于等于预设次数及发生过的所有理赔额均小于第二阈值的客户的预设类型数据为三级健康风险等级数据，未发生过理赔的客户的预设类型数据为四级健康风险等级数据；

其中，所述预设的模型生成规则包括：

获取预设数量已投保客户的预设类型数据；

获得各个已投保客户的预设类型数据对应的风险因子数据；

若生成的SVM模型准确率小于预设准确率，则增加预设类型数据的获取数量，重复上述模型的生成过程，直到生成的模型准确率大于等于预设准确率；或按照预设的因子调优规则对确定的风险因子进行删除和/或增加处理，重复上述模型的生成过程，直到生成的模型准确率大于等于预设准确率，所述因子调优规则包括：确定生成的模型中的各个风险因子对应的权重系数；找出权重系数最小的风险因子；从生成的SVM模型中的各个风险因子中删除找出的风险因子，和/或新增其他风险因子。

2.如权利要求1所述的方法，其特征在于，所述预设类型数据包括：门诊数据、体检数据、个人特征数据；以及所述预设类型数据对应的风险因子数据包括：门诊数据对应的固定时间内的门诊次数、慢性病、突发性疾病及固定时间内门诊的平均花费，体检数据对应的血压、血糖、心率及身体质量指数，及个人特征数据对应的年龄、性别、生活地域及职业。

3.一种服务器，其特征在于，该服务器包括存储设备以及处理器，其中：

所述存储设备，用于存储一个投保客户健康状况分析***；

其中，所述预设的模型生成规则包括：

获取预设数量已投保客户的预设类型数据；

获得各个已投保客户的预设类型数据对应的风险因子数据；

4.如权利要求3所述的服务器，其特征在于，所述预设类型数据包括：门诊数据、体检数据、个人特征数据；以及所述预设类型数据对应的风险因子数据包括：门诊数据对应的固定时间内的门诊次数、慢性病、突发性疾病及固定时间内门诊的平均花费，体检数据对应的血压、血糖、心率及身体质量指数，及个人特征数据对应的年龄、性别、生活地域及职业。