CN107146160B - 投保客户健康状况分析方法及服务器 - Google Patents

投保客户健康状况分析方法及服务器 Download PDF

Info

Publication number
CN107146160B
CN107146160B CN201610105653.5A CN201610105653A CN107146160B CN 107146160 B CN107146160 B CN 107146160B CN 201610105653 A CN201610105653 A CN 201610105653A CN 107146160 B CN107146160 B CN 107146160B
Authority
CN
China
Prior art keywords
data
preset
client
preset type
risk
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201610105653.5A
Other languages
English (en)
Other versions
CN107146160A (zh
Inventor
王春亮
蔡宁
项同德
钱慧敏
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ping An Technology Shenzhen Co Ltd
Original Assignee
Ping An Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ping An Technology Shenzhen Co Ltd filed Critical Ping An Technology Shenzhen Co Ltd
Priority to CN201610105653.5A priority Critical patent/CN107146160B/zh
Publication of CN107146160A publication Critical patent/CN107146160A/zh
Application granted granted Critical
Publication of CN107146160B publication Critical patent/CN107146160B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/08Insurance

Landscapes

  • Business, Economics & Management (AREA)
  • Accounting & Taxation (AREA)
  • Finance (AREA)
  • Engineering & Computer Science (AREA)
  • Development Economics (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Strategic Management (AREA)
  • Technology Law (AREA)
  • Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)

Abstract

一种投保客户健康状况分析方法,包括:获取多个已投保客户的预设类型数据,基于所述已投保客户的预设类型数据,按照预设的模型生成规则,生成一个健康风险等级分析模型;在收到针对一待投保客户的健康风险等级分析指令时,接收该客户的投保数据;从所述客户的投保数据中获取预设类型数据作为健康风险数据,确定各个预设类型数据对应的风险因子数据;及将各个预设类型数据对应的风险因子对应的数据代入生成的所述健康风险等级分析模型中,以分析出该客户对应的健康风险等级。本发明还提供一种适用于上述方法的服务器。本发明可以快速评估投保客户的健康风险等级,避免传统人工评估所耗费的大量人力、物力。

Description

投保客户健康状况分析方法及服务器
技术领域
本发明涉及数据分析评估技术领域,特别是一种投保客户健康状况分析方法及服务器。
背景技术
目前,针对一个客户的寿险投保申请,通常由风险评估人员对该客户的当前投保数据按照预设的评估规则进行人工风险分析。例如,预设的评估规则中可以设置理赔额风险评估规则,若一个受理赔人预设时间内多次发生理赔额超过阈值的理赔事件时,则分析人员会对将该受理赔人列入高理赔风险人。这种人工风险评估方式对分析人的风险分析的专业性有很高的要求,且这种方式的准确性通常很低,需要投入的人力、物力会非常大。
发明内容
鉴于以上内容,有必要提供一种投保客户健康状况分析方法,其可以快速评估投保客户的健康风险等级,避免传统人工评估所耗费的大量人力、物力。
一种投保客户健康状况分析方法,包括:
获取多个已投保客户的预设类型数据,基于所述已投保客户的预设类型数据,按照预设的模型生成规则,生成一个健康风险等级分析模型;
在收到针对一待投保客户的健康风险等级分析指令时,接收该客户的投保数据;
从所述客户的投保数据中获取预设类型数据作为健康风险数据,确定各个预设类型数据对应的风险因子数据;及
将各个预设类型数据对应的风险因子对应的数据代入生成的所述健康风险等级分析模型中,以分析出该客户对应的健康风险等级。
优选地,所述预设的模型生成规则包括:
获取预设数量已投保客户的预设类型数据;
获得各个已投保客户的预设类型数据对应的风险因子数据;
对各个已投保客户的预设类型数据,按照预设分析规则进行健康风险等级划分,将不同健康风险等级的客户的预设类型数据对应的各个风险因子数据分发到不同的文件夹里;
从不同文件夹下各提取第一预设比例的各个风险因子数据作为训练数据进行模型训练,从不同文件夹下各取剩下的第二预设比例的各个风险因子数据作为测试数据以对生成的模型进行准确性验证;及
若生成的SVM模型准确率小于预设准确率,则增加预设类型数据的获取数量,重复上述模型的生成过程,直到生成的模型准确率大于等于预设准确率。
优选地,所述预设的模型生成规则包括:
获取预设数量已投保客户的预设类型数据;
获得各个已投保客户的预设类型数据对应的风险因子数据;
对各个已投保客户的预设类型数据,按照预设分析规则进行健康风险等级划分,将不同健康风险等级的客户的预设类型数据对应的各个风险因子数据分发到不同的文件夹里;
从不同文件夹下各提取第一预设比例的各个风险因子数据作为训练数据进行模型训练,从不同文件夹下各取剩下的第二预设比例的各个风险因子数据作为测试数据以对生成的模型进行准确性验证;及
若生成的SVM模型准确率小于预设准确率,则按照预设的因子调优规则对确定的风险因子进行删除和/或增加处理,重复上述模型的生成过程,直到生成的模型准确率大于等于预设准确率。
优选地,所述因子调优规则包括确定生成的模型中的各个风险因子对应的权重系数;找出权重系数最小的风险因子;从生成的SVM模型中的各个风险因子中删除找出的风险因子,和/或新增其他风险因子。
优选地,所述预设类型数据包括:门诊数据、体检数据、个人特征数据;以及所述预设类型数据对应的风险因子数据包括:门诊数据对应的固定时间内的门诊次数、慢性病、突发性疾病及固定时间内门诊的平均花费,体检数据对应的血压、血糖、心率及身体质量指数,及个人特征数据对应的年龄、性别、生活地域及职业。
鉴于以上内容,还有必要提供一种适用于上述方法的服务器,其可以快速评估投保客户的健康风险等级,避免传统人工评估所耗费的大量人力、物力。
一种服务器,该服务器包括存储设备以及处理器,其中:
所述存储设备,用于存储一个投保客户健康状况分析***;
所述处理器,用于调用并执行所述投保客户健康状况分析***,以执行如下步骤:
获取多个已投保客户的预设类型数据,基于所述已投保客户的预设类型数据,按照预设的模型生成规则,生成一个健康风险等级分析模型;
在收到针对一待投保客户的健康风险等级分析指令时,接收该客户的投保数据;
从所述客户的投保数据中获取预设类型数据作为健康风险数据,确定各个预设类型数据对应的风险因子数据;及
将各个预设类型数据对应的风险因子对应的数据代入生成的所述健康风险等级分析模型中,以分析出该客户对应的健康风险等级。
优选地,其特征在于,所述预设的模型生成规则包括:
获取预设数量已投保客户的预设类型数据;
获得各个已投保客户的预设类型数据对应的风险因子数据;
对各个已投保客户的预设类型数据,按照预设分析规则进行健康风险等级划分,将不同健康风险等级的客户的预设类型数据对应的各个风险因子数据分发到不同的文件夹里;
从不同文件夹下各提取第一预设比例的各个风险因子数据作为训练数据进行模型训练,从不同文件夹下各取剩下的第二预设比例的各个风险因子数据作为测试数据以对生成的模型进行准确性验证;及
若生成的SVM模型准确率小于预设准确率,则增加预设类型数据的获取数量,重复上述模型的生成过程,直到生成的模型准确率大于等于预设准确率。
优选地,所述预设的模型生成规则包括:
获取预设数量已投保客户的预设类型数据;
获得各个已投保客户的预设类型数据对应的风险因子数据;
对各个已投保客户的预设类型数据,按照预设分析规则进行健康风险等级划分,将不同健康风险等级的客户的预设类型数据对应的各个风险因子数据分发到不同的文件夹里;
从不同文件夹下各提取第一预设比例的各个风险因子数据作为训练数据进行模型训练,从不同文件夹下各取剩下的第二预设比例的各个风险因子数据作为测试数据以对生成的模型进行准确性验证;及
若生成的SVM模型准确率小于预设准确率,则按照预设的因子调优规则对确定的风险因子进行删除和/或增加处理,重复上述模型的生成过程,直到生成的模型准确率大于等于预设准确率。
优选地,所述因子调优规则为:确定生成的模型中的各个风险因子对应的权重系数;找出权重系数最小的风险因子;从生成的SVM模型中的各个风险因子中删除找出的风险因子,和/或新增其他风险因子。
优选地,所述预设类型数据包括:门诊数据、体检数据、个人特征数据;以及所述预设类型数据对应的风险因子数据包括:门诊数据对应的固定时间内的门诊次数、慢性病、突发性疾病及固定时间内门诊的平均花费,体检数据对应的血压、血糖、心率及身体质量指数,及个人特征数据对应的年龄、性别、生活地域及职业。
本发明所述投保客户健康状况分析方法及适用于上述方法的服务器及终端设备,通过建立健康风险等级的分析模型,快速评估投保客户的健康风险等级,避免传统人工评估所耗费的大量人力、物力。
附图说明
图1是本发明投保客户健康状况分析***第一实施例的硬件环境图。
图2是本发明投保客户健康状况分析***第二实施例的硬件环境图。
图3是本发明投保客户健康状况分析***较佳实施例的功能模块图。
图4是本发明投保客户健康状况分析方法较佳实施例的方法实施流程图。
图5是图4所示投保客户健康状况分析方法中生成健康风险等级分析模型的第一较佳实施例的实施流程图。
图6是图4所示投保客户健康状况分析方法中生成健康风险等级分析模型的第二较佳实施例的实施流程图。
具体实施方式
参阅图1所示,是本发明投保客户健康状况分析***第一实施例的硬件环境图。
本实施例所述投保客户健康状况分析***2可以安装并运行于一台服务器1中。所述服务器1可以通过通讯模块(未图示)与至少一台终端设备3通讯连接,所述终端设备3可以是个人电脑、智能手机、平板电脑等设备。所述终端设备3包括输入设备30及显示设备31。
所述服务器1可以包括有处理器以及存储设备(未图示)。所述处理器是服务器1的运算核心(Core Unit)和控制核心(Control Unit),用于解释计算机指令以及处理计算机软件中的数据。所述存储设备可以是一个或者多个非易失性存储单元,如ROM、EPROM或Flash Memory(快闪存储单元)等。所述存储设备可以内置或者外接于服务器1。
本实施例中,所述投保客户健康状况分析***2可以是一种计算机软件,其包括计算机可执行的程序指令代码,该程序指令代码可以存储于所述存储设备中,在所述处理器的执行下,实现下述功能:从与所述服务器1连接的数据库4中获取多个已投保客户的预设类型数据,基于所述已投保客户的预设类型数据,按照预设的模型生成规则,生成一个健康风险等级分析模型,并在收到终端设备3发出的针对一待投保客户的健康风险等级分析指令时,利用所述健康风险等级分析模型分析该待投保客户对应的健康风险等级,并将所述待投保客户对应的健康风险等级传送给所述终端设备3。
本实施例中,所述已投保客户的预设类型数据包括,例如,门诊数据、体检数据、个人特征数据等。
本实施例中,所述健康风险等级分析模型为一支持向量机(Support VectorMachine,SVM)模型。
所述预设的模型生成规则为:获取预设数量(例如,10万)已投保客户的预设类型数据;获得各个已投保客户的预设类型数据对应的风险因子数据,例如,门诊数据对应的风险因子数据可以包括固定时间内的门诊次数、慢性病、突发性疾病、固定时间内门诊的平均花费等,体检数据对应的风险因子数据可以包括血压、血糖、心率、身体质量指数,即体重公斤数除以身高米数平方得出的指数等,个人特征数据对应的风险因子可以包括年龄、性别、生活地域、职业等;对各个已投保客户的预设类型数据,按照预设分析规则进行健康风险等级划分。
例如,所述预设分析规则为:发生过的理赔额大于等于第一阈值或者发生过的理赔次数大于预设次数,例如,10次的客户的预设类型数据为一级健康风险等级数据;发生过的理赔次数小于等于预设次数,及有发生过的理赔额小于第一阈值且大于等于第二阈值的客户的预设类型数据为二级健康风险等级数据;发生过的理赔次数小于等于预设次数,及发生过的所有理赔额均小于第二阈值的客户的预设类型数据为三级健康风险等级数据;及未发生过理赔的客户的预设类型数据为四级健康风险等级数据。
将不同健康风险等级的客户的预设类型数据对应的各个风险因子数据分发到不同的文件夹里。例如,一级健康风险等级的预设类型数据的风险因子数据分发到第一文件夹里;二级健康风险等级的预设类型数据的风险因子数据分发到第二文件夹里;三级健康风险等级的预设类型数据的风险因子数据分发到第三文件夹里;四级健康风险等级的预设类型数据的风险因子数据分发到第四文件夹里。从不同文件夹下各提取第一预设比例,例如,70%的各个风险因子数据作为训练数据进行支持向量机(SVM)模型的训练,从不同文件夹下各取剩下的第二预设比例,例如,30%的各个风险因子数据作为测试数据以对生成的SVM模型进行准确性验证。
若生成的SVM模型准确率小于预设准确率,例如,99%,则增加预设类型数据的获取数量,重复上述SVM模型的生成过程,直到生成的SVM模型准确率大于等于预设准确率,例如,99%。
本发明其他较佳实施例中,若生成的SVM模型准确率小于预设准确率,例如,99%,则按照预设的因子调优规则对确定的风险因子进行删除和/或增加处理,重复上述SVM模型的生成过程,直到生成的SVM模型准确率大于等于预设准确率,例如,99%。
优选地,所述预设的因子调优规则为:在确定的风险因子中新增其他风险因子。
优选地,所述预设的因子调优规则为:确定生成的SVM模型中的各个风险因子对应的权重系数;找出权重系数最小的风险因子;从生成的SVM模型中的各个风险因子中删除找出的风险因子,和/或新增其他风险因子。
优选地,所述预设的因子调优规则为:确定生成的SVM模型中的各个风险因子对应的权重系数;找出权重系数最小的风险因子;若找出的风险因子的权重系数小于预设权重阈值,则从生成的SVM模型中的风险因子中删除找出的风险因子;若找出的风险因子的权重系数大于等于预设权重阈值,则新增其他风险因子。
在本发明的其他实施例中,如图2所示,所述的投保客户健康状况分析***2也可以安装并运行于终端设备3中,所述投保客户健康状况分析***2的程序代码可以存储于所述终端设备3的存储设备(未图示)中,并在终端设备3的处理器的执行下,实现上述描述的功能。
参阅图3所示,是本发明投保客户健康状况分析***较佳实施例的功能模块图。
所述投保客户健康状况分析***2的程序代码根据其不同的功能,可以划分为多个功能模块。本发明较佳实施例中,所述投保客户健康状况分析***2可以包括模型建立模块20、获取模块21、预处理模块22及等级分析模块23。
所述模型建立模块20用于获取多个已投保客户的预设类型数据,基于所述已投保客户的预设类型数据,按照预设的模型生成规则,生成一个健康风险等级分析模型。
所述多个已投保客户的预设类型数据可以从,例如,一数据库4中获取。
本实施例中,所述已投保客户的预设类型数据包括,例如,门诊数据、体检数据、个人特征数据等。
本实施例中,所述健康风险等级分析模型为一支持向量机(Support VectorMachine,SVM)模型。
所述预设的模型生成规则为:获取预设数量(例如,10万)已投保客户的预设类型数据;获得各个已投保客户的预设类型数据对应的风险因子数据,例如,门诊数据对应的风险因子数据可以包括固定时间内的门诊次数、慢性病、突发性疾病、固定时间内门诊的平均花费等,体检数据对应的风险因子数据可以包括血压、血糖、心率、身体质量指数,即体重公斤数除以身高米数平方得出的指数等,个人特征数据对应的风险因子可以包括年龄、性别、生活地域、职业等;对各个已投保客户的预设类型数据,按照预设分析规则进行健康风险等级划分。
例如,所述预设分析规则为:发生过的理赔额大于等于第一阈值或者发生过的理赔次数大于预设次数,例如,10次的客户的预设类型数据为一级健康风险等级数据;发生过的理赔次数小于等于预设次数,及有发生过的理赔额小于第一阈值且大于等于第二阈值的客户的预设类型数据为二级健康风险等级数据;发生过的理赔次数小于等于预设次数,及发生过的所有理赔额均小于第二阈值的客户的预设类型数据为三级健康风险等级数据;及未发生过理赔的客户的预设类型数据为四级健康风险等级数据。
将不同健康风险等级的客户的预设类型数据对应的各个风险因子数据分发到不同的文件夹里。例如,一级健康风险等级的预设类型数据的风险因子数据分发到第一文件夹里;二级健康风险等级的预设类型数据的风险因子数据分发到第二文件夹里;三级健康风险等级的预设类型数据的风险因子数据分发到第三文件夹里;四级健康风险等级的预设类型数据的风险因子数据分发到第四文件夹里。从不同文件夹下各提取第一预设比例,例如,70%的各个风险因子数据作为训练数据进行支持向量机(SVM)模型的训练,从不同文件夹下各取剩下的第二预设比例,例如,30%的各个风险因子数据作为测试数据以对生成的SVM模型进行准确性验证。
若生成的SVM模型准确率小于预设准确率,例如,99%,则增加预设类型数据的获取数量,重复上述SVM模型的生成过程,直到生成的SVM模型准确率大于等于预设准确率,例如,99%。
本发明其他较佳实施例中,若生成的SVM模型准确率小于预设准确率,例如,99%,则按照预设的因子调优规则对确定的风险因子进行删除和/或增加处理,重复上述SVM模型的生成过程,直到生成的SVM模型准确率大于等于预设准确率,例如,99%。
优选地,所述预设的因子调优规则为:在确定的风险因子中新增其他风险因子。
优选地,所述预设的因子调优规则为:确定生成的SVM模型中的各个风险因子对应的权重系数;找出权重系数最小的风险因子;从生成的SVM模型中的各个风险因子中删除找出的风险因子,及新增其他风险因子。
优选地,所述预设的因子调优规则为:确定生成的SVM模型中的各个风险因子对应的权重系数;找出权重系数最小的风险因子;若找出的风险因子的权重系数小于预设权重阈值,则从生成的SVM模型中的风险因子中删除找出的风险因子;若找出的风险因子的权重系数大于等于预设权重阈值,则新增其他风险因子。
所述获取模块21用于在收到终端设备3的用户通过其输入设备30发出的针对一待投保客户的健康风险等级分析指令时,接收该客户的投保数据。
所述预处理模块22用于从所述客户的投保数据中获取预设类型数据作为健康风险数据,确定各个预设类型数据对应的风险因子数据。
本实施例中,所述预设类型数据包括,例如,门诊数据、体检数据、个人特征数据等。所述预设类型数据对应的风险因子数据,例如,门诊数据对应的风险因子数据可以包括固定时间内的门诊次数、慢性病、突发性疾病、固定时间内门诊的平均花费等,体检数据对应的风险因子数据可以包括血压、血糖、心率、身体质量指数,即体重公斤数除以身高米数平方得出的指数等,个人特征数据对应的风险因子可以包括年龄、性别、生活地域、职业等。
所述等级分析模块23用于将各个预设类型数据对应的风险因子对应的数据代入生成的所述健康风险等级分析模型中,以分析出该客户对应的健康风险等级,将所述客户对应的健康风险等级发送给所述终端设备3。所述客户对应的健康风险等级可以显示在终端设备3的显示设备31上。
参阅图4所示,是本发明投保客户健康状况分析方法较佳实施例的方法实施流程图。本实施例所述投保客户健康状况分析方法并不限于流程图中所示步骤,此外流程图中所示步骤中,某些步骤可以省略、步骤之间的顺序可以改变。
步骤S10,模型建立模块20获取多个已投保客户的预设类型数据,基于所述已投保客户的预设类型数据,按照预设的模型生成规则,生成一个健康风险等级分析模型。
所述多个已投保客户的预设类型数据可以从,例如,一数据库4中获取。
本实施例中,所述已投保客户的预设类型数据包括,例如,门诊数据、体检数据、个人特征数据等。所述生成健康风险等级分析模型的详细流程可以参照下述图5及图6中的描述。
本实施例中,所述健康风险等级分析模型为一支持向量机(Support VectorMachine,SVM)模型。
步骤S11,获取模块21在收到终端设备3的用户通过其输入设备30发出的针对一待投保客户的健康风险等级分析指令时,接收该客户的投保数据。
步骤S12,预处理模块22从所述客户的投保数据中获取预设类型数据作为健康风险数据,确定各个预设类型数据对应的风险因子数据。
本实施例中,所述预设类型数据包括,例如,门诊数据、体检数据、个人特征数据等。所述预设类型数据对应的风险因子数据,例如,门诊数据对应的风险因子数据可以包括固定时间内的门诊次数、慢性病、突发性疾病、固定时间内门诊的平均花费等,体检数据对应的风险因子数据可以包括血压、血糖、心率、身体质量指数,即体重公斤数除以身高米数平方得出的指数等,个人特征数据对应的风险因子可以包括年龄、性别、生活地域、职业等。
步骤S13,等级分析模块23将各个预设类型数据对应的风险因子对应的数据代入生成的所述健康风险等级分析模型中,以分析出该客户对应的健康风险等级。
步骤S13,所述等级分析模块23将所述客户对应的健康风险等级发送给所述终端设备3,并显示在终端设备3的显示设备31上。
参阅图5所示,是图4所示投保客户健康状况分析方法中生成健康风险等级分析模型的第一较佳实施例的实施流程图。本实施例所述投保客户健康状况分析方法并不限于流程图中所示步骤,此外流程图中所示步骤中,某些步骤可以省略、步骤之间的顺序可以改变。
步骤S100,模型建立模块20获取预设数量(例如,10万)已投保客户的预设类型数据。
步骤S101,模型建立模块20获得各个已投保客户的预设类型数据对应的风险因子数据,例如,门诊数据对应的风险因子数据可以包括固定时间内的门诊次数、慢性病、突发性疾病、固定时间内门诊的平均花费等,体检数据对应的风险因子数据可以包括血压、血糖、心率、身体质量指数,即体重公斤数除以身高米数平方得出的指数等,个人特征数据对应的风险因子可以包括年龄、性别、生活地域、职业等。
步骤S102,模型建立模块20对各个已投保客户的预设类型数据,按照预设分析规则进行健康风险等级划分,将不同健康风险等级的客户的预设类型数据对应的各个风险因子数据分发到不同的文件夹里。
例如,所述预设分析规则为:发生过的理赔额大于等于第一阈值或者发生过的理赔次数大于预设次数,例如,10次的客户的预设类型数据为一级健康风险等级数据;发生过的理赔次数小于等于预设次数,及有发生过的理赔额小于第一阈值且大于等于第二阈值的客户的预设类型数据为二级健康风险等级数据;发生过的理赔次数小于等于预设次数,及发生过的所有理赔额均小于第二阈值的客户的预设类型数据为三级健康风险等级数据;及未发生过理赔的客户的预设类型数据为四级健康风险等级数据。
例如,一级健康风险等级的预设类型数据的风险因子数据分发到第一文件夹里;二级健康风险等级的预设类型数据的风险因子数据分发到第二文件夹里;三级健康风险等级的预设类型数据的风险因子数据分发到第三文件夹里;四级健康风险等级的预设类型数据的风险因子数据分发到第四文件夹里。
步骤S103,模型建立模块20从不同文件夹下各提取第一预设比例,例如,70%的各个风险因子数据作为训练数据进行支持向量机(SVM)模型的训练,从不同文件夹下各取剩下的第二预设比例,例如,30%的各个风险因子数据作为测试数据以对生成的SVM模型进行准确性验证。
步骤S104,模型建立模块20判断生成的SVM模型准确率是否小于预设准确率,例如,99%。
若生成的SVM模型准确率小于预设准确率,则执行步骤S105,模型建立模块20增加预设类型数据的获取数量,并返回上述步骤S100,直到生成的SVM模型准确率大于所述预设准确率。
参阅图6所示,是图4所示投保客户健康状况分析方法中生成健康风险等级分析模型的第二较佳实施例的实施流程图。本实施例所述投保客户健康状况分析方法并不限于流程图中所示步骤,此外流程图中所示步骤中,某些步骤可以省略、步骤之间的顺序可以改变。
步骤S110,模型建立模块20获取预设数量(例如,10万)已投保客户的预设类型数据。
步骤S111,模型建立模块20获得各个已投保客户的预设类型数据对应的风险因子数据,例如,门诊数据对应的风险因子数据可以包括固定时间内的门诊次数、慢性病、突发性疾病、固定时间内门诊的平均花费等,体检数据对应的风险因子数据可以包括血压、血糖、心率、身体质量指数,即体重公斤数除以身高米数平方得出的指数等,个人特征数据对应的风险因子可以包括年龄、性别、生活地域、职业等.
步骤S112,模型建立模块20对各个已投保客户的预设类型数据,按照预设分析规则进行健康风险等级划分,将不同健康风险等级的客户的预设类型数据对应的各个风险因子数据分发到不同的文件夹里。
例如,所述预设分析规则为:发生过的理赔额大于等于第一阈值或者发生过的理赔次数大于预设次数,例如,10次的客户的预设类型数据为一级健康风险等级数据;发生过的理赔次数小于等于预设次数,及有发生过的理赔额小于第一阈值且大于等于第二阈值的客户的预设类型数据为二级健康风险等级数据;发生过的理赔次数小于等于预设次数,及发生过的所有理赔额均小于第二阈值的客户的预设类型数据为三级健康风险等级数据;及未发生过理赔的客户的预设类型数据为四级健康风险等级数据。
例如,一级健康风险等级的预设类型数据的风险因子数据分发到第一文件夹里;二级健康风险等级的预设类型数据的风险因子数据分发到第二文件夹里;三级健康风险等级的预设类型数据的风险因子数据分发到第三文件夹里;四级健康风险等级的预设类型数据的风险因子数据分发到第四文件夹里。
步骤S113,模型建立模块20从不同文件夹下各提取第一预设比例,例如,70%的各个风险因子数据作为训练数据进行支持向量机(SVM)模型的训练,从不同文件夹下各取剩下的第二预设比例,例如,30%的各个风险因子数据作为测试数据以对生成的SVM模型进行准确性验证。
步骤S114,模型建立模块20判断生成的SVM模型准确率是否小于预设准确率,例如,99%。
若生成的SVM模型准确率小于预设准确率,则执行步骤S115,模型建立模块20按照预设的因子调优规则对确定的风险因子进行删除和/或增加处理,并返回执行上述的步骤S111,直到生成的SVM模型准确率大于所述预设准确率。
其中,所述预设的因子调优规则为:在确定的风险因子中新增其他风险因子。
在其他实施例中,所述预设的因子调优规则可以为:确定生成的SVM模型中的各个风险因子对应的权重系数;找出权重系数最小的风险因子;从生成的SVM模型中的各个风险因子中删除找出的风险因子,和/或新增其他风险因子。
在其他实施例中,所述预设的因子调优规则为:确定生成的SVM模型中的各个风险因子对应的权重系数;找出权重系数最小的风险因子;若找出的风险因子的权重系数小于预设权重阈值,则从生成的SVM模型中的风险因子中删除找出的风险因子;若找出的风险因子的权重系数大于等于预设权重阈值,则新增其他风险因子。
最后所应说明的是,以上实施例仅用以说明本发明的技术方案而非限制,尽管参照较佳实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改或等同替换,而不脱离本发明技术方案的精神和范围。

Claims (4)

1.一种投保客户健康状况分析方法,其特征在于,该方法包括:
获取多个已投保客户的预设类型数据,基于所述已投保客户的预设类型数据,按照预设的模型生成规则,生成一个健康风险等级分析模型;
在收到针对一待投保客户的健康风险等级分析指令时,接收该客户的投保数据;
从所述客户的投保数据中获取预设类型数据作为健康风险数据,确定各个预设类型数据对应的风险因子数据;及
将各个预设类型数据对应的风险因子对应的数据代入生成的所述健康风险等级分析模型中,以分析出该客户对应的健康风险等级,发生过的理赔额大于等于第一阈值或者发生过的理赔次数大于预设次数为一级健康风险等级数据,发生过的理赔次数小于等于预设次数及有发生过的理赔额小于第一阈值且大于等于第二阈值的客户的预设类型数据为二级健康风险等级数据,发生过的理赔次数小于等于预设次数及发生过的所有理赔额均小于第二阈值的客户的预设类型数据为三级健康风险等级数据,未发生过理赔的客户的预设类型数据为四级健康风险等级数据;
其中,所述预设的模型生成规则包括:
获取预设数量已投保客户的预设类型数据;
获得各个已投保客户的预设类型数据对应的风险因子数据;
对各个已投保客户的预设类型数据,按照预设分析规则进行健康风险等级划分,将不同健康风险等级的客户的预设类型数据对应的各个风险因子数据分发到不同的文件夹里;
从不同文件夹下各提取第一预设比例的各个风险因子数据作为训练数据进行模型训练,从不同文件夹下各取剩下的第二预设比例的各个风险因子数据作为测试数据以对生成的模型进行准确性验证;及
若生成的SVM模型准确率小于预设准确率,则增加预设类型数据的获取数量,重复上述模型的生成过程,直到生成的模型准确率大于等于预设准确率;或按照预设的因子调优规则对确定的风险因子进行删除和/或增加处理,重复上述模型的生成过程,直到生成的模型准确率大于等于预设准确率,所述因子调优规则包括:确定生成的模型中的各个风险因子对应的权重系数;找出权重系数最小的风险因子;从生成的SVM模型中的各个风险因子中删除找出的风险因子,和/或新增其他风险因子。
2.如权利要求1所述的方法,其特征在于,所述预设类型数据包括:门诊数据、体检数据、个人特征数据;以及所述预设类型数据对应的风险因子数据包括:门诊数据对应的固定时间内的门诊次数、慢性病、突发性疾病及固定时间内门诊的平均花费,体检数据对应的血压、血糖、心率及身体质量指数,及个人特征数据对应的年龄、性别、生活地域及职业。
3.一种服务器,其特征在于,该服务器包括存储设备以及处理器,其中:
所述存储设备,用于存储一个投保客户健康状况分析***;
所述处理器,用于调用并执行所述投保客户健康状况分析***,以执行如下步骤:
获取多个已投保客户的预设类型数据,基于所述已投保客户的预设类型数据,按照预设的模型生成规则,生成一个健康风险等级分析模型;
在收到针对一待投保客户的健康风险等级分析指令时,接收该客户的投保数据;
从所述客户的投保数据中获取预设类型数据作为健康风险数据,确定各个预设类型数据对应的风险因子数据;及
将各个预设类型数据对应的风险因子对应的数据代入生成的所述健康风险等级分析模型中,以分析出该客户对应的健康风险等级,发生过的理赔额大于等于第一阈值或者发生过的理赔次数大于预设次数为一级健康风险等级数据,发生过的理赔次数小于等于预设次数及有发生过的理赔额小于第一阈值且大于等于第二阈值的客户的预设类型数据为二级健康风险等级数据,发生过的理赔次数小于等于预设次数及发生过的所有理赔额均小于第二阈值的客户的预设类型数据为三级健康风险等级数据,未发生过理赔的客户的预设类型数据为四级健康风险等级数据;
其中,所述预设的模型生成规则包括:
获取预设数量已投保客户的预设类型数据;
获得各个已投保客户的预设类型数据对应的风险因子数据;
对各个已投保客户的预设类型数据,按照预设分析规则进行健康风险等级划分,将不同健康风险等级的客户的预设类型数据对应的各个风险因子数据分发到不同的文件夹里;
从不同文件夹下各提取第一预设比例的各个风险因子数据作为训练数据进行模型训练,从不同文件夹下各取剩下的第二预设比例的各个风险因子数据作为测试数据以对生成的模型进行准确性验证;及
若生成的SVM模型准确率小于预设准确率,则增加预设类型数据的获取数量,重复上述模型的生成过程,直到生成的模型准确率大于等于预设准确率;或按照预设的因子调优规则对确定的风险因子进行删除和/或增加处理,重复上述模型的生成过程,直到生成的模型准确率大于等于预设准确率,所述因子调优规则包括:确定生成的模型中的各个风险因子对应的权重系数;找出权重系数最小的风险因子;从生成的SVM模型中的各个风险因子中删除找出的风险因子,和/或新增其他风险因子。
4.如权利要求3所述的服务器,其特征在于,所述预设类型数据包括:门诊数据、体检数据、个人特征数据;以及所述预设类型数据对应的风险因子数据包括:门诊数据对应的固定时间内的门诊次数、慢性病、突发性疾病及固定时间内门诊的平均花费,体检数据对应的血压、血糖、心率及身体质量指数,及个人特征数据对应的年龄、性别、生活地域及职业。
CN201610105653.5A 2016-02-26 2016-02-26 投保客户健康状况分析方法及服务器 Active CN107146160B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610105653.5A CN107146160B (zh) 2016-02-26 2016-02-26 投保客户健康状况分析方法及服务器

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610105653.5A CN107146160B (zh) 2016-02-26 2016-02-26 投保客户健康状况分析方法及服务器

Publications (2)

Publication Number Publication Date
CN107146160A CN107146160A (zh) 2017-09-08
CN107146160B true CN107146160B (zh) 2021-04-20

Family

ID=59783002

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610105653.5A Active CN107146160B (zh) 2016-02-26 2016-02-26 投保客户健康状况分析方法及服务器

Country Status (1)

Country Link
CN (1) CN107146160B (zh)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107910068A (zh) * 2017-11-29 2018-04-13 平安健康保险股份有限公司 投保用户的健康风险预测方法、装置、设备及存储介质
CN109325781A (zh) * 2018-09-04 2019-02-12 中国平安人寿保险股份有限公司 客户品质分析方法、装置、计算机设备和存储介质
CN109345397A (zh) * 2018-09-17 2019-02-15 平安科技(深圳)有限公司 智能分保方法、服务器及存储介质
CN109493244A (zh) * 2018-11-07 2019-03-19 平安医疗健康管理股份有限公司 基于预测模型配置保险需求的方法及相关产品
CN111091472A (zh) * 2019-11-25 2020-05-01 泰康保险集团股份有限公司 数据处理方法、装置及设备
CN110942314A (zh) * 2019-12-02 2020-03-31 中国建设银行股份有限公司 异常账户监管方法及装置
CN112183113A (zh) * 2020-10-14 2021-01-05 山东健康医疗大数据有限公司 基于健康医疗大数据的保险客户名单筛选方法及装置

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1591443A (zh) * 2004-06-17 2005-03-09 徐汇丰 人寿保险公司对保险客户核保医检的新方法
US8103528B2 (en) * 2007-11-20 2012-01-24 Hartford Fire Insurance Company System and method for administering dynamic security benefits and payments
CN101727532A (zh) * 2008-10-14 2010-06-09 邱小益 基于互联网的健康管理***及方法
CN102469145A (zh) * 2010-11-19 2012-05-23 岑澔 一种基于云计算的体质健康管理***
CN105184107A (zh) * 2015-10-20 2015-12-23 沈阳国际旅行卫生保健中心 一种人体循环***健康风险预警***

Also Published As

Publication number Publication date
CN107146160A (zh) 2017-09-08

Similar Documents

Publication Publication Date Title
CN107146160B (zh) 投保客户健康状况分析方法及服务器
WO2020048051A1 (zh) 理财产品推荐方法、服务器及计算机可读存储介质
CN108833458B (zh) 一种应用推荐方法、装置、介质及设备
US20190180379A1 (en) Life insurance system with fully automated underwriting process for real-time underwriting and risk adjustment, and corresponding method thereof
CN113742492B (zh) 保险方案生成方法、装置、电子设备及存储介质
CN110503564B (zh) 基于大数据的保全案件处理方法、***、设备及存储介质
CN110610431A (zh) 基于大数据的智能理赔方法及智能理赔***
CN109598302B (zh) 就诊费用预测方法、装置、设备及计算机可读存储介质
CN111091276A (zh) 企业风险评分方法、装置、计算机设备和存储介质
CN111797320A (zh) 数据处理方法、装置、设备及存储介质
CN109492863A (zh) 金融单证的自动生成方法及装置
CN116128627A (zh) 风险预测方法、装置、电子设备及存储介质
CN111144738A (zh) 信息处理方法、装置、计算机设备和存储介质
CN110765351A (zh) 目标用户识别方法、装置、计算机设备和存储介质
CN107644042B (zh) 软件程序点击率预估排序方法及服务器
CN116629556A (zh) 推荐任务的分配方法、装置、存储介质及电子设备
CN109460778B (zh) 活动评估方法、装置、电子设备及存储介质
CN109472455B (zh) 活动评估方法、装置、电子设备及存储介质
CN111652471A (zh) 名单分配控制方法、装置、电子设备及存储介质
CN107545347B (zh) 用于防控风险的属性确定方法、装置及服务器
CN113592662A (zh) 数据信息智能化处理方法、装置、设备及介质
CN113643140A (zh) 确定医保支出影响因素的方法、装置、设备和介质
CN112699872A (zh) 表单审核处理方法及装置、电子设备和存储介质
CN112529319A (zh) 基于多维特征的评分方法、装置、计算机设备及存储介质
CN111091472A (zh) 数据处理方法、装置及设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant