CN108197742A - 用户的续保行为预测方法、***及计算机可读存储介质 - Google Patents
用户的续保行为预测方法、***及计算机可读存储介质 Download PDFInfo
- Publication number
- CN108197742A CN108197742A CN201711497554.7A CN201711497554A CN108197742A CN 108197742 A CN108197742 A CN 108197742A CN 201711497554 A CN201711497554 A CN 201711497554A CN 108197742 A CN108197742 A CN 108197742A
- Authority
- CN
- China
- Prior art keywords
- insurance
- user
- continuation
- condition
- decision
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q40/00—Finance; Insurance; Tax strategies; Processing of corporate or income taxes
- G06Q40/08—Insurance
Landscapes
- Business, Economics & Management (AREA)
- Engineering & Computer Science (AREA)
- Strategic Management (AREA)
- Economics (AREA)
- Theoretical Computer Science (AREA)
- Finance (AREA)
- Human Resources & Organizations (AREA)
- Accounting & Taxation (AREA)
- Marketing (AREA)
- Development Economics (AREA)
- General Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- Physics & Mathematics (AREA)
- Tourism & Hospitality (AREA)
- Quality & Reliability (AREA)
- Operations Research (AREA)
- Entrepreneurship & Innovation (AREA)
- Game Theory and Decision Science (AREA)
- Technology Law (AREA)
- Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种用户的续保行为预测方法,包括步骤:获取已购保险的用户对应的用户数据,以及根据预设的基准算法计算用户对应的基准续保概率值;获取处于不同层级的多个对用户的续保行为造成积极效果的预测条件,其中,每个层级对应包括至少一个预测条件;根据用户数据以及所述用户对应的基准续保概率值,通过决策树模型,按照所述层级的顺序,将所述预测条件作为决策节点,依次选择对应层级的决策节点进行分类,以获得所述用户对应的续保概率值。本发明还提供一种用户的续保行为预测***以及计算机可读存储介质。本发明解决了销售员凭借个人经验预测用户续保行为准确性不高的问题,便于对大量用户的续保行为进行分析。
Description
技术领域
本发明涉及数据分析技术领域,尤其涉及一种用户的续保行为预测方法、***及计算机可读存储介质。
背景技术
随着人民生活水平的提高,人们对于人身安全和生命健康的保障意识也逐步提高,而其中提高安全和健康保障的措施之一即是购买保险。对于保险公司来说,如何维系好现有的用户,保证一定的续保人数,是保险公司保持盈利的基本手段之一,这其中就需要使用数据分析手段去预测哪些用户会续保。在此之前,对于用户的续保行为进行预测的方法主要是基于销售员根据有限的信息和个人经验来判断用户是否会续保,但对于大量用户而言,这种人为判断的方式准确性不高,而且不稳定。
发明内容
本发明的主要目的在于提供一种用户的续保行为预测方法、***及计算机可读存储介质,旨在解决用户续保行为预测的准确性不高的问题,提高预测的稳定性。
为实现上述目的,用户的续保行为预测方法,包括以下步骤:
获取已购保险的用户对应的用户数据,以及根据待预测保险业务对应的预设的基准算法计算所述用户对应的基准续保概率值;
获取处于不同层级的多个对所述用户的续保行为造成积极效果的预测条件,其中,所述每个层级对应包括至少一个所述预测条件;
根据所述用户数据以及所述用户对应的基准续保概率值,通过决策树模型,按照所述层级的顺序,将所述预测条件作为决策节点,依次选择对应层级的决策节点进行分类,以获得所述用户对应的待预测保险业务的续保概率值。
为实现上述目的,本发明还提供一种用户的续保行为预测***,包括:
获取模块,用于获取已购保险的用户对应的用户数据;
计算模块,用于根据预设的基准算法计算所述用户对应的基准续保概率值;
所述获取模块,还用于获取处于不同层级的多个对所述用户的续保行为造成积极效果的预测条件,其中,所述每个层级对应包括至少一个所述预测条件;
选择模块,用于根据所述用户数据以及所述用户对应的基准续保概率值,通过决策树模型,按照所述层级的顺序,将所述预测条件作为决策节点,依次选择对应层级的决策节点进行分类,以获得所述用户对应的待预测保险业务的续保概率值。
为实现上述目的,本发明还提供一种用户的续保行为预测***,包括通信模块、处理器、存储器及存储在存储器上并可在处理器上运行的计算机程序;所述处理器执行所述计算机程序时实现如上所述的用户的续保行为预测方法的步骤。
为实现上述目的,本发明还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如上所述的用户的续保行为预测方法的步骤。
本发明通过获取已购保险的用户对应的用户数据,以及根据待预测保险业务的对应的预设的基准算法计算所述用户对应的基准续保概率值;获取处于不同层级的多个对所述用户的续保行为造成积极效果的预测条件,其中,所述每个层级对应包括至少一个所述预测条件;根据所述用户数据以及所述用户对应的基准续保概率值,通过决策树模型,按照所述层级的顺序,将所述预测条件作为决策节点,依次选择对应层级的决策节点进行分类,以获得所述用户对应的续保概率值。由于本发明设置了对用户续保行为造成积极效果的多个预测条件,并使用了决策树模型进行分类,继而得到用户的续保概率值,使得在用户续保行为预测的过程中,整合了大量的用户数据,实现了用机器代替人为操作进行用户的续保行为的预测,预测准确性高,稳定性好。
附图说明
图1为本发明中的用户的续保行为预测***的网络结构示意图;
图2为本发明用户的续保行为预测方法的第一实施例的流程示意图;
图3为本发明用户的续保行为预测方法的第二实施例中步骤S30的细化流程示意图;
图4为本发明用户的续保行为预测方法的第三实施例的流程示意图;
图5为本发明用户的续保行为预测方法的第四实施例中步骤S10的细化流程示意图;
图6为本发明用户的续保行为预测方法的第五实施例中步骤S30的细化流程示意图;
图7为本发明用户的续保行为预测***的功能模块示意图。
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明。
在后续的描述中,使用用于表示元件的诸如“模块”、“部件”或“单元”的后缀仅为了有利于本发明的说明,其本身没有特定的意义。因此,“模块”、“部件”或“单元”可以混合地使用。
请参照图1,图1为本发明各个实施例中用户的续保行为预测***的结构示意图。所述用户的续保行为预测***可以是单独用于行为预测分析的平台***,也可以是作为数据收集整合的总的服务器,该用户的续保行为预测***可以部署在云端,也可以部署在本地。
所述用户的续保行为预测***包括通信模块10、存储器20及处理器30等部件。其中,所述处理器30分别与所述存储器20和所述通信模块10连接,所述存储器20上存储有计算机程序,所述计算机程序同时被处理器30执行。
通信模块10,可通过网络与外部设备,例如电子终端连接。通信模块10可以接收外部通讯设备发出的请求,还可发送事件、指令及信息至所述外部设备和/或其他服务器。所述外部通讯设备可以是扫描仪、键盘、手机、电脑及摄像设备等电子设备。
存储器20,可用于存储软件程序以及各种数据。存储器20可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作***等;存储数据区可存储根据用户的续保行为预测***的使用所创建的数据或信息等,例如用户的资产数据。此外,存储器20可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。
处理器30,是用户的续保行为预测***的控制中心,利用各种接口和线路连接整个用户的续保行为预测***的各个部分,通过运行或执行存储在存储器20内的软件程序和/或模块,以及调用存储在存储器20内的数据,执行用户的续保行为预测***的各种功能和处理数据。处理器30可包括一个或多个处理单元;优选的,处理器30可集成应用处理器和调制解调处理器,其中,应用处理器主要处理操作***、用户界面和应用程序等,调制解调处理器主要处理无线通信。可以理解的是,上述调制解调处理器也可以不集成到处理器30中。
尽管图1未示出,但上述用户的续保行为预测***还可以包括电路控制模块,用于与电源连接,保证其他部件的正常工作等。
本领域技术人员可以理解,图1中示出的***结构并不构成对用户的续保行为预测***的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
基于上述硬件结构,提出本发明用户的续保行为预测方法的第一实施例,参见图2,在本实施例中,所述方法包括步骤:
步骤S10,获取已购保险的用户对应的用户数据,以及根据待预测保险业务对应的预设的基准算法计算所述用户对应的基准续保概率值;
本实施例中,所述的已购保险的用户可以是集团企业客户,也可以是个人客户,涉及的保险种类可以是面向个人和/或企业的财产保险,也可以是针对个人的健康险或者人身安全险等。
处理器可以获取已购保险的用户对应的用户数据,所述用户数据可以是用户购买的所有保险的数据、用户的资产信息以及用户的基本身份信息,例如可以包括已购保险产品名称、保险类型、业务员、期缴保费、保费总额、用户资产信息、用户年龄信息、用户已购保险的索赔次数以及用户最近一次购买保险的时间。
还可以在获得了用户对应的用户数据后,对用户数据进行预处理,例如:根据该用户购买的所有保险产品的名称,将用户购买保险产品的全部数量相加得到用户持有保险产品的总数、用户购买这些保险产品的期缴保费各需要多少、期缴保费总计有多少都进行统计,即根据原始数据处理后得到后续需要判断的条件数据。
针对不同的待预测保险业务对应的预设的基准算法可以是相同的也可以是不同的,例如,已经买了商业医疗保险的用户,对同质同类的商业医疗保险的续保概率可能交底,而对意外伤害险或者其他理财型保险的续保概率可能较高,针对不同的待预测保险业务对应的预设的基准算法可以采用不同的预估算法。
此外,为了预测用户的续保行为,就需要得到用户的待预测保险业务的续保概率值,而为了得到该续保概率值,则需要一个基准续保概率值作为参考。例如,可以在预测分析之前向用户发出对已购保险的产品的满意度测评,可以直接让用户打分,也可以根据用户选择的各个选项计算出得分,可以理解地是,不同的用户会测评出不同的分数,测评出的分数可以转换为基准值续保概率值,也可以不转换直接作为用户对应的续保概率值;或者,还可以根据用户购买的不同的保险设定不同的基准续保概率值。
步骤S20,获取处于不同层级的多个对所述用户的续保行为造成积极效果的预测条件,其中,所述每个层级对应包括至少一个所述预测条件;
由于用户在考虑是否续保时,会结合被保险人的身体情况以及自身的资产情况等方面综合考虑,因此,可以基于此设置不同层级的预测条件,每个预测条件均是对用户的续保行为造成积极效果的。可以理解的是,还可以将所述预测条件设置为对所述用户的续保行为造成消极影响的预测条件,那么相应地后续执行的步骤和判断结果均相反,在此不再赘述。
需要说明的是,可以为不同层级对应的预测条件设置不同的权重,例如第一层预测条件对应的权重为0.462,第二层预测条件对应的权重为0.254;还可以按照预设的顺序对不同层级的预测条件进行排序,例如,按照权重从高到低的顺序进行排列。其中,对于预测条件的权重的设置主要是通过保险公司已有的客户以及已有客户的续保比率得出,还可以随着时间的推进,不断对公司已有的客户以及已有客户的续保比例进行更新,从而实时更新预测条件对应的权重。
步骤S30,根据所述用户数据以及所述用户对应的基准续保概率值,通过决策树模型,按照所述层级的顺序,将所述预测条件作为决策节点,依次选择对应层级的决策节点进行分类,以获得所述用户对应的待预测保险业务的续保概率值。
上一个决策节点会通过对应预测条件的分类情况衍生的决策枝与当前决策节点连接,当前决策节点会通过对应预测条件的分类情况衍生的决策枝与下一个决策节点连接。决策节点的分类则是依照层级的顺序进行,每个决策节点的分类都会影响用户的续保行为对应的续保概率值,当所有层级分类完成时,即获得用户对应的续保概率值。
同一层级可以对应包括至少一个所述预测条件,当同一层级包括两个或两个以上的预测条件,这些同一层级的预测条件对应的权重可以相同也可以不同。以下以同一层级包括两个预测条件进行说明,例如上一层决策节点对应的预测条件是用户已购平安保险的总数大于5.5个,如果用户已购平安保险的总数大于5.5个时,当前决策节点对应的预测条件为用户购买了H706产品;如果用户已购平安保险的总数小于或等于5.5个时,当前决策节点对应的预测条件为用户购买了H705产品。
此外,还以三个层级执行决策树模型分类得到用户的待预测保险业务的续保概率值进行举例说明,假设A客户持有平安各系列产品总数为10项,期缴保费合计2000元,且购买了产品H706。首先第一层时判断用户持有平安保险的产品总数是否大于5.5,A客户持有平安保险的产品总数满足大于5.5后继续判断第二层,第二层的预测条件为期缴保费合计大于1885.0,A客户期缴保费合计满足1885.0元;然后再判断第三层,第三层的预测条件为用户购买了产品H706,A客户购买了产品H706,则分析***自动判定A客户的续保概率为85.64%。
本实施例基于决策树模型,根据基准续保概率值结合不同层级的多个对所述用户的续保行为造成积极效果的预测条件依次选择对应层级的决策节点进行分类,从而获得所述用户对应的待预测保险业务的续保概率值,从而提供了一种基于大数据算法模型的用户的续保行为预测方法,解决了销售员凭借个人经验判断用户的续保行为准确性不高的问题,提高了预测的稳定性。再者,本方案只需要从用户或销售员处获得用户数据,适用于大量客户的行为预测。
参见图3,基于本发明用户的续保行为预测方法的第一实施例提出本发明用户的续保行为预测方法的第二实施例,在本实施例中,所述步骤S30包括:
步骤S31,根据所述用户数据以及所述用户对应的基准续保概率值,将所述预测条件作为决策节点,按照预设的顺序依次选择对应层级的决策节点,并根据所述用户数据判断该决策节点下所述预测条件是否成立;在依次选择对应层级的决策节点并确定该决策节点下所述预测条件成立时,执行步骤S32;在依次选择对应层级的决策节点并确定该决策节点下所述预测条件不成立时,执行步骤S33;
步骤S32,按照该预测条件对应的权重提升所述用户的续保概率;
步骤S33,按照该预测条件对应的权重降低所述用户的续保概率;
对用户的续保行为造成积极效果的预测条件会提升用户的续保概率;相反未对用户的续保行为造成积极效果,甚至造成了消极效果的预测条件,会降低用户的续保概率,因此当对用户的续保行为产生积极效果的预测条件成立时,可以基于已测得的用户的续保概率,按照预测条件对应的权重提升用户的续保概率;当对用户的续保行为产生积极效果的预测条件不成立时,可以基于已测得的用户的续保概率,按照预测条件对应的权重降低用户的续保概率。
例如,可以设层级总数为M(M=1,2,3...,M),每个层级对应只有一个预测条件,分别对应第一层为M1,第二层为M2,直至MM,基准续保概率值为N,每一层预测条件对应的权重转换成的概率提升值为NM(M=1,2,3,...,M),需要获取的用户的概率值为P。当开始进行用户的续保行为预测时,首先判断第一层对应的预测条件M1是否成立,当预测条件M1成立时,则判断结束后当前测得的续保概率为N1+N;接着判断第二层对应预测条件是否成立,当预测条件M2不成立时,则判断结束后测得的续保概率为N+N1-N2,直至判断到第MM层结束后,测得的续保概率即是最后获取的用户的待预测保险业务的续保概率值P。
步骤S34,在所述决策节点选择完成后,获取所述用户的待预测保险业务的续保概率值的计算结果。
决策节点选择完成的时机可以通过设置层数计数器进行确认,每一层对应的预测条件分类完成,计数器加一直至计数器数值等于所有层数为止,将最后分类测得的续保概率作为用户的待预测保险业务的续保概率值。本方案介绍了决策树模型用于用户的续保行为预测的过程,给出了用户对应的待预测保险业务的续保概率值的计算方法,解决了销售员凭借个人经验预测用户续保行为准确性不高的问题,便于对大量用户的续保行为进行分析。
参见图4,基于本发明用户的续保行为预测方法的第一实施例提出本发明用户的续保行为预测方法的第三实施例,在本实施例中,所述步骤S30之后还包括:
步骤S40,获取所述已购保险的用户实际的续保信息;
由于本方案是对于用户的续保行为的预测,而为了验证预测结果是否准确,可以在所有用户对应的用户已购保险全都超出了续保期限后收集统计已购保险的用户实际的续保信息。实际的续保信息可以包括用户是否产生续保行为,续保行为对应的保险详细信息等。
步骤S50,根据所述已购保险的用户实际的续保信息,判断所述预设的对所述用户的续保行为造成积极效果的预测条件是否成立;
在执行步骤S50的同时执行步骤S60,
步骤S60,根据所述已购保险的用户对应的用户数据,判断所述预设的对所述用户的续保行为造成积极效果的预测条件是否成立;
在根据所述已购保险的用户实际的续保信息确定所述预测条件成立,但根据所述已购保险的用户对应的用户数据确定所述预测条件不成立时,执行步骤S61;
步骤S61,确定该预测条件为假负判定条件;
在根据所述已购保险的用户实际的续保信息确定所述预测条件成立,且根据所述已购保险的用户对应的用户数据确定所述预测条件成立时,执行步骤S62;
步骤S62,确定该预测条件为真正判定条件;
在根据所述已购保险的用户实际的续保信息确定所述预测条件不成立,且根据所述已购保险的用户对应的用户数据确定所述预测条件不成立时,执行步骤S63;
步骤S63,确定该预测条件为真负判定条件;
在根据所述已购保险的用户实际的续保信息确定所述预测条件不成立,但根据所述已购保险的用户对应的用户数据确定所述预测条件成立时,执行步骤S64;
步骤S64,确定该预测条件为假正判定条件。
处理器根据收集的实际的已购保险用户的续保信息,可以确定真实情况下用户是否发生续保行为。处理器可以将已有用户数据分类结果与用户的真实续保情况进行结合,确定预测条件的真实性。
其中,所述对所述用户的续保行为造成积极效果的预测条件可以包括以下条件中的至少一种:
所述用户的已购保险总数量超过预设的数量阈值;
所述用户的期缴保费总额超过预设的保费阈值;
所述用户的已购保险产品包括预设产品编号对应的保险产品;
所述用户最近一次购买保险的时间在预设的时间范围内;
所述用户的年龄在预设的年龄范围内;
所述用户的已购保险的索赔次数在预设的次数阈值内;
所述用户的资产变化率超过预设的变化速率。
除此之外,还可以新增其他的预测条件以及该预测条件对应的权重。
在逻辑算法学科中,如果预测条件判断成立表示是积极条件或者正条件;如果预测条件判断不成立表示是消极条件或者负条件。但实际发生时如果预测条件是正确的,表示该预测条件为真条件;如果预测条件是错误的,表示该预测条件为假条件。将两者预测结合起来,即会出现四种情况,分别对应为假负判定条件、真正判定条件、真负判定条件以及假正判定条件。
进一步地,在确认预测条件的情况后,还可以执行以下步骤:
步骤S70,记录所有假负判定条件、真正判定条件、假正判定条件以及真负判定条件对应的个数;
在结合实际情况和以往数据确认预测条件对应的类型后,可以将所有事件类型对应的个数保存在存储器中。
步骤S80,根据假负判定条件、真正判定条件、假正判定条件以及真负判定条件对应的个数,通过以下算法计算用户的续保行为的准确率;
其中,Accuracy为准确率、TP为真正判定条件对应的个数、TN为真负判定条件对应的个数、∑Total为假负判定条件、真正判定条件、假正判定条件以及真负判定条件对应的个数之和。
准确率是分类准确的预测条件占所有预测条件总数的百分比,真正判定条件和真负判定条件相加即是分类准确的预测条件,所有的可能性对应的条件个数相加即是所有预测条件总数。通过计算准确率即可以得到用户的续保行为预测模型的准确度情况,方便分析人员根据准确率结果即时调整模型的参数、预测条件以及对应的权重。
此外,还可以通过算法计算错误率,其中Error rate表示错误率,FP表示假正判定条件对应的个数,FN表示假负判定条件对应的个数,∑Total为假负判定条件、真正判定条件、假正判定条件以及真负判定条件对应的个数之和。进一步地,错误率也等于1减去准确率。
还可以通过算法sensitive=TP/P计算灵敏度,表示所有正预测条件中被分对的比例,可以由此衡量出用户的续保行为预测对正预测条件的识别能力,其中sensitive表示灵敏度,TP表示真正判定条件,P表示真正判定条件和假正判定条件对应的个数之和。
还可以通过算法specificity=TN/N计算特效度,表示所有负预测条件中被分对的比例,可以由此衡量出用户的续保行为预测对负预测条件的识别能力,其中specificity表示特效度,TN表示真负判定条件,P表示真负判定条件对应的个数和假负判定条件对应的个数之和。
还可以由此得到综合评价指标以及评价处理缺失值和异常值能力的鲁棒性等评价指标,还可以得到ROC(Receiver Operating Characteristic)曲线以及PR(Precision-Recall)曲线。
参见图5,基于本发明用户的续保行为预测方法的第一实施例提出本发明用户的续保行为预测方法的第四实施例,在本实施例中,所述步骤S10包括:
步骤S11,获取已购保险的用户对应的用户数据;
步骤S12,获取所述用户的已购保险的满意度测评信息;
本实施例是对第一实施例中获取已购保险的用户对应的用户数据,以及根据预设的基准算法计算所述用户对应的基准续保概率值的进一步地改进,对于获取已购保险的用户对应的用户数据并无改进,本实施例与第一实施例的区别在于,本实施例进一步提出了预设的获得用户对应的基准续保概率值的基准算法。分析***或者销售员可以在用户续保期限结束前提示用户填写满意度测评表,为已购保险的满意度进行打分,然后生成已购保险的满意度测评信息给处理器。
步骤S13,根据所述用户的已购保险的满意度测评信息,测算得到所述用户对应的基准续保概率值。
处理器收到已购保险的满意度测评信息后,可以按照测评信息表中每条信息对应的分值计算用户对应的基准续保概率值。例如,提示用户填写的是满意度测评表,一共10道选择题,每道题5分,用户A填写完成后,有8道题的分值为3分,2道题为5分,则测评分数位为8*3+2*5=34分,可以按比例将其转化为基准概率值。
通过用户的满意度测评信息结合决策树模型获得用户的续保概率值,能得到更贴近不同用户的真实续保情况,提高续保行为预测的准确度。
参见图6,基于本发明用户的续保行为预测方法的第一实施例提出本发明用户的续保行为预测方法的第五实施例,在本实施例中,所述步骤S30包括:
步骤S35,重复多次执行根据所述用户数据以及所述用户对应的基准续保概率值,通过决策树模型,按照所述层级的顺序,将所述预测条件作为决策节点,依次选择对应层级的决策节点进行分类的步骤,以获取多个决策树续保概率值,其中,每次执行步骤的预测条件不完全相同;
仅通过一棵决策树进行分类和预测得到的用户续保概率可能会不太准确,提高准确的方法可以是进行重复多次验证,并保证每次进行分类的不同层级的所述预测条件不完全相同,使每棵决策树之间的分类都是独立的没有关联,同时多棵决策树组成了一个随机森林。
步骤S36,基于随机森林模型进行投票,以从所述多个决策树续保概率值中选择投票最多的决策树续保概率值作为所述用户对应的待预测保险业务的续保概率值。
当获取到已购保险的用户对应的用户数据时,让随机森林里的多棵决策树进行判断,以投票最多的结果作为最终的用户的续保概率值,提高了正确的概率。
本发明还提供一种用户的续保行为预测***,参见图7,在一实施例中,包括:
获取模块10,用于获取已购保险的用户对应的用户数据;
计算模块20,用于根据待预测保险业务的对应的预设的基准算法计算所述用户对应的基准续保概率值;
所述获取模块10,还用于获取处于不同层级的多个对所述用户的续保行为造成积极效果的预测条件,其中,所述每个层级对应包括至少一个所述预测条件;
选择模块30,用于根据所述用户数据以及所述用户对应的基准续保概率值,通过决策树模型,按照所述层级的顺序,将所述预测条件作为决策节点,依次选择对应层级的决策节点进行分类,以获得所述用户对应的待预测保险业务的续保概率值。
在另一实施例中,所述选择模块30包括判断单元31、处理单元32以及获取单元33;
所述判断单元31,用于根据所述用户数据以及所述用户对应的基准续保概率值,将所述预测条件作为决策节点,按照预设的顺序依次选择对应层级的决策节点,并根据所述用户数据判断该决策节点下所述预测条件是否成立;并在依次选择对应层级的决策节点并确定该决策节点下所述预测条件成立时,触发所述处理单元32按照该预测条件对应的权重提升所述用户的续保概率;在依次选择对应层级的决策节点并确定该决策节点下所述预测条件不成立时,触发所述处理单元32按照该预测条件对应的权重降低所述用户的续保概率;
所述获取单元33,用于在所述决策节点选择完成后,获取所述用户的待预测保险业务的续保概率值的计算结果。
在又一实施例中,还包括判断模块40和确定模块50;
所述获取模块10,用于获取所述已购保险的用户实际的续保信息;
所述判断模块40,用于根据所述已购保险的用户实际的续保信息,判断所述预设的对所述用户的续保行为造成积极效果的预测条件是否成立;
在根据所述已购保险的用户实际的续保信息确定所述预测条件成立,但根据所述已购保险的用户对应的用户数据确定所述预测条件不成立时,触发所述确定模块50确定该预测条件为假负判定条件;
在根据所述已购保险的用户实际的续保信息确定所述预测条件成立,且根据所述已购保险的用户对应的用户数据确定所述预测条件成立时,触发所述确定模块50确定该预测条件为真正判定条件;
在根据所述已购保险的用户实际的续保信息确定所述预测条件不成立,且根据所述已购保险的用户对应的用户数据确定所述预测条件不成立时,触发所述确定模块50确定该预测条件为真负判定条件;
在根据所述已购保险的用户实际的续保信息确定所述预测条件不成立,但根据所述已购保险的用户对应的用户数据确定所述预测条件成立时,触发所述确定模块50确定该预测条件为假正判定条件。
在又一实施例中,还包括记录模块60;
所述记录模块60,用于记录所有假负判定条件、真正判定条件、假正判定条件以及真负判定条件对应的个数;
所述计算模块20,还用于根据假负判定条件、真正判定条件、假正判定条件以及真负判定条件对应的个数,通过以下算法计算用户的续保行为的准确率;
其中,Accuracy为准确率、TP为真正判定条件对应的个数、TN为真负判定条件对应的个数、∑Total为假负判定条件、真正判定条件、假正判定条件以及真负判定条件对应的个数之和。
在又一实施例中,所述对所述用户的续保行为造成积极效果的预测条件包括以下条件中的至少一种:
所述用户的已购保险总数量超过预设的数量阈值;
所述用户的期缴保费总额超过预设的保费阈值;
所述用户的已购保险产品包括预设产品编号对应的保险产品;
所述用户最近一次购买保险的时间在预设的时间范围内;
所述用户的年龄在预设的年龄范围内;
所述用户的已购保险的索赔次数在预设的次数阈值内;
所述用户的资产变化率超过预设的变化速率。
在又一实施例中,所述计算模块20还用于获取所述用户的已购保险的满意度测评信息;并根据所述用户的已购保险的满意度测评信息,测算得到所述用户对应的基准续保概率值。
选择模块30包括获取单元33以及选择单元34;
所述获取单元33,用于重复多次执行根据所述用户数据以及所述用户对应的基准续保概率值,通过决策树模型,按照所述层级的顺序,将所述预测条件作为决策节点,依次选择对应层级的决策节点进行分类的步骤,以获取多个决策树续保概率值,其中,每次执行步骤的预测条件不完全相同;
所述选择单元34,用于基于随机森林模型进行投票,以从所述多个决策树续保概率值中选择投票最多的决策树续保概率值作为所述用户对应的待预测保险业务的续保概率值。
请继续参照图1,本发明还提供一种用户的续保行为预测***,包括通信模块10、存储器20、处理器30及存储在存储器20上并可在处理器30上运行的计算机程序;所述处理器30执行所述计算机程序时实现如上所述的用户的续保行为预测方法的步骤。
本发明还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如上所述的用户的续保行为预测方法的步骤。
在本说明书的描述中,参考术语“一实施例”、“另一实施例”、“其他实施例”、或“第一实施例~第X实施例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或示例。而且,描述的具体特征、结构、材料、方法步骤或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
通过以上的实施例的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施例。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个计算机可读存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端(可以是手机,计算机,服务器,空调器,或者网络设备等)执行本发明各个实施例所述的方法。
上面结合附图对本发明的实施例进行了描述,但是本发明并不局限于上述的具体实施例,上述的具体实施例仅仅是示意性的,而不是限制性的,本领域的普通技术人员在本发明的启示下,在不脱离本发明宗旨和权利要求所保护的范围情况下,还可做出很多形式,这些均属于本发明的保护之内。
Claims (10)
1.一种用户的续保行为预测方法,其特征在于,包括步骤:
获取已购保险的用户对应的用户数据,以及根据待预测保险业务对应的预设的基准算法计算所述用户对应的基准续保概率值;
获取处于不同层级的多个对所述用户的续保行为造成积极效果的预测条件,其中,所述每个层级对应包括至少一个所述预测条件;
根据所述用户数据以及所述用户对应的基准续保概率值,通过决策树模型,按照所述层级的顺序,将所述预测条件作为决策节点,依次选择对应层级的决策节点进行分类,以获得所述用户对应的待预测保险业务的续保概率值。
2.如权利要求1所述的用户的续保行为预测方法,其特征在于,所述根据所述用户数据以及所述用户对应的基准续保概率值,通过决策树模型,按照所述层级的顺序,将所述预测条件作为决策节点,依次选择对应层级的决策节点进行分类,以获得所述用户对应的待预测保险业务的续保概率值的步骤,包括:
根据所述用户数据以及所述用户对应的基准续保概率值,将所述预测条件作为决策节点,按照预设的顺序依次选择对应层级的决策节点,并根据所述用户数据判断该决策节点下所述预测条件是否成立;
在依次选择对应层级的决策节点并确定该决策节点下所述预测条件成立时,按照该预测条件对应的权重提升所述用户的续保概率;
在依次选择对应层级的决策节点并确定该决策节点下所述预测条件不成立时,按照该预测条件对应的权重降低所述用户的续保概率;
在所述决策节点选择完成后,获取所述用户的待预测保险业务的续保概率值的计算结果。
3.如权利要求1所述的用户的续保行为预测方法,其特征在于,所述根据所述用户数据以及所述用户对应的基准续保概率值,通过决策树模型,按照所述层级的顺序,将所述预测条件作为决策节点,依次选择对应层级的决策节点进行分类,以获得所述用户对应的待预测保险业务的续保概率值的步骤之后,还包括:
获取所述已购保险的用户实际的续保信息;
根据所述已购保险的用户实际的续保信息,判断所述预设的对所述用户的续保行为造成积极效果的预测条件是否成立;
在根据所述已购保险的用户实际的续保信息确定所述预测条件成立,但根据所述已购保险的用户对应的用户数据确定所述预测条件不成立时,确定该预测条件为假负判定条件;
在根据所述已购保险的用户实际的续保信息确定所述预测条件成立,且根据所述已购保险的用户对应的用户数据确定所述预测条件成立时,确定该预测条件为真正判定条件;
在根据所述已购保险的用户实际的续保信息确定所述预测条件不成立,且根据所述已购保险的用户对应的用户数据确定所述预测条件不成立时,确定该预测条件为真负判定条件;
在根据所述已购保险的用户实际的续保信息确定所述预测条件不成立,但根据所述已购保险的用户对应的用户数据确定所述预测条件成立时,确定该预测条件为假正判定条件。
4.如权利要求3所述的用户的续保行为预测方法,其特征在于,在所有步骤之后还包括:
记录所有假负判定条件、真正判定条件、假正判定条件以及真负判定条件对应的个数;
根据假负判定条件、真正判定条件、假正判定条件以及真负判定条件对应的个数,通过以下算法计算用户的续保行为的准确率;
其中,Accuracy为准确率、TP为真正判定条件对应的个数、TN为真负判定条件对应的个数、∑Total为假负判定条件、真正判定条件、假正判定条件以及真负判定条件对应的个数之和。
5.如权利要求1所述的用户的续保行为预测方法,其特征在于,所述对所述用户的续保行为造成积极效果的预测条件包括以下条件中的至少一种:
所述用户的已购保险总数量超过预设的数量阈值;
所述用户的期缴保费总额超过预设的保费阈值;
所述用户的已购保险产品包括预设产品编号对应的保险产品;
所述用户最近一次购买保险的时间在预设的时间范围内;
所述用户的年龄在预设的年龄范围内;
所述用户的已购保险的索赔次数在预设的次数阈值内;
所述用户的资产变化率超过预设的变化速率。
6.如权利要求1所述的用户的续保行为预测方法,其特征在于,还包括步骤:
获取所述用户的已购保险的满意度测评信息;
根据所述用户的已购保险的满意度测评信息,测算得到所述用户对应的基准续保概率值。
7.如权利要求1所述的用户的续保行为预测方法,其特征在于,所述根据所述用户数据以及所述用户对应的基准续保概率值,通过决策树模型,按照所述层级的顺序,将所述预测条件作为决策节点,依次选择对应层级的决策节点进行分类,以获得所述用户对应的待预测保险业务的续保概率值的步骤包括:
重复多次执行根据所述用户数据以及所述用户对应的基准续保概率值,通过决策树模型,按照所述层级的顺序,将所述预测条件作为决策节点,依次选择对应层级的决策节点进行分类的步骤,以获取多个决策树续保概率值,其中,每次执行步骤的预测条件不完全相同;
基于随机森林模型进行投票,以从所述多个决策树续保概率值中选择投票最多的决策树续保概率值作为所述用户对应的待预测保险业务的续保概率值。
8.一种用户的续保行为预测***,其特征在于,包括:
获取模块,用于获取已购保险的用户对应的用户数据;
计算模块,用于根据预设的基准算法计算所述用户对应的基准续保概率值;
所述获取模块,还用于获取处于不同层级的多个对所述用户的续保行为造成积极效果的预测条件,其中,所述每个层级对应包括至少一个所述预测条件;
选择模块,用于根据所述用户数据以及所述用户对应的基准续保概率值,通过决策树模型,按照所述层级的顺序,将所述预测条件作为决策节点,依次选择对应层级的决策节点进行分类,以获得所述用户对应的待预测保险业务的续保概率值。
9.一种用户的续保行为预测***,其特征在于,包括通信模块、处理器、存储器及存储在存储器上并可在处理器上运行的计算机程序;所述处理器执行所述计算机程序时实现如权利要求1-7任一项所述的用户的续保行为预测方法的步骤。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1-7任一项所述的用户的续保行为预测方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201711497554.7A CN108197742A (zh) | 2017-12-29 | 2017-12-29 | 用户的续保行为预测方法、***及计算机可读存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201711497554.7A CN108197742A (zh) | 2017-12-29 | 2017-12-29 | 用户的续保行为预测方法、***及计算机可读存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN108197742A true CN108197742A (zh) | 2018-06-22 |
Family
ID=62587557
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201711497554.7A Pending CN108197742A (zh) | 2017-12-29 | 2017-12-29 | 用户的续保行为预测方法、***及计算机可读存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108197742A (zh) |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109447824A (zh) * | 2018-09-26 | 2019-03-08 | 平安健康保险股份有限公司 | 保单数据处理方法、装置、计算机设备和存储介质 |
CN109785076A (zh) * | 2019-01-28 | 2019-05-21 | 中国平安财产保险股份有限公司 | 信息的获取方法、装置、计算机设备和存储介质 |
CN110136011A (zh) * | 2019-05-09 | 2019-08-16 | 泰康保险集团股份有限公司 | 保险智能报价方法、装置、介质及电子设备 |
CN110659922A (zh) * | 2018-06-28 | 2020-01-07 | 马上消费金融股份有限公司 | 一种客户筛选方法、装置、服务器及计算机可读存储介质 |
CN113177801A (zh) * | 2020-03-04 | 2021-07-27 | 阿里巴巴集团控股有限公司 | 一种信息处理方法、装置、电子设备以及存储介质 |
CN113837889A (zh) * | 2021-11-26 | 2021-12-24 | 太平金融科技服务(上海)有限公司深圳分公司 | 业务数据生成方法、装置、计算机设备和存储介质 |
CN117834780A (zh) * | 2024-03-05 | 2024-04-05 | 济南云上电子科技有限公司 | 一种智能外呼客户意图预测分析*** |
CN109447824B (zh) * | 2018-09-26 | 2024-06-28 | 平安健康保险股份有限公司 | 保单数据处理方法、装置、计算机设备和存储介质 |
-
2017
- 2017-12-29 CN CN201711497554.7A patent/CN108197742A/zh active Pending
Cited By (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110659922A (zh) * | 2018-06-28 | 2020-01-07 | 马上消费金融股份有限公司 | 一种客户筛选方法、装置、服务器及计算机可读存储介质 |
CN110659922B (zh) * | 2018-06-28 | 2021-01-26 | 马上消费金融股份有限公司 | 一种客户筛选方法、装置、服务器及计算机可读存储介质 |
CN109447824A (zh) * | 2018-09-26 | 2019-03-08 | 平安健康保险股份有限公司 | 保单数据处理方法、装置、计算机设备和存储介质 |
CN109447824B (zh) * | 2018-09-26 | 2024-06-28 | 平安健康保险股份有限公司 | 保单数据处理方法、装置、计算机设备和存储介质 |
CN109785076A (zh) * | 2019-01-28 | 2019-05-21 | 中国平安财产保险股份有限公司 | 信息的获取方法、装置、计算机设备和存储介质 |
CN110136011A (zh) * | 2019-05-09 | 2019-08-16 | 泰康保险集团股份有限公司 | 保险智能报价方法、装置、介质及电子设备 |
CN113177801A (zh) * | 2020-03-04 | 2021-07-27 | 阿里巴巴集团控股有限公司 | 一种信息处理方法、装置、电子设备以及存储介质 |
CN113837889A (zh) * | 2021-11-26 | 2021-12-24 | 太平金融科技服务(上海)有限公司深圳分公司 | 业务数据生成方法、装置、计算机设备和存储介质 |
CN113837889B (zh) * | 2021-11-26 | 2022-03-18 | 太平金融科技服务(上海)有限公司深圳分公司 | 业务数据生成方法、装置、计算机设备和存储介质 |
CN117834780A (zh) * | 2024-03-05 | 2024-04-05 | 济南云上电子科技有限公司 | 一种智能外呼客户意图预测分析*** |
CN117834780B (zh) * | 2024-03-05 | 2024-05-14 | 济南云上电子科技有限公司 | 一种智能外呼客户意图预测分析*** |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108197742A (zh) | 用户的续保行为预测方法、***及计算机可读存储介质 | |
CN107910068A (zh) | 投保用户的健康风险预测方法、装置、设备及存储介质 | |
CN108257027B (zh) | 保单数据审核方法、装置、计算机设备及存储介质 | |
CN109074389A (zh) | 可信度指标的众包 | |
CN108665159A (zh) | 一种风险评估方法、装置、终端设备及存储介质 | |
CN110417721A (zh) | 安全风险评估方法、装置、设备及计算机可读存储介质 | |
CN107437198A (zh) | 确定用户风险偏好的方法、信息推荐方法及装置 | |
CN110009449A (zh) | 商家信用评估方法、服务器及存储介质 | |
CN112559900B (zh) | 产品推荐方法、装置、计算机设备和存储介质 | |
CN109670852A (zh) | 用户分类方法、装置、终端及存储介质 | |
CN109242573A (zh) | App的评价方法、装置、设备及存储介质 | |
CN108304853B (zh) | 游戏相关度的获取方法、装置、存储介质和电子装置 | |
CN112494952A (zh) | 目标游戏用户的检测方法、装置及设备 | |
CN108109066A (zh) | 一种信用评分模型更新方法及*** | |
CN111160783A (zh) | 数字资产价值的评价方法、***及电子设备 | |
CN107767055A (zh) | 一种基于串谋检测的众包结果汇聚方法及装置 | |
CN111695831B (zh) | 一种开源代码的使用风险评估方法、装置及电子设备 | |
CN110517071A (zh) | 基于机器模型的信息预测方法、装置、设备及存储介质 | |
CN109636565A (zh) | 风险数据的处理方法、装置、设备及计算机可读存储介质 | |
CN108776846A (zh) | 推荐方法、装置、计算机设备及存储介质 | |
CN110533525A (zh) | 用于评估实体风险的方法及装置 | |
CN115062734A (zh) | 可输出解释性信息的风控建模方法、装置、设备及介质 | |
Gonzalez et al. | Validation techniques for case-based reasoning systems | |
CN114782123A (zh) | 一种信用评估方法及*** | |
CN107908673A (zh) | 社交平台用户的现实关系匹配方法、装置及可读存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20180622 |
|
RJ01 | Rejection of invention patent application after publication |