CN115409636A - 产品风险预测方法、装置、设备及介质 - Google Patents

产品风险预测方法、装置、设备及介质 Download PDF

Info

Publication number
CN115409636A
CN115409636A CN202211068818.8A CN202211068818A CN115409636A CN 115409636 A CN115409636 A CN 115409636A CN 202211068818 A CN202211068818 A CN 202211068818A CN 115409636 A CN115409636 A CN 115409636A
Authority
CN
China
Prior art keywords
operation data
target
risk
basic operation
risk prediction
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202211068818.8A
Other languages
English (en)
Inventor
王松松
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Industrial and Commercial Bank of China Ltd ICBC
Original Assignee
Industrial and Commercial Bank of China Ltd ICBC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Industrial and Commercial Bank of China Ltd ICBC filed Critical Industrial and Commercial Bank of China Ltd ICBC
Priority to CN202211068818.8A priority Critical patent/CN115409636A/zh
Publication of CN115409636A publication Critical patent/CN115409636A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/08Insurance

Landscapes

  • Business, Economics & Management (AREA)
  • Accounting & Taxation (AREA)
  • Finance (AREA)
  • Engineering & Computer Science (AREA)
  • Development Economics (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Strategic Management (AREA)
  • Technology Law (AREA)
  • Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本公开提供了一种产品风险预测方法、装置、设备、介质和程序产品,可以应用于人工智能领域、大数据领域和金融科技领域。该方法包括:利用目标客户字段和基础运营数据字段,从基础运营数据表中查询与目标客户对应的基础运营数据集,以及基础运营数据集中基础运营数据各自的风险相关性信息;根据基础运营数据各自的风险相关性信息,从与目标客户对应的基础运营数据集中筛选出目标运营数据;将目标运营数据输入至目标风险预测模型,输出风险预测结果;将目标运营数据输入至运营数据评分模型,输出运营评分结果;以及根据风险预测结果和运营评分结果,确定与目标客户关联的目标产品的产品风险预测结果。

Description

产品风险预测方法、装置、设备及介质
技术领域
本公开涉及人工智能领域、大数据领域和金融科技领域,具体地涉及一种产品风险预测方法、装置、设备、介质和程序产品。
背景技术
随着经济的快速发展,企业等相关机构为满足快速发展的业务需求,可以在满足相关法规的调教下,通过售卖债券、信托等金融产品,从而帮助相关机构获取到用于满足业务发展需求的融资金额。相应地,购买债券、信托等金融产品的用户也可以通过金融产品中规定的收益比例获取收益金额。
在实际的金融产品交易场景中,需要通过预测金融产品的风险来辅助金融产品进行交易,而相关技术中金融产品风险的预测准确率通常较低,难以满足实际需求。
发明内容
鉴于上述问题,本公开提供了产品风险预测方法、装置、设备、介质和程序产品。
根据本公开的第一个方面,提供了一种产品风险预测方法,包括:
利用目标客户字段和基础运营数据字段,从基础运营数据表中查询与目标客户对应的基础运营数据集,以及上述基础运营数据集中基础运营数据各自的风险相关性信息;
根据上述基础运营数据各自的风险相关性信息,从与目标客户对应的基础运营数据集中筛选出目标运营数据;
将上述目标运营数据输入至目标风险预测模型,输出风险预测结果;
将上述目标运营数据输入至运营数据评分模型,输出运营评分结果;以及
根据上述风险预测结果和上述运营评分结果,确定与上述目标客户关联的目标产品的产品风险预测结果。
根据本公开的实施例,上述基础运营数据具有运营数据标识;
上述产品风险预测方法还包括:
根据时间序列模型对样本基础运营数据进行风险相关性分析,得到上述样本基础运营数据的风险相关性信息,其中,上述样本基础运营数据具有与上述基础运营数据对应的样本运营数据标识;以及
根据上述样本基础运营数据的风险相关性信息,以及上述样本运营数据标识与上述运营数据标识的对应关系,确定上述基础运营数据各自的风险相关性信息。
根据本公开的实施例,根据时间序列模型对样本基础运营数据进行风险相关性分析,得到上述样本基础运营数据的风险相关性信息包括:
将上述样本基础运营数据输入至上述时间序列模型,得到样本风险预测结果;以及
基于预设算法处理上述样本风险预测结果和与上述样本基础运营数据对应的样本标签,以便迭代地调整上述时间序列模型的参数,直至上述样本风险预测结果和上述样本标签之间的差异值收敛,得到上述时间序列模型的目标参数,其中,上述时间序列模型的目标参数为上述样本基础运营数据各自的风险相关性信息。
根据本公开的实施例,上述基础运营数据集中包括L个基础运营数据,L为大于1的正整数;
根据基础运营数据各自的风险相关性信息,从与目标客户对应的基础运营数据集中筛选出目标运营数据包括:
根据预设风险阈值,在上述基础运营数据集中确定M个候选基础运营数据,其中,上述候选基础运营数据的风险相关性信息大于或等于上述预设风险阈值,L>M≥1;以及
从上述基础运营数据集中筛选出M个上述候选基础运营数据,得到M个上述目标运营数据。
根据本公开的实施例,产品风险预测方法还包括:
利用训练样本分别训练N个初始风险预测模型中的每个初始风险预测模型,得到训练后的N个候选风险预测模型,其中,上述训练样本包括样本目标运营数据和与上述样本目标运营数据对应的样本标签,N为大于2的正整数;
根据上述样本标签,确定N个上述候选风险预测模型各自的预测效果信息;以及
根据N个上述候选风险预测模型各自的预测效果信息,从N个上述候选风险预测模型中确定上述目标风险预测模型。
根据本公开的实施例,上述预测效果信息包括以下至少一项:
预测覆盖率信息、预测准确率信息、预测召回率信息。
根据本公开的实施例,
上述目标风险预测模型包括基于决策树算法构建得到的决策树预测模型;或
上述目标风险预测模型包括基于神经网络算法构建得到的神经网络预测模型。
根据本公开的实施例,上述决策树预测模型包括以下任意一项:
极端梯度提升模型、随机森林模型、轻度梯度提升机模型。
根据本公开的实施例,上述风险预测结果包括第一产品风险概率,上述产品风险预测结果包括产品风险概率;
其中,根据上述风险预测结果和上述运营评分结果,确定与上述目标客户关联的目标产品的产品风险预测结果包括:
利用预设映射函数处理上述运营评分结果,得到与上述运营评分结果对应的第二产品风险概率;以及
根据上述第一产品风险概率和上述第二产品风险概率,确定上述目标产品的产品风险概率。
本公开的第二方面提供了一种产品风险预测装置,包括:
查询模块,用于利用目标客户字段和基础运营数据字段,从基础运营数据表中查询与目标客户对应的基础运营数据集,以及上述基础运营数据集中基础运营数据各自的风险相关性信息;
第一筛选模块,用于根据上述基础运营数据各自的风险相关性信息,从与目标客户对应的基础运营数据集中筛选出目标运营数据;
风险预测模块,用于将上述目标运营数据输入至目标风险预测模型,输出风险预测结果;
运营评分模块,用于将上述目标运营数据输入至运营数据评分模型,输出运营评分结果;以及
产品风险确定模块,用于根据上述风险预测结果和上述运营评分结果,确定与上述目标客户关联的目标产品的产品风险预测结果。
本公开的第三方面提供了一种电子设备,包括:一个或多个处理器;存储器,用于存储一个或多个程序,其中,当所述一个或多个程序被所述一个或多个处理器执行时,使得一个或多个处理器执行上述产品风险预测方法。
本公开的第四方面还提供了一种计算机可读存储介质,其上存储有可执行指令,该指令被处理器执行时使处理器执行上述产品风险预测方法。
本公开的第五方面还提供了一种计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现上述产品风险预测方法。
附图说明
通过以下参照附图对本公开实施例的描述,本公开的上述内容以及其他目的、特征和优点将更为清楚,在附图中:
图1示意性示出了根据本公开实施例的产品风险预测方法、装置的应用场景图;
图2示意性示出了根据本公开实施例的产品风险预测方法的流程图;
图3示意性示出了根据本公开另一实施例的产品风险预测方法的流程图;
图4示意性释出了本公开的实施例中候选风险预测模型各自的预测效果信息的示意图;
图5示意性释出了根据本公开实施例的产品风险预测方法的应用场景图;
图6示意性示出了根据本公开实施例的产品风险预测装置的结构框图;以及
图7示意性示出了根据本公开实施例的适于实现产品风险预测方法的电子设备的方框图。
具体实施方式
以下,将参照附图来描述本公开的实施例。但是应该理解,这些描述只是示例性的,而并非要限制本公开的范围。在下面的详细描述中,为便于解释,阐述了许多具体的细节以提供对本公开实施例的全面理解。然而,明显地,一个或多个实施例在没有这些具体细节的情况下也可以被实施。此外,在以下说明中,省略了对公知结构和技术的描述,以避免不必要地混淆本公开的概念。
在此使用的术语仅仅是为了描述具体实施例,而并非意在限制本公开。在此使用的术语“包括”、“包含”等表明了所述特征、步骤、操作和/或部件的存在,但是并不排除存在或添加一个或多个其他特征、步骤、操作或部件。
在此使用的所有术语(包括技术和科学术语)具有本领域技术人员通常所理解的含义,除非另外定义。应注意,这里使用的术语应解释为具有与本说明书的上下文相一致的含义,而不应以理想化或过于刻板的方式来解释。
在使用类似于“A、B和C等中至少一个”这样的表述的情况下,一般来说应该按照本领域技术人员通常理解该表述的含义来予以解释(例如,“具有A、B和C中至少一个的***”应包括但不限于单独具有A、单独具有B、单独具有C、具有A和B、具有A和C、具有B和C、和/或具有A、B、C的***等)。
在本公开的技术方案中,所涉及的用户个人信息的收集、存储、使用、加工、传输、提供、公开和应用等处理,均符合相关法律法规的规定,采取了必要保密措施,且不违背公序良俗。
在本公开的技术方案中,在获取或采集用户个人信息之前,均获取了用户的授权或同意。
在针对金融产品的风险评估***中,可以基于相关技术中的打分模型对产品的风险进行评估,例如金融机构可以基于专业知识和相关规则对客户的债券产品的违约风险进行评估,从而预测该债券产品的违约概率。而该种针对金融产品的风险预测方法难以快速迭代,且风险预测的准确率较低,难以满足实际的需求。
本公开的实施例提供了一种产品风险预测方法、装置、设备、介质和程序产品。该产品风险预测方法包括:
利用目标客户字段和基础运营数据字段,从基础运营数据表中查询与目标客户对应的基础运营数据集,以及基础运营数据集中基础运营数据各自的风险相关性信息;根据基础运营数据各自的风险相关性信息,从与目标客户对应的基础运营数据集中筛选出目标运营数据;将目标运营数据输入至目标风险预测模型,输出风险预测结果;将目标运营数据输入至运营数据评分模型,输出运营评分结果;以及根据风险预测结果和运营评分结果,确定与目标客户关联的目标产品的产品风险预测结果。
根据本公开的实施例,通过根据风险相关性信息从基础运营数据集中确定目标运营数据,可以筛除基础运营数据中与产品风险相关性较低的数据,排除噪音数据干扰,提升后续目标风险预测模型的计算效率,通过将目标运营数据输入至目标风险预测模型,可以从预测模型的算法维度对目标产品的风险进行预测,同时将目标运营数据输入至运营数据评分模型,可以使输出的运营评分结果从规则评分维度对目标产品的风险进行评价,进而根据风险预测结果和运营评分结果,确定目标产品的产品风险预测结果,可以在多维度预测目标产品的产品风险的条件下,预测目标产品产生风险的可能性,从而实现提升针对目标产品的产品风险预测的准确性的技术效果。
图1示意性示出了根据本公开实施例的产品风险预测方法、装置的应用场景图。
如图1所示,根据该实施例的应用场景100可以包括终端设备101、102、103、网络104和服务器105。网络104用以在终端设备101、102、103和服务器105之间提供通信链路的介质。网络104可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。
用户可以使用终端设备101、102、103通过网络104与服务器105交互,以接收或发送消息等。终端设备101、102、103上可以安装有各种通讯客户端应用,例如购物类应用、网页浏览器应用、搜索类应用、即时通信工具、邮箱客户端、社交平台软件等(仅为示例)。
终端设备101、102、103可以是具有显示屏并且支持网页浏览的各种电子设备,包括但不限于智能手机、平板电脑、膝上型便携计算机和台式计算机等等。
服务器105可以是提供各种服务的服务器,例如对用户利用终端设备101、102、103所浏览的网站提供支持的后台管理服务器(仅为示例)。后台管理服务器可以对接收到的用户请求等数据进行分析等处理,并将处理结果(例如根据用户请求获取或生成的网页、信息、或数据等)反馈给终端设备。
需要说明的是,本公开实施例所提供的产品风险预测方法一般可以由服务器105执行。相应地,本公开实施例所提供的产品风险预测装置一般可以设置于服务器105中。本公开实施例所提供的产品风险预测方法也可以由不同于服务器105且能够与终端设备101、102、103和/或服务器105通信的服务器或服务器集群执行。相应地,本公开实施例所提供的产品风险预测装置也可以设置于不同于服务器105且能够与终端设备101、102、103和/或服务器105通信的服务器或服务器集群中。
应该理解,图1中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要,可以具有任意数目的终端设备、网络和服务器。
以下将基于图1描述的场景,通过图2~图5对公开实施例的产品风险预测方法进行详细描述。
图2示意性示出了根据本公开实施例的产品风险预测方法的流程图。
如图2所示,该实施例的产品风险预测方法包括操作S210~操作S250。
在操作S210,利用目标客户字段和基础运营数据字段,从基础运营数据表中查询与目标客户对应的基础运营数据集,以及基础运营数据集中基础运营数据各自的风险相关性信息。
根据本公开的实施例,基础运营数据表可以包括从公开数据库中获取的目标客户的基础运营数据,还可以包括从机构内相关的运营数据库中获取的目标客户的基础运营数据。基础运营数据可以包括目标客户在运营过程中产生的财务数据、信用评价数据、企业属性数据等等。
根据本公开的实施例,风险相关性信息可以包括用于表征该基础运营数据与目标客户发行的目标产品的风险相关性程度的信息,例如风险相关性参数等。
需要说明的是,可以基于相关技术中的风险评价方法来确定基础运营数据各自的风险相关性信息,例如可以基于专家经验规则设定基础运营数据各自的风险相关性信息,或者还可以基于神经网络构建的风险评价模型(例如全连接神经网络模型)确定基础运营数据各自对于风险评价结果的贡献度,并基于贡献度来确定基础运营数据各自的风险相关性信息。本公开的实施例对风险相关性信息的确定方法不做限定,本领域技术人员可以根据实际需求进行设计,只要能够满足风险相关性信息能够表征该基础运营数据与目标产品的产品风险的相关性即可。
根据本公开的实施例,可以通过编辑包含有目标客户字段和基础运营数据字段的查询语句来实现查询到与目标客户对应的基础运营数据集和基础运营数据各自的风险相关性信息。
在操作S220,根据基础运营数据各自的风险相关性信息,从与目标客户对应的基础运营数据集中筛选出目标运营数据。
根据本公开的实施例,通过根据风险相关性信息从基础运营数据集中筛选出目标运营数据,可以筛除与目标产品的风险相关程度较低的基础运营数据,从而减少后续目标风险预测模型和/或运营数据评分模型的计算量,提升计算效率。
在操作S230,将目标运营数据输入至目标风险预测模型,输出风险预测结果。
根据本公开的实施例,目标风险预测模型可以包括基于机器学习算法构建的模型,例如可以包括基于循环神经网络算法构建的目标风险预测模型,但不仅限于此,还可以基于决策树模型等机器学习模型构建目标风险预测模型,本公开的实施例对目标风险预测模型的模型结构不做限定,本领域技术人员可以根据实际需求进行设计。
在操作S240,将目标运营数据输入至运营数据评分模型,输出运营评分结果。
根据本公开的实施例,运营数据评分模型可以是基于相关技术中的规则评分模型构建得到,例如可以基于相关专家经验构建规则评分模型。通过运营数据评分模型处理目标运营数据,可以基于运营数据评分模型中的评分规则,将目标运营数据的数据信息转换为评分信息,进而可以根据评分信息确定目标客户的运营评分结果,从而可以充分地利用运营评分结果来表征目标客户的运营能力,以进一步提升后续目标产品风险预测的准确率。
在操作S250,根据风险预测结果和运营评分结果,确定与目标客户关联的目标产品的产品风险预测结果。
根据本公开的实施例,目标产品可以包括目标客户售卖的金融类产品,例如企业委托具有相关资质的金融机构发行的债券产品、信托产品等。产品风险预测结果可以是用于预测目标产品所具有的风险的等级、违约的概率等等。
根据本公开的实施例,通过根据风险相关性信息从基础运营数据集中确定目标运营数据,可以筛除基础运营数据中与产品风险相关性较低的数据,排除噪音数据干扰,提升后续目标风险预测模型的计算效率,通过将目标运营数据输入至目标风险预测模型,可以从预测模型的算法维度对目标产品的风险进行预测,同时将目标运营数据输入至运营数据评分模型,可以使输出的运营评分结果从规则评分维度对目标产品的风险进行评价,进而根据风险预测结果和运营评分结果,确定目标产品的产品风险预测结果,可以在多维度预测目标产品的产品风险的条件下,预测目标产品产生风险的可能性,从而实现提升针对目标产品的产品风险预测的准确性的技术效果。
根据本公开的实施例,基础运营数据可以具有运营数据标识。
图3示意性示出了根据本公开另一实施例的产品风险预测方法的流程图。
如图3所示,产品风险预测方法还可以包括操作S310~操作S320。
在操作S310,根据时间序列模型对样本基础运营数据进行风险相关性分析,得到样本基础运营数据的风险相关性信息,其中,样本基础运营数据具有与基础运营数据对应的样本运营数据标识。
在操作S320,根据样本基础运营数据的风险相关性信息,以及样本运营数据标识与运营数据标识的对应关系,确定基础运营数据各自的风险相关性信息。
根据本公开的实施例,时间序列模型可以包括基于时间序列算法构建得到的模型,时间序列模型例如可以包括自回归模型、移动平均模型等。
根据本公开的实施例,样本基础运营数据可以包括与基础运营数据具有相同数据项类型的历史运营数据,样本运营数据标识和运营数据标识可以通过该数据项类型形成对应关系。同一样本目标客户可以对应有样本基础数据对应有包含样本基础数据的样本基础运营数据集,通过时间序列模型对一个或多个样本目标客户各自的样本基础运营数据集进行处理,可以得到在历史阶段中,相同数据项类型的样本基础运营数据对产品的风险结果的相关程度,即可以得到样本运营数据的风险相关性信息。
根据本公开的实施例,通过样本基础运营数据的风险相关性信息来确定具有相同的数据项类型的基础运营数据的风险相关性信息,可以为后续筛选出目标运营数据奠定基础,从而提升针对目标产品的产品风险预测结果的时效性。
根据本公开的实施例,需要说明的是,在对样本基础运营数据进行相关性分析之前,可以对样本基础运营数据中的异常运营数据和缺失运营数据进行预处理,以满足对样本基础运营数据进行相关性分析的需求。
在本公开的一个实施例中,可以从相关数据平台中获取样本基础运营数据,例如可以获取债券违约报表、债券基本资料,客户基本信息表、法人客户贷款余额表等初始样本基础运营数据。然后从业务逻辑上对初始样本基础运营数据集中的数据进行分析,剔除与债券违约相关的数据信息,如客户信息表中对应的基本属性信息,债券基本信息表中对应的大额存单、等信息。还可以对初始样本基础运营数据中的异常运营数据和缺失运营数据进行预处理。
对于初始样本基础运营数据中的连续型数据的的缺失和异常,对同一客户的初始样本基础运营数据,可以使用异常运营数据所在字段的平均值来填充。而对于初始样本基础运营数据中的非连续型数值的缺失和异常,对同一客户而言,可以使用改初始样本基础运营数据所在字段的众数来进行填充。最后,将预处理之后得到的数据表连接,构成一张宽表,该宽表中可以包含有表征样本运营数据标识的字段,以及与样本运营数据标识对应的数据项,即样本基础运营数据。
根据本公开的实施例,操作S310,根据时间序列模型对样本基础运营数据进行风险相关性分析,得到样本基础运营数据的风险相关性信息可以包括如下操作:
将样本基础运营数据输入至时间序列模型,得到样本风险预测结果;以及基于预设算法处理样本风险预测结果和与样本基础运营数据对应的样本标签,以便迭代地调整时间序列模型的参数,直至样本风险预测结果和样本标签之间的差异值收敛,得到时间序列模型的目标参数,其中,时间序列模型的目标参数为样本基础运营数据各自的风险相关性信息。
根据本公开的实施例,时间序列模型可以包括线性时间序列模型,例如可以采用公式(1)来标识时间序列模型。
Xt=k1x1+k2x2+...+kt-1xt-1+μ; (1)
公式(1)中,xi表示样本基础运营数据,ki表示时间序列模型中与样本基础数据对应的参数,μ表示随机参数,Xt可以表示与样本基础运营数据xi对应的样本标签。
需要说明的是,公式(1)中的ki可以表示样本风险预测结果和样本标签之间的差异值为零时,样本基础运营数据各自的目标参数。通过采用线性时间序列模型对于样本目标客户的样本基础运营数据各自的参数进行调整,可以使目标参数表征该样本基础运营数据与债券违约风险的相关程度,即样本基础运营数据可以通过目标参数来反映与债券违约风险的权重关系,从而为后续筛除与债券违约风险相关程度较低的基础运营数据提供有效的依据。
根据本公开的实施例,基础运营数据集中包括L个基础运营数据,L为大于1的正整数。
操作S220,根据基础运营数据各自的风险相关性信息,从与目标客户对应的基础运营数据集中筛选出目标运营数据包括如下操作:
根据预设风险阈值,在基础运营数据集中确定M个候选基础运营数据,其中,候选基础运营数据的风险相关性信息大于或等于预设风险阈值,L>M≥1;以及从基础运营数据集中筛选出M个候选基础运营数据,得到M个目标运营数据。
根据本公开的实施例,风险相关性信息可以表征相对应的基础运营数据与产品风险的相关程度,通过从基础运营数据集中确定风险相关性信息大于或等于预设风险阈值的M个候选基础运营数据,即可以从基础运营数据集中确定与产品风险的相关程度较高的运营数据,从而减少后续目标风险预测模型和/或运营数据评分模型的数据处理速度,至少部分避免目标风险预测模型产生维度维度灾难等技术问题,提升产品风险预测结果的准确率与时效性。
需要说明的是,在得到M个候选基础运营数据后,还可以将候选基础运营数据中具有不同数据项类型(或者不同运营数据标识),但具有相同含义的候选基础运营数据进行合并,以进一步较少后续目标运营数据的数据量。
例如,可以将运营数据标识分别为“上市公司标识”和“是否上市公司”的候选基础运营数据进行合并,以减少后续目标运营数据的数据量。
根据本公开的实施例,预设风险阈值可以是固定的阈值,或者也可以根据不同的目标产品和/或不同的目标客户设定动态的预设风险阈值。相应地,预设风险阈值可以根据实际的需求进行设计,本公开的实施例对预设风险阈值的具体数值以及设计方式不做限定。
在本公开的一个实施例中,可以通过表1中的运营数据标识的字段和目标运营数据的描述来表示目标客户的目标运营数据。
需要说明的是,表1中的目标运营数据仅为示例性展示可以筛选出的目标运营数据,且没有表示各个目标运营数据具体的数据值。本领域技术人员可以根据实际需求,并根据上述实施例中提供的产品风险预测方法来筛选出具体的目标运营数据,本公开的实施例对目标运营数据的具体数据项类型不做限定。
表1
Figure BDA0003827824900000131
Figure BDA0003827824900000141
根据本公开的实施例,产品风险预测方法还可以包括如下操作:
利用训练样本分别训练N个初始风险预测模型中的每个初始风险预测模型,得到训练后的N个候选风险预测模型,其中,训练样本包括样本目标运营数据和与样本目标运营数据对应的样本标签,N为大于2的正整数;根据样本标签,确定N个候选风险预测模型各自的预测效果信息;以及根据N个候选风险预测模型各自的预测效果信息,从N个候选风险预测模型中确定目标风险预测模型。
根据本公开的实施例,N个初始风险预测模型可以是具有不同的模型结构的模型,可以根据相关技术中的训练方法来分别训练每个初始风险预测模型,从而的到可以用于预测产品风险预测结果的N个候选风险预测模型。然后根据候选风险预测模型各自的预测效果信息,确定预测效果最好的候选风险预测模型作为目标风险预测模型,进而提升目标风险预测模型的预测准确性。
根据本公开的实施例,预测效果信息包括以下至少一项:
预测覆盖率信息、预测准确率信息、预测召回率信息。
根据本公开的实施例,可以从预测覆盖率信息、预测准确率信息、预测召回率信息的任意一个或多个方面来构建预测效果信息,从而结合实际需求综合评价候选风险预测模型的预测效果,进而提升目标风险预测模型的鲁棒性以及预测的准确性,进一步提升后续产品风险预测结果的准确率。
根据本公开的实施例,目标风险预测模型包括基于神经网络算法构建得到的神经网络预测模型。
根据本公开的实施例,神经网络预测模型例如可以包括基于全连接神经网络、循环神经网络、长短期记忆网络等神经网络算法构建得到网络模型。
需要说明的是,本公开的实施例对神经网络预测模型的具体网络结构不做限定,本领域技术人员可以根据实际需求,基于相关技术中的神经网络算法构建初始风险预测模型,并基于上述实施例中的产品风险预测方法来确定目标风险预测模型。
根据本公开的实施例,目标风险预测模型包括基于决策树算法构建得到的决策树预测模型。
根据本公开的实施例,决策树预测模型可以根据目标运营数据的处理结果来确定目标产品的风险分类结果,即第一风险预测结果。通过决策树模型较为精确地预测能力,可以有效地提升第一风险预测结果的准确性,从而进一步提升后续产品风险预测结果的预测准确性。
根据本公开的实施例,决策树预测模型包括以下任意一项:
极端梯度提升模型(eXtreme Gradient Boosting,XGBoost)、随机森林模型(Random Forests,RF)、轻度梯度提升机模型(lightGBM,Light Gradient BoostingMachine)。
需要说明的是,目标风险预测模型可以是从训练后的候选风险预测模型中确定的,相应地本公开的实施例对候选风险预测模型的构建方法与网络结构不做限定,本领域技术人员可以根据实际需求进行设计。
根据本公开的实施例,可以选择XGBoost模型和LightGBM模型作为初始风险预测模型,并利用目标基础运营数据来分别训练初始风险预测模型,得到训练后的候选风险预测模型,并根据候选风险预测模型(即训练后的XGBoost模型和LightGBM模型)各自的预测覆盖率信息、预测准确率信息、预测召回率信息来确定目标风险预测模型。
XGBoost模型作为一种机器学习算法模型,也是一种基于CART回归树的集成学习算法模型,可以通过不断迭代生成新的树,以学习到真实值(即样本标签)与当前所有树预测值的残差,将所有树的结果累加作为最终结果,即可以得到样本风险预测结果,从而可以获取尽可能高的分类准确率。
XGBoost模型中包含t个树,每个树对样本目标运营数据进行打分,将所有打分结果求和作为该样本样本目标运营数据的预测值。可以通过公式(2)设定初始树的实测值为0。
Figure BDA0003827824900000161
通过公式(3)确定第t个回归树的预测函数可以表示为:
Figure BDA0003827824900000162
公式(2)和(3)中,xi表示第i个样本目标运营数据,fk表示第k棵树,fk(xi)表示在第k棵树中xi的分值,yi (t)表示经过k轮迭代后,样本目标运营数据xi的预测结果。
XGBoost模型的损失函数可以通过公式(4)来表示。
Figure BDA0003827824900000163
公式(4)中,
Figure BDA0003827824900000164
用于衡量预测值与实际值直接的误差损失函数,
Figure BDA0003827824900000165
用于防止过拟合的正则化项。yi表示是第i个样本目标运营数据对应的样本标签,
Figure BDA0003827824900000166
表示经过t轮迭代后,XGBoost模型对第i个样本目标运营数据的预测值。XGBoost模型可以采用加法模型,即第t轮对样本目标运营数据的预测值为前t次迭代对样本目标运营数据打分的分值之和。进而通过公式(5)表示XGBoost模型的损失函数。
Figure BDA0003827824900000167
公式(5)中,
Figure BDA0003827824900000168
表示第t-1轮的预测值,ft(xi)表示第t轮对样本目标运营数据打分的分值。第t轮的正则化项是t棵树的正则化项相加而来的,即每棵树的复杂度之和,目的是控制XGBoost模型的复杂度,防止过拟合。正则化项由公式(6)表示示:
Figure BDA0003827824900000171
公式(6)中,T表示叶子结点的个数,ωj表示第j个叶子节点的分值,τ与α均表示惩罚系数,在实际应用中可以通过调参,以使XGBoost模型达到最佳效果。
LightGBM算法作为用于处理海量数据的决策树算法,是GBDT(Gradient BoostingDecision Tree,梯度提升决策树)算法的一种进化形式。与传统的GBDT和XGBoost算法不同的是LightGBM算法通过使用直方图算法、GOSS算法(单边采样算法)和EFB算法(互斥特征捆绑算法)来提供模型训练的运行效率,同时减少训练的时间复杂度和内存资源的占用。
LightGBM模型采用叶子生长(leaf-wise)策略来对叶子节点进行***,计算当前所有叶子节点的信息增益,寻找最大信息增益的叶子节点进行***,并对LightGBM模型的深度进行限制,来防止过拟合,缩短寻找最优深度树的时间。
LightGBM模型在模型训练上比传统的模型更具优势,其主要体现在两个方面:目标运营数据的数据项类型的原始性和模型训练的并行性。对于数据项类型的原始性主要体现在传统的算法模型在进行模型训练之前需要对目标运营数据做one-hot编码处理,这样就会在原有目标运营数据的基础上增加了存储空间,同时降低了模型训练效率,而LightGBM模型可以直接使用原始的数据项类型,一定程度上减少了模型训练的时间。模型训练的并行性包含数据项类型并行和数据并行,模型训练过程中需要对海量的数据进行训练,在训练效率上具有很大的开销,而LightGBM模型可以将不同的目标运营数据集合放到不同的机器上进行训练,可以在机器间实现模型的最优化分割,实现训练效率的大幅提升。
根据本公开的实施例,可以基于训练后得到的LightGBM模型和XGBoost模型针对债券产品的违约风险进行预测,由于债券违约本身就是小概率事件,因此可以使用覆盖率(CR)、准确率(p)和召回率(AVG)作为预测效果信息来对模型的预测效果进行评价。
例如,可以基于表2中的混沌矩阵来表示LightGBM模型和XGBoost模型各自的预测效果信息
表2
Figure BDA0003827824900000181
表2中,TP表示预测结果为1,实际结果(样本标签)为1,即预测正确;FP表示预测结果为1,实际结果为0,即预测错误;FN表示预测结果为0,实际结果为1,即预测错误;TN表示预测结果为0,实际结果为0,即预测正确;Type Ierror表示预测结果为1,实际结果为0时的错误率,Type II error表示预测结果为0,实际结果为1的错误率。
覆盖率(CR)是指候选风险预测模型预测的具有风险的预测清单中,对于市场上真实违约的目标客户的覆盖程度,针对的是市场中存在债券产品违约的目标客户主体。例如可以通过公式(7)来表示覆盖率(CR)。
Figure BDA0003827824900000182
公式(7)中,CR表示覆盖率,c表示预测清单中违约的目标客户主体的数量,D表示市场中存在违约情况的目标客户主体的数量,n表示预测清单中目标客户主体的数量,p表示预测正确率,N表示市场中发行债券产品的目标客户主体的数量,d表示市场中债券违约率。
准确率(p)可以是指候选风险预测模型针对预测清单真正发生违约的比例,其可以表示候选风险预测模型的精度。例如可以通过公式(8)表示准确率(p)。
Figure BDA0003827824900000191
公式(8)中,P表示准确率,c表示预测清单中违约的目标客户主体的数量,n表示预测清单中目标客户主体的数量,p表示预测正确率。
召回率(AVG)就可以是指候选风险预测模型预测得到的违约结果与样本标签表征的实际违约结果相同的清单中的目标客户,与真正发生违约的清单中目标客户的比例,召回率(AVG)可以表示选风险预测模型针对违约债券预测的完整性。例如可以通过公式(9)来表示。
Figure BDA0003827824900000192
公式(9)中,AVG表示召回率,c表示预测清单中违约的目标客户主体的数量,D表示市场中存在违约情况的目标客户主体的数量,n表示预测清单中目标客户主体的数量,N表示市场中发行债券产品的目标客户主体的数量,d表示市场中债券违约率。
根据本公开的实施例,准确率(p)的提升通常仅能通过改善模型的特征选取,即改善目标基础运营数据的选取,或者通过提升目标基础运营数据的数据质量来实现。难以实现准确预测准确性,且需要验证目标风险预测模型的稳定性。因此在准确率(p)未知的情况下,可以实现保证覆盖率(CR)的确定性方法就是提高预测清单中目标客户主体的主体数量(n),但盲目提升主体数量(n)会导致过高的Type I error,即候选风险预测模型的预测结果中会出现预测违约但实际没有违约(False Positive);而覆盖率(CR)不够则Type IIerror(1-p)过高,即实际结果违约但没在预测清单中体现主体的实际比例。因此可以根据实际的风险控制需求,在候选风险预测模型的构建过程中考虑在n尽量小的情况下限制Type II error。
图4示意性释出了本公开的实施例中候选风险预测模型各自的预测效果信息的示意图。
如图4所示,样本目标基础运营数据可以是以月度为维度的债券违约数据,例如可以利用2020年1月到2020年12月全年的债券违约数据进行训练和测试。在样本目标基础运营数据处理过程中分别采用空值填充和不填充的对比方法,同时对于样本目标基础运营数据中的连续数据做不归一化、不平滑、不分箱的操作,最后使用召回率来评价候选风险预测模型各自针对债券违约的预测结果。
图4中的(a)图可以是将样本目标基础运营数据未按照比例划分为训练集和测试集,对初始风险预测模型LightGBM模型和初始风险预测模型XGBoost模型进行训练后得到的候选风险预测模型的预测召回率。
图4中的(b)图可以是将样本目标基础运营数据按照比例划分为训练集和测试集,以交叉验证候选风险预测模型LightGBM模型和候选风险预测模型XGBoost模型的预测召回率。
需要说明的是,图4中的(a)图和(b)图的前1%、前2.5%和前5%分别可以表示训练后的XGBoost模型和训练后的LightGBM模型各自输出的样本风险预测结果中的前1%、前2.5%和前5%部分结果。相应地,可以根据样本风险预测结果中的前1%、前2.5%和前5%部分结果来确定训练后的XGBoost模型和训练后的LightGBM模型各自的预测召回率。
结合图4中的(a)图和(b)图,可以确定训练后得到的XGBoost模型作为目标风险预测模型。
根据本公开的实施例,风险预测结果包括第一产品风险概率,产品风险预测结果包括产品风险概率;
操作S250,根据风险预测结果和运营评分结果,确定与目标客户关联的目标产品的产品风险预测结果可以包括如下操作:
利用预设映射函数处理运营评分结果,得到与运营评分结果对应的第二产品风险概率;以及根据第一产品风险概率和第二产品风险概率,确定目标产品的产品风险概率。
根据本公开的实施例,运营数据评分模型可以基于相关技术中的规则打分模型(也称评分卡模型)构建得到,从而可以利用运营数据评分模型将目标运营数据进行数值化的评价。
运营数据评分模型可以从两个方面对目标运营数据进行评价,即可以利用经验模型和数据模型构建运营数据评分模型,其中经验模型可以是通过具有丰富经验的业务人员对业务场景进行等级评分,进而将等级评分进行数值化处理,这样就实现了经验模型针对目标运营数据的评分可计算性。数据模型可以是通过对目标运营数据使用概率计算方法来进行打分,具有较强的计算逻辑,从计算的角度来说更具可操作性,从结果的角度来说更具指导性。
在本公开的一个实施例中,可以基于经验模型构建运营数据评分模型,例如可以通过表3来构建运营数据评分模型,并进一步根据目标运营数据得到运营评分结果。
表3
Figure BDA0003827824900000211
Figure BDA0003827824900000221
根据表3可知,可以基于专家经验总结的结果来构建申万规则和机构内规则,并进一步通过相关技术中的编程语言等方法,可以构建得到运营数据评分模型。将目标运营数据输入至运营数据评分模型可以综合得到针对目标产品的违约风险评分结果,即运营评分结果。
进一步地,可以选择反正切函数作为预设映射函数,从而可以利用反正切函数将运营评分结果进行标准化处理,得到与第一产品风险概率相统一的第二产品风险概率。
其中,反正切函数的特性就是具有数据的连续性,同时在数据标准化的过程中,将数据维度映射到[0,1]的区间范围内,这样就可以将运营评分结果映射至[0,1]的区间范围内,实现与第一产品风险概率的一致性。例如可以通过公式(10)来生成第二产品风险概率。
scoreModel=atan(-q)*2/π; (10)
公式(10)中,q表示运营评分结果,atan()表示反正切函数,scoreModel表示第二产品风险概率。
根据本公开的实施例,可以基于第一产品风险概率和第二产品风险概率的平均值来确定目标客户关联的目标产品的产品风险预测结果,从而量化地表征目标产品产生风险的概率,以便于准确的预测与评价目标产品的产品风险。
图5示意性释出了根据本公开实施例的产品风险预测方法的应用场景图。
如图5所示,在该应用场景中,目标运营数据510可以是从目标客户对应的基础运营数据集中筛选出的运营数据。目标运营数据510可以包括机构内评级信贷数据511和公开财务数据。
通过上述实施例提供的产品风险预测方法,可以从训练后得到的候选风险预测模型中确定目标风险预测模型521。
在本实施例中,可以将目标风险预测模型521确定为训练后的XGBoost模型。相应地,还可以基于上述专家经验来构建运营数据评分模型522。
将目标运营数据510分别输入至目标风险预测模型521和运营数据评分模型522,可以得到目标风险预测模型521输出的第一产品风险概率531和运营数据评分模型522输出的运营评分结果532。
利用预设映射函数,例如反正切函数处理运营评分结果532,可以将运营评分结果532映射至[0,1]的数值区间范围内,从而得到第二产品风险概率533。
根据第一产品风险概率531和第二产品风险概率533的平均值,可以得到目标客户关联的目标产品的产品风险预测结果,从而可以准确地预测目标产品的产品风险。
进一步地,在目标客户包括多个的情况下,可以基于每个目标客户各自对应的产品风险预测结果来对多个目标客户进行产品风险排序,进而可以清晰地选择产品风险较低的目标客户作为准备进行交易的目标客户,以降低后续产品交易过程中的产品风险。
基于上述产品风险预测方法,本公开还提供了一种产品风险预测装置。以下将结合图6对该装置进行详细描述。
图6示意性示出了根据本公开实施例的产品风险预测装置的结构框图。
如图6所示,该实施例的产品风险预测装置600包括查询模块610、第一筛选模块620、风险预测模块630、运营评分模块640和产品风险确定模块650。
查询模块610用于利用目标客户字段和基础运营数据字段,从基础运营数据表中查询与目标客户对应的基础运营数据集,以及基础运营数据集中基础运营数据各自的风险相关性信息。
第一筛选模块620用于根据基础运营数据各自的风险相关性信息,从与目标客户对应的基础运营数据集中筛选出目标运营数据。
风险预测模块630用于将目标运营数据输入至目标风险预测模型,输出风险预测结果。
运营评分模块640用于将目标运营数据输入至运营数据评分模型,输出运营评分结果。
产品风险确定模块650用于根据风险预测结果和运营评分结果,确定与目标客户关联的目标产品的产品风险预测结果。
根据本公开的实施例,基础运营数据具有运营数据标识。
产品风险预测装置还包括:风险相关性分析模块和第一确定模块。
风险相关性分析模块用于根据时间序列模型对样本基础运营数据进行风险相关性分析,得到样本基础运营数据的风险相关性信息,其中,样本基础运营数据具有与基础运营数据对应的样本运营数据标识。
第一确定模块用于根据样本基础运营数据的风险相关性信息,以及样本运营数据标识与运营数据标识的对应关系,确定基础运营数据各自的风险相关性信息。
根据本公开的实施例,风险相关性分析模块包括:风险相关性分析单元和风险相关性信息生成单元。
风险相关性分析单元用于将样本基础运营数据输入至时间序列模型,得到样本风险预测结果。
风险相关性信息生成单元基于预设算法处理样本风险预测结果和与样本基础运营数据对应的样本标签,以便迭代地调整时间序列模型的参数,直至样本风险预测结果和样本标签之间的差异值收敛,得到时间序列模型的目标参数,其中,时间序列模型的目标参数为样本基础运营数据各自的风险相关性信息。
根据本公开的实施例,基础运营数据集中包括L个基础运营数据,L为大于1的正整数。
第一筛选模块包括:第一确定单元和第一筛选单元。
第一确定单元用于根据预设风险阈值,在基础运营数据集中确定M个候选基础运营数据,其中,候选基础运营数据的风险相关性信息大于或等于预设风险阈值,L>M≥1。
第一筛选单元用于从基础运营数据集中筛选出M个候选基础运营数据,得到M个目标运营数据。
根据本公开的实施例,产品风险预测装置还包括:模型训练模块、第二确定模块和第三确定模块。
模型训练模块用于利用训练样本分别训练N个初始风险预测模型中的每个初始风险预测模型,得到训练后的N个候选风险预测模型,其中,训练样本包括样本目标运营数据和与样本目标运营数据对应的样本标签,N为大于2的正整数。
第二确定模块用于根据样本标签,确定N个候选风险预测模型各自的预测效果信息。
第三确定模块用于根据N个候选风险预测模型各自的预测效果信息,从N个候选风险预测模型中确定目标风险预测模型。
根据本公开的实施例,预测效果信息包括以下至少一项:
预测覆盖率信息、预测准确率信息、预测召回率信息。
根据本公开的实施例,目标风险预测模型包括基于决策树算法构建得到的决策树预测模型;或
目标风险预测模型包括基于神经网络算法构建得到的神经网络预测模型。
根据本公开的实施例,决策树预测模型包括以下任意一项:
极端梯度提升模型、随机森林模型、轻度梯度提升机模型。
根据本公开的实施例,风险预测结果包括第一产品风险概率,产品风险预测结果包括产品风险概率;
产品风险确定模块包括:风险概率生成单元和产品风险概率确定单元。
风险概率生成单元用于利用预设映射函数处理运营评分结果,得到与运营评分结果对应的第二产品风险概率。
产品风险概率确定单元用于根据第一产品风险概率和第二产品风险概率,确定目标产品的产品风险概率。
根据本公开的实施例,查询模块610、第一筛选模块620、风险预测模块630、运营评分模块640和产品风险确定模块650中的任意多个模块可以合并在一个模块中实现,或者其中的任意一个模块可以被拆分成多个模块。或者,这些模块中的一个或多个模块的至少部分功能可以与其他模块的至少部分功能相结合,并在一个模块中实现。根据本公开的实施例,查询模块610、第一筛选模块620、风险预测模块630、运营评分模块640和产品风险确定模块650中的至少一个可以至少被部分地实现为硬件电路,例如现场可编程门阵列(FPGA)、可编程逻辑阵列(PLA)、片上***、基板上的***、封装上的***、专用集成电路(ASIC),或可以通过对电路进行集成或封装的任何其他的合理方式等硬件或固件来实现,或以软件、硬件以及固件三种实现方式中任意一种或以其中任意几种的适当组合来实现。或者,查询模块610、第一筛选模块620、风险预测模块630、运营评分模块640和产品风险确定模块650中的至少一个可以至少被部分地实现为计算机程序模块,当该计算机程序模块被运行时,可以执行相应的功能。
图7示意性示出了根据本公开实施例的适于实现产品风险预测方法的电子设备的方框图。
如图7所示,根据本公开实施例的电子设备700包括处理器701,其可以根据存储在只读存储器(ROM)702中的程序或者从存储部分708加载到随机访问存储器(RAM)703中的程序而执行各种适当的动作和处理。处理器701例如可以包括通用微处理器(例如CPU)、指令集处理器和/或相关芯片组和/或专用微处理器(例如,专用集成电路(ASIC))等等。处理器701还可以包括用于缓存用途的板载存储器。处理器701可以包括用于执行根据本公开实施例的方法流程的不同动作的单一处理单元或者是多个处理单元。
在RAM 703中,存储有电子设备700操作所需的各种程序和数据。处理器701、ROM702以及RAM 703通过总线704彼此相连。处理器701通过执行ROM 702和/或RAM 703中的程序来执行根据本公开实施例的方法流程的各种操作。需要注意,所述程序也可以存储在除ROM 702和RAM 703以外的一个或多个存储器中。处理器701也可以通过执行存储在所述一个或多个存储器中的程序来执行根据本公开实施例的方法流程的各种操作。
根据本公开的实施例,电子设备700还可以包括输入/输出(I/O)接口705,输入/输出(I/O)接口705也连接至总线704。电子设备700还可以包括连接至I/O接口705的以下部件中的一项或多项:包括键盘、鼠标等的输入部分706;包括诸如阴极射线管(CRT)、液晶显示器(LCD)等以及扬声器等的输出部分707;包括硬盘等的存储部分708;以及包括诸如LAN卡、调制解调器等的网络接口卡的通信部分709。通信部分709经由诸如因特网的网络执行通信处理。驱动器710也根据需要连接至I/O接口705。可拆卸介质711,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器710上,以便于从其上读出的计算机程序根据需要被安装入存储部分708。
本公开还提供了一种计算机可读存储介质,该计算机可读存储介质可以是上述实施例中描述的设备/装置/***中所包含的;也可以是单独存在,而未装配入该设备/装置/***中。上述计算机可读存储介质承载有一个或者多个程序,当上述一个或者多个程序被执行时,实现根据本公开实施例的方法。
根据本公开的实施例,计算机可读存储介质可以是非易失性的计算机可读存储介质,例如可以包括但不限于:便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本公开中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行***、装置或者器件使用或者与其结合使用。例如,根据本公开的实施例,计算机可读存储介质可以包括上文描述的ROM 702和/或RAM 703和/或ROM 702和RAM 703以外的一个或多个存储器。
本公开的实施例还包括一种计算机程序产品,其包括计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。当计算机程序产品在计算机***中运行时,该程序代码用于使计算机***实现本公开实施例所提供的方法。
在该计算机程序被处理器701执行时执行本公开实施例的***/装置中限定的上述功能。根据本公开的实施例,上文描述的***、装置、模块、单元等可以通过计算机程序模块来实现。
在一种实施例中,该计算机程序可以依托于光存储器件、磁存储器件等有形存储介质。在另一种实施例中,该计算机程序也可以在网络介质上以信号的形式进行传输、分发,并通过通信部分709被下载和安装,和/或从可拆卸介质711被安装。该计算机程序包含的程序代码可以用任何适当的网络介质传输,包括但不限于:无线、有线等等,或者上述的任意合适的组合。
在这样的实施例中,该计算机程序可以通过通信部分709从网络上被下载和安装,和/或从可拆卸介质711被安装。在该计算机程序被处理器701执行时,执行本公开实施例的***中限定的上述功能。根据本公开的实施例,上文描述的***、设备、装置、模块、单元等可以通过计算机程序模块来实现。
根据本公开的实施例,可以以一种或多种程序设计语言的任意组合来编写用于执行本公开实施例提供的计算机程序的程序代码,具体地,可以利用高级过程和/或面向对象的编程语言、和/或汇编/机器语言来实施这些计算程序。程序设计语言包括但不限于诸如Java,C++,python,“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分地在用户设备上执行、部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。在涉及远程计算设备的情形中,远程计算设备可以通过任意种类的网络,包括局域网(LAN)或广域网(WAN),连接到用户计算设备,或者,可以连接到外部计算设备(例如利用因特网服务提供商来通过因特网连接)。
附图中的流程图和框图,图示了按照本公开各种实施例的***、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,上述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图或流程图中的每个方框、以及框图或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的***来实现,或者可以用专用硬件与计算机指令的组合来实现。
本领域技术人员可以理解,本公开的各个实施例和/或权利要求中记载的特征可以进行多种组合或/或结合,即使这样的组合或结合没有明确记载于本公开中。特别地,在不脱离本公开精神和教导的情况下,本公开的各个实施例和/或权利要求中记载的特征可以进行多种组合和/或结合。所有这些组合和/或结合均落入本公开的范围。
以上对本公开的实施例进行了描述。但是,这些实施例仅仅是为了说明的目的,而并非为了限制本公开的范围。尽管在以上分别描述了各实施例,但是这并不意味着各个实施例中的措施不能有利地结合使用。本公开的范围由所附权利要求及其等同物限定。不脱离本公开的范围,本领域技术人员可以做出多种替代和修改,这些替代和修改都应落在本公开的范围之内。

Claims (13)

1.一种产品风险预测方法,包括:
利用目标客户字段和基础运营数据字段,从基础运营数据表中查询与目标客户对应的基础运营数据集,以及所述基础运营数据集中基础运营数据各自的风险相关性信息;
根据所述基础运营数据各自的风险相关性信息,从与目标客户对应的基础运营数据集中筛选出目标运营数据;
将所述目标运营数据输入至目标风险预测模型,输出风险预测结果;
将所述目标运营数据输入至运营数据评分模型,输出运营评分结果;以及
根据所述风险预测结果和所述运营评分结果,确定与所述目标客户关联的目标产品的产品风险预测结果。
2.根据权利要求1所述的方法,其中,所述基础运营数据具有运营数据标识;
所述产品风险预测方法还包括:
根据时间序列模型对样本基础运营数据进行风险相关性分析,得到所述样本基础运营数据的风险相关性信息,其中,所述样本基础运营数据具有与所述基础运营数据对应的样本运营数据标识;以及
根据所述样本基础运营数据的风险相关性信息,以及所述样本运营数据标识与所述运营数据标识的对应关系,确定所述基础运营数据各自的风险相关性信息。
3.根据权利要求2所述的方法,其中,根据时间序列模型对样本基础运营数据进行风险相关性分析,得到所述样本基础运营数据的风险相关性信息包括:
将所述样本基础运营数据输入至所述时间序列模型,得到样本风险预测结果;以及
基于预设算法处理所述样本风险预测结果和与所述样本基础运营数据对应的样本标签,以便迭代地调整所述时间序列模型的参数,直至所述样本风险预测结果和所述样本标签之间的差异值收敛,得到所述时间序列模型的目标参数,其中,所述时间序列模型的目标参数为所述样本基础运营数据各自的风险相关性信息。
4.根据权利要求1至3中任一项所述的方法,其中,所述基础运营数据集中包括L个基础运营数据,L为大于1的正整数;
根据基础运营数据各自的风险相关性信息,从与目标客户对应的基础运营数据集中筛选出目标运营数据包括:
根据预设风险阈值,在所述基础运营数据集中确定M个候选基础运营数据,其中,所述候选基础运营数据的风险相关性信息大于或等于所述预设风险阈值,L>M≥1;以及
从所述基础运营数据集中筛选出M个所述候选基础运营数据,得到M个所述目标运营数据。
5.根据权利要求1所述的方法,还包括:
利用训练样本分别训练N个初始风险预测模型中的每个初始风险预测模型,得到训练后的N个候选风险预测模型,其中,所述训练样本包括样本目标运营数据和与所述样本目标运营数据对应的样本标签,N为大于2的正整数;
根据所述样本标签,确定N个所述候选风险预测模型各自的预测效果信息;以及
根据N个所述候选风险预测模型各自的预测效果信息,从N个所述候选风险预测模型中确定所述目标风险预测模型。
6.根据权利要求5所述的方法,其中,所述预测效果信息包括以下至少一项:
预测覆盖率信息、预测准确率信息、预测召回率信息。
7.根据权利要求1所述的方法,其中,
所述目标风险预测模型包括基于决策树算法构建得到的决策树预测模型;或
所述目标风险预测模型包括基于神经网络算法构建得到的神经网络预测模型。
8.根据权利要求7所述的方法,其中,所述决策树预测模型包括以下任意一项:
极端梯度提升模型、随机森林模型、轻度梯度提升机模型。
9.根据权利要求1所述的方法,其中,所述风险预测结果包括第一产品风险概率,所述产品风险预测结果包括产品风险概率;
其中,根据所述风险预测结果和所述运营评分结果,确定与所述目标客户关联的目标产品的产品风险预测结果包括:
利用预设映射函数处理所述运营评分结果,得到与所述运营评分结果对应的第二产品风险概率;以及
根据所述第一产品风险概率和所述第二产品风险概率,确定所述目标产品的产品风险概率。
10.一种产品风险预测装置,包括:
查询模块,用于利用目标客户字段和基础运营数据字段,从基础运营数据表中查询与目标客户对应的基础运营数据集,以及所述基础运营数据集中基础运营数据各自的风险相关性信息;
第一筛选模块,用于根据所述基础运营数据各自的风险相关性信息,从与目标客户对应的基础运营数据集中筛选出目标运营数据;
风险预测模块,用于将所述目标运营数据输入至目标风险预测模型,输出风险预测结果;
运营评分模块,用于将所述目标运营数据输入至运营数据评分模型,输出运营评分结果;以及
产品风险确定模块,用于根据所述风险预测结果和所述运营评分结果,确定与所述目标客户关联的目标产品的产品风险预测结果。
11.一种电子设备,包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,
其中,当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器执行根据权利要求1~9中任一项所述的方法。
12.一种计算机可读存储介质,其上存储有可执行指令,该指令被处理器执行时使处理器执行根据权利要求1~9中任一项所述的方法。
13.一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时实现根据权利要求1~9中任一项所述的方法。
CN202211068818.8A 2022-09-01 2022-09-01 产品风险预测方法、装置、设备及介质 Pending CN115409636A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211068818.8A CN115409636A (zh) 2022-09-01 2022-09-01 产品风险预测方法、装置、设备及介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211068818.8A CN115409636A (zh) 2022-09-01 2022-09-01 产品风险预测方法、装置、设备及介质

Publications (1)

Publication Number Publication Date
CN115409636A true CN115409636A (zh) 2022-11-29

Family

ID=84163218

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211068818.8A Pending CN115409636A (zh) 2022-09-01 2022-09-01 产品风险预测方法、装置、设备及介质

Country Status (1)

Country Link
CN (1) CN115409636A (zh)

Similar Documents

Publication Publication Date Title
CN108564286B (zh) 一种基于大数据征信的人工智能金融风控授信评定方法和***
CN112734559B (zh) 企业信用风险评价方法、装置及电子设备
CN112561685B (zh) 客户的分类方法和装置
Liu et al. Financial credit risk assessment of online supply chain in construction industry with a hybrid model chain
CN111563187A (zh) 关系确定方法、装置、***和电子设备
CN112950359B (zh) 一种用户识别方法和装置
CN117575804A (zh) 一种货物资产风险分析方法、***及介质
CN115809837B (zh) 基于数字化模拟场景的金融企业管理方法、设备及介质
CN116091249A (zh) 交易风险的评估方法、装置、电子设备和介质
CN115795345A (zh) 信息处理方法、装置、设备及存储介质
US20220164374A1 (en) Method of scoring and valuing data for exchange
CN114782170A (zh) 评估模型风险等级的方法、装置、设备和介质
US20220058658A1 (en) Method of scoring and valuing data for exchange
CN117455681A (zh) 业务风险预测方法和装置
CN114493853A (zh) 信用等级评价方法、装置、电子设备及存储介质
CN114968821A (zh) 基于强化学习的测试数据生成方法及装置
CN114943563A (zh) 一种权益推送方法、装置、计算机设备及存储介质
KR20230103025A (ko) 기업 신용 분석 및 평가 정보 제공 방법, 장치 및 시스템
CN115409636A (zh) 产品风险预测方法、装置、设备及介质
CN113870007A (zh) 一种产品推荐方法、装置、设备及介质
CN113052509A (zh) 模型评估方法、模型评估装置、电子设备和存储介质
Li et al. Research on Efficiency in Credit Risk Prediction Using Logistic‐SBM Model
Zang Construction of Mobile Internet Financial Risk Cautioning Framework Based on BP Neural Network
CN111784503B (zh) 一种通信征信数据的运营变现方法、***和存储介质
US20240185249A1 (en) EVALUATING TRANSACTIONS IN A DECENTRALIZED FINANCE NETWORK BASED ON DECOMPOSED NON-FUNGIBLE TOKENS (NFTs)

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination