CN117093933A - 模型构建方法、装置、存储介质及电子设备 - Google Patents

模型构建方法、装置、存储介质及电子设备 Download PDF

Info

Publication number
CN117093933A
CN117093933A CN202310851489.2A CN202310851489A CN117093933A CN 117093933 A CN117093933 A CN 117093933A CN 202310851489 A CN202310851489 A CN 202310851489A CN 117093933 A CN117093933 A CN 117093933A
Authority
CN
China
Prior art keywords
interest rate
model
random
sample
prediction
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202310851489.2A
Other languages
English (en)
Inventor
卓正兴
陈尧瑞
杨磊
杨青
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Du Xiaoman Technology Beijing Co Ltd
Original Assignee
Du Xiaoman Technology Beijing Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Du Xiaoman Technology Beijing Co Ltd filed Critical Du Xiaoman Technology Beijing Co Ltd
Priority to CN202310851489.2A priority Critical patent/CN117093933A/zh
Publication of CN117093933A publication Critical patent/CN117093933A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/243Classification techniques relating to the number of classes
    • G06F18/24323Tree-organised classifiers
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2415Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/27Regression, e.g. linear or logistic regression
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/01Dynamic search techniques; Heuristics; Dynamic trees; Branch-and-bound
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/03Credit; Loans; Processing thereof

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Business, Economics & Management (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Finance (AREA)
  • Accounting & Taxation (AREA)
  • Computational Linguistics (AREA)
  • Software Systems (AREA)
  • Mathematical Physics (AREA)
  • Computing Systems (AREA)
  • Probability & Statistics with Applications (AREA)
  • Development Economics (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Strategic Management (AREA)
  • Technology Law (AREA)
  • General Business, Economics & Management (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明提供一种模型构建方法、装置、存储介质及电子设备,其中,该方法包括:获取N个第一历史样本集,以及获取第二历史样本集,同一第一历史样本集中的第一历史样本对应同一利率信息,且一个第二历史样本对应的利率信息为随机生成的利率信息,N为正整数;分别采用N个第一历史样本集中的各个第一历史样本集,确定N个单一利率模型,N个单一利率模型中的各个单一利率模型与各个第一历史样本集一一对应;基于第二历史样本集和各个单一利率模型,构建利率敏感模型,利率敏感模型用于预测目标对象的利率敏感度。本发明实施例可精确地获取目标对象的利率敏感度,以基于目标对象的利率敏感度为目标对象确定合适的利率信息。

Description

模型构建方法、装置、存储介质及电子设备
技术领域
本发明涉及计算机技术领域,尤其涉及一种模型构建方法、装置、存储介质及电子设备。
背景技术
目前,信贷场景下的利率(也可称为利率信息)定价方式具有重要价值,如果更加优质的对象(即用户)群体都给到低价(即较低的利率),则会降低盈利性;如果优质敏感对象(即利率敏感度较高的对象)给到高价,则可能会导致对象流失;可见,利率敏感度可在利率定价方式中具有重要作用。在相关技术中,通常基于风险定价(Risk pricing),或考虑对象履约意愿、社交价值及还款能力定价(即结合对象履约意愿模型、社交价值模型及还款能力模型综合给定利率信息),或通过无监督的机器学***、客户风险等因素,也就是说,可基于风险对不同对象群体给定不同的利率,常用采用人工策略或逻辑回归模型。但无论是基于风险定价还是考虑用户履约意愿、社交价值及还款能力定价,都无法对细分对象群体进行差异化定价,即仅能对一个对象群体给定相应的利率,而无监督学习(即根据类别未知(没有被标记)的训练样本解决模式识别中的各种问题)的样本有限且准确性难以评估,从而导致相关技术难以在利率定价时对目标对象进行精确性分析。基于此,如何精确地获取目标对象的利率敏感度,以基于目标对象的利率敏感度为目标对象确定合适的利率信息成为一个研究热点。
发明内容
有鉴于此,本发明实施例提供了一种模型构建方法、装置、存储介质及电子设备,以解决难以在利率定价时对目标对象进行精确性分析,以及难以为目标对象确定合适的利率信息等问题;也就是说,本发明实施例可精确地获取目标对象的利率敏感度,以基于目标对象的利率敏感度为目标对象确定合适的利率信息。
根据本发明的一方面,提供了一种模型构建方法,所述方法包括:
获取N个第一历史样本集,以及获取第二历史样本集,同一第一历史样本集中的第一历史样本对应同一利率信息,且一个第二历史样本对应的利率信息为随机生成的利率信息,N为正整数;
分别采用所述N个第一历史样本集中的各个第一历史样本集,确定N个单一利率模型,所述N个单一利率模型中的各个单一利率模型与所述各个第一历史样本集一一对应;
基于所述第二历史样本集和所述各个单一利率模型,构建利率敏感模型,所述利率敏感模型用于预测目标对象的利率敏感度。
根据本发明的另一方面,提供了一种模型构建装置,所述装置包括:
获取单元,用于获取N个第一历史样本集,以及获取第二历史样本集,同一第一历史样本集中的第一历史样本对应同一利率信息,且一个第二历史样本对应的利率信息为随机生成的利率信息,N为正整数;
处理单元,用于分别采用所述N个第一历史样本集中的各个第一历史样本集,确定N个单一利率模型,所述N个单一利率模型中的各个单一利率模型与所述各个第一历史样本集一一对应;
所述处理单元,还用于基于所述第二历史样本集和所述各个单一利率模型,构建利率敏感模型,所述利率敏感模型用于预测目标对象的利率敏感度。
根据本发明的另一方面,提供了一种电子设备,所述电子设备包括处理器、以及存储程序的存储器,其中,所述程序包括指令,所述指令在由所述处理器执行时使所述处理器执行上述所提及的方法。
根据本发明的另一方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,所述计算机指令用于使计算机执行上述所提及的方法。
本发明实施例可在获取到N个第一历史样本集,以及获取到第二历史样本集后,分别采用N个第一历史样本集中的各个第一历史样本集,确定N个单一利率模型,同一第一历史样本集中的第一历史样本对应同一利率信息,且一个第二历史样本对应的利率信息为随机生成的利率信息,N个单一利率模型中的各个单一利率模型与各个第一历史样本集一一对应,N为正整数;然后,基于第二历史样本集和各个单一利率模型,构建利率敏感模型,利率敏感模型用于预测目标对象的利率敏感度。可见,本发明实施例可针对利率定价构建利率敏感模型,从而通过利率敏感模型获取目标对象的利率敏感度,以采用目标对象的利率敏感度对目标对象进行更有差异化的利率定价,也就是说,本发明实施例可基于目标对象的利率敏感度为目标对象确定合适的利率信息。同时,本发明实施例可基于迁移学习的特征构造方法,通过在N个第一历史样本集上学习到重要的信息,在第二历史样本集上进行微调,对利率敏感模型特征信息的构建具有较大意义,可有效提高利率敏感模型的模型性能,从而通过利率敏感模型精确地获取目标对象的利率敏感度,也就是说,本发明实施例可提高利率敏感度的精确性。
附图说明
在下面结合附图对于示例性实施例的描述中,本发明的更多细节、特征和优点被公开,在附图中:
图1示出了根据本发明示例性实施例的一种模型构建方法的流程示意图;
图2示出了根据本发明示例性实施例的一种利率敏感模型的构建过程的示意图;
图3示出了根据本发明示例性实施例的另一种模型构建方法的流程示意图;
图4示出了根据本发明示例性实施例的一种迁移学习的示意图;
图5示出了根据本发明示例性实施例的一种利率敏感模型的应用过程的示意图;
图6示出了根据本发明示例性实施例的一种模型构建装置的示意性框图;
图7示出了能够用于实现本发明的实施例的示例性电子设备的结构框图。
具体实施方式
下面将参照附图更详细地描述本发明的实施例。虽然附图中显示了本发明的某些实施例,然而应当理解的是,本发明可以通过各种形式来实现,而且不应该被解释为限于这里阐述的实施例,相反提供这些实施例是为了更加透彻和完整地理解本发明。应当理解的是,本发明的附图及实施例仅用于示例性作用,并非用于限制本发明的保护范围。
应当理解,本发明的方法实施方式中记载的各个步骤可以按照不同的顺序执行,和/或并行执行。此外,方法实施方式可以包括附加的步骤和/或省略执行示出的步骤。本发明的范围在此方面不受限制。
本文使用的术语“包括”及其变形是开放性包括,即“包括但不限于”。术语“基于”是“至少部分地基于”。术语“一个实施例”表示“至少一个实施例”;术语“另一实施例”表示“至少一个另外的实施例”;术语“一些实施例”表示“至少一些实施例”。其他术语的相关定义将在下文描述中给出。需要注意,本发明中提及的“第一”、“第二”等概念仅用于对不同的装置、模块或单元进行区分,并非用于限定这些装置、模块或单元所执行的功能的顺序或者相互依存关系。
需要注意,本发明中提及的“一个”、“多个”的修饰是示意性而非限制性的,本领域技术人员应当理解,除非在上下文另有明确指出,否则应该理解为“一个或多个”。
本发明实施方式中的多个装置之间所交互的消息或者信息的名称仅用于说明性的目的,而并不是用于对这些消息或信息的范围进行限制。
需要说明的是,本发明实施例提供的模型构建方法的执行主体可以是一个或多个电子设备,本发明对此不作限定;其中,电子设备可以是终端(即客户端)或者服务器,那么在执行主体包括多个电子设备,且多个电子设备中包括至少一个终端和至少一个服务器时,本发明实施例提供的模型构建方法可由终端和服务器共同执行。相应的,此处所提及的终端可以包括但不限于:智能手机、平板电脑、笔记本电脑、台式计算机、智能手表、智能语音交互设备、智能家电、车载终端、飞行器,等等。此处所提及的服务器可以是独立的物理服务器,也可以是多个物理服务器构成的服务器集群或者分布式***,还可以是提供云服务、云数据库、云计算(cloud computing)、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、CDN(Content Delivery Network,内容分发网络)、以及大数据和人工智能平台等基础云计算服务的云服务器,等等。
基于上述描述,本发明实施例提出一种模型构建方法,该模型构建方法可以由上述所提及的电子设备(终端或服务器)执行;或者,该模型构建方法可由终端和服务器共同执行。为了便于阐述,后续均以电子设备执行该模型构建方法为例进行说明;如图1所示,该模型构建方法可包括以下步骤S101-S103:
S101,获取N个第一历史样本集,以及获取第二历史样本集,同一第一历史样本集中的第一历史样本对应同一利率信息,且一个第二历史样本对应的利率信息为随机生成的利率信息,N为正整数。
其中,上述N个第一历史样本集所构成的样本集合也可称为全量历史样本;基于此,在获取N个第一历史样本集时,电子设备可获取全量历史样本,并通过在全量历史样本上按照N个利率划分样本空间,即按照利率信息对全量历史样本进行样本空间划分,从而得到N个第一历史样本集,一个第一历史样本集包括一个样本空间中的第一历史样本。在此种情况下,电子设备可将利率信息相同的第一历史样本划分在同一样本空间中,以使同一样本空间中的每个第一历史样本对应的利率信息相同,也就是说,可使同一第一历史样本集中的每个第一历史样本对应的利率信息相同。可选的,电子设备可也直接获取N个第一历史样本集,也就是说,上述全量历史样本已被按照利率信息进行样本空间划分,即全量历史样本已被划分为N个第一历史样本集,此时电子设备在获取到全量历史样本后,可不再对全量历史样本进行样本空间划分,等等;本发明对此不作限定。
需要说明的是,一个样本(如第一历史样本或第二历史样本等)可用于表示:一个对象(即用户)的对象特征;可选的,一个样本可包括但不限于:历史贷款数量、有无房贷以及收入信息,等等;本发明对此不作限定。
在本发明实施例中,以N个第一历史样本集和第二历史样本集的获取方式为例进行说明,N个第一历史样本集和第二历史样本集的获取方式可以包括但不限于以下几种:
第一种获取方式:电子设备可获取N个第一历史样本集的第一下载链接,并根据第一下载链接进行样本集下载,从而将基于第一下载链接下载的样本集作为N个第一历史样本集;相应的,电子设备可获取第二历史样本集的第二下载链接,并根据第二下载链接进行样本集下载,从而将基于第二下载链接下载的样本集作为第二历史样本集。
第二种获取方式:电子设备存储有多个第一历史样本集和多个第二历史样本集,那么电子设备可从多个第一历史样本集中选取出N个第一历史样本集,以获取到N个第一历史样本集;并且,电子设备可从多个第二历史样本集中选取出一个第二历史样本集,以获取到第二历史样本集,等等。
S102,分别采用N个第一历史样本集中的各个第一历史样本集,确定N个单一利率模型,N个单一利率模型中的各个单一利率模型与各个第一历史样本集一一对应。
在具体的实现中,由于一个第一历史样本集包括一个样本空间中的第一历史样本,所以分别采用各个第一历史样本集,确定N个单一利率模型可以指的是:在N个样本空间中的每个样本空间下,独立训练N个单一利率模型(也可称为子模型),如图2所示。基于此,可保证在每个样本空间下拟合单一利率下的响应情况(即是否用信的情况)。
举例来说,假设N的取值为2,N个第一历史样本集包括第一历史样本集1和第一历史样本集2,且第一历史样本集1中每个第一历史样本对应的利率信息均为利率信息1,第一历史样本集2中每个第一历史样本对应的利率信息均为利率信息2,那么电子设备可在第一历史样本集1对应的样本空间中进行模型训练,得到第一历史样本集1对应的单一利率模型1,且单一利率模型1拟合了利率信息1下的响应情况;并且,可在第一历史样本集2对应的样本空间中进行模型训练,得到第一历史样本集2对应的单一利率模型2,且单一利率模型2拟合了利率信息2下的响应情况,等等。
S103,基于第二历史样本集和各个单一利率模型,构建利率敏感模型,利率敏感模型用于预测目标对象的利率敏感度。
其中,目标对象可以为需要办理目标业务的任一对象,且该目标业务可以指的是房贷业务,也可以指的是车贷业务等,本发明对此不作限定。可选的,上述利率敏感度也可称为利率敏感差异或敏感模型分等。
应当理解的是,由于随机定价(即随机生成利率信息)对目标业务的指标会造成不确定性影响(如随机生成的利率信息较大而导致对象不履约的情况等),所以第二历史样本集中的第二历史样本数量较小,以避免对业务数据造成波动。基于此,在构建利率敏感模型时,如果只用全量历史样本(即N个第一历史样本集)进行训练,学习到的利率敏感度会比较受历史定价策略的影响;而如果只用历史随机定价样本(即第二历史样本)进行训练,样本太少会导致模型学习不充分或者不稳定;并且,采用全量历史样本对不同样本空间单独训练虽然会学习到历史定价策略而非对象真实的敏感性特征,但通过少量历史随机定价样本可以进行修正微调,同时也学习到了大量数据下的特征信息。可见,本发明实施例可基于迁移学习的特征构造方法,通过在大量数据(即N个第一历史样本集)上学习到重要的信息,并在少量历史随机定价样本上进行微调,可提高利率敏感模型的模型性能;其中,所谓的迁移学习是一种机器学习的方法,是指一个预训练的模型被重新用在另一个任务中。
本发明实施例可在获取到N个第一历史样本集,以及获取到第二历史样本集后,分别采用N个第一历史样本集中的各个第一历史样本集,确定N个单一利率模型,同一第一历史样本集中的第一历史样本对应同一利率信息,且一个第二历史样本对应的利率信息为随机生成的利率信息,N个单一利率模型中的各个单一利率模型与各个第一历史样本集一一对应,N为正整数;然后,基于第二历史样本集和各个单一利率模型,构建利率敏感模型,利率敏感模型用于预测目标对象的利率敏感度。可见,本发明实施例可针对利率定价构建利率敏感模型,从而通过利率敏感模型获取目标对象的利率敏感度,以采用目标对象的利率敏感度对目标对象进行更有差异化的利率定价,也就是说,本发明实施例可基于目标对象的利率敏感度为目标对象确定合适的利率信息。同时,本发明实施例可基于迁移学习的特征构造方法,通过在N个第一历史样本集上学习到重要的信息,在第二历史样本集上进行微调,对利率敏感模型特征信息的构建具有较大意义,可有效提高利率敏感模型的模型性能,从而通过利率敏感模型精确地获取目标对象的利率敏感度,也就是说,本发明实施例可提高利率敏感度的精确性。
基于上述描述,本发明实施例还提出一种更为具体的模型构建方法。相应的,该模型构建方法可以由上述所提及的电子设备(终端或服务器)执行;或者,该模型构建方法可由终端和服务器共同执行。为了便于阐述,后续均以电子设备执行该模型构建方法为例进行说明;请参见图3,该模型构建方法可包括以下步骤S301-S307:
S301,获取N个第一历史样本集,以及获取第二历史样本集,同一第一历史样本集中的第一历史样本对应同一利率信息,且一个第二历史样本对应的利率信息为随机生成的利率信息,N为正整数。
在一种实施方式中,上述第二历史样本集包括的第二历史样本的数量可以是基于预设样本比例和目标数据量所确定的,该目标数据量可包括以下任一种:N个第一历史样本集中第一历史样本的数量和目标时间范围内办理目标业务的业务数据量,且预设样本比例小于样本比例阈值。可选的,目标数据量还可以为预设数据量阈值(如一千或一万等),本发明对目标数据量的具体取值不作限定。应当理解的是,上述目标时间范围可以是过去的一年,也可以为过去的一个月等,本发明对此不作限定;相应的,上述预设样本比例可以为0.1,也可以为0.2等,本发明对此不作限定。
需要说明的是,为了避免随机定价(即随机生成利率信息)对目标业务的业务数据造成波动,因此第二历史样本集中的第二历史样本的数量必须控制在较小的比例,也就是说,上述预设样本比例需小于样本比例阈值,从而使得第二历史样本的数量较小。可选的,样本比例阈值可以为0.3,也可以为0.4等,本发明对此不作限定。
另一种实施方式中,第二历史样本集包括的第二历史样本的数量可以是基于预设生成数量阈值所确定的,在此种情况下,第二历史样本的数量小于预设生成数量阈值,等等。可选的,预设生成数量阈值可以是按照经验设置的,也可以是按照实际需求设置的,本发明对此不作限定。
进一步的,第二历史样本集可包括第一随机利率样本集和第二随机利率样本集,且第一随机利率样本集中任一第一随机利率样本对应的利率信息,大于或等于第二随机利率样本集中各个第二随机利率样本对应的利率信息;在此种情况下,第一随机利率样本也可称为高价随机样本,第二随机利率样本也可称为低价随机样本。应当理解的是,由于第二历史样本集中的第二历史样本的数量较小,则第一随机利率样本集中的第一随机利率样本的数量和第二随机利率样本集中的第二随机利率样本的数量均较小。
可选的,第二历史样本集中的第一随机利率样本和第二随机利率样本可以是乱序排列的,也就是说,第一随机利率样本集中的第一随机利率样本和第二随机利率样本集中的第二随机利率样本被融合至一个集合(即第二历史样本集)中,在此种情况下,电子设备可按照利率信息,将第二历史样本集划分为第一随机利率样本集和第二随机利率样本集。
在一种具体的实现中,电子设备可确定第一随机利率样本集对应的第一利率范围和第二随机利率样本集对应的第二利率范围,那么电子设备可根据第二历史样本集中各个第二历史样本对应的利率信息,将利率信息位于第一利率范围内的第二历史样本划分至第一随机利率样本集中,并将利率信息位于第二利率范围内的第二历史样本划分至第二随机利率样本中。其中,第一利率范围中任一利率信息,大于或等于第二利率范围中的各个利率信息;可选的,第一利率范围和第二利率范围可以是按照经验设置的,也可以是按照实际需求设置的,本发明对此不作限定。
另一种具体的实现中,电子设备可按照各个第二历史样本对应的利率信息从大到小的顺序,对各个第二历史样本进行排序,得到第一排序结果;然后,确定第一划分比例,并按照第一划分比例和第二历史样本的数量确定第一划分位置信息,并将第一排序结果中位于第一划分位置信息以及第一划分位置信息之前的第二历史样本,划分至第一随机利率样本集中,以及将第一排序结果中位于第一划分位置信息之后的第二历史样本,划分至第二随机利率样本集中。其中,第一划分比例可以是按照经验设置的,也可以是按照实际需求设置的,本发明对此不作限定;示例性的,在将第一划分比例和第二历史样本的数量之间的乘积作为第一划分位置信息时,假设第一划分比例为0.5,且第二历史样本的数量为100,那么第一划分位置信息可以为50,在此种情况下,电子设备可将第一排序结果中位于前50的第二历史样本(包括第1个第二历史样本至第50个第二历史样本),划分至第一随机利率样本集中,并将第一排序结果中位于后50的第二历史样本(包括第50个第二历史样本至第100个第二历史样本),划分至第二随机利率样本集中。
又一种具体的实现中,电子设备可按照各个第二历史样本对应的利率信息从小到大的顺序,对各个第二历史样本进行排序,得到第二排序结果;然后,确定第二划分比例,并按照第二划分比例和第二历史样本的数量确定第二划分位置信息,并将第二排序结果中位于第二划分位置信息之后的第二历史样本,划分至第一随机利率样本集中,以及将第二排序结果中位于第二划分位置信息以及第二划分位置信息之前的第二历史样本,划分至第二随机利率样本集中,等等。其中,第二划分比例可以是按照经验设置的,也可以是按照实际需求设置的,本发明对此不作限定。
应当理解的是,若获取到的第二历史样本集是已被划分为第一随机利率样本集和第二随机利率样本集的集合,则电子设备无需按照利率信息对第二历史样本集进行划分。
S302,分别采用N个第一历史样本集中的各个第一历史样本集,确定N个单一利率模型,N个单一利率模型中的各个单一利率模型与各个第一历史样本集一一对应。
具体的,针对N个第一历史样本集中的第i个第一历史样本集,电子设备可调用第i个第一历史样本集对应的初始利率模型,对第i个第一历史样本集中的各个第一历史样本进行用信率预测,得到各个第一历史样本的预测用信率,并基于各个第一历史样本的预测用信率,确定各个第一历史样本的预测类别,i∈[1,N]。其中,一个样本的用信率是指:相应样本对应的对象,在相应样本对应的利率信息下进行履约的概率;可选的,一个样本的用信率也可以是指:相应样本对应的对象,在相应样本对应的利率信息下按照预设有效期进行履约的概率,即在预设有效期内履约的概率;可选的,预设有效期可以是30天,也可以是45天等,本发明对此不作限定。那么相应的,可将预设有效期内是否用信(即是否履约)作为响应,以进行模型训练,也就是说,可通过是否用信类别来进行模型训练。
具体的,是否用信类别可包括用信和非用信;相应的,若任一样本的预测用信率大于预设用信率,则电子设备可确定该任一样本所属类别为用信(即该任一样本的预测类别为用信),若该任一样本的预测用信率小于或等于预设用信率,则电子设备可确定该任一样本所属类别为非用信(即该任一样本的预测类别为非用信)。可选的,预设用信率可以是按照经验设置的,也可以是按照实际需求设置的,本发明对此不作限定。
进一步的,电子设备可基于各个第一历史样本的预测类别与相应第一历史样本的标注类别,计算初始利率模型的初始利率模型损失值,并按照减小初始利率模型损失值的方向,优化初始利率模型中的模型参数,以基于模型优化后的初始利率模型,确定第i个第一历史样本集对应的单一利率模型。其中,任一样本的标注类别可以为该任一样本对应的对象实际的是否用信类别,也就是说,若该任一样本对应的对象在实际情况下进行了履约,则该任一样本的标注类别可以为用信,若该任一样本对应的对象在实际情况下未进行履约,则该任一样本的标注类别可以为非用信。
在本发明实施例中,在基于模型优化后的初始利率模型,确定第i个第一历史样本集对应的单一利率模型时,电子设备可继续对模型优化后的初始利率模型进行模型优化,直至满足利率模型收敛条件,并将满足利率模型收敛条件下的利率模型作为第i个第一历史样本集对应的单一利率模型。可选的,利率模型收敛条件可以指的是迭代次数达到利率模型迭代次数阈值,也可以指的是利率模型损失值小于利率模型损失阈值等,本发明对此不作限定;相应的,利率模型迭代次数阈值和利率模型损失阈值可以是按照经验设置的,也可以是按照实际需求设置的,本发明对此不作限定。
可选的,初始利率模型可以是Lightgbm模型(Light Gradient BoostingMachine,一种基于决策树算法的分布式梯度提升框架),也可以是XGBoost模型(eXtremeGradient Boosting,一种经过优化的分布式梯度提升库),还可以是深度神经网络模型,等等;本发明对此不作限定。
需要说明的是,各个第一历史样本集对应的初始利率模型可以相同(即各个初始利率模型中的模型参数可以相同),也可以不同(即各个初始利率模型中的模型参数可以不同),等等;本发明对此不作限定。
在本发明实施例中,电子设备可通过各个第一历史样本集对应的初始利率模型,对各个第一历史样本集所在的样本空间进行训练,从而得到各个第一历史样本集对应的单一利率模型。
S303,分别调用各个单一利率模型,对第一随机利率样本集中的各个第一随机利率样本进行用信率预测,得到各个第一随机利率样本在各个单一利率模型下的预测用信率。
其中,任一单一利率模型用于:预测任一样本在任一单一利率模型对应利率信息下的用信率,且任一样本的用信率是指:任一样本对应的对象,在相应利率信息下进行履约的概率。在本发明实施例中,任一单一利率模型下的预测用信率也可称为该任一单一利率模型下的单一利率模型分,相应的,一个随机利率样本在各个单一利率模型下的预测用信率也可称为相应随机利率样本的单一利率模型分。
在具体的实现中,电子设备可将各个单一利率模型下的预测用信率作为利率敏感模型中第二层模型的特征,以确定第一随机利率模型和第二随机利率模型,且第一随机利率模型和第二随机利率模型的确定过程可见下文所述,本发明在此不再赘述。
S304,基于各个第一随机利率样本在各个单一利率模型下的预测用信率,确定第一随机利率模型。
在具体的实现中,电子设备可采用各个第一随机利率样本在各个单一利率模型下的预测用信率,分别确定各个第一随机利率样本对应的第一随机训练数据,一个第一随机训练数据包括相应第一随机利率样本在各个单一利率模型下的预测用信率;然后,电子设备可采用各个第一随机利率样本对应的第一随机训练数据,对初始第一随机利率模型进行模型训练,得到模型训练后的初始第一随机利率模型,并基于模型训练后的初始第一随机利率模型,确定第一随机利率模型。示例性的,假设N的取值为3,那么一个第一随机利率样本在各个单一利率模型下的预测用信率可分别为预测用信率1、预测用信率2以及预测用信率3,在此种情况下,该第一随机利率样本对应的第一随机训练数据可包括预测用信率1、预测用信率2以及预测用信率3,并作为训练第二层模型中的初始第一随机利率模型的特征。
其中,初始第一随机利率模型可以是LR(Logistics Regression,逻辑回归)模型(即广义的线性回归方法,一般用于分类任务,如判断对象是不是逾期的分类任务),也可以是深度神经网络模型(即机器学习(Machine Learning,ML)领域中的一种技术,通常指利用多层次的网络结构进行预测的方法),还可以是决策树模型(即是一种简单易用的非参数分类器,它不需要对数据有任何的先验假设,计算速度较快,结果容易解释,且稳健性强),等等;本发明对此不作限定。应当理解的是,本发明实施例中的模型均为有监督学习,所谓的有监督学习是从标签化训练数据集中推断出函数的机器学习任务,也就是说,可基于标注类别进行模型训练。
具体的,在采用各个第一随机利率样本对应的第一随机训练数据,对初始第一随机利率模型进行模型训练,得到模型训练后的初始第一随机利率模型时,电子设备可调用初始第一随机利率模型对各个第一随机利率样本对应的第一随机训练数据进行用信率预测,得到各个第一随机利率样本的预测用信率,并基于各个第一随机利率样本的预测用信率,确定各个第一随机利率样本的预测类别;然后,电子设备可基于各个第一随机利率样本的预测类别与相应第一随机利率样本的标注类别,计算初始第一随机利率模型的初始第一随机利率模型损失值,并按照减小初始第一随机利率模型损失值的方向,对初始第一随机利率模型中的模型参数进行模型训练,得到模型训练后的初始第一随机利率模型。其中,一个样本通过随机利率模型(如第一随机利率模型或第二随机利率模型)所预测的预测用信率也可称为随机利率模型分(如第一随机利率模型分或第二随机利率模型分)。
在本发明实施例中,在基于模型训练后的初始第一随机利率模型,确定第一随机利率模型时,电子设备可继续对模型训练后的初始第一随机利率模型进行模型训练,直至满足第一随机利率模型收敛条件,并将满足第一随机利率模型收敛条件下的随机利率模型作为第一随机利率模型。可选的,第一随机利率模型收敛条件可以指的是迭代次数达到第一随机利率模型迭代次数阈值,也可以指的是第一随机利率模型损失值小于第一随机利率模型损失阈值等,本发明对此不作限定;相应的,第一随机利率模型迭代次数阈值和第一随机利率模型损失阈值均可以是按照经验设置的,也可以是按照实际需求设置的,本分明对此不作限定。
S305,分别调用各个单一利率模型,对各个第二随机利率样本进行用信率预测,得到各个第二随机利率样本在各个单一利率模型下的预测用信率。
S306,基于各个第二随机利率样本在各个单一利率模型下的预测用信率,确定第二随机利率模型。
在具体的实现中,电子设备可采用各个第二随机利率样本在各个单一利率模型下的预测用信率,分别确定各个第二随机利率样本对应的第二随机训练数据,一个第二随机训练数据包括相应第二随机利率样本在各个单一利率模型下的预测用信率;然后,电子设备可采用各个第二随机利率样本对应的第二随机训练数据,对初始第二随机利率模型进行模型训练,得到模型训练后的初始第二随机利率模型,并基于模型训练后的初始第二随机利率模型,确定第二随机利率模型。
其中,初始第二随机利率模型可以是LR(Logistics Regression,逻辑回归)模型,也可以是深度神经网络模型,还可以是决策树模型,等等;本发明对此不作限定。需要说明的是,初始第二随机利率模型可以与初始第一随机利率模型相同,也可以与初始第一随机利率模型不同,本发明对此不作限定。可选的,由于本发明实施例可通过一个样本在第一随机利率模型下的预测用信率,以及在第二随机利率模型下的预测用信率之间的差值,计算相应样本对应的对象的利率敏感度,所以本发明实施例可优选初始第一随机利率模型与初始第二随机利率模型相同,以避免模型差异带来的误差,从而提高利率敏感度的精确性;例如,当初始第一随机利率模型和初始第二随机利率模型均为逻辑回归模型时,电子设备可基于双逻辑回归模型学习利率敏感度,当初始第一随机利率模型和初始第二随机利率模型均为深度神经网络模型时,电子设备可基于双深度神经网络模型学习利率敏感度,当初始第一随机利率模型和初始第二随机利率模型均为决策树模型时,电子设备可基于双决策树模型学习利率敏感度。
可选的,第一随机利率样本集可用于确定利率敏感模型中的第一随机利率模型,第二随机利率样本集可用于确定利率敏感模型中的第二随机利率模型,由于第一随机利率样本集和第二随机利率样本集包括的随机利率样本的数量均较少,所以本发明实施例可优选初始第一随机利率模型和初始第二随机利率模型均为逻辑回归模型,即可优选第一随机利率模型和第二随机利率模型均为逻辑回归模型,也就是说,本发明实施例可优选复杂度偏低的模型以构建随机利率模型。在此种情况下,本发明实施例可基于双逻辑回归模型学习利率敏感度的方法,解决了无法使用有监督学习的方法学习利率敏感度,且可通过迁移学习的方法解决建模样本少的问题。
具体的,在采用各个第二随机利率样本对应的第二随机训练数据,对初始第二随机利率模型进行模型训练,得到模型训练后的初始第二随机利率模型时,电子设备可调用初始第二随机利率模型对各个第二随机利率样本对应的第二随机训练数据进行用信率预测,得到各个第二随机利率样本的预测用信率,并基于各个第二随机利率样本的预测用信率,确定各个第二随机利率样本的预测类别;然后,电子设备可基于各个第二随机利率样本的预测类别与相应第二随机利率样本的标注类别,计算初始第二随机利率模型的初始第二随机利率模型损失值,并按照减小初始第二随机利率模型损失值的方向,对初始第二随机利率模型中的模型参数进行模型训练,得到模型训练后的初始第二随机利率模型。
需要说明的是,在基于模型训练后的初始第二随机利率模型,确定第二随机利率模型时,电子设备可继续对模型训练后的初始第二随机利率模型进行模型训练,直至满足第二随机利率模型收敛条件,并将满足第二随机利率模型收敛条件下的随机利率模型作为第二随机利率模型。可选的,第二随机利率模型收敛条件可以指的是迭代次数达到第二随机利率模型迭代次数阈值,也可以指的是第二随机利率模型损失值小于第二随机利率模型损失阈值等,本发明对此不作限定;相应的,第二随机利率模型迭代次数阈值和第二随机利率模型损失阈值均可以是按照经验设置的,也可以是按照实际需求设置的,本分明对此不作限定。
综上所述,电子设备可通过N个第一历史样本集和每个第一历史样本的标注类别进行训练,得到N个单一利率模型;然后,调用各个单一利率模型对各个第一随机利率样本进行用信率预测,得到各个第一随机利率样本在各个单一利率模型下的预测用信率(即单一利率模型分),以及调用各个单一利率模型对各个第二随机利率样本进行用信率预测,得到各个第二随机利率样本在各个单一利率模型下的预测用信率。然后,采用各个第一随机利率样本在各个单一利率模型下的预测用信率,确定各个第一随机利率样本对应的第一随机训练数据,并采用各个第二随机利率样本在各个单一利率模型下的预测用信率,确定各个第二随机利率样本对应的第二随机训练数据,以实现将各个单一利率模型下的预测用信率迁移到相应的随机利率样本。进一步的,可基于各个第一随机利率样本对应的第一随机训练数据(即经过单一利率模型分迁移后的随机利率样本)和各个第一随机利率样本的标注类别,对初始第一随机利率模型进行模型训练,并基于各个第二随机利率样本对应的第二随机训练数据和各个第二随机利率样本的标注类别,对初始第二随机利率模型进行模型训练,以实现在少量历史随机定价样本(即随机利率样本)上进行微调,从而实现利率敏感模型中第二层模型的模型训练,也就是说,可以随机利率样本对应的N个单一利率模型分作为特征,拟合随机利率样本下的响应情况,从而完成特征层面的迁移学习,如图4所示。
应当理解的是,图4仅示例性地对迁移学习进行了表示,本发明对此不作限定;例如,单一利率模型分和是否用信类别之间还可包括N个单一利率模型,也就是说,单一利率模型分是由各个单一利率模型得到的;又如,随机利率样本集和是否用信类别之后还可包括随机利率模型,等等。
S307,采用各个单一利率模型、第一随机利率模型以及第二随机利率模型,构建利率敏感模型。
在本发明实施例中,当利率敏感模型包括各个单一利率模型、第一随机利率模型以及第二随机利率模型时,电子设备可获取目标对象对应的对象预测样本,并分别调用各个单一利率模型,对对象预测样本进行用信率预测,得到对象预测样本在各个单一利率模型下的预测用信率,以及采用对象预测样本在各个单一利率模型下的预测用信率,确定对象预测样本对应的目标预测样本。然后,电子设备可调用第一随机利率模型对目标预测样本进行用信率预测,得到目标预测样本的第一预测用信率,并调用第二随机利率模型对目标预测样本进行用信率预测,得到目标预测样本的第二预测用信率,从而采用第一预测用信率和第二预测用信率之间的差值,计算目标对象的利率敏感度,如图5所示。
示例性的,假设N个单一利率模型包括单一利率模型1、单一利率模型2以及单一利率模型3,则电子设备可得到对象预测样本在单一利率模型1下的预测用信率1、在单一利率模型2下的预测用信率2以及在单一利率模型3下的预测用信率3,以得到目标预测样本,且目标预测样本包括预测用信率1、预测用信率2以及预测用信率3;又假设第一预测用信率为0.3,第二预测用信率为0.8,那么电子设备可计算目标对象的利率敏感度为0.5,等等。
需要说明的是,电子设备还可根据目标对象的利率敏感度,为目标对象确定目标利率信息;其中,目标利率信息可随着目标对象的利率敏感度的增大而减小,也就是说,当目标对象的利率敏感度较大时,可为目标对象确定较小的目标利率信息,当目标对象的利率敏感度较小时,可为目标对象确定较大的目标利率信息。可选的,电子设备可采用多个利率敏感度和多个利率敏感度中各个利率敏感度对应的利率信息,构建利率函数,并采用利率函数和目标对象的利率敏感度,计算目标利率信息;或者,电子设备可对利率敏感度范围进行范围划分,得到多个利率敏感子范围,且一个利率敏感子范围对应一个利率信息,基于此,电子设备可将目标对象的利率敏感度所属的利率敏感子范围对应的利率信息,作为目标利率信息,等等;本发明对此不作限定。
本发明实施例可在获取到N个第一历史样本集,以及获取到第二历史样本集后,分别采用N个第一历史样本集中的各个第一历史样本集,确定N个单一利率模型,N个单一利率模型中的各个单一利率模型与各个第一历史样本集一一对应,且第二历史样本集包括第一随机利率样本集和第二随机利率样本集。然后,分别调用各个单一利率模型,对第一随机利率样本集中的各个第一随机利率样本进行用信率预测,得到各个第一随机利率样本在各个单一利率模型下的预测用信率,并基于各个第一随机利率样本在各个单一利率模型下的预测用信率,确定第一随机利率模型;以及,分别调用各个单一利率模型,对各个第二随机利率样本进行用信率预测,得到各个第二随机利率样本在各个单一利率模型下的预测用信率,并基于各个第二随机利率样本在各个单一利率模型下的预测用信率,确定第二随机利率模型;基于此,可采用各个单一利率模型、第一随机利率模型以及第二随机利率模型,构建利率敏感模型,利率敏感模型用于预测目标对象的利率敏感度。可见,本发明实施例可将各个单一利率模型重用于第一随机利率模型和第二随机利率模型的构建过程中,从而可通过在少量历史随机定价样本上给以修正微调,同时也可学习到大量数据下的特征信息,可有效提高利率敏感模型的模型性能,从而通过利率敏感模型精确地获取目标对象的利率敏感度,也就是说,本发明实施例可提高利率敏感度的精确性。
基于上述模型构建方法的相关实施例的描述,本发明实施例还提出了一种模型构建装置,该模型构建装置可以是运行于电子设备中的一个计算机程序(包括程序代码);如图6所示,该模型构建装置可包括获取单元601和处理单元602。该模型构建装置可以执行图1或图3所示的模型构建方法,即该模型构建装置可以运行上述单元:
获取单元601,用于获取N个第一历史样本集,以及获取第二历史样本集,同一第一历史样本集中的第一历史样本对应同一利率信息,且一个第二历史样本对应的利率信息为随机生成的利率信息,N为正整数;
处理单元602,用于分别采用所述N个第一历史样本集中的各个第一历史样本集,确定N个单一利率模型,所述N个单一利率模型中的各个单一利率模型与所述各个第一历史样本集一一对应;
所述处理单元602,还用于基于所述第二历史样本集和所述各个单一利率模型,构建利率敏感模型,所述利率敏感模型用于预测目标对象的利率敏感度。
在一种实施方式中,所述第二历史样本集包括第一随机利率样本集和第二随机利率样本集,且所述第一随机利率样本集中任一第一随机利率样本对应的利率信息,大于或等于所述第二随机利率样本集中各个第二随机利率样本对应的利率信息;处理单元602在基于所述第二历史样本集和所述各个单一利率模型,构建利率敏感模型时,可具体用于:
分别调用所述各个单一利率模型,对所述第一随机利率样本集中的各个第一随机利率样本进行用信率预测,得到所述各个第一随机利率样本在所述各个单一利率模型下的预测用信率,任一单一利率模型用于:预测任一样本在所述任一单一利率模型对应利率信息下的用信率,且所述任一样本的用信率是指:所述任一样本对应的对象,在相应利率信息下进行履约的概率;
基于所述各个第一随机利率样本在所述各个单一利率模型下的预测用信率,确定第一随机利率模型;
分别调用所述各个单一利率模型,对所述各个第二随机利率样本进行用信率预测,得到所述各个第二随机利率样本在所述各个单一利率模型下的预测用信率;
基于所述各个第二随机利率样本在所述各个单一利率模型下的预测用信率,确定第二随机利率模型;
采用所述各个单一利率模型、所述第一随机利率模型以及所述第二随机利率模型,构建利率敏感模型。
另一种实施方式中,处理单元602在基于所述各个第一随机利率样本在所述各个单一利率模型下的预测用信率,确定第一随机利率模型时,可具体用于:
采用所述各个第一随机利率样本在所述各个单一利率模型下的预测用信率,分别确定所述各个第一随机利率样本对应的第一随机训练数据,一个第一随机训练数据包括相应第一随机利率样本在所述各个单一利率模型下的预测用信率;
采用所述各个第一随机利率样本对应的第一随机训练数据,对初始第一随机利率模型进行模型训练,得到模型训练后的初始第一随机利率模型,并基于所述模型训练后的初始第一随机利率模型,确定第一随机利率模型;
处理单元602在基于所述各个第二随机利率样本在所述各个单一利率模型下的预测用信率,确定第二随机利率模型时,可具体用于:
采用所述各个第二随机利率样本在所述各个单一利率模型下的预测用信率,分别确定所述各个第二随机利率样本对应的第二随机训练数据,一个第二随机训练数据包括相应第二随机利率样本在所述各个单一利率模型下的预测用信率;
采用所述各个第二随机利率样本对应的第二随机训练数据,对初始第二随机利率模型进行模型训练,得到模型训练后的初始第二随机利率模型,并基于所述模型训练后的初始第二随机利率模型,确定第二随机利率模型。
另一种实施方式中,处理单元602在分别采用所述N个第一历史样本集中的各个第一历史样本集,确定N个单一利率模型时,可具体用于:
针对所述N个第一历史样本集中的第i个第一历史样本集,调用所述第i个第一历史样本集对应的初始利率模型,对所述第i个第一历史样本集中的各个第一历史样本进行用信率预测,得到所述各个第一历史样本的预测用信率,并基于所述各个第一历史样本的预测用信率,确定所述各个第一历史样本的预测类别,i∈[1,N];
基于所述各个第一历史样本的预测类别与相应第一历史样本的标注类别,计算所述初始利率模型的初始利率模型损失值;
按照减小所述初始利率模型损失值的方向,优化所述初始利率模型中的模型参数,以基于模型优化后的初始利率模型,确定所述第i个第一历史样本集对应的单一利率模型。
另一种实施方式中,所述第二历史样本集包括的第二历史样本的数量是基于预设样本比例和目标数据量所确定的,所述目标数据量包括以下任一种:所述N个第一历史样本集中第一历史样本的数量和目标时间范围内办理目标业务的业务数据量,且所述预设样本比例小于样本比例阈值。
另一种实施方式中,所述第二历史样本集包括第一随机利率样本集和第二随机利率样本集,所述第一随机利率样本集用于确定所述利率敏感模型中的第一随机利率模型,所述第二随机利率样本集用于确定所述利率敏感模型中的第二随机利率模型,且所述第一随机利率模型和所述第二随机利率模型均为逻辑回归模型。
另一种实施方式中,所述利率敏感模型包括所述各个单一利率模型、第一随机利率模型以及第二随机利率模型,获取单元601,还可用于:
获取所述目标对象对应的对象预测样本;
处理单元602,还可用于:
分别调用所述各个单一利率模型,对所述对象预测样本进行用信率预测,得到所述对象预测样本在所述各个单一利率模型下的预测用信率;
采用所述对象预测样本在所述各个单一利率模型下的预测用信率,确定所述对象预测样本对应的目标预测样本;
调用所述第一随机利率模型对所述目标预测样本进行用信率预测,得到所述目标预测样本的第一预测用信率,并调用所述第二随机利率模型对所述目标预测样本进行用信率预测,得到所述目标预测样本的第二预测用信率;
采用所述第一预测用信率和所述第二预测用信率之间的差值,计算所述目标对象的利率敏感度。
根据本发明的一个实施例,图1或图3所示的方法所涉及的各个步骤均可由图6所示的模型构建装置中的各个单元来执行的。例如,图1中所示的步骤S101可由图6中所示的获取单元601执行,步骤S102和S103均可由图6中所示的处理单元602执行。又如,图3中所示的步骤S301可由图6中所示的获取单元601执行,步骤S302-S307均可由图6中所示的处理单元602执行,等等。
根据本发明的另一个实施例,图6所示的模型构建装置中的各个单元均可以分别或全部合并为一个或若干个另外的单元来构成,或者其中的某个(些)单元还可以再拆分为功能上更小的多个单元来构成,这可以实现同样的操作,而不影响本发明的实施例的技术效果的实现。上述单元是基于逻辑功能划分的,在实际应用中,一个单元的功能也可以由多个单元来实现,或者多个单元的功能由一个单元实现。在本发明的其它实施例中,任一模型构建装置也可以包括其他单元,在实际应用中,这些功能也可以由其它单元协助实现,并且可以由多个单元协作实现。
根据本发明的另一个实施例,可以通过在包括中央处理单元(CPU)、随机存取存储介质(RAM)、只读存储介质(ROM)等处理元件和存储元件的例如计算机的通用电子设备上运行能够执行如图1或图3中所示的相应方法所涉及的各步骤的计算机程序(包括程序代码),来构造如图6中所示的模型构建装置,以及来实现本发明实施例的模型构建方法。所述计算机程序可以记载于例如计算机存储介质上,并通过计算机存储介质装载于上述电子设备中,并在其中运行。
本发明实施例可在获取到N个第一历史样本集,以及获取到第二历史样本集后,分别采用N个第一历史样本集中的各个第一历史样本集,确定N个单一利率模型,同一第一历史样本集中的第一历史样本对应同一利率信息,且一个第二历史样本对应的利率信息为随机生成的利率信息,N个单一利率模型中的各个单一利率模型与各个第一历史样本集一一对应,N为正整数;然后,基于第二历史样本集和各个单一利率模型,构建利率敏感模型,利率敏感模型用于预测目标对象的利率敏感度。可见,本发明实施例可针对利率定价构建利率敏感模型,从而通过利率敏感模型获取目标对象的利率敏感度,以采用目标对象的利率敏感度对目标对象进行更有差异化的利率定价,也就是说,本发明实施例可基于目标对象的利率敏感度为目标对象确定合适的利率信息。同时,本发明实施例可基于迁移学习的特征构造方法,通过在N个第一历史样本集上学习到重要的信息,在第二历史样本集上进行微调,对利率敏感模型特征信息的构建具有较大意义,可有效提高利率敏感模型的模型性能,从而通过利率敏感模型精确地获取目标对象的利率敏感度,也就是说,本发明实施例可提高利率敏感度的精确性。
基于上述方法实施例以及装置实施例的描述,本发明示例性实施例还提供一种电子设备,包括:至少一个处理器;以及与至少一个处理器通信连接的存储器。所述存储器存储有能够被所述至少一个处理器执行的计算机程序,所述计算机程序在被所述至少一个处理器执行时用于使所述电子设备执行根据本发明实施例的方法。
本发明示例性实施例还提供一种存储有计算机程序的非瞬时计算机可读存储介质,其中,所述计算机程序在被计算机的处理器执行时用于使所述计算机执行根据本发明实施例的方法。
本发明示例性实施例还提供一种计算机程序产品,包括计算机程序,其中,所述计算机程序在被计算机的处理器执行时用于使所述计算机执行根据本发明实施例的方法。
参考图7,现将描述可以作为本发明的服务器或客户端的电子设备700的结构框图,其是可以应用于本发明的各方面的硬件设备的示例。电子设备旨在表示各种形式的数字电子的计算机设备,诸如,膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置,诸如,个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例,并且不意在限制本文中描述的和/或者要求的本发明的实现。
如图7所示,电子设备700包括计算单元701,其可以根据存储在只读存储器(ROM)702中的计算机程序或者从存储单元708加载到随机访问存储器(RAM)703中的计算机程序,来执行各种适当的动作和处理。在RAM 703中,还可存储设备700操作所需的各种程序和数据。计算单元701、ROM 702以及RAM 703通过总线704彼此相连。输入/输出(I/O)接口705也连接至总线704。
电子设备700中的多个部件连接至I/O接口705,包括:输入单元706、输出单元707、存储单元708以及通信单元709。输入单元706可以是能向电子设备700输入信息的任何类型的设备,输入单元706可以接收输入的数字或字符信息,以及产生与电子设备的用户设置和/或功能控制有关的键信号输入。输出单元707可以是能呈现信息的任何类型的设备,并且可以包括但不限于显示器、扬声器、视频/音频输出终端、振动器和/或打印机。存储单元708可以包括但不限于磁盘、光盘。通信单元709允许电子设备700通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据,并且可以包括但不限于调制解调器、网卡、红外通信设备、无线通信收发机和/或芯片组,例如蓝牙TM设备、WiFi设备、WiMax设备、蜂窝通信设备和/或类似物。
计算单元701可以是各种具有处理和计算能力的通用和/或专用处理组件。计算单元701的一些示例包括但不限于中央处理单元(CPU)、图形处理单元(GPU)、各种专用的人工智能(AI)计算芯片、各种运行机器学习模型算法的计算单元、数字信号处理器(DSP)、以及任何适当的处理器、控制器、微控制器等。计算单元701执行上文所描述的各个方法和处理。例如,在一些实施例中,模型构建方法可被实现为计算机软件程序,其被有形地包含于机器可读介质,例如存储单元708。在一些实施例中,计算机程序的部分或者全部可以经由ROM702和/或通信单元709而被载入和/或安装到电子设备700上。在一些实施例中,计算单元701可以通过其他任何适当的方式(例如,借助于固件)而被配置为执行模型构建方法。
用于实施本发明的方法的程序代码可以采用一个或多个编程语言的任何组合来编写。这些程序代码可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器或控制器,使得程序代码当由处理器或控制器执行时使流程图和/或框图中所规定的功能/操作被实施。程序代码可以完全在机器上执行、部分地在机器上执行,作为独立软件包部分地在机器上执行且部分地在远程机器上执行或完全在远程机器或服务器上执行。
在本发明的上下文中,机器可读介质可以是有形的介质,其可以包含或存储以供指令执行***、装置或设备使用或与指令执行***、装置或设备结合地使用的程序。机器可读介质可以是机器可读信号介质或机器可读储存介质。机器可读介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体***、装置或设备,或者上述内容的任何合适组合。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或快闪存储器)、光纤、便捷式紧凑盘只读存储器(CD-ROM)、光学储存设备、磁储存设备、或上述内容的任何合适组合。
如本发明使用的,术语“机器可读介质”和“计算机可读介质”指的是用于将机器指令和/或数据提供给可编程处理器的任何计算机程序产品、设备、和/或装置(例如,磁盘、光盘、存储器、可编程逻辑装置(PLD)),包括,接收作为机器可读信号的机器指令的机器可读介质。术语“机器可读信号”指的是用于将机器指令和/或数据提供给可编程处理器的任何信号。
为了提供与用户的交互,可以在计算机上实施此处描述的***和技术,该计算机具有:用于向用户显示信息的显示装置(例如,CRT(阴极射线管)或者LCD(液晶显示器)监视器);以及键盘和指向装置(例如,鼠标或者轨迹球),用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互;例如,提供给用户的反馈可以是任何形式的传感反馈(例如,视觉反馈、听觉反馈、或者触觉反馈);并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。
可以将此处描述的***和技术实施在包括后台部件的计算***(例如,作为数据服务器)、或者包括中间件部件的计算***(例如,应用服务器)、或者包括前端部件的计算***(例如,具有图形用户界面或者网络浏览器的用户计算机,用户可以通过该图形用户界面或者该网络浏览器来与此处描述的***和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算***中。可以通过任何形式或者介质的数字数据通信(例如,通信网络)来将***的部件相互连接。通信网络的示例包括:局域网(LAN)、广域网(WAN)和互联网。
计算机***可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。
并且,应理解的是,以上所揭露的仅为本发明较佳实施例而已,当然不能以此来限定本发明之权利范围,因此依本发明权利要求所作的等同变化,仍属本发明所涵盖的范围。

Claims (10)

1.一种模型构建方法,其特征在于,包括:
获取N个第一历史样本集,以及获取第二历史样本集,同一第一历史样本集中的第一历史样本对应同一利率信息,且一个第二历史样本对应的利率信息为随机生成的利率信息,N为正整数;
分别采用所述N个第一历史样本集中的各个第一历史样本集,确定N个单一利率模型,所述N个单一利率模型中的各个单一利率模型与所述各个第一历史样本集一一对应;
基于所述第二历史样本集和所述各个单一利率模型,构建利率敏感模型,所述利率敏感模型用于预测目标对象的利率敏感度。
2.根据权利要求1所述的方法,其特征在于,所述第二历史样本集包括第一随机利率样本集和第二随机利率样本集,且所述第一随机利率样本集中任一第一随机利率样本对应的利率信息,大于或等于所述第二随机利率样本集中各个第二随机利率样本对应的利率信息;所述基于所述第二历史样本集和所述各个单一利率模型,构建利率敏感模型,包括:
分别调用所述各个单一利率模型,对所述第一随机利率样本集中的各个第一随机利率样本进行用信率预测,得到所述各个第一随机利率样本在所述各个单一利率模型下的预测用信率,任一单一利率模型用于:预测任一样本在所述任一单一利率模型对应利率信息下的用信率,且所述任一样本的用信率是指:所述任一样本对应的对象,在相应利率信息下进行履约的概率;
基于所述各个第一随机利率样本在所述各个单一利率模型下的预测用信率,确定第一随机利率模型;
分别调用所述各个单一利率模型,对所述各个第二随机利率样本进行用信率预测,得到所述各个第二随机利率样本在所述各个单一利率模型下的预测用信率;
基于所述各个第二随机利率样本在所述各个单一利率模型下的预测用信率,确定第二随机利率模型;
采用所述各个单一利率模型、所述第一随机利率模型以及所述第二随机利率模型,构建利率敏感模型。
3.根据权利要求2所述的方法,其特征在于,所述基于所述各个第一随机利率样本在所述各个单一利率模型下的预测用信率,确定第一随机利率模型,包括:
采用所述各个第一随机利率样本在所述各个单一利率模型下的预测用信率,分别确定所述各个第一随机利率样本对应的第一随机训练数据,一个第一随机训练数据包括相应第一随机利率样本在所述各个单一利率模型下的预测用信率;
采用所述各个第一随机利率样本对应的第一随机训练数据,对初始第一随机利率模型进行模型训练,得到模型训练后的初始第一随机利率模型,并基于所述模型训练后的初始第一随机利率模型,确定第一随机利率模型;
所述基于所述各个第二随机利率样本在所述各个单一利率模型下的预测用信率,确定第二随机利率模型,包括:
采用所述各个第二随机利率样本在所述各个单一利率模型下的预测用信率,分别确定所述各个第二随机利率样本对应的第二随机训练数据,一个第二随机训练数据包括相应第二随机利率样本在所述各个单一利率模型下的预测用信率;
采用所述各个第二随机利率样本对应的第二随机训练数据,对初始第二随机利率模型进行模型训练,得到模型训练后的初始第二随机利率模型,并基于所述模型训练后的初始第二随机利率模型,确定第二随机利率模型。
4.根据权利要求1-3任一项所述的方法,其特征在于,所述分别采用所述N个第一历史样本集中的各个第一历史样本集,确定N个单一利率模型,包括:
针对所述N个第一历史样本集中的第i个第一历史样本集,调用所述第i个第一历史样本集对应的初始利率模型,对所述第i个第一历史样本集中的各个第一历史样本进行用信率预测,得到所述各个第一历史样本的预测用信率,并基于所述各个第一历史样本的预测用信率,确定所述各个第一历史样本的预测类别,i∈[1,N];
基于所述各个第一历史样本的预测类别与相应第一历史样本的标注类别,计算所述初始利率模型的初始利率模型损失值;
按照减小所述初始利率模型损失值的方向,优化所述初始利率模型中的模型参数,以基于模型优化后的初始利率模型,确定所述第i个第一历史样本集对应的单一利率模型。
5.根据权利要求1-3任一项所述的方法,其特征在于,所述第二历史样本集包括的第二历史样本的数量是基于预设样本比例和目标数据量所确定的,所述目标数据量包括以下任一种:所述N个第一历史样本集中第一历史样本的数量和目标时间范围内办理目标业务的业务数据量,且所述预设样本比例小于样本比例阈值。
6.根据权利要求5所述的方法,其特征在于,所述第二历史样本集包括第一随机利率样本集和第二随机利率样本集,所述第一随机利率样本集用于确定所述利率敏感模型中的第一随机利率模型,所述第二随机利率样本集用于确定所述利率敏感模型中的第二随机利率模型,且所述第一随机利率模型和所述第二随机利率模型均为逻辑回归模型。
7.根据权利要求1-3任一项所述的方法,其特征在于,所述利率敏感模型包括所述各个单一利率模型、第一随机利率模型以及第二随机利率模型,所述方法还包括:
获取所述目标对象对应的对象预测样本;
分别调用所述各个单一利率模型,对所述对象预测样本进行用信率预测,得到所述对象预测样本在所述各个单一利率模型下的预测用信率;
采用所述对象预测样本在所述各个单一利率模型下的预测用信率,确定所述对象预测样本对应的目标预测样本;
调用所述第一随机利率模型对所述目标预测样本进行用信率预测,得到所述目标预测样本的第一预测用信率,并调用所述第二随机利率模型对所述目标预测样本进行用信率预测,得到所述目标预测样本的第二预测用信率;
采用所述第一预测用信率和所述第二预测用信率之间的差值,计算所述目标对象的利率敏感度。
8.一种模型构建装置,其特征在于,所述装置包括:
获取单元,用于获取N个第一历史样本集,以及获取第二历史样本集,同一第一历史样本集中的第一历史样本对应同一利率信息,且一个第二历史样本对应的利率信息为随机生成的利率信息,N为正整数;
处理单元,用于分别采用所述N个第一历史样本集中的各个第一历史样本集,确定N个单一利率模型,所述N个单一利率模型中的各个单一利率模型与所述各个第一历史样本集一一对应;
所述处理单元,还用于基于所述第二历史样本集和所述各个单一利率模型,构建利率敏感模型,所述利率敏感模型用于预测目标对象的利率敏感度。
9.一种电子设备,其特征在于,包括:
处理器;以及
存储程序的存储器,
其中,所述程序包括指令,所述指令在由所述处理器执行时使所述处理器执行根据权利要求1-7中任一项所述的方法。
10.一种存储有计算机指令的非瞬时计算机可读存储介质,其中,所述计算机指令用于使计算机执行根据权利要求1-7中任一项所述的方法。
CN202310851489.2A 2023-07-12 2023-07-12 模型构建方法、装置、存储介质及电子设备 Pending CN117093933A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310851489.2A CN117093933A (zh) 2023-07-12 2023-07-12 模型构建方法、装置、存储介质及电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310851489.2A CN117093933A (zh) 2023-07-12 2023-07-12 模型构建方法、装置、存储介质及电子设备

Publications (1)

Publication Number Publication Date
CN117093933A true CN117093933A (zh) 2023-11-21

Family

ID=88772545

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310851489.2A Pending CN117093933A (zh) 2023-07-12 2023-07-12 模型构建方法、装置、存储介质及电子设备

Country Status (1)

Country Link
CN (1) CN117093933A (zh)

Similar Documents

Publication Publication Date Title
CN106548210B (zh) 基于机器学习模型训练的信贷用户分类方法及装置
US11501161B2 (en) Method to explain factors influencing AI predictions with deep neural networks
EP3779737B1 (en) Threshold value determination and identity verification method, threshold value determination and identity verification apparatus, electronic device, and storage medium
WO2020168851A1 (zh) 行为识别
US11811708B2 (en) Systems and methods for generating dynamic conversational responses using cluster-level collaborative filtering matrices
US20220027339A1 (en) Identifying source datasets that fit a transfer learning process for a target domain
US20220114664A1 (en) Use of machine learning to forecast, recommend, and trade securities in currency markets
US20220383324A1 (en) Dynamic autoscaling of server resources using intelligent demand analytic systems
CN113627566A (zh) 一种网络诈骗的预警方法、装置和计算机设备
US20220207420A1 (en) Utilizing machine learning models to characterize a relationship between a user and an entity
US20240144278A1 (en) Systems and methods for fraud monitoring
CN116883154A (zh) 信贷风险识别方法、装置、电子设备及可读存储介质
US11475019B2 (en) Contact graph scoring system
WO2024059814A2 (en) Systems and methods for determining trusted devices
CN115600818A (zh) 多维评分方法、装置、电子设备和存储介质
CN117093933A (zh) 模型构建方法、装置、存储介质及电子设备
CN115063145A (zh) 交易风险因子的预测方法、装置、电子设备和存储介质
CN114862435A (zh) 客户流失预警方法、设备及介质
CN114239985A (zh) 汇率预测方法、装置、电子设备及存储介质
CN113807391A (zh) 任务模型的训练方法、装置、电子设备及存储介质
CN113112311A (zh) 训练因果推断模型的方法、信息提示方法以装置
US12072895B2 (en) Contact graph scoring system
US20240289877A1 (en) Systems and methods for validating dynamic income
US20240202816A1 (en) Systems and methods for dynamically generating pre-approval data
US20240267367A1 (en) Systems and methods for authentication using partitioned authentication tokens

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination