CN118134652A - 一种资产配置方案生成方法、装置、电子设备及介质 - Google Patents

一种资产配置方案生成方法、装置、电子设备及介质 Download PDF

Info

Publication number
CN118134652A
CN118134652A CN202410296672.5A CN202410296672A CN118134652A CN 118134652 A CN118134652 A CN 118134652A CN 202410296672 A CN202410296672 A CN 202410296672A CN 118134652 A CN118134652 A CN 118134652A
Authority
CN
China
Prior art keywords
preference
target object
target
information
feature set
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202410296672.5A
Other languages
English (en)
Inventor
陈芃宇
游屹
唐鹏飞
袁超
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Construction Bank Corp
CCB Finetech Co Ltd
Original Assignee
China Construction Bank Corp
CCB Finetech Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Construction Bank Corp, CCB Finetech Co Ltd filed Critical China Construction Bank Corp
Priority to CN202410296672.5A priority Critical patent/CN118134652A/zh
Publication of CN118134652A publication Critical patent/CN118134652A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)

Abstract

本申请涉及数据分析技术领域,具体涉及一种资产配置方案生成方法、装置、电子设备及介质,用于解决相关技术中生成的资产配置方案质量不稳定,无法与客户高度匹配的问题。该方法包括:获取目标对象的基本信息和资产信息;基于基本信息和资产信息,对目标对象进行行业类别偏好预测,确定目标对象的行业类别偏好信息,行业类别偏好信息表征目标对象对金融产品所属行业类别的偏好程度;根据行业类别偏好信息从目标金融产品类型所包括的多个金融产品中选择至少一个目标金融产品;基于至少一个目标金融产品输出资产配置方案,资产配置方案指示了每个目标金融产品在目标对象的资产中所占的比重。

Description

一种资产配置方案生成方法、装置、电子设备及介质
技术领域
本申请涉及数据分析技术领域,具体涉及一种资产配置方案生成方法、装置、电子设备及介质。
背景技术
随着金融市场的不断发展和人们生活水平的不断提高,人们对于金融产品的购买需求也越来越大。尤其对于高净值客户而言,由于其自身拥有资产数额较大,如何对其资产进行合理的分配就显得尤为重要。
目前生成客户的资产配置方案时,一般是通过对客户发放一系列的调查问卷,来获取客户的相关信息,再由客户经理进行主观分析,将现有的金融产品与客户进行匹配,从而得到最终的资产配置方案并推送给客户。
然而,通过这种方式生成资产配置方案时,需要客户花费大量时间去填写调查问卷,而且生成的资产配置方案还与客户经理的经验以及分析能力,息息相关,一旦客户经理由于缺乏经验或者能力欠缺,导致分析错误,就会为客户提供质量较低或者与客户不匹配的资产配置方案。
因此如何为客户提供一种高质量且与客户匹配度高的资产配置方案就亟待解决。
发明内容
本申请实施例提供一种一种资产配置方案生成方法、装置、设备及介质,用于解决相关技术中生成的资产配置方案质量不稳定,无法与客户高度匹配的问题。
第一方面,本申请实施例提供一种资产配置方案生成方法,所述方法包括:
获取目标对象的基本信息和资产信息;
基于所述基本信息和所述资产信息,对所述目标对象进行行业类别偏好预测,确定所述目标对象的行业类别偏好信息,所述行业类别偏好信息表征所述目标对象对金融产品所属行业类别的偏好程度;
根据所述行业类别偏好信息从目标金融产品类型所包括的多个金融产品中选择至少一个目标金融产品;
基于所述至少一个目标金融产品输出资产配置方案,所述资产配置方案指示了每个目标金融产品在所述目标对象的资产中所占的比重。
一种可能的实现方式中,所述根据所述行业类别偏好信息从目标金融产品类型所包括的多个金融产品中选择至少一个目标金融产品之前,所述方法还包括:基于所述目标对象的风险偏好,为所述目标对象选择目标金融产品类型;所述目标风险偏好表征所述目标对象的风险接受程度;所述根据所述行业类别偏好信息从目标金融产品类型所包括的多个金融产品中选择至少一个目标金融产品,包括:根据所述行业类别偏好信息中记录的目标行业类别,在所述目标金融产品类型所包括的多个金融产品中,选择属于所述目标行业类别的目标金融产品。
一种可能的实现方式中,所述目标对象的目标风险偏好是根据以下方法确定的:对所述基本信息和所述资产信息进行特征提取,确定所述目标对象的特征集;基于不同对象的特征集与不同对象的风险偏好之间的关联关系,分析所述目标对象的特征集以获得所述目标对象的风险偏好。
一种可能的实现方式中,所述基于不同对象的特征集与不同对象的风险偏好之间的关联关系,分析所述目标对象的特征集以获得所述目标对象的风险偏好,包括:通过训练好的风险偏好分类模型,根据所述特征集,对所述目标对象进行风险偏好分类,确定所述目标对象的目标风险偏好;其中,所述风险偏好分类模型是基于训练样本的特征集和风险偏好标签训练的,所述训练样本为资产配置活跃度大于预设活跃度阈值的对象。
一种可能的实现方式中,所述基于所述基本信息和所述资产信息,对所述目标对象进行行业类别偏好预测,确定所述目标对象的行业类别偏好信息,包括:对所述基本信息和所述资产信息进行特征提取,确定所述目标对象的特征集;基于不同对象的特征集与不同对象的行业类别偏好之间的关联关系,分析所述目标对象的特征集以获得所述目标对象的行业类别偏好信息。
一种可能的实现方式中,所述基于不同对象的特征集与不同对象的行业类别偏好之间的关联关系,分析所述目标对象的特征集以获得所述目标对象的行业类别偏好信息,包括:通过训练好的行业类别偏好预测模型,根据所述特征集,对所述目标对象进行行业类别偏好预测,确定所述目标对象的行业类别偏好信息;其中,所述行业类别偏好预测模型是基于训练样本的特征集和行业类别偏好标签训练的,所述训练样本为资产配置活跃度大于预设活跃度阈值的对象。
一种可能的实现方式中,所述对所述基本信息和所述资产信息进行特征提取,确定所述目标对象的特征集,包括:对所述基本信息和所述资产信息进行特征提取,获取所述目标对象的候选特征集;从所述候选特征集中筛选出一个或多个特征,形成所述特征集;其中,所述特征集中的特征满足:所述一个或多个特征与风险偏好的关联程度大于所述候选特征集中其他特征与所述风险偏好的关联程度,或者,所述一个或多个特征与行业类别偏好的关联程度大于所述候选特征集中其他特征与所述行业类别偏好的关联程度,或者,所述一个或多个特征与风险偏好的关联程度大于所述候选特征集中其他特征与所述风险偏好的关联程度,并且所述一个或多个特征与行业类别偏好的关联程度大于所述候选特征集中其他特征与所述行业类别偏好的关联程度。
一种可能的实现方式中,所述从所述候选特征集中筛选出一个或多个特征,形成所述特征集,包括:基于所述候选特征集中包括的各个候选特征,分别生成随机特征,并将对模型变量的影响程度大于随机特征的候选特征,作为待定特征;通过自动建模模型,构建分类模型,基于所述待定特征对模型输出准确性的影响程度,对各个待定特征进行重要程度排序;所述分类模型为针对行业类别偏好和/或风险偏好进行分类的模型;基于排序结果,确定所述特征集中包括的多个特征。
第二方面,本申请实施例提供一种资产配置方案生成装置,所述装置包括:
通信单元,用于获取目标对象的基本信息和资产信息;
偏好信息确定单元,用于基于所述基本信息和所述资产信息,对所述目标对象进行行业类别偏好预测,确定所述目标对象的行业类别偏好信息,所述行业类别偏好信息表征所述目标对象对金融产品所属行业类别的偏好程度;
资产配置单元,用于根据所述行业类别偏好信息从目标金融产品类型所包括的多个金融产品中选择至少一个目标金融产品;基于所述至少一个目标金融产品输出资产配置方案,所述资产配置方案指示了每个目标金融产品在所述目标对象的资产中所占的比重。
一种可能的实现方式中,所述资产配置单元根据所述行业类别偏好信息从目标金融产品类型所包括的多个金融产品中选择至少一个目标金融产品之前,还用于:基于所述目标对象的风险偏好,为所述目标对象选择目标金融产品类型;所述目标风险偏好表征所述目标对象的风险接受程度;所述资产配置单元根据所述行业类别偏好信息从目标金融产品类型所包括的多个金融产品中选择至少一个目标金融产品时,用于:根据所述行业类别偏好信息中记录的目标行业类别,在所述目标金融产品类型所包括的多个金融产品中,选择属于所述目标行业类别的目标金融产品。
一种可能的实现方式中,所述目标对象的目标风险偏好是所述偏好信息确定单元根据以下方法确定的:对所述基本信息和所述资产信息进行特征提取,确定所述目标对象的特征集;基于不同对象的特征集与不同对象的风险偏好之间的关联关系,分析所述目标对象的特征集以获得所述目标对象的风险偏好。
一种可能的实现方式中,所述偏好信息确定单元基于不同对象的特征集与不同对象的风险偏好之间的关联关系,分析所述目标对象的特征集以获得所述目标对象的风险偏好时,用于:通过训练好的风险偏好分类模型,根据所述特征集,对所述目标对象进行风险偏好分类,确定所述目标对象的目标风险偏好;其中,所述风险偏好分类模型是基于训练样本的特征集和风险偏好标签训练的,所述训练样本为资产配置活跃度大于预设活跃度阈值的对象。
一种可能的实现方式中,所述偏好信息确定单元基于所述基本信息和所述资产信息,对所述目标对象进行行业类别偏好预测,确定所述目标对象的行业类别偏好信息时,用于:对所述基本信息和所述资产信息进行特征提取,确定所述目标对象的特征集;基于不同对象的特征集与不同对象的行业类别偏好之间的关联关系,分析所述目标对象的特征集以获得所述目标对象的行业类别偏好信息。
一种可能的实现方式中,所述偏好信息确定单元基于不同对象的特征集与不同对象的行业类别偏好之间的关联关系,分析所述目标对象的特征集以获得所述目标对象的行业类别偏好信息时,用于:通过训练好的行业类别偏好预测模型,根据所述特征集,对所述目标对象进行行业类别偏好预测,确定所述目标对象的行业类别偏好信息;其中,所述行业类别偏好预测模型是基于训练样本的特征集和行业类别偏好标签训练的,所述训练样本为资产配置活跃度大于预设活跃度阈值的对象。
一种可能的实现方式中,所述偏好信息确定单元对所述基本信息和所述资产信息进行特征提取,确定所述目标对象的特征集时,用于:对所述基本信息和所述资产信息进行特征提取,获取所述目标对象的候选特征集;从所述候选特征集中筛选出一个或多个特征,形成所述特征集;其中,所述特征集中的特征满足:所述一个或多个特征与风险偏好的关联程度大于所述候选特征集中其他特征与所述风险偏好的关联程度,或者,所述一个或多个特征与行业类别偏好的关联程度大于所述候选特征集中其他特征与所述行业类别偏好的关联程度,或者,所述一个或多个特征与风险偏好的关联程度大于所述候选特征集中其他特征与所述风险偏好的关联程度,并且所述一个或多个特征与行业类别偏好的关联程度大于所述候选特征集中其他特征与所述行业类别偏好的关联程度。
一种可能的实现方式中,所述资产配置单元从所述候选特征集中筛选出一个或多个特征,形成所述特征集时,用于:基于所述候选特征集中包括的各个候选特征,分别生成随机特征,并将对模型变量的影响程度大于随机特征的候选特征,作为待定特征;通过自动建模模型,构建分类模型,基于所述待定特征对模型输出准确性的影响程度,对各个待定特征进行重要程度排序;所述分类模型为针对行业类别偏好和/或风险偏好进行分类的模型;基于排序结果,确定所述特征集中包括的多个特征。
第三方面,本申请提供一种电子设备,包括:
存储器,用于存储程序指令;
处理器,用于调用所述存储器中存储的程序指令,按照获得的程序指令执行第一方面中任一项所述的方法包括的步骤。
第四方面,本申请提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序包括程序指令,所述程序指令当被计算机执行时,使所述计算机执行第一方面中任一项所述的方法。
第五方面,本申请提供了一种计算机程序产品,所述计算机程序产品包括:计算机程序代码,当所述计算机程序代码在计算机上运行时,使得计算机执行第一方面中任一项所述的方法。
本申请有益效果如下:
本申请实施例提供了一种资产配置方案生成方法、装置、电子设备及介质,该方法包括:获取需要进行资产配置的目标对象的基本信息和资产信息后,可以基于基本信息和资产信息,对目标对象进行行业类别偏好预测,确定目标对象的行业类别偏好信息。然后可以根据行业类别偏好信息从目标金融产品类型所包括的多个金融产品中选择至少一个目标金融产品。最后基于选择的至少一个目标金融产品输出指示了每个目标金融产品在目标对象的资产中所占比重的资产配置方案。
通过该方法,首先可以基于目标对象的基本信息和资产信息,对目标对象的行业类别偏好进行预测,由于不仅考虑到了用户的基本信息还考虑到了用户的资产信息,因此可以更加准确地预测目标对象的行业类别偏好。然后基于预测出的行业类别偏好信息,可以为目标对象提供更加更加符合目标对象行业类别偏好的资产配置方案,避免出现相关技术中生成的资产配置方案质量不稳定的问题。
本申请的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本申请而了解。本申请的目的和其他优点可通过在所写的说明书、权利要求书、以及附图中所特别指出的结构来实现和获得。
附图说明
图1为本申请实施例提供的一种资产配置方案生成方法应用的***结构示意图;
图2为本申请实施例提供的一种资产配置方案生成方法的示例性流程图之一;
图3为本申请实施例提供的行业类别偏好预测模型的训练方法的流程示意图;
图4为本申请实施例提供的模型结构示意图;
图5为本申请实施例提供的风险偏好分类模型的训练方法的流程示意图;
图6为本申请实施例提供的一种资产配置方案生成方法的示例性流程图之一;
图7为本申请实施例提供的一种资产配置方案生成装置的结构图;
图8为本申请实施例提供的一种电子设备的结构图。
具体实施方式
为使本申请的目的、技术方案和优点更加清楚明白,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互任意组合。并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以按不同于此处的顺序执行所示出或描述的步骤。
本申请的说明书和权利要求书及上述附图中的术语“第一”和“第二”是用于区别不同对象,而非用于描述特定顺序。此外,术语“包括”以及它们任何变形,意图在于覆盖不排他的保护。例如包含了一系列步骤或单元的过程、方法、***、产品或设备没有限定于已列出的步骤或单元,而是可选地还包括没有列出的步骤或单元,或可选地还包括对于这些过程、方法、产品或设备固有的其它步骤或单元。本申请中的“多个”可以表示至少两个,例如可以是两个、三个或者更多个,本申请实施例不做限制。
本申请技术方案中,对数据的采集、传播、使用等,均符合国家相关法律法规要求。
在介绍本申请实施例所提供的资产配置方案生成方法之前,为了便于理解,首先对下面对本申请实施例的技术背景进行详细介绍。
随着金融市场的不断发展和人们生活水平的不断提高,人们对于金融产品的购买需求也越来越大。尤其对于高净值客户而言,例如使用私人银行服务的客户,由于其自身拥有资产数额较大,如何对其资产进行合理的分配就显得尤为重要。
目前生成客户的资产配置方案时,一般是通过对客户发放一系列的调查问卷,来获取客户的相关信息,再由客户经理进行主观分析,将现有的金融产品与客户进行匹配,从而得到最终的资产配置方案并推送给客户。
然而,通过这种方式生成资产配置方案时,需要客户花费大量时间去填写调查问卷,而且生成的资产配置方案还与客户经理的经验以及分析能力,息息相关,一旦客户经理由于缺乏经验或者能力欠缺,导致分析错误,就会为客户提供质量较低或者与客户不匹配的资产配置方案。
为了避免出现这种情况,本申请实施例提供了一种资产配置方案生成方法,该方法中,获取需要进行资产配置的目标对象的基本信息和资产信息后,可以基于基本信息和资产信息,对目标对象进行行业类别偏好预测,确定目标对象的行业类别偏好信息。然后可以根据行业类别偏好信息从目标金融产品类型所包括的多个金融产品中选择至少一个目标金融产品。最后基于选择的至少一个目标金融产品输出指示了每个目标金融产品在目标对象的资产中所占比重的资产配置方案。
通过该方法,首先可以基于目标对象的基本信息和资产信息,对目标对象的行业类别偏好进行预测,由于不仅考虑到了用户的基本信息还考虑到了用户的资产信息,因此可以更加准确地预测目标对象的行业类别偏好。然后基于预测出的行业类别偏好信息,可以为目标对象提供更加符合目标对象行业类别偏好的资产配置方案,避免出现相关技术中生成的资产配置方案质量不稳定的问题。
参阅图1为本申请实施例提供的资产配置方案生成方法应用的***架构示意图。该***可以为服务器100,包括:存储器110、处理器120和通信接口130。其中,通信接口130可以用于获取目标对象的基本信息和资产信息,以及将生成的资产配置方案向目标对象的终端设备发送。处理器120是服务器100的控制中心,利用各种接口和线路连接整个服务器100的各个部分,通过运行或执行存储在存储器110内的软件程序或模块,以及调用存储在存储器110内的数据,执行服务器100的各种功能和处理数据。可选地,处理器120可以包括一个或多个处理单元。存储器110可以为高速随机存取存储器,还可以为非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。需要说明的是,上述图1所示的结构仅是一种示例,本申请实施例对此不做限定。
参阅图2为本申请实施例提供的一种资产配置方案生成方法的示例性流程图之一,该方法可应用于图1所示的服务器,可包括以下流程:
S201,获取目标对象的基本信息和资产信息。
其中,目标对象可以是指需要进行资产配置的对象。图2所示的流程可以是接收到目标对象发送的指示执行资产配置操作的指示信息后触发的。
基本信息可以包括表征目标对象的基本特征的信息。例如,年龄、家庭情况、学历、职业等。其中,基本信息可以是目标对象在办理相关业务时自行输入的。
资产信息可以包括表征目标对象的资产情况,以及业务办理情况的信息。例如:资产管理规模(Assets Under Management,AUM)、业务注册时间、指定周期内业务办理次数、指定周期内交易次数等。其中,资产信息可以是目标对象办理相关业务时产生的历史数据。
可选的,服务器在获取基本信息和资产信息后,通过对基本信息和资产信息进行计算和比较等操作,可以获得目标对象的衍生信息,衍生信息可以表示一些基本信息或资产信息的变化情况,例如AUM年增长率、家庭情况变动等。
需要说明的是,获取基本信息和资产信息之前可以通过向目标对象发送消息等方式,向目标对象询问是否允许服务器获取以及使用基本信息和资产信息,并在目标对象同意后执行图2所示的流程。
在一些实施例中,目标对象还可以是满足预设条件的对象。例如,为辅助一些对象更好地优化其资产配置结构,目标对象还可以是资产配置活跃度不高于预设活跃度阈值的低活跃度对象。资产配置活跃度可以在一定程度上表示对象进行资产配置的频次。
可选的,资产配置活跃度可以是根据对象的指定金融产品类型资产的资产管理规模和对象的总资产规模之间的比值确定的,满足公式(1)。
S=1-AUMc/AUMa 公式(1)
式中,S表示资产配置活跃度,AUMc表示对象的指定种类资产的资产管理规模,AUMa表示对象的总资产规模。指定金融产品类型资产的类型可以根据实际情况或经验确定,例如可以是固定收益类资产或者存款类资产等,本申请对此不作限定。
S202,基于基本信息和资产信息,对目标对象进行行业类别偏好预测,确定目标对象的行业类别偏好信息。
其中,行业类别偏好信息表征目标对象对金融产品所属行业类别的偏好程度。行业类别可以包括金融、房地产、工业、信息技术、可选消费、必选消费、医疗保健、公用事业和能源等。
一种可能的实现方式中,服务器基于目标对象的基本信息和资产信息,对目标对象进行行业类别偏好预测,确定目标对象的行业类别偏好信息时,可以对目标对象的基本信息和资产信息进行特征提取,确定目标对象的特征集。再基于不同对象的特征集与不同对象的行业类别偏好之间的关联关系,分析目标对象的特征集以获得目标对象的行业类别偏好信息。
一种可能的实现方式中,服务器对目标对象的基本信息和资产信息进行特征提取,确定目标对象的特征集时,可以先对基本信息和资产信息进行特征提取,获取目标对象的候选特征集。然后从候选特征集中筛选出一个或多个特征,形成特征集。其中,特征集中的特征满足:一个或多个特征与行业类别偏好的关联程度大于候选特征集中其他特征与行业类别偏好的关联程度。
在一些实施例中,服务器从候选特征集中筛选出一个或多个特征,形成特征集时,可以基于候选特征集中包括的各个候选特征,分别生成随机特征,并将对模型变量的影响程度大于随机特征的候选特征,作为待定特征。再通过自动建模模型,构建针对行业类别偏好的分类模型,基于待定特征对模型输出准确性的影响程度,对各个待定特征进行重要程度排序。最后基于排序结果,确定特征集中包括的多个特征。其中,模型变量是指用于训练随机特征和候选特征的模型的变量。
在一个示例中,确定候选特征集中的待定特征时,可以通过Boruta算法对候选特征进行初步筛选。Boruta算法是一个基于随机森林分类算法的包装器方法,Boruta算法会对候选特征进行随机排列生成一组随机特征,然后将这些随机特征与候选特征一起输入到随机森林模型中进行训练。然后可以通过比较候选特征的重要性与随机特征的重要性,来确定每个候选特征的相对重要性。将重要性高的特征作为待定特征。其中,重要性高的特征对随机森林模型变量的影响程度更大。例如,如果某个候选特征的重要性显著高于对应的随机特征,那么该候选特征就被认为重要性高。
在一个示例中,确定待定特征中属于特征集中的特征时,可以将各个待定特征输入自动建模模型,例如自动化机器学习(Automated Machine Learning,AutoML)模型。可以通过AutoML模型,以行业类别偏好分类为目标进行自动建模,通过其中的AutoGluon工具包可以在有限的资源里同时训练多个模型,并将它们融合在一起,实现自动机器学习。建模后,基于各个待定特征对构建的模型的输出准确性的影响程度来确定待定特征的重要程度。同时对待定特征进行重要程度从高到低的排序。基于排序结果确定特征集中包括的多个特征时,可以确定排序位于前80%的待定特征为特征集中包括的多个特征。需要说明的是,特征选取比例可以根据实际情况或经验进行设置,本申请对此不作限定。
基于上述方案,假设基于基本信息和资产信息可以获取到241个候选特征,初次筛选后可以得到197个待定特征,再次筛选后可能最后特征集中就包括157个特征。由此可见,通过多次筛选可以去除一些不太重要的特征,避免这些特征对输出结果的干扰,从而使得预测的行业类别偏好更加准确。并且通过减少特征数量,可以提高分析目标对象的特征集以获得目标对象的行业类别偏好信息时的处理速度。
在一些实施例中,基于不同对象的特征集与不同对象的行业类别偏好之间的关联关系,分析目标对象的特征集以获得目标对象的行业类别偏好信息时,可以通过训练好的行业类别偏好预测模型,根据特征集,对目标对象进行行业类别偏好预测,确定目标对象的行业类别偏好信息。其中,行业类别偏好预测模型是基于训练样本的特征集和训练样本的行业类别偏好标签训练的,训练样本为资产配置活跃度大于预设活跃度阈值的对象。
参见图3为本申请实施例提供的行业类别偏好预测模型的训练方法的流程示意图,该流程包括:
S301,获取训练样本集。
具体的,训练行业类别偏好预测模型之前,服务器可以通过公式(1)确定多个对象各自的资产配置活跃度,将资产配置活跃度大于预设活跃度阈值的对象作为训练样本。
其中,预设活跃度阈值可以是预先设置的某一固定值,例如0.7或0.8等。或者,预设活跃度阈值可以是将多个对象按照资产配置活跃度进行排序后,根据排序结果确定的。例如,将500个对象按照资产配置活跃度进行排序,需要将排在前10%的对象作为训练样本时,则将排在第50位的对象的资产配置活跃度作为预设活跃度阈值。
一种可能的实现方式中,服务器可以通过公式(1)确定多个对象各自的资产配置活跃度,并将资产配置活跃度大于预设活跃度阈值的对象作为候选训练样本。然后,获取多个候选训练样本的基本信息和资产信息,并对基本信息和资产信息进行统计分析,将信息缺失比例不大于预设缺失比例阈值的候选训练样本作为训练样本。其中,预设缺失比例阈值可以根据经验或实际情况进行设置,例如可以是20%、10%等,本申请对此不作限定。基于资产配置活跃度确定候选训练样本的方式参见可以上述基于配置活跃度确定训练样本的方法,在此不作赘述。
举例来说,假设基本信息和资产信息包括以下七项信息:年龄、家庭情况、学历、职业、AUM、家庭变动情况、一年内业务办理次数。对象A的基本信息和资产信息中缺失职业和家庭变动情况这两项信息,则对象A的信息缺失比例约为29%;对象B的基本信息和资产信息中缺失职业、家庭变动情况和一年内业务办理次数这三项信息,则对象B的信息缺失比例约为43%;对象C的基本信息和资产信息中未缺失任何信息,则对象C的信息缺失比例为0%;对象D的基本信息和资产信息中缺失家庭变动情况这一项信息,则对象D的信息缺失比例约为14%。假设预设缺失比例阈值为30%,由于在对象A-D中,只有对象B的信息缺失比例大于30%,因此可以将对象A、对象C和对象D作为训练样本。
由于部分对象业务注册时间较长,其中的一些信息可能缺失,因此在训练模型前可以先对样本进行筛选。通过上述方案对样本进行筛选后,可以避免由于信息缺失过多,导致训练出的模型输出结果不准确的情况发生。
在一种可能的实现方式中,再确定训练样本后,对于训练样本中信息缺失的信息可以通过中位数或均值等方式进行填充。例如,通过中位数进行填充时,训练样本E的资产信息中缺失“一年内业务办理次数”这项信息,假设各训练样本中“一年内业务办理次数”这项信息的中位数为10,则将“10”作为训练样本E的“一年内业务办理次数”。
确定训练样本并对训练样本进行信息填充后,可以针对每个训练样本的基本信息和资产信息分别进行特征提取,确定每个训练样本的特征集。其中特征提取方法,可以参见上述方法实施例中的相关描述,在此不在赘述。
一种可能的实现方式中,特征集中包括的特征可以是在训练行业类别偏好预测模型之前确定的,则对目标对象的基本信息和资产信息进行特征提取时,可以基于确定的特征集中包括的特征来进行特征提取,而不用再次执行上述特征筛选的操作。
举例来说,在训练行业类别偏好预测模型之前确定特征集中包括:年龄、家庭情况、学历、职业、AUM、家庭变动情况、一年内业务办理次数。则对目标对象进行特征提取时,可以直接对目标对象的这些信息来进行特征提取,得到目标对象的特征集。
在一些实施例中,针对每个训练样本,可以基于该训练样本的资产信息,确定该训练样本的持有的金融产品,从而确定金融产品所属的行业类别。然后可以基于针对属于不同行业类别的金融产品的持有金额进行排序,从而确定该训练样本的行业类别偏好标签。
举例来说,假设训练样本持有的金融产品包括金融产品A1、金融产品A2、金融产品B1、金融产品C1,其中金融产品A1、金融产品A2所属的行业类别为金融,金融产品B1所属的行业类别为必选消费,金融产品C1所属的行业类别为能源。则可以确定该训练样本持有的金融产品所属的行业类别包括金融、必选消费和能源,并将金融产品A1、金融产品A2的持有总金额作为金融对应的持有金额,将金融产品B1的持有金额作为必选消费对应的持有金额,将金融产品C1的持有金额作为能源对应的持有金额。然后可以根据金融、必选消费和能源对应的持有金额进行排序,从而将其中的一个或多个行业类别作为该训练样本的行业类别偏好标签。
其中,行业类别偏好标签中包括的行业类别偏好数量可以根据实际情况或经验进行设置,本申请对此不作限定。例如,可以确定每个训练样本持有金额排在前3位的行业类别作为该训练样本的行业类别偏好标签。或者,还可以是将每个训练样本持有金额最高的行业类别作为该训练样本的行业类别偏好标签。
S302,训练样本平衡处理。
为了使训练的行业类别偏好预测模型的输出结果更加准确,需要使每类行业类别偏好标签对应的训练样本数量尽量平衡。
具体的,服务器可以采用合成少数类过采样技术(Synthetic Minority Over-sampling Technique,SMOTE)算法对样本数量较少的行业类别偏好标签进行样本扩充处理。具体实现时可以通过以下步骤执行:
1、确定样本数量较少的待扩充行业类别偏好标签。
可以根据预设规则确定样本数量较少的行业类别偏好标签。比如,可以设定样本数量阈值,样本数量小于该样本数量阈值的行业类别偏好标签,即为待扩充行业类别偏好标签。
再比如,可以计算每两个行业类别偏好标签之间的样本数量差值,在样本数量差值大于预设的差值阈值时可以认为两个行业类别偏好标签中,样本数量较少的为待扩充行业类别偏好标签。举例来说,假设行业类别偏好标签为A的训练样本有500个,行业类别偏好标签为B的训练样本有200个,行业类别偏好标签为C的训练样本有100个,且差值阈值为200。A与B之间的样本数量差值大于差值阈值,且B的样本数量较少,则可以认为B为待扩充行业类别偏好标签。A与C之间的样本数量差值大于差值阈值,且C的样本数量较少,则可以认为C为待扩充行业类别偏好标签。
2、确定属于待扩充行业类别偏好标签的训练样本的近邻样本。
对于属于待扩充行业类别偏好标签的每一个训练样本,可以分别执行以下操作:计算训练样本与属于同一待扩充行业类别偏好标签的其他训练样本之间的欧式距离,从而确定该训练样本的k个近邻样本。k为正整数,可以根据实际情况进行设置,本申请对此不作限定。
3、确定采样倍率。
可以根据样本不平衡比例设置采样比例,从而确定采样倍率N。其中,采样倍率为生成的新训练样本的数量与原始少数类样本数量之间的比率。采样倍率通常可以为大于1的整数。
例如,如果属于待扩充行业类别偏好标签的样本数量为100个,设置采样倍率为2,则生成的新训练样本的数量将是原始样本数量的两倍,即200个。
4、生成一个介于0和1之间的随机数。
5、构建新训练样本。
对于每一个属于待扩充行业类别偏好标签的训练样本,从其k个近邻样本中随机选择若干个样本,对于每一个随机选出的近邻样本,分别与原始训练样本根据公式(2)构建新训练样本。
Xnew=x+rand(0,1)*(Xj-x),j=1,2,3,…,n 公式(2)
式中,Xnew表示新训练样本,x属于待扩充行业类别偏好标签的训练样本,表示rand(0,1)表示介于0和1之间的随机数,Xj表示x的一个近邻样本,j可以从1取到n。
S303,基于训练样本的特征集和行业类别偏好标签训练行业类别偏好预测模型。
行业类别偏好预测模型可以采用长短期记忆网络(Long Short-Term Memory,LSTM),参见图4为本申请实施例提供的模型结构示意图。LSTM模型可以包括随机失活层(Drop-out)、全连接层(Dense)和SoftMax层。将训练样本的特征集和行业类别偏好标签输入LSTM模型,可以通过Drop-out层避免过拟合,通过SoftMax层输出训练样本的行业类别偏好的预测结果,然后基于预测结果与行业类别偏好标签之间的损失调整LSTM模型的参数,直至满足预设训练结束条件时得到训练好的行业类别偏好预测模型。
其中,预设训练结束条件可以是损失函数收敛,也可以是达到最大迭代次数等,本申请对训练结束条件不作限定。损失函数可以根据实际情况或经验进行设置,本申请对损失函数的选取不作限定。
可选的,还可以按照8:1:1将训练样本划分为训练集、测试集和验证集。通过训练集中各个训练样本的特征集和行业类别偏好标签训练行业类别偏好预测模型,在训练后根据测试集中各个训练样本的特征集和行业类别偏好标签对行业类别偏好预测模型进行测试,最后可以基于验证集中各个训练样本的特征集和行业类别偏好标签对行业类别偏好预测模型进行评价。并在模型指标达到预设条件时得到训练好的行业类别偏好预测模型。模型指标可以包括F1分数,ROC曲线下方面积(Area Under the Curve,AUC)等指标。应了解,模型的测试和验证方法可以采取相关技术中的方法,本申请对此不作限定。
S203,根据行业类别偏好信息从目标金融产品类型所包括的多个金融产品中选择至少一个目标金融产品。
一种可能的实现方式中,执行S203之前,还可以根据目标对象的基本信息和资产信息确定目标对象的目标风险偏好。
具体的,服务器可以对基本信息和资产信息进行特征提取,确定目标对象的特征集。基于不同对象的特征集与不同对象的风险偏好之间的关联关系,分析目标对象的特征集以获得目标对象的风险偏好。
在一些实施例中,服务器基于不同对象的特征集与不同对象的风险偏好之间的关联关系,分析目标对象的特征集以获得目标对象的风险偏好时,可以通过训练好的风险偏好分类模型,根据特征集,对目标对象进行风险偏好分类,确定目标对象的目标风险偏好。其中,风险偏好分类模型是基于训练样本的特征集和风险偏好标签训练的,训练样本为活跃度大于预设活跃度阈值的对象;活跃度表征对象对资产配置的活跃度。
参加图5为本申请实施例提供的风险偏好分类模型的训练方法的流程示意图,该流程包括:
S501,获取训练样本集。
训练样本的确定方法与训练行业类别偏好预测模型之前确定训练样本的方法相同,可以参见S301中的相关描述,在此不在赘述。
一种可能的实现方式中,确定训练样本的特征集时,服务器可以根据S202中描述的特征筛选方法确定候选特征集,再从候选特征集中筛选出一个或多个特征,形成特征集。其中,特征集中的特征满足:一个或多个特征与风险偏好的关联程度大于候选特征集中其他特征与风险偏好的关联程度。
特征筛选的具体方法可以参加上述方法实施例中的相关描述,与上述特征筛选方法不同的时,通过自动建模模型构建分类模型时可以以风险偏好分类为目标进行自动建模,从而确定特征集中包括的多个特征,在此不再赘述。
另一种可能的实现方式中,从候选特征集中筛选出一个或多个特征,形成特征集时,特征集中的特征还可以满足一个或多个特征与风险偏好的关联程度大于候选特征集中其他特征与风险偏好的关联程度,并且一个或多个特征与行业类别偏好的关联程度大于候选特征集中其他特征与行业类别偏好的关联程度。
具体实施时,可以先通过S202中描述的特征筛选方法,根据特征与行业类别偏好的关联程度筛选出行业类别偏好关联特征。再以风险偏好分类为目标,通过自动建模模型构建分类模型,并将筛选出的行业类别偏好关联特征输入该分类模型,从而得到特征的重要程度排序,确定特征集中包括的各个特征。
需要说明的是,确定目标对象的特征集时,也可以采用上述方法进行筛选,也即,从候选特征集中筛选出一个或多个特征,形成特征集时,特征集中的特征可以满足:一个或多个特征与风险偏好的关联程度大于候选特征集中其他特征与风险偏好的关联程度,或者,一个或多个特征与行业类别偏好的关联程度大于候选特征集中其他特征与行业类别偏好的关联程度,或者,一个或多个特征与风险偏好的关联程度大于候选特征集中其他特征与风险偏好的关联程度,并且一个或多个特征与行业类别偏好的关联程度大于候选特征集中其他特征与行业类别偏好的关联程度。
在一些实施例中,针对每个训练样本,可以基于该训练样本的资产信息,确定该训练样本的持有的金融产品,从而确定金融产品所属的风险级别。然后可以通过公式(3),基于属于不同风险级别的金融产品的持有金额进行计算,确定该训练样本的风险偏好得分。
式中,Score表示训练样本的风险偏好得分,x表示风险级别,p表示预设的风险级别的数量,SUMx表示训练样本持有的属于x风险级别的金融产品的金额,SUMa表示训练样本持有的金融产品的总金额。
举例来说,假设将金融产品所属的风险级别划分为1、2、3、4、5,则可以根据训练样本持有的风险级别属于1的金融产品的金额,训练样本持有的风险级别属于2的金融产品的金额,训练样本持有的风险级别属于3的金融产品的金额,训练样本持有的风险级别属于4的金融产品的金额,以及训练样本持有的风险级别属于5的金融产品的金额确定该训练样本的风险偏好得分。
确定每个训练样本的风险偏好得分后,可以根据风险偏好得分的平均值和标准差对每个训练样本的风险偏好得分进行标准化,满足公式(4)。
式中,Score'表示训练样本的风险偏好得分的标准值,μ表示各训练样本的风险偏好得分的平均值,σ表示各训练样本的风险偏好得分的标准差。
将风险偏好得分进行标准化之后,可以取风险偏好得分的标准值≥σ的训练样本的风险偏好标签记为1,-σ<风险偏好得分的标准值<σ的训练样本的风险偏好标签记为0,而风险偏好得分的标准值≤-σ的训练样本的风险偏好标签记为-1。
S502,训练样本平衡处理。
为了使训练的风险偏好分类模型的输出结果更加准确,需要使每类风险偏好标签对应的训练样本数量尽量平衡。具体方法与训练行业类别偏好预测模型时的样本平衡处理方法相似,可以参加S302中的相关描述,在此不在赘述。
S503,基于训练样本的特征集和风险偏好标签训练风险偏好分类模型。
风险偏好分类模型也可以采用LSTM模型,模型结构如图4所示。可以基于LSTM输出的预测分类结果与风险偏好标签之间的损失调整LSTM模型的参数,直至满足预设训练结束条件时得到训练好的风险偏好分类模型。
其中,预设训练结束条件可以与行业类别偏好预测模型的预设训练结束条件相同,也可以不同,本申请对此不作限定。损失函数可以与行业类别偏好预测模型的预设训练结束条件相同,也可以不同,本申请对此不作限定。
可选的,还可以按照8:1:1将训练样本划分为训练集、测试集和验证集。通过训练集中各个训练样本的特征集和风险偏好标签训练风险偏好分类模型,在训练后根据测试集中各个训练样本的特征集和风险偏好标签对风险偏好分类模型进行测试,最后可以基于验证集中各个训练样本的特征集和风险偏好标签对风险偏好分类模型进行评价。并在模型指标达到预设条件时得到训练好的风险偏好分类模型。模型指标可以包括F1指标,AUC指标等。应了解,模型的测试和验证方法可以采取相关技术中的方法,本申请对此不作限定。
在一些实施例中,确定目标对象的目标风险偏好后,服务器还可以在执行S203之前,基于目标对象的风险偏好,为目标对象选择目标金融产品类型。其中,目标风险偏好表征目标对象的风险接受程度。金融产品类型可以包括固定收益、权益、货币、商品、保障等,固定收益可以包括定期存款等金融产品,权益可以包括股票、基金等金融产品,商品可以包括实物类型的金融产品,如贵金属等,保障可以包括保险等金融产品。
则服务器根据行业类别偏好信息从目标金融产品类型所包括的多个金融产品中选择至少一个目标金融产品时,可以根据行业类别偏好信息中记录的目标行业类别,在目标金融产品类型所包括的多个金融产品中,选择属于目标行业类别的目标金融产品。
举例来说,目标对象的目标金融产品类型可以包括A、B,则服务器根据行业类别偏好信息从属于A的多个金融产品A1、A2、A3……中选择属于目标行业类别的金融产品作为目标对象的目标金融产品,再从属于B的多个金融产品B1、B2、B3……中选择属于目标行业类别的金融产品作为目标对象的目标金融产品。
其中,选择的属于目标行业类别的目标金融产品数量可以根据实际情况进行设置,例如,在存在多个目标行业类别时,可以为每个目标行业类别分别选择一个目标金融产品。还可以为每个目标行业类别分别选择多个目标金融产品。本申请对此不作限定。
在一些实施例中,目标金融产品类型所包括的多个金融产品中,可能存在多个属于目标行业类别的金融产品,则可以基于各金融产品的预设评估值,对多个属于目标行业类别的金融产品进行排序,选择排序靠前的金融产品作为目标金融产品。
例如,金融产品A-D均属于目标行业类别,金融产品A的评估值为80,金融产品B的评估值为90,金融产品C的评估值为85,金融产品D的评估值为88。若目标金融产品的数量为3,则可以确定金融产品B、C、D作为目标金融产品。若目标金融产品的数量为2,则可以确定金融产品B、D作为目标金融产品。
一种可能的实现方式中,在执行本申请实施例提供的资产配置方案生成方法之前,还可以通过公式(3)和公式(4)确定活跃程度大于预设活跃程度阈值的对象各自的风险偏好级别。在每个风险偏好级别下,分别对于对象的资产管理规模进行统计,并划分多个资产管理规模层级。针对任意一个风险偏好级别,以及该风险偏好级别下的任意一个资产管理规模层级,对于对象持有的各金融产品类型的金额所占总资产的比重进行统计,得到每个风险偏好级别下的资产管理规模层级与金融产品类型占比的映射关系。
举例来说,资产管理规模层级可以包括0-10000,10000-100000,100000-1000000,1000000-10000000,10000000以上,这五个层级。
在风险偏好等级包括1,0,-1时,服务器可以分别确定风险偏好级别为1时,各资产管理规模层级与金融产品类型占比的映射关系、风险偏好级别为0时,各资产管理规模层级与金融产品类型占比的映射关系,以及风险偏好级别为-1时,各资产管理规模层级与金融产品类型占比的映射关系。
以风险偏好等级为1且资产管理规模层级位于0-10000为例进行说明,可以统计风险偏好等级为1且资产管理规模层级位于0-10000的对象,确定持有的各金融产品类型的金额所占总资产的比重,并根据各对象的比重的均值。确定风险偏好等级为1时,资产管理规模层级0-10000与金融产品类型占比的映射关系。
例如,假设金融产品类型包括A、B、C,风险偏好等级为1且资产管理规模层级位于0-10000的对象包括:对象1-对象3。其中,对象1的资产中A的占比为20%、B的占比为30%、C的占比为50%,对象2的资产中A的占比为40%、B的占比为30%、C的占比为30%,对象3的资产中A的占比为20%、B的占比为40%、C的占比为40%。则根据对象1-3相同金融产品类型的占比的均值,可以确定风险偏好等级为1的情况下,资产管理规模层级0-10000对应的金融产品类型占比中,A约占27%,B约占33%,C约占40%。其他风险偏好等级以及其他资产管理规模层级与金融产品类型占比的映射关系,可以通过相同方法计算得到,在此不再赘述。
确定每个风险偏好等级下,各资产管理规模层级与金融产品类型占比的映射关系后,基于目标对象的风险偏好,为目标对象选择目标金融产品类型时,服务器可以先确定目标对象适用的资产管理规模层级与金融产品类型占比的映射关系,然后基于目标对象的资产管理规模确定目标对象所属的资产管理规模层级,从而确定目标对象对应的金融产品类型以及相应的金融产品类型占比。
S204,基于至少一个目标金融产品输出资产配置方案。
其中,资产配置方案指示了每个目标金融产品在目标对象的资产中所占的比重。
一种实现方式中,服务器确定目标对象对应的目标金融产品后,可以基于目标对象对应的金融产品类型占比,确定目标金融产品在目标对象的资产中所占的比重。
举例来说,假设目标对象对应的金融产品类型占比为A的占比为40%、B的占比为30%、C的占比为30%。金融产品类型A的目标金融产品包括A1、A2、A3,金融产品类型B的目标金融产品包括B1、B2、B3,金融产品类型C的目标金融产品包括C1、C2、C3。则A1、A2、A3占目标对象的资产的比重的和为40%,B1、B2、B3占目标对象的资产的比重的和为30%,C1、C2、C3占目标对象的资产的比重的和为30%。
可选的,每个目标金融产品在目标对象的资产中所占的比重可以根据每个目标金融产品的预设评估值确定。或者,每个目标金融产品在目标对象的资产中所占的比重可以根据目标金融产品所属的金融产品类型占比进行平均分配。
在一个示例中,假设目标金融产品包括A1、A2、A3、B1、B2、B3、C1、C2、C3,则输出的目标对象的资产配置方案可以包括:A1占比14%、A2占比13%、A3占比13%、B1占比10%、B2占比10%、B3占比10%、C1占比10%、C2占比10%、C3占比10%。
下面,为了能够更加清晰地理解本申请实施例提出的方案,将结合具体地实施例对本申请提供的一种资产配置方案生成方法进行介绍。
参阅图6,为本申请实施例提供的一种资产配置方案生成方法的示例性流程图之一,具体包括:
S601,信息预处理。
获取多个对象各自的基本信息和资产信息,确定训练样本,以及每个训练样本的特征集中包括的特征。训练样本的确定方法可以参加图3或图5所示的方法实施例中的相关描述,特征的确定方法可以参加图2、图3或图5所示的方法实施例中的相关描述,在此不再赘述。
S602,训练风险偏好分类模型和行业类别偏好预测模型。
服务器可以通过图5所示的流程训练风险偏好分类模型,通过图3所示的流程训练行业类别偏好预测模型。
S603,生成资产配置方案。
获取目标对象的基本信息和资产信息,基于S601确定的特征集中包括的特征,对目标对象的基本信息和资产信息进行特征提取,得到目标对象的特征集。将目标对象的特征集分别输入训练好的风险偏好分类模型和行业类别偏好预测模型,得到目标对象的目标风险偏好和行业类别偏好信息。然后基于目标对象的目标风险偏好和行业类别偏好信息生成目标对象的资产配置方案,并将生成的资产配置方案向目标对象发送。
其中,资产配置方案生成方法可以参加图2所示的方法实施例中的相关描述,在此不再赘述。
基于同一发明构思,本申请实施例提供一种资产配置方案生成装置,请参照图7,该装置包括:
通信单元701,用于获取目标对象的基本信息和资产信息;
偏好信息确定单元702,用于基于所述基本信息和所述资产信息,对所述目标对象进行行业类别偏好预测,确定所述目标对象的行业类别偏好信息,所述行业类别偏好信息表征所述目标对象对金融产品所属行业类别的偏好程度;
资产配置单元703,用于根据所述行业类别偏好信息从目标金融产品类型所包括的多个金融产品中选择至少一个目标金融产品;基于所述至少一个目标金融产品输出资产配置方案,所述资产配置方案指示了每个目标金融产品在所述目标对象的资产中所占的比重。
一种可能的实现方式中,所述资产配置单元703根据所述行业类别偏好信息从目标金融产品类型所包括的多个金融产品中选择至少一个目标金融产品之前,还用于:基于所述目标对象的风险偏好,为所述目标对象选择目标金融产品类型;所述目标风险偏好表征所述目标对象的风险接受程度;所述资产配置单元根据所述行业类别偏好信息从目标金融产品类型所包括的多个金融产品中选择至少一个目标金融产品时,用于:根据所述行业类别偏好信息中记录的目标行业类别,在所述目标金融产品类型所包括的多个金融产品中,选择属于所述目标行业类别的目标金融产品。
一种可能的实现方式中,所述目标对象的目标风险偏好是所述偏好信息确定单元702根据以下方法确定的:对所述基本信息和所述资产信息进行特征提取,确定所述目标对象的特征集;基于不同对象的特征集与不同对象的风险偏好之间的关联关系,分析所述目标对象的特征集以获得所述目标对象的风险偏好。
一种可能的实现方式中,所述偏好信息确定单元702基于不同对象的特征集与不同对象的风险偏好之间的关联关系,分析所述目标对象的特征集以获得所述目标对象的风险偏好时,用于:通过训练好的风险偏好分类模型,根据所述特征集,对所述目标对象进行风险偏好分类,确定所述目标对象的目标风险偏好;其中,所述风险偏好分类模型是基于训练样本的特征集和风险偏好标签训练的,所述训练样本为资产配置活跃度大于预设活跃度阈值的对象。
一种可能的实现方式中,所述偏好信息确定单元702基于所述基本信息和所述资产信息,对所述目标对象进行行业类别偏好预测,确定所述目标对象的行业类别偏好信息时,用于:对所述基本信息和所述资产信息进行特征提取,确定所述目标对象的特征集;基于不同对象的特征集与不同对象的行业类别偏好之间的关联关系,分析所述目标对象的特征集以获得所述目标对象的行业类别偏好信息。
一种可能的实现方式中,所述偏好信息确定单元702基于不同对象的特征集与不同对象的行业类别偏好之间的关联关系,分析所述目标对象的特征集以获得所述目标对象的行业类别偏好信息时,用于:通过训练好的行业类别偏好预测模型,根据所述特征集,对所述目标对象进行行业类别偏好预测,确定所述目标对象的行业类别偏好信息;其中,所述行业类别偏好预测模型是基于训练样本的特征集和行业类别偏好标签训练的,所述训练样本为资产配置活跃度大于预设活跃度阈值的对象。
一种可能的实现方式中,所述偏好信息确定单元702对所述基本信息和所述资产信息进行特征提取,确定所述目标对象的特征集时,用于:对所述基本信息和所述资产信息进行特征提取,获取所述目标对象的候选特征集;从所述候选特征集中筛选出一个或多个特征,形成所述特征集;其中,所述特征集中的特征满足:所述一个或多个特征与风险偏好的关联程度大于所述候选特征集中其他特征与所述风险偏好的关联程度,或者,所述一个或多个特征与行业类别偏好的关联程度大于所述候选特征集中其他特征与所述行业类别偏好的关联程度,或者,所述一个或多个特征与风险偏好的关联程度大于所述候选特征集中其他特征与所述风险偏好的关联程度,并且所述一个或多个特征与行业类别偏好的关联程度大于所述候选特征集中其他特征与所述行业类别偏好的关联程度。
一种可能的实现方式中,所述资产配置单元703从所述候选特征集中筛选出一个或多个特征,形成所述特征集时,用于:基于所述候选特征集中包括的各个候选特征,分别生成随机特征,并将对模型变量的影响程度大于随机特征的候选特征,作为待定特征;通过自动建模模型,构建分类模型,基于所述待定特征对模型输出准确性的影响程度,对各个待定特征进行重要程度排序;所述分类模型为针对行业类别偏好和/或风险偏好进行分类的模型;基于排序结果,确定所述特征集中包括的多个特征。
基于上述方法的同一构思,参见图8,为本申请实施例提供的一种电子设备的结构示意图,该电子设备包括至少一个处理器802,以及与至少一个处理器802连接或称耦合的存储器801,此外,电子设备还可以包括通信接口803。电子设备可以通过通信接口803和其它设备进行信息交互。
示例性的,所述通信接口803可以是收发器、电路、总线、模块、管脚或其它类型的通信接口。当该电子设备为芯片类的装置或者电路时,该电子设备中的通信接口803也可以是输入输出电路,可以输入信息(或称,接收信息)和输出信息(或称,发送信息),处理器为集成的处理器或者微处理器或者集成电路或则逻辑电路,处理器可以根据输入信息确定输出信息。
本申请实施例中的耦合是装置、单元或模块之间的间接耦合或通信连接,可以是电性,机械或其它的形式,用于装置、单元或模块之间的信息交互。处理器802可能和存储器801、通信接口803协同操作。本申请中不限定上述处理器802、存储器801以及通信接口803之间的具体连接介质。
可选的,参见图8,所述处理器802、所述存储器801以及所述通信接口803之间通过总线相互连接。所述总线可以是外设部件互连标准(peripheral componentinterconnect,PCI)总线或扩展工业标准结构(extended industry standardarchitecture,EISA)总线等。所述总线可以分为地址总线、数据总线、控制总线等。为便于表示,图8中仅用一个箭头表示,但并不表示仅有一根总线或一种类型的总线。
在本申请实施例中,存储器801作为一种非易失性计算机可读存储介质,可用于存储非易失性软件程序、非易失性计算机可执行程序以及模块。存储器801可以包括至少一种类型的存储介质,例如可以包括闪存、硬盘、多媒体卡、卡型存储器、随机访问存储器(Random Access Memory,RAM)、静态随机访问存储器(Static Random Access Memory,SRAM)、可编程只读存储器(Programmable Read Only Memory,PROM)、只读存储器(ReadOnly Memory,ROM)、带电可擦除可编程只读存储器(Electrically ErasableProgrammable Read-Only Memory,EEPROM)、磁性存储器、磁盘、光盘等等。存储器801是能够用于携带或存储具有指令或数据结构形式的期望的程序代码并能够由计算机存取的任何其他介质,但不限于此。本申请实施例中的存储器801还可以是电路或者其它任意能够实现存储功能的装置,用于存储指令、计算机程序和/或数据。
在本申请实施例中,处理器802可以是通用处理器,例如中央处理器(CPU)、数字信号处理器、专用集成电路、现场可编程门阵列或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件,可以实现或者执行本申请实施例中公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者任何常规的处理器等。结合本申请实施例所公开的资产配置方案生成方法的步骤可以直接体现为硬件处理器执行完成,或者用处理器中的硬件及软件模块组合执行完成。
通过对处理器802进行设计编程,可以将前述实施例中介绍的资产配置方案生成方法所对应的代码固化到芯片内,从而使芯片在运行时能够执行前述的资产配置方案生成方法的步骤,如何对处理器802进行设计编程为本领域技术人员所公知的技术,这里不再赘述。
在一个或多个实施例中,存储器801存储有可被至少一个处理器802执行的指令,至少一个处理器802通过调用存储器801存储的指令或者计算机程序,可以实现上述任一方法的步骤。
基于同一发明构思,本申请实施例提供一种计算机可读存储介质,计算机程序产品包括:计算机程序代码,当计算机程序代码在计算机上运行时,使得计算机执行如前文论述任一的资产配置方案生成方法。由于上述计算机可读存储介质解决问题的原理与资产配置方案生成方法相似,因此上述计算机可读存储介质的实施可以参见方法的实施,重复之处不再赘述。
基于同一发明构思,本申请实施例还提供了一种计算机程序产品,该计算机程序产品包括:计算机程序代码,当该计算机程序代码在计算机上运行时,使得计算机执行如前文论述任一的资产配置方案生成方法。由于上述计算机程序产品解决问题的原理与资产配置方案生成方法相似,因此上述计算机程序产品的实施可以参见方法的实施,重复之处不再赘述。
本领域内的技术人员应明白,本申请的实施例可提供为方法、***、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请的方法、设备(***)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列用户操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
显然,本领域的技术人员可以对本申请进行各种改动和变型而不脱离本申请的精神和范围。这样,倘若本申请的这些修改和变型属于本申请权利要求及其等同技术的范围之内,则本申请也意图包含这些改动和变型在内。

Claims (19)

1.一种资产配置方案生成方法,其特征在于,所述方法包括:
获取目标对象的基本信息和资产信息;
基于所述基本信息和所述资产信息,对所述目标对象进行行业类别偏好预测,确定所述目标对象的行业类别偏好信息,所述行业类别偏好信息表征所述目标对象对金融产品所属行业类别的偏好程度;
根据所述行业类别偏好信息从目标金融产品类型所包括的多个金融产品中选择至少一个目标金融产品;
基于所述至少一个目标金融产品输出资产配置方案,所述资产配置方案指示了每个目标金融产品在所述目标对象的资产中所占的比重。
2.根据权利要求1所述的方法,其特征在于,所述根据所述行业类别偏好信息从目标金融产品类型所包括的多个金融产品中选择至少一个目标金融产品之前,所述方法还包括:
基于所述目标对象的风险偏好,为所述目标对象选择目标金融产品类型;所述目标风险偏好表征所述目标对象的风险接受程度;
所述根据所述行业类别偏好信息从目标金融产品类型所包括的多个金融产品中选择至少一个目标金融产品,包括:
根据所述行业类别偏好信息中记录的目标行业类别,在所述目标金融产品类型所包括的多个金融产品中,选择属于所述目标行业类别的目标金融产品。
3.根据权利要求2所述的方法,其特征在于,所述目标对象的目标风险偏好是根据以下方法确定的:
对所述基本信息和所述资产信息进行特征提取,确定所述目标对象的特征集;
基于不同对象的特征集与不同对象的风险偏好之间的关联关系,分析所述目标对象的特征集以获得所述目标对象的风险偏好。
4.根据权利要求3所述的方法,其特征在于,所述基于不同对象的特征集与不同对象的风险偏好之间的关联关系,分析所述目标对象的特征集以获得所述目标对象的风险偏好,包括:
通过训练好的风险偏好分类模型,根据所述特征集,对所述目标对象进行风险偏好分类,确定所述目标对象的目标风险偏好;
其中,所述风险偏好分类模型是基于训练样本的特征集和风险偏好标签训练的,所述训练样本为资产配置活跃度大于预设活跃度阈值的对象。
5.根据权利要求1所述的方法,其特征在于,所述基于所述基本信息和所述资产信息,对所述目标对象进行行业类别偏好预测,确定所述目标对象的行业类别偏好信息,包括:
对所述基本信息和所述资产信息进行特征提取,确定所述目标对象的特征集;
基于不同对象的特征集与不同对象的行业类别偏好之间的关联关系,分析所述目标对象的特征集以获得所述目标对象的行业类别偏好信息。
6.根据权利要求5所述的方法,其特征在于,所述基于不同对象的特征集与不同对象的行业类别偏好之间的关联关系,分析所述目标对象的特征集以获得所述目标对象的行业类别偏好信息,包括:
通过训练好的行业类别偏好预测模型,根据所述特征集,对所述目标对象进行行业类别偏好预测,确定所述目标对象的行业类别偏好信息;
其中,所述行业类别偏好预测模型是基于训练样本的特征集和行业类别偏好标签训练的,所述训练样本为资产配置活跃度大于预设活跃度阈值的对象。
7.根据权利要求3-6任一项所述的方法,其特征在于,所述对所述基本信息和所述资产信息进行特征提取,确定所述目标对象的特征集,包括:
对所述基本信息和所述资产信息进行特征提取,获取所述目标对象的候选特征集;
从所述候选特征集中筛选出一个或多个特征,形成所述特征集;
其中,所述特征集中的特征满足:所述一个或多个特征与风险偏好的关联程度大于所述候选特征集中其他特征与所述风险偏好的关联程度,或者,所述一个或多个特征与行业类别偏好的关联程度大于所述候选特征集中其他特征与所述行业类别偏好的关联程度,或者,所述一个或多个特征与风险偏好的关联程度大于所述候选特征集中其他特征与所述风险偏好的关联程度,并且所述一个或多个特征与行业类别偏好的关联程度大于所述候选特征集中其他特征与所述行业类别偏好的关联程度。
8.根据权利要求7所述的方法,其特征在于,所述从所述候选特征集中筛选出一个或多个特征,形成所述特征集,包括:
基于所述候选特征集中包括的各个候选特征,分别生成随机特征,并将对模型变量的影响程度大于随机特征的候选特征,作为待定特征;
通过自动建模模型,构建分类模型,基于所述待定特征对模型输出准确性的影响程度,对各个待定特征进行重要程度排序;所述分类模型为针对行业类别偏好和/或风险偏好进行分类的模型;
基于排序结果,确定所述特征集中包括的多个特征。
9.一种资产配置方案生成装置,其特征在于,所述装置包括:
通信单元,用于获取目标对象的基本信息和资产信息;
偏好信息确定单元,用于基于所述基本信息和所述资产信息,对所述目标对象进行行业类别偏好预测,确定所述目标对象的行业类别偏好信息,所述行业类别偏好信息表征所述目标对象对金融产品所属行业类别的偏好程度;
资产配置单元,用于根据所述行业类别偏好信息从目标金融产品类型所包括的多个金融产品中选择至少一个目标金融产品;基于所述至少一个目标金融产品输出资产配置方案,所述资产配置方案指示了每个目标金融产品在所述目标对象的资产中所占的比重。
10.如权利要求9所述的装置,其特征在于,所述资产配置单元根据所述行业类别偏好信息从目标金融产品类型所包括的多个金融产品中选择至少一个目标金融产品之前,还用于:
基于所述目标对象的风险偏好,为所述目标对象选择目标金融产品类型;所述目标风险偏好表征所述目标对象的风险接受程度;
所述资产配置单元根据所述行业类别偏好信息从目标金融产品类型所包括的多个金融产品中选择至少一个目标金融产品时,用于:
根据所述行业类别偏好信息中记录的目标行业类别,在所述目标金融产品类型所包括的多个金融产品中,选择属于所述目标行业类别的目标金融产品。
11.根据权利要求10所述的装置,其特征在于,所述目标对象的目标风险偏好是所述偏好信息确定单元根据以下方法确定的:
对所述基本信息和所述资产信息进行特征提取,确定所述目标对象的特征集;
基于不同对象的特征集与不同对象的风险偏好之间的关联关系,分析所述目标对象的特征集以获得所述目标对象的风险偏好。
12.根据权利要求11所述的装置,其特征在于,所述偏好信息确定单元基于不同对象的特征集与不同对象的风险偏好之间的关联关系,分析所述目标对象的特征集以获得所述目标对象的风险偏好时,用于:
通过训练好的风险偏好分类模型,根据所述特征集,对所述目标对象进行风险偏好分类,确定所述目标对象的目标风险偏好;
其中,所述风险偏好分类模型是基于训练样本的特征集和风险偏好标签训练的,所述训练样本为资产配置活跃度大于预设活跃度阈值的对象。
13.根据权利要求9所述的装置,其特征在于,所述偏好信息确定单元基于所述基本信息和所述资产信息,对所述目标对象进行行业类别偏好预测,确定所述目标对象的行业类别偏好信息时,用于:
对所述基本信息和所述资产信息进行特征提取,确定所述目标对象的特征集;
基于不同对象的特征集与不同对象的行业类别偏好之间的关联关系,分析所述目标对象的特征集以获得所述目标对象的行业类别偏好信息。
14.根据权利要求13所述的装置,其特征在于,所述偏好信息确定单元基于不同对象的特征集与不同对象的行业类别偏好之间的关联关系,分析所述目标对象的特征集以获得所述目标对象的行业类别偏好信息时,用于:
通过训练好的行业类别偏好预测模型,根据所述特征集,对所述目标对象进行行业类别偏好预测,确定所述目标对象的行业类别偏好信息;
其中,所述行业类别偏好预测模型是基于训练样本的特征集和行业类别偏好标签训练的,所述训练样本为资产配置活跃度大于预设活跃度阈值的对象。
15.根据权利要求11-14任一项所述的装置,其特征在于,所述偏好信息确定单元对所述基本信息和所述资产信息进行特征提取,确定所述目标对象的特征集时,用于:
对所述基本信息和所述资产信息进行特征提取,获取所述目标对象的候选特征集;
从所述候选特征集中筛选出一个或多个特征,形成所述特征集;
其中,所述特征集中的特征满足:所述一个或多个特征与风险偏好的关联程度大于所述候选特征集中其他特征与所述风险偏好的关联程度,或者,所述一个或多个特征与行业类别偏好的关联程度大于所述候选特征集中其他特征与所述行业类别偏好的关联程度,或者,所述一个或多个特征与风险偏好的关联程度大于所述候选特征集中其他特征与所述风险偏好的关联程度,并且所述一个或多个特征与行业类别偏好的关联程度大于所述候选特征集中其他特征与所述行业类别偏好的关联程度。
16.根据权利要求15所述的装置,其特征在于,所述资产配置单元从所述候选特征集中筛选出一个或多个特征,形成所述特征集时,用于:
基于所述候选特征集中包括的各个候选特征,分别生成随机特征,并将对模型变量的影响程度大于随机特征的候选特征,作为待定特征;
通过自动建模模型,构建分类模型,基于所述待定特征对模型输出准确性的影响程度,对各个待定特征进行重要程度排序;所述分类模型为针对行业类别偏好和/或风险偏好进行分类的模型;
基于排序结果,确定所述特征集中包括的多个特征。
17.一种电子设备,其特征在于,包括:
存储器,用于存储程序指令;
处理器,用于调用所述存储器中存储的程序指令,按照获得的程序指令执行权利要求1-8中任一项所述的方法包括的步骤。
18.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机程序,所述计算机程序包括程序指令,所述程序指令当被计算机执行时,使所述计算机执行如权利要求1-8中任一项所述的方法。
19.一种计算机程序产品,其特征在于,所述计算机程序产品包括:计算机程序代码,当所述计算机程序代码在计算机上运行时,使得计算机执行上述如权利要求1-8中任一项所述的方法。
CN202410296672.5A 2024-03-15 2024-03-15 一种资产配置方案生成方法、装置、电子设备及介质 Pending CN118134652A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202410296672.5A CN118134652A (zh) 2024-03-15 2024-03-15 一种资产配置方案生成方法、装置、电子设备及介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202410296672.5A CN118134652A (zh) 2024-03-15 2024-03-15 一种资产配置方案生成方法、装置、电子设备及介质

Publications (1)

Publication Number Publication Date
CN118134652A true CN118134652A (zh) 2024-06-04

Family

ID=91240320

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202410296672.5A Pending CN118134652A (zh) 2024-03-15 2024-03-15 一种资产配置方案生成方法、装置、电子设备及介质

Country Status (1)

Country Link
CN (1) CN118134652A (zh)

Similar Documents

Publication Publication Date Title
CN110837931B (zh) 客户流失预测方法、装置及存储介质
WO2020249125A1 (zh) 用于自动训练机器学习模型的方法和***
CN111291816B (zh) 针对用户分类模型进行特征处理的方法及装置
CN107025596B (zh) 一种风险评估方法和***
CN110895758B (zh) 存在作弊交易的***账户的筛选方法、装置及***
CN105225135B (zh) 潜力客户识别方法以及装置
CN109583966A (zh) 一种高价值客户识别方法、***、设备及存储介质
US8984022B1 (en) Automating growth and evaluation of segmentation trees
JP7017149B2 (ja) ディープラーニングを用いる情報処理装置、情報処理方法及び情報処理プログラム
CN111985937A (zh) 交易商价值信息评估方法、***、存储介质、计算机设备
CN111260368A (zh) 一种账户交易风险判断方法、装置及电子设备
CN107622326A (zh) 用户分类、可用资源预测方法、装置及设备
CN110930038A (zh) 一种贷款需求识别方法、装置、终端及存储介质
RU2640633C2 (ru) Вычисление вероятности того, что фирма выполняет свои обязательства
CN109063736A (zh) 数据分类方法、装置、电子设备及计算机可读存储介质
CN112836750A (zh) 一种***资源分配方法、装置及设备
CN112328869A (zh) 一种用户贷款意愿的预测方法、装置及计算机***
CN115293336A (zh) 风险评估模型训练方法、装置和服务器
CN112634048A (zh) 一种反洗钱模型的训练方法及装置
CN111310931A (zh) 参数生成方法、装置、计算机设备及存储介质
CN115965468A (zh) 基于交易数据的异常行为检测方法、装置、设备及介质
CN118134652A (zh) 一种资产配置方案生成方法、装置、电子设备及介质
CN114612239A (zh) 基于算法、大数据、人工智能的股票舆情监测和风控***
CN110570301B (zh) 风险识别方法、装置、设备及介质
CN114626940A (zh) 数据分析方法、装置及电子设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination