CN113313538A - 用户消费能力预测方法、装置、电子设备和存储介质 - Google Patents

用户消费能力预测方法、装置、电子设备和存储介质 Download PDF

Info

Publication number
CN113313538A
CN113313538A CN202110732385.0A CN202110732385A CN113313538A CN 113313538 A CN113313538 A CN 113313538A CN 202110732385 A CN202110732385 A CN 202110732385A CN 113313538 A CN113313538 A CN 113313538A
Authority
CN
China
Prior art keywords
consumption
user
prediction
predicted
prediction result
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110732385.0A
Other languages
English (en)
Inventor
吴迪
何佳玉
王子惠
杨海霞
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Pudong Development Bank Co Ltd
Original Assignee
Shanghai Pudong Development Bank Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Pudong Development Bank Co Ltd filed Critical Shanghai Pudong Development Bank Co Ltd
Priority to CN202110732385.0A priority Critical patent/CN113313538A/zh
Publication of CN113313538A publication Critical patent/CN113313538A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data
    • G06Q30/0202Market predictions or forecasting for commercial activities
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • G06F18/2321Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
    • G06F18/23213Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/25Fusion techniques
    • G06F18/254Fusion techniques of classification results, e.g. of results related to same input data

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • Finance (AREA)
  • General Physics & Mathematics (AREA)
  • Strategic Management (AREA)
  • Development Economics (AREA)
  • Accounting & Taxation (AREA)
  • Artificial Intelligence (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Evolutionary Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Probability & Statistics with Applications (AREA)
  • Game Theory and Decision Science (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • General Business, Economics & Management (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明实施例公开了一种用户消费能力预测方法、装置、电子设备和存储介质。该方法包括:基于无监督预测模型和有监督预测模型分别对待预测消费特征数据进行预测,得到第一种消费能力预测结果和第二种消费能力预测结果;将第一种消费能力预测结果和第二种消费能力预测结果进行融合得到目标消费能力预测结果。本实施例通过多维度预测方法对银行用户的消费能力进行预测,解决目前银行因缺少用户外部消费及资产数据导致消费能力预测困难的问题,只需依赖银行用户内部消费特征数据,最大程度上预测用户的真实消费能力,且多维度全面预测可以提高最终预测结果的准确性,提高银行对高消费潜力用户的识别能力,为精准营销提供决策依据。

Description

用户消费能力预测方法、装置、电子设备和存储介质
技术领域
本发明实施例涉及金融数据处理技术领域,尤其涉及一种用户消费能力预测方法、装置、电子设备和存储介质。
背景技术
商业银行在进行业务营销推荐时,首先需要预测银行用户的消费能力,以提高银行对高消费潜力客户的识别能力,为精准营销提供决策依据。
现有的预测用户消费能力主要有两种方案,一种是根据消费能力阈值对客户的历史消费数据进行划分,但是阈值的选定具有较强主观性,不同阈值的选择会导致预测结果具有较大差异性,且在不同数据集上需定义不同的阈值,准确性和通用性都较差。另一种是基于机器学习的预测方法,但是该方法依赖于大量外部数据的引入,需要有客户完整的历史消费、资产和真实标签等相关数据才能准确预测,但是不同商业银行之间的数据很难共享,因此给预测结果的准确性带来一定的影响。
发明内容
本发明实施例提供一种用户消费能力预测方法、装置、电子设备和存储介质,提高对用户消费能力预测结果的准确性。
第一方面,本发明实施例提供了一种用户消费能力预测方法,包括:
获取待预测用户的待预测消费特征数据和样本用户的样本消费特征数据;
基于无监督预测模型对所述待预测消费特征数据进行预测,得到第一种消费能力预测结果;
基于有监督预测模型对所述待预测消费特征数据进行预测,得到第二种消费能力预测结果;
将所述第一种消费能力预测结果和所述第二种消费能力预测结果作为多维度预测结果,对所述多维度预测结果进行融合,得到所述待预测用户的目标消费能力预测结果;
其中,所述无监督预测模型和所述有监督预测模型基于所述样本消费特征数据进行训练。
第二方面,本发明实施例还提供了一种用户消费能力预测装置,包括:
用户数据获取模块,用于获取待预测用户的待预测消费特征数据和样本用户的样本消费特征数据;
无监督预测模块,用于基于无监督预测模型对所述待预测消费特征数据进行预测,得到第一种消费能力预测结果;
有监督预测模块,用于基于有监督预测模型对所述待预测消费特征数据进行预测,得到第二种消费能力预测结果;
融合预测模块,用于将所述第一种消费能力预测结果和所述第二种消费能力预测结果作为多维度预测结果,对所述多维度预测结果进行融合,得到所述待预测用户的目标消费能力预测结果;
其中,所述无监督预测模型和所述有监督预测模型基于所述样本消费特征数据进行训练。
第三方面,本发明实施例还提供了一种电子设备,包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如本发明任一实施例所述的用户消费能力预测方法。
第四方面,本发明实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如本发明任一实施例所述的用户消费能力预测方法。
本发明实施例基于无监督预测模型对待预测消费特征数据进行预测,得到第一种消费能力预测结果;基于有监督预测模型对待预测消费特征数据进行预测,得到第二种消费能力预测结果;将第一种消费能力预测结果和第二种消费能力预测结果作为多维度预测结果,对多维度预测结果进行融合,得到待预测用户的目标消费能力预测结果。本实施例通过两个维度预测方法对商业银行用户的消费能力进行预测,解决目前银行因缺少用户外部消费及资产数据导致消费能力预测困难的问题,本实施例只需依赖银行用户内部消费特征数据,最大程度上预测用户的真实消费能力,且多维度全面预测可以提高最终预测结果的准确性,提高银行对高消费潜力用户的识别能力,为精准营销提供决策依据。
附图说明
图1是本发明实施例一中的用户消费能力预测方法的流程图;
图2是本发明实施例二中的用户消费能力预测方法的流程图;
图3是本发明实施例三中的用户消费能力预测装置的结构示意图;
图4是本发明实施例四中的电子设备的结构示意图。
具体实施方式
下面结合附图和实施例对本发明作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本发明,而非对本发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本发明相关的部分而非全部结构。
实施例一
图1是本发明实施例一中的用户消费能力预测方法的流程图,本实施例可适用于对商业银行用户的消费能力进行预测的情况。该方法可以由用户消费能力预测装置来执行,该装置可以采用软件和/或硬件的方式实现,并可配置在电子设备中,例如电子设备可以是后台服务器等具有通信和计算能力的设备。如图1所示,该方法具体包括:
步骤101、获取待预测用户的待预测消费特征数据和样本用户的样本消费特征数据。
其中,待预测用户是指需要进行预测消费能力的商业银行用户,待预测用户可以为一个或者多个,样本用户是指商业银行的其他用户,示例性的,由于不同商业银行间数据难以共享,样本用户为与待预测用户在同一商业银行中有消费记录的人员,例如将同一商业银行中所有借记卡用户作为样本用户。
消费特征数据用于对用户历史消费进行表征以及对用户的个人情况进行表征,例如包括用户与该商业银行有关的消费记录以及用户的个人特征数据,其中,消费记录包括资金往来情况等,个人特征数据包括性别、年龄、收入、资产分布以及负债数据等。
具体的,确定待预测用户和样本用户在商业银行中所登记的个人特征数据,以及确定通过该商业银行的借记卡进行的历史消费记录,根据个人特征数据和历史消费记录确定消费特征数据。示例性的,历史消费记录中包括每笔交易消费金额、交易场景、交易时间、交易频率以及交易习惯和偏好等。
在一个可行的实施例中,用户为银行卡使用用户;
相应的,获取样本用户的样本消费特征数据,包括:
获取全量银行卡使用用户的银行数据;其中,银行数据至少包括如下一项:动账数据、资产数据以及负债数据;
根据银行数据从全量银行卡使用用户中筛选出样本用户,并获取样本用户的样本消费特征数据。
在确定样本用户前,根据用户数据先进行用户筛选,以保证筛选出来的样本用户的消费特征数据可以真实反映用户的实际消费情况。例如,某用户在该商业银行中办有借记卡,但是长久未使用,或者该用户在该商业银行中长久没有置办资产,则表明该用户属于该商业银行的无效客户,则获取到的消费特征数据无法真实反映该用户实际的消费能力。
具体的,获取商业银行中全量借记卡使用用户的银行数据,将与该银行在预设时间段内无资金联系的用户删除,剩余用户为样本用户。无资金联系可以通过用户的银行数据进行确定,例如在一年内该用户在该商业银行是否有动账或者是否有资产或者是否有负债。
示例性的,在剔除无效用户后,获取样本用户的样本消费特征数据,同时需要对样本消费特征数据进行缺失值填充以及归一化等操作,以保证消费特征数据的完整性和一致性,提高后续模型训练效率和准确性。
步骤102、基于无监督预测模型对待预测消费特征数据进行预测,得到第一种消费能力预测结果。
其中,无监督预测模型基于样本消费特征数据进行训练。而由于用户的真实消费标签的难获取,因此无监督预测有利于针对该情况对消费能力进行预测。
具体的,无监督预测模型通过对样本消费特征数据的学习,根据样本用户的特征对样本用户进行分类,将具有相似消费特征的用户聚为一类,最终以类内用户的月均消费额度作为该类的消费能力。在使用无监督预测模型进行预测时,根据待预测消费特征数据的特征,确定最相似的一类样本用户,最终以该类中所有用户的月均消费额度作为待预测用户的第一种消费能力预测结果。
在一个可行的实施例中,无监督预测模型包括无监督聚类预测模型,消费特征数据中至少包括预设时间段内的每月消费额度;
相应的,步骤102,包括:
基于无监督聚类预测模型根据待预测消费特征数据和样本消费特征数据,对待预测用户和样本用户进行分类,得到用户分类结果;
根据待预测用户所属类别中所有用户在预设时间段内的平均月均消费额度作为待预测用户的第一种消费能力预测结果。
无监督聚类预测模型是使用聚类算法对用户进行类别划分。示例性的,基于无监督K-Means聚类算法对待预测消费特征数据和样本消费特征数据进行聚类分析,将待预测用户和样本用户进行分类,得到用户分类结果。确定待预测用户的所在类,根据消费特征数据中预设时间段内的每月消费额度确定该类中每个用户一年内通过该商业银行消费的月均消费额度,最后将该类中所有用户的平均月均消费额度作为该类中每个用户的第一种消费能力预测结果,即待预测用户的第一种消费能力预测结果。
步骤103、基于有监督预测模型对待预测消费特征数据进行预测,得到第二种消费能力预测结果。
其中,有监督预测模型基于样本消费特征数据进行训练。同样,由于用户的真实消费标签的难获取,因此在进行有监督预测时,可以选择部分用户作为有监督训练时的样本用户,该部分用户需要具备商业银行交易单一性这一特征,即只使用该商业银行或者仅小部分交易在其他商业银行,具备这一特征的样本用户,可以根据其样本消费特征数据确定消费能力标签。以保证在获取少量外部数据或者不获取外部数据的情况下进行有监督预测,以和无监督预测进行结合,相互弥补不同预测方案的缺点。
具体的,从样本用户中选择具备商业银行交易单一性特征的用户作为有监督训练用户,示例性的,可以通过外部数据对该特征进行确定。根据有监督训练用户的月均消费额度确定消费能力标签,根据该消费能力标签和有监督训练用户的样本消费特征数据进行训练,得到有监督预测模型。其中有监督训练包括有监督回归训练和有监督分类训练等。
在确定有监督预测模型后,根据该模型对待预测用户的待预测消费特征数据进行预测,得到待预测用户的消费能力标签,作为待预测用户的第二种消费能力预测结果。
在一个可行的实施例中,有监督预测模型包括有监督回归预测模型,消费特征数据中至少包括交易频率和预设时间段内的历史消费行为数据;样本消费特征数据中还包括样本消费能力标签数据,样本消费能力标签数据是指样本用户的月均消费额度,其中,有监督回归预测模型的训练步骤如下所示:
根据交易频率的大小从样本用户中确定目标样本用户;
基于有监督回归算法对目标样本用户的历史消费行为数据和样本消费能力标签数据进行训练,得到有监督回归预测模型。
其中,有监督回归预测模型是指使用有监督回归算法进行训练的模型,例如XGBoost回归算法。交易频率是指用户在预设时间段内的交易笔数,例如用户一年内在该商业银行进行交易的次数。历史消费行为数据是指对用户的交易具体信息进行表征的数据,例如历史消费金额、消费场景、消费时间以及消费偏好等。样本消费能力标签数据是指用于模拟样本用户真实消费标签的数据,由于外部数据的难获取,因此将样本用户在该商业银行的月均消费额度模拟为真实消费标签。
由于样本用户中包括在该商业银行注册有借记卡的所有用户,而一般用户不仅仅在一个银行有借记卡,在其他银行也会有借记卡,并且会使用其他银行的银行卡进行消费。由于难以获取到其他银行的消费记录,因此若将所有样本用户在单一商业银行的月均消费额度模拟为真实消费标签会造成模型预测不准确。
根据交易频率的大小从样本用户中确定目标样本用户,将目标样本用户确定为有监督训练用户,并将目标样本用户在该商业银行的月均消费额度模拟为样本消费标签数据,即作为真实消费标签。再根据目标样本用户的历史消费行为数据和样本消费能力标签数据进行训练,得到有监督回归训练模型。示例性的,将交易频率排名前2%的用户作为目标样本用户,根据目标样本用户的历史消费行为数据和样本消费能力标签数据构建XGBoost回归预测模型,以此去预测其余用户的真实消费标签。在本实施例中,目标样本用户的交易频率在样本用户中排名在前,可以认定为目标样本用户仅使用该商业银行的银行卡进行交易,并且由于银行卡用户使用者具有一定的使用习惯,当使用某一银行卡达到一定次数后可以默认该用户只习惯使用这一银行卡。因此在不获取外部数据的情况下,采用交易频率确定进行训练的目标样本用户,并根据目标样本用户现有的月均消费额度作为样本消费能力标签数据可以保证训练结果的准确性。
本实施例解决机器学习算法缺少完整样本和真实标签的问题。在外部数据引入经济和时间成本较高的现状下,本实施例选用消费频率在前的用户作为完整样本和真实消费标签进行训练,以此预测其他数据不完整客户,极大避免了因缺少外部数据导致的预测失真。
在一个可行的实施例中,步骤103,包括:
基于有监督回归预测模型对待预测用户在预设时间段内的历史消费行为数据进行预测,得到预测消费能力标签数据,作为第二种消费能力预测结果。
在根据目标样本用户的历史消费行为数据和样本消费能力标签数据进行训练得到的有监督回归预测模型下,将待预测用户在预设时间内的历史消费行为数据输入到有监督回归预测模型中,模型输出得到的结果即为待预测用户的预测消费能力标签数据,将其作为有监督预测的第二种消费能力预测结果。
在本发明实施例中并不对第一种消费能力预测结果和第二种消费能力预测结果的确定顺序进行限制,即不对步骤102和步骤103中两种模型的预测顺序进行限制,步骤102和步骤103可以顺序执行或者同时执行。
步骤104、将第一种消费能力预测结果和第二种消费能力预测结果作为多维度预测结果,对多维度预测结果进行融合,得到待预测用户的目标消费能力预测结果。
由于第一种消费能力预测结果和第二种消费能力预测结果是从两个不同的维度对待预测用户的消费能力进行预测,因此将两种维度的预测结果进行融合,将融合结果作为待预测用户最终的目标消费能力预测结果,可以保证目标消费能力预测结果的准确性,可以真实反映待预测用户的真实消费水平。示例性的,将第一种消费能力预测结果和第二种消费能力预测结果的均值作为待预测用户的目标消费能力预测结果。
在一个可行的实施例中,对多维度预测结果进行融合,得到待预测用户的目标消费能力预测结果,包括:
确定多维度预测结果中各预测结果的权重值;
根据权重值和多维度预测结果的加权和确定待预测用户的目标消费能力预测结果。
在对多维度预测结果进行融合前,由于不同维度的预测方法具有不同的准确性,因此为不同维度预测方法得到的预测结果设置不同的权重值,按照该权重值对多维度预测结果进行加权求和,以确定待预测用户最终的目标消费能力预测结果。示例性的,权重值可以根据经验值进行确定。
在一个可行的实施例中,样本消费特征数据中至少包括交易频率和预设时间段内的月均消费额度;
相应的,确定多维度预测结果中各预测结果的权重值,包括:
根据交易频率的大小从样本用户中确定目标样本用户;
对目标样本用户的样本消费特征数据进行预测得到样本多维度预测结果;
根据样本多维度预测结果和月均消费额度确定各预测结果的权重值。
根据上述实施例的描述,根据交易频率确定的目标样本用户可以认定其月均消费额度为其真实消费能力,因此根据目标样本用户确定各预测结果的权重值可以保证权重值确定的准确性。
具体的,根据交易频率从样本用户中确定目标样本用户后,根据无监督预测模型对目标样本用户的目标样本消费特征数据进行预测得到第一种消费能力预测结果;根据有监督预测模型对目标样本用户的目标样本消费特征数据进行预测得到第二种消费能力预测结果;具体预测过程参考上述实施例,在此不再赘述。
根据第一种消费能力预测结果和第二种消费能力预测结果确定样本多维度预测结果,将目标样本用户的月均消费额度作为目标消费能力预测结果,即确定各预测结果的权重值的过程是如何根据样本多维度预测结果的加权结果得到目标消费能力预测结果。通过目标样本用户的模拟真实消费能力标签确定各预测结果的权重值可以保证权重值确定结果的准确性。
本实施例通过两个维度预测方法对商业银行用户的消费能力进行预测,解决目前银行因缺少用户外部消费及资产数据导致消费能力预测困难的问题,本实施例只需依赖银行用户内部消费特征数据,最大程度上预测用户的真实消费能力,且多维度全面预测可以提高最终预测结果的准确性,提高银行对高消费潜力用户的识别能力,为精准营销提供决策依据。
实施例二
图2是本发明实施例一中的用户消费能力预测方法的流程图,本实施例在上述实施例的基础上进行进一步的优化,如图2所示,该方法具体包括:
步骤201、获取待预测用户的待预测消费特征数据和样本用户的样本消费特征数据;其中,待预测消费特征数据中至少包括待预测用户在预设时间段内的每月消费额度。
步骤202、基于无监督预测模型对待预测消费特征数据进行预测,得到第一种消费能力预测结果。
步骤203、基于有监督预测模型对待预测消费特征数据进行预测,得到第二种消费能力预测结果。
步骤204、根据待预测用户在预设时间段内的每月消费额度确定待预测用户的月均消费额度,作为第三种消费能力预测结果。
待预测用户在一段时间内的平均消费水平也能在一定程度上反映该用户的实际消费能力。因此,在本实施例中引入第三种维度的预测结果,将待预测用户在预设时间段内的月均消费额度,作为该用户消费能力的自身度量结果,即第三种消费能力预测结果。第三种消费能力预测结果从待预测用户自身的消费情况出发,以提高最终预测结果的准确性。示例性的,将待预测用户一年内的月均消费额度作为第三种消费能力预测结果。
在本发明实施例中并不对第一种消费能力预测结果、第二种消费能力预测结果和第三中消费能力预测结果的确定顺序进行限制,即不对步骤202、步骤203和步骤204的执行顺序进行限制,步骤202、步骤203和步骤204可以按照任意顺序进行执行或者同时执行。
步骤205、将第一种消费能力预测结果、第二种消费能力预测结果和第三种消费能力预测结果作为多维度预测结果。
将三种预测方法得到的三种消费能力预测结果作为多维度预测结果,第一种消费能力预测结果从用户已经展现的消费特征数据进行分类进行无监督训练;第二种消费能力预测结果通过模拟目标样本用户的真实消费能力标签进行有监督训练;第三种消费能力预测结果从待预测用户自身的实际消费水平出发对消费能力进行预测,三种消费能力预测结果分别从不同方面进行预测,避免单一预测方法的偏差性和偶然性,提高预测结果的准确性。
步骤206、确定多维度预测结果中各预测结果的权重值,根据权重值和多维度预测结果的加权和确定待预测用户的目标消费能力预测结果。
在对多维度预测结果进行融合前,由于不同维度的预测方法具有不同的准确性,因此为不同维度预测方法得到的预测结果设置不同的权重值,按照该权重值对多维度预测结果进行加权求和,以确定待预测用户最终的目标消费能力预测结果。示例性的,权重值的确定可以参考实施例一中根据目标样本用户的月均消费额度进行确定,在此不再赘述。
根据第一种消费能力预测结果、第二种消费能力预测结果和第三种消费能力预测结果确定样本多维度预测结果,将目标样本用户的月均消费额度作为目标消费能力预测结果,即确定各预测结果的权重值的过程是如何根据样本多维度预测结果的加权结果得到目标消费能力预测结果。通过目标样本用户的模拟真实消费能力标签确定各预测结果的权重值可以保证权重值确定结果的准确性。
在一个可行的实施例中,在得到待预测用户的目标消费能力预测结果之后,该方法还包括:
获取待预测用户的真实月消费额度;
根据真实月消费额度和目标消费能力预测结果的偏差情况对各预测结果的权重值进行更新。
本实施例通过跨期预测对权重值进行更新,以保证权重值的准确性,进而提高后续预测结果的准确性。
具体的,确定待预测用户的目标消费能力预测结果后,该目标消费能力预测结果为预设时间的预测月消费额度,当达到该预设时间后,即可获取待预测用户的真实月消费额度。根据真实月消费额度和目标消费能力预测结果的偏差情况对权重值进行更新。
示例性的,根据上述目标样本用户的模拟真实消费能力标签确定初始权重值后,利用初始权重值对待预测用户进行目标消费能力的预测,在获取到与该目标消费能力预测结果对应的真实月消费额度后,若两者之间的偏差小于预设阈值,则不作处理;若偏差大于或等于预设阈值,则根据真实月消费额度和与目标消费能力预测结果对应的多维度预测结果对权重值进行更新,以保证预测结果的准确性。
在一个可行的实施例中,消费能力为月消费额度;
相应的,在得到待预测用户的目标消费能力预测结果之后,该方法还包括:
获取待预测用户的真实月消费额度;
根据真实月消费额度和目标消费能力预测结果的偏差情况对无监督预测模型和有监督预测模型进行优化。
具体的,确定待预测用户的目标消费能力预测结果后,该目标消费能力预测结果为预设时间的预测月消费额度,当达到该预设时间后,即可获取待预测用户的真实月消费额度。根据真实月消费额度和目标消费能力预测结果的偏差情况对无监督预测模型和有监督预测模型中的参数进行优化,以提高第一种消费能力预测结果和第二种消费能力预测结果的准确性。
示例性的,在对模型进行优化时,采用MSE(均方误差)和R2(决定系数)评价指标进行优化参考,其中,MSE指真实值与模型预测值之间的偏离度,MSE的值越小说明模型预测精确度越高;R2用来衡量模型预测的错误与基准模型预测错误之间的拟合度,R2的值越大表示模型预测效果越好。在对无监督预测模型和有监督预测模型进行参数优化时,优化目标为MSE值减小,R2增大,进而通过不断的优化过程提高模型预测的准确性,进而提高最终消费能力的预测准确性。其中,MSE为所有待预测用户的真实月消费额度和目标消费能力预测结果之差的平方和的均值;
Figure BDA0003140272890000151
其中,y′表示目标消费能力预测结果,y表示与目标消费能力预测结果对应的真实月消费额度,Var(y)表示所有待预测用户的真实月消费额度的方差。
本实施例从三个维度预测方法对商业银行用户的消费能力进行预测,预测维度更加全面,进而提高预测结果的准确性,解决单一预测方法偏差性较高的问题。且通过跨期预测的真实消费能力对权重值和模型参数进行更新优化,进一步提高模型预测和最终结果的准确性。
实施例三
图3是本发明实施例三中的用户消费能力预测装置的结构示意图,本实施例可适用于对商业银行用户的消费能力进行预测的情况。如图3所示,该装置包括:
用户数据获取模块310,用于获取待预测用户的待预测消费特征数据和样本用户的样本消费特征数据;
无监督预测模块320,用于基于无监督预测模型对所述待预测消费特征数据进行预测,得到第一种消费能力预测结果;
有监督预测模块330,用于基于有监督预测模型对所述待预测消费特征数据进行预测,得到第二种消费能力预测结果;
融合预测模块340,用于将所述第一种消费能力预测结果和所述第二种消费能力预测结果作为多维度预测结果,对所述多维度预测结果进行融合,得到所述待预测用户的目标消费能力预测结果;
其中,所述无监督预测模型和所述有监督预测模型基于所述样本消费特征数据进行训练。
本发明实施例基于无监督预测模型对待预测消费特征数据进行预测,得到第一种消费能力预测结果;基于有监督预测模型对待预测消费特征数据进行预测,得到第二种消费能力预测结果;将第一种消费能力预测结果和第二种消费能力预测结果作为多维度预测结果,对多维度预测结果进行融合,得到待预测用户的目标消费能力预测结果。本实施例通过两个维度预测方法对商业银行用户的消费能力进行预测,解决目前银行因缺少用户外部消费及资产数据导致消费能力预测困难的问题,本实施例只需依赖银行用户内部消费特征数据,最大程度上预测用户的真实消费能力,且多维度全面预测可以提高最终预测结果的准确性,提高银行对高消费潜力用户的识别能力,为精准营销提供决策依据。
可选的,所述无监督预测模型包括无监督聚类预测模型,消费特征数据中至少包括预设时间段内的每月消费额度;
相应的,无监督预测模块,具体用于:
基于所述无监督聚类预测模型根据所述待预测消费特征数据和所述样本消费特征数据,对所述待预测用户和所述样本用户进行分类,得到用户分类结果;
根据所述待预测用户所属类别中所有用户在预设时间段内的平均月均消费额度作为所述待预测用户的第一种消费能力预测结果。
可选的,所述有监督预测模型包括有监督回归预测模型,消费特征数据中至少包括交易频率和预设时间段内的历史消费行为数据;所述样本消费特征数据中还包括样本消费能力标签数据,所述样本消费能力标签数据是指样本用户的月均消费额度,其中,所述有监督回归预测模型的训练步骤如下所示:
根据所述交易频率的大小从样本用户中确定目标样本用户;
基于有监督回归算法对所述目标样本用户的历史消费行为数据和样本消费能力标签数据进行训练,得到所述有监督回归预测模型。
可选的,有监督预测模块,具体用于:
基于所述有监督回归预测模型对所述待预测用户在预设时间段内的历史消费行为数据进行预测,得到预测消费能力标签数据,作为第二种消费能力预测结果。
可选的,所述待预测消费特征数据中至少包括所述待预测用户在预设时间段内的每月消费额度;
相应的,该装置还包括业务预测模块,用于在对所述多维度预测结果进行融合之前,根据所述待预测用户在预设时间段内的每月消费额度确定所述待预测用户的月均消费额度,作为第三种消费能力预测结果;
将所述第一种消费能力预测结果、所述第二种消费能力预测结果和所述第三种消费能力预测结果作为多维度预测结果。
可选的,融合预测模块中对所述多维度预测结果进行融合,得到所述待预测用户的目标消费能力预测结果,包括:
权重值确定单元,用于确定所述多维度预测结果中各预测结果的权重值;
目标结果确定单元,用于根据所述权重值和多维度预测结果的加权和确定所述待预测用户的目标消费能力预测结果。
可选的,所述样本消费特征数据中至少包括交易频率和预设时间段内的月均消费额度;
相应的,权重值确定单元,包括:
根据所述交易频率的大小从样本用户中确定目标样本用户;
对目标样本用户的样本消费特征数据进行预测得到样本多维度预测结果;
根据所述样本多维度预测结果和所述月均消费额度确定所述各预测结果的权重值。
可选的,该装置还包括权重值更新模块,在得到所述待预测用户的目标消费能力预测结果之后,获取所述待预测用户的真实月消费额度;
根据所述真实月消费额度和所述目标消费能力预测结果的偏差情况对所述各预测结果的权重值进行更新。
可选的,消费能力为月消费额度;
相应的,该装置还包括模块优化模块,用于在得到所述待预测用户的目标消费能力预测结果之后,获取所述待预测用户的真实月消费额度;
根据所述真实月消费额度和所述目标消费能力预测结果的偏差情况对所述无监督预测模型和所述有监督预测模型进行优化。
可选的,所述用户为银行卡使用用户;
相应的,用户数据获取模块包括样本用户数据获取单元,具体用于:
获取全量银行卡使用用户的银行数据;其中,所述银行数据至少包括如下一项:动账数据、资产数据以及负债数据;
根据所述银行数据从所述全量银行卡使用用户中筛选出样本用户,并获取所述样本用户的样本消费特征数据。
本发明实施例所提供的用户消费能力预测装置可执行本发明任意实施例所提供的用户消费能力预测方法,具备执行用户消费能力预测方法相应的功能模块和有益效果。
实施例四
图4是本发明实施例四提供的一种电子设备的结构示意图。图4示出了适于用来实现本发明实施方式的示例性电子设备12的框图。图4显示的电子设备12仅仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。
如图4所示,电子设备12以通用计算设备的形式表现。电子设备12的组件可以包括但不限于:一个或者多个处理器或者处理单元16,***存储装置28,连接不同***组件(包括***存储装置28和处理单元16)的总线18。
总线18表示几类总线结构中的一种或多种,包括存储装置总线或者存储装置控制器,***总线,图形加速端口,处理器或者使用多种总线结构中的任意总线结构的局域总线。举例来说,这些体系结构包括但不限于工业标准体系结构(ISA)总线,微通道体系结构(MAC)总线,增强型ISA总线、视频电子标准协会(VESA)局域总线以及***组件互连(PCI)总线。
电子设备12典型地包括多种计算机***可读介质。这些介质可以是任何能够被电子设备12访问的可用介质,包括易失性和非易失性介质,可移动的和不可移动的介质。
***存储装置28可以包括易失性存储装置形式的计算机***可读介质,例如随机存取存储装置(RAM)30和/或高速缓存存储装置32。电子设备12可以进一步包括其它可移动/不可移动的、易失性/非易失性计算机***存储介质。仅作为举例,存储***34可以用于读写不可移动的、非易失性磁介质(图4未显示,通常称为“硬盘驱动器”)。尽管图4中未示出,可以提供用于对可移动非易失性磁盘(例如“软盘”)读写的磁盘驱动器,以及对可移动非易失性光盘(例如CD-ROM,DVD-ROM或者其它光介质)读写的光盘驱动器。在这些情况下,每个驱动器可以通过一个或者多个数据介质接口与总线18相连。存储装置28可以包括至少一个程序产品,该程序产品具有一组(例如至少一个)程序模块,这些程序模块被配置以执行本发明各实施例的功能。
具有一组(至少一个)程序模块42的程序/实用工具40,可以存储在例如存储装置28中,这样的程序模块42包括但不限于操作***、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。程序模块42通常执行本发明所描述的实施例中的功能和/或方法。
电子设备12也可以与一个或多个外部设备14(例如键盘、指向设备、显示器24等)通信,还可与一个或者多个使得用户能与该设备12交互的设备通信,和/或与使得该设备12能与一个或多个其它计算设备进行通信的任何设备(例如网卡,调制解调器等等)通信。这种通信可以通过输入/输出(I/O)接口22进行。并且,电子设备12还可以通过网络适配器20与一个或者多个网络(例如局域网(LAN),广域网(WAN)和/或公共网络,例如因特网)通信。如图4所示,网络适配器20通过总线18与电子设备12的其它模块通信。应当明白,尽管图4中未示出,可以结合电子设备12使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、RAID***、磁带驱动器以及数据备份存储***等。
处理单元16通过运行存储在***存储装置28中的程序,从而执行各种功能应用以及数据处理,例如实现本发明实施例所提供的用户消费能力预测方法,包括:
获取待预测用户的待预测消费特征数据和样本用户的样本消费特征数据;
基于无监督预测模型对所述待预测消费特征数据进行预测,得到第一种消费能力预测结果;
基于有监督预测模型对所述待预测消费特征数据进行预测,得到第二种消费能力预测结果;
将所述第一种消费能力预测结果和所述第二种消费能力预测结果作为多维度预测结果,对所述多维度预测结果进行融合,得到所述待预测用户的目标消费能力预测结果;
其中,所述无监督预测模型和所述有监督预测模型基于所述样本消费特征数据进行训练。
实施例五
本发明实施例五还提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如本发明实施例所提供的用户消费能力预测方法,包括:
获取待预测用户的待预测消费特征数据和样本用户的样本消费特征数据;
基于无监督预测模型对所述待预测消费特征数据进行预测,得到第一种消费能力预测结果;
基于有监督预测模型对所述待预测消费特征数据进行预测,得到第二种消费能力预测结果;
将所述第一种消费能力预测结果和所述第二种消费能力预测结果作为多维度预测结果,对所述多维度预测结果进行融合,得到所述待预测用户的目标消费能力预测结果;
其中,所述无监督预测模型和所述有监督预测模型基于所述样本消费特征数据进行训练。
本发明实施例的计算机存储介质,可以采用一个或多个计算机可读的介质的任意组合。计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质。计算机可读存储介质例如可以是但不限于电、磁、光、电磁、红外线、或半导体的***、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本文件中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行***、装置或者器件使用或者与其结合使用。
计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行***、装置或者器件使用或者与其结合使用的程序。
计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于无线、电线、光缆、RF等等,或者上述的任意合适的组合。
可以以一种或多种程序设计语言或其组合来编写用于执行本发明操作的计算机程序代码,所述程序设计语言包括面向对象的程序设计语言诸如Java、Smalltalk、C++,还包括常规的过程式程序设计语言诸如”C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络包括局域网(LAN)或广域网(WAN)连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
注意,上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员会理解,本发明不限于这里所述的特定实施例,对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本发明的保护范围。因此,虽然通过以上实施例对本发明进行了较为详细的说明,但是本发明不仅仅限于以上实施例,在不脱离本发明构思的情况下,还可以包括更多其他等效实施例,而本发明的范围由所附的权利要求范围决定。

Claims (13)

1.一种用户消费能力预测方法,其特征在于,包括:
获取待预测用户的待预测消费特征数据和样本用户的样本消费特征数据;
基于无监督预测模型对所述待预测消费特征数据进行预测,得到第一种消费能力预测结果;
基于有监督预测模型对所述待预测消费特征数据进行预测,得到第二种消费能力预测结果;
将所述第一种消费能力预测结果和所述第二种消费能力预测结果作为多维度预测结果,对所述多维度预测结果进行融合,得到所述待预测用户的目标消费能力预测结果;
其中,所述无监督预测模型和所述有监督预测模型基于所述样本消费特征数据进行训练。
2.根据权利要求1所述的方法,其特征在于,所述无监督预测模型包括无监督聚类预测模型,消费特征数据中至少包括预设时间段内的每月消费额度;
相应的,基于无监督预测模型对所述待预测消费特征数据进行预测,得到第一种消费能力预测结果,包括:
基于所述无监督聚类预测模型根据所述待预测消费特征数据和所述样本消费特征数据,对所述待预测用户和所述样本用户进行分类,得到用户分类结果;
根据所述待预测用户所属类别中所有用户在预设时间段内的平均月均消费额度作为所述待预测用户的第一种消费能力预测结果。
3.根据权利要求1所述的方法,其特征在于,所述有监督预测模型包括有监督回归预测模型,消费特征数据中至少包括交易频率和预设时间段内的历史消费行为数据;所述样本消费特征数据中还包括样本消费能力标签数据,所述样本消费能力标签数据是指样本用户的月均消费额度,其中,所述有监督回归预测模型的训练步骤如下所示:
根据所述交易频率的大小从样本用户中确定目标样本用户;
基于有监督回归算法对所述目标样本用户的历史消费行为数据和样本消费能力标签数据进行训练,得到所述有监督回归预测模型。
4.根据权利要求3所述的方法,其特征在于,基于有监督预测模型对所述待预测消费特征数据进行预测,得到第二种消费能力预测结果,包括:
基于所述有监督回归预测模型对所述待预测用户在预设时间段内的历史消费行为数据进行预测,得到预测消费能力标签数据,作为第二种消费能力预测结果。
5.根据权利要求1所述的方法,其特征在于,所述待预测消费特征数据中至少包括所述待预测用户在预设时间段内的每月消费额度;
相应的,在对所述多维度预测结果进行融合之前,所述方法还包括:
根据所述待预测用户在预设时间段内的每月消费额度确定所述待预测用户的月均消费额度,作为第三种消费能力预测结果;
将所述第一种消费能力预测结果、所述第二种消费能力预测结果和所述第三种消费能力预测结果作为多维度预测结果。
6.根据权利要求1或5任一项所述的方法,其特征在于,对所述多维度预测结果进行融合,得到所述待预测用户的目标消费能力预测结果,包括:
确定所述多维度预测结果中各预测结果的权重值;
根据所述权重值和多维度预测结果的加权和确定所述待预测用户的目标消费能力预测结果。
7.根据权利要求6所述的方法,其特征在于,所述样本消费特征数据中至少包括交易频率和预设时间段内的月均消费额度;
相应的,确定所述多维度预测结果中各预测结果的权重值,包括:
根据所述交易频率的大小从样本用户中确定目标样本用户;
对目标样本用户的样本消费特征数据进行预测得到样本多维度预测结果;
根据所述样本多维度预测结果和所述月均消费额度确定所述各预测结果的权重值。
8.根据权利要求6所述的方法,其特征在于,在得到所述待预测用户的目标消费能力预测结果之后,所述方法还包括:
获取所述待预测用户的真实月消费额度;
根据所述真实月消费额度和所述目标消费能力预测结果的偏差情况对所述各预测结果的权重值进行更新。
9.根据权利要求1所述的方法,其特征在于,消费能力为月消费额度;
相应的,在得到所述待预测用户的目标消费能力预测结果之后,所述方法还包括:
获取所述待预测用户的真实月消费额度;
根据所述真实月消费额度和所述目标消费能力预测结果的偏差情况对所述无监督预测模型和所述有监督预测模型进行优化。
10.根据权利要求1所述的方法,其特征在于,所述用户为银行卡使用用户;
相应的,获取样本用户的样本消费特征数据,包括:
获取全量银行卡使用用户的银行数据;其中,所述银行数据至少包括如下一项:动账数据、资产数据以及负债数据;
根据所述银行数据从所述全量银行卡使用用户中筛选出样本用户,并获取所述样本用户的样本消费特征数据。
11.一种用户消费能力预测装置,其特征在于,包括:
用户数据获取模块,用于获取待预测用户的待预测消费特征数据和样本用户的样本消费特征数据;
无监督预测模块,用于基于无监督预测模型对所述待预测消费特征数据进行预测,得到第一种消费能力预测结果;
有监督预测模块,用于基于有监督预测模型对所述待预测消费特征数据进行预测,得到第二种消费能力预测结果;
融合预测模块,用于将所述第一种消费能力预测结果和所述第二种消费能力预测结果作为多维度预测结果,对所述多维度预测结果进行融合,得到所述待预测用户的目标消费能力预测结果;
其中,所述无监督预测模型和所述有监督预测模型基于所述样本消费特征数据进行训练。
12.一种电子设备,其特征在于,包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1-10中任一所述的用户消费能力预测方法。
13.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1-10中任一所述的用户消费能力预测方法。
CN202110732385.0A 2021-06-30 2021-06-30 用户消费能力预测方法、装置、电子设备和存储介质 Pending CN113313538A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110732385.0A CN113313538A (zh) 2021-06-30 2021-06-30 用户消费能力预测方法、装置、电子设备和存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110732385.0A CN113313538A (zh) 2021-06-30 2021-06-30 用户消费能力预测方法、装置、电子设备和存储介质

Publications (1)

Publication Number Publication Date
CN113313538A true CN113313538A (zh) 2021-08-27

Family

ID=77380943

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110732385.0A Pending CN113313538A (zh) 2021-06-30 2021-06-30 用户消费能力预测方法、装置、电子设备和存储介质

Country Status (1)

Country Link
CN (1) CN113313538A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113780675A (zh) * 2021-09-23 2021-12-10 北方健康医疗大数据科技有限公司 一种消耗预测方法、装置、存储介质及电子设备
CN116028838A (zh) * 2023-01-09 2023-04-28 广东电网有限责任公司 一种基于聚类算法的能源数据处理方法、装置及终端设备
CN117455549A (zh) * 2023-11-08 2024-01-26 广州丰石科技有限公司 一种基于城市体征指标的消费能力评估方法

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113780675A (zh) * 2021-09-23 2021-12-10 北方健康医疗大数据科技有限公司 一种消耗预测方法、装置、存储介质及电子设备
CN113780675B (zh) * 2021-09-23 2024-01-09 北方健康医疗大数据科技有限公司 一种消耗预测方法、装置、存储介质及电子设备
CN116028838A (zh) * 2023-01-09 2023-04-28 广东电网有限责任公司 一种基于聚类算法的能源数据处理方法、装置及终端设备
CN116028838B (zh) * 2023-01-09 2023-09-19 广东电网有限责任公司 一种基于聚类算法的能源数据处理方法、装置及终端设备
CN117455549A (zh) * 2023-11-08 2024-01-26 广州丰石科技有限公司 一种基于城市体征指标的消费能力评估方法

Similar Documents

Publication Publication Date Title
CN113313538A (zh) 用户消费能力预测方法、装置、电子设备和存储介质
WO2007106786A2 (en) Methods and systems for multi-credit reporting agency data modeling
CN110738527A (zh) 一种特征重要性排序方法、装置、设备和存储介质
CN109583966A (zh) 一种高价值客户识别方法、***、设备及存储介质
CN111783039B (zh) 风险确定方法、装置、计算机***和存储介质
CN113177700B (zh) 一种风险评估方法、***、电子设备及存储介质
CN112990294A (zh) 行为判别模型的训练方法、装置、电子设备及存储介质
CN112328869A (zh) 一种用户贷款意愿的预测方法、装置及计算机***
CN112070559A (zh) 状态获取方法和装置、电子设备和存储介质
CN114422241A (zh) 一种入侵检测方法、装置及***
CN113554504A (zh) 一种车贷风控模型生成方法、装置及评分卡生成方法
CN112836742A (zh) ***资源调整方法、装置及设备
CN111815435A (zh) 一种群体风险特征的可视化方法、装置、设备及存储介质
CN116257758A (zh) 模型训练方法、人群拓展方法、介质、装置和计算设备
CN115641198A (zh) 用户运营方法、装置、电子设备和存储介质
CN113837843B (zh) 产品推荐方法、装置、介质及电子设备
CN112328899B (zh) 信息处理方法、信息处理装置、存储介质与电子设备
CN115186101A (zh) 一种投资管理后端***、方法、设备及存储介质
CN113052512A (zh) 风险预测方法、装置和电子设备
CN111325350A (zh) 可疑组织发现***和方法
CN110852392A (zh) 一种用户分群方法、装置、设备和介质
CN117076962B (zh) 应用于人工智能领域的数据分析方法、装置及设备
CN112926816B (zh) 供应商评价方法、装置、计算机设备和存储介质
CN103180850A (zh) 计算机***和使用了计算机***的信息提示方法
CN118096342A (zh) 账户对象数据处理方法、装置、计算机设备、存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20210827

RJ01 Rejection of invention patent application after publication