CN113869973A - 产品推荐方法、产品推荐***和计算机可读存储介质 - Google Patents

产品推荐方法、产品推荐***和计算机可读存储介质 Download PDF

Info

Publication number
CN113869973A
CN113869973A CN202111078658.0A CN202111078658A CN113869973A CN 113869973 A CN113869973 A CN 113869973A CN 202111078658 A CN202111078658 A CN 202111078658A CN 113869973 A CN113869973 A CN 113869973A
Authority
CN
China
Prior art keywords
product
products
user
model
recommended
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202111078658.0A
Other languages
English (en)
Inventor
李剑戈
肖钢
夏添
吴华普
杜瑞岭
张浩然
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Securities Co Ltd
Original Assignee
China Securities Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Securities Co Ltd filed Critical China Securities Co Ltd
Priority to CN202111078658.0A priority Critical patent/CN113869973A/zh
Publication of CN113869973A publication Critical patent/CN113869973A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions
    • G06Q30/0601Electronic shopping [e-shopping]
    • G06Q30/0631Item recommendations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0639Performance analysis of employees; Performance analysis of enterprise or organisation operations
    • G06Q10/06393Score-carding, benchmarking or key performance indicator [KPI] analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/04Trading; Exchange, e.g. stocks, commodities, derivatives or currency exchange

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • Human Resources & Organizations (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Economics (AREA)
  • Development Economics (AREA)
  • Accounting & Taxation (AREA)
  • Finance (AREA)
  • Strategic Management (AREA)
  • Marketing (AREA)
  • General Business, Economics & Management (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Software Systems (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Educational Administration (AREA)
  • General Engineering & Computer Science (AREA)
  • Technology Law (AREA)
  • Tourism & Hospitality (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Game Theory and Decision Science (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Medical Informatics (AREA)
  • Evolutionary Biology (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明实施例提供一种产品推荐方法和产品推荐***,该产品推荐方法包括:获取目标用户的历史交易数据以建立样本集,样本集包括训练集和验证集;获取目标用户的产品,从中提取出目标用户的多个用户属性特征和多个产品属性特征形成组合特征;以训练集和组合特征为基础建立多个评估模型,由测试集从中筛选出一个评估模型作为产品评分模型;根据产品评分模型对待预测集中的多款产品进行评分和排序,筛选出待推荐产品在待推荐时间区间内推荐给目标用户。该产品推荐方法和推荐***能根据用户的历史交易数据和组合特征分析出与用户匹配度最好的产品,自适应为目标用户推荐产品,提升推荐准确率和转化率。

Description

产品推荐方法、产品推荐***和计算机可读存储介质
技术领域
本发明涉及计算机技术领域,具体涉及一种产品推荐方法、产品推荐***和计算机可读存储介质。
背景技术
随着金融行业的快速发展,目前许多金融机构都会将一些待推广的金融产品推荐给用户,金融产品例如基金、证券等。但是推荐的产品要符合用户的消费观念和习惯才会提升转化率。目前常用的几种推荐方法有:随机给用户推荐基金、全量给用户推荐基金、无策略的给用户推荐基金。随机给用户推荐基金即将任意的基金产品推荐给用户,这会导致基金推荐展示位的转化率过低;全量给用户推荐是将全部基金产品不加筛选地提供给用户,可能会导致用户选择的产品种类过多,资金不能及时利用和周转;另外,无策略的推荐容易导致基金推荐效率降低。
因此,目前使用的产品推荐方法有很大的局限性,不能为用户挑选出合适的产品,导致资金不能得到有效的利用。
发明内容
有鉴于此,本发明实施例提供一种产品推荐方法和产品推荐***,能根据用户的历史交易数据和特征数据,分析出适合不同客群的产品进行推荐,解决现有技术中的问题。
根据本发明第一方面,提供一种产品推荐方法,包括:
获取目标用户的历史交易数据以建立样本集,所述样本集包括训练集和验证集;
从所述历史交易数据中提取出所述目标用户的多个用户属性特征和多个产品属性特征形成组合特征;
以所述训练集和所述组合特征为基础建立多个评估模型,由所述测试集从中筛选出一个评估模型作为产品评分模型;以及
根据所述产品评分模型对待预测集中的多款产品进行评分和排序,筛选出待推荐产品在待推荐时间区间内推荐给所述目标用户。
可选地,在根据所述产品评分模型对待预测集中的多款产品进行评分和排序,筛选出待推荐产品在待推荐时间区间内推荐给所述目标用户的步骤之前还包括:
通过多维度的产品召回方式进行产品召回,组成所述待预测集;
根据所述产品的热度和转化率对所述待预测集中的产品数量进行调整。
可选地,在获取目标用户的历史交易数据以建立样本集,所述样本集包括训练集和验证集的步骤之后还包括:
对所述样本集进行数据预处理,舍弃无效数据;
根据所述历史交易数据进行时间间隔分析,预测出向所述目标用户进行推荐的待推荐时间区间。
可选地,所述样本集包括正样本数据和负样本数据,所述正样本数据为向所述目标用户推荐过且已完成交易的产品数据,所述负样本数据为向所述目标用户推荐过但未被交易的产品数据。
可选地,所述多个用户属性特征包括基本信息特征、资产特征、业务开通特征、交易行为特征和APP行为特征;所述多个产品属性特征包括产品类型特征、产品经理经验水平特征、产品排名特征、产品收益能力特征、风险控制能力特征和产品热度特征。
可选地,采用GBDT模型或LR模型建立多个所述评估模型。
可选地,所述样本集包括所述目标用户和所述已推荐产品之间的关联关系,所述产品评分模型表征所述目标用户和所述待推荐产品之间的关联度。
可选地,以所述训练集和所述组合特征为基础建立多个评估模型,由所述测试集从中筛选出一个评估模型作为产品评分模型的步骤包括:
根据所述训练集建立评估模型;
将不同类型的所述组合特征分别作为参数加入所述评估模型中,得到多个所述评估模型;
根据所述测试集对多个所述评估模型进行测试,筛选出符合预期模型效果的评估模型作为产品评分模型。
可选地,采用固定的比例或采用多折交叉验证方法将所述样本集划分为所述训练集和所述验证集。
可选地,所述多维度的产品召回方式包括:基于多维度用户属性与产品属性的产品召回、基于历史购买数据的产品召回、基于用户持仓的产品召回、基于用户自选的产品召回、基于用户APP搜索的产品召回和基于模型算法的产品召回。
可选地,根据所述产品评分模型对待预测集中的多款产品进行评分和排序,筛选出待推荐产品在待推荐时间区间内推荐给所述目标用户的步骤包括:
将所述待预测集中的所述产品依次输入所述产品评分模型中,得到每款所述产品的评分;
筛选出得分最高的N款产品推荐给所述目标用户,N为大于0的自然数。
可选地,所述根据所述历史交易数据进行时间间隔分析,预测出向所述目标用户进行推荐的待推荐时间区间包括:
获取所述目标用户在固定时间段内的所有产品交易行为记录;
对所有所述产品交易行为记录进行时间间隔分析,预测出交易时间间隔;
根据所述最后一次产品交易行为记录和所述交易时间间隔获得所述时间区间。
根据本发明第二方面,提供一种产品推荐***,包括:
样本集获取单元,用于获取目标用户的历史交易数据以建立样本集,所述样本集包括训练集和验证集;
特征构建单元,用于从所述历史交易数据中提取出所述目标用户的多个用户属性特征和多个产品属性特征形成组合特征;
模型建立单元,用于以所述训练集和所述组合特征为基础建立多个评估模型,由所述测试集从中筛选出一个评估模型作为产品评分模型;以及
推荐单元,用于根据所述产品评分模型对待预测集中的多款产品进行评分和排序,筛选出待推荐产品在待推荐时间区间内推荐给所述目标用户。
可选地,所述产品推荐***还包括:
产品召回单元,用于通过多维度的产品召回方式进行产品召回,组成所述待预测集;
调整单元,用于根据所述产品的热度和转化率对所述待预测集中的产品数量进行调整。
可选地,所述样本集包括所述目标用户和所述已推荐产品之间的关联关系,所述产品评分模型表征所述目标用户和所述待推荐产品之间的关联度。
根据本发明第三方面,提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机指令,所述计算机指令被执行时实现如上述所述的产品推荐方法。
根据本发明第四方面,提供一种产品推荐装置,包括:存储器,用于存储计算机指令;处理器,耦合到所述存储器,所述处理器被配置为基于所述存储器存储的计算机指令执行实现如上述所述的产品推荐方法。
本发明的实施例具有以下优点或有益效果:本发明实施例的产品推荐方法和推荐***首先根据用户的历史交易数据建立样本集,再提取出分别与用户和产品相对应的属性特征构建组合特征,经由组合特征和样本集建立并筛选出优质的评分模型,该评分模型同时兼顾了用户与产品的关系,且将最佳的属性特征作为模型的参数,使建立的模型更符合用户的特性和需求;之后据此模型对待预测集中的各项产品进行评分,从而提取出与用户最匹配的产品进行推荐。该产品推荐方法和***能根据用户的历史交易数据对用户特征和行为进行分析,并且根据模型精准评估出用户与产品之间的相关度,可以为合适的有能力的用户进行产品推荐,并且能在合适的时间区间按照用户的习惯和喜好向用户推荐产品,不仅可以自动挖掘***,还可以利用机器学习的算法为用户推荐相关性高的产品,提高推荐的准确度以及推荐转化率,提升用户体验。
附图说明
通过参照以下附图对本发明实施例的描述,本发明的上述以及其它目的、特征和优点将更为清楚,在附图中:
图1示出了根据本发明实施例的产品推荐方法的流程图;
图2示出了根据本发明实施例的产品推荐方法中获取的特征集合的示意图;
图3示出了根据本发明实施例的产品推荐方法中产品评分模型的建立过程示意图;
图4示出了根据本发明实施例的汇总的产品推荐方法的流程图;
图5示出了根据本发明实施例的产品推荐方法中待预测集的组成示意图;
图6示出了根据本发明实施例的产品推荐***的结构示意图;
图7示出了采用本发明实施例的产品推荐方法前后产品的转化率的示意图;
图8示出了根据本发明实施例的产品推荐装置的结构示意图。
具体实施方式
以下基于实施例对本发明进行描述,但是本发明并不仅仅限于这些实施例。在下文对本发明的细节描述中,详尽描述了一些特定的细节部分。对本领域技术人员来说没有这些细节部分的描述也可以完全理解本发明。为了避免混淆本发明的实质,公知的方法、过程、流程没有详细叙述。另外附图不一定是按比例绘制的。
图1示出了根据本发明实施例的产品推荐方法的流程图,具体包括步骤S101-S104。
本发明旨在提供一种产品推荐方法,产品可以是基金、股票或证券等。该产品推荐方法使用GBDT(Gradient Boosting Decision Tree)算法进行建模,能基于用户的多种特征分析出适合不同客群推荐的产品,能够实现有效地对用户进行自适应产品推荐,提升推荐准确率。
在步骤S101中,获取目标用户的历史交易数据以建立样本集,样本集包括训练集和验证集。
本步骤中,首先从APP内获取所有开户用户作为目标用户,并获取相应的用户信息和历史交易数据,例如包括开户姓名、转账记录、产品购入和卖出信息等,这些信息都是在用户允许的情况下且能保证用户隐私的前提下得到的。根据目标用户的历史交易数据建立样本集,样本集包括正样本和负样本,其包括目标用户和已推荐产品之间的关联关系。正样本数据为向目标用户推荐过且已完成交易的产品数据,负样本数据为向目标用户推荐过但未被交易的产品数据。具体地,对于某些已推荐给用户的产品,若该产品被用户购买,则将该用户与其购买的产品记录为正样本;若该产品未被用户购买,则将该产品和用户记录为负样本,通过目标用户的历史交易数据可以获取对应的正样本和负样本,并合并为样本集。
之后再将样本集划分成训练集和验证集,供模型训练和模型验证。样本集的划分可以采用固定的比例,也可以采用多折交叉验证的方式,例如,根据数据库时间分区将样本集按照7:3(或8:2)的比例划分为训练集和验证集。训练集数据用于进行模型的训练,验证集数据用于进行模型的验证。
在步骤S102中,从历史交易数据中提取出目标用户的多个用户属性特征和多个产品属性特征形成组合特征。
本步骤中,由于历史交易数据也包含用户和产品之间的关系,所以从历史交易数据中提取出多个用户属性特征和多个产品属性特征。用户的属性特征例如包括用户的基本信息特征、资产特征、业务开通特征、用户交易行为特征(包括场内交易时序和场外OTC交易时序)以及用户APP行为特征(APP登陆时序,浏览或点击等相关特征),并进行相应的特征组合。产品属性特征包括产品类型、产品经理经验水平、产品排名、产品的收益能力、风险控制能力、择时能力、攻守兼备能力、产品购买热度等。从用户属性特征和产品属性特征中分别各提取出部分项以构建组合特征,便于后续建模分析。另外,组合特征也可以是仅多个用户属性特征的组合或仅多个产品属性特征的组合。
在步骤S103中,以训练集和组合特征为基础建立多个评估模型,由测试集从中筛选出一个评估模型作为产品评分模型。
本步骤中,选择合适的分类模型进行建模,通常采用GBDT(Gradient BoostingDecision Tree)模型对训练集进行整合,建立评估模型,将组合特征作为模型因子加入评估模型中,不同的组合特征对应不同的评估模型,产品评分模型表征目标用户和待推荐产品之间的关联度。之后再采用测试集对各个评分模型进行评估,筛选出优质模型作为最终的产品评分模型。
该步骤具体包括:根据训练集(80%样本集)建立评估模型;将不同类型的组合特征分别作为参数加入评估模型中,得到多个评估模型;根据测试集(20%样本集)对多个评估模型进行测试,筛选出符合预期模型效果的评估模型作为产品评分模型。在步骤S102中可以获得多种组合特征,分别一一对应加入评估模型中,测试集用于对模型进行评估和筛选,同时也是对模型的多种特征进行处理,测试集主要用于对特征进行重要性分析和选择,从而调节模型参数。即在筛选过程中,保留优质模型及其对应的组合特征,在筛选优质模型的同时筛选出最合适的组合特征。在步骤S104中,根据产品评分模型对待预测集中的多款产品进行评分和排序,筛选出待推荐产品在待推荐时间区间内推荐给目标用户。
本步骤中,利用筛选出的产品评分模型对待预测集中的产品进行预测,得到用户对各类产品的打分。根据分值排序,将分值高的产品优先推荐给用户。待预测集是产品推荐池,其中存储有多款欲向用户推荐的产品。
进一步地,本步骤具体包括:将待预测集中的产品依次输入产品评分模型中,得到每款产品的评分;筛选出得分最高的N款产品推荐给目标用户,N为大于0的自然数。例如根据评分模型筛选出得分最高的三款产品,将其推荐给目标用户。本步骤中能对每一款产品进行相应的评分,根据评分来判断产品与用户的契合度。这些产品能为多数目标用户喜爱或选择,能提高推荐的准确性。
综上,本实施例主要介绍了如何建立贴合用户实际需求的产品评分模型,根据客户不同的行为特征,分析出适合不同客群推荐的产品,进而为客户进行推荐。首先,根据历史交易数据得到样本集和用户属性特征以及产品属性特征,将样本集和各项特征加入GBDT模型进行建模、整合,根据模型评估得到优质模型,该模型包含了用户与产品之间的关联度,根据该模型得到的待推荐产品与用户的特征和消费习惯等较为贴合。
本实施例的产品推荐方法能根据目标用户的历史交易数据获取样本集和组合特征,再据此建立多个评估模型,并从中筛选出最优的产品评分模型,最后据此选出评分较高的产品在合适的时间区间内推荐给目标用户。从而可以为合适的有能力的用户进行产品推荐,并且能在合适的时间区间按照用户的习惯和喜好向用户推荐产品,不仅可以自动挖掘***,还可以利用机器学习的算法为用户推荐相关性高的产品,提高推荐的准确度以及推荐转化率。
图2示出了根据本发明实施例的产品推荐方法中获取的特征集合的示意图。
图1在步骤S102中,获取了多个用户属性特征和多个产品属性特征,图2重点对模型中特征涉及的数据展示。如图2所示,特征集合由客户相关特征(用户属性特征)和产品相关特征(产品属性特征)组成,分别都包括多个特征。具体地,多个用户属性特征包括基本信息特征、资产相关特征、银证转账交易行为时序特征、业务开通相关特征、场内证券买卖交易时序特征、APP浏览点击行为特征、场外OTC产品买卖时序特征、交易反馈行为特征、按品类交易时序特征、与行情相关的组合特征等;多个产品属性特征包括产品基本信息特征、产品管理人相关特征、产品行业板块相关特征、产品收益表现特征、产品持仓相关特征、产品风险控制相关特征、产品热度特征、产品大数据相关特征等。当然,实际获取到的特征可能并不完全与图2的内容一致,可以根据实际情况及时调节特征集合。采用这些特征相互组合得到多个不同的组合特征,构建组合特征的过程同时也可以视为用户分层的过程,不同的组合特征可以代表不同的客群。
图3示出了根据本发明实施例的产品推荐方法中产品评分模型的建立过程示意图。
如图3所示,该产品评分模型的建立过程包括多个流程。首先获取正样本和负样本,再由二者组合得到样本集,正样本数据为目标用户购买过的已推荐产品数据,负样本数据为目标用户未购买过的已推荐产品数据。然后将样本集拆分为训练集和测试集,训练集用于建模。在建模之前,还需要获取大量的特征数据,该特征数据可以是图2中描述的多项特征或者其他特征,图3中示例性地给出了一些特征,对这些特征进行筛选,之后加入到GBDT模型建立的评估模型中,得到多个模型;再采用测试集对各模型进行模型评估,筛选出优质模型,作为最终的产品评分模型。
图4示出了根据本发明实施例的汇总的产品推荐方法的流程图,具体包括以下步骤。
在步骤S201中,获取目标用户的历史交易数据以建立样本集,样本集包括训练集和验证集。
在步骤S202中,对样本集进行数据预处理,舍弃无效数据。
在步骤S203中,根据历史交易数据进行时间间隔分析,预测出向目标用户进行推荐的待推荐时间区间。
在步骤S204中,从历史交易数据中提取出目标用户的多个用户属性特征和多个产品属性特征形成组合特征。
在步骤S205中,以训练集和组合特征为基础建立多个评估模型,由测试集从中筛选出一个评估模型作为产品评分模型。
在步骤S206中,通过多维度的产品召回方式进行产品召回,组成待预测集。
在步骤S207中,根据产品的热度和转化率对待预测集中的产品数量进行调整。
在步骤S208中,根据产品评分模型对待预测集中的多款产品进行评分和排序,筛选出待推荐产品在待推荐时间区间内推荐给目标用户。
本实施例是比前述实施例更加完善的产品推荐方法。其中,步骤S201、S204-S205和S208与图1的步骤S101-S104相同,这里就不再赘述。产品评分模型在建立后,需要应用在实际产品推荐中,所以在产品推荐前还需要对待预测集进行准备和筛选,以筛选出合适优质的产品进行推荐。步骤S202-S203是对建模过程的进一步优化,而步骤S206-S207是对待预测集的准备和筛选。
在步骤S202中,在获取到用户的历史交易数据后,建立样本集并对其进行数据预处理。数据预处理包含缺失数据处理、缺失数据处理,可以选择直接舍弃该条记录,或者按照均值进行填充。从而得到优质的样本集。
在步骤S203中,获取目标用户在固定时间段(例如近半年)内的所有产品交易行为记录,对时间段的选择是为了确保最后预测出的时间区间能更符合用户近期的行为习惯。然后对所有产品交易行为记录进行时间间隔分析,分析每一次交易的时间间隔,预测出用户习惯的交易时间间隔。根据最后一次产品交易时间间隔和预测的时间间隔预测用户下一次可能下单或购买产品的时间段,得到适合向用户推荐的时间区间。从而实现根据历史交易数据预测出向目标用户进行产品推荐的时间区间,在此时间区间内向用户推荐产品可以提升转化率。本步骤中对适合向用户推荐的时间区间进行了预测,且是根据用户的历史交易数据得到的时间区间,较为符合用户的交易习惯,能为用户提供更贴心便利的产品推荐。
在步骤S206中,通过建立多维度的召回策略进行产品召回,多维度的产品召回方式包括:基于多维度用户属性与产品属性的产品召回、基于历史交易数据的产品召回、基于用户持仓的产品召回、基于用户自选的产品召回、基于用户APP搜索的产品召回和基于模型算法(关联规则,协调过滤)的产品召回。经过召回优选和策略控制后,为用户召回相关产品,作为待预测集。该待预测集中的产品与用户息息相关,作为待推荐产品更能符合用户的实际需求。
在步骤S207中,针对上一步骤中召回的多款产品,还需要通过产品属性特征进行一轮产品的优胜劣汰,剔除劣质的产品,主要是根据现有产品的盈亏状况以及市场行情等进行分析,为用户推荐收益较高、热度较高的多项产品,筛除明显收益亏损的产品。例如,对于证券类持仓用户,根据现有盈亏情况对召回的结果进行一定程度的调整,增加召回的合理性。根据用户当前实际盈亏情况调整推荐产品,亏损用户更多推荐固定收益类或低风险类产品,引导用户减少损失。考虑行情因素对用户操作行为的影响,在行情变动时对召回的产品数量进行一定程度的调整,来适应行情变化。主要把行情因子加入模型训练,根据用户交易行为与行情的相关性实现在不同行情下的差异化推荐。另外也需要综合考虑行情变动与用户盈亏的关系,针对不同的情况设置不同的策略,满足多方面的推荐需求。在这一步骤中对待预测集中的产品数量和质量进行调整,以向用户推荐优质产品。
进一步地,本实施例还包括:根据评分模型获得得分最高的N款产品,从产品推荐池中选择出相似度最高的N款产品,在时间区间内推荐给目标用户,N为大于0的自然数。
本步骤中,在根据评分模型得到评分最高的多款产品后,可以不直接向用户推荐,而是从待推荐的产品推荐池中选择出与评分最高的产品相似度最高的N款产品进行推荐,N为大于0的自然数。那么,不仅可以向用户推荐之前接触过的产品,还可以向其推荐新的类似产品,更为符合用户的习惯,提升推荐的多样性和准确性,提升用户体验。
在本发明实施例中,对产品推荐方法进行了进一步优化,通过建立多维度召回策略,经过产品优选和策略控制后召回产品,从而精准推荐相关产品,投放给用户,引导用户选取并完成转化。得到的推荐产品更为符合用户的使用习惯和交易状况,那么,推荐的基金产品是用户能够合理选取的产品,更能提升用户的使用体验,也能提高推荐的转化率。
图5示出了根据本发明实施例的产品推荐方法中待预测集的组成示意图。
图5示出了图4的步骤S206中待预测集的组成示意图,如图5,多维度的产品召回策略包括:基于多维度客群热度产品和优选品以及用户画像匹配产品画像的产品召回策略、用户历史交易数据的产品召回策略、用户产品持仓相关的召回策略、用户自选产品相关的召回策略、用户APP搜索相关产品的召回策略、大数据模型策略(根据购买、持仓、自选、规则等多召回)和基于项目、用户的协同过滤召回策略。通过这些多维度的产品召回,其召回结果作为待预测集。
图6示出了根据本发明实施例的产品推荐***的结构示意图。
该产品推荐***600包括目标样本集获取单元601、特征构建单元602、模型建立单元603和推荐单元604。样本集获取单元601用于获取目标用户的历史交易数据以建立样本集,样本集包括训练集和验证集;特征构建单元602用于从历史交易数据中提取出目标用户的多个用户属性特征和多个产品属性特征形成组合特征;模型建立单元603用于以训练集和组合特征为基础建立多个评估模型,由测试集从中筛选出一个评估模型作为产品评分模型;推荐单元604用于根据产品评分模型对待预测集中的多款产品进行评分和排序,筛选出待推荐产品在待推荐时间区间内推荐给目标用户。样本集包括目标用户和已推荐产品之间的关联关系,产品评分模型表征目标用户和待推荐产品之间的关联度。
进一步地,产品推荐***600还包括:产品召回单元(图中未示出)和调整单元(图中未示出),产品召回单元用于通过多维度的产品召回方式进行产品召回,组成待预测集;调整单元用于根据产品的热度和转化率对待预测集中的产品数量进行调整。
在本实施例中,产品推荐***600通过样本集获取单元601获取样本集,通过特征构建单元602获取相应的用户和产品特征,再由模型建立单元603根据样本集和组合特征建立产品评分模型,再据此选出评分较高的产品由推荐单元604在合适的时间区间内推荐给目标用户。从而可以为合适的有能力的用户进行产品推荐,并且能按照用户的习惯和喜好向用户推荐产品,不仅可以自动挖掘***,还可以利用机器学习的算法为用户推荐相关性高的产品,提高推荐的准确度以及推荐转化率。
图7示出了采用本发明实施例的产品推荐方法前后产品的转化率的示意图。
如图7所示,曲线图的横坐标表示时间,纵坐标表示产品的转化率。图7中示出了实际应用中产品在2020年6月至2021年5月的一部分转化率,作为示例。在这段时间内,对产品采取了不同的推荐策略,例如从模型上线至实时推荐的过程,转化率逐渐升高。
最初模型上线,根据大数据得到推荐模型,主要根据用户的交易偏好优化了产品推荐池,引导用户完成优化,这一阶段的推荐模型与用户具有一定的匹配度,转化率最好达到了0.43%。之后进行了特征构建和客群分层,基于客群行为特征的精准描述,按照用户生命周期模型,将客群细分,对应本发明的产品推荐方法中对组合特征的构建,这一阶段的转化率可以达到0.73%。之后又进行了指标分析,基于全流程的数据驱动理念,优化产品转化分析指标体系,主要包括分析模型、监测指标、效果分析和得出分析报告等,可以理解为对模型的筛选,这一阶段转化率达到了0.60%。之后采用图4的产品推荐方法,对模型进行优化,主要是优化新老用户的召回和排序模型,根据反馈数据控制召回策略,丰富召回分支策略的排序算法,引导用户精准完成转化,这一阶段由于执行了召回策略,丰富了推荐池,转化率达到0.73%。接着,加入了行情因素的分析和控制,主要把行情因子加入模型训练,根据用户交易行为与行情的相关性实现不同净值用户在不同行情下的表现进行差异化推荐,加入了行情因子的模型更为贴合实际,产品转化率高达0.91%。之后,再实行盈亏控制,根据用户当前实际盈亏情况调整推荐策略,亏损用户更多推荐货基或固收类理财产品,引导用户减少损失,这一阶段的转化率大概为0.67%。最后综合上述各类方法,根据集合了组合特征、模型优化、行情控制和盈亏控制的产品推荐模型进行实时推荐,因为最终的模型综合了上述多个方案的共同有点,转化率得到了显著提升,达到了1.2%。
图7示出的即是上述图4汇总的产品推荐方法在实施一段时间后实际能达到的转化率的示意图,目前采用该产品推荐方法进行产品推荐比之前的产品转化率显著提升。因此,通过本发明的产品推荐方法,不仅可以通过多策略为客户召回相关产品,还可以利用机器学习的算法为用户推荐匹配度高的产品,提高推荐的准确度。
图8示出了根据本发明实施例的产品推荐装置的结构图。图8示出的设备仅仅是一个示例,不应对本发明实施例的功能和使用范围构成任何限制。
参考图8,该产品推荐装置800包括通过总线连接的处理器801、存储器802和输入输出设备803。存储器802包括只读存储器(ROM)和随机访问存储器(RAM),存储器802内存储有执行***功能所需的各种计算机指令和数据,处理器801从存储器802中读取各种计算机指令以执行各种适当的动作和处理。输入输出设备包括键盘、鼠标等的输入部分;包括诸如阴极射线管(CRT)、液晶显示器(LCD)等以及扬声器等的输出部分;包括硬盘等的存储部分;以及包括诸如LAN卡、调制解调器等的网络接口卡的通信部分。存储器802还存储有以下的计算机指令以完成本发明实施例的产品推荐方法规定的操作:获取目标用户的历史交易数据以建立样本集,样本集包括训练集和验证集;从历史交易数据中提取出目标用户的多个用户属性特征和多个产品属性特征形成组合特征;以训练集和组合特征为基础建立多个评估模型,由测试集从中筛选出一个评估模型作为产品评分模型;以及根据产品评分模型对待预测集中的多款产品进行评分和排序,筛选出待推荐产品在待推荐时间区间内推荐给目标用户。
相应地,本发明实施例提供一种计算机可读存储介质,该计算机可读存储介质存储有计算机指令,所述计算机指令被执行时实现上述产品推荐方法所规定的操作。
附图中的流程图、框图图示了本发明实施例的***、方法、装置的可能的体系框架、功能和操作,流程图和框图上的方框可以代表一个模块、程序段或仅仅是一段代码,所述模块、程序段和代码都是用来实现规定逻辑功能的可执行指令。也应当注意,所述实现规定逻辑功能的可执行指令可以重新组合,从而生成新的模块和程序段。因此附图的方框以及方框顺序只是用来更好的图示实施例的过程和步骤,而不应以此作为对发明本身的限制。
***的各个模块或单元可以通过硬件、固件或软件实现。软件例如包括采用JAVA、C/C++/C#、SQL等各种编程语言形成的编码程序。虽然在方法以及方法图例中给出本发明实施例的步骤以及步骤的顺序,但是所述步骤实现规定的逻辑功能的可执行指令可以重新组合,从而生成新的步骤。所述步骤的顺序也不应该仅仅局限于所述方法以及方法图例中的步骤顺序,可以根据功能的需要随时进行调整。例如将其中的某些步骤并行或按照相反顺序执行。
根据本发明的***和方法可以部署在单个或多个服务器上。例如,可以将不同的模块分别部署在不同的服务器上,形成专用服务器。或者,可以在多个服务器上分布式部署相同的功能单元、模块或***,以减轻负载压力。所述服务器包括但不限于在同一个局域网以及通过Internet连接的多个PC机、PC服务器、刀片机、超级计算机等。
以上所述仅为本发明的优选实施例,并不用于限制本发明,对于本领域技术人员而言,本发明可以有各种改动和变化。凡在本发明的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (16)

1.一种产品推荐方法,其特征在于,包括:
获取目标用户的历史交易数据以建立样本集,所述样本集包括训练集和验证集;
从所述历史交易数据中提取出所述目标用户的多个用户属性特征和多个产品属性特征形成组合特征;
以所述训练集和所述组合特征为基础建立多个评估模型,由所述测试集从中筛选出一个评估模型作为产品评分模型;以及
根据所述产品评分模型对待预测集中的多款产品进行评分和排序,筛选出待推荐产品在待推荐时间区间内推荐给所述目标用户。
2.根据权利要求1所述的产品推荐方法,其特征在于,在根据所述产品评分模型对待预测集中的多款产品进行评分和排序,筛选出待推荐产品在待推荐时间区间内推荐给所述目标用户的步骤之前还包括:
通过多维度的产品召回方式进行产品召回,组成所述待预测集;
根据所述产品的热度和转化率对所述待预测集中的产品数量进行调整。
3.根据权利要求1所述的产品推荐方法,其特征在于,在获取目标用户的历史交易数据以建立样本集,所述样本集包括训练集和验证集的步骤之后还包括:
对所述样本集进行数据预处理,舍弃无效数据;
根据所述历史交易数据进行时间间隔分析,预测出向所述目标用户进行推荐的待推荐时间区间。
4.根据权利要求1所述的产品推荐方法,其特征在于,所述样本集包括正样本数据和负样本数据,所述正样本数据为向所述目标用户推荐过且已完成交易的产品数据,所述负样本数据为向所述目标用户推荐过但未被交易的产品数据。
5.根据权利要求1所述的产品推荐方法,其特征在于,所述多个用户属性特征包括基本信息特征、资产特征、业务开通特征、交易行为特征和APP行为特征;所述多个产品属性特征包括产品类型特征、产品经理经验水平特征、产品排名特征、产品收益能力特征、风险控制能力特征和产品热度特征。
6.根据权利要求1所述的产品推荐方法,其特征在于,采用GBDT模型或LR模型建立多个所述评估模型。
7.根据权利要求4所述的产品推荐方法,其特征在于,所述样本集包括所述目标用户和所述已推荐产品之间的关联关系,所述产品评分模型表征所述目标用户和所述待推荐产品之间的关联度。
8.根据权利要求1所述的产品推荐方法,其特征在于,以所述训练集和所述组合特征为基础建立多个评估模型,由所述测试集从中筛选出一个评估模型作为产品评分模型的步骤包括:
根据所述训练集建立评估模型;
将不同类型的所述组合特征分别作为参数加入所述评估模型中,得到多个所述评估模型;
根据所述测试集对多个所述评估模型进行测试,筛选出符合预期模型效果的评估模型作为产品评分模型。
9.根据权利要求1所述的产品推荐方法,其特征在于,采用固定的比例或采用多折交叉验证方法将所述样本集划分为所述训练集和所述验证集。
10.根据权利要求2所述的产品推荐方法,其特征在于,所述多维度的产品召回方式包括:基于多维度用户属性与产品属性的产品召回、基于历史交易数据的产品召回、基于用户持仓的产品召回、基于用户自选的产品召回、基于用户APP搜索的产品召回和基于模型算法的产品召回。
11.根据权利要求1所述的产品推荐方法,其特征在于,根据所述产品评分模型对待预测集中的多款产品进行评分和排序,筛选出待推荐产品在待推荐时间区间内推荐给所述目标用户的步骤包括:
将所述待预测集中的所述产品依次输入所述产品评分模型中,得到每款所述产品的评分;
筛选出得分最高的N款产品推荐给所述目标用户,N为大于0的自然数。
12.一种产品推荐***,其特征在于,包括:
样本集获取单元,用于获取目标用户的历史交易数据以建立样本集,所述样本集包括训练集和验证集;
特征构建单元,用于从所述历史交易数据中提取出所述目标用户的多个用户属性特征和多个产品属性特征形成组合特征;
模型建立单元,用于以所述训练集和所述组合特征为基础建立多个评估模型,由所述测试集从中筛选出一个评估模型作为产品评分模型;以及
推荐单元,用于根据所述产品评分模型对待预测集中的多款产品进行评分和排序,筛选出待推荐产品在待推荐时间区间内推荐给所述目标用户。
13.根据权利要求12所述的产品推荐***,其特征在于,还包括:
产品召回单元,用于通过多维度的产品召回方式进行产品召回,组成所述待预测集;
调整单元,用于根据所述产品的热度和转化率对所述待预测集中的产品数量进行调整。
14.根据权利要求12所述的产品推荐***,其特征在于,所述样本集包括所述目标用户和所述已推荐产品之间的关联关系,所述产品评分模型表征所述目标用户和所述待推荐产品之间的关联度。
15.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机指令,所述计算机指令被执行时实现如权利要求1至11中任一项所述的产品推荐方法。
16.一种产品推荐装置,其特征在于,包括:
存储器,用于存储计算机指令;
处理器,耦合到所述存储器,所述处理器被配置为基于所述存储器存储的计算机指令执行实现如权利要求1至11中任一项所述的产品推荐方法。
CN202111078658.0A 2021-09-15 2021-09-15 产品推荐方法、产品推荐***和计算机可读存储介质 Pending CN113869973A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111078658.0A CN113869973A (zh) 2021-09-15 2021-09-15 产品推荐方法、产品推荐***和计算机可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111078658.0A CN113869973A (zh) 2021-09-15 2021-09-15 产品推荐方法、产品推荐***和计算机可读存储介质

Publications (1)

Publication Number Publication Date
CN113869973A true CN113869973A (zh) 2021-12-31

Family

ID=78995914

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111078658.0A Pending CN113869973A (zh) 2021-09-15 2021-09-15 产品推荐方法、产品推荐***和计算机可读存储介质

Country Status (1)

Country Link
CN (1) CN113869973A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114693307A (zh) * 2022-05-30 2022-07-01 深圳市泰铼科技有限公司 一种证券期货程序化交易策略风险压力测试***

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106127525A (zh) * 2016-06-27 2016-11-16 浙江大学 一种基于分类算法的电视购物商品推荐方法
CN108182621A (zh) * 2017-12-07 2018-06-19 合肥美的智能科技有限公司 商品推荐方法及商品推荐装置、设备和存储介质
CN108416625A (zh) * 2018-02-28 2018-08-17 阿里巴巴集团控股有限公司 营销产品的推荐方法和装置
CN108776922A (zh) * 2018-06-04 2018-11-09 北京至信普林科技有限公司 基于大数据的理财产品推荐方法及装置
CN110335064A (zh) * 2019-06-05 2019-10-15 平安科技(深圳)有限公司 产品推送方法、装置、计算机设备和存储介质
CN110555717A (zh) * 2019-07-29 2019-12-10 华南理工大学 基于用户行为特征挖掘用户潜在购买商品和品类的方法
CN111179031A (zh) * 2019-12-23 2020-05-19 第四范式(北京)技术有限公司 一种商品推荐模型的训练方法、装置及***
CN111523976A (zh) * 2020-04-23 2020-08-11 京东数字科技控股有限公司 商品推荐方法、装置、电子设备及存储介质
CN112150206A (zh) * 2020-09-28 2020-12-29 京东数字科技控股股份有限公司 用户感兴趣物品的预测方法及设备

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106127525A (zh) * 2016-06-27 2016-11-16 浙江大学 一种基于分类算法的电视购物商品推荐方法
CN108182621A (zh) * 2017-12-07 2018-06-19 合肥美的智能科技有限公司 商品推荐方法及商品推荐装置、设备和存储介质
CN108416625A (zh) * 2018-02-28 2018-08-17 阿里巴巴集团控股有限公司 营销产品的推荐方法和装置
CN108776922A (zh) * 2018-06-04 2018-11-09 北京至信普林科技有限公司 基于大数据的理财产品推荐方法及装置
CN110335064A (zh) * 2019-06-05 2019-10-15 平安科技(深圳)有限公司 产品推送方法、装置、计算机设备和存储介质
CN110555717A (zh) * 2019-07-29 2019-12-10 华南理工大学 基于用户行为特征挖掘用户潜在购买商品和品类的方法
CN111179031A (zh) * 2019-12-23 2020-05-19 第四范式(北京)技术有限公司 一种商品推荐模型的训练方法、装置及***
CN111523976A (zh) * 2020-04-23 2020-08-11 京东数字科技控股有限公司 商品推荐方法、装置、电子设备及存储介质
CN112150206A (zh) * 2020-09-28 2020-12-29 京东数字科技控股股份有限公司 用户感兴趣物品的预测方法及设备

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114693307A (zh) * 2022-05-30 2022-07-01 深圳市泰铼科技有限公司 一种证券期货程序化交易策略风险压力测试***
CN114693307B (zh) * 2022-05-30 2022-09-02 深圳市泰铼科技有限公司 一种证券期货程序化交易策略风险压力测试***

Similar Documents

Publication Publication Date Title
CN108564286B (zh) 一种基于大数据征信的人工智能金融风控授信评定方法和***
CN110837931B (zh) 客户流失预测方法、装置及存储介质
US8751273B2 (en) Predictor variable selection and dimensionality reduction for a predictive model
US8170841B2 (en) Predictive model validation
US7725300B2 (en) Target profiling in predictive modeling
US7562058B2 (en) Predictive model management using a re-entrant process
US7933762B2 (en) Predictive model generation
CN105718490A (zh) 一种用于更新分类模型的方法及装置
EP1587008A2 (en) Automatic data view generation for a target variable
US7028036B2 (en) System and method for visualization of continuous attribute values
US11663839B1 (en) Polarity semantics engine analytics platform
US20050267852A1 (en) System and method for processing a large data set using a prediction model having a feature selection capability
CN112288455B (zh) 标签生成方法及装置、计算机可读存储介质、电子设备
CN110738527A (zh) 一种特征重要性排序方法、装置、设备和存储介质
Chang et al. Establishing decision tree-based short-term default credit risk assessment models
US11461343B1 (en) Prescriptive analytics platform and polarity analysis engine
CN113609193A (zh) 训练用于预测客户交易行为的预测模型的方法及装置
US11995667B2 (en) Systems and methods for business analytics model scoring and selection
CN114154672A (zh) 一种用于客户流失预测的数据挖掘方法
WO2007061649A2 (en) Method and system for analyzing effectiveness of compliance function
CN113869973A (zh) 产品推荐方法、产品推荐***和计算机可读存储介质
CN117132383A (zh) 一种信贷数据处理方法、装置、设备及可读存储介质
CN114626940A (zh) 数据分析方法、装置及电子设备
CN114693428A (zh) 数据确定方法、装置、计算机可读存储介质及电子设备
CN113468437A (zh) 一种社群挖掘方法、装置、电子设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination