CN113762392A - 基于人工智能的理财产品推荐方法、装置、设备及介质 - Google Patents

基于人工智能的理财产品推荐方法、装置、设备及介质 Download PDF

Info

Publication number
CN113762392A
CN113762392A CN202111052153.7A CN202111052153A CN113762392A CN 113762392 A CN113762392 A CN 113762392A CN 202111052153 A CN202111052153 A CN 202111052153A CN 113762392 A CN113762392 A CN 113762392A
Authority
CN
China
Prior art keywords
product
financial
data
financing
historical
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202111052153.7A
Other languages
English (en)
Inventor
沈卫
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ping An Puhui Enterprise Management Co Ltd
Original Assignee
Ping An Puhui Enterprise Management Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ping An Puhui Enterprise Management Co Ltd filed Critical Ping An Puhui Enterprise Management Co Ltd
Priority to CN202111052153.7A priority Critical patent/CN113762392A/zh
Publication of CN113762392A publication Critical patent/CN113762392A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/243Classification techniques relating to the number of classes
    • G06F18/24323Tree-organised classifiers
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/06Asset management; Financial planning or analysis

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Business, Economics & Management (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Finance (AREA)
  • Accounting & Taxation (AREA)
  • Development Economics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Game Theory and Decision Science (AREA)
  • Human Resources & Organizations (AREA)
  • Operations Research (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Strategic Management (AREA)
  • Technology Law (AREA)
  • General Business, Economics & Management (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请为人工智能技术领域,本申请提供了一种基于人工智能的理财产品推荐方法、装置、设备及介质,其中,所述方法包括:构建历史理财数据与历史产品偏好信息的对应关系;根据对应关系,将具有相同历史产品偏好信息的历史理财数据划分在同一数据集,并组成训练集,从训练集中选取K个训练样本,并构建K个决策树模型,将各个训练样本分别输入至不同的决策树模型进行训练,得到训练好的K个决策树模型;利用训练好的K个决策树模型组成理财产品推荐模型;获取用户的理财数据,将理财数据输入理财产品推荐模型中,得到多个理财产品及产品偏好值,并从中筛选出目标理财产品推荐给用户,以实现精准推荐,推荐效果更好。

Description

基于人工智能的理财产品推荐方法、装置、设备及介质
技术领域
本申请涉及人工智能技术领域,具体而言,本申请涉及一种基于人工智能的理财产品推荐方法、装置、设备及介质。
背景技术
随着经济的发展和科技的进步,人们的理财意识逐渐增强,越来越多的人将闲置资金投入到金融理财产品中。银行、基金公司等金融机构,为了向用户推销自己的理财产品,常常重点选择购买理财产品意愿较强的用户进行定向推荐,以提高产品推荐的效果。
为了能更好地了解用户的购买意愿,理财平台常常根据其所掌握的用户信息对用户进行评估,对评估出的购买理财产品意愿较强的用户进行理财产品的推荐。但是,目前理财平台在对用户进行推荐时,一般只推荐当前比较热门的一些理财产品,推荐的理财产品过于单一化,而且比较固定,推荐的效果较差。
发明内容
本申请的主要目的为提供一种基于人工智能的理财产品推荐方法、装置、设备及介质,以提高理财产品的推荐效果。
为了实现上述发明目的,本申请提供一种基于人工智能的理财产品推荐方法,其包括以下步骤:
获取预设时间段内用户的历史理财数据及历史产品偏好信息,并构建所述历史理财数据与所述历史产品偏好信息的对应关系;
根据所述对应关系,将具有相同历史产品偏好信息的历史理财数据划分在同一数据集,并将所有的数据集以及与所述数据集对应的历史产品偏好信息作为训练样本组成训练集;
从所述训练集中选取K个训练样本,并构建K个决策树模型,将各个所述训练样本分别输入至不同的决策树模型进行训练,得到训练好的K个决策树模型,K为正整数;
利用训练好的所述K个决策树模型组成理财产品推荐模型;
获取用户的理财数据,将所述理财数据输入所述理财产品推荐模型中,得到多个理财产品及每个所述理财产品对应的产品偏好值;
根据所述产品偏好值从所述理财产品中筛选出目标理财产品,将所述目标理财产品推荐给用户。
优选地,所述根据所述产品偏好值从所述理财产品中筛选出目标理财产品,包括:
获取时事热点信息,提取所述时事热点信息的第一关键词,并提取每个所述理财产品的第二关键词;
计算所述第一关键词与每个所述理财产品的第二关键词的相似度值,将相似度值大于预设相似度阈值的第二关键词作为目标关键词;
将所述目标关键词对应的理财产品作为所述目标理财产品。
优选地,所述第一关键词包括多个,所述计算所述第一关键词与每个所述理财产品的第二关键词的相似度值,包括:
利用预先训练好的Word2Vec词向量模型将多个所述第一关键词分别转换为词向量,并计算多个所述第一关键词的词向量的平均值,得到第一词向量;
利用所述Word2Vec词向量模型将每个所述理财产品的第二关键词转换为词向量,得到每个所述理财产品的第二词向量;
计算所述第一词向量与每个所述理财产品的第二词向量的余弦距离作为所述相似度值。
优选地,所述得到训练好的K个决策树模型,包括:
利用预设的损失函数分别计算训练后的每个决策树模型的损失值;
判断所述每个决策树模型的损失值是否都低于预设损失值;
若是,则判定所述K个决策树模型完成训练。
优选地,所述根据所述产品偏好值从所述理财产品中筛选出目标理财产品,包括:
按照所述产品偏好值的从大小的顺序对所述理财产品进行排序;
将排在前N位的所述理财产品作为目标理财产品;其中,所述N为正整数。
优选地,所述获取预设时间段内用户的历史理财数据,包括:
通过爬取工具抓取所述用户在预设时间段内已浏览的理财页面;
采用预设的正则表达式对所述理财页面中的信息进行提取,得到目标信息;
对所述目标信息进行解析后,得到所述历史理财数据。
优选地,所述得到所述历史理财数据,包括:
将解析后的目标信息分割为多个子数据块,并根据数据结构分别为每个子数据块分配唯一的标识符;
遍历所有标识符,对应各个标识符保留唯一一个数据块,去除其他具有相同标识符的数据块,得到去除重复数据的历史理财数据。
本申请还提供一种基于人工智能的理财产品推荐装置,其包括:
获取模块,用于获取预设时间段内用户的历史理财数据及历史产品偏好信息,并构建所述历史理财数据与所述历史产品偏好信息的对应关系;
划分模块,用于根据所述对应关系,将具有相同历史产品偏好信息的历史理财数据划分在同一数据集,并将所有的数据集以及与所述数据集对应的历史产品偏好信息作为训练样本组成训练集;
训练模块,用于从所述训练集中选取K个训练样本,并构建K个决策树模型,将各个所述训练样本分别输入至不同的决策树模型进行训练,得到训练好的K个决策树模型,K为正整数;
组成模块,用于利用训练好的所述K个决策树模型组成理财产品推荐模型;
输入模块,用于获取用户的理财数据,将所述理财数据输入所述理财产品推荐模型中,得到多个理财产品及每个所述理财产品对应的产品偏好值;
推荐模块,用于根据所述产品偏好值从所述理财产品中筛选出目标理财产品,将所述目标理财产品推荐给用户。
本申请还提供一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现上述任一项所述方法的步骤。
本申请还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,该计算机程序被处理器执行时实现上述任一项所述方法的步骤。
本申请所提供的一种基于人工智能的理财产品推荐方法、装置、设备及介质,通过获取预设时间段内用户的历史理财数据及历史产品偏好信息,构建历史理财数据与历史产品偏好信息的对应关系;根据所述对应关系,将具有相同历史产品偏好信息的历史理财数据划分在同一数据集,并将所有的数据集以及与所述数据集对应的历史产品偏好信息作为训练样本组成训练集,从训练集中选取K个训练样本,并构建K个决策树模型,将各个训练样本分别输入至不同的决策树模型进行训练,得到训练好的K个决策树模型;利用训练好的K个决策树模型组成理财产品推荐模型;获取用户的理财数据,将理财数据输入理财产品推荐模型中,得到多个理财产品及每个理财产品对应的产品偏好值;根据产品偏好值从理财产品中筛选出目标理财产品,将目标理财产品推荐给用户。本申请通过对历史理财数据基于所反映的历史产品偏好信息进行分类,利用每类的历史理财数据对应训练一个决策树模型,实现独立训练,提高训练效率,并利用单独训练好的决策树分类模型组合得到理财产品推荐模型,使生成的理财产品推荐模型具有更佳地训练结果,提高理财产品的推荐精度;同时基于理财产品推荐模型输出的产品偏好值对理财产品进行筛选,以筛选出适合用户的理财产品,实现精准推荐,推荐效果更好。
附图说明
图1为本申请一实施例的基于人工智能的理财产品推荐方法的流程示意图;
图2为本申请一实施例的基于人工智能的理财产品推荐装置的结构示意框图;
图3为本申请一实施例的计算机设备的结构示意框图。
本申请目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
本申请实施例可以基于人工智能技术对相关的数据进行获取和处理。其中,人工智能(Artificial Intelligence,AI)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用***。
人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互***、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、机器人技术、生物识别技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等几大方向。
参考图1,本申请提出一种基于人工智能的理财产品推荐方法,以服务器为执行主体,服务器可以是独立的服务器,也可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、内容分发网络(Content DeliveryNetwork,CDN)、以及大数据和人工智能平台等基础云计算服务的云服务器。
本申请中,该基于人工智能的理财产品推荐方法用于提高理财产品的推荐效果,参照图1,其中一个实施例中,该基于人工智能的理财产品推荐方法包括如下步骤:
S11、获取预设时间段内用户的历史理财数据及历史产品偏好信息,并构建所述历史理财数据与所述历史产品偏好信息的对应关系;
S12、根据所述对应关系,将具有相同历史产品偏好信息的历史理财数据划分在同一数据集,并将所有的数据集以及与所述数据集对应的历史产品偏好信息作为训练样本组成训练集;
S13、从所述训练集中选取K个训练样本,并构建K个决策树模型,将各个所述训练样本分别输入至不同的决策树模型进行训练,得到训练好的K个决策树模型,K为正整数;
S14、利用训练好的所述K个决策树模型组成理财产品推荐模型;
S15、获取用户的理财数据,将所述理财数据输入所述理财产品推荐模型中,得到多个理财产品及每个所述理财产品对应的产品偏好值;
S16、根据所述产品偏好值从所述理财产品中筛选出目标理财产品,将所述目标理财产品推荐给用户。
如上述步骤S11所述,历史理财数据可包括年龄、收入、婚姻状况、学历、资产级别、理财产品类型、风险等级、投资期限、起投金额、收益率等等。历史产品偏好信息包括喜好投资基金、股票或债券等等行为数据。
构建历史理财数据与历史产品偏好信息的对应关系是为了对历史理财数据进行更好的划分,例如,当基于历史理财数据分析得到在用户的理财产品中,理财产品类型为债券的占比最大,则表明该用户的历史产品偏好信息为喜欢投资债券,属于稳健型,对应的历史理财数据则是关于债券的数据,包括债券的投资金额、持有时间等等。
如上述步骤S12所述,本实施例基于该对应关系对历史理财数据进行归类,将具有相同历史产品偏好信息的历史理财数据划分在同一数据集,并将所有的数据集以及与所述数据集对应的历史产品偏好信息作为训练样本组成训练集。例如,将属于喜欢投资债券的所有关于债券投资的数据划分在一个数据集中,并将同一个数据集及对应的历史产品偏好信息作为一个训练样本,将多个训练样本组成训练集,并进行保存。
如上述步骤S13所述,本实施例可使用机器学习模型算法,对理财产品进行推荐匹配,满足核心的业务目标。在进行推荐前,需要训练得到理财产品推荐模型。具体的,可利用决策树模型对训练集进行分类学习,挖掘真实客户购买理财产品的规律及相应的产品偏好值,并建立两者的映射关系,最终生成相应的理财产品推荐模型。例如,可以从训练集中随机抽取K个训练样本,同时也构建K个决策树模型,每个决策树模型输入唯一的一个训练样本,且每个训练样本的历史理财数据的数据量都足够多,以对相应的决策树模型进行多次训练,以得到训练好的决策树模型,训练得到的每个决策树模型可基于理财数据对应识别出一种产品偏好信息,以通过分别训练的方式得到推荐效果更好的理财产品推荐模型,并通过独立训练的方式,可实现在同一时间段进行训练,提高训练效率。
如上述步骤S14所述,可将K个决策树分类模型进行随机组合,得到训练好的理财产品推荐模型,例如,可以将K个决策树分类模型进行拼接,组合成为训练好的理财产品推荐模型,或选取K个决策树分类模型中的任意至少两个进行拼接,组合成为训练好的理财产品推荐模型,从而使利用单独训练好的决策树分类模型组合得到的产品推荐模型具有更佳地训练结果,提高理财产品的推荐精度。
如上述步骤S15-S16所述,本申请的理财产品推荐模型还可基于历史产品偏好信息计算每种理财产品的产品偏好值,该产品偏好值用于评估用户对理财产品的喜好程度。因此理财产品推荐模型除了可以输出需要推荐的理财产品之外,还输出每个理财产品对应的产品偏好值。具体的,本步骤获取需要推荐理财产品的用户的理财数据,将理财数据输入训练好的理财产品推荐模型中,得到多个理财产品及每个理财产品对应的产品偏好值,然后根据产品偏好值从理财产品中筛选出目标理财产品,将目标理财产品推荐给用户。例如,筛选出产品偏好值最高的理财产品作为目标理财产品,将目标理财产品推荐给用户。
本申请所提供的一种基于人工智能的理财产品推荐方法,通过获取预设时间段内用户的历史理财数据及历史产品偏好信息,构建历史理财数据与历史产品偏好信息的对应关系;根据所述对应关系,将具有相同历史产品偏好信息的历史理财数据划分在同一数据集,并将所有的数据集以及与所述数据集对应的历史产品偏好信息作为训练样本组成训练集,从训练集中选取K个训练样本,并构建K个决策树模型,将各个训练样本分别输入至不同的决策树模型进行训练,得到训练好的K个决策树模型;利用训练好的K个决策树模型组成理财产品推荐模型;获取用户的理财数据,将理财数据输入理财产品推荐模型中,得到多个理财产品及每个理财产品对应的产品偏好值;根据产品偏好值从理财产品中筛选出目标理财产品,将目标理财产品推荐给用户。本申请通过对历史理财数据基于所反映的历史产品偏好信息进行分类,利用每类的历史理财数据对应训练一个决策树模型,实现独立训练,提高训练效率,并利用单独训练好的决策树分类模型组合得到理财产品推荐模型,使生成的理财产品推荐模型具有更佳地训练结果,提高理财产品的推荐精度;同时基于理财产品推荐模型输出的产品偏好值对理财产品进行筛选,以筛选出适合用户的理财产品,实现精准推荐,推荐效果更好。
在一实施例中,在步骤S16中,所述根据所述产品偏好值从所述理财产品中筛选出目标理财产品,可具体包括:
S161、获取时事热点信息,提取所述时事热点信息的第一关键词,并提取每个所述理财产品的第二关键词;
S162、计算所述第一关键词与每个所述理财产品的第二关键词的相似度值,将相似度值大于预设相似度阈值的第二关键词作为目标关键词;
S163、将所述目标关键词对应的理财产品作为所述目标理财产品。
S164、推荐给用户的理财产品可能会有很多很多,全部推荐给用户显然并不合理,因此需要终端结合热点题材,热点产品做出加权重的排行,根据打分结果分页推荐给用户。
具体的,本实施例从各个理财网站中获取与理财相关的时事热点信息,对时事热点信息进行分词,以提取时事热点信息的所有关键词,得到第一关键词,并提取每个所述理财产品的描述信息,该描述信息为对理财产品的简单描述,然后对描述信息进行分词,以提取每个所述理财产品的所有关键词,得到第二关键词,分别将第一关键词转换为词向量,得到第一词向量,同时将第二关键词转换为词向量,得到第二词向量,计算第一词向量与第二词向量的余弦距离,将余弦距离作为所述第一关键词与每个所述理财产品的第二关键词的相似度值,然后将相似度值大于预设相似度阈值的第二关键词作为目标关键词,将目标关键词对应的理财产品作为目标理财产品,从而筛选出符合时事热点的目标理财产品,并将该目标理财产品推荐给用户,提高推荐的时效性。
在一实施例中,所述第一关键词包括多个,在步骤S162中,所述计算所述第一关键词与每个所述理财产品的第二关键词的相似度值,可具体包括:
S1621、利用预先训练好的Word2Vec词向量模型将多个所述第一关键词分别转换为词向量,并计算多个所述第一关键词的词向量的平均值,得到第一词向量;
S1622、利用所述Word2Vec词向量模型将每个所述理财产品的第二关键词转换为词向量,得到每个所述理财产品的第二词向量;
S1623、计算所述第一词向量与每个所述理财产品的第二词向量的余弦距离作为所述相似度值。
本实施例利用预先训练好的Word2Vec词向量模型将该多个第一关键词分别转换为词向量,得到各个第一关键词对应的词向量,并将所有第一关键词的词向量的平均值作为第一词向量;同时将第二关键词转换为词向量,得到第二词向量,计算第一词向量与第二词向量的余弦距离,将余弦距离作为所述第一关键词与每个所述理财产品的第二关键词的相似度值,以精确地计算第一关键词与每个所述理财产品的第二关键词的相似度值。
其中,Word2Vec词向量模型是从大量文本中学习语义知识的一种模型,采用无监督的方式。其通过训练大量文本,将文本中的词用向量形式表示,这个向量我们称之为词向量,可以通过计算两个词的词向量之间的距离,从而得知两个词之间的联系。
在一实施例中,所述得到训练好的K个决策树模型,可具体包括:
利用预设的损失函数分别计算训练后的每个决策树模型的损失值;
判断所述每个决策树模型的损失值是否都低于预设损失值;
若是,则判定所述K个决策树模型完成训练。
在本实施例中,在对决策树模型每次训练后,可利用预设的损失函数计算每次训练完成后的决策树模型的损失值,并在损失值满足预设阈值或小于预设损失值时,即满足要求,则表明决策树模型达到训练要求,完成所述决策树模型的训练,以提高理财产品推荐模型的推荐精度。
当任一个决策树模型的损失值不小于预设损失值时,可根据损失值在决策树模型的神经网络结构中进行前向传递,调整决策树模型的相关参数,基于重新设置的相关参数对调整后的决策树模型进行重新训练,并计算再次训练,直至所有决策树模型的损失值都小于预设损失值为止后的损失值,直至损失值满足预设要求时,最终得到损失值满足预设阈值所对应的决策树模型的参数,至此所有决策树模型训练结束。
在一实施例中,所述根据所述产品偏好值从所述理财产品中筛选出目标理财产品,可具体包括:
按照所述产品偏好值的从大小的顺序对所述理财产品进行排序;
将排在前N位的所述理财产品作为目标理财产品;其中,所述N为正整数。
本实施例基于理财产品推荐模型输出的产品偏好值对理财产品进行排序,并在排序时,按照产品偏好值从大到小的顺序依次对所有理财产品进行排列,然后从所有理财产品中筛选出排在前N位的理财产品作为目标理财产品,以筛选出最适合用户的理财产品,如筛选出产品偏好值排在前三位的理财产品作为目标理财产品。其中,该产品偏好值用于预测该用户对输出的理财产品的偏好信息程度,产品偏好值越大,则表明该用户喜欢或适合该理财产品的概率越大。
在一实施例中,所述获取预设时间段内用户的历史理财数据,包括:
通过爬取工具抓取所述用户在预设时间段内已浏览的理财页面;
采用预设的正则表达式对所述理财页面中的信息进行提取,得到目标信息;
对所述目标信息进行解析后,得到所述历史理财数据。
理财页面是指与理财产品相关的网页,本实施例中的理财页面可以是财经类网站的网页,也可以是股票类网站的网页。具体地,可以通过read()方法读取理财页面的网址,向getHtml()函数传递一个网址,并把整个页面下载下来,得到理财页面。
其中,预设的正则表达式是一种字符串匹配和处理规则,用于提取网页中的信息。预设的正则表达式包括但不限于Python正则表达式。目标信息是指与正则表达式匹配的网页信息。该目标信息可以是理财产品的名称、收益或者产品类型等信息。
具体地,从理财页面中过滤与预设的正则表达式匹配的信息,然后提取该信息,进而得到目标信息,从而通过采用预设的正则表达式对理财页面中的信息进行提取,提高了目标信息的准确性。
在一实施例中,解析目标信息时,首先通过爬虫解析库中的解析模块对目标信息进行数据分析,再通过路径表达式提取解析后的目标信息,并将解析后的目标信息保存在数据库中,得到历史理财数据。其中,爬虫解析库可以是BeautifulSoup解析库,也可以是lxml解析库。可以理解地,通过解析目标信息,可以快速准确地获取到历史理财数据。
本实施例通过采用预设的正则表达式对理财网页中的信息进行提取,提高了目标信息的准确性;最后解析目标信息,得到历史理财数据,从而快速准确地获取到历史理财数据。
此外,用户登录到***页面,会提示用户注册身份,手机号等描述信息;用户的身份信息会有后台oracle数据库保存,以便于信息安全和后续的推荐消息等使用。***后台oracle数据库会记录出用户的浏览的产品id时长,关注的产品id,购买的产品id,撤单的产品id,生成理财产品数据,后续会取理财产品数据进行训练,将oracle每天的理财产品数据同步到大数据平台中,并且按日分区保存。
在一实施例中,所述得到所述历史理财数据,包括:
将解析后的目标信息分割为多个子数据块,并根据数据结构分别为每个子数据块分配唯一的标识符;
遍历所有标识符,对应各个标识符保留唯一一个数据块,去除其他具有相同标识符的数据块,得到去除重复数据的历史理财数据。
本实施例将解析后的目标信息分割为多个子数据块,每个子数据块的大小一致,并根据数据结构分别为每个子数据块分配唯一的标识符,该标识符用于区分不同的数据块,因此相同的数据块会有相同的标识符,然后利用标识符去除重复数据,以得到去除重复数据的历史理财数据。具体的,可遍历所有标识符,对应各个标识符保留唯一一个数据块,去除其他具有相同标识符的数据块。
其中,数据结构是指相互之间存在着一种或多种关系的数据元素的集合和该集合中数据元素之间的关系组成。常用的数据结构有:数组,栈,链表,队列,树,图,堆,散列表等等。
参照图2,本申请实施例中还提供一种基于人工智能的理财产品推荐装置,包括:
获取模块11,用于获取预设时间段内用户的历史理财数据及历史产品偏好信息,并构建所述历史理财数据与所述历史产品偏好信息的对应关系;
划分模块12,用于根据所述对应关系,将具有相同历史产品偏好信息的历史理财数据划分在同一数据集,并将所有的数据集以及与所述数据集对应的历史产品偏好信息作为训练样本组成训练集;
训练模块13,用于从所述训练集中选取K个训练样本,并构建K个决策树模型,将各个所述训练样本分别输入至不同的决策树模型进行训练,得到训练好的K个决策树模型,K为正整数;
组成模块14,用于利用训练好的所述K个决策树模型组成理财产品推荐模型;
输入模块15,用于获取用户的理财数据,将所述理财数据输入所述理财产品推荐模型中,得到多个理财产品及每个所述理财产品对应的产品偏好值;
推荐模块16,用于根据所述产品偏好值从所述理财产品中筛选出目标理财产品,将所述目标理财产品推荐给用户。
历史理财数据可包括年龄、收入、婚姻状况、学历、资产级别、理财产品类型、风险等级、投资期限、起投金额、收益率等等。历史产品偏好信息包括喜好投资基金、股票或债券等等行为数据。
构建历史理财数据与历史产品偏好信息的对应关系是为了对历史理财数据进行更好的划分,例如,当基于历史理财数据分析得到在用户的理财产品中,理财产品类型为债券的占比最大,则表明该用户的历史产品偏好信息为喜欢投资债券,属于稳健型,对应的历史理财数据则是关于债券的数据,包括债券的投资金额、持有时间等等。
本实施例基于该对应关系对历史理财数据进行归类,将具有相同历史产品偏好信息的历史理财数据划分在同一数据集,并将所有的数据集以及与所述数据集对应的历史产品偏好信息作为训练样本组成训练集。例如,将属于喜欢投资债券的所有关于债券投资的数据划分在一个数据集中,并将同一个数据集及对应的历史产品偏好信息作为一个训练样本,将多个训练样本组成训练集,并进行保存。
本实施例可使用机器学习模型算法,对理财产品进行推荐匹配,满足核心的业务目标。在进行推荐前,需要训练得到理财产品推荐模型。具体的,可利用决策树模型对训练集进行分类学习,挖掘真实客户购买理财产品的规律及相应的产品偏好值,并建立两者的映射关系,最终生成相应的理财产品推荐模型。例如,可以从训练集中随机抽取K个训练样本,同时也构建K个决策树模型,每个决策树模型输入唯一的一个训练样本,且每个训练样本的历史理财数据的数据量都足够多,以对相应的决策树模型进行多次训练,以得到训练好的决策树模型,训练得到的每个决策树模型可基于理财数据对应识别出一种产品偏好信息,以通过分别训练的方式得到推荐效果更好的理财产品推荐模型,并通过独立训练的方式,可实现在同一时间段进行训练,提高训练效率。
此外,可将K个决策树分类模型进行随机组合,得到训练好的理财产品推荐模型,例如,可以将K个决策树分类模型进行拼接,组合成为训练好的理财产品推荐模型,或选取K个决策树分类模型中的任意至少两个进行拼接,组合成为训练好的理财产品推荐模型,从而使利用单独训练好的决策树分类模型组合得到的产品推荐模型具有更佳地训练结果,提高理财产品的推荐精度。
本申请的理财产品推荐模型还可基于历史产品偏好信息计算每种理财产品的产品偏好值,该产品偏好值用于评估用户对理财产品的喜好程度。因此理财产品推荐模型除了可以输出需要推荐的理财产品之外,还输出每个理财产品对应的产品偏好值。具体的,本步骤获取需要推荐理财产品的用户的理财数据,将理财数据输入训练好的理财产品推荐模型中,得到多个理财产品及每个理财产品对应的产品偏好值,然后根据产品偏好值从理财产品中筛选出目标理财产品,将目标理财产品推荐给用户。例如,筛选出产品偏好值最高的理财产品作为目标理财产品,将目标理财产品推荐给用户。
如上所述,可以理解地,本申请中提出的所述基于人工智能的理财产品推荐装置的各组成部分可以实现如上所述基于人工智能的理财产品推荐方法任一项的功能,具体结构不再赘述。
参照图3,本申请实施例中还提供一种计算机设备,其内部结构可以如图3所示。该计算机设备包括通过***总线连接的处理器、存储器、网络接口和数据库。其中,该计算机设计的处理器用于提供计算和控制能力。该计算机设备的存储器包括存储介质、内存储器。该存储介质存储有操作***、计算机程序和数据库。该内存器为存储介质中的操作***和计算机程序的运行提供环境。该计算机设备的数据库用于存储历史理财数据、历史产品偏好信息等数据。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种基于人工智能的理财产品推荐方法。
上述处理器执行上述的基于人工智能的理财产品推荐方法,包括:
获取预设时间段内用户的历史理财数据及历史产品偏好信息,并构建所述历史理财数据与所述历史产品偏好信息的对应关系;
根据所述对应关系,将具有相同历史产品偏好信息的历史理财数据划分在同一数据集,并将所有的数据集以及与所述数据集对应的历史产品偏好信息作为训练样本组成训练集;从所述训练集中选取K个训练样本,并构建K个决策树模型,将各个所述训练样本分别输入至不同的决策树模型进行训练,得到训练好的K个决策树模型,K为正整数;
利用训练好的所述K个决策树模型组成理财产品推荐模型;
获取用户的理财数据,将所述理财数据输入所述理财产品推荐模型中,得到多个理财产品及每个所述理财产品对应的产品偏好值;
根据所述产品偏好值从所述理财产品中筛选出目标理财产品,将所述目标理财产品推荐给用户。
本申请一实施例还提供一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现一种基于人工智能的理财产品推荐方法,包括步骤:
获取预设时间段内用户的历史理财数据及历史产品偏好信息,并构建所述历史理财数据与所述历史产品偏好信息的对应关系;
根据所述对应关系,将具有相同历史产品偏好信息的历史理财数据划分在同一数据集,并将所有的数据集以及与所述数据集对应的历史产品偏好信息作为训练样本组成训练集;从所述训练集中选取K个训练样本,并构建K个决策树模型,将各个所述训练样本分别输入至不同的决策树模型进行训练,得到训练好的K个决策树模型,K为正整数;
利用训练好的所述K个决策树模型组成理财产品推荐模型;
获取用户的理财数据,将所述理财数据输入所述理财产品推荐模型中,得到多个理财产品及每个所述理财产品对应的产品偏好值;
根据所述产品偏好值从所述理财产品中筛选出目标理财产品,将所述目标理财产品推荐给用户。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的和实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可以包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双速据率SDRAM(SSRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
综上所述,本申请的最大有益效果在于:
本申请所提供的一种基于人工智能的理财产品推荐方法、装置、设备及介质,通过获取预设时间段内用户的历史理财数据及历史产品偏好信息,构建历史理财数据与历史产品偏好信息的对应关系;根据所述对应关系,将具有相同历史产品偏好信息的历史理财数据划分在同一数据集,并将所有的数据集以及与所述数据集对应的历史产品偏好信息作为训练样本组成训练集,从训练集中选取K个训练样本,并构建K个决策树模型,将各个训练样本分别输入至不同的决策树模型进行训练,得到训练好的K个决策树模型;利用训练好的K个决策树模型组成理财产品推荐模型;获取用户的理财数据,将理财数据输入理财产品推荐模型中,得到多个理财产品及每个理财产品对应的产品偏好值;根据产品偏好值从理财产品中筛选出目标理财产品,将目标理财产品推荐给用户。本申请通过对历史理财数据基于所反映的历史产品偏好信息进行分类,利用每类的历史理财数据对应训练一个决策树模型,实现独立训练,提高训练效率,并利用单独训练好的决策树分类模型组合得到理财产品推荐模型,使生成的理财产品推荐模型具有更佳地训练结果,提高理财产品的推荐精度;同时基于理财产品推荐模型输出的产品偏好值对理财产品进行筛选,以筛选出适合用户的理财产品,实现精准推荐,推荐效果更好。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、装置、物品或者方法不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、装置、物品或者方法所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、装置、物品或者方法中还存在另外的相同要素。
以上所述仅为本申请的优选实施例,并非因此限制本申请的专利范围,凡是利用本申请说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本申请的专利保护范围内。

Claims (10)

1.一种基于人工智能的理财产品推荐方法,其特征在于,包括:
获取预设时间段内用户的历史理财数据及历史产品偏好信息,并构建所述历史理财数据与所述历史产品偏好信息的对应关系;
根据所述对应关系,将具有相同历史产品偏好信息的历史理财数据划分在同一数据集,并将所有的数据集以及与所述数据集对应的历史产品偏好信息作为训练样本组成训练集;
从所述训练集中选取K个训练样本,并构建K个决策树模型,将各个所述训练样本分别输入至不同的决策树模型进行训练,得到训练好的K个决策树模型,K为正整数;
利用训练好的所述K个决策树模型组成理财产品推荐模型;
获取用户的理财数据,将所述理财数据输入所述理财产品推荐模型中,得到多个理财产品及每个所述理财产品对应的产品偏好值;
根据所述产品偏好值从所述理财产品中筛选出目标理财产品,将所述目标理财产品推荐给用户。
2.根据权利要求1所述的方法,其特征在于,所述根据所述产品偏好值从所述理财产品中筛选出目标理财产品,包括:
获取时事热点信息,提取所述时事热点信息的第一关键词,并提取每个所述理财产品的第二关键词;
计算所述第一关键词与每个所述理财产品的第二关键词的相似度值,将相似度值大于预设相似度阈值的第二关键词作为目标关键词;
将所述目标关键词对应的理财产品作为所述目标理财产品。
3.根据权利要求2所述的方法,其特征在于,所述第一关键词包括多个,所述计算所述第一关键词与每个所述理财产品的第二关键词的相似度值,包括:
利用预先训练好的Word2Vec词向量模型将多个所述第一关键词分别转换为词向量,并计算多个所述第一关键词的词向量的平均值,得到第一词向量;
利用所述Word2Vec词向量模型将每个所述理财产品的第二关键词转换为词向量,得到每个所述理财产品的第二词向量;
计算所述第一词向量与每个所述理财产品的第二词向量的余弦距离作为所述相似度值。
4.根据权利要求1所述的方法,其特征在于,所述得到训练好的K个决策树模型,包括:
利用预设的损失函数分别计算训练后的每个决策树模型的损失值;
判断所述每个决策树模型的损失值是否都低于预设损失值;
若是,则判定所述K个决策树模型完成训练。
5.根据权利要求1所述的方法,其特征在于,所述根据所述产品偏好值从所述理财产品中筛选出目标理财产品,包括:
按照所述产品偏好值的从大小的顺序对所述理财产品进行排序;
将排在前N位的所述理财产品作为目标理财产品;其中,所述N为正整数。
6.根据权利要求1所述的方法,其特征在于,所述获取预设时间段内用户的历史理财数据,包括:
通过爬取工具抓取所述用户在预设时间段内已浏览的理财页面;
采用预设的正则表达式对所述理财页面中的信息进行提取,得到目标信息;
对所述目标信息进行解析后,得到所述历史理财数据。
7.根据权利要求6所述的方法,其特征在于,所述得到所述历史理财数据,包括:
将解析后的目标信息分割为多个子数据块,并根据数据结构分别为每个子数据块分配唯一的标识符;
遍历所有标识符,对应各个标识符保留唯一一个数据块,去除其他具有相同标识符的数据块,得到去除重复数据的历史理财数据。
8.一种基于人工智能的理财产品推荐装置,其特征在于,包括:
获取模块,用于获取预设时间段内用户的历史理财数据及历史产品偏好信息,并构建所述历史理财数据与所述历史产品偏好信息的对应关系;
划分模块,用于根据所述对应关系,将具有相同历史产品偏好信息的历史理财数据划分在同一数据集,并将所有的数据集以及与所述数据集对应的历史产品偏好信息作为训练样本组成训练集;训练模块,用于从所述训练集中选取K个训练样本,并构建K个决策树模型,将各个所述训练样本分别输入至不同的决策树模型进行训练,得到训练好的K个决策树模型,K为正整数;
组成模块,用于利用训练好的所述K个决策树模型组成理财产品推荐模型;
输入模块,用于获取用户的理财数据,将所述理财数据输入所述理财产品推荐模型中,得到多个理财产品及每个所述理财产品对应的产品偏好值;
推荐模块,用于根据所述产品偏好值从所述理财产品中筛选出目标理财产品,将所述目标理财产品推荐给用户。
9.一种计算机设备,其特征在于,包括:
处理器;
存储器;
计算机程序,其中所述计算机程序被存储在所述存储器中并被配置为由所述处理器执行,所述计算机程序配置用于执行根据权利要求1至7任一项所述的基于人工智能的理财产品推荐方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,该计算机程序被处理器执行时实现权利要求1-7任一项所述的基于人工智能的理财产品推荐方法。
CN202111052153.7A 2021-09-08 2021-09-08 基于人工智能的理财产品推荐方法、装置、设备及介质 Pending CN113762392A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111052153.7A CN113762392A (zh) 2021-09-08 2021-09-08 基于人工智能的理财产品推荐方法、装置、设备及介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111052153.7A CN113762392A (zh) 2021-09-08 2021-09-08 基于人工智能的理财产品推荐方法、装置、设备及介质

Publications (1)

Publication Number Publication Date
CN113762392A true CN113762392A (zh) 2021-12-07

Family

ID=78793981

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111052153.7A Pending CN113762392A (zh) 2021-09-08 2021-09-08 基于人工智能的理财产品推荐方法、装置、设备及介质

Country Status (1)

Country Link
CN (1) CN113762392A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114297511A (zh) * 2022-01-27 2022-04-08 中国农业银行股份有限公司 理财推荐方法、装置、***和存储介质
CN115511569A (zh) * 2022-10-09 2022-12-23 湖南工商大学 一种金融风险监控装置和方法
TWI839060B (zh) * 2023-01-03 2024-04-11 中國信託商業銀行股份有限公司 理財需求評估方法及其運算裝置

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20130046772A1 (en) * 2011-08-16 2013-02-21 Alibaba Group Holding Limited Recommending content information based on user behavior
CN105631707A (zh) * 2015-12-23 2016-06-01 北京奇虎科技有限公司 基于决策树的广告点击率预估方法与应用推荐方法及装置
CN108629693A (zh) * 2018-05-08 2018-10-09 平安科技(深圳)有限公司 自动生成投资建议的方法、装置、计算机设备和存储介质
CN110752942A (zh) * 2019-09-06 2020-02-04 平安科技(深圳)有限公司 告警信息的决策方法、装置、计算机设备及存储介质
CN111861569A (zh) * 2020-07-23 2020-10-30 中国工商银行股份有限公司 产品信息推荐方法及装置
US20210118080A1 (en) * 2018-04-18 2021-04-22 Beijing Didi Infinity Technology And Development Co., Ltd. Systems and methods for recommending transportation means
CN113255370A (zh) * 2021-06-22 2021-08-13 中国平安财产保险股份有限公司 基于语义相似度的行业类型推荐方法、装置、设备及介质

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20130046772A1 (en) * 2011-08-16 2013-02-21 Alibaba Group Holding Limited Recommending content information based on user behavior
CN105631707A (zh) * 2015-12-23 2016-06-01 北京奇虎科技有限公司 基于决策树的广告点击率预估方法与应用推荐方法及装置
US20210118080A1 (en) * 2018-04-18 2021-04-22 Beijing Didi Infinity Technology And Development Co., Ltd. Systems and methods for recommending transportation means
CN108629693A (zh) * 2018-05-08 2018-10-09 平安科技(深圳)有限公司 自动生成投资建议的方法、装置、计算机设备和存储介质
CN110752942A (zh) * 2019-09-06 2020-02-04 平安科技(深圳)有限公司 告警信息的决策方法、装置、计算机设备及存储介质
CN111861569A (zh) * 2020-07-23 2020-10-30 中国工商银行股份有限公司 产品信息推荐方法及装置
CN113255370A (zh) * 2021-06-22 2021-08-13 中国平安财产保险股份有限公司 基于语义相似度的行业类型推荐方法、装置、设备及介质

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
辛菊琴;蒋艳;舒少龙;: "综合用户偏好模型和BP神经网络的个性化推荐", 计算机工程与应用, no. 02, pages 57 - 60 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114297511A (zh) * 2022-01-27 2022-04-08 中国农业银行股份有限公司 理财推荐方法、装置、***和存储介质
CN115511569A (zh) * 2022-10-09 2022-12-23 湖南工商大学 一种金融风险监控装置和方法
TWI839060B (zh) * 2023-01-03 2024-04-11 中國信託商業銀行股份有限公司 理財需求評估方法及其運算裝置

Similar Documents

Publication Publication Date Title
AU2017243270B2 (en) Method and device for extracting core words from commodity short text
CN109960725B (zh) 基于情感的文本分类处理方法、装置和计算机设备
CN110175227B (zh) 一种基于组队学习和层级推理的对话辅助***
Bucur Using opinion mining techniques in tourism
CN113762392A (zh) 基于人工智能的理财产品推荐方法、装置、设备及介质
CN110147445A (zh) 基于文本分类的意图识别方法、装置、设备及存储介质
CN111221944B (zh) 文本意图识别方法、装置、设备和存储介质
CN107943792B (zh) 一种语句分析方法、装置及终端设备、存储介质
CN111274371B (zh) 一种基于知识图谱的智能人机对话方法及设备
CN111090719B (zh) 文本分类方法、装置、计算机设备及存储介质
De Souza et al. Automated multi-label text categorization with VG-RAM weightless neural networks
CN112084307A (zh) 一种数据处理方法、装置、服务器及计算机可读存储介质
CN112347254A (zh) 新闻文本的分类方法、装置、计算机设备和存储介质
CN114510923B (zh) 基于人工智能的文本主题生成方法、装置、设备及介质
CN116541517A (zh) 文本信息处理方法、装置、设备、软件程序以及存储介质
CN116680401A (zh) 文档处理方法、文档处理装置、设备及存储介质
CN111460114A (zh) 检索方法、装置、设备及计算机可读存储介质
CN116167371A (zh) 产品的推荐方法及装置、处理器和电子设备
CN110610378A (zh) 产品需求分析方法、装置、计算机设备和存储介质
CN113850670A (zh) 银行产品推荐方法、装置、设备及存储介质
CN112749530B (zh) 文本编码方法、装置、设备及计算机可读存储介质
CN114936326A (zh) 基于人工智能的信息推荐方法、装置、设备及存储介质
CN114238798A (zh) 基于神经网络的搜索排序方法、***、设备及存储介质
CN114707510A (zh) 资源推荐信息推送方法、装置、计算机设备及存储介质
CN111400413B (zh) 一种确定知识库中知识点类目的方法及***

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
AD01 Patent right deemed abandoned

Effective date of abandoning: 20240802