CN117252667A - 一种基于大数据的产品推荐方法及*** - Google Patents
一种基于大数据的产品推荐方法及*** Download PDFInfo
- Publication number
- CN117252667A CN117252667A CN202311532345.7A CN202311532345A CN117252667A CN 117252667 A CN117252667 A CN 117252667A CN 202311532345 A CN202311532345 A CN 202311532345A CN 117252667 A CN117252667 A CN 117252667A
- Authority
- CN
- China
- Prior art keywords
- purchase
- product
- recommendation
- client
- customer
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 41
- 230000008451 emotion Effects 0.000 claims abstract description 44
- 238000004458 analytical method Methods 0.000 claims abstract description 22
- 239000011159 matrix material Substances 0.000 claims description 41
- 230000003993 interaction Effects 0.000 claims description 24
- 238000012545 processing Methods 0.000 claims description 15
- 230000008846 dynamic interplay Effects 0.000 claims description 7
- 238000013500 data storage Methods 0.000 claims description 6
- 239000002131 composite material Substances 0.000 claims description 3
- 238000007781 pre-processing Methods 0.000 claims description 3
- 238000012552 review Methods 0.000 claims description 3
- 230000002996 emotional effect Effects 0.000 claims 1
- 230000007246 mechanism Effects 0.000 abstract description 6
- 230000000694 effects Effects 0.000 description 8
- 238000011176 pooling Methods 0.000 description 4
- 230000009286 beneficial effect Effects 0.000 description 3
- 238000000605 extraction Methods 0.000 description 3
- 238000003064 k means clustering Methods 0.000 description 3
- 230000006399 behavior Effects 0.000 description 2
- 230000002349 favourable effect Effects 0.000 description 2
- 230000004927 fusion Effects 0.000 description 2
- 238000007477 logistic regression Methods 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000012549 training Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/06—Buying, selling or leasing transactions
- G06Q30/0601—Electronic shopping [e-shopping]
- G06Q30/0631—Item recommendations
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
- G06N20/20—Ensemble learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/06—Buying, selling or leasing transactions
- G06Q30/0601—Electronic shopping [e-shopping]
- G06Q30/0623—Item investigation
- G06Q30/0625—Directed, with specific intent or strategy
- G06Q30/0629—Directed, with specific intent or strategy for generating comparisons
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Accounting & Taxation (AREA)
- Finance (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- Strategic Management (AREA)
- Evolutionary Computation (AREA)
- Marketing (AREA)
- Economics (AREA)
- Development Economics (AREA)
- General Business, Economics & Management (AREA)
- Artificial Intelligence (AREA)
- Software Systems (AREA)
- General Engineering & Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Life Sciences & Earth Sciences (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Medical Informatics (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明涉及大数据领域,尤其是涉及一种基于大数据的产品推荐方法及***,所述方法包括如下步骤:利用大数据获取客户的账户信息;使用账户信息对客户进行聚类得到多个聚类集群;计算不同聚类集群之间的购买关联性,进而预测不同的聚类集群的购买方向;依据聚类集群确定产品的推荐群体和产品清单;基于购买方向和产品清单向客户推荐产品;根据账户信息对客户进行情感分析,进而更新推荐的产品。本方法基于大数据能准确找到商品推荐群体,同时利用账户信息预测并推荐客户可能购买的产品,且本方法也能够根据客户购买产品的情感特征及时更新推荐产品,构成了关联推荐、预测推荐和推荐更新相结合的产品推荐机制,提高了产品推荐的准确性和人性化程度。
Description
技术领域
本发明涉及大数据领域,尤其是涉及一种基于大数据的产品推荐方法及***。
背景技术
随着互联网行业的发展,产品的营销手段也在快速发展,基于互联网的产品推荐方式也在飞速发展。产品推荐的基本思想是根据客户的历史以及实时行为挖掘客户的兴趣,从而将客户感兴趣的商品推荐给客户,避免了客户在庞杂的商品项目中的搜索行为,更好的方便客户。
然而,现有产品推荐方法主要是根据历史销售记录,选择销量较好的产品或者根据客户的购买记录进行推荐,但是每个客户的个人情况、购买需求等都各不相同,这种产品推荐的模式也无法真正满足所有的消费者。此外,现有技术的产品推荐方法对客户的实际需求存在考虑不足的问题,忽略了客户的情感特征,胡乱的产品推荐降低了客户的购买欲望,换言之,现有的产品推荐方法的准确性不足,人性化程度有待提高。
发明内容
针对现有技术中的不足,本发明提供一种基于大数据的产品推荐方法及***。
为了实现上述目的,第一方面,本发明提供了一种基于大数据的产品推荐方法,所述方法包括如下步骤:利用大数据获取客户的账户信息,所述账户信息包括客户基础信息、浏览偏好、购买水平、购买历史、购买渠道和客户评论;使用所述账户信息对客户进行聚类得到多个聚类集群;根据所述购买历史计算不同所述聚类集群之间的购买关联性,进而预测不同的所述聚类集群的购买方向;依据所述聚类集群确定产品的第一推荐群体和第二推荐群体;根据所述购买历史确定所述第一推荐群体的第一产品清单和所述第二推荐群体的第二产品清单;基于所述购买方向、所述第一产品清单和所述第二产品清单向客户推荐产品;根据所述客户评论和所述浏览偏好对客户进行多模态情感分析;利用多模态情感分析的结果更新推荐的产品。本发明提供的方法基于大数据能够准确的找到商品推荐群体,同时利用账户信息预测并推荐客户未来可能购买的产品,并且本发明也能够根据客户购买产品的情感特征及时更新推荐产品,实现了关联推荐、预测推荐和推荐更新相结合的产品推荐机制,提高了产品推荐的准确性和人性化程度。
可选地,所述利用大数据获取客户的账户信息,所述账户信息包括客户基础信息、浏览偏好、购买水平、购买历史、购买渠道和客户评论包括如下步骤:
利用大数据获取全网客户的初步账户信息;
对所述初步账户信息进行预处理得到所述账户信息,所述账户信息包括客户基础信息、浏览偏好、购买水平、购买历史、购买渠道和客户评论。
进一步的,客户基础信息包括客户姓名、客户年龄和客户性别,获取的浏览偏好和客户评论中可能存在噪声,需要去除,同时也需要剔除一些特殊的账户信息,使账户信息有利于反映客户的实际购买情况,进而提高产品推荐的准确性。
可选地,所述使用所述账户信息对客户进行聚类得到多个聚类集群包括如下步骤:
根据所述客户基础信息进行第一次聚类得到初始聚类集群;
依据所述浏览偏好、所述购买水平、所述购买渠道对所述初始聚类集群进行第二次聚类,得到所述聚类集群。
进一步的,基于客户年龄和客户性别对账户信息进行第一次聚类,经过第二次聚类之后得到的聚类集群能够很好的凸显客户群体的产品喜好特征,为准确的推荐产品提供数据基础。
可选地,所述根据所述购买历史计算不同所述聚类集群之间的购买关联性,进而预测不同的所述聚类集群的购买方向包括如下步骤:
根据所述购买历史计算不同所述聚类集群之间的购买关联性;
设定关联性阈值,根据所述关联性阈值和所述购买关联性预测不同所述聚类集群的第一购买方向;
利用所述客户基础信息和所述购买历史预测所述聚类集群中客户的第二购买方向。
进一步的,利用购买方向预测客户未来可能购买的产品,有利于提高客户的购买欲望。
可选地,所述依据所述聚类集群确定产品的第一推荐群体和第二推荐群体包括如下步骤:
根据所述聚类集群得到多个独立推荐群体;
提取所述独立推荐群体之间的复合部分作为第一推荐群体;
使用各个所述独立推荐群体减去所述第一推荐群体即为所述第二推荐群体。
可选地,所述利用所述客户基础信息和所述购买历史预测所述聚类集群中客户的第二购买方向包括如下步骤:
根据所述购买历史提取商品特征和商品客户交互特征;
根据所述商品特征、所述商品客户交互特征和所述客户基础信息建立产品购买预测模型,并根据所述产品购买预测模型预测客户的第二购买方向。
进一步的,将不同聚类集群中的客户可能的购买方向与基于客户本身得到的购买方向相结合,进而预测客户未来可能购买的产品,可以提高预测的准确性,实现精准推荐。
可选地,所述根据所述客户评论和所述浏览偏好对客户进行多模态情感分析包括如下步骤:
对所述浏览偏好和所述客户评论中的文本、音频和视频进行单模态表示提取;
根据单模态表示提取的结果,利用跨模态注意力得到单模态之间的动态交互信息;
利用所述动态交互信息提取总体特征和显著特征,利用所述显著特征和所述总体特征得到综合情感特征,并利用所述综合情感特征得到客户的情感。
进一步的,利用跨模态注意力机制对客户评论和浏览偏好进行多模态情感分析,提高细粒度的情感分类结果,更加准确的反映客户对于推荐产品的态度,有利于及时更新推荐产品,提高产品推荐的准确性和客户的满意度,提升客户的购买欲望。
可选地,所述跨模态注意力满足如下关系:
其中,为第i个模态的所述跨模态注意力,/>为第i个模态的输入向量矩阵,/>表示第i个模态的查询矩阵,/>表示第i个所述查询矩阵的权重矩阵,/>表示第j个模态的键矩阵,/>表示第j个所述键矩阵的所述权重矩阵的转置矩阵,/>表示第j个模态的输入向量矩阵的转置矩阵,/>为缩放比例因子,/>表示第j个模态的值矩阵,/>表示第j个所述值矩阵的权重矩阵。
可选地,所述情感特征满足如下关系:
其中,表示第i个所述综合情感特征,/>表示所述总体特征,表示所述显著特征。
综上所述,本发明提供的方法基于大数据和聚类算法能够准确的找到商品推荐群体,并利用账户信息建立集成学习算法模型预测客户未来可能购买的产品,同时本发明也能够根据客户购买产品的情感特征及时更新推荐产品,实现了关联推荐、预测推荐和推荐更新相结合的产品推荐机制,提高了产品推荐的准确性,人性化程度较高。此外,本发明提供的方法所需要的数据较少,涉及到的客户基础信息较少,对于降低客户隐私泄露的概率十分有利。
第二方面,本发明提供了一种基于大数据的产品推荐***,所述***使用本发明提供的一种基于大数据的产品推荐方法,所述***包括:
数据获取模块,所述数据获取模块用于利用大数据获取客户的账户信息,所述账户信息包括客户基础信息、浏览偏好、购买水平、购买历史、购买渠道和客户评论;
数据处理及输出模块,所述数据处理及输出模块用于使用所述账户信息对客户进行聚类得到多个聚类集群;根据所述购买历史计算不同所述聚类集群之间的购买关联性,进而预测不同的所述聚类集群的购买方向;依据所述聚类集群确定产品的第一推荐群体和第二推荐群体;根据所述购买历史确定所述第一推荐群体的第一产品清单和所述第二推荐群体的第二产品清单;基于所述购买方向、所述第一产品清单和所述第二产品清单向客户推荐产品;根据所述客户评论和所述浏览偏好对客户进行多模态情感分析;利用多模态情感分析的结果更新推荐的产品;
数据储存模块,所述数据储存模块用于储存所述数据处理及输出模块产生的数据;
进一步的,所述***作为使用本发明提供的方法的***,不仅实现了关联推荐、预测推荐和推荐更新相结合的产品推荐机制,提高了产品推荐的准确性,而且智能化程度较高,提高了产品推荐的效率。
附图说明
为了更清楚地说明本申请实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本申请的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它相关的附图。
图1为本发明实施例的一种基于大数据的产品推荐方法流程示意图;
图2为本发明实施例的一种基于大数据的产品推荐***框架示意图。
具体实施方式
下面将详细描述本发明的具体实施例,应当注意,这里描述的实施例只用于举例说明,并不用于限制本发明。在以下描述中,为了提供对本发明的透彻理解,阐述了大量特定细节。然而,对于本领域普通技术人员显而易见的是:不必采用这些特定细节来实行本发明。在其他实例中,为了避免混淆本发明,未具体描述公知的电路,软件或方法。
在整个说明书中,对“一个实施例”、“实施例”、“一个示例”或“示例”的提及意味着:结合该实施例或示例描述的特定特征、结构或特性被包含在本发明至少一个实施例中。因此,在整个说明书的各个地方出现的短语“在一个实施例中”、“在实施例中”、“一个示例”或“示例”不一定都指同一实施例或示例。此外,可以以任何适当的组合和、或子组合将特定的特征、结构或特性组合在一个或多个实施例或示例中。此外,本领域普通技术人员应当理解,在此提供的示图都是为了说明的目的,并且示图不一定是按比例绘制的。
请参见图1,在一个可选地实施例当中,本发明提供了一种基于大数据的产品推荐方法,所述方法包括如下步骤:
S1、利用大数据获取客户的账户信息,所述账户信息包括客户基础信息、浏览偏好、购买水平、购买历史、购买渠道和客户评论。
其中,S1具体包括如下步骤:
S11、利用大数据获取全网客户的初步账户信息。
具体的,在本实施例当中,初步账户信息通过选择性的提取各大线上购买软件和网站的客户注册信息获得,即在获取初步账户信息时不获取完整的客户注册信息,一方面可以从根源上防止产品推荐时客户信息的泄露,保护客户的隐私安全,另一方面也可以减少数据的获取量和处理量,进而提高产品推荐的广泛性,提高产品推荐的效率。
进一步的,客户基础信息包括客户姓名、客户年龄和客户性别。在其他可选地实施例当中,初步账户信息也可以通过其他渠道获取,具体方式在此不做限定。
S12、对所述初步账户信息进行预处理得到所述账户信息,所述账户信息包括客户基础信息、浏览偏好、购买水平、购买历史、购买渠道和客户评论。
具体的,在本实施例当中,获取的浏览偏好和客户评论中主要包括图片信息、文字信息和视频信息,例如客户发表的评论中可能就附带有图片和视频。其中的图片信息和视频信息可能存在噪声,使用高斯滤波的方法去除图片信息中的噪声,使用VBM3D算法去除视频信息中的噪声,提高图片信息和视频信息地质量,有利于提高情感分析的准确性,进而提高产品推荐的准确性。
进一步的,在获取的账户信息中,存在一些不活跃客户,这些不活跃客户的数据会对整个客户群体的数据产生很大影响,例如不活跃客户的购买水平一般来说是极低的,在利用购买水平聚类时需要另设一个聚类中心进行聚类,这会加大计算量,降低产品的推荐的效率和准确性。此外,对于线上购物来说,对不活跃客户进行产品推荐是无效的推荐。因此,根据购买历史设定合适的购买时间间隔阈值,使用拉依达方法将不活跃客户剔除,即当某一客户的购买时间间隔大于购买时间间隔阈值的3倍时,则判断该客户为不活跃客户。剔除不活跃客户的账户信息可以减少数据处理量,提高数据处理速度,进而提高产品推荐的准确性和效率。
更进一步的,购买时间间隔阈值为1个月,这样设置刚好满足换季时间,可以较为准确的剔除不活跃客户。在其他可选地实施例当中,对于不活跃客户,可以根据该客户的购买历史,结合该客户购买产品的类别进行随机的产品推荐。
S2、使用所述账户信息对客户进行聚类得到多个聚类集群。
其中,S2具体包括如下步骤:
S21、根据所述客户基础信息进行第一次聚类得到初始聚类集群。
具体的,在本实施例当中,第一次聚类分为两步进行,首先根据客户性别将客户分为男性客户和女性客户,然后根据客户年龄分别对男性客户和女性客户进行聚类。
进一步的,根据人类的成长状态对客户年龄进行阶段性划分,将6-12岁作为第一阶段,将13-18岁作为第二阶段,19-22岁作为第三阶段,23-65岁作为第四阶段,65岁之后作为第五阶段,将不同年龄阶段的客户聚类到一起,有利于凸显不同年龄阶段的商品购买特征,为提高产品推荐准确性提供数据基础。
在其他可选地实施例当中,还可以通过其他方式将客户年龄划分为其他阶段,也可以根据本步骤划分的年龄阶段,将客户分为5个簇,使用K-means聚类算法对不同性别的客户群体进行聚类。
S22、依据所述浏览偏好、所述购买水平、所述购买渠道对所述初始聚类集群进行第二次聚类,得到所述聚类集群。
具体的,在本实施例当中,首先对产品进行精细化分类得到多个精细化产品类别,然后依次对精细化产品类别进行编号,客户的浏览偏好对应的产品类别可以根据编号的结果进行标注,购买水平可以分为1-低水平、2-中等水平和3-高水平三个类别,购买渠道根据现有的线上购买软件和网站进行分类。
进一步的,使用PPC-GA聚类算法分别根据浏览偏好、购买水平和购买渠道对初始聚类集群进行第二次聚类得到多个聚类结果,此为现有技术,在此就不做详细说明。
PPC-GA聚类算法是基于K-means聚类算法的改进算法,是基于密度自适应网格和加权属性的隐私保护聚类算法,可以很好的保护客户的隐私,避免在聚类分析时客户数据的泄露,而且PPC-GA聚类算法聚类效果相比于K-means聚类算法也更加准确可靠,有利于准确定位产品第二推荐群体,提高产品推荐的准确性。
S3、根据所述购买历史计算不同所述聚类集群之间的购买关联性,进而预测不同的所述聚类集群的购买方向。
其中,S3具体包括如下步骤:
S31、根据所述购买历史计算不同所述聚类集群之间的购买关联性。
具体的,在本实施例当中,根据购买历史可以计算出不同聚类集群购买产品的类别清单,进而得出不同类别的产品在不同聚类集群所占的购买比例,购买关联性满足如下关系:
其中,为第i个聚类集群与第j个聚类集群的购买关联性,N为产品类别的总数,为第n个类别的产品在i个聚类集群的购买比例,/>为第n个类别的产品在第j个聚类集群的购买比例。
S32、设定关联性阈值,根据所述关联性阈值和所述购买关联性预测不同所述聚类集群的第一购买方向。
具体的,在本实施例当中,当两个聚类集群的购买关联性大于关联性阈值时,可判断这两个聚类集群购买的产品具有内在联系,表示这两个聚类集群购买的产品可以相互推荐,这就是第一购买方向。
进一步的,关联性阈值受到产品类别多少的影响,可以将2作为关联性阈值;第一购买方向可以表示不同群体的大致购买方向,具有一定的预测作用,例如对于不同年龄阶段的男性群体购买的产品。
更进一步的,设置关联性阈值可以去除关联性较低的两个聚类集群之间产品的影响,降低推荐产品预测的范围,进而提高产品推荐的准确性。
S33、利用所述客户基础信息和所述购买历史预测所述聚类集群中客户的第二购买方向。
其中,S33具体又包括如下步骤:
S331、根据所述购买历史提取商品特征和商品客户交互特征。
具体的,在本实施例当中,商品特征具体为购买历史中商品的品牌、类别、活跃度和价格,商品客户交互特征表示客户与商品的时空交互特征,商品客户交互特征为客户在某一段时间对产品的收藏次数和购买次数的比值。
进一步的,商品客户交互特征还可以通过其他方式表示,在此不做限定。
S332、根据所述商品特征、所述商品客户交互特征和所述客户基础信息建立产品购买预测模型,并根据所述产品购买预测模型预测客户的第二购买方向。
具体的,在本实施例当中,分别将商品客户交互特征、客户的年龄、购买历史中商品的活跃度和价格划分为不同的商品客户交互特征区间、年龄区间、活跃度区间和价格区间,进而精简数据,减少后续的数据处理量,例如可以按照S21中的年龄划分方法将客户的年龄划分为5个区间。考虑到商品客户交互特征区间、年龄区间、活跃度区间和价格区间数量和大小都是相关人员可以根据实际情况自行设置的,故而在此就不做详细的说明和限制。
然后使用不同的字母符号来表示不同的商品特征、商品客户交互特征区间、年龄区间、活跃度区间、价格区间和性别,便于后续模型的训练和建立。分别使用、/>、/>、来表示购买历史中商品不同的品牌、类别、活跃度区间和价格区间,如果某一活跃度处于/>所表示的活跃度区间中,则该活跃度使用/>来表示,如果某一价格处于/>所表示的价格区间中,则该价格使用/>来表示;使用/>表示不同的商品客户交互特征区间,如果某一商品客户交互特征处于/>所表示的商品客户交互特征区间中,则该商品客户交互特征使用/>来表示;使用/>表示不同的年龄区间,如果某一客户的年龄处于/>所表示的年龄区间中,则该客户的年龄使用/>来表示;分别使用/>和/>表示男性和女性。i=1、2、3......。
在使用不同的字母符号来表示不同的商品特征、商品客户交互特征区间、年龄区间、活跃度区间、价格区间和性别之后,根据商品特征、商品客户交互特征以及客户的年龄和性别,利用XGBoost模型、CatBoost模型和逻辑回归模型建立4个客户个体预测模型,然后将这4个客户个体预测模型融合起来即可得到产品购买预测模型,产品购买预测模型是集成学习算法模型,用于预测客户可能购买的产品类型。
更为具体的,选择客户的年龄和商品特征对XGBoost模型进行训练,得到XGBoost模型1。选择客户的性别和商品特征对XGBoost模型进行训练,得到XGBoost模型2。将XGBoost模型1、XGBoost模型2、CatBoost模型和逻辑回归模型分别命名为第一客户个体预测模型、第二客户个体预测模型、第三客户个体预测模型和第四客户个体预测模型。其中,第一客户个体预测模型的输入为客户的年龄和商品特征,第二客户个体预测模型的输入为客户的性别和商品特征,第三客户个体预测模型和第四客户个体预测模型的输入为商品特征、商品客户交互特征、客户的年龄和性别。然后将这个4个客户个体预测模型的输出通过融合模型融合起来即可得到客户可能购买的产品类型,融合模型满足如下关系:
其中,为客户k购买的产品属于第i种产品类型的概率,/>、/>、/>和/>为分别对应于/>、/>为、/>和/>的权重,/>为第一客户个体预测模型预测客户k购买的产品属于第i种产品类型的概率,/>为第二客户个体预测模型预测客户k购买的产品属于第i种产品类型的概率,/>为第三客户个体预测模型预测客户k购买的产品属于第i种产品类型的概率,/>为第四客户个体预测模型预测客户k购买的产品属于第i种产品类型的概率。利用、/>为、/>和/>构建权重求解向量/>,并将该权重求解向量输入线性分类器,即可学习出/>、/>、/>和/>。
进一步的,如果大于0.7,则将其所对应的第i种产品类型确定为客户k的第二购买方向。通过第一购买方向可以确定客户群体大致的购买方向,通过第二购买方向可以确定客户群体中客户个体的购买方向,因此以第一购买方向为参考,结合第二购买方向即可较为准确的预测客户的购买方向,进而根据客户的购买方向推荐客户想要的产品。在其他可选地实施例中,也可以直接将获得的商品特征、商品客户交互特征和客户的年龄和性别用于建立产品购买预测模型和预测客户的第二购买方向,即不对商品客户交互特征、客户的年龄、购买历史中商品的活跃度和价格进行区间的划分和用字母符号表示,但这会加大数据处理量。
S4、依据所述聚类集群确定产品的第一推荐群体和第二推荐群体。
其中,S4具体包括如下步骤:
S41、根据所述聚类集群得到多个独立推荐群体。
具体的,在本实施例当中,根据步骤S22得到的聚类结果即为独立推荐群体,每一个独立推荐群体都可以表示该群体的浏览偏好特征、购买水平特征和购买渠道特征。
S42、提取所述独立推荐群体之间的复合部分作为第一推荐群体。
具体的,在本实施例当中,不同的独立推荐群体之间存在相同的群体,即存多个客户具有相同的浏览偏好特征、购买水平特征和购买渠道特征,第一推荐群体在独立推荐群体中具有代表性,相比于任何只具有单一的浏览偏好特征、购买水平特征和购买渠道特征的客户具有更大的购买爱好和更广的购买产品的类型。
S43、使用各个所述独立推荐群体减去所述第一推荐群体即为所述第二推荐群体。
具体的,在本实施例当中,第一推荐群体即为多个独立推荐群体的交集,除交集之外的群体即为第二推荐群体。
进一步的,将独立推荐群体分为第一推荐群体和第二推荐群体可以更加准确的确定产品推荐的对象,提高产品推荐的准确性,而且处理过程也十分简单,便于操作。
S5、根据所述购买历史确定所述第一推荐群体的第一产品清单和所述第二推荐群体的第二产品清单。
S6、基于所述购买方向、所述第一产品清单和所述第二产品清单向客户推荐产品。
具体的,在本实施例当中,首先对比第一产品清单和第二产品清单,然后根据客户的购买方向预测客户想要的产品或产品类别,将第一推荐群体和第二推荐群体相互之间没有的产品进行相互推荐,实现产品的准确推荐。
S7、根据所述客户评论和所述浏览偏好对客户进行多模态情感分析。
其中,S7具体包括如下步骤:
S71、对所述浏览偏好和所述客户评论中的文本、音频和视频进行单模态表示提取。
具体的,在本实施例当中,使用LSTM模型对浏览偏好和客户评论中的文本、音频和视频进行单模态表示提取,得到文本、音频和视频等单模态的上下文表示信息,即各个模态的输入向量矩阵,便于后续跨模态注意力的使用。
进一步的,在其他可选地实施例当中,还可以通过其他方法对浏览偏好和客户评论中的文本、音频和视频进行单模态表示提取。
S72、根据单模态表示提取的结果,利用跨模态注意力得到单模态之间的动态交互信息。
具体的,在本实施例当中,跨模态注意力满足如下关系:
其中,为第i个模态的跨模态注意力,/>为第i个模态的输入向量矩阵,/>表示第i个模态的查询矩阵,/>表示第i个查询矩阵的权重矩阵,/>表示第j个模态的键矩阵,/>表示第j个键矩阵的权重矩阵的转置矩阵,/>表示第j个模态的输入向量矩阵的转置矩阵,为缩放比例因子,/>表示第j个模态的值矩阵,/>表示第j个值矩阵的权重矩阵。
即可表示动态交互信息,查询矩阵、键矩阵和值矩阵是线性映射矩阵,通过输入向量矩阵映射而来的,是通过学习得到的,查询矩阵、键矩阵和值矩阵和权重矩阵的具体获取方式请参考现有技术,在此就不做赘述。
进一步的,通过跨模态注意力机制获取各模态之间的交互信息,可以减少信息冗余和模态信息干扰,提高情感分析的准确性,进而更为准确的把握客户对于购买产品的情感态度,并以此为依据及时更新推荐产品,提高推荐的准确性和客户的满意度。
S73、利用所述动态交互信息提取总体特征和显著特征,利用所述显著特征和所述总体特征得到综合情感特征,并利用所述综合情感特征得到客户的情感。
具体的,在本实施例当中,情感特征满足如下关系:
其中,表示第i个综合情感特征,/>表示总体特征,表示显著特征。
表示对第i个模态的跨模态注意力进行平均池化,表示对第i个模态的跨模态注意力进行最大池化,/>表示拼接操作。
进一步的,在获得综合情感特征之后,通过综合情感特征即可得到客户的情感,具体的内容参考现有技术,在此不做限制;通过平均池化和最大池化相结合的方式可以降低特征提取中的信息冗余性,提高情感分析的准确性。
更进一步的,客户的情感包括悲伤、恐惧和惊喜。
S8、利用多模态情感分析的结果更新推荐的产品。
具体的,在本实施例当中,当客户的情感为悲伤和恐惧时,则判断客户对购买的产品和浏览历史中已经被推荐的产品并不满意,这时即可对推荐产品类别进行更新,即更换推荐产品类别。如果客户的情感为惊喜,则判断客户对购买的产品和浏览历史中已经被推荐的产品持满意态度,则继续推荐相同类别的产品。
进一步的,利用多模态情感分析的结果更新推荐的产品可以提高产品推荐的人性化程度,提高客户的满意度和购买欲望。
需要说明的是,在一些情况下,在说明书中记载的动作可以按照不同的顺序来执行并且仍然可以实现期望的结果,在本实施例当中,所给出的步骤顺序仅仅是为了使实施例看起来更加清晰明了,方便说明,而非对其限制。
请参见图2,在一个可选地实施例当中,本发明提供了一种基于大数据的产品推荐***,所述***使用本发明提供的一种基于大数据的产品推荐方法,所述***包括数据获取模块A1、数据处理及输出模块A2和数据储存模块A3。
所述数据获取模块A1用于利用大数据获取客户的账户信息,所述账户信息包括客户基础信息、浏览偏好、购买水平、购买历史、购买渠道和客户评论。
具体的,在本实施例当中,账户信息包括客户基础信息、浏览偏好、购买水平、购买历史、购买渠道和客户评论,数据获取模块A1执行步骤S1所述的内容。
所述数据处理及输出模块A2用于使用所述账户信息对客户进行聚类得到多个聚类集群;根据所述购买历史计算不同所述聚类集群之间的购买关联性,进而预测不同的所述聚类集群的购买方向;依据所述聚类集群确定产品的第一推荐群体和第二推荐群体;根据所述购买历史确定所述第一推荐群体的第一产品清单和所述第二推荐群体的第二产品清单;基于所述购买方向、所述第一产品清单和所述第二产品清单向客户推荐产品;根据所述客户评论和所述浏览偏好对客户进行多模态情感分析;利用多模态情感分析的结果更新推荐的产品。
具体的,在本实施例当中,数据处理及输出模块A2通过数据线与数据获取模块A1相连接,数据处理及输出模块A2执行步骤S2至步骤S8所述的内容。
所述数据储存模块A3用于储存所述数据处理及输出模块产生的数据。
具体的,在本实施例当中,数据储存模块A3通过数据线与数据处理模块A2相连接。数据储存模块A3储存的内容包括聚类集群、购买关联性、第一推荐群体、第二推荐群体、第一产品清单、第二产品清单以及多模态情感分析的结果。
综上所述,本发明提供的方法基于大数据和聚类算法能够准确的找到商品推荐群体,并利用账户信息建立集成学习算法模型预测客户未来可能购买的产品,同时本发明也能够通过对客户的相关信息进行多模态情感分析得到客户的情感特征,进而及时更新推荐产品,实现了关联推荐、预测推荐和推荐更新相结合的产品推荐机制,提高了产品推荐的准确性和人性化程度,有利于提升客户的满意度和购买欲望。此外,本发明提供的方法所需要的数据较少,涉及到的客户基础信息较少,对于降低客户隐私泄露的概率十分有利。此外,本发明提供的***作为使用本发明提供的方法的***,不仅实现了关联推荐、预测推荐和推荐更新相结合的产品推荐机制,提高了产品推荐的准确性,而且智能化程度较高,提高了产品推荐的效率。
最后应说明的是:以上各实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围,其均应涵盖在本发明的权利要求和说明书的范围当中。
Claims (10)
1.一种基于大数据的产品推荐方法,其特征在于,包括如下步骤:
利用大数据获取客户的账户信息,所述账户信息包括客户基础信息、浏览偏好、购买水平、购买历史、购买渠道和客户评论;
使用所述账户信息对客户进行聚类得到多个聚类集群;
根据所述购买历史计算不同所述聚类集群之间的购买关联性,进而预测不同的所述聚类集群的购买方向;
依据所述聚类集群确定产品的第一推荐群体和第二推荐群体;
根据所述购买历史确定所述第一推荐群体的第一产品清单和所述第二推荐群体的第二产品清单;
基于所述购买方向、所述第一产品清单和所述第二产品清单向客户推荐产品;
根据所述客户评论和所述浏览偏好对客户进行多模态情感分析;
利用多模态情感分析的结果更新推荐的产品。
2.根据权利要求1所述的一种基于大数据的产品推荐方法,其特征在于,所述利用大数据获取客户的账户信息,所述账户信息包括客户基础信息、浏览偏好、购买水平、购买历史、购买渠道和客户评论包括如下步骤:
利用大数据获取全网客户的初步账户信息;
对所述初步账户信息进行预处理得到所述账户信息,所述账户信息包括客户基础信息、浏览偏好、购买水平、购买历史、购买渠道和客户评论。
3.根据权利要求1所述的一种基于大数据的产品推荐方法,其特征在于,所述使用所述账户信息对客户进行聚类得到多个聚类集群包括如下步骤:
根据所述客户基础信息进行第一次聚类得到初始聚类集群;
依据所述浏览偏好、所述购买水平、所述购买渠道对所述初始聚类集群进行第二次聚类,得到所述聚类集群。
4.根据权利要求1所述的一种基于大数据的产品推荐方法,其特征在于,所述根据所述购买历史计算不同所述聚类集群之间的购买关联性,进而预测不同的所述聚类集群的购买方向包括如下步骤:
根据所述购买历史计算不同所述聚类集群之间的购买关联性;
设定关联性阈值,根据所述关联性阈值和所述购买关联性预测不同所述聚类集群的第一购买方向;
利用所述客户基础信息和所述购买历史预测所述聚类集群中客户的第二购买方向。
5.根据权利要求1所述的一种基于大数据的产品推荐方法,其特征在于,所述依据所述聚类集群确定产品的第一推荐群体和第二推荐群体包括如下步骤:
根据所述聚类集群得到多个独立推荐群体;
提取所述独立推荐群体之间的复合部分作为第一推荐群体;
使用各个所述独立推荐群体减去所述第一推荐群体即为所述第二推荐群体。
6.根据权利要求4所述的一种基于大数据的产品推荐方法,其特征在于,所述利用所述客户基础信息和所述购买历史预测所述聚类集群中客户的第二购买方向包括如下步骤:
根据所述购买历史提取商品特征和商品客户交互特征;
根据所述商品特征、所述商品客户交互特征和所述客户基础信息建立产品购买预测模型,并根据所述产品购买预测模型预测客户的第二购买方向。
7.根据权利要求1所述的一种基于大数据的产品推荐方法,其特征在于,所述根据所述客户评论和所述浏览偏好对客户进行多模态情感分析包括如下步骤:
对所述浏览偏好和所述客户评论中的文本、音频和视频进行单模态表示提取;
根据单模态表示提取的结果,利用跨模态注意力得到单模态之间的动态交互信息;
利用所述动态交互信息提取总体特征和显著特征,利用所述显著特征和所述总体特征得到综合情感特征,并利用所述综合情感特征得到客户的情感。
8.根据权利要求7所述的一种基于大数据的产品推荐方法,其特征在于,所述跨模态注意力满足如下关系:
,
其中,为第i个模态的所述跨模态注意力,/>为第i个模态的输入向量矩阵,/>表示第i个模态的查询矩阵,/>表示第i个所述查询矩阵的权重矩阵,/>表示第j个模态的键矩阵,表示第j个所述键矩阵的所述权重矩阵的转置矩阵,/>表示第j个模态的输入向量矩阵的转置矩阵,/>为缩放比例因子,/>表示第j个模态的值矩阵,/>表示第j个所述值矩阵的权重矩阵。
9.根据权利要求7所述的一种基于大数据的产品推荐方法,其特征在于,所述情感特征满足如下关系:
,
其中,表示第i个所述综合情感特征,/>表示所述总体特征,表示所述显著特征。
10.一种基于大数据的产品推荐***,所述***使用权利要求1-9任意一项所述的一种基于大数据的产品推荐方法,其特征在于,包括:
数据获取模块,所述数据获取模块用于利用大数据获取客户的账户信息,所述账户信息包括客户基础信息、浏览偏好、购买水平、购买历史、购买渠道和客户评论;
数据处理及输出模块,所述数据处理及输出模块用于使用所述账户信息对客户进行聚类得到多个聚类集群;根据所述购买历史计算不同所述聚类集群之间的购买关联性,进而预测不同的所述聚类集群的购买方向;依据所述聚类集群确定产品的第一推荐群体和第二推荐群体;根据所述购买历史确定所述第一推荐群体的第一产品清单和所述第二推荐群体的第二产品清单;基于所述购买方向、所述第一产品清单和所述第二产品清单向客户推荐产品;根据所述客户评论和所述浏览偏好对客户进行多模态情感分析;利用多模态情感分析的结果更新推荐的产品;
数据储存模块,所述数据储存模块用于储存所述数据处理及输出模块产生的数据。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311532345.7A CN117252667A (zh) | 2023-11-17 | 2023-11-17 | 一种基于大数据的产品推荐方法及*** |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311532345.7A CN117252667A (zh) | 2023-11-17 | 2023-11-17 | 一种基于大数据的产品推荐方法及*** |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117252667A true CN117252667A (zh) | 2023-12-19 |
Family
ID=89128020
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311532345.7A Pending CN117252667A (zh) | 2023-11-17 | 2023-11-17 | 一种基于大数据的产品推荐方法及*** |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117252667A (zh) |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105426528A (zh) * | 2015-12-15 | 2016-03-23 | 中南大学 | 一种商品数据的检索排序方法及*** |
CN106651546A (zh) * | 2017-01-03 | 2017-05-10 | 重庆邮电大学 | 一种面向智慧社区的电子商务信息推荐方法 |
CN107633430A (zh) * | 2017-09-20 | 2018-01-26 | 哈尔滨工业大学 | 一种基于群体社区的商品推荐方法 |
US20190188771A1 (en) * | 2017-12-15 | 2019-06-20 | Capital One Services, Llc | Systems and Methods for Transaction-Based Real Time Pre-Intent Recommendations for a Sequential Purchase |
CN112991017A (zh) * | 2021-03-26 | 2021-06-18 | 刘秀萍 | 基于用户评论解析的标签体系精准推荐方法 |
CN116680363A (zh) * | 2023-06-15 | 2023-09-01 | 盐城师范学院 | 一种基于多模态评论数据的情感分析方法 |
-
2023
- 2023-11-17 CN CN202311532345.7A patent/CN117252667A/zh active Pending
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105426528A (zh) * | 2015-12-15 | 2016-03-23 | 中南大学 | 一种商品数据的检索排序方法及*** |
CN106651546A (zh) * | 2017-01-03 | 2017-05-10 | 重庆邮电大学 | 一种面向智慧社区的电子商务信息推荐方法 |
CN107633430A (zh) * | 2017-09-20 | 2018-01-26 | 哈尔滨工业大学 | 一种基于群体社区的商品推荐方法 |
US20190188771A1 (en) * | 2017-12-15 | 2019-06-20 | Capital One Services, Llc | Systems and Methods for Transaction-Based Real Time Pre-Intent Recommendations for a Sequential Purchase |
CN112991017A (zh) * | 2021-03-26 | 2021-06-18 | 刘秀萍 | 基于用户评论解析的标签体系精准推荐方法 |
CN116680363A (zh) * | 2023-06-15 | 2023-09-01 | 盐城师范学院 | 一种基于多模态评论数据的情感分析方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110162693B (zh) | 一种信息推荐的方法以及服务器 | |
Aakash et al. | Assessment of hotel performance and guest satisfaction through eWOM: big data for better insights | |
CN109584006B (zh) | 一种基于深度匹配模型的跨平台商品匹配方法 | |
CN116468460B (zh) | 基于人工智能的消费金融客户画像识别***及其方法 | |
Shen et al. | A voice of the customer real-time strategy: An integrated quality function deployment approach | |
Vatambeti et al. | Twitter sentiment analysis on online food services based on elephant herd optimization with hybrid deep learning technique | |
CN114266443A (zh) | 数据评估方法和装置、电子设备、存储介质 | |
CN113946754A (zh) | 基于用户画像的权益推荐方法、装置、设备及存储介质 | |
CN111429161B (zh) | 特征提取方法、特征提取装置、存储介质及电子设备 | |
CN115131101A (zh) | 一种保险产品个性化智能推荐*** | |
CN114861050A (zh) | 一种基于神经网络的特征融合推荐方法及*** | |
Duarte et al. | Machine learning and marketing: A systematic literature review | |
Shi et al. | Service quality assessment of travel agency O2O model based on improved evidence theory | |
Kim et al. | The method for generating recommended candidates through prediction of multi-criteria ratings using cnn-bilstm | |
Alquhtani et al. | Development of Effective Electronic Customer Relationship Management (ECRM) Model by the Applications of Web Intelligence Analytics | |
Wei et al. | Online shopping behavior analysis for smart business using big data analytics and blockchain security | |
Shou et al. | Predictions on usefulness and popularity of online reviews: evidence from mobile phones for older adults | |
CN116340643B (zh) | 对象推荐的调整方法及装置、存储介质、电子设备 | |
CN112507241A (zh) | 车型推荐方法、获取车型推荐列表的方法、***、介质及电子设备 | |
Gong et al. | Sentiment analysis of online reviews for electric vehicles using the SMAA-2 method and interval type-2 fuzzy sets | |
CN116401450A (zh) | 一种基于知识图谱的推荐方法、装置及计算机设备 | |
Ren et al. | A co-attention based multi-modal fusion network for review helpfulness prediction | |
CN117252667A (zh) | 一种基于大数据的产品推荐方法及*** | |
CN114429384A (zh) | 基于电商平台的产品智能推荐方法及*** | |
Liao et al. | A MULTI-CRITERIA DECISION-MAKING MODEL BASED ON ONLINE CONSUMER REVIEWS UNDER INTERVAL-VALUED PROBABILISTIC LINGUISTIC ENVIRONMENT. |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |