CN117217875A - 商品推荐方法及装置、电子设备及存储介质 - Google Patents

商品推荐方法及装置、电子设备及存储介质 Download PDF

Info

Publication number
CN117217875A
CN117217875A CN202311416533.3A CN202311416533A CN117217875A CN 117217875 A CN117217875 A CN 117217875A CN 202311416533 A CN202311416533 A CN 202311416533A CN 117217875 A CN117217875 A CN 117217875A
Authority
CN
China
Prior art keywords
commodity
user
behavior data
scoring
historical behavior
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202311416533.3A
Other languages
English (en)
Inventor
蒋兴辉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tianyi Electronic Commerce Co Ltd
Original Assignee
Tianyi Electronic Commerce Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tianyi Electronic Commerce Co Ltd filed Critical Tianyi Electronic Commerce Co Ltd
Priority to CN202311416533.3A priority Critical patent/CN117217875A/zh
Publication of CN117217875A publication Critical patent/CN117217875A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种商品推荐方法及装置、电子设备及存储介质,涉及电商技术领域,其中,该商品推荐方法包括:响应用户端的商品搜索请求,得到用户端的用户标识;基于用户标识获取用户端的历史行为数据表,并获取商品评分表和商品词典表;基于历史行为数据表和商品评分表构建商品关联特征表,并基于历史行为数据表和商品词典表构建商品特征权重表;对商品关联特征表和商品特征权重表中的商品进行权重值计算和排序,得到商品列表,并基于商品列表生成商品推荐列表。本发明解决了相关技术中,通过计算用户已购买商品与商城其他商品之间的相似度向用户端推荐感兴趣的产品,造成用户线上购物体验感较差的技术问题。

Description

商品推荐方法及装置、电子设备及存储介质
技术领域
本发明涉及电商技术领域,具体而言,涉及一种商品推荐方法及装置、电子设备及存储介质。
背景技术
随着各大电商平台的快速崛起,线上购物已成为当前最主流的购物方式,随着购物平台的逐渐成熟,用户对于商品搜索的需求也越来越高,目前在线上购物场景中,智能化推荐尚处于萌芽阶段,基于用户的购物行为或搜索行为为用户推荐相似产品,满足用户的购物需求,为用户提供更贴合需求的产品,可以促进用户的购物兴趣。
相关技术中,采用相似度计算方式为用户推荐个性化商品,即向用户推荐购买过或下单过的同类型产品,那以满足用户多方面的购物需求,同时对于新用户,在无法获取用户购买历史和下单历史的情况下,无法有效地向用户进行商品推荐,存在冷启动的问题。
针对上述的问题,目前尚未提出有效的解决方案。
发明内容
本发明实施例提供了一种商品推荐方法及装置、电子设备及存储介质,以至少解决相关技术中,通过计算用户已购买商品与商城其他商品之间的相似度向用户端推荐感兴趣的产品,造成用户线上购物体验感较差的技术问题。
根据本发明实施例的一个方面,提供了一种商品推荐方法,包括:响应用户端的商品搜索请求,得到所述用户端的用户标识;基于所述用户标识获取所述用户端的历史行为数据表,并获取商品评分表和商品词典表,其中,所述历史行为数据表中至少包括:商品标识、商品标签值,所述商品评分表是基于评分模型得到的,所述商品词典表中至少包括:商品标识、商品特征、每个所述商品特征对应的特征权重;基于所述历史行为数据表和所述商品评分表构建商品关联特征表,并基于所述历史行为数据表和所述商品词典表构建商品特征权重表;对所述商品关联特征表和所述商品特征权重表中的商品进行权重值计算和排序,得到商品列表,并基于所述商品列表生成商品推荐列表。
可选地,在基于所述商品列表生成商品推荐列表之后,还包括:基于所述商品推荐列表确定待推荐商品;对所述待推荐商品进行排列,并基于所述待推荐商品对所述用户端的终端页面进行渲染,将所述待推荐商品展示至所述用户端的终端页面。
可选地,基于所述用户标识获取所述用户端的历史行为数据表的步骤包括:基于所述用户标识采集所述用户端的购物行为数据,其中,所述购物行为数据至少包括:所述商品标识、行为特征;基于所述行为特征对每个商品配置标签值,得到商品标签值;基于所述用户标识、所述商品标识和所述商品标签值生成所述用户端的所述历史行为数据表。
可选地,获取商品词典表的步骤包括:对商城中的每个商品进行信息采集,得到商品基本信息,其中,所述商品基本信息至少包括:商品标识、商品特征;对每个所述商品特征赋予权重值,得到所述特征权重,并基于所述商品标识、所述商品特征和所述特征权重生成所述商品词典表。
可选地,基于所述历史行为数据表和所述商品评分表构建商品关联特征表的步骤包括:将所述商品评分表中的每个商品与所述历史行为数据表中的每个商品进行组合,得到关联商品对集合;计算所述关联商品对集合中每个关联商品对的权重值;基于所述关联商品对的权重值计算所述商品评分表中的每个商品与所述用户端的关联权重值;基于每个商品与所述用户端的所述关联权重值生成所述商品关联特征表。
可选地,所述评分模型是预先构建的,构建所述评分模型的步骤包括:采集商城中每个商品的商品信息,其中,所述商品信息至少包括:商品特征标识、商品特征评分值;基于所述商品信息构建样本数据,并基于预设比例将所述样本数据划分为训练集和测试集;基于所述训练集对分类器进行训练,得到初始评分模型;基于所述测试集对所述初始评分模型进行测试,得到测试精确度,在所述测试精确度大于等于预设精确度阈值的情况下,得到所述评分模型。
可选地,基于所述商品信息构建样本数据的步骤包括:对所述商品信息进行预处理,其中,所述预处理至少包括:脱敏处理、数据清洗处理、数据缺失值处理;将预处理后的所述商品信息转化为向量数据,得到商品向量数据集合,并基于所述商品向量数据集合构建所述样本数据。
根据本发明实施例的另一方面,还提供了一种商品推荐装置,包括:响应单元,用于响应用户端的商品搜索请求,得到所述用户端的用户标识;获取单元,用于基于所述用户标识获取所述用户端的历史行为数据表,并获取商品评分表和商品词典表,其中,所述历史行为数据表中至少包括:商品标识、商品标签值,所述商品评分表是基于评分模型得到的,所述商品词典表中至少包括:商品标识、商品特征、每个所述商品特征对应的特征权重;构建单元,用于基于所述历史行为数据表和所述商品评分表构建商品关联特征表,并基于所述历史行为数据表和所述商品词典表构建商品特征权重表;生成单元,用于对所述商品关联特征表和所述商品特征权重表中的商品进行权重值计算和排序,得到商品列表,并基于所述商品列表生成商品推荐列表。
可选地,所述商品推荐装置还包括:第一确定模块,用于基于所述商品推荐列表确定待推荐商品;第一展示模块,用于对所述待推荐商品进行排列,并基于所述待推荐商品对所述用户端的终端页面进行渲染,将所述待推荐商品展示至所述用户端的终端页面。
可选地,所述获取单元包括:第一采集模块,用于基于所述用户标识采集所述用户端的购物行为数据,其中,所述购物行为数据至少包括:所述商品标识、行为特征;第一配置模块,用于基于所述行为特征对每个商品配置标签值,得到商品标签值;第一生成模块,用于基于所述用户标识、所述商品标识和所述商品标签值生成所述用户端的所述历史行为数据表。
可选地,所述获取单元还包括:第二采集模块,用于对商城中的每个商品进行信息采集,得到商品基本信息,其中,所述商品基本信息至少包括:商品标识、商品特征;第一赋予模块,用于对每个所述商品特征赋予权重值,得到所述特征权重,并基于所述商品标识、所述商品特征和所述特征权重生成所述商品词典表。
可选地,所述构建单元包括:第一组合模块,用于将所述商品评分表中的每个商品与所述历史行为数据表中的每个商品进行组合,得到关联商品对集合;第一计算模块,用于计算所述关联商品对集合中每个关联商品对的权重值;第一计算模块,用于基于所述关联商品对的权重值计算所述商品评分表中的每个商品与所述用户端的关联权重值;第二生成模块,用于基于每个商品与所述用户端的所述关联权重值生成所述商品关联特征表。
可选地,所述商品推荐装置还包括:第三采集模块,用于采集商城中每个商品的商品信息,其中,所述商品信息至少包括:商品特征标识、商品特征评分值;第一构建模块,用于基于所述商品信息构建样本数据,并基于预设比例将所述样本数据划分为训练集和测试集;第一训练模块,用于基于所述训练集对分类器进行训练,得到初始评分模型;第一测试模块,用于基于所述测试集对所述初始评分模型进行测试,得到测试精确度,在所述测试精确度大于等于预设精确度阈值的情况下,得到所述评分模型。
可选地,所述第一构建模块包括:第一预处理子模块,用于对所述商品信息进行预处理,其中,所述预处理至少包括:脱敏处理、数据清洗处理、数据缺失值处理;第一转化子模块,用于将预处理后的所述商品信息转化为向量数据,得到商品向量数据集合,并基于所述商品向量数据集合构建所述样本数据。
根据本发明实施例的另一方面,还提供了一种计算机可读存储介质,所述计算机可读存储介质包括存储的计算机程序,其中,在所述计算机程序运行时控制所述计算机可读存储介质所在设备执行上述任意一项商品推荐方法。
根据本发明实施例的另一方面,还提供了一种电子设备,包括一个或多个处理器和存储器,所述存储器用于存储一个或多个程序,其中,当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器实现上述任意一项商品推荐方法。
在本公开中,通过以下步骤:先响应用户端的商品搜索请求,得到用户端的用户标识;再基于用户标识获取用户端的历史行为数据表,并获取商品评分表和商品词典表,其中,历史行为数据表中至少包括:商品标识、商品标签值,商品评分表是基于评分模型得到的,商品词典表中至少包括:商品标识、商品特征、每个商品特征对应的特征权重;然后基于历史行为数据表和商品评分表构建商品关联特征表,并基于历史行为数据表和商品词典表构建商品特征权重表;最后对商品关联特征表和商品特征权重表中的商品进行权重值计算和排序,得到商品列表,并基于商品列表生成商品推荐列表。
在本公开中,通过用户端的历史行为数据表,商品评分表以及商品词典表对商城中的商品进行综合评估,根据历史行为数据表和商品评分表构建商品关联特征表,将商城中的商品与用户端购买的历史商品进行关联,确定用户对商品的感兴趣程度,同时根据历史行为数据表和商品词典表构建商品特征权重表,确定商品的特征权重,进而获取商品对应的权重值,最后根据商品关联特征表和商品特征权重表中记载的商品进行权重值计算和排序,得到用户端对应的商品推荐列表,综合分析用户对商品的需求程度,为用户端精准推荐需求商品,提升用户满意度,进而解决了相关技术中,通过计算用户已购买商品与商城其他商品之间的相似度向用户端推荐感兴趣的产品,造成用户线上购物体验感较差的技术问题。
附图说明
此处所说明的附图用来提供对本发明的进一步理解,构成本申请的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1是根据本发明实施例的一种可选的商品推荐方法的流程图;
图2是根据本发明实施例的一种可选的商品推荐流程的示意图;
图3是根据本发明实施例的一种可选的商品在线排序的流程图;
图4是根据本发明实施例的一种可选的商品推荐装置的示意图;
图5是根据本发明实施例的一种商品推荐方法的电子设备(或移动设备)的硬件结构框图。
具体实施方式
为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分的实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、***、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
为便于本领域技术人员理解本发明,下面对本发明各实施例中涉及的部分术语或名词做出解释:
支持向量机,Support Vector Machine,简称SVM,是一种用于分类和回归分析的机器学习方法。
梯度提升决策树,Gradient Boosting Decision Tree,简称GBDT,是一种常用的集成学习方法,通过迭代地训练决策树模型并将其组合起来,以提高整体模型的性能。
随机森林,Random Forest,是一种常用的集成学习方法。
梯度提升框架,Gradient Boosting Framework,简称XGBoost是一种增强的决策树算法。
ETL,(抽取、转换、加载)是一种常见的数据处理过程,用于从源***中抽取数据,经过转换后加载到目标***中,以满足不同业务需求。
数据结构服务器,Redis,是一种开源的内存数据结构存储***,支持多种数据结构,如字符串、哈希表、列表、集合等。
需要说明的是,本公开中的商品推荐方法及其装置可用于电商技术领域在对商品进行综合评估,并根据用户需求进行商品推荐的情况下,也可用于除电商技术领域之外的任意领域在对商品进行综合评估,并根据用户需求进行商品推荐的情况下,本公开中对商品推荐方法及其装置的应用领域不做限定。
需要说明的是,本公开所涉及的相关信息(包括但不限于用户设备信息、用户个人信息等)和数据(包括但不限于用于分析的数据、存储的数据、展示的数据等),均为经用户授权或者经过各方充分授权的信息和数据,并且相关数据的收集、使用和处理需要遵守相关地区的相关法律法规和标准,并提供有相应的操作入口,供用户选择授权或者拒绝。例如,本***和相关用户或机构间设置有接口,在获取相关信息之前,需要通过接口向前述的用户或机构发送获取请求,并在接收到前述的用户或机构反馈的同意信息后,获取相关信息。
本发明下述各实施例可应用于各种商品推荐***/应用/设备中。本发明通过用户端的历史行为数据表、商品评分表以及商品词典表对商品进行综合评估,预先建立了评分模型对商品进行评分,获取用户需求的商品,以用户为中心,提高用户购物体验,减少信息冗杂给用户带来的困扰,满足用户选购需求,降低用户选择的机会成本。
本发明针对冷启动问题,提出通过特征索引获取每个商品的综合权重,进而保证新用户登录电商平台时可以为用户推荐大众偏好商品,解决冷启动的问题。
下面结合各个实施例来详细说明本发明。
实施例一
根据本发明实施例,提供了一种商品推荐方法的实施例,需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机***中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
图1是根据本发明实施例的一种可选的商品推荐方法的流程图,如图1所示,该方法包括如下步骤:
步骤S101,响应用户端的商品搜索请求,得到用户端的用户标识;
步骤S102,基于用户标识获取用户端的历史行为数据表,并获取商品评分表和商品词典表,其中,历史行为数据表中至少包括:商品标识、商品标签值,商品评分表是基于评分模型得到的,商品词典表中至少包括:商品标识、商品特征、每个商品特征对应的特征权重;
步骤S103,基于历史行为数据表和商品评分表构建商品关联特征表,并基于历史行为数据表和商品词典表构建商品特征权重表;
步骤S104,对商品关联特征表和商品特征权重表中的商品进行权重值计算和排序,得到商品列表,并基于商品列表生成商品推荐列表。
通过上述步骤,先响应用户端的商品搜索请求,得到用户端的用户标识;再基于用户标识获取用户端的历史行为数据表,并获取商品评分表和商品词典表,其中,历史行为数据表中至少包括:商品标识、商品标签值,商品评分表是基于评分模型得到的,商品词典表中至少包括:商品标识、商品特征、每个商品特征对应的特征权重;然后基于历史行为数据表和商品评分表构建商品关联特征表,并基于历史行为数据表和商品词典表构建商品特征权重表;最后对商品关联特征表和商品特征权重表中的商品进行权重值计算和排序,得到商品列表,并基于商品列表生成商品推荐列表。
本实施例中,通过用户端的历史行为数据表,商品评分表以及商品词典表对商城中的商品进行综合评估,根据历史行为数据表和商品评分表构建商品关联特征表,将商城中的商品与用户端购买的历史商品进行关联,确定用户对商品的感兴趣程度,同时根据历史行为数据表和商品词典表构建商品特征权重表,确定商品的特征权重,进而获取商品对应的权重值,最后根据商品关联特征表和商品特征权重表中记载的商品进行权重值计算和排序,得到用户端对应的商品推荐列表,综合分析用户对商品的需求程度,为用户端精准推荐需求商品,提升用户满意度,进而解决了相关技术中,通过计算用户已购买商品与商城其他商品之间的相似度向用户端推荐感兴趣的产品,造成用户线上购物体验感较差的技术问题。
下面结合上述各步骤对本发明实施例进行详细说明。
需要说明的是,本发明实施例的实施主体为商品推荐***,该商品推荐***可以部署在各电商平台,通过商品推荐***获取用户偏好和需求,进而为用户进行个性化商品的推荐,提升用户线上购物的兴趣。
需要说明的是,现有的商品推荐技术是通过对用户已经购买的商品或浏览过的商品与商城中其他商品进行相似度计算,根据计算得到的相似度值为用户进行商品的推荐,但依据用户购买行为大量推荐相似商品,使得用户在电商平台被动接受已经购买过的相似商品,容易产生倦怠,缺乏新鲜感,购买愿望和动机不强烈,且现有的推荐方式属于大数据商品推荐,用户在实际购物过程中,还需要从海量相似商品去选择需求商品或服务,在抉择和比较上浪费时间,造成用户体验感较差。
另外,现有的商品推荐技术存在冷启动问题,在新用户进入平台的情况下,没有产生任何行为记录,平台对于该用户行为数据和用户特征数据无法获取,无法根据用户历史行为获取用户需求的商品,无法满足其偏好,容易造成用户流失,同时对于用户短暂离开浏览和支付页面的情况,***根据停留时长自动为商品进行打分,容易造成误判,其他的特殊情况例如竞争对手的恶意差评等,也可能造成误判的情况。
可选地,评分模型是预先构建的,构建评分模型的步骤包括:采集商城中每个商品的商品信息,其中,商品信息至少包括:商品特征标识、商品特征评分值;基于商品信息构建样本数据,并基于预设比例将样本数据划分为训练集和测试集;基于训练集对分类器进行训练,得到初始评分模型;基于测试集对初始评分模型进行测试,得到测试精确度,在测试精确度大于等于预设精确度阈值的情况下,得到评分模型。
需要说明的是,本发明实施例结合大数据技术和AI算法,通过构建评分模型,由评分模型对商城中的所有商品进行综合评分,评分模型的构建首先需要采集商城中每个商品的商品信息,包括每个商品的特征标识,以及该商品历史时间段内的特征评分值,根据采集的数据即可构建样本数据,将样本数据拆分为训练集和测试集,然后采用训练集对分类器进行训练,得到初始评分模型,然后基于测试集对初始评分模型进行测试,测试通过则得到训练好的评分模型,评分模型可以定时输出商城中所有商品特征的评分值,得到商品评分表,也可以将商品标识或商品特征标识输入至评分模型,根据特征索引获取需要的商品评分表,同时,评分模型需要根据平台商品的数据变化定时进行更新,保证模型使用的样本数据都是最新的。
需要说明的是,本发明采用分类算法堆叠和交叉验证的方式进行模型训练,输出商品评分表,模型训练算法包括SVM,GBDT,随机森林和XGBOOST,SVM将不同类样本在样本空间分隔成超平面,通过内积核函数代替向高维空间的非线性映射,寻找最优的超平面,最大化分类边际,从而达到最优分类和预测的目的;GBDT又称梯度提升决策树,GBDT使用CART回归树作为分类器,通过多轮迭代,每轮迭代产生一个弱分类器,过经验风险极小化来确定下一个弱分类器的参数,每个分类器在上一轮分类器的残差基础上进行训练,不断拟合平方损失函数,最终通过多轮迭代的弱学***均投票的方式来建立森林模型,随机森林包含很多独立的决策树,通过博采众长,少数服从多数,最终做出分类预测;XGBOOST分类算法和GBDT同属于Boosting集成学***方损失函数,最终提高模型性能和准确度。
本发明实施例中使用SVM,GBDT,随机森林作为基学习器,使用XGBOOST作为权重分类学习器,将基学习器预测的结果灌入到XGBOOST中,开始时赋予相同权重,随着训练深入不断优化入参,分配合适的权重参数,最终以XGBOOST的结果输出作为模型评分结果。
可选地,基于商品信息构建样本数据的步骤包括:对商品信息进行预处理,其中,预处理至少包括:脱敏处理、数据清洗处理、数据缺失值处理;将预处理后的商品信息转化为向量数据,得到商品向量数据集合,并基于商品向量数据集合构建样本数据。
需要说明的是,在构建评分模型时需要注意,得到的特征是以字符的形式呈现的,为了构建评分模型,需要将特征数据转化为机器学习使用的向量数据,且在进行向量转化之前,还需要对原始数据进行预处理,包括对敏感数据进行脱敏处理,对数据进行清洗处理以及对数据缺失值进行处理,在对数据缺失值进行处理时,可以采用均值/中位数/众数插补法、固定值替换法、最近临补法,回归方法、插值法等方法,同时对于存在异常的数据,可以采用以下方法排除异常:第一,业务规则干预,对明显不符合业务逻辑的数据过滤和抛弃;第二,依据数据的上下界、上下四分位数、中位数、均值是否符合正态分布,通过数据挖掘方法对不合理数据进行规避。
步骤S101,响应用户端的商品搜索请求,得到用户端的用户标识。
需要说明的是,在用户登入平台时,实时采集用户的浏览行为,根据用户的搜索请求,获取用户端的用户标识,并根据用户的搜索请求确定用户对应的需求商品。
步骤S102,基于用户标识获取用户端的历史行为数据表,并获取商品评分表和商品词典表,其中,历史行为数据表中至少包括:商品标识、商品标签值,商品评分表是基于评分模型得到的,商品词典表中至少包括:商品标识、商品特征、每个商品特征对应的特征权重。
可选地,基于用户标识获取用户端的历史行为数据表的步骤包括:基于用户标识采集用户端的购物行为数据,其中,购物行为数据至少包括:商品标识、行为特征;基于行为特征对每个商品配置标签值,得到商品标签值;基于用户标识、商品标识和商品标签值生成用户端的历史行为数据表。
需要说明的是,在响应用户端的商品搜索请求之后,首先需要获取该用户端对应用户标识的历史行为数据表,历史行为数据表示根据用户端的历史购物行为数据建立的,首先获取用户对于各个商品的购物行为,并为该行为特征对应的商品配置标签值,得到商品标签值,然后根据用户标识,商品标识和商品标签值生成历史行为数据表,行为特征包括:商品评价、商品转发推荐、商品收藏、商品加购、文字评论、晒图评论、商品下单、商品浏览、商品主页停留时间和跳转页面数等,在配置标签时,对于商品评价,可以根据评价的星级为商品配置1-5的标签值,对于商品转发推荐行为可以依据是否推荐和转发为商品配置0和1的标签等。
可选地,获取商品词典表的步骤包括:对商城中的每个商品进行信息采集,得到商品基本信息,其中,商品基本信息至少包括:商品标识、商品特征;对每个商品特征赋予权重值,得到特征权重,并基于商品标识、商品特征和特征权重生成商品词典表。
需要说明的是,商品词典表反映基本每个商品的基本权重,权重信息来源于商品品牌,商品版本,商家实力,信用度,线下渠道布局等,用于客观反映商品初始价值和初始评分,可以很好地解决推荐***中的冷启动问题,并对商品进行更为全面的综合评估。
同时,为了应对推荐冷启动的问题,在数据采集时,除了关注业务行为数据本身,还可以关注商品和用户基础数据的采集,例如对用户基础信息进行采集,如年龄,性别,职业,地域等,可以作为用户粗粒度的个性化推荐依据;对专家知识进行采集,利用权威专家,资深购物者,达人,市场人士对商品的评价快速建立起物品的初始评分表(对应于上述商品词典表);采集商品的基本信息,例如厂家,线下口碑,品牌知名度,内容推广信息,生产日期等,作为快速建立物品初始评分表(对应于上述商品词典表)的依据。
步骤S103,基于历史行为数据表和商品评分表构建商品关联特征表,并基于历史行为数据表和商品词典表构建商品特征权重表。
需要说明的是,根据三张基础表,包括历史行为数据表、商品评分表和商品词典表,可以生成两张子表,分别为商品关联特征表和商品特征权重表。
可选地,基于历史行为数据表和商品评分表构建商品关联特征表的步骤包括:将商品评分表中的每个商品与历史行为数据表中的每个商品进行组合,得到关联商品对集合;计算关联商品对集合中每个关联商品对的权重值;基于关联商品对的权重值计算商品评分表中的每个商品与用户端的关联权重值;基于每个商品与用户端的关联权重值生成商品关联特征表。
需要说明的是,商品关联特征表用于将用户未浏览或购买过的新商品与用户已经浏览或购买过的商品关联起来,计算新商品与用户之间的关联度,进而确定是否需要向用户推荐该新商品。
需要说明的是,在进行商品关联时,将商品评分表中的每个商品与历史行为数据表中的每个商品进行组合,得到关联商品对,然后根据商品对中关联商品各自的权重值计算该关联商品对的权重值,进而计算商品评分表中记载的每个商品与用户端之间的权重值,得到关联特征表。
步骤S104,对商品关联特征表和商品特征权重表中的商品进行权重值计算和排序,得到商品列表,并基于商品列表生成商品推荐列表。
可选地,在基于商品列表生成商品推荐列表之后,还包括:基于商品推荐列表确定待推荐商品;对待推荐商品进行排列,并基于待推荐商品对用户端的终端页面进行渲染,将待推荐商品展示至用户端的终端页面。
需要说明的是,根据历史行为数据表、商品评分表和商品词典表生成两张子表后,每张子表中记载了个商品与该用户端对应的权重值或商品特征与该用户端对应的权重值,根据表中记载的商品权重值进行计算,得到上商城中每件商品的综合权重值,对权重值进行排序,选取权重值排在前面的N个商品,并根据选取的商品生成商品推荐列表。
需要说明的是,商品推荐***在生成用户端的商品推荐列表后,与用户端终端界面进行交互,将推荐的商品按照猜你喜欢、个性化推荐等标签进行排列,并基于排列好的商品将商城中用户端感兴趣的商品展示在用户端终端界面上。
下面结合另一种可选的具体实施方式进行详细说明。
商品推荐***分为四层结构,分别为数据来源层,数据仓库层,计算***和应用层。
数据来源层作为***底层,用于对用户历史数据和商品基本信息,用户实时行为数据,比如浏览行为数据,购买行为数据,点击行为数据等信息进行采集,用户实时行为数据可以通过前端埋点、Kafka和Flink管道,流入上层,具备数据流向的实时性,实时反映用户当下在电商平台某个时间片段内的购物行为和商品偏好,用户历史业务数据则是基于历史时间段内存储在数据仓库中的业务数据,数据存放在HDFS数据库上,数据体量大,不易丢失,是电商平台重要的数据资产,推荐***将基于数据来源层采集的数据源进行计算,分析和运营,产出相关的推荐偏好内容。
中间两层计算***和数据仓库层属于基础设施层,数据仓库层可以执行最基础的数据计算,目的是完成用户画像,ETL数据清洗过滤,模型训练集的建设,基础数据分析,索引列表构建等基础功能,为上层计算***提供高质量的训练集和分析参考。
计算***遵循推荐工序的三段式,即召回、排序、重排的推荐策略,涵盖了机器学习,深度学习的算法模型,目的是产出推荐***的模型文件(对应于上述商品评分表),该模型文件可理解成为是算法评分卡,后续向用户个性化推荐商品都是基于算法评分卡进行排序的。具体来说,召回模型分为热门召回,协同过滤,商品偏好,关联规则,主要目的是通过召回,将用户基础特征,行为特征,海量商品库,进行粗筛选,从海量数据中过滤和删减不必要的数据,为后续数据训练减轻负担,提高训练的效率和训练质量,提高推荐服务的实时性。排序是运用机器学习和深度学习的方法对训练集进行排序和商品评分,以模型文件形式输出。重排是实施人工干预,运营调控,围绕用户体验,进行适当去重,打散,丰富多样性,商品升权降权,置顶沉底,以此实现商品推荐的灵活分发,改善用户体验。
应用层是直接面向用户的,将下层的推荐列表和商品详情缓存在Redis数据库中,并展示在用户端的终端页面,内容可以为:猜你喜欢,个性化推荐,商品零售等,向用户投放推荐流,形成良好的用户体验。
图2是根据本发明实施例的一种可选的商品推荐流程的示意图,如图2所示,商品推荐流程包括在线推荐和离线训练两部分,用户端登入购物平台后,购物平台的商品推荐***向用户端进行推荐服务,在线推荐包括服务路由、特征索引、特征抽取和预测评分四个部分,离线训练包括样本抽取、特征抽取、训练集生成、特征索引生成和训练模型五个部分,离线训练从数据库获取样本数据,并将构建好的预测模型存入REDIS缓存,等到需要进行商品推荐服务时直接调用该模型对商品进行评估。
图3是根据本发明实施例的一种可选的商品在线排序的流程图,如图3所示,首先建立商品评分表、历史行为数据表和商品词典表三张数据表,每张表中存储有特征和权重值,然后基于商品评分表和历史行为数据表构建商品关联特征表和商品基本权重表,两张表通过用户标识进行关联,然后对商品关联特征表和商品基本权重表进行权重排序计算,得到商品推荐列表,最后由商品推荐***将商品推荐列表中的商品展示至用户端的终端界面。
下面结合另一实施例进行详细说明。
实施例二
本实施例中提供的一种商品推荐装置包含了多个实施单元,每个实施单元对应于上述实施例一中的各个实施步骤。
图4是根据本发明实施例的一种可选的商品推荐装置的示意图,如图4所示,该商品推荐装置包括:响应单元41、获取单元42、构建单元43、生成单元44,其中,
响应单元41,用于响应用户端的商品搜索请求,得到用户端的用户标识;
获取单元42,用于基于用户标识获取用户端的历史行为数据表,并获取商品评分表和商品词典表,其中,历史行为数据表中至少包括:商品标识、商品标签值,商品评分表是基于评分模型得到的,商品词典表中至少包括:商品标识、商品特征、每个商品特征对应的特征权重;
构建单元43,用于基于历史行为数据表和商品评分表构建商品关联特征表,并基于历史行为数据表和商品词典表构建商品特征权重表;
生成单元44,用于对商品关联特征表和商品特征权重表中的商品进行权重值计算和排序,得到商品列表,并基于商品列表生成商品推荐列表。
上述商品推荐装置,通过响应单元41响应用户端的商品搜索请求,得到用户端的用户标识;通过获取单元42基于用户标识获取用户端的历史行为数据表,并获取商品评分表和商品词典表,其中,历史行为数据表中至少包括:商品标识、商品标签值,商品评分表是基于评分模型得到的,商品词典表中至少包括:商品标识、商品特征、每个商品特征对应的特征权重;通过构建单元43基于历史行为数据表和商品评分表构建商品关联特征表,并基于历史行为数据表和商品词典表构建商品特征权重表;通过生成单元44对商品关联特征表和商品特征权重表中的商品进行权重值计算和排序,得到商品列表,并基于商品列表生成商品推荐列表。
本实施例中,通过用户端的历史行为数据表,商品评分表以及商品词典表对商城中的商品进行综合评估,根据历史行为数据表和商品评分表构建商品关联特征表,将商城中的商品与用户端购买的历史商品进行关联,确定用户对商品的感兴趣程度,同时根据历史行为数据表和商品词典表构建商品特征权重表,确定商品的特征权重,进而获取商品对应的权重值,最后根据商品关联特征表和商品特征权重表中记载的商品进行权重值计算和排序,得到用户端对应的商品推荐列表,综合分析用户对商品的需求程度,为用户端精准推荐需求商品,提升用户满意度,进而解决了相关技术中,通过计算用户已购买商品与商城其他商品之间的相似度向用户端推荐感兴趣的产品,造成用户线上购物体验感较差的技术问题。
可选地,商品推荐装置还包括:第一确定模块,用于基于商品推荐列表确定待推荐商品;第一展示模块,用于对待推荐商品进行排列,并基于待推荐商品对用户端的终端页面进行渲染,将待推荐商品展示至用户端的终端页面。
可选地,获取单元包括:第一采集模块,用于基于用户标识采集用户端的购物行为数据,其中,购物行为数据至少包括:商品标识、行为特征;第一配置模块,用于基于行为特征对每个商品配置标签值,得到商品标签值;第一生成模块,用于基于用户标识、商品标识和商品标签值生成用户端的历史行为数据表。
可选地,获取单元还包括:第二采集模块,用于对商城中的每个商品进行信息采集,得到商品基本信息,其中,商品基本信息至少包括:商品标识、商品特征;第一赋予模块,用于对每个商品特征赋予权重值,得到特征权重,并基于商品标识、商品特征和特征权重生成商品词典表。
可选地,构建单元包括:第一组合模块,用于将商品评分表中的每个商品与历史行为数据表中的每个商品进行组合,得到关联商品对集合;第一计算模块,用于计算关联商品对集合中每个关联商品对的权重值;第一计算模块,用于基于关联商品对的权重值计算商品评分表中的每个商品与用户端的关联权重值;第二生成模块,用于基于每个商品与用户端的关联权重值生成商品关联特征表。
可选地,商品推荐装置还包括:第三采集模块,用于采集商城中每个商品的商品信息,其中,商品信息至少包括:商品特征标识、商品特征评分值;第一构建模块,用于基于商品信息构建样本数据,并基于预设比例将样本数据划分为训练集和测试集;第一训练模块,用于基于训练集对分类器进行训练,得到初始评分模型;第一测试模块,用于基于测试集对初始评分模型进行测试,得到测试精确度,在测试精确度大于等于预设精确度阈值的情况下,得到评分模型。
可选地,第一构建模块包括:第一预处理子模块,用于对商品信息进行预处理,其中,预处理至少包括:脱敏处理、数据清洗处理、数据缺失值处理;第一转化子模块,用于将预处理后的商品信息转化为向量数据,得到商品向量数据集合,并基于商品向量数据集合构建样本数据。
上述的商品推荐装置还可以包括处理器和存储器,上述响应单元41、获取单元42、构建单元43、生成单元44等均作为程序单元存储在存储器中,由处理器执行存储在存储器中的上述程序单元来实现相应的功能。
上述处理器中包含内核,由内核去存储器中调取相应的程序单元。内核可以设置一个或以上,通过调整内核参数来为用户端推荐商品。
上述存储器可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM),存储器包括至少一个存储芯片。
根据本发明实施例的另一方面,还提供了一种计算机可读存储介质,计算机可读存储介质包括存储的计算机程序,其中,在计算机程序运行时控制计算机可读存储介质所在设备执行上述任意一项商品推荐方法。
根据本发明实施例的另一方面,还提供了一种电子设备,包括一个或多个处理器和存储器,存储器用于存储一个或多个程序,其中,当一个或多个程序被一个或多个处理器执行时,使得一个或多个处理器实现上述任意一项商品推荐方法。
本申请还提供了一种计算机程序产品,当在数据处理设备上执行时,适于执行初始化有如下方法步骤的程序:响应用户端的商品搜索请求,得到用户端的用户标识;基于用户标识获取用户端的历史行为数据表,并获取商品评分表和商品词典表,其中,历史行为数据表中至少包括:商品标识、商品标签值,商品评分表是基于评分模型得到的,商品词典表中至少包括:商品标识、商品特征、每个商品特征对应的特征权重;基于历史行为数据表和商品评分表构建商品关联特征表,并基于历史行为数据表和商品词典表构建商品特征权重表;对商品关联特征表和商品特征权重表中的商品进行权重值计算和排序,得到商品列表,并基于商品列表生成商品推荐列表。
图5是根据本发明实施例的一种商品推荐方法的电子设备(或移动设备)的硬件结构框图。如图5所示,电子设备可以包括一个或多个(图5中采用502a、502b,……,502n来示出)处理器502(处理器502可以包括但不限于微处理器MCU或可编程逻辑器件FPGA等的处理装置)、用于存储数据的存储器504。除此以外,还可以包括:显示器、输入/输出接口(I/O接口)、通用串行总线(USB)端口(可以作为I/O接口的端口中的一个端口被包括)、网络接口、键盘、电源和/或相机。本领域普通技术人员可以理解,图5所示的结构仅为示意,其并不对上述电子装置的结构造成限定。例如,电子设备还可包括比图5中所示更多或者更少的组件,或者具有与图5所示不同的配置。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
在本发明的上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
在本申请所提供的几个实施例中,应该理解到,所揭露的技术内容,可通过其它的方式实现。其中,以上所描述的装置实施例仅仅是示意性的,例如所述单元的划分,可以为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个***,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,单元或模块的间接耦合或通信连接,可以是电性或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可为个人计算机、服务器或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。

Claims (10)

1.一种商品推荐方法,其特征在于,包括:
响应用户端的商品搜索请求,得到所述用户端的用户标识;
基于所述用户标识获取所述用户端的历史行为数据表,并获取商品评分表和商品词典表,其中,所述历史行为数据表中至少包括:商品标识、商品标签值,所述商品评分表是基于评分模型得到的,所述商品词典表中至少包括:商品标识、商品特征、每个所述商品特征对应的特征权重;
基于所述历史行为数据表和所述商品评分表构建商品关联特征表,并基于所述历史行为数据表和所述商品词典表构建商品特征权重表;
对所述商品关联特征表和所述商品特征权重表中的商品进行权重值计算和排序,得到商品列表,并基于所述商品列表生成商品推荐列表。
2.根据权利要求1所述的商品推荐方法,其特征在于,在基于所述商品列表生成商品推荐列表之后,还包括:
基于所述商品推荐列表确定待推荐商品;
对所述待推荐商品进行排列,并基于所述待推荐商品对所述用户端的终端页面进行渲染,将所述待推荐商品展示至所述用户端的终端页面。
3.根据权利要求1所述的商品推荐方法,其特征在于,基于所述用户标识获取所述用户端的历史行为数据表的步骤包括:
基于所述用户标识采集所述用户端的购物行为数据,其中,所述购物行为数据至少包括:所述商品标识、行为特征;
基于所述行为特征对每个商品配置标签值,得到商品标签值;
基于所述用户标识、所述商品标识和所述商品标签值生成所述用户端的所述历史行为数据表。
4.根据权利要求1所述的商品推荐方法,其特征在于,获取商品词典表的步骤包括:
对商城中的每个商品进行信息采集,得到商品基本信息,其中,所述商品基本信息至少包括:商品标识、商品特征;
对每个所述商品特征赋予权重值,得到所述特征权重,并基于所述商品标识、所述商品特征和所述特征权重生成所述商品词典表。
5.根据权利要求1所述的商品推荐方法,其特征在于,基于所述历史行为数据表和所述商品评分表构建商品关联特征表的步骤包括:
将所述商品评分表中的每个商品与所述历史行为数据表中的每个商品进行组合,得到关联商品对集合;
计算所述关联商品对集合中每个关联商品对的权重值;
基于所述关联商品对的权重值计算所述商品评分表中的每个商品与所述用户端的关联权重值;
基于每个商品与所述用户端的所述关联权重值生成所述商品关联特征表。
6.根据权利要求1所述的商品推荐方法,其特征在于,所述评分模型是预先构建的,构建所述评分模型的步骤包括:
采集商城中每个商品的商品信息,其中,所述商品信息至少包括:商品特征标识、商品特征评分值;
基于所述商品信息构建样本数据,并基于预设比例将所述样本数据划分为训练集和测试集;
基于所述训练集对分类器进行训练,得到初始评分模型;
基于所述测试集对所述初始评分模型进行测试,得到测试精确度,在所述测试精确度大于等于预设精确度阈值的情况下,得到所述评分模型。
7.根据权利要求6所述的商品推荐方法,其特征在于,基于所述商品信息构建样本数据的步骤包括:
对所述商品信息进行预处理,其中,所述预处理至少包括:脱敏处理、数据清洗处理、数据缺失值处理;
将预处理后的所述商品信息转化为向量数据,得到商品向量数据集合,并基于所述商品向量数据集合构建所述样本数据。
8.一种商品推荐装置,其特征在于,包括:
响应单元,用于响应用户端的商品搜索请求,得到所述用户端的用户标识;
获取单元,用于基于所述用户标识获取所述用户端的历史行为数据表,并获取商品评分表和商品词典表,其中,所述历史行为数据表中至少包括:商品标识、商品标签值,所述商品评分表是基于评分模型得到的,所述商品词典表中至少包括:商品标识、商品特征、每个所述商品特征对应的特征权重;
构建单元,用于基于所述历史行为数据表和所述商品评分表构建商品关联特征表,并基于所述历史行为数据表和所述商品词典表构建商品特征权重表;
生成单元,用于对所述商品关联特征表和所述商品特征权重表中的商品进行权重值计算和排序,得到商品列表,并基于所述商品列表生成商品推荐列表。
9.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质包括存储的计算机程序,其中,在所述计算机程序运行时控制所述计算机可读存储介质所在设备执行权利要求1至7中任意一项所述的商品推荐方法。
10.一种电子设备,其特征在于,包括一个或多个处理器和存储器,所述存储器用于存储一个或多个程序,其中,当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器实现权利要求1至7中任意一项所述的商品推荐方法。
CN202311416533.3A 2023-10-27 2023-10-27 商品推荐方法及装置、电子设备及存储介质 Pending CN117217875A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202311416533.3A CN117217875A (zh) 2023-10-27 2023-10-27 商品推荐方法及装置、电子设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202311416533.3A CN117217875A (zh) 2023-10-27 2023-10-27 商品推荐方法及装置、电子设备及存储介质

Publications (1)

Publication Number Publication Date
CN117217875A true CN117217875A (zh) 2023-12-12

Family

ID=89037392

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202311416533.3A Pending CN117217875A (zh) 2023-10-27 2023-10-27 商品推荐方法及装置、电子设备及存储介质

Country Status (1)

Country Link
CN (1) CN117217875A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117876029A (zh) * 2024-03-12 2024-04-12 南京摆渡人网络信息技术有限公司 一种基于商品推广的人机交互优化***、方法及装置
CN117952711A (zh) * 2024-01-22 2024-04-30 杭州河狸家信息技术有限公司 基于人工智能的电商个性化精准导购方法

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117952711A (zh) * 2024-01-22 2024-04-30 杭州河狸家信息技术有限公司 基于人工智能的电商个性化精准导购方法
CN117876029A (zh) * 2024-03-12 2024-04-12 南京摆渡人网络信息技术有限公司 一种基于商品推广的人机交互优化***、方法及装置
CN117876029B (zh) * 2024-03-12 2024-05-07 南京摆渡人网络信息技术有限公司 一种基于商品推广的人机交互优化***、方法及装置

Similar Documents

Publication Publication Date Title
CN110222272B (zh) 一种潜在客户挖掘与推荐方法
CN107944913B (zh) 基于大数据用户行为分析的高***购买意向预测方法
CN117217875A (zh) 商品推荐方法及装置、电子设备及存储介质
CN109189904A (zh) 个性化搜索方法及***
KR102227552B1 (ko) 상황인지 알고리즘 기반 리뷰 카테고리를 이용한 음식점 노출 개인화 서비스 제공 시스템
CN107862530A (zh) 建立用户人际关系信息的方法及装置
CN108022152A (zh) 基于图像识别的用户商品自动推荐***及推荐方法
CN106708821A (zh) 基于用户个性化购物行为进行商品推荐的方法
CN107730346A (zh) 物品聚类的方法和装置
WO2017028735A1 (zh) 选择及推荐展示对象的方法及装置
CN112435067A (zh) 跨电商平台与社交平台的智能广告投放方法及***
KR101646312B1 (ko) 개인행동기반 관심 대상 및 선호 분야 분석시스템 및 그 방법
CN110019943A (zh) 视频推荐方法、装置、电子设备和存储介质
CN111949887A (zh) 物品推荐方法、装置及计算机可读存储介质
JP6976207B2 (ja) 情報処理装置、情報処理方法、およびプログラム
KR102322668B1 (ko) 콘텐츠 크리에이터의 창작활동 활성화를 위한 다중 플랫폼 서비스 제공 시스템
Levinas An analysis of memory based collaborative filtering recommender systems with improvement proposals
CN106708871A (zh) 一种社交业务特征用户的识别方法和装置
CN111177581A (zh) 一种基于多平台的社交电商网站商品推荐方法及装置
CN104981829A (zh) 优选图像标识码生成方法、优选图像标识码诊断方法及利用优选图像标识码的信息提供方法
KR101754124B1 (ko) 레스토랑 추천 시스템 및 추천 방법
JP6360625B2 (ja) 検証支援システム及び方法
CN116561291A (zh) 基于自然语言智能转化模型的智能推荐方法和***
CN108416611B (zh) 一种超市路径推荐***及其方法
KR102576123B1 (ko) 제품 공동구매 연계 시스템 및 방법

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination