CN110490637A - 商品组的推荐方法、装置、电子设备及可读存储介质 - Google Patents
商品组的推荐方法、装置、电子设备及可读存储介质 Download PDFInfo
- Publication number
- CN110490637A CN110490637A CN201910636573.6A CN201910636573A CN110490637A CN 110490637 A CN110490637 A CN 110490637A CN 201910636573 A CN201910636573 A CN 201910636573A CN 110490637 A CN110490637 A CN 110490637A
- Authority
- CN
- China
- Prior art keywords
- commodity
- sample
- activation
- feature vector
- end article
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9536—Search customisation based on social or collaborative filtering
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0241—Advertisements
- G06Q30/0251—Targeted advertisements
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Business, Economics & Management (AREA)
- Finance (AREA)
- Strategic Management (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Accounting & Taxation (AREA)
- Development Economics (AREA)
- General Engineering & Computer Science (AREA)
- Entrepreneurship & Innovation (AREA)
- Game Theory and Decision Science (AREA)
- Data Mining & Analysis (AREA)
- Economics (AREA)
- Marketing (AREA)
- General Business, Economics & Management (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本公开的实施例提供了一种商品组的推荐方法、装置、电子设备及可读存储介质,所述方法包括:针对目标商品组中每个商品,根据商品对应的个体特征生成个体特征向量;根据个体特征向量确定商品在目标商品组中的权重;根据商品的个体特征向量、商品在目标商品组中的权重、目标商品组的综合特征生成目标商品组的综合特征向量;将综合特征向量输入至激活函数中预测得到目标商品组的质量得分;根据质量得分将目标商品组推荐给用户。可以根据商品组合中各商品的特征预估商品组合的质量得分,有助于提高推荐准确度,且商品组合的灵活性更好。
Description
技术领域
本公开的实施例涉及个性化推荐技术领域,尤其涉及一种商品组的推荐方法、装置、电子设备及可读存储介质。
背景技术
个性化推荐通过商品特征、用户特征确定用户可能感兴趣的商品,并推荐给用户。个性化推荐广泛应用于各种领域,例如,在餐饮领域中,可以将多种菜品合理搭配组成菜品组合,以向用户推荐。
现有技术中,菜品组合的推荐过程主要包括:首先,根据用户的每天所需基础热量及提前获取的该天所需消耗的热量,计算用户在就餐的时候所需要补充的热量;然后,根据每个菜品所对应的热量值以及菜品组合方法,制定当前用户的多个备选菜品组合;最后,根据用户在***中的消费行为以及口味爱好,在备选菜品组合中,生成多个菜品组合方案,从而根据菜品组合方案的排序,为用户推荐最佳菜品组合。
发明人对上述方案进行研究发现,由于预估热量的准确度较差,导致推荐准确度较差;此外,采用固有的组合方法限制了组合的灵活性。
发明内容
本公开的实施例提供一种商品组的推荐方法、装置、电子设备及可读存储介质,可以根据商品组合中各商品的特征预估商品组合的质量得分,有助于提高推荐准确度,且商品组合的灵活性更好。
根据本公开的实施例的第一方面,提供了一种商品组的推荐方法,所述方法包括:
针对目标商品组中每个商品,根据所述商品对应的个体特征生成个体特征向量;
根据所述每个商品的个体特征向量确定每个商品在所述目标商品组中的权重;
根据每个商品的个体特征向量、每个商品在所述目标商品组中的权重、以及所述目标商品组的综合特征,生成所述目标商品组的综合特征向量;
将所述综合特征向量输入至预先训练的激活函数中,预测得到所述目标商品组的质量得分,所述激活函数包括针对点击率的第一激活子函数和针对转化率的第二激活子函数,在训练过程中,根据商品组合样本中预先标注的点击率样本值、所述第一激活子函数输出的点击率预测值、预先标注的转化率样本值、所述第二激活子函数输出的转化率预测值确定损失值;
根据所述质量得分将所述目标商品组推荐给用户。
根据本公开的实施例的第二方面,提供了一种商品组的推荐装置,所述装置包括:
个体特征向量生成模块,用于针对目标商品组中每个商品,根据所述商品对应的个体特征生成个体特征向量;
商品权重确定模块,用于根据所述每个商品的个体特征向量确定每个商品在所述目标商品组中的权重;
综合特征向量生成模块,用于根据每个商品的个体特征向量、每个商品在所述目标商品组中的权重、以及所述目标商品组的综合特征,生成所述目标商品组的综合特征向量;
质量得分预测模块,用于将所述综合特征向量输入至预先训练的激活函数中,预测得到所述目标商品组的质量得分,所述激活函数包括针对点击率的第一激活子函数和针对转化率的第二激活子函数,在训练过程中,根据商品组合样本中预先标注的点击率样本值、所述第一激活子函数输出的点击率预测值、预先标注的转化率样本值、所述第二激活子函数输出的转化率预测值确定损失值;
商品组推荐模块,用于根据所述质量得分将所述目标商品组推荐给用户。
根据本公开的实施例的第三方面,提供了一种电子设备,包括:
处理器、存储器以及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现前述商品组的推荐方法。
根据本公开的实施例的第四方面,提供了一种可读存储介质,其特征在于,当所述存储介质中的指令由电子设备的处理器执行时,使得电子设备能够执行前述商品组的推荐方法。
本公开的实施例提供了一种商品组的推荐方法及装置,所述方法包括:针对目标商品组中每个商品,根据所述商品对应的个体特征生成个体特征向量;根据所述每个商品的个体特征向量确定每个商品在所述目标商品组中的权重;根据每个商品的个体特征向量、每个商品在所述目标商品组中的权重、以及所述目标商品组的综合特征,生成所述目标商品组的综合特征向量;将所述综合特征向量输入至预先训练的激活函数中,预测得到所述目标商品组的质量得分,所述激活函数包括针对点击率的第一激活子函数和针对转化率的第二激活子函数,在训练过程中,根据商品组合样本中预先标注的点击率样本值、所述第一激活子函数输出的点击率预测值、预先标注的转化率样本值、所述第二激活子函数输出的转化率预测值确定损失值;根据所述质量得分将所述目标商品组推荐给用户。本公开的实施例可以根据商品组合中各商品的特征预估商品组合的质量得分,有助于提高推荐准确度,且商品组合的灵活性更好。
附图说明
为了更清楚地说明本公开的实施例的技术方案,下面将对本公开的实施例的描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本公开的实施例的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1示出了本公开的一种实施例中的商品组的推荐方法步骤流程图;
图2示出了本公开的另一种实施例中的商品组的推荐方法步骤流程图;
图3示出了本公开的实施例中根据个体特征向量和综合特征向量预测质量得分的模型结构示意图;
图4示出了本公开的实施例中生成每个商品的个体特征向量的模型结构示意图;
图5示出了本公开的一种实施例中的商品组的推荐装置的结构图;
图6示出了本公开的另一种实施例中的商品组的推荐装置的结构图;
图7示出了本公开的一种实施例中的电子设备的结构图。
具体实施方式
下面将结合本公开的实施例中的附图,对本公开的实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本公开的实施例一部分实施例,而不是全部的实施例。基于本公开的实施例中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本公开的实施例保护的范围。
实施例一
参照图1,其示出了本公开的一种实施例中的商品组的推荐方法的步骤流程图,具体如下。
步骤101,针对目标商品组中每个商品,根据所述商品对应的个体特征生成个体特征向量。
其中,目标商品组为待确定其质量得分的商品组,由多个商品构成。本公开的实施例中,目标商品组可以为商家根据经验设定的商品组,还可以由其他自动化方式生成的商品组,本公开的实施例对目标商品组的来源不加以限制。
个体特征为影响商品推荐成功或失败的各种特征,可以包括但不限于:商品名称、商品价格、商品销量、各级标签、该商品在目标商品组中的数量。
个体特征向量可以通过个体特征按照一定顺序拼接得到,例如,可以将商品名称、商品价格、商品销量、各级标签、商品在目标商品组中的数量顺序拼接得到。其中,商品名称、各级标签需要预先转换为词向量,商品价格、商品销量、商品在目标商品组中的数量可以直接作为向量的取值。
步骤102,根据所述每个商品的个体特征向量确定每个商品在所述目标商品组中的权重。
其中,商品在目标商品组中的权重可以为商品对目标商品组的影响大小,例如,权重越大,商品对目标商品组的推荐成功或失败的影响越大;权重越小,商品对目标商品组的推荐成功或失败的影响越小。
在本公开的实施例中,如图3所示,可以通过Self-Attention预测商品在目标商品组中的权重。其可以根据输入的每个商品的个体特征向量预测到该商品在目标商品组中的权重。Self-Attention是深度学习技术中的常用结构,本公开的实施例对其不再赘述。
步骤103,根据每个商品的个体特征向量、每个商品在所述目标商品组中的权重、以及所述目标商品组的综合特征,生成所述目标商品组的综合特征向量。
具体地,首先,将每个商品的个体特征向量与该商品在目标商品组中的权重相乘,得到每个商品的加权特征向量;然后,将所有商品的加权特征向量、以及目标商品组的综合特征拼接为目标商品组的综合特征向量。当然,可以理解,本公开的实施例对拼接顺序不加以限制。
在实际应用中,如图3所示,可以直接将所有商品的加权特征向量、以及目标商品组的综合特征输入至Concatenate层,输出得到目标商品组的综合特征向量。Concatenate为深度学习中的常用结构,本公开的实施例对其不再赘述。
本公开的实施例中,目标商品组的综合特征向量不仅包含商品的个体特征,还包括了目标商品组的综合特征,从而综合特征向量包含的信息越多,使得对目标商品组的描述更准确,有助于提高质量得分的准确度。
步骤104,将所述综合特征向量输入至预先训练的激活函数中,预测得到所述目标商品组的质量得分,所述激活函数包括针对点击率的第一激活子函数和针对转化率的第二激活子函数,所述第一激活子函数和第二激活子函数预先训练得到,在训练过程中,根据商品组合样本中预先标注的点击率样本值、所述第一激活子函数输出的点击率预测值、预先标注的转化率样本值、所述第二激活子函数输出的转化率预测值确定损失值。
在本公开的是实施例中,如图3所示,质量得分根据第一激活子函数输出的点击率和第二激活子函数输出的转化率计算得到。
损失值同时兼顾点击率的损失和转化率的损失,将两种损失综合起来作为损失值,以使得训练得到的模型对应的点击率和转化率均较好。
可以理解,本公开的实施例对损失值的具体计算公式不加以限制,只要保证损失值由点击率的损失值和转化率的损失值构成即可。例如,可以直接将点击率预测值和点击率样本值之间的平方损失值,与转化率预测值和转化率样本值之间的平方损失值进行加权运算得到损失值。
步骤105,根据所述质量得分将所述目标商品组推荐给用户。
可以理解,质量得分越高,目标商品组的推荐成功率越高;质量得分越低,目标商品组的推荐成功率越低。
具体地,可以将多个目标商品组合按照质量得分降序排列,并将排序靠前的质量得分大于或等于预设质量得分阈值的目标商品组合推荐给用户。
综上所述,本公开的实施例提供了一种商品组的推荐方法,所述方法包括:针对目标商品组中每个商品,根据所述商品对应的个体特征生成个体特征向量;根据所述每个商品的个体特征向量确定每个商品在所述目标商品组中的权重;根据每个商品的个体特征向量、每个商品在所述目标商品组中的权重、以及所述目标商品组的综合特征,生成所述目标商品组的综合特征向量;将所述综合特征向量输入至预先训练的激活函数中,预测得到所述目标商品组的质量得分,所述激活函数包括针对点击率的第一激活子函数和针对转化率的第二激活子函数,在训练过程中,根据商品组合样本中预先标注的点击率样本值、所述第一激活子函数输出的点击率预测值、预先标注的转化率样本值、所述第二激活子函数输出的转化率预测值确定损失值;根据所述质量得分将所述目标商品组推荐给用户。本公开的实施例可以根据商品组合中各商品的特征预估商品组合的质量得分,有助于提高推荐准确度,且商品组合的灵活性更好。
实施例二
参照图2,其示出了在本公开的另一种实施例中的商品组的推荐方法的具体步骤流程图,具体如下。
步骤201,针对目标商品组中每个商品,将商品名称输入至卷积神经网络和最大池化层中预测得到第一子向量。
其中,这里的商品名称是指商品名称对应的词向量。而由于商品名称通常包括多种信息,除了主要信息之外还有一些冗余信息,从而需要从商品名称中去除冗余信息,从而得到仅包含主要信息的第一子向量。
在本公开的实施例中,如图4所示,可以通过CNN(Convolutional NeutralNetwork,卷积神经网络)提取商品名称中的特征信息,并采用最大池化层Max-Pooling提取特征信息中的主要信息,使得第一子向量可以包含商品名称中的主要信息。卷积神经网络和Max-Pooling均为深度学习中常用的结构,本公开的实施例对其不再赘述。
需要说明的是,商品的个体特征中除商品名称外,若还有自定义的特征包含冗余信息,均需要通过步骤201对其进行处理,得到第一子向量。
步骤202,将标签输入至嵌入层中预测得到第二子向量。
其中,标签可以包含多个级别的标签,数目越多,得到的第二子向量对商品的描述越准确;数目越少,得到的第二子向量对商品的描述越不准确。
其中,标签本身是一个语义信息,需要通过嵌入层将其映射为向量表示。
在本公开的实施例中,如图4所示,其中Embeding层为嵌入层。Embeding为深度学习中常用的结构,本公开的实施例对其不再赘述。
可以理解,由于标签信息通常为按照一定规则设定的,不包含冗余信息,从而不需要通过步骤201进行处理。
步骤203,将所述第一子向量、第二子向量、所述连续特征组成的第三向量拼接得到个体特征向量。
其中,连续特征为数值类的特征,包括但不限于:商品价格、商品销量、商品评分等。
需要说明的是,由于连续特征为具有数值类的特征,从而不需要对其进行任何处理即可作为特征向量中的取值。
如图4所示,可以通过Concatenate将第一子向量、第二子向量、所述连续特征组成的第三向量为个体特征向量。
可以理解,本公开的实施例对拼接顺序不加以限制。
步骤204,根据所述每个商品的个体特征向量确定每个商品在所述目标商品组中的权重。
该步骤可以参照步骤102的详细说明,在此不再赘述。
步骤205,根据每个商品的个体特征向量、每个商品在所述目标商品组中的权重、以及所述目标商品组的综合特征,生成所述目标商品组的综合特征向量。
该步骤可以参照步骤103的详细说明,在此不再赘述。
步骤206,将所述综合特征向量输入至所述第一激活子函数中,预测得到点击率。
可以理解,第一激活子函数用于根据综合特征向量预测目标商品组的点击率。
步骤207,将所述综合特征向量输入至所述第二激活子函数中,预测得到转化率。
可以理解,第二激活子函数用于根据综合特征向量预测目标商品组的转化率。
需要说明的是,第一激活子函数和第二激活子函数可以采用现有的激活函数,例如,sigmoid函数、tanh函数、ReLU函数等。本公开的实施例对激活子函数的选取不加以限制。
步骤208,根据所述点击率和转化率计算得到质量得分,所述第一激活子函数和第二激活子函数预先训练得到,在训练过程中,根据商品组合样本中预先标注的点击率样本值、所述第一激活子函数输出的点击率预测值、预先标注的转化率样本值、所述第二激活子函数输出的转化率预测值确定损失值。
具体地,质量得分可以根据点击率和转化率进行加权运算得到质量得分,包括以乘的方式加权和以和的方式加权。例如,以和的方式加权即为:将点击率与第一加权因子的乘积、转化率与第二加权因子的乘积相加得到质量得分,以乘的方式加权即为:将点击率和转换率相乘得到质量得分。本公开的实施例对加权算法不加以限定,可以为各种综合点击率和转化率的公式计算得到,只要保持如下关系不变即可:点击率越大、转化率越大,则质量得分越大;点击率越小、转化率越小,则质量得分越小。
本公开的实施例不仅可以在训练时同时兼顾点击率和转化率,还可以综合点击率和转化率确定质量得分,使得质量得分的准确度更好。
可选地,在本公开的另一种实施例中,所述步骤208包括子步骤A1至A2:
子步骤A1,根据所述点击率和转化率的乘积确定访购率得分。
在本公开的实施例中,可以直接将该点击率和转化率的乘积作为访购率得分,还可以对其进行变换之后得到访购率得分,本公开的实施例对其不加以限制,只要保证如下关系即可:点击率和转化率的乘积越大,访购率得分越大;点击率和转化率的乘积越小,访购率得分越小。
子步骤A2,将所述点击率或所述转化率或所述访购率得分作为质量得分。
在本公开的实施例中,可以支持多种类型的质量得分,从而可以根据实际应用灵活的实现不同目标的推荐。例如,以点击率为目标的推荐,可以将点击率较高的目标商品组合推荐给用户,以转化率为目标的推荐,可以将转化率较高的目标商品组合推荐给用户,以访购率得分为目标的推荐,则可以同时兼顾点击率和访购率。
在本公开的另一种实施例中,根据如下公式计算损失值:
根据如下公式计算损失值:
其中,TrainLoss为损失值,M为商品组合样本的数量,w1为第一预设权重,w2为第二预设权重,y′i,1为第一激活子函数针对第i个商品组合样本的点击率预测值,y′i,2为第二激活子函数针对第i个商品组合样本输出的转化率预测值,yi,1、yi,2分别为第i个商品组合样本预先标注的点击率样本值、转化率样本值,yi,1·yi,2为第i个商品组合样本对应的访购率样本值,y′i,1y′i,2为第i个商品组合样本对应的访购率预测值。
可选地,在本公开的另一种实施例中,所述第一预设权重、第二预设权重通过如下步骤B1至B3确定:
步骤B1,基于多个商品组合样本,分别计算所述点击率预测值的方差和所述访购率预测值的方差,得到第一方差和第二方差。
在本公开的实施例中,商品组合样本的点击率预测值可以作为变量,从而可以计算点击率预测值的方差σ1 2,可以参照如下公式:
其中,M、i、y′i,1可以参照公式(1)中的说明,在此不再赘述,μ1为点击率预测值的平均值。
此外,商品组合样本的转化率预测值也可以作为变量,从而可以计算转化率预测值的方差σ2 2,可以参照如下公式:
其中,M、i、y′i,2可以参照公式(1)中的说明,在此不再赘述,μ2为转化率预测值的平均值。
步骤B2,若所述第一方差大于第二方差,则减小所述第一预设权重,且增大所述第二预设权重。
具体地,若第一方差减去第二方差的差值大于一定阈值,则减小第一预设权重,并增大第二预设权重;若第一方差减去第二方差的差值小于或等于一定阈值,则不减小第一预设权重,也不增大第二预设权重。
可以理解,减小和增大的程度可以根据第一方差和第二方差的差值确定,差值越大,减少和增大的程度越大;差值越小,减少和增大的程度越小。
步骤B3,若所述第一方差小于第二方差,则增大所述第一预设权重,且减小所述第二预设权重。
具体地,若第二方差减去第一方差的差值大于一定阈值,则增大第一预设权重,并减小第二预设权重;若第二方差减去第一方差的差值小于或等于一定阈值,则不增大第一预设权重,也不减小第二预设权重。
可以理解,减小和增大的程度可以根据第二方差和第一方差的差值确定,差值越大,减少和增大的程度越大;差值越小,减少和增大的程度越小。
在本公开的实施例中,在点击率预测值的方差较大,即点击率预测值的准确度较差时,可以降低点击率预测值对质量得分的影响;在转化率预测值的方差较大,即转化率预测值的准确度较差时,可以降低转化率预测值对质量得分的影响,有助于进一步提高质量得分的准确度。
在本公开的另一种实施例中,在对第一激活子函数和第二激活子函数训练之前,还包括步骤C1:
步骤C1,按照预设规则对所述商品组合样本进行过滤,所述预设规则包括如下规则中的一种或多种:基于在预设历史时间段内的转化率的过滤规则、基于在预设历史时间段内的点击率的过滤规则。
具体地,可以将转化率低于一定转化率阈值的商品组合样本滤除,可以将点击率阈值低于一定点击率阈值的商品组合样本滤除。此外,还可以将展示次数较低的商品组合样本滤除。
本公开的实施例可以对商品组合样本进行过滤,以保证商品组合样本的质量,有助于提高训练结果的准确度。
在本公开的另一种实施例中,在对第一激活子函数和第二激活子函数训练之前,还包括步骤C2至C3:
步骤C2,通过预设黑名单对所述商品组合样本进行样本扩展。
其中,黑名单可以为不符合预设条件的商品组合样本,其中,预设条件可以包括但不限于:基于价格的条件、基于商品组合样本中商品类型的条件、基于用户自定义的条件等。其中,可以价格不符合常规价格的商品组合样本添加至黑名单,还可以将商品组合样本中商品类型均为饮料类型的商品组合样本添加至黑名单,还可以将用户满意度较差的商品组合样本添加至黑名单。
当然,为了降低黑名单的占用空间,可以将黑名单的存储对象确定为预设黑名单条件,从而可以将符合该预设黑名单条件的商品组合作为商品组合样本,并标注为负样本,例如点击率和转化率均为0。其中,黑名单条件和上述预设条件相反,例如,预设条件为价格符合常规价格,黑名单条件即为价格不符合常规价格;预设条件为商品类型不全为饮料类型,黑名单条件即为商品类型均为饮料类型;预设条件为用户满意度较好,黑名单条件即为用户满意度较差。
步骤C3,通过预设白名单对所述商品组合样本进行样本扩展。
其中,预设白名单可以包括满足预设条件的商品组合,具体地,可以从商品销售平台的数据库中获取满足预设条件的商品组合生成白名单。
其中,预设条件可以参照步骤C2中的说明,在此不再赘述。
同理,为了减小白名单的占用空间,可以将白名单的存储对象确定为预设条件,然后在对商品组合样本进行扩展时,从商品销售平台的数据库中获取满足预设条件的商品组合作为商品组合样本,并标注为正样本,例如,将该商品组合样本在商品销售平台上的点击率、转化率作为标注信息。
在本公开的实施例中,可以通过黑名单和白名单对商品组合样本进行扩展,使得商品组合样本具有多样性,有助于提高训练结果的准确度。
步骤209,根据所述质量得分将所述目标商品组推荐给用户。
该步骤可以参照步骤105的下关系说明,在此不再赘述。
综上所述,基于实施例一,本公开的实施例提供了另一种商品组的推荐方法,除具有实施例一的有益效果外,本公开的实施例还可以从包含冗余信息的商品名称中提取主要信息,并将商品名称、标签、及其他连续特征拼接为个体特征向量,使得个体特征向量包含各种维度的信息,有助于提高质量得分的准确度;还可以在训练时同时兼顾点击率和转化率,综合点击率和转化率确定质量得分,使得质量得分的准确度更好;还可以实现不同目标的推荐;还可以动态调整第一预设权重和第二预设权重,有助于提高质量得分的准确度;还可以对商品组合样本进行过滤,以保证商品组合样本的质量,有助于提高训练结果的准确度;还可以通过黑名单和白名单对商品组合样本进行扩展,使得商品组合样本具有多样性,有助于提高训练结果的准确度。
实施例三
参照图4,其示出了在本公开的另一种实施例中的商品组的推荐装置的结构图,具体如下。
个体特征向量生成模块301,用于针对目标商品组中每个商品,根据所述商品对应的个体特征生成个体特征向量。
商品权重确定模块302,用于根据所述每个商品的个体特征向量确定每个商品在所述目标商品组中的权重。
综合特征向量生成模块303,用于根据每个商品的个体特征向量、每个商品在所述目标商品组中的权重、以及所述目标商品组的综合特征,生成所述目标商品组的综合特征向量。
质量得分预测模块304,用于将所述综合特征向量输入至预先训练的激活函数中,预测得到所述目标商品组的质量得分,所述激活函数包括针对点击率的第一激活子函数和针对转化率的第二激活子函数,在训练过程中,根据商品组合样本中预先标注的点击率样本值、所述第一激活子函数输出的点击率预测值、预先标注的转化率样本值、所述第二激活子函数输出的转化率预测值确定损失值。
商品组推荐模块305,用于根据所述质量得分将所述目标商品组推荐给用户。
综上所述,本公开的实施例提供了一种商品组的推荐装置,所述装置包括:个体特征向量生成模块,用于针对目标商品组中每个商品,根据所述商品对应的个体特征生成个体特征向量;商品权重确定模块,用于根据所述每个商品的个体特征向量确定每个商品在所述目标商品组中的权重;综合特征向量生成模块,用于根据每个商品的个体特征向量、每个商品在所述目标商品组中的权重、以及所述目标商品组的综合特征,生成所述目标商品组的综合特征向量;质量得分预测模块,用于将所述综合特征向量输入至预先训练的激活函数中,预测得到所述目标商品组的质量得分,所述激活函数包括针对点击率的第一激活子函数和针对转化率的第二激活子函数,在训练过程中,根据商品组合样本中预先标注的点击率样本值、所述第一激活子函数输出的点击率预测值、预先标注的转化率样本值、所述第二激活子函数输出的转化率预测值确定损失值;商品组推荐模块,用于根据所述质量得分将所述目标商品组推荐给用户。本公开的实施例可以根据商品组合中各商品的特征预估商品组合的质量得分,有助于提高推荐准确度,且商品组合的灵活性更好。
实施例三为实施例一对应的装置实施例,详细说明可以参照实施例一,在此不再赘述。
实施例四
参照图5,其示出了在本公开的一种实施例中的商品组的推荐装置的结构图,具体如下。
个体特征向量生成模块401,用于针对目标商品组中每个商品,根据所述商品对应的个体特征生成个体特征向量;可选地,在本公开的实施例中,所述个体特征向量生成模块401包括:
卷积及最大化子模块4011,用于针对目标商品组中每个商品,将所述商品名称输入至卷积神经网络和最大池化层中预测得到第一子向量。
嵌入预测子模块4012,用于将所述标签输入至嵌入层中预测得到第二子向量。
个体特征向量拼接子模块4013,用于将所述第一子向量、第二子向量、所述连续特征组成的第三向量拼接得到个体特征向量。
商品权重确定模块402,用于根据所述每个商品的个体特征向量确定每个商品在所述目标商品组中的权重。
综合特征向量生成模块403,用于根据每个商品的个体特征向量、每个商品在所述目标商品组中的权重、以及所述目标商品组的综合特征,生成所述目标商品组的综合特征向量。
质量得分预测模块404,用于将所述综合特征向量输入至预先训练的激活函数中,预测得到所述目标商品组的质量得分,所述激活函数包括针对点击率的第一激活子函数和针对转化率的第二激活子函数,在训练过程中,根据商品组合样本中预先标注的点击率样本值、所述第一激活子函数输出的点击率预测值、预先标注的转化率样本值、所述第二激活子函数输出的转化率预测值确定损失值;可选地,在本公开的一种实施例中,所述质量得分预测模块404包括:
点击率预测子模块4041,用于将所述综合特征向量输入至所述第一激活子函数中,预测得到点击率。
转化率预测子模块4042,用于将所述综合特征向量输入至所述第二激活子函数中,预测得到转化率。
质量得分计算子模块4043,用于根据所述点击率和转化率计算得到质量得分。
商品组推荐模块405,用于根据所述质量得分将所述目标商品组推荐给用户。
可选地,在本公开的另一种实施例中,所述质量得分计算子模块4043包括:
访购率得分预测单元,用于根据所述点击率和转化率的乘积确定访购率得分。
质量得分预测单元,用于将所述点击率或所述转化率或所述访购率得分作为质量得分。
在本公开的另一种实施例中,根据如下公式计算损失值:
根据如下公式计算损失值:
其中,TrainLoss为损失值,M为商品组合样本的数量,w1为第一预设权重,w2为第二预设权重,y′i,1为第一激活子函数针对第i个商品组合样本的点击率预测值,y′i,2为第二激活子函数针对第i个商品组合样本输出的转化率预测值,yi,1、yi,2分别为第i个商品组合样本预先标注的点击率样本值、转化率样本值,yi,1·yi,2为第i个商品组合样本对应的访购率样本值,y′i,1y′i,2为第i个商品组合样本对应的访购率预测值。
可选地,在本公开的另一种实施例中,所述第一预设权重、第二预设权重通过如下模块确定:
方差计算模块,用于基于多个商品组合样本,分别计算所述点击率预测值的方差和所述访购率预测值的方差,得到第一方差和第二方差。
第一权重调整模块,用于若所述第一方差大于第二方差,则减小所述第一预设权重,且增大所述第二预设权重。
第二权重调整模块,用于若所述第一方差小于第二方差,则增大所述第一预设权重,且减小所述第二预设权重。
在本公开的另一种实施例中,在对第一激活子函数和第二激活子函数训练之前,还包括如下模块:
样本过滤模块,用于按照预设规则对所述商品组合样本进行过滤,所述预设规则包括如下规则中的一种或多种:基于在预设历史时间段内的转化率的过滤规则、基于在预设历史时间段内的点击率的过滤规则。
在本公开的另一种实施例中,在对第一激活子函数和第二激活子函数训练之前,还包括如下模块:
第一样本扩展模块,用于通过预设黑名单对所述商品组合样本进行样本扩展。
第二样本扩展模块,用于通过预设白名单对所述商品组合样本进行样本扩展。
综上所述,基于实施例三,本公开的实施例提供了另一种商品组的推荐装置,除具有实施例三的有益效果外,本公开的实施例还可以从包含冗余信息的商品名称中提取主要信息,并将商品名称、标签、及其他连续特征拼接为个体特征向量,使得个体特征向量包含各种维度的信息,有助于提高质量得分的准确度;将个体特征向量和目标商品组的综合特征拼接为目标商品组的综合特征向量,使得综合特征向量包含各种维度的信息,有助于提高质量得分的准确度;还可以在训练时同时兼顾点击率和转化率,综合点击率和转化率确定质量得分,使得质量得分的准确度更好;还可以实现不同目标的推荐;还可以动态调整第一预设权重和第二预设权重,有助于提高质量得分的准确度;还可以对商品组合样本进行过滤,以保证商品组合样本的质量,有助于提高训练结果的准确度;还可以通过黑名单和白名单对商品组合样本进行扩展,使得商品组合样本具有多样性,有助于提高训练结果的准确度。
实施例四为实施例二对应的装置实施例,详细说明可以参照实施例二,在此不再赘述。
本公开的实施例还提供了一种电子设备,参照图6,包括:处理器501、存储器502以及存储在所述存储器502上并可在所述处理器上运行的计算机程序5021,所述处理器501执行所述程序时实现前述实施例的商品组的推荐方法。
本公开的实施例还提供了一种可读存储介质,当所述存储介质中的指令由电子设备的处理器执行时,使得电子设备能够执行前述实施例的商品组的推荐方法。
对于装置实施例而言,由于其与方法实施例基本相似,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
在此提供的算法和显示不与任何特定计算机、虚拟***或者其它设备固有相关。各种通用***也可以与基于在此的示教一起使用。根据上面的描述,构造这类***所要求的结构是显而易见的。此外,本公开的实施例也不针对任何特定编程语言。应当明白,可以利用各种编程语言实现在此描述的本公开的实施例的内容,并且上面对特定语言所做的描述是为了披露本公开的实施例的最佳实施方式。
在此处所提供的说明书中,说明了大量具体细节。然而,能够理解,本公开的实施例的实施例可以在没有这些具体细节的情况下实践。在一些实例中,并未详细示出公知的方法、结构和技术,以便不模糊对本说明书的理解。
类似地,应当理解,为了精简本公开并帮助理解各个发明方面中的一个或多个,在上面对本公开的实施例的示例性实施例的描述中,本公开的实施例的各个特征有时被一起分组到单个实施例、图、或者对其的描述中。然而,并不应将该公开的方法解释成反映如下意图:即所要求保护的本公开的实施例要求比在每个权利要求中所明确记载的特征更多的特征。更确切地说,如下面的权利要求书所反映的那样,发明方面在于少于前面公开的单个实施例的所有特征。因此,遵循具体实施方式的权利要求书由此明确地并入该具体实施方式,其中每个权利要求本身都作为本公开的实施例的单独实施例。
本领域那些技术人员可以理解,可以对实施例中的设备中的模块进行自适应性地改变并且把它们设置在与该实施例不同的一个或多个设备中。可以把实施例中的模块或单元或组件组合成一个模块或单元或组件,以及此外可以把它们分成多个子模块或子单元或子组件。除了这样的特征和/或过程或者单元中的至少一些是相互排斥之外,可以采用任何组合对本说明书(包括伴随的权利要求、摘要和附图)中公开的所有特征以及如此公开的任何方法或者设备的所有过程或单元进行组合。除非另外明确陈述,本说明书(包括伴随的权利要求、摘要和附图)中公开的每个特征可以由提供相同、等同或相似目的的替代特征来代替。
本公开的实施例的各个部件实施例可以以硬件实现,或者以在一个或者多个处理器上运行的软件模块实现,或者以它们的组合实现。本领域的技术人员应当理解,可以在实践中使用微处理器或者数字信号处理器(DSP)来实现根据本公开的实施例的商品组的推荐设备中的一些或者全部部件的一些或者全部功能。本公开的实施例还可以实现为用于执行这里所描述的方法的一部分或者全部的设备或者装置程序。这样的实现本公开的实施例的程序可以存储在计算机可读介质上,或者可以具有一个或者多个信号的形式。这样的信号可以从因特网网站上下载得到,或者在载体信号上提供,或者以任何其他形式提供。
应该注意的是上述实施例对本公开的实施例进行说明而不是对本公开的实施例进行限制,并且本领域技术人员在不脱离所附权利要求的范围的情况下可设计出替换实施例。在权利要求中,不应将位于括号之间的任何参考符号构造成对权利要求的限制。单词“包含”不排除存在未列在权利要求中的元件或步骤。位于元件之前的单词“一”或“一个”不排除存在多个这样的元件。本公开的实施例可以借助于包括有若干不同元件的硬件以及借助于适当编程的计算机来实现。在列举了若干装置的单元权利要求中,这些装置中的若干个可以是通过同一个硬件项来具体体现。单词第一、第二、以及第三等的使用不表示任何顺序。可将这些单词解释为名称。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的***、装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
以上所述仅为本公开的实施例的较佳实施例而已,并不用以限制本公开的实施例,凡在本公开的实施例的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本公开的实施例的保护范围之内。
以上所述,仅为本公开的实施例的具体实施方式,但本公开的实施例的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本公开的实施例揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本公开的实施例的保护范围之内。因此,本公开的实施例的保护范围应以权利要求的保护范围为准。
Claims (11)
1.一种商品组的推荐方法,其特征在于,所述方法包括:
针对目标商品组中每个商品,根据所述商品对应的个体特征生成个体特征向量;
根据所述每个商品的个体特征向量确定每个商品在所述目标商品组中的权重;
根据每个商品的个体特征向量、每个商品在所述目标商品组中的权重、以及所述目标商品组的综合特征,生成所述目标商品组的综合特征向量;
将所述综合特征向量输入至预先训练的激活函数中,预测得到所述目标商品组的质量得分,所述激活函数包括针对点击率的第一激活子函数和针对转化率的第二激活子函数,在训练过程中,根据商品组合样本中预先标注的点击率样本值、所述第一激活子函数输出的点击率预测值、预先标注的转化率样本值、所述第二激活子函数输出的转化率预测值确定损失值;
根据所述质量得分将所述目标商品组推荐给用户。
2.根据权利要求1所述的方法,其特征在于,所述个体特征包括商品名称、所述商品对应的标签、以及连续特征,所述根据所述商品对应的个体特征生成个体特征向量的步骤,包括:
将所述商品名称输入至卷积神经网络和最大池化层中预测得到第一子向量;
将所述标签输入至嵌入层中预测得到第二子向量;
将所述第一子向量、第二子向量、所述连续特征组成的第三向量拼接得到个体特征向量。
3.根据权利要求1所述的方法,其特征在于,所述将所述综合特征向量输入至预先训练的激活函数中,预测得到所述目标商品组的质量得分的步骤,包括:
将所述综合特征向量输入至所述第一激活子函数中,预测得到点击率;
将所述综合特征向量输入至所述第二激活子函数中,预测得到转化率;
根据所述点击率和转化率计算得到质量得分。
4.根据权利要求3所述的方法,其特征在于,所述根据所述点击率和转化率计算得到质量得分的步骤,包括:
根据所述点击率和转化率的乘积确定访购率得分;
将所述点击率或所述转化率或所述访购率得分作为质量得分。
5.根据权利要求1至4其中任一项所述的方法,其特征在于,所述在训练过程中,根据商品组合样本中预先标注的点击率样本值、所述第一激活子函数输出的点击率预测值、预先标注的转化率样本值、所述第二激活子函数输出的转化率预测值确定损失值的步骤,包括:
根据如下公式计算损失值:
其中,TrainLoss为损失值,M为商品组合样本的数量,w1为第一预设权重,w2为第二预设权重,y'i,1为第一激活子函数针对第i个商品组合样本的点击率预测值,y'i,2为第二激活子函数针对第i个商品组合样本输出的转化率预测值,yi,1、yi,2分别为第i个商品组合样本预先标注的点击率样本值、转化率样本值,yi,1·yi,2为第i个商品组合样本对应的访购率样本值,y'i,1y'i,2为第i个商品组合样本对应的访购率预测值。
6.根据权利要求5所述的方法,其特征在于,所述第一预设权重、第二预设权重通过如下步骤确定:
基于多个商品组合样本,分别计算所述点击率预测值的方差和所述访购率预测值的方差,得到第一方差和第二方差;
若所述第一方差大于第二方差,则减小所述第一预设权重,且增大所述第二预设权重;
若所述第一方差小于第二方差,则增大所述第一预设权重,且减小所述第二预设权重。
7.根据权利要求5所述的方法,其特征在于,在对所述第一激活子函数和第二激活子函数训练之前,所述方法还包括:
按照预设规则对所述商品组合样本进行过滤,所述预设规则包括如下规则中的一种或多种:基于在预设历史时间段内的转化率的过滤规则、基于在预设历史时间段内的点击率的过滤规则。
8.根据权利要求5所述的方法,其特征在于,在对所述第一激活子函数和第二激活子函数训练之前,所述方法还包括:
通过预设黑名单对所述商品组合样本进行样本扩展;
通过预设白名单对所述商品组合样本进行样本扩展。
9.一种商品组的推荐装置,其特征在于,所述装置包括:
个体特征向量生成模块,用于针对目标商品组中每个商品,根据所述商品对应的个体特征生成个体特征向量;
商品权重确定模块,用于根据所述每个商品的个体特征向量确定每个商品在所述目标商品组中的权重;
综合特征向量生成模块,用于根据每个商品的个体特征向量、每个商品在所述目标商品组中的权重、以及所述目标商品组的综合特征,生成所述目标商品组的综合特征向量;
质量得分预测模块,用于将所述综合特征向量输入至预先训练的激活函数中,预测得到所述目标商品组的质量得分,所述激活函数包括针对点击率的第一激活子函数和针对转化率的第二激活子函数,在训练过程中,根据商品组合样本中预先标注的点击率样本值、所述第一激活子函数输出的点击率预测值、预先标注的转化率样本值、所述第二激活子函数输出的转化率预测值确定损失值;
商品组推荐模块,用于根据所述质量得分将所述目标商品组推荐给用户。
10.一种电子设备,其特征在于,包括:
处理器、存储器以及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1-8中一个或多个所述的商品组的推荐方法。
11.一种可读存储介质,其特征在于,当所述存储介质中的指令由电子设备的处理器执行时,使得电子设备能够执行如方法权利要求1-8中一个或多个所述的商品组的推荐方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910636573.6A CN110490637A (zh) | 2019-07-15 | 2019-07-15 | 商品组的推荐方法、装置、电子设备及可读存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910636573.6A CN110490637A (zh) | 2019-07-15 | 2019-07-15 | 商品组的推荐方法、装置、电子设备及可读存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN110490637A true CN110490637A (zh) | 2019-11-22 |
Family
ID=68547059
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910636573.6A Pending CN110490637A (zh) | 2019-07-15 | 2019-07-15 | 商品组的推荐方法、装置、电子设备及可读存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110490637A (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111008335A (zh) * | 2019-12-20 | 2020-04-14 | 腾讯科技(深圳)有限公司 | 一种信息处理方法、装置、设备及存储介质 |
CN111460191A (zh) * | 2020-02-25 | 2020-07-28 | 北京三快在线科技有限公司 | 推荐方法、装置、电子设备及可读存储介质 |
CN112508613A (zh) * | 2020-12-09 | 2021-03-16 | 天津狮拓信息技术有限公司 | 一种商品推荐方法、装置、电子设备和可读存储介质 |
CN112861001A (zh) * | 2021-02-18 | 2021-05-28 | 咪咕数字传媒有限公司 | 数字内容的推荐值生成方法、装置、电子设备及存储介质 |
-
2019
- 2019-07-15 CN CN201910636573.6A patent/CN110490637A/zh active Pending
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111008335A (zh) * | 2019-12-20 | 2020-04-14 | 腾讯科技(深圳)有限公司 | 一种信息处理方法、装置、设备及存储介质 |
CN111460191A (zh) * | 2020-02-25 | 2020-07-28 | 北京三快在线科技有限公司 | 推荐方法、装置、电子设备及可读存储介质 |
CN112508613A (zh) * | 2020-12-09 | 2021-03-16 | 天津狮拓信息技术有限公司 | 一种商品推荐方法、装置、电子设备和可读存储介质 |
CN112508613B (zh) * | 2020-12-09 | 2024-03-19 | 天津狮拓信息技术有限公司 | 一种商品推荐方法、装置、电子设备和可读存储介质 |
CN112861001A (zh) * | 2021-02-18 | 2021-05-28 | 咪咕数字传媒有限公司 | 数字内容的推荐值生成方法、装置、电子设备及存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110490637A (zh) | 商品组的推荐方法、装置、电子设备及可读存储介质 | |
US9858530B2 (en) | Generating novel work products using computational creativity | |
US8924314B2 (en) | Search result ranking using machine learning | |
CN109509054A (zh) | 海量数据下商品推荐方法、电子装置及存储介质 | |
CN109902852A (zh) | 商品组合方法、装置、电子设备及可读存储介质 | |
CN109711925A (zh) | 具有多个辅助域的跨域推荐数据处理方法、跨域推荐*** | |
CN108287864A (zh) | 一种兴趣群组划分方法、装置、介质及计算设备 | |
CN102937976B (zh) | 一种基于输入前缀的下拉提示方法和装置 | |
CN110765273B (zh) | 推荐文案生成方法、装置、电子设备及可读存储介质 | |
CN106446189A (zh) | 一种资讯推荐方法及*** | |
CN108897823B (zh) | 基于深度学习注意力机制的个性化商品检索方法及装置 | |
CN109064293A (zh) | 商品推荐方法、装置、计算机设备及存储介质 | |
CN106445971A (zh) | 一种应用推荐方法和*** | |
Singh et al. | A production reliable model for deteriorating products with random demand and inflation | |
CN110263161A (zh) | 一种信息的处理方法、装置及设备 | |
CN108920665A (zh) | 基于网络结构和评论文本的推荐评分方法及装置 | |
CN110134783A (zh) | 个性化推荐的方法、装置、设备和介质 | |
CN110033324A (zh) | 数据处理方法、装置、电子设备及计算机可读存储介质 | |
CN109584016A (zh) | 一种商品推荐方法 | |
Starke et al. | Promoting healthy food choices online: A case for multi-list recommender systems | |
CN114240555A (zh) | 训练点击率预测模型和预测点击率的方法和装置 | |
CN105550901A (zh) | 基于少量用户评价的物品流行度与喜好度联合预测*** | |
CN108388555A (zh) | 基于行业类别的商品去重方法及装置 | |
CN111460191A (zh) | 推荐方法、装置、电子设备及可读存储介质 | |
CN111966916A (zh) | 一种推荐方法、装置、电子设备及计算机可读存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |