CN111179031A - 一种商品推荐模型的训练方法、装置及*** - Google Patents

一种商品推荐模型的训练方法、装置及*** Download PDF

Info

Publication number
CN111179031A
CN111179031A CN201911337899.5A CN201911337899A CN111179031A CN 111179031 A CN111179031 A CN 111179031A CN 201911337899 A CN201911337899 A CN 201911337899A CN 111179031 A CN111179031 A CN 111179031A
Authority
CN
China
Prior art keywords
commodity
target
interaction
matrix
user
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201911337899.5A
Other languages
English (en)
Other versions
CN111179031B (zh
Inventor
刘正夫
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
4Paradigm Beijing Technology Co Ltd
Original Assignee
4Paradigm Beijing Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 4Paradigm Beijing Technology Co Ltd filed Critical 4Paradigm Beijing Technology Co Ltd
Priority to CN201911337899.5A priority Critical patent/CN111179031B/zh
Publication of CN111179031A publication Critical patent/CN111179031A/zh
Application granted granted Critical
Publication of CN111179031B publication Critical patent/CN111179031B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions
    • G06Q30/0601Electronic shopping [e-shopping]
    • G06Q30/0631Item recommendations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Biophysics (AREA)
  • Software Systems (AREA)
  • Mathematical Physics (AREA)
  • General Engineering & Computer Science (AREA)
  • Computing Systems (AREA)
  • Finance (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Biomedical Technology (AREA)
  • Molecular Biology (AREA)
  • Computational Linguistics (AREA)
  • Accounting & Taxation (AREA)
  • Evolutionary Computation (AREA)
  • General Health & Medical Sciences (AREA)
  • Strategic Management (AREA)
  • Development Economics (AREA)
  • Economics (AREA)
  • General Business, Economics & Management (AREA)
  • Marketing (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种商品推荐模型的训练方法、装置及***,该方法包括:获取目标用户针对目标商品执行多种交互操作的交互数据、用于训练商品推荐模型的初始样本集合;基于初始样本集合,采用预设的机器学习算法训练初始的商品推荐模型;根据初始的商品推荐模型和初始样本集合,将多种交互操作的交互数据进行合并,得到合并交互数据;基于预设的图神经网络,根据合并交互数据得到每个目标用户的用户特征和每个目标商品的商品特征;根据用户特征、商品特征和初始样本集合,构建新的样本集合;基于新的样本集合,采用机器学习算法训练最终的商品推荐模型。

Description

一种商品推荐模型的训练方法、装置及***
技术领域
本发明涉及商品推荐技术领域,更具体地,涉及一种商品推荐模型的训练方法、一种商品推荐模型的训练装置、一种包括至少一个计算装置和至少一个存储装置的***、及一种可读存储介质。
背景技术
在互联网时代,每天都会产生大量用户和商品之间的交互数据。这些交互数据中包含了丰富的信息,我们可以利用这些交互数据来构建商品推荐模型,进行精准营销,从而更好的服务用户。在目前工业界,推荐模型通用的做法是先提取特征,然后构造训练样本来训练模型。
在现有技术中,提取用于训练推荐模型的特征时,通常只考虑用户针对商品执行的指定交互操作,很少考虑用户针对商品执行的其他交互操作,导致通过推荐模型对用户进行商品推荐的准确性较低。
发明内容
本发明的一个目的是提供一种训练商品推荐模型的新技术方案。
根据本发明的第一方面,提供了一种商品推荐模型的训练方法,包括:
获取目标用户针对目标商品执行多种交互操作的交互数据、用于训练商品推荐模型的初始样本集合,其中,所述初始样本集合中的每条原始样本包括多个选定特征和标签,所述标签表示对应原始样本产生时所述目标用户针对所述目标商品是否执行指定的交互操作;
基于所述初始样本集合,采用预设的机器学习算法训练初始的商品推荐模型;
根据所述初始的商品推荐模型和所述初始样本集合,将多种交互操作的交互数据进行合并,得到合并交互数据;
基于预设的图神经网络,根据所述合并交互数据得到每个目标用户的用户特征和每个目标商品的商品特征;
根据所述用户特征、所述商品特征和所述初始样本集合,构建新的样本集合;
基于所述新的样本集合,采用所述机器学习算法训练最终的商品推荐模型。
可选的,所述根据所述初始的商品推荐模型和所述初始样本集合,将多种交互操作的交互数据进行合并,得到合并交互数据包括:
基于所述初始的商品推荐模型,根据所述选定特征得到每个目标用户和每个目标商品之间预测匹配度;
根据每个目标用户和每个目标商品之间预测匹配度构建预测匹配度矩阵;
分别根据每一交互操作的交互数据,构建对应交互操作的交互矩阵;
根据所述预测匹配度矩阵和每一交互矩阵训练预设的机器学习模型,得到所述合并交互数据。
可选的,所述根据所述预测匹配度矩阵和每一交互矩阵训练预设的机器学习模型,得到所述合并交互数据包括:
以所述机器学习模型的待定参数为变量,根据所述交互矩阵构建合并交互矩阵的表达式;
根据所述预测匹配度矩阵和所述并交互矩阵的表达式构建第一损失函数;
求解所述第一损失函数,确定所述机器学习模型的待定参数的取值,得到所述合并交互矩阵;
根据所述合并交互矩阵得到所述合并交互数据。
可选的,所述根据所述合并交互矩阵得到所述合并交互数据包括:
确定所述指定的交互操作的交互矩阵中的元素总数量和非空值率;其中,所述非空值率为非零元素的数量与所述元素总数量的比率;
根据所述元素总数量和所述非空值率,确定分值阈值;
将所述合并交互矩阵中数值小于或等于所述分值阈值的元素值调整为第一设定值,将大于所述分值阈值的元素值调整为第二设定值,得到所述合并交互数据。
可选的,所述合并交互矩阵的表达式表示为:
Figure BDA0002331458750000021
其中,Xi为第i个交互操作的交互矩阵;wi和b为所述机器学习模型的待定参数,P为所述合并交互矩阵。
可选的,所述第一损失函数表示为:
Figure BDA0002331458750000031
其中,Ki,j为所述预测匹配度矩阵中第i行第j列的元素值,Pi,j为所述合并交互矩阵中第i行第j列的元素值;m为矩阵的行数,n为矩阵的列数。
可选的,所述基于预设的图神经网络,根据所述合并交互数据得到每个目标用户的用户特征和每个目标商品的商品特征包括:
根据合并交互数据,分别构建对应每个目标用户和每个目标商品的图神经网络;其中,每个图神经网络的层数相同;
根据所述合并交互数据训练每个目标用户和每个目标商品的图神经网络,获得每个目标用户在对应图神经网络的隐藏层的值,作为对应目标用户的用户特征;获得每个目标商品在对应图神经网络的隐藏层的值,作为对应目标商品的商品特征。
可选的,所述根据所述合并交互数据训练每个目标用户和每个目标商品的图神经网络包括:
对于每个目标商品和每个目标用户,分别以对应图神经网络的待定参数为变量,构建隐藏层的表达式;其中,每个所述图神经网络在同一层的待定参数的相同;
根据每个目标商品的隐藏层的表达式和每个目标用户的隐藏层的表达式,构建每个目标商品和每个目标用户之间的距离的表达式;
根据每个目标商品和每个目标用户之间的距离的表达式、及所述合并交互数据,构建第二损失函数;
求解所述第二损失函数,确定每个图神经网络的待定参数的值。
可选的,将每个目标商品和每个目标用户轮流作为目标节点;
所述目标节点的隐藏层的表达式表示为:
h0=x
Figure BDA0002331458750000032
其中,其中
Figure BDA0002331458750000033
是第k层的所述目标节点的隐藏层的值,x是所述目标节点的初始值,N(v)代表在所述图神经网络中与所述目标节点连接的节点,σ是激活函数,Wk和Bk均为所述图神经网络的第k层的待定系数。
可选的,所述第二损失函数的表达式表示为:
L2=∑ij(yij-Pij)2
其中,Pij为所述合成交互矩阵中第i个目标用户和第j个目标商品对应的元素值;yij为所述第i个目标用户和第j个目标商品之间的距离。
可选的,所述机器学习算法为GBDT算法。
可选的,所述根据所述用户特征、所述商品特征和所述初始样本集合,构建新的样本集合包括:
在每条初始样本中,增加对应目标用户的用户特征和对应目标商品的商品特征,得到新的样本。
可选的,还包括:
获取待推荐用户对应预设的至少一个候选商品的选定特征的特征值、和所述待推荐用户针对每个所述候选商品执行所述多种交互操作的新的交互数据;
根据所述新的交互数据得到所述待推荐用户的用户特征和每个所述候选商品的商品特征;
基于所述最终的商品推荐模型,分别根据所述待推荐用户对应每个所述候选商品的选定特征的特征值、所述待推荐用户的用户特征和所述候选商品的商品特征,得到每个候选商品对应所述待推荐用户的推荐分;
选取所述推荐分符合预设的推荐条件的候选商品,作为推荐商品推荐给所述待推荐用户。
可选的,所述选取所述推荐分符合预设的推荐条件的候选商品,作为推荐商品推荐给所述待推荐用户的步骤包括:
根据所述推荐分对所述候选商品进行降序排序,并获取每个候选商品的排序次序;
选取排序次序符合预设的排序范围的候选商品,作为推荐商品推荐给所述待推荐用户。
可选的,还包括:
展示所述候选商品、及每个候选商品的排序次序。
根据本发明的第二方面,提供了一种商品推荐模型的训练装置,包括:
数据获取模块,用于获取目标用户针对目标商品执行多种交互操作的交互数据、用于训练商品推荐模型的初始样本集合,其中,所述初始样本集合中的每条原始样本包括多个选定特征和标签,所述标签表示对应原始样本产生时所述目标用户针对所述目标商品是否执行指定的交互操作;
初始训练模块,用于基于所述初始样本集合,采用预设的机器学习算法训练初始的商品推荐模型;
数据合并模块,用于根据所述初始的商品推荐模型和所述初始样本集合,将多种交互操作的交互数据进行合并,得到合并交互数据;
特征生成模块,用于基于预设的图神经网络,根据所述合并交互数据得到每个目标用户的用户特征和每个目标商品的商品特征;
样本构建模块,用于根据所述用户特征、所述商品特征和所述初始样本集合,构建新的样本集合;以及,
最终训练模块,用于基于所述新的样本集合,采用所述机器学习算法训练最终的商品推荐模型。
可选的,所述数据合并模块还用于:
基于所述初始的商品推荐模型,根据所述选定特征得到每个目标用户和每个目标商品之间预测匹配度;
根据每个目标用户和每个目标商品之间预测匹配度构建预测匹配度矩阵;
分别根据每一交互操作的交互数据,构建对应交互操作的交互矩阵;
根据所述预测匹配度矩阵和每一交互矩阵训练预设的机器学习模型,得到所述合并交互数据。
可选的,所述根据所述预测匹配度矩阵和每一交互矩阵训练预设的机器学习模型,得到所述合并交互数据包括:
以所述机器学习模型的待定参数为变量,根据所述交互矩阵构建合并交互矩阵的表达式;
根据所述预测匹配度矩阵和所述并交互矩阵的表达式构建第一损失函数;
求解所述第一损失函数,确定所述机器学习模型的待定参数的取值,得到所述合并交互矩阵;
根据所述合并交互矩阵得到所述合并交互数据。
可选的,所述根据所述合并交互矩阵得到所述合并交互数据包括:
确定所述指定的交互操作的交互矩阵中的元素总数量和非空值率;其中,所述非空值率为非零元素的数量与所述元素总数量的比率;
根据所述元素总数量和所述非空值率,确定分值阈值;
将所述合并交互矩阵中数值小于或等于所述分值阈值的元素值调整为第一设定值,将大于所述分值阈值的元素值调整为第二设定值,得到所述合并交互数据。
可选的,所述合并交互矩阵的表达式表示为:
Figure BDA0002331458750000051
其中,Xi为第i个交互操作的交互矩阵;wi和b为所述机器学习模型的待定参数,P为所述合并交互矩阵。
可选的,所述第一损失函数表示为:
Figure BDA0002331458750000061
其中,Ki,j为所述预测匹配度矩阵中第i行第j列的元素值,Pi,j为所述合并交互矩阵中第i行第j列的元素值;m为矩阵的行数,n为矩阵的列数。
可选的,所述特征生成模块还用于:
根据合并交互数据,分别构建对应每个目标用户和每个目标商品的图神经网络;其中,每个图神经网络的层数相同;
根据所述合并交互数据训练每个目标用户和每个目标商品的图神经网络,获得每个目标用户在对应图神经网络的隐藏层的值,作为对应目标用户的用户特征;获得每个目标商品在对应图神经网络的隐藏层的值,作为对应目标商品的商品特征。
可选的,所述根据所述合并交互数据训练每个目标用户和每个目标商品的图神经网络包括:
对于每个目标商品和每个目标用户,分别以对应图神经网络的待定参数为变量,构建隐藏层的表达式;其中,每个所述图神经网络在同一层的待定参数的相同;
根据每个目标商品的隐藏层的表达式和每个目标用户的隐藏层的表达式,构建每个目标商品和每个目标用户之间的距离的表达式;
根据每个目标商品和每个目标用户之间的距离的表达式、及所述合并交互数据,构建第二损失函数;
求解所述第二损失函数,确定每个图神经网络的待定参数的值。
可选的,将每个目标商品和每个目标用户轮流作为目标节点;
所述目标节点的隐藏层的表达式表示为:
h0=x
Figure BDA0002331458750000062
其中,其中
Figure BDA0002331458750000063
是第k层的所述目标节点的隐藏层的值,x是所述目标节点的初始值,N(v)代表在所述图神经网络中与所述目标节点连接的节点,σ是激活函数,Wk和Bk均为所述图神经网络的第k层的待定系数。
可选的,所述第二损失函数的表达式表示为:
L2=∑ij(yij-Pij)2
其中,Pij为所述合成交互矩阵中第i个目标用户和第j个目标商品对应的元素值;yij为所述第i个目标用户和第j个目标商品之间的距离。
可选的,所述机器学习算法为GBDT算法。
可选的,所述样本构建模块还用于:
在每条初始样本中,增加对应目标用户的用户特征和对应目标商品的商品特征,得到新的样本。
可选的,还包括:
用于获取待推荐用户对应预设的至少一个候选商品的选定特征的特征值、和所述待推荐用户针对每个所述候选商品执行所述多种交互操作的新的交互数据的模块;
用于根据所述新的交互数据得到所述待推荐用户的用户特征和每个所述候选商品的商品特征的模块;
用于基于所述最终的商品推荐模型,分别根据所述待推荐用户对应每个所述候选商品的选定特征的特征值、所述待推荐用户的用户特征和所述候选商品的商品特征,得到每个候选商品对应所述待推荐用户的推荐分的模块;
用于选取所述推荐分符合预设的推荐条件的候选商品,作为推荐商品推荐给所述待推荐用户的模块。
可选的,所述选取所述推荐分符合预设的推荐条件的候选商品,作为推荐商品推荐给所述待推荐用户包括:
根据所述推荐分对所述候选商品进行降序排序,并获取每个候选商品的排序次序;
选取排序次序符合预设的排序范围的候选商品,作为推荐商品推荐给所述待推荐用户。
可选的,还包括:
用于展示所述候选商品、及每个候选商品的排序次序的模块。
根据本发明的第三方面,提供了一种包括至少一个计算装置和至少一个存储装置的***,其中,所述至少一个存储装置用于存储指令,所述指令用于控制所述至少一个计算装置执行根据本发明第一方面所述的方法。
根据本发明的第四方面,提供了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序在被处理器执行时实现如本发明第一方面所述的方法。
在本发明的实施例中,通过目标用户针对目标商品执行多种交互操作的交互数据,基于图神经网络得到每个目标用户的用户特征和每个目标商品的商品特征,并根据用户特征和商品特征来训练得到最终的商品推荐模型,可以使得最终的商品推荐模型更容易学习到有用的信息,进而可以提升最终的商品推荐模型的推荐效果。
通过以下参照附图对本发明的示例性实施例的详细描述,本发明的其它特征及其优点将会变得清楚。
附图说明
被结合在说明书中并构成说明书的一部分的附图示出了本发明的实施例,并且连同其说明一起用于解释本发明的原理。
图1是可用于实现本发明的实施例的电子设备的硬件配置的一个例子的框图。
图2是根据本发明实施例的商品推荐模型的训练方法的流程示意图;
图3是根据本发明实施例的得到合并数据的步骤的流程示意图;
图4是根据本发明实施例的图神经网络的结果示意图;
图5是根据本发明实施例的商品推荐模型的训练装置的方框原理图;
图6是根据本发明实施例的***的方框原理图。
具体实施方式
现在将参照附图来详细描述本发明的各种示例性实施例。应注意到:除非另外具体说明,否则在这些实施例中阐述的部件和步骤的相对布置、数字表达式和数值不限制本发明的范围。
以下对至少一个示例性实施例的描述实际上仅仅是说明性的,决不作为对本发明及其应用或使用的任何限制。
对于相关领域普通技术人员已知的技术、方法和设备可能不作详细讨论,但在适当情况下,所述技术、方法和设备应当被视为说明书的一部分。
在这里示出和讨论的所有例子中,任何具体值应被解释为仅仅是示例性的,而不是作为限制。因此,示例性实施例的其它例子可以具有不同的值。
应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步讨论。
下面,参照附图描述根据本发明实施例的各个实施例和例子。
<硬件配置>
图1是示出可以实现本发明的实施例的电子设备1000的硬件配置的框图。
电子设备1000可以是便携式电脑、台式计算机、手机、平板电脑等。如图1所示,电子设备1000可以包括处理器1100、存储器1200、接口装置1300、通信装置1400、显示装置1500、输入装置1600、扬声器1700、麦克风1800等等。其中,处理器1100可以是中央处理器CPU、微处理器MCU等。存储器1200例如包括ROM(只读存储器)、RAM(随机存取存储器)、诸如硬盘的非易失性存储器等。接口装置1300例如包括USB接口、耳机接口等。通信装置1400例如能够进行有线或无线通信,具体地可以包括Wifi通信、蓝牙通信、2G/3G/4G/5G通信等。显示装置1500例如是液晶显示屏、触摸显示屏等。输入装置1600例如可以包括触摸屏、键盘、体感输入等。用户可以通过扬声器1700和麦克风1800输入/输出语音信息。
图1所示的电子设备仅仅是说明性的并且决不意味着对本发明、其应用或使用的任何限制。应用于本发明的实施例中,电子设备1000的所述存储器1200用于存储指令,所述指令用于控制所述处理器1100进行操作以执行本发明实施例提供的任意一项商品推荐模型的训练方法。本领域技术人员应当理解,尽管在图1中对电子设备1000示出了多个装置,但是,本发明可以仅涉及其中的部分装置,例如,电子设备1000只涉及处理器1100和存储装置1200。技术人员可以根据本发明所公开方案设计指令。指令如何控制处理器进行操作,这是本领域公知,故在此不再详细描述。
<方法实施例>
在本实施例中,提供一种商品推荐模型的训练方法。该商品推荐模型的训练方法可以是由电子设备实施。该电子设备可以是如图1所示的电子设备1000。
根据图2所示,本实施例的商品推荐模型的训练方法可以包括如下步骤S2100~S2600:
步骤S2100,获取目标用户针对目标商品执行多种交互操作的交互数据、用于训练商品推荐模型的初始样本集合。
其中,初始样本集合中的每条原始样本包括多个选定特征和标签,标签表示对应原始样本产生时目标用户针对目标商品是否执行指定的交互操作。
交互数据可以表示目标用户是否针对目标商品执行对应的交互操作,交互操作例如可以包括购买、点击、或搜索。
在本发明的一个实施例中,每个交互操作对应的交互数据可以是如下表1-3所示的数据表。在数据表中,目标用户针对目标商品执行对应的交互操作时,对应位置的取值为1;目标用户针对目标商品未执行对应的交互操作时,对应位置的取值为0。
例如,表1可以是交互操作为购买的交互数据表。表2可以是交互操作为点击的交互数据表;表3可以是交互操作为搜索的交互数据表。其中,U表示目标用户的用户号,P表示目标商品的商品号。
表1
Figure BDA0002331458750000101
表2
Figure BDA0002331458750000102
表3
Figure BDA0002331458750000103
Figure BDA0002331458750000111
在本发明的一个实施例中,指定的交互操作可以是前述的交互操作中的一种,具体可以是预先根据应用场景或具体需求来指定。例如,该指定的交互操作可以是购买。
在本发明的一个实施例中,初始样本集合可以是如下表4所示的数据表。每条原始样本的选定特征可以包括特征f1~f4,且每条原始样本对应于一个目标用户和目标商品的组合,具体可以是对应于一个目标用户的用户号和一个目标商品的商品号的组合。
当目标用户针对目标商品执行指定的交互行为时,表4中对应的标签位置的取值为1;当目标用户针对目标商品未执行指定的交互行为时,表4中对应的标签位置的取值为0。
表4
用户号 商品号 f1 f2 f3 f4 标签
U1 P1 2 1 3 11 1
U1 P2 4 2 5 12 0
U2 P3 20 10 15 10 1
U3 P2 25 13 12 23 1
U4 P3 34 32 13 22 0
U5 P2 52 17 15 27 1
U6 P1 29 83 32 23 0
U2 P4 96 27 36 27 1
U1 P4 25 32 35 22 0
步骤S2200,基于初始样本集合,采用预设的机器学习算法训练初始的商品推荐模型。
本实施例的机器学习算法可以是推荐算法,例如可以是GBDT算法、DNN算法、LR算法、协同过滤算法、GraphX算法中的任意一种。
步骤S2300,根据初始的商品推荐模型和初始样本集合,将多种交互操作的交互数据进行合并,得到合并交互数据。
在本发明的一个实施例中,根据初始的商品推荐模型和初始样本集合,将多种交互操作的交互数据进行合并,得到合并交互数据可以包括如图3所示的步骤S2310~S2340:
步骤S2310,基于初始的商品推荐模型,根据选定特征得到每个目标用户和每个目标商品之间预测匹配度。
具体的,可以是将每条原始样本的选定特征输入到初始的商品推荐模型中,得到对应的预测匹配度,即该原始样本对应的目标用户和目标商品之间的预测匹配度。
步骤S2320,根据每个目标用户和每个目标商品之间预测匹配度构建预测匹配度矩阵。
每个目标用户和每个目标商品之间的预测匹配度可以是如表5所示,每个位置的取值为对应目标用户与目标商品之间的预测匹配度。其中,U表示目标用户的用户号,P表示目标商品的商品号。
表5
Figure BDA0002331458750000121
根据上表5得到的预测匹配度矩阵可以表示为:
Figure BDA0002331458750000122
步骤S2330,分别根据每一交互操作的交互数据,构建对应交互操作的交互矩阵。
具体的,交互矩阵的构建方式与预测匹配度矩阵的构建方式相同。每一交互操作的交互矩阵中,相同位置的元素所对应的目标用户和目标商品相同。
根据表1中购买操作的数据表,构建得到购买操作的交互矩阵可以为:
Figure BDA0002331458750000131
根据表2中点击操作的数据表,构建得到点击操作的交互矩阵可以为:
Figure BDA0002331458750000132
根据表3中搜索操作的数据表,构建得到搜索操作的交互矩阵可以为:
Figure BDA0002331458750000133
步骤S2340,根据预测匹配度矩阵和每一交互矩阵训练预设的机器学习模型,得到合并交互数据。
在本发明的一个实施例中,根据预测匹配度矩阵和每一交互矩阵训练预设的机器学习模型,得到合并交互数据可以包括如下所示的步骤S2341~S2344:
步骤S2341,以机器学习模型的待定参数为变量,根据交互矩阵构建合并交互矩阵的表达式。
在本发明的一个实施例中,合并交互矩阵的表达式可以表示为:
Figure BDA0002331458750000134
其中,Xi为第i个交互操作的交互矩阵;wi和b为机器学习模型的待定参数,P为合并交互矩阵。
步骤S2342,根据预测匹配度矩阵和并交互矩阵的表达式构建第一损失函数。
在本发明的一个实施例中,第一损失函数可以表示为:
Figure BDA0002331458750000141
其中,Ki,j为预测匹配度矩阵中第i行第j列的元素值,Pi,j为合并交互矩阵中第i行第j列的元素值;m为矩阵的行数,n为矩阵的列数。
步骤S2343,求解第一损失函数,确定机器学习模型的待定参数的取值,得到合并交互矩阵。
在本发明的一个实施例中,可以是用随机梯度下降优化算法来优化第一损失函数,使得第一损失函数L1的取值最小,得到训练后的wi和b,进而可以得到合并交互矩阵P。
在本发明的一个例子中,第1个交互操作的交互矩阵为购买操作的交互矩阵,第2个交互操作的交互矩阵为点击操作的交互矩阵,第3个交互操作的交互矩阵为搜索操作的交互矩阵,经过求解第一损失函数得到w1=0.4,w2=0.1,w3=0.1,b=0.1。那么,通过P=sigmoid(b+∑i=1wi*Xi)可以得到合并交互矩阵P为:
Figure BDA0002331458750000142
步骤S2344,根据合并交互矩阵得到合并交互数据。
在本发明的一个实施例中,根据合并交互矩阵得到合并交互数据可以包括如下所示的步骤S2344-1~S2344-3:
步骤S2344-1,确定指定的交互操作的交互矩阵中的元素总数量和非空值率。
其中,非空值率为非零元素的数量与元素总数量的比率。
具体的,在指定的交互操作为购买的情况下,可以是确定购买操作的交互矩阵中的元素总数量和非空值率。
在购买操作的交互矩阵
Figure BDA0002331458750000151
中,元素的总数量为24,非零元素的数量为9,那么,非空值率可以是9/24=0.375。
步骤S2344-2,根据元素总数量和非空值率,确定分值阈值。
在本发明的一个实施例中,可以是预先对合并交互矩阵中的元素值进行降序排序,并确定每个元素的排序值。
根据元素总数量N和非空值率p确定排序阈值,例如可以为N*λ*p,其中,λ为空值填充率的系数,例如,λ可以为2。根据该排序阈值,就可以确定分值阈值。该分值阈值可以是排序值为N*λ*p的元素值。
例如,排序值N*λ*p的元素值为0.52,那么,分值阈值可以也为0.52。
步骤S2344-3,将合并交互矩阵中数值小于或等于分值阈值的元素值调整为第一设定值,将大于分值阈值的元素值调整为第二设定值,得到合并交互数据。
在本发明的一个实施例中,第一设定值和第二设定值可以预先根据应用场景或具体需求来设定,例如,该第一设定值可以是1,第二设定值可以是0。那么,可以是将合并交互矩阵P中大于分值阈值的元素值调整为1,小于或等于分值阈值的元素值调整为0。
在分值阈值为0.52的情况下,将合并矩阵
Figure BDA0002331458750000152
中的元素值进行调整后,得到的合并交互数据可以如下表6所示:
表6
Figure BDA0002331458750000153
Figure BDA0002331458750000161
其中,U表示目标用户的用户号,P表示目标商品的商品号。
步骤S2400,基于预设的图神经网络,根据合并交互数据得到每个目标用户的用户特征和每个目标商品的商品特征。
在本发明的一个实施例中,基于预设的图神经网络,根据合并交互数据得到每个目标用户的用户特征和每个目标商品的商品特征可以包括如下所示的步骤S2410~S2420:
步骤S2410,根据合并交互数据,分别构建对应每个目标用户和每个目标商品的图神经网络。
其中,每个图神经网络的层数相同。
具体的,可以是分别以每个目标用户和每个目标商品为根节点,建立对应于每个目标用户的图神经网络和对应于每个目标商品的图神经网络。在有N1个目标用户和N2个目标商品的情况下,可以构建N1+N2个图神经网络,且每个图神经网络的根节点不同。图神经网络中第k层可以是在合并交互数据中与第k-1层的目标用户(或目标商品)对应于第一设定值的目标商品(或目标用户)。
例如,在图神经网络的层数为五层的情况下,对于以目标用户U1为根节点的图神经网络,图神经网络的第一层可以是目标用户U1,第二层可以是在合并交互数据中与目标用户U1对应于第一设定值的所有目标商品,第三层可以是在合并交互数据中与第二层的目标商品对应于第一设定值的所有目标用户,第四层可以是在合并交互数据中与第三层的目标用户对应于第一设定值的所有目标商品,该图神经网络的结构示意图可以是如图4所示。
步骤S2420,根据合并交互数据训练每个目标用户和每个目标商品的图神经网络,获得每个目标用户在对应图神经网络的隐藏层的值,作为对应目标用户的用户特征;获得每个目标商品在对应图神经网络的隐藏层的值,作为对应目标商品的商品特征。
在本发明的一个而实施例中,根据合并交互数据训练每个目标用户和每个目标商品的图神经网络包括如下所示的步骤S2421~S2424:
步骤S2421,对于每个目标商品和每个目标用户,分别以对应图神经网络的待定参数为变量,构建隐藏层的表达式。
其中,每个图神经网络在同一层的待定参数的相同。
在本发明的一个实施例中,可以是将每个目标商品和每个目标用户轮流作为目标节点,目标节点的隐藏层的表达式可以表示为:
h0=x
Figure BDA0002331458750000171
其中,其中
Figure BDA0002331458750000172
是第k层的目标节点的隐藏层的值,x是目标节点的初始值,N(v)代表在图神经网络中与目标节点连接的节点,σ是激活函数(例如可以但不限于是ReLU),Wk和Bk均为图神经网络的第k层的待定系数。
具体的,第i个目标用户的隐藏层的表达式可以表示为:
Figure BDA0002331458750000173
Figure BDA0002331458750000174
其中,其中
Figure BDA0002331458750000175
是第i个目标用户的图神经网络中第k层的隐藏层的值,xi是第i个目标用户的初始值,N(i)代表在图神经网络中与第i个目标用户连接的节点,σ是激活函数,Wk和Bk均为图神经网络的第k层的待定系数。
第j个目标商品的隐藏层的表达式可以表示为:
Figure BDA0002331458750000176
Figure BDA0002331458750000177
其中,其中
Figure BDA0002331458750000178
是第j个目标商品的图神经网络中第k层的隐藏层的值,xi是第j个目标商品的初始值,N(i)代表在图神经网络中与第j个目标商品连接的节点,σ是激活函数,Wk和Bk均为图神经网络的第k层的待定系数。
步骤S2422,根据每个目标商品的隐藏层的表达式和每个目标用户的隐藏层的表达式,构建每个目标商品和每个目标用户之间的距离的表达式。
在本发明的一个实施例中,每个目标商品和每个目标用户之间的距离可以是余弦距离。
那么,在第i个目标用户和第j个目标商品之间的距离yij的表达式可以表示为:
Figure BDA0002331458750000181
其中,
Figure BDA0002331458750000182
为第i个目标用户的图神经网络中第k层的隐藏层的值,
Figure BDA0002331458750000183
是第j个目标商品的图神经网络中第k层的隐藏层的值。
步骤S2423,根据每个目标商品和每个目标用户之间的距离的表达式、及合并交互数据,构建第二损失函数。
在本发明的一个实施例中,第二损失函数L2的表达式可以表示为:
L2=∑ij(yij-Pij)2
其中,Pij为合并交互数据中第i个目标用户和第j个目标商品对应的数据;yij为第i个目标用户和第j个目标商品之间的距离。
步骤S2424,求解第二损失函数,确定每个图神经网络的待定参数的值。
通过求解该第二损失函数,得到每个图神经网络的待定参数的值。根据每个图神经网络,就可以得到每个目标用户的图神经网络中第k层的隐藏层的值、和每个目标商品的图神经网络中第k层的隐藏层的值。
进一步地,将每个目标用户在对应图神经网络的隐藏层的值,作为对应目标用户的用户特征;将每个目标商品在对应图神经网络的隐藏层的值,作为对应目标商品的商品特征。
具体的,可以是将第i个目标用户的图神经网络中第k层的隐藏层的值
Figure BDA0002331458750000184
作为第i个目标用户的用户特征,将第j个目标商品的图神经网络中第k层的隐藏层的值
Figure BDA0002331458750000185
作为第j个目标商品的商品特征。
在本发明的一个实施例中,基于预设的图神经网络,根据如表6所示的合并交互数据得到每个目标用户的用户特征可以是如表7所示,根据如表6所示的合并交互数据得到每个目标商品的商品特征以是如表8所示:
表7
用户号 用户特征
U1 (0.1,0.2,0,0.4)
U2 (1,0.4,0.2,0.6)
U3 (0.3,0.6,0,0.2)
U4 (0.4,0.8,0.3,0.3)
U5 (0.1,0.1,0.2,0.1)
U6 (0.9,0.7,0.2,0.6)
表8
商品号 商品特征
P1 (0.3,0.2,0.1,0.5)
P2 (0.3,0.1,0.1,0.8)
P3 (0.7,0.8,0.2,0.5)
P4 (0.3,0.6,0.4,0.4)
步骤S2500,根据用户特征、商品特征和初始样本集合,构建新的样本集合。
在本发明的一个实施例中,根据用户特征、商品特征和初始样本集合,构建新的样本集合包括:
在每条初始样本中,增加对应目标用户的用户特征和对应目标商品的商品特征,得到新的样本。
在本发明的一个实施例中,可以是将表7中的用户特征和表8中的商品特征增加至表4中的样本数据表中,可以得到如表9所示的新的样本的数据表。
表9
Figure BDA0002331458750000191
Figure BDA0002331458750000201
步骤S2600,基于新的样本集合,采用机器学习算法训练最终的商品推荐模型。
在本发明的一个实施例中,可以是基于新的样本集合重新训练初始的商品推荐模型,得到最终的商品推荐模型。
在本发明的实施例中,通过目标用户针对目标商品执行多种交互操作的交互数据,基于图神经网络得到每个目标用户的用户特征和每个目标商品的商品特征,并根据用户特征和商品特征来训练得到最终的商品推荐模型,可以使得最终的商品推荐模型更容易学习到有用的信息,进而可以提升最终的商品推荐模型的推荐效果。
在本发明的一个实施例中,可以根据最终的商品推荐模型对用户进行商品推荐。具体的,该方法还可以包括如下所示的步骤S3100~S3400:
步骤S3100,获取待推荐用户对应预设的至少一个候选商品的选定特征的特征值、和待推荐用户针对每个候选商品执行多种交互操作的新的交互数据。
步骤S3200,根据新的交互数据得到待推荐用户的用户特征和每个候选商品的商品特征。
根据新的交互数据得到待推荐用户的用户特征和候选商品的商品特征的步骤可以包括:
根据最终的商品推荐模型,将多种交互操作的新的交互数据进行合并,得到新的合并交互数据;基于图神经网络,根据新的合并交互数据得到待推荐用户的用户特征和候选商品的商品特征。具体可以参照前述的步骤2300和步骤S2400,在此不再赘述。
步骤S3300,基于最终的商品推荐模型,分别根据待推荐用户对应每个候选商品的选定特征的特征值、待推荐用户的用户特征和候选商品的商品特征,得到每个候选商品对应待推荐用户的推荐分。
具体的,可以是将每个待推荐用户对应每个候选商品的选定特征的特征值、待推荐用户的用户特征和候选商品的商品特征输入至最终的商品推荐模型中,就能够得到每个候选商品对应待推荐用户的推荐分。
步骤S3400,选取推荐分符合预设的推荐条件的候选商品,作为推荐商品推荐给待推荐用户。
在本发明的一个实施例中,选取推荐分符合预设的推荐条件的候选商品,作为推荐商品推荐给待推荐用户的步骤包括如下所示的步骤S3410和S3420:
步骤S3410,根据推荐分对候选商品进行降序排序,并获取每个候选商品的排序次序。
步骤S3420,选取排序次序符合预设的排序范围的候选商品,作为推荐商品推荐给待推荐用户。
在本发明的一个实施例中,该排序范围可以是预先根据应用场景或具体需求设定的好的,例如该排序范围可以是1~3,那么可以是选取排序次序为1、2、3的候选商品,作为推荐商品推荐给待推荐用户。
在本发明的一个实施例中,该方法还可以包括:
展示候选商品、及每个候选商品的排序次序,以供待推荐用户挑选。
<装置实施例>
在本实施例中,提供一种商品推荐模型的训练装置5000,如图5所示,包括数据获取模块5100、初始训练模块5200、数据合并模块5300、特征生成模块5400、样本构建模块5500和最终训练模块5600。
上述数据获取模块5100用于获取目标用户针对目标商品执行多种交互操作的交互数据、用于训练商品推荐模型的初始样本集合。其中,初始样本集合中的每条原始样本包括多个选定特征和标签,标签表示对应原始样本产生时目标用户针对目标商品是否执行指定的交互操作。
上述初始训练模块5200用于基于初始样本集合,采用预设的机器学习算法训练初始的商品推荐模型。
上述数据合并模块5300用于根据初始的商品推荐模型和初始样本集合,将多种交互操作的交互数据进行合并,得到合并交互数据。
上述特征生成模块5400用于基于预设的图神经网络,根据合并交互数据得到每个目标用户的用户特征和每个目标商品的商品特征。
上述样本构建模块5500用于根据用户特征、商品特征和初始样本集合,构建新的样本集合。
上述最终训练模块5600用于基于新的样本集合,采用机器学习算法训练最终的商品推荐模型。
在本发明的一个实施例中,数据合并模块5300还可以用于:
基于初始的商品推荐模型,根据选定特征得到每个目标用户和每个目标商品之间预测匹配度;
根据每个目标用户和每个目标商品之间预测匹配度构建预测匹配度矩阵;
分别根据每一交互操作的交互数据,构建对应交互操作的交互矩阵;
根据预测匹配度矩阵和每一交互矩阵训练预设的机器学习模型,得到合并交互数据。
在本发明的一个实施例中,根据预测匹配度矩阵和每一交互矩阵训练预设的机器学习模型,得到合并交互数据包括:
以机器学习模型的待定参数为变量,根据交互矩阵构建合并交互矩阵的表达式;
根据预测匹配度矩阵和并交互矩阵的表达式构建第一损失函数;
求解第一损失函数,确定机器学习模型的待定参数的取值,得到合并交互矩阵;
根据合并交互矩阵得到合并交互数据。
在本发明的一个实施例中,根据合并交互矩阵得到合并交互数据包括:
确定指定的交互操作的交互矩阵中的元素总数量和非空值率;其中,非空值率为非零元素的数量与元素总数量的比率;
根据元素总数量和非空值率,确定分值阈值;
将合并交互矩阵中数值小于或等于分值阈值的元素值调整为第一设定值,将大于分值阈值的元素值调整为第二设定值,得到合并交互数据。
在本发明的一个实施例中,合并交互矩阵的表达式表示为:
Figure BDA0002331458750000221
其中,Xi为第i个交互操作的交互矩阵;wi和b为机器学习模型的待定参数,P为合并交互矩阵。
在本发明的一个实施例中,第一损失函数表示为:
Figure BDA0002331458750000222
其中,Ki,j为预测匹配度矩阵中第i行第j列的元素值,Pi,j为合并交互矩阵中第i行第j列的元素值;m为矩阵的行数,n为矩阵的列数。
在本发明的一个实施例中,特征生成模块5400还可以用于:
根据合并交互数据,分别构建对应每个目标用户和每个目标商品的图神经网络;其中,每个图神经网络的层数相同;
根据合并交互数据训练每个目标用户和每个目标商品的图神经网络,获得每个目标用户在对应图神经网络的隐藏层的值,作为对应目标用户的用户特征;获得每个目标商品在对应图神经网络的隐藏层的值,作为对应目标商品的商品特征。
在本发明的一个实施例中,根据合并交互数据训练每个目标用户和每个目标商品的图神经网络包括:
对于每个目标商品和每个目标用户,分别以对应图神经网络的待定参数为变量,构建隐藏层的表达式;其中,每个图神经网络在同一层的待定参数的相同;
根据每个目标商品的隐藏层的表达式和每个目标用户的隐藏层的表达式,构建每个目标商品和每个目标用户之间的距离的表达式;
根据每个目标商品和每个目标用户之间的距离的表达式、及合并交互数据,构建第二损失函数;
求解第二损失函数,确定每个图神经网络的待定参数的值。
在本发明的一个实施例中,将每个目标商品和每个目标用户轮流作为目标节点;
目标节点的隐藏层的表达式表示为:
h0=x
Figure BDA0002331458750000231
其中,其中
Figure BDA0002331458750000232
是第k层的目标节点的隐藏层的值,x是目标节点的初始值,N(v)代表在图神经网络中与目标节点连接的节点,σ是激活函数,Wk和Bk均为图神经网络的第k层的待定系数。
在本发明的一个实施例中,第二损失函数的表达式表示为:
L2=∑ij(yij-Pij)2
其中,Pij为合成交互矩阵中第i个目标用户和第j个目标商品对应的元素值;yij为第i个目标用户和第j个目标商品之间的距离。
在本发明的一个实施例中,机器学习算法为GBDT算法。
在本发明的一个实施例中,样本构建模块5500还可以用于:
在每条初始样本中,增加对应目标用户的用户特征和对应目标商品的商品特征,得到新的样本。
在本发明的一个实施例中,该商品推荐模型的训练装置5000还可以包括:
用于获取待推荐用户对应预设的至少一个候选商品的选定特征的特征值、和待推荐用户针对每个候选商品执行多种交互操作的新的交互数据的模块;
用于根据新的交互数据得到待推荐用户的用户特征和每个候选商品的商品特征的模块;
用于基于最终的商品推荐模型,分别根据待推荐用户对应每个候选商品的选定特征的特征值、待推荐用户的用户特征和候选商品的商品特征,得到每个候选商品对应待推荐用户的推荐分的模块;
用于选取推荐分符合预设的推荐条件的候选商品,作为推荐商品推荐给待推荐用户的模块。
在本发明的一个实施例中,选取推荐分符合预设的推荐条件的候选商品,作为推荐商品推荐给待推荐用户包括:
根据推荐分对候选商品进行降序排序,并获取每个候选商品的排序次序;
选取排序次序符合预设的排序范围的候选商品,作为推荐商品推荐给待推荐用户。
在本发明的一个实施例中,该商品推荐模型的训练装置5000还可以包括:
用于展示候选商品、及每个候选商品的排序次序的模块。
本领域技术人员应当明白,可以通过各种方式来实现商品推荐模型的训练装置5000。例如,可以通过指令配置处理器来实现商品推荐模型的训练装置5000。例如,可以将指令存储在ROM中,并且当启动设备时,将指令从ROM读取到可编程器件中来实现商品推荐模型的训练装置5000。例如,可以将商品推荐模型的训练装置5000固化到专用器件(例如ASIC)中。可以将商品推荐模型的训练装置5000分成相互独立的单元,或者可以将它们合并在一起实现。商品推荐模型的训练装置5000可以通过上述各种实现方式中的一种来实现,或者可以通过上述各种实现方式中的两种或更多种方式的组合来实现。
在本实施例中,商品推荐模型的训练装置5000可以具有多种实现形式,例如,商品推荐模型的训练装置5000可以是任何的提供模型训练服务的软件产品或者应用程序中运行的功能模块,或者是这些软件产品或者应用程序的外设嵌入件、插件、补丁件等,还可以是这些软件产品或者应用程序本身。
<***>
在本实施例中,如图6所示,还提供一种至少一个计算装置6100和至少一个存储装置6200的***6000。该至少一个存储装置6200用于存储可执行的指令;该指令用于控制至少一个计算装置6100执行根据本发明任意实施例的商品推荐模型的训练方法。
在本实施例中,该***6000可以是手机、平板电脑、掌上电脑、台式机、笔记本电脑、工作站、游戏机等设备,也可以是由多个设备构成的分布式***。
<计算机可读存储介质>
在本实施例中,还提供一种计算机可读存储介质,其上存储有计算机程序,计算机程序在被处理器执行时实现如本发明任意实施例的商品推荐模型的训练方法。
本发明可以是设备、方法和/或计算机程序产品。计算机程序产品可以包括计算机可读存储介质,其上载有用于使处理器实现本发明的各个方面的计算机可读程序指令。
计算机可读存储介质可以是可以保持和存储由指令执行设备使用的指令的有形设备。计算机可读存储介质例如可以是――但不限于――电存储设备、磁存储设备、光存储设备、电磁存储设备、半导体存储设备或者上述的任意合适的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、静态随机存取存储器(SRAM)、便携式压缩盘只读存储器(CD-ROM)、数字多功能盘(DVD)、记忆棒、软盘、机械编码设备、例如其上存储有指令的打孔卡或凹槽内凸起结构、以及上述的任意合适的组合。这里所使用的计算机可读存储介质不被解释为瞬时信号本身,诸如无线电波或者其他自由传播的电磁波、通过波导或其他传输媒介传播的电磁波(例如,通过光纤电缆的光脉冲)、或者通过电线传输的电信号。
这里所描述的计算机可读程序指令可以从计算机可读存储介质下载到各个计算/处理设备,或者通过网络、例如因特网、局域网、广域网和/或无线网下载到外部计算机或外部存储设备。网络可以包括铜传输电缆、光纤传输、无线传输、路由器、防火墙、交换机、网关计算机和/或边缘服务器。每个计算/处理设备中的网络适配卡或者网络接口从网络接收计算机可读程序指令,并转发该计算机可读程序指令,以供存储在各个计算/处理设备中的计算机可读存储介质中。
用于执行本发明操作的计算机程序指令可以是汇编指令、指令集架构(ISA)指令、机器指令、机器相关指令、微代码、固件指令、状态设置数据、或者以一种或多种编程语言的任意组合编写的源代码或目标代码,所述编程语言包括面向对象的编程语言—诸如Smalltalk、C++等,以及常规的过程式编程语言—诸如“C”语言或类似的编程语言。计算机可读程序指令可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络—包括局域网(LAN)或广域网(WAN)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。在一些实施例中,通过利用计算机可读程序指令的状态信息来个性化定制电子电路,例如可编程逻辑电路、现场可编程门阵列(FPGA)或可编程逻辑阵列(PLA),该电子电路可以执行计算机可读程序指令,从而实现本发明的各个方面。
这里参照根据本发明实施例的方法、装置(***)和计算机程序产品的流程图和/或框图描述了本发明的各个方面。应当理解,流程图和/或框图的每个方框以及流程图和/或框图中各方框的组合,都可以由计算机可读程序指令实现。
这些计算机可读程序指令可以提供给通用计算机、专用计算机或其它可编程数据处理装置的处理器,从而生产出一种机器,使得这些指令在通过计算机或其它可编程数据处理装置的处理器执行时,产生了实现流程图和/或框图中的一个或多个方框中规定的功能/动作的装置。也可以把这些计算机可读程序指令存储在计算机可读存储介质中,这些指令使得计算机、可编程数据处理装置和/或其他设备以特定方式工作,从而,存储有指令的计算机可读介质则包括一个制造品,其包括实现流程图和/或框图中的一个或多个方框中规定的功能/动作的各个方面的指令。
也可以把计算机可读程序指令加载到计算机、其它可编程数据处理装置、或其它设备上,使得在计算机、其它可编程数据处理装置或其它设备上执行一系列操作步骤,以产生计算机实现的过程,从而使得在计算机、其它可编程数据处理装置、或其它设备上执行的指令实现流程图和/或框图中的一个或多个方框中规定的功能/动作。
附图中的流程图和框图显示了根据本发明的多个实施例的***、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或指令的一部分,所述模块、程序段或指令的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的***来实现,或者可以用专用硬件与计算机指令的组合来实现。对于本领域技术人员来说公知的是,通过硬件方式实现、通过软件方式实现以及通过软件和硬件结合的方式实现都是等价的。
以上已经描述了本发明的各实施例,上述说明是示例性的,并非穷尽性的,并且也不限于所披露的各实施例。在不偏离所说明的各实施例的范围和精神的情况下,对于本技术领域的普通技术人员来说许多修改和变更都是显而易见的。本文中所用术语的选择,旨在最好地解释各实施例的原理、实际应用或对市场中的技术改进,或者使本技术领域的其它普通技术人员能理解本文披露的各实施例。本发明的范围由所附权利要求来限定。

Claims (10)

1.一种商品推荐模型的训练方法,包括:
获取目标用户针对目标商品执行多种交互操作的交互数据、用于训练商品推荐模型的初始样本集合,其中,所述初始样本集合中的每条原始样本包括多个选定特征和标签,所述标签表示对应原始样本产生时所述目标用户针对所述目标商品是否执行指定的交互操作;
基于所述初始样本集合,采用预设的机器学习算法训练初始的商品推荐模型;
根据所述初始的商品推荐模型和所述初始样本集合,将多种交互操作的交互数据进行合并,得到合并交互数据;
基于预设的图神经网络,根据所述合并交互数据得到每个目标用户的用户特征和每个目标商品的商品特征;
根据所述用户特征、所述商品特征和所述初始样本集合,构建新的样本集合;
基于所述新的样本集合,采用所述机器学习算法训练最终的商品推荐模型。
2.根据权利要求1所述的方法,所述根据所述初始的商品推荐模型和所述初始样本集合,将多种交互操作的交互数据进行合并,得到合并交互数据包括:
基于所述初始的商品推荐模型,根据所述选定特征得到每个目标用户和每个目标商品之间预测匹配度;
根据每个目标用户和每个目标商品之间预测匹配度构建预测匹配度矩阵;
分别根据每一交互操作的交互数据,构建对应交互操作的交互矩阵;
根据所述预测匹配度矩阵和每一交互矩阵训练预设的机器学习模型,得到所述合并交互数据。
3.根据权利要求2所述的方法,所述根据所述预测匹配度矩阵和每一交互矩阵训练预设的机器学习模型,得到所述合并交互数据包括:
以所述机器学习模型的待定参数为变量,根据所述交互矩阵构建合并交互矩阵的表达式;
根据所述预测匹配度矩阵和所述并交互矩阵的表达式构建第一损失函数;
求解所述第一损失函数,确定所述机器学习模型的待定参数的取值,得到所述合并交互矩阵;
根据所述合并交互矩阵得到所述合并交互数据。
4.根据权利要求3所述的方法,所述根据所述合并交互矩阵得到所述合并交互数据包括:
确定所述指定的交互操作的交互矩阵中的元素总数量和非空值率;其中,所述非空值率为非零元素的数量与所述元素总数量的比率;
根据所述元素总数量和所述非空值率,确定分值阈值;
将所述合并交互矩阵中数值小于或等于所述分值阈值的元素值调整为第一设定值,将大于所述分值阈值的元素值调整为第二设定值,得到所述合并交互数据。
5.根据权利要求3所述的方法,所述合并交互矩阵的表达式表示为:
Figure FDA0002331458740000021
其中,Xi为第i个交互操作的交互矩阵;wi和b为所述机器学习模型的待定参数,P为所述合并交互矩阵。
6.根据权利要求3所述的方法,所述第一损失函数表示为:
Figure FDA0002331458740000022
其中,Ki,j为所述预测匹配度矩阵中第i行第j列的元素值,Pi,j为所述合并交互矩阵中第i行第j列的元素值;m为矩阵的行数,n为矩阵的列数。
7.根据权利要求1所述的方法,所述基于预设的图神经网络,根据所述合并交互数据得到每个目标用户的用户特征和每个目标商品的商品特征包括:
根据合并交互数据,分别构建对应每个目标用户和每个目标商品的图神经网络;其中,每个图神经网络的层数相同;
根据所述合并交互数据训练每个目标用户和每个目标商品的图神经网络,获得每个目标用户在对应图神经网络的隐藏层的值,作为对应目标用户的用户特征;获得每个目标商品在对应图神经网络的隐藏层的值,作为对应目标商品的商品特征。
8.一种商品推荐模型的训练装置,包括:
数据获取模块,用于获取目标用户针对目标商品执行多种交互操作的交互数据、用于训练商品推荐模型的初始样本集合,其中,所述初始样本集合中的每条原始样本包括多个选定特征和标签,所述标签表示对应原始样本产生时所述目标用户针对所述目标商品是否执行指定的交互操作;
初始训练模块,用于基于所述初始样本集合,采用预设的机器学习算法训练初始的商品推荐模型;
数据合并模块,用于根据所述初始的商品推荐模型和所述初始样本集合,将多种交互操作的交互数据进行合并,得到合并交互数据;
特征生成模块,用于基于预设的图神经网络,根据所述合并交互数据得到每个目标用户的用户特征和每个目标商品的商品特征;
样本构建模块,用于根据所述用户特征、所述商品特征和所述初始样本集合,构建新的样本集合;以及,
最终训练模块,用于基于所述新的样本集合,采用所述机器学习算法训练最终的商品推荐模型。
9.一种包括至少一个计算装置和至少一个存储装置的***,其中,所述至少一个存储装置用于存储指令,所述指令用于控制所述至少一个计算装置执行根据权利要求1至7中任一项所述的方法。
10.一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序在被处理器执行时实现如权利要求1至7中任一项所述的方法。
CN201911337899.5A 2019-12-23 2019-12-23 一种商品推荐模型的训练方法、装置及*** Active CN111179031B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911337899.5A CN111179031B (zh) 2019-12-23 2019-12-23 一种商品推荐模型的训练方法、装置及***

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911337899.5A CN111179031B (zh) 2019-12-23 2019-12-23 一种商品推荐模型的训练方法、装置及***

Publications (2)

Publication Number Publication Date
CN111179031A true CN111179031A (zh) 2020-05-19
CN111179031B CN111179031B (zh) 2023-09-26

Family

ID=70653930

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911337899.5A Active CN111179031B (zh) 2019-12-23 2019-12-23 一种商品推荐模型的训练方法、装置及***

Country Status (1)

Country Link
CN (1) CN111179031B (zh)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111507812A (zh) * 2020-07-02 2020-08-07 成都晓多科技有限公司 一种基于属性和标题的商品搭配推荐方法及装置
CN111932308A (zh) * 2020-08-13 2020-11-13 中国工商银行股份有限公司 数据推荐方法、装置和设备
CN112116411A (zh) * 2020-08-10 2020-12-22 第四范式(北京)技术有限公司 一种用于商品推荐的排序模型的训练方法、装置及***
CN112184391A (zh) * 2020-10-16 2021-01-05 中国科学院计算技术研究所 一种推荐模型的训练方法、介质、电子设备和推荐模型
CN112330406A (zh) * 2020-11-10 2021-02-05 深圳大学 一种长尾物品推荐方法、智能终端及存储介质
CN113763075A (zh) * 2020-07-17 2021-12-07 北京沃东天骏信息技术有限公司 推送物品的方法、装置、设备及介质
CN113869973A (zh) * 2021-09-15 2021-12-31 中信建投证券股份有限公司 产品推荐方法、产品推荐***和计算机可读存储介质
CN115757979A (zh) * 2022-12-20 2023-03-07 济南亿凛呈嗒网络有限公司 一种基于人工智能的用户数据推荐方法及***

Citations (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105654329A (zh) * 2015-01-22 2016-06-08 香港中文大学深圳研究院 一种整合性推荐方法及装置
KR20170096971A (ko) * 2016-02-17 2017-08-25 옴니어스 주식회사 스타일 특징을 이용한 상품 추천 방법
CN107861972A (zh) * 2017-09-15 2018-03-30 广州唯品会研究院有限公司 一种用户录入商品信息后显示商品全结果的方法及设备
CN108537624A (zh) * 2018-03-09 2018-09-14 西北大学 一种基于深度学习的旅游服务推荐方法
CN109377260A (zh) * 2018-09-14 2019-02-22 江阴逐日信息科技有限公司 面向服装行业的用户行为分析***
CN109509054A (zh) * 2018-09-30 2019-03-22 平安科技(深圳)有限公司 海量数据下商品推荐方法、电子装置及存储介质
US10290040B1 (en) * 2015-09-16 2019-05-14 Amazon Technologies, Inc. Discovering cross-category latent features
CN109767261A (zh) * 2018-12-18 2019-05-17 深圳壹账通智能科技有限公司 产品推荐方法、装置、计算机设备和存储介质
CN110008399A (zh) * 2019-01-30 2019-07-12 阿里巴巴集团控股有限公司 一种推荐模型的训练方法及装置、一种推荐方法及装置
CN110012356A (zh) * 2019-04-16 2019-07-12 腾讯科技(深圳)有限公司 视频推荐方法、装置和设备及计算机存储介质
CN110033342A (zh) * 2019-01-30 2019-07-19 阿里巴巴集团控股有限公司 一种推荐模型的训练方法及装置、一种推荐方法及装置
CN110046952A (zh) * 2019-01-30 2019-07-23 阿里巴巴集团控股有限公司 一种推荐模型的训练方法及装置、一种推荐方法及装置
CN110059262A (zh) * 2019-04-19 2019-07-26 武汉大学 一种基于混合神经网络的项目推荐模型的构建方法及装置、项目推荐方法
CN110119467A (zh) * 2019-05-14 2019-08-13 苏州大学 一种基于会话的项目推荐方法、装置、设备及存储介质
CN110147882A (zh) * 2018-09-03 2019-08-20 腾讯科技(深圳)有限公司 神经网络模型的训练方法、人群扩散方法、装置及设备
CN110428298A (zh) * 2019-07-15 2019-11-08 阿里巴巴集团控股有限公司 一种店铺推荐方法、装置及设备
CN110580482A (zh) * 2017-11-30 2019-12-17 腾讯科技(深圳)有限公司 图像分类模型训练、图像分类、个性化推荐方法及装置
CN110580314A (zh) * 2019-07-16 2019-12-17 华南师范大学 基于图卷积神经网络和动态权重的课程推荐方法和***

Patent Citations (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105654329A (zh) * 2015-01-22 2016-06-08 香港中文大学深圳研究院 一种整合性推荐方法及装置
US10290040B1 (en) * 2015-09-16 2019-05-14 Amazon Technologies, Inc. Discovering cross-category latent features
KR20170096971A (ko) * 2016-02-17 2017-08-25 옴니어스 주식회사 스타일 특징을 이용한 상품 추천 방법
CN107861972A (zh) * 2017-09-15 2018-03-30 广州唯品会研究院有限公司 一种用户录入商品信息后显示商品全结果的方法及设备
CN110580482A (zh) * 2017-11-30 2019-12-17 腾讯科技(深圳)有限公司 图像分类模型训练、图像分类、个性化推荐方法及装置
CN108537624A (zh) * 2018-03-09 2018-09-14 西北大学 一种基于深度学习的旅游服务推荐方法
CN110147882A (zh) * 2018-09-03 2019-08-20 腾讯科技(深圳)有限公司 神经网络模型的训练方法、人群扩散方法、装置及设备
CN109377260A (zh) * 2018-09-14 2019-02-22 江阴逐日信息科技有限公司 面向服装行业的用户行为分析***
CN109509054A (zh) * 2018-09-30 2019-03-22 平安科技(深圳)有限公司 海量数据下商品推荐方法、电子装置及存储介质
CN109767261A (zh) * 2018-12-18 2019-05-17 深圳壹账通智能科技有限公司 产品推荐方法、装置、计算机设备和存储介质
CN110008399A (zh) * 2019-01-30 2019-07-12 阿里巴巴集团控股有限公司 一种推荐模型的训练方法及装置、一种推荐方法及装置
CN110046952A (zh) * 2019-01-30 2019-07-23 阿里巴巴集团控股有限公司 一种推荐模型的训练方法及装置、一种推荐方法及装置
CN110033342A (zh) * 2019-01-30 2019-07-19 阿里巴巴集团控股有限公司 一种推荐模型的训练方法及装置、一种推荐方法及装置
CN110012356A (zh) * 2019-04-16 2019-07-12 腾讯科技(深圳)有限公司 视频推荐方法、装置和设备及计算机存储介质
CN110059262A (zh) * 2019-04-19 2019-07-26 武汉大学 一种基于混合神经网络的项目推荐模型的构建方法及装置、项目推荐方法
CN110119467A (zh) * 2019-05-14 2019-08-13 苏州大学 一种基于会话的项目推荐方法、装置、设备及存储介质
CN110428298A (zh) * 2019-07-15 2019-11-08 阿里巴巴集团控股有限公司 一种店铺推荐方法、装置及设备
CN110580314A (zh) * 2019-07-16 2019-12-17 华南师范大学 基于图卷积神经网络和动态权重的课程推荐方法和***

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
刘志等: "基于属性偏好自学习的推荐方法", vol. 46, no. 46, pages 161 - 167 *

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111507812A (zh) * 2020-07-02 2020-08-07 成都晓多科技有限公司 一种基于属性和标题的商品搭配推荐方法及装置
CN113763075A (zh) * 2020-07-17 2021-12-07 北京沃东天骏信息技术有限公司 推送物品的方法、装置、设备及介质
CN112116411A (zh) * 2020-08-10 2020-12-22 第四范式(北京)技术有限公司 一种用于商品推荐的排序模型的训练方法、装置及***
CN111932308A (zh) * 2020-08-13 2020-11-13 中国工商银行股份有限公司 数据推荐方法、装置和设备
CN112184391A (zh) * 2020-10-16 2021-01-05 中国科学院计算技术研究所 一种推荐模型的训练方法、介质、电子设备和推荐模型
CN112184391B (zh) * 2020-10-16 2023-10-10 中国科学院计算技术研究所 一种推荐模型的训练方法、介质、电子设备和推荐模型
CN112330406A (zh) * 2020-11-10 2021-02-05 深圳大学 一种长尾物品推荐方法、智能终端及存储介质
CN112330406B (zh) * 2020-11-10 2024-05-24 深圳大学 一种长尾物品推荐方法、智能终端及存储介质
CN113869973A (zh) * 2021-09-15 2021-12-31 中信建投证券股份有限公司 产品推荐方法、产品推荐***和计算机可读存储介质
CN115757979A (zh) * 2022-12-20 2023-03-07 济南亿凛呈嗒网络有限公司 一种基于人工智能的用户数据推荐方法及***
CN115757979B (zh) * 2022-12-20 2023-12-01 海南达润丰企业管理合伙企业(有限合伙) 一种基于人工智能的用户数据推荐方法及***

Also Published As

Publication number Publication date
CN111179031B (zh) 2023-09-26

Similar Documents

Publication Publication Date Title
CN111179031B (zh) 一种商品推荐模型的训练方法、装置及***
CN108108821A (zh) 模型训练方法及装置
CA3066832A1 (en) Information search method, apparatus and system
US20160034968A1 (en) Method and device for determining target user, and network server
CN105574067A (zh) 项目推荐装置以及项目推荐方法
CN108984555B (zh) 用户状态挖掘和信息推荐方法、装置以及设备
CN113191838B (zh) 一种基于异质图神经网络的购物推荐方法及***
CN110689135B (zh) 一种反洗钱模型的训练方法、装置及电子设备
CN110276382B (zh) 基于谱聚类的人群分类方法、装置及介质
CN107918778A (zh) 一种信息匹配方法及相关装置
CN111506575A (zh) 一种网点业务量预测模型的训练方法、装置及***
CN112784039A (zh) 一种分配在线客服的方法、装置和存储介质
CN105308591A (zh) 来自社交交互的关系强度的动态性
CN114154461A (zh) 一种文本数据的处理方法、装置及***
US10706371B2 (en) Data processing techniques
CA3004344C (en) Method and apparatus for dynamically selecting content for online visitors
US11532025B2 (en) Deep cognitive constrained filtering for product recommendation
CN106777069A (zh) 基于矩阵因子分解的个性化推荐方法及推荐***
CN110598766B (zh) 一种商品推荐模型的训练方法、装置及电子设备
KR102119518B1 (ko) 인공지능을 이용하여 생성되는 스타일 공간에 기반한 상품 추천 방법 및 시스템
CN112669127A (zh) 用于商品推荐的方法、装置及设备
CN112818082A (zh) 评价文本推送方法和装置
CN111475664A (zh) 对象展示方法、装置及电子设备
CN115905681A (zh) 店铺推荐方法、服务器、展示方法、客户端及***
US10296623B2 (en) Document curation

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant