CN113705683B - 推荐模型的训练方法、装置、电子设备及存储介质 - Google Patents
推荐模型的训练方法、装置、电子设备及存储介质 Download PDFInfo
- Publication number
- CN113705683B CN113705683B CN202111002586.1A CN202111002586A CN113705683B CN 113705683 B CN113705683 B CN 113705683B CN 202111002586 A CN202111002586 A CN 202111002586A CN 113705683 B CN113705683 B CN 113705683B
- Authority
- CN
- China
- Prior art keywords
- sample
- training sample
- training
- object type
- processed
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000012549 training Methods 0.000 title claims abstract description 807
- 238000000034 method Methods 0.000 title claims abstract description 64
- 238000003062 neural network model Methods 0.000 claims abstract description 11
- 239000013598 vector Substances 0.000 claims description 130
- 238000012216 screening Methods 0.000 claims description 21
- 238000004590 computer program Methods 0.000 claims description 18
- 230000006399 behavior Effects 0.000 claims description 13
- 238000009825 accumulation Methods 0.000 claims description 5
- 238000001914 filtration Methods 0.000 claims 2
- 238000012545 processing Methods 0.000 description 11
- 230000004927 fusion Effects 0.000 description 10
- 238000010586 diagram Methods 0.000 description 9
- 230000006870 function Effects 0.000 description 9
- 101150109471 PID2 gene Proteins 0.000 description 7
- 230000003287 optical effect Effects 0.000 description 4
- 238000004891 communication Methods 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 101100190466 Caenorhabditis elegans pid-3 gene Proteins 0.000 description 2
- 101000609957 Homo sapiens PTB-containing, cubilin and LRP1-interacting protein Proteins 0.000 description 2
- 102100039157 PTB-containing, cubilin and LRP1-interacting protein Human genes 0.000 description 2
- 238000013528 artificial neural network Methods 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 2
- 238000010606 normalization Methods 0.000 description 2
- 239000013307 optical fiber Substances 0.000 description 2
- 230000002093 peripheral effect Effects 0.000 description 2
- 230000000644 propagated effect Effects 0.000 description 2
- 230000006978 adaptation Effects 0.000 description 1
- 230000004075 alteration Effects 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 239000003086 colorant Substances 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000007499 fusion processing Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/22—Matching criteria, e.g. proximity measures
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- Databases & Information Systems (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Evolutionary Computation (AREA)
- Evolutionary Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Computational Biology (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Image Analysis (AREA)
Abstract
本公开公开了一种推荐模型的训练方法、装置、电子设备及存储介质。该方法在获取训练样本集后确定待处理训练样本集;遍历待处理训练样本集,并执行:根据当前训练样本中第一对象类型对应的样本信息,在第一训练样本中确定当前训练样本的相似样本;将相似样本中的第二对象类型对应的样本信息,对当前训练样本中的第二对象类型对应的样本信息进行替换,将替换后的当前训练样本作为新训练样本,以及得到新训练样本的样本标签;基于训练样本集中的训练样本和相应样本标签,以及待处理训练样本集中每个训练样本对应的新训练样本和相应样本标签,对神经网络模型进行迭代训练,得到推荐模型。该方法提高了推荐模型的推荐准确率。
Description
技术领域
本公开涉及数据处理技术领域,尤其涉及一种推荐模型的训练方法、装置、 电子设备及存储介质。
背景技术
对于多媒体的推荐***,输入推荐***的样本信息可以包括用户账户信息 和多媒体资源信息,还可以包括用户账户与相应多媒体资源的上下文信息,获 取到该样本信息中每种属性的特征向量,如词向量后,推荐***通过这些词向 量,可以判断出该样本信息属于正样本的概率值(即基于这样的上下文信息的情况下,该用户选择该对象的概率值)。
在训练推荐模型时,常常存在因训练样本少,导致训练出的推荐模型的推 荐准确性不高的问题。
发明内容
本公开实施例提供一种推荐模型的训练方法、装置、电子设备及存储介质, 以至少解决相关技术中因训练样本少,导致训练出的推荐模型的推荐准确率不 高的问题。本公开的技术方案如下:
根据本公开实施例的第一方面,提供一种推荐模型的训练方法,该方法可 以包括:
获取训练样本集,所述训练样本集包括训练样本和所述训练样本对应的样 本标签;所述训练样本包括两种对象类型对应的样本信息,所述两种对象类型 包括账户类型和多媒体类型,所述两种对象类型对应的样本信息包括用户账户 信息和多媒体资源信息;所述样本标签表征所述用户账户信息对应的账户对所 述多媒体资源信息对应的多媒体资源间的操作行为;
确定所述训练样本集中的待处理训练样本集;遍历所述待处理训练样本集, 针对遍历到的当前训练样本,执行如下步骤:
根据所述当前训练样本中第一对象类型对应的样本信息,在第一训练 样本中确定所述当前训练样本的相似样本;其中,所述第一对象类型是所 述训练样本中的一种对象类型;所述第一训练样本为所述训练样本集中除 所述当前训练样本外的其他训练样本;
将所述相似样本中的第二对象类型对应的样本信息,对所述当前训练 样本中的第二对象类型对应的样本信息进行替换,将替换后的所述当前训 练样本作为新训练样本,并将相应相似样本的样本标签确定为所述新训练 样本的样本标签;所述第二对象类型是所述训练样本中除所述第一对象类 型外的类型;
基于所述训练样本集中的训练样本和相应样本标签,以及所述待处理训练 样本集中每个训练样本对应的新训练样本和相应样本标签,对神经网络模型进 行迭代训练,得到推荐模型。
该实施方式通过对用户账户对应的训练样本或多媒体资源对应的训练样 本进行样本扩展,得到针对相应用户账户或多媒体资源的新训练样本,从而避 免某些用户账户或某些多媒体资源对应样本因有效样本少,而导致训练出的推 荐模型不准确的问题,提高了推荐模型的推荐准确率。
一种可能的实施方式中,所述用户账户信息包括账户标识;
在所述第一对象类型对应的样本信息为所述用户账户信息时,确定所述训 练样本集中的待处理训练样本集,包括:
获取历史累计样本中各账户标识的数量;
若目标账户标识的数量小于预设数量阈值,则将所述训练样本集中所述目 标账户标识对应的训练样本确定为待处理训练样本,基于确定的待处理训练样 本构建待处理训练样本集;所述目标账户标识为所述训练样本集中的一个账户 标识。
该实施方式通过查询历史累计样本中各账户标识的数量可准确的确定出 目标账户标识对应的用户账户存在有效样本量少的问题,且将训练样本集中目 标账户标识对应的训练样本作为待处理训练样本,以实现后期对该待处理训练 样本进行样本扩展。
一种可能的实施方式中,所述多媒体资源信息包括多媒体标识;
在所述第一对象类型对应的样本信息为所述多媒体资源信息时,确定所述 训练样本集中的待处理训练样本集,包括:
获取存储的历史累计样本中各多媒体标识的数量;
若目标多媒体标识的数量小于预设数量阈值,则将所述训练样本集中所述 目标多媒体标识对应的训练样本确定为待处理训练样本,基于确定的待处理训 练样本构建待处理训练样本集;所述目标多媒体标识为所述训练样本集中的一 个多媒体标识。
该实施方式通过查询历史累计样本中各多媒体标识的数量可准确的确定 出目标多媒体标识对应的多媒体资源存在有效样本量少的问题,且将训练样本 集中目标多媒体标识对应的训练样本作为待处理训练样本,以实现后期对该待 处理训练样本进行样本扩展。
一种可能的实施方式中,根据所述当前训练样本中第一对象类型对应的样 本信息,在第一训练样本中确定所述当前训练样本的相似样本,包括:
获取所述当前训练样本的第一对象类型对应的样本信息分别与所述第一 训练样本中各训练样本的第一对象类型对应的样本信息的相似度;
将满足预设筛选条件的相似度对应的第一训练样本确定为所述当前训练 样本的相似样本。
该实施方式为了扩展出与当前训练样本中第一对象类型对应的有效样本, 在第一训练样本中,根据当前训练样本中第一对象类型对应的样本信息来寻找 其相似样本,以得到与当前训练样本存在较强关联程度的相似样本。
一种可能的实施方式中,所述用户账户信息还包括账户特征;
获取所述当前训练样本的第一对象类型对应的样本信息分别与所述第一 训练样本中各训练样本的第一对象类型对应的样本信息的相似度,包括:
获取所述当前训练样本的所述账户标识和所述账户特征分别与所述第一 训练样本中各训练样本的所述账户标识和所述账户特征的相似度;或者,
获取所述当前训练样本的所述账户标识或所述账户特征分别与所述第一 训练样本中各训练样本的所述账户标识或所述账户特征的相似度。
该实施方式通过用户账户信息中的账户标识和/或账户特征来获取与当前 训练样本中账户标识和/或账户特征对应的相似样本。
一种可能的实施方式中,所述多媒体资源信息包括多媒体特征;
获取所述当前训练样本的第一对象类型对应的样本信息分别与所述第一 训练样本中各训练样本的第一对象类型对应的样本信息的相似度,包括:
获取所述当前训练样本的所述多媒体标识和所述多媒体特征分别与所述 第一训练样本中各训练样本的所述多媒体标识和所述多媒体特征的相似度;或 者,
获取所述当前训练样本的所述多媒体标识或所述多媒体特征分别与所述 第一训练样本中各训练样本的所述多媒体标识或所述多媒体特征的相似度。
该实施方式通过多媒体资源信息中的多媒体标识和多媒体特征来获取与 当前训练样本中多媒体资源信息对应的相似样本。
一种可能的实施方式中,将所述相似样本中的第二对象类型对应的样本信 息,对所述当前训练样本中的第二对象类型对应的样本信息进行替换,将替换 后的所述当前训练样本作为新训练样本,包括:
根据所述当前训练样本对应的相似样本的数量和样本选取权重,确定样本 选取数量;
从所述当前训练样本的相似样本中,选取所述样本选取数量的相似样本作 为待处理的相似样本;
根据所述待处理的相似样本中所述第二对象类型对应的样本信息,对所述 当前训练样本中所述第二对象类型对应的样本信息进行替换,将替换后的所述 当前训练样本作为新训练样本。
该实施方式仅通过相似样本中第二对象类型对应的样本信息与当前训练 样本中第二对象类型对应的样本信息进行替换,即可得到新的训练样本,提高 新训练样本的获取速度。
一种可能的实施方式中,所述样本选取权重是对所述满足预设筛选条件的 相似度进行归一化处理后得到的。
一种可能的实施方式中,在所述第一对象类型对应的样本信息为所述用户 账户信息时,所述第二对象类型对应的样本信息为所述多媒体资源信息;
根据所述待处理的相似样本中所述第二对象类型对应的样本信息,对所述 当前训练样本中所述第二对象类型对应的样本信息进行替换,将替换后的所述 当前训练样本作为新训练样本,包括:
将所述待处理的相似样本中的所述多媒体资源信息,替换所述当前训练样 本中的所述多媒体资源信息,并将替换后的所述当前训练样本作为新训练样本。
该实施方式在第二对象类型对应的样本信息为用户账户信息时,通过相似 样本中用户账户信息与当前训练样本中用户账户信息进行替换,得到用户账户 信息对应的新训练样本。
一种可能的实施方式中,在所述第一对象类型对应的样本信息为所述多媒 体资源信息时,所述第二对象类型对应的样本信息为所述用户账户信息。
根据所述待处理的相似样本中所述第二对象类型对应的样本信息,对所述 当前训练样本中所述第二对象类型对应的样本信息进行替换,将替换后的所述 当前训练样本作为新训练样本,包括:
将所述待处理的相似样本中的所述用户账户信息,替换所述当前训练样本 中的所述用户账户信息,并将替换后的所述当前训练样本作为新训练样本。
该实施方式在第二对象类型对应的样本信息为多媒体资源信息时,通过相 似样本中多媒体资源信息与当前训练样本中多媒体资源信息进行替换,得到多 媒体资源信息对应的新训练样本。
一种可能的实施方式中,根据所述待处理的相似样本中所述第二对象类型 对应的样本信息,对所述当前训练样本中所述第二对象类型对应的样本信息进 行替换,将替换后的所述当前训练样本作为新训练样本,包括:
获取所述待处理的相似样本中所述第二对象类型对应的样本信息的特征 向量,以及所述当前训练样本中所述第二对象类型对应的样本信息的特征向量;
根据所述待处理的相似样本中所述第二对象类型对应的样本信息的特征 向量与预设权重系数,得到所述待处理的相似样本中所述第二对象类型对应的 新的样本信息的特征向量;
基于所述第二对象类型对应的新的样本信息的特征向量,对所述当前训练 样本中所述第二对象类型对应的样本信息的特征向量进行替换,将替换后的所 述当前训练样本作为新训练样本。
该实施方式在当前训练样本第一对象类型对应的样本信息不变的情况下, 通过对相似样本中第二对象类型对应的样本信息的特征向量与预设权重系数 相乘,获取到训练样本集中不存在的第二对象类型对应的样本信息,从而通过 将新的样本信息的特征向量,替换当前训练样本中第二对象类型对应的样本信 息的特征向量,得到当前训练样本对应的新训练样本,确保了该新训练样本是与训练样本集中的各训练样本不同的训练样本。
一种可能的实施方式中,根据所述待处理的相似样本中所述第二对象类型 对应的样本信息的特征向量与预设权重系数,得到所述待处理的相似样本中所 述第二对象类型对应的新的样本信息的特征向量,包括:
当所述待处理的相似样本的样本选取数量为至少一个时,将每个待处理的 相似样本的所述第二对象类型对应的样本信息的特征向量与预设权重系数相 乘,得到所述每个待处理的相似样本中所述第二对象类型对应的新的样本信息 的特征向量;或者,
当所述待处理的相似样本的样本选取数量为至少两个时,将所述至少两个 待处理的相似样本中每个待处理的相似样本的所述第二对象类型对应的样本 信息的特征向量与预设权重系数进行加权求和,得到所述至少两个待处理的相 似样本中所述第二对象类型对应的一个新的样本信息的特征向量。
该实施方式在当前训练样本第一对象类型对应的样本信息不变的情况下, 通过对各相似样本中第二对象类型对应的样本信息的特征向量与预设权重系 数的加权求和,获取到训练样本集中不存在的第二对象类型对应的样本信息, 从而通过将新的样本信息的特征向量,替换当前训练样本中第二对象类型对应 的样本信息的特征向量,得到当前训练样本对应的新训练样本,确保了该新训练样本是与训练样本集中的各训练样本不同的训练样本。
根据本公开实施例的第二方面,提供一种数据处理装置,该装置可以包括:
获取单元,被配置为执行获取训练样本集,所述训练样本集包括训练样本 和所述训练样本对应的样本标签;所述训练样本包括两种对象类型对应的样本 信息,所述两种对象类型包括账户类型和多媒体类型,所述两种对象类型对应 的样本信息包括用户账户信息和多媒体资源信息;所述样本标签表征所述用户 账户信息对应的账户对所述多媒体资源信息对应的多媒体资源间的操作行为;
确定单元,被配置为执行确定所述训练样本集中的待处理训练样本集;遍 历所述待处理训练样本集,针对遍历到的当前训练样本,执行如下步骤:
根据所述当前训练样本中第一对象类型对应的样本信息,在第一训练 样本中确定所述当前训练样本的相似样本;其中,所述第一对象类型是所 述训练样本中的一种对象类型;所述第一训练样本为所述训练样本集中除 所述当前训练样本外的其他训练样本;
将所述相似样本中的第二对象类型对应的样本信息,对所述当前训练 样本中的第二对象类型对应的样本信息进行替换,将替换后的所述当前训 练样本作为新训练样本,并将相应相似样本的样本标签确定为所述新训练 样本的样本标签;所述第二对象类型是所述训练样本中除所述第一对象类 型外的类型;
训练单元,被配置为执行基于所述训练样本集中的训练样本和相应样本标 签,以及所述待处理训练样本集中每个训练样本对应的新训练样本和相应样本 标签,对神经网络模型进行迭代训练,得到推荐模型。
一种可能的实施方式中,所述用户账户信息包括账户标识;
在所述第一对象类型对应的样本信息为所述用户账户信息时,所述确定单 元,具体被配置为执行:
获取历史累计样本中各账户标识的数量;
若目标账户标识的数量小于预设数量阈值,则将所述训练样本集中所述目 标账户标识对应的训练样本确定为待处理训练样本,基于确定的待处理训练样 本构建待处理训练样本集;所述目标账户标识为所述训练样本集中的一个账户 标识。
一种可能的实施方式中,所述多媒体资源信息包括多媒体标识;
在所述第一对象类型对应的样本信息为所述多媒体资源信息时,所述确定 单元,具体被配置为执行:
获取存储的历史累计样本中各多媒体标识的数量;
若目标多媒体标识的数量小于预设数量阈值,则将所述训练样本集中所述 目标多媒体标识对应的训练样本确定为待处理训练样本,基于确定的待处理训 练样本构建待处理训练样本集;所述目标多媒体标识为所述训练样本集中的一 个多媒体标识。
一种可能的实施方式中,所述确定单元,还具体被配置为执行:
获取所述当前训练样本的第一对象类型对应的样本信息分别与所述第一 训练样本中各训练样本的第一对象类型对应的样本信息的相似度;
以及,将满足预设筛选条件的相似度对应的第一训练样本确定为所述当前 训练样本的相似样本。
一种可能的实施方式中,所述用户账户信息还包括账户特征;
所述确定单元,还具体被配置为执行:
获取所述当前训练样本的所述账户标识和所述账户特征分别与所述第一 训练样本中各训练样本的所述账户标识和所述账户特征的相似度;或者,获取 所述当前训练样本的所述账户标识或所述账户特征分别与所述第一训练样本 中各训练样本的所述账户标识或所述账户特征的相似度。
一种可能的实施方式中,所述多媒体资源信息包括多媒体特征;
所述确定单元,还具体被配置为执行:
获取所述当前训练样本的所述多媒体标识和所述多媒体特征分别与所述 第一训练样本中各训练样本的所述多媒体标识和所述多媒体特征的相似度;或 者,获取所述当前训练样本的所述多媒体标识或所述多媒体特征分别与所述第 一训练样本中各训练样本的所述多媒体标识或所述多媒体特征的相似度。
一种可能的实施方式中,所述确定单元,还具体被配置为执行:
根据所述当前训练样本对应的相似样本的数量和样本选取权重,确定样本 选取数量;
以及,从所述当前训练样本的相似样本中,选取所述样本选取数量的相似 样本作为待处理的相似样本;
根据所述待处理的相似样本中所述第二对象类型对应的样本信息,对所述 当前训练样本中所述第二对象类型对应的样本信息进行替换,将替换后的所述 当前训练样本作为新训练样本。
一种可能的实施方式中,所述样本选取权重是对所述满足预设筛选条件的 相似度进行归一化处理后得到的。
一种可能的实施方式中,在所述第一对象类型对应的样本信息为所述用户 账户信息时,所述第二对象类型对应的样本信息为所述多媒体资源信息;
所述确定单元,还具体被配置为执行:
将所述待处理的相似样本中的所述多媒体资源信息,替换所述当前训练样 本中的所述多媒体资源信息,并将替换后的所述当前训练样本作为新训练样本。
一种可能的实施方式中,在所述第一对象类型对应的样本信息为所述多媒 体资源信息时,所述第二对象类型对应的样本信息为所述用户账户信息。
所述确定单元,还具体被配置为执行:
将所述待处理的相似样本中的所述用户账户信息,替换所述当前训练样本 中的所述用户账户信息,并将替换后的所述当前训练样本作为新训练样本。
一种可能的实施方式中,所述确定单元,还具体被配置为执行:
获取所述待处理的相似样本中所述第二对象类型对应的样本信息的特征 向量,以及所述当前训练样本中所述第二对象类型对应的样本信息的特征向量;
以及,根据所述待处理的相似样本中所述第二对象类型对应的样本信息的 特征向量与预设权重系数,得到所述待处理的相似样本中所述第二对象类型对 应的新的样本信息的特征向量;
基于所述第二对象类型对应的新的样本信息的特征向量,对所述当前训练 样本中所述第二对象类型对应的样本信息的特征向量进行替换,将替换后的所 述当前训练样本作为新训练样本。
一种可能的实施方式中,所述确定单元,还具体被配置为执行:
当所述待处理的相似样本的样本选取数量为至少一个时,将每个待处理的 相似样本的所述第二对象类型对应的样本信息的特征向量与预设权重系数相 乘,得到所述每个待处理的相似样本中所述第二对象类型对应的新的样本信息 的特征向量;或者,当所述待处理的相似样本的样本选取数量为至少两个时, 将所述至少两个待处理的相似样本中每个待处理的相似样本的所述第二对象类型对应的样本信息的特征向量与预设权重系数进行加权求和,得到所述至少 两个待处理的相似样本中所述第二对象类型对应的一个新的样本信息的特征 向量。
根据本公开实施例的第三方面,提供一种电子设备,包括:
处理器;
用于存储所述处理器可执行指令的存储器;
其中,所述处理器被配置为执行所述指令,以实现上述第一方面中所述的 任一方法步骤。
根据本公开实施例的第四方面,提供一种计算机可读存储介质,当所述计 算机可读存储介质中的指令由电子设备的处理器执行时,使得电子设备能够执 行上述第一方面中所述的任一方法步骤。
根据本公开实施例的第五方面,提供一种计算机程序产品,包括计算机程 序/指令,所述计算机程序/指令被处理器执行时实现上述第一方面中所述的任 一方法步骤。
本公开的实施例提供的技术方案至少带来以下有益效果:
本公开实施例提供的推荐模型的训练方法在获取训练样本集后,训练样本 集包括训练样本和训练样本对应的样本标签;训练样本包括两种对象类型对应 的样本信息,两种对象类型包括账户类型和多媒体类型,两种对象类型对应的 样本信息包括用户账户信息和多媒体资源信息;样本标签表征用户账户信息对 应的账户对多媒体资源信息对应的多媒体资源间的操作行为,确定训练样本集中的待处理训练样本集;遍历待处理训练样本集,针对遍历到的当前训练样本, 执行如下步骤:根据当前训练样本中第一对象类型对应的样本信息,在第一训 练样本中确定当前训练样本的相似样本;第一对象类型是训练样本中的一种对 象类型;第一训练样本为训练样本集中除当前训练样本外的其他训练样本;将相似样本中的第二对象类型对应的样本信息,对当前训练样本中的第二对象类 型对应的样本信息进行替换,将替换后的当前训练样本作为新训练样本,并将相应相似样本的样本标签确定为新训练样本的样本标签;第二对象类型是训练 样本中除第一对象类型外的类型;最后,基于训练样本集中的训练样本和相应 样本标签,以及待处理训练样本集中每个训练样本对应的新训练样本和相应样 本标签,对神经网络模型进行迭代训练,得到推荐模型。该方法通过在样本信 息层面进行对相应用户账户或多媒体资源对应的样本进行扩展,得到扩展出的 针对相应用户账户或多媒体资源的新样本,使推荐模型在训练样本集中存在某些用户账户或某些多媒体资源对应的有限样本时,导致训练出的推荐模型不准 确的问题,增强训练出的推荐模型的鲁棒性,提高了推荐模型的推荐准确率。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的, 并不能限制本公开。
附图说明
图1是根据一示例性实施例示出的一种推荐***的训练方法的流程示意图。
图2是根据一示例性实施例示出的一种推荐模型的训练方法的流程示意图。
图3是根据一示例性实施例示出的一种推荐模型的训练装置的结构框图。
图4是根据一示例性实施例示出的一种电子设备的结构框图。
具体实施方式
为了使本领域普通人员更好地理解本公开的技术方案,下面将结合附图, 对本公开实施例中的技术方案进行清楚、完整地描述。
需要说明的是,本公开的说明书和权利要求书及上述附图中的术语“第一”、 “第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。 应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本公开的实 施例能够以除了在这里图示或描述的那些以外的顺序实施。以下示例性实施例中所描述的实施方式并不代表与本公开相一致的所有实施方式。相反,它们 仅是与如所附权利要求书中所详述的、本公开的一些方面相一致的装置和方法 的例子。
本公开实施例提供的推荐模型的训练方法可以由终端设备执行,也可以由 为该终端设备提供服务的服务器执行。
该终端设备可以是移动终端、固定终端或便携式终端,例如移动手机、站 点、单元、设备、多媒体计算机、多媒体平板、互联网节点、通信器、台式计 算机、膝上型计算机、笔记本计算机、上网本计算机、平板计算机、个人通信 ***设备、个人导航设备、个人数字助理、音频/视频播放器、数码相机/摄像 机、定位设备、电视接收器、无线电广播接收器、电子书设备、游戏设备或者 其任意组合,包括这些设备的配件和外设或者其任意组合。还可预见到的是,终端设备能够支持任意类型的针对用户的接口(例如可穿戴设备)等。
该服务器可以是独立的物理服务器,也可以是多个物理服务器构成的服务 器集群或者分布式***,还可以是提供云服务、云数据库、云计算、云函数、 云存储、网络服务、云通信、中间件服务、域名服务、安全服务以及大数据和 人工智能平台等基础云计算服务的云服务器。
互联网多媒体的快速发展产生了大量的信息,一方面满足了用户对信息的 需求,但另一方面,用户难以从大量信息中获取到有用的内容,即存在信息过 载问题,降低了用户对信息的使用效率,推荐***是解决信息过载问题的一个 很有用的方法。目前推荐***已经广泛应用于商品、短视频、音乐、新闻等领 域的推荐应用中。
目前,在这些推荐应用中的推荐***均是由相应推荐应用中产生的数据对 神经网络进行训练得到的,如图1所示,以一个训练样本为例,通常推荐*** 的训练方法可以包括:
步骤S110、获取1个训练样本和该训练样本的样本标签。
该训练样本可以包括两种对象类型对应的样本信息。
两种对象类型包括账户类型和多媒体类型,两种对象类型对应的样本信息 包括用户账户信息和多媒体资源信息。样本标签用于表征用户账户信息对应的 账户对多媒体资源信息对应的多媒体资源间的操作行为。
其中,用户账户信息可以包括账户标识(User Identification,UID)和账户 特征;账户标识UID可以是用户标识。账户特征可以包括姓名、性别、年龄、 身高、体重、消费力等。
多媒体资源信息可以包括多媒体标识(Product Identification,PID)和多 媒体特征。多媒体特征可以包括多媒体资源的标题、类目、价格、尺寸、颜色 等。
步骤S120、获取训练样本中各信息对应的特征向量。
该训练样本中的多媒体特征和账户特征可以包括稠密dense特征和稀疏 sparse特征。其中,dense特征是指不能用数字标识距离关系的特征,如职业、 学历等。sparse特征是指能用数字标识距离关系的特征,如身高、体重等。
将多媒体标识PID、账户标识UID以及sparse特征分别转为相应的特征向 量,如词向量,以及,将dense特征转为相应的dense特征的特征向量,如词 向量。
需要说明的是,多媒体标识PID对应的词向量、账户标识UID对应的词 向量以及sparse特征对应的词向量均是预先配置的,本公开实施例在此不做赘 述。
步骤S130、采用预设链接concat方式,将得到的各特征向量与相应的dense 特征的特征向量进行合并,得到该训练样本对应的输入向量。
其中,预设链接concat方式是对向量进行融合处理。例如,假设第一向量 为:[1,2,3],第二向量为:[4,5,6],第三向量为:[7,8,9],那么,对 这3个向量进行融合处理,可得到向量:{[1,2,3],[4,5,6],[7,8,9]}。
步骤S140、基于该输入向量和相应样本标签,对神经网络进行训练,得到 推荐模型。
由于推荐***中常常存在长尾问题:用户账户对应的历史操作行为较少的 长尾用户账户问题,或多媒体资源对应的历史***作行为较少的长尾多媒体资 源问题,将影响训练出的推荐模型的推荐准确率。
其中,长尾用户账户问题是指用户账户的有效样本量(或称“用户账户的 历史操作行为的样本量”)较少的问题;长尾多媒体资源问题是指多媒体资源 的有效样本量(或称“多媒体资源的历史***作的样本量”)较少的问题。有效样本量是指作为训练样本的数量。对此本公开提供了一种推荐模型的训练方 法,通过增加相应账户标识或多媒体标识对应的有效样本量,来提高训练出的 推荐模型的预测准确率。
以下结合说明书附图对本公开的优选实施例进行说明,应当理解,此处所 描述的优选实施例仅用于说明和解释本公开,并不用于限定本公开,并且在不 冲突的情况下,本公开中的实施例及实施例中的特征可以相互组合。
图2是根据一示例性实施例示出的一种推荐模型的训练方法的流程示意图, 如图1所示,该方法可以包括以下步骤:
步骤S210、获取训练样本集。
用户账户通过智能终端使用业务应用,如多媒体应用的过程中会产生业务 数据,可以将近期产生的业务数据确定为训练样本,也可以从历史业务数据中 选出部分业务数据作为训练样本,以获取到训练样本集X。
训练样本集包括训练样本和训练样本对应的样本标签;训练样本包括两种 对象类型对应的样本信息,两种对象类型包括账户类型和多媒体类型,两种对 象类型对应的样本信息包括用户账户信息和多媒体资源信息;样本标签表征用 户账户信息对应的账户对多媒体资源信息对应的多媒体资源间的操作行为。
其中,用户账户信息可以包括账户标识UID和账户特征;多媒体资源信息 可以包括多媒体标识PID和多媒体特征。例如,训练样本为“一名学生账户关 注了一个美食视频”,该训练样本包括该账户的账户标识UID、账户特征为学 生、美食视频的视频标识PID、多媒体特征为美食领域,其中,“关注”行为为该训练样本的样本标签。
为了提高推荐的准确性,该训练样本还可以包括多媒体标识和账户标识对 应的上下文信息。
例如,训练样本为“一名学生账户在每天12点都关注一个美食视频”,该 训练样本包括该账户的账户标识UID、账户特征为学生、美食视频的视频标识 PID、多媒体特征为美食领域,上下文信息为每天12点。
步骤S220、确定训练样本集中的待处理训练样本集。
在一些实施例中,确定训练样本集中的待处理训练样本集可以包括以下方 式:
方式一,可以直接将训练样本集中预设样本数量的训练样本组成的集合, 确定为待处理训练样本集。其中,预设样本数量可以为训练样本集中训练样本 的总数量或部分数量。例如,训练样本集中训练样本的总数量为N个,则预设 样本数量为M,其中,M大于0,且不大于N。该预设样本数量可以根据实际 业务需求进行确定,本公开在此不做限定。
方式二,由于训练样本中的两种对象类型,且一种对象类型为用户账户, 另一种对象类型为多媒体资源,故可以先确定训练样本集中用户账户或多媒体 资源是否存在长尾问题,若不存在长尾问题,则可以直接利用该训练样本集训 练推荐***,如图1所示;
若存在长尾问题,则需要确定训练样本集中的待处理训练样本集。
(1)在第一对象类型为账户类型,第一对象类型对应的样本信息为用户 账户信息时,可以获取存储的历史累计样本中各账户标识的数量;第一对象类 型是训练样本中的一种对象类型,即用户账户或多媒体资源。
若目标账户标识的数量小于预设数量阈值,则将训练样本集中目标账户标 识对应的训练样本确定为待处理训练样本,并基于确定的待处理训练样本,构 建待处理训练样本集。其中,该目标账户标识为训练样本集中的一个账户标识。
例如,以存储的历史累计样本中包括账户标识UID1、UID2、UID3和UID4 对应的样本,预设数量阈值为10为例。在历史累计样本中查找到账户标识UID1、 UID2、UID3和UID4出现的次数依次为5次、14次、2次和9次,由于预设 数量阈值为10,故此时得到账户标识UID1、UID3和UID4对应的有效样本量 较少,即账户标识UID1、UID3和UID4对应的用户账户存在长尾问题,且训 练样本集中存在账户标识UID1和UID4,故将账户标识UID1和UID4对应的训练样本确定为待处理训练样本,由账户标识UID1对应的待处理训练样本和 UID4对应的待处理训练样本组成待处理训练样本集。
该实施方式通过查询历史累计样本中各账户标识的数量可准确的确定出 目标账户标识对应的用户账户是否存在有效样本量少的问题,若存在,则将训 练样本集中目标账户标识对应的训练样本作为待处理训练样本,以实现后期针 对该待处理训练样本进行样本扩展。
(2)在第一对象类型为多媒体类型,第一对象类型对应的样本信息为多 媒体资源信息时,可以获取存储的历史累计样本中各多媒体标识的数量。
若目标多媒体标识的数量小于预设数量阈值,则将训练样本集中目标多媒 体标识对应的训练样本确定为待处理训练样本,并基于确定的待处理训练样本, 构建待处理训练样本集。其中,该目标多媒体标识为训练样本集中的一个多媒 体标识。
例如,以存储的历史累计样本中包括多媒体标识PID1、PID2和PID3对 应的样本,预设数量阈值为10为例。在历史累计样本中查找到多媒体标识PID1、 PID2和PID3出现的次数依次为20次、3次和13次。由于预设数量阈值为10,故此时得到多媒体标识PID2对应的样本有效样本量较少,即多媒体标识PID2 对应的多媒体资源存在长尾问题,且训练样本集中存在多媒体标识PID2,故 将多媒体标识PID2对应的训练样本确定为待处理训练样本,由多媒体标识 PID2对应的待处理训练样本组成待处理训练样本,即该待处理训练样本中仅 包括一个待处理训练样本。
该实施方式通过查询历史累计样本中各多媒体标识的数量可准确的确定 出目标多媒体标识对应的多媒体资源存在有效样本量少的问题,且将训练样本 集中目标多媒体标识对应的训练样本作为待处理训练样本,以实现后期对该待 处理训练样本进行样本扩展。
步骤S230、遍历待处理训练样本集,获取待处理训练样本集中各训练样本 对应的新训练样本。
具体实施中,在遍历待处理训练样本集过程中,针对遍历到的当前训练样 本,需要执行如下步骤:
步骤一,根据当前训练样本中第一对象类型对应的样本信息,在第一训练 样本中确定当前训练样本的相似样本。第一训练样本为训练样本集中除当前训 练样本外的其他训练样本,也就是说,第一训练样本可以是待处理训练样本集 中除当前训练样本外的其他待处理训练样本,也可以是除待处理训练样本集外 的其他待处理训练样本。
具体的,可通过余弦相似度算法、欧式距离算法等现有算法,获取当前训 练样本的第一对象类型对应的样本信息与第一训练样本的第一对象类型对应 的样本信息的相似度;并将满足预设筛选条件的相似度对应的第一训练样本确 定为当前训练样本的相似样本。当前训练样本的相似样本的数量可以为多个。
其中,预设筛选条件可以是大于预设相似度阈值的条件、最大相似度的选 取条件、按照相似度从大到小顺序选取前预设数量的选取条件等能够实现对相 似度筛选的条件,本公开在此不做限定。
例如,若预设筛选条件为大于预设相似度阈值的条件,则此时当前训练样 本的相似样本的数量可以为至少一个。
若预设筛选条件为最大相似度的选取条件,则此时当前训练样本的相似样 本的数量仅为一个。
若预设筛选条件为按照相似度从大到小顺序选取前预设数量的选取条件, 则此时当前训练样本的相似样本的数量为预设数量个。
步骤二,将相似样本中的第二对象类型对应的样本信息,对当前训练样本 中的第二对象类型对应的样本信息进行替换,将替换后的当前训练样本作为新 训练样本,并将相应相似样本的样本标签确定为新训练样本的样本标签。其中, 第二对象类型是训练样本中除第一对象类型外的类型,也就是说,第一对象类 型为账户类型时,第二对象类型为多媒体类型;第一对象类型为多媒体类型时, 第二对象类型为账户类型。
在一些实施例中,针对每个相似样本,可以将该相似样本中的第二对象类 型对应的样本信息,替换当前训练样本中的第二对象类型对应的样本信息,并 将替换后的当前训练样本作为新训练样本,以及将相应相似样本的样本标签确 定为该新训练样本的样本标签。这样就可以得到每个相似样本对应的新训练样 本和相应新训练样本的样本标签。
在一些实施例中,在当前训练样本存在大量满足预设筛选条件的相似度对 应的相似样本时,按照上述实施方式会得到大量的新训练样本,由于新训练样 本并不是真实存在的,而是基于当前训练样本的真实相似样本虚构的,故大量 的新训练样本可能会导致后期训练的推荐模型的推荐准确率,因此需要控制新 训练样本的获取数量。
具体实施中,根据当前训练样本对应的相似样本的数量和样本选取权重, 确定样本选取数量。样本选取权重可以是对满足预设筛选条件的相似度进行归 一化处理后得到的,即将该相似度归一化到[0,1]之间。
其中,该满足预设筛选条件的相似度为满足预设筛选条件的至少一个相似 度中的一个,具体可以根据实际业务需求,从满足预设筛选条件的至少一个相 似度中选取最小相似度,或该至少一个相似度的平均相似度。该归一化处理方 式可以是现有的任一归一化算法,本公开在此不做限定。
可以理解的是,样本选取权重也可以是根据不同业务需求设定的随机权重, 还可以是预先设置的固定权重,本公开在此不做限定。
之后,从当前训练样本的相似样本中,选取样本选取数量的相似样本作为 待处理的相似样本;并根据待处理的相似样本中第二对象类型对应的样本信息, 对当前训练样本中第二对象类型对应的样本信息进行替换,将替换后的当前训 练样本作为新训练样本,以及将相应相似样本的样本标签确定为该新训练样本 的样本标签。
上述实施例为了扩展出与当前训练样本中第一对象类型对应的有效数量 的有效样本,通过先获取当前训练样本的相似样本,再按照当前训练样本中的 第一对象类型查找样本选取数量的相似样本,以避免相似样本过多影响推荐模 型的准确率,再基于样本选取数量的相似样本中的第二对象类型对应的样本信 息对当前训练样本中第二对象类型对应的样本信息进行替换,可快速得到较真实的新训练样本,提高了新训练样本的获取效率。
进一步的,由于待处理训练样本集可以由小于预设数量阈值的账户标识对 应的待处理训练样本组成,也可以由小于预设数量阈值的多媒体标识对应的待 处理训练样本组成,故遍历待处理训练样本集包括遍历小于预设数量阈值的账 户标识对应的待处理训练样本集,以及遍历小于预设数量阈值的多媒体标识对 应的待处理训练样本集。
(1)在遍历小于预设数量阈值的账户标识对应的待处理训练样本集过程 中,第一对象类型对应的样本信息为用户账户信息,针对遍历到的当前训练样 本,需要执行如下步骤:
首先,获取当前训练样本的用户账户信息与第一训练样本的用户账户信息 的相似度。其中,用户账户信息包括账户标识和账户特征,故可以获取账户标 识和账户特征的组合信息对应的相似度,也可以获取账户标识或账户特征对应 的相似度。
具体实施中,对于获取账户标识和账户特征的组合信息对应的相似度的情 况:
获取当前训练样本的账户标识和账户特征与第一训练样本中各训练样本 的账户标识和账户特征的相似度;具体的,获取账户标识的特征向量和账户特 征的特征向量对应的第一特征融合向量,以及第一训练样本中各训练样本的账 户标识的特征向量和账户特征的特征向量对应的第二特征融合向量;其中,可 按照concat方式进行向量的融合。
采用相似度算法,计算第一特征融合向量与第二特征融合向量间的相似度, 从而获取到账户标识和账户特征的组合信息对应的相似度。
对于获取账户标识或账户特征对应的相似度对应的相似度的情况:
获取当前训练样本的账户标识或账户特征与第一训练样本中各训练样本 的账户标识或账户特征的相似度。具体的,获取当前训练样本中账户标识的特 征向量,以及第一训练样本中各训练样本的账户标识的特征向量;采用相似度 算法,分别计算当前训练样本的账户标识的特征向量与第一训练样本中各训练 样本的账户标识的特征向量的相似度;
或者,获取当前训练样本中账户特征的特征向量,以及第一训练样本的账 户特征的特征向量;采用相似度算法,计算当前训练样本的账户特征的特征向 量与第一训练样本的账户特征的特征向量的相似度。
可见,该实施方式通过用户账户信息中的账户标识和账户特征来获取与当 前训练样本中用户账户信息对应的相似样本,以得到在相同账户标识和/或账户 特征的情况下,与当前训练样本存在较强关联程度的相似样本。
其次,将满足预设筛选条件的相似度对应的第一训练样本确定为当前训练 样本的相似样本。
然后,根据当前训练样本对应的相似样本的数量和样本选取权重,确定样 本选取数量,并从当前训练样本的相似样本中,选取该样本选取数量的相似样 本作为待处理的相似样本。
最后,由于第一对象类型对应的样本信息为用户账户信息,故第二对象类 型对应的样本信息为多媒体资源信息。此时将待处理的相似样本中的多媒体资 源信息,替换当前训练样本中的多媒体资源信息,并将替换后的当前训练样本 作为新训练样本,以及将相应相似样本的样本标签确定为该新训练样本的样本 标签。
(2)在遍历小于预设数量阈值的多媒体标识对应的待处理训练样本集过 程中,第一对象类型对应的样本信息为多媒体资源信息,针对遍历到的当前训 练样本,需要执行如下步骤:
首先,获取当前训练样本的多媒体标识和多媒体特征与第一训练样本中各 训练样本的多媒体标识和多媒体特征的相似度;
具体的,获取当前训练样本的多媒体资源信息与第一训练样本的多媒体资 源信息的相似度。其中,多媒体资源信息包括多媒体标识和多媒体特征,故可 以获取多媒体标识和多媒体特征的组合信息对应的相似度,也可以获取多媒体 标识或多媒体特征对应的相似度。
具体实施中,对于获取多媒体标识和多媒体特征的组合信息对应的相似度 的情况:
获取当前训练样本的多媒体标识和多媒体特征与第一训练样本中各训练 样本的多媒体标识和多媒体特征的相似度;具体的,获取多媒体标识的特征向 量和多媒体特征的特征向量对应的第三特征融合向量,以及第一训练样本中各 训练样本的多媒体标识的特征向量和多媒体特征的特征向量对应的第四特征 融合向量;其中,可按照concat方式进行向量的融合。
采用相似度算法,计算第三特征融合向量与第四特征融合向量间的相似度, 从而获取到多媒体标识和多媒体特征的组合信息对应的相似度。
该实施方式通过多媒体资源信息中的多媒体标识和/或多媒体特征来获取 与当前训练样本中多媒体标识和/或多媒体特征对应的相似样本,以得到在相同 多媒体标识和/或多媒体特征的情况下,与当前训练样本存在较强关联程度的相 似样本。
对于获取多媒体标识或多媒体特征对应的相似度对应的相似度的情况:
获取当前训练样本的多媒体标识或多媒体特征与第一训练样本的多媒体 标识或多媒体特征的相似度。具体的,获取当前训练样本中多媒体标识的特征 向量,以及第一训练样本中各训练样本的多媒体标识的特征向量;采用相似度 算法,计算当前训练样本的多媒体标识的特征向量与第一训练样本中各训练样 本的多媒体标识的特征向量的相似度;
或者,获取当前训练样本中多媒体特征的特征向量,以及第一训练样本的 多媒体特征的特征向量;采用相似度算法,计算当前训练样本的多媒体特征的 特征向量与第一训练样本中各训练样本的多媒体特征的特征向量的相似度。
该实施方式通过多媒体资源信息中的多媒体标识和多媒体特征来获取与 当前训练样本中多媒体资源信息对应的相似样本,以得到在相同多媒体标识和 /或多媒体特征的情况下,与当前训练样本存在较强关联程度的相似样本。
其次,将满足预设筛选条件的相似度对应的第一训练样本确定为当前训练 样本的相似样本。
然后,根据当前训练样本对应的相似样本的数量和样本选取权重,确定样 本选取数量,并从当前训练样本的相似样本中,选取该样本选取数量的相似样 本作为待处理的相似样本。
最后,由于第一对象类型对应的样本信息为多媒体资源信息,故第二对象 类型对应的样本信息为用户账户信息。此时将待处理的相似样本中的多媒体资 源信息,替换当前训练样本中的多媒体资源信息,并将替换后的当前训练样本 作为新训练样本,以及将相应相似样本的样本标签确定为该新训练样本的样本 标签。
在一些可能的实施例中,为了进一步扩展出新训练样本,在将待处理的相 似样本中的第二对象类型对应的样本信息,对当前训练样本中的第二对象类型 对应的样本信息进行替换还可以包括以下两种方式:
方式一,获取待处理的相似样本中第二对象类型对应的样本信息的特征向 量,以及当前训练样本中第二对象类型对应的样本信息的特征向量;
根据待处理的相似样本中第二对象类型对应的样本信息的特征向量与预 设权重系数,得到待处理的相似样本中第二对象类型对应的新的样本信息的特 征向量;
基于第二对象类型对应的新的样本信息的特征向量,对当前训练样本中第 二对象类型对应的样本信息的特征向量进行替换,将替换后的所述当前训练样 本作为新训练样本。
该实施方式在当前训练样本第一对象类型对应的样本信息不变的情况下, 通过对相似样本中第二对象类型对应的样本信息的特征向量与预设权重系数 相乘,获取到训练样本集中不存在的第二对象类型对应的样本信息,从而通过 将新的样本信息的特征向量,替换当前训练样本中第二对象类型对应的样本信 息的特征向量,得到当前训练样本对应的新训练样本,确保了该新训练样本是与训练样本集中的各训练样本不同的训练样本。
方式二,当待处理的相似样本的样本选取数量为至少一个时,将每个待处 理的相似样本的第二对象类型对应的样本信息的特征向量与预设权重系数相 乘,得到每个待处理的相似样本中第二对象类型对应的新的样本信息的特征向 量;或者,当待处理的相似样本的样本选取数量为至少两个时,将至少两个待 处理的相似样本中每个待处理的相似样本的第二对象类型对应的样本信息的 特征向量与预设权重系数进行加权求和,得到至少两个待处理的相似样本中第 二对象类型对应的一个新的样本信息的特征向量。
该实施方式在当前训练样本第一对象类型对应的样本信息不变的情况下, 通过对各相似样本中第二对象类型对应的样本信息的特征向量与预设权重系 数的加权求和,获取到训练样本集中不存在的第二对象类型对应的样本信息, 从而通过将新的样本信息的特征向量,替换当前训练样本中第二对象类型对应 的样本信息的特征向量,得到当前训练样本对应的新训练样本,确保了该新训练样本是与训练样本集中的各训练样本不同的训练样本。
综合上述实施例可知本公开实施例可以针对小于预设数量阈值的账户标 识对应的待处理训练样本集,以及小于预设数量阈值的多媒体标识对应的待处 理训练样本集进行训练样本进行多训练样本的扩展,且仅通过相似样本中用户 账户信息或多媒体资源信息与当前训练样本中用户账户信息或多媒体资源信息进行替换,即可得到新的训练样本,提高了新训练样本的获取速度。
步骤S240、基于训练样本集中的训练样本和相应样本标签,以及新训练样 本和相应样本标签,对神经网络模型进行迭代训练,得到推荐模型。
在得到各相似样本对应的新训练样本之后,将新训练样本和相应样本标签 添加入步骤S210获取的训练样本集中,得到当前训练样本集,由此扩充了训 练样本的数量,提高了模型训练的准确率。
针对当前训练样本集中的各训练样本和相应的样本标签,对神经网络模型 进行训练,得到推荐模型,具体可参考图1所示的推荐***的训练方法,本公 开实施例在此不再赘述。
为了进一步提高推荐***的推荐准确率,在当前训练样本集对神经网络模 型进行训练得到推荐模型后,可以再次获取新的训练样本集,即返回执行步骤 210进行新一轮的训练样本扩展和推荐模型的训练。其中,在不同轮次的训练 样本扩展方案中每次对训练样本进行扩展时涉及的样本选取权重需要根据业 务需求进行重新设置,且执行的次数可按照模型训练速度或最终训练出的推荐 模型的推荐准确率来调整。
本公开实施例提供的推荐模型的训练方法在获取训练样本集后,训练样本 集包括训练样本和训练样本对应的样本标签;训练样本包括两种对象类型对应 的样本信息,两种对象类型包括账户类型和多媒体类型,两种对象类型对应的 样本信息包括用户账户信息和多媒体资源信息;样本标签表征用户账户信息对 应的账户对多媒体资源信息对应的多媒体资源间的操作行为,确定训练样本集中的待处理训练样本集;遍历待处理训练样本集,针对遍历到的当前训练样本, 执行如下步骤:根据当前训练样本中第一对象类型对应的样本信息,在第一训 练样本中确定当前训练样本的相似样本;第一对象类型是训练样本中的一种对 象类型;第一训练样本为训练样本集中除当前训练样本外的其他训练样本;将相似样本中的第二对象类型对应的样本信息,对当前训练样本中的第二对象类 型对应的样本信息进行替换,将替换后的当前训练样本作为新训练样本,并将相应相似样本的样本标签确定为新训练样本的样本标签;第二对象类型是训练 样本中除第一对象类型外的类型;最后,基于训练样本集中的训练样本和相应 样本标签,以及待处理训练样本集中每个训练样本对应的新训练样本和相应样 本标签,对神经网络模型进行迭代训练,得到推荐模型。
可见,该方法通过在样本信息层面进行对相应用户账户或多媒体资源对应 的样本进行扩展,得到扩展出的针对相应用户账户或多媒体资源的新样本,使 推荐模型在训练样本集中存在某些用户账户或某些多媒体资源对应的有限样 本时,导致训练出的推荐模型不准确的问题,增强训练出的推荐模型的鲁棒性, 提高了推荐模型的推荐准确率。
且,本公开实施例是在在样本信息层面进行对相应用户账户或多媒体资源 对应的样本进行扩展,不需要修改待训练的推荐模型的模型结构以及相应损失 函数,故本公开实施例提供的推荐模型的训练方法可以适用任何领域中推荐系 统的训练过程。
图3是根据一示例性实施例示出的一种数据处理装置的结构框图。参照图 3,该装置可以包括获取单元310、确定单元320和训练单元330。
该获取单元310,被配置为执行获取训练样本集,所述训练样本集包括训 练样本和所述训练样本对应的样本标签;所述训练样本包括两种对象类型对应 的样本信息,所述两种对象类型包括账户类型和多媒体类型,所述两种对象类 型对应的样本信息包括用户账户信息和多媒体资源信息;所述样本标签表征所述用户账户信息对应的账户对所述多媒体资源信息对应的多媒体资源间的操 作行为;
确定单元320,被配置为执行确定所述训练样本集中的待处理训练样本集; 遍历所述待处理训练样本集,针对遍历到的当前训练样本,执行如下步骤:
根据所述当前训练样本中第一对象类型对应的样本信息,在第一训练 样本中确定所述当前训练样本的相似样本;其中,所述第一对象类型是所 述训练样本中的一种对象类型;所述第一训练样本为所述训练样本集中除 所述当前训练样本外的其他训练样本;
将所述相似样本中的第二对象类型对应的样本信息,对所述当前训练 样本中的第二对象类型对应的样本信息进行替换,将替换后的所述当前训 练样本作为新训练样本,并将相应相似样本的样本标签确定为所述新训练 样本的样本标签;所述第二对象类型是所述训练样本中除所述第一对象类 型外的类型;
训练单元330,被配置为执行基于所述训练样本集中的训练样本和相应样 本标签,以及所述待处理训练样本集中每个训练样本对应的新训练样本和相应 样本标签,对神经网络模型进行迭代训练,得到推荐模型。
一种可能的实施方式中,所述用户账户信息包括账户标识;
在所述第一对象类型对应的样本信息为所述用户账户信息时,确定单元 320,具体被配置为执行:
获取历史累计样本中各账户标识的数量;
若目标账户标识的数量小于预设数量阈值,则将所述训练样本集中所述目 标账户标识对应的训练样本确定为待处理训练样本,基于确定的待处理训练样 本构建待处理训练样本集;所述目标账户标识为所述训练样本集中的一个账户 标识。
一种可能的实施方式中,所述多媒体资源信息包括多媒体标识;
在所述第一对象类型对应的样本信息为所述多媒体资源信息时,确定单元 320,具体被配置为执行:
获取存储的历史累计样本中各多媒体标识的数量;
若目标多媒体标识的数量小于预设数量阈值,则将所述训练样本集中所述 目标多媒体标识对应的训练样本确定为待处理训练样本,基于确定的待处理训 练样本构建待处理训练样本集;所述目标多媒体标识为所述训练样本集中的一 个多媒体标识。
一种可能的实施方式中,确定单元320,还具体被配置为执行:
获取所述当前训练样本的第一对象类型对应的样本信息分别与所述第一 训练样本中各训练样本的第一对象类型对应的样本信息的相似度;
以及,将满足预设筛选条件的相似度对应的第一训练样本确定为所述当前 训练样本的相似样本。
一种可能的实施方式中,所述用户账户信息还包括账户特征;
确定单元320,还具体被配置为执行获取所述当前训练样本的所述账户标 识和所述账户特征分别与所述第一训练样本中各训练样本的所述账户标识和 所述账户特征的相似度;或者,获取所述当前训练样本的所述账户标识或所述 账户特征分别与所述第一训练样本中各训练样本的所述账户标识或所述账户特征的相似度。
一种可能的实施方式中,所述多媒体资源信息包括多媒体特征;
确定单元320,还具体被配置为执行获取所述当前训练样本的所述多媒体 标识和所述多媒体特征分别与所述第一训练样本中各训练样本的所述多媒体 标识和所述多媒体特征的相似度;或者,获取所述当前训练样本的所述多媒体 标识或所述多媒体特征分别与所述第一训练样本中各训练样本的所述多媒体标识或所述多媒体特征的相似度。
一种可能的实施方式中,确定单元320,还具体被配置为执行:
根据所述当前训练样本对应的相似样本的数量和样本选取权重,确定样本 选取数量;
以及,从所述当前训练样本的相似样本中,选取所述样本选取数量的相似 样本作为待处理的相似样本;
根据所述待处理的相似样本中所述第二对象类型对应的样本信息,对所述 当前训练样本中所述第二对象类型对应的样本信息进行替换,将替换后的所述 当前训练样本作为新训练样本。
一种可能的实施方式中,所述样本选取权重是对所述满足预设筛选条件的 相似度进行归一化处理后得到的。
一种可能的实施方式中,在所述第一对象类型对应的样本信息为所述用户 账户信息时,所述第二对象类型对应的样本信息为所述多媒体资源信息;
确定单元320,还具体被配置为执行将所述待处理的相似样本中的所述多 媒体资源信息,替换所述当前训练样本中的所述多媒体资源信息,并将替换后 的所述当前训练样本作为新训练样本。
一种可能的实施方式中,在所述第一对象类型对应的样本信息为所述多媒 体资源信息时,所述第二对象类型对应的样本信息为所述用户账户信息。
确定单元320,还具体被配置为执行将所述待处理的相似样本中的所述用 户账户信息,替换所述当前训练样本中的所述用户账户信息,并将替换后的所 述当前训练样本作为新训练样本。
一种可能的实施方式中,确定单元320,还具体被配置为执行:
获取所述待处理的相似样本中所述第二对象类型对应的样本信息的特征 向量,以及所述当前训练样本中所述第二对象类型对应的样本信息的特征向量;
以及,根据所述待处理的相似样本中所述第二对象类型对应的样本信息的 特征向量与预设权重系数,得到所述待处理的相似样本中所述第二对象类型对 应的新的样本信息的特征向量;
基于所述第二对象类型对应的新的样本信息的特征向量,对所述当前训练 样本中所述第二对象类型对应的样本信息的特征向量进行替换,将替换后的所 述当前训练样本作为新训练样本。
一种可能的实施方式中,确定单元320,还具体被配置为执行:
当所述待处理的相似样本的样本选取数量为至少一个时,将每个待处理的 相似样本的所述第二对象类型对应的样本信息的特征向量与预设权重系数相 乘,得到所述每个待处理的相似样本中所述第二对象类型对应的新的样本信息 的特征向量;或者,当所述待处理的相似样本的样本选取数量为至少两个时, 将所述至少两个待处理的相似样本中每个待处理的相似样本的所述第二对象类型对应的样本信息的特征向量与预设权重系数进行加权求和,得到所述至少 两个待处理的相似样本中所述第二对象类型对应的一个新的样本信息的特征 向量。
本公开上述实施例提供的数据处理装置的各功能单元的功能,可以通过上 述各方法步骤来实现,因此,本公开实施例提供的数据处理装置中的各个单元 的具体工作过程和有益效果,在此不复赘述。
下面参照图4来描述根据本公开的这种实施方式的电子设备130。如图4 所示,电子设备130以通用计算装置的形式表现。电子设备130的组件可以包 括但不限于:上述至少一个处理器131、上述至少一个存储器132、连接不同 ***组件(包括存储器132和处理器131)的总线133。
总线133表示几类总线结构中的一种或多种,包括存储器总线或者存储器 控制器、***总线、处理器或者使用多种总线结构中的任意总线结构的局域总 线。
存储器132可以包括易失性存储器形式的可读介质,例如随机存取存储器 (RAM)1321和/或高速缓存存储器1322,还可以进一步包括只读存储器(ROM) 1323。
存储器132还可以包括具有一组(至少一个)程序模块1324的程序/实用 工具1325,这样的程序模块1324包括但不限于:操作***、一个或者多个应 用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能 包括网络环境的实现。
电子设备130也可以与一个或多个外部设备134(例如键盘、指向设备等) 通信,和/或与使得该电子设备130能与一个或多个其它计算装置进行通信的任 何设备(例如路由器、调制解调器等等)通信。这种通信可以通过输入/输出(I/O) 接口135进行。并且,电子设备130还可以通过网络适配器136与一个或者多 个网络(例如局域网(LAN),广域网(WAN)和/或公共网络,例如因特网) 通信。如图所示,网络适配器136通过总线133与用于电子设备130的其它模 块通信。应当理解,尽管图中未示出,可以结合电子设备130使用其它硬件和 /或软件模块,包括但不限于:微代码、设备驱动器、冗余处理器、外部磁盘驱 动阵列、RAID***、磁带驱动器以及数据备份存储***等。
在一些可能的实施方式中,本公开提供的推荐模型的训练方法的各个方面 还可以实现为一种程序产品的形式,其包括计算机程序,当程序产品在计算机 设备上行驶时,计算机程序用于使计算机设备执行本说明书上述描述的根据本 公开各种示例性实施方式的推荐模型的训练方法的步骤,例如,电子设备可以 执行图2中的方法步骤。
程序产品可以采用一个或多个可读介质的任意组合。可读介质可以是可读 信号介质或者可读存储介质。可读存储介质例如可以是——但不限于——电、 磁、光、电磁、红外线、或半导体的***、装置或器件,或者任意以上的组合。 可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的 电连接、便携式盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、 可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑盘只读存储器 (CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。
本公开的实施方式的用于数据处理的程序产品可以采用便携式紧凑盘只 读存储器(CD-ROM)并包括计算机程序,并可以在计算装置上行驶。然而,本 公开的程序产品不限于此,在本文件中,可读存储介质可以是任何包含或存储 程序的有形介质,该程序可以被指令执行***、装置或者器件使用或者与其结 合使用。
可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其 中承载了可读计算机程序。这种传播的数据信号可以采用多种形式,包括—— 但不限于——电磁信号、光信号或上述的任意合适的组合。可读信号介质还可 以是可读存储介质以外的任何可读介质,该可读介质可以发送、传播或者传输 用于由指令执行***、装置或者器件使用或者与其结合使用的程序。
可读介质上包含的计算机程序可以用任何适当的介质传输,包括——但不 限于——无线、有线、光缆、RF等等,或者上述的任意合适的组合。
可以以一种或多种程序设计语言的任意组合来编写用于执行本公开操作 的计算机程序,程序设计语言包括面向对象的程序设计语言—诸如Java、C++ 等,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。 计算机程序可以完全地在目标对象计算装置上执行、部分地在目标对象设备上 执行、作为一个独立的软件包执行、部分在目标对象计算装置上部分在远程计 算装置上执行、或者完全在远程计算装置或服务器上执行。在涉及远程计算装 置的情形中,远程计算装置可以通过任意种类的网络——包括局域网(LAN) 或广域网(WAN)—连接到目标对象计算装置,或者,可以连接到外部计算装置(例如利用因特网服务提供商来通过因特网连接)。
应当注意,尽管在上文详细描述中提及了装置的若干单元或子单元,但是 这种划分仅仅是示例性的并非强制性的。实际上,根据本公开的实施方式,上 文描述的两个或更多单元的特征和功能可以在一个单元中具体化。反之,上文 描述的一个单元的特征和功能可以进一步划分为由多个单元来具体化。
此外,尽管在附图中以特定顺序描述了本公开方法的操作,但是,这并非 要求或者暗示必须按照该特定顺序来执行这些操作,或是必须执行全部所示的 操作才能实现期望的结果。附加地或备选地,可以省略某些步骤,将多个步骤 合并为一个步骤执行,和/或将一个步骤分解为多个步骤执行。
本领域内的技术人员应明白,本公开的实施例可提供为方法、***、或计 算机程序产品。因此,本公开可采用完全硬件实施例、完全软件实施例、或结 合软件和硬件方面的实施例的形式。而且,本公开可采用在一个或多个其中包 含有计算机可用计算机程序的计算机可用存储介质(包括但不限于磁盘存储器、 CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本公开是参照根据本公开实施例的方法、设备(***)、和计算机程序产 品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和 /或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/ 或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入 式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算 机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一 个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设 备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中 的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个 流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使 得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处 理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个 流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
尽管已描述了本公开的优选实施例,但本领域内的技术人员一旦得知了基 本创造性概念,则可对这些实施例做出另外的变更和修改。所以,所附权利要 求意欲解释为包括优选实施例以及落入本公开范围的所有变更和修改。
显然,本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想 到本公开的其它实施方案。本申请旨在涵盖本公开的任何变型、用途或者适应 性变化,这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公 开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视 为示例性的,本公开的真正范围和精神由下面的权利要求指出。
应当理解的是,本公开并不局限于上面已经描述并在附图中示出的精确结 构,并且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的 权利要求来限制。
Claims (27)
1.一种推荐模型的训练方法,其特征在于,所述方法包括:
获取训练样本集,所述训练样本集包括训练样本和所述训练样本对应的样本标签;所述训练样本包括两种对象类型对应的样本信息,所述两种对象类型包括账户类型和多媒体类型,所述两种对象类型对应的样本信息包括用户账户信息和多媒体资源信息;所述样本标签表征所述用户账户信息对应的账户对所述多媒体资源信息对应的多媒体资源间的操作行为;
从所述训练样本集中选择存在长尾问题的用户账户或多媒体资源对应的训练样本,构建待处理训练样本集;
遍历所述待处理训练样本集,针对遍历到的当前训练样本,执行如下步骤:
根据所述当前训练样本中第一对象类型对应的样本信息,在第一训练样本中确定所述当前训练样本的相似样本;其中,所述第一对象类型是所述训练样本中的一种对象类型;所述第一训练样本为所述训练样本集中除所述当前训练样本外的其他训练样本;
将所述相似样本中的第二对象类型对应的样本信息,对所述当前训练样本中的第二对象类型对应的样本信息进行替换,将替换后的所述当前训练样本作为新训练样本,并将相应相似样本的样本标签确定为所述新训练样本的样本标签;所述第二对象类型是所述训练样本中除所述第一对象类型外的类型;
基于所述训练样本集中的训练样本和相应样本标签,以及所述待处理训练样本集中每个训练样本对应的新训练样本和相应样本标签,对神经网络模型进行迭代训练,得到推荐模型。
2.如权利要求1所述的方法,其特征在于,所述用户账户信息包括账户标识;
在所述第一对象类型对应的样本信息为所述用户账户信息时,从所述训练样本集中选择存在长尾问题的用户账户或多媒体资源对应的训练样本,构建待处理训练样本集,包括:
获取历史累计样本中各账户标识的数量;
若目标账户标识的数量小于预设数量阈值,则将所述训练样本集中所述目标账户标识对应的训练样本确定为待处理训练样本,基于确定的待处理训练样本构建待处理训练样本集;所述目标账户标识为所述训练样本集中的一个账户标识。
3.如权利要求1所述的方法,其特征在于,所述多媒体资源信息包括多媒体标识;
在所述第一对象类型对应的样本信息为所述多媒体资源信息时,从所述训练样本集中选择存在长尾问题的用户账户或多媒体资源对应的训练样本,构建待处理训练样本集,包括:
获取存储的历史累计样本中各多媒体标识的数量;
若目标多媒体标识的数量小于预设数量阈值,则将所述训练样本集中所述目标多媒体标识对应的训练样本确定为待处理训练样本,基于确定的待处理训练样本构建待处理训练样本集;所述目标多媒体标识为所述训练样本集中的一个多媒体标识。
4.如权利要求2或3所述的方法,其特征在于,根据所述当前训练样本中第一对象类型对应的样本信息,在第一训练样本中确定所述当前训练样本的相似样本,包括:
获取所述当前训练样本的第一对象类型对应的样本信息分别与所述第一训练样本中各训练样本的第一对象类型对应的样本信息的相似度;
将满足预设筛选条件的相似度对应的第一训练样本确定为所述当前训练样本的相似样本。
5.如权利要求4所述的方法,其特征在于,所述用户账户信息还包括账户特征;
获取所述当前训练样本的第一对象类型对应的样本信息分别与所述第一训练样本中各训练样本的第一对象类型对应的样本信息的相似度,包括:
获取所述当前训练样本的账户标识和所述账户特征分别与所述第一训练样本中各训练样本的账户标识和所述账户特征的相似度;或者,
获取所述当前训练样本的账户标识或所述账户特征分别与所述第一训练样本中各训练样本的账户标识或所述账户特征的相似度。
6.如权利要求4所述的方法,其特征在于,所述多媒体资源信息包括多媒体特征;
获取所述当前训练样本的第一对象类型对应的样本信息分别与所述第一训练样本中各训练样本的第一对象类型对应的样本信息的相似度,包括:
获取所述当前训练样本的多媒体标识和所述多媒体特征分别与所述第一训练样本中各训练样本的多媒体标识和所述多媒体特征的相似度;或者,
获取所述当前训练样本的多媒体标识或所述多媒体特征分别与所述第一训练样本中各训练样本的多媒体标识或所述多媒体特征的相似度。
7.如权利要求4所述的方法,其特征在于,将所述相似样本中的第二对象类型对应的样本信息,对所述当前训练样本中的第二对象类型对应的样本信息进行替换,将替换后的所述当前训练样本作为新训练样本,包括:
根据所述当前训练样本对应的相似样本的数量和样本选取权重,确定样本选取数量;
从所述当前训练样本的相似样本中,选取所述样本选取数量的相似样本作为待处理的相似样本;
根据所述待处理的相似样本中所述第二对象类型对应的样本信息,对所述当前训练样本中所述第二对象类型对应的样本信息进行替换,将替换后的所述当前训练样本作为新训练样本。
8.如权利要求7所述的方法,其特征在于,所述样本选取权重是对所述满足预设筛选条件的相似度进行归一化处理后得到的。
9.如权利要求7所述的方法,其特征在于,在所述第一对象类型对应的样本信息为所述用户账户信息时,所述第二对象类型对应的样本信息为所述多媒体资源信息;
根据所述待处理的相似样本中所述第二对象类型对应的样本信息,对所述当前训练样本中所述第二对象类型对应的样本信息进行替换,将替换后的所述当前训练样本作为新训练样本,包括:
将所述待处理的相似样本中的所述多媒体资源信息,替换所述当前训练样本中的所述多媒体资源信息,并将替换后的所述当前训练样本作为新训练样本。
10.如权利要求7所述的方法,其特征在于,在所述第一对象类型对应的样本信息为所述多媒体资源信息时,所述第二对象类型对应的样本信息为所述用户账户信息;
根据所述待处理的相似样本中所述第二对象类型对应的样本信息,对所述当前训练样本中所述第二对象类型对应的样本信息进行替换,将替换后的所述当前训练样本作为新训练样本,包括:
将所述待处理的相似样本中的所述用户账户信息,替换所述当前训练样本中的所述用户账户信息,并将替换后的所述当前训练样本作为新训练样本。
11.如权利要求7所述的方法,其特征在于,根据所述待处理的相似样本中所述第二对象类型对应的样本信息,对所述当前训练样本中所述第二对象类型对应的样本信息进行替换,将替换后的所述当前训练样本作为新训练样本,包括:
获取所述待处理的相似样本中所述第二对象类型对应的样本信息的特征向量,以及所述当前训练样本中所述第二对象类型对应的样本信息的特征向量;
根据所述待处理的相似样本中所述第二对象类型对应的样本信息的特征向量与预设权重系数,得到所述待处理的相似样本中所述第二对象类型对应的新的样本信息的特征向量;
基于所述第二对象类型对应的新的样本信息的特征向量,对所述当前训练样本中所述第二对象类型对应的样本信息的特征向量进行替换,将替换后的所述当前训练样本作为新训练样本。
12.如权利要求11所述的方法,其特征在于,根据所述待处理的相似样本中所述第二对象类型对应的样本信息的特征向量与预设权重系数,得到所述待处理的相似样本中所述第二对象类型对应的新的样本信息的特征向量,包括:
当所述待处理的相似样本的样本选取数量为至少一个时,将每个待处理的相似样本的所述第二对象类型对应的样本信息的特征向量与预设权重系数相乘,得到所述每个待处理的相似样本中所述第二对象类型对应的新的样本信息的特征向量;或者,
当所述待处理的相似样本的样本选取数量为至少两个时,将所述至少两个待处理的相似样本中每个待处理的相似样本的所述第二对象类型对应的样本信息的特征向量与预设权重系数进行加权求和,得到所述至少两个待处理的相似样本中所述第二对象类型对应的一个新的样本信息的特征向量。
13.一种推荐模型的训练装置,其特征在于,所述装置包括:
获取单元,被配置为执行获取训练样本集,所述训练样本集包括训练样本和所述训练样本对应的样本标签;所述训练样本包括两种对象类型对应的样本信息,所述两种对象类型包括账户类型和多媒体类型,所述两种对象类型对应的样本信息包括用户账户信息和多媒体资源信息;所述样本标签表征所述用户账户信息对应的账户对所述多媒体资源信息对应的多媒体资源间的操作行为;
确定单元,被配置为执行从所述训练样本集中选择存在长尾问题的用户账户或多媒体资源对应的训练样本,构建待处理训练样本集;遍历所述待处理训练样本集,针对遍历到的当前训练样本,执行如下步骤:
根据所述当前训练样本中第一对象类型对应的样本信息,在第一训练样本中确定所述当前训练样本的相似样本;其中,所述第一对象类型是所述训练样本中的一种对象类型;所述第一训练样本为所述训练样本集中除所述当前训练样本外的其他训练样本;
将所述相似样本中的第二对象类型对应的样本信息,对所述当前训练样本中的第二对象类型对应的样本信息进行替换,将替换后的所述当前训练样本作为新训练样本,并将相应相似样本的样本标签确定为所述新训练样本的样本标签;所述第二对象类型是所述训练样本中除所述第一对象类型外的类型;
训练单元,被配置为执行基于所述训练样本集中的训练样本和相应样本标签,以及所述待处理训练样本集中每个训练样本对应的新训练样本和相应样本标签,对神经网络模型进行迭代训练,得到推荐模型。
14.如权利要求13所述的装置,其特征在于,所述用户账户信息包括账户标识;
在所述第一对象类型对应的样本信息为所述用户账户信息时,所述确定单元,具体被配置为执行:
获取历史累计样本中各账户标识的数量;
若目标账户标识的数量小于预设数量阈值,则将所述训练样本集中所述目标账户标识对应的训练样本确定为待处理训练样本,基于确定的待处理训练样本构建待处理训练样本集;所述目标账户标识为所述训练样本集中的一个账户标识。
15.如权利要求13所述的装置,其特征在于,所述多媒体资源信息包括多媒体标识;
在所述第一对象类型对应的样本信息为所述多媒体资源信息时,所述确定单元,具体被配置为执行:
获取存储的历史累计样本中各多媒体标识的数量;
若目标多媒体标识的数量小于预设数量阈值,则将所述训练样本集中所述目标多媒体标识对应的训练样本确定为待处理训练样本,基于确定的待处理训练样本构建待处理训练样本集;所述目标多媒体标识为所述训练样本集中的一个多媒体标识。
16.如权利要求14或15所述的装置,其特征在于,所述确定单元,还具体被配置为执行:
获取所述当前训练样本的第一对象类型对应的样本信息分别与所述第一训练样本中各训练样本的第一对象类型对应的样本信息的相似度;
以及,将满足预设筛选条件的相似度对应的第一训练样本确定为所述当前训练样本的相似样本。
17.如权利要求16所述的装置,其特征在于,所述用户账户信息还包括账户特征;
所述确定单元,还具体被配置为执行获取所述当前训练样本的账户标识和所述账户特征分别与所述第一训练样本中各训练样本的账户标识和所述账户特征的相似度;或者,获取所述当前训练样本的账户标识或所述账户特征分别与所述第一训练样本中各训练样本的账户标识或所述账户特征的相似度。
18.如权利要求16所述的装置,其特征在于,所述多媒体资源信息包括多媒体特征;
所述确定单元,还具体被配置为执行获取所述当前训练样本的多媒体标识和所述多媒体特征分别与所述第一训练样本中各训练样本的多媒体标识和所述多媒体特征的相似度;或者,获取所述当前训练样本的多媒体标识或所述多媒体特征分别与所述第一训练样本中各训练样本的多媒体标识或所述多媒体特征的相似度。
19.如权利要求16所述的装置,其特征在于,所述确定单元,还具体被配置为执行:
根据所述当前训练样本对应的相似样本的数量和样本选取权重,确定样本选取数量;
以及,从所述当前训练样本的相似样本中,选取所述样本选取数量的相似样本作为待处理的相似样本;
根据所述待处理的相似样本中所述第二对象类型对应的样本信息,对所述当前训练样本中所述第二对象类型对应的样本信息进行替换,将替换后的所述当前训练样本作为新训练样本。
20.如权利要求19所述的装置,其特征在于,所述样本选取权重是对所述满足预设筛选条件的相似度进行归一化处理后得到的。
21.如权利要求19所述的装置,其特征在于,在所述第一对象类型对应的样本信息为所述用户账户信息时,所述第二对象类型对应的样本信息为所述多媒体资源信息;
所述确定单元,还具体被配置为执行将所述待处理的相似样本中的所述多媒体资源信息,替换所述当前训练样本中的所述多媒体资源信息,并将替换后的所述当前训练样本作为新训练样本。
22.如权利要求19所述的装置,其特征在于,在所述第一对象类型对应的样本信息为所述多媒体资源信息时,所述第二对象类型对应的样本信息为所述用户账户信息;
所述确定单元,还具体被配置为执行将所述待处理的相似样本中的所述用户账户信息,替换所述当前训练样本中的所述用户账户信息,并将替换后的所述当前训练样本作为新训练样本。
23.如权利要求19所述的装置,其特征在于,所述确定单元,还具体被配置为执行:
获取所述待处理的相似样本中所述第二对象类型对应的样本信息的特征向量,以及所述当前训练样本中所述第二对象类型对应的样本信息的特征向量;
以及,根据所述待处理的相似样本中所述第二对象类型对应的样本信息的特征向量与预设权重系数,得到所述待处理的相似样本中所述第二对象类型对应的新的样本信息的特征向量;
基于所述第二对象类型对应的新的样本信息的特征向量,对所述当前训练样本中所述第二对象类型对应的样本信息的特征向量进行替换,将替换后的所述当前训练样本作为新训练样本。
24.如权利要求23所述的装置,其特征在于,所述确定单元,还具体被配置为执行:
当所述待处理的相似样本的样本选取数量为至少一个时,将每个待处理的相似样本的所述第二对象类型对应的样本信息的特征向量与预设权重系数相乘,得到所述每个待处理的相似样本中所述第二对象类型对应的新的样本信息的特征向量;或者,当所述待处理的相似样本的样本选取数量为至少两个时,将所述至少两个待处理的相似样本中每个待处理的相似样本的所述第二对象类型对应的样本信息的特征向量与预设权重系数进行加权求和,得到所述至少两个待处理的相似样本中所述第二对象类型对应的一个新的样本信息的特征向量。
25.一种电子设备,其特征在于,包括:
处理器;
用于存储所述处理器可执行指令的存储器;
其中,所述处理器被配置为执行所述指令,以实现如权利要求1至12中任一项所述的方法。
26.一种计算机可读存储介质,其特征在于,当所述计算机可读存储介质中的指令由电子设备的处理器执行时,使得电子设备能够执行如权利要求1至12中任一项所述的方法。
27.一种计算机程序产品,包括计算机程序/指令,其特征在于,所述计算机程序/指令被处理器执行时实现权利要求1至12任一项所述的推荐模型的训练方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111002586.1A CN113705683B (zh) | 2021-08-30 | 2021-08-30 | 推荐模型的训练方法、装置、电子设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111002586.1A CN113705683B (zh) | 2021-08-30 | 2021-08-30 | 推荐模型的训练方法、装置、电子设备及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113705683A CN113705683A (zh) | 2021-11-26 |
CN113705683B true CN113705683B (zh) | 2024-06-04 |
Family
ID=78656653
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111002586.1A Active CN113705683B (zh) | 2021-08-30 | 2021-08-30 | 推荐模型的训练方法、装置、电子设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113705683B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114363671B (zh) * | 2021-12-31 | 2024-03-19 | 北京达佳互联信息技术有限公司 | 多媒体资源推送方法、模型训练方法、装置、存储介质 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110162627A (zh) * | 2019-04-28 | 2019-08-23 | 平安科技(深圳)有限公司 | 数据增量方法、装置、计算机设备及存储介质 |
CN110321422A (zh) * | 2018-03-28 | 2019-10-11 | 腾讯科技(深圳)有限公司 | 在线训练模型的方法、推送方法、装置以及设备 |
CN110832533A (zh) * | 2017-07-21 | 2020-02-21 | 三星电子株式会社 | 用于生成用户偏好内容的对抗式方法和*** |
CN111428783A (zh) * | 2020-03-23 | 2020-07-17 | 支付宝(杭州)信息技术有限公司 | 对推荐模型的训练样本进行样本域转换的方法及装置 |
CN111949886A (zh) * | 2020-08-28 | 2020-11-17 | 腾讯科技(深圳)有限公司 | 一种用于信息推荐的样本数据生成方法和相关装置 |
CN112256966A (zh) * | 2020-10-23 | 2021-01-22 | 北京交通大学 | 基于半监督因子分解机的物品推荐方法 |
CN113204655A (zh) * | 2021-07-02 | 2021-08-03 | 北京搜狐新媒体信息技术有限公司 | 多媒体信息的推荐方法、相关装置及计算机存储介质 |
-
2021
- 2021-08-30 CN CN202111002586.1A patent/CN113705683B/zh active Active
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110832533A (zh) * | 2017-07-21 | 2020-02-21 | 三星电子株式会社 | 用于生成用户偏好内容的对抗式方法和*** |
CN110321422A (zh) * | 2018-03-28 | 2019-10-11 | 腾讯科技(深圳)有限公司 | 在线训练模型的方法、推送方法、装置以及设备 |
CN110162627A (zh) * | 2019-04-28 | 2019-08-23 | 平安科技(深圳)有限公司 | 数据增量方法、装置、计算机设备及存储介质 |
WO2020220539A1 (zh) * | 2019-04-28 | 2020-11-05 | 平安科技(深圳)有限公司 | 数据增量方法、装置、计算机设备及存储介质 |
CN111428783A (zh) * | 2020-03-23 | 2020-07-17 | 支付宝(杭州)信息技术有限公司 | 对推荐模型的训练样本进行样本域转换的方法及装置 |
CN111949886A (zh) * | 2020-08-28 | 2020-11-17 | 腾讯科技(深圳)有限公司 | 一种用于信息推荐的样本数据生成方法和相关装置 |
CN112256966A (zh) * | 2020-10-23 | 2021-01-22 | 北京交通大学 | 基于半监督因子分解机的物品推荐方法 |
CN113204655A (zh) * | 2021-07-02 | 2021-08-03 | 北京搜狐新媒体信息技术有限公司 | 多媒体信息的推荐方法、相关装置及计算机存储介质 |
Non-Patent Citations (1)
Title |
---|
"基于改进的倾向得分估计的无偏推荐模型";骆锦潍等;《计算机应用》;20210719;3508-3514页 * |
Also Published As
Publication number | Publication date |
---|---|
CN113705683A (zh) | 2021-11-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10747771B2 (en) | Method and apparatus for determining hot event | |
CN110909182B (zh) | 多媒体资源搜索方法、装置、计算机设备及存储介质 | |
CN108520470B (zh) | 用于生成用户属性信息的方法和装置 | |
CN112100489B (zh) | 对象推荐的方法、装置和计算机存储介质 | |
CN107977678B (zh) | 用于输出信息的方法和装置 | |
CN106407381B (zh) | 一种基于人工智能的推送信息的方法和装置 | |
CN113761219A (zh) | 基于知识图谱的检索方法、装置、电子设备及存储介质 | |
CN112100504A (zh) | 内容推荐方法、装置、电子设备及存储介质 | |
CN112000822A (zh) | 多媒体资源排序方法、装置、电子设备及存储介质 | |
CN112182281B (zh) | 一种音频推荐方法、装置及存储介质 | |
CN110059172B (zh) | 基于自然语言理解的推荐答案的方法和装置 | |
CN113705683B (zh) | 推荐模型的训练方法、装置、电子设备及存储介质 | |
CN112364185B (zh) | 多媒体资源的特征确定方法、装置、电子设备和存储介质 | |
CN112529646A (zh) | 一种商品分类方法和装置 | |
CN115391589A (zh) | 内容召回模型的训练方法、装置、电子设备及存储介质 | |
CN112801053B (zh) | 视频数据处理方法、装置 | |
CN117272056A (zh) | 对象特征构建方法、装置和计算机可读存储介质 | |
CN111491198B (zh) | 一种小视频搜索方法和装置 | |
CN113536138A (zh) | 一种网络资源推荐方法、装置、电子设备及可读存储介质 | |
CN112000888B (zh) | 信息推送方法、装置、服务器及存储介质 | |
US11762928B2 (en) | Feature recommendation based on user-generated content | |
CN108536362B (zh) | 用于识别操作的方法、装置及服务器 | |
CN113742588A (zh) | 一种咨询处理方法和装置 | |
CN115062214A (zh) | 内容推荐方法、装置、可读存储介质及电子设备 | |
CN116578757A (zh) | 博文向量生成模型训练方法、博文推荐方法及装置、设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |