CN114119081A

CN114119081A - 对象预测模型的训练方法、装置、电子设备及存储介质

Info

Publication number: CN114119081A
Application number: CN202111350069.3A
Authority: CN
Inventors: 吕昊; 赵紫晗; 周柏村; 付靖玲; 王答明; 易津锋
Original assignee: Beijing Jingdong Shangke Information Technology Co Ltd
Current assignee: Beijing Jingdong Shangke Information Technology Co Ltd
Priority date: 2021-11-15
Filing date: 2021-11-15
Publication date: 2022-03-01

Abstract

本申请提出了一种对象预测模型的训练方法、装置、电子设备及存储介质，其中，方法包括：获取样本对象的描述信息和历史目标数量，其中，目标数量用于表征样本对象的热度；从描述信息中获取样本对象的图像的分类特征表示和文本信息的文本特征表示，以及历史目标数量的第一编码表示；根据分类特征表示、文本特征表示和第一编码表示，对待训练的对象预测模型进行训练，以生成目标对象预测模型。本申请中，通过融合图像信息和文本信息实现对象预测模型的训练，使得训练后的目标对象预测模型可以结合对象的图像和文本中的信息，实现对象的目标数量进行预测，有效提高了预测的准确率，优化了对象预测模型的预测效果。

Description

对象预测模型的训练方法、装置、电子设备及存储介质

技术领域

本申请涉及数据处理领域，尤其涉及计算机视觉和深度学习等人工智能领域。

背景技术

随着社会经济的发展，销量预测在市场运营的相关工作中愈加重要。相关技术中，仅可以基于商品的历史销量的相关时序数据，对商品在未来的销量进行预测，忽略了可以对销量产生影响的其他因素，比如商品的图像、商品的文字表述等等。

因此，如何利用商品的图像、文字等相关信息，提高商品销量预测的精度，是目前需要解决的问题。

发明内容

本申请旨在至少在一定程度上解决相关技术中的技术问题之一。

为此，本申请第一方面提出一种对象预测模型的训练方法。

本申请第二方面还提出一种对象预测模型的训练装置。

本申请第三方面提出一种电子设备。

本申请第四方面提出一种计算机可读存储介质。

本申请第五方面提出一种计算机程序产品。

本申请第一方面提出一种对象预测模型的训练方法，包括：获取样本对象的描述信息和历史目标数量，其中，所述目标数量用于表征所述样本对象的热度；从所述描述信息中获取所述样本对象的图像的分类特征表示和所述文本信息的文本特征表示，并获取所述历史目标数量的第一编码表示；根据所述分类特征表示、所述文本特征表示和所述第一编码表示，对待训练的对象预测模型进行训练，以生成目标对象预测模型。

另外，本申请第一方面提出的对象预测模型的训练方法，还可以具有如下附加的技术特征：

根据本申请的一个实施例，所述根据所述分类特征表示、所述文本特征表示和所述第一编码表示，对待训练的对象预测模型进行训练，包括：将所述分类特征表示、所述文本特征表示和所述第一编码表示输入所述对象预测模型中，对所述分类特征表示、所述文本特征表示和所述第一编码表示进行拼接，并生成目标拼接表示；基于目标拼接表示，获取所述样本对象的预测目标数量；根据所述预测目标数量和所述历史目标数量，获取所述对象预测模型的损失函数；根据所述损失函数调整所述对象预测模型的模型参数，并使用下一样本对象对调整后的对象预测模型继续训练，直至训练结束生成目标对象预测模型。

根据本申请的一个实施例，所述方法还包括：获取所述样本对象的属性信息和运营信息；获取所述属性信息的第二编码表示和所述运营信息的第三编码表示；基于所述第一编码表示、所述第二编码表示和所述第三编码表示，生成目标编码表示；将所述分类特征表示、所述文本特征表示和所述目标编码表示，输入所述对象预测模型中，对所述分类特征表示、所述文本特征表示和所述目标编码表示进行拼接，以生成所述目标拼接表示。

根据本申请的一个实施例，所述获取所述样本对象的图像的分类特征表示和所述文本信息的文本特征表示，包括：将所述图像输入目标图像分类模型，由所述目标图像分类模型提取所述图像的外观特征，并基于所述外观特征进行分类识别，得到所述分类特征表示；将所述文本信息输入目标文本提取模型进行关键字提取，并根据所述关键字提取文本特征，以得到所述文本特征表示。

根据本申请的一个实施例，所述方法还包括:在所述对象预测模型之前训练之前，训练出所述目标图像分类模型和所述目标文本提取模型。

根据本申请的一个实施例，所述获取所述属性信息的第二编码表示和所述运营信息的第三编码表示之前，还包括：对所述样本对象的所述属性信息、所述运营信息和所述历史目标数量进行数据清洗和/或数据补全。

根据本申请的一个实施例，所述方法包括：获取待预测的目标对象的目标描述信息；从所述目标描述信息中，获取所述目标对象的图像的目标分类特征表示和所述文本信息的目标文本特征表示；将所述目标分类特征表示和所述目标文本特征表示输入所述目标对象预测模型中对所述目标对象进行目标数量预测，以生成所述目标对象的目标预测数量。

本申请第二方面还提出一种对象预测模型的训练装置，该装置包括：获取模块，用于获取样本对象的描述信息和历史目标数量，其中，所述目标数量用于表征所述样本对象的热度；提取模块，用于从所述描述信息中获取所述样本对象的图像的分类特征表示和所述文本信息的文本特征表示，并获取所述历史目标数量的第一编码表示；训练模块，用于根据所述分类特征表示、所述文本特征表示和所述第一编码表示，对待训练的对象预测模型进行训练，以生成目标对象预测模型。

本申请第二方面提出的对象预测模型的训练装置还可以具有如下附加的技术特征：

根据本申请的一个实施例，所述训练模块，还用于：将所述分类特征表示、所述文本特征表示和所述第一编码表示输入所述对象预测模型中，对所述分类特征表示、所述文本特征表示和所述第一编码表示进行拼接，并生成目标拼接表示；基于目标拼接表示，获取所述样本对象的预测目标数量；根据所述预测目标数量和所述历史目标数量，获取所述对象预测模型的损失函数；根据所述损失函数调整所述对象预测模型的模型参数，并使用下一样本对象对调整后的对象预测模型继续训练，直至训练结束生成目标对象预测模型。

根据本申请的一个实施例，所述装置还包括：所述获取模块，还用于获取所述样本对象的属性信息和运营信息；所述提取模块，还用于获取所述属性信息的第二编码表示和所述运营信息的第三编码表示；所述提取模块，还用于基于所述第一编码表示、所述第二编码表示和所述第三编码表示，生成目标编码表示；所述训练模块，还用于将所述分类特征表示、所述文本特征表示和所述目标编码表示，输入所述对象预测模型中，对所述分类特征表示、所述文本特征表示和所述目标编码表示进行拼接，以生成所述目标拼接表示。

根据本申请的一个实施例，所述提取模块，还用于：将所述图像输入目标图像分类模型，由所述目标图像分类模型提取所述图像的外观特征，并基于所述外观特征进行分类识别，得到所述分类特征表示；将所述文本信息输入目标文本提取模型进行关键字提取，并根据所述关键字提取文本特征，以得到所述文本特征表示。

根据本申请的一个实施例，所述训练模块，还用于:在所述对象预测模型之前训练之前，训练出所述目标图像分类模型和所述目标文本提取模型。

根据本申请的一个实施例，所述提取模块，还用于：对所述样本对象的所述属性信息、所述运营信息和所述历史目标数量进行数据清洗和/或数据补全。

根据本申请的一个实施例，所述装置包括：所述获取模块，还用于获取待预测的目标对象的目标描述信息；所述提取模块，还用于从所述目标描述信息中，获取所述目标对象的图像的目标分类特征表示和所述文本信息的目标文本特征表示；预测模块，用于将所述目标分类特征表示和所述目标文本特征表示输入所述目标对象预测模型中对所述目标对象进行目标数量预测，以生成所述目标对象的目标预测数量。

本申请第三方面提出了一种电子设备，包括：至少一个处理器；以及与所述至少一个处理器通信连接的存储器；其中，所述存储器存储有可被所述至少一个处理器执行的指令，所述指令被所述至少一个处理器执行，以使所述至少一个处理器能够执行上述第一方面提出的对象预测模型的训练方法。

本申请第四方面提出了一种计算机可读存储介质，其中，所述计算机指令用于使所述计算机执行第一方面提出的对象预测模型的训练方法。

本申请第五方面提出了一种计算机程序产品，包括计算机程序，所述计算机程序在被处理器执行时实现根据上述第一方面提出的对象预测模型的训练方法。

本申请提出的对象预测模型的训练方法及装置，获取样本对象的图像、文本信息和历史销量，并分别获取样本对象的图像对应的分类特征表示、样本对象的文本信息对应的文本特征表示和样本对象的历史销量对应的第一编码表示，并根据分类特征表示、文本特征表示和第一编码表示对待训练的对象预测模型进行模型训练，直至训练结束，生成目标对象预测模型。本申请中，通过融合图像信息和文本信息实现对象预测模型的训练，使得训练后的目标对象预测模型可以结合对象的图像和文本中的信息，实现对象的目标数量的预测，有效提高了预测的准确率，优化了对象预测模型的预测效果。

应当理解，本申请所描述的内容并非旨在标识本申请的实施例的关键或重要特征，也不用于限制本申请的范围。本申请的其它特征将通过以下的说明书而变得容易理解。

附图说明

本申请上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解，其中：

图1为本申请一实施例的对象预测模型的训练方法的流程示意图；

图2为本申请另一实施例的对象预测模型的训练方法的流程示意图；

图3为本申请另一实施例的对象预测模型的训练方法的流程示意图；

图4为本申请另一实施例的对象预测模型的训练方法的流程示意图；

图5为本申请另一实施例的对象预测模型的训练方法的流程示意图；

图6为本申请另一实施例的对象预测模型的训练方法的流程示意图；

图7为本申请一实施例的对象预测模型的训练装置的结构示意图；

图8为本申请另一实施例的对象预测模型的训练装置的结构示意图；

图9为本申请一实施例的电子设备的结构示意图。

具体实施方式

下面详细描述本申请的实施例，所述实施例的示例在附图中示出，其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的，旨在用于解释本申请，而不能理解为对本申请的限制。

下面参照附图描述本申请实施例的对象预测模型的训练方法、装置、电子设备和存储介质。

图1为本申请一实施例的对象预测模型的训练方法的流程示意图，如图1所示，该方法包括：

S101，获取样本对象的描述信息和历史目标数量，其中，目标数量用于表征样本对象的热度。

随着社会的发展，消费者们在进行购物时，除了实体店之外，还会选择通过网络渠道购买。在网络渠道中，人们的意向购买对象可以是实体化的商品，也可以是虚拟的服务商品，其中，购买对象存在图像、文字以及评论等相关信息，可以将图像、文字以及评论等相关信息确定为购买对象的相关描述信息，该描述信息是消费者判断购买对象是否可以达成购买意向的重要依据。

因此，在进行商品销量预测的过程中，可以通过对商品的图像、文本等相关信息实现。

进一步地，还可以结合商品的历史目标数量，其中，商品的历史目标数量可以是历史销量，通过历史销量的数值大小，可以对商品被购买的热度进行判断。

通过对图像、文本以及历史销量的结合分析，从而实现商品的高准确率的销量预测。

在构建商品的购买链接时，商家和/或平台会对商品进行相关信息的输入并存储于服务器的设定位置中，比如上传商品的外观图像、输入商品标题详情介绍等等相关信息。相应地，商品的购买链接上架后，商品的历史销售数据等相关信息会被监控并存储与服务器的设定位置中。

本申请实施例中，可以从不同品类的商品中确定进行模型训练的样本商品，并通过每个样本商品的标识信息，从设定的存储位置中获取样本商品的图像、文本信息和历史销量等等。

其中，通过样本商品的图像可以获取样本商品的外观特征，比如样本商品的形状、颜色等等。

通过样本商品的文本信息可以获取样本商品的评价性描述，比如样本商品的名称、效果、作用、性能等等。

通过样本商品的历史销量可以获取样本的历史销量的时序数据。

S102，从描述信息中获取样本对象的图像的分类特征表示和文本信息的文本特征表示，并获取历史目标数量的第一编码表示。

本申请实施例中，为了使得样本商品的图像信息、文本信息和历史销量可以同时在销量模型训练时得到应用，待训练的对象预测模型的输入存在设定格式。进一步地，需要对样本商品的图像、文本信息和历史销量进行数据处理，将样本图像、文本信息和历史销量分别转化为符合设定格式的数据，使得对象预测模型可以融合样本商品的图像、文本信息和历史销量进行模型训练。

实现中，样本商品的外观对于商品的销量存在影响，因此，可以从样本商品的图像中提取样本商品的有效外观特征，并基于外观特征生成对应的分类特征表示。

相应地，样本商品的文本信息中包含的评价性描述对于商品的销量存在影响，因此，可以提取样本商品的文本信息中的样本商品的有效评价性描述，并生成样本商品的文本信息对应的文本特征表示。

相应地，样本的历史销量需要进一步的数据处理。实现中，样本商品的历史销量数据可能存在部分无效冗余的数据，或者存在部分数据的缺失，因此，可以针对无效冗余的数据以及缺失数据进行进一步的处理，并将处理后的历史销量进行编码转换，生成对应的编码表示，并将其标识为样本商品的历史销量的第一编码表示。

其中，样本商品的分类特征表示、文本特征表示和第一编码表示均为符合对象预测模型的输入数据设定格式的向量和/或字符串。

S103，根据分类特征表示、文本特征表示和第一编码表示，对待训练的对象预测模型进行训练，以生成目标对象预测模型。

本申请实施例中，通过融合样本商品的图像、文本信息和历史销量，对对象预测模型进行训练，可以使得训练后的目标对象预测模型具备更高的精度。

为了达到上述效果，可以样本商品图像的分类特征表示、样本商品文本信息的文本特征表示和样本商品历史销量的第一编码表示同时输入至待训练的对象预测模型进行模型训练。

可选地，可以将分类特征表示、文本特征表示和第一编码表示进行数据融合，使得对象预测模型可以基于融合后的向量和/或字符串进行训练。

可选地，对象预测模型可以分别基于分类特征表示、文本特征表示和第一编码表示进行模型训练。

进一步地，当对象预测模型达到模型训练结束的条件后，即可结束模型训练，并生成训练完成的目标对象预测模型。

其中，可以将模型训练的次数作为模型训练结束的条件，在进行对象预测模型训练时，可以对其训练轮次进行监控统计，当训练轮次达到预设的模型训练结束的条件时，可以理解为，当前轮次训练的模型可以满足实际所需，则结束模型训练，并将最后一个轮次训练的模型确定为目标对象预测模型。

或者，可以将模型训练的输出结果作为训练结束的条件，当某一轮次的模型训练的输出结果满足预设的条件时，可以理解为，当前轮次训练结束的模型可以满足实际所需，则结束模型训练，并将当前轮次训练的模型确定为目标对象预测模型。

本申请提出的对象预测模型的训练方法，获取样本商品的图像、文本信息和历史销量，并分别获取样本商品的图像对应的分类特征表示、样本商品的文本信息对应的文本特征表示和样本商品的历史销量对应的第一编码表示，并根据分类特征表示、文本特征表示和第一编码表示对待训练的对象预测模型进行模型训练，直至训练结束，生成目标对象预测模型。本申请中，通过融合图像信息和文本信息对对象预测模型进行训练，使得训练后的目标对象预测模型可以结合商品的图像和文本中的信息，对商品的销量进行预测，有效提高了商品预测的准确率，优化了对象预测模型的预测效果。

为了更好的理解本申请提出的对象预测模型的训练方法，在下述实施例中以商品为例，通过结合商品的图像、文本和历史销量的相关信息，实现对象预测模型的训练。并基于训练完成后的目标对象预测模型实现对于商品销量的预测。

上述实施例中，关于对象预测模型的训练，可结合图2进一步理解，图2为本申请另一实施例的对象预测模型的训练方法的流程示意图，如图2所示，该方法包括：

S201，将分类特征表示、文本特征表示和第一编码表示输入对象预测模型中，对分类特征表示、文本特征表示和第一编码表示进行拼接，并生成目标拼接表示。

本申请实施例中，对象预测模型通过输入其中的分类特征表示、文本特征表示和第一编码表示进行模型训练。

由于分类特征表示、文本特征表示以及第一编码表示均是基于对象预测模型的输入数据的设定格式进行的处理转化，因此，分类特征表示、文本特征表示以及第一编码表示的格式是相同的。

进一步地，可以将分类特征表示、文本特征表示和第一编码表示进行任意顺序的拼接，生成一条包括了分类特征、文本特征和历史销量特征的向量和/或字符串，将将其确定为拼接后的目标拼接表示。

可选地，样本商品存在设定的标识信息，该标识信息具有唯一性，因此，可以通过样本商品的标识信息对分类特征表示、文本特征表示和第一编码表示进行拼接，进而生成目标拼接标识。

S202，基于目标拼接表示，获取样本对象的预测目标数量。

本申请实施例中，对象预测模型可以通过目标拼接表示进行模型训练，通过目标拼接表示中的分类特征表示、文本特征表示以及第一编码表示，可以获取样本商品的外观特征对样本商品的销量的影响规律，样本的评价性描述对样本商品的销量的影响规律。

进一步地，将目标拼接表示输入对象预测模型中，进而获取对象预测模型输出的样本商品的预测销量。

其中，对象预测模型可以为支持向量机(Supporting Vector Machine，SVM)、回归树模型、神经网络模型等等。

通过目标拼接表示实现对象预测模型的多轮次训练，从而实现最终的目标对象预测模型的生成。

S203，根据预测目标数量和历史目标数量，获取对象预测模型的损失函数。

本申请实施例中，为了实现对象预测模型的训练，需要根据每个轮次训练输出的预测销量调整对象预测模型。

其中，为了有效提高对象预测模型调整的准确性，可以基于预测销量和历史销量获取对象预测模型当前训练轮次的损失函数。

可选地，可以通过平方损失函数体现预测销量和历史销量之间的损失。

设定，样本商品i的目标拼接表示为Xi，历史销量为Yi，将目标拼接表示Xi输入对象预测模型中，输出的预测销量为Ri，则基于预测销量Ri和历史销量Yi生成的平方损失函数可以如下所示：

L＝(Y_i-R_i)²

其中，L为对象预测模型在当前轮次训练的平方损失函数。

S204，根据损失函数调整对象预测模型的模型参数，并使用下一样本商品对调整后的对象预测模型继续训练，直至训练结束生成目标对象预测模型。

实现中，可以基于对象预测模型当前轮次训练的损失函数调整对象预测模型的相关参数，使得下一轮次对象预测模型训练输出的预测销量可以无限接近于实际的历史销量。

进一步地，通过多轮次的模型训练，并基于每个轮次训练输出的损失函数，在下一轮次的训练开始前对当前训练轮次的对象预测模型进行参数的调整和优化。并使用下一样本商品的图像、文本信息和历史销量对应的目标拼接表示继续训练对象预测模型，直至训练输出的预测销量与实际的历史销量之间的损失达到预设的标准。

其中，若当前训练轮次的对象预测模型的输出结果与实际的历史销量之间的损失函数达到预设的标准时，可以理解为，基于当前训练轮次的对象预测模型的进行商品的销量预测时，所输出的预测结果的准确率可以满足实际所需，因此，可以结束模型训练，并将当前轮次的对象预测模型确定为目标对象预测模型。

本申请提出的对象预测模型的训练方法，基于分类特征表示、文本特征表示和第一编码表示生成目标拼接表示，并通过目标拼接表示对对象预测模型进行训练，通过训练输出的预测销量和实际的历史销量之间的损失函数，对对象预测模型的模型参数进行调整和优化，直至训练结束，并生成目标对象预测模型。本申请中，通过融合图像信息和文本信息对对象预测模型进行训练，使得训练后的目标对象预测模型可以结合商品的图像和文本中的信息，对商品的销量进行预测，有效提高了商品预测的准确率，优化了对象预测模型的预测效果。

上述实施例中，关于第一编码表示，还可以结合图3理解，图3为本申请另一实施例的对象预测模型的训练方法的流程示意图，如图3所示，该方法包括：

S301，获取样本对象的属性信息和运营信息。

实现中，商品存在客观描述类信息，比如材质、规格、尺码等等属性信息，该部分信息会帮助消费者对商品进行基础的判断，因此，属性信息对于商品的销量存在一定的影响。其中，该属性信息在构建商品的购买链接时，会存储于服务器的设定位置。

另外，商品的销售过程中，可以通过运营活动的策划执行提升商品的销量，因此，运营信息会对商品的销量存在影响。

进一步地，可以结合商品的运营信息和属性信息对对象预测模型进行训练。

本申请实施例中，商品的属性信息和运营信息可以存储于服务器的设定位置，因此，可以通过设定存储位置的接口，获取样本商品的属性信息和运营信息。

S302，获取属性信息的第二编码表示和运营信息的第三编码表示。

本申请实施例中，为了使得对象预测模型可以使用样本商品的属性信息和运营信息进行模型训练，需要针对属性信息和运营信息进行进一步地数据处理。

实现中，样本商品的属性信息和运营信息可能存在部分无效冗余的数据，或者存在部分数据的缺失，因此，可以针对无效冗余的数据以及缺失数据进行进一步的处理，并将处理后的历史销量进行编码转换，生成对应的编码表示。

进一步地，对样本商品的属性信息、运营信息和历史销量进行数据清洗和/或数据补全。

其中，对于属性信息、运营信息的数据处理方法，与针对历史销量的数据处理方法相同。

可选地，可以对样本商品的属性信息、运营信息以及历史销量进行数据清洗，将其中冗余无效的信息进行删除。比如重复的数据，再比如缺失较多的残破数据，再比如无实际含义的描述信息等等，可以通过数据清洗进行删除，进而提取出样本商品的属性信息、运营信息和历史销量中的有效信息的提取。

进一步地，提取出的有效信息可能存在部分缺失。

比如，从时序的维度上，设定统计间隔为一个自然日，当某一个自然日未统计到相关数据时，可以判断，该自然日内对应的数据为缺失数据，因此，需要对该自然日内的数据进行数据补全。

再比如，属性信息中包含样本商品多个类型的描述类信息，其中，可以预先设定从属性信息中提取出的有效类型信息，当某一个类型下未提取到有效信息时，可以判断，该类型下对应的数据为缺失数据，因此，需要对该类型下对应的数据进行数据补全。

其中，可以将预先定义的空白数据在缺失部位进行填充，从而进行数据补全。

进一步地，对于补全后的数据可以进行编码处理，从而获取样本商品的属性信息、运营信息以及历史销量对应的编码表示。其中，补全后的数据可以为有序数据，也可以为无序数据。

可选地，可以将有序数据转化为浮点型数据类型，并使用有序数据的编码方式对其进行编码，比如标签编码(label-encoding)，进而生成有序数据对应的编码表示，其中，有序数据对应的编码表示可以为一个字符串。

可选地，可以对无序数据采用相应的编码方式进行编码，比如独热编码(One-HotEncoding)，进而生成无序数据对应的编码表示，其中，无序数据对应的编码表示可以为一个向量。

进一步地，获取样本商品历史销量的第一编码表示、样本商品的属性信息对应的第二编码表示，以及样本商品运营信息对应的第三编码表示。

需要说明的是，第一编码表示、第二编码表示以及第三编码表示的格式和维度是相同的。

S303，基于第一编码表示、第二编码表示和第三编码表示，生成目标编码表示。

本申请实施例中，可以将第一编码表示、第二编码表示和第三编码表示进行融合，从而使得对象预测模型可以结合样本商品的属性信息、运营信息和历史销量实现对象预测模型的训练。

可选地，由于第一编码表示、第二编码表示和第三编码表示的格式和维度相同，因此，可以按任意顺序将第一编码表示、第二编码表示和第三编码表示进行拼接，进而生成相应的目标编码表示。其中，目标编码表示可以是一串字符串，也可以是一个向量。

S304，将分类特征表示、文本特征表示和目标编码表示，输入对象预测模型中，对分类特征表示、文本特征表示和目标编码表示进行拼接，以生成目标拼接表示。

本申请实施例中，获取目标编码表示后，可以将其与分类特征表示、文本特征表示同时输入对象预测模型进行模型训练。

可选地，可以将分类特征表示、文本特征表示和目标编码表示进行融合，按照任意顺序进行拼接，从而生成一个融合后的目标拼接表示，并基于该目标拼接表示对对象预测模型进行训练，进而使得对象预测模型可以融合样本商品的图像、文本信息、历史销量、属性信息以及运营信息，实现多种维度信息的模型训练。

本申请提出的对象预测模型的训练方法，获取样本商品的属性信息和运营信息对应的第二编码表示和第三编码表示，将其与第一编码表示进行融合，生成目标编码表示。进一步地，将目标编码表示、分类特征表示和文本特征表示进行拼接，生成目标拼接表示，并基于该目标拼接表示对对象预测模型进行训练。本申请中，融合了图像、文本、历史销量、运营信息和属性信息对对象预测模型进行训练，有效提升了训练后的目标对象预测模型的销量预测的精度。

上述实施例中，关于分类特征表示以及文本特征表示的获取，可以结合图4进一步地理解，图4为本申请另一实施例的对象预测模型的训练方法的流程示意图，如图4所示，该方法包括：

S401，将图像输入目标图像分类模型，由目标图像分类模型提取图像的外观特征，并基于外观特征进行分类识别，得到分类特征表示。

实现中，商品的外观特征对于商品销量存在较大的影响，人们更加愿意购买符合主流审美的商品，因此，可以结合商品的外观特征对对象预测模型进行训练。

其中，商品的外观特征可以为商品对应的风格的标签。比如服装类商品，其风格标签可以为商务、休闲等等。

进一步地，样本商品的分类特征表示可以通过目标图像分类模型获取。其中，在对象预测模型训练之前，目标图像分类模型已经训练完成。

可选地，可以将样本图像输入待训练的图像分类模型中，基于图像分类模型的输出结果与实际的样本图像的分类标签进行对比，基于二者之间的损失函数，对图像分类模型进行参数的调整和优化，直至训练结束，进而获取训练完成的目标图像分类模型。

其中，图像分类模型可以采用深度残差网络结构(resnet)作为主结构(backbone)，也可以采用卷积神经网络(Dense Convolutional Network，DenseNet)作为backbone，还可以采用图像分类经典卷积神经网络(GoogleNet)作为backbone，此处不做限定。

需要说明的是，上述待训练的图像分类模型，可以使用现有的可以实现图像分类的模型结构进行训练，也可以根据实际所需进行调整，此处不做限定。

本申请实施例中，为了保证对象预测模型的准确性，需要保证输入对象预测模型进行训练的样本的准确性，因此，在开始对象预测模型的训练之前，需要通过已经训练完成的目标图像分类模型，提取样本商品的图像中的外观特征，并根据外观特征进行分类识别，从而生成样本商品的图像的分类特征表示。

比如，可以将服装类的样本商品的图像输入目标图像分类模型中，获取该样本商品的外观特征所属风格的分类结果，比如甜美、嘻哈、休闲等等，进而生成对应的分类特征表示。

再比如，可以将电器类的样本商品的图像输入目标图像分类模型中，获取该样本商品的外观特征所属风格的分类结果，比如可爱、简约、潮流等等，进而生成对应的分类特征表示。

S402，将文本信息输入目标文本提取模型进行关键字提取，并根据关键字提取文本特征，以得到文本特征表示。

实现中，商品存在标题、用户评价等评价类的描述信息，该部分信息对于商品销量存在较大影响，是消费者在线上购物时，判断是否购买商品的重要依据。因此，可以提取其中的有效信息对对象预测模型进行训练。

其中，不同品类的商品，其标题和用户评价可以提取的有效信息的数据类型存在差异。依然以服装类商品为例，从其评价性描述信息中提取到的有效信息可以包括对舒适度的评价、服装剪裁的评价、面料质感的评价等等。再以电器类产品为例，从其评价性的描述信息中提取到的有效信息可以包括运行速度的评价、性能的评价、使用效果的评价等等。

进一步地，样本商品的文本特征表示可以通过目标文本提取模型获取，其中，在对象预测模型之前训练之前，目标文本提取模型已经训练完成。

可选地，可以将样本商品的文本信息输入至待训练的文本特征提取模型中，基于文本特征模型提取文本信息中的有效关键字，进而获取文本特征，并根据训练输出的文本特征和实际的样本商品的文本信息对应的特征标签进行对比，基于二者之间的损失函数，对样本特征提取模型进行模型参数的调整优化，直至训练结果，生成训练完成的目标样本提取模型。

其中，文本特征提取模型可以是中文文本分类模型(BERT)，进一步地，基于注意力(Attention)机制处理自然语言处理样本商品的文本信息，从而生成文本特征表示。

需要说明的是，上述待训练的文本提取模型，可以使用现有的可以实现文本提取的模型结构进行训练，也可以根据实际所需进行调整，此处不做限定。

本申请实施例中，可以将样本商品的评价性的文本信息输入训练完成的目标文本特征提取模型中，提取样本商品的文本信息的文本特征表示。

S403，根据分类特征表示、文本特征表示和第一编码表示，对待训练的对象预测模型进行训练，以生成目标对象预测模型。

步骤S403可参见上述相关详细内容，此处不再赘述。

本申请提出的对象预测模型的训练方法，预先对图像分类模型和文本提取模型训练完成，并通过训练完成的目标图像分类模型和目标文本提取模型，提取样本商品的分类特征表示和样本特征表示，使得对象预测模型可以基于准确的样本表示进行训练，从而有效提升了对象预测模型的准确率。

进一步地，对象预测模型的训练结束后，可以基于训练后的目标对象预测模型进行商品销量的预测，可结合图5，图5为本申请另一实施例的对象预测模型的训练方法的流程示意图，如图5所示，该方法包括：

S501，获取待预测的目标对象的目标描述信息。

本申请实施例中，目标对象预测模型是基于样本商品的图像和文本信息对应的分类特征表示和文本特征表示进行的模型训练，因此，为了更好的发挥目标对象预测模型的预测效果，可以将待预测的目标商品的目标描述信息中的图像和文本信息输入目标对象预测模型。

可选地，可以从构建商品购买链接时，商品的图像和文本信息存储的设定位置获取目标商品的图像和文本信息。

其中，目标商品的图像包含有目标商品的外观类信息特征，目标商品的文本信息包含有目标商品的评价类信息特征。

S502，从目标描述信息中，获取目标对象的图像的目标分类特征表示和文本信息的目标文本特征表示。

本申请实施例中，为了使得目标商品的图像、文本信息可以在销量预测时可以同时得以使用，因此，目标对象预测模型存在设定的输入格式。

进一步地，可以将目标商品的图像输入目标图像分类模型中，基于目标图像分类模型获取目标商品的目标分类特征表示。

相应地，可以将目标商品的文本信息输入目标文本提取模型中，基于目标文本提取模型获取目标商品的目标文本特征表示。

S503，将目标分类特征表示和目标文本特征表示输入目标对象预测模型中对目标对象进行目标数量预测，以生成目标对象的目标预测数量。

进一步地，将目标分类特征表示和目标文本特征表示输入目标对象预测模型中，目标对象预测模型基于其中的外观特征和文本特征进行销量预测，进而输出目标商品的目标预测销量。

可选地，可以将目标分类特征表示和目标文本特征表示按任意顺序进行拼接，生成对应的拼接表示，目标对象预测模型基于对应的拼接表示输出目标商品的目标预测销量。

实现中，目标对象预测模型在进行销量预测时，需要预先获取目标商品的图像和文本信息中的特征表示，并基于预先提取出的目标商品的图像和文本信息对应的特征表示进行销量预测。

可选地，目标对象预测模型中可以包括目标图像分类模型和目标文本提取模型。将待预测的目标商品的图像和文本信息输入目标对象预测模型后，由模型内部进行目标分类特征和目标文本特征的提取，进而进行目标商品的销量预测，并通过目标对象预测模型内部的对象预测模型输出目标预测销量。

可选地，目标图像分类模型和目标文本提取模型可以分别与目标对象预测模型连接，由目标图像分类模型获取目标商品的目标分类特征表示，以及由目标文本提取模型获取目标商品的目标文本特征表示后，将二者输入至目标对象预测模型中进行销量预测，进而由目标对象预测模型输出目标预测销量。

本申请提出的对象预测模型的训练方法，将待预测的目标商品的图像和文本信息输入训练完成的目标对象预测模型中，从而获取目标商品的目标预测销量。融合了图像和文本的多维度信息进行的销量预测，有效提升了目标对象预测模型的预测精度以及准确度。

为了更好的理解上述实施例，可结合图6，图6为本申请另一实施例的对象预测模型的训练方法的流程示意图。

如图6所示，样本商品的图像可以通过图像分类模型61提取其中的分类特征表示，样本商品的文本信息可以通过文本提取模型62提取其中的文本特征表示，样本商品的历史销量可以通过数据处理编码器63进行数据清洗补全以及编码获取对应的第一编码表示。

进一步地，将分类特征表示、文本特征表示和第一编码表示输入对象预测模型64中进行模型训练，进而生成训练后的目标对象预测模型。

相应地，样本商品的属性信息和运营信息可以通过数据处理编码器63进行数据清洗补全以及编码获取对应的第二编码表示和第三编码表示，进一步地，将第一编码表示、第二编码表示和第三编码表示进行拼接生成目标拼接表示后，可以将目标拼接表示和分类特征表示、文本特征表示输入对象预测模型64进行模型训练，进而生成训练后的目标对象预测模型。

与上述几种实施例提出的对象预测模型的训练方法相对应，本申请的一个实施例还提出了一种对象预测模型的训练装置，由于本申请实施例提出的对象预测模型的训练装置与上述几种实施例提出的对象预测模型的训练方法相对应，因此上述对象预测模型的训练方法的实施方式也适用于本申请实施例提出的对象预测模型的训练装置，在下述实施例中不再详细描述。

图7为本申请一实施例的对象预测模型的训练装置的结构示意图，如图7所示，对象预测模型的训练装置700，包括获取模块71、提取模块72、训练模块73，其中：

获取模块71，用于获取样本对象的描述信息和历史目标数量，其中，目标数量用于表征样本对象的热度；

提取模块72，用于从描述信息中获取样本对象的图像的分类特征表示和文本信息的文本特征表示，以及历史目标数量的第一编码表示；

训练模块73，用于根据分类特征表示、文本特征表示和第一编码表示，对待训练的对象预测模型进行训练，以生成目标对象预测模型。

图8为本申请另一实施例的对象预测模型的训练装置的结构示意图，如图8所示，对象预测模型的训练装置800，包括获取模块81、提取模块82、训练模块83、预测模块84，其中：

需要说明的是，获取模块71、提取模块72、训练模块73与获取模块81、提取模块82、训练模块83，具有相同的结构和功能。

本申请实施例中，训练模块83，还用于：将分类特征表示、文本特征表示和第一编码表示输入对象预测模型中，对分类特征表示、文本特征表示和第一编码表示进行拼接，并生成目标拼接表示；基于目标拼接表示，获取样本对象的预测目标数量；根据预测目标数量和历史目标数量，获取对象预测模型的损失函数；根据损失函数调整对象预测模型的模型参数，并使用下一样本对象对调整后的对象预测模型继续训练，直至训练结束生成目标对象预测模型。

本申请实施例中，对象预测模型的训练装置800，还包括：获取模块81，还用于获取样本对象的属性信息和运营信息；提取模块82，还用于获取属性信息的第二编码表示和运营信息的第三编码表示；以及，基于第一编码表示、第二编码表示和第三编码表示，生成目标编码表示；训练模块83，还用于将分类特征表示、文本特征表示和目标编码表示，输入对象预测模型中，对分类特征表示、文本特征表示和目标编码表示进行拼接，以生成目标拼接表示。

本申请实施例中，提取模块82，还用于：将图像输入目标图像分类模型，由目标图像分类模型提取图像的外观特征，并基于外观特征进行分类识别，得到分类特征表示；将文本信息输入目标文本提取模型进行关键字提取，并根据关键字提取文本特征，以得到文本特征表示。

本申请实施例中，训练模块83，还用于:在对象预测模型之前训练之前，训练出目标图像分类模型和目标文本提取模型。

本申请实施例中，提取模块82，还用于：对样本对象的属性信息、运营信息和历史目标数量进行数据清洗和/或数据补全。

本申请实施例中，对象预测模型的训练装置800，包括：获取模块81，还用于获取待预测的目标对象的目标描述信息；提取模块82，还用于获取目标对象的图像的目标分类特征表示和文本信息的目标文本特征表示；预测模块84，用于将目标分类特征表示和目标文本特征表示输入目标对象预测模型中对目标对象进行目标数量预测，以生成目标对象的目标预测数量。

本申请提出的对象预测模型的训练装置，获取样本商品的图像、文本信息和历史销量，并分别获取样本商品的图像对应的分类特征表示、样本商品的文本信息对应的文本特征表示和样本商品的历史销量对应的第一编码表示，并根据分类特征表示、文本特征表示和第一编码表示对待训练的对象预测模型进行模型训练，直至训练结束，生成目标对象预测模型。本申请中，通过融合图像信息和文本信息对对象预测模型进行训练，使得训练后的目标对象预测模型可以结合商品的图像和文本中的信息，对商品的销量进行预测，有效提高了商品预测的准确率，优化了对象预测模型的预测效果。

为达到上述实施例，本申请还提出了一种电子设备、一种计算机可读存储介质和一种计算机程序产品。

图9为本申请一实施例的电子设备的结构示意图。如图9所示，设备900包括存储器91、处理器92及存储在存储91上并可在处理器92上运行的计算机程序，处理器92执行程序指令时，实现上述实施例提出的对象预测模型的训练方法。

本申请实施例的电子设备，获取样本商品的图像、文本信息和历史销量，并分别获取样本商品的图像对应的分类特征表示、样本商品的文本信息对应的文本特征表示和样本商品的历史销量对应的第一编码表示，并根据分类特征表示、文本特征表示和第一编码表示对待训练的对象预测模型进行模型训练，直至训练结束，生成目标对象预测模型。本申请中，通过融合图像信息和文本信息对对象预测模型进行训练，使得训练后的目标对象预测模型可以结合商品的图像和文本中的信息，对商品的销量进行预测，有效提高了商品预测的准确率，优化了对象预测模型的预测效果。

本申请实施例提出的一种计算机可读存储介质，其上存储有计算机程序，该程序被处理器执行时，实现上述实施例提出的对象预测模型的训练方法。

本申请实施例的计算机可读存储介质，获取样本商品的图像、文本信息和历史销量，并分别获取样本商品的图像对应的分类特征表示、样本商品的文本信息对应的文本特征表示和样本商品的历史销量对应的第一编码表示，并根据分类特征表示、文本特征表示和第一编码表示对待训练的对象预测模型进行模型训练，直至训练结束，生成目标对象预测模型。本申请中，通过融合图像信息和文本信息对对象预测模型进行训练，使得训练后的目标对象预测模型可以结合商品的图像和文本中的信息，对商品的销量进行预测，有效提高了商品预测的准确率，优化了对象预测模型的预测效果。

在本说明书的描述中，参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本申请的至少一个实施例或示例中。在本说明书中，对上述术语的示意性表述不必须针对的是相同的实施例或示例。而且，描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外，在不相互矛盾的情况下，本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。

此外，术语“第一”、“第二”仅用于描述目的，而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此，限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。在本申请的描述中，“多个”的含义是至少两个，例如两个，三个等，除非另有明确具体的限定。

流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为，表示包括一个或更多个用于实现定制逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分，并且本申请的优选实施方式的范围包括另外的实现，其中可以不按所示出或讨论的顺序，包括根据所涉及的功能按基本同时的方式或按相反的顺序，来执行功能，这应被本申请的实施例所属技术领域的技术人员所理解。

在流程图中表示或在此以其他方式描述的逻辑和/或步骤，例如，可以被认为是用于实现逻辑功能的可执行指令的定序列表，可以具体实现在任何计算机可读介质中，以供指令执行***、装置或设备(如基于计算机的***、包括处理器的***或其他可以从指令执行***、装置或设备取指令并执行指令的***)使用，或结合这些指令执行***、装置或设备而使用。就本说明书而言，"计算机可读介质"可以是任何可以包含、存储、通信、传播或传输程序以供指令执行***、装置或设备或结合这些指令执行***、装置或设备而使用的装置。计算机可读介质的更具体的示例(非穷尽性列表)包括以下：具有一个或多个布线的电连接部(电子装置)，便携式计算机盘盒(磁装置)，随机存取存储器(RAM)，只读存储器(ROM)，可擦除可编辑只读存储器(EPROM或闪速存储器)，光纤装置，以及便携式光盘只读存储器(CDROM)。另外，计算机可读介质甚至可以是可在其上打印所述程序的纸或其他合适的介质，因为可以例如通过对纸或其他介质进行光学扫描，接着进行编辑、解译或必要时以其他合适方式进行处理来以电子方式获得所述程序，然后将其存储在计算机存储器中。

应当理解，本申请的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中，多个步骤或方法可以用存储在存储器中且由合适的指令执行***执行的软件或固件来实现。如，如果用硬件来实现和在另一实施方式中一样，可用本领域公知的下列技术中的任一项或他们的组合来实现：具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路，具有合适的组合逻辑门电路的专用集成电路，可编程门阵列(PGA)，现场可编程门阵列(FPGA)等。

本技术领域的普通技术人员可以理解实现上述实施例方法携带的全部或部分步骤是可以通过程序来指令相关的硬件完成，所述的程序可以存储于一种计算机可读存储介质中，该程序在执行时，包括方法实施例的步骤之一或其组合。

此外，在本申请各个实施例中的各功能单元可以集成在一个处理模块中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个模块中。上述集成的模块既可以采用硬件的形式实现，也可以采用软件功能模块的形式实现。所述集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时，也可以存储在一个计算机可读取存储介质中。

上述提到的存储介质可以是只读存储器，磁盘或光盘等。尽管上面已经示出和描述了本申请的实施例，可以理解的是，上述实施例是示例性的，不能理解为对本申请的限制，本领域的普通技术人员在本申请的范围内可以对上述实施例进行变化、修改、替换和变型。

应该理解，可以使用上面所示的各种形式的流程，重新排序、增加或删除步骤。例如，本申请中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行，只要能够实现本申请公开的技术方案所期望的结果，本文在此不进行限制。

上述具体实施方式，并不构成对本申请保护范围的限制。本领域技术人员应该明白的是，根据设计要求和其他因素，可以进行各种修改、组合、子组合和替代。任何在本申请的精神和原则之内所作的修改、等同替换和改进等，均应包含在本申请保护范围之内。

Claims

1.一种对象预测模型的训练方法，其特征在于，该方法包括：

获取样本对象的描述信息和历史目标数量，其中，所述目标数量用于表征所述样本对象的热度；

从所述描述信息中获取所述样本对象的图像的分类特征表示和所述文本信息的文本特征表示，并获取所述历史目标数量的第一编码表示；

根据所述分类特征表示、所述文本特征表示和所述第一编码表示，对待训练的对象预测模型进行训练，以生成目标对象预测模型。

2.根据权利要求1所述的方法，其特征在于，所述根据所述分类特征表示、所述文本特征表示和所述第一编码表示，对待训练的对象预测模型进行训练，包括：

将所述分类特征表示、所述文本特征表示和所述第一编码表示输入所述对象预测模型中，对所述分类特征表示、所述文本特征表示和所述第一编码表示进行拼接，并生成目标拼接表示；

基于目标拼接表示，获取所述样本对象的预测目标数量；

根据所述预测目标数量和所述历史目标数量，获取所述对象预测模型的损失函数；

根据所述损失函数调整所述对象预测模型的模型参数，并使用下一样本对象对调整后的对象预测模型继续训练，直至训练结束生成目标对象预测模型。

3.根据权利要求1所述的方法，其特征在于，所述方法还包括：

获取所述样本对象的属性信息和运营信息；

获取所述属性信息的第二编码表示和所述运营信息的第三编码表示；

基于所述第一编码表示、所述第二编码表示和所述第三编码表示，生成目标编码表示；

将所述分类特征表示、所述文本特征表示和所述目标编码表示，输入所述对象预测模型中，对所述分类特征表示、所述文本特征表示和所述目标编码表示进行拼接，以生成所述目标拼接表示。

4.根据权利要求1所述的方法，其特征在于，所述获取所述样本对象的图像的分类特征表示和所述文本信息的文本特征表示，包括：

将所述图像输入目标图像分类模型，由所述目标图像分类模型提取所述图像的外观特征，并基于所述外观特征进行分类识别，得到所述分类特征表示；

将所述文本信息输入目标文本提取模型进行关键字提取，并根据所述关键字提取文本特征，以得到所述文本特征表示。

5.根据权利要求4所述的方法，其特征在于，所述方法还包括:

在所述对象预测模型之前训练之前，训练出所述目标图像分类模型和所述目标文本提取模型。

6.根据权利要求3所述的方法，其特征在于，所述获取所述属性信息的第二编码表示和所述运营信息的第三编码表示之前，还包括：

对所述样本对象的所述属性信息、所述运营信息和所述历史目标数量进行数据清洗和/或数据补全。

7.根据权利要求1-6任一项所述的方法，其特征在于，包括：

获取待预测的目标对象的目标描述信息；

从所述目标描述信息中，获取所述目标对象的图像的目标分类特征表示和所述文本信息的目标文本特征表示；

将所述目标分类特征表示和所述目标文本特征表示输入所述目标对象预测模型中对所述目标对象进行目标数量预测，以生成所述目标对象的目标预测数量。

8.一种对象预测模型的训练装置，其特征在于，该装置包括：

获取模块，用于获取样本对象的描述信息和历史目标数量，其中，所述目标数量用于表征所述样本对象的热度；

提取模块，用于从所述描述信息中获取所述样本对象的图像的分类特征表示和所述文本信息的文本特征表示，并获取所述历史目标数量的第一编码表示；

训练模块，用于根据所述分类特征表示、所述文本特征表示和所述第一编码表示，对待训练的对象预测模型进行训练，以生成目标对象预测模型。

9.根据权利要求8所述的装置，其特征在于，所述训练模块，还用于：

基于目标拼接表示，获取所述样本对象的预测目标数量；

10.根据权利要求8所述的装置，其特征在于，所述装置还包括：

所述获取模块，还用于获取所述样本对象的属性信息和运营信息；

所述提取模块，还用于获取所述属性信息的第二编码表示和所述运营信息的第三编码表示；

所述提取模块，还用于基于所述第一编码表示、所述第二编码表示和所述第三编码表示，生成目标编码表示；

所述训练模块，还用于将所述分类特征表示、所述文本特征表示和所述目标编码表示，输入所述对象预测模型中，对所述分类特征表示、所述文本特征表示和所述目标编码表示进行拼接，以生成所述目标拼接表示。

11.根据权利要求8所述的装置，其特征在于，所述提取模块，还用于：

12.根据权利要求11所述的装置，其特征在于，所述训练模块，还用于:

13.根据权利要求10所述的装置，其特征在于，所述提取模块，还用于：

14.根据权利要求8-13任一项所述的装置，其特征在于，包括：

所述获取模块，还用于获取待预测的目标对象的目标描述信息；

所述提取模块，还用于从所述目标描述信息中，获取所述目标对象的图像的目标分类特征表示和所述文本信息的目标文本特征表示；

预测模块，用于将所述目标分类特征表示和所述目标文本特征表示输入所述目标对象预测模型中对所述目标对象进行预测，以生成所述目标对象的目标预测数量。

15.一种电子设备，包括：

至少一个处理器；以及

与所述至少一个处理器通信连接的存储器；其中，

所述存储器存储有可被所述至少一个处理器执行的指令，所述指令被所述至少一个处理器执行，以使所述至少一个处理器能够执行权利要求1-7中任一项所述的方法。

16.一种存储有计算机指令的非瞬时计算机可读存储介质，其中，所述计算机指令用于使所述计算机执行根据权利要求1-7中任一项所述的方法。

17.一种计算机程序产品，包括计算机程序，所述计算机程序在被处理器执行时实现根据权利要求1-7中任一项所述的方法。