CN111353052B

CN111353052B - 一种多媒体对象推荐方法、装置、电子设备及存储介质

Info

Publication number: CN111353052B
Application number: CN202010096847.XA
Authority: CN
Inventors: 张水发
Original assignee: Beijing Dajia Internet Information Technology Co Ltd
Current assignee: Beijing Dajia Internet Information Technology Co Ltd
Priority date: 2020-02-17
Filing date: 2020-02-17
Publication date: 2023-11-21
Anticipated expiration: 2040-02-17
Also published as: CN111353052A

Abstract

本公开关于一种多媒体对象推荐方法、装置、电子设备及存储介质，涉及信息处理技术领域，包括：获得用户的用户特征，并获得参考多媒体对象的多媒体特征；根据所述用户特征和多媒体特征对所述参考多媒体对象进行类别预测；在第一预设分类次数大于1的情况下，对所述参考多媒体对象重新进行第二预设分类次数次类别预测；从多媒体对象库中，选择属于预测得到的类别、且基于特征相似度确定与所述参考多媒体相似的多媒体对象，并利用所选择的多媒体对象进行推荐。应用本公开实施例提供的方案，可以提高推荐的多媒体对象的准确率。

Description

一种多媒体对象推荐方法、装置、电子设备及存储介质

技术领域

本公开涉及信息处理技术领域，尤其涉及一种多媒体对象推荐方法、装置、电子设备及存储介质。

背景技术

为了向用户提供更优质的服务，各类应用软件通常会向用户推荐与其浏览过的多媒体对象所属的类别相同的多媒体对象。具体的，上述多媒体对象可以是视频、歌曲、文章等。例如，视频类软件通常会确定用户浏览过的视频所属的视频类别，然后向用户推荐上述所确定视频类别中的视频。

以上述多媒体对象为视频为例，相关技术中，工作人员一般会手动对视频数据库中存储的各个视频进行分类，例如：将视频数据库中存储的各个视频划分为武侠类、言情类、偶像类等。鉴于此，确定用户浏览过的视频所属的视频类别时，一般根据上述工作人员手动分类的结果确定用户浏览过的各个视频所属的视频类别。

然而，由于工作人员在对视频进行分类时，主观性较强，而且工作人员在对视频进行分类时一般仅仅考虑视频本身的属性，从而导致应用上述方式确定的用户浏览过的各个视频所属视频类别的准确率低。进一步的，在根据所确定的用户浏览过的视频所属的视频类别进行视频推荐时准确率低。

发明内容

本公开提供一种多媒体对象推荐方法、装置、电子设备及存储介质，以提高推荐的多媒体对象的准确率。本公开的技术方案如下：

根据本公开实施例的第一方面，提供一种多媒体对象推荐方法，所述方法包括：

获得用户的用户特征，并获得参考多媒体对象的多媒体特征，其中，所述参考多媒体对象为所述用户请求过的多媒体对象；

根据所述用户特征和多媒体特征对所述参考多媒体对象进行类别预测；

在第一预设分类次数大于1的情况下，对所述参考多媒体对象重新进行第二预设分类次数次类别预测，其中，每一次进行类别预测所依据的信息包括：上一次进行类别预测得到的类别和所述多媒体特征，所述第二预设分类次数等于所述第一预设分类次数减1；

从多媒体对象库中，选择属于预测得到的类别、且基于特征相似度确定与所述参考多媒体相似的多媒体对象，并利用所选择的多媒体对象进行推荐。

本公开的一个实施例中，所述根据所述用户特征和多媒体特征对所述参考多媒体对象进行类别预测，包括：

将所述用户特征与多媒体特征输入预先训练的类别预测模型，对所述参考多媒体对象进行类别预测；

所述对所述参考多媒体对象重新进行第二预设分类次数次类别预测，包括：

利用所述类别预测模型对所述参考多媒体对象重新进行第二预设分类次数次类别预测，其中，每一次进行类别预测时所述类别预测模型的输入信息包括：上一次进行类别预测时所述类别预测模型输出的类别和所述多媒体特征；

其中，所述类别预测模型为：以样本用户的样本用户特征和样本多媒体特征为模型输入信息、以所述样本多媒体对象所属的第一预设数量个具有不同优先级的标注类别为训练监督信息、对所述类别预测模型的初始模型进行训练、得到的用于预测多媒体对象所属类别的模型，所述样本多媒体特征为：所述样本用户请求过的样本多媒体对象的特征，所述第一预设数量的取值不小于所述第一预设分类次数的取值。

本公开的一个实施例中，通过以下方式训练得到所述类别预测模型：

获得样本用户的特征，作为样本用户特征，并获得所述样本用户请求过的样本多媒体对象的特征，作为样本多媒体特征；

获得所述样本多媒体对象所属的所述第一预设数量个标注类别，其中，各个标注类别具有不同的优先级；

将所述样本用户特征和样本多媒体特征输入所述初始模型，对所述样本多媒体对象进行类别预测；

在所述第一预设数量大于1的情况下，利用所述初始模型对所述样本多媒体对象进行第二预设数量次类别预测，其中，每一次进行类别预测时所述初始模型的输入信息包括：上一次进行类别预测时所述初始模型输出的类别和所述样本多媒体特征，所述第二预设数量等于所述第一预设数量减1；

基于依次预测得到的类别相对于所获得的标注类别的差异，对所述初始模型进行参数调整，实现模型训练，得到所述类别预测模型。

本公开的一个实施例中，所述获得所述样本多媒体对象所属的所述第一预设数量个标注类别，包括：

获得所述样本多媒体对象所属的类别；

在具有所述样本用户特征的用户中，统计各个类别对应的用户数量，其中，每一类别对应的用户数量为：具有所述样本用户特征的用户中认为所述样本多媒体对象属于该类别的用户数量；

选择对应的用户数量最多的、所述第一预设数量个类别作为标注类别，其中，各个标注类别的优先级按照：各个标注类别对应的用户数量由多到少的顺序依次降低。

本公开的一个实施例中，所述获得用户的用户特征，包括：

获得用户的注册信息，根据所述注册信息确定所述用户所属的类别，作为所述用户的用户特征。

根据本公开实施例的第二方面，提供一种多媒体对象推荐装置，所述装置包括：

特征获得模块，用于获得用户的用户特征，并获得参考多媒体对象的多媒体特征，其中，所述参考多媒体对象为所述用户请求过的多媒体对象；

第一类别预测模块，用于根据所述用户特征和多媒体特征对所述参考多媒体对象进行类别预测；

第二类别预测模块，用于在第一预设分类次数大于1的情况下，对所述参考多媒体对象重新进行第二预设分类次数次类别预测，其中，每一次进行类别预测所依据的信息包括：上一次进行类别预测得到的类别和所述多媒体特征，所述第二预设分类次数等于所述第一预设分类次数减1；

对象推荐模块，用于从多媒体对象库中，选择属于预测得到的类别、且基于特征相似度确定与所述参考多媒体相似的多媒体对象，并利用所选择的多媒体对象进行推荐。

本公开的一个实施例中，所述第一类别预测模块，具体用于：

所述第二类别预测模块，具体用于：

本公开的一个实施例中，所述装置还包括模型训练模块，所述模型训练模块用于训练得到所述类别预测模型，所述模型训练模块包括：

样本特征获得单元，用于获得样本用户的特征，作为样本用户特征，并获得所述样本用户请求过的样本多媒体对象的特征，作为样本多媒体特征；

标注类别获得单元，用于获得所述样本多媒体对象所属的所述第一预设数量个标注类别，其中，各个标注类别具有不同的优先级；

第一模型训练单元，用于将所述样本用户特征和样本多媒体特征输入所述初始模型，对所述样本多媒体对象进行类别预测；

第二模型训练单元，用于在所述第一预设数量大于1的情况下，利用所述初始模型对所述样本多媒体对象进行第二预设数量次类别预测，其中，每一次进行类别预测时所述初始模型的输入信息包括：上一次进行类别预测时所述初始模型输出的类别和所述样本多媒体特征，所述第二预设数量等于所述第一预设数量减1；

参数调整单元，用于基于依次预测得到的类别相对于所获得的标注类别的差异，对所述初始模型进行参数调整，实现模型训练，得到所述类别预测模型。

本公开的一个实施例中，所述标注类别获得单元，具体用于：

获得所述样本多媒体对象所属的类别；

本公开的一个实施例中，所述特征获得模块，具体用于：

获得用户的注册信息，根据所述注册信息确定所述用户所属的类别，作为所述用户的用户特征，并获得参考多媒体对象的多媒体特征，其中，所述参考多媒体对象为所述用户请求过的多媒体对象。

根据本公开实施例的第三方面，提供一种电子设备，包括：

处理器；

用于存储所述处理器可执行指令的存储器；

其中，所述处理器被配置为执行所述指令，以实现如第一方面中任一项所述的多媒体对象推荐方法。

根据本公开实施例的第四方面，提供一种存储介质，当所述存储介质中的指令由电子设备的处理器执行时，使得电子设备能够执行如第一方面中任一项所述的多媒体对象推荐方法。

本公开的实施例提供的技术方案至少带来以下有益效果：

由上述的技术方案可见，应用本公开实施例提供的方案进行多媒体对象推荐时，首先获得用户的用户特征，并获得参考多媒体对象的多媒体特征，根据用户特征和多媒体特征对参考多媒体对象进行类别预测，在第一预设分类次数大于1的情况下，对参考多媒体对象重新进行第二预设分类次数次类别预测，从多媒体对象库中，选择属于预测得到的类别、且基于特征相似度确定与参考多媒体相似的多媒体对象，并利用所选择的多媒体对象进行推荐。由于本公开实施例提供的方案在获得参考多媒体所属的类别时，既考虑了用户的用户特征，又考虑了用户所选中多媒体对象的多媒体特征，根据两类特征进行类别预测，得到多媒体对象所属的类别。可见，本方案在获得参考多媒体所属类别时，考虑的信息种类丰富，不再单一，因此可以提高获得的类别的准确率。进而，在根据所获得类别进行多媒体对象推荐时，可以提高推荐的多媒体对象的准确率。

应当理解的是，以上的一般描述和后文的细节描述仅是示例性和解释性的，并不能限制本公开。

附图说明

此处的附图被并入说明书中并构成本说明书的一部分，示出了符合本公开的实施例，并与说明书一起用于解释本公开的原理，并不构成对本公开的不当限定。

图1是根据一示例性实施例示出的一种多媒体对象推荐方法的流程示意图。

图2是根据一示例性实施例示出的一种视频封面图像的示意图。

图3是根据一示例性实施例示出的另一种多媒体对象推荐方法的流程示意图。

图4是根据一示例性实施例示出的一种多媒体对象类别获得过程的示意图。

图5为本公开实施例提供的一种类别预测模型训练方法的流程示意图。

图6为本公开实施例提供的另一种类别预测模型训练方法的流程示意图。

图7为本公开实施例提供的一种多媒体对象推荐装置的结构示意图。

图8是根据一示例性实施例示出的一种电子设备的结构示意图。

具体实施方式

为了使本领域普通人员更好地理解本公开的技术方案，下面将结合附图，对本公开实施例中的技术方案进行清楚、完整地描述。

需要说明的是，本公开的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象，而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换，以便这里描述的本公开的实施例能够以除了在这里图示或描述的那些以外的顺序实施。以下示例性实施例中所描述的实施方式并不代表与本公开相一致的所有实施方式。相反，它们仅是与如所附权利要求书中所详述的、本公开的一些方面相一致的装置和方法的例子。

图1是根据一示例性实施例示出的一种多媒体对象推荐方法的流程示意图，上述方法可以应用于客户端，如提供视频的视频软件、提供音频的音频软件、提供小说的小说软件等，上述方法也可以应用于运行有上述客户端的电子设备，如台式计算机、笔记本电脑、智能手机等。如图1所示，多媒体对象推荐方法包括以下步骤101-步骤104。

步骤101，获得用户的用户特征，并获得参考多媒体对象的多媒体特征。

其中，用户特征可以是用户所属的类别，上述类别可以是按照年龄段划分的类别，如青少年、青年、中年等，上述类别也可以是按照工作划分的类别，如教师、医生、作家等。

参考多媒体对象为用户请求过的多媒体对象。上述多媒体对象可以是视频、音频、小说等。对于视频而言，上述多媒体特征可以是视频的封面图像、出品公司、发行时间等；对于小说而言，上述多媒体特征可以是标题、作者、出版方等。其中，用户请求过的多媒体对象可以是用户在对媒体对象浏览页面点击过的多媒体对象，也可以是用户在搜索页面搜索过的多媒体对象等。

本公开的一个实施例中，可以在获取用户授权的情况下，获取用户特征和多媒体特征。具体的，可以在交互界面中弹出授权请求窗口，在用户选择确认授权的情况下，可以获取用户的用户特征和参考多媒体对象的多媒体特征。其中，可以在每次进行多媒体对象推荐时请求获取授权，也可以在首次进行多媒体对象推荐时请求获取授权，这样可以避免每次进行多媒体对象推荐时进行授权请求，节省由于请求授权带来的资源消耗，提高推荐效率。

本公开的一个实施例中，可以获得用户的注册信息，根据注册信息确定用户所属的类别，作为用户的用户特征。

具体的，在获得用户授权的情况下，可以获得用户的注册信息。其中，注册信息可以包括年龄、性别、工作等信息。例如，根据用户的年龄，可以确定用户所属的类别为青少年、青年、中年、老年等；根据用户的工作，可以确定用户所属的类别为学生、教师、职员、工人等。将所确定出的用户所属的类别作为上述用户特征。这样获得用户特征的方式简便快捷，而且获得的用户特征准确率高。

本公开的一个实施例中，还可以根据用户所浏览的多媒体对象，确定用户所属的类别，作为用户特征。具体的，可以获得用户所浏览过的多媒体对象所属的类别，根据上述多媒体对象所属的类别和各个类别所占的比重，确定用户感兴趣的多媒体对象的类别，进而确定用户的类别，作为用户特征。

其中，上述所浏览过的多媒体对象可以是用户在预设期间内浏览过的多媒体对象，上述预设期间可以是自当前时刻起前一周时间的期间，也可以是自当前时刻起前一个月时间的期间。上述所浏览过的多媒体对象也可以是用户自最近浏览过的多媒体对象起之前浏览过的第三预设数量个多媒体对象，上述第三预设数量可以是50、100、200等。上述各个类别所占的比重可以是各个类别的多媒体对象的浏览次数的比值。

以上述多媒体对象为视频为例，可以获得用户自当前时刻起前三个月时间内浏览过的所有视频所属的类别，假设所获得的类别有武侠类和言情类，其中，属于武侠类的视频的浏览次数为10次，属于言情类视频的浏览次数为3次，则可以确定用户的类别为武侠爱好者，并作为上述用户的用户特征。

本公开的一个实施例中，在获得参考多媒体对象的多媒体特征时，可以根据客户端的浏览记录，确定用户所请求过的参考多媒体对象，进而获得参考多媒体对象的多媒体特征。

具体的，在确定参考多媒体对象后，可以获得参考多媒体的发行时间、发行地区、封面图像、多媒体对象名称等信息，作为多媒体特征。

例如，在视频软件中，会保存用户所浏览过的视频的历史记录，根据历史记录可以确定用户所点击的视频，进而可以确定上述视频的封面图像，作为上述视频的多媒体特征。

本公开的一个实施例中，还可以根据服务端保存的浏览记录，确定用户所请求过的参考多媒体对象，进而获得参考多媒体对象的多媒体特征。还可以根据用户当前点击的参考多媒体对象，确定参考多媒体对象的多媒体特征。

步骤102，根据用户特征和多媒体特征对参考多媒体对象进行类别预测。

具体的，结合用户特征和多媒体特征，对参考多媒体对象进行类别预测，可以得到参考多媒体对象所属的类别。同一参考多媒体对象，可能属于多个类别。对于不同类别的用户而言，参考多媒体对象所属的类别可能不同，这种情况下，当用户特征不同时，预测得到的参考多媒体对象所属的类别也不同。

参见图2，假设参考多媒体对象为视频，图2为该视频的封面图像。该封面图像中有行人、河流、欧式建筑等，也就是，从该视频的封面图像的属性上来划分，该视频所属的类别可以是行人类、河流类、欧式建筑类等。但是对于不同类别的用户来讲，关注点可能不同，例如，对于青少年，关注点在于河流，对于中年人，关注点在于欧式建筑，对于老年人，关注点在于行人。也就是，当用户特征为青少年、多媒体特征为该视频的封面图像时，预测得到的上述视频所属的类别为河流；当用户特征为中年人、多媒体特征为该视频的封面图像时，预测得到的上述视频所属的类别为欧式建筑。

步骤103，在第一预设分类次数大于1的情况下，对参考多媒体对象重新进行第二预设分类次数次类别预测。

其中，每一次进行类别预测所依据的信息包括：上一次进行类别预测得到的类别和多媒体特征，第二预设分类次数等于第一预设分类次数减1。第一预设分类次数的取值可以是1、3、6、8等。

具体的，在第一预测分类次数大于1的情况下，首先，根据用户特征和多媒体特征对参考多媒体对象进行类别预测，得到第一类别；根据第一类别和多媒体特征，对参考多媒体对象进行类别预测，得到第二类别；将第一类别更新为第二类别，返回执行根据第一类别和多媒体特征、对参考多媒体对象进行类别预测、得到第二类别的步骤，直至对参考多媒体对象进行类别预测的次数达到第一预设分类次数。

例如，假设第一预设分类次数为3，这种情况下，对参考多媒体对象重新进行2次类别预测。第1次类别预测时，根据用户特征和多媒体特征对参考多媒体对象进行类别预测，得到类别1；第2次类别预测时，根据类别1和多媒体特征对参考多媒体对象进行类别预测，得到类别2；第3次类别预测时，根据类别2和多媒体特征对参考多媒体对象进行类别预测，得到类别3。

本公开的一个实施例中，可以按照各个类别的获得顺序，确定每一类别作为参考多媒体对象所属类别的优先级。具体的，可以是获得顺序靠前的类别，其优先级越高，获得顺序靠后的类别，其优先级越低。

其中，上述各个类别作为参考多媒体对象所属类别的优先级可以理解为参考多媒体对象被认为属于各个类别的概率。对于一个类别而言，参考多媒体对象被认为属于该类别的概率越高，则该类别的优先级越高。

例如，假设依次获得类别1、类别2、类别3，则其中优先级最高的类别为类别1，优先级最低的类别为类别3。

步骤104，从多媒体对象库中，选择属于预测得到的类别、且基于特征相似度确定与参考多媒体相似的多媒体对象，并利用所选择的多媒体对象进行推荐。

本公开的一个实施例中，可以首先从多媒体对象库中，选择属于预测得到的类别的候选多媒体对象，再基于特征相似度，从候选多媒体对象中确定与参考多媒体对象相似的多媒体对象，并根据所确定的多媒体对象进行推荐。

本公开的一个实施例中，还可以首先基于特征相似度，从多媒体对象库中选择与参考多媒体对象相似的候选多媒体对象，再从候选多媒体对象中，确定属于预测得到的类别的多媒体对象，并根据所确定的多媒体对象进行推荐。

本公开的一个实施例中，在基于特征相似度确定与参考多媒体相似的多媒体对象，可以计算各个多媒体对象与参考多媒体对象的特征相似度，选择特征相似度大于预设的相似度阈值的多媒体对象为与参考多媒体相似的多媒体对象，还可以选择特征相似度最高的预设数量个多媒体对象为与参考多媒体相似的多媒体对象。

其中，可以通过计算多媒体对象的特征和参考多媒体对象的多媒体特征之间的欧氏距离、汉明距离、余弦相似度等，确定多媒体对象与参考多媒体对象之间的特征相似度。

本公开的一个实施例中，在获得的各个类别具有不同优先级的情况下，可以根据优先级选择待进行多媒体推荐的多媒体对象。具体的，可以预先设定针对每一优先级的类别进行推荐的多媒体对象的预设推荐数量，从多媒体对象库中，选择属于该类别、且基于特征相似度确定与参考多媒体相似的、预设推荐数量个多媒体对象。

例如，假设针对优先级最高的第一类别进行推荐的多媒体对象的预设推荐数量为5，针对优先级较低的第二类别进行推荐的多媒体对象的预设推荐数量为2，则从多媒体对象库中，选择属于第一类别、且基于特征相似度确定与参考多媒体相似的5个多媒体对象，以及属于第二类别、且基于特征相似度确定与参考多媒体相似的2个多媒体对象。

本公开的一个实施例中，在向用户进行多媒体对象推荐时，可以优先向用户推荐属于较高优先级的类别的多媒体对象。具体的，在向用户展示推荐的多媒体对象时，可以根据各个待展示的多媒体对象所属类别的优先级，确定各个多媒体对象在展示页面上的展示位置。

例如，可以按照所属类别优先级由高到低的顺序，在展示页面上由左到右依次展示各个待展示的多媒体对象。

这样可以针对性地根据不同优先级的类别进行多媒体对象推荐，可以使得推荐的多媒体对象种类丰富，不再单调，给用户带来更好的体验。

参见图3，本公开的一个实施例中，对于上述步骤102和103，可以利用类别预测模型，对参考多媒体对象进行类别预测。

其中，类别预测模型为：以样本用户的样本用户特征和样本多媒体特征为模型输入信息、以样本多媒体对象所属的第一预设数量个具有不同优先级的标注类别为训练监督信息、对类别预测模型的初始模型进行训练、得到的用于预测多媒体对象所属类别的模型，样本多媒体特征为：样本用户请求过的样本多媒体对象的特征，第一预设数量的取值不小于第一预设分类次数的取值。

上述初始模型可以是LSTM(Long Short-Term Memory，长短期记忆网络)模型，也可以是RNN(Recurrent Neural Network，循环神经网络)模型等，本公开并不对此进行限定。

具体参见如下步骤1021和1031：

步骤1021，将用户特征与多媒体特征输入预先训练的类别预测模型，对参考多媒体对象进行类别预测。

具体的，将用户特征和多媒体特征输入类别预测模型，得到输出结果，将输出结果作为参考多媒体对象所属的类别。

例如，在参考多媒体对象为视频、多媒体特征为视频的封面图像的情况下，将用户特征和封面图像输入类别预测模型，对封面图像进行分类，得到封面图像所属的类别，作为上述视频所属的类别。

步骤1031，在第一预设分类次数大于1的情况下，利用类别预测模型对参考多媒体对象重新进行第二预设分类次数次类别预测。

其中，每一次进行类别预测时所述类别预测模型的输入信息包括：上一次进行类别预测时所述类别预测模型输出的类别和所述多媒体特征。

具体的，参见图4，在第一预测分类次数大于1的情况下，首先，将用户特征和多媒体特征输入类别预测模型，得到模型输出的第一类别；再将第一类别和多媒体特征输入类别预测模型，得到模型输出的第二类别；将第一类别更新为第二类别，返回执行再将第一类别和多媒体特征输入类别预测模型、得到模型输出的第二类别的步骤，直至对参考多媒体对象进行类别预测的次数达到第一预设分类次数。上述类别预测模型每进行一次分类，可以得到一个参考多媒体对象所属的类别，上述对参考多媒体对象进行第一预设分类次数次分类，则可以得到第一预设分类次数个类别。

本公开的一个实施例中，可以按照得到的各个类别的输出顺序，设定各个类别作为参考多媒体对象所属类别的优先级，并将设定优先级后的类别确定为参考多媒体对象所属的类别。

例如，在参考多媒体对象为视频、多媒体特征为视频的封面图像的情况下，将用户特征和封面图像输入类别预测模型，对该封面图像进行类别预测，得到第一类别，记作P1；再将得到的第一类别和该封面图像再次输入上述类别预测模型，对该封面图像再次进行类别预测，得到第二类别，记作P2；此时，再将第一类别更新为第二类别，再一次将第一类别和该封面图像输入上述类别预测模型，得到第二类别，记作P3……直到分类次数达到第一预设分类次数。此时得到P1、P2……Pn第一预设分类次数个分类结果，按照各个分类结果的输出顺序，设定各个分类结果的优先级，即P1优先级最高，P2的优先级为P1的优先级对应的下一优先级，最后将设定优先级后的分类结果作为参考多媒体对象所属的类别。

由上述实施例提供的方案可以得到参考多媒体对象所属的多个类别，并且不同的类别之间存在优先级差异，这样得到的类别种类不再单一，更加丰富。基于此，在根据类别向用户做多媒体对象推荐时，可以依据不同类别之间的优先级顺序向用户推荐不同的对象。

参见图5，图5为本公开实施例提供的一种类别预测模型训练方法的流程示意图，该方法包括如下步骤501至步骤：

步骤501，获得样本用户的特征，作为样本用户特征，并获得样本用户请求过的样本多媒体对象的特征，作为样本多媒体特征。

此处获得样本用户的样本用户特征、样本多媒体对象的样本多媒体特征的方法同上述步骤101中获得用户特征、多媒体特征的方法相同，在此不做赘述。

步骤502，获得样本多媒体对象所属的第一预设数量个标注类别。

其中，各个标注类别具有不同的优先级。标注类别为用于对样本多媒体特征进行标注的、样本多媒体对象所属的类别。例如，当样本多媒体对象为视频、样本多媒体特征为视频的封面图像时，以上述图2为例，封面图像所属的类别可以为行人类、河流类、欧式建筑类。

由于类别预测模型在训练阶段使用的样本多媒体对象所属的标注类别数量是第一预设数量，基于此训练得到的类别预测模型在使用阶段，同样可以得到第一预设数量个多媒体对象所属的类别。在本公开实施例提供的方案中，该类别预测模型在实际使用阶段，需要对参考多媒体对象进行第一预设分类次数次类别预测，为保证得到的类别的准确度，第一预设数量的取值大于或等于第一预设分类次数的取值。例如，假设第一预设分类次数的取值为3，则第一预设数量则可以是1、2、3等。

本公开的一个实施例中，在获得上述标注类别时，可以由工作人员对样本多媒体对象进行分类，将样本多媒体对象分为第一预设数量个类别，进而得到第一预设数量个标注类别。

本公开的一个实施例中，在获得上述标注类别时，还可以将样本多媒体特征输入预先训练完成的特征分类模型中，得到第一预设数量个类别，作为样本多媒体对象所属的标注类别。

其中，上述特征分类模型可以是RNN模型，也可以是CNN(ConvolutionalNeuralNetworks，卷积神经网络)模型。上述特征分类模型可以以样本多媒体特征为输入、样本多媒体对象所属类别的标注为监督、对初始模型进行训练进行训练得到。

本公开的一个实施例中，对于获得的第一预设数量个标注类别，可以由人工为各个标注类别设定优先级。

步骤503，将样本用户特征和样本多媒体特征输入初始模型，对样本多媒体对象进行类别预测。

具体的，以样本用户特征和样本多媒体特征为输入信息，输入初始模型，上述初始模型对输入信息进行处理，输出对样本多媒体对象进行类别预测的第一样本类别。

步骤504，在第一预设数量大于1的情况下，利用初始模型对样本多媒体对象进行第二预设数量次类别预测。

其中，每一次进行类别预测时初始模型的输入信息包括：上一次进行类别预测时初始模型输出的类别和样本多媒体特征，第二预设数量等于第一预设数量减1。

具体的，在第一预测数量大于1的情况下，首先，以样本用户特征和样本多媒体特征为输入信息，输入初始模型，得到模型输出的第一样本类别；再将第一样本类别和样本多媒体特征作为输入信息，输入初始模型，得到模型输出的第二样本类别；将第一样本类别更新为第二样本类别，返回执行再将第一样本类别和样本多媒体特征作为输入信息、输入初始模型、得到模型输出的第二样本类别的步骤，直至对样本多媒体对象进行第一预设数量次类别预测。

上述初始模型每进行一次类别预测，可以得到一个样本多媒体对象所属的样本类别，上述对样本多媒体对象进行第一预设数量次分类，则可以得到第一预设数量个类别。

步骤505，基于依次预测得到的类别相对于所获得的标注类别的差异，对初始模型进行参数调整，实现模型训练，得到类别预测模型。

具体的，可以确定依次得到的第一预设数量个类别相对第一预设数量个标注类别的差异，依据上述差异对初始模型的参数进行调整。利用参数调整后的模型，反复执行上述步骤，实现对模型的多次训练。直至达到预设的训练次数，或者模型输出的类别与标注类别之间的差异小于预设的差异阈值，也就是，认为上述模型收敛，结束对上述模型的训练。将训练后的模型作为类别预测模型。本公开的一个实施例中，上述差异可以通过计算输出的类别与标注类别之间的欧氏距离、余弦相似度、对比损失等确定。

例如，假设第一预设数量为3，依次得到的3个输出的类别为：[S1 S2 S3]，其中，S1表示模型第一次输出的类别，S2表示第二次输出的类别，S3表示第三次输出的类别；3个标注类别为：[Z1 Z2 Z3]，其中，Z1表示优先级最高的标注类别，Z2表示第二优先级的标注类别，Z3表示优先级最低的标注类别。可以计算[S1 S2 S3]相对[Z1 Z2 Z3]的差异，基于计算得到的差异对模型进行参数调整，实现模型训练。

参见图6，本公开的一个实施例中，对于上述步骤502，可以通过如下步骤5021至步骤5023获得第一预设数量个具有不同优先级的标注类别：

步骤5021，获得样本多媒体对象所属的类别。

具体的，可以获得第三预设数量个多媒体对象所属的类别，其中，由于要获得第一预设数量个标注类别，因此上述第三预设数量的取值不小于第一预设数量的取值，在最终的第三预设数量个类别中选择第一预设数量个类别作为标注类别。

步骤5022，在具有样本用户特征的用户中，统计各个类别对应的用户数量。

其中，每一类别对应的用户数量为：具有样本用户特征的用户中认为样本多媒体对象属于该类别的用户数量。具有样本用户特征的用户，其用户特征与上述样本用户特征相同。具体的，在以用户所属的类别为用户特征的情况下，上述具有样本用户特征的用户为：属于同一类别的用户。

例如，假设样本多媒体对象为视频，所属的类别为武侠，样本用户特征为青少年，则该类别对应的用户数量为：青少年的用户中认为该视频为武侠类视频的用户数量。

上述每一标注类别对应的用户数量可以通过调差问卷的形式得到。具体的，针对一个样本多媒体对象而言，在得到第一预设数量的标注类别后，由第四预设数量的用户对各个标注类别进行投票，得到每一标注类别对应的票数，进而得到每一标注类别对应的用户数量。其中，上述第四预设数量可以是100、500、1000等。

上述每一标注类别对应的用户数量还可以通过挖掘用户的浏览行为得到。具体的，针对一个样本多媒体对象的一个标注类别而言，将上述样本多媒体对象与第五预设数量个属于同一标注类别的样本多媒体对象共同展示给用户，当用户浏览展示出的样本用户特征时，如果选择了该样本多媒体对象，则确认该用户认为该样本多媒体对象属于该标注类别，进而对认为该样本多媒体对象属于该标注类别的用户进行统计，得到每一标注类别对应的用户数量。其中，上述第五预设数量可以是10、50、100等。

步骤5023，选择对应的用户数量最多的、第一预设数量个类别作为标注类别。

其中，各个标注类别的优先级按照：各个标注类别对应的用户数量由多到少的顺序依次降低。

具体的，按照各个标注类别对应的用户数量由高到低的顺序，获得样本多媒体对象属于各个标注类别由高到低的优先级。例如，标注类别1对应的用户数量为100，标注类别2对应的用户数量为150，则标注类别2的优先级高于标注类别1的优先级。

本公开的一个实施例中，在统计每一标注类别对应的用户数量时，用户可能存在误操作，这类用户数量不具有参考意义；或者某一标注类别对应的用户数量过小，认为该样本多媒体对象属于该标注类别的概率过低，因此，在获得标注类别时，选择优先级较高的第一预设数量个标注类别，对优先级过低的标注类别进行清除。

本公开的一个实施例中，当仅需要获得参考多媒体对象所属的一个类别时，可以仅采用类别预测模型对参考多媒体对象进行一次类别预测。

这种情况下，获得参考多媒体对象所属的类别时，可以将用户特征与多媒体特征输入预先训练的类别预测模型，对参考多媒体对象进行类别预测，得到一个参考多媒体对象所属的类别。

假设上述参考多媒体对象为视频，多媒体特征为视频的封面图像，可以将用户特征与封面图像输入类别预测模型，得到一个输出结果，上述输出结果即为该封面图像所属的类别，并将该类别作为上述视频所属的类别。

本公开的一个实施例中，上述类别预测模型可以通过以下方式训练得到：

获得样本用户的用户特征，作为样本用户特征；并获得样本用户请求过的样本多媒体对象的特征，作为样本多媒体特征；获得样本多媒体对象所属的1个标注类别；以以样本用户特征和样本多媒体特征为输入信息、以标注类别为训练监督信息，对初始模型进行训练，得到类别预测模型。

参见图7，图7为本公开实施例提供的一种多媒体对象推荐装置的结构示意图，所述装置包括：

特征获得模块701，用于获得用户的用户特征，并获得参考多媒体对象的多媒体特征，其中，所述参考多媒体对象为所述用户请求过的多媒体对象；

第一类别预测模块702，用于根据所述用户特征和多媒体特征对所述参考多媒体对象进行类别预测；

第二类别预测模块703，用于在第一预设分类次数大于1的情况下，对所述参考多媒体对象重新进行第二预设分类次数次类别预测，其中，每一次进行类别预测所依据的信息包括：上一次进行类别预测得到的类别和所述多媒体特征，所述第二预设分类次数等于所述第一预设分类次数减1；

对象推荐模块704，用于从多媒体对象库中，选择属于预测得到的类别、且基于特征相似度确定与所述参考多媒体相似的多媒体对象，并利用所选择的多媒体对象进行推荐。

本公开的一个实施例中，所述第一类别预测模块702，具体用于：

所述第二类别预测模块703，具体用于：

获得所述样本多媒体对象所属的类别；

本公开的一个实施例中，所述特征获得模块701，具体用于：

图8是根据一示例性实施例示出的一种电子设备框图，应用于应用软件。参照图8，该电子设备包括处理器801、通信接口802、存储器803和通信总线804，其中，处理器801，通信接口802，存储器803通过通信总线804完成相互间的通信，

存储器803，用于存放计算机程序；

处理器801，用于执行存储器803上所存放的程序时，实现本公开提供的多媒体对象推荐方法。

上述电子设备提到的通信总线可以是外设部件互连标准(Peripheral ComponentInterconnect，PCI)总线或扩展工业标准结构(Extended Industry StandardArchitecture，EISA)总线等。该通信总线可以分为地址总线、数据总线、控制总线等。为便于表示，图中仅用一条粗线表示，但并不表示仅有一根总线或一种类型的总线。

通信接口用于上述电子设备与其他设备之间的通信。

存储器可以包括随机存取存储器(Random Access Memory，RAM)，也可以包括非易失性存储器(Non-Volatile Memory，NVM)，例如至少一个磁盘存储器。可选的，存储器还可以是至少一个位于远离前述处理器的存储装置。

上述的处理器可以是通用处理器，包括中央处理器(Central Processing Unit，CPU)、网络处理器(Network Processor，NP)等；还可以是数字信号处理器(Digital SignalProcessing，DSP)、专用集成电路(Application Specific Integrated Circuit，ASIC)、现场可编程门阵列(Field-Programmable Gate Array，FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。

在本公开提供的又一实施例中，还提供了一种计算机可读存储介质，该计算机可读存储介质内存储有计算机程序，上述计算机程序被处理器执行时实现上述任一多媒体对象推荐方法的步骤。

在本公开提供的又一实施例中，还提供了一种包含指令的计算机程序产品，当其在计算机上运行时，使得计算机执行上述实施例中任一多媒体对象推荐方法。

上述实施例提供的电子设备、可读存储介质以及计算机程序产品，可以快速准确地实现本公开实施例提供的多媒体对象推荐方法，与现有技术相比，应用上述实施例提供的多媒体对象推荐方案，考虑的信息种类丰富，不再单一，因此可以提高获得对象类别的准确度。

在上述实施例中，可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时，可以全部或部分地以计算机程序产品的形式实现。所述计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行所述计算机程序指令时，全部或部分地产生按照本公开实施例所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中，或者从一个计算机可读存储介质向另一个计算机可读存储介质传输，例如，所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(DSL))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。所述计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质，(例如，软盘、硬盘、磁带)、光介质(例如，DVD)、或者半导体介质(例如固态硬盘Solid State Disk(SSD))等。

需要说明的是，在本文中，诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来，而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

本说明书中的各个实施例均采用相关的方式描述，各个实施例之间相同相似的部分互相参见即可，每个实施例重点说明的都是与其他实施例的不同之处。尤其，对于装置实施例、电子设备实施例、计算机可读存储介质实施例以及计算机程序产品实施例而言，由于其基本相似于方法实施例，所以描述的比较简单，相关之处参见方法实施例的部分说明即可。

以上所述仅为本公开的较佳实施例而已，并非用于限定本公开的保护范围。凡在本公开的精神和原则之内所作的任何修改、等同替换、改进等，均包含在本公开的保护范围内。

Claims

1.一种多媒体对象推荐方法，其特征在于，所述方法包括：

按照各个类别的获得顺序，确定每一类别作为所述参考多媒体对象所属类别的优先级，根据各个类别的优先级从多媒体对象库中，选择属于预测得到的类别、且基于特征相似度确定与所述参考多媒体相似的多媒体对象，并利用所选择的多媒体对象进行推荐。

2.根据权利要求1所述的方法，其特征在于，

所述根据所述用户特征和多媒体特征对所述参考多媒体对象进行类别预测，包括：

3.根据权利要求2所述的方法，其特征在于，通过以下方式训练得到所述类别预测模型：

4.根据权利要求3所述的方法，其特征在于，所述获得所述样本多媒体对象所属的所述第一预设数量个标注类别，包括：

获得所述样本多媒体对象所属的类别；

5.根据权利要求1-4中任一项所述的方法，其特征在于，所述获得用户的用户特征，包括：

6.一种多媒体对象推荐装置，其特征在于，所述装置包括：

对象推荐模块，用于按照各个类别的获得顺序，确定每一类别作为所述参考多媒体对象所属类别的优先级，根据各个类别的优先级从多媒体对象库中，选择属于预测得到的类别、且基于特征相似度确定与所述参考多媒体相似的多媒体对象，并利用所选择的多媒体对象进行推荐。

7.根据权利要求6所述的装置，其特征在于，

所述第一类别预测模块，具体用于：

所述第二类别预测模块，具体用于：

8.根据权利要求7所述的装置，其特征在于，所述装置还包括模型训练模块，所述模型训练模块用于训练得到所述类别预测模型，所述模型训练模块包括：

9.根据权利要求8所述的装置，其特征在于，所述标注类别获得单元，具体用于：

获得所述样本多媒体对象所属的类别；

10.根据权利要求6-9中任一项所述的装置，其特征在于，所述特征获得模块，具体用于：

11.一种电子设备，其特征在于，包括：

处理器；

用于存储所述处理器可执行指令的存储器；

其中，所述处理器被配置为执行所述指令，以实现如权利要求1至5中任一项所述的多媒体对象推荐方法。

12.一种存储介质，其特征在于，当所述存储介质中的指令由电子设备的处理器执行时，使得电子设备能够执行如权利要求1至5中任一项所述的多媒体对象推荐方法。