CN112989115B

CN112989115B - 待推荐视频的筛选控制方法及装置

Info

Publication number: CN112989115B
Application number: CN202110153744.7A
Authority: CN
Inventors: 陈畅新; 钟艺豪; 李百川
Original assignee: Youmi Technology Co ltd
Current assignee: Youmi Technology Co ltd
Priority date: 2021-02-04
Filing date: 2021-02-04
Publication date: 2024-06-25
Anticipated expiration: 2041-02-04
Also published as: CN112989115A

Abstract

本发明公开了待推荐视频的筛选控制方法及装置，包括：提取目标视频的目标特征信息并确定其目标类别标签；从多个多类别集合中筛选包括目标类别标签的目标多类别集合并从目标多类别集合对应的视频集合中筛选与目标特征信息的匹配度满足预设匹配条件的至少一个视频得到第一视频集合；根据视频的哈希特征对第一视频集合包括的所有视频执行过滤操作得到第二视频集合，过滤操作用于从第一视频集合中过滤掉视频画面的内容重合度高于重合度阈值的视频；将第二视频集合包括的视频确定为目标视频的待推荐视频。可见，本发明能够自动过滤画面布局有差异但内容重合度较高的视频，提高筛选出的待推荐视频的有效性，有利于提高待推荐视频与用户需求的匹配度。

Description

待推荐视频的筛选控制方法及装置

技术领域

本发明涉及视频处理技术领域，尤其涉及一种待推荐视频的筛选控制方法及装置。

背景技术

随着电子信息的快速发展，短视频日渐火爆且相应的用户规模也日益扩大，用户不仅可以直接拍摄视频并进行剪辑发布，而且还能够基于已有视频的设计添加不同的创作元素(也称艺术效果)对已有视频进行再创作，例如用户可以对已有视频的画面、光度及编码等进行修改，这不仅能够丰富用户的日常生活，在一些情况下，还能够为用户带来一定的收益。由于越来越多的用户参与发布视频或对已有视频进行再创作，这导致在海量的视频数据库中存在大量重复或相关的视频，且为了提高用户黏性，需要根据用户观看的视频为其推荐相关视频。

实践发现，当前已有的相关视频推荐方法可以大致分为三种：第一种是基于协同过滤的推荐方法，具体是根据用户历史观看记录或相同类型的其它用户的观看记录进行相关视频的推荐，这种方法存在冷启动的问题，也即没有被用户观看过的视频将无法被推荐出来；第二种是基于视频内容的推荐方法，具体是提取视频帧的特征信息并根据目标视频的特征信息去比对数据库中的相关联特征，从而推荐相关视频，这种方法虽然避免了冷启动的问题，但是可能会推荐出内容完全一致的视频；第三种是根据视频的标签信息来计算视频间的相关度，但是由于视频标签信息的语义特征过于宽泛，且没有直接考虑视频内容本身，导致推荐出来的相关视频不能满足用户需求。

可见，当前的视频推荐方式存在筛选出的待推荐视频与用户需求匹配度低的问题。

发明内容

本发明提供了一种待推荐视频的筛选控制方法及装置，能够提高筛选出的待推荐视频与用户实际需求的匹配度。

本发明第一方面公开了一种待推荐视频的筛选控制方法，所述方法包括：

提取目标视频的目标特征信息，并确定所述目标视频的目标类别标签，所述目标特征信息用于表征所述目标视频的风格特征；

从预先生成的多个多类别集合中筛选包括所述目标类别标签的目标多类别集合，并从所述目标多类别集合对应的视频集合中筛选与所述目标特征信息的匹配度满足预设匹配条件的至少一个视频，得到第一视频集合；

根据确定出的所述目标视频的哈希特征以及所述第一视频集合中每个视频的哈希特征，对所述第一视频集合包括的所有视频执行过滤操作得到第二视频集合，所述过滤操作用于从所述第一视频集合包括的所有视频中过滤掉视频画面的内容重合度高于预先设定的重合度阈值的视频；

将所述第二视频集合包括的视频确定为所述目标视频的待推荐视频。

作为一种可选的实施方式，在本发明第一方面中，所述从预先生成的多个多类别集合中筛选包括所述目标类别标签的目标多类别集合之前，所述方法还包括：

将待推荐的原始视频集合中每个视频的视频标识、特征信息、哈希特征以及类别标签存储为该视频对应的信息集合；

根据预先确定出的类别标签关联关系，对存在关联关系的所有类别标签所属的信息集合执行集中存放操作，得到多个多类别集合；

其中，每个所述多类别集合包括存在关联关系的多个类别标签以及相应视频对应的信息集合中的内容。

作为一种可选的实施方式，在本发明第一方面中，所述根据预先确定出的类别标签关联关系，对存在关联关系的所有类别标签所属的信息集合执行集中存放操作，得到多个多类别集合之前，所述方法还包括：

生成类别标签关联关系；

其中，所述生成类别标签关联关系，包括：

将验证视频集合中每个验证视频输入预先训练好的类别识别模型，得到每个所述验证视频对应的多个类别标签，其中，每个所述验证视频存在与之对应的原始类别标签；

提取每个所述验证视频对应的所有类别标签中满足第一预设筛选条件的类别标签，得到每个所述验证视频对应的类别标签集合；

将所有所述验证视频中原始类别标签相同的所有验证视频确定为一个验证视频组，得到多个验证视频组；

筛选每个所述验证视频组中所有验证视频对应的类别标签集合所包括的所有类别标签中满足第二预设筛选条件的所有类别标签，得到每个所述验证视频组对应的类别标签集合；

分别建立每个所述验证视频组对应的类别标签集合所包括的多个类别标签之间的类别标签关联关系。

作为一种可选的实施方式，在本发明第一方面中，所述筛选每个所述验证视频组中所有验证视频对应的类别标签集合所包括的所有类别标签中满足第二预设筛选条件的所有类别标签，得到每个所述验证视频组对应的类别标签集合，包括：

对于每个所述验证视频组，统计该验证视频组中所有验证视频对应的类别标签集合中每个类别标签的标记数，并从该验证视频组中所有验证视频对应的类别标签集合所包括的所有类别标签中筛选标记数大于等于预设标记数阈值的所有类别标签，得到该验证视频组对应的类别标签集合。

作为一种可选的实施方式，在本发明第一方面中，所述根据确定出的所述目标视频的哈希特征以及所述第一视频集合中每个视频的哈希特征，对所述第一视频集合包括的所有视频执行过滤操作得到第二视频集合，包括：

根据所述目标视频的哈希特征以及所述第一视频集合中每个视频的哈希特征，对所述第一视频集合包括的所有视频执行第一过滤操作，得到过滤结果；

根据所述过滤结果包括的所有视频的哈希特征，对所述过滤结果包括的所有视频执行第二过滤操作，得到第二视频集合。

作为一种可选的实施方式，在本发明第一方面中，所述根据所述目标视频的哈希特征以及所述第一视频集合中每个视频的哈希特征，对所述第一视频集合包括的所有视频执行第一过滤操作，得到过滤结果，包括：

根据所述目标视频的哈希特征以及所述第一视频集合中每个视频的哈希特征，计算所述第一视频集合中每个视频与所述目标视频的汉明距离；

从所述第一视频集合中过滤与所述目标视频的汉明距离小于等于预设汉明距离阈值的所有视频，得到过滤结果。

作为一种可选的实施方式，在本发明第一方面中，所述根据所述过滤结果包括的所有视频的哈希特征，对所述过滤结果包括的所有视频执行第二过滤操作，得到第二视频集合，包括：

从所述过滤结果对应的所有剩余视频中选择未被选择过的其中一个视频，根据所述其中一个视频的哈希特征以及所述过滤结果对应的所有剩余视频中除所述其中一个视频之外的每个视频的哈希特征，计算所述过滤结果对应的所有剩余视频中除所述其中一个视频之外的每个视频与所述其中一个视频的汉明距离；

判断所述过滤结果对应的所有剩余视频中除所述其中一个视频之外的所有视频是否存在与所述其中一个视频的汉明距离小于等于所述预设汉明距离阈值的至少一个视频；

当判断结果为否时，触发执行所述的从所述过滤结果对应的所有剩余视频中选择未被选择过的其中一个视频，根据所述其中一个视频的哈希特征以及所述过滤结果对应的所有剩余视频中除所述其中一个视频之外的每个视频的哈希特征，计算所述过滤结果对应的所有剩余视频中除所述其中一个视频之外的每个视频与所述其中一个视频的汉明距离的操作，以及，触发执行所述的判断所述过滤结果对应的所有剩余视频中除所述其中一个视频之外的所有视频是否存在与所述其中一个视频的汉明距离小于等于所述预设汉明距离阈值的至少一个视频的操作；

当判断结果为是时，从所述过滤结果对应的所有剩余视频除所述其中一个视频之外的所有视频中过滤与所述其中一个视频的汉明距离小于等于所述预设汉明距离阈值的所有视频，以更新所述过滤结果对应的所有剩余视频，并触发执行所述的从所述过滤结果对应的所有剩余视频中选择未被选择过的其中一个视频，根据所述其中一个视频的哈希特征以及所述过滤结果对应的所有剩余视频中除所述其中一个视频之外的每个视频的哈希特征，计算所述过滤结果对应的所有剩余视频中除所述其中一个视频之外的每个视频与所述其中一个视频的汉明距离的操作，以及，触发执行所述的判断所述过滤结果对应的所有剩余视频中除所述其中一个视频之外的所有视频是否存在与所述其中一个视频的汉明距离小于等于所述预设汉明距离阈值的至少一个视频的操作；

当所述过滤结果对应的所有剩余视频中只存在一个未被选择过的视频时，将所述过滤结果对应的所有剩余视频确定为第二视频集合。

本发明第二方面公开了一种待推荐视频的筛选控制装置，所述装置包括：

提取模块，用于提取目标视频的目标特征信息，所述目标特征信息用于表征所述目标视频的风格特征；

确定模块，用于确定所述目标视频的目标类别标签；

第一筛选模块，用于从预先生成的多个多类别集合中筛选包括所述目标类别标签的目标多类别集合；

第二筛选模块，用于从所述目标多类别集合对应的视频集合中筛选与所述目标特征信息的匹配度满足预设匹配条件的至少一个视频，得到第一视频集合；

过滤模块，用于根据确定出的所述目标视频的哈希特征以及所述第一视频集合中每个视频的哈希特征，对所述第一视频集合包括的所有视频执行过滤操作得到第二视频集合，所述过滤操作用于从所述第一视频集合包括的所有视频中过滤掉视频画面的内容重合度高于预先设定的重合度阈值的视频；

所述确定模块，还用于将所述第二视频集合包括的视频确定为所述目标视频的待推荐视频。

作为一种可选的实施方式，在本发明第二方面中，所述装置还包括：

多类别集合生成模块，用于在所述第一筛选模块从预先生成的多个多类别集合中筛选包括所述目标类别标签的目标多类别集合之前，将待推荐的原始视频集合中每个视频的视频标识、特征信息、哈希特征以及类别标签存储为该视频对应的信息集合；以及，根据预先确定出的类别标签关联关系，对存在关联关系的所有类别标签所属的信息集合执行集中存放操作，得到多个多类别集合；

关联关系生成模块，用于生成类别标签关联关系；

其中，所述关联关系生成模块，包括：

输入子模块，用于将验证视频集合中每个验证视频输入预先训练好的类别识别模型，得到每个所述验证视频对应的多个类别标签，其中，每个所述验证视频存在与之对应的原始类别标签；

提取子模块，用于提取每个所述验证视频对应的所有类别标签中满足第一预设筛选条件的类别标签，得到每个所述验证视频对应的类别标签集合；

确定子模块，用于将所有所述验证视频中原始类别标签相同的所有验证视频确定为一个验证视频组，得到多个验证视频组；

筛选子模块，用于筛选每个所述验证视频组中所有验证视频对应的类别标签集合所包括的所有类别标签中满足第二预设筛选条件的所有类别标签，得到每个所述验证视频组对应的类别标签集合；

建立子模块，用于分别建立每个所述验证视频组对应的类别标签集合所包括的多个类别标签之间的类别标签关联关系。

作为一种可选的实施方式，在本发明第二方面中，所述筛选子模块筛选每个所述验证视频组中所有验证视频对应的类别标签集合所包括的所有类别标签中满足第二预设筛选条件的所有类别标签，得到每个所述验证视频组对应的类别标签集合的具体方式为：

作为一种可选的实施方式，在本发明第二方面中，所述过滤模块，包括：

第一过滤子模块，用于根据所述目标视频的哈希特征以及所述第一视频集合中每个视频的哈希特征，对所述第一视频集合包括的所有视频执行第一过滤操作，得到过滤结果；

第二过滤子模块，用于根据所述过滤结果包括的所有视频的哈希特征，对所述过滤结果包括的所有视频执行第二过滤操作，得到第二视频集合。

作为一种可选的实施方式，在本发明第二方面中，所述第一过滤子模块根据所述目标视频的哈希特征以及所述第一视频集合中每个视频的哈希特征，对所述第一视频集合包括的所有视频执行第一过滤操作，得到过滤结果的具体方式为：

作为一种可选的实施方式，在本发明第二方面中，所述第二过滤子模块根据所述过滤结果包括的所有视频的哈希特征，对所述过滤结果包括的所有视频执行第二过滤操作，得到第二视频集合的具体方式为：

本发明第三方面公开了另一种待推荐视频的筛选控制装置，所述装置包括：

存储有可执行程序代码的存储器；

与所述存储器耦合的处理器；

所述处理器调用所述存储器中存储的所述可执行程序代码，执行本发明第一方面公开的待推荐视频的筛选控制方法中的部分或全部步骤。

本发明第四方面公开了一种计算机存储介质，所述计算机存储介质存储有计算机指令，所述计算机指令被调用时，用于本发明第一方面公开的待推荐视频的筛选控制方法中的部分或全部步骤。

与现有技术相比，本发明实施例具有以下有益效果：

本发明实施例中，提取目标视频的目标特征信息并确定其目标类别标签；从多个多类别集合中筛选包括目标类别标签的目标多类别集合并从目标多类别集合对应的视频集合中筛选与目标特征信息的匹配度满足预设匹配条件的至少一个视频得到第一视频集合；根据视频的哈希特征对第一视频集合包括的所有视频执行过滤操作得到第二视频集合，过滤操作用于从第一视频集合中过滤掉视频画面的内容重合度高于重合度阈值的视频；将第二视频集合包括的视频确定为目标视频的待推荐视频。可见，本发明能够自动过滤画面布局有差异但内容重合度较高的视频，提高筛选出的待推荐视频的有效性，有利于提高待推荐视频与用户需求的匹配度。

附图说明

为了更清楚地说明本发明实施例中的技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1是本发明实施例公开的一种待推荐视频的筛选控制方法的流程示意图。

图2是本发明实施例公开的另一种待推荐视频的筛选控制方法的流程示意图；

图3是本发明实施例公开的一种基于待推荐视频的筛选控制装置的结构示意图；

图4是本发明实施例公开的另一种待推荐视频的筛选控制装置的结构示意图；

图5是本发明实施例公开的又一种待推荐视频的筛选控制装置的结构示意图。

具体实施方式

为了使本技术领域的人员更好地理解本发明方案，下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别不同对象，而不是用于描述特定顺序。此外，术语“包括”和“具有”以及它们任何变形，意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、装置、产品或设备没有限定于已列出的步骤或单元，而是可选地还包括没有列出的步骤或单元，或可选地还包括对于这些过程、方法、产品或设备固有的其他步骤或单元。

在本文中提及“实施例”意味着，结合实施例描述的特定特征、结构或特性可以包含在本发明的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例，也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地理解的是，本文所描述的实施例可以与其它实施例相结合。

本发明公开了一种待推荐视频的筛选控制方法及装置，能够自动过滤画面布局有差异但内容重合度较高的视频，提高筛选出的待推荐视频的有效性，有利于提高待推荐视频与用户需求的匹配度。以下分别进行详细说明。

实施例一(方法侧实施例)

请参阅图1，图1是本发明实施例公开的一种待推荐视频的筛选控制方法的流程示意图。其中，图1所描述的方法可以应用于控制装置中，可选的，该控制装置可以具体是控制设备，也可以是后台服务器，本发明实施例不做限定。如图1所示，该待推荐视频的筛选控制方法可以包括以下操作：

101、控制装置提取目标视频的目标特征信息，并确定目标视频的目标类别标签。

本发明实施例中，目标视频的目标特征信息用于表征目标视频的风格特征。需要说明的是，该目标视频可以是任一用户当前观看的视频，也可以是任一用户历史观看的视频，还可以是预先筛选出的为任一用户推荐的其中一个视频，本发明实施例不做限定。

本发明实施例中，目标视频的目标特征信息是通过预先构建好的特征提取模型提取得到的。若目标视频具有原始类别标签，则目标视频的目标类别标签可以为其原始类别标签，若目标视频没有原始类别标签，则目标视频的目标类别标签是通过预先构建好的类别识别模型识别得到的预测类别标签。可选的，构建特征提取模型及类别识别模型的过程可以具体如下：

利用预先训练好的三维机器学习模型进行特征提取模型的参数初始化，其中，特征提取模型包含特征提取层和特征融合层。特征提取层主要由三维的卷积层和三维的归一化层构成，用来同时提取输入视频的时间和空间维度的特征；此外，再构建一层全连接层，作为输入视频的类别标签的输出层，即类别识别模型(也可称为类别识别层)，该类别识别模型会输出m个概率值(m代表视频的类别标签个数)，即针对每个视频，该类别识别模型会输出m个类别标签分别对应的概率，表示视频属于该m个类别标签中每个类别标签的概率；

所有层经过参数初始化后，再利用视频数据集进行训练，从而完成特征提取模型和类别识别模型的训练。其中，类别识别模型输出的最高概率所对应的类别标签称为视频的预测类别标签。且特征提取模型输出的特征向量也即为类别识别模型的输入，该特征向量由三维的特征提取层进行特征提取后，再经过特征融合层来整合多帧的全局信息得到，因此，该特征向量足以表征视频风格和形式的信息。相较于二维的机器学习模型，三维机器学习模型不仅能够捕捉单帧图像的空间特征，还能捕捉视频帧序列在时间维度上的运动特征，从而提取出画面切换或三维旋转等运动信息，结合风格特征和运动特征，可以使得根据展示手法相同的视频间的特征向量计算得到的相关度得到提高，从而使得这类视频能够被筛选出来，有利于提高确定出的待推荐视频的全面性及准确性。

需要说明的是，在利用上述构建好的视频风格的特征提取模型和类别识别模型提取目标视频的目标特征信息和识别目标视频的目标类别标签之前，可以对从目标视频中提取的n个视频帧进行相应的预处理操作，具体为：将n个视频帧的每个视频帧统一缩放到固定大小并进行归一化处理。预处理后的视频帧在深度通道上进行拼接融合，再输入特征提取模型，从而得到用于表征目标视频的视频风格和运动信息的特征向量(也即上述目标特征信息)，该特征向量再经类别识别模型，得到目标视频的目标类别标签(也即预测类别标签)。

102、控制装置从预先生成的多个多类别集合中筛选包括目标类别标签的目标多类别集合，并从目标多类别集合对应的视频集合中筛选与目标特征信息的匹配度满足预设匹配条件的至少一个视频，得到第一视频集合。

本发明实施例中，每个多类别集合可以包括存在关联关系的多个类别标签、该多个类别标签对应的所有视频中每个视频唯一对应的视频标识以及每个视频的特征信息，还可以进一步包括每个视频的哈希特征，且每个视频的特征信息用于表征该视频的风格特征。其中，控制装置从目标多类别集合对应的视频集合中筛选与目标特征信息的匹配度满足预设匹配条件的至少一个视频，得到第一视频集合，可以包括：

控制装置计算目标视频的目标特征信息与目标多类别集合对应的视频集合中每个视频的特征信息的匹配度；

控制装置根据计算得到的所有匹配度从目标多类别集合对应的视频集合中筛选与目标视频的匹配度大于等于预设匹配度阈值的所有视频，得到第一视频集合；或者，

控制装置根据计算得到的所有匹配度，按照匹配度由高到底的顺序从目标多类别集合对应的视频集合中筛选k个视频，得到第一视频集合，其中，k为大于等于1的整数。

可选的，视频之间的匹配度可以具体为余弦距离，也可以具体为欧式距离等，本发明实施例不做限定。

103、控制装置根据确定出的目标视频的哈希特征以及第一视频集合中每个视频的哈希特征，对第一视频集合包括的所有视频执行过滤操作得到第二视频集合。

本发明实施例中，该过滤操作用于从第一视频集合包括的所有视频中过滤掉视频画面的内容重合度高于预先设定的重合度阈值的视频。其中，目标视频的哈希特征是通过以下方式确定出的：

在上述抽取的n个视频帧中，取前j个视频帧分别计算该j个视频帧中每个视频帧的哈希值，并将j个视频帧的哈希值按照视频帧的先后顺序进行拼接得到拼接哈希值，作为目标视频的哈希特征，其中，j为大于等于1且小于等于n的整数，优选的，控制装置可以抽取该目标视频的第2-4秒的第一帧，得到3个视频帧(也即j等于3)。由于部分相关视频新增了视频标题画面或特效，只抽取前两秒的视频帧会存在较大的误差，单独抽取一帧进行后续计算得到的相关视频的准确性较低，抽取过多的视频帧会导致计算量的增加，此外，由于部分相关视频的播放速度不同，通常为源视频的1.2-1.5倍，若抽取播放时间相对靠后的视频帧，会导致相关视频的播放画面区别较大，进而导致计算得到的相关视频存在较大误差，准确性较低，因此，本发明实施例优选第2-4秒的第一帧能够在增加少量计算量的同时提高确定出相关视频的准确性。

104、控制装置将第二视频集合包括的视频确定为目标视频的待推荐视频。

在一个可选的实施例中，在执行完毕步骤104之后，控制装置还可以执行以下操作：

控制装置获取与上述目标视频的观看用户对应的用户等级；

控制装置确定与用户等级相匹配的视频筛选方式，并根据确定出的视频筛选方式从上述第一视频集合中筛选相匹配的目标待推荐视频；

控制装置将上述目标待推荐视频推荐至观看用户对应的用户终端。

可见，该可选的实施例能够在确定出待推荐视频集合之后自动根据用户等级确定相匹配的视频筛选方式，进而根据相匹配的视频筛选方式推荐相应视频，实现了基于用户等级的视频个性化推荐。

在另一个可选的实施例中，控制装置根据确定出的目标视频的哈希特征以及第一视频集合中每个视频的哈希特征，对第一视频集合包括的所有视频执行过滤操作得到第二视频集合，可以包括：

控制装置根据目标视频的哈希特征以及第一视频集合中每个视频的哈希特征，对第一视频集合包括的所有视频执行第一过滤操作，得到过滤结果；

控制装置根据过滤结果包括的所有视频的哈希特征，对过滤结果包括的所有视频执行第二过滤操作，得到第二视频集合。

在该可选的实施例中，进一步可选的，控制装置根据目标视频的哈希特征以及第一视频集合中每个视频的哈希特征，对第一视频集合包括的所有视频执行第一过滤操作，得到过滤结果，可以包括：

控制装置根据目标视频的哈希特征以及第一视频集合中每个视频的哈希特征，计算第一视频集合中每个视频与目标视频的汉明距离；

控制装置从第一视频集合中过滤与目标视频的汉明距离小于等于预设汉明距离阈值的所有视频，得到过滤结果。

在该可选的实施例中，进一步可选的，控制装置根据过滤结果包括的所有视频的哈希特征，对过滤结果包括的所有视频执行第二过滤操作，得到第二视频集合，可以包括：

控制装置从过滤结果对应的所有剩余视频中选择未被选择过的其中一个视频，根据其中一个视频的哈希特征以及过滤结果对应的所有剩余视频中除其中一个视频之外的每个视频的哈希特征，计算过滤结果对应的所有剩余视频中除其中一个视频之外的每个视频与其中一个视频的汉明距离；

控制装置判断过滤结果对应的所有剩余视频中除其中一个视频之外的所有视频是否存在与其中一个视频的汉明距离小于等于预设汉明距离阈值的至少一个视频；

当判断结果为否时，控制装置执行上述的从过滤结果对应的所有剩余视频中选择未被选择过的其中一个视频，根据其中一个视频的哈希特征以及过滤结果对应的所有剩余视频中除其中一个视频之外的每个视频的哈希特征，计算过滤结果对应的所有剩余视频中除其中一个视频之外的每个视频与其中一个视频的汉明距离的操作，以及，执行上述的判断过滤结果对应的所有剩余视频中除其中一个视频之外的所有视频是否存在与其中一个视频的汉明距离小于等于预设汉明距离阈值的至少一个视频的操作；

当判断结果为是时，控制装置从过滤结果对应的所有剩余视频除其中一个视频之外的所有视频中过滤与其中一个视频的汉明距离小于等于预设汉明距离阈值的所有视频，以更新过滤结果对应的所有剩余视频，并执行上述的从过滤结果对应的所有剩余视频中选择未被选择过的其中一个视频，根据其中一个视频的哈希特征以及过滤结果对应的所有剩余视频中除其中一个视频之外的每个视频的哈希特征，计算过滤结果对应的所有剩余视频中除其中一个视频之外的每个视频与其中一个视频的汉明距离的操作，以及，执行上述的判断过滤结果对应的所有剩余视频中除其中一个视频之外的所有视频是否存在与其中一个视频的汉明距离小于等于预设汉明距离阈值的至少一个视频的操作；

当过滤结果对应的所有剩余视频中只存在一个未被选择过的视频时，控制装置将过滤结果对应的所有剩余视频确定为第二视频集合。

可见，该可选实施例还能够通过视频的哈希特征将视频对应的视频帧的高维特征映射至低维空间，由于视频播放画面(也即播放内容)相同或重合度高的视频帧具有高度相似的哈希特征，通过视频的哈希特征实现对初步确定出的视频集合中播放画面重复度较高的视频的过滤，有利于提高确定出的待推荐视频集合的有效性。

可见，本发明实施例能够自动过滤画面布局有差异但内容重合度较高的视频，提高筛选出的待推荐视频的有效性，有利于提高待推荐视频与用户需求的匹配度。此外，还能够在确定出待推荐视频集合之后自动根据用户等级确定相匹配的视频筛选方式，进而根据相匹配的视频筛选方式推荐相应视频，实现了基于用户等级的视频个性化推荐。此外，还能够通过视频的哈希特征将视频对应的视频帧的高维特征映射至低维空间，由于视频播放画面(也即播放内容)相同或重合度高的视频帧具有高度相似的哈希特征，通过视频的哈希特征实现对初步确定出的视频集合中播放画面重复度较高的视频的过滤，有利于提高确定出的待推荐视频集合的有效性。

实施例二(方法侧实施例)

请参阅图2，图2是本发明实施例公开的另一种待推荐视频的筛选控制方法的流程示意图。其中，图2所描述的方法可以应用于控制装置中，可选的，该控制装置可以具体是控制设备，也可以是后台服务器，本发明实施例不做限定。如图2所示，该待推荐视频的筛选控制方法可以包括以下操作：

201、控制装置生成类别标签关联关系。

202、控制装置将待推荐的原始视频集合中每个视频的视频标识、特征信息、哈希特征以及类别标签存储为该视频对应的信息集合。

本发明实施例中，若原始视频集合的某一视频本身存在原始类别标签，则该视频对应的信息集合中所包括的类别标签为该视频的原始类别标签，若该视频不存在原始类别标签，则该视频对应的信息集合中所包括的类别标签为该视频的预测类别标签。

203、控制装置根据预先确定出的类别标签关联关系，对存在关联关系的所有类别标签所属的信息集合执行集中存放操作，得到多个多类别集合。

204、控制装置提取目标视频的目标特征信息，并确定目标视频的目标类别标签。

本发明实施例中，目标视频的目标特征信息用于表征目标视频的风格特征。

205、控制装置从生成的多个多类别集合中筛选包括目标类别标签的目标多类别集合，并从目标多类别集合对应的视频集合中筛选与目标特征信息的匹配度满足预设匹配条件的至少一个视频，得到第一视频集合。

206、控制装置根据确定出的目标视频的哈希特征以及第一视频集合中每个视频的哈希特征，对第一视频集合包括的所有视频执行过滤操作得到第二视频集合。

本发明实施例中，该过滤操作用于从第一视频集合包括的所有视频中过滤掉视频画面的内容重合度高于预先设定的重合度阈值的视频。

207、控制装置将第二视频集合包括的视频确定为目标视频的待推荐视频。

其中，本发明实施例中对于步骤204-步骤207的详细描述请参照实施例一中对于步骤101-步骤104的详细描述，本发明实施例不再赘述。

可见，本发明实施例所描述的方法能够自动过滤画面布局有差异但内容重合度较高的视频，提高筛选出的待推荐视频的有效性，有利于提高待推荐视频与用户需求的匹配度。此外，还能够通过生成类别标签关联关系的方式筛选出不同类别标签的相关视频，有利于提高筛选出的相关视频的准确性。

在一个可选的实施例中，控制装置生成类别标签关联关系，可以包括：

控制装置将验证视频集合中每个验证视频输入预先训练好的类别识别模型，得到每个验证视频对应的多个类别标签，其中，每个验证视频存在与之对应的原始类别标签；

控制装置提取每个验证视频对应的所有类别标签中满足第一预设筛选条件的类别标签，得到每个验证视频对应的类别标签集合；

控制装置将所有验证视频中原始类别标签相同的所有验证视频确定为一个验证视频组，得到多个验证视频组；

控制装置筛选每个验证视频组中所有验证视频对应的类别标签集合所包括的所有类别标签中满足第二预设筛选条件的所有类别标签，得到每个验证视频组对应的类别标签集合；

控制装置分别建立每个验证视频组对应的类别标签集合所包括的多个类别标签之间的类别标签关联关系。

进一步可选的，控制装置筛选每个验证视频组中所有验证视频对应的类别标签集合所包括的所有类别标签中满足第二预设筛选条件的所有类别标签，得到每个验证视频组对应的类别标签集合，可以包括：

对于每个验证视频组，控制装置统计该验证视频组中所有验证视频对应的类别标签集合中每个类别标签的标记数，并从该验证视频组中所有验证视频对应的类别标签集合所包括的所有类别标签中筛选标记数大于等于预设标记数阈值的所有类别标签，得到该验证视频组对应的类别标签集合。

在该可选的实施例中，进一步可选的，控制装置统计验证视频组中所有验证视频对应的类别标签集合中每个类别标签的标记数，可以包括：

控制装置统计该验证视频组中每个验证视频对应的类别标签集合中相同类别标签出现的累计次数，得到每个类别标签对应的标记数。

举例来说，假设某一验证视频组包括3个原始类别标签为a的验证视频，第一个验证视频对应的类别标签集合为a、b以及c，第二个验证视频对应的类别标签集合为a、b、d，第三个验证视频对应的类别标签集合为a、b以及e，则统计出的每个类别标签对应的标记数为：类别标签a对应的标记数为3，类别标签b对应的标记数为3，类别标签c、类别标签d以及类别标签e对应的标记数均为1，若预设标记数阈值为2，则该验证视频组对应的类别标签集合包括标记数为3的类别标签a以及类别标签b。

在该可选的实施例中，由于不同类别标签的视频也可能具有一定的相关性，通过预先训练好的类别识别模型构建相关视频的类别标签之间的关联关系，这样能够提高确定出的目标多类别集合的全面性与准确性，进而有利于提高后续确定出的待推荐视频集合所包括的视频的全面性与准确性，减少因类别标签不同而导致相关视频无法被推荐给用户的情况发生。

可见，本发明实施例能够自动过滤画面布局有差异但内容重合度较高的视频，提高筛选出的待推荐视频的有效性，有利于提高待推荐视频与用户需求的匹配度，且还能够根据类别标签对每个视频的信息集合进行统一存放，有利于缩小特征检索时不相关的特征范围，从而加快检索速度。此外，还能够通过类别标签之间的关联关系集中存放存在关联关系的类别标签所属的信息集合，有利于扩大特征检索的有效范围，且当视频不存在原始类别标签时，能够通过预先训练好的类别识别模型所预测的类别标签进行检索，提高了检索的有效性。

实施例三(装置侧实施例)

请参阅图3，图3是本发明实施例公开的一种待推荐视频的筛选控制装置的结构示意图。其中，图3所描述的装置可以具体应用于控制设备或后台服务器中，本发明实施例不做限定。如图3所示，该待推荐视频的筛选控制装置可以包括：

提取模块301，用于提取目标视频的目标特征信息，目标特征信息用于表征目标视频的风格特征。

确定模块302，用于确定目标视频的目标类别标签。

第一筛选模块303，用于从预先生成的多个多类别集合中筛选包括目标类别标签的目标多类别集合。

第二筛选模块304，用于从目标多类别集合对应的视频集合中筛选与目标特征信息的匹配度满足预设匹配条件的至少一个视频，得到第一视频集合。

过滤模块305，用于根据确定出的目标视频的哈希特征以及第一视频集合中每个视频的哈希特征，对第一视频集合包括的所有视频执行过滤操作得到第二视频集合，过滤操作用于从第一视频集合包括的所有视频中过滤掉视频画面的内容重合度高于预先设定的重合度阈值的视频。

确定模块302，还用于将第二视频集合包括的视频确定为目标视频的待推荐视频。

可见，实施图3所描述的装置能够自动过滤画面布局有差异但内容重合度较高的视频，提高筛选出的待推荐视频的有效性，有利于提高待推荐视频与用户需求的匹配度。

在一个可选的实施例中，如图4所示，该装置还可以包括：

多类别集合生成模块306，用于在第一筛选模块303从预先生成的多个多类别集合中筛选包括目标类别标签的目标多类别集合之前，将待推荐的原始视频集合中每个视频的视频标识、特征信息、哈希特征以及类别标签存储为该视频对应的信息集合；以及，根据预先确定出的类别标签关联关系，对存在关联关系的所有类别标签所属的信息集合执行集中存放操作，得到多个多类别集合。

其中，每个多类别集合包括存在关联关系的多个类别标签以及相应视频对应的信息集合中的内容。

可见，实施图4所描述的装置还能够通过生成类别标签关联关系的方式筛选出不同类别标签的相关视频，有利于提高筛选出的相关视频的准确性。

在另一个可选的实施例中，如图4所示，该装置还可以包括：

关联关系生成模块307，用于生成类别标签关联关系。

进一步可选的，关联关系生成模块307包括：

输入子模块3071，用于将验证视频集合中每个验证视频输入预先训练好的类别识别模型，得到每个验证视频对应的多个类别标签，其中，每个验证视频存在与之对应的原始类别标签。

提取子模块3072，用于提取每个验证视频对应的所有类别标签中满足第一预设筛选条件的类别标签，得到每个验证视频对应的类别标签集合。

确定子模块3073，用于将所有验证视频中原始类别标签相同的所有验证视频确定为一个验证视频组，得到多个验证视频组。

筛选子模块3074，用于筛选每个验证视频组中所有验证视频对应的类别标签集合所包括的所有类别标签中满足第二预设筛选条件的所有类别标签，得到每个验证视频组对应的类别标签集合。

建立子模块3075，用于分别建立每个验证视频组对应的类别标签集合所包括的多个类别标签之间的类别标签关联关系。

进一步可选的，筛选子模块3074筛选每个验证视频组中所有验证视频对应的类别标签集合所包括的所有类别标签中满足第二预设筛选条件的所有类别标签，得到每个验证视频组对应的类别标签集合的具体方式可以为：

对于每个验证视频组，统计该验证视频组中所有验证视频对应的类别标签集合中每个类别标签的标记数，并从该验证视频组中所有验证视频对应的类别标签集合所包括的所有类别标签中筛选标记数大于等于预设标记数阈值的所有类别标签，得到该验证视频组对应的类别标签集合。

可见，实施图4所描述的装置还能够通过类别标签之间的关联关系集中存放存在关联关系的类别标签所属的信息集合，有利于扩大特征检索的有效范围，且当视频不存在原始类别标签时，能够通过预先训练好的类别识别模型所预测的类别标签进行检索，提高了检索的有效性。

在又一个可选的实施例中，如图4所示，过滤模块305可以包括：

第一过滤子模块3051，用于根据目标视频的哈希特征以及第一视频集合中每个视频的哈希特征，对第一视频集合包括的所有视频执行第一过滤操作，得到过滤结果；

第二过滤子模块3052，用于根据过滤结果包括的所有视频的哈希特征，对过滤结果包括的所有视频执行第二过滤操作，得到第二视频集合。

进一步可选的，第一过滤子模块3051根据目标视频的哈希特征以及第一视频集合中每个视频的哈希特征，对第一视频集合包括的所有视频执行第一过滤操作，得到过滤结果的具体方式可以为：

根据目标视频的哈希特征以及第一视频集合中每个视频的哈希特征，计算第一视频集合中每个视频与目标视频的汉明距离；

从第一视频集合中过滤与目标视频的汉明距离小于等于预设汉明距离阈值的所有视频，得到过滤结果。

进一步可选的，第二过滤子模块3052根据过滤结果包括的所有视频的哈希特征，对过滤结果包括的所有视频执行第二过滤操作，得到第二视频集合可以包括：

从过滤结果对应的所有剩余视频中选择未被选择过的其中一个视频，根据其中一个视频的哈希特征以及过滤结果对应的所有剩余视频中除其中一个视频之外的每个视频的哈希特征，计算过滤结果对应的所有剩余视频中除其中一个视频之外的每个视频与其中一个视频的汉明距离；

判断过滤结果对应的所有剩余视频中除其中一个视频之外的所有视频是否存在与其中一个视频的汉明距离小于等于预设汉明距离阈值的至少一个视频；

当判断结果为否时，触发执行上述的从过滤结果对应的所有剩余视频中选择未被选择过的其中一个视频，根据其中一个视频的哈希特征以及过滤结果对应的所有剩余视频中除其中一个视频之外的每个视频的哈希特征，计算过滤结果对应的所有剩余视频中除其中一个视频之外的每个视频与其中一个视频的汉明距离的操作，以及，触发执行上述的判断过滤结果对应的所有剩余视频中除其中一个视频之外的所有视频是否存在与其中一个视频的汉明距离小于等于预设汉明距离阈值的至少一个视频的操作；

当判断结果为是时，从过滤结果对应的所有剩余视频除其中一个视频之外的所有视频中过滤与其中一个视频的汉明距离小于等于预设汉明距离阈值的所有视频，以更新过滤结果对应的所有剩余视频，并触发执行上述的从过滤结果对应的所有剩余视频中选择未被选择过的其中一个视频，根据其中一个视频的哈希特征以及过滤结果对应的所有剩余视频中除其中一个视频之外的每个视频的哈希特征，计算过滤结果对应的所有剩余视频中除其中一个视频之外的每个视频与其中一个视频的汉明距离的操作，以及，触发执行上述的判断过滤结果对应的所有剩余视频中除其中一个视频之外的所有视频是否存在与其中一个视频的汉明距离小于等于预设汉明距离阈值的至少一个视频的操作；

当过滤结果对应的所有剩余视频中只存在一个未被选择过的视频时，将过滤结果对应的所有剩余视频确定为第二视频集合。

可见，实施图4所描述的装置还能够通过视频的哈希特征将视频对应的视频帧的高维特征映射至低维空间，由于视频播放画面(也即播放内容)相同或重合度高的视频帧具有高度相似的哈希特征，通过视频的哈希特征实现对初步确定出的视频集合中播放画面重复度较高的视频的过滤，有利于提高确定出的待推荐视频集合的有效性。

实施例四

请参阅图5，图5是本发明实施例公开的又一种待推荐视频的筛选控制装置的结构示意图。其中，图5所描述的装置可以具体应用于控制设备或后台服务器中，本发明实施例不做限定。如图5所示，该装置可以包括：

存储有可执行程序代码的存储器401；

与存储器401耦合的处理器402；

其中，处理器402调用存储器401中存储的可执行程序代码，用于执行实施例一或实施例二中所描述的待推荐视频的筛选控制方法中的部分或全部步骤。

实施例五

本发明实施例公开了一种计算机存储介质，其存储用于电子数据交换的计算机程序，其中，该计算机程序使得计算机执行实施例一或实施例二中所描述的待推荐视频的筛选控制方法中的部分或全部步骤。

实施例六

本发明实施例公开了一种计算机程序产品，该计算机程序产品包括存储了计算机程序的非瞬时性计算机可读存储介质，且该计算机程序可操作来使计算机执行实施例一或实施例二中所描述的待推荐视频的筛选控制方法中的部分或全部步骤。

以上所描述的装置实施例仅是示意性的，其中所述作为分离部件说明的模块可以是或者也可以不是物理上分开的，作为模块显示的部件可以是或者也可以不是物理模块，即可以位于一个地方，或者也可以分布到多个网络模块上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下，即可以理解并实施。

通过以上的实施例的具体描述，本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现，当然也可以通过硬件。基于这样的理解，上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品可以存储在计算机可读存储介质中,存储介质包括只读存储器(Read-Only Memory，ROM)、随机存储器(Random Access Memory，RAM)、可编程只读存储器(Programmable Read-only Memory，PROM)、可擦除可编程只读存储器(ErasableProgrammable Read Only Memory，EPROM)、一次可编程只读存储器(One-timeProgrammable Read-Only Memory，OTPROM)、电子抹除式可复写只读存储器(Electrically-Erasable Programmable Read-Only Memory，EEPROM)、只读光盘(CompactDisc Read-Only Memory，CD-ROM)或其他光盘存储器、磁盘存储器、磁带存储器、或者能够用于携带或存储数据的计算机可读的任何其他介质。

最后应说明的是：本发明实施例公开的一种待推荐视频的筛选控制方法及装置所揭露的仅为本发明较佳实施例而已，仅用于说明本发明的技术方案，而非对其限制；尽管参照前述实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解；其依然可以对前述各项实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或替换，并不使相应的技术方案的本质脱离本发明各项实施例技术方案的精神和范围。

Claims

1.一种待推荐视频的筛选控制方法，其特征在于，所述方法包括：

从预先生成的多个多类别集合中筛选包括所述目标类别标签的目标多类别集合，并从所述目标多类别集合对应的视频集合中筛选与所述目标特征信息的匹配度满足预设匹配条件的至少一个视频，得到第一视频集合；其中，所述多个多类别集合是根据预先确定出的类别标签关联关系对存在关联关系的所有类别标签所属的信息集合执行集中存放操作得到的；

将所述第二视频集合包括的视频确定为所述目标视频的待推荐视频；

其中，所述类别标签关联关系是通过以下方式确定出的：将验证视频集合中每个验证视频输入预先训练好的类别识别模型，得到每个所述验证视频对应的多个类别标签，其中，每个所述验证视频存在与之对应的原始类别标签；提取每个所述验证视频对应的所有类别标签中满足第一预设筛选条件的类别标签，得到每个所述验证视频对应的类别标签集合；将所有所述验证视频中原始类别标签相同的所有验证视频确定为一个验证视频组，得到多个验证视频组；筛选每个所述验证视频组中所有验证视频对应的类别标签集合所包括的所有类别标签中满足第二预设筛选条件的所有类别标签，得到每个所述验证视频组对应的类别标签集合；分别建立每个所述验证视频组对应的类别标签集合所包括的多个类别标签之间的类别标签关联关系。

2.根据权利要求1所述的待推荐视频的筛选控制方法，其特征在于，所述从预先生成的多个多类别集合中筛选包括所述目标类别标签的目标多类别集合之前，所述方法还包括：

3.根据权利要求2所述的待推荐视频的筛选控制方法，其特征在于，所述根据预先确定出的类别标签关联关系，对存在关联关系的所有类别标签所属的信息集合执行集中存放操作，得到多个多类别集合之前，所述方法还包括：

生成类别标签关联关系。

4.根据权利要求3所述的待推荐视频的筛选控制方法，其特征在于，所述筛选每个所述验证视频组中所有验证视频对应的类别标签集合所包括的所有类别标签中满足第二预设筛选条件的所有类别标签，得到每个所述验证视频组对应的类别标签集合，包括：

5.根据权利要求1-4任一项所述的待推荐视频的筛选控制方法，其特征在于，所述根据确定出的所述目标视频的哈希特征以及所述第一视频集合中每个视频的哈希特征，对所述第一视频集合包括的所有视频执行过滤操作得到第二视频集合，包括：

6.根据权利要求5所述的待推荐视频的筛选控制方法，其特征在于，所述根据所述目标视频的哈希特征以及所述第一视频集合中每个视频的哈希特征，对所述第一视频集合包括的所有视频执行第一过滤操作，得到过滤结果，包括：

7.根据权利要求6所述的待推荐视频的筛选控制方法，其特征在于，所述根据所述过滤结果包括的所有视频的哈希特征，对所述过滤结果包括的所有视频执行第二过滤操作，得到第二视频集合，包括：

8.一种待推荐视频的筛选控制装置，其特征在于，所述装置包括：

确定模块，用于确定所述目标视频的目标类别标签；

第一筛选模块，用于从预先生成的多个多类别集合中筛选包括所述目标类别标签的目标多类别集合；其中，所述多个多类别集合是根据预先确定出的类别标签关联关系对存在关联关系的所有类别标签所属的信息集合执行集中存放操作得到的；

所述确定模块，还用于将所述第二视频集合包括的视频确定为所述目标视频的待推荐视频；

9.一种待推荐视频的筛选控制装置，其特征在于，所述装置包括：

存储有可执行程序代码的存储器；

与所述存储器耦合的处理器；

所述处理器调用所述存储器中存储的所述可执行程序代码，执行如权利要求1-7任一项所述的待推荐视频的筛选控制方法。

10.一种计算机存储介质，其特征在于，所述计算机存储介质存储有计算机指令，所述计算机指令被调用时，用于执行如权利要求1-7任一项所述的待推荐视频的筛选控制方法。