CN114881174A

CN114881174A - 内容分类方法、装置、可读存储介质及电子设备

Info

Publication number: CN114881174A
Application number: CN202210626498.7A
Authority: CN
Inventors: 徐瑞聪
Original assignee: Beijing Sankuai Online Technology Co Ltd
Current assignee: Beijing Sankuai Online Technology Co Ltd
Priority date: 2022-06-02
Filing date: 2022-06-02
Publication date: 2022-08-09

Abstract

本公开涉及一种内容分类方法、装置、可读存储介质及电子设备。方法包括：提取待分类内容对应的目标特征信息；根据目标特征信息，通过目标层级分类模型对待分类内容按照预设类目体系进行分类，得到目标分类；目标层级分类模型包括与预设类目体系中的N级类目一一对应的N个层级网络，与最低层级类目对应的第一分类器；层级网络用于至少根据目标特征信息和来自该层级网络的前一层级网络的层级特征信息，生成该层级网络对应的层级类目的层级特征信息。这样，N个层级网络之间能以自顶向下的方式进行层级特征信息的传递融合，利用类目层级间的融合信息进行内容分类，提升内容分类准确率。另外，通过单一模型进行分类，模型部署简单，迭代方便。

Description

内容分类方法、装置、可读存储介质及电子设备

技术领域

本公开涉及信息处理技术领域，具体地，涉及一种内容分类方法、装置、可读存储介质及电子设备。

背景技术

随着互联网技术的发展，互联网上的内容越来越多，在许多场景下都会存在对内容分类的需求。例如，需要根据内容的类型对内容进行管理、分发、点评等，根据用户选择的内容类别推送对应类别的内容等。现阶段，通常采用人工智能模型进行内容分类，但目前分类得到的内容类别的准确率不高。

发明内容

本公开的目的是提供一种内容分类方法、装置、可读存储介质及电子设备，以部分地解决相关技术中存在的上述问题。

为了实现上述目的，第一方面，本公开提供一种内容分类方法，包括：

提取待分类内容对应的目标特征信息；

根据所述目标特征信息，通过目标层级分类模型对所述待分类内容按照预设类目体系进行分类，得到所述待分类内容对应的目标分类，其中，所述预设类目体系包括N级类目，所述目标分类属于所述N级类目中的最低层级类目，N≥2；

所述目标层级分类模型包括：与所述N级类目一一对应的、按照对应类目层级由高到低依次串联的N个层级网络，以及与所述最低层级类目对应的第一分类器；

所述层级网络，用于至少根据所述目标特征信息和来自该层级网络的前一层级网络的层级特征信息，生成该层级网络对应的层级类目的层级特征信息；

所述第一分类器，与所述最低层级类目对应的层级网络连接，用于至少根据来自所述最低层级类目对应的层级网络的层级特征信息，确定所述目标分类。

可选地，所述至少根据来自所述最低层级类目对应的层级网络的层级特征信息，确定所述目标分类，包括：

根据来自每一所述层级网络的层级特征信息，确定所述目标分类。

利用注意力机制提取所述目标特征信息的注意力特征信息；

根据来自所述最低层级类目对应的层级网络的层级特征信息和所述注意力特征信息，确定所述目标分类。

利用注意力机制提取所述目标特征信息的注意力特征信息；

根据来自每一所述层级网络的层级特征信息和所述注意力特征信息，确定所述目标分类。

可选地，所述根据来自每一所述层级网络的层级特征信息和所述注意力特征信息，确定所述目标分类，包括：

根据来自每一所述层级网络的层级特征信息，确定全局特征信息；

根据所述全局特征信息和所述注意力特征信息，确定所述目标分类。

可选地，所述至少根据所述目标特征信息和来自该层级网络的前一层级网络的层级特征信息，生成该层级网络对应的层级类目的层级特征信息，包括：

根据所述目标特征信息和来自该层级网络前的每一层级网络的层级特征信息，生成该层级网络对应的层级类目的层级特征信息。

可选地，所述待分类内容包括文本、图像、视频中的至少一者。

可选地，所述目标层级分类模型还包括与所述N级类目中除所述最低层级类目外的其他层级类目一一对应的第二分类器，其中，所述第二分类器与自身所对应的层级类目相对应的层级网络连接，用于在所述目标层级分类模型的训练阶段，根据来自与所述第二分类器自身连接的层级网络的层级特征信息，确定用作训练数据的样本内容在所述第二分类器自身所对应的层级类目下的预测分类。

可选地，所述目标层级分类模型通过以下方式训练得到：

获取训练数据，其中，所述训练数据包括所述样本内容和所述样本内容在每一所述层级类目下的分类标签；

提取所述样本内容对应的样本特征信息；

根据所述样本特征信息，通过当前层级分类模型对所述样本内容按照所述预设类目体系进行分类，得到每一所述第二分类器输出的、所述样本内容在所述第二分类器自身所对应的层级类目下的预测分类，和所述第一分类器输出的、所述样本内容在所述最低层级类目下的预测分类；

根据每一所述层级类目下的预测分类和分类标签，对所述当前层级分类模型进行模型参数更新；

响应于满足训练截止条件，将当前层级分类模型确定为所述目标层级分类模型；

响应于不满足所述训练截止条件，重新执行所述获取训练数据的步骤至所述根据每一所述层级类目下的预测分类和分类标签，对所述当前层级分类模型进行模型参数更新的步骤。

可选地，所述根据每一所述层级类目下的预测分类和分类标签，对所述当前层级分类模型进行模型参数更新，包括：

根据每一所述层级类目下的预测分类和分类标签，确定当前损失；

根据所述当前损失，对所述当前层级分类模型进行模型参数更新。

可选地，所述根据每一所述层级类目下的预测分类和分类标签，确定当前损失，包括：

针对每一所述层级类目，根据所述样本内容在该层级类目下的预测分类和分类标签，确定该层级类目的层级分类损失；

将每一所述层级分类损失之和为确定当前损失。

针对所述N级类目中除最高层级类目外的每一其他层级类目，根据所述样本内容在该其他层级类目下的预测分类是否属于所述样本内容在该其他层级类目的上一层级类目下的预测分类的第一判别结果，所述样本内容在该其他层级类目的上一层级类目下的分类标签与预测分类是否一致的第二判别结果，以及所述样本内容在该其他层级类目下的分类标签与预测分类是否一致的第三判别结果，确定该其他层级类目对应的层级网络与其前一层级网络之间的层级间误分类损失；

将每一所述层级间误分类损失、每一所述层级分类损失之和确定为当前损失。

第二方面，本公开提供一种内容分类装置，包括：

第一提取模块，用于提取待分类内容对应的目标特征信息；

第一分类模块，用于根据所述第一提取模块提取到的所述目标特征信息，通过目标层级分类模型对所述待分类内容按照预设类目体系进行分类，得到所述待分类内容对应的目标分类，其中，所述预设类目体系包括N级类目，所述目标分类属于所述N级类目中的最低层级类目，N≥2；

第三方面，本公开提供一种计算机可读存储介质，其上存储有计算机程序，该程序被处理器执行时实现本公开第一方面提供的所述内容分类方法的步骤。

第四方面，本公开提供一种电子设备，包括：

存储器，其上存储有计算机程序；

处理器，用于执行所述存储器中的所述计算机程序，以实现本公开第一方面提供的所述内容分类方法的步骤。

在上述技术方案中，根据待分类内容对应的目标特征信息，通过目标层级分类模型对待分类内容按照预设类目体系进行分类，得到待分类内容对应的目标分类，目标层级分类模型包括：与预设类目体系中的N级类目一一对应的、按照对应类目层级由高到低依次串联的N个层级网络，以及与N级类目中的最低层级类目对应的第一分类器。其中，层级网络用于至少根据目标特征信息和来自该层级网络的前一层级网络的层级特征信息，生成该层级网络对应的层级类目的层级特征信息，这样，与预设类目体系中的N级类目一一对应的N个层级网络之间能够以自顶向下的方式进行层级特征信息的传递融合，从而能够利用类目层级间的融合信息进行内容分类，提升内容分类的准确率。另外，通过单一的目标层级分类模型即可满足高分类准确率的需求，模型部署简单，迭代方便。

本公开的其他特征和优点将在随后的具体实施方式部分予以详细说明。

附图说明

附图是用来提供对本公开的进一步理解，并且构成说明书的一部分，与下面的具体实施方式一起用于解释本公开，但并不构成对本公开的限制。在附图中：

图1是根据一示例性实施例示出的一种内容分类方法的流程图。

图2A是根据一示例性实施例示出的一种目标层级分类模型的结构示意图。

图2B是根据另一示例性实施例示出的一种目标层级分类模型的结构示意图。

图2C是根据另一示例性实施例示出的一种目标层级分类模型的结构示意图。

图2D是根据另一示例性实施例示出的一种目标层级分类模型的结构示意图。

图2E是根据另一示例性实施例示出的一种目标层级分类模型的结构示意图。

图2F是根据另一示例性实施例示出的一种目标层级分类模型的结构示意图。

图2G是根据另一示例性实施例示出的一种目标层级分类模型的结构示意图。

图2H是根据另一示例性实施例示出的一种目标层级分类模型的结构示意图。

图3是根据另一示例性实施例示出的一种目标层级分类模型的结构示意图。

图4是根据一示例性实施例示出的一种目标层级分类模型的训练方法的流程图。

图5是根据一示例性实施例示出的一种内容分类装置的框图。

图6是根据一示例性实施例示出的一种电子设备的框图。

图7是根据一示例性实施例示出的一种电子设备的框图。

具体实施方式

正如背景技术中论述的那样，现阶段，通常采用人工智能模型进行内容分类，但目前分类得到的内容类别的准确率不高。具体来说，现阶段主要通过以下三种方式来对待分类内容按照预设类目体系中的最低层级类目进行分类，其中，通常以树形结构来表示预设类目体系：(1)通过单一分类模型直接对待分类内容按照预设类目体系中的最低层级类目进行分类，但其未能有效利用不同类目层级的信息，使得分类模型无法得到有效约束，导致分类的准确率不理想；(2)训练一个一层级类目的分类模型，并在每个一层级类目下训练一个单独的叶子节点(即最低层级类目)的分类模型，该种方式的分类准确率受一层级类目的分类模型的准确度影响较大，使得分类准确率难以保证，另外，还需要按照一层级类目的数量训练多个分类模型，模型部署开销大；(3)每个层级类目分别训练对应的分类模型，多个分类模型在训练过程中不会互相影响，这样，不仅模型部署开销大，而且当调整叶子类目所属父节点后，需要对父节点所属层级的分类模型进行调整，迭代难度高。

鉴于此，本公开提供一种内容分类方法、装置、可读存储介质及电子设备。

以下结合附图对本公开的具体实施方式进行详细说明。应当理解的是，此处所描述的具体实施方式仅用于说明和解释本公开，并不用于限制本公开。

需要说明的是，本公开中所有获取信号、信息或数据的动作都是在遵照所在地国家相应的数据保护法规政策的前提下，并获得由相应装置所有者给予授权的情况下进行的。

图1是根据一示例性实施例示出的一种内容分类方法的流程图，其中，该方法可以应用于智能手机、平板电脑、个人计算机等终端，也可以应用于服务器。如图1所示，该方法可以包括以下S101和S102。

在S101中，提取待分类内容对应的目标特征信息。

在本公开中，待分类内容包括文本、图像、视频中的至少一者，即待分类内容可以是文本、图像、视频中的一种或多种。例如，待分类内容是图文内容(例如，文章)，待分类内容还可以是视频内容。

目标特征信息用于描述待分类内容的特性，可以根据待分类内容的相关信息(例如，待分类内容对应的文本和图像)提取得到。其中，当待分类内容为视频时，其相关信息可以包括各视频帧、视频字幕、视频中音频的语音识别结果等。

另外，可以通过特征提取网络来提取待分类内容对应的目标特征信息。示例地，当待分类内容同时包括文本和图像(或视频)时，该特征提取网络可以为基于变形的双向编码器图像表征模型(Image Bidirectional Encoder Representations from Transformers，ImageBERT)，ImageBERT属于机器学习模型。其中，BERT框架是学习文本特征，用来理解内容的语义信息，ImageBERT同时融合了文本特征和图像特征，使图片信息和文本语义信息结合，丰富内容表达。

在S102中，根据目标特征信息，通过目标层级分类模型对待分类内容按照预设类目体系进行分类，得到待分类内容对应的目标分类。

在本公开中，预设类目体系包括N级类目，目标分类属于N级类目中的最低层级类目，N≥2。

目标层级分类模型包括：与N级类目一一对应的、按照对应类目层级由高到低依次串联的N个层级网络，以及与最低层级类目对应的第一分类器。其中，层级网络，用于至少根据目标特征信息和来自该层级网络的前一层级网络的层级特征信息，生成该层级网络对应的层级类目的层级特征信息；第一分类器，与最低层级类目对应的层级网络连接，用于至少根据来自最低层级类目对应的层级网络的层级特征信息，确定目标分类。

示例地，上述预设类目体系包括三级类目，即N＝3，分别为一层级类目、二层级类目以及三层级类目，其中，一层级类目、二层级类目、三层级类目的类目层级依次降低，即最低层级类目为三层级类目，如图2A-图2H所示，目标层级分类模型包括与一层级类目对应的第一层级网络、与二层级类目对应的第二层级网络、与三层级类目对应的第三层级网络以及与三层级类目对应的第一分类器。

其中，第一层级网络，用于根据目标特征信息，生成一层级类目的层级特征信息，即第一层级特征信息；第二层级网络，与第一层级网络连接，用于根据目标特征信息和来自第一层级网络的层级特征信息(即第一层级特征信息)，生成二层级类目的层级特征信息，即第二层级特征信息；第三层级网络，与第二层级网络连接，用于至少根据目标特征信息和来自第二层级网络的层级特征信息(即第二层级特征信息)，生成三层级类目的层级特征信息，即第三层级特征信息；第一分类器，与第三层级网络连接，用于至少根据来自第三层级网络的层级特征信息(即第三层级特征信息)，确定目标分类。

下面针对上述至少根据目标特征信息和来自该层级网络的前一层级网络的层级特征信息，生成该层级网络对应的层级类目的层级特征信息的具体实施方式进行详细说明。具体来说，可以通过多种方式来实现，在一种实施方式中，可以根据目标特征信息和来自该层级网络的前一层级网络的层级特征信息，生成该层级网络对应的层级类目的层级特征信息。

示例地，如图2A-2D所示，第一层级网络，用于根据目标特征信息，生成第一层级特征信息；第二层级网络，用于根据目标特征信息和来自第一层级网络的层级特征信息(即第一层级特征信息)，生成第二层级特征信息；第三层级网络，用于根据目标特征信息和来自第二层级网络的层级特征信息(即第二层级特征信息)，生成第三层级特征信息。

在另一种实施方式中，可以根据目标特征信息和来自该层级网络前的每一层级网络的层级特征信息，生成该层级网络对应的层级类目的层级特征信息。这样，能够将每一层级网络的层级特征信息进行融合，使得用于内容分类的层级特征信息更加全面，从而进一步提升内容分类的准确率。

示例地，如图2E-2H所示，第一层级网络，用于根据目标特征信息，生成第一层级特征信息；第二层级网络，用于根据目标特征信息和来自第一层级网络的层级特征信息(即第一层级特征信息)，生成第二层级特征信息；第三层级网络，用于根据目标特征信息、来自第一层级网络的层级特征信息(即第一层级特征信息)以及来自第二层级网络的层级特征信息(即第二层级特征信息)，生成第三层级特征信息。

下面针对上述至少根据来自最低层级类目对应的层级网络的层级特征信息，确定目标分类的具体实施方式进行详细说明。具体来说，可以通过多种方式来实现，在一种实施方式中，可以根据来自最低层级类目对应的层级网络的层级特征信息，确定目标分类。

示例地，如图2A和图2E所示，第一分类器，用于根据来自第三层级网络的层级特征信息(即第三层级特征信息)，确定目标分类。

在另一种实施方式中，可以根据来自每一层级网络的层级特征信息，确定目标分类。这样，能够充分利用多个层级网络输出的层级特征信息进行分类，保证了信息表达的充分性，从而进一步提升了内容分类的准确率。

示例地，如图2B和图2F所示，第一分类器，用于根据来自第一层级网络的层级特征信息(即第一层级特征信息)、来自第二层级网络的层级特征信息(即第二层级特征信息)以及来自第三层级网络的层级特征信息(即第三层级特征信息)，确定目标分类。

在又一种实施方式中，可以先利用注意力机制提取目标特征信息的注意力特征信息，示例地，可以通过注意力模块来提取目标特征信息的注意力特征信息；然后，根据来自最低层级类目对应的层级网络的层级特征信息和注意力特征信息，确定目标分类。在确定目标分类时，引入目标特征信息的注意力特征信息，以引导第一分类器对待分类内容进行有效分类，从而避免目标特征信息经过多个层级网络处理而丢失有效信息，进而提升内容分类的准确率。

示例地，如图2C和图2G所示，第一分类器，用于根据来自第三层级网络的层级特征信息(即第三层级特征信息)和注意力特征信息，确定目标分类。

在又一种实施方式中，可以先利用注意力机制提取目标特征信息的注意力特征信息；然后，根据来自每一层级网络的层级特征信息和注意力特征信息，确定目标分类。在确定目标分类时，不但引入目标特征信息的注意力特征信息，还充分利用多个层级网络输出的层级特征信息，从而能够最大程度地提升内容分类的准确率。

示例地，如图2D和图2H所示，第一分类器，用于根据来自第一层级网络的层级特征信息(即第一层级特征信息)、来自第二层级网络的层级特征信息(即第二层级特征信息)、来自第三层级网络的层级特征信息(即第三层级特征信息)以及注意力特征信息，确定目标分类。

下面针对上述根据来自每一层级网络的层级特征信息，确定目标分类的具体实施方式进行详细说明。具体来说，可以通过以下步骤(1)和步骤(2)来实现：

(1)根据来自每一层级网络的层级特征信息，确定全局特征信息。

(2)根据全局特征信息，确定目标分类。

具体来说，可以将全局层级特征信息输入到第一分类器中，得到待分类内容对应的目标分类。

下面针对上述根据来自每一层级网络的层级特征信息和注意力特征信息，确定目标分类的具体实施方式进行详细说明。具体来说，可以通过以下步骤[1]和步骤[2]来实现：

[1]根据来自每一层级网络的层级特征信息，确定全局特征信息。

[2]根据全局特征信息和注意力特征信息，确定目标分类。

具体来说，可以将全局层级特征信息和注意力特征信息输入到第一分类器中，得到待分类内容对应的目标分类。

下面针对上述步骤(1)和步骤[1]中的根据来自每一层级网络的层级特征信息，确定全局特征信息的具体实施方式进行详细说明。

具体来说，可以将来自每一层级网络的层级特征信息进行融合，以得到全局特征信息。

在一种实施方式中，可以通过学习参数α(即权重矩阵)将来自每一层级网络的层级特征信息进行融合，以得到全局特征信息，即全局特征信息＝N个层级网络中除与最低层级类目对应的层级网络外的其他层级网络输出的层级特征信息(可以表征为向量)之和

+最低层级类目对应的层级网络输出的层级特征信息

示例地，如图2B、图2C、图2F以及图2H所示的目标层级分类模型，全局特征信息＝(第一层级特征信息+第二层级特征信息)

+第三层级特征信息

另外，上述目标层级分类模型还包括与N级类目中除最低层级类目外的其他层级类目一一对应的第二分类器，其中，第二分类器与自身所对应的层级类目相对应的层级网络连接，用于在目标层级分类模型的训练阶段，根据来自与第二分类器自身连接的层级网络的层级特征信息，确定用作训练数据的样本内容在第二分类器自身所对应的层级类目下的预测分类。

示例地，如图3所示，上述目标层级分类模型除了包括第一层级网络、第二层级网络、第三层级网络以及与三层级类目对应的第一分类器外，还包括与一层级类目对应的第二分类器、与二层级类目对应的第二分类器。其中，第一层级网络，用于在目标层级分类模型的训练阶段，根据用作训练数据的样本内容的样本特征信息，生成一层级类目的层级特征信息，即第四层级特征信息；第二层级网络，用于在目标层级分类模型的训练阶段，根据样本特征信息和来自第一层级网络的层级特征信息(即第四层级特征信息)，生成二层级类目的层级特征信息，即第五层级特征信息；第三层级网络，用于在目标层级分类模型的训练阶段，至少根据样本特征信息和来自第二层级网络的层级特征信息(即第五层级特征信息)，生成三层级类目的层级特征信息，即第六层级特征信息；与一层级类目对应的第二分类器A，与第一层级网络连接，用于在目标层级分类模型的训练阶段，根据来自与该第二分类器A自身连接的层级网络(即第一层级网络)的层级特征信息(即第四层级特征信息)，确定样本内容在一层级类目下的预测分类；与二层级类目对应的第二分类器B，与第二层级网络连接，用于在目标层级分类模型的训练阶段，根据来自与该第二分类器B自身连接的层级网络(即第二层级网络)的层级特征信息(即第五层级特征信息)，确定样本内容在二层级类目下的预测分类；第一分类器，与第三层级网络连接，用于在目标层级分类模型的训练阶段，至少根据来自第三层级网络的层级特征信息(即第六层级特征信息)，确定样本内容在三层级类目下的预测分类。

下面针对上述目标层级分类模型的具体训练方式进行详细说明。具体来说，可以通过图4中所示的S401～S406来实现。

在S401中，获取训练数据，训练数据包括样本内容和样本内容在每一层级类目下的分类标签。

在本公开中，样本内容包括文本、图像、视频中的至少一者，即样本内容可以是文本、图像、视频中的一种或多种。例如，样本内容是图文内容(例如，文章)，样本内容还可以是视频内容。

在S402中，提取样本内容对应的样本特征信息。

在本公开中，可以采用与上述S101提取待分类内容对应的目标特征信息类似的方式来提取样本内容对应的样本特征信息，本公开不再赘述。

在S403中，根据样本特征信息，通过当前层级分类模型对样本内容按照预设类目体系进行分类，得到每一第二分类器输出的、样本内容在第二分类器自身所对应的层级类目下的预测分类，和第一分类器输出的、样本内容在最低层级类目下的预测分类。

在S404中，根据每一层级类目下的预测分类和分类标签，对当前层级分类模型进行模型参数更新。

在S405中，判断是否满足训练截止条件。

在本公开中，训练截止条件可以为训练次数达到预设次数阈值，也可以是当前层级分类模型的当前损失小于预设损失阈值。

若不满足训练截止条件，则返回上述S401继续执行，直到满足训练截止条件时为止。若满足训练截止条件，则执行以下S406。

在S406中，将当前层级分类模型确定为目标层级分类模型。

下面针对上述S404中的根据每一层级类目下的预测分类和分类标签，对当前层级分类模型进行模型参数更新的具体实施方式进行详细说明。具体来说，可以通过以下步骤1)和步骤2)来实现：

1)根据每一层级类目下的预测分类和分类标签，确定当前损失。

2)根据当前损失，对当前层级分类模型进行模型参数更新。

下面针对上述步骤1)中的根据每一层级类目下的预测分类和分类标签，确定当前损失的具体实施方式进行详细说明。具体来说，可以通过多种方式来实现，在一种实施方式中，可以针对每一层级类目，根据样本内容在该层级类目下的预测分类和分类标签，确定该层级类目的层级分类损失，然后，将每一层级分类损失之和为确定当前损失。

具体来说，可以针对每一层级类目，根据样本内容在该层级类目下的预测分类和分类标签之间的差异来确定该层级类目的层级分类损失，之后，将每一层级分类损失之和为确定当前损失。

在另一种实施方式中，可以通过以下步骤①～步骤③来确定当前损失：

①针对N级类目中除最高层级类目外的每一其他层级类目，根据样本内容在该其他层级类目下的预测分类是否属于样本内容在该其他层级类目的上一层级类目下的预测分类的第一判别结果，样本内容在该其他层级类目的上一层级类目下的分类标签与预测分类是否一致的第二判别结果，以及样本内容在该其他层级类目下的分类标签与预测分类是否一致的第三判别结果，确定该其他层级类目对应的层级网络与其前一层级网络之间的层级间误分类损失。

示例地，N＝3，则如图3所示，可以根据样本内容在二层级类目下的预测分类是否属于样本内容在一层级类目下的预测分类的第一判别结果，样本内容在一层级类目下的分类标签与预测分类是否一致的第二判别结果，以及样本内容在二层级类目下的分类标签与预测分类是否一致的第三判别结果，确定二层级类目对应的层级网络(即第二层级网络)与其前一层级网络(即第一层级网络)之间的层级间误分类损失；同时，根据样本内容在三层级类目下的预测分类是否属于样本内容在二层级类目下的预测分类的第一判别结果，样本内容在二层级类目下的分类标签与预测分类是否一致的第二判别结果，以及样本内容在三层级类目下的分类标签与预测分类是否一致的第三判别结果，确定三层级类目对应的层级网络(即第三层级网络)与其前一层级网络(即第二层级网络)之间的层级间误分类损失。

②针对每一层级类目，根据样本内容在该层级类目下的预测分类和分类标签，确定该层级类目的层级分类损失。

③将每一层级间误分类损失、每一层级分类损失之和确定为当前损失。

示例地，可以根据样本内容在i层级类目下的预测分类是否属于样本内容在i-1层级类目下的预测分类的第一判别结果，样本内容在该i-1层级类目下的分类标签与预测分类是否一致的第二判别结果，以及样本内容在该i层级类目下的分类标签与预测分类是否一致的第三判别结果，确定i层级类目对应的层级网络与其前一层级网络(即i-1层级类目对应的层级网络)之间的层级间误分类损失：

其中，Hier_i-1,i为i层级类目对应的层级网络与其前一层级网络之间的层级间误分类损失，其中，i＝2,3，……，N；β为惩罚参数，且1＜β≤5；Child_i为样本内容在i层级类目下的预测分类是否属于样本内容在i-1层级类目下的预测分类的第一判别结果，其中，若样本内容在i层级类目下的预测分类属于样本内容在i-1层级类目下的预测分类，则Child_i＝0，若样本内容在i层级类目下的预测分类不属于样本内容在i-1层级类目下的预测分类，则Child_i＝1；Pred_i-1为样本内容在该i-1层级类目下的分类标签与预测分类是否一致的第二判别结果，其中，若样本内容在该i-1层级类目下的分类标签与预测分类一致，则Pred_i-1＝0，若样本内容在该i-1层级类目下的分类标签与预测分类不一致，则Pred_i-1＝1；Pred_i为样本内容在该i层级类目下的分类标签与预测分类是否一致的第三判别结果，其中，若样本内容在该i层级类目下的分类标签与预测分类一致，则Pred_i＝0，若样本内容在该i层级类目下的分类标签与预测分类不一致，则Pred_i＝1。

在上述实施方式中，在目标层级分类模型训练过程中，当前层级分类模型的当前损失不但参考了每一层级分类损失，还参考了每一层级间误分类损失，这样，能够利用每层级间误分类损失约束N级类目中相邻层级类目之间的从属关系，对于层级间的不关联预测(即样本内容在该层级类目下的预测分类不属于样本内容在该层级类目的上一层级类目下的预测分类)进行惩罚，从而使得当前层级分类模型学习到层级关系信息，提升模型分类的准确率。

图5是根据一示例性实施例示出的一种内容分类装置的框图。如图5所示，该装置500包括：

第一提取模块501，用于提取待分类内容对应的目标特征信息；

第一分类模块502，用于根据所述第一提取模块501提取到的所述目标特征信息，通过目标层级分类模型对所述待分类内容按照预设类目体系进行分类，得到所述待分类内容对应的目标分类，其中，所述预设类目体系包括N级类目，所述目标分类属于所述N级类目中的最低层级类目，N≥2；

可选地，所述第一分类器，用于根据来自每一所述层级网络的层级特征信息，确定所述目标分类。

可选地，所述第一分类器，用于：利用注意力机制提取所述目标特征信息的注意力特征信息；根据来自所述最低层级类目对应的层级网络的层级特征信息和所述注意力特征信息，确定所述目标分类。

可选地，所述第一分类器，用于：利用注意力机制提取所述目标特征信息的注意力特征信息；根据来自每一所述层级网络的层级特征信息和所述注意力特征信息，确定所述目标分类。

可选地，所述第一分类器，用于：根据来自每一所述层级网络的层级特征信息，确定全局特征信息；根据所述全局特征信息和所述注意力特征信息，确定所述目标分类。

可选地，所述层级网络，用于根据所述目标特征信息和来自该层级网络前的每一层级网络的层级特征信息，生成该层级网络对应的层级类目的层级特征信息。

可选地，所述目标层级分类模型通过模型训练装置训练得到，其中，该模型训练装置包括：

获取模块，用于获取训练数据，其中，所述训练数据包括所述样本内容和所述样本内容在每一所述层级类目下的分类标签；

第二提取模块，用于提取所述样本内容对应的样本特征信息；

第二分类模块，用于根据所述样本特征信息，通过当前层级分类模型对所述样本内容按照所述预设类目体系进行分类，得到每一所述第二分类器输出的、所述样本内容在所述第二分类器自身所对应的层级类目下的预测分类，和所述第一分类器输出的、所述样本内容在所述最低层级类目下的预测分类；

更新模块，用于根据每一所述层级类目下的预测分类和分类标签，对所述当前层级分类模型进行模型参数更新；

触发模块，用于：响应于满足训练截止条件，将当前层级分类模型确定为所述目标层级分类模型；响应于不满足所述训练截止条件，触发所述获取模块获取训练数据。

可选地，所述更新模块包括：

第一确定子模块，用于根据每一所述层级类目下的预测分类和分类标签，确定当前损失；

更新子模块，用于根据所述当前损失，对所述当前层级分类模型进行模型参数更新。

可选地，所述第一确定子模块包括：

第二确定子模块，用于针对每一所述层级类目，根据所述样本内容在该层级类目下的预测分类和分类标签，确定该层级类目的层级分类损失；

第三确定子模块，用于将每一所述层级分类损失之和为确定当前损失。

可选地，所述第一确定子模块包括：

第四确定子模块，用于针对所述N级类目中除最高层级类目外的每一其他层级类目，根据所述样本内容在该其他层级类目下的预测分类是否属于所述样本内容在该其他层级类目的上一层级类目下的预测分类的第一判别结果，所述样本内容在该其他层级类目的上一层级类目下的分类标签与预测分类是否一致的第二判别结果，以及所述样本内容在该其他层级类目下的分类标签与预测分类是否一致的第三判别结果，确定该其他层级类目对应的层级网络与其前一层级网络之间的层级间误分类损失；

第五确定子模块，用于针对每一所述层级类目，根据所述样本内容在该层级类目下的预测分类和分类标签，确定该层级类目的层级分类损失；

第六确定子模块，用于将每一所述层级间误分类损失、每一所述层级分类损失之和确定为当前损失。

另外，需要说明的是，上述模型训练装置可以独立于上述内容分类装置500，也可以集成在上述内容分类装置500中，本公开不作具体限定。

关于上述实施例中的装置，其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述，此处将不做详细阐述说明。

本公开还提供一种计算机可读存储介质，其上存储有计算机程序，该程序被处理器执行时实现本公开提供的上述内容分类方法的步骤。

图6是根据一示例性实施例示出的一种电子设备700的框图。如图6所示，该电子设备700可以包括：处理器701，存储器702。该电子设备700还可以包括多媒体组件703，输入/输出(I/O)接口704，以及通信组件705中的一者或多者。

其中，处理器701用于控制该电子设备700的整体操作，以完成上述的内容分类方法中的全部或部分步骤。存储器702用于存储各种类型的数据以支持在该电子设备700的操作，这些数据例如可以包括用于在该电子设备700上操作的任何应用程序或方法的指令，以及应用程序相关的数据，例如联系人数据、收发的消息、图片、音频、视频等等。该存储器702可以由任何类型的易失性或非易失性存储设备或者它们的组合实现，例如静态随机存取存储器(Static Random Access Memory，简称SRAM)，电可擦除可编程只读存储器(Electrically Erasable Programmable Read-Only Memory，简称EEPROM)，可擦除可编程只读存储器(Erasable Programmable Read-Only Memory，简称EPROM)，可编程只读存储器(Programmable Read-Only Memory，简称PROM)，只读存储器(Read-Only Memory，简称ROM)，磁存储器，快闪存储器，磁盘或光盘。多媒体组件703可以包括屏幕和音频组件。其中屏幕例如可以是触摸屏，音频组件用于输出和/或输入音频信号。例如，音频组件可以包括一个麦克风，麦克风用于接收外部音频信号。所接收的音频信号可以被进一步存储在存储器702或通过通信组件705发送。音频组件还包括至少一个扬声器，用于输出音频信号。I/O接口704为处理器701和其他接口模块之间提供接口，上述其他接口模块可以是键盘，鼠标，按钮等。这些按钮可以是虚拟按钮或者实体按钮。通信组件705用于该电子设备700与其他设备之间进行有线或无线通信。无线通信，例如Wi-Fi，蓝牙，近场通信(Near FieldCommunication，简称NFC)，2G、3G、4G、NB-IOT、eMTC、或其他5G等等，或它们中的一种或几种的组合，在此不做限定。因此相应的该通信组件705可以包括：Wi-Fi模块，蓝牙模块，NFC模块等等。

在一示例性实施例中，电子设备700可以被一个或多个应用专用集成电路(Application Specific Integrated Circuit，简称ASIC)、数字信号处理器(DigitalSignal Processor，简称DSP)、数字信号处理设备(Digital Signal Processing Device，简称DSPD)、可编程逻辑器件(Programmable Logic Device，简称PLD)、现场可编程门阵列(Field Programmable Gate Array，简称FPGA)、控制器、微控制器、微处理器或其他电子元件实现，用于执行上述的内容分类方法。

在另一示例性实施例中，还提供了一种包括程序指令的计算机可读存储介质，该程序指令被处理器执行时实现上述的内容分类方法的步骤。例如，该计算机可读存储介质可以为上述包括程序指令的存储器702，上述程序指令可由电子设备700的处理器701执行以完成上述的内容分类方法。

图7是根据一示例性实施例示出的一种电子设备1900的框图。例如，电子设备1900可以被提供为一服务器。参照图7，电子设备1900包括处理器1922，其数量可以为一个或多个，以及存储器1932，用于存储可由处理器1922执行的计算机程序。存储器1932中存储的计算机程序可以包括一个或一个以上的每一个对应于一组指令的模块。此外，处理器1922可以被配置为执行该计算机程序，以执行上述的内容分类方法。

另外，电子设备1900还可以包括电源组件1926和通信组件1950，该电源组件1926可以被配置为执行电子设备1900的电源管理，该通信组件1950可以被配置为实现电子设备1900的通信，例如，有线或无线通信。此外，该电子设备1900还可以包括输入/输出(I/O)接口1958。电子设备1900可以操作基于存储在存储器1932的操作***，例如WindowsServer^TM，Mac OS X^TM，Unix^TM，Linux^TM等等。

在另一示例性实施例中，还提供了一种包括程序指令的计算机可读存储介质，该程序指令被处理器执行时实现上述的内容分类方法的步骤。例如，该计算机可读存储介质可以为上述包括程序指令的存储器1932，上述程序指令可由电子设备1900的处理器1922执行以完成上述的内容分类方法。

在另一示例性实施例中，还提供一种计算机程序产品，该计算机程序产品包含能够由可编程的装置执行的计算机程序，该计算机程序具有当由该可编程的装置执行时用于执行上述的内容分类方法的代码部分。

以上结合附图详细描述了本公开的优选实施方式，但是，本公开并不限于上述实施方式中的具体细节，在本公开的技术构思范围内，可以对本公开的技术方案进行多种简单变型，这些简单变型均属于本公开的保护范围。

另外需要说明的是，在上述具体实施方式中所描述的各个具体技术特征，在不矛盾的情况下，可以通过任何合适的方式进行组合。为了避免不必要的重复，本公开对各种可能的组合方式不再另行说明。

此外，本公开的各种不同的实施方式之间也可以进行任意组合，只要其不违背本公开的思想，其同样应当视为本公开所公开的内容。

Claims

1.一种内容分类方法，其特征在于，包括：

提取待分类内容对应的目标特征信息；

2.根据权利要求1所述的方法，其特征在于，所述至少根据来自所述最低层级类目对应的层级网络的层级特征信息，确定所述目标分类，包括：

利用注意力机制提取所述目标特征信息的注意力特征信息；

3.根据权利要求1所述的方法，其特征在于，所述至少根据来自所述最低层级类目对应的层级网络的层级特征信息，确定所述目标分类，包括：

利用注意力机制提取所述目标特征信息的注意力特征信息；

4.根据权利要求1-3中任一项所述的方法，其特征在于，所述目标层级分类模型还包括与所述N级类目中除所述最低层级类目外的其他层级类目一一对应的第二分类器，其中，所述第二分类器与自身所对应的层级类目相对应的层级网络连接，用于在所述目标层级分类模型的训练阶段，根据来自与所述第二分类器自身连接的层级网络的层级特征信息，确定用作训练数据的样本内容在所述第二分类器自身所对应的层级类目下的预测分类。

5.根据权利要求4所述的方法，其特征在于，所述目标层级分类模型通过以下方式训练得到：

提取所述样本内容对应的样本特征信息；

6.根据权利要求5所述的方法，其特征在于，所述根据每一所述层级类目下的预测分类和分类标签，对所述当前层级分类模型进行模型参数更新，包括：

7.根据权利要求6所述的方法，其特征在于，所述根据每一所述层级类目下的预测分类和分类标签，确定当前损失，包括：

针对每一所述层级类目，根据所述样本内容在该层级类目下的预测分类和分类标签，确定该层级类目的层级分类损失；将每一所述层级分类损失之和为确定当前损失；或者

针对所述N级类目中除最高层级类目外的每一其他层级类目，根据所述样本内容在该其他层级类目下的预测分类是否属于所述样本内容在该其他层级类目的上一层级类目下的预测分类的第一判别结果，所述样本内容在该其他层级类目的上一层级类目下的分类标签与预测分类是否一致的第二判别结果，以及所述样本内容在该其他层级类目下的分类标签与预测分类是否一致的第三判别结果，确定该其他层级类目对应的层级网络与其前一层级网络之间的层级间误分类损失；针对每一所述层级类目，根据所述样本内容在该层级类目下的预测分类和分类标签，确定该层级类目的层级分类损失；将每一所述层级间误分类损失、每一所述层级分类损失之和确定为当前损失。

8.一种内容分类装置，其特征在于，包括：

第一提取模块，用于提取待分类内容对应的目标特征信息；

9.一种计算机可读存储介质，其上存储有计算机程序，其特征在于，该程序被处理器执行时实现权利要求1-7中任一项所述方法的步骤。

10.一种电子设备，其特征在于，包括：

存储器，其上存储有计算机程序；

处理器，用于执行所述存储器中的所述计算机程序，以实现权利要求1-7中任一项所述方法的步骤。