WO2021237570A1

WO2021237570A1 - 影像审核方法及装置、设备、存储介质

Info

Publication number: WO2021237570A1
Application number: PCT/CN2020/092923
Authority: WO
Inventors: 罗茂
Original assignee: 深圳市欢太科技有限公司; Oppo广东移动通信有限公司
Priority date: 2020-05-28
Filing date: 2020-05-28
Publication date: 2021-12-02
Also published as: CN115443490A

Abstract

影像审核方法包括：利用目标分类模型对待审影像文件进行特征提取，得到对应的特征向量；其中，目标分类模型是通过多个样本影像文件和对应的多种影像变换文件训练得到的；确定所述待审影像文件的特征向量与审核集合中的至少一个参考特征向量之间的相似度；根据确定的相似度与第一阈值之间的关系，确定待审影像文件是否是违规文件。还提供影像审核装置、设备和存储介质。

Description

影像审核方法及装置、设备、存储介质

技术领域

本申请实施例涉及互联网技术，涉及但不限于影像审核方法及装置、设备、存储介质。

背景技术

在互联网内容的审核业务中，“坏人”故意将违规的影像文件进行各种方式的变换，以“骗过”影像审核装置，进而将违规的影像文件传播到互联网。影像文件的变换方式多种多样，例如，旋转、液化、变形、噪点、渲染等基本变换方式或它们的组合。可见，“坏人”将违规的影像文件进行变换后上传至互联网，给影像审核装置带来了非常大的技术挑战。

发明内容

本申请实施例提供的影像审核方法及装置、设备、存储介质是这样实现的：

本申请实施例提供的影像审核方法，包括：利用目标分类模型对待审影像文件进行特征提取，得到对应的特征向量；其中，所述目标分类模型是通过多个样本影像文件和对应的多种影像变换文件训练得到的；确定所述待审影像文件的特征向量与审核集合中的至少一个参考特征向量之间的相似度；根据确定的所述相似度与第一阈值之间的关系，确定所述待审影像文件是否是违规文件。

本申请实施例提供的影像审核装置，包括：特征提取模块，配置为利用目标分类模型对待审影像文件进行特征提取，得到对应的特征向量；其中，所述目标分类模型是通过多个样本影像文件和对应的多种影像变换文件训练得到的；第一确定模块，配置为确定所述待审影像文件的特征向量与审核集合中的至少一个参考特征向量之间的相似度；审核模块，配置为根据确定的所述相似度与第一阈值之间的关系，确定所述待审影像文件是否是违规文件。

本申请实施例提供的电子设备，包括存储器和处理器，所述存储器存储有可在处理器上运行的计算机程序，所述处理器执行所述程序时实现本申请实施例任一所述影像审核方法中的步骤。

本申请实施例提供的计算机可读存储介质，其上存储有计算机程序，该计算机程序被处理器执行时实现本申请实施例任一所述影像审核方法中的步骤。

本申请实施例中，电子设备利用目标分类模型对待审影像文件进行特征提取，得到对应的特征向量；其中，所述目标分类模型是通过多个样本影像文件和对应的多种影像变换文件训练得到的；如此，即使待审影像文件是对原始文件进行旋转、液化、变形等多种变换处理后的文件，仍然能够提取与原始文件相一致的特征向量，从而实现对任意变换的影像文件的准确识别，进而能够增强影像审核方法的鲁棒性。

附图说明

图1为本申请实施例影像审核方法的示例性应用场景的示意图；

图2为本申请实施例影像审核方法的实现流程示意图；

图3为本申请实施例目标分类模型的训练过程示意图；

图4为本申请实施例审核集合的生成方法的实现流程示意图；

图5为本申请实施例第一阈值的确定方法的实现流程示意图；

图6为本申请实施例另一影像审核方法的实现流程示意图；

图7A为本申请实施例MobileNetV2的结构示意图；

图7B为本申请实施例特征提取结构的结构示意图；

图8为本申请实施例又一影像审核方法的实现流程示意图；

图9为本申请实施例再一影像审核方法的实现流程示意图；

图10为本申请实施例另一影像审核方法的实现流程示意图；

图11为本申请实施例又一影像审核方法的实现流程示意图；

图12为本申请实施例对原始图片进行变换操作的示意图；

图13为本申请实施例简化后的MobileNetV2结构示意图；

图14为sigmoid函数的曲线示意图；

图15为本申请实施例图片匹配的流程示意图；

图16为本申请实施例候选阈值为35至70时对应的recall和wrong_recall；

图17为本申请实施例候选阈值为50至55时对应的recall和wrong_recall；

图18为本申请实施例图片审核***的流程示意图；

图19为本申请实施例图片审核***中的Mobilehashnet算法流程示意图；

图20A为本申请实施例影像文件审核装置的结构示意图；

图20B为本申请实施例另一影像文件审核装置的结构示意图；

图21为本申请实施例的电子设备的硬件实体示意图。

具体实施方式

为使本申请实施例的目的、技术方案和优点更加清楚，下面将结合本申请实施例中的附图，对本申请的具体技术方案做进一步详细描述。以下实施例用于说明本申请，但不用来限制本申请的范围。

除非另有定义，本文所使用的所有的技术和科学术语与属于本申请的技术领域的技术人员通常理解的含义相同。本文中所使用的术语只是为了描述本申请实施例的目的，不是旨在限制本申请。

在以下的描述中，涉及到“一些实施例”，其描述了所有可能实施例的子集，但是可以理解，“一些实施例”可以是所有可能实施例的相同子集或不同子集，并且可以在不冲突的情况下相互结合。

需要指出，本申请实施例所涉及的术语“第一\第二\第三”仅仅是是区别类似或不同的对象，不代表针对对象的特定排序，可以理解地，“第一\第二\第三”在允许的情况下可以互换特定的顺序或先后次序，以使这里描述的本申请实施例能够以除了在这里图示或描述的以外的顺序实施。

下面首先说明本申请实施例提供的影像审核方法的示例性应用场景。

图1是本申请实施例提供的影像审核方法的示例性应用场景100的示意图。如图1 所示，场景100包括终端101、影像审核装置102和第二数据库103。其中，影像审核装置102，用于对用户在终端101输入的影像文件104进行审核，以确定该文件是否是违规文件；如果是违规文件，则禁止将该文件存储在第二数据库103中；反之，如果不是违规文件，即该文件是合规文件，则允许该文件存储在第二数据库103中，以便该用户或其他用户检索、浏览或下载该文件。

需要说明的是，终端101可以是移动电话(例如手机)、平板电脑、笔记本电脑等具有无线通信能力的移动终端，还可以是不便移动的具有计算功能的台式计算机、桌面电脑等。

影像审核装置102可以配置在终端101中，也可以独立于终端101而配置。应用场景100中可以有一个或多个影像审核装置102。多个影像审核装置102可以并行对不同用户输入的影像文件进行审核，从而提高数据处理速度。

第二数据库103除了可以独立于影像审核装置102和终端101的配置之外，在影像审核装置102配置在网络侧的情况下，第二数据库103还可以配置在影像审核装置102中。

在终端101、影像审核装置102和第二数据库103相互独立于不同的设备的情况下，终端101与影像审核装置102之间可以通过网络进行通信，影像审核装置102与第二数据库103之间也可以通过网络进行通信，该网络可以为无线网络或有线网络，本申请实施例在此不对通信方式进行具体限定。

本申请实施例提供一种影像审核方法，所述方法可以应用于具有影像审核装置的电子设备，所述电子设备可以是计算机设备、笔记本电脑、分布式计算架构中的任一节点服务器、移动终端等。所述影像审核方法所实现的功能可以通过所述电子设备中的处理器调用程序代码来实现，当然程序代码可以保存在计算机存储介质中。可见，所述电子设备至少包括处理器和存储介质。

图2为本申请实施例影像审核方法的实现流程示意图，如图2所示，所述方法可以包括以下步骤201至步骤203：

步骤201，利用目标分类模型对待审影像文件进行特征提取，得到对应的特征向量；其中，所述目标分类模型是通过多个样本影像文件和对应的多种影像变换文件训练得到的。

需要说明的是，目标分类模型可以是深度学习模型，例如为神经网络模型。对于该模型中所包含的层数不做限定。该模型可以是轻量级的神经网络模型，例如为MobileNetV2。当然，该模型也可以是非轻量级的神经网络模型。对于目标分类模型的训练过程，电子设备可以通过如下实施例的步骤301至304实现。

可以理解地，所谓影像变换文件，指的是对样本影像文件进行翻转、旋转、液化、缩放、剪裁、马赛克、噪声、变色或遮挡等变换处理或者这些变换方式的组合处理得到的文件。

待审影像文件可以是多种多样的，例如待审影像文件为一张图像或者一段视频(例如为短视频、直播视频、电影、电视剧等)。在待审影像文件为一段视频的情况下，电子设备可以从该视频中随机采样一帧或多帧视频帧图像，然后通过目标分类模型对这些图像进行特征提取，得到该视频对应的特征向量。

步骤202，确定所述待审影像文件的特征向量与审核集合中的至少一个参考特征向量之间的相似度。

通常情况下，为了保证审核准确率，待审影像文件为一张图像和为一段视频时，对应的审核集合可以是不同的。也就是说，待审影像文件为一张图像时，对应的审核集合中的参考特征向量是电子设备从一张图像中提取得到的。待审影像文件为一段视频时，对应的审核集合中的一个参考特征向量是电子设备从多张图像中提取得到的。总而言之，待审影像文件的特征向量的维度与参考特征向量的维度一致。当然，也可以不局限于上述规则。这两个特征向量的维度也可以是不同的。

表征相似度的参数类型可以是多种多样的，例如可以是汉明距离、欧氏距离或者余弦相似度等。

步骤203，根据确定的所述相似度与第一阈值之间的关系，确定所述待审影像文件是否是违规文件。

可以理解地，基于合规的参考影像文件生成的审核集合(为简便描述，以下称为合规集合)和基于违规的参考影像文件生成的审核集合(以下称为违规集合)，对应的判断准则是不同的。

以相似度通过汉明距离来表征为例，两个等长字符串之间的汉明距离指的是两个字符串对应位置的不同字符的个数。因此，汉明距离越小，说明两个特征向量越相似，对应的两个影像文件也越相似。对于违规集合来讲，在一个示例中，确定小于第一阈值的相似度的数目与相似度总数目的比值，当该比值大于第二阈值时，确定待审影像文件为违规文件。对于合规集合来讲，在一个示例中，当该比值大于第二阈值时，确定待审影像文件为合规文件。

确定待审影像文件是否是违规文件的方法可以是多种多样的。例如，电子设备可以通过如下实施例的步骤604至步骤606实现。再如，电子设备还可以通过如下实施例的步骤802至步骤809实现。相似度表征的是两个特征向量之间的不同特征的数目，审核集合为违规集合，电子设备可以每确定一次与参考特征向量之间的相似度，便统计一次当前小于第一阈值的相似度数目，如果该数目大于或等于第三阈值，则停止相似度的运算，确定待审影像文件为违规文件，以此作为审核结果输出。

又如，电子设备还可以通过以下实施例的步骤902至步骤904确定待审影像文件是否是违规文件。

在本申请实施例中，电子设备利用目标分类模型对待审影像文件进行特征提取，得到对应的特征向量；其中，所述目标分类模型是通过多个样本影像文件和对应的多种影像变换文件训练得到的；如此，即使待审影像文件是对原始文件进行旋转、液化、变形等多种变换处理后的文件，仍然能够提取与原始文件相一致的特征向量，从而实现对任意变换的影像文件的准确识别，进而能够增强影像审核方法的鲁棒性。

在一些实施例中，电子设备在对待审影像文件进行审核之前，可以预先地训练得到目标分类模型、生成审核集合和确定第一阈值；其中，

对于目标分类模型的训练过程，如图3所示，可以包括以下步骤301至步骤304。需要说明的是，电子设备可以在对待审影像文件进行特征提取之前，执行以下步骤301至步骤304。电子设备还可以在被配置为具有影像审核功能时，执行以下步骤301至步骤304。

步骤301，获取每一样本影像文件的类型标签。

可以理解地，样本影像文件包括违规的影像文件和合规的影像文件。违规的影像文件，例如可以是与恐怖、暴力、色情和赌博等相关的文件。合规的影像文件，例如可以是与自然风景和建筑物等相关的文件。电子设备可以从收集了多种多样的违规影像文件的第一数据库中采样得到部分违规的样本文件，从收集了多种多样的合规影像文件的第二数据库中采样得到部分合规的样本文件。

为了降低每一样本影像文件的标签标注工作，通常情况下，从第一数据库和第二数据库中选取一定数量的影像文件作为样本文件。例如，从这两个数据库中选取100张违规图像和100张合规图像作为样本影像文件。

步骤302，按照多种变换规则，对每一所述样本影像文件进行变换处理，得到对应文件的影像变换文件集合。

变换规则可以是多种多样的，例如，基本的变换规则包括翻转、旋转、液化、缩放、剪裁、马赛克、噪声、变色和遮挡等。组合的变换规则为至少两种基本的变换规则的组合。以上述9种基本的变换规则为例，组合的变换规则包括502种，即

在一个示例中，电子设备可以按照100种不同的变换规则，对样本影像文件进行变换处理，得到该文件对应的100个影像变换文件。

步骤303，将每一所述样本影像文件的类型标签，赋予给对应影像变换文件集合中的每一影像变换文件。

可以理解地，变换后的影像文件与变换前的影像文件的类型标签应该是一致的。例如，违规影像文件被进行了液化处理，液化处理后的文件仍然是违规的，其性质是不变的。因此，每一样本影像文件对应的影像变换文件的类型标签可以与该样本影像文件的类型标签一致。

步骤304，根据每一所述样本影像文件、每一所述影像变换文件和各自对应的类型标签，对特定的神经网络模型进行训练，得到所述目标分类模型。

在本申请实施例中，按照多种变换规则，对每一样本影像文件进行变换处理，得到对应文件的影像变换文件集合；将每一样本影像文件的类型标签，赋予给对应影像变换文件集合中的每一影像变换文件；根据每一所述样本影像文件、每一所述影像变换文件和各自对应的类型标签，对特定的神经网络模型进行训练，得到所述目标分类模型。

如此，一方面，训练样本中包括对样本影像文件进行多种变换得到的影像变换文件，这样能够丰富训练样本的多样性，使得训练得到的目标分类模型具有较好的鲁棒性。在基于该目标分类模型对待审影像文件进行审核时，能够对抗变换处理后的文件。即使用户在输入影像文件之前，对该文件进行了翻转、旋转、缩放、裁剪、马赛克等变换处理，也能够通过该模型准确地提取变换处理后的文件的特征向量，从而能够准确识别该文件是否是违规文件。简单来说，利用该模型对变换处理前和变换处理后的影像文件提取的特征向量基本一致，因此即使输入的影像文件是变换处理后的文件，电子设备也能够准确地识别出该文件是否是违规文件。

另一方面，在本申请实施例中，将每一样本影像文件的类型标签，赋予给对应影像变换文件集合中的每一影像变换文件；如此，在保证训练样本多样性的前提下，减少了人工标注成本，无需人工对每一影像变换文件标注类型标签。电子设备通过对样本影像文件进行变换处理，即可自动获取大量丰富多样的训练样本。

在一些实施例中，电子设备可以预先将已生成的审核集合加载至缓存中。对于加载的时机不做限定。例如，电子设备可以在利用目标分类模型对待审影像文件进行特征提取之前，加载已生成的审核集合；再如，电子设备还可以在对待审影像文件进行特征提取之后，且在确定待审影像文件的特征向量与审核集合中的至少一个参考特征向量之间的相似度之前，加载已生成的审核集合；又如，电子设备还可以在被配置为具有影像审核功能时，加载已生成的审核集合。

在一些实施例中，对于审核集合的生成方法，如图4所示，可以包括以下步骤401和步骤402：

步骤401，利用所述目标分类模型，对多个参考影像文件进行特征提取，得到对应文件的特征向量。

在一些实施例中，所述多个参考影像文件可以是违规文件，例如为第一数据库中的全部或部分文件，基于此得到的审核集合为违规集合。在另一些实施例中，所述多个参考影像文件可以是合规文件，例如为第二数据库中的全部或部分文件。如上文提到的，审核集合的性质不同，即合规集合和违规集合，在影像审核阶段，对应的判断准则也是不同的。

所述多个参考影像文件是数据库中的部分文件时，可以是电子设备从数据库中随机抽取的文件，还可以是数据库中一些具有代表性的文件，比如优先级比较高的一些文件。

步骤402，将每一所述参考影像文件的特征向量作为参考特征向量，生成所述审核集合。

在本申请实施例中，预先将审核集合加载至缓存区。这样，电子设备在对待审影像文件进行审核的过程中，无需对所述多个参考影像文件进行特征提取，以生成审核集合；而是，直接使用预先生成的审核集合进行影像审核即可。如此，能够节约特征提取处理的时间消耗，从而能够节约影像的审核时长。

在一些实施例中，电子设备可以预先将已确定的第一阈值加载至缓存中。对于加载的时机不做限定。例如，电子设备可以在确定所述待审影像文件是否是违规文件之前，加载已确定的第一阈值；再如，电子设备还可以在对待审影像文件进行特征提取之前，加载已确定的第一阈值；又如，电子设备还可以在被配置为具有影像审核功能时，加载已确定的第一阈值。

在一些实施例中，所述第一阈值的确定方法，如图5所示，可以包括以下步骤501至步骤503：

步骤501，在假设所述第一阈值分别为多个不同候选阈值的情况下，根据所述影像审核方法，确定多个验证影像文件是否是违规文件，从而得到每一所述候选阈值对应的审核结果集合。

在一些实施例中，所述多个验证影像文件可以包括违规影像文件和合规影像文件。验证影像文件与用于训练神经网络模型的文件不同。所述多个验证影像文件中还可以包括电子设备对原始影像文件进行多种变换处理后的文件。变换处理采用的变换规则可以与模型训练阶段采用的变换规则相同。

可以理解地，通过实施步骤501，能够得到基于每一候选阈值获得的审核结果集合。如表1所示，其中阈值1对应的审核结果集合为表1中的第2列的内容。

表1

	候选阈值1	候选阈值2	……	候选阈值N
验证影像文件1	1	1	……	1
验证影像文件2	0	1	……	1
……	……	……	……	……
验证影像文件M	1	1	……	0

其中，候选阈值所属列中的“1”表示对应的文件的审核结果为合规文件，“0”表示对应的文件的审核结果为违规文件。

步骤502，根据每一审核结果集合和每一所述验证影像文件的类型标签，确定在对应候选阈值下的正确召回率和错误召回率。

在一个示例中，正确召回率的计算公式如下式(1)所示：

错误召回率的计算公式如下式(2)所示：

在式(1)和式(2)中，TN表示将违规文件审核为违规文件的数量；FP表示将违规文件审核为合规文件的数量；FN表示将合规文件审核为违规文件的数量。

步骤503，将满足特定条件的正确召回率和错误召回率所对应的候选阈值，确定为所述第一阈值。

可以理解地，选择哪个候选阈值作为第一阈值，直接决定了影像审核方法的识别准确率。因此，应该在保证较高正确召回率的前提下，尽量地降低错误召回率，从而选择对应的候选阈值作为第一阈值。举例来说，在保证正确召回率大于或等于最小正确召回率(比如0.85)的情况下，选择最小错误召回率对应的候选阈值，作为第一阈值。

在一些实施例中，电子设备可以采用网格搜索法，逐渐逼近最佳值，从而从多个候选阈值中选择第一阈值。

本申请实施例再提供一种影像审核方法，图6为本申请实施例影像审核方法的实现流程示意图，如图6所示，所述方法可以包括以下步骤601至步骤606：

步骤601，获取所述目标分类模型的特征向量提取结构，所述特征向量提取结构包括所述目标分类模型的输入层至非线性激活层；其中，所述目标分类模型是通过多个样本影像文件和对应的多种影像变换文件训练得到的。

举例来说，目标分类模型可以为轻量级的神经网络模型MobileNetV2。该网络的结构，如图7A所示，包括“bottleneck结构”、conv2d层、sigmoid激活层、n×1维的全连接层(Dense)和归一化指数层(softmax)。在一些实施例中，如图7B所示，可以将“bottleneck结构”、conv2d层和sigmoid激活层作为特征向量提取结构。

步骤602，利用所述特征向量提取结构，对所述待审影像文件进行特征提取，得到对应的特征向量。

也就是说，特征向量提取结构的非线性激活层的输出即为该文件对应的特征向量。

步骤603，确定所述待审影像文件的特征向量与审核集合中的每一参考特征向量之间的相似度；其中，所述相似度用于表征两个特征向量之间的不同的特征数目；

步骤604，确定小于所述第一阈值的相似度的数目，所述相似度用于表征两个特征向量之间的不同的特征数目。

例如，相似度为汉明距离。

步骤605，确定所述数目与相似度总数目的比值；

步骤606，根据所述比值与第二阈值之间的关系，确定所述待审影像文件是否是违规文件。

可以理解地，在审核集合为违规集合的情况下，所述比值大于第二阈值时，确定待审影像文件为违规文件；所述比值小于或等于第二阈值时，确定该文件为合规文件。

在审核集合为合规集合的情况下，所述比值大于第二阈值时，确定待审影像文件为合规文件；所述比值小于或等于第二阈值时，确定该文件为违规文件。

在本申请实施例中，统计小于第一阈值的相似度的数目，确定该数目与确定的相似度总数目之间的比值；根据比值与第二阈值的关系，确定待审影像文件是否是违规文件；如此，相比于仅根据与一个参考特征向量的相似度，获得审核结果，这种方式获得的审核结果更为可靠，识别准确率更高。

本申请实施例再提供一种影像审核方法，图8为本申请实施例影像审核方法的实现流程示意图，如图8所示，所述方法可以包括以下步骤801至步骤809：

步骤801，利用目标分类模型对待审影像文件进行特征提取，得到对应的特征向量；其中，所述目标分类模型是通过多个样本影像文件和对应的多种影像变换文件训练得到的。

可以理解地，一个目标分类模型通常由多个顺序连接的层(layer)组成。第一层一般以图像为输入，通过特定的运算从图像中提取特征。接下来，每一层以前一层提取的特征作为输入，对其进行特定形式的变换，便可以得到更复杂一些的特征。这种层次化的特征提取过程可以累加，从而赋予了神经网络强大的特征提取能力。经过很多层的变换之后，神经网络就可以将初始输入的图像变换为更高层次的抽象的特征。

这种由简单到复杂、由低级到高级的抽象过程可以通过生活中的例子来体会。例如，在英语学习过程中，通过字母的组合，可以得到单词；通过单词的组合，可以得到句子；通过对句子的分析，可以了解语义；通过对语义的分析，可以获得表达的思想或目的。而这种语义、思想等，就是更高级别的抽象。

因此，在本申请实施例中，通过目标分类模型对待审影像文件进行特征提取时，无论待审影像文件是原始文件经过多么复杂的变换处理得到的，其提取的特征向量基本是不变的。这样，使得所述影像审核方法具有较强的鲁棒性，即使违规文件被变换处理后上传至网络，仍然能够被准确识别。

步骤802，确定所述待审影像文件的特征向量与所述审核集合中的第i个参考特征向量之间的相似度；其中，i大于0且小于或等于所述审核集合中的参考特征向量总数目；

步骤803，根据所述第i个参考特征向量对应的相似度与第一阈值之间的关系，确定所述待审影像文件是否是违规文件；如果是，执行步骤804；否则，执行步骤807；

所谓第i个参考特征向量对应的相似度，指的是待审影像文件的特征向量与第i个参考特征向量之间的相似度。

步骤804，统计所述待审影像文件是违规文件的第一确定次数；

步骤805，确定所述第一确定次数是否大于第三阈值；如果是，执行步骤806；否则，i+1，返回执行步骤802；

步骤806，输出所述待审影像文件是违规文件。

可以理解地，如果第一确定次数大于第三阈值，则足以可靠地确定待审影像文件是违规文件，此时无需再继续计算待审影像文件的特征向量与剩余参考特征向量之间的相似度了，从而节约运算量，缩短审核时长。

举例来说，假设审核集合包括10000个参考特征向量，第三阈值为900，相似度通过汉明距离表征。那么，在计算至第1000个参考特征向量对应的相似度时，第一确定次数为901。即，在第1个至第1000个参考特征向量对应的相似度中，有901个相似度小于第一阈值。至此可以结束影像审核流程，输出待审影像文件为违规文件的审核结果。而无需再继续计算与剩余的9000个参考特征向量之间的相似度了。

步骤807，统计所述待审影像文件是合规文件的第二确定次数；

步骤808，确定所述第二确定次数是否大于第四阈值；如果是，执行步骤809；否则，i+1，返回执行步骤802；

在一些实施例中，第四阈值大于第三阈值。这样，可以降低违规文件的误检率。

步骤809，输出所述待审影像文件是合规文件。

本申请实施例再提供一种影像审核方法，图9为本申请实施例影像审核方法的实现流程示意图，如图9所示，所述方法可以包括以下步骤901至步骤904：

步骤901，利用目标分类模型对待审影像文件进行特征提取，得到对应的特征向量；其中，所述目标分类模型是通过多个样本影像文件和对应的多种影像变换文件训练得到的；

步骤902，确定所述待审影像文件的特征向量与所述审核集合中的第i个参考特征向量之间的相似度；其中，i大于0且小于或等于所述审核集合中的参考特征向量总数目，所述参考特征向量对应的参考影像文件为违规文件；所述相似度用于表征两个特征向量之间的不同的特征数目；

步骤903，确定所述第i个参考特征向量对应的相似度是否小于第一阈值；如果是，执行步骤904；否则，i+1，返回执行步骤902；

步骤904，确定所述待审影像文件是违规文件，并输出该审核结果。

相比于上述步骤802至步骤809，这里，如果第i个参考特征向量对应的相似度小于第一阈值，则结束审核流程，输出待审影像文件是违规文件的审核结果；否则，继续遍历下一参考特征向量，直至确定待审影像文件是违规文件为止。当然，在一些实施例中，如果遍历审核集合中的每一参考特征向量，结果均为对应的相似度大于或等于第一阈值，则输出待审影像文件是合规文件的审核结果。

在相关技术中，通过将输入图片(即待审图片)与违规图库(即第一数据库的一种示例)中的图片进行相似度计算，以判断该输入图片是否违规。常用的相似度算法，比如感知哈希(pHash)算法和尺度不变特征转换(Scale-Invariant Feature Transform，SIFT)算法。

pHash算法，是通过人工设计的规则算法，该算法的基本原理是：获得输入图片的hash值，再通过计算该输入图片与违规图库中的一张图片的hash“距离”，从而得到这两张图片的相似度；当相似度大于设定的阈值时，则认为匹配成功。算法的实现过程如下：

缩小输入图片的尺寸；简化缩小后的图片的色彩；计算简化后的图片的平均值；基于平均值，比较像素的灰度；基于灰度，计算哈希值；基于哈希值，计算与违规图库中的一张图片的汉明距离；当汉明距离小于设定的阈值时，则确定匹配成功，输入图片为违规图片。

SIFT算法，用来侦测和描述图片中的局部性特征，它在空间尺度中寻找极值点，并提取出其位置、尺度、旋转不变量。局部特征的描述和侦测可以帮助辨识物体，SIFT特征是基于物体上的一些局部外观的兴趣点而与图片的大小和旋转无关。

然而，pHash算法和SIFT算法的算法因子(即图片特征抽取算子)均由人为设计，因此只能满足特定的匹配场景。pHash算法只能保持尺度缩放、变色的不变性；SIFT算法只能保持旋转、尺度缩放、亮度变化、仿射、噪声的不变性。

基于此，下面将说明本申请实施例在一个实际的应用场景中的示例性应用。

对于端到端的深度学习匹配算法，主要通过神经网络模型，直接计算两张图片是否匹配。实现流程如图10所示，分为训练阶段和预测阶段。训练阶段的基本流程包括以下步骤1001至步骤1004：

步骤1001，设计模型结构(包括卷积层、全连接层和池化层等)，得到初始的相似度模型，即神经网络模型；

步骤1002，准备大量图片数据作为训练样本；

步骤1003，对训练样本中的每张图片进行数据增强处理，比如，对图片分别进行旋转、镜像和渲染等，将同一张图片经过不同数据变换后得到的两张图片，组合为正样本(1)，其他变换后的图片作为负样本(0)。

步骤1004，通过梯度下降系列优化算法和数据增强后的训练样本，更新初始的相似度模型，得到训练好的相似度模型，即目标分类模型。

预测阶段的基本流程，如图10所示，包括步骤1005至步骤1007：

步骤1005，输入图片与违规图库中的每张图片进行相似度计算；

步骤1006，确定小于第一阈值的相似度数目与相似度总数目的比值是否大于第二阈值；如果是，执行步骤1007；

步骤1007，认为匹配成功，确定输入图片为违规图片。

端到端的深度学习匹配算法，深度学习模型含有多个通过梯度下降获得的卷积核，卷积核对图片特征的表达能力极强，基本满足所有图片变换场景。但是，在预测阶段，对于一个输入图片，需要循环地与图库中的所有图片进行匹配计算，再加上神经网络模型本身的计算消耗，其资源的消耗是无法接受的。

在本申请实施例中，结合hash和深度学习的特点，采用深度神经网络抽取图片特征，获得图片hash，即特征向量的一种示例；比较两张图片hash的相似度，判断是否匹配成功。

以下详细描述本申请实施例提供的影像审核方法的实现流程，如图11所示，该流程可以包括以下Step1至Step4)：

Step1)数据准备。准备200张原始图片，如图12所示，对每张原始图片进行翻转、旋转、缩放、裁剪、液化、马赛克、噪声、变色、遮挡等图片变换操作，或者它们的组合变换。对每张图片进行100次不同的变换操作，这样总共获得20000个样本。

Step2)设计模型。选用轻量级的深度神经网络MobileNetV2作为特征提取器。在对该模型进行训练之前，对MobileNetV2网络结构进行修改，MobileNetV2的原结构如下表2所示，其中，表头“Input”为该结构层输入的大小，“Operator”为该层的结构类型，“c”为该层的输出特征层维度，“n”为该层的重复次数，“s”为深度卷积核的步数。

表2

Num	Input	Operator	c	n	s
1	224 ²×3	Conv2d	32	1	2
2	112 ²×32	bottleneck	16	1	1
3	112 ²×16	bottleneck	24	2	2
4	56 ²×24	bottleneck	32	3	2
5	28 ²×32	bottleneck	64	4	2
6	14 ²×64	bottleneck	96	3	1
7	14 ²×96	bottleneck	160	3	2
8	7 ²×160	bottleneck	320	1	1
9	7 ²×320	Conv2d 1×1	1280	1	1
10	7 ²×1280	Avgpool 7×7	-	1	-
11	1×1×1280	Conv2d 1×1	k	-	-
12	k×1	Active-Softmax	k	-	-

MobileNetV2的第11层的输入大小固定为1×1×1280，采用k个1×1大小的卷积核进行卷积计算，从而输出长度为k的1维向量。最后，连接softmax激活层，从而计算得到k个类别的概率。

为了便于描述，将表2所示的第1至10层简称为“bottleneck结构”，简化后的MobileNetV2结构如图13所示。

对MobileNetV2结构进行如下修改：在conv2d层与softmax层中间，添加一层sigmoid激活层与n×1维的全连接层(Dense)。修改后的MobileNetV2结构如图7A所示。

Step3)模型训练阶段。

将Step1中得到的20000张图片作为训练样本，200张原始图片作为训练样本的标签，训练一个图片分类模型，即特定的神经网络模型。对应到图7A中，k＝200，n为需要编码hash的维度(例如取为300)。训练图7A中所示的修改后的MobileNetV2分类模型。

模型损失函数为多分类的交叉熵损失(categorical_crossentropy)，优化算法为Adam，学习率固定为0.001，训练得到的模型准确率>99.5％。

Step4)匹配阶段。

加载Step3得到的模型参数，为了得到图片的hash值，删除模型的最后两层，即Dense层与softmax层，修改后的模型如图7B所示。为便于描述，将此模型称为“Mobilehashnet”，即特征向量提取结构的一种示例。将基于该模型实现的图片审核方法称为Mobilehashnet算法。

此时模型的输出为一个长度为n(例如为300)的1维向量，如图14所示，由于激活函数为sigmoid，sigmoid输出的取值范围为(0，1)。然后，根据输出<0.5则取0，输出>0.5则取1的原则，对输出进行过滤，最终得到长度为300、取值为0或1的hash向量，即特征向量。

需要说明的是，之所以将提取的特征向量称为hash向量，是因为即使输入图片是原始图片被变换处理后的图片，Mobilehashnet提取的特征向量仍然与原始图片的特征向量一致。

如图15所示，在获得图片1和图片2的hash向量之后，即可根据图片的hash向量，计算两张图片的汉明距离。距离越小两张图片越相似。匹配的实现可规定一个第一阈值，当汉明距离低于第一阈值时，则认为两张图片为同一张图片，匹配成功；否则，匹配失败。

需要说明的是，这里对于第一阈值的选取，需要预先通过验证获得。其中验证集的准备过程与上述训练集相同。准备若干非训练集中的图片，进行数据增强，计算不同候选阈值下，匹配模型的正确召回率(recall)和错误召回率(wrong_recall)。

一个好的匹配模型，应在保证正确召回率的前提下，尽量降低错误召回率。在一些实施例中，可以采用网格搜索法，逐渐逼近最佳值，网格搜索结果如图16和图17所示；其中，图16示出了候选阈值为35至70时，对应的recall和wrong_recall。图17示出了候选阈值为50至55时，对应的recall和wrong_recall。

在一个示例中，在候选阈值＝52处，recall＝0.85，wrong_recall＝0.15，是一个好的取值。这是因为，在保证recall的值大于或等于0.85的前提下，wrong_recall的值越小越好，因此可以将最小wrong_recall对应的候选阈值确定为第一阈值。

hash维度直接决定了修改后的MobileNetV2结构中2d卷积层(conv2d1×1)的卷积核个数以及激活层的输出维度n，由于处于网络结构的末端，其大小直接影响模型的学习能力。hash维度过小，将导致模型欠拟合，并降低图库的数量限制；维度过大不仅增加了生成hash的耗时，并增加了计算汉明距离的耗时，所以需要选择一个合理的hash维度。

在一个示例中，hash维度n取为原始图片数量(分类种类)的1.5倍，即，n＝1.5×200＝300。

可以理解地，相对于依靠纯人工设计的计算因子，Mobilehashnet采用深度神经网络提取图片特征，理论上具有性能优势。为了更直观地说明其高性能特点，在不同图片变换方式下，进行Mobilehashnet算法与Phash算法、SIFT算法的匹配性能对比，实验结果如表3所示。

表3

从表3所示的对比结果中可以看出，Phash算法在翻转、旋转、缩放等图片变换中基本无法进行匹配；SIFT算法在所有图片变化种类中，recall均处于较低值。而本申请实施例中，Mobilehashnet算法在翻转、扭曲、剪切、马赛克、噪声的图片变换中，能达到100％的recall，且在其余图片变换中，recall值均较高，wrong_recall值均较低。

相比于相关技术中通过人工标注大量样本训练一个图片分类模型，在本申请实施例所提供的Mobilehashnet算法中，无需通过人工大量标注样本即可进行训练，通过图片数据增强技术自动获取大量训练样本。

本申请实施例所提供的Mobilehashnet算法，通过采用深度神经网络提取图片特征，基于这些特征生成图片hash，并进行图片匹配。相比于相关图片匹配/相似度算法，有效地提高了正确召回率，降低了错误召回率，且无需人工大量标注数据。

图片审核***对用户上传的图片进行审核，防止大量违法违规图片的传播。由于图片内容的复杂性，如图18所示，图片审核***流程包括了违规图库匹配模型、图片分类模型、人脸识别模型、文字识别模型、文本分类模型。待审图片依次经过各个模型进行审核，当所有模型结果均为“正常”时，其审核结果才能是“正常”，即是合规图片；否则，则为违规图片。

其中，图片审核***中的违规图库匹配模型，可由本申请实施例提供的Mobilehashnet算法实现，保证匹配的高的正确召回率与低的错误召回率。该算法的实现流程如图19所示，提取待审图片的hash向量；确定该hash向量与违规图库对应的违规hash库中的每一hash向量的汉明距离，即批量计算汉明距离；判断每一汉明距离是否大于第一阈值，从而获得召回结果，即正确召回率和错误召回率。

在一些实施例中，违规hash库在***初始化时即可获得，匹配时仅需进行一次hash计算，即仅需对待审图片进行特征提取即可。

基于前述的实施例，本申请实施例提供的影像文件审核装置，包括所包括的各模块、以及各模块所包括的各单元，可以通过终端中的处理器来实现；当然也可通过具体的逻辑电路实现；在实施的过程中，处理器可以为中央处理器(CPU)、微处理器(MPU)、数字信号处理器(DSP)或现场可编程门阵列(FPGA)等。

图20A为本申请实施例影像文件审核装置的结构示意图，如图20A所示，所述装置200包括特征提取模块201、第一确定模块202和审核模块203，其中：

特征提取模块201，配置为利用目标分类模型对待审影像文件进行特征提取，得到对应的特征向量；其中，所述目标分类模型是通过多个样本影像文件和对应的多种影像变换文件训练得到的；

第一确定模块202，配置为确定所述待审影像文件的特征向量与审核集合中的至少一个参考特征向量之间的相似度；

审核模块203，配置为根据确定的所述相似度与第一阈值之间的关系，确定所述待审影像文件是否是违规文件。

在一些实施例中，特征提取模块201，配置为：获取所述目标分类模型的特征向量提取结构，所述特征向量提取结构包括所述目标分类模型的输入层至非线性激活层；其中，所述目标分类模型的类型为神经网络模型；利用所述特征向量提取结构，对所述待审影像文件进行特征提取，得到对应的特征向量。

在一些实施例中，如图20B所示，影像审核装置200还包括：标签获取模块204，配置为获取每一所述样本影像文件的类型标签；变换处理模块205，配置为按照多种变换规则，对每一所述样本影像文件进行变换处理，得到对应文件的影像变换文件集合；标签标注模块206，配置为将每一所述样本影像文件的类型标签，赋予给对应影像变换文件集合中的每一影像变换文件；模型训练模块207，配置为根据每一所述样本影像文件、每一所述影像变换文件和各自对应的类型标签，对特定的神经网络模型进行训练，得到所述目标分类模型。

在一些实施例中，审核模块203，配置为：确定小于所述第一阈值的相似度的数目，所述相似度用于表征两个特征向量之间的不同的特征数目；确定所述数目与相似度总数目的比值；根据所述比值与第二阈值之间的关系，确定所述待审影像文件是否是违规文件。

在一些实施例中，第一确定模块202，配置为：确定所述待审影像文件的特征向量与所述审核集合中的第i个参考特征向量之间的相似度；其中，i大于0且小于或等于所述审核集合中的参考特征向量总数目；所述相似度用于表征两个特征向量之间的不同的特征数目，所述参考特征向量对应的参考影像文件为违规文件；相应地，审核模块203，配置为在所述第i个参考特征向量对应的相似度小于所述第一阈值的情况下，确定所述待审影像文件是违规文件。

在一些实施例中，第一确定模块202，还配置为：在所述第i个参考特征向量对应的相似度大于或等于所述第一阈值时，确定所述待审影像文件的特征向量与所述审核集合中的第i+1个参考特征向量之间的相似度，以确定所述待审影像文件是否是违规文件。

在一些实施例中，如图20B所示，影像审核装置200，还包括：加载模块208，配置为加载已生成的所述审核集合；相应地，特征提取模块201，还配置为：利用所述目标分类模型，对多个参考影像文件进行特征提取，得到对应文件的特征向量；将每一所述参考影像文件的特征向量作为参考特征向量，生成所述审核集合。

在一些实施例中，加载模块208，配置为加载已确定的所述第一阈值；

相应地，所述装置还包括第二确定模块，配置为：在假设所述第一阈值分别为多个不同候选阈值的情况下，利用所述装置的特征提取模块、第一确定模块和审核模块，确定多个验证影像文件是否是违规文件，从而得到每一所述候选阈值对应的审核结果集合；根据每一审核结果集合和每一所述验证影像文件的类型标签，确定在对应候选阈值下的正确召回率和错误召回率；将满足特定条件的正确召回率和错误召回率所对应的候选阈值，确定为所述第一阈值。

以上装置实施例的描述，与上述方法实施例的描述是类似的，具有同方法实施例相似的有益效果。对于本申请装置实施例中未披露的技术细节，请参照本申请方法实施例的描述而理解。

需要说明的是，本申请实施例中，如果以软件功能模块的形式实现上述的影像审核方法，并作为独立的产品销售或使用时，也可以存储在一个计算机可读取存储介质中。基于这样的理解，本申请实施例的技术方案本质上或者说对相关技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得电子设备执行本申请各个实施例所述方法的全部或部分。而前述的存储介质包括：U盘、移动硬盘、只读存储器(Read Only Memory，ROM)、磁碟或者光盘等各种可以存储程序代码的介质。这样，本申请实施例不限制于任何特定的硬件和软件结合。

对应地，本申请实施例提供一种电子设备，图21为本申请实施例的电子设备的硬件实体示意图，如图21所示，所述电子设备210包括存储器211和处理器212，所述存储器211存储有可在处理器212上运行的计算机程序，所述处理器212执行所述程序时实现上述实施例中提供的影像审核方法中的步骤。

需要说明的是，存储器211配置为存储由处理器212可执行的指令和应用，还可以缓存待处理器212以及电子设备210中各模块待处理或已经处理的数据(例如，图像数据、音频数据、语音通信数据和视频通信数据)，可以通过闪存(FLASH)或随机访问存储器(Random Access Memory，RAM)实现。

对应地，本申请实施例提供一种计算机可读存储介质，其上存储有计算机程序，该计算机程序被处理器执行时实现上述实施例中提供的影像审核方法中的步骤。

这里需要指出的是：以上存储介质、芯片和终端设备实施例的描述，与上述方法实施例的描述是类似的，具有同方法实施例相似的有益效果。对于本申请存储介质、芯片和终端设备实施例中未披露的技术细节，请参照本申请方法实施例的描述而理解。

应理解，说明书通篇中提到的“一个实施例”或“一实施例”或“一些实施例”意味着与实施例有关的特定特征、结构或特性包括在本申请的至少一个实施例中。因此，在整个说明书各处出现的“在一个实施例中”或“在一实施例中”或“在一些实施例中”未必一定指相同的实施例。此外，这些特定的特征、结构或特性可以任意适合的方式结合在一个或多个实施例中。应理解，在本申请的各种实施例中，上述各过程的序号的大小并不意味着执行顺序的先后，各过程的执行顺序应以其功能和内在逻辑确定，而不应对本申请实施例的实施过程构成任何限定。上述本申请实施例序号仅仅为了描述，不代表实施例的优劣。

需要说明的是，在本文中，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括该要素的过程、方法、物品或者设备中还存在另外的相同要素。

在本申请所提供的几个实施例中，应该理解到，所揭露的设备和方法，可以通过其它的方式实现。以上所描述的触摸屏***的实施例仅仅是示意性的，例如，所述模块的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，如：多个模块或组件可以结合，或可以集成到另一个***，或一些特征可以忽略，或不执行。另外，所显示或讨论的各组成部分相互之间的耦合、或直接耦合、或通信连接可以是通过一些接口，设备或模块的间接耦合或通信连接，可以是电性的、机械的或其它形式的。

上述作为分离部件说明的模块可以是、或也可以不是物理上分开的，作为模块显示的部件可以是、或也可以不是物理模块；既可以位于一个地方，也可以分布到多个网络单元上；可以根据实际的需要选择其中的部分或全部模块来实现本实施例方案的目的。

另外，在本申请各实施例中的各功能模块可以全部集成在一个处理单元中，也可以是各模块分别单独作为一个单元，也可以两个或两个以上模块集成在一个单元中；上述集成的模块既可以采用硬件的形式实现，也可以采用硬件加软件功能单元的形式实现。

本领域普通技术人员可以理解：实现上述方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成，前述的程序可以存储于计算机可读取存储介质中，该程序在执行时，执行包括上述方法实施例的步骤；而前述的存储介质包括：移动存储设备、只读存储器(Read Only Memory，ROM)、磁碟或者光盘等各种可以存储程序代码的介质。

或者，本申请上述集成的单元如果以软件功能模块的形式实现并作为独立的产品销售或使用时，也可以存储在一个计算机可读取存储介质中。基于这样的理解，本申请实施例的技术方案本质上或者说对相关技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得电子设备执行本申请各个实施例所述方法的全部或部分。而前述的存储介质包括：移动存储设备、ROM、磁碟或者光盘等各种可以存储程序代码的介质。

本申请所提供的几个方法实施例中所揭露的方法，在不冲突的情况下可以任意组合，得到新的方法实施例。

本申请所提供的几个产品实施例中所揭露的特征，在不冲突的情况下可以任意组合，得到新的产品实施例。

本申请所提供的几个方法或设备实施例中所揭露的特征，在不冲突的情况下可以任意组合，得到新的方法实施例或设备实施例。

以上所述，仅为本申请的实施方式，但本申请的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本申请揭露的技术范围内，可轻易想到变化或替换，都应涵盖在本申请的保护范围之内。因此，本申请的保护范围应以所述权利要求的保护范围为准。

Claims

影像审核方法，所述方法包括：

利用目标分类模型对待审影像文件进行特征提取，得到对应的特征向量；其中，所述目标分类模型是通过多个样本影像文件和对应的多种影像变换文件训练得到的；

确定所述待审影像文件的特征向量与审核集合中的至少一个参考特征向量之间的相似度；

根据确定的所述相似度与第一阈值之间的关系，确定所述待审影像文件是否是违规文件。
根据权利要求1所述的方法，其中，所述目标分类模型的类型为神经网络模型，所述利用目标分类模型对待审影像文件进行特征提取，得到对应的特征向量，包括：

获取所述目标分类模型的特征向量提取结构，所述特征向量提取结构包括所述目标分类模型的输入层至非线性激活层；

利用所述特征向量提取结构，对所述待审影像文件进行特征提取，得到对应的特征向量。
根据权利要求1或2所述的方法，其中，所述目标分类模型的训练过程，包括：

获取每一所述样本影像文件的类型标签；

按照多种变换规则，对每一所述样本影像文件进行变换处理，得到对应文件的影像变换文件集合；

将每一所述样本影像文件的类型标签，赋予给对应影像变换文件集合中的每一影像变换文件；

根据每一所述样本影像文件、每一所述影像变换文件和各自对应的类型标签，对特定的神经网络模型进行训练，得到所述目标分类模型。
根据权利要求1所述的方法，其中，所述根据确定的所述相似度与第一阈值之间的关系，确定所述待审影像文件是否是违规文件，包括：

确定小于所述第一阈值的相似度的数目，所述相似度用于表征两个特征向量之间的不同的特征数目；

确定所述数目与相似度总数目的比值；

根据所述比值与第二阈值之间的关系，确定所述待审影像文件是否是违规文件。
根据权利要求1所述的方法，其中，所述相似度用于表征两个特征向量之间的不同的特征数目，所述参考特征向量对应的参考影像文件为违规文件；

所述确定所述待审影像文件的特征向量与审核集合中的至少一个参考特征向量之间的相似度，包括：

确定所述待审影像文件的特征向量与所述审核集合中的第i个参考特征向量之间的相似度；其中，i大于0且小于或等于所述审核集合中的参考特征向量总数目；

相应地，所述根据确定的所述相似度与第一阈值之间的关系，确定所述待审影像文件是否是违规文件，包括：

在所述第i个参考特征向量对应的相似度小于所述第一阈值的情况下，确定所述待审影像文件是违规文件。
根据权利要求5所述的方法，其中，还包括：

在所述第i个参考特征向量对应的相似度大于或等于所述第一阈值时，确定所述待审影像文件的特征向量与所述审核集合中的第i+1个参考特征向量之间的相似度，以确定所述待审影像文件是否是违规文件。
根据权利要求1至6任一项所述的方法，其中，还包括：加载已生成的所述审核集合；

所述审核集合的生成方法，包括：

利用所述目标分类模型，对多个参考影像文件进行特征提取，得到对应文件的特征向量；

将每一所述参考影像文件的特征向量作为参考特征向量，生成所述审核集合。
根据权利要求1至6任一项所述的方法，其中，还包括：加载已确定的所述第一阈值；其中，所述第一阈值的确定方法包括：

在假设所述第一阈值分别为多个不同候选阈值的情况下，根据所述影像审核方法，确定多个验证影像文件是否是违规文件，从而得到每一所述候选阈值对应的审核结果集合；

根据每一审核结果集合和每一所述验证影像文件的类型标签，确定在对应候选阈值下的正确召回率和错误召回率；

将满足特定条件的正确召回率和错误召回率所对应的候选阈值，确定为所述第一阈值。
影像审核装置，包括：

特征提取模块，配置为利用目标分类模型对待审影像文件进行特征提取，得到对应的特征向量；其中，所述目标分类模型是通过多个样本影像文件和对应的多种影像变换文件训练得到的；

第一确定模块，配置为确定所述待审影像文件的特征向量与审核集合中的至少一个参考特征向量之间的相似度；

审核模块，配置为根据确定的所述相似度与第一阈值之间的关系，确定所述待审影像文件是否是违规文件。
根据权利要求9所述的装置，其中，所述特征提取模块，配置为：

获取所述目标分类模型的特征向量提取结构，所述特征向量提取结构包括所述目标分类模型的输入层至非线性激活层；其中，所述目标分类模型的类型为神经网络模型；

利用所述特征向量提取结构，对所述待审影像文件进行特征提取，得到对应的特征向量。
根据权利要求9或10所述的装置，其中，还包括：

标签获取模块，配置为获取每一所述样本影像文件的类型标签；

变换处理模块，配置为按照多种变换规则，对每一所述样本影像文件进行变换处理，得到对应文件的影像变换文件集合；

标签标注模块，配置为将每一所述样本影像文件的类型标签，赋予给对应影像变换文件集合中的每一影像变换文件；

模型训练模块，配置为根据每一所述样本影像文件、每一所述影像变换文件和各自对应的类型标签，对特定的神经网络模型进行训练，得到所述目标分类模型。
根据权利要求9所述的装置，其中，所述审核模块，配置为：

确定小于所述第一阈值的相似度的数目，所述相似度用于表征两个特征向量之间的不同的特征数目；

确定所述数目与相似度总数目的比值；

根据所述比值与第二阈值之间的关系，确定所述待审影像文件是否是违规文件。
根据权利要求9所述的装置，其中，

所述第一确定模块，配置为：确定所述待审影像文件的特征向量与所述审核集合中的第i个参考特征向量之间的相似度；

其中，i大于0且小于或等于所述审核集合中的参考特征向量总数目；所述相似度用于表征两个特征向量之间的不同的特征数目，所述参考特征向量对应的参考影像文件为违规文件；

相应地，所述审核模块，配置为在所述第i个参考特征向量对应的相似度小于所述第一阈值的情况下，确定所述待审影像文件是违规文件。
根据权利要求13所述的装置，其中，所述第一确定模块，还配置为：

在所述第i个参考特征向量对应的相似度大于或等于所述第一阈值时，确定所述待审影像文件的特征向量与所述审核集合中的第i+1个参考特征向量之间的相似度，以确定所述待审影像文件是否是违规文件。
根据权利要求9至14任一所述的装置，其中，还包括：

加载模块，配置为加载已生成的所述审核集合；

相应地，所述特征提取模块，还配置为：利用所述目标分类模型，对多个参考影像文件进行特征提取，得到对应文件的特征向量；将每一所述参考影像文件的特征向量作为参考特征向量，生成所述审核集合。
根据权利要求9至14任一所述的装置，其中，还包括：

加载模块，配置为加载已确定的所述第一阈值；

相应地，所述装置还包括第二确定模块，配置为：在假设所述第一阈值分别为多个不同候选阈值的情况下，利用所述装置的特征提取模块、第一确定模块和审核模块，确定多个验证影像文件是否是违规文件，从而得到每一所述候选阈值对应的审核结果集合；根据每一审核结果集合和每一所述验证影像文件的类型标签，确定在对应候选阈值下的正确召回率和错误召回率；将满足特定条件的正确召回率和错误召回率所对应的候选阈值，确定为所述第一阈值。
电子设备，包括存储器和处理器，所述存储器存储有可在处理器上运行的计算机程序，所述处理器执行所述程序时实现权利要求1至8任一项所述影像审核方法中的步骤。
计算机可读存储介质，其上存储有计算机程序，该计算机程序被处理器执行时实现权利要求1至8任一项所述影像审核方法中的步骤。