CN116597212A

CN116597212A - 一种基于动态区域检测的视频内容安全审核方法与终端

Info

Publication number: CN116597212A
Application number: CN202310561323.7A
Authority: CN
Inventors: 童同; 王恒健; 高钦泉; 邓炜
Original assignee: Fujian Deshi Technology Group Co ltd
Current assignee: Fujian Deshi Technology Group Co ltd
Priority date: 2023-05-18
Filing date: 2023-05-18
Publication date: 2023-08-15

Abstract

本发明公开了一种基于动态区域检测的视频内容安全审核方法与终端，获取当前视频画面，与前一视频画面进行比较，确定动态区域；对所述动态区域的画面进行预处理后输入预设的内容审核算法中，判断是否安全合法；通过前后两个画面的对比，确定视频画面的动态区域，即画面的重点区域，仅对动态区域的画面进行预处理和内容审核，保证该区域的有效检测像素，避免了细节的丢失，解决了画中画的问题，提升重点区域的检测力度和对小目标的检测率。

Description

一种基于动态区域检测的视频内容安全审核方法与终端

技术领域

本发明涉及内容审核技术领域，特别涉及一种基于动态区域检测的视频内容安全审核方法与终端。

背景技术

目前，一般对于视频画面的自动审核，由于算力大小的限制，算法输入分辨率需要限制在一定的大小内，以降低计算量。因此在AI分析预处理时必须将原视频画面做降采样。

而对于部分视频，特别是如画中画形式呈现的视频而言，则可能由于对原视频画面进行降采样处理，造成画面细节的丢失，使得小目标无法检测出来，特别是占画面比例过小的目标，同时，由于目标区域被压缩，细节丢失，也会导致检测率下降。

因此，如何实现对画中画视频画面有效、准确的审核，是当前所要解决的技术问题。

发明内容

本发明所要解决的技术问题是：提供一种基于动态区域检测的视频内容安全审核方法与终端，能够实现对画中画视频画面有效、准确的审核。

为了解决上述技术问题，本发明采用的技术方案为：

一种基于动态区域检测的视频内容安全审核方法，包括步骤：

S1、获取当前视频画面，与前一视频画面进行比较，确定动态区域；

S2、对所述动态区域的画面进行预处理后输入预设的内容审核算法中，判断是否安全合法。

为了解决上述技术问题，本发明采用的另一种技术方案为：

一种基于动态区域检测的视频内容安全审核终端，包括处理器、存储器以及存储在所述存储器中并可在所述处理器上运行的计算机程序，所述处理器执行所述计算机程序时实现以下步骤：

本发明的有益效果在于：本发明的一种基于动态区域检测的视频内容安全审核方法与终端，通过前后两个画面的对比，确定视频画面的动态区域，即画面的重点区域，仅对动态区域的画面进行预处理和内容审核，保证该区域的有效检测像素，避免了细节的丢失，解决了画中画的问题，提升重点区域的检测力度和对小目标的检测率。

附图说明

图1为本发明实施例的一种基于动态区域检测的视频内容安全审核方法的流程图；

图2为本发明实施例的一种基于动态区域检测的视频内容安全审核终端的结构图；

图3为本发明实施例的一种基于动态区域检测的视频内容安全审核方法的具体流程图；

标号说明：

1、一种基于动态区域检测的视频内容安全审核终端；2、处理器；3、存储器。

具体实施方式

为详细说明本发明的技术内容、所实现目的及效果，以下结合实施方式并配合附图予以说明。

请参照图1以及图3，一种基于动态区域检测的视频内容安全审核方法，包括步骤：

从上述描述可知，本发明的有益效果在于：本发明的一种基于动态区域检测的视频内容安全审核方法，通过前后两个画面的对比，确定视频画面的动态区域，即画面的重点区域，仅对动态区域的画面进行预处理和内容审核，保证该区域的有效检测像素，避免了细节的丢失，解决了画中画的问题，提升重点区域的检测力度和对小目标的检测率。

进一步地，所述步骤S1包括步骤：

S11、获取当前视频画面，判断是否存在当前视频画面的前一视频画面，若是则进入步骤S12，否则进入步骤S13；

S12、将所述当前视频画面与所述前一视频画面进行比较，确定动态区域；

S13、缓存所述当前视频画面，对所述当前视频画面进行预处理后输入预设的内容审核算法中，判断是否安全合法。

由上述描述可知，基于上述步骤，采用全画幅和动态区域交错检测的方式，在提升重点区域的检测力度和对小目标的检测率的同时，又能保证了动态区域以外的目标检测能力。

进一步地，所述预处理包括色彩转换和分辨率转换。

由上述描述可知，对画面进行色彩转换和分辨率转换，以降低后续分析所需的计算量。

进一步地，所述预设的内容审核算法采用混合目标检测和多标签分类的神经网络模型，包含提取图像特征的骨干网络、目标检测网络和多标签分类网络；

所述目标检测网络和多标签分类网络共享所述骨干网络；

所述内容审核算法将内容审核划分成识别具体违规类型的多个子任务，并依据子任务的特点，设定子任务使用的识别算法是目标检测网络或者多标签分类网络；

将视频图像输入提取图像特征的骨干网络，以提取视频图像的各维度图像特征；

将图像特征输入目标检测模块和多标签分类模块，以判断视频图像是否违规且属于何种违规。

由上述描述可知，将视频内容审核分解成多种子任务，依据子任务的特点选择使用多标签分类算法或者目标检测算法，并将两种算法融合到一个人工神经网络中，共享使用一个骨干网络提取特征，其速度快，需要计算资源少，且计算精度高，网络模型泛化性更好。

请参照图2，一种基于动态区域检测的视频内容安全审核终端，包括处理器、存储器以及存储在所述存储器中并可在所述处理器上运行的计算机程序，所述处理器执行所述计算机程序时实现以下步骤：

进一步地，所述步骤S1包括步骤：

进一步地，所述预处理包括色彩转换和分辨率转换。

所述目标检测网络和多标签分类网络共享所述骨干网络；

本发明的一种基于动态区域检测的视频内容安全审核方法与终端，适用于视频内容安全审核，尤其是对含有画中画的视频画面的内容安全审核。

请参照图1和图3，本发明的实施例一为：

所述步骤S1包括步骤：

本实施例中，获取视频画面后，若当前为缓存有其前一视频画面，则首先对原画面(当前视频画面)进行预处理，预处理包含色彩转换和分辨率转换。对预处理后的视频画面进行推理分析(内容审核)。

在进入后一视频画面的审核后，将后一视频画面与缓存的当前视频画面进行比较，计算出变化的区域，即动态区域，最后将动态区域做预处理后进行推理分析。

本实施例中，推理分析(内容审核)采用基于EasyDL平台定制的图像审核算法。

由于动态区域通常为整个画面的局部区域，其分辨率比整个画面的分辨率小，因此用局部区域的图作为分析画面，缩小到算法要求的分辨率的比例，会比原图缩小的比例小，避免目标细节因图像缩小而丢失，即可提高对画中画动态区域检测能力。

本发明的实施例二为：

一种基于动态区域检测的视频内容安全审核方法，与实施例一的区别在于，本实施例中对采用的内容审核算法进行说明。

本实施例中，内容审核算法采用混合目标检测和多标签分类的神经网络模型，包含提取图像特征的骨干网络、目标检测网络和多标签分类网络；

所述目标检测网络和多标签分类网络共享所述骨干网络；

请参照图3，本发明的实施例三为：

一种基于动态区域检测的视频内容安全审核终端1，包括处理器2、存储器3以及存储在所述存储器3中并可在所述处理器2上运行的计算机程序，所述处理器2执行所述计算机程序时实现以上实施例一或二中的步骤。

综上所述，本发明提供的一种基于动态区域检测的视频内容安全审核方法与终端，通过前后两个画面的对比，确定视频画面的动态区域，即画面的重点区域，仅对动态区域的画面进行预处理和内容审核，保证该区域的有效检测像素，避免了细节的丢失，解决了画中画的问题，提升重点区域的检测力度和对小目标的检测率。

以上所述仅为本发明的实施例，并非因此限制本发明的专利范围，凡是利用本发明说明书及附图内容所作的等同变换，或直接或间接运用在相关的技术领域，均同理包括在本发明的专利保护范围内。

Claims

1.一种基于动态区域检测的视频内容安全审核方法，其特征在于，包括步骤：

2.根据权利要求1所述的一种基于动态区域检测的视频内容安全审核方法，其特征在于，所述步骤S1包括步骤：

3.根据权利要求1或2所述的一种基于动态区域检测的视频内容安全审核方法，其特征在于，所述预处理包括色彩转换和分辨率转换。

4.根据权利要求1所述的一种基于动态区域检测的视频内容安全审核方法，其特征在于，所述预设的内容审核算法采用混合目标检测和多标签分类的神经网络模型，包含提取图像特征的骨干网络、目标检测网络和多标签分类网络；

所述目标检测网络和多标签分类网络共享所述骨干网络；

5.一种基于动态区域检测的视频内容安全审核终端，包括处理器、存储器以及存储在所述存储器中并可在所述处理器上运行的计算机程序，其特征在于，所述处理器执行所述计算机程序时实现以下步骤：

6.根据权利要求5所述的一种基于动态区域检测的视频内容安全审核终端，其特征在于，所述步骤S1包括步骤：

7.根据权利要求5或6所述的一种基于动态区域检测的视频内容安全审核终端，其特征在于，所述预处理包括色彩转换和分辨率转换。

8.根据权利要求5所述的一种基于动态区域检测的视频内容安全审核终端，其特征在于，所述预设的内容审核算法采用混合目标检测和多标签分类的神经网络模型，包含提取图像特征的骨干网络、目标检测网络和多标签分类网络；

所述目标检测网络和多标签分类网络共享所述骨干网络；