CN116597212A - 一种基于动态区域检测的视频内容安全审核方法与终端 - Google Patents
一种基于动态区域检测的视频内容安全审核方法与终端 Download PDFInfo
- Publication number
- CN116597212A CN116597212A CN202310561323.7A CN202310561323A CN116597212A CN 116597212 A CN116597212 A CN 116597212A CN 202310561323 A CN202310561323 A CN 202310561323A CN 116597212 A CN116597212 A CN 116597212A
- Authority
- CN
- China
- Prior art keywords
- picture
- video picture
- dynamic region
- current video
- network
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000001514 detection method Methods 0.000 title claims abstract description 81
- 238000000034 method Methods 0.000 title claims abstract description 23
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 36
- 238000007781 pre-processing Methods 0.000 claims abstract description 19
- 238000006243 chemical reaction Methods 0.000 claims description 14
- 238000012550 audit Methods 0.000 claims description 13
- 238000004590 computer program Methods 0.000 claims description 8
- 238000003062 neural network model Methods 0.000 claims description 5
- 238000004364 calculation method Methods 0.000 description 4
- 230000009286 beneficial effect Effects 0.000 description 3
- 238000013528 artificial neural network Methods 0.000 description 2
- 238000007635 classification algorithm Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N5/00—Details of television systems
- H04N5/44—Receiver circuitry for the reception of television signals according to analogue transmission standards
- H04N5/445—Receiver circuitry for the reception of television signals according to analogue transmission standards for displaying additional information
- H04N5/45—Picture in picture, e.g. displaying simultaneously another television channel in a region of the screen
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/764—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using classification, e.g. of video objects
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/77—Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
- G06V10/80—Fusion, i.e. combining data from various sources at the sensor level, preprocessing level, feature extraction level or classification level
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/40—Scenes; Scene-specific elements in video content
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V2201/00—Indexing scheme relating to image or video recognition or understanding
- G06V2201/07—Target detection
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Multimedia (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Artificial Intelligence (AREA)
- Databases & Information Systems (AREA)
- Evolutionary Computation (AREA)
- General Health & Medical Sciences (AREA)
- Medical Informatics (AREA)
- Software Systems (AREA)
- Computing Systems (AREA)
- Health & Medical Sciences (AREA)
- Signal Processing (AREA)
- Image Analysis (AREA)
Abstract
本发明公开了一种基于动态区域检测的视频内容安全审核方法与终端,获取当前视频画面,与前一视频画面进行比较,确定动态区域;对所述动态区域的画面进行预处理后输入预设的内容审核算法中,判断是否安全合法;通过前后两个画面的对比,确定视频画面的动态区域,即画面的重点区域,仅对动态区域的画面进行预处理和内容审核,保证该区域的有效检测像素,避免了细节的丢失,解决了画中画的问题,提升重点区域的检测力度和对小目标的检测率。
Description
技术领域
本发明涉及内容审核技术领域,特别涉及一种基于动态区域检测的视频内容安全审核方法与终端。
背景技术
目前,一般对于视频画面的自动审核,由于算力大小的限制,算法输入分辨率需要限制在一定的大小内,以降低计算量。因此在AI分析预处理时必须将原视频画面做降采样。
而对于部分视频,特别是如画中画形式呈现的视频而言,则可能由于对原视频画面进行降采样处理,造成画面细节的丢失,使得小目标无法检测出来,特别是占画面比例过小的目标,同时,由于目标区域被压缩,细节丢失,也会导致检测率下降。
因此,如何实现对画中画视频画面有效、准确的审核,是当前所要解决的技术问题。
发明内容
本发明所要解决的技术问题是:提供一种基于动态区域检测的视频内容安全审核方法与终端,能够实现对画中画视频画面有效、准确的审核。
为了解决上述技术问题,本发明采用的技术方案为:
一种基于动态区域检测的视频内容安全审核方法,包括步骤:
S1、获取当前视频画面,与前一视频画面进行比较,确定动态区域;
S2、对所述动态区域的画面进行预处理后输入预设的内容审核算法中,判断是否安全合法。
为了解决上述技术问题,本发明采用的另一种技术方案为:
一种基于动态区域检测的视频内容安全审核终端,包括处理器、存储器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现以下步骤:
S1、获取当前视频画面,与前一视频画面进行比较,确定动态区域;
S2、对所述动态区域的画面进行预处理后输入预设的内容审核算法中,判断是否安全合法。
本发明的有益效果在于:本发明的一种基于动态区域检测的视频内容安全审核方法与终端,通过前后两个画面的对比,确定视频画面的动态区域,即画面的重点区域,仅对动态区域的画面进行预处理和内容审核,保证该区域的有效检测像素,避免了细节的丢失,解决了画中画的问题,提升重点区域的检测力度和对小目标的检测率。
附图说明
图1为本发明实施例的一种基于动态区域检测的视频内容安全审核方法的流程图;
图2为本发明实施例的一种基于动态区域检测的视频内容安全审核终端的结构图;
图3为本发明实施例的一种基于动态区域检测的视频内容安全审核方法的具体流程图;
标号说明:
1、一种基于动态区域检测的视频内容安全审核终端;2、处理器;3、存储器。
具体实施方式
为详细说明本发明的技术内容、所实现目的及效果,以下结合实施方式并配合附图予以说明。
请参照图1以及图3,一种基于动态区域检测的视频内容安全审核方法,包括步骤:
S1、获取当前视频画面,与前一视频画面进行比较,确定动态区域;
S2、对所述动态区域的画面进行预处理后输入预设的内容审核算法中,判断是否安全合法。
从上述描述可知,本发明的有益效果在于:本发明的一种基于动态区域检测的视频内容安全审核方法,通过前后两个画面的对比,确定视频画面的动态区域,即画面的重点区域,仅对动态区域的画面进行预处理和内容审核,保证该区域的有效检测像素,避免了细节的丢失,解决了画中画的问题,提升重点区域的检测力度和对小目标的检测率。
进一步地,所述步骤S1包括步骤:
S11、获取当前视频画面,判断是否存在当前视频画面的前一视频画面,若是则进入步骤S12,否则进入步骤S13;
S12、将所述当前视频画面与所述前一视频画面进行比较,确定动态区域;
S13、缓存所述当前视频画面,对所述当前视频画面进行预处理后输入预设的内容审核算法中,判断是否安全合法。
由上述描述可知,基于上述步骤,采用全画幅和动态区域交错检测的方式,在提升重点区域的检测力度和对小目标的检测率的同时,又能保证了动态区域以外的目标检测能力。
进一步地,所述预处理包括色彩转换和分辨率转换。
由上述描述可知,对画面进行色彩转换和分辨率转换,以降低后续分析所需的计算量。
进一步地,所述预设的内容审核算法采用混合目标检测和多标签分类的神经网络模型,包含提取图像特征的骨干网络、目标检测网络和多标签分类网络;
所述目标检测网络和多标签分类网络共享所述骨干网络;
所述内容审核算法将内容审核划分成识别具体违规类型的多个子任务,并依据子任务的特点,设定子任务使用的识别算法是目标检测网络或者多标签分类网络;
将视频图像输入提取图像特征的骨干网络,以提取视频图像的各维度图像特征;
将图像特征输入目标检测模块和多标签分类模块,以判断视频图像是否违规且属于何种违规。
由上述描述可知,将视频内容审核分解成多种子任务,依据子任务的特点选择使用多标签分类算法或者目标检测算法,并将两种算法融合到一个人工神经网络中,共享使用一个骨干网络提取特征,其速度快,需要计算资源少,且计算精度高,网络模型泛化性更好。
请参照图2,一种基于动态区域检测的视频内容安全审核终端,包括处理器、存储器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现以下步骤:
S1、获取当前视频画面,与前一视频画面进行比较,确定动态区域;
S2、对所述动态区域的画面进行预处理后输入预设的内容审核算法中,判断是否安全合法。
从上述描述可知,本发明的有益效果在于:本发明的一种基于动态区域检测的视频内容安全审核方法,通过前后两个画面的对比,确定视频画面的动态区域,即画面的重点区域,仅对动态区域的画面进行预处理和内容审核,保证该区域的有效检测像素,避免了细节的丢失,解决了画中画的问题,提升重点区域的检测力度和对小目标的检测率。
进一步地,所述步骤S1包括步骤:
S11、获取当前视频画面,判断是否存在当前视频画面的前一视频画面,若是则进入步骤S12,否则进入步骤S13;
S12、将所述当前视频画面与所述前一视频画面进行比较,确定动态区域;
S13、缓存所述当前视频画面,对所述当前视频画面进行预处理后输入预设的内容审核算法中,判断是否安全合法。
由上述描述可知,基于上述步骤,采用全画幅和动态区域交错检测的方式,在提升重点区域的检测力度和对小目标的检测率的同时,又能保证了动态区域以外的目标检测能力。
进一步地,所述预处理包括色彩转换和分辨率转换。
由上述描述可知,对画面进行色彩转换和分辨率转换,以降低后续分析所需的计算量。
进一步地,所述预设的内容审核算法采用混合目标检测和多标签分类的神经网络模型,包含提取图像特征的骨干网络、目标检测网络和多标签分类网络;
所述目标检测网络和多标签分类网络共享所述骨干网络;
所述内容审核算法将内容审核划分成识别具体违规类型的多个子任务,并依据子任务的特点,设定子任务使用的识别算法是目标检测网络或者多标签分类网络;
将视频图像输入提取图像特征的骨干网络,以提取视频图像的各维度图像特征;
将图像特征输入目标检测模块和多标签分类模块,以判断视频图像是否违规且属于何种违规。
由上述描述可知,将视频内容审核分解成多种子任务,依据子任务的特点选择使用多标签分类算法或者目标检测算法,并将两种算法融合到一个人工神经网络中,共享使用一个骨干网络提取特征,其速度快,需要计算资源少,且计算精度高,网络模型泛化性更好。
本发明的一种基于动态区域检测的视频内容安全审核方法与终端,适用于视频内容安全审核,尤其是对含有画中画的视频画面的内容安全审核。
请参照图1和图3,本发明的实施例一为:
一种基于动态区域检测的视频内容安全审核方法,包括步骤:
S1、获取当前视频画面,与前一视频画面进行比较,确定动态区域;
所述步骤S1包括步骤:
S11、获取当前视频画面,判断是否存在当前视频画面的前一视频画面,若是则进入步骤S12,否则进入步骤S13;
S12、将所述当前视频画面与所述前一视频画面进行比较,确定动态区域;
S13、缓存所述当前视频画面,对所述当前视频画面进行预处理后输入预设的内容审核算法中,判断是否安全合法。
S2、对所述动态区域的画面进行预处理后输入预设的内容审核算法中,判断是否安全合法。
本实施例中,获取视频画面后,若当前为缓存有其前一视频画面,则首先对原画面(当前视频画面)进行预处理,预处理包含色彩转换和分辨率转换。对预处理后的视频画面进行推理分析(内容审核)。
在进入后一视频画面的审核后,将后一视频画面与缓存的当前视频画面进行比较,计算出变化的区域,即动态区域,最后将动态区域做预处理后进行推理分析。
本实施例中,推理分析(内容审核)采用基于EasyDL平台定制的图像审核算法。
由于动态区域通常为整个画面的局部区域,其分辨率比整个画面的分辨率小,因此用局部区域的图作为分析画面,缩小到算法要求的分辨率的比例,会比原图缩小的比例小,避免目标细节因图像缩小而丢失,即可提高对画中画动态区域检测能力。
本发明的实施例二为:
一种基于动态区域检测的视频内容安全审核方法,与实施例一的区别在于,本实施例中对采用的内容审核算法进行说明。
本实施例中,内容审核算法采用混合目标检测和多标签分类的神经网络模型,包含提取图像特征的骨干网络、目标检测网络和多标签分类网络;
所述目标检测网络和多标签分类网络共享所述骨干网络;
所述内容审核算法将内容审核划分成识别具体违规类型的多个子任务,并依据子任务的特点,设定子任务使用的识别算法是目标检测网络或者多标签分类网络;
将视频图像输入提取图像特征的骨干网络,以提取视频图像的各维度图像特征;
将图像特征输入目标检测模块和多标签分类模块,以判断视频图像是否违规且属于何种违规。
请参照图3,本发明的实施例三为:
一种基于动态区域检测的视频内容安全审核终端1,包括处理器2、存储器3以及存储在所述存储器3中并可在所述处理器2上运行的计算机程序,所述处理器2执行所述计算机程序时实现以上实施例一或二中的步骤。
综上所述,本发明提供的一种基于动态区域检测的视频内容安全审核方法与终端,通过前后两个画面的对比,确定视频画面的动态区域,即画面的重点区域,仅对动态区域的画面进行预处理和内容审核,保证该区域的有效检测像素,避免了细节的丢失,解决了画中画的问题,提升重点区域的检测力度和对小目标的检测率。
以上所述仅为本发明的实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等同变换,或直接或间接运用在相关的技术领域,均同理包括在本发明的专利保护范围内。
Claims (8)
1.一种基于动态区域检测的视频内容安全审核方法,其特征在于,包括步骤:
S1、获取当前视频画面,与前一视频画面进行比较,确定动态区域;
S2、对所述动态区域的画面进行预处理后输入预设的内容审核算法中,判断是否安全合法。
2.根据权利要求1所述的一种基于动态区域检测的视频内容安全审核方法,其特征在于,所述步骤S1包括步骤:
S11、获取当前视频画面,判断是否存在当前视频画面的前一视频画面,若是则进入步骤S12,否则进入步骤S13;
S12、将所述当前视频画面与所述前一视频画面进行比较,确定动态区域;
S13、缓存所述当前视频画面,对所述当前视频画面进行预处理后输入预设的内容审核算法中,判断是否安全合法。
3.根据权利要求1或2所述的一种基于动态区域检测的视频内容安全审核方法,其特征在于,所述预处理包括色彩转换和分辨率转换。
4.根据权利要求1所述的一种基于动态区域检测的视频内容安全审核方法,其特征在于,所述预设的内容审核算法采用混合目标检测和多标签分类的神经网络模型,包含提取图像特征的骨干网络、目标检测网络和多标签分类网络;
所述目标检测网络和多标签分类网络共享所述骨干网络;
所述内容审核算法将内容审核划分成识别具体违规类型的多个子任务,并依据子任务的特点,设定子任务使用的识别算法是目标检测网络或者多标签分类网络;
将视频图像输入提取图像特征的骨干网络,以提取视频图像的各维度图像特征;
将图像特征输入目标检测模块和多标签分类模块,以判断视频图像是否违规且属于何种违规。
5.一种基于动态区域检测的视频内容安全审核终端,包括处理器、存储器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现以下步骤:
S1、获取当前视频画面,与前一视频画面进行比较,确定动态区域;
S2、对所述动态区域的画面进行预处理后输入预设的内容审核算法中,判断是否安全合法。
6.根据权利要求5所述的一种基于动态区域检测的视频内容安全审核终端,其特征在于,所述步骤S1包括步骤:
S11、获取当前视频画面,判断是否存在当前视频画面的前一视频画面,若是则进入步骤S12,否则进入步骤S13;
S12、将所述当前视频画面与所述前一视频画面进行比较,确定动态区域;
S13、缓存所述当前视频画面,对所述当前视频画面进行预处理后输入预设的内容审核算法中,判断是否安全合法。
7.根据权利要求5或6所述的一种基于动态区域检测的视频内容安全审核终端,其特征在于,所述预处理包括色彩转换和分辨率转换。
8.根据权利要求5所述的一种基于动态区域检测的视频内容安全审核终端,其特征在于,所述预设的内容审核算法采用混合目标检测和多标签分类的神经网络模型,包含提取图像特征的骨干网络、目标检测网络和多标签分类网络;
所述目标检测网络和多标签分类网络共享所述骨干网络;
所述内容审核算法将内容审核划分成识别具体违规类型的多个子任务,并依据子任务的特点,设定子任务使用的识别算法是目标检测网络或者多标签分类网络;
将视频图像输入提取图像特征的骨干网络,以提取视频图像的各维度图像特征;
将图像特征输入目标检测模块和多标签分类模块,以判断视频图像是否违规且属于何种违规。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310561323.7A CN116597212A (zh) | 2023-05-18 | 2023-05-18 | 一种基于动态区域检测的视频内容安全审核方法与终端 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310561323.7A CN116597212A (zh) | 2023-05-18 | 2023-05-18 | 一种基于动态区域检测的视频内容安全审核方法与终端 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116597212A true CN116597212A (zh) | 2023-08-15 |
Family
ID=87589299
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310561323.7A Pending CN116597212A (zh) | 2023-05-18 | 2023-05-18 | 一种基于动态区域检测的视频内容安全审核方法与终端 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116597212A (zh) |
-
2023
- 2023-05-18 CN CN202310561323.7A patent/CN116597212A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11195037B2 (en) | Living body detection method and system, computer-readable storage medium | |
JP2008148298A (ja) | 画像における異なった内容の領域を識別する方法、画像における異なった内容の領域を識別する装置、および画像における異なった内容の領域を識別するコンピュータ・プログラムを具現するコンピュータ読み取り可能な媒体 | |
US7885474B2 (en) | Solution for detecting a streak in a compressed gray scale image | |
CN112052702A (zh) | 一种识别二维码的方法和装置 | |
CN116597212A (zh) | 一种基于动态区域检测的视频内容安全审核方法与终端 | |
CN114491648B (zh) | 一种面向视频直播社交大数据的区块链数据隐私保护方法 | |
CN116612355A (zh) | 人脸伪造识别模型训练方法和装置、人脸识别方法和装置 | |
CN113239738B (zh) | 一种图像的模糊检测方法及模糊检测装置 | |
CN113743235B (zh) | 基于边缘计算的电力巡检图像处理方法、装置和设备 | |
CN113014914B (zh) | 一种基于神经网络的单人换脸短视频的识别方法和*** | |
CN112949423B (zh) | 物体识别方法、物体识别装置及机器人 | |
CN113902942A (zh) | 一种基于多模态特征的同质用户群组发掘方法 | |
CN111401317B (zh) | 视频分类方法、装置、设备及存储介质 | |
Zeng et al. | Exposing image splicing with inconsistent sensor noise levels | |
CN114663930A (zh) | 一种活体检测方法、装置、终端设备及存储介质 | |
CN112712550A (zh) | 一种图像质量评价方法及装置 | |
CN116012248B (zh) | 图像处理方法、装置、计算机设备及计算机存储介质 | |
Khan et al. | An image enhancement-based License plate detection method for Naturally Degraded Images | |
CN117609532A (zh) | 相似图像检索方法、装置、设备及介质 | |
CN116823643A (zh) | 一种可预去除模糊度的图像处理*** | |
Tom et al. | An Improved Forgery Detection Method for Images | |
CN117218486A (zh) | 筛选模型的训练方法、水印添加方法、装置及设备 | |
CN117830247A (zh) | 织物疵点检测方法、装置、电子设备及存储介质 | |
CN115797264A (zh) | 一种有遮挡情况下屏幕变化的检测方法及装置 | |
CN106295634B (zh) | 车牌图像识别的处理方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |