CN114494971A - 视频涉黄检测方法、装置、电子设备及存储介质 - Google Patents

视频涉黄检测方法、装置、电子设备及存储介质 Download PDF

Info

Publication number
CN114494971A
CN114494971A CN202210121820.0A CN202210121820A CN114494971A CN 114494971 A CN114494971 A CN 114494971A CN 202210121820 A CN202210121820 A CN 202210121820A CN 114494971 A CN114494971 A CN 114494971A
Authority
CN
China
Prior art keywords
video
yellow
target video
action
continuous
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210121820.0A
Other languages
English (en)
Inventor
丁锐
王语斌
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tongdun Technology Co ltd
Original Assignee
Tongdun Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tongdun Technology Co ltd filed Critical Tongdun Technology Co ltd
Priority to CN202210121820.0A priority Critical patent/CN114494971A/zh
Publication of CN114494971A publication Critical patent/CN114494971A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Image Analysis (AREA)

Abstract

本申请提供了一种视频涉黄检测方法、装置、电子设备及存储介质,所述方法包括:利用人体关键点检测模型对目标视频中各组连续视频帧的人体关键点进行特征提取,得到各目标视频动作特征;在涉黄视频动作特征库中对所述各目标视频动作特征进行检索,确定目标视频的涉***段,其中,所述涉黄视频动作特征库包括利用所述人体关键点检测模型对涉黄视频中各组连续视频帧的人体关键点进行特征提取所得到的各涉黄视频动作特征;基于所述涉***段,确定所述目标视频是否涉黄。本申请实施例能够提高视频涉黄检测的效率。

Description

视频涉黄检测方法、装置、电子设备及存储介质
技术领域
本申请涉及视频处理领域,具体涉及一种视频涉黄检测方法、装置、电子设备及存储介质。
背景技术
随着互联网的发展,多媒体信息的传播交流愈发便捷。为了保证多媒体信息的合法传播,国家政策监管部门对于直播内容进行了严格把控,要求各直播平台必须保证直播内容的合法合规,避免直播内容涉黄。相关技术中,为了检测直播内容是否涉黄,要么是通过人工随机巡视审核的方式确定直播内容是否涉黄,要么是对直播截图中的图像内容通过深度学习进行识别从而确定直播内容是否涉黄。前者需要耗费大量人力;后者由于视频涉黄内容存在一个灰色地带,一般的利用深度学习的图像内容识别方法不能对连续动作的危险程度进行识别,原因是缺少连续上下文的动作信息,仅通过图像内容识别的方式无法识别出处于灰色地带的视频涉黄内容,最终还是需要辅以人工进行视频涉黄检测。由此可见,相关技术中的任一种方式,均无法避免耗费大量人力,从而导致视频涉黄检测的效率低下。
发明内容
本申请的一个目的在于提出一种视频涉黄检测方法、装置、电子设备及存储介质,能够提高视频涉黄检测的效率。
根据本申请实施例的一方面,公开了一种视频涉黄检测方法,所述方法包括:
利用人体关键点检测模型对目标视频中各组连续视频帧的人体关键点进行特征提取,得到各目标视频动作特征;
在涉黄视频动作特征库中对所述各目标视频动作特征进行检索,确定目标视频的涉***段,其中,所述涉黄视频动作特征库包括利用所述人体关键点检测模型对涉黄视频中各组连续视频帧的人体关键点进行特征提取所得到的各涉黄视频动作特征;
基于所述涉***段,确定所述目标视频是否涉黄。
根据本申请实施例的一方面,公开了一种视频涉黄检测装置,所述装置包括:
特征提取模块,配置为利用人体关键点检测模型对目标视频中各组连续视频帧的人体关键点进行特征提取,得到各目标视频动作特征;
特征检索模块,配置为在涉黄视频动作特征库中对所述各目标视频动作特征进行检索,确定目标视频的涉***段,其中,所述涉黄视频动作特征库包括利用所述人体关键点检测模型对涉黄视频中各组连续视频帧的人体关键点进行特征提取所得到的各涉黄视频动作特征;
涉黄确定模块,配置为基于所述涉***段,确定所述目标视频是否涉黄。
根据本申请实施例的一方面,公开了一种电子设备,包括:一个或多个处理器;存储装置,用于存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行时,使得所述电子设备实现以上任一项实施例。
根据本申请实施例的一方面,公开了一种计算机程序介质,其上存储有计算机可读指令,当所述计算机可读指令被计算机的处理器执行时,使计算机执行以上任一项实施例。
根据本申请实施例的一个方面,提供了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行上述各种可选实现方式中提供的方法。
本申请实施例中,通过对目标视频中各组连续视频帧的人体关键点进行特征提取,得到各目标视频动作特征,进而在涉黄视频动作特征库中对各目标视频动作特征进行检索,确定目标视频的涉***段,进而基于涉***段确定目标视频是否涉黄。由于用于视频涉黄检测的目标视频动作特征描述的是目标视频中的人体在一段连续视频帧中的动作特征,包含有连续上下文的动作信息,克服了一般图像内容识别方法无法识别处于灰色地带的视频涉黄内容的缺陷,从而能够识别出处于灰色地带的视频涉黄内容,避免为识别处于灰色地带的视频涉黄内容而耗费大量人力,从而提高了视频涉黄检测的效率。
本申请的其他特性和优点将通过下面的详细描述变得显然,或部分地通过本申请的实践而习得。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性的,并不能限制本申请。
附图说明
通过参考附图详细描述其示例实施例,本申请的上述和其它目标、特征及优点将变得更加显而易见。
图1示出了根据本申请一个实施例的视频涉黄检测方法的流程图。
图2示出了根据本申请一个实施例的人体关键点标注结果的示意图。
图3示出了根据本申请一个实施例的人体关键点注释信息的示意图。
图4示出了根据本申请一个实施例的涉***段的示意图。
图5示出了根据本申请一个实施例的涉***段的示意图。
图6示出了根据本申请一个实施例的视频涉黄检测装置的框图。
图7示出了根据本申请一个实施例的电子设备硬件图。
具体实施方式
现在将参考附图更全面地描述示例实施方式。然而,示例实施方式能够以多种形式实施,且不应被理解为限于在此阐述的范例;相反,提供这些示例实施方式使得本申请的描述将更加全面和完整,并将示例实施方式的构思全面地传达给本领域的技术人员。附图仅为本申请的示意性图解,并非一定是按比例绘制。图中相同的附图标记表示相同或类似的部分,因而将省略对它们的重复描述。
此外,所描述的特征、结构或特性可以以任何合适的方式结合在一个或更多示例实施方式中。在下面的描述中,提供许多具体细节从而给出对本申请的示例实施方式的充分理解。然而,本领域技术人员将意识到,可以实践本申请的技术方案而省略所述特定细节中的一个或更多,或者可以采用其它的方法、组元、步骤等。在其它情况下,不详细示出或描述公知结构、方法、实现或者操作以避免喧宾夺主而使得本申请的各方面变得模糊。
附图中所示的一些方框图是功能实体,不一定必须与物理或逻辑上独立的实体相对应。可以采用软件形式来实现这些功能实体,或在一个或多个硬件模块或集成电路中实现这些功能实体,或在不同网络和/或处理器装置和/或微控制器装置中实现这些功能实体。
本申请提供了一种视频涉黄检测方法,主要用于直播领域中,对直播视频进行涉黄检测,以在检测到直播视频涉黄后对直播间进行封禁以及对主播进行处罚等,从而保证直播内容合法合规。
图1示出了本申请所提供视频涉黄检测方法的流程图,该方法的示例性执行主体为服务器,该方法包括:
步骤S110、利用人体关键点检测模型对目标视频中各组连续视频帧的人体关键点进行特征提取,得到各目标视频动作特征;
步骤S120、在涉黄视频动作特征库中对各目标视频动作特征进行检索,确定目标视频的涉***段,其中,涉黄视频动作特征库包括利用人体关键点检测模型对涉黄视频中各组连续视频帧的人体关键点进行特征提取所得到的各涉黄视频动作特征;
步骤S130、基于涉***段,确定目标视频是否涉黄。
本申请实施例中,目标视频为待检测其是否涉黄的视频。获取目标视频中至少一组连续视频帧,进而对目标视频中各组连续视频帧的人体关键点进行特征提取。
由于每一个视频帧的人体关键点展示了视频帧所对应时刻的人体姿态,因此连续视频帧的人体关键点展示了连续视频帧所对应时段的人体动作,因此对目标视频中各组连续视频帧的人体关键点进行特征提取,能够得到目标视频中各组连续视频帧分别对应的人体动作特征,即,目标视频动作特征。
本申请实施例设置用于对各目标视频动作特征进行检索的涉黄视频动作特征库,以根据各目标视频动作特征检测目标视频是否涉黄。同理于目标视频动作特征的提取过程,本申请实施例中,对涉黄视频中各组连续视频帧的人体关键点进行特征提取,得到各涉黄视频动作特征。进而得到包含各涉黄视频动作特征的涉黄视频动作特征库。
得到各目标视频动作特征后,在涉黄视频动作特征库中对各目标视频动作特征进行检索,确定目标视频的涉***段。若在涉黄视频动作特征库中检索得到与某一目标视频动作特征足够相似的涉黄视频动作特征,则将该目标视频动作特征所来源的连续视频帧确定为目标视频的一个涉***段。例如:在涉黄视频动作特征库中检索得到与目标视频第0~5帧对应的目标视频动作特征足够相似的涉黄视频动作特征,则目标视频第0~5帧为目标视频的一个涉***段。
确定目标视频的涉***段后,进一步确定目标视频是否涉黄。例如:若目标视频的涉***段的数量过多,则确定目标视频涉黄。
本申请实施例中,通过对目标视频中各组连续视频帧的人体关键点进行特征提取,得到各目标视频动作特征,进而在涉黄视频动作特征库中对各目标视频动作特征进行检索,确定目标视频的涉***段,进而基于涉***段确定目标视频是否涉黄。由于用于视频涉黄检测的目标视频动作特征描述的是目标视频中的人体在一段连续视频帧中的动作特征,包含有连续上下文的动作信息,克服了一般图像内容识别方法无法识别处于灰色地带的视频涉黄内容的缺陷,从而能够识别出处于灰色地带的视频涉黄内容,避免为识别处于灰色地带的视频涉黄内容而耗费大量人力,从而提高了视频涉黄检测的效率。
在一实施例中,按照预设帧数对目标视频进行连续划分,得到目标视频中各组连续视频帧。例如:预设帧数为5。则5帧5帧地对目标视频进行连续划分,得到目标视频中各组连续视频帧。目标视频中各组连续视频帧的帧数为5,并且目标视频帧中相邻两组连续视频帧之间无间隔。
在一实施例中,按照预设帧间隔以及预设帧数,周期性地选取目标视频中各组连续视频帧。例如:预设帧间隔为2,预设帧数为5。则每隔2帧,选取目标视频的连续5个视频帧,得到目标视频中各组连续视频帧。目标视频中各组连续视频帧的帧数为5,并且目标视频帧中相邻两组连续视频帧之间间隔2帧。
在一实施例中,按照随机帧间隔以及预设帧数,选取目标视频中各组连续视频帧,得到目标视频中各组连续视频帧。
在一实施例中,获取视频观看端与目标视频端之间的互动特征。基于互动特征,筛选出目标视频中各组连续视频帧,以对目标视频中各组连续视频帧进行特征提取。
本实施例中,视频观看端主要指的是目标视频的观看端,或者,目标视频的接收端。目标视频端主要指的是目标视频的来源端。在直播场景中,视频观看端主要为观众端,目标视频端主要为主播端。
相比于目标视频未涉黄时视频观看端与目标视频端之间的互动行为,目标视频涉黄时视频观看端与目标视频端之间的互动行为会发生一定程度的变化。例如:相比于目标视频未涉黄时观众端与主播端之间的互动频率,目标视频涉黄时观众端与主播端之间的互动频率会升高;相比于目标视频未涉黄时观众端向主播端的打赏额,目标视频涉黄时观众端向主播端的打赏额会增加。
因此,基于视频观看端与目标视频端之间的互动特征,可以筛选出目标视频中疑似涉黄的部分,进而提取疑似涉黄的部分对应的连续视频帧,从而得到用于提取各目标视频动作特征以检测目标视频是否涉黄的目标视频中各组连续视频帧。
在一实施例中,互动特征包含视频观看端与目标视频端之间的互动频率。将互动频率达到预设频率阈值且时段达到预设时长阈值的连续视频帧,作为目标视频中各组连续视频帧。
考虑到相比于目标视频未涉黄时视频观看端与目标视频端之间的互动频率,目标视频涉黄时视频观看端与目标视频端之间的互动频率会升高。因此,若某一达到预设时长阈值的时段中,视频观看端与目标视频端之间的互动频率达到预设频率阈值,则将该时段覆盖的连续视频帧作为目标视频中其中一组连续视频帧,以提取该时段对应的目标视频动作特征,进而以检测目标视频是否涉黄。
例如:预设时长阈值为10秒,预设互动频率阈值为7次/秒。若时段[t1,t2]的时长(t2-t1)大于或等于10秒,且时段[t1,t2]内视频观看端与目标视频段之间的互动频率大于或等于7次/秒,则将时段[t1,t2]覆盖的连续视频帧作为目标视频中其中一组连续视频帧,以提取时段[t1,t2]对应的目标视频动作特征,进而以检测目标视频是否涉黄。
在一实施例中,互动特征包含视频观看端向目标视频端所转移的虚拟资源量。将虚拟资源量达到预设资源量阈值且时段大于预设时长阈值的连续视频帧,作为目标视频中各组连续视频帧。
考虑到相比于目标视频未涉黄时视频观看端向目标视频端所转移的虚拟资源量,目标视频涉黄时视频观看端向目标视频端所转移的虚拟资源量会增加。因此,若某一达到预设时长阈值的时段中,视频观看端向目标视频端所转移的虚拟资源量达到预设资源量阈值,则将该时段覆盖的连续视频帧作为目标视频中其中一组连续视频帧,以提取该时段对应的目标视频动作特征,进而以检测目标视频是否涉黄。
例如:处于直播场景时,虚拟资源可以为直播平台上的虚拟礼物。预设时长阈值为10秒,预设资源量阈值为100单位。若时段[t1,t2]的时长(t2-t1)大于或等于10秒,且时段[t1,t2]内观众端向主播端转移的虚拟礼物量大于或等于100单位,则将时段[t1,t2]覆盖的连续视频帧作为目标视频中其中一组连续视频帧,以提取时段[t1,t2]对应的目标视频动作特征,进而以检测目标视频是否涉黄。
在一实施例中,获取样本视频帧的人体关键点标注结果,其中,样本视频帧的人体关键点标注结果包含人体左乳关键点、人体右乳关键点以及人体裆部关键点。以样本视频帧为训练样本、样本视频帧的人体关键点标注结果为样本标签,训练得到人体关键点检测模型。
考虑到涉黄内容通常多与人体敏感部位相关,因此为了提高涉黄检测的准确性,本实施例中,预先训练得到能够检测出人体左乳关键点、人体右乳关键点以及人体裆部关键点的人体关键点检测模型,进而采用该人体关键点检测模型对目标视频中各组连续视频帧的人体关键点进行特征提取,从而使得提取得到的目标视频动作特征描述有人体左乳关键点的特征、人体右乳关键点的特征以及人体裆部关键点的特征,从而提高了在目标视频动作特征基础上对目标视频进行涉黄检测的准确性。
详细的,由于样本视频帧的人体关键点标注结果包含有人体左乳关键点、人体右乳关键点以及人体裆部关键点,因此基于样本视频帧的人体关键点标注结果为样本标签训练得到的人体关键点检测模型,能够提取出目标视频中各组连续视频帧的人体左乳关键点的特征、人体右乳关键点的特征以及人体裆部关键点的特征。
其中,样本视频帧的人体关键点标注结果可以完全由人工标注所有人体关键点,也可以先使用通用模型检测出样本视频帧的通用人体关键点(例如:眼部关键点、耳部关键点等),再由人工增添样本视频帧的人体左乳关键点、人体右乳关键点以及人体裆部关键点,从而得到由通用人体关键点、人体左乳关键点、人体右乳关键点以及人体裆部关键点共同组成的人体关键点标注结果。
图2示出了本申请一实施例的人体关键点标注结果的示意图,图3示出了本申请一实施例的人体关键点注释信息的示意图。
参考图2以及图3,人体关键点标注结果共展示了21个人体关键点,其中,0~17这18个人体关键点为一般情况下的通用人体关键点,18、19以及20这3个人体关键点为本实施例为提高涉黄检测准确率而增添的人体关键点。详细的,18为人体左乳关键点,19为人体右乳关键点,20为人体裆部关键点。本实施例中,根据样本视频帧以及样本视频帧的这21个人体关键点训练人体关键点检测模型,进而采用训练得到的人体关键点检测模型,对目标视频中各组连续视频帧的这21个人体关键点进行特征提取。
在一实施例中,通过resnet50神经网络对输入的视频帧进行处理,得到视频帧的图像特征,然后视频帧的图像特征进入t(t≥2)个预测阶段。每个预测阶段被分为两个分支进行迭代训练:第一分支通过多个卷积层来预测各人体关键点的位置;第二分支通过多个卷积层来预测各人体关键点之间的连接信息。
每个预测阶段都会计算一次损失函数,然后依据损失函数将resnet50提取到的图像特征、人体关键点位置信息、人体关键点之间的连接信息进行融合,并送入下一个预测阶段再重复以上训练过程。如此循环,经过t个预测阶段,预测得到与人体关键点标注结果匹配的人体关键点。
第一分支的损失函数
Figure BDA0003498581440000091
第二分支的损失函数
Figure BDA0003498581440000092
以及训练阶段的总损失函数f如下所示:
Figure BDA0003498581440000093
Figure BDA0003498581440000094
Figure BDA0003498581440000095
其中,
Figure BDA0003498581440000096
为t阶段第一分支的损失函数值,表示第一分支输出的预测值
Figure BDA0003498581440000097
与标注值
Figure BDA0003498581440000098
之间的L2范数。j为骨骼关键点序号。t为预测阶段序号。W(p)为二值矩阵,当其取0时表示某个关键点标注缺失,可能是关键点超出画面,也可能是标注漏标等情况,损失函数不计算缺失点的损失;当取1时表示关键点标注正常。
Figure BDA0003498581440000099
为t阶段第二分支的损失函数值,表示第二分支输出的预测值
Figure BDA00034985814400000910
与标注值
Figure BDA00034985814400000911
之间的L2范数。c为关节连接号。f为训练阶段的总损失函数值,是
Figure BDA00034985814400000912
Figure BDA00034985814400000913
的总和。
经过OpenPose算法检测后,得到包含有人体左乳关键点、人体右乳关键点以及人体裆部关键点的人体关键点。从而可以根据涉黄视频中各组连续视频帧的人体关键点,得到各涉黄视频动作特征;并且可以根据目标视频中各组连续视频帧的人体关键点,得到各目标视频动作特征。
在一实施例中,检测各目标视频动作特征与各涉黄视频动作特征之间的特征距离。若检测得到特征距离小于预设距离阈值的目标视频动作特征,则将特征距离小于预设距离阈值的目标视频动作特征确定为涉黄的目标视频动作特征,并将涉黄的目标视频动作特征所来源的连续视频帧确定为目标视频的涉***段。
详细的,若目标视频中的某一目标视频动作特征与特征库中的某一涉黄视频动作特征之间的特征距离小于预设距离阈值,则认为该目标视频动作特征与该涉黄视频动作特征足够相似,则将该目标视频动作特征判定为涉黄的目标视频动作特征,进而将该目标视频动作特征所来源的连续视频帧确定为目标视频的一个涉***段。
在一实施例中,若从目标视频中检测得到大于或等于预设数量阈值的涉***段,则确定目标视频涉黄。反之,若从目标视频中检测得到的涉***段的数量小于预设数量阈值,则确定目标视频未涉黄。
详细的,本实施例中,目标视频的涉***段的数量越多,说明目标视频的涉黄可能性越大。因此将涉***段的数量与预设数量阈值进行对比,从而根据对比结果确定目标视频是否涉黄。
例如:当预设数量阈值为3时,若目标视频中有3个以上(包含3个)的涉***段,则确定目标视频涉黄;反之,若目标视频中仅有3个以下的涉***段,则确定目标视频未涉黄。
在一实施例中,若从目标视频中检测得到大于或等于预设数量阈值的连续的涉***段,则确定目标视频涉黄。反之,若从目标视频中检测得到的连续的涉***段的数量均小于预设数量阈值,则确定目标视频未涉黄。
详细的,考虑到目标视频中的某一组连续视频帧被判断为涉***段时,可能是误检。因此本实施例在判断目标视频是否涉黄时,不仅要求参与判断的是涉***段,还要求参与判断的涉***段是连续的。当连续的涉***段的数量大于或等于预设数量阈值时,才确定目标视频涉黄;反之,则确定目标视频未涉黄。
例如:当预设数量阈值为3时,若目标视频中有3个以上的连续的涉***段,则确定目标视频涉黄;反之,若目标视频中所有连续的涉***段的数量均小于3,则确定目标视频未涉黄。
参考图4以及图5(图4示出了本申请一实施例的涉***段的示意图,图5示出了本申请一实施例的涉***段的示意图)。由于图4中的目标视频中,第0~5帧对应的片段、第5~10帧对应的片段、第10~15帧对应的片段以及第15~20帧对应的片段,均不仅由于对应的目标视频动作特征与涉黄视频动作特征库的某一涉黄视频动作特征足够相似而被判断为涉黄,而且这4个片段是连续的,因此图4中的目标视频涉黄。
反之,虽然图5中的目标视频也有4个片段被判断为涉黄,但其中连续的涉***段的数量均小于3,因此图5中的目标视频未涉黄。
在一实施例中,当特征库包含的涉黄视频特征不断增多时,可以采用PQ乘积量化中的IVFADC方法,在特征库中对目标视频特征进行检索,以提供检索效率。
图6示出了根据本申请一实施例的视频涉黄检测装置,所述装置包括:
特征提取模块210,配置为利用人体关键点检测模型对目标视频中各组连续视频帧的人体关键点进行特征提取,得到各目标视频动作特征;
特征检索模块220,配置为在涉黄视频动作特征库中对所述各目标视频动作特征进行检索,确定目标视频的涉***段,其中,所述涉黄视频动作特征库包括利用所述人体关键点检测模型对涉黄视频中各组连续视频帧的人体关键点进行特征提取所得到的各涉黄视频动作特征;
涉黄检测模块230,配置为基于所述涉***段,确定所述目标视频是否涉黄。
在本申请的一示例性实施例中,所述装置配置为:
获取样本视频帧的人体关键点标注结果,其中,所述样本视频帧的人体关键点标注结果包含人体左乳关键点、人体右乳关键点以及人体裆部关键点;
以所述样本视频帧为训练样本、所述样本视频帧的人体关键点标注结果为样本标签,训练得到所述人体关键点检测模型。
在本申请的一示例性实施例中,所述特征检索模块配置为:
检测所述各目标视频动作特征与所述各涉黄视频动作特征之间的特征距离;
若检测得到所述特征距离小于预设距离阈值的目标视频动作特征,则将所述特征距离小于预设距离阈值的目标视频动作特征确定为涉黄的目标视频动作特征,并将所述涉黄的目标视频动作特征所来源的连续视频帧确定为所述目标视频的涉***段。
在本申请的一示例性实施例中,所述涉黄确定模块配置为:
若从所述目标视频中检测得到大于或等于预设数量阈值的连续的涉***段,则确定所述目标视频涉黄。
在本申请的一示例性实施例中,所述装置配置为:
获取视频观看端与目标视频端之间的互动特征;
基于所述互动特征,筛选出所述目标视频中各组连续视频帧,以对所述目标视频中各组连续视频帧进行特征提取。
在本申请的一示例性实施例中,所述互动特征包含所述视频观看端与所述目标视频端之间的互动频率,所述装置配置为:
将所述互动频率达到预设频率阈值且时段达到预设时长阈值的连续视频帧,作为所述目标视频中各组连续视频帧。
在本申请的一示例性实施例中,所述互动特征包含所述视频观看端向所述目标视频端所转移的虚拟资源量,所述装置配置为:
将所述虚拟资源量达到预设资源量阈值且时段大于预设时长阈值的连续视频帧,作为所述目标视频中各组连续视频帧。
下面参考图7来描述根据本申请实施例的电子设备30。图7显示的电子设备30仅仅是一个示例,不应对本申请实施例的功能和使用范围带来任何限制。
如图7所示,电子设备30以通用计算设备的形式表现。电子设备30的组件可以包括但不限于:上述至少一个处理单元310、上述至少一个存储单元320、连接不同***组件(包括存储单元320和处理单元310)的总线330。
其中,所述存储单元存储有程序代码,所述程序代码可以被所述处理单元310执行,使得所述处理单元310执行本说明书上述示例性方法的描述部分中描述的根据本发明各种示例性实施方式的步骤。例如,所述处理单元310可以执行如图1中所示的各个步骤。
存储单元320可以包括易失性存储单元形式的可读介质,例如随机存取存储单元(RAM)3201和/或高速缓存存储单元3202,还可以进一步包括只读存储单元(ROM)3203。
存储单元320还可以包括具有一组(至少一个)程序模块3205的程序/实用工具3204,这样的程序模块3205包括但不限于:操作***、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。
总线330可以为表示几类总线结构中的一种或多种,包括存储单元总线或者存储单元控制器、***总线、图形加速端口、处理单元或者使用多种总线结构中的任意总线结构的局域总线。
电子设备30也可以与一个或多个外部设备400(例如键盘、指向设备、蓝牙设备等)通信,还可与一个或者多个使得用户能与该电子设备30交互的设备通信,和/或与使得该电子设备30能与一个或多个其它计算设备进行通信的任何设备(例如路由器、调制解调器等等)通信。这种通信可以通过输入/输出(I/O)接口350进行。输入/输出(I/O)接口350与显示单元340相连。并且,电子设备30还可以通过网络适配器360与一个或者多个网络(例如局域网(LAN),广域网(WAN)和/或公共网络,例如因特网)通信。如图所示,网络适配器360通过总线330与电子设备30的其它模块通信。应当明白,尽管图中未示出,可以结合电子设备30使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、RAID***、磁带驱动器以及数据备份存储***等。
通过以上的实施方式的描述,本领域的技术人员易于理解,这里描述的示例实施方式可以通过软件实现,也可以通过软件结合必要的硬件的方式来实现。因此,根据本申请实施方式的技术方案可以以软件产品的形式体现出来,该软件产品可以存储在一个非易失性存储介质(可以是CD-ROM,U盘,移动硬盘等)中或网络上,包括若干指令以使得一台计算设备(可以是个人计算机、服务器、终端装置、或者网络设备等)执行根据本申请实施方式的方法。
在本申请的示例性实施例中,还提供了一种计算机可读存储介质,其上存储有计算机可读指令,当所述计算机可读指令被计算机的处理器执行时,使计算机执行上述方法实施例部分描述的方法。
根据本申请的一个实施例,还提供了一种用于实现上述方法实施例中的方法的程序产品,其可以采用便携式紧凑盘只读存储器(CD-ROM)并包括程序代码,并可以在终端设备,例如个人电脑上运行。然而,本发明的程序产品不限于此,在本文件中,可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行***、装置或者器件使用或者与其结合使用。
所述程序产品可以采用一个或多个可读介质的任意组合。可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以为但不限于电、磁、光、电磁、红外线、或半导体的***、装置或器件,或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。
计算机可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了可读程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。可读信号介质还可以是可读存储介质以外的任何可读介质,该可读介质可以发送、传播或者传输用于由指令执行***、装置或者器件使用或者与其结合使用的程序。
可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于无线、有线、光缆、RF等等,或者上述的任意合适的组合。
可以以一种或多种程序设计语言的任意组合来编写用于执行本发明操作的程序代码,所述程序设计语言包括面向对象的程序设计语言—诸如JAVA、C++等,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户计算设备上部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。在涉及远程计算设备的情形中,远程计算设备可以通过任意种类的网络,包括局域网(LAN)或广域网(WAN),连接到用户计算设备,或者,可以连接到外部计算设备(例如利用因特网服务提供商来通过因特网连接)。
应当注意,尽管在上文详细描述中提及了用于动作执行的设备的若干模块或者单元,但是这种划分并非强制性的。实际上,根据本申请的实施方式,上文描述的两个或更多模块或者单元的特征和功能可以在一个模块或者单元中具体化。反之,上文描述的一个模块或者单元的特征和功能可以进一步划分为由多个模块或者单元来具体化。
此外,尽管在附图中以特定顺序描述了本申请中方法的各个步骤,但是,这并非要求或者暗示必须按照该特定顺序来执行这些步骤,或是必须执行全部所示的步骤才能实现期望的结果。附加的或备选的,可以省略某些步骤,将多个步骤合并为一个步骤执行,以及/或者将一个步骤分解为多个步骤执行等。
通过以上的实施方式的描述,本领域的技术人员易于理解,这里描述的示例实施方式可以通过软件实现,也可以通过软件结合必要的硬件的方式来实现。因此,根据本申请实施方式的技术方案可以以软件产品的形式体现出来,该软件产品可以存储在一个非易失性存储介质(可以是CD-ROM,U盘,移动硬盘等)中或网络上,包括若干指令以使得一台计算设备(可以是个人计算机、服务器、移动终端、或者网络设备等)执行根据本申请实施方式的方法。
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本申请的其它实施方案。本申请旨在涵盖本申请的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本申请的一般性原理并包括本申请未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本申请的真正范围和精神由所附的权利要求指出。

Claims (10)

1.一种视频涉黄检测方法,其特征在于,所述方法包括:
利用人体关键点检测模型对目标视频中各组连续视频帧的人体关键点进行特征提取,得到各目标视频动作特征;
在涉黄视频动作特征库中对所述各目标视频动作特征进行检索,确定目标视频的涉***段,其中,所述涉黄视频动作特征库包括利用所述人体关键点检测模型对涉黄视频中各组连续视频帧的人体关键点进行特征提取所得到的各涉黄视频动作特征;
基于所述涉***段,确定所述目标视频是否涉黄。
2.根据权利要求1所述的方法,其特征在于,所述方法还包括:
获取样本视频帧的人体关键点标注结果,其中,所述样本视频帧的人体关键点标注结果包含人体左乳关键点、人体右乳关键点以及人体裆部关键点;
以所述样本视频帧为训练样本、所述样本视频帧的人体关键点标注结果为样本标签,训练得到所述人体关键点检测模型。
3.根据权利要求1所述的方法,其特征在于,在涉黄视频动作特征库中对所述各目标视频动作特征进行检索,确定目标视频的涉***段,包括:
检测所述各目标视频动作特征与所述各涉黄视频动作特征之间的特征距离;
若检测得到所述特征距离小于预设距离阈值的目标视频动作特征,则将所述特征距离小于预设距离阈值的目标视频动作特征确定为涉黄的目标视频动作特征,并将所述涉黄的目标视频动作特征所来源的连续视频帧确定为所述目标视频的涉***段。
4.根据权利要求1所述的方法,其特征在于,基于所述涉***段,确定所述目标视频是否涉黄,包括:
若从所述目标视频中检测得到大于或等于预设数量阈值的连续的涉***段,则确定所述目标视频涉黄。
5.根据权利要求1所述的方法,其特征在于,所述方法还包括:
获取视频观看端与目标视频端之间的互动特征;
基于所述互动特征,筛选出所述目标视频中各组连续视频帧,以对所述目标视频中各组连续视频帧进行特征提取。
6.根据权利要求5所述的方法,其特征在于,所述互动特征包含所述视频观看端与所述目标视频端之间的互动频率,基于所述互动特征,筛选出所述目标视频中各组连续视频帧,包括:
将所述互动频率达到预设频率阈值且时段达到预设时长阈值的连续视频帧,作为所述目标视频中各组连续视频帧。
7.根据权利要求5所述的方法,其特征在于,所述互动特征包含所述视频观看端向所述目标视频端所转移的虚拟资源量,基于所述互动特征,筛选出所述目标视频中各组连续视频帧,包括:
将所述虚拟资源量达到预设资源量阈值且时段大于预设时长阈值的连续视频帧,作为所述目标视频中各组连续视频帧。
8.一种视频涉黄检测装置,其特征在于,所述装置包括:
特征提取模块,配置为利用人体关键点检测模型对目标视频中各组连续视频帧的人体关键点进行特征提取,得到各目标视频动作特征;
特征检索模块,配置为在涉黄视频动作特征库中对所述各目标视频动作特征进行检索,确定目标视频的涉***段,其中,所述涉黄视频动作特征库包括利用所述人体关键点检测模型对涉黄视频中各组连续视频帧的人体关键点进行特征提取所得到的各涉黄视频动作特征;
涉黄确定模块,配置为基于所述涉***段,确定所述目标视频是否涉黄。
9.一种电子设备,其特征在于,包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行时,使得所述电子设备实现如权利要求1至7任一项所述的方法。
10.一种计算机可读存储介质,其特征在于,其上存储有计算机可读指令,当所述计算机可读指令被计算机的处理器执行时,使计算机执行权利要求1至7中任一项所述的方法。
CN202210121820.0A 2022-02-09 2022-02-09 视频涉黄检测方法、装置、电子设备及存储介质 Pending CN114494971A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210121820.0A CN114494971A (zh) 2022-02-09 2022-02-09 视频涉黄检测方法、装置、电子设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210121820.0A CN114494971A (zh) 2022-02-09 2022-02-09 视频涉黄检测方法、装置、电子设备及存储介质

Publications (1)

Publication Number Publication Date
CN114494971A true CN114494971A (zh) 2022-05-13

Family

ID=81478494

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210121820.0A Pending CN114494971A (zh) 2022-02-09 2022-02-09 视频涉黄检测方法、装置、电子设备及存储介质

Country Status (1)

Country Link
CN (1) CN114494971A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115512280A (zh) * 2022-11-15 2022-12-23 福建中科中欣智能科技有限公司 一种涉黄涉暴视频多目标检测算法和装置

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115512280A (zh) * 2022-11-15 2022-12-23 福建中科中欣智能科技有限公司 一种涉黄涉暴视频多目标检测算法和装置
CN115512280B (zh) * 2022-11-15 2023-02-28 福建中科中欣智能科技有限公司 一种涉黄涉暴视频多目标检测算法和装置

Similar Documents

Publication Publication Date Title
CN109117777B (zh) 生成信息的方法和装置
CN113486833B (zh) 多模态特征提取模型训练方法、装置、电子设备
CN111858973B (zh) 多媒体事件信息的检测方法、装置、服务器及存储介质
CN111046956A (zh) 遮挡图像检测方法、装置、电子设备及存储介质
CN110598620B (zh) 基于深度神经网络模型的推荐方法和装置
CN109918513B (zh) 图像处理方法、装置、服务器及存储介质
CN110555405B (zh) 目标跟踪方法及装置、存储介质和电子设备
CN112434178B (zh) 图像分类方法、装置、电子设备和存储介质
CN111931719B (zh) 高空抛物检测方法以及装置
CN110046279B (zh) 视频文件特征的预测方法、介质、装置和计算设备
CN111753746B (zh) 属性识别模型训练方法、识别方法、电子设备、存储介质
CN112925905B (zh) 提取视频字幕的方法、装置、电子设备和存储介质
CN108665769B (zh) 基于卷积神经网络的网络教学方法以及装置
CN114429566A (zh) 一种图像语义理解方法、装置、设备及存储介质
CN114245232B (zh) 一种视频摘要生成方法、装置、存储介质及电子设备
CN114494971A (zh) 视频涉黄检测方法、装置、电子设备及存储介质
CN113033707B (zh) 视频分类方法、装置、可读介质及电子设备
CN114422848A (zh) 视频分割方法、装置、电子设备及存储介质
CN112070093B (zh) 生成图像分类模型的方法、图像分类方法、装置和设备
CN109960745B (zh) 视频分类处理方法及装置、存储介质和电子设备
CN112949777B (zh) 相似图像确定方法及装置、电子设备和存储介质
CN109886234B (zh) 目标检测方法、装置、***、电子设备、存储介质
CN114821396A (zh) Lng卸车作业流程的规范性检测方法、设备及存储介质
CN116704593A (zh) 预测模型训练方法、装置、电子设备和计算机可读介质
CN114299435A (zh) 视频中的场景聚类方法、装置及相关设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination