CN115412726B - 视频真伪检测方法、装置及存储介质 - Google Patents
视频真伪检测方法、装置及存储介质 Download PDFInfo
- Publication number
- CN115412726B CN115412726B CN202211073269.3A CN202211073269A CN115412726B CN 115412726 B CN115412726 B CN 115412726B CN 202211073269 A CN202211073269 A CN 202211073269A CN 115412726 B CN115412726 B CN 115412726B
- Authority
- CN
- China
- Prior art keywords
- frame number
- video
- target
- fake
- false
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000001514 detection method Methods 0.000 title claims abstract description 314
- 238000003860 storage Methods 0.000 title claims abstract description 59
- 238000000034 method Methods 0.000 claims abstract description 55
- 238000005242 forging Methods 0.000 claims abstract description 49
- 238000012545 processing Methods 0.000 claims description 43
- 238000004590 computer program Methods 0.000 claims description 11
- 238000005516 engineering process Methods 0.000 description 44
- 230000006870 function Effects 0.000 description 26
- 238000013473 artificial intelligence Methods 0.000 description 16
- 230000008569 process Effects 0.000 description 15
- 238000010586 diagram Methods 0.000 description 11
- 238000004891 communication Methods 0.000 description 10
- 238000012549 training Methods 0.000 description 10
- 238000004364 calculation method Methods 0.000 description 6
- 230000008878 coupling Effects 0.000 description 6
- 238000010168 coupling process Methods 0.000 description 6
- 238000005859 coupling reaction Methods 0.000 description 6
- 238000007726 management method Methods 0.000 description 6
- 238000011160 research Methods 0.000 description 4
- 230000004075 alteration Effects 0.000 description 3
- 230000005540 biological transmission Effects 0.000 description 2
- 238000010276 construction Methods 0.000 description 2
- 238000013500 data storage Methods 0.000 description 2
- 238000013135 deep learning Methods 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 230000010354 integration Effects 0.000 description 2
- 239000004973 liquid crystal related substance Substances 0.000 description 2
- 238000005259 measurement Methods 0.000 description 2
- 238000000638 solvent extraction Methods 0.000 description 2
- 230000005236 sound signal Effects 0.000 description 2
- 238000012935 Averaging Methods 0.000 description 1
- 230000001133 acceleration Effects 0.000 description 1
- 230000003190 augmentative effect Effects 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 238000007599 discharging Methods 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 238000009432 framing Methods 0.000 description 1
- 230000005484 gravity Effects 0.000 description 1
- 230000000977 initiatory effect Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 238000003058 natural language processing Methods 0.000 description 1
- 230000006855 networking Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000002085 persistent effect Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 238000010897 surface acoustic wave method Methods 0.000 description 1
- 230000001360 synchronised effect Effects 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N17/00—Diagnosis, testing or measuring for television systems or their details
Landscapes
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- General Health & Medical Sciences (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Image Analysis (AREA)
Abstract
本申请实施例公开了一种视频真伪检测方法、装置及存储介质。方法包括:获取待检测视频;根据目标阈值组合对待检测视频进行真伪检测,得到真伪检测结果,目标阈值组合包括目标伪造帧数阈值以及目标伪造帧数占比阈值,且目标阈值组合根据视频样本集合、候选伪造帧数集合和候选伪造帧数占比集合计算得到,视频样本集合包括播放时长大于预设时长的多个视频样本;输出真伪检测结果。由于本方案联合了目标伪造帧数阈值以及目标伪造帧数占比阈值对待检测视频进行真伪检测,即使待检测视频的视频较长,包含的伪造帧数较少,也可以通过该待检测视频的伪造帧数以及伪造帧数占比来确定该待检测视频的真伪,提高了视频真伪检测的准确率。
Description
技术领域
本申请涉及人工智能技术领域,尤其涉及一种视频真伪检测方法、装置及存储介质。
背景技术
深度伪造篡改技术源自人工智能深度学习的伪造技术,例如,可以实现用另一张人脸图片替换掉原始人像,生成逼真度极高的伪造数据,目前已可以做到以假乱真,深度伪造篡改技术的持续进步给深度伪造检测方法带来了极大的挑战。
伪造视频的常规检测逻辑为将待检测视频抽取为一帧一帧的图片,然后将帧图片过视频真伪检测模型,输出视频中各帧的置信度,再根据各帧的置信度计算视频所有帧的平均置信度,最后将平均置信度与平均置信度阈值进行比较,如果平均置信度大于或等于平均置信度阈值,则说明该视频为伪造视频,反之为正常视频。
然而,网络中存在很多伪造视频,当有些视频中伪造的帧较少且视频较长时,通过上述逻辑得到的视频平均置信度较小,此时,视频的平均置信度低于平均置信度阈值时则会被判定为非伪造,若此视频中确实存在伪造的帧,则很可能会因为采用平均置信度来作为判定整体视频的真伪,将此视频误判为非伪造,导致视频真伪检测准确率较低。
发明内容
本申请实施例提供了一种视频真伪检测方法、装置及存储介质,可以联合目标伪造帧数阈值以及目标伪造帧数占比阈值对待检测视频进行真伪检测,即使待检测视频的视频较长,包含的伪造帧数较少,也可以通过该待检测视频的伪造帧数以及伪造帧数占比来确定该待检测视频的真伪,真伪判断不会受视频平均置信度的影响,从而提高了视频真伪检测的准确率。
第一方面,本申请实施例提供了一种视频真伪检测方法,其包括:
获取待检测视频;
根据目标阈值组合对所述待检测视频进行真伪检测,得到真伪检测结果,所述目标阈值组合包括目标伪造帧数阈值以及目标伪造帧数占比阈值,且所述目标阈值组合根据视频样本集合、候选伪造帧数集合和候选伪造帧数占比集合计算得到,所述视频样本集合包括播放时长大于预设时长的多个视频样本;
输出所述真伪检测结果。
第二方面,本申请实施例还提供了一种视频真伪检测装置,其包括:
收发模块,用于获取待检测视频;
处理模块,用于根据目标阈值组合对所述待检测视频进行真伪检测,得到真伪检测结果,所述目标阈值组合包括目标伪造帧数阈值以及目标伪造帧数占比阈值,且所述目标阈值组合根据视频样本集合、候选伪造帧数集合和候选伪造帧数占比集合计算得到,所述视频样本集合包括播放时长大于预设时长的多个视频样本;
所述收发模块,还用于输出所述真伪检测结果。
在一些实施例中,所述处理模块在执行所述根据目标阈值组合对所述待检测视频进行真伪检测步骤之前,还用于:
获取所述视频样本集合的目标帧置信度阈值;
根据所述目标帧置信度阈值确定各所述视频样本对应的伪造帧数阈值以及伪造帧数占比阈值;
根据所述候选伪造帧数集合和所述候选伪造帧数占比集合获取多个候选对,所述候选对由伪造帧数与伪造帧数占比组成;
针对各候选对,根据所述伪造帧数、所述伪造帧数占比、所述伪造帧数阈值以及所述伪造帧数占比阈值确定各视频样本的检测结果;
根据所述检测结果确定各候选对分别对应的真伪检测准确率;
根据所述真伪检测准确率从所述候选对中确定所述目标阈值组合。
在一些实施例中,所述处理模块在执行所述根据所述伪造帧数、所述伪造帧数占比、所述伪造帧数阈值以及所述伪造帧数占比阈值确定各视频样本的检测结果步骤时,具体用于:
针对各所述视频样本,若确定所述视频样本中的伪造帧数不小于所述伪造帧数阈值,且所述伪造帧数占比不小于所述伪造帧数占比阈值,则确定所述视频样本对应的所述检测结果为伪视频;
若确定所述视频样本中的伪造帧数小于所述伪造帧数阈值,或所述伪造帧数占比小于所述伪造帧数占比阈值,则确定所述视频样本对应的所述检测结果为真视频。
在一些实施例中,所述处理模块在执行所述根据所述检测结果确定各候选对分别对应的真伪检测准确率步骤时,具体用于:
获取各视频样本的真伪标签;
确定所述真伪标签与所述检测结果是否对应;
若真伪标签与所述检测结果相对应,则确定对应检测结果检测正确;
针对各候选对,根据正确的所述检测结果在各样本视频的比例,确定所述真伪检测准确率。
在一些实施例中,所述处理模块在执行所述根据所述真伪检测准确率从所述候选对中确定目标阈值组合步骤时,具体用于:
获取期望检测准确率;
从所述真伪检测准确率中确定与所述期望检测准确率对应的目标检测准确率;
将所述目标检测准确率对应的候选对确定为所述目标阈值组合。
在一些实施例中,所述处理模块在执行所述真伪检测准确率包括视频检测准确率以及伪造帧数检测准确率,所述从所述真伪检测准确率中确定与所述期望检测准确率对应的目标检测准确率步骤时,具体用于:
从所述视频检测准确率中确定与所述期望检测准确率对应的目标检测准确率;
所述处理模块在执行所述将所述目标检测准确率对应的候选对确定为所述目标阈值组合步骤时,具体用于:
若所述目标检测准确率对应多个候选对,则获取所述多个候选对中各候选对分别对应的所述伪造帧数检测准确率;
将所述伪造帧数检测准确率最高的候选对确定为所述目标阈值组合。
在一些实施例中,所述处理模块在执行所述根据目标阈值组合对所述待检测视频进行真伪检测,得到真伪检测结果步骤时,具体用于:
确定所述待检测视频的目标伪造帧数以及总帧数;
根据所述目标伪造帧数以及所述总帧数确定目标伪造帧数占比;
若所述目标伪造帧数不小于所述目标伪造帧数阈值,且所述目标伪造帧数占比不小于所述目标伪造帧数占比阈值,则确定所述待检测视频为伪视频;
若所述目标伪造帧数小于所述目标伪造帧数阈值,或所述目标伪造帧数占比小于所述目标伪造帧数占比阈值,则确定所述待检测视频为真视频。
第三方面,本申请实施例还提供了一种计算机设备,其包括存储器及处理器,所述存储器上存储有计算机程序,所述处理器执行所述计算机程序时实现上述方法。
第四方面,本申请实施例还提供了一种计算机可读存储介质,所述存储介质存储有计算机程序,所述计算机程序包括程序指令,所述程序指令当被处理器执行时可实现上述方法。
与现有技术相比,本申请实施例中,一方面,由于目标阈值组合包括目标伪造帧数阈值以及目标伪造帧数占比阈值,该目标伪造帧数阈值以及目标伪造帧数占比阈值能够表征真视频允许检测出来的伪造帧数或伪造帧数占比需要小于该目标伪造帧数阈值或目标伪造帧数占比阈值,所以能够在后续用于待检测视频真伪检测时,结合目标伪造帧数阈值以及目标伪造帧数占比阈值进行视频真伪检测起到同时检测视频伪造帧数以及伪造帧数占比的作用,使得可以对待检测视频进行多角度检测;另一方面,由于目标阈值组合根据视频样本集合、候选伪造帧数集合和候选伪造帧数占比集合计算得到,而视频样本集合包括播放时长大于预设时长的多个视频样本,所以目标阈值组合在针对待检测视频较长且包含的伪造帧数较少的视频进行真伪检测时,根据目标阈值组合对待检测视频进行真伪检测,即使待检测视频的视频较长,包含的伪造帧数较少,也可以通过该待检测视频的伪造帧数以及伪造帧数占比来确定该待检测视频的真伪,真伪判断不会受视频平均置信度的影响,从而提高视频真伪检测的准确率。
附图说明
为了更清楚地说明本申请实施例技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本申请实施例提供的视频真伪检测方法的应用场景示意图;
图2为本申请实施例提供的视频真伪检测模型中目标帧置信度阈值的训练流程示意图;
图3为本申请实施例提供的视频真伪检测方法的流程示意图;
图4为本申请实施例提供的视频真伪检测方法的子流程示意图;
图5为本申请实施例提供的视频真伪检测装置的示意性框图;
图6为本申请实施例中服务器的一种结构示意图;
图7为本申请实施例中终端的一种结构示意图;
图8为本申请实施例中服务器的一种结构示意图。
具体实施方式
本申请实施例的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的实施例能够以除了在这里图示或描述的内容以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或模块的过程、方法、***、产品或设备不必限于清楚地列出的那些步骤或模块,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或模块,本申请实施例中所出现的模块的划分,仅仅是一种逻辑上的划分,实际应用中实现时可以有另外的划分方式,例如多个模块可以结合成或集成在另一个***中,或一些特征可以忽略,或不执行,另外,所显示的或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,模块之间的间接耦合或通信连接可以是电性或其他类似的形式,本申请实施例中均不作限定。并且,作为分离部件说明的模块或子模块可以是也可以不是物理上的分离,可以是也可以不是物理模块,或者可以分布到多个电路模块中,可以根据实际的需要选择其中的部分或全部模块来实现本申请实施例方案的目的。
本申请实施例供了一种视频真伪检测方法、装置及存储介质,该视频真伪检测方法的执行主体可以是本申请实施例提供的视频真伪检测确定装置,或者集成了该视频真伪检测装置的计算机设备,其中,该视频真伪检测装置可以采用硬件或者软件的方式实现,该计算机设备可以为终端或服务器。
当该计算机设备为服务器时,该服务器可以是独立的物理服务器,也可以是多个物理服务器构成的服务器集群或者分布式***,还可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、CDN、以及大数据和人工智能平台等基础云计算服务的云服务器。
当该计算机设备为终端时,该终端可以包括:智能手机、平板电脑、笔记本电脑、桌上型电脑、智能电视、智能音箱、个人数字助理(英文全称:PersonalDigitalAssistant,英文简称:PDA)、台式计算机、智能手表等携带多媒体数据处理功能(例如,视频数据播放功能、音乐数据播放功能)的智能终端,但并不局限于此。
本申请实施例的方案可基于人工智能技术实现,具体来说涉及人工智能技术中的计算机视觉技术技术领域和云技术中的云计算、云存储和数据库等领域,下面将分别进行介绍。
人工智能(ArtificialIntelligence,AI)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用***。换句话说,人工智能是计算机科学的一个综合技术,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器。人工智能也就是研究各种智能机器的设计原理与实现方法,使机器具有感知、推理与决策的功能。
人工智能技术是一门综合学科,涉及领域广泛,既有硬件层面的技术也有软件层面的技术。人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互***、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等几大方向。
计算机视觉技术(ComputerVision,CV)计算机视觉是一门研究如何使机器“看”的科学,更进一步的说,就是指用摄影机和电脑代替人眼对目标进行识别、跟踪和测量等机器视觉,并进一步做图形处理,使电脑处理成为更适合人眼观察或传送给仪器检测的图像。作为一个科学学科,计算机视觉研究相关的理论和技术,试图建立能够从图像或者多维数据中获取信息的人工智能***。计算机视觉技术通常包括图像处理、人脸识别、图像语义理解、图像检索、OCR、视频处理、视频语义理解、视频内容/行为识别、三维物体重建、3D技术、虚拟现实、增强现实、同步定位与地图构建等技术,还包括常见的人脸识别、指纹识别等生物特征识别技术。
随着人工智能技术研究和进步,人工智能技术在多个领域展开研究和应用,例如常见的智能家居、智能穿戴设备、虚拟助理、智能音箱、智能营销、无人驾驶、自动驾驶、无人机、机器人、智能医疗、智能客服等,相信随着技术的发展,人工智能技术将在更多的领域得到应用,并发挥越来越重要的价值。
本申请实施例的方案可基于云技术实现,具体来说涉及云技术中的云计算、云存储和数据库等技术领域,下面将分别进行介绍。
云技术(Cloudtechnology)是指在广域网或局域网内将硬件、软件、网络等系列资源统一起来,实现数据的计算、储存、处理和共享的一种托管技术。云技术(Cloudtechnology)基于云计算商业模式应用的网络技术、信息技术、整合技术、管理平台技术、应用技术等的总称,可以组成资源池,按需所用,灵活便利。云计算技术将变成重要支撑。技术网络***的后台服务需要大量的计算、存储资源,如视频网站、图像类网站和更多的门户网站。伴随着互联网行业的高度发展和应用,将来每个物品都有可能存在自己的识别标志,都需要传输到后台***进行逻辑处理,不同程度级别的数据将会分开处理,各类行业数据皆需要强大的***后盾支撑,只能通过云计算来实现。本申请实施例可通过云技术对识别结果进行保存。
云存储(cloudstorage)是在云计算概念上延伸和发展出来的一个新的概念,分布式云存储***(以下简称存储***)是指通过集群应用、网格技术以及分布存储文件***等功能,将网络中大量各种不同类型的存储设备(存储设备也称之为存储节点)通过应用软件或应用接口集合起来协同工作,共同对外提供数据存储和业务访问功能的一个存储***。在本申请实施例中,可将网络配置等信息均保存在该存储***中,便于服务器调取。
目前,存储***的存储方法为:创建逻辑卷,在创建逻辑卷时,就为每个逻辑卷分配物理存储空间,该物理存储空间可能是某个存储设备或者某几个存储设备的磁盘组成。客户端在某一逻辑卷上存储数据,也就是将数据存储在文件***上,文件***将数据分成许多部分,每一部分是一个对象,对象不仅包含数据而且还包含数据标识(ID,IDentity)等额外的信息,文件***将每个对象分别写入该逻辑卷的物理存储空间,且文件***会记录每个对象的存储位置信息,从而当客户端请求访问数据时,文件***能够根据每个对象的存储位置信息让客户端对数据进行访问。
存储***为逻辑卷分配物理存储空间的过程,具体为:按照对存储于逻辑卷的对象的容量估量(该估量往往相对于实际要存储的对象的容量有很大余量)和独立冗余磁盘阵列(RAID,RedundantArrayofIndependentDisk)的组别,预先将物理存储空间划分成分条,一个逻辑卷可以理解为一个分条,从而为逻辑卷分配了物理存储空间。
数据库(Database),简而言之可视为电子化的文件柜——存储电子文件的处所,用户可以对文件中的数据进行新增、查询、更新、删除等操作。所谓“数据库”是以一定方式储存在一起、能与多个用户共享、具有尽可能小的冗余度、与应用程序彼此独立的数据集合。
数据库管理***(英语:DatabaseManagementSystem,简称DBMS)是为管理数据库而设计的电脑软件***,一般具有存储、截取、安全保障、备份等基础功能。数据库管理***可以依据它所支持的数据库模型来作分类,例如关系式、XML(ExtensibleMarkupLanguage,即可扩展标记语言);或依据所支持的计算机类型来作分类,例如服务器群集、移动电话;或依据所用查询语言来作分类,例如SQL(结构化查询语言,StructuredQueryLanguage)、XQuery;或依据性能冲量重点来作分类,例如最大规模、最高运行速度;亦或其他的分类方式。不论使用哪种分类方式,一些DBMS能够跨类别,例如,同时支持多种查询语言。在本申请实施例中,可将识别结果存储在该数据库管理***中,便于服务器调取。
其中,需要特别说明的是,本申请实施例涉及的服务终端,可以是指向服务终端提供语音和/或数据连通性的设备,具有无线连接功能的手持式设备、或连接到无线调制解调器的其他处理设备。例如移动电话(或称为“蜂窝”电话)和具有移动终端的计算机,例如,可以是便携式、袖珍式、手持式、计算机内置的或者车载的移动装置,它们与无线接入网交换语音和/或数据。例如,个人通信业务(英文全称:PersonalCommunicationService,英文简称:PCS)电话、无绳电话、会话发起协议(SIP)话机、无线本地环路(WirelessLocalLoop,英文简称:WLL)站、个人数字助理(英文全称:PersonalDigitalAssistant,英文简称:PDA)等设备。
在一些实施方式中,请参阅图1,图1为本申请实施例提供的视频真伪检测方法的一个应用场景示意图。本申请实施例可应用于如图1所示的视频真伪检测***1中,所述视频真伪检测***1包括服务器10、以及用户终端20,其中,用户终端20将待检测视频发送至服务器10,服务器10获取到该待检测视频之后,将根据目标阈值组合对所述待检测视频进行真伪检测,得到真伪检测结果,其中,目标阈值组合包括目标伪造帧数阈值以及目标伪造帧数占比阈值,然后输出该真伪检测结果至用户终端20。本申请实施例以服务器20作为执行主体为例,当执行主体为终端时,可参考服务器的实施例,不作赘述。
需要说明的是,在进行视频真伪检测的时候,对于视频中图像帧的真伪判断具有一定的容错包容,所以,检测出存在少量伪造帧图像并不能判断该视频就是伪视频。
下面,将结合附图2至图4详细描述本申请实施例的技术方案。
由于本申请实施例的视频真伪检测方法可以基于预先训练好的视频真伪检测模型对待检测视频进行真伪检测,所以在介绍视频真伪检测方法之前,先介绍该视频真伪检测模型的训练过程。为实现对待识别视频中视频较长且包含的伪造帧数较少时的伪视频进行准确识别,以提高视频真伪检测的准确率,本申请实施例中的视频真伪检测模型采用视频样本集合进行训练,所述视频样本集合包括播放时长大于预设时长的多个视频样本,使得该视频真伪检测模型能够识别出视频较长且包含的伪造帧数较少的伪视频,其中,该多个视频样本包括真视频样本以及伪视频样本。
一些实施方式中,如图2所示的一种视频真伪检测模型中目标帧置信度阈值的训练流程示意图,以针对多个播放时长大于预设时长的视频样本进行训练为例,该训练流程包括步骤101至步骤106:
101、服务器获取视频样本集合的目标帧置信度阈值。
其中,该目标帧置信度阈值根据以下方法得到:
根据所述视频样本集合,分别确定预设帧置信度阈值集合中各帧置信度阈值分别对应的帧检测准确率;然后将所述帧检测准确率最高的帧置信度阈值确定为所述目标帧置信度阈值。
其中,预设帧置信度阈值集合中包括多个帧置信度阈值,例如多个帧置信度阈值在0至1的区间内,按照粒度0.01进行取值,此时,预设帧置信度阈值集合为(0、0.01、0.02、0.03、……、0.99、1)。
具体地,视频样本集合中各视频样本还包括各帧图像的真伪标签,本实施例需要计算预设帧置信度阈值集合中各个帧置信度阈值下,每个视频样本的帧检测准确率,例如,第一视频样本具有500帧图像,在帧置信度阈值0.25下(即将0.25作为当次计算的帧置信度阈值),计算出这500帧图像中有400帧图像的真伪判断正确了(根据0.25这个帧置信度计算出的帧真伪计算结果,与该帧对应的真伪标签作比对,如果真伪情况相同,则判断正确,如果真伪情况不同,则判断错误),则此时,帧检测准确率为400/500=0.8%;第二视频样本具有600帧图像,在帧置信度阈值0.25下,计算出这600帧图像中有420帧图像的真伪判断正确了,则此时,帧检测准确率为420/600=0.7%……,计算所有视频样本在该帧置信度阈值下的准确率,然后再轮询其他帧置信度阈值,得到其他帧置信度阈值下各视频样本的帧检测准确率,直到计算得到设帧置信度阈值集合中所有帧置信度阈值下各视频样本的帧检测准确率,最后将帧检测准确率最高的帧置信度阈值确定为目标帧置信度阈值。
其中,预设时长可以为10分钟,也可以为其他时长,具体此处不作限定。
102、服务器根据所述目标帧置信度阈值确定各所述视频样本对应的伪造帧数阈值以及伪造帧数占比阈值。
具体地,对视频样本集合中的各个视频样本均做以下计算:将视频样本中的各帧图像依次输入预设的视频真伪检测模型中,得到各帧图像的帧置信度,将帧置信度小于目标帧置信度阈值的帧图像确定为真帧图像,将帧置信度不小于目标帧置信度阈值的帧图像确定为伪帧图像,将视频样本中计算得到的伪帧图像的总数确定为该视频样本对应的伪造帧数阈值,进而得到视频样本集合中各个视频样本分别对应的伪造帧数阈值。
其中,本实施例中某视频样本的伪造帧数阈值,即该视频样本在目标帧置信度阈值下的伪造帧的数量;伪造帧数占比阈值,即该视频样本的伪造帧数阈值与帧总数之比。
可见,本实施例通过目标帧置信度阈值为各视频样本分别设置一套伪造帧数阈值以及伪造帧数占比阈值,后续根据候选对进行检测结果的判断时,根据该伪造帧数阈值以及伪造帧数占比阈值为真伪判断依据,使得检测结果可以从帧的角度进行判断,可以减少检测结果的计算量。
103、服务器根据所述候选伪造帧数集合和所述候选伪造帧数占比集合获取多个候选对,所述候选对由伪造帧数与伪造帧数占比组成。
该候选伪造帧数集合包括多个候选伪造帧数,在一些实施例中,为提高计算精度,该多个伪造帧数可以为预设的伪造帧数,如为用户设置的数值,譬如包括1至50内的所有整数,或者设为其他数值,具体此处不作限定;在另一些实施例中,为减少候选伪造帧数集合中伪造帧数的数量,该候选伪造帧数集合中的伪造帧数还可以根据视频样本集合得到,此时,该候选伪造帧数集合中的伪造帧数包括视频样本集合中各视频样本的伪造帧数,其中,如果有多个视频样本对应同一个伪造帧数,则对伪造帧数进行去重处理,每个伪造帧数只保留一个,例如,有10个视频样本(当然实际情况中,视频样本集合中包括更多的样本数量,这里以10个为例子进行说明),分别对应的伪造帧数包括2、4、1、5、2、7、11、4、3以及7,去重后得到的伪造帧数集合为(1、2、3、4、5、7、11),由于此实施例得到的伪造帧数为根据视频样本得到的,伪造帧数的数量会比用户自行设置的少(用户自行设置时,由于需要防止遗漏伪造帧数,伪造帧数的取值范围一般情况需要设置很大),所以可以减少候选伪造帧数集合中候选伪造帧数的数量。
该候选伪造帧数占比集合包括多个候选伪造帧数占比,例如多个候选伪造帧数占比在0至1的区间内,按照粒度0.01进行取值,此时,候选伪造帧数占比集合为(0、0.01、0.02、0.03、……、0.99、1)。
104、服务器针对各候选对,根据所述伪造帧数、所述伪造帧数占比、所述伪造帧数阈值以及所述伪造帧数占比阈值确定各视频样本的检测结果。
具体地,对于各候选对,执行以下步骤:
对于各所述视频样本,若确定所述视频样本中的伪造帧数不小于所述伪造帧数阈值,且所述伪造帧数占比不小于所述伪造帧数占比阈值,则确定所述视频样本对应的所述检测结果为伪视频;若确定所述视频样本中的伪造帧数小于所述伪造帧数阈值,或所述伪造帧数占比小于所述伪造帧数占比阈值,则确定所述视频样本对应的所述检测结果为真视频。
最后计算得到每个候选对下各个视频样本的检测结果。
可见,本方案的检测结果可以从帧图像的角度进行判断,相对于从视频的角度进行判断,可以减少检测结果的计算量。
105、服务器根据所述检测结果确定各候选对分别对应的真伪检测准确率。
具体地,获取各视频样本的真伪标签;确定所述真伪标签与所述检测结果是否对应;若真伪标签与所述检测结果相对应,则确定对应检测结果检测正确;针对各候选对,根据正确的所述检测结果在各样本视频的比例,确定所述真伪检测准确率。
例如,如果某视频样本的真伪标签为真视频,而检测结果显示该视频样本为伪视频,则说明该检测结果是错误的;如果某视频样本的真伪标签为真视频,检测结果显示该视频样本也为真视频,则说明该检测结果是正确的。如果视频样本集合中有100个视频样本,使用某候选对进行检测时,该100个视频样本中,有90个检测结果是正确的,有10个检测结果是错误,所以该候选对对应的真伪准确率为90%;用以上方法计算各候选对分别对应的真伪检测准确率。
106、服务器根据所述真伪检测准确率从所述候选对中确定所述目标阈值组合。
在一些实施例中,为了保证视频检测的质量,将真伪检测准确率最高的候选对确定为目标阈值组合。
在另一些实施例中,可以根据用户需求调节视频真伪检测的容错度,此时,在确定目标阈值组合时,首先获取期望检测准确率;然后从所述真伪检测准确率中确定与所述期望检测准确率对应的目标检测准确率;将所述目标检测准确率对应的候选对确定为所述目标阈值组合。
其中,该期望检测准确率可以为用户指定的准确率,例如90%或95%等。
可见,本方案可以根据用户指定的期望检测准确率进行目标阈值组合的选取,可以根据用户需求对目标阈值组合进行调节,灵活度高。
在一些实施例中,所述真伪检测准确率包括视频检测准确率以及伪造帧数检测准确率,所述从所述真伪检测准确率中确定与所述期望检测准确率对应的目标检测准确率,包括:从所述视频检测准确率中确定与所述期望检测准确率对应的目标检测准确率。
其中,可能存在期望检测准确率对应多个候选对的情况,此时,需要对候选对进行进一步的选取,此时,若所述目标检测准确率对应多个候选对,则获取所述多个候选对中各候选对分别对应的所述伪造帧数检测准确率;并将所述伪造帧数检测准确率最高的候选对确定为所述目标阈值组合。
需要说明的是,以上训练过程可以在视频真伪检测模型中进行,从而训练得到训练好的视频真伪检测模型,也可以先训练得到目标阈值组合,直接将目标阈值组合写入视频真伪检测模型的对应参数中,得到训练好的视频真伪检测模型。
得到训练好的视频真伪检测模型之后,可以将该训练好的视频真伪检测模型应用在多台服务器上。
由此可见,本申请实施例中,通过训练得到的目标阈值组合,该目标阈值组合包括目标伪造帧数阈值以及目标伪造帧数占比阈值,目标伪造帧数阈值以及目标伪造帧数占比阈值能够表征真视频允许检测出来的伪造帧数或伪造帧数占比需要小于该目标伪造帧数阈值或目标伪造帧数占比阈值,所以能够在后续用于待检测视频真伪检测时,结合目标伪造帧数阈值以及目标伪造帧数占比阈值进行视频真伪检测起到同时检测视频伪造帧数以及伪造帧数占比的作用,使得可以对待检测视频进行多角度检测;另一方面,由于目标阈值组合根据视频样本集合、候选伪造帧数集合和候选伪造帧数占比集合计算得到,而视频样本集合包括播放时长大于预设时长的多个视频样本,所以目标阈值组合在针对待检测视频较长且包含的伪造帧数较少的视频进行真伪检测时,根据目标阈值组合对待检测视频进行真伪检测时,即使待检测视频的视频较长,包含的伪造帧数较少,也可以通过该待检测视频的伪造帧数以及伪造帧数占比来确定该待检测视频的真伪,真伪判断不会受视频平均置信度的影响,从而在后续使用该目标阈值组合进行视频真伪检测时,可以提高视频真伪检测的准确率。
如上述实施例所述,在通过模型训练得到上述视频真伪检测模型后,即可基于该视频真伪检测模型识别待处理视频的真伪情况。具体来说,参照图3,以下介绍本申请实施例所提供的一种视频真伪检测方法,本申请实施例包括:
201、服务器获取待检测视频。
本实施例以从用户终端中获取待检测视频为例进行说明,例如,用户需要对某个视频进行真伪检测时,将通过用户终端将该视频发送至服务器中,使得服务器获取到该视频,并将该视频作为待检测视频。
需要说明的是,服务器可以从用户终端中获取待检测视频之外,还可以根据其他方式获取该待检测视频,例如,服务器接收用户终端发送的待检测视频检测指令,该待检测视频检测指令中携带有待检测视频存储地址,用于指示服务器获取待检测视频并且对该待检测视频进行真伪检测,然后服务器根据该待检测视频指令中的待检测视频存储地址从待检测视频存储地址对应的地方(例如存储有待检测视频的存储装置,该存储装置可以为云储装置,或者其他物理存储装置)获取该待检测视频。
202、服务器根据目标阈值组合对所述待检测视频进行真伪检测,得到真伪检测结果,所述目标阈值组合包括目标伪造帧数阈值以及目标伪造帧数占比阈值,且所述目标阈值组合根据视频样本集合、候选伪造帧数集合和候选伪造帧数占比集合计算得到,所述视频样本集合包括播放时长大于预设时长的多个视频样本。
其中,视频样本集合每个视频样本都携带有对应的真伪标签,该真伪标签包括真视频以及假视频。
具体地,该候选伪造帧数集合包括多个候选伪造帧数,该候选伪造帧数占比集合包括多个候选伪造帧数占比,具体可参考步骤103对于候选伪造帧数集合以及候选伪造帧数占比集合的解释,此处不做赘述。
服务器获取到待检测视频之后,将该待检测视频输入视频真伪检测模型,通过视频真伪检测模型根据目标阈值组合对所述待检测视频进行真伪检测,得到真伪检测结果。
在一些实施例中,为了进一步丰富本实施例,请参阅图4,服务器中的视频真伪检测模型在进行真伪检测时,具体包括以下步骤:
2021、确定所述待检测视频的目标伪造帧数以及总帧数。
其中,视频真伪检测模型中除了设有目标阈值组合,还设有目标帧置信度阈值,本实施例将根据视频真伪检测模型得到各帧图像的帧置信度,将帧置信度小于目标帧置信度阈值的帧图像确定为真帧图像,将帧置信度不小于目标帧置信度阈值的帧图像确定为伪帧图像。
具体地,首先通过视频真伪检测模型对待检测视频进行分帧处理,将待检测视频分成一帧一帧的图像,统计待检测视频的图像帧数,以确定该待检测视频的总帧数,并判断每帧图像的真伪结果,该真伪结果包括真帧图像或伪帧图像,在进行真伪结果判断时,执行以下步骤:首先通过视频真伪检测模型得到各帧图像的置信度,然后将置信度小于目标帧置信度阈值的帧图像确定为真帧图像,将帧置信度不小于目标帧置信度阈值的帧图像确定为伪帧图像,最后统计待检测视频中伪帧图像的数量作为目标伪造帧数。
其中,该目标帧置信度阈值根据以下方法得到:
具体地,根据视频样本集合,分别确定预设帧置信度阈值集合中各帧置信度阈值分别对应的帧检测准确率;然后将所述帧检测准确率最高的帧置信度阈值确定为所述目标帧置信度阈值;其中,该视频样本集合包括播放时长大于预设时长的多个视频样本,并且每个视频样本都写到有对应的真伪标签,还包括视频样本中各帧图像的真伪标签。
例如多个帧置信度阈值在0至1的区间内,按照粒度0.01进行取值,此时,预设帧置信度阈值集合为(0、0.01、0.02、0.03、……、0.99、1)。
在计算每个视频样本的帧检测准确率时,例如,第一视频样本具有500帧图像,在帧置信度阈值0.25下,计算出这500帧图像中有400帧图像的真伪判断正确了,则此时,帧检测准确率为400/500=0.8%;第二视频样本具有600帧图像,在帧置信度阈值0.25下,计算出这600帧图像中有420帧图像的真伪判断正确了,则此时,帧检测准确率为420/600=0.7%……,计算所有视频样本在该帧置信度阈值下的准确率,然后再轮询其他帧置信度阈值,得到其他帧置信度阈值下各视频样本的帧检测准确率,直到计算得到设帧置信度阈值集合中所有帧置信度阈值下各视频样本的帧检测准确率,最后将帧检测准确率最高的帧置信度阈值确定为目标帧置信度阈值。
2022、根据所述目标伪造帧数以及所述总帧数确定目标伪造帧数占比。
例如,目标伪造帧数为4、总帧数为100,则此时目标伪造帧数占比为5/100=0.05。
2023、若所述目标伪造帧数不小于所述目标伪造帧数阈值,且所述目标伪造帧数占比不小于所述目标伪造帧数占比阈值,则确定所述待检测视频为伪视频。
例如,当目标伪造帧数阈值为5,目标伪造帧数占比阈值为0.06,待检测视频的目标伪造帧数为7、目标伪造帧数占比为0.07时,此时,由于目标伪造帧数7不小于目标伪造帧数阈值5,并且目标伪造帧数占比0.07不小于目标伪造帧数占比阈值0.06,此时,确定该待检测视频为伪视频。
本实施例中,需要同时满足目标伪造帧数不小于目标伪造帧数阈值,以及目标伪造帧数占比不小于目标伪造帧数占比阈值这两种情况,才能确定待检测视频为伪视频。
2024、若所述目标伪造帧数小于所述目标伪造帧数阈值,或所述目标伪造帧数占比小于所述目标伪造帧数占比阈值,则确定所述待检测视频为真视频。
例如,当目标伪造帧数阈值为5,目标伪造帧数占比阈值为0.06,待检测视频的目标伪造帧数为4、目标伪造帧数占比为0.07时,此时,虽然目标伪造帧数占0.07比大于目标伪造帧数占比阈值0.06,但是目标伪造帧数4小于目标伪造帧数阈值5,所以依然将该待检测视频确定为真视频。
本实施例中,只需要满足目标伪造帧数小于目标伪造帧数阈值,或目标伪造帧数占比小于目标伪造帧数占比阈值中的任意一种情况即可确定待检测视频为真视频。
在一些实施例中,为了进一步提高视频真伪检测的准确率,本实施例还结合平均置信度阈值对待检测视频进行真伪检测,此时,具体地,步骤202包括以下步骤;
根据目标阈值组合对所述待检测视频进行真伪检测,得到第一真伪检测结果;根据平均置信度阈值对所述待检测视频进行真伪检测,得到第二真伪检测结果,根据所述第一真伪检测结果以及所述第二真伪检测结果对待检测视频进行真伪检测。
其中,得到第一检测结果的具体过程可以参考图4对应的实施例,具体此处不作赘述,得到第一检测结果的具体过程如下:
伪造视频的常规检测逻辑为将待检测视频抽取为一帧一帧的图像,然后将帧图像输入视频真伪检测模型,输出视频中各帧图像的置信度,再根据各帧的置信度计算待检测视频中所有帧图像的平均置信度,最后将平均置信度与预设的平均置信度阈值进行比较,如果平均置信度大于或等于平均置信度阈值,则说明该视频为伪造视频,反之为真视频。
即,本实施例可以分别通过平均置信度阈值的方法以及目标阈值组合的方法对该待检测视频进行真伪检测,当根据其中一种方法确定待检测视频为伪视频,则确定该待检测视频为伪视频,即如果使用其中一种方法判断该待检测视频为伪视频,即使使用另一种方法判断该待检测视频为真视频,那么也确定该待检测视频为伪视频,只有两种方法同时判断待检测视频为真视频时,该待检测视频才确定为真视频。
可见,虽然通过平均置信度阈值的方法进行视频真伪判断时,可能出现当视频中伪造的帧较少且视频较长时,导致识别出错的情况发生,但是这种情况可以通过目标阈值组合的方法解决,并且通过平均置信度阈值的方法对于其他情况(如视频较短)的检测准确率是比较高的,所以本实施例结合平均置信度阈值以及目标阈值组合的方法对视频真伪进行检测,可以进一步提高视频真伪检测的准确率。
203、服务器输出所述真伪检测结果。
例如,将真伪检测结果输出发送至用户终端,使得用户通过用户终端得到该待检测视频的真伪情况。
综上所述,本申请实施例中,一方面,由于目标阈值组合包括目标伪造帧数阈值以及目标伪造帧数占比阈值,该目标伪造帧数阈值以及目标伪造帧数占比阈值能够表征真视频允许检测出来的伪造帧数或伪造帧数占比需要小于该目标伪造帧数阈值或目标伪造帧数占比阈值,所以能够在后续用于待检测视频真伪检测时,结合目标伪造帧数阈值以及目标伪造帧数占比阈值进行视频真伪检测起到同时检测视频伪造帧数以及伪造帧数占比的作用,使得可以对待检测视频进行多角度检测。
另一方面,由于目标阈值组合根据视频样本集合、候选伪造帧数集合和候选伪造帧数占比集合计算得到,而视频样本集合包括播放时长大于预设时长的多个视频样本,所以目标阈值组合在针对待检测视频较长且包含的伪造帧数较少的视频进行真伪检测时,根据目标阈值组合对待检测视频进行真伪检测时,即使待检测视频的视频较长,包含的伪造帧数较少,也可以通过该待检测视频的伪造帧数以及伪造帧数占比来确定该待检测视频的真伪,真伪判断不会受视频平均置信度的影响,从而提高视频真伪检测的准确率。
图5是本申请实施例提供的一种视频真伪检测装置的示意性框图。如图5所示,对应于以上视频真伪检测方法,本申请还提供一种视频真伪检测装置。该视频真伪检测装置包括用于执行上述视频真伪检测方法的单元,该装置可以被配置于服务器或终端中。具体地,请参阅图5,该视频真伪检测装置500包括收发模块501以及处理模块502,其中:
收发模块501,用于获取待检测视频;
处理模块502,用于根据目标阈值组合对所述待检测视频进行真伪检测,得到真伪检测结果,所述目标阈值组合包括目标伪造帧数阈值以及目标伪造帧数占比阈值,且所述目标阈值组合根据视频样本集合、候选伪造帧数集合和候选伪造帧数占比集合计算得到,所述视频样本集合包括播放时长大于预设时长的多个视频样本;
所述收发模块501,还用于输出所述真伪检测结果。
在一些实施例中,所述处理模块502在执行所述根据目标阈值组合对所述待检测视频进行真伪检测步骤之前,还用于:
获取所述视频样本集合的目标帧置信度阈值;
根据所述目标帧置信度阈值确定各所述视频样本对应的伪造帧数阈值以及伪造帧数占比阈值;
根据所述候选伪造帧数集合和所述候选伪造帧数占比集合获取多个候选对,所述候选对由伪造帧数与伪造帧数占比组成;
针对各候选对,根据所述伪造帧数、所述伪造帧数占比、所述伪造帧数阈值以及所述伪造帧数占比阈值确定各视频样本的检测结果;
根据所述检测结果确定各候选对分别对应的真伪检测准确率;
根据所述真伪检测准确率从所述候选对中确定所述目标阈值组合。
在一些实施例中,所述处理模块502在执行所述根据所述伪造帧数、所述伪造帧数占比、所述伪造帧数阈值以及所述伪造帧数占比阈值确定各视频样本的检测结果步骤时,具体用于:
针对各所述视频样本,若确定所述视频样本中的伪造帧数不小于所述伪造帧数阈值,且所述伪造帧数占比不小于所述伪造帧数占比阈值,则确定所述视频样本对应的所述检测结果为伪视频;
若确定所述视频样本中的伪造帧数小于所述伪造帧数阈值,或所述伪造帧数占比小于所述伪造帧数占比阈值,则确定所述视频样本对应的所述检测结果为真视频。
在一些实施例中,所述处理模块502在执行所述根据所述检测结果确定各候选对分别对应的真伪检测准确率步骤时,具体用于:
获取各视频样本的真伪标签;
确定所述真伪标签与所述检测结果是否对应;
若真伪标签与所述检测结果相对应,则确定对应检测结果检测正确;
针对各候选对,根据正确的所述检测结果在各样本视频的比例,确定所述真伪检测准确率。
在一些实施例中,所述处理模块502在执行所述根据所述真伪检测准确率从所述候选对中确定目标阈值组合步骤时,具体用于:
获取期望检测准确率;
从所述真伪检测准确率中确定与所述期望检测准确率对应的目标检测准确率;
将所述目标检测准确率对应的候选对确定为所述目标阈值组合。
在一些实施例中,所述处理模块502在执行所述真伪检测准确率包括视频检测准确率以及伪造帧数检测准确率,所述从所述真伪检测准确率中确定与所述期望检测准确率对应的目标检测准确率步骤时,具体用于:
从所述视频检测准确率中确定与所述期望检测准确率对应的目标检测准确率;
所述处理模块在执行所述将所述目标检测准确率对应的候选对确定为所述目标阈值组合步骤时,具体用于:
若所述目标检测准确率对应多个候选对,则获取所述多个候选对中各候选对分别对应的所述伪造帧数检测准确率;
将所述伪造帧数检测准确率最高的候选对确定为所述目标阈值组合。
在一些实施例中,所述处理模块502在执行所述根据目标阈值组合对所述待检测视频进行真伪检测,得到真伪检测结果步骤时,具体用于:
确定所述待检测视频的目标伪造帧数以及总帧数;
根据所述目标伪造帧数以及所述总帧数确定目标伪造帧数占比;
若所述目标伪造帧数不小于所述目标伪造帧数阈值,且所述目标伪造帧数占比不小于所述目标伪造帧数占比阈值,则确定所述待检测视频为伪视频;
若所述目标伪造帧数小于所述目标伪造帧数阈值,或所述目标伪造帧数占比小于所述目标伪造帧数占比阈值,则确定所述待检测视频为真视频。
综上所述,由于本方案中的视频真伪检测装置联合了目标伪造帧数阈值以及目标伪造帧数占比阈值对待检测视频进行真伪检测,即使待检测视频的视频较长,包含的伪造帧数较少,也可以通过该待检测视频的伪造帧数以及伪造帧数占比来确定该待检测视频的真伪,真伪判断不会受视频平均置信度的影响,从而提高了视频真伪检测的准确率。
需要说明的是,所属领域的技术人员可以清楚地了解到,上述视频真伪检测装置和各单元的具体实现过程,可以参考前述方法实施例中的相应描述,为了描述的方便和简洁,在此不再赘述。
上面从模块化功能实体的角度对本申请实施例中的人脸识别***进行了描述,下面从硬件处理的角度分别对本申请实施例中的人脸识别装置进行描述。
需要说明的是,在本申请实施例各实施例(包括图5所示的各实施例)中所有的收发模块对应的实体设备可以为收发器,所有的处理模块对应的实体设备可以为处理器。当其中一种装置具有如图5所示的结构时,处理器、收发器和存储器实现前述对应该装置的装置实施例提供的所述收发模块和所述处理模块相同或相似的功能,图6中的存储器存储处理器执行上述视频真伪检测方法时需要调用的计算机程序。
图5所示的***可以具有如图6所示的结构,当图5所示的装置具有如图6所示的结构时,图6中的处理器能够实现前述对应该装置的装置实施例提供的所述处理模块相同或相似的功能,图6中的收发器能够实现前述对应该装置的装置实施例提供的所述收发模块相同或相似的功能,图6中的存储器存储处理器执行上述视频真伪检测方法时需要调用的计算机程序。在本申请实施例图5所示的实施例中的所述收发模块所对应的实体设备可以为输入输出接口,所述处理模块对应的实体设备可以为处理器。
本申请实施例还提供了另一种终端设备,如图7所示,为了便于说明,仅示出了与本申请实施例相关的部分,具体技术细节未揭示的,请参照本申请实施例方法部分。该终端设备可以为包括手机、平板电脑、个人数字助理(英文全称:PersonalDigitalAssistant,英文简称:PDA)、销售终端(英文全称:PointofSales,英文简称:POS)、车载电脑等任意终端设备,以终端为手机为例:
图7示出的是与本申请实施例提供的终端设备相关的手机的部分结构的框图。参考图7,手机包括:射频(英文全称:RadioFrequency,英文简称:RF)电路610、存储器620、输入单元630、显示单元640、传感器650、音频电路660、无线保真(英文全称:wirelessfidelity,英文简称:Wi-Fi)模块670、处理器680、以及电源690等部件。本领域技术人员可以理解,图7中示出的手机结构并不构成对手机的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
下面结合图7对手机的各个构成部件进行具体的介绍:
RF电路710可用于收发信息或通话过程中,信号的接收和发送,特别地,将基站的下行信息接收后,给处理器780处理;另外,将设计上行的数据发送给基站。通常,RF电路710包括但不限于天线、至少一个放大器、收发信机、耦合器、低噪声放大器(英文全称:LowNoiseAmplifier,英文简称:LNA)、双工器等。此外,RF电路710还可以通过无线通信与网络和其他设备通信。上述无线通信可以使用任一通信标准或协议,包括但不限于全球移动通讯***(英文全称:GlobalSystemofMobilecommunication,英文简称:GSM)、通用分组无线服务(英文全称:GeneralPacketRadioService,英文简称:GPRS)、码分多址(英文全称:CodeDivisionMultipleAccess,英文简称:CDMA)、宽带码分多址(英文全称:WidebandCodeDivisionMultipleAccess,英文简称:WCDMA)、长期演进(英文全称:Long TermEvolution,英文简称:LTE)、电子邮件、短消息服务(英文全称:ShortMessagingService,英文简称:SMS)等。
存储器720可用于存储软件程序以及模块,处理器780通过运行存储在存储器720的软件程序以及模块,从而执行手机的各种功能应用以及数据处理。存储器720可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作***、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等;存储数据区可存储根据手机的使用所创建的数据(比如音频数据、电话本等)等。此外,存储器720可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。
输入单元730可用于接收输入的数字或字符信息,以及产生与手机的用户设置以及功能控制有关的键信号输入。具体地,输入单元730可包括触控面板731以及其他输入设备732。触控面板731,也称为触摸屏,可收集用户在其上或附近的触摸操作(比如用户使用手指、触笔等任何适合的物体或附件在触控面板731上或在触控面板731附近的操作),并根据预先设定的程式驱动相应的连接装置。可选的,触控面板731可包括触摸检测装置和触摸控制器两个部分。其中,触摸检测装置检测用户的触摸方位,并检测触摸操作带来的信号,将信号传送给触摸控制器;触摸控制器从触摸检测装置上接收触摸信息,并将它转换成触点坐标,再送给处理器780,并能接收处理器780发来的命令并加以执行。此外,可以采用电阻式、电容式、红外线以及表面声波等多种类型实现触控面板731。除了触控面板731,输入单元730还可以包括其他输入设备732。具体地,其他输入设备732可以包括但不限于物理键盘、功能键(比如音量控制按键、开关按键等)、轨迹球、鼠标、操作杆等中的一种或多种。
显示单元740可用于显示由用户输入的信息或提供给用户的信息以及手机的各种菜单。显示单元740可包括显示面板741,可选的,可以采用液晶显示器(英文全称:LiquidCrystal Display,英文简称:LCD)、有机发光二极管(英文全称:OrganicLight-EmittingDiode,英文简称:OLED)等形式来配置显示面板741。进一步的,触控面板731可覆盖显示面板741,当触控面板731检测到在其上或附近的触摸操作后,传送给处理器780以确定触摸事件的类型,随后处理器780根据触摸事件的类型在显示面板741上提供相应的视觉输出。虽然在图7中,触控面板731与显示面板741是作为两个独立的部件来实现手机的输入和输入功能,但是在某些实施例中,可以将触控面板731与显示面板741集成而实现手机的输入和输出功能。
手机还可包括至少一种传感器750,比如光传感器、运动传感器以及其他传感器。具体地,光传感器可包括环境光传感器及接近传感器,其中,环境光传感器可根据环境光线的明暗来调节显示面板741的亮度,接近传感器可在手机移动到耳边时,关闭显示面板741和/或背光。作为运动传感器的一种,加速计传感器可检测各个方向上(一般为三轴)加速度的大小,静止时可检测出重力的大小及方向,可用于识别手机姿态的应用(比如横竖屏切换、相关游戏、磁力计姿态校准)、振动识别相关功能(比如计步器、敲击)等;至于手机还可配置的陀螺仪、气压计、湿度计、温度计、红外线传感器等其他传感器,在此不再赘述。
音频电路760、扬声器761,传声器762可提供用户与手机之间的音频接口。音频电路760可将接收到的音频数据转换后的电信号,传输到扬声器761,由扬声器761转换为声音信号输出;另一方面,传声器762将收集的声音信号转换为电信号,由音频电路760接收后转换为音频数据,再将音频数据输出处理器780处理后,经RF电路710以发送给比如另一手机,或者将音频数据输出至存储器720以便进一步处理。
Wi-Fi属于短距离无线传输技术,手机通过Wi-Fi模块770可以帮助用户收发电子邮件、浏览网页和访问流式媒体等,它为用户提供了无线的宽带互联网访问。虽然图7示出了Wi-Fi模块770,但是可以理解的是,其并不属于手机的必须构成,完全可以根据需要在不改变申请的本质的范围内而省略。
处理器780是手机的控制中心,利用各种接口和线路连接整个手机的各个部分,通过运行或执行存储在存储器720内的软件程序和/或模块,以及调用存储在存储器720内的数据,执行手机的各种功能和处理数据,从而对手机进行整体监控。可选的,处理器780可包括一个或多个处理模块;优选的,处理器780可集成应用处理器和调制解调处理器,其中,应用处理器主要处理操作***、用户界面和应用程序等,调制解调处理器主要处理无线通信。可以理解的是,上述调制解调处理器也可以不集成到处理器780中。
手机还包括给各个部件供电的电源790(比如电池),电源可以通过电源管理***与处理器780逻辑相连,从而通过电源管理***实现管理充电、放电、以及功耗管理等功能。
尽管未示出,手机还可以包括摄像头、蓝牙模块等,在此不再赘述。
在本申请实施例中,该手机所包括的处理器780还具有控制执行以上由图2和图3所示流程图。
图8是本申请实施例提供的一种服务器结构示意图,该服务器820可因配置或性能不同而产生比较大的差异,可以包括一个或一个以***处理器(英文全称:centralprocessing units,英文简称:CPU)822(例如,一个或一个以上处理器)和存储器832,一个或一个以上存储应用程序842或数据844的存储介质830(例如一个或一个以上海量存储设备)。其中,存储器832和存储介质830可以是短暂存储或持久存储。存储在存储介质830的程序可以包括一个或一个以上模块(图示没标出),每个模块可以包括对服务器中的一系列指令操作。更进一步地,中央处理器822可以设置为与存储介质830通信,在服务器820上执行存储介质830中的一系列指令操作。
服务器820还可以包括一个或一个以上电源826,一个或一个以上有线或无线网络接口850,一个或一个以上输入输出接口858,和/或,一个或一个以上操作***841,例如Windows Server,MacOSX,Unix,Linux,FreeBSD等等。
上述实施例中由服务器所执行的步骤可以基于该图8所示的服务器820的结构。例如上述实施例中由图2和图3所示的服务器的步骤可以基于该图8所示的服务器结构。例如,所述处理器822通过调用存储器832中的指令,执行以下操作:
获取待检测视频;
根据目标阈值组合对所述待检测视频进行真伪检测,得到真伪检测结果,所述目标阈值组合包括目标伪造帧数阈值以及目标伪造帧数占比阈值,且所述目标阈值组合根据视频样本集合、候选伪造帧数集合和候选伪造帧数占比集合计算得到,所述视频样本集合包括播放时长大于预设时长的多个视频样本;
输出所述真伪检测结果。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的***,装置和模块的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在本申请实施例所提供的几个实施例中,应该理解到,所揭露的***,装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述模块的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个模块或组件可以结合或者可以集成到另一个***,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或模块的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的模块可以是或者也可以不是物理上分开的,作为模块显示的部件可以是或者也可以不是物理模块,即可以位于一个地方,或者也可以分布到多个网络模块上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。
另外,在本申请实施例各个实施例中的各功能模块可以集成在一个处理模块中,也可以是各个模块单独物理存在,也可以两个或两个以上模块集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。所述集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。
在上述实施例中,可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时,可以全部或部分地以计算机程序产品的形式实现。
所述计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行所述计算机计算机程序时,全部或部分地产生按照本申请实施例所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一计算机可读存储介质传输,例如,所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(DSL))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。所述计算机可读存储介质可以是计算机能够存储的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质,(例如,软盘、硬盘、磁带)、光介质(例如,DVD)、或者半导体介质(例如固态硬盘SolidStateDisk(SSD))等。
以上对本申请实施例所提供的技术方案进行了详细介绍,本申请实施例中应用了具体个例对本申请实施例的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本申请实施例的方法及其核心思想;同时,对于本领域的一般技术人员,依据本申请实施例的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本申请实施例的限制。
Claims (12)
1.一种视频真伪检测方法,其特征在于,包括:
获取待检测视频;
根据目标阈值组合对所述待检测视频进行真伪检测,得到真伪检测结果,所述目标阈值组合包括目标伪造帧数阈值以及目标伪造帧数占比阈值,且所述目标阈值组合根据视频样本集合、候选伪造帧数集合和候选伪造帧数占比集合计算得到,所述视频样本集合包括播放时长大于预设时长的多个视频样本;
输出所述真伪检测结果;
其中,所述根据目标阈值组合对所述待检测视频进行真伪检测之前,所述方法还包括:
获取所述视频样本集合的目标帧置信度阈值;
根据所述目标帧置信度阈值确定各所述视频样本对应的伪造帧数阈值以及伪造帧数占比阈值;
根据所述候选伪造帧数集合和所述候选伪造帧数占比集合获取多个候选对,所述候选对由伪造帧数与伪造帧数占比组成;
针对各候选对,根据所述伪造帧数、所述伪造帧数占比、所述伪造帧数阈值以及所述伪造帧数占比阈值确定各视频样本的检测结果;
根据所述检测结果确定各候选对分别对应的真伪检测准确率;
根据所述真伪检测准确率从所述候选对中确定所述目标阈值组合。
2.根据权利要求1所述的方法,其特征在于,所述根据所述伪造帧数、所述伪造帧数占比、所述伪造帧数阈值以及所述伪造帧数占比阈值确定各视频样本的检测结果,包括:
针对各所述视频样本,若确定所述视频样本中的伪造帧数不小于所述伪造帧数阈值,且所述伪造帧数占比不小于所述伪造帧数占比阈值,则确定所述视频样本对应的所述检测结果为伪视频;
若确定所述视频样本中的伪造帧数小于所述伪造帧数阈值,或所述伪造帧数占比小于所述伪造帧数占比阈值,则确定所述视频样本对应的所述检测结果为真视频。
3.根据权利要求1或2所述的方法,其特征在于,所述根据所述检测结果确定各候选对分别对应的真伪检测准确率,包括:
获取各视频样本的真伪标签;
确定所述真伪标签与所述检测结果是否对应;
若真伪标签与所述检测结果相对应,则确定对应检测结果检测正确;
针对各候选对,根据正确的所述检测结果在各样本视频的比例,确定所述真伪检测准确率。
4.根据权利要求1或2所述的方法,其特征在于,所述根据所述真伪检测准确率从所述候选对中确定目标阈值组合,包括:
获取期望检测准确率;
从所述真伪检测准确率中确定与所述期望检测准确率对应的目标检测准确率;
将所述目标检测准确率对应的候选对确定为所述目标阈值组合。
5.根据权利要求1或2所述的方法,其特征在于,所述根据目标阈值组合对所述待检测视频进行真伪检测,得到真伪检测结果,包括:
确定所述待检测视频的目标伪造帧数以及总帧数;
根据所述目标伪造帧数以及所述总帧数确定目标伪造帧数占比;
若所述目标伪造帧数不小于所述目标伪造帧数阈值,且所述目标伪造帧数占比不小于所述目标伪造帧数占比阈值,则确定所述待检测视频为伪视频;
若所述目标伪造帧数小于所述目标伪造帧数阈值,或所述目标伪造帧数占比小于所述目标伪造帧数占比阈值,则确定所述待检测视频为真视频。
6.一种视频真伪检测装置,其特征在于,包括:
收发模块,用于获取待检测视频;
处理模块,用于根据目标阈值组合对所述待检测视频进行真伪检测,得到真伪检测结果,所述目标阈值组合包括目标伪造帧数阈值以及目标伪造帧数占比阈值,且所述目标阈值组合根据视频样本集合、候选伪造帧数集合和候选伪造帧数占比集合计算得到,所述视频样本集合包括播放时长大于预设时长的多个视频样本;
所述收发模块,还用于输出所述真伪检测结果;
其中,所述处理模块在执行所述根据目标阈值组合对所述待检测视频进行真伪检测步骤之前,还用于:
获取所述视频样本集合的目标帧置信度阈值;
根据所述目标帧置信度阈值确定各所述视频样本对应的伪造帧数阈值以及伪造帧数占比阈值;
根据所述候选伪造帧数集合和所述候选伪造帧数占比集合获取多个候选对,所述候选对由伪造帧数与伪造帧数占比组成;
针对各候选对,根据所述伪造帧数、所述伪造帧数占比、所述伪造帧数阈值以及所述伪造帧数占比阈值确定各视频样本的检测结果;
根据所述检测结果确定各候选对分别对应的真伪检测准确率;
根据所述真伪检测准确率从所述候选对中确定所述目标阈值组合。
7.根据权利要求6所述的视频真伪检测装置,其特征在于,所述处理模块在执行所述根据所述伪造帧数、所述伪造帧数占比、所述伪造帧数阈值以及所述伪造帧数占比阈值确定各视频样本的检测结果步骤时,具体用于:
针对各所述视频样本,若确定所述视频样本中的伪造帧数不小于所述伪造帧数阈值,且所述伪造帧数占比不小于所述伪造帧数占比阈值,则确定所述视频样本对应的所述检测结果为伪视频;
若确定所述视频样本中的伪造帧数小于所述伪造帧数阈值,或所述伪造帧数占比小于所述伪造帧数占比阈值,则确定所述视频样本对应的所述检测结果为真视频。
8.根据权利要求6或7所述的视频真伪检测装置,其特征在于,所述处理模块在执行所述根据所述检测结果确定各候选对分别对应的真伪检测准确率步骤时,具体用于:
获取各视频样本的真伪标签;
确定所述真伪标签与所述检测结果是否对应;
若真伪标签与所述检测结果相对应,则确定对应检测结果检测正确;
针对各候选对,根据正确的所述检测结果在各样本视频的比例,确定所述真伪检测准确率。
9.根据权利要求6或7所述的视频真伪检测装置,其特征在于,所述处理模块在执行所述根据所述真伪检测准确率从所述候选对中确定目标阈值组合步骤时,具体用于:
获取期望检测准确率;
从所述真伪检测准确率中确定与所述期望检测准确率对应的目标检测准确率;
将所述目标检测准确率对应的候选对确定为所述目标阈值组合。
10.根据权利要求6或7所述的视频真伪检测装置,其特征在于,所述处理模块在执行所述根据目标阈值组合对所述待检测视频进行真伪检测,得到真伪检测结果步骤时,具体用于:
确定所述待检测视频的目标伪造帧数以及总帧数;
根据所述目标伪造帧数以及所述总帧数确定目标伪造帧数占比;
若所述目标伪造帧数不小于所述目标伪造帧数阈值,且所述目标伪造帧数占比不小于所述目标伪造帧数占比阈值,则确定所述待检测视频为伪视频;
若所述目标伪造帧数小于所述目标伪造帧数阈值,或所述目标伪造帧数占比小于所述目标伪造帧数占比阈值,则确定所述待检测视频为真视频。
11.一种计算机设备,其特征在于,所述计算机设备包括存储器及处理器,所述存储器上存储有计算机程序,所述处理器执行所述计算机程序时实现如权利要求1-5中任一项所述的方法。
12.一种计算机可读存储介质,其特征在于,所述存储介质存储有计算机程序,所述计算机程序包括程序指令,所述程序指令当被处理器执行时可实现如权利要求1-5中任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211073269.3A CN115412726B (zh) | 2022-09-02 | 2022-09-02 | 视频真伪检测方法、装置及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211073269.3A CN115412726B (zh) | 2022-09-02 | 2022-09-02 | 视频真伪检测方法、装置及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN115412726A CN115412726A (zh) | 2022-11-29 |
CN115412726B true CN115412726B (zh) | 2024-03-01 |
Family
ID=84164265
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211073269.3A Active CN115412726B (zh) | 2022-09-02 | 2022-09-02 | 视频真伪检测方法、装置及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115412726B (zh) |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2013171457A (ja) * | 2012-02-21 | 2013-09-02 | Nippon Hoso Kyokai <Nhk> | 擬似輪郭領域検出装置及びプログラム |
CN111160286A (zh) * | 2019-12-31 | 2020-05-15 | 中国电子科技集团公司信息科学研究院 | 一种视频真伪鉴别方法 |
CN112329730A (zh) * | 2020-11-27 | 2021-02-05 | 上海商汤智能科技有限公司 | 视频检测方法、装置、设备及计算机可读存储介质 |
CN112653886A (zh) * | 2020-12-14 | 2021-04-13 | 华中科技大学 | 一种基于无线信号的监控视频流伪造检测方法和定位方法 |
CN114782858A (zh) * | 2022-03-28 | 2022-07-22 | 中国人民解放军战略支援部队信息工程大学 | 一种基于预训练多模态模型的伪造视频检测方法及*** |
-
2022
- 2022-09-02 CN CN202211073269.3A patent/CN115412726B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2013171457A (ja) * | 2012-02-21 | 2013-09-02 | Nippon Hoso Kyokai <Nhk> | 擬似輪郭領域検出装置及びプログラム |
CN111160286A (zh) * | 2019-12-31 | 2020-05-15 | 中国电子科技集团公司信息科学研究院 | 一种视频真伪鉴别方法 |
CN112329730A (zh) * | 2020-11-27 | 2021-02-05 | 上海商汤智能科技有限公司 | 视频检测方法、装置、设备及计算机可读存储介质 |
CN112653886A (zh) * | 2020-12-14 | 2021-04-13 | 华中科技大学 | 一种基于无线信号的监控视频流伪造检测方法和定位方法 |
CN114782858A (zh) * | 2022-03-28 | 2022-07-22 | 中国人民解放军战略支援部队信息工程大学 | 一种基于预训练多模态模型的伪造视频检测方法及*** |
Also Published As
Publication number | Publication date |
---|---|
CN115412726A (zh) | 2022-11-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN114973351B (zh) | 人脸识别方法、装置、设备及存储介质 | |
CN115022098B (zh) | 人工智能安全靶场内容推荐方法、装置及存储介质 | |
CN114595124A (zh) | 时序异常检测模型评估方法、相关装置及存储介质 | |
CN115658348A (zh) | 微服务调用方法、相关装置及存储介质 | |
CN111399819A (zh) | 数据生成方法、装置、电子设备及存储介质 | |
CN115376192B (zh) | 用户异常行为确定方法、装置、计算机设备及存储介质 | |
CN116778306A (zh) | 伪造对象检测方法、相关装置及存储介质 | |
CN116861198A (zh) | 数据处理方法、装置及存储介质 | |
CN116071614A (zh) | 样本数据处理方法、相关设备及存储介质 | |
CN116758362A (zh) | 图像处理方法、装置、计算机设备及存储介质 | |
CN115984643A (zh) | 模型训练方法、相关设备及存储介质 | |
CN115640567B (zh) | Tee完整性认证方法、装置、***及存储介质 | |
CN114821751B (zh) | 图像识别方法、装置、***及存储介质 | |
CN115546516A (zh) | 人员聚档方法、装置、计算机设备及存储介质 | |
CN115412726B (zh) | 视频真伪检测方法、装置及存储介质 | |
CN115062197A (zh) | 考勤数据检测方法、装置及存储介质 | |
CN115565215B (zh) | 一种人脸识别算法切换方法、装置及存储介质 | |
CN115525554B (zh) | 模型的自动化测试方法、***及存储介质 | |
CN115909186B (zh) | 图像信息识别方法、装置、计算机设备及存储介质 | |
CN116386647B (zh) | 音频验证方法、相关装置、存储介质及程序产品 | |
CN116363490A (zh) | 伪造对象检测方法、相关装置及存储介质 | |
CN116244071A (zh) | 资源调整方法、相关设备及存储介质 | |
CN115050079B (zh) | 人脸识别方法、装置及存储介质 | |
CN116954631A (zh) | 模型部署方法、相关装置及存储介质 | |
CN116032433A (zh) | 消息处理方法、相关设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |