CN116188439A - 一种基于身份识别概率分布的伪造换脸图像检测方法和装置 - Google Patents

一种基于身份识别概率分布的伪造换脸图像检测方法和装置 Download PDF

Info

Publication number
CN116188439A
CN116188439A CN202310202602.4A CN202310202602A CN116188439A CN 116188439 A CN116188439 A CN 116188439A CN 202310202602 A CN202310202602 A CN 202310202602A CN 116188439 A CN116188439 A CN 116188439A
Authority
CN
China
Prior art keywords
identity
image
probability distribution
identity recognition
model
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202310202602.4A
Other languages
English (en)
Inventor
张旭鸿
段宇萱
徐时健
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Qiaozhihui Technology Zhejiang Co ltd
Original Assignee
Qiaozhihui Technology Zhejiang Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Qiaozhihui Technology Zhejiang Co ltd filed Critical Qiaozhihui Technology Zhejiang Co ltd
Priority to CN202310202602.4A priority Critical patent/CN116188439A/zh
Publication of CN116188439A publication Critical patent/CN116188439A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/0002Inspection of images, e.g. flaw detection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/764Arrangements for image or video recognition or understanding using pattern recognition or machine learning using classification, e.g. of video objects
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/77Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
    • G06V10/774Generating sets of training patterns; Bootstrap methods, e.g. bagging or boosting
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02TCLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
    • Y02T10/00Road transport of goods or passengers
    • Y02T10/10Internal combustion engine [ICE] based vehicles
    • Y02T10/40Engine management systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Computing Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Databases & Information Systems (AREA)
  • Evolutionary Computation (AREA)
  • General Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Software Systems (AREA)
  • Multimedia (AREA)
  • Quality & Reliability (AREA)
  • Image Analysis (AREA)
  • Image Processing (AREA)

Abstract

本发明公开了一种基于身份识别概率分布的伪造换脸图像检测方法和装置,构建真实图像和对应的身份标签,对身份标签进行平滑操作以构建平滑的身份标签;采用真实图像对身份识别模型进行多轮基于身份标签的监督学***滑的身份标签的监督学习以优化参数;直到训练结束,将身份识别模型输出的最大预测概率值与阈值进行比较,当最大预测概率值小于阈值则检测为伪造换脸图像。该方法在防御攻击的同时,提升伪造换脸图像的检测准确性和泛化性。

Description

一种基于身份识别概率分布的伪造换脸图像检测方法和装置
技术领域
本发明属于深度伪造检测技术领域,具体涉及一种基于身份识别概率分布的伪造换脸图像检测方法和装置。
背景技术
近年来,随着生成对抗网络(GAN)等深度生成技术的发展,换脸图像的生成效果变得更加真实、生成过程变得更加简便,因此对舆论安全的威胁变得更加严重,亟需研究可靠的伪造换脸图像检测方法。
现有的伪造换脸图像检测方法大多将伪造换脸图像检测建模为一个真伪二分类问题,收集大量伪造换脸图像和真实人脸图像训练分类深度神经网络,用于检测待测图像的真伪,例如专利文献CN115100128A公开的一种联合多尺度特征的深度伪造图像检测方法,再例如专利文献CN115240243A公开的一种人脸伪造检测方法。这类方法容易在训练集中的换脸伪造图像上过度拟合,对训练集中不包含的换脸方法生成的图像检测准确率降低,因此难以应对迅速更新迭代的换脸生成技术。
另一类方法通过研究和提取换脸伪造过程造成的通用伪造痕迹来提升检测方法在不同换脸技术上的泛化性,例如检测脸部混合边界痕迹等,但这类痕迹容易被图像压缩、模糊等操作破坏,因此这类方法难以用于经过网络传播而质量降低的换脸图像检测。
此外,现有的伪造换脸图像检测研究很少针对换脸生成者已知检测方法并试图绕过的灰盒攻击场景对检测方法进行防御,因此存在被换脸生成者绕过的风险。
发明内容
鉴于上述,本发明的目的是提供一种基于身份识别概率分布的伪造换脸图像检测方法和装置,在防御攻击的同时,提升伪造换脸图像的检测准确性。
为实现上述发明目的,实施例提供的一种基于身份识别概率分布的伪造换脸图像检测方法,包括以下步骤:
步骤1,构建真实图像和对应的身份标签,对身份标签进行平滑操作以构建平滑的身份标签;
步骤2,采用真实图像对身份识别模型进行多轮基于身份标签的监督学习以优化参数;
步骤3,将当前参数优化的身份识别模型拷贝作为拷贝模型,基于真实图像在拷贝模型的预测结果中贡献最大的像素区域进行遮挡以构建遮挡图像;
步骤4,采用遮挡图像对当前参数优化的身份识别模型进行多轮基于平滑的身份标签的监督学习以优化参数;
步骤5,重复步骤3和步骤4,直到训练结束,提取最终参数优化的身份识别模型用于伪造换脸图像检测,包括:将身份识别模型输出的最大预测概率值与阈值进行比较,当最大预测概率值小于阈值则检测为伪造换脸图像。
优选地,所述平滑操作是指将身份标签的独热码标签和均匀分布结合,平滑的身份标签向量表示为:
Figure BDA0004109555940000021
其中,ys,c表示类别c对应的平滑的身份标签向量值,α表示标签平滑的超参数,C表示身份标签类别总数,c=target表示类别c为真实图像对应的身份标签。
优选地,所述标签平滑的超参数α取值为0.5。
优选地,所述身份识别模型用于基于输入图像预测输出身份识别概率分布,当采用真实图像对当前身份识别模型进行多轮基于身份标签的监督学习时,以预测输出的身份识别概率分布与身份标签的独热码编码的交叉熵作为损失函数li,表示为:
Figure BDA0004109555940000031
其中,zi表示第i个图像在身份识别模型中输出的身份识别概率分布向量,
Figure BDA0004109555940000032
表示zi中真实图像对应身份标签yi的概率值,zi,c表示zi中身份标签c的概率值,C表示身份标签类别总量,exp()表示e指数函数,log()表示对数函数。
优选地,所述基于真实图像在拷贝模型的预测结果中贡献最大的像素区域进行遮挡以构建遮挡图像,包括:
计算真实图像在拷贝模型中的身份识别概率分布,并从身份识别概率分布中提取身份标签对应的概率值进行反向传播以计算梯度后,选取梯度值最大的N个目标像素点,并提取以每个目标像素点为中心的矩形区域,将N个矩形区域的像素值置为零以实现遮挡,得到遮挡图像。
优选地,当采用遮挡图像对当前参数优化的身份识别模型进行多轮基于平滑的身份标签的监督学***滑的身份标签向量的交叉熵作为损失函数li’,表示为:
Figure BDA0004109555940000041
其中,zi表示第i个图像在身份识别模型中输出的身份识别概率分布向量,zi,c表示zi中身份标签c的概率值,zi,j表示zi中身份标签j的概率值,C表示身份标签类别总量,exp()表示e指数函数,log ()表示对数函数,ys,c表示类别c对应的平滑的身份标签向量值。
优选地,所述身份识别模型包括用于图像特征提取的特征提取单元和用于预测身份识别概率分布的识别单元;
其中,特征提取单元采用ArcFace模型,识别单元采用全连接网络。
为实现上述发明目的,实施例提供一种基于身份识别概率分布的伪造换脸图像检测装置,包括标签处理模块、预优化模块、遮挡图像构建模块、再优化模块、检测模块;
所述标签处理模块用于构建真实图像和对应的身份标签,对身份标签进行平滑操作以构建平滑的身份标签;
所述预优化模块用于采用真实图像对身份识别模型进行多轮基于身份标签的监督学习以优化参数;
所述遮挡图像构建模块用于将当前参数优化的身份识别模型拷贝作为拷贝模型,基于真实图像在拷贝模型的分类结果中贡献最大的像素区域进行遮挡以构建遮挡图像;
所述再优化模块用于采用遮挡图像对当前参数优化的身份识别模型进行多轮基于平滑的身份标签的监督学习以优化参数;
所述检测模块用于提取最终参数优化的身份识别模型用于伪造换脸图像检测,包括:将身份识别模型输出的最大预测概率值与阈值进行比较,当最大预测概率值小于阈值则检测为伪造换脸图像。
为实现上述发明目的,实施例还提供了一种基于身份识别概率分布的伪造换脸图像检测装置,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上执行的计算机程序,所述处理器执行所述计算机程序时实现上述基于身份识别概率分布的伪造换脸图像检测方法。
与现有技术相比,本发明具有的有益效果至少包括:
利用了换脸伪造图像的身份特征融合了参与换脸的两个不同身份这一共性本质特征,只需要使用真实图像训练身份识别模型,不需要现有伪造换脸图像训练真伪分类模型,因此对不同换脸方法的泛化性好;同时身份特征不容易被压缩等图像操作破坏,因此本发明对不同质量图像的泛化性好;同时设计训练策略扩大了身份识别模型注意的区域,因此增强了对灰盒攻击的鲁棒性。
本发明特别针对已知需要检测伪造图像的保护人物集合的场景,利用保护人物的真实人脸训练身份识别模型,根据换脸伪造图像与真实图像的身份识别概率分布的差异进行真伪检测;本发明针对伪造图像生成者已知本发明的检测方法、但无法获得具体模型参数的灰盒攻击场景,利用了灰盒攻击依赖相似模型注意区域的性质,通过遮挡图像中对模型分类贡献最大的区域再进行训练的策略,扩大了身份识别模型注意的区域,从而降低灰盒攻击的成功率;同时,在遮挡的图像的损失计算中使用平滑标签防止过拟合。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图做简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动前提下,还可以根据这些附图获得其他附图。
图1是实施例提供的基于身份识别概率分布的伪造换脸图像检测方法的流程图;
图2是实施例提供的身份识别模型的训练过程图;
图3是实施例提供的利用身份识别模型进行伪造换脸图像的检测流程图;
图4是实施例提供的基于身份识别概率分布的伪造换脸图像检测装置的结构示意图。
具体实施方式
为使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例对本发明进行进一步的详细说明。应当理解,此处所描述的具体实施方式仅仅用以解释本发明,并不限定本发明的保护范围。
实施例提供了一种基于身份识别概率分布的伪造换脸图像检测方法,核心创新点是利用了伪造换脸图像的身份特征融合了参与换脸的两个不同身份这一共性特征进行检测,从而达到超过现有方法的换脸检测泛化性,并针对灰盒攻击场景防御设计了基于注意力的图像遮挡和标签平滑结合的身份识别模型训练策略,在换脸生成者已知检测方法并试图绕过的灰盒场景下达到了较好的防御效果。
通过身份识别模型输出的概率分布表征伪造换脸图像的身份融合共性特征,从而对伪造换脸图像和真实人脸图像进行区分,即身份识别模型对伪造换脸图像的身份不确定度高于真实人脸图像,因而概率分布的最大概率值低于真实人脸图像。其中,身份识别模型的训练中设计了基于注意力的图像遮挡和标签平滑两种训练策略以检测经过灰盒攻击的伪造换脸图像。
如图1所示,实施例提供的基于身份识别概率分布的伪造换脸图像检测方法,包括以下步骤:
步骤1,构建真实图像和对应的身份标签,对身份标签进行平滑操作以构建平滑的身份标签。
实施例中,获取需要检测伪造图像的真实图像以及对应的身份标签,具体以伪造换脸图像数据集CelebDF为例,其包含59个不同身份的真实视频和取其中任意两个身份进行换脸得到的伪造视频。对每一个身份,在其所有真实视频取得的帧中随机选取10帧,共获得590张真实人脸图像作为身份识别模型的样本数据。
标签平滑操作是指将独热码标签和均匀分布结合,作用是使身份识别模型尽量均匀地注意整个人脸区域,避免身份识别模型对遮挡后剩余人脸部分过拟合,平滑后的身份标签向量表示为:
Figure BDA0004109555940000071
其中,ys,c表示类别c对应的平滑的身份标签向量值,α表示标签平滑的超参数,优选取值为0.5,C表示身份标签类别总数,本例中为59,c=y表示类别c为真实图像对应的身份标签y。
步骤2,采用真实图像对身份识别模型进行多轮基于身份标签的监督学习以优化参数。
实施例中,身份识别模型f是用于图像特征提取的特征提取单元和用于预测身份识别概率分布的识别单元构成,该身份识别模型f在被应用之前需要进行参数优化。
其中,特征提取单元将输入人脸图像编码为身份特征向量,经过在大量真实人脸数据集上预训练,其提取的身份特征向量具有相同身份人脸的特征距离近、不同身份人脸的特征距离远的性质;识别单元是输入维度与特征提取单元的输出特征维度相同,输出维度与确定的需要检测伪造图像的保护人物集合中的人物数量相同。
具体地,特征提取单元以开源模型ArcFace为例,其网络结构为IR_SE50,使用ArcFace损失函数在大规模人脸识别数据集上预训练,预训练参数公开可获得。输入为112×112的对齐人脸图像,输出为512维的身份特征向量;识别单元采用FC层接在ArcFace最后一层的输出端,输入为512维的身份特征向量,输出维度为身份标签类别数量的身份识别概率分布,在本例输出维度为59。
利用真实图像对身份识别模型进行训练之前,对真实图像进行数据处理,包括:使用MTCNN识别人脸区域,并根据人脸特征点的坐标对图像进行仿射变换对齐人脸,以一定的缩放比例裁剪人脸区域并缩放尺寸为ArcFace的输入尺寸(112×112);加载ArcFace的预训练参数,随机初始化FC层的参数。
对身份识别模型进行多轮(例如10轮)预训练时,固定ArcFace参数,只更新FC层参数,使用真实图像的身份标签的独热码编码与预测输出的身份识别概率分布计算交叉熵损失li
Figure BDA0004109555940000081
其中,zi表示第i个训练样本经过FC层输出59维身份识别概率分布向量,
Figure BDA0004109555940000082
表示zi中真实图像对应身份标签yi的概率值,zi,c表示zi中身份标签c的概率值,C表示身份标签类别总量,即为59,exp()表示e指数函数,log()表示对数函数。
步骤3,将当前参数优化的身份识别模型拷贝作为拷贝模型,基于真实图像在拷贝模型的预测结果中贡献最大的像素区域进行遮挡以构建遮挡图像。
实施例中,如图2所示,在对身份识别模型经过多轮参数优化后,将当前参数优化的身份识别模型拷贝作为拷贝模型f’,该拷贝模型f’用于根据梯度计算遮挡区域。具体地,将真实图像输入至拷贝模型f’,基于真实图像在拷贝模型的预测结果中贡献最大的像素区域进行遮挡以构建遮挡图像,包括:
计算真实图像在拷贝模型的FC层的输出身份识别概率分布,并从身份识别概率分布中提取身份标签yi对应的概率值
Figure BDA0004109555940000091
进行反向传播以计算梯度后,选取梯度值最大的N个目标像素点,并提取以每个目标像素点为中心的矩形区域,将N个矩形区域的像素值置为零以实现遮挡,得到遮挡图像。其中,N优选为5,在提取矩形区域时,可以在25~35之间随机取两个整数作为长宽得到一个矩形区域。
步骤4,采用遮挡图像对当前参数优化的身份识别模型进行多轮基于平滑的身份标签的监督学习以优化参数。
实施例中,利用遮挡图像对当前参数优化的身份识别模型进行多轮(例如5轮)基于平滑的身份标签的监督学***滑的身份标签向量的交叉熵损失li’,并反向传播更新身份识别模型参数,即优化FC层的参数和ArcFace模型的高层参数,本实施例中,固定了ArcFace第20个卷积模块及以下层的参数,更新第20个卷积模块以上的参数,根据实际情况可以改变。其中,交叉熵损失li’表示为:
Figure BDA0004109555940000101
其中,zi,j表示zi中身份标签j的概率值。
步骤5,重复步骤3和步骤4,直到训练结束,提取最终参数优化的身份识别模型用于伪造换脸图像检测,包括:将身份识别模型输出的最大预测概率值与阈值进行比较,当最大预测概率值小于阈值则检测为伪造换脸图像。
经过步骤4,利用遮挡图像对身份识别模型进行多轮训练后,用新身份识别模型的参数更新拷贝模型,即提取经过步骤4参数优化的身份识别模型作为拷贝模型,继续步骤3和4,重复多次,直到迭代结束,迭代结束条件可以为身份识别模型的损失函数li’收敛。
在训练结束后,提取最终参数优化的身份识别模型用于伪造换脸图像检测,基于换脸图像融合了用于换脸的两个不同身份这一性质,身份识别模型对换脸图像身份的不确定度高于真实人脸图像,导致换脸图像的最大概率值低于真实人脸图像,因而根据身份识别概率分布中的最大概率值大小识别伪造换脸图像,如图3所示,包括:
首先,将待测图像输入训练好的身份识别模型,获取FC层输出的logits向量,通过Softmax计算身份识别概率分布,公式表示为:
Figure BDA0004109555940000102
其中,x表示待测图像,p(x)c表示输入图像的身份标签为c的概率,exp()表示e指数函数,f(x)表示身份识别模型输出的logits向量,f(x)c和f(x)j分别表示logits向量中下标c和下标j处的取值。
然后,从身份识别模型输出的身份识别概率分布中识别最大概率值pmax,用公式表示为:
Figure BDA0004109555940000111
最后,将最大预测概率值与阈值进行比较,当最大预测概率值小于阈值则检测为伪造换脸图像,否则为真实图像。其中,阈值是通过测试得到的,具体为:收集真实和伪造的测试样本,输入训练完成的身份识别模型,获得身份识别概率分布中的最大概率值,根据最大概率值以及测试样本的真实标签,确定真伪分类的最佳阈值。
为了测试本发明的实施效果,参照上述具体实施示例的步骤在部分换脸伪造数据集上进行了测试,用AUC(Area Under Curve)作为评估指标,AUC越接近1.0,检测效果越好。表1示出了在FaceForensics++、Celeb-DF、DeeperForensics-1.0三种数据集上的测试结果,其中FaceForensics++仅包含其中的三种换脸伪造部分:DeepFakes、FaceSwap、FaceShifter,不包含表情活化伪造部分,且FaceForensics++进行了不同程度的压缩。
表1真伪检测测试结果
Figure BDA0004109555940000112
从表1的测试结果可见,本发明的检测结果均为95%以上,在FaceForensics++换脸伪造数据集的不同压缩率下达到了98.9%和97.9%,检测性能高。
为了测试本发明的实施效果,在CelebDF换脸伪造数据集上进行了灰盒攻击防御效果测试,用攻击成功率ASR(Attack Success Rate)作为评估指标,ASR越接近0,防御效果越好。
具体地,灰盒攻击是指攻击者已知检测方法,但无法获取检测用身份识别模型的具体参数和/或训练数据集,于是利用其他可获得模型和/或数据修改换脸伪造图像,以期被检测方法识别为真实图像。作为示例,本实例模拟的灰盒攻击实施方法为,换脸伪造图像生成完成后,攻击者获取公开的预训练人脸身份特征提取模型,例如ArcFace,将换脸伪造图像和换脸伪造的目标人物的真实图像分别输入ArcFace,可以得到两个512维的身份特征向量,使用投影梯度下降法在换脸伪造图像上添加对抗噪声,使得添加噪声后的换脸伪造图像经过ArcFace得到的身份特征向量与目标真实图像的身份特征向量之间的余弦距离减小。表2示出了对CelebDF数据集的伪造图像实施上述攻击后的ASR,作为对比,示出了不采取本发明步骤3至步骤4所述训练策略,直接使用步骤2得到的ArcFace固定、仅训练FC层的身份识别模型的ASR。
表2抗灰盒攻击测试结果
方法 ASR(%) AUC
不采取步骤(3-3)至(3-5)所述训练策略 97.11% 0.9933
本发明完整步骤 39.07% 0.9617
从表2的测试结果可见,本发明步骤3至4所述训练策略将ASR从97%下降到了39%,同时保持了较高的AUC,防御效果好。
基于同样的发明构思,实施例还提供的基于身份识别概率分布的伪造换脸图像检测装置,如图4所示,包括标签处理模块、预优化模块、遮挡图像构建模块、再优化模块、检测模块;
其中,标签处理模块用于构建真实图像和对应的身份标签,对身份标签进行平滑操作以构建平滑的身份标签;预优化模块用于采用真实图像对身份识别模型进行多轮基于身份标签的监督学***滑的身份标签的监督学习以优化参数;检测模块用于提取最终参数优化的身份识别模型用于伪造换脸图像检测,包括:将身份识别模型输出的最大预测概率值与阈值进行比较,当最大预测概率值小于阈值则检测为伪造换脸图像。
需要说明的是,上述实施例提供的伪造换脸图像检测装置在进行伪造换脸图像检测时,应以上述各功能模块的划分进行举例说明,可以根据需要将上述功能分配由不同的功能模块完成,即在终端或服务器的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。另外,上述实施例提供的伪造换脸图像检测装置与伪造换脸图像检测方法实施例属于同一构思,其具体实现过程详见伪造换脸图像检测方法实施例,这里不再赘述。
上述实施例提供的伪造换脸图像检测装置,在伪造换脸图像检测中应用了身份特征,利用换脸图像都会融合用于换脸的两个不同身份这一共性特征,通过身份识别模型输出的概率分布区分伪造换脸图像和真实人脸图像,并在身份识别模型的训练策略上进行了抗灰盒攻击设计。本发明获取需要检测伪造图像的人物集合的真实图像以及对应的身份标签,作为训练集;获取预训练的人脸身份特征提取模型,在最后添加全连接层,作为身份识别模型;采用基于注意力的图像遮挡和标签平滑结合的策略训练身份识别模型;将待检测真伪的图像输入身份识别模型,得到身份识别概率分布;根据身份识别概率分布中的最大概率值大小识别伪造换脸图像,由于换脸图像融合了用于换脸的两个不同身份,身份识别模型对换脸图像身份的不确定度高于真实人脸图像,因而换脸图像的最大概率值低于真实人脸图像。本发明训练步骤中只使用真实图像,不依赖现有伪造换脸图像进行训练,因此对不同换脸方法的泛化性好;同时身份特征不容易被压缩等图像操作破坏,因此对不同质量图像的泛化性好;同时设计训练策略扩大了身份识别模型注意的区域,因此增强了对灰盒攻击的鲁棒性。
基于同样的发明构思,实施例还提供了一种基于身份识别概率分布的伪造换脸图像检测装置,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上执行的计算机程序所述处理器执行所述计算机程序时实现上述伪造换脸图像检测方法,包括以下步骤:
步骤1,构建真实图像和对应的身份标签,对身份标签进行平滑操作以构建平滑的身份标签;
步骤2,采用真实图像对身份识别模型进行多轮基于身份标签的监督学习以优化参数;
步骤3,将当前参数优化的身份识别模型拷贝作为拷贝模型,基于真实图像在拷贝模型的预测结果中贡献最大的像素区域进行遮挡以构建遮挡图像;
步骤4,采用遮挡图像对当前参数优化的身份识别模型进行多轮基于平滑的身份标签的监督学习以优化参数;
步骤5,重复步骤3和步骤4,直到训练结束,提取最终参数优化的身份识别模型用于伪造换脸图像检测,包括:将身份识别模型输出的最大预测概率值与阈值进行比较,当最大预测概率值小于阈值则检测为伪造换脸图像。
实际应用中,存储器可以为在近端的易失性存储器,如RAM,还可以是非易失性存储器,如ROM,FLASH,软盘,机械硬盘等,还可以是远端的存储云。处理器可以为中央处理器(CPU)、微处理器(MPU)、数字信号处理器(DSP)、或现场可编程门阵列(FPGA),即可以通过这些处理器实现基于身份识别概率分布的伪造换脸图像检测方法的步骤。
以上所述的具体实施方式对本发明的技术方案和有益效果进行了详细说明,应理解的是以上所述仅为本发明的最优选实施例,并不用于限制本发明,凡在本发明的原则范围内所做的任何修改、补充和等同替换等,均应包含在本发明的保护范围之内。

Claims (9)

1.一种基于身份识别概率分布的伪造换脸图像检测方法,其特征在于,包括以下步骤:
步骤1,构建真实图像和对应的身份标签,对身份标签进行平滑操作以构建平滑的身份标签;
步骤2,采用真实图像对身份识别模型进行多轮基于身份标签的监督学习以优化参数;
步骤3,将当前参数优化的身份识别模型拷贝作为拷贝模型,基于真实图像在拷贝模型的预测结果中贡献最大的像素区域进行遮挡以构建遮挡图像;
步骤4,采用遮挡图像对当前参数优化的身份识别模型进行多轮基于平滑的身份标签的监督学习以优化参数;
步骤5,重复步骤3和步骤4,直到训练结束,提取最终参数优化的身份识别模型用于伪造换脸图像检测,包括:将身份识别模型输出的最大预测概率值与阈值进行比较,当最大预测概率值小于阈值则检测为伪造换脸图像。
2.根据权利要求1所述的基于身份识别概率分布的伪造换脸图像检测方法,其特征在于,所述平滑操作是指将身份标签的独热码标签和均匀分布结合,平滑的身份标签向量表示为:
Figure FDA0004109555930000011
其中,ys,c表示类别c对应的平滑的身份标签向量值,α表示标签平滑的超参数,C表示身份标签类别总数,c=target表示类别c为真实图像对应的身份标签。
3.根据权利要求2所述的基于身份识别概率分布的伪造换脸图像检测方法,其特征在于,所述标签平滑的超参数α取值为0.5。
4.根据权利要求1所述的基于身份识别概率分布的伪造换脸图像检测方法,其特征在于,所述身份识别模型用于基于输入图像预测输出身份识别概率分布,当采用真实图像对当前身份识别模型进行多轮基于身份标签的监督学习时,以预测输出的身份识别概率分布与身份标签的独热码编码的交叉熵作为损失函数li,表示为:
Figure FDA0004109555930000021
其中,zi表示第i个图像在身份识别模型中输出的身份识别概率分布向量,zi,yi表示zi中真实图像对应身份标签yi的概率值,zi,c表示zi中身份标签c的概率值,C表示身份标签类别总量,exp ()表示e指数函数,log()表示对数函数。
5.根据权利要求1所述的基于身份识别概率分布的伪造换脸图像检测方法,其特征在于,所述基于真实图像在拷贝模型的预测结果中贡献最大的像素区域进行遮挡以构建遮挡图像,包括:
计算真实图像在拷贝模型中的身份识别概率分布,并从身份识别概率分布中提取身份标签对应的概率值进行反向传播以计算梯度后,选取梯度值最大的N个目标像素点,并提取以每个目标像素点为中心的矩形区域,将N个矩形区域的像素值置为零以实现遮挡,得到遮挡图像。
6.根据权利要求1所述的基于身份识别概率分布的伪造换脸图像检测方法,其特征在于,当采用遮挡图像对当前参数优化的身份识别模型进行多轮基于平滑的身份标签的监督学***滑的身份标签向量的交叉熵作为损失函数li’,表示为:
Figure FDA0004109555930000031
其中,zi表示第i个图像在身份识别模型中输出的身份识别概率分布向量,zi,c表示zi中身份标签c的概率值,zi,j表示zi中身份标签j的概率值,C表示身份标签类别总量,exp ()表示e指数函数,log ()表示对数函数,ys,c表示类别c对应的平滑的身份标签向量值。
7.根据权利要求1所述的基于身份识别概率分布的伪造换脸图像检测方法,其特征在于,所述身份识别模型包括用于图像特征提取的特征提取单元和用于预测身份识别概率分布的识别单元。
8.一种基于身份识别概率分布的伪造换脸图像检测装置,其特征在于,包括标签处理模块、预优化模块、遮挡图像构建模块、再优化模块、检测模块;
所述标签处理模块用于构建真实图像和对应的身份标签,对身份标签进行平滑操作以构建平滑的身份标签;
所述预优化模块用于采用真实图像对身份识别模型进行多轮基于身份标签的监督学习以优化参数;
所述遮挡图像构建模块用于将当前参数优化的身份识别模型拷贝作为拷贝模型,基于真实图像在拷贝模型的分类结果中贡献最大的像素区域进行遮挡以构建遮挡图像;
所述再优化模块用于采用遮挡图像对当前参数优化的身份识别模型进行多轮基于平滑的身份标签的监督学习以优化参数;
所述检测模块用于提取最终参数优化的身份识别模型用于伪造换脸图像检测,包括:将身份识别模型输出的最大预测概率值与阈值进行比较,当最大预测概率值小于阈值则检测为伪造换脸图像。
9.一种基于身份识别概率分布的伪造换脸图像检测装置,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上执行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1-7任一项所述的基于身份识别概率分布的伪造换脸图像检测方法。
CN202310202602.4A 2023-03-06 2023-03-06 一种基于身份识别概率分布的伪造换脸图像检测方法和装置 Pending CN116188439A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310202602.4A CN116188439A (zh) 2023-03-06 2023-03-06 一种基于身份识别概率分布的伪造换脸图像检测方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310202602.4A CN116188439A (zh) 2023-03-06 2023-03-06 一种基于身份识别概率分布的伪造换脸图像检测方法和装置

Publications (1)

Publication Number Publication Date
CN116188439A true CN116188439A (zh) 2023-05-30

Family

ID=86444222

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310202602.4A Pending CN116188439A (zh) 2023-03-06 2023-03-06 一种基于身份识别概率分布的伪造换脸图像检测方法和装置

Country Status (1)

Country Link
CN (1) CN116188439A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117611923A (zh) * 2024-01-08 2024-02-27 北京锐融天下科技股份有限公司 一种身份证件真伪识别方法及***

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117611923A (zh) * 2024-01-08 2024-02-27 北京锐融天下科技股份有限公司 一种身份证件真伪识别方法及***

Similar Documents

Publication Publication Date Title
US20230022943A1 (en) Method and system for defending against adversarial sample in image classification, and data processing terminal
Zhu et al. AR-Net: Adaptive attention and residual refinement network for copy-move forgery detection
CN110941794B (zh) 一种基于通用逆扰动防御矩阵的对抗攻击防御方法
CN111753881B (zh) 一种基于概念敏感性量化识别对抗攻击的防御方法
Wang et al. Amora: Black-box adversarial morphing attack
CN109902018B (zh) 一种智能驾驶***测试案例的获取方法
CN111160313B (zh) 一种基于lbp-vae异常检测模型的人脸表示攻击检测方法
CN113269228B (zh) 一种图网络分类模型的训练方法、装置、***及电子设备
US20230076017A1 (en) Method for training neural network by using de-identified image and server providing same
CN113283590A (zh) 一种面向后门攻击的防御方法
CN111222583B (zh) 一种基于对抗训练与关键路径提取的图像隐写分析方法
CN117113163A (zh) 基于双向时域卷积网络和特征融合的恶意代码分类方法
CN114724218A (zh) 视频检测方法、装置、设备及介质
CN116188439A (zh) 一种基于身份识别概率分布的伪造换脸图像检测方法和装置
CN116343301A (zh) 基于人脸识别的人员信息智能校验***
CN114758113A (zh) 对抗样本防御训练方法、分类预测方法及装置、电子设备
CN116978096A (zh) 一种基于生成对抗网络的人脸对抗攻击方法
CN116824695A (zh) 一种基于特征去噪的行人再识别非局部防御方法
CN116260565A (zh) 芯片电磁侧信道分析方法、***及存储介质
Hirofumi et al. Did You Use My GAN to Generate Fake? Post-hoc Attribution of GAN Generated Images via Latent Recovery
CN115659387A (zh) 一种基于神经通路的用户隐私保护方法、电子设备、介质
CN113723215A (zh) 活体检测网络的训练方法、活体检测方法及装置
Girish et al. Inter-frame video forgery detection using UFS-MSRC algorithm and LSTM network
Dhar et al. Detecting deepfake images using deep convolutional neural network
CN115935378B (zh) 一种基于条件生成式网络的图像融合模型安全性检测方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination