CN115170378A

CN115170378A - 一种基于深度学习的视频数字水印嵌入与提取方法及***

Info

Publication number: CN115170378A
Application number: CN202210661160.5A
Authority: CN
Inventors: 王晗; 张志伟; 胡海; 崔凯元
Original assignee: Beijing Forestry University
Current assignee: Beijing Forestry University
Priority date: 2022-06-13
Filing date: 2022-06-13
Publication date: 2022-10-11

Abstract

本发明涉及一种基于深度学习的视频数字水印嵌入与提取方法及***，其方法包括：S1：使用公开视频构建图像的训练集；S2：将训练集输入视频数字水印嵌入与提取网络进行训练，得到训练好的模型；视频数字水印嵌入与提取网络包括：水印嵌入网络、图像变换模块以及水印提取网络；S3：提取待嵌入水印视频的关键帧，并与水印一起输入到训练好的视频数字水印嵌入网络，输出嵌入水印的关键帧，再放回待嵌入水印视频；S4：抽取含数字水印视频的待检测帧，进行校正后，输入到训练好的视频数字水印提取网络，提取水印。本发明提供了可追溯源头的视频数字水印嵌入和提取方法，鲁棒性强，为新媒体环境下数字视频泄露溯源以及视频知识产权保护做出贡献。

Description

一种基于深度学习的视频数字水印嵌入与提取方法及***

技术领域

本发明涉及数字水印领域，具体涉及一种基于深度学习的视频数字水印嵌入与提取方法及***。

背景技术

随着计算机和网络技术的发展，多媒体产品正日益数字化，数字化音像产品正日益走进人们的生活。虽然数字化使多媒体信息更容易编辑、制作、保存、传输，提高了音像制品的质量，但也带来了新的版权问题。如，在未得到作品所有者同意情况下，对具有高度价值的作品，无限制地复制将会给制作者和内容提供者造成相当大的经济损失。而且由于数字化的优点使其对视频信息的篡改变得异常容易，更使原作品的完整性受到严重威胁。而一些具有特殊意义的信息，如涉及司法诉讼、政府机要等等信息，则会遭到恶意攻击和篡改伪造。这一系列数字化技术本身特性所带来的负面效应，已成为信息产业健康持续发展的一大障碍。

因此，对于数字产品的版权保护便显得日益重要。人们常常认为版权保护的实现可以通过加密来完成。即首先将多媒体数据文件加密成密文后发布，使得网络传递过程中出现的非法攻击者无法从密文获得机密信息，从而达到版权保护和信息安全的目的，但这并不能完全解决问题。一方面加密后的文件因其不可理解性妨碍多媒体信息的传播；另一方面多媒体信息经过加密后容易引起攻击者的好奇和注意，并有被破解的可能性而且一旦加密文件经过破解后其内容就完全透明了。密码学一直被认为是在通信研究应用领域中主要的信息安全手段并受到极大重视，直到最近几年这种情况才有了改变。现有版权保护***多采用密码认证技术(例如DVD光盘的安全密码)，但仅采用密码并不能完全解决版权保护问题，密码仅能在数据从发送者到接受者的传输过程中进行数据加密保护。但当信息被接收并进行解密后，所有加密的文档就与普通文档一样，将不再受到保护，无法幸免于盗版。因此，如何进行数字产品版权保护和数据安全维护成为一个亟待解决的问题。

发明内容

为了解决上述技术问题，本发明提供一种基于深度学习的视频数字水印嵌入与提取方法及***。

本发明技术解决方案为：一种基于深度学习的视频数字水印嵌入与提取方法，包括：

步骤S1：使用公开视频中抽取预设数量的视频帧并进行裁剪，得到输入图像；生成随机二进制串作为水印信息数据，将所述输入图像和所述水印信息数据一起构建训练集；

步骤S2：将所述训练集中输入图像与水印信息数据一起输入视频数字水印嵌入与提取网络进行训练，得到训练好的视频数字水印嵌入与提取网络；其中，所述视频数字水印嵌入与提取网络包括：视频数字水印嵌入网络用于将水印W嵌入输入图像Img，得到含水印的图像Img_encoded；图像变换模块用于将Img_encoded进行攻击变换，得到Img'_encoded；以及视频数字水印提取网络用于提取Img'_encoded中水印W'，基于Img_encoded与Img以及W'与W分别构建损失函数，更新网络参数，直至得到训练好的视频数字水印嵌入与提取网络；

步骤S3：抽取待嵌入水印视频的关键帧，与包含用户信息的水印一起输入训练好的视频数字水印嵌入网络，输出嵌入水印的关键帧，将所述嵌入水印的关键帧放回至所述待嵌入水印视频中；

步骤S4：抽取含水印视频的待检测帧，输入训练好的视频数字水印提取网络，提取水印，获取其中的用户信息。

本发明与现有技术相比，具有以下优点：

本发明公开了一种基于深度学习的视频数字水印嵌入与提取方法，通过基于DWT(Discrete Wavelet Transform)域以及深度学习的视频数字水印算法以及基于SIFT特征的图像配准方法实现，本发明提供的方法对抵抗裁剪、翻拍、打印、JPEG图像压缩和模糊等攻击具有强鲁棒性，提供了可追溯源头的数字水印嵌入和提取方法，为新媒体环境下数字视频泄露溯源以及视频知识产权保护做出贡献。

附图说明

图1为本发明实施例中一种基于深度学习的视频数字水印嵌入与提取方法的流程图；

图2为本发明实施例中视频数字水印嵌入网络结构示意图；

图3为本发明实施例中视频数字水印提取网络结构示意图；

图4为本发明实施例中一种基于深度学习的视频数字水印嵌入与提取***的结构框图。

具体实施方式

本发明提供了一种基于深度学习的视频数字水印嵌入与提取方法，为视频嵌入与提取可追溯源头的水印，为新媒体环境下数字视频泄露溯源以及视频知识产权保护做出贡献。

为了使本发明的目的、技术方案及优点更加清楚，以下通过具体实施，并结合附图，对本发明进一步详细说明。

为了更好地理解本发明实施例，对本发明实施例中所用的离散小波变换(DWT)进行阐述：

离散小波变换(Discrete Wavelet Transform,DWT)可以同时在频域以及时域表示图像的信息，是一种便捷的图像处理方式。小波变换是对傅里叶变换和短时傅里叶变换的一个突破，其改变在于使用有限长的会衰减的小波替代了无限长的三角函数基，在数值分析和泛函分析中，离散小波变换是对小波进行离散采样的任意小波变换。与其他小波变换一样，离散小波变换与傅里叶变换相比的一个关键优势是时间分辨能力，即离散小波变换基于时间捕获频率和位置信息。在计算机视觉***中，为了便于存储和计算，需要对输入变量进行离散化，这就要求对小波进行离散化，也就是DWT。DWT是将小波变换中的比例因子和移动因子离散化而得到的。

其中，DWT的变换公式如下：

其中

为近似系数，W_ψ为小波细节系数；

为尺度函数，ψ(t)为小波函数，求和范围n为0,1,2,...,M-1，基本的尺度函数与小波函数的表示如下：

ψ_j,k(t)＝2^j/2ψ(2^jt-k),j,k≥0

其中j表示频域上小波函数的伸缩及尺度，k表示时域中函数的平移。

二维图像经过DWT变换，被分解为四个不同的分量，分别为水平LH(低频、高频)、垂直HL(高频、低频)、对角HH(高频、高频)和低频LL(低频、低频)，其中低频分量集中在左侧，可以继续递归的对四个分量进行DWT变换。其中低频分量包含的图像信息更为重要，若扰动过大会很强的影响图像的质量；高频分量则为图像的一些细节，若进行图像压缩时舍去也不会很影响图像的质量。

逆变换IDWT的公式如下：

其中在计算时，一般将j₀置0，M为2的幂，求和范围k为0,1,2,...,2^j-1。

通过对DWT变换过的图像进行分析发现，若图像收到攻击，一般低频区域是不会受到太大影响的，几乎能保留完整的信息，所以基于DWT的水印通常将内容写在低频区域，以应对可能出现的攻击。但随之而来的问题是图像的质量可能会受到比较大的影响。

实施例一

如图1所示，本发明实施例提供的一种基于深度学习的视频数字水印嵌入与提取方法，包括下述步骤：

步骤S1：使用公开视频中抽取预设数量的视频帧并进行裁剪，得到输入图像；生成随机二进制串作为水印信息数据，将输入图像和水印信息数据一起构建训练集；

步骤S2：将训练集中输入图像与水印信息数据一起输入视频数字水印嵌入与提取网络进行训练，得到训练好的视频数字水印嵌入与提取网络；其中，视频数字水印嵌入与提取网络包括：视频数字水印嵌入网络用于将水印W嵌入输入图像Img，得到含水印的图像Img_encoded；图像变换模块用于将Img_encoded进行攻击变换，得到Img'_encoded；以及视频数字水印提取网络用于提取Img'_encoded中水印W'，基于Img_encoded与Img以及W'与W分别构建损失函数，更新网络参数，直至得到训练好的视频数字水印嵌入与提取网络；

步骤S3：抽取待嵌入水印视频的关键帧，与包含用户信息的水印一起输入训练好的视频数字水印嵌入网络，输出嵌入水印的关键帧，将嵌入水印的关键帧嵌入至待嵌入水印视频；

在一个实施例中，上述步骤S1：使用公开视频中抽取预设数量的视频帧并进行裁剪，得到关键帧构建输入图像的训练集，具体包括：

从公开视频中抽取一定数量的视频帧作为关键帧，将这些关键帧按照预定的尺寸进行裁剪，并进行归一化，得到预处理后的关键帧，得到输入图像；同时，生成包含用户信息的随机二进制串作为水印信息数据，将输入图像和水印信息数据一起构建训练集。

在一个实施例中，上述步骤S2中视频数字水印嵌入网络将水印W嵌入输入图像Img，得到含水印的图像Img_encoded，具体包括：

步骤S201：获取水印信息数据并转换为水印数组W∈{0,1}^N，N为W长度；若水印数组长度不足时，在其后补0直到预定长度N；在W的第一位设有标志位，用于标识是否为正确的水印；

步骤S202：获取训练集中图片Img，在Img中心选出预设大小的区域，将该区域从RGB色彩空间变换到YCbCr色彩空间，提取其中的Y分量矩阵H，其中H大小为h×w；将分量矩阵H分割成8×8大小的子块集B_y(i)，i∈N，N＝(h×w)/(8×8)；对B_y(i)进行DWT变换得到变换子块集B_dwt(i)；

如图2所示，W(i)表示水印数组W中的第i位二进制水印，W(i)经过扩展后变成1×4×4的数据块；B_y(i)表示YCbCr色彩空间的Y通道数据分块，大小为1×8×8；B_y(i)经过DWT变换后变成4×4×4的数据块；

步骤S203：将二维水印数组W和变换子块集B_dwt(i)输入视频数字水印嵌入网络，经过水印嵌入卷积模块运算后输出含水印的变换子块集B'_dwt(i)，其中，如图2所示，水印嵌入卷积模块中包含5个二维卷积层，二维卷积层间使用批标准化(Batch Normalization)层和ReLU激活层，5个二维卷积层的输出通道深度分别为16、16、16、16和4；

将步骤S202得到的1×4×4的数据块和4×4×4的数据块一起输入视频数字水印嵌入网络后，在第一维度上进行拼接后，生成大小为5×4×4的数据块；然后经过5个二维卷积层生成大小为4×4×4的数据块B'_dwt(i)。

步骤S204：对编码后的变换子块集B'_dwt(i)中每个子块分别进行逆DWT变换得到含有水印的Y'分量，将其合并到YCbCr色彩空间后再转换到RGB色彩空间；得到含水印的图像Img_encoded；

步骤S205：根据公式(1)计算Img_encoded与Img损失值Loss_img：

Loss_img＝LPIPS(Img,Img_encoded) (1)。

在一个实施例中，上述步骤S2中图像变换模块用于将Img_encoded进行变换增强，得到Img'_encoded，具体包括：

将Img_encoded输入图像变换模块，对Img_encoded添加随机噪声、高斯模糊、JPEG图像压缩或者改变亮度，得到变换增强后的含水印图像Img'_encoded。

为了在训练过程中提高视频数字水印提取网络的鲁棒性，对含水印图像添加攻击性，比如增加随机噪声、高斯模糊、JPEG图像压缩或者改变亮度。使用训练好的视频数字水印嵌入与提取网络时，无需使用图像变换模块。

在一个实施例中，上述步骤S2中视频数字水印提取网络用于提取Img'_encoded中水印W'，具体包括：

步骤S211：将Img'_encoded从RGB色彩空间变换到YCbCr色彩空间，提取其中的Y分量矩阵H，其中H大小为h×w；将分量矩阵H分割成8×8大小的子块集B_y(i)，i∈N，N＝(h×w)/(8×8)；对B(i)进行DWT变换得到变换子块集B_dwt(i)；

如图3所示，B_y(i)表示YCbCr色彩空间的Y通道数据分块，大小为1×8×8；B_y(i)经过DWT后变成4×4×4的数据块B_dwt(i)；

步骤S212：将变换子块集B_dwt(i)传入视频数字水印提取网络，经过水印提取卷积模块运算后输出水印数组W'，其中，如图3所示，水印提取卷积模块中包含4个二维卷积层、1个平均池化层和1个全连接层，4个二维卷积层间使用批标准化(Batch Normalization)层和ReLU激活层，4个二维卷积层的输出通道深度分别为16、16、16和1；

将步骤S211得到4×4×4的数据块B_dwt(i)输入视频数字水印提取网络，经过4个二维卷积生成大小为1×4×4的数据块B'_dwt(i)；然后经过全局平均池化(mean pooling)和全连接层(fully connected layers)生成大小为1的W'(i)；

步骤S213：根据公式(2)计算W'与W均方差损失值Loss_msg；

步骤S214：构建总损失函数如公式(3)所示，通过反向传播，更新视频数字水印嵌入网络和视频数字水印提取网络的参数：

Loss_total＝γ_imgLoss_img+γ_msgLoss_msg (3)

其中，γ_img、γ_msg分别为Loss_img和Loss_msg权重。

利用，根据总损失函数，不断更新和优化视频数字水印嵌入网络和视频数字水印提取网络的参数，直到得到训练好的视频数字水印嵌入与提取网络。

在一个实施例中，上述步骤S3：抽取待嵌入水印视频的关键帧，与水印一起输入训练好的视频数字水印嵌入网络，输出嵌入水印的关键帧，将嵌入水印的关键帧嵌入至待嵌入水印视频，具体包括：

步骤S301：对待嵌入水印视频按照抽取帧规则：每间隔预定帧，抽取一帧作为关键帧F_origin，将待嵌入的水印字符串转换为二进制串水印数组W；

步骤S302：将F_origin和W输入训练好的视频数字水印嵌入网络，得到含水印视频帧F_water；

步骤S303：按照抽取帧规则将含水印视频帧F_water放回待嵌入水印视频中。

在一个实施例中，上述步骤S4：抽取含水印视频的待检测帧，输入训练好的视频数字水印提取网络，提取水印，具体包括：

步骤S401：获取含水印视频的前200帧作为水印待检测帧F；

步骤S402：将F输入训练好的视频数字水印提取网络，当提取出来的水印序列的标志位与嵌入的水印标志位相匹配，则结束水印提取操作，转至步骤S406；若对F提取结束仍无法提取出匹配的水印，则转至步骤S403，进行视频深度提取水印；

步骤S403：将每个待检测视频帧F与所有关键帧F_origin进行比对和校正；

步骤S404：基于SIFT特征比对图像相似度，使用K近邻算法匹配，再使用单应性矩阵将待检测视频通过旋转、变换方式将其与校正帧进行对齐；其中，单应性矩阵H如公式(4)所示：

其中，[x₁ y₁1]^T和[x₂ y₂1]^T分别表示待检测视频帧和校正帧的齐次坐标，将h₂₂设为1，则单应性矩阵有8个未知参数，每一个对应的像素点可以产生2个方程，一个x方程，一个y方程，因此总共需要四个像素点来求解单应性矩阵H；通过随机抽样一致算法选取符合条件的像素点作为内群点；

步骤S405：比对每个待检测视频帧F与校正帧F_origin的内群点值，若设定内群点数量小于等于全部特征点的25％则会跳过当前校正帧；若大于25％，则将匹配到的校正帧暂存；在该待检测视频帧与所有校正帧比对完成之后，将上述待检测视频帧前后的帧按照由内到外的匹配策略依次通过与校正帧对齐后通过步骤S401、S402提取水印，若没有提取出来，则切换到下一个待检测视频帧重复以上步骤，直到提取出水印或检测完全部待检测视频帧为止；

步骤S406：提取水印所包含的用户信息。

本发明公开了一种基于深度学习的视频数字水印嵌入与提取方法，通过基于DWT(Discrete Wavelet Transform)域以及深度学习的视频数字水印算法以及基于SIFT特征的图像配准方法实现，本发明提供的方法对抵抗裁剪、翻拍、打印、JPEG图像压缩和模糊等攻击具有较强鲁棒性，提供了可追溯源头的水印嵌入和提取方法，为新媒体环境下数字视频泄露溯源以及视频知识产权保护做出贡献。

实施例二

如图4所示，本发明实施例提供了一种基于深度学习的视频数字水印嵌入与提取***，包括下述模块：

构建训练集模块1：使用公开视频中抽取预设数量的视频帧并进行裁剪，得到输入图像；生成随机二进制串作为水印信息数据，将输入图像和水印信息数据一起构建训练集；

网络训练模块2：将训练集中输入图像与水印信息数据一起输入视频数字水印嵌入与提取网络进行训练，得到训练好的视频数字水印嵌入与提取网络；其中，视频数字水印嵌入与提取网络包括：视频数字水印嵌入网络用于将水印W嵌入输入图像Img，得到含水印的图像Img_encoded；图像变换模块用于将Img_encoded进行攻击变换，得到Img'_encoded；以及视频数字水印提取网络用于提取Img'_encoded中水印W'，基于Img_encoded与Img以及W'与W分别构建损失函数，更新网络参数，直至得到训练好的视频数字水印嵌入与提取网络；

视频数字水印嵌入模块3：抽取待嵌入水印视频的关键帧，与包含用户信息的水印一起输入训练好的视频数字水印嵌入网络，输出嵌入水印的关键帧，将嵌入水印的关键帧放回至待嵌入水印视频中；

视频数字水印提取模块4：抽取含水印视频的待检测帧，输入训练好的视频数字水印提取网络，提取水印，获取其中的用户信息。

提供以上实施例仅仅是为了描述本发明的目的，而并非要限制本发明的范围。本发明的范围由所附权利要求限定。不脱离本发明的精神和原理而做出的各种等同替换和修改，均应涵盖在本发明的范围之内。

Claims

1.一种基于深度学习的视频数字水印嵌入与提取方法，其特征在于，包括：

步骤S1：使用公开视频中抽取预设数量的视频帧并进行裁剪，得到输入图像；生成包含用户信息的随机二进制串作为水印信息数据，将所述输入图像和所述水印信息数据一起构建训练集；

步骤S3：抽取待嵌入水印视频的关键帧，与包含用户信息的水印数据一起输入到训练好的视频数字水印嵌入网络，输出嵌入水印的关键帧，将所述嵌入水印的关键帧放回至所述待嵌入水印视频中；

步骤S4：抽取含水印视频的待检测帧，输入到训练好的视频数字水印提取网络，提取水印，获取其中的用户信息。

2.根据权利要求1所述的基于深度学习的视频数字水印嵌入与提取方法，其特征在于，所述步骤S2中视频数字水印嵌入网络将水印W嵌入输入图像Img，得到含水印的图像Img_encoded，具体包括：

步骤S201：获取所述水印信息数据并转换为水印数组W∈{0,1}^N，N为W的长度；若所述水印数组长度不足时，在其后补0直到预定长度N；在W的第一位设有标志位，用于标识是否为正确的水印；

步骤S202：获取所述训练集中图像Img，在Img中心选出预设大小的区域，将该区域从RGB色彩空间变换到YCbCr色彩空间，提取其中的Y分量矩阵H，其中H大小为h×w；将所述分量矩阵H分割成8×8大小的子块集B(i)，i∈N，N＝(h×w)/(8×8)；对B(i)进行DWT变换得到变换子块集B_dwt(i)；

步骤S203：将所述二维水印数组W和所述变换子块集B_dwt(i)输入所述视频数字水印嵌入网络，经过水印嵌入卷积模块运算后输出含水印的变换子块集B'_dwt(i)，其中，所述水印嵌入卷积模块包含：5个二维卷积层，所述二维卷积层之间使用批标准化层和ReLU激活层；

步骤S204：对所述编码后的变换子块集B'_dwt(i)中每个子块分别进行逆DWT变换得到含有所述水印的Y'分量，将其合并到YCbCr色彩空间后再转换到RGB色彩空间；得到含水印的图像Img_encoded；

步骤S205：根据公式(1)计算Img_encoded与Img损失值Loss_img：

Loss_img＝LPIPS(Img,Img_encoded) (1)。

3.根据权利要求2所述的基于深度学习的视频数字水印嵌入与提取方法，其特征在于，所述步骤S2中图像变换模块用于将Img_encoded进行变换攻击，得到Img'_encoded，变换攻击具体包括：

将Img_encoded输入所述图像变换模块，对Img_encoded添加随机噪声、高斯模糊、JPEG图像压缩或者改变亮度，得到变换增强后的含水印图像Img'_encoded。

4.根据权利要求3所述的基于深度学习的视频数字水印嵌入与提取方法，其特征在于，所述步骤S2中视频数字水印提取网络用于提取Img'_encoded中水印W'，具体包括：

步骤S211：将Img'_encoded从RGB色彩空间变换到YCbCr色彩空间，提取其中的Y分量矩阵H，其中H大小为h×w；将所述分量矩阵H分割成8×8大小的子块集B(i)，i∈N，N＝(h×w)/(8×8)；对B(i)进行DWT变换得到变换子块集B_dwt(i)；

步骤S212：将变换子块集B_dwt(i)传入所述视频数字水印提取网络，经过水印提取卷积模块运算后输出水印数组W'，其中，所述水印卷积模块包含：4个二维卷积层、1个平均池化层和1个全连接层，所述二维卷积层间使用批标准化层和ReLU激活层；

步骤S213：根据公式(2)计算W'与W均方差损失值Loss_msg；

步骤S214：构建总损失函数如公式(3)所示，通过反向传播，更新所述视频数字水印嵌入网络和所述视频数字水印提取网络的参数：

Loss_total＝γ_imgLoss_img+γ_msgLoss_msg (3)

其中，γ_img、γ_msg分别为Loss_img和Loss_msg权重。

5.根据权利要求4所述的基于深度学习的视频数字水印嵌入与提取方法，其特征在于，所述步骤S3：抽取待嵌入水印视频的关键帧，与水印一起输入训练好的视频数字水印嵌入网络，输出嵌入水印的关键帧，将所述嵌入水印的关键帧放回至所述待嵌入水印视频中，具体包括：

步骤S301：对待嵌入水印视频按照抽取帧图像规则：每间隔预定帧，抽取一帧作为关键帧F_origin，将待嵌入的水印字符串转换为二进制串水印数组W；

对待嵌入水印视频每间隔120帧，抽取一帧作为关键帧F_origin；并将含有用户信息的将待嵌入的水印字符串转换为二进制串水印数组W；

步骤S302：将F_origin和W输入所述训练好的视频数字水印嵌入网络，得到含水印视频帧F_water；

步骤S303：按照所述抽取帧规则将含水印视频帧F_water放回所述待嵌入水印视频中。

对待嵌入水印视频每间隔120帧，放回含水印视频帧F_water。

6.根据权利要求4所述的基于深度学习的视频数字水印嵌入与提取方法，其特征在于，所述步骤S4：抽取含水印视频的待检测帧，输入训练好的视频数字水印提取网络，提取水印，具体包括：

步骤S401：获取含水印视频的前200帧作为水印待检测帧F；

步骤S402：将F输入所述训练好的视频数字水印提取网络，当提取出来的所述水印序列的标志位与嵌入的水印标志位相匹配，则结束水印提取操作，转至步骤S406；若对F提取结束仍无法提取出匹配的水印，则转至步骤S403，进行视频深度提取水印；

步骤S403：将每个所述待检测视频帧F与所有关键帧F_origin进行对比和校正；

步骤S404：基于SIFT特征比对图像相似度，使用K近邻算法匹配，再使用单应性矩阵将所述待检测视频通过旋转、变换方式将其与所述校正帧进行对齐校正；其中，所述单应性矩阵H如公式(4)所示：

其中，[x₁ y₁ 1]^T和[x₂ y₂ 1]^T分别表示所述待检测视频帧和所述校正帧的齐次坐标，将h₂₂设为1，则所述单应性矩阵有8个未知参数，每一个对应的像素点可以产生2个方程，一个x方程，一个y方程，因此总共需要四个像素点来求解所述单应性矩阵H；通过随机抽样一致算法选取符合条件的像素点作为内群点；

步骤S405：比对每个所述待检测视频帧F与所述校正帧F_origin的内群点值，若设定内群点数量小于等于全部特征点的25％则会跳过当前所述校正帧；若大于25％，则将匹配到的所述校正帧暂存；在该待检测视频帧与所有所述校正帧比对完成之后，将上述待检测视频帧前后的帧按照由内到外的匹配策略依次通过与所述校正帧对齐后通过步骤S401、S402提取水印，若没有提取出来，则切换到下一个所述待检测视频帧重复以上步骤，直到提取出水印或检测完全部所述待检测视频帧为止；

步骤S406：提取所述水印包含的用户信息。

7.一种基于深度学习的视频数字水印嵌入与提取***，其特征在于，包括：

构建训练集模块：使用公开视频中抽取预设数量的视频帧并进行裁剪，得到输入图像；生成随机二进制串作为水印信息数据，将所述输入图像和所述水印信息数据一起构建训练集；

网络训练模块：将所述训练集中输入图像与水印信息数据一起输入视频数字水印嵌入与提取网络进行训练，得到训练好的视频数字水印嵌入与提取网络；其中，所述视频数字水印嵌入与提取网络包括：视频数字水印嵌入网络用于将水印W嵌入到输入图像Img，得到含水印的图像Img_encoded；图像变换攻击模块用于将Img_encoded进行变换攻击，得到Img'_encoded；以及视频数字水印提取网络用于提取Img'_encoded中水印W'，基于Img_encoded与Img以及W'与W分别构建损失函数，更新网络参数，直至得到训练好的视频数字水印嵌入与提取网络；

视频数字水印嵌入模块：抽取待嵌入水印视频的关键帧，与包含用户信息的水印二进制串一起输入训练好的视频数字水印嵌入网络，输出嵌入水印的关键帧，将所述嵌入水印的关键帧放回至所述待嵌入水印视频中；

视频数字水印提取模块：抽取含水印视频的待检测帧，输入到训练好的视频数字水印提取网络，提取水印，获取其中的用户信息。