CN112104869A

CN112104869A - 一种视频大数据存储及转码优化***

Info

Publication number: CN112104869A
Application number: CN202011243500.XA
Authority: CN
Inventors: 郭海强; 李源; 李露; 肖俊
Original assignee: Optical Valley Technology Co ltd
Current assignee: Optical Valley Technology Co ltd
Priority date: 2020-11-10
Filing date: 2020-11-10
Publication date: 2020-12-18
Anticipated expiration: 2040-11-10
Also published as: CN112104869B

Abstract

本发明提出一种视频大数据存储及转码优化***。所述***包括：图像采集模块，用于采集原始图像；关键帧选取模块，用于根据相邻帧原始图像ROI中对应特征点总欧式距离

选取关键帧、待定背景帧和无关帧；背景帧选取模块，用于判断待定背景帧是否为背景帧；转码优化模块，用于根据

确定各帧的编码量化参数QP；数据存储模块，用于将关键帧和背景帧分别转化为关键帧灰度图像和背景帧YUV图像并分为若干个图像组储存起来；色彩重建模块，用于根据图像组中背景帧YUV图像来恢复同一图像组中的关键帧灰度图像的色彩。

Description

一种视频大数据存储及转码优化***

技术领域

本申请涉及计算机视觉领域，具体涉及一种视频大数据存储及转码优化***。

背景技术

进入信息时代，需要存储的数据量出现暴涨，存储数据的大量冗余提高了硬件的成本，造成大量人力、物力的消耗。对于视频数据而言，其存储通常表现为空间、颜色的冗余，如何降低视频对存储空间的消耗是当前科研的一个难题。现有技术通过降低视频的分辨率来节省存储空间，这种方法虽然能有效降低视频占用的存储空间，但也丢失了一部分关键信息，影响了后续对视频进行分析的效率。

发明内容

针对以上问题，本发明提出一种视频大数据存储及转码优化***。所述***包括：图像采集模块，用于采集原始图像；关键帧选取模块用于根据相邻帧原始图像ROI中对应特征点总欧式距离

选取关键帧、待定背景帧和无关帧；背景帧选取模块用于判断待定背景帧是否为背景帧；转码优化模块用于根据

确定各帧的编码量化参数QP；数据存储模块用于将关键帧和背景帧分别转化为灰度图像和YUV图像并分为若干个图像组储存起来；色彩重建模块用于根据图像组中背景帧YUV图像来恢复同一图像组中的关键帧灰度图像的色彩。

一种视频大数据存储及转码优化***，其特征在于，该***包括：

图像采集模块，用于采集原始图像，在每一帧所述原始图像中设置ROI；

关键帧选取模块，用于根据当前帧原始图像ROI和上一帧原始图像ROI中对应特征点总欧式距离

，判断所述当前帧原始图像为关键帧、待定背景帧或无关帧；

背景帧选取模块，用于根据所述各待定背景帧和时间上与所述待定背景帧最近的背景帧的亮度相似性，判断所述待定背景帧是否为背景帧，以此输出若干张背景帧；

转码优化模块，用于根据所述总欧式距离

与编码量化参数QP的关系模型，确定对所述关键帧和所述背景帧进行编码所用编码量化参数QP；

数据存储模块，用于将相邻所述背景帧之间的关键帧和前一背景帧归为一个图像组，还用于将所述图像组内的关键帧转化为关键帧灰度图像并储存，将所述图像组内的背景帧转化为背景帧YUV图像并储存；

色彩重建模块，用于根据所述图像组中的背景帧YUV图像来恢复同一所述图像组中的关键帧灰度图像的色彩，并输出关键帧RGB图像。

所述关键帧选取模块，用于根据当前帧原始图像ROI和上一帧原始图像ROI中对应特征点总欧式距离

，判断所述当前帧原始图像为关键帧、待定背景帧或无关帧，具体包括：

找到上一帧原始图像ROI中第一特征点的坐标，并根据上一帧原始图像和当前帧原始图像预测当前帧原始图像ROI中第二特征点的坐标，所述第二特征点和所述第一特征点一一对应。

计算每个所述第一特征点和对应的所述第二特征点的欧式距离

，设置经验欧式距离阈值

，当

时，舍去该

值；当

时，保留该

值。将筛选后剩下的欧式距离

相加得到总欧式距离

；

预设第一欧式距离阈值

、第二欧式距离阈值

，且

＜

；当

时，判定所述当前帧原始图像为所述关键帧；当

时，判定所述当前帧原始图像为所述无关帧；当

时，判定所述当前帧原始图像为所述待定背景帧。

所述背景帧选取模块，用于根据所述各待定背景帧和时间上与所述待定背景帧最近的背景帧的亮度相似性，判断所述待定背景帧是否为背景帧，以此输出若干张背景帧，具体包括：

S1，将待定背景帧按时间顺序排列，得到待定背景帧序列，设待定背景帧序列中第一个待定背景帧为背景帧，将其加入背景帧集合，并从待定背景帧序列中删除；

S2，按时间顺序从待定背景帧序列上取一个待定背景帧作为待处理待定背景帧

，从背景帧集合中确定与待处理待定背景帧

时序距离最近的背景帧

，并计算所述待处理待定背景帧

与

之间的亮度差阈值

：

，T为拍摄所述待处理待定背景帧的时刻，

为拍摄所述与待处理待定背景帧

时序距离最近的背景帧

的时刻，

为

时刻照度，

为

时刻的照度，

为比例调节系数；

S3，设置经验亮度差阈值

，当

时，判定理想亮度差

；当

时，判定理想亮度差

；

S4，计算所述待处理待定背景帧

与所述背景帧

的亮度差

，

，

为所述待处理待定背景帧

内所有像素的灰度平均值，

为所述背景帧

内所有像素的灰度平均值；当

时，判定所述待处理待定背景帧

为背景帧并将其加入背景帧集合；当

时，判定所述待处理待定背景帧为无关帧；

S5，重复S2-S4直至所有待定背景帧被处理完成，输出若干张背景帧。

所述关系模型为：

，

为四舍五入取整函数，

为底数调整因子，

为值域调整因子，

为常数调整因子。

所述色彩重建模块包括：第一编码器，用于提取所述关键帧灰度图像的第一特征张量；第二编码器，用于提取所述背景帧YUV图像的第二特征张量；解码器，用于将所述第一特征张量和所述第二特征张量联合并进行色彩恢复，输出所述关键帧RGB图像。

所述色彩重建模块为神经网络，所述色彩重建模块的训练方法包括：以若干个所述图像组为数据集；对所述数据集进行标注，标注为所述关键帧灰度图像对应的所述关键帧RGB图像数据；使用均方误差损失函数进行训练。

本发明和现有技术相比有如下有益效果：

（1）根据相邻帧之间ROI区域对应特征点总欧式距离选取关键帧，将关键帧转化为灰度图像并存储，降低存储空间的消耗并保留了关键信息，有利于后续对视频的分析；

（2）根据光强传感器估计理想亮度差F，将待定背景帧和时间上最近的背景帧之间的亮度差值和F对比，来确定理想亮度差F用于筛选背景帧。得到的背景帧和同一图像组的关键帧亮度差较小，可以更好地还原出关键帧灰度图像的色彩；

（3）利用神经网络，根据背景帧YUV图像来恢复关键帧灰度图像的色彩，可以更快速、更准确地还原出关键帧原本的色彩。

附图说明

图1为***结构图。

图2为色彩重建模块结构图。

具体实施方式

为了使本发明的目的、技术方案及优点更加清楚明白，以下结合附图及实施例，对本发明进行进一步详细说明。应当理解，此处所描述的具体实施例仅用以解释本发明，并不用于限定本发明。

需要说明的是，本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象，而不是用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换，以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外，术语“包括”和“具有”以及他们的任何变形，意图在于覆盖不排他的包含，例如，包含了一系列步骤或单元的过程、方法、***、产品或设备不必限于清楚地列出的那些步骤或单元，而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。

实施例一：

本发明的主要目的是实现对摄像头采集的图像进行选择性存储，并对图像进行颜色压缩，降低视频编码的时间与存储占用的空间。

为了实现本发明所述内容，本发明设计了一种视频大数据存储及转码优化***，***结构图如图1所示。

所述***包括：图像采集模块、关键帧选取模块、背景帧选取模块、转码优化模块、数据存储模块、色彩重建模块。

本发明主要针对城市道路、工厂等监控区域的监控摄像头采集的图像进行处理，监控摄像头采集的图像若不经过压缩处理降低码率，会占用大量存储空间。我们往往只需要监测画面中一部分关键区域，所以需要设置ROI（感兴趣区域）。

图像采集模块，使用监控摄像头采集RGB图像，即原始图像，根据实际情况设置ROI，以便于后续根据光流法判断关键帧。本实施例针对城市道路中的十字路口的监控，因为风吹导致道路边树木晃动，对于光流估计的结果有很大的影响，从而导致关键帧的误判，所以选定原始图像中的道路部分为ROI。

关键帧选取模块，用于选取关键帧。本发明通过光流估计判断相邻帧原始图像ROI中物体的变化大小。光流（optical flow）是空间运动物体在观察成像平面上的像素运动的瞬时速度。光流估计算法是利用图像序列中像素在时间域上的变化以及相邻帧原始图像之间的相关性来找到上一帧原始图像跟当前帧原始图像之间存在的对应关系，从而计算出相邻帧原始图像之间物体的运动信息的一种方法。

光流估计算法是多样且公知的，本发明不对光流估计的算法进行限制，实施者可以根据实际情况选择合适的光流估计算法。可以选择卢卡斯-卡纳德方法（Lucas-KanadeMethod）、霍恩·山克方法（Horn Schunck Method）、基于DNN的FlowNet系列方法等。本实施例选择卢卡斯-卡纳德方法(简称L-K方法)进行光流估计。

L-K方法是一种广泛使用的光流估计的差分方法，具体步骤如下：

选择当前帧原始图像和上一帧原始图像，使用算法找到上一帧原始图像ROI中的第一特征点并计算第一特征点的坐标，一个单位长度对应一个像素的长度。所述算法是多样且公知的，不作为本发明的保护内容，本实施例使用Harris角点检测算法找到图像ROI中的角点，所述角点即为特征点。

根据所述第一特征点的坐标、所述上一帧原始图像和所述当前帧原始图像预测当前帧原始图像ROI中第二特征点的坐标，所述第二特征点和所述第一特征点一一对应。

为了保证选出的特征点能更准确地反映出相邻两帧原始图像ROI中光流大小，需要筛除位移较小的特征点。计算每个第一特征点和对应第二特征点的欧式距离

，计算公式为：

，

为所述第二特征点的x坐标，

为所述第二特征点的y坐标，

为所述第一特征点的x坐标，

为所述第一特征点的y坐标。

设置经验欧式距离阈值

，当

时，判定这对特征点不符合要求，舍去该

值；当

时，判定这对特征点符合要求并保留该

值。需要说明的是，

的值可由实施者根据实际情况设置，本实施例设置

。

将筛选后剩下的欧式距离

相加得到总欧式距离

，并根据

筛选关键帧。预设第一欧式距离阈值

、第二欧式距离阈值

，且

＜

；当

时，判定当前帧原始图像为所述关键帧；当

时，判定当前帧原始图像为所述无关帧；当

时，判定当前帧原始图像为所述待定背景帧。实施者可以根据实际情况设置合适的

、

，本实施例根据原始图像的分辨率

设置

、

，

、

。

背景帧选取模块，用于从待定背景帧中选取背景帧。本发明只需要储存关键帧和背景帧，不储存无关帧，所述背景帧用于后续恢复关键帧灰度图像的色彩，为了使恢复出的图像接近原始图像，背景帧应该和对应关键帧的亮度相近。所以本发明设计了根据亮度筛选背景帧的规则。筛选步骤如下：

S1，将待定背景帧按时间顺序排列起来，得到待定背景帧序列。在相机上设置照度传感器，检测相机周围环境的照度S，照度单位为lx。首先选取待定背景帧序列上第一帧待定背景帧为背景帧并将其加入背景帧集合，并从待定背景帧序列中删除；

S2，按时间顺序从待定背景帧序列上选取一个待定背景帧作为待处理待定背景帧

，从背景帧集合中确定与该待处理待定背景帧

时序距离最近的背景帧

，计算所述待处理待定背景帧

与所述背景帧

之间的亮度差阈值

：

因为图像亮度是由灰度来表示的，为了将照度和图像亮度联系起来，本发明设计了亮度差阈值计算模型，计算模型如下：

，

为亮度差阈值，所述T为拍摄所述待处理待定背景帧

的时刻，

为拍摄所述背景帧

的时刻，

为

时刻照度，

为

时刻照度，

为比例调节系数，实施者可以根据实际情况设置合适的

使照度和图像亮度联系起来,本实施例中设置

=0.2；

S3，为了避免

过小导致

过大，本发明还设置了经验亮度差阈值

，当

时，判定理想亮度差

；当

时，判定理想亮度差

；

S4，根据理想亮度差判断所述待处理待定背景帧

是否为背景帧，计算

内所有像素的灰度平均值

、计算所述背景帧

内所有像素的灰度平均值

，进一步地，计算所述待处理待定背景帧

与所述背景帧

的亮度差

，

。当

时，判定所述待处理待定背景帧

为背景帧并将其加入背景帧集合；当

时，判定所述待处理待定背景帧为无关帧；

S5，重复S2-S4直到所有待定背景帧被处理完成，输出背景帧集合，所述背景帧集合包含若干张背景帧。

转码优化模块，用于调节所述关键帧和所述背景帧的编码量化参数。得到所述背景帧和所述关键帧之后就可以针对它们进行转码优化，在关键帧选取模块中已经求得相邻帧原始图像ROI中对应特征点总欧式距离

，本发明根据

对各个关键帧和背景帧进行转码优化。

构建所述总欧式距离

与编码量化参数QP的关系模型：

，QP为视频编码的量化参数，

为四舍五入取整函数，

为底数调整因子，其取值范围在（0，1）之间，所述

使得QP的值随着

值的增大而减小。

为值域调整因子，

为常数调整因子。编码量化参数QP取值范围为（0，51），设置

是为了保证该关系模型的值域为（0，51）。实施者可以根据实际情况设置合适的

值

值

值，本实施例中设置

、

、

。

编码量化参数(QP)反映了空间细节压缩情况，QP较小时图像的大部分细节都会被保留，码率增大。QP较大时，图像中的一些细节会丢失，码率降低。即随着

的增大，QP变小，所述关键帧和背景帧占存储空间增大；随着

的减小，QP变大，所述关键帧和背景帧占存储空间减小。

数据存储模块，用于将转码优化后的背景帧和关键帧储存起来。将相邻所述背景帧之间的关键帧和前一背景帧归为一个图像组。将所述图像组内的背景帧转化到YUV空间生成背景帧YUV图像并储存。选取YUV是因为在视频存储中，没有必要储存全部的颜色信号。可以把更多带宽留给黑—白信号，也即Y通道分量，将稍少的带宽留给彩色信号，也即U、V通道分量。将RGB图像转化到YUV空间的方法是多样且公知的，本发明不对转化方法进行限制。同时将所述图像组内关键帧中像素的RGB值转换成灰度值，形成关键帧灰度图像并储存。

背景帧YUV图像和关键帧灰度图像所占存储空间较小，可以有效地节省存储空间。

色彩重建模块，用于恢复关键帧灰度图像的色彩，其结构如图2。在我们分析存储的视频数据时，需要得到关键帧RGB图像，所以本发明设计了色彩重建模块来恢复关键帧灰度图像的色彩。所述色彩重建模块为神经网络，其包括：第一编码器，用于提取所述关键帧灰度图像的第一特征张量；第二编码器，用于提取所述背景帧YUV图像的第二特征张量；解码器，用于将所述第一特征张量和所述第二特征张量联合并进行色彩恢复，输出所述关键帧RGB图像。

对色彩重建模块进行训练，训练方法包括：以若干个所述图像组为数据集；对所述数据集进行标注，标注为所述关键帧灰度图像对应的所述关键帧RGB图像数据；使用均方误差损失函数进行训练。

将背景帧YUV图像和同一所述图像组中的关键帧灰度图像输入训练好的色彩重建模块，最后输出关键帧的RGB图像。

以上所述仅为本发明的较佳实施例而已，并不用以限制本发明，凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等，均应包含在本发明的保护范围之内。