CN116708789A

CN116708789A - 一种基于人工智能的视频分析编码***

Info

Publication number: CN116708789A
Application number: CN202310977741.4A
Authority: CN
Inventors: 邓正秋; 谢松县
Original assignee: Hunan Malanshan Video Advanced Technology Research Institute Co ltd
Current assignee: Hunan Malanshan Video Advanced Technology Research Institute Co ltd
Priority date: 2023-08-04
Filing date: 2023-08-04
Publication date: 2023-09-05
Anticipated expiration: 2043-08-04
Also published as: CN116708789B

Abstract

本发明涉及视频编码传输领域，尤其涉及一种基于人工智能的视频分析编码***，本发明本发明通过设置数据获取模块、数据分析模块以及数据编码模块，通过数据分析模块获取视频帧序列子集的图像参数，基于图像参数的波动情况计算图像波动参量，采用较小算力初步划分视频帧序列子集的变化状态，并且，在视频帧序列子集处于不同的变化状态下，采取不同的解析间隔数量从视频帧序列子集中调用相邻视频帧进行动作解析，在提高对关键特征采集的基础上节约算力，并且，后续基于视频帧序列子集的动作变化状态适应性的调整编码参数，通过上述过程，在节约算力的前提下，考虑视频帧中轮廓坐标变化情况，适应性调整编码参数节约传输带宽保证传输后视频的质量。

Description

一种基于人工智能的视频分析编码***

技术领域

本发明涉及视频编码传输领域，尤其涉及一种基于人工智能的视频分析编码***。

背景技术

视频编码的一个重要目的就是对视频信号进行压缩，减少视频信号的数据量，从而节约视频信号的存储空间和传输带宽，现有的编码方式中，常纳入对视频内容的考虑，基于视频中运动矢量的变化对视觉效果的影响，适应性的调整编码参数。

例如，中国专利申请公开号：CN101325707A，公开了一种纹理自适应视频编码***、一种纹理自适应视频解码***和一种纹理自适应视频编解码***。纹理自适应视频编码***包含视频编码器和编码端纹理分析器；纹理自适应视频解码***包含视频解码器和解码端纹理分析器；纹理自适应视频编解码***包括纹理自适应视频编码***和纹理自适应视频解码***，纹理自适应视频编解码***将视频图像的纹理特征信息纳入到视频编解码***中，以提高视频编码的压缩效率和主观质量。

但是，现有技术中还存在以下问题，现有技术中，基于视频中运动矢量的变化对视觉效果的影响，适应性的调整编码参数，对局部运动矢量的分析相关联的计算成本很高并且读取当前的对比帧和先前的参考帧所需的存储带宽非常高，尤其是在视频量较大时占用较大的算力。

发明内容

为解决对局部运动矢量的分析相关联的计算成本很高并且读取当前的对比帧和先前的参考帧所需的存储带宽非常高，尤其是在视频量较大时占用较大的算力的问题，本发明提供一种基于人工智能的视频分析编码***，其包括：

数据获取模块，其与图像采集端连接，用以获取图像采集端所采集的视频帧序列；

数据分析模块，其用以接收所述数据获取模块所获取的视频帧序列，并将各所述视频帧序列拆分得到视频帧序列子集，确定视频帧序列子集中各视频帧的图像参数，并且，基于视频帧序列子集中连续视频帧对应图像参数的波动情况计算图像波动参量，并基于所述图像波动参量划分各所述视频帧序列子集的变化状态，所述变化状态包括第一变化状态以及第二变化状态；

数据编码模块，其与所述数据分析模块以及数据获取模块连接，包括运动解析单元以及编码单元，

所述运动解析单元用以基于所述视频帧序列子集的变化状态确定解析间隔数量，每隔所述解析间隔数量从所述视频帧序列子集中调用相邻视频帧进行动作参数解析，包括，解析相邻视频帧中轮廓坐标的变化参量，并基于所述视频帧序列子集中各变化参量的平均值划分视频帧序列子集的动作变化状态；

所述编码单元用以基于所述视频帧序列子集的动作变化状态对所述视频帧序列子集进行编码，包括，

以初始编码压缩率对所述视频帧序列子集中的各视频帧进行编码；

或，基于所述变化参量调整编码压缩率对所述视频帧序列子集中的各视频帧进行编码。

进一步地，所述数据分析模块确定视频帧序列子集中各视频帧的图像参数，包括，获取各视频帧的平均色度以及各视频帧的平均亮度。

进一步地，所述数据分析模块基于视频帧序列子集中连续视频帧对应图像参数的波动情况根据公式（1）计算图像波动参量，其中，

，

公式（1）中，E表示图像波动参量，P（i+1）表示第i+1个视频帧的平均色度，P（i）表示第i个视频帧的平均色度，L（i+1）表示第i+1个视频帧的平均亮度，L（i）表示第i个视频帧的平均亮度，n表示视频帧序列子集中视频帧的数量。

进一步地，所述数据分析模块基于所述图像波动参量划分各所述视频帧序列子集的变化状态，其中，

所述数据分析模块将所述图像波动参量与预设的图像波动参量对比阈值进行对比，

若所述图像波动参量大于所述图像波动参量对比阈值，所述数据分析模块判定所述视频帧序列子集的变化状态为第一变化状态；

若所述图像波动参量小于或等于所述图像波动参量对比阈值，所述数据分析模块判定所述视频帧序列子集的变化状态为第二变化状态。

进一步地，所述运动解析单元基于所述视频帧序列子集的变化状态确定解析间隔数量，其中，

在所述视频帧序列子集的变化状态为第一变化状态时，增加解析间隔数量；

在所述视频帧序列子集的变化状态为第二变化状态时，减小解析间隔数量。

进一步地，所述运动解析单元内设置有增大或减小解析间隔数量的运行算法，其中，

增大解析间隔数量的增大量以及减小解析间隔数量的减小量均基于所述视频帧序列子集的图像波动参量所确定。

进一步地，所述运动解析单元解析相邻视频帧中轮廓坐标的变化参量，其中，

所述运动解析单元在各视频帧中以视频帧中心为基准建立直角坐标系，识别相邻视频帧中相同物体轮廓的中心点，并按照公式（2）计算所述相邻视频帧中相同物体轮廓变化参量，

，

公式（2）中，G表示相同物体轮廓变化参量，x1表示相邻的第一视频帧中物体轮廓的中心点x轴向坐标，y1表示相邻的第一视频帧中所述物体轮廓的中心点y轴向坐标，x2表示相邻的第二视频帧中相同物体轮廓的中心点的x轴向坐标，y2表示相邻的第二视频帧中相同物体轮廓的中心点的y轴向坐标；

所述运动解析单元将所述相邻视频帧中各相同物体轮廓变化参量的平均值确定为所述相邻视频帧中轮廓坐标的变化参量。

进一步地，所述运动解析单元基于所述视频帧序列子集中各变化参量的平均值划分视频帧序列子集的动作变化状态，其中，

所述运动解析单元将所述视频帧序列子集中各变化参量的平均值与预设的变化参量对比阈值进行对比，

若所述视频帧序列子集中各变化参量的平均值大于所述变化参量对比阈值，则判定所述视频帧序列子集属于第一动作变化状态；

若所述视频帧序列子集中各变化参量的平均值小于或等于所述变化参量对比阈值则判定所述视频帧序列子集属于第二动作变化状态。

进一步地，所述编码单元基于所述视频帧序列子集的动作变化状态对所述视频帧序列子集进行编码，其中，

若所述视频帧序列子集为第一动作变化状态，以初始编码参数对所述视频帧序列子集中的各视频帧进行编码；

若所述视频帧序列子集为第二动作变化状态，基于所述变化参量调整编码压缩率对所述视频帧序列子集中的各视频帧进行编码。

进一步地，所述编码单元基于所述变化参量调整编码压缩率对所述视频帧序列子集中的各视频帧进行编码，其中，

所述编码单元内设置有若干基于变化参量调整编码压缩率的调整方式，各所述调整方式中对所述编码压缩率的调整量不同。

与现有技术相比，本发明通过设置数据获取模块、数据分析模块以及数据编码模块，通过数据分析模块获取视频帧序列子集的图像参数，基于图像参数的波动情况计算图像波动参量，采用较小算力初步划分视频帧序列子集的变化状态，并且，在视频帧序列子集处于不同的变化状态下，采取不同的解析间隔数量从视频帧序列子集中调用相邻视频帧进行动作解析，在提高对关键特征采集的基础上节约算力，并且，后续基于视频帧序列子集的动作变化状态适应性的调整编码参数，通过上述过程，在节约算力的前提下，考虑视频帧中轮廓坐标的变化情况，适应性调整编码参数，节约传输带宽保证传输后视频的质量。

尤其，本发明基于视频帧序列子集中连续视频帧对应图像参数的波动情况计算图像波动参量，并基于所述图像波动参量划分各所述视频帧序列子集的变化状态，在实际情况中，图像波动参量能够表征出视频帧中画面内容的变化情况，相较于其中轮廓点的运动矢量分析，图像参数提取的所占用算力是较少的，进而计算图像波动参量也占用较小算力，因此，本发明通过图像波动参量初步划分视频帧的变化情况，在占用较小算力的前提下为后续的数据处理提供依据。

尤其，本发明基于所述视频帧序列子集的变化状态确定解析间隔数量，对于视频帧序列子集，图像波动参量变化程度越小，表征画面变化情况相对较小，但是其中仍然可能存在运动轮廓变化量较大的情况，还需要纳入对运动轮廓的考量，在实际情况中，第一变化状态的视频帧序列子集相对于第二变化状态的视频帧序列子集其中物体轮廓矢量变化量可能会大，并且其中的运动轮廓特征也可能较多，因此，适应性的调整解析间隔数量，对第一变化状态的视频帧序列子集提取更多的相邻视频帧纳入动作变化状态的判定依据，对第二变化状态的视频帧序列子集适应性的减少相邻视频帧的提取数量，进而避免特征遗漏，在保证数据表征性的前提下，减少算力，为后续适应性调整编码参数提供可靠依据，进而节约传输带宽，保证视频编码传输后质量。

尤其，本发明基于视频帧序列子集对应的动作变化状态适应性调整编码参数，对于第二动作变化状态的视频帧序列子集，其中物体轮廓的运动矢量变化情况较小，适应性调整编码压缩率，在保证解码传输后视频观感的前提下，节约带宽，保证解码传输效果。

附图说明

图1为发明实施例的基于人工智能的视频分析编码***结构示意图；

图2为发明实施例的数据编码模块结构示意图。

具体实施方式

为了使本发明的目的和优点更加清楚明白，下面结合实施例对本发明作进一步描述；应当理解，此处所描述的具体实施例仅仅用于解释本发明，并不用于限定本发明。

下面参照附图来描述本发明的优选实施方式。本领域技术人员应当理解的是，这些实施方式仅仅用于解释本发明的技术原理，并非在限制本发明的保护范围。

请参阅图1以及图2所示，分别为本发明实施例的基于人工智能的视频分析编码***结构示意图以及数据编码模块结构示意图，本发明的基于人工智能的视频分析编码***包括：

具体而言，本发明对数据获取模块的具体结构不做限定，数据获取模块可以是数据转接器，设置于数据分析模块与数据采集端之间，当然，也可以是其他形式，只需能完成数据的转接、传输即可，此处不再赘述。

具体而言，本发明对数据分析模块以及数据编码模块的具体结构不做限定，均可以为逻辑部件或逻辑部件的组合，逻辑部件包括现场可编程部件、计算机以及计算机中的微处理器。

具体而言，本发明对获取图像参数的具体算法不做限定，图像参数为图像的基本参数，其获取方式为现有技术，且所占用算力较小，在本实施例中可以预先训练能够识别图像基本参数的模型将对应模型导入数据分析模块即可，此为现有技术，不再赘述。

同样的，本发明对数据分析模块获取相邻视频帧中相同轮廓的中心坐标的图像算法不做具体限定，在本实施例中，可以预先训练能够实现上述功能的图像模型，将对应图像模型导入数据分析模块中实现对应功能，此为现有技术，不再赘述。

具体而言，本发明对编码单元的具体结构不做现代，编码单元可以是能够控制的编码器，此为现有技术，不再赘述。

具体而言，所述视频分析模块将各所述视频帧序列拆分得到视频帧序列子集，其中，各视频帧序列子集中视频帧的数量相同。

具体而言，所述数据分析模块确定视频帧序列子集中各视频帧的图像参数，包括，获取各视频帧的平均色度以及各视频帧的平均亮度。

具体而言，所述数据分析模块基于视频帧序列子集中连续视频帧对应图像参数的波动情况根据公式（1）计算图像波动参量，其中，

，

具体而言，所述数据分析模块基于所述图像波动参量划分各所述视频帧序列子集的变化状态，其中，

具体而言，在本实施例中，图像波动参量对比阈值E0为预先统计所得，其中，获取若干视频样本，采集视频样本中的图像参数，并对应计算各视频样本的图像波动参量E，并求解图像波动参量平均值△E，设定E0=α1×△E，α1表示第一偏差因子，0.5＜α1＜0.7。

本发明基于视频帧序列子集中连续视频帧对应图像参数的波动情况计算图像波动参量，并基于所述图像波动参量划分各所述视频帧序列子集的变化状态，在实际情况中，图像波动参量能够表征出视频帧中画面内容的变化情况，相较于其中轮廓点的运动矢量分析，图像参数提取的所占用算力是较少的，进而计算图像波动参量也占用较小算力，因此，本发明通过图像波动参量初步划分视频帧的变化情况，在占用较小算力的前提下为后续的数据处理提供依据。

具体而言，所述运动解析单元基于所述视频帧序列子集的变化状态确定解析间隔数量，其中，

具体而言，所述运动解析单元内设置有增大或减小解析间隔数量的运行算法，其中，

在本实施例中设定Ne1=Ne2=[|E-△E|×N0/E]，Ne1表示解析间隔数量的增大量，Ne2表示解析间隔数量的减小量，N0表示初始解析间隔数量。

本发明基于所述视频帧序列子集的变化状态确定解析间隔数量，对于视频帧序列子集，图像波动参量变化程度越小，表征画面变化情况相对较小，但是其中仍然可能存在运动轮廓变化量较大的情况，还需要纳入对运动轮廓的考量，在实际情况中，第一变化状态的视频帧序列子集相对于第二变化状态的视频帧序列子集其中物体轮廓矢量变化量可能会大，并且其中的运动轮廓特征也可能较多因此，适应性的调整解析间隔数量，对第一变化状态的视频帧序列子集提取更多的相邻视频帧纳入动作变化状态的判定依据，对第二变化状态的视频帧序列子集适应性的减少相邻视频帧的提取数量，进而避免特征遗漏，在保证数据表征性的前提下，减少算力，为后续适应性调整编码参数提供可靠依据，进而节约传输带宽，保证视频编码传输后质量。

具体而言，所述运动解析单元解析相邻视频帧中轮廓坐标的变化参量，其中，

，

具体而言，所述运动解析单元基于所述视频帧序列子集中各变化参量的平均值划分视频帧序列子集的动作变化状态，其中，

具体而言，在本实施例中变化参量对比阈值G0为预先统计所得，其中，获取若干视频样本，随机从各视频样本中筛选出若干相邻视频帧，并求解各相邻视频帧中轮廓坐标的变化参量△G，求解各变化参量的平均值△Ge，设定G0=△Ge×α2，α2表示第二偏差因子，0.3＜α2＜0.5。

具体而言，所述编码单元基于所述视频帧序列子集的动作变化状态对所述视频帧序列子集进行编码，其中，

具体而言，所述编码单元基于所述变化参量调整编码压缩率对所述视频帧序列子集中的各视频帧进行编码，其中，

具体而言，在本实施例中至少提供两种编码压缩率的调整方式，其中，

编码单元将变化参量ΔG与预设的变化参量调整阈值Ge进行对比，

若ΔG＞Ge，所述编码单元将编码压缩率调整至第一编码压缩率F1，设定F1=F0+k1×F0；

若ΔG≤Ge，所述编码单元将编码压缩率调整至第二编码压缩率F2，设定F2=F0+k2×F0；

F0表示初始编码压缩率，K1表示第一调整系数，K2表示第二调整系数，0.15＜k1＜0.3＜k2＜0.45，Ge基于G0所确定，Ge=γ×G0，γ表示比例参数，0.6＜γ＜0.8。

本发明基于视频帧序列子集对应的动作变化状态适应性调整编码参数，对于第二动作变化状态的视频帧序列子集，其中物体轮廓的运动矢量变化情况较小，适应性调整编码压缩率，在保证解码传输后视频观感的前提下，节约带宽，保证解码传输效果。

至此，已经结合附图所示的优选实施方式描述了本发明的技术方案，但是，本领域技术人员容易理解的是，本发明的保护范围显然不局限于这些具体实施方式。在不偏离本发明的原理的前提下，本领域技术人员可以对相关技术特征做出等同的更改或替换，这些更改或替换之后的技术方案都将落入本发明的保护范围之内。

Claims

1.一种基于人工智能的视频分析编码***，其特征在于，包括：

2.根据权利要求1所述基于人工智能的视频分析编码***，其特征在于，所述数据分析模块确定视频帧序列子集中各视频帧的图像参数，包括，获取各视频帧的平均色度以及各视频帧的平均亮度。

3.根据权利要求2所述基于人工智能的视频分析编码***，其特征在于，所述数据分析模块基于视频帧序列子集中连续视频帧对应图像参数的波动情况根据公式（1）计算图像波动参量，其中，

，

4.根据权利要求3所述基于人工智能的视频分析编码***，其特征在于，所述数据分析模块基于所述图像波动参量划分各所述视频帧序列子集的变化状态，其中，

5.根据权利要求1所述基于人工智能的视频分析编码***，其特征在于，所述运动解析单元基于所述视频帧序列子集的变化状态确定解析间隔数量，其中，

6.根据权利要求5所述基于人工智能的视频分析编码***，其特征在于，所述运动解析单元内设置有增大或减小解析间隔数量的运行算法，其中，

7.根据权利要求1所述基于人工智能的视频分析编码***，其特征在于，所述运动解析单元解析相邻视频帧中轮廓坐标的变化参量，其中，

，

8.根据权利要求1所述基于人工智能的视频分析编码***，其特征在于，所述运动解析单元基于所述视频帧序列子集中各变化参量的平均值划分视频帧序列子集的动作变化状态，其中，

9.根据权利要求1所述基于人工智能的视频分析编码***，其特征在于，所述编码单元基于所述视频帧序列子集的动作变化状态对所述视频帧序列子集进行编码，其中，

10.根据权利要求9所述基于人工智能的视频分析编码***，其特征在于，所述编码单元基于所述变化参量调整编码压缩率对所述视频帧序列子集中的各视频帧进行编码，其中，