WO2023123512A1

WO2023123512A1 - 滤波系数生成及滤波方法、视频编解码方法、装置和***

Info

Publication number: WO2023123512A1
Application number: PCT/CN2021/144056
Authority: WO
Inventors: 元辉; 邢金睿; 王璐; 王婷婷; 李明
Original assignee: Oppo广东移动通信有限公司
Priority date: 2021-12-31
Filing date: 2021-12-31
Publication date: 2023-07-06
Also published as: CN118235392A

Abstract

一种滤波系数生成及滤波方法、视频编解码方法、装置和***，解码端从码流中解析出第一视频图像的滤波参数，滤波参数包括滤波系数；根据所述滤波参数对解码得到的所述第一视频图像进行邻域滤波。其中，所述滤波系数是根据第一视频图像中像素点的邻域差异将所述第一视频图像中的像素点分成多个类别，为所述多个类别中的部分或全部类别分别生成的对应的滤波系数；可以由编码端生成并编码发送。本公开实施例可以提升滤波效果，增强视频图像的图像质量。

Description

滤波系数生成及滤波方法、视频编解码方法、装置和***

技术邻域

本公开实施例涉及但不限于视频技术，更具体地，涉及一种滤波系数生成及滤波方法、视频编解码方法、装置和***。

背景技术

图像滤波要在尽量保留图像细节特征的条件下对目标图像的噪声进行抑制，是图像处理中重要的操作。邻域滤波是一种常用的滤波方式，邻域滤波基于图像中每一个像素点的像素值及其邻域像素点的像素值进行计算，结果作为该像素点新的像素值。邻域滤波包括维纳滤波、高斯滤波、均值滤波等。邻域滤波的效果还有待增强。以图像的维纳滤波为例，比如在滤波器阶数K一定的情况下，对于大尺度图像以及局部变化较为剧烈的图像，利用同一组系数进行滤波得到的质量增强效果并不好；如果一味增大K的大小，滤波效果只有小幅度提升，同时在一定程度上会增加码流大小及时间复杂度，甚至使得综合性能更差。

发明概述

以下是对本文详细描述的主题的概述。本概述并非是为了限制权利要求的保护范围。

本公开一实施例提供了一种视频解码方法，包括：

解码码流，确定第一视频图像的滤波参数，所述滤波参数包括滤波系数；

根据所述滤波参数对所述第一视频图像进行邻域滤波。

本公开一实施例还提供了一种滤波系数生成方法，包括：

根据第一视频图像中像素点的邻域差异将所述第一视频图像中的像素点分成多个类别；

为所述多个类别中的部分或全部类别分别生成对应的滤波系数。

本公开一实施例还提供了一种视频滤波方法，其中：

获取按照本公开任一实施例所述的滤波系数生成方法生成的，与所述多个类别中的部分或全部类别对应的滤波系数；

对所述第一视频图像进行邻域滤波时，所述第一视频图像中有对应滤波系数的每一类别的像素点使用该类别对应的滤波系数进行滤波。

本公开一实施例还提供了一种视频编码方法，包括：

按照如本公开任一实施例所述的滤波系数生成方法，将第一视频图像中的像素点分成多个类别，为所述多个类别中的部分或全部类别分别生成对应的滤波系数，一个所述类别对应一组滤波系数；

对滤波参数编码并发送，或者对所述滤波系数中符合发送条件的滤波参数编码并发送，其中，所述滤波参数包括所述滤波系数和类别信息。

本公开一实施例还提供了一种码流，其中，所述码流为已编码视频码流，所述码流中包括已编码的滤波参数，所述滤波参数包括滤波系数，所述滤波系数用于对第一视频图像进行邻域滤波。

本公开一实施例还提供了一种视频解码装置，包括处理器以及存储有计算机程序的存储器，其中，所述处理器执行所述计算机程序时实现如本公开任一实施例所述的视频解码方法。

本公开一实施例还提供了一种视频解码装置，包括几何帧重建模块和纹理转换模块，其中，还包括：

维纳滤波模块，设置为接收所述几何帧重建模块输出的重建几何视频图像，及从码流中解析得到的滤波参数，执行如本公开任一实施例所述的视频解码方法，输出滤波后的重建几何视频图像到所述纹理转换模块。

本公开一实施例还提供了一种视频编码装置，包括处理器以及存储有计算机程序的存储器，其中，所述处理器执行所述计算机程序时实现如本公开任一实施例所述的视频编码方法。

本公开一实施例还提供了一种视频编码装置，应用于基于视频的点云压缩***，包括纹理帧生成模块，以及依次连接的几何帧生成模块、几何帧填充模块和几何帧视频压缩模块，其中，还包括：

维纳滤波模块，设置为接收所述几何帧视频压缩模块输出的重建几何视频图像，及所述几何帧生成模块或几何帧填充模块输出的原始几何视频图像，执行如本公开实施例所述的视频编码方法，输出滤波后的重建几何视频图像到所述纹理帧生成模块。

本公开一实施例还提供了一种视频编解码***，其中，包括如本公开任一实施例所述的视频编码装置和如本公开任一实施例所述的视频解码装置。

本公开一实施例还提供了一种视频滤波装置，包括处理器以及存储有计算机程序的存储器，其中，所述处理器执行所述计算机程序时实现如本公开任一实施例所述的视频滤波方法。

本公开一实施例还提供了一种非瞬态计算机可读存储介质，所述计算机可读存储介质存储有计算机程序，其中，所述计算机程序时被处理器执行时实现如本公开任一实施例所述的方法。

在阅读并理解了附图和详细描述后，可以明白其他方面。

附图概述

附图用来提供对本公开实施例的理解，并且构成说明书的一部分，与本公开实施例一起用于解释本公开的技术方案，并不构成对本公开技术方案的限制。

图1是本公开一实施例滤波系数生成方法的流程图；

图2是本公开一实施例视频滤波方法的流程图；

图3A、图3B和图3C是一个像素点几种邻域的示意图；

图4A、图4B和图4C是一个像素点及其邻域像素点的像素值取值的几个示例；

图5是本公开一实施例采用的菱形窗口的示意图；

图6是本公开一实施例滤波系数生成方法中小类合并过程的流程图；

图7是V-PCC编码端的框架图；

图8是V-PCC解码端的框架图；

图9是本公开一实施例视频编码方法的流程图；

图10是本公开一实施例作为示例的视频几何帧的示意图；

图11是本公开一实施例在V-PCC编码端增加维纳滤波模块的一种方式的模块图；

图12是本公开一实施例在V-PCC编码端增加维纳滤波模块的另一方式的模块图；

图13是本公开一实施例在视频编码装置增加维纳滤波单元的示意图；

图14是本公开一实施例视频解码方法的流程图；

图15是本公开一实施例在V-PCC解码端增加维纳滤波模块的示意图；

图16是本公开一实施例在视频解码装置增加维纳滤波单元的示意图；

图17是CTC_C2上每个序列的测试结果中一部分的示意图；

图18是CTC_C2上每个序列的测试结果中另一部分的示意图；

图19、图20和图21是本公开一实施例方法原始点云、重建点云和经本公开实施例质量增强的点云比较的示意图；

图22是本公开一实施例视频编码装置的硬件架构图。

详述

本公开描述了多个实施例，但是该描述是示例性的，而不是限制性的，并且对于本邻域的普通技术人员来说显而易见的是，在本公开所描述的实施例包含的范围内可以有更多的实施例和实现方案。

本公开的描述中，“示例性的”或者“例如”等词用于表示作例子、例证或说明。本公开中被描述为“示例性的”或者“例如”的任何实施例不应被解释为比其他实施例更优选或更具优势。本文中的“和/或”是对关联对象的关联关系的一种描述，表示可以存在三种关系，例如，A和/或B，可以表示：单独存在A，同时存在A和B，单独存在B这三种情况。“多个”是指两个或多于两个。另外，为了便于清楚描述本公开实施例的技术方案，采用了“第一”、“第二”等字样对功能和作用基本相同的相同项或相似项进行区分。本邻域技术人员可以理解“第一”、“第二”等字样并不对数量和执行次序进行限定，并且“第一”、“第二”等字样也并不限定一定不同。

在描述具有代表性的示例性实施例时，说明书可能已经将方法和/或过程呈现为特定的步骤序列。然而，在该方法或过程不依赖于本文所述步骤的特定顺序的程度上，该方法或过程不应限于所述的特定顺序的步骤。如本邻域普通技术人员将理解的，其它的步骤顺序也是可能的。因此，说明书中阐述的步骤的特定顺序不应被解释为对权利要求的限制。此外，针对该方法和/或过程的权利要求不应限于按照所写顺序执行它们的步骤，本邻域技术人员可以容易地理解，这些顺序可以变化，并且仍然保持在本公开实施例的精神和范围内。

目前的邻域滤波算法对视频图像中所有的像素点采用同一组系数进行滤波，没有考虑视频图像中像素点的邻域差异，质量增强效果不好。在前景和背景交界处亮度变化极为剧烈的区域，与前景或背景亮度变化平缓的区域，如果采用相同的滤波系数进行邻域滤波，难以达到好的效果。此外，视频编解码***的编码端和解码端分别滤波，解码端没有利用编码端的滤波参数，影响了滤波效果。

为此，本公开一实施例提供了一种滤波系数生成方法，如图1所示，包括：

步骤110，根据第一视频图像中像素点的邻域差异将所述第一视频图像中的像素点分成多个类别；

步骤120，为所述多个类别中的部分或全部类别分别生成对应的滤波系数。

本公开实施例不同类别像素点可以使用不同的滤波系数，因此本公开的邻域滤波不包括那些系数固定的邻域滤波算法如均值滤波、中值滤波等。

本公开一实施例还提供了一种视频滤波方法，如图2所示，包括：

步骤210，获取本公开任一实施例所述的滤波系数生成方法生成的,与所述多个类别中的部分或全部类别对应的滤波系数；

此处获取的滤波系数可以是本地生成的，也可以是从外部传输来的，例如视频编码端生成滤波系数并编码发送，视频解码端通过解析获取所述滤波系数并使用。

步骤220，对所述第一视频图像进行邻域滤波，其中，对所述第一视频图像中有对应滤波系数的每一类别的像素点，使用该类别对应的滤波系数进行滤波。

也即对所述第一视频图像进行邻域滤波时，对有对应滤波系数的每一类别，使用窗口扫描该类别的每一像素点，对所述窗口内所有像素点的像素值加权平均，将位于所述窗口中心的该类别像素点的像素值更新为加权平均的结果，加权平均使用的一组加权系数采用该类别对应的一组滤波系数。

本公开实施例根据像素点的邻域差域对视频图像中的像素点分类，对不同的类别分别生成对应的滤波系数并在邻域滤波时作为该类别像素点的滤波系数，可以为邻域差异不同的像素点自适应地生成合适的滤波系数，从而提高视频图像邻域滤波的效果。本公开实施例提出的基于邻域差异的自适应邻域滤波方法、可以通过自适应邻域滤波增强图像的质量。

本公开的第一视频图像包括但不限于视频帧，第一视频图像还可以是视频帧中的条带(slice)、条带片段(slice segment)等更小的视频单位，或者更大的视频单位，如多个视频帧序列。本公开以下实施例对视频帧的处理也可适用于对其他视频图像的处理。

本文中，像素点的像素值可以是颜色的三个分量(也称为三个通道)中任一分量的值。例如，在YUV格式的图像中，“Y”表示亮度(Luminance或Luma)分量，亮度分量的值通常称为灰度值；“U”和“V”表示的则是色度(Chrominance或Chroma)分量，色度分量可以被存储成Cb(也写为Chroma Cb)和Cr(也写入Chroma Cr)，其中Cb为蓝色色度分量，Cr为红色色度分量。则像素点的像素值可以是亮度分量、蓝色色度分量或红色色度分量的值；在RGB格式的图像中，像素点的像素值可以是红色、绿色或蓝色的值，等等。有时，第一视频图像只具有部分分量时，例如在基于视频的点云压缩(video-based point cloud compression，简称V-PCC)***中，对重建几何视频图像滤波时，像素点的像素值指灰度值。而对重建纹理视频图像滤波时，可以对两个色度分量分别滤波，则对蓝色色度分量滤波时，上述像素点的像素值指蓝色色度分量的值，对红色色度分量滤波时，上述像素点的像素值指红色色度分量的值。

本公开实施例中，对视频图像进行邻域滤波，是对视频图像中每一像素点，以该像素点使用的k个滤波系数为加权系数，对以该像素点为中心的窗口内k个像素点的像素值进行加权平均，结果作为该像素点新的像素值，其中，k为滤波阶数。这与传统的邻域滤波是基本相同的，只是传统的邻域滤波所有像素点使用的是相同的滤波系数。而在本公开实施例中，具有对应滤波系数的每一类别的像素点使用的是该类别对应的滤波系数，不同类别对应的滤波系数分别生成，通常并不相同。视频图像中还可能存在一部分像素点，其所属的类别没有对应的滤波系数，对视频图像进行邻域滤波时，这部分像素点保留原来的像素值，不参与滤波运算。

本文中的“窗口”均指邻域滤波扫描时使用的窗口，也可以称为模板、模板窗口、卷积核、方框等。所述扫描操作也可以称之为卷积。但本实施例的一个示例使用菱形的滤波器窗口，如图5所示。相较于原始的矩形框滤波器，该示例改变了窗口的形状，可以更好地适应边界变化，更有效地提取邻域信息。图5中的窗口包括25个像素点，对应于k＝25阶的滤波器。本公开也可以使用如9阶、16阶、36阶等其他阶数的滤波器进行邻域滤波。

在本公开一示例性实施例中，所述第一视频图像中一个像素点的邻域差异根据该像素点的像素值与该像素点邻域中每一像素点的像素值之差的绝对值统计得到，所述统计为求和、求均值或者求最大值。

在一个示例中，该像素点的邻域指该像素点的八邻域或四邻域或对角邻域。图3A示出了像素点A的八邻域即带有剖面线的区域，八邻域中包括像素点A周围一圈的8个像素点。图3B示出了像素点A的四邻域即带有剖面线的区域，四邻域中包括像素A周边8个像素点中位于上、下、左、右的4个像素点。图3C示出了像素点A的对角邻域即带有剖面线的区域，对角邻域中包括像素A周边8个像素点位于四个角上的像素点。但本公开不局限于此，在另一示例中，一个像素点的邻域不局限于上述八邻域、四邻域和对角邻域，如也可以包括该像素点周围二圈的24个像素点。

在一个示例中，像素点的邻域为八邻域为例，第一视频图像中一个像素点的邻域差异根据该像素点的像素值与该像素点邻域中每一像素点的像素值之差的绝对值求和得到。如图4A的示例，像素点A的像素值为2，八邻域中的像素点分别为3,1,3,2,4,2,2,4，邻域差异为diff。则有：

diff＝|2-3|+|2-1|+|2-3|+|2-2|+|2-4|+|2-2|+|2-2|+|2-4|＝7

如图4B的示例，像素点A的像素值为1，八邻域中的像素点分别为1,1,1,2,1,2,2,1，邻域差异为diff。则有：

diff＝|1-1|+|1-1|+|1-1|+|1-2|+|1-1|+|1-2|+|1-2|+|1-1|＝3

如图4C的示例，像素点A的像素值为5，八邻域中的像素点分别为4,7,8,8,6,5,2,3，邻域差异为diff。则有：

diff＝|5-4|+|5-7|+|5-8|+|5-8|+|5-6|+|5-5|+|5-2|+|5-3|＝15

除了求和外，所述统计也可以是求均值，即求和之后除以邻域中像素点的个数；或者所述统计也可以是求最大值，即求得到的所述多个绝对值中的最大值。此外，在得到统计值之后，可以用该统计值直接表示邻域差异。但也可以对第一视频图像中所有像素点的统计值做归一化处理，如将统计值映射到[0，10]的区间内，用归一化之后的值表示邻域差异。

在本公开一示例性实施例中，所述第一视频图像中一个像素点的邻域差异根据该像素点及该像素点邻域中像素点的像素值之间的差异确定。以图3A的数据为例，像素点A的邻域差异由该3×3区域整体的像素值的差异得到，即考虑2,3,1,3,2,4,2,2,4的差异，该差异可以用如极差、均方差等表示。

与本实施例相比，上一实施例邻域差异根据该像素点的像素值与该像素点邻域中每一像素点的像素值之差的绝对值统计得到，对逐像素的变化更为敏感，能捕捉到物体边缘处灰度值的剧烈变化，较准确地将边缘处的像素点分入同一类别，生成相适应的滤波系数，提高滤波效果。

在本公开一示例性实施例中，，所述部分或全部类别中每一类别对应的滤波系数设置为对所述第一视频图像进行邻域滤波时该类别像素点使用的滤波系数；所述对所述第一视频图像进行邻域滤波，包括：对有对应滤波系数的每一类别，使用窗口扫描该类别的每一像素点，对所述窗口内所有像素点的像素值加权平均，将位于所述窗口中心的该类别像素点的像素值更新为加权平均的结果，所述加权平均使用的一组加权系数根据该类别对应的滤波系数得到，所述窗口为矩形或菱形。此处描述的对一个类别的像素点进行邻域滤波的操作也适用于以下将多个小类合并为一个类别的过程中，对合并成的一个类别的像素点进行邻域滤波。

下面用维纳滤波器(Wiener filter)说明一下使用滤波系数进行滤波的过程以及滤波系数的生成过程。虽然本公开实施例以维纳滤波为例，但本公开也可用于可以根据有损信号和原始信号直接计算出最优系数的其他邻域滤波算法，以及其他滤波系数可以变化的邻域滤波算法。

维纳滤波器是由数学家Norbert Wiener提出的一种线性滤波器，是利用平稳随机过程的相关特性和频谱特性对混有噪声的信号进行滤波的方法。在一定的约束条件下，其输出与一给定函数(称为期望信号)的差的平方达到最小，通过数学运算最终可变为一个托布利兹方程的求解问题。

维纳滤波具体算法如下：

对于一列混有噪声的信号(称为待滤波信号)x，滤波器长度或阶数为M时输出为:

用矩阵形式表示为：y(n)＝H(m)×X(n)

已知期望信号为d，则可以计算输出信号与期望信号之间的误差：

e(n)＝d(n)-y(n)＝d(n)–H(m)×X(n),m＝0,1…..M

维纳滤波器以最小均方误差(Minimum Mean Squared Error，简称MMSE)为目标函数，故令目标函数为：

Min E(e(n) ²)＝E[(d(n)-H(m)×X(n) ²)]

当滤波系数为最优时，目标函数对滤波系数的导数应该为0，即：

2E[(d(n)-H(m)×X(n))]×X(n)＝0

E[d(n)X(n)]-H(m)E[X(n)X(n)]＝0

上式可表示为：

Rxd–H×Rxx＝0

从而由维纳--霍夫方程有：

H＝Rxx ^-1×Rxd

得到最优滤波系数的矩阵H，其中，Rxx为待滤波信号(即含有噪声的输入信号)的自相关矩阵，Rxd为待滤波信号与期望信号的互相关矩阵。

求取维纳滤波系数需要待滤波信号与期望信号，在图像处理邻域，两者可以分别对应于有损图像(也称为失真图像)与原始图像(也称为真实图像)。对于k阶的维纳滤波器，该算法可以根据有损图像与原始图像中每个像素的像素值计算得到k个系数，作为维纳滤波最优的系数，利用该系数对有损图像进行维纳滤波，可以得到在均方误差上逼近原始图像的恢复图像，同时也会具有更好的主观效果。

以视频图像的滤波为例，假定滤波器阶数为k。视频图像的像素总数为n，矩阵P(n,k)是一个n×k矩阵，n行分别对应于图像中n个像素点，对于图像中的每一像素点，文中将以该像素点为中心的窗口内k个像素值的序列称为该像素点的滤波相关向量，文中将矩阵P(n,k)称为视频图像的滤波相关矩阵，由视频图像中n个像素点的滤波相关向量组成。向量S(n)表示原始图像内n个像素点的n个像素值，称为原始像素值向量。

由上述算法可得：

互相关矩阵B(k):B(k)＝P(n,k) ^T×S(n)

自相关矩阵A(k,k)：A(k,k)＝P(n,k) ^T×P(n,k)

则最优滤波系数(向量)H(k)：H(k)＝A(k,k) ^-1×B(k)

即，H(k)是该k阶滤波器的一组滤波系数，也叫维纳系数，共包括k个滤波系数。

生成维纳系数后，使用维纳系数对待滤波信号进行维纳滤波，输出信号可以最大限度地恢复原始图像，输出信号R(n)＝P(n,k)×H(k)，R(n)代表输出信号的n个像素值。

在本公开一示例性的实施例中，所述邻域滤波为维纳滤波，所述第一视频图像包括有损视频图像；为所述多个类别中的一个类别生成对应的滤波系数时，是将所述有损视频图像中该类别所有像素点的滤波相关向量组成该类别滤波相关矩阵，将该类别像素点在相应原始视频图像中相应位置的像素点的像素值组成该类别原始像素值向量，将该类别滤波相关矩阵和该类别原始像素值向量的互相关矩阵左乘该类别滤波相关矩阵的自相关矩阵的逆矩阵，得到该类别对应的滤波系数。用公式表示为：

第i类别互相关矩阵B _i(k)＝P(n _i,k) ^T×S(n _i)；

第i类别自相关矩阵A _i(k,k)＝P(n _i,k) ^T×P(n _i,k)；

第i类别对应的滤波系数H _i(k)＝A _i(k,k) ^-1×B _i(k)。

其中，一个像素点的滤波相关向量指以该像素点为中心的窗口内的k个像素值组成的向量，P(n _i,k)是第i类别滤波相关矩阵，n _i是第i类别像素点的数量，S(n _i)是第i类别像素点的原始像素值向量。

本公开一示例性实施例中，对第一视频图像进行维纳滤波时，与传统维纳滤波的算法基本相同。对视频图像中有对应滤波系数的类别中的每一像素点，也是对以该像素点为中心的窗口内k个像素点的像素值进行加权平均，结果作为该像素点新的像素值，只是加权平均时使用该类别对应的滤波系数，不再对所有像素点使用相同的滤波系数。本公开实施例还允许一部分像素点分入没有对应滤波系数的一个类别，对第一视频图像进行维纳滤波时直接保留原像素值，不需要参与运算。本公开任一实施例中，无论是合并前还是合并后，无论是对一个类别的像素点进行邻域滤波还是生成一个类别的滤波系数，对第一视频图像中的一个像素点来说，以该像素点为中心的窗口内的k个像素值均不改变，也即该像素点的滤波相关向量不变，均是第一视频图像中以该像素点为中心的窗口所覆盖的k个像素值。

在本公开一示例性的实施例中，所述根据第一视频图像中像素点的邻域差异将所述第一视频图像中的像素点分成多个类别，包括：将邻域差异的取值范围分为多个取值区间，确定所述第一视频图像中每一像素点的邻域差异所属的取值区间，将该像素点分入该取值区间对应的一个类别。

本实施例中，类别与邻域差异的取值区间之间的对应关系是设定好的。在一示例中，假定邻域差异的取值范围为[0,100]，设定的类别个数为3，第一个类别对应的取值区间为[0,3]，第二个类别对应的取值区间为[4,10]，第三个类别对应的取值区间为[11,100]。对视频图像中的每一像素点，均可以按照前述方法计算出一个邻域差异的值，例如用diff表示邻域差异，如果diff＝5，则将该像素点分入第二类别或者说该像素点属于第二类别，如果diff＝15，则将该像素点分入第三类别或者说该像素点属于第三类别。这种方式根据像素点的邻域差异对视频帧中的像素点做了分类，这种分类下，类别的个数和类别与取值区间的对应关系是可以设定的，或者可以通过机器学习得到，仍然能够提升滤波的效果。每一类别对应的滤波系数可以通过算法计算，或者过经验设置，或者从设置好的多组滤波系数中通过滤波前后图像质量的增益选择出最优的一组。

在本公开另一示例性的实施例中，类别与取值区间的对应关系不是预先设定的，而是可以动态地择优选择。本实施例中，以视频帧为例，所述根据第一视频帧中像素点的邻域差异将所述第一视频帧中的像素点分成多个类别，包括：

将邻域差异的取值范围分成多个取值区间，确定所述第一视频图像中每一像素点的邻域差异的值所属的取值区间，将该像素点分入该取值区间对应的一个小类，所述小类的数量大于所述类别的数量；

遍历多种将小类合并为类别的方式，按照最优的合并方式将所述多个小类的像素点分入所述多个类别。

本公开实施例中，小类与邻域差异的取值区间之间关系是固定，通过动态择优的方式将小类合并为类别，可以实现类别与邻域差异的取值区间的自适应调整，达到最优的滤波效果。

在本实施例一示例性的实施例中，所述遍历多种将小类合并为类别的方式，按照最优的合并方式将所述多个小类的像素点分入所述多个类别，包括：

对所述多个小类进行第一轮的多次合并，每次按不同方式将其中的部分或全部小类合并为第一个类别，基于为该第一个类别生成的滤波系数对该第一个类别的像素点进行邻域滤波并计算增益，将增益最大且大于等于相应增益阈值的一次合并所合并小类的像素点分入该第一个类别，记录合并为该第一个类别的多个小类；

在前一轮次合并成功，已合并的轮次i小于设定的最大轮数且未合并的小类数量大于1的情况下，对未合并的多个小类进行第i+1轮的一次或多次合并，每次按不同方式将其中的部分或全部小类合并为第i+1个类别,基于为所述第i+1个类别生成的滤波系数对此次合并的小类中的像素点进行邻域滤波并计算增益，将增益最大且大于等于相应增益阈值的一次合并所合并小类的像素点分入所述第i+1个类别，记录合并为该第i+1个类别的多个小类。

在一个示例中，上述对小类合并的过程中，如果满足以下条件时可以结束整个合并过程：

在当前轮次，如果所有合并方式的增益均小于相应增益阈值的情况下，当前轮次不进行合并且结束整个合并过程；

在已合并的轮次等于设定的最大轮数或没有可以合并的小类时，结束整个合并过程；

整个合并过程结束如果还有未合并的小类，则将未合并的所有小类的像素点分入没有对应滤波系数的一个类别，在对第一视频帧进行邻域滤波时，该类别的像素点不参与滤波运算，像素值不需要更新。

在一个示例中，所述按不同方式将其中的部分或全部小类合并，包括：

遍历所有可能的合并方式，将其中的部分或全部小类合并，这是一种无约束的遍历方式，在小类的数量比较多时，会比较耗时，但找到最优的合并方式的可能性更大。

遍历满足约束条件时的可能的合并方式，将其中的部分或全部小类合并，所述约束条件包括以下一个或多个：

条件一，只能将队列中位置连续的多个小类合并；

条件二，每一轮合并时，先遍历队列位置最靠前的未合并小类与其他未合并小类之间可能的合并方式，如合并失败再遍历其他可能的合并方式或结束整个合并过程；

其中，所述队列指按照对应取值区间中的值从小到大的顺序将所述多个小类排列成的队列。

有约束的遍历可以利用实验过程中找到的规律性来提高运算效率。在基于一些数据的实验中，发现遍历时合并的小类在队伍中的位置连续时，使得相邻类别即diff相似的像素点共享滤波系数，才可能有更好的结果，这可以有效降低算法的时间复杂度。

在一个示例中，对该类别的像素点进行邻域滤波产生的增益可以用该类别像素点滤波后的图像质量相对滤波前的图像质量的增强表示，例如可以用滤波后的图像质量与滤波前的图像质量的差值表示。本申请一个类别像素点的图像质量可以通过将该类别所有像素点的集合视为一幅子图像，用该子图像的PSNR、结构相似性(Structural Similarity，简称SSIM)、或平均结构相似性(Mean Structural Similarity，简称MSSIM)等质量参数表示。

在一个示例中，所述每次合并计算的增益均是加权后的增益，权值等于此次合并的所有小类中像素点的总数与所述第一视频帧中像素点的总数的比值，这样能够更好地反映局部增益对整个视频帧的影响，以更好地达到提高视频帧整体的图像质量的目的。

在该示例中，不同轮次设置的增益阈值可以相同也可以不同。

在一个示例中，小类的数量可以预先设定，而类别的数量可能会随着视频帧数据的不同而有所变化，但对小类进行合并尝试的最大轮次是可以设定的。在该示例中，所述小类的数量大于等于8且小于等于20，所述最大轮数等于1或2或3或4。

在一个示例中，一个类别对应的滤波系数为所述加权平均使用的一组加权系数；或者

所述一组加权系数包括对称矩阵中的2N个系数，一个类别对应的滤波系数包括所述对称矩阵中主对角线一侧的N个系数，N≥1。

下面结合图6对本实施例上述小类合并的过程再简述一下，如图所示，该过程包括：

步骤310，按邻域差异的取值区间将像素点分入多个小类；

小类与邻域差异的取值区间之间的对应关系可以是固定的，也可以按照约定的某种规则动态计算，此时不同的视频帧计算出的对应关系可能是不同的。但编码端和解码端可以按照相同的规则得到相同的对应关系。

步骤320，判断是否已达到合并的最大轮次？如果是，结束，如果否，执行步骤330；

本实施例的轮次设置为3，但也可以设置为1或2或大于3的数值。

步骤330，遍历未合并小类可能的合并方式，计算每次合并得到的类别的滤波系数和滤波的增益；

步骤340，判断计算出的增益中是否有大于相应增益阈值的增益？如果是，执行步骤350，如果否，结束；

增益阈值可以设置为0，或者某个正值。不同的轮次的增益阈值可以相同或不同。如果已经找不到带来预期增益的合并方式，则无需合并，可以结束整个合并过程。

步骤350，记录增益最大的合并方式及其得到的滤波系数；

在需要满足合并小类在队列中位置连续这一约束条件的情况下，合并方式可以用首尾两个小类的索引表示。例如一共有12个小类，第0个小类对应的取值区间为0，第1个小类对应的取值区间为1，……，第10个小类对应的取值区间为10，第11个小类对应的取值区间是11以上的所有取值。假定第一轮增益最大且大于等于相应增益阈值的合并方式是将第0个小类至第5个小类合并，则该合并方式可以用合并的6个小类中第1个小类的索引“0”和最后一个小类的索引“5”表示，记录为0,5。在其他示例中，也可以记录第1个小类的索引“0”以及合并的小类的数量“6”，或者用位图的方式将一个12比特的位图的前6位置为1，后6位置为0。

记录的滤波系数可以用于本地对第一视频帧进行邻域滤波，也可以不在本地对第一视频帧进行邻域滤波，例如可以在编码端利用原始视频帧为重建视频帧生成最优的滤波系数，将该最优的滤波系数发送到解码端，用于解码端对重建视频帧的质量增强。

步骤360，将被合并的小类的序号从队列中去除，判断是否还有可以合并的小类？如果是，转入步骤320，记录增益最大的合并方式及其得到的滤波系数；如果否，结束。

一般来说，如果还有2个未合并的小类，判断为还有可以合并的小类。如果所有小类均已合并完成，判断为没有可以合并的小类。对于还有1个未合并的小类的情况，可以判断为还有可以合并的小类，在后续的处理中直接将该小类的像素点分入下一个类别，计算相应的滤波系数和增益，在增益大于阈值时记录该类别的滤波系数和该小类的索引信息。对于还有1个未合并的小类的情况，也可以判断为没有可以合并的小类，不对这个小类的像素点进行滤波。或者结合该小类的像素点的个数判断，在个数大于阈值时判断还有可以合并的小类，在个数小于阈值时判断没有可以合并的小类，等等。这里可以根据情况选择一种方式处理。

在本实施例一示例性的实施例中，

对视频图像序列中有损的第一视频图像，对其中一个第一视频图像通过小类合并的方式将所述多个小类的像素点分入所述多个类别后，对该第一视频图像后的第一个视频图像，采用与该第一视频图像相同的小类合并方式，将所述多个小类的像素点分入所述多个类别；或者

对视频图像序列中有损的第一视频图像，分别执行所述滤波系数生成方法。

本实施例对序列中相邻的视频图像，内容上通有较大的相似性，通过将前一视频图像的小类合并方式共享给后一视频图像，可以节省后一视频图像遍历合并方式和比较的时间，提高效率。对质量的影响较小。而每一视频图像都独立地进行小类合并，则滤波后通常会得到更好的质量增强效果。

本公开上述实施例的滤波系数生成方法和相应的视频滤波方法，针对像素点的邻域差异将像素点分成多个类别，每个类别的像素点用为该类别生成的滤波系数进行邻域滤波，充分地考虑到像素点邻域差异对邻域滤波的影响，可以显著提升滤波的效果。

本公开实施例的滤波系数生成方法和相应的视频滤波方法可以用于各种视频编解码***，用于对重建视频帧的滤波，提升图像质量。

以V-PCC***为例，V-PCC编解码框架如图7和图8所示。

图7示出了V-PCC编码端的视频编码装置的结构，该视频编码装置可实现以下视频编码处理：

3D patch(块)生成模块(3D patch generation)11基于输入的点云帧生成3D的patch后，分别输出到patch封装模块(patch packing)13、几何帧生成模块(Geometry image generation)19、纹理帧生成模块(Attribute image generation)15、patch序列压缩模块(Patch sequence compression)27以及平滑模块(Smoothing)17。Patch封装模块13对patch进行封装，生成占用图(Occupancy map)并输出到几何帧生成模块19和第一视频压缩(Video compression)模块21，第一视频压缩模块21对占用图进行压缩，输出经压缩的占用子流(occupancy sub stream)到多路复用器(Multiplexer)33，并输出重建占用图(Reconstructed occupancy map)到几何帧填充模块(image padding)23、纹理帧填充模块(image padding)25、纹理帧生成模块15和平滑模块17。几何帧生成模块19根据输入的占用图、3D patch和点云帧生成几何帧并输出到几何帧填充模块23，几何帧填充模块23根据输入的几何帧和重建占用图，输出已填充几何帧(Padded geometry)到第二视频压缩模块31，第二视频压缩模块31输出经压缩的几何子流(geometry sub stream)到多路复用器33，并输出重建几何帧(Reconstructed geometry image)到平滑模块17。平滑模块17根据重建占用图、3D patch对重建几何帧进行平滑处理，输出经平滑处理的重建几何帧到纹理帧生成模块15。纹理帧生成模块15根据输入的经平滑处理的重建几何帧、3D patch、重建占用图和点云帧生成纹理帧并输出到纹理帧填充模块25，纹理帧填充模块25输出已填充的纹理帧到第三视频压缩模块29。第三视频压缩模块29输出已压缩的纹理子流到多路复用器33。Patch序列压缩模块27则输出已压缩的Patch子流到多路复用器33。多路复用器33对输入的Patch子流、纹理子流、几何子流和占用子流进行复用后输出经压缩的码流(Compression bitstream)。

图8示出了V-PCC解码端的视频解码装置的结构。该视频解码装置可实现以下视频解码处理：

经压缩的码流经解多路复用器(Demultiplexer)41解复用，输出序列参数集(Sequence Paramater Set”，简称SPS)、Patch子流、纹理子流、几何子流和占用子流。SPS语法分析模块(SPS parsing)43对SPS进行语法分析后输出语法元素到Patch序列解压缩模块(Patch sequence decompression)45、第一视频解压缩模块(Video decompression)47、第二视频解压缩模块(Video decompression)49、第三视频解压缩模块(Video decompression)51、几何和纹理重建模块(Geometry/Attribute Reconstruction)53、几何后处理模块(Geometry Post-Processing(e.g.smoothing))55和纹理转换和平滑模块(Attribute transfer&smoothing)57。Patch序列解压缩模块45根据语法元素对输入的Patch子流解压缩，输出patch信息(patch information)到几何和纹理重建模块53。第一视频解压缩模块47根据语法元素对输入的占用子流解压缩，输出占用图到几何和纹理重建模块53。第二视频解压缩模块49根据语法元素对输入的几何子流解压缩，输出几何帧到几何和纹理重建模块53。第三视频解压缩模块51根据语法元素对输入的纹理子流解压缩，输出纹理帧到几何和纹理重建模块53。几何和纹理重建模块53根据输入的语法元素、patch信息、占用图、几何帧和纹理帧得到重建几何帧和重建纹理帧，将重建几何帧输出到几何后处理模块55，将重建纹理帧输出到纹理转换和平滑模块57。几何后处理模块55根据语法元素对重建几何帧进行平滑处理后输出到纹理转换和平滑模块57，纹理转换和平滑模块57根据输入的语法元素、纹理帧和经平滑处理的重建几何帧进行纹理转换和平滑，输出经平滑处理的重建点云帧。

V-PCC中存在对有损压缩后解码得到的视频帧(video)的多次平滑处理，例如在编码端，对重建几何帧的平滑处理，及对重建纹理帧的平滑处理(图中未示出)；又如在解码端，对重建几何帧的平滑处理和对重建点云的平滑处理。

对于纹理视频帧(Texture video/frame)，V-PCC针对在三维空间中非相邻的块(patch)在图像内可能非常临近，导致基于patch的视频编码器可能将相邻像素混淆使得重建伪影出现的问题，可以采用颜色平滑算法，在重建帧中利用占有图(Occupancy map)找到patch边界点对应的像素，然后利用中值滤波进行平滑处理。对于几何视频帧(Geometry video/frame)，V-PCC针对重建点云patch可能不连续的问题，可以采用边界滤波算法，找到patch边界点对应的像素，局部改变patch边缘的深度值。对于重建点云，针对patch不连续的问题，可以添加3D点，使边界连续。针对由于失真导致外点和噪点产生的问题，可以将重建点云网格化(grid)，利用网格的中心对patch边缘点进行三线性滤波，提升点云的视觉效果。

V-PCC编解码框架在对解码后视频帧进行基础性重建后，只进行了图像平滑操作，重建点云质量依然有较大的提升空间。为了进一步提升压缩性能，在码流大小变化不大的基础上得到质量增强的点云是有益的。

对图像进行维纳滤波可以增强图像的质量，但如上文所述，图像的维纳滤波存在着一些缺点，比如在滤波器阶数K一定的情况下，对于大尺度图像以及局部变化较为剧烈的图像，利用同一组系数进行滤波得到的质量增强的图像效果并不好；如果一味增大K的大小，滤波效果只有小幅度提升，同时在一定程度上会增加码流大小及时间复杂度，甚至使得综合性能更差。而更为常用的自适应环路滤波器，也是以维纳滤波为基础，将滤波器分为25个类别，计算图像中每个4×4小块的梯度方向和变化剧烈程度，据此确定该块的滤波器类别，计算系数并进行滤波。不过这种方法难以应用在编解码质量增强方面，因为没有专门针对V-PCC图像帧patch紧密排列、邻域变化大的特点，同时此方法需要传递的数据较多，码流开支大。

在2D图像的编解码方面也存在着类似的问题，这里不再赘述。

针对以上问题，本公开实施例基于邻域差域的视频滤波方法，提出了可以应用于各种视频编解码框架的视频编码方法和视频解码方法。

本公开一实施例提出一种视频编码方法，如图9所示，包括：

步骤410，按照本公开任一实施例所述的滤波系数生成方法，将第一视频图像中的像素点分成多个类别，为所述多个类别中的部分或全部类别分别生成对应的滤波系数，一个所述类别对应一组滤波系数；

步骤420，对滤波参数编码并发送，或者对所述滤波系数中符合发送条件的滤波参数编码并发送，其中，所述滤波参数包括所述滤波系数和类别信息。

本实施例在编码端按照前述滤波系数生成方法将像素点分类并得到各类别的滤波系数之后，将滤波参数编码发送。可以利用编码端的滤波系数，提升解码端的滤波效果，减轻解码端的运算量。特别在采用维纳滤波等算法时，可以利用编码端的原始视频图像计算出最优的滤波系数，使得解码端也可以利用该最优的滤波系数，对视频图像进行质量增强。

本实施例编码端生成的滤波系数可以直接发送或者先进行判决再有选择性的发送。因为发送滤波参数会增大码流，影响编码效率。

在本公开一示例性的实施例中，所述对所述滤波系数中符合发送条件的滤波参数编码并发送，包括：分组判断生成的滤波系数是否符合发送条件，将符合发送条件的每一组滤波系数及该组滤波系数对应的一个类别的信息进行编码并发送；

其中，所述发送条件包括以下条件中的任意一种或更多种：

对一组滤波系数，使用该组滤波系数对所述第一视频图像中对应类别的像素点进行邻域滤波，获得的增益大于相应的增益阈值；

对一组滤波系数，使用该组滤波系数对所述第一视频图像中对应类别的像素点进行邻域滤波时的率失真相对不进行所述邻域滤波时的率失真变小且变小的量大于相应的率失真增益阈值。

在通过小类合并为类别的情况下，上述发送条件中使用的增益阈值可以与合并过程中使用的增益阈值相同，也可以不同。例如，在发送条件中使用的增益阈值可以高于合并过程中使用的增益阈值。

率失真(distortion-rate)用于衡量图像失真度与编码码率二者之间的相互关系。其中的图像失真度可以采用原始图像与重建图像之间的PSNR来衡量，可以是亮度分量的PSNR，或者亮度分量的PSNR与色度分量的PSNR的线性组合。编码码率表示基于选取的编码参数、量化参数、预测模式最终所需传输的总体编码数据的多少。率失真可以通过代价函数计算得到，率失真越小，表示编码器的编码效率越高。上述率失真增益阈值可以设置为0，或大于0的某个数值。所述变小的量即不进行所述邻域滤波时的率失真减去进行邻域滤波时的率失真得到的差。

在本公开一示例性的实施例中，所述将符合发送条件的每一组滤波系数及该组滤波系数对应的一个类别的信息进行编码，包括：在每一组滤波系数及该组滤波系数对应的一个类别的信息前增加一个标志，用于指示是否存在类别信息和滤波系数。在一示例中，至少一个所述类别的信息用合并为该类别的多个小类的索引信息表示，每一个小类对应于一个约定的邻域差异的取值区间。上文已经给出示例，这里不再赘述。

因为本实施例的滤波系数是与类别对应的，因此需要在传输滤波系数的同时传输与其对应的类别信息。因为不满足发送条件或合并成的类别数量是变化的，实际传输的滤波系数的组数也是可变的，部分组或全部组的滤波系数可能为空，所以可以为每一组滤波系数设置一个标志位，来指示是否存在类别的信息和滤波系数。编码端和解码端可以约定一个最多可以传输的组数，例如可设置为前述的最大轮数。

在本公开一示例性的实施例中，所述视频编码方法应用于基于视频的点云压缩***的编码端。

依据V-PCC的编码过程，对于每一帧输入点云，在编码前都会被划分成一块块patch，patch间紧密排列，并映射到远层和近层两幅单通道图像上，即生成几何视频帧(Geometry video)；而每个patch的纹理信息则会映射到两幅三通道图像上，即生成纹理视频帧(Attribute video)；每帧中两幅几何/纹理图像差距很小。占用图(Occupancy map)用来表示视频(video)中有用像素的占用情况。在V-PCC几何编码部分，生成的信号包括重建几何视频帧(有损)、原始几何视频帧(无损)。编码端输出的经压缩的码流中包括写有编码信息的几何码流。

本实施例中，考虑到几何视频帧背景为黑色，而一些几何视频帧中前景的一块块patch灰度分布不均匀，且在与背景交界处亮度变化极为剧烈，如图10所示，如果采用传统的维纳滤波方法，整个几何视频帧使用一组滤波系数并进行滤波，效果很难达到预期。经过测试，如果采用k＝25的滤波器直接进行维纳滤波，图像的峰值信噪比(peak signal to noise ratio,简称PSNR)甚至会下降0.05dB左右。这是由于没有充分考虑到在几何视频帧中每个像素点之间邻域差异较大的特点。因此可以使用本公开实施例基于邻域差异的自适应维纳滤波方法对重建几何视频帧进行滤波，以提升重建几何视频帧的质量。

本实施例中，所述第一视频帧包括有损的重建几何视频帧；

所述视频编码方法在生成滤波系数之后，还包括：对所述重建几何视频帧进行邻域滤波，将滤波后的重建几何视频帧用于对应的纹理视频帧的生成；其中，对所述重建几何视频帧进行邻域滤波时，所述重建几何视频帧中有对应滤波系数的每一类别的像素点使用该类别对应的一组滤波系数进行滤波。

为了执行本实施例的视频编码方法，可以在V-PCC编码端增加一个维纳滤波装置，图11示出了相关的局部架构。如图所示，本实施例在编码装置中增加了一个维纳滤波模块35，也可以称为维纳滤波器。该维纳滤波模块35接收从平滑模块17输出的经平滑处理的重建几何视频帧(简称为重建几何帧)，以及从几何帧填充模块23(或几何帧生成模块19)输出的原始几何视频帧(简称为原始几何帧)。对所述重建几何视频帧进行维纳滤波，滤波后的重建几何视频帧输出到纹理帧生成模块15，用于对应的纹理视频帧的生成。经维纳滤波后，重建几何视频帧的质量得到增强，这也能够使得生成的纹理视频帧的质量得到提升。在本实施例中，维纳滤波模块35同样可以记录生成的滤波系数，编码后随几何视频帧数据一起发送，或者作为语法元素发送。

图12是可以执行本实施例视频编码方法的另一种示例性的架构。如图所示。本示例中，增加的维纳滤波模块35接收从第二视频压缩模块31输出的重建几何视频帧，以及从几何帧填充模块23(或几何帧生成模块19)输出的原始几何视频帧。滤波后的重建几何视频帧输出到平滑模块17。也可以达到与图11架构类似的效果。

在其他示例中，也可以取消平滑模块17，维纳滤波模块35接收从第二视频压缩模块31输出的重建几何视频帧，以及从几何帧填充模块23输出的原始几何视频帧。滤波后的重建几何视频帧输出到纹理帧生成模块15。

容易理解，在本公开另一示例性的实施例中，也可以采用本实施例的维纳滤波方法对重建纹理视频帧进行滤波，生成相应的滤波系数并编码和发送。这里不再赘述。

在本公开一示例性的实施例中，所述视频编码方法应用于基于视频的点云压缩***的编码端，所述邻域滤波为维纳滤波；所述第一视频图像包括重建几何视频图像；或者，所述第一视频图像包括重建纹理视频图像。在本实施例编码端可以只生成滤波系数而进行维纳滤波，该滤波系数编码后发送到解码端，用于解码端重建几何视频图像和/或重建纹理视频图像的质量增强。

在本公开一示例性的实施例中，所述第一视频图像包括点云帧映射成的两幅重建视频图像；

所述视频编码方法还包括：对同一点云帧映射成的两幅重建视频图像，按照如本公开进行小类合并的任一实施例所述的滤波系数生成方法为第一幅重建视频图像生成滤波系数后，在为第二幅重建视频图像生成滤波系数时，对第二幅重建视频图像的像素点划分小类后，采用与第一幅重建视频图像相同的小类合并方式，将所述多个小类的像素点分入所述多个类别；其中，所述重建视频图像包括有损的几何视频图像或纹理视频图像。因为同一点云帧映射成的两幅重建视频图像，共享合并方式可以提高编码速度和效果，对质量的影响可控。

在本公开一示例性的实施例中，所述视频编码方法同样可应用于处理二维视频图像的视频编解码***，例如。H.264/AVC、H.265/HEVC、VVC/H.266及其他类似标准的视频编解码***。

如图13所示，一种传统的视频编码装置1000包含预测处理单元1100、划分单元1101、残差产生单元1102、变换处理单元1104、量化单元1106、反量化单元1108、反变换处理单元1110、重建单元1112、滤波器单元1113、已解码图片缓冲器1114、图像分辨率调整单元1115，以及熵编码单元1116。预测处理单元1100包含帧间预测处理单元121和帧内预测处理单元1126。在其他实施例中，视频编码器20可以包含比该示例更多、更少或不同功能组件。

划分单元1101与预测处理单元1100配合将接收的视频数据划分为切片(Slice)、CTU或其它较大的单元。划分单元1101接收的视频数据可以是包括I帧、P帧或B帧等视频帧的视频序列。

预测处理单元1100可以将CTU划分为CU，对CU执行帧内预测编码或帧间预测编码。对CU做帧内预测和帧间预测时，可以将CU划分为一个或多个预测单元(PU：prediction unit)。

帧间预测处理单元1121可对PU执行帧间预测，产生PU的预测数据，所述预测数据包括PU的预测块、PU的运动信息和各种语法元素。

帧内预测处理单元1126可对PU执行帧内预测，产生PU的预测数据。PU的预测数据可包含PU的预测块和各种语法元素。

残差产生单元1102可基于CU的原始块减去CU划分的PU的预测块，产生CU的残差块。

变换处理单元1104可将CU划分为一个或多个变换单元(TU：Transform Unit)，TU关联的残差块是CU的残差块划分得到的子块。通过将一种或多种变换应用于TU关联的残差块来产生TU关联的系数块。

量化单元1106可基于选定的量化参数对系数块中的系数进行量化，通过调整QP值可以调整对系数块的量化程度。

反量化单元1108和反变换单元1110可分别将反量化和反变换应用于系数块，得到TU关联的重建残差块。

重建单元1112可将所述重建残差块和预测处理单元1100产生的预测块相加，产生CU的重建块。

滤波器单元1113对所述重建块执行环路滤波后，将其存储在已解码图片缓冲器1114中作为参考图像。帧内预测处理单元1126可以从已解码图片缓冲器1114中提取PU邻近的块的参考图像以执行帧内预测。帧间预测处理单元1121可使用已解码图片缓冲器1114缓存的上一帧的参考图像对当前帧图像的PU执行帧间预测。

图像分辨率调整单元1115对已解码图片缓冲器1114中存储的参考图像进行重采样，可以包括上采样和/或下采样，得到多种分辨率的参考图像保存在已解码图片缓冲器1114中。

熵编码单元1116可以对接收的数据(如语法元素、量化后的***块、运动信息等)执行熵编码操作。

将本公开实施例的视频编码方法应用于图13所示的编码架构时，在一个示例中，可以在图中的滤波器单元1113和已解码图片缓冲器1114之间增加一个维纳滤波单元1128，此时断开滤波器单元1113到已解码图片缓冲器1114的输出。该维纳滤波单元接收滤波器单元1113输出的已滤波的重建视频图像(可以是相应标准中规定的任何规格的视频图像)，并且从划分单元1101获取相应的原始视频图像，对重建视频信号进行维纳滤波，滤波后的重建视频图像输出到已解码图像缓冲器1114保存。类似的，在其他示例中，该维纳滤波单元1128也可以设置在滤波器单元1113之前，接收加法器1112输出的重建视频图像以及划分单元1101输出的原始视频图像，对重建视频图像进行维纳滤波后输出到滤波器单元1113，或者该维纳滤波单元1128可以集成在滤波器单元1113中，或者替代滤波器单元1113。

本公开一实施例还提供了一种码流，其中，所述码流为已编码视频码流，所述码流中包括已编码的滤波参数，所述滤波参数包括用于对第一视频图像进行邻域滤波的滤波系数。

本实施例在已编码视频码流中携带用于对第一视频图像进行邻域滤波的滤波参数，可以将编码端得到的最优的滤波系数传输到解码端，用于对视频图像的增强，提升重建视频图像的质量。

在本公开一示例性的实施例中，所述已编码的滤波参数包括一个或多个信息单元，每个所述信息单元包括以下子单元：

标志子单元，设置为指示是否存在滤波系数和类别信息；

索引子单元，设置为写入一个类别的信息，或为空，其中该类别的信息用该类别的索引信息或者合并为该类别的多个小类的索引信息表示；

系数子单元，设置为写入一组滤波系数，或为空；其中，所述索引子单元中的类别是该组滤波系数对应的类别。

通过上述数据格式传递滤波参数，可以使得编码端具有足够的编码灵活性，可以根据情况发送或不发送部分乃至全部的滤波系数，从而保证获得较高的编码效率。而解码端通过对标志的解析，可以快速、正确读取到所需要的滤波参数。

在本公开一示例性的实施例中，所述码流是基于视频的点云压缩***的编码端发送的码流，所述第一视频图像包括重建视频图像；

所述已编码的滤波参数携带在视频图像数据流中，位于几何码流中的分隔符之后和所述重建视频图像的数据之前，其中，所述重建视频图像包括有损的重建几何视频图像或重建纹理视频图像；或者

所述已编码的滤波参数携带在码流的序列参数集中。

本公开一实施例还提供了一种视频解码方法，如图14所示，包括：

步骤510，解码码流，确定第一视频图像的滤波参数，所述滤波参数包括滤波系数；

步骤520，根据所述滤波参数对所述第一视频图像进行邻域滤波。

本实施例从码流中解析出编码端发送的滤波系数，用于对解码得到的所述第一视频图像进行邻域滤波，可以减轻解码端的运算负担。而且编码端在存在原始视频图像的情况下，更容易生成最优的滤波系数，从而使得解码端的滤波效果更好。

本公开一示例性的实施例中，所述滤波参数包括一组或多组滤波系数，以及其中每一组滤波系数对应的一个类别的信息；其中，所述一个类别是根据所述第一视频图像中像素点的邻域差异将所述第一视频图像中的像素点分成的多个类别中的一个，所述一个类别对应所述邻域差异的一个或多个取值区间。此处限定所述滤波参数包括一组或多组滤波系数，是限定滤波参数的内容。但并不表示相应的解码装置对所有视频图像都必须收到有效的滤波系数和类别信息，解码装置也可能没有收到任何的滤波系数和类别信息，或者只收到表示不存在滤波系数和类别信息的标志。

本公开一示例性的实施例中，所述第一视频图像中一个像素点的邻域差异根据该像素点的像素值与该像素点邻域中每一像素点的像素值之差的绝对值统计得到，所述统计为求和、求均值或者求最大值；或者，所述第一视频图像中一个像素点的邻域差异根据该像素点及该像素点邻域中像素点的像素值之间的差异确定；其中，该像素点邻域指该像素点的八邻域或四邻域或对角邻域。关于领域差异如何计算可参见上文。

本公开一示例性的实施例中，所述解码码流，确定第一视频图像的滤波参数，包括：

对码流中携带所述滤波参数的一个或多个信息单元分别解析，对每一个所述信息单元，先读取1位标志，如该标志的值表示存在滤波系数和类别信息，再读取一组滤波系数和该组滤波系数对应的一个类别的信息。如该标志的值表示不存在滤波系数和类别信息，则继续读取后续的其他信息单元。这种解析方式是基于信息单元的标志+类别信息+滤波系数的数据格式，具体可参见本公开实施例关于码流的说明。

所述类别的信息可以为类别的索引信息，

在本公开一示例性的实施例中，根据所述滤波参数所述第一视频图像进行邻域滤波，包括：对解析出的每一组滤波系数，根据该组滤波系数对应的该类别的信息确定该类别对应的邻域差异的取值区间，对所述第一视频图像进行邻域滤波时，所述第一视频图像中邻域差异的值属于所述取值区间的像素点使用该组滤波系数进行滤波。

在本公开一示例性的实施例中，至少一个所述类别的信息包括合并为该类别的多个小类的索引信息，每一小类对应一个约定的邻域差异的取值区间；每一所述类别对应的邻域差异的取值区间是合并为该类别的多个小类对应的取值区间的并集。

在本公开一示例性的实施例中，所述视频解码方法应用于基于视频的点云压缩***的解码端；

所述第一视频图像包括有损的重建几何视频图像，对所述重建几何视频图像进行邻域滤波后，所述视频解码方法还包括：将滤波后的重建几何视频图像用于对应的纹理视频图像的质量增强；或者

所述第一视频图像包括有损的重建纹理视频帧。

在V-PCC***的解码端执行本公开实施例的视频解码方法，在一个示例中，可以采用如图15所示的视频解码装置，该视频解码装置在原有架构中增加了一个维纳滤波模块59，该维纳滤波模块59接收几何后处理模块55输出的重建几何视频帧，根据解析出的滤波参数对所述重建几何视频帧进行滤波，维纳滤波后的重建几何视频帧再送入纹理转换和平滑模块57用于生成重建点云。所述滤波参数可以从SPS语法分析模块43中获取，也可以从几何子流中解析得到，如可以由第二视频解压缩模块49解析出所述滤波参数再输出到维纳滤波模块59。在另一示例中，也可以将维纳滤波模块59设置在几何和纹理重建模块53和几何后处理模块55之间，或者与几何后处理模块55集成在一起，或者替代原来的几何后处理模块55。本实施例的所述滤波参数包括一组或多组滤波系数，以及其中每一组滤波系数对应的一个类别的信息。

在本公开一示例性的实施例中，所述视频解码方法同样可应用于处理二维视频图像的视频编解码***，例如。H.264/AVC、H.265/HEVC、VVC/H.266及其他类似标准的视频编解码***。所述邻域滤波为维纳滤波；所述第一视频图像包括重建视频图像。

如图15所示，一种传统的视频解码装置101包含熵解码单元150、预测处理单元152、反量化单元154、反变换处理单元156、重建单元158(图中用带加号的圆圈表示)、滤波器单元159，以及图片缓冲器160。在其它实施例中，视频解码器30可以包含更多、更少或不同的功能组件。

熵解码单元150可对接收的码流进行熵解码，提取语法元素、量化后的系数块和PU的运动信息等信息。预测处理单元152、反量化单元154、反变换处理单元156、重建单元158以及滤波器单元159均可基于从码流提取的语法元素来执行相应的操作。

作为执行重建操作的功能组件，反量化单元154可对量化后的TU关联的系数块进行反量化。反变换处理单元156可将一种或多种反变换应用于反量化后的系数块以便产生TU的重建残差块。

预测处理单元152包含帧间预测处理单元162和帧内预测处理单元164。如果PU使用帧内预测编码，帧内预测处理单元164可基于从码流解析出的语法元素确定PU的帧内预测模式，根据确定的帧内预测模式和从图片缓冲器件60获取的PU邻近的已重建参考信息执行帧内预测，产生PU的预测块。如果PU使用帧间预测编码，帧间预测处理单元162可基于PU的运动信息和相应的语法元素来确定PU的一个或多个参考块，基于所述参考块来产生PU的预测块。

重建单元158可基于TU关联的重建残差块和预测处理单元152产生的PU的预测块(即帧内预测数据或帧间预测数据)，得到CU的重建块。

滤波器单元159可对CU的重建块执行环路滤波，得到重建的图片。重建的图片存储在图片缓冲器160中。图片缓冲器160可提供参考图片以用于后续运动补偿、帧内预测、帧间预测等，也可将重建的视频数据作为已解码视频数据输出，在显示装置上的呈现。

上述显示器105例如可以是液晶显示器、等离子显示器、有机发光二极管显示器或其它类型的显示装置。在其他示例中，解码端也可以不包含显示器105，而是包含可应用解码后数据的其他装置。

将本公开实施例的视频解码方法应用于该视频解码装置时，如图16所示，需要增加维纳滤波单元166，此时断开滤波器单元159到图片缓冲器160的输出。如图16的虚线所示，可以在图中的滤波器单元159和图片缓冲器160之间增加一个维纳滤波单元166，该维纳滤波单元接收滤波器单元159输出的经滤波的重建视频图像(可以是相应标准中规定的任何视频图像)，并且从熵编码单元150接收解析得到的滤波参数(包括滤波系数和类别信息)，对所述重建视频图像进行维纳滤波，滤波后的重建视频信号保存在图片缓冲器160。在其他示例中，该维纳滤波单元也可以设置在滤波器单元159之前接收加法器158输出的重建视频图像，对重建视频图像进行维纳滤波后输出滤波器单元159，或者该维纳滤波单元可以集成在滤波器单元159中，或者替代滤波器单元159。本实施例的所述滤波参数包括一组或多组滤波系数，以及其中每一组滤波系数对应的一个类别的信息。

本公开上述实施例的视频编码装置和/或视频解码装置可使用以下电路中的任意一种或者以下电路的任意组合来实现：一个或多个微处理器、数字信号处理器、专用集成电路、现场可编程门阵列、离散逻辑、硬件。如果部分地以软件来实施本公开，那么可将用于软件的指令存储在合适的非易失性计算机可读存储媒体中，且可使用一个或多个处理器在硬件中执行所述指令从而实施本公开实施例的方法。

本公开一实施例提供了一种视频编码装置，应用于基于视频的点云压缩***，参见图11和图12，包括纹理帧生成模块，以及依次连接的几何帧生成模块、几何帧填充模块和几何帧视频压缩模块(对应于图11和图12中的第二视频压缩模块31)，其中，还包括：维纳滤波模块，设置为接收所述几何帧视频压缩模块输出的重建几何视频帧，及所述几何帧生成模块或几何帧填充模块输出的原始几何视频帧，执行如本公开对重建几何视频帧进行维纳滤波的实施例所述的视频编码方法，输出滤波后的重建几何视频帧到所述纹理帧生成模块。需要说明的是，维纳滤波模块接收所述几何帧视频压缩模块输出的重建几何视频帧，可以是几何帧视频压缩模块直接或间接输出给维纳滤波模块(如中间经过平滑模块)，而维纳滤波模块输出滤波后的重建几何视频帧到所述纹理帧生成模块，也可以是直接或间接输出到纹理帧生成模块(如中间经过平滑模块)。

本公开一实施例还提供了一种视频编码装置，如图22所示，包括处理器5以及存储有计算机程序的存储器6，其中，所述处理器5执行所述计算机程序时实现如本公开任一实施例所述的视频编码方法。

本公开一实施例还提供了一种视频解码装置，包括几何帧重建模块和纹理转换模块，参见图15，还包括：

维纳滤波模块，设置为接收所述几何帧重建模块输出的重建几何视频帧，及从码流中解析得到的滤波参数，执行如本公开任一实施例所述的视频解码方法，输出滤波后的重建几何视频帧到所述纹理转换模块。

本实施例所述的几何帧重建模块可以集成在图15中的几何和纹理重建模块53中，几何帧重建模块输出的重建几何视频帧可以直接或间接输出到所述维纳滤波模块(或叫维纳滤波器，其他实施例同此)。本实施例所述的纹理转换模块可以集成在图15中的纹理转换和平滑模块57中，维纳滤波模块滤波后的重建几何视频帧可以直接或间接地输出到纹理转换模块。

本公开一实施例还提供了一种视频编解码***，包括如本公开任一实施例所述的视频编码装置和如本公开任一实施例所述的视频解码装置。

上述视频编码装置和解码装置中的处理器可以是通用处理器，包括中央处理器 (Central Processing Unit，简称CPU)、网络处理器(Network Processor，简称NP)等；还可以是数字信号处理器(DSP)、专用集成电路(ASIC)、现成可编程门阵列(FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本发明实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。

本公开一实施例还提供了一种针对V-PCC重建几何帧进行基于邻域差异的自适应维纳滤波的方法，以达到增强点云质量及主观效果的目的。本实施例提出在编解码端依据数据及滤波效果设置一个或多个维纳滤波器，编码端通过计算得到最优的滤波系数并传递到解码端，解码端解码出所述最优的滤波系数后对点云重建几何帧做后处理。本实施例针对的是V-PCC几何有损、属性有损的编码方式。

在编码端操作如下：

依据V-PCC的编码过程，对于每一帧输入点云，在编码前都会被划分成一块块patch，patch间紧密排列，并映射到远层和近层两幅单通道图像上，即生成Geometry video；而每个patch的纹理信息则会映射到两幅三通道图像上，即生成Attribute video；每帧中两幅几何/纹理图像差距很小。Occupancy map用来表示video中有用像素的占用情况。在V-PCC几何编码部分，我们可以获得重建(有损)几何视频帧与原始(无损)几何视频帧，同时得到写有编码信息的几何码流。

本实施例中，考虑到几何视频帧背景为黑色，而前景即一块块patch灰度分布不均匀，且在与背景交界处亮度变化极为剧烈，提出了基于邻域差异的自适应维纳滤波技术。如果采用传统的维纳滤波方法，整幅图像计算一组最优系数并进行滤波，效果很难达到预期。实际上，经过测试，如果采用k＝25的滤波器直接进行维纳滤波，图像PSNR甚至会下降0.05dB左右。这是由于没有充分考虑到在几何视频帧中每个像素点之间邻域差异较大的特点。

基于此，该实施例计算了每个像素点与其八邻域每个点像素值差的绝对值的和，记为diff，并利用该值进行分类。在实际测试中，将diff限制在0～11范围内(大于11的取值11)，即共分为12个小类，并进行最佳组合点(即最佳合并方式)的寻找，从该12小类中组合出3个类别。最佳合并方式的确定参见图6及相应说明。

在本实施例中，遍历的合并方式中用于合并的小类对应的diff值都是相邻的，基于测试显示，相邻的类别在共享滤波系数时有更好的结果，也能有效降低时间复杂度；同时，在计算每种合并方式的最大增益时，对PSNR增加值表示的增益进行加权后再比较，因为不同合并方式下合并成的类别中的像素点的数目不同，当点数多时，PSNR提升更难，且对整幅图像的质量增强贡献更大，因此利用当前合并方式得到的类别中像素点的数量与整幅图像分辨率大小的比值作为权重对增益进行加权。

本实施例对每一视频帧(即每幅图像)设置的合并的最大轮次为3，最多可以生成三组滤波系数，三组滤波系数对应的3个类别不一定覆盖视频帧中所有的像素点，余下的像素点可以视为一个没有对应滤波系数、不需要滤波的类别。且后续需要判断基于每一类别的滤波系数对该类别像素点进行维纳滤波是否会带来整体性能的提升，如果不能，可以不传递所有的滤波系数。实际测试证明，大多数几何视频帧图像仅对第一个类别的像素点滤波会带来正增益，也即只需要传递第一组滤波系数与合并方式的信息(即对应的类别的信息)；少数情况下，对前两个类别的像素点按照各自的滤波系数进行滤波都有增益。本实施例设置三个类别，可以最大程度保证质量提升的可能性。

考虑到每个点云帧会生成两张几何视频帧(Geometry video)，而这两张图像的差异极小，因此本实施例提出了两幅图像共享最佳合并方式的方法：第二张图像计算出差异值diff后，不再进行合并方式的遍历，而是直接利用前一张图像帧保存的合并方式信息进行像素点的组合并进行后续操作。实验证明，该方法能有效降低时间复杂度，同时最后的性能与原方法几乎没有差别。

在一示例中，得到三个类别的重建像素点集以及对应的原始像素点集后，可以对每个类别的像素点进行维纳滤波操作。相较于原始的矩形框滤波器，本实施例中改变了滤波器形状，采用了菱形滤波器，这样可以更有效地提取邻域信息。本实施例中采用k阶滤波器，k＝25。

对于具有对应的一组滤波系数的类别下的像素点，该实施例会计算滤波后这些像素点与原始点的PSNR以及率失真性能，并与滤波前相比较。其中利用代价函数来进行率失真的权衡：

J＝D+λ×R

其中，D是原始点集(原始像素点集)与重建点集(不滤波时的重建像素点集)或滤波点集(滤波后的重建像素点集)的SSE，即对应点误差的平方和；λ是与量化参数QP有关的量，该方案中取

R为比特流大小。如果滤波后的代价J _f小于不滤波时的重建点集的代价J _r，则该组的标志设为1，保存该组系数和最佳的合并方式(或称组合点)；否则标志设为0，不保存其余信息。

最后，将需要传递至解码端的信息写入码流。具体写入码流的步骤如下：在H.264编码框架中，常用0x00 00 00 01作为分隔符，用于开始一段新的编码，之后便是NALU(网络抽象层单元)，即帧数据信息。在V-PCC几何视频帧编码中，可以得到几何码流(也称为几何子流)数据，也即从分隔符开始的信息，因此可以将本实施例所需要传递的滤波系数相关的数据写入码流中分隔符之后的位置，完成后再将原有数据写入。在解码端读取码流时，由于分隔符的存在，可以正确定位，之后从第五个字节开始读取滤波系数相关的数据，即可得到编码端传递的滤波参数；读取完滤波系数相关的数据后，再将后续的几何码流数据恢复即可。

编码端需写入的数据为：对于每一视频帧的每一类别，首先写入标志(bool类型)；如果标志为0，则不再继续写入；如果标志为1，则写入最佳的合并方式也即类别的信息(char类型)，并写入k个滤波器系数(转化为int类型)。类别的信息可以用小类的索引表示，在队列中位置连接的多个小类可以用第一个小类的索引和最后一个小类的索引表示即可。实验证明，本实施例的系数传递方法是可行的，在解码端并没有信息的丢失。

在解码端操作如下：

由于编码端滤波器所传递的滤波系数的相关数据在几何视频帧数据之前，V-PCC解码定位到几何码流后，先从第五位起按照编码端的格式读取维纳滤波标志、类别的信息及一组滤波系数，之后恢复原始码流，继续V-PCC解码操作，得到重建几何视频帧，将重建几何视频帧与滤波参数传递至维纳滤波器。

根据码流中解析得到的标志可判断出每一帧中哪些类别的像素点需要滤波，将需要滤波的像素点按照类别的信息(如小类的合并方式)分入各自的类别，利用各类别对应的滤波器系数分别进行滤波，并将滤波后的像素值替换重建点云对应的像素点的像素值；所有帧的滤波完毕后，即得到质量增强的几何视频帧。之后返回V-PCC程序。由于几何视频帧的优化，可以使得重建点云中点的位置与真实值更为接近，从而提升整个点云的质量，同时有更好的主观效果。

本实施例提出的方法在V-PCC参考软件TMC2V14.0上实现后，在CTC-C2测试条件下对MPEG的测试序列的前32帧进行了测试(cat2-A&cat2-B&cat2-C)，采用C2编码方式，几何有损-属性有损(帧内)。测试结果的截图如图17和图18所示。图中BD-Rate就是衡量压缩率的一个指标，在相同PSNR下所用的码流对比。D1是点到点的PSNR，D2是点到平面的PSNR。Geom.BD-TotGeomRate是几何PSNR相对于几何码流的BD-Rate，End-to-End BD-AttrRate是端到端属性PSNR相对于属性码流的BD-Rate，Geom.BD-TotalRate是几何PSNR相对于总码流的BD-Rate，End-to-End BD-TotalRate是端到端属性PSNR相对于总码流的BD-Rate。

图17和图18中示出了CTC_C2上每个序列的测试结果，图17和图18下面几行均表示CTC_C2上测试的平均增益，其中，图17所示的BD-TotalRate是几何或纹理质量提升相对于整体码流来看，总的压缩率提升；图18所示是几何质量提升针对几何码流，纹理质量提升针对纹理码流，各自的压缩率提升。从图中可以看出，相较于原始程序，经过几何视频帧自适应维纳滤波后，点云的质量有了较大的提升，同时压缩效率进一步增加，BD-Rate有显著降低。从几何或颜色属性质量相对于整体码流大小来看(即BD-TotalRate)，颜色属性的压缩率变化不大，而几何属性有了很大的提升。从二者相对于各自码流大小来看，颜色属性的BD-Rate也有少量的降低，这是几何质量提升而对颜色编码与重建产生的有益影响；Cat2-C序列几何增益依旧可观，说明该算法对于重建质量较高的点云质量提升效果更为明显。

本实施例同样可以明显提升重建点云的主观质量。图19、图20和图21展示了在R1码率下，点云序列redandblack_vox10_1450.ply质量增强前后效果对比图。其中图19为原始点云(Ground Truth)，图20为重建点云，图21为进行几何视频帧质量增强后的点云。从图片中可以明显看出，几何视频帧进行基于邻域差异的自适应维纳滤波后，得到的点云相对于重建点云，边界轮廓更为平滑，部分离群点也回到了正确的位置，给人以更好的主观感受。

本实施例提出的V-PCC点云后处理质量增强方法，采用了基于邻域差异的自适应维纳滤波算法，至少具有以下特点：

针对几何视频帧图像中Patch与背景交界处变化较大的特点，不再进行全图像的维纳滤波，而是先计算每个像素点的八邻域总差异，根据差异值大小进行小类的划分。

进一步合并和分类，将共享滤波器参数后质量提升最多像素点的组合成大的类别，共分成三个类别，依次进行维纳滤波并得到三组滤波系数。

滤波系数等信息是否传递到解码端，是依据率失真指标等来确定，当滤波系数、合并方式等数据的码流代价大于质量提升的效果时，不进行滤波系数的传递。

滤波器形状采用菱形，以更有效率地提取邻域信息。

基于同一点云帧中远近层图像差异极小的特点，第二帧图像的最佳合并方式不再重新计算，而是直接确定为与第一帧图像相同，保证效果的同时可以减少时间复杂度。这里的第一帧图像和第二帧图像可以是几何视频帧，也可以是纹理视频帧，均包含近层和远层的两帧图像。

依据H.264编码特点，提出了将额外的数据写入码流的一种方式。

在一个或多个示例性实施例中，所描述的功能可以硬件、软件、固件或其任一组合来实施。如果以软件实施，那么功能可作为一个或多个指令或代码存储在计算机可读介质上或经由计算机可读介质传输，且由基于硬件的处理单元执行。计算机可读介质可包含对应于例如数据存储介质等有形介质的计算机可读存储介质，或包含促进计算机程序例如根据通信协议从一处传送到另一处的任何介质的通信介质。以此方式，计算机可读介质通常可对应于非暂时性的有形计算机可读存储介质或例如信号或载波等通信介质。数据存储介质可为可由一个或多个计算机或者一个或多个处理器存取以检索用于实施本公开中描述的技术的指令、代码和/或数据结构的任何可用介质。计算机程序产品可包含计算机可读介质。

举例来说且并非限制，此类计算机可读存储介质可包括RAM、ROM、EEPROM、CD-ROM或其它光盘存储装置、磁盘存储装置或其它磁性存储装置、快闪存储器或可用来以指令或数据结构的形式存储所要程序代码且可由计算机存取的任何其它介质。而且，还可以将任何连接称作计算机可读介质举例来说，如果使用同轴电缆、光纤电缆、双绞线、数字订户线(DSL)或例如红外线、无线电及微波等无线技术从网站、服务器或其它远程源传输指令，则同轴电缆、光纤电缆、双纹线、DSL或例如红外线、无线电及微波等无线技术包含于介质的定义中。然而应了解，计算机可读存储介质和数据存储介质不包含连接、载波、信号或其它瞬时(瞬态)介质，而是针对非瞬时有形存储介质。如本文中所使用，磁盘及光盘包含压缩光盘(CD)、激光光盘、光学光盘、数字多功能光盘(DVD)、软磁盘或蓝光光盘等，其中磁盘通常以磁性方式再生数据，而光盘使用激光以光学方式再生数据。上文的组合也应包含在计算机可读介质的范围内。

可由例如一个或多个数字信号理器(DSP)、通用微处理器、专用集成电路(ASIC)现场可编程逻辑阵列(FPGA)或其它等效集成或离散逻辑电路等一个或多个处理器来执行指令。因此，如本文中所使用的术语“处理器”可指上述结构或适合于实施本文中所描述的技术的任一其它结构中的任一者。另外，在一些方面中，本文描述的功能性可提供于经配置以用于编码和解码的专用硬件和/或软件模块内，或并入在组合式编解码器中。并且，可将所述技术完全实施于一个或多个电路或逻辑元件中。

本公开实施例的技术方案可在广泛多种装置或设备中实施，包含无线手机、集成电路(IC)或一组IC(例如，芯片组)。本公开实施例中描各种组件、模块或单元以强调经配置以执行所描述的技术的装置的功能方面，但不一定需要通过不同硬件单元来实现。而是，如上所述，各种单元可在编解码器硬件单元中组合或由互操作硬件单元(包含如上所述的一个或多个处理器)的集合结合合适软件和/或固件来提供。

Claims

一种视频解码方法，包括：

解码码流，确定第一视频图像的滤波参数，所述滤波参数包括滤波系数；

根据所述滤波参数对所述第一视频图像进行邻域滤波。
根据权利要求1所述的视频解码方法，其中：

所述滤波参数包括一组或多组滤波系数，以及其中每一组滤波系数对应的一个类别的信息；其中，所述一个类别是根据所述第一视频图像中像素点的邻域差异将所述第一视频图像中的像素点分成的多个类别中的一个，所述一个类别对应所述邻域差异的一个或多个取值区间。
根据权利要求1所述的视频解码方法，其中：

所述邻域滤波为维纳滤波；所述第一视频图像包括重建视频图像。
根据权利要求1所述的视频解码方法，其中：

所述第一视频图像中一个像素点的邻域差异根据该像素点的像素值与该像素点邻域中每一像素点的像素值之差的绝对值统计得到，所述统计为求和、求均值或者求最大值；或者，所述第一视频图像中一个像素点的邻域差异根据该像素点及该像素点邻域中像素点的像素值之间的差异确定；

其中，该像素点邻域指该像素点的八邻域或四邻域或对角邻域。
根据权利要求2所述的视频解码方法，其中：

所述解码码流，确定第一视频图像的滤波参数，包括：

对码流中携带所述滤波参数的一个或多个信息单元分别解析，对每一个所述信息单元，先读取1位标志，如该标志的值表示存在滤波系数和类别信息，再读取一组滤波系数和该组滤波系数对应的一个类别的信息。
根据权利要求2所述的视频解码方法，其中：

根据所述滤波参数对所述第一视频图像进行邻域滤波，包括：对解析出的每一组滤波系数，根据该组滤波系数对应的该类别的信息确定该类别对应的邻域差异的取值区间，对所述第一视频图像进行邻域滤波时，所述第一视频图像中邻域差异的值属于所述取值区间的像素点使用该组滤波系数进行滤波。
根据权利要求6所述的视频解码方法，其中：

至少一个所述类别的信息包括合并为该类别的多个小类的索引信息，每一小类对应一个约定的邻域差异的取值区间；每一所述类别对应的邻域差异的取值区间是合并为该类别的多个小类对应的取值区间的并集。
根据权利要求1或3所述的视频解码方法，其中：

所述视频解码方法应用于基于视频的点云压缩***的解码端；

所述第一视频图像包括有损的重建几何视频图像，对所述重建几何视频图像进行邻域滤波后，所述视频解码方法还包括：将滤波后的重建几何视频图像用于对应的纹理视频图像的质量增强；或者

所述第一视频图像包括有损的重建纹理视频图像。
一种滤波系数生成方法，包括：

根据第一视频图像中像素点的邻域差异将所述第一视频图像中的像素点分成多个类别；

为所述多个类别中的部分或全部类别分别生成对应的滤波系数。
根据权利要求9所述的滤波系数生成方法，其中：

所述第一视频图像中一个像素点的邻域差异根据该像素点的像素值与该像素点邻域中每一像素点的像素值之差的绝对值统计得到，所述统计为求和、求均值或者求最大值；或者，所述第一视频图像中一个像素点的邻域差异根据该像素点及该像素点邻域中像素点的像素值之间的差异确定；

其中，该像素点邻域指该像素点的八邻域或四邻域或对角邻域。
根据权利要求9所述的滤波系数生成方法，其中：

所述部分或全部类别中每一类别对应的滤波系数设置为对所述第一视频图像进行邻域滤波时该类别像素点使用的滤波系数；

所述对所述第一视频图像进行邻域滤波，包括：对有对应滤波系数的每一类别，使用窗口扫描该类别的每一像素点，对所述窗口内所有像素点的像素值加权平均，将位于所述窗口中心的该类别像素点的像素值更新为加权平均的结果，加权平均使用的一组加权系数采用该类别对应的一组滤波系数，所述窗口为矩形或菱形。
根据权利要求9所述的滤波系数生成方法，其中：

所述邻域滤波为维纳滤波，所述第一视频图像包括有损视频图像；

为一个所述类别生成对应的滤波系数时，将所述有损视频图像中该类别所有像素点的滤波相关向量组成该类别滤波相关矩阵，将该类别像素点在相应原始视频图像中相应位置的像素点的像素值组成该类别原始像素值向量；将该类别滤波相关矩阵和该类别原始像素值向量的互相关矩阵左乘该类别滤波相关矩阵的自相关矩阵的逆矩阵，得到该类别对应的滤波系数；

其中，一个像素点的滤波相关向量指以该像素点为中心的窗口内的k个像素值组成的向量。
根据权利要求9所述的滤波系数生成方法，其中：

所述根据第一视频图像中像素点的邻域差异将所述第一视频图像中的像素点分成多个类别，包括：

将邻域差异的取值范围分为多个取值区间，确定所述第一视频图像中每一像素点的邻域差异所属的取值区间，将该像素点分入该取值区间对应的一个类别。
根据权利要求9至12中任一所述的滤波系数生成方法，其中：

所述根据第一视频图像中像素点的邻域差异将所述第一视频图像中的像素点分成多个类别，包括：

将邻域差异的取值范围分成多个取值区间，确定所述第一视频图像中每一像素点的邻域差异的值所属的取值区间，将该像素点分入该取值区间对应的一个小类，所述小类的数量大于所述类别的数量；

遍历多种将小类合并为类别的方式，按照最优的合并方式将所述多个小类的像素点分入所述多个类别。
根据权利要求14所述的滤波系数生成方法，其中：

所述遍历多种将小类合并为类别的方式，按照最优的合并方式将所述多个小类的像素点分入所述多个类别，包括：

对所述多个小类进行第一轮的多次合并，每次按不同方式将其中的部分或全部小类合并为第一个类别，基于为该第一个类别生成的滤波系数对该第一个类别的像素点进行邻域滤波并计算增益，将增益最大且大于等于相应增益阈值的一次合并所合并小类的像素点分入该第一个类别，记录合并为该第一个类别的多个小类；

在前一轮次合并成功，已合并的轮次i小于设定的最大轮数且未合并的小类数量大于1的情况下，对未合并的多个小类进行第i+1轮的一次或多次合并，每次按不同方式将其中的部分或全部小类合并为第i+1个类别,基于为该第i+1个类别生成的滤波系数对该第i+1个类别中的像素点进行邻域滤波并计算增益，将增益最大且大于等于相应增益阈值的一次合并所合并小类的像素点分入该第i+1个类别，记录合并为该第i+1个类别的多个小类。
根据权利要求15所述的滤波系数生成方法，其中：

所述遍历多种将小类合并为类别的方式，按照最优的合并方式将所述多个小类的像素点分入所述多个类别，还包括：

在当前轮次，在所有合并方式的增益均小于相应增益阈值的情况下，当前轮次不进行合并且结束整个合并过程；

在已合并的轮次等于设定的最大轮数或没有可以合并的小类时，结束整个合并过程；

在整个合并过程结束还有未合并的小类的情况下，将未合并的所有小类的像素点分入没有对应滤波系数的一个类别，不参与滤波运算。
根据权利要求15所述的滤波系数生成方法，其中：

所述按不同方式将其中的部分或全部小类合并，包括：遍历所有可能的合并方式，将其中的部分或全部小类合并；

或者

所述按不同方式将其中的部分或全部小类合并，包括：遍历满足约束条件时的可能的合并方式，将其中的部分或全部小类合并，所述约束条件包括以下一个或多个：

只能将队列中位置连续的多个小类合并；

每一轮合并时，先遍历队列位置最靠前的未合并小类与其他未合并小类之间可能的合并方式，如合并失败再遍历其他可能的合并方式；

其中，所述队列指按照对应取值区间中的值从小到大的顺序将所述多个小类排列成的队列。
根据权利要求15所述的滤波系数生成方法，其中：

所述对该第一个类别的像素点进行邻域滤波的增益用该类别像素点滤波后的图像质量相对滤波前的图像质量的增加来表示；

所述每次合并计算的增益均是加权后的增益，权值等于此次合并的所有小类中像素点的总数与所述第一视频图像中像素点的总数的比值。
根据权利要求15所述的滤波系数生成方法，其中：

所述小类的数量大于等于8且小于等于20，所述最大轮数等于1或2或3或4。
根据权利要求15所述的滤波系数生成方法，其中：

对视频图像序列中有损的第一视频图像，对其中一个第一视频图像通过小类合并的方式将所述多个小类的像素点分入所述多个类别后，对该第一视频图像后的第一个视频图像，采用与该第一视频图像相同的小类合并方式，将所述多个小类的像素点分入所述多个类别；或者

对视频图像序列中有损的第一视频图像，分别执行所述滤波系数生成方法。
一种视频滤波方法，其中：

获取按照如权利要求9至20中任一所述的滤波系数生成方法生成的，与所述多个类别中的部分或全部类别对应的滤波系数；

对所述第一视频图像进行邻域滤波，其中，对所述第一视频图像中有对应滤波系数的每一类别的像素点，使用该类别对应的滤波系数进行滤波。
一种视频编码方法，包括：

按照如权利要求9至20中任一所述的滤波系数生成方法，将第一视频图像中的像素点分成多个类别，为所述多个类别中的部分或全部类别分别生成对应的滤波系数，一个所述类别对应一组滤波系数；

对滤波参数编码并发送，或者对符合发送条件的滤波参数编码并发送，其中，所述滤波参数包括所述滤波系数和类别信息。
根据权利要求22所述的视频编码方法，其中：

所述对符合发送条件的滤波参数编码发送，包括：分组判断生成的滤波系数是否符合发送条件，将符合发送条件的每一组滤波系数及该组滤波系数对应的一个类别的信息进行编码并发送；其中，所述发送条件包括以下条件中的任意一种或更多种：

对一组滤波系数，使用该组滤波系数对所述第一视频图像中对应类别的像素点进行邻域滤波，获得的增益大于相应的增益阈值；

对一组滤波系数，使用该组滤波系数对所述第一视频图像中对应类别的像素点进行邻域滤波时的率失真相对不进行所述邻域滤波时的率失真变小且变小的量大于相应的率失真增益阈值。
根据权利要求22所述的视频编码方法，其中：

所述将符合发送条件的每一组滤波系数及该组滤波系数对应的一个类别的信息进行编码，包括：在每一组滤波系数及该组滤波系数对应的一个类别的信息前增加一个标志，用于指示是否存在类别信息和滤波系数，其中，至少一个所述类别的信息用合并为该类别的多个小类的索引信息表示。
根据权利要求24所述的视频编码方法，其中：

所述视频编码方法应用于处理二维视频图像的视频编码***，所述邻域滤波为维纳滤波，所述第一视频图像为重建视频图像，所述滤波系数根据所述重建视频图像和对应的原始视频图像生成。
根据权利要求22所述的视频编码方法，其中：

所述视频编码方法应用于基于视频的点云压缩***的编码端，所述第一视频图像包括有损的重建几何视频图像；

所述视频编码方法还包括：对所述重建几何视频图像进行邻域滤波，将滤波后的重建几何视频图像用于对应的纹理视频图像的生成；其中，对所述重建几何视频图像进行邻域滤波时，所述重建几何视频图像中有对应滤波系数的每一类别的像素点使用该类别对应的一组滤波系数进行滤波。
根据权利要求22所述的视频编码方法，其中：

所述视频编码方法应用于基于视频的点云压缩***的编码端，所述邻域滤波为维纳滤波；所述第一视频图像包括重建几何视频图像；或者，所述第一视频图像包括重建纹理视频图像。
根据权利要求22所述的视频编码方法，其中：

所述视频编码方法应用于基于视频的点云压缩***的编码端；所述第一视频图像包括点云帧映射成的两幅重建视频图像；

所述视频编码方法还包括：对同一点云帧映射成的两幅重建视频图像，按照如权利要求14-19中任一所述的滤波系数生成方法为第一幅重建视频图像生成滤波系数后，在为第二幅重建视频图像生成滤波系数时，对第二幅重建视频图像的像素点划分小类后，采用与第一幅重建视频图像相同的小类合并方式，将所述多个小类的像素点分入所述多个类别；

其中，所述重建视频图像包括有损的几何视频图像或纹理视频图像。
一种码流，其中，所述码流为已编码视频码流，所述码流中包括已编码的滤波参数，所述滤波参数包括用于对第一视频图像进行邻域滤波的滤波系数。
根据权利要求29所述的码流，其中：

所述已编码的滤波参数包括一个或多个信息单元，每个所述信息单元包括以下子单元：

标志子单元，设置为指示是否存在滤波系数和类别信息；

索引子单元，设置为写入一个类别的信息，或为空，其中该类别的信息用该类别的索引信息或者合并为该类别的多个小类的索引信息表示；

系数子单元，设置为写入一组滤波系数，或为空；其中，所述索引子单元中的类别是该组滤波系数对应的类别。
根据权利要求29所述的码流，其中：

所述码流是基于视频的点云压缩***的编码端发送的码流，所述第一视频图像包括重建视频图像；

所述已编码的滤波参数位于几何码流中的分隔符之后和所述重建视频图像的数据之前，其中，所述重建视频图像包括有损的重建几何视频图像或重建纹理视频图像；或者

所述已编码的滤波参数携带在码流的序列参数集中。
一种视频解码装置，包括处理器以及存储有计算机程序的存储器，其中，所述处理器执行所述计算机程序时实现如权利要求1至9中任一所述的视频解码方法。
一种视频解码装置，包括几何帧重建模块和纹理转换模块，其中，还包括：

维纳滤波模块，设置为接收所述几何帧重建模块输出的重建几何视频图像，及从码流中解析得到的滤波参数，执行如权利要求8所述的视频解码方法，输出滤波后的重建几何视频图像到所述纹理转换模块。
一种视频编码装置，包括处理器以及存储有计算机程序的存储器，其中，所述处理器执行所述计算机程序时实现如权利要求22至28中任一所述的视频编码方法。
一种视频编码装置，应用于基于视频的点云压缩***，包括纹理帧生成模块，以及依次连接的几何帧生成模块、几何帧填充模块和几何帧视频压缩模块，其中，还包括：

维纳滤波模块，设置为接收所述几何帧视频压缩模块输出的重建几何视频图像，及所述几何帧生成模块或几何帧填充模块输出的原始几何视频图像，执行如权利要求26所述的视频编码方法，输出滤波后的重建几何视频图像到所述纹理帧生成模块。
一种视频编解码***，其中，包括如权利要求34或35所述的视频编码装置和如权利要求32或33所述的视频解码装置。
一种视频滤波装置，包括处理器以及存储有计算机程序的存储器，其中，所述处理器执行所述计算机程序时实现如权利要求21所述的视频滤波方法。
一种非瞬态计算机可读存储介质，所述计算机可读存储介质存储有计算机程序，其中，所述计算机程序时被处理器执行时实现如权利要求1至28中任一所述的方法。