WO2022257130A1

WO2022257130A1 - 编解码方法、码流、编码器、解码器、***和存储介质

Info

Publication number: WO2022257130A1
Application number: PCT/CN2021/099813
Authority: WO
Inventors: 戴震宇
Original assignee: Oppo广东移动通信有限公司
Priority date: 2021-06-11
Filing date: 2021-06-11
Publication date: 2022-12-15
Also published as: US20240107073A1; CN117461316A; EP4354873A1

Abstract

本申请实施例公开了一种编解码方法、码流、编码器、解码器、***和存储介质，该方法包括：解析码流，确定第一语法元素标识信息的取值；当第一语法元素标识信息指示当前块允许使用预设选择网络模型进行模型决策时，根据当前块的预设选择网络模型确定至少两个输出值，这至少两个输出值包括当前块使用环路滤波网络模型时至少一个候选环路滤波网络模型各自对应的第一值和当前块不使用环路滤波网络模型时的第二值；根据至少两个输出值，确定当前块使用环路滤波网络模型时的目标环路滤波网络模型或者当前块不使用环路滤波网络模型；当当前块使用环路滤波网络模型时，利用目标环路滤波网络模型对当前块进行滤波处理，得到当前块的第一重建图像块。

Description

编解码方法、码流、编码器、解码器、***和存储介质

技术领域

本申请实施例涉及图像处理技术领域，尤其涉及一种编解码方法、码流、编码器、解码器、***和存储介质。

背景技术

在视频编解码***中，环路滤波器被使用来提升重建图像的主客观质量。其中，在环路滤波部分，虽然目前存在一些模型选择方案，但是这些方案大都是通过计算各个模型的率失真代价值来选择出性能较好的模型，复杂度较高；而且对于选择出的模型，还需要通过率失真代价来决策是否打开模型开关，以及将帧级、块级等开关信息写入码流，从而造成额外的比特开销。

发明内容

本申请实施例提供一种编解码方法、码流、编码器、解码器、***和存储介质，不仅可以降低复杂度，还可以避免额外的比特开销，提升编码性能，进而能够提高编解码效率。

本申请实施例的技术方案可以如下实现：

第一方面，本申请实施例提供了一种解码方法，应用于解码器，该方法包括：

解析码流，确定第一语法元素标识信息的取值；

当第一语法元素标识信息指示当前块允许使用预设选择网络模型进行模型决策时，根据当前块的预设选择网络模型确定至少两个输出值；其中，至少两个输出值包括当前块使用环路滤波网络模型时至少一个候选环路滤波网络模型各自对应的第一值和当前块不使用环路滤波网络模型时的第二值；

根据至少两个输出值，确定当前块使用环路滤波网络模型时的目标环路滤波网络模型或者当前块不使用环路滤波网络模型；

当当前块使用环路滤波网络模型时，利用目标环路滤波网络模型对当前块进行滤波处理，得到当前块的第一重建图像块。

第二方面，本申请实施例提供了一种编码方法，应用于编码器，该方法包括：

确定第一语法元素标识信息的取值；

第三方面，本申请实施例提供了一种码流，码流是根据待编码信息进行比特编码生成的；其中，待编码信息包括第一语法元素标识信息的取值，第一语法元素标识信息用于指示当前块是否允许使用预设选择网络模型进行模型决策。

第四方面，本申请实施例提供了一种编码器，该编码器包括第一确定单元、第一决策单元和第一滤波单元；其中，

第一确定单元，配置为确定第一语法元素标识信息的取值；

第一决策单元，配置为当第一语法元素标识信息指示当前块允许使用预设选择网络模型进行模型决策时，根据当前块的预设选择网络模型确定至少两个输出值；其中，至少两个输出值包括当前块使用环路滤波网络模型时至少一个候选环路滤波网络模型各自对应的第一值和当前块不使用环路滤波网络模型时的第二值；以及根据至少两个输出值，确定当前块使用环路滤波网络模型时的目标环路滤波网络模型或者当前块不使用环路滤波网络模型；

第一滤波单元，配置为当当前块使用环路滤波网络模型时，利用目标环路滤波网络模型对当前块进行滤波处理，得到当前块的第一重建图像块。

第五方面，本申请实施例提供了一种编码器，该编码器包括第一存储器和第一处理器；其中，

第一存储器，用于存储能够在第一处理器上运行的计算机程序；

第一处理器，用于在运行计算机程序时，执行如第二方面所述的方法。

第六方面，本申请实施例提供了一种解码器，该解码器包括解析单元、第二决策单元和第二滤波单元；其中，

解析单元，配置为解析码流，确定第一语法元素标识信息的取值；

第二决策单元，配置为当第一语法元素标识信息指示当前块允许使用预设选择网络模型进行模型决策时，根据当前块的预设选择网络模型确定至少两个输出值；其中，至少两个输出值包括当前块使用环路滤波网络模型时至少一个候选环路滤波网络模型各自对应的第一值和当前块不使用环路滤波网络模型时的第二值；以及根据至少两个输出值，确定当前块使用环路滤波网络模型时的目标环路滤波网络模型或者当前块不使用环路滤波网络模型；

第二滤波单元，配置为当当前块使用环路滤波网络模型时，利用目标环路滤波网络模型对当前块进行滤波处理，得到当前块的第一重建图像块。

第七方面，本申请实施例提供了一种解码器，该解码器包括第二存储器和第二处理器；其中，

第二存储器，用于存储能够在第二处理器上运行的计算机程序；

第二处理器，用于在运行计算机程序时，执行如第一方面所述的方法。

第八方面，本申请实施例提供了一种编解码***，该编解码***包括如第四方面或第五方面所述的编码器和如第六方面或第七方面所述的解码器。

第九方面，本申请实施例提供了一种计算机存储介质，该计算机存储介质存储有计算机程序，所述计算机程序被执行时实现如第一方面所述的方法、或者如第二方面所述的方法。

本申请实施例提供了一种编解码方法、码流、编码器、解码器、***和存储介质，在编码器侧，确定第一语法元素标识信息的取值；当第一语法元素标识信息指示当前块允许使用预设选择网络模型进行模型决策时，根据当前块的预设选择网络模型确定至少两个输出值；其中，至少两个输出值包括当前块使用环路滤波网络模型时至少一个候选环路滤波网络模型各自对应的第一值和当前块不使用环路滤波网络模型时的第二值；根据至少两个输出值，确定当前块使用环路滤波网络模型时的目标环路滤波网络模型或者当前块不使用环路滤波网络模型；当当前块使用环路滤波网络模型时，利用目标环路滤波网络模型对当前块进行滤波处理，得到当前块的第一重建图像块。在解码器侧，解析码流，确定第一语法元素标识信息的取值；当第一语法元素标识信息指示当前块允许使用预设选择网络模型进行模型决策时，根据当前块的预设选择网络模型确定至少两个输出值；其中，至少两个输出值包括当前块使用环路滤波网络模型时至少一个候选环路滤波网络模型各自对应的第一值和当前块不使用环路滤波网络模型时的第二值；根据至少两个输出值，确定当前块使用环路滤波网络模型时的目标环路滤波网络模型或者当前块不使用环路滤波网络模型；当当前块使用环路滤波网络模型时，利用目标环路滤波网络模型对当前块进行滤波处理，得到当前块的第一重建图像块。这样，通过引入基于深度学习的神经网络技术对环路滤波网络模型进行自适应决策，可以确定出当前块使用环路滤波网络模型时的目标环路滤波网络模型或者当前块不使用环路滤波网络模型；如果当前块使用环路滤波网络模型，那么可以还可以利用目标环路滤波网络模型对当前块进行滤波处理，如此不仅可以降低复杂度，还可以避免额外的比特开销，提升编码性能，进而能够提高编解码效率；另外，还可以使得最终输出的第一重建图像块更加接近于原始图像块，能够提升视频图像质量。

附图说明

图1为本申请实施例提供的一种编码框架的应用示意图；

图2为本申请实施例提供的另一种编码框架的应用示意图；

图3A为本申请实施例提供的一种视频编码***的详细框架示意图；

图3B为本申请实施例提供的一种视频解码***的详细框架示意图；

图4为本申请实施例提供的一种解码方法的流程示意图；

图5为本申请实施例提供的又一种编码框架的应用示意图；

图6A为本申请实施例提供的一种亮度环路滤波网络模型的网络结构组成示意图；

图6B为本申请实施例提供的一种色度环路滤波网络模型的网络结构组成示意图；

图7A为本申请实施例提供的另一种亮度环路滤波网络模型的网络结构组成示意图；

图7B为本申请实施例提供的另一种色度环路滤波网络模型的网络结构组成示意图；

图8为本申请实施例提供的一种残差块的网络结构组成示意图；

图9A为本申请实施例提供的一种预设选择网络模型的组成结构示意图；

图9B为本申请实施例提供的另一种预设选择网络模型的组成结构示意图；

图10为本申请实施例提供的一种基于预设选择网络模型的整体框架示意图；

图11为本申请实施例提供的另一种解码方法的流程示意图；

图12为本申请实施例提供的一种编码方法的流程示意图；

图13为本申请实施例提供的一种编码器的组成结构示意图；

图14为本申请实施例提供的一种编码器的具体硬件结构示意图；

图15为本申请实施例提供的一种解码器的组成结构示意图；

图16为本申请实施例提供的一种解码器的具体硬件结构示意图；

图17为本申请实施例提供的一种编解码***的组成结构示意图。

具体实施方式

为了能够更加详尽地了解本申请实施例的特点与技术内容，下面结合附图对本申请实施例的实现进行详细阐述，所附附图仅供参考说明之用，并非用来限定本申请实施例。

除非另有定义，本文所使用的所有的技术和科学术语与属于本申请的技术领域的技术人员通常理解的含义相同。本文中所使用的术语只是为了描述本申请实施例的目的，不是旨在限制本申请。

在以下的描述中，涉及到“一些实施例”，其描述了所有可能实施例的子集，但是可以理解，“一些实施例”可以是所有可能实施例的相同子集或不同子集，并且可以在不冲突的情况下相互结合。还需要指出，本申请实施例所涉及的术语“第一\第二\第三”仅是用于区别类似的对象，不代表针对对象的特定排序，可以理解地，“第一\第二\第三”在允许的情况下可以互换特定的顺序或先后次序，以使这里描述的本申请实施例能够以除了在这里图示或描述的以外的顺序实施。

对本申请实施例进行进一步详细说明之前，先对本申请实施例中涉及的名词和术语进行说明，本申请实施例中涉及的名词和术语适用于如下的解释：

联合视频专家组(Joint Video Experts Team，JVET)

新一代视频编码标准H.266/多功能视频编码(Versatile Video Coding，VVC)

VVC的参考软件测试平台(VVC Test Model，VTM)

音视频编码标准(Audio Video coding Standard，AVS)

AVS的高性能测试模型(High-Performance Model，HPM)

AVS的高性能-模块化智能编码测试模型(High Performance-Modular Artificial Intelligence Model，HPM-ModAI)

基于残差神经网络的环路滤波器(Convolutional Neural Network based in-Loop Filter，CNNLF)

去块滤波器(DeBlocking Filter，DBF)

样值自适应补偿(Sample adaptive Offset，SAO)

自适应修正滤波器(Adaptive loop filter，ALF)

量化参数(Quantization Parameter，QP)

编码单元(Coding Unit，CU)

编码树单元(Coding Tree Unit，CTU)

可以理解，数字视频压缩技术主要是将庞大的数字影像视频数据进行压缩，以便于传输以及存储等。随着互联网视频的激增以及人们对视频清晰度的要求越来越高，尽管已有的数字视频压缩标准能够节省不少视频数据，但目前仍然需要追求更好的数字视频压缩技术，以减少数字视频传输的带宽和流量压力。

在数字视频编码过程中，编码器对不同颜色格式的原始视频序列读取不相等的像素，包含亮度分量和色度分量，即编码器读取一副黑白或者彩色图像。然后将该图像进行划分成块，将块数据交由编码器进行编码，如今编码器通常为混合框架编码模式，一般可以包含帧内预测与帧间预测、变换/量化、反量化/逆变换、环路滤波及熵编码等操作，处理流程具体可参考图1所示。这里，帧内预测只参考同一帧图像的信息，预测当前划分块内的像素信息，用于消除空间冗余；帧间预测可以包括运动估计和运动补偿，其可参考不同帧的图像信息，利用运动估计搜索最匹配当前划分块的运动矢量信息，用于消除时间冗余；变换将预测后的图像块转换到频率域，能量重新分布，结合量化可以将人眼不敏感的信息去除，用于消除视觉冗余；熵编码可以根据当前上下文模型以及二进制码流的概率信息消除字符冗余；环路滤波则主要对反变换与反量化后的像素进行处理，弥补失真信息，为后续编码像素提供更好的参考。

对于视频编码标准而言，在环路滤波部分，传统环路滤波模块主要包含去块滤波器(以下简称为DBF)、样值自适应补偿滤波器(以下简称为SAO)和自适应修正滤波器(以下简称为ALF)。在HPM-ModAI的应用中，还采用了基于残差神经网络的环路滤波器(以下简称为CNNLF)作为智能环路滤波模块的基线方案，并设置于SAO滤波和ALF滤波之间，具体详见图2所示。在编码测试时，按照智能编码通用测试条件，对于全帧内(All Intra)配置，打开ALF，关闭DBF和SAO；对于随机接入(Random Access)和低延迟(Low Delay)配置，打开I帧的DBF，打开ALF，关闭SAO。

在实际应用中，尤其是HPM-ModAI中，按照QP 27～31，32～37，38～44，45～50为范围划分为4个区间，分别训练了4种I帧亮度分量模型，4种非I帧亮度分量模型，4种色度U分量模型，4种色度V分量模型等总共16种候选CNNLF模型。在编码时，根据不同的帧类型、QP、颜色分量类型等特性，需要在这多种候选CNNLF模型中人为地选择对应的一种CNNLF模型，例如可以通过率失真代价方式决策是否调用CNNLF模型，并将帧级、CTU级等开关信息写入码流(“比特流”)中。对于Random Access和Low Delay等配置，在编码时各帧的QP相比初始QP会产生一定的波动，导致所选择的CNNLF模型并不一定就是使该帧滤波效果最好的模型。

也就是说，已有的神经网络环路滤波器技术，往往是针对帧类型、QP、颜色分量类型等特性，训练了多种候选模型。在编码时，要么人为地选择一种模型，并将帧级、CTU级等开关信息编入码流中；要么通过率失真代价方式选择出一种模型，并将帧级、CTU级等开关信息，以及模型索引序号写入码流中。虽然可以提出一种基于深度学习的模型自适应选择技术方案，其可以优化神经网络环路滤波器的模型选择操作；但是对于选择出的模型，仍然需要通过率失真代价方式来决策是否打开模型开关，并将帧级，CTU级等开关信息写入码流中，造成额外的比特开销。

本申请实施例提供了一种编码方法，在编码器侧，确定第一语法元素标识信息的取值；当第一语法元素标识信息指示当前块允许使用预设选择网络模型进行模型决策时，根据当前块的预设选择网络模型确定至少两个输出值；其中，至少两个输出值包括当前块使用环路滤波网络模型时至少一个候选环路滤波网络模型各自对应的第一值和当前块不使用环路滤波网络模型时的第二值；根据至少两个输出值，确定当前块使用环路滤波网络模型时的目标环路滤波网络模型或者当前块不使用环路滤波网络模型；当当前块使用环路滤波网络模型时，利用目标环路滤波网络模型对当前块进行滤波处理，得到当前块的第一重建图像块。

本申请实施例还提供了一种解码方法，在解码器侧，解析码流，确定第一语法元素标识信息的取值；当第一语法元素标识信息指示当前块允许使用预设选择网络模型进行模型决策时，根据当前块的预设选择网络模型确定至少两个输出值；其中，至少两个输出值包括当前块使用环路滤波网络模型时至少一个候选环路滤波网络模型各自对应的第一值和当前块不使用环路滤波网络模型时的第二值；根据至少两个输出值，确定当前块使用环路滤波网络模型时的目标环路滤波网络模型或者当前块不使用环路滤波网络模型；当当前块使用环路滤波网络模型时，利用目标环路滤波网络模型对当前块进行滤波处理，得到当前块的第一重建图像块。

这样，通过引入基于深度学习的神经网络技术对环路滤波网络模型进行自适应决策，可以确定出当前块使用环路滤波网络模型时的目标环路滤波网络模型或者当前块不使用环路滤波网络模型；如果当前块使用环路滤波网络模型，那么可以还可以利用目标环路滤波网络模型对当前块进行滤波处理，如此不仅可以降低复杂度，还可以避免额外的比特开销，提升编码性能，进而能够提高编解码效率；另外，还可以使得最终输出的第一重建图像块更加接近于原始图像块，能够提升视频图像质量。

下面将结合附图对本申请各实施例进行详细说明。

参见图3A，其示出了本申请实施例提供的一种视频编码***的详细框架示意图。如图3A所示，该视频编码***10包括变换与量化单元101、帧内估计单元102、帧内预测单元103、运动补偿单元104、运动估计单元105、反变换与反量化单元106、滤波器控制分析单元107、滤波单元108、编码单元109和解码图像缓存单元110等，其中，滤波单元108可以实现DBF滤波/SAO滤波/ALF滤波，编码单元109可以实现头信息编码及基于上下文的自适应二进制算术编码(Context-based Adaptive Binary Arithmetic Coding，CABAC)。针对输入的原始视频信号，通过编码树单元(Coding Tree Unit，CTU)的划分可以得到一个视频编码块，然后对经过帧内或帧间预测后得到的残差像素信息通过变换与量化单元101对该视频编码块进行变换，包括将残差信息从像素域变换到变换域，并对所得的变换系数进行量化，用以进一步减少比特率；帧内估计单元102和帧内预测单元103是用于对该视频编码块进行帧内预测；明确地说，帧内估计单元102和帧内预测单元103用于确定待用以编码该视频编码块的帧内预测模式；运动补偿单元104和运动估计单元105用于执行所接收的视频编码块相对于一或多个参考帧中的一或多个块的帧间预测编码以提供时间预测信息；由运动估计单元105执行的运动估计为产生运动向量的过程，所述运动向量可以估计该视频编码块的运动，然后由运动补偿单元104基于由运动估计单元105 所确定的运动向量执行运动补偿；在确定帧内预测模式之后，帧内预测单元103还用于将所选择的帧内预测数据提供到编码单元109，而且运动估计单元105将所计算确定的运动向量数据也发送到编码单元109；此外，反变换与反量化单元106是用于该视频编码块的重构建，在像素域中重构建残差块，该重构建残差块通过滤波器控制分析单元107和滤波单元108去除方块效应伪影，然后将该重构残差块添加到解码图像缓存单元110的帧中的一个预测性块，用以产生经重构建的视频编码块；编码单元109是用于编码各种编码参数及量化后的变换系数，在基于CABAC的编码算法中，上下文内容可基于相邻编码块，可用于编码指示所确定的帧内预测模式的信息，输出该视频信号的码流；而解码图像缓存单元110是用于存放重构建的视频编码块，用于预测参考。随着视频图像编码的进行，会不断生成新的重构建的视频编码块，这些重构建的视频编码块都会被存放在解码图像缓存单元110中。

参见图3B，其示出了本申请实施例提供的一种视频解码***的详细框架示意图。如图3B所示，该视频解码***20包括解码单元201、反变换与反量化单元202、帧内预测单元203、运动补偿单元204、滤波单元205和解码图像缓存单元206等，其中，解码单元201可以实现头信息解码以及CABAC解码，滤波单元205可以实现DBF滤波/SAO滤波/ALF滤波。输入的视频信号经过图3A的编码处理之后，输出该视频信号的码流；该码流输入视频解码***20中，首先经过解码单元201，用于得到解码后的变换系数；针对该变换系数通过反变换与反量化单元202进行处理，以便在像素域中产生残差块；帧内预测单元203可用于基于所确定的帧内预测模式和来自当前帧或图片的先前经解码块的数据而产生当前视频解码块的预测数据；运动补偿单元204是通过剖析运动向量和其他关联语法元素来确定用于视频解码块的预测信息，并使用该预测信息以产生正被解码的视频解码块的预测性块；通过对来自反变换与反量化单元202的残差块与由帧内预测单元203或运动补偿单元204产生的对应预测性块进行求和，而形成解码的视频块；该解码的视频信号通过滤波单元205以便去除方块效应伪影，可以改善视频质量；然后将经解码的视频块存储于解码图像缓存单元206中，解码图像缓存单元206存储用于后续帧内预测或运动补偿的参考图像，同时也用于视频信号的输出，即得到了所恢复的原始视频信号。

需要说明的是，本申请实施例提供的方法，可以应用在如图3A所示的滤波单元108部分(用黑色加粗方框表示)，也可以应用在如图3B所示的滤波单元205部分(用黑色加粗方框表示)。也就是说，本申请实施例中的方法，既可以应用于视频编码***(简称为“编码器”)，也可以应用于视频解码***(简称为“解码器”)，甚至还可以同时应用于视频编码***和视频解码***，但是这里不作任何限定。

还需要说明的是，当本申请实施例应用于编码器时，“当前块”具体是指视频图像中的当前待编码的块(也可以简称为“编码块”)；当本申请实施例应用于解码器时，“当前块”具体是指视频图像中的当前待解码的块(也可以简称为“解码块”)。

在本申请的一实施例中，参见图4，其示出了本申请实施例提供的一种解码方法的流程示意图。如图4所示，该方法可以包括：

S401：解析码流，确定第一语法元素标识信息的取值。

需要说明的是，视频图像可以划分为多个图像块，每个当前待解码的图像块可以称为解码块。这里，每个解码块可以包括第一图像分量、第二图像分量和第三图像分量；而当前块即为视频图像中当前待进行第一图像分量、第二图像分量或者第三图像分量环路滤波处理的解码块。其中，这里的当前块可以为CTU，也可以为CU，甚至还可以是比CU更小的块，本申请实施例不作任何限定。

在这里，针对第一图像分量、第二图像分量和第三图像分量，从颜色划分角度，本申请实施例可以将其划分为亮度分量和色度分量等两种颜色分量类型。在这种情况下，如果当前块进行亮度分量的预测、反变换与反量化、环路滤波等操作，那么当前块也可以称为亮度块；或者，如果当前块进行色度分量的预测、反变换与反量化、环路滤波等操作，那么当前块也可以称为色度块。

还需要说明的是，在解码器侧，本申请实施例具体提供了一种环路滤波方法，尤其是一种基于深度学习的环路滤波网络模型使用的自适应决策方法，该方法应用在如图3B所示的滤波单元205部分。在这里，滤波单元205可以包括去块滤波器(DBF)、样值自适应补偿滤波器(SAO)、基于残差神经网络的环路滤波器(CNNLF)和自适应修正滤波器(ALF)。对于该滤波单元205来说，利用本申请实施例所述的方法可以对该滤波单元205中的CNNLF模型进行自适应地决策，以便决策出当前块使用CNNLF模型时的目标模型或者当前块不使用CNNLF模型。

更具体地，本申请实施例提出了一种基于深度学习的模型自适应决策使用模块，用于对环路滤波网络模型(比如CNNLF模型)是否使用进行自适应决策，提升编码性能。如图5所示，环路滤波器除了包括DBF、SAO、CNNLF和ALF之外，还可以包括模型自适应决策使用模块(Model Adaptive Decision，MAD)，且模型自适应决策使用模块位于SAO滤波和CNNLF滤波之间。另外，模型自适应决策使用模块的使用不依赖于DBF、SAO、CNNLF和ALF的标志位，只是在位置上置于CNNLF之前。需要说明的是，模型自适应决策使用模块可以看作是由多层卷积神经网络和多层全连接神经网络组成的预设选择网络模型，以便决策出当前块是否使用CNNLF模型，具体可以是指当前块使用CNNLF模型时的目标模型或者当前块不使用CNNLF模型。

在这里，为了方便解码器能够确定当前块是否允许使用预设选择网络模型进行模型决策，可以设置一个第一语法元素标识信息，然后根据解码获得的第一语法元素标识信息的取值来确定。在一些实施例中，该方法还可以包括：

若第一语法元素标识信息的取值为第一标识值，则确定第一语法元素标识信息指示当前块允许使用预设选择网络模型进行模型决策；或者，

若第一语法元素标识信息的取值为第二标识值，则确定第一语法元素标识信息指示当前块不允许使用预设选择网络模型进行模型决策。

需要说明的是，第一标识值和第二标识值不同，而且第一标识值和第二标识值可以是参数形式，也可以是数字形式。具体地，第一语法元素标识信息可以是写入在概述(profile)中的参数，也可以是一个标志(flag)的取值，本申请实施例对此不作任何限定。

以第一语法元素标识信息为一个flag为例，这时候对于第一标识值和第二标识值而言，第一标识值可以设置为1，第二标识值可以设置为0；或者，第一标识值还可以设置为true，第二标识值还可以设置为false；或者，第一标识值还可以设置为0，第二标识值还可以设置为1；或者，第一标识值还可以设置为false，第二标识值还可以设置为true。示例性地，对于flag而言，一般情况下，第一标识值可以为1，第二标识值可以为0，但是并不作任何限定。

还需要说明的是，预设选择网络模型可以看作是一个神经网络，而第一语法元素标识信息可以看作是一个基于神经网络的模型自适应决策的允许标志，这里可以用model_adaptive_decision_enable_flag表示。具体来说，model_adaptive_decision_enable_flag可以用于指示当前块是否允许使用预设选择网络模型进行模型自适应决策。

S402：当第一语法元素标识信息指示当前块允许使用预设选择网络模型进行模型决策时，根据当前块的预设选择网络模型确定至少两个输出值；其中，至少两个输出值包括当前块使用环路滤波网络模型时至少一个候选环路滤波网络模型各自对应的第一值和当前块不使用环路滤波网络模型时的第二值。

需要说明的是，如果当前块允许使用预设选择网络模型进行模型决策，那么这时候可以根据当前块的颜色分量类型、量化参数和所属帧的帧类型等，从若干个候选的预设选择网络模型中确定出当前块使用的预设选择网络模型，然后根据该预设选择网络模型确定当前块使用环路滤波网络模型时的至少一个候选环路滤波网络模型和当前块不使用环路滤波网络模型的概率分布情况。具体地，在本申请实施例中，这至少两个输出值可以包括当前块使用环路滤波网络模型时至少一个候选环路滤波网络模型各自对应的第一值和当前块不使用环路滤波网络模型时的第二值。

在一种更具体的示例中，第一值可以用于反映当前块使用环路滤波网络模型时这至少一个候选环路滤波网络模型的概率分布情况，第二值可以用于反映当前块不使用环路滤波网络模型时的概率分布情况。换言之，第一值和第二值均可以用概率值表示；即根据预设选择网络模型，所确定的至少两个输出值可以为至少两个概率值。或者，第一值和第二值还可以用于反映当前块使用环路滤波网络模型时这至少一个候选环路滤波网络模型和当前块不使用环路滤波网络模型的权重分配情况；即第一值和第二值也可以称为权重值，本申请实施例不作任何限定。

可以理解地，针对不同的颜色分量类型，这里的预设选择网络模型并不相同。在本申请实施例中，亮度分量对应的预设选择网络模型可以称为亮度选择网络模型，色度分量对应的预设选择网络模型可以称为色度选择网络模型。因此，在一些实施例中，所述确定当前块的预设选择网络模型，可以包括：

若当前块的颜色分量类型为亮度分量(即当前块为亮度块时)，则确定当前块的亮度选择网络模型；或者，

若当前块的颜色分量类型为色度分量(即当前块为色度块时)，则确定当前块的色度选择网络模型。

相应地，针对不同的颜色分量类型，这里的候选环路滤波网络模型也是不同的。在本申请实施例中，亮度分量对应的一个或多个候选环路滤波网络模型可以称为候选亮度环路滤波网络模型，色度分量对应的一个或多个候选环路滤波网络模型可以称为候选色度环路滤波网络模型。因此，在一些实施例中，所述根据当前块的预设选择网络模型确定至少两个输出值，可以包括：

若当前块的颜色分量类型为亮度分量，则根据亮度选择网络模型确定至少两个亮度输出值；其中，至少两个亮度输出值包括当前块使用亮度环路滤波网络模型时至少一个候选亮度环路滤波网络模型各自对应的第一值和当前块不使用亮度环路滤波网络模型时的第二值；或者，

若当前块的颜色分量类型为色度分量，则根据色度选择网络模型确定至少两个色度输出值；其中，至少两个色度输出值包括当前块使用色度环路滤波网络模型时至少一个候选色度环路滤波网络模型各自对应的第一值和当前块不使用色度环路滤波网络模型时的第二值。

也就是说，以概率值为例，对于颜色分量类型而言，其可以包括亮度分量和色度分量。在本申请实施例中，如果当前块的颜色分量类型为亮度分量，那么需要确定当前块的亮度选择网络模型，然后可以根据亮度选择网络模型不仅可以确定当前块不使用亮度环路滤波模型的概率分布情况，还可以确定当前块使用亮度环路滤波模型时这至少一个候选亮度环路滤波网络模型各自对应的概率分布情况。如果当前块的颜色分量类型为色度分量，那么需要确定当前块的色度选择网络模型，然后可以根据色度选择网络模型不仅可以确定当前块不使用色度环路滤波模型的概率分布情况，还可以确定当前块使用色度环路滤波模型时这至少一个候选色度环路滤波网络模型的各自对应的概率分布情况。

进一步地，对于帧类型来说，其可以包括I帧、P帧和B帧。其中，I帧，即帧内编码图像帧(Intra-coded Picture)；I帧表示关键帧，可以理解为这一帧画面的完整保留。P帧，即前向预测编码图像帧(Predictive-coded Picture)；P帧表示的是这一帧跟之前的一个关键帧(I帧)的差别。B帧，即双向预测编码图像帧(Bidirectionally predicted Picture)；B帧是双向差别帧，也就是B帧记录的是本帧与前帧和后帧的差别。

在本申请实施例中，帧类型可以包括第一类型和第二类型。针对不同的帧类型，这里的预设选择网络模型也是不同的。

在一种具体的示例中，第一类型可以为I帧，第二类型可以为非I帧。需要注意的是，这里并不作具体限定。

在一种可能的实施方式中，对于亮度选择网络模型而言，第一类型对应的亮度选择网络模型可以称为第一亮度选择网络模型，第二类型对应的亮度选择网络模型可以称为第二亮度选择网络模型。因此，在一些实施例中，在当前块的颜色分量类型为亮度分量的情况下，所述确定当前块的亮度选择网络模型，可以包括：

若当前块所属帧的帧类型为第一类型，则确定当前块的第一亮度选择网络模型；或者，

若当前块所属帧的帧类型为第二类型，则确定当前块的第二亮度选择网络模型。

相应地，对于候选亮度环路滤波网络模型来说，根据不同的帧类型，候选亮度环路滤波网络模型也是不同的。具体地，第一类型对应的一个或多个候选亮度环路滤波网络模型可以称为候选第一亮度选择网络模型，第二类型对应的一个或多个候选亮度环路滤波网络模型可以称为候选第二亮度选择网络模型。因此，在一些实施例中，所述根据亮度选择网络模型确定至少两个亮度输出值，可以包括：

若当前块所属帧的帧类型为第一类型，则根据第一亮度选择网络模型确定至少两个亮度输出值；其中，这至少两个亮度输出值包括当前块使用第一亮度环路滤波网络模型时至少一个候选第一亮度环路滤波网络模型各自对应的第一值和当前块不使用第一亮度环路滤波网络模型时的第二值；或者，

若当前块所属帧的帧类型为第二类型，则根据第二亮度选择网络模型确定至少两个亮度输出值；其中，这至少两个亮度输出值包括当前块使用第二亮度环路滤波网络模型时至少一个候选第二亮度环路滤波网络模型各自对应的第一值和当前块不使用第二亮度环路滤波网络模型时的第二值。

进一步地，在本申请实施例中，对于亮度分量对应的一个或多个候选环路滤波网络模型(可简称为“候选亮度环路滤波网络模型”)，无论是第一类型对应的至少一个候选第一亮度环路滤波网络模型，还是第二类型对应的至少一个候选第二亮度环路滤波网络模型，这些候选环路滤波网络模型都是通过模型训练得到的。

在一些实施例中，该方法还可以包括：

确定第一训练集；其中，第一训练集包括至少一个第一训练样本和至少一个第二训练样本，第一训练样本的帧类型为第一类型，第二训练样本的帧类型为第二类型，且第一训练样本和第二训练样本均是根据至少一种量化参数得到的；

利用至少一个第一训练样本的亮度分量对第一神经网络结构进行训练，得到至少一个候选第一亮度环路滤波网络模型；以及

利用至少一个第二训练样本的亮度分量对第一神经网络结构进行训练，得到至少一个候选第二亮度环路滤波网络模型。

在这里，第一神经网络结构包括下述至少之一：卷积层、激活层、残差块和跳转连接层。

也就是说，至少一个候选第一亮度环路滤波网络模型和至少一个候选第二亮度环路滤波网络模型是根据至少一个训练样本对第一神经网络结构进行模型训练确定的，且至少一个候选第一亮度环路滤波网络模型和至少一个候选第二亮度环路滤波网络模型与帧类型、颜色分量类型和量化参数之间具有对应关系。

在另一种可能的实施方式中，对于色度选择网络模型而言，第一类型对应的色度选择网络模型可以称为第一色度选择网络模型，第二类型对应的色度选择网络模型可以称为第二色度选择网络模型。因此，在一些实施例中，在当前块的颜色分量类型为色度分量的情况下，所述确定当前块的色度选择网络模型，可以包括：

若当前块所属帧的帧类型为第一类型，则确定当前块的第一色度选择网络模型；或者，

若当前块所属帧的帧类型为第二类型，则确定当前块的第二色度选择网络模型。

相应地，对于候选色度环路滤波网络模型来说，根据不同的帧类型，候选色度环路滤波网络模型也是不同的。具体地，第一类型对应的一个或多个候选色度环路滤波网络模型可以称为候选第一色度选择网络模型，第二类型对应的一个或多个候选色度环路滤波网络模型可以称为候选第二色度选择网络模型。因此，在一些实施例中，所述根据色度选择网络模型确定至少两个色度输出值，可以包括：

若当前块所属帧的帧类型为第一类型，则根据第一色度选择网络模型确定至少两个色度输出值；其中，这至少两个色度输出值包括当前块使用第一色度环路滤波网络模型时至少一个候选第一色度环路滤波网络模型各自对应的第一值和当前块不使用第一色度环路滤波网络模型时的第二值；或者，

若当前块所属帧的帧类型为第二类型，则根据第二色度选择网络模型确定至少两个色度输出值；其中，这至少两个色度输出值包括当前块使用第二色度环路滤波网络模型时至少一个候选第二色度环路滤波网络模型各自对应的第一值和当前块不使用第二色度环路滤波网络模型时的第二值。

进一步地，在本申请实施例中，对于色度分量对应的一个或多个候选环路滤波网络模型(可简称为“候选色度环路滤波网络模型”)，无论是第一类型对应的至少一个候选第一色度环路滤波网络模型，还是第二类型对应的至少一个候选第二色度环路滤波网络模型，这些候选环路滤波网络模型都是通过模型训练得到的。

在一些实施例中，该方法还可以包括：

利用至少一个第一训练样本的色度分量对第二神经网络结构进行训练，得到至少一个候选第一色度环路滤波网络模型；以及

利用至少一个第二训练样本的色度分量对第二神经网络结构进行训练，得到至少一个候选第二色度环路滤波网络模型。

在这里，第二神经网络结构包括下述至少之一：采样层、卷积层、激活层、残差块、池化层和跳转连接层。

也就是说，至少一个候选第一色度环路滤波网络模型和至少一个候选第二色度环路滤波网络模型是根据至少一个训练样本对第二神经网络结构进行模型训练确定的，且至少一个候选第一色度环路滤波网络模型和至少一个候选第二色度环路滤波网络模型与帧类型、颜色分量类型和量化参数之间具有对应关系。

在一种具体的示例中，第一神经网络结构可以包括第一卷积模块、第一残差模块、第二卷积模块和第一连接模块。

在这里，如图6A所示，第一神经网络结构的输入是重建亮度帧，输出是原始亮度帧；该第一神经网络结构包括有：第一卷积模块601、第一残差模块602、第二卷积模块603和第一连接模块604。其中，在图6A中，第一卷积模块601、第一残差模块602、第二卷积模块603和第一连接模块604顺次连接，且第一连接模块604还与第一卷积模块601的输入连接。

在一种更具体的示例中，对于第一神经网络结构而言，第一卷积模块可以由一层卷积层和一层激活层组成，第二卷积模块可以由两层卷积层和一层激活层组成，连接模块可以由跳转连接层组成，第一残差模块可以包括若干个残差块，且每一个残差块可以由两层卷积层和一层激活层组成。

在另一种具体的示例中，第二神经网络结构可以包括上采样模块、第三卷积模块、第四卷积模块、融合模块、第二残差模块、第五卷积模块和第二连接模块。

在这里，如图6B所示，第二神经网络结构的输入是重建亮度帧和重建色度帧，输出是原始色度帧；该第二神经网络结构包括有：上采样模块605、第三卷积模块606、第四卷积模块607、融合模块608、第二残差模块609、第五卷积模块610和第二连接模块611。其中，在图6B中，上采样模块605的输入是重建色度帧，上采样模块605和第三卷积模块606连接；第四卷积模块607的输入是重建亮度帧，第三卷积模块606和第四卷积模块607与融合模块608连接，融合模块608、第二残差模块609、第五卷积模块610和第二连接模块611顺次连接，且第二连接模块611还与上采样模块605的输入连接。

在一种更具体的示例中，对于第二神经网络结构而言，第三卷积模块可以由一层卷积层和一层激活层组成，第四卷积模块可以由一层卷积层和一层激活层组成，第五卷积模块可以由两层卷积层、一层激活层和一层池化层组成，连接模块可以由跳转连接层组成，第二残差模块可以包括若干个残差块，且每一个残差块可以由两层卷积层和一层激活层组成。

示例性地，以环路滤波网络模型为CNNLF为例，CNNLF对于亮度分量和色度分量分别设计了不同的网络结构。其中，对于亮度分量，其设计了第一神经网络结构，具体参见图7A；对于色度分量，其设计了第二神经网络结构，具体参见图7B。

对于亮度分量，如图7A所示，整个网络结构可以由卷积层、激活层、残差块、跳转连接层等部分组成。这里，卷积层的卷积核可以为3×3，即可以用3×3Conv表示；激活层可以为线性激活函数，即可以用线性整流函数(Rectified Linear Unit，ReLU)表示，又可称为修正线性单元，是一种人工神经网络中常用的激活函数，通常指代以斜坡函数及其变种为代表的非线性函数。残差块(ResBlock)的网络结构如图8中的虚线框所示，可以由卷积层(Conv)、激活层(ReLU)和跳转连接层等组成。在网络结构中，跳转连接层(Concat)是指网络结构中所包括的一条从输入到输出的全局跳转连接，能够使网络能够专注于学习残差，加速了网络的收敛过程。

对于色度分量，如图7B所示，这里引入了亮度分量作为输入之一来指导色度分量的滤波，整个网络结构可以由卷积层、激活层、残差块、池化层、跳转连接层等部分组成。由于分辨率的不一致性，色度分量首先需要进行上采样。为了避免在上采样过程中引入其他噪声，可以通过直接拷贝邻近像素来完成分辨率的扩大，以得到放大色度帧(Enlarged chroma frame)。另外，在网络结构的末端，还使用了池化层(如平均值池化层，用2×2AvgPool表示)来完成色度分量的下采样。具体地，在HPM-ModAI的应用中，亮度分量网络的残差块数量可设置为N＝20，色度分量网络的残差块数量可设置为N＝10。

这样，在模型训练阶段，可以离线的训练出4个I帧亮度分量模型，4个非I帧亮度分量模型，4个色度U分量模型，4个色度V分量模型等共16种候选环路滤波网络模型。

还可以理解，针对不同的颜色分量类型，其对应的预设选择网络模型也不相同。在这里，亮度分量对应的预设选择网络模型可以称为亮度选择网络模型，色度分量对应的预设选择网络模型可以称为色度选择网络模型。

在一种可能的实施方式中，在当前块的颜色分量类型为亮度分量的情况下，所述确定当前块的亮度选择网络模型，可以包括：

确定至少一个候选亮度选择网络模型，候选亮度选择网络模型包括候选第一亮度选择网络模型和/或候选第二亮度选择网络模型；

确定当前块所属帧的帧类型和量化参数；

若帧类型为第一类型，则从至少一个候选亮度选择网络模型中确定第一类型对应的至少一个候选第一亮度选择网络模型，并根据量化参数从至少一个候选第一亮度选择网络模型中确定当前块的第一亮度选择网络模型；或者，

若帧类型为第二类型，则从至少一个候选亮度选择网络模型中确定第二类型对应的至少一个候选第二亮度选择网络模型，并根据量化参数从至少一个候选第二亮度选择网络模型中确定当前块的第二亮度选择网络模型。

在另一种可能的实施方式中，在当前块的颜色分量类型为色度分量的情况下，所述确定当前块的色度选择网络模型，可以包括：

确定至少一个候选色度选择网络模型，候选色度选择网络模型包括候选第一色度选择网络模型和/或候选第二色度选择网络模型；

确定当前块所属帧的帧类型和量化参数；

若帧类型为第一类型，则从至少一个候选色度选择网络模型中确定第一类型对应的至少一个候选第一色度选择网络模型，并根据量化参数从至少一个候选第一色度选择网络模型中确定当前块的第一色度选择网络模型；或者，

若帧类型为第二类型，则从至少一个候选色度选择网络模型中确定第二类型对应的至少一个候选第二色度选择网络模型，并根据量化参数从至少一个候选第二色度选择网络模型中确定当前块的第二色度选择网络模型。

需要说明的是，当前块的预设选择网络模型不仅和量化参数有关，而且还和帧类型、颜色分量类型有关。其中，不同的颜色分量类型，对应有不同的预设选择网络模型，比如对于亮度分量来说，预设选择网络模型可以是与亮度分量相关的亮度选择网络模型；对于色度分量来说，预设选择网络模型可以是与色度分量相关的色度选择网络模型。而且，不同的帧类型，其对应的预设选择网络模型也是不同的。对于与亮度分量相关的亮度选择网络模型，第一类型对应的亮度选择网络模型可以称为第一亮度选择网络模型，第二类型对应的亮度选择网络模型可以称为第二亮度选择网络模型；对于与色度分量相关的色度选择网络模型，第一类型对应的色度选择网络模型可以称为第一色度选择网络模型，第二类型对应的色度选择网络模型可以称为第二色度选择网络模型。

还需要说明的是，在本申请实施例中，根据不同的量化参数，比如QP的取值为27～31、32～37、38～44、45～50等，以及不同的帧类型，比如第一类型和第二类型等，预先可以训练出至少一个候选亮度选择网络模型(包括候选第一亮度选择网络模型和/或候选第二亮度选择网络模型)以及至少一个候选色度选择网络模型(包括候选第一色度选择网络模型和/或候选第二色度选择网络模型)。

这样，对于亮度分量，在确定出当前块的帧类型后，假定帧类型为I帧，可以从至少一个候选亮度选择网络模型中确定出I帧类型对应的至少一个候选I帧亮度选择网络模型；根据当前块的量化参数，可以从至少一个候选I帧亮度选择网络模型中选取出该量化参数对应的I帧亮度选择网络模型，即当前块的亮度选择网络模型；或者，假定帧类型为非I帧，可以从至少一个候选亮度选择网络模型中确定出非I帧类型对应的至少一个候选非I帧亮度选择网络模型；根据当前块的量化参数，可以从至少一个候选非I帧亮度选择网络模型中选取出该量化参数对应的非I帧亮度选择网络模型，即当前块的亮度选择网络模型。另外，对于色度分量，其色度选择网络模型的确定方式与亮度分量相同，这里不再详述。

进一步地，对于至少一个候选亮度选择网络模型和至少一个候选色度选择网络模型的模型训练，在一些实施例中，该方法还可以包括：

确定第二训练集，其中，第二训练集包括至少一个训练样本，且所述训练样本是根据至少一种量化参数得到的；

利用第二训练集中训练样本的亮度分量对第三神经网络结构进行训练，得到至少一个候选亮度选择网络模型；

利用第二训练集中训练样本的色度分量对第三神经网络结构进行训练，得到至少一个候选色度选择网络模型。

也就是说，至少一个候选亮度选择网络模型是根据至少一个训练样本对第三神经网络结构进行模型训练确定的，且这至少一个候选亮度选择网络模型与帧类型、颜色分量类型和量化参数之间具有对应关系。另外，至少一个候选色度选择网络模型也是根据至少一个训练样本对第三神经网络结构进行模型训练确定的，且这至少一个候选色度选择网络模型与帧类型、颜色分量类型和量化参数之间具有对应关系。

需要说明的是，在本申请实施例中，第三神经网络结构可以包括下述至少之一：卷积层、池化层、全连接层和激活层。

在一种具体的示例中，第三神经网络结构可以包括第六卷积模块和全连接模块，第六卷积模块和全连接模块顺次连接。

在一种更具体的示例中，第六卷积模块可以包括若干个卷积子模块，每一个卷积子模块可以由一层卷积层和一层池化层组成；全连接模块可以包括若干个全连接子模块，每一个全连接子模块可以由一层全连接层和一层激活层组成。

也就是说，预设选择网络模型可以选择多层卷积神经网络和多层全连接层神经网络组成，然后利用训练样本进行深度学习以得到当前块的预设选择网络模型，如亮度选择网络模型或者色度选择网络模型。

在本申请实施例中，深度学习是机器学习的一种，而机器学习是实现人工智能的必经路径。深度学习的概念源于人工神经网络的研究，含多个隐藏层的多层感知器就是一种深度学习结构。深度学习可以通过组合低层特征形成更加抽象的高层表示属性类别或特征，以发现数据的分布式特征表示。在本申请实施例中，以卷积神经网络(Convolutional Neural Networks，CNN)为例，它是一类包含卷积计算且具有深度结构的前馈神经网络(Feedforward Neural Networks)，是深度学习(Deep Learning)的代表算法之一。这里的预设选择网络模型可以是一种卷积神经网络结构。

示例性地，无论是亮度选择网络模型还是色度选择网络模型，其可以看作是由第三神经网络结构进行训练得到的。也就是说，对于预设选择网络模型，本申请实施例还设计了第三神经网络结构，具体如图9A和图9B。

如图9A所示，第三神经网络结构的输入是重建帧，输出是当前块使用环路滤波网络模型时的各个候选环路滤波网络模型以及当前块不使用环路滤波网络模型时的概率分布情况。在图9A中，该第三神经网络结构包括有：第六卷积模块901和全连接模块902，且第六卷积模块901和全连接模块902顺次连接。其中，第六卷积模块901可以包括若干个卷积子模块，每一个卷积子模块可以由一层卷积层和一层池化层组成；全连接模块902可以包括若干个全连接子模块，每一个全连接子模块可以由一层全连接层和一层激活层组成。

在一种具体的示例中，如图9B所示，第三神经网络结构可以由多层卷积神经网络和多层全连接神经网络组成。其中，该网络结构可以包括K层卷积层、M层池化层、L层全连接层和N层激活层，K、M、L、N均为大于或等于1的整数。

在一种更具体的示例中，K＝3，M＝3，L＝2，N＝2。

这样，基于图9B所示的网络结构，其可以由3层卷积层和2层全连接层组成，而且每一层卷积层之后设置有池化层；其中，卷积层的卷积核可以为3×3，即可以用3×3Conv表示；池化层可以采用最大值池化层，用2×2MaxPool表示；另外，每一层全连接层之后设置有激活层，在这里，激活层可以为线性激活函数，也可以为非线性激活函数，比如ReLU和Softmax等。

还需要说明的是，对于预设选择网络模型(比如候选亮度选择网络模型或者候选色度选择网络模型)，还可以利用损失函数进行模型训练。在一些实施例中，该方法还可以包括：

确定第二训练集以及预设损失函数；其中，第二训练集包括至少一个训练样本，且所述训练样本是根据至少一种量化参数得到的；

利用第二训练集中训练样本的亮度分量对第三神经网络结构进行训练，在所述预设损失函数的损失值收敛到损失阈值时，得到至少一个候选亮度选择网络模型；以及

利用第二训练集中训练样本的色度分量对第三神经网络结构进行训练，在所述预设损失函数的损失值收敛到损失阈值时，得到至少一个候选色度选择网络模型。

需要说明的是，对于预设损失函数来说，在一种可能的实施方式中，本申请实施例还提供了一种加权的损失函数进行模型训练的方法。具体如下式所示，

lossFunction＝(clip(Wa×reca+Wb×recb+…+Wn×recn+Woff×rec0,0,N)-orig) ²

其中，Wa,Wb,…,Wn,Woff分别表示预设选择网络模型的输出，代表了至少一个候选环路滤波网络模型a,b,…,n，以及不使用环路滤波网络模型(即模型关闭)的概率值。reca,recb,…,recn分别表示使用候选环路滤波网络模型a,b,…,n后的输出重建图像，rec0则表示经过DBF和SAO之后的输出重建图像。Clip函数将数值限定在0～N之间。N表示像素值的最大值，例如对于10bit的YUV图像，N为1023；orig则表示原始图像。

这样，可以将预设选择网络模型的至少两个输出概率值作为至少一个候选CNNLF模型以及不使用CNNLF模型时的输出重建图像的加权权值，最终与原始图像orig计算均方误差，可以得到损失函数值。

在另一种可能的实施方式中，本申请实施例还提供了一种将分类网络常用的交叉熵损失函数应用到本申请实施例的技术方案中。具体如下式所示，

label(i)＝argmin((reca-orig) ²,(recb-orig) ²,…,(recn-orig) ²,(rec0-orig) ²)

lossFunction＝-label(i)×log(softmax(Wi))

其中，label(i)表示至少一个候选环路滤波网络模型a,b,…,n的输出重建图像，以及经过DBF和SAO之后的输出重建图像分别与原始图像计算均方误差，并取其中最小误差所对应的序号的值i。Wa,Wb,…,Wn,Woff分别表示预设选择网络模型的输出，代表了至少一个候选环路滤波网络模型a,b,…,n，以及不使用环路滤波网络模型(即模型关闭)的概率值。Wi表示与label(i)相同序号的概率值。然后计算Wi的softmax，并与label(i)相乘，可以得到交叉熵损失值。

进一步地，根据上述的实施方式，在确定出预设选择网络模型和至少一个候选环路滤波网络模型之后，还可以确定当前块使用环路滤波网络模型时的各个候选环路滤波网络模型以及当前块不使用环路滤波网络模型时的概率分布情况。在一些实施例中，所述根据当前块的预设选择网络模型确定至少两个输出值，可以包括：

确定当前块的第二重建图像块；

将第二重建图像块输入预设选择网络模型，得到至少两个输出值。

在这里，这至少两个输出值可以包括当前块使用环路滤波网络模型时至少一个候选环路滤波网络模型各自对应的第一值和当前块不使用环路滤波网络模型时的第二值。

还需要说明的是，以输出值为概率值为例，环路滤波网络模型可以是指前述的CNNLF模型。在确定出待输入CNNLF模型的第二重建图像块之后，将第二重建图像块作为预设选择网络模型的输入，而预设选择网络模型的输出即为至少一个候选CNNLF模型以及当前块不使用CNNLF模型的概率分布情况(包括：这至少一个候选CNNLF模型各自对应的第一值和当前块不使用CNNLF模型时的第二值)。

S403：根据至少两个输出值，确定当前块使用环路滤波网络模型时的目标环路滤波网络模型或者当前块不使用环路滤波网络模型。

S404：当当前块使用环路滤波网络模型时，利用目标环路滤波网络模型对当前块进行滤波处理，得到当前块的第一重建图像块。

需要说明的是，在确定出至少一个候选CNNLF模型各自对应的第一值和当前块不使用CNNLF模型时的第二值之后，可以根据这这至少两个输出值确定出当前块使用环路滤波网络模型时的目标环路滤波网络模型或者所述当前块不使用环路滤波网络模型。

在一些实施例中，所述根据所述至少两个输出值，确定当前块使用环路滤波网络模型时的目标环路滤波网络模型或者当前块不使用环路滤波网络模型，可以包括：

从至少两个输出值中确定目标值；

若目标值为所述第一值，则确定当前块使用环路滤波网络模型，且将目标值对应的候选环路滤波网络模型作为目标环路滤波网络模型；或者，

若目标值为所述第二值，则确定当前块不使用环路滤波网络模型。

在一种具体的示例中，所述从至少两个输出值中确定目标值，可以包括：从至少两个值中选取最大值，将最大值作为所述目标值。

也就是说，无论是亮度环路滤波网络模型还是色度环路滤波网络模型，均是先通过模型训练以得到若干个候选亮度环路滤波网络模型或者若干个候选亮度环路滤波网络模型，然后再利用预设选择网络模型进行模型决策，如果这至少两个输出值中第二值为最大值，那么可以确定出当前块不使用环路滤波网络模型；如果这至少两个输出值中第二值不为最大值，那么将第一值中的最大值对应的候选环路滤波网络模型确定为目标环路滤波网络模型，以便利用该目标环路滤波网络模型对当前块进行滤波处理。

还需要说明的是，根据颜色分量类型的不同，预设选择网络模型包括亮度选择网络模型和色度选择网络模型；这样，对于第二重建图像块来说，也可以包括输入重建亮度图像块和输入重建色度图像块。

在一种可能的实施方式中，在当前块的颜色分量类型为亮度分量的情况下，所述根据当前块的预设选择网络模型确定至少两个输出值，可以包括：

确定亮度环路滤波网络模型的输入重建亮度图像块；

将输入重建亮度图像块输入亮度选择网络模型，得到至少两个亮度输出值。

在这里，至少两个亮度输出值可以包括当前块使用亮度环路滤波网络模型时至少一个候选亮度环路滤波网络模型各自对应的第一值和当前块不使用亮度环路滤波网络模型时的第二值。

进一步地，在一些实施例中，以亮度输出值为概率值为例，该方法还可以包括：从至少两个亮度输出值中选取最大概率值；若最大概率值为第一值，则确定当前块使用亮度环路滤波网络模型，且将最大概率值对应的候选亮度环路滤波网络模型作为目标亮度环路滤波网络模型；或者，若最大概率值为第二值，则确定当前块不使用亮度环路滤波网络模型。

在另一种可能的实施方式中，在当前块的颜色分量类型为色度分量的情况下，所述根据当前块的预设选择网络模型确定至少两个输出值，可以包括：

确定色度环路滤波网络模型的输入重建色度图像块；

将输入重建色度图像块输入色度选择网络模型，得到至少两个色度输出值。

在这里，至少两个色度输出值可以包括当前块使用色度环路滤波网络模型时至少一个候选色度环路滤波网络模型各自对应的第一值和当前块不使用色度环路滤波网络模型时的第二值。

进一步地，在一些实施例中，以色度输出值为概率值为例，该方法还可以包括：从至少两个色度输出值中选取最大概率值；若最大概率值为第一值，则确定当前块使用色度环路滤波网络模型，且将最大概率值对应的候选色度环路滤波网络模型作为目标色度环路滤波网络模型；或者，若最大概率值为第二值，则确定当前块不使用色度环路滤波网络模型。

这样，在确定出当前块使用的目标环路滤波网络模型(包括目标亮度环路滤波网络模型或者目标色度环路滤波网络模型)之后，可以利用所选取的目标环路滤波网络模型对当前块进行滤波处理。具体地，在一种可能的实施方式中，当当前块使用环路滤波网络模型时，所述利用目标环路滤波网络模型对当前块进行滤波处理，得到当前块的第一重建图像块，可以包括：

确定当前块的第二重建图像块；

将第二重建图像块输入到目标环路滤波网络模型，得到当前块的第一重建图像块。

在另一种可能的实施方式中，当当前块不使用环路滤波网络模型时，该方法还可以包括：将第二重建图像块确定为当前块的第一重建图像块。

简言之，在确定出这至少两个输出值后，如果从这至少两个输出值中确定出最大值为第二值，意味着当前块不使用环路滤波网络模型的率失真代价最小，那么可以确定出当前块不使用环路滤波网络模型，即将第二重建图像块直接确定为当前块的第一重建图像块；如果从这至少两个输出值中确定出最大值为某一第一值，意味着当前块使用环路滤波网络模型的率失真代价最小，那么可以将某一第一值对应的候选环路滤波网络模型确定为目标环路滤波网络模型，然后将第二重建图像块输入到该目标环路滤波网络模型中，得到当前块的第一重建图像块。

在一些实施例中，对于第二重建图像块(包括输入重建亮度图像块或者输入重建色度图像块)来说，这里，第二重建图像块可以是经由去块滤波器和样值自适应补偿滤波器进行滤波处理后得到。

还需要说明的是，本申请实施例所述的环路滤波网络模型可以为CNNLF模型。这样，利用所选取的CNNLF模型对当前块进行CNNLF滤波处理，可以得到当前块的第一重建图像块。

进一步地，在一些实施例中，该方法还可以包括：在确定出当前块的第一重建图像块之后，利用自适应修正滤波器对第一重建图像块进行滤波处理。

示例性地，参见图10，其示出了本申请实施例提供的一种使用预设选择网络模型的整体框架示意图。如图10所示，结合图9B所示的网络结构，该网络结构的输入为CNNLF模型的输入重建亮度图像块或输入重建色度图像块，该网络结构的输出为至少一个CNNLF模型各自对应的概率值以及当前块不使用CNNLF模型(即决策关闭CNNLF模型)的概率值。如果输出的概率值最大的为某个CNNLF模型的索引序号，那么可以选择该CNNLF模型为输入重建亮度图像块或输入重建色度图像块进行CNNLF滤波处理；如果输出的概率值最大的为决策关闭CNNLF模型，那么可以不使用神经网络滤波处理。另外，根据图10还可以得到，第二重建图像块是经由去块滤波器(DBF)和样值自适应补偿滤波器(SAO)进行滤波处理后得到的，然后第二重建图像块经由模型自适应选择模块和CNNLF模型后得到的第一重建图像块还可以输入自适应修正滤波器(ALF)继续进行滤波处理。

本实施例提供了一种解码方法，应用于解码器。通过解析码流，确定第一语法元素标识信息的取值；当第一语法元素标识信息指示当前块允许使用预设选择网络模型进行模型决策时，根据当前块的预设选择网络模型确定至少两个输出值；其中，至少两个输出值包括当前块使用环路滤波网络模型时至少一个候选环路滤波网络模型各自对应的第一值和当前块不使用环路滤波网络模型时的第二值；根据至少两个输出值，确定当前块使用环路滤波网络模型时的目标环路滤波网络模型或者当前块不使用环路滤波网络模型；当当前块使用环路滤波网络模型时，利用目标环路滤波网络模型对当前块进行滤波处理，得到当前块的第一重建图像块。这样，通过引入基于深度学习的神经网络技术对环路滤波网络模型进行自适应决策，可以确定当前块使用环路滤波网络模型时的目标环路滤波网络模型或者当前块不使用环路滤波网络模型；如果当前块使用环路滤波网络模型，那么可以还可以利用目标环路滤波网络模型对当前块进行滤波处理，如此不仅可以降低复杂度，还可以避免额外的比特开销，提升编码性能，进而能够提高编解码效率；另外，还可以使得最终输出的第一重建图像块更加接近于原始图像块，能够提升视频图像质量。

在本申请的另一实施例中，为了节省解码器的复杂度，参见图11，其示出了本申请实施例提供的另一种解码方法的流程示意图。如图11所示，该方法可以包括：

S1101：解析码流，确定第一语法元素标识信息的取值。

S1102：当第一语法元素标识信息指示当前块允许使用预设选择网络模型进行模型决策时，解析码流，确定环路滤波网络模型的标识信息。

S1103：若环路滤波网络模型的标识信息为模型关闭信息，则确定当前块不使用环路滤波网络模型。

S1104：若环路滤波网络模型的标识信息为环路滤波网络模型索引序号，则根据环路滤波网络模型索引序号，从至少一个候选环路滤波网络模型中确定当前块使用的目标环路滤波网络模型。

S1105：利用目标环路滤波网络模型对当前块进行滤波处理，得到当前块的第一重建图像块。

需要说明的是，为了方便解码器能够确定当前块是否允许使用预设选择网络模型进行模型决策，可以设置一个第一语法元素标识信息，然后根据解码获得的第一语法元素标识信息的取值来确定。其中，第一语法元素标识信息可以用model_adaptive_decision_enable_flag表示。

在一种具体的示例中，如果model_adaptive_decision_enable_flag的取值为第一标识值，那么可以确定当前块允许使用预设选择网络模型进行模型决策；或者，如果model_adaptive_decision_enable_flag的取值为第二标识值，那么可以确定当前块不允许使用所述预设选择网络模型进行模型决策。示例性地，第一标识值可以为1，第二标识值可以为0，但这里不作任何限定。

还需要说明的是，本申请实施例还可以设置一个环路滤波网络模型的标识信息，用于确定当前块使用环路滤波网络模型时的环路滤波网络模型索引序号或者当前块不使用环路滤波网络模型。

以CNNLF模型为例，对于解码器侧的模型自适应决策使用模块，可以根据在编码器侧模型自适应决策使用模块所确定的环路滤波网络模型的标识信息，根据解码获取的环路滤波网络模型的标识信息，可以确定出当前块不使用环路滤波网络模型或者当前块使用的环路滤波网络模型索引序号。根据该环路滤波网络模型索引序号即可确定出当前块使用的目标环路滤波网络模型，进而根据目标环路滤波网络模型对当前块进行CNNLF滤波处理，从而降低解码器的复杂度。

除此之外，针对前述实施例中的第一神经网络结构、第二神经网络结构和第三神经网络结构等，其包括的卷积层数量，全连接层数量，非线性激活函数等均可以进行调整。另外，模型自适应决策使用模块所针对的环路滤波网络模型，除了CNNLF模型之外，还可以是针对其他高效的神经网络滤波器模型进行模型的自适应决策使用，本申请实施例也不作任何限定。

简言之，本申请实施例提出了一种基于深度学习的模型自适应决策使用模块，用于对CNNLF模型的使用进行自适应决策，不再需要计算率失真代价和传输帧级、CTU级等开关信息，避免额外的比特开销，提升编码性能。模型自适应决策使用模块可以看作是由多层卷积神经网络和多层全连接神经网络组成的预设选择网络模型，其输入为当前块的第二重建图像块(即CNNLF模型的输入重建图像块)，输出为各个CNNLF模型以及决策为关闭CNNLF模型的概率分布情况。模型自适应决策使用模块位于编码器/解码器中的位置如图5所示，模型自适应选择模块的使用不依赖于DBF、SAO、ALF、CNNLF的标志位，只是在位置上置于CNNLF之前。

在一种具体的示例中，本申请实施例的技术方案作用在解码器的环路滤波模块中，其具体流程如下：

解码器获取并解析码流，当解析到环路滤波模块时，按照预设的滤波器顺序进行处理。这里，预设的滤波器顺序为DBF滤波---->SAO滤波---->模型自适应决策使用模块---->CNNLF滤波---->ALF滤波。当进入模型自适应决策使用模块时，

(a)首先根据解码得到的model_adaptive_decision_enable_flag判断当前块下是否允许使用模型自适应决策使用模块进行模型决策。如果model_adaptive_decision_enable_flag为“1”，那么对当前块尝试进行模型自适应决策使用模块处理，跳转至(b)；如果model_adaptive_decision_enable_flag为“0”，那么跳转至(e)；

(b)判断当前块的颜色分量类型，如果当前块为亮度块，那么跳转至(c)；如果当前块为色度块，那么跳转(d)；

(c)对于亮度分量，将CNNLF模型的输入重建亮度图像块作为模型自适应决策使用模块的输入，输出为各个亮度CNNLF模型以及决策为关闭亮度CNNLF模型的概率分布情况。若输出的概率值最大的为决策关闭亮度CNNLF模型，则跳转至(e)；若输出的概率值最大的为某个亮度CNNLF模型的索引序号，则选择该模型对当前亮度图像块进行CNNLF滤波处理，得到最终输出的重建亮度图像块；

(d)对于色度分量，将CNNLF模型的输入重建色度图像块作为模型自适应决策使用模块的输入，输出为各个色度CNNLF模型以及决策为关闭色度CNNLF模型的概率分布情况。若输出的概率值最大的为决策关闭色度CNNLF模型，则跳转至(e)；若输出的概率值最大的为某个色度CNNLF模型的索引序号，则选择该模型对当前色度图像块进行CNNLF滤波处理，得到最终输出的重建色度图像块；

(e)如果当前帧已完成模型自适应决策使用模块的处理，那么加载下一帧进行处理，然后跳转至(a)。

在实现中，其语法元素的修改如下所示。

(1)序列头定义，其语法元素的修改如表1所示。

表1

其中，基于神经网络的模型自适应决策使用的允许标志可以用model_adaptive_decision_enable_flag表示。

(2)帧内预测图像头定义，其语法元素的修改如表2所示。

表2

其中，当基于神经网络的模型自适应决策使用的允许标志model_adaptive_decision_enable_flag为1 时，可取消以下语义的定义：

图像级神经网络滤波允许标志picture_nn_filter_enable_flag[compIdx]

图像级选择性滤波自适应标志picture_nn_filter_adaptive_flag[compIdx]

图像级神级网络滤波模型索引picture_nn_filter_set_index[compIdx]

(3)帧间预测图像头定义，其语法元素的修改如表3所示。

表3

其中，当基于神经网络的模型自适应决策使用的允许标志model_adaptive_decision_enable_flag为1时，可取消以下语义的定义：

图像级神经网络滤波允许标志picture_nn_filter_enable_flag[compIdx]

图像级选择性滤波自适应标志picture_nn_filter_adaptive_flag[compIdx]

图像级神级网络滤波模型索引picture_nn_filter_set_index[compIdx]

(4)片定义，其语法元素的修改如表4所示。

表4

最大编码单元神经网络滤波允许标志nn_filter_lcu_enable_flag[compIdx][LcuIdx]

最大编码单元神经网络滤波模型索引序号标志nn_filter_lcu_set_index[compIdx][LcuIdx]

通过上述实施例，对前述实施例的具体实现进行了详细阐述，从中可以看出，通过前述实施例的技术方案，该实施例通过引入基于深度学习的模型自适应决策技术，将当前块的第二重建图像块(即CNNLF模型的输入重建图像块)输入多层卷积层加多层全连接层的神经网络结构中，输出各个CNNLF模型以及决策为关闭CNNLF模型的概率分布情况，为第二重建图像块自适应地决策使用合适的CNNLF 模型或者不使用CNNLF模型，这时候不再需要计算率失真代价和传输帧级、CTU级等开关信息，避免额外的比特开销，使编码性能提升。

在本申请的又一实施例中，参见图12，其示出了本申请实施例提供的一种编码方法的流程示意图。如图12所示，该方法可以包括：

S1201：确定第一语法元素标识信息的取值。

需要说明的是，视频图像可以划分为多个图像块，每个当前待编码的图像块可以称为编码块。这里，每个编码块可以包括第一图像分量、第二图像分量和第三图像分量；而当前块即为视频图像中当前待进行第一图像分量、第二图像分量或者第三图像分量环路滤波处理的编码块。其中，这里的当前块可以为CTU，也可以为CU，甚至还可以是比CU更小的块，本申请实施例不作任何限定。

还需要说明的是，在编码器侧，本申请实施例具体提供了一种环路滤波方法，尤其是一种基于深度学习的环路滤波网络模型使用的自适应决策方法，该方法应用在如图3A所示的滤波单元108部分。在这里，滤波单元108可以包括去块滤波器(DBF)、样值自适应补偿滤波器(SAO)、基于残差神经网络的环路滤波器(CNNLF)和自适应修正滤波器(ALF)。对于该滤波单元108来说，利用本申请实施例所述的方法可以对该滤波单元108中的CNNLF模型进行自适应地决策，以便决策出当前块使用CNNLF模型时的目标模型或者当前块不使用CNNLF模型。

更具体地，本申请实施例提出了一种基于深度学习的模型自适应决策使用模块，详见图5所示的模型自适应选择模块，可以用于对环路滤波网络模型(比如CNNLF模型)是否使用以及使用哪一个CNNLF模型进行自适应决策，从而提升编码性能。

在本申请实施例中，对于模型自适应决策使用模块，当前块是否允许使用预设选择网络模型进行模型决策，可以通过一个第一语法元素标识信息进行指示。在一些实施例中，所述确定第一语法元素标识信息的取值，包括：

若当前块允许使用预设选择网络模型进行模型决策，则确定第一语法元素标识信息的取值为第一标识值；和/或，

若当前块不允许使用预设选择网络模型进行模型决策，则确定第一语法元素标识信息的取值为第二标识值。

进一步地，该方法还包括：对第一语法元素标识信息的取值进行编码，将编码比特写入码流。

也就是说，首先可以设置一个第一语法元素标识信息，以指示当前块是否允许使用预设选择网络模型进行模型决策。在这里，如果当前块允许使用预设选择网络模型进行模型决策，那么可以确定第一语法元素标识信息的取值为第一标识值；如果当前块不允许使用预设选择网络模型进行模型决策，那么可以确定第一语法元素标识信息的取值为第二标识值。这样，在编码器中，当确定出第一语法元素标识信息的取值后，将第一语法元素标识信息的取值写入码流以传输到解码器，使得解码器通过解析码流即可获知当前块是否允许使用预设选择网络模型进行模型决策。

在这里，第一标识值和第二标识值不同，而且第一标识值和第二标识值可以是参数形式，也可以是数字形式。具体地，第一语法元素标识信息可以是写入在概述(profile)中的参数，也可以是一个标志(flag)的取值，本申请实施例对此不作任何限定。

还需要说明的是，预设选择网络模型可以看作是一个神经网络，而第一语法元素标识信息可以看作是一个基于神经网络的模型自适应决策的允许标志，这里可以用model_adaptive_decision_enable_flag表示。具体来说，model_adaptive_decision_enable_flag可以用于指示当前块是否允许使用预设选择网络模型进行模型的自适应决策。

这样，以第一标识值为1，第二标识值为0为例，如果model_adaptive_decision_enable_flag的取值为1，那么可以确定当前块允许使用预设选择网络模型进行模型决策；如果model_adaptive_decision_enable_flag的取值为0，那么可以确定当前块不允许使用预设选择网络模型进行模型决策。

S1202：当第一语法元素标识信息指示当前块允许使用预设选择网络模型进行模型决策时，根据当前块的预设选择网络模型确定至少两个输出值；其中，至少两个输出值包括当前块使用环路滤波网络模型时至少一个候选环路滤波网络模型各自对应的第一值和当前块不使用环路滤波网络模型时的第二值。

需要说明的是，如果当前块允许使用预设选择网络模型进行模型决策，那么这时候可以根据当前块的颜色分量类型、量化参数和所属帧的帧类型等，从若干个候选的预设选择网络模型中确定出当前块使用的预设选择网络模型，然后根据预设选择网络模型确定当前块使用环路滤波网络模型时的至少一个候选环路滤波网络模型和当前块不使用环路滤波网络模型的概率分布情况。具体地，在本申请实施例中，这至少两个输出值可以包括当前块使用环路滤波网络模型时至少一个候选环路滤波网络模型各自对应的第一值和当前块不使用环路滤波网络模型时的第二值。

在一种具体的示例中，第一值可以用于反映当前块使用环路滤波网络模型时这至少一个候选环路滤波网络模型的概率分布情况，第二值可以用于反映当前块不使用环路滤波网络模型时的概率分布情况。换言之，第一值和第二值均可以用概率值表示；即根据预设选择网络模型，所确定的至少两个输出值可以为至少两个概率值。或者，第一值和第二值还可以用于反映当前块使用环路滤波网络模型时这至少一个候选环路滤波网络模型和当前块不使用环路滤波网络模型的权重分配情况；即第一值和第二值也可以称为权重值，本申请实施例不作任何限定。

可以理解地，对于颜色分量类型而言，其可以包括亮度分量和色度分量。针对不同的颜色分量类型，这里的预设选择网络模型并不相同。在本申请实施例中，亮度分量对应的预设选择网络模型可以称为亮度选择网络模型，色度分量对应的预设选择网络模型可以称为色度选择网络模型。因此，在一些实施例中，所述确定当前块的预设选择网络模型，可以包括：

若当前块的颜色分量类型为色度分量(即当前块为亮度块时)，则确定当前块的色度选择网络模型。

进一步地，对于帧类型来说，其可以包括I帧、P帧和B帧。在本申请实施例中，帧类型可以包括第一类型和第二类型。针对不同的帧类型，这里的预设选择网络模型也是不同的。在一种具体的示例中，第一类型可以为I帧，第二类型可以为非I帧。需要注意的是，这里并不作具体限定。

相应地，对于候选亮度环路滤波网络模型来说，根据不同的帧类型，候选亮度环路滤波网络模型也是不同的。具体地，第一类型对应的候选亮度环路滤波网络模型可以称为候选第一亮度选择网络模型，第二类型对应的候选亮度环路滤波网络模型可以称为候选第二亮度选择网络模型。因此，在一些实施例中，所述根据亮度选择网络模型确定至少两个亮度输出值，可以包括：

进一步地，在本申请实施例中，对于至亮度分量对应的少一个候选环路滤波网络模型(可简称为“候选亮度环路滤波网络模型”)，无论是第一类型对应的至少一个候选第一亮度环路滤波网络模型，还是第二类型对应的至少一个候选第二亮度环路滤波网络模型，这些候选环路滤波网络模型都是通过模型训练得到的。

在一些实施例中，该方法还可以包括：

进一步地，在本申请实施例中，对于色度分量对应的至少一个候选环路滤波网络模型(可简称为“候选色度环路滤波网络模型”)，无论是第一类型对应的至少一个候选第一色度环路滤波网络模型，还是第二类型对应的至少一个候选第二色度环路滤波网络模型，这些候选环路滤波网络模型都是通过模型训练得到的。

在一些实施例中，该方法还可以包括：

在一种具体的示例中，第一神经网络结构可以包括第一卷积模块、第一残差模块、第二卷积模块和第一连接模块。其中，对于第一神经网络结构而言，第一卷积模块可以由一层卷积层和一层激活层组成，第二卷积模块可以由两层卷积层和一层激活层组成，连接模块可以由跳转连接层组成，第一残差模块可以包括若干个残差块，且每一个残差块可以由两层卷积层和一层激活层组成。

在另一种具体的示例中，第二神经网络结构可以包括上采样模块、第三卷积模块、第四卷积模块、融合模块、第二残差模块、第五卷积模块和第二连接模块。其中，对于第二神经网络结构而言，第三卷积模块可以由一层卷积层和一层激活层组成，第四卷积模块可以由一层卷积层和一层激活层组成，第五卷积模块可以由两层卷积层、一层激活层和一层池化层组成，连接模块可以由跳转连接层组成，第二残差模块可以包括若干个残差块，且每一个残差块可以由两层卷积层和一层激活层组成。

示例性地，以环路滤波网络模型为CNNLF为例，CNNLF对于亮度分量和色度分量分别设计了不同的网络结构。其中，对于亮度分量，其设计了第一神经网络结构，具体参见图6A和图7A；对于色度分量，其设计了第二神经网络结构，具体参见图6B和图7B。

对于亮度分量，以图7A为例，整个网络结构可以由卷积层、激活层、残差块、跳转连接层等部分组成。这里，卷积层的卷积核可以为3×3，即可以用3×3Conv表示；激活层可以为线性激活函数，即可以用线性整流函数(Rectified Linear Unit，ReLU)表示，又可称为修正线性单元，是一种人工神经网络中常用的激活函数，通常指代以斜坡函数及其变种为代表的非线性函数。残差块(ResBlock)的网络结构如图8中的虚线框所示，可以由卷积层(Conv)、激活层(ReLU)和跳转连接层等组成。在网络结构中，跳转连接层(Concat)是指网络结构中所包括的一条从输入到输出的全局跳转连接，能够使网络能够专注于学习残差，加速了网络的收敛过程。

对于色度分量，以图7B为例，这里引入了亮度分量作为输入之一来指导色度分量的滤波，整个网络结构可以由卷积层、激活层、残差块、池化层、跳转连接层等部分组成。由于分辨率的不一致性，色度分量首先需要进行上采样。为了避免在上采样过程中引入其他噪声，可以通过直接拷贝邻近像素来完成分辨率的扩大，以得到放大色度帧(Enlarged chroma frame)。另外，在网络结构的末端，还使用了池化层(如2×2AvgPool)来完成色度分量的下采样。具体地，在HPM-ModAI的应用中，亮度分量网络的残差块数量可设置为N＝20，色度分量网络的残差块数量可设置为N＝10。

在这里，CNNLF的使用可以包含离线训练和推理测试两个阶段。其中，在离线训练阶段，可以离线的训练了4个I帧亮度分量模型，4个非I帧亮度分量模型，4个色度U分量模型，4个色度V分量模型等共16种模型。具体地，使用预设图像数据集(例如DIV2K，该数据集有1000张高清图(2K分辨率)，其中，800张作为训练，100张作为验证，100张作为测试)，将图像从RGB转换成YUV4:2:0格式的单帧视频序列，作为标签数据。然后使用HPM在All Intra配置下对序列进行编码，关闭DBF，SAO和ALF等传统滤波器，量化步长设置为27到50。对于编码得到的重建序列，按照QP 27～31、32～37、38～44、45～50为范围划分为4个区间，切割为128×128的图像块作为训练数据，分别训练了4种I帧亮度分量模型，4种色度U分量模型，4种色度V分量模型。进一步地，使用预设视频数据集(例如BVI-DVC)，使用HPM-ModAI在Random Access配置下编码，关闭DBF，SAO和ALF等传统滤波器，并打开I帧的CNNLF，收集编码重建的非I帧数据，分别训练了4种非I帧亮度分量模型。

在推理测试阶段，HPM-ModAI为亮度分量设置了开关形式的帧级标志位与CTU级标志位以控制是否打开CNNLF模型，而为色度分量设置了开关形式的帧级标志位以控制是否打开CNNLF模型。在这里，标志位通常可以用flag表示。另外，帧级标志位由式(1)确定，其中，D＝D _net-D _rec表示CNNLF处理后减少的失真(D _net为滤波后的失真，D _rec为滤波前的失真)，R表示当前帧的CTU个数，λ与自适应修正滤波器的λ保持一致。当RDcost为负时，打开帧级标志位，否则关闭帧级标志位。

RDcost＝D+λ×R (1)

当帧级标志位打开时，还需要进一步通过率失真代价方式决策每个CTU是否打开CNNLF模型。这里，设置了CTU级标志位以控制是否打开CNNLF。具体地，CTU级标志位由式(2)确定。

RDcost＝D (2)

在一种可能的实施方式中，在HPM-ModAI中，编码器可以通过率失真代价方式确定当前帧或者当前块是否使用CNNLF模型进行滤波处理，但是这时候需要将帧级和CTU级等开关信息写入码流，造成额外的比特开销。

在另一种可能的实施方式中，本申请实施例提出了一种基于深度学习的预设选择网络模型，可以对CNNLF模型的使用进行自适应决策，这时候将不再需要计算率失真代价和编码帧级和CTU级等开关信息。

具体来讲，针对不同的颜色分量类型，其对应的预设选择网络模型也不相同。在这里，亮度分量对应的预设选择网络模型可以称为亮度选择网络模型，色度分量对应的预设选择网络模型可以称为色度选择网络模型。

确定当前块所属帧的帧类型和量化参数；

在一种具体的示例中，第三神经网络结构可以包括第六卷积模块和全连接模块，第六卷积模块和全连接模块顺次连接。其中，第六卷积模块可以包括若干个卷积子模块，每一个卷积子模块可以由一层卷积层和一层池化层组成；全连接模块可以包括若干个全连接子模块，每一个全连接子模块可以由一层全连接层和一层激活层组成。

也就是说，预设选择网络模型可以选择多层卷积神经网络和多层全连接层神经网络组成，然后利用训练样本进行深度学习以得到当前块的预设选择网络模型，比如亮度选择网络模型或者色度选择网络模型。

示例性地，以图9B为例，第三神经网络结构可以由3层卷积层和2层全连接层组成，而且每一层卷积层之后设置有池化层；其中，卷积层的卷积核可以为3×3，即可以用3×3Conv表示；池化层可以采用最大值池化层，用2×2MaxPool表示；另外，每一层全连接层之后设置有激活层，在这里，激活层可以为线性激活函数，也可以为非线性激活函数，比如ReLU和Softmax等。

lossFunction＝(clip(Wa×reca+Wb×recb+…+Wn×recn+Woff×rec0,0,N)-orig) ²

lossFunction＝-label(i)×log(softmax(Wi))

确定当前块的第二重建图像块；

S1203：根据至少两个输出值，确定当前块使用环路滤波网络模型时的目标环路滤波网络模型或者当前块不使用环路滤波网络模型。

S1204：当当前块使用环路滤波网络模型时，利用目标环路滤波网络模型对当前块进行滤波处理，得到当前块的第一重建图像块。

从至少两个输出值中确定目标值；

确定亮度环路滤波网络模型的输入重建亮度图像块；

确定色度环路滤波网络模型的输入重建色度图像块；

这样，在确定出当前块使用的目标环路滤波网络模型(包括目标亮度环路滤波网络模型或者目标色度环路滤波网络模型)后，可以利用所选取的目标环路滤波网络模型对当前块进行滤波处理。具体地，在一种可能的实施方式中，当当前块使用环路滤波网络模型时，所述利用目标环路滤波网络模型对当前块进行滤波处理，得到当前块的第一重建图像块，可以包括：

确定当前块的第二重建图像块；

以图10为例，第二重建图像块是经由去块滤波器(DBF)和样值自适应补偿滤波器(SAO)进行滤波处理后得到的，然后第二重建图像块经由模型自适应选择模块和CNNLF模型后得到的第一重建图像块还可以输入自适应修正滤波器(ALF)继续进行滤波处理。

除此之外，为了节省复杂度，在一些实施例中，在确定当前块使用的目标环路滤波网络模型之后，该方法还可以包括：

确定环路滤波网络模型的标识信息；

对所述环路滤波网络模型的标识信息进行编码，将编码比特写入码流。

在一种具体的示例中，所述确定环路滤波网络模型的标识信息，可以包括：

若当前块使用环路滤波网络模型，则将目标环路滤波网络模型对应的环路滤波网络模型索引序号确定为环路滤波网络模型的标识信息；和/或，

若当前块不使用环路滤波网络模型，则将模型关闭信息确定为环路滤波网络模型的标识信息。

这样，以CNNLF模型为例，根据在编码器侧模型自适应决策使用模块，如果当前块使用环路滤波网络模型，那么可以将目标环路滤波网络模型对应的环路滤波网络模型索引序号确定为环路滤波网络模型的标识信息；如果当前块不使用环路滤波网络模型，那么可以将模型关闭信息确定为环路滤波网络模型的标识信息；然后对环路滤波网络模型的标识信息进行编码并写入码流中；如此，后续在解码器中根据解码获得的环路滤波网络模型的标识信息即可直接确定出当前块不使用环路滤波网络模型或者当前块使用的环路滤波网络模型索引序号，从而能够降低解码器的复杂度。

在本申请实施例中，针对前述实施例中的第一神经网络结构、第二神经网络结构和第三神经网络结构等，其包括的卷积层数量，全连接层数量，非线性激活函数等均可以进行调整。另外，模型自适应选择模块所针对的环路滤波网络模型，除了CNNLF模型之外，还可以是针对其他高效的神经网络滤波器模型进行模型自适应选择，这里不作任何限定。

在一种具体的示例中，本申请实施例的技术方案作用在编码器的环路滤波模块中，其具体流程如下：

编码端进入环路滤波模块时，按照预设的滤波器顺序进行处理。这里，预设的滤波器顺序为DBF滤波---->SAO滤波---->模型自适应决策使用模块---->CNNLF滤波---->ALF滤波。当进入模型自适应决策使用模块时，

(a)首先根据model_adaptive_decision_enable_flag判断当前块下是否允许使用模型自适应决策使用模块进行模型决策。如果model_adaptive_decision_enable_flag为“1”，那么对当前块尝试进行模型自适应决策使用模块处理，跳转至(b)；如果model_adaptive_decision_enable_flag为“0”，那么跳转至(e)；

(b)判断当前块的颜色分量类型，如果当前块为亮度块，那么跳转至(c)；如果当前块为色度块，那么跳转至(d)；

在实现中，其语法元素的修改如下所示。其中，对于序列头定义，其语法元素的修改如表1所示；对于帧内预测图像头定义，其语法元素的修改如表2所示；对于帧间预测图像头定义，其语法元素的修改如表3所示；对于片定义，其语法元素的修改如表4所示。

本实施例提供了一种编码方法，应用于编码器。确定第一语法元素标识信息的取值；当第一语法元素标识信息指示当前块允许使用预设选择网络模型进行模型决策时，根据当前块的预设选择网络模型确定至少两个输出值；其中，至少两个输出值包括当前块使用环路滤波网络模型时至少一个候选环路滤波网络模型各自对应的第一值和当前块不使用环路滤波网络模型时的第二值；根据至少两个输出值，确定当前块使用环路滤波网络模型时的目标环路滤波网络模型或者当前块不使用环路滤波网络模型；当当前块使用环路滤波网络模型时，利用目标环路滤波网络模型对当前块进行滤波处理，得到当前块的第一重建图像块。这样，通过引入基于深度学习的神经网络技术对环路滤波网络模型进行自适应决策，可以确定出当前块使用环路滤波网络模型时的目标环路滤波网络模型或者当前块不使用环路滤波网络模型；如果当前块使用环路滤波网络模型，那么可以还可以利用目标环路滤波网络模型对当前块进行滤波处理，如此不仅可以降低复杂度，还可以避免额外的比特开销，提升编码性能，进而能够提高编解码效率；另外，还可以使得最终输出的第一重建图像块更加接近于原始图像块，能够提升视频图像质量。

在本申请的再一实施例中，基于前述实施例相同的发明构思，参见图13，其示出了本申请实施例提供的一种编码器130的组成结构示意图。如图13所示，该编码器130可以包括：第一确定单元1301、第一决策单元1302和第一滤波单元1303；其中，

第一确定单元1301，配置为确定第一语法元素标识信息的取值；

第一决策单元1302，配置为当第一语法元素标识信息指示当前块允许使用预设选择网络模型进行模型决策时，根据当前块的预设选择网络模型确定至少两个输出值；其中，至少两个输出值包括当前块使用环路滤波网络模型时至少一个候选环路滤波网络模型各自对应的第一值和当前块不使用环路滤波网络模型时的第二值；以及根据至少两个输出值，确定当前块使用环路滤波网络模型时的目标环路滤波网络模型或者当前块不使用环路滤波网络模型；

第一滤波单元1303，配置为当当前块使用环路滤波网络模型时，利用目标环路滤波网络模型对当前块进行滤波处理，得到当前块的第一重建图像块。

在一些实施例中，第一确定单元1301，还配置为确定当前块的第二重建图像块；

第一滤波单元1303，还配置为将第二重建图像块输入到目标环路滤波网络模型，得到当前块的第一重建图像块。

在一些实施例中，第一滤波单元1303，还配置为将第二重建图像块确定为当前块的第一重建图像块。

在一些实施例中，第一决策单元1302，还配置为从至少两个输出值中确定目标值；以及若目标值为第一值，则确定当前块使用环路滤波网络模型，且将目标值对应的候选环路滤波网络模型作为目标环路滤波网络模型；或者，若目标值为第二值，则确定当前块不使用环路滤波网络模型。

在一些实施例中，第一决策单元1302，还配置为从至少两个值中选取最大值，将最大值作为目标值。

在一些实施例中，第一确定单元1301，还配置为若当前块允许使用预设选择网络模型进行模型决策，则确定第一语法元素标识信息的取值为第一标识值；和/或，若当前块不允许使用预设选择网络模型进行模型决策，则确定第一语法元素标识信息的取值为第二标识值。

在一些实施例中，参见图13，编码器130还可以包括编码单元1304，配置为对第一语法元素标识信息的取值进行编码，将编码比特写入码流。

在一些实施例中，第一确定单元1301，还配置为若当前块的颜色分量类型为亮度分量，则确定当前块的亮度选择网络模型；或者，若当前块的颜色分量类型为色度分量，则确定当前块的色度选择网络模型；

相应地，第一决策单元1302，还配置为若当前块的颜色分量类型为亮度分量，则根据亮度选择网络模型确定至少两个亮度输出值；其中，至少两个亮度输出值包括当前块使用亮度环路滤波网络模型时至少一个候选亮度环路滤波网络模型各自对应的第一值和当前块不使用亮度环路滤波网络模型时的第二值；或者，若当前块的颜色分量类型为色度分量，则根据色度选择网络模型确定至少两个色度输出值；其中，至少两个色度输出值包括当前块使用色度环路滤波网络模型时至少一个候选色度环路滤波网络模型各自对应的第一值和当前块不使用色度环路滤波网络模型时的第二值。

在一些实施例中，第一确定单元1301，还配置为在当前块的颜色分量类型为亮度分量的情况下，若当前块所属帧的帧类型为第一类型，则确定当前块的第一亮度选择网络模型；或者，若当前块所属帧的帧类型为第二类型，则确定当前块的第二亮度选择网络模型；

相应地，第一决策单元1302，还配置为若当前块所属帧的帧类型为第一类型，则根据第一亮度选择网络模型确定至少两个亮度输出值；其中，至少两个亮度输出值包括当前块使用第一亮度环路滤波网络模型时至少一个候选第一亮度环路滤波网络模型各自对应的第一值和当前块不使用第一亮度环路滤波网络模型时的第二值；或者，若当前块所属帧的帧类型为第二类型，则根据第二亮度选择网络模型确定至少两个亮度输出值；其中，至少两个亮度输出值包括当前块使用第二亮度环路滤波网络模型时至少一个候选第二亮度环路滤波网络模型各自对应的第一值和当前块不使用第二亮度环路滤波网络模型时的第二值。

在一些实施例中，至少一个候选第一亮度环路滤波网络模型和至少一个候选第二亮度环路滤波网络模型是根据至少一个训练样本对第一神经网络结构进行模型训练确定的，且至少一个候选第一亮度环路滤波网络模型和至少一个候选第二亮度环路滤波网络模型与帧类型、颜色分量类型和量化参数之间具有对应关系。

在一些实施例中，第一神经网络结构包括第一卷积模块、第一残差模块、第二卷积模块和第一连接模块，第一卷积模块、第一残差模块、第二卷积模块和第一连接模块顺次连接，且第一连接模块还与第一卷积模块的输入连接。

在一些实施例中，第一卷积模块由一层卷积层和一层激活层组成，第二卷积模块由两层卷积层和一层激活层组成，连接模块由跳转连接层组成，第一残差模块包括若干个残差块，且残差块由两层卷积层和一层激活层组成。

在一些实施例中，第一确定单元1301，还配置为在当前块的颜色分量类型为色度分量的情况下，若当前块所属帧的帧类型为第一类型，则确定当前块的第一色度选择网络模型；或者，若当前块所属帧的帧类型为第二类型，则确定当前块的第二色度选择网络模型；

相应地，第一决策单元1302，还配置为若当前块所属帧的帧类型为第一类型，则根据第一色度选择网络模型确定至少两个色度输出值；其中，至少两个色度输出值包括当前块使用第一色度环路滤波网络模型时至少一个候选第一色度环路滤波网络模型各自对应的第一值和当前块不使用第一色度环路滤波网络模型时的第二值；或者，若当前块所属帧的帧类型为第二类型，则根据第二色度选择网络模型确定至少两个色度输出值；其中，至少两个色度输出值包括当前块使用第二色度环路滤波网络模型时至少一个候选第二色度环路滤波网络模型各自对应的第一值和当前块不使用第二色度环路滤波网络模型时的第二值。

在一些实施例中，至少一个候选第一色度环路滤波网络模型和至少一个候选第二色度环路滤波网络模型是根据至少一个训练样本对第二神经网络结构进行模型训练确定的，且至少一个候选第一色度环路滤波网络模型和至少一个候选第二色度环路滤波网络模型与帧类型、颜色分量类型和量化参数之间具有对应关系。

在一些实施例中，第二神经网络结构包括上采样模块、第三卷积模块、第四卷积模块、融合模块、第二残差模块、第五卷积模块和第二连接模块，上采样模块和第三卷积模块连接，第三卷积模块和第四卷积模块与融合模块连接，融合模块、第二残差模块、第五卷积模块和第二连接模块顺次连接，且第二连接模块还与上采样模块的输入连接。

在一些实施例中，第三卷积模块由一层卷积层和一层激活层组成，第四卷积模块由一层卷积层和一层激活层组成，第五卷积模块由两层卷积层、一层激活层和一层池化层组成，连接模块由跳转连接层组成，第二残差模块包括若干个残差块，且残差块由两层卷积层和一层激活层组成。

在一些实施例中，第一确定单元1301，还配置为在当前块的颜色分量类型为亮度分量的情况下，确定至少一个候选亮度选择网络模型，候选亮度选择网络模型包括候选第一亮度选择网络模型和/或候选第二亮度选择网络模型；以及确定当前块所属帧的帧类型和量化参数；若帧类型为第一类型，则从至少一个候选亮度选择网络模型中确定第一类型对应的至少一个候选第一亮度选择网络模型，并根据量化参数从至少一个候选第一亮度选择网络模型中确定当前块的第一亮度选择网络模型；或者，若帧类型为第二类型，则从至少一个候选亮度选择网络模型中确定第二类型对应的至少一个候选第二亮度选择网络模型，并根据量化参数从至少一个候选第二亮度选择网络模型中确定当前块的第二亮度选择网络模型。

在一些实施例中，第一确定单元1301，还配置为在当前块的颜色分量类型为色度分量的情况下，确定至少一个候选色度选择网络模型，候选色度选择网络模型包括候选第一色度选择网络模型和/或候选第二色度选择网络模型；以及确定当前块所属帧的帧类型和量化参数；若帧类型为第一类型，则从至少一个候选色度选择网络模型中确定第一类型对应的至少一个候选第一色度选择网络模型，并根据量化参数从至少一个候选第一色度选择网络模型中确定当前块的第一色度选择网络模型；或者，若帧类型为第二类型，则从至少一个候选色度选择网络模型中确定第二类型对应的至少一个候选第二色度选择网络模型，并根据量化参数从至少一个候选第二色度选择网络模型中确定当前块的第二色度选择网络模型。

在一些实施例中，至少一个候选亮度选择网络模型是根据至少一个训练样本对第三神经网络结构进行模型训练确定的，且至少一个候选亮度选择网络模型与帧类型、颜色分量类型和量化参数之间具有对应关系。

在一些实施例中，至少一个候选色度选择网络模型是根据至少一个训练样本对第三神经网络结构进行模型训练确定的，且至少一个候选色度选择网络模型与帧类型、颜色分量类型和量化参数之间具有对应关系。

在一些实施例中，第三神经网络结构包括第六卷积模块和全连接模块，第六卷积模块和全连接模块顺次连接；其中，第六卷积模块包括若干个卷积子模块，卷积子模块由一层卷积层和一层池化层组成；全连接模块包括若干个全连接子模块，全连接子模块由一层全连接层和一层激活层组成。

在一些实施例中，第一确定单元1301，还配置为确定环路滤波网络模型的标识信息；

编码单元1304，还配置为对环路滤波网络模型的标识信息进行编码，将编码比特写入码流。

在一些实施例中，第一确定单元1301，还配置为若当前块使用环路滤波网络模型，则将目标环路滤波网络模型对应的环路滤波网络模型索引序号确定为环路滤波网络模型的标识信息；和/或，若当前块不使用环路滤波网络模型，则将模型关闭信息确定为环路滤波网络模型的标识信息。

在一些实施例中，环路滤波网络模型为CNNLF模型。

在一些实施例中，第一决策单元1302，还配置为确定当前块的第二重建图像块；以及将第二重建图像块输入预设选择网络模型，得到至少两个输出值。

在一些实施例中，第二重建图像块是经由去块滤波器和样值自适应补偿滤波器进行滤波处理后得到。

在一些实施例中，第一滤波单元1303，还配置为在确定出第一重建图像块之后，利用自适应修正滤波器对第一重建图像块进行滤波处理。

可以理解地，在本申请实施例中，“单元”可以是部分电路、部分处理器、部分程序或软件等等，当然也可以是模块，还可以是非模块化的。而且在本实施例中的各组成部分可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现，也可以采用软件功能模块的形式实现。

所述集成的单元如果以软件功能模块的形式实现并非作为独立的产品进行销售或使用时，可以存储在一个计算机可读取存储介质中，基于这样的理解，本实施例的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)或processor(处理器)执行本实施例所述方法的全部或部分步骤。而前述的存储介质包括：U盘、移动硬盘、只读存储器(Read Only Memory，ROM)、随机存取存储器(Random Access Memory，RAM)、磁碟或者光盘等各种可以存储程序代码的介质。

因此，本申请实施例提供了一种计算机存储介质，应用于编码器130，该计算机存储介质存储有计算机程序，所述计算机程序被第一处理器执行时实现前述实施例中任一项所述的方法。

基于上述编码器130的组成以及计算机存储介质，参见图14，其示出了本申请实施例提供的编码器130的具体硬件结构示意图。如图14所示，可以包括：第一通信接口1401、第一存储器1402和第一处理器1403；各个组件通过第一总线***1404耦合在一起。可理解，第一总线***1404用于实现这些组件之间的连接通信。第一总线***1404除包括数据总线之外，还包括电源总线、控制总线和状态信号总线。但是为了清楚说明起见，在图14中将各种总线都标为第一总线***1404。其中，

第一通信接口1401，用于在与其他外部网元之间进行收发信息过程中，信号的接收和发送；

第一存储器1402，用于存储能够在第一处理器1403上运行的计算机程序；

第一处理器1403，用于在运行所述计算机程序时，执行：

确定第一语法元素标识信息的取值；

可以理解，本申请实施例中的第一存储器1402可以是易失性存储器或非易失性存储器，或可包括易失性和非易失性存储器两者。其中，非易失性存储器可以是只读存储器(Read-Only Memory，ROM)、可编程只读存储器(Programmable ROM，PROM)、可擦除可编程只读存储器(Erasable PROM，EPROM)、电可擦除可编程只读存储器(Electrically EPROM，EEPROM)或闪存。易失性存储器可以是随机存取存储器(Random Access Memory，RAM)，其用作外部高速缓存。通过示例性但不是限制性说明，许多形式的RAM可用，例如静态随机存取存储器(Static RAM，SRAM)、动态随机存取存储器(Dynamic RAM，DRAM)、同步动态随机存取存储器(Synchronous DRAM，SDRAM)、双倍数据速率同步动态随机存取存储器(Double Data Rate SDRAM，DDRSDRAM)、增强型同步动态随机存取存储器(Enhanced SDRAM，ESDRAM)、同步连接动态随机存取存储器(Synchlink DRAM，SLDRAM)和直接内存总线随机存取存储器(Direct Rambus RAM，DRRAM)。本申请描述的***和方法的第一存储器1402旨在包括但不限于这些和任意其它适合类型的存储器。

而第一处理器1403可能是一种集成电路芯片，具有信号的处理能力。在实现过程中，上述方法的各步骤可以通过第一处理器1403中的硬件的集成逻辑电路或者软件形式的指令完成。上述的第一处理器1403可以是通用处理器、数字信号处理器(Digital Signal Processor，DSP)、专用集成电路(Application Specific Integrated Circuit，ASIC)、现成可编程门阵列(Field Programmable Gate Array，FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本申请实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合本申请实施例所公开的方法的步骤可以直接体现为硬件译码处理器执行完成，或者用译码处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器，闪存、只读存储器，可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于第一存储器1402，第一处理器1403读取第一存储器1402中的信息，结合其硬件完成上述方法的步骤。

可以理解的是，本申请描述的这些实施例可以用硬件、软件、固件、中间件、微码或其组合来实现。对于硬件实现，处理单元可以实现在一个或多个专用集成电路(Application Specific Integrated Circuits，ASIC)、数字信号处理器(Digital Signal Processing，DSP)、数字信号处理设备(DSP Device，DSPD)、可编程逻辑设备(Programmable Logic Device，PLD)、现场可编程门阵列(Field-Programmable Gate Array，FPGA)、通用处理器、控制器、微控制器、微处理器、用于执行本申请所述功能的其它电子单元或其组合中。对于软件实现，可通过执行本申请所述功能的模块(例如过程、函数等)来实现本申请所述的技术。软件代码可存储在存储器中并通过处理器执行。存储器可以在处理器中或在处理器外部实现。

可选地，作为另一个实施例，第一处理器1403还配置为在运行所述计算机程序时，执行前述实施例中任一项所述的方法。

本实施例提供了一种编码器，该编码器可以包括第一确定单元、第一决策单元和第一滤波单元。这样，通过引入基于深度学习的神经网络技术对环路滤波网络模型进行自适应决策，不仅可以降低复杂度，还可以避免额外的比特开销，提升编码性能，进而能够提高编解码效率；另外，还可以使得最终输出的第一重建图像块更加接近于原始图像块，能够提升视频图像质量。

在本申请的再一实施例中，基于前述实施例相同的发明构思，参见图15，其示出了本申请实施例提供的一种解码器150的组成结构示意图。如图15所示，该解码器150可以包括：解析单元1501、第二决策单元1502和第二滤波单元1503；其中，

解析单元1501，配置为解析码流，确定第一语法元素标识信息的取值；

第二决策单元1502，配置为当第一语法元素标识信息指示当前块允许使用预设选择网络模型进行模型决策时，根据当前块的预设选择网络模型确定至少两个输出值；其中，至少两个输出值包括当前块使用环路滤波网络模型时至少一个候选环路滤波网络模型各自对应的第一值和当前块不使用环路滤波网络模型时的第二值；以及根据至少两个输出值，确定当前块使用环路滤波网络模型时的目标环路滤波网络模型或者当前块不使用环路滤波网络模型；

第二滤波单元1503，配置为当当前块使用环路滤波网络模型时，利用目标环路滤波网络模型对当前块进行滤波处理，得到当前块的第一重建图像块。

在一些实施例中，参见图15，解码器150还可以包括第二确定单元1504，确定当前块的第二重建图像块；

第二滤波单元1503，还配置为将第二重建图像块输入到目标环路滤波网络模型，得到当前块的第一重建图像块。

在一些实施例中，第二滤波单元1503，还配置为当当前块不使用环路滤波网络模型时，将第二重建图像块确定为当前块的第一重建图像块。

在一些实施例中，第二决策单元1502，还配置为从至少两个输出值中确定目标值；以及若目标值为第一值，则确定当前块使用环路滤波网络模型，且将目标值对应的候选环路滤波网络模型作为目标环路滤波网络模型；或者，若目标值为第二值，则确定当前块不使用环路滤波网络模型。

在一些实施例中，第二决策单元1502，还配置为从至少两个值中选取最大值，将最大值作为目标值。

在一些实施例中，第二确定单元1504，还配置为若第一语法元素标识信息的取值为第一标识值，则确定第一语法元素标识信息指示当前块允许使用预设选择网络模型进行模型决策；或者，若第一语法元素标识信息的取值为第二标识值，则确定第一语法元素标识信息指示当前块不允许使用预设选择网络模型进行模型决策。

在一些实施例中，第二确定单元1504，还配置为若当前块的颜色分量类型为亮度分量，则确定当前块的亮度选择网络模型；或者，若当前块的颜色分量类型为色度分量，则确定当前块的色度选择网络模型；

相应地，第二决策单元1502，还配置为若当前块的颜色分量类型为亮度分量，则根据亮度选择网络模型确定至少两个亮度输出值；其中，至少两个亮度输出值包括当前块使用亮度环路滤波网络模型时至少一个候选亮度环路滤波网络模型各自对应的第一值和当前块不使用亮度环路滤波网络模型时的第二值；或者，若当前块的颜色分量类型为色度分量，则根据色度选择网络模型确定至少两个色度输出值；其中，至少两个色度输出值包括当前块使用色度环路滤波网络模型时至少一个候选色度环路滤波网络模型各自对应的第一值和当前块不使用色度环路滤波网络模型时的第二值。

在一些实施例中，第二确定单元1504，还配置为在当前块的颜色分量类型为亮度分量的情况下，若当前块所属帧的帧类型为第一类型，则确定当前块的第一亮度选择网络模型；或者，若当前块所属帧的帧类型为第二类型，则确定当前块的第二亮度选择网络模型；

相应地，第二决策单元1502，还配置为若当前块所属帧的帧类型为第一类型，则根据第一亮度选择网络模型确定至少两个亮度输出值；其中，至少两个亮度输出值包括当前块使用第一亮度环路滤波网络模型时至少一个候选第一亮度环路滤波网络模型各自对应的第一值和当前块不使用第一亮度环路滤波网络模型时的第二值；或者，若当前块所属帧的帧类型为第二类型，则根据第二亮度选择网络模型确定至少两个亮度输出值；其中，至少两个亮度输出值包括当前块使用第二亮度环路滤波网络模型时至少一个候选第二亮度环路滤波网络模型各自对应的第一值和当前块不使用第二亮度环路滤波网络模型时的第二值。

在一些实施例中，第二确定单元1504，还配置为在当前块的颜色分量类型为色度分量的情况下，若当前块所属帧的帧类型为第一类型，则确定当前块的第一色度选择网络模型；或者，若当前块所属帧的帧类型为第二类型，则确定当前块的第二色度选择网络模型；

相应地，第二决策单元1502，还配置为若当前块所属帧的帧类型为第一类型，则根据第一色度选择网络模型确定至少两个色度输出值；其中，至少两个色度输出值包括当前块使用第一色度环路滤波网络模型时至少一个候选第一色度环路滤波网络模型各自对应的第一值和当前块不使用第一色度环路滤波网络模型时的第二值；或者，若当前块所属帧的帧类型为第二类型，则根据第二色度选择网络模型确定至少两个色度输出值；其中，至少两个色度输出值包括当前块使用第二色度环路滤波网络模型时至少一个候选第二色度环路滤波网络模型各自对应的第一值和当前块不使用第二色度环路滤波网络模型时的第二值。

在一些实施例中，第二确定单元1504，还配置为在当前块的颜色分量类型为亮度分量的情况下，确定至少一个候选亮度选择网络模型，候选亮度选择网络模型包括候选第一亮度选择网络模型和/或候选第二亮度选择网络模型；以及确定当前块所属帧的帧类型和量化参数；若帧类型为第一类型，则从至少一个候选亮度选择网络模型中确定第一类型对应的至少一个候选第一亮度选择网络模型，并根据量化参数从至少一个候选第一亮度选择网络模型中确定当前块的第一亮度选择网络模型；或者，若帧类型为第二类型，则从至少一个候选亮度选择网络模型中确定第二类型对应的至少一个候选第二亮度选择网络模型，并根据量化参数从至少一个候选第二亮度选择网络模型中确定当前块的第二亮度选择网络模型。

在一些实施例中，第二确定单元1504，还配置为在当前块的颜色分量类型为色度分量的情况下，确定至少一个候选色度选择网络模型，候选色度选择网络模型包括候选第一色度选择网络模型和/或候选第二色度选择网络模型；以及确定当前块所属帧的帧类型和量化参数；若帧类型为第一类型，则从至少一个候选色度选择网络模型中确定第一类型对应的至少一个候选第一色度选择网络模型，并根据量化参数从至少一个候选第一色度选择网络模型中确定当前块的第一色度选择网络模型；或者，若帧类型为第二类型，则从至少一个候选色度选择网络模型中确定第二类型对应的至少一个候选第二色度选择网络模型，并根据量化参数从至少一个候选第二色度选择网络模型中确定当前块的第二色度选择网络模型。

在一些实施例中，解析单元1501，还配置为当第一语法元素标识信息指示当前块允许使用预设选择网络模型进行模型决策时，解析码流，确定环路滤波网络模型的标识信息；

第二确定单元1504，还配置为若环路滤波网络模型的标识信息为模型关闭信息，则确定当前块不使用环路滤波网络模型；或者，若环路滤波网络模型的标识信息为环路滤波网络模型索引序号，则根据环路滤波网络模型索引序号，从至少一个候选环路滤波网络模型中确定当前块使用的目标环路滤波网络模型；

第二滤波单元1503，还配置为利用目标环路滤波网络模型对当前块进行滤波处理，得到当前块的第一重建图像块。

在一些实施例中，环路滤波网络模型为CNNLF模型。

在一些实施例中，第二确定单元1504，还配置为确定当前块的第二重建图像块；

第二决策单元1502，还配置为将第二重建图像块输入预设选择网络模型，得到至少两个输出值。

在一些实施例中，第二滤波单元1503，还配置为在确定出第一重建图像块之后，利用自适应修正滤波器对第一重建图像块进行滤波处理。

可以理解地，在本实施例中，“单元”可以是部分电路、部分处理器、部分程序或软件等等，当然也可以是模块，还可以是非模块化的。而且在本实施例中的各组成部分可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现，也可以采用软件功能模块的形式实现。

所述集成的单元如果以软件功能模块的形式实现并非作为独立的产品进行销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本实施例提供了一种计算机存储介质，应用于解码器150，该计算机存储介质存储有计算机程序，所述计算机程序被第二处理器执行时实现前述实施例中任一项所述的方法。

基于上述解码器150的组成以及计算机存储介质，参见图16，其示出了本申请实施例提供的解码器150的具体硬件结构示意图。如图16所示，可以包括：第二通信接口1601、第二存储器1602和第二处理器1603；各个组件通过第二总线***1604耦合在一起。可理解，第二总线***1604用于实现这些组件之间的连接通信。第二总线***1604除包括数据总线之外，还包括电源总线、控制总线和状态信号总线。但是为了清楚说明起见，在图16中将各种总线都标为第二总线***1604。其中，

第二通信接口1601，用于在与其他外部网元之间进行收发信息过程中，信号的接收和发送；

第二存储器1602，用于存储能够在第二处理器1603上运行的计算机程序；

第二处理器1603，用于在运行所述计算机程序时，执行：

解析码流，确定第一语法元素标识信息的取值；

可选地，作为另一个实施例，第二处理器1603还配置为在运行所述计算机程序时，执行前述实施例中任一项所述的方法。

可以理解，第二存储器1602与第一存储器1402的硬件功能类似，第二处理器1603与第一处理器1403的硬件功能类似；这里不再详述。

本实施例提供了一种解码器，该解码器可以包括解析单元、第二决策单元和第二滤波单元。这样，通过引入基于深度学习的神经网络技术对环路滤波网络模型进行自适应决策，不仅可以降低复杂度，还可以避免额外的比特开销，提升编码性能，进而能够提高编解码效率；另外，还可以使得最终输出的第一重建图像块更加接近于原始图像块，能够提升视频图像质量。

在本申请的再一实施例中，参见图17，其示出了本申请实施例提供的一种编解码***的组成结构示意图。如图17所示，编解码***170可以包括前述实施例任一项所述的编码器130和前述实施例任一项所述的解码器150。

在一些实施例中，本申请实施例还提供了一种码流，该码流是根据待编码信息进行比特编码生成的；其中，待编码信息包括第一语法元素标识信息的取值，第一语法元素标识信息用于指示当前块是否允许使用预设选择网络模型进行模型决策。

进一步地，在一些实施例中，这里的待编码信息还可以包括环路滤波网络模型的标识信息；其中，环路滤波网络模型的标识信息用于确定当前块使用环路滤波网络模型时的环路滤波网络模型索引序号或者当前块不使用环路滤波网络模型。

需要说明的是，在编解码***170中，编码器130可以将码流传输到解码器150。这样，解码器150通过解析码流可以获取到第一语法元素标识信息的取值，以便确定出当前块是否允许使用预设选择网络模型进行模型决策。

这样，在本申请实施例中，通过引入基于深度学习的神经网络技术对环路滤波网络模型进行自适应决策，可以确定当前块使用环路滤波网络模型时的目标环路滤波网络模型或者当前块不使用环路滤波网络模型；如果当前块使用环路滤波网络模型，那么可以还可以利用目标环路滤波网络模型对当前块进行滤波处理，如此不仅可以降低复杂度，还可以避免额外的比特开销，提升编码性能，进而能够提高编解码效率；另外，还可以使得最终输出的第一重建图像块更加接近于原始图像块，能够提升视频图像质量。

需要说明的是，在本申请中，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。

上述本申请实施例序号仅仅为了描述，不代表实施例的优劣。

本申请所提供的几个方法实施例中所揭露的方法，在不冲突的情况下可以任意组合，得到新的方法实施例。

本申请所提供的几个产品实施例中所揭露的特征，在不冲突的情况下可以任意组合，得到新的产品实施例。

本申请所提供的几个方法或设备实施例中所揭露的特征，在不冲突的情况下可以任意组合，得到新的方法实施例或设备实施例。

以上所述，仅为本申请的具体实施方式，但本申请的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本申请揭露的技术范围内，可轻易想到变化或替换，都应涵盖在本申请的保护范围之内。因此，本申请的保护范围应以所述权利要求的保护范围为准。

工业实用性

本申请实施例中，无论是编码器还是解码器，在确定出第一语法元素标识信息的取值之后，当第一语法元素标识信息指示当前块允许使用预设选择网络模型进行模型决策时，根据当前块的预设选择网络模型确定至少两个输出值，这至少两个输出值包括当前块使用环路滤波网络模型时至少一个候选环路滤波网络模型各自对应的第一值和当前块不使用环路滤波网络模型时的第二值；根据至少两个输出值，确定当前块使用环路滤波网络模型时的目标环路滤波网络模型或者当前块不使用环路滤波网络模型；当当前块使用环路滤波网络模型时，利用目标环路滤波网络模型对当前块进行滤波处理，得到当前块的第一重建图像块。这样，通过引入基于深度学习的神经网络技术对环路滤波网络模型进行自适应决策，可以确定出当前块使用环路滤波网络模型时的目标环路滤波网络模型或者当前块不使用环路滤波网络模型；如果当前块使用环路滤波网络模型，那么可以还可以利用目标环路滤波网络模型对当前块进行滤波处理，如此不仅可以降低复杂度，还可以避免额外的比特开销，提升编码性能，进而能够提高编解码效率；另外，还可以使得最终输出的第一重建图像块更加接近于原始图像块，能够提升视频图像质量。

Claims

一种解码方法，应用于解码器，所述方法包括：

解析码流，确定第一语法元素标识信息的取值；

当所述第一语法元素标识信息指示当前块允许使用预设选择网络模型进行模型决策时，根据当前块的预设选择网络模型确定至少两个输出值；其中，所述至少两个输出值包括所述当前块使用环路滤波网络模型时至少一个候选环路滤波网络模型各自对应的第一值和所述当前块不使用环路滤波网络模型时的第二值；

根据所述至少两个输出值，确定所述当前块使用环路滤波网络模型时的目标环路滤波网络模型或者所述当前块不使用环路滤波网络模型；

当所述当前块使用环路滤波网络模型时，利用所述目标环路滤波网络模型对所述当前块进行滤波处理，得到所述当前块的第一重建图像块。
根据权利要求1所述的方法，其中，当所述当前块使用环路滤波网络模型时，所述利用所述目标环路滤波网络模型对所述当前块进行滤波处理，得到所述当前块的第一重建图像块，包括：

确定所述当前块的第二重建图像块；

将所述第二重建图像块输入到所述目标环路滤波网络模型，得到所述当前块的第一重建图像块。
根据权利要求2所述的方法，其中，当所述当前块不使用环路滤波网络模型时，所述方法还包括：

将所述第二重建图像块确定为所述当前块的第一重建图像块。
根据权利要求1所述的方法，其中，所述根据所述至少两个输出值，确定所述当前块使用环路滤波网络模型时的目标环路滤波网络模型或者所述当前块不使用环路滤波网络模型，包括：

从所述至少两个输出值中确定目标值；

若所述目标值为所述第一值，则确定所述当前块使用环路滤波网络模型，且将所述目标值对应的候选环路滤波网络模型作为所述目标环路滤波网络模型；或者，

若所述目标值为所述第二值，则确定所述当前块不使用环路滤波网络模型。
根据权利要求4所述的方法，其中，所述从所述至少两个输出值中确定目标值，包括：从所述至少两个值中选取最大值，将所述最大值作为所述目标值。
根据权利要求1所述的方法，其中，所述方法还包括：

若所述第一语法元素标识信息的取值为第一标识值，则确定所述第一语法元素标识信息指示所述当前块允许使用所述预设选择网络模型进行模型决策；或者，

若所述第一语法元素标识信息的取值为第二标识值，则确定所述第一语法元素标识信息指示所述当前块不允许使用所述预设选择网络模型进行模型决策。
根据权利要求1所述的方法，其中，所述方法还包括：

若所述当前块的颜色分量类型为亮度分量，则确定所述当前块的亮度选择网络模型；或者，

若所述当前块的颜色分量类型为色度分量，则确定所述当前块的色度选择网络模型；

所述根据当前块的预设选择网络模型确定至少两个输出值，包括：

若所述当前块的颜色分量类型为亮度分量，则根据所述亮度选择网络模型确定至少两个亮度输出值；其中，所述至少两个亮度输出值包括所述当前块使用亮度环路滤波网络模型时至少一个候选亮度环路滤波网络模型各自对应的第一值和所述当前块不使用所述亮度环路滤波网络模型时的第二值；或者，

若所述当前块的颜色分量类型为色度分量，则根据所述色度选择网络模型确定至少两个色度输出值；其中，所述至少两个色度输出值包括所述当前块使用色度环路滤波网络模型时至少一个候选色度环路滤波网络模型各自对应的第一值和所述当前块不使用所述色度环路滤波网络模型时的第二值。
根据权利要求7所述的方法，其中，在所述当前块的颜色分量类型为亮度分量的情况下，所述确定所述当前块的亮度选择网络模型，包括：

若所述当前块所属帧的帧类型为第一类型，则确定所述当前块的第一亮度选择网络模型；或者，

若所述当前块所属帧的帧类型为第二类型，则确定所述当前块的第二亮度选择网络模型；

所述根据所述亮度选择网络模型确定至少两个亮度输出值，包括：

若所述当前块所属帧的帧类型为第一类型，则根据所述第一亮度选择网络模型确定所述至少两个亮度输出值；其中，所述至少两个亮度输出值包括所述当前块使用第一亮度环路滤波网络模型时至少一个候选第一亮度环路滤波网络模型各自对应的第一值和所述当前块不使用所述第一亮度环路滤波网络模型时的第二值；或者，

若所述当前块所属帧的帧类型为第二类型，则根据所述第二亮度选择网络模型确定所述至少两个亮度输出值；其中，所述至少两个亮度输出值包括所述当前块使用第二亮度环路滤波网络模型时至少一个候选第二亮度环路滤波网络模型各自对应的第一值和所述当前块不使用所述第二亮度环路滤波网络模型时的第二值。
根据权利要求8所述的方法，其中，第一神经网络结构包括第一卷积模块、第一残差模块、第二卷积模块和第一连接模块，所述第一卷积模块、所述第一残差模块、所述第二卷积模块和所述第一连接模块顺次连接，且所述第一连接模块还与所述第一卷积模块的输入连接。
根据权利要求9所述的方法，其中，所述第一卷积模块由一层卷积层和一层激活层组成，所述第二卷积模块由两层卷积层和一层激活层组成，所述连接模块由跳转连接层组成，所述第一残差模块包括若干个残差块，且所述残差块由两层卷积层和一层激活层组成。
根据权利要求7所述的方法，其中，在所述当前块的颜色分量类型为色度分量的情况下，所述确定所述当前块的色度选择网络模型，包括：

若所述当前块所属帧的帧类型为第一类型，则确定所述当前块的第一色度选择网络模型；或者，

若所述当前块所属帧的帧类型为第二类型，则确定所述当前块的第二色度选择网络模型；

所述根据所述色度选择网络模型确定至少两个色度输出值，包括：

若所述当前块所属帧的帧类型为第一类型，则根据所述第一色度选择网络模型确定所述至少两个色度输出值；其中，所述至少两个色度输出值包括所述当前块使用第一色度环路滤波网络模型时至少一个候选第一色度环路滤波网络模型各自对应的第一值和所述当前块不使用所述第一色度环路滤波网络模型时的第二值；或者，

若所述当前块所属帧的帧类型为第二类型，则根据所述第二色度选择网络模型确定所述至少两个色度输出值；其中，所述至少两个色度输出值包括所述当前块使用第二色度环路滤波网络模型时至少一个候选第二色度环路滤波网络模型各自对应的第一值和所述当前块不使用所述第二色度环路滤波网络模型时的第二值。
根据权利要求11所述的方法，其中，第二神经网络结构包括上采样模块、第三卷积模块、第四卷积模块、融合模块、第二残差模块、第五卷积模块和第二连接模块，所述上采样模块和所述第三卷积模块连接，所述第三卷积模块和所述第四卷积模块与所述融合模块连接，所述融合模块、所述第二残差模块、所述第五卷积模块和所述第二连接模块顺次连接，且所述第二连接模块还与所述上采样模块的输入连接。
根据权利要求12所述的方法，其中，所述第三卷积模块由一层卷积层和一层激活层组成，所述第四卷积模块由一层卷积层和一层激活层组成，所述第五卷积模块由两层卷积层、一层激活层和一层池化层组成，所述连接模块由跳转连接层组成，所述第二残差模块包括若干个残差块，且所述残差块由两层卷积层和一层激活层组成。
根据权利要求8所述的方法，其中，在所述当前块的颜色分量类型为亮度分量的情况下，所述确定所述当前块的亮度选择网络模型，包括：

确定至少一个候选亮度选择网络模型，所述候选亮度选择网络模型包括所述候选第一亮度选择网络模型和/或所述候选第二亮度选择网络模型；

确定所述当前块所属帧的帧类型和量化参数；

若所述帧类型为第一类型，则从所述至少一个候选亮度选择网络模型中确定所述第一类型对应的至少一个候选第一亮度选择网络模型，并根据所述量化参数从所述至少一个候选第一亮度选择网络模型中确定所述当前块的第一亮度选择网络模型；或者，

若所述帧类型为第二类型，则从所述至少一个候选亮度选择网络模型中确定所述第二类型对应的至少一个候选第二亮度选择网络模型，并根据所述量化参数从所述至少一个候选第二亮度选择网络模型中确定所述当前块的第二亮度选择网络模型。
根据权利要求11所述的方法，其中，在所述当前块的颜色分量类型为色度分量的情况下，所述确定所述当前块的色度选择网络模型，包括：

确定至少一个候选色度选择网络模型，所述候选色度选择网络模型包括所述候选第一色度选择网络模型和/或所述候选第二色度选择网络模型；

确定所述当前块所属帧的帧类型和量化参数；

若所述帧类型为第一类型，则从所述至少一个候选色度选择网络模型中确定所述第一类型对应的至少一个候选第一色度选择网络模型，并根据所述量化参数从所述至少一个候选第一色度选择网络模型中确定所述当前块的第一色度选择网络模型；或者，

若所述帧类型为第二类型，则从所述至少一个候选色度选择网络模型中确定所述第二类型对应的至少一个候选第二色度选择网络模型，并根据所述量化参数从所述至少一个候选第二色度选择网络模型中确定所述当前块的第二色度选择网络模型。
根据权利要求14或15所述的方法，其中，第三神经网络结构包括第六卷积模块和全连接模块，所述第六卷积模块和所述全连接模块顺次连接；

其中，所述第六卷积模块包括若干个卷积子模块，所述卷积子模块由一层卷积层和一层池化层组成；所述全连接模块包括若干个全连接子模块，所述全连接子模块由一层全连接层和一层激活层组成。
根据权利要求1所述的方法，其中，所述方法还包括：

当所述第一语法元素标识信息指示当前块允许使用预设选择网络模型进行模型决策时，解析所述码流，确定环路滤波网络模型的标识信息；

若所述环路滤波网络模型的标识信息为模型关闭信息，则确定所述当前块不使用环路滤波网络模型；或者，

若所述环路滤波网络模型的标识信息为环路滤波网络模型索引序号，则根据所述环路滤波网络模型索引序号，从至少一个候选环路滤波网络模型中确定所述当前块使用的目标环路滤波网络模型；

利用所述目标环路滤波网络模型对所述当前块进行滤波处理，得到所述当前块的第一重建图像块。
根据权利要求1所述的方法，其中，所述环路滤波网络模型为基于残差神经网络的环路滤波器(CNNLF)模型。
根据权利要求1所述的方法，其中，所述根据当前块的预设选择网络模型确定至少两个输出值，包括：

确定所述当前块的第二重建图像块；

将所述第二重建图像块输入所述预设选择网络模型，得到所述至少两个输出值。
根据权利要求19所述的方法，其中，所述第二重建图像块是经由去块滤波器和样值自适应补偿滤波器进行滤波处理后得到。
根据权利要求1至20任一项所述的方法，其中，所述方法还包括：

在确定出所述第一重建图像块之后，利用自适应修正滤波器对所述第一重建图像块进行滤波处理。
一种编码方法，应用于编码器，所述方法包括：

确定第一语法元素标识信息的取值；

当所述第一语法元素标识信息指示当前块允许使用预设选择网络模型进行模型决策时，根据所述当前块的预设选择网络模型确定至少两个输出值；其中，所述至少两个输出值包括所述当前块使用环路滤波网络模型时至少一个候选环路滤波网络模型各自对应的第一值和所述当前块不使用环路滤波网络模型时的第二值；

根据所述至少两个输出值，确定所述当前块使用环路滤波网络模型时的目标环路滤波网络模型或者所述当前块不使用环路滤波网络模型；

当所述当前块使用环路滤波网络模型时，利用所述目标环路滤波网络模型对所述当前块进行滤波处理，得到所述当前块的第一重建图像块。
根据权利要求22所述的方法，其中，当所述当前块使用环路滤波网络模型时，所述利用所述目标环路滤波网络模型对所述当前块进行滤波处理，得到所述当前块的第一重建图像块，包括：

确定所述当前块的第二重建图像块；

将所述第二重建图像块输入到所述目标环路滤波网络模型，得到所述当前块的第一重建图像块。
根据权利要求23所述的方法，其中，当所述当前块不使用环路滤波网络模型时，所述方法还包括：

将所述第二重建图像块确定为所述当前块的第一重建图像块。
根据权利要求22所述的方法，其中，所述根据所述至少两个输出值，确定所述当前块使用环路滤波网络模型时的目标环路滤波网络模型或者所述当前块不使用环路滤波网络模型，包括：

从所述至少两个输出值中确定目标值；

若所述目标值为所述第一值，则确定所述当前块使用环路滤波网络模型，且将所述目标值对应的候选环路滤波网络模型作为所述目标环路滤波网络模型；或者，

若所述目标值为所述第二值，则确定所述当前块不使用环路滤波网络模型。
根据权利要求25所述的方法，其中，所述从所述至少两个输出值中确定目标值，包括：从所述至少两个值中选取最大值，将所述最大值作为所述目标值。
根据权利要求22所述的方法，其中，所述确定第一语法元素标识信息的取值，包括：

若所述当前块允许使用预设选择网络模型进行模型决策，则确定所述第一语法元素标识信息的取值为第一标识值；和/或，

若所述当前块不允许使用预设选择网络模型进行模型决策，则确定所述第一语法元素标识信息的取值为第二标识值。
根据权利要求27所述的方法，其中，所述方法还包括：

对所述第一语法元素标识信息的取值进行编码，将编码比特写入码流。
根据权利要求22所述的方法，其中，所述方法还包括：

若所述当前块的颜色分量类型为亮度分量，则确定所述当前块的亮度选择网络模型；或者，

若所述当前块的颜色分量类型为色度分量，则确定所述当前块的色度选择网络模型；

所述根据当前块的预设选择网络模型确定至少两个输出值，包括：

若所述当前块的颜色分量类型为亮度分量，则根据所述亮度选择网络模型确定至少两个亮度输出值；其中，所述至少两个亮度输出值包括所述当前块使用亮度环路滤波网络模型时至少一个候选亮度环路滤波网络模型各自对应的第一值和所述当前块不使用所述亮度环路滤波网络模型时的第二值；或者，

若所述当前块的颜色分量类型为色度分量，则根据所述色度选择网络模型确定至少两个色度输出值；其中，所述至少两个色度输出值包括所述当前块使用色度环路滤波网络模型时至少一个候选色度环路滤波网络模型各自对应的第一值和所述当前块不使用所述色度环路滤波网络模型时的第二值。
根据权利要求29所述的方法，其中，在所述当前块的颜色分量类型为亮度分量的情况下，所述确定所述当前块的亮度选择网络模型，包括：

若所述当前块所属帧的帧类型为第一类型，则确定所述当前块的第一亮度选择网络模型；或者，

若所述当前块所属帧的帧类型为第二类型，则确定所述当前块的第二亮度选择网络模型；

所述根据所述亮度选择网络模型确定至少两个亮度输出值，包括：

若所述当前块所属帧的帧类型为第一类型，则根据所述第一亮度选择网络模型确定所述至少两个亮度输出值；其中，所述至少两个亮度输出值包括所述当前块使用第一亮度环路滤波网络模型时至少一个候选第一亮度环路滤波网络模型各自对应的第一值和所述当前块不使用所述第一亮度环路滤波网络模型时的第二值；或者，

若所述当前块所属帧的帧类型为第二类型，则根据所述第二亮度选择网络模型确定所述至少两个亮度输出值；其中，所述至少两个亮度输出值包括所述当前块使用第二亮度环路滤波网络模型时至少一个候选第二亮度环路滤波网络模型各自对应的第一值和所述当前块不使用所述第二亮度环路滤波网络模型时的第二值。
根据权利要求30所述的方法，其中，所述至少一个候选第一亮度环路滤波网络模型和所述至少一个候选第二亮度环路滤波网络模型是根据至少一个训练样本对第一神经网络结构进行模型训练确定的，且所述至少一个候选第一亮度环路滤波网络模型和所述至少一个候选第二亮度环路滤波网络模型与帧类型、颜色分量类型和量化参数之间具有对应关系。
根据权利要求31所述的方法，其中，所述第一神经网络结构包括第一卷积模块、第一残差模块、第二卷积模块和第一连接模块，所述第一卷积模块、所述第一残差模块、所述第二卷积模块和所述第一连接模块顺次连接，且所述第一连接模块还与所述第一卷积模块的输入连接。
根据权利要求32所述的方法，其中，所述第一卷积模块由一层卷积层和一层激活层组成，所述第二卷积模块由两层卷积层和一层激活层组成，所述连接模块由跳转连接层组成，所述第一残差模块包括若干个残差块，且所述残差块由两层卷积层和一层激活层组成。
根据权利要求29所述的方法，其中，在所述当前块的颜色分量类型为色度分量的情况下，所述确定所述当前块的色度选择网络模型，包括：

若所述当前块所属帧的帧类型为第一类型，则确定所述当前块的第一色度选择网络模型；或者，

若所述当前块所属帧的帧类型为第二类型，则确定所述当前块的第二色度选择网络模型；

所述根据所述色度选择网络模型确定至少两个色度输出值，包括：

若所述当前块所属帧的帧类型为第一类型，则根据所述第一色度选择网络模型确定所述至少两个色度输出值；其中，所述至少两个色度输出值包括所述当前块使用第一色度环路滤波网络模型时至少一个候选第一色度环路滤波网络模型各自对应的第一值和所述当前块不使用所述第一色度环路滤波网络模型时的第二值；或者，

若所述当前块所属帧的帧类型为第二类型，则根据所述第二色度选择网络模型确定所述至少两个色度输出值；其中，所述至少两个色度输出值包括所述当前块使用第二色度环路滤波网络模型时至少一个候选第二色度环路滤波网络模型各自对应的第一值和所述当前块不使用所述第二色度环路滤波网络模型时的第二值。
根据权利要求34所述的方法，其中，所述至少一个候选第一色度环路滤波网络模型和所述至少一个候选第二色度环路滤波网络模型是根据至少一个训练样本对第二神经网络结构进行模型训练确定的，且所述至少一个候选第一色度环路滤波网络模型和所述至少一个候选第二色度环路滤波网络模型与帧类型、颜色分量类型和量化参数之间具有对应关系。
根据权利要求35所述的方法，其中，所述第二神经网络结构包括上采样模块、第三卷积模块、第四卷积模块、融合模块、第二残差模块、第五卷积模块和第二连接模块，所述上采样模块和所述第三卷积模块连接，所述第三卷积模块和所述第四卷积模块与所述融合模块连接，所述融合模块、所述第二残差模块、所述第五卷积模块和所述第二连接模块顺次连接，且所述第二连接模块还与所述上采样模块的输入连接。
根据权利要求36所述的方法，其中，所述第三卷积模块由一层卷积层和一层激活层组成，所述第四卷积模块由一层卷积层和一层激活层组成，所述第五卷积模块由两层卷积层、一层激活层和一层池化层组成，所述连接模块由跳转连接层组成，所述第二残差模块包括若干个残差块，且所述残差块由两层卷积层和一层激活层组成。
根据权利要求30所述的方法，其中，在所述当前块的颜色分量类型为亮度分量的情况下，所述确定所述当前块的亮度选择网络模型，包括：

确定至少一个候选亮度选择网络模型，所述候选亮度选择网络模型包括所述候选第一亮度选择网络模型和/或所述候选第二亮度选择网络模型；

确定所述当前块所属帧的帧类型和量化参数；

若所述帧类型为第一类型，则从所述至少一个候选亮度选择网络模型中确定所述第一类型对应的至少一个候选第一亮度选择网络模型，并根据所述量化参数从所述至少一个候选第一亮度选择网络模型中确定所述当前块的第一亮度选择网络模型；或者，

若所述帧类型为第二类型，则从所述至少一个候选亮度选择网络模型中确定所述第二类型对应的至少一个候选第二亮度选择网络模型，并根据所述量化参数从所述至少一个候选第二亮度选择网络模型中确定所述当前块的第二亮度选择网络模型。
根据权利要求34所述的方法，其中，在所述当前块的颜色分量类型为色度分量的情况下，所述确定所述当前块的色度选择网络模型，包括：

确定至少一个候选色度选择网络模型，所述候选色度选择网络模型包括所述候选第一色度选择网络模型和/或所述候选第二色度选择网络模型；

确定所述当前块所属帧的帧类型和量化参数；

若所述帧类型为第一类型，则从所述至少一个候选色度选择网络模型中确定所述第一类型对应的至少一个候选第一色度选择网络模型，并根据所述量化参数从所述至少一个候选第一色度选择网络模型中确定所述当前块的第一色度选择网络模型；或者，

若所述帧类型为第二类型，则从所述至少一个候选色度选择网络模型中确定所述第二类型对应的至少一个候选第二色度选择网络模型，并根据所述量化参数从所述至少一个候选第二色度选择网络模型中确定所述当前块的第二色度选择网络模型。
根据权利要求38所述的方法，其中，所述至少一个候选亮度选择网络模型是根据至少一个训练样本对第三神经网络结构进行模型训练确定的，且所述至少一个候选亮度选择网络模型与帧类型、颜色分量类型和量化参数之间具有对应关系。
根据权利要求39所述的方法，其中，所述至少一个候选色度选择网络模型是根据至少一个训练样本对第三神经网络结构进行模型训练确定的，且所述至少一个候选色度选择网络模型与帧类型、颜色分量类型和量化参数之间具有对应关系。
根据权利要求40或41所述的方法，其中，所述第三神经网络结构包括第六卷积模块和全连接模块，所述第六卷积模块和所述全连接模块顺次连接；

其中，所述第六卷积模块包括若干个卷积子模块，所述卷积子模块由一层卷积层和一层池化层组成；所述全连接模块包括若干个全连接子模块，所述全连接子模块由一层全连接层和一层激活层组成。
根据权利要求22所述的方法，其中，所述方法还包括：

确定环路滤波网络模型的标识信息；

对所述环路滤波网络模型的标识信息进行编码，将编码比特写入码流。
根据权利要求43所述的方法，其中，所述确定环路滤波网络模型的标识信息，包括：

若所述当前块使用环路滤波网络模型，则将所述目标环路滤波网络模型对应的环路滤波网络模型索引序号确定为所述环路滤波网络模型的标识信息；和/或，

若所述当前块不使用环路滤波网络模型，则将模型关闭信息确定为所述环路滤波网络模型的标识信息。
根据权利要求22所述的方法，其中，所述环路滤波网络模型为基于残差神经网络的环路滤波器(CNNLF)模型。
根据权利要求22所述的方法，其中，所述根据当前块的预设选择网络模型确定至少两个输出值，包括：

确定所述当前块的第二重建图像块；

将所述第二重建图像块输入所述预设选择网络模型，得到所述至少两个输出值。
根据权利要求46所述的方法，其中，所述第二重建图像块是经由去块滤波器和样值自适应补偿滤波器进行滤波处理后得到。
根据权利要求22至47任一项所述的方法，其中，所述方法还包括：

在确定出所述第一重建图像块之后，利用自适应修正滤波器对所述第一重建图像块进行滤波处理。
一种码流，所述码流是根据待编码信息进行比特编码生成的；其中，所述待编码信息包括第一语法元素标识信息的取值，所述第一语法元素标识信息用于指示当前块是否允许使用预设选择网络模型进行模型决策。
根据权利要求49所述的码流，其中，所述待编码信息还包括环路滤波网络模型的标识信息，所述环路滤波网络模型的标识信息用于确定所述当前块使用环路滤波网络模型时的环路滤波网络模型索引序号或者所述当前块不使用环路滤波网络模型。
一种编码器，所述编码器包括第一确定单元、第一决策单元和第一滤波单元；其中，

所述第一确定单元，配置为确定第一语法元素标识信息的取值；

所述第一决策单元，配置为当所述第一语法元素标识信息指示当前块允许使用预设选择网络模型进行模型决策时，根据所述当前块的预设选择网络模型确定至少两个输出值；其中，所述至少两个输出值包括所述当前块使用环路滤波网络模型时至少一个候选环路滤波网络模型各自对应的第一值和所述当前块不使用环路滤波网络模型时的第二值；以及根据所述至少两个输出值，确定所述当前块使用环路滤波网络模型时的目标环路滤波网络模型或者所述当前块不使用环路滤波网络模型；

所述第一滤波单元，配置为当所述当前块使用环路滤波网络模型时，利用所述目标环路滤波网络模型对所述当前块进行滤波处理，得到所述当前块的第一重建图像块。
一种编码器，所述编码器包括第一存储器和第一处理器；其中，

所述第一存储器，用于存储能够在所述第一处理器上运行的计算机程序；

所述第一处理器，用于在运行所述计算机程序时，执行如权利要求22至48任一项所述的方法。
一种解码器，所述解码器包括解析单元、第二决策单元和第二滤波单元；其中，

所述解析单元，配置为解析码流，确定第一语法元素标识信息的取值；

所述第二决策单元，配置为当所述第一语法元素标识信息指示当前块允许使用预设选择网络模型进行模型决策时，根据当前块的预设选择网络模型确定至少两个输出值；其中，所述至少两个输出值包括所述当前块使用环路滤波网络模型时至少一个候选环路滤波网络模型各自对应的第一值和所述当前块不使用环路滤波网络模型时的第二值；以及根据所述至少两个输出值，确定所述当前块使用环路滤波网络模型时的目标环路滤波网络模型或者所述当前块不使用环路滤波网络模型；

所述第二滤波单元，配置为当所述当前块使用环路滤波网络模型时，利用所述目标环路滤波网络模型对所述当前块进行滤波处理，得到所述当前块的第一重建图像块。
一种解码器，所述解码器包括第二存储器和第二处理器；其中，

所述第二存储器，用于存储能够在所述第二处理器上运行的计算机程序；

所述第二处理器，用于在运行所述计算机程序时，执行如权利要求1至21任一项所述的方法。
一种编解码***，其中，所述编解码***包括如权利要求51或52所述的编码器和如权利要求53或54所述的解码器。
一种计算机存储介质，其中，所述计算机存储介质存储有计算机程序，所述计算机程序被执行时实现如权利要求1至21任一项所述的方法、或者如权利要求22至48任一项所述的方法。