CN113727103B - 视频编码、解码方法、装置、电子设备及存储介质 - Google Patents

视频编码、解码方法、装置、电子设备及存储介质 Download PDF

Info

Publication number
CN113727103B
CN113727103B CN202010449583.1A CN202010449583A CN113727103B CN 113727103 B CN113727103 B CN 113727103B CN 202010449583 A CN202010449583 A CN 202010449583A CN 113727103 B CN113727103 B CN 113727103B
Authority
CN
China
Prior art keywords
gain
blocks
video frame
block
determining
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010449583.1A
Other languages
English (en)
Other versions
CN113727103A (zh
Inventor
朱晗
许晓中
刘杉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent Technology Shenzhen Co Ltd
Original Assignee
Tencent Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Technology Shenzhen Co Ltd filed Critical Tencent Technology Shenzhen Co Ltd
Priority to CN202010449583.1A priority Critical patent/CN113727103B/zh
Priority to EP21813453.4A priority patent/EP4044600A4/en
Priority to PCT/CN2021/092029 priority patent/WO2021238606A1/zh
Publication of CN113727103A publication Critical patent/CN113727103A/zh
Priority to US17/719,027 priority patent/US12022069B2/en
Application granted granted Critical
Publication of CN113727103B publication Critical patent/CN113727103B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/117Filters, e.g. for pre-processing or post-processing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/119Adaptive subdivision aspects, e.g. subdivision of a picture into rectangular or non-rectangular coding blocks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • H04N19/147Data rate or code amount at the encoder output according to rate distortion criteria
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • H04N19/149Data rate or code amount at the encoder output by estimating the code amount by means of a model, e.g. mathematical model or statistical model
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/172Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a picture, frame or field
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/46Embedding additional information in the video signal during the compression process
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/80Details of filtering operations specially adapted for video compression, e.g. for pixel interpolation
    • H04N19/82Details of filtering operations specially adapted for video compression, e.g. for pixel interpolation involving filtering within a prediction loop
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/06Physical realisation, i.e. hardware implementation of neural networks, neurons or parts of neurons
    • G06N3/063Physical realisation, i.e. hardware implementation of neural networks, neurons or parts of neurons using electronic means

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Multimedia (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Pure & Applied Mathematics (AREA)
  • Mathematical Optimization (AREA)
  • Mathematical Analysis (AREA)
  • Algebra (AREA)
  • Biophysics (AREA)
  • Evolutionary Computation (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Molecular Biology (AREA)
  • Data Mining & Analysis (AREA)
  • Computational Linguistics (AREA)
  • Biomedical Technology (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

本申请涉及视频处理技术领域,公开了一种视频编码、解码方法、装置、电子设备及存储介质,涉及人工智能技术,利用人工智能中机器学习技术进行视频滤波,可在几乎不影响视频质量或视频质量下降不明显的情况下,降低解码复杂度,提升滤波效率。所述方法包括:从视频帧的编码数据中获得重建的视频帧,视频帧包括至少两个区块;对重建的视频帧进行滤波处理,获取重建的视频帧中的各个区块在滤波处理后获得的增益;根据各个区块的增益分布,从各个区块中确定出对编码数据进行解码时需要进行滤波处理的区块;发送视频帧的编码数据,编码数据中包含需要进行滤波处理的区块的指示信息。

Description

视频编码、解码方法、装置、电子设备及存储介质
技术领域
本申请涉及视频处理技术领域,尤其涉及一种视频编码、解码方法、装置、电子设备及存储介质。
背景技术
近年来,随着深度学习技术的发展,已经有不少研究尝试采用深度学习模型替代传统视频编码框架中的部分模块或提出基于深度学习的端到端编码框架,尤其是在环路滤波工具上,相比于传统滤波工具能明显提升编码性能。但是,基于深度学习的环路滤波工具的使用,会增加视频解码端的解码复杂度,目前的一种处理方式是通过RDO(Ratedistortion optimization,率失真优化)筛选出滤波后的视频帧中有增益提升的CTU(Coding Tree Unit,编码树单元),并在视频解码端对这部分CTU进行滤波。
发明内容
但是,基于RDO筛选出的CTU的增益分布不均匀,其中包括大量增益较小的CTU,这部分CTU对提升图像质量的帮助较小,却会增加解码复杂度。基于此,本申请实施例提供一种视频编码、解码方法、装置、电子设备及存储介质,可在几乎不影响视频质量或视频质量下降不明显的情况下,降低解码复杂度,提升滤波效率。
一方面,本申请一实施例提供了一种视频编码方法,包括:
从视频帧的编码数据中获得重建的视频帧,所述视频帧包括至少两个区块;
对重建的视频帧进行滤波处理,获取重建的视频帧中的各个区块在滤波处理后获得的增益;
根据各个区块的增益分布,从所述各个区块中确定出对所述编码数据进行解码时需要进行滤波处理的区块;
发送所述视频帧的编码数据,所述编码数据中包含需要进行滤波处理的区块的指示信息。
一方面,本申请实施例提供了一种视频解码方法,包括:
获取视频帧的编码数据,所述视频帧包括至少两个区块,所述编码数据中包含需要进行滤波处理的区块的指示信息,所述指示信息是根据所述至少两个区块在滤波处理后获得的增益的增益分布确定的;
从所述编码数据中获得重建的视频帧;
基于所述指示信息,对所述重建的视频帧中需要进行滤波处理的区块进行滤波处理。
可选地,所述编码数据中还包括用于指示所述视频帧是否需要进行滤波处理的帧级开关信息,所述帧级开关信息是通过如下方式确定:基于率失真优化算法,确定当重建的视频帧滤波后获得的增益达到第一总增益阈值时,是否需要在解码时对所述重建的视频帧进行滤波处理,其中,所述第一总增益阈值为所述视频帧中增益大于所述增益阈值的区块的增益之和;
所述方法还包括:
所述基于所述指示信息,对所述重建的视频帧中需要进行滤波处理的区块进行滤波处理之前,所述方法还包括:
确定从所述编码数据中获取的帧级开关信息表示需要对所述视频帧进行滤波处理。
可选地,所述增益阈值是通过如下方式确定的:
根据各个区块的增益分布,确定总增益为增益为正的区块的增益之和;
基于总增益保留比例与总增益的乘积,获得第二总增益阈值;
按区块的增益从大到小的顺序,对区块的增益进行累加处理,当累加值大于或等于所述第二总增益阈值时,将参与累加处理的至少两个增益中的最小增益,确定为增益阈值。
可选地,所述总增益保留比例是根据增益为正的区块的数量和所述视频帧中的区块总数之间的比值确定的;或者,所述总增益保留比例是根据增益为正的区块的增益统计特征值确定的。
可选地,所述编码数据中还包括用于指示所述视频帧是否需要进行滤波处理的帧级开关信息,所述帧级开关信息是通过如下方式确定:基于率失真优化算法,确定当所述重建的视频帧滤波后获得的增益达到第二总增益阈值时,是否需要在解码时对所述重建的视频帧进行滤波处理;
所述方法还包括:
所述基于所述指示信息,对所述重建的视频帧中需要进行滤波处理的区块进行滤波处理之前,所述方法还包括:
确定从所述编码数据中获取的帧级开关信息表示需要对所述视频帧进行滤波处理。
可选地,所述编码数据中还包括用于指示所述视频帧是否需要进行滤波处理的帧级开关信息,所述帧级开关信息是通过如下方式确定:基于率失真优化算法,确定当所述重建的视频帧滤波后获得的增益达到总增益时,是否需要在解码时对所述重建的视频帧进行滤波处理,其中,所述总增益为增益为正的区块的增益之和;
所述方法还包括:
所述基于所述指示信息,对所述重建的视频帧中需要进行滤波处理的区块进行滤波处理之前,所述方法还包括:
确定从所述编码数据中获取的帧级开关信息表示需要对所述视频帧进行滤波处理。
一方面,本申请一实施例提供了一种视频编码装置,包括:
解码模块,用于从视频帧的编码数据中获得重建的视频帧,所述视频帧包括至少两个区块;
滤波模块,用于对重建的视频帧进行滤波处理,获取重建的视频帧中的各个区块在滤波处理后获得的增益;
筛选模块,用于根据各个区块的增益分布,从所述各个区块中确定出对所述编码数据进行解码时需要进行滤波处理的区块;
发送模块,用于发送所述视频帧的编码数据,所述编码数据中包含需要进行滤波处理的区块的指示信息。
可选地,所述筛选模块,具体用于:
根据各个区块的增益分布,确定出增益阈值;
将增益大于所述增益阈值的区块,确定为对所述编码数据进行解码时需要进行滤波处理的区块。
可选地,所述筛选模块,具体用于:
基于增益为正的区块的增益,获得增益统计特征值;
根据所述增益统计特征值,确定增益阈值。
可选地,所述筛选模块还用于:在将增益大于所述增益阈值的区块,确定为对所述编码数据进行解码时需要进行滤波处理的区块之前,基于率失真优化算法,确定当所述重建的视频帧滤波后获得的增益达到第一总增益阈值时,需要在解码时对所述重建的视频帧进行滤波处理,其中,所述第一总增益阈值为增益大于所述增益阈值的区块的增益之和。
可选地,所述筛选模块,具体用于:
根据各个区块的增益分布,确定总增益为增益为正的区块的增益之和;
基于总增益保留比例与总增益的乘积,获得第二总增益阈值;
按区块的增益从大到小的顺序,对区块的增益进行累加处理,当累加值大于或等于所述第二总增益阈值时,将参与累加处理的多个增益中的最小增益,确定为增益阈值。
可选地,所述筛选模块还用于:
根据增益为正的区块的数量和所述视频帧中的区块总数之间的比值,确定所述总增益保留比例;或者,
根据增益为正的区块的增益统计特征值,确定所述总增益保留比例。
可选地,所述筛选模块还用于:
在对区块的增益进行累加处理之前,基于率失真优化算法,确定当所述重建的视频帧滤波后获得的增益达到第二总增益阈值时,需要在解码时对所述重建的视频帧进行滤波处理。
可选地,所述筛选模块,还用于:在根据各个区块的增益分布,从所述各个区块中确定出对所述编码数据进行解码时需要进行滤波处理的区块之前,基于率失真优化算法,确定当所述重建的视频帧滤波后获得的增益达到总增益时,需要在解码时对所述重建的视频帧进行滤波处理,其中,所述总增益为增益为正的区块的增益之和。
一方面,本申请一实施例提供了一种视频解码装置,包括:
获取模块,用于获取视频帧的编码数据,所述视频帧包括至少两个区块,所述编码数据中包含需要进行滤波处理的区块的指示信息,所述指示信息是根据所述至少两个区块在滤波处理后获得的增益的增益分布确定的;
视频解码模块,用于从所述编码数据中获得重建的视频帧;
视频滤波模块,用于基于所述指示信息,对所述重建的视频帧中需要进行滤波处理的区块进行滤波处理。
可选地,所述指示信息中指示的需要进行滤波处理的区块为增益大于增益阈值的区块,所述增益阈值是根据所述至少两个区块在滤波处理后获得的增益的增益分布确定的。
可选地,所述增益阈值是通过如下方式确定的:
基于所述至少两个区块中增益为正的区块的增益,获得增益统计特征值;
根据所述增益统计特征值,确定增益阈值。
可选地,所述编码数据中还包括用于指示所述视频帧是否需要进行滤波处理的帧级开关信息,所述帧级开关信息是通过如下方式确定:基于率失真优化算法,确定当重建的视频帧滤波后获得的增益达到第一总增益阈值时,是否需要在解码时对所述重建的视频帧进行滤波处理,其中,所述第一总增益阈值为所述视频帧中增益大于所述增益阈值的区块的增益之和;
所述视频滤波模块还用于:在基于所述指示信息,对所述重建的视频帧中需要进行滤波处理的区块进行滤波处理之前,确定从所述编码数据中获取的帧级开关信息表示需要对所述视频帧进行滤波处理。
可选地,所述增益阈值是通过如下方式确定的:
根据各个区块的增益分布,确定总增益为增益为正的区块的增益之和;
基于总增益保留比例与总增益的乘积,获得第二总增益阈值;
按区块的增益从大到小的顺序,对区块的增益进行累加处理,当累加值大于或等于所述第二总增益阈值时,将参与累加处理的至少两个增益中的最小增益,确定为增益阈值。
可选地,所述总增益保留比例是根据增益为正的区块的数量和所述视频帧中的区块总数之间的比值确定的;或者,所述总增益保留比例是根据增益为正的区块的增益统计特征值确定的。
可选地,所述编码数据中还包括用于指示所述视频帧是否需要进行滤波处理的帧级开关信息,所述帧级开关信息是通过如下方式确定:基于率失真优化算法,确定当所述重建的视频帧滤波后获得的增益达到第二总增益阈值时,是否需要在解码时对所述重建的视频帧进行滤波处理;
所述视频滤波模块还用于:在基于所述指示信息,对所述重建的视频帧中需要进行滤波处理的区块进行滤波处理之前,确定从所述编码数据中获取的帧级开关信息表示需要对所述视频帧进行滤波处理。
可选地,所述编码数据中还包括用于指示所述视频帧是否需要进行滤波处理的帧级开关信息,所述帧级开关信息是通过如下方式确定:基于率失真优化算法,确定当所述重建的视频帧滤波后获得的增益达到总增益时,是否需要在解码时对所述重建的视频帧进行滤波处理,其中,所述总增益为增益为正的区块的增益之和;
所述视频滤波模块还用于:在基于所述指示信息,对所述重建的视频帧中需要进行滤波处理的区块进行滤波处理之前,确定从所述编码数据中获取的帧级开关信息表示需要对所述视频帧进行滤波处理。
一方面,本申请一实施例提供了一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其中,处理器执行计算机程序时实现上述任一种方法的步骤。
一方面,本申请一实施例提供了一种计算机可读存储介质,其上存储有计算机程序指令,该计算机程序指令被处理器执行时实现上述任一种方法的步骤。
本申请实施例提供的视频编码、解码方法、装置、电子设备及存储介质,在视频编码端完成对视频帧的编码后,从视频帧的编码数据中获得重建的视频帧,对重建的视频帧进行滤波处理,并获得视频帧中各个区块因滤波处理带来的增益,根据各个区块的增益分布,筛选出增益较大的区块,使得视频解码端在解码时仅对增益较大的区块进行滤波处理,对增益较小的区块不进行滤波处理,在尽可能提高滤波后视频帧的增益的前提下,减少参与滤波的区块数量,在几乎不影响视频质量或视频质量下降不明显的情况下,降低解码复杂度,提升滤波效率。
附图说明
为了更清楚地说明本申请实施例的技术方案,下面将对本申请实施例中所需要使用的附图作简单地介绍,显而易见地,下面所介绍的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为视频编码器的基本流程图;
图2为RA和LDB配置下各个视频帧上CTU的命中率;
图3为经过CNNLF处理后有性能提升的CTU的增益分布情况;
图4为本申请实施例提供的视频编码方法的应用场景示意图;
图5为本申请一实施例提供的视频编码方法的流程示意图;
图6为本申请一实施例提供的确定增益阈值的一种实施方式的流程示意图;
图7为本申请一实施例提供的确定出需要进行滤波处理的区块的一种实施方式的流程示意图;
图8为本申请一实施例提供的确定增益阈值的另一种实施方式的流程示意图;
图9为本申请一实施例提供的确定出需要进行滤波处理的区块的另一种实施方式的流程示意图;
图10为本申请一实施例提供的视频解码方法的流程示意图;
图11为本申请一实施例提供的视频编码装置的结构示意图;
图12为本申请一实施例提供的视频解码装置的流程示意图;
图13为本申请一实施例提供的电子设备的结构示意图。
具体实施方式
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述。需要说明的是,附图中的任何元素数量均用于示例而非限制,以及任何命名都仅用于区分,而不具有任何限制含义。
YUV是编译true-color颜色空间(color space)的种类,“Y”表示明亮度(Luminance或Luma),也就是灰阶值,“U”和“V”表示的则是色度(Chrominance或Chroma),作用是描述影像色彩及饱和度,用于指定像素的颜色。
视频信号:从信号的获取方式看,可以分为摄像机拍摄到的以及计算机生成的两种方式。由于统计特性的不同,其对应的压缩编码方式也可能有所区别。
参考图1,现代主流视频编码技术,以国际视频编码标准HEVC,VVC,以及中国国家视频编码标准AVS为例,采用了混合编码框架,对输入的原始视频信号,进行了如下一系列的操作和处理:
(1)块划分结构(block partition structure):根据输入图像的大小,划分成若干个不重叠的处理单元,每个处理单元将进行类似的压缩操作。这个处理单元被称作CTU,或者LCU(largest coding unit,最大编码单元)。每一个CTU还可以继续进行更加精细的划分,得到一个或多个基本编码的单元,称之为CU(Coding Unit编码单元),每个CU是一个编码环节中最基本的元素。以下描述的是对每一个CU可能采用的各种编码方式。
(2)预测编码(Predictive Coding):包括了帧内预测和帧间预测等方式,原始视频信号经过选定的已重建视频信号的预测后,得到残差视频信号。视频编码端需要为当前CU决定在众多可能的预测编码模式中,选择最适合的一种,并告知视频解码端。
帧内预测(intra-picture prediction):预测的信号来自于同一图像内已经编码重建过的区域,即从参考帧中找出与当前块最匹配的位置,参考的是时域上信息,包括:运动估计(Motion Estimation,ME)和运动补偿(Motion Compensation,MC)。其中,运动估计是指,确定当前待编码的CU在已编码的图像(参考帧)中的最佳对应图像块,并且计算出对应块的偏移(运动矢量)。
帧间预测(intra-picture prediction):预测的信号来自已经编码过的,不同于当前图像的其他图像(称之为参考图像),即参考周围像素来插值出预测像素,参考的是空域上信息。
I帧(I frame),即参考帧,又称为内部画面(intra picture),I帧通常是每个GOP(MPEG所使用的一种视频压缩技术)的第一个帧。I帧法是帧内压缩法,也称为“关键帧”压缩法,是基于离散余弦变换DCT(Discrete Cosine Transform)的压缩技术,这种算法与JPEG压缩算法类似。在编码的过程中,部分视频帧序列压缩成为I帧,部分压缩成P帧,还有部分压缩成B帧,解码时仅用I帧的数据就可重构一帧完整的图像,即I帧不需要参考其他视频帧即可完成重构,其它视频帧可基于I帧实现重构。
(3)变换编码及量化(Transform&Quantization):残差视频信号经过DFT(Discrete Fourier Transform,离散傅里叶变换)、DCT(Discrete Cosine Transform,离散余弦变换)等变换操作,将信号转换到变换域中,称之为变换系数。在变换域中的信号,进一步的进行有损的量化操作,丢失掉一定的信息,使得量化后的信号有利于压缩表达。在一些视频编码标准中,可能有多于一种变换方式可以选择,因此,视频编码端也需要为当前编码CU选择其中的一种变换,并告知视频解码端。量化的精细程度通常由量化参数(QP)来决定,QP取值较大大,表示更大取值范围的系数将被量化为同一个输出,因此通常会带来更大的失真,及较低的码率;相反,QP取值较小,表示较小取值范围的系数将被量化为同一个输出,因此通常会带来较小的失真,同时对应较高的码率。
(4)熵编码(Entropy Coding)或统计编码:量化后的变换域信号,将根据各个值出现的频率,进行统计压缩编码,最后输出二值化(0或者1)的压缩码流。同时,编码产生其他信息,例如选择的模式,运动矢量等,也需要进行熵编码以降低码率。统计编码是一种无损编码方式,可以有效的降低表达同样的信号所需要的码率。常见的统计编码方式有变长编码(VLC,Variable Length Coding)或者基于上下文的二值化算术编码(CABAC,ContentAdaptive Binary Arithmetic Coding)。
(5)环路滤波(Loop Filtering):已经编码过的图像,经过反量化,反变换及预测补偿的操作(上述2~4的反向操作),可获得重建的解码图像。重建的解码图像与原始图像相比,由于存在量化的影响,部分信息与原始图像有所不同,产生失真(Distortion),因此需要对重建图像进行滤波处理,例如去块效应滤波(deblocking)、SAO(Sample AdaptiveOffset,样点自适应补偿)或者ALF(Adaptive Loop Filter,自适应环路滤波)等滤波器,可以有效地降低量化所产生的失真程度。由于这些经过滤波后的重建图像,将做为后续编码图像的参考,用于对将来的信号进行预测,所以上述的滤波操作也被称为环路滤波,即在编码环路内的滤波操作。图1展示了一个视频编码器的基本流程图。
根据上述视频编码过程可以看出,在视频解码端,对于每一个CU,解码器获得压缩码流后,先进行熵解码,获得各种模式信息及量化后的变换系数。各个系数经过反量化及反变换,得到残差信号。另一方面,根据已知的编码模式信息,可获得该CU对应的预测信号,两者相加之后,即可得到重建信号。最后,解码图像的重建值,需要经过环路滤波的操作,产生最终的输出信号。
近年来,随着深度学习技术的发展,已经有不少研究尝试采用深度学习模型替代传统视频编码框架中的部分模块或提出基于深度学习的端到端编码框架,尤其是在环路滤波工具上,相比于传统滤波工具能明显提升编码性能。基于深度学习的环路滤波工具主要思路是通过神经网络学习重建图像到原始图像的映射关系,通常用来替换或帮助传统滤波工具修复有损编码带来的信息损失、抑制编码噪声,从而提升重建帧质量,提升编解码器性能。
例如,目前AVS3参考软件HPM5.2中采纳的CNNLF(Convolutional Neural NetworkLoop Filter,基于深度学习的环路滤波)方案相较于HPM5.0(无CNNLF方案)实现了接近7%的码率节省,但高性能的同时也带来了高复杂度,即使在GPU(Graphics Processing Unit,图形处理器)上处理,在RA(Random Access)配置下的解码复杂度仍高达3942%,在LDB(lowdelay B)配置下的解码复杂度仍高达7938%,这严重影响了基于深度学习的环路滤波工具在实际中的推广和应用。由于HPM5.2中目前采纳方案的视频解码端部署思路是仅对flag为1(即CNNLF开关为开)的CTU进行CNNLF处理,因此减少开启CNNLF的CTU个数将能直接降低解码复杂度。目前,标准提案M5129根据RA测试中CTU上命中率呈现的规律性,提出时域层(temporal layer)并关闭4和5级时域层,如表1所示,表1为不同时域帧CNN环路滤波的开关情况。
表1
时域层 包含的帧 是否打开CNN环路滤波
0 0(I frame)
1 16
2 8
3 4,12
4 2,6,10,14
5 1,3,5,7,9,11,13,15
随着时域层(Temporal layer)增大,参考帧中的时域信息利用的更加充分,CTU开关选中神经网络滤波的块数逐渐减少,神经网络滤波带来的质量提升逐渐减少,关闭对质量提升贡献不大的时域层能在对性能影响较小的情况下降低解码复杂度,相较于HPM5.2的BD-rate与解码复杂度如表2所示,表2为关闭4和5级temporal layer后对比HPM5.2的性能。
表2
Figure BDA0002507022610000121
标准提案M5129的复杂度优化方法虽然达到降低复杂度的目的,但性能有明显下降,尤其是在4K序列上。参考图2,为RA和LDB配置下各个视频帧上CTU的命中率,可见LDB配置下temporal layer规律与RA配置下略有不同,因此,表1的策略并不完全适用于LDB测试。
在AVS3参考软件HPM5.2中,通过CTU级RDO判断CNNLF是否会给当前CTU带来性能增益,如果有增益则该打开该CTU的CNNLF工具,即对该CTU内的像素点进行CNNLF,否则关闭该CTU的CNNLF工具,即不对该CTU内的像素点进行CNNLF。本申请发明人对RitualDance序列的第二帧中进行CNNLF处理后有性能提升的CTU增益分布情况进行了统计,统计结果如图3所示,此处的增益采用欧式距离衡量,其计算方法如下:
Disti=(Ii,REC-Ii,org)2-(Ii,CNN-Ii,org)2
其中,i表示CTU序号,Ii,CNN为经过CNNLF处理后视频帧中第i个CTU对应的图像,Ii,REC为未经过CNNLF处理的视频帧中第i个CTU对应的解码图像,Ii,org为未经过压缩编码的原始视频帧中第i个CTU对应的图像,Disti为正数则说明经过CNNLF处理后该CTU上存在增益,且Disti越大代表增益越大,Disti为负数则说明经过CNNLF处理后该CTU上存在损失,Disti越小代表损失越大。从图3中发现在同一视频帧中,不同CTU上存在增益分布不均的情况,且很大一部分CTU上增益并不明显,由于每个CTU上CNNLF处理的时间相同,因此,将过多的计算资源用于增益并不明显的CTU,将极大地增加解码复杂度,且并不能大幅提高滤波后的图像质量。
基于此,本申请提出了一种视频编码方法,在视频解码端完成对视频帧的编码后,从视频帧的编码数据中获得重建的视频帧,并对重建的视频帧进行滤波处理,获取重建的视频帧中的各个区块在滤波处理后获得的增益,并根据各个区块的增益分布,从各个区块中确定出对编码数据进行解码时需要进行滤波处理的区块,将视频帧的编码数据发送至视频解码端,该编码数据中包含需要进行滤波处理的区块的指示信息,这样,视频解码端在对视频帧进行解码时,可根据编码数据中的指示信息,仅对视频帧中需要进行滤波处理的区块进行滤波处理,在几乎不影响视频质量或视频质量下降不明显的情况下,降低解码复杂度,提升滤波效率。其中,视频帧可划分成至少两个区块,本申请实施例中的区块可以是CTU,也可以是比CTU定义更小的区域(如CU),或者一个可包含至少两个CTU的区域,或者帧内部其他划分方法得到的区域等等。上述视频编码方法,可根据滤波后的视频帧中各个区块的增益分布,筛选出增益较大的区块,解码时仅对增益较大的区块进行滤波处理,对增益较小的区块不进行滤波处理,虽然该方法会降低某一帧的总增益,但在帧间预测中,能提升滤波工具在下一帧上的滤波效果,最终在几乎不影响视频质量或视频质量下降不明显的情况下,降低解码复杂度,提升滤波效率。
需要说明的是,本申请实施例的视频编码方法,不涉及编解码过程中使用的滤波模型本身,因此,本申请实施例的视频编码方法可适用于任何滤波模型,可以应用到使用了基于深度学习的滤波模型的视频编解码器或视频压缩的后处理产品中。
在介绍完本申请实施例的设计思想之后,下面对本申请实施例的技术方案能够适用的应用场景做一些简单介绍,需要说明的是,以下介绍的应用场景仅用于说明本申请实施例而非限定。在具体实施时,可以根据实际需要灵活地应用本申请实施例提供的技术方案。
参考图4,其为本申请实施例提供的视频编码方法的应用场景示意图。该应用场景包括终端设备401(包括终端设备401-1、终端设备401-2、……终端设备401-n)和服务器402。其中,终端设备401和服务器402之间可通过无线通信网络或有线通信网络连接,终端设备401包括但不限于桌面计算机、移动电话、移动电脑、平板电脑、媒体播放器、智能可穿戴设备、智能电视、车载设备、个人数字助理(personal digital assistant,PDA)等电子设备。服务器402可以是独立的物理服务器,也可以是多个物理服务器构成的服务器集群或者分布式***,还可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、CDN、以及大数据和人工智能平台等基础云计算服务的云服务器。
当终端设备401的用户想观看某一视频时,可通过终端设备401向服务器402发送视频获取请求,服务器402基于视频获取请求查找对应的视频,对该视频进行编码以得到编码后的视频流,并将视频流传输给终端设备401,终端设备401对接收到的视频流进行解码和滤波处理,以实现该视频在终端设备401-2上的正常播放。此时,服务器402相当于视频编码端,而终端设备401相当于视频解码端。
当终端设备401-1的用户想将某一视频上推送给其它用户(如终端设备401-2)时,终端设备401-1对该视频进行编码以得到编码后的视频流,将视频流传输给服务器402,服务器402再将该视频流转发给终端设备401-2,终端设备401-2对接收到的视频流进行解码和滤波处理,以实现该视频在终端设备401-2上的正常播放。此时,终端设备401-1相当于视频编码端,而终端设备401-2相当于视频解码端。
当然,本申请实施例提供的方法并不限用于图4所示的应用场景中,还可以用于其它可能的应用场景,本申请实施例并不进行限制。对于图4所示的应用场景的各个设备所能实现的功能将在后续的方法实施例中一并进行描述,在此先不过多赘述。
为进一步说明本申请实施例提供的技术方案,下面结合附图以及具体实施方式对此进行详细的说明。虽然本申请实施例提供了如下述实施例或附图所示的方法操作步骤,但基于常规或者无需创造性的劳动在方法中可以包括更多或者更少的操作步骤。在逻辑上不存在必要因果关系的步骤中,这些步骤的执行顺序不限于本申请实施例提供的执行顺序。
下面结合图4所示的应用场景,对本申请实施例提供的技术方案进行说明。需要说明的时,本申请实施例提供任一视频编码方法,可应用任一视频编码端,如图4所示的终端设备或服务器。
参考图5,本申请实施例提供一种视频编码方法,包括以下步骤:
S501、从视频帧的编码数据中获得重建的视频帧,视频帧包括至少两个区块。
实际应用中,区块可以是视频帧中的CTU,也可以是比CTU定义更小的区域(如CU),或者一个可包含至少两个CTU的区域,或者通过其他区块划分方法对视频帧内部进行划分后得到的区域,本申请实施例不作限定。
具体实施时,从视频帧的编码数据中获得重建的视频帧的过程,即为对编码数据进行反量化、反变换及预测补偿的操作,不再赘述。
S502、对重建的视频帧进行滤波处理,获取重建的视频帧中的各个区块在滤波处理后获得的增益。
其中,步骤S502中采用的滤波方法与视频解码端采用的滤波方法相同,本申请实施例对视频解码端采用的滤波处理方法不作限定,可以是采用CNNLF模型进行滤波,也可以是其它的滤波模型。
具体实施时,视频编码端先对原始视频进行编码处理,获得编码数据,再从每个视频帧的编码数据中获得重建的视频帧。然后,视频编码端对每个重建的视频帧进行滤波处理,获得每个重建的视频帧对应的滤波图像。接着,视频编码端基于一定的评价标准,获取重建的视频帧中的各个区块在滤波处理后获得的增益,例如,可对原始视频帧、解码后的视频帧(即重建的视频帧)以及滤波后的视频帧进行相似度的评估,从而获取重建的视频帧中的各个区块在滤波处理后获得的增益。区块的增益越大,表明滤波处理对该区块的图像质量的提升效果越明显,反之,区块的增益越小,表明滤波处理对该区块的图像质量的提升效果越不明显。
具体地,可通过如下方式获得重建的视频帧中的每一区块在滤波处理后获得的增益:针对重建的视频帧中的每一区块,基于每一区块对应的原始图像和重建图像之间的第二相似度,以及每一区块对应的原始图像和滤波图像之间的第二相似度,获得每一区块在滤波处理后获得的增益,其中,原始图像为每一区块在编码前的视频帧中对应的图像,重建图像为每一区块在重建的视频帧中对应的图像,滤波图像为对重建的视频帧中的每一区块进行滤波处理后获得的图像。其中,计算第一相似度和第二相似度时使用的评价标准可以是欧氏距离、MSE(Mean Square Error,均方误差)或SSIM(structural similarity index,结构相似性)等,本申请实施例不作限定。具体实施时,可采用如下公式计算视频帧中的每一区块的增益:
Disti=S(Ii,REC,Ii,org)-S(Ii,CNN,Ii,org),
其中,i表示视频帧中区块的序号,Ii,org为第i个区块对应的原始图像,Ii,REC为第i个区块对应的重建图像,Ii,CNN为第i个区块对应的滤波图像,S(Ii,REC,Iorg)表示Ii,REC和Ii,org的相似度,S(Ii,CNN,Ii,org)表示Ii,CNN和Ii,org的相似度,Disti为视频帧中第i个区块的增益。Disti为正数则说明经过滤波处理后第i个区块上存在增益,此时Disti越大代表增益越大;Disti为负数则说明经过滤波处理后第i个区块上存在损失,此时Disti越小代表损失越大。
实际应用中,可基于区块中像素点的像素参数计算第一相似度和第二相似度,其中,像素参数可以是以下至少一种:Y分量、U分量和V分量,像素参数也可以是灰度值、RGB值等。
S503、根据各个区块的增益分布,从各个区块中确定出对编码数据进行解码时需要进行滤波处理的区块。
具体实施时,可通过如下方式确定出每个视频帧中需要进行滤波处理的区块:根据各个区块的增益分布,确定出增益阈值;将增益大于增益阈值的区块,确定为对编码数据进行解码时需要进行滤波处理的区块。这样,可基于视频帧内的区块的增益分布确定出合适的增益阈值,并基于增益阈值筛选出增益较大的区块,从而在解码时筛选出的增益较大的区块进行滤波,对增益较小的区块不进行滤波,以将计算资源用于对提升图像质量帮助较大的区块,从而降低解码复杂度,提升滤波效率。
S504、发送视频帧的编码数据,编码数据中包含需要进行滤波处理的区块的指示信息。
具体实施时,每一视频帧的编码数据中均携带有指示信息,该指示信息用于指示该视频帧中的哪些区块需要进行滤波处理。例如,指示信息可包括视频帧中每个区块对应的flag标识,当区块的flag=1时,表示解码时需要对该区块进行滤波处理,当区块的flag=0时,表示解码时不需要对该区块进行滤波处理。再如,指示信息可包括视频帧中需要进行滤波处理的区块的序号,例如指示信息中包含序号1、4、5,则需要对视频帧中的第1、4、5个区块进行滤波处理。
具体实施时,视频编码端将指示信息写入编码数据中,并发送给视频解码端。视频解码端从编码数据中获得重建的视频帧,基于编码数据中的指示信息,对重建的视频帧中需要进行滤波处理的区块进行滤波处理,获得滤波后的视频帧并播放。
本申请实施例的视频编码方法,在视频编码端完成对视频帧的编码后,视频帧的编码数据中获得重建的视频帧,对重建的视频帧进行滤波处理,并获得视频帧中各个区块因滤波处理带来的增益,根据各个区块的增益分布,筛选出增益较大的区块,使得视频解码端在解码时仅对增益较大的区块进行滤波处理,对增益较小的区块不进行滤波处理,在尽可能提高滤波后视频帧的增益的前提下,减少参与滤波的区块数量,在几乎不影响视频质量或视频质量下降不明显的情况下,降低解码复杂度,提升滤波效率。
具体实施时,参考图6,可通过以下方式确定任一视频帧所对应的增益阈值:
S601、根据各个区块的增益分布,确定总增益为增益为正的区块的增益之和。
其中,步骤S601中的各个区块是指同一个视频帧中的区块。
S602、基于总增益保留比例与总增益的乘积,获得第二总增益阈值。
具体实施时,总增益可通过如下公式表示:
Figure BDA0002507022610000181
其中,N为增益为正的区块数量,则第二总增益阈值为
Figure BDA0002507022610000182
其中,G为总增益保留比例。
具体实施时,可预先设定一个总增益保留比例,即每个视频帧对应相同的总增益保留比例。
具体实施时,还可以根据各个区块的增益分布,确定总增益保留比例。这样,每个视频帧对应的总增益保留比例是不同的,通过增益分布动态确定总增益保留比例,可提高区块筛选的准确度。具体地,可通过如下任一方式确定视频帧的总增益保留比例:
第一种方式:基于增益为正的区块的数量和视频帧中的区块总数的比值,确定总增益保留比例。
具体实施时,根据视频帧中各个区块的增益,统计增益为正的区块的数量N,确定视频帧的命中率r=N/block_num,其中,block_num为该视频帧中包含的区块总数;然后,基于命中率r确定总增益保留比例G。
实际应用中,r与G的关系可以通过如下分段函数表示:
Figure BDA0002507022610000183
其中,分段数n、范围an以及对应的gn均根据经验取值,0≤an,gn≤1。
进一步地,可限定a0<a1<a2<…<an-1<an,g1<g2<…<gn,即命中率r越高,总增益保留比例G越大。
具体实施时,总增益保留比例可以与比值正相关,例如,r与G的关系也可以是:G=k×r+b,其中,k和b可根据经验取值。
第二种方式:基于增益为正的区块的增益统计特征值,确定总增益保留比例。
具体实施时,增益统计特征值包括但不限于:平均值、中位值、标准差等。
具体实施时,增益统计特征值与总增益保留比例的关系可通过分段函数表示。以标准差为例,标准差std与G的关系可以通过如下分段函数表示:
Figure BDA0002507022610000191
其中,分段数n、范围an以及对应的gn均根据经验取值,0≤an,gn≤1。
进一步地,可限定a0<a1<a2<…<an-1<an,g1<g2<…<gn,即标准差std越高,总增益保留比例G越大。
具体实施时,总增益保留比例可以与增益统计特征值正相关,例如,增益统计特征值P与G的关系也可以是:G=k×P+b,其中,k和b可根据经验取值。
S603、按区块的增益从大到小的顺序,对区块的增益进行累加处理,当累加值大于或等于第二总增益阈值时,将参与累加处理的至少两个增益中的最小增益,确定为增益阈值。
实际应用中,可根据各个区块的增益,确定每个区块对应的flag的初始值,将增益为正的区块的flag设为1,将增益小于等于0的区块的flag设为0;然后,令
Figure BDA0002507022610000192
其中,flagi表示视频帧中第i个区块的flag,此时,计算命中率的公式可以表示为:
Figure BDA0002507022610000193
block_num为该视频帧中包含的区块总数。
然后,根据各个区块的增益分布,确定总增益保留比例G,基于总增益保留比例G与总增益
Figure BDA0002507022610000194
的乘积,获得第二总增益阈值
Figure BDA0002507022610000195
接着,按增益从大到小的顺序,对增益为正的区块的增益进行排序,获得序列Dist′j,其中,排序越靠前的区块的增益越大,即j越小,Dist′j越大。然后,按照Dist′j的排序,从j=1开始对区块的增益Dist′j进行累加处理,直到
Figure BDA0002507022610000201
停止累加,此时可确定增益阈值D1=Dist′j
最后,将该视频中,增益不小于增益阈值D1的区块的flag设为1,将增益大于增益阈值D1的区块的flag设为0,并将设置好的各个区块的flag作为指示信息写入编码数据,并发送给视频解码端。
视频解码端在收到编码数据后,根据指示信息中各个区块的flag,对flag=1的区块进行滤波处理,对flag=0的区块不进行滤波处理。
图6所示的实施方式中,基于各个区块的增益分布,保留合适比例的区块进行滤波处理,这样,在尽可能提高解码后的视频帧获得的总增益的前提下,降低视频帧中参与滤波的区块的比例,进而在几乎不影响视频质量或视频质量下降不明显的情况下,降低解码复杂度,提升滤波效率。
进一步地,在步骤S603之前,本申请实施例的方法还包括如下步骤:基于率失真优化算法,确定当重建的视频帧滤波后获得的增益达到第二总增益阈值时,需要在解码时对重建的视频帧进行滤波处理。通过上述步骤,可基于第二总增益阈值,进一步地确定是否要对视频帧进行滤波处理,针对需要滤波处理的视频帧,继续筛选出视频帧中需要进行滤波处理的区块。
具体地,参考图7,可通过如下方式确定视频帧中需要进行滤波处理的区块:
S701、根据各个区块的增益分布,确定总增益为增益为正的区块的增益之和。
S702、基于总增益保留比例与总增益的乘积,获得第二总增益阈值,总增益为增益为正的区块的增益之和。
其中,步骤S701和步骤S702的具体实施方式可参考步骤S601和步骤S602,不再赘述。
S703、基于率失真优化算法,判断当重建的视频帧滤波后获得的增益达到第二总增益阈值时是否需要在解码时对重建的视频帧进行滤波处理,若需要,则执行步骤S705,否则,执行步骤S704。
其中,率失真优化(RDO)是一种提高视频压缩视频质量的方法,该名称是指针对视频编码所需的数据量(速率)优化失真量(视频质量损失),速率失真优化可在提高视频编码的质量的同时减少编码后视频的数据量,即平衡视频大小和视频质量,作出最优的编码决策。通过编解码器或编解码标准中现有的率失真优化算法判断是否需要在解码时对重建的视频帧进行滤波处理,即根据对视频帧进行滤波处理带来的增益,以及在编码数据中写入指示信息所增加的数据量,判断是否值得对该视频帧进行滤波处理。步骤S703中,确定为了要使滤波后的视频帧获得的总增益达到第二总增益阈值,需要在编码数据中增加指示信息的数据量,基于率失真优化算法,根据增加的数据量和视频帧获得的总增益,判断是否值得对该视频帧进行滤波处理。实际应用中,可确定当视频帧的总增益达到第二总增益阈值时,需要进行滤波的区块数量,进而确定需要在编码数据中增加指示信息的数据量,例如,每一区块的指示信息需要占用m比特的数据量,若有T个区块需要进行滤波,则增加Tm比特的数据量。
S704、确定不需要对该视频帧进行滤波处理。
具体实施时,若确定不需要对该视频帧进行滤波处理,则该视频帧对应的帧级开关frame_flag=0,将帧级开关的信息作为指示信息写入该视频帧的编码数据内。当视频帧对应的帧级开关frame_flag=0时,视频解码端不会对该视频帧进行滤波处理。
S705、按区块的增益从大到小的顺序,对区块的增益进行累加处理,当累加值大于或等于第二总增益阈值时,将参与累加处理的至少两个增益中的最小增益,确定为增益阈值。
其中,步骤S705的具体实施方式可参考步骤S603的具体实施方式,不再赘述。
S706、将增益大于增益阈值的区块,确定为对编码数据进行解码时需要进行滤波处理的区块。
具体实施时,参考图8,可通过以下方式确定任一视频帧所对应的增益阈值:
S801、基于增益为正的区块的增益,获得增益统计特征值。
S802、根据增益统计特征值,确定增益阈值。
具体实施时,增益统计特征值包括但不限于:平均值、中位值、标准差等。
以平均值为例,可根据各个区块的增益,确定每个区块对应的flag的初始值,将增益为正的区块的flag设为1,将增益小于等于0的区块的flag设为0,然后,令
Figure BDA0002507022610000221
其中,flagi表示视频帧中第i个区块的flag,此时,增益为正的区块的增益的平均值
Figure BDA0002507022610000222
可设置增益阈值
Figure BDA0002507022610000223
a为根据经验设置的系数。
当然,也可以采用分段函数的方式,确定增益统计特征值和增益阈值之间的对应关系,具体可参考第一种方式和第二种方式中介绍的分段函数,不再赘述。
基于其它增益统计特征值确定增益阈值的具体实施方式,可参考平均值的处理方式,不再赘述。
进一步地,在将增益大于增益阈值的区块,确定为对编码数据进行解码时需要进行滤波处理的区块之前,本申请实施例的方法还包括如下步骤:基于率失真优化算法,确定当重建的视频帧滤波后获得的增益达到第一总增益阈值时,需要在解码时对重建的视频帧进行滤波处理,其中,第一总增益阈值为增益大于步骤S802确定出的增益阈值的区块的增益之和。
具体地,参考图9,可通过如下方式确定视频帧中需要进行滤波处理的区块:
S901、基于增益为正的区块的增益,获得增益统计特征值。
S902、根据增益统计特征值,确定增益阈值。
其中,步骤S901和步骤S902的具体实施方式可参考步骤S801和步骤S802,不再赘述。
S903、基于率失真优化算法,判断当重建的视频帧滤波后获得的增益达到第一总增益阈值时是否需要在解码时对重建的视频帧进行滤波处理,若需要,则执行步骤S905,否则,执行步骤S904。
其中,第一总增益阈值为增益大于步骤S902确定出的增益阈值的区块的增益之和。步骤S903中,可先确定为了要使滤波后的视频帧获得的总增益达到第一总增益阈值,需要在编码数据中增加指示信息的数据量,再基于率失真优化算法,根据增加的数据量和视频帧获得的总增益,判断是否值得对该视频帧进行滤波处理。实际应用中,可确定当视频帧的总增益达到第一总增益阈值时,需要进行滤波的区块数量,进而确定需要在编码数据中增加指示信息的数据量,例如,每一区块的指示信息需要占用m比特的数据量,若有T个区块需要进行滤波,则增加T×m比特的数据量。
S904、确定不需要对该视频帧进行滤波处理。
具体实施时,若确定不需要对该视频帧进行滤波处理,则该视频帧对应的帧级开关frame_flag=0,将帧级开关的信息作为指示信息写入该视频帧的编码数据内。当视频帧对应的帧级开关frame_flag=0时,视频解码端不会对该视频帧进行滤波处理。当视频帧对应的帧级开关frame_flag=1时,视频解码端才会继续从解码数据中获取针对区域的指示信息,基于区域的指示信息,对需要进行滤波处理的区块进行滤波处理。
S905、将增益大于增益阈值的区块,确定为对编码数据进行解码时需要进行滤波处理的区块。
在上述任一实施方式的基础上,在执行步骤S503之前,可先确定是否需要对视频帧进行滤波处理,若确定需要对视频帧进行滤波处理,则执行步骤S503;若确定不需要对视频帧进行滤波处理,则确定无需执行步骤S503。
为此,在执行步骤S503之前,可通过如下方式确定是否需要对视频帧进行滤波处理:基于率失真优化算法,判断当重建的视频帧滤波后获得的增益达到总增益时,是否需要在解码时对重建的视频帧进行滤波处理,其中,总增益为增益为正的区块的增益之和;若需要,则执行步骤S503,否则,确定不需要对该视频帧进行滤波处理。具体实施方式,可参考步骤S703和步骤S903,不再赘述。
具体实施时,若确定不需要对该视频帧进行滤波处理,则该视频帧对应的帧级开关frame_flag=0,将帧级开关的信息作为指示信息写入该视频帧的编码数据内。当视频帧对应的帧级开关frame_flag=0时,视频解码端不会对该视频帧进行滤波处理。
基于率失真优化算法和视频帧的总增益,进一步判断是否要对视频帧进行滤波,提高针对视频帧的判断准确率。
在使用I帧进行解码的方案中,I帧是十分关键的参考帧,为了保证后续视频帧的质量,在解码时可对I帧中的所有区块均进行滤波,提高I帧的质量,进而保证整个视频的质量。为此,具体实施时,可根据实际应用需求选择是否需要在解码时,对I帧的所有区块都进行滤波处理。
当选择对I帧的所有区块都进行滤波处理时,可在执行步骤S503之前,先判断当前处理的视频帧是否为I帧,若该视频帧为I帧,则将该视频帧中的各个区块,确定为解码时需要进行滤波处理的区块;若该视频帧不是I帧,则执行步骤S503以及后续的步骤。例如,针对目前AVS3的帧间预测(RA和LDB配置下)进行解码效率优化时,为了保证性能没有明显下降而不对I帧的区块进行筛选,即I帧中所有的区块均需要滤波。
当不选择对I帧的所有区块都进行滤波处理时,则在执行步骤S503之前不需要判断当前处理的视频帧是否为I帧,即I帧的处理方式与其他帧的处理方式相同,具体处理方式参考图5~图9。例如,当本申请实施例的方法应用于帧内预测帧以及AI(all intra)配置下时,可不再对I帧进行特殊处理,即对所有视频帧均执行的相同的筛选操作。
参考图10,基于与上述视频编码方法相同的发明构思,本申请实施例还提供了一种视频解码方法,具体包括以下步骤:
S1001、获取视频帧的编码数据,视频帧包括至少两个区块,编码数据中包含需要进行滤波处理的区块的指示信息,指示信息是根据至少两个区块在滤波处理后获得的增益的增益分布确定的。
具体实施时,指示信息中指示的需要进行滤波处理的区块为增益大于增益阈值的区块,该增益阈值是根据视频帧中的至少两个区块在滤波处理后获得的增益的增益分布确定的。
具体实施时,确定出视频帧的指示信息的具体实施方式可参考图5~图9所示的方法,不再赘述。
S1002、从编码数据中获得重建的视频帧。
S1003、基于指示信息,对重建的视频帧中需要进行滤波处理的区块进行滤波处理。
具体实施时,每一视频帧的编码数据中均携带有指示信息,该指示信息用于指示该视频帧中的哪些区块需要进行滤波处理。例如,指示信息可包括视频帧中每个区块对应的flag标识,当区块的flag=1时,表示解码时需要对该区块进行滤波处理,当区块的flag=0时,表示解码时不需要对该区块进行滤波处理。再如,指示信息可包括视频帧中需要进行滤波处理的区块的序号,例如指示信息中包含序号1、4、5,则需要对视频帧中的第1、4、5个区块进行滤波处理。
具体实施时,视频编码端将指示信息写入编码数据中,并发送给视频解码端。视频解码端从编码数据中获得重建的视频帧,基于编码数据中的指示信息,对重建的视频帧中需要进行滤波处理的区块进行滤波处理,获得滤波后的视频帧并播放。
本申请实施例的视频解码方法,在视频编码端完成对视频帧的编码后,从视频帧的编码数据中获得重建的视频帧,对重建的视频帧进行滤波处理,并获得视频帧中各个区块因滤波处理带来的增益,根据各个区块的增益分布,筛选出增益较大的区块,使得视频解码端在解码时仅对增益较大的区块进行滤波处理,对增益较小的区块不进行滤波处理,在尽可能提高滤波后视频帧的增益的前提下,减少参与滤波的区块数量,在几乎不影响视频质量或视频质量下降不明显的情况下,降低解码复杂度,提升滤波效率。
具体实施时,编码数据中还包括用于指示视频帧是否需要进行滤波处理的帧级开关信息。相应地,在执行步骤S1003之前,本申请实施例的视频解码方法还包括如下步骤:从编码数据中获取帧级开关信息,若获取的帧级开关信息表示需要对视频帧进行滤波处理,则执行步骤S1003;若获取的帧级开关信息表示不需要对视频帧进行滤波处理,则无需执行步骤S1003,即无需对视频帧进行滤波处理。
具体实施时,可通过帧级开关表示帧级开关信息,若视频帧对应的帧级开关frame_flag=0,则表示不需要对该视频帧进行滤波处理;若视频帧对应的帧级开关frame_flag=1,则表示需要对该视频帧进行滤波处理,然后再根据区块的指示信息进行滤波处理。
具体实施时,可通过以下任一方式确定帧级开关信息:
第一种方式:基于率失真优化算法,确定当重建的视频帧滤波后获得的增益达到第一总增益阈值时,是否需要在解码时对重建的视频帧进行滤波处理,其中,第一总增益阈值为视频帧中增益大于增益阈值的区块的增益之和。
第二种方式:基于率失真优化算法,确定当重建的视频帧滤波后获得的增益达到第二总增益阈值时,是否需要在解码时对重建的视频帧进行滤波处理;
第三种方式:基于率失真优化算法,确定当重建的视频帧滤波后获得的增益达到总增益时,是否需要在解码时对重建的视频帧进行滤波处理,其中,总增益为增益为正的区块的增益之和。
上述三种方式的具体实现过程,可参考视频解码方法对应的实施例,不再赘述。
基于视频帧的第一总增益阈值、第二总增益阈值或总增益,进一步判断是否需要对视频帧进行滤波,提高针对视频帧的判断准确率。
如图11所示,基于与上述视频编码方法相同的发明构思,本申请实施例还提供了一种视频编码装置110,包括解码模块1101、滤波模块1102、筛选模块1103和发送模块1104。
解码模块1101,用于从视频帧的编码数据中获得重建的视频帧,所述视频帧包括至少两个区块。
滤波模块1102,用于对重建的视频帧进行滤波处理获取重建的视频帧中的各个区块在滤波处理后获得的增益。
筛选模块1103,用于根据各个区块的增益分布,从所述各个区块中确定出对所述编码数据进行解码时需要进行滤波处理的区块;
发送模块1104,用于发送所述视频帧的编码数据,所述编码数据中包含需要进行滤波处理的区块的指示信息。
可选地,筛选模块1103具体用于:根据各个区块的增益分布,确定出增益阈值;将增益大于增益阈值的区块,确定为对编码数据进行解码时需要进行滤波处理的区块。
可选地,筛选模块1103具体用于:基于增益为正的区块的增益,获得增益统计特征值;根据增益统计特征值,确定增益阈值。
可选地,筛选模块1103还用于:在将增益大于增益阈值的区块,确定为对编码数据进行解码时需要进行滤波处理的区块之前,基于率失真优化算法,确定当重建的视频帧滤波后获得的增益达到第一总增益阈值时,需要在解码时对重建的视频帧进行滤波处理,其中,第一总增益阈值为增益大于增益阈值的区块的增益之和。
可选地,筛选模块1103具体用于:
根据各个区块的增益分布,确定总增益为增益为正的区块的增益之和;
基于总增益保留比例与总增益的乘积,获得第二总增益阈值;
按区块的增益从大到小的顺序,对区块的增益进行累加处理,当累加值大于或等于第二总增益阈值时,将参与累加处理的至少两个增益中的最小增益,确定为增益阈值。
可选地,筛选模块1103还用于:根据增益为正的区块的数量和视频帧中的区块总数之间的比值,确定总增益保留比例;或者,根据增益为正的区块的增益统计特征值,确定总增益保留比例。
可选地,筛选模块1103还用于:在对区块的增益进行累加处理之前,基于率失真优化算法,确定当重建的视频帧滤波后获得的增益达到第二总增益阈值时,需要在解码时对重建的视频帧进行滤波处理。
可选地,筛选模块1103还用于:在根据各个区块的增益分布,从各个区块中确定出对编码数据进行解码时需要进行滤波处理的区块之前,基于率失真优化算法,确定当重建的视频帧滤波后获得的增益达到总增益时,需要在解码时对重建的视频帧进行滤波处理,其中,总增益为增益为正的区块的增益之和。
本申请实施例提的视频编码装置与上述视频编码方法采用了相同的发明构思,能够取得相同的有益效果,在此不再赘述。
如图12所示,基于与上述视频解码方法相同的发明构思,本申请实施例还提供了一种视频解码装置120,包括获取模块1201、视频解码模块1202和视频滤波模块1203。
获取模块1201,用于获取视频帧的编码数据,视频帧包括至少两个区块,编码数据中包含需要进行滤波处理的区块的指示信息,指示信息是根据至少两个区块在滤波处理后获得的增益的增益分布确定的。
视频解码模块1202,用于从编码数据进行解码中获得重建的视频帧。
视频滤波模块1203,用于基于指示信息,对重建的视频帧中需要进行滤波处理的区块进行滤波处理。
可选地,指示信息中指示的需要进行滤波处理的区块为增益大于增益阈值的区块,增益阈值是根据至少两个区块在滤波处理后获得的增益的增益分布确定的。
可选地,增益阈值是通过如下方式确定的:
基于至少两个区块中增益为正的区块的增益,获得增益统计特征值;
根据增益统计特征值,确定增益阈值。
可选地,编码数据中还包括用于指示视频帧是否需要进行滤波处理的帧级开关信息,帧级开关信息是通过如下方式确定:基于率失真优化算法,确定当重建的视频帧滤波后获得的增益达到第一总增益阈值时,是否需要在解码时对重建的视频帧进行滤波处理,其中,第一总增益阈值为视频帧中增益大于增益阈值的区块的增益之和。
相应地,视频滤波模块1203还用于:在基于指示信息,对重建的视频帧中需要进行滤波处理的区块进行滤波处理之前,确定从编码数据中获取的帧级开关信息表示需要对视频帧进行滤波处理。
可选地,增益阈值是通过如下方式确定的:
根据各个区块的增益分布,确定总增益为增益为正的区块的增益之和;
基于总增益保留比例与总增益的乘积,获得第二总增益阈值;
按区块的增益从大到小的顺序,对区块的增益进行累加处理,当累加值大于或等于第二总增益阈值时,将参与累加处理的至少两个增益中的最小增益,确定为增益阈值。
可选地,总增益保留比例是根据增益为正的区块的数量和视频帧中的区块总数之间的比值确定的;或者,总增益保留比例是根据增益为正的区块的增益统计特征值确定的。
可选地,编码数据中还包括用于指示视频帧是否需要进行滤波处理的帧级开关信息,帧级开关信息是通过如下方式确定:基于率失真优化算法,确定当重建的视频帧滤波后获得的增益达到第二总增益阈值时,是否需要在解码时对重建的视频帧进行滤波处理。
相应地,视频滤波模块1203还用于:在基于指示信息,对重建的视频帧中需要进行滤波处理的区块进行滤波处理之前,确定从编码数据中获取的帧级开关信息表示需要对视频帧进行滤波处理。
可选地,编码数据中还包括用于指示视频帧是否需要进行滤波处理的帧级开关信息,帧级开关信息是通过如下方式确定:基于率失真优化算法,确定当重建的视频帧滤波后获得的增益达到总增益时,是否需要在解码时对重建的视频帧进行滤波处理,其中,总增益为增益为正的区块的增益之和。
相应地,视频滤波模块1203还用于:在基于指示信息,对重建的视频帧中需要进行滤波处理的区块进行滤波处理之前,确定从编码数据中获取的帧级开关信息表示需要对视频帧进行滤波处理。
本申请实施例提的视频解码装置与上述视频解码方法采用了相同的发明构思,能够取得相同的有益效果,在此不再赘述。
基于与上述视频编码以及视频解码方法相同的发明构思,本申请实施例还提供了一种电子设备,该电子设备具体可以为图4所示的终端设备或服务器等。如图13所示,该电子设备130可以包括处理器1301和存储器1302。
处理器1301可以是通用处理器,例如中央处理器(CPU)、数字信号处理器(DigitalSignal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件,可以实现或者执行本申请实施例中公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者任何常规的处理器等。结合本申请实施例所公开的方法的步骤可以直接体现为硬件处理器执行完成,或者用处理器中的硬件及软件模块组合执行完成。
存储器1302作为一种非易失性计算机可读存储介质,可用于存储非易失性软件程序、非易失性计算机可执行程序以及模块。存储器可以包括至少一种类型的存储介质,例如可以包括闪存、硬盘、多媒体卡、卡型存储器、随机访问存储器(Random Access Memory,RAM)、静态随机访问存储器(Static Random Access Memory,SRAM)、可编程只读存储器(Programmable Read Only Memory,PROM)、只读存储器(Read Only Memory,ROM)、带电可擦除可编程只读存储器(Electrically Erasable Programmable Read-Only Memory,EEPROM)、磁性存储器、磁盘、光盘等等。存储器是能够用于携带或存储具有指令或数据结构形式的期望的程序代码并能够由计算机存取的任何其他介质,但不限于此。本申请实施例中的存储器1302还可以是电路或者其它任意能够实现存储功能的装置,用于存储程序指令和/或数据。
本申请实施例提供了一种计算机可读存储介质,用于储存为上述电子设备所用的计算机程序指令,其包含用于执行上述视频编码方法或视频解码方法的程序。
上述计算机存储介质可以是计算机能够存取的任何可用介质或数据存储设备,包括但不限于磁性存储器(例如软盘、硬盘、磁带、磁光盘(MO)等)、光学存储器(例如CD、DVD、BD、HVD等)、以及半导体存储器(例如ROM、EPROM、EEPROM、非易失性存储器(NAND FLASH)、固态硬盘(SSD))等。
以上,以上实施例仅用以对本申请的技术方案进行了详细介绍,但以上实施例的说明只是用于帮助理解本申请实施例的方法,不应理解为对本申请实施例的限制。本技术领域的技术人员可轻易想到的变化或替换,都应涵盖在本申请实施例的保护范围之内。

Claims (10)

1.一种视频编码方法,其特征在于,包括:
从视频帧的编码数据中获得重建的视频帧,所述视频帧包括至少两个区块;
对重建的视频帧进行滤波处理,获取重建的视频帧中的各个区块在滤波处理后获得的增益;
根据各个区块的增益分布,从所述各个区块中确定出对所述编码数据进行解码时需要进行滤波处理的区块;
发送所述视频帧的编码数据,所述编码数据中包含需要进行滤波处理的区块的指示信息;
其中,所述根据各个区块的增益分布,从所述各个区块中确定出对所述编码数据进行解码时需要进行滤波处理的区块,包括:
根据各个区块的增益分布,确定出增益阈值;
将增益大于所述增益阈值的区块,确定为对所述编码数据进行解码时需要进行滤波处理的区块;
其中,所述根据各个区块的增益分布,确定出增益阈值,包括:
基于增益为正的区块的增益,获得增益统计特征值;根据所述增益统计特征值,确定增益阈值;或者,
根据各个区块的增益分布,确定总增益为正的区块的增益之和;基于总增益保留比例与总增益的乘积,获得第二总增益阈值;按区块的增益从大到小的顺序,对区块的增益进行累加处理,当累加值大于或等于所述第二总增益阈值时,将参与累加处理的至少两个增益中的最小增益,确定为增益阈值。
2.根据权利要求1所述的方法,其特征在于,所述将增益大于所述增益阈值的区块,确定为对所述编码数据进行解码时需要进行滤波处理的区块之前,所述方法还包括:
基于率失真优化算法,确定当所述重建的视频帧滤波后获得的增益达到第一总增益阈值时,需要在解码时对所述重建的视频帧进行滤波处理,其中,所述第一总增益阈值为增益大于所述增益阈值的区块的增益之和。
3.根据权利要求1所述的方法,其特征在于,所述方法还包括:
根据增益为正的区块的数量和所述视频帧中的区块总数之间的比值,确定所述总增益保留比例;或者,
根据增益为正的区块的增益统计特征值,确定所述总增益保留比例。
4.根据权利要求3所述的方法,其特征在于,所述对区块的增益进行累加处理之前,所述方法还包括:
基于率失真优化算法,确定当所述重建的视频帧滤波后获得的增益达到第二总增益阈值时,需要在解码时对所述重建的视频帧进行滤波处理。
5.根据权利要求1至4任一项所述的方法,其特征在于,所述根据各个区块的增益分布,从所述各个区块中确定出对所述编码数据进行解码时需要进行滤波处理的区块之前,所述方法还包括:
基于率失真优化算法,确定当所述重建的视频帧滤波后获得的增益达到总增益时,需要在解码时对所述重建的视频帧进行滤波处理,其中,所述总增益为增益为正的区块的增益之和。
6.一种视频解码方法,其特征在于,包括:
获取视频帧的编码数据,所述视频帧包括至少两个区块,所述编码数据中包含需要进行滤波处理的区块的指示信息,所述指示信息是根据所述至少两个区块在滤波处理后获得的增益的增益分布确定的,所述指示信息中指示的需要进行滤波处理的区块为增益大于增益阈值的区块,所述增益阈值是根据所述至少两个区块在滤波处理后获得的增益的增益分布确定的;
从所述编码数据中获得重建的视频帧;
基于所述指示信息,对所述重建的视频帧中需要进行滤波处理的区块进行滤波处理;
其中,所述增益阈值是通过如下方式确定的:
基于所述至少两个区块中增益为正的区块的增益,获得增益统计特征值;根据所述增益统计特征值,确定增益阈值;或者,
根据各个区块的增益分布,确定总增益为正的区块的增益之和;基于总增益保留比例与总增益的乘积,获得第二总增益阈值;按区块的增益从大到小的顺序,对区块的增益进行累加处理,当累加值大于或等于所述第二总增益阈值时,将参与累加处理的至少两个增益中的最小增益,确定为增益阈值。
7.一种视频编码装置,其特征在于,包括:
解码模块,用于从视频帧的编码数据中获得重建的视频帧,所述视频帧包括至少两个区块;
滤波模块,用于对重建的视频帧进行滤波处理,获取重建的视频帧中的各个区块在滤波处理后获得的增益;
筛选模块,用于根据各个区块的增益分布,从所述各个区块中确定出对所述编码数据进行解码时需要进行滤波处理的区块;
发送模块,用于发送所述视频帧的编码数据,所述编码数据中包含需要进行滤波处理的区块的指示信息;
其中,所述根据各个区块的增益分布,从所述各个区块中确定出对所述编码数据进行解码时需要进行滤波处理的区块时,所述筛选模块具体用于:
根据各个区块的增益分布,确定出增益阈值;
将增益大于所述增益阈值的区块,确定为对所述编码数据进行解码时需要进行滤波处理的区块;
其中,所述根据各个区块的增益分布,确定出增益阈值时,所述筛选模块具体用于:
基于增益为正的区块的增益,获得增益统计特征值;根据所述增益统计特征值,确定增益阈值;或者,
根据各个区块的增益分布,确定总增益为正的区块的增益之和;基于总增益保留比例与总增益的乘积,获得第二总增益阈值;按区块的增益从大到小的顺序,对区块的增益进行累加处理,当累加值大于或等于所述第二总增益阈值时,将参与累加处理的至少两个增益中的最小增益,确定为增益阈值。
8.一种视频解码装置,其特征在于,包括:
获取模块,用于获取视频帧的编码数据,所述视频帧包括至少两个区块,所述编码数据中包含需要进行滤波处理的区块的指示信息,所述指示信息是根据所述至少两个区块在滤波处理后获得的增益的增益分布确定的,所述指示信息中指示的需要进行滤波处理的区块为增益大于增益阈值的区块,所述增益阈值是根据所述至少两个区块在滤波处理后获得的增益的增益分布确定的;
视频解码模块,用于从所述编码数据中获得重建的视频帧;
视频滤波模块,用于基于所述指示信息,对所述重建的视频帧中需要进行滤波处理的区块进行滤波处理;
其中,所述增益阈值是通过如下方式确定的:
基于所述至少两个区块中增益为正的区块的增益,获得增益统计特征值;根据所述增益统计特征值,确定增益阈值;或者,
根据各个区块的增益分布,确定总增益为正的区块的增益之和;基于总增益保留比例与总增益的乘积,获得第二总增益阈值;按区块的增益从大到小的顺序,对区块的增益进行累加处理,当累加值大于或等于所述第二总增益阈值时,将参与累加处理的至少两个增益中的最小增益,确定为增益阈值。
9.一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至5任一项所述方法的步骤,或者所述处理器执行所述计算机程序时实现权利要求6所述方法的步骤。
10.一种计算机可读存储介质,其上存储有计算机程序指令,其特征在于,该计算机程序指令被处理器执行时实现权利要求1至5任一项所述方法的步骤,或者该计算机程序指令被处理器执行时实现权利要求6所述方法的步骤。
CN202010449583.1A 2020-05-25 2020-05-25 视频编码、解码方法、装置、电子设备及存储介质 Active CN113727103B (zh)

Priority Applications (4)

Application Number Priority Date Filing Date Title
CN202010449583.1A CN113727103B (zh) 2020-05-25 2020-05-25 视频编码、解码方法、装置、电子设备及存储介质
EP21813453.4A EP4044600A4 (en) 2020-05-25 2021-05-07 VIDEO CODING METHOD AND APPARATUS, VIDEO DECODING METHOD AND APPARATUS, ELECTRONIC DEVICE, AND RECORDING MEDIA
PCT/CN2021/092029 WO2021238606A1 (zh) 2020-05-25 2021-05-07 视频编码、解码方法、装置、电子设备及存储介质
US17/719,027 US12022069B2 (en) 2020-05-25 2022-04-12 Video encoding method and apparatus, video decoding method and apparatus, electronic device, and storage medium

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010449583.1A CN113727103B (zh) 2020-05-25 2020-05-25 视频编码、解码方法、装置、电子设备及存储介质

Publications (2)

Publication Number Publication Date
CN113727103A CN113727103A (zh) 2021-11-30
CN113727103B true CN113727103B (zh) 2022-08-12

Family

ID=78671671

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010449583.1A Active CN113727103B (zh) 2020-05-25 2020-05-25 视频编码、解码方法、装置、电子设备及存储介质

Country Status (4)

Country Link
US (1) US12022069B2 (zh)
EP (1) EP4044600A4 (zh)
CN (1) CN113727103B (zh)
WO (1) WO2021238606A1 (zh)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2008085109A1 (en) * 2007-01-09 2008-07-17 Telefonaktiebolaget Lm Ericsson (Publ) Adaptive filter representation
CN104737540A (zh) * 2012-11-13 2015-06-24 英特尔公司 用于下一代视频的视频编解码器架构
CN108184129A (zh) * 2017-12-11 2018-06-19 北京大学 一种视频编解码方法、装置及用于图像滤波的神经网络
WO2019093919A1 (en) * 2017-11-13 2019-05-16 Huawei Technologies Co., Ltd In-loop filter apparatus and method for video coding
WO2020055288A2 (en) * 2018-09-16 2020-03-19 Huawei Technologies Co., Ltd. Apparatus and method for filtering in video coding with look-up table selected based on bitstream information

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7330509B2 (en) * 2003-09-12 2008-02-12 International Business Machines Corporation Method for video transcoding with adaptive frame rate control
EP2559238B1 (en) * 2010-04-13 2015-06-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Adaptive image filtering method and apparatus
US10638144B2 (en) * 2017-03-15 2020-04-28 Facebook, Inc. Content-based transcoder
WO2019009448A1 (ko) * 2017-07-06 2019-01-10 삼성전자 주식회사 영상을 부호화 또는 복호화하는 방법 및 장치
US10609384B2 (en) * 2017-09-21 2020-03-31 Futurewei Technologies, Inc. Restriction on sub-block size derivation for affine inter prediction
EP3677031B1 (en) * 2017-10-16 2023-10-04 Huawei Technologies Co., Ltd. Spatial varying transforms for video coding
US10469869B1 (en) * 2018-06-01 2019-11-05 Tencent America LLC Method and apparatus for video coding
US11343492B2 (en) * 2019-03-15 2022-05-24 Mux, Inc. Method for generating video- and audience-specific encoding ladders
CN117097893A (zh) * 2018-07-06 2023-11-21 Lg电子株式会社 图像编码/解码设备和图像数据发送设备
US10999606B2 (en) * 2019-01-08 2021-05-04 Intel Corporation Method and system of neural network loop filtering for video coding
US11695960B2 (en) * 2019-06-14 2023-07-04 Qualcomm Incorporated Transform and last significant coefficient position signaling for low-frequency non-separable transform in video coding
US11206428B1 (en) * 2020-07-14 2021-12-21 Tencent America LLC Method and apparatus for frequency-dependent joint component secondary transform

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2008085109A1 (en) * 2007-01-09 2008-07-17 Telefonaktiebolaget Lm Ericsson (Publ) Adaptive filter representation
CN104737540A (zh) * 2012-11-13 2015-06-24 英特尔公司 用于下一代视频的视频编解码器架构
WO2019093919A1 (en) * 2017-11-13 2019-05-16 Huawei Technologies Co., Ltd In-loop filter apparatus and method for video coding
CN108184129A (zh) * 2017-12-11 2018-06-19 北京大学 一种视频编解码方法、装置及用于图像滤波的神经网络
WO2020055288A2 (en) * 2018-09-16 2020-03-19 Huawei Technologies Co., Ltd. Apparatus and method for filtering in video coding with look-up table selected based on bitstream information

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
视频编码标准HEVC中的环路滤波技术分析;唐华敏等;《电视技术》;20141130;全文 *

Also Published As

Publication number Publication date
CN113727103A (zh) 2021-11-30
EP4044600A1 (en) 2022-08-17
WO2021238606A1 (zh) 2021-12-02
US20220239910A1 (en) 2022-07-28
US12022069B2 (en) 2024-06-25
EP4044600A4 (en) 2023-01-11

Similar Documents

Publication Publication Date Title
CN113727106B (zh) 视频编码、解码方法、装置、电子设备及存储介质
JP5301277B2 (ja) マルチメディア符号化のためのモード選択技術
CN107005698B (zh) 支持尽力服务解码的元数据提示
CN112075082A (zh) 用于基于cabac的神经网络实现方式的视频编码与解码的方法及设备
CN114257810B (zh) 上下文模型的选择方法、装置、设备及存储介质
WO2022116836A1 (zh) 视频解码方法、视频编码方法、装置及设备
WO2020258055A1 (zh) 环路滤波的方法与装置
US20240015310A1 (en) Multimedia data processing method, apparatus, device, computer-readable storage medium, and computer program product
WO2020182104A1 (zh) 进行编码和解码的方法、解码装置和编码装置
CN115118976A (zh) 一种图像编码方法、可读介质及其电子设备
CN111416977A (zh) 视频编码器、视频解码器及相应方法
CN113727103B (zh) 视频编码、解码方法、装置、电子设备及存储介质
WO2022022299A1 (zh) 视频编解码中的运动信息列表构建方法、装置及设备
WO2019067907A1 (en) APPARATUS AND METHOD FOR ENCODING IMAGE BLOCK
WO2022178686A1 (zh) 编解码方法、编解码设备、编解码***以及计算机可读存储介质
WO2021263251A1 (en) State transition for dependent quantization in video coding
CN111669579B (zh) 进行编码和解码的方法、编码端、解码端和***
CN112584143A (zh) 一种视频编码方法、装置、***及计算机可读存储介质
US20240064298A1 (en) Loop filtering, video encoding, and video decoding methods and apparatus, storage medium, and electronic device
CN114051140B (zh) 视频编码方法、装置、计算机设备及存储介质
JP7483029B2 (ja) ビデオ復号方法、ビデオ符号化方法、装置、媒体、及び電子機器
US20230082386A1 (en) Video encoding method and apparatus, video decoding method and apparatus, computer-readable medium, and electronic device
US20230104359A1 (en) Video encoding method and apparatus, video decoding method and apparatus, computer-readable medium, and electronic device
WO2023065890A1 (zh) 多媒体数据处理方法、装置、计算机设备、计算机可读存储介质及计算机程序产品
CN113709454A (zh) 视频编码方法、模型训练方法及相关装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant