CN110062226B - 一种视频编码方法、视频解码方法、装置、***及介质 - Google Patents

一种视频编码方法、视频解码方法、装置、***及介质 Download PDF

Info

Publication number
CN110062226B
CN110062226B CN201810050810.6A CN201810050810A CN110062226B CN 110062226 B CN110062226 B CN 110062226B CN 201810050810 A CN201810050810 A CN 201810050810A CN 110062226 B CN110062226 B CN 110062226B
Authority
CN
China
Prior art keywords
image block
distorted
target image
picture
distortion
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201810050810.6A
Other languages
English (en)
Other versions
CN110062226A (zh
Inventor
周璐璐
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hangzhou Hikvision Digital Technology Co Ltd
Original Assignee
Hangzhou Hikvision Digital Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hangzhou Hikvision Digital Technology Co Ltd filed Critical Hangzhou Hikvision Digital Technology Co Ltd
Priority to CN201810050810.6A priority Critical patent/CN110062226B/zh
Priority to PCT/CN2019/072417 priority patent/WO2019141258A1/zh
Publication of CN110062226A publication Critical patent/CN110062226A/zh
Application granted granted Critical
Publication of CN110062226B publication Critical patent/CN110062226B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/117Filters, e.g. for pre-processing or post-processing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/13Adaptive entropy coding, e.g. adaptive variable length coding [AVLC] or context adaptive binary arithmetic coding [CABAC]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/184Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being bits, e.g. of the compressed video stream
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/80Details of filtering operations specially adapted for video compression, e.g. for pixel interpolation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/80Details of filtering operations specially adapted for video compression, e.g. for pixel interpolation
    • H04N19/82Details of filtering operations specially adapted for video compression, e.g. for pixel interpolation involving filtering within a prediction loop
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/85Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

本申请是关于一种视频编码方法、视频解码方法、装置及***,属于视频编解码领域。所述方法包括:获取失真图片,生成失真图片对应的边信息分量,将所述失真图片和所述边信息分量输入卷积神经网络模型进行滤波处理得到所述失真图片包括的失真图像块对应的第一去失真图像块,从所述失真图像块对应的图像块集合中选择一个图像块作为所述失真图像块对应的目标去失真图像块,所述图像块集合包括所述失真图像块对应的第一去失真图像块和/或所述失真图像块;根据该失真图片包括的各失真图像块对应的去失真图像块,编码在当前原始视频图片之后的原始视频图片得到视频比特流。本申请能够提高去失真的性能。

Description

一种视频编码方法、视频解码方法、装置、***及介质
技术领域
本申请涉及视频编解码领域,特别涉及一种视频编码方法、视频解码方法、装置及***。
背景技术
在视频编码***中,在对原始视频图片进行编码时,原始视频图片会被进行多次处理得到重构图片。在视频编码的过程中,该重构图片又可以作为参考图片,被用于对原始视频图片进行编码。
原始视频图片会被进行多次处理后得到的重构图片相对原始视频图片可能已经发生像素偏移,即重构图片存在失真,导致视觉障碍或假象。这些失真影响重构图片的主客观质量,由于重构图片作为视频编码的参考图片,还会影响后续编码的预测准确性,影响最终比特流的大小。
发明内容
为了提高去失真的性能,本申请实施例提供了一种视频编码方法、视频解码方法、装置及***。所述技术方案如下:
第一方面,本申请实施例提供了一种视频编码方法,所述方法包括:
获取失真图片,所述失真图片是对当前原始视频图片进行编码时生成的;
生成失真图片对应的边信息分量,所述边信息分量表示所述失真图片相对所述当前原始视频图片的失真特征;
将所述失真图片和所述边信息分量输入卷积神经网络模型进行滤波处理得到所述失真图片包括的失真图像块对应的第一去失真图像块,所述卷积神经网络模型为基于预设训练集进行训练得到的,所述预设训练集包括原始样本图片,所述原始样本图片对应的多个失真图片,以及每个所述原始样本图片对应的失真图片所对应的边信息分量;
从所述失真图像块对应的图像块集合中选择一个图像块作为所述失真图像块对应的目标去失真图像块,所述图像块集合包括所述失真图像块对应的第一去失真图像块和/或所述失真图像块;
根据所述失真图像块对应的目标去失真图像块,对所述当前原始视频图片之后的原始视频图片进行编码得到视频比特流。
可选的,所述将所述失真图片和所述边信息分量输入卷积神经网络模型进行滤波处理得到所述失真图片包括的失真图像块对应的第一去失真图像块,包括:
对所述失真图片进行划分,得到所述失真图片包括的失真图像块,将所述失真图像块和所述失真图像块对应的边信息分量输入卷积神经网络模型进行滤波处理得到所述失真图像块对应的第一去失真图像块;或者,
将所述失真图片和所述边信息分量输入卷积神经网络模型进行滤波处理得到去失真图图片,对所述去失真图片进行划分得到所述失真图片包括的失真图像块对应的第一去失真图像块。
可选的,所述获取失真图片之后,还包括:
将所述失真图片输入至少一个滤波器进行滤波处理,得到每个滤波器输出的所述失真图片包括的失真图像块对应的第二去失真图像块,所述失真图像块对应的图像块集合还包括所述每个滤波器输出的所述失真图像块对应的第二去失真图像块。
可选的,所述从图像块集合中选择一个图像块,包括:
根据所述失真图像块在所述当前原始视频图片中对应的原始图像块,从图像块集合中选择一个图像块;或者,
根据所述失真图像块包括的各编码单元的编码信息,从图像块集合中选择一个图像块。
可选的,所述根据所述失真图像块在所述当前原始视频图片中对应的原始图像块,从图像块集合中选择一个图像块,包括:
分别计算所述图像块集合中的每个图像块与所述失真图像块对应的原始图像块之间的差异值;
从所述图像块集合中选择与所述失真图像块对应的原始图像块之间的差异值最小的图像块。
可选的,所述视频比特流还包括所述失真图片对应的滤波标志图,所述方法还包括:
在根据所述失真图像块对应的原始图像块,从图像块集合中选择一个图像块时,根据所述失真图像块在所述失真图片的位置,在所述滤波标志图中填写用于标识所述目标去失真图像块的数据类型的标志信息。
第二方面,本申请实施例提供了一种视频解码方法,所述方法包括:
对接收的视频比特流进行熵解码,得到当前熵解码数据;
获取失真图片包括的各失真图像块,所述失真图片为对所述当前熵解码数据进行解码时生成的;
根据所述当前熵解码数据确定目标图像块对应的数据类型,所述目标图像块为所述失真图片中的一个失真图像块;
在所述数据类型用于表示卷积神经网络模型滤波的数据时,生成目标图像块对应的边信息分量,所述边信息分量表示所述目标图像块相对其在原始视频图片中对应的原始图像块的失真特征,所述原始视频图片是所述当前熵解码数据对应的视频图片;
将所述目标图像块以及所述边信息分量输入卷积神经网络模型进行卷积滤波处理,得到所述目标图像块对应的去失真图像块,所述卷积神经网络模型为基于预设训练集进行训练得到的,所述预设训练集包括原始样本图片,所述原始样本图片对应的多个失真图片,以及每个所述原始样本图片对应的失真图片所对应的边信息分量;
根据所述失真图片包括的各失真图像块对应的去失真图像块,对后续接收的视频比特流进行解码。
可选的,所述方法还包括:
在所述数据类型用于表示一滤波器滤波的数据时,将所述目标图像块输入所述滤波器进行滤波处理,得到所述目标图像块对应的去失真图像块;或者,
在所述数据类型用于表示所述目标图像块时,将所述目标图像块确定为所述目标图像块对应的去失真图像块。
可选的,所述当前熵解码数据包括滤波标志图,所述滤波标志图包括所述失真图片中的各失真图像块对应的标志信息,失真图像块对应的标志信息用于标识所述失真图像块对应的数据类型;
所述根据所述当前熵解码数据确定目标图像块对应的数据类型,包括:
根据目标图像块在所述失真图片中的位置,从所述滤波标志图中读取所述目标图像块对应的标志信息;
根据所述标志信息确定所述目标图像块对应的数据类型。
可选的,所述当前熵解码数据包括所述原始视频图片中的各编码单元的位置和编码信息;
所述根据所述当前熵解码数据确定目标图像块对应的数据类型,包括:
根据所述目标图像块在所述失真图片中的位置和所述原始视频图片中的各编码单元的位置,确定所述目标图像块包括的各编码单元;
根据所述目标图像块包括的各编码单元的编码信息,确定所述目标图像块对应的数据类型。
第三方面,本申请实施例提供了一种视频编码装置,所述装置包括:
获取模块,用于获取失真图片,所述失真图片是对当前原始视频图片进行编码时生成的;
生成模块,用于生成失真图片对应的边信息分量,所述边信息分量表示所述失真图片相对所述当前原始视频图片的失真特征;
滤波模块,用于将所述失真图片和所述边信息分量输入卷积神经网络模型进行滤波处理得到所述失真图片包括的失真图像块对应的第一去失真图像块,所述卷积神经网络模型为基于预设训练集进行训练得到的,所述预设训练集包括原始样本图片,所述原始样本图片对应的多个失真图片,以及每个所述原始样本图片对应的失真图片所对应的边信息分量;
选择模块,用于从所述失真图像块对应的图像块集合中选择一个图像块作为所述失真图像块对应的目标去失真图像块,所述图像块集合包括所述失真图像块对应的第一去失真图像块和/或所述失真图像块;
编码模块,用于根据所述失真图像块对应的目标去失真图像块,对所述当前原始视频图片之后的原始视频图片进行编码得到视频比特流。
可选的,所述滤波模块包括:
第一滤波单元,用于对所述失真图片进行划分,得到所述失真图片包括的失真图像块,将所述失真图像块和所述失真图像块对应的边信息分量输入卷积神经网络模型进行滤波处理得到所述失真图像块对应的第一去失真图像块;或者,
第二滤波单元,用于将所述失真图片和所述边信息分量输入卷积神经网络模型进行滤波处理得到去失真图图片,对所述去失真图片进行划分得到所述失真图片包括的失真图像块对应的第一去失真图像块。
可选的,所述滤波模块,还用于:
将所述失真图片输入至少一个滤波器进行滤波处理,得到每个滤波器输出的所述失真图片包括的失真图像块对应的第二去失真图像块,所述失真图像块对应的图像块集合还包括所述每个滤波器输出的所述失真图像块对应的第二去失真图像块。
可选的,所述选择模块包括:
第一选择单元,用于根据所述失真图像块在所述当前原始视频图片中对应的原始图像块,从图像块集合中选择一个图像块;或者,
第二选择单元,用于根据所述失真图像块包括的各编码单元的编码信息,从图像块集合中选择一个图像块。
可选的,所述第一选择单元,用于:
分别计算所述图像块集合中的每个图像块与所述失真图像块对应的原始图像块之间的差异值;
从所述图像块集合中选择与所述失真图像块对应的原始图像块之间的差异值最小的图像块。
可选的,所述视频比特流还包括所述失真图片对应的滤波标志图,所述装置还包括:
填写模块,用于在根据所述失真图像块对应的原始图像块,从图像块集合中选择一个图像块时,根据所述失真图像块在所述失真图片的位置,在所述滤波标志图中填写用于标识所述目标去失真图像块的数据类型的标志信息。
第四方面,本申请实施例提供了一种视频解码装置,所述装置包括:
解码模块,用于对接收的视频比特流进行熵解码,得到当前熵解码数据;
获取模块,用于获取失真图片包括的各失真图像块,所述失真图片为对所述当前熵解码数据进行解码时生成的;
确定模块,用于根据所述当前熵解码数据确定目标图像块对应的数据类型,所述目标图像块为所述失真图片中的一个失真图像块;
生成模块,用于在所述数据类型用于表示卷积神经网络模型滤波的数据时,生成目标图像块对应的边信息分量,所述边信息分量表示所述目标图像块相对其在原始视频图片中对应的原始图像块的失真特征,所述原始视频图片是所述当前熵解码数据对应的视频图片;
滤波模块,用于将所述目标图像块以及所述边信息分量输入卷积神经网络模型进行卷积滤波处理,得到所述目标图像块对应的去失真图像块,所述卷积神经网络模型为基于预设训练集进行训练得到的,所述预设训练集包括原始样本图片,所述原始样本图片对应的多个失真图片,以及每个所述原始样本图片失真图片所对应的边信息分量;
所述解码模块,还用于根据所述失真图片包括的各失真图像块对应的去失真图像块,对后续接收的视频比特流进行解码。
可选的,所述滤波模块,还用于:
在所述数据类型用于表示一滤波器滤波的数据时,将所述目标图像块输入所述滤波器进行滤波处理,得到所述目标图像块对应的去失真图像块;或者,
在所述数据类型用于表示所述目标图像块时,将所述目标图像块确定为所述目标图像块对应的去失真图像块。
可选的,所述当前熵解码数据包括滤波标志图,所述滤波标志图包括所述失真图片中的各失真图像块对应的标志信息,失真图像块对应的标志信息用于标识所述失真图像块对应的数据类型;
所述确定模块,包括:
读取单元,用于根据目标图像块在所述失真图片中的位置,从所述滤波标志图中读取所述目标图像块对应的标志信息;
第一确定单元,用于根据所述标志信息确定所述目标图像块对应的数据类型。
可选的,所述当前熵解码数据包括所述原始视频图片中的各编码单元的位置和编码信息;
所述确定模块包括:
第二确定单元,用于根据所述目标图像块在所述失真图片中的位置和所述原始视频图片中的各编码单元的位置,确定所述目标图像块包括的各编码单元;
第三确定单元,用于根据所述目标图像块包括的各编码单元的编码信息,确定所述目标图像块对应的数据类型。
第五方面,本申请实施例提供了一种视频编码方法,所述方法包括:
获取失真图片包括的失真图像块,所述失真图片是对原始视频图片进行编码时生成的;
根据目标图像块包括的编码单元的编码信息,确定所述目标图像块对应的数据类型,所述目标图像块为所述失真图片中的任一失真图像块;
在所述数据类型用于表示卷积神经网络模型滤波的数据时,生成所述目标图像块对应的边信息分量,所述边信息分量表示所述目标图像块相对其在所述原始视频图片中对应的原始图像块的失真特征;
将所述目标图像块以及所述边信息分量输入卷积神经网络模型进行卷积滤波处理,得到所述目标图像块对应的去失真图像块,所述卷积神经网络模型为基于预设训练集进行训练得到的,所述预设训练集包括原始样本图片,所述原始样本图片对应的多个失真图片,以及每个所述原始样本图片对应的失真图片所对应的边信息分量;
根据所述失真图片中的失真图像块对应的去失真图像块,对所述当前原始视频图片之后的原始视频图片进行编码得到视频比特流。
可选的,所述方法还包括:
在所述数据类型用于表示一滤波器滤波的数据时,将所述目标图像块输入所述滤波器进行滤波处理,得到所述目标图像块对应的去失真图像块;或者,
在所述数据类型用于表示所述目标图像块时,将所述目标图像块确定为所述目标图像块对应的去失真图像块。
第六方面,本申请实施例提供了一种视频编码装置,所述装置包括:
获取模块,用于获取失真图片包括的失真图像块,所述失真图片是对原始视频图片进行编码时生成的;
确定模块,用于根据目标图像块包括的编码单元的编码信息,确定所述目标图像块对应的数据类型,所述目标图像块为所述失真图片中的任一失真图像块;
生成模块,用于在所述数据类型用于表示卷积神经网络模型滤波的数据时,生成所述目标图像块对应的边信息分量,所述边信息分量表示所述目标图像块相对其在所述原始视频图片中对应的原始图像块的失真特征;
滤波模块,用于将所述目标图像块以及所述边信息分量输入卷积神经网络模型进行卷积滤波处理,得到所述目标图像块对应的去失真图像块,所述卷积神经网络模型为基于预设训练集进行训练得到的,所述预设训练集包括原始样本图片,所述原始样本图片对应的多个失真图片,以及每个所述原始样本图片对应的失真图片所对应的边信息分量;
编码模块,用于根据所述失真图片中的失真图像块对应的去失真图像块,对所述当前原始视频图片之后的原始视频图片进行编码得到视频比特流。
可选的,所述滤波模块,还用于:
在所述数据类型用于表示一滤波器滤波的数据时,将所述目标图像块输入所述滤波器进行滤波处理,得到所述目标图像块对应的去失真图像块;或者,
在所述数据类型用于表示所述目标图像块时,将所述目标图像块确定为所述目标图像块对应的去失真图像块。
第七方面,本申请实施例提供了一种计算机可读存储介质,所述计算机可读存储介质内存储有计算机程序,所述计算机程序被处理器执行时实现所述第一方面或第一方面任可选的方式提供的方法步骤或实现所述第五方面或第五方面任可选的方式提供的方法步骤。
第八方面,本申请实施例提供了一种计算机可读存储介质,所述计算机可读存储介质内存储有计算机程序,所述计算机程序被处理器执行时实现所述第二方面或第二方面任可选的方式提供的方法步骤。
第九方面,本申请实施例提供了一种编解码***,所述***包括所述第一方面提供的视频编码装置和如所述第二方面提供的视频解码装置;或者,
所述***包括所述第六方面提供的视频编码装置和如所述第二方面提供的视频解码装置。
本申请实施例提供的技术方案可以包括以下有益效果:
通过对失真图片进行滤波后得到失真图片的失真图像块对应的第一去失真图像块,然后从失真图像块和该失真图像块对应的第一去失真图像块中选择图像块作为最终滤波得到的图像块,这样不仅提高了滤波性能,还提高了在视频编码过程中去失真性能。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本申请。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本申请的实施例,并与说明书一起用于解释本申请的原理。
图1是本申请实施例提供的一种视频编码方法流程图;
图2-1是本申请实施例提供的另一种视频编码方法流程图;
图2-2是本申请实施例提供的一种视频编码***的结构框图;
图2-3是本申请实施例提供的另一种视频编码***的结构框图;
图2-4是本申请实施例提供的边信息分量的示意图之一;
图2-5是本申请实施例提供的边信息分量的示意图之二;
图2-6是本申请实施例提供的技术方案的***架构图;
图2-7是本申请实施例提供的技术方案的数据流示意图;
图2-8是本申请实施例获得失真图像的失真图像颜色分量的示意图;
图2-9是本申请实施例提供的失真图像的去失真方法的流程图;
图2-10是本申请实施例提供的卷积神经网络模型训练方法的流程图;
图3是本申请实施例提供的一种视频解码方法流程图;
图4-1是本申请实施例提供的另一种视频解码方法流程图;
图4-2是本申请实施例提供的一种视频解码***的结构框图;
图4-3是本申请实施例提供的另一种视频解码***的结构框图;
图5是本申请实施例提供的一种视频编码装置结构示意图;
图6是本申请实施例提供的一种视频解码装置结构示意图;
图7是本申请实施例提供的另一种视频编码方法流程图;
图8是本申请实施例提供的另一种视频编码方法流程图;
图9是本申请实施例提供的另一种视频编码装置结构图;
图10是本申请实施例提供的一种视频编解码***结构示意图;
图11是本申请实施例提供的一种装置结构示意图。
通过上述附图,已示出本申请明确的实施例,后文中将有更详细的描述。这些附图和文字描述并不是为了通过任何方式限制本申请构思的范围,而是通过参考特定实施例为本领域技术人员说明本申请的概念。
具体实施方式
这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本申请相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本申请的一些方面相一致的装置和方法的例子。
参见图1,本申请实施例提供了一种视频编码方法,所述方法包括:
步骤101:获取失真图片,失真图片是对当前原始视频图片进行编码时生成的。
此处的编码包括对当前原始视频图片进行预测、变换和量化等处理得到预测数据和残差信息,根据该预测数据和残差信息等进行熵编码得到视频比特流以及根据该预测数据和残差信息进行重建处理得到重构图片。失真图片为该重构图片或对该重构图片进行滤波后的图片。
步骤102:生成该失真图片对应的边信息分量,该边信息分量表示失真图片相原始视频图片的失真特征。
步骤103:将失真图片和该边信息分量输入卷积神经网络模型进行滤波处理得到失真图片包括的失真图像块对应的第一去失真图像块。
其中,卷积神经网络模型为基于预设训练集进行训练得到的,预设训练集包括原始样本图片,原始样本图片对应的多个失真图片,以及每个失真图片对应的边信息分量。
步骤104:从失真图像块对应的图像块集合中选择一个图像块作为该失真图像块对应的目标去失真图像块,该图像块集合包括该失真图像块对应的第一去失真图像块和/或该失真图像块。
在选择时可以以失真图像块对应的原始图像块为参考,从图像块集合中选择与原始图像块差异最小的图像块作为目标去失真图像块。或者,
也可以根据失真图像块包括的各编码单元的编码信息,从失真图像块集合中选择一个图像块作为目标去失真图像块。其中,编码单元的编码信息可以反映在原始视频图片中该编码单元对应的原始图像信息,所以根据编码信息也可以选择与原始图像块差异小的图像块作为目标去失真图像块。
步骤105:根据该失真图像块对应的目标去失真图像块,对当前原始视频图片之后的原始视频图片进行编码得到视频比特流。
本步骤在实际实现时,可以将该失真图像块对应的目标去失真图像块组成一帧参考图片,当该参考图片被选中用于对当前原始视频图片之后待编码的原始视频图片进行编码时,可以根据该参考图片对待编码的原始视频图片进行编码得到视频比特流。
在本申请实施例中,对失真图片进行滤波后得到失真图片的失真图像块对应的第一去失真图像块,然后从失真图像块和该失真图像块对应的第一去失真图像块中选择与原始图片差异小的图像块作为最终滤波得到的图像块,这样不仅提高了滤波性能,提高了在视频编码过程中去失真性能。
对于图1所示的视频编码方法,参见图2-1,该方法的详细实现过程,可以包括:
步骤201:获取视频编码过程中生成的失真图片。
在视频编码过程中会生成重构图片,失真图片可以为该重构图片,或者可以为对该重构图片进行滤波后得到的图片。
参见图2-2所示的视频编码***的结构示意图,视频编码***包括预测模块、加法器、变换单元、量化单元、熵编码器、反量化单元、反变换单元、重建单元、CNN(卷积神经网络模型)和缓存器等部分组成。
该视频编码***编码的过程为:将当前原始视频图片输入到预测模块和加法器中,预测模块根据缓存器中的参考图片对输入的当前原始视频图片进行预测得到预测数据,并将该预测数据输入到加法器、熵编码器和重建单元。其中,预测模块包括帧内预测单元、运动估计与运动补偿单元和开关。帧内预测单元可以对当前原始视频图片进行帧内预测得到帧内预测数据,运动估计与运动补偿单元根据缓存器中缓存的参考图片对当前原始视频图片进行帧间预测得到帧间预测数据,开关选择将帧内预测数据或将帧间预测数据输出给加法器和重建单元。
加法器根据该预测数据和当前原始视频图片产生预测误差信息,变换单元对该预测误差信息进行变换,将变换的该预测误差信息输出给量化单元;量化单元根据量化参数对变换的该预测误差信息进行量化得到残差信息,将该残差信息输出给熵编码器和反量化单元;熵编码器根对该残差信息和预设数据等信息进行编码形成视频比特流,该视频比较流中可以包括原始视频图片中的每个编码单元的编码信息。
同时,反量化单元和反变换单元分别对该残差信息进行反量化和反变换处理,得到预测误差信息,将该预测误差信息输入到重建单元中;重建单元根据该预测误差信息和预测数据生成重构图片。相应的,在本步骤中,可以获取重建单元生成的重构图片,并将该重构图片作为失真图片。
可选的,参见图2-3,在卷积神经网络模型和重建单元之间还可以串联滤波器,该滤波器还可以对重建单元生成的重构图片进行滤波,输出滤波的重构图片。相应的,在本步骤中,可以获取滤波的重构图片,并将滤波的该重构图片作为失真图片。
步骤202:对失真图片进行划分,得到失真图片包括的多个失真图像块。
在本申请实施例中,将失真图片划分成多个失真图像块,然后分别对每个图像块进行滤波,相比目前对整帧失真图片进行滤波,可以减小滤波图片所需要的资源,从而使设备能够满足滤波图片所需要的资源。
在本申请实施例中,设有预先训练的卷积神经网络模型和至少一个滤波器,卷积神经网络模型用于对失真图像块进行滤波,该至少一个滤波器中的每个滤波器也用于对失真图像块进行滤波。该至少一个滤波器可以为卷积神经网络滤波器、自适应环路滤波技术(Adaptive Loop Filiter,ALF)等。
其中,步骤202为可选的步骤,即可以不执行步骤202,在滤波时也可以直接对整帧失真图片进行滤波。
步骤203:生成目标图像块对应的边信息分量,该边信息分量表示目标图像块相对其在原始视频图片中对应的原始图像块的失真特征,目标图像块是失真图片中的一失真图像块。
其中,在使用卷积神经网络模型对目标图像块滤波时,需要使用到目标图像块对应的边信息分量。
目标图像块对应的边信息分量可以根据量化参数或目标图像块中包括的各编码单元的编码信息获取得到的。
其中,如果对整帧失真图片进行滤波,则在本步骤中生成失真图片对应的边信息分量,该边信息分量表示失真图片相对原始视频图片的失真特征。
生成失真图片对应的边信息分量的过程与生成目标图像块对应的边信息分量相同,接下来仅对生成目标图像块对应的边信息分量进行说明,对于失真图片的边信息分量,仅需要将如下内容的目标图像块替换为失真图片即可。
对于边信息分量,其表示目标图像块相对原始图片中对应的原始图块的失真特征,是一种由图像处理过程确定的失真特征的表达。
在实际应用中,上述失真特征可以至少包括如下失真特征之一:
失真程度、失真位置,失真类型:
首先,边信息分量可以表示失真的目标图像块相对原始图片的失真程度。
其次,边信息分量也可以表示失真的目标图像块相对原始图片的失真位置,例如在主流的视频编解码应用中,图像通常被划分为多个不重叠且不固定大小的编码单元,编码单元分别进行预测编码及不同程度的量化处理,编码单元之间的失真通常不具有一致性,在编码单元的边界处通常会产生像素突变,因此,编码单元的边界坐标可以作为一种先验的表征失真位置的边信息。
再次,边信息分量也可以表示失真的目标图像块相对原始图片的失真类型,例如在视频编解码应用中,图像中不同编码单元可能采用不同预测模式,不同预测模式会影响残差数据的分布,从而影响失真的目标图像块的特征,因此,编码单元的预测模式可以作为一种表征失真类型的边信息。
可选的,边信息分量可以为上述一种或多种的组合,也可以为上述一种的多个边信息分量,例如,经过图像处理后,可能通过一种物理含义的参量表示失真的目标图像块的失真程度,也可能通过不同物理含义的两种参量表示失真的目标图像块的失真程度,相应的,即可以根据实际需要,将一种或多种均表示失真程度的边信息分量作为输入数据。
如图2-4所示,边信息分量的矩阵结构与失真的目标图像块颜色分量的矩阵结构相同,其中,坐标[0,0]、[0,1]表示失真位置,矩阵的元素值1表示失真程度,即边信息分量同时能表示失真程度与失真位置。
又如图2-5所示,坐标[0,0]、[0,1]、[2,0]、[2,4]表示失真位置,矩阵的元素值1、2表示失真类型,即边信息分量同时能表示失真类型与失真位置。
并且,本申请实施例提供的上述解决方案中,可以同时包括图2-4和图2-5分别所示意的两个边信息分量。
进一步的,根据方案的实际应用情况和需要,当失真图像颜色分量包括多种时,边信息分量可以包括分别与每种失真图像颜色分量对应的边信息分量。
本申请实施例提供的上述解决方案,可以应用于目前已知的各种实际应用场景中,例如,可应用于对图像进行超分辨率处理的应用场景中,本发明在此不做限定。
本步骤可以通过如下两个步骤来实现,分别为
步骤2031、针对待处理的目标图像块,确定目标图像块中的每个像素点的失真程度值。
在实际应用中,对原始图像进行不同方式的图像处理之后,表示失真程度的物理参量也可能不同,因此,本步骤中,可以基于不同的图像处理方式,确定出对应的能够准确表示像素点失真程度的失真程度值,具体可以如下:
第一种方式:针对通过编解码得到的目标图像块,目标图像块中的每个编码单元的量化参数都是已知的,即可以获取目标图像块中的每个编码单元的量化参数,将目标图像块的每个像素点所在编码单元的量化参数,确定为目标图像块的每个像素点的失真程度值;
第二种方式:针对通过编解码得到的目标图像块,目标图像块中的每个编码单元的编码信息都是已知的,即可以获取目标图像块中的每个编码单元的编码信息,根据目标图像块中的每个编码单元的编码信息计算出每个编码单元的量化参数,将目标图像块的每个像素点所在编码单元的量化参数,确定为目标图像块的每个像素点的失真程度值。
步骤2032、基于目标图像块中的各像素点的位置,使用获取的各像素点的失真程度值,生成目标图像块对应的边信息分量,其中,边信息分量包括的每个分量值与目标图像块上相同位置的像素点相对应。
由于边信息分量包括的每个分量值与目标图像块上相同位置的像素点相对应,则边信息分量与目标图像块的失真图像颜色分量的结构相同,即表示边信息分量的矩阵与表示目标图像块颜色分量的矩阵是同型的。
本步骤中,可以基于目标图像块中的各像素点的位置,将获取的每个像素点的失真程度值,确定为目标图像块对应的边信息分量中该像素点相同位置的分量值,即直接将每个像素点的失真程度值,确定为该像素点对应的分量值。
当目标图像块的像素值范围与像素点的失真程度值的取值范围不同时,也可以基于目标图像块的像素值范围,对获取的各像素点的失真程度值进行标准化处理,得到处理后失真程度值,处理后失真程度值的取值范围与像素值范围相同;
然后基于目标图像块中的各像素点的位置,将每个像素点的处理后失真程度值,确定为目标图像块对应的边信息分量中该像素点相同位置的分量值。
本步骤中,可以采用如下公式对像素点的失真程度值进行标准化处理:
Figure BDA0001552308560000151
其中,norm(x)为标准化处理后得到的处理后失真程度值,x为像素点的失真程度值,目标图像块的像素值范围为[PIEXLMIN,PIXELMAX],像素点的失真程度值的取值范围为[QPMIN,QPMAX]。
通过上述两个步骤,即生成了目标图像块的边信息分量,生成边信息分量的过程,也可以理解为生成了目标图像块对应的边信息引导图,该边信息引导图通过其边信息分量表示目标图像块的失真程度,且该边信息引导图与目标图像块是等高等宽的。
步骤204:将目标图像块和该边信息分量输入卷积神经网络模型进行滤波处理得到第一去失真图像块。
可选的,参见图2-6,卷积神经网络模型,包括:边信息分量生成模块11,卷积神经网络12,网络训练模块13;
其中,卷积神经网络12可以包括如下三层结构:
输入层处理单元121,用于接收卷积神经网络的输入,本方案中包括目标图像块的失真图像颜色分量,以及目标图像块的边信息分量;并对输入的数据进行第一层的卷积滤波处理;
隐含层处理单元122,对输入层处理单元121的输出数据,进行至少一层的卷积滤波处理;
输出层处理单元123,对隐含层处理单元122的输出数据,进行最后一层的卷积滤波处理,输出结果作为去失真图像颜色分量,用于生成去失真图像块。
图2-7为实现该解决方案的数据流的示意图,其中,目标图像块的失真图像颜色分量,以及目标图像块的边信息分量作为输入数据,输入到预先训练的卷积神经网络模型中,卷积神经网络模型可以由预设结构的卷积神经网络和配置的网络参数集进行表示,输入数据经过输入层、隐含层和输出层的卷积滤波处理之后,得到去失真图像块。
作为卷积神经网络模型的输入数据,根据实际需要,可以包括一种或多种边信息分量,也可以包括一种或多种失真图像颜色分量,例如,至少包括Y颜色分量、U颜色分量和V颜色分量之一。
例如,在一些图像处理中,可能仅针对全部颜色分量中的一种颜色分量存在失真情况,则可以在去失真处理时,仅将失真图像的该颜色分量作为输入数据,如两种颜色分量存在失真情况,则将失真图像的该两种颜色分量均作为输入数据,相应的,均输出对应的去失真图像颜色分量。
一个图像的每个像素点的存储数据,包括该像素点的所有颜色分量的值,在获得失真图像的失真图像颜色分量时,可以根据需要,从每个像素点的存储数据中,提取出需要的一种或多种颜色分量的值,从而得到失真图像的失真图像颜色分量。
如图2-8所示,以YUV颜色空间为例,从中提取出每个像素点的Y颜色分量的值,从而得到失真图像的Y颜色分量。
参见图2-9,本步骤可以具体包括如下处理步骤:
本发明实施例中,以卷积神经网络模型包括输入层、隐含层和输出层的结构为例,对方案进行描述。
步骤61、将目标图像块的失真图像颜色分量以及生成的边信息分量,作为预先建立的卷积神经网络模型的输入数据,由输入层进行第一层的卷积滤波处理,具体可以如下:
在卷积神经网络模型中,输入数据可以是通过各自的通道输入到网络中,本步骤中,可以将cy通道的目标图像块颜色分量Y与cm通道的边信息分量M,在通道的维度上进行合并,共同组成cy+cm通道的输入数据I,并采用如下公式对输入数据I进行多维卷积滤波和非线性映射,产生n1个以稀疏形式表示的图像块:
F1(I)=g(W1*I+B1);
其中,F1(I)为输入层的输出,I为输入层中卷积层的输入,*为卷积操作,W1为输入层的卷积层滤波器组的权重系数,B1为输入层的卷积层滤波器组的偏移系数,g()为非线性映射函数。
其中,W1对应于n1个卷积滤波器,即有n1个卷积滤波器作用于输入层的卷积层的输入,输出n1个图像块;每个卷积滤波器的卷积核的大小为c1×f1×f1,其中c1为输入通道数,f1为每个卷积核在空间上的大小。
在一个具体的实施例中,该输入层的参数可以为:c1=2,f1=5,n1=64,使用ReLU(Rectified linear unit)函数作为g(),它的函数表达式为:
g(x)=max(0,x);
则该实施例中输入层卷积处理表达式为:
F1(I)=max(0,W1*I+B1);
步骤62、隐含层对输入层输出的稀疏表示的图像块F1(I)进行进一步的高维映射。
本发明实施例中,不对隐含层中包含的卷积层层数、卷积层连接方式、卷积层属性等作限定,可以采用目前已知的各种结构,但隐含层中包含至少1个卷积层。
例如,隐含层包含N-1(N≥2)层卷积层,隐含层处理由下式表示:
F1(I)=g(W1*F1-1(I)+B1),i∈{2,3,…,N};
其中,F1(I)表示卷积神经网络中第i层卷积层的输出,*为卷积操作,W1为第i层卷积层滤波器组的权重系数,B1为第i层卷积层滤波器组的偏移系数,g()为非线性映射函数。
其中,Wi对应于ni个卷积滤波器,即有ni个卷积滤波器作用于第i层卷积层的输入,输出ni个图像块;每个卷积滤波器的卷积核的大小为ci×fi×fi,其中ci为输入通道数,fi为每个卷积核在空间上的大小。
在一个具体的实施例中,该隐含层可以包括1个卷积层,该卷积层的卷积滤波器参数为:c2=64,f2=1,n2=32,使用ReLU(Rectified linear unit)函数作为g(),则该实施例中隐含层的卷积处理表达式为:
F2(I)=max(0,W2*F1(I)+B2);
步骤63、输出层对隐含层输出的高维图像块FN(I)进行聚合,输出去目标图像块颜色分量,用于生成去失真图像块。
本发明实施例中不对输出层的结构作限定,输出层可以是Residual Learning 结构,也可以是Direct Learning结构,或者其他的结构。
采用Residual Learning结构的处理如下:
对隐含层的输出进行卷积操作获取补偿残差,再与输入的失真图像颜色分量相加,得到去失真图像颜色分量,即得到去失真的第二图像块。输出层处理可由下式表示:
F(I)=WN+1*FN(I)+BN+1+Y;
其中,F(I)为输出层输出,FN(I)为隐含层的输出,*为卷积操作,WN+1为输出层的卷积层滤波器组的权重系数,BN+1为输出层的卷积层滤波器组的偏移系数,Y为未经过卷积滤波处理、欲进行去失真处理的失真图像颜色分量。
其中,WN+1对应于nN+1个卷积滤波器,即有nN+1个卷积滤波器作用于第N+1 层卷积层的输入,输出nN+1个图像块,nN+1为输出的去失真图像颜色分量个数,一般与输入的失真图像颜色分量的个数相等,如果只输出一种去失真图像颜色分量,则nN+1一般取值为1;每个卷积滤波器的卷积核的大小为 cN+1×fN+1×fN+1,其中cN+1为输入通道数,fN+1为每个卷积核在空间上的大小。
采用Direct Learning结构的处理如下:
对隐含层的输出进行卷积操作后直接输出去失真图像颜色分量,即得到去失真的第二图像块。输出层处理可由下式表示:
F(I)=WN+1,FN(I)+BN+1
其中,F(I)为输出层输出,FN(I)为隐含层的输出,*为卷积操作,WN+1为输出层的卷积层滤波器组的权重系数,BN+1为输出层的卷积层滤波器组的偏移系数。
其中,WN+1对应于nN+1个卷积滤波器,即有nN+1个卷积滤波器作用于第N+1 层卷积层的输入,输出nN+1个图像块,nN+1为输出的去失真图像颜色分量个数,一般与输入的失真图像颜色分量的个数相等,如果只输出一种去失真图像颜色分量,则HN+1一般取值为1;每个卷积滤波器的卷积核的大小为 cN+1×fN+1×fN+1,其中cN+1为输入通道数,fN+1为每个卷积核在空间上的大小。
在一个具体的实施例中,该输出层采用Residual Learning结构,输出层包括1 个卷积层,该输出层的卷积滤波器参数为:c3=32,f3=3,n3=1,则该实施例中输出层的卷积处理表达式为:
F(I)=W3*F3(I)+B3+Y。
在本发明实施例提供的上述解决方案中,还提出了一种卷积神经网络模型训练方法,如图2-10所示,具体包括如下处理步骤:
步骤71、获取预设训练集,预设训练集包括原始样本图像,以及原始样本图像对应的多个失真图像的失真图像颜色分量,以及每个失真图像对应的边信息分量,其中,失真图像对应的边信息分量表示该失真图像相对原始样本图像的失真特征。该多个失真图像的失真特征不同。
本步骤中,可以预先对原始样本图像(即未失真的自然图像),进行不同失真程度的一种图像处理,得到各自对应的失真图像,并按照上述去失真方法中的步骤,针对每个失真图像,生成对应的边信息分量,从而将每个原始样本图像、对应的失真图像以及对应的边信息分量组成图像对,由这些图像对组成预设训练集Ω。
进一步的,训练集可以包括一个原始样本图像,针对该原始样本图像进行上述图像处理,得到失真特征不同的多个失真图像,以及每个失真图像对应的边信息分量;
训练集也可以包括多个原始样本图像,分别针对每个原始样本图像进行上述图像处理,得到失真特征不同的多个失真图像,以及每个失真图像对应的边信息分量。
步骤72、针对预设结构的卷积神经网络CNN,初始化该卷积神经网络CNN的网络参数集中的参数,初始化的参数集可以由Θ1表示,初始化的参数可以根据实际需要和经验进行设置。
本步骤中,还可以对训练相关的高层参数如学习率、梯度下降算法等进行合理的设置,具体可以采用现有技术中的各种方式,在此不再进行详细描述。
步骤73、进行前向计算,具体如下:
将预设训练集中的每个失真图像的失真图像颜色分量以及对应的边信息分量,输入预设结构的卷积神经网络进行卷积滤波处理,得到该失真图像对应的去失真图像颜色分量。
本步骤中,具体可以为对预设训练集Ω进行参数集为Θi的卷积神经网络CNN 的前向计算,获取卷积神经网络的输出F(Y),即每个失真图像对应的去失真图像颜色分量。
第一次进入本步骤处理时,当前参数集为Θ1,后续再次进入本步骤处理时,当前参数集Θi为对上一次使用的参数集Θi-1进行调整后得到的,详见后续描述。
步骤74、基于多个原始样本图像的原始图像颜色分量和得到的去失真图像颜色分量,确定多个原始样本图像的损失值。
具体可以使用均方误差(MSE)公式作为损失函数,得到损失值L(Θi),详见如下公式:
Figure BDA0001552308560000201
其中,H表示单次训练中从预设训练集中选取的图像对个数,Ih表示第h个失真图像对应的由边信息分量和失真图像颜色分量合并后的输入数据,F(Ihi) 表示针对第h个失真图像,卷积神经网络CNN在参数集Θi下前向计算得到的去失真图像颜色分量,Xh表示第h个失真图像对应的原始图像颜色分量,i为当前已进行前向计算的次数计数。
步骤75、基于损失值确定采用当前参数集的该预设结构的卷积神经网络是否收敛,如果不收敛,进入步骤76,如果收敛,进入步骤77。
具体的,可以当损失值小于预设损失值阈值时,确定收敛;也可以当本次计算得到损失值与上一次计算得到的损失值之差,小于预设变化阈值时,确定收敛,本发明在此不做限定。
步骤76,对当前参数集中的参数进行调整,得到调整后的参数集,然后进入步骤73,用于下一次前向计算。
具体可以利用反向传播算法对当前参数集中的参数进行调整。
步骤77、将当前参数集作为输出的最终参数集Θfinal,并将采用最终参数集Θfinal的该预设结构的卷积神经网络,作为训练完成的卷积神经网络模型。
可选的,如果对整帧失真图片进行滤波,则可以将失真图片和失真图片对应的边信息分量输入到卷积神经网络模型中进行卷积滤波处理,得到去失真图片,对该去失真图片进行划分得到失真图片中的每个失真图像块对应的第一去夫真图像块。
步骤205:将目标图像块输入至少一个滤波器进行滤波处理,得到每个滤波器输出的第二去失真图像块。
如果对整帧失真图片进行滤波,则可以将失真图片输入至少一个滤波器进行滤波处理,得到每个滤波器输出的去失真图片,再对每个滤波器输出的去失真图片进行划分,得到每个滤波器滤波后的失真图片包括的失真图像块对应的第二去失真图像块。
步骤206:从图像块集合中选择一个图像块作为目标图像块对应的目标去失真图像块,图像块集合包括每个第二去失真图像块、第一去失真图像块和目标图像块。
在本步骤中可以通过如下两种方式选择图像块,分别为:
第一种,根据目标图像块对应的原始图像块,从图像块集合中选择一个图像块。
在实现时,可以分别计算图像块集合中的每个图像块与目标图像块对应的原始图像块之间的差异值;从图像块集合中选择与目标图像块对应的原始图像块之间的差异值最小的图像块。
其中,图像块与目标图像块对应的原始图像块之间的差异值可以为估算值与估算对象之差值的平方和(Sum of Squared Differences,SSD)值等。
可选的,在选择目标去失真图像块之后,还可以根据目标图像块在失真图片中的位置,在滤波标志图中填写用于标识该目标去失真图像块的数据类型的标志信息。
该目标去失真图像块的数据类型可以为是卷积神经网络模型滤波输出的数据、至少一个滤波器中的某个滤波器输出的数据或是目标图像块。
第二种、根据目标图像块包括的各编码单元的编码信息,从图像块集合中选择一个图像块。
其中,熵编码器输出的视频比特流中包括当前原始视频图片中的每个编码单元的位置和编码信息。
所以在实现时,可以根据目标图像块在失真图片中的位置和当前原始视频图片中的每个编码单元的位置,确定目标图像块包括的各编码单元;根据目标图像块包括的各编码单元的编码信息,从图像块集合中选择一个图像块。
目标图像块包括的编码单元的编码信息可以为预测模式和/或运动向量等等,利用一种或多种编码信息来导出目标图像块的选择结果。例如若目标图像块中超过预设第一比例的编码单元采用帧内编码模式,则选择卷积神经网络模型滤波出的第一去失真图像块,若目标图像块中超过预设第二比例的编码单元采用跳过模式(SKIP)进行编码,则选择目标图像块,第二比例小于第一比例;否则,选择某个滤波器输出的第二去失真图像块。
按上述203至206的步骤,得到失真图片中的各失真图像块对应的目标去失真图像块。在本实施例中,由于得到每个失真图像块对应的图像块集合,失真图像块集合包括该失真图像块和使用不同滤波器滤波得到的去真图像块,然后根据该失真图像块对应的原始图像块或该失真图像块包括的各编码单元的编码信息,从该图像块集合中选择与原始图像块差异最小的图像块作为该失真图像块对应的目标去失真图像块,这样可以提高滤波性能和质量,以及去失真性能。
步骤207:根据该失真图片包括的各失真图像块对应的目标去失真图像块,对待编码的原始视频图片进行编码得到视频比特流。
具体地,根据该失真图片包括的各失真图像块在失真图片中的位置,分别将各失真图像块对应的目标去失真图像块填充在空白的参考图片中,将该参考图片缓存在缓存器中,这样当该参考图片被选中时,可以使用该参考图片对待编码的原始视频图片进行编码得到视频比特流,该待编码的原始视频图片指的是尚未编码的原始视频图片,可以是当前原始视频图片之后的原始视频图片。
在本申请实施例中,对于失真图片包括的任一失真图像块,即对目标图像块进行滤波后得到失真图片的失真图像块对应的第一去失真图像块,以及使用至少一个滤波器对该目标图像块进行滤波后,得到每个滤波器输出的目标图像块对应的第二去失真图像块,然后从目标图像块、第一去失真图像块和第二去失真图像块中选择与目标图像块对应的原始图像块差异小的图像块作为最终滤波得到的图像块,这样不仅提高了滤波性能,提高了在视频编码过程中去失真性能。另外,在本申请实施例中,在卷积神经网络模型中还加入了边信息分量,这样提高卷积神经网络模型的泛化能力。
参见图3,本申请实施例提供了一种视频解码方法,所述方法包括:
步骤301:对接收的视频比特流进行熵解码,得到当前熵解码数据。
步骤302:获取失真图片包括的各失真图像块,失真图片为对当前熵解码数据进行解码时生成的。
步骤303:根据当前熵解码数据确定目标图像块对应的数据类型,目标图像块为失真图片中的一个失真图像块。
步骤304:在该数据类型用于表示卷积神经网络模型滤波的数据时,生成目标图像块对应的边信息分量。
其中该边信息分量表示该目标图像块相对其在原始视频图片中对应的原始图像块的失真特征,该原始视频图片是该当前熵解码数据对应的视频图片。
步骤305:将目标图像块以及该边信息分量输入卷积神经网络模型进行卷积滤波处理,得到所述目标图像块对应的去失真图像块。
其中,卷积神经网络模型为基于预设训练集进行训练得到的,预设训练集包括原始样本图片,原始样本图片对应的多个失真图片,以及每个失真图片对应的边信息分量。
步骤306:根据该失真图片包括的各失真图像块对应的去失真图像块,对后续接收的视频比特流进行解码。
在本申请实施例中,根据当前熵解码数据确定目标图像块对应的数据类型,根据该数据类型选择滤波器对失真图片进行滤波,这样不仅提高了滤波性能,提高了在视频解码过程中去失真性能。
对于图3所示的视频解码方法,参见图4-1,该方法的详细实现过程,可以包括:
步骤401:对接收的视频比特流进行熵解码,得到当前熵解码数据。
步骤402:获得失真图片包括的各失真图像块,失真图像为对当前熵解码数据进行解码时生成的。
在视频解码过程中会生成重构图片,失真图片可以为该重构图片,或者可以为对该重构图片进行滤波后得到的图片。
参见图4-2所示的视频解码***的结构示意图,视频解码***包括预测模块、熵解码器、反量化单元、反变换单元、重建单元、CNN(卷积神经网络模型)和缓存器等部分组成。
该视频解码***解码的过程为:将接收的视频比特流输入到熵解码器中,熵解码器对该比特流进行解码得到熵解码数据,该熵解码数据包括模式信息、量化参数、残差信息、原始视频图片包括的每个编码单元的编码信息和/或滤波标志图等,将该模式信息输入到预测模块中,将该量化参数输入到卷积神经网络模型中,以及将该残差信息输入到反量化单元中。预测模块根据缓存器中的参考图片对输入的该模式信息进行预测得到预测数据,并将该预测数据输入重建单元。其中,预测模块包括帧内预测单元、运动补偿单元和开关,模式信息可以包括帧内模式信息和帧间模式信息。帧内预测单元可以对帧内模式信息预测得到帧内预测数据,运动补偿单元根据缓存器中缓存的参考图片对帧间模式信息帧间预测得到帧间预测数据,开关选择将帧内预测数据或将帧间预测数据输出给重建单元。
反量化单元和反变换单元分别对该残差信息进行反量化和反变换处理,得到预测误差信息,将该预测误差信息输入到重建单元中;重建单元根据该预测误差信息和预测数据生成重构图片。相应的,在本步骤中,可以获取重建单元生成的重构图片,并将该重构图片作为失真图片。
可选的,参见图4-3,在卷积神经网络模型和重建单元之间还可以串联滤波器,该滤波器还可以对重建单元生成的重构图片进行滤波,输出滤波的重构图片。相应的,在本步骤中,可以获取滤波的重构图片,并将滤波的该重构图片作为失真图片。
步骤403:根据当前熵解码数据确定目标图像块对应的数据类型,目标图像块为失真图片中的一个失真图像块。
当前熵解码数据包括滤波标志图,滤波标志图包括失真图片中的各失真图像块对应的标志信息,失真图像块对应的标志信息用于标识失真图像块对应的数据类型。
本步骤可以为:根据目标图像块在失真图片中的位置,从滤波标志图中读取目标图像块对应的标志信息;根据该标志信息确定该目标图像块对应的数据类型。或者,
当前熵解码数据包括原始视频图片中的各编码单元的位置和编码信息。本步骤可以为:根据目标图像块在失真图片中的位置和原始视频图片中的各编码单元的位置,确定目标图像块包括的各编码单元;根据目标图像块包括的各编码单元的编码信息,确定目标图像块对应的数据类型。
目标图像块包括的编码单元的编码信息可以为预测模式和/或运动向量等等。例如若目标图像块中有超过预设第一比例的编码单元采用帧内编码模式,则确定数据类型为卷积神经网络模型滤波的数据;若目标图像块中超过预设第二比例的编码单元采用跳过模式(SKIP)进行编码,则确定数据类型为一滤波器滤波的数据,第二比例小于第一比例;否则,确定数据类型为目标图像块。
步骤404:在该数据类型用于表示卷积神经网络模型滤波的数据时,生成目标图像块对应的边信息分量。
其中该边信息分量表示该目标图像块相对其在原始视频图片中对应的原始图像块的失真特征,该原始视频图片是该当前熵解码数据对应的视频图片。
生成目标图像块对应的边信息分量的详细实现过程,可以参见2-1所述实施例中的步骤203中的相关内容,在此不再详细说明。
步骤405:将目标图像块以及该边信息分量输入卷积神经网络模型进行卷积滤波处理,得到目标图像块对应的去失真图像块。
卷积神经网络模型进行卷积滤波处理的详细实现过程,可以参见2-1所述实施例中的步骤204中的相关内容,在此不再详细说明。
步骤406:在该数据类型用于表示某个滤波器输出的数据时,将该目标图像块输入到该滤波器中进行滤波处理,得到去失真图像块。
步骤407:在该数据类型用于表示目标图像块时,将该目标图像块确定为去失真图像块。
按上述403至407的步骤,获取失真图片中的各失真图像块对应的去失真图像块。
步骤408:根据该失真图片包括的各失真图像块对应的去失真图像块,对后续接收的视频比特流进行解码。
具体地,根据该失真图片包括的各失真图像块在失真图片中的位置,将各失真图像块对应的去失真图像块填充在空白的参考图片中,将该参考图片存储缓存器中,这样可以使用缓存器中的该参考图片对后续接收的视频比特流进行解码。
在本申请实施例中,根据当前熵解码数据确定目标图像块对应的数据类型,根据该数据类型选择滤波器对失真图片进行滤波,这样不仅提高了滤波性能,提高了在视频解码过程中去失真性能。
下述为本申请装置实施例,可以用于执行本申请方法实施例。对于本申请装置实施例中未披露的细节,请参照本申请方法实施例。
参见图5,本申请实施例提供了一种视频编码装置500,所述装置500包括:
获取模块501,用于获取失真图片,所述失真图片是对当前原始视频图片进行编码时生成的;
生成模块502,用于生成失真图片对应的边信息分量,所述边信息分量表示所述失真图片相对所述当前原始视频图片的失真特征;
滤波模块503,用于将所述失真图片和所述边信息分量输入卷积神经网络模型进行滤波处理得到所述失真图片包括的失真图像块对应的第一去失真图像块,所述卷积神经网络模型为基于预设训练集进行训练得到的,所述预设训练集包括原始样本图片,所述原始样本图片对应的多个失真图片,以及每个所述原始样本图片对应的失真图片所对应的边信息分量;
选择模块504,用于从所述失真图像块对应的图像块集合中选择一个图像块作为所述失真图像块对应的目标去失真图像块,所述图像块集合包括所述失真图像块对应的第一去失真图像块和/或所述失真图像块;
编码模块505,用于根据所述失真图像块对应的目标去失真图像块,对所述当前原始视频图片之后的原始视频图片进行编码得到视频比特流。
可选的,所述滤波模块503包括:
第一滤波单元,用于对所述失真图片进行划分,得到所述失真图片包括的失真图像块,将所述失真图像块和所述失真图像块对应的边信息分量输入卷积神经网络模型进行滤波处理得到所述失真图像块对应的第一去失真图像块;或者,
第二滤波单元,用于将所述失真图片和所述边信息分量输入卷积神经网络模型进行滤波处理得到去失真图图片,对所述去失真图片进行划分得到所述失真图片包括的失真图像块对应的第一去失真图像块。
可选的,所述滤波模块,还用于:
将所述失真图片输入至少一个滤波器进行滤波处理,得到每个滤波器输出的所述失真图片包括的失真图像块对应的第二去失真图像块,所述失真图像块对应的图像块集合还包括所述每个滤波器输出的所述失真图像块对应的第二去失真图像块。
可选的,所述选择模块504包括:
第一选择单元,用于根据所述失真图像块在所述当前原始视频图片中对应的原始图像块,从图像块集合中选择一个图像块;或者,
第二选择单元,用于根据所述失真图像块包括的各编码单元的编码信息,从图像块集合中选择一个图像块。
可选的,所述第一选择单元,用于:
分别计算所述图像块集合中的每个图像块与所述失真图像块对应的原始图像块之间的差异值;
从所述图像块集合中选择与所述失真图像块对应的原始图像块之间的差异值最小的图像块。
可选的,所述视频比特流还包括所述失真图片对应的滤波标志图,所述装置还包括:
填写模块,用于在根据所述失真图像块对应的原始图像块,从图像块集合中选择一个图像块时,根据所述失真图像块在所述失真图片的位置,在所述滤波标志图中填写用于标识所述目标去失真图像块的数据类型的标志信息。
在本申请实施例中,对失真图片进行滤波后得到失真图片的失真图像块对应的第一去失真图像块,然后从失真图像块和该失真图像块对应的第一去失真图像块中选择与原始图片差异小的图像块作为最终滤波得到的图像块,这样不仅提高了滤波性能,提高了在视频编码过程中去失真性能。
参见图6,本申请实施例提供一种视频解码装置600,所述装置600包括:
解码模块601,用于对接收的视频比特流进行熵解码,得到当前熵解码数据;
获取模块602,用于获取失真图片包括的各失真图像块,所述失真图片为对所述当前熵解码数据进行解码时生成的;
确定模块603,用于根据所述当前熵解码数据确定目标图像块对应的数据类型,所述目标图像块为所述失真图片中的一个失真图像块;
生成模块604,用于在所述数据类型用于表示卷积神经网络模型滤波的数据时,生成目标图像块对应的边信息分量,所述边信息分量表示所述目标图像块相对其在原始视频图片中对应的原始图像块的失真特征,所述原始视频图片是所述当前熵解码数据对应的视频图片;
滤波模块605,用于将所述目标图像块以及所述边信息分量输入卷积神经网络模型进行卷积滤波处理,得到所述目标图像块对应的去失真图像块,所述卷积神经网络模型为基于预设训练集进行训练得到的,所述预设训练集包括原始样本图片,所述原始样本图片对应的多个失真图片,以及每个所述原始样本图片对应的失真图片所对应的边信息分量;
所述解码模块601,还用于根据所述失真图片包括的各失真图像块对应的去失真图像块,对后续接收的视频比特流进行解码。
可选的,所述滤波模块605,还用于:
在所述数据类型用于表示一滤波器滤波的数据时,将所述目标图像块输入所述滤波器进行滤波处理,得到所述目标图像块对应的去失真图像块;或者,
在所述数据类型用于表示所述目标图像块时,将所述目标图像块确定为所述目标图像块对应的去失真图像块。
可选的,所述当前熵解码数据包括滤波标志图,所述滤波标志图包括所述失真图片中的各失真图像块对应的标志信息,失真图像块对应的标志信息用于标识所述失真图像块对应的数据类型;
所述确定模块603,包括:
读取单元,用于根据目标图像块在所述失真图片中的位置,从所述滤波标志图中读取所述目标图像块对应的标志信息;
第一确定单元,用于根据所述标志信息确定所述目标图像块对应的数据类型。
可选的,所述当前熵解码数据包括所述原始视频图片中的各编码单元的位置和编码信息;
所述确定模块603包括:
第二确定单元,用于根据所述目标图像块在所述失真图片中的位置和所述原始视频图片中的各编码单元的位置,确定所述目标图像块包括的各编码单元;
第三确定单元,用于根据所述目标图像块包括的各编码单元的编码信息,确定所述目标图像块对应的数据类型。
在本申请实施例中,根据当前熵解码数据确定目标图像块对应的数据类型,根据该数据类型选择滤波器对失真图片进行滤波,这样不仅提高了滤波性能,提高了在视频解码过程中去失真性能。
参见图7,本申请实施例提供了一种视频编码方法,所述方法包括:
步骤701:获取失真图片包括的失真图像块,该失真图片是对原始视频图片进行编码时生成的。
步骤702:根据目标图像块包括的编码单元的编码信息,确定目标图像块对应的数据类型,目标图像块为失真图片中的任一失真图像块。
步骤703:在该数据类型用于表示卷积神经网络模型滤波的数据时,生成目标图像块对应的边信息分量,该边信息分量表示目标图像块相对其在原始视频图片中对应的原始图像块的失真特征。
步骤704:将目标图像块以及该边信息分量输入卷积神经网络模型进行卷积滤波处理,得到目标图像块对应的去失真图像块,卷积神经网络模型为基于预设训练集进行训练得到的,预设训练集包括原始样本图片,原始样本图片对应的多个失真图片,以及每个原始图片对应的失真图片所对应的边信息分量。
步骤705:根据失真图片中的失真图像块对应的去失真图像块,对当前原始视频图片之后的原始视频图片进行编码得到视频比特流。
在本申请实施例中,根据失真图像块包括的编码单元的编码信息确定目标图像块对应的数据类型,根据该数据类型选择滤波器对失真图片进行滤波,这样不仅提高了滤波性能,提高了在视频编码过程中去失真性能。
对于图7所示的视频编码方法,参见图8,该方法的详细实现过程,可以包括:
步骤801-802:分别与图2-1所示实施例中的步骤201-202相同,在此不再详细说明。
步骤803:根据目标图像块包括的编码单元的编码信息,确定目标图像块对应的数据类型,目标图像块为失真图片中的任一失真图像块。
其中,在对当前原始视频图片进行视频编码时会得到视频比特流,该视频比特流中包括当前原始视频图片中的各编码单元的位置和编码信息。
在本步骤中,可以根据目标图像块在失真图片中的位置和原始视频图片中的各编码单元的位置,确定目标图像块包括的各编码单元;根据目标图像块包括的各编码单元的编码信息,确定目标图像块对应的数据类型。
目标图像块包括的编码单元的编码信息可以为预测模式和/或运动向量等等。例如若目标图像块中有超过预设第一比例的编码单元采用帧内编码模式,则确定数据类型为卷积神经网络模型滤波的数据;若目标图像块中超过预设第二比例的编码单元采用跳过模式(SKIP)进行编码,则确定数据类型为一滤波器滤波的数据,第二比例小于第一比例;否则,确定数据类型为目标图像块。
步骤804:在该数据类型用于表示卷积神经网络模型滤波的数据时,生成目标图像块对应的边信息分量。
其中该边信息分量表示该目标图像块相对其在原始视频图片中对应的原始图像块的失真特征,该原始视频图片是该当前熵解码数据对应的视频图片。
生成目标图像块对应的边信息分量的详细实现过程,可以参见2-1所述实施例中的步骤203中的相关内容,在此不再详细说明。
步骤805:将目标图像块以及该边信息分量输入卷积神经网络模型进行卷积滤波处理,得到目标图像块对应的去失真图像块。
卷积神经网络模型进行卷积滤波处理的详细实现过程,可以参见2-1所述实施例中的步骤204中的相关内容,在此不再详细说明。
步骤806:在该数据类型用于表示某个滤波器输出的数据时,将该目标图像块输入到该滤波器中进行滤波处理,得到去失真图像块。
步骤807:在该数据类型用于表示目标图像块时,将该目标图像块确定为去失真图像块。
按上述803至807的步骤,获取失真图片中的各失真图像块对应的去失真图像块。
步骤808:根据该失真图片包括的各失真图像块对应的去失真图像块,编码在当前原始视频图片之后的原始视频图片得到视频比特流。
具体地具体地,根据该失真图片包括的各失真图像块在失真图片中的位置,分别将各失真图像块对应的目标去失真图像块填充在空白的参考图片中,将该参考图片缓存在缓存器中,这样当该参考图片被选中时,可以使用该参考图片对待编码的原始视频图片进行编码得到视频比特流。
在本申请实施例中,根据目标图像块包括的各编码单元的编码信息确定目标图像块对应的数据类型,根据该数据类型选择滤波器对失真图片进行滤波,,由于编码信息能够反映该编码单元在原始视频图片中的原始图像信息,这样通过编码信息可以确定出滤波时出现失真小的滤波方式,即数据类型,根据该数据类型选择滤波器,不仅提高了滤波性能,提高了在视频编码过程中去失真性能。
参见图9,本申请实施例提供了一种视频编码装置900,所述装置900包括:
获取模块901,用于获取失真图片包括的失真图像块,所述失真图片是对原始视频图片进行编码时生成的;
确定模块902,用于根据目标图像块包括的编码单元的编码信息,确定所述目标图像块对应的数据类型,所述目标图像块为所述失真图片中的任一失真图像块;
生成模块903,用于在所述数据类型用于表示卷积神经网络模型滤波的数据时,生成所述目标图像块对应的边信息分量,所述边信息分量表示所述目标图像块相对其在所述原始视频图片中对应的原始图像块的失真特征;
滤波模块904,用于将所述目标图像块以及所述边信息分量输入卷积神经网络模型进行卷积滤波处理,得到所述目标图像块对应的去失真图像块,所述卷积神经网络模型为基于预设训练集进行训练得到的,所述预设训练集包括原始样本图片,所述原始样本图片对应的多个失真图片,以及每个失真图片对应的边信息分量;
编码模块905,用于根据所述失真图片中的失真图像块对应的去失真图像块,对所述当前原始视频图片之后的原始视频图片进行编码得到视频比特流。
可选的,所述滤波模块904,还用于:
在所述数据类型用于表示一滤波器滤波的数据时,将所述目标图像块输入所述滤波器进行滤波处理,得到所述目标图像块对应的去失真图像块;或者,
在所述数据类型用于表示所述目标图像块时,将所述目标图像块确定为所述目标图像块对应的去失真图像块。
在本申请实施例中,根据目标图像块包括的各编码单元的编码信息确定目标图像块对应的数据类型,根据该数据类型选择滤波器对失真图片进行滤波,这样不仅提高了滤波性能,提高了在视频编码过程中去失真性能。
参见图10,本申请实施例提供了一种编解码***1000,所述***1000包括如图5所示实施例提供的视频编码装置1001和如图6所示实施例提供的视频解码装置1002;或者,
所述***1000包括如图9所示实施例提供的视频编码装置1001和如图6 所示实施例提供的视频解码装置1002。
关于上述实施例中的装置,其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。
图11示出了本发明一个示例性实施例提供的终端1100的结构框图。该终端1100可以是便携式移动终端,比如:智能手机、平板电脑、MP3播放器(Moving Picture ExpertsGroup Audio Layer III,动态影像专家压缩标准音频层面3)、MP4 (Moving PictureExperts Group Audio Layer IV,动态影像专家压缩标准音频层面4)播放器、笔记本电脑或台式电脑。终端1100还可能被称为用户设备、便携式终端、膝上型终端、台式终端等其他名称。
通常,终端1100包括有:处理器1101和存储器1102。
处理器1101可以包括一个或多个处理核心,比如4核心处理器、8核心处理器等。处理器1101可以采用DSP(Digital Signal Processing,数字信号处理)、 FPGA(Field-Programmable Gate Array,现场可编程门阵列)、PLA (Programmable Logic Array,可编程逻辑阵列)中的至少一种硬件形式来实现。处理器1101也可以包括主处理器和协处理器,主处理器是用于对在唤醒状态下的数据进行处理的处理器,也称CPU(Central ProcessingUnit,中央处理器);协处理器是用于对在待机状态下的数据进行处理的低功耗处理器。在一些实施例中,处理器1101可以在集成有GPU(Graphics Processing Unit,图像处理器),GPU用于负责显示屏所需要显示的内容的渲染和绘制。一些实施例中,处理器 1101还可以包括AI(Artificial Intelligence,人工智能)处理器,该AI处理器用于处理有关机器学习的计算操作。
存储器1102可以包括一个或多个计算机可读存储介质,该计算机可读存储介质可以是非暂态的。存储器1102还可包括高速随机存取存储器,以及非易失性存储器,比如一个或多个磁盘存储设备、闪存存储设备。在一些实施例中,存储器1102中的非暂态的计算机可读存储介质用于存储至少一个指令,该至少一个指令用于被处理器1101所执行以实现本申请中方法实施例提供的视频编码方法或视频解码方法。
在一些实施例中,终端1100还可选包括有:***设备接口1103和至少一个***设备。处理器1101、存储器1102和***设备接口1103之间可以通过总线或信号线相连。各个***设备可以通过总线、信号线或电路板与***设备接口1103相连。具体地,***设备包括:射频电路1104、触摸显示屏1105、摄像头1106、音频电路1107、定位组件1108和电源1109中的至少一种。
***设备接口1103可被用于将I/O(Input/Output,输入/输出)相关的至少一个***设备连接到处理器1101和存储器1102。在一些实施例中,处理器1101、存储器1102和***设备接口1103被集成在同一芯片或电路板上;在一些其他实施例中,处理器1101、存储器1102和***设备接口1103中的任意一个或两个可以在单独的芯片或电路板上实现,本实施例对此不加以限定。
射频电路1104用于接收和发射RF(Radio Frequency,射频)信号,也称电磁信号。射频电路1104通过电磁信号与通信网络以及其他通信设备进行通信。射频电路1104将电信号转换为电磁信号进行发送,或者,将接收到的电磁信号转换为电信号。可选地,射频电路1104包括:天线***、RF收发器、一个或多个放大器、调谐器、振荡器、数字信号处理器、编解码芯片组、用户身份模块卡等等。射频电路1104可以通过至少一种无线通信协议来与其它终端进行通信。该无线通信协议包括但不限于:万维网、城域网、内联网、各代移动通信网络(2G、3G、4G及5G)、无线局域网和/或WiFi(Wireless Fidelity,无线保真) 网络。在一些实施例中,射频电路1104还可以包括NFC(Near Field Communication,近距离无线通信)有关的电路,本申请对此不加以限定。
显示屏1105用于显示UI(User Interface,用户界面)。该UI可以包括图形、文本、图标、视频及其它们的任意组合。当显示屏1105是触摸显示屏时,显示屏1105还具有采集在显示屏1105的表面或表面上方的触摸信号的能力。该触摸信号可以作为控制信号输入至处理器1101进行处理。此时,显示屏1105还可以用于提供虚拟按钮和/或虚拟键盘,也称软按钮和/或软键盘。在一些实施例中,显示屏1105可以为一个,设置终端1100的前面板;在另一些实施例中,显示屏1105可以为至少两个,分别设置在终端1100的不同表面或呈折叠设计;在再一些实施例中,显示屏1105可以是柔性显示屏,设置在终端1100的弯曲表面上或折叠面上。甚至,显示屏1105还可以设置成非矩形的不规则图形,也即异形屏。显示屏1105可以采用LCD(Liquid Crystal Display,液晶显示屏)、 OLED(Organic Light-EmittingDiode,有机发光二极管)等材质制备。
摄像头组件1106用于采集图像或视频。可选地,摄像头组件1106包括前置摄像头和后置摄像头。通常,前置摄像头设置在终端的前面板,后置摄像头设置在终端的背面。在一些实施例中,后置摄像头为至少两个,分别为主摄像头、景深摄像头、广角摄像头、长焦摄像头中的任意一种,以实现主摄像头和景深摄像头融合实现背景虚化功能、主摄像头和广角摄像头融合实现全景拍摄以及VR(Virtual Reality,虚拟现实)拍摄功能或者其它融合拍摄功能。在一些实施例中,摄像头组件1106还可以包括闪光灯。闪光灯可以是单色温闪光灯,也可以是双色温闪光灯。双色温闪光灯是指暖光闪光灯和冷光闪光灯的组合,可以用于不同色温下的光线补偿。
音频电路1107可以包括麦克风和扬声器。麦克风用于采集用户及环境的声波,并将声波转换为电信号输入至处理器1101进行处理,或者输入至射频电路 1104以实现语音通信。出于立体声采集或降噪的目的,麦克风可以为多个,分别设置在终端1100的不同部位。麦克风还可以是阵列麦克风或全向采集型麦克风。扬声器则用于将来自处理器1101或射频电路1104的电信号转换为声波。扬声器可以是传统的薄膜扬声器,也可以是压电陶瓷扬声器。当扬声器是压电陶瓷扬声器时,不仅可以将电信号转换为人类可听见的声波,也可以将电信号转换为人类听不见的声波以进行测距等用途。在一些实施例中,音频电路1107还可以包括耳机插孔。
定位组件1108用于定位终端1100的当前地理位置,以实现导航或LBS (LocationBased Service,基于位置的服务)。定位组件1108可以是基于美国的 GPS(GlobalPositioning System,全球定位***)、中国的北斗***或俄罗斯的伽利略***的定位组件。
电源1109用于为终端1100中的各个组件进行供电。电源1109可以是交流电、直流电、一次性电池或可充电电池。当电源1109包括可充电电池时,该可充电电池可以是有线充电电池或无线充电电池。有线充电电池是通过有线线路充电的电池,无线充电电池是通过无线线圈充电的电池。该可充电电池还可以用于支持快充技术。
在一些实施例中,终端1100还包括有一个或多个传感器810。该一个或多个传感器810包括但不限于:加速度传感器811、陀螺仪传感器812、压力传感器813、指纹传感器814、光学传感器815以及接近传感器816。
加速度传感器811可以检测以终端1100建立的坐标系的三个坐标轴上的加速度大小。比如,加速度传感器811可以用于检测重力加速度在三个坐标轴上的分量。处理器1101可以根据加速度传感器811采集的重力加速度信号,控制触摸显示屏1105以横向视图或纵向视图进行用户界面的显示。加速度传感器811 还可以用于游戏或者用户的运动数据的采集。
陀螺仪传感器812可以检测终端1100的机体方向及转动角度,陀螺仪传感器812可以与加速度传感器811协同采集用户对终端1100的3D动作。处理器 1101根据陀螺仪传感器812采集的数据,可以实现如下功能:动作感应(比如根据用户的倾斜操作来改变UI)、拍摄时的图像稳定、游戏控制以及惯性导航。
压力传感器813可以设置在终端1100的侧边框和/或触摸显示屏1105的下层。当压力传感器813设置在终端1100的侧边框时,可以检测用户对终端1100 的握持信号,由处理器1101根据压力传感器813采集的握持信号进行左右手识别或快捷操作。当压力传感器813设置在触摸显示屏1105的下层时,由处理器 1101根据用户对触摸显示屏1105的压力操作,实现对UI界面上的可操作性控件进行控制。可操作性控件包括按钮控件、滚动条控件、图标控件、菜单控件中的至少一种。
指纹传感器814用于采集用户的指纹,由处理器1101根据指纹传感器814 采集到的指纹识别用户的身份,或者,由指纹传感器814根据采集到的指纹识别用户的身份。在识别出用户的身份为可信身份时,由处理器1101授权该用户执行相关的敏感操作,该敏感操作包括解锁屏幕、查看加密信息、下载软件、支付及更改设置等。指纹传感器814可以被设置终端1100的正面、背面或侧面。当终端1100上设置有物理按键或厂商Logo时,指纹传感器814可以与物理按键或厂商Logo集成在一起。
光学传感器815用于采集环境光强度。在一个实施例中,处理器1101可以根据光学传感器815采集的环境光强度,控制触摸显示屏1105的显示亮度。具体地,当环境光强度较高时,调高触摸显示屏1105的显示亮度;当环境光强度较低时,调低触摸显示屏1105的显示亮度。在另一个实施例中,处理器1101 还可以根据光学传感器815采集的环境光强度,动态调整摄像头组件1106的拍摄参数。
接近传感器816,也称距离传感器,通常设置在终端1100的前面板。接近传感器816用于采集用户与终端1100的正面之间的距离。在一个实施例中,当接近传感器816检测到用户与终端1100的正面之间的距离逐渐变小时,由处理器1101控制触摸显示屏1105从亮屏状态切换为息屏状态;当接近传感器816 检测到用户与终端1100的正面之间的距离逐渐变大时,由处理器1101控制触摸显示屏1105从息屏状态切换为亮屏状态。
本领域技术人员可以理解,图11中示出的结构并不构成对终端1100的限定,可以包括比图示更多或更少的组件,或者组合某些组件,或者采用不同的组件布置。
本领域技术人员在考虑说明书及实践这里公开的申请后,将容易想到本申请的其它实施方案。本申请旨在涵盖本申请的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本申请的一般性原理并包括本申请未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本申请的真正范围和精神由下面的权利要求指出。
应当理解的是,本申请并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本申请的范围仅由所附的权利要求来限制。

Claims (27)

1.一种视频编码方法,其特征在于,所述方法包括:
获取失真图片,所述失真图片是对当前原始视频图片进行编码时生成的;
生成失真图片对应的边信息分量,所述边信息分量表示所述失真图片相对所述当前原始视频图片的失真特征,所述边信息分量是根据至少一个量化参数或目标图像块中包括的各编码单元的编码信息获取得到的;
将所述失真图片和所述边信息分量输入卷积神经网络模型进行滤波处理得到所述失真图片包括的失真图像块对应的第一去失真图像块,所述卷积神经网络模型为基于预设训练集进行训练得到的,所述预设训练集包括原始样本图片,所述原始样本图片对应的多个失真图片,以及每个所述原始样本图片对应的失真图片所对应的边信息分量;
从所述失真图像块对应的图像块集合中选择一个图像块作为所述失真图像块对应的目标去失真图像块,所述图像块集合包括所述失真图像块对应的第一去失真图像块和/或所述失真图像块;
根据所述失真图像块对应的目标去失真图像块,对所述当前原始视频图片之后的原始视频图片进行编码得到视频比特流;
其中,所述生成失真图片对应的边信息分量包括:
针对待处理的目标图像块,获取所述目标图像块中的每个编码单元的量化参数,将所述目标图像块的每个像素点所在编码单元的量化参数,确定为所述目标图像块的每个像素点的失真程度值,所述目标图像块是所述失真图片中的一失真图像块;
基于所述目标图像块中的各像素点的位置,使用所述获取的各像素点的失真程度值,生成所述目标图像块对应的边信息分量,其中,所述边信息分量包括的每个分量值与目标图像块上相同位置的像素点相对应。
2.如权利要求1所述的方法,其特征在于,所述将所述失真图片和所述边信息分量输入卷积神经网络模型进行滤波处理得到所述失真图片包括的失真图像块对应的第一去失真图像块,包括:
对所述失真图片进行划分,得到所述失真图片包括的失真图像块,将所述失真图像块和所述失真图像块对应的边信息分量输入卷积神经网络模型进行滤波处理得到所述失真图像块对应的第一去失真图像块;或者,
将所述失真图片和所述边信息分量输入卷积神经网络模型进行滤波处理得到去失真图图片,对所述去失真图片进行划分得到所述失真图片包括的失真图像块对应的第一去失真图像块。
3.如权利要求1所述的方法,其特征在于,所述获取失真图片之后,还包括:
将所述失真图片输入至少一个滤波器进行滤波处理,得到每个滤波器输出的所述失真图片包括的失真图像块对应的第二去失真图像块,所述失真图像块对应的图像块集合还包括所述每个滤波器输出的所述失真图像块对应的第二去失真图像块。
4.如权利要求1至3任一项所述的方法,其特征在于,所述从图像块集合中选择一个图像块,包括:
根据所述失真图像块在所述当前原始视频图片中对应的原始图像块,从图像块集合中选择一个图像块;或者,
根据所述失真图像块包括的各编码单元的编码信息,从图像块集合中选择一个图像块。
5.如权利要求4所述的方法,其特征在于,所述根据所述失真图像块在所述当前原始视频图片中对应的原始图像块,从图像块集合中选择一个图像块,包括:
分别计算所述图像块集合中的每个图像块与所述失真图像块对应的原始图像块之间的差异值;
从所述图像块集合中选择与所述失真图像块对应的原始图像块之间的差异值最小的图像块。
6.如权利要求4所述的方法,其特征在于,所述视频比特流还包括所述失真图片对应的滤波标志图,所述方法还包括:
在根据所述失真图像块对应的原始图像块,从图像块集合中选择一个图像块时,根据所述失真图像块在所述失真图片的位置,在所述滤波标志图中填写用于标识所述目标去失真图像块的数据类型的标志信息。
7.一种视频解码方法,其特征在于,所述方法包括:
对接收的视频比特流进行熵解码,得到当前熵解码数据;
获取失真图片包括的各失真图像块,所述失真图片为对所述当前熵解码数据进行解码时生成的;
根据所述当前熵解码数据确定目标图像块对应的数据类型,所述目标图像块为所述失真图片中的一个失真图像块;
在所述数据类型用于表示卷积神经网络模型滤波的数据时,生成目标图像块对应的边信息分量,所述边信息分量表示所述目标图像块相对其在原始视频图片中对应的原始图像块的失真特征,所述原始视频图片是所述当前熵解码数据对应的视频图片,所述边信息分量是根据至少一个量化参数或目标图像块中包括的各编码单元的编码信息获取得到的;
将所述目标图像块以及所述边信息分量输入卷积神经网络模型进行卷积滤波处理,得到所述目标图像块对应的去失真图像块,所述卷积神经网络模型为基于预设训练集进行训练得到的,所述预设训练集包括原始样本图片,所述原始样本图片对应的多个失真图片,以及每个所述原始样本图片对应的失真图片所对应的边信息分量;
根据所述失真图片包括的各失真图像块对应的去失真图像块,对后续接收的视频比特流进行解码;
其中,所述生成目标图像块对应的边信息分量包括:
针对待处理的目标图像块,获取所述目标图像块中的每个编码单元的量化参数,将所述目标图像块的每个像素点所在编码单元的量化参数,确定为所述目标图像块的每个像素点的失真程度值,所述目标图像块是所述失真图片中的一失真图像块;
基于所述目标图像块中的各像素点的位置,使用所述获取的各像素点的失真程度值,生成所述目标图像块对应的边信息分量,其中,所述边信息分量包括的每个分量值与目标图像块上相同位置的像素点相对应。
8.如权利要求7所述的方法,其特征在于,所述方法还包括:
在所述数据类型用于表示一滤波器滤波的数据时,将所述目标图像块输入所述滤波器进行滤波处理,得到所述目标图像块对应的去失真图像块;或者,
在所述数据类型用于表示所述目标图像块时,将所述目标图像块确定为所述目标图像块对应的去失真图像块。
9.如权利要求7所述的方法,其特征在于,所述当前熵解码数据包括滤波标志图,所述滤波标志图包括所述失真图片中的各失真图像块对应的标志信息,失真图像块对应的标志信息用于标识所述失真图像块对应的数据类型;
所述根据所述当前熵解码数据确定目标图像块对应的数据类型,包括:
根据目标图像块在所述失真图片中的位置,从所述滤波标志图中读取所述目标图像块对应的标志信息;
根据所述标志信息确定所述目标图像块对应的数据类型。
10.如权利要求7所述的方法,其特征在于,所述当前熵解码数据包括所述原始视频图片中的各编码单元的位置和编码信息;
所述根据所述当前熵解码数据确定目标图像块对应的数据类型,包括:
根据所述目标图像块在所述失真图片中的位置和所述原始视频图片中的各编码单元的位置,确定所述目标图像块包括的各编码单元;
根据所述目标图像块包括的各编码单元的编码信息,确定所述目标图像块对应的数据类型。
11.一种视频编码装置,其特征在于,所述装置包括:
获取模块,用于获取失真图片,所述失真图片是对当前原始视频图片进行编码时生成的;
生成模块,用于生成失真图片对应的边信息分量,所述边信息分量表示所述失真图片相对所述当前原始视频图片的失真特征,所述边信息分量是根据至少一个量化参数或目标图像块中包括的各编码单元的编码信息获取得到的;
滤波模块,用于将所述失真图片和所述边信息分量输入卷积神经网络模型进行滤波处理得到所述失真图片包括的失真图像块对应的第一去失真图像块,所述卷积神经网络模型为基于预设训练集进行训练得到的,所述预设训练集包括原始样本图片,所述原始样本图片对应的多个失真图片,以及每个所述原始样本图片对应的失真图片所对应的边信息分量;
选择模块,用于从所述失真图像块对应的图像块集合中选择一个图像块作为所述失真图像块对应的目标去失真图像块,所述图像块集合包括所述失真图像块对应的第一去失真图像块和/或所述失真图像块;
编码模块,用于根据所述失真图像块对应的目标去失真图像块,对所述当前原始视频图片之后的原始视频图片进行编码得到视频比特流;
其中,所述生成失真图片对应的边信息分量包括:
针对待处理的目标图像块,获取所述目标图像块中的每个编码单元的量化参数,将所述目标图像块的每个像素点所在编码单元的量化参数,确定为所述目标图像块的每个像素点的失真程度值,所述目标图像块是所述失真图片中的一失真图像块;
基于所述目标图像块中的各像素点的位置,使用所述获取的各像素点的失真程度值,生成所述目标图像块对应的边信息分量,其中,所述边信息分量包括的每个分量值与目标图像块上相同位置的像素点相对应。
12.如权利要求11所述的装置,其特征在于,所述滤波模块包括:
第一滤波单元,用于对所述失真图片进行划分,得到所述失真图片包括的失真图像块,将所述失真图像块和所述失真图像块对应的边信息分量输入卷积神经网络模型进行滤波处理得到所述失真图像块对应的第一去失真图像块;或者,
第二滤波单元,用于将所述失真图片和所述边信息分量输入卷积神经网络模型进行滤波处理得到去失真图图片,对所述去失真图片进行划分得到所述失真图片包括的失真图像块对应的第一去失真图像块。
13.如权利要求11所述的装置,其特征在于,所述滤波模块,还用于:
将所述失真图片输入至少一个滤波器进行滤波处理,得到每个滤波器输出的所述失真图片包括的失真图像块对应的第二去失真图像块,所述失真图像块对应的图像块集合还包括所述每个滤波器输出的所述失真图像块对应的第二去失真图像块。
14.如权利要求11至13任一项所述的装置,其特征在于,所述选择模块包括:
第一选择单元,用于根据所述失真图像块在所述当前原始视频图片中对应的原始图像块,从图像块集合中选择一个图像块;或者,
第二选择单元,用于根据所述失真图像块包括的各编码单元的编码信息,从图像块集合中选择一个图像块。
15.如权利要求14所述的装置,其特征在于,所述第一选择单元,用于:
分别计算所述图像块集合中的每个图像块与所述失真图像块对应的原始图像块之间的差异值;
从所述图像块集合中选择与所述失真图像块对应的原始图像块之间的差异值最小的图像块。
16.如权利要求14所述的装置,其特征在于,所述视频比特流还包括所述失真图片对应的滤波标志图,所述装置还包括:
填写模块,用于在根据所述失真图像块对应的原始图像块,从图像块集合中选择一个图像块时,根据所述失真图像块在所述失真图片的位置,在所述滤波标志图中填写用于标识所述目标去失真图像块的数据类型的标志信息。
17.一种视频解码装置,其特征在于,所述装置包括:
解码模块,用于对接收的视频比特流进行熵解码,得到当前熵解码数据;
获取模块,用于获取失真图片包括的各失真图像块,所述失真图片为对所述当前熵解码数据进行解码时生成的;
确定模块,用于根据所述当前熵解码数据确定目标图像块对应的数据类型,所述目标图像块为所述失真图片中的一个失真图像块;
生成模块,用于在所述数据类型用于表示卷积神经网络模型滤波的数据时,生成目标图像块对应的边信息分量,所述边信息分量表示所述目标图像块相对其在原始视频图片中对应的原始图像块的失真特征,所述原始视频图片是所述当前熵解码数据对应的视频图片,所述边信息分量是根据至少一个量化参数或目标图像块中包括的各编码单元的编码信息获取得到的;
滤波模块,用于将所述目标图像块以及所述边信息分量输入卷积神经网络模型进行卷积滤波处理,得到所述目标图像块对应的去失真图像块,所述卷积神经网络模型为基于预设训练集进行训练得到的,所述预设训练集包括原始样本图片,所述原始样本图片对应的多个失真图片,以及每个失真图片对应的边信息分量;
所述解码模块,还用于根据所述失真图片包括的各失真图像块对应的去失真图像块,对后续接收的视频比特流进行解码;
其中,所述生成目标图像块对应的边信息分量包括:
针对待处理的目标图像块,获取所述目标图像块中的每个编码单元的量化参数,将所述目标图像块的每个像素点所在编码单元的量化参数,确定为所述目标图像块的每个像素点的失真程度值,所述目标图像块是所述失真图片中的一失真图像块;
基于所述目标图像块中的各像素点的位置,使用所述获取的各像素点的失真程度值,生成所述目标图像块对应的边信息分量,其中,所述边信息分量包括的每个分量值与目标图像块上相同位置的像素点相对应。
18.如权利要求17所述的装置,其特征在于,所述滤波模块,还用于:
在所述数据类型用于表示一滤波器滤波的数据时,将所述目标图像块输入所述滤波器进行滤波处理,得到所述目标图像块对应的去失真图像块;或者,
在所述数据类型用于表示所述目标图像块时,将所述目标图像块确定为所述目标图像块对应的去失真图像块。
19.如权利要求17所述的装置,其特征在于,所述当前熵解码数据包括滤波标志图,所述滤波标志图包括所述失真图片中的各失真图像块对应的标志信息,失真图像块对应的标志信息用于标识所述失真图像块对应的数据类型;
所述确定模块,包括:
读取单元,用于根据目标图像块在所述失真图片中的位置,从所述滤波标志图中读取所述目标图像块对应的标志信息;
第一确定单元,用于根据所述标志信息确定所述目标图像块对应的数据类型。
20.如权利要求17所述的装置,其特征在于,所述当前熵解码数据包括所述原始视频图片中的各编码单元的位置和编码信息;
所述确定模块包括:
第二确定单元,用于根据所述目标图像块在所述失真图片中的位置和所述原始视频图片中的各编码单元的位置,确定所述目标图像块包括的各编码单元;
第三确定单元,用于根据所述目标图像块包括的各编码单元的编码信息,确定所述目标图像块对应的数据类型。
21.一种视频编码方法,其特征在于,所述方法包括:
获取失真图片包括的失真图像块,所述失真图片是对原始视频图片进行编码时生成的;
根据目标图像块包括的编码单元的编码信息,确定所述目标图像块对应的数据类型,所述目标图像块为所述失真图片中的任一失真图像块;
在所述数据类型用于表示卷积神经网络模型滤波的数据时,生成所述目标图像块对应的边信息分量,所述边信息分量表示所述目标图像块相对其在所述原始视频图片中对应的原始图像块的失真特征,所述边信息分量是根据至少一个量化参数或目标图像块中包括的各编码单元的编码信息获取得到的;
将所述目标图像块以及所述边信息分量输入卷积神经网络模型进行卷积滤波处理,得到所述目标图像块对应的去失真图像块,所述卷积神经网络模型为基于预设训练集进行训练得到的,所述预设训练集包括原始样本图片,所述原始样本图片对应的多个失真图片,以及每个所述原始样本图片对应的失真图片所对应的边信息分量;
根据所述失真图片中的失真图像块对应的去失真图像块,对所述当前原始视频图片之后的原始视频图片进行编码得到视频比特流;
其中,所述生成所述目标图像块对应的边信息分量包括:
针对待处理的目标图像块,获取所述目标图像块中的每个编码单元的量化参数,将所述目标图像块的每个像素点所在编码单元的量化参数,确定为所述目标图像块的每个像素点的失真程度值,所述目标图像块是所述失真图片中的一失真图像块;
基于所述目标图像块中的各像素点的位置,使用所述获取的各像素点的失真程度值,生成所述目标图像块对应的边信息分量,其中,所述边信息分量包括的每个分量值与目标图像块上相同位置的像素点相对应。
22.如权利要求21所述的方法,其特征在于,所述方法还包括:
在所述数据类型用于表示一滤波器滤波的数据时,将所述目标图像块输入所述滤波器进行滤波处理,得到所述目标图像块对应的去失真图像块;或者,
在所述数据类型用于表示所述目标图像块时,将所述目标图像块确定为所述目标图像块对应的去失真图像块。
23.一种视频编码装置,其特征在于,所述装置包括:
获取模块,用于获取失真图片包括的失真图像块,所述失真图片是对原始视频图片进行编码时生成的;
确定模块,用于根据目标图像块包括的编码单元的编码信息,确定所述目标图像块对应的数据类型,所述目标图像块为所述失真图片中的任一失真图像块;
生成模块,用于在所述数据类型用于表示卷积神经网络模型滤波的数据时,生成所述目标图像块对应的边信息分量,所述边信息分量表示所述目标图像块相对其在所述原始视频图片中对应的原始图像块的失真特征,所述边信息分量是根据至少一个量化参数或目标图像块中包括的各编码单元的编码信息获取得到的;
滤波模块,用于将所述目标图像块以及所述边信息分量输入卷积神经网络模型进行卷积滤波处理,得到所述目标图像块对应的去失真图像块,所述卷积神经网络模型为基于预设训练集进行训练得到的,所述预设训练集包括原始样本图片,所述原始样本图片对应的多个失真图片,以及每个所述原始样本图片对应的失真图片所对应的边信息分量;
编码模块,用于根据所述失真图片中的失真图像块对应的去失真图像块,对所述当前原始视频图片之后的原始视频图片进行编码得到视频比特流;
其中,所述生成所述目标图像块对应的边信息分量包括:
针对待处理的目标图像块,获取所述目标图像块中的每个编码单元的量化参数,将所述目标图像块的每个像素点所在编码单元的量化参数,确定为所述目标图像块的每个像素点的失真程度值,所述目标图像块是所述失真图片中的一失真图像块;
基于所述目标图像块中的各像素点的位置,使用所述获取的各像素点的失真程度值,生成所述目标图像块对应的边信息分量,其中,所述边信息分量包括的每个分量值与目标图像块上相同位置的像素点相对应。
24.如权利要求23所述的装置,其特征在于,所述滤波模块,还用于:
在所述数据类型用于表示一滤波器滤波的数据时,将所述目标图像块输入所述滤波器进行滤波处理,得到所述目标图像块对应的去失真图像块;或者,
在所述数据类型用于表示所述目标图像块时,将所述目标图像块确定为所述目标图像块对应的去失真图像块。
25.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质内存储有计算机程序,所述计算机程序被处理器执行时实现权利要求1-6任一所述的方法步骤或实现权利要求21或22所述的方法步骤。
26.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质内存储有计算机程序,所述计算机程序被处理器执行时实现权利要求7-10任一所述的方法步骤。
27.一种编解码***,其特征在于,所述***包括如权利要求11至16任一项所述的视频编码装置和如权利要求17至20任一项所述的视频解码装置;或者,
所述***包括如权利要求21或22所述的视频编码装置和如权利要求17至20任一项所述的视频解码装置。
CN201810050810.6A 2018-01-18 2018-01-18 一种视频编码方法、视频解码方法、装置、***及介质 Active CN110062226B (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN201810050810.6A CN110062226B (zh) 2018-01-18 2018-01-18 一种视频编码方法、视频解码方法、装置、***及介质
PCT/CN2019/072417 WO2019141258A1 (zh) 2018-01-18 2019-01-18 一种视频编码方法、视频解码方法、装置及***

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810050810.6A CN110062226B (zh) 2018-01-18 2018-01-18 一种视频编码方法、视频解码方法、装置、***及介质

Publications (2)

Publication Number Publication Date
CN110062226A CN110062226A (zh) 2019-07-26
CN110062226B true CN110062226B (zh) 2021-06-11

Family

ID=67301287

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810050810.6A Active CN110062226B (zh) 2018-01-18 2018-01-18 一种视频编码方法、视频解码方法、装置、***及介质

Country Status (2)

Country Link
CN (1) CN110062226B (zh)
WO (1) WO2019141258A1 (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113132755B (zh) * 2019-12-31 2022-04-01 北京大学 可扩展人机协同图像编码方法及***、解码器训练方法

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2017036370A1 (en) * 2015-09-03 2017-03-09 Mediatek Inc. Method and apparatus of neural network based processing in video coding

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2788811B2 (ja) * 1992-01-10 1998-08-20 シャープ株式会社 ブロック歪補正器
KR101860606B1 (ko) * 2011-06-30 2018-05-23 미쓰비시덴키 가부시키가이샤 화상 부호화 장치, 화상 복호 장치, 화상 부호화 방법, 화상 복호 방법 및 기억 매체
CN108932697B (zh) * 2017-05-26 2020-01-17 杭州海康威视数字技术股份有限公司 一种失真图像的去失真方法、装置及电子设备
CN107197260B (zh) * 2017-06-12 2019-09-13 清华大学深圳研究生院 基于卷积神经网络的视频编码后置滤波方法
CN109120937B (zh) * 2017-06-26 2020-03-27 杭州海康威视数字技术股份有限公司 一种视频编码方法、解码方法、装置及电子设备
CN109151475B (zh) * 2017-06-27 2020-03-27 杭州海康威视数字技术股份有限公司 一种视频编码方法、解码方法、装置及电子设备

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2017036370A1 (en) * 2015-09-03 2017-03-09 Mediatek Inc. Method and apparatus of neural network based processing in video coding

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
A Convolutional Neural Network Approach for Post-Processing in HEVC Intra Coding;Dai Y等;《MultiMedia Modeling 23rd International Conference》;20170106;第28-38页 *
Spatial-temporal residue network based in-loop filter for video coding;Chuanmin Jia;《arXiv》;20171225;第II节-第IV节 *

Also Published As

Publication number Publication date
CN110062226A (zh) 2019-07-26
WO2019141258A1 (zh) 2019-07-25

Similar Documents

Publication Publication Date Title
CN108305236B (zh) 图像增强处理方法及装置
CN110502954B (zh) 视频分析的方法和装置
CN108810538B (zh) 视频编码方法、装置、终端及存储介质
CN112449192B (zh) 解码方法、编码方法及装置
EP3787291B1 (en) Method and device for video encoding, storage medium, and equipment
CN110062246B (zh) 对视频帧数据进行处理的方法和装置
CN110933334B (zh) 视频降噪方法、装置、终端及存储介质
CN111107357B (zh) 一种图像处理的方法、装置、***及存储介质
CN114170349A (zh) 图像生成方法、装置、电子设备及存储介质
CN111586413B (zh) 视频调整方法、装置、计算机设备及存储介质
CN110991457A (zh) 二维码处理方法、装置、电子设备及存储介质
CN110572710B (zh) 视频生成方法、装置、设备及存储介质
CN113891074B (zh) 视频编码方法和装置、电子装置和计算机可读存储介质
CN110062226B (zh) 一种视频编码方法、视频解码方法、装置、***及介质
CN115205164B (zh) 图像处理模型的训练方法、视频处理方法、装置及设备
CN113822955B (zh) 图像数据处理方法、装置、计算机设备及存储介质
CN111698512B (zh) 视频处理方法、装置、设备及存储介质
CN115330610A (zh) 图像处理方法、装置、电子设备以及存储介质
CN110460856B (zh) 视频编码方法、装置、编码设备及计算机可读存储介质
CN110062225B (zh) 一种图片滤波的方法及装置
CN109040753B (zh) 预测模式选择方法、装置及存储介质
CN113379624B (zh) 图像生成方法、图像生成模型的训练方法、装置及设备
CN113079372B (zh) 帧间预测的编码方法、装置、设备及可读存储介质
CN111353934B (zh) 一种视频合成的方法及装置
CN114900704A (zh) 视频处理方法、装置、电子设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant