CN113329227A - 视频编码方法、装置、电子设备与计算机可读介质 - Google Patents

视频编码方法、装置、电子设备与计算机可读介质 Download PDF

Info

Publication number
CN113329227A
CN113329227A CN202110586023.5A CN202110586023A CN113329227A CN 113329227 A CN113329227 A CN 113329227A CN 202110586023 A CN202110586023 A CN 202110586023A CN 113329227 A CN113329227 A CN 113329227A
Authority
CN
China
Prior art keywords
differential
video
frame
region
sub
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110586023.5A
Other languages
English (en)
Inventor
池毅韬
张平
陈金
侯光华
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tianyi Cloud Technology Co Ltd
Original Assignee
China Telecom Corp Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Telecom Corp Ltd filed Critical China Telecom Corp Ltd
Priority to CN202110586023.5A priority Critical patent/CN113329227A/zh
Publication of CN113329227A publication Critical patent/CN113329227A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/30Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/85Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

本公开提供一种视频编码方法、装置、电子设备与计算机可读介质。其中,视频编码方法包括:对视频帧组进行差分处理,以生成差分序列;根据所述差分序列确定所述视频帧组的差分子区域和非差分子区域;对所述视频帧组中的任一帧的差分子区域和非差分子区域分别进行编码传输。通过本公开的实施例,在保证了视频帧的图像质量的前提下,降低了传输视频帧的传输带宽,节省了网络带宽。

Description

视频编码方法、装置、电子设备与计算机可读介质
技术领域
本公开涉及编码技术领域,具体而言,涉及一种视频编码方法、装置、电子设备与计算机可读介质。
背景技术
目前,高清视频通常具有很高的分辨率,其分辨率的宽高都在数千的数量级上,原始数据的体积也很大。如何在保证视频质量的前提下对视频进行高效的压缩,是编码领域持续的课题。
在相关技术中,当前最具代表性和最广泛使用的视频编解码器是基于H264/H265标准的编解码器。H264在编解码的使用中已经经过了很长一段时期,其良好的性能和压缩质量,受到业界的推崇。
H265的视频压缩标准比H264有了较大的进步。H265是基于分片(Tile)的编码器,并且视频压缩单元是可变的。也就是说,一个W×H分辨率的原始视频图像序列,可以划分成wc×hc个相同大小块。其中,W和H代表原始视频的宽和高的像素数,wc和hc分别是横向方向和纵向方向的划分数量。这里横向是指宽的方向,纵向是指高的方向,在每个视频图像序列中,原始图像的尺寸表示为(W/wc)×(H/hc),多个块是可以并行进行编码的。
但是,现有的视频编码方案至少存在以下技术问题:
(1)H264的划分块是固定的,而且只能基于整帧为单位进行编解码。也就是说,必须对整个视频帧的序列进行编解码,才可以输出编码后的视频流,用与播放或者传输。对于帧内数据来说,是一个串行的过程,这就导致了现有的基于H264的编码方式对传输带宽的要求高。
(2)虽然H265在编码上是基于分片的,但其具有较大的冗余数据,仍然是基于关键帧技术的一种编码方式,也就是说,在压缩后的分片视频流中,每隔一段时间间隔,就会出现一个占较大体积的关键帧。由于分片中关键帧的存在,使得视频压缩在窄带情况下,无法呈现出完整的视频图像。
需要说明的是,在上述背景技术部分公开的信息仅用于加强对本公开的背景的理解,因此可以包括不构成对本领域普通技术人员已知的现有技术的信息。
发明内容
本公开的目的在于提供一种视频编码方法、装置、电子设备与计算机可读介质,用于至少在一定程度上克服由于相关技术的限制和缺陷而导致的浪费传输带宽的问题。
根据本公开实施例的第一方面,提供一种视频编码方法,包括:对视频帧组进行差分处理,以生成差分序列;根据所述差分序列确定所述视频帧组的差分子区域和非差分子区域;对所述视频帧组中的任一帧的差分子区域和非差分子区域分别进行编码传输。
在本公开的一种示例性实施例中,对视频帧组进行差分处理,以生成差分序列包括:对任一所述视频帧组内的任两个相邻帧进行前后差分处理,以得到所述差分序列,所述前后差分处理包括后一时刻的帧与前一时刻的帧作差的处理。
在本公开的一种示例性实施例中,根据所述差分序列确定所述视频帧组的差分子区域和非差分子区域包括:对所述差分序列中像素不为零的图像区域进行合并,合并后得到所述非零连通区域;对每个所述非零连通区域生成外接边框;将所述外接边框围合的区域确定为所述非零子区域;将所述视频帧组中除所述非零子区域以外的区域确定为所述非差分子区域。
在本公开的一种示例性实施例中,对所述视频帧组中的任一帧的差分子区域和非差分子区域分别进行编码传输包括:采用第一编码对所述视频帧组中的任一帧的差分子区域进行编码;将经第一编码后的图像信息传输至文件流。
在本公开的一种示例性实施例中,对所述视频帧组中的任一帧的差分子区域和非差分子区域分别进行编码传输还包括:确定所述视频帧组中的至少一个帧的非差分子区域;将所述非差分子区域对应的区域确定为静止图像区域;采用第二编码对所述静止图像区域进行编码;将第二编码后的图像信息确定为所述视频帧组中的任一帧的非差分子区域的编码信息;将第二编码后的图像信息传输至所述文件流;在所述文件流中,根据帧的标识信息属于同一帧的第一编码的图像信息与第二编码的图像信息进行合成。
在本公开的一种示例性实施例中,在对视频帧组进行差分处理前,还包括:确定获取视频流文件,所述视频流文件中的帧按照时间排序;按照预设帧组长度将所述视频流文件进行分组,以生成所述视频帧组。
在本公开的一种示例性实施例中,所述第一编码为H264、H265、AV1、HEVC、vp8和vp9中的至少一种,和/或,所述第二编码为H264、H265、AV1、HEVC、vp8和vp9中的至少一种。
根据本公开实施例的第二方面,提供一种视频编码装置,包括:差分模块,用于对视频帧组进行差分处理,以生成差分序列;确定模块,用于根据所述差分序列确定所述视频帧组的差分子区域和非差分子区域;编码模块,用于对所述视频帧组中的任一帧的差分子区域和非差分子区域分别进行编码传输。
根据本公开的第三方面,提供一种电子设备,包括:存储器;以及耦合到所述存储器的处理器,所述处理器被配置为基于存储在所述存储器中的指令,执行如上述任意一项所述的方法。
根据本公开的第四方面,提供一种计算机可读存储介质,其上存储有程序,该程序被处理器执行时实现如上述任意一项所述的视频编码方法。
本公开实施例,通过差分处理确定视频帧组中的每一帧的差分子区域和非差分子区域,并采用不同的编码方式对差分子区域和非差分子区域进行编码和传输,在保证编码后的图像的像素质量的前提下,降低了对传输带宽的要求,节省了传输带宽。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理。显而易见地,下面描述中的附图仅仅是本公开的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本公开的一个示例性实施例中视频编码方法的流程图;
图2是本公开的另一个示例性实施例中视频编码方法的流程图;
图3是本公开的另一个示例性实施例中视频编码方法的流程图;
图4是本公开的另一个示例性实施例中视频编码方法的流程图;
图5是本公开的另一个示例性实施例中视频编码方法的流程图;
图6是本公开的另一个示例性实施例中视频编码方法的流程图;
图7是本公开的一个示例性实施例中视频编码方案的帧处理的示意图;
图8是本公开的另一个示例性实施例中视频编码方案的帧处理的示意图;
图9是本公开的另一个示例性实施例中视频编码方案的帧处理的示意图;
图10是本公开示例性实施例中一种视频编码装置的方框图;
图11是本公开示例性实施例中一种电子设备的方框图。
具体实施方式
现在将参考附图更全面地描述示例实施方式。然而,示例实施方式能够以多种形式实施,且不应被理解为限于在此阐述的范例;相反,提供这些实施方式使得本公开将更加全面和完整,并将示例实施方式的构思全面地传达给本领域的技术人员。所描述的特征、结构或特性可以以任何合适的方式结合在一个或更多实施方式中。在下面的描述中,提供许多具体细节从而给出对本公开的实施方式的充分理解。然而,本领域技术人员将意识到,可以实践本公开的技术方案而省略所述特定细节中的一个或更多,或者可以采用其它的方法、组元、装置、步骤等。在其它情况下,不详细示出或描述公知技术方案以避免喧宾夺主而使得本公开的各方面变得模糊。
此外,附图仅为本公开的示意性图解,图中相同的附图标记表示相同或类似的部分,因而将省略对它们的重复描述。附图中所示的一些方框图是功能实体,不一定必须与物理或逻辑上独立的实体相对应。可以采用软件形式来实现这些功能实体,或在一个或多个硬件模块或集成电路中实现这些功能实体,或在不同网络和/或处理器装置和/或微控制器装置中实现这些功能实体。
下面结合附图对本公开示例实施方式进行详细说明。
图1是本公开示例性实施例中视频编码方法的流程图。
参考图1,视频编码方法可以包括:
步骤S102,对视频帧组进行差分处理,以生成差分序列。
在本公开的一种示例性实施例中,若视频帧组包括n帧图像,且采用前后差分进行处理,则差分序列包括n-1个差分图像。其中,n为大于或等于2的整数。
步骤S104,根据所述差分序列确定所述视频帧组的差分子区域和非差分子区域。
在本公开的一种示例性实施例中,对于视频帧组而言,非差分子区域包括静态图像的区域,视频帧组内的所有帧在非差分子区域内的像素变化为零,可以采用静态图像的编码方式进行编码传输,而差分子区域是用于确定视频帧组内像素动态变化的区域,对于此区域需要较高带宽进行完全编码。
步骤S106,对所述视频帧组中的任一帧的差分子区域和非差分子区域分别进行编码传输。
在本公开的一种示例性实施例中,通过差分处理确定视频帧组中的每一帧的差分子区域和非差分子区域,并采用不同的编码方式对差分子区域和非差分子区域进行编码和传输,在保证编码后的图像的像素质量的前提下,降低了对传输带宽的要求,节省了传输带宽。
在本公开的一种示例性实施例中,首先,确定视频帧组内的帧图像的差分子区域进行掩码后,其次,对至少一个帧图像进行编码传输。若采用多个掩码后的帧图像,则对帧图像进行均分、均值或加权等处理,提高了非差分子区域编码的质量、准确性和可靠性。
在本公开的一种示例性实施例中,在完成对视频帧组的掩码编码后,可以仅传输视频帧组内的一帧的编码信息,降低了视频编码对传输带宽的占用。
在本公开的一种示例性实施例中,动态变化的非零像素区域通常为不规则形状,将非零像素区域进行矩形定界处理,矩形定界处理的矩形边界与帧图像的边界平行,矩形定界确定的差分子区域不仅包括非零像素区域,还包括靠近非零边界区域的零像素区域。
下面,结合图2至图6对视频编码方法的各步骤进行详细说明。
如图2所示,对视频帧组进行差分处理,以生成差分序列包括:
步骤S2022,对任一所述视频帧组内的任两个相邻帧进行前后差分处理,以得到所述差分序列,所述前后差分处理包括后一时刻的帧与前一时刻的帧作差的处理。
在本公开的一种示例性实施例中,通过对任一所述视频帧组内的任两个相邻帧进行前后差分处理,确定了帧图像中的动态变化的区域,基于此,形成的差分序列中包括视频帧组中所有动态变化的像素信息。
如图3所示,根据所述差分序列确定所述视频帧组的差分子区域和非差分子区域包括:
步骤S3022,对所述差分序列中像素不为零的图像区域进行合并,合并后得到所述非零连通区域。
步骤S3024,对每个所述非零连通区域生成外接边框。
步骤S3026,将所述外接边框围合的区域确定为所述非零子区域。
步骤S3028,将所述视频帧组中除所述非零子区域以外的区域确定为所述非差分子区域。
在本公开的一种示例性实施例中,通过矩形定界的方式确定每个非零连通区域的的外接边框,并将外接边框围合的区域确定为非零子区域,进而确定了视频帧组的动态变化的像素区域。
在本公开的一种示例性实施例中,若存在多个非零连通区域,则为每个非零连通区域确定外接边框,不仅有利于更准确地确定动态变化的像素区域,也有利于尽可能地提高非差分子区域的面积,进而有利于进一步地降低编码的信息量,进而降低了对传输带宽的要求,减少了对传输带宽的浪费。
如图4所示,对所述视频帧组中的任一帧的差分子区域和非差分子区域分别进行编码传输包括:
步骤S4022,采用第一编码对所述视频帧组中的任一帧的差分子区域进行编码。
步骤S4024,将经第一编码后的图像信息传输至文件流。
在本公开的一种示例性实施例中,视频帧组中的所有帧的差分子区域是相同的,通过对差分子区域进行完全编码,保证了视频图像的编码质量,降低了编码过程导致的视频质量的下降。
如图5所示,对所述视频帧组中的任一帧的差分子区域和非差分子区域分别进行编码传输还包括:
步骤S502,确定所述视频帧组中的至少一个帧的非差分子区域。
在本公开的一种示例性实施例中,视频帧组的所有帧的非差分子区域也是相同的,采用一个帧的非差分子区域进行编码,即相当于完成了所有帧的非差分子区域的编码。
步骤S504,将所述非差分子区域对应的区域确定为静止图像区域。
步骤S506,采用第二编码对所述静止图像区域进行编码。
步骤S508,将第二编码后的图像信息确定为所述视频帧组中的任一帧的非差分子区域的编码信息。
步骤S510,将第二编码后的图像信息传输至所述文件流。
步骤S512,在所述文件流中,根据帧的标识信息属于同一帧的第一编码的图像信息与第二编码的图像信息进行合成。
在本公开的一种示例性实施例中,在所述文件流中包括一个非差分子区域的编码信息和每一帧的差分子区域的编码信息,仅需要对非差分子区域进行一次解码即可,进一步地,按照帧的标识信息来完成第一编码的图像信息与第二编码的图像信息的合成,不仅降低了对传输带宽的要求,节省了传输带宽,也提高了解码的效率。
如图6所示,在对视频帧组进行差分处理前,还包括:
步骤S602,确定获取视频流文件,所述视频流文件中的帧按照时间排序。
在本公开的一种示例性实施例中,通过获取视频流文件,且视频流文件中的帧按照时间排序,进而得到了连续的视频帧组,基于此,划分的非差分子区域和差分子区域能更准确地反映图像像素的动态变化。
步骤S604,按照预设帧组长度将所述视频流文件进行分组,以生成所述视频帧组。
在本公开的一种示例性实施例中,预设帧组长度可以为帧的数量和连续帧的时间长度。
在本公开的一种示例性实施例中,所述第一编码为H264、H265、AV1、HEVC、vp8和vp9中的至少一种,和/或,所述第二编码为H264、H265、AV1、HEVC、vp8和vp9中的至少一种。
在本公开的一种示例性实施例中,H264有8个预测方向+1个平均值,一共9个预测。
在本公开的一种示例性实施例中,H265对比较平坦的图像使用16×16的大小的宏块,但是为了更高的压缩率,还可以在16×16的宏块上划分出更小的子块,子块的大小可以是8×16、16×8、8×8、4×8、8×4和4×4中的任一种,非常的灵活。子块就是在16×16的标准宏块内进一步划分出更小的宏块。
在本公开的一种示例性实施例中,AV1(Alliance for Open Media Video 1)是由AOM(Alliance for Open Media,开放媒体联盟)制定的一个开源、免版权费的视频编码格式,编码效率高于V9,AV1不仅将分区树扩展为10种结构,还将最大的分块尺寸(在VP9/AV1中称为superblock)增大至128×128。
在本公开的一种示例性实施例中,VP9的分区树有4种分块方式,从最大的64×64开始,一直到4×4层,对于8×8及以下的分块则有一些额外的限制,VP9支持10种帧内预测模式,其中8种方向模式,角度45-207度,2个非方向预测模式:DC和true motionTM模式。AV1,潜在的帧内编码进一步探索了不同的方法:方向预测的粒度进一步升级,而非方向性的预测,纳入了梯度和相关性,亮度的一致性和色度信号也得到充分利用,并开发出针对人造视频内容特殊优化的工具。
在本公开的一种示例性实施例中,V8(Voukoder)是一款输出编码插件,它可以让Pr直接导出更多的编码格式,可以直接使用x264编码器进行编码,甚至可以使用显卡加速。V8可以直接输出一个高画质且低码率的视频,不用先导出再进行二次压制了,既高效又保证了画质。
在本公开的一种示例性实施例中,HEVC(High Efficiency Video Coding的缩写,是一种新的视频压缩标准)用来以替代H.264/AVC编码标准。HEVC设立了GOP(Group ofPictures,画面组)的3种编码结构,即帧内编码、低延时编码和随机访问编码。在帧内编码结构中,每一帧图像都是按帧内方式进行空间域预测编码,不使用时间参考帧。在低时延(LowDelay)编码结构中,只有第一帧图像按照帧内方式进行编码,并成为IDR(Instantaneous Decoding Refresh,即时解码刷新)帧,随后的各帧都作为一般的P帧和B帧进行编码。这主要是为交互式实时通信设计的。随机访问(Random Access)编码结构主要由分级B帧构成,周期性地(大约每隔1秒)***随机访问(Clean Random Access,CRA)帧。这些CRA帧成为编码视频流中的随机访问点(Random Access Point,RAP)。所谓随机访问点是指对这些帧的解码可以独立进行,不需要参考比特流中前面已经解码的图像帧。这种对随机访问方式有力地支持了信道转换、搜索以及动态流媒体服务等应用。
如图7、图8和图9所示,视频编码方案的帧处理过程包括以下四个阶段:
(1)原始视频流按帧组切块。
(2)视频序列差分检测。
(3)差分子区域选定。
(4)各子区域视频编码。
第一步,如图7所示,将原始视频流按连续帧组切块。这里的原始视频是由一系列RGB图像组成的连续帧组702,假设连续帧组702包含n帧图像。这里连续帧组是指,按照某一时间间隔进行采样的得到的帧序列。
在本公开的一个实施例中,原始视频是按照40ms/帧进行采样的,那么一秒钟包含的连续帧组中包含的帧数就是1000ms/40ms=25帧。
在本公开的一个实施例中,连续帧组可按照两种方法进行选择,一种是以采样间隔为单位,选择某一段固定时长内的连续帧,另一种是直接按照帧数选择,比如连续的100帧图像等等。
第二步,如图7所示,对连续帧组进行差分处理,得到差分帧组704,差分帧组704中包含n-1帧图像,差分帧组即上文提到的差分序列的一种实施例。
对于第一步中选取的帧组,重要的一环就是视频差分检测过程,差分检测过程也分多个步骤如下:
(a)首先是帧组内做前后帧的差分。这里假设连续帧组702内包含n帧图像。前后帧做差分的含义是,假设从前到后的帧的编号为0,1,……,(n-1),那么第1帧减去第0帧,第2帧减去第1帧,……,第(n-1)帧减去第(n-2)帧,得到(n-1)个差分图像组成的差分帧组704。
(b)其次是筛选差分帧组704中需要编码的区域。简单来说,就是合并差分帧组704中不为0的图像区域。所谓差分帧组704中为0的图像区域,即前后帧相同的像素部分,可以按照静态图像的方式进行处理。
如图8所示,对差分帧组中的第一差分图像802和第二差分图像804进行合并,得到包括合并后的差分子区域的动态变化帧806。斜纹填充的区域为非0像素区域,白色的区域即为像素值为0的区域。对于产生于某个连续帧组的两幅差分图像来说,要其进行区域合并,如箭头右侧所示的黑色区域,即将两幅图像合并后的需要进行进一步编码的区域。根据上述的计算过程,可以将一系列的差分图像合并,即求出各个差分区域中不为零区域的并集区域,得到要编码的差分子区域。这个区域很有可能是不规则的区域。
第三步,对于合并得到的不规则区域,进行选定用于后续的编码过程。
如图9所示,示例图像902是一组视频帧组904的差分序列合并后得到的结果,斜纹区域即为不为0的像素区域,示例图像902中包括第一连通差分子区域9022和第二连通差分子区域9024。对于每一个不规则的连通差分子区域,都选其对应的外接矩形9062。每一个各自独立的连通子区域,都求出其对应的外接矩形。对于每一组视频帧,记录下矩形的位置及宽高信息。
第四步,对各子区域分别进行编码,本公开的实施例中并不指定具体的子区域的编码方案,即每个子区域中的编码方案可以选择H264/H265,也可以是其他的编码方案,如AV1、vp8和vp9等。
如图9所示,各个子区域编码的过程包括:对于每一组连续帧数据来说,差分子区域908是需要完全编码的;而连续图像中其他部分,因为没有产生变化,所以采样传送一帧或几帧即可。一种可行的传输方案是,选择连续帧组的某一幅图像,可以是第一幅,也可以是中间一幅;在待编码图像906的差分子区域908上,通过生成掩码矩阵9062的方式,将这些差分子区域908进行屏蔽。对差分子区域908进行完整编码,而非差分子区域9064只是静态图片过程,再将两部分输出到文件流。至此,就完成了一个连续的视频帧组的编码构建过程。
本公开的上述实施例,通过差分子区域和非差分子区域的选择,尽可能地减少了编码区域,减少了计算量,同时也减少了带宽消耗,另外,也降低了视频解码的工作量。
对应于上述方法实施例,本公开还提供一种视频编码装置,可以用于执行上述方法实施例。
图10是本公开示例性实施例中一种视频编码装置的方框图。
参考图10,视频编码装置1000可以包括:
差分模块1002,用于对视频帧组进行差分处理,以生成差分序列。
确定模块1004,用于根据所述差分序列确定所述视频帧组的差分子区域和非差分子区域。
编码模块1006,用于对所述视频帧组中的任一帧的差分子区域和非差分子区域分别进行编码传输。
在本公开的一种示例性实施例中,差分模块1002还用于:对任一所述视频帧组内的任两个相邻帧进行前后差分处理,以得到所述差分序列,所述前后差分处理包括后一时刻的帧与前一时刻的帧作差的处理。
在本公开的一种示例性实施例中,确定模块1004还用于:对所述差分序列中像素不为零的图像区域进行合并,合并后得到所述非零连通区域;对每个所述非零连通区域生成外接边框;将所述外接边框围合的区域确定为所述非零子区域;将所述视频帧组中除所述非零子区域以外的区域确定为所述非差分子区域。
在本公开的一种示例性实施例中,编码模块1006还用于:采用第一编码对所述视频帧组中的任一帧的差分子区域进行编码;将经第一编码后的图像信息传输至文件流。
在本公开的一种示例性实施例中,编码模块1006还用于:确定所述视频帧组中的至少一个帧的非差分子区域;将所述非差分子区域对应的区域确定为静止图像区域;采用第二编码对所述静止图像区域进行编码;将第二编码后的图像信息确定为所述视频帧组中的任一帧的非差分子区域的编码信息;将第二编码后的图像信息传输至所述文件流;在所述文件流中,根据帧的标识信息属于同一帧的第一编码的图像信息与第二编码的图像信息进行合成。
在本公开的一种示例性实施例中,确定模块1004还用于:确定获取视频流文件,所述视频流文件中的帧按照时间排序;按照预设帧组长度将所述视频流文件进行分组,以生成所述视频帧组。
在本公开的一种示例性实施例中,所述第一编码为H264、H265、AV1、HEVC、vp8和vp9中的至少一种,和/或,所述第二编码为H264、H265、AV1、HEVC、vp8和vp9中的至少一种。
由于装置1000的各功能已在其对应的方法实施例中予以详细说明,本公开于此不再赘述。
应当注意,尽管在上文详细描述中提及了用于动作执行的设备的若干模块或者单元,但是这种划分并非强制性的。实际上,根据本公开的实施方式,上文描述的两个或更多模块或者单元的特征和功能可以在一个模块或者单元中具体化。反之,上文描述的一个模块或者单元的特征和功能可以进一步划分为由多个模块或者单元来具体化。
在本公开的示例性实施例中,还提供了一种能够实现上述方法的电子设备。
所属技术领域的技术人员能够理解,本发明的各个方面可以实现为***、方法或程序产品。因此,本发明的各个方面可以具体实现为以下形式,即:完全的硬件实施方式、完全的软件实施方式(包括固件、微代码等),或硬件和软件方面结合的实施方式,这里可以统称为“电路”、“模块”或“***”。
下面参照图11来描述根据本发明的这种实施方式的电子设备1100。图11显示的电子设备1100仅仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。
如图11所示,电子设备1100以通用计算设备的形式表现。电子设备1100的组件可以包括但不限于:上述至少一个处理单元1110、上述至少一个存储单元1120、连接不同***组件(包括存储单元1120和处理单元1110)的总线1130。
其中,所述存储单元存储有程序代码,所述程序代码可以被所述处理单元1110执行,使得所述处理单元1110执行本说明书上述“示例性方法”部分中描述的根据本发明各种示例性实施方式的步骤。例如,所述处理单元1110可以执行如本公开实施例所示的方法。
存储单元1120可以包括易失性存储单元形式的可读介质,例如随机存取存储单元(RAM)11201和/或高速缓存存储单元11202,还可以进一步包括只读存储单元(ROM)11203。
存储单元1120还可以包括具有一组(至少一个)程序模块11205的程序/实用工具11204,这样的程序模块11205包括但不限于:操作***、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。
总线1130可以为表示几类总线结构中的一种或多种,包括存储单元总线或者存储单元控制器、***总线、图形加速端口、处理单元或者使用多种总线结构中的任意总线结构的局域总线。
电子设备1100也可以与一个或多个外部设备1140(例如键盘、指向设备、蓝牙设备等)通信,还可与一个或者多个使得用户能与该电子设备1100交互的设备通信,和/或与使得该电子设备1100能与一个或多个其它计算设备进行通信的任何设备(例如路由器、调制解调器等等)通信。这种通信可以通过输入/输出(I/O)接口1150进行。并且,电子设备1100还可以通过网络适配器1160与一个或者多个网络(例如局域网(LAN),广域网(WAN)和/或公共网络,例如因特网)通信。如图所示,网络适配器1160通过总线1130与电子设备1100的其它模块通信。应当明白,尽管图中未示出,可以结合电子设备1100使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、RAID***、磁带驱动器以及数据备份存储***等。
通过以上的实施方式的描述,本领域的技术人员易于理解,这里描述的示例实施方式可以通过软件实现,也可以通过软件结合必要的硬件的方式来实现。因此,根据本公开实施方式的技术方案可以以软件产品的形式体现出来,该软件产品可以存储在一个非易失性存储介质(可以是CD-ROM,U盘,移动硬盘等)中或网络上,包括若干指令以使得一台计算设备(可以是个人计算机、服务器、终端装置、或者网络设备等)执行根据本公开实施方式的方法。
在本公开的示例性实施例中,还提供了一种计算机可读存储介质,其上存储有能够实现本说明书上述方法的程序产品。在一些可能的实施方式中,本发明的各个方面还可以实现为一种程序产品的形式,其包括程序代码,当所述程序产品在终端设备上运行时,所述程序代码用于使所述终端设备执行本说明书上述“示例性方法”部分中描述的根据本发明各种示例性实施方式的步骤。
根据本发明的实施方式的用于实现上述方法的程序产品可以采用便携式紧凑盘只读存储器(CD-ROM)并包括程序代码,并可以在终端设备,例如个人电脑上运行。然而,本发明的程序产品不限于此,在本文件中,可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行***、装置或者器件使用或者与其结合使用。
所述程序产品可以采用一个或多个可读介质的任意组合。可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以为但不限于电、磁、光、电磁、红外线、或半导体的***、装置或器件,或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。
计算机可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了可读程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。可读信号介质还可以是可读存储介质以外的任何可读介质,该可读介质可以发送、传播或者传输用于由指令执行***、装置或者器件使用或者与其结合使用的程序。
可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于无线、有线、光缆、RF等等,或者上述的任意合适的组合。
可以以一种或多种程序设计语言的任意组合来编写用于执行本发明操作的程序代码,所述程序设计语言包括面向对象的程序设计语言—诸如Java、C++等,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户计算设备上部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。在涉及远程计算设备的情形中,远程计算设备可以通过任意种类的网络,包括局域网(LAN)或广域网(WAN),连接到用户计算设备,或者,可以连接到外部计算设备(例如利用因特网服务提供商来通过因特网连接)。
此外,上述附图仅是根据本发明示例性实施例的方法所包括的处理的示意性说明,而不是限制目的。易于理解,上述附图所示的处理并不表明或限制这些处理的时间顺序。另外,也易于理解,这些处理可以是例如在多个模块中同步或异步执行的。
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本公开的其它实施方案。本申请旨在涵盖本公开的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本公开的真正范围和构思由权利要求指出。

Claims (10)

1.一种视频编码方法,其特征在于,包括:
对视频帧组进行差分处理,以生成差分序列;
根据所述差分序列确定所述视频帧组的差分子区域和非差分子区域;
对所述视频帧组中的任一帧的差分子区域和非差分子区域分别进行编码传输。
2.如权利要求1所述的视频编码方法,其特征在于,对视频帧组进行差分处理,以生成差分序列包括:
对任一所述视频帧组内的任两个相邻帧进行前后差分处理,以得到所述差分序列,所述前后差分处理包括后一时刻的帧与前一时刻的帧作差的处理。
3.如权利要求1所述的视频编码方法,其特征在于,根据所述差分序列确定所述视频帧组的差分子区域和非差分子区域包括:
对所述差分序列中像素不为零的图像区域进行合并,合并后得到所述非零连通区域;
对每个所述非零连通区域生成外接边框;
将所述外接边框围合的区域确定为所述非零子区域;
将所述视频帧组中除所述非零子区域以外的区域确定为所述非差分子区域。
4.如权利要求1所述的视频编码方法,其特征在于,对所述视频帧组中的任一帧的差分子区域和非差分子区域分别进行编码传输包括:
采用第一编码对所述视频帧组中的任一帧的差分子区域进行编码;
将经第一编码后的图像信息传输至文件流。
5.如权利要求4所述的视频编码方法,其特征在于,对所述视频帧组中的任一帧的差分子区域和非差分子区域分别进行编码传输还包括:
确定所述视频帧组中的至少一个帧的非差分子区域;
将所述非差分子区域对应的区域确定为静止图像区域;
采用第二编码对所述静止图像区域进行编码;
将第二编码后的图像信息确定为所述视频帧组中的任一帧的非差分子区域的编码信息;
将第二编码后的图像信息传输至所述文件流;
在所述文件流中,根据帧的标识信息属于同一帧的第一编码的图像信息与第二编码的图像信息进行合成。
6.如权利要求1-5中任一项所述的视频编码方法,其特征在于,在对视频帧组进行差分处理前,还包括:
确定获取视频流文件,所述视频流文件中的帧按照时间排序;
按照预设帧组长度将所述视频流文件进行分组,以生成所述视频帧组。
7.如权利要求5所述的视频编码方法,其特征在于,
所述第一编码为H264、H265、AV1、HEVC、vp8和vp9中的至少一种,和/或,所述第二编码为H264、H265、AV1、HEVC、vp8和vp9中的至少一种。
8.一种视频编码装置,其特征在于,包括:
差分模块,用于对视频帧组进行差分处理,以生成差分序列;
确定模块,用于根据所述差分序列确定所述视频帧组的差分子区域和非差分子区域;
编码模块,用于对所述视频帧组中的任一帧的差分子区域和非差分子区域分别进行编码传输。
9.一种电子设备,其特征在于,包括:
存储器;以及
耦合到所述存储器的处理器,所述处理器被配置为基于存储在所述存储器中的指令,执行如权利要求1-7任一项所述的视频编码方法。
10.一种计算机可读存储介质,其上存储有程序,该程序被处理器执行时实现如权利要求1-7任一项所述的视频编码方法。
CN202110586023.5A 2021-05-27 2021-05-27 视频编码方法、装置、电子设备与计算机可读介质 Pending CN113329227A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110586023.5A CN113329227A (zh) 2021-05-27 2021-05-27 视频编码方法、装置、电子设备与计算机可读介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110586023.5A CN113329227A (zh) 2021-05-27 2021-05-27 视频编码方法、装置、电子设备与计算机可读介质

Publications (1)

Publication Number Publication Date
CN113329227A true CN113329227A (zh) 2021-08-31

Family

ID=77421738

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110586023.5A Pending CN113329227A (zh) 2021-05-27 2021-05-27 视频编码方法、装置、电子设备与计算机可读介质

Country Status (1)

Country Link
CN (1) CN113329227A (zh)

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101860757A (zh) * 2010-06-03 2010-10-13 无锡中星微电子有限公司 智能监控***及其图像编解码方法
CN102163361A (zh) * 2011-05-16 2011-08-24 公安部沈阳消防研究所 一种基于前景累积图像的图像型火灾探测方法
CN102162667A (zh) * 2010-02-24 2011-08-24 株式会社东芝 图像处理装置、图像处理方法及空调控制装置
CN102487443A (zh) * 2010-12-03 2012-06-06 奇扬网科股份有限公司 荧幕画面的编码方法及其应用的电子装置
CN102970528A (zh) * 2012-12-28 2013-03-13 北京航空航天大学 基于变化检测和帧差累积的视频对象分割方法
CN103747257A (zh) * 2013-12-05 2014-04-23 中国科学技术大学 一种视频数据高效编码的方法
CN104113754A (zh) * 2014-07-17 2014-10-22 四川大学 基于时域相关性的高性能视频帧间编码方法及其转码器
CN107454395A (zh) * 2017-08-23 2017-12-08 上海安威士科技股份有限公司 一种高清网络摄像机及智能码流控制方法

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102162667A (zh) * 2010-02-24 2011-08-24 株式会社东芝 图像处理装置、图像处理方法及空调控制装置
CN101860757A (zh) * 2010-06-03 2010-10-13 无锡中星微电子有限公司 智能监控***及其图像编解码方法
CN102487443A (zh) * 2010-12-03 2012-06-06 奇扬网科股份有限公司 荧幕画面的编码方法及其应用的电子装置
CN102163361A (zh) * 2011-05-16 2011-08-24 公安部沈阳消防研究所 一种基于前景累积图像的图像型火灾探测方法
CN102970528A (zh) * 2012-12-28 2013-03-13 北京航空航天大学 基于变化检测和帧差累积的视频对象分割方法
CN103747257A (zh) * 2013-12-05 2014-04-23 中国科学技术大学 一种视频数据高效编码的方法
CN104113754A (zh) * 2014-07-17 2014-10-22 四川大学 基于时域相关性的高性能视频帧间编码方法及其转码器
CN107454395A (zh) * 2017-08-23 2017-12-08 上海安威士科技股份有限公司 一种高清网络摄像机及智能码流控制方法

Similar Documents

Publication Publication Date Title
EP3334153B1 (en) Reference frame decoding method
CN111630864B (zh) 编解码方法、装置和媒介
CN112514393B (zh) 解码视频序列的方法、装置和存储介质
CN113330749A (zh) 用于变换跳过模式和块差分脉冲编码调制的改进的残差编解码
US20100104021A1 (en) Remote Transmission and Display of Video Data Using Standard H.264-Based Video Codecs
TW201725905A (zh) 用於非4:4:4色度子採樣之顯示串流壓縮(dsc)之熵寫碼技術
CN112291571A (zh) 视频解码方法及装置以及计算机设备和存储介质
CN114651447A (zh) 用于视频编解码的方法和装置
CN113424541A (zh) 用于变换跳过模式和块差分脉冲编码调制的残差编解码
JP2022521757A (ja) 線形モデルを使用したイントラ予測のための方法および装置
CN113424546A (zh) 用于预测模式和已编码块标志(cbf)的进一步改进的上下文设计的方法和装置
CN110708558A (zh) 变换类型的表示方法和设备
CN112840657B (zh) 用于视频解码的方法、装置、设备和可读介质
TW202135530A (zh) 用於編碼和解碼視訊樣本區塊的方法、設備及系統
CN115211114A (zh) 编码器、解码器和参数集中的指示和语义的对应方法
CN113316932B (zh) 编解码方法、装置和设备
US20240155159A1 (en) Frequency-dependent joint component secondary transform
CN113273193A (zh) 用于分块配置指示的编码器,解码器及对应方法
CN111182310A (zh) 视频处理方法、装置、计算机可读介质及电子设备
CN112135151A (zh) 视频解码方法、***、计算机设备和存储介质
CN114846789B (zh) 用于指示条带的图像分割信息的解码器及对应方法
CN113329227A (zh) 视频编码方法、装置、电子设备与计算机可读介质
KR102657540B1 (ko) 변환 프로세스를 위해 사용되는 인코더, 디코더 및 대응하는 방법
CN114885160A (zh) 视频编解码方法、装置、计算机可读介质及电子设备
CN111757122A (zh) 视频解码方法和装置、计算机设备和存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right
TA01 Transfer of patent application right

Effective date of registration: 20220208

Address after: 100007 room 205-32, floor 2, building 2, No. 1 and No. 3, qinglonghutong a, Dongcheng District, Beijing

Applicant after: Tianyiyun Technology Co.,Ltd.

Address before: No.31, Financial Street, Xicheng District, Beijing, 100033

Applicant before: CHINA TELECOM Corp.,Ltd.

RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20210831