CN109379594B - 视频编码压缩方法、装置、设备和介质 - Google Patents

视频编码压缩方法、装置、设备和介质 Download PDF

Info

Publication number
CN109379594B
CN109379594B CN201811284900.8A CN201811284900A CN109379594B CN 109379594 B CN109379594 B CN 109379594B CN 201811284900 A CN201811284900 A CN 201811284900A CN 109379594 B CN109379594 B CN 109379594B
Authority
CN
China
Prior art keywords
coding unit
frame image
target coding
current frame
image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201811284900.8A
Other languages
English (en)
Other versions
CN109379594A (zh
Inventor
欧阳国胜
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Jiaxun Feihong Electrical Co Ltd
Original Assignee
Beijing Jiaxun Feihong Electrical Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Jiaxun Feihong Electrical Co Ltd filed Critical Beijing Jiaxun Feihong Electrical Co Ltd
Priority to CN201811284900.8A priority Critical patent/CN109379594B/zh
Publication of CN109379594A publication Critical patent/CN109379594A/zh
Application granted granted Critical
Publication of CN109379594B publication Critical patent/CN109379594B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/172Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a picture, frame or field
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/124Quantisation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

本发明公开了一种视频编码压缩方法、装置、设备和介质。该方法包括:根据当前帧图像与当前帧图像的上一帧图像,确定当前帧图像相对于上一帧图像的二值差分图像;根据二值差分图像确定当前帧图像是否存在感兴趣区域;其中,感兴趣区域为当前帧图像与上一帧图像不相同的区域;若确定当前帧图像存在感兴趣区域,则确定当前帧图像的所有目标编码单元,针对每个目标编码单元,根据目标编码单元与感兴趣区域的位置关系,确定每个目标编码单元的帧间预测模式;根据每个目标编码单元的帧间预测模式、每个目标编码单元对应的量化参数以及当前帧图像,确定当前帧图像对应的编码后的数据。本发明提供的方法降低了计算复杂度,减小了编码时间。

Description

视频编码压缩方法、装置、设备和介质
技术领域
本发明实施例涉及数据压缩技术领域,尤其涉及一种视频编码压缩方法、装置、设备和介质。
背景技术
国际电信联盟电信标准分局(ITU-T for ITU TelecommunicationStandardization Sector)的视频编码专家组(Video Coding Experts Group,VCEG)和国际标准化组织(International Organization for Standardization,ISO)的动态图像专家组(Moving Picture Experts Group,MPEG)成立了视频编码合作组(JointCollaborative Team on Video Coding,JCT-VC),制定了新一代高性能视频编码标准(High Efficiency Video Coding,HEVC)。作为最新的视频编码标准,与之前主流的视频编码标准相比,它拥有更加灵活的编码结构。HEVC将图像帧分为编码树单元,编码树单元可以按照四叉树结构分解为若干方形编码单元(Coding Unit,CU),编码深度是编码单元在四叉树结构中递归的深度,编码尺寸是编码单元的图像块的大小尺寸,每种编码深度下的CU,都有其对应的预测模式(PU,Prediction Unit),PU是进行帧内预测的基本单元,PU按照划分形式可以划分为包括跳过模式(SKIP/merge)、正方形分割(Square motion partition)模式、对称分割(Symmetric motion partition,SMP)模式、非对称分割(Asymmetric motionpartition,AMP)模式和帧内预测(intra modes)模式。
目前,HEVC编码器针对不同深度的每一个CU,都会自顶向下地对SKIP/merge、Square、SMP、AMP以及intra modes等帧间预测模式进行函数调用,直至最小编码单元,编码深度达到3,对其中每种帧间预测模式逐一计算率失真代价(Rate Distortion Cost,RD-Cost),最终找到率失真代价最小的预测单元,作为当前CU的最佳PU预测模式。但是,上述的HEVC编码的遍历计算的过程使得计算PU时的计算复杂度非常高,视频压缩需要消耗大量编码时间。
发明内容
本发明提供一种视频编码压缩方法、装置、设备和介质,以实现高效的视频编码压缩。
第一方面,本发明实施例提供了一种视频编码压缩方法,所述方法包括:
根据当前帧图像与所述当前帧图像的上一帧图像,确定所述当前帧图像相对于所述上一帧图像的二值差分图像;
根据所述二值差分图像确定所述当前帧图像是否存在感兴趣区域;其中,所述感兴趣区域为所述当前帧图像与所述上一帧图像不相同的区域;
若确定所述当前帧图像存在所述感兴趣区域,则确定所述当前帧图像的所有目标编码单元,针对所述每个目标编码单元,根据所述目标编码单元与所述感兴趣区域的位置关系,确定所述每个目标编码单元的帧间预测模式;
根据每个目标编码单元的帧间预测模式、每个目标编码单元对应的量化参数以及所述当前帧图像,确定所述当前帧图像对应的编码后的数据。
第二方面,本发明实施例还提供了一种视频编码压缩装置,所述装置包括:
二值差分图像确定模块,用于根据当前帧图像与所述当前帧图像的上一帧图像,确定所述当前帧图像相对于所述上一帧图像的二值差分图像;
感兴趣区域确定模块,用于根据所述二值差分图像确定所述当前帧图像是否存在感兴趣区域;其中,所述感兴趣区域为所述当前帧图像与所述上一帧图像不相同的区域;
第一帧间预测模式确定模块,用于若确定所述当前帧图像存在所述感兴趣区域,则确定所述当前帧图像的所有目标编码单元,针对所述每个目标编码单元,根据所述目标编码单元与所述感兴趣区域的位置关系,确定所述每个目标编码单元的帧间预测模式;
编码模块,用于根据每个目标编码单元的帧间预测模式、每个目标编码单元对应的量化参数以及所述当前帧图像,确定所述当前帧图像对应的编码后的数据。
第三方面,本发明实施例还提供了一种设备,所述设备包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序;
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如本发明实施例中任一所述的视频编码压缩方法。
第四方面,本发明实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现实施例中任一所述的视频编码压缩方法。
本发明通过根据当前帧图像与当前帧图像的上一帧图像,确定当前帧图像相对于所述上一帧图像的二值差分图像;根据二值差分图像确定当前帧图像是否存在感兴趣区域;其中,感兴趣区域为当前帧图像与上一帧图像不相同的区域;若确定当前帧图像存在感兴趣区域,则确定当前帧图像的所有目标编码单元,针对每个目标编码单元,根据目标编码单元与感兴趣区域的位置关系,确定每个目标编码单元的帧间预测模式;根据每个目标编码单元的帧间预测模式、每个目标编码单元对应的量化参数以及当前帧图像,确定当前帧图像对应的编码后的数据。解决了传统视频压缩编码过程中每个编码单元递归进行全部帧间预测模式而导致时间复杂度高的问题,减小了压缩视频的编码时间。
附图说明
图1是本发明实施例一提供的视频编码压缩方法的流程图;
图2是帧间预测模式示意图;
图3是本发明实施例二提供的视频编码压缩方法的流程图;
图4是本发明实施例三提供的视频编码压缩方法的流程图;
图5本发明实施例四提供的视频编码压缩装置示意图;
图6为本发明实施例五提供的一种设备的结构示意图。
具体实施方式
下面结合附图和实施例对本发明作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本发明,而非对本发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本发明相关的部分而非全部结构。
实施例一
图1是本发明实施例一提供的视频编码压缩方法的流程图,本实施例提供的视频编码压缩方法是针对HEVC标准的改进方法。本实施例可适用于视频编码压缩的情况,该方法可以由视频编码压缩装置来执行,具体包括如下步骤:
步骤101、根据当前帧图像与所述当前帧图像的上一帧图像,确定所述当前帧图像相对于所述上一帧图像的二值差分图像。
其中,当前帧图像可以是视频中进行编码压缩的图像帧,当前帧图像的上一帧图像可以是作为预测根据的关键帧;像素值可以是当前帧图像像素点对应的像素点红绿蓝三原色三个分量具体的值,还可以是像素点的亮度信息,可以是灰度值,像素值在0~255的范围之间,0代表亮度最暗,255代表亮度最亮。二值差分图像产生的方式可以是通过两幅图像对相应位置的像素值进行比较,如果相同,则将对应位置像素点的灰度值设为0,如果不同,则使得对应像素点灰度值设为255的方式构成图像。
具体地,分别获取当前帧图像和当前帧前一帧图像中各个位置的像素值,依次对比两帧图像中位置相同的像素点的像素值,如果对应位置的像素值相同,那么将二值差分图像中对应位置的像素点的灰度值设为0,如果对应位置的像素值不同,那么则将二值差分图像中对应位置的像素点的灰度值设为255,当两帧图像中的所有像素点比较完毕后,则获取到由灰度值为255或0的像素点组成的二值差分图像。
一种优选的实施方式,分别获取当前帧图像和当前帧前一帧图像,当前帧图像像素值f(x,y,i)和当前帧前一帧像素值f(x,y,i-1),那么二值差分图像像素值DF(x,y,i,i-1),其中x,y可以分别是当前帧图像和当前帧前一帧图像的坐标位置中的横纵坐标,i代表当前帧图像在视频的帧序号,二值差分图像的像素值DF(x,y,i,i-1)=f(x,y,i)-f(x,y,i-1),若计算后的DF值大于一设定阈值,则将对DF值对应的灰度值设为255,若计算后的DF值小于等于一设定阈值,则将DF值对应的灰度值设为0,其中设定阈值优选为15(改为“15”);当二值差分图像中的每个像素点的灰度值均被设定后,则得到当前帧图像和当前帧前一帧图像的二值分差图像。
步骤102、根据所述二值差分图像确定所述当前帧图像是否存在感兴趣区域;其中,所述感兴趣区域为所述当前帧图像与所述上一帧图像不相同的区域。
其中,感兴趣区域可以是人眼对图像感知度强的区域,包括运动区域、纹理复杂区域、人脸等区域等。二值差分图像可以展示两幅图像中发生变化的区域,通过二值差分图像可以帮助获取感兴趣区域。
在具体实现中,根据生成的二值差分图像判断二值差分图像中是否存在像素点的灰度值不为0的像素点,如果存在灰度值不为0的像素点,则说明当前帧图像中存在与当前帧上一帧图像不相同的区域,该不相同的区域也就是当前帧图像的感兴趣区域。换句话说,当二值差分图像中存在灰度值为255的像素点时,确定当前帧图像存在感兴趣区域。
步骤103、若确定所述当前帧图像存在所述感兴趣区域,则确定所述当前帧图像的所有目标编码单元,针对所述每个目标编码单元,根据所述目标编码单元与所述感兴趣区域的位置关系,确定所述每个目标编码单元的帧间预测模式。
其中,目标编码单元可以是在当前帧图像中,按照预设编码深度和编码尺寸划分的正方形图像块。目标编码单元与感兴趣区域的关系可以包括位于非感兴趣、位于感兴趣区域边缘和位于感兴趣区域内部等。帧间预测模式可以是目标编码单元划分的形式。
图2是帧间预测模式示意图。示例性地,图2中被分割的CU的尺寸为2N*2N。其中,N为像素点的个数。如图2所示Square、SMP、AMP分别有其对应的分割方式。
如图2所示,Square可以是将CU正方形分割的模式,将CU分割后形成PU。其中,在Square模式中,CU被分割后形成的PU可以一个大小为2N*2N的图像块PART_2N*2N,或者,是四个大小均为N*N的图像块PART_N*N。
如图2所示,SMP可以是将CU对称形分割的模式。其中,分割后形成的PU可以是两个大小为2N*N的图像块PART_2N*N,或者,是两个大小为N*2N的图像块PART_N*2N。
如图2所示,AMP可以是将CU非对称形分割的模式。其中,分割后形成的PU可以是大小分别为2N*N/2和2N*3N/2的图像块。按照分割方向的不同,PU的形式可以是图2中的图像块PART_nL*2N示出的形式、图像块PART_nR*2N示出的形式、图像块PART_2N*nU示出的形式,或者,图像块PART_2N*nD示出的形式。
另外,SKIP/merge和intra modes未在图2中示出,SKIP/merge不对CU进行帧间预测;intra modes是将CU划分为更小编码尺寸的CU,再次进行帧间预测。
具体地,本实施例中,先按照目前的HEVC标准对当前帧图像进行划分,形成不同尺寸和不同编码深度的编码单元。其中,编码深度可以是0、1、2和3,编码尺寸可以是64*64、32*32、16*16和8*8。更具体地,将当前帧图像划分为多个尺寸为64*64的编码单元;对于编码尺寸为64*64的编码单元,将其划分为4个尺寸为32*32的编码单元;对于编码尺寸为32*32的编码单元,将其划分为4个尺寸为16*16的编码单元;对于编码尺寸为16*16的编码单元,将其划分为4个尺寸为8*8的编码单元。所有尺寸为64*64的编码单元,其对应的编码深度为0;所有尺寸为32*32的编码单元,其对应的编码深度为1;所有尺寸为16*16的编码单元,其对应的编码深度为2;所有尺寸为8*8的编码单元,其对应的编码深度为3。其中,尺寸64*64指的是该编码单元中,横向和纵向均包括64个像素点。
如果当前帧图像对应的二值差分图像中存在灰度值为0的像素点构成的区域,一种实现方式中,将当前帧图像的编码单元中,尺寸为16*16以及8*8的所有编码单元,确定为该当前帧图像的目标编码单元。针对每个目标编码单元,确定每个编码单元与二值差分图像中像素值不为0的像素点构成的区域的位置关系,根据位置关系判断该目标编码单元对应的帧间预测模式。具体如何根据目标编码单元与感兴趣区域的位置关系,确定每个目标编码单元的帧间预测模式,将在实施例三中进行详细说明。
步骤104、根据每个目标编码单元的帧间预测模式、每个目标编码单元对应的量化参数以及所述当前帧图像,确定所述当前帧图像对应的编码后的数据。
其中,量化参数可以是反应图像质量的参数,量化参数越小,量化参数对应的目标编码单元的图像质量越清晰。
具体地,可以根据目标编码帧内各个编码单元的预测模式、设定的量化参数以及当前帧图像对当前帧图像进行编码操作,其中,量化参数可以是预设值,优选的实施方式中,量化参数设定为28;编码操作可以包括使用目标编码单元和其对应的帧间预测模式生成数据帧,将数据帧和参考帧进行减法运算得到残差矩阵,其中,参考帧可以是根据经验选取的视频图像帧或者按阈值时间选取的视频图像帧,将残差矩阵进行离散余弦变换(Discrete Cosine Transform,DCT)得到变换系数矩阵;再使用量化参数对计算得到的变换系数矩阵进行量化生成量化矩阵,最后对量化矩阵进行熵编码最终得到视频的压缩编码数据。
本实施例的技术方案,通过根据当前帧图像与当前帧图像的上一帧图像,确定当前帧图像相对于上一帧图像的二值差分图像;根据二值差分图像确定当前帧图像是否存在感兴趣区域;其中,感兴趣区域为当前帧图像与上一帧图像不相同的区域;若确定当前帧图像存在感兴趣区域,则确定当前帧图像的所有目标编码单元,针对每个目标编码单元,根据目标编码单元与感兴趣区域的位置关系,确定每个目标编码单元的帧间预测模式;根据每个目标编码单元的帧间预测模式、每个目标编码单元对应的量化参数以及当前帧图像,确定当前帧图像对应的编码后的数据,实现了在确定目标编码单元的帧间预测模式时,根据目标编码单元与感兴趣区域的位置关系,确定目标编码单元的帧间预测模式,相较于目前采用枚举方式确定编码单元的帧间预测模式的方式,降低了计算复杂度。解决了传统视频编码压缩过程中由于每个编码单元都需要递归进行全部帧间预测模式的问题,降低了视频编码压缩的计算复杂度,减小了压缩视频的编码时间。
实施例二
图3是本发明实施例二提供的视频编码压缩方法的流程图。本实施例是在上述实施例的基础上的一种可选方案,参见图3,本发明实施例提供的视频编码压缩方法包括:
步骤201、当所述当前帧图像的第一像素点与所述上一帧图像的对应位置的像素点的像素值相同时,确定所述二值差分图像中所述第一像素点的灰度值为0;当所述当前帧图像的第二像素点与所述上一帧图像的对应位置的像素点的像素值不相同时,确定所述二值差分图像中所述第二像素点的灰度值为255。
其中,像素点可以是当前帧图像中最小的显色单元。具体地,获取当前帧图像和上一帧图像各像素点的像素值,如果两帧图像中对应位置像素点的像素值相同,则将二值差分图像中与两帧图像位置对应的第一像素点的灰度值设为0;如果两帧图像中对应位置像素点的像素值不相同,则将二值差分图像中与两帧图像位置对应的第二像素点的灰度值设为255。其中,当前帧图像中坐标值为(2,8)的像素点在上一帧图像中的对应位置像素点指的是,上一帧图像中坐标值为(2,8)的像素点。
步骤202、当所述二值差分图像中存在灰度值为255的像素点时,确定所述当前帧图像存在所述感兴趣区域;其中,所述感兴趣区域为所述当前帧图像与所述上一帧图像不相同的区域。
步骤203、若确定所述当前帧图像存在感兴趣区域,则将所述当前帧图像的编码单元中,尺寸为16*16以及8*8的所有编码单元,确定为所述当前帧图像的目标编码单元。
其中,尺寸可以是目标编码单元横向和纵向包含的像素点的个数。
具体地,如果当前帧图像对应的二值差分图像中存在灰度值为255的区域,那么当前帧图像中存在感兴趣区域,感兴趣区域可以是二值差分图像中灰度值为255的像素点构成的区域。对当前帧图像中的感兴趣区域,使用编码尺寸16*16和8*8分割;而非感兴趣区域,使用编码尺寸64*64和32*32分割,最终确定当前帧图像的对应的所有目标编码单元。
步骤204、针对所述每个目标编码单元,根据所述目标编码单元与所述感兴趣区域的位置关系,确定所述每个目标编码单元的帧间预测模式。
步骤205、根据每个目标编码单元的帧间预测模式、每个目标编码单元对应的量化参数以及所述当前帧图像,确定所述当前帧图像对应的编码后的数据。
本发明实施例的技术方案,通过当前帧图像的第一像素点与上一帧图像的对应位置的像素点的像素值相同时,确定二值差分图像中第一像素点的灰度值为0;当前帧图像的第二像素点与上一帧图像的对应位置的像素点的像素值不相同时,确定二值差分图像中所述第二像素点的灰度值为255;当二值差分图像中存在灰度值为255的像素点时,确定当前帧图像存在感兴趣区域;其中,感兴趣区域为当前帧图像与上一帧图像不相同的区域;若确定当前帧图像存在感兴趣区域,则将当前帧图像的编码单元中,尺寸为16*16以及8*8的所有编码单元,确定为所述当前帧图像的目标编码单元;针对每个目标编码单元,根据目标编码单元与感兴趣区域的位置关系,确定每个目标编码单元的帧间预测模式;根据每个目标编码单元的帧间预测模式、每个目标编码单元对应的量化参数以及当前帧图像,确定当前帧图像对应的编码后的数据。通过将二值差分图的像素值变为0和255,使得图像的感兴趣区域更加明显,便于数据处理,在当前帧图像中,只使用尺寸较小的编码单元作为目标编码单元,进一步降低了编码压缩的计算复杂度,提高了视频编码质量。
在上述实施例的基础上,在针对所述每个目标编码单元,根据所述目标编码单元与所述感兴趣区域的位置关系,确定所述每个目标编码单元的帧间预测模式之前,该视频编码压缩方法还包括:
当所述二值差分图像中,灰度值为255的像素点的个数与所述二值差分图像的像素点的总个数的比值大于预设阈值时,确定所述当前帧图像的运动模式为背景和前景均运动。
其中,前景可以是当前帧图像中作为主体的人、动物或者物等,背景可以是用于烘托主体的景物,运动模式可以是图像像中背景和前景的运动方式,可以包括前景和背景均运动、前景和背景均静止及前景运动和背景静止等。
具体地,可以获取当前帧图像对应的二值差分图像中灰度值为255的像素点占二值差分图像中所有像素点的比值,然后将比值和预设阈值进行比较,如果比值大于预设阈值,则将当前帧图像的运动模式确定为背景和前景均处于运动状态。其中,预设阈值优选为30%。
当所述二值差分图像中,灰度值为255的像素点的个数与所述二值差分图像的像素点的总个数的比值小于或等于所述预设阈值时,确定所述当前帧图像的运动模式为背景静止和前景运动。
具体地,可以获取当前帧图像对应的二值差分图像中灰度值为255的像素点数占二值差分图像中总像素点的比值,然后将比值和预设阈值进行比较,如果比值小于或等于预设阈值,则当前帧图像的运动模式确定为背景处于静止状态和前景处于运动状态。其中,预设阈值优选为30%。
相应地,所述根据所述目标编码单元与所述感兴趣区域的位置关系,确定所述每个目标编码单元的帧间预测模式,包括:
根据所述当前帧图像的运动模式,以及,所述目标编码单元与所述感兴趣区域的位置关系,确定所述每个目标编码单元的帧间预测模式以及所述每个目标编码单元对应的调整后的量化参数。
其中,目标编码单元与所述感兴趣区域的位置关系可以包括处于感兴趣区域的内部位置、处于感兴趣区域的边缘位置和处于非感兴趣区域等;帧间预测模式可以包括SKIP/merge、Square、SMP、AMP以及intra modes等。
具体地,可以根据当前帧图像中前景和背景的运动方式、目标编码单元和感兴趣区域的位置关系,确定所述目标编码单元的帧间预测模式和调整量化参数的方式,示例性的,如果目标编码单元位于感兴趣区域的内部位置,且运动模式为前景运动和背景静止,则目标编码单元的帧间预测模式可以是Square和SMP,并且在量化参数的基础上减小3,使得目标编码单元对应的图像更加清晰。
实施例三
图4是本发明实施例三提供的视频编码压缩方法的流程图。本实施例是在上述实施例的基础上的另一种可选方案,参见图4,本发明实施例提供的视频编码压缩方法包括:
步骤301、当所述当前帧图像的第一像素点与所述上一帧图像的对应位置的像素点的像素值相同时,确定所述二值差分图像中所述第一像素点的灰度值为0;当所述当前帧图像的第二像素点与所述上一帧图像的对应位置的像素点的像素值不相同时,确定所述二值差分图像中所述第二像素点的灰度值为255。
步骤302、当所述二值差分图像中存在灰度值为255的像素点时,确定所述当前帧图像存在所述感兴趣区域;其中,所述感兴趣区域为所述当前帧图像与所述上一帧图像不相同的区域。
步骤303、若确定所述当前帧图像存在感兴趣区域,则将所述当前帧图像的编码单元中,尺寸为16*16以及8*8的所有编码单元,确定为所述当前帧图像的目标编码单元,针对所述每个目标编码单元,根据所述目标编码单元与所述感兴趣区域的位置关系,确定所述每个目标编码单元的帧间预测模式。
步骤304、若确定所述当前帧图像不存在所述感兴趣区域,则将所述当前帧图像的编码单元中,尺寸为64*64以及32*32的所有编码单元,确定为所述当前帧图像的目标编码单元;确定所述目标编码单元的帧间预测模式为第六候选帧间预测模式(改为“预测模式”)集合中具有最小率失真代价的帧间预测模式,所述目标编码单元对应的调整后的量化参数为所述目标编码单元对应的量化参数加二;其中,所述第六候选帧间预测模式集合包括:SKIP/merge和Square。
具体地,如果当前帧图像对应的二值差分图像中不存在灰度值为255的区域,那么当前帧图像中不存在感兴趣区域。使用编码尺寸64*64和32*32分割当前帧图像,生成编码尺寸64*64和32*32的目标编码单元,最终获得当前帧图像的所有目标编码单元;使对应的目标编码单元使用候选帧间预测模式集合中的SKIP/merge和Square计算率失真代价,选取率失真代价计算结果最小的候选帧间预测模式作为帧间预测模式,同时,在目标编码单元初始的量化参数的基础上增加2,作为目标编码单元调整后的量化参数,使得对应目标编码单元的码率更小,其中,SKIP/merge和Square组成的集合可以是第六候选帧间预测模式集合。
一种可选的实施方式,在步骤304中的确定每个目标编码单元的帧间预测模式之前,还可以确定当前帧图像的运动模式。则步骤304中根据目标编码单元与感兴趣区域的位置关系,确定每个目标编码单元的帧间预测模式具体可以是:根据所述当前帧图像的运动模式,以及,所述目标编码单元与所述感兴趣区域的位置关系,确定所述每个目标编码单元的帧间预测模式以及所述每个目标编码单元对应的调整后的量化参数。在该实现方式中,步骤304中的根据所述当前帧图像的运动模式,以及,所述目标编码单元与所述感兴趣区域的位置关系,确定所述每个目标编码单元的帧间预测模式以及所述每个目标编码单元对应的调整后的量化参数具体包括如下步骤:
步骤3041、若所述当前帧图像的运动模式为背景和前景均运动,则:
当所述目标编码单元中包括与所述二值差分图像中灰度值为255的像素点位置相同的像素点时,确定所述目标编码单元的帧间预测模式为第一候选帧间预测模式集合中具有最小率失真代价的帧间预测模式,所述目标编码单元对应的调整后的量化参数为所述目标编码单元对应的量化参数减一;其中,所述第一候选帧间预测模式集合包括:SMP、AMP和intra modes;
当所述目标编码单元中不包括与所述二值差分图像中灰度值为255的像素点位置相同的像素点时,确定所述目标编码单元的帧间预测模式为第二候选帧间预测模式集合中具有最小率失真代价的帧间预测模式,所述目标编码单元对应的调整后的量化参数为所述目标编码单元对应的量化参数加一;其中,所述第二候选帧间预测模式集合包括:SKIP/merge、Square和SMP。
其中,候选帧间预测模式集合可以是目标编码单元对应的所有帧间预测模式组合的集合,可以包括SKIP/merge、Square、SMP、AMP以及intra modes等帧间预测模式的任意组合,例如SKIP/merge、Square集合,SKIP/merge、SMP集合,SKIP/merge、intra modes集合,SKIP/merge、Square、SMP集合,SKIP/merge、Square、SMP、AMP集合和SKIP/merge、Square、SMP、AMP、intra modes集合等。
具体地,如果确定前景和背景均处于运动状态,有以下两种场景。
第一种场景,获取各目标编码单元中所有的像素点的位置,如果某一个目标编码单元中,存在与处于当前帧图像对应的二值差分图像中感兴趣区域(即灰度值为255的像素点构成的区域)的像素点的位置相同的像素点,则针对该目标编码单元,使用对称分割模式SMP、非对称分割模式AMP和帧内预测模式intra modes分别对目标编码单元计算率失真代价,计算公式可以是J=DFD(Motion)+kMotionRMV(Motion),其中DFD(Motion)表示采用不同运动模式下的运动补偿预测误差,RMV(Motion)表示帧间预测模式相关信息的编码比特数,相关信息可以包括帧间预测模式的运动矢量、图像索引和参考队列索引等,kMotion为拉格朗日因子;选取率失真代价计算结果最小的候选帧间预测模式作为该目标编码单元的帧间预测模式,并将对应目标编码单元的量化参数在其初始的量化参数的基础上减一,作为该目标编码单元调整后的量化参数。
第二种场景,获取各目标编码单元中所有的像素点的位置,如果某一个目标编码单元中,不存在与处于当前帧图像对应的二值差分图像中感兴趣区域的像素点位置相同的像素点,则针对该目标编码单元使用候选帧间预测模式集合中的SKIP/merge、Square和SMP计算率失真代价,选取率失真代价计算结果最小的候选帧间预测模式作为帧间预测模式,并将对应目标编码单元的量化参数在其初始的量化参数的基础上加一,作为该目标编码单元调整后的量化参数。
其中,所有目标编码单元调整前的量化参数,即初始的量化参数,可以根据经验设置为一定值,优选的定值为28。
步骤3042、若所述当前帧图像的运动模式为背景静止和前景运动,则:
当所述目标编码单元中包括与所述二值差分图像中灰度值为255的像素点位置相同的像素点,并且,所述目标编码单元周围的编码单元中不包括与所述二值差分图像灰度值为255的像素点位置相同的像素点时,确定所述目标编码单元的帧间预测模式为第三候选帧间预测模式集合中具有最小率失真代价的帧间预测模式,所述目标编码单元对应的调整后的量化参数为所述目标编码单元对应的量化参数减一;其中,所述第三候选帧间预测模式集合包括:AMP和intra modes;
当所述目标编码单元中包括与所述二值差分图像中灰度值为255的像素点位置相同的像素点,并且,所述目标编码单元周围的编码单元中也包括与所述二值差分图像中灰度值为255的像素点位置相同的像素点时,确定所述目标编码单元的帧间预测模式为第四候选帧间预测模式集合中具有最小率失真代价的帧间预测模式,所述目标编码单元对应的调整后的量化参数为所述目标编码单元对应的量化参数减三;其中,所述第四候选帧间预测模式集合包括:Square和SMP;
当所述目标编码单元中不包括与所述二值差分图像中灰度值为255的像素点位置相同的像素点时,确定所述目标编码单元的帧间预测模式为第五候选帧间预测模式集合中具有最小率失真代价的帧间预测模式,所述目标编码单元对应的调整后的量化参数为所述目标编码单元对应的量化参数加二;其中,所述第五候选帧间预测模式集合包括:跳过模式SKIP/merge和正方形分割模式Square。
具体实现中,如果确定前景处于运动状态和背景均处于静止状态,有以下三种场景。
第一种场景:获取各目标编码单元中所有的像素点的位置,如果某一个目标编码单元中,存在与处于当前帧图像对应的二值差分图像中感兴趣区域的像素点的位置相同的像素点,并且目标编码单元周围的编码单元中不存在与二值差分图像中感兴趣区域的像素点的位置相同的像素点,则针对该目标编码单元使用非对称分割模式AMP和帧内预测模式intra modes计算率失真代价,AMP和intra modes的集合就是第三候选帧间预测模式集合,选取率失真代价计算结果最小的候选帧间预测模式作为帧间预测模式,并将对应目标编码单元的量化参数在其初始的量化参数的基础上减一,作为该目标编码单元调整后的量化参数,其中,目标编码单元周围的编码单元可以是目标编码单元左方、左上方、上方、右上方、右方、右下方、下方和左下方的编码单元;
第二种场景:获取各目标编码单元中所有的像素点的位置,如果某一个目标编码单元和该目标编码单元周围的编码单元对应位置的二值差分图像区域中均存在灰度值为255的像素点,目标编码单元可以分别使用Square和SMP帧间预测模式计算率失真代价,选择其中率失真代价值最小的帧间预测模式作为帧间预测模式,并将对应目标编码单元的量化参数在其初始的量化参数的基础上减去三,作为该目标编码单元调整后的量化参数。Square和SMP构成的集合可以是第四候选帧间预测模式集合,其中,目标编码单元周围的编码单元可以是目标编码单元左方、左上方、上方、右上方、右方、右下方、下方和左下方的编码单元;
第三种场景:获取各目标编码单元中所有的像素点的位置,如果在某一个目标编码单元所有的像素点的位置对应的二值差分图像中不存在灰度值为255的像素点,那么可以使用SKIP/merge和Square计算率失真代价,可以选择率失真代价最小的帧间预测模式作为帧间预测模式,并将目标编码单元对应的量化参数在其基础数值上加二,其中目标编码单元的基础数值根据经验可以优选为28。SKIP/merge和Square构成的集合可以是第五候选帧间预测模式集合。
需要说明的是,本实施例中,目标编码单元中所有的像素点的位置,指的是目标编码单元的所有像素点在当前帧图像中的位置。目标编码单元的初始的量化参数,以及,量化参数的基础数值均指的是根据目前的HEVC标准确定出的目标编码单元的量化参数。
步骤305、根据每个目标编码单元的帧间预测模式、每个目标编码单元对应的量化参数以及所述当前帧图像,确定所述当前帧图像对应的编码后的数据。
本发明的实施例的技术方案,通过当前帧图像的第一像素点与上一帧图像的对应位置的像素点的像素值相同时,确定二值差分图像中第一像素点的灰度值为0;当前帧图像的第二像素点与上一帧图像的对应位置的像素点的像素值不相同时,确定二值差分图像中第二像素点的灰度值为255;当二值差分图像中存在灰度值为255的像素点时,确定当前帧图像存在所述感兴趣区域;其中,所述感兴趣区域为当前帧图像与所述上一帧图像不相同的区域;若确定当前帧图像存在感兴趣区域,则将所述当前帧图像的编码单元中,尺寸为16*16以及8*8的所有编码单元,确定为所述当前帧图像的目标编码单元;针对每个目标编码单元,根据目标编码单元与感兴趣区域的位置关系,确定每个目标编码单元的帧间预测模式;若确定当前帧图像不存在感兴趣区域,则将尺寸为64*64以及32*32的所有编码单元,确定为当前帧图像的目标编码单元;确定目标编码单元的帧间预测模式为第六候选帧间预测模式集合中具有最小率失真代价的帧间预测模式,目标编码单元对应的调整后的量化参数为目标编码单元对应的量化参数加二;其中,第六候选帧间预测模式集合包括:跳过模式SKIP/merge和正方形分割模式Square;根据每个目标编码单元的帧间预测模式、每个目标编码单元对应的量化参数以及当前帧图像,确定当前帧图像对应的编码后的数据;针对图像是否存在感兴趣区域,采取不同编码尺寸的目标编码单元,对没有感兴趣区域的图像使用较大尺寸的64*64和32*32的编码单元,提高了编码速度,对存在感兴趣区域的图像,在使用较小尺寸的16*16和8*8的编码单元,同时,通过调整目标编码单元的量化参数,保证了当前帧图像的清晰度,使得在提高视频编码的效率同时保证了图像的清晰度,增强了用户观看视频的体验程度。
为了进一步提高感兴趣区域图像的图像质量,所述方法还包括:
目标编码单元对应的调整后的量化参数的取值范围为:
Figure BDA0001848815180000171
QP=max{0,min{QP,51}},其中,QP表示所述目标编码单元对应的调整后的量化参数,
Figure BDA0001848815180000172
表示所述目标编码单元周围4个已编码的编码单元对应的调整后的量化参数的平均值。
其中,周围4个已编码单元可以是目标编码单元左方、左上方、上方和右上方已经编码的编码单元。
具体地,各目标编码单元确定帧间预测模式后调整的量化参数不同,会导致某编码单元与周围编码单元的量化参数差距过大,导致产生方块效应降低用户观看视频的体验度,因此,可以先将目标编码单元的量化参数与周围四个编码单元的量化参数的平均值进行对比,如果大于或者小于周围编码单元量化参数的平均值,那么将目标编码单元量化参数进行调整,减小与周围编码单元的差距,如果量化参数过小则增大量化参数,如果量化参数过大则减小量化参数,其中增加或减小的量化参数增量优选为2,最后目标编码单元调整后的量化参数的范围需满足0~51。
实施例四
图5本发明实施例四提供的视频编码压缩装置示意图,本装置可执行本发明任意实施例所提供的视频编码压缩方法,具备执行方法相应的功能模块和有益效果。参见图5,本发明实施例提供的视频编码压缩装置包括:二值差分图像确定模块401、感兴趣区域确定模块402、第一帧间预测模式确定模块403和编码模块404。
其中,二值差分图像确定模块401,用于根据当前帧图像与所述当前帧图像的上一帧图像,确定所述当前帧图像相对于所述上一帧图像的二值差分图像。
感兴趣区域确定模块402,用于根据所述二值差分图像确定所述当前帧图像是否存在感兴趣区域;其中,所述感兴趣区域为所述当前帧图像与所述上一帧图像不相同的区域。
第一帧间预测模式确定模块403,用于若确定所述当前帧图像存在所述感兴趣区域,则确定所述当前帧图像的所有目标编码单元,针对所述每个目标编码单元,根据所述目标编码单元与所述感兴趣区域的位置关系,确定所述每个目标编码单元的帧间预测模式。
编码模块404,用于根据每个目标编码单元的帧间预测模式、每个目标编码单元对应的量化参数以及所述当前帧图像,确定所述当前帧图像对应的编码后的数据。
本发明实施例的技术方案,通过设置二值差分图像确定模块,用于根据当前帧图像与当前帧图像的上一帧图像,确定当前帧图像相对于上一帧图像的二值差分图像,感兴趣区域确定模块,用于根据二值差分图像确定当前帧图像是否存在感兴趣区域;其中,感兴趣区域为当前帧图像与上一帧图像不相同的区域,第一帧间预测模式确定模块,用于若确定当前帧图像存在感兴趣区域,则确定当前帧图像的所有目标编码单元,针对每个目标编码单元,根据目标编码单元与感兴趣区域的位置关系,确定每个目标编码单元的帧间预测模式,编码模块,用于根据每个目标编码单元的帧间预测模式、每个目标编码单元对应的量化参数以及当前帧图像,确定当前帧图像对应的编码后的数据。解决了传统视频编码压缩过程中由于每个编码单元都需要递归进行全部帧间预测模式的问题,降低了视频编码压缩的计算复杂度,减小了压缩视频的编码时间。
进一步地,所述第一帧间预测模式确定模块,包括:目标编码单元确定子模块。
其中,目标编码单元确定子模块,用于若确定所述当前帧图像存在感兴趣区域,则将所述当前帧图像的编码单元中,尺寸为16*16以及8*8的所有编码单元,确定为所述当前帧图像的目标编码单元。
进一步地,在一种实现方式中,二值差分图像确定模块还包括灰度值设定子模块。其中,灰度值设定子模块,用于当所述当前帧图像的第一像素点与所述上一帧图像的对应位置的像素点的像素值相同时,确定所述二值差分图像中所述第一像素点的灰度值为0;当所述当前帧图像的第二像素点与所述上一帧图像的对应位置的像素点的像素值不相同时,确定所述二值差分图像中所述第二像素点的灰度值为255。
基于该实现方式,感兴趣区域确定模块402具体用于当所述二值差分图像中存在灰度值为255的像素点时,确定所述当前帧图像存在所述感兴趣区域。
在该实现方式中,上述实施例提供的视频编码压缩装置还包括运动模式确定模块。具体地,运动模式确定模块用于:当所述二值差分图像中,灰度值为255的像素点的个数与所述二值差分图像的像素点的总个数的比值大于预设阈值时,确定所述当前帧图像的运动模式为背景和前景均运动;当所述二值差分图像中,灰度值为255的像素点的个数与所述二值差分图像的像素点的总个数的比值小于或等于所述预设阈值时,确定所述当前帧图像的运动模式为背景静止和前景运动。
基于该实现方式,第一帧间预测模式确定模块403在根据所述目标编码单元与所述感兴趣区域的位置关系,确定所述每个目标编码单元的帧间预测模式的方面,具体包括帧间预测模式确定子模块。
可选地,帧间预测模式确定子模块,具体用于根据所述当前帧图像的运动模式,以及,所述目标编码单元与所述感兴趣区域的位置关系,确定所述每个目标编码单元的帧间预测模式以及所述每个目标编码单元对应的调整后的量化参数。
具体地,帧间预测模式确定子模块具体包括:前景运动背景运动子模块和前景运动背景静止子模块。
前景运动背景运动子模块,用于若所述当前帧图像的运动模式为背景和前景均运动,则:
当所述目标编码单元中包括与所述二值差分图像中灰度值为255的像素点位置相同的像素点时,确定所述目标编码单元的帧间预测模式为第一候选帧间预测模式集合中具有最小率失真代价的帧间预测模式,所述目标编码单元对应的调整后的量化参数为所述目标编码单元对应的量化参数减一;其中,所述第一候选帧间预测模式集合包括:SMP、AMP和intra modes;
当所述目标编码单元中不包括与所述二值差分图像中灰度值为255的像素点位置相同的像素点时,确定所述目标编码单元的帧间预测模式为第二候选帧间预测模式集合中具有最小率失真代价的帧间预测模式,所述目标编码单元对应的调整后的量化参数为所述目标编码单元对应的量化参数加一;其中,所述第二候选帧间预测模式集合包括:SKIP/merge、Square和SMP。
前景运动背景静止子模块,用于若所述当前帧图像的运动模式为背景静止和前景运动,则:
当所述目标编码单元中包括与所述二值差分图像中灰度值为255的像素点位置相同的像素点,并且,所述目标编码单元周围的编码单元中不包括与所述二值差分图像灰度值为255的像素点位置相同的像素点时,确定所述目标编码单元的帧间预测模式为第三候选帧间预测模式集合中具有最小率失真代价的帧间预测模式,所述目标编码单元对应的调整后的量化参数为所述目标编码单元对应的量化参数减一;其中,所述第三候选帧间预测模式集合包括:AMP和intra modes;
当所述目标编码单元中包括与所述二值差分图像中灰度值为255的像素点位置相同的像素点,并且,所述目标编码单元周围的编码单元中也包括与所述二值差分图像中灰度值为255的像素点位置相同的像素点时,确定所述目标编码单元的帧间预测模式为第四候选帧间预测模式集合中具有最小率失真代价的帧间预测模式,所述目标编码单元对应的调整后的量化参数为所述目标编码单元对应的量化参数减三;其中,所述第四候选帧间预测模式集合包括:Square和SMP;
当所述目标编码单元中不包括与所述二值差分图像中灰度值为255的像素点位置相同的像素点时,确定所述目标编码单元的帧间预测模式为第五候选帧间预测模式集合中具有最小率失真代价的帧间预测模式,所述目标编码单元对应的调整后的量化参数为所述目标编码单元对应的量化参数加二;其中,所述第五候选帧间预测模式集合包括:SKIP/merge和Square。
进一步地,在该实现方式中,上述实施例提供的视频编码压缩装置还包括:第二帧间预测模式确定模块。
第二帧间预测模式确定模块具体用于:若确定所述当前帧图像不存在所述感兴趣区域,则将所述当前帧图像的编码单元中,尺寸为64*64以及32*32的所有编码单元,确定为所述当前帧图像的目标编码单元;确定所述目标编码单元的帧间预测模式为第六候选帧间预测模式集合中具有最小率失真代价的帧间预测模式,所述目标编码单元对应的调整后的量化参数为所述目标编码单元对应的量化参数加二。其中,所述第六候选帧间预测模式集合包括:SKIP/merge模式和Square模式。
进一步地,在该实现方式中,目标编码单元对应的调整后的量化参数的取值范围为:
Figure BDA0001848815180000211
QP=max{0,min{QP,51}},其中,QP表示所述目标编码单元对应的调整后的量化参数,
Figure BDA0001848815180000212
表示所述目标编码单元周围4个已编码的编码单元对应的调整后的量化参数的平均值。
实施例五
图6为本发明实施例五提供的一种设备的结构示意图,如图6所示,该设备包括处理器70、存储装置71、输入装置72和输出装置73;设备中处理器70的数量可以是一个或多个,图6中以一个处理器70为例;设备中的处理器70、存储装置71、输入装置72和输出装置73可以通过总线或其他方式连接,图6中以通过总线连接为例。
存储装置71作为一种计算机可读存储介质,可用于存储软件程序、计算机可执行程序以及模块,如本发明实施例中的视频编码压缩方法对应的程序模块(例如,视频编码压缩装置中的二值差分图像确定模块401、感兴趣区域确定模块402、第一帧间预测模式确定模块403和编码模块404)。处理器70通过运行存储在存储装置71中的软件模块,从而执行设备的各种功能应用以及数据处理,即实现上述的视频编码压缩方法。
存储装置71可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作***、至少一个功能所需的应用程序;存储数据区可存储根据终端的使用所创建的数据等。此外,存储装置71可以包括高速随机存取存储装置,还可以包括非易失性存储装置,例如至少一个磁盘存储装置件、闪存器件、或其他非易失性固态存储装置件。在一些实例中,存储装置71可进一步包括相对于处理器70远程设置的存储装置,这些远程存储装置可以通过网络连接至设备。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
输入装置72可用于接收输入的数字或字符信息,以及产生与设备的用户设置以及功能控制有关的键信号输入。输出装置73可包括显示屏等显示设备。
实施例六
本发明实施例六还提供一种包含计算机可执行指令的存储介质,所述计算机可执行指令在由计算机处理器执行时用于执行一种视频编码压缩方法,该方法包括:
根据当前帧图像与所述当前帧图像的上一帧图像,确定所述当前帧图像相对于所述上一帧图像的二值差分图像;
根据所述二值差分图像确定所述当前帧图像是否存在感兴趣区域;其中,所述感兴趣区域为所述当前帧图像与所述上一帧图像不相同的区域;
若确定所述当前帧图像存在所述感兴趣区域,则确定所述当前帧图像的所有目标编码单元,针对所述每个目标编码单元,根据所述目标编码单元与所述感兴趣区域的位置关系,确定所述每个目标编码单元的帧间预测模式;
根据每个目标编码单元的帧间预测模式、每个目标编码单元对应的量化参数以及所述当前帧图像,确定所述当前帧图像对应的编码后的数据。
当然,本发明实施例所提供的一种包含计算机可执行指令的存储介质,其计算机可执行指令不限于如上所述的方法操作,还可以执行本发明任意实施例所提供的视频压缩方法中的相关操作.
通过以上关于实施方式的描述,所属领域的技术人员可以清楚地了解到,本发明可借助软件及必需的通用硬件来实现,当然也可以通过硬件实现,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如计算机的软盘、只读存储装置(Read-Only Memory,ROM)、随机存取存储装置(RandomAccess Memory,RAM)、闪存(FLASH)、硬盘或光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述的方法。
值得注意的是,上述视频压缩方法的实施例中,所包括的各个单元和模块只是按照功能逻辑进行划分的,但并不局限于上述的划分,只要能够实现相应的功能即可;另外,各功能模块的具体名称也只是为了便于相互区分,并不用于限制本发明的保护范围。
注意,上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员会理解,本发明不限于这里所述的特定实施例,对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本发明的保护范围。因此,虽然通过以上实施例对本发明进行了较为详细的说明,但是本发明不仅仅限于以上实施例,在不脱离本发明构思的情况下,还可以包括更多其他等效实施例,而本发明的范围由所附的权利要求范围决定。

Claims (7)

1.一种视频编码压缩方法,其特征在于,包括:
根据当前帧图像与所述当前帧图像的上一帧图像,确定所述当前帧图像相对于所述上一帧图像的二值差分图像;
根据所述二值差分图像确定所述当前帧图像是否存在感兴趣区域;其中,所述感兴趣区域为所述当前帧图像与所述上一帧图像不相同的区域;
若确定所述当前帧图像存在所述感兴趣区域,则确定所述当前帧图像的所有目标编码单元,针对所述每个目标编码单元,根据所述目标编码单元与所述感兴趣区域的位置关系,确定所述每个目标编码单元的帧间预测模式;
根据每个目标编码单元的帧间预测模式、每个目标编码单元对应的量化参数以及所述当前帧图像,确定所述当前帧图像对应的编码后的数据;
所述根据当前帧图像与所述当前帧图像的上一帧图像,确定所述当前帧图像相对于所述上一帧图像的二值差分图像,包括:
当所述当前帧图像的第一像素点与所述上一帧图像的对应位置的像素点的像素值相同时,确定所述二值差分图像中所述第一像素点的灰度值为0;
当所述当前帧图像的第二像素点与所述上一帧图像的对应位置的像素点的像素值不相同时,确定所述二值差分图像中所述第二像素点的灰度值为255;
相应地,根据所述二值差分图像确定所述当前帧图像是否存在感兴趣区域,包括:
当所述二值差分图像中存在灰度值为255的像素点时,确定所述当前帧图像存在所述感兴趣区域;
在所述针对所述每个目标编码单元,根据所述目标编码单元与所述感兴趣区域的位置关系,确定所述每个目标编码单元的帧间预测模式之前,所述方法还包括:
当所述二值差分图像中,灰度值为255的像素点的个数与所述二值差分图像的像素点的总个数的比值大于预设阈值时,确定所述当前帧图像的运动模式为背景和前景均运动;
当所述二值差分图像中,灰度值为255的像素点的个数与所述二值差分图像的像素点的总个数的比值小于或等于所述预设阈值时,确定所述当前帧图像的运动模式为背景静止和前景运动;
相应地,所述根据所述目标编码单元与所述感兴趣区域的位置关系,确定所述每个目标编码单元的帧间预测模式,包括:
根据所述当前帧图像的运动模式,以及,所述目标编码单元与所述感兴趣区域的位置关系,确定所述每个目标编码单元的帧间预测模式以及所述每个目标编码单元对应的调整后的量化参数;
所述在根据所述二值差分图像确定所述当前帧图像是否存在感兴趣区域之后,所述方法还包括:
若确定所述当前帧图像不存在所述感兴趣区域,则将所述当前帧图像的编码单元中,尺寸为64*64以及32*32的所有编码单元,确定为所述当前帧图像的目标编码单元;
确定所述目标编码单元的帧间预测模式为第六候选帧间预测模式集合中具有最小率失真代价的帧间预测模式,所述目标编码单元对应的调整后的量化参数为所述目标编码单元对应的量化参数加二;其中,所述第六候选帧间预测模式集合包括:SKIP/merge模式和Square模式。
2.根据权利要求1所述的方法,其特征在于,所述若确定所述当前帧图像存在感兴趣区域,则确定所述当前帧图像的所有目标编码单元,包括:
若确定所述当前帧图像存在感兴趣区域,则将所述当前帧图像的编码单元中,尺寸为16*16以及8*8的所有编码单元,确定为所述当前帧图像的目标编码单元。
3.根据权利要求1所述的方法,其特征在于,所述根据所述当前帧图像的运动模式,以及,所述目标编码单元与所述感兴趣区域的位置关系,确定所述每个目标编码单元的帧间预测模式以及所述每个目标编码单元对应的调整后的量化参数,包括:
若所述当前帧图像的运动模式为背景和前景均运动,则:
当所述目标编码单元中包括与所述二值差分图像中灰度值为255的像素点位置相同的像素点时,确定所述目标编码单元的帧间预测模式为第一候选帧间预测模式集合中具有最小率失真代价的帧间预测模式,所述目标编码单元对应的调整后的量化参数为所述目标编码单元对应的量化参数减一;其中,所述第一候选帧间预测模式集合包括:对称分割SMP模式、非对称分割AMP模式和帧内预测intra modes模式;
当所述目标编码单元中不包括与所述二值差分图像中灰度值为255的像素点位置相同的像素点时,确定所述目标编码单元的帧间预测模式为第二候选帧间预测模式集合中具有最小率失真代价的帧间预测模式,所述目标编码单元对应的调整后的量化参数为所述目标编码单元对应的量化参数加一;其中,所述第二候选帧间预测模式集合包括:跳过SKIP/merge模式、正方形分割Square模式和SMP模式;
若所述当前帧图像的运动模式为背景静止和前景运动,则:
当所述目标编码单元中包括与所述二值差分图像中灰度值为255的像素点位置相同的像素点,并且,所述目标编码单元周围的编码单元中不包括与所述二值差分图像灰度值为255的像素点位置相同的像素点时,确定所述目标编码单元的帧间预测模式为第三候选帧间预测模式集合中具有最小率失真代价的帧间预测模式,所述目标编码单元对应的调整后的量化参数为所述目标编码单元对应的量化参数减一;其中,所述第三候选帧间预测模式集合包括:AMP模式和intra modes模式;
当所述目标编码单元中包括与所述二值差分图像中灰度值为255的像素点位置相同的像素点,并且,所述目标编码单元周围的编码单元中也包括与所述二值差分图像中灰度值为255的像素点位置相同的像素点时,确定所述目标编码单元的帧间预测模式为第四候选帧间预测模式集合中具有最小率失真代价的帧间预测模式,所述目标编码单元对应的调整后的量化参数为所述目标编码单元对应的量化参数减三;其中,所述第四候选帧间预测模式集合包括:Square模式和SMP模式;
当所述目标编码单元中不包括与所述二值差分图像中灰度值为255的像素点位置相同的像素点时,确定所述目标编码单元的帧间预测模式为第五候选帧间预测模式集合中具有最小率失真代价的帧间预测模式,所述目标编码单元对应的调整后的量化参数为所述目标编码单元对应的量化参数加二;其中,所述第五候选帧间预测模式集合包括:SKIP/merge模式和Square模式。
4.根据权利要求1或3所述的方法,其特征在于,所述目标编码单元对应的调整后的量化参数的取值范围为:
Figure FDA0003582198040000041
QP=max{0,min{QP,51}},其中,QP表示所述目标编码单元对应的调整后的量化参数,
Figure FDA0003582198040000042
表示所述目标编码单元周围4个已编码的编码单元对应的调整后的量化参数的平均值。
5.一种视频编码压缩装置,其特征在于,包括:
二值差分图像确定模块,用于根据当前帧图像与所述当前帧图像的上一帧图像,确定所述当前帧图像相对于所述上一帧图像的二值差分图像;
感兴趣区域确定模块,用于根据所述二值差分图像确定所述当前帧图像是否存在感兴趣区域;其中,所述感兴趣区域为所述当前帧图像与所述上一帧图像不相同的区域;
第一帧间预测模式确定模块,用于若确定所述当前帧图像存在所述感兴趣区域,则确定所述当前帧图像的所有目标编码单元,针对所述每个目标编码单元,根据所述目标编码单元与所述感兴趣区域的位置关系,确定所述每个目标编码单元的帧间预测模式;
编码模块,用于根据每个目标编码单元的帧间预测模式、每个目标编码单元对应的量化参数以及所述当前帧图像,确定所述当前帧图像对应的编码后的数据;
所述二值差分图像确定模块还包括灰度值设定子模块;
其中,所述灰度值设定子模块,用于当所述当前帧图像的第一像素点与所述上一帧图像的对应位置的像素点的像素值相同时,确定所述二值差分图像中所述第一像素点的灰度值为0;当所述当前帧图像的第二像素点与所述上一帧图像的对应位置的像素点的像素值不相同时,确定所述二值差分图像中所述第二像素点的灰度值为255;
所述感兴趣区域确定模块具体用于当所述二值差分图像中存在灰度值为255的像素点时,确定所述当前帧图像存在所述感兴趣区域;
运动模式确定模块用于:当所述二值差分图像中,灰度值为255的像素点的个数与所述二值差分图像的像素点的总个数的比值大于预设阈值时,确定所述当前帧图像的运动模式为背景和前景均运动;当所述二值差分图像中,灰度值为255的像素点的个数与所述二值差分图像的像素点的总个数的比值小于或等于所述预设阈值时,确定所述当前帧图像的运动模式为背景静止和前景运动;
所述第一帧间预测模式确定模块在根据所述目标编码单元与所述感兴趣区域的位置关系,确定所述每个目标编码单元的帧间预测模式的方面,具体包括帧间预测模式确定子模块;
所述帧间预测模式确定子模块,具体用于根据所述当前帧图像的运动模式,以及,所述目标编码单元与所述感兴趣区域的位置关系,确定所述每个目标编码单元的帧间预测模式以及所述每个目标编码单元对应的调整后的量化参数;
第二帧间预测模式确定模块具体用于:若确定所述当前帧图像不存在所述感兴趣区域,则将所述当前帧图像的编码单元中,尺寸为64*64以及32*32的所有编码单元,确定为所述当前帧图像的目标编码单元;确定所述目标编码单元的帧间预测模式为第六候选帧间预测模式集合中具有最小率失真代价的帧间预测模式,所述目标编码单元对应的调整后的量化参数为所述目标编码单元对应的量化参数加二;其中,所述第六候选帧间预测模式集合包括:SKIP/merge模式和Square模式。
6.一种电子设备,其特征在于,所述设备包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序;
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1-4中任一所述的视频编码压缩方法。
7.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1-4中任一所述的视频编码压缩方法。
CN201811284900.8A 2018-10-31 2018-10-31 视频编码压缩方法、装置、设备和介质 Active CN109379594B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811284900.8A CN109379594B (zh) 2018-10-31 2018-10-31 视频编码压缩方法、装置、设备和介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811284900.8A CN109379594B (zh) 2018-10-31 2018-10-31 视频编码压缩方法、装置、设备和介质

Publications (2)

Publication Number Publication Date
CN109379594A CN109379594A (zh) 2019-02-22
CN109379594B true CN109379594B (zh) 2022-07-19

Family

ID=65390500

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811284900.8A Active CN109379594B (zh) 2018-10-31 2018-10-31 视频编码压缩方法、装置、设备和介质

Country Status (1)

Country Link
CN (1) CN109379594B (zh)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110072103A (zh) * 2019-03-15 2019-07-30 西安电子科技大学 基于roi的视频快速压缩方法、高清视频***、4k视频***
CN110611819B (zh) * 2019-08-01 2021-07-27 杭州当虹科技股份有限公司 一种提升h.264中b帧质量的编码方法
CN110519597B (zh) * 2019-09-05 2022-05-10 北京佳讯飞鸿电气股份有限公司 一种基于hevc的编码方法、装置、计算设备和介质
CN110610150B (zh) * 2019-09-05 2022-10-11 北京佳讯飞鸿电气股份有限公司 一种目标运动物体的跟踪方法、装置、计算设备和介质
CN110728700B (zh) * 2019-09-25 2022-07-19 北京佳讯飞鸿电气股份有限公司 一种运动目标追踪方法、装置、计算机设备及存储介质
CN113301342B (zh) * 2021-05-13 2022-07-22 广州方硅信息技术有限公司 视频编码方法、网络直播方法、装置和终端设备
CN117132669A (zh) * 2022-10-10 2023-11-28 深圳市Tcl云创科技有限公司 图像帧序列处理方法、装置、计算机设备以及存储介质
CN117596394B (zh) * 2024-01-18 2024-05-24 之江实验室 一种自适应精度的深度图帧间压缩方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1750658A (zh) * 2004-09-14 2006-03-22 华为技术有限公司 帧间预测模式的选择方法
CN101090498A (zh) * 2007-07-19 2007-12-19 华为技术有限公司 对图像进行运动检测的装置和方法
CN101159873A (zh) * 2007-11-16 2008-04-09 中国科学院计算技术研究所 一种帧间模式选择方法
CN103679745A (zh) * 2012-09-17 2014-03-26 浙江大华技术股份有限公司 一种运动目标检测方法及装置
CN104113754A (zh) * 2014-07-17 2014-10-22 四川大学 基于时域相关性的高性能视频帧间编码方法及其转码器

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7003035B2 (en) * 2002-01-25 2006-02-21 Microsoft Corporation Video coding methods and apparatuses
US20090317062A1 (en) * 2008-06-24 2009-12-24 Samsung Electronics Co., Ltd. Image processing method and apparatus
CN103618900B (zh) * 2013-11-21 2016-08-17 北京工业大学 基于编码信息的视频感兴趣区域提取方法
TWI571831B (zh) * 2014-01-28 2017-02-21 瑞昱半導體股份有限公司 利用過壓驅動功能進行動態影像之平滑化處理之裝置與方法
CN107580217A (zh) * 2017-08-31 2018-01-12 郑州云海信息技术有限公司 编码方法及其装置

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1750658A (zh) * 2004-09-14 2006-03-22 华为技术有限公司 帧间预测模式的选择方法
CN101090498A (zh) * 2007-07-19 2007-12-19 华为技术有限公司 对图像进行运动检测的装置和方法
CN101159873A (zh) * 2007-11-16 2008-04-09 中国科学院计算技术研究所 一种帧间模式选择方法
CN103679745A (zh) * 2012-09-17 2014-03-26 浙江大华技术股份有限公司 一种运动目标检测方法及装置
CN104113754A (zh) * 2014-07-17 2014-10-22 四川大学 基于时域相关性的高性能视频帧间编码方法及其转码器

Also Published As

Publication number Publication date
CN109379594A (zh) 2019-02-22

Similar Documents

Publication Publication Date Title
CN109379594B (zh) 视频编码压缩方法、装置、设备和介质
US10694179B2 (en) Video coding using hybrid intra prediction
US11265543B2 (en) Method, device, and recording medium storing bit stream, for encoding/decoding image
CA2997462C (en) Image encoding and decoding using pixel adaptive offset process
EP3120556B1 (en) Encoder-side decisions for screen content encoding
WO2020262396A1 (en) Systems and methods for reducing a reconstruction error in video coding based on a cross-component correlation
US8204136B2 (en) Image encoding apparatus
JP2015164346A (ja) 画像復号装置、画像復号方法、画像符号化装置、画像符号化方法及び符号化データのデータ構造
US20200021850A1 (en) Video data decoding method, decoding apparatus, encoding method, and encoding apparatus
CN112889286B (zh) 位置相关预测组合的模式相关和大小相关块级限制的方法和装置
US9832465B2 (en) Image encoding device and image decoding device
WO2017121549A1 (en) Frequency based prediction
JP6373008B2 (ja) 画像符号化装置、画像復号装置、画像符号化方法及び画像復号方法
WO2021070427A1 (en) Systems and methods for reducing a reconstruction error in video coding based on a cross-component correlation
CN109889838A (zh) 一种基于roi区域的hevc快速编码方法
CN112954365A (zh) Hevc帧间运动估算像素搜索改进方法
JP7147145B2 (ja) 動画像符号化装置、動画像符号化方法、及び動画像符号化プログラム
JP2013098713A (ja) 動画像符号化装置、動画像復号装置、動画像符号化方法及び動画像復号方法
JP7293460B2 (ja) 効率的なデブロッキングを実行するための画像処理デバイス及び方法
Hwang Enhanced Coding Tools and Algorithms for Screen Content Video: A Review: A Review
CN116418991A (zh) 处理方法及装置、视频解码方法、视频编码方法及装置
CN116156187A (zh) 图像处理方法、装置、电子设备及存储介质
Lei et al. Fast Mode Decision Algorithm for Coding Depth Maps in 3D High-Efficiency Video Coding.
CN116647683A (zh) 量化处理方法和装置
JP2009033245A (ja) 画像符号化装置、画像符号化方法及びプログラム

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant