CN109561303A - 一种基于视频压缩的预测方法 - Google Patents

一种基于视频压缩的预测方法 Download PDF

Info

Publication number
CN109561303A
CN109561303A CN201811260616.7A CN201811260616A CN109561303A CN 109561303 A CN109561303 A CN 109561303A CN 201811260616 A CN201811260616 A CN 201811260616A CN 109561303 A CN109561303 A CN 109561303A
Authority
CN
China
Prior art keywords
predicted
value
residual
pixel
prediction
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201811260616.7A
Other languages
English (en)
Other versions
CN109561303B (zh
Inventor
田林海
李雯
岳庆冬
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
GUANGDONG HONGSHI DIGITAL MEDIA Co.,Ltd.
Original Assignee
Xian Cresun Innovation Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Xian Cresun Innovation Technology Co Ltd filed Critical Xian Cresun Innovation Technology Co Ltd
Priority to CN201811260616.7A priority Critical patent/CN109561303B/zh
Publication of CN109561303A publication Critical patent/CN109561303A/zh
Application granted granted Critical
Publication of CN109561303B publication Critical patent/CN109561303B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/182Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a pixel
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/184Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being bits, e.g. of the compressed video stream
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/90Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
    • H04N19/96Tree coding, e.g. quad-tree coding

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

本发明涉及一种基于视频压缩的预测方法,包括:获取待预测MB的第一标准差和第二标准差;利用待预测MB的第一预测残差获取待预测MB的第一残差绝对值和;利用待预测MB的第二预测残差获取待预测MB的第二残差绝对值和;根据第一标准差与第一残差绝对值和获取第一残差主观和;根据第二标准差与第二残差绝对值和获取第二残差主观和;根据第一残差主观和与第二残差主观和确定待预测MB的最终预测方法。本发明针对通一待压缩图像选取多种预测方法,待压缩图像根据纹理的相关性自适应性的选择一种预测方法进行预测,从而使得待压缩图像能够针对性的选择预测方法进行预测,极大的改善了视频压缩的质量。

Description

一种基于视频压缩的预测方法
技术领域
本发明涉及一种视频压缩技术领域,特别涉及一种基于视频压缩的预测方法。
背景技术
视频处理技术是伴随着视频从模拟到数字化转变的过程中得到蓬勃发展的。随着人们对视频图像的清晰度、流畅度、实时度的要求越来越苛刻,使其成为了一项炙手可热的技术。同时由于当前周边行业比如Internet、显示设备等产业的兴盛,也推动了视频处理技术的发展。视频处理技术可以细化为,图象增强技术、视频压缩解压缩技术、数字视频广播技术等分支学科,应用于通信、家庭及个人娱乐、安防、医疗、军事等各个行业。其中视频压缩技术尤其被专业人士看好。
迄今,图象压缩标准众多,有静止JPEG、JPEG2000,有运动的M-JPEG、MPEG1、MPEG2、MPEG4、H.261、H.263、WMV-HD、VC1等和最近很热门的H.264以及国内自主知识产权的AVS等等。从H.264高度压缩数字视频编解码标准开始,帧内方向预测编码成了视频帧内块编码的主流技术。
但是,当视频中的待压缩图像的纹理比较复杂时,现有的预测方法受限于有限的信息,不能充分的利用纹理间的相关性对待压缩图像进行有效的预测,从而影响视频压缩的质量。
发明内容
因此,为解决现有技术存在的技术缺陷和不足,本发明提出一种基于视频压缩的预测方法。
具体地,本发明一个实施例提出的一种基于视频压缩的预测方法,包括:
获取待预测MB的第一标准差和第二标准差;
利用所述待预测MB的第一预测残差获取所述待预测MB的第一残差绝对值和;
利用所述待预测MB的第二预测残差获取所述待预测MB的第二残差绝对值和;
根据所述第一标准差与所述第一残差绝对值和获取第一残差主观和;
根据所述第二标准差与所述第一残差绝对值和获取第二残差主观和;
根据所述第一残差主观和与所述第二残差主观和确定所述待预测MB的最终预测方法。
在本发明的一个实施例中,获取所述待预测MB的第一标准差和第二标准差,包括:
获取所述待预测MB的第一预测残差和第一平均残差;
通过所述第一预测残差和所述第一平均残差确定所述第一标准差;
获取所述待预测MB的第二预测残差和第二平均残差;
通过所述第二预测残差和所述第二平均残差确定所述第二标准差。
在本发明的一个实施例中,利用所述待预测MB的第一预测残差获取所述待预测MB的第一残差绝对值和,包括:
确定所述待预测MB的当前像素有K个像素分量,其中,K为大于零的自然数;
获取所述像素分量的第一加权梯度值;
通过所述第一加权梯度值获取所述像素分量的第二加权梯度值;
通过所述第二加权梯度值确定所述像素分量的参考像素值;
将所述像素分量的像素值与所述参考像素值求差得到所述第一预测残差;
根据所述第一预测残差获取所述待预测MB的第一残差绝对值和。
在本发明的一个实施例中,获取所述像素分量的第一加权梯度值,包括:
通过所述像素分量的周围分量,确定所述像素分量的N个纹理方向梯度值,其中,N为大于零的自然数;
利用第一加权系数对所述每个像素分量的纹理方向梯度值进行加权处理,获得所述每个像素分量的第一加权梯度值。
在本发明的一个实施例中,通过所述第一加权梯度值获取所述像素分量的第二加权梯度值,包括:
选取所述第一加权梯度值的最小值;
利用第二加权系数对所述每个像素分量的第一加权梯度值的最小值进行加权处理,获得所述每个像素分量的第二加权梯度值。
在本发明的一个实施例中,通过所述第二加权梯度值确定所述像素分量的参考像素值,包括:
通过所述第二加权梯度值的最小值确定所述像素分量的参考方向;
利用第三加权系数对所述参考方向的分量像素值进行加权处理,获得所述像素分量的参考像素值。
在本发明的一个实施例中,利用所述待预测MB的第二预测残差获取所述待预测MB的第二残差绝对值和,包括:
利用四叉树方法将所述待预测MB分割成多个待预测子MB;
分别获取所述待预测MB的预测残差和第一比特数和所述待预测子MB的预测残差和第二比特数;
通过所述待预测MB的预测残差和第一比特数与所述待预测子MB的预测残差和第二比特数确定所述待预测MB的第二预测残差;
判断所述待预测子MB是否继续分割,若是,则按照四叉树算法继续分割所述待预测子MB,若否,则结束所述待预测子MB的分割,通过所述待预测子MB的第二预测残差获得所述待预测MB的第二残差绝对值和。
在本发明的一个实施例中,分别获取所述待预测MB的预测残差和第一比特数和所述待预测子MB的预测残差和第二比特数,包括:
将所述待预测MB中所有像素分量值分别减去所述待预测MB中像素分量值的最小值,得到所述待预测MB中所有像素分量对应的预测残差;
利用所述待预测MB的第一最少比特数、所述待预测MB的数据比特深度与所述待预测MB的像素分量的数量确定所述第一比特数;
将所述待预测子MB中所有像素分量值分别减去所述待预测子MB中像素分量值的最小值,得到所述待预测子MB中所有像素分量对应的预测残差;
利用所述待预测子MB的第二最少比特数、所述待预测子MB的数据比特深度与所述待预测子MB的像素分量的数量确定所述第二比特数。
在本发明的一个实施例中,通过所述待预测MB的预测残差和第一比特数与所述待预测子MB的预测残差和第二比特数确定所述待预测MB的第二预测残差,包括:
根据所述待预测MB的预测残差和第一比特数确定所述待预测MB的第一加权值;
根据所述待预测子MB的预测残差和第二比特数确定所述待预测MB的第二加权值;
对所述第一加权值与所述第二加权值进行判断;
若所述第一加权值大于所述第二加权值,则继续分割所述待预测子MB;
若所述第一加权值小于所述第二加权值,则选取所述待预测子MB的预测残差作为所述待预测MB的第二预测残差。
在本发明的一个实施例中,根据所述第一残差主观和与所述第二残差主观和确定所述待预测MB的最终预测方法,包括:
选取所述第一残差主观和与所述第二残差主观和中的最小值,通过所述最小值确定所述待预测MB的最终预测方法。
基于此,本发明具备如下优点:
本发明针对通一待压缩图像选取了多种预测方法进行预测,待压缩图像可以根据纹理的相关性自适应性的选择其中一种预测方法进行预测,从而使得待压缩图像能够针对性的选择预测方法进行预测,极大的改善了视频压缩的质量,并且通过选择最优的预测方法进行预测能够进一步降低理论极限熵。
通过以下参考附图的详细说明,本发明的其它方面和特征变得明显。但是应当知道,该附图仅仅为解释的目的设计,而不是作为本发明的范围的限定,这是因为其应当参考附加的权利要求。还应当知道,除非另外指出,不必要依比例绘制附图,它们仅仅力图概念地说明此处描述的结构和流程。
附图说明
下面将结合附图,对本发明的具体实施方式进行详细的说明。
图1为本发明实施例提供的一种基于视频压缩的预测方法流程示意图;
图2为本发明实施例提供的一种像素级多分量参考的自适应方向预测方法的算法原理示意图;
图3为本发明实施例提供的一种参考像素位置示意图;
图4为本发明实施例提供的一种梯度值计算示意图;
图5为本发明实施例提供的另一种像素级多分量参考的自适应方向预测方法的算法原理示意图;
图6为本发明实施例提供的一种基于四叉树的分割方法的示意图;
图7为本发明实施例提供的一种待预测宏块分割方式的示意图;
图8为本发明实施例提供的另一种待预测宏块分割方式的示意图。
具体实施方式
为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图对本发明的具体实施方式做详细的说明。
实施例一
请参见图1,图1为本发明实施例提供的一种基于视频压缩的预测方法流程示意图。该预测方法包括如下步骤:
步骤1、获取待预测MB的第一标准差和第二标准差;
步骤2、利用所述待预测MB的第一预测残差获取所述待预测MB的第一残差绝对值和;
步骤3、利用所述待预测MB的第二预测残差获取所述待预测MB的第二残差绝对值和;
步骤4、根据所述第一标准差与所述第一残差绝对值和获取第一残差主观和;
步骤5、根据所述第二标准差与所述第二残差绝对值和获取第二残差主观和;
步骤6、根据所述第一残差主观和与所述第二残差主观和确定所述待预测MB的最终预测方法。
具体地,为了更好的说明基于视频压缩的预测方法,本实施例将对该预测方法进行详细描述:
S1、设定待预测MB的大小为m*n,其中,m和n为大于零的自然数。
S2、根据像素级多分量参考的自适应方向预测方法对待预测MB进行预测,并根据残差绝对值和计算公式计算待预测MB的第一残差绝对值和SAD1,第一残差绝对值和SAD1求得的为待预测MB中所有的第一预测残差的绝对值和,其中,残差绝对值和计算公式为:
其中,SAD为残差绝对值和,ABS为求绝对值,Res为预测残差,k为预测方法所对应的序号,像素级多分量参考的自适应方向预测方法对应的k为1,计算第一残差绝对值SAD1时对应的为待预测MB的所有第一预测残差。
S3、根据基于四叉树的视频压缩预测方法对待预测MB进行预测,并根据残差绝对值和计算公式计算待预测MB的第二残差绝对值和SAD2,第一残差绝对值SAD2求得的为待预测MB的所有第二预测残差的绝对值和,基于四叉树的视频压缩预测方法对应的k为2。
S4、利用标准差计算公式计算像素级多分量参考的自适应方向预测方法对应的第一标准差E1,基于四叉树的视频压缩预测方法对应的第二标准差E2,其中,标准差计算公式为:
其中,E为标准差,ABS为求绝对值,Res为预测残差,AVE为平均残差,k为预测方法所对应的序号,k的取值为1和2,当k为1时,对应的为像素级多分量参考的自适应方向预测方法,当k为2时,对应的为基于四叉树的视频压缩预测方法。计算第一标准差E1时对应的为第一预测残差,计算第二标准差E2时对应的为第二预测残差,。
步骤5、最终根据SAD1、SAD2、E1和E2的情况,分场景配置权重系数a3和a4,根据SUBD(subjectivedifference,残差主观和)计算公式计算SUBD,其中,像素级多分量参考的自适应方向预测方法对应SUBD1,基于四叉树的视频压缩预测方法对应SUBD2
SUBDk=a1×SADk+a2×Ek
其中,a3和a4为权重系数,SAD为残差绝对值和,E为标准差,Res为预测残差,k为预测模式所对应的序号,其中,k为1时对应像素级多分量参考的自适应方向预测方法,k为2时对应基于四叉树的视频压缩预测方法。
比较SUBD1和SUBD2,选用其中最小的SUBD所对应的预测方法为最终预测方法,采用该最终预测方法的预测残差为最终预测残差;并在码流中传输该最终预测方法的预测残差和附加标志位,附加标志位为该最终预测方法所对应的序号,附加标志位为1时对应像素级多分量参考的自适应方向预测方法,附加标志位为k为2时对应基于四叉树的视频压缩预测方法。
当待压缩图像的纹理较为复杂时,通过两种预测方法分别对其进行预测,根据预测结果从两种预测方法中选取最优的预测方法作为最终的预测方法,能够进一步降低理论极限熵,根据待压缩图像的纹理特征进行预测方法的选择,提高了预测方法的自适应性,并且提高了纹理复杂的待压缩图像的压缩质量,改善了预测效果。
本发明针对通一待压缩图像选取了两种预测方法进行预测,待压缩图像可以根据纹理的相关性自适应性的选择其中一种预测方法进行预测,从而使得待压缩图像能够针对性的选择预测方法进行预测,极大的改善了视频压缩的质量,并且通过选择最优的预测方法进行预测能够进一步降低理论极限熵。
实施例二
请参见图2和图3,图2为本发明实施例提供的一种像素级多分量参考的自适应方向预测方法的算法原理示意图,图3为本发明实施例提供的一种参考像素位置示意图。本实施例在上述实施例的基础上对本发明提出的像素级多分量参考的自适应方向预测方法进行详细描述,该预测方法包括如下步骤:
S1、定义待预测MB的大小为m*n,其中,m和n为大于零的自然数;
S2、定义待预测MB的当前像素有K个像素分量,其中,K为大于零的自然数,所述K个像素分量分别为像素分量1、像素分量2……像素分量K;
S3、对于当前像素的每个像素分量,通过每个像素分量的周围像素分量,确定每个像素分量的N个纹理方向梯度值G1~GN,其中,N为大于零的自然数;
优选地,每个像素分量的周围分量,可与该像素分量相邻,也可不相邻;如图3所示,Cur代表当前像素分量,周围像素分量可以为GHIK,也可以为ABCDEFJ。
S4、将每个像素分量的N个纹理方向梯度值G1~GN进行加权处理(G1~GN既代表纹理方向梯度值的大小,也代表纹理方向梯度值的方向),得到N个纹理方向梯度值经加权处理后的第一加权梯度值BG,第一加权梯度值BG的计算公式如下:
BGi=w1*G1+w2*G2+…+wN*GN(i=1…K)
其中,w1、w2…wN为第一加权系数,w1、w2…wN可以相同也可以不同;对应的,BG1为像素分量1的第一加权梯度值,BG2为像素分量2的第一加权梯度值,依次类推,BGK为像素分量K的第一加权梯度值。
在一种实施方式中,w1、w2…wN可以是预先自行设定的固定值。更进一步的,并且,配置w1、w2…wN的相对大小时,可以考虑先验经验。例如,从以往的经验得知,在梯度值G1的这个方向可能更加适合本图像做预测的实际情况,则可以将w1配置一个更加适合本图像做预测的实际情况的值(例如,可以将w1配置很小),以增加在梯度值G1的这个方向的权重。当然,w1、w2…wN也可以是自适应的,即可以根据早期预测处理的实际情况,灵活调整w1、w2…wN的相对大小,具体地w1+w2+…+wN=1。
优选地,第一加权梯度值BG,可用对应的像素分量的像素值差的绝对值表示,但是不限于此。
优选地,选取多组w1、w2…wN的值,得到多个第一加权梯度值,第一加权梯度值BG取最小值,可以得到每个像素分量的第一加权梯度值的最优值BGbst。
S5、将K个像素分量的第一加权梯度值的最优值BGbst进行加权处理,可以得到第一加权梯度值的最优值经加权处理后的第二加权梯度值BG",第二加权梯度值BG"的计算公式如下:
BG"i=t1*BGbst1+t2*BGbst2+…+tK*BGbstK(i=1…K)
其中,t1、t2…tK为第二加权系数,t1、t2…tK可以相同也可以不同;BGbst1为像素分量1的第一加权梯度值的最优值,BGbst2为像素分量2的第一加权梯度值的最优值,依次类推,BGbstK为像素分量K的第一加权梯度值的最优值,BG"1为像素分量1的第二加权梯度值,BG"2为像素分量2的第二加权梯度值,依次类推,BG"K为像素分量K的第二加权梯度值,确定出每个像素分量的第二加权梯度值BG"的最优值BG"bst。
优选地,根据每个像素分量与对应第一加权梯度值的最优值BGbst的关系,设置加权系数t1、t2和t3获得每个像素分量的第二加权梯度值的最优值BGbst。
优选地,当前像素分量下的第一加权梯度值的最优值BGbst加权系数值最大,与当前像素分量距离逐渐增加的其它像素分量下的第一加权梯度值的最优值BGbst加权系数值逐渐减小,加权系数值的总和为1,具体为t1+t2+t3=1。
优选地,第二加权梯度值BG"取最小值,可以得到每个像素分量的第二加权梯度值的最优值BG"bst。
第二加权梯度值的最优值BG"bst对应的方向即为该像素分量的参考方向Dir。
S6、将每个像素分量的参考方向上所有可用的像素分量的像素值进行加权处理,得到每个像素分量的参考像素值Ref,参考像素值Ref计算公式如下所示:
Refi=r1*cpt1+r2*cpt2+…+rN*cptN(i=1…K)
其中,r1、r2…rN为第三加权系数,r1、r2…rN可以相同也可以不同;cpt1~cptN为每个像素分量的参考方向上N个可用的像素分量的像素值;Ref1为像素分量1的参考像素值,Ref2为像素分量2的参考像素值,依次类推,RefK为像素分量K的参考像素值。
S7、将当前像素分量的像素值减去对应的参考像素值,可以得到当前像素分量的第一预测残差Dif;公式如下:
Difi=Curcpti-Refi(i=1…K)
其中,Curcpt1为像素分量1的像素值,Curcpt2为像素分量2的像素值,依次类推,CurcptK为像素分量K的像素值;Dif1为像素分量1的预测残差,Dif2为像素分量2的预测残差,依次类推,DifK为像素分量K的预测残差。
S8、当前像素的其余分量,重复S3~S7,即得到该当前像素所有像素分量的第一预测残差。
优选地,多分量可以并行处理,也可以串行处理,具体依据应用规格场景需要。
本实施例通过对当前像素的多个像素分量进行加权处理,可以更加合理的确定当前像素分量的预测方向,尤其是当纹理比较复杂时,可以起到更好的预测方向纠偏效果。并且该方法,可以均衡像素分量的多个相邻像素间的纹理预测方向,减少单个像素分量预测误判的可能性,最终进一步降低预测的理论极限熵,本发明还可以将多个像素分量并行处理,更利于实现预测方法的并行化处理。相对于串行分量处理的时间长效率低,并行处理可以成倍提高处理速度,利于预测算法的硬件实现。
实施例三
请参见图4和图5,图4为本发明实施例提供的一种梯度值计算示意图;图5为本发明实施例提供的另一种像素级多分量参考的自适应方向预测方法的算法原理示意图。本实施例在上述实施例的基础上对本发明提出的像素级多分量参考的自适应方向预测方法举例描述。本实施例将当前像素的像素分为Y、U、V三个分量,具体步骤如下:
S1、定义待预测MB的大小为m*n,其中,m和n为大于零的自然数;
S2、定义待预测MB的当前像素有三个像素分量,分别为像素分量Y、像素分量U、像素分量V;
S3、对于当前像素的三个像素分量,通过每个像素分量的周围分量,确定每个像素分量的3个纹理方向梯度值G1、G2和G3;
优选地,对于像素分量Y、像素分量U、像素分量V,分别根据图4所示,可以得到ABS(K-H)为45度纹理方向梯度值,ABS(K-G)为90度纹理方向梯度值,ABS(K-F)为135度纹理方向梯度值,ABS(K-J)为180度纹理方向梯度值,其中,ABS为绝对值运算。
S4、对于像素分量Y、像素分量U、像素分量V的3个纹理方向梯度值G1、G2、G3进行加权处理,分别得到每一个像素分量的第一加权梯度值BG,查找每一个像素分量的第一加权梯度值的最小值BGmin,作为第一加权梯度值的最优值。
S5、将3个像素分量的第一加权梯度值的最小梯度值进行加权处理,得出第一加权梯度值的最优值经加权处理后的第二加权梯度值BG",并查找出第二加权梯度值的最小值BG"min作为第二加权梯度值BG"的最优值BG"bst。加权计算如下:
BG"minY=0.5*BGminY+0.7*BGminU+0.7*BGminV
BG"minU=0.5*BGminY+0.3*BGminU+0.4*BGminV
BG"minY=0.5*BGminY+0.4*BGminU+0.3*BGminV
其中,BG"minY为像素分量Y第二加权梯度值的最小值,BG"minU为像素分量U第二加权梯度值的最小值,BG"minV为像素分量V第二加权梯度值的最小值,BGminY为像素分量Y第一加权梯度值的最小值,BGminU为像素分量U第一加权梯度值的最小值,BGminV为像素分量V第一加权梯度值的最小值。
其中,BG"min的方向为当前像素分量的参考方向Dir,即DirY为像素分量Y的参考方向,DirU为像素分量U的参考方向,DirV为像素分量V的参考方向。
S5、将像素分量Y、像素分量U、像素分量V三个像素分量的参考方向上的二个分量像素值进行加权,得到参考像素值Ref三个分量的参考像素值Ref,参考像素值Ref计算公式如下所示:
RefY=r1*cpt1+r2*cpt2
RefU=r1*cpt1+r2*cpt2
RefV=r1*cpt1+r2*cpt2
其中,RefY为像素分量Y的参考像素值,RefU为像素分量U的参考像素值,RefV为像素分量V的参考像素值,cpt1、cpt2为每个参考方向的分量像素值,r1和r2为第三加权系数。
优选地,对于任意像素分量,若为45度参考,那么参考像素值REF为0.8*I+0.2E;若为90度参考,那么参考像素值为0.8*H+0.2C;若为135度参考,那么参考像素值为0.8*G+0.2A;若为180度参考,那么参考像素值为0.8*K+0.2J。
S36、将当前像素分量的像素值减去对应的参考像素值,可以得到当前像素分量的第一预测残差Res,第一预测残差Res计算公式如下:
ResY=CurcptY-RefY
ResU=CurcptU-RefU
ResV=CurcptV-RefV
其中,CurcptY为像素分量Y的像素值,CurcptU为像素分量U的像素值,CurcptV为像素分量V的像素值;ResY为像素分量Y的第一预测残差,ResU为像素分量U的第一预测残差,ResV为像素分量V的第一预测残差。
本发明通过对R、G、B三个像素分量的多方向梯度加权处理,可以更加合理的确定当前像素分量的预测方向,尤其是当纹理复杂时,可以起到更好的预测方向纠偏效果。并且该方法可以均衡同位置R、G、B三个像素分量之间的纹理预测方向,减少单个像素分量预测误判的可能性,最终进一步降低预测的理论极限熵,本发明还可以将多分量并行处理,更利于实现预测方法的并行化处理。相对于串行分量处理的时间长效率低,并行处理可以成倍提高处理速度,利于预测算法的硬件实现。
实施例四
请参见图6~图8,图6为本发明实施例提供的一种基于四叉树的分割方法的示意图,图7为本发明实施例提供的一种待预测宏块分割方式的示意图,图8为本发明实施例提供的另一种待预测宏块分割方式的示意图。本实施例在上述实施例的基础上对本发明提出的基于四叉树的视频压缩预测方法进行详细介绍。
视频通常可以包括一系列图片,每个图片可以被分成或划分成预定区域,如帧或MB。当视频的区域被划分成MB时,根据编码方法,划分MB可以被分类成帧内MB或帧间MB。帧内MB是指通过帧内预测编码方法编码的MB。帧内预测编码方法通过使用其中执行当前编码的当前图片中的之前经受编码和解码的重构块的像素,预测待预测MB的像素,以产生预测MB,然后编码待预测MB的像素和待预测MB的像素之间的差值。
在本发明中,如图6所示,编码对象可以为一个64×64规格的图像MB,也可以为一个16×16规格图像MB,更或者是具有更小或更大尺寸规格的图像宏块。例如,将待预测MB按照四叉树算法进行递归分割,每个待预测MB被分割为四个相同大小的待预测子MB。每个待预测子MB是否再继续进行分割由预设算法判断。
假设待预测MB为64×64规格,将64×64的待预测MB作为根节点,位于第一层。通过预设算法判断出需要将继续分割时,该节点被分为4个32×32的待预测子MB,形成第二层。通过预设算法判断出第二层右上待预测子MB和第二层左下待预测子MB不需要继续分割,第二层左上待预测子MB和第二层右下待预测子MB需要继续分割,将第二层左上待预测子MB分割为4个16×16的待预测子MB,将第二层右下待预测子MB分割为4个16×16的待预测子MB,形成第三层,依次递归,直至第N层。如图7所示,为该64×64规格的待预测MB的最终分割方式。
本实施例的预测方法包括如下步骤:
S1、将待预测MB按照四叉树算法进行分割,如图8所示,待预测MB分割后的待预测子MB分别为第一待预测子MB、第二待预测子MB、第三待预测子MB以及第四待预测子MB。
S2、根据原始待预测MB获取待预测MB的第一比特数以及预测残差,具体地,计算待预测MB中像素分量最大值与待预测MB中像素分量最小值之间的差值,得到表示差值的第一最少比特数,根据第一最少比特数以及待预测MB的数据比特深度计算得到待预测MB的第一比特数,其中待预测MB的第一比特数满足如下公式:
MBIT1=M*BIT_MIN1+2*BITDETH
其中,MBIT1为待预测MB的第一比特数,BIT_MIN1为第一最少比特数,BITDEPTH为待预测MB的数据比特深度,M为待预测MB中的像素分量数量。
将待预测MB中所有像素分量值分别减去待预测MB中所有像素分量值的最小值,得到待预测MB中所有像素分量对应的预测残差。
S3、根据分割后的每个待预测子MB获取每个待预测子MB对应的第二比特数以及预测残差,具体地,计算第一待预测子MB中像素分量最大值与第一待预测子MB中像素分量最小值之间的第二差值,得到表示第一待预测子MB的第二最少比特数;
计算第二待预测子MB中像素分量最大值与第二待预测子MB中像素分量最小值之间的第三差值,得到表示第二待预测子MB的第三最少比特数;计算第三待预测子MB中像素分量最大值与第三待预测子MB中像素分量最小值之间的第四差值,得到表示第三待预测子MB的第四最少比特数;计算第四待预测子MB中像素分量最大值与第四待预测子MB中像素分量最小值之间的第五差值,得到表示第四待预测子MB的第五最少比特数;根据第二最少比特数、第三最少比特数、第四最少比特数、第五最少比特数以及待预测MB的数据比特深度计算得到第二比特数,其中第二比特数满足如下公式:
MBIT2=N1*BIT_MIN2+N2*BIT_MIN3+N3*BIT_MIN4+N4*BIT_MIN5+2*BITDETH其中,MBIT2为第二比特数,BIT_MIN2为第二最少比特数,BIT_MIN3为第三最少比特数,BIT_MIN4为第四最少比特数,BIT_MIN5为第五最少比特数,BITDEPTH为待预测MB的数据比特深度,N1为第一待预测子MB中像素分量数量,N2为第二待预测子MB中像素分量数量,N3为第三待预测子MB中像素分量数量,N4为第四待预测子MB中像素分量数量。
将第一待预测子MB中所有像素分量值分别减去第一待预测子MB中所有像素分量值的最小值,第二待预测子MB中所有像素分量值分别减去第二待预测子MB中所有像素分量值的最小值,第三待预测子MB中所有像素分量值分别减去第三待预测子MB中所有像素分量值的最小值,第四待预测子MB中所有像素分量值分别减去第四待预测子MB中所有像素分量值的最小值,得到分割后的所有待预测子MB中所有像素分量对应的第二预测残差。
S4、根据第一比特数、待预测MB的预测残差、第二比特数以及待预测子MB的预测残差判断是否对待预测MB继续进行分割;若是,则跳转到步骤1,按照递归算法将每个待预测个子MB分别执行步骤1~步骤4进行分割;若否,则结束待预测子MB的分割。
具体地,根据待预测MB的预测残差得到待预测MB的第一重建值,求第一重建值与待预测MB的像素值求差的绝对值,得到第一重建差值,将第一重建差值以及第一比特数进行加权得到待预测MB的第一加权值,其中,第一加权值满足如下公式:
RDO1=a1*MBIT1+b1*RES1
其中,RDO1为第一加权值,MBIT1为第一比特数,RES1为第一重建差值,a1和b1为加权系数。
a1和b1的取值可以是预先设定的固定值,进一步地,a1+b1=1,优选地,a1可以选取为0.5,b1可以选取为0.5,a1和b1也可以灵活调整大小。
其中,重建像素分量指已压缩图像解压重建得到的像素分量,重建像素分量的像素值通常称为重建值。进一步地,根据预测残差可以得到重建像素分量,即将参考值(每个宏块像素分量的最小值)加上预测残差可以得到重建像素分量。
根据第二预测残差得到分割后的待预测子MB的第二重建值,求第二重建值与分割后的待预测子MB的像素值求差的绝对值,得到第二重建差值,将第二重建差值以及第二比特数进行加权得到分割后的待预测子MB的第二加权值,其中,第二加权值满足如下公式:
RDO2=a2*MBIT2+b2*RES2
其中,RDO2为第二加权值,MBIT2为第二比特数,RES2为第二重建差值,a2和b2为加权系数。
a2和b2的取值可以是预先设定的固定值,进一步地,a2+b2=1,优选地,a2可以选取为0.5,b2可以选取为0.5,a2和b2也可以灵活调整大小。
比较第一加权值与第二加权值的大小,若第一加权值大于第二加权值,则将待预测子MB按照四叉树算法进行分割,将每个待预测子MB分别执行步骤1~步骤4进行判断是否继续进行分割,即按照递归算法,判断是否进行第三次分割、第四次分割直至第N次分割。反之,若第一加权值小于第二加权值则待预测MB不进行分割。
S5、输出待预测MB最终分割层次下,每个待预测子MB的预测残差以及像素分量中的最小值,并将最终分割层次下的待预测子MB的预测残差作为第二预测残差。
本发明基于四叉树的视频压缩预测方法,是根据待预测MB的比特数和预测残差以及待预测子MB的比特和预测残差判断是否继续分割的,通过这种方式能针对性的待预测MB进行分割,从而当待压缩图像的纹理较为复杂时,可以根据纹理的相关性确定最终的分割层次,通过这种分割方式进行预测,能够提高压缩效率,并提高主观图片质量,而且对于复杂纹理图像处理,该预测方法效果好、处理效率高,且能够降低理论极限熵。
综上所述,本文中应用了具体个例对本发明一种基于视频压缩预测方法进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制,本发明的保护范围应以所附的权利要求为准。

Claims (10)

1.一种基于视频压缩的预测方法,其特征在于,包括:
获取待预测MB的第一标准差和第二标准差;
利用所述待预测MB的第一预测残差获取所述待预测MB的第一残差绝对值和;
利用所述待预测MB的第二预测残差获取所述待预测MB的第二残差绝对值和;
根据所述第一标准差与所述第一残差绝对值和获取第一残差主观和;
根据所述第二标准差与所述第二残差绝对值和获取第二残差主观和;
根据所述第一残差主观和与所述第二残差主观和确定所述待预测MB的最终预测方法。
2.根据权利要求1所述的方法,其特征在于,获取待预测MB的第一标准差和第二标准差,包括:
获取所述待预测MB的第一预测残差和第一平均残差;
通过所述第一预测残差和所述第一平均残差确定所述第一标准差;
获取所述待预测MB的第二预测残差和第二平均残差;
通过所述第二预测残差和所述第二平均残差确定所述第二标准差。
3.根据权利要求1所述的方法,其特征在于,利用所述待预测MB的第一预测残差获取所述待预测MB的第一残差绝对值和,包括:
确定所述待预测MB的当前像素有K个像素分量,其中,K为大于零的自然数;
获取所述像素分量的第一加权梯度值;
通过所述第一加权梯度值获取所述像素分量的第二加权梯度值;
通过所述第二加权梯度值确定所述像素分量的参考像素值;
将所述像素分量的像素值与所述参考像素值求差得到所述第一预测残差;
根据所述第一预测残差获取所述待预测MB的第一残差绝对值和。
4.根据权利要求3所述的方法,其特征在于,获取所述像素分量的第一加权梯度值,包括:
通过所述像素分量的周围分量,确定所述像素分量的N个纹理方向梯度值,其中,N为大于零的自然数;
利用第一加权系数对所述每个像素分量的纹理方向梯度值进行加权处理,获得所述每个像素分量的第一加权梯度值。
5.根据权利要求3所述的方法,其特征在于,通过所述第一加权梯度值获取所述像素分量的第二加权梯度值,包括:
选取所述第一加权梯度值的最小值;
利用第二加权系数对所述每个像素分量的第一加权梯度值的最小值进行加权处理,获得所述每个像素分量的第二加权梯度值。
通过所述第二加权梯度值确定所述每个像素分量的参考方向。
6.根据权利要求3所述的方法,其特征在于,通过所述第二加权梯度值确定所述像素分量的参考像素值,包括:
通过所述第二加权梯度值的最小值确定所述像素分量的参考方向;
利用第三加权系数对所述参考方向的分量像素值进行加权处理,获得所述像素分量的参考像素值。
7.根据权利要求1所述的方法,其特征在于,利用所述待预测MB的第二预测残差获取所述待预测MB的第二残差绝对值和,包括:
利用四叉树方法将所述待预测MB分割成多个待预测子MB;
分别获取所述待预测MB的预测残差和第一比特数和所述待预测子MB的预测残差和第二比特数;
通过所述待预测MB的预测残差和第一比特数与所述待预测子MB的预测残差和第二比特数确定所述待预测MB的第二预测残差;
判断所述待预测子MB是否继续分割,若是,则按照四叉树算法继续分割所述待预测子MB,若否,则结束所述待预测子MB的分割,通过所述待预测子MB的第二预测残差获得所述待预测MB的第二残差绝对值和。
8.根据权利要求7所述的方法,其特征在于,分别获取所述待预测MB的预测残差和第一比特数和所述待预测子MB的预测残差和第二比特数,包括:
将所述待预测MB中所有像素分量值分别减去所述待预测MB中像素分量值的最小值,得到所述待预测MB中所有像素分量对应的预测残差;
利用所述待预测MB的第一最少比特数、所述待预测MB的数据比特深度与所述待预测MB的像素分量的数量确定所述第一比特数;
将所述待预测子MB中所有像素分量值分别减去所述待预测子MB中像素分量值的最小值,得到所述待预测子MB中所有像素分量对应的预测残差;
利用所述待预测子MB的第二最少比特数、所述待预测子MB的数据比特深度与所述待预测子MB的像素分量的数量确定所述第二比特数。
9.根据权利要求7所述的方法,其特征在于,通过所述待预测MB的预测残差和第一比特数与所述待预测子MB的预测残差和第二比特数确定所述待预测MB的第二预测残差,包括:
根据所述待预测MB的预测残差和第一比特数确定所述待预测MB的第一加权值;
根据所述待预测子MB的预测残差和第二比特数确定所述待预测MB的第二加权值;
对所述第一加权值与所述第二加权值进行判断;
若所述第一加权值大于所述第二加权值,则继续分割所述待预测子MB;
若所述第一加权值小于所述第二加权值,则选取所述待预测子MB的预测残差作为所述待预测MB的第二预测残差。
10.根据权利要求1所述的方法,其特征在于,根据所述第一残差主观和与所述第二残差主观和确定所述待预测MB的最终预测方法,包括:
选取所述第一残差主观和与所述第二残差主观和中的最小值,通过所述最小值确定所述待预测MB的最终预测方法。
CN201811260616.7A 2018-10-26 2018-10-26 一种基于视频压缩的预测方法 Active CN109561303B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811260616.7A CN109561303B (zh) 2018-10-26 2018-10-26 一种基于视频压缩的预测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811260616.7A CN109561303B (zh) 2018-10-26 2018-10-26 一种基于视频压缩的预测方法

Publications (2)

Publication Number Publication Date
CN109561303A true CN109561303A (zh) 2019-04-02
CN109561303B CN109561303B (zh) 2020-12-15

Family

ID=65865385

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811260616.7A Active CN109561303B (zh) 2018-10-26 2018-10-26 一种基于视频压缩的预测方法

Country Status (1)

Country Link
CN (1) CN109561303B (zh)

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102281434A (zh) * 2010-06-10 2011-12-14 ***通信集团公司 一种视频压缩方法及设备
CN102595135A (zh) * 2012-02-24 2012-07-18 中国科学技术大学 一种可伸缩视频编码的方法及装置
CN102917197A (zh) * 2011-08-04 2013-02-06 想象技术有限公司 运动估计***中的外部矢量
CN103517069A (zh) * 2013-09-25 2014-01-15 北京航空航天大学 一种基于纹理分析的hevc帧内预测快速模式选择方法
US20140205015A1 (en) * 2011-08-25 2014-07-24 Telefonaktiebolaget L M Ericsson (Publ) Depth Map Encoding and Decoding
CN106034235A (zh) * 2015-03-11 2016-10-19 杭州海康威视数字技术股份有限公司 计算编码失真度和编码模式控制的方法及其***
CN107509076A (zh) * 2017-08-25 2017-12-22 中国软件与技术服务股份有限公司 一种面向超高清视频的编码优化方法

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102281434A (zh) * 2010-06-10 2011-12-14 ***通信集团公司 一种视频压缩方法及设备
CN102917197A (zh) * 2011-08-04 2013-02-06 想象技术有限公司 运动估计***中的外部矢量
US20140205015A1 (en) * 2011-08-25 2014-07-24 Telefonaktiebolaget L M Ericsson (Publ) Depth Map Encoding and Decoding
CN102595135A (zh) * 2012-02-24 2012-07-18 中国科学技术大学 一种可伸缩视频编码的方法及装置
CN103517069A (zh) * 2013-09-25 2014-01-15 北京航空航天大学 一种基于纹理分析的hevc帧内预测快速模式选择方法
CN106034235A (zh) * 2015-03-11 2016-10-19 杭州海康威视数字技术股份有限公司 计算编码失真度和编码模式控制的方法及其***
CN107509076A (zh) * 2017-08-25 2017-12-22 中国软件与技术服务股份有限公司 一种面向超高清视频的编码优化方法

Also Published As

Publication number Publication date
CN109561303B (zh) 2020-12-15

Similar Documents

Publication Publication Date Title
CN104935938B (zh) 一种混合视频编码标准中帧间预测方法
RU2544799C2 (ru) Устройство кодирования движущихся изображений, устройство декодирования движущихся изображений, способ кодирования движущихся изображений и способ декодирования движущихся изображений
US20140126635A1 (en) Optimal intra prediction in block-based video coding
CN105430415B (zh) 一种3d‑hevc深度视频帧内快速编码方法
TWI690199B (zh) 視頻編碼幀內預測方法和裝置
CN103248895B (zh) 一种用于hevc帧内编码的快速模式估计方法
KR20110134319A (ko) 고해상도 영상의 부호화/복호화 방법 및 이를 수행하는 장치
CN105959698A (zh) 用于基于变换和反变换执行内插的方法和设备
CN108259898A (zh) 基于质量可伸缩视频编码qshvc的帧内快速编码方法
Hu et al. Optimized spatial recurrent network for intra prediction in video coding
CN113507609B (zh) 一种基于时空域预测的帧间图像并行编码方法
CN109688411B (zh) 一种视频编码率失真代价估计方法和装置
CN109561303A (zh) 一种基于视频压缩的预测方法
CN109547788B (zh) 图像压缩方法、设备及图像传输***
CN110677644A (zh) 一种视频编码、解码方法及视频编码帧内预测器
CN109474799A (zh) 基于视频监控的图像存储方法及其***
CN113055678B (zh) 一种基于相邻像素相关性的测量域压缩感知编码算法
TWI698118B (zh) 影像內插方法以及影像編碼方法
CN109379599A (zh) 基于视频编码的复杂纹理预测方法
CN110049339A (zh) 图像编码中的预测方向选取方法、装置和存储介质
CN109587481B (zh) 视频编码方法及设备
CN109510995A (zh) 一种基于视频压缩的预测方法
Hu et al. Low-complexity progressive image transmission scheme based on quadtree segmentation
CN109660793B (zh) 用于带宽压缩的预测方法
CN109561301A (zh) 一种视频压缩中的预测方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right
TA01 Transfer of patent application right

Effective date of registration: 20201127

Address after: No. 02, 1701, No. 17, Zhujiang West Road, Tianhe District, Guangzhou City, Guangdong Province

Applicant after: GUANGDONG HONGSHI DIGITAL MEDIA Co.,Ltd.

Address before: 710065 No. 86 Leading Times Square (Block B), No. 2, Building No. 1, Unit 22, Room 12202, No. 51, High-tech Road, Xi'an High-tech Zone, Shaanxi Province

Applicant before: Xi'an Cresun Innovation Technology Co.,Ltd.

GR01 Patent grant
GR01 Patent grant