CN101778275B - 一种自适应时间域和空间域分辨率框架的图像处理方法 - Google Patents

一种自适应时间域和空间域分辨率框架的图像处理方法 Download PDF

Info

Publication number
CN101778275B
CN101778275B CN2009101048685A CN200910104868A CN101778275B CN 101778275 B CN101778275 B CN 101778275B CN 2009101048685 A CN2009101048685 A CN 2009101048685A CN 200910104868 A CN200910104868 A CN 200910104868A CN 101778275 B CN101778275 B CN 101778275B
Authority
CN
China
Prior art keywords
image
code check
resolution ratio
image processing
value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN2009101048685A
Other languages
English (en)
Other versions
CN101778275A (zh
Inventor
马国强
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Temobi Science and Technology Co Ltd
Original Assignee
Shenzhen Temobi Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Temobi Science and Technology Co Ltd filed Critical Shenzhen Temobi Science and Technology Co Ltd
Priority to CN2009101048685A priority Critical patent/CN101778275B/zh
Priority to US12/746,175 priority patent/US8311097B2/en
Priority to PCT/CN2009/073590 priority patent/WO2010078759A1/zh
Priority to EP09833910.4A priority patent/EP2234401A4/en
Publication of CN101778275A publication Critical patent/CN101778275A/zh
Application granted granted Critical
Publication of CN101778275B publication Critical patent/CN101778275B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/107Selection of coding mode or of prediction mode between spatial and temporal predictive coding, e.g. picture refresh
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • H04N19/147Data rate or code amount at the encoder output according to rate distortion criteria
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/172Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a picture, frame or field
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/189Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding
    • H04N19/19Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding using optimisation based on Lagrange multipliers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/30Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
    • H04N19/31Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability in the temporal domain
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/59Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving spatial sub-sampling or interpolation, e.g. alteration of picture size or resolution
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/80Details of filtering operations specially adapted for video compression, e.g. for pixel interpolation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/85Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression
    • H04N19/87Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression involving scene cut or scene change detection in combination with video compression

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

本发明涉及视频图象处理领域,提供了一种自适应时间域和空间域分辨率框架的图像处理方法。所述方法包括以下步骤:A.编码器根据输入的视频图像和目标分配码率的变化计算并获得临界码率条件值;B.编码器将所述临界码率条件值与阈值进行比较,若所述临界码率条件值小于阈值即所述的目标分配码率小于所述临界码率时通过下采样获得适应于所述目标分配码率的图像分辨率,否则进行常规编码处理;C.解码器通过上采样恢复接收图像的原始分辨率并进行平滑处理。采用本发明的方法,能够保证在低码率的情况下,不会由于编码器的过压缩或过量化造成解码器解码的图像产生严重失真。

Description

一种自适应时间域和空间域分辨率框架的图像处理方法
技术领域
本发明涉及视频图象处理领域,更具体地说,涉及一种自适应时间域和空间域分辨率框架的图像处理方法。
背景技术
在窄带视频通信应用领域,由于传输带宽的限制,需要降低视频图像编码码率,在较低的编码码率下传输的图象有很大概率都处于过压缩状态,继而引起的方块效应、量化噪声等对视频图像的主观效果会产生比较明显的损伤。在编码器中,造成过压缩的原因主要是由过量化引起的,具体表现在两种情况:(1)量化系数Qp过高,使得量化步长偏大,不能反映视频图像的细节变化,结果导致视频图象的高频部分失真过大,视频图象的细节损失比较严重。(2)宏块边界效应,由于一帧视频图像中两侧边缘宏块的编码模式可能不相同,并且各宏块可能选择不同的量化参数,因此会引起视频图像边界能量的断裂,即经过压缩编码后的相邻图像块的边界不连续,造成明显的方块效应(blockingeffect),在目前主流的视频图像压缩编码技术如H261/H263/H264及MPEG4等国际标准中,一般都是基于DCT离散余弦变换的方法将空域图像信息变换到频率域,再将变换后少数的DCT系数进行量化和编码。采用传统的编码压缩方法在低码率压缩的视频图像通信中产生的方块效应是引起图像失真的一个重要因素,方块效应严重影响了视频图像通信的主观质量和客观质量(PSNR)。
实验证明,对于给定的输入图象,随着编码过程中分配码率的降低,存在着一个临界点,当分配码率小于该临界点时,重建图象在原有的时间分辨率和空间分辨率下不能保存足够的图像纹理信息。本发明提出了一种新的视频图像处理方法(AstRF)(RDO based Adaptive spatial-temporal Resolution Frame),即基于率失真优化的自适应时间域和空间域分辨率框架的图像处理方法,当编码器检测到分配码率小于临界点时,自动根据率失真优化的原则,找出在分配的特定目标码率下最适合的时间分辨率和空间分辨率,在解码器解码后,再通过一定的算法恢复到输入图象的分辨率。通过本发明提供的图像处理方法可以明显改善在低码率下传输视频图像因过压缩而引起的对视频图像的主观效果的明显损伤。
发明内容
本发明要解决的技术问题在于,针对现有技术中的因过压缩而严重影响视频图像主观质量和客观质量的问题,提供一种基于率失真优化的自适应时间域和空间域分辨率框架的图像处理方法。
本发明解决其技术问题所采用的技术方案是:构造一种基于率失真优化的自适应时间域和空间域分辨率框架的图像处理方法,所述方法包括以下步骤:
A.编码器根据输入的视频图像和目标分配码率的变化计算并获得临界码率条件值,所述计算并获得临界码率条件值的公式为:
Risualx,y,k=H×(cx,y,k-Px,y,k)×HT
Score = 256 N Σ x , y = 0 X , Y ( R isual x , y , k · T x , y , k ) · 0.85 · Qp 2 3
其中,Cx,y,k表示Sx,y,k编码然后解码得到的重建图象,Sx,y,k表示k时刻的图象,
Px,y,k表示预测图像,H是任意编码器指定的空间-频域变换矩阵,
Risualx,y,k表示编码Cx,y,k后得到的残差在频域的分布,
其中,Qp是量化参数,N是参加计算区域的像素数目,Tx,y,k是为高频分量适当增加权重,取值如下:
Figure GSB00000533667400022
H = 1 1 1 1 2 1 - 1 - 2 1 - 1 - 1 1 1 - 2 2 - 1 H T = 1 2 1 1 1 1 - 1 - 2 1 - 1 - 1 2 1 - 2 1 - 1
Score是临界码率条件值。;
B.编码器将所述临界码率条件值与阈值进行比较,若所述临界码率条件值小于阈值即所述的目标分配码率小于所述临界码率时通过下采样获得适应于所述目标分配码率的图像分辨率,否则进行常规编码处理;
C.解码器通过上采样恢复接收图像的原始分辨率并进行平滑处理。
优选地,所述步骤B中的所述阈值根据不同场景变化的范围是0.1至0.95。
进一步优选地,所述步骤B进一步包括:
B1.通过下采样获得适应于所述目标分配码率的图像空间分辨率;
B2.通过下采样获得适应于所述目标分配码率的图像时间分辨率。
进一步优选地,所述步骤B1进一步包括:
B11.设置图像空间分辨率模板集合;
B12.根据率失真优化方法在所述模板集合中获得最佳模板做为适应于所述目标分配码率的图像空间分辨率。
进一步优选地,所述步骤B12中所述率失真优化方法是采用拉格朗日线性逼近方法实现RDO,公式为:J=R(p)+pD(p)
其中,遍历模板集合中各种编码模式i,求取Ji,使所述公式中的J最小,即min(J)对应的模式,即是R-D最优,其对应的图像分辨率即是所述图像空间分辨率。
优选地,所述步骤B2中所述下采样是采用抽帧的方式降低时间分辨率。
优选地,所述步骤C进一步包括:
C1.采用空间重采样恢复接收图像的原始空间分辨率;
C2.采用时间窗平滑和场景切换判断方式对图像进行平滑处理。
优选地,所述步骤C1中所述空间重采样是采用了双立方体卷积插值算法,所述双立方体卷积插值算法包括一维立方体卷积插值算法和二维立方体卷积插值算法,其中,一维立方体卷积插值算法为:
P ′ ( x ) = Σ i = 0 3 W ( x - x i ) P ( x i )
其中,其中P’(x)是待插值点,P(xi)是参考网格点,
其中,
Figure GSB00000533667400042
参数a=-0.5,
其中W(x)是函数的最近似拟合表达式;
二维立方体卷积插值算法为:
P ′ ( x , y ) = Σ j = 0 3 W ( y - y j ) · ( Σ i = 0 3 W ( x - x i ) P ( x i , y j ) )
其中,P′(x,y)是待插值点,P(xi,yj)是参考网格点。
优选地,所述步骤C2中所述场景切换判断的步骤包括:
C21.分析当前宏块,选取最佳帧内和帧间编码模式,使用拉格朗日率失真模型计算出帧内编码代价函数值和帧间编码代价函数值,计算公式为:
IntraCostInMb=SATD+λ×Rbit(Intra)
InterCostInMb=SAD+λ×Rbit(Inter)
其中,IntraCostInMb是帧内编码代价函数值,InterCostInMb是帧间编码代价函数值,λ是拉格朗日因子,SATD是经过哈德曼变换的4×4块的预测参差绝对值总和,SAD是绝对误差和,Rbit是使用相应编码参数对应的编码输出比特数;
C22.将当前图像中每个宏块的帧内编码代价函数值和帧间编码代价函数值进行累加,分析完整帧图像后得到帧内编码总代价函数值和帧间编码总代价函数值,若帧间编码总代价函数值大于帧内编码总代价函数值与敏感系数的乘积则发生了场景切换,否则没有发生场景切换,其中敏感系数范围是0.1至0.9。
实施本发明提供的基于率失真优化的自适应时间域和空间域分辨率框架的图像处理方法,当编码器检测到分配码率小于临界码率时,自动根据率失真优化的原则,找出在分配的特定目标码率下最适合的时间分辨率和空间分辨率,在解码器解码后,再通过一定的算法恢复到输入图象的空间分辨率。通过本发明提供的图像处理方法可以明显改善在低码率下传输视频图像因过压缩而引起的对视频图像的主观效果的明显损伤并且在降低计算复杂度的同时仍能保证图象质量。
附图说明
图1是依据本发明一较佳实施例的一种自适应时间域和空间域分辨率框架的图像处理方法的流程图;
图2是本发明的一个实施例中用于平滑图像的时间窗示意图;
图3是本发明在一个实施例中使用场景切换判断方式对图像进行平滑处理的场景切换判断方法流程图;
图4是本发明在一个实施例中空间重采样的一维插值和二维插值需要的参考网格点示意图;
图5是本发明的一个实施例中空间重采样的立方体卷积插值函数与距离之间的关系示意图;
图6是本发明的一个实施例中Akiyo序列图象原始分辨率编码与本发明方法率失真性能对比示意图;
图7是本发明的一个实施例中Foreman序列图象原始分辨率编码与本发明方法率失真性能对比示意图;
图8是本发明的一个实施例中Mobile序列图象原始分辨率编码与本发明方法率失真性能对比示意图;
图9是本发明的一个实施例中Tempete序列图象原始分辨率编码与本发明方法率失真性能对比示意图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
图1示出了依据本发明一较佳实施例的一种自适应时间域和空间域分辨率框架的图像处理方法的流程图,过程如下:
在步骤S100中,在编码器端接收原始输入的视频图像;
在步骤S105中,在编码器端计算并获得临界码率条件值,方法如下:
假设Sx,y,k表示k时刻的图象,t表示目标码率,Sr x,y,k表示重新采样后的生成图象:
Sr x′,y′,k′=R(Sx,y,k)
其中,R(·)表示下采样函数。设Cx,y,k表示Sx,y,k编码然后解码得到的重建图象,Cr x,y,k表示Sr x,y,k编码然后解码得到的图象。Dx,y,k表示由Sx,y,k编码得到的失真:
Dx,y,k=Sx,y,k-Cx,y,k;设Dr x,y,k表示由Sr x,y,k编码,然后恢复分辨率后得到的失真:
Dr x,y,k=Sr x,y,k-U(Cr x,y,k)
其中,U(·)表示上采样函数。
设Risualx,y,k表示编码Cx,y,k后得到的残差在频域的分布。Risualx,y,k的取值见式4,其中H可以是任意编码器指定的空间-频域变换矩阵。
Risualx,y,k=H×(Cx,y,k-Px,y,k)×HT
Score = 256 N Σ x , y = 0 X , Y ( R isual x , y , k · T x , y , k ) · 0.85 · Qp 2 3
其中,Qp是量化参数,N是参加计算区域的象素数目,Tx,y,k是为高频分量适当增加权重,取值如下:
Figure GSB00000533667400062
H = 1 1 1 1 2 1 - 1 - 2 1 - 1 - 1 1 1 - 2 2 - 1 H T = 1 2 1 1 1 1 - 1 - 2 1 - 1 - 1 2 1 - 2 1 - 1
Score是临界码率条件值;
在步骤S110中,比较判断编码器计算的临界码率条件值Score是否小于阈值L,在本发明使用的场景中,图象分辨率为320X240,10FPS,码率50kbps,信道是60kbps左右,L可以取0.85,如果场景发生变化,如码率变化了等等,需要重新根据实验调整阈值L,阈值L的范围是0.1-0.95;若临界码率条件值Score小于阈值L则执行步骤S115,否则执行步骤S135;
在步骤S115中,在编码器端采用下采样计算适应于目标分配码率的空间分辨率,方法如下:
首先对空间分辨率设置模板,如下:
Figure GSB00000533667400071
纵向缩小1/2
Figure GSB00000533667400072
纵向缩小1/3
Figure GSB00000533667400073
纵向缩小1/4
Figure GSB00000533667400074
横向缩小1/2
Figure GSB00000533667400075
横向缩小1/3
Figure GSB00000533667400076
横向缩小1/4
具体的模板可以根据实际中原始分辨率的大小实际设定。在确定好模块集合后,根据RDO的原则在这些模板中寻找最佳值。可以使用拉格朗日线性逼近方法来实现RDO,按照式:
J=R(p)+pD(p)
遍历模板集合中各种编码模式i,求取Ji,使上式中的J最小,即min(J)对应的模式,即是R-D最优,其对应的分辨率即是最优分辨率;
在步骤S120中,在编码器端采用下采样计算适应于目标分配码率的时间分辨率,方法如下:
主要通过时间上分层(或分级)来实现时间分辨率的可变。一个提供时间可分级的比特流,图象可以分割成具有以下特性的一个基础层和一个或者几个增强层。这些时间层通过时间级来标志,基础层以时间级0表示,其它的时间层依次递增,相应地时间分辨率也随之增加。对于一个自然数k,可以通过移除比特流中所有时间级大于k的时间(增强)层,得到一个以k标定的低层次时间分辨率。在混合视频编解码器中,一般情况下时间可分级的一个必要条件是允许通过将当前被预测帧的运动补偿预测参考帧限制在低于或者是等于当前帧的时间层中来实现。利用编码器中分层B帧(hierarchical B picture)的工具可以得到时间可分级的N层2阶时间增强层。
时间基础层T0,独立于其它所有帧被编码,开始于一个IDR访问单元,其中每一帧编码方式为帧内编码或者利用之前的基础层的图象作为参考帧。基础层的编码和显示次序是相同的。时间级为Tx的时间增强层图片永远坐落于两个连续的时间级低于x的图片之间。时间增强层是作为B帧被编码的,其参考帧列表List 0和List 1被限制在前后时间级小于x的两个图象。每个时间层集合{T0…Tx}可以独立于所有时间级Y>X的增强层被解码;
上述时间分级的分层预测结构(Hierarchical Prediction Structure)可以与编码器的多参考帧方法相结合,参考帧列表可以使用多于一个参考帧,而且可以包含与被预测帧相同时间级的图片,分层预测结构可以是非二阶的,可以根据实际编码需要,任意修改预测结构;
在上述时间分层的结构中,很明显时间上的参考受到局限,编码器率失真性能将会不可避免地受到影响,以下部分介绍如何在一定程度上改善这个问题。
分层预测结构的编码效率很大一部分依赖于不同的时间层量化参数是怎样选择的。基础层编码必须有最高的保真度,因为其直接或者间接地作为所有其它图象的运动补偿预测参考。而其它各个时间层的量化参数可以逐层增加,因为其重建图象质量只能影响更少的图片。基础层量化参数的选择可以通过传统的方法由率失真分析来完成。然而对增强层的Qp,为了避免复杂的计算,可以使用以下的方法,实验证明对不同特性的视频信号有较好的鲁棒性。
假设基础层的量化参数是QP0,对于时间级为k>0的增强层其量化参数可以选择为QPk=QP0+3+k。
虽然这种方法在一个GOP内引起很大的PSNR波动,但是实验证明其重建结果还是比较平滑的。
在步骤S125中,在解码器端采用上采样的方法回复视频图像的原始空间分辨率,这里的上采样就是使用空间重采样的方式即使用双立方体卷积插值算法回复视频图像的原始空间分辨率,双立方体卷积插值算法包括一维插值算法和二维插值算法;
在步骤S130中,在解码器端对处理过的图像进行平滑处理,包括时间窗平滑处理和场景切换判断方式的平滑处理,平滑处理完毕即结束本方法流程;
在步骤S135中,是在临界码率条件值Score不小于阈值L时,在编码器端对原始输入的视频图像进行常规编码处理;
在步骤S140中,对应于步骤S135在解码器端对接收的编码的视频图像进行常规的解码处理。
图2示出了本发明的一个实施例中用于平滑图像的时间窗示意图,在时间窗中,空间分辨率的下降采用平滑过度的方式,让人的视觉逐渐过度。图2表示连续的时间窗,可以统计一个窗口的整体情况,然后回来重新编码整个窗口。
图3示出了本发明在一个实施例中使用场景切换判断方式对图像进行平滑处理的场景切换判断方法流程图,包括以下步骤:
在步骤300中,首先分析当前宏块,选取最佳帧内和帧间编码模式;
在步骤302中,使用拉格朗日率失真模型计算出IntraCostInMb和InterCostInMb;IntraCostInMb和InterCostInMb分别代表在帧内编码及帧间编码的代价函数,计算方法如下:
IntraCostInMb=SATD+λ×Rbit(Intra)
InterCostInMb=SAD+λ×Rbit(Inter)
其中,λ是拉格朗日因子,SATD是经过哈德曼变换的4×4块的预测参差绝对值总和,SAD是绝对误差和,Rbit是使用相应编码参数对应的编码输出比特数;
在步骤304中,将当前图像中每个宏块的帧内编码代价函数值(IntraCostInMb)和帧间编码代价函数值(InterCostInMb)进行累加求和,得到帧内编码总代价函数值(IntraTotalCost),帧间编码总代价函数值(InterTotalCost),公式为:
IntraTotalCost = Σ mb IntraCostInMb
InterTotalCost = Σ mb InterCostInMb
在步骤306中,判断当前帧是否结束,若没有结束则继续执行步骤300,若当前帧结束则执行步骤308;
在步骤308中,当分析完整帧图像后,根据求得的帧内编码总代价函数值(IntraTotalCost)和帧间编码总代价函数值(InterTotalCost)分析判断当前图像是不是场景切换,如果InterTotalCost>IntraTotalCost×Fbias此幅图像的判断结果为场景切换310,否则判断结果为没有场景切换312;其中,Fbias是判断场景切换的敏感系数,取值范围是0.1-0.9,如果过小会造成误判,过大会造成对场景切换反映迟钝,例如在50kbps信道传输QVGA(320x240),10fps的场景时,建议取0.25,其它场景可以根据具体需要作调节。
图4示出了本发明在一个实施例中空间重采样的一维插值和二维插值需要的参考网格点示意图,本发明的空间重采样使用了双立方体卷积插值。***值点的灰度值由16个最近的原图像网格点的灰度值加权平均而得,整个插值过程包括了水平方向上的一维插值以及垂直方向上的一维插值,每次一维插值需要4个参考网格点,两边各两个;而二维插值共需要4x4=16个参考网格点;一维立方体卷积插值的核函数算子是:
W ( x ) = ( a + 2 ) | x | 3 - ( a + 3 ) | x | 2 + 1 0 &le; | x | < 1 a | x | 3 - 5 a | x | 2 + 8 a | x | - 4 a 1 &le; | x | < 2 0 | x | &GreaterEqual; 2
其中,x是待插值点与参考网格点之间的距离,而参数a=-0.5。这个核函数是函数
Figure GSB00000533667400102
的最近似拟合表达式,函数
Figure GSB00000533667400103
的函数图像如附图中的图5所示。
立方体卷积一维插值公式为:
P &prime; ( x ) = &Sigma; i = 0 3 W ( x - x i ) P ( x i )
其中,P’(x)是待插值点,P(xi)是参考网格点,若参考网格点落在了图像之外,则用最近的图像边缘上的像素点取代;二维插值是可分离的两个方向上的一维插值的组合,算法为:
P &prime; ( x , y ) = &Sigma; j = 0 3 W ( y - y j ) &CenterDot; ( &Sigma; i = 0 3 W ( x - x i ) P ( x i , y j ) )
图5示出了本发明的一个实施例中空间重采样的立方体卷积插值函数与距离之间的关系示意图,反映该函数图像的函数为:
Figure GSB00000533667400111
图6是本发明的一个实施例中Akiyo序列图象原始分辨率编码与本发明方法率失真性能对比示意图。
图7是本发明的一个实施例中Foreman序列图象原始分辨率编码与本发明方法率失真性能对比示意图。
图8是本发明的一个实施例中Mobile序列图象原始分辨率编码与本发明方法率失真性能对比示意图。
图9是本发明的一个实施例中Tempete序列图象原始分辨率编码与本发明方法率失真性能对比示意图。
图6、图7、图8和图9分别显示了Akiyo、Foreman、Mobile和Tempete分别采用原始分辨率及本发明方法的率失真性能,这里需要说明的是,原始分辨率下计算PSNR时采用的是解码图象和原始图象间的差异;本发明方法计算PSNR采用的是解码图象和分辨率调整后图象间的差异;从这些图中可以看到,原始分辨率和本发明方法两条曲线在某个点开始分叉,这个点就是临界码率,之后采用本发明方法的曲线与重采样图象之间的失真远小于原始分辨率图象编码后与原始输入图象之间的失真。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。

Claims (9)

1.一种自适应时间域和空间域分辨率框架的图像处理方法,其特征在于,包括以下步骤:
A.编码器根据输入的视频图像和目标分配码率的变化计算并获得临界码率条件值,所述计算并获得临界码率条件值的公式为:
Risualx,y,k=H×(Cx,y,k-Px,y,k)×HT
Figure FSB00000533667300011
其中,Cx,y,k表示Sx,y,k编码然后解码得到的重建图象,Sx,y,k表示k时刻的图象,
Px,y,k表示预测图像,H是任意编码器指定的空间-频域变换矩阵,
Risualx,y,k表示编码Cx,y,k后得到的残差在频域的分布,
其中,Qp是量化参数,N是参加计算区域的像素数目,Tx,y,k是为高频分量适当增加权重,取值如下:
Figure FSB00000533667300012
Figure FSB00000533667300013
Figure FSB00000533667300014
Score是临界码率条件值;
B.编码器将所述临界码率条件值与阈值进行比较,若所述临界码率条件值小于阈值即所述的目标分配码率小于所述临界码率时通过下采样获得适应于所述目标分配码率的图像分辨率,否则进行常规编码处理;
C.解码器通过上采样恢复接收图像的原始分辨率并进行平滑处理。 
2.根据权利要求1所述的自适应时间域和空间域分辨率框架的图像处理方法,其特征在于:所述步骤B中的所述阈值根据不同场景变化的范围是0.1至0.95。
3.根据权利要求1所述的自适应时间域和空间域分辨率框架的图像处理方法,其特征在于,所述步骤B进一步包括:
B1.通过下采样获得适应于所述目标分配码率的图像空间分辨率;
B2.通过下采样获得适应于所述目标分配码率的图像时间分辨率。
4.根据权利要求3所述的自适应时间域和空间域分辨率框架的图像处理方法,其特征在于,所述步骤B1进一步包括:
B11.设置图像空间分辨率模板集合;
B12.根据率失真优化方法在所述模板集合中获得最佳模板做为适应于所述目标分配码率的图像空间分辨率。
5.根据权利要求4所述的自适应时间域和空间域分辨率框架的图像处理方法,其特征在于,所述步骤B12中所述率失真优化方法是采用拉格朗日线性逼近方法实现RDO,公式为:J=R(p)+pD(p)
其中,遍历模板集合中各种编码模式i,求取Ji,使所述公式中的J最小,即min(J)对应的模式,即是R-D最优,其对应的图像分辨率即是所述图像空间分辨率。
6.根据权利要求3所述的自适应时间域和空间域分辨率框架的图像处理方法,其特征在于,所述步骤B2中所述下采样是采用抽帧的方式降低时间分辨率。
7.根据权利要求1所述的自适应时间域和空间域分辨率框架的图像处理方法,其特征在于,所述步骤C进一步包括:
C1.采用空间重采样恢复接收图像的原始空间分辨率;
C2.采用时间窗平滑和场景切换判断方式对图像进行平滑处理。
8.根据权利要求7所述的自适应时间域和空间域分辨率框架的图像处理方法,其特征在于,所述步骤C1中所述空间重采样是采用了双立方体卷积插值算法,所述双立方体卷积插值算法包括一维立方体卷积插值算法和二维立方体卷 积插值算法,其中,一维立方体卷积插值算法为:
Figure FSB00000533667300031
其中,其中P’(x)是待插值点,P(xi)是参考网格点,
其中, 
Figure FSB00000533667300032
参数a=-0.5,
其中W(x)是函数 
Figure FSB00000533667300033
的最近似拟合表达式;
二维立方体卷积插值算法为:
Figure FSB00000533667300034
其中,P′(x,y)是待插值点,P(xi,yj)是参考网格点。
9.根据权利要求7所述的自适应时间域和空间域分辨率框架的图像处理方法,其特征在于,所述步骤C2中所述场景切换判断的步骤包括:
C21.分析当前宏块,选取最佳帧内和帧间编码模式,使用拉格朗日率失真模型计算出帧内编码代价函数值和帧间编码代价函数值,计算公式为:
IntraCostInMb=SATD+λ×Rbit(Intra)
InterCostInMb=SAD+λ×Rbit(Inter)
其中,IntraCostInMb是帧内编码代价函数值,InterCostInMb是帧间编码代价函数值,λ是拉格朗日因子,SATD是经过哈德曼变换的4×4块的预测参差绝对值总和,SAD是绝对误差和,Rbit是使用相应编码参数对应的编码输出比特数;
C22.将当前图像中每个宏块的帧内编码代价函数值和帧间编码代价函数值进行累加,分析完整帧图像后得到帧内编码总代价函数值和帧间编码总代价函数值,若帧间编码总代价函数值大于帧内编码总代价函数值与敏感系数的乘积则发生了场景切换,否则没有发生场景切换,其中敏感系数范围是0.1至0.9。 
CN2009101048685A 2009-01-09 2009-01-09 一种自适应时间域和空间域分辨率框架的图像处理方法 Expired - Fee Related CN101778275B (zh)

Priority Applications (4)

Application Number Priority Date Filing Date Title
CN2009101048685A CN101778275B (zh) 2009-01-09 2009-01-09 一种自适应时间域和空间域分辨率框架的图像处理方法
US12/746,175 US8311097B2 (en) 2009-01-09 2009-08-28 Image processing method for adaptive spatial-temporal resolution frame
PCT/CN2009/073590 WO2010078759A1 (zh) 2009-01-09 2009-08-28 基于码率控制的图像时间域和空间域分辨率处理方法
EP09833910.4A EP2234401A4 (en) 2009-01-09 2009-08-28 BASED ON CODER DATA CONTROL PROCESS FOR PROCESSING TEMPORARY AND SPATIAL IMMEDIATE RESOLUTIONS

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2009101048685A CN101778275B (zh) 2009-01-09 2009-01-09 一种自适应时间域和空间域分辨率框架的图像处理方法

Publications (2)

Publication Number Publication Date
CN101778275A CN101778275A (zh) 2010-07-14
CN101778275B true CN101778275B (zh) 2012-05-02

Family

ID=42316223

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2009101048685A Expired - Fee Related CN101778275B (zh) 2009-01-09 2009-01-09 一种自适应时间域和空间域分辨率框架的图像处理方法

Country Status (4)

Country Link
US (1) US8311097B2 (zh)
EP (1) EP2234401A4 (zh)
CN (1) CN101778275B (zh)
WO (1) WO2010078759A1 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106682419A (zh) * 2016-12-27 2017-05-17 深圳先进技术研究院 一种医学图像参数的拟合方法和装置

Families Citing this family (37)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101418104B1 (ko) * 2010-03-08 2014-07-16 에스케이 텔레콤주식회사 움직임 벡터 해상도 조합을 이용한 움직임 벡터 부호화/복호화 방법 및 장치와 그를 이용한 영상 부호화/복호화 방법 및 장치
FR2963189B1 (fr) * 2010-07-20 2013-06-21 Freebox Procede d'encodage adaptatif d'un flux video numerique, notamment pour diffusion sur ligne xdsl.
US20120275511A1 (en) * 2011-04-29 2012-11-01 Google Inc. System and method for providing content aware video adaptation
US8767821B2 (en) 2011-05-09 2014-07-01 Google Inc. System and method for providing adaptive media optimization
US9438918B2 (en) * 2012-04-23 2016-09-06 Intel Corporation Frame level rate control using motion estimated distortions
CN103428523B (zh) 2012-05-22 2015-07-08 华为技术有限公司 评估视频质量的方法和装置
CN103096086A (zh) * 2013-02-06 2013-05-08 上海风格信息技术股份有限公司 一种在多画面显示中下采样前移达到***优化的方法
KR102085270B1 (ko) * 2013-08-12 2020-03-05 삼성전자 주식회사 가장 작은 왜곡 값을 갖는 해상도를 선택하는 이미지 처리 방법과 상기 방법을 수행하는 장치들
US20150103909A1 (en) * 2013-10-14 2015-04-16 Qualcomm Incorporated Multi-threaded video encoder
US9363333B2 (en) * 2013-11-27 2016-06-07 At&T Intellectual Property I, Lp Server-side scheduling for media transmissions
GB2526773B (en) * 2014-04-04 2020-09-30 Adder Tech Ltd Video signal transmission
CN104980740A (zh) * 2014-04-08 2015-10-14 富士通株式会社 图像处理方法、装置和电子设备
CN104052998B (zh) * 2014-05-26 2019-10-25 深圳市梦网百科信息技术有限公司 一种基于运动强度的gop层率控调整方法和***
CN104159119A (zh) * 2014-07-07 2014-11-19 大连民族学院 一种视频图像实时共享播放的超分辨率重构方法和***
KR102332782B1 (ko) 2014-12-15 2021-11-30 삼성전자주식회사 시각 특성을 고려한 영상 데이터 압축
CN104935928B (zh) * 2015-06-01 2017-10-17 电子科技大学 一种基于空域下采样模式的高效图像压缩方法
CN104883579B (zh) * 2015-06-08 2017-11-14 电子科技大学 一种基于空‑频域的联合视频图像的上采样方法
US11450064B2 (en) 2016-09-06 2022-09-20 Carnegie Mellon University Gaussian mixture model based approximation of continuous belief distributions
CN107155107B (zh) 2017-03-21 2018-08-03 腾讯科技(深圳)有限公司 视频编码方法和装置、视频解码方法和装置
CN109905717A (zh) * 2017-12-11 2019-06-18 四川大学 一种基于空时域下采样与重建的h.264/avc编码优化方法
CN108235018B (zh) * 2017-12-13 2019-12-27 北京大学 一种基于拉格朗日乘子模型的点云帧内编码优化方法及装置
JP6946566B2 (ja) * 2018-03-11 2021-10-06 グーグル エルエルシーGoogle LLC 静的な映像認識
CN108833916B (zh) 2018-06-20 2021-09-24 腾讯科技(深圳)有限公司 视频编码、解码方法、装置、存储介质和计算机设备
CN108833918B (zh) * 2018-06-20 2021-09-17 腾讯科技(深圳)有限公司 视频编码方法、解码方法、装置、计算机设备及存储介质
WO2020076838A1 (en) * 2018-10-08 2020-04-16 Beijing Dajia Internet Information Technology Co., Ltd. Motion vector storage for video coding
CN111193931B (zh) * 2018-11-14 2023-04-07 深圳市中兴微电子技术有限公司 一种视频数据的编码处理方法和计算机存储介质
CN109495741B (zh) * 2018-11-29 2023-03-31 四川大学 基于自适应下采样和深度学习的图像压缩方法
CN109635813B (zh) * 2018-12-13 2020-12-25 银河水滴科技(北京)有限公司 一种钢轨区域图像分割方法及装置
CN109640117A (zh) * 2018-12-26 2019-04-16 呈像科技(北京)有限公司 视频插帧处理方法
US10764603B2 (en) * 2018-12-31 2020-09-01 Alibaba Group Holding Limited Resolution-adaptive video coding
CN110264404B (zh) * 2019-06-17 2020-12-08 北京邮电大学 一种超分辨图像纹理优化的方法和装置
CN110582022B (zh) * 2019-09-27 2022-12-30 腾讯科技(深圳)有限公司 视频编解码方法和装置及存储介质
CN110896481B (zh) * 2019-12-31 2022-03-08 杭州当虹科技股份有限公司 一种适用于hevc的快速帧内模式编码方法
CN111314697B (zh) * 2020-02-25 2021-10-15 中南大学 一种针对光字符识别的码率设置方法、设备及存储介质
CN111462765B (zh) * 2020-04-02 2023-08-01 宁波大学 一种基于一维卷积核的自适应音频复杂度表征方法
CN111986082B (zh) * 2020-07-22 2022-06-21 中国西安卫星测控中心 一种自适应图像处理分辨率评价方法
CN112153379B (zh) * 2020-09-28 2023-02-24 北京金山云网络技术有限公司 转码质量的评价方法、装置、电子设备及计算机存储介质

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2588925B2 (ja) * 1988-03-11 1997-03-12 富士通株式会社 可変ビットレート画像符号化装置
US6625322B1 (en) * 1999-06-08 2003-09-23 Matsushita Electric Industrial Co., Ltd. Image coding apparatus
US6891889B2 (en) * 2001-09-05 2005-05-10 Intel Corporation Signal to noise ratio optimization for video compression bit-rate control
US7596179B2 (en) * 2002-02-27 2009-09-29 Hewlett-Packard Development Company, L.P. Reducing the resolution of media data
KR100850705B1 (ko) * 2002-03-09 2008-08-06 삼성전자주식회사 시공간적 복잡도를 고려한 적응적 동영상 부호화 방법 및그 장치
US7421024B2 (en) * 2003-06-30 2008-09-02 Intel Corporation Method for transcoding MPEG encoded streams
US7797723B2 (en) * 2004-10-30 2010-09-14 Sharp Laboratories Of America, Inc. Packet scheduling for video transmission with sender queue control
JP4758946B2 (ja) * 2007-05-24 2011-08-31 大日本スクリーン製造株式会社 閾値マトリクス生成方法、画像データ生成方法、画像データ生成装置、画像記録装置および閾値マトリクス
US7974498B2 (en) * 2007-08-08 2011-07-05 Microsoft Corporation Super-resolution in periodic and aperiodic pixel imaging
US8218811B2 (en) * 2007-09-28 2012-07-10 Uti Limited Partnership Method and system for video interaction based on motion swarms
CN101159871B (zh) * 2007-11-12 2010-08-04 中兴通讯股份有限公司 宏块组级视频码率控制方法
CN102905131A (zh) * 2008-06-20 2013-01-30 杜比实验室特许公司 在多个失真约束下的视频压缩
US20110013692A1 (en) * 2009-03-29 2011-01-20 Cohen Robert A Adaptive Video Transcoding

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
JP平1-231583A 1989.09.14

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106682419A (zh) * 2016-12-27 2017-05-17 深圳先进技术研究院 一种医学图像参数的拟合方法和装置
CN106682419B (zh) * 2016-12-27 2019-05-07 深圳先进技术研究院 一种医学图像参数的拟合方法和装置

Also Published As

Publication number Publication date
US8311097B2 (en) 2012-11-13
US20110058605A1 (en) 2011-03-10
WO2010078759A1 (zh) 2010-07-15
CN101778275A (zh) 2010-07-14
EP2234401A1 (en) 2010-09-29
EP2234401A4 (en) 2015-02-25

Similar Documents

Publication Publication Date Title
CN101778275B (zh) 一种自适应时间域和空间域分辨率框架的图像处理方法
KR100750136B1 (ko) 영상의 부호화, 복호화 방법 및 장치
KR100781525B1 (ko) 가중 평균합을 이용하여 fgs 계층을 인코딩 및디코딩하는 방법 및 장치
KR100772882B1 (ko) 인트라 bl 모드를 고려한 디블록 필터링 강도 결정 방법, 및 장치
KR100679031B1 (ko) 다 계층 기반의 비디오 인코딩 방법, 디코딩 방법 및 상기방법을 이용한 장치
KR100772873B1 (ko) 스무딩 예측을 이용한 다계층 기반의 비디오 인코딩 방법,디코딩 방법, 비디오 인코더 및 비디오 디코더
KR100679035B1 (ko) 인트라 bl 모드를 고려한 디블록 필터링 방법, 및 상기방법을 이용하는 다 계층 비디오 인코더/디코더
KR100746007B1 (ko) 엔트로피 코딩의 컨텍스트 모델을 적응적으로 선택하는방법 및 비디오 디코더
US8224100B2 (en) Method and device for intra prediction coding and decoding of image
US8107535B2 (en) Method and apparatus for scalable motion vector coding
JP5044057B2 (ja) フィルタを選択する方法及び装置
WO2010137323A1 (ja) 映像符号化装置、映像復号装置、映像符号化方法、および映像復号方法
US20050200757A1 (en) Method and apparatus for digital video reconstruction
WO2001015457A2 (en) Image coding
US20050129125A1 (en) Method and apparatus for pitcure compression using variable block of arbitrary size
US8594189B1 (en) Apparatus and method for coding video using consistent regions and resolution scaling
CN101977323A (zh) 基于视频时空相关性约束的分布式视频编码重构方法
KR20130053645A (ko) 적응적 루프 필터를 이용한 비디오 부호화/복호화 방법 및 장치
WO2006059848A1 (en) Method and apparatus for multi-layered video encoding and decoding
KR100359819B1 (ko) 압축영상의 공간 도메인에서의 효율적인 엣지 예측 방법
JP4762486B2 (ja) マルチ・リゾルーション・ビデオ符号化および復号化
KR20010069016A (ko) 영상부호화기의 인트라/인터 부호화 모드의 결정방법
KR100801155B1 (ko) H.264에서의 저복잡도를 가지는 공간적 에러 은닉방법
KR20040039805A (ko) 동영상 부호화 방법
CN117478874A (zh) 一种高压缩率视频关键帧编码方法及解码方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
C56 Change in the name or address of the patentee

Owner name: SHENZHEN RONGCHANG TIANXIA TECHNOLOGY CO., LTD.

Free format text: FORMER NAME: SHENZHEN TEMOBI SCIENCE + TECHNOLOGY CO., LTD.

CP01 Change in the name or title of a patent holder

Address after: 19, building 18, Changhong technology building, 518057 South twelve Road, South tech Zone, Nanshan District hi tech Zone, Guangdong, Shenzhen

Patentee after: SHENZHEN TEMOBI TECHNOLOGY CO., LTD.

Address before: 19, building 18, Changhong technology building, 518057 South twelve Road, South tech Zone, Nanshan District hi tech Zone, Guangdong, Shenzhen

Patentee before: Shenzhen Temobi Science & Tech Development Co.,Ltd.

CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20120502

Termination date: 20170109