CN101835048A - 通过基于abt的最小可觉差模型进行视频编码的方法和装置 - Google Patents
通过基于abt的最小可觉差模型进行视频编码的方法和装置 Download PDFInfo
- Publication number
- CN101835048A CN101835048A CN201010174145A CN201010174145A CN101835048A CN 101835048 A CN101835048 A CN 101835048A CN 201010174145 A CN201010174145 A CN 201010174145A CN 201010174145 A CN201010174145 A CN 201010174145A CN 101835048 A CN101835048 A CN 101835048A
- Authority
- CN
- China
- Prior art keywords
- jnd
- abt
- frame
- piece
- content information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 21
- 230000000007 visual effect Effects 0.000 claims abstract description 21
- 238000001914 filtration Methods 0.000 claims description 18
- 238000002474 experimental method Methods 0.000 claims description 10
- 230000004044 response Effects 0.000 claims description 8
- 238000006243 chemical reaction Methods 0.000 abstract description 16
- 230000003044 adaptive effect Effects 0.000 abstract description 6
- 230000005540 biological transmission Effects 0.000 abstract description 2
- 230000009467 reduction Effects 0.000 abstract description 2
- 230000033001 locomotion Effects 0.000 description 14
- 239000013598 vector Substances 0.000 description 13
- 238000012360 testing method Methods 0.000 description 10
- 208000037170 Delayed Emergence from Anesthesia Diseases 0.000 description 9
- 230000008859 change Effects 0.000 description 9
- 238000005457 optimization Methods 0.000 description 7
- 238000004590 computer program Methods 0.000 description 6
- 230000006870 function Effects 0.000 description 6
- 230000008569 process Effects 0.000 description 6
- 230000006978 adaptation Effects 0.000 description 5
- 230000006835 compression Effects 0.000 description 5
- 238000007906 compression Methods 0.000 description 5
- 238000004891 communication Methods 0.000 description 4
- 238000012545 processing Methods 0.000 description 4
- 230000009466 transformation Effects 0.000 description 4
- 239000011159 matrix material Substances 0.000 description 3
- 238000013139 quantization Methods 0.000 description 3
- 230000008901 benefit Effects 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 238000013507 mapping Methods 0.000 description 2
- 239000000463 material Substances 0.000 description 2
- 239000000203 mixture Substances 0.000 description 2
- 238000013441 quality evaluation Methods 0.000 description 2
- 230000035945 sensitivity Effects 0.000 description 2
- 208000013021 vision distortion Diseases 0.000 description 2
- 241001269238 Data Species 0.000 description 1
- 230000003213 activating effect Effects 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000004069 differentiation Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 239000003550 marker Substances 0.000 description 1
- 230000000873 masking effect Effects 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
- 230000002207 retinal effect Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 210000000697 sensory organ Anatomy 0.000 description 1
- 238000004088 simulation Methods 0.000 description 1
- 238000012876 topography Methods 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/136—Incoming video signal characteristics or properties
- H04N19/137—Motion inside a coding unit, e.g. average field, frame or block difference
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/119—Adaptive subdivision aspects, e.g. subdivision of a picture into rectangular or non-rectangular coding blocks
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/12—Selection from among a plurality of transforms or standards, e.g. selection between discrete cosine transform [DCT] and sub-band transform or selection between H.263 and H.264
- H04N19/122—Selection of transform size, e.g. 8x8 or 2x4x8 DCT; Selection of sub-band transforms of varying structure or type
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/136—Incoming video signal characteristics or properties
- H04N19/14—Coding unit complexity, e.g. amount of activity or edge presence estimation
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/146—Data rate or code amount at the encoder output
- H04N19/147—Data rate or code amount at the encoder output according to rate distortion criteria
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/157—Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
- H04N19/159—Prediction type, e.g. intra-frame, inter-frame or bidirectional frame prediction
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/60—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
- H04N19/61—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Physics & Mathematics (AREA)
- Discrete Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
Abstract
本发明涉及通过基于自适应块尺寸变换(ABT)的最小可觉差(JND)模型对视频编码的方法和装置。为了建立最小可觉差模型,使用空间内容信息(SCI)来表示宏块及其子块之间的空间外观相似度,并且使用运动特性距离(MCD)来表示宏块及其子块之间的运动特性相似度。对帧内编码帧,基于宏块SCI的平衡策略被用来产生基于ABT的JND模型。对帧间编码帧,基于宏块SCI和MCD的平衡策略被用来产生基于ABT的JND模型。使用基于ABT的JND模型,帧内每个块的残差系数被滤波以获得一组缩减的残差系数用于传输,但不会降低视觉质量。
Description
【技术领域】
本发明通常涉及数字视频处理,特别涉及包括编码和解码的数字视频编码。
【背景技术】
由于摄像装置的进步,无论何时何地都能够产生越来越多的视频(图像序列,也被称为运动图像)。此外,为了追求更高的分辨率,视频尺寸不断增加,从而涉及到大量数据需要处理。这给诸如显示、传输和存储视频的过程带来了巨大挑战。所以,需要一种视频编码技术,使得视频在不牺牲其质量的情况下能够被压缩。
至于质量,期望发生较少的失真,传统上失真通常是由量化度量如均方差(MSE)和峰值信噪比(PSNR)来衡量的。但是,这些量化度量并不能反映观看者的感受以及失真在观看者眼中的严重程度。因此,通过考虑人类如何视觉感受事物的特性,在不带来额外视觉失真的前提下,需要进一步提高压缩比。换言之,人类如何视觉感受图像的主观试验非常重要。所以,需要保持用户的视觉感受,同时更有效地进行视频处理。
此外,按照视频标准的发展,越来越多的特征被结合到当前和未来的视频编准里。其中一个特征是允许视频编码过程里有各种块尺寸,例如,自适应块尺寸变换(ABT)。通过考虑图像内容,这有助于改善图像质量。所以,需要在视频编码时能够进行ABT,例如,与视频标准如H.264/AVC兼容。
【发明概述】
基于空间内容信息和运动特性距离,本发明产生基于ABT的最小可觉差(JND)模型,其通过残差滤波方法可以应用于视频编码***。JND模型也被称为JND方案。由于JND模型能够以矩阵格式表示,JND模型也被称为JND图。
本发明其中一个优点是通过使用基于ABT的JND模型进行视频编码能够节省高达50%的比特率,而不会降低主观视觉质量。本发明使用人类如何视觉感受事物的特性以降低比特率,而不会带来可觉察的视觉失真。一个模拟人类视觉感受事物过程的***被称为视觉感受模型(VPM)。一个视觉感受模型的例子是最小可觉差(JND)模型。建立基于ABT的JND模型,并提供JND阈值给帧内的每个块,如果非零残差系数的数值小于JND阈值,非零残差系数被滤波。如果非零残差系数的数值大于相应的JND阈值,将从非零残差系数中减去相应的JND阈值。
就本发明JND模型的特性而言,不同于图像域内的现有JND模型,或频率域内产生的基于固定块尺寸DCT的JND模型,本发明采用基于不同块尺寸的基于ABT的JND模型。另外,基于ABT的JND模型在不同块尺寸变换时考虑人类如何视觉感受事物的特性。基于ABT的JND模型是根据空间内容信息(SCI)和运动特性距离(MCD)而确定的。
就本发明JND模型的应用而言,不同于现有JND模型用于图像/视频水印和质量评估,本发明使用JND模型以增强视频编码效率并降低比特率。
此外,依照一个预设的图像质量度量,本发明使用基于ABT的JND模型进行视频编码,而不需要调整量化矩阵。
本发明的一个方面是将固定尺寸的JND模型扩展到不同块尺寸。不同块尺寸的JND模型被用来描述人类对不同尺寸变换如何视觉感受事物的特性。
本发明的另一个方面是确定空间内容信息(SCI),其描述宏块及其子块之间的空间外观相似性。
本发明的另一个方面是确定运动特性距离(MCD),其描述宏块及其子块之间的运动特性相似性。
本发明的另一个方面是基于宏块的SCI使用图像或帧内的不同块尺寸变换之间的平衡策略。
本发明的另一个方面是基于宏块的SCI和MCD使用帧间的不同块尺寸变换之间的平衡策略。
本发明的另一个方面是对不同尺寸变换进行残差滤波以降低比特率并保持相同的视觉质量。
本发明的其它方面也将披露,如以下所述的实施例。
【附图说明】
以下将参照附图,详细描述本发明的目的、方面和实施例,其中:
图1显示本发明一个视频编码的典型实施例的流程图;
图2显示一个产生基于ABT的JND模型的典型实施例的流程图;
图3显示一个基于ABT的JND滤波的典型实施例的流程图;
图4显示在一个实施例里分别在一个16x16块和一个4x4块内分配测试DCT子带。
图5描述宏块及其相应子块的运动矢量以解释MCD一致性概念用于帧间的时间平衡策略。
图6描述一个视频编码装置的典型实施例的模块示意图。
【发明详述】
图1显示本发明提供的一个视频编码典型实施例的流程图。在一个实施例里,视频编码实在一个输入视频110上进行,输入视频110被编码。为了编码输入视频110,计算输入视频110里每帧内不同块尺寸的每个块的JND模型。可能的块尺寸的例子包括但不限于4x4、8x8和16x16。
对每个宏块,基于帧内预测121或帧间预测122,计算预测值。例如,当帧是P帧或B帧时,使用帧间预测122。帧内预测121是基于不同块尺寸如4x4、8x8和16x16,并也被称为不同块尺寸的帧内预测。帧间预测122是基于不同块尺寸如4x4、8x8和16x16,并也被称为不同块尺寸的帧间预测。
差值块(difference block)是由预测和块之间的差异而产生。差值块也被称为残差(residual)块。根据残差块的块尺寸,残差块被分割成不同构造的非重叠块用于进行编码。同时计算以下信息:
(1)块类型,如帧间或帧内;
(2)块分类,如平面、边缘或纹理;和
(3)不同尺寸的块的运动矢量。
以上信息被用来计算最小可觉差(Just-Noticeable Difference,JND)模型140。依照其中一个实施例,根据Jia,Y.;Lin,W.;Kassim,A.A.所著的Estimating Just-Noticeable Distortion for Video(IEEE Transactions on Circuitsand Systems for Video Technology,Vol.16,No.7,pp.820-829,Jul.2006)一文中的Jia的模型,在此其披露通过引用结合到本发明,假设JND模型140最初是专为8x8离散余弦变换(DCT)块开发的。8x8DCT块的JND模型140可以被扩展到以下所述的其它块尺寸。
以X表示将被编码的块,Xp是X的预测。如以下等式(1)所示,残差块Xr被变换、量化和编码。
Xr=X-Xp (1)
残差块Xr通过自适应块尺寸变换(ABT)130进行变换,也被称为不同块尺寸变换,如通过不同块尺寸离散余弦变换(DCT)以计算被变换的残差块Y。被变换的残差块Y在以下等式(2)定义:
Y=T(Xr) (2)
其中T表示在残差块Xr上的ABT。被量化的变换的残差块Yq在以下等式(3)定义:
Yq=Q(Y) (3)
其中Q表示量化运算。
对块X,计算基于ABT的JND模型140。基于ABT的JND模型140,由JX(u,v)表示,是一个包括JND阈值的矩阵或图,超过该JND阈值,观察者就能注意到每个残差系数的任何失真。JND阈值的计算将在以下讨论。
以Y(u,v)表示残差块Xr的第(u,v)位置的残差系数。如果Y(u,v)的幅值小于JX(u,v),则可以丢弃变换的残差系数Y(u,v)。如果Y(,v)的幅值大于JX(u,v),变换的残差系数Y(u,v)减去JX(u,v)。变换的残差系数Y(u,v)的处理也被称为一个滤波步骤150(基于ABT的JND滤波)。在一个实施例里,基于ABT的JND滤波步骤150在量化之前实施,并且滤波计算如以下等式(4)定义:
其中Yj是JND滤波变换块。Sign函数确保在滤波之后Y(u,v)仍然是负或正。由于残差系数被滤波,通过以下等式(5)计算重建块Xj’:
Xj’=Xp+T1(Q-1(Yj,q)) (5)
其中Yj,q是被量化的Yj。
在重建块Xj’和块X之间的失真d由以下等式(6)定义:
d=||Xj′-X||1 (6)
其中失真d等于重建块和初始块之间的绝对差总和(SAD)。其它差值度量,诸如但不限于平方差总和(SSD)或绝对变换差总和(SATD),也可以被用于率失真优化(RD0)160。
以E表示初始块和重建块之间的DCT变换差,并且从以下等式(7)计算E:
E=T(Xj’-X) (7)
E由以上等式(4)的JX滤波,由以下等式(8)计算滤波:
对“滤波”,进行以下操作:如果E(u,v)的幅值小于JX(u,v),可以丢弃DCT变换差E(u,v)。如果E(u,v)的幅值大于JX(u,v),则DCT变换差E(u,v)减去JX(u,v)。然后,如以下等式(9)所示,从Ej的逆变换,计算失真dj,用于率失真优化160:
dj=||T-1(Ej)||1 (9)
如果能够进行率失真优化160,选择的块的预测模式是最小化RD(率失真)成本。例如,RD成本是由以下等式(10)定义:
R=d+λL (10)
其中λ是Lagrangian乘子,而L是利用预测模式对块进行编码的实际比特长度。例如,如果帧间预测的RD成本低于帧内预测,那么就选择帧间预测作为该块的预测模式。
基于ABT的JND滤波步骤150可以看作是一个自适应量化步骤,其中每个块的量化装置是由其空间和时间特性确定的。因为基于ABT的JND滤波的块将经历正常的编码程序,比特流完全与H.264标准兼容,并且能够通过任何解码器准确地进行解码。
选择的变换模式与被滤波的残差系数一起,通过熵编码170进行编码。在进行不同块尺寸变换和基于ABT的JND滤波之后,计算宏块的总失真及其所需比特。根据宏块的总失真及其所需比特,依照率失真优化而确定最佳变换模式(最佳变换尺寸)。基于ABT的JND模型140与变换模式有关,所以不需要编码额外信息。
图2显示一个典型实施例的产生基于ABT的JND模型的流程图。为了产生基于ABT的JND模型,需要确定块类型210。如果是一个帧间块,一个根据空间和时间特性的平衡策略是合适的。如果是一个帧内块,仅空间平衡策略就合适了。在一个实施例里,使用8x8基于DCT的JND模型,并可以扩展到不同块尺寸的基于DCT的JND模型,如16x16基于DCT的JND模型和4x4基于DCT的JND模型。图像的自适应的基于块尺寸变换(ABT)的最小可觉差(JND)模型的详情在Ma,Lin;Ngan,King N.所著的AdaptiveBlock-Size Transform Based Just-Noticeable Difference Profile for Images(Proceedings of the 10th Pacific Rim Conference on Multimedia:Advances inMultimedia Information Processing,Session 13:Advanced Image ProcessingTechniques;Page 1208-1218;2009)一文里有描述,在此其披露通过引用结合到本发明。
在图像域或变换域内可以确定一个自动的JND模型,如DCT和离散小波变换(DWT)或这两种方案的组合。为了准确地描述人类如何视觉感受事物,在变换域内产生的一个JND模型,其也被称为基于子带(subband-based)的JND,可以集合所有主要的影响因子。主要影响因子包括但不限于空间对比敏感度函数(CSF)、亮度适应效应和对比度掩盖(contrast masking)。
ABT允许不同的变换尺寸。依照普通策略采用不同的变换尺寸,即较大变换会提供较好的能量压缩和较好的细节保留,而较小变换可以避免压缩期间的振铃现象。如果使用不同的变换尺寸,本发明允许基于ABT的JND模型使用人类如何视觉感受事物的不同表现。在扩展期间,进行心理物理实验来参数化空间CSF以考虑人类如何视觉感受事物的特性。图像内容也被自适应地调整以确定采用哪一个变换尺寸来产生基于ABT的JND模型。
对一个帧内块,使用空间平衡策略220来确定空间内容信息(SCI)在块内是否一致。根据空间平衡策略220,如果一个16×16块的空间内容信息一致,DCT的块尺寸被选择为16×16。16×16DCT被用来产生基于ABT的JND模型。根据基于16×16块尺寸的心理物理实验221,产生的基于ABT的JND模型是基于16×16的块尺寸。如果16×16块的空间内容信息不一致,那么16×16块被分割成8×8块。随后,对每个8×8块,根据空间平衡策略222,如果8×8块的空间内容信息一致,就选择DCT的块尺寸为8×8。8×8DCT被用来产生基于ABT的JND模型。产生的基于ABT的JND模型是基于8×8的块尺寸。如果8×8块的空间内容信息不一致,就选择DCT的块尺寸为4×4,4×4DCT被用来产生基于ABT的JND模型。根据基于4×4块尺寸的心理物理实验223,产生的基于ABT的JND模型是基于4×4的块尺寸。
对一个帧间块,使用空间和时间平衡策略230来确定16×16块的空间内容信息(SCI)是否一致,以及16×16块的运动特性距离(MCD)是否一致。依照空间和时间平衡策略230,如果SCI和MCD一致,就选择DCT的块尺寸为16×16。16×16DCT被用来产生基于ABT的JND模型。根据基于16×16块尺寸的心理物理实验231,产生的基于ABT的JND模型是基于16×16的块尺寸。如果SCI和MCD不一致,16×16块被分割成8×8区块。随后,对每个8×8块,使用空间和时间平衡策略232来确定8×8块的SCI是否一致以及8×8块的MCD是否一致。依照空间和时间平衡策略232,如果SCI和MCD一致,就选择DCT的块尺寸为8×8。8×8DCT被用来产生基于ABT的JND模型。如果SCI和MCD不一致,就选择DCT的块尺寸为4×4。4×4DCT被用来产生基于ABT的JND模型。根据基于4×4块尺寸的心理物理实验233,产生的基于ABT的JND模型是基于4×4的块尺寸。
空间平衡策略
在心理物理学中,最小可觉差(JND)是某一特定感官刺激所能察觉的最小差别。JND也被看作是差别阈限或差分阈值。通常,JND模型能够以以下等式(11)表述:
其中是空间JND,而是时间JND调制因子。在帧间帧,对于处理不适合运动估计的块,也需要帧内预测。因为这些块依赖于其空间邻近块多于时间帧。因此,这些块被看作仅包含空间信息,并通过遵循空间平衡策略的空间JND模型进行模拟。
在DCT域里的空间JND模型是由以下等式(12)确定:
T(m,n,i,j)=Tbasic(i,j)·αlum(m,n)·αcm(m,n,i,j) (12)
其中(m,n)表示图像里DCT块的位置,(i,j)表示DCT子带(i,j),Tbasic是由空间对比敏感度函数(CSF)产生的基本可视度阈值;αlum是亮度适应性αcm是对比度掩盖;而T(m,n,i,j)是获得的空间JND阈值。
基本可视度阈值
基本可视度阈值Tbasic被定为空间频率的对比敏感度的倒数,其是在空间频率上人类视觉感受的敏感度,并通过以下等式(13)进行模拟:
H(ω)=(a+bω)·exp(-cω) (13)
其中ω是指定的空间频率。由于JND阈值是由等式(13)模拟的敏感度的倒数,基本JND阈值由以下等式(14)模拟:
其中s=0.25表示求和影响因子,并且φi,φj是如以下等式(15)所定义的DCT正态因子:
其中θx和θy分别是水平和垂直视觉角度,由以下等式(18)提供:
θx=θy=2·arctan(1/(2·Rd·Ph)) (18)
其中Rd表示观看距离与图像高度的比率,而Ph是图像高度(像素)。参数(a,b,c)在以下段落进行定义和计算。
亮度适应性
亮度适应性αlum,被用来表示对比不同亮度有多容易地察觉到差别。例如,在黑暗或明亮区域内有一个较高的可视度阈值,以表示要察觉到任何差别会更困难些,而在中等亮度区域内有一个较低的可视度阈值,以表示更容易察觉到任和差别。亮度适应性是基于DCT块的平均强度Iave,由以下等式(19)给定:
其中Iave是整个DCT块的平均强度值。
对比度掩盖
对比度掩盖αcm被用来表示在出现另一个视觉分量时一个视觉分量可视度的降低。例如,在一个纹理区域内将较难见到噪声,而在一个光滑区域或边缘区域内将更容易见到噪声。因此,αcm依块分类的不同而不同,由以下等式(20)给定:
在一个实施例里,块分类是在图像域内实施的。首先,在图像域内使用Canny边缘探测器标记边缘像素。其次,基于块内的边缘像素数目,块可以被分类成三种类型,即分别是PLANE(平面)、EDGE(边缘)、和TEXTURE(纹理)。例如,对一个16×16宏块,依照以下等式(21)定义块分类:
其中∑Edge是在一个给定宏块里边缘像素的数目。
在一个实施例里,时间JND模型由以下等式(20)确定:
其中ft=fsxvx+fsyvy,fsx,fsy分别是水平空间频率和垂直空间频率,而vx,vy分别是沿着水平方向和沿着垂直方向在视网膜平面上物体运动的速度。
不同块尺寸变换之间的JND方案的平衡策略
在扩展8×8到16×16以及4×4之后,将获得三个基于不同块尺寸变换的JND方案。较小块尺寸的DCT将产生较好的能量压缩和细节信息保留,而较大块尺寸的DCT能够更有效地表示局部图像块的内容和特性。
帧内的空间平衡策略
对帧内,图像首先被分割成16×16宏块。块分类被采用作为平衡不同JND方案的基础。如表格1所示,第一列表示16×16宏块类型,而第二列表示8×8子块分类。第三列是产生JND方案的决定。例如,如果16×16宏块被标记为PLANE,而在宏块内的所有8×8子块也被标记为PLANE,则采用16×16基于DCT的JND模型,因为其具有能量压缩和细节信息保留的优点。否则,JND方案确定过程将继续,如以下表格2:
例如,如果8×8子块被标记为PLANE,并且在8×8子块内的所有4×4子块也被标记为PLANE,根据8×8子块的不同信息和特性,如块类型是否是PLANE或EDGE或TEXTURE,则采用8×8基于DCT的JND模型用于16×16宏块内的每个8×8子块。否则,通过考虑4×4子块的不同内容信息和特性,如区块类型是否是PLANE或EDGE或TEXTURE,采用4×4基于DCT的JND模型用于每个4×4子块。
帧间的时间平衡策略
块及其子块之间的时间特性被用于帧间的平衡策略。在一个实施例里,运动矢量被用来表示物体的运动特性。运动特性距离(MCD)表示一个宏块及其子块之间的运动特性相似性。MCD由以下等式(23)确定:
其中MVs_i是子块的运动矢量,而MVM_i是宏块的运动矢量。
如果MCD小于阈值,空间内容信息一致,那么将使用一个较大的基于DCT的JND。否则,将采用较小的基于DCT的JND。
图5描述宏块及其相应子块的运动矢量以解释MCD一致性概念用于帧间的时间平衡策略。图5显示一个当前帧520及其参考帧510。在当前帧520里的宏块521有一个运动矢量,指向参考帧510里的相应宏块511。当前帧520里的宏块522有一个运动矢量,指向参考帧510里的相应宏块512。图中显示,与宏块522的子块的那些运动矢量相比,宏块521的子块的运动矢量与宏块521的运动矢量更加一致。宏块522的MCD大于宏块521的MCD,甚至大于阈值,都是可能的。
心理物理实验
图4显示一个实施例里分别在一个16×16块和一个4×4块内示例分配测试DCT子带。在一个16×16块410的实施例里,测试DCT子带是由阴影单元表示,如单元411,其分配如附图所示。在一个4×4块420的实施例里,测试DCT子带由阴影单元表示,如单元421,其分配如附图所示。如图4所示,测试DCT子带被分配,使得至少一个测试DCT子带安排在每行和每列上,测试DCT子带覆盖低频、中频和高频,并且至少一个DCT子带被安排在每个对角线上。噪声被分别加到16×16和4×4DCT的某些空间频率子带上。对每个测试DCT子带,基于预设的衡量,对每个子带选择多个幅度的噪声。对是否能够感受到噪声,观察者提供意见和看法。如果能察觉到噪声,将降低噪声幅度。相反,如果感受不到噪声,将提高噪声幅度。在实验之后,能够获得所选择DCT子带的最小可觉差阈值。
JND模型有方向性,其表示为对水平和垂直频率分量的最大敏感度和对对角线分量的最小敏感度。
在参数化期间,至少一个DCT子带被安排在每行和每列上,至少一个DCT子带被安排在每个对角线上,并且DCT子带最好覆盖低频、中频和高频。
采用最小均方误差来拟合获得的JND阈值,如以下等式(24):
图3显示一个基于ABT的JND滤波的典型实施例的流程图。在一个实施例里,依照不同变换尺寸的DCT,4×4残差系数301、8×8残差系数302、和16×16残差系数303是从ABT 300获得。
通过产生JND模型310,而产生选择的JND模型311,其可以是4×4JND模型、8×8JND模型、或16×16JND模型。此外,每个变换尺寸有两种类型的JND模型,即帧内宏块的空间JND模型和帧间宏块的时间JND模型。
为了使JND模型与ABT变换兼容,选择的JND模型通过JND扩展312被扩展到基于不同块尺寸的JND模型。在JND扩展312里,一些信息诸如不同块的块类型、块分类和运动矢量被用来产生每个块的基于不同块尺寸的JND模型。因此,获得了4×4JND模型321、8×8JND模型322、和16×16JND模型323用于滤波变换的残差系数。
等式(25)表示滤波过程。“typ”表示用于DCT变换和JND模型的块尺寸。Etyp是根据不同块尺寸的变换的残差系数,JNDtyp是产生的JND,其可以是4×4JND模型321、8×8JND模型322、或16×16JND模型323。是被滤波的系数。
在滤波之后,获得4×4被滤波的残差系数331、8×8被滤波的残差系数332、或16×16被滤波的残差系数333。残差系数与预测模式信息一起将由率失真优化(RDO)340进行处理以选择最佳预测模式。因此,当率失真被激活时,选择用于块的预测模式即是最小化率失真成本的那个预测模式。在一个实施例里,率失真成本被定义为R=d+λL。
其中λ是Lagrangian乘子,而L是对那个预测模式的块进行编码的实际比特长度。
图6描述本发明提供的一个视频编码装置的典型实施例的模块示意图。以下所述的各个部件可以被实施为一个或多个处理器。预测模式确定单元601对输入视频数据进行运作,根据帧预测模式确定视频信号里的帧是帧间编码帧还是帧内编码帧。ABT单元603在输入视频数据上执行自适应块变换以产生各种块尺寸的DCT变换信号。另一方面,基于ABT的JND模型产生单元602基于以下上述信息产生一个基于ABT的JND模型:
(1)块类型,如帧间或帧内;
(2)块分类,如平面、边缘或纹理;和
(3)不同尺寸块的运动矢量。
基于ABT的JND模型包括一个或多个JND阈值,这些阈值是由基于视觉感受模型的心理物理实验确定的。根据上述空间平衡策略,基于ABT的JND模型产生单元602基于空间内容信息计算帧内编码帧的基于ABT的JND模型。根据上述空间和时间平衡策略,基于ABT的JND模型产生单元602也基于空间内容信息和时间特性计算帧间编码帧的基于ABT的JND模型。
通过丢弃一个或多个低于基于ABT的JND模型的JND阈值的残差系数,基于ABT的JND滤波单元604滤波一个或多个残差系数,从而输出一个被滤波的残差系数的信号。基于被滤波的残差系数,如果率失真优化单元激活时,通过降低率失真成本,率失真优化单元605确定率失真成本以选择最佳预测模式。
接着,在对被滤波的残差系数进行编码之后,熵编码单元606计算被编码的数据。
本发明实施例能够以软件、硬件、应用逻辑的形式实施,或以软件、硬件和应用逻辑的组合而实施。软件、应用逻辑和/或硬件可以被安置在集成电路芯片、模块或存储器里。如果期望的话,部分软件、硬件和/或用用逻辑可以被安置在集成电路芯片里,部分软件、硬件和/或用用逻辑可以被安置在模块里,并且部分软件、硬件和/或用用逻辑可以被安置在存储器里。在一个典型实施例里,应用逻辑、软件或指令集合保留在任何一种传统的非临时性计算机可读媒质里。
在本说明书里描述的过程和逻辑流程可以通过一个或多个可编程处理器运行一个或多个计算机程序,运行输入数据并产生输出,以执行以上功能。过程和逻辑流程也可以通过专用逻辑电路如FPGA(现场可编程栅极阵列)或ASIC(专用集成电路)来运行。
在本说明书里描述的装置或设备可以通过可编程处理器、计算机、芯片***或其组合来实施,运行输入数据并产生输出。装置或设备可以包括专用逻辑电路如FPGA(现场可编程栅极阵列)或ASIC(专用集成电路)。装置或设备也可以包括硬件、为计算机程序产生运行环境的代码,如构成处理器固件、协议堆栈、数据库管理***、运行***、跨平台运行环境的代码,如虚拟机或一个或多个虚拟机的组合。
适合执行计算机程序的处理器包括诸如通用和专用微处理器,以及任何类型数字计算机的任何一个或多个处理器。通常,处理器从只读存储器和/或随机存取存储器接收指令和数据。计算机元件通常包括一个用来执行指令的处理器、以及一个或多个用来存储指令和数据的存储器装置。
在本说明书里描述的计算机可读媒质可以是任何与指令执行***、装置或设备如计算机一起连接以保留、存储、通信、传播或传输所用指令的任何媒质或装置。计算机可读媒质可以包括计算机可读存储媒质,其可以是任何与指令执行***、装置或设备如计算机一起连接以保留或存储所用指令的媒质或装置。计算机可读媒质可以包括所有形式的非易失性存储器、媒质和存储器装置,包括如半导体存储器装置,如EPROM、EEPROM、和闪存装置,磁碟如内置硬碟或可移除碟、磁光碟、以及CD-ROM和DVD-ROM碟。
计算机程序(也被称为程序、软件、软件应用程序、脚本或代码)可以任何编码语言撰写,包括可编译或可解释语言、可陈述或程序语言,并且能够以任何形式运行,包括以一个单机程序或适合用于计算环境里的一个模块、组件、子程序、对象或其它单元。计算机程序可以在一个计算机或多个计算机上运行,计算机可以安置在单个地点或分布在多个地点,并通过通信网络互连。
在本说明书里描述的实施例和/或特征可以实施在一个计算***里,其包括一个后端部件如数据服务器,或其包括一个中间件部件如应用程序服务器,或其包括一个前端部件如具有用户界面或Web浏览器的客户计算机,由此用户能够与本说明书里所述的实施例进行互动,或该计算机***可以是一个或多个这种后端、中间或前端部件的任何组合。***部件可以通过任何形式或通过数字数据通信的方法如通信网络而进行互连。通信网络的例子包括局域网(LAN)和广域网(WAN),如互联网。
计算***可以包括客户机和服务器。客户机和服务器通常互相远离,并通常通过一个通信网络进行互动。客户机和服务器的关系凭借各个计算机上运行的计算机程序发生联系,并互相有一个客户机-服务器的关系。
整个说明书包括许多具体实施细节。这些具体实施细节并不意味着是对本发明范围的限制,而是作为本发明特别实施例的具体特征描述。
在各个实施例上下文里描述的某些特征也可以被合并,并作为单个实施例。相反地,在单个实施例的上下文里描述的各个特征也可以单独或以任何合适的亚合并方式实施在多个实施例里。此外,尽管特征可以被描述以某些方式合并,甚至初始作如此声明,来自所述组合或声明组合的一个或多个特征在某些情况下可以被排除出组合,并且声明组合可能涉及一个亚组合或一个亚组合的变化。尽管本发明各个方面在独立权利要求里有阐述,但本发明的其它方面还包括来自实施例和/或从属权利要求的特征以及独立权利要求特征的其他组合,且并不是仅仅在权利要求里明确阐述的组合。
在本说明书里描述的某些功能可以以不同次序和/或互相同时执行。而且,如果期望的话,一个或多个上述功能可以是可选的或可以合并。
以上描述提供了本发明的典型实施例,但不应该被看作是限制性的。此外,还有可能对其作出改变和修改,而不会脱离如在所附权利要求里所定义的本发明范围。
Claims (17)
1.一种视频编码装置,包括:
一个提供视频信号的单元;
一个预测模式确定单元,其依照帧预测模式确定视频信号里的帧是帧间编码帧还是帧内编码帧;
一个基于ABT的JND模型产生单元,其产生一个基于ABT的JND模型,该模型包括由基于视觉感受模型的心理物理实验确定的一个或多个JND阈值;和
一个基于ABT的JND滤波器,其通过去除一个或多个低于JND阈值的残差系数并从一个或多个大于JND阈值的残差系数中减去JND阈值来滤波一个或多个残差系数,从而输出一个含有被滤波的残差系数的信号。
2.根据权利要求1所述的视频编码装置,其中:
基于空间内容信息,基于ABT的JND模型产生单元为帧内编码帧计算基于ABT的JND模型。
3.根据权利要求2所述的视频编码装置,其中:
如果块及其子块之间的空间内容信息一致,就选择一个较大块尺寸的基于ABT的JND模型。
4.根据权利要求2所述的视频编码装置,其中:
空间内容信息是由块类型确定,而块类型是由帧的每个块里的边缘像素数量决定的。
5.根据权利要求1所述的视频编码装置,其中:
基于空间内容信息和时间特性,基于ABT的JND模型产生单元为帧间编码帧计算基于ABT的JND模型。
6.根据权利要求5所述的视频编码装置,其中:
如果空间内容信息一致并且时间特性一致,就选择一个较大块尺寸的基于ABT的JND模型。
7.根据权利要求5所述的视频编码装置,其中:
空间内容信息是由块类型确定,而块类型是由帧的每个块里的边缘像素数量决定。
8.根据权利要求5所述的视频编码装置,其中:
时间特性是由块及其子块之间的运动特性距离确定。
9.一种对视频信号进行编码的方法,包括:
使用权利要求1所述的视频编码装置,处理视频信号。
10.一种对视频信号进行编码的方法,包括:
提供一个将被编码的视频信号;
依照帧预测模式确定视频信号里的帧是帧间编码帧还是帧内编码帧;
产生一个基于ABT的JND模型,其包括由基于视觉感受模型的心理物理实验确定的一个或多个JND阈值;和
通过去除一个或多个低于JND阈值的残差系数并从一个或多个大于JND阈值的残差系数减去JND阈值,滤波一个或多个残差系数,从而输出一个具有被滤波的残差系数的信号。
11.根据权利要求10所述的视频信号编码方法,还包括:
基于空间内容信息,计算帧内编码帧的基于ABT的JND模型。
12.根据权利要求11所述的视频信号编码方法,其中:
如果块及其子块之间的空间内容信息一致,就选择一个较大块尺寸的基于ABT的JND模型。
13.根据权利要求11所述的视频信号编码方法,其中:
空间内容信息是由块类型确定的,而块类型是由帧的每个块里的边缘像素数量决定。
14.根据权利要求10所述的视频信号编码方法,还包括:
基于空间内容信息和时间特性,计算帧间编码帧的基于ABT的JND模型。
15.根据权利要求14所述的视频信号编码方法,其中:
如果空间内容信息一致并且时间特性一致,就选择一个较大块尺寸的基于ABT的JND模型。
16.根据权利要求14所述的视频信号编码方法,其中:
空间内容信息是由块类型确定的,而块类型是由帧的每个块里的边缘像素数量决定。
17.根据权利要求14所述的视频信号编码方法,其中:
时间特性是由块及其子块之间的运动特性距离确定。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US12/750,401 | 2010-03-30 | ||
US12/750,401 US8559511B2 (en) | 2010-03-30 | 2010-03-30 | Method and apparatus for video coding by ABT-based just noticeable difference model |
Publications (2)
Publication Number | Publication Date |
---|---|
CN101835048A true CN101835048A (zh) | 2010-09-15 |
CN101835048B CN101835048B (zh) | 2012-09-26 |
Family
ID=42718950
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN2010101741455A Expired - Fee Related CN101835048B (zh) | 2010-03-30 | 2010-04-30 | 通过基于自适应块尺寸变换abt的最小可觉差jnd模型进行视频编码的方法和装置 |
Country Status (2)
Country | Link |
---|---|
US (1) | US8559511B2 (zh) |
CN (1) | CN101835048B (zh) |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102706453A (zh) * | 2012-06-14 | 2012-10-03 | 北京印刷学院 | 不同心理物理实验方法的比较评价方法 |
CN103596006A (zh) * | 2013-12-04 | 2014-02-19 | 西安电子科技大学 | 基于视觉冗余度量的图像压缩方法 |
CN105284110A (zh) * | 2013-07-31 | 2016-01-27 | 松下电器(美国)知识产权公司 | 图像编码方法及图像编码装置 |
CN107257475A (zh) * | 2011-10-17 | 2017-10-17 | 株式会社Kt | 利用解码装置解码视频信号的方法 |
CN108521572A (zh) * | 2018-03-22 | 2018-09-11 | 四川大学 | 一种基于像素域jnd模型的残差滤波方法 |
CN111260533A (zh) * | 2020-01-17 | 2020-06-09 | 山东师范大学 | 融合图像块内和块间纹理规则特征的图像水印方法及*** |
CN113489674A (zh) * | 2021-05-25 | 2021-10-08 | 南京邮电大学 | 一种面向物联网***的恶意流量智能检测方法及应用 |
Families Citing this family (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101911716A (zh) * | 2008-01-18 | 2010-12-08 | 汤姆森许可贸易公司 | 评估感知质量的方法 |
JP5818800B2 (ja) * | 2009-10-05 | 2015-11-18 | トムソン ライセンシングThomson Licensing | 符号化方法及び復号化方法 |
US9398300B2 (en) * | 2011-10-07 | 2016-07-19 | Texas Instruments Incorporated | Method, system and apparatus for intra-prediction in video signal processing using combinable blocks |
US9819965B2 (en) * | 2012-11-13 | 2017-11-14 | Intel Corporation | Content adaptive transform coding for next generation video |
US9237343B2 (en) * | 2012-12-13 | 2016-01-12 | Mitsubishi Electric Research Laboratories, Inc. | Perceptually coding images and videos |
EP2951999A4 (en) | 2013-01-30 | 2016-07-20 | Intel Corp | CONTENT PARAMETRIC TRANSFORMATIONS FOR CODING VIDEOS OF THE NEXT GENERATION |
US9967559B1 (en) * | 2013-02-11 | 2018-05-08 | Google Llc | Motion vector dependent spatial transformation in video coding |
CN103607589B (zh) * | 2013-11-14 | 2016-08-24 | 同济大学 | 基于层次选择性视觉注意力机制的jnd阈值计算方法 |
KR20150095591A (ko) * | 2014-02-13 | 2015-08-21 | 한국과학기술원 | 시각적 인지 특성을 이용한 pvc 방법 |
CN105303531B (zh) * | 2015-10-15 | 2018-01-26 | 深圳市华星光电技术有限公司 | 一种对比度调整方法及装置 |
CN115278230A (zh) * | 2015-11-11 | 2022-11-01 | 三星电子株式会社 | 对视频进行解码的设备和对视频进行编码的设备 |
KR101737006B1 (ko) * | 2017-01-25 | 2017-05-17 | 광운대학교 산학협력단 | 인지 품질 기반의 변환 부호화 고속화 방법 및 장치 |
US10356404B1 (en) * | 2017-09-28 | 2019-07-16 | Amazon Technologies, Inc. | Image processing using just-noticeable-difference thresholds |
CN109525847B (zh) * | 2018-11-13 | 2021-04-30 | 华侨大学 | 一种恰可察觉失真模型阈值计算方法 |
CN112738515B (zh) * | 2020-12-28 | 2023-03-24 | 北京百度网讯科技有限公司 | 用于自适应量化的量化参数调整方法和装置 |
CN113160342B (zh) * | 2021-05-14 | 2023-08-25 | 杭州网易智企科技有限公司 | 基于反馈的编码方法及装置、存储介质、电子设备 |
US20230169794A1 (en) * | 2021-11-30 | 2023-06-01 | Irina Kezele | Method, device, and medium for adaptive inference in compressed video domain |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN2517124Y (zh) * | 2001-06-19 | 2002-10-16 | 四川省视频电子有限责任公司 | 同步卫星地球站太阳定位天线 |
CN2657213Y (zh) * | 2003-09-19 | 2004-11-17 | 中卫科技股份有限公司 | 卫星天线可调角度的固定装置 |
CN101017924A (zh) * | 2006-11-09 | 2007-08-15 | 屠小德 | 卫星直播天线及成套组合接收方法 |
CN101019435A (zh) * | 2004-09-08 | 2007-08-15 | 松下电器产业株式会社 | 动态图像编码方法及动态图像解码方法 |
CN101060626A (zh) * | 2007-05-10 | 2007-10-24 | 武汉大学 | 一种视频转码中帧内模式的快速选择方法 |
CN101159873A (zh) * | 2007-11-16 | 2008-04-09 | 中国科学院计算技术研究所 | 一种帧间模式选择方法 |
CN201062953Y (zh) * | 2007-08-08 | 2008-05-21 | 黄嘉莹 | 快速找卫星的辅助装置 |
CN101217663A (zh) * | 2008-01-09 | 2008-07-09 | 上海华平信息技术股份有限公司 | 用于编码器的图像像素块编码模式的快速选择方法 |
CN100551075C (zh) * | 2007-10-15 | 2009-10-14 | 中兴通讯股份有限公司 | 一种低复杂度的帧内预测模式选择方法 |
Family Cites Families (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5559900A (en) | 1991-03-12 | 1996-09-24 | Lucent Technologies Inc. | Compression of signals for perceptual quality by selecting frequency bands having relatively high energy |
US5426512A (en) | 1994-01-25 | 1995-06-20 | The United States Of America As Represented By The Administrator Of The National Aeronautics And Space Administration | Image data compression having minimum perceptual error |
US5629780A (en) | 1994-12-19 | 1997-05-13 | The United States Of America As Represented By The Administrator Of The National Aeronautics And Space Administration | Image data compression having minimum perceptual error |
US6611608B1 (en) | 2000-10-18 | 2003-08-26 | Matsushita Electric Industrial Co., Ltd. | Human visual model for data hiding |
WO2005055618A1 (en) | 2003-12-02 | 2005-06-16 | Agency For Science, Technology And Research | Method and system for video quality measurements |
WO2006012375A1 (en) * | 2004-07-20 | 2006-02-02 | Qualcomm Incorporated | Method and apparatus for motion vector processing |
US7783130B2 (en) | 2005-01-24 | 2010-08-24 | The United States Of America As Represented By The Administrator Of The National Aeronautics And Space Administration | Spatial standard observer |
KR100750138B1 (ko) * | 2005-11-16 | 2007-08-21 | 삼성전자주식회사 | 인간의 시각 특성을 이용한 영상의 부호화, 복호화 방법 및장치 |
US20100086063A1 (en) * | 2008-10-02 | 2010-04-08 | Apple Inc. | Quality metrics for coded video using just noticeable difference models |
-
2010
- 2010-03-30 US US12/750,401 patent/US8559511B2/en active Active
- 2010-04-30 CN CN2010101741455A patent/CN101835048B/zh not_active Expired - Fee Related
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN2517124Y (zh) * | 2001-06-19 | 2002-10-16 | 四川省视频电子有限责任公司 | 同步卫星地球站太阳定位天线 |
CN2657213Y (zh) * | 2003-09-19 | 2004-11-17 | 中卫科技股份有限公司 | 卫星天线可调角度的固定装置 |
CN101019435A (zh) * | 2004-09-08 | 2007-08-15 | 松下电器产业株式会社 | 动态图像编码方法及动态图像解码方法 |
CN101017924A (zh) * | 2006-11-09 | 2007-08-15 | 屠小德 | 卫星直播天线及成套组合接收方法 |
CN101060626A (zh) * | 2007-05-10 | 2007-10-24 | 武汉大学 | 一种视频转码中帧内模式的快速选择方法 |
CN201062953Y (zh) * | 2007-08-08 | 2008-05-21 | 黄嘉莹 | 快速找卫星的辅助装置 |
CN100551075C (zh) * | 2007-10-15 | 2009-10-14 | 中兴通讯股份有限公司 | 一种低复杂度的帧内预测模式选择方法 |
CN101159873A (zh) * | 2007-11-16 | 2008-04-09 | 中国科学院计算技术研究所 | 一种帧间模式选择方法 |
CN101217663A (zh) * | 2008-01-09 | 2008-07-09 | 上海华平信息技术股份有限公司 | 用于编码器的图像像素块编码模式的快速选择方法 |
Cited By (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107257475B (zh) * | 2011-10-17 | 2020-04-21 | 株式会社Kt | 利用解码装置解码视频信号的方法 |
CN107257457B (zh) * | 2011-10-17 | 2020-04-21 | 株式会社Kt | 利用解码装置解码视频信号的方法 |
CN107257475A (zh) * | 2011-10-17 | 2017-10-17 | 株式会社Kt | 利用解码装置解码视频信号的方法 |
CN107257457A (zh) * | 2011-10-17 | 2017-10-17 | 株式会社Kt | 利用解码装置解码视频信号的方法 |
CN102706453B (zh) * | 2012-06-14 | 2013-12-11 | 北京印刷学院 | 不同心理物理实验方法的比较评价方法 |
CN102706453A (zh) * | 2012-06-14 | 2012-10-03 | 北京印刷学院 | 不同心理物理实验方法的比较评价方法 |
CN105284110A (zh) * | 2013-07-31 | 2016-01-27 | 松下电器(美国)知识产权公司 | 图像编码方法及图像编码装置 |
CN105284110B (zh) * | 2013-07-31 | 2019-04-23 | 太阳专利托管公司 | 图像编码方法及图像编码装置 |
CN103596006A (zh) * | 2013-12-04 | 2014-02-19 | 西安电子科技大学 | 基于视觉冗余度量的图像压缩方法 |
CN108521572A (zh) * | 2018-03-22 | 2018-09-11 | 四川大学 | 一种基于像素域jnd模型的残差滤波方法 |
CN108521572B (zh) * | 2018-03-22 | 2021-07-16 | 四川大学 | 一种基于像素域jnd模型的残差滤波方法 |
CN111260533A (zh) * | 2020-01-17 | 2020-06-09 | 山东师范大学 | 融合图像块内和块间纹理规则特征的图像水印方法及*** |
CN111260533B (zh) * | 2020-01-17 | 2023-04-25 | 山东师范大学 | 融合图像块内和块间纹理规则特征的图像水印方法及*** |
CN113489674A (zh) * | 2021-05-25 | 2021-10-08 | 南京邮电大学 | 一种面向物联网***的恶意流量智能检测方法及应用 |
CN113489674B (zh) * | 2021-05-25 | 2022-09-30 | 南京邮电大学 | 一种面向物联网***的恶意流量智能检测方法及应用 |
Also Published As
Publication number | Publication date |
---|---|
US8559511B2 (en) | 2013-10-15 |
US20110243228A1 (en) | 2011-10-06 |
CN101835048B (zh) | 2012-09-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN101835048B (zh) | 通过基于自适应块尺寸变换abt的最小可觉差jnd模型进行视频编码的方法和装置 | |
CN103918262B (zh) | 基于结构相似度的码率失真优化感知视频编码方法和*** | |
US9282330B1 (en) | Method and apparatus for data compression using content-based features | |
CN103124347B (zh) | 利用视觉感知特性指导多视点视频编码量化过程的方法 | |
CN101019437B (zh) | 基于帧内预测方向的h.264空间错误隐藏 | |
CN104823448B (zh) | 用于视频编码中的颜色自适应的装置和介质 | |
CN101534436B (zh) | 一种视频图像宏块级自适应码率分配方法 | |
CN106028026A (zh) | 一种基于时空域结构的高效视频质量客观评价方法 | |
CN104919805A (zh) | 使用至少评估后的视觉质量的视频编码方法和相关视频编码装置 | |
CN104823447B (zh) | 视频编码中的颜色自适应 | |
CN104378636B (zh) | 一种视频图像编码方法及装置 | |
CN102752596B (zh) | 一种率失真优化方法 | |
CN101710993A (zh) | 基于块的自适应超分辨率视频处理方法及*** | |
Xu et al. | Free-energy principle inspired video quality metric and its use in video coding | |
CN107580217A (zh) | 编码方法及其装置 | |
Yang et al. | Optimized-SSIM based quantization in optical remote sensing image compression | |
CN101056408B (zh) | 用于确定视频编码中跳跃模式的阈值的方法和装置 | |
CN110169059A (zh) | 视频代码化的复合预测 | |
CN105681803B (zh) | 一种大容量的hevc视频信息隐藏方法 | |
Pascual et al. | Adjustable compression method for still JPEG images | |
CN113079373A (zh) | 一种基于hevc-scc的视频编码方法 | |
Gao et al. | Quality constrained compression using DWT-based image quality metric | |
CN110115033A (zh) | 用于有损静止图像编码的混合域协同后滤波器 | |
CN111083498A (zh) | 一种用于视频编码帧间环路滤波的模型训练方法和使用方法 | |
Gao et al. | Perceptual friendly variable rate image compression |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20120926 |
|
CF01 | Termination of patent right due to non-payment of annual fee |