CN1299510C - 压缩运动图像信息的方法和*** - Google Patents

压缩运动图像信息的方法和*** Download PDF

Info

Publication number
CN1299510C
CN1299510C CNB028000056A CN02800005A CN1299510C CN 1299510 C CN1299510 C CN 1299510C CN B028000056 A CNB028000056 A CN B028000056A CN 02800005 A CN02800005 A CN 02800005A CN 1299510 C CN1299510 C CN 1299510C
Authority
CN
China
Prior art keywords
piece
frame
pixel
moving
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CNB028000056A
Other languages
English (en)
Other versions
CN1456016A (zh
Inventor
加治木纪子
田边智
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Office Noa KK
Original Assignee
Office Noa KK
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from EP01102046A external-priority patent/EP1170956A3/en
Priority claimed from JP2001337217A external-priority patent/JP3560946B2/ja
Application filed by Office Noa KK filed Critical Office Noa KK
Publication of CN1456016A publication Critical patent/CN1456016A/zh
Application granted granted Critical
Publication of CN1299510C publication Critical patent/CN1299510C/zh
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/107Selection of coding mode or of prediction mode between spatial and temporal predictive coding, e.g. picture refresh
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • H04N19/137Motion inside a coding unit, e.g. average field, frame or block difference
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/157Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/184Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being bits, e.g. of the compressed video stream
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/46Embedding additional information in the video signal during the compression process
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/507Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction using conditional replenishment
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/593Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving spatial prediction techniques
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/90Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
    • H04N19/96Tree coding, e.g. quad-tree coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

一种压缩运动图像信息的方法和***,可以采用高压缩比和高速度压缩可以经历预测编码的数据或图像信息,同时可以改善图像质量。根据本发明的第一方面,在帧内压缩处理开始之前,将一个帧内的一个图像划分成多个块,每个块用一个由每个块内的至少三个像素的分量代表的单个平面来近似(替代)。根据本发明的第二方面,原始图像与压缩后展开的图像之间像素被比较,并且输出像素的合成差值信息,当存在造成差值大于给定参数(阈值)的一个像素出现时,使用较小块大小执行帧内压缩。根据本发明的第三方面,当空间上被划分的各个I块沿时间轴在每帧之间扩散时,不把I块***由于帧间差值在一个指定时段期间大于参数(阈值)P而导致已经更新的帧内的任何一个块中。

Description

压缩运动图像信息的方法和***
技术领域
本发明涉及一种压缩运动图像信息的方法和***,可以以高压缩比和高速度压缩可被预测编码的数据或图像信息,并且可以改善图像质量。
背景技术
按照惯例,一般的处理是将图像变换成另一种类型的信号,并且根据被变换的信号的统计特征将合适的代码分配给该被变换的信号,然后发送合成的被编码信号。在这种情况下,为一帧内的一个冗余图像或一个包含规则图案或平面图案的图像执行所谓的预测编码,该预测编码可以用一个大压缩比压缩信息,在这样一种方式中:由于在邻近像素之间也许存在高相关,因此,能够在一定程度上依据已经编码的像素值预测将要被编码的下一个像素值;仅提取和编码可能不能被预测的分量。
对于电视电话中的运动图像或类似物,由于图像的邻近帧通常彼此非常相似,时间变化受到限制;因此通过帧间预测编码(执行帧间的预测)可以消除这种时间冗余,此时,通常可以按照这样一种方式执行所谓的基于块的编码:利用一个块码,其中一个码字被分配给一个单个码元;将每帧划分成多个像素块;利用每块中亮度差较小的特征压缩信息。
霍夫曼编码被称作一种生成高效码的方法,是一种可以通过把一个高效码分配给已变换的信号实现数据压缩的熵编码。其代表性的是算术编码,根据码元的每个序列的出现概率将概率编号行划分成诸多段,并且确定接受将一个段中一个位置指示为码元序列的一个代码的二十进制,经一个算术计算生成另一个码字之后的一个码字。
传统的三步骤块编码***用于有效地编码一个图像信号,该编码***包括抽样、转换和量化步骤。为了保持一个给定图像信号的二维分辨率和高频分量,通常需要按照最高频率分量的两倍频率执行抽样。
对于MPEG,最好使编码效率尽可能地高,以便可以压缩具有大量信息的图像。因此,目前存在:传统的前向预测编码(以P帧为基础处理),仅仅将已经编码的过去图像信号用作一个预测信号;以及双向预测编码(以B帧为基础处理),将未来的图像信号以及过去的图像信号用作一个预测信号。传统的帧间预测编码执行输入图像信号与对应的预测图像信号之间的差值信号的传输,并且解码方将被传输的差值信号附加到已经解码的预测图像信号上,以便重建原始图像。在这种方式中,如果不提供预测图像信号,解码方则不能以帧间为基础进行重建。因此,不是将过去和将来的图像信号用作预测信号,而是使用一个帧间编码I帧(即基准帧,允许仅从该基准帧重建图像),该I帧以固定间隔***诸多帧的一个序列中,它能够使经过该序列的一部分帧重建,并且解决了可能的数据误差。
然而,由于传统的图像信号压缩技术使用了完全基于块的编码处理,因此,难于以高速度、高压缩比压缩图像数据,比如可以经历预测编码的声音信息。当不同信息经过运动图像压缩处理进行一般压缩时,也就是,当可以预料到连续值A1和A2彼此相似以及当值A2出现之前就知道值A1时,假定等于或接近零的A2与A1之间的差值出现的概率是高的,此时使用传统的霍夫曼编码或算术编码执行压缩;如果A1和A2每一个都可以取值0,…,n中的一个,则A2与A1间的差值可以有2n+1值中的一个,因而2n+1霍夫曼码字是必需的。由于实际上存在用于A2的n个可能值,但是所有的n个码不被本地使用,因此可能生成冗余码字。此外,存在一个当帧间差值变大时,使得图像质量急剧恶化,因而不能提供高图像质量的问题。
此外,如果使用一个较大的块尺寸,可以提高压缩比;然而,原始图像的细节可能被丢失,使图像质量恶化。细线被完全丢失的现象出现在原始图像由这种细线构成时,其辉度不同于固定的颜色背景。
此外,由于被周期性***帧的一个序列中的I帧要经历帧内编码,因此编码效率比对帧间差值编码的帧间编码的效率差,所以生成的信息量增加;因此,在不能得到高速通信线路的情况下,I帧的***频率受到限制。此外,由于I帧内的数据量是差分帧内数据量的两倍至十倍,因此,该技术与进行通信的所需的固定速率相抵触。也就是,按照惯例,由于I帧被周期性地***帧的序列中,所以处理时间相当长,使重建的图像的显示被非常长地延迟。此外,由于数据本身的量很大,因此在I帧内出现不可能恢复的数据误差的概率是很高的。此外,在一个差错出现造成I帧不可能重建(或解码)的情况下,如果未提供解决该问题的专用装置,则停止重建处理,直至后续I帧到达。例如,在某种原因造成数据错误的情况下,其最初的很小的不利影响可能被扩散到整个许多帧;在最坏情况下,重建处理停止。此外,对于以固定间隔***I帧的传统的技术,当重建处理开始于某个时间位置时,它需要通过某些装置搜索最近的I帧,重建与其对应的图像,并且在达到目标时间位置上的帧后显示该重建的帧;然而,对I帧的搜索需要花费大量的时间。如果提供了解决上述问题的某个专用装置,则作用于解码处理的相应负担就自然增加。此外,由于一个重负担将加到重建I帧的处理上,则需要能够处理I帧的附加功能用于该处理。
本发明是考虑上述问题提出的,其第一目的是提供一种压缩运动图像信息的方法和***,可以高压缩比高速地压缩可以经历预测编码的数据或图像,并且可以改善图像质量。
本发明的第二目的是提供一种压缩运动图像的方法和***,即使通过扩大块尺寸来提高压缩比,也能保持原始图像的细节,而不恶化图像质量。
此外,本发明的第三目的是提供一种压缩运动图像信息的方法和***,通过在重建处理期间防止由于数据错误造成的初始不利影响传染到所有的许多帧,进而避免中止重建处理,从而到达可以在任意的时间位置容易地显示重建的图像,当重建处理开始于任意时间位置上的帧时,不需要花费大量时间由某些装置首先搜索最近的I帧,由此重建了相应的图像。
发明内容
根据本发明第一实施例的运动图像信息压缩方法,将一帧中空间上相互邻近的诸多像素进行比较,或者将帧间在时间上邻近的诸多像素进行比较,输出这些像素的合成差值信息;在比特图中存储关于输出的差值信息是否大于给定的参数(阈值)的信息,并且压缩比特图中存储的大于参数(阈值)的信息,从而减少冗余信息;通过将一帧内的一个图像划分成诸多块,以及通过用代表每个块内的像素的三个分量的一个平面近似(替代)每个被划分的块,来解决上述问题,所述三个分量为:像素的辉度、X方向上该块内的辉度的梯度、Y方向上该块内的辉度的梯度。
另一方面,本发明的压缩运动图像信息的一个***包括:比特图信息读出装置,用于将一帧中空间上相互邻近的诸多像素进行比较,或者将帧间在时间上邻近的诸多像素进行比较,输出这些像素的合成差值信息,并且在比特图中存储关于输出的差值信息是否大于给定的参数(阈值)的信息;和信息压缩装置,压缩比特图中存储的大于参数(阈值)的信息,从而减少冗余信息;该***还包括块近似装置,在执行帧间压缩之前,将一帧内的一个图像划分成诸多块,并且用代表每个块内的像素的三个分量的一个平面近似(替代)每个被划分的块,由此解决上述问题,所述三个分量为:像素的辉度、X方向上该块内的辉度的梯度、Y方向上该块内的辉度的梯度。
根据本发明第二实施例的运动图像压缩方法,通过以下步骤执行帧内压缩:使用帧内压缩方法将整个图像压缩在n×m像素块单元(n和m分别是自然数)中,比较原始图像与压缩后展开的图像间的诸多像素,输出每个像素的不同信息,如果存在造成大于给定参数(阈值)的一个较大差值出现的一个图像,则重复地使用一个较小的块尺寸用于包括该像素的一个部分或一个周围区域,直至达到所指定的最小块尺寸;从而解决上述问题。
根据本发明第二实施例的运动图像压缩***,块近似装置通过以下方式执行帧内压缩:使用帧间压缩方法将整个图像压缩在n×m像素块单元(n和m分别是自然数)中,比较原始图像与压缩后展开的图像间的诸多像素,输出每个像素的合成像素信息,如果存在造成大于给定参数(阈值)的一个较大差值出现的一个图像,则重复地使用一个较小的块尺寸用于包括该像素的一个部分或一个周围区域,直至达到所指定的最小块尺寸;从而解决上述问题。
根据本发明第三实施例的运动图像压缩方法,使用了一个帧内编码的I帧(即基准帧,仅从该基准帧就可以重建图像);该帧在空间上被分成I块;当沿着时间轴在每帧之间扩散I块时,I块不***已经更新的帧内的任何块中,所述的已经更新的帧是帧间插值在一个特定时段内大于给定参数(阈值)造成的;从而解决了上述问题。
根据本发明第三实施例的运动图像压缩***,包括I块***装置,使用了一个帧内编码的I帧(即,只是一个可以重建一个帧的基准帧),在空间上将I帧分成I块,并且沿着时间轴在每个帧之间扩散I块;I块***装置不把I块***已经更新的帧内的任何块中,所述的已经更新的帧是帧间差值在一个特定时段内大于给定参数(阈值)造成的;从而解决了上述问题。
根据本发明的运动图像信息压缩方法和***,由于省略了块变换处理过程,因此可以对可以经历预测编码的数据或图像执行高压缩比和高速压缩,从而改善了图像质量。对于传统技术,特别是当帧间差值大时,图像质量急剧地恶化;然而,根据本发明可以减小图像质量的恶化。具体地说,根据本发明第一实施例,能够提供一种图像质量的线性变化,而不会由于一个块的阈值造成图像质量的急剧恶化。因此,可以容易地执行通信比特速率的调整,而且不会恶化图像质量;此外,可以进行压缩比的接近-20%至-50%的改善,并且具有照原样维持的图像质量。此外,自适应霍夫曼编码和自适应算术编码共同地执行预测编码处理,包括传统的差值信息生成和霍夫曼编码和/或差值信息生成和算术编码;从而生成有效率码字和有效地压缩数据,比如可以经历预测编码的图像信息。此外,根据本发明第一实施例的减小的(压缩的)数据被用来定义一个平面,当它被展开时,它代表具有一个等级的平面。
根据本发明的运动图像信息压缩方法和***,甚至在使用较大的块尺寸改善压缩比的情况下,也可以不丢失原始图像的细节,因此可以减小图像质量的恶化。甚至在由具有固定色彩背景的细线的极大不同密度构成的原始图像的情况下,也能够避免该细线完全丢失。
根据本发明第三实施例的运动图像信息压缩方法和***,当一个I帧在空间上被划分成诸多块,以及当被划分的诸多块沿着时间轴在每个帧之间扩散时,由于I块不***由于帧间差值大于参数(阈值)而更新的帧之内的任何块中,因此它能够自一个图像可以被完全重建的预定数目的在前帧以后进行图像重建处理,以开始重建,并且在达到目标时间位置之后显示一个重建的图像;因而不需要花费时间搜索一个I帧,就可以在一个任意的位置显示一个重建的图像。此外,由于在运动图像传递期间通信服务器和/或数据传送路径上的分布数据的量在时间上是均匀的,因此与传统技术相比,可以获得内容传递的较高传送性能。此外,由于在收和重建侧上每单位时间的接收量变化是很小的,因此,可以减小必需的缓冲存储量,可以调节所期望的重建负载,以及甚至一个低容量的***也可以可靠地重建图像。此外,由于重建时可能的数据差错的影响很小,因此能够连续地进行重建,而忽略数据差错;因而,不需要传递侧***重新发送数据,从而减小了传递侧的负担。此外,还能够容易地提供用于运动图像广播的多点分布能力等。
附图的简要说明
图1是一个显示压缩运动图像信息的结构概况的方框图;
图2是是一个详细说明图1中压缩运动图像信息的结构的方框图;
图3图示了一个用于编码的特定结构的实例;
图4是一个显示用于解码的特定结构的一个实例的解释性方框图;
图5是一个解释图,显示了一个由三个数据片代表的平面:一个块内的一个像素的辉度Z,该块在X方向上的梯度,以及该块在Y方向上的梯度,它们被用来近似相应的被划分的图像块;
图6是一个解释使用用于一个像素的一部分或一个周围区域一个较小的块尺寸的操作的图像的平面图,其中所述的像素造成比给定参数(阈值)大的差值出现;
图7A和图7B显示了一个解释帧间压缩处理的图像,其中图7A是帧t的平面图,图7B是帧t+1的平面图;
图8是构成I帧的多个I块的平面图;
图9是显示在帧间***I块的状态的解释性附图;
图10是显示执行帧内压缩的步骤的流程图;
图11是显示执行帧间压缩的步骤的流程图;
图12是显示执行I块***的步骤的流程图。
参考标号的说明
P参数(阈值);1模数变换器;2缓冲器;3编码器/压缩单元;4比特图信息记录装置;5信息压缩装置;6熵编码装置;7I块***装置;8I块生成装置;12比较装置;13当前帧数据;14在前帧数据。
实现本发明的最佳方式
首先,说明本发明第一实施例的压缩运动图像信息的方法。
本发明包括一个运动图像信息压缩方法,用于对一帧中的在空间上彼此邻近的诸多像素进行比较,或者对诸多帧间的时间上邻近的诸多像素进行比较,输出这些像素的合成差值信息,在比特图中存储关于输出差值信息是否大于一个给定参数(阈值)的信息,并且压缩存储在所述比特图中的大于所述参数(阈值)信息,从而减少冗余信息;其中一帧中的一个图像被划分成诸多块,并且在帧间压缩处理开始之前,每个被划分的块用所述块内的像素的三个分量所代表的单个平面来近似(替代)。
此外,存储在比特图中的不大于参数(阈值)P的信息被处理为不变的像素。
此外,根据构成由像素的三个分量代表的单个平面的块近似方法,利用了平均或最小二乘方方法。
此外,根据帧内压缩处理,所述的平面由三个数据片代表:一个块内的一个像素的辉度,在X方向上该块辉度的梯度,在Y方向上该块的辉度的梯度。
比特图中存储的信息通过从组中选择的至少一个二进制编码方法来压缩,该组包括:运行长度编码、修改的READ(MR,MMR)编码、修改的霍夫曼(MH)编码以及JBIG编码。
比参数P(阈值)大的信息使用自适应霍夫曼编码进行压缩,其使用与期望的信息量同样多的多个霍夫曼表。
帧间的冗余信息通过使用熵编码来进一步减少。
熵编码或者通过自适应霍夫曼编码处理或者通过算术编码来执行。所述的霍夫曼编码利用一个表进行编码,所述的表是从与预期信息量一样多的霍夫曼表中选出的;所述的算术编码也利用一个表进行编码,该表是从与预期信息量一样多的算术表中选出的。
该编码处理根据像素之间的差值信息执行。
该差值信息是经由帧间的像素t与像素t-1的比较而输出的差值。
此外,还利用了经由帧间的n×m(n和m是等于或大于2的整数)像素的一个块与帧间的n×m像素的相应块的比较而输出的差值信息。
此外,利用了所述帧之间的像素t与像素t-1的比较而输出的差值信息,其中一个块由一个帧内的n×m像素(n和m是等于或大于2的整数)构成。
此外,对于帧间的n×m像素,n代表2K(K是一个自然数),m代表2K’(K’是一个自然数)。
在帧间压缩处理开始之前,可以执行帧内压缩,同时改变在相同帧内划分的块的大小。
下面说明本发明第一实施例的压缩运动图像信息的***。
本发明包括一个运动图像信息压缩***,该***包括:比特图信息记录装置4,用于比较一个帧内的在空间上邻近的诸多像素,或者比较帧之间的在时间上邻近的像素,输出这些像素的合成差值信息,并且在比特图中存储关于输出差值信息是否大于给定参数(阈值P的信息;和信息压缩装置5,用于压缩存储在比特图信息记录装置4中的大于所述参数(阈值)P的差值信息,从而减小冗余信息;所述的***还包括一个块近似装置,用于将一个帧中的一个图像划分成诸多块,并且由所述块中的像素的三个分量代表的单个平面近似(替代)每个被划分的块。
此外,信息压缩装置5对比特图记录装置4存储的不大于参数(阈值)P的信息作为不变化的图像进行处理(删除)。
此外,块近似装置使用平均或最小二乘方方法近似由像素的三分量所代表的单个平面。
此外,借助块近似装置,所述平面由三个数据片代表:一个块中的一个像素的辉度,在X方向上该块的辉度的梯度,以及在Y方向上该块的辉度的梯度。
此外,比特图信息记录装置4存储的信息通过从组中选择的至少一个二进制编码方法来压缩,该组包括:运行长度编码、修改的READ(MR,MMR)编码、修改的霍夫曼(MH)编码以及JBIG编码。
此外,压缩大于参数(阈值)P的信息的信息压缩装置5使用与预测的信息量一样多数目的霍夫曼表来执行自适应霍夫曼编码。
还设置了可以减少帧间的冗余信息的熵编码装置6;该熵编码装置6或者执行自适应霍夫曼编码或者执行自适应算术编码,所述的霍夫曼编码利用一个表进行编码,该表是从与预期信息量一样多的霍夫曼表中选出的;所述的算术编码也利用一个表进行编码,该表是从与预期信息量一样多的算术表中选出的。
此外,比特图信息记录装置中存储的差值信息是经由帧间的像素t与像素t-1的比较而输出的一个差值,其中一个块由一个帧内的n×m像素(n和m是等于或大于2的整数)构成。
在下文中,说明根据本发明的第一方面的压缩运动图像信息的方法和***的实施例。
图1是显示用于压缩运动图像信息的结构的概况的方框图。一个组合的模拟信号从诸如摄像机、光盘播放机或者符合NTSC标准的盒式磁带播放机输出,该组合的模拟信号被模数转换器1转换成代表一个视频帧的一个单线的数字信号,然后数字地输出给缓冲器2,存储在其中。需要注意的是,尽管公开的是模数转换器1将NTSC装置输出的模拟信号转换成数字信号,并将合成的数字信号输出和存储到缓冲器2中,但本发明不局限于此。换言之,根据本发明,可以有效地压缩任何一种视频信号,包括从各种装置的任何一种装置输出的普通视频信号。
如图1所示,设置了比特图信息存储电路4,它循序地比较帧间的像素t与像素t-1,并且基于比特图以单个比特存储关于合成差值是否大于参数(阈值)P的信息。该像素t和像素t-1的比较根据像素分量(即,辉度或色调)执行。也就是在时间上比较当前帧的一个像素(像素t)与在前帧的相应像素(像素t-1);其中t代表时间。因此,比特图信息记录装置4所存储的大于参数(阈值)P的像素t与像素t-1之间的差值被压缩,而其它的差值被确定为不变化的像素,然后进行处理(删除)。大于参数P(阈值)的信息(差值)由信息压缩装置5使用自适应霍夫曼编码进行压缩,该霍夫曼编码利用了与预期信息量一样多的霍夫曼表。此外,还设置了熵编码装置6,它对空间上或时间上邻近的像素进行比较,输出合成差值信息,并且利用一个算术表执行自适应算术编码,所述的算术表是从与(例如)基于预测信息的预期信息量一样多的算术表中选出的,以便减小帧间的合成信息。压缩编码器3执行编码之后,每帧中的数据的一个块被发送给比特图信息记录装置4的存储器,如图2所示。然后存储被延迟一个单个帧时间的当前帧数据13和在前帧数据14。然后,比较器12依据帧间的冗余量确定当前帧数据13和在前帧数据12,并计算它们的差值。也就是,将每个被编码块与在前帧的相应块进行比较。每个块用一个比特作标记,以标识每个块是否从相应的在前块变化,通过该处理,生成了具有每块一比特的一个帧比特图。这里,通过执行帧间的比较将每帧的比特图与另一个比特图相区别。
该实施例用作基本技术,即不改变块的大小的帧内压缩技术。如图5所示,一帧内的一个图像被预先划分成多个块,每个被预先划分的块用三个数据片所代表的一个单个平面近似(替代):每块中的一个像素的辉度Z,在X方向上每块的辉度的梯度,在Y方向上每块的辉度的梯度。具体地说,通过帧内压缩处理,一个图像首先被分成多个块,然后每个块用近似每个块的一个单平面替代。该平面可以由每个块中的像素的三个分量,比如辉度z、在X方向上辉度的梯度x以及在Y方向上辉度的梯度y代表。作为选择,该平面可以由一个块中的一个像素的辉度z、X方向上块之间的多个像素的辉度的梯度以及Y方向上块之间多个像素的辉度的梯度代表。例如,平均或最小二乘方方法可以用于近似。得到的降低(压缩)的数据代表一个平面;通过展开该数据,可以获得具有梯度的平面。当一个块由s个像素构成时,一个单帧内的预期压缩比是3/s;压缩比随s的增加而增加,然而图像质量却恶化。需要说明的是,一个块的大小和形状是n×m个像素;其中n和m是任意一个自然数。此外,对于帧间的n×m个像素,n可以是2K(K是一个自然数),m可以是2K’(K’是一个自然数)。
下面说明用于该实施例的帧间压缩的基本技术。
具体地说,根据帧间压缩的第一方法,定位于与帧t相同位置上的帧t-1中的块被帧内压缩,并且依据以下三个分量得到z(t+1),x(t+1),y(t+1):表示一个像素的辉度的z,表示x方向上一个块的辉度的梯度的x,和表示y方向上该块中辉度的梯度的y。在一组z(t),x(t)和y(t)与一组z(t-1),x(t-1)和y(t-1)之间计算均方和,然后与阈值P进行比较。因此,如果超出阈值P,则作出诸如‘THERE IS DIFFERENCE’的确定。作为选择,将一组z(t),x(t)和y(t)与一组z(t-1),x(t-1)和y(t-1)之一组与一组阈值Pz,Px和Py比较;如果得到的差值超过阈值P,则作出‘THEREIS DIFFERENCE’的确定。如果作出了‘THERE IS DIFFERENCE’的确定,则对与帧的块相对应的比特图的部分作标记。
对于前者的情况,使用单个比特图;而对于后者的情况,使用三个比特图。
该比特图包括一个包含0和/或1(即,二进制数据)的阵列,并且使用例如运行长度编码对其进行压缩。此外,差值数据Δz(t)=z(t+1)-z(t),Δx(t)=x(t+1)-x(t),和Δy(t)=y(t+1)-y(t)的片断被熵压缩。需要注意的是,根据第一方法,由于不执行展开,因此,执行计算的负担轻,但是误差可以被累积。
根据帧间压缩的第二方法,使用上述帧间压缩的基本技术压缩的数据被展开,以及重建构成一个块的像素数据片。每个位于下一帧t+1中的相同块的相同位置上的各像素数据片段与像素数据的相应的重建片断之间的均方和被计算,并且与阈值P比较,因此,如果它超出阈值P,则作出‘THERE IS DIFFERENCE’的确定。如果‘THERE ISDIFFERENCE’的确定被作出,则对对应于该帧的块的比特图中的部分作出标记。该比特图包括一个包含0和/或1(即,二进制数据)的阵列,并且使用例如运行长度编码对其压缩。此外,差值数据Δz(t)=z(t+1)-z(t),Δx(t)=x(t+1)-x(t),和Δy(t)=y(t+1)-y(t)的片断是熵压缩的。需要注意的是,由于执行展开,因此,执行计算的负担重,但是不累积误差。
根据帧间压缩的第三方法,当前帧t的一个块内的像素数据的各片断与位于下一帧t+1的对应的相同块内的对应的相同位置上的每个像素数据的对应片断之间的均方和被计算,并且与阈值P比较,因而,如果它超过阈值P,则作出‘THERE IS DIFFERENCE’的确定。如果‘THERE IS DIFFERENCE’的确定被作出,则计算和帧间压缩位于下一帧t+1的对应的相同块内的对应的相同位置上对应的像素的差值ΔP。对与该帧的该块相对应的比特图中的区段作标记。该比特图包括一个包含0和/或1(即,二进制数据)的阵列,并且使用例如运行长度编码对其压缩。此外,差值数据ΔP是熵压缩的。需要注意的是,根据第三方法,由于压缩是在作出差值确定之后执行的,因此,计算量最小,而且不累积计算误差。
图1所示的熵编码装置6使用一个二进制图像编码,比如运行长度编码、修改的READ(MR,MMR)编码、修改的霍夫曼编码或者JBIG编码,压缩基于由比特图信息记录装置4存储的比特图信息的单个比特。具体地说,在二进制文件图像通常被传真机或类似物处理的情况中,存在白色像素或黑色像素接连出现在一个或多个连续区域中的高概率;所以,借助运行长度编码方法,将仅包含被称作运行的白色或黑色像素的一维片断利用为一个编码的单位,并且使用作为每个运行的长度的包含在每个运行内的连续的相等像素的数量执行编码。例如,在使用公共电话网络的数字传真中,修改的霍夫曼码通常被用于为黑色和白色像素分别建立的运行长度模型。
在包含每扫描线1728个像素的单色像素信息的传真传送中,将改进的霍夫曼编码(MH)利用为一维编码方法,所述的扫描线是通过以例如8个像素/mm的像素密度进行扫描获得的;其中,MH码代表其每个是仅包含连续的白色像素(白色运行)或者仅包含连续的黑色像素(黑色运行)的每个片断的长度的运行长度,并且可变长度码利用统计趋势分配给各运行,所述统计趋势是具有特定长度的白色或黑色运行比其它长度运行更频繁地出现,它是减少数据量的理论。
修改的READ(MR或MMR)编码被用作二维编码以及一维编码的标准方法;其中,MMR编码是标准分辨率和用于MR编码的高分辨率都被设置为无限大的编码。
本发明的运动图像信息的压缩方法和其***的基本结构是比较空间上和时间上邻近的像素,并且输出合成的差值信息,以便可以减小帧间的冗余信息。具体地说,帧间的像素t和像素t-1被循序地比较,并且将关于合成的差值是否大于参数(阈值)P的信息存储为比特图信息的一个单个比特片。熵编码装置6预测也许出现在每帧内和帧间的代码,并且依据预测的值输出小误差,以便可以减小冗余信息。众所周知,当执行代码分配和发送代码的合成序列时,每个像素的平均代码长度不会小于或等于平均信息内容(即,熵)。
下面说明自适应霍夫曼编码算法。执行自适应霍夫曼编码是为了通过共同地执行一系列包括生成差值信息和其霍夫曼编码的预测编码处理来有效地生成码字。根据传统的霍夫曼编码,通常使用霍夫曼表生成码字,并且每次对每个单个字编码都要更新所生成的霍夫曼表,或者动态地执行霍夫曼编码处理。与此相反,根据自适应霍夫曼编码,则使用其信息量与预测的信息量一样多的霍夫曼表(代码表),它是根据预测的信息由一个表选择器选择许多表的一个表;因此执行所选用表的编码。所以,有效地压缩了数据,比如可以经历预测编码的音频信息。
下面说明自适应算术编码算法。执行自适应算术编码是为了通过共同地执行一系列包括生成差值信息和其算术编码的预测编码处理来有效地生成码字。根据传统的算术编码,通常使用一个单个事件概率表生成码字,并且每次对每个单个字编码时都要更新所生成的单个事件概率表,或者动态地执行算术编码处理。与此相反,根据自适应算术编码,则使用其信息量与预测的信息量一样多的算术表(代码表),它是根据预测的信息由一个表选择器选择许多表的一个表;因此执行所选用表的编码。所以,有效地压缩了数据,比如可以经历预测编码的音频信息。
图3中示出了预测编码电路的具体结构,其中为了编码输入图像数据,进行模数变换,然后进行适当的延迟并耦合给表选择器。输入图像数据还不经任何延迟发送给编码单元,然后对其编码。合成的编码数据片被比较,然后计算它们的差值。表选择器根据预测信息选择用于输入图像数据的一个代码表,发送给编码单元,在此压缩输入图像数据以便可以获得被调整的码字。
图4示出了预测解码电路的一个具体结构,其中将一个码字发送给解码器,同时在时间上将直接被传送的码字发送给表选择器,表选择器根据送回到解码器的预测信息选择解码表,依据在前解码的像素依次计算差值,以便可以得到调节的码字。
下面说明本发明第二实施例的压缩运动图像信息的方法。
本发明是一种压缩运动图像信息的方法:比较一帧内空间上邻近的像素或者比较帧间时间上邻近的像素,输出像素值的合成差值信息,在一个比特图中存储关于输出的差值信息是否大于给定的参数(阈值)P的信息,并且根据比特图中存储信息压缩的大于参数(阈值)P的差值信息;从而减少冗余信息;其中,在执行帧间压缩之前,执行帧内压缩,同时改变相同帧内的被划分块的大小。
根据帧内压缩处理,每个块内的像素被比较,在改变被划分块尺寸的同时输出像素的合成差值信息,如果差值信息大于参数(阈值)P,则将较小的块尺寸用于包括该差值信息的部分。
此外,如果像素之间的差值信息大于参数(阈值)P,则重复使用一个较小的块。
一帧内的一个像素被划分成诸多块,并且每个块用一个单个平面来近似(替代),该单个平面由每个块内的至少三个分量表示。
此外,根据帧内压缩处理,所述的平面由三个数据片表示:一个块内的一个像素的辉度,X方向上该块内的辉度的梯度,以及Y方向上该块内的辉度的梯度。
根据帧内压缩处理,使用帧内压缩方法,在n×m像素块单元(n和m分别是自然数)中压缩整个图像,原始图像与压缩之后的展开的图像之间的像素被比较,并输出用于像素的合成的每个差值信息,如果存在造成比参数(阈值)P大的一个差值出现的像素,则重复地执行使用一个用于包含该像素的一个部分或一个周围区域的较小块尺寸的操作,直至达到一个指定的最小块尺寸。
此外,如果在帧内压缩处理期间块尺寸不变化,则帧间压缩处理开始。
如果块尺寸被改变成较大的一个,则不执行用于所述块中的数据差值的附加计算,实际上是输出。
如果块尺寸被改变成较小的一个,则在每个部分中计算源自在前展开的数据的差值,并且在该较小块尺寸中进行压缩。
下面说明本发明第三实施例的压缩运动图像信息的***。
根据帧内压缩处理,使用帧内压缩方法,在n×m像素块单元(n和m分别是自然数)中压缩整个图像,原始图像与压缩之后的展开的图像之间的像素被比较,并输出用于像素的合成的每个差值信息,如果存在造成比参数(阈值)P大的一个差值出现的像素,则重复地执行使用一个用于包含该像素的一个部分或一个周围区域的曾经较小块尺寸的操作,直至达到一个指定的最小块尺寸。
此外,借助块近似装置,如果在帧内压缩处理期间块尺寸不变化,则帧内压缩处理开始。
此外,借助块近似装置,如果块尺寸被改变成较大的一个,则不执行用于所述块中的数据差值的附加计算,实际上是输出。
此外,借助块近似装置,如果块尺寸被改变成较小的一个,则在每个部分中计算源自在前展开的数据的差值,并且在该较小块尺寸中进行压缩。
在下面的说明中结合附图6、7和10说明本发明第二实施例的压缩运动图像信息的方法和***。
如上所述,如果一个较大块尺寸被使用,则压缩比可以被增大;然而,可能会损失原始图像的细节,从而恶化图像质量。细线被完全损失的现象发生在原始图像由这种细线构成,其辉度不同于固定颜色背景时。利用以下方法以便解决上述问题。为了简化解释,说明一个白色图像的16×16像素的情况(例子)。
具体地说,如图6和图10所示,使用上述的一个帧间压缩方法将整个图像压缩(展开)在16×16像素块单元中(图10中步骤1)。原始图像与压缩后展开的图像之间的像素被比较,并输出每个像素的合成差值信息,然后与参数(阈值)P进行比较(图10的步骤2)。作为比较的结果,如果存在差值超过参数(阈值)P1的像素,则包括该像素的一个部分或者8×8像素块被压缩(展开)(参见图10中步骤3和图6中的最大圆环)。此外,该部分的周围区域被压缩在8×8像素块单元中。然后,比较原始图像与压缩后展开的图像之间的像素,并输出每个像素的合成差值信息,然后与参数(阈值)P2进行比较(图10中的步骤4)。作为该比较的结果,如果存在超过参数(阈值)P2的一个像素,则压缩(展开)包含该像素的一个部分或者一个4×4像块素块(参见图10中的步骤5和图6中的中等圆环)。此外,将该部分的周围区域压缩在4×4像素单元中。比较原始图像与压缩后展开的图像之间的像素,并输出每个像素的合成差值信息,然后与参数(阈值)P3进行比较(图10中的步骤6)。作为该比较的结果,如果存在超过参数(阈值)P3的一个像素,则压缩(展开)包含该像素的一个部分或者一个2×2像素块(参见图10中的步骤7和图6中的最小圆环)。此外,将该部分的周围区域压缩在2×2像素块单元中。处理继续到帧间压缩步骤(图10中的步骤8)。在此方式中,能够压缩原始图像,使其在保持高压缩比的同时保持细节(清晰度)。
下面,像上述的帧内压缩的结果那样,结合图11说明获得图7(A)的帧t的一个压缩图像和图7(B)的帧t+1的一个压缩图像情形下的帧内压缩方法。比较块尺寸(步骤9);由于在图7(A)中的1与图7(B)中的1’之间以及图7(A)中的2与图7(B)中的2’之间,块尺寸没有变化,因此使用上述的帧间压缩处理中所述的方法之一计算和帧间压缩差值(步骤10)。此后,确定每个块尺寸中的差值是否等于或大于参数(阈值)P(步骤15)。如果确定每个块尺寸中的差值等于或大于参数(阈值)P,则在比特图中记录‘THERE ISDIFFERENCE’的结果,并输出差值(步骤16)。如果确定每个块尺寸中的差值小于参数(阈值)P,则用‘THERE IS NO DIFFERENCE’的结果存储并更新该比特图,然后输出差值(参见步骤17)。顺便说明,在存在块尺寸变化的情况下,特别是在存在朝着更粗分辨率变化的情况下(步骤11),比如存在图7的4与4’之间的变化的情况下,4’被用作一个关键块(或一个关键帧),它可以独立于在前帧由它自己展开。在此情况下,不计算差值。换言之,不计算块4’中的数据差值,实际上是输出不经计算的差值(步骤12)。在存在块尺寸变化的情况下,特别是在存在朝着更细分辨率变化的情况下(步骤13),比如存在图7A的3与图7B的3’之间的变化的情况下,为每个部分计算源自块3内的展开的数据的差值,并依据块尺寸单元压缩计算的差值(步骤14)。
下面说明本发明的第三实施例的压缩运动图像信息的方法。
根据本发明,使用了帧内编码的I帧(即基准帧,仅从该基准帧就可以重建图像);每个I帧在空间上被划分成多个I块,然后沿着时间轴在每个帧之间扩散。
当在空间上划分的各个I块沿着时间轴在每帧之间扩散时,不把I块***到每当帧间的差值大于参数(阈值)P的状态发生时更新的帧内的任何块中。
此外,提供了一种压缩方法,其中:一帧内的一个图像被预先划分成多个块,所有被划分的每个块用三个数据片所代表的单个平面来近似(替代):每个块中的一个像素的辉度,X方向上每个块的梯度,以及Y方向上每个块的梯度,使用了帧内编码的I帧(即,仅从该基准帧就可以重建图像),所述的I帧被***在帧的序列中;其中:所述的I帧在空间上预先划分成多个块;当被划分的I块沿着时间轴在每个帧间扩散时,不把I块***已经被更新的帧内的任何块中,所述的已经更新的帧是由于帧间的差值在一个特定时段内大于参数(阈值)P而造成的。
此外,提供了一种压缩运动图像的方法,其中:一帧内空间上邻近的像素被比较或者时间上邻近的帧间的像素被比较,以输出像素之间的合成差值信息;在一个比特图中存储关于输出的差值信息是否大于给定参数(阈值)的信息;并且压缩比特图中存储的大于所述参数(阈值)P的差值信息;从而减少冗余信息;其中:使用一个帧内被编码的I帧(即,仅从该基准帧就可以重建图像),将所述I帧在空间上预先划分成多个块;并且当被划分的I块沿时间轴在每个帧之间扩散时,不把I块***已经被更新的帧内的任何块中,所述的已经更新的帧是由于帧间的差值在一个特定时段内大于参数(阈值)P而造成的。
下面说明本发明第三实施例的压缩运动图像信息的方法。
根据本发明,帧内被编码的I个帧(只是可以重建对应的图像的基本帧)被使用;每个I帧在空间上被预先划分成多个I块,然后沿时间轴在每帧之间扩散。
I块***装置7不把任何一个I块***由于帧间的差值在一个特定时段内大于参数(阈值)P导致已经更新的帧内的一个块中。
此外,设置了一个压缩***,包括:一个块近似装置,用于将一帧内的一个图像划分成多个块,并且由三个数据片所代表的一个单个平面近似(替代)所有被划分的块的每一个:每个块中的一个像素的辉度,X方向上每个块的梯度,Y方向上每个块的梯度;所述的***还包括:I块生成装置8,用于在空间上将一个帧内被编码的I帧(即,仅从该基准帧就可以重建图像)划分成I块;以及I块***装置7,当被划分的I块沿时间轴在每个帧之间扩散时,将一个I块***除由于帧间的差值在一个特定时段内大于参数(阈值)P而导致已经更新的帧内的一个块以外的一部分中。
下面结合图8、图9和图12说明本发明的第三实施例的压缩运动图像信息的方法和***。
本发明是一个编码方法,对应于部分序列图像重建(解码)和/或在图像重建期间出现的数据误差。需要注意的是,这里有一个前提:使用压缩算法,而不使用用于多于三个要被压缩的完整帧的任何运动预测和校正技术。
首先,如图12所示,一个帧内预测被编码的帧或I帧在空间上被划分成一个单个块或者多个块(步骤1),这些被划分的I块沿时间轴扩散(步骤2的I块的生成)。需要注意的是,块尺寸、被划分的块的形状等归应于I块的生成可以被随意地改变,此外,它们可以被随机地选择。
具体地说,如图8所示,8×8像素的I帧在空间上被划分成每个具有2×2像素的十六个I块,并且这些块以固定周期间隔***一个帧序列中。结果,当帧间的差值输出的部分出现(即,具有存在一个运动的大信息内容的部分)和I块(大于其它帧的信息内容)重叠时,将***无用的I块,以急剧地增加信息内容,它可以使不可能恢复的误差在被***的I帧中发生。为了避免此问题,如图12所示,在解码侧没有处理速度问题的情况下,确定大于参数(阈值)P的帧间差值的状态是否出现在一个被指定的时段内以及是否由此执行更新(差值的输出)(步骤3),并且不把I块***更新的任何块中(或者输出一个差值)(步骤4)。另一方面,I块被***为更新的块中(或者输出一个差值)(步骤5)。
参见图9,说明一个特定编码方法。需要注意的是,作为一个实例,构成总共三十二个I块的I块生成装置8将8×8像素的I帧在空间上划分成1×2像素的一个块。还需要注意的是,作为一个实例,这里提供了包括一个图像帧的一个运动图像,具有8×8像素的一个块和具有16×16像素的最大块。在图9中,为了方便起见,省略了第(n+11)至第(n+32)帧。
首先,***其每一个在水平方向具有1×2像素的I块(在图中用黑色标注)。最初位于图像的右上角并且需要将要更新的最大2×2像素(即,输出差值)的一个对象(代表逆着背景运动的一个差值输出块的暗灰色区域)朝着左下部位运动。在第(n+3)帧之前,通常***I块(图12的步骤5)。与此相反,由于与出现在第(n+3)帧的上左的对象相对应的块被更新(即,输出差值),因此将要***第(n+4)帧的I块实际上不被***(参见阴影部分和图12的步骤4)。需要注意的是,浅灰色部分代表由于对象已经移动而回到原始背景的部分的一个差值输出块。在此情况下,不***I块的处理(参见图12的步骤4)出现在第(n+7)帧和第(n+8)帧。具体地说,作为第(n+5)帧中对象的运动结果,如果应当回到背景部分的差值输出块(浅灰色部分)作为要更新的部分而存在,则在第(n+7)帧内,只有每个块具有1×2像素的I块的右侧上的单个块不***该部分中。作为第(n+4)帧和第(n+5)帧中对象运动的结果,如果应当回到背景部分的水平定位的1×2像素的一个差值输出块(浅灰色部分)作为一个要更新的部分而存在,则在第(n+8)帧内,不把1×2像素的一个I块***该部分中。在此情况下,任何I块将不被***的期间的基准时间(不远的过去时间)由将要***到每个块位置的I块所需要的帧数表示(8×8/2=32帧)。换言之,I块将不***由于对象运动而导致在三十二个帧的序列内更新(输出差值)的任何块中,为了在任意时间位置上开始重建一个预期帧,应当在前面预定数目的帧开始进行解码,以允许单个图像完全重建,。
工业实用性
如上所述,对于本发明第一实施例的运动图像信息压缩方法和***,帧内图像被预先划分成多个块,用三个数据片所代表的单个平面近似每个被划分的块,这三个数据片是:每个块内的一个像素的辉度,X方向上所述每个块的梯度,以及Y方向上每个块的梯度,因而有效地执行了帧内压缩。
根据运动图像信息压缩方法和***,通过在n×m像素块单元(n和m分别是自然数)压缩整个图像执行帧内压缩,原始图像与压缩之后展开的图像之间的像素被比较,并且每个像素的输出合成差值信息,如果造成大于参数(阈值)P的一个差值出现的一个像素存在,则重复地使用用于包括该像素的一个部分或者周围区域的一个较大块尺寸,直至达到指定的最小块尺寸,从而维持了原始图像的细节并且避免了图像质量的恶化。
对于运动图像信息压缩方法和***,根据本发明第三实施例中,I帧在空间上被预先划分成I块,当被划分的I块沿时间轴在每个帧之间扩散时,I块不***由于帧间的差值在一个特定时段大于参数(阈值)而导致已经更新的帧内的任何块中,并且在以时间定位的目标帧到达后显示重建的图像;因此,通过较早地开始重建预定数目的帧可以执行一个图像的重建,从而可以完全地重建一个单个图像;因此容易地在任意时间位置显示一个被重建的图像,而且不需要为搜索I帧花费大量的时间。
此外,由于传递服务器和/或数据通信路径上的分布数据量在时间上是一致的,因此可以获得比传统内容分布更高的部分特性。在接收/重建侧,由于每单位时间接收量的变化小,因此,可以减少所需的缓冲存储量,并且由于加在重建处理上的负担被调节,因此甚至低性能***也可以执行可靠的重建。此外,由于重建处理的数据误差的影响小,因此重建处理可以连续进行,忽略这种数据误差;因此不需要分发送侧***重发数据,从而加给发送侧***较轻负担。此外,还能够容易地为运动图像广播提供多点广播发送能力等。
如上所述,本发明是一个有效压缩运动图像信息的最佳装置,可以广泛地用在各种运动图像信息的传送、接收和重建的领域中。

Claims (40)

1、一种运动图像信息压缩方法,将一帧中在空间上相互邻近的像素进行两两比较,或者将时间上邻近的帧之间的像素进行两两比较,以输出这些像素之间的差值信息;在比特图中存储关于输出的差值信息是否大于给定的阈值参数的信息,并且压缩比特图中存储的大于阈值参数P的信息,从而减少冗余信息;
所述的方法包括,将一帧内的一个图像划分成诸多块,并且在帧间压缩处理开始之前,把每个块近似置换为由每个块内的像素的三个分量所表示的一个单个平面,所述三个分量为:像素的辉度、X方向上该块内的辉度的梯度、Y方向上该块内的辉度的梯度。
2、根据权利要求1所述的压缩运动图像信息的方法,其中不大于比特图中存储的阈值参数的信息被处理为不变化像素。
3、根据权利要求1所述的压缩运动图像信息的方法,其中每个块作为由像素的三个分量表示的一个单个平面的所述近似利用了平均或最小二乘方方法。
4、根据权利要求1所述的压缩运动图像信息的方法,其中帧内压缩用所述的平面执行,所述的平面由三个分量数据表示:一个块内的一个像素的辉度,X方向上该块内的辉度的梯度,Y方向上该块内的辉度的梯度。
5、根据权利要求2所述的压缩运动图像信息的方法,其中帧内压缩用所述的平面执行,所述的平面由三个分量数据表示:一个块内的一个像素的辉度,X方向上该块内的辉度的梯度,Y方向上该块内的辉度的梯度。
6、根据权利要求1所述的压缩运动图像信息的方法,其中使用至少一种二进制图像编码方法压缩比特图中存储的信息,所述的二进制编码方法是从包括运行长度编码、修改的READ即MR,MMR编码、修改的霍夫曼MH编码以及JBIG编码的组中选出的。
7、根据权利要求1所述的压缩运动图像信息的方法,其中利用自适应霍夫曼编码压缩大于阈值参数P的信息,所述的霍夫曼编码利用了与信息的预期片数一样多的霍夫曼表。
8、根据权利要求1所述的压缩运动图像信息的方法,还包括使用熵编码减少帧间的冗余信息。
9、根据权利要求7所述的压缩运动图像信息的方法,其中或者通过自适应霍夫曼编码或者通过自适应算术编码执行熵编码,所述的自适应霍夫曼编码利用从与预期数目的信息片一样多的霍夫曼表中选出的一个表进行编码,所述的自适应算术编码利用从与预期数目的信息片一样多的算术表中选出的一个表进行编码。
10、根据权利要求1所述的压缩运动图像信息的方法,其中差值信息是经帧间的像素t和像素t-1的比较输出的差值。
11、根据权利要求1所述的压缩运动图像信息的方法,其中利用了经所述帧间的像素t和像素t-1的比较输出的差值信息,其中帧间的n×m像素构成一个单个块,n和m是等于或大于2的整数。
12、根据权利要求11所述的压缩运动图像信息的方法,其中利用了经所述帧间的像素t和像素t-1的比较输出的差值信息,其中一个帧内的n×m像素构成一个单个块,这里n和m是等于或大于2的整数。
13、根据权利要求11所述的压缩运动图像信息的方法,其中对于所述帧间的n×m像素,n是2K,K是一个自然数,m是2K’,K’是一个自然数。
14、根据权利要求1所述的压缩运动图像信息的方法,其中还包括在帧间压缩处理之前,执行帧内压缩,同时改变相同帧内的被划分块的大小。
15、根据权利要求12所述的压缩运动图像信息的方法,其中还包括在帧间压缩处理之前,执行帧内压缩,同时改变相同帧内的被划分块的大小。
16、根据权利要求14所述的压缩运动图像信息的方法,其中所述帧内压缩是这样执行的:比较每个块内的像素间的两两像素,同时改变被划分的块尺寸,输出用于像素的合成差值信息,如果差值信息大于阈值参数P,则使用用于包括差值信息的部分的较小块尺寸。
17、根据权利要求14所述的压缩运动图像信息的方法,其中如果像素间的差值信息大于阈值参数P,则重复使用较小的块尺寸。
18、根据权利要求14所述的压缩图像信息的方法,还包括将一帧内的一个图像划分成多个块,并且用所述每个块内的像素的三个分量所表示的一个单个平面近似替代每个块。
19、根据权利要求14所述的压缩运动图像信息的方法,其中帧内压缩用所述的平面执行,所述的平面由三个分量数据表示:一个块内的一个像素的辉度,X方向上该块内的辉度的梯度,Y方向上该块内的辉度的梯度。
20、根据权利要求14所述的压缩运动图像信息的方法,其中所述帧内压缩是这样执行的:使用帧内压缩方法将在n×m像素单元中的整个图像压缩,其中n和m分别为自然数,比较原始图像与压缩后展开的图像之间的像素,输出每个像素的合成差值信息,以及,如果存在造成大于阈值参数P的差值出现的一个像素,则重复使用用于包括该像素的一个部分或周围区域的曾经较小的块尺寸,直至达到指定的最小块尺寸。
21、根据权利要求14所述的压缩运动图像信息的方法,其中当作为帧内压缩的结果,没有块尺寸的变化时,执行帧间压缩。
22、根据权利要求14所述的压缩运动图像信息的方法,其中当块尺寸朝一个较大尺寸变化时,输出该块中的数据,实际上不计算来自数据的差值。
23、根据权利要求14所述的压缩运动图像信息的方法,当块尺寸朝一个较小的尺寸变化时,计算每个部分中来自在前展开的数据的差值,并且依据块尺寸单元进行压缩。
24、根据权利要求1所述的压缩运动图像信息的方法,其中包括使用帧内编码的I帧,即基准帧,仅从该基准帧就可以重建图像,在空间上将所述I帧划分成I块,并且沿时间轴在每个帧之间扩散该I块。
25、根据权利要求24所述的压缩运动图像信息的方法,其中包括使用帧内编码的I帧,即基准帧,仅从该基准帧就可以重建图像,在空间上将所述I帧划分成I块,并且沿时间轴在每个帧之间扩散该I块。
26、根据权利要求25所述的压缩运动图像信息的方法,其中以这样一种方式执行沿时间轴在每个帧之间扩散所述I块:把一个I块***除了已经更新的帧内的块以外的一个部分中,所述的已经更新的帧是帧间的差值在一个特定时段大于一给定阈值参数而造成的。
27、一种运动图像信息压缩***,包括一个比特图信息记录装置,用于将一帧中在空间上相互邻近的像素进行两两比较,或者将帧间的时间上邻近的像素进行两两比较,输出这些像素之间的差值信息,在比特图中存储关于输出的差值信息是否大于给定的阈值参数的信息;和信息压缩装置,用于压缩所述比特图中存储的大于所述阈值参数的信息,从而减少冗余信息;
所述***包括一个块近似装置,在帧间压缩处理开始之前,将一帧内的一个图像划分成诸多块,并且用每个块内的像素的三个分量所表示的一个单个平面近似替代每个被划分的块,所述三个分量为:像素的辉度、X方向上该块内的辉度的梯度、Y方向上该块内的辉度的梯度。
28、根据权利要求27所述的压缩运动图像信息的***,其中所述的信息压缩装置将比特图中存储的不大于阈值参数的信息被处理为不变化像素。
29、根据权利要求27所述的压缩运动图像信息的***,其中所述块近似装置利用了平均或最小二乘方方法进行近似,以便构成由像素的三个分量表示的一个单个平面。
30、根据权利要求27所述的压缩运动图像信息的***,其中在所述的块近似装置中,所述平面由三个分量数据表示:一个块内的一个像素的辉度,X方向上该块内的辉度的梯度,Y方向上该块内的辉度的梯度。
31、根据权利要求27所述的压缩运动图像信息的***,其中使用至少一个二进制图像编码方法压缩由比特图信息记录装置存储的信息,所述的二进制图像编码方法是从包括运行长度编码、修改的READ即MR,MMR编码、修改的霍夫曼MH编码以及JBIG编码的组中选出的。
32、根据权利要求27所述的压缩运动图像信息的***,其中压缩大于阈值参数的所述信息压缩装置,执行自适应霍夫曼编码,所述的霍夫曼编码利用了与信息的预期片数一样多的霍夫曼表。
33、根据权利要求27所述的压缩运动图像信息的***,还包括可以减少帧间冗余信息的熵编码装置;其中所述的熵编码装置执行自适应霍夫曼编码或者执行自适应算术编码,所述的自适应霍夫曼编码利用从与预期数目的信息片一样多的霍夫曼表中选出的一个表进行编码,所述的自适应算术编码利用从与预期数目的信息片一样多的算术表中选出的一个表进行编码。
34、根据权利要求27所述的压缩运动图像信息的***,其中比特图信息记录装置存储的差值信息是经帧间的像素t和像素t-1的比较输出的差值,其中一个块由一个帧内的n×m像素构成,n和m是等于或大于2的整数。
35、根据权利要求27所述的压缩运动图像信息的***,其中帧内压缩处理利用以这样一种方式执行帧内压缩:使用帧内压缩方法将整个图像压缩在n×m像素单元中,n和m分别是自然数,比较原始图像与压缩后展开的图像之间的像素,输出像素的合成差值信息,如果存在造成大于阈值参数的差值出现的一个像素,则重复使用用于包括该像素的一个部分或周围区域的较小的块尺寸,直至达到指定的最小块尺寸。
36、根据权利要求27所述的压缩运动图像信息的***,其中当作为由所述块近似装置执行的帧内压缩的结果,没有块尺寸的变化时,执行帧间压缩。
37、根据权利要求27所述的压缩运动图像信息的***,其中当作为块近似装置所执行的帧内压缩的结果,块尺寸朝一个较大尺寸变化时,输出该块中的数据,而不执行所述块内数据差值的附加计算。
38、根据权利要求27所述的压缩运动图像信息的***,其中当作为块近似装置所执行的帧内压缩的结果,块尺寸朝一个较小尺寸变化时,计算来自每个部分中在前展开的数据的差值,并且依据块尺寸单元进行压缩。
39、根据权利要求27所述的压缩运动图像信息的***,还包括I块***装置,使用帧内被编码的I帧,即基准帧,仅从该基准帧就可以重建图像,在空间上将所述I帧划分成I块,并且沿时间轴在每个帧之间扩散该I块。
40、根据权利要求39所述的压缩运动图像信息的***,其中所述I块***装置把一个I块***除了已经更新的帧内的块以外的一个部分中,所述的已经更新的帧是帧间的差值在一个特定时段大于阈值参数而造成的。
CNB028000056A 2001-01-30 2002-01-30 压缩运动图像信息的方法和*** Expired - Fee Related CN1299510C (zh)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
EP01102046A EP1170956A3 (en) 2000-06-06 2001-01-30 Method and system for compressing motion image information
EP01102046.8 2001-01-30
JP337217/01 2001-11-01
JP2001337217A JP3560946B2 (ja) 2000-11-01 2001-11-01 動画像情報の圧縮方法およびそのシステム
JP337217/2001 2001-11-01

Publications (2)

Publication Number Publication Date
CN1456016A CN1456016A (zh) 2003-11-12
CN1299510C true CN1299510C (zh) 2007-02-07

Family

ID=26076452

Family Applications (1)

Application Number Title Priority Date Filing Date
CNB028000056A Expired - Fee Related CN1299510C (zh) 2001-01-30 2002-01-30 压缩运动图像信息的方法和***

Country Status (9)

Country Link
CN (1) CN1299510C (zh)
AU (1) AU2002230101A2 (zh)
BR (1) BR0201500A (zh)
CA (1) CA2436437A1 (zh)
HK (1) HK1059349A1 (zh)
MX (1) MXPA03006756A (zh)
RU (1) RU2003126484A (zh)
TW (1) TW567729B (zh)
WO (1) WO2002063885A1 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107465930A (zh) * 2012-04-15 2017-12-12 三星电子株式会社 对视频进行编码的方法和设备以及计算机可读存储介质

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN100428269C (zh) * 2003-12-16 2008-10-22 富可视公司 处理图像数据的方法
CN100459711C (zh) * 2005-09-09 2009-02-04 北京中星微电子有限公司 一种视频压缩方法及使用该方法的视频***
CN100548051C (zh) 2006-05-25 2009-10-07 联想(北京)有限公司 视频编解码设备和方法以及***
EP2090112A4 (en) * 2006-11-07 2014-04-23 Samsung Electronics Co Ltd METHOD AND DEVICE FOR ENCODING AND DECODING BASED ON INTRA PREDICTION
TWI401963B (zh) * 2009-06-25 2013-07-11 Pixart Imaging Inc Dynamic image compression method for face detection
KR20150059797A (ko) * 2010-07-15 2015-06-02 미쓰비시덴키 가부시키가이샤 동영상 부호화 장치, 동영상 복호 장치, 동영상 부호화 방법 및 동영상 복호 방법
CN107145515B (zh) * 2017-04-01 2020-12-11 北京安云世纪科技有限公司 一种动态图像展示的方法、装置及移动终端
CN107404633A (zh) * 2017-08-14 2017-11-28 南京国电南自维美德自动化有限公司 视频监控***及其视频压缩编码方法、联合告警追踪方法
CN111556612B (zh) * 2020-06-04 2022-02-18 黄萍 一种电源线载波驱动led灯体的压缩灰度控制码协议

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0564015A (ja) * 1991-08-29 1993-03-12 Toshiba Corp 画像符号化装置及び画像復号化装置
CN1100872A (zh) * 1993-03-05 1995-03-29 索尼公司 用于再生预测编码的视频信号的装置和方法
JPH1098620A (ja) * 1996-09-19 1998-04-14 Fuji Xerox Co Ltd 画像処理装置
JPH11164305A (ja) * 1997-04-24 1999-06-18 Mitsubishi Electric Corp 動画像符号化方法、動画像符号化装置および動画像復号装置

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0824341B2 (ja) * 1985-10-28 1996-03-06 株式会社日立製作所 画像データ符号化方法
JPH0813134B2 (ja) * 1985-11-20 1996-02-07 富士通株式会社 ブロック化エントロピー符号化装置
JP2586715B2 (ja) * 1990-09-20 1997-03-05 日本電気株式会社 動画像信号の符号化方式
JP3689454B2 (ja) * 1995-06-22 2005-08-31 キヤノン株式会社 画像符号化装置及び方法
JPH11289542A (ja) * 1998-02-09 1999-10-19 Matsushita Electric Ind Co Ltd 画像符号化装置、画像符号化方法、および画像符号化プログラムを記録した記録媒体

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0564015A (ja) * 1991-08-29 1993-03-12 Toshiba Corp 画像符号化装置及び画像復号化装置
CN1100872A (zh) * 1993-03-05 1995-03-29 索尼公司 用于再生预测编码的视频信号的装置和方法
JPH1098620A (ja) * 1996-09-19 1998-04-14 Fuji Xerox Co Ltd 画像処理装置
JPH11164305A (ja) * 1997-04-24 1999-06-18 Mitsubishi Electric Corp 動画像符号化方法、動画像符号化装置および動画像復号装置

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107465930A (zh) * 2012-04-15 2017-12-12 三星电子株式会社 对视频进行编码的方法和设备以及计算机可读存储介质
CN107465930B (zh) * 2012-04-15 2020-06-23 三星电子株式会社 对视频进行编码的方法和设备以及计算机可读存储介质

Also Published As

Publication number Publication date
HK1059349A1 (en) 2004-06-25
MXPA03006756A (es) 2004-10-15
WO2002063885A1 (en) 2002-08-15
WO2002063885A8 (en) 2004-11-11
CA2436437A1 (en) 2002-08-15
CN1456016A (zh) 2003-11-12
RU2003126484A (ru) 2005-03-10
AU2002230101A2 (en) 2002-08-19
TW567729B (en) 2003-12-21
BR0201500A (pt) 2002-11-05

Similar Documents

Publication Publication Date Title
CN1224268C (zh) 运动图象编码装置及运动图象解码装置
US7085424B2 (en) Method and system for compressing motion image information
CN1189038C (zh) 嵌入的离散余弦变换式静止图像编码算法
CN1151684C (zh) 活动图象编码译码装置及方法
CN1299243C (zh) 图象编码方法和译码方法、以及图象编码装置和译码装置
CN1178515C (zh) 图象编码方法及图象编码装置
CN1285216C (zh) 图像编码方法和装置、图像译码方法和装置
CN1134991C (zh) 数字视频信号块间内插预测编码/解码装置及高效编码方法
CN1254980C (zh) 冗余图像编解码的方法与装置
KR101622450B1 (ko) 변환을 이용하는 비디오 인코딩 및 디코딩
CN1229999C (zh) 用于编码和解码运动矢量的方法和装置
CN1245032C (zh) 格式化一个mpeg译码器中的再压缩的数据
CN1659580A (zh) 基于空间预测的帧内编码
CN1893666A (zh) 视频编码和解码方法及设备
CN1633811A (zh) 图像编码方法、图像译码方法、图像编码装置、图像译码装置、程序、计算机数据信号,以及图像传送***
CN1968418A (zh) 混合图像数据处理***和方法
CN101031086A (zh) 视频信息编码方法和视频信息解码方法
CN1592413A (zh) 图象数据的自适应可变长度编码方法
CN1535018A (zh) 一种视频图像跳过宏块的编码方法
CN1292594C (zh) 使用多个扫描图形的编码和解码方法及装置
CN1643912A (zh) 用于在视频序列中对运动进行编码的方法
CN1922884A (zh) 视频解码方法
CN1299510C (zh) 压缩运动图像信息的方法和***
CN1589023A (zh) 一种基于上下文的多码表变长编解码方法及编解码装置
CN1615656A (zh) 对数字视频内容的图像级自适应帧/场编码

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 1059349

Country of ref document: HK

C14 Grant of patent or utility model
GR01 Patent grant
C19 Lapse of patent right due to non-payment of the annual fee
CF01 Termination of patent right due to non-payment of annual fee