CN1917562A - 用于渐进地变换并编码数字数据的***和方法 - Google Patents

用于渐进地变换并编码数字数据的***和方法 Download PDF

Info

Publication number
CN1917562A
CN1917562A CNA2006100778070A CN200610077807A CN1917562A CN 1917562 A CN1917562 A CN 1917562A CN A2006100778070 A CNA2006100778070 A CN A2006100778070A CN 200610077807 A CN200610077807 A CN 200610077807A CN 1917562 A CN1917562 A CN 1917562A
Authority
CN
China
Prior art keywords
color space
transform
composition
coefficient
present
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CNA2006100778070A
Other languages
English (en)
Other versions
CN100463488C (zh
Inventor
H·S·马尔瓦
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Microsoft Corp
Original Assignee
Microsoft Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Microsoft Corp filed Critical Microsoft Corp
Publication of CN1917562A publication Critical patent/CN1917562A/zh
Application granted granted Critical
Publication of CN100463488C publication Critical patent/CN100463488C/zh
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/46Colour picture communication systems
    • H04N1/64Systems for the transmission or the storage of the colour picture signal; Details therefor, e.g. coding or decoding means therefor
    • H04N1/646Transmitting or storing colour television type signals, e.g. PAL, Lab; Their conversion into additive or subtractive colour signals or vice versa therefor
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/41Bandwidth or redundancy reduction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/63Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding using sub-band based transform, e.g. wavelets
    • H04N19/635Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding using sub-band based transform, e.g. wavelets characterised by filter definition or implementation details
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/90Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
    • H04N19/91Entropy coding, e.g. variable length coding [VLC] or arithmetic coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/90Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
    • H04N19/93Run-length coding

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Of Band Width Or Redundancy In Fax (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Color Television Systems (AREA)
  • Image Processing (AREA)
  • Color Image Communication Systems (AREA)

Abstract

提供便于进步地转换并编码数字图像的***和方法。与许多常规压缩***相比,本发明通过使用多分辨率重叠变换提供进步的表现以及分组人工产物和振铃人工产物的减轻。本发明包括彩色空间映射器、多分辨率重叠变换、量化器、扫描仪和熵编码器。该多分辨率重叠变换输出变换系数,例如,第一变换系数和第二变换系数。用多分辨率重叠变换的第二变换系数可获得多分辨率的表示。该彩色空间映射器把输入图像映射到该输入图像的彩色空间表示。该输入图像的彩色空间表示接着被提供给该多分辨率重叠变换。该量化器接收该第一变换系数和/或该第二变换系数并且提供用于扫描仪和/或熵编码器的经量化的系数输出。该扫描仪扫描该经量化的系数以产生用于熵编码器的一维向量。该熵编码器对从该量化器和/或该扫描仪接收到的经量化的系数进行编码从而导致数据压缩。

Description

用于渐进地变换并编码数字数据的***和方法
本申请是提交于2003年2月27日,申请号为03106491.4的专利申请的分案申请。
技术领域
本发明一般涉及数字图像处理,并且尤其涉及便于图像编码和/或解码的***和方法。
背景技术
随着计算机网络、因特网和数字存储方法的广泛传播扩散,通过计算机的可用信息数量发生引人注目的提高。这样提高了的信息数量需要快速地发送信息并有效地存储该信息。数据压缩是便于信息的有效发送和存储的技术。
数据压缩减少表示信息所需的空间数量并可被用于许多信息类型。对数字信息(包括图像、文本、音频和视频)压缩的需求不断地增长。一般地,数据压缩随着标准计算机***使用;然而,其它技术也利用数据压缩,譬如但不限于数字和***以及蜂窝/数字电话。
随着对处理、发送和处理大量信息的需求增长,压缩这些数据的需求也增长。尽管存储设备容量已大大地增加,然而信息的需求已超出容量的提升。例如,一个未经压缩的数字图像可以需要5兆比特的空间,而同样的图像可被无损失地压缩且只需要2.5兆比特的空间。因此,数据压缩便于发送更大数量的信息。即使传输速率增加,譬如宽带、DSL、有线调制解调器因特网等等,用未经压缩的信息仍会容易地达到传输极限。例如,在DSL线上传输一个未经压缩的图像可能需要十分钟。然而,当同样的图像被压缩时可以在大约一分钟内发送从而提供十倍的数据通量。
通常有两种类型的压缩,无损的和有损的。无损的压缩使正确的原始数据在压缩后被重现,而有损的压缩使压缩后被重现的数据与原始数据不同。因为可以容忍一定程度数据完整性的损害,由于有损的压缩提供比无损压缩更好的压缩率,所以两种压缩模式间存在一个折衷。例如,无损的压缩可以用来压缩关键的文本,因为不能正确地重建数据会大大地影响文本的质量和可读性。有损的压缩可以用于图像或非关键性的文本,其中一定量的失真或噪声对于人体感官来说不是可以接受的就是不可察觉的。
图像压缩是一个尤为重要的技术问题,因为数字图像是前面提及的信息增长的一个很大部分。当今的大多数网页包含许多图片,许多办公文件也包含若干图片。数字照相机的使用以很快的速度增长;许多用户拥有取自这些照相机的差不多几千张图片。
最流行且广泛使用的图像压缩技术之一是联合摄影专家组(JPEG)标准。JPEG标准的操作是通过使用离散余弦变换(DCT)把8×8的像素方块映射到频域。DCT取得的系数除以一个缩放因数并四舍五入到最近的整数(通称为量化的一个过程)然后通过固定的锯齿形扫描图形被映射到一维矢量上。用运转周期编码和哈夫曼编码的组合对该一维矢量进行编码。
尽管JPEG是一种流行的并广泛使用的压缩技术,它仍然具有若干缺点。例如,JPEG的一个缺点是,在低的比特速率下DCT在重建的图像内产生不规则性和不连续性(通称为瓦面的或分组人工产物)。分组人工产物造成像素的8×8分组各组群之间的边界在重建图像中可见。这些分组人工产物引起图像质量不期望的降低。JPEG的另一个缺点是,JPEG不能执行保真度提高的图像重建。换句话说,如果图像以某保真度被编码并且后来期望较低的保真度(例如,由于限制的带宽或存储可用性),那么图像必须被解码并重新编码。
新的JPEG2000减轻了JPEG的一些缺点,它用小波变换取代DCT。尽管小波提供没有分组人工产物的平滑的信号重建,它们会导致模糊和振铃人工产物的增加。此外,JPEG2000使用相对复杂的系数编码***,产生比JPEG慢3x(或更多)倍的压缩技术。
发明内容
下面给出本发明简化了的概述以提供对本发明的一些方面的基本了解。该摘要并非本发明的详尽综述。它并不意味着识别本发明的主要/关键元件或描绘本发明的范围。它唯一的目的是给出本发明的一些概念的简化形式,作为后面给出的更详细的说明的序言。
本发明提供了一种数字图像压缩的***和方法,它使用能接收输入值(例如,从彩色空间映射器)的多分辨率的重叠变换,并且提供进步的表现。该多分辨率的重叠变换利用分层重叠的双正交变换,它缓和与许多使用离散余弦变换(DCT)的常规图像压缩***(譬如JPEG)有关的“分组人工产物”。此外,双正交重叠变换的使用与常规基于DCT的图像压缩***相比减轻了显著的“振铃人工产物”。
本发明的一个特定方面提供的图像压缩***具有彩色空间映射器、多分辨率重叠变换、量化器、扫描仪和/或熵编码器。多分辨率重叠变换输出变换系数,譬如,第一变换系数和第二变换系数。可以利用多分辨率重叠变换的第二变换系数来获取多分辨率表示。彩色空间映射器把输入图像映射到输入图像的彩色空间表示上(例如,YUV和/或YCOCG)。输入图像的彩色空间表示接着被提供给多分辨率重叠变换。量化器接收第一变换系数和/或第二变换系数并把经量化的系数的输出提供给扫描仪和/或熵编码器使用。扫描仪扫描该经量化的系数以产生用于熵编码器的一维向量。扫描仪可以利用一个Peano型的扫描命令。熵编码器对从量化器和/或扫描仪接收的经量化的系数进行编码,最终导致数据压缩。熵编码器可以利用自适应的运转周期编码器。
本发明的另一个方面提供的图像压缩***具有彩色空间映射器、无损变换和熵编码器。无损变换从彩色空间映射器接收输入值并利用无损的变换(例如,分层哈德曼(Hadamard)变换)。
本发明的还有一个方面提供的图像解压缩***具有熵解码器、反变换和反向彩色空间映射器。熵编码器接收比特流(例如,由相应的熵编码器产生的)并对该比特流解码。熵解码器可以利用自适应的运转周期解码器。
该反变换从熵解码器接收输入值并利用反变换(例如,反相分层重叠双正交或反相分层哈德曼)。该反变换把输出值提供给反向彩色空间映射器。该反向彩色空间映射器把输入值(例如,YUV和/或YCOCG)映射到RGB输出图像上。
本发明的另一个方面提供的图像压缩***可以用于一大批文件图像应用,包括但不限于分段分层的图像***、影印机、文件扫描仪、光特性识别***、个人数字助理、传真机、数字照相机、数字摄像机和/或电视游戏。
本发明的其它方面提供数据压缩/编码、数据解压缩/解码、扫描组块系数、彩色映像和反向彩色映像的方法。此外提供的是具有用于图像压缩***的计算机可用指令的计算机可读媒体和具有用于图像解压缩***的计算机可用指令的计算机可读媒体。还进一步提供了适合传输在两个或多个计算机进程之间的数据分组,该计算机进程包含便于数据压缩的信息,该信息包含至少部分基于输入值的重叠双正交变换的第一变换系数和至少部分基于至少一个第一变换系数的分层哈德曼变换的第二变换系数。进一步提供一种在两个或多个计算机元件间发送的有助于数据压缩的数据分组,它包括数据字段,该数据字段包含至少部分基于输入值的分层哈德曼变换,以及第二变换系数,该系数至少部分基于至少一个第一变换系数的哈德曼变换。
为了实现上述的和相关的目的,这里结合下面的说明和附图描述了本发明的某些说明性方面。然而,这些方面只表示本发明原理的各种使用方法中的一小部分并且本发明试图包括所有这些方面及其等价物。通过结合附图考虑下面本发明的详细描述,本发明的其它优点和新颖特性是显而易见的。
附图说明
图1是按照本发明的一个方面的图像压缩***的框图。
图2是按照本发明的一个方面的双正交重叠变换的框图。
图3是按照本发明的一个方面的多分辨率重叠变换的框图。
图4是按照本发明的一个方面的多分辨率重叠变换的框图。
图5是按照本发明的一个方面的多分辨率重叠变换的框图。
图6是说明按照本发明的一个方面的4乘4数据分组的框图。
图7是说明按照本发明的一个方面的16乘16数据大分组的Peano型扫描图案的框图。
图8是说明按照本发明的一个方面的第二级系数的4乘4分组的扫描图案的框图。
图9是按照本发明的一个方面的图像压缩***的框图。
图10是按照本发明的一个方面的4距哈德曼变换的框图。
图11是按照本发明的一个方面的图像解压缩***的框图。
图12是说明按照本发明的一个方面的数据压缩/编码的方法的流程图。
图13是说明按照本发明的一个方面的数据解压缩/解码的方法的流程图。
图14是说明按照本发明的一个方面的扫描组块系数的方法的流程图。
图15是说明按照本发明的一个方面的无损彩色空间正向映射器元件和反向映射器元件的框图。
图16是说明按照本发明的一个方面的彩色空间映射方法的流程图。
图17是说明按照本发明的一个方面的反向彩色空间映射方法的流程图。
图18说明本发明可能起作用的操作环境的例子。
图19是按照本发明的示例性通信环境的原理框图。
具体实施方式
现在参考附图描述本发明,其中相同的参考数字用来指示相同的元件。在下面的描述中,为了解释的目的,提出许多特定细节以提供对本发明的彻底理解。然而,显然可以无需这些特定细节而实际使用本发明。在其它的情况下,以框图形式示出众所周知的结构和设备以便于描述本发明。
如本申请所用到的,术语“计算机元件”是指计算机相关的实体,既可以是硬件、硬件和软件的组合、软件、也可以是执行中的软件。例如,计算机元件可以但不限于是运行在处理器上的进程、处理器、对象、命令、线程、程序、和/或计算机。通过说明,运行在服务器上的应用程序和服务器都可以是计算机元件。可能有一个或多个计算机元件驻留在进程和/或线程内并且元件可以定位在在一台计算机上和/或分散在两个或多个计算机中。
参考图1,它说明按照本发明的一个方面的图像压缩***100。如上所述,与许多常规的压缩***相比,本发明的***100通过使用多分辨率的重叠变换120提供进步的表现以及分组人工产物和振铃人工产物的减轻。该图像压缩***100包括彩色空间映射器110、多分辨率重叠变换120、量化器130、扫描仪140和熵编码器150。
彩色空间映射器110把输入图像映射到输入图像的彩色空间表示上。该输入图像的彩色空间表示接着被提供给多分辨率重叠变换120。在一个例子中,彩色空间映射器110把输入图像映射到RGB输入图像的YUV表示(例如,由红色、绿色和蓝色成分表示)上。YUV表示使用由Y指示的亮度分量、由U指示的红色度和由V指示的蓝色度。
在另一个例子中,彩色空间映射器110把输入图像映射到YCoCg表示上。该YCoCg表示使用由Y表示的亮度、由Co表示的橙色度和由Cg表示的绿色度。RGB输入成分用下列变换被映射到YCoCg上(例如,作为上面描述的常规YUV的替代):
Y C o C g = 1 2 1 2 0 - 2 - 1 2 - 1 R G B ⇔ R G B = 1 1 - 1 1 0 1 1 - 1 - 1 Y C o C g - - - ( 1 )
值得注意的是,YCoCg彩色空间映射的一个优点在于可以使用整数运算来实现从RGB到YCoCg的映射和从YCoCg到RGB的逆变换的,由此降低计算的开销。此外,可以无需乘法而实现逆变换。YCoCg彩色空间表示可能导致压缩性能比普及的YUV大大提高,因为它是对统计最佳的空间的更好逼近,这是通过对现代数字图像数据的主要成分分析获得的。
值得重视的是,可以构想许多其它与主题发明有关的、有助于用多分辨率重叠变换进行数据压缩的彩色空间表示。关于本发明的任何适当的彩色空间表示都应在所附的权利要求的范围内。此外,可以用按照本发明的彩色空间映射器110(例如,整数和/或浮点)来执行任何适当的计算机进程。
多分辨率重叠变换120例如,从彩色空间映射器110接收输入值。多分辨率重叠变换120能允许图像压缩***100具有进步的表现。多分辨率重叠变换120使用分层重叠的双正交变换。通过使用重叠变换,使用离散余弦变换(DCT)的常规图像压缩***(譬如JPEG)的“分组人工产物”可被减少。此外,重叠双正交变换的使用与常规基于DCT的图像压缩***相比减少了显著的“振铃人工产物”。
简要参考图2,它说明了按照本发明的一个方面的重叠双正交变换(LBT)200。该LBT 200包含与第一组数据有关的具有四个输入x(0),x(1),x(2)和x(3)的第一个类DCT变换210(例如,与DCT相似,但不完全相同)。该LBT 200也包含与第二组数据有关的具有四个输入x(0),x(1),x(2)和x(3)的第二个类DCT变换210。该LBT 200具有四个输出230,X(0),X(1),X(2)和X(3)。如图2所述,在直接变换(譬如,数据压缩/编码)中数据从左至右被处理,在反变换(如数据解压缩/解码)中数据从右至左被处理。直接(D)变换和逆(I)变换的缩放因数可以不同。
为了完成变换的重叠部分,输入第二个类DCT变换220的一组数据的输出230取决于前一组输入第一个类DCT变换210的数据。在不存在前一组数据输入的情况下(例如,在初始化时和/或在图像的角落处),不能完全判定第一个类DCT变换210的输入值。特别是如果第一个类DCT变换210是行或列的第一个,则x(0)和x(1)会超出图像边界。在该情况下,示例性的解决办法是通过设置x(1)=x(2)及x(0)=x(3)使用偶对称的扩展。类似的对称反射被应用于图像行或列的最后一个类DCT变换210。在这两种情况下都能容易地看到,行或列的第一个和最后一个类DCT变换210可以由简单的2×2操作符替代(例如,两个截然不同的输入,两个截然不同的输出)。
在一个例子中,LBT 200内的大致所有计算都可以用唯一的整数运算而无需乘法来完成。例如,对于给定的值z,可以用右移来实现新的值z/2:z>>1。此外,可以通过把右移的z相加两次并把该值加到z(例如,z+(z>>2))来实现数值1.25z。虽然该实现会导致由移位产生的小的截断误差(只要数据被适当地缩放),但值得注意的是该实现一般是独立于处理器的,因为不考虑用于实施变换的处理器时结果仍然相同。由此,不像诸如JPEG、MPEG及其它标准这样的常规数据压缩***,本发明的***和方法的大致所有实现都能导致对相同原始图像位图的大致相似的压缩文件。
简要参考图3,它说明了按照本发明的一个方面的多分辨率重叠变换300。该多分辨率重叠变换300包含第一初始LBT 3101到第S初始LBT 310S,S是大于或等于一的整数。该第一初始LBT 3101到第S初始LBT 310S可以总称为初始LBT 310。该多分辨率重叠变换300也包含二级LBT 320。譬如,多分辨率重叠变换120可使用该多分辨率重叠变换300。
初始LBT 310接收输入值(例如,从彩色空间映射器110)。该初始LBT310处理该输入值并输出至少部分基于输入值的重叠双正交变换的第一变换系数。例如,该初始LBT 310可以使用前面提出的示例性的LBT 200。
第一初始LBT 3101到第S初始LBT 310S的第一变换系数被作为输入提供给二级LBT 320。在一个例子中,初始LBT 310把低频系数(例如,DC)提供给二级LBT 320。二级LBT 320处理第一变换系数并输出第二变换系数,它至少部分基于输入的第一变换系数的重叠双正交变换。例如,二级LBT 320可以使用前面提出的示例性的LBT 200。
用二级重叠双正交变换320的第二变换系数可以获得多分辨率表示。例如,由只施加第二级的反向分层LBT而重构的位图能恢复表示原图的4×下采样形式的图像位图,这能与常规双立方下采样滤波器产生的结果相比较。
简要参考图4,它说明了按照本发明的一个方面的多分辨率重叠变换400。该变换400包含第一初始LBT 4101、第二初始LBT 4102、第三初始LBT 4103、第四初始LBT 4104和二级LBT 420。第一初始LBT 4101、第二初始LBT 4102、第三初始LBT 4103、第四初始LBT 4104的低频系数输出被作为输入提供给二级LBT 420。例如,多分辨率重叠变换120可使用该多分辨率重叠变换400。
接着参考图5,它说明了按照本发明的一个方面的多分辨率重叠变换500。该变换500包含初始LBT 510和二级LBT 520。初始LBT 510的低频系数输出被接着提供给二级LBT 520。一旦从初始LBT 510接收到足够的低频输出,该二级LBT 520就提供第二级系数输出。例如,多分辨率重叠变换120可使用该多分辨率重叠变换400。
为了处理图像而使用二维变换。为实现该二维变换,可以把前面讨论的LBT应用在输入值的行与列上(例如,从彩色空间映射器110接收到的Y、Co和Cg中的每个的)。在一个例子中,由于每个列存取几乎扩越整个位图阵列,这需要中断缓存的存储器存取,所以为了减少计算开销而并不处理整列。作为替代,按照本发明,可以使用内部“滚动的缓冲器”方法,其中在每处理四行之后进行部分列变换。在该方式中,仅对原始位图扫描一次便可以计算该二维变换。
再参考图1,量化器130接收第一变换系数和/或第二变换系数并提供用于扫描仪140和/或熵编码器150的经量化的系数输出。该量化器130一般把信息的丢失引入图像压缩***100。该丢失由系数的量化产生,因为对于经变换的值Y来说,它的量化形式一般由r=int[(Y+f)/s]给出,其中s是量化器130的步距,|f|一般等于s/2且sign(f)=sign(Y)。因此,随着步距s的增加,r的相应动态范围减少到象r等于零。在解压缩期间(例如,解码),Y的近似值一般通过 Y ^ = r × s 来恢复。因此,步距s越小,近似值越接近 Y ^ ≈ Y . 随着步距的增加,数据压缩一般更有效;然而也会引起较大的损失。在一个例子中,为了减少计算开销,量化器130使用整数运算,例如,用整数因数Z来缩放数值并且用整数来近似Z/s。
扫描仪140扫描经量化的系数以产生用于熵编码器150的一维向量。在一个例子中,扫描仪140使用行式扫描,而在另一个例子中,扫描仪140使用列式扫描。在还有一个例子中,扫描仪140使用锯齿形图案,譬如在常规JPEG数据压缩***中。
在第四个例子中,用一种不同的但仍固定的(独立于数据的)的图案来扫描经量化的系数(例如,为了避免随机数据存取)。简要参考图6,它说明了按照本发明的一个方面的4乘4系数分组。接着参考图7,它说明了按照本发明的一个方面的16乘16数据大分组(一组群L个分组,这里L=4)的Peano型扫描图案。图8说明了按照本发明的一个方面的第二级系数的4乘4分组的扫描图案(譬如由320、420、520的二级重叠变换产生的那些)。
对于每个大分组(例如,由分层级联的4×4变换产生),变换值被读入六个系数组群之一。从M个连续的大分组(“组块”)读出每个组群的连续值,该六个组群被连接起来作为一个被发送到熵编码器的长度为256M的向量。因此,每个组块可以独立地被编码。独立编码允许每个组块独立地解码,从而在期望的情况下允许仅仅一部分图像位图被解码。
图7和8提出的扫描图案是对DC系数空频有序的扫描(例如,经历两级LBT)和Peano加上对AC系数的空频有序的扫描(例如,只经历第一级LBT)的组合。使用Peano元件(图7中有阴影的箭头)以使特定组群内的每个邻近的AC系数组群来自邻近的4×4分组。
因此,组群0包含特定的第二级DC系数,它经过每个大分组的第二级LBT。接着可以对每个带有组群1至组群5扫描的大分组进行组群1到组群5的扫描,接着再对下一个大分组进行组群1到组群5的扫描,依此类推。对于大分组来说,组群1包含其余的经过该大分组的第二级LBT的DC系数。对每个大分组的LBT分组来说,组群2包含所述的系数值。对每个大分组的LBT分组来说,组群3包含所述的系数值。对每个大分组的LBT分组来说,组群4包含所述的系数值。对每个大分组的LBT分组来说,组群5包含所述的系数值。
回过去参考图1,熵编码器150对从量化器130和/或扫描仪140接收到的经量化的系数进行编码。彩色空间映射器110、多分辨率重叠变换120、量化器130和/或扫描仪140用减少的动态范围和长串的零把原始像素数据转换成整数向量----尽管无数据压缩。熵编码器150对这些经量化的系数进行编码,从而导致数据压缩。
在一个例子中,编码器150使用自适应的运转周期编码器。输入向量的每个位平面被有序地处理,开始于最高有效位(MSB)结束于最低有效位比特。对于每个系数来说,如果尚未编码过非零比特,则被标为“有效”,如果已编码过该系数的有效位,则被标为“清除”。清除比特很可能等于零或一,所以它们未经修改地被复制到比特流。有效位很可能等于零,所以它们通过自适应的且有效的运转周期编码器被编码,这产生根据表1描述的规则的码元。
  码字   输入比特序列
  0   2K个零的完全运算
1c0   c<2K个零的部分运算,后面是一个1,系数的符合=“+”(c是一个k比特的数字)
1c1   c<2K个零的部分运算,后面是一个1,系数的符合=“-”
表1:有效位的运转周期编码规则,带有参数k。
参数k控制运转周期编码器的压缩效率。k的值越大,可用包含单个比特=0的码字来表示的零字符串越长,并且从而压缩程度越高。参数k可被“调节”到数据的统计数字以使2K大致等于零字符串的长度。
在常规的运转周期编码中,参数k既可以是固定的又可以是定期更新的并且被加入比特流(因为解码器需要知道k的任何变化)。尽管因为两个原因,该两个方法都会导致很大的性能损失。首先,输入数据带有通常变化的统计数字,所以k需要被改变以跟踪这些变化。其次,因为需要若干比特来表现k的值,所以通过把k的值复制到比特流中来更新k的值会增加很大的开销。因此,在该例的自适应运转周期编码器内使用k的后向自适应规则。后向的意思是k根据经编码的码元被调节,而非根据输入数据。因此,只要编码器和解码器使用相同的自适应规则,则不需发送k的值。基本的自适应规则很简单。如果码字为零,这意味着刚观察到零的一个运转,可预料到较多的零的运转,并且从而增加k。如果码字以1开始,这意味着刚观察到零的一个不完全运转,所以可预料到较少的零的运转,并且从而减少k。
k内整数的增加会造成过快的自适应,这导致压缩性能的损失。从而,k可以通过分数数值来调节(例如,通过增加或减少k的成比例的形式)。
可以在每个位平面的末端终止运转周期编码码元并且添加包含每个位平面的经编码的数据长度的字段。由此,如果需要的话,则可解析该比特流并且可以消除最低有效位平面。这相当于用半个步距对数据进行再编码。因此,可以通过简单地从被压缩的文件中解析出一些比特来完成数据的再压缩。同样地,可以实现保真度的可量测性。
可以理解构想许多其它的熵编码技术(例如,自适应运算编码),它们有助于与本主题发明有关的使用多分辨率重叠变换的数据压缩。任何与本发明有关的适当的熵编码技术的使用都在所附权利要求的范围之内。
虽然图1是说明图像压缩***100的元件的框图,正如这里定义的术语,可以理解该彩色空间映射器110、多分辨率重叠变换120、量化器130、扫描仪140和/或熵编码器150可以作为一个或多个计算机元件来实现。因此,实现该图像压缩***100、彩色空间映射器110、多分辨率重叠变换120、量化器130、扫描仪140和/或熵编码器150可操作的计算机可执行元件可以存储在计算机可读的媒质上,这些媒质包括、但不限于按照本发明的ASIC(专用集成电路)、CD(激光唱盘)、DVD(数字化视频光盘)、ROM(只读存储器)、软盘、硬盘、EEPROM(电可擦可编程只读存储器)和存储棒。
接着转向图9,它说明了按照本发明的一个方面的无损图像压缩***900。该图像压缩***900包含彩色空间映射器110、无损变换910和熵编码器150。
例如,无损变换910从彩色空间映射器110接收输入值。无损变换910使用一个无损的变换。对于无损编码不需要使用重叠变换,因为不会存在分组人工产物(因为不涉及量化)。例如,无损变换910可以使用分层哈德曼变换。简要参考图10,可以使用分层变换结构1010,但4×4变换模块必须由无损哈德曼结构1020实现。正如这里定义的术语,可以理解无损变换1010可作为一个或多个计算机元件被实现。
转到图11,它说明了按照本发明的一个方面的图像解压缩***1100。该***1100包含熵解码器1110、逆扫描仪1120、反相量化器1130、逆变换元件1140和反向彩色空间映射器1150。
熵解码器1110接收比特流(例如,由相应的熵编码器产生)并对其解码。在一个例子中,该熵解码器1110使用自适应运转周期解码器,其操作类似于上述的解码器150。
逆扫描仪1120反向扫描从熵解码器1110接收到的熵解码的输入比特流。逆扫描仪1120把经量化的第一变换系数和/或经量化的第二变换系数提供给反相量化器1130。
在一个例子中,逆扫描仪1120使用行式反向扫描,而在另一个例子中,逆扫描仪1120使用反向列式扫描。在还有一个例子中,逆扫描仪1120使用锯齿形图案,譬如在常规JPEG数据压缩***中。在第四个例子中,用一种不同的但仍固定的(独立于数据的)的图案来扫描经量化的系数(例如,为了避免随机数据存取),譬如反向Peano型扫描图案。
反相量化器1130反相量化从逆扫描仪1120接收到的经量化的第一变换系数和/或经量化的第二变换系数。反相量化器1130提供未经量化的系数输出(例如,第一变换系数和/或第二变换系数)。
逆变换元件1140从反相量化器1130接收输出值。在一个例子中,逆变换元件1140使用反相分层重叠双正交变换并且把输出值提供给反向彩色映射器1150。例如,逆变换元件1140可以使用图2的多分辨率重叠变换的逆变换(例如,从右至左)。在另一个例子中,逆变换元件1140使用反向无损变换(例如,逆分层哈德曼变换)来解码原先由无损编码***900编码的图像位图。例如,逆变换(例如,无损的)能主要地颠倒无损模块1020中的计算(例如,以颠倒的次序)。
逆彩色空间映射器1150把输入值映射到RGB输出图像。在一个例子中,逆彩色空间映射器1150把YUV表示映射到RGB输出。在另一个例子中,逆彩色空间映射器1150把YCoCg表示映射到RGB输出。可以理解构想许多其它彩色空间表示,它们有助于与本主题发明有关的使用逆分层双正交重叠变换的数据解压缩。任何与本发明有关的适当的彩色空间表示的使用都在所附权利要求的范围之内。此外,可以用按照本发明的逆彩色空间映射器1150(例如,整数和/或浮点)来实现任何适当的计算机进程。
可以理解,熵编码器1110、逆扫描仪1120、逆量化器1130、逆变换1140和/或逆彩色空间映射器1150可以是计算机元件。
鉴于上面示出并描述的示例性***,参考图12、13、14、16和17的流程图可以更好地理解按照本发明实现的方法。虽然为了解释的简单,该方法以连续的块示出并描述,然而可以理解本发明并非被块的顺序限定,按照本发明,一些块的发生顺序可能与这里示出并描述的不同和/或相同。此外,并不需要所有说明的块来实现根据本发明的方法。
本发明一般可以用由一个或多个元件执行的计算机可执行的指令来描述,譬如程序模块。一般地,程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、数据结构等等。程序模块的功能一般可以根据各种实施例的需要被组合或被分配。
转到图12,它说明了按照本发明的一个方面的数据压缩/编码的方法1200。在1210处,对于每个大分组执行每个分组的变换。在一个例子中,使用双正交重叠变换(例如,有损模式)。在另一个例子中,使用无损哈德曼变换(例如,无损哈德曼结构1020,无损模式)。在1220处,在分组的低频系数上进行变换。在一个例子中,使用双正交重叠变换(例如,有损模式)。在第二个例子中,使用无损哈德曼变换(例如,无损哈德曼结构1020,无损模式)。接着,在1230处,系数被量化。在1240处,系数被扫描。在1250处,经量化的系数被编码。
参考图13,它说明了按照本发明的一个方面的图像解压缩/解码的方法1300。在1310处,系数被解码。在1320处,对于每个大分组,在每个分组的低频系数上进行逆变换。在一个例子中,使用逆双正交重叠变换(例如,有损模式)。在另一个例子中,使用逆无损哈德曼变换(例如,无损哈德曼结构1020,无损模式)。在1330处,每个分组的系数上进行逆变换。在一个例子中,使用逆双正交重叠变换(例如,有损模式)。在第二个例子中,使用逆无损哈德曼变换(例如,无损模式)。
接着,参考图14,它说明了按照本发明的一个方面扫描组块系数的方法1400。在1410处,扫描组块中每个大分组的一个二级系数(例如,DC元件)。接着,在1420处,对于组块中的每个大分组,扫描大分组其余的二级系数。在1430处,扫描大分组中的每个分组的组群2一级系数(例如,AC元件)。在1440处,扫描大分组中的每个分组的组群3一级系数。在1450处,扫描大分组中的每个分组的组群4一级系数。在1460处,扫描大分组中的每个分组的组群5一级系数。如果组块中还有未被扫描的大分组,则扫描在1420处继续。在刚才描述的示例性扫描方法中产生六个变换系数组群(组群0到5)。虽然相信这样的扫描和分组方案能产生好的压缩结果,然而可以使用任何其它合适的扫描和分组图案,例如,如果可以为更快的处理而牺牲压缩性能。与本发明有关的任何这些扫描/分组图案的使用都在所附权利要求的范围之内。
转到图15,它说明正向映射器元件1510(例如,由彩色映射器110使用)。该正向映射器元件1510提供将被映射到空间YCOCG的原始的RGB输入成分(例如,通过方程(1)的缩放形式)。该缩放需除以2(由标记为1/2的箭头所指示),而且可以通过前面描述的右移来实现。最初,这些移位产生的误差可能看上去是不可恢复的。然而,在逆向映射器元件1520中,以逆向的顺序施加正向映射器元件1510的输出,从而发生由移位产生的截断(例如,与正向映射元件1510内的相同),但现在它们的效应被减轻(由标记为-1/2的箭头所指示),从而允许对原始数据的恢复。因此,逆向映射器元件1520可以从YCOCG成分恢复原始的RGB输入成分(例如,准确地)。
接着参考图16,它说明彩色空间映射的方法1600。例如,正向映射器元件1510可以使用该方法1600。
在1610处接收到RGB输入(包含R成分、G成分和B成分)。在1620处提供包含该RGB输入的平均光强(亮度)表示的Y通道输出。可以根据上面的变换(1)提供该Y通道(例如,Y至少部分根据R+2G+B)。在一个例子中,可以用与RGB输入有关的信息增量和/或移位来提供该Y通道----无需乘法。
在1630处提供包含该RGB输入的彩色信息表示(色度)的接近橙色方向的Co通道输出。可以根据上面的变换(1)提供该Co通道(例如,Co至少部分根据2R-2B)。在一个例子中,可以用与RGB输入有关的信息增量和/或移位来提供该Co通道----无需乘法。
在1640处提供包含该RGB输入的彩色信息表示(色度)的接近绿色方向的Cg通道输出。可以根据上面的变换(1)提供该Cg通道(例如,Cg至少部分根据-R+2G-B)。在一个例子中,可以用与RGB输入有关的信息增量和/或移位来提供该Cg通道----无需乘法。
在另一个例子中,能够用根据方法1600提供的YCoCg通道的逆向映射来恢复该R成分、G成分和/或B成分。
接着参考图17,它说明逆彩色空间映射的方法1700。例如,逆向映射器元件1520可以使用方法1700。
在1710处,接收到YCoCg输入,它包含表示平均光强的Y通道、表示附近橙色方向的彩色信息和附近绿色方向的彩色信息。在1720处提供至少部分基于该YCoCg输入的R成分。可以根据上面的变换(1)提供该R成分(例如,R至少部分根据Y+Co-Cg)。在一个例子中,可以用与YCoCg输入有关的信息增量和/或移位来提供该R成分----无需乘法。
在1730处提供至少部分基于该YCoCg输入的G成分。可以根据上面的变换(1)提供该G成分(例如,G至少部分根据Y+Cg)。在一个例子中,可以用与YCoCg输入有关的信息增量和/或移位来提供该G成分----无需乘法。
在1740处提供至少部分基于该YCoCg输入的B成分。可以根据上面的变换(1)提供该B成分(例如,B至少部分根据Y+Co-Cg)。在一个例子中,可以用与YCoCg输入有关的信息增量和/或移位来提供该B成分----无需乘法。
可以理解,本发明的***和/或方法可以用于总的压缩***中,它便于文本、手稿、绘图、图片等的压缩。此外,本领域的技术人员会认识到本发明的***和/或方法可以用于大量文件图像应用软件的阵列,包括但不限于,影印机、文件扫描仪、光特性认识***、PDA、传真机、数字照相机、数字摄像机和/或电视游戏。
为了提供本发明的各方面的额外关系,图18和下面的讨论提供对可以实现本发明各种方面的合适的操作环境1810的简要、概括说明。图19提供了本发明能工作的额外的和/或可选择的操作环境。虽然本发明一般是以由一个或多个元件执行的计算机可执行的指令(如程序模块)来描述的,但是本领域的技术人员可以认识到,本发明也可以与其它程序模块组合和/或作为硬件和软件的组合来实现。然而,程序模块一般包括能执行特定任务或实现特定数据类型的例程、程序、对象、元件、数据结构等等。操作环境1810只是合适的操作环境的一个例子并且并不试图对本发明的使用范围或功能作出任何限制。适合与本发明一起使用的其它已知的计算机***、环境和/或配置包括但不限于,个人计算机、手提或便携式设备、多处理器***、基于微处理器的***、可编程用户电子设备、网络PC、小型计算机、大型计算机、包含上述***或设备的分布式计算环境等等。
参考图18,实现本发明的各方面的示例性环境1810包含计算机1812。该计算机1812包含处理器单元1814、***存储器1816和***总线1818。该***总线1818把包括、但不限于***存储器1816的***元件连接到处理单元1814。该处理单元1814可以是各种可用处理器中的任何一种。双重微处理器和其它多处理器结构也可以作为处理单元1814使用。
***总线1818可以是包括存储器总线或存储控制器、***总线或外部总线和/或局部总线的几种总线结构类型中的任一种,其中局部总线使用的多种可用的总线体系结构包括、但不限于,18比特总线、工业标准结构(ISA)、微通道结构(MSA)、扩展工业标准结构(EISA)、智能驱动电路(IDE)、VESA局部总线(VLB)、外设元件互连(PCI)、通用串行总线架构(USB)、]加速图形接口(AGP)、个人计算机存储器卡国际联合会总线(PCMCIA)以及小型计算机***接口(SCSI)。
***存储器1816包含易失存储器1820和非易失存储器1822。基本输入输出***(BIOS)被存储在非易失存储器1822内,它包含计算机1812内的元件之间传输信息的基本程序,譬如在启动期间。通过说明而非限定,非易失存储器1822可以包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除ROM(EEPROM)或瞬时存储器。易失存储器1820包括作为外部缓存存储器的随机存取存储器(RAM)。通过说明而非限定,RAM在许多形式下有效,譬如同步RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据速率SDRAM(DDRSDRAM)、增强的SDRAM(ESDRAM)、同步链接DRAM(SLDRAM)和直接存储总线RAM(DRRAM)。
计算机1812也包括可移除/不可移除的、易失/非易失计算机存储媒质。图18说明磁盘存储器1824的示例。磁盘存储器1824包括、但不限于像磁盘驱动器、软盘驱动器、磁带驱动器、Jazz驱动器、Zip驱动器、LS-100驱动器、瞬时存储卡或存储棒这样的设备。此外,磁盘存储器1824可包括与其它存储媒质独立或组合的存储媒质,它们包括、但不限于,像激光唱盘ROM设备(CD-ROM)、CD可记录驱动器(CD-R驱动器)、CD可重写驱动器(CD-RW驱动器)或者数字通用磁盘ROM驱动器(DVD-ROM)这样的光学磁盘驱动器。为了便于磁盘存储器设备1824到***总线1818的连接,通常使用可移除或不可移除的接口,譬如接口1826。
可以理解,图18描述的软件可作为在适当操作环境1810中描述的用户和基本计算机资源之间的媒介物。这类软件包括操作***1828。可存储在磁盘存储器1824上的操作***1828起到控制和分配计算机***1812的资源的作用。***应用程序1830通过存储在***存储器1816内或磁盘存储器1824上的程序模块1832和程序数据1834,利用操作***1828的资源管理。可以理解,本发明可以用各种操作***或操作***的组合来实现。
用户通过输入设备1836把命令或信息输入计算机1812。输入设备1836包括、但不限于,像鼠标这样的定点设备、跟踪球、指示笔、接触板、键盘、麦克风、操纵杆、游戏板、圆盘式***天线、扫描仪、TV转换卡、数字照相机、数字摄像机、网络照相机等等。这些和其它输入设备通过***总线1818经由接口端口1838连接到处理单元1816。接口端口1838包括,例如,串行端口、并行端口、游戏端口和通用串行总线(USB)。输出设备1840使用一些与输入设备1836相同的端口。因此,举例来说,USB端口可用来把输入提供给计算机1812并且从计算机1812输出信息至输出设备1840。提供输出适配器1842来说明存在一些需要特别适配器的输出设备1840,譬如其它输出设备1840中的监视器、扬声器和打印机。通过说明而非限定,该输出适配器1842包括在输出设备1840和***总线1818间提供一种连接方法的显卡和声卡。值得注意的是,像远程计算机1844这样的其它设备和/或设备的***既提供输入能力又提供输出能力。
计算机1812可以工作在使用像远程计算机1844这样的网络环境中。它使用到一个或多个远程计算机的逻辑连接。该远程计算机1844可以是个人计算机、服务器、路由器、网络PC、工作站、基于应用的微处理器、对等设备或其它公共网络节点等等,它一般包括关于计算机1812描述的许多或全部元件。为了简洁,只说明远程计算机1844的记忆体存储器设备1846。远程计算机1844通过网络接口1848被逻辑地连接到计算机1812并且接着通过通信连接1850被物理地连接。网络接口1848围绕像局域网(LAN)和广域网(WAN)这样的通信网络。LAN技术包括光纤分布式数据接口(FDDI)、铜分布式数据接口(CDDI)、以太网/IEEE 1502.3、令牌网/IEEE1502.5等等。WAN技术包括、但不限于,点对点链接、像综合业务数字网(ISDN)这样的电路切换网络及其变化、分组交换网和数字用户线(DSL)。
通信连接1850是指用于把网络接口1848连接到总线1818的硬件/软件。虽然为了说明的清晰在计算机1812内示出通信连接1850,然而它也可以处于计算机1812的外部。到网络接口1848的连接所需的硬件/软件包括(只为了示例性的目的),像DSL调制解调器、ISDN适配器和以太网卡这样的内部和外部技术,调制解调器包括常规电话级调制解调器、电缆调制解调器和DSL调制解调器。
图19是与本发明相互作用的示例计算环境1900的原理框图。该***1900包括一个或多个客户机1910。该客户机1910可以是硬件和/或软件(例如,线程、进程、计算设备)。该***1900也包括一个或多个服务器1930。该服务器1930也可以是硬件和/或软件(例如,线程、进程、计算设备)。例如,该服务器1930可以通过使用本发明收藏线程来进行转换。客户机1910和服务器1930之间一个可能的通信可以用适合在两个或多个计算机进程间发送的数据分组的形式。该***1900包括通信框架1950,它可用于促进客户机1910和服务器1930之间的通信。该客户机1910***作上连接到一个或多个客户数据存储器1960,数据存储器1960可以用来把信息存储到当地的客户机1910。同样地,该服务器1930***作上地连接到一个或多个服务器数据存储器1940,服务器数据存储器1940可以用来把信息存储到当地的服务器1930。
上面描述的说明中包括本发明的例子。当然,为了描述本发明不可能描述元件或方法的每个想得到的组合,但是本领域的一般技术人员可以认识到,本发明的许多进一步的组合和变更是可能的。由此,本发明试图包含所有这样的替代、修改和变化,它们在所附权利要求的精神和范围之内。此外,就术语“includes”既用于详细的说明又用于权利要求来说,它与术语“comprising”用于权利要求中的过渡词时所译的意思相同。

Claims (9)

1.一种彩色空间映射的方法,其特征在于包括:
接收RGB输入;
提供Y通道输出,它包含RGB输入的平均光强的表示;
提供Co通道输出,它包含在附近橙色方向的RGB输入的彩色信息的表示;以及,
提供Cg通道输出,它包含在附近绿色方向的RGB输入的彩色信息的表示。
2.如权利要求1所述的方法,其特征在于,还包括至少一个下列行为:
该RGB输入包含R成分、G成分和B成分;
提供至少部分基于R+2G+B的Y通道;
提供至少部分基于2R-2B的Co通道;以及,
提供至少部分基于-R+2G-B的Cg通道。
3.如权利要求1所述的方法,其特征在于,还包括至少一个下列行为:
提供用增量和移位实现的Y通道;
提供用增量和移位实现的Co通道;以及,
提供用增量和移位实现的Cg通道。
4.如权利要求1所述的方法,其特征在于,该R成分能通过YCoCg通道的逆映射而被恢复。
5.如权利要求1所述的方法,其特征在于,该G成分能通过YCoCg通道的逆映射而被恢复。
6.如权利要求1所述的方法,其特征在于,该B成分能通过YCoCg通道的逆映射而被恢复。
7.一种逆彩色空间映射的方法,其特征在于包括:
接收YCoCg输入,它包含表示平均光强的Y通道、表示附近橙色方向的彩色信息的Co通道和表示附近绿色方向的彩色信息的Cg通道;
提供至少部分基于YCoCg输入的R成分;
提供至少部分基于YCoCg输入的G成分;以及,
提供至少部分基于YCoCg输入的B成分。
8.如权利要求7所述的方法,其特征在于,还包括至少一个下列行为:
提供至少部分基于Y+Co-Cg的R成分;
提供至少部分基于Y+Cg的G成分;以及,
提供至少部分基于Y-Co-Cg的B成分。
9.如权利要求7所述的方法,其特征在于,还包括至少一个下列行为:
提供用增量和移位实现的R成分;
提供用增量和移位实现的G成分;以及,
提供用增量和移位实现的B成分。
CNB2006100778070A 2002-03-27 2003-02-27 用于渐进地变换并编码数字数据的***和方法 Expired - Lifetime CN100463488C (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US10/109,291 US7006699B2 (en) 2002-03-27 2002-03-27 System and method for progressively transforming and coding digital data
US10/109,291 2002-03-27

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
CNB031064914A Division CN100348049C (zh) 2002-03-27 2003-02-27 用于渐进地变换并编码数字数据的***和方法

Publications (2)

Publication Number Publication Date
CN1917562A true CN1917562A (zh) 2007-02-21
CN100463488C CN100463488C (zh) 2009-02-18

Family

ID=27804407

Family Applications (2)

Application Number Title Priority Date Filing Date
CNB2006100778070A Expired - Lifetime CN100463488C (zh) 2002-03-27 2003-02-27 用于渐进地变换并编码数字数据的***和方法
CNB031064914A Expired - Lifetime CN100348049C (zh) 2002-03-27 2003-02-27 用于渐进地变换并编码数字数据的***和方法

Family Applications After (1)

Application Number Title Priority Date Filing Date
CNB031064914A Expired - Lifetime CN100348049C (zh) 2002-03-27 2003-02-27 用于渐进地变换并编码数字数据的***和方法

Country Status (13)

Country Link
US (6) US7006699B2 (zh)
EP (3) EP3169049B1 (zh)
JP (1) JP4444571B2 (zh)
KR (1) KR100882417B1 (zh)
CN (2) CN100463488C (zh)
AU (4) AU2003202423B2 (zh)
BR (1) BR0300847A (zh)
CA (3) CA2423165C (zh)
ES (2) ES2733023T3 (zh)
HK (1) HK1058987A1 (zh)
MX (1) MXPA03002646A (zh)
RU (1) RU2321063C2 (zh)
TW (1) TWI239489B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103327337A (zh) * 2013-06-28 2013-09-25 武汉大学 一种基于双正交重叠变换的分类量化编码方法

Families Citing this family (61)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6950213B1 (en) * 2000-12-20 2005-09-27 Cisco Systems, Inc. Fast method for fax encoded data conversion
US7006699B2 (en) * 2002-03-27 2006-02-28 Microsoft Corporation System and method for progressively transforming and coding digital data
US7155065B1 (en) 2002-03-27 2006-12-26 Microsoft Corporation System and method for progressively transforming and coding digital data
US7769084B1 (en) 2002-07-15 2010-08-03 Apple Inc. Method for implementing a quantizer in a multimedia compression and encoding system
US7471726B2 (en) 2003-07-15 2008-12-30 Microsoft Corporation Spatial-domain lapped transform in digital media compression
US7724827B2 (en) * 2003-09-07 2010-05-25 Microsoft Corporation Multi-layer run level encoding and decoding
US7369709B2 (en) * 2003-09-07 2008-05-06 Microsoft Corporation Conditional lapped transform
US7649539B2 (en) * 2004-03-10 2010-01-19 Microsoft Corporation Image formats for video capture, processing and display
US7689051B2 (en) * 2004-04-15 2010-03-30 Microsoft Corporation Predictive lossless coding of images and video
US7480417B2 (en) * 2004-10-19 2009-01-20 Microsoft Corp. System and method for encoding mosaiced image data employing a reversible color transform
JP4371982B2 (ja) * 2004-11-08 2009-11-25 キヤノン株式会社 画像処理装置及びその制御方法、並びに、コンピュータプログラム及びコンピュータ可読記憶媒体
US7428342B2 (en) * 2004-12-17 2008-09-23 Microsoft Corporation Reversible overlap operator for efficient lossless data compression
US7305139B2 (en) * 2004-12-17 2007-12-04 Microsoft Corporation Reversible 2-dimensional pre-/post-filtering for lapped biorthogonal transform
US7471850B2 (en) * 2004-12-17 2008-12-30 Microsoft Corporation Reversible transform for lossy and lossless 2-D data compression
CN1811911B (zh) * 2005-01-28 2010-06-23 北京捷通华声语音技术有限公司 自适应的语音变换处理方法
WO2006098494A1 (en) * 2005-03-18 2006-09-21 Sharp Kabushiki Kaisha Video compression using residual color transform
US7792370B2 (en) * 2005-03-18 2010-09-07 Sharp Laboratories Of America, Inc. Residual color transform for 4:2:0 RGB format
US7630568B2 (en) * 2005-03-25 2009-12-08 Microsoft Corporation System and method for low-resolution signal rendering from a hierarchical transform representation
ES2569419T3 (es) * 2005-05-27 2016-05-10 Telefonaktiebolaget Lm Ericsson (Publ) Procesamiento de imágenes basado en peso
KR100718130B1 (ko) * 2005-06-04 2007-05-14 삼성전자주식회사 디스플레이 구동 장치 및 방법
US20060288065A1 (en) * 2005-06-17 2006-12-21 Docomo Communications Laboratories Usa, Inc. Method and apparatus for lapped transform coding and decoding
US8036274B2 (en) 2005-08-12 2011-10-11 Microsoft Corporation SIMD lapped transform-based digital media encoding/decoding
US8880571B2 (en) 2006-05-05 2014-11-04 Microsoft Corporation High dynamic range data format conversions for digital media
US8179961B2 (en) 2006-07-17 2012-05-15 Thomson Licensing Method and apparatus for adapting a default encoding of a digital video signal during a scene change period
WO2008019524A1 (en) * 2006-07-17 2008-02-21 Thomson Licensing Method and apparatus for encoding video color enhancement data, and method and apparatus for decoding video color enhancement data
US9415544B2 (en) * 2006-08-29 2016-08-16 3D Systems, Inc. Wall smoothness, feature accuracy and resolution in projected images via exposure levels in solid imaging
US8054886B2 (en) * 2007-02-21 2011-11-08 Microsoft Corporation Signaling and use of chroma sample positioning information
JP4806464B2 (ja) * 2007-03-29 2011-11-02 富士通株式会社 画像圧縮装置、画像圧縮方法、画像復元装置、及びプログラム
US8237830B2 (en) 2007-04-11 2012-08-07 Red.Com, Inc. Video camera
KR101503227B1 (ko) 2007-04-11 2015-03-16 레드.컴 인코포레이티드 비디오 카메라
US8369638B2 (en) * 2008-05-27 2013-02-05 Microsoft Corporation Reducing DC leakage in HD photo transform
US8447591B2 (en) * 2008-05-30 2013-05-21 Microsoft Corporation Factorization of overlapping tranforms into two block transforms
US8391638B2 (en) * 2008-06-04 2013-03-05 Microsoft Corporation Hybrid image format
US20090313574A1 (en) * 2008-06-16 2009-12-17 Microsoft Corporation Mobile document viewer
US8275209B2 (en) * 2008-10-10 2012-09-25 Microsoft Corporation Reduced DC gain mismatch and DC leakage in overlap transform processing
US8194977B2 (en) * 2008-12-09 2012-06-05 Microsoft Corporation Remote desktop protocol compression acceleration using single instruction, multiple dispatch instructions
WO2010088465A1 (en) * 2009-02-02 2010-08-05 Gentex Corporation Improved digital image processing and systems incorporating the same
JP5004986B2 (ja) 2009-03-19 2012-08-22 キヤノン株式会社 スキャン変換装置及び画像符号化装置、並びにそれらの制御方法
JP5302769B2 (ja) * 2009-05-14 2013-10-02 キヤノン株式会社 スキャン変換装置及び画像符号化装置及びそれらの制御方法
TWI423068B (zh) * 2009-10-23 2014-01-11 Univ Nat Cheng Kung Image digital tag embedding method, instant identification method and its authentication system
KR101484280B1 (ko) 2009-12-08 2015-01-20 삼성전자주식회사 임의적인 파티션을 이용한 움직임 예측에 따른 비디오 부호화 방법 및 장치, 임의적인 파티션을 이용한 움직임 보상에 따른 비디오 복호화 방법 및 장치
EP2564354A4 (en) * 2010-04-29 2014-03-12 Icvt Ltd APPARATUS AND METHODS FOR RECOMPRESSION HAVING A MONOTONE RELATIONSHIP BETWEEN COMPRESSION LEVEL AND COMPRESSED IMAGE QUALITY
US8542934B2 (en) 2011-05-18 2013-09-24 Microsoft Corporation Transform space difference compression
US8693772B2 (en) * 2011-10-11 2014-04-08 Tandent Vision Science, Inc. System and method for digital image signal compression using intrinsic images
US9329861B2 (en) * 2011-12-29 2016-05-03 International Business Machines Corporation Convert to zoned format from decimal floating point format
WO2013112064A1 (en) * 2012-01-25 2013-08-01 Intel Corporation Content-aware image resizing using superpixels
US9521384B2 (en) 2013-02-14 2016-12-13 Red.Com, Inc. Green average subtraction in image data
SE538512C2 (sv) * 2014-11-26 2016-08-30 Kelicomp Ab Improved compression and encryption of a file
EP3067889A1 (en) 2015-03-09 2016-09-14 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Method and apparatus for signal-adaptive transform kernel switching in audio coding
US10123045B2 (en) * 2015-07-24 2018-11-06 Qualcomm Incorporated Modification to block size for transform mode in display stream compression
US10303498B2 (en) 2015-10-01 2019-05-28 Microsoft Technology Licensing, Llc Performance optimizations for emulators
US10264263B2 (en) * 2016-07-06 2019-04-16 Morpho Detection, Llc Systems and methods for compressing image data generated by a computed tomography (CT) imaging system
CN107403176B (zh) * 2017-03-29 2020-02-28 北京猿力未来科技有限公司 文本图片中文字背景反色的检测方法和装置
JP7313330B2 (ja) 2017-07-05 2023-07-24 レッド.コム,エルエルシー 電子機器でのビデオ画像データ処理
US20190197413A1 (en) * 2017-12-27 2019-06-27 Elasticsearch B.V. Forecasting for Resource Allocation
US10262451B1 (en) * 2018-04-09 2019-04-16 8i Limited View-dependent color compression
US10861405B2 (en) 2018-07-09 2020-12-08 Samsung Display Co., Ltd. Color transform for RGBG subpixel format
CN110032470B (zh) * 2019-03-18 2023-02-28 长安大学 一种基于哈夫曼树的异构部分重复码的构造方法
US11042422B1 (en) 2020-08-31 2021-06-22 Microsoft Technology Licensing, Llc Hybrid binaries supporting code stream folding
US11231918B1 (en) 2020-08-31 2022-01-25 Microsoft Technologly Licensing, LLC Native emulation compatible application binary interface for supporting emulation of foreign code
US11403100B2 (en) 2020-08-31 2022-08-02 Microsoft Technology Licensing, Llc Dual architecture function pointers having consistent reference addresses

Family Cites Families (28)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5233684A (en) * 1990-06-26 1993-08-03 Digital Equipment Corporation Method and apparatus for mapping a digital color image from a first color space to a second color space
US5097331A (en) * 1990-08-24 1992-03-17 Bell Communications Research, Inc. Multiple block-size transform video coding using an asymmetric sub-band structure
US6034667A (en) * 1992-01-21 2000-03-07 Radius Inc. Method and apparatus for displaying YUV color information on a pseudo-color RGB display
US5384901A (en) * 1992-10-22 1995-01-24 Xerox Corporation Method of rendering a color image for an output medium from symbolic image data
US5497398A (en) * 1993-08-12 1996-03-05 Aware, Inc. Multi-carrier transceiver
JPH0877341A (ja) * 1994-08-29 1996-03-22 Xerox Corp カラー画像処理装置及び方法
US5966465A (en) * 1994-09-21 1999-10-12 Ricoh Corporation Compression/decompression using reversible embedded wavelets
KR100363250B1 (ko) * 1995-12-30 2003-03-15 삼성전자 주식회사 2차원색도분할을이용한색처리방법및장치
US5850482A (en) * 1996-04-17 1998-12-15 Mcdonnell Douglas Corporation Error resilient method and apparatus for entropy coding
US5838377A (en) * 1996-12-20 1998-11-17 Analog Devices, Inc. Video compressed circuit using recursive wavelet filtering
US6101279A (en) * 1997-06-05 2000-08-08 Wisconsin Alumni Research Foundation Image compression system using block transforms and tree-type coefficient truncation
JPH11112817A (ja) * 1997-10-02 1999-04-23 Toshiba Corp カラーイメージデータ圧縮方法、その圧縮装置および圧縮処理用記憶媒体
US6937659B1 (en) 1997-11-14 2005-08-30 Ac Capital Management, Inc. Apparatus and method for compressing video information
US6268939B1 (en) * 1998-01-08 2001-07-31 Xerox Corporation Method and apparatus for correcting luminance and chrominance data in digital color images
US6115689A (en) * 1998-05-27 2000-09-05 Microsoft Corporation Scalable audio coder and decoder
US6073153A (en) * 1998-06-03 2000-06-06 Microsoft Corporation Fast system and method for computing modulated lapped transforms
US6253165B1 (en) * 1998-06-30 2001-06-26 Microsoft Corporation System and method for modeling probability distribution functions of transform coefficients of encoded signal
US6697519B1 (en) * 1998-10-29 2004-02-24 Pixar Color management system for converting computer graphic images to film images
US6625216B1 (en) * 1999-01-27 2003-09-23 Matsushita Electic Industrial Co., Ltd. Motion estimation using orthogonal transform-domain block matching
US6211971B1 (en) * 1999-03-11 2001-04-03 Lockheed Martin Missiles & Space Co. Method and apparatus to compress multi-spectral images to a single color image for display
US6611273B2 (en) * 2000-02-25 2003-08-26 Microsoft Corporation Method and data arrangement for encapsulating signed over-ranged color image data to accommodate in-range file formats
TW508940B (en) * 2000-03-28 2002-11-01 Omnivision Tech Inc Method and apparatus for color image date processing and compression
US6781724B1 (en) * 2000-06-13 2004-08-24 Eastman Kodak Company Image processing and manipulation system
US6909812B1 (en) 2000-07-13 2005-06-21 Lucent Technologies Inc. Methods and apparatus for nearly lossless-concatenated block transform coding
WO2002007438A1 (en) * 2000-07-17 2002-01-24 Trustees Of Boston University Generalized lapped biorthogonal transform embedded inverse discrete cosine transform and low bit rate video sequence coding artifact removal
US6636830B1 (en) * 2000-11-22 2003-10-21 Vialta Inc. System and method for noise reduction using bi-orthogonal modified discrete cosine transform
WO2002051157A2 (en) * 2000-12-19 2002-06-27 Pulsent Corporation Adaptive transforms
US7006699B2 (en) * 2002-03-27 2006-02-28 Microsoft Corporation System and method for progressively transforming and coding digital data

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103327337A (zh) * 2013-06-28 2013-09-25 武汉大学 一种基于双正交重叠变换的分类量化编码方法
CN103327337B (zh) * 2013-06-28 2015-12-23 武汉大学 一种基于双正交重叠变换的分类量化编码方法

Also Published As

Publication number Publication date
KR100882417B1 (ko) 2009-02-05
EP3169049A1 (en) 2017-05-17
AU2003202423A1 (en) 2003-10-23
HK1058987A1 (en) 2004-06-11
CA2775691A1 (en) 2003-09-27
CA2775622C (en) 2014-05-27
AU2008229881A1 (en) 2008-10-30
US7155055B2 (en) 2006-12-26
US20030185439A1 (en) 2003-10-02
CN100348049C (zh) 2007-11-07
TWI239489B (en) 2005-09-11
AU2008229880B2 (en) 2010-06-24
EP1349394B1 (en) 2017-03-29
EP1349394A3 (en) 2008-01-30
AU2008229876A1 (en) 2008-10-30
EP3169049B1 (en) 2019-04-10
US7099516B2 (en) 2006-08-29
US7095899B2 (en) 2006-08-22
US20050276472A1 (en) 2005-12-15
AU2003202423B2 (en) 2008-07-17
BR0300847A (pt) 2004-08-17
CA2775622A1 (en) 2003-09-27
US20050276494A1 (en) 2005-12-15
TW200305830A (en) 2003-11-01
US7006699B2 (en) 2006-02-28
US20060023958A1 (en) 2006-02-02
ES2733023T3 (es) 2019-11-27
JP4444571B2 (ja) 2010-03-31
EP1349394A2 (en) 2003-10-01
KR20030077959A (ko) 2003-10-04
ES2729926T3 (es) 2019-11-07
CN1447285A (zh) 2003-10-08
CA2775691C (en) 2013-07-02
EP1349394B8 (en) 2017-05-31
US20050276491A1 (en) 2005-12-15
US7116834B2 (en) 2006-10-03
MXPA03002646A (es) 2004-09-06
JP2003324757A (ja) 2003-11-14
CA2423165C (en) 2012-07-17
US20050281472A1 (en) 2005-12-22
US7110610B2 (en) 2006-09-19
CN100463488C (zh) 2009-02-18
CA2423165A1 (en) 2003-09-27
EP3169050B1 (en) 2019-04-10
RU2321063C2 (ru) 2008-03-27
AU2008229880A1 (en) 2008-11-06
EP3169050A1 (en) 2017-05-17

Similar Documents

Publication Publication Date Title
CN100348049C (zh) 用于渐进地变换并编码数字数据的***和方法
US7155065B1 (en) System and method for progressively transforming and coding digital data
US5881176A (en) Compression and decompression with wavelet style and binary style including quantization by device-dependent parser
CN1266843C (zh) 编码方法及***以及译码方法及***
CN1550104A (zh) 应用Golomb-Rice编码法DCT压缩法
JP2001136526A (ja) 画像処理方法及びその装置及び記憶媒体
JPH11136519A (ja) 画像処理装置
Ansari et al. Jpeg and jpeg2000
Yovanof Recent advances in lossless coding techniques
CN1477867A (zh) 渐进式联合图像专家组解码装置及方法
CN1599403A (zh) 逐进式结合图像专家组解码方法及相关装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
ASS Succession or assignment of patent right

Owner name: MICROSOFT TECHNOLOGY LICENSING LLC

Free format text: FORMER OWNER: MICROSOFT CORP.

Effective date: 20150429

C41 Transfer of patent application or patent right or utility model
TR01 Transfer of patent right

Effective date of registration: 20150429

Address after: Washington State

Patentee after: MICROSOFT TECHNOLOGY LICENSING, LLC

Address before: Washington State

Patentee before: Microsoft Corp.

C41 Transfer of patent application or patent right or utility model
TR01 Transfer of patent right

Effective date of registration: 20160727

Address after: Grand Cayman, Georgetown, Cayman Islands

Patentee after: Microsoft Corp.

Address before: Washington State

Patentee before: MICROSOFT TECHNOLOGY LICENSING, LLC

CX01 Expiry of patent term

Granted publication date: 20090218

CX01 Expiry of patent term