KR20060049812A

KR20060049812A - 하이브리드 방향성 예측 및 리프팅 웨이브렛 기술을 채용한이미지 코딩을 위한 시스템 및 방법

Info

Publication number: KR20060049812A
Application number: KR1020050059687A
Authority: KR
Inventors: 펭 우; 쉬헹 리
Original assignee: 마이크로소프트 코포레이션
Priority date: 2004-07-03
Filing date: 2005-07-04
Publication date: 2006-05-19
Also published as: US20060008164A1; EP1641277B1; US7565020B2; EP1641277A3; JP2006074733A; KR101203369B1; CN1735213A; CN1735213B; JP4889248B2; EP1641277A2

Abstract

하이브리드 방향성 예측 및 리프팅 웨이브렛 기술을 채용해서 이미지 내의 공간적인 상관관계를 개발해서 이미지 및 비디오를 코딩하는 효율적 방식을 제공하는 시스템 및 방법.

다상 샘플, 리프팅, 인코딩, 부가 비트, 코덱, 웨이브렛

Description

하이브리드 방향성 예측 및 리프팅 웨이브렛 기술을 채용한 이미지 코딩을 위한 시스템 및 방법 {A SYSTEM AND METHOD FOR IMAGE CODING EMPLOYING HYBRID DIRECTIONAL PREDICTION AND LIFTING WAVELET}

본 발명의 구체적인 특징, 양상, 및 장점은 아래의 설명, 첨부된 청구범위, 및 동반된 도면을 통해 더욱 잘 이해될 것이다.

도 1은 본 발명을 구현하기 위한 예시적인 시스템을 이루는, 일반적인 목적의 컴퓨팅 장치(computing device)를 도시하는 도면.

도 2는 본 발명의 인코딩 방법의 개요 흐름도.

도 3은 2차원 방향성 공간 예측 리프팅의 예시적인 흐름도.

도 4는 일반적인 종래의 1차원 리프팅 변환의 단순화된 블록도. (a)분석 면과 (b)통합 면.

도 5는 종래의 리프팅 분해를 이용한 예시적인 이미지와 결과물인 네 개의 부대역. 도 5A는 원래의 이미지. 도 5B는 로 로(low low, LL) 부대역. 도 5B는 로 하이(low high, LH) 부대역. 도 5C는 하이 로(high low, HL) 부대역. 도 5D는 하이 하이 (high high, HH) 부대역.

도 6은 본 발명에 따른 시스템 및 방법에 따른 DSP 리프팅 방식에서의 수직 변환 각도.

도 7은 일반적인 1차원 DSP 리프팅 변환. (a)분석 면과 (b)통합 면.

도 8A에서 8D는 본 발명의 DSP 리프팅 분해를 이용한 결과물인 네 개의 부대역. 도 8A는 로 로(low low, LL) 부대역. 도 8B는 로 하이(low high, LH) 부대역. 도 8C는 하이 로(high low, HL) 부대역. 도 8D는 하이 하이 (high high, HH) 부대역.

도 9A, 9B, 및 9C는 본 발명에 따른 시스템 및 방법의 방향성 각도를 추정하기 위한 세 개의 분할 모드(partition mode). 도 9A는 16x16 픽셀 블록 분할. 도 9B는 8x8 픽셀 블록 분할; 도 9C는 4x4 픽셀 블록 분할.

도 10은 본 발명에 따른 시스템및 방법의 이미지에서의 각도 추정 과정을 위한 흐름도.

도 11은 본 발명에 따른 시스템 및 방법의 매크로블록(macroblock)에서의 각도와 모드 추정을 위한 흐름도.

도 12는 본 발명에 따른 시스템 및 방법의 방향성 각도의 예측.

< 도면의 주요 부분에 대한 부호 설명 >

202 : 2차원 신호 입력

204 : 지향성 예측 및 리프팅 웨이브렛을 사용하여 2차원 신호 변환

206 : 계수 출력

208 : 엔트로피 인코딩 계수

210 : 엔트로피 인코딩 계수를 비트 스트림으로 출력

본 발명은 이미지 데이터를 인코딩(encoding)하고 디코딩(decoding)하는 시스템 및 방법에 관한 것이다. 더 구체적으로, 본 발명은, 하이브리드 방향성 예측(hybrid directional prediction) 및 리프팅 웨이브렛(lifting wavelet) 기술을 이용하여 이미지 내의 공간적인 상관관계를 개발하는, 개선된 인코딩 및 디코딩 방법에 관한 것이다. 본 코딩 방법은 일련의 비디오의 프레임 내부(intra frame)를 코딩하는 데에 사용될 수도 있다.

이미지 압축은 디지털 카메라의 수가 급속히 증가함에 따라 현대 삶에서 중요한 역할을 하고 있다. 지난 수십년간 많은 압축 방식이 개발되었다. 이것은 초기의 차분 펄스 부호 변조(Differential Pulse Code Modulation, DPCM) 기반[1], 이산 코사인 변환(Discrete Cosine Transform, DCT) 기반 압축 방식[1]-[4] 및 웨이브렛 기반[5]-[20] 압축 기술을 포함한다. JPEG[1]과 같은 DCT 기반 방식은 대부분 낮은 계산 솔루션(computational solution)을 제공하지만, 원하는 범위성(scalability)를 달성하는 데에 어려움이 있다.

DCT 기반 압축 방식과 비교했을 때, 웨이브렛 기반 방식은 일반적으로 더 많은 계산 전력을 필요로 한다. 반면에, 웨이브렛 변환(wavelet transform)[21]은 공간-주파수 영역에서 이미지의 다중 스케일 표시(multi-scale representation)를 제공한다. 압축을 용이하게 하는 에너지를 압축하고 상관관계를 없애는(de-correlation) 특성 외에도, 웨이브렛 변환의 주요 장점은 고유의 범위성 (scalability)이다. 예컨대, 웨이브렛 기반 JPEG2000 표준[7]은 DCT 기반 JPEG 표준에 비해 월등한 압축 성능을 제공할 뿐만 아니라, 소비자와 통신망 애플리케이션에 매우 바람직한 속도, 품질, 및 정밀도의 범위성 또한 제공한다.

사실상 자연 이미지는 흔히 풍부한 방향성 속성을 가지며, 이것은 일반적으로 국부적인 레벨(local level)에서 선형적인 모서리(linear edge)로 근사될 수 있다. 이 모서리들은 수직이거나 수평이지 않을 수도 있다. 그러나 대부분의 주류 이미지 코딩 방식은 이러한 사실을 염두에 두지 않는다 [1],[5]-[7]. 2차원 DCT 또는 웨이브렛 변환은 항상 수평 및 수직 방향에서 실행된다. 그 결과 고주파수 계수가 매우 큰 값을 가지게 된다. 또한, 낮은 비트 속도(bit-rate)에서는 이미지 모서리에서 악명높은 깁스 아티팩트(Gibbs artifact)로 양자화 현상(quantized effects)을 명백하게 관찰할 수 있다. 이 문제는 여러 연구원들에 의해 인식되었다[3],[4],[8]-[20]. Feig et al.은 프랙탈(fractal) 기반 이미지 압축[3]과 비슷한 방법으로 공간적 예측을 JPEG 방식 코드에 도입하였다. 이것은 PSNR과 비트 속도의 손익상쇄(trade-off) 면에서 순수한 DCT 기반 이미지 압축보다 월등한 성능을 보이지 않는다. 그러나 매우 낮은 비트 속도에서 이것은 훨씬 적은 블록 아티팩트(block artifact) 및 현저히 나은 시각적인 품질의 결과를 가져온다. Kondo et al.은 네 개의 코딩된 인접한 DCT 블록 중 하나로부터 예측될 수 있는, DCT 블록의 방향성 예측을 실행하였다[4]. 새로운 비디오 코딩 표준 H.264 또한 블록 기반 공간적 예측 기술을 프레임 내부 코딩에 성공적으로 적용하였다. 이것은 공간 예측을 하지 않는 기술에 비해 코딩 효율 면에서 현저한 이득(gain)을 나타냈다[22].

많은 사람들이 웨이브렛/부대역(subband) 코딩 방식의 이 문제를 연구하였다. Ikonomopoulos et al.은 서로 다른 방향으로의 텍스쳐(texture) 상관관계에 맞게 적응하기 위해 방향성 필터의 결정된 집합(fixed set)을 제시하였다[8]. Li et al.은 Ikonomopoulos의 방식에 부대역 분해(subband decomposition)를 통합하였다[9] Bamberger et al.은 직사각형 이미지 샘플링(rectangular image sampling)을 기반으로 하는 필터 뱅크(filter bank)를 사용하였다[10]-[12]. 이것은 이미지를 여러 개의 서로 다른 방향성 요소들로 분해할 수 있다. Candes et al.에 의해 최근에 개발된 릿질렛(Ridgelet)및 커블렛(Curvelet)은 극 샘플링(polar sampling)을 하는 또 다른 종류의 변환이다[13],[14]. Mahesh et al.은 육각형으로 샘플된 이미지를 주파수와 방향에 대해 모두 선택적인 부대역으로 변환하였다[15]. Taubman et al. 은 웨이브렛 변환 전에 입력 이미지가 우선 재샘플되는(re-sampled) 방식을 제안하였다[16]. 재샘플되는 과정은 이미지 모서리를 수평 또는 수직 방향으로 회전시킬 수 있다. Wang et al.은 Taubman et al.과 유사한 아이디어를 사용하였으나, 나아가 서로 다른 방향 영역의 경계 주위의 코딩 아티팩트를 방지하기 위한 중첩된 확장(overlapped extension)을 제안하였다[17]. 웨이브렛 패킷에 대한 유사한 연구는 또한 [18][19]에 발표되었다.

그러나 리프팅 기반 웨이브렛 변환에 방향성 예측을 사용할 것을 제안한 저자는 몇 안 된다. 웨이브렛 변환은 포갬(convolution)기반과 리프팅 기반의 두 가지 방법을 사용하여 구현될 수 있다. 리프팅 구현은 Daubechies에 의해 제안되었다. Daubechies et al.에 의해 개발된 리프팅 구조는, 모든 유한 임펄스 응답 (Finite Impulse Response, FIR) 웨이브렛 필터가 여러 개의 리프팅 단계로 분해될 수 있는, 효율적이고 대중적인 구현이다[23]. 웨이브렛 변환의 포갬 구현은 공간 예측이 매우 어렵게 통합되도록 하는 한편, 웨이브렛 기술은 공간 예측의 통합을 잠재적으로 가능케 한다. 그러나 Daubechies에 의해 제안된 기술은 공간적으로 방향성이 있는 정보를 전혀 사용하지 않는다. Boulgouris et al.은 예측된 오차 분산을 최소화하기 위해 적응(adaptive) 리프팅 기술을 제안하였다[20]. Ikonomopoulos의 아이디어와 유사하게, 이것은 다섯 점 모양의 샘플링(quincunx sampling)으로부터 여러 개의 방향성 필터를 유도하고 중앙값 연산(median operation)으로 그 중 하나를 선택한다. 그러나 이것은 무손실 이미지 코딩에서 현저한 이득을 보이지 않는다.

그러므로, 필요한 것은, 공간적인 상관관계를 이용하고 고주파수 계수가 큰 값은 가지지 않는 방법으로 비트 흐름(bit stream)이 인코딩될 수 있는, 예컨대 비디오 데이터와 같은 이미지 데이터를 인코딩하거나 디코딩하는 시스템과 방법이다. 이 시스템과 방법은 또한 계산적으로 효율적이어야한다.

본 설명서의 나머지에서는, 설명이 한 쌍의 괄호 안에 있는 지정된 숫자로 식별되는 다양한 개별적인 출판물을 참조한다는 것을 밝힌다. 예컨대, 이러한 참조는 "참조[1]" 또는 단순히 "[1]"라고 함으로써 식별될 수 있다. 각각의 지정된 숫자에 대응되는 출판물의 목록은 상세한 설명 부분 뒤에서 찾을 수 있다.

필요한 것은, 공간적인 상관관계를 이용하고 고주파수 계수가 큰 값은 가지 지 않는 방법으로 비트 흐름(bit stream)이 인코딩될 수 있는, 예컨대 비디오 데이터와 같은 이미지 데이터를 인코딩하거나 디코딩하는 시스템과 방법이다. 이 시스템과 방법은 또한 계산적으로 효율적이어야한다.

본 발명은 이미지 데이터를 인코딩 및/또는 디코딩하는 코덱(codec)을 위한 시스템 및 방법을 대상으로 한다. 본 발명의 시스템 및 방법에서는 방향성 공간 예측이 종래의 리프팅 기반 웨이브렛 변환에 통합된다. 본 발명의 시스템 및 방법은 새롭고 효율적이며 유동적인 디지털 신호 처리(Digital Singnal Processing, DSP) 기반 기술을 제공한다. 본 발명의 시스템 및 방법의 DSP 리프팅은 대중적인 Haar, 5/3, 및 9/3 필터를 사용할 수 있으나, 다른 리프팅 방식에는 존재하지 않는 몇 가지 특징을 가진다. 예컨대, 각 리프팅 단계에서, 다른 리프팅 방식에서 그렇듯, 예측하거나 업데이트하는 신호들이 항상 수평 또는 수직적인 샘플로부터 오지 않는다. 고역 통과(high-pass) 계수의 크기를 감소하기 위해, 예측하거나 업데이트하는 신호들은 이미지 선형 모서리를 따라 선택할 수 있다. 또한, 정확한 공간 예측을 위해, 예측하거나 업데이트하는 신호는 아무 보간법으로나 계산될 수 있는 부분적인 샘플(fractional sample)로부터 올 수 있다. 즉, 본 발명의 DSP 리프팅 기술은 보간법에 제한을 두지 않는다. 나아가, 완벽한 복원을 보장하기 위해, 예측되고 업데이트된 신호는 정수로 표현된다. 또한, 2차원 변환이 두 개의 1차원 변환으로 나뉘어졌을 때, 두 개의 1차원 변환은 반드시 DSP 리프팅에서 수직이지 않다. 그러나 분리가 수평 및 수직 방향으로 실행되어 네 개의 직사각형 부대역을 생성한다.

본 인코딩 시스템의 한 실시예는 다음과 같이 동작한다. 하나의 2차원 신호가 시스템에 입력된다. 그 뒤 이 2차원 신호는 방향성 예측 및 리프팅 웨이브렛을 사용하여 변환된다. 더 구체적으로, 방향성 예측 및 리프팅 웨이브렛을 사용하는 2차원 신호의 변환은, 수직 방향으로의 1차원 웨이브렛 변환을 실행하는 것과 수평 방향으로의 1차원 웨이브렛 변환을 실행하는 것을 포함한다. 각각의 1차원 수직 및 수평 웨이브렛 변환은 그 뒤 짝수 및 홀수의 다상(polyphase) 샘플로 분리된다. 홀수 다상 샘플은, 이미지의 모서리를 따라 선택된 예측하는 신호들을 사용하여, 인접하는 짝수 다상 샘플들로부터 예측된다. 짝수 다상 샘플은 그 뒤 (예측된 잔여(predicted residue)라고도 불리는) 예측된 홀수 다상 샘플과 (잔여(residue)와 같은) 예측된 홀수 다상 샘플의 계수를 이용하여 업데이트되고, 업데이트된 짝수 다상 샘플은 출력되고 엔트로피 인코딩된다(entropy encoded). 엔트로피 인코딩된 계수는 그 뒤 비트 흐름으로 출력된다.

또한 본 발명의 시스템 및 방법은, 방향성 데이터를 효율적으로 추정하고 코딩하여 공간적 예측의 정밀도를 증가하고 부가 비트(overhead bit)를 감소하기 위한 기술을 사용한다. 이것이 본 발명의 DSP 리프팅 방식에서 높은 성능을 달성하는 주요 포인트이다. 본 발명의 한 실시예의 인코딩/디코딩 방식은 JPEG2000 방식의 코덱에 구현되었으며, 여기에서 DSP 리프팅은 종래의 리프팅을 대체한다.

방금 설명된 이득 외 본 발명의 다른 장점은, 동반하는 도면과 함께 보았을 때, 이하 상세한 설명으로부터 자명해질 것이다.

본 발명의 바람직한 실시예의 이하 설명에서는, 이것의 일부를 이루고 본 발명이 실행될 수 있는 구체적인 실시예의 설명의 통해 보여지는, 동반하는 도면이 참조된다. 물론 다른 실시예가 사용될 수도 있으며, 본 발명의 범위에서 벗어나지 않는 구조적인 변화가 있을 수도 있다.

1.0 예시적인 조작 환경(operating environment)

도 1은 본 발명이 구현될 수 있는 적당한 컴퓨팅 시스템(computing system) 환경(100)의 예를 도시한다. 컴퓨팅 시스템 환경(100)은 단지 적당한 컴퓨팅 환경의 한 예일 뿐이며, 본 발명의 사용 범위나 기능성에 어떠한 제한을 제안하는 것을 의도하지 않는다. 컴퓨팅 환경(100)은 또한 예시적인 조작 환경(100)에 도시된 요소 중 어느 하나 또는 이들의 조합과 관련된 어떤 종속성이나 요구사항이 있는 것으로 해석되어서도 안 된다.

본 발명은 수많은 다른 일반적인 목적이나 특수 목적 컴퓨팅 시스템 환경이나 구성에서 사용할 수 있다. 본 발명을 사용하는 데에 적합할 수 있는 잘 알려진 컴퓨팅 시스템, 환경 및/또는 구성은 개인용 컴퓨터, 서버 컴퓨터, 손에 들고 다니는(hand-held) 또는 랩탑(laptop) 장치, 멀티프로세서(multiprocessor) 시스템, 마이크로프로세서(microprocessor) 기반 시스템, 세트톱 박스(set top box), 프로그램 가능(programmable) 소비자 전자기기, 통신망 PC, 미니컴퓨터, 본체 컴퓨터(mainframe computer), 상기 시스템이나 장치 중 아무 것이나 포함하는 분산(distributed) 컴퓨팅 환경, 그리고 이와 비슷한 것들을 포함하지만, 이것에 제한되어있지는 않다.

본 발명은 컴퓨터에 의해 실행되는 프로그램 모듈과 같은 컴퓨터 실행가능한 명령의 일반적인 문맥에서 설명될 수 있다. 일반적으로, 프로그램 모듈은 특정 임무를 수행하거나 특정 추상 데이터형(abstract data type)을 구현하는 루틴(routine), 프로그램, 객체(object), 요소(component), 자료 구조(data structure 등을 포함한다. 본 발명은 또한 통신 통신망를 통해 연결되어 있는 원격 처리 장치(remote processing device)에 의해 임무가 수행되는 분산 컴퓨팅 환경에서도 사용될 수 있다. 분산 컴퓨팅 환경에서 프로그램 모듈은 메모리 저장 장치를 포함하는 국부적이거나 원격인 컴퓨터 저장 매체 모두에 위치할 수 있다.

도 1을 참조하면, 본 발명을 구현하는 예시적인 시스템은 컴퓨터(110) 형태의 일반적인 목적을 가지는 컴퓨팅 장치를 포함한다. 컴퓨터(110)의 요소들은 처리 장치(processing unit, 120), 시스템 메모리(130), 및 시스템 메모리를 포함하는 다양한 시스템 요소들을 커플링 시켜주는 시스템 버스(121)를 포함하지만 이것에 제한되지는 않는다. 시스템 버스(121)는 메모리 버스나 기억 제어기(memory controller), 주변 장치 버스(peripheral bus), 및 다양한 아무 버스 구조나 사용하는 국부적인 버스를 포함하는 아무 버스 구조나 가질 수 있다. 예로서, 이러한 구조는 업계 표준 구조(Industry Standard Architecture, ISA) 버스, 마이크로 채널 구조(Micro Channel Architecture, MCA) 버스, 확장 업계 표준 구조(Enhanced ISA, EISA) 버스, 비디오 전자 기기 표준 협회(Video Electronics Standards Association, VESA) 로컬 버스, 및 메자닌(Mezzanine) 버스라고도 알려진 주변 장치 요소 직접 접속(Peripheral Component Interconnect, PCI) 버스를 포함하지만, 여기에 제한되지는 않는다.

컴퓨터(110)는 일반적으로 다양한 컴퓨터 판독 가능 매체(computer readable media)를 포함한다. 컴퓨터 판독 가능 매체는, 컴퓨터(110)에 의해 접근가능한 아무 가용 매체일 수 있고, 휘발성(volatile)과 불휘발성(nonvolative) 매체, 분리 가능(removable)과 불리 불가능(non-removable) 매체를 모두 포함한다. 예로서, 컴퓨터 판독 가능 매체는 컴퓨터 저장 매체와 통신 매체로 이루어질 수 있지만, 이것에 제한되지는 않는다. 컴퓨터 저장 매체는, 컴퓨터 판독 가능 명령, 자료 구조, 프로그램 모듈, 또는 다른 데이터와 같은, 정보의 저장을 위해 아무 방법이나 기술로 구현된 휘발성(volatile)과 불휘발성(nonvolative) 매체, 분리 가능(removable)과 불리 불가능(non-removable) 매체를 모두 포함한다. 컴퓨터 저장 매체는 RAM, ROM, EEPROM, 플래시 메모리, 또는 다른 메모리 기술, CD-ROM, 디지털 비디오 디스크(digital versatile disk, DVD), 또는 다른 광디스크 저장 장치, 자기 카세트, 자기 테이프, 자기 디스크 저장 장치, 또는 다른 자기 저장 장치, 또는 원하는 정보를 저장하는 데에 사용될 수 있고 컴퓨터(110)가 접근할 수 있는 다른 어떤 매체를 포함하지만 여기에 제한되지는 않는다. 통신 매체는 일반적으로, 컴퓨터 판독 가능 명령, 자료 구조, 프로그램 모듈, 또는 다른 데이터를, 반송파(carrier wave)나 다른 전달 기법과 같은 변조된 데이터 신호에 구현한다. "변조된 데이터 신호"라는 용어는, 신호에 있는 정보를 인코딩하기 위한 방식으로, 하나 또는 여러 개의 특성이 정해지거나 변화된 신호를 뜻한다. 예컨대, 통신 매체는 연결 통신망(wired network) 또는 직접 연결(direct-wired connection)과 같은 연 결 매체(wired media) 및 음향, RF, 적외선 및 다른 무선 매체와 같은 무선 매체를 포함하지만, 이것에 제한되지는 않는다. 상기 언급된 것들의 조합 또한 컴퓨터 판독 가능 매체의 범위에 포함되어야 한다.

시스템 메모리(130)는 읽기용 기억 장치(read only memory, ROM, 131) 및 막기억 장치(random access memory, RAM, 132)와 같은 휘발성 및/또는 불휘발성 메모리 장치 형태를 가지는 컴퓨터 저장 매체를 포함한다. 시동할 때와 같은 때에 컴퓨터(110)내의 요소들 간에 정보를 전달하는 것을 돕는 기본적인 루틴을 포함하는 기본 입출력 체계(basic input/output system, BIOS, 133)는 일반적으로 ROM(131)에 저장된다. RAM(132)는 일반적으로, 처리장치(120)에게 즉시 접근 가능하고/하거나 현재 처리장치(120)에 의해 작동되고 있는 데이터 및/또는 프로그램 모듈을 포함한다. 예로서, 도 1은 운영 체계(134), 응용 프로그램(135), 다른 프로그램 모듈(136), 및 프로그램 데이터(137)를 나타내지만, 이에 제한되지는 않는다.

컴퓨터(110)는 또한 다른 분리 가능/분리 불가능, 휘발성/불휘발성 컴퓨터 저장 매체를 포함할 수 있다. 오로지 예시로서, 도 1은, 분리 불가능, 불휘발성 자기 매체로부터 읽거나 이에 쓰는 하드 디스크 드라이브(141), 분리 가능, 불휘발성 자기 디스크(152)로부터 읽거나 이에 쓰는 자기 디스크 드라이브(151), 및 CD ROM이나 다른 광 매체(optical media)와 같은 분리 가능, 불휘발성 광 디스크(156)로부터 읽거나 이에 쓰는 광 디스크 드라이브를 보여준다. 예시적인 조작 환경에서 사용될 수 있는 다른 분리 가능/분리 불가능, 휘발성/불휘발성 컴퓨터 저장 매체는 자기 테이프 카세트, 플래시 메모리 카드, 디지털 비디오 디스크, 디지털 비 디오 테이브, 고체 상태의(solid state) RAM, 고체 상태의 ROM, 그리고 이와 비슷한 것들을 포함하지만 이에 제한되지는 않는다. 하드 디스크 드라이브(141)는 일반적으로 인터페이스(interface, 140)와 같은 분리 불가능 메모리 인터페이스를 통해 시스템 버스(121)에 연결되어 있으며, 자기 디스크 드라이브(151)와 광 디스크 드라이브(155)는 인터페이스(150)와 같은 분리 가능 메모리 인터페이스를 통해 시스템 버스(121)에 연결되어 있다.

상기 기술되고 도 1에 나타난 드라이브와 이와 관련된 컴퓨터 저장 매체는 컴퓨터(110)를 위해, 컴퓨터 판독 가능 명령, 자료 구조, 프로그램 모듈, 및 다른 데이터의 저장을 제공한다. 예컨대, 도 1에서 하드 드라이브(141)는 운영 체계(144), 응용 프로그램(145), 다른 프로그램 모듈(145), 및 프로그램 데이터(147)을 저장하는 것으로 나타난다. 이 요소들은 운영 체계(134), 응용 프로그램(135), 다른 프로그램 모듈(136), 및 프로그램 데이터(137)과 같을 수도 있고 다를 수도 있다는 것을 주의해야한다. 운영 체계(144), 응용 프로그램(145), 다른 프로그램 모듈(145), 및 프로그램 데이터(147)에는, 최소한 이들이 다른 카피(copy)라는 것을 나타내기 위해 다른 번호가 주어졌다. 사용자는 키보드(162)와 일반적으로 마우스, 트랙 볼, 또는 터치패드로 불리우는 위치 지정 도구(pointing device)와 같은 입력 장치를 통해 컴퓨터(110)에 명령과 정보를 입력할 수 있다. (나타나지 않은) 다른 입력 장치로는 마이크, 조이스틱, 게임 패드, 위성 전파 수신 안테나(satellite dish), 스캐너, 그리고 이와 비슷한 것들이 포함될 수 있다. 이것들과 이 밖의 입력 장치들은 흔히 시스템 버스(121)에 커플링된 사용자 입력 인터페이스 (160)를 통해 처리 장치(120)에 연결되어 있지만, 병렬 접속구(parallel port), 게임 접속구, 또는 범용 직렬 버스(universal serial bus, USB)와 같은 다른 인터페이스 및 버스 구조로 연결되어 있을 수도 있다. 모니터(191)나 다른 종류의 디스플레이 장치(display device) 또한 비디오 인터페이스(190)과 같은 인터페이스를 통해 시스템 버스(121)에 연결되어 있다. 모니터 외에도, 컴퓨터는 스피커(197)와 프린터(196)와 같은, 다른 주변 출력 장치도 포함할 수 있으며, 이것은 출력 주변 장치 인터페이스(195)를 통해 연결되어 있을 수 있다. 본 발명에 특히 중요한 것으로, 일련의 이미지(164)를 포착할 수 있는 (디지털/전자 정지 또는 비디오 카메라나 필름식(film)/사진식(photographic) 스캐너와 같은) 카메라(163)도 개인용 컴퓨터(110)의 입력 장치로서 포함될 수 있다. 나아가, 오직 한 개의 카메라만이 도시되어 있지만, 다수의 카메라가 개인용 컴퓨터(110)의 입력 장치로서 포함될 수 있다. 한 개 또는 여러 개의 카메라로부터의 이미지(164)는 적합한 카메라 인터페이스(165)를 통해 컴퓨터(110)에 입력된다. 이 인터페이스(165)는 시스템 버스(121)에 연결되어 있어서 RAM(132)이나 컴퓨터(110)과 관련있는 다른 데이터 저장 장치 중 하나로 경로가 배정되고(routed) 이곳에 저장되는 것을 가능케 한다. 그러나 카메라(163)의 사용을 필요로 하지 않고도, 상기 언급된 컴퓨터 판독 가능 매체로부터 이미지 데이터가 컴퓨터(110)에 입력될 수도 있다는 것을 주의하여야 한다.

컴퓨터(110)은 원격 컴퓨터(180)와 같은 한 개 또는 여러 개의 원격 컴퓨터로의 논리적 연결(logical connection)을 이용하여 통신망 환경(networked environment)에서 작동할 수 있다. 원격 컴퓨터(180)는 개인용 컴퓨터, 서버, 라우터, 통신망 PC, 동등 장치(peer device), 또는 다른 일반적인 통신망 노드(node)일 수 있고, 비록 도 1에는 메모리 저장 장치(181)만이 나타나 있지만, 일반적으로 컴퓨터(110)와 관련하여 상기 설명된 여러 개의 또는 모든 요소들을 포함한다. 도 1에 도시된 논리적 연결은 구내 정보 통신망(local area network, LAN, 171)과 원거리 정보 통신망(wide area network, WAN, 173)을 포함하지만, 다른 통신망도 포함할 수 있다. 이러한 통신망 환경은 사무실, 회사 전체에 걸친 통신망, 인트라넷(intranet), 그리고 인터넷(Internet)에서 흔하다.

LAN 통신망 환경에서 사용되었을 때, 컴퓨터(110)은 통신망 인터페이스나 정합기(adapter, 170)를 통해 LAN(171)에 연결되어 있다. WAN 통신망 환경에서 사용되었을 때, 컴퓨터(110)는 인터넷과 같은 WAN(173)을 통한 통신을 구축하기 위해 일반적으로 모뎀(172)이나 다른 수단을 포함한다. 내부적일 수도 있고 외부적일 수도 있는 모뎀(172)은 사용자 입력 인터페이스(160)나 다른 적절한 기법을 통해 시스템 버스(121)에 연결되어 있을 수 있다. 통신망 환경에서는 컴퓨터(110)와 관련하여 도시된 프로그램 모듈이나 이것의 부분은 원격 메모리 저장 장치에 저장될 수 있다. 예로서, 도 1은 원격 응용 프로그램(185)이 메모리 장치(181)에 존재하는 것으로 나타내지만, 이에 한정되지는 않는다. 보여진 통신망 연결이 예시적이며 컴퓨터 간의 통신 링크를 구축하기 위한 다른 수단이 사용될 수 있음이 인식될 것이다.

이제 예시적인 조작 환경이 설명된 이상, 이 설명 부분의 나머지는 본 발명 을 구현하는 프로그램 모듈의 설명에 바칠 것이다.

2.0 하이브리드 방향성 예측 및 리프팅 웨이블릿을 채용한 이미지 코딩을 위한 시스템 및 방법

아래 문단에서는 본 발명의 이미지 코딩 시스템 및 방법이 더 자세히 설명된다. 종래의 리프팅 기술과 함께 본 발명의 개요가 제공된다. 그 뒤 본 발명의 방향성 예측 및 리프팅 기술이 종래의 리프팅에 대해 대조되고 구체화된다. 보간법, 예측 각도 추정 및 인코딩도 설명된다. 마지막으로, 본 발명의 예시적인 작동하는 실시예 또한 설명된다.

2.1 발명 개요

도 2에는 본 발명의 시스템 및 방법의 개요가 나타나있다. 프로세스 액션(process action, 202)에 나타나듯, 이미지를 나타내는 2차원 신호가 시스템에 입력된다. 그 뒤 이 2차원 이미지는, 프로세스 액션(204)에 나타나고 도 3에서 구체화되듯, 이미지의 모서리와 리프팅 웨이브렛을 바탕으로 방향성 예측을 이용해 변환된다. 그 뒤 변환의 계수는 출력되고(프로세스 액션(206)) 엔트로피 코딩된다(프로세스 액션(208)). 엔트로피 코딩된 계수는 그 뒤 프로세스 액션(210)에 나타나듯 비트 흐름으로 출력된다.

도 3에 나타나듯, 방향성 예측 및 리프팅 웨이브렛을 사용하는 2차원 신호의 변환은, 수직 방향으로의 1차원 웨이브렛 변환을 실행하는 것(프로세스 액션(301))과 수평 방향으로의 1차원 웨이브렛 변환을 실행하는 것(프로세스 액션(304))를 포함한다. 이 두 가지 프로세스 액션은 순서가 바뀔 수 있음을 주의한다.

프로세스 액션(302, 304)의 자세한 사항은 다음과 같다. 프로세스 액션(306)에 나타나듯, 첫 번째 1차원 웨이브렛 변환은 수직 방향을 따라 짝수와 홀수 다상 샘플로 분리된다(프로세스 액션 306). "예측된 잔여" 또는 홀수 다상 샘플은, 이미지의 모서리를 따라 선택된 예측하는 신호를 사용하여, 인접하는 짝수 다상 샘플로부터 예측된다(프로세스 액션 308). 그 뒤 짝수 다상 샘플은 예측된 홀수 다상 샘플을 이용하여 업데이트되며, 여기에서 업데이트하는 신호는 이전의 예측 단계와 같은 방향을 따라 선택된다(프로세스 액션 310).

유사하게, 두 번째 1차원 웨이브렛 변환은 수평 방향을 따라 짝수와 홀수 다상 샘플로 분리된다(프로세스 액션 312). "예측된 잔여" 또는 홀수 다상 샘플은, 이미지의 모서리를 따라 선택된 예측하는 신호를 사용하여, 인접하는 짝수 다상 샘플로부터 예측된다(프로세스 액션 314). 그 뒤 짝수 다상 샘플은 예측된 홀수 다상 샘플을 이용하여 업데이트되며, 여기에서 업데이트하는 신호는 이전의 예측 단계와 같은 방향을 따라 선택된다(프로세스 액션 316). 그 뒤, 도 2에 나타나듯, "예측된 잔여"의 계수와 업데이트된 다상 샘플이 출력된다.

본 발명의 시스템 및 방법은 방향성 공간 예측을 종래의 리프팅 기반 웨이브렛 변환에 통합하여 효율적이고 유동적인 DSP 리프팅 이미지 인코딩 기술을 제공한다. 본 발명의 어떤 실시예에서는 대중적인 Haar, 5/3 및 9/7 필터가 사용된다. 그러나 본 발명의 시스템 및 방법은 다른 리프팅 기법에서 이전에는 사용하지 않았던 다음의 특징을 가진다.

● 각 리프팅 단계에서, 예측하거나 업데이트하는 신호들이 항상 수평 또는 수직적인 샘플로부터 오지 않는다. 고역 통과(high-pass) 계수의 크기를 감소하기 위해, 이 신호들은 이미지 선형 모서리를 따라 선택할 수 있다.

● 정확한 공간 예측을 위해, 예측하거나 업데이트하는 신호는 존재하는 보간법으로 계산될 수 있는 부분적인 샘플(fractional sample)로부터 올 수 있다. 본 발명의 리프팅 기술은 보간법에 제한을 두지 않는다.

● 완벽한 복원을 보장하기 위해, 예측되고 업데이트된 신호는 항상 정수의 위치에 있다.

● 2차원 변환이 두 개의 1차원 변환으로 나뉘어졌을 때, 두 개의 1차원 변환은 반드시 본 발명의 DSP 리프팅에 대해 수직이지 않다. 예컨대, 기존의 리프팅에서는 두 1차원 변환이 항상 수평 및 수직 방향으로 실행된다. 기본적으로 두 번째 1차원 변환은 첫 번째 변환에 수직이다. 그러나 많은 경우에, 만약 첫 번째 변환이 특정 방향을 따라 실행된다면, 두 번째 1차원 변환의 수직 방향은 최선의 예측이 아닐 수 있다. 본 발명에 따른 시스템 및 방법에서는 두 번째 변환이 최선의 예측 방향을 자유롭게 선택할 수 있고, 첫 번째 1차원 변환에 의해 제한받지 않는다. 그러나 짝수와 홀수 다상 샘플로의 샘플의 분리는 수평과 수직 방향으로 실행되어 네 개의 직사각형 부대역을 생성한다.

추가로, 본 발명의 시스템 및 방법은 또한 방향성 데이터를 효율적으로 추정하고 코딩하여 공간적 예측의 정밀도를 증가하고 부가 비트(overhead bit)를 감소하기 위한 기술을 사용한다. 이것이 본 발명의 DSP 리프팅 방식에서 높은 성능을 달성하는 주요 포인트이다. 본 발명의 한 실시예는 JPEG2000 방식의 코덱에 구현 되었으며, 여기에서 DSP 리프팅은 종래의 리프팅을 대체한다.

본 발명과 종래의 리프팅 기술의 차이를 충분히 이해하기 위해서, 이하 단락에서는 기존의 리프팅의 개요가 설명되고 대조된다.

2.2 통상적 리프팅의 개요

본 발명에 따른 시스템 및 방법에 관하여 논의하기 위한 출발점으로서 [23]에서 Daubechies 등에 의하여 제안된 통상적 리프팅을 검토하기로 한다. 종래의 웨이브렛/부대역 이미지 부호화 방안들에 존재하는 문제점을 명확하게 밝히고자 특수한 이미지를 사용한다. 웨이브렛 변환의 기본 아이디어는 대부분의 실제 신호들에 존재하는 상관 구조를 이용하여 희소 근사기법을 구축하는 것이다. 이웃하는 샘플들 및 주파수들은 멀리 떨어져 있는 것들보다 더 많이 상관되어 있다.

x(m,n) _m,n∈Z 를 2D 신호라 하자. 일반성을 잃지 않고서, 이 신호는 먼저 수직 방향의 1D 웨이브렛 변환으로 처리(예컨대, 수직 웨이브렛 분해가 이미지의 각 로우에 대해 수행된다)된 다음 수평 방향 처리(예컨대, 수평 웨이브렛 분해가 이미지의 각 컬럼에 대해 수행된다)된다고 가정한다. [23]에서 주어진 기법에 따라, 각 1D 웨이브렛 변환이 하나 또는 다수의 리프팅 단계로 팩터링될(factored) 수 있다. 공간 도메인 기법을 이용하여 주어진 신호를 분석 및 합성하기 위한 방법으로서 리프팅을 검토해볼 수 있다. 일반적으로, 전형적인 리프팅 단계는 세 가지 단계, 즉 분할(split), 예측(predict) 및 갱신(update)으로 구성된다. 분할 단계에서는, 입력 신호가 공통 원소를 갖지 않는 두 개의 세트, 즉 홀수 및 짝수 샘플들로 분리된 다. 예측 단계에서는, 짝수 샘플들을 이용하여 홀수 계수들을 예측한다. 홀수 계수들에서 이러한 예측된 값을 빼면 예측에 있어서의 에러를 찾을 수 있다. 갱신 단계에서는, 갱신 함수를 통과한 예측에 있어서의 에러와 짝수 계수들을 결합하여 짝수 계수들을 갱신한다. 이러한 리프팅 단계들은 역방향으로도 용이하게 이루어질 있다. 즉, 에러 예측의 계수들과 짝수 계수들의 갱신 결과로부터 원래의 신호를 재구성하는 것이 가능하다.

보다 구체적으로, 리프팅 단계들은 수직 1D 웨이브렛 변환과 관련하여 이하에서 더욱 상세히 설명된다.

먼저, 1D 수직 웨이브렛 변환의 모든 샘플들이 두 개의 부분, 즉 짝수 다상 샘플들 및 홀수 다상 샘플들로 분할된다.

예측 단계에서는, 그 홀수 다상 샘플들이 이웃하는 짝수 다상 샘플들로부터 예측된다. 예측된 나머지 h(m,n)는 다음 수학식에 의하여 계산된다.

이제부터 수직 변환에 관하여 논의할 것이므로, 각 x ₀ (m,n)의 예측은 m번째 컬럼에서의 이웃 짝수 계수들의 선형 조합, 즉 다음과 같다.

통상적 리프팅에 있어서 p _i 는 변수 m과 독립적이라는 점을 알 필요가 있다. 그러므로, 수학식 3의 충격 응답 함수는 1D 형태로 단순화, 즉 다음과 같이 될 수 있다.

여기서 z는 Z 도메인의 변수이고 p _i 는 웨이브렛 필터에 의하여 결정되는 예측 파라미터이다. 일반적으로, 단지 유한한 수의 계수 p _i 만이 0이 아닌 경우 FIR 웨이브렛 필터가 고려된다. 여기서 i _b 및 i _e 를 각각 최소 및 최대 정수 i라고 가정한다(p _i 는 0이 아님). 수학식 2의 계산 후에, x ₀ (m.n)을 그 예측된 나머지 h(m,n)으로 교체함으로써 x(m,n)의 새로운 표현이 획득된다. 이는 x(m,n)과 등가이다. 홀수 다상 샘플들의 예측과 예측된 나머지가 주어지면, 수학식 2에 의해 원래의 홀수 다상 샘플들을 완벽하게 재구성할 수 있다.

갱신 단계에서는, 짝수 다상 샘플들이 다음에 의해 교체된다.

여기서, U _h (m,n)은 m번째 컬럼에서의 이웃하는 예측된 나머지의 선형 조합이다.

마찬가지로, 수학식 6의 유한 충격 응답 함수는 다음과 같이 주어진다.

여기서, j _b 및 j _e 를 각각 최소 및 최대 정수 j라고 하자(u _j 는 0이 아님). u _j 는 웨이브렛 필터에 의하여 결정되는 갱신 파라미터이다. 이 단계는 역으로도 쉽게 이루어진다. l(m,n) 및 h(m,n)이 주어지면, 짝수 다상 샘플들을 완벽하게 재구성할 수 있다.

변수 p _i 및 u _i 는 필터링 파라미터이다. 0이 아닌 필터링 파라미터들의 수와 그 크기는 대개 이용되는 웨이브렛 필터에 따라 변화한다. 그러나, 각기 다른 필터들을 이용한 1D 리프팅-기반 변환은 도 4에 도시된 바와 같은 프레임워크에 의하여 공통적으로 기술될 수 있다. 도 4a는 순방향(forward) 리프팅-기반 변환이다. 도 4b는 역방향(inverse) 리프팅-기반 변환이다. 변수 K는 리프팅 단계의 수(Haar 및 5/3 필터에 있어서 K=1이고 9/7필터에 있어서 K=2)이다. 필터는 선형의 시간 불변 조작기이고 전적으로 그 충격 응답에 의하여 결정된다. 유한 충격 응답 필터 (FIR)는 단지 유한한 수의 필터 계수들만이 0이 아닌 경우에 해당한다. 본 발명의 DSP-리프팅 기법을 통상적 리프팅과 쉽게 비교하기 위하여, Harr, 5/3 및 9/7 필터의 FIR 함수는 다음과 같이 열거된다.

1D 수평 리프팅 변환은 수직 리프팅 변환과 관련하여 앞서 논의된 것과 동일한 방식으로 수행되지만, 이는 m차원에서 이루어진다. 앞서의 논의로부터, 수학식 3 및 수학식 6의 예측은 항상 수평 또는 수직 방향에서의 고역 계수들이나 이웃하는 정수 샘플들의 조합임을 알 수 있다. 부호화된 이미지가 수평도 수직도 아닌 많은 모서리들을 갖는 경우, 다음과 같은 문제가 발생한다.

문제를 명확하게 설명하기 위하여, 2D 웨이브렛 변환에 있어서 도 5a에 도시 된 바와 같은 특수한 이미지를 이용한다. 이는 4개의 로우 블록들로 이루어진다. 즉, 제1 행에는 수평 줄무늬를 갖는 4개의 정방형 블록들, 제2 행 및 제4 행에는 경사진 줄무늬를 갖는 4개의 정방형 블록들, 그리고 제3 행에는 수직 줄무늬를 갖는 4개의 정방형 블록들을 갖는다. 통상적 2D 리프팅 변환 이후에, 도 5b 내지 도 5e에 도시된 4개의 부대역이 발생한다. 이들 부대역은 2D 웨이브렛을 저역 통과 및 고역 통과 필터 양자를 통과시킴으로써 얻어진다. 먼저, 2D 웨이브렛은 저역 통과 계수들에 의하여 정의되는 이미지 및 고역 통과 계수들에 의하여 정의되는 이미지를 야기하는 수직 1D 변환에 의하여 처리된다. 그런 다음 저역 통과 계수들 및 고역 통과 계수들에 의하여 정의되는 이미지를 야기하는 수평 1D 변환에 의하여 처리된다. 이들 4개의 이미지는 그 4개의 도시된 부대역으로 조합된다. 저-고(low high:LH) 부대역에서는, 수평 변환에 의하여 제1 행만이 완전히 소거된다. 고-저(high-low:HL) 부대역에서는, 수직 변환에 의하여 제3 행만이 완전히 소거된다. 고-고(high-high:HH) 부대역에서는, 수직 및 수평 변환 이후 경사진 줄무늬를 갖는 행들만이 남는다. 그러한 고역 부대역들이 더 많은 텍스처 정보를 갖는다는 점을 분명하게 알 수 있다. 이는 비트율이 낮은 경우 낮은 부호화 효율 및 조악한 시각적 품질을 야기할 것이다.

2.3 본 발명에 따른 하이브리드 방향 예측 및 리프팅 웨이브렛을 이용한 이미지 부호화 시스템 및 방법에 있어서의 리프팅 구조

본 발명에 따른 시스템 및 방법에 있어서, 통상적 리프팅과 DSP 리프팅 간의 근본적 차이는 수학식 3 및 7에 있다. 통상적 리프팅에서는 항상 수평 또는 수직 방향의 예측을 수행하지만, 본 발명의 DSP 리프팅 기법에서는 국부적 공간 상관을 이용한다. 도 6에 도시된 바와 같이, 화소들은 각도 θ _v 의 강한 상관을 갖는다고 가정하면, 전(integer) 화소는 " "라는 표시자로 표현되고, 반(half) 화소는 "×"라는 표시자로 표현되며, 사반(quarter) 화소는 "+"라는 표시자로 표현된다. 본 발명의 DSP 리프팅 시스템 및 방법에 있어서, x(m,2n+1)의 예측은 도 6에서 화살표로 표시되는 짝수 다상 샘플들로부터 이루어진다. 이들은 다음과 같이 계산된다.

여기서, tg()=sin()/cos()이다.

대응하는 유한 충격 응답 함수는 다음과 같다.

예측은 항상 짝수 다상 샘플들로부터 계산되므로, 방향각이 알려지면, DSP 리프팅은 수학식 2에 의하여 홀수 다상 샘플들을 완벽하게 재구성할 수 있다.

갱신 단계에서, 본 발명의 DSP 리프팅 기법은 각도 데이터를 부호화하는데 필요한 비트 수를 최소화하기 위하여 예측 단계에서와 동일한 방향각을 이용한다. 그러므로, 짝수 다상 샘플들의 예측은 다음과 같다.

대응하는 유한 충격 응답 함수는 다음과 같다.

명백하게, 이는 완벽한 재구성을 보장한다.

본 발명의 DSP 리프팅 시스템 및 방법은, 도 6에 도시된 프레임워크에 의해 마찬가지로 개시될 수 있는, 각기 다른 웨이브렛 필터와 함께 이용될 수 있다. 제안된 Haar, 5/3 및 9/7 필터의 FIR 함수는 다음과 같다.

수식 (8), (9) 및 (10)과 비교하면, 종래의 리프팅은 본 발명의 DSP 리프팅에서

가 0인 특별한 경우로 볼 수 있다. 특히, 1차원 웨이브렛 변환이 리프팅 단계보다 좀 더 분해되는 경우(예컨대, 9/7 필터),

를 0으로 설정하면 이전의 리프팅 단계가 방향성 상관관계를 제거하기 때문에 제1 리프팅 단계를 제외한 다른 단계들에서는 공간적 예측이 불가능해질 수 있다.

상기 논의는 본 발명의 DSP 리프팅에서 1차원 수직 변환과 관련되었다. 수평 변환은

차원에서 유사한 방식으로 수행된다. 수평 변환에서 분해에 최적인 방향을 찾기 위해 수평 변환의 방향성 각도

가 수직인

가 될 필요가 없음을 주목할 필요가 있다.

도 8은 본 발명의 DSP 리프팅 분해 후 결과를 도시한 것이다. 수직 변환 후 HL 부대역에는 수평 스트라이프를 갖는 행만이 남게 된다. 수직 및 수평 변환 후 HH 부대역에는 어떤 행도 남지 않는다. 수직 변환 후 다운 샘플링(down-sampling) 프로세스를 하기 때문에, 본 발명의 DSP 리프팅 기술은 정확한 예측 방향을 찾지 못할 수 있다. 그러나 그 경우에도 LH 부대역의 에너지는 종래 리프팅 분해에서 LH 부대역의 에너지보다는 훨씬 더 적다.

2.4 보간(Interpolation)

정확한 공간적 예측을 위하여, 본 발명의 DSP 리프팅은 방향성 각도가 부분 픽셀들을 가리키도록 허용한다. 다시 말해서, 수식 (12) 및 (13)에 사용된

는 정수가 아닐 수 있다. 따라서 이 경우 보간 기술이 요구된다.

도 6에 도시된 바와 같이, x(m, 2n+1)의 예측은 x(m-1, 2n+2)와 x(m, 2n+2) 사이 및 x(m,2n)과 x(m+1,2n) 사이의 반 픽셀들을 이용한다. 일반적으로, 그러한 반 픽셀들의 값은 이용가능하지 않다. 보간은 부분 픽셀의 값을 계산하는 방법이다. 많은 방법들이 있는데, 예를 들자면 선 1은 다음과 같다.

y = (x(m-1, 2n+2) + x(m, 2n+2)+1) >> 1

보간 기술은 일 예로서 수식(12)를 사용하여 논의된다. 먼저, 완벽한 재구성을 위하여 부분 픽셀의 보간에 사용될 정수 픽셀들은

에 속해야 한다. 이 기술은

으로부터의 임의의 정수 픽셀은 사용할 수 없다. 보간은 일반적으로 아래와 같이 기술될 수 있다.

여기에서 k는

근처의 정수이고,

는 보간 필터의 파라미터이다. 수식 (18)의 z 변환 후 다음이 얻어진다.

파라미터

는 0이 아닌 계수를 유한 개수로 갖는다. 이 실시예에서,

의 값을 결정하는 것으로 인기 있는 Sinc 보간 방법을 채택하였다. 수식 (14)의 보간도 동일한 방식으로 수행된다.

2.5 방향 추정

각 샘플의 방향성 각도

및

는 주어진 블록 크기에 대해, 예컨대 16×16 블록에서 국지적으로 추정된다. 도 8에 도시된 바와 같이, 16×16 블록은 16×16(도 9A), 8×8(도 9B) 및 4×4(도 9C)의 세 가지 모드로 분할될 수 있다. 16×16 모드에서, 모든 픽셀들은 동일한 방향성 각도를 갖는다. 4×4 모드에서, 각 블록은 16개의 방향성 각도를 가지며, 4×4 서브블록의 모든 픽셀들은 동일한 각도를 공유한다. 또한, 예측된 각도가 정교할 수록 공간적 예측이 더 정확해 진다. 비디오 코딩의 모션 보상에 대한 지식으로부터, 본 발명의 이 실시예에서는 1/4 픽셀까지의 예측 정밀도를 택하기로 한다.

이미지에서 일반적인 각도 추정 프로세스가 도 10에 도시되어 있다. 프로세 스 동작(1002, 1004 및 1006)에 도시된 바와 같이, 이미지의 각 매크로블록에 있어서, 수직 방향의 최적 예측 각도 및 모드가 다양한 블록 크기 및 후보 각도들로부터 찾아진다. 다음으로 1차원 수직 변환이 수행된다(프로세스 동작(908)). 프로세스 동작(1010, 1012 및 1014)에 도시된 바와 같이, 이미지의 각 매크로블록에 있어서, 수평 방향의 최적 예측 각도 및 모드가 다양한 블록 크기 및 후보 각도들로부터 찾아진다. 다음으로 프로세스 동작(1016)에 도시된 바와 같이 1차원 수직 변환이 수행된다.

도 11은 매크로블록에서 각도 및 모드 추정 프로세스를 도시한다. 프로세스 동작(1102, 1104, 1106)에 도시된 바와 같이, 16×16 매크로블록에서 최적 각도, 8×8 매크로블록에서 최적 각도 및 4×4 서브블록에서 최적 각도가 찾아진다. 다음으로 블록 모드 레벨에서의 이러한 세 개의 최적 각도들을 기초로 최적 모드가 찾아진다(프로세스 동작(1108)). 최적 각도 및 모드를 결정하기 위한 기준은 수직 및 수평 변환에 대한 수식 (20) 및 (21)에서 주어진다.

각 16×16 블록에 대한 예측된 모드 및 방향성 각도들을 결정하기 위한 R-D 알고리즘이 제안된다. 수직 리프팅 변환에서 모드와 방향성 각도들을 추정하기 위한 기준은 다음과 같다.

여기에서,

은 수직 변환후 고역 통과(high-pass) 계수들로서, 수 식 (2)에서 계산될 수 있다.

는 이 모드와 방향성 각도들을 코딩하기 위한 비트들이고,

는 라그랑지에(Lagrangian) 인수이고,

는

의 좌측상단 픽셀의 좌표이다.

추정된 방향성 데이터를 가지고 수직 리프팅 변환을 수행한 결과, 저역 통과 신호

과 고역 통과 신호

을 얻을 수 있다. 이들은 계속하여 수평 변환으로 처리된다. 일반적으로

은 적은 에너지를 갖는다. 수직 분해 이후에 고역 통과 부대역을 수평으로 변환하기 위해 예측된 모드들 및 각도들의 다른 세트를 사용할 필요는 없다. 따라서

이 수평 방향에서 분해된다.

을 분해하기 위한 예측된 모드들 및 각도들의 다른 세트가 있는데, 이들은 수직 분해에서 사용한 것들과 다른 것일 수 있다. 새로운 기준은 다음과 같다.

여기에서

은 LH 부대역의 계수이다.

는 모드 및 방향성 각 도들을 코딩하기 위한 비트들이다.

는 라그랑지에 인수이고,

는

의 좌측상단 픽셀의 좌표이다.

2.5 방향성 각도 코딩

방향성 각도들은 고정 가변 길이 코딩(VLC) 표를 이용하되 적응 매핑 방식으로 코딩된다. 도 12에 도시된 바와 같이, 현재 블록의 각도(c)가 코딩된다고 가정한다. 이웃 블록들의 각도들(a, b 및 d)은 코딩된 각도를 예측할 준비가 된다. 어느 각도가 예측치로 이용될지 선택하기 위하여 다음의 기준을 사용한다.

다시 말해서, 각도들(b와 d)의 차가 더 큰 경우, 각도(a)가 예측치로 이용되고, 반대의 경우 각도(d)가 예측치로 이용된다.

VLC 표의 심볼들은 예측된 각도에 따라 적응적으로 할당된다. 예측된 각도는 가장 짧은 심볼로서 주어지며, 다른 각도들은 그 각도들과 예측된 각도의 차의 절대값에 따라 짧은 심볼에서 긴 심볼의 순서로 할당된다. 그 후, 현재 각도(c)는 소정의 표에 따라 코딩된다.

2.7 본 발명에 따른 시스템 및 방법의 예시적인 애플리케이션들

제안된 DSP 리프팅은 이미지 코딩뿐 아니라, 다른 많은 분야들에도 적용될 수 있다. 이하에서, 본 발명의 시스템 및 방법의 두 가지 예시적인 애플리케이션 들이 논의된다: 하나는 공간 확장형 비디오 코딩(spatial scalable video coding) 이고 다른 하나는 저지연(low-delay) 웨이브렛 비디오 코딩이다.

2.7.1 공간 확장형 비디오 코딩

공간 확장성은 특히 무선 네트워크와 휴대용 장치들의 증가와 함께 비디오 코딩에서 상당히 요구되는 특징이다. 이는 해결하기 어려운 문제이다. 많은 연구자들이 공간 확장성이 코딩 효율성을 상당히 저하시킬 수 있음을 보여왔다. 공간 확장성을 달성하기 위한 해결책 중 하나는 먼저, 비디오 시퀀스를 수 개의 4가지 저해상도 시퀀스로 분해한 다음, 분해된 시퀀스들을 결합하여 또는 따로 코딩하는것이다. 그러나 이러한 시퀀스의 고역 통과 시퀀스는 현재의 모션 보상 방식으로는 압축하기 곤란하다. 본 발명의 DSP 리프팅 기술을 사용하면, 방향성 공간 변환으로 픽셀들 간의 상관관계가 상당히 제거되기 때문에 고역 통과 시퀀스가 훨씬 더 적은 에너지를 갖는다. 고역 통과 시퀀스 각각은 인트라 코딩을 이용하여 압축된다.

2.7.2 저지연 (Low-delay) 3D 웨이브렛 비디오 코딩

MPEG은 확장 가능형 비디오 코딩에 대한 제안을 청하였다. 제안된 방식의 대부분은 일시적 웨이브렛 분해(temporal wavelet decomposition)를 이용한다. 이 방식들의 큰 문제는 다중-계층 분해 때문에 지연이 상당히 크다는 것이다. 이는 저지연 및 실시간 애플리케이션으로부터의 요구 사항을 만족시킬 수 없다. 본 발명에서 제안된 DSP-리프팅으로, 3D 웨이브렛 비디오 코딩 방식은 일시적 분해의 수를 감소시킬 수 있다. 저대역 프레임들(low-band frames) 간의 상관관계들은 방향 성 공간 예측에 의해 제거될 수 있다.

본 발명에 대해 상술한 설명은 예시 및 설명을 위해 제시된 것이다. 본 발명을 망라하거나 정확하게 개시된 형태로 본 발명을 제한하고자 함이 아니다. 상기 본 발명의 교시에는 많은 수정 및 변경이 가능하다. 본 발명의 범위는 본 상세한 설명에 의해 제한되는 것이 아니며, 첨부되는 특허청구범위에 의해 제한되고자 함이다.

참조문헌:

[1] A. Habibi, R. S. Hershel, "A unified representation of differential pulse-code modulation (DPCM) and transform coding systems", IEEE trans. on communications, vol. 22, no 5, 692-696, 1974년.

[2] W. B. Pennebaker 및 J. L. Mitchell, "JPEG still image data compression standard", New York: Van Nostrand, 1993년.

[3] E. Feig, H. Peterson, V. Ratnakar, "Image compression using spatial prediction", ICASSP, vol. 4, 2339-2342, 1995년.

[4] H. Kondo, Y. Oishi, "Digital image compression using directional sub-block DCT", International Conference on Comm. Technology, vol. 1, 21-25, 2000년.

[5] J. M. Shapiro, "Embedded image coding using zerotree of wavelet coefficients", IEEE trans. Signal Processing, vol. 41, no 12, 3445-3462, 1993년.

[6] A. Said 및 W. A. Pearlman, "A new fast and efficient image codec based on set partitioning in hierarchical trees", IEEE trans. on CSVT, vol. 6, no 3, 243-250, 1996년.

[7] D. Taubman 및 M. Marcellin, "JPEG2000: Image Compression Fundamentals, Standards, and Practice", Kluwer Academic Publishers, 2001년.

[8] A. Ikonomopoulos 및 M. Kunt, "High compression image coding via directional filtering", Signal Processing, vol. 8, no 2, 179-203, 1985년.

[9] H. Li 및 Z. He, "Directional subband coding of images", ICASSP, vol. 3, 1823-1826, 1989년.

[10] R. H. Bamberger, M. Smith, "A filter bank for the directional decomposition of images: theory and design", IEEE trans. on Signal Processing, vol. 40, no 4, 882-893, 1992년.

[11] R. H. Bamberger, M. Smith, "Narrow band analysis of a filter bank for the directional decomposition of images", ICASSP, vol. 3, 1739-1742, 1990년.

[12] R. H. Bamberger, M. Smith, "A comparison of directionally-based and nondirectionally-based subband image coders", in Proc. SPIE, VCIP, 1605, vol.2, 757-768, 1991년.

[13] E. J. Candes, "Monoscale ridgelets for the representation of images with edges", Dept. Statistic, Stanford Univ., Tech. Reporter, 1999년.

[14] E. J. Candes and D. L. Donoho, "Curvelets", Available: http://www-stat.stanford.edu/~donoho/reports/1999/curvelets.pdf.

[15] B. Mahesh 및 W. A. Pearlman, "Hexagonal sub-band coding for inages", ICASSP, vol. 3, 1953-1956, 1989년.

[16] D. Taubman 및 A. Zakhor, "Orientation adaptive subband coding of images", IEEE trans. on Image Processing, vol. 3, no 4, 421-437, 1994년.

[17] D. Wang, L. Zhang 및 A. Vincent, "Curved wavelet transform for scalable video coding", ISO/IEC JTC1/SC29/WG11, MPEG doc M10535, Munich, 2004년.

[18] C. N. Zhang 및 X. Wu, "A hybrid approach of wavelet packet and directional decomposition for image compression", IEEE Canadian Conf. on Electrical and Computer Engineering, vol. 2, 755-760, 1999년.

[19] P. Carre, E. Andres, C. F. Maloigne, "Discrete rotation for directional orthogonal wavelet packets", ICIP, vol. 2, 257-260, 2001년.

[20] N. V. Boulgouris, D. Tzovaras, M. G. Strintzis, "Lossless image compression based on optimal prediction, adaptive lifting, and conditional arithmetic coding", IEEE trans. on Image Processing, vol. 10, no. 1, 1-14, 2001년.

[21] M. Vetterli 및 J. Kovacevic, "Wavelets and subband coding", Prentice Hall Englewood Cliffs, NJ 1995년.

[22] T. Wiegand, G. J. Sullivan, G. Bjntegaard, A. Luthra, "Overview of the H.264/AVC video coding standard", IEEE trans. CSVT, vol. 13, no. 7, 2003년.

[23] I. Daubechies 및 W. Sweldens, "Factoring wavelet transforms into lifting steps", Journal of Fourier Anal. Appl., vol. 4, no 3, 247-269, 1998년.

MPEG은 확장 가능형 비디오 코딩에 대한 제안을 청하였다. 제안된 방식의 대부분은 일시적 웨이브렛 분해(temporal wavelet decomposition)를 이용한다. 이 방식들의 큰 문제는 다중-계층 분해 때문에 지연이 상당히 크다는 것이다. 이는 저지연 및 실시간 애플리케이션으로부터의 요구 사항을 만족시킬 수 없다. 본 발명에서 제안된 DSP-리프팅으로, 3D 웨이브렛 비디오 코딩 방식은 일시적 분해의 수를 감소시킬 수 있다. 저대역 프레임들(low-band frames) 간의 상관관계들은 방향성 공간 예측에 의해 제거될 수 있다.

Claims

이차원(two dimensional; 2D) 신호를 인코딩하기 위한 시스템으로서,

범용 컴퓨팅 장치;

상기 범용 컴퓨팅 장치에 의해 실행 가능한 프로그램 모듈들을 포함하는 컴퓨터 프로그램

을 포함하며, 상기 컴퓨팅 장치는, 상기 컴퓨터 프로그램의 상기 프로그램 모듈들에 의하여,

이차원(2D) 신호를 입력하고,

상기 이차원 신호를 나타내는 출력 계수들을 얻기 위하여 적어도 하나의 리프팅 웨이브렛 및 이미지의 모서리들의 공간 상관관계들에 기초한 방향성 예측, 상기 이미지의 상기 모서리들에 기초한 방향성 각도들 및 이미지 블록들의 크기를 나타내는 모드들을 사용하여 상기 2D 신호를 변환하고,

상기 출력 계수들, 방향성 각도들 및 모드들을 엔트로피 인코딩하여, 상기 입력 신호의 인코딩된 버전을 생성하도록

지시되는 시스템.
제1항에 있어서,

상기 2D 신호를 변환하는 상기 프로그램 모듈은,

제1 일차원 웨이브렛 변환을 수직 방향으로 수행하는 서브모듈; 및

제2 일차원 웨이브렛 변환을 수평 방향으로 수행하는 서브모듈

을 포함하며,

상기 제1 일차원 웨이브렛 변환을 수직 방향으로 수행하는 서브모듈은,

상기 제1 일차원 웨이브렛 변환을 수직 방향으로 짝수 및 홀수 다상 샘플들로 분할하는 서브모듈;

이웃하는 짝수 다상 샘플들로부터 홀수 다상 샘플들을 예측하는 서브모듈 - 상기 예측 신호들은 상기 이미지의 모서리들을 따라 각도에서 방향성 있게 선택됨 -;

상기 예측된 홀수 다상 샘플들을 사용하여 짝수 다상 샘플들을 갱신하는 서브모듈 - 상기 갱신 신호들은 상기 이미지의 모서리들을 따라 각도에서 방향성 있게 선택됨 -; 및

상기 예측된 샘플들과 짝수 다상 샘플들의 계수들을 출력하는 서브모듈

을 포함하며,

상기 제2 일차원 웨이브렛 변환을 수평 방향으로 수행하는 서브모듈은,

상기 제2 일차원 웨이브렛 변환을 수평 방향으로 짝수 및 홀수 다상 샘플들로 분할하는 서브모듈;

이웃하는 짝수 다상 샘플들로부터 홀수 다상 샘플들을 예측하는 서브모듈 - 상기 예측 신호들은 상기 이미지의 모서리들을 따라 각도에서 방향성 있게 선택됨 -;

상기 예측된 홀수 다상 샘플들을 사용하여 짝수 다상 샘플들을 갱신하는 서브모듈 - 상기 갱신 신호들은 상기 이미지의 모서리들을 따라 각도에서 방향성 있게 선택됨 -; 및

상기 예측된 샘플들과 짝수 다상 샘플들의 계수들을 출력하는 서브모듈

을 포함하는 시스템.
제2항에 있어서,

상기 수직 방향의 제1 일차원 웨이브렛 변환 및 상기 수평 방향의 제2 일차원 웨이브렛 변환에 대하여, 상기 짝수 다상 샘플들은 상기 예측된 홀수 다상 샘플들을 사용하여 갱신되며, 상기 갱신 신호들은 상기 홀수 다상 샘플들을 예측하는 방향과 동일한 방향으로 각도를 따라 선택되는 시스템.
제1항에 있어서,

상기 엔트로피 인코딩된 계수, 방향성 각도(directional angles) 및 모드(modes)를 비트 스트림으로 출력하기 위한 프로그램 모듈을 더 포함하는 시스템.
제2항에 있어서,

상기 제1 1D 변환의 상기 각도가 상기 제2 변환의 각도에 대하여 수직인 시스템.
제2항에 있어서,

상기 입력 신호 및 방향성 각도와 모드의 상기 엔트로피 인코딩된 버전을 엔트로피 디코딩하고,

상기 입력 신호를 두 개의 1차원 신호로 분해하고,

각 1차원 신호에 대해,

예측된 홀수 및 갱신된 짝수 다상 샘플의 계수를 추출하고,

상기 예측된 홀수 다상 샘플 및 갱신된 짝수 다상 샘플을 사용해 상기 원래의 짝수 다상 샘플을 추출하고 - 상기 예측된 홀수 다상 샘플은 각도 및 모드의 디코딩에 따라 사용됨 -,

상기 원래의 짝수 다상 샘플 및 예측된 홀수 다상 샘플을 사용해 상기 원래의 홀수 다상 샘플을 추출하고 - 상기 원래의 짝수 다상 샘플은 각도 및 모드의 디코딩에 따라 사용됨 -,

상기 짝수 및 홀수 다상 샘플을 결합하여 1차원 웨이브렛 변환을 생성 하고,

상기 디코딩된 1차원 신호에 기초해 이미지를 생성함으로써

상기 신호를 디코딩하는 것에 의해 상기 입력 신호의 상기 엔트로피 인코딩된 버전이 디코딩되는 시스템.
제2항에 있어서,

상기 예측 신호가 방향성 각도 및 모드에 의해 규정되는 짝수 다상 샘플로부터 선택되는 시스템.
제7항에 있어서,

상기 방향성 각도는 상기 짝수 다상 샘플을 갱신하는데 사용되어서 상기 각도 데이터를 인코딩하기 위해 필요한 비트의 개수를 최소화하는 시스템.
제2항에 있어서,

상기 예측 신호 또는 상기 생신 신호는 부분적인 샘플로부터 획득되는 시스템.
제9항에 있어서,

상기 부분적인 샘플은 내삽 기법(interpolation approach)에 의해 계산되는 시스템.
제10항에 있어서,

x_e(m,n)에 속하는 부분적인 픽셀에 대하여, 상기 내삽은

으로서 설명되고, k는 sign(i-1)tg(
) 주변의 정수이고
는 내삽 필터의 파라미터인 시스템.
제2항에 있어서,

상기 예측된 및 갱신된 샘플은 정수로 표현되는 시스템.
제2항에 있어서,

상기 방향성 데이터는 상기 이미지에서 픽셀의 블록을 사용하여 방향성 각도를 채용함으로써 추정되는 시스템.
제13항에 있어서,

상기 방향성 데이터는,

블록 모드의 점진적으로 더 작은 블록의 세 세트로 이미지 블록을 분리하고, 제1 블록 모드는 픽셀의 큰 블록이고, 제2 블록 모드는 픽셀의 제1 블록보다 작으며, 제3 블록 모드는 픽셀의 상기 제2 블록의 부분집합이고, 상기 제1 블록 모드에서 모든 픽셀이 동일한 방향성 각도를 갖고, 상기 제3 블록 모드에서 각 블록은 16 개의 방향성 각도를 가지며 상기 제3 블록 모드에서의 모든 픽셀은 동일한 각도를 공유하고,

상기 수직 방향으로 웨이브렛 변환을 위한 상기 방향성 각도를

에 의해 추정하고 - h(m, n)은 상기 수직 방향으로 상기 웨이브렛 변환후의 하이 패스 계수이고,
는 상기 블록 모드 및 방향성 각도를 코딩하기 위한 비트의 개수이며,
는 최적화 팩터이고
은 h(m, n)의 상기 좌-상측 픽셀의 상기 좌표임 -,

상기 수평 방향으로 웨이브렛 변환을 위한 상기 방향성 각도를

에 의해 추정함으로써 - lh(m, n)은 저 고 부대역(low high sub-band)의 상기 계수이고,
는 상기 블록 모드 및 방향성 각도를 코딩하기 위한 비트의 개수이며,
는 최적화 팩터이고
은 lh(m, n)의 상기 좌-상측 픽셀의 상기 좌표임 - 추정되는 시스템.
제14항에 있어서,

상기 제1 블록 모드의 상기 블록 크기는 16×16 픽셀이고, 상기 제2 블록 모드의 상기 블록 크기는 8×8 픽셀이고, 상기 제3 블록 모드의 상기 블록 크기는 4 ×4 픽셀인 시스템.
제13항에 있어서,

블록의 방향성 각도는 인접한 블록의 상기 방향성 각도를 사용함으로써 코딩되고, 각각 각도 a 및 각도 c를 갖는 제1 행 아래 블록의 제2 행 위의 각각 각도 b 및 각도 d를 갖는 두 개 블록의 상기 제1 행에 대하여, 각도 b 및 d사이의 절대 차이가 각도 b 및 a사이의 절대 차이보다 큰 경우, 각도 a가 상기 예측으로서 사용되고, 그렇지 않은 경우 각도 d가 상기 예측으로서 사용되는 시스템.
제1항에 있어서,

상기 입력 신호는 비디오 신호를 포함하는 시스템.
이미지 데이터를 인코딩하기 위한 컴퓨터 구현 프로세스에 있어서,

입력 신호를 수신하고 상기 입력 신호에 대응하는 양자화된 계수의 출력을 제공하는 가역 변환 컴포넌트를 사용하는 프로세스 동작을 포함하고, 양자화된 계수의 상기 출력은 매트릭스 리프팅(matrix lifting) 및 이미지의 모서리에 대응하는 방향성 예측을 통해 획득되는 가역 변환에 적어도 부분적으로 기초하는 컴퓨터 구현 프로세스.
제18항에 있어서,

상기 입력 신호를 수신하고 상기 입력 신호에 대응하는 양자화된 계수의 출력을 제공하는 가역 변환 컴포넌트를 사용하는 프로세스 동작에 있어서, 양자화된 계수의 상기 출력은 매트릭스 리프팅 및 이미지의 모서리에 대응하는 방향성 예측을 통해 획득되는 가역 변환에 적어도 부분적으로 기초하며,상기 동작은,

이차원(2D) 신호를 입력하는 단계; 및

방향성 예측 및 적어도 하나의 리프팅 웨이브렛을 사용하여 상기 2D 신호를 변환하는 단계를 포함하고, 상기 변환하는 단계는

상기 수직 방향으로 일차원(1D) 웨이브렛 변환을 수행하는 단계;

상기 수평 방향으로 일차원 웨이브렛 변환을 수행하는 단계;

를 포함하며, 각 일차원 웨이브렛 변환은

상기 수직 방향으로 상기 일차원 웨이브렛 변환을 짝수 및 홀수 다상 샘플로 분리하는 단계;

이웃 짝수 다상 샘플로부터 홀수 다상 샘플을 예측하는 단계 - 상기 예측 신호는 상기 이미지에서 모서리를 따르는 각도에서 방향적으로 선택됨 -; 및

상기 예측된 홀수 다상 샘플을 사용하여 짝수 다상 샘플을 갱신하는 단계 - 상기 갱신 신호는 상기 이미지에서 모서리를 따르는 각도에서 방향적으로 선택됨 -

를 포함하는 컴퓨터 구현 프로세스.
제19항에 있어서,

상기 이미지에서 모서리를 나타내는 각도는 이미지 데이터의 블록을 사용해 계산된 컴퓨터 구현 프로세스.
제19항에 있어서,

이미지 데이터의 상기 이미지를 나타내는 모드는 상기 출력 계수 및 상기 이미지에서 모서리를 나타내는 각도로 인코딩된 엔트로피인 컴퓨터 구현 프로세스.
제19항에 있어서,

상기 프로세서 동작은 컴퓨터 판독 가능 매체에 저장된 컴퓨터 구현 프로세스.
제19항에 있어서,

상기 입력 신호는 이미지 신호를 포함하는 컴퓨터 구현 프로세스.
제19항에 있어서,

상기 입력 신호는 비디오 신호를 포함하는 컴퓨터 구현 프로세스.
제19항에 있어서,

하르 필터(Haar filer)가 상시 수직 방향 또는 수평 방향으로 1차원 웨이브 렛 변환을 수행하는데 사용되는 컴퓨터 구현 프로세스.
제19항에 있어서,

5/3 필터가 상시 수직 방향 또는 수평 방향으로 1차원 웨이브렛 변환을 수행하는데 사용되는 컴퓨터 구현 프로세스.
제19항에 있어서,

9/7 필터가 상시 수직 방향 또는 수평 방향으로 1차원 웨이브렛 변환을 수행하는데 사용되는 컴퓨터 구현 프로세스.
제19항에 있어서,

상기 짝수 다상 샘플(even polyphase samples)로부터의 상기 x(m,2n+1)의 예측은

로 계산되는 컴퓨터 구현 프로세스.
제19항에 있어서,

상기 짝수 다상 샘플로부터의 상기 예측은

로 계산되는 컴퓨터 구현 프로세스.
제19항에 있어서,

상기 이미지에서 모서리를 나타내는 각도가

이미지 데이터의 일련의 블록의 각 블록에 대해,

상기 수직 방향으로 일련의 후보 각도들 및 이미지 블록 사이즈 모드들로부터 최적 예측 각도 및 이미지 블록 사이즈 모드를 찾는 단계;

상기 1D 수직 변환을 수행시에, 상기 수직 방향으로 최적 예측 및 이미지 블록 모드를 사용하는 단계;

상기 수평 방향으로 일련의 후보 각도들 및 이미지 블록 사이즈 모드들로부터 최적 예측 각도 및 이미지 블록 사이즈 모드를 찾는 단계; 및

상기 1D 수평 변환을 수행시에, 상기 수평 방향으로 최적 예측 및 이미지 블록 모드를 사용하는 단계

의 프로세스 동작들에 의해 추정되는 컴퓨터 구현 프로세스.
이미지 내의 모서리들의 공간 상관관계를 나타내는 각도에 기초한 방향성 예측, 이미지 블록들의 사이즈를 나타내는 모드들 및 최소한 하나의 리프팅 웨이브렛을 사용해 입력 신호의 엔트로피 인코딩된 버전을 디코딩하기 위해,

상기 입력 신호 및 방향성 각도들 및 모드들의 상기 엔트로피 인코딩된 버전을 엔트로피 디코딩하고,

상기 입력 신호를 두 개의 1차원 신호들로 분해하며,

각 1차원 신호에 대해, 상기 신호를

예측된 홀수 및 갱신된 짝수 다상 샘플들의 계수를 추출하고,

상기 예측된 홀수 다상 샘플들 및 갱신된 짝수 다상 샘플들을 사용해 상기 원 짝수 다상 샘플들을 추출하고, 상기 예측된 홀수 다상 샘플들은 각도들 및 모드들의 디코딩에 따라 사용되며,

상기 원 짝수 다상 샘플들 및 예측된 홀수 다상 샘플들을 사용해 상기 원 홀수 다상 샘플들을 추출하고, 상기 원 짝수 다상 샘플들은 각도들 및 모드들의 디코딩에 따라 사용되고,

상기 짝수 및 홀수 다상 샘플들을 결합하여 1차원 웨이브렛 변환을 생성하고, 그리고

상기 디코딩된 1차원 신호들에 기초해 이미지를 생성하는

프로세스 동작을 포함하는

컴퓨터 구현 프로세스.