KR100584495B1 - 비디오 화상 코딩 장치 및 방법 - Google Patents

비디오 화상 코딩 장치 및 방법 Download PDF

Info

Publication number
KR100584495B1
KR100584495B1 KR1019997009376A KR19997009376A KR100584495B1 KR 100584495 B1 KR100584495 B1 KR 100584495B1 KR 1019997009376 A KR1019997009376 A KR 1019997009376A KR 19997009376 A KR19997009376 A KR 19997009376A KR 100584495 B1 KR100584495 B1 KR 100584495B1
Authority
KR
South Korea
Prior art keywords
block
coefficients
prediction block
candidate prediction
picture
Prior art date
Application number
KR1019997009376A
Other languages
English (en)
Other versions
KR20010006292A (ko
Inventor
리차드 피. 클리홀스트
패브리스 카브레라
Original Assignee
코닌클리케 필립스 일렉트로닉스 엔.브이.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 코닌클리케 필립스 일렉트로닉스 엔.브이. filed Critical 코닌클리케 필립스 일렉트로닉스 엔.브이.
Publication of KR20010006292A publication Critical patent/KR20010006292A/ko
Application granted granted Critical
Publication of KR100584495B1 publication Critical patent/KR100584495B1/ko

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

본 발명은 변환 도메인에서 모션 추정과 보상(8)을 실행하는 하이브리드 비디오 인코더에 관한 것이다. 이와 같은 인코더에 있어서, 변환-도메인 프레임 메모리(7)에 저장된 이전에 인코딩된 블록들(Z)로부터 예측 블록(
Figure 112004003286119-pct00054
)의 계산은 다수의 승산들을 필요로 한다. 이는 특히 모션 추정 알고리즘에 적용된다. 본 발명에 따라, 후보 예측 블록들의 단지 약간의 DCT 계수들, 예를 들어 DC 계수와 약간의 AC 계수들만이 계산된다. 양호한 실시예에 있어서, AC 계수들은 고려되는 모션 벡터에 따라 적응적으로 선택된다. 이러한 후보 예측 블록들의 계산된 계수들과 현재의 입력 화상 블록(Y)에 대응하는 계수들은 최적의 매칭 예측 블록을 식별하기 위해 비교된다.
후보 예측 블록, DCT 계수, 하이브리드 비디오 인코더

Description

비디오 화상 코딩 장치 및 방법{Method and arrangement for video coding}
본 발명은, 비디오 화상의 화상 블록들을 변환 계수들로 변환하는 단계와, 각각 변환된 화상 블록의 변환 계수들과 이전에 인코딩된 화상에 모션 추정을 적용함으로써 얻어진 예측 블록의 대응하는 변환 계수들 사이의 차이를 인코딩하는 단계를 포함하는 비디오 화상 코딩 방법에 관한 것이다. 또한, 본 발명은 상술한 방법을 실행하기 위한 장치에 관한 것이다.
MPEG 및 H.261과 같은 국제 코딩 표준들(international coding standards)에 따라 동작하는 비디오 인코더들은 변환 코딩 및 예측 코딩이 조합되는 하이브리드 인코더들(hybrid encoders)이다. 모션 추정 및 보상을 포함하는 예측 코딩은 통상적으로 픽셀 도메인에서 실행되고, 변환 코딩(DCT)은 예측으로 코딩된 신호에 적용된다. 이와 같은 인코더들에 있어서, 역 DCT(inverse DCT)는 예측 루프에서 요구된다.
오늘날, 변환 도메인에서 예측 코딩을 실행하는데 따른 연구 노력이 소비되고 있다. 하이브리드 인코더의 이러한 실시예에 있어서, 우선, 화상이 변환되고, 그 이후에 예측 코딩이 변환 계수들에 적용된다. 지금은 그러한 역 DCT가 불필요하게 될 수 있다. 이와 같은 하이브리드 비디오 인코더의 개략적인 다이어그램은 인터넷상의 University of Maryland(http://dspserv.eng.umd.edu:80..\~koc\/project/Video_Coding.html)에 널리 알려져 있다.
종래 기술의 하이브리드 비디오 인코더의 결함은, 예측 블록의 계산이 많은 매트릭스 승산들(multiplications)을 수반하기 때문에, 변환 도메인에서 모션 추정 및 보상이 픽셀 도메인에서의 모션 추정 및 보상보다 더 복잡하게 된다는 것이다. 특히, 모션 추정은 엄격한 문제가 있다. 모션 추정은 복수의 후보 예측 블록들을 계산하는 단계, 각각의 후보 예측 블록을 변환된 화상 블록과 비교하는 단계, 및 예측 블록이 될 후보 예측 블록들 중 하나의 후보 예측 블록들을 선택하는 단계를 포함한다. 다수의 후보 예측 블록들 각각에 대해서, 상기 많은 계산들이 수반된다.
본 발명의 목적은 상술한 결점들을 완화시킨 비디오 인코딩 방법을 제공하는 것이다.
상기 및 다른 목적들을 성취하기 위하여, 본 발명에 따른 방법은, 후보 예측 블록을 계산하는 단계와 후보 예측 블록을 변환된 화상 블록과 비교하는 단계가 상기 후보 예측 블록 및 변환된 화상 블록의 변환 계수들의 서브세트(subset)에 대해 실행되는 것을 특징으로 한다.
본 발명은 하나의 화상 블록을 인코딩하기 위한 대부분의 비트들이 약간의 변환 계수들에 대해 보통 소비되고, 가장 유사한 예측 블록에 대한 검색을 그들 계수들에 제한하는 것이 이롭다는 인식에 기초로 한다. 그로 인해 다수의 승산들은 상당히 감소되는데, 특히, 모션 보상이 4개의 8*8 휘도 블록들(luminance blocks)을 포함하는 16*16 매크로블록들에 적용되는 MPEG과 같은 코딩 표준들에서 상당히 감소된다. 모션 보상에 대해 결국 선택된 예측 블록은 여전히 완전하게 계산될 것임을 주목한다. 따라서, 화질은 영향을 받지 않는다.
유리하게, 변환 계수들의 서브세트는 예를 들어, 8*8 블록의 상부 좌측 코너에서 2*2 또는 3*3 서브매트릭스를 구성하는 계수들인, 미리규정된 수의 인접한 AC 계수들과 DC 계수를 포함한다. 서브매트릭스는, 정상 비디오 장면에서 대부분의 모션이 수평으로 보여 지기 때문에, 수평 방향(예를 들어, 2*3 또는 2*4)으로 확장될 수 있다. 승산의 수는, 단일 로우 또는 단일 컬럼의 한 계수들만이 계산될 때 심지어 더 감소될 수 있다.
양호한 실시예에 있어서, 계수들은 후보 예측 블록에 의한 표시되고 그와 관련된 후보 모션 벡터에 의해 표현됨에 따라 선택된다. 만일, 후보 모션 벡터가 수평 모션을 나타낸다면, 수평 방향으로 실질적으로 확장하는 서브매트릭스가 선택된다. 만일, 후보 모션 벡터가 수직 모션을 나타낸다면, 선택된 서브매트릭스는 실질적으로 수직 방향으로 확장한다.
도 1은 본 발명에 따라 변환 도메인에서 모션 추정을 실행하는 하이브리드 인코더를 도시한 도면.
도 2는 픽셀 도메인에서 이동하는 물체의 두 개의 위상들을 도시한 도면.
도 3은 변환 도메인에서 이전에 인코딩된 블록들에 대하여 예측 블록의 관련된 위치의 예를 도시한 도면.
도 4a 내지 도 5d는 모션 추정을 실행하기 위해 선택된 계수들의 서브세트들의 예들을 도시한 도면.
도 6은 도 1에 도시된 모션 추정 및 보상 회로의 동작들을 설명하는 흐름도.
도 7은 변환 도메인에서 이전에 인코딩된 블록들에 대해서 예측 매크로블록 블록의 관련된 위치의 예를 도시한 도면.
도 1은 본 발명에 따른 변환 도메인에서 모션 추정을 실행하는 하이브리드 인코더를 도시한 도면이다. 인코더는 8*8 픽셀들의 화상 블록들(X)의 형태로 비디오 화상 신호를 수신한다. 각각의 픽셀 블록은 불연속 코사인 변환 회로(discrete cosine transform circuit)(1)에 의해 8*8 DCT 계수들의 블록(Y)으로 변환된다. 감산기(2)에 있어서, 예측 블록(
Figure 112004003286119-pct00035
)의 계수들은 8*8 차계수들(difference coefficients)의 블록을 얻기 위해 블록(Y)에 대응하는 계수들로부터 감산된다. 차계수들은 양자화기(quantizer)(3)에서 양자화되고, 그 다음 양자화된 차계수들은 가변-길이 인코더(variable-length encoder)(4)에 의해 가변-길이 코드 워드들(variable-length code words)로 인코딩된다. 가변-길이 코드 워드들은 하이브리드 인코더의 디지털 출력 비트스트림을 구성한다. 이러한 비트스트림은 전송 채널에 인가되거나 저장 매체(도시하지 않음)에 저장된다.
예측 루프에 있어서, 양자화된 차계수들은 역양자화기(5)에서 역양자화 처리되고, 가산기(6)에 의해 현재 예측 블록에 가산되며, 프레임 메모리(7)에 기록되어, 거기에 저장된 이전의 인코딩된 화상을 갱신한다. 프레임 메모리(6)에 저장된 화상 블록들은 Z로 표시된다. 그들은 변환 도메인에 저장되는 것을 주목한다. 모션 추정기 및 모션 보상 회로(8)는 현재 화상 블록을 수신하고, 프레임 메모리(7)에서 상기 화상 블록에 가장 비슷한 예측 블록(
Figure 112004003286119-pct00036
)을 검색한다. 따라서, 발견된 예측 블록의 위치는 현재의 블록 위치에 대하여 예측 블록의 위치를 정의하는 모션 벡터(mv)에 의해 식별된다. 이러한 모션 벡터(mv)는 가변-길이 인코더(4)에 인가되고, 출력 스트림의 일부가 된다.
이전에는, 픽셀 도메인에서 실행시키기 위해 이동 보상이 이용되었다. 이는 픽셀 도메인에서 이동하는 물체(10)의 두 개의 위상들을 도시하는 도 2의 예로 도시되어 있다. 본 도면에 있어서, 코딩될 화상의 12개의 8*8 픽셀 블록들을 구성하는 화상 세그먼트(11)와 프레임 메모리에 저장된 이전에 인코딩된 화상의 대응하는 화상 세그먼트(12)가 도시되어 있다. 참조 번호(13)는 코딩될 8*8 픽셀 블록(X)을 나타내고, 참조 번호(14)는 프레임 메모리에서 가장 비슷한 예측 블록(
Figure 112004003286119-pct00037
)을 나타낸다. 또한, 예측 블록(
Figure 112004003286119-pct00038
)과 관련된 이동 벡터(mv)가 도시되어 있다. 이러한 이동 벡터가 모션 추정에 의해 발견되면, 예측 블록은 프레임 메모리로부터 예측 블록(
Figure 112004003286119-pct00039
)의 관련된 픽셀들을 판독함으로써 쉽게 얻을 수 있다.
이에 반하여, 도 1에 도시된 하이브리드 디코더는 변환 도메인에서 이전에 인코딩된 화상을 저장한다. 예측 블록(
Figure 112004003286119-pct00040
)의 계수들은 메모리에 저장된 계수 블록들(Z)로부터 바로 계산되어야 한다. 이는 예측 블록(
Figure 112004003286119-pct00041
)의 계수들이 4 개의 언더라잉(underlying) 계수 블록들(Z1, Z2, Z3 및 Z4)로부터 계산되는 것에 관해서 도시한 도 3의 예로 도시되어 있다. 수학 표기에 있어서, 예측 블록은 다음과 같은 식(1)으로 표시된다 :
Figure 111999012815816-pct00008
여기서, Hi 및 Wi는 언더라잉 블록들에 대하여 블록(
Figure 112004003286119-pct00042
)의 상대 위치를 나타내는 변환 매트릭스들이다. Hi 및 Wi는 포맷
Figure 112004003286119-pct00043
Figure 112004003286119-pct00044
중 하나의 포맷을 가지는데, 여기서 I는 항등 매트릭스(identity matrix)이고, 0은 제로들의 매트릭스이다. [식 1]의 이론 배경은, 특히 미국 특허 출원 제 5,408,274 호에서 알 수 있다.
예측 블록의 계수들의 상술한 계산은 매트릭스들(Hi 및 Wi), 즉 모션 벡터(mv)의 인식을 가정한다. 모션 추정기[도1의 회로(8)에 포함]의 목적은 현재 입력된 블록에 가장 비슷한 예측 블록의 모션 벡터를 결정하는 것이다. 모션 추정은, 심지어 픽셀 도메인에 있어도, 매우 복잡한 처리가 되고, 효과적인 비용과 양호하게 실행하는(well-performing) 모션 추정 알고리즘들을 알기 위하여 많은 연구의 노력이 소비되었다. 사실상, 모션 추정은 복수의 후보 예측 블록들에 모션 보상을 적용하고 상기 후보들로부터 최적의 예측 블록을 선택하는 반복 처리(iterative process)가 된다. 이후에, 3 차원 반복 검색(3-Dimensional Recursive Search : 3DRS) 블록 매칭 알고리즘으로서 공지된 알고리즘은 예를 통해 참조될 것이다. 그러한 알고리즘은, 특히, 출원인의 미국 특허 출원 제 5,072,293 호에 개시되어 있다. 3DRS 모션 추정 알고리즘의 양호한 특성은 단지 제한된 수의 후보 모션 벡터들이 평가된다는 것이다.
모션 추정이 복수의 후보 예측 블록들에 모션 보상을 반복적으로 적용하는 것과 유사하다는 인식에 비추어, 변환 도메인에서의 모션 추정은 식(1)이 여러 회 계산될 필요가 있다. 이는 다수의 승산들을 요구한다. 본 발명에 따라, 식(1)에 따라 각각의 후보 예측 블록의 계산은 단지 제한된 수의 계수들에 대해 실행된다. 이는 승산들의 수를 감소시키기 때문에, 극적으로, 변환 도메인에서 동작하는 1-칩(one-chip) MPEG2 인코더가 실행 가능하게 된다. 물론, 이는 디지털 비디오 처리의 분야에서 중요한 진일보한 것이다.
모션 추정를 위해 계산될 계수들은 일정하게 선택될 수 있다. 바람직하게, 그들은 낮은 공간 주파수들을 나타내는 약간의 AC 계수들과 DC 계수를 포함한다. 이는 이들 계수들이 출력 신호의 대부분의 비트들에 응답되고, 차이 블록[도 1의 감산기(2)의 출력]에서 가장 바람직하게 최소가 되기 때문이다. 도4a 내지 도 4c는 양호한 선택들의 예들을 도시한 도면이다. 각각의 예에 있어서, 상부-좌측의 계수(upper-left coefficient)는 DC 계수이다. 도 4a에 있어서, 계수들은 3*3(또는 임의 다른 사이즈) 서브매트릭스를 구성한다. 도4b에 있어서, 선택된 계수들은 지그재그 스캔된 시리즈(zigzag scanned series)의 제 1 계수들이다. 이러한 선택은 지그재그 주사 계수 블록들을 위한 이미 이용가능한 회로들에 비추어 유리하게 된다. 도 4c에 있어서, 서브매트릭스는 수평 방향으로 연장한다. 후자의 선택은 평면 비디오 장면들에서 알 수 있는 대부분의 모션이 수평 모션이 되는 특성으로부터 유리하게 된다.
본 발명의 양호한 실시예에 있어서, 모션 추정을 위해 계산될 계수들은 추정되는 후보 모션 벡터들에 따라 적응적으로 선택된다. 만일, 후보 모션 벡터들이 수평 모션을 나타내는 경우(3DRS 알고리즘에서, 수평 모션이 이전에 발견되었을 경우)에, 수평 방향으로 연장하는 서브매트릭스가 선택된다. 이러한 실시예들은 도 5a 및 도 5b에 도시되어 있다. 후보 모션 벡터들이 수직 모션을 나타낸다면, 서브매트릭스는 도 5c 및 도 5d에 도시된 것처럼 수직 방향으로 연장한다. 도5b 및 도 5d에 도시된 예들은 단일 로우 또는 칼럼의 계수들의 계산들은 철저하게 승산들의 수를 절약(saving)하는데 기여하기 때문에 특히 유리하게 된다(단일 로우를 구성하는 8 계수들은 2*4 서브매트릭스를 구성하는 8 계수들 보다 경제적으로 계산될 수 있다). 또한, 선택된 AC 계수들은 DC 계수에 필연적으로 인접하게 되지 않는 점이 주목된다. 적은 량의 모션은 차이 블록내의 보다 높은 공간 주파수들로서 증명되기 때문에[도 1의 감산기(2)의 출력], 또한, 적은 량의 모션에 대한 보다 높은 공간 주파수들을 나타내는 AC 계수들을 추정하는데 유리하게 될 수도 있다.
다음은, 모션 추정 및 모션 보상 회로(8)의 동작(도 1)이 이제 설명될 것이다. 다수의 계산들을 각각 포함하는 복수의 동일한 동작들을 성공적으로 실행되어야 하기 때문에, 마이크로프로세서-제어된 산술 유닛으로서 회로가 구현되는 것이 바람직하다. 이와 같은 유닛의 아키텍쳐(architecture)는 본 기술 분야에 당업자들에게 이미 알려져 있기 때문에, 보다 상세한 설명은 예시하지 않는다. 본 발명을 개시하는 목적을 위해, 도6은 산술 유닛을 제어하는 마이크로프로세서에 의해 실행되는 동작들의 흐름도이다. 여기서, 3DRS 모션 추정 알고리즘이 이용되고, 후보 모션 벡터들(mvk)(k=1..K)이 이미 알려져 있음이 가정된다.
제 1 단계(20)에 있어서, 프로세서는, DCT 계수들의 어떤 서브세트가 모션 추정 처리에 고려되었는지를 결정한다. 상술한 것처럼, 그러한 세트는 일정하게 선택(즉, 도 4a 내지 도 4c)될 수 있거나, 후보 모션 벡터들에 따라 적응적으로 선택(즉, 도5a 내지 도5d)될 수 있다. 단계(20)에 있어서, 계수들은 계수 매트릭스에서 그들 위치들을 나타내는 인덱스들(u=0..7, v=0..7)에 의해 표시된다.
단계(21)에 있어서, 마이크로프로세서는 후보 모션 벡터들(mvk) 중 하나를 선택한다. 그 후, 단계(22)에서, 프로세서는 프레임 메모리로부터 그 모션 벡터와 관련된 후보 예측 블록의 아래의 4개의 계수 블록들을 검색한다. 식(1)에 따라, 상기 4 개의 블록들은 Z1..Z4로 나타낸다.
단계(23)에 있어서, 후보 예측 블록의 관련된 계수들은 식(1)에 따라 계산된다. 그들 계수들은
Figure 112004003286119-pct00045
로 나타낸다. 단계(20)에서 결정된 것과 같은 것으로 고려될 수 있는 인덱스(u,v)를 갖는 계수들(
Figure 112004003286119-pct00046
)만이 계산되는 점을 주목한다.
단계(24)에 있어서, 마이크로프로세서는 계수들(
Figure 112004003286119-pct00047
)의 세트를, 현재 입력 블록의 대응하는 계수들(yu,v)과 비교한다. 그 결과는 현재 후보 모션(mvk)에 대해 비슷한 인디케이터(indicator)(Rk)로서 저장된다. 본 예에 있어서, 비슷한 인디케이터는 변환 도메인내의 후보 예측 블록과 입력 블록 사이의 평균 절대차(mean absolute difference)를 나타낸다 :
Figure 111999012815816-pct00015
여기서, wu,v는 각각의 계수의 상대적인 관련성(relative relevance)을 나타내는 가중 계수(weighting factor)이다. MPEG과 같은 비디오 압축 방식들에 있어서, 양자화기 매트릭스는 적당한 가중 계수들을 제공한다. 간단한 실시예에 있어서, 모든 가중 계수(wu,v)는 1로 설정될 수 있다.
단계(25)에 있어서, 모든 후보 모션 벡터들(mvk)(k=1..k)은 이 방식으로 처리된다. 상기 경우가 아닌 한, 단계들(21 내지 24)은 다른 후보 모션 벡터들(mvk)에 대해 반복된다. 모든 후보 모션 벡터가 처리된 경우라면, 모션 추정 처리는 저장된 비슷한 인디케이터들(Rk)(k=1..K) 중 하나가 최저값을 갖는지를 판정하는 단계(26)로 진행한다. 후보 예측 블록들 중 최적 매칭 블록은 바로 확인되고, 모션 추정 처리는 종료된다.
지금, 산술 유닛은 모션 보상으로 진행한다. 이를 위해, 바로 발견된 최적 매칭 예측 블록의 모션 벡터(mvk)는 단계(30)에서 다시 선택된다. 단계(31)에 있어서, 4 개의 아래 블록들(Z1..Z4)은 프레임 메모리로부터 다시 판독된다, 단계(32)에 있어서, 예측 블록(
Figure 112004003286119-pct00048
)의 모든 계수들은 식(1)에 따라 계산된다. 상기 단계(32)와 모션 추정 처리에서의 알려진 유사한 단계(23)의 차이를 주목한다. 단계(32)에서, 모든 계수들이 계산되는데 반하여, 단계(23)에서는 약간의 계수들만에 적용된다. 블록(
Figure 112004003286119-pct00049
)은 하이브리드 인코더의 감산기(2)(도 1 참조)에 적용된다.
상술한 실시예에 있어서, 후보 예측 블록들은 이전에 인코딩된 블록들을 아래와 동일한 사이즈를 갖는다. H.263과 같은 약간의 코딩 표준들은 각각 8*8 블록들에 대해 모션 벡터를 전송하는 옵션("향상된 모션 추정")을 제공한다. 상술한 실시예는 그와 같은 표준에 따라 하이브리드 인코더에서 유리하게 구현될 수 있다. MPEG와 같은 다른 코딩 표준들은 4 개의 8*8 블럭들을 포함하는 각각 매크로블럭에 대해 하나의 모션 벡터를 전송한다. 그와 같은 코딩 표준들에 있어서, 모션 추정 및 보상의 처리는 약간 다른데, 이는 이제 도 7을 참조하여 설명될 것이다.
도 7은 4개의 8*8 블록들(
Figure 112004003286119-pct00050
)을 포함하는 (후보) 예측 매크로블록(40)을 도시한 도면이다. 매크로블록은 9 개의 이전에 인코딩된 계수 블록들(Z1-Z9)을 포함한다. 매크로블록의 계수들을 계산하기 위하여, 각각의 8*8 블록은 식(1)에 따라 그것의 4 개의 아래의 블록들로부터 개별적으로 계산된다. 모션 추정 및 보상 처리는 또한 도 6을 참조하여 상술한 것처럼 진행한다. 모션 보상을 위하여, 모든 계수들(4*64 전체)은 단계(32)에서 계산된다. 모션 추정의 목적을 위하여, 단지 선택된 계수들만이 단계(23)에서 계산되고, 대응하는 계수들은 비슷한 인디케이터를 결정하기 위한 입력 매크로블록으로부터 취해진다(단계 25).
요약하면, 변환 도메인에서 모션 추정 및 보상(8)을 실행하는 하이브리드 비디오 인코더가 설명되었다. 이러한 인코더에 있어서, 변환-도메인 프레임 메모리(7)에 저장된 이전에 인코딩된 블록들로부터 예측 블록(
Figure 112004003286119-pct00051
)의 계산은 다수의 승산들을 필요로 한다. 이는 특히 모션 추정 알고리즘에 적용한다. 본 발명에 따라, 후보 예측 블록들의 단지 약간의 계수들, 예를 들어 DC 계수 및 약간의 AC 계수들이 계산된다. 양호한 실시예에 있어서, AC 계수들은 고려될 모션 벡터에 따라 적응적으로 선택된다. 그 후에 후보 예측 블록들의 계산된 계수들과 현재 입력 화상 블록(Y)의 대응하는 계수들은 비교되어, 최적의 매칭 예측 블록을 식별한다.

Claims (8)

  1. 비디오 화상의 화상 블록들을 변환 계수들로 변환하는 단계(1)와, 각각의 변환된 화상 블록(Y)의 변환 계수들과 이전에 인코딩된 화상에 모션 추정(8)을 적용하여 얻어진 예측 블록(
    Figure 112004003286119-pct00052
    )의 대응하는 변환 계수들 사이의 차이(2)를 인코딩하는 단계(2-8)를 포함하는, 비디오 화상들을 코딩하는 방법으로서
    상기 모션 추정은,
    복수의 후보 예측 블록들(candidate prediction blocks)을 계산하는 단계(23),
    각각의 후보 예측 블록을 상기 변환된 화상 블록과 비교하는 단계(24), 및
    상기 예측 블록이 될 상기 후보 예측 블록들 중 한 블록을 선택하는 단계(26)를 포함하는, 상기 비디오 화상 코딩 방법에 있어서,
    상기 후보 예측 블록을 계산하는 단계(23)와 상기 후보 예측 블록을 상기 변환된 화상 블록과 비교하는 단계(24)는 상기 후보 예측 블록과 변환된 화상 블록의 상기 변환 계수들의 서브세트에 대해 실행되는 것을 특징으로 하는, 비디오 화상 코딩 방법.
  2. 제 1 항에 있어서, 상기 변환 계수들의 서브세트는 DC 계수와 미리규정된 수의 AC 계수들을 포함하는, 비디오 화상 코딩 방법.
  3. 제 1 항 또는 제 2 항에 있어서, 상기 변환 계수들의 서브세트는 상기 후보 예측 블록과 관련된 후보 모션 벡터에 따라 적응적으로 선택되는, 비디오 화상 코딩 방법.
  4. 제 3 항에 있어서, 상기 변환 계수들의 서브세트는 상기 후보 예측 블록의 제 1 M 로우들의 제 1 N 계수들을 포함하고, N 및 M은 상기 후보 모션 벡터의 수평 및 수직 성분에 따라 각각 선택되는, 비디오 화상 코딩 방법.
  5. 제 4 항에 있어서, 실질적으로 수직 성분을 갖는 후보 모션 벡터들에 대해서 N=1이고 실질적으로 수평 성분을 갖는 후보 모션 벡터들에 대해서 M=1인, 비디오 화상 코딩 방법.
  6. 제 1 항에 있어서, 각각의 후보 예측 블록을 상기 변환된 예측 블록과 비교하는 상기 비교 단계(24)는 공간적으로 대응하는 계수들을 비교하는 단계를 포함하고, 미리규정된 가중 계수들(weighting factors)(wu,v)은 상기 공간적으로 대응하는 계수들에 적용되는, 비디오 화상 코딩 방법.
  7. 제 1 항에 있어서, 상기 후보 예측 블록들은 3차원 반복 블록 매칭 알고리즘(3-dimensional recursive block matching algorithm)에 따라 선택되는, 비디오 화상 코딩 방법.
  8. 비디오 화상의 화상 블록들을 변환 계수들로 변환하기 위한 변환 인코더 회로(1)와, 각각 변환된 화상 블록(Y)과 이전에 인코딩된 화상(Z)에 모션 추정(8)을 적용하여 얻어진 예측 블록(
    Figure 112004003286119-pct00053
    ) 사이의 차이(2)를 인코딩하기 위한 예측 인코더(2-8)를 포함하는, 블록-기반 하이브리드 비디오 인코더(block-based hybrid video encoder)로서,
    상기 예측 인코더는,
    복수의 후보 예측 블록들을 계산(23)하고,
    각각의 후보 예측 블록을 상기 변환된 화상 블록과 비교(24)하고,
    상기 예측 블록이 될 상기 후보 예측 블록들 중 한 블록을 선택(26)하도록 배열된 모션 추정기(motion estimator)(8)를 포함하는, 상기 블록-기반 하이브리드 비디오 인코더에 있어서,
    상기 모션 추정기는 상기 후보 예측 블록의 상기 계산(23)과, 상기 변환된 화상 블록과 상기 후보 예측 블록의 비교(24)를 실행하도록 상기 후보 예측 블록과 변환된 화상 블록의 변환 계수들의 서브세트에 대해 배치되는 것을 특징으로 하는, 블록-기반 하이브리드 비디오 인코더.
KR1019997009376A 1998-02-13 1999-01-28 비디오 화상 코딩 장치 및 방법 KR100584495B1 (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
EP98200449.1 1998-02-13
EP98200449 1998-02-13
PCT/IB1999/000151 WO1999041912A2 (en) 1998-02-13 1999-01-28 Method and arrangement for video coding

Publications (2)

Publication Number Publication Date
KR20010006292A KR20010006292A (ko) 2001-01-26
KR100584495B1 true KR100584495B1 (ko) 2006-06-02

Family

ID=8233387

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1019997009376A KR100584495B1 (ko) 1998-02-13 1999-01-28 비디오 화상 코딩 장치 및 방법

Country Status (7)

Country Link
US (1) US6498815B2 (ko)
EP (1) EP0976251B1 (ko)
JP (1) JP2001520846A (ko)
KR (1) KR100584495B1 (ko)
CN (1) CN1166215C (ko)
DE (1) DE69901525T2 (ko)
WO (1) WO1999041912A2 (ko)

Families Citing this family (36)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6128047A (en) * 1998-05-20 2000-10-03 Sony Corporation Motion estimation process and system using sparse search block-matching and integral projection
US6697427B1 (en) * 1998-11-03 2004-02-24 Pts Corporation Methods and apparatus for improved motion estimation for video encoding
WO2000034920A1 (en) * 1998-12-07 2000-06-15 Koninklijke Philips Electronics N.V. Motion vector estimation
US6741648B2 (en) * 2000-11-10 2004-05-25 Nokia Corporation Apparatus, and associated method, for selecting an encoding rate by which to encode video frames of a video sequence
FI109634B (fi) * 2001-02-16 2002-09-13 Hantro Products Oy Menetelmä ja laite videokuvan koodaamiseksi
KR100490395B1 (ko) * 2001-10-29 2005-05-17 삼성전자주식회사 움직임 벡터 추정 방법 및 이에 적합한 장치
FI110745B (fi) * 2001-11-13 2003-03-14 Hantro Products Oy Menetelmä ja laite peräkkäisten kuvien koodaamiseksi
US7742525B1 (en) * 2002-07-14 2010-06-22 Apple Inc. Adaptive motion estimation
EP1480170A1 (en) * 2003-05-20 2004-11-24 Mitsubishi Electric Information Technology Centre Europe B.V. Method and apparatus for processing images
US7792188B2 (en) * 2004-06-27 2010-09-07 Apple Inc. Selecting encoding types and predictive modes for encoding video data
US8111752B2 (en) * 2004-06-27 2012-02-07 Apple Inc. Encoding mode pruning during video encoding
US20050286777A1 (en) * 2004-06-27 2005-12-29 Roger Kumar Encoding and decoding images
US7593465B2 (en) * 2004-09-27 2009-09-22 Lsi Corporation Method for video coding artifacts concealment
KR100694093B1 (ko) * 2005-02-18 2007-03-12 삼성전자주식회사 영상 블럭의 계수 예측 장치 및 그 방법
US7924316B2 (en) 2007-03-14 2011-04-12 Aptina Imaging Corporation Image feature identification and motion compensation apparatus, systems, and methods
US7920746B2 (en) * 2007-04-23 2011-04-05 Aptina Imaging Corporation Compressed domain image summation apparatus, systems, and methods
US8488684B2 (en) * 2008-09-17 2013-07-16 Qualcomm Incorporated Methods and systems for hybrid MIMO decoding
KR101675116B1 (ko) 2009-08-06 2016-11-10 삼성전자 주식회사 영상의 부호화 방법 및 장치, 그 복호화 방법 및 장치
US9609342B2 (en) 2010-02-19 2017-03-28 Skype Compression for frames of a video signal using selected candidate blocks
US9313526B2 (en) 2010-02-19 2016-04-12 Skype Data compression for video
US9078009B2 (en) 2010-02-19 2015-07-07 Skype Data compression for video utilizing non-translational motion information
US8681873B2 (en) * 2010-02-19 2014-03-25 Skype Data compression for video
US9819358B2 (en) 2010-02-19 2017-11-14 Skype Entropy encoding based on observed frequency
GB2487200A (en) 2011-01-12 2012-07-18 Canon Kk Video encoding and decoding with improved error resilience
US8891626B1 (en) 2011-04-05 2014-11-18 Google Inc. Center of motion for encoding motion fields
GB2491589B (en) 2011-06-06 2015-12-16 Canon Kk Method and device for encoding a sequence of images and method and device for decoding a sequence of image
CA2841921C (en) 2011-06-14 2021-01-26 Samsung Electronics Co., Ltd. Method and apparatus for encoding motion information and method and apparatus for decoding same
KR20140034292A (ko) 2011-07-01 2014-03-19 모토로라 모빌리티 엘엘씨 움직임 벡터 예측 설계 간소화
CN104041041B (zh) 2011-11-04 2017-09-01 谷歌技术控股有限责任公司 用于非均匀运动向量栅格的运动向量缩放
EP2805497A1 (en) * 2012-01-21 2014-11-26 Motorola Mobility LLC Method of determining binary codewords for transform coefficients
US8908767B1 (en) 2012-02-09 2014-12-09 Google Inc. Temporal motion vector prediction
US9172970B1 (en) 2012-05-29 2015-10-27 Google Inc. Inter frame candidate selection for a video encoder
US11317101B2 (en) 2012-06-12 2022-04-26 Google Inc. Inter frame candidate selection for a video encoder
US9485515B2 (en) 2013-08-23 2016-11-01 Google Inc. Video coding using reference motion vectors
US9503746B2 (en) 2012-10-08 2016-11-22 Google Inc. Determine reference motion vectors
US9313493B1 (en) 2013-06-27 2016-04-12 Google Inc. Advanced motion estimation

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4245248A (en) * 1979-04-04 1981-01-13 Bell Telephone Laboratories, Incorporated Motion estimation and encoding of video signals in the transform domain
US4704628A (en) * 1986-07-16 1987-11-03 Compression Labs, Inc. Combined intraframe and interframe transform coding system
SE457402B (sv) * 1987-02-20 1988-12-19 Harald Brusewitz Foerfarande och anordning foer kodning och avkodning av bildinformation
US5072293A (en) 1989-08-29 1991-12-10 U.S. Philips Corporation Method of estimating motion in a picture signal
DE4118571A1 (de) * 1991-06-06 1992-12-10 Philips Patentverwaltung Vorrichtung zur steuerung des quantisierers eines hybrid-kodierers
US5408274A (en) * 1993-03-11 1995-04-18 The Regents Of The University Of California Method and apparatus for compositing compressed video data
US5712809A (en) * 1994-10-31 1998-01-27 Vivo Software, Inc. Method and apparatus for performing fast reduced coefficient discrete cosine transforms
EP0791273B1 (en) * 1995-09-12 2000-06-07 Koninklijke Philips Electronics N.V. Hybrid waveform and model-based encoding and decoding of image signals
US5790686A (en) * 1995-09-19 1998-08-04 University Of Maryland At College Park DCT-based motion estimation method
KR100614522B1 (ko) * 1997-11-14 2006-08-22 안테온 코포레이션 비디오 정보를 압축하기 위한 장치 및 방법

Also Published As

Publication number Publication date
US6498815B2 (en) 2002-12-24
DE69901525T2 (de) 2003-01-09
EP0976251A2 (en) 2000-02-02
DE69901525D1 (de) 2002-06-27
KR20010006292A (ko) 2001-01-26
JP2001520846A (ja) 2001-10-30
CN1256049A (zh) 2000-06-07
WO1999041912A3 (en) 1999-11-11
US20020085630A1 (en) 2002-07-04
CN1166215C (zh) 2004-09-08
EP0976251B1 (en) 2002-05-22
WO1999041912A2 (en) 1999-08-19

Similar Documents

Publication Publication Date Title
KR100584495B1 (ko) 비디오 화상 코딩 장치 및 방법
US9699459B2 (en) Image encoding apparatus, image encoding method, image decoding apparatus, and image decoding method
US6532306B1 (en) Image predictive coding method
US20060008008A1 (en) Method of multi-resolution based motion estimation and recording medium storing program to implement the method
US8285064B2 (en) Method for processing images and the corresponding electronic device
JP4250638B2 (ja) 動画像符号化装置及びその方法
CN101491106A (zh) 图像处理设备和方法及程序
KR20050089838A (ko) 선택된 매크로블록에 대한 스킵 모션 추정으로 비디오인코딩하는 방법
KR100727988B1 (ko) 변환 영역에서의 dc 계수 예측 방법 및 장치
JP2000513914A (ja) ディジタル画像を符号化および復号化する方法および装置
JP2003070001A (ja) 動画像符号化装置
JP2004215296A (ja) 画像予測符号化方法及び装置

Legal Events

Date Code Title Description
A201 Request for examination
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
LAPS Lapse due to unpaid annual fee