KR100919885B1

KR100919885B1 - 다시점 비디오의 스케일러블 코딩 및 디코딩 방법과, 코딩및 디코딩 장치

Info

Publication number: KR100919885B1
Application number: KR1020070108021A
Authority: KR
Inventors: 조숙희; 권형진; 허남호; 김진웅; 이수인; 심동규; 남정학; 박시내
Original assignee: 한국전자통신연구원
Priority date: 2006-10-25
Filing date: 2007-10-25
Publication date: 2009-09-30
Also published as: KR20080037593A; JP5170786B2; JP2010507961A; WO2008051041A1

Abstract

본 발명은 다시점 비디오를 다계층 공간 및 시간 스케일러블 코딩 기술을 이용해 압축 전송하여 다양한 형태의 비디오 단말기들에게 2차원 또는 3차원 비디오 서비스를 제공하기 위한 다시점 비디오의 스케일러블 코딩 및 디코딩 방법과 코딩 및 디코딩 장치에 관한 것으로, 하나의 기초 비디오에 대해 공간 필터링을 통해 다계층 해상도로 분리하고, 분리된 저해상도 영상 프레임 및 적어도 하나 이상의 고해상도 영상 프레임 각각에 대해 시공간 예측을 통해 스케일러블 비디오 코딩을 수행하는 기초 스케일러빌리티 비디오 인코더; 및 동일 시점에 촬영된 자신의 비디오와 참조 비디오로 적어도 하나 이상의 타 비디오를 입력받아, 공간 필터링을 통해 다계층 해상도로 분리하고, 분리된 저해상도 영상 프레임에 대해 자신의 인접 프레임뿐만 아니라 동일 시간 축에서 상기 타 비디오 프레임을 참조하여 시공간 예측을 통해 스케일러블 비디오 코딩을 수행하며, 분리된 적어도 하나 이상의 고해상도 영상 프레임에 대해 자신의 하위 계층뿐만 아니라 상기 타 비디오 프레임의 하위 계층을 참조하여 시공간 예측을 통해 스케일러블 비디오 코딩을 수행하는 복수의 확장된 스케일러빌리티 비디오 인코더를 포함한다.

Description

다시점 비디오의 스케일러블 코딩 및 디코딩 방법과, 코딩 및 디코딩 장치{Multi-view video scalable coding and decoding}

본 발명은 다시점 비디오의 스케일러블(scalable) 코딩 및 디코딩 기술에 관한 것으로, 더욱 자세하게는 복수 카메라에 의해 촬영된 다시점 비디오를 압축 전송함에 있어, 다시점 비디오를 다계층 공간 및 시간 스케일러블 코딩 기술을 이용해 압축 전송하고, 수신단에서 디코딩하여 다양한 형태의 비디오 단말기들에게 2차원 또는 3차원 비디오 서비스를 제공하기 위한 다시점 비디오의 스케일러블 코딩 및 디코딩 방법과, 코딩 및 디코딩 장치에 관한 것이다.

본 발명은 정보통신부 및 정보통신연구진흥원의 IT신성장동력핵심기술개발사업의 일환으로 수행한 연구로부터 도출된 것이다[과제관리번호: 2005-S-403-02, 과제명: 지능형 통합정보방송(SmarTV) 기술개발].

데이터를 압축하는 기본적인 원리는 데이터의 공간적 중복 및 시간적 중복(redundancy) 요소를 제거하는 것이다. 공간적 중복은 비디오에서 동일한 색이나 객체가 반복되는 것을 말한다. 그리고 시간적 중복은 동영상 픽쳐에서 인접 픽쳐가 거의 변화 없는 것 또는 오디오에서 같은 음이 계속 반복되는 것을 말한다. 일반적인 비디오 코딩 방법에서, 시간적 중복은 움직임 보상에 근거한 시간적 필터링에 의해 제거되고, 공간적 중복은 공간적 변환에 의해 제거된다.

데이터의 중복이 제거된 후 생성되는 멀티미디어 데이터를 전송하기 위해서는, 전송매체가 필요한데, 그 성능은 전송매체 별로 차이가 있다. 다양한 속도의 전송매체를 지원하기 위하여 또는 전송환경에 따라 이에 적합한 전송률로 멀티미디어 데이터를 전송하기 위해 스케일러블(scalable) 비디오 코딩 기술이 있다.

스케일러블 비디오 코딩 기술이란 이미 압축된 비트스트림(bit-stream)에 대하여 전송 비트율, 전송 에러율, 시스템 자원 등의 주변 조건에 따라 비트스트림의 일부를 잘라내어 비디오의 해상도, 프레임율, 및 SNR(Signal-to-Noise Ratio) 등을 조절할 수 있게 해주는 코딩 기술을 의미한다.

도 1은 일반적인 스케일러블 코딩 개념을 설명하기 위한 참고도이다. 도 1을 참조하면, 스케일러블 비디오 코딩은 입력 비디오에 대해 시간적 변환을 이용하여 시간적 스케일러블을 구현하고, 2차원 공간적 변환을 이용하여 공간적 스케일러블을 구현한다. 또한, 스케일러블 비디오 코딩은 텍스쳐 코딩(Texture Coding)을 이용하여 화질(quality) 스케일러빌러티를 구현한다. 모션 코딩(Motion Coding)은 각각의 공간적 스케일러블을 구현할 때의 모션 정보를 스케일러블하게 부호화한다. 이와 같은 코딩 알고리즘을 통하여 하나의 비트스트림을 생성한다.

스케일러블 비디오 코딩에서 시간적 스케일러블을 제공하고 압축 효율을 높이기 위한 방법으로, 모션 보상 시간 필터링(MCTF: Motion Compensated Temporal Filtering)과 계층적 B-픽처(Hierarchical B-pictures)가 있다.

MCTF는 비디오 시퀀스 내에서 시간 방향의 움직임 정보를 이용하여 웨이블릿 변환(Wavelet Transform)을 수행하는 것을 말한다. 웨이블릿 변환은 리프팅 스킴(Lifting scheme)을 이용하여 구현된다. 리프팅 스킴은 다위상 분해(polyphase decomposition), 예측(prediction) 및 업데이트(update)의 세 가지 연산으로 구성된다.

계층적 B-픽처는 H.264에서 사용하는 16개의 픽처를 저장할 수 있는 DPB(Decoded Picture Buffer)를 관리하는 MMCO(Memory Managemnent Control Operation)와 RPLR(Reference Picture List Reordering)의 신텍스를 이용하여 다양한 방법으로 구현될 수 있다.

최근에는 기술적 발전과 사용자의 요구에 의해 다양한 시점에서의 광경에 대한 비디오 정보를 시청자에게 제공하고, 해당 비디오 정보 중에 시청자가 보고 싶은 광경에 대한 조작을 통해 각각의 시청자마다 방송국에서 보내지는 정보를 편집하여 시청할 수 있는 서비스가 연구되고 있다. 이와 같은 서비스를 제공하기 위해서는 다시점 비디오에 대한 비디오 압축 기술이 필요하다.

다시점 비디오 압축은 다시점 비디오를 제공하는 복수 카메라로부터 입력된 비디오를 동시에 코딩하여 압축 저장 및 전송하기 위한 것이다. 다시점 비디오를 압축하지 않고 저장 및 전송할 경우 데이터의 크기가 매우 크기 때문에 데이터를 실시간으로 방송망 또는 유/무선 인터넷을 통하여 사용자에게 전달하기 위해서는 큰 크기의 전송 대역폭이 요구된다.

통상 다시점 비디오 코딩 및 디코딩은 각각의 비디오 시퀀스를 독립적으로 코딩하여 전송한 후 디코딩하는 방법으로 이루어질 수 있다. 이는 기존의 MPEG-1/2/4나 H.261/263/264를 통하여 쉽게 구현될 수 있다. 하지만, 이는 동일한 물체를 복수 카메라로 촬영하기 때문에 생기는 비디오 간의 중복성을 제거할 수 없다.

비디오 간의 중복성을 제거하기 위한 기술로 스케일러블 비디오 코딩(Scalable video coding) 기술이 있다. 일반적으로 단일시점 비디오의 스케일러블 코딩 기술은 단일시점 비디오를 공간 축으로 공간 필터를 사용하여 다계층 해상도로 분리하고, 분리된 비디오를 시간축에서 계층적 양방향 움직임 예측을 통하여 시공간 스케일러블을 한다. 여기서 각 해상도에서 계층간 효과적인 예측을 위하여 움직임과 차영상 및 인트라 예측이 수행될 수 있다. 또한 변환 부호화에서 계층적 표현에 의한 엔트로피 코딩을 통하여 화질관점의 스케일러빌리티가 제공될 수 있다.

하지만, 이와 같은 종래의 스케일러블 비디오 코딩 기술은 단일시점 비디오 공간 화질로 고정되어 있어, 다양한 환경과 다양한 연산 능력을 가지는 단말기에서 다양하게 삼차원 또는 선택적인 이차원으로 비디오를 재생하도록 하는 경우에는 많은 전송률과 비디오 디코더 면에서 많은 오버헤드가 발생될 수 있는 문제점이 있다.

따라서, 본 발명은 상기와 같은 종래 기술의 문제점을 해결하기 위하여 제안된 것으로, 다시점 비디오를 압축 전송하기 위해 시간 축 및 비디오(공간) 축에서 주변 영상을 참조하는 움직임 예측 보상뿐만 아니라, 다시점 비디오에서 공간축 상으로 스케일러빌리티를 제공하기 위하여 주변 비디오의 다른 해상도에서의 움직임과 차영상 및 인트라 예측을 통하여 보다 효율적으로 비디오를 압축하고 다양한 환경의 단말기에게 다양한 비디오 서비스를 제공할 수 있는 다시점 비디오의 스케일러블 코딩 방법 및 장치를 제공하는데 그 목적이 있다.

또한, 본 발명은 다시점 비디오에 대해 스케일러블 코딩된 신호를 수신하여 디코딩하기 위한 디코딩 방법 및 장치를 제공하는데 그 목적이 있다.

본 발명의 다른 목적 및 장점들은 하기의 설명에 의해서 이해될 수 있으며, 본 발명의 실시예에 의해 보다 분명하게 알게 될 것이다. 또한, 본 발명의 목적 및 장점들은 특허 청구 범위에 나타낸 수단 및 그 조합에 의해 실현될 수 있음을 쉽게 알 수 있을 것이다.

상기 목적을 달성하기 위한 본 발명에 따른 스케일러블 비디오 코딩 장치는, 다시점 비디오에 대한 스케일러블 비디오 코딩 장치에 있어서, 하나의 기초 비디오에 대해 공간 필터링을 통해 다계층 해상도로 분리하고, 분리된 저해상도 영상 프레임 및 적어도 하나 이상의 고해상도 영상 프레임 각각에 대해 시공간 예측을 통해 스케일러블 비디오 코딩을 수행하는 기초 스케일러빌리티 비디오 인코더; 및 동일 시점에 촬영된 자신의 비디오와 참조 비디오로 적어도 하나 이상의 타 비디오를 입력받아, 공간 필터링을 통해 다계층 해상도로 분리하고, 분리된 저해상도 영상 프레임에 대해 자신의 인접 프레임뿐만 아니라 동일 시간 축에서 상기 타 비디오 프레임을 참조하여 시공간 예측을 통해 스케일러블 비디오 코딩을 수행하며, 분리된 적어도 하나 이상의 고해상도 영상 프레임에 대해 자신의 하위 계층뿐만 아니라 상기 타 비디오 프레임의 하위 계층을 참조하여 시공간 예측을 통해 스케일러블 비디오 코딩을 수행하는 복수의 확장된 스케일러빌리티 비디오 인코더를 포함한다.

또한 본 발명에 따른 스케일러블 비디오 코딩 방법은, 다시점 비디오에 대한 스케일러블 비디오 코딩 방법에 있어서, (a) 하나의 기초 비디오에 대해 다계층 해상도로 분리하여, 시공간 예측을 통해 스케일러블 비디오 코딩을 수행하는 단계; 및 (b) 동일 시점에 촬영된 자신의 비디오와 참조 비디오로 적어도 하나 이상의 타 비디오를 입력받아, 입력된 비디오들에 대해 다계층 해상도로 분리하여 시공간 예측을 통해 스케일러블 비디오 코딩을 수행하는 단계를 포함하되, 상기 (b) 단계는, (c) 저해상도 영상 프레임에 대해 자신의 인접 프레임뿐만 아니라 동일 시간 축에서 상기 타 비디오 프레임을 참조하여 시공간 예측을 통해 스케일러블 비디오 코딩을 수행하는 단계와, (d) 적어도 하나 이상의 고해상도 영상 프레임에 대해 자신의 하위 계층뿐만 아니라 상기 타 비디오 프레임의 하위 계층을 참조하여 시공간 예측을 통해 스케일러블 비디오 코딩을 수행하는 단계를 포함한다.

한편, 본 발명에 따른 디코딩 장치는, 다시점 비디오에 대한 스케일러블 비디오 디코딩 장치에 있어서, 하나의 기초 비디오에 대해 스케일러블 코딩된 비트스트림을 수신하여, 역시간 변환 및 역 공간 변환을 통해 복원하는 기초 스케일러빌리티 비디오 디코더; 및 동일 시점에 촬영된 자신의 비디오와 참조 비디오에 대해 시공간 예측을 통해 스케일러블 코딩된 비트스트림을 수신하여, 자신의 하위 계층뿐만 아니라 참조 비디오인 타 비디오 프레임의 하위 계층의 참조 여부에 따라 역 시공간 예측을 통해 적어도 하나 이상의 고해상도 영상 프레임을 복원하고, 자신의 인접 프레임뿐만 아니라 동일 시간 축에서 상기 타 비디오 프레임의 참조 여부에 따라 역 시공간 예측을 통해 저해상도 영상 프레임을 복원한 후, 상기 복원된 고해상도 영상 프레임과 상기 복원된 저해상도 영상 프레임에 대해 역공간 필터링을 통해 영상을 복원하는 복수의 확장된 스케일러빌리티 비디오 디코더를 포함한다.

바람직하게는 상기 확장된 스케일러빌리티 비디오 디코더는, 수신된 비트스트림을 역다중화하는 역다중화수단; 상기 역다중화수단에 의해 출력된 고해상도 영상 신호에 대해 자신의 비디오에 대한 하위 계층뿐만 아니라 참조 비디오인 타 비디오에 대한 하위 계층의 참조 여부에 따라 역 시공간 움직임 예측을 통해 스케일러블 디코딩을 수행하는 적어도 하나 이상의 향상계층 디코딩수단; 상기 역다중화수단에 의해 출력된 저해상도 영상 신호에 자신의 비디오 프레임에 대한 역 시공간 움직임 예측뿐만 아니라 시간 축에서 참조 비디오 프레임에 대한 역 움직임 예측을 통해 스케일러블 디코딩을 수행하는 기초계층 디코딩수단; 상기 향상계층 디코딩수단에 의해 복원된 고해상도 영상 및 상기 기초계층 디코딩수단에 의해 복원된 저해상도 영상에 대해 역 공간적 필터링을 통해 영상을 복원하는 역공간적 비디오 필터링 수단을 포함한다.

바람직하게는 상기 향상계층 디코딩수단은, 하위 계층의 움직임 벡터 정보의 사용 여부를 나타내는 플래그와 타 비디오에 대한 하위 계층의 참조 인덱스를 예측 정보로 이용하는지의 여부를 나타내는 플래그와, 하위 계층의 인트라 블록의 타입을 예측정보로 이용하는지 여부를 나타내는 플래그와, 하위 계층의 차분 영상 값의 이용 여부에 대한 플래그와, 예측에 사용된 참조 뷰의 인덱스를 참조하여 스케일러블 디코딩을 수행한다.

또한 상기 목적을 달성하기 위한 본 발명에 따른 디코딩 방법은, 다시점 비디오에 대한 스케일러블 비디오 디코딩 방법에 있어서, (a) 하나의 기초 비디오에 대해 역 시공간 예측을 통해 스케일러블 비디오 디코딩을 수행하는 단계; 및 (b) 동일 시점에 촬영된 자신의 비디오와 참조 비디오로 적어도 하나 이상의 타 비디오를 참조하여 스케일러블 코딩된 비트스트림을 수신하여, 역 시공간 예측과 역 공간 필터링을 통해 스케일러블 비디오 디코딩을 수행하는 단계를 포함하되, 상기 (b) 단계는, (c) 역다중화된 고해상도 영상 프레임에 대해 자신의 하위 계층뿐만 아니라 상기 타 비디오 프레임의 하위 계층의 참조 여부 정보에 따라 역 시공간 예측을 통해 스케일러블 비디오 디코딩을 수행하는 단계; 및 (d) 역다중화된 저해상도 영상 신호에 대해 자신의 인접 프레임뿐만 아니라 동일 시간 축에서 상기 타 비디오 프레임의 참조 여부 정보에 따라 역 시공간 예측을 통해 스케일러블 비디오 디코딩을 수행하는 단계를 포함한다.

바람직하게는, 상기 (c) 단계에서 하위 계층의 움직임 벡터 정보의 사용 여부를 나타내는 플래그와, 타 비디오에 대한 하위 계층의 참조 인덱스를 예측 정보로 이용하는지의 여부를 나타내는 플래그와, 하위 계층의 인트라 블록의 타입을 예측정보로 이용하는지 여부를 나타내는 플래그와, 하위 계층의 차분 영상 값의 이용 여부에 대한 플래그와, 예측에 사용된 참조 뷰의 인덱스 정보를 이용해 스케일러블 비디오 디코딩을 수행하는 한다.

상기와 같은 본 발명은, 일반적인 스케일러블 코딩 기술의 시공간 계층적 구조를 다시점 비디오 간으로 확장하여 다시점 비디오를 효과적으로 압축할 수 있다. 또한, 본 발명은 다시점 비디오에 대하여 시간 및 공간축 상으로 계층적 구조를 구성함으로써 다양한 형태의 2차원 또는 3차원 단말기에 스케일러블하게 비디오 서비스를 제공할 수 있다.

도 1은 일반적인 스케일러블 비디오 코딩 개념을 설명하기 위한 도면,

도 2는 본 발명의 일 실시예에 따른 다시점 비디오에 대한 스케일러블 비디오 코딩 장치의 블록 구성도,

도 3은 본 발명에 따른 확장된 스케일러빌리티 비디오 인코더의 기능 블록 구성도,

도 4는 본 발명에 따른 다시점 비디오에 대한 다계층 비디오 압축을 위한 프레임 참조 구조를 설명하기 위한 도면,

도 5는 도 4에 대한 계층간 참조 구조를 설명하기 위한 도면,

도 6은 본 발명에 따른 다시점 비디오에 대한 B 프레임 움직임 예측 구조에 대한 프레임 참조 구조를 설명하기 위한 도면,

도 7은 도 6에 대한 계층간 참조 구조를 설명하기 위한 도면,

도 8은 본 발명의 다른 실시예에 따른 다시점 비디오에 대한 스케일러블 비디오 코딩 장치의 블록 구성도,

도 9는 도 8에 대한 다계층 비디오 압축을 위한 프레임 참조 구조를 설명하기 위한 도면이다.

상술한 목적, 특징 및 장점은 첨부된 도면과 관련한 다음의 상세한 설명을 통하여 보다 분명해 질 것이며, 그에 따라 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자가 본 발명의 기술적 사상을 용이하게 실시할 수 있을 것이다. 또한, 본 발명을 설명함에 있어서 본 발명과 관련된 공지 기술에 대한 구체적인 설명이 본 발명의 요지를 불필요하게 흐릴 수 있다고 판단되는 경우에 그 상세한 설명을 생략하기로 한다. 이하, 첨부된 도면을 참조하여 본 발명에 따른 바람직한 일실시예를 상세히 설명하기로 한다.

도 2는 본 발명에 따른 다시점 비디오의 스케일러블 코딩 장치의 일 예시도이다. 도 2에서는 비디오 0부터 비디오 4까지 5개의 카메라로 촬영된 비디오가 입력되는 경우 각 비디오를 스케일러블 비디오 인코더(scalable video encoder)로 압축하는 경우를 나타낸 것이다.

본 발명에 따른 다시점 비디오의 스케일러블 코딩 장치는 기초 비디오인 비디오 0에 대해 2차원 공간 변환과 시간 변환을 수행하고, 모션 코딩과 텍스쳐 코딩을 통해 스케일러블 코딩을 수행하는 기초 스케일러빌리디 비디오 인코더(21)와, 각각 대응되는 자신의 비디오뿐만 아니라 참조 비디오인 적어도 하나 이상의 주변의 타 비디오를 입력받아 공간적 필터링 및 시간적 필터링을 통해 다계층 해상도로 분리하고, 상기 분리된 프레임에 대해 자신의 비디오뿐만 아니라 주변의 비디오들의 시공간 계층 영상 정보 및 압축 파라미터를 참조하여 스케일러블 코딩을 수행하는 복수의 확장된 스케일러빌리티 비디오 인코더들(22 내지 25)을 포함한다.

도면에서 비디오 0은 기초 비디오로 정의되며, 비디오 0에 대해 스케일러블 코딩을 수행하는 기초 스케일러빌리티 비디오 인코더(21)는 종래의 단일시점 비디오의 스케일러블 코딩 장치와 동일한 구조를 갖는다. 따라서 기초 비디오의 경우 기존의 스케일러블 코딩 장치들과 호환될 수 있는 구조이다.

그리고, 자신의 비디오뿐만 아니라 참조 비디오인 주변 비디오를 참조하여 스케일러블하게 압축하기 위하여, 비디오 1에서부터 비디오 4까지는 확장된 스케일러빌리티 비디오 인코더(22 내지 25)를 통해 압축을 수행한다. 확장된 스케일러빌리티 비디오 인코더(22 내지 25)는 기존의 단일시점 비디오의 스케일러블 코딩 장치와 같이 자신의 비디오와 참조 비디오인 주변 비디오를 입력받아 공간 필터링을 통해 다계층 해상도로 분리하고, 분리된 각 프레임에 대해 시간 및 공간 축 상에서 자신의 프레임에 대한 하위 계층뿐만 아니라 주변의 프레임에 대한 하위 계층을 참조하여 스케일러블 코딩을 수행한다. 예를 들어, 비디오 4를 압축하는 확장된 스케일러빌리티 비디오 인코더(25)는 기초 비디오 0의 다계층 시공간 해상도 영상 정보를 예측 참조하는 방법으로 자신의 비디오 4에 대해 스케일러블 비디오 코딩을 수행한다. 또한, 비디오 2를 압축하는 확장된 스케일러빌리티 비디오 인코더(23)는 기초 비디오 0과 비디오 4의 다계층 시공간 해상도 영상 정보를 이용하여 양방향 예측을 통해 자신의 비디오에 대한 압축을 수행한다.

이에 따라 기초 스케일러빌리티 비디오 인코더(21)만을 이용하는 경우 기존의 2차원 비디오 서비스가 가능하며, 기초 비디오 0에 대한 기초 스케일러빌리티 비디오 인코더(21)와 비디오 4에 대한 확장된 스케일러빌리티 비디오 인코더(25)를 이용하는 경우 스테레오 비디오 서비스가 가능하게 된다. 또한 확장된 스케일러빌리티 비디오 인코더들(22 내지 25)과, 기초 스케일러빌리티 비디오 인코더(21)를 선택적으로 조합하는 것에 의해 3 뷰(view) 또는 5 뷰 비디오 서비스가 가능하게 된다.

이와 같은 확장된 스케일러빌리티 비디오 인코더의 구조 및 기능에 대해서는 도 3 이하를 참조하여 구체적으로 살펴본다.

도 3은 본 발명에 따른 확장된 스케일러빌리티 비디오 인코더의 상세 기능 블록 구성도이다.

본 발명에 따른 확장된 스케일러빌리티 비디오 인코더는 자신의 비디오와 참조 비디오에 대해 공간적 필터링을 통해 다계층 해상도로 분리하는 공간적 비디오 필터링부(31)와, 상기 공간적 비디오 필터링부(31)의 출력 영상들에 대해 시간적 필터링을 통해 시간으로 분리하는 시간적 비디오 필터링부(330, 340)와, 시간적 비디오 필터링부(330)로부터 출력된 시간적 저주파수 영상들에 대해 자신의 비디오 프레임에 대한 시공간 움직임 예측뿐만 아니라 시간 축에서 참조 비디오 프레임에 대한 움직임 예측을 통해 스케일러블 코딩을 수행하는 기초계층 인코더(33)와, 시간적 비디오 필터링부(340)로부터 출력된 시간적 고주파수 영상들에 대해 자신의 비디오의 하위 계층뿐만 아니라 참조 비디오인 주변의 타 비디오의 하위 계층을 참조하여 스케일러블 코딩을 수행하는 적어도 하나 이상의 향상계층 인코더(34)와, 기초계층 인코더의 출력과 향상 계층 인코더의 출력을 다중화하여 하나의 비트스트림을 출력하는 다중화부(35)를 포함한다.

공간적 비디오 필터링부(31)는 자신의 카메라를 통해 촬영된 자신의 비디오와 참조 비디오로 설정된 주변의 타 비디오를 소정의 시간단위로 입력받아 MCTF 또는 계층적 B 구조를 이용한 공간적 필터링을 통해 다계층 해상도로 분리한다.

기초 계층 인코더(33)와 향상 계층 인코더(34)는 시간적 비디오 필터링부(330, 340)와, 모션 코딩부(331, 341)와, 차분기(332, 342)와, 공간적 변환부(333, 343)와, 양자화부(334, 344), 엔트로피 부호화부(335, 345)를 포함할 수 있다. 이와 같은 기초 계층 인코더(33)와 향상 계층 인코더(34)는 종래의 스케일러블 비디오 인코더와 그 구조가 유사하며, 여기서는 각 기능부에 대해 간단히 살펴보기로 한다.

기초 계층 인코더(33)에 구비된 시간적 비디오 필터링부(330)는 상기 공간적 필터링에 의해 분리된 저주파수 영상들에 대해 MCTF 또는 계층적 B 구조를 이용한 필터링을 통해 시간 축으로 분리한다. 또한 향상 계층 인코더(34)에 구비된 시간적 비디오 필터링부(340)는 상기 공간적 필터링에 의해 분리된 고주파수 영상들에 대해 MCTF 또는 계층적 B 구조를 이용한 필터링을 통해 시간 축으로 분리한다.

모션 코딩부(331, 341)는 통상 모션 추정과 모션 보상으로 구성된다. 모션 추정은 입력 비디오 프레임들 중에서 참조 프레임을 기준으로 현재 프레임의 모션 추정을 수행하고, 순방향 예측 또는 양방향 예측을 위한 모션 벡터를 구한다. 여기서, 본 발명은 모션 추정 시 참조 프레임으로 자신의 프레임뿐만 아니라 주변의 프레임이 사용될 수 있다. 이러한 움직임 추정을 위해 널리 사용되는 알고리즘은 블록 매칭(block matching) 알고리즘이다. 즉, 주어진 모션 블록을 참조 프레임의 특정 탐색영역 내에서 픽셀단위로 움직이면서 그 에러가 최저가 되는 경우의 변위를 움직임 벡터로 추정한다. 모션 추정의 결과 구해지는 모션 벡터, 모션 블록의 크기, 참조 프레임 번호 등의 모션 데이터는 엔트로피 부호화부(335, 345)로 제공된다. 또한 모션 보상은 모션 추정에 의해 계산된 모션 벡터를 이용하여 순방향 참조 프레임 또는 역방향 참조 프레임 또는 양방향 참조 프레임에 대하여 모션 보상(motion compensation)을 수행함으로써 현재 프레임에 대한 시간적 예측 프레임을 생성한다.

차분기(332, 342)는 현재 프레임과 시간적 예측 프레임을 차분함으로써 비디오의 시간적 중복성을 제거한다. 공간적 변환부(333, 343)는 차분기(332, 342)에 의하여 시간적 중복성이 제거된 프레임에 대하여, 공간적 스케일러빌리티를 지원하는 공간적 변환법을 사용하여 공간적 중복성를 제거한다. 이러한 공간적 변환법으로는 주로 DCT(Discrete Cosine Transform), 웨이블릿 변환(wavelet transform) 등이 사용된다.

양자화부(334, 344)는 공간적 변환부(333, 343)에서 구한 변환 계수를 양자화한다. 양자화(quantization)란 임의의 실수값으로 표현되는 상기 변환 계수를 일정 구간으로 나누어 불연속적인 값(discrete value)으로 나타내고, 이를 소정의 인덱스로 매칭시키는 작업을 의미한다.

엔트로피 부호화부(335, 345)는 양자화부(334, 344)에 의하여 양자화된 변환 계수와, 모션 추정에 의하여 제공되는 모션 데이터를 무손실 부호화하고 출력 비트스트림을 생성한다. 이러한 무손실 부호화 방법으로는, 산술 부호화(arithmetic coding), 가변 길이 부호화(variable length coding) 등이 사용될 수 있다.

한편, 본 발명은 공간적 변환 이전에 인트라 블록을 위한 인트라 예측이 사용될 수 있다. 이를 위해 향상 계층 인코더는 하위 계층 인코더로부터 복원된 참조 프레임을 전달받아 2차원 공간 보간을 수행하는 기능과 인트라 예측 기능이 포함될 수 있다.

일반적으로 인터 예측은 참조 프레임으로부터　현재　프레임의 어떤 블록(현재 블록)과 가장 유사한 블록을 탐색하고, 이로부터 현재 블록을 가장 잘 표현할 수 있는 예측 블록을 얻은 후, 상기 현재 블록과 상기 예측 블록과의 차분을 양자화하는 방식이다. 인터 예측은 참조 프레임을 참조하는 방식에 따라 두　개의　참조　프레임을 사용하는 양방향 예측(bi-directional prediction)과, 이전　참조 프레임이 사용되는 순방향 예측(forward prediction)과, 이후 참조 프레임이 사용되는 역방향 예측(backward prediction) 등이 있다.

한편, 인트라 예측은, 현재 블록의 주변 블록 중 현재 블록과 인접한 프레임을 이용하여 현재 블록을 예측하는　방식이다. 인트라 예측은 현재 프레임 내의 정보만을 이용하며 동일 계층 내의 다른 프레임이나 다른 계층의 프레임을 참조하지 않는 점에서 다른 예측 방식과 차이가 있다.

인트라 베이스 예측(intra base prediction)은, 현재　프레임이 동일한 시간적 위치를 갖는 하위 계층의 프레임을 갖는 경우에 사용될 수 있다. 현재 프레임의 매크로블록은 대응되는 기초 프레임의 매크로블록으로부터 효율적으로 예측될 수 있다. 즉, 현재 프레임의 매크로블록과 대응되는 기초 프레임의 매크로블록과의 차분이 양자화된다. 만일　하위 계층의 해상도와 현재 계층의 해상도가 서로 다른 경우에는, 상기 차분을 구하기 전에 상기 기초 프레임의 매크로블록은 상기 현재 계층의 해상도로 업샘플링된다.

잔차 예측은 단일 계층에서의 인터 예측을 다계층의 형태로 확장한 것으로, 현재 계층의 인터 예측 과정에서 생성된 차분을 직접 양자화하는 것이 아니라, 상기 차분과 하위 계층의 인터 예측 과정에서 생성된 차분을 다시 차감하여 그 결과를 양자화하는 기법이다.

한편, 본 발명에서 향상계층 인코더는 고해상도 영상 프레임에 대한 부호화 시, 움직임 예측을 위하여 자신의 비디오에 대한 기초 계층 영상(저해상도 영상)과 참조 비디오인 타 비디오에 대한 기초 계층 영상(저해상도 영상)의 움직임 벡터를 두 배한 값을 사용한다.

또한, 본 발명에서 향상계층 인코더는 고해상도 영상 프레임에 대한 부호화 시, 차영상 예측을 위하여 자신의 비디오에 대한 기초 계층 영상(저해상도 영상)과 참조 비디오인 타 비디오에 대한 기초 계층 영상(저해상도 영상)의 예측 후 잔여영상을 보간하여 차영상 예측을 수행한다.

또한, 본 발명에서 향상계층 인코더는 고해상도 영상 프레임에 대한 부호화 시, 인트라 예측을 위하여 자신의 비디오에 대한 기초 계층 영상(저해상도 영상)과 참조 비디오인 타 비디오에 대한 기초 계층 영상(저해상도 영상)을 인트라 예측 모드로 인트라 예측을 수행한다.

도 4는 본 발명에 따른 스케일러블 비디오 코딩 시 예측 참조 구조를 설명하기 위한 도면이다.

도면에서 P 매크로블록은 단방향 예측을 나타내고, B 매크로블록은 양방향 예측을 나타낸다. 본 발명에 따른 예측 참조는 단방향 예측(P 매크로블록)과 양방향 예측(B 매크로블록)을 시간 축과 공간(뷰)축 뿐만 아니라 다수의 해상도 계층에서 예측을 수행하는 구조이다.

도 4는 하나의 실시예로 기초 계층과 하나의 향상 계층으로 구성된 2계층 구조만을 나타낸 것으로, 더 많은 계층은 향상 계층을 반복적으로 확장함으로써 구성될 수 있다.

도 4에서 41은 기초 스케일러빌리티 비디오 인코더(도2의 21) 내의 기초 계층 인코더 및 향상 계층 인코더에서 수행되는 예측 참조를 나타내고, 42는 도 2에 도시된 비디오 1에 대한 확장된 스케일러빌리티 비디오 인코더(22) 내의 기초 계층 인코더 및 향상 계층 인코더에서 수행되는 예측 참조를 나타내며, 43은 도 2에 도시된 비디오 2에 대한 확장된 스케일러빌리티 비디오 인코더(23) 내의 기초 계층 인코더 및 향상 계층 인코더에서 수행되는 예측 참조를 나타낸다.

다시 말해, 도 4에서 기초 계층 0(L0)은 기초 스케일러빌리티 비디오 인코더(21)의 기초 계층 인코더와, 비디오 1에 대한 확장된 스케일러빌리티 비디오 인코더 22의 기초 계층 인코더와, 비디오 2에 대한 확장된 스케일러빌리티 비디오 인코더 23의 기초 계층 인코더에서 각각 수행되는 예측 참조 구조를 나타낸 것이다.

마찬가지로, 도 4에서 향상 계층 1(L1)은 기초 스케일러빌리티 비디오 인코더(21)의 향상 계층 인코더와, 비디오 1에 대한 확장된 스케일러빌리티 비디오 인코더 22의 향상 계층 인코더와, 비디오 2에 대한 확장된 스케일러빌리티 비디오 인코더 23의 향상 계층 인코더에서 각각 수행되는 예측 참조 구조를 나타낸 것이다.

도 4를 참조하면, 기초 스케일러빌리티 비디오 인코더(21)의 기초 계층 인코더는 종래와 같이 시간축 상에서 자신의 저해상도 영상 프레임들에 대해 인접 프레임들을 예측 참조하여 스케일러블 비디오 코딩을 수행한다. 그리고 비디오 1을 위한 확장된 스케일러빌리티 비디오 인코더(22)의 기초 계층 인코더는 동일 시간축 상에 위치한 참조 주변 비디오 프레임인 비디오 0의 프레임과 비디오 2의 프레임을 이용해 자신의 프레임에 대한 양방향 예측을 수행한다. 또한 비디오 2를 위한 확장된 스케일러빌리티 비디오 인코더(23)의 기초 계층 인코더는 기본 비디오 0을 참조하여 단방향 예측을 수행함과 동시에 자신의 프레임을 이용해 양방향 예측을 수행한다.

한편, 기본 계층의 상위 계층인 향상 계층 1(L1)은 자신의 비디오 프레임에 대한 공간 및 시간 예측뿐만 아니라 하위 계층인 기초 계층의 자신 프레임과 기초 계층의 주변 프레임을 참조하여 예측을 수행한다. 도면에서 각 매크로블록에 원과 가위표로 표현된 세 개의 표시는 하위 계층의 참조 여부를 나타내기 위한 것이다. 여기서, 세 개의 표시중 중간에 있는 "원"이나 "가위표"는 자신의 비디오 프레임에 대한 하위 계층의 참조 여부를 나타내고, 위와 아래에 표시된 "원"이나 "가위표"는 주변 비디오 프레임에 대한 하위 계층의 참조 여부를 나타낸다.

도 4를 참조하면, 기초 스케일러빌리티 비디오 인코더(21)의 향상 계층 인코더는 종래와 같은 자신의 하위 계층의 프레임을 참조하여 스케일러블 비디오 코딩을 수행한다. 그리고 비디오 1을 위한 확장된 스케일러빌리티 비디오 인코더(22)의 향상 계층 인코더는 자신의 하위 계층의 프레임을 참조할 뿐만 아니라 주변 비디오 프레임인 비디오 0의 하위 계층 프레임과 비디오 2의 하위 계층 프레임을 참조하여 자신의 프레임에 대한 양방향 예측을 수행한다. 또한 비디오 2를 위한 확장된 스케일러빌리티 비디오 인코더(23)의 향상 계층 인코더는 자신의 하위 계층의 프레임을 참조할 뿐만 아니라 기본 비디오 0의 하위 계층 프레임을 참조하여 예측을 수행한다.

도 5는 도 4에 도시된 참조 구조를 시간을 고정시키고 공간(뷰) 계층 축에서 참조 구조를 "원"과 "가위표"로 나타낸 것이다. 도 5에서는 3개 계층의 경우를 나타내고 있다. 도 5에서 51은 기초 비디오인 비디오 0의 참조 구조를 나타내고, 52는 비디오 1의 참조 구조를 나타내며, 53은 비디오 2의 참조 구조를 나타낸다.

도 5에서 비디오 0(51)에 대한 향상 계층 2의 매크로블록은 중간만 "원"이고 양쪽 모두 "가위표"이므로, 자신의 비디오에 대한 하위 계층만을 참조하여 기존의 스케일러블 비디오 코딩(SVC: scalable video coding)에서 사용하는 움직임과 차영상 및 인트라 예측을 통해 코딩한다. 반면, 비디오 1(52)에 대한 향상 계층 2의 매크로블록은 중간뿐만 아니라 오른쪽 및 왼쪽 모두 "원"이므로 자신의 비디오에 대한 하위 계층뿐만 아니라 주변의 비디오에 대한 하위 계층을 참조하여 스케일러블 비디오 코딩을 수행한다. 또한 비디오 2(53)에 대한 향상 계층 2의 매크로블록은 중간 및 왼쪽이 "원"으로 표현되었으므로, 자신의 비디오의 하위 계층과 비디오 0의 하위 계층을 참조하여 스케일러블 비디오 코딩을 수행한다.

이상에서 설명한 바와 같은 하위 계층의 참조 여부를 나타내기 위해, 하위 계층의 참조 여부에 따라 참조 계층의 비디오에 대한 정보를 추가한 스케일러블 비디오의 구문이 필요하다.

다음의 구문에서 ref_view_Idx는 하위 계층의 참조 비디오의 뷰 번호를 나타낸다. 여기서 base_mode_flag는 하위 계층의 움직임 벡터 정보를 현재 블록의 움직임 예측에 사용을 할 것인지를 나타내는 플래그로, 값이 1일 경우 하위 계층의 어느 뷰의 움직임 벡터 정보를 이용한 것인지를 나타내는 뷰 번호인 ref_view_Idx를 나타내 주어야 한다.

base_mode_refinement_flag 역시 하위 계층의 움직임 벡터 정보를 현재 블록의 움직임 벡터 예측에서 이용하는지를 나타내는 플래그로, base_mode_flag와의 차이점은 하위 계층의 참조 인덱스도 예측정보로 이용을 한다는 것이다. 따라서 플래그가 1인 경우 하위 계층 어떤 뷰의 움직임 벡터와 참조 인덱스 정보를 이용한 것인지를 나타내는 ref_view_Idx를 표시해 주어야 한다. intra_base_flag는 하위 계층의 인트라 블록의 타입을 현재블록의 블록타입의 예측정보로 이용하는 것에 대해 나타내는 플래그로, 1인 경우 하위 계층의 인트라 예측모드에 대한 정보를 현재 블록에서 이용하게 된다. 따라서 하위 계층의 어느 뷰의 인트라 블록 타입 정보를 이용하는지에 대한 뷰 번호인 ref_view_Idx를 표시해 주어야 한다.

residual_prediction_flag는 하위 계층의 차분 영상 값을 현재 블록의 차분영상의 예측에 이용하는지에 대한 여부를 나타내는 플래그로, 1인 경우 하위 계층의 차분영상 정보를 업 샘플링하여 이용하게 된다. 역시 이때에도 하위 계층의 어떤 뷰의 차분 영상 정보를 이용하는지에 대한 뷰 번호인 ref_view_Idx를 표시해 주어야 한다. 이상과 같은 스케일러블 비디오의 구문을 표로 나타내면, 표 1과 같다.

도 6은 기본 스케일러블 구조에서 계층적 B구조가 아닌 기존의 B 프레임 구조의 경우에서 참조 구조의 하나의 실시 예를 나타낸다. 도 6에서 61은 기초 비디오인 비디오 0에 대한 참조 구조를 나타내고, 62는 비디오 1에 대한 참조 구조를 나타내며, 63은 비디오 2에 대한 참조 구조를 나타낸다.

또한 도 7은 도 6에 도시된 참조 구조를 시간을 고정시키고 공간(뷰) 계층 축에서 참조 구조를 "원"과 "가위표"로 나타낸 것이다. 마찬가지로, 도 7에서는 3개 계층의 경우를 나타낸다. 도 7에서 71은 기초 비디오인 비디오 0의 참조 구조를 나타내고, 72는 비디오 1의 참조 구조를 나타내며, 73은 비디오 2의 참조 구조를 나타낸다.

도 6 및 도 7을 참조하면, 기초 비디오인 비디오 0(61, 71)은 자신의 하위 계층 프레임만을 참조하여 스케일러블 비디오 코딩을 수행한다. 하지만, 비디오 1과 비디오 2는 자신의 하위 계층 프레임을 참조할 뿐만 아니라 주변 비디오의 하위 계층을 참조하여 스케일러블 비디오 코딩을 수행한다.

이상에서 설명한 바와 같은 본 발명에 따른 예측 참조 구조는 B 프레임 예측 구조가 아닌 기존의 P 프레임 구조의 경우에도 동일하게 적용될 수 있다.

도 8은 본 발명에 따른 다른 실시 예에 따른 다시점 비디오의 스케일러블 코딩 장치의 블록 구성도이고, 도 9는 도 8에서 기초 비디오인 비디오 0(91)과 주변 비디오인 비디오 1(92) 및 비디오 2(93)에 대한 참조 구조를 나타낸 것이다.

도 8 및 도 9를 참조하면, 기초 비디오인 비디오 0에 대한 스케일러블 코딩을 수행하는 기초 스케일러빌리티 비디오 인코더(81)는 종래의 단일시점 비디오의 스케일러블 코딩 장치와 동일하게 자신의 하위 계층을 참조하여 스케일러블 비디오 코딩을 수행한다. 따라서 기초 비디오의 경우 기존의 스케일러블 코딩 장치들과 호환이 될 수 있다.

그리고, 비디오 1에서부터 비디오 4까지는 확장된 스케일러빌리티 비디오 인코더(82 내지 85)를 통해 스케일러브 비디오 코딩을 수행한다. 확장된 스케일러빌리티 비디오 인코더(82 내지 85)는 기존의 단일시점 비디오의 스케일러블 코딩 장치와 같이 영상을 다계층 해상도로 분리하고, 분리된 영상 프레임에 대해 시공간으로 예측을 수행할 뿐만 아니라 주변 비디오의 시공간 계층 영상 정보 및 압축 파라메터를 참조하여 압축을 수행한다.

예를 들어, 도 9에 도시된 바와 같이 비디오 1의 향상 계층 1(92)은 비디오 0의 하위 계층을 참조하여 스케일러블 비디오 코딩을 수행하고, 비디오 2의 향상 계층 1(93)은 비디오 1의 하위 계층을 참조하여 스케일러블 비디오 코딩을 수행한다. 다시 말해, 도 8에 도시된 바와 같이 본 발명의 다른 실시 예는 확장된 스케일러빌리티 비디오 인코더가 바로 옆의 하나의 비디오만을 순차적으로 참조하여 스케일러블 비디오 코딩을 수행한다.

이에 따라 기초 스케일러빌리티 비디오 인코더(81)만을 이용하는 경우 기존의 2차원 비디오 서비스가 가능하며, 기초 비디오 0에 대한 기초 스케일러빌리티 비디오 인코더(81)와 비디오 1에 대한 확장된 스케일러빌리티 비디오 인코더(82)를 이용하는 경우 스테레오 비디오 서비스가 가능하게 된다. 또한 기초 비디오 0과 비디오 1과 비디오 2에 의해 3 뷰(view) 서비스가 가능하며, 기초 비디오 0부터 비디오 4에 의해 5 뷰 서비스가 가능하다.

이상에서 설명한 바와 같은 본 발명에 따른 다시점 비디오에 대한 스케일러블 코딩 기술에 대해 정리하면 다음과 같다.

먼저, 하나의 기초 비디오(예를 들어, 비디오 0)에 대해 공간 축으로 공간 필터를 사용하여 다계층 해상도로 분리한다. 그리고, 상기 분리된 저해상도 영상 프레임에 대해 시간 축에서 계층적 움직임 예측을 통해 시공간 스케일러블 비디오 코딩을 수행한다. 또한 상기 분리된 고해상도 영상 프레임에 대해 하위 계층을 참조하여 시간 축에서 계층적 움직임 예측을 통해 시공간 스케일러블 비디오 코딩을 수행한다. 그리고, 코딩된 저해상도 영상과 코딩된 적어도 하나 이상의 고해상도 영상을 다중화하여 비트 스트림을 생성한다. 이와 같은 기초 비디오에 대한 스케일러블 비디오 코딩은 종래의 방법과 동일하다.

다음, 다시점 비디오들에 대한 확장된 스케일러블 비디오 코딩에 대해 살펴본다.

먼저, 자신의 비디오와 참조 비디오인 적어도 하나 이상의 주변 비디오를 입력받아, 입력된 자신의 비디오 및 주변 비디오에 대해 공간 축으로 공간 필터를 사용하여 다계층 해상도로 분리한다. 그리고 분리된 저해상도 영상 프레임에 대해 시간 축에서 자신의 인접 프레임뿐만 아니라 참조 프레임으로 주변의 프레임을 참조하여 계층적 움직임 예측을 통해 시공간 스케일러블 비디오 코딩을 수행한다. 또한 상기 분리된 고해상된 영상 프레임에 대해 시간 축에서 자신 비디오 프레임에 대한 하위 계층뿐만 아니라 참조 비디오인 주변 비디오 프레임의 하위 계층을 참조하여 계층적 움직임 예측을 통해 스케일러블 비디오 코딩을 수행한다. 그리고, 코딩된 저해상도 영상과 코딩된 적어도 하나 이상의 고해상도 영상을 다중화하여 비트 스트림을 생성한다.

이와 같이 확장된 스케일러블 비디오 코딩은 참조 프레임으로 자신의 인접 프레임 및 하위 계층 프레임만을 사용하는 단일 시점 비디오에 대한 스케일러블 비디오 코딩과 다르게 참조 프레임으로 자신의 하위 계층 프레임뿐만 아니라 주변의 하위 계층 프레임을 사용한다.

한편, 본 발명에 따른 다시점 비디오에 대한 스케일러블 비디오 디코딩 장치는 전술한 바와 같은 인코딩 장치의 역으로 수행된다.

본 발명에 따른 디코딩 장치에 살펴보면, 디코딩 장치는 하나의 기초 비디오에 대해 스케일러블 코딩된 비트스트림을 수신하여, 역시간 변환 및 역 공간 변환을 통해 복원하는 기초 스케일러빌리티 비디오 디코더; 및 동일 시점에 촬영된 자신의 비디오와 참조 비디오에 대해 시공간 예측을 통해 스케일러블 코딩된 비트스트림을 수신하여, 자신의 하위 계층뿐만 아니라 참조 비디오인 타 비디오 프레임의 하위 계층의 참조 여부에 따라 역 시공간 예측을 통해 적어도 하나 이상의 고해상도 영상 프레임을 복원하고, 자신의 인접 프레임뿐만 아니라 동일 시간 축에서 상기 타 비디오 프레임의 참조 여부에 따라 역 시공간 예측을 통해 저해상도 영상 프레임을 복원한 후, 상기 복원된 고해상도 영상 프레임과 상기 복원된 저해상도 영상 프레임에 대해 역공간 필터링을 통해 영상을 복원하는 복수의 확장된 스케일러빌리티 비디오 디코더를 포함한다.

본 발명에 따른 디코딩 장치에서 기초 스케일러빌리티 비디오 디코더는, 기존의 스케일러블 비디오 디코더와 동일한 구조를 갖는다. 따라서 이에 대한 구체적인 설명은 생략한다.

본 발명에서 확장된 스케일러빌리티 비디오 디코더는, 수신된 비트스트림을 역다중화하는 역다중화부와, 상기 역다중화부에 의해 출력된 고해상도 영상 신호에 대해 자신의 비디오에 대한 하위 계층뿐만 아니라 참조 비디오인 타 비디오에 대한 하위 계층의 참조 여부에 따라 역 시공간 움직임 예측을 통해 스케일러블 디코딩을 수행하는 적어도 하나 이상의 향상계층 디코더와, 상기 역다중화부에 의해 출력된 저해상도 영상 신호에 자신의 비디오 프레임에 대한 역 시공간 움직임 예측뿐만 아니라 시간 축에서 참조 비디오 프레임에 대한 역 움직임 예측을 통해 스케일러블 디코딩을 수행하는 기초계층 디코더와, 상기 향상계층 디코딩더에 의해 복원된 고해상도 영상 및 상기 기초계층 디코더에 의해 복원된 저해상도 영상에 대해 역 공간적 필터링을 통해 영상을 복원하는 역공간적 비디오 필터링부를 포함한다.

여기서, 기초계층 디코더와 향상 계층 디코더는 앞서 설명한 기초 계층 인코더 및 향상 계층 디코더의 역 동작을 수행하는 것으로, 이에 대한 구체적인 구조 및 동작에 대해서는 설명을 생략한다.

향상계층 디코더는, 고해상도 영상 신호에 대한 디코딩 시, 하위 계층의 움직임 벡터 정보의 사용 여부를 나타내는 플래그와 타 비디오에 대한 하위 계층의 참조 인덱스를 예측 정보로 이용하는지의 여부를 나타내는 플래그와, 하위 계층의 인트라 블록의 타입을 예측정보로 이용하는지 여부를 나타내는 플래그와, 하위 계층의 차분 영상 값의 이용 여부에 대한 플래그와, 예측에 사용된 참조 뷰의 인덱스를 참조하여 스케일러블 디코딩을 수행한다.

한편, 전술한 바와 같은 본 발명의 방법은 컴퓨터 프로그램으로 작성이 가능하다. 그리고 상기 프로그램을 구성하는 코드 및 코드 세그먼트는 당해 분야의 컴퓨터 프로그래머에 의하여 용이하게 추론될 수 있다.　또한, 상기 작성된 프로그램은 컴퓨터가 읽을 수 있는 기록매체(정보저장매체)에 저장되고, 컴퓨터에 의하여 판독되고 실행됨으로써 본 발명의 방법을 구현한다. 그리고 상기 기록매체는 컴퓨터가 판독할 수 있는 모든 형태의 기록매체를 포함한다.

이상에서 설명한 본 발명은, 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자에게 있어 본 발명의 기술적 사상을 벗어나지 않는 범위 내에서 여러 가지 치환, 변형 및 변경이 가능하므로 전술한 실시예 및 첨부된 도면에 의해 한정되는 것이 아니다.

Claims

다시점 비디오에 대한 스케일러블 비디오 코딩 장치에 있어서,

기초 비디오를 공간 필터링을 통해 다계층 해상도로 분리하고, 분리된 저해상도 영상 프레임 및 하나 이상의 고해상도 영상 프레임 각각에 대해 시공간 예측을 통해 스케일러블 비디오 코딩을 수행하는 기초 스케일러빌리티 비디오 인코더; 및

제1 비디오와 참조 비디오인 적어도 하나 이상의 비디오를 입력 받아, 공간 필터링을 통해 다계층 해상도로 분리하고, 분리된 저해상도 영상 프레임에 대해 제1 비디오 프레임의 인접 프레임 및 동일 시간 축에서의 참조 비디오 프레임을 참조하여 시공간 예측을 통해 스케일러블 비디오 코딩을 수행하며, 분리된 하나 이상의 고해상도 영상 프레임에 대해 상기 제1 비디오의 하위 계층 및 상기 참조 비디오의 하위 계층을 참조하여 시공간 예측을 통해 스케일러블 비디오 코딩을 수행하는 복수의 확장된 스케일러빌리티 비디오 인코더를 포함하는 다시점 비디오에 대한 스케일러블 비디오 코딩 장치.
제 1 항에 있어서,

상기 확장된 스케일러빌리티 비디오 인코더는,

입력된 상기 제1 비디오와 상기 참조 비디오에 대해 공간적 필터링을 통해 다계층 해상도로 분리하는 공간적 비디오 필터링 수단;

상기 공간적 비디오 필터링 수단의 저해상도 영상들에 대해 시간적 필터링을 통해 분리하고, 상기 제1 비디오 프레임에 대한 시공간 움직임 예측 및 시간 축에서 상기 참조 비디오 프레임에 대한 움직임 예측을 통해 스케일러블 코딩을 수행하는 기초계층 인코딩 수단;

상기 공간적 비디오 필터링 수단의 고해상도 영상들에 대해 시간적 필터링을 통해 분리하고, 상기 제1 비디오에 대한 하위 계층 및 상기 참조 비디오에 대한 하위 계층을 참조하여 시공간 움직임 예측을 통해 스케일러블 코딩을 수행하는 하나 이상의 향상계층 인코딩수단; 및

상기 기초계층 인코딩 수단의 출력과 향상 계층 인코딩 수단의 출력을 다중화하여 하나의 비트스트림을 출력하는 다중화수단을 포함하는, 다시점 비디오에 대한 스케일러블 비디오 코딩 장치.
제 2 항에 있어서,

상기 향상계층 인코딩수단은,

코딩의 결과로 상기 하위 계층의 움직임 벡터 정보의 사용 여부를 나타내는 플래그, 상기 참조 비디오에 대한 하위 계층의 참조 인덱스를 예측 정보로 이용하는지의 여부를 나타내는 플래그, 상기 하위 계층의 인트라 블록의 타입을 예측정보로 이용하는지 여부를 나타내는 플래그 및 상기 하위 계층의 차분 영상 값의 이용 여부에 대한 플래그를 각각 설정하고, 사용된 참조 뷰의 인덱스를 표시하는, 다시점 비디오에 대한 스케일러블 비디오 코딩 장치.
제 2 항에 있어서,

상기 향상 계층 인코딩수단은,

인트라 블록을 위한 인트라 예측을 위해 복원된 비디오 프레임에 대해 2차원 공간 보간을 수행하는 2차원 공간 보간수단을 더 포함하는, 다시점 비디오에 대한 스케일러블 비디오 코딩 장치.
제 2 항에 있어서,

상기 향상 계층 인코딩수단은,

시간 및 공간축 상에 프레임간 움직임과 차영상 및 인트라 예측을 통해 부호화하는, 다시점 비디오에 대한 스케일러블 비디오 코딩 장치.
제 5 항에 있어서,

상기 향상계층 인코딩수단은,

움직임 예측을 위하여 상기 제1 비디오에 대한 기초 계층 영상(저해상도 영상)과 상기 참조 비디오에 대한 기초 계층 영상(저해상도 영상)의 움직임 벡터를 두 배 한 값을 사용하여 움직임 예측을 수행하는, 다시점 비디오에 대한 스케일러블 비디오 코딩 장치.
제 5 항에 있어서,

상기 향상계층 인코딩수단은,

상기 차영상 예측을 위하여 상기 제1 비디오에 대한 기초 계층 영상(저해상도 영상)과 상기 참조 비디오에 대한 기초 계층 영상(저해상도 영상)의 예측 후 잔여영상을 보간하여 차영상 예측을 수행하는, 다시점 비디오에 대한 스케일러블 비디오 코딩 장치.
다시점 비디오에 대한 스케일러블 비디오 코딩 방법에 있어서,

(a) 기초 비디오를 공간 필터링을 통해 다계층 해상도로 분리하고, 분리된 저해상도 영상 프레임 및 하나 이상의 고해상도 영상 프레임 각각에 대해 시공간 예측을 통해 스케일러블 비디오 코딩을 수행하는 단계; 및

(b) 제1 비디오와 참조 비디오인 적어도 하나 이상의 비디오를 입력 받아, 공간 필터링을 통해 다계층 해상도로 분리하고, 분리된 저해상도 영상 프레임에 대해 제1 비디오 프레임의 인접 프레임 및 동일 시간 축에서의 참조 비디오 프레임을 참조하여 시공간 예측을 통해 스케일러블 비디오 코딩을 수행하며, 분리된 하나 이상의 고해상도 영상 프레임에 대해 상기 제1 비디오의 하위 계층 및 상기 참조 비디오의 하위 계층을 참조하여 시공간 예측을 통해 스케일러블 비디오 코딩을 수행하는 단계를 포함하는, 다시점 비디오에 대한 스케일러블 비디오 코딩 방법.
제 8 항에 있어서,

상기 (b) 단계는

코딩의 결과로 상기 하위 계층의 움직임 벡터 정보의 사용 여부를 나타내는 플래그, 상기 참조 비디오에 대한 하위 계층의 참조 인덱스를 예측 정보로 이용하는지의 여부를 나타내는 플래그, 상기 하위 계층의 인트라 블록의 타입을 예측정보로 이용하는지 여부를 나타내는 플래그 및 상기 하위 계층의 차분 영상 값의 이용 여부에 대한 플래그를 각각 설정하고, 사용된 참조 뷰의 인덱스를 표시하는, 다시점 비디오에 대한 스케일러블 비디오 코딩 방법.
제 8 항에 있어서,

상기 (b) 단계는

시간 및 공간축 상에 프레임간 움직임과 차영상 및 인트라 예측을 통해 부호화하는, 다시점 비디오에 대한 스케일러블 비디오 코딩 방법.
제 8 항에 있어서,

상기 (b) 단계는,

인트라 블록을 위한 인트라 예측을 위해 복원된 비디오 프레임에 대해 2차원 공간 보간을 수행하는, 다시점 비디오에 대한 스케일러블 비디오 코딩 방법.
제 8 항에 있어서,

상기 (b) 단계는,

움직임 예측을 위하여 상기 제1 비디오에 대한 기초 계층 영상(저해상도 영상)과 상기 참조 비디오에 대한 기초 계층 영상(저해상도 영상)의 움직임 벡터를 두 배 한 값을 사용하여 움직임 예측을 수행하는, 다시점 비디오에 대한 스케일러블 비디오 코딩 방법.
제 8 항에 있어서,

상기 (b) 단계는,

상기 차영상 예측을 위하여 상기 제1 비디오에 대한 기초 계층 영상(저해상도 영상)과 상기 참조 비디오에 대한 기초 계층 영상(저해상도 영상)의 예측 후 잔여영상을 보간하여 차영상 예측을 수행하는, 다시점 비디오에 대한 스케일러블 비디오 코딩 방법.
다시점 비디오에 대한 스케일러블 비디오 디코딩 장치에 있어서,

기초 비디오에 대해 스케일러블 코딩된 비트스트림을 수신하여, 역시간 변환 및 역 공간 변환을 통해 복원하는 기초 스케일러빌리티 비디오 디코더; 및

제1 비디오와 참조 비디오에 대해 시공간 예측을 통해 스케일러블 코딩된 비트스트림을 수신하여, 상기 제1 비디오의 하위 계층 및 상기 참조 비디오의 하위 계층의 참조 여부에 따라 역 시공간 예측을 통해 하나 이상의 고해상도 영상 프레임을 복원하고, 상기 제1 비디오에 포함된 프레임의 인접 프레임 및 동일 시간 축에서 상기 참조 비디오의 프레임의 참조 여부에 따라 역 시공간 예측을 통해 저해상도 영상 프레임을 복원한 후, 상기 복원된 고해상도 영상 프레임과 상기 복원된 저해상도 영상 프레임에 대해 역공간 필터링을 통해 영상을 복원하는 복수의 확장된 스케일러빌리티 비디오 디코더를 포함하는, 다시점 비디오에 대한 스케일러블 비디오 디코딩 장치.
제 14 항에 있어서,

상기 확장된 스케일러빌리티 비디오 디코더는,

수신된 비트스트림을 역다중화하는 역다중화수단;

상기 역다중화수단에 의해 출력된 고해상도 영상 신호에 대해 상기 제1 비디오에 대한 하위 계층 및 상기 참조 비디오에 대한 하위 계층의 참조 여부에 따라 역 시공간 움직임 예측을 통해 스케일러블 디코딩을 수행하는 하나 이상의 향상계층 디코딩수단;

상기 역다중화수단에 의해 출력된 저해상도 영상 신호에 상기 제1 비디오의 비디오 프레임에 대한 역 시공간 움직임 예측 및 시간 축에서 상기 참조 비디오의 프레임에 대한 역 움직임 예측을 통해 스케일러블 디코딩을 수행하는 기초계층 디코딩수단;

상기 향상계층 디코딩수단에 의해 복원된 고해상도 영상 및 상기 기초계층 디코딩수단에 의해 복원된 저해상도 영상에 대해 역 공간적 필터링을 통해 영상을 복원하는 역공간적 비디오 필터링 수단을 포함하는, 다시점 비디오에 대한 스케일러블 비디오 디코딩 장치.
제 15 항에 있어서,

상기 향상계층 디코딩수단은,

상기 하위 계층의 움직임 벡터 정보의 사용 여부를 나타내는 플래그, 상기 참조 비디오에 대한 하위 계층의 참조 인덱스를 예측 정보로 이용하는지의 여부를 나타내는 플래그, 상기 하위 계층의 인트라 블록의 타입을 예측정보로 이용하는지 여부를 나타내는 플래그, 상기 하위 계층의 차분 영상 값의 이용 여부에 대한 플래그 및 예측에 사용된 참조 뷰의 인덱스를 참조하여 스케일러블 디코딩을 수행하는, 다시점 비디오에 대한 스케일러블 비디오 디코딩 장치.
다시점 비디오에 대한 스케일러블 비디오 디코딩 방법에 있어서,

(a) 기초 비디오에 대해 스케일러블 코딩된 비트스트림을 수신하여, 역시간 변환 및 역 공간 변환을 통해 복원하는 단계; 및

(b) 제1 비디오와 참조 비디오에 대해 시공간 예측을 통해 스케일러블 코딩된 비트스트림을 수신하여, 상기 제1 비디오의 하위 계층 및 상기 참조 비디오의 하위 계층의 참조 여부에 따라 역 시공간 예측을 통해 하나 이상의 고해상도 영상 프레임을 복원하고, 상기 제1 비디오에 포함된 프레임의 인접 프레임 및 동일 시간 축에서 상기 참조 비디오의 프레임의 참조 여부에 따라 역 시공간 예측을 통해 저해상도 영상 프레임을 복원한 후, 상기 복원된 고해상도 영상 프레임과 상기 복원된 저해상도 영상 프레임에 대해 역공간 필터링을 통해 영상을 복원하는 단계를 포함하는, 다시점 비디오에 대한 스케일러블 비디오 디코딩 방법.
제 17 항에 있어서,

상기 (a) 단계는

상기 하위 계층의 움직임 벡터 정보의 사용 여부를 나타내는 플래그, 상기 참조 비디오에 대한 하위 계층의 참조 인덱스를 예측 정보로 이용하는지의 여부를 나타내는 플래그, 상기 하위 계층의 인트라 블록의 타입을 예측정보로 이용하는지 여부를 나타내는 플래그, 상기 하위 계층의 차분 영상 값의 이용 여부에 대한 플래그 및 예측에 사용된 참조 뷰의 인덱스를 참조하여 스케일러블 디코딩을 수행하는 단계를 포함하는, 다시점 비디오에 대한 스케일러블 비디오 디코딩 방법.