KR20050089868A - 비디오 코딩 및 디코딩 방법 - Google Patents

비디오 코딩 및 디코딩 방법 Download PDF

Info

Publication number
KR20050089868A
KR20050089868A KR1020057012440A KR20057012440A KR20050089868A KR 20050089868 A KR20050089868 A KR 20050089868A KR 1020057012440 A KR1020057012440 A KR 1020057012440A KR 20057012440 A KR20057012440 A KR 20057012440A KR 20050089868 A KR20050089868 A KR 20050089868A
Authority
KR
South Korea
Prior art keywords
frames
oriented
video
coding
coded
Prior art date
Application number
KR1020057012440A
Other languages
English (en)
Inventor
세실 두포어
그웨내일 마르큐안트
스테판 바렌테
Original Assignee
코닌클리케 필립스 일렉트로닉스 엔.브이.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 코닌클리케 필립스 일렉트로닉스 엔.브이. filed Critical 코닌클리케 필립스 일렉트로닉스 엔.브이.
Publication of KR20050089868A publication Critical patent/KR20050089868A/ko

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/20Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using video object coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/20Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using video object coding
    • H04N19/21Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using video object coding with binary alpha-plane coding for video objects, e.g. context-based arithmetic encoding [CAE]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

본 발명은 연속적인 프레임들 또는 비디오 객체 플레인들(VOP들)이 그들의 텍스처 및 모션 성분들 및 부가적인 모양 성분들에 의해 규정된 하나 이상의 임의의 형상의 비디오 객체들(VO들)을 포함하는 원 비디오 시퀀스에 적용되는 비디오 코딩 방법에 관한 것이다. 본 발명에 따라, 상기 방법은 비디오 시퀀스의 소수의 프레임들에 적용되는 비객체-지향 코딩 단계, 소수의 프레임들에 후속하는 시퀀스의 모든 프레임들에 적용되는 객체-지향 코딩 단계, 소수의 프레임들에 대응하는 비객체 지향 코딩된 데이터와, 이어서 후속 프레임들에 대응하는 객체 지향 코딩된 데이터를 포함하는 코딩된 비트스트림을 발생하도록, 비객체-지향 및 객체-지향 코딩 단계들이 적절한 프레임들에 각각 적용되도록 제어하기 위해 제공된 시퀀싱 단계를 포함하다. 또한, 본 발명은 대응하는 비디오 디코딩 방법에 관한 것이다.

Description

비디오 코딩 및 디코딩 방법{Video coding and decoding method}
본 발명은 일반적으로, 비디오 압축 분야에 관한 것으로서, 특히 MPEG계열의 비디오 코딩 표준들 및 ITU-H.26X 계열의 비디오 코딩 권고들에 관한 것이다. 보다 정확하게는, 연속적인 프레임들 또는 비디오 객체 플레인들(video object planes; VOP들)이 각 VOP에서 텍스처(texture) 및 모션 성분들 및 부가적인 모양 성분들에 의해 정의된 하나 이상의 임의의 형상의 비디오 객체들(VO들)을 포함하는 원(orignal) 비디오 시퀀스에 적용되는 비디오 코딩 방법 및 대응하는 디코딩 방법에 관한 것이다.
첫번째 비디오 표준들 및 권고들(각각 MPEG-2 및 H.263)에서, 4각형이라 가정된 비디오는 3개의 별도의 채널들 즉; 휘도용 한 채널 및 크로미넌스용 두 채널(표현 체계에 기초한 이 3개의 채널들은 매쉬-기반 접근법과 유사한 다른 압축 체계들에도 사용된다)의 견지에서 기술된다. 그러나, 코딩 및 전송 또는 저장되어야 하는 장면(scene)은 독립적인 움직임들을 가진 몇몇의 객체들로 구성될 때, 특히, 공간-시간적 불연속성이 존재할 때마다, 아티팩트들(artifacts)이 나타난다. 그러면, 이들 영역들은 명확하게 처리(treat) 및 정제될 필요가 있다.
MPEG-4 표준에 있어서, 부가적인 채널 , 즉, MPEG-4 기술에서 "임의의 모양 채널"로서 또한 언급되는 알파 채널(alpha channel)이 도입된다. 이 알파 채널은 고려된 장면에 있는 각 비디오 객체(VO)의 윤곽(또는 모양)을 독립적으로 기술하는 것을 허용하여, 결과적으로 이들 객체들의 경계들에 따른 불연속성들을 피하면서 객체들을 별도로 인코딩하는 것을 가능하게 한다. 그러나, 이러한 기술의 단점은 이러한 모양 채널을 기술하기 위해 요구되는 오버헤드의 비용에서 직면하는 비트들의 낭비이다.
그러므로, 본 발명의 목적은 상기 결점들을 피하는 코딩 방법을 제안하는 것이다.
이를 위해, 본 발명은 본 기술의 도입 문단에서 정의한 바와 같은 비디오 코딩 방법에 관한 것이며, 상기 방법은,
(a) 비디오 시퀀스의 소수의 프레임들에 적용되는 비객체-지향 코딩 단계;
(b) 상기 소수의 프레임들에 후속하는 시퀀스의 모든 프레임들에 적용되는 객체-지향 코딩 단계;
(c) 상기 소수의 프레임들에 대응하는 비객체 지향 코딩된 데이터와, 이어서 상기 후속 프레임들에 대응하는 객체 지향 코딩된 데이터를 포함하는 코딩된 비트스트림을 발생하도록, 상기 비객체-지향 및 객체-지향 코딩 단계들이 적절한 프레임들에 각각 적용되도록 제어를 위해 제공된 시퀀싱 단계를 포함한다.
또한, 본 발명의 목적은 연속적인 프레임들 또는 비디오 객체 플레인들(VOP들)이 각 VOP에서 텍스처 및 모션 성분들 및 부가적인 모양 성분들에 의해 정의된 하나 이상의 임의의 형상의 비디오 객체들(VO들)을 포함하고,
(a) 비디오 시퀀스의 소수의 프레임들에 적용되는 비객체-지향 코딩 단계;
(b) 소수의 프레임들에 후속하는 시퀀스의 모든 프레임들에 적용되는 객체-지향 코딩 단계;
(c) 소수의 프레임들에 대응하는 비객체 지향 코딩된 데이터와, 이어서 후속 프레임들에 대응하는 객체 지향 코딩된 데이터를 포함하는 코딩된 비트스트림을 발생하기 위해, 상기 비객체-지향 및 객체-지향 코딩 단계들이 적절한 프레임들에 각각 적용되도록 제어하기 위해 제공된 시퀀싱 단계를 포함하는 비디오 코딩 방법에 의해 코딩된 원 비디오 시퀀스에 대응하는 코딩된 비트스트림에 적용되는 비디오 디코딩 방법을 제안하며,
상기 디코딩 방법은,
(1) 원 비디오 시퀀스의 상기 소수의 프레임들에 대응하는 코딩된 비트스트림의 상기 비객체-지향 코딩된 데이터에 적용되는 제 1 디코딩 단계;
(2) 상기 소수의 프레임들에 대응하는 코딩된 비트스트림의 상기 비객체-지향 코딩된 데이터에 적용되고, 상기 VO들의 누락 모양 성분(missing shape component)을 재구성하도록 제공된 공간-시간 세그멘테이션 단계;
(3) 상기 후속 프레임들에 대응하는 코딩된 비트스트림들의 상기 객체-지향 코딩된 데이터에 적용되는 제 2 디코딩 단계;
(4) 상기 디코딩 및 세그멘테이션 단계들이 적절한 프레임들에 적용되도록 제어하기 위해 제공된 시퀀싱 단계를 포함한다.
많은 문서들, 및 예를 들어, 문서 US 6026195는 MPEG-4에 따른 객체-지향 비디오 인코딩 방법 및 디바이스를 기술한다. 상기 디바이스의 비디오 입력은 비디오 객체들(VO들)로 구성되고, 비디오 객체 플레인들(VOP들)과 같은 디지털 비디오 이미지들의 시퀀스 형태로 조직되며, 이들 각각은 각각이 3개의 성분; 모양(shape), 모션(motion) 및 텍스처에 의해 정의된다. 인코딩 디바이스는 각 객체의 모양의 특정 표현을 인코딩하는 모양 인코더, 각 VO의 텍스처의 표현을 인코딩하는 텍스처 인코더, 각 VO의 모션의 표현을 인코딩하는 모션 인코더를 포함한다.
그 후, 비디오의 인코딩된 모양, 텍스처 및 모션을 나타내는 신호들은 다중화된 데이터 스트림을 버퍼에 제공하는 다중화기에 보내진다. 그 후, 상기 버퍼의 출력은 수신된 인코딩된 데이터를 분리하는 역다중화기 및 디코딩 디바이스에 의해 차후에 수신되도록, 미래의 사용을 위해 데이터베이스와 같은 기록 매체에 저장되거나 채널을 통해 전송된다. 이어서, 상기 디코딩 디바이스는 모양 디코더, 텍스처 디코더 및 모션 디코더를 포함하며 이들의 출력들은 재구성 디바이스 예를 들어, 합성기(사용자의 집에 있는 개인용 컴퓨터와 같은)에 보내진다. 상기 재구성 디바이스에서, 수신된 VOP들은 처리되고, 이에 의해 재형성된 비디오 이미지의 시퀀스는 출력될 수 있다(예를 들어, 디스플레이되거나 비디오 라이브러리에 저장됨).
이런 공지된 시스템에 대해, 본 발명의 원리는 인코딩 및 디코딩측들에서 세크멘테이션을 고려된 입력 시퀀스 상에서 수행함으로써 인코딩 및 디코딩부들을 수정하는 것이다. 상기 원리의 구현의 관점에서, 시퀀싱 모듈은 다음의 동작들을 시행하도록 인코딩 디바이스에 부가된다.:
(a) 시퀀스의 프레임들(또는 이미지들)의 수가 작으며, 및 바람직하게는 단지 2개의 처음 이미지들에 대해, VOP들의 VO들의 모양 성분은 전송되지 않고: 객체-지향 코딩 모드는 2개의 처음 이미지들을 위해 선택되지 않고, 및 2개의 이미지들을 비객체-지향 모드 예를 들어, 마치 이들이 단일, 4각의 객체(이 모드는 여기서 "전통적인"이라 칭함)처럼, 블록 기반 모드 또는 웨이브렛 분해(wavelet decomposition)에 기초한 모드에 따라 코딩된다.
(b) 시퀀스의 후속 프레임들(즉, 2개의 프레임들만이 동작(a)에서 고려되었다면, 제 3 프레임, 제 4 프레임)은 객체-지향 코딩 모드를 사용하여 다시 코딩되지만, 어떤 모양 성분도 전송하지 않는다.
디코딩 디바이스에서, 시퀀싱 모듈은 다음의 동작들을 수행하도록 상응하게 제공된다:
(a) 두 개의 처음 이미지들에 대응하는 비객체-지향 코딩된 데이터는 제 1 디코딩 단계(즉, 상술한 바와 같이, 예를 들어, 블록-기반 모드 또는 웨이브렛 기반 모드에 따라)에 의해 "전통적으로" 디코딩된다;
(b) 공간-시간적 세그멘테이션(spatio-temporal segmentation) 단계가 이들 두 처음 이이지들에 기초하여 수행된다.
(c) 이른바 후속 이미지들(즉, 두 개의 처음 이미지들을 제외한 모든 이미지들)에 대응하는 객체-지향 코딩된 데이터는 제 2 디코딩 단계에 의해 객체-지향 디코딩 모드에 따라 디코딩되고, 각 VOP에 대한 모양 정보는 디코딩 디바이스에 제공된 공간-시간적 세그멘테이션 처리에 기인하여 얻어진다.
이런 기술적 솔루션으로, 객체-기반 처리는 모양 정보의 인코딩없이 달성될 수 있어서, 그에 따른 비트의 낭비를 피한다.
본 개시는 예시적인 것이고, 본 발명에 따른 방법은 상술한 구현으로 제한하지 않는다는 것에 주의해야 한다. 세크멘테이션 프로세스는 예를 들어, 관심의 영역들(즉, 각 VOP의 VO들)의 수에 대한 정보를 화상 레벨의 코딩된 비트스트림으로 전송함으로써 조금 개선될 수 있다. 이러한 방식으로, 디코딩 디바이스는 인코더측의 것과 동일한 세그멘테이션을 정확히 얻도록 세그멘테이션 단계를 조정할 수 있다.

Claims (5)

  1. 연속적인 프레임들 또는 비디오 객체 플레인들(video object planes; VOP들)이 각 VOP에서 텍스처 및 모션 성분들 및 부가적인 모양 성분들에 의해 정의된 하나 이상의 임의의 형상의 비디오 객체들(VO들)을 포함하는 원 비디오 시퀀스(orignal video sequence)에 적용되는 비디오 코딩 방법으로서,
    (a) 상기 비디오 시퀀스의 소수의 프레임들에 적용되는 비객체-지향 코딩 단계;
    (b) 상기 소수의 프레임들에 후속하는 상기 시퀀스의 모든 프레임들에 적용되는 객체-지향 코딩 단계;
    (c) 상기 소수의 프레임들에 대응하는 비객체 지향 코딩된 데이터와, 이어서 상기 후속 프레임들에 대응하는 객체 지향 코딩된 데이터를 포함하는 코딩된 비트스트림을 발생하도록, 상기 비객체-지향 및 객체-지향 코딩 단계들이 적절한 프레임들에 각각 적용되도록 제어하기 위해 제공된 시퀀싱 단계를 포함하는, 비디오 코딩 방법.
  2. 제 1 항에 있어서,
    상기 프레임들의 수는 2인, 비디오 코딩 방법.
  3. 제 1 항 또는 제 2 항에 있어서,
    상기 코딩된 비트스트림은 상기 원 비디오 시퀀스에서 관심(interest) 영역들의 수에 관한 정보를 또한 포함하는, 비디오 코딩 방법.
  4. 제 3 항에 있어서,
    상기 관심 영역들의 수에 관한 상기 정보는 화상 레벨에서 주어지는, 비디오 코딩 방법.
  5. 연속적인 프레임들 또는 비디오 객체 플레인들(VOP들)이 각 VOP에서 텍스처 및 모션 성분들 및 부가적인 모양 성분들에 의해 정의된 하나 이상의 임의의 형상의 비디오 객체들(VO들)을 포함하고,
    (a) 상기 비디오 시퀀스의 소수의 프레임들에 적용되는 비객체-지향 코딩 단계;
    (b) 상기 소수의 프레임들에 후속하는 상기 시퀀스의 모든 프레임들에 적용되는 객체-지향 코딩 단계;
    (c) 상기 소수의 프레임들에 대응하는 비객체 지향 코딩된 데이터와, 이어서 상기 후속 프레임들에 대응하는 객체 지향 코딩된 데이터를 포함하는 코딩된 비트스트림을 발생하기 위해, 상기 비객체-지향 및 객체-지향 코딩 단계들이 적절한 프레임들에 각각 적용되도록 제어하기 위해 제공된 시퀀싱 단계를 포함하는 비디오 코딩 방법에 의해 코딩된 원 비디오 시퀀스에 대응하는 코딩된 비트스트림에 적용되는 비디오 디코딩 방법으로서,
    상기 디코딩 방법은,
    (1) 상기 원 비디오 시퀀스의 상기 소수의 프레임들에 대응하는 상기 코딩된 비트스트림의 상기 비객체-지향 코딩된 데이터에 적용되는 제 1 디코딩 단계;
    (2) 상기 소수의 프레임들에 대응하는 상기 코딩된 비트스트림의 상기 비객체-지향 코딩된 데이터에 적용되고, 상기 VO들의 누락 모양 성분(missing shape component)을 재구성하도록 제공된 공간-시간 세그멘테이션 단계;
    (3) 상기 후속 프레임들에 대응하는 상기 코딩된 비트스트림들의 상기 객체-지향 코딩된 데이터에 적용되는 제 2 디코딩 단계;
    (4) 상기 디코딩 및 세그멘테이션 단계들이 상기 적절한 프레임들에 적용되도록 제어하기 위해 제공된 시퀀싱 단계를 포함하는, 비디오 디코딩 방법.
KR1020057012440A 2002-12-30 2003-12-22 비디오 코딩 및 디코딩 방법 KR20050089868A (ko)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
EP02293258.6 2002-12-30
EP02293258 2002-12-30

Publications (1)

Publication Number Publication Date
KR20050089868A true KR20050089868A (ko) 2005-09-08

Family

ID=32668918

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020057012440A KR20050089868A (ko) 2002-12-30 2003-12-22 비디오 코딩 및 디코딩 방법

Country Status (7)

Country Link
US (1) US20060165296A1 (ko)
EP (1) EP1582070A1 (ko)
JP (1) JP2006512832A (ko)
KR (1) KR20050089868A (ko)
CN (1) CN1732691A (ko)
AU (1) AU2003285691A1 (ko)
WO (1) WO2004059983A1 (ko)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8165205B2 (en) 2005-09-16 2012-04-24 Sony Corporation Natural shaped regions for motion compensation
US9049447B2 (en) * 2010-12-30 2015-06-02 Pelco, Inc. Video coding
CN103260022A (zh) * 2012-02-21 2013-08-21 安凯(广州)微电子技术有限公司 一种低功耗的视频解码方法和装置

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6005980A (en) * 1997-03-07 1999-12-21 General Instrument Corporation Motion estimation and compensation of video object planes for interlaced digital video
FR2806570B1 (fr) * 2000-03-15 2002-05-17 Thomson Multimedia Sa Procede et dispositif de codage d'images video
US6597739B1 (en) * 2000-06-20 2003-07-22 Microsoft Corporation Three-dimensional shape-adaptive wavelet transform for efficient object-based video coding
US8265163B2 (en) * 2001-12-21 2012-09-11 Motorola Mobility Llc Video shape padding method

Also Published As

Publication number Publication date
AU2003285691A1 (en) 2004-07-22
EP1582070A1 (en) 2005-10-05
CN1732691A (zh) 2006-02-08
US20060165296A1 (en) 2006-07-27
JP2006512832A (ja) 2006-04-13
WO2004059983A1 (en) 2004-07-15

Similar Documents

Publication Publication Date Title
KR100849965B1 (ko) 예측 모드 세분화 계위 제공 방법 및 장치
US6782132B1 (en) Video coding and reconstruction apparatus and methods
US5675669A (en) Apparatus for encoding/decoding an image signal having a still object
AU2005201366A1 (en) Predictive lossless coding of images and video
KR20060088461A (ko) 영상신호의 엔코딩/디코딩시에 영상블록을 위한 모션벡터를베이스 레이어 픽처의 모션벡터로부터 유도하는 방법 및장치
JP2001285871A (ja) ビデオ画像を符号化する処理方法及びその装置
EP1110179B1 (en) Subband coding/decoding
JP4410414B2 (ja) ビデオ信号圧縮処理方法
KR20020047031A (ko) 효율적인 화상 처리 방법 및 장치
JP2000050270A (ja) 映像信号符号化方法
JP2005506775A (ja) ビデオ符号化方法及び対応する送信可能なビデオ信号
KR20050089868A (ko) 비디오 코딩 및 디코딩 방법
KR20050012809A (ko) 비디오 인코딩 방법과 대응 인코딩 및 디코딩 장치들
EP1336303A2 (en) Video coding method
KR19990067355A (ko) 동작추정방법
KR100944544B1 (ko) 비디오 부호화 및 복호화 방법
KR20060059770A (ko) 영상신호의 엔코딩/디코딩시에 영상블록을 위한 모션벡터를베이스 레이어 픽처의 모션벡터로부터 유도하는 방법 및장치
CN1771736A (zh) 视频编码、解码方法和相应设备
EP1416735B1 (en) Method of computing temporal wavelet coefficients of a group of pictures
JPH1132337A (ja) 画像伝送用データ構造,符号化方法及び復号化方法
KR20060008990A (ko) 비디오 엔코딩 및 디코딩 방법들 및 대응하는 엔코딩 및디코딩 디바이스들
JP2770776B2 (ja) 符号化システムおよび復号システム
JPH11313324A (ja) 画像圧縮データの加工方法および装置ならびに画像圧縮データ加工プログラムを記憶した記憶媒体
Bartkowiak et al. Chrominance vector quantization for cellular video-telephony
JP2000333164A (ja) 符号化装置、復号装置、画像処理装置、画像処理システム、画像処理方法、及び記憶媒体

Legal Events

Date Code Title Description
WITN Application deemed withdrawn, e.g. because no request for examination was filed or no examination fee was paid