KR100994947B1 - 비디오 코딩 - Google Patents

비디오 코딩 Download PDF

Info

Publication number
KR100994947B1
KR100994947B1 KR1020057014039A KR20057014039A KR100994947B1 KR 100994947 B1 KR100994947 B1 KR 100994947B1 KR 1020057014039 A KR1020057014039 A KR 1020057014039A KR 20057014039 A KR20057014039 A KR 20057014039A KR 100994947 B1 KR100994947 B1 KR 100994947B1
Authority
KR
South Korea
Prior art keywords
enhancement
picture content
parameters
unit
input
Prior art date
Application number
KR1020057014039A
Other languages
English (en)
Other versions
KR20050098275A (ko
Inventor
윌헬머스 에이치. 에이. 브럴스
Original Assignee
코닌클리케 필립스 일렉트로닉스 엔.브이.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 코닌클리케 필립스 일렉트로닉스 엔.브이. filed Critical 코닌클리케 필립스 일렉트로닉스 엔.브이.
Publication of KR20050098275A publication Critical patent/KR20050098275A/ko
Application granted granted Critical
Publication of KR100994947B1 publication Critical patent/KR100994947B1/ko

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/59Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving spatial sub-sampling or interpolation, e.g. alteration of picture size or resolution
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/30Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
    • H04N19/33Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability in the spatial domain
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/46Embedding additional information in the video signal during the compression process

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

인코딩된 출력 비트스트림을 생성하도록 입력 비디오 비트스트림을 인코딩하는 방법 및 장치가 개시된다. 기본 스트림은 인핸스먼트 제어 파라미터들에 기초하여 인핸싱된다. 적어도 하나의 화상 컨텐트 파라미터는 인핸싱된 기본 스트림으로부터 추출된다. 적어도 하나의 화상 컨텐트 파라미터는 입력 비디오 비트스트림으로부터 추출된다. 인핸싱된 화상 컨텐트 파라미터들은 입력 화상 컨텐트 파라미터들과 비교된다. 비교 단계로부터의 출력이 수신되고, 입력 화상 컨텐트 파라미터들과 인핸싱된 화상 컨텐트 파라미터들 간의 차이를 최소화하도록 인핸스먼트 제어 파라미터들이 계산된다. 계산된 제어 파라미터들은 인코딩된 출력 비트스트림에 통합된다.
인핸스먼트 제어 파라미터, 화상 컨텐트 파라미터, 출력 비트스트림, 비교 수단, 에지 경사도

Description

비디오 코딩{Video coding}
본 발명은 비디오 코딩에 관한 것이고, 보다 구체적으로는 공간적 스케일 가능한 비디오 압축 체계들에 관한 것이다.
디지털 비디오에 고유한 방대한 양의 데이터 때문에, 풀-모션(full-motion) 고해상도 디지털 비디오 신호들의 전송은 고해상도 텔레비전의 개발에 있어서 중요한 문제이다. 보다 구체적으로, 각각의 디지털 이미지 프레임은 특정한 시스템의 디스플레이 해상도에 따라 화소들의 어레이로부터 형성된 스틸 이미지(still image)이다. 그 결과, 고해상도 비디오 시퀀스들에 포함된 미처리(raw) 디지털 정보의 양은 방대하다. 송신되어야 하는 데이터의 양을 감소시키기 위해, 데이터를 압축하기 위한 압축 체계들이 사용된다. MPEG-2, MPEG-4, 및 H.264를 포함하여 다양한 비디오 압축 표준들이나 프로세스들이 확립되어 왔다.
비디오가 하나의 스트림에서 다양한 해상도들 및/또는 품질들로 이용가능한 다수의 애플리케이션들이 가능하게 된다. 이것을 달성하기 위한 방법들은 막연히 스케일러빌러티(scalability) 기술들로서 언급된다. 스케일러빌러티를 배치할 수 있는 세 개의 축들이 있다. 첫째는 시간적 스케일러빌러티로서 종종 언급되는, 시간 축 상의 스케일러빌러티이다. 둘째로, 신호-대-잡음 스케일러빌러티 또는 파인-그레인(fine-grain) 스케일러빌러티로서 종종 언급되는, 품질 축 상의 스케일러빌러티가 있다. 제 3 축은 공간적 스케일러빌러티 또는 계층화된 코딩(layered coding)으로서 종종 언급되는 해상도축(이미지 내 화소들의 수)이다. 계층화된 코딩에서, 비트스트림은 두 개 이상의 비트스트림들이나 계층들로 분할된다. 각각의 계층은 단일의 고품질 신호를 형성하기 위해 결합될 수 있다. 예를 들어, 기본층(base layer)은 저품질 비디오 신호를 제공할 수 있고, 인핸스먼트층(enhancement layer)은 기본층 이미지를 인핸싱(enhancing)할 수 있는 부가적인 정보를 제공한다.
특히, 공간적 스케일러빌러티는 상이한 비디오 표준들이나 디코더 능력들 간의 호환성(compatibility)을 제공할 수 있다. 공간적 스케일러빌러티로 인해, 기본층 비디오는 입력 비디오 시퀀스보다 낮은 해상도를 가질 수 있고, 이 경우, 인핸스먼트층은 기본층의 해상도를 입력 시퀀스 레벨로 복원할 수 있는 정보를 전달한다.
도 1은 알려져 있는 계층화된 비디오 인코더(layered video encoder;100)를 도시한다. 도시된 인코딩 시스템(100)은 계층 압축을 수행하여, 채널의 일부가 저해상도 기본층을 제공하기 위해 사용되고, 그 나머지 부분이 에지 인핸스먼트 정보를 전송하기 위해 사용되며, 시스템의 해상도를 높이기 위해 두 개의 신호들이 재결합된다. 고해상도 비디오 입력(Hi-RES)은 분할기(102)에 의해 분할되어, 데이터는 저역 통과 필터(104)와 감산 회로(106)에 송신된다. 저역 통과 필터(104)는 비디오 데이터의 해상도를 감소시키고, 상기 비디오 데이터는 이후 기본 인코더(108)에 공급된다. 일반적으로, 저역 통과 필터들과 인코더들은 당업계에 잘 알려져 있어, 간략함을 위해 본 명세서에서 자세하게 기술되지 않는다. 인코더(108)는 제 2 분할기(110)에 제공되는 더 낮은 해상도 기본 스트림을 생성하고, 이것은 시스템(100)의 출력이다. 기본 스트림이 고해상도로서 간주될 해상도를 제공하지 않더라도, 상기 기본 스트림은 방송, 수신, 및 디코더를 통해 그대로 디스플레이될 수 있다.
분할기(110)의 다른 출력은 시스템(100) 내의 디코더(112)에 공급된다. 그곳으로부터, 디코딩된 신호는 보간 및 업샘플 회로(114)에 공급된다. 일반적으로, 보간 및 업샘플 회로(114)는 디코딩된 비디오 스트림으로부터 필터링된 해상도를 재구성하여, 고해상도 입력과 동일한 해상도를 갖는 비디오 데이터 스트림을 제공한다. 그러나, 인코딩 및 디코딩으로부터 발생한 손실들과 필터링 때문에, 재구성된 스트림에 에러들이 존재한다. 상기 에러들은 감산 회로(106)에서 원래의 변경되지 않은 고해상도 스트림으로부터 재구성된 고해상도 스트림을 감산함으로써 결정된다. 감산 회로(106)의 출력은 적절한 품질의 인핸스먼트 스트림을 출력하는 인핸스먼트 인코더(116)에 공급된다.
입력 비디오를 더 낮은 해상도로 필터링 및 다운스케일링한 후 압축하는 것의 단점은, 상기 비디오가 선명도(sharpness)를 잃어버린다는 것이다. 이것은 디코더 후에 선명도 인핸스먼트를 사용함으로써 어느 정도 보상될 수 있다. 화상 인핸스먼트 기술들은 일반적으로 인핸싱된 출력 신호를 분석함으로써 제어된다. 원래의 풀(full) 해상도 신호가 기준(reference)으로서 사용된다면, 인핸스먼트 제어가 개선될 수 있다. 그러나, 일반적으로 상기 기준은 예를 들어 텔레비전 세트들에 존재하지 않는다. 그러나, 예컨대, 공간적 스케일 가능한 압축과 같은 일부 애플리케이션에서는, 상기 기준 신호가 존재한다. 그러나, 문제는 상기 기준을 이용하는 방법이 된다. 하나의 가능성은 기준과 인핸싱된 출력 신호의 화소 차이를 관찰하는 것이다. 차이 에너지를 최소화함으로써 제어가 달성될 수 있다. 그러나, 이 방법은 실제로 인간의 눈이 화상을 선명하게 지각하는 방법을 고려하지 않는다. 인간의 눈이 화상을 선명하게 지각하는 방법을 고려하여 화상으로부터 화상 컨텐트 파라미터들이 추출될 수 있다는 것이 알려져 있다. 본원에서, 제어 알고리즘은 이런 값들을 최대화하는 것이지만, 상기 최대화를 지나치게 행하면 선명하지만 매우 자연스럽지 않은 화상들을 유발하는 위험을 갖는다. 문제는 화상 인핸스먼트를 제어하는데 이용가능한 기준 화상이 또한 존재하는 경우에 이런 추출된 화상 컨텐트 파라미터들을 사용하는 방법이다.
발명의 요약
본 발명은 인핸싱된 출력 신호와 기준 신호 모두에 대해 화상 컨텐트 파라미터들을 사용함으로써 다른 알려진 계층화된 압축 체계들의 결함을 극복한다. 제어 알고리즘은, 인핸싱된 출력 신호와 기준 신호의 화상 컨텐트 파라미터들 간의 차이가 가능한 한 낮아지게 하는 방법으로 기본 스트림의 인핸스먼트를 제어한다. 이것은 지나치게 인핸싱되는 것을 막아, 선명하고 자연스러운 화상들을 발생시킨다.
본 발명의 일 실시예에 따라, 인코딩된 출력 비트스트림을 생성하기 위해 입력 비디오 비트스트림을 인코딩하는 방법 및 장치가 개시된다. 기본 스트림은 인핸스먼트 제어 파라미터들에 기초하여 인핸싱된다. 적어도 하나의 화상 컨텐트 파라미터는 인핸싱된 기본 스트림으로부터 추출된다. 적어도 하나의 화상 컨텐트 파라미터는 입력 비디오 비트스트림으로부터 추출된다. 인핸싱된 화상 컨텐트 파라미터들은 입력 화상 컨텐트 파라미터들과 비교된다. 입력 화상 컨텐트 파라미터들과 인핸싱된 화상 컨텐트 파라미터들 간의 차이를 최소화하도록, 비교 단계로부터의 출력이 수신되어 인핸스먼트 제어 파라미터들이 계산된다. 계산된 제어 파라미터들은 인코딩된 출력 비트스트림에 통합된다.
본 발명의 이들 및 다른 특징들은 이하에 기술된 실시예들을 참조하여 분명해지고 명백해질 것이다.
본 발명은 이제 첨부 도면들을 참조하여 예로서 기술될 것이다.
도 1은 알려진 계층화된 비디오 인코더를 나타내는 블록도.
도 2는 본 발명의 일 실시예에 따른 계층화된 비디오 인코더/디코더의 블록도.
도 3은 본 발명의 일 실시예에 따른 DCT 계수 에너지 레벨 곡선들을 도시하는 도면.
도 4는 본 발명의 일 실시예에 따른 디코더의 블록도.
도 5는 본 발명의 다른 실시예에 따른 디코더의 블록도.
도 6은 본 발명의 다른 실시예에 따른 디코더의 블록도.
본 발명의 일 실시예에 따라, 공간적 선명도 인핸스먼트 기술들을 사용하는 공간적 스케일 가능한 압축 체계가 개시된다. 본 발명의 상기 실시예에서는, 이하에 기술되는 바와 같이, 화상 컨텐트 정보가 기준 신호와 인핸싱된 출력 신호 모두로부터 추출된다.
상기 실시예는 이제 본 발명에 사용될 수 있는 인코더의 블록도인 도 2를 참조하여 보다 자세하게 기술될 것이다. 상기 인코더는 상대적으로 저해상도를 갖는 기본층과 적어도 하나의 인핸스먼트층을 갖는 계층화된 인코더이지만 이것으로 제한되지 않는다는 점이 이해될 것이다. 도시된 인코딩 시스템(200)은 계층 압축을 수행하여, 채널의 일부가 저해상도 기본층을 제공하기 위해 사용되고, 그 나머지 부분이 에지 인핸스먼트 정보를 전송하기 위해 사용되며, 시스템의 해상도를 높이기 위해 두 개의 신호들이 재결합된다. 고해상도 비디오 입력(201)은 분할기(210)에 의해 분할되어, 데이터는 예를 들어 나이키스트 필터(nyquist filter)와 같은 저역 통과 필터(212)와 분할기(232)에 송신된다. 저역 통과 필터(212)는 비디오 데이터의 해상도를 감소시킨 후, 기본 인코더(214)에 공급한다. 일반적으로, 저역 통과 필터들과 인코더들은 당업계에 잘 알려져 있어, 본 명세서에서는 간략함을 위해 자세하게 기술되지 않는다. 기본 인코더(214)는 더 낮은 해상도 기본 스트림(215)을 생성한다. 기본 스트림이 고해상도로서 간주될 해상도를 제공하지 않더라도, 상기 기본 스트림은 방송, 수신, 및 디코더를 통해 그대로 디스플레이될 수 있다.
인코더는 또한 디코딩된 기본 스트림을 분할기(213)에 출력하고, 이는 디코딩된 기본 스트림을 분할하여 업스케일링 회로(216)와 인핸스먼트 유닛(220)에 공급한다. 또한, 디코더(도시되지 않음)는 업스케일링 회로(216)에 송신되기 전에 인코더의 출력을 디코딩하도록 인코더(214) 뒤의 회로에 삽입될 수 있다. 일반적으로, 업스케일링 회로(216)는 디코딩된 비디오 스트림으로부터 필터링된 해상도를 재구성하여, 고해상도 입력과 동일한 해상도를 갖는 비디오 데이터 스트림을 제공한다. 업스케일링 회로(216)로부터의 업스케일된 비트스트림(v1)은 감산 회로(234)에 입력된다.
인핸스먼트 유닛(220)은 출력 신호(215)를 처리하고, 인핸스먼트 유닛(220)의 인핸스먼트 알고리즘(들) 및 제어 유닛(231)에 의해 생성된 인핸스먼트 제어 파라미터들("enh ctrl par")에 따라서 신호들을 인핸싱한다. 다수의 비디오 인핸스먼트 기술들이 존재하고, 상기 기술들은 결과적인 화상의 감지가 인핸싱되도록 화상 컨텐트를 모두 변경한다. 상기 인핸스먼트들의 주관적 특성은 최적화 프로세스를 복잡하게 하고, 비디오 인핸스먼트 알고리즘들의 다양성의 이유일 것이다. 다양한 인핸스먼트 알고리즘들은 일부 수단에 의해 화상 품질에 기여한다. 잡음 감소 및 선명도 개선 알고리즘은 큰 세트의 인핸스먼트 알고리즘들 중 단지 일부 예들이다. 이런 알려진 임의의 인핸스먼트 알고리즘들이 본 발명에 사용될 수 있다는 점이 이해될 것이다.
인핸싱된 출력 신호(221)는 화상 컨텐트 파라미터 유닛(222)에 제공된다. 화상 컨텐트 파라미터 유닛(222)은 인핸싱된 출력 신호(221)로부터 복수의 화상 컨텐트 파라미터들을 추출한다. 도시된 예에서는, 세 개의 화상 컨텐트 파라미터들이 인핸싱된 출력 신호(221)로부터 추출되지만, 본 발명은 이것으로 제한되지 않는다.
기준 신호(201)는 화상 컨텐트 파라미터 유닛(224)에 제공된다. 화상 컨텐트 파라미터 유닛(224)은, 화상 컨텐트 파라미터 유닛(222)이 인핸싱된 출력 신호(221)로부터 추출한 것과 동일한 복수의 화상 컨텐트 파라미터들을 기준 신호(201)로부터 추출한다. 화상 컨텐트 파라미터들은 전체적인 프레임에 기초하지만, 예컨대 16*16 화소들과 같은 화소 그룹에 기초할 수도 있다. 화상이나 화소 그룹으로부터 추출된 화상 컨텐트 파라미터의 예들은 화소 그룹의 최대 값과 최소 값 사이의 차이, 에지들 중 중심에 있는 에지의 경사도 값, DCT 계수 고주파수 에너지 레벨들 등을 포함하지만 이것으로 제한되지 않는다. 도 3a는 기준 신호(201)의 DCT 계수 에너지 레벨 곡선을 도시하고, 도 3b는 인핸싱된 출력 신호(221)의 DCT 계수 에너지 레벨 곡선을 도시한다.
기준 화상 컨텐트 파라미터 유닛(224)과 인핸싱된 화상 컨텐트 파라미터 유닛(222)으로부터 추출된 화상 컨텐트 파라미터들은, 예를 들어 적어도 하나의 감산 유닛(226)과 승산 유닛들(228)을 포함하는 비교 유닛에 공급된다. 비교 유닛은 다른 요소들도 포함할 수 있다는 것이 당업자들에게 이해될 것이다. 감산 유닛(226)은 기준 화상 컨텐트 파라미터들로부터 인핸싱된 화상 컨텐트 파라미터들을 감산한다. 각 감산 유닛(226)의 출력은 출력들에 미리 결정된 인수들(C1,C2,C3)을 곱하는 승산 유닛들(228)에 선택적으로 공급될 수 있다. 승산 유닛의 출력들은 합산 유닛(230)에서 서로 합산되어 제어 유닛(231)에 공급된다. 제어 유닛(231)은 합산 유닛(230)으로부터 수신된 정보를 처리하고, 새로운 인핸스먼트 제어 파라미터들을 생성한다. 본 발명의 일 실시예에 따라, 제어 유닛(231)은, 기준 신호와 인핸싱된 출력 신호의 화상 컨텐트 파라미터들 간의 차이가 가능한 한 낮게 되도록 인핸스먼트 제어 파라미터들을 통해 인핸스먼트 유닛(220)을 제어한다. 이것은 또한 지나치게 인핸싱하여, 일반적으로 선명하지만 매우 자연스럽지 않은 화상들을 유발하는 것을 방지한다.
업스케일링 회로(216)의 업스케일된 출력은 스위치(236)에 인가되는 잔여 비트스트림을 생성하도록 감산 회로(234)에서 원래의 입력(201)으로부터 감산된다. 스위치는 제어 유닛(231)의 출력(S)에 의해 제어된다. 입력 비디오 비트스트림(201)을 인핸싱된 기본 비디오 스트림과 비교함으로써, 제어 유닛(231)은 인핸스먼트층(208)에 의해 더 인핸싱될 필요가 있는 화소들이나 화소 그룹들(블록들)을 결정할 수 있다. 제어 유닛(231)에 의해 인핸싱될 필요가 있는 것으로 결정된 화소들이나 화소 그룹들(블록들)에 대해, 제어 유닛(231)은 잔여 비트스트림의 그런 부분들을 인핸스먼트층 인코더(240)로 보내기 위해 스위치(236)를 닫도록 제어 신호(S)를 출력한다. 이런 정보가 결과적인 잔여 비트스트림과 인핸스먼트 스트림(241)에 통합(다중화)되도록, 제어 유닛(231)은 또한 스위치(236)를 위한 제어 신호와 선택된 인핸스먼트 제어 파라미터들을 인코더(240)에 송신한다.
도 4는 본 발명의 일 실시예에 따라 인코더(200)로부터의 기본 및 인핸스먼트 스트림들을 디코딩하도록 사용될 수 있는 디코더(400)를 도시한다. 상기 실시예에서, 기본 스트림(215)은 기본 디코더(402)에 의해 디코딩되고, 인핸스먼트 스트림(241)은 인핸스먼트 디코더(404)에 의해 디코딩된다. 디코딩된 기본 스트림은 업컨버터(406)와 인핸스먼트 유닛(408)에 공급된다. 디코드 인핸스먼트 스트림은 가산 유닛(410)에 공급된다. 가산 유닛(410)은 디코딩된 인핸스먼트 스트림을 업컨버터(406)로부터 업컨버팅된 기본 스트림에 가산하여, 결합된 스트림을 스위치(414)의 한쪽에 제공한다.
인핸스먼트 인코더는 또한 다중화기(도시되지 않음)를 통해 신호(S)와 인핸스먼트 제어 파라미터들을 인핸스먼트 스트림으로부터 제거하여, 상기 신호(S)와 인핸스먼트 제어 파라미터들을 인핸스먼트 제어 유닛(412)에 제공한다. 인핸스먼트 제어 유닛(412)은 신호(S)를 스위치(414)에 제공하고, 인핸스먼트 제어 파라미터들을 인핸스먼트 유닛(408)에 제공한다. 인핸스먼트 유닛(408)은 인핸스먼트 유닛(408)에서의 인핸스먼트 알고리즘들과 인핸스먼트 제어 유닛(412)에 의해 제공된 인핸스먼트 제어 파라미터들에 따라서 디코딩된 기본 스트림을 인핸싱한다. 인핸싱된 기본 스트림은 이후 스위치(414)의 다른 쪽에 제공된다. 신호(S)에 의해 결정된 스위치의 위치에 따라, 디코더(400)는 가산 유닛(410)으로부터의 결합된 스트림 또는 인핸싱된 기본 스트림을 출력한다.
본 발명의 다른 실시예에 따라, 디코더(400)의 출력은 가산 유닛(410)으로부터의 결합된 스트림과 인핸스먼트 유닛(408)으로부터의 인핸싱된 기본 스트림의 결합일 수 있다. 도 5에 도시된 바와 같이, 신호(s)는 한 쌍의 승산 유닛들(502,504)에 제공되고, 여기서 S는 0과 1 사이의 값이다. 이런 도시된 예에서, 승산 유닛(502)은 가산 유닛(410)으로부터의 결합 스트림을 (1-S)의 값으로 곱한다. 승산 유닛(504)은 인핸싱된 기본 스트림을 값 S으로 곱한다. 두 개의 승산 유닛들의 출력들은 디코더의 출력을 형성하도록 가산 유닛(506)에서 결합된다.
본 발명의 다른 실시예에서, 인코더(200)의 인핸스먼트 인코더부의 출력은 제어 유닛(231)이나 일부 다른 장치에 의해 뮤팅(muting)될 수 있다. 그 결과, 인코더(200)로부터 출력된 인핸스먼트 스트림은 없다. 이런 도시된 예에서, 인핸스먼트 제어 파라미터들은 전술된 바와 같이 생성되지만, 도 2의 점선(251)을 통해 기본 인코더(214)에 제공된다. 인핸스먼트 제어 파라미터들은 이후 기본 인코더 내의 다중화기를 통해 인코딩된 기본 스트림(215)에 통합된다.
통합된 인핸스먼트 제어 파라미터들을 갖는 인코딩된 기본 스트림(215)은 이후 도 6에 도시된 디코더(600)에 의해 디코딩될 수 있다. 인코딩된 기본 스트림은 기본 디코더(602)에서 디코딩되고, 디코딩된 기본 스트림은 인핸스먼트 유닛(604)에 제공된다. 기본 디코더(602)는 또한 인핸스먼트 제어 파라미터들을 인코딩된 기본 스트림(215)으로부터 분리하여, 이를 인핸스먼트 제어 유닛(606)에 공급한다. 디코딩된 기본 스트림은 이후 인핸스먼트 유닛(604)에 있어서의 인핸스먼트 알고리즘들 및 인핸스먼트 제어 유닛(606)으로부터의 인핸스먼트 제어 파라미터들에 따라서 인핸스먼트 유닛(604)에 의해 인핸싱된다. 인핸싱되고 디코딩된 기본 스트림은 이후 디코더(600)로부터 출력된다.
본 발명의 전술된 실시예들은, 기준 신호와 인핸싱된 신호로부터의 화상 컨텐트 파라미터들 간의 차이가 가능한 한 낮게 되기 위한 방법으로 인핸스먼트 제어 파라미터들을 제어하는 제어 유닛을 사용함으로써 화상 선명도나 품질을 최적화한다.
전술된 실시예들은 본 발명을 제한하기보다는 예시하고 있고, 당업자들은 첨부된 청구 범위를 벗어나지 않고 다수의 대안적인 실시예들을 설계할 수 있을 것이라는 점에 유의해야 한다. 청구 범위에서, 괄호 안의 참조 기초들은 청구항을 제한하는 것으로 해석되지 않아야 한다. 단어 "포함하다"는 청구항에 나열된 것 이상의 성분들 또는 단계들의 존재를 배제하지 않는다. 본 발명은 몇몇 별개의 성분들을 포함하는 하드웨어와, 적합하게 프로그래밍된 컴퓨터로 구현될 수 있다. 몇몇 수단들을 열거하는 장치 청구항들에서, 상기 수단들 중 몇몇은 컴퓨터 판독가능한 소프트웨어 또는 하드웨어 및 그 동일 아이템으로 구현될 수 있다. 어떤 방법들이 서로 상이한 종속 청구항들에 인용되는 단순한 사실은, 이 방법들의 결합이 바람직하게 사용될 수 없다는 것을 나타내지 않는다.

Claims (16)

  1. 인코딩된 출력 비트스트림을 생성하도록 입력 비디오 비트스트림을 인코딩하는 인코더에 있어서:
    인핸스먼트 제어 파라미터들(enhancement control parameters)에 기초하여 기본 스트림을 인핸싱(enhancing)하는 인핸스먼트 유닛(220);
    적어도 하나의 화상 컨텐트 파라미터를 상기 인핸싱된 기본 스트림으로부터 추출하는 제 1 화상 컨텐트 파라미터 유닛(222);
    적어도 하나의 화상 컨텐트 파라미터를 상기 입력 비디오 비트스트림으로부터 추출하는 제 2 화상 컨텐트 파라미터 유닛(224);
    인핸싱된 화상 컨텐트 파라미터들을 입력 화상 컨텐트 파라미터들과 비교하는 비교 수단(226,228);
    상기 비교 수단으로부터의 출력을 수신하고, 상기 비교 수단으로부터의 상기 출력에 응답하여 상기 입력 화상 컨텐트 파라미터들과 상기 인핸싱된 화상 컨텐트 파라미터들 간의 차이를 최소화시킬 상기 인핸스먼트 제어 파라미터들을 계산하는 제어 유닛(231); 및
    상기 계산된 제어 파라미터들을 상기 인코딩된 출력 비트스트림에 통합시키는 수단(240)을 포함하는, 인코더.
  2. 제 1 항에 있어서,
    상기 인코더는 기본층과 적어도 하나의 인핸스먼트층을 갖는 계층화된 인코더인, 인코더.
  3. 제 2 항에 있어서,
    상기 계층화된 인코더는, 상기 기본층이 상대적으로 저해상도인 공간적 계층화된 인코더인, 인코더.
  4. 제 3 항에 있어서,
    상기 입력 화상 컨텐트 파라미터들과 상기 인핸스먼트 화상 컨텐트 파라미터들 간의 차이가 미리 결정된 기준을 충족할 때, 상기 인핸스먼트 인코더의 입력을 뮤팅(muting)하는 수단(231)을 더 포함하는, 인코더.
  5. 제 1 항에 있어서,
    선택된 화상 컨텐트 파라미터들 간의 차이는 상기 제어 유닛에 입력되기 전에 미리 결정된 값으로 곱해지는, 인코더.
  6. 제 5 항에 있어서,
    상기 미리 결정된 값들로 곱해진 상기 비교 수단의 출력들을 서로 합산하는 합산 유닛(230)을 더 포함하는, 인코더.
  7. 제 1 항에 있어서,
    상기 화상 컨텐트 파라미터들은 화소들의 그룹의 최대 및 최소 값 사이의 차이, 에지 경사도 값(edge steepness value), 및 DCT 계수 고주파수 에너지 레벨 곡선들 중 적어도 하나인, 인코더.
  8. 입력 비디오 비트스트림을 인코딩하는 인코더에 있어서:
    상기 입력 비디오 비트스트림의 해상도를 감소시키는 다운샘플링 유닛(212);
    더 낮은 해상도 기본 스트림을 인코딩하는 기본 인코더(214);
    업스케일된 기본 비트스트림을 생성하도록 디코딩하여 상기 기본 스트림의 해상도를 증가시키는 업스케일링 유닛(216);
    인핸스먼트 제어 파라미터들에 기초하여 상기 기본 스트림을 인핸싱하는 인핸스먼트 유닛(220);
    적어도 하나의 화상 컨텐트 파라미터를 상기 인핸싱된 기본 스트림으로부터 추출하는 제 1 화상 컨텐트 파라미터 유닛(222);
    적어도 하나의 화상 컨텐트 파라미터를 상기 입력 비디오 비트스트림으로부터 추출하는 제 2 화상 컨텐트 파라미터 유닛(224);
    인핸싱된 화상 컨텐트 파라미터들을 입력 화상 컨텐트 파라미터들로부터 비교하는 비교 수단(226,228);
    상기 비교 수단으로부터의 출력을 수신하고, 상기 비교 수단으로부터의 상기 출력에 응답하여 상기 입력 화상 컨텐트 파라미터들과 상기 인핸싱된 화상 컨텐트 파라미터들 간의 차이를 최소화시킬 상기 인핸스먼트 제어 파라미터들을 계산하는 제어 유닛(231);
    잔여 비트스트림을 생성하도록 상기 업스케일된 기본 비트스트림을 상기 입력 비디오 비트스트림으로부터 감산하는 감산 유닛(234);
    상기 제어 유닛으로부터의 제어 신호에 기초하여 상기 잔여 비트스트림의 부분들만이 인핸스먼트 인코더에 선택적으로 송신되게 하는 스위칭 수단(236); 및
    인코딩된 잔여 비트스트림을 형성하도록 상기 스위칭 수단을 통과하는 상기 잔여 비트스트림의 부분들을 상기 인핸스먼트 제어 파라미터들과 통합시키는 인핸스먼트 인코더(240)를 포함하는, 인코더.
  9. 제 8 항에 있어서,
    상기 스위칭 수단은 0과 1 사이의 값을 갖는 승산기이고, 0의 값은 상기 스위칭 수단이 개방되어 있다는 것을 의미하고, 1의 값은 상기 스위칭 수단이 폐쇄되어 있다는 것을 의미하는, 인코더.
  10. 제 8 항에 있어서,
    선택된 화상 컨텐트 파라미터들 간의 비교는 상기 제어 유닛에 입력되기 전에 미리 결정된 값으로 곱해지는, 인코더.
  11. 제 10 항에 있어서,
    상기 미리 결정된 값들로 곱해진 상기 비교 수단의 출력들을 서로 합산하는 합산 수단(230)을 더 포함하는, 인코더.
  12. 제 8 항에 있어서,
    상기 화상 컨텐트 파라미터들은 화소들의 그룹의 최대 및 최소 값 사이의 차이, 에지 경사도 값, 및 DCT 계수 고주파수 에너지 레벨 곡선들 중 적어도 하나인, 인코더.
  13. 인코딩된 출력 스트림을 생성하도록 입력 비디오 비트스트림을 인코더에서 인코딩하는 방법에 있어서:
    인핸스먼트 제어 파라미터들에 기초하여 기본 스트림을 인핸싱하는 단계;
    적어도 하나의 화상 컨텐트 파라미터를 인핸싱된 기본 스트림으로부터 추출하는 단계;
    적어도 하나의 화상 컨텐트 파라미터를 상기 입력 비디오 비트스트림으로부터 추출하는 단계;
    인핸싱된 화상 컨텐트 파라미터들을 입력 화상 컨텐트 파라미터들과 비교하는 단계;
    상기 비교 단계로부터의 출력을 수신하고, 상기 비교 단계로부터의 상기 출력에 응답하여 상기 입력 화상 컨텐트 파라미터들과 상기 인핸싱된 화상 컨텐트 파라미터들 간의 차이를 최소화시킬 상기 인핸스먼트 제어 파라미터들을 계산하는 단계; 및
    상기 계산된 제어 파라미터들을 상기 인코딩된 출력 비트스트림에 통합시키는 단계를 포함하는, 인코딩 방법.
  14. 통합된 인핸스먼트 제어 파라미터들을 갖는 입력 스트림을 디코딩하는 디코더에 있어서:
    상기 입력 신호를 디코딩하고, 상기 인핸스먼트 제어 파라미터들을 상기 디코딩된 신호로부터 분리하는 디코더(602); 및
    상기 인핸스먼트 제어 파라미터들에 기초하여 상기 디코딩된 신호를 인핸싱하는 인핸스먼트 유닛(604,606)을 포함하는, 디코더.
  15. 압축된 비디오 정보를 디코딩하는 디코더에 있어서:
    수신된 기본 스트림을 디코딩하는 기본 스트림 디코더(402);
    상기 디코딩된 기본 스트림의 해상도를 증가시키는 업컨버팅 유닛(406);
    수신된 인핸스먼트 스트림을 디코딩하여 임베딩된 인핸스먼트 제어 파라미터들을 상기 인핸스먼트 스트림으로부터 분리하는 인핸스먼트 스트림 디코더(404);
    업컨버팅되고 디코딩된 기본 스트림과 디코딩된 인핸스먼트 스트림을 결합하는 제 1 가산 유닛(410);
    상기 인핸스먼트 제어 파라미터들을 사용하여 상기 디코딩된 기본 스트림을 인핸싱하는 인핸스먼트 수단(408,412); 및
    상기 가산 유닛으로부터 상기 결합된 스트림들 또는 상기 인핸싱된 기본 스트림을 출력하도록 선택하는 스위치 수단(414)을 포함하는, 디코더.
  16. 제 15 항에 있어서,
    상기 제 1 가산 유닛의 출력을 제 1 미리 결정된 값으로 곱하는 제 1 승산 유닛(502);
    상기 인핸스먼트 기본 스트림을 제 2 미리 결정된 값으로 곱하는 제 2 승산 유닛(504); 및
    출력 스트림을 형성하기 위해 상기 제 1 및 제 2 승산 유닛들로부터의 출력들을 가산하는 제 2 가산 수단(506)을 상기 스위치 수단 대신에 더 포함하는, 디코더.
KR1020057014039A 2003-01-30 2003-12-16 비디오 코딩 KR100994947B1 (ko)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
EP03100188 2003-01-30
EP03100188.6 2003-01-30

Publications (2)

Publication Number Publication Date
KR20050098275A KR20050098275A (ko) 2005-10-11
KR100994947B1 true KR100994947B1 (ko) 2010-11-18

Family

ID=32798993

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020057014039A KR100994947B1 (ko) 2003-01-30 2003-12-16 비디오 코딩

Country Status (11)

Country Link
US (2) US8005148B2 (ko)
EP (2) EP3203741B1 (ko)
JP (1) JP4860156B2 (ko)
KR (1) KR100994947B1 (ko)
CN (1) CN100502504C (ko)
AU (1) AU2003288684A1 (ko)
ES (2) ES2626106T3 (ko)
HU (2) HUE032291T2 (ko)
PT (1) PT1590964T (ko)
TR (1) TR201807601T4 (ko)
WO (1) WO2004068861A1 (ko)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2006087319A2 (en) * 2005-02-18 2006-08-24 Thomson Licensing Method for deriving coding information for high resolution pictures from low resoluton pictures and coding and decoding devices implementing said method
US8446956B2 (en) * 2006-01-05 2013-05-21 Thomson Licensing Inter-layer motion prediction method using resampling
US8937997B2 (en) 2006-03-16 2015-01-20 Apple Inc. Scalable video coding/multiplexing compatible with non-scalable decoders
EP1879399A1 (en) 2006-07-12 2008-01-16 THOMSON Licensing Method for deriving motion data for high resolution pictures from motion data of low resolution pictures and coding and decoding devices implementing said method
JP5233939B2 (ja) * 2009-09-30 2013-07-10 沖電気工業株式会社 動画像符号化装置及びプログラム、並びに、動画像配信システム
US9045685B2 (en) 2011-08-29 2015-06-02 Ticona Llc Cast molded parts formed from a liquid crystalline polymer
US10616583B2 (en) * 2016-06-30 2020-04-07 Sony Interactive Entertainment Inc. Encoding/decoding digital frames by down-sampling/up-sampling with enhancement information
EP3849180A1 (en) * 2020-01-10 2021-07-14 Nokia Technologies Oy Encoding or decoding data for dynamic task switching

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH1084548A (ja) 1996-07-17 1998-03-31 Sony Corp 画像符号化装置および画像符号化方法、画像復号化装置および画像復号化方法、伝送方法、並びに記録媒体

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AU694096B2 (en) * 1992-11-16 1998-07-16 Multimedia Systems Corporation Method for the production and transmission of enhanced interactive multimedia information
JP3277419B2 (ja) * 1993-09-09 2002-04-22 ソニー株式会社 動きベクトル検出装置および方法
US5822458A (en) * 1995-02-06 1998-10-13 The Regents Of The University Of California Precomputing and encoding compressed image enhancement instructions
JPH1070717A (ja) * 1996-06-19 1998-03-10 Matsushita Electric Ind Co Ltd 画像符号化装置及び画像復号化装置
WO1999033274A1 (en) * 1997-12-19 1999-07-01 Kenneth Rose Scalable predictive coding method and apparatus
JPH11331613A (ja) * 1998-05-20 1999-11-30 Matsushita Electric Ind Co Ltd 階層型映像信号符号化装置と階層型映像信号復号化装置
US6292512B1 (en) * 1998-07-06 2001-09-18 U.S. Philips Corporation Scalable video coding system
US6501797B1 (en) * 1999-07-06 2002-12-31 Koninklijke Phillips Electronics N.V. System and method for improved fine granular scalable video using base layer coding information
US6480547B1 (en) 1999-10-15 2002-11-12 Koninklijke Philips Electronics N.V. System and method for encoding and decoding the residual signal for fine granular scalable video
US7421127B2 (en) * 2001-10-26 2008-09-02 Koninklijke Philips Electronics N.V. Spatial scalable compression scheme using spatial sharpness enhancement techniques
US7386049B2 (en) * 2002-05-29 2008-06-10 Innovation Management Sciences, Llc Predictive interpolation of a video signal

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH1084548A (ja) 1996-07-17 1998-03-31 Sony Corp 画像符号化装置および画像符号化方法、画像復号化装置および画像復号化方法、伝送方法、並びに記録媒体

Also Published As

Publication number Publication date
US20060140269A1 (en) 2006-06-29
JP2006514455A (ja) 2006-04-27
WO2004068861A1 (en) 2004-08-12
ES2672109T3 (es) 2018-06-12
US8005148B2 (en) 2011-08-23
EP3203741A1 (en) 2017-08-09
US9036715B2 (en) 2015-05-19
CN1745586A (zh) 2006-03-08
TR201807601T4 (tr) 2018-06-21
HUE037820T2 (hu) 2018-09-28
KR20050098275A (ko) 2005-10-11
AU2003288684A1 (en) 2004-08-23
HUE032291T2 (en) 2017-09-28
JP4860156B2 (ja) 2012-01-25
ES2626106T3 (es) 2017-07-24
US20110310979A1 (en) 2011-12-22
PT1590964T (pt) 2017-06-09
EP3203741B1 (en) 2018-03-14
EP1590964B1 (en) 2017-03-01
CN100502504C (zh) 2009-06-17
EP1590964A1 (en) 2005-11-02

Similar Documents

Publication Publication Date Title
RU2728738C1 (ru) Высокоточная повышающая дискретизация при масштабируемом кодировании видеоизображений с высокой битовой глубиной
US20040258319A1 (en) Spatial scalable compression scheme using adaptive content filtering
US20040252767A1 (en) Coding
EP1442603B1 (en) Spatial scalable compression scheme using spatial sharpness enhancement techniques
US9036715B2 (en) Video coding
US20040252900A1 (en) Spatial scalable compression
US6865229B1 (en) Method and apparatus for reducing the “blocky picture” effect in MPEG decoded images
US20070160300A1 (en) Spatial scalable compression scheme with a dead zone
US20070086666A1 (en) Compatible interlaced sdtv and progressive hdtv
US20060133472A1 (en) Spatial scalable compression
JPH0846961A (ja) 画像符号化復号化方法
KR20050019807A (ko) 공간적인 스케일러블 압축
JPH07336685A (ja) 画像復号化方法および装置

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20131108

Year of fee payment: 4

FPAY Annual fee payment

Payment date: 20141112

Year of fee payment: 5

FPAY Annual fee payment

Payment date: 20151111

Year of fee payment: 6

FPAY Annual fee payment

Payment date: 20161110

Year of fee payment: 7

FPAY Annual fee payment

Payment date: 20191031

Year of fee payment: 10