KR20120118505A - 비디오 신호 처리 - Google Patents

비디오 신호 처리 Download PDF

Info

Publication number
KR20120118505A
KR20120118505A KR1020127024239A KR20127024239A KR20120118505A KR 20120118505 A KR20120118505 A KR 20120118505A KR 1020127024239 A KR1020127024239 A KR 1020127024239A KR 20127024239 A KR20127024239 A KR 20127024239A KR 20120118505 A KR20120118505 A KR 20120118505A
Authority
KR
South Korea
Prior art keywords
image
video signal
domain
partitions
representative group
Prior art date
Application number
KR1020127024239A
Other languages
English (en)
Other versions
KR101354095B1 (ko
Inventor
박광훈
Original Assignee
경희대학교 산학협력단
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 경희대학교 산학협력단 filed Critical 경희대학교 산학협력단
Publication of KR20120118505A publication Critical patent/KR20120118505A/ko
Application granted granted Critical
Publication of KR101354095B1 publication Critical patent/KR101354095B1/ko

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/234Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs
    • H04N21/2343Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs involving reformatting operations of video signals for distribution or compliance with end-user requests or end-user device requirements
    • H04N21/234327Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs involving reformatting operations of video signals for distribution or compliance with end-user requests or end-user device requirements by decomposing into layers, e.g. base layer and one or more enhancement layers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/132Sampling, masking or truncation of coding units, e.g. adaptive resampling, frame skipping, frame interpolation or high-frequency transform coefficient masking
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/18Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a set of transform coefficients
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/30Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
    • H04N19/33Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability in the spatial domain
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/48Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using compressed domain processing techniques other than decoding, e.g. modification of transform coefficients, variable length coding [VLC] data or run-length data
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/85Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

비디오 신호 처리에 관련된 기법이 제공된다. 일 실시예에서, 비디오 신호 인코더는 입력 비디오 신호의 부분을 선택하고 부분을 파티션들로 분할하도록 구성된 전처리기, 파티션들을 제1 도메인에서 제2 도메인으로 변환하도록 구성된 제1 변환기, 제2 도메인의 각각의 파티션들로부터 대표 값들을 선택하도록 구성된 선택기, 대표 값들을 수집하여 값들의 대표 그룹을 형성하도록 구성된 수집기, 및 대표 그룹을 인코딩하도록 구성된 제1 인코딩 유닛을 포함한다.

Description

비디오 신호 처리{VIDEO SIGNAL PROCESSING}
UDTV(Ultra Definition TV)라 불리는 커다란 벽 크기의 텔레비전(약 70 인치 내지 120 인치)과 같은, 대형 디스플레이(display)는 디스플레이의 기술적 혁신과 실감나는 느낌에 대한 수요자의 요구로 인하여, 매력적인 가전 제품으로서 사용되어 왔다. UDTV는 통신 또는 방송 라인에서 UDTV 비디오를 전송함에 있어 많은 양의 대역폭을 사용한다. 따라서, 더 높은 코딩 효율을 가지는 UDTV를 개발하는 것에 대한 관심이 있다.
비디오 신호 처리에 관련된 기법이 제공된다. 일 실시예에서, 비디오 신호 인코더(video signal encoder)는 입력 비디오 신호의 부분(portion)을 선택하고 부분을 파티션(partition)들로 분할하도록 구성된 전처리기(pre-processor), 파티션들을 제1 도메인(domain)으로부터 제2 도메인으로 변환하도록 구성된 제1 변환기(transformer), 제2 도메인의 각각의 파티션들로부터 대표 값들을 선택하도록 구성된 선택기(selector), 대표 값들을 수집하여 값들의 대표 그룹을 형성하도록 구성된 수집기(collector) 및 대표 그룹을 인코딩하도록 구성된 제1 인코딩 유닛(encoding unit)을 포함한다.
전술한 요약은 예시적인 것일 뿐이고, 어떤 방식으로든 제한을 의도한 것은 아니다. 상술한 예시적인 태양, 실시예 및 특징들에 더하여, 추가의 태양, 실시예 및 특징들은 도면과 이하의 상세한 설명을 참조함으로써 분명하게 될 것이다.
도 1은 공급자(provider)와 수요자 사이에서 비디오를 공급하는 시스템의 예시적인 구성을 개략적으로 도시한다.
도 2는 도 1에서 도시된 비디오 공급자 시스템의 예시적인 구성을 도시한다.
도 3은 도 2에서 도시된 비디오 인코더(encoder)의 실시예를 도시한다.
도 4는 다수의 파티션으로 분할된 비디오의 부분의 예시를 도시한다.
도 5a 및 도 5b는 변환된 파티션 및 대표 그룹의 예시를 도시한다.
도 6은 다른 실시예에 따라 비디오 신호를 인코딩하는 비디오 공급자 시스템의 예시적인 구성을 도시한다.
도 7은 도 6에서 도시된 스케일러블 비디오 인코더(scalable video encoder)의 실시예를 도시한다.
도 8은 도 7에서 도시된 기저층 인코더(base-layer encoder)의 실시예를 도시한다.
도 9는 도 8에서 도시된 인코딩 유닛의 실시예를 도시한다.
도 10은 도 7에서 도시된 향상층 인코더(enhancement-layer encoder)의 실시예를 도시한다.
도 11은 일 실시예에 따른 비디오 신호 인코딩 방법의 예시적인 흐름도를 도시한다.
도 12는 일 실시예에 따른 비디오 신호 인코딩 방법의 추가적인 흐름도의 예시를 도시한다.
이하의 상세한 설명에서, 여기의 일부를 구성하는 첨부 도면에 대한 참조가 이루어진다. 도면에서, 유사한 부호는, 문맥에서 다른 지시가 없다면, 일반적으로 유사한 구성요소를 식별한다. 상세한 설명, 도면 및 청구항에서 기술된 예시적 실시예들은 제한하는 것으로 의미되지 않는다. 여기에 제시된 대상의 범위와 사상을 벗어나지 않고, 다른 실시예가 이용될 수 있고, 다른 변형이 이루어질 수 있다. 여기에서 일반적으로 기술되고 도면에서 도시된 바와 같은 본 개시의 태양들이 다양한 다른 구성으로 배열, 대체, 조합, 분리 및 설계될 수 있음과, 이 모두가 여기에서 명시적으로 고려됨이 쉽게 이해될 것이다.
도 1은 공급자와 수요자 사이에서 비디오를 공급하는 시스템의 예시적인 구성을 개략적으로 도시한다. 시스템(100)은 비디오 신호를 매체(120)에 공급하는 비디오 공급자 시스템(110), 및 매체(120)로부터 비디오 신호를 수신하는 하나 이상의 비디오 수요자 시스템(130)을 가진다. 비디오 신호를 효율적으로 공급하기 위하여, 비디오 공급자 시스템(110)은 비디오 신호를 매체(120)에 공급하기 전에 인코딩할 수 있으며, 비디오 수요자 시스템(130)은 인코딩된 비디오 신호를 디코딩할 수 있다.
매체(120)는 기록 매체, 유선 또는 무선 전송 매체 또는 비디오 신호를 비디오 공급자 시스템(110)에서 비디오 수요자 시스템(130)으로 수송하기에 적합하다고 고려되는 임의의 기타 매체를 포함할 수 있다. 일부의 경우에, 매체(120)는 둘 이상의 상이한 종류의 매체의 조합을 그 안에 포함할 수 있다.
비디오 수요자 시스템(130)은 비디오 신호를 처리(예컨대, 디스플레이(display), 재인코딩(re-encode), 저장, 전송 및/또는 임의의 기타 고려 가능한 방법의 이용)하도록 구성된 다양한 종류의 장치를 포함할 수 있다. 이 중에 UDTV(Ultra Definition TV)라고 불리는 벽 크기의 텔레비전(약 70인치 내지 120인치)이 있다. UDTV의 일부 일반적인 해상도는 3840 픽셀 x 2160 라인(4K-UDTV) 또는 7680 픽셀 x 4320 라인(8K-UDTV)일 수 있다. 그러나, 해상도는 전술된 해상도에 제한되지 않고, 환경에 따라 더 크거나 더 작을 수 있다는 것이 인정되어야 한다. 일부의 경우에, 비디오 수요자 시스템(130)은 HDTV 또는 그보다 더 작은 크기의 TV 셋탑(set-top)을 포함할 수 있다.
일부 실시예에서, 비디오 공급자 시스템(110)은 스케일러블 인코딩을 수행하여 비디오 수요자 시스템(130)에 실감 나는(realistic) 비디오를 공급할 수 있다. 스케일러블 인코딩은 스케일러블 비트 스트림(scalable bit-stream)을 생성하는 인코딩 방법을 포함할 수 있다. 결과적인 서브 스트림(sub-stream)이 일부 타겟 디코더에 대하여 다른 유효한 비트 스트림을 형성하는 방식으로, 비트 스트림의 일부가 제거될 수 있으면 비디오 비트 스트림은 스케일러블 하다고 할 수 있다.
스케일러블 인코딩은, 서브 셋 비트 스트림에서와 동일한 양의 데이터를 이용하여 달성되는 바와 유사한 복잡도와 복원 품질로, 스스로 디코딩될 수 있는 하나 이상의 서브 셋 비트 스트림을 포함하는 고 품질의 비디오 비트 스트림의 인코딩을 가능하게 할 수 있다. 일부 실시예에서, 서브 셋 비트 스트림은 패킷을 더 큰 비트 스트림으로부터 드랍(drop)함으로써 얻어질 수 있다. 비트 스트림과 비교하여 이로부터 얻어진 서브 셋 비트 스트림은 (각각 개별적으로 또는 조합하여) 더 낮은 시간적 또는 공간적 해상도 또는 더 낮은 품질의 비디오 신호를 나타낼 수 있다. 스케일러블 인코딩의 이용을 통하여, 비디오는 다양한 시간적 또는 공간적 해상도 또는 품질로 동시에 전송될 수 있거나 저장될 수 있다.
도 2는 도 1에서 도시된 비디오 공급자 시스템의 예시적인 구성을 도시한다. 비디오 공급자 시스템(110)은 일 실시예에 따라 비디오 신호를 인코딩한다. 도 2를 참조하면, 비디오 공급자 시스템(110)은 비디오 공급원(video source)(210) 및 비디오 인코더(220)를 포함할 수 있다.
비디오 공급원(210)은 일련의 비디오 신호를 생성할 수 있는 임의의 장치일 수 있다. 비디오 신호는 비디오 데이터를 나타내는 임의의 신호 또는 신호 중 적어도 일부일 수 있다. 비디오 공급원(210)은, 예컨대, 텔레비전 안테나 및 수신기 유닛, 비디오 카세트 플레이어, 비디오 카메라, 비디오 신호를 수신/저장할 수 있는 디스크 저장 장치 등을 포함할 수 있다. 비디오 신호는 비디오 인코더(220)로 전송될 수 있다.
비디오 인코더(220)는 비디오 신호를 인코딩하여 인코딩된 비디오 신호를 생성할 수 있다. 일부 실시예에서, 비디오 인코더(220)로부터의 인코딩된 비디오 신호는 비디오 공급원(210)으로부터의 원본 비디오 신호와 비교하여 비교적 낮은 해상도에 해당하는 기저층 데이터를 포함할 수 있다. 비디오 인코더(220)는 또한 인코딩된 비디오 신호를 디코더 판독가능 매체, 예컨대, 매체(120)로 출력할 수 있다. 이러한 방식으로, 일부 실시예에서, 비디오 인코더(220)는 비디오 신호를 디코더 판독가능 매체(120)에 인코딩할 수 있다. 예컨대, 비디오 인코더(220)는 인코딩된 비디오 신호를 디코더 판독가능 매체(120)에 기록할 수 있다.
도 3은 도 2에서 도시된 비디오 인코더의 실시예를 도시한다. 도 3을 참조하면, 비디오 인코더(220)는 전처리기(310) 및 기저층 인코더(320)를 포함할 수 있다.
전처리기(310)는 입력 비디오 신호를 비디오 공급원(210)으로부터 수신할 수 있으며, 인코딩될 입력 비디오 신호의 부분("선택된 부분")을 선택할 수 있다. 여기에서, "선택된 부분"이라는 용어는 인코딩될 입력 비디오 신호의 부분 또는 전체를 지칭한다. 일부 실시예에서, 선택된 부분은, 예컨대, 16x16 픽셀을 포함하는 매크로 블록(macro-block)에 해당할 수 있다. 즉, 입력 비디오 신호는 매크로 블록으로 인코딩될 수 있다. 전처리기(310)에 의해 결정된 선택된 부분은 16x16 매크로 블록에 제한되지 않음에 유의한다. 예컨대, 32x32 슈퍼 블록(super-block), 64x64 울트라 블록(ultra-block), 더 작은 블록, 또는 심지어 정방형이 아닌 형태의 객체라도 또한 전처리기(310)에 의하여 결정된 선택된 부분에 해당할 수 있다.
전처리기(310)는 또한 선택된 부분을 다수의 파티션으로 분할할 수 있다. 일부 실시예에서, 파티션은 4x4 서브 블록일 수 있다. 선택된 부분이 16x16 매크로 블록인 경우, 전처리기(310)는 선택된 부분에 대하여 16개의 파티션을 제공할 수 있다. 도 4는 다수의 파티션으로 분할된 선택된 부분의 예시를 도시한다. 도 4에서, 16x16 매크로 블록으로 도시된 선택된 부분(410)은 16개의 파티션(420)으로 분할된다. 각각의 파티션(420)은 4x4 서브 블록으로 도시된다. 다만, 파티션(420)은 4x4 서브 블록으로 제한되지 않음에 유의한다. 일부 실시예에서, 파티션(420)은 8x8의 정방형, 16x16의 정방형 또는 비정방형과 같이, 다른 크기 또는 모양을 가질 수 있다.
도 3을 다시 참조하면, 기저층 인코더(320)는 비교적 낮은 해상도에 해당하는 인코딩된 기저층 데이터를 생성할 수 있다. 일부 실시예에서, 기저층 데이터는 원본 크기의 1/4x4 해상도에 해당할 수 있다. 예컨대, 입력 비디오 신호가 7680 픽셀 및 4320 라인을 가지면(8K-UDTV), 1/4x4 기저층 데이터는 전체적으로 1920x1080의 해상도에 해당할 수 있다. 또한, 입력 비디오 신호가 3840 픽셀 및 2160 라인을 가지면(4K-UDTV), 1/4x4 기저층 데이터는 전체적으로 960x540의 해상도에 해당할 수 있다. 기저층 데이터의 해상도는 상기 예시에 제한되지 않음에 유의한다. 예컨대, 일부의 기타 실시예에서, 선택된 부분이 32x32 슈퍼 블록이고 파티션이 16x16 매크로 블록이어서, 기저층 데이터가 원본 크기의 1/2x2 해상도에 해당할 수 있다. 입력 비디오 신호가 3840 픽셀 및 2160 라인을 가지는 경우(4K-UDTV)에, 1/2x2 기저층 데이터는 전체적으로 1920x1080의 해상도에 해당할 수 있다.
기저층 인코더(320)는 변환기(322), 선택기(324), 수집기(326), 및 인코딩 유닛(328)을 포함할 수 있다.
변환기(322)(또는 제1 변환기)는 전처리기(310)로부터 파티션(420)을 수신할 수 있으며, 파티션(420)을 다른 도메인으로 변환할 수 있다("제1 변환"). 일부 실시예에서, 변환기(322)는, 예컨대, 이산 코사인 변환(discrete cosine transform(DCT))을 수행함으로써, 공간 도메인에서 주파수 도메인으로 파티션(420)을 변환할 수 있다. 그러나, 본 개시의 사상과 범위를 벗어나지 않고, 다른 종류의 변환이 또한 적용될 수 있다. 본 기술 분야에서 잘 알려진 바와 같이, DCT는 상이한 주파수에서 진동하는 코사인 함수의 합으로 일련의 유한한 데이터 점을 표현할 수 있다. 예컨대, JPEG 또는 MPEG에서, DCT가 8x8 블록에 적용되면, 결과는 8x8 변환 계수 배열(transform coefficient array)일 수 있으며, 여기서, (좌측 최상부의) (0,0) 요소는 DC(0 주파수) 값이고 수직 및 수평의 인덱스 값(index value)이 증가할수록 엔트리(entry)(AC 계수)는 더 높은 수직 및 수평 공간 주파수를 나타낸다. 따라서, 변환기(322)에 의하여, 각 파티션(420)에서의 픽셀 값이 하나의 DC 값 및 다수의 AC 계수로 변환될 수 있다. 예컨대, 파티션(420)이 16개의 픽셀 값을 포함하는 4x4 서브 블록이면, 변환기(322)는 4x4 DCT를 4x4 서브 블록에 수행하여 하나의 DC 값 및 15개의 AC 계수를 얻을 수 있다. 일부 실시예에서, DC 값은 공간 도메인에서 4x4 픽셀 값의 평균 값(mean value)에 해당하도록 구해질 수 있다.
도 5a는 선택된 부분(510)(16x16 매크로 블록)에서의 파티션(520)(4x4 서브 블록)의 각각이 하나의 DC 값(530)과 15개의 AC 계수(540)로 변환되는 예시를 도시한다. 도 5a에서, 변환 이후에, 선택된 부분(510)은 16개의 DC 값(530)을 포함하며, 각각은 하나의 파티션(520)에 대응한다.
도 3을 다시 참조하면, 선택기(324)는 변환기(322)로부터 변환된 파티션을 수신할 수 있으며, 변환된 파티션의 각각으로부터 대표 값을 선택할 수 있다. 일부의 실시예에서, 선택기(324)는 변환된 파티션의 각각으로부터 DC 값을 선택할 수 있으며, AC 계수를 버릴 수 있다. DC 값은 대응하는 파티션의 대표 값으로 사용될 수 있다. 그러나, 환경과 변환의 유형에 따라, 대표 값은 본 개시의 사상과 범위를 벗어나지 않으면서 상이한 방식으로 선택될 수 있다.
수집기(326)는 선택기(324)로부터 선택된 대표 값을 수신할 수 있으며, 대표 값을 수집하여 값의 대표 그룹을 형성할 수 있다. 예컨대, 도 5a에서 도시된 DC 값(530)은 수집되어 도 5b에서 도시된 바와 같이 DC 값(530)을 포함하는 4x4 서브 블록(550)을 형성할 수 있다. 도 5a의 선택된 부분(510)이 16개의 파티션(520)을 거기에 포함하므로, 전체적인 결과의 4x4 서브 블록(550)은 도 5a의 선택된 부분(510)을 나타낼 수 있으며, 4x4 서브 블록(550)에서의 16개의 DC 값(530)은 각각 선택된 부분(510)에서의 16개의 파티션(520)을 나타낼 수 있다.
이후, 인코딩 유닛(328)(또는 제1 인코딩 유닛)은 값의 대표 그룹을 인코딩할 수 있다. 다양한 알려진 기법 또는 모듈이 대표 그룹을 인코딩하기 위해 이용될 수 있다. 인코딩의 일 실시예에서, 값의 대표 그룹은 일반적인 이미지의 보통의 픽셀 값을 가지는 것처럼 다루어질 수 있다. 예컨대, 일부 실시예에서, 도 5b에서 도시된 16개의 DC 값(530)을 포함하는 4x4 서브 블록(550)은 인코딩될 일반적인 이미지의 보통의 서브 블록처럼 다루어질 수 있다.
이러한 방식으로, 기저층 인코더(320)는 선택된 부분의 비교적 낮은 해상도에 해당하는 인코딩된 기저층 데이터를 생성할 수 있다. 예컨대, 선택된 부분이 16개의 4x4 서브 블록으로 분할된 16x16 매크로 블록이면, 기저층 인코더(320)는 선택된 부분의 4x4 기저층 이미지에 해당하는 인코딩된 신호를 생성할 수 있다.
도 6은 다른 실시예에 따라 비디오 신호를 인코딩하는 비디오 공급자 시스템의 예시적인 구성을 도시한다. 도 6을 참조하면, 비디오 공급자 시스템(110)은 비디오 공급원(610), 스케일러블 비디오 인코더(620) 및 비트 스트림 생성기(630)를 포함할 수 있다. 비디오 공급원(610)은 도 2를 참조하여 상기 논의된 비디오 공급원(210)과 유사할 수 있으며, 따라서 반복하여 상세히 설명되지는 않을 것이다.
스케일러블 비디오 인코더(620)는 비디오 신호를 인코딩하여 인코딩된 데이터의 적어도 두 개의 스트림을 비트 스트림 생성기(630)에 제공할 수 있다. 일부 실시예에서, 스케일러블 비디오 인코더(620)로부터의 스트림은 비교적 낮은 해상도에 해당하는 기저층 데이터와 비교적 높은 해상도에 해당하는 적어도 하나의 향상층 데이터를 포함할 수 있다.
비트 스트림 생성기(630)는 인코딩된 데이터의 스트림을 스케일러블 비디오 인코더(620)로부터 수신할 수 있으며, 인코딩된 데이터의 스트림을 거기에 포함한 단일 비트 스트림을 생성할 수 있다. 즉, 비트 스트림 생성기(630)는 스케일 가능하게 인코딩된 비트 스트림을 디코더 판독 가능 매체, 예컨대, 매체(120)에 출력할 수 있다. 일부 실시예에서, 디코더가 매체로부터 이를 판독할 수 있는 방식으로 디코더 판독가능 매체(120)는 스케일 가능하게 인코딩된 비트 스트림을 거기에 포함할 수 있다. 이러한 방식으로, 일부 실시예에서, 스케일러블 비디오 인코더(620)는 디코더 판독가능 매체(120)가 스케일러블 비디오 인코더(620)에 의해 인코딩된 비디오 신호를 거기에 포함하도록 할 수 있다. 예컨대, 스케일러블 비디오 인코더(620)는 인코딩된 비디오 신호를 디코더 판독가능 매체(120)에 기록할 수 있다.
도 7은 도 6에서 도시된 스케일러블 비디오 인코더의 실시예를 도시한다. 도 7을 참조하면, 스케일러블 비디오 인코더(620)는 전처리기(710), 기저층 인코더(720), 기저층 복원 유닛(730), 이미지 확장기(740), 향상층 인코더(750) 및 향상층 복원 유닛(760)을 포함할 수 있다. 전처리기(710)는 도 3을 참조하여 상기 논의된 전처리기(310)와 유사할 수 있고, 따라서 반복적으로 상세히 설명되지는 않을 것이다.
기저층 인코더(720)는 비교적 낮은 해상도에 해당하는 인코딩된 기저층 데이터를 생성할 수 있다. 일부 실시예에서, 기저층 데이터는 원본 크기의 1/4x4 해상도에 해당할 수 있다. 예컨대, 입력 비디오 신호가 7680 픽셀 및 4320 라인을 가지면(8K-UDTV), 1/4x4 기저층 데이터는 전체적으로 1920x1080의 해상도에 해당할 수 있다. 또한, 입력 비디오 신호가 3840 픽셀 및 2160 라인을 가지면(4K-UDTV), 1/4x4 기저층 데이터는 전체적으로 960x540의 해상도에 해당할 수 있다. 기저층 데이터의 해상도는 상기 예시에 제한되지 않음에 유의한다. 예컨대, 일부 기타 실시예에서, 선택된 부분이 32x32 슈퍼 블록이고 파티션이 16x16 매크로 블록이어서, 기저층 데이터가 원본 크기의 1/2x2 해상도에 해당할 수 있다. 입력 비디오 신호가 3840 픽셀 및 2160 라인을 가지는 경우(4K-UDTV)에, 1/2x2 기저층 데이터는 전체적으로 1920x1080의 해상도에 해당할 수 있다. 일 실시예에 따른 기저층 인코더(720)의 세부 사항은 이후에 설명될 것이다.
기저층 복원 유닛(730)(또는 제1 복원 유닛)은 인코딩된 기저층 데이터로부터 기저층 이미지를 복원할 수 있다. 이미지의 복원을 위하여, 예컨대, 인트라 텍스쳐 코딩(intra-texture coding), 인터 텍스쳐 코딩(inter-texture coding), 시간 분해(temporal decomposition), 모션 보상(motion compensation) 등과 관련될 수 있는 다양한 기법이 사용될 수 있다. 이후 이미지 확장기(740)는 복원된 기저층 이미지를 원본 크기, 즉, 선택된 부분의 크기까지 확장할 수 있다. 예컨대, 기저층 데이터가 원본 크기의 1/4x4 해상도를 가지면, 이미지 확장기(740)는 픽셀 복제기(pixel duplicator)(742)를 이용하여 복원된 기저층 이미지에서의 픽셀을 확장된 이미지에서의 16개(즉, 4x4)의 픽셀로 복제할 수 있다. 보간법(interpolation)과 같은 기타 기법이 또한 이미지 확장을 위하여 사용될 수 있음에 유의한다. 확장된 기저층 이미지는 향상층 인코더(750)(또는 제2 인코딩 유닛)에 제공될 수 있다. 또한, 일부 실시예에서, 기저층 복원 유닛(730)으로부터의 복원된 기저층 이미지는 또한 참조 이미지로서 인터 텍스쳐 코딩을 위해 기저층 인코더(720)로 피드백될 수 있으며, 이는 이하에서 설명될 것이다.
향상층 인코더(750)는 선택된 부분(410)을 전처리기(710)로부터 수신할 수 있고 확장된 기저층 이미지를 이미지 확장기(740)로부터 수신할 수 있다. 이후, 향상층 인코더(750)는 확장된 기저층 이미지를 이용하여 선택된 부분(410)에 해당하는 적어도 하나의 인코딩된 향상층 데이터를 생성할 수 있다. 일 실시예에 따른 향상층 인코더(750)의 세부 사항은 이하에서 설명할 것이다.
향상층 복원 유닛(760)(또는 제2 복원 유닛)은 이후에 인코딩된 향상층 데이터로부터 향상층 이미지를 복원할 수 있고 이를 향상층 인코더(750)로 피드백할 수 있다. 이미지의 복원을 위하여, 시간 분해, 모션 보상 등과 같은 다양한 기법이 사용될 수 있다.
도 8은 도 7에서 도시된 기저층 인코더의 실시예를 도시한다. 도 8을 참조하면, 기저층 인코더(720)는 변환기(810), 선택기(820), 수집기(830) 및 인코딩 유닛(840)을 포함할 수 있다. 변환기(810)(또는 제1 변환기), 선택기(820) 및 수집기(830)은 도 3을 참조하여 상기 논의된 변환기(322), 선택기(324) 및 수집기(326)와 유사할 수 있고, 따라서 반복적으로 상세히 설명되지는 않을 것이다.
변환기(810), 선택기(820) 및 수집기(830)가 협동하여 값의 대표 그룹을 생성한 이후에, 인코딩 유닛(840)(제1 인코딩 유닛)은 값의 대표 그룹을 일반적인 이미지의 보통의 픽셀 값을 포함하는 것으로 다루어 값의 대표 그룹을 인코딩할 수 있다. 다양한 기법 또는 모듈이 대표 그룹을 인코딩하는 데에 사용될 수 있다.
도 9는 도 8에서 도시된 인코딩 유닛의 실시예를 도시한다. 도 9를 참조하면, 인코딩 유닛(940)은 변환기(910), 인트라 텍스쳐 코딩기(intra-texture coder)(920) 및 인터 텍스쳐 코딩기(inter-texture coder)(930)를 포함할 수 있다.
변환기(910)(또는 제2 변환기)는 값의 대표 그룹을 수신할 수 있고 대표 그룹을 다른 도메인으로 재변환할 수 있다. 예컨대, 일부 실시예에서, 4x4 서브 블록(예컨대, 도 5b에서 도시된 16개의 DC 값(530)을 포함하는 4x4 서브 블록(550))은 이미지의 보통의 서브 블록처럼 다루어질 수 있고 DCT 계수, 즉, 하나의 DC 값과 15개의 AC 계수로 재변환될 수 있다. 이러한 프로세스(process)는 제1 변환기, 예컨대, 변환기(810)에 의해 수행되는 변환, 즉 제1 변환 이후의 제2 변환으로 지칭될 수 있다.
변환기(910)에 의한 제2 변환 이후에, 인트라 텍스쳐 코딩기(920)는 결과적인 DCT 계수(resultant DCT coefficient)를 이용하여 인트라 텍스쳐 코딩을 수행할 수 있다. 런 길이 인코딩(run-length encoding) 및 가변 길이 코딩(variable-length coding)과 같은 다양한 기법이 인트라 텍스쳐 코딩을 위하여 이용될 수 있다.
인터 텍스쳐 코딩기(930)는 변환기(910)로부터의 DCT 계수 및 기저층 복원 유닛(730)으로부터의 이전에 복원된 이미지를 이용하여 인터 텍스쳐 코딩을 수행할 수 있다. 인터 텍스쳐 코딩에서, 인터 텍스쳐 코딩기(930)는 모션 추정 유닛(932) 및 모션 보상 유닛(934)을 이용하여 모션 추정 및/또는 모션 보상을 수행할 수 있다. 모션 추정 및 모션 보상은 이미지의 보통의 픽셀 값을 포함하는 보통의 서브 블록으로 간주될 수 있는 (예컨대, 16개의 DC 값을 포함하는) 대표 그룹에 기초하여 수행될 수 있다.
이러한 방식으로, 기저층 인코더(720)는 선택된 부분의 비교적 낮은 해상도에 해당하는 인코딩된 기저층 데이터를 생성할 수 있다. 예컨대, 선택된 부분이 16개의 4x4 서브 블록으로 분할된 16x16 매크로 블록이면, 기저층 인코더(720)는 부분에 대한 4x4 기저층 이미지에 해당하는 인코딩된 신호를 생성할 수 있다.
[51]도 10은 도 7에 도시된 향상층 인코더의 실시예를 도시한다. 도 10을 참조하면, 향상층 인코더(750)는 차분화 유닛(differentiating unit)(1010), 변환기(1020) 및 엔트로피 코딩기(entropy coder)(1030)를 포함한다.
일부 실시예에서, 차분화 유닛(1010)은 전처리기(710)에 의하여 결정된 원본 부분(예컨대, 선택된 부분(410))을 수신할 수 있고 이미지 확장기(740)로부터 확장된 기저층 이미지를 수신할 수 있다. 이후 차분화 유닛(1010)은 원본 부분 및 확장된 기저층 이미지 사이의 차분 이미지(differential image)를 획득할 수 있다.
변환기(1020)(또는 제3 변환기)는 차분화 유닛(1010)에 의해 획득된 차분 이미지를 다른 도메인, 예컨대, 주파수 도메인으로 변환할 수 있다. 일부 실시예에서, 변환기(1020)는 이러한 목적을 위하여 이산 코사인 변환(DCT)을 수행할 수 있다.
엔트로피 코딩기(1030)는 변환된 차분 이미지에 대하여 엔트로피 코딩을 수행하여, 인코딩된 향상층 데이터를 생성할 수 있다. 엔트로피 코딩은 런 길이 인코딩, 가변 길이 코딩 등과 같은 다양한 기법을 포함할 수 있다.
상기 실시예에서, 차분화 유닛(1010)은 원본 부분 및 원본 부분으로부터 얻어진 기저층 이미지를 이용한다. 따라서, 상기 인코딩 방법은 인트라 코딩이라 지칭될 수 있다. 그러나, 향상층 인코더(750)는 인트라 코딩에 제한되지 않는다.
예컨대, 일부 기타의 실시예에서, 차분화 유닛(1010)은 복원된 향상층 이미지를 향상층 복원 유닛(760)으로부터 수신할 수 있다. 차분화 유닛(1010)은 이후, 복원된 향상층 이미지 및 확장된 기저층 이미지 사이의 차분 이미지를 획득할 수 있다. 복원된 향상층 이미지가 원본 부분 외에 하나 이상의 참조 이미지를 참조함으로써 획득될 수 있으므로, 그러한 인코딩 방법은 인터 코딩으로 지칭될 수 있다.
일부 실시예에서, 차분화 유닛(1010)은 필요에 따라 인트라 코딩 및 인터 코딩 둘 다를 사용하도록 구성될 수 있다는 것이 인정되어야 한다.
이러한 방식으로, 향상층 인코더(750)는 확장된 기저층 이미지를 이용하여 원본 부분에 해당하는 향상층 데이터를 생성할 수 있다.
도 11은 비디오 신호 인코더에 의하여, 더 구체적으로는 비디오 신호 인코더에서의 각각의 구성에 의하여 수행될 수 있는 일 실시예에 따른 비디오 신호 인코딩 방법의 예시적인 흐름도를 도시한다.
도 11을 참조하면, 방법은 인코딩될 입력 비디오 신호의 부분(선택된 부분)을 선택함으로써 시작할 수 있다(블록 1110). 부분은 이후 다수의 파티션으로 분할 될 수 있다(블록 1120). 일부 실시예에서, 부분은 16x16 매크로 블록에 해당할 수 있고 파티션은 4x4 서브 블록에 해당할 수 있다.
파티션은 상이한 도메인으로 변환될 수 있다(제1 변환)(블록 1130). 예컨대, 파티션은 이산 코사인 변환(DCT)을 수행함으로써 공간 도메인에서 주파수 도메인으로 변환될 수 있다. 이후, 대표 값이 변환된 파티션의 각각으로부터 선택될 수 있다(블록 1140). 일부 실시예에서, DCT 이후에 DC 값이 대표 값으로 선택될 수 있다. 파티션에 대한 대표 값은 수집되어 값의 대표 그룹을 형성할 수 있다(블록 1150). 일부 실시예에서, 대표 그룹은 16개의 DC 값을 포함할 수 있으며, 각각의 DC 값은 4x4 서브 블록을 대표할 수 있다.
대표 그룹은 이후 인코딩될 수 있다(블록 1160). 다양한 기법이 대표 그룹을 인코딩하는 데에 사용될 수 있다. 일부 실시예에서, 대표 그룹은 보통의 4x4 이미지 부분으로 간주될 수 있다. 이러한 경우, 대표 그룹은 DCT를 수행함으로써 주파수 도메인으로 다시 변환될 수 있다(제2 변환). 이러한 제2 변환 이후에, 인코딩 유닛(840)은 또한 제2 변환에 의해 획득된 DCT 계수에 적어도 부분적으로 기초하여 인트라 텍스쳐 코딩 및/또는 인터 텍스쳐 코딩을 수행할 수 있다.
당업자는 여기에서 개시된 이러한 프로세스 및 방법과 기타의 프로세스 및 방법에 대하여, 프로세스 및 방법에서 수행되는 기능이 다른 순서로 구현될 수 있다는 것을 인정할 것이다. 또한, 개략의 단계 및 동작은 단지 예시적인 것이며, 단계 및 동작 중 일부는, 개시된 실시예의 본질을 벗어나지 않고, 선택적일 수 있거나, 더 적은 단계 및 동작으로 조합될 수 있거나, 추가적인 단계 및 동작으로 확장될 수 있다.
도 12는 비디오 신호 인코더에 의하여, 더 구체적으로는, 비디오 신호 인코더에서의 각각의 구성에 의하여 추가적으로 수행될 수 있는 일 실시예에 따른 비디오 신호 인코딩 방법의 추가적인 흐름도의 예시를 도시한다.
도 12를 참조하면, 방법은 기저층 이미지를 복원할 수 있다(블록 1210). 일부 실시예에서, 기저층 이미지는 도 11의 블록(1160)에 의해 인코딩된 대표 그룹에 적어도 부분적으로 기초하여 복원될 수 있다. 이후 복원된 기저층 이미지는, 예컨대, 도 11의 블록(1110)에 의하여 결정된 부분의 크기까지 확장될 수 있다(블록 1220). 방법은 확장된 기저층 이미지를 이용하여 부분에 대응하는 인코딩된 향상층 데이터를 생성할 수 있다(블록 1230). 차분화, 변환, 엔트로피 코딩, 시간 분해, 모션 보상 등과 같은 다양한 방법이 인코딩된 향상층 데이터의 생성을 위하여 사용될 수 있다.
본 개시는 다양한 태양의 예시로서 의도된 본 출원에 기술된 특정 실시예들에 제한되지 않을 것이다. 당업자에게 명백할 바와 같이, 많은 수정과 변형들이 그 사상과 범위를 벗어나지 않으면서 이루어질 수 있다. 여기에 열거된 것들에 더하여, 본 개시의 범위 안에서 기능적으로 균등한 방법과 장치가 위의 설명으로부터 당업자에게 명백할 것이다. 그러한 수정과 변형들은 첨부된 청구항의 범위에 들어가도록 의도된 것이다. 본 개시는 첨부된 청구항과 그러한 청구항에 부여된 균등물의 전 범위에 의해서만 제한될 것이다. 본 개시가 물론 다양할 수 있는 특정 방법, 시약, 합성 구성 또는 생물학적 시스템에 제한되지 않는 것으로 이해될 것이다. 또한, 여기에서 사용된 용어는 특정 실시예를 기술하기 위한 목적이고, 제한하는 것으로 의도되지 않음이 이해될 것이다.
예시적인 실시예에서, 여기에서 설명된 임의의 동작, 프로세스 등이 컴퓨터 판독 가능 매체(computer-readable medium)에 저장된 컴퓨터 판독 가능 명령으로 구현될 수 있다. 컴퓨터 판독 가능 명령은 모바일 유닛(mobile unit), 네트워크 요소, 및/또는 임의의 기타 컴퓨팅 장치(computing device)의 프로세서에 의해 실행될 수 있다.
시스템의 양상들의 하드웨어 및 소프트웨어 구현 사이에는 구별이 거의 없다; 하드웨어 또는 소프트웨어의 사용은 일반적으로 (그러나 어떤 문맥에서 하드웨어 및 소프트웨어 사이의 선택이 중요할 수 있다는 점에서 항상 그런 것은 아니지만) 비용 대비 효율의 트레이드오프(tradeoff)를 나타내는 설계상 선택(design choice)이다. 본 개시에서 기재된 프로세스 및/또는 시스템 및/또는 다른 기술들이 영향 받을 수 있는 다양한 수단(vehicles)(예를 들어, 하드웨어, 소프트웨어 및/또는 펌웨어)이 있으며, 선호되는 수단은 프로세스 및/또는 시스템 및/또는 다른 기술이 사용되는 컨텍스트(context)에 따라 변경될 것이다. 예를 들어, 구현자가 속도 및 정확성이 가장 중요하다고 결정한다면, 구현자는 주로 하드웨어 및/또는 펌웨어 수단을 선택할 수 있으며, 유연성이 가장 중요하다면, 구현자는 주로 소프트웨어 구현을 선택할 수 있다; 또는, 다른 대안으로서, 구현자는 하드웨어, 소프트웨어 및/또는 펌웨어의 어떤 결합을 선택할 수 있다.
전술한 상세한 설명은 블록도, 흐름도, 및/또는 예를 통해 장치의 다양한 실시예 및/또는 프로세스를 설명하였다. 그러한 블록도, 흐름도, 및/또는 예는 하나 이상의 기능 및/또는 동작을 포함하는 한, 당업자라면 그러한 블록도, 흐름도, 또는 예 내의 각각의 기능 및/또는 동작은 하드웨어, 소프트웨어, 펌웨어, 또는 가상의 그들의 임의의 조합의 넓은 범위에 의해 개별적으로 및/또는 집합적으로 구현될 수 있다는 것이 이해될 것이다. 일 실시예에서, 본 개시에 기재된 대상의 몇몇 부분은 ASIC(Application Specific Integrated Circuit), FPGA(Field Programmable Gate Array), DSP(Digital Signal Processor) 또는 다른 집적의 형태를 통해 구현될 수 있다. 그러나, 당업자라면, 본 개시의 실시예의 일부 양상은, 하나 이상의 컴퓨터 상에 실행되는 하나 이상의 컴퓨터 프로그램(예를 들어, 하나 이상의 컴퓨터 시스템 상에 실행되는 하나 이상의 프로그램), 하나 이상의 프로세서 상에서 실행되는 하나 이상의 프로그램(예를 들어, 하나 이상의 마이크로프로세서 상에서 실행되는 하나 이상의 프로그램), 펌웨어 또는 실질적으로 이들의 조합으로써, 전체적으로 또는 부분적으로 균등하게 집적회로에 구현될 수 있다는 알 수 있으며, 소프트웨어 및/또는 펌웨어를 위한 코드의 작성 및/또는 회로의 설계는 본 개시에 비추어 당업자에게 자명할 것이다. 또한, 당업자라면, 본 개시의 대상의 매커니즘(mechanism)들이 다양한 형태의 프로그램 제품으로 분포될 수 있음을 이해할 것이며, 본 개시의 대상의 예시는, 분배를 실제로 수행하는데 사용되는 신호 포함 매체(signal bearing medium)의 특정 유형과 무관하게 적용됨을 이해할 것이다. 신호 포함 매체의 예는, 플로피 디스크, 하드 디스크 드라이브, CD, DVD, 디지털 테이프, 컴퓨터 메모리 등과 같은 판독가능 유형의 매체, 디지털 및/또는 아날로그 통신 매체(예를 들어, 섬유 광학 케이블, 웨이브가이드, 유선 통신 링크, 무선 통신 링크 등)와 같은 전송 유형 매체를 포함할 수 있으나, 이에 제한되지는 않는다.
당업자라면, 여기서 설명된 형식으로 장치 및/또는 프로세스를 기술하고, 이후, 공학 실무를 사용하여 그러한 기술된 장치(예를 들면, 전송기, 수신기, 컴퓨팅 플랫폼, 컴퓨팅 장치 등) 및/또는 방법을 데이터 처리 시스템에 통합한다는 것은 당해 분야에서는 일반적이란 것을 인식할 것이다. 즉, 여기서 기술된 장치 및/또는 방법의 적어도 일부는 합당한 실험량을 통해 데이터 처리 시스템에 통합될 수 있다. 당업자라면, 전형적인 데이터 처리 시스템은 일반적으로 하나 이상의 시스템 유닛 하우징, 비디오 디스플레이 장치, 휘발성 및 비휘발성 메모리 같은 메모리, 마이크로프로세서 및 디지털 신호 프로세서 같은 프로세서, 운영 체제, 드라이버, 그래픽 사용자 인터페이스 및 애플리케이션 프로그램과 같은 컴퓨터 엔티티(computational entities), 터치 패드 또는 스크린 같은 하나 이상의 상호작용 장치, 및/또는 피드백 루프 및 제어 모터(예를 들면, 위치 및/또는 속도를 감지하기 위한 피드백; 컴포넌트 및/또는 양(quantities)을 이동하고 및/또는 조정하기 위한 제어 모터)를 포함하는 제어 시스템을 일반적으로 포함한다는 것을 인식할 것이다. 전형적인 데이터 처리 시스템은 데이터 컴퓨팅/통신 및/또는 네트워크 컴퓨팅/통신 시스템에서 전형적으로 발견되는 바와 같은 임의의 적절한 상업적으로 이용가능한 컴포넌트를 이용하여 구현될 수 있다.
여기서 기술된 대상은 때때로 상이한 다른 컴포넌트 내에 포함되거나 접속된 상이한 컴포넌트를 도시한다. 도시된 그러한 아키텍처는 단순히 예시적인 것이고, 사실상 동일한 기능을 달성하는 다른 많은 아키텍처가 구현될 수 있다는 것이 이해되어야 한다. 개념적으로, 동일한 기능을 달성하기 위한 컴포넌트의 임의의 배치는 원하는 기능이 달성되도록 유효하게 "연관"된다. 이에 따라, 특정 기능을 달성하기 위해 여기서 결합된 임의의 두 개의 컴포넌트는, 아키텍처 또는 중간 컴포넌트와는 무관하게, 원하는 기능이 달성되도록 서로 "연관"된 것으로 볼 수 있다. 마찬가지로, 연관된 두 개의 컴포넌트는 또한 원하는 기능을 달성하기 위해 서로 "동작적으로 접속"되거나 또는 "동작적으로 연결"되는 것으로 간주될 수 있고, 그와 같이 연관될 수 있는 임의의 두 개의 컴포넌트는 또한 원하는 기능을 달성하기 위해 서로 "동작적으로 연결가능"한 것으로 볼 수 있다. 동작적으로 연결 가능하다는 것의 특정 예는 물리적으로 양립가능(mateable)하고 및/또는 물리적으로 상호작용하는 컴포넌트 및/또는 무선으로 상호작용이 가능하고 및/또는 무선으로 상호작용하는 컴포넌트 및/또는 논리적으로 상호작용하고 및/또는 논리적으로 상호작용이 가능한 컴포넌트를 포함하지만, 이에 한정되는 것은 아니다.
여기에서 실질적으로 임의의 복수 및/또는 단수의 용어의 사용에 대하여, 당업자는 맥락 및/또는 응용에 적절하도록, 복수를 단수로 및/또는 단수를 복수로 해석할 수 있다. 다양한 단수/복수의 치환은 명확성을 위해 여기에서 명시적으로 기재될 수 있다.
당업자라면, 일반적으로 본 개시에 사용되며 특히 첨부된 청구범위(예를 들어, 첨부된 청구범위)에 사용된 용어들이 일반적으로 "개방적(open)" 용어(예를 들어, 용어 "포함하는"은 "포함하지만 이에 제한되지 않는"으로, 용어 "갖는"는 "적어도 갖는"으로, 용어 "포함하다"는 "포함하지만 이에 한정되지 않는" 등으로 해석되어야 함)로 의도되었음을 이해할 것이다. 또한, 당업자라면, 도입된 청구항의 기재사항의 특정 수가 의도된 경우, 그러한 의도가 청구항에 명시적으로 기재될 것이며, 그러한 기재사항이 없는 경우, 그러한 의도가 없음을 또한 이해할 것이다. 예를 들어, 이해를 돕기 위해, 이하의 첨부 청구범위는 "적어도 하나" 및 "하나 이상" 등의 도입 구절의 사용을 포함하여 청구항 기재사항을 도입할 수 있다. 그러나, 그러한 구절의 사용이, 부정관사 "하나"("a" 또는 "an")에 의한 청구항 기재사항의 도입이, 그러한 하나의 기재사항을 포함하는 실시예로, 그러한 도입된 청구항 기재사항을 포함하는 특정 청구항을 제한함을 암시하는 것으로 해석되어서는 안되며, 동일한 청구항이 도입 구절인 "하나 이상" 또는 "적어도 하나" 및 "하나"("a" 또는 "an")과 같은 부정관사(예를 들어, "하나"는 "적어도 하나" 또는 "하나 이상"을 의미하는 것으로 일반적으로 해석되어야 함)를 포함하는 경우에도 마찬가지로 해석되어야 한다. 이는 청구항 기재사항을 도입하기 위해 사용된 정관사의 경우에도 적용된다. 또한, 도입된 청구항 기재사항의 특정 수가 명시적으로 기재되는 경우에도, 당업자라면 그러한 기재가 일반적으로 적어도 기재된 수(예를 들어, 다른 수식어가 없는 "두개의 기재사항"을 단순히 기재한 것은, 일반적으로 적어도 두 개의 기재사항 또는 두 개 이상의 기재사항을 의미함)를 의미하도록 해석되어야 함을 이해할 것이다. 또한, "A, B 및 C,등 중의 적어도 하나"와 유사한 규칙이 사용된 경우에는, 일반적으로 그러한 해석은 당업자가 그 규칙을 이해할 것이라는 전제가 의도된 것이다(예를 들어, "A, B 및 C 중의 적어도 하나를 갖는 시스템"은, A만을 갖거나, B만을 갖거나, C만을 갖거나, A 및 B를 함께 갖거나, A 및 C를 함께 갖거나, B 및 C를 함께 갖거나, A, B, 및 C를 함께 갖는 시스템을 포함하지만 이에 제한되지 않음). "A, B 또는 C 중의 적어도 하나"와 유사한 규칙이 사용된 경우에는, 일반적으로 그러한 해석은 당업자가 그 규칙을 이해할 것이라는 전제가 의도된 것이다(예를 들어, "A, B 또는 C 중의 적어도 하나를 갖는 시스템"은, A만을 갖거나, B만을 갖거나, C만을 갖거나, A 및 B를 함께 갖거나, A 및 C를 함께 갖거나, B 및 C를 함께 갖거나, A, B, 및 C를 함께 갖는 시스템을 포함하지만 이에 제한되지 않음). 또한 당업자라면, 실질적으로 어떠한 이접 접속어(disjunctive word) 및/또는 두 개 이상의 대안적인 용어들을 나타내는 구절은, 그것이 상세한 설명, 청구범위 또는 도면에 있는지와 상관없이, 그 용어들 중의 하나, 그 용어들 중의 어느 하나, 또는 그 용어들 두 개 모두를 포함하는 가능성을 고려했음을 이해할 것이다. 예를 들어, "A 또는 B"라는 구절은 "A" 또는 "B" 또는 "A 및 B"의 가능성을 포함하는 것으로 이해될 것이다.
또한, 마쿠쉬 그룹을 이용하여 본 개시의 특징 또는 양상이 기술될 때는, 당업자라면 본 개시가 또한 마쿠쉬 그룹의 임의의 개별 구성원 또는 구성원의 서브그룹을 이용하여 기술됨을 이해할 것이다.
서면의 기재를 제공하는 것과 같은 어떠한 그리고 모든 목적을 위해서, 본 개시에 기재된 모든 범위는 모든 어떠한 가능한 하위범위 및 그 하위범위의 조합을 또한 포괄함이 이해 되어야 한다. 임의의 나열된 범위는, 그 동일한 범위가 적어도 동일한 이분 범위, 삼분 범위, 사분 범위, 오분 범위, 십분 범위 등으로 분할될 수 있으며, 그러한 동일 범위를 충분히 기술하는 것으로 용이하게 인식될 수 있다. 제한되지 않은 예로서, 본 개시에 기재된 각 범위는, 하위 삼분, 중간 삼분, 상위 삼분 등으로 용이하게 분할될 수 있다. 또한, "까지(up to)", "적어도(at least)", “더 큰(greater than)”, “더 적은(less than)” 등과 같은 모든 언어는 인용된 수를 포함하며, 상술한 바와 같은 하위 범위로 분할될 수 있는 범위들을 나타냄이 이해되어야 한다. 마지막으로, 범위는 각 개별 구성요소를 포함됨이 이해되어야 한다. 따라서, 예를 들어, 1 내지 3 셀(cell)을 가지는 그룹은 1, 2 또는 3 셀을 가지는 그룹을 나타낸다. 유사하게, 1 내지 5 셀을 가지는 그룹은 1, 2, 3, 4 또는 5 셀을 가지는 그룹을 나타내는 등이다.
전술한 바로부터, 본 개시의 다양한 실시예들은 예시의 목적으로 여기에서 기술되었음과, 본 개시의 사상과 범위를 벗어나지 않으면서 다양한 수정이 이루어질 수 있음이 이해될 것이다. 따라서, 여기에서 개시된 다양한 실시예들은 제한하는 것으로 의도되지 않으며, 진정한 범위 및 사상은 이하의 청구항에 의해 나타난다.

Claims (20)

  1. 입력 비디오 신호의 부분(portion)을 선택하고 상기 부분을 파티션(partition)들로 분할하도록 구성된 전처리기(pre-processor);
    상기 파티션들을 제1 도메인(domain)에서 제2 도메인으로 변환하도록 구성된 제1 변환기(transformer);
    상기 제2 도메인의 상기 각각의 파티션들로부터 대표 값들을 선택하도록 구성된 선택기(selector);
    상기 대표 값들을 수집하여 값들의 대표 그룹을 형성하도록 구성된 수집기(collector); 및
    상기 대표 그룹을 인코딩하도록 구성된 제1 인코딩 유닛
    을 포함하는 비디오 신호 인코더(video signal encoder).
  2. 제1항에 있어서,
    상기 입력 비디오 신호는 제1 해상도에 해당하는 비디오 신호를 가지고 상기 대표 그룹은 제2 해상도에 해당하는 비디오 신호를 가지며, 상기 제2 해상도는 상기 제1 해상도보다 작은, 비디오 신호 인코더.
  3. 제2항에 있어서,
    상기 제1 해상도는 적어도 7680 픽셀(pixel) 및 적어도 4320 라인(line)을 포함하는, 비디오 신호 인코더.
  4. 제2항에 있어서,
    상기 제1 해상도는 적어도 3840 픽셀 및 적어도 2160 라인을 포함하는, 비디오 신호 인코더.
  5. 제1항에 있어서,
    상기 제1 도메인은 공간 도메인이고 상기 제2 도메인은 주파수 도메인인, 비디오 신호 인코더.
  6. 제5항에 있어서,
    상기 제1 변환기는 상기 파티션들에 이산 코사인 변환(discrete cosine transform(DCT))을 수행하도록 구성되고, 상기 선택기는 상기 제2 도메인의 상기 파티션들의 DC 값들을 선택하도록 구성된, 비디오 신호 인코더.
  7. 제1항에 있어서,
    상기 부분은 상기 입력 비디오 신호의 매크로 블록(macro-block)에 해당하고 상기 파티션들은 상기 부분을 구성하는 서브 블록(sub-block)들에 해당하는, 비디오 신호 인코더.
  8. 제1항에 있어서,
    상기 부분은 상기 입력 비디오 신호의 32x32 크기의 블록에 해당하는, 비디오 신호 인코더.
  9. 제1항에 있어서,
    상기 제1 인코딩 유닛은,
    상기 대표 그룹을 변환하도록 구성된 제2 변환기; 및
    상기 변환된 대표 그룹의 인트라 텍스쳐 코딩(intra-texture coding)을 수행하도록 구성된 인트라 코딩기(intra-coder)를 포함하는, 비디오 신호 인코더.
  10. 제1항에 있어서,
    상기 제1 인코딩 유닛은,
    적어도 하나의 참조 이미지(reference image)와 비교되어 상기 대표 그룹의 인터 텍스쳐 코딩(inter-texture coding)을 수행하도록 구성된 인터 코딩기(inter-coder)를 포함하는, 비디오 신호 인코더.
  11. 제10항에 있어서,
    상기 인터 코딩기는 상기 대표 그룹의 모션 추정(motion estimation) 및 모션 보상(motion compensation)을 수행하도록 더 구성된, 비디오 신호 인코더.
  12. 제1항에 있어서,
    상기 인코딩된 대표 그룹으로부터 참조 이미지를 복원하도록 구성된 제1 복원 유닛을 더 포함하는 비디오 신호 인코더.
  13. 제12항에 있어서,
    상기 복원된 이미지를 확장하여 확장된 이미지를 형성하도록 구성된 이미지 확장기(image expander); 및
    상기 확장된 이미지를 이용하여 상기 전처리기에 의해 결정된 상기 부분을 인코딩 하도록 구성된 제2 인코딩 유닛을 더 포함하는 비디오 신호 인코더.
  14. 제13항에 있어서,
    상기 이미지 확장기는,
    상기 복원된 이미지에서의 값을 복제하여 상기 확장된 이미지에서의 다수의 픽셀들을 형성하도록 구성된 픽셀 복제기(pixel duplicator)를 포함하는, 비디오 신호 인코더.
  15. 제13항에 있어서,
    상기 제2 인코딩 유닛은,
    상기 부분 및 상기 확장된 이미지 사이의 차분 이미지(differential image)를 결정하도록 구성된 차분화 유닛(differentiating unit);
    상기 차분 이미지를 변환하도록 구성된 제3 변환기; 및
    상기 변환된 차분 이미지의 엔트로피 코딩(entropy coding)을 수행하도록 구성된 엔트로피 코딩기를 포함하는, 비디오 신호 인코더.
  16. 제13항에 있어서,
    시간 분해(temporal decomposition) 및 모션 보상에 의하여 제2 복원된 이미지를 복원하도록 구성된 제2 복원 유닛을 더 포함하고,
    상기 제2 복원된 이미지는 상기 전처리기에 의해 결정된 상기 부분과 동일한 크기이며,
    상기 제2 인코딩 유닛은,
    상기 제2 복원된 이미지 및 상기 확장된 이미지 사이의 차분 이미지를 결정하도록 구성된 차분화 유닛;
    상기 차분 이미지를 변환하도록 구성된 제3 변환기; 및
    상기 변환된 차분 이미지의 엔트로피 코딩을 수행하도록 구성된 엔트로피 코딩기를 포함하는, 비디오 신호 인코더.
  17. 제13항에 있어서,
    상기 인코딩된 대표 그룹 및 상기 인코딩된 부분을 포함하는 비트 스트림(bit-stream)을 생성하도록 구성된 비트 스트림 생성기를 더 포함하는 비디오신호 인코더.
  18. 제1항에 따른 상기 비디오 신호 인코더에 의해 인코딩된 비디오 신호를 포함하는 디코더 판독 가능 매체(decoder-readable medium).
  19. 비디오 신호를 인코딩하기 위한 방법으로서,
    입력 비디오 신호의 부분을 선택하고 상기 부분을 파티션들로 분할하는 단계;
    상기 파티션들을 제1 도메인에서 제2 도메인으로 변환하는 단계;
    상기 제2 도메인의 상기 각각의 파티션들로부터 대표 값들을 선택하는 단계 - 상기 대표 값들은 상기 파티션들을 각각 대표함 -;
    상기 대표 값들을 수집하여 값들의 대표 그룹을 형성하는 단계; 및
    상기 대표 그룹을 인코딩하는 단계
    를 포함하는 방법.
  20. 제19항에 있어서,
    상기 인코딩된 대표 그룹으로부터 참조 이미지를 복원하는 단계;
    상기 복원된 이미지를 확장하여 확장된 이미지를 형성하는 단계; 및
    상기 확장된 이미지를 이용하여 상기 결정된 부분에 해당하는 인코딩된 데이터를 생성하는 단계
    를 더 포함하는 방법.
KR1020127024239A 2010-02-17 2010-12-13 비디오 신호 처리 KR101354095B1 (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US12/707,400 US8611414B2 (en) 2010-02-17 2010-02-17 Video signal processing and encoding
US12/707,400 2010-02-17
PCT/KR2010/008897 WO2011102598A1 (en) 2010-02-17 2010-12-13 Video signal processing

Publications (2)

Publication Number Publication Date
KR20120118505A true KR20120118505A (ko) 2012-10-26
KR101354095B1 KR101354095B1 (ko) 2014-01-27

Family

ID=44369622

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020127024239A KR101354095B1 (ko) 2010-02-17 2010-12-13 비디오 신호 처리

Country Status (5)

Country Link
US (1) US8611414B2 (ko)
JP (3) JP2013520125A (ko)
KR (1) KR101354095B1 (ko)
CN (1) CN102763413B (ko)
WO (1) WO2011102598A1 (ko)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011216948A (ja) * 2010-03-31 2011-10-27 Sony Corp カメラシステム、映像処理装置及びカメラ装置
CN113556556A (zh) * 2010-04-13 2021-10-26 Ge视频压缩有限责任公司 显著性图和变换系数块的编码
US20130195186A1 (en) * 2012-02-01 2013-08-01 Futurewei Technologies, Inc. Scalable Video Coding Extensions for High Efficiency Video Coding
US9912941B2 (en) 2012-07-02 2018-03-06 Sony Corporation Video coding system with temporal layers and method of operation thereof
US20140003504A1 (en) * 2012-07-02 2014-01-02 Nokia Corporation Apparatus, a Method and a Computer Program for Video Coding and Decoding
KR102257379B1 (ko) * 2014-07-22 2021-06-01 삼성전자주식회사 비디오 인코딩 회로 및 그것을 이용하는 비디오 인코딩 방법
CN117499644A (zh) * 2019-03-14 2024-02-02 北京字节跳动网络技术有限公司 环路整形信息的信令和语法

Family Cites Families (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3065393B2 (ja) * 1991-09-12 2000-07-17 富士通株式会社 画像データ復元方法および画像データ復元装置
JPH06205397A (ja) * 1992-12-28 1994-07-22 Toshiba Corp 動画像符号化装置
JP3609488B2 (ja) * 1995-05-17 2005-01-12 株式会社日立製作所 情報処理システム
US5852565A (en) * 1996-01-30 1998-12-22 Demografx Temporal and resolution layering in advanced television
US6370198B1 (en) * 1997-04-07 2002-04-09 Kinya Washino Wide-band multi-format audio/video production system with frame-rate conversion
US6233356B1 (en) * 1997-07-08 2001-05-15 At&T Corp. Generalized scalability for video coder based on video objects
AU1937799A (en) * 1997-12-23 1999-07-12 Sarnoff Corporation Partial decoding of compressed video sequences
JPH11205152A (ja) * 1998-01-19 1999-07-30 Sony Corp データ符号化装置、データ多重化装置及びデータ符号化多重化装置
JP2000350204A (ja) * 1999-06-02 2000-12-15 Hitachi Ltd 階層符号化方法および画像符号化/復号化装置
JP2003116009A (ja) * 2001-10-04 2003-04-18 Canon Inc 画像符号化制御装置及び方法
KR20060105407A (ko) * 2005-04-01 2006-10-11 엘지전자 주식회사 영상 신호의 스케일러블 인코딩 및 디코딩 방법
KR20060109247A (ko) * 2005-04-13 2006-10-19 엘지전자 주식회사 베이스 레이어 픽처를 이용하는 영상신호의 엔코딩/디코딩방법 및 장치
WO2005032138A1 (en) * 2003-09-29 2005-04-07 Koninklijke Philips Electronics, N.V. System and method for combining advanced data partitioning and fine granularity scalability for efficient spatio-temporal-snr scalability video coding and streaming
JP2008521270A (ja) * 2004-11-16 2008-06-19 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ 送信者側チャネル適応型のビデオ送信
KR100703734B1 (ko) * 2004-12-03 2007-04-05 삼성전자주식회사 Dct 업샘플링을 이용한 다 계층 비디오 인코딩/디코딩방법 및 장치
KR100886191B1 (ko) * 2004-12-06 2009-02-27 엘지전자 주식회사 영상 블록을 디코딩 하는 방법
KR100704626B1 (ko) * 2005-02-07 2007-04-09 삼성전자주식회사 다 계층 기반의 모션 벡터를 압축하는 방법 및 장치
EP1886502A2 (en) * 2005-04-13 2008-02-13 Universität Hannover Method and apparatus for enhanced video coding
JP4523493B2 (ja) * 2005-06-10 2010-08-11 三菱電機株式会社 階層的動画像符号化装置、階層的動画像復号装置、およびその方法
US7956930B2 (en) * 2006-01-06 2011-06-07 Microsoft Corporation Resampling and picture resizing operations for multi-resolution video coding and decoding
KR101512833B1 (ko) 2007-10-16 2015-04-16 톰슨 라이센싱 비트 깊이 확장성을 위한 아티팩트 제거를 위한 방법 및 장치
KR20090097015A (ko) * 2008-03-10 2009-09-15 삼성전자주식회사 스케일러블 영상 부호화장치 및 스케일러블 영상복호화장치
JP4692576B2 (ja) * 2008-05-26 2011-06-01 ソニー株式会社 信号送信装置及び信号送信方法

Also Published As

Publication number Publication date
JP2018085741A (ja) 2018-05-31
US8611414B2 (en) 2013-12-17
CN102763413A (zh) 2012-10-31
US20110200106A1 (en) 2011-08-18
WO2011102598A1 (en) 2011-08-25
JP6543688B2 (ja) 2019-07-10
JP6438904B2 (ja) 2018-12-19
CN102763413B (zh) 2016-04-13
KR101354095B1 (ko) 2014-01-27
JP2013520125A (ja) 2013-05-30
JP2016136763A (ja) 2016-07-28

Similar Documents

Publication Publication Date Title
JP6543688B2 (ja) ビデオ信号処理
CN103458241B (zh) 用于多层视频编码的速率控制方法和设备
CN104967850B (zh) 通过使用大变换单元对图像进行编码和解码的方法和设备
RU2559691C2 (ru) Способ декодирования, декодер, программный продукт, программное приложение для мобильного устройства беспроводной связи и электронный потребительский продукт
CN104620576A (zh) 可缩放视频译码中的替代变换
CN103563378A (zh) 存储器高效的上下文建模
CN111373753B (zh) 变换因子级别编码方法及其装置
MX2008012863A (es) Metodo y aparato de codificacion de video que soporta analisis sintactico independiente.
CN104718752A (zh) 在可缩放视频译码中减少取样相位信息的发信
CN105075258A (zh) 针对具有不同纵横比的空间可缩放性的层间参考图片建构
CN104604224A (zh) 可缩放视频译码中的变换基底调整
US20070177664A1 (en) Entropy encoding/decoding method and apparatus
WO2014070945A1 (en) Encoding video into lower resolution streams
CN104429076A (zh) 用于可缩放视频译码和3d视频译码的一般化残差预测
CN104620577A (zh) 在一般化残差预测的框架下的经加权差预测
KR102227660B1 (ko) 신호 변환 방법 및 디바이스
JP6566865B2 (ja) 動画像復号装置、動画像復号方法、動画像符号化装置、動画像符号化方法及びコンピュータ可読記録媒体
KR20060024449A (ko) 오버컴플릿 웨이브릿 도메인에서 비디오 코딩
KR101455553B1 (ko) 압축 측정을 사용하는 비디오 코딩
CN110731083A (zh) 视频编码***和方法中的编码块位流结构和语法
WO2014070941A1 (en) Video coding using lower resolution streams
JP6566864B2 (ja) ビットストリーム変換装置、ビットストリーム変換方法、配信システム及びコンピュータ可読記録媒体
EP3496405A1 (en) Devices and methods for video reconstruction from multiple source videos
Hu et al. Motion differential set partition coding for image sequence and video compression
CN109510985B (zh) 视频编码方法及其装置

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20161227

Year of fee payment: 4

FPAY Annual fee payment

Payment date: 20171226

Year of fee payment: 5