KR20160010602A

KR20160010602A - 비디오 및 이미지 압축에 있어서의 변환 시스템 및 방법

Info

Publication number: KR20160010602A
Application number: KR1020157035918A
Authority: KR
Inventors: 아누라그 멘드헤카르
Original assignee: 시노바 미디어
Priority date: 2013-05-20
Filing date: 2014-05-20
Publication date: 2016-01-27
Also published as: US10015507B2; HK1223176A1; US20140341304A1; EP3000075A4; WO2014189981A1; US20140341303A1; US10015506B2; EP3000075A1

Abstract

본 발명은 주파수 감소 및 복원을 위한 시스템 및 방법에 관한 것이다. 시스템 및 방법은 디지털 데이터, 예컨대 비디오 데이터 및 이미지 데이터의 시각적 리던던시를 감소시키기 위하여 사용될 수 있다.

Description

비디오 및 이미지 압축에 있어서의 변환 시스템 및 방법{TRANSFORM SYSTEM AND METHOD IN VIDEO AND IMAGE COMPRESSION}

본 출원은 “Frequency Reduction and Restoration System and Method in Video and Image Compression”이란 명칭으로 2013년 5월 20일에 출원된 미국 가특허출원 제61/825,487호에 대해 35 USC 119(e)에 의거한 이익과 35 USC 120에 의거한 우선권을 주장하며, 이 가출원의 전체 내용은 인용에 의해 본원에 통합된다.

본 발명은 일반적으로 비디오 및 이미지 압축에 관한 것이다.

디지털 이미지, 동화상 이미지 또는 비디오와 같은 디지털 데이터는 변환될 필요가 있을 수 있는 (화소로 표현되는) 다수의 정보를 포함한다. 이러한 정보를 변환시키면 디지털 데이터, 예컨대 이미지 및 비디오의 크기가 감소하며, 따라서 디지털 데이터가 압축될 수 있다. 따라서, 그 압축된 디지털 데이터가 변환될 수 있는 방식을 가지는 것이 바람직하다.

도 1은 이산 코사인 변환 압축 데이터 스트림과 같은 인입(incoming) 압축 데이터 스트림에 대한 변환 시스템의 예를 도시한다.
도 2는 도 1의 변환 시스템의 더 상세하게 도시한다.
도 3은 변환 방법의 흐름도이다.
도 4a는 예컨대 이를테면 DCT 변환에 있어서의 계수에 대한 변환 정보 모델의 예를 도시한다.

본 발명은 구체적으로 압축 디지털 데이터(compressed digital data), 예컨대 이미지 데이터 또는 비디오 데이터에 대한 변환 시스템 및 방법에 적용가능하며, 이러한 맥락에서 본 발명이 설명될 것이다. 그러나, 변환이 대단히 유익하다는 것이 인식될 것인데, 왜냐하면 디지털 데이터를 더 효율적으로 압축하기 위하여 변환될 필요가 있는 여러 타입의 데이터에 대하여 그 변환이 사용될 수 있기 때문이다.

도 1은 인입 압축 데이터 스트림(102), 예컨대 압축 이미지 데이터 스트림 또는 압축 비디오 데이터 스트림의 하나 이상의 변수를 변환시키기 위한 변환 시스템(100)의 예를 도시한다. 입력 데이터 스트림(102)은 예컨대 이산 코사인 변환(DCT: Discrete Cosine Transform)을 사용함으로써 압축되는 압축 데이터 스트림일 수 있다. DCT가 사용중일 때, 입력 데이터 스트림은 예컨대 JPEG(joint picture experts group) 파일 또는 데이터 스트림, 모션 JPEG 파일/데이터 스트림 또는 비디오 파일/데이터 스트림일 수 있으며, 이 스트림은 MPEG(motion picture expert group)-2, H.264 또는 H.265 압축 콘텐츠를 포함한다. 이하에서 제공된 설명에서, 상이한 타입의 DCT 압축 데이터는 DCT 압축 데이터로 총칭될 수 있다. 입력 스트림(102)은 변환 시스템(104)에 공급될 수 있으며, 변환 시스템(104)은 출력 데이터 스트림(106)을 생성할 수 있으며, 출력 데이터 스트림(106)은 동일한 타입의 압축을 가지나 인입 압축 데이터 스트림의 하나 이상의 변수가 이하에서 더 상세히 설명되는 바와 같이 수정되는 수정된 압축 데이터 스트림일 수 있다. 하나 이상의 변수는 압축 알고리즘 계수값, 예컨대 DCT 계수값, 출력 신호에서 잡음 감소를 야기하는 값 및/또는 재양자화 값일 수 있다.

변환 시스템(104)은 하드웨어 또는 소프트웨어 또는 하드웨어와 소프트웨어의 조합으로 구현될 수 있다. 예컨대, 변환 시스템(104)은 도 3를 참조로 하여 이하에서 설명되는 프로세스를 구현하기 위하여 복수의 라인의 명령 또는 마이크로코드를 실행하는 프로세서로 구현될 수 있거나, 또는 시스템(104)은 프로그램가능 하드웨어 디바이스(programmable hardware device), 예컨대 마이크로제어기, 필드 프로그램가능 게이트 어레이(FPGA) 또는 주문형 집적회로(ASIC, application specific integrated circuit)로 구현될 수 있다. 대안적으로, 시스템은 복수의 라인의 컴퓨터 코드를 실행하는 프로세서에 의해 액세스될 수 있는 메모리(DRAM, SRAM, 플래시, 디스크 드라이브, 광 드라이브)에 저장되는 복수의 라인의 컴퓨터 코드로 구현될 수 있다. 시스템(104)은 또한 컴팩트 디스크, 플래시 메모리 또는 다른 형태의 판독가능 매체일 수 있는 컴퓨터 판독가능 매체상에 저장되나, 또한 원격 컴퓨터 시스템(예컨대, 하나 이상의 서버 컴퓨터 또는 하나 이상의 컴퓨팅 소스)에 저장되고 이후 네트워크를 통해 사용자에 의해 다운로드 및/또는 액세스될 수 있는 복수의 라인의 컴퓨터 코드로 구현될 수 있다. 더욱이, 변환 시스템(104)은 다른 시스템/제품에 통합될 수 있다.

도 2는 도 1의 변환 시스템(104)의 더 상세한 설명을 도시한다. 변환 시스템(104)은 이하에서 더 상세히 설명되는 바와 같이 변환 프로세스를 수행하는 데이터 스트림 프로세서(202)에 커플링되는 변환 정보 모델(200)을 더 포함할 수 있다. 변환 시스템(104)은 복수의 변환 정보 모델을 저장하는 스토어(store), 예컨대 데이터베이스, 다른 저장 디바이스 및/또는 소프트웨어 저장 시스템을 가질 수 있다. 일 실시예에서, 압축 데이터 스트림을 실제로 프로세싱하기 전에, 변환 정보 모델 또는 복수의 변환 정보 모델은 다양한 데이터 스트림을 경험적으로 분석함으로써 구성될 수 있다. 예컨대, DCT로 주파수 값을 변환하는데 있어서, 변환 정보 모델은 DCT에서 사용되는 주파수 각각에 대응하는 수치값을 포함할 수 있다. 예컨대, 8x8 DCT 기반 데이터 스트림은 변환 정보 모델이 구성되는 64개의 주파수를 가질 것이다. 로우-디테일(low-detail) DCT 블록(소량의 콘텐츠/시각 정보를 가진 화소의 블록에 대한 DCT 계수의 블록)에 대한 변환 정보 모델의 일례는 도 4a에 도시되며, 도 4a에서 행렬내의 위치는 DCT 블록의 특정 주파수에 대응하며, 값은 그 주파수에서의 리던던시(redundancy)의 양에 대응한다. 따라서, DCT 계수에 대한 변환 정보 모델은 DCT 계수를 변환시킬 수 있다. 일례에서, DCT 계수에 대한 변환 정보 모델은 이하에서 더 상세히 설명되는 바와 같이 인입 데이터의 계수로부터 값의 세트를 감산하기 위하여 사용될 수 있다.

변환 정보 모델은 또한 인입 데이터의 각각의 블록의 계수를 나누거나 또는 곱하는 것과 같은 수학 함수를 수행하기 위하여 사용될 수 있는 값의 행렬(이하에서 설명됨)일 수 있다. 예컨대, 재양자화 또는 재양자화를 위한 변환 정보 모델은 수학 함수를 수행하기 위하여 사용될 수 있는 변환 정보 모델의 예일 수 있다. 예컨대, 재양자화를 위한 변환 정보 모델은 DCT를 나누기 위하여 사용될 수 있으며, H.264 스트림이 디코딩될 때 비디오를 재구성하기 위하여 H.264 스트림에서 필요한 정보의 양쪽 부분인 양자화 및 스케일링을 위한 새로운 양자화 및 스케일링 행렬을 추가로 선택할 수 있다.

변환 방법 구현에서, 변환 정보 모델의 값은 인입 압축 데이터 스트림의 값을 수정하기 위하여 사용될 수 있다. 일부 실시예에서, 인입 압축 데이터 스트림은 데이터값의 복수의 블록으로 부분적으로 디코딩될 수 있으며, 변환 정보 모델의 값은 데이터값의 각각의 블록의 값을 수정하기 위하여 사용될 수 있다. 일 실시예에서, 변환 정보 모델에 저장된 수치값은 압축 인입 데이터 스트림의 특정 블록, 예컨대 DCT 압축 인입 데이터 스트림의 8x8 DCT 블록으로부터 감산될 수 있으며, 결과적인 이미지는 인입 데이터 스트림의 이미지 또는 비디오로부터 시각적으로 구별할 수 없다. 이하에서 더 상세히 설명되는 바와 같이, 변환 정보 모델은 많은 상이한 값 세트를 가질 수 있으며, 각각의 세트는 상이한 환경 하에 적용가능하다.

도 3은 도 1-2에 도시된 시스템에 의해 수행될 수 있는 변환 방법(300)의 흐름도이다. 일 실시예에서, 방법의 프로세스는 복수의 라인 컴퓨터 코드에 의해 프로세스가 구현되는 데이터 스트림 프로세서(202)에 의해 수행될 수 있다. 대안적으로, 프로세스는 앞서 설명된 바와같은 프로세스를 실행하는 하드웨어 회로, 예컨대 프로세서, FPGA 등에 의해 구현될 수 있다. 방법에서, 인입 데이터 스트림의 부분 디코드(302)는 수행되는데, 여기서 인입 압축 데이터 스트림은 부분적으로 디코딩된 인입 압축 데이터 스트림이 복수의 데이터 블록을 가지는 지점까지 디코딩된다. 예컨대, 일 구현에서, DCT 압축 데이터 스트림의 DCT 계수는 블록 형태로 프로세싱하는데 이용가능할 수 있다. 시스템 및 방법에서, 블록은 정사각형의 각각의 변이 2의 정수 승(integer power of 2)인 행렬/정사각형(예컨대, 2X2 블록, 4X4 블록, 8X8 블록, 16X16블록, 32X32 블록 등)일 수 있다.

일단 인입 데이터 스트림이 부분적으로 디코딩되면, 방법은, 이하에서 더 상세히 설명되는 바와 같이, 부분적으로 디코딩되는 데이터 스트림의 각각의 블록에 대한 가장 적용가능한 변환 정보 모델을 선택한다(304). 예컨대, DCT 블록의 주파수가 수정되는 변환에서, 만일 인입 DCT 블록이 상대적으로 편평한 시각적 특성(소위 낮은 그라디언스(low gradience)로 지칭됨)을 가지면, 도 4a의 변환 정보 모델의 예와 같이 그 인입 DCT 블록에 대하여 특정 변환 정보 모델이 선택될 수 있다.

시스템은 다수의 변환 정보 모델이 저장되어 이용가능하게 할 수 있거나 또는 생성되어 이용가능하게 할 수 있다. 변환 정보 모델은 각각의 블록의 DCT 계수로부터 특정 변환 정보 모델 클래스(class)를 감산하여 각각의 블록의 DCT 계수에 다양한 재양자화를 적용하는 변환을 포함할 수 있다. 다른 가능한 변환은 특정 임계치에 대한 (블록의 DCT 계수의) 값을 테스트하고 값에 상수를 가산하거나 또는 값으로부터 상수를 감산함으로써 값을 수정하는 비선형 변환일 수 있고, 게다가, 앞의 변환의 조합은 블록에서 수정된 값 세트를 산출하기 위하여 사용될 수 있다. 동작의 예에서, 인입 데이터로부터의 블록은 다른 특징과 함께 배경에서 느리게 변화하는 그라디언트(gradient)를 가질 수 있다. 이러한 동작의 예에서, 시스템은, 재양자화가 필요하지 않은 블록의 통계적 특성에 기초하여, 특정 변환 정보 모델이 블록의 값으로부터 감산될 필요가 있음을 그리고 블록의 값의 일부가 상수를 가산하거나 또는 감산함으로써 비선형적으로 수정될 필요가 있음을 결정한다. 변환의 선택은 통상적으로 인간의 눈에 보이는 아티팩트(artifact)에 대한 영향을 최소화하면서 블록의 크기를 최소화하도록 이루어진다.

일단 각각의 블록에 대한 변환 정보 모델이 선택되면, 변환 정보 모델 데이터는 인입하는 부분적으로 디코딩되는 데이터 스트림의 블록을 수정하기 위하여 사용된다(306). 예컨대, DCT 계수값이 수정되는 구현에서, 변환 정보 모델 데이터는 블록으로부터 제거될 수 있다. DCT 블록값이 수정되는 일 실시예에서, 인입 데이터 스트림에서 각각의 DCT 블록의 절대값이 변환 정보 모델의 절대값보다 작으면, 출력 데이터 스트림의 DCT 계수(이는 특정 DCT 블록에 대응함)는 0으로 세팅된다. DCT 블록값이 수정되는 일 실시예에서, 인입 데이터 스트림에서 각각의 DCT 블록의 절대값이 변환 정보 모델의 절대값보다 작지 않으면, 인입 데이터 스트림의 DCT 계수의 절대값은 원래의 데이터 스트림의 DCT 계수의 부호를 유지하면서 변환 정보 모델의 대응값으로 감소된다.

일단 예컨대 DCT 계수에서 제거되는 리던던시에 의하여 변수값이 수정되었다면, 방법은 주파수를 복원한다(308). 특히, (예컨대, 이하에서 설명된 방법을 사용하여) 블록에서 앞의 리던던시 제거가 용납할 수 없는 시각적 차이를 도입한 계수의 경우에, 방법은 DCT 블록의 이 계수를 다시 DCT로부터의 자신의 원래 값으로 복원한다. 다른 변환 정보 모델의 경우에, 값의 복원이 발생할 수 있다. 예컨대, 만일 블록의 값의 양자화 파라미터가 변경되었으면, 복원은 이러한 변경을 고려하여 수행된다.

일단 주파수의 복원이 완료되었다면, 데이터 스트림은 변환 정보 모델에 기초하여, 수정된 데이터 값을 사용하여 재인코딩될 수 있다(310). DCT 계수가 수정되는 구현에서, 데이터 스트림은 (가능한 경우에 일부 원래의 계수 뿐만아니라 변환 정보 모델로부터의 일부 계수를 비롯하여) 방법으로부터 수정된 DCT 계수로 재인코딩될 수 있다.

가장 적용 가능한 변환 정보 모델 선택

주파수 감소의 경우에 RIM과 같은 적절한 변환 정보 모델은 예컨대 도 2에 도시된 데이터 스트림 프로세서(202)에 의해 평가될 수 있는 이하의 기준 중 하나 이상의 기준을 사용하여 각각의 블록에 대하여 선택될 수 있다. 적절한 RIM를 결정하기 위하여 사용되는 기준은 하기의 경우를 포함할 수 있다:

1. DCT 블록의 크기

2. DCT 블록의 통계적 특성(AC 에너지, 분산 등)

3. DCT 블록에 의해 표현되는 전체 디코딩된 화소의 통계적 특성. (화소의 평균값, 화소의 분산).

4. 데이터 스트림의 다른 특성(예컨대, 데이터 스트림이 표준 화질(SD) 이미지인지 또는 고화질(HD) 이미지인지의 여부).

예컨대, 만일 인입 DCT 블록이 매우 높은 AC 에너지를 표시하나 휘도가 낮으면, 변환의 집합(RIM 감산, 재양자화 뿐만 아니라 비선형 수정을 포함할 변환 모델로 총칭됨)이 선택될 것이며, 이는 블록으로부터 감산 된다는 점에서 더 공격적(aggressive)이다. 다른 경우에, 최소 변화를 수행하는 변환 모델이 선택될 수 있다. 더욱이, HD 스트림의 경우에, 통상적인 변환 모델은 인간의 눈의 상이한 예상 행위 때문에 SD 스트림과 비교하여 보다 높은 주파수 성분에 대해 상이한 값을 가질 것이다. SD 스트림이 고화질 디바이스상에서 디스플레이될 것이라는 것이 알려질 때, 변환 모델은 이미지의 스케일링-업(scaling-up)을 예상하여 범위의 중앙 및 고주파수에 대해 덜 공격적일 것이다.

시스템에서는 이들 기준의 다양한 조합에 대하여 하나 이상의 상이한 변환 정보 모델이 구성될 수 있다. 각각의 상이한 타입의 변환(주파수 감소, 잡음 감소, 재양자화 값 등)에 대하여, 부분적으로 디코딩된 인입 데이터 스트림의 블록이 프로세싱될 때 위의 기준이 컴퓨팅될 수 있으며, 특정 블록에 대한 변환 정보 모델을 선택하기 위하여, 특정 블록에 대한 특정 변환 쓰임새(use case)에 대한 하나 이상의 기준이 사용될 수 있다. 예컨대, DCT 계수를 사용하여 주파수를 감소시키기 위하여, DCT 블록이 (부분 디코딩 이후에) 프로세싱될 때 적절한 기준이 컴퓨팅되며, 특정 블록에서 앞의 기준의 조합은 특정 블록에 대하여 선택될 필요가 있는 RIM을 가르킨다. 이러한 프로세스의 하나의 예는 예컨대 낮은 분산 및 낮은 그라디언스를 가진 DCT 블록(여기서, "낮은"은 특정한 미리 결정된 임계치보다 낮다는 것을 의미함, 하기 참조)이 프로세싱되고 이러한 타입의 사례에 대하여 구성되었던 RIM이 사용될 때이다. 변환 정보 모델은 스트림이 표준 화질인지 또는 고화질인지의 여부에 따라 변화할 수 있다.

주파수 감소 변환을 위한 주파수 복원 기준

인간의 눈은 특정 타입의 압축 아티팩트(예컨대 블록 현상(blockiness) 및 윤곽대비(contouring))에 매우 민감하다. 특정 타입의 DCT 블록에 대하여, 선택된 RIM은 이들 압축 아티팩트의 악화를 유발할 수 있다. 예컨대, 느리게 변화하는 그라디언트를 가진 이미지 블록은 특히 압축 아티팩트의 직접적인 악화에 민감할 수 있다.

이들 타입의 DCT 블록의 식별은 DCT 블록에 의해 표현되는 화소의 1차 도함수의 분산을 컴퓨팅함으로써 달성될 수 있으며, "그라디언스(gradience)"로서 알려질 수 있다. 그라디언스는 예컨대 화소의 값을 그 화소의 좌측 이웃 및 최상부 이웃으로부터 각각 감산함으로써 유도된 값의 분산을 컴퓨팅함으로써 계산될 수 있다.

그라디언스가 특정 임계치 보다 낮을 때(이는 시스템 및 방법에 대한 파라미터로서 처리됨), 주파수 복원을 위하여 DCT 블록이 선택된다. 블록의 그라디언스는 0 내지 255일 수 있으며, 만일 그라디언스 값이 255보다 크면 255까지 잘려질 수 있다. 그라디언스 임계치는 또한 경험적으로 결정될 수 있으며, 애플리케이션에 의존할 수 있으며, 0 내지 12의 범위를 가진다. 그라디언스의 특정 값 및 DCT 블록의 크기에 따라, DCT 블록의 하나 이상의 주파수는 자신들의 원래의 인입 값으로 복원된다. 예컨대, 대량의 시각적 피델리티(visual fidelity)를 필요로 하는 애플리케이션은 매우 낮은 그라디언스 값을 사용할 것이며, 낮은 시각적 피델리티를 필요로 하는 애플리케이션은 높은 그라디언스 값을 허용할 것이다. 낮은 그라디언스 DCT 블록에서, 예컨대 하부 범위의 주파수는 RIM의 시각적 영향이 용납할 수 없는 경우에 복원된다. 시각적 영향은 보통 그 범위내의 주파수가 0으로 세팅되었으나 임의의 다른 적당한 메트릭이 또한 사용될 수 있는지를 결정하기 위하여 평가된다.

잡음 감소 변환 및 재양자화 변환

앞서 설명된 주파수 감소 실시예와 유사하게, 변환 시스템은 또한 잡음 감소 및 재양자화 값에 대한 부분적으로 디코딩된 인입 데이터 스트림의 블록의 값을 수정하기 위하여 사용될 수 있다. 잡음 감소 또는 재양자화를 위한 다른 변환은 유사하게 각각의 변이 2의 정수 승인 정사각형 행렬인 값의 블록일 수 있으며, 여기서 값의 블록은 인입하는 부분적으로 디코딩된 인입 데이터 스트림에서 각각의 블록의 값을 수정하기 위하여 사용된다. 주파수 감소를 위하여 앞서 설명된 바와 같이, 잡음 감소 또는 재양자화 값에 대한 변환 정보 모델은 앞서 설명된 주파수 감소와 동일한 기준의 일부 또는 전부에 기초하여 선택된 후, 데이터 스트림의 블록의 값을 수정하기 위하여 사용될 수 있으며, 이후 데이터 스트림은 재압축될 수 있다.

전술한 설명이 본 발명의 특정 실시예와 관련하여 설명되었을지라도, 본 개시내용의 원리 및 사상, 즉 첨부된 청구항에 의해 정의되는 범위로부터 벗어나지 않고 이러한 실시예의 변형이 이루어질 수 있다는 것이 당업자에 의해 인식될 것이다.

Claims

압축 데이터 스트림(compressed data stream)의 데이터 값을 변환하기 위한 시스템으로서,
데이터 스트림 프로세서를 포함하고,
상기 데이터 스트림 프로세서는 각각의 블록이 복수의 값을 가지는 복수의 블록으로, 압축된 인입 데이터 스트림을 부분적으로 디코딩하고, 각각의 블록에 대한 변환 모델(transform model)을 선택하고, 선택된 변환 모델의 복수의 값 중 하나의 값을 사용하여 각각의 블록의 값을 수정하고, 수정된 값을 포함하는 복수의 블록으로 데이터 스트림을 인코딩하도록 구성되는 시스템.
청구항 1에 있어서,
상기 변환 모델은 잡음 감소 정보 모델, 주파수 감소 정보 모델, 재양자화 모델 또는 비선형 계수 수정 모델 중 하나인 시스템.
청구항 2에 있어서,
상기 주파수 감소 정보 모델은 복수의 계수값을 더 포함하는 시스템.
청구항 3에 있어서,
상기 데이터 스트림 프로세서는 수정된 값을 가진 계수를 다시 그 원래의 값으로 변경시킴으로써, 부분적으로 디코딩된 인입 데이터 스트림에 값을 복원시키도록 구성되는 시스템.
청구항 1에 있어서,
상기 압축 인입 데이터 스트림은 DCT 기반 압축 스트림인 시스템.
청구항 5에 있어서,
상기 DCT 기반 압축 스트림은 MPEG-2 데이터 스트림, H.264 데이터 스트림, JPEG 데이터 스트림, 모션 JPEG 데이터 스트림 또는 H.265 데이터 스트림 중 하나인 시스템.
청구항 1에 있어서,
복수의 변환 정보 모델을 저장하도록 구성되는 스토어(store)를 더 포함하며, 상기 복수의 변환 정보 모델로부터 상기 변환 정보 모델이 선택되는 시스템.
청구항 1에 있어서,
상기 변환 정보 모델은 복수의 값을 가지며, 상기 변환 정보 모델의 각각의 값은 상기 블록의 값에 대응하는 시스템.
청구항 8에 있어서,
상기 블록은 정사각형 행렬이며, 상기 정사각형 행렬의 각각의 변은 2의 정수 승(integer power of 2)인 시스템.
청구항 1에 있어서,
상기 데이터 스트림 프로세서는 상기 부분적으로 디코딩된 인입 데이터 스트림의 블록의 그라디언스(gradience)의 부분에 기초하여 각각의 블록에 대한 변환 정보 모델을 선택하도록 구성되는 시스템.
청구항 1에 있어서,
상기 데이터 스트림 프로세서는 상기 블록의 크기, 상기 블록의 통계적 특성 및 상기 블록의 특성 중 하나 이상에 기초하여 각각의 블록에 대한 변환 정보 모델을 선택하도록 구성되는 시스템.
청구항 1에 있어서,
상기 데이터 스트림 프로세서는 프로세서 및 프로그램가능 하드웨어 디바이스 중 하나인 시스템.
압축 데이터 스트림의 데이터 값을 변환하는 방법으로서,
각각의 블록이 복수의 값을 가지는 복수의 블록으로 인입 데이터 스트림을 부분적으로 디코딩하는 단계;
각각의 블록에 대한 변환 정보 모델을 선택하는 단계;
선택된 변환 모델의 복수의 값 중 하나의 값에 기초하여 각각의 블록의 하나 이상의 값 중의 값을 수정하는 단계; 및
상기 수정된 값 및 상기 복수의 블록을 사용하여 데이터 스트림을 인코딩하는 단계를 포함하는 방법.
청구항 13에 있어서,
상기 변환 모델은 잡음 감소 정보 모델, 주파수 감소 정보 모델 및 재양자화 정보 모델 중 하나인 방법.
청구항 14에 있어서,
상기 주파수 감소 정보 모델은 복수의 계수값을 더 포함하는 방법.
청구항 15에 있어서,
수정된 값을 가진 계수를 다시 그 원래의 값으로 변경시킴으로써, 부분적으로 디코딩된 인입 데이터 스트림에 값을 복원시키는 단계를 더 포함하는 방법.
청구항 13에 있어서,
압축 인입 데이터 스트림은 DCT 기반 압축 스트림인 방법.
청구항 17에 있어서,
상기 DCT 기반 압축 스트림은 MPEG-2 데이터 스트림, H.264 데이터 스트림, JPEG 데이터 스트림, 모션 JPEG 데이터 스트림 또는 H.265 데이터 스트림 중 하나인 방법.
청구항 13에 있어서,
복수의 변환 정보 모델을 저장하는 단계를 더 포함하며,
상기 복수의 변환 정보 모델로부터 상기 변환 정보 모델이 선택되는 방법.
청구항 13에 있어서,
상기 변환 정보 모델은 복수의 값을 가지고,
상기 변환 정보 모델의 각각의 값은 상기 블록의 값에 대응하는 방법.
청구항 20에 있어서,
상기 블록은 정사각형 행렬이며, 상기 정사각형 행렬의 각각의 변은 2의 정수 승인 방법.
청구항 13에 있어서,
상기 각각의 블록에 대한 변환 정보 모델을 선택하는 단계는 상기 부분적으로 디코딩된 인입 데이터 스트림의 블록의 그라디언스의 부분에 기초하여 각각의 블록에 대한 변환 정보 모델을 선택하는 단계를 더 포함하는 방법.
청구항 13에 있어서,
상기 각각의 블록에 대한 변환 정보 모델을 선택하는 단계는 상기 블록의 크기, 상기 블록의 통계적 특성 또는 상기 블록의 특성 중 하나 이상에 기초하여 각각의 블록에 대한 변환 정보 모델을 선택하는 단계를 더 포함하는 방법.
청구항 13에 있어서,
부분적으로 디코딩된 인입 데이터 스트림의 블록의 각각의 값에 대하여, 상기 블록의 값에 대응하는, 상기 변환 정보 모델의 값의 절대값과 상기 블록의 값의 절대값을 비교하는 단계, 및
상기 블록의 값의 절대값이 상기 블록의 값에 대응하는, 상기 변환 정보 모델의 값의 절대값보다 작은 경우에 상기 부분적으로 디코딩된 인입 데이터 스트림의 값을 0으로 세팅하는 단계를 더 포함하는 방법.
청구항 13에 있어서,
부분적으로 디코딩된 인입 데이터 스트림의 블록의 각각의 값에 대하여, 상기 블록의 값에 대응하는 상기 변환 정보 모델의 값의 절대값과 상기 블록의 값의 절대값을 비교하는 단계, 상기 부분적으로 디코딩된 인입 데이터 스트림의 값을 상기 변환 정보 모델의 값으로 세팅하는 단계, 및 상기 블록의 값의 절대값이 상기 블록의 값에 대응하는, 상기 변환 정보 모델의 값의 절대값보다 작지 않은 경우에 상기 부분적으로 디코딩된 인입 데이터 스트림의 값의 부호를 유지하는 단계를 더 포함하는 방법.
컴퓨터 판독가능 매체로서,
각각의 블록이 복수의 값을 가지는 복수의 블록으로 인입 데이터 스트림을 부분적으로 디코딩하는 명령;
각각의 블록에 대한 변환 정보 모델을 선택하는 명령;
선택된 변환 모델의 복수의 값 중 하나의 값에 기초하여 각각의 블록의 하나 이상의 값 중의 값을 수정하는 명령; 및
상기 수정된 값 및 상기 복수의 블록으로 데이터 스트림을 인코딩하는 명령을 포함하는 컴퓨터 판독가능 매체.
청구항 26에 있어서,
상기 변환 모델은 잡음 감소 정보 모델, 주파수 감소 정보 모델 또는 재양자화 정보 모델 중 하나인 컴퓨터 판독가능 매체.
청구항 27에 있어서,
상기 주파수 감소 정보 모델은 복수의 계수값을 더 포함하는 컴퓨터 판독가능 매체.
청구항 28에 있어서,
수정된 값을 가진 계수를 다시 그 원래의 값으로 변경시킴으로써, 부분적으로 디코딩된 인입 데이터 스트림에 대한 값을 복원시키는 명령을 더 포함하는 컴퓨터 판독가능 매체.
청구항 26에 있어서,
상기 각각의 블록에 대한 변환 정보 모델을 선택하는 명령은 상기 부분적으로 디코딩된 인입 데이터 스트림의 블록의 그라디언스의 부분에 기초하여 각각의 블록에 대한 변환 정보 모델을 선택하는 명령을 더 포함하는 컴퓨터 판독가능 매체.
청구항 26에 있어서,
상기 각각의 블록에 대한 변환 정보 모델을 선택하는 명령은 상기 블록의 크기, 상기 블록의 통계적 특성 또는 상기 블록의 특성 중 하나 이상에 기초하여 각각의 블록에 대한 변환 정보 모델을 선택하는 명령을 더 포함하는 컴퓨터 판독가능 매체.
청구항 26에 있어서,
부분적으로 디코딩된 인입 데이터 스트림의 블록의 각각의 값에 대하여, 상기 블록의 값에 대응하는, 상기 변환 정보 모델의 값의 절대값과 상기 블록의 값의 절대값을 비교하는 명령, 및 상기 블록의 값의 절대값이 상기 블록의 값에 대응하는, 상기 변환 정보 모델의 값의 절대값보다 작은 경우에 상기 부분적으로 디코딩된 인입 데이터 스트림의 값을 0으로 세팅하는 명령을 더 포함하는 컴퓨터 판독가능 매체.
청구항 26에 있어서,
부분적으로 디코딩된 인입 데이터 스트림의 블록의 각각의 값에 대하여, 상기 블록의 값에 대응하는, 상기 변환 정보 모델의 값의 절대값과 상기 블록의 값의 절대값을 비교하는 명령, 상기 부분적으로 디코딩된 인입 데이터 스트림의 값을 상기 변환 정보 모델의 값으로 세팅하는 명령, 및 상기 블록의 값의 절대값이 상기 블록의 값에 대응하는, 상기 변환 정보 모델의 값의 절대값보다 작지 않은 경우에 상기 부분적으로 디코딩된 인입 데이터 스트림의 값의 부호를 유지하는 명령을 더 포함하는 컴퓨터 판독가능 매체.