KR20200004348A

KR20200004348A - 타겟 영역 수정을 통해 비디오 신호를 처리하는 방법 및 장치

Info

Publication number: KR20200004348A
Application number: KR1020197035640A
Authority: KR
Inventors: 최장원
Original assignee: 엘지전자 주식회사
Priority date: 2017-06-02
Filing date: 2018-06-01
Publication date: 2020-01-13
Also published as: US10999591B2; US20200195952A1; WO2018222020A1

Abstract

본 발명은, 타겟 수정을 통해 비디오 신호를 처리하는 방법에 있어서, 상기 비디오 신호의 시퀀스 파라미터 셋으로부터 타겟 수정 플래그를 획득하는 단계, 여기서 상기 타겟 수정 플래그는 타겟 영역에 대해 수정을 수행하는지 여부를 나타냄; 상기 타겟 수정 플래그에 따라 타겟 영역에 대해 수정을 수행하는 경우, 타겟 수정 인덱스를 획득하는 단계, 여기서 상기 타겟 수정 인덱스는 타겟 수정 방법을 나타내며, 수정 없음, 좌우 대칭 변환, 상하 대칭 변환, 회전 변환 또는 이들의 조합 중 적어도 하나에 대응됨; 상기 타겟 수정 인덱스에 대응되는 타겟 수정 방법을 확인하는 단계; 및 상기 타겟 수정 방법에 따라, 복원된 타겟 영역에 대해 역수정을 수행하는 단계를 포함하는 것을 특징으로 하는 방법을 제공한다.

Description

타겟 영역 수정을 통해 비디오 신호를 처리하는 방법 및 장치

본 발명은 정지 영상 혹은 동영상을 인코딩, 디코딩하는 방법 및 이를 지원하는 장치에 관한 것으로서, 영상의 인코딩 및 디코딩 과정에서 코딩 효율을 향상시키기 위해 타겟 영역을 수정(modification) 또는 변환(transform)하는 방법을 제안한다.

압축 부호화란 디지털화한 정보를 통신 회선을 통해 전송하거나, 저장 매체에 적합한 형태로 저장하기 위한 일련의 신호 처리 기술을 의미한다. 영상, 이미지, 음성 등의 미디어가 압축 부호화의 대상이 될 수 있으며, 특히 영상을 대상으로 압축 부호화를 수행하는 기술을 비디오 영상 압축이라고 일컫는다.

차세대 비디오 컨텐츠는 고해상도(high spatial resolution), 고프레임율(high frame rate) 및 영상 표현의 고차원화(high dimensionality of scene representation)라는 특징을 갖게 될 것이다. 그러한 컨텐츠를 처리하기 위해서는 메모리 저장(memory storage), 메모리 액세스율(memory access rate) 및 처리 전력(processing power) 측면에서 엄청난 증가를 가져올 것이다.

따라서, 차세대 비디오 컨텐츠를 보다 효율적으로 처리하기 위한 새로운 코딩 툴을 디자인할 필요가 있다. 특히, 현재 영상 부호화는 래스터 스캔(raster scan) 순서로 영상의 좌상단에서부터 블록 단위로 부호화를 진행하기 때문에, 인트라 예측시 블록의 좌측과 상단의 픽셀 정보만을 이용하여 예측을 수행한다. 따라서, 블록의 우측 또는 하단에 에지와 같은 중요한 픽셀 정보가 많을 경우 예측 효율이 줄어드는 문제점이 발생한다.

본 발명은 코딩 압축율 향상을 위해 타겟 영역을 효율적으로 수정 또는 변환하는 방법을 제안하고자 한다.

본 발명은 타겟 영역을 수정 또는 변환할 수 있는 비디오 신호 처리 장치의 구조를 제안하고자 한다.

본 발명은 새로운 코딩 툴 디자인을 통해 코딩 효율을 향상시키는 방법을 제안하고자 한다.

본 발명은 영상 특성에 따라 적응적으로 타겟 영역을 수정 또는 변환하는 방법을 제안하고자 한다.

본 발명은 타겟 영역의 좌우 및/또는 상하 대칭 변환, 회전 변환을 적용하여 보다 높은 압축 효율을 얻는 방법을 제공한다.

본 발명은 타겟 영역의 수정 정보 또는 변환 정보를 시그널링하는 방법을 제공한다.

본 발명은 복수개의 수정 또는 변환 방법들에 대해 율-왜곡 최적화를 통해 최적의 수정 방법을 선택하는 방법을 제공한다.

본 발명은 에지 분포 분석을 통해 최적의 수정 방법을 선택하는 방법을 제공한다.

본 발명은 타겟 영역의 수정 및 수정 정보 전송을 통해 영상의 중요한 픽셀 정보를 좌측과 상단에 위치시킴으로써 코딩 효율을 높이는 방법을 제공한다.

본 발명은 타겟 영역의 좌우 및/또는 상하 대칭 변환, 회전 변환을 적용함으로써 보다 높은 압축 효율을 얻을 수 있다. 구체적으로, 본 발명은 타겟 영역의 수정 및 수정 정보 전송을 통해 영상의 중요한 픽셀 정보를 좌측과 상단에 위치시킴으로써 코딩 효율을 향상시킬 수 있다.

또한, 본 발명은 타겟 영역의 수정 정보 또는 변환 정보를 시그널링함으로써 수정 전의 원 영상으로 복원할 수 있다.

도 1은 본 발명이 적용되는 실시예로서, 인코더를 포함하는 비디오 신호 처리 장치의 개략적인 블록도를 나타낸다.
도 2는 본 발명이 적용되는 실시예로서, 디코더를 포함하는 비디오 신호 처리 장치의 개략적인 블록도를 나타낸다.
도 3은 본 발명이 적용되는 실시예로서, 코딩 유닛의 분할 구조를 설명하기 위한 도면이다.
도 4는 본 발명이 적용되는 실시예로서, 인트라 예측 모드에 따른 예측 방향을 설명하기 위한 도면이다.
도 5는 본 발명이 적용되는 실시예로서, 타겟 영역의 수정을 통해 비디오 신호를 처리하는 과정을 설명하기 위한 도면이다.
도 6은 본 발명이 적용되는 실시예로서, 타겟 영역을 수정하는 전처리부의 개략적인 블록도를 나타낸다.
도 7은 본 발명이 적용되는 실시예로서, 타겟 영역을 역수정하는 후처리부의 개략적인 블록도를 나타낸다.
도 8은 본 발명이 적용되는 실시예로서, 타겟 영역의 수정을 통해 비디오 신호를 처리하는 과정을 나타내는 흐름도이다.
도 9는 본 발명이 적용되는 실시예로서, 타겟 영역의 역수정을 통해 비디오 신호를 처리하는 과정을 나타내는 흐름도이다.
도 10은 본 발명이 적용되는 실시예로서, SPS(sequence parameter set) 레벨에서 수정 정보(sps_seq_transform_id)를 정의하는 신택스 구조를 나타낸다.
도 11은 본 발명이 적용되는 실시예로서, SPS(sequence parameter set) 레벨에서 수정 정보를 정의하는 신택스 구조를 나타낸다.
도 12는 본 발명이 적용되는 실시예로서, SPS(sequence parameter set) 레벨에서 수정 정보(sps_seq_transform_flag 및 sps_seq_transform_id)를 정의하는 신택스 구조를 나타낸다.
도 13은 본 발명이 적용되는 실시예로서, PPS(Picture parameter set) 레벨에서 수정 정보(pps_seq_transform_id)를 정의하는 신택스 구조를 나타낸다.
도 14는 본 발명이 적용되는 실시예로서, 슬라이스 헤더에서 수정 정보(slice_seq_transform_id)를 정의하는 신택스 구조를 나타낸다.
도 15는 본 발명이 적용되는 실시예로서, SPS(sequence parameter set) 및 슬라이스 헤더에서 수정 정보(sps_seq_transform_flag 및 sps_seq_transform_id)를 정의하는 신택스 구조를 나타낸다.
도 16은 본 발명이 적용되는 실시예로서, 타겟 영역을 수정하는 과정을 설명하기 위한 흐름도이다.
도 17은 본 발명이 적용되는 실시예로서, 타겟 영역을 역수정하는 과정을 설명하기 위한 흐름도이다.
도 18은 본 발명이 적용되는 실시예로서, 컨텐츠 스트리밍 시스템 구조도를 나타낸다.

발명의 실시를 위한 최선의 형태

본 발명에서, 상기 타겟 수정 인덱스에 대응되는 타겟 수정 방법은 상기 타겟 영역의 에지 분포, 복잡도, 또는 율-왜곡 비용에 기초하여 결정된 것을 특징으로 한다.

본 발명에서, 상기 타겟 영역의 에지 분포의 경우, 상기 타겟 영역 내 수직 대각 에지(vertical diagonal edge)가 기결정된 임계값 이상으로 분포되어 있을 때, 상기 타겟 수정 방법은 좌우 대칭 변환 또는 상하 대칭 변환을 나타내는 것을 특징으로 한다.

본 발명에서, 상기 타겟 영역의 복잡도의 경우, 상기 타겟 영역 내 우측 영역이 좌측 영역에 비해 복잡도가 높을 때, 상기 타겟 수정 방법은 좌우 대칭 변환을 나타내는 것을 특징으로 한다.

본 발명에서, 상기 타겟 영역은 시퀀스, 영상, 프레임, 타일, 또는 블록 중 적어도 하나에 대응되는 것을 특징으로 한다.

본 발명에서, 상기 타겟 수정 인덱스는 상기 시퀀스 파라미터 셋, 픽쳐 파라미터 셋 또는 슬라이스 헤더로부터 획득되는 것을 특징으로 한다.

본 발명은, 타겟 수정을 통해 비디오 신호를 처리하는 방법에 있어서, 타겟 영역을 포함하는 상기 비디오 신호를 수신하는 단계; 상기 타겟 영역에 대해 복수개의 타겟 수정 방법을 적용하는 단계; 상기 복수개의 타겟 수정 방법 중 최적의 타겟 수정 방법을 결정하는 단계; 상기 최적의 타겟 수정 방법에 따라 수정된 타겟 영역을 이용하여 비디오 신호를 인코딩하는 단계; 및 상기 최적의 타겟 수정 방법에 대응되는 타겟 수정 인덱스를 인코딩하는 단계를 포함하되, 상기 타겟 수정 인덱스는 타겟 수정 방법을 나타내며, 수정 없음, 좌우 대칭 변환, 상하 대칭 변환, 회전 변환 또는 이들의 조합 중 적어도 하나에 대응되는 것을 특징으로 하는 방법을 제공한다.

본 발명에서, 상기 최적의 타겟 수정 방법은 상기 타겟 영역의 에지 분포, 복잡도, 또는 율-왜곡 비용에 기초하여 결정되는 것을 특징으로 한다.

본 발명에서, 상기 타겟 영역의 에지 분포의 경우, 상기 타겟 영역 내 수직 대각 에지(vertical diagonal edge)가 기결정된 임계값 이상으로 분포되어 있을 때, 상기 최적의 타겟 수정 방법은 좌우 대칭 변환 또는 상하 대칭 변환을 나타내는 것을 특징으로 한다.

본 발명에서, 상기 타겟 영역의 복잡도의 경우, 상기 타겟 영역 내 우측 영역이 좌측 영역에 비해 복잡도가 높을 때, 상기 최적의 타겟 수정 방법은 좌우 대칭 변환을 나타내는 것을 특징으로 한다.

본 발명에서, 상기 타겟 수정 인덱스는 상기 시퀀스 파라미터 셋, 픽쳐 파라미터 셋 또는 슬라이스 헤더에서 시그널링되는 것을 특징으로 한다.

본 발명은, 타겟 수정을 통해 비디오 신호를 처리하는 장치에 있어서, 상기 비디오 신호의 시퀀스 파라미터 셋으로부터 타겟 수정 플래그를 파싱하는 파싱부, 여기서 상기 타겟 수정 플래그는 타겟 영역에 대해 수정을 수행하는지 여부를 나타냄; 및 상기 타겟 수정 플래그에 따라 타겟 영역에 대해 수정을 수행하는 경우, 타겟 수정 인덱스를 획득하고, 상기 타겟 수정 인덱스에 대응되는 타겟 수정 방법을 확인하고, 상기 타겟 수정 방법에 따라 복원된 타겟 영역에 대해 역수정을 수행하는 후처리부를 포함하되, 상기 타겟 수정 인덱스는 타겟 수정 방법을 나타내며, 수정 없음, 좌우 대칭 변환, 상하 대칭 변환, 회전 변환 또는 이들의 조합 중 적어도 하나에 대응되는 것을 특징으로 하는 장치를 제공한다.

본 발명은, 타겟 수정을 통해 비디오 신호를 처리하는 장치에 있어서, 타겟 영역을 포함하는 상기 비디오 신호를 수신하고, 상기 타겟 영역에 대해 복수개의 타겟 수정 방법을 적용하고, 상기 복수개의 타겟 수정 방법 중 최적의 타겟 수정 방법을 결정하고, 상기 최적의 타겟 수정 방법에 대응되는 타겟 수정 인덱스를 인코딩하는 전처리부; 및 상기 최적의 타겟 수정 방법에 따라 수정된 타겟 영역을 이용하여 비디오 신호를 인코딩하는 인코더;를 포함하되, 상기 타겟 수정 인덱스는 타겟 수정 방법을 나타내며, 수정 없음, 좌우 대칭 변환, 상하 대칭 변환, 회전 변환 또는 이들의 조합 중 적어도 하나에 대응되는 것을 특징으로 하는 장치를 제공한다.

발명의 실시를 위한 형태

이하, 첨부된 도면을 참조하여 본 발명의 실시예의 구성과 그 작용을 설명하며, 도면에 의해서 설명되는 본 발명의 구성과 작용은 하나의 실시예로서 설명되는 것이며, 이것에 의해서 본 발명의 기술적 사상과 그 핵심 구성 및 작용이 제한되지는 않는다.

아울러, 본 발명에서 사용되는 용어는 가능한 한 현재 널리 사용되는 일반적인 용어를 선택하였으나, 특정한 경우는 출원인이 임의로 선정한 용어를 사용하여 설명한다. 그러한 경우에는 해당 부분의 상세 설명에서 그 의미를 명확히 기재하므로, 본 발명의 설명에서 사용된 용어의 명칭만으로 단순 해석되어서는 안 될 것이며 그 해당 용어의 의미까지 파악하여 해석되어야 함을 밝혀두고자 한다.

또한, 본 발명에서 사용되는 용어들은 발명을 설명하기 위해 선택된 일반적인 용어들이나, 유사한 의미를 갖는 다른 용어가 있는 경우 보다 적절한 해석을 위해 대체 가능할 것이다. 예를 들어, 신호, 데이터, 샘플, 픽쳐, 프레임, 블록 등의 경우 각 코딩 과정에서 적절하게 대체되어 해석될 수 있을 것이다. 또한, 파티셔닝(partitioning), 분해(decomposition), 스플리팅 (splitting) 및 분할(division) 등의 경우에도 각 코딩 과정에서 적절하게 대체되어 해석될 수 있을 것이다.

도 1은 본 발명이 적용되는 실시예로서, 인코더를 포함하는 비디오 신호 처리 장치의 개략적인 블록도를 나타낸다.

도 1을 참조하면, 비디오 신호 처리 장치(10)는 전처리부(101) 및 인코더(100)를 포함할 수 있으며, 상기 인코더(100)는 영상 분할부(110), 변환부(120), 양자화부(130), 역양자화부(140), 역변환부(150), 필터링부(160), 복호 픽쳐 버퍼(DPB: Decoded Picture Buffer)(170), 인터 예측부(180), 인트라 예측부(185) 및 엔트로피 인코딩부(190)를 포함하여 구성될 수 있다. 상기 도 1에서는 전처리부(101)와 인코더(100)를 분리하여 설명하나, 본 발명은 이에 한정되지 않으며, 상기 전처리부(101)는 상기 인코더(100)에 포함될 수 있다.

상기 전처리부(101)는 타겟 영역에 대해 좌우 대칭 변환, 상하 대칭 변환, 또는 회전 변환 중 적어도 하나를 수행할 수 있다. 그리고, 복수개의 수정 또는 변환 방법들에 대해 율-왜곡 최적화를 통해 최적의 수정 방법을 선택할 수 있다. 또는, 본 발명은 에지 분포 분석을 통해 최적의 수정 방법을 선택할 수도 있다. 이때, 타겟 영역의 수정 정보 또는 변환 정보는 시그널링되어 디코더로 전송될 수 있다. 여기서, 상기 타겟 영역은 시퀀스, 영상, 타일, 픽쳐, 프레임, 또는 블록 중 적어도 하나를 포함할 수 있다. 본 명세서에서는 설명의 편의를 위해 영상을 기준으로 설명할 수 있으나, 본 발명은 이에 한정되지 않으며, 대체 가능하다.

이와 같이, 본 발명은 타겟 영역의 수정 및 수정 정보 전송을 통해 영상의 중요한 픽셀 정보를 좌측과 상단에 위치시킴으로써 코딩 효율을 높일 수 있다.

영상 분할부(110)는 인코더(100)에 입력된 영상(또는, 픽쳐, 프레임)를 하나 이상의 처리 유닛으로 분할할 수 있다. 여기서, 상기 인코더(100)에 입력된 영상은 상기 전처리부(101)에 의해 변환 또는 수정된 영상일 수 있다. 한편, 상기 처리 유닛은 코딩 트리 유닛(CTU: Coding Tree Unit), 코딩 유닛(CU: Coding Unit), 예측 유닛(PU: Prediction Unit) 또는 변환 유닛(TU: Transform Unit) 중 적어도 하나에 대응될 수 있다.

다만, 상기 용어들은 본 발명에 대한 설명의 편의를 위해 사용할 뿐이며, 본 발명은 해당 용어의 정의에 한정되지 않는다. 또한, 본 명세서에서는 설명의 편의를 위해, 비디오 신호를 인코딩 또는 디코딩하는 과정에서 이용되는 단위로써 코딩 유닛이라는 용어를 사용하지만, 본 발명은 그에 한정되지 않으며 발명 내용에 따라 적절하게 해석 가능할 것이다.

인코더(100)는 입력 영상 신호에서 인터 예측부(180) 또는 인트라 예측부(185)로부터 출력된 예측 신호(prediction signal)를 감산하여 잔여 신호(residual signal)를 생성할 수 있고, 생성된 잔여 신호는 변환부(120)로 전송된다.

변환부(120)는 잔여 신호에 변환 기법을 적용하여 변환 계수(transform coefficient)를 생성할 수 있다. 변환 과정은 정사각형의 동일한 크기를 갖는 픽셀 블록에 적용될 수도 있고, 정사각형이 아닌 가변 크기의 블록에도 적용될 수 있다.

양자화부(130)는 변환 계수를 양자화하여 엔트로피 인코딩부(190)로 전송하고, 엔트로피 인코딩부(190)는 양자화된 신호(quantized signal)를 엔트로피 코딩하여 비트스트림으로 출력할 수 있다.

양자화부(130)로부터 출력된 양자화된 신호(quantized signal)는 예측 신호를 생성하기 위해 이용될 수 있다. 예를 들어, 양자화된 신호(quantized signal)는 루프 내의 역양자화부(140) 및 역변환부(150)를 통해 역양자화 및 역변환을 적용함으로써 잔여 신호를 복원할 수 있다. 복원된 잔여 신호를 인터 예측부(180) 또는 인트라 예측부(185)로부터 출력된 예측 신호(prediction signal)에 더함으로써 복원 신호(reconstructed signal)가 생성될 수 있다.

한편, 위와 같은 압축 과정에서 인접한 블록들이 서로 다른 양자화 파라미터에 의해 양자화됨으로써 블록 경계가 보이는 열화가 발생될 수 있다. 이러한 현상을 블록킹 열화(blocking artifacts)라고 하며, 이는 화질을 평가하는 중요한 요소 중의 하나이다. 이러한 열화를 줄이기 위해 필터링 과정을 수행할 수 있다. 이러한 필터링 과정을 통해 블록킹 열화를 제거함과 동시에 현재 픽쳐에 대한 오차를 줄임으로써 화질을 향상시킬 수 있게 된다.

필터링부(160)는 복원 신호에 필터링을 적용하여 이를 재생 장치로 출력하거나 복호 픽쳐 버퍼(170)에 전송한다. 복호 픽쳐 버퍼(170)에 전송된 필터링된 신호는 인터 예측부(180)에서 참조 픽쳐로 사용될 수 있다. 이처럼, 필터링된 픽쳐를 화면간 예측 모드에서 참조 픽쳐로 이용함으로써 화질 뿐만 아니라 부호화 효율도 향상시킬 수 있다.

복호 픽쳐 버퍼(170)는 필터링된 픽쳐를 인터 예측부(180)에서의 참조 픽쳐로 사용하기 위해 저장할 수 있다.

인터 예측부(180)는 복원 픽쳐(reconstructed picture)를 참조하여 시간적 중복성 및/또는 공간적 중복성을 제거하기 위해 시간적 예측 및/또는 공간적 예측을 수행한다. 여기서, 예측을 수행하기 위해 이용되는 참조 픽쳐는 이전 시간에 부호화/복호화 시 블록 단위로 양자화와 역양자화를 거친 변환된 신호이기 때문에, 블로킹 아티팩트(blocking artifact)나 링잉 아티팩트(ringing artifact)가 존재할 수 있다.

따라서, 인터 예측부(180)는 이러한 신호의 불연속이나 양자화로 인한 성능 저하를 해결하기 위해, 로우패스 필터(lowpass filter)를 적용함으로써 픽셀들 사이의 신호를 서브 픽셀 단위로 보간할 수 있다. 여기서, 서브 픽셀은 보간 필터를 적용하여 생성된 가상의 화소를 의미하고, 정수 픽셀은 복원된 픽쳐에 존재하는 실제 화소를 의미한다. 보간 방법으로는 선형 보간, 양선형 보간(bi-linear interpolation), 위너 필터(wiener filter) 등이 적용될 수 있다.

보간 필터는 복원 픽쳐(reconstructed picture)에 적용되어 예측의 정밀도를 향상시킬 수 있다. 예를 들어, 인터 예측부(180)는 정수 픽셀에 보간 필터를 적용하여 보간 픽셀을 생성하고, 보간 픽셀들(interpolated pixels)로 구성된 보간 블록(interpolated block)을 예측 블록(prediction block)으로 사용하여 예측을 수행할 수 있다.

한편, 인트라 예측부(185)는 현재 부호화를 진행하려고 하는 블록의 주변에 있는 샘플들을 참조하여 현재 블록을 예측할 수 있다. 상기 인트라 예측부(185)는 인트라 예측을 수행하기 위해 다음과 같은 과정을 수행할 수 있다. 먼저, 예측 신호를 생성하기 위해 필요한 참조 샘플을 준비할 수 있다. 그리고, 준비된 참조 샘플을 이용하여 예측 신호를 생성할 수 있다. 이후, 예측 모드를 부호화하게 된다. 이때, 참조 샘플은 참조 샘플 패딩 및/또는 참조 샘플 필터링을 통해 준비될 수 있다. 참조 샘플은 예측 및 복원 과정을 거쳤기 때문에 양자화 에러가 존재할 수 있다. 따라서, 이러한 에러를 줄이기 위해 인트라 예측에 이용되는 각 예측 모드에 대해 참조 샘플 필터링 과정이 수행될 수 있다.

상기 인터 예측부(180) 또는 상기 인트라 예측부(185)를 통해 생성된 예측 신호(prediction signal)는 복원 신호를 생성하기 위해 이용되거나 잔여 신호를 생성하기 위해 이용될 수 있다.

도 2는 본 발명이 적용되는 실시예로서, 디코더를 포함하는 비디오 신호 처리 장치의 개략적인 블록도를 나타낸다.

도 2를 참조하면, 비디오 신호 처리 장치(20)는 디코더(200) 및 후처리부(270)를 포함할 수 있으며, 상기 디코더(200)는 파싱부(미도시), 엔트로피 디코딩부(210), 역양자화부(220), 역변환부(230), 필터링부(240), 복호 픽쳐 버퍼(DPB: Decoded Picture Buffer Unit)(250), 인터 예측부(260) 및 인트라 예측부(265)를 포함하여 구성될 수 있다.

상기 도 2에서는 디코더(200)와 후처리부(270)를 분리하여 설명하나, 본 발명은 이에 한정되지 않으며, 상기 후처리부(270)는 상기 디코더(200)에 포함될 수 있다.

디코더(200)는 도 1의 비디오 신호 처리 장치(10)로부터 출력된 신호을 수신할 수 있고, 수신된 신호는 엔트로피 디코딩부(210)를 통해 엔트로피 디코딩될 수 있다.

역양자화부(220)에서는 양자화 스텝 사이즈 정보를 이용하여 엔트로피 디코딩된 신호로부터 변환 계수(transform coefficient)를 획득한다.

역변환부(230)에서는 변환 계수를 역변환하여 잔여 신호(residual signal)를 획득하게 된다.

획득된 잔여 신호를 인터 예측부(260) 또는 인트라 예측부(265)로부터 출력된 예측 신호(prediction signal)에 더함으로써 복원 신호(reconstructed signal)가 생성된다.

필터링부(240)는 복원 신호(reconstructed signal)에 필터링을 적용하여 이를 재생 장치로 출력하거나 복호 픽쳐 버퍼부(250)에 전송한다. 복호 픽쳐 버퍼부(250)에 전송된 필터링된 신호는 인터 예측부(260)에서 참조 픽쳐로 사용될 수 있다.

본 명세서에서, 인코더(100)의 변환부(120) 및 각 기능 유닛들에서 설명된 실시예들은 각각 디코더의 역변환부(230) 및 대응되는 기능 유닛들에도 동일하게 적용될 수 있다.

그리고, 디코더(200)를 통해 출력된 복원 영상 신호(reconstructed video signal)는 상기 후처리부(270)를 통해 후처리된 후, 재생 장치를 통해 재생될 수 있다.

상기 비디오 신호 처리 장치(20)는 수정 정보(또는 변환 정보)를 수신할 수 있다. 여기서, 상기 수정 정보는 출력 영상에 대해 역수정(또는 역변환)을 수행할지 여부를 나타내는 수정 플래그를 포함할 수 있다.

상기 수정 플래그에 따라 출력 영상에 대해 역수정(또는 역변환)을 수행하는 경우, 상기 후처리부(270)는 출력 영상에 대해 좌우 대칭 역변환, 상하 대칭 역변환, 또는 회전 역변환 중 적어도 하나를 수행할 수 있다.

도 3은 본 발명이 적용되는 실시예로서, 코딩 유닛의 분할 구조 중 쿼드트리 바이너리트리(QuadTree BinaryTree)를 설명하기 위한 도면이다.

인코더는 하나의 영상(또는 픽쳐)을 사각형 형태의 코딩 트리 유닛(CTU: Coding Tree Unit) 단위로 분할할 수 있다. 그리고, 래스터 스캔 순서(raster scan order)에 따라 하나의 CTU 씩 순차적으로 인코딩한다.

하나의 CTU은 쿼드트리(quadtree, 이하 'QT'라 함) 구조와 바이너리트리(binarytree, 이하 ‘BT’라 함)로 분해될 수 있다. 예를 들어, 하나의 CTU은 정사각형 형태를 가지면서 각 변의 길이가 절반씩 감소하는 4개의 유닛으로 분할하거나 직사각형 형태를 가지면서 너비 또는 높이 길이가 절반씩 감소하는 2개의 유닛으로 분할할 수 있다. 이러한 QTBT구조의 분해는 재귀적으로 수행될 수 있다.

도 3을 참조하면, QT의 루트 노드(root node)는 CTU와 관련될 수 있다. QT는 QT 리프 노드(QT leaf node)에 도달할 때까지 분할될 수 있고, QT의 리프노드는 BT로 분할될 수 있으며, BT 리프노드에 도달할 때까지 분할 될 수 있다.

도 3을 참조하면, CTU는 루트 노드(root node)에 해당되고, 가장 작은 깊이(depth)(즉, 레벨 0) 값을 가진다. 입력 영상의 특성에 따라 CTU가 분할되지 않을 수도 있으며, 이 경우 CTU은 코딩 유닛(Coding Unit, CU)에 해당된다.

CTU은 QT 형태로 분해될 수 있으며 QT 리프노드는 BT형태로 분할될 수 있다. 그 결과 레벨 n의 깊이를 가지는 하위 노드들이 생성될 수 있다. 그리고, 레벨 n의 깊이를 가지는 하위 노드에서 더 이상 분할되지 않은 노드(즉, 리프 노드)는 코딩 유닛(Coding Unit)에 해당한다.

하나의 CU에 대하여, 해당 CU가 분할 되는지 여부를 나타내는 정보가 디코더에 전달될 수 있다. 예를 들어, 상기 정보는 분할 플래그로 정의될 수 있으며, 신택스 엘리먼트 "split_cu_flag"로 표현될 수 있다. 또한 QT 리프노드에서 BT로 분할되는지 여부를 나타내는 정보가 디코더에 전달될 수 있다. 예를 들어, 상기 정보는 BT 분할 플래그로 정의될 수 있으며, 신택스 엘리먼트 “split_bt_flag”로 표현될 수 있다.

또한, “split_bt_flag”에 의하여 BT로 분할이 되는 경우, 절반크기의 너비를 가지는 직사각형 또는 절반크기의 높이를 가지는 직사각형 형태로 분할되도록 BT 분할 모양이 디코더에 전달될 수 있다. 예를 들어, 상기 정보는 BT분할 모드로 정의될 수 있으며, 신택스 엘리먼트 “bt_split_mode”로 표현될 수 있다.

도 4는 본 발명이 적용되는 실시예로서, 인트라 예측 모드에 따른 예측 방향을 설명하기 위한 도면이다.

도 4(a)는 35개의 인트라 예측 모드에 따른 예측 방향을 예시하고, 도 4(b)는 67개의 인트라 예측 모드에 따른 예측 방향을 예시한다.

인트라 예측에서는 예측 모드에 따라 예측에 사용되는 참조 샘플의 위치에 대한 예측 방향을 가질 수 있다. 본 명세서에서는 예측 방향을 가지는 인트라 예측 모드를 인트라 방향성 예측 모드(Intra_Angular prediction mode) 또는 인트라 방향성 모드라고 한다. 반면, 예측 방향을 가지지 않는 인트라 예측 모드로서, 인트라 플래너(INTRA_PLANAR) 예측 모드, 인트라 DC(INTRA_DC) 예측 모드가 있다.

인트라 예측에서는 유도되는 예측 모드에 기반하여 현재 처리 블록에 대한 예측을 수행한다. 예측 모드에 따라 예측에 사용되는 참조 샘플과 구체적인 예측 방법이 달라지므로, 현재 블록이 인트라 예측 모드로 인코딩된 경우, 디코더는 예측을 수행하기 위해 현재 블록의 예측 모드를 유도할 수 있다.

디코더는 현재 처리 블록의 주변 샘플들(neighboring samples)이 예측에 사용될 수 있는지 확인하고, 예측에 사용할 참조 샘플들을 구성할 수 있다.

인트라 예측에서 현재 처리 블록의 주변 샘플들은 nSxnS 크기의 현재 처리 블록의 좌측(left) 경계에 인접한 샘플 및 좌하측(bottom-left)에 이웃하는 총 2xnS 개의 샘플들, 현재 처리 블록의 상측(top) 경계에 인접한 샘플 및 우상측(top-right)에 이웃하는 총 2xnS 개의 샘플들 및 현재 처리 블록의 좌상측(top-left)에 이웃하는 1개의 샘플을 의미한다.

그러나, 현재 처리 블록의 주변 샘플들 중 일부는 아직 디코딩되지 않았거나, 이용 가능하지 않을 수 있다. 이 경우, 디코더는 이용 가능한 샘플들로 이용 가능하지 않은 샘플들을 대체(substitution)하여 예측에 사용할 참조 샘플들을 구성할 수 있다.

디코더는 인트라 예측 모드에 기반하여 참조 샘플의 필터링을 수행할 수 있다.

디코더는 인트라 예측 모드와 참조 샘플들에 기반하여 현재 처리 블록에 대한 예측 블록을 생성할 수 있다. 즉, 디코더는 인트라 예측 모드 유도 단계에서 유도된 인트라 예측 모드와 참조 샘플 구성 단계와 참조 샘플 필터링 단계를 통해 획득한 참조 샘플들에 기반하여 현재 처리 블록에 대한 예측 블록을 생성할 수 있다.

도 4(b)를 살펴보면, 고해상도 영상의 인트라 부호화 및 더 정확한 예측을 위해 35가지 방향성 모드를 67가지 방향성 모드로 확장한다. 도 4(b)에서 점선으로 나타낸 화살표는 도 4(a)에서 추가된 32가지 방향성 모드를 나타낸다. 인트라 플래너(INTRA_PLANAR) 모드와 인트라 DC(INTRA_DC) 모드는 기존의 인트라 플래너 모드와 인트라 DC 모드와 동일하다. 추가된 32가지 방향성 모드는 모든 블록 크기에서 적용되고, 휘도 성분과 색차 성분의 인트라 부호화에서 모두 적용될 수 있다.

각 모드의 명칭은 다음과 같이 정의될 수 있다.

도 5는 본 발명이 적용되는 실시예로서, 타겟 영역의 수정을 통해 비디오 신호를 처리하는 과정을 설명하기 위한 도면이다.

현재 영상 부호화는 래스터 스캔(raster scan) 순서로 영상의 좌상단에서부터 블록 단위로 부호화를 진행하기 때문에, 화면 내 부호화에서는 블록의 좌측과 상단의 픽셀 정보만을 참조하여 예측을 수행한다. 따라서 블록의 우측 혹은 하단에 중요한 픽셀 정보(예를 들어, 에지 등)가 많을 경우 예측 효율이 감소하는 문제점이 발생한다.

본 발명에서는 도 5와 같이 타겟 영역의 수정(modification)(또는 변환(transform)) 및 수정 정보(modification information)(또는 변환 정보) 전송을 통해 영상의 중요한 픽셀 정보를 좌측과 상단에 위치시킴으로써 코딩 효율을 높이는 방법을 제안한다. 여기서, 상기 타겟 영역은 시퀀스, 영상, 타일, 픽쳐, 프레임, 또는 블록 중 적어도 하나를 포함할 수 있다. 본 명세서에서는 설명의 편의를 위해 영상을 기준으로 설명할 수 있으나, 본 발명은 이에 한정되지 않으며, 대체 가능하다.

본 명세서에서 사용되는 “수정(modification)” 용어는 변환(transform)으로 대체될 수 있다. 다만, DCT(Discrete Cosing Transform)와 같은 변환과의 혼동을 피하기 위해 수정이란 용어를 사용하도록 한다.

상기 도 5를 살펴보면, 타겟 영상이 입력되면 비디오 신호 처리 장치는 상기 타겟 영상에 대해 수정을 수행할지 여부를 결정할 수 있다. 그리고, 어떠한 수정 방법이 최적의 수정 방법인지 여부를 결정할 수 있다.

비디오 신호 처리 장치는 타겟 영상에 대해 수정을 수행할지 여부를 나타내는 타겟 수정 플래그를 시그널링할 수 있고, 또한 최적의 타겟 수정 방법을 나타내는 타겟 수정 인덱스를 시그널링할 수 있다. 이때, 상기 타겟 수정 플래그 및/또는 상기 타겟 수정 인덱스는 타겟 수정 정보라고 부를 수 있다.

한편, 비디오 신호 처리 장치는 타겟 수정 플래그에 따라 수정 영상을 복원하고, 타겟 수정 인덱스에 대응되는 타겟 수정 방법에 따라 역수정을 수행함으로써 영상을 복원할 수 있다.

도 6은 본 발명이 적용되는 실시예로서, 타겟 영역을 수정하는 전처리부의 개략적인 블록도를 나타낸다.

본 발명이 적용되는 전처리부(101)는 타겟 영역 수정 결정부(102) 및 타겟 영역 수정부(103)를 포함할 수 있다.

상기 타겟 영역 수정 결정부(102)는 타겟 영역에 대해 수정을 수행할지 여부를 결정할 수 있고, 어떠한 타겟 수정 방법을 이용할지를 결정할 수 있다.

상기 타겟 영역 수정부(103)는 상기 결정된 타겟 수정 방법에 기초하여 타겟 영역에 대해 수정을 수행할 수 있다.

일실시예로, 상기 타겟 수정 방법의 예로는 다음 표 2와 같은 방법들이 있을 수 있다.

위 표 2는 일실시예일 뿐이며, 각 방법들뿐만 아니라 그들의 조합도 가능할 수 있다.

예를 들어, (1) 좌/우 대칭 변환, (2) 상/하 대칭 변환, (3) 좌/우/상/하 대칭 변환, (4) 회전 변환, (5) 좌/우 대칭 및 회전 변환, (6) 상/하 대칭 및 회전 변환을 수식으로 표현하면, 각각 다음 수식 1 내지 6과 같다.

여기서, (x,y)는 픽셀 위치를 나타내고, W는 타겟 영역의 너비(width)를, H는 타겟 영역의 높이(height)를 나타낸다. org은 원본 타겟 영역이며 trans는 수정된 타겟 영역을 의미한다. R은 회전 변환을 수행하는 행렬을 의미하며, θ는 회전 각도를 의미한다.

상기 수식 4에서 회전 각도는 90도, 180도, 또는 270도일 수 있으나, 본 발명은 이에 한정되지 않는다. 상기 회전 각도에 따라 더 다양한 조합이 만들어 질 수 있다.

다른 일실시예로, 비디오 신호 처리 장치는 위와 같은 복수개의 타겟 수정 방법들 중, 최적의 타겟 수정 방법을 결정 또는 선택할 수 있다.

예를 들어, 상기 최적의 타겟 수정 방법은 상기 타겟 영역의 에지 분포, 복잡도, 또는 율-왜곡 비용에 기초하여 결정될 수 있다.

먼저, 타겟 영역의 에지 분포의 경우, 타겟 영역의 수직 대각 에지(vertical diagonal edge)가 줄어들 수 있는 방향으로 타겟 영역을 수정할 수 있다. 여기서, 상기 수직 대각 에지는 인트라 예측 모드 중에서 수평 모드 이전 방향 및 수직 모드 이후 방향을 의미할 수 있다.

예를 들어, 상기 타겟 영역 내 수직 대각 에지(vertical diagonal edge)가 많을 경우 좌우 대칭 변환 또는 상하 대칭 변환이 수행될 수 있다. 즉, 상기 타겟 영역 내 수직 대각 에지(vertical diagonal edge)가 기결정된 임계값 이상으로 분포되어 있을 때, 상기 최적의 타겟 수정 방법은 좌우 대칭 변환 또는 상하 대칭 변환을 나타낼 수 있다. 이때, 에지 분포 분석은 타겟 영역에 다양한 에지 검출 필터 및 알고리즘을 이용하여 계산할 수 있다.

그리고, 타겟 영역의 복잡도의 경우, 타겟 영역의 좌상단에 복잡도가 증가할 수 있는 방향으로 타겟 영역을 수정할 수 있다. 예를 들어, 상기 타겟 영역 내 우측 영역이 좌측 영역에 비해 복잡도가 높을 때, 상기 최적의 타겟 수정 방법은 좌우 대칭 변환을 나타낼 수 있다. 이때, 타겟 영역의 복잡도는 타겟 영역별 고주파수 성분을 비교하거나, 오브젝트 검출(object detection) 등의 알고리즘을 이용하여 계산할 수 있다.

또한, 타겟 영역의 율-왜곡 비용의 경우, 타겟 영역에 율-비용 최적화(Rate-Distortion Optimization, RDO)를 통해 최적의 타겟 수정 방법이 결정될 수 있다. 이때, 상기 RDO를 위해서는 원본 영상의 다운 샘플링(downsampling)을 통한 영상 크기 축소, 간단한 RDO 수행 (예: 인트라 예측 모드 후보 선택을 위한 1st RDO 단계), 복잡한 코딩 툴 사용 안함, QT 및 BT 깊이(depth) 제한 등의 방법이 이용될 수 있다.

한편, 타겟 수정 방법에 대한 이진화는 다음 표 3 내지 6과 같이 수행될 수 있다. 다만, 이는 일실시예들일 뿐이며, 타겟 수정 방법들의 조합에 따라 변형 가능하다.

다른 실시예로, 타겟 수정 방법에 대한 정보는 시퀀스, 타일(tile), 픽쳐, 프레임, 슬라이스 또는 블록 중 적어도 하나의 단위로 전송할 수 있으며, 컨텍스트 모델링을 통해 이진화 정보를 전송할 수 있다. 예를 들어, 표 7 및 표 9는 블록 또는 타일 단위로 전송하는 경우 각 비트당 컨텍스트 모델링을 적용하는 것을 나타낸다.

블록 단위 (CTU 혹은 CU) 또는 타일(tile) 단위로 전송하게 되며, 컨텍스트 모델링(context modeling)을 통해 이진화 정보를 전송할 수 있다. 표7 내지 표9은 각 비트당 컨텍스트 모델링(context modeling)을 적용하는 예시를 보여준다.

표 7 및 표 8은 상기 표 5에 대응되는 컨텍스트 모델링 예시들이고, 표 9는 상기 표 6에 대응되는 컨텍스트 모델링 예시를 나타낸다.

상기 표8, 표9에서와 같이 하나의 이진화(binarization)에 3개의 컨텍스트 모델링(context modeling)을 적용하는 경우에는 다음 표 10과 같이 컨텍스트 모델링(context modeling)을 설정할 수 있다.

도 7은 본 발명이 적용되는 실시예로서, 타겟 영역을 역수정하는 후처리부의 개략적인 블록도를 나타낸다.

본 발명이 적용되는 후처리부(270)는 타겟 영역 역수정 결정부(271) 및 타겟 영역 역수정부(272)를 포함할 수 있다.

상기 타겟 영역 역수정 결정부(271)는 타겟 영역에 대해 역수정을 수행할지 여부를 결정할 수 있고, 어떠한 타겟 수정 방법이 이용되었는지를 확인할 수 있다. 이때, 상기 도 6에서 설명한 실시예가 모두 적용될 수 있으며, 중복되는 설명은 생략하기로 한다.

상기 타겟 영역 역수정부(272)는 상기 확인된 타겟 수정 방법에 기초하여 타겟 영역에 대해 수정을 수행할 수 있다. 이때, 상기 도 6에서 설명한 실시예가 모두 적용될 수 있으며, 중복되는 설명은 생략하기로 한다.

도 8은 본 발명이 적용되는 실시예로서, 타겟 영역의 수정을 통해 비디오 신호를 처리하는 과정을 나타내는 흐름도이다.

비디오 신호 처리 장치는 타겟 영역을 포함하는 비디오 신호를 수신할 수 있다(S810).

그리고, 상기 비디오 신호 처리 장치는 상기 타겟 영역에 대해 수정할지 여부를 결정할 수 있다(S820).

상기 타겟 영역에 대해 수정하는 것으로 결정되면, 상기 비디오 신호 처리 장치는 상기 타겟 영역에 대해 수정을 수행할 수 있다(S830).

이때, 상기 비디오 신호 처리 장치는 타겟 수정 정보 및 수정된 타겟 영역을 인코딩할 수 있다(S840). 예를 들어, 상기 타겟 수정 정보는 타겟 수정 인덱스를 포함할 수 있고, 상기 타겟 수정 인덱스는 타겟 수정 방법을 나타내며, 수정 없음, 좌우 대칭 변환, 상하 대칭 변환, 회전 변환 또는 이들의 조합 중 적어도 하나에 대응될 수 있다.

그러나, 상기 타겟 영역에 대해 수정을 하지 않는 것으로 결정되면, 상기 비디오 신호 처리 장치는 수정 없이 상기 타겟 영역을 인코딩할 수 있다(S850).

또한, 본 실시예의 경우에도, 본 명세서에서 설명한 다양한 실시예들이 모두 적용될 수 있다.

도 9는 본 발명이 적용되는 실시예로서, 타겟 영역의 역수정을 통해 비디오 신호를 처리하는 과정을 나타내는 흐름도이다.

비디오 신호 처리 장치는 타겟 영역을 포함하는 비트스트림을 수신하여 이를 디코딩할 수 있다(S910).

그리고, 상기 비디오 신호 처리 장치는 타겟 수정 플래그에 기초하여 상기 타겟 영역에 대해 역수정을 수행할지 여부를 결정할 수 있다(S920). 여기서 상기 타겟 수정 플래그는 타겟 영역에 대해 수정을 수행하는지 여부를 나타낸다.

상기 타겟 영역에 대해 역수정하는 것으로 결정되면, 상기 비디오 신호 처리 장치는 타겟 수정 정보를 디코딩하고(S930), 디코딩된 타겟 수정 정보에 기초하여 상기 타겟 영역에 대해 역수정을 수행할 수 있다(S940).

예를 들어, 상기 타겟 수정 정보는 타겟 수정 인덱스를 포함할 수 있고, 상기 타겟 수정 인덱스는 타겟 수정 방법을 나타내며, 수정 없음, 좌우 대칭 변환, 상하 대칭 변환, 회전 변환 또는 이들의 조합 중 적어도 하나에 대응될 수 있다.

그러나, 상기 타겟 영역에 대해 역수정하지 않는 것으로 결정되면, 상기 비디오 신호 처리 장치는 역수정 없이 상기 타겟 영역을 디코딩한다.

도 10 내지 도 15는 본 발명이 적용되는 실시예들로, 타겟 수정 정보를 정의하는 신택스 구조들을 나타낸다.

도 10은 SPS(sequence parameter set) 레벨에서 타겟 수정 정보를 정의하는 신택스 구조를 나타내며, 상기 타겟 수정 정보는 타겟 수정 인덱스를 포함할 수 있다.

예를 들어, 상기 타겟 수정 인덱스는 SPS 레벨에서의 타겟 수정 방법을 나타내며, 수정 없음, 좌우 대칭 변환, 상하 대칭 변환, 회전 변환 또는 이들의 조합 중 적어도 하나에 대응될 수 있다.

상기 타겟 수정 인덱스는 sps_seq_transform_id 로 정의될 수 있으며(S1010), 상기 타겟 수정 인덱스는 상기 표 2와 같이 정의될 수 있다. 여기서, 표 2는 일실시예일 뿐이며, 본 발명은 이에 한정되지 않으며 본 명세서에서 설명하는 다양한 실시예들의 조합이 가능하다.

도 11은 SPS(sequence parameter set) 레벨에서 타겟 수정 정보를 정의하는 신택스 구조를 나타내며, 상기 타겟 수정 정보는 타겟 수정 플래그 및 타겟 수정 인덱스를 포함할 수 있다.

여기서 상기 타겟 수정 플래그는 타겟 영역에 대해 수정을 수행하는지 여부를 나타내고, 이는 sps_seq_transform_flag로 표현될 수 있다(S1110).

그리고, 상기 타겟 수정 인덱스는 타겟 수정 방법을 나타내며, 수정 없음, 좌우 대칭 변환, 상하 대칭 변환, 회전 변환 또는 이들의 조합 중 적어도 하나에 대응될 수 있다. 예를 들어, 상기 타겟 수정 인덱스는 sps_seq_transform_id 로 표현될 수 있다.

상기 타겟 수정 인덱스는 상기 타겟 수정 플래그에 기초하여(S1120) 획득될 수 있다(S1130). 예를 들어, 상기 타겟 수정 인덱스는 상기 타겟 수정 플래그에 따라 타겟 영역에 대해 수정이 수행되는 경우에만 획득될 수 있다.

도 12는 PPS(Picture parameter set) 레벨에서 타겟 수정 정보를 정의하는 신택스 구조를 나타내며, 상기 타겟 수정 정보는 타겟 수정 인덱스를 포함할 수 있다.

예를 들어, 상기 타겟 수정 인덱스는 픽쳐 레벨에서의 타겟 수정 방법을 나타내며, 수정 없음, 좌우 대칭 변환, 상하 대칭 변환, 회전 변환 또는 이들의 조합 중 적어도 하나에 대응될 수 있다.

상기 타겟 수정 인덱스는 pps_seq_transform_id 로 정의될 수 있으며(S1210), 상기 타겟 수정 인덱스는 상기 표 2와 같이 정의될 수 있다. 여기서, 표 2는 일실시예일 뿐이며, 본 발명은 이에 한정되지 않으며 본 명세서에서 설명하는 다양한 실시예들의 조합이 가능하다.

도 13은 PPS(Picture parameter set) 레벨에서 타겟 수정 정보를 정의하는 신택스 구조를 나타내며, 상기 타겟 수정 정보는 타겟 수정 플래그를 포함할 수 있다.

여기서 상기 타겟 수정 플래그는 픽쳐 레벨에서 타겟 영역에 대해 수정을 수행하는지 여부를 나타내고, 이는 pps_seq_transform_flag로 표현될 수 있다(S1310).

본 발명은 이에 한정되지 않으며 본 명세서에서 설명하는 다양한 실시예들의 조합이 가능하다.

도 14는 슬라이스 세그먼트 헤더(slice segment header) 레벨에서 타겟 수정 정보를 정의하는 신택스 구조를 나타내며, 상기 타겟 수정 정보는 타겟 수정 인덱스를 포함할 수 있다.

예를 들어, 상기 타겟 수정 인덱스는 슬라이스 세그먼트 헤더 레벨에서의 타겟 수정 방법을 나타내며, 수정 없음, 좌우 대칭 변환, 상하 대칭 변환, 회전 변환 또는 이들의 조합 중 적어도 하나에 대응될 수 있다.

상기 타겟 수정 인덱스는 slice_seq_transform_id 로 정의될 수 있으며(S1410), 상기 타겟 수정 인덱스는 상기 표 2와 같이 정의될 수 있다. 여기서, 표 2는 일실시예일 뿐이며, 본 발명은 이에 한정되지 않으며 본 명세서에서 설명하는 다양한 실시예들의 조합이 가능하다.

도 15는 SPS(sequence parameter set) 및 슬라이스 세그먼트 헤더에서 타겟 수정 정보(seq_transform_flag 및 seq_transform_id)를 정의하는 신택스 구조를 나타낸다.

예를 들어, 상기 타겟 수정 정보는 타겟 수정 플래그 및 타겟 수정 인덱스를 포함할 수 있다.

상기 타겟 수정 플래그는 SPS에서 정의되고, 상기 타겟 수정 인덱스는 슬라이스 세그먼트 헤더에서 정의될 수 있다. 이때, 상기 타겟 수정 플래그는 seq_transform_flag 로 표현될 수 있고, 상기 타겟 수정 인덱스는 seq_transform_id 로 표현될 수 있다.

따라서, 비디오 신호 처리 장치는 SPS에서 타겟 수정 플래그를 획득하고(S1510), 상기 타겟 수정 플래그에 기초하여(S1520) 슬라이스 세그먼트 헤더로부터 타겟 수정 인덱스를 획득될 수 있다(S1530). 예를 들어, 상기 타겟 수정 인덱스는 상기 타겟 수정 플래그에 따라 타겟 영역에 대해 수정이 수행되는 경우에만 획득될 수 있다.

일실시예로, 디코더에서 시퀀스 또는 프레임 단위로 디코딩이 끝난 후, 전송받은 타겟 수정 방법에 기초하여 디코딩된 영상을 수정할 수 있다. 예를 들어, PPS의 pps_seq_transform_id가 1일 경우 디코딩된 영상에 대해 좌/우 대칭 변환을 수행할 수 있다. 이는 일실시예일 뿐이며, 본 발명은 이에 한정되지 않으며 본 명세서에서 설명하는 다양한 실시예들의 조합이 가능하다.

도 16은 본 발명이 적용되는 실시예로서, 타겟 영역을 수정하는 과정을 설명하기 위한 흐름도이다.

비디오 신호 처리 장치는 타겟 영역을 포함하는 상기 비디오 신호를 수신할 수 있다(S1610).

상기 비디오 신호 처리 장치는 상기 타겟 영역에 대해 복수개의 타겟 수정 방법을 적용할 수 있다(S1620).

상기 비디오 신호 처리 장치는 상기 복수개의 타겟 수정 방법 중 최적의 타겟 수정 방법을 결정할 수 있다(S1630). 여기서, 상기 최적의 타겟 수정 방법은 상기 타겟 영역의 에지 분포, 복잡도, 또는 율-왜곡 비용에 기초하여 결정된다.

그리고, 상기 비디오 신호 처리 장치는 상기 최적의 타겟 수정 방법에 따라 수정된 타겟 영역을 이용하여 비디오 신호를 인코딩할 수 있다(S1640).

한편, 상기 비디오 신호 처리 장치는 상기 최적의 타겟 수정 방법에 대응되는 타겟 수정 인덱스를 인코딩할 수 있다(S1650). 상기 타겟 수정 인덱스는 타겟 수정 방법을 나타내며, 예를 들어, 수정 없음, 좌우 대칭 변환, 상하 대칭 변환, 회전 변환 또는 이들의 조합 중 적어도 하나에 대응될 수 있다.

본 발명은 이에 한정되지 않으며 본 명세서에서 설명하는 다양한 실시예들이 적용될 수 있다.

도 17은 본 발명이 적용되는 실시예로서, 타겟 영역을 역수정하는 과정을 설명하기 위한 흐름도이다.

비디오 신호 처리 장치는 비디오 신호의 시퀀스 파라미터 셋으로부터 타겟 수정 플래그를 획득할 수 있다(S1710). 여기서 상기 타겟 수정 플래그는 타겟 영역에 대해 수정을 수행하는지 여부를 나타낸다. 예를 들어, 상기 타겟 영역은 시퀀스, 영상, 프레임, 타일, 또는 블록 중 적어도 하나에 대응될 수 있다.

상기 비디오 신호 처리 장치는 상기 타겟 수정 플래그에 따라 타겟 영역에 대해 수정을 수행하는 경우(S1720), 타겟 수정 인덱스를 획득할 수 있다(S1730). 여기서, 상기 타겟 수정 인덱스는 타겟 수정 방법을 나타내며, 수정 없음, 좌우 대칭 변환, 상하 대칭 변환, 회전 변환 또는 이들의 조합 중 적어도 하나에 대응된다.

그리고, 상기 타겟 수정 인덱스는 상기 시퀀스 파라미터 셋, 픽쳐 파라미터 셋 또는 슬라이스 헤더로부터 획득될 수 있다.

상기 비디오 신호 처리 장치는 상기 타겟 수정 인덱스에 대응되는 타겟 수정 방법을 확인할 수 있다(S1740). 여기서, 상기 타겟 수정 인덱스에 대응되는 타겟 수정 방법은 상기 타겟 영역의 에지 분포, 복잡도, 또는 율-왜곡 비용에 기초하여 결정된 것을 특징으로 한다.

상기 비디오 신호 처리 장치는, 상기 타겟 수정 방법에 따라, 복원된 타겟 영역에 대해 역수정을 수행할 수 있다(S1750).

그리고, 상기 비디오 신호 처리 장치는 상기 역수정된 타겟 영역을 출력 또는 디스플레이 할 수 있다.

도 18은 본 발명이 적용되는 실시예로서, 컨텐츠 스트리밍 시스템 구조도를 나타낸다.

상기 도 18을 살펴보면, 본 발명이 적용되는 컨텐츠 스트리밍 시스템은 크게 인코딩 서버, 스트리밍 서버, 웹 서버, 미디어 저장소, 사용자 장치 및 멀티미디어 입력 장치를 포함할 수 있다.

상기 인코딩 서버는 스마트폰, 카메라, 캠코더 등과 같은 멀티미디어 입력 장치들로부터 입력된 컨텐츠를 디지털 데이터로 압축하여 비트스트림을 생성하고 이를 상기 스트리밍 서버로 전송하는 역할을 한다. 다른 예로, 스마트폰, 카메라, 캠코더 등과 같은 멀티미디어 입력 장치들이 비트스트림을 직접 생성하는 경우, 상기 인코딩 서버는 생략될 수 있다.

상기 비트스트림은 본 발명이 적용되는 인코딩 방법 또는 비트스트림 생성 방법에 의해 생성될 수 있고, 상기 스트리밍 서버는 상기 비트스트림을 전송 또는 수신하는 과정에서 일시적으로 상기 비트스트림을 저장할 수 있다.

상기 스트리밍 서버는 웹 서버를 통한 사용자 요청에 기초하여 멀티미디어 데이터를 사용자 장치에 전송하고, 상기 웹 서버는 사용자에게 어떠한 서비스가 있는지를 알려주는 매개체 역할을 한다. 사용자가 상기 웹 서버에 원하는 서비스를 요청하면, 상기 웹 서버는 이를 스트리밍 서버에 전달하고, 상기 스트리밍 서버는 사용자에게 멀티미디어 데이터를 전송한다. 이때, 상기 컨텐츠 스트리밍 시스템은 별도의 제어 서버를 포함할 수 있고, 이 경우 상기 제어 서버는 상기 컨텐츠 스트리밍 시스템 내 각 장치 간 명령/응답을 제어하는 역할을 한다.

상기 스트리밍 서버는 미디어 저장소 및/또는 인코딩 서버로부터 컨텐츠를 수신할 수 있다. 예를 들어, 상기 인코딩 서버로부터 컨텐츠를 수신하게 되는 경우, 상기 컨텐츠를 실시간으로 수신할 수 있다. 이 경우, 원활한 스트리밍 서비스를 제공하기 위하여 상기 스트리밍 서버는 상기 비트스트림을 일정 시간동안 저장할 수 있다.

상기 사용자 장치의 예로는, 휴대폰, 스마트 폰(smart phone), 노트북 컴퓨터(laptop computer), 디지털방송용 단말기, PDA(personal digital assistants), PMP(portable multimedia player), 네비게이션, 슬레이트 PC(slate PC), 태블릿 PC(tablet PC), 울트라북(ultrabook), 웨어러블 디바이스(wearable device, 예를 들어, 워치형 단말기 (smartwatch), 글래스형 단말기 (smart glass), HMD(head mounted display)), 디지털 TV, 데스크탑 컴퓨터, 디지털 사이니지 등이 있을 수 있다.

상기 컨텐츠 스트리밍 시스템 내 각 서버들은 분산 서버로 운영될 수 있으며, 이 경우 각 서버에서 수신하는 데이터는 분산 처리될 수 있다.

상기 기술된 것과 같이, 본 발명에서 설명한 실시예들은 프로세서, 마이크로 프로세서, 컨트롤러 또는 칩 상에서 구현되어 수행될 수 있다. 예를 들어, 각 도면에서 도시한 기능 유닛들은 컴퓨터, 프로세서, 마이크로 프로세서, 컨트롤러 또는 칩 상에서 구현되어 수행될 수 있다.

또한, 본 발명이 적용되는 디코더 및 인코더는 멀티미디어 방송 송수신 장치, 모바일 통신 단말, 홈 시네마 비디오 장치, 디지털 시네마 비디오 장치, 감시용 카메라, 비디오 대화 장치, 비디오 통신과 같은 실시간 통신 장치, 모바일 스트리밍 장치, 저장 매체, 캠코더, 주문형 비디오(VoD) 서비스 제공 장치, OTT 비디오(Over the top video) 장치, 인터넷 스트리밍 서비스 제공 장치, 3차원(3D) 비디오 장치, 화상 전화 비디오 장치, 및 의료용 비디오 장치 등에 포함될 수 있으며, 비디오 신호 또는 데이터 신호를 처리하기 위해 사용될 수 있다. 예를 들어, OTT 비디오(Over the top video) 장치로는 게임 콘솔, 블루레이 플레이어, 인터넷 접속 TV, 홈시어터 시스템, 스마트폰, 태블릿 PC, DVR(Digital Video Recoder) 등을 포함할 수 있다.

또한, 본 발명이 적용되는 처리 방법은 컴퓨터로 실행되는 프로그램의 형태로 생산될 수 있으며, 컴퓨터가 판독할 수 있는 기록 매체에 저장될 수 있다. 본 발명에 따른 데이터 구조를 가지는 멀티미디어 데이터도 또한 컴퓨터가 판독할 수 있는 기록 매체에 저장될 수 있다. 상기 컴퓨터가 판독할 수 있는 기록 매체는 컴퓨터로 읽을 수 있는 데이터가 저장되는 모든 종류의 저장 장치 및 분산 저장 장치를 포함한다. 상기 컴퓨터가 판독할 수 있는 기록 매체는, 예를 들어, 블루레이 디스크(BD), 범용 직렬 버스(USB), ROM, PROM, EPROM, EEPROM, RAM, CD-ROM, 자기 테이프, 플로피 디스크 및 광학적 데이터 저장 장치를 포함할 수 있다. 또한, 상기 컴퓨터가 판독할 수 있는 기록 매체는 반송파(예를 들어, 인터넷을 통한 전송)의 형태로 구현된 미디어를 포함한다. 또한, 인코딩 방법으로 생성된 비트스트림이 컴퓨터가 판독할 수 있는 기록 매체에 저장되거나 유무선 통신 네트워크를 통해 전송될 수 있다.

또한, 본 발명의 실시예는 프로그램 코드에 의한 컴퓨터 프로그램 제품으로 구현될 수 있고, 상기 프로그램 코드는 본 발명의 실시예에 의해 컴퓨터에서 수행될 수 있다. 상기 프로그램 코드는 컴퓨터에 의해 판독가능한 캐리어 상에 저장될 수 있다.

이상, 전술한 본 발명의 바람직한 실시예는, 예시의 목적을 위해 개시된 것으로, 당업자라면 이하 첨부된 특허청구범위에 개시된 본 발명의 기술적 사상과 그 기술적 범위 내에서, 다양한 다른 실시예들을 개량, 변경, 대체 또는 부가 등이 가능할 것이다.

Claims

타겟 수정을 통해 비디오 신호를 처리하는 방법에 있어서,
상기 비디오 신호의 시퀀스 파라미터 셋으로부터 타겟 수정 플래그를 획득하는 단계, 여기서 상기 타겟 수정 플래그는 타겟 영역에 대해 수정을 수행하는지 여부를 나타냄;
상기 타겟 수정 플래그에 따라 타겟 영역에 대해 수정을 수행하는 경우, 타겟 수정 인덱스를 획득하는 단계, 여기서 상기 타겟 수정 인덱스는 타겟 수정 방법을 나타내며, 수정 없음, 좌우 대칭 변환, 상하 대칭 변환, 회전 변환 또는 이들의 조합 중 적어도 하나에 대응됨;
상기 타겟 수정 인덱스에 대응되는 타겟 수정 방법을 확인하는 단계; 및
상기 타겟 수정 방법에 따라, 복원된 타겟 영역에 대해 역수정을 수행하는 단계
를 포함하는 것을 특징으로 하는 방법.
제1항에 있어서,
상기 타겟 수정 인덱스에 대응되는 타겟 수정 방법은 상기 타겟 영역의 에지 분포, 복잡도, 또는 율-왜곡 비용에 기초하여 결정된 것을 특징으로 하는 방법.
제2항에 있어서,
상기 타겟 영역의 에지 분포의 경우,
상기 타겟 영역 내 수직 대각 에지(vertical diagonal edge)가 기결정된 임계값 이상으로 분포되어 있을 때, 상기 타겟 수정 방법은 좌우 대칭 변환 또는 상하 대칭 변환을 나타내는 것을 특징으로 하는 방법.
제2항에 있어서,
상기 타겟 영역의 복잡도의 경우,
상기 타겟 영역 내 우측 영역이 좌측 영역에 비해 복잡도가 높을 때, 상기 타겟 수정 방법은 좌우 대칭 변환을 나타내는 것을 특징으로 하는 방법.
제1항에 있어서,
상기 타겟 영역은 시퀀스, 영상, 프레임, 타일, 또는 블록 중 적어도 하나에 대응되는 것을 특징으로 하는 방법.
제1항에 있어서,
상기 타겟 수정 인덱스는 상기 시퀀스 파라미터 셋, 픽쳐 파라미터 셋 또는 슬라이스 헤더로부터 획득되는 것을 특징으로 하는 방법.
타겟 수정을 통해 비디오 신호를 처리하는 방법에 있어서,
타겟 영역을 포함하는 상기 비디오 신호를 수신하는 단계;
상기 타겟 영역에 대해 복수개의 타겟 수정 방법을 적용하는 단계;
상기 복수개의 타겟 수정 방법 중 최적의 타겟 수정 방법을 결정하는 단계;
상기 최적의 타겟 수정 방법에 따라 수정된 타겟 영역을 이용하여 비디오 신호를 인코딩하는 단계;
상기 최적의 타겟 수정 방법에 대응되는 타겟 수정 인덱스를 인코딩하는 단계
를 포함하되,
상기 타겟 수정 인덱스는 타겟 수정 방법을 나타내며, 수정 없음, 좌우 대칭 변환, 상하 대칭 변환, 회전 변환 또는 이들의 조합 중 적어도 하나에 대응되는 것을 특징으로 하는 방법.
제1항에 있어서,
상기 최적의 타겟 수정 방법은 상기 타겟 영역의 에지 분포, 복잡도, 또는 율-왜곡 비용에 기초하여 결정되는 것을 특징으로 하는 방법.
제8항에 있어서,
상기 타겟 영역의 에지 분포의 경우,
상기 타겟 영역 내 수직 대각 에지(vertical diagonal edge)가 기결정된 임계값 이상으로 분포되어 있을 때, 상기 최적의 타겟 수정 방법은 좌우 대칭 변환 또는 상하 대칭 변환을 나타내는 것을 특징으로 하는 방법.
제8항에 있어서,
상기 타겟 영역의 복잡도의 경우,
상기 타겟 영역 내 우측 영역이 좌측 영역에 비해 복잡도가 높을 때, 상기 최적의 타겟 수정 방법은 좌우 대칭 변환을 나타내는 것을 특징으로 하는 방법.
제7항에 있어서,
상기 타겟 영역은 시퀀스, 영상, 프레임, 타일, 또는 블록 중 적어도 하나에 대응되는 것을 특징으로 하는 방법.
제7항에 있어서,
상기 타겟 수정 인덱스는 상기 시퀀스 파라미터 셋, 픽쳐 파라미터 셋 또는 슬라이스 헤더에서 시그널링되는 것을 특징으로 하는 방법.
타겟 수정을 통해 비디오 신호를 처리하는 장치에 있어서,
상기 비디오 신호의 시퀀스 파라미터 셋으로부터 타겟 수정 플래그를 파싱하는 파싱부, 여기서 상기 타겟 수정 플래그는 타겟 영역에 대해 수정을 수행하는지 여부를 나타냄; 및
상기 타겟 수정 플래그에 따라 타겟 영역에 대해 수정을 수행하는 경우, 타겟 수정 인덱스를 획득하고, 상기 타겟 수정 인덱스에 대응되는 타겟 수정 방법을 확인하고, 상기 타겟 수정 방법에 따라 복원된 타겟 영역에 대해 역수정을 수행하는 후처리부
를 포함하되,
상기 타겟 수정 인덱스는 타겟 수정 방법을 나타내며, 수정 없음, 좌우 대칭 변환, 상하 대칭 변환, 회전 변환 또는 이들의 조합 중 적어도 하나에 대응되는 것을 특징으로 하는 장치.
타겟 수정을 통해 비디오 신호를 처리하는 장치에 있어서,
타겟 영역을 포함하는 상기 비디오 신호를 수신하고, 상기 타겟 영역에 대해 복수개의 타겟 수정 방법을 적용하고, 상기 복수개의 타겟 수정 방법 중 최적의 타겟 수정 방법을 결정하고, 상기 최적의 타겟 수정 방법에 대응되는 타겟 수정 인덱스를 인코딩하는 전처리부; 및
상기 최적의 타겟 수정 방법에 따라 수정된 타겟 영역을 이용하여 비디오 신호를 인코딩하는 인코더;
를 포함하되,
상기 타겟 수정 인덱스는 타겟 수정 방법을 나타내며, 수정 없음, 좌우 대칭 변환, 상하 대칭 변환, 회전 변환 또는 이들의 조합 중 적어도 하나에 대응되는 것을 특징으로 하는 장치.