KR20150095253A - 영상 부호화에서의 화면 내 예측 방법 및 장치 - Google Patents

영상 부호화에서의 화면 내 예측 방법 및 장치 Download PDF

Info

Publication number
KR20150095253A
KR20150095253A KR1020140016350A KR20140016350A KR20150095253A KR 20150095253 A KR20150095253 A KR 20150095253A KR 1020140016350 A KR1020140016350 A KR 1020140016350A KR 20140016350 A KR20140016350 A KR 20140016350A KR 20150095253 A KR20150095253 A KR 20150095253A
Authority
KR
South Korea
Prior art keywords
prediction
prediction mode
block
mode
intra
Prior art date
Application number
KR1020140016350A
Other languages
English (en)
Inventor
김종호
정세윤
조숙희
임성창
이대열
김휘용
최진수
김진웅
Original Assignee
한국전자통신연구원
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 한국전자통신연구원 filed Critical 한국전자통신연구원
Priority to KR1020140016350A priority Critical patent/KR20150095253A/ko
Publication of KR20150095253A publication Critical patent/KR20150095253A/ko

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/593Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving spatial prediction techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

영상 부호화에서의 화면 내 예측 방법이 개시된다. 상기 방법은 화면 내 예측을 수행하는 현재 블록의 주변 블록 및 상기 현재 블록의 크기보다 큰 상위 블록 중 적어도 하나의 부호화 정보를 이용하여, 상기 현재 블록에 대해 화면 내 예측을 수행할 후보 예측 모드를 결정하는 단계 및 상기 후보 예측 모드를 기반으로 상기 현재 블록에 대한 최적 예측 모드를 결정하는 단계를 포함한다.

Description

영상 부호화에서의 화면 내 예측 방법 및 장치{INTRA PREDICTION METHOD AND APPARATUS FOR VIDEO CODING}
본 발명은 영상 부호화 및 복호화 기술에 관한 것으로, 보다 구체적으로는 화면 내 예측 방법에 관한 것이다.
최근 HD(High Definition) 영상 및 UHD(Ultra High Definition) 영상과 같은 고해상도, 고품질의 영상에 대한 수요가 다양한 응용 분야에서 증가하고 있다. 영상 데이터가 고해상도, 고품질이 될수록 기존의 영상 데이터에 비해 상대적으로 데이터량이 증가하기 때문에 기존의 유무선 광대역 회선과 같은 매체를 이용하여 영상 데이터를 전송하거나 기존의 저장 매체를 이용해 저장하는 경우, 전송 비용과 저장 비용이 증가하게 된다. 영상 데이터가 고해상도, 고품질화 됨에 따라 발생하는 이러한 문제들을 해결하기 위해서는 고효율의 영상 압축 기술들이 활용될 수 있다.
영상 압축 기술로 현재 픽처의 이전 또는 이후 픽처로부터 현재 픽처에 포함된 화소값을 예측하는 화면 간 예측(inter prediction) 기술, 현재 픽처 내의 화소 정보를 이용하여 현재 픽처에 포함된 화소값을 예측하는 화면 내 예측(intra prediction) 기술, 출현 빈도가 높은 값에 짧은 부호를 할당하고 출현 빈도가 낮은 값에 긴 부호를 할당하는 엔트로피 부호화 기술 등 다양한 기술이 존재하고 이러한 영상 압축 기술을 이용해 영상 데이터를 효과적으로 압축하여 전송 또는 저장할 수 있다.
한편, 영상 부호화에서 화면 내 예측은 다양한 방향성을 가지는 예측 모드들을 포함한다. 이러한 다양한 방향성 예측 모드들을 이용하여 예측 신호를 만들고, 예측 신호와 원본 신호의 차를 이용하여 잔차 신호를 생성한다. 그리고 다양한 방향성 모드들 중 최소 율-왜곡(Rate Distortion) 비용을 가지는 방향성 예측 모드가 최적 화면 내 예측 모드가 된다.
하지만, 예측 오차를 줄이기 위해 방향성 예측 모드들의 개수가 늘어나고 다양한 크기의 블록들에 대해 화면 내 예측을 수행함에 따라 화면 내 예측 시의 복잡도가 크게 증가하였다. 예를 들어, HEVC(High Efficiency Video Coding)의 경우, 35가지의 방향성 예측 모드가 있으며, 방향성 예측을 하는 블록들의 크기도 4x4 크기의 블록에서 64x64 크기의 블록까지 다양하다. 이러한 다양한 크기의 모든 블록들에 대해 35가지의 화면 내 예측 모드들을 모두 적용할 경우, 부호화기의 복잡도는 크게 증가하게 된다. 따라서, 화면 내 예측 시의 복잡도를 줄일 수 있는 방법이 필요하다.
본 발명에서는 다양한 부호화 정보들을 이용하여 화면 내 예측을 위한 방향성 예측 모드들의 수를 줄임으로써 화면 내 예측의 복잡도를 줄일 수 있는 방법에 대해 제안한다.
본 발명은 영상의 부호화/복호화 효율을 증가시키기 위한 화면 내 예측 방법 및 장치를 제공한다.
본 발명은 주변 블록 또는 상위 크기 블록의 부호화 정보를 이용하여 화면 내 예측에서의 방향성 예측 모드들의 수를 줄이는 방법 및 장치를 제공한다.
본 발명의 일 실시예에 따르면, 영상 부호화에서의 화면 내 예측 방법이 제공된다. 상기 방법은 화면 내 예측을 수행하는 현재 블록의 주변 블록 및 상기 현재 블록의 크기보다 큰 상위 블록 중 적어도 하나의 부호화 정보를 이용하여, 상기 현재 블록에 대해 화면 내 예측을 수행할 후보 예측 모드를 결정하는 단계 및 상기 후보 예측 모드를 기반으로 상기 현재 블록에 대한 최적 예측 모드를 결정하는 단계를 포함한다.
상기 후보 예측 모드를 결정하는 단계는, 상기 주변 블록의 최적 예측 모드 정보, 상기 주변 블록의 예측 모드의 부호화 비용 정보, 상기 상위 블록의 최적 예측 모드 정보 및 상기 상위 블록의 예측 모드의 부호화 비용 정보 중 적어도 하나를 이용하여 상기 후보 예측 모드를 결정할 수 있다.
상기 최적 예측 모드를 결정하는 단계는, 상기 후보 예측 모드의 부호화 비용의 평균 값 및 상기 후보 예측 모드 간의 부호화 비용 증가율 중 적어도 하나를 이용하여 상기 후보 예측 모드로부터 최종 후보 예측 모드를 결정하는 단계 및 상기 최종 후보 예측 모드의 부호화 비용을 기반으로 상기 최적 예측 모드를 결정하는 단계를 포함할 수 있다.
화면 내 예측에서의 방향성 예측 모드의 수가 감소됨으로써 영상 부호화 과정에서의 복잡도가 감소될 수 있다.
도 1은 본 발명이 적용되는 영상 부호화 장치의 일 실시예에 따른 구성을 나타내는 블록도이다.
도 2는 본 발명이 적용되는 영상 복호화 장치의 일 실시예에 따른 구성을 나타내는 블록도이다.
도 3은 화면 내 예측 모드의 예측 방향 및 각 예측 방향에 할당된 모드 값의 일실시예를 개략적으로 나타낸 도면이다.
도 4는 본 발명의 일실시예에 따른 현재 PU(현재 블록)의 주변 블록(주변 참조 블록)을 도시한 도면이다.
도 5는 본 발명의 실시예에 따른 영상 부호화에서의 화면 내 예측 방법을 나타내는 순서도이다.
이하, 도면을 참조하여 본 발명의 실시 형태에 대하여 구체적으로 설명한다. 본 명세서의 실시예를 설명함에 있어, 관련된 공지 구성 또는 기능에 대한 구체적인 설명이 본 명세서의 요지를 흐릴 수 있다고 판단되는 경우에는 해당 설명을 생략할 수도 있다.
본 명세서에서 어떤 구성 요소가 다른 구성 요소에 연결되어 있다거나 접속되어 있다고 언급된 때에는, 그 다른 구성 요소에 직접적으로 연결되어 있거나 또는 접속되어 있는 것을 의미할 수도 있고, 중간에 다른 구성 요소가 존재하는 것을 의미할 수도 있다. 아울러, 본 명세서에서 특정 구성을 포함한다고 기술하는 내용은 해당 구성 이외의 구성을 배제하는 것이 아니며, 추가적인 구성이 본 발명의 실시 또는 본 발명의 기술적 사상의 범위에 포함될 수 있음을 의미한다.
제1, 제2 등의 용어는 다양한 구성들을 설명하는데 사용될 수 있지만, 상기 구성들은 상기 용어에 의해 한정되지 않는다. 상기 용어들은 하나의 구성을 다른 구성으로부터 구별하는 목적으로 사용된다. 예를 들어, 본 발명의 권리 범위를 벗어나지 않으면서 제1 구성은 제2 구성으로 명명될 수 있고, 유사하게 제2 구성도 제1 구성으로 명명될 수 있다.
또한 본 발명의 실시예에 나타나는 구성부들은 서로 다른 특징적인 기능을 나타내기 위해 독립적으로 도시되는 것으로, 각 구성부들이 분리된 하드웨어나 하나의 소프트웨어 구성 단위로 이루어짐을 의미하지 않는다. 즉, 각 구성부는 설명의 편의상 각각의 구성부로 나열하여 포함한 것으로 각 구성부 중 적어도 두 개의 구성부가 하나의 구성부를 이루거나, 하나의 구성부가 복수 개의 구성부로 나뉘어져 기능을 수행할 수 있다. 각 구성부의 통합된 실시예 및 분리된 실시예도 본 발명의 본질에서 벗어나지 않는 한 본 발명의 권리 범위에 포함된다.
또한, 일부의 구성 요소는 본 발명에서 본질적인 기능을 수행하는 필수적인 구성 요소는 아니고 단지 성능을 향상시키기 위한 선택적 구성 요소일 수 있다. 본 발명은 단지 성능 향상을 위해 사용되는 구성 요소를 제외한 본 발명의 본질을 구현하는데 필수적인 구성부만을 포함하여 구현될 수 있고, 단지 성능 향상을 위해 사용되는 선택적 구성 요소를 제외한 필수 구성 요소만을 포함한 구조도 본 발명의 권리범위에 포함된다.
도 1은 본 발명이 적용되는 영상 부호화 장치의 일 실시예에 따른 구성을 나타내는 블록도이다.
도 1을 참조하면, 영상 부호화 장치(100)는 움직임 예측부(111), 움직임 보상부(112), 인트라 예측부(120), 스위치(115), 감산기(125), 변환부(130), 양자화부(140), 엔트로피 부호화부(150), 역양자화부(160), 역변환부(170), 가산기(175), 필터부(180) 및 참조 영상 버퍼(190)를 포함한다.
영상 부호화 장치(100)는 입력 영상에 대해 인트라(intra) 모드 또는 인터(inter) 모드로 부호화를 수행하고 비트스트림을 출력할 수 있다. 인트라 모드인 경우 스위치(115)가 인트라로 전환되고, 인터 모드인 경우 스위치(115)가 인터로 전환될 수 있다. 인트라 예측은 화면 내 예측, 인터 예측은 화면 간 예측을 의미한다. 영상 부호화 장치(100)는 입력 영상의 입력 블록에 대한 예측 블록을 생성한 후, 입력 블록과 예측 블록의 차분(residual)을 부호화할 수 있다. 이때, 입력 영상은 원 영상(original picture)를 의미할 수 있다.
인트라 모드인 경우, 인트라 예측부(120)는 현재 블록 주변의 이미 부호화/복호화된 블록의 픽셀값을 이용하여 공간적 예측을 수행하여 예측 블록을 생성할 수 있다.
인터 모드인 경우, 움직임 예측부(111)는, 움직임 예측 과정에서 참조 픽처 버퍼(190)에 저장되어 있는 참조 영상에서 입력 블록과 가장 매치가 잘 되는 영역을 찾아 움직임 벡터를 구할 수 있다. 움직임 보상부(112)는 움직임 벡터를 이용하여 움직임 보상을 수행함으로써 예측 블록을 생성할 수 있다. 여기서, 움직임 벡터는 인터 예측에 사용되는 2차원 벡터이며, 현재 부호화/복호화 대상 영상과 참조 영상 사이의 오프셋을 나타낼 수 있다.
감산기(125)는 입력 블록과 생성된 예측 블록의 차분에 의해 잔차 블록(residual block)을 생성할 수 있다.
변환부(130)는 잔차 블록에 대해 변환(transform)을 수행하여 변환 계수(transform coefficient)를 출력할 수 있다. 그리고 양자화부(140)는 입력된 변환 계수를 양자화 파라미터(quantization parameter, 또는 양자화 매개변수)에 따라 양자화하여 양자화된 계수(quantized coefficient)를 출력할 수 있다.
엔트로피 부호화부(150)는, 양자화부(140)에서 산출된 값들 또는 부호화 과정에서 산출된 부호화 파라미터 값 등을 기초로 엔트로피 부호화를 수행하여 비트스트림(bit stream)을 출력할 수 있다. 엔트로피 부호화가 적용되는 경우, 높은 발생 확률을 갖는 심볼(symbol)에 적은 수의 비트가 할당되고 낮은 발생 확률을 갖는 심볼에 많은 수의 비트가 할당되어 심볼이 표현됨으로써, 부호화 대상 심볼들에 대한 비트열의 크기가 감소될 수 있다. 따라서 엔트로피 부호화를 통해서 영상 부호화의 압축 성능이 높아질 수 있다. 엔트로피 부호화부(150)는 엔트로피 부호화를 위해 지수-골롬(Exponential-Golomb), CAVLC(Context-Adaptive Variable Length Coding), CABAC(Context-Adaptive Binary Arithmetic Coding)과 같은 부호화 방법을 사용할 수 있다.
도 1의 실시예에 따른 영상 부호화 장치(100)는 인터 예측 부호화, 즉 화면 간 예측 부호화를 수행하므로, 현재 부호화된 영상은 참조 영상으로 사용되기 위해 복호화되어 저장될 필요가 있다. 따라서 양자화된 계수는 역양자화부(160)에서 역양자화되고 역변환부(170)에서 역변환된다. 역양자화, 역변환된 계수는 가산기(175)를 통해 예측 블록과 더해지고 복원 블록이 생성된다.
복원 블록은 필터부(180)를 거치고, 필터부(180)는 디블록킹 필터(deblocking filter), SAO(Sample Adaptive Offset), ALF(Adaptive Loop Filter) 중 적어도 하나 이상을 복원 블록 또는 복원 픽처에 적용할 수 있다. 필터부(180)는 적응적 인루프(in-loop) 필터로 불릴 수도 있다. 디블록킹 필터는 블록 간의 경계에 생긴 블록 왜곡을 제거할 수 있다. SAO는 코딩 에러를 보상하기 위해 픽셀값에 적정 오프셋(offset) 값을 더해줄 수 있다. ALF는 복원된 영상과 원래의 영상을 비교한 값을 기초로 필터링을 수행할 수 있다. 필터부(180)를 거친 복원 블록은 참조 픽처 버퍼(190)에 저장될 수 있다.
도 2는 본 발명이 적용되는 영상 복호화 장치의 일 실시예에 따른 구성을 나타내는 블록도이다.
도 2를 참조하면, 영상 복호화 장치(200)는 엔트로피 복호화부(210), 역양자화부(220), 역변환부(230), 인트라 예측부(240), 움직임 보상부(250), 가산기(255), 필터부(260) 및 참조 픽처 버퍼(270)를 포함한다.
영상 복호화 장치(200)는 부호화기에서 출력된 비트스트림을 입력 받아 인트라 모드 또는 인터 모드로 복호화를 수행하고 재구성된 영상, 즉 복원 영상을 출력할 수 있다. 인트라 모드인 경우 스위치가 인트라로 전환되고, 인터 모드인 경우 스위치가 인터로 전환될 수 있다.
영상 복호화 장치(200)는 입력 받은 비트스트림으로부터 복원된 잔차 블록(reconstructed residual block)을 얻고 예측 블록을 생성한 후 복원된 잔차 블록과 예측 블록을 더하여 재구성된 블록, 즉 복원 블록을 생성할 수 있다.
엔트로피 복호화부(210)는, 입력된 비트스트림을 확률 분포에 따라 엔트로피 복호화하여, 양자화된 계수(quantized coefficient) 형태의 심볼을 포함한 심볼들을 생성할 수 있다.
엔트로피 복호화 방법이 적용되는 경우, 높은 발생 확률을 갖는 심볼에 적은 수의 비트가 할당되고 낮은 발생 확률을 갖는 심볼에 많은 수의 비트가 할당되어 심볼이 표현됨으로써, 각 심볼들에 대한 비트열의 크기가 감소될 수 있다.
양자화된 계수는 역양자화부(220)에서 역양자화되고 역변환부(230)에서 역변환되며, 양자화된 계수가 역양자화/역변환 된 결과, 복원된 잔차 블록이 생성될 수 있다.
인트라 모드인 경우, 인트라 예측부(240)는 현재 블록 주변의 이미 복호화된 블록의 픽셀값을 이용하여 공간적 예측을 수행하여 예측 블록을 생성할 수 있다. 인터 모드인 경우, 움직임 보상부(250)는 움직임 벡터 및 참조 픽처 버퍼(270)에 저장되어 있는 참조 영상을 이용하여 움직임 보상을 수행함으로써 예측 블록을 생성할 수 있다.
잔차 블록과 예측 블록은 가산기(255)를 통해 더해지고, 더해진 블록은 필터부(260)를 거칠 수 있다. 필터부(260)는 디블록킹 필터, SAO, ALF 중 적어도 하나 이상을 복원 블록 또는 복원 픽쳐에 적용할 수 있다. 필터부(260)는 재구성된 영상, 즉 복원 영상을 출력할 수 있다. 복원 영상은 참조 픽처 버퍼(270)에 저장되어 인터 예측에 사용될 수 있다.
한편, 본 명세서에서 방향성 예측 모드는 화면 내 예측(인트라 예측)에서 다양한 방향성을 가지는 예측 모드를 의미하며, 방향성 예측 모드의 방향대로 화소를 패딩(padding) 및 보간(interpolation)하여 예측 블록을 생성할 수 있다. 후보 (방향성) 예측 모드는 다양한 화면 내 예측 모드들 중 화면 내 예측에서 사용될 예측 모드를 말한다. 부호화 비용은 SAD(Sum of Absolute Difference), SSE(Sum of Squared Error), SATD(Sum of Absolute Transformed Difference), 율-왜곡 비용(Rate-Distortion cost) 등 부호화를 하는데 있어서 필요한 비용을 나타내는 값이다. MPM(Most Probable Mode)은 특정 주변 블록의 화면 내 예측 모드와 현재 블록의 최적 화면 내 예측 모드가 동일할 경우, 최적 예측 모드 정보를 나타내는 긴 플래그를 보내는 대신 짧은 MPM 플래그를 보내는 것을 말하며, MPM을 사용할 경우 비트 수를 절약할 수 있다.
도 3은 화면 내 예측 모드의 예측 방향 및 각 예측 방향에 할당된 모드 값의 일실시예를 개략적으로 나타낸 도면이다.
도 3에 도시된 바와 같이, 화면 내 예측 모드는 서로 다른 방향성을 가진다. 또한 각각의 화면 내 예측 모드에는 서로 다른 모드 값이 할당된다.
예를 들어, HEVC(High Efficiency Video Coding)의 화면 내 예측에서는 도 3에 도시된 바와 같이 0~34까지의 모드값을 갖는 총 35가지의 예측 모드를 포함할 수 있다. 이때, 33개의 방향성 예측 모드와 2개의 비방향성 예측 모드(예를 들어, DC 모드, Planar 모드)를 포함할 수 있다.
혹은 화면 내 예측 모드는 현재 블록의 색 성분(color component)이 휘도(luma) 신호인지 색차(chroma) 신호인지에 따라 예측 모드의 개수가 다를 수 있다. 예컨대, 도 3에 도시된 ‘intra_FromLuma’ 모드는 휘도 신호로부터 색차 신호를 예측하는 특정 모드일 수 있다.
부호화기에서는 도 3에 도시된 바와 같은 35가지의 예측 모드를 기반으로 현재 블록에 대한 화면 내 예측을 수행하고, 예측을 위해 사용된 화면 내 예측 모드 정보를 부호화한다. 이때, 부호화 효율을 향상시키기 위해서, 부호화기는 현재 블록에 인접한 주변 블록으로부터 MPM을 도출하고, 도출된 MPM을 기초로 현재 블록의 화면 내 예측 모드 정보를 부호화할 수 있다.
보다 구체적으로 부호화기에서 수행되는 화면 내 예측 방법을 설명하면, 부호화기는 먼저 화면 내 예측을 수행할 현재 블록의 크기를 결정한다. 현재 블록의 크기는 4x4, 8x8, 16x16, 32x32, 64x64 등의 다양한 크기를 가질 수 있다.
여기서, 현재 블록은 부화화 유닛(CU: Coding Unit), 예측 유닛(PU: Prediction Unit), 변환 유닛(TU: Transform Unit) 중 적어도 하나의 크기일 수 있다. 또한, 예측이 수행되는 처리 단위와 예측 방법 및 구체적인 내용이 정해지는 처리 단위는 서로 다를 수도 있다. 예컨대, 예측 유닛마다 예측 모드가 정해져서 예측이 수행될 수도 있고, 혹은 예측 유닛마다 예측 모드가 정해지고 변환 유닛마다 예측이 수행될 수도 있다.
다음으로, 부호화기는 4x4, 8x8, 16x16, 32x32, 64x64 크기의 블록 각각에 대해 35가지의 화면 내 예측 모드를 적용하는 러프 모드 결정(Rough Mode Decision) 과정을 수행할 수 있다. 예를 들어, 부호화기는 표 1에 도시된 바와 같이, 4x4, 8x8, 16x16, 32x32, 64x64 크기의 블록 각각에 대해 35가지의 예측 모드를 적용하여 예측을 수행하며, 각 모드에 대해 하다마르 변환(Hadamard Transform)을 이용해 각 모드 별 SATD 값을 구할 수 있다. 표 1은 러프 모드 결정 과정 수행 시 각 블록 크기에 적용할 화면 내 예측 모드의 개수를 나타내는 일예이다.
블록 크기 예측 모드의 개수
4x4 35
8x8 35
16x16 35
32x32 35
64x64 35
다음으로, 부호화기는 러프 모드 결정 과정에 의해 도출된 작은 SATD 값을 가지는 상위 몇 개의 모드에 대해 4x4, 8x8, 16x16, 32x32, 64x64 크기의 블록 각각에 DCT(Discrete Cosine Transform)/DST(Discrete Sine Transform)를 수행하고, 그 결과를 바탕으로 예측 모드 별 율-왜곡 비용(RD-Cost)을 구할 수 있다. 가장 작은 율-왜곡 비용을 가지는 예측 모드가 해당 블록의 최적 예측 모드가 된다. 다시 말해, 부호화기는 러프 모드 결정 후 작은 SATD 값을 가지는 상위 몇 개의 예측 모드에 대해서만 변환, 양자화 및 엔트로피 부호화 과정을 모두 거치는 최종 RDO(Full Rate Distortion Optimization)를 수행하여 최적 예측 모드를 결정한다.
표 2는 최종 RDO 수행 시 각 블록 크기에 적용할 화면 내 예측 모드의 개수를 나타내는 일예이다.
블록 크기 예측 모드의 개수
4x4 8+MPM
8x8 8+MPM
16x16 3+MPM
32x32 3+MPM
64x64 3+MPM
예를 들어, 표 2를 참조하면, 부호화기는 4x4 혹은 8x8 크기의 블록에 대해서는 러프 모드 결정 후 작은 SATD 값을 가지는 상위 8개의 모드 및 MPM에 대해서만 최종 RDO를 수행하고, 그 결과 가장 작은 율-왜곡 비용을 가지는 모드를 최적 예측 모드로 결정할 수 있다. 또는, 부호화기는 16x16, 32x32 혹은 64x64 크기의 블록에 대해서는 러프 모드 결정 후 작은 SATD 값을 가지는 상위 3개의 모드 및 MPM에 대해서만 최종 RDO를 수행하고, 그 결과 가장 작은 율-왜곡 비용을 가지는 모드를 최적 예측 모드로 결정할 수 있다.
상술한 화면 내 예측 방법은 최소의 부호화 비용을 가지는 최적 예측 모드를 결정하기 위해서, 다양한 크기의 블록에 대해서 많은 수의 화면 내 예측 모드를 모두 적용하여 예측을 수행하게 되므로, 부호화 복잡도가 크게 증가하게 된다. 따라서, 본 발명에서는 화면 내 예측 시 복잡도를 줄일 수 있는 방법을 제안하고자 한다.
본 발명에서는 주변 블록 및/또는 상위 블록의 부호화 정보를 이용하여 화면 내 예측 시 방향성 예측 과정 중의 한 부분인 A) 러프 모드 결정( RMD : Rough Mode Decision) 과정B) RDO 모드 결정( RDO Mode Decision ) 과정을 간소화하는 방법에 대해 설명한다. 여기서, 부호화 정보는 예측 모드 정보, 블록 크기 정보, 부호화 비용(예를 들어, SAD, SSE, SATD 등) 정보, 참조 리스트 정보, 스킵(Skip)/머지(Merge) 정보, 움직임 벡터 정보, 주변 화소 간의 유사성 정보 등을 말한다.
도 4는 본 발명의 일실시예에 따른 현재 PU(현재 블록)의 주변 블록(주변 참조 블록)을 도시한 도면이다.
화면 내 예측을 수행할 때, 예측 대상 블록은 복수의 파티션(partition)으로 분할될 수 있다. 예측 대상 블록이 복수의 파티션으로 분할될 경우, 복수의 파티션 각각이 예측이 수행되는 단위(PU)일 수 있다. 이때, 예측이 수행되는 현재 PU(현재 블록)는 주변 블록의 부호화 정보를 참조하여 화면 내 예측이 수행될 수 있다. 예컨대, 예측 대상 블록은 2Nx2N, NxN, 2NxN, Nx2N, 2nxnU, 2NxnD, nLx2N, nRx2N의 파티션 타입으로 분할될 수 있으며, 분할된 각 PU는 PU의 좌측, 좌측 하단, 상단, 상단 우측, 상단 좌측에 인접한 주변 참조 블록들의 부호화 정보를 이용하여 예측이 수행될 수 있다.
도 4의 (a)에 도시된 바와 같이, 현재 PU(현재 블록)(400)가 2Nx2N의 파티션 타입으로 분할된 경우, 현재 PU(400)는 현재 PU(400)의 좌측 하단(A), 좌측(B), 상단 우측(C), 상단(D), 상단 좌측(E)에 인접한 블록들을 주변 참조 블록으로 결정할 수 있다. 그리고 주변 참조 블록의 부호화 정보를 이용하여 현재 PU(400)의 화면 내 예측이 수행될 수 있다.
도 4의 (b)에 도시된 바와 같이, 현재 PU(현재 블록)(410)가 2NxN의 파티션 타입으로 분할된 경우, 현재 PU(410)는 현재 PU(410)의 좌측 하단(A), 좌측(B), 상단 우측(C), 상단 좌측(D)에 인접한 블록들을 주변 참조 블록으로 결정할 수 있다. 그리고 주변 참조 블록의 부호화 정보를 이용하여 현재 PU(410)의 화면 내 예측이 수행될 수 있다.
도 4의 (b)에 도시된 바와 같이 2NxN의 파티션 타입으로 분할된 경우, 상단에 위치한 상단 PU(415)는 도 4의 (a)에 도시된 2Nx2N 파티션 타입의 PU(400)와 동일하게 주변 참조 블록을 설정할 수 있으며, 설정된 주변 참조 블록의 부호화 정보를 이용하여 상단 PU(415)의 화면 내 예측을 수행할 수 있다.
도 4의 (c)에 도시된 바와 같이, 현재 PU(현재 블록)(420)가 Nx2N의 파티션 타입으로 분할된 경우, 현재 PU(420)는 현재 PU(420)의 좌측 하단(A), 상단 우측(B), 상단(C), 상단 좌측(D)에 인접한 블록들을 주변 참조 블록으로 결정할 수 있다. 그리고 주변 참조 블록의 부호화 정보를 이용하여 현재 PU(420)의 화면 내 예측이 수행될 수 있다.
도 4의 (c)에 도시된 바와 같이 Nx2N의 파티션 타입으로 분할된 경우, 좌측에 위치한 좌측 PU(425)는 도 4의 (a)에 도시된 2Nx2N 파티션 타입의 PU(400)와 동일하게 주변 참조 블록을 설정할 수 있으며, 설정된 주변 참조 블록의 부호화 정보를 이용하여 좌측 PU(425)의 화면 내 예측을 수행할 수 있다.
현재 PU(현재 블록)(430)는 주변 참조 블록으로 상술한 바와 같이 현재 PU(430)에 공간적으로 인접한 블록을 이용할 수도 있으며, 도 4의 (d)에 도시된 바와 같이 콜(Col: Collocated) 블록(432, 434)을 이용할 수도 있다. 콜 블록(432, 434)은 현재 PU(430)를 포함하는 현재 프레임(예컨대, N번째 프레임)과 시간적으로 인접한 프레임(예컨대, N-1번째 프레임 혹은 N+1번째 프레임) 내에서 현재 PU(430)에 대응되는 블록을 말한다. 즉, 현재 PU(430)는 콜 블록(432, 434)을 주변 참조 블록으로 결정하고, 결정된 주변 참조 블록의 부호화 정보를 이용하여 예측이 수행될 수 있다.
이하에서는 상술한 바와 같은 주변 참조 블록과 상위 블록의 부호화 정보를 이용하여 본 발명에 따른 화면 내 예측을 수행하는 방법에 대해 설명한다.
A) 러프 모드 결정(RMD: Rough Mode Decision) 간소화 방법
A-1) 주변 참조 블록의 예측 모드 정보에 기반한 방법
주변 참조 블록들 또는 특정 참조 블록의 최적 예측 모드 및 MPM에 해당되는 모드들에 대해서만 러프 모드 결정(이하 RMD라 함) 과정을 수행한다. 여기서, 특정 참조 블록은 화면 간 예측에서 머지로 선택된 블록, 우선 순위가 높은 참조 블록, 주변 참조 블록들과의 움직임 벡터 차가 작은 블록, 경계 화소 사이에 연관성이 높은 블록일 수 있다.
A-2) 상위 크기 블록의 예측 모드 정보에 기반한 방법
(a) 상위 크기 블록에서의 RMD 수행 후, 작은 SATD 값을 가지는 상위 몇 개의 예측 모드들에 대해서만 하위 블록에서 RMD를 수행한다. 작은 SATD 값을 가지는 상위 예측 모드의 개수는 임의로 지정할 수 있으며, 예컨대 상위 5개, 상위 10개 등으로 지정할 수 있다. 이때, 작은 SATD 값을 가지는 상위 예측 모드는 상위 크기 블록에서 RDO 모드 결정 과정을 수행하는 예측 모드로 지정될 수 있다.
(b) 상위 크기 블록에서 RDO 모드 결정 과정을 수행한 예측 모드들 중 겹쳐지는 모드에 대해서만 하위 블록에서 RMD를 수행한다.
예를 들어, 블록 크기 별 RDO 모드 결정 과정을 수행한 예측 모드 번호가 표 3에 도시된 바와 같은 경우라고 가정하자. 여기서, 표 3의 예측 모드 번호는 도 3에 도시된 예측 모드 방향에 매핑되는 번호이며, MPM은 예측 모드 번호 0과 10인 경우이다.
블록 크기 ROD 모드 결정 과정을 수행한 예측 모드 번호
64x64 2, 4, 6, 8
32x32 6, 8, 9, 14
16x16 3, 6, 8, 9
8x8 0, 1, 2, 3, 6, 8, 9, 12, 14
4x4 1, 2, 3, 6, 10, 11, 13, 15
일예로 표 3을 참조하여 설명하면, 현재 RMD를 수행할 블록이 8x8 블록일 경우, 상위 크기 블록은 16x16, 32x32, 64x64 블록일 수 있다.
이때, 8x8 블록이 상위 크기 블록(16x16, 32x32, 64x64 블록)의 예측 모드 정보를 모두 사용할 경우, A-2)-(a) 방법에서는 예측 모드 번호 2, 3, 4, 6, 8, 9, 14 및 MPM에 해당되는 예측 모드들(예측 모드 번호 0, 10)에 대해서 RMD를 수행할 수 있다. A-2)-(b) 방법에서는 상위 크기 블록(16x16, 32x32, 64x64 블록)에서 중첩되는 예측 모드인 6, 8 및 MPM에 해당되는 예측 모드들(예측 모드 번호 0, 10)에 대해서 RMD를 수행할 수 있다.
또는, 8x8 블록이 상위 크기 블록(16x16, 32x32, 64x64 블록) 중 특정 블록의 예측 모드 정보를 사용할 경우, 16x16, 32x32 및 64x64 블록 중 하나 이상의 블록의 예측 모드 정보를 이용하여 해당 블록에 대한 RMD를 수행할 수 있다. 예컨대, 특정 블록으로 32x32 및 16x16 블록을 이용하는 경우, A-2)-(a) 방법에서는 예측 모드 번호 3, 6, 8, 9, 14 및 MPM에 해당되는 예측 모드들(예측 모드 번호 0, 10)에 대해서 RMD를 수행할 수 있다. A-2)-(b) 방법에서는 32x32 및 16x16 블록에서 중첩되는 모드인 6, 8, 9 및 MPM에 해당되는 예측 모드들(예측 모드 번호 0, 10)에 대해서 RMD를 수행할 수 있다.
A-3) 부호화 비용(예를 들어, SAD, SSE, SATD)을 이용한 방법
다양한 방향성 예측 모드들을 몇 개의 그룹으로 나누고, 각 그룹 내에서 대표 예측 모드를 정하여 대표 예측 모드들에 대해서 부호화 비용을 구한 뒤 가장 작은 부호화 비용을 가지는 대표 예측 모드가 속한 그룹에 대해서 RMD 과정을 수행한다.
예측 모드들을 그룹으로 나누는 방법(Grouping Method)으로는, 1) 예측 모드 번호 순으로 나누는 방법, 2) 주변 블록의 예측 모드 정보를 이용하여 주변 블록의 예측 모드와 인접한 번호의 모드들을 하나의 그룹으로 묶어 분류하는 방법, 3) 상위 블록에서 선택된 최적 예측 모드 정보와 인접한 번호의 모드들을 하나의 그룹으로 묶어 분류하는 방법이 있다.
예시 1) 예측 모드 번호 순으로 나누는 방법은 예컨대, 예측 모드 7개씩 5개의 그룹으로 분류하는 방법, 예측 모드 5개씩 7개의 그룹으로 분류하는 방법 등이 있을 수 있다.
일예로, 예측 모드 7개씩 5개의 그룹으로 분류하는 경우, 0~6번 예측 모드를 1번 그룹으로 결정하고, 1번 그룹의 대표 예측 모드를 3번 예측 모드로 정할 수 있다. 7~13번 예측 모드를 2번 그룹으로 결정하고, 2번 그룹의 대표 예측 모드를 10번 예측 모드로 정할 수 있다. 14~20번 예측 모드를 3번 그룹으로 결정하고, 3번 그룹의 대표 예측 모드를 17번 예측 모드로 정할 수 있다. 21~27번 예측 모드를 4번 그룹으로 결정하고, 4번 그룹의 대표 예측 모드를 24번 예측 모드로 정할 수 있다. 28~34번 예측 모드를 5번 그룹으로 결정하고, 5번 그룹의 대표 예측 모드를 31번 예측 모드로 정할 수 있다.
상기 5개의 그룹 내 각 대표 예측 모드에 대해 RMD를 수행한 후, 가장 작은 부호화 비용(예컨대, SATD 값)을 가지는 대표 예측 모드가 속한 그룹의 예측 모드들에 대해서 RMD를 수행할 수 있다.
예시 2) 주변 블록의 예측 모드 정보를 이용하여 주변 블록의 예측 모드와 인접한 번호의 모드들을 하나의 그룹으로 묶어 분류하는 방법
예를 들어, 도 4의 (a)에 도시된 바와 같이 현재 블록을 기준으로 5개의 참조 가능한 주변 블록들이 있는 경우, 각 주변 블록의 최적 예측 모드를 대표 예측 모드(기준 모드)로 하여 5개의 그룹으로 분류할 수 있다. 표 4는 주변 블록들의 최적 예측 모드 정보를 나타낸 일예이다.
주변 블록 최적 예측 모드
A 7
B 10
C 17
D 20
E 24
5개의 주변 블록들이 표 4에서와 같이 최적 예측 모드를 가지는 경우, 본 예시에서는 각 최적 예측 모드를 기준으로 하여 각 최적 예측 모드의 번호와 인접한 번호를 가지는 6개의 모드들을 하나의 그룹으로 형성하여 다음과 같이 5개의 그룹을 구성하였다. 이때, 하나의 그룹에는 최대 7개의 예측 모드들로 구성되도록 하였다.
- 1번 그룹 : 대표 예측 모드 7 + 나머지 예측 모드 4, 5, 6, 8, 9, 10
- 2번 그룹 : 대표 예측 모드 10 + 나머지 예측 모드 7, 8, 9, 11, 12, 13
- 3번 그룹 : 대표 예측 모드 17 + 나머지 예측 모드 14, 15, 16, 18, 19, 20
- 4번 그룹 : 대표 예측 모드 20 + 나머지 예측 모드 17, 18, 19, 21, 22, 23
- 5번 그룹 : 대표 예측 모드 24 + 나머지 예측 모드 21, 22, 23, 25, 26, 27
상기 5개의 그룹 내 각 대표 예측 모드에 대해 RMD를 수행한 후, 가장 작은 부호화 비용(예컨대, SATD 값)을 가지는 대표 예측 모드가 속한 그룹의 예측 모드들에 대해서 RMD를 수행할 수 있다.
만약, 현재 블록의 참조 가능한 주변 블록이 하나인 경우, 상기 하나의 주변 블록의 예측 모드를 기준으로 인접한 번호를 가지는 소정의 모드들을 하나의 그룹으로 형성하고, 상기 하나의 그룹에 속한 모드들에 대해서 RMD를 수행할 수 있다. 예를 들어, 현재 블록의 참조 가능한 주변 블록이 B이며, 주변 블록 B의 최적 예측 모드가 10인 경우라 하자. 최적 예측 모드 10과 인접한 번호를 가지는 소정의 모드들, 예컨대 최대 16개의 예측 모드들을 포함한다고 할 때, 예측 모드 2~9 및 11~18을 하나의 그룹으로 구성할 수 있으며, 이때 대표 예측 모드는 예측 모드 10으로 결정할 수 있다. 따라서, 예측 모드 2~18에 대해서만 RMD를 수행하면 된다.
예시 3) 상위 블록에서 선택된 최적 예측 모드 정보와 인접한 번호의 모드들을 하나의 그룹으로 묶어 분류하는 방법
예를 들어, 현재 RMD를 수행할 블록이 4x4 블록일 경우, 참조 가능한 상위 크기 블록은 8x8, 16x16, 32x32, 64x64 크기의 4개 블록일 수 있다. 그러므로 4개의 상위 크기 블록 각각의 최적 예측 모드를 대표 예측 모드(기준 모드)로 하여 4개의 그룹으로 분류할 수 있다. 표 5는 상위 크기 블록들의 최적 예측 모드 정보를 나타낸 일예이다.
상위 크기 블록 최적 예측 모드
64x64 7
32x32 10
16x16 17
8x8 20
4개의 상위 크기 블록들이 표 5에서와 같이 최적 예측 모드를 가지는 경우, 본 예시에서는 각 최적 예측 모드를 기준으로 하여 각 최적 예측 모드의 번호와 인접한 번호를 가지는 8개의 모드들을 하나의 그룹으로 형성하여 다음과 같이 4개의 그룹을 구성하였다. 이때, 하나의 그룹에는 최대 9개의 예측 모드들로 구성되도록 하였다.
- 1번 그룹 : 대표 예측 모드 7 + 나머지 예측 모드 3, 4, 5, 6, 8, 9, 10, 11
- 2번 그룹 : 대표 예측 모드 10 + 나머지 예측 모드 6, 7, 8, 9, 11, 12, 13, 14
- 3번 그룹 : 대표 예측 모드 17 + 나머지 예측 모드 13, 14, 15, 16, 18, 19, 20, 21
- 4번 그룹 : 대표 예측 모드 20 + 나머지 예측 모드 16, 17, 18, 19, 21, 22, 23, 24
상기 4개의 그룹 내 각 대표 예측 모드에 대해 RMD를 수행한 후, 가장 작은 부호화 비용(예컨대, SATD 값)을 가지는 대표 예측 모드가 속한 그룹의 예측 모드들에 대해서 RMD를 수행할 수 있다.
만약, 참조 가능한 상위 크기 블록이 하나일 경우, 상기 하나의 상위 크기 블록의 예측 모드를 기준으로 인접한 번호를 가지는 소정의 모드들을 하나의 그룹으로 형성하고, 상기 하나의 그룹에 속한 모드들에 대해서 RMD를 수행할 수 있다. 예를 들어, 현재 블록에 대한 참조 가능한 상위 크기 블록이 32x32 블록이며, 32x32 블록의 최적 예측 모드가 10인 경우라 하자. 최적 예측 모드 10과 인접한 번호를 가지는 소정의 모드들, 예컨대 최대 16개의 예측 모드들을 포함한다고 할 때, 예측 모드 2~9 및 11~18을 하나의 그룹으로 구성할 수 있으며, 이때 대표 예측 모드는 예측 모드 10으로 결정할 수 있다. 따라서, 예측 모드 2~18에 대해서만 RMD를 수행하면 된다.
B) RDO 모드 결정(RDO Mode Decision) 간소화 방법
RDO 모드 결정 과정을 간소화하기 위해서 다음과 같이 부호화 비용을 이용할 수 있다.
B-1) RMD에서 계산된 SATD 값을 이용하는 방법
RMD 과정을 통해 계산된 SATD 값의 평균을 계산하고, 계산된 SATD 값의 평균보다 큰 SATD 값을 가지는 예측 모드에 대해서 RDO 모드 결정 과정을 생략할 수 있다.
표 6은 예측 모드 별 SATD 값과 RDO를 수행할 예측 모드 정보를 나타낸 일예이다.
RDO 모드 결정 순서 RDO를 수행할 예측 모드 예측 모드 별 SATD 예측 모드 별 RD-Cost
1 0 20 100
2 1 30 300
3 4 50 600
4 5 100 1000
5 14 150 2500
평균 70 700
예를 들어, RMD 과정을 통해 계산된 예측 모드 별 SATD 값이 표 6에 도시된 바와 같은 경우, SATD 값들의 평균이 70이므로, SATD 값의 평균보다 큰 SATD 값을 가지는 예측 모드는 5, 14이다. 이러한 경우, 예측 모드 5 및 14에 대한 RDO 모드 결정 과정은 생략할 수 있다.
상술한 SATD 값의 평균을 이용할 수도 있으며, 그 외에 SATD 값에 대한 분산/표준편차 값 등을 이용할 수도 있다. 예컨대, SATD 값에 대한 분산/표준편차 값을 계산하고, 계산된 분산/표준편차의 평균 값보다 큰 값을 가지는 예측 모드에 대해서 RDO 모드 결정 과정을 생략할 수 있다.
B-2) RDO 모드 결정 과정에서 계산되는 율-왜곡 비용(RD-Cost)을 이용하는 방법
RDO 모드 결정 과정에서, 현재 RDO를 수행할 예측 모드와, 현재 예측 모드 이전에 RDO를 수행한 적어도 하나의 예측 모드에 대한 율-왜곡 비용이 증가하는 형태일 경우, 현재 예측 모드 이후에 RDO를 수행할 나머지 예측 모드들에 대해서 RDO 모드 결정 과정을 생략할 수 있다.
예를 들어, RDO 모드 결정 순서 및 예측 모드 별 율-왜곡 비용이 표 6에 도시된 바와 같으며, 현재 RDO 모드 결정 과정을 수행할 순서가 3번일 경우, 현재 RDO를 수행할 예측 모드(예측 모드 4)와, 현재 예측 모드 이전에 RDO를 수행한 2개의 예측 모드(예측 모드 0, 1)의 율-왜곡 비용은 100 -> 300 -> 600 순으로 계속 증가하는 방향으로 나간다. 이 경우, 남은 예측 모드 5와 14에 대한 RDO 모드 결정 과정은 생략할 수 있다.
도 5는 본 발명의 실시예에 따른 영상 부호화에서의 화면 내 예측 방법을 개략적으로 나타내는 순서도이다. 도 5의 방법은 상술한 도 1의 영상 부호화 장치에서 수행될 수 있다.
도 5를 참조하면, 부호화 장치는 화면 내 예측을 수행하는 현재 블록의 주변 블록 및 현재 블록의 크기보다 큰 상위 블록 중 적어도 하나의 부호화 정보를 이용하여, 현재 블록에 대해 화면 내 예측을 수행할 후보 예측 모드를 결정한다(S500).
이때, 부호화 장치는 주변 블록의 최적 예측 모드 정보, 주변 블록의 예측 모드의 부호화 비용 정보, 상위 블록의 최적 예측 모드 정보, 상위 블록의 예측 모드의 부호화 비용 정보를 이용하여 현재 블록에 대한 후보 예측 모드를 결정할 수 있다.
예를 들어, 부호화 장치는 주변 블록의 최적 예측 모드 및 MPM 모드를 현재블록의 후보 예측 모드로 결정할 수 있다. 또는, 부호화 장치는 상위 블록의 부호화 과정에서 계산된 상위 블록의 예측 모드들에 대한 부호화 비용(예컨대, SATD)을 기반으로 현재 블록의 후보 예측 모드를 결정할 수 있다. 또는, 상위 블록이 하나 이상일 경우, 부호화 장치는 하나 이상의 상위 블록에서 중첩되는 예측 모드들을 현재 블록의 후보 예측 모드로 결정할 수 있다. 또는, 부호화 장치는 예측 모드들을 그룹으로 나누고, 각 그룹 내에서 대표 예측 모드를 정하여 대표 예측 모드들에 대해서 부호화 비용을 구한 뒤, 가장 작은 부호화 비용을 가지는 대표 예측 모드가 속한 그룹의 예측 모드들을 현재 블록의 후보 예측 모드로 결정할 수 있다.
부호화 장치는, 상기와 같이 결정된 현재 블록의 후보 예측 모드들에 대해서 러프 모드 결정 과정을 수행할 수 있다. 따라서, 본 발명에서는 모든 예측 모드들에 대해서 러프 모드 결정 과정을 수행하는 것이 아니라, 후보 예측 모드에 대해서만 러프 모드 결정 과정을 수행하면 되므로 부호화 과정에서의 복잡도를 줄일 수 있다.
현재 블록의 후보 예측 모드를 결정하는 구체적인 방법은 본 명세서의 러프 모드 결정 간소화 방법의 실시예들에서 상세히 설명한 바와 같다.
부호화 장치는 후보 예측 모드를 기반으로 현재 블록에 대한 최적 예측 모드를 결정한다(S510).
보다 구체적으로, 부호화 장치는 후보 예측 모드의 부호화 비용의 평균 값 및 후보 예측 모드 간의 부호화 비용 증가율 중 적어도 하나를 이용하여, 후보 예측 모드로부터 최종 후보 예측 모드를 결정한다. 그리고, 최종 후보 예측 모드의 부호화 비용을 기반으로 현재 블록의 최적 예측 모드를 결정한다.
예를 들어, 부호화 장치는 후보 예측 모드의 부호화 비용(예를 들어, SATD)의 평균을 구하고, 상기 평균보다 큰 부호화 비용을 가지는 후보 예측 모드를 제외한 나머지 후보 예측 모드(즉, 상기 평균 혹은 상기 평균보다 작은 부호화 비용을 가지는 후보 예측 모드)를 최종 후보 예측 모드로 결정할 수 있다. 또는, 부호화 장치는 소정의 후보 예측 모드들 간의 부호화 비용(예를 들어, RD-Cost)이 증가하는 방향으로 나가는 경우, 상기 소정의 후보 예측 모드들을 최종 후보 예측 모드로 결정할 수 있다.
부호화 장치는, 상기와 같이 결정된 현재 블록의 최종 후보 예측 모드들에 대해서 RDO 모드 결정 과정을 수행할 수 있다. 따라서, 본 발명의 실시예에서는 RDO 모드 결정 과정을 수행할 예측 모드의 수를 줄일 수 있으므로 부호화 과정에서의 복잡도가 감소될 수 있다.
현재 블록의 최종 후보 예측 모드를 결정하는 구체적인 방법은 본 명세서의 RDO 모드 결정 간소화 방법의 실시예들에서 상세히 설명한 바와 같다.
부호화 장치는 최종 후보 예측 모드들에 RDO 모드 결정 과정을 수행하고, 이로부터 도출된 최소 율-왜곡 비용을 가지는 예측 모드를 현재 블록의 최적 예측 모드로 결정할 수 있다. 그리고, 부호화 장치는 최적 예측 모드를 이용하여 현재 블록에 대한 화면 내 예측을 수행할 수 있다.
상술한 실시예들에서, 방법들은 일련의 단계 또는 블록으로서 순서도를 기초로 설명되고 있으나, 본 발명은 단계들의 순서에 한정되는 것은 아니며, 어떤 단계는 상술한 바와 다른 단계와 다른 순서로 또는 동시에 발생할 수 있다. 또한, 당해 기술 분야에서 통상의 지식을 가진 자라면 순서도에 나타난 단계들이 배타적이지 않고, 다른 단계가 포함되거나, 순서도의 하나 또는 그 이상의 단계가 본 발명의 범위에 영향을 미치지 않고 삭제될 수 있음을 이해할 수 있을 것이다.
이상의 설명은 본 발명의 기술 사상을 예시적으로 설명한 것에 불과한 것으로서, 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자라면 본 발명의 본질적인 특성에서 벗어나지 않는 범위에서 다양한 수정 및 변형이 가능할 것이다. 따라서, 본 발명에 개시된 실시 예들은 본 발명의 기술 사상을 한정하기 위한 것이 아니라 설명하기 위한 것이고, 이러한 실시 예에 의하여 본 발명의 기술 사상의 범위가 한정되는 것은 아니다. 본 발명의 보호범위는 특허청구범위에 의하여 해석되어야 하며, 그와 동등한 범위 내에 있는 모든 기술 사상은 본 발명의 권리범위에 포함되는 것으로 해석되어야 할 것이다.

Claims (1)

  1. 화면 내 예측을 수행하는 현재 블록의 주변 블록 및 상기 현재 블록의 크기보다 큰 상위 블록 중 적어도 하나의 부호화 정보를 이용하여, 상기 현재 블록에 대해 화면 내 예측을 수행할 후보 예측 모드를 결정하는 단계; 및
    상기 후보 예측 모드를 기반으로 상기 현재 블록에 대한 최적 예측 모드를 결정하는 단계를 포함하며,
    상기 후보 예측 모드를 결정하는 단계는,
    상기 주변 블록의 최적 예측 모드 정보, 상기 주변 블록의 예측 모드의 부호화 비용 정보, 상기 상위 블록의 최적 예측 모드 정보 및 상기 상위 블록의 예측 모드의 부호화 비용 정보 중 적어도 하나를 이용하여 상기 후보 예측 모드를 결정하며,
    상기 최적 예측 모드를 결정하는 단계는,
    상기 후보 예측 모드의 부호화 비용의 평균 값 및 상기 후보 예측 모드 간의 부호화 비용 증가율 중 적어도 하나를 이용하여 상기 후보 예측 모드로부터 최종 후보 예측 모드를 결정하는 단계; 및
    상기 최종 후보 예측 모드의 부호화 비용을 기반으로 상기 최적 예측 모드를 결정하는 단계를 포함하는 것을 특징으로 하는 영상 부호화에서의 화면 내 예측 방법.
KR1020140016350A 2014-02-13 2014-02-13 영상 부호화에서의 화면 내 예측 방법 및 장치 KR20150095253A (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020140016350A KR20150095253A (ko) 2014-02-13 2014-02-13 영상 부호화에서의 화면 내 예측 방법 및 장치

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020140016350A KR20150095253A (ko) 2014-02-13 2014-02-13 영상 부호화에서의 화면 내 예측 방법 및 장치

Publications (1)

Publication Number Publication Date
KR20150095253A true KR20150095253A (ko) 2015-08-21

Family

ID=54058309

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020140016350A KR20150095253A (ko) 2014-02-13 2014-02-13 영상 부호화에서의 화면 내 예측 방법 및 장치

Country Status (1)

Country Link
KR (1) KR20150095253A (ko)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2018062788A1 (ko) * 2016-09-30 2018-04-05 엘지전자(주) 인트라 예측 모드 기반 영상 처리 방법 및 이를 위한 장치
JP2021153313A (ja) * 2020-06-30 2021-09-30 ベイジン バイドゥ ネットコム サイエンス アンド テクノロジー カンパニー リミテッド 画像コーディング処理方法、装置、機器及び媒体
WO2024067036A1 (zh) * 2022-09-26 2024-04-04 广州市百果园信息技术有限公司 帧内预测模式的决策方法、装置及视频编码设备

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2018062788A1 (ko) * 2016-09-30 2018-04-05 엘지전자(주) 인트라 예측 모드 기반 영상 처리 방법 및 이를 위한 장치
US10812795B2 (en) 2016-09-30 2020-10-20 Lg Electronic Inc. Method for processing picture based on intra-prediction mode and apparatus for same
JP2021153313A (ja) * 2020-06-30 2021-09-30 ベイジン バイドゥ ネットコム サイエンス アンド テクノロジー カンパニー リミテッド 画像コーディング処理方法、装置、機器及び媒体
WO2024067036A1 (zh) * 2022-09-26 2024-04-04 广州市百果园信息技术有限公司 帧内预测模式的决策方法、装置及视频编码设备

Similar Documents

Publication Publication Date Title
KR102634794B1 (ko) 영상 부호화/복호화 방법 및 장치
KR102379174B1 (ko) 영상 부호화/복호화 방법 및 이를 위한 기록 매체
KR102283517B1 (ko) 영상 부호화/복호화 방법, 장치 및 비트스트림을 저장한 기록 매체
JP7198268B2 (ja) 画像復号化方法、画像符号化方法及びコンピュータ可読記録媒体
KR101718954B1 (ko) 영상 부호화/복호화 방법 및 그 장치
KR20170058838A (ko) 화면간 예측 향상을 위한 부호화/복호화 방법 및 장치
KR20170007069A (ko) 파노라믹 비디오의 왜곡보정 방법 및 장치
KR20210065063A (ko) 영상 부호화/복호화 방법, 장치 및 비트스트림을 저장한 기록 매체
KR101768173B1 (ko) 영상 부호화에서의 화면 내 예측 생략 방법 및 장치
KR20210035062A (ko) 영상 부호화/복호화 방법, 장치 및 비트스트림을 저장한 기록 매체
KR20150095253A (ko) 영상 부호화에서의 화면 내 예측 방법 및 장치
KR20200145761A (ko) 영상 부호화/복호화 방법 및 장치
KR20210003604A (ko) 화면내 예측 방법 및 장치
KR20130083405A (ko) 디블록킹 필터링 방법 및 그 장치
KR102634795B1 (ko) 영상 부호화/복호화 방법 및 장치
KR20140120396A (ko) 영상의 고속 부호화를 위한 방법
KR20150116338A (ko) 움직임 예측 방법 및 장치

Legal Events

Date Code Title Description
WITN Withdrawal due to no request for examination