KR20100080792A - 기하학적으로 분할된 쌍방 예측 모드 분할들을 비디오 인코딩 및 디코딩하기 위한 방법 및 장치 - Google Patents

기하학적으로 분할된 쌍방 예측 모드 분할들을 비디오 인코딩 및 디코딩하기 위한 방법 및 장치 Download PDF

Info

Publication number
KR20100080792A
KR20100080792A KR1020107007666A KR20107007666A KR20100080792A KR 20100080792 A KR20100080792 A KR 20100080792A KR 1020107007666 A KR1020107007666 A KR 1020107007666A KR 20107007666 A KR20107007666 A KR 20107007666A KR 20100080792 A KR20100080792 A KR 20100080792A
Authority
KR
South Korea
Prior art keywords
geometric
predictors
mode
prediction
modes
Prior art date
Application number
KR1020107007666A
Other languages
English (en)
Other versions
KR101555617B1 (ko
Inventor
펭 인
에스코다 오스카 디볼라
Original Assignee
톰슨 라이센싱
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 톰슨 라이센싱 filed Critical 톰슨 라이센싱
Publication of KR20100080792A publication Critical patent/KR20100080792A/ko
Application granted granted Critical
Publication of KR101555617B1 publication Critical patent/KR101555617B1/ko

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/577Motion compensation with bidirectional frame interpolation, i.e. using B-pictures
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/109Selection of coding mode or of prediction mode among a plurality of temporal predictive coding modes
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/13Adaptive entropy coding, e.g. adaptive variable length coding [AVLC] or context adaptive binary arithmetic coding [CABAC]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/46Embedding additional information in the video signal during the compression process
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/537Motion estimation other than block-based
    • H04N19/543Motion estimation other than block-based using regions
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

기하학적으로 분할된 쌍방 예측 모드 분할을 비디오 인코딩 및 디코딩하기 위한 방법 및 장치가 제공된다. 장치는 적응 기하학적 분할법을 사용하여 화상의 적어도 한 부분에 관한 쌍방 예측 가능 화상 데이터를 인코딩하기 위한 인코더(300)를 포함한다. 적응 기하학적 분할법을 위한 기하학적 분할은, 기준 화상들의 제 1 목록에 대응하는 예측기들의 제 1 세트, 기준 화상들의 제 2 목록에 대응하는 예측기들의 제 2 세트, 및 제 1 세트와 제 2 세트 중 적어도 하나로부터의 예측기들을 포함하고 쌍방 예측을 위해 사용된 예측기들의 제 3 세트로부터 선택된 적어도 하나의 예측기를 사용하여 예측된다.

Description

기하학적으로 분할된 쌍방 예측 모드 분할들을 비디오 인코딩 및 디코딩하기 위한 방법 및 장치{METHODS AND APPARATUS FOR VIDEO ENCODING AND DECODING GEOMETRICALLY PARTITIONED BI-PREDICTIVE MODE PARTITIONS}
관련 출원들에 대한 상호 참조
본 출원은, 2007년 10월 12일에 출원된, 미국 가특허 출원 일련번호 60/979,586의 이익을 주장하며, 상기 출원은 그 전체가 본 명세서에 참조로서 통합된다.
본 발명은 일반적으로 비디오 인코딩과 비디오 디코딩에 관한 것이며, 더욱 상세하게는, 기하학적으로 분할된 쌍방 예측 모드 분할들을 비디오 인코딩 및 디코딩하기 위한 방법 및 장치에 관한 것이다.
트리-구조의(tree-structured) 매크로블록 분할법이 현재 주된 비디오 코딩 표준들에서 채택되고 있다. ITU-T(International Telecommunication Union, Telecommunication) 섹터 H.261 권고안(이후, "H.261 권고안"이라고 함), ISO/IEC(International Organization for Standardization/International Electrotechnical Commission) MPEG(Moving Picture Experts Group)-1 표준(이후, "MPEG-1 표준"이라고 함), 및 ISO/IEC MPEG-2 표준/ITU-T H.263 권고안(이후, "MPEG-2 표준"이라고 함)은 16 ×16 MB(macroblock) 분할들만을 지원한다. ISO/IEC MPEG-4 파트(Part) 2 간단한 프로파일 또는 ITU-T H.263(+) 권고안은 16 ×16 MB에 관한 16 ×16 분할과 8 ×8 분할 모두를 지원한다. MPEG-4 AVC 표준은 트리-구조의 계층적 매크로블록 분할들을 지원한다. 16 ×16 매크로블록은 16 ×8, 8 ×16 또는 8 ×8의 크기를 가지는 매크로블록 분할들로 분할될 수 있다. 8 ×8 분할들은 또한 하위-매크로블록(sub-macroblock)들로 알려져 있다. 하위-매크로블록은 크기가 8 ×4, 4 ×8, 및 4 ×4인 하위-매크로블록 분할들로 더 분할될 수 있다.
예측(P: predictive) 프레임들 또는 쌍방-예측(B: bi-predictive) 프레임들이 인코딩되는지에 따라, 상이한 예측 구성이 트리-기반의 분할들을 사용하여 가능하다. 이들 예측 구성은 MPEG-4 AVC 표준 코더(coder) 및/또는 디코더에서 이용 가능한 코딩 모드들을 한정한다. P 프레임들은 기준 프레임들의 제 1 목록으로부터의 시간(temporal) 예측을 허용하는데 반해, B 프레임들은 블록 분할들에서 역방향/순방향/양방-예측을 위해, 기준 프레임들의 2가지 목록들까지의 사용을 허용한다. 더 일반적으로는, 임의의 방향을 명시하지 않는다. 대신, P 프레임들은 LIST 0으로부터 예측하고, B 프레임들은 LIST 0, LIST 1 또는 LIST 0 및 LIST 1로부터의 예측을 허용한다. 간단하게 하기 위해, 후속하는 본문에서는 LIST 0 예측을 위한 순방향 예측, LIST 1 예측을 위한 역방향 예측, 및 LIST 0와 LIST 1 예측 모두를 위한 쌍방-예측을 간단히 참조한다. 예컨대, P 프레임과 B 프레임에 관한 이들 코딩 모드들의 예는 다음의 것을 포함한다.
P-프레임:
Figure pct00001
B-프레임:
Figure pct00002
여기서, "FWD"란 순방향 예측 목록 또는 목록 0으로부터의 예측을 나타내고, "BKW"란 역방향 예측 목록 또는 목록 1로부터의 예측을 나타내며, "BI"는 순방향 목록과 역방향 목록 모두로부터의 쌍방 예측을 나타내고, "FWD-FWD"는 순방향 예측 목록으로부터의 2가지 예측 각각을 나타내며, "FWD-BKW"는 순방향 예측 목록으로부터의 제 1 예측과 역방향 예측 목록으로부터의 제 2 예측을 나타낸다.
MPEG-4 AVC 표준에서의 프레임 분할은 MPEG-2와 같은 더 오래된 비디오 코딩 표준들에서 통상적으로 사용된 간단한 균일한 블록 분할보다 더 효율적이다. 하지만, 트리 기반의 프레임 분할법은 결함이 없지는 않은데, 이는 그것이 일부 코딩 시나리오에서는 2차원 데이터의 기하학적 구조를 획득할 수 없으므로 인해서 비효율적이기 때문이다. 그러한 한계를 해결하기 위해, 2차원 기하학적 구조를 고려함으로써, 2차원 비디오 데이터를 더 잘 묘사하고 코딩하기 위한 종래 기술의 방법(이후 "종래 기술 방법"이라고 함)이 소개되었다. 종래 기술의 방법은 인터(inter)(INTER 16 ×16GEO, INTER 8 ×8GEO) 예측과 인트라(intra) 예측(INTRA 16 ×16GEO, INTRA 8 ×8GEO) 모두를 위한 모드들의 새로운 세트에서 쐐기(wedge) 분할들을 이용한다(즉, 블록을 임의의 선 또는 곡선에 의해 분리되는 2개의 구역들로 분할).
종래 기술의 방법의 일 구현예에서는, MPEG-4 AVC 표준이 기하학적 분할 모드를 통합하기 위한 기초로서 사용된다. 블록들 내의 기하학적 분할들은 선의 암시적인 형식화에 의해 모델링된다. 도 1을 참조하면, 이미지 블록의 예시적인 기하학적 분할법이 일반적으로 참조 번호 100으로 표시되어 있다. 전체 이미지 블록이 일반적으로 참조 번호 120으로 표시되고, 대각선(150)의 반대 측에 위치하는 이미지 블록(120)의 2개의 분할이 일반적으로 각각 참조 번호 130과 140으로 표시되어 있다.
따라서, 분할들은 다음과 같이 한정된다.
Figure pct00003
여기서
Figure pct00004
는 각각 원점으로부터 f(x,y)에 직교 방향으로 경계선 f(x,y)까지의 거리와, f(x,y)에 직교하는 방향과 수평 좌표축(x)의 각도를 표시한다.
그것의 형식화로부터 당연히 더 높은 차수의 기하학적 파라미터들에 대해 f(x,y)에 관한 더 많은 연좌된 모델들이 또한 고려된다.
각각의 블록 픽셀(x,y)은
Figure pct00005
과 같이 분류된다.
코딩 목적들을 위해, 가능한 분할들(또는 기하학적 모드들)의 사전이 선험적으로 한정된다. 이는
Figure pct00006
그리고
Figure pct00007
와 같이 공식으로 한정될 수 있다.
여기서,
Figure pct00008
는 선택된 양자화(파라미터 해결) 단계들이다. θ와 ρ에 관한 양자화된 지수는 가장자리를 코딩하기 위해 송신된 정보이다. 하지만, 코딩 절차에서 16 ×8과 8 ×16이 사용된다면, ρ=0의 경우 각도 0과 90이 가능한 가장자리들의 세트로부터 제거될 수 있다.
종래 기술의 방법 내에서는, 기하학적 적응 움직임 보상 모드에 관해, θ와 ρ그리고 각각의 분할에 관한 움직임 벡터들에 대한 검색이 최상의 구성을 찾기 위해 수행된다. 최상의 움직임 벡터들이 검색되는 모든 θ와 ρ쌍에 관해 완전한 검색 전략이 2가지 단계를 통해 이루어진다. 기하학적-적응 인트라 예측 모드 내에서는, θ와 ρ그리고 각각의 분할에 관한 최상의 예측기(지향성 예측 또는 전략 등)에 대한 검색이 최상의 구성을 찾기 위해 수행된다.
도 2를 참조하면, 기하학적 적응 직선으로 분할된 예시적인 INTER-P 이미지 블록이 일반적으로 참조 번호 200으로 표시되어 있다. 전반적인 이미지 블록은 참조 번호 220으로 표시되어 있고, 이미지 블록(220)의 2개의 분할이 각각 일반적으로 참조 번호 230과 240으로 표시되어 있다.
블록의 예측 보상은 P 모드들의 경우 다음과 같이 나타낼 수 있다.
Figure pct00009
여기서,
Figure pct00010
는 현재 예측이고
Figure pct00011
Figure pct00012
는 각각 분할(P2,P1)에 관한 블록 움직임 보상된 기준들이다. 각각의
Figure pct00013
는 각 분할들에 관한 각각의 픽셀(x,y)에 관한 기여 가중치(weight)를 포함한다. 분할 경계에 있지 않은 픽셀들은 일반적으로 임의의 동작을 필요로 하지 않는다. 실제로, 마스크 값은 1 또는 0이다. 분할 경계에 가까운 픽셀들만이 기준들 모두로부터의 예측 값들을 결합할 필요가 있을 수 있다.
그러므로, 기하학적 적응 블록 분할을 사용하는 인터 예측이 코딩 효율 향상에 대한 유망한 연구 방향으로서 인식되어 왔지만, 이들의 현재 구현예들은 INTER-P 프레임들에 제한되어 왔다.
종래 기술의 이들 및 다른 결점 및 단점이 본 발명의 원리들에 의해 다루어지고, 이러한 본 발명의 원리들은 기하학적으로 분할된 쌍방 예측 모드 분할들을 비디오 인코딩 및 디코딩하기 위한 방법 및 장치에 관한 것이다.
본 발명의 원리들의 일 양상에 따르면, 장치가 제공된다. 이 장치는 적응 기하학적 분할법(adaptive geometric partitioning)을 사용하여 화상의 적어도 한 부분에 관한 쌍방 예측 가능(bi-predictable) 화상 데이터를 인코딩하기 위한 인코더를 포함한다. 적응 기하학적 분할법에 관한 기하학적 분할은, 기준 화상들의 제 1 목록에 대응하는 예측기들의 제 1 세트, 기준 화상들의 제 2 목록에 대응하는 예측기들의 제 2 세트, 및 상기 제 1 세트와 제 2 세트 중 적어도 하나로부터의 예측기를 포함하고 쌍방 예측을 위해 사용된 예측기들의 제 3 세트로부터 선택된 적어도 하나의 예측기를 사용하여 예측된다.
본 발명의 원리들의 또 다른 양상에 따르면, 방법이 제공된다. 이 방법은 적응 기하학적 분할법을 사용하여 화상의 적어도 한 부분에 관한 쌍방 예측 가능 화상 데이터를 인코딩하는 단계를 포함한다. 이러한 적응 기하학적 분할법에 관한 기하학적 분할은, 기준 화상들의 제 1 목록에 대응하는 예측기들의 제 1 세트, 기준 화상들의 제 2 목록에 대응하는 예측기들의 제 2 세트, 및 상기 제 1 세트와 제 2 세트 중 적어도 하나로부터의 예측기를 포함하고 쌍방 예측을 위해 사용된 예측기들의 제 3 세트로부터 선택된 적어도 하나의 예측기를 사용하여 예측된다.
본 발명의 원리들의 또 다른 양상에 따르면, 장치가 제공된다. 이 장치는 적응 기하학적 분할법을 사용하여 화상의 적어도 한 부분에 관한 쌍방 예측 가능 화상 데이터를 디코딩하기 위한 디코더를 포함한다. 이러한 적응 기하학적 분할법에 관한 기하학적 분할은, 기준 화상들의 제 1 목록에 대응하는 예측기들의 제 1 세트, 기준 화상들의 제 2 목록에 대응하는 예측기들의 제 2 세트, 및 상기 제 1 세트와 제 2 세트 중 적어도 하나로부터의 예측기를 포함하고 쌍방 예측을 위해 사용된 예측기들의 제 3 세트로부터 선택된 적어도 하나의 예측기를 사용하여 예측된다.
본 발명의 원리들의 또 다른 양상에 따르면, 방법이 제공된다. 이 방법은 적응 기하학적 분할법을 사용하여 화상의 적어도 한 부분에 관한 쌍방 예측 가능 화상 데이터를 디코딩하는 단계를 포함한다. 이러한 적응 기하학적 분할법에 관한 기하학적 분할은, 기준 화상들의 제 1 목록에 대응하는 예측기들의 제 1 세트, 기준 화상들의 제 2 목록에 대응하는 예측기들의 제 2 세트, 및 상기 제 1 세트와 제 2 세트 중 적어도 하나로부터의 예측기를 포함하고 쌍방 예측을 위해 사용된 예측기들의 제 3 세트로부터 선택된 적어도 하나의 예측기를 사용하여 예측된다.
본 발명의 이들 및 다른 양상, 특징, 장점은 첨부 도면과 관련하여 읽혀질 예시적 실시예들의 후속하는 상세한 설명으로부터 명백해 질 것이다.
본 발명은 다음의 예시적인 도면들에 따라서 더욱 잘 이해될 수 있다.
본 발명을 이용함으로써, 기하학적으로 분할된 쌍방 예측 모드 분할들을 비디오 인코딩 및 디코딩할 수 있다.
도 1은 이미지 블록의 예시적인 기하학적 분할을 도시하는 도면.
도 2는 기하학적 적응 직선으로 분할된 예시적인 INTER-P 이미지 블록을 도시하는 도면.
도 3은 본 발명의 원리들의 일 실시예에 따라 본 발명의 원리들이 적용될 수 있는 예시적인 인코더에 관한 블록도.
도 4는 본 발명의 원리들의 일 실시예에 따라 본 발명의 원리들이 적용될 수 있는 예시적인 디코더에 관한 블록도.
도 5는 본 발명의 원리들의 일 실시예에 따라 기하학적 적응 직선으로 분할된 예시적인 INTER-B 블록을 도시하는 도면.
도 6은 MPEG-4 AVC 표준의 상황 적응 2진 산술 코딩(CABAC: context adaptive binary arithmetic coding)을 따르는 16 ×16, 16 ×8, 8 ×16, 8 ×8, 8 ×4, 4 ×8, 4 ×4에 관한 B-프레임 2진 코드 구조와, CABAC에 관한 인트라 모드들을 도시하는 도면.
도 7은 본 발명의 원리들의 일 실시예를 따르는, 16 ×16, 16 ×8, 8 ×16, 16 ×16GEO, 8 ×8, 8 ×4, 4 ×8, 8 ×8GEO, 4 ×4에 관한 예시적인 B-프레임 2진 코드 구조와, B-프레임들에 대한 기하학적 적응 블록 분할을 따르는 MPEG-4 AVC 표준 CABAC의 확장된 버전에 관한 인트라 모드들 CABAC을 도시하는 도면.
도 8은 본 발명의 원리들의 일 실시예를 따르는, 인코더에서 최상의 기하학적 모드에 관한 검색을 수행하기 위한 예시적인 방법에 관한 흐름도.
도 9는 본 발명의 원리들의 일 실시예를 따르는, 기하학적으로 분할된 쌍방 예측 모드 분할들을 사용하는 비디오 인코딩에 관한 예시적인 방법에 관한 흐름도.
도 10은 본 발명의 원리들의 일 실시예를 따르는, 기하학적으로 분할된 쌍방 예측 모드 분할들을 사용하는 비디오 인코딩에 관한 예시적인 방법에 관한 흐름도.
본 발명의 원리들은 기하학적으로 분할된 쌍방 예측 모드 분할들을 비디오 인코딩 및 디코딩하기 위한 방법 및 장치에 관한 것이다.
본 설명은 본 발명을 설명한다. 그러므로 당업자가, 본 명세서에 명시적으로 기재되거나 도시되지 않았으나, 본 발명을 구현하며 본 발명의 사상 및 범위 내에 포함되는, 다양한 장치를 안출하는 것이 가능할 것이라는 것이 이해될 것이다.
본 명세서에 상술된 모든 예시들 및 조건적 언어는 해당 기술을 진전시키기 위해 본 발명자에 의해 공헌된 본 발명의 원리 및 개념을 독자가 이해하는 것을 돕기 위한 교육적인 목적을 위한 것이며, 그러한 특정하게 상술한 예시들 및 조건들로 제한되지 않는 것으로 해석되어야 한다.
또한, 본 명세서에서 본 발명의 원리, 양상, 및 실시예들, 그리고 본 발명의 특정 예시들을 상술하는 모든 설명은, 본 발명의 구조적 그리고 기능적 등가물들을 모두 포함하도록 의도되었다. 또한, 그러한 등가물들은 현재 알려진 등가물 및 미래에 개발될 등가물 모두, 즉, 구조에 관계없이 동일한 기능을 수행하도록 개발되는 임의의 요소를 포함하도록 의도된다.
그러므로, 예컨대, 본 명세서에 제공된 블록도는 본 발명을 구현하는 예시적 회로의 개념적 개관을 나타낸다는 것이 당업자에 의해 이해될 것이다. 마찬가지로, 임의의 순서도, 흐름도, 상태 전이도, 의사 코드(pseudocode), 그리고 이와 유사한 것들은, 실질적으로 컴퓨터 판독 가능한 매체로 제공될 수 있고 따라서, 컴퓨터 또는 프로세서가 명시적으로 도시되어있든지 그렇지 않든지 간에, 컴퓨터 또는 프로세서에 의해 실행될 수 있는 다양한 프로세스들을 나타낸다는 것이 이해될 것이다.
도면들에 도시된 다양한 요소들의 기능들은 전용 하드웨어의 이용 및, 적절한 소프트웨어와 결합하여 소프트웨어를 실행할 수 있는 하드웨어의 이용을 통해 제공될 수도 있다. 프로세서에 의해 제공될 때, 단일의 전용 프로세서에 의해, 단일의 공유된 프로세서에 의해, 또는 일부가 공유될 수 있는 복수의 개별적인 프로세서에 의해 기능들이 제공될 수도 있다. 또한, 용어 "프로세서(processor)" 또는 "제어기(controller)"의 명시적인 사용은 소프트웨어를 실행할 수 있는 하드웨어를 배타적으로 지칭하는 것으로 해석되어서는 안 되며, 이들은, 제한 없이, 디지털 신호 프로세서("DSP") 하드웨어, 소프트웨어를 저장하기 위한 판독-전용 메모리("ROM"), 랜덤 액세스 메모리("RAM"), 그리고 비-휘발성 저장 장치를 암묵적으로 포함할 수도 있다.
종래의 및/또는 맞춤화된 다른 하드웨어가 또한 포함될 수도 있다. 마찬가지로, 도면들에 도시된 임의의 스위치들은 오직 개념적인 것이다. 그러한 스위치들의 기능은 프로그램 로직의 동작을 통해, 전용 로직을 통해, 프로그램 제어와 전용 로직의 상호작용을 통해, 또는 심지어 수동으로 수행될 수도 있으며, 문맥으로부터 더욱 특정하게 이해되는 것과 같이, 특정 기술은 구현자에 의해 선택될 수 있다.
본 명세서의 청구항들에서, 특정 기능을 수행하는 수단으로 표현된 임의의 요소들은, 예컨대, a) 그러한 기능을 수행하는 회로 요소들의 결합 또는 b) 그러한 기능을 수행하기 위한 소프트웨어를 실행시키기 위한 적절한 회로와 결합된 펌웨어, 마이크로코드 또는 이와 유사한 것들을 포함하는, 임의의 형태의 소프트웨어를 포함하는, 그러한 기능을 수행하기 위한 임의의 방법을 포함하도록 의도되었다. 그러한 청구항들에 의해 한정되는 본 발명은, 다양한 상술한 수단들에 의해 제공되는 기능이 그러한 청구항들이 청구하는 방식으로 결합되며 모아질 수 있다는 사실에 존재한다. 그러므로, 그러한 기능들을 제공할 수 있는 임의의 수단은 본 명세서에 도시된 수단들과 등가인 것으로 간주된다.
본 명세서에서, 본 발명의 "하나의 실시예" 또는 "일 실시예"를 언급하는 것은, 그러한 실시예와 관련되어 설명되는 특정한 특징, 구조, 특성 등이 본 발명의 적어도 한 실시예에 포함된다는 것을 의미한다. 그러므로, 본 명세서 전반에 걸쳐서 다양한 위치에 나타나는 "일 실시예에서" 또는 "하나의 실시예에서"라는 구절의 출현은 반드시 모두 동일한 실시예를 언급하는 것은 아니다.
"A 및/또는 B"와 "A와 B 중 적어도 하나"의 경우에서와 같이 "및/또는(and/or)"과 "중 적어도 하나"의 사용은 첫 번째로 열거된 옵션(A)만의 선택, 또는 두 번째로 열거된 옵션(B)만의 선택, 또는 옵션(A와 B) 모두의 선택을 포함하는 것으로 의도된다는 점을 알아야 한다. 또 다른 예로서, "A,B, 및/또는 C"와 "A,B, 및 C 중 적어도 하나"의 경우들에서, 그러한 어법은 첫 번째 열거된 옵션(A)만의 선택, 또는 두 번째 열거된 옵션(B)만의 선택, 또는 세 번째 열거된 옵션(C)만의 선택, 또는 첫 번째 및 두 번째 열거된 옵션들(A,B)만의 선택, 또는 첫 번째 및 세 번째 열거된 옵션(A,C)만의 선택, 또는 두 번째 및 세 번째 열거된 옵션(B,C)만의 선택, 또는 3개의 옵션(A,B,C) 전부의 선택을 포함하는 것으로 의도된다. 이는 당업자에게 바로 명백해 지듯이, 열거된 많은 항목에 관해 확장될 수 있다.
또한, 본 발명의 원리들의 하나 이상의 실시예가 MPEG-4 AVC 표준에 관해 본 명세서에서 설명되지만, 본 발명의 원리들은 이러한 표준에만 제한되지 않고, 따라서 본 발명의 원리들이 취지를 유지하면서, MPEG-4 AVC 표준의 확장을 포함하여, 다른 비디오 코딩 표준, 권고안, 및 그 확장에 관해 이용될 수 있다는 점을 알아야 한다.
도 3을 참조하면, MPEG-4 AVC 표준에 따라 비디오 인코딩을 수행할 수 있는 비디오 인코더가 일반적으로 참조 번호 300으로 표시되어 있다.
이 비디오 인코더(300)는 결합기(385)의 비반전 입력과 교신하는 출력을 가지는 프레임 배열 버퍼(310)를 포함한다. 결합기(385)의 출력은 기하학적 확장부를 구비한 변환기 및 양자화기(325)의 제 1 입력과 교신하도록 연결된다. 기하학적 확장부를 구비한 변환기 및 양자화기(325)의 출력은 기하학적 확장부를 구비한 엔트로피 코더(345)의 제 1 입력과, 기하학적 확장부를 구비한 역 변환기 및 역 양자화기(350)의 제 1 입력과 교신하도록 연결된다. 기하학적 확장부를 구비한 엔트로피 코더(345)의 출력은 결합기(390)의 제 1 비반전 입력과 교신하도록 연결된다. 결합기(390)의 출력은 출력 버퍼(335)의 제 1 입력과 교신하도록 연결된다.
기하학적 확장부를 구비한 인코더 제어기(305)의 제 1 출력은, 프레임 배열 버퍼(310)의 제 2 입력, 기하학적 확장부를 구비한 역 변환기 및 역 양자화기(350)의 제 2 입력, 화상 유형 결정 모듈(315)의 입력, 기하학적 확장부를 구비한 매크로블록 유형(MB-유형) 결정 모듈(320)의 입력, 기하학적 확장부를 구비한 인트라 예측 모듈(360)의 제 2 입력, 기하학적 확장부를 구비한 디블로킹 필터(365)의 제 2 입력, 기하학적 확장부를 구비한 움직임 보상기(370)의 제 1 입력, 기하학적 확장부를 구비한 움직임 추정기(375)의 제 1 입력, 및 기준 화상 버퍼(380)의 제 2 입력과 교신하도록 연결된다.
기하학적 확장부를 구비한 인코더 제어기(305)의 제 2 출력은, 보충 강화 정보(SEI: supplemental Enhancement Information) 삽입기(330)의 제 1 입력, 기하학적 확장부를 구비한 변환기 및 양자화기(325)의 제 2 입력, 기하학적 확장부를 구비한 엔트로피 코더(345)의 제 2 입력, 출력 버퍼(335)의 제 2 입력, 및 시퀀스 파라미터 세트(SPS: Sequence Parameter Set) 및 화상 파라미터 세트(PPS: Picture Parameter Set) 삽입기(340)의 입력과 교신하도록 연결된다.
화상-유형 결정 모듈(315)의 제 1 출력은 프레임 배열 버퍼(310)의 제 3 입력과 교신하도록 연결된다. 화상 유형 결정 모듈(315)의 제 2 출력은 기하학적 확장부를 구비한 매크로블록-유형 결정 모듈(320)의 제 2 입력과 교신하도록 연결된다.
SPS 및 PPS 삽입기(340)의 출력은 결합기(390)의 제 3 비반전 입력과 교신하도록 연결된다.
기하학적 확장부를 구비한 역 양자화기 및 역 변환기(350)의 출력은 결합기(319)의 제 1 비반전 입력과 교신하도록 연결된다. 결합기(319)의 출력은 기하학적 확장부를 구비한 인트라 예측 모듈(360)의 제 1 입력과, 기하학적 확장부를 구비한 디블로킹 필터(365)의 제 1 입력과 교신하도록 연결된다. 기하학적 확장부를 구비한 디블로킹 필터(365)의 출력은 기준 화상 버퍼(380)의 제 1 입력과 교신하도록 연결된다. 기준 화상 버퍼(380)의 출력은 기하학적 확장부를 구비한 움직임 추정기(375)의 제 2 입력과 교신하도록 연결된다. 기하학적 확장부를 구비한 움직임 추정기(375)의 제 1 출력은 기하학적 확장부를 구비한 움직임 보상기(370)의 제 2 입력과 교신하도록 연결된다. 기하학적 확장부를 구비한 움직임 추정기(375)의 제 2 출력은 기하학적 확장부를 구비한 엔트로피 코더(345)의 제 3 입력과 교신하도록 연결된다.
기하학적 확장부를 구비한 움직임 보상기(370)의 출력은 스위치(397)의 제 1 입력과 교신하도록 연결된다. 기하학적 확장부를 구비한 인트라 예측 모듈(360)의 출력은 스위치(397)의 제 2 입력과 교신하도록 연결된다. 기하학적 확장부를 구비한 매크로블록 유형의 결정 모듈(320)의 출력은 스위치(397)의 제 3 입력과 교신하도록 연결된다. 스위치(397)의 제 3 입력은 스위치의 "데이터" 입력(제어 입력, 즉 제 3 입력과 비교시)이 기하학적 확장부를 구비한 움직임 보상기(370) 또는 기하학적 확장부를 구비한 인트라 예측 모듈(360)에 의해 제공되는지 여부를 결정한다. 스위치(397)의 출력은 결합기(319)의 제 2 비반전 입력과, 결합기(385)의 반전 입력과 교신하도록 연결된다.
프레임 배열 버퍼(310)와, 기하학적 확장부를 구비한 인코더 제어기(305)의 입력들은 입력 화상(301)을 수신하기 위해 인코더(300)의 입력으로서 이용 가능하다. 게다가, SEI 삽입기(330)의 입력은 메타데이터를 수신하기 위해 인코더(300)의 입력으로서 이용 가능하다. 출력 버퍼(335)의 출력은 비트스트림을 출력하기 위해 인코더(300)의 출력으로서 이용 가능하다.
도 4를 참조하면, MPEG-4 AVC 표준에 따라 비디오 디코딩을 수행할 수 있는 비디오 디코더가 일반적으로 참조 번호 400으로 표시되어 있다.
비디오 디코더(400)는 기하학적 확장부를 구비한 엔트로피 디코더(445)의 제 1 입력과 교신하도록 연결된 출력을 가지는 입력 버퍼(410)를 포함한다. 기하학적 확장부를 구비한 엔트로피 디코더의 제 1 출력은 기하학적 확장부를 구비한 역 변환기 및 역 양자화기(450)의 제 1 입력과 교신하도록 연결된다. 기하학적 확장부를 구비한 역 변환기 및 역 양자화기(450)의 출력은 결합기(425)의 제 2 비반전 입력과 교신하도록 연결된다. 결합기(425)의 출력은 기하학적 확장부를 구비한 디블로킹 필터(465)의 제 2 입력 및 기하학적 확장부를 구비한 인트라 예측 모듈(460)의 제 1 입력과 교신하도록 연결된다. 기하학적 확장부를 구비한 디블로킹 필터(465)의 제 2 출력은 기준 화상 버퍼(480)의 제 1 입력과 교신하도록 연결된다. 기준 화상 버퍼(480)의 출력은 기하학적 확장부를 구비한 움직임 보상기(470)의 제 2 입력과 교신하도록 연결된다.
기하학적 확장부를 구비한 엔트로피 디코더(445)의 제 2 출력은, 기하학적 확장부를 구비한 움직임 보상기(470)의 제 3 입력 및 기하학적 확장부를 구비한 디블로킹 필터(465)의 제 1 입력과 교신하도록 연결된다. 기하학적 확장부를 구비한 엔트로피 디코더(445)의 제 3 출력은, 구역 병합 확장부를 구비한 디코더 제어기(405)의 입력과 교신하도록 연결된다. 기하학적 확장부를 구비한 디코더 제어기(405)의 제 1 출력은, 기하학적 확장부를 구비한 엔트로피 디코더(445)의 제 2 입력과 교신하도록 연결된다. 기하학적 확장부를 구비한 디코더 제어기(405)의 제 2 출력은 기하학적 확장부를 구비한 역 변환기 및 역 양자화기(450)의 제 2 입력과 교신하도록 연결된다. 기하학적 확장부를 구비한 디코더 제어기(405)의 제 3 출력은 기하학적 확장부를 구비한 디블로킹 필터(465)의 제 3 입력과 교신하도록 연결된다. 기하학적 확장부를 구비한 디코더 제어기(405)의 제 4 출력은 기하학적 확장부를 구비한 인트라 예측 모듈(460)의 제 2 입력, 기하학적 확장부를 구비한 움직임 보상기(470)의 제 1 입력, 기준 화상 버퍼(480)의 제 2 입력과 교신하도록 연결된다. 기하학적 확장부를 구비한 디코더 제어기(405)의 제 5 출력은, 스위치(497)의 출력이 스위치(497)의 제 1 입력 또는 스위치(497)의 제 2 입력과 연결될지를 제어하기 위해, 스위치(497)의 출력의 제어 부분과 교신하도록 연결된다.
기하학적 확장부를 구비한 움직임 보상기(470)의 출력은 스위치(497)의 제 1 입력과 교신하도록 연결된다. 기하학적 확장부를 구비한 인트라 예측 모듈(460)의 출력은 스위치(497)의 제 2 입력과 교신하도록 연결된다. 스위치(497)의 출력은 결합기(425)의 제 1 비반전 입력과 교신하도록 연결된다.
입력 버퍼(410)의 입력은 입력 비트스트림을 수신하기 위한 디코더(400)의 입력으로서 이용 가능하다. 기하학적 확장부를 구비한 디블로킹 필터(465)의 제 1 출력은 출력 화상을 출력하기 위한 디코더(400)의 출력으로서 이용 가능하다.
위에서 주지된 바와 같이, 본 발명의 원리들은 기하학적으로 분할된 쌍방 예측 모드 분할들을 비디오 인코딩 및 디코딩하기 위한 방법 및 장치에 관한 것이다.
예측 모드를 효율적으로 인코딩하는 것은, 정보가 구성되고 디코더에 송신되는 방법과 방식의 정확한 설계를 요구한다는 점을 알아야 한다. 그러므로, 디코더로의 송신을 위해 데이터가 준비되는 방법과, 사용된 특별한 엔트로피 코딩에 따라, 예측 레벨에서 일부 특별한 코딩 모드들에 의해 도입된 압축 효율에 있어서의 이득과 혜택이 불필요한 여분의 비트 양을 낭비함으로써, 손상될 수 있다.
본 발명의 원리들의 하나 이상의 실시예들에 따라, 앞선 문제들의 해결책이 기하학적-적응 블록 분할이 사용되는 B-프레임들을 위한 효율적인 코딩 구조들에 관해 제안된다.
앞에서 설명된 바처럼, 비록 본 발명의 원리들의 하나 이상의 실시예가 MPEG-4 AVC 표준에 관한 것이고/이거나 그렇지 않을 경우 MPEG-4 AVC 표준(즉, 기하학적 모드 분할을 MPEG-4 AVC 표준에 통합하는 것)에 관해 설명되지만, 본 발명의 원리들은 이러한 표준에만 제한되지 않고, 본 발명의 원리들의 취지를 유지하면서, 다른 표준, 권고안 및/또는 그것들의 확장에 바로 적용될 수 있다는 점을 알아야 한다.
움직임 예측된 화상들의 경우, 픽셀들이 동일한 유형의 예측 정보를 공유할 수 있는 화상 영역들에서는 더 큰 블록들이 사용되고, 상이한 조직을 지닌 구역들 사이의 움직임 경계들에는 더 작은 크기의 블록들이 축적되는 경향이 있다. 때때로, 움직임 경계들 부근에서는, 트리 기반의 분할이 유사한 데이터를 상이한 하위-블록들에서 별도로 코딩하여, 불필요한 오버헤드를 초래한다. 또한, 움직임 구역들 모두와 겹쳐지는 블록들은 경계 면들 모두에서 픽셀들을 정확히 예측하는데 있어서의 어려움으로 인해 일부 예측 에러를 동반할 수 있다.
심지어 MPEG-4 AVC 표준에서 현재 사용된 쌍방 예측 모드들이 예측 에러를 감소시키고 일부 화상 세부 사항의 표현을 개선하는데 도움을 줄지라도, 그것들은 여전히 2차원 시각 데이터의 기본 구조를 부분적으로만 이용하여, 개선의 여지를 남긴다.
본 발명의 원리들의 하나 이상의 실시예에 따라, 쌍방 예측의 프레임워크(즉, B-프레임들)에서 기하학적-적응된 블록 분할들을 사용하는 구조를 개시하고 설명한다. B-프레임들 프레임워크 내의 기하학적 적응된 분할들을 사용하는 것은, 폐쇄 효과와 양자화 잡음을 감소시키기 위해, 쌍방 예측의 혜택으로부터 이익을 얻으면서, 움직임 경계들을 더 잘 모델화하는 것을 도울 수 있다. 실제로, 일 실시예에서 기하학적 적응 분할들에 의해 하나의 블록에서 생성된 분할들 중 적어도 하나에서의 순방향 예측, 역방향 예측, 및 쌍방 예측 중 적어도 하나를 사용할 수 있다.
도 5를 참조하면, 기하학적 적응 직선으로 분할된 예시적인 INTER-B 블록이 일반적으로 참조 번호 500으로 표시되어 있다. 움직임 벡터들(MV_1 & MV_3)을 지닌 구역(510)은 쌍방 예측되고, 움직임 벡터(MV_2)를 지닌 구역(520)은 단일 기준 프레임으로부터 예측된다. 본 명세서에서 사용된 것처럼, MV_x는 3차원 움직임 벡터들(즉, 공간 변위에 기준 프레임을 더한 것)을 가리킨다.
일 실시예에서, 도 5에 따르면, 블록의 예측 보상은
Figure pct00014
와 같이 나타낼 수 있다.
일 실시예에서, 블록 분할법은 16 ×8, 8 ×16, 8 ×4, 4 ×8 B-프레임 블록 모드들을 일반화한 것이고, 각각 B-프레임들(8 ×8과 4 ×4)에 대한 개선예이다. 이와 같이, 새로운 B-프레임 모드들인 INTER16 ×16GEO와 INTER8 ×8GEO가 모드들 표에 삽입된다. B-프레임들의 프레임워크에서는, 각각의 기하학적 적응된 분할의 예측 유형(예컨대, 순방향, 역방향, 및 쌍방 예측)을 표시하기 위해 추가 데이터가 시그널링된다. 이러한 목적을 위해, 역방향, 순방향, 및 쌍방 예측을 위한 모든 가능한 기준 목록 조합 모드들이 B-프레임 GEO 제안된 모드들을 위해 고려된다. 즉, 분할 0와 분할 1의 경우: 순방향-순방향, 순방향-역방향, 역방향-순방향, 역방향-역방향, 역방향-쌍방 예측, 쌍방 예측-역방향, 순방향-쌍방 예측, 쌍방 예측-순방향, 쌍방 예측-쌍방 예측이다. B-프레임들 INTER8 ×8GEO는 분할 모두에 관해 동일한 유형의 예측(역방향, 순방향 또는 쌍방 예측)을 사용한다.
본 발명의 원리들의 일 실시예에 따르면, B-프레임들을 위한 기하학적 적응된 블록 분할법이 또한 한정된 분할들 내에서 가중된 쌍방 예측을 지원하기 위해 적응될 수 있다.
예측 방향에 블록 분할법을 더한 것에 대한 모든 가능한 조합들을 고려하면, 프레임 분할이 기하학적-적응된 모드들을 위한 예측 설명과 결합되는 일련의 B-프레임 매크로블록 모드를 한정할 수 있다. MPEG-4 AVC 표준에서의 모드들의 이미 존재하는 목록과 함께, B-프레임 예측 모드들의 전체 세트는 매우 큰 모드들의 군(family)을 생성한다. 이는 표 2와 표 4에서 볼 수 있고, MPEG-4 AVC 표준의 본래 표들(즉, 본 명세서에서는 표 1과 표 3)과 비교될 수 있다.
특히, 표 1이 MPEG-4 AVC 표준에 관한 B-프레임 매크로블록 코딩 모드들을 보여주는데 반해, 표 2는 기하학적-적응 분할된 블록들을 지닌 MPEG-4 AVC 표준을 위한 예시적인 B 프레임 매크로블록 코딩 모드들을 보여준다. 또한, 표 3은 MPEG-4 AVC 표준을 위한 B-프레임 하위(sub)8 ×8 코딩 모드들을 보여주는데 반해, 표 4는 기하학적-적응 분할된 블록들을 지닌 MPEG-4 AVC 표준을 위한 예시적인 B 프레임 하위8 ×8 코딩 모드들을 보여준다.
Figure pct00015
Figure pct00016
Figure pct00017
Figure pct00018
본 발명의 원리들의 또 다른 실시예에서는, 기하학적-적응 분할법 모드와 순방향/역방향/쌍방-예측 모드들(또는 예측 모드)에 관한 독립적인 코드들을 사용하여 정보를 다르게 그룹화할 수 있다.
공동의 분할 모드들과 예측 모드들의 최적의 인코딩을 하기 위해, 본 발명의 원리들은 코딩 모드들을 최적화된 코딩 워드로의 적응된 매핑을 고려한다.
일 실시예에서, 새롭게 추가된 기하학적 모드들은, 표 2와 표 4에 도시된 MPEG-4 AVC 표준의 다른 모드들로 인터리빙된다. 또 다른 실시예에서는, 새롭게 추가된 기하학적 모드들이 하나로 묶여질 수 있고, 표 5에 도시된 MPEG-4 AVC 표준의 모드들 사이에 놓인다. 또 다른 실시예에서는, 기하학적 모드들 일부를 함께 묶을 수 있고, 다른 기하학적 모드들을 인터리빙할 수 있다. 예컨대, 일방-예측(uni-prediction) 기하학적 모드들을 함께 묶을 수 있고, MPEG-4 AVC 표준의 다른 모드들로 쌍방-예측 기하학적 모드들을 인터리빙할 수 있다.
Figure pct00019
엔트로피 코딩을 위한 코딩 모드 배열은 이용된 엔트로피 코딩 방법에 의존적일 수 있다. 예컨대, MPEG-4 AVC 표준에서는, 2개의 엔트로피 코딩 방법, 즉 상황 적응 가변 길이 코딩(CAVLC: context adaptive variable length coding)과 CABAC이 지원된다. CAVLC와 CABAC에 관해 동일한 모드 표들이 적용될 수 있거나, CAVLC와 CABAC에 관해 상이한 모드 표들을 적용할 수 있다. 예컨대, 일 실시예에서 VLC 코딩의 경우, 위 제 1 실시예를 사용할 수 있다(표 2와 표 4). 산술 코딩의 경우에는 위 제 2 실시예를 사용할 수 있다(표 5).
그런 다음, 각 모드 식별자는 엔트로피 코딩을 위해 같지 않은 길이의 코드들의 세트로 맵핑된다. 같지 않은 길이 코드들의 세트로부터의 코드들 중 각각의 코드의 길이는 모드 배열에 따라 만들어질 수 있다.
도 6을 참조하면, MPEG-4 AVC 표준 CABAC을 따르는 16 ×16, 16 ×8, 8 ×16, 8 ×8, 8 ×4, 4 ×8, 4 ×4에 관한 B-프레임 2진 코드 구조와, CABAC에 관한 인트라 모드들이 일반적으로 참조 번호 600으로 표시되어 있다. 이는 각각의 모드에 관한 단순화된 2진 트리 표현이다. 2진 트리의 단말 노드들은 그 모드의 심벌 값들에 대응하여, 루트(root) 노드로부터 대응하는 단자 모드로 트리를 횡단하기 위한 2진 값의 연결(concatenation)이 대응하는 심벌 값의 빈 스트링(bin string)을 나타낸다. 예컨대, 트리의 좌측 잎(leaf)이 0이고, 트리의 좌측 잎의 바로 우측에 있는 잎이 1이라고 결정하면, 모드 0은 "0"으로 나타내어지고, 모드 1은 "100"으로 나타내어지며, 모드 2는 "101"로 나타내어지고, 모드 3은 "110000"으로 나타내어지는 식이다.
도 7을 참조하면, 16 ×16, 16 ×8, 8 ×16, 16 ×16GEO, 8 ×8, 8 ×4, 4 ×8, 8 ×8GEO, 4 ×4에 관한 예시적인 B-프레임 2진 코드 구조와, B-프레임들에 대한 기하학적 적응 블록 분할을 따르는 MPEG-4 AVC 표준 CABAC의 확장된 버전에 관한 인트라 모드들 CABAC이 일반적으로 참조 번호 700으로 표시되어 있다. 이 예에서는, 기하학적 B 모드들에 의해 도입된 더 많은 모드를 조절하기 위해, 도 6에서의 2개의 브랜치(branch)에 하나 더 많은 비트를 추가한다. 구조(700)는 B-프레임들에 대한 기하학적-적응 블록 분할법으로 MPEG-4 AVC 표준의 확장된 버전에서 CABAC 전에 2진화 단계에서 코딩 모드 식별 번호로부터 같지 않은 길이 코드들을 생성하기 위해 사용될 수 있다는 점을 알아야 한다.
도 8을 참조하면, 인코더에서 최상의 기하학적 모드를 검색하는 것을 수행하기 위한 예시적인 방법이 일반적으로 참조 번호 800으로 표시되어 있다.
방법(800)은 루프 제한 블록(810)에 제어를 넘기는 시작 블록(805)을 포함한다. 루프 제한 블록(810)은 변수 i를 사용하는 가능한 가장자리들의 총 개수(그 양은 기하학적 정밀도에 의존적임)에 걸쳐 루프 형성을 수행하고, 제어를 기능 블록(815)에 넘긴다. 기능 블록(815)은 변수(i)의 현재 값에 기초하여 대응하는 파라미터 세트로 분할을 생성하고, 제어를 기능 블록(820)에 넘긴다. 기능 블록(820)은 목록 0, 목록 1 및 쌍방-예측에 관해 분할 세트(I)가 주어진 최상의 예측기를 검색하고, 제어를 결정 블록(825)에 넘긴다. 결정 블록(825)은 현재 분할 및 예측이 각각 최상의 분할과 최상의 예측인지 여부를 결정한다. 만약 그렇다면, 제어는 기능 블록(830)으로 넘어간다. 그렇지 않다면, 제어는 기능 블록(835)으로 넘어간다.
기능 블록(830)은 최상의 기하학적 파라미터들, 예측기 선택, 및 예측 목록을 저장하고, 제어를 기능 블록(835)에 넘긴다.
기능 블록(835)은 가능한 가장자리들의 총 개수에 걸친 루프 형성을 종료하고 제어를 종료 블록(899)에 넘긴다.
도 9를 참조하면, 기하학적으로 분할된 쌍방 예측 모드 분할들을 사용하는 비디오 인코딩을 위한 예시적인 방법이, 일반적으로 참조 번호 900으로 표시되어 있다.
방법(900)은 제어를 결정 블록(910)에 넘기는 시작 블록(905)을 포함한다. 결정 블록(910)은 현재 유형이 기하학적 모드 유형인지를 결정한다. 만약 그렇다면, 제어는 기능 블록(915)에 넘어간다. 그렇지 않다면, 제어는 종료 블록(999)에 넘어간다.
기능 블록(915)은 기하학적 모드 유형을 코딩하고, 제어를 기능 블록(920)에 넘긴다. 기능 블록(920)은 기하학적 분할 파라미터들을 코딩하고, 제어를 결정 블록(925)에 넘긴다. 결정 블록(925)은 현재 모드 유형이 쌍방 예측 기하학적 모드 유형인지 여부를 결정한다. 만약 그렇다면, 제어는 기능 블록(930)에 넘어간다. 그렇지 않다면, 제어는 기능 블록(935)에 넘어간다.
기능 블록(930)은 목록 0과 목록 1 모두로부터의 분할 예측을 코딩하고, 제어를 종료 블록(999)에 넘긴다.
기능 블록(935)은 단일 목록(목록 0 또는 목록 1)으로부터의 분할들 예측을 코딩하고, 제어를 종료 블록(999)에 넘긴다.
도 10을 참조하면, 기하학적으로 분할된 쌍방 예측 모드 분할들을 사용하는 비디오 인코딩에 관한 예시적인 방법이, 일반적으로 참조 번호 1000으로 표시된다.
방법(1000)은 제어를 기능 블록(1010)에 넘기는 시작 블록(1005)을 포함한다. 기능 블록(1010)은 모드 유형을 디코딩하고, 제어를 결정 블록(1015)에 넘긴다. 결정 블록(1015)은 현재 모드 유형이 기하학적 모드 유형인지 여부를 결정한다. 만약 그렇다면, 제어는 기능 블록(1020)에 넘어간다. 만약 그렇지 않다면, 제어는 종료 블록(1099)에 넘어간다.
기능 블록(1020)은 기하학적 분할 파라미터들을 디코딩하고, 제어를 결정 블록(1025)에 넘긴다. 결정 블록(1025)은 현재 모드가 쌍방-예측 기하학적 모드 유형인지 여부를 결정한다. 만약 그렇다면, 제어는 기능 블록(1030)에 넘어간다. 그렇지 않다면, 제어는 기능 블록(1035)에 넘어간다.
기능 블록(1030)은 목록 0과 목록 1 모두로부터의 분할 예측을 디코딩하고, 제어를 종료 블록(1099)에 넘긴다.
기능 블록(1035)은 단일 목록(목록 0 또는 목록 1)으로부터의 분할 예측을 디코딩하고, 제어를 종료 블록(1099)에 넘긴다.
이제 본 발명의 많은 부수적인 장점/특징의 일부에 대한 설명이 주어지고, 그들 중 일부는 위에서 언급되었다. 예컨대, 한 가지 장점/특징은 적응 기하학적 분할법을 사용하여 화상의 적어도 일 부분에 관한 쌍방-예측 화상 데이터를 인코딩하기 위한 인코더를 가지는 장치이다. 적응 기하학적 분할법에 관한 기하학적 분할들은, 기준 화상들의 제 1 목록에 대응하는 예측기들의 제 1 세트, 기준 화상들의 제 2 목록에 대응하는 예측기들의 제 2 세트, 및 쌍방-예측을 위해 사용되고 제 1 세트와 제 2 세트 중 적어도 하나로부터의 예측기들을 포함하는 예측기들의 제 3 세트로부터 선택된 적어도 하나의 예측기를 사용하여 예측된다.
또 다른 장점/특징은 전술한 바와 같은 인코더를 가지는 장치로서, 이 경우 인코더는 블록 분할 모드와, 예측기의 제 1 세트에 대응하는 예측 설명어, 예측기의 제 2 세트에 대응하는 예측 설명어, 및 예측기의 제 3 세트에 대응하는 쌍방 예측 설명어 중 적어도 하나의 예측 설명어를, 통일된 코드워드(codeword)를 사용하여, 공동으로 코딩한다.
또 다른 장점/특징은 전술한 바와 같이 공동으로 코딩하는 인코더를 가지는 장치로서, 이 경우 적응 기하학적 분할법에 관해 사용된 기하학적 분할 모드들에 대응하는 적응 기하학적 분할법 모드 코드워드들은, 다른 하위-분할된 블록들에 관해 사용된 코드워드의 길이 이하인 코드워드 길이를 가진다.
또 다른 장점/특징은 전술한 바와 같은 인코더를 가지는 장치로서, 이 경우 적응 기하학적 분할법에 관해 사용된 기하학적 모드들은, 다른 존재하는 모드들과 인터리빙되고 나머지 존재하는 모드들 중에서 함께 압축되는 기하학적 모드들 중 적어도 하나이다.
게다가, 또 다른 장점/특징은 전술한 바와 같은 인코더를 가지는 장치로서, 이 경우 인코더는 쌍방 예측 가능 화상 데이터를 인코딩하기 위해 사용된 모드 식별자들에 관해, 길이가 같지 않은 코드워드들의 세트로 모드 배열(ordering)을 맵핑한다.
또한, 또 다른 장점/특징은 전술한 바와 같은 인코더를 가지는 장치로서, 이 경우 인코더는 이용된 엔트로피 코딩 방법에 따라 쌍방 예측 가능 화상 데이터를 인코딩하기 위해 사용된 기하학적 모드 식별자들에 관한 기하학적 모드 배열을 변경한다.
본 명세서의 가르침을 기초로 하여, 본 발명의 이러한 그리고 다른 특징들 및 이점들은 당업자에 의해 즉시 확인될 수도 있다. 본 발명의 가르침은 하드웨어, 소프트웨어, 펌웨어, 특수 목적 프로세서, 또는 그들의 조합의 다양한 형태로 구현될 수 있다는 것이 이해되어야 한다.
가장 바람직하게, 본 발명의 가르침은 하드웨어와 소프트웨어의 조합으로서 구현된다. 또한, 소프트웨어는, 프로그램 저장 유닛 상에 실체적으로 구체화되는 응용 프로그램으로서 구현될 수도 있다. 응용 프로그램은, 임의의 적당한 구조를 포함하는 기계로 업로드되어, 그러한 기계에 의해 실행될 수도 있다. 바람직하게, 그러한 기계는 하나 이상의 중앙 처리 장치("CPU"), 랜덤 액세스 메모리("RAM"), 그리고 입력/출력("I/O") 인터페이스와 같은 하드웨어를 갖는 컴퓨터 플랫폼 상에서 구현된다. 컴퓨터 플랫폼은 또한 운영 체제 및 마이크로명령어(microinstruction) 코드를 포함할 수도 있다. 본 명세서에 기재된 다양한 프로세스 및 기능은 CPU에 의해 실행될 수도 있는 마이크로명령어 코드의 부분, 또는 응용 프로그램의 부분, 또는 그들의 임의의 조합일 수도 있다. 또한, 추가적인 데이터 저장 유닛 및 프린팅 유닛과 같은 다양한 다른 주변기기 유닛이 컴퓨터 플랫폼으로 연결될 수도 있다.
첨부 도면에 도시된 구성 시스템 구성요소들 및 방법들의 일부는 바람직하게 소프트웨어로 구현되므로, 시스템 구성요소들 또는 프로세스 기능 블록들 사이의 실제 연결은 본 발명이 프로그래밍되는 방법에 따라서 달라질 수도 있다는 것이 또한 이해되어야 한다. 본 명세서의 상기 가르침들이 주어지면, 당업자라면 본 발명의 이러한 그리고 유사한 구현들 또는 구성들을 예측하는 것이 가능할 것이다.
본 명세서에서 예시적 실시예들이 첨부 도면을 참조하여 설명되었지만, 본 발명은 바로 그 실시예들로 제한되지 않으며, 본 발명의 범위 또는 사상으로부터 벗어나지 않으면서 당업자에 의해 그러한 실시예들에 다양한 변화 및 수정이 실행될 수도 있다는 것이 이해되어야 한다. 모든 그러한 변화 및 수정은 첨부되는 청구항에 설명된 본 발명의 범위 내에 포함되도록 의도된다.
120: 이미지 블록 130,140: 이미지 블록의 분할
150: 대각선 200: INTER-P 이미지 블록
220: 이미지 블록 230,240: 이미지 블록의 분할

Claims (25)

  1. 장치로서,
    적응 기하학적 분할법(adaptive geometric partitioning)을 사용하여 화상의 적어도 한 부분에 관한 쌍방 예측 가능(bi-predictable) 화상 데이터를 인코딩하기 위한 인코더(300)를 포함하고,
    상기 적응 기하학적 분할법에 관한 기하학적 분할은, 기준 화상들의 제 1 목록에 대응하는 예측기들의 제 1 세트, 기준 화상들의 제 2 목록에 대응하는 예측기들의 제 2 세트, 및 상기 제 1 세트와 제 2 세트 중 적어도 하나로부터의 예측기를 포함하고 쌍방 예측을 위해 사용된 예측기들의 제 3 세트로부터 선택된 적어도 하나의 예측기를 사용하여 예측되는, 장치.
  2. 제 1항에 있어서,
    상기 인코더(300)는 블록 분할 모드와, 예측기의 제 1 세트에 대응하는 예측 설명어, 예측기의 제 2 세트에 대응하는 예측 설명어, 및 예측기의 제 3 세트에 대응하는 쌍방 예측 설명어 중 적어도 하나의 예측 설명어를, 통일된 코드워드(codeword)를 사용하여, 공동으로 코딩하는, 장치.
  3. 제 2항에 있어서,
    상기 적응 기하학적 분할법에 관해 사용된 기하학적 분할 모드들에 대응하는 적응 기하학적 분할법 모드 코드워드들은, 다른 하위-분할된 블록들에 관해 사용된 코드워드의 길이 이하인 코드워드 길이를 가지는, 장치.
  4. 제 1항에 있어서,
    상기 적응 기하학적 분할법에 관해 사용된 기하학적 모드들은, 다른 존재하는 모드들과 인터리빙된 기하학적 모드와 존재하는 다른 모드들 중에서 함께 압축되는 기하학적 모드 중 적어도 하나의 기하학적 모드인, 장치.
  5. 제 1항에 있어서,
    상기 인코더(300)는 쌍방 예측 가능 화상 데이터를 인코딩하기 위해 사용된 모드 식별자들에 관해, 길이가 같지 않은 코드들의 세트로 모드 배열(ordering)을 맵핑하는, 장치.
  6. 제 1항에 있어서,
    상기 인코더(300)는 이용된 엔트로피 코딩 방법에 따라 쌍방 예측 가능 화상 데이터를 인코딩하기 위해 사용된 기하학적 모드 식별자들에 관한 기하학적 모드 배열을 변경하는, 장치.
  7. 방법으로서,
    적응 기하학적 분할법을 사용하여 화상의 적어도 한 부분에 관한 쌍방 예측 가능 화상 데이터를 인코딩하는 단계(930,935)를 포함하고,
    상기 적응 기하학적 분할법에 관한 기하학적 분할은, 기준 화상들의 제 1 목록에 대응하는 예측기들의 제 1 세트, 기준 화상들의 제 2 목록에 대응하는 예측기들의 제 2 세트, 및 상기 제 1 세트와 제 2 세트 중 적어도 하나로부터의 예측기를 포함하고 쌍방 예측을 위해 사용된 예측기들의 제 3 세트로부터 선택된 적어도 하나의 예측기를 사용하여 예측되는, 방법.
  8. 제 7항에 있어서,
    상기 인코딩하는 단계는, 블록 분할 모드와, 예측기의 제 1 세트에 대응하는 예측 설명어, 예측기의 제 2 세트에 대응하는 예측 설명어, 및 예측기의 제 3 세트에 대응하는 쌍방 예측 설명어 중 적어도 하나의 예측 설명어를, 통일된 코드워드를 사용하여, 공동으로 코딩하는 단계(700,920)를 포함하는, 방법.
  9. 제 8항에 있어서,
    상기 적응 기하학적 분할법에 관해 사용된 기하학적 분할 모드들에 대응하는 적응 기하학적 분할법 모드 코드워드들은, 다른 하위-분할된 블록들에 관해 사용된 코드워드의 길이 이하인 코드워드 길이를 가지는(700), 방법.
  10. 제 7항에 있어서,
    상기 적응 기하학적 분할법에 관해 사용된 기하학적 모드들은, 존재하는 다른 모드들과 인터리빙되는 기하학적 모드와 존재하는 나머지 모드들 중에서 함께 압축되는 기하학적 모드 중 적어도 하나의 기하학적 모드인(700), 방법.
  11. 제 7항에 있어서,
    상기 인코딩 단계는 쌍방 예측 가능 화상 데이터를 인코딩하기 위해 사용된 모드 식별자들에 관해, 길이가 같지 않은 코드들의 세트로 모드 배열을 맵핑하는 단계(700)를 포함하는, 방법.
  12. 제 7항에 있어서,
    상기 인코딩 단계는 이용된 엔트로피 코딩 방법에 따라 쌍방 예측 가능 화상 데이터를 인코딩하기 위해 사용된 기하학적 모드 식별자들에 관한 기하학적 모드 배열을 변경하는(700), 방법.
  13. 장치로서,
    적응 기하학적 분할법을 사용하여 화상의 적어도 한 부분에 관한 쌍방 예측 가능 화상 데이터를 디코딩하기 위한 디코더(400)를 포함하고,
    상기 적응 기하학적 분할법에 관한 기하학적 분할은, 기준 화상들의 제 1 목록에 대응하는 예측기들의 제 1 세트, 기준 화상들의 제 2 목록에 대응하는 예측기들의 제 2 세트, 및 상기 제 1 세트와 제 2 세트 중 적어도 하나로부터의 예측기를 포함하고 쌍방 예측을 위해 사용된 예측기들의 제 3 세트로부터 선택된 적어도 하나의 예측기를 사용하여 예측되는, 장치.
  14. 제 13항에 있어서,
    상기 디코더(400)는, 통일된 코드워드로부터, 블록 분할 모드와, 예측기의 제 1 세트에 대응하는 예측 설명어, 예측기의 제 2 세트에 대응하는 예측 설명어, 및 예측기의 제 3 세트에 대응하는 쌍방 예측 설명어 중 적어도 하나의 예측 설명어를 디코딩하는, 장치.
  15. 제 14항에 있어서,
    상기 적응 기하학적 분할법에 관해 사용된 기하학적 분할 모드들에 대응하는 적응 기하학적 분할법 모드 코드워드들은, 다른 하위-분할된 블록들에 관해 사용된 코드워드의 길이 이하인 코드워드 길이를 가지는, 장치.
  16. 제 13항에 있어서,
    상기 적응 기하학적 분할법에 관해 사용된 기하학적 모드들은, 존재하는 다른 모드들과 인터리빙되는 기하학적 모드와 존재하는 나머지 모드들 중에서 함께 압축되는 기하학적 모드 중 적어도 하나의 기하학적 모드인, 장치.
  17. 제 13항에 있어서,
    상기 디코더(400)는 길이가 같지 않은 코드들의 세트를 쌍방 예측 가능 화상 데이터를 디코딩하기 위해 사용된 모드 식별자들에 관한 모드 배열로 맵핑하는, 장치.
  18. 제 13항에 있어서,
    상기 디코더(400)는 이용된 엔트로피 디코딩 방법에 따라 쌍방 예측 가능 화상 데이터를 디코딩하기 위해 사용된 기하학적 모드 식별자들에 관한 기하학적 모드 배열을 변경하는, 장치.
  19. 방법으로서,
    적응 기하학적 분할법을 사용하여 화상의 적어도 한 부분에 관한 쌍방 예측 가능 화상 데이터를 디코딩하는 단계(1030,1035)를 포함하고,
    상기 적응 기하학적 분할법에 관한 기하학적 분할은, 기준 화상들의 제 1 목록에 대응하는 예측기들의 제 1 세트, 기준 화상들의 제 2 목록에 대응하는 예측기들의 제 2 세트, 및 상기 제 1 세트와 제 2 세트 중 적어도 하나로부터의 예측기를 포함하고 쌍방 예측을 위해 사용된 예측기들의 제 3 세트로부터 선택된 적어도 하나의 예측기를 사용하여 예측되는, 방법.
  20. 제 19항에 있어서,
    상기 디코딩 단계는 통일된 코드워드로부터, 블록 분할 모드와, 예측기의 제 1 세트에 대응하는 예측 설명어, 예측기의 제 2 세트에 대응하는 예측 설명어, 및 예측기의 제 3 세트에 대응하는 쌍방 예측 설명어 중 적어도 하나의 예측 설명어를 디코딩하는 단계(1010,700)를 포함하는, 방법.
  21. 제 20항에 있어서,
    상기 적응 기하학적 분할법에 관해 사용된 기하학적 분할 모드들에 대응하는 적응 기하학적 분할법 모드 코드워드들은, 다른 하위-분할된 블록들에 관해 사용된 코드워드의 길이 이하인 코드워드 길이를 가지는(700), 방법.
  22. 제 19항에 있어서,
    상기 적응 기하학적 분할법에 관해 사용된 기하학적 모드들은, 존재하는 다른 모드들과 인터리빙되는 기하학적 모드와, 존재하는 나머지 모드들 중에서 함께 압축되는 기하학적 모드 중 적어도 하나의 기하학적 모드인(700), 방법.
  23. 제 19항에 있어서,
    상기 디코딩 단계는 길이가 같지 않은 코드들의 세트를 쌍방 예측 가능 화상 데이터를 디코딩하기 위해 사용된 모드 식별자들에 관한 모드 배열로 맵핑하는 단계(700)를 포함하는, 방법.
  24. 제 19항에 있어서,
    상기 디코딩 단계는 이용된 엔트로피 코딩 방법에 따라 쌍방 예측 가능 화상 데이터를 디코딩하기 위해 사용된 기하학적 모드 식별자들에 관한 기하학적 모드 배열을 변경하는 단계(700)를 포함하는, 방법.
  25. 인코딩된 비디오 신호 데이터를 가지는 저장 매체로서,
    적응 기하학적 분할법을 사용하여 인코딩된 화상의 적어도 한 부분에 관한 쌍방 예측 가능 화상 데이터를 포함하고, 상기 적응 기하학적 분할법에 관한 기하학적 분할은, 순방향 예측기들의 세트, 역방향 예측기들의 세트, 및 쌍방 예측기들의 세트로부터 선택된 적어도 하나의 예측기를 사용하여 예측되는, 인코딩된 비디오 신호 데이터를 가지는 저장 매체.
KR1020107007666A 2007-10-12 2008-10-10 기하학적으로 분할된 쌍방 예측 모드 분할들을 비디오 인코딩 및 디코딩하기 위한 방법 및 장치 KR101555617B1 (ko)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US97958607P 2007-10-12 2007-10-12
US60/979,586 2007-10-12

Related Child Applications (1)

Application Number Title Priority Date Filing Date
KR1020147019996A Division KR101555327B1 (ko) 2007-10-12 2008-10-10 기하학적으로 분할된 쌍방 예측 모드 분할들을 비디오 인코딩 및 디코딩하기 위한 방법 및 장치

Publications (2)

Publication Number Publication Date
KR20100080792A true KR20100080792A (ko) 2010-07-12
KR101555617B1 KR101555617B1 (ko) 2015-09-24

Family

ID=40494950

Family Applications (2)

Application Number Title Priority Date Filing Date
KR1020147019996A KR101555327B1 (ko) 2007-10-12 2008-10-10 기하학적으로 분할된 쌍방 예측 모드 분할들을 비디오 인코딩 및 디코딩하기 위한 방법 및 장치
KR1020107007666A KR101555617B1 (ko) 2007-10-12 2008-10-10 기하학적으로 분할된 쌍방 예측 모드 분할들을 비디오 인코딩 및 디코딩하기 위한 방법 및 장치

Family Applications Before (1)

Application Number Title Priority Date Filing Date
KR1020147019996A KR101555327B1 (ko) 2007-10-12 2008-10-10 기하학적으로 분할된 쌍방 예측 모드 분할들을 비디오 인코딩 및 디코딩하기 위한 방법 및 장치

Country Status (7)

Country Link
US (1) US8681855B2 (ko)
EP (1) EP2208350A2 (ko)
JP (3) JP2011501508A (ko)
KR (2) KR101555327B1 (ko)
CN (1) CN101822056B (ko)
BR (1) BRPI0818344A2 (ko)
WO (1) WO2009051668A2 (ko)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2017183751A1 (ko) * 2016-04-22 2017-10-26 엘지전자(주) 인터 예측 모드 기반 영상 처리 방법 및 이를 위한 장치

Families Citing this family (54)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101517768B1 (ko) 2008-07-02 2015-05-06 삼성전자주식회사 영상의 부호화 방법 및 장치, 그 복호화 방법 및 장치
US9467705B2 (en) * 2009-12-30 2016-10-11 Ariscale Inc. Video encoding apparatus, video decoding apparatus, and video decoding method for performing intra-prediction based on directionality of neighboring block
US8879632B2 (en) * 2010-02-18 2014-11-04 Qualcomm Incorporated Fixed point implementation for geometric motion partitioning
CN102918842B (zh) * 2010-04-07 2016-05-18 Jvc建伍株式会社 动图像编码装置和方法、以及动图像解码装置和方法
JP2011234337A (ja) * 2010-04-07 2011-11-17 Jvc Kenwood Corp 動画像符号化装置、動画像符号化方法及び動画像符号化プログラム
JP2011234338A (ja) * 2010-04-07 2011-11-17 Jvc Kenwood Corp 動画像復号装置、動画像復号方法及び動画像復号プログラム
CN102215396A (zh) 2010-04-09 2011-10-12 华为技术有限公司 一种视频编解码方法和***
EP2559248A2 (en) * 2010-04-12 2013-02-20 Qualcomm Incorporated Fixed point implementation for geometric motion partitioning
JP5718453B2 (ja) 2010-04-13 2015-05-13 フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン 復号化方法
ES2907203T3 (es) 2010-04-13 2022-04-22 Ge Video Compression Llc Codificación de vídeo que usa subdivisiones multiárbol de imágenes
CN102939750B (zh) 2010-04-13 2016-07-06 Ge视频压缩有限责任公司 跨平面预测
CN106454370B (zh) 2010-04-13 2019-11-01 Ge视频压缩有限责任公司 解码器、重建数组的方法、编码器、编码方法及数据流
JP5541364B2 (ja) * 2010-09-30 2014-07-09 富士通株式会社 画像復号方法、画像符号化方法、画像復号装置、画像符号化装置、画像復号プログラム、及び画像符号化プログラム
US8885704B2 (en) * 2010-10-01 2014-11-11 Qualcomm Incorporated Coding prediction modes in video coding
US8787459B2 (en) * 2010-11-09 2014-07-22 Sony Computer Entertainment Inc. Video coding methods and apparatus
CN102611880B (zh) * 2011-01-19 2015-02-04 华为技术有限公司 标识图像块几何划分模式的编解码方法和设备
WO2012177052A2 (ko) 2011-06-21 2012-12-27 한국전자통신연구원 인터 예측 방법 및 그 장치
KR20120140592A (ko) 2011-06-21 2012-12-31 한국전자통신연구원 움직임 보상의 계산 복잡도 감소 및 부호화 효율을 증가시키는 방법 및 장치
SI2744204T1 (sl) * 2011-09-14 2019-02-28 Samsung Electronics Co., Ltd., Postopek dekodiranja enote za napovedovanje (PU) na podlagi njene velikosti
CN108632608B (zh) * 2011-09-29 2022-07-29 夏普株式会社 图像解码装置、图像解码方法、图像编码装置及图像编码方法
JP5972888B2 (ja) 2011-09-29 2016-08-17 シャープ株式会社 画像復号装置、画像復号方法および画像符号化装置
WO2014077827A1 (en) 2012-11-16 2014-05-22 Thomson Licensing Processing high dynamic range images
CN103916673B (zh) * 2013-01-06 2017-12-22 华为技术有限公司 基于双向预测的编码方法、解码方法和装置
WO2015133838A1 (ko) * 2014-03-05 2015-09-11 엘지전자(주) 폴리곤 유닛 기반 영상 인코딩/디코딩 방법 및 이를 위한 장치
CN105519110B (zh) * 2015-02-05 2018-09-28 华为技术有限公司 模板处理方法和相关设备
US10306258B2 (en) 2016-01-29 2019-05-28 Google Llc Last frame motion vector partitioning
US10469841B2 (en) 2016-01-29 2019-11-05 Google Llc Motion vector prediction using prior frame residual
ES2737845B2 (es) * 2016-07-05 2021-05-19 Kt Corp Metodo y aparato para procesar senal de video
WO2019001733A1 (en) 2017-06-30 2019-01-03 Huawei Technologies Co., Ltd. ENCODER, DECODER, COMPUTER PROGRAM, AND COMPUTER PROGRAM PRODUCT FOR PROCESSING A FRAME OF A VIDEO SEQUENCE
CN115118996A (zh) * 2017-08-22 2022-09-27 松下电器(美国)知识产权公司 图像编码器和图像解码器
WO2019138998A1 (ja) * 2018-01-12 2019-07-18 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ 符号化装置、復号装置、符号化方法及び復号方法
EP3758374A4 (en) * 2018-02-22 2021-09-01 LG Electronics Inc. IMAGE DECODING METHOD AND DEVICE ACCORDING TO A BLOCK DIVISION STRUCTURE IN AN IMAGE ENCODING SYSTEM
CN112602324A (zh) 2018-06-22 2021-04-02 Op方案有限责任公司 块水平几何划分
CN112385231B (zh) * 2018-06-27 2024-01-02 数字洞察力有限公司 图像编码/解码方法和装置
KR20210049822A (ko) * 2018-09-07 2021-05-06 파나소닉 인텔렉츄얼 프로퍼티 코포레이션 오브 아메리카 비디오 코딩 시스템 및 방법
CN111418205B (zh) 2018-11-06 2024-06-21 北京字节跳动网络技术有限公司 用于帧间预测的运动候选
KR20210087450A (ko) 2018-11-06 2021-07-12 베이징 바이트댄스 네트워크 테크놀로지 컴퍼니, 리미티드 기하학적 파티션을 이용한 인터 예측을 위한 사이드 정보 시그널링
WO2020140862A1 (en) 2018-12-30 2020-07-09 Beijing Bytedance Network Technology Co., Ltd. Conditional application of inter prediction with geometric partitioning in video processing
SG11202108103WA (en) 2019-01-28 2021-08-30 Op Solutions Llc Inter prediction in geometric partitioning with an adaptive number of regions
WO2020167097A1 (ko) * 2019-02-15 2020-08-20 엘지전자 주식회사 영상 코딩 시스템에서 인터 예측을 위한 인터 예측 타입 도출
WO2020220037A1 (en) * 2019-04-25 2020-10-29 Beijing Dajia Internet Information Technology Co., Ltd. Methods and apparatuses for video coding with triangle prediction
EP3970372A4 (en) * 2019-06-21 2022-07-20 Huawei Technologies Co., Ltd. ADAPTIVE FILTER STRENGTH SIGNALING FOR GEOMETRIC SEPARATION MODE
MX2021015847A (es) * 2019-06-21 2022-02-03 Huawei Tech Co Ltd Derivacion de ponderacion de muestra croma para modo de particion geometrica.
WO2021015581A1 (ko) * 2019-07-23 2021-01-28 한국전자통신연구원 기하학적 분할을 사용하는 영상 부호화/복호화를 위한 방법, 장치 및 기록 매체
CN110505485B (zh) * 2019-08-23 2021-09-17 北京达佳互联信息技术有限公司 运动补偿方法、装置、计算机设备以及存储介质
CN112204986A (zh) * 2019-09-24 2021-01-08 北京大学 视频编解码的方法和装置
WO2020251421A2 (en) * 2019-10-03 2020-12-17 Huawei Technologies Co., Ltd. Method and apparatus of high-level syntax for non-rectangular partitioning modes
CN114788274A (zh) * 2019-10-10 2022-07-22 北京达佳互联信息技术有限公司 利用三角分区的视频编解码方法和装置
US11533498B2 (en) * 2019-11-21 2022-12-20 Tencent America LLC Geometric partitioning mode in video coding
US11575905B2 (en) 2019-11-27 2023-02-07 Hfi Innovation Inc. Method and apparatus of unified weight and motion indexes derivation for geometric merge mode in video coding
JP7460766B2 (ja) * 2019-12-31 2024-04-02 オッポ広東移動通信有限公司 インター予測方法、エンコーダー、デコーダー、及び記憶媒体
JP7460384B2 (ja) 2020-02-10 2024-04-02 日本放送協会 予測装置、符号化装置、復号装置、及びプログラム
CN111246212B (zh) * 2020-02-21 2022-06-03 北京大学 一种基于编解码端的几何划分模式预测方法、装置、存储介质及终端
EP4262202A1 (en) * 2022-04-13 2023-10-18 Panasonic Intellectual Property Corporation of America Encoder, decoder, encoding method, and decoding method

Family Cites Families (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1142343A1 (en) * 1999-10-29 2001-10-10 Koninklijke Philips Electronics N.V. Video encoding method
EP2819411B1 (en) * 2001-09-14 2018-08-29 NTT DoCoMo, Inc. Coding method and decoding method
US6925125B2 (en) * 2002-01-09 2005-08-02 Hiroshi Akimoto Enhanced aperture problem solving method using displaced center quadtree adaptive partitioning
US7302006B2 (en) * 2002-04-30 2007-11-27 Hewlett-Packard Development Company, L.P. Compression of images and image sequences through adaptive partitioning
KR100506864B1 (ko) * 2002-10-04 2005-08-05 엘지전자 주식회사 모션벡터 결정방법
MY139467A (en) * 2003-01-07 2009-10-30 Thomson Licensing Sa Mixed inter/intra video coding of macroblock partitions
ES2343410T3 (es) * 2003-06-25 2010-07-30 Thomson Licensing Codificacion intertramas con decision rapida de modo.
KR101050828B1 (ko) * 2003-08-26 2011-07-21 톰슨 라이센싱 하이브리드 인트라-인터 코딩된 블록을 디코딩하기 위한 방법 및 장치
JP4313710B2 (ja) 2004-03-25 2009-08-12 パナソニック株式会社 画像符号化方法および画像復号化方法
US8085846B2 (en) * 2004-08-24 2011-12-27 Thomson Licensing Method and apparatus for decoding hybrid intra-inter coded blocks
WO2006052577A2 (en) * 2004-11-04 2006-05-18 Thomson Licensing Method and apparatus for fast mode decision of b-frames in a video encoder
JP2007028393A (ja) * 2005-07-20 2007-02-01 Matsushita Electric Ind Co Ltd 双方向予測符号化ピクチャの直接モードブロックの動きベクトルを求める方法
WO2007092192A2 (en) * 2006-02-02 2007-08-16 Thomson Licensing Method and apparatus for motion estimation using combined reference bi-prediction
BRPI0714859A2 (pt) * 2006-08-02 2013-05-21 Thomson Licensing mÉtodo e aparelho para particionamento geomÉtrico adaptativo para codificaÇço de vÍdeo e estrutura de sinal de vÍdeo para codificaÇço de vÍdeo

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2017183751A1 (ko) * 2016-04-22 2017-10-26 엘지전자(주) 인터 예측 모드 기반 영상 처리 방법 및 이를 위한 장치
US10939099B2 (en) 2016-04-22 2021-03-02 Lg Electronics Inc. Inter prediction mode-based image processing method and device therefor

Also Published As

Publication number Publication date
CN101822056A (zh) 2010-09-01
BRPI0818344A2 (pt) 2015-04-22
US8681855B2 (en) 2014-03-25
JP6318136B2 (ja) 2018-04-25
JP2011501508A (ja) 2011-01-06
WO2009051668A3 (en) 2009-06-04
EP2208350A2 (en) 2010-07-21
KR101555327B1 (ko) 2015-09-23
US20100208818A1 (en) 2010-08-19
KR20140106709A (ko) 2014-09-03
KR101555617B1 (ko) 2015-09-24
WO2009051668A2 (en) 2009-04-23
CN101822056B (zh) 2013-01-02
JP2016054530A (ja) 2016-04-14
JP2014099920A (ja) 2014-05-29

Similar Documents

Publication Publication Date Title
KR101555617B1 (ko) 기하학적으로 분할된 쌍방 예측 모드 분할들을 비디오 인코딩 및 디코딩하기 위한 방법 및 장치
CN113170173B (zh) 变换量化或量化旁路模式的改进方法
TWI816858B (zh) 用於變換矩陣選擇的隱式編碼
CN112823518B (zh) 用于译码块的几何划分块的帧间预测的装置及方法
JP5452584B2 (ja) ビデオ符号化及び復号化におけるテンプレート・マッチング予測(tmp)のための方法及び装置
EP3033886B1 (en) Method of video coding using prediction based on intra picture block copy
KR101382101B1 (ko) 감소된 해상도의 파티셔닝을 위한 방법 및 장치
CN113574880B (zh) 关于子块变换模式的分割
KR20130006616A (ko) 비디오 인코딩 및 디코딩을 위한 암시적인 적응 움직임 벡터 예측자 선택을 위한 방법 및 장치
JP2016507966A (ja) 高効率ビデオコーディングに基づくビデオ情報のスケーラブルコーディングのためのデバイスおよび方法
KR20100021568A (ko) 슬라이스 데이터에 관한 다중 과정 비디오 구문 구조를 지원하는 방법 및 장치
US9503743B2 (en) Methods and apparatus for uni-prediction of self-derivation of motion estimation
CN113841402B (zh) 视频编解码中大块的变换设计
CN114501019A (zh) 关于划分预测
KR20210153725A (ko) 글로벌 모션 벡터들의 효율적인 코딩
JP2023521609A (ja) ビデオコーディングのための方法、コンピュータプログラム及び装置
KR20210153129A (ko) 글로벌 모션을 갖는 프레임들에서의 선택적 모션 벡터 예측 후보들
KR20220002991A (ko) 글로벌 모션을 갖는 프레임들에서의 적응적 모션 벡터 예측 후보들
JP2017073598A (ja) 動画像符号化装置、動画像符号化方法及び動画像符号化用コンピュータプログラム
KR20230060535A (ko) 인터 및 인트라 예측을 갖는 기하학적 파티션 모드에 대한 인트라 모드의 제약
CN110944184A (zh) 视频解码方法及视频解码器
CN110958452A (zh) 视频解码方法及视频解码器
CN113632493B (zh) 变换跳过模式中的子块变换
TWI840401B (zh) 基於多運動模型的跳過和直接模式編碼的視頻塊中的修剪
US20160165235A1 (en) Method of encoding image data, encoder using the method, and application processor including the encoder

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20180816

Year of fee payment: 4

FPAY Annual fee payment

Payment date: 20190910

Year of fee payment: 5