KR101322498B1 - 부호화 장치, 부호화 방법 및 프로그램 - Google Patents

부호화 장치, 부호화 방법 및 프로그램 Download PDF

Info

Publication number
KR101322498B1
KR101322498B1 KR20087018611A KR20087018611A KR101322498B1 KR 101322498 B1 KR101322498 B1 KR 101322498B1 KR 20087018611 A KR20087018611 A KR 20087018611A KR 20087018611 A KR20087018611 A KR 20087018611A KR 101322498 B1 KR101322498 B1 KR 101322498B1
Authority
KR
South Korea
Prior art keywords
gop
flicker
encoding
unit
image data
Prior art date
Application number
KR20087018611A
Other languages
English (en)
Other versions
KR20080096760A (ko
Inventor
카즈시 사토
준이치 타나카
오지 나카가미
위엔 쯔
요이치 야가사키
Original Assignee
소니 주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 소니 주식회사 filed Critical 소니 주식회사
Publication of KR20080096760A publication Critical patent/KR20080096760A/ko
Application granted granted Critical
Publication of KR101322498B1 publication Critical patent/KR101322498B1/ko

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/577Motion compensation with bidirectional frame interpolation, i.e. using B-pictures
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/177Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a group of pictures [GOP]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/107Selection of coding mode or of prediction mode between spatial and temporal predictive coding, e.g. picture refresh
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/114Adapting the group of pictures [GOP] structure, e.g. number of B-frames between two anchor frames
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/46Embedding additional information in the video signal during the compression process
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/80Details of filtering operations specially adapted for video compression, e.g. for pixel interpolation
    • H04N19/82Details of filtering operations specially adapted for video compression, e.g. for pixel interpolation involving filtering within a prediction loop
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/85Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression
    • H04N19/87Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression involving scene cut or scene change detection in combination with video compression

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Picture Signal Circuits (AREA)

Abstract

부호화 대상의 화상 데이터를 구성하는 GOP의 각각에 관해, 당해 GOP를 부호화 후에 복호한 화상 내에서 GOP 단위의 플리커가 시인되기 쉬운 GOP인지의 여부를 판정하도록 구성되어 있는 판정부와, 플리커가 시인되기 쉬운 GOP라고 상기 판정부가 판정한 경우에, 상기 GOP 단위의 플리커를 억제하는 처리를 시행하여 당해 GOP를 부호화하도록 구성되어 있는 부호화부를 갖는 부호화 장치.
Figure R1020087018611
화상 데이터, 플리커, 부호화 장치

Description

부호화 장치, 부호화 방법 및 프로그램{ENCODING DEVICE, ENCODING METHOD, AND PROGRAM}
본 발명은, 화상 데이터의 부호화를 행하는 부호화 장치, 부호화 방법 및 프로그램에 관한 것이다.
근래, 화상 데이터를 디지털로서 취급하고, 그때, 효율이 높은 정보의 전송, 축적을 목적으로 하여, 화상 정보 특유의 용장성(冗長性)을 이용하여, 이산(離散) 코사인 변환 등의 직교 변환과 움직임 보상에 의해 압축하는 H.264/AVC(Advanced Video Coding) 방식에 준거한 장치의 개발이 행하여지고 있다.
그런데, MPEG(Moving Picture Experts Group)2에서는, 참조 프레임의 매수는 2매이고, 현재의 픽처보다도 과거의 참조 픽처은 반드시 1매였다.
이에 대해, H.264/AVC에서는, 복수의 참조 프레임을 갖는 것이 허가됨과 함께, 예를 들면, 도 10(A)에 도시하는 바와 같이, I픽처를 넘어서 보다 과거의 픽처를 참조하는 것도 가능하다.
따라서 I픽처로부터 복호를 시작하여도, 올바르게 복호 가능한지의 여부는 보증되지 않는다. 이것은, 랜덤 액세스 등에서는 매우 큰 문제가 된다. 그래서, H.264/AVC에서는, 도 10(B)에 도시되는 바와 같은, IDR(Instantaneous Decoder Refresh) 픽처라고 불리는 픽처가 규정되어 있다. H.264/AVC에서는, IDR 픽처를 복호할 때에, 메모리에 기억된 참조 프레임, 프레임 번호, POC(Picture Order Count: 픽처의 출력 순서를 나타내는 정보) 등의 복호에 필요한 모든 정보가 리셋된다. 따라서, IDR 픽처를 넘어서, 보다 과거의 픽처를 참조하는 것은 금지되어 있다. 또한, IDR 픽처에서는, 참조 프레임 메모리, 버퍼 등이 초기화된다. IDR 픽처로부터 복호를 시작하면, 올바르게 화상이 복호화되는 것이 보증된다.
발명이 해결하고자 하는 과제
그런데, 시퀀스가 거의 정지화(靜止畵) 등의 움직임이 적은 화상인 경우나, 시퀀스의 일부에 그와 같은 움직임이 적은 영역이 있는 경우에, 당해 화상 또는 당해 영역의 텍스쳐는 I픽처를 참조하여 부호화되고, P, B픽처는 스킵(SKIP)된다. 이로써, 적은 부호량에 의해 양호한 복호 화상을 얻을 수 있다.
그러나, 도 10(B)에 도시한 바와 같은 IDR 픽처가 일정 간격으로 삽입된 경우, 특히 복잡도(액티비티)가 높은 정지화 영역에서는, 화상 상에 존재하는 잡음의 영향에 의해, 디블록 필터의 강도나, 인트라 예측의 방향의 차이가, GOP(Group of Pictures) 경계에서 생기고, 그것이 GOP 단위의 플리커로서 유저에게 화질(畵質)로서 시인(視認)되어 버린다는 문제점이 있다.
상술한 종래 기술의 문제점을 해결하기 위해, GOP 단위의 플리커를 억제할 수 있는 부호화 장치, 그 방법 및 프로그램을 제공하는 것이 요망되고 있다.
과제를 해결하기 위한 수단
상술한 종래 기술의 문제점을 해결하기 위해, 본 발명의 부호화 장치는, 부호화 대상의 화상 데이터를 구성하는 GOP의 각각에 관해, 당해 GOP를 부호화 후에 복호한 화상 내에서 GOP 단위의 플리커가 시인되기 쉬운 GOP인지의 여부를 판정하도록 구성되어 있는 판정부와, 플리커가 시인되기 쉬운 GOP라고 상기 판정부가 판정한 경우에, 상기 GOP 단위의 플리커를 억제하는 처리를 시행하여 당해 GOP를 부호화하도록 구성되어 있는 부호화부를 구비한다.
또한, 본 발명의 부호화 장치는, 부호화 대상의 화상 데이터를 구성하는 GOP의 각각에 관해, 당해 GOP를 부호화 후에 복호한 화상 내에서 GOP 단위의 플리커가 시인되기 쉬운 GOP인지의 여부를 판정하는 판정 수단과, 플리커가 시인되기 쉬운 GOP라고 상기 판정 수단이 판정한 경우에, 상기 GOP 단위의 플리커를 억제하는 처리를 시행하여 당해 GOP를 부호화하는 부호화 수단을 갖는다.
제 2의 발명의 부호화 방법은, 부호화 대상의 화상 데이터를 구성하는 GOP의 각각에 관해, 당해 GOP를 부호화 후에 복호한 화상 내에서 GOP 단위의 플리커가 시인되기 쉬운 GOP인지의 여부를 판정하는 판정 공정과, 플리커가 시인되기 쉬운 GOP라고 상기 판정 공정에서 판정한 경우에, 상기 GOP 단위의 플리커를 억제하는 처리를 시행하여 당해 GOP를 부호화하는 부호화 공정을 갖는다.
제 3의 발명의 프로그램은, 부호화 처리를 행하는 컴퓨터가 실행하는 프로그램으로서, 부호화 대상의 화상 데이터를 구성하는 GOP의 각각에 관해, 당해 GOP를 부호화 후에 복호한 화상 내에서 GOP 단위의 플리커가 시인되기 쉬운 GOP인지의 여부를 판정하는 판정 순서와, 플리커가 시인되기 쉬운 GOP라고 상기 판정 순서에서 판정한 경우에, 상기 GOP 단위의 플리커를 억제하는 처리를 시행하여 당해 GOP를 부호화하는 부호화 순서를 상기 컴퓨터에 실행시킨다.
발명의 효과
본 발명에 의하면, GOP 단위의 플리커를 억제할 수 있는 부호화 장치, 그 방법 및 프로그램을 제공할 수 있다.
도 1은 본 발명의 제 1 실시 형태의 통신 시스템의 전체 구성도.
도 2는 도 1에 도시하는 부호화 회로의 구성도.
도 3은 도 2에 도시하는 GOP 제어 회로의 기능 블록도.
도 4는 도 3에 도시하는 GOP 제어 회로의 처리를 설명하기 위한 플로우 차트.
도 5는 도 3에 도시하는 GOP 제어 회로의 처리를 설명하기 위한 도면.
도 6은 도 2에 도시하는 움직임 예측·보상 회로의 처리를 설명하기 위한 플로우 차트.
도 7은 도 2에 도시하는 선택 회로의 처리를 설명하기 위한 플로우 차트.
도 8은 도 2에 도시하는 레이트 제어 회로의 처리를 설명하기 위한 플로우 차트.
도 9는 본 발명의 제 2 실시 형태의 부호화 장치의 구성도.
도 10은 종래 기술의 문제점을 설명하기 위한 도면.
(도면의 주요 부분에 대한 부호의 설명)
2, 2a : 부호화 장치
10, 10a : GOP 제어 회로
22 : A/D 변환 회로
23 : 화면 재나열 회로
24 : 연산 회로
25 : 직교 변환 회로
26 : 양자화 회로
27 : 가역 부호화 회로
28 : 버퍼
29 : 역양자화 회로
30 : 역직교 변환 회로
31 : 재구성 회로
32 : 디블록 필터
33 : 메모리
41 : 인트라 예측 회로
42 : 움직임 예측·보상 회로
44 : 선택 회로
46 : 레이트 제어 회로
71 : GOP 플리커 판정부
72 : GOP 제어부
<제 1 실시 형태>
이하, 본 발명의 제 1 실시 형태를 설명한다.
우선, 본 실시 형태의 구성 요소와, 본 발명의 구성 요소의 대응 관계를 설명한다.
도 2 및 도 9에 도시하는 GOP 제어 회로(10, 10a)의 GOP 플리커 판정부(71)가 본 발명의 판정 수단의 한 예이다. 또한, GOP 제어 회로(10, 10a)의 GOP 제어부(72), 움직임 예측·보상 회로(42), 선택 회로(44) 및 레이트 제어 회로(46)가, 본 발명의 부호화 수단의 한 예이다.
도 1은, 본 실시 형태의 통신 시스템(1)의 개념도이다.
도 1에 도시하는 바와 같이, 통신 시스템(1)은, 송신측에 마련된 부호화 장치(2)와, 수신측에 마련된 복호 장치(3)를 갖는다.
통신 시스템(1)에서는, 송신측의 부호화 장치(2)에서, 이산 코사인 변환이나 카루넨·루베 변환 등의 직교 변환과 움직임 보상에 의해 압축한 프레임 화상 데이터(비트 스트림)를 생성하고, 당해 프레임 화상 데이터를 변조한 후에, 위성 방송파, 케이블 TV망, 전화 회선망, 휴대 전화 회선망 등의 전송 매체를 통하여 송신한다.
수신측에서는, 수신한 화상 신호를 복조한 후에, 상기 변조시의 직교 변환의 역변환과 움직임 보상에 의해 신장한 프레임 화상 데이터를 생성하여 이용한다.
또한, 상기 전송 매체는, 광디스크, 자기 디스크 및 반도체 메모리 등의 기록 매체라도 좋다.
도 1에 도시하는 복호 장치(3)는 부호화 장치(2)의 부호화에 대응한 복호를 행한다.
이하, 도 1에 도시하는 부호화 장치(2)에 관해 설명한다.
도 2는, 도 1에 도시하는 부호화 장치(2)의 전체 구성도이다.
도 2에 도시하는 바와 같이, 부호화 장치(2)는, 예를 들면, GOP 제어 회로(10), A/D 변환 회로(22), 화면 재나열 회로(23), 연산 회로(24), 직교 변환 회로(25), 양자화 회로(26), 가역 부호화 회로(27), 버퍼(28), 역양자화 회로(29), 역직교 변환 회로(30), 재구성 회로(31), 디블록 필터(32), 메모리(33), 인트라 예측 회로(41), 움직임 예측·보상 회로(42), 선택 회로(44), 레이트 제어 회로(46)를 갖는다.
부호화 장치(2)는, GOP 제어 회로(10)가, 부호화 대상(판정 대상)의 GOP가 GOP 단위의 플리커가 시인(視認)되기 쉽다고 판정한 경우에, 클로즈드 GOP를 오픈 GOP로 변경하는 등의 GOP 단위의 플리커를 억제하는 처리를 행하는 것을 특징으로 하고 있다.
부호화 장치(2)는, H.264/AVC 방식의 부호화를 행하고, 일정 간격으로 IDR 픽처가 삽입되어 있다.
도 2에 도시하는 부호화 장치(2)의 각 구성 요소(회로 등)의 전부 또는 일부는, CPU 등의 처리 회로가 프로그램을 실행하는 형태로 실현하여도 좋다.
이하, 부호화 장치(2)의 구성 요소에 관해 설명한다.
[GOP 제어 회로(10)]
도 3은, 도 1에 도시하는 GOP 제어 회로(10)의 구성도이다.
도 3에 도시하는 바와 같이, GOP 제어 회로(10)는, 예를 들면, GOP 플리커 판정부(71) 및 GOP 제어부(72)를 갖는다.
도 4는, 도 3에 도시하는 GOP 제어 회로(10)의 처리의 한 예를 설명하기 위한 플로우 차트이다.
우선, GOP 플리커 판정부(71)에 관해 설명한다.
GOP 플리커 판정부(71)는, 예를 들면 화면 재나열 회로(23)에서 재나열을 행하는 화상 데이터(S22)의 부호화 대상의 각 GOP를 판정 대상으로 하여, 당해 GOP를 부호화 후에 복호한 화상 내에서 GOP 단위의 플리커가 시인되기 쉬운지의 여부를 판정한다(스텝 ST1).
이때, GOP 플리커 판정부(71)는, 예를 들면, 판정 대상의 GOP가 신 체인지 직후의 GOP인 경우에, 플리커가 시인되기 어려운 GOP라고 판정한다.
또한, GOP 플리커 판정부(71)는, 판정 대상의 GOP의 앞의 GOP를 구성하는 픽처의 복잡도를 기초로, 상기 판정을 행하여도 좋다.
이때, GOP 플리커 판정부(71)는, 예를 들면, MPEG의 TM(Test Mode)5로 규정된 수법으로 산출한 액티비티 데이터를 복잡도로서 이용한다.
구체적으로는, GOP 플리커 판정부(71)는, 액티비티 데이터를 이하와 같이 산출하고 있다.
GOP 플리커 판정부(71)는, 화상 데이터(S2) 내의 프레임 화상의 16화소×16라인의 매크로블록(macroblock)의 휘도 성분을 분할하여 얻어지는 8화소×8라인의 4개의 서브블록(subblock)의 각각에 대해, 각각 하기 식(1)로 표시되는 각 화소의 화소 데이터(Pk)와 그 평균치(P_mean)와의 차분의 제곱 합인 데이터(var_sblk)를 산출한다. 여기서, 서브블록의 화상이 복잡하게 됨에 따라 데이터(var_sblk)의 값이 커진다.
[수식 1]
Figure 112008054522718-pct00001
또한, 상기 식(1)의 화소 데이터(Pk)의 평균치(P_mean)는, 하기 식(2)에 의해 산출된다.
[수식 2]
Figure 112008054522718-pct00002
그리고, GOP 플리커 판정부(71)는, 하기 식(3)으로 표시되는 바와 같이, 4개의 서브블록에 대해 산출한 데이터(var_sblk)의 최소치를 이용하여, 데이터(actj)를 구한다.
[수식 3]
Figure 112008054522718-pct00003
다음에, GOP 플리커 판정부(71)는, 하기 식(4)로 표시되는 바와 같이, 데이터(actj)와, 이전의 프레임 화상에 대해 구한 데이터(actj)의 평균치 데이터(avg_act)를 이용하여, 데이터(actj)를 정규화(正規化)하여 액티비티 데이터(N_actj)를 산출하고 있다.
[수식 4]
Figure 112008054522718-pct00004
GOP 플리커 판정부(71)는, 상술한 액티비티 데이터(N_actj)가 소정의 임계치 이상의 서브블록이 존재하는 경우, 또는 소정수 이상 존재하는 경우에, 플리커가 시인되기 쉽다고 판정한다. 즉, 판정 대상의 GOP가 신 체인지 직후에 존재하지 않은 경우라도, 그 이전의 GOP로, 텍스쳐의 액티비티가 높은 정지화 영역이 존재하지 않는 경우에는, GOP 단위의 플리커가 문제가 되는 일은 없다.
다음에, GOP 제어부(72)에 관해 설명한다.
GOP 제어부(72)는, GOP 플리커 판정부(71)에서 판정 대상의 GOP가 GOP 단위의 플리커가 시인되기 쉽다고 판정된 경우(스텝 ST2)에 이하에 도시하는 처리를 행한다.
즉, GOP 제어부(72)는, 부호화 대상의 GOP가 클로즈드 GOP인지의 여부를 판단하고(스텝 ST3), 클로즈드 GOP라고 판단한 경우에, 그것을 오픈 GOP로 변경한다(스텝 ST4). 이로써, IDR 픽처가 있어도, 당해 IDR 픽처 이후의 픽처가, 당해 IDR 픽처 이전의 픽처를 참조하여 부호화하는 것을 허가한다.
또한, GOP 제어부(72)는, 부호화 대상의 GOP가 오픈 GOP인 경우에, 또는, 오픈 GOP로 변경된 때, 도 5에 도시하는 바와 같이, I픽처 이전의 B픽처의 수(M2)를, I픽처 이후의 I, P픽처 사이의 B픽처의 수(M1)보다 많게 하도록 화면 재나열 회로(23)를 제어한다(스텝 ST5). 도 5에 도시하는 예에서는, M2=3, M1=1이다.
또한, GOP 제어부(72)는, GOP 플리커 판정부(71)에서 판정 대상의 GOP가 GOP 단위의 플리커가 시인되기 쉽다고 판정된 경우에, 이하에 나타내는 바와 같이, 인트라 예측 회로(41), 선택 회로(44) 및 레이트 제어 회로(46)를 제어한다(스텝 ST6).
[A/D 변환 회로(22)]
A/D 변환 회로(22)는, 입력된 아날로그의 휘도 신호(Y), 색차 신호(Pb, Pr)로 구성되는 피(被)부호화 화상 데이터(S10)를 디지털의 화상 데이터(S22)로 변환하고, 이것을 화면 재나열 회로(23)에 출력한다.
[화면 재나열 회로(23)]
화면 재나열 회로(23)는, A/D 변환 회로(22)로부터 입력한 화상 데이터(S22)를, 그 픽처 타입(I, P, B)으로 이루어지는 GOP(Group of Pictures) 구조에 있어서, 부호화하는 순번으로 재나열한 화상 데이터(S23)를 연산 회로(24), 인트라 예측 회로(41), 움직임 예측·보상 회로(42) 및 레이트 제어 회로(46)에 출력한다.
[연산 회로(24)]
연산 회로(24)는, 화상 데이터(S23)와, 선택 회로(44)로부터 입력한 예측 화상 데이터(PI)와의 차분을 나타내는 화상 데이터(S24)를 생성하고, 이것을 직교 변환 회로(25)에 출력한다.
[직교 변환 회로(25)]
직교 변환 회로(25)는, 화상 데이터(S24)에 이산 코사인 변환이나 카루넨·루베 변환 등의 직교 변환을 시행하여 화상 데이터(예를 들면 DCT 계수)(S25)를 생성하고, 이것을 양자화 회로(26)에 출력한다.
[양자화 회로(26)]
양자화 회로(26)는, 레이트 제어 회로(46)로부터 입력한 양자화 파라미터(QP)를 기초로, 당해 양자화 파라미터(QP)에 따라 규정되는 양자화 스케일(양자 화 스텝)로 화상 데이터(S25)를 양자화하여 화상 데이터(S26)를 생성하고, 이것을 가역 부호화 회로(27) 및 역양자화 회로(29)에 출력한다.
[가역 부호화 회로(27)]
가역 부호화 회로(27)는, 화상 데이터(S26)를 가변 길이 부호화 또는 산술(算術) 부호화한 화상 데이터를 버퍼(28)에 격납한다.
이때, 가역 부호화 회로(27)는, 선택 회로(44)로부터 출력되는 선택 데이터(S44)가 인터 예측 부호화를 선택한 것을 나타내는 경우에, 움직임 예측·보상 회로(42)로부터 입력한 움직임 벡터(MV)를 부호화하여 헤더 데이터에 격납한다.
또한, 가역 부호화 회로(27)는, 선택 회로(44)로부터 출력되는 선택 데이터(S44)가 인트라 예측 부호화를 선택한 것을 나타내는 경우에, 인트라 예측 회로(41)로부터 입력한 인트라 예측 모드(IPM)를 헤더 데이터 등에 격납한다.
또한, 가역 부호화 회로(27)는, 화상 데이터(S26)각 매크로블록(MB)에, 양자화 회로(26)에서의 양자화에서 이용한 양자화 스케일을 포함한다.
버퍼(28)에 격납된 화상 데이터는, 변조 등이 된 후에 송신된다.
[역양자화 회로(29)]
역양자화 회로(29)는, 양자화 회로(26)에서 이용한 양자화 스케일을 기초로, 화상 데이터(S26)를 역양자화하여 역직교 변환 회로(30)에 출력한다.
[역직교 변환 회로(30)]
역직교 변환 회로(30)는, 역양자화 회로(29)로부터 입력한 역양자화된 화상 데이터에, 직교 변환 회로(25)의 직교 변환에 대응한 역직교 변환을 시행하여 재구 성 회로(31)에 출력한다.
[재구성 회로(31)]
재구성 회로(31)는, 선택 회로(44)로부터 입력한 예측 화상 데이터(PI)와, 역직교 변환 회로(30)로부터 입력한 화상 데이터를 가산하고, 연산 회로(24)에 입력된 화상 데이터에 대응하는 재구성 화상 데이터를 생성하고, 이것을 디블록 필터(32)에 출력한다.
[디블록 필터(32)]
디블록 필터(32)는, 재구성 회로(31)로부터 입력한 화상 데이터의 블록 왜곡을 제거한 후에, 이것을 참조 화상 데이터(REF)로서 메모리(33)에 기록한다.
[인트라 예측 회로(41)]
인트라 예측 회로(41)는, 미리 규정된 인트라 예측 모드의 각각을 기초로, 메모리(33)로부터 판독한 화상 데이터(참조 화상 데이터(REF))를 구성하는 각 매크로블록(MB)에 인트라 예측 부호를 시행하여 예측 화상 데이터를 생성하고, 당해 예측 화상 데이터와 화상 데이터(S23)와의 차분(DIF41)을 검출한다.
그리고, 인트라 예측 회로(41)는, 상기 복수의 인트라 예측 모드에 대해 각각 생성한 상기 차분중 최소의 차분에 대응하는 인트라 예측 모드를 특정하고, 당해 특정한 인트라 예측 모드(IPM)를 표시하는 신호를 가역 부호화 회로(27)에 출력한다.
또한, 인트라 예측 회로(41)는, 상기 특정한 인트라 예측 모드에 의한 예측 화상 데이터(PI41)와, 상기 차분(DIF41)을 선택 회로(44)에 출력한다.
[움직임 예측·보상 회로(42)]
움직임 예측·보상 회로(42)는, 화상 데이터(S23) 내의 블록을 단위로 하여, 프레임 데이터 및 필드 데이터를 단위로서 움직임 예측 처리를 행하고, 메모리(33)로부터 판독한 참조 화상 데이터(REF)를 기초로 움직임 벡터(MV)를 결정한다.
즉, 움직임 예측·보상 회로(42)는, 화상 데이터(S23) 내의 각 블록에 대해 움직임 벡터(MV)와 참조 화상 데이터(REF)에 의해 규정된 예측 화상 데이터(PI42)와, 화상 데이터(S23)와의 차분(DIF42)을 최소로 하는 움직임 벡터(MV)를 결정한다.
움직임 예측·보상 회로(42)는, 예측 화상 데이터(PI42) 및 차분(DIF42)을 선택 회로(44)에 출력하고, 움직임 벡터(MV)를 가역 부호화 회로(27)에 출력한다.
움직임 예측·보상 회로(42)는, 처리 대상의 블록이 B슬라이스에 포함되어 있는 경우, 앞방향 예측, 뒷방향 예측 및 쌍방향 예측의 어느것으로 하여야 하는지의 판정을 행한다.
이때, 움직임 예측·보상 회로(42)는, 도 6에 도시하는 바와 같이, GOP 제어부(72)에서 판정 대상의 GOP가 GOP 단위의 플리커가 시인되기 쉽다고 판정된 경우에(스텝 ST11), GOP 제어부(72)로부터의 제어에 의거하여, 처리 대상의 GOP 내에서 I픽처보다 전에 존재하는 B픽처에 관해서는, 쌍방향 예측을 우대하는 처리를 행한다(스텝 ST12). 그 밖의 경우, 움직임 예측·보상 회로(42)는, 통상의 움직임 예측·보상 처리를 행한다(스텝 ST13).
구체적으로는, 움직임 예측·보상 회로(42)는, 앞방향 예측, 뒷방향 예측 및 쌍방향 예측의 각각에 관해 부호화 비용(예를 들면 상기 차분(DIF))을 계산하고, 부호화 비용이 최소인 예측 방법을 선택하지만, 이때에, 쌍방향 예측의 부호화 비용에 부(負)의 값(値)의 오프셋을 부여함으로써, 쌍방향 예측이 선택되기 쉽게 한 다.
움직임 예측·보상 회로(42)는, 화상 데이터(S23)가 오클루전(occlusion) 등의 이유로 쌍방향 예측을 행함으로써 복호시의 화질이 현저하게 열화되는 것인지의 여부를 판정하고, 화질이 현저하게 열화된다고 판단한 경우에는 상기 오프셋의 부여는 행하지 않는다.
구체적으로는, 움직임 예측·보상 회로(42)는, L0 방향의 부호화 비용(L0―cost)과, L1 방향의 부호화 비용(L1_cost)이 미리 결정된 임계치 식별 데이터(Θ)에 대해 하기 식(5)의 관계를 충족시킨다고 판단한 경우에는 상기 오프셋의 부여는 행하지 않는다. 여기서, B픽처에서는, 임의의 참조 픽처로부터 최대 2매를 선택하고, 그 2매에 의한 예측을 각각 L0, L1 예측이라고 부른다. L0, L1 방향의 부호화 비용(L0_cost, L1_cost)은, 각각 L0, L1 예측의 부호화 비용을 나타낸다.
[수식 5]
Figure 112008054522718-pct00005
[선택 회로(44)]
선택 회로(44)는, 인트라 예측 회로(41)로부터 입력한 차분(DIF41)과, 움직임 예측·보상 회로(42)로부터 입력한 차분(DIF42)을 비교한다.
선택 회로(44)는, 상기 비교에 의해 인트라 예측 회로(41)로부터 입력한 차분(DIF41)의 쪽이 움직임 예측·보상 회로(42)로부터 입력한 차분(DIF42) 보다 작다고 판단하면, 인트라 예측 회로(41)로부터 입력한 예측 화상 데이터(PI41)를 선택하여 연산 회로(24)에 출력한다.
선택 회로(44)는, 상기 비교에 의해 움직임 예측·보상 회로(42)로부터 입력한 차분(DIF42)의 쪽이 인트라 예측 회로(41)로부터 입력한 차분(DIF41) 보다 작다고 판단하면, 움직임 예측·보상 회로(42)로부터 입력한 예측 화상 데이터(PI42)를 선택하여 연산 회로(24)에 출력한다.
또한, 선택 회로(44)는, 인트라 예측 회로(41)로부터의 예측 화상 데이터(PI41)를 선택한 경우에는 인터 예측 부호화를 선택한 것을 나타내는 선택 데이터(S44)를 가역 부호화 회로(27)에 출력하고, 움직임 예측·보상 회로(42)로부터의 예측 화상 데이터(PI42)를 선택한 경우에는 인트라 예측 부호화를 선택한 것을 나타내는 선택 데이터(S44)를 가역 부호화 회로(27)에 출력한다.
선택 회로(44)는, 도 7에 도시하는 바와 같이, GOP 제어부(72)에서 판정 대상의 GOP가 GOP 단위의 플리커가 시인되기 쉽다고 판정된 경우에(스텝 ST21), GOP 제어부(72)로부터의 제어에 의거하여, 이하의 처리를 행한다.
즉, 선택 회로(44)는, 처리 대상의 블록이 인터 슬라이스에 포함되어 있는 경우, 인트라 예측 회로(41)로부터 입력한 예측 화상 데이터(PI41) 또는 움직임 예측·보상 회로(42)로부터 입력한 예측 화상 데이터(PI42)의 어느 것의 예측 화상 데이터(PI)를 선택하는지(인트라 매크로블록으로 하여야 하는지, 인터 매크로블록으로 하여야 하는지)의 판정을 행할 때에, 그 GOP에서 I픽처보다 전에 존재하는 B픽처에 대해서는 인터 매크로블록을 우대한다(스텝 ST22). 이것은, 예를 들면, 선택 회로(44)에서, 움직임 예측·보상 회로(42)로부터의 차분(DIF42)(부호화 비용)에 부의 값의 오프셋을 가산한 후에, 인트라 예측 회로(41)로부터의 차분(DIF41)과 비교를 행함으로써 실현된다.
GOP 제어부(72)에서 판정 대상의 GOP가 GOP 단위의 플리커가 시인되기 쉽다 고 판정된 경우에는, 선택 회로(44)는 특히 우대를 행하지 않고 통상의 선택을 행한다(스텝 ST23).
[레이트 제어 회로(46)]
레이트 제어 회로(46)는, 버퍼(28)로부터 판독한 화상 데이터(S2)를 기초로 양자화 파라미터(QP)를 결정하고, 이것을 양자화 회로(26)에 출력한다.
레이트 제어 회로(46)는, 도 8에 도시하는 바와 같이, GOP 제어부(72)에서 판정 대상의 GOP가 GOP 단위의 플리커가 시인되기 쉽다고 판정된 경우에, GOP 제어부(72)로부터의 제어에 의거하여, I픽처보다 전에 존재하는 B픽처에 대해, 통상의 B픽처보다 많은 부호량을 할당하도록 양자화 파라미터(QP)를 결정한다(스텝 ST32). 그 밖의 경우에는, 레이트 제어 회로(46)는, 특히 우대를 행하지 않고 통상의 부호량을 할당한다.
이하, 도 2에 도시하는 부호화 장치(2)의 전체 동작예를 설명한다.
부호화 장치(2)는, GOP 제어 회로(10)가, A/D 변환 회로(22)로부터 입력한 화상 데이터(S22) 내의 부호화 대상(판정 대상)의 GOP가 GOP 단위의 플리커가 시인되기 쉬운지의 여부를 판정한다.
그리고, GOP 제어 회로(10)가, 플리커가 시인되기 쉽다고 판정한 경우에, 클로즈드 GOP를 오픈 GOP로 변경하는 등의 GOP 단위의 플리커를 억제하는 처리를 화면 재나열 회로(23)에 행하게 한다.
그리고, 연산 회로(24)는, 화상 데이터(S23)와, 선택 회로(44)로부터 입력한 예측 화상 데이터(PI)와의 차분을 나타내는 화상 데이터(S24)를 생성하고, 이것을 직교 변환 회로(25)에 출력한다.
그리고, 당해 차분은, 직교 변환 회로(25)에서 직교 변환된 후, 양자화 회로(26)에서 양자화된다. 또한, 양자화 후의 화상 데이터가, 역양자화 회로(29)에서 역양자화된 후에, 역직교 변환 회로(30)에서 역직교 변환되고, 화상 데이터(S23)에 상당하는 화상 데이터가 재구성 회로(31)에서 재구성된다.
재구성 회로(31)에서의 재구성으로 얻어진 참조 화상 데이터가 메모리(33)에 기록된다.
또한, 인트라 예측 회로(41)에서 인트라 예측이 행하여지고, 예측 화상 데이터(PI41)와 차분(DIF41)이 선택 회로(44)에 출력된다.
또한, 움직임 예측·보상 회로(42)에서, 움직임 예측·보상 처리가 행하여지고, 움직임 벡터(MV)가 특정됨과 함께, 예측 화상 데이터(PI42)와 차분(DIF42)이 선택 회로(44)에 출력된다.
여기서, 움직임 예측·보상 회로(42)는, 앞방향 예측, 뒷방향 예측 및 쌍방향 예측의 각각에 관해 부호화 비용(예를 들면 상기 차분(DIF42))을 계산하고, 부호화 비용이 최소인 예측 방법을 선택한다. 이때, 움직임 예측·보상 회로(42)는, 플리커가 시인되기 쉽다고 판정된 경우에, 쌍방향 예측의 부호화 비용에 부의 값의 오프셋을 부여함으로써, 쌍방향 예측이 선택되기 쉽게 한다.
그리고, 선택 회로(44)가, 인트라 예측 회로(41)로부터 입력한 차분(DIF41)과, 움직임 예측·보상 회로(58)로부터 입력한 차분(DIF41) 중 작은 쪽의 차분(DIF)에 대응하는 예측 화상 데이터(PI)를 연산 회로(24)에 출력한다.
여기서, 선택 회로(44)는, GOP 제어부(72)에서 판정 대상의 GOP가 GOP 단위의 플리커가 시인되기 쉽다고 판정된 경우에 I픽처보다 전에 존재하는 B픽처에 대해서는 인터 매크로블록을 우대한다.
이상 설명한 바와 같이, 부호화 장치(2)에 의하면, 판정 대상의 GOP가 GOP 단위의 플리커가 시인되기 쉬운 화상인 경우에, GOP 사이의 화상의 비연속성을 회피하고, GOP 단위의 플리커 제어할 수 있다.
이로써, 일정한 시간 간격으로 랜덤 액세스 가능한 픽처(IDR 픽처)를 삽입하는 GOP 구조의 화상 압축 정보를 출력하는 AVC 방식의 부호화 장치에서, GOP 단위의 플리커를 제어할 수 있다.
<제 2 실시 형태>
도 9는, 본 발명의 제 2 실시 형태의 부호화 장치(2a)의 구성도이다.
도 9에 도시하는 바와 같이, 부호화 장치(2a)는, 도 1에 도시하는 부호화 장치(2)에 비하여, A/D 변환 회로(22) 대신에, MPEG2 복호 장치(200)를 마련하고, GOP 제어 회로(10a)에서, MPEG2 복호 장치(200)의 복호 정보(부호화 속성 정보(inf))를 이용하여, 판정 대상의 GOP가 GOP 단위의 플리커가 시인되기 쉬운지의 여부를 판정한다. 부호화 장치(2a)의 그 이외의 구성은, 제 1 실시 형태의 부호화 장치(2)와 같다.
이하, MPEG2 복호 장치(200) 및 GOP 제어 회로(10a)에 관해 설명한다.
MPEG2 복호 장치(200)는, MPEG2 방식 등의 부호화 화상 데이터(S100)를 입력하고, 이것을 복호하여 생성한 화상 데이터(S22)를 화면 재나열 회로(23)에 출력한 다.
또한, MPEG2 복호 장치(200)는, 부호화 화상 데이터(S100)에 포함되는 직교 변환(DCT) 계수나, 움직임 벡터 등의 부호화 속성 정보(inf)를 GOP 제어 회로(10a)에 출력한다.
GOP 제어 회로(10a)는, 부호화 화상 데이터(S100)에 포함되는 부호화 속성 정보(inf)를 기초로, 텍스쳐를 포함하는 정지화 영역인지의 여부, 즉 움직임 벡터 정보가 0이 아닌 비(非)0의 직교 변환 계수를 포함하는지의 여부를 검출함에 의해, 판정 대상의 GOP가 GOP 단위의 플리커가 시인되기 쉬운지의 여부를 판정한다.
본 실시 형태에 의하면, MPEG2 복호 장치(200)가 얻은 부호화 속성 정보(inf)를 유효하게 이용함으로써, GOP 단위의 플리커가 시인되기 쉬운지의 여부를 판정할 수 있다.
본 발명은 상술한 실시 형태로는 한정되지 않는다.
상술한 실시 형태에서는, 부호화 장치(2, 102, 202)가 H.264/AVC로 부호화를 행하는 경우를 예시하였지만, GOP나 IDR가 규정된 다른 부호화 방식에도 적용 가능하다.

Claims (18)

  1. 일정 간격으로 랜덤 액세스 가능한 픽처가 삽입된 부호화 대상의 화상 데이터를 구성하는 복수의 GOP를, 화상 정보 특유의 용장성을 이용하여 직교 변환과 움직임 보상에 의한 부호화 방식으로 부호화 후에 상기 부호화한 GOP를 상기 부호화 방식에 대응하는 복호 방식으로 복호 한 화상에 있어서 GOP를 단위로 하는 플리커가 시인되기 쉬운 GOP인지 아닌지를 판정하는 판정부와,
    상기 판정부에 의해 상기 플리커가 시인되기 쉬운 GOP라고 판정된 경우, 또한, 판정 대상의 GOP가 클로즈드 GOP인 경우에, 상기 판정 대상의 GOP를 오픈 GOP로 변경하고, 상기 변경한 오픈 GOP를 부호화하는 부호화부를 갖는 것을 특징으로 하는 부호화 장치.
  2. 제 1항에 있어서,
    상기 판정부는, 판정 대상의 GOP가 신 체인지 직후의 GOP인 경우, 상기 GOP를 상기 플리커가 시인되기 어려운 GOP라고 판정하는 것을 특징으로 하는 부호화 장치.
  3. 제 1항에 있어서,
    상기 판정부는, 판정 대상의 GOP의 앞의 GOP를 구성하는 화상의 복잡도가 소정의 임계치보다 높은 경우에, 상기 판정 대상의 GOP를 상기 플리커가 시인되기 쉬운 GOP로서 판정하는 것을 특징으로 하는 부호화 장치.
  4. 제 1항에 있어서,
    상기 부호화 화상 데이터를 상기 부호화 방식에 대응하는 복호 방식으로 복호하고 상기 부호화 대상 화상 데이터를 생성하는 생성부를 더 가지고,
    상기 판정부는, 상기 생성부에 있어서 생성된 상기 부호화 대상 화상 데이터에 있어서의 GOP를 단위로 하는 플리커가 시인되기 쉬운 GOP인지 아닌지를 판정하는 것을 특징으로 하는 부호화 장치.
  5. 제 4항에 있어서,
    상기 판정부는, 상기 부호화 화상 데이터에 포함된 직교 변환 계수가 0이 아닌 비(非)0의 직교 변환 계수를 포함하는지 아닌지를 검출하고, 0이 아닌 비(非)0의 직교 변환 계수를 포함하는 경우에, 상기 부호화 대상 화상 데이터에 있어서의 GOP를 단위로 하는 플리커가 시인되기 쉬운 GOP라고 판정하는 것을 특징으로 하는 부호화 장치.
  6. 제 1항에 있어서,
    상기 랜덤 액세스 가능한 픽처는 IDR 화상을 포함하는 것을 특징으로 하는 부호화 장치.
  7. 일정 간격으로 랜덤 액세스 가능한 픽처가 삽입된 부호화 대상의 화상 데이터를 구성하는 복수의 GOP를, 화상 정보 특유의 용장성을 이용하여 직교 변환과 움직임 보상에 의한 부호화 방식으로 부호화 후에 상기 부호화한 GOP를 상기 부호화 방식에 대응하는 복호 방식으로 복호한 화상에 있어서의 GOP를 단위로 하는 플리커가 시인되기 쉬운 GOP인지 아닌지를 판정하는 판정부와,
    상기 판정부에 의해 상기 플리커가 시인되기 쉬운 GOP라고 판정된 경우, 또한, 판정 대상의 GOP가 오픈 GOP인 경우에, 상기 GOP 내의 I픽처 후의 I, P픽처 사이에 존재하는 B픽처의 수에 비하여 I픽처 이전의 B픽처의 수를 많게 하도록 GOP를 구성하고, 상기 구성한 GOP를 부호화하는 부호화부를 갖는 것을 특징으로 하는 부호화 장치.
  8. 일정 간격으로 랜덤 액세스 가능한 픽처가 삽입된 부호화 대상의 화상 데이터를 구성하는 복수의 GOP를, 화상 정보 특유의 용장성을 이용하여 직교 변환과 움직임 보상에 의한 부호화 방식으로 부호화 후에 상기 부호화한 GOP를 상기 부호화 방식에 대응하는 복호 방식으로 복호한 화상에 있어서의 GOP를 단위로 하는 플리커가 시인되기 쉬운 GOP인지 아닌지를 판정하는 판정부와,
    상기 판정부에 의해 상기 플리커가 시인되기 쉬운 GOP라고 판정된 경우에, 상기 GOP 내의 I픽처 보다 이전에 위치하는 B픽처에 관하여, 상기 플리커가 시인되기 쉬운 GOP가 아닌 경우에 비하여, 쌍방향 예측 부호화가 선택되기 쉽도록 제어해 GOP를 구성하고, 상기 구성한 GOP를 부호화하는 부호화부를 갖는 것을 특징으로 하는 부호화 장치.
  9. 일정 간격으로 랜덤 액세스 가능한 픽처가 삽입된 부호화 대상의 화상 데이터를 구성하는 복수의 GOP를, 화상 정보 특유의 용장성을 이용하여 직교 변환과 움직임 보상에 의한 부호화 방식으로 부호화 후에 상기 부호화한 GOP를 상기 부호화 방식에 대응하는 복호 방식으로 복호한 화상에 있어서의 GOP를 단위로 하는 플리커가 시인되기 쉬운 GOP인지 아닌지를 판정하는 판정부와,
    상기 판정부에 의해 상기 플리커가 시인되기 쉬운 GOP라고 판정된 경우에, 상기 판정 대상의 GOP 내의 I픽처 보다 이전에 위치하는 B픽처에 관하여, 상기 플리커가 시인되기 쉬운 GOP가 아닌 경우에 비하여, 인터 부호화가 선택되기 쉽도록 제어해 GOP를 구성하고, 상기 구성한 GOP를 부호화하는 부호화부를 갖는 것을 특징으로 하는 부호화 장치.
  10. 일정 간격으로 랜덤 액세스 가능한 픽처가 삽입된 부호화 대상의 화상 데이터를 구성하는 복수의 GOP를, 화상 정보 특유의 용장성을 이용하여 직교 변환과 움직임 보상에 의한 부호화 방식으로 부호화 후에 상기 부호화한 GOP를 상기 부호화 방식에 대응하는 복호 방식으로 복호한 화상에 있어서의 GOP를 단위로 하는 플리커가 시인되기 쉬운 GOP인지 아닌지를 판정하는 판정부와,
    상기 판정부에 의해 상기 플리커가 시인되기 쉬운 GOP라고 판정된 경우에, 상기 GOP 내의 I픽처 이전에 있는 B픽처에 관하여, 상기 플리커가 시인되기 쉬운 GOP가 아닌 경우에 비하여, 쌍방향 예측 부호화 비용을 내리고, 앞방향 예측, 뒷방향 예측 및 쌍방향 예측 중 부호화 비용이 최소인 예측을 선택해 GOP를 구성하고, 상기 구성한 GOP를 부호화하는 부호화부를 갖는 것을 특징으로 하는 부호화 장치.
  11. 일정 간격으로 랜덤 액세스 가능한 픽처가 삽입된 부호화 대상의 화상 데이터를 구성하는 복수의 GOP를, 화상 정보 특유의 용장성을 이용하여 직교 변환과 움직임 보상에 의한 부호화 방식으로 부호화 후에 상기 부호화한 GOP를 상기 부호화 방식에 대응하는 복호 방식으로 복호한 화상에 있어서의 GOP를 단위로 하는 플리커가 시인되기 쉬운 GOP인지 아닌지를 판정하는 판정부와,
    상기 판정부에 의해 상기 플리커가 시인되기 쉬운 GOP라고 판정된 경우에, 상기 GOP 내의 I픽처 이전에 있는 B픽처에 관하여, 상기 플리커가 시인되기 쉬운 GOP가 아닌 경우에 비하여, 인터 부호화의 상기 부호화 비용을 내리고, 인터 부호화와 인트라 부호화 중 부호화 비용이 최소인 예측을 선택해 GOP를 구성하고, 상기 구성한 GOP를 부호화하는 부호화부를 갖는 것을 특징으로 하는 부호화 장치.
  12. 일정 간격으로 랜덤 액세스 가능한 픽처가 삽입된 부호화 대상의 화상 데이터를 구성하는 복수의 GOP를, 화상 정보 특유의 용장성을 이용하여 직교 변환과 움직임 보상에 의한 부호화 방식으로 부호화 후에 상기 부호화한 GOP를 상기 부호화 방식에 대응하는 복호 방식으로 복호한 화상에 있어서의 GOP를 단위로 하는 플리커가 시인되기 쉬운 GOP인지 아닌지를 판정하는 판정부와,
    상기 판정부에 의해 상기 플리커가 시인되기 쉬운 GOP라고 판정된 경우에, 상기 GOP 내의 I픽처 이전에 있는 B픽처에, 상기 플리커가 시인되기 쉬운 GOP가 아닌 경우에 비하여, 보다 많은 부호량을 할당하도록 양자화 패러미터를 결정하고, 부호화하는 부호화부를 갖는 것을 특징으로 하는 부호화 장치.
  13. 제 1항에 있어서,
    상기 판정부는, 소정의 픽처 이전의 픽처를 참조하지 않는다고 규정된 픽처를 포함하는 GOP를 상기 판정의 대상으로 하는 것을 특징으로 하는 부호화 장치.
  14. 일정 간격으로 랜덤 액세스 가능한 픽처가 삽입된 부호화 대상의 화상 데이터를 구성하는 복수의 GOP를, 화상 정보 특유의 용장성을 이용하여 직교 변환과 움직임 보상에 의한 부호화 방식으로 부호화 후에 상기 부호화한 GOP를 상기 부호화 방식에 대응하는 복호 방식으로 복호한 화상에 있어서의 GOP를 단위로 하는 플리커가 시인되기 쉬운 GOP인지 아닌지를 판정하는 판정 스텝과,
    상기 판정 스텝에 있어서 상기 플리커가 시인되기 쉬운 GOP라고 판정된 경우, 또한, 판정 대상의 GOP가 클로즈드 GOP인 경우에, 상기 판정 대상의 GOP를 오픈 GOP로 변경하고, 상기 변경한 오픈 GOP를 부호화하는 부호화 스텝을 갖는 것을 특징으로 하는 부호화 방법.
  15. 일정 간격으로 랜덤 액세스 가능한 픽처가 삽입된 부호화 대상의 화상 데이터를 구성하는 복수의 GOP를, 화상 정보 특유의 용장성을 이용하여 직교 변환과 움직임 보상에 의한 부호화 방식으로 부호화 후에 상기 부호화한 GOP를 상기 부호화 방식에 대응하는 복호 방식으로 복호 한 화상에 있어서 GOP를 단위로 하는 플리커가 시인되기 쉬운 GOP인지 아닌지를 판정하는 판정 수단과,
    상기 판정 수단에 의해 상기 플리커가 시인되기 쉬운 GOP라고 판정된 경우, 또한, 판정 대상의 GOP가 클로즈드 GOP인 경우에, 상기 판정 대상의 GOP를 오픈 GOP로 변경하고, 상기 변경한 오픈 GOP를 부호화하는 부호화 수단을 갖는 것을 특징으로 하는 부호화 장치.
  16. 제 15항에 있어서,
    상기 판정 수단은, 판정 대상의 GOP의 앞의 GOP를 구성하는 화상의 복잡도가 소정의 임계치보다 높은 경우에, 상기 판정 대상의 GOP를 상기 플리커가 시인되기 쉬운 GOP로서 판정하는 것을 특징으로 하는 부호화 장치.
  17. 제 15항에 있어서,
    상기 부호화 화상 데이터를 상기 부호화 방식에 대응하는 복호 방식으로 복호하고 상기 부호화 대상 화상 데이터를 생성하는 생성 수단을 더 가지고,
    상기 판정 수단은, 상기 생성 수단에 있어서 생성된 상기 부호화 대상 화상 데이터에 있어서의 GOP를 단위로 하는 플리커가 시인되기 쉬운 GOP인지 아닌지를 판정하는 것을 특징으로 하는 부호화 장치.
  18. 컴퓨터에 있어 부호화 처리를 행하는 프로그램을 기록한 기록 매체에 있어서,
    일정 간격으로 랜덤 액세스 가능한 픽처가 삽입된 부호화 대상의 화상 데이터를 구성하는 복수의 GOP를, 화상 정보 특유의 용장성을 이용하여 직교 변환과 움직임 보상에 의한 부호화 방식으로 부호화 후에 상기 부호화한 GOP를 상기 부호화 방식에 대응하는 복호 방식으로 복호한 화상에 있어서의 GOP를 단위로 하는 플리커가 시인되기 쉬운 GOP인지 아닌지를 판정한 처리를 컴퓨터에 실행시키는 판정 프로그램과,
    상기 판정 프로그램의 실행에 의해 상기 플리커가 시인되기 쉬운 GOP라고 판정된 경우, 또한, 판정 대상의 GOP가 클로즈드 GOP인 경우에, 상기 판정 대상의 GOP를 오픈 GOP로 변경하고, 상기 변경한 오픈 GOP를 부호화한 처리를 컴퓨터에 실행시키는 부호화 프로그램을 컴퓨터로 판독 가능하게 기록한 기록 매체 .
KR20087018611A 2006-02-08 2007-02-07 부호화 장치, 부호화 방법 및 프로그램 KR101322498B1 (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2006031220A JP4449915B2 (ja) 2006-02-08 2006-02-08 符号化装置、符号化方法およびプログラム、並びに、記録媒体
JPJP-P-2006-00031220 2006-02-08
PCT/JP2007/052130 WO2007091601A1 (ja) 2006-02-08 2007-02-07 符号化装置、符号化方法およびプログラム

Publications (2)

Publication Number Publication Date
KR20080096760A KR20080096760A (ko) 2008-11-03
KR101322498B1 true KR101322498B1 (ko) 2013-10-28

Family

ID=38345197

Family Applications (1)

Application Number Title Priority Date Filing Date
KR20087018611A KR101322498B1 (ko) 2006-02-08 2007-02-07 부호화 장치, 부호화 방법 및 프로그램

Country Status (12)

Country Link
US (1) US8406287B2 (ko)
EP (1) EP1983760A4 (ko)
JP (1) JP4449915B2 (ko)
KR (1) KR101322498B1 (ko)
CN (1) CN101379834B (ko)
AU (1) AU2007213103A1 (ko)
BR (1) BRPI0707664A2 (ko)
CA (1) CA2641522A1 (ko)
MX (1) MX2008010117A (ko)
RU (1) RU2426270C2 (ko)
TW (1) TW200746840A (ko)
WO (1) WO2007091601A1 (ko)

Families Citing this family (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8625914B2 (en) * 2013-02-04 2014-01-07 Sony Corporation Image processing system, image processing method and program
DE102007060004B4 (de) * 2007-12-13 2009-09-03 Siemens Ag Verfahren und Vorrichtung zum Bestimmen einer Bildqualität
BRPI0907258A2 (pt) * 2008-01-17 2015-07-14 Thomson Licensing Método para medição de oscilação
JP4936557B2 (ja) * 2008-01-24 2012-05-23 キヤノン株式会社 符号化装置
KR101656091B1 (ko) * 2008-03-10 2016-09-08 톰슨 라이센싱 효율성과 주관적 품질의 개선을 지원하는 예측 프레임 선택을 위한 방법 및 장치
EP2345258A4 (en) * 2008-11-12 2012-04-25 Thomson Licensing ELIMINATION OF FRAME SCINTILLE I FOR MULTIPHREAD VIDEO CODING PARALLEL TO THE GOP
EP2347518A4 (en) * 2008-11-12 2012-10-17 Thomson Licensing LIGHT CHANGE CODING
WO2010056315A1 (en) * 2008-11-13 2010-05-20 Thomson Licensing Multiple thread video encoding using gop merging and bit allocation
JP5136470B2 (ja) * 2009-03-06 2013-02-06 富士通株式会社 動画像符号化装置及び動画像符号化方法
JP2011049740A (ja) * 2009-08-26 2011-03-10 Sony Corp 画像処理装置および方法
JP5570846B2 (ja) * 2010-03-04 2014-08-13 株式会社メガチップス 画像符号化装置
JP2011259361A (ja) * 2010-06-11 2011-12-22 Sony Corp 画像処理装置および方法
JP5589924B2 (ja) * 2011-03-25 2014-09-17 Kddi株式会社 フリッカ/シーンチェンジ判定装置及び方法
EP2536143B1 (en) * 2011-06-16 2015-01-14 Axis AB Method and a digital video encoder system for encoding digital video data
US9253482B2 (en) * 2011-11-08 2016-02-02 Texas Insturments Incorporated Method and apparatus for sample adaptive offset without sign coding
US9723314B2 (en) 2012-02-29 2017-08-01 Smsc Holdings Sarl Flicker reduction circuit and method for compressed video transmission
US20160360219A1 (en) * 2015-06-05 2016-12-08 Apple Inc. Preventing i-frame popping in video encoding and decoding
SG11201710829WA (en) 2015-06-30 2018-02-27 Glytech Inc Albumin-sugar chain complex
JP6270293B1 (ja) * 2016-11-01 2018-01-31 Nttエレクトロニクス株式会社 動画像符号化装置および動画像符号化方法
JP6874844B2 (ja) 2017-07-19 2021-05-19 日本電気株式会社 動画像符号化装置、動画像符号化方法、及び、動画像符号化プログラム
WO2019084792A1 (zh) * 2017-10-31 2019-05-09 深圳市大疆创新科技有限公司 一种编码方法及装置
TWI680675B (zh) * 2017-12-29 2019-12-21 聯發科技股份有限公司 影像處理裝置與相關的影像處理方法
CN111314700B (zh) * 2020-03-03 2021-09-07 眸芯科技(上海)有限公司 抑制呼吸效应的视频编码方法及装置

Family Cites Families (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0750839A (ja) 1993-08-06 1995-02-21 Matsushita Electric Ind Co Ltd 動画像の符号化方法
JPH10191355A (ja) 1996-12-26 1998-07-21 Sony Corp 映像信号切換装置およびその方法
JP4462643B2 (ja) 1997-04-25 2010-05-12 ソニー株式会社 画像符号化方法及び画像符号化装置
JP4123567B2 (ja) * 1998-04-30 2008-07-23 ソニー株式会社 画像信号処理装置及び方法
US6859496B1 (en) * 1998-05-29 2005-02-22 International Business Machines Corporation Adaptively encoding multiple streams of video data in parallel for multiplexing onto a constant bit rate channel
US6658157B1 (en) * 1999-06-29 2003-12-02 Sony Corporation Method and apparatus for converting image information
JP2002010263A (ja) 2000-06-20 2002-01-11 Mitsubishi Electric Corp 動画像符号化装置および動画像符号化方法
US7023924B1 (en) * 2000-12-28 2006-04-04 Emc Corporation Method of pausing an MPEG coded video stream
US6980594B2 (en) * 2001-09-11 2005-12-27 Emc Corporation Generation of MPEG slow motion playout
JP3928424B2 (ja) * 2001-12-26 2007-06-13 コニカミノルタビジネステクノロジーズ株式会社 動画におけるフリッカ補正
JP4288897B2 (ja) 2002-06-05 2009-07-01 ソニー株式会社 符号化装置及び方法、プログラム、記録媒体
JP2004056234A (ja) 2002-07-17 2004-02-19 Nec Corp 画像符号化装置および画像符号化方法
KR20050078099A (ko) * 2004-01-30 2005-08-04 삼성전자주식회사 적응적으로 키 프레임을 삽입하는 비디오 코딩 장치 및 방법
WO2006070787A1 (ja) * 2004-12-28 2006-07-06 Nec Corporation 動画像符号化方法、及びこれを用いた装置と、コンピュータプログラム
US8036270B2 (en) * 2006-07-27 2011-10-11 Sharp Laboratories Of America, Inc. Intra-frame flicker reduction in video coding

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
HARA et al, "Flicker reduction technique in MPEG-2 video by post-processing", 2005 Gigest of technical papers. International conference on consumer electronics, pp 327-328(2005.01.08. 공개). *
HARA et al, "Flicker reduction technique in MPEG-2 video by post-processing", 2005 Gigest of technical papers. International conference on consumer electronics, pp 327-328(2005.01.08. 공개).*

Also Published As

Publication number Publication date
US20090046092A1 (en) 2009-02-19
EP1983760A4 (en) 2012-09-05
EP1983760A1 (en) 2008-10-22
AU2007213103A1 (en) 2007-08-16
RU2008132608A (ru) 2010-02-20
JP4449915B2 (ja) 2010-04-14
JP2007214785A (ja) 2007-08-23
TWI339532B (ko) 2011-03-21
RU2426270C2 (ru) 2011-08-10
TW200746840A (en) 2007-12-16
CN101379834A (zh) 2009-03-04
MX2008010117A (es) 2008-11-06
US8406287B2 (en) 2013-03-26
CN101379834B (zh) 2011-07-06
KR20080096760A (ko) 2008-11-03
BRPI0707664A2 (pt) 2011-05-10
CA2641522A1 (en) 2007-08-16
WO2007091601A1 (ja) 2007-08-16

Similar Documents

Publication Publication Date Title
KR101322498B1 (ko) 부호화 장치, 부호화 방법 및 프로그램
US11538198B2 (en) Apparatus and method for coding/decoding image selectively using discrete cosine/sine transform
US10349051B1 (en) Adaptive filtering based upon boundary strength
US8208545B2 (en) Method and apparatus for video coding on pixel-wise prediction
US20050201633A1 (en) Method, medium, and filter removing a blocking effect
US8432964B2 (en) Image processing device, method, and program
US8948243B2 (en) Image encoding device, image decoding device, image encoding method, and image decoding method
US20070081589A1 (en) Adaptive quantization controller and methods thereof
US20070171970A1 (en) Method and apparatus for video encoding/decoding based on orthogonal transform and vector quantization
KR20110045026A (ko) 압축 도메인에서 유사성 메트릭에 기초한 비디오 코딩의 지능형 프레임 스키핑
KR101394209B1 (ko) 영상의 인트라 예측 부호화 방법
KR20050074286A (ko) 화상 부호화 장치, 화상 부호화 방법 및 화상 부호화프로그램
JP4655791B2 (ja) 符号化装置、符号化方法およびそのプログラム
RU2808075C1 (ru) Способ кодирования и декодирования изображений, устройство кодирования и декодирования и соответствующие компьютерные программы
KR20090037288A (ko) 동영상 부호화 데이터율 제어를 위한 실시간 장면 전환검출 방법, 이를 이용한 영상통화 품질 향상 방법, 및영상통화 시스템

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant