KR980011300A - 입체 디지털 비디오 인코딩을 위한 속도제어 - Google Patents

입체 디지털 비디오 인코딩을 위한 속도제어 Download PDF

Info

Publication number
KR980011300A
KR980011300A KR1019970030742A KR19970030742A KR980011300A KR 980011300 A KR980011300 A KR 980011300A KR 1019970030742 A KR1019970030742 A KR 1019970030742A KR 19970030742 A KR19970030742 A KR 19970030742A KR 980011300 A KR980011300 A KR 980011300A
Authority
KR
South Korea
Prior art keywords
picture
enhancement layer
image
coding
bit
Prior art date
Application number
KR1019970030742A
Other languages
English (en)
Inventor
첸 쑤에민
Original Assignee
로버트 에이. 스코트
제너럴 인스트푸먼트 코포레이션
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 로버트 에이. 스코트, 제너럴 인스트푸먼트 코포레이션 filed Critical 로버트 에이. 스코트
Publication of KR980011300A publication Critical patent/KR980011300A/ko

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/177Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a group of pictures [GOP]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N13/00Stereoscopic video systems; Multi-view video systems; Details thereof
    • H04N13/10Processing, recording or transmission of stereoscopic or multi-view image signals
    • H04N13/194Transmission of image signals
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/114Adapting the group of pictures [GOP] structure, e.g. number of B-frames between two anchor frames
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/115Selection of the code volume for a coding unit prior to coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/124Quantisation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/124Quantisation
    • H04N19/126Details of normalisation or weighting functions, e.g. normalisation matrices or variable uniform quantisers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • H04N19/152Data rate or code amount at the encoder output by measuring the fullness of the transmission buffer
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/157Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
    • H04N19/159Prediction type, e.g. intra-frame, inter-frame or bidirectional frame prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/172Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a picture, frame or field
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/30Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/597Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding specially adapted for multi-view video sequence encoding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N13/00Stereoscopic video systems; Multi-view video systems; Details thereof
    • H04N13/10Processing, recording or transmission of stereoscopic or multi-view image signals
    • H04N13/106Processing image signals
    • H04N13/15Processing image signals for colour aspects of image signals
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N13/00Stereoscopic video systems; Multi-view video systems; Details thereof
    • H04N13/10Processing, recording or transmission of stereoscopic or multi-view image signals
    • H04N13/106Processing image signals
    • H04N13/167Synchronising or controlling image signals
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N13/00Stereoscopic video systems; Multi-view video systems; Details thereof
    • H04N13/10Processing, recording or transmission of stereoscopic or multi-view image signals
    • H04N13/189Recording image signals; Reproducing recorded image signals
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N13/00Stereoscopic video systems; Multi-view video systems; Details thereof
    • H04N13/20Image signal generators
    • H04N13/204Image signal generators using stereoscopic image cameras
    • H04N13/207Image signal generators using stereoscopic image cameras using a single 2D image sensor
    • H04N13/218Image signal generators using stereoscopic image cameras using a single 2D image sensor using spatial multiplexing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N13/00Stereoscopic video systems; Multi-view video systems; Details thereof
    • H04N13/20Image signal generators
    • H04N13/204Image signal generators using stereoscopic image cameras
    • H04N13/239Image signal generators using stereoscopic image cameras using two 2D image sensors having a relative position equal to or related to the interocular distance
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N13/00Stereoscopic video systems; Multi-view video systems; Details thereof
    • H04N13/20Image signal generators
    • H04N13/296Synchronisation thereof; Control thereof
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • H04N19/149Data rate or code amount at the encoder output by estimating the code amount by means of a model, e.g. mathematical model or statistical model
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • H04N19/15Data rate or code amount at the encoder output by monitoring actual compressed data size at the memory before deciding storage at the transmission buffer
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N13/00Stereoscopic video systems; Multi-view video systems; Details thereof
    • H04N2013/0074Stereoscopic image analysis
    • H04N2013/0085Motion estimation from stereoscopic image signals

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Testing, Inspecting, Measuring Of Stereoscopic Televisions And Televisions (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

입체 디지털 비디오 통신시스템의 속도제어는 프레임이 일시적 예측(동일층으로부터)인지 또는 불일치 예측(반대층으로부터)인지에 따라 인헨스먼트층에 P 또는 B-프레임 데이터의 양자화 레벨을 변경함으로써, 수행된다. 본 발명은 예컨대, P-프레임이 인헨스먼츠층에 B-프레임으로부터 인코드되는 불일치-예측 P-화상에 추가적인 양자화 비트를 제공함으로써, 일관된 이미지 특성을 유지할 수 있다. 선택된 양자화 레벨은 인헨스먼트층의 전체 비트율 요구에 대응한다. 불일치 예측 P-프레임에 대한 양자화 스텝사이즈는 어느쪽이 더 크더라도, 인헨스먼트층에 인코드되는 프레임 또는 기준 프레임의 활성레벨에 따라 변경된다. 또한, 이미지 특성이 개선되고, 화상 데이터에 랜덤 억세스를 요구하는 고속 순방향 및 고속 역방향과 같은 모드 편집동안 프리즈업이 방지된다. 베이스층에 기준 프레임이 GOP의 제1프레임일 경우, 대응하는 인헨스먼트층 프레임은 이미지 특성을 개선하기 위하여 B프레임 대신에 I 또는 P프레임으로 인코드될 것이고, 랜덤 억세스동안 에러전파가 제거되거나 감소될 것이다.
대표도:제3도

Description

입체 디지털 비디오 인코딩을 위한 속도제어
제1도는 종래의 MPEG MVP 시스템의 일시적 그리고 불일치 예측체계를 나타낸 도면.
제2도는 본 발명에 따른 초기 GOP 나 리프레쉬 주기 서브루틴을 나타낸 도면.
제3도는 본 발명에 따른 인헨스먼트층 시퀀스에 대한 화상층 타이밍을 나타낸 도면.
제4도는 본 발명에 따른 현재 화상의 전처리과정에 대한 서브루틴을 나타낸 도면.
제5도는 본 발명에 따른 이전화상의 후처리과정에 대한 서브루틴을 나타낸 도면.
제6도는 본 발명에 따른 화상분배구성을 나타낸 도면이다.
[발명이 속하는 기술분야 및 그 분야의 종래기술]
본 발명은 디지털 비디오신호의 인코딩에 관한 것이다. 특히, 신호의 대역폭을 유지하면서 화상의 질을 최적화 하기 위해 입체 디지털 비디오신호를 인코딩하기 위한 수단과 장치에 관한 것이다. 또한 고속 순방향이나 고속 역방향과 같이 비디오의 편집에 관한 화상의 특성을 개선한 장치와 관련된다.
디지털 기술은 아날로그 기술보다 고화질의 신호를 전달하고, 과거에는 사용할 수 없었던 비디오의 전송을 제공하게 됨으로써, 비디오와 오디오의 전송에 큰 변화를 주었다. 디지털 시스템은 특히 케이블 텔레비젼망에 의한 방송신호와 위성방송에 가입한 케이블 텔레비젼이나 가정용 위성 텔레비젼수신기에 의한 위성방송의 신호에 대해서 장점을 가지고 있다. 상기와 같은 시스템에 있어서, 가입자는, 원래 비디오 및 오디오신호를 복구하기 위하여 데이터를 감압하고 디코드하는 수신기를 통하여 디지털 데이터 스트림을 수신한다. 디지털 수신기는 아래와 같은 처리를 행하기 위한 마이크로컴퓨터와 메모리저장 요소를 포함한다.
그러나 수신기의 저렴화로 인해 많은 양의 데이터의 처리를 요구하는 고화질의 서비스는 제한적이다. 더욱이, 디지털신호의 전송을 위한 사용 주파수 대역폭은 통신규약의 존재와 정부의 규제, 그리고 물리적 제약으로 인해 제한적이다. 따라서, 특수한 비디오에 있어서, 근접한 화소간에 공간상응관계를 이용한 다양한 내부구조 데이터 압축 체계이 개발되었다.
더욱이, 내부화면 데이터 압축 체계는 데이터 보상과 구역결합 모션 및 추정연산 모션에 의해 연속적인 화면에 일치하는 영역사이의 일시적인 상응관계를 이용한다. 상기의 경우에, 현재의 구역과 가장 유사한 이전의 구역을 동일시함으로서 현재비디오에 있는 각 구역에 대한 모션벡터를 결정한다. 일치하는 쌍들의 확인에 필요한 모션벡터와 함께 일치하는 구역쌍들 사이의 차이점을 표현하는 데이터를 보냄으로서, 전체의 현재화상이 디코더에서 재구축되어 질수 있다. 구역결합 모션 추정연산은 DCT(discrete cosine transform)과 같은 구역에 기초한 공간 압축기술과 결합되어 질때 특히 효과적이다.
그러나, 동비디오 전문가 그룹(Motion Picture Experts Group;MPEG) MPEG-2 다중비디오프로파일(Multi-view Profile;MVP)시스템과 같이 제안된 입체전송형식에 의해 더 큰 목표가 제기된다. 상기 MVP 시스템에 관한 상세한 설명은 1995년 11월에 발표된 서명"Proposed Draft Amendment No.3 to 13818-2(Multi-view Profile)," 서류번호 ISO/IEC JTC1/SC29/WG11 N1088 을 참고한다. 입체비디오는 3차원 효과를 나타내고 상의 깊이를 가지는 복합 이미지를 만들기위해 같은 이미지의 어긋남 비디오(offset view)를 제공한다. 상기와 같은 시스템에서, 1개의 상을 2개의 분리된 비디오신호로 기록하기 위해 2개의 카메라가 2인치정도의 거리를 두고 위치할 수 있다.
카메라간의 공간은 대략 인간의 양쪽눈의 거리이다. 더욱이 어떤류의 입체비디오 캠코드는 2개의 렌즈가 하나의 본체에 설치되어 동시에 움직인다. 예컨데, 상을 가로지르는 패닝을 할때 2개의 카메라신호가 전송되어지고 인간의 비디오와 일치하는 3차원의 비디오를 생산하는 수신기에서 재조합될 수 있다.
MPEG MVP 시스템은 다중신호로 전송되어지는 2개의 비디오층을 포함한다. 첫째, 베이스층은 3차원 대상의 왼편 부분을 표현한다. 둘쩨 인헨스먼트층은 대상의 오른편을 표현한다. 상의 왼/오른편은 같은 대상이고 각각에 관련하여 조금씩 오프셋(offset)이 있다. 베이스층과 인헨스먼트층 사이는 또한 많은 상응관계가 존재한다. 상기 상응관계는 베이스층에 관한 인헨스먼트층 데이터를 압축하는데 사용되어질 수 있다. 또한 이러한 상응관계는 주어진 비디오의 화질을 유지하기 위한 인헨스먼트층의 전송에 필요한 많은 양의 데이터를 감소할 수 있다.
MPEG MVP 시스템은 비디오화상의 3가지 형태를 포함한다; 특히, 내부코드 화상(I-화상), 예측코드 화상(P-화상), 양방향 얘측코드 화상(B-화상). 게다가 베이스층은 화면이나 바탕구조비디오시퀀스중에 하나를 조절하는 반면, 인헨스먼트층은 오직 화면구조만을 조절한다. I-화상은 완전히 어떤 다른 화상을 참조하지 않고 단일 비디오화상을 묘사한다. 개선된 에러를 감추기위해, 모션벡터가 I-화상에 포함될 수 있다. 베이스층의 P-화상과 B-화상이 I-화상으로부터 예측되기 때문에 I-화상의 에러는 디스플레이된 비디오에 더 큰 영향을 줄 가능성이 있다. 더욱이, 인헨스먼트층의 화상은 불일치 예측으로 알려진 교차층 예측과정의 베이스층 화상으로부터 예측될 수 있다. 층 내부의 한 화면에서 다른 화면의 예측은 일시적예측으로 알려진다.
베이스층에서, P-화상은 과거의 I-화상이나 P-화상을 기초로 예측된다. 기준은 이전 I-화상과 P-화상으로부터 미래의 P-화상까지이고 선행예측으로 알려진다. B-화상은 가장 근접한 이전의 I-화상이나 P-화상 그리고 가장 근접한 이후의 I-화상이나 P-화상으로부터 예측되어 진다.
인헨스먼트층에서는, 화상형태에 상관없이 인헨스먼트층의 가장 최근에 복호화된 화상으로 부터 예측되거나, 가장 최근의 베이스층 화상으로부터 형태에 상관없이 디스플레이 지시에 따라 P-화상이 예측되어질 수 있다. 더욱이, 인헨스먼트층의 B-화상과 더불어 디스플레이 지시에 따라 선행참고화상이 인헨스먼트층에서 가장 최근에 복호화된 화상이고, 후행참고화상은 베이스층에서 가장 최근의 화상이다. 인헨스먼트층에서 B-화상은 인헨스먼트층의 다른 화상들을 위해 참고될 수 있기 때문에 인헨스먼트층의 P와 B-화상을 위한 비트할당이 화상 내의 이미지의 컴플렉시티(예컨대, 활성)를 기초로 조정되어야 한다. 임의의 배치에 있어서, 인헨스먼트층은 I-화상을 제외한 P-화상과 B-화상을 가지고 있다.
미래화상(즉, 아직 디스플레이되지 않은 화상)의 참고는 후행예측이라 불린다. 후행예측이 압축비의 증가에 매우 유용한 경우가 많이 있다. 예를 들면, 도어(door)를 여는 장면에 있어서, 현재의 화상은 도어가 이미 열려져 있는 미래의 화상을 기초로 도어의 뒤에 있는 것을 예측할 수 있다.
B-화상은 대부분의 압축을 행하고 또한 대부분의 에러를 발생시킨다. 에러의 확대를 제거하기위해, B-화상은 베이스층의 다른 B-화상으로부터 예측되어져서는 안된다. P-화상은 적은 에러와 압축을 발생시킨다. I-화상은 최저의 압축을 행하지만, 랜덤억세스를 제공할 수 있다.
따라서, 베이스층에서 P-화상을 디코드하기위해, 이전의 I-화상이나 P-화상이 사용되어져야 한다.
마찬가지로, B-화상을 디코드하기 위해서는, 이전의 P-화상이나 I-화상 그리고 미래의 P-화상이나 I-화상이 사용되어져야 한다. 따라서 비디오화상들은 부가적인 지시에서 인코드되고 전송되어진다. 예측에 사용된 그러한 모든 화상들은 화상들이 거기서부터 예측되기전에 인코드되어진다. 인코드된 신호가 디코더에 수신되어질때, 비디오화상은 디코드되고 디스플레이를 위해 재명령되어진다. 따라서, 디스플레이되기 전의 데이터를 완충시키기위해 일시적인 저장 장치가 요구되어진다.
2차원 비디오신호에 대한 MPEG-2 표준은 I-화상, P-화상 그리고 B-화상이 층내의 시퀀스 내부에서 취해야하는 어떤 특별한 분류를 상술하지는 않는다. 그러나 MPEG-2 표준은 압축과 랜덤 억세스의 각 등급으로 여러가지 분류를 할 수 있다. 베이스층에서의 공통적인 분류는 I-화상과 B-화상 사이에 2개의 B-화상을 가져야 한다. 화상들의 시퀀스는 예컨대 I1, B1, B2, P1, B3, B4, I2, B5, B6, P2, B7, B8, I3, 등 일 수 있다. 인헨스먼트층에서, 12개의 P와 B-화상, 예컨대 일련의 I1, B1, B2, P1, B3, B4, P2, B5, B6, P3, B7, B8, I2 에 대하여 제공된 I-화상과 더불어 P-화상이 이어질 수 있다. MPEG-2 표준에 대한 자세한 설명은 1994년 3월 25일에 발표된 서명"Information Technology - Generic Coding of Moving Pictures and Associated Audio, Recommendation H.262"의 서류번호 ISO/TEC JTC1/SC29/WG11 NO702에 참고되어 있다.
도1은 MPEG MVP 시스템의 종래의 일시적 그리고 불일치 비디오화상 예측체계을 나타낸다.
화살표의 앞부분은 예측방향을 지시하고 있다. 화살표의 앞부분에 의해 지적된 화상은 화살표의 뒷부분에 연결된 화상을 기초로 예측되어져 있다. Ib 155, Bb1 160, Bb2 165, Pb 170의 베이스층(왼편에서 볼때) 시퀀스 150에서 일시적 예측이 발생한다(부호"b"는 베이스층을 의미한다). 특히, Bb1 160은 Ib 155와 Pb 170으로부터 예측되어지고 Bb2 165는 Ib 155와 Pb 170으로부터 예측되고 Pb 170은 Ib 155로부터 예측되어 진다. Pe 105, Be1 110, Be2 115, 그리고 Be3 120의 인헨스먼트층(오른편에서 볼때) 시퀀스 100에서 일시적이고 불일치 예측이 발생한다. 특히, Pe 105는 Ib 155로부터 불일치하게 예측된다. Be1 110은 Pe 105로부터 일시적으로 예측되고 Bb1 160에서 불일치 예측된다. Be2 115는 Be1 110에서 일시적으로 예측되고 Bb2 165에서 불일치 예측된다. Be3 120은 Be2 115에서 일시적으로 예측되고 Pb 170에서 불일치 예측된다.
일반적으로, MPEG MVP 시스템의 베이스층은 메인 프로파일(Main Profile(MP)) 규약에 따라 코딩된다. 반면에 인헨스먼트층은 MPEG-2 임시측정기구(Tempral scalability tools)에 따라 코딩된다.
고정 대역폭 입체비디오서비스에 있어서, 베이스와 인헨스먼트층의 다중통신을 포함하는 출력 비트스트림은 주어진 비트율이나 상응하는 대역폭을 초과해서는 안된다. 이러한 결과는 각 층에 대한 비트속도가 주어진 한계치를 초과하지않는 베이스와 인헨스먼트층에서 분배율제어체계로 도달될 수 있다. 그리고 2개의 비트속도의 합은 전체의 대역폭 필요조건을 만족시킨다. 결합된 비트속도가 전체의 대역폭 필요조건을 일치하는 동안 각 층의 비트속도는 다양하게 변화할 수 있다.
더욱이, 속도제어체계 인헨스먼트층에서 모든 비디오형태(예컨대, I, P, 그리고 B-화상)에 비교적 일정한 비디오신호의 수준을 제공해야 하고, MPEG MVP 시스템에서 비디오버퍼검공기(Video Buffering Verifier(VBV)) 모델과 일치해야 한다. VBV 는 인코더의 출력과 개념적으로 연결된 가상의 디코더이다. 인코드된 데이터는 현재 사용되어지고 있는 일정한 비트 속도로 버퍼에 위치하고 있고, 가장 오랫동안 버퍼에 존재하고 있는 데이터로부터 제거된다. 인코더나 에디터에 의해 발생된 비트스트림은 VBV가 오버플로워나 언더플로워를 발생시키지 않도록 요구되어 진다.
종래의 시스템에서는, 인헨스먼트층의 P-화상의 특성은 P-화상이 일시적으로 예측된 것이지 아니면 불일치 예측된 것인지에 의해 변화할 수 있다. 예컨대, 오른편으로의 카메라 패닝의 장면동안, 일정한 양자화 레벨로, 인헨스먼트층의 B-화상으로부터 일시적으로 예측된 P-화상은 베이스층의 I-화상으로부터 불일치 예측된 화상보다 화질이 떨어질 수 있다. 앞서 언급되었지만, 상기의 사실은 B-화상이 가장 많은 압축을 행하지만 또한 가장 많은 에러를 포함하고 있기 때문이다. 대조적으로, 베이스층의 P-화상의 화질은 B-화상이 베이스층의 기준화상으로 사용되지 않을 수 있기 때문에 유지되어 진다. P-화상 이미지의 화질은 P-화상 데이터의 평균양자화 스텝사이즈에 일치한다.더욱이, 고속 순방향과 고속 역방향과 같은 편집동작들은 용자가 지시하는 명령에 응하여 디코더 터미널에서 이행될 수 있다. 화상그룹(Group of Picture;GOP)이나 재생주기프레임이 베이스층, 인헨스먼트층과 다를 수 있기 때문에 상기의 편집동작들은 인코딩 에러가 될 수 있고, 각각의 시작위치가 일시적으로 어긋날 수 있다. GOP 는 한개의 화상이나 그 이상의 연속적인 화상으로 구성되어져 있다. 화상이 디스플레이되는 순서와 코더화된 버젼이 비트스트림에 발생하는 순서는 서로 상이하다. 비트스트림에서, GOP 의 첫번째 프레임은 항상 I-화상이다. 그러나 디스플레이 순서에서, GOP 의 첫번째 화상은, 첫번째 I-화상에 선행하는 일련의 B-화상들중 첫번째 B-화상이거나 아니면 I-화상이다. 게다가, 디스플레이 순서에서, GOP 의 마지막 화상은 항상 I 이거나 P-화상이다.
더욱이, 비트스트림에서 코드화된 I-프레임에 따르는 첫번째 연속적인 B-화상들이 랜덤억세스의 경우에 적절히 재구축될 수 있는가를 비트스트림의 코드화된 I-프레임이 디코더에 지시하기 바로 전에 GOP 헤더가 사용된다. 여기에서 I-프레임은 기준 프레임으로서 사용될 수 없다. 비록 I-프레임이 사용되지 않을때라도, B-화상은 하부의 I-프레임이나 P-프레임으로부터 오직 후행 예측하여 재구축될 수 있다.
편집동작동안 GOP 헤더에 즉각 따르지 않는 프레임이 디스플레이 되도록 요구되어질때 베이스와 인헨스먼트층 프레임 사이의 동기화가 파괴되어질 수 있다. 상기의 사실은 프레임 프리즈업이나 최종 비디오이미지에 다른 손상을 주는 불연속현상을 불러 일으킬 수 있다.
따라서, 일시적 예측이거나 불일치 예측되어지는 화상에 의존하여 인헨스먼트층의 P-화상의 양자화 레벨을 조절하는 MPEG MVP 시스템과 같은 입체 비디오시스템은 속도제어체계를 제공하는 잇점이 있다. 상기 체계는 인코드된 화상과 기준 프레임의 컴플렉시티 레벨을 더 자세히 설명해야 한다. 상기 체계는 또한 단일한 형태의 이미지 수준을 제공하고 프레임 프리즈업을 피하면서 잠재적인 편집동작동안의 데이터속도요청을 설명할 수 있어야 한다. 본 발명은 상기의 것들과 또한 다른 잇점들을 제공한다.
[발명이 이루고자 하는 기술적 과제]
본 발명은 상기한 점을 감안하여 발명된 것으로, 본 발명에 따른 속도제어의 수단과 장치들은, 프레임이 일시적으로 예측된 것인지(동층으로부터) 아니면 불일치 예측된 것인지(다른 층으로부터)에 의존하여 인헨스먼트층에서의 P나 B-프레임의 양자화 레벨을 조절하기 위한 입체 디지털 비디오통신시스템의 양방향전송용 인코더를 사용하는 것에 그 목적이 있다.
[발명의 구성 및 작용]
본 발명은 불일치 예측된 P-화상(예컨대, P-프레임은 베이스층의 B-프레임으로부터 인코드될 수 있다)에 대해 추가적인 양자화 비트를 제공함으로써, 일정한 수준의 이미지를 유지할 수 있게 한다.선택된 양자화 레벨은 인헨스먼트층의 전체적인 비트속도요청과 right_bit_rate, 그리고 가상기억버퍼 충만파라미터, Vr 등에 일치한다.
더욱이, 많은 경우에 있어서, 고속 순방향과 고속 역방향과 같은 편집모드에서는 코드화된 데이터를 재인코드할 필요가 있다. 본 발명에 따라서, 베이스층의 기준 프레임이 GOP 의 첫번째 프레임일때, 상응하는 인헨스먼트층 프레임은 잠재적 편집모드일 동안에 이미지의 화질을 개선하고 에러 확산을 제거하기위해 I나 P-프레임으로 인코드될 것이다. 예를 들면, 종래의 화상분배체계를 사용하여 인헨스먼트층 프레임이 B-프레임으로 코드화 된다면, 화상의 형태는 P나 I-화상으로 교체될 것이다. 게다가, 전송기의 속도제어계산은, 인코더의 가상기억버퍼의 발생가능한 오버플로워를 피하기 위해, 인헨스먼트층의 현재 화상에 할당된 비트를 감소시키는 이러한 가능성을 설명할 것이다.
더욱이, 불일치 예측된 P-프레임에 대해, 양자화 스텝사이즈는 인헨스먼트층에서 인코드되어지는 프레임이나 베이스층에서의 기준 프레임중 더 큰 활성레벨에 따라서 조절되어진다.
[실시예]
이하, 본 발명의 실시예를 도면을 참조하면서 상세히 설명한다.
본 발명의 속도제어수단은 7가지 과정을 포함한다. 상기 수단은 파라미터 초기화, 인헨스먼트층에 대한 초기화, 리프레쉬 주기나 화상그룹(GOP)에 대한 초기화와 갱신, 현재화상의 전처리과정, 이전화상의 후처리과정, 매크로-블록 작업과 슬라이스 작업 속도제어프로세싱, 그리고 적절한 양자화프로세싱을 포함하고 있다.
후사용을 위해 초기화 되는 파라미터는, OP나 인헨스먼트층의 리프레쉬 주기에 상응하는 프레임을 위해 최소한으로 할당된 비트, Trmin의 수를 포함한다.
Trmin은 다음으로부터 계산되어 진다.
Trmin=(right bit rate)/(8*picture rate)
여기에서 right_bit_rate는 인헨스먼트층에 할당된 최소 비트속도이고, picture_rate는 입체신호의 화상속도이다. 예컨대 NTSC비디오방식은 초당 30화상이고 PAL비디오는 초당 25화상이다.
더욱이, 초기의 컴플렉서티값(Kx)는 인헨스먼트층의 현재화상에 할당되어진다. 현재화상에서 선택된 양자화레벨은 컴플렉서티레벨과 일치하고, 이러한 작은 양자와스텝사이즈는 좀더 복잡한 화상(다량의 인코드된 데이터비트를 포함한)에 사용되어진다. 초기의 컴플렉서티레벨은 화상의 형태에 따라 할당되어 진다. I-화상은 랜덤억세스 기준화상으로 사용되고 따라서 상대적으로 작은 스텝으로 양자화되어져야 한다. 또한, I-화상은 상대적으로 큰 컴플렉서티레벨을 가지고 있다. P와 B-화상은 컴플렉서티의 작은 초기화 값으로 할당되어지고, 따라서 보다 세밀하게 양자화 되어진다. 게다가, 주어진 화상의 컴플렉서티는 공간 도메인이나 변환 도메인중 하나에 의해 결정되어질 수 있다.
대표값은 KxI=1.39, KxDP=0.52,KxTP=0.37 그리고 KxB=0.37, 여기서 하부수식 "I"는 I-화상을 의미하고, "DP"는 불일치 예측된 P-화상을, 그리고 "B"는 B-화상을 의미한다. 추가적으로 PD와 PT는 여기에서 각각 불일치 예측된 P-화상과 일시적 예측된 P-화상을 나타내는 데 사용된다. 컴플렉서티 파라미터는 KxI〉KxDP≥KxTP≥KxB와 같은 관계를 만족시켜야 한다.
주어진 화상의 형태에서, 컴플렉서티값 Kx는 조정가능하다. 고복합 이미지는 화소의 휘도와 색상에 있어서 많은 다양성을 가질 수 있다. 주어진 이미지의 화질을 유지하기 위하여, 고복합 이미지는 저복합 이미지에 비하여 추가의 비트를 사용하여 인코드 되어져야 한다.
따라서, 화상이 같은 형태의 다른 화상보다 조금더 복잡하거나 덜 복잡하다면, 주어진 화상의 컴플렉서티값도 상대적으로 증가하거나 감소될 수 있다.
KrDP, KrTP, KrB는 인헨스먼트층에서 예측되어 코딩된 프레임(예컨대, PD, PT그리고 B-프레임)에 대한 초기 가상기억버퍼 충만파라미터이다. 예컨대, KrDP=1.0, KrTP=1.4 그리고 KrB=1.4가 적당하다. 이러한 파라미터들은 조정가능해야 하고, KrDP〈KrTP≤KrB를 만족시켜야 한다. XrDP, XrTP그리고 XrB는 PD, PT그리고 B-화상의 컴플렉서티이다. 그리고 각각은 커플렉서티 파라미터 XrDP, XrTP그리고 XrB로부터 초기에 결정되어진다. 특히, 인헨스먼트층에 대해 최소한으로 할당된 비트의 수를 사용하여, I-화상에 대해 요구되는 비트속도 right_bit_rate는 XrI=KxI*right_bit_rate이다. PD-화상은, XrDP=KxDP*right_bit_rate이고, PT-화상은 XrTP=KxTP*right_bit_rate이고, B-화상은 XrB=KxB*right_bit_rate이다. 더욱이 인헨스먼트층에 I-프레임이 없을 경우에는, 불일치 예측된 P-화상에 대해 할당된 비트속도는 XrI/NI항에 의해 증가될 수 있다. 여기에서 NI는 max{Nr/GOP_length_of_left_view, 1}이고, Nr은 인헨스먼트층의 재생주기이다. 앞서 언급된 것처럼 GOP_length_of_left_view 는 베이스층에서 화상그룹의 프레임수이다. 이 경우에 있어서 XrDP=KxDP*right_bit_rate + XrI/NI이다. GOP_length_of_left_view 을 주목하여, I1, B1, B2, P1, B3, B4, I2, B5, B6, P2, B7, B8베이스층에서 종래의 화상분배체계를 고려하라. 이 경우에, GOP_length_of_left_view=12이다.
다음으로, 인헨스먼트층에서의 현재화상형태가 결정된다. 만약 현재화상이 I-화상이라면, 가상기억버퍼 충만레벨은 VrJ=10*RPr/31이다. 만약 현재화상 불일치 예측된 P-화상이라면, 가상기억버퍼 충만레벨은 VrDP=10*RPr*KrDP/31이다. 일시적 예측된 P-화상에 대한 가상기억버퍼 충만레벨은 VrTP=10*RPr*KrTP/31이다. B-화상에 대한 가상기억버퍼 충만레벨은 KrTP=KrB이므로 VrB=VrTP=10*RPr*KrB/31이다. 리액션 파라미터 RPr은 2*right_bit_rate/picture_rate 로 정의된다.
다음의 설명은 인헨스먼트층의 초기화에 관한 것이다. 도2는 본 발명에 따른 초기의 GOP 이거나 리프레쉬 주기 서브루틴을 나타낸 것이다. 루틴은 블록 200에서 시작한다. 블록 210에서, Nr, NI 그리고 MI 의 값들이 복구되어 진다. Nr은 인헨스먼트층(오른쪽 관점)의 GOP이거나 리프레쉬 주기에서의 화상의 수이다. NI는 베이스층(왼쪽 관점)의 GOP의 길이이고, MI는 베이스층에서 화상형태의 구성을 의미한다. 특히, MI=1 일때, 베이스층은 단지 I와 P-화상을 가지고 있다. MI=2 일때, 베이스층은 I나 P-화상 사이에 하나의 B-화상과 I, P, 그리고 B-화상을 가진다. MI=3 일때, I나 P-화상 사이에 두개의 연속적인 B-화상과 I, P, 그리고 B-화상을 가진다.
블록 220에서, 인헨스먼트층의 GOP나 리프레쉬 주기에서 I, P 그리고 B-화상의 수의 초기값이 계산되어진다. NrI는 I-프래임의 수이고, NrDP는 불일치 예측된 P-프레임의 수이고, NrTP는 일시적 예측된 P-프레임의 수이다. 그리고 NrB는 B-프레임의 수이다.
블록 230에서, 리프레쉬 주기나 인헨스먼트층의 GOP에서 남아있는 비트의 수의 초기값 Gr은 Gr=((right_bit_rate)/(picture_rate)*Nr에 의해 결정되어진다.
블록 240에서 리프레쉬 주기나 GOP에서 남아있는 화상들을 코딩하기 위해 사용하는 비트의 남아있는 수 Rr이 복구되어진다. Rr은 각 화상이 인헨스먼트층에서 인코드된 후에 개정된 런닝밸런스이다. 남아있는 비트수의 초기값은 Rr=0이다. 블록 250에서, Rr은 Rr=Rr+Gr에 의해 개정되어진다.
블록 260에서, Trmin, Kx, Kr, Xr 그리고 Vr을 포함하여 다른 파라미터들은 앞서 설명한 것처럼 초기화 되어 진다. 블록 270에서 루틴은 종결한다.
이제, 리프레쉬 주기 또는 화상그룹(GOP)에 대한 초기화 및 갱신에 대하여 설명한다. 베이스층에 있어서, 리프레쉬 주기는 인코드된 비디오 프레임의 시퀀스로 연속 I-화상간에 간격이 존재하고, GOP로서 동화상을 정의한다. 인헨스먼트층에 있어서, 리프레쉬 주기가 존재한다면, 연속 I-화상간에 또는 2개의 선-지정(Pre-assigned) 불일치-예측(disparity-predected) P-화상(예컨대, PD-화상)간에 간격이 존재한다. 선-지정은 베이스층 구성을 조사하기 전에 인헨스먼트층을 설정하는 것을 의미한다. 본 발명에 따른 선-지정 화상타입은 인코딩 전에 또 다른 화상타입으로 전환될 것이다. 베이스층 또는 인헨스먼트층에 I-프레임이 사용될 경우, 코드된 I-프레임 바로 다음 제1연속 B-화상이 랜덤억세스의 경우에, 적절하게 재구성될 수 있는 가를 나타내도록 GOP헤더는 패킷화 비디오 비트스트림에 코드된 I-프레임에 앞서 행한다. 이 상황은 예컨대, 디코더에서 비디오 프레임의 시퀀스를 편집하는 동안 발생한다. I-프레임이 인헨스먼트층에 사용되지 않을 경우, GOP가 존재하지 않는다. 더욱이, 베이스 및 인헨스먼트층에 사용된 GOP 또는 리프레쉬 주기는 통상 개시 및 종료 포인트를 일시적으로 오프셋할 것이다. 즉, 베이스층에 GOP의 제1프레임은 인헨스먼트층의 리프레쉬 주기의 제1프레임과 일치할 필요가 없다. 마찬가지로, GOP 또는 리프레쉬 주기 길이(예컨대, 프레임수)는 통상, 베이스 및 인헨스먼트층 사이에서 변동한다.
베이스 및 인헨스먼트층이 오프셋 되고 다른 길이를 갖는 사실은 고속 순방향모드 및 고속 역방향모드를 편집하는 동안 문제로 될 수 있다. 사실, 편집동작은 인헨스먼트층 또는 다른 시각장애의 손실의 결과일 것이다. MPEG-2와 같은 프로토콜은 편집기능을 하는 인코드된 비트스트림에 신택스 계층을 제공한다. 예컨대, 비트스트림은 모든 비디오를 디코드하도록 필요로 하지 않고 베이스층의 대응하는 부분의 처리와 편집을 하는 다양한 억세스 포인트로 인코드될 수 있다.
그러나, 베이스층에 그와 같은 억세스 포인트는 인헨스먼트층에 수용가능한 억세스 포인트에 일치할 필요는 없다. 예컨대, 억세스 포인트는 I-화상이 위치된 베이스층에 보통 제공된다. I-프레임이 자신이 포함된 비디오 프레임 이미지를 제공하기 때문에, 베이스층에 다음 프레임이 I-화상을 이용하여 예측될 수 있다. 그러나, 베이스층에 I-프레임은 인헨스먼트층에 B-프레임과 일치될 것이다. 이 경우, 다음 화상은 B-프레임이 모든 비디오 프레임으로부터 데이터를 포함하지 않기 때문에, 인헨스먼트층으로부터 정확하게 예측될 수 없다.
본 발명에 따른 B-화상으로 소정 정의된 인헨스먼트층은 화상이 베이스층 GOP의 제1 I-화상과 일치하는 것이 결정될 경우, 대신 PD-화상으로 인코드된다. 즉, 화상타입이 전환된다. 랜덤억세스가 베이스층에 요구된 것은 인헨스먼트층에 대응하는 P-화상이 인헨스먼트층 이미지를 재구성하도록 요구된 정보를 제공하기 위하여, 베이스층에 I-프레임을 이용하여 불일치 예측될 수 있다. 인헨스먼트층 화상은 충분한 비트가 가능하면, I-화상으로 인코드될 수 있고, 그것에 의해서 베이스 및 인헨스먼트층 모두에 대해 동기화 랜덤억세스를 제공한다.
더욱이, 디코더에서 양자화 및 에러로 인한 다른 프레임으로부터 예측된 프레임으로 에러를 전할 수 있다. 따라서, 자신을 포함하고 어떤 다른 프레임(베이스층에 I-프레임)에 의존하지 않거나, I-프레임(인헨스먼트층에 불일치-예측된 P-프레임)으로부터 직접 예측된 새로운 프레임을 주기적으로 제공할 필요가 있다. 그와 같은 프레임이 제공될 경우, 전달된 에러가 제거되거나 감소되고 새로운 베이스라인이 확립되기 때문에, 데이터 스트림은 리프레쉬 된다. 예컨대, 30프레임/초의 프레임율과 I-화상이 되는 베이스층에 8번째 화상중에 하나와 함께, 리프레쉬 주기는 8/30초이다. GOP헤더에 대한 프레임은 상기 리프레쉬 주기 전체에 미친다.
도3은 본 발명에 따른 인헨스먼트층에 대한 화상층 타이밍을 나타낸다. 인헨스먼트층은 도시한 전체 GOP에 프레임의 시퀀스(I1, B1, PD1, PT1, B3, B4, PT2, B5, PD2, PT3, B7, B8)을 포함한다. 화상(PD1, PD2)은 각각 B2 및 B6(도시하지 않았음)로 교체한다. 리셋 신호(310)는 펄스(315)로 코딩시퀀스의 개시를 나타낸다. 펄스 싱크(PSYNC) 신호(320)는 펄스 트레인(train)을 제공한다. 펄스(325)는 앞의 GOP 또는 리프레쉬 주기로 마지막 프레임(B-화상으로 도시한)을 나타낸다. 펄스(330)는 다음 GOP 또는 리프레쉬 주기로 최초 프레임을 나타낸다. 언급한 바와 같이, GOP는 I-화상이 인헨스먼트층으로 이용될 경우, 정의한다. 그렇지 않으면, 리프레쉬 주기는 할당된 비트수로 코드된 화상의 설정을 정의한다. 따라서, 리프레쉬 주기의 화상은 GOP가 없어도 여전히 그룹화 된다. 펄스(330~390)는 각각 화상(I1, B1, PD1, B3, B4, PT2, B5, B6, PT3, B7, B8, I2)에 대응한다.
펄스(390)는 또 다른 화상그룹의 개시 또는 인헨스먼트층에 리프레쉬 주기를 표시한다. 기술한 예에 있어서, GOP 또는 리프레쉬 주기로 인코드될 제1프레임은 각각 I-화상 또는 PD-화상이 존재한다. 다음 프레임은 펄스(335)로 나타낸 B-화상이다. 그러나, 본 발명에 따른 펄스(340)로 나타낸 다음 프레임은 B-화상(예컨대, B2)에서 PD-화상으로 전환된다. 마찬가지로, 펄스(370)으로 나타낸 B6, PD2는 또 다른 B-화상 B6(도시하지 않았음)로 교체된다. GOP 또는 리프레쉬 주기의 마지막 2개의 프레임은 각각 펄스(380, 385)로 나타낸 바와 같이, B7, B8이다. 다음 리셋 신호펄스(317), 또 다른 GOP 또는 리프레쉬 주기는 또 다른 I-화상 또는 PD-화상으로 펄스(390)에 의해 나타낸 것으로 개시한다. 펄스(395)는 이 GOP 등의 첫 번째 B-화상을 나타낸다.
또한, 각 펄스(330~385)는 이전화상의 포스트-프로세싱과 현재 화상의 프리-프로세싱의 발생을 나타낸다. 예컨대, 인헨스먼트층에 I-화상이 없는 것으로 추측한다. 따라서, 펄스(330)는 PD-화상으로 인코드되는 현재 프레임의 프리-프로세싱이 개시하는 것을 나타낸다. 또한, 이 때, 펄스(325)로 나타낸 B-화상의 포스트-프로세싱이 개시한다. 마찬가지로, 펄스(335)는 현재 프레임 B1의 프리-프로세싱이 개시하는 것을 나타내고, 펄스(330)에 의해 나타낸 PD-화상의 포스트-프로세싱이 개시하는 것을 나타낸다. 프리-프로세싱 및 포스트-프로세싱 단계는 이하에 기술할 것이다.
도4는 본 발명에 따른 현재 화상의 프리-프로세싱에 대한 서브루틴을 나타낸다. 루틴은 블록(400)에서 시작한다. 블록(405)에서 파라메터(Rr, Trmin, NrI, NrDP, NrTP, NrB, KrDP, KrTP, KrB, XrDP, XrB, XrTP)가 회복된다. Rr은 GOP의 프레임 또는 인헨스먼트층의 리프레쉬 주기가 할당될 수 있는 나머지 비트수가 존재한다.
Trmin은 프레임에 대하여 할당된 최소비트수이다. NrI, NrDP, NrTP, NrB는 각각 I, PD, PT, B-화상의 수이고, 본 발명에 따른 인헨스먼트층의 GOP 또는 리프레쉬 주기로 제공된다. 입체 비디오신호에 있어서, 베이스층 코드된 프레임에 GOP의 제1프레임이 존재하면, 인헨스먼트층에 대응하는 프레임은 기준 프레임으로서 베이스층 프레임과 함께, I 또는 P-프레임으로 코드될 것이다. 이러한 요인은 또한, 리프레쉬 주기가 정확하게 이루어지는 것을 보장하도록 속도제어계산을 설명할 것이다.
예컨대, 도6은 본 발명에 따른 화상 분배구성을 나타낸다. 기술한 예로 많은 가능한 화상 분배구성중 하나만이 존재하는 것을 알 수 있다. 화상(602∼626)은 인헨스먼트층(600)에 존재하고, 화상(652∼676)은 베이스층에 존재한다. 화상타입은 화상으로 나타낸다. 첨자 "e"는 인헨스먼트층을 나타내고, 첨자 "b"는 베이스층을 나타내며, 수치첨자는 순차지시기이다. 예컨대, 화상 Be4616은 도시한 인헨스먼트층 화상에 제4 B-화상이다. Pd 및 PT는 각각, 불일치-예측 P-화상 및 일시적-예측 P-화상을 나타낸다. 화상이 비트스트림으로 전송되기 위하여, 나타낸 것에 주목하고, 통상 디스플레이 명령과 다르다.
더욱이, 화살표는 인헨스먼트층의 각각의 화상에 포인터가 화상을 위하여 이용된 인코딩 타입을 나타낸다. 연속화살표는 포인트된 화상이 기준화상으로 화살의 꼬리에 화상을 이용하여 인코드된다. 예컨대, Be1604는 인헨스먼트층에 Ie1602와 베이스층에 Bb2654 모두를 이용하여 인코드된다. 대쉬된 화살은 선택적인 인코딩 선택을 나타낸다. 예컨대, 화상(608)은 화상이 PT1인 경우, 인헨스먼트층에 화상 PD1606을 이용하여 인코드되거나, 화상(608)은 화상이 PD인 경우에, 베이스층에 Bb3658을 이용하여 인코드된다. 본 발명에 따른 특별한 기준에 맞는 선택은 선택될 수 있다. 이 기준은 예컨대, 최소화 예측에러, 또는 요구된 비트할당 또는 이미지 성질을 반영할 것이다. 또 다른 경우에 있어서, 본 발명의 속도제어 체계는 선택된 화상타입을 설명한다.
또한, P-화상타입이 하나의 기준 프레임만을 갖고, B-화상은 통상 평균처리에 있어서 양층에 프레임으로부터 예측되어지는 마크로-블록을 갖는다. 예컨대, Be3612는 Be2610과 Pb1662로부터 예측된다. 베이스층에 예측모드는 종래 존재하기 때문에, 도시하지 않는다.
도6에 도시한 화상분배와 예측모드 구성에 있어서, 인헨스먼트층은 I-화상 Ie1602와 Ie2626을 포함한다. 따라서, 인헨스먼트층의 GOP는 12개 화상(602~624)을 포함한다. 인헨스먼트층의 또 다른 GOP는 Ie2626에서 개시하지만, 모두 도시하지는 않았다. 베이스층의 GOP는 화상(Ib1656~Bb6666)을 포함한다. 베이스층의 또 다른 GOP는 화상(Ib2668)에서 개시하지만, 모두 도시하지는 않았다. 베이스층에 12개의 화상(Bb1652~Pb2674)가 인헨스먼트층의 GOP에 대응하는 것에 주목한다. 이 12개 화상의 베이스층 시퀀스에 있어서는 베이스층 GOP의 개시로 2개의 I-화상이 존재한다. 본 발명에 따른 이들 베이스층 I-화상에 대응하는 인헨스먼트층에 화상은 코딩을 위한 다른 화상타입으로 전환된다.
특히, 베이스층의 화상(Ib1656)에 대응하는 화상(PD1606)이 전환된다. 마찬가지로, 베이스층의 화상(Ib2668)에 대응하는 화상(PD2618)이 전환된다. 통상, 종래 화상분배체계에 있어서, 화상(PD1606, PD2618)은 B-화상이다. 실시예에 있어서, 베이스층에 GOP화상의 개시에 대응하는 인헨스먼트층 화상은 I-화상으로 전환될 수 있다. 베이스와 인헨스먼트층에 랜덤억세스가 요구될 경우, 종래 방법으로 인헨스먼트층에 있어서, B-화상에서 P 또는 I-화상으로의 전환은 편집모드중 장점을 제공할 것이다.
따라서, 도6의 예에 있어서, 인헨스먼트층의 GOP에 NrI=1, NrDP=2, NrTP=3, NrB=6는 화상(Ie1602~Be6624) 전체에 영향을 미친다. 또한, Nr=12는 인헨스먼트(오른쪽)층 GOP에 12개 화상이 존재하고, N1=6은 베이스(왼쪽)층 GOP에 6개 화상이 존재하며, M1=3은 베이스층에 I 또는 P화상간에 2개의 연속 B-화상이 존재하기 때문이다.
도4의 블록(410)에서 인헨스먼트층에 현재 화상타입이 결정된다. 화상타입에 따라, 도4에 4개의 다른 분기중 하나가 이하에 기술될 것이다. 현재 화상이 I-화상이면, 가상버퍼 충만레벨(VrI)은 블록(415)에서 결정된다. 현재 화상이 P-화상이면, P-화상의 타입은 블록(412)에서 결정된다. 불일치-예측 P-화상에 대하여, 가상버퍼 충만레벨(VrDP)은 블록(435)에서 결정된다. 일시적-예측 P-화상에 대하여, 가상버퍼 충만레벨(VrTP)은 블록(455)에설 결정된다. B-화상에 대하여, 가상버퍼 충만레벨(VrB)은 블록(475)에서 결정된다.
다음에, 코드된 인헨스먼트층에 현재 화상은 "타겟" 비트할당, Tr을 결정하기 위하여 앞서 처리되고, 판단된 비트수가 다음 화상을 코드하도록 가능하게 한다. 더욱이, 비트할당은 GOP 또는 리프레쉬 주기로부터 정의된 프레임 전체에 걸쳐 이루어진다. 따라서, 얼마나 많은 프레임과 어떤 타입이 GOP 또는 리프레쉬 주기를 이루는가를 알 필요가 있다. 특히, 새롭게 코드된 프레임이 I-화상 경우, 블록(420)에서,
불일치-예측 P-화상에 대하여, 블록(440)에서,
일시적-예측 P-화상에 대하여, 블록(460)에서,
B-화상에 대하여, 블록(480)에서,
현재 프레임이 어떤 화상타입으로 코드될 경우, 인헨스먼트층에 필요한 타입의 나머지 화상수는 하나로 감소될 수 있다. 따라서, I화상에 대하여, 블록(425)에서 NrI는 하나로 감소되어 기억된다. 대응하는 액션이 각각 블록(445, 465, 485)에서 NrDP, NrTP, NrB에 대하여 발생한다.
현재 화상이 PD-화상일 경우, 다음에 본 발명에 따른 새로운 평균활성레벨 avg_act"는 블록(450)에서 정의된다. avg_act는 인헨스먼트층에 이전 프레임의 평균활성을 나타내고, MPEG 테스트 모델 5 시스템으로서 공간 도메인에, 또는 MPEG-2 시스템으로서 변환 도메인에 결정될 수 있다. 테스트 모델 5의 상세한 설명은 참조에 의해 구체화된 1993년, 4월 "테스트 모델 5"로 명기된 버전 1, AVC-491, 문서 ISO/IEC JTC1/SC29/WG11에서 찾을 수 있다.
종래, 인코드된 프레임의 양자화 레벨은 오직 기준 프레임의 활성레벨에 기초하여 결정된다. 그러나, 이것은 현재 프레임이 기준 프레임 보다도 좀더 높은 활성레벨을 갖으면, 감소된 이미지 특성을 만들 것이다. PD-화상에 대하여, 기준 프레임은 avg_act_1의 평균활성으로 베이스(왼쪽)층에 존재할 것이다. 본 발명에 따른 PD-화상에 대하여, 이전 프레임과 기준 프레임의 최대평균활성레벨이 이용된다. 따라서, 새로운 평균활성레벨은 avg_act"=max{avg_, avg_act_1}이다.
시스템이 프레임 버퍼를 갖을 경우, 인헨스먼트층에 인코드된 프레임의 avg_act는 미리 계산되어 기억될 수 있다. 즉, 인코드되는 현재 프레임에 대하여, 평균활성은 현재 화상 자신으로부터 계산될 수 있다.
I, Pt 및 B-화상에 대하여, 각각 블록(430, 470, 487)에서 평균활성레벨은 avg_act_"=avg_act이다. 블록(489)에서 현재 화상타입은 이전화상의 포스트-프로세싱으로 나중에 보상하기 위하여 기억된다. 블록(490)에서 결정은 선형 또는 비선형 양자화가 이용되는가로 결정된다. 선형 양자화에 대하여, 현재 프레임에 스케일된 DC 및 AC 계수 모두를 양자화에 이용하기 위하여 초기 양자화 단계 크기는 매크로-블록 양자화 파라메터, MQUANT=max{2,min{Vr×62/RPr, 62}}로 블록(492)에서 결정되는 MQUANT로부터 유도된다. 기술한 바와 같이, Vr은 가상버퍼 충만레벨이고, RPr은 리액션 파라메터이다. 비선형 양자화 스케일에 대하여, 블록(494)에서 MQUANT=max{1,min{non_linear_mquant_table[Vr×31/RPr],112}}이고, {non_linear_mquant_table은 Vr×31/RPr의 입력에 대한 검색 테이블의 출력이다.
루틴은 블록(496)에서 종료한다.
도5는 본 발명에 따른 이전화상의 포스트-프로세싱에 대한 서브루틴을 나타낸다. 블록(505)에서 파라메터(Rr, MBr, Sr, Tr, TQr, Vr)는 회복된다. Rr은 현재 프레임이 인코드 된 후, 인헨스먼트층에 GOP 또는 리프레쉬 주기의 프레임에 대하여 할당될 수 있는 나머지 비트수이다. MBr은 프레임에 매크로-블록수이다. Sr은 인헨스먼트층에 이전화상에 비트수이고, 더미비트가 데이터 스트림에 개시코드 전에 삽입되는 스터프(stuff) 비트를 포함하지 않는다. Tr은 현재 프레임을 코딩하기 위하여 할당된 비트수이다. TQr은 이전화상에 대한 MQUANT의 누적이다. Vr은 가상버퍼 충만레벨이다.
블록(510)에서 평균 양자화 파라메터, Qr이 계산된다. 다음 화상이 PD-화상이면, QrDP=TQrDP/MBr이다. 그렇지 않으면, Qr=TQr/MBr이다.
블록(515)에서 글로벌 컴플렉시티 레벨, Xr이 결정된다. 다음 화상이 PD-화상이면, 글로벌 컴플렉시티는 Xr=SrDP×QrDP이다. 그렇지 않으면, Xr=Sr×Qr이다.
블록(520)에서 가상버퍼 충만레벨, Vr은 이전화상, Sr에 비트수를 추가하고 현재 화상, Tr에 할당된 비트수를 감소하는 이전 버퍼 충만레벨을 취함으로써, 갱신된다.
블록(525)에서 이전화상타입이 회복된다. 인헨스먼트층에 이전화상이 I-화상이면, XrI 및 VrI가 블록(535)에 설정되고 기억된다. 이전화상이 블록(555)에서 결정한 것과 같이 PD-화상이면, 블록(545)에서 설정되고 기억된다. 이전화상이 블록(55)에서 결정한 것과 같이 PT-화상이면, XrTP 및 VrTP가 블록(560)에서 설정되고 기억된다. 이전화상이 B-화상이면, XrB 및 VrB가 블록(570)에서 설정되고 기억된다.
다음에, 평균활성은 도 4의 블록(430, 450, 470, 487)과 연결하여 기술한 바와 같이, 각각 블록(540, 550, 565, 575)에서 I, PD, PT 및 B-화상이 계산되고 저장된다.
다음에, 블록(580)에서 인헨스먼트층의 GOP 또는 리프레쉬 주기의 프레임이 할당될 수 있는 나머지 비트수가 인헨스먼트층, Sr에 이전화상의 비트수를 감소함으로써, 갱신된다.
루틴은 블록(585)에서 종료한다.
매크로-블록 테스크 및 슬라이스(slice) 테스트 속도제어 프로세싱에 대하여 기술한다. MPEG-2시스템에 있어서, 속도제어는 비디오 프레임의 매크로-블록 레벨 및 슬라이스 레벨 부분에 기초한다. 예컨대, NTSC 포맷으로 비디오 프레임은 44개 매크로 블록을 갖는 30개 슬라이스로 분할 될 것이다. 그래서, 전체 NTSC 프레임은 1,320 매크로 블록으로 이루어진다. PAL 포맷으로는 1,584 매크로 블록이 이루어진다.
속도제어에 기초한 매크로 블록에 대하여, Bm(j)는 현재 화상에 j번째 매크로 블록에 비트수를 나타내고, j=1~1,320이다. Abm(j)은 현재 화상에 j번째 매크로 블록까지 축적된 비트수이다. MBr은 화상에 매크로 블록수이다. 매크로 블록 가상버퍼 불일치(descrepancy), d(j)는
로부터 결정된다. j번째 매크로 블록에 대한 기준양자화 파라메터는
이다.
슬라이스 레벨 속도제어에 대하여, Bs(j)는 현재 화상에 j번째 비트수이고, j=1~30이다. Abs(j)는 현재 화상에 j번째까지 누적된 비트수이다. No_slice는 화상에 슬라이스수이다. 슬라이스 가상버퍼 불일치는 ds(j)이고, 여기서
이다.
j번째 슬라이스에 대한 기준양자화 파라메터는
이다.
적응 양자화 프로세싱에 대하여 기술한다. 우선, j번째 매크로 블록의 활성, act(j)가 계산된다. 만약, 현재 화상이 불일치 예측 모드 P-화상이면, J번째 매크로 블록의 정상화 활성, N_act(j)는
로서 계산된다.
p-화상의 다른 타입에 대해서는
로서 계산된다.
매크로 블록 레벨 속도제어로, j번째 매크로 블록에 대한 양자화 스텝사이즈(step size)는 이하와 같이 계산된다.
선형 양자화(Q) 스케일에 대해서는, MQUANT(j)=max{2,min{Q(j)×N_act(j),62}}.
비선형 양자화 스케일에 대해서는, MQUANT(j)=max{1,min{non_linear_mquant_table[Q(j)×N_act(j)],112}}. 여기서, non_linear_mquant_table은 Q(j)×N_act(j)의 입력에 대한 조사 테이블의 출력이다.
슬라이스 레벨 속도제어로, Qs(j)가 Q(j) 대신 대체되고, 따라서 선형 양자화 스케일에 대해서는, MQUANT(j)=max{2,min{Qs(j)×N_act(j),62}}.
비선형 양자화 스케일에 대해서는, MQUANT(j)=max{1,min{non_linear_mquant_table[Qs(j)×N_act(j)],112}}. 여기서, non_linear_mquant_table은 Qs(j)×N_act(j)의 입력에 대한 조사 테이블의 출력이다.
[발명의 효과]
이상 설명한 바와 같이, 본 발명은 프레임이 일시적 예측(동일층으로부터)인지 또는 불일치 예측(반대층으로부터)인지에 따라 인헨스먼트층에 P 또는 B-프레임의 양자화 레벨을 변경하는 입체 디지털 비디오 통신시스템을 위한 속도제어 체계를 제공할 수 있다. 더욱이, 어느쪽이 크더라도 인헨스먼트층에 인코드 되는 프레임 또는 베이스층에 기준 프레임의 활성레벨에 따라 양자화 스텝사이즈가 변경된다. 더욱이, 이미지 특성이 개선되고, 베이스층에 기준 프레임이 GOP의 첫번째 프레임에 존재할 경우, I 또는 P로서 인헨스먼트층을 인코딩함으로써, 프레임 프리즈업(freeze up)이 편집모드동안 방지된다.

Claims (22)

  1. 화상그룹의 현재 화상을 코딩하는데 이용하기 위한 기준화상을 제공하는 단계와, 상기 기준화상이 인헨스먼트층에 제공되면, 적어도 제1비트를 이용하는 상기 현재 화상의 일부분을 코딩하는 단계 및, 상기 기준화상이 입체신호의 베이스층에 제공되면, 상기 제1비트와 다른 제2비트를 이용하는 상기 현재 화상의 일부분을 코딩하는 단계를 구비하여 이루어진 것을 특징으로 하는 입체 디지털 데이터 신호의 인헨스먼트층에 비디오 데이터의 연속화상을 코딩하기 위한 방법.
  2. 제1항에 있어서, 상기 화상그룹을 코딩하기 위한 초기비트를 할당하는 단계와, 코드된 상기 그룹에 상기 각 화상으로 이용가능한 나머지 비트의 실행합계를 유지하는 단계를 구비하여 이루어지고, 상기 제1 및 제2비트중 어느 하나가 상기 실행합계에 따라 변경되는 것을 특징으로 하는 입체 디지털 데이터 신호의 인헨스먼트층에 비디오 데이터의 연속화상을 코딩하기 위한 방법.
  3. 제1항에 있어서, 상기 제1 및 제2비트는 상기 현재 화상의 상기 부분을 코딩하기 위한 각 제1 및 제2양자화 스텝사이즈를 결정하는 것을 특징으로 하는 입체 디지털 데이터 신호의 인헨스먼트층에 비디오 데이터의 연속화상을 코딩하기 위한 방법.
  4. 제1항에 있어서, 상기 제1 및 제2비트는 상기 입체신호의 요구된 데이터율과 관련된 것을 특징으로 하는 입체 디지털 데이터 신호의 인헨스먼트층에 비디오 데이터의 연속화상을 코딩하기 위한 방법.
  5. 제1항에 있어서, 상기 현재 화상은 불일치-예측 화상(PD-화상)이고, 상기 인헨스먼트층에 내부코드 화상(I-화상)이 존재할 경우와 비교하여 상기 인헨스먼트층에 인트라 코드 화상(I-화상)이 없을 경우의 상기 제1 및 제2비트중 어느 하나를 증가하는 단계를 더 구비하여 이루어진 것을 특징으로 하는 입체 디지털 데이터 신호의 인헨스먼트층에 비디오 데이터의 연속화상을 코딩하기 위한 방법.
  6. 제1항에 있어서, 상기 기준화상은 상기 베이스층에 제공되고, 상기 인헨스먼트층에 상기 현재 화상에 앞서 행해지는 적어도 화상 일부분의 활성레벨을 결정하는 단계와, 상기 기준화상의 적어도 일부분의 활성레벨을 결정하는 단계 및, 상기 보다 더 큰 제1 및 제2활성레벨로부터 상기 제1 및 제2비트중 어느 하나를 유도하는 단계를 더 구비하여 이루어진 것을 특징으로 하는 입체 디지털 데이터 신호의 인헨스먼트층에 비디오 데이터의 연속화상을 코딩하기 위한 방법.
  7. 제1항에 있어서, 상기 기준화상은 상기 베이스층에 제공되고, 상기 인헨스먼트층에 상기 현재 화상에 앞서 행해지는 적어도 화상 일부분의 활성레벨을 결정하는 단계와, 상기 기준화상의 적어도 일부분의 활성레벨을 결정하는 단계 및, 상기 평균 제1 및 제2활성레벨로부터 상기 제1 및 제2비트중 어느 하나를 유도하는 단계를 더 구비하여 이루어진 것을 특징으로 하는 입체 디지털 데이터 신호의 인헨스먼트층에 비디오 데이터의 연속화상을 코딩하기 위한 방법.
  8. 제1항에 있어서, 상기 현재 화상이 코드될 경우, 적어도 상기 현재 화상의 일부분의 활성레벨을 나타내는 값을 미리 계산하고 기억하는 단계와, 상기 현재 화상을 코딩하는데 이용하기 위한 상기 값을 회복하는 단계, 상기 기준화상의 적어도 일부분의 활성레벨을 결정하는 단계 및, 상기 보다 더 큰 제1 및 제2활성레벨로부터 상기 제1 및 제2비트중 어느 하나를 유도하는 단계를 더 구비하여 이루어진 것을 특징으로 하는 입체 디지털 데이터 신호의 인헨스먼트층에 비디오 데이터의 연속화상을 코딩하기 위한 방법.
  9. 제1항에 있어서, 상기 현재 화상이 코드될 경우, 적어도 상기 현재 화상의 일부분의 활성레벨을 나타내는 값을 미리 계산하고 기억하는 단계와, 상기 현재 화상을 코딩하는데 이용하기 위한 상기 값을 회복하는 단계, 상기 기준화상의 적어도 일부분의 활성레벨을 결정하는 단계 및, 상기 평균 제1 및 제2활성레벨로부터 상기 제1 및 제2비트중 어느 하나를 유도하는 단계를 더 구비하여 이루어진 것을 특징으로 하는 입체 디지털 데이터 신호의 인헨스먼트층에 비디오 데이터의 연속화상을 코딩하기 위한 방법.
  10. 상기 인헨스먼트층의 상기 화상의 그룹을 결정하는 단계를 구비하여 이루어지고, 상기 베이스층의 화상그룹(GOP)의 제1화상인 상기 입체신호의 베이스층에 상기 그룹의 현재 화상이 대응할 경우, 상기 현재 화상은 내부코드 화상(I-화상)과 예측코드 화상(P-화상)중 어느 하나로서 코드되는 것을 특징으로 하는 입체 디지털 데이터 신호의 인헨스먼트층에 비디오 데이터의 연속화상을 코딩하기 위한 방법.
  11. 제10항에 있어서, 상기 인헨스먼트층에 상기 화상의 상기 그룹의 제1화상은 상기 베이스층의 상기 기준화상으로부터 일시적으로 오프셋하는 것을 특징으로 하는 입체 디지털 데이터 신호의 인헨스먼트층에 비디오 데이터의 연속화상을 코딩하기 위한 방법.
  12. 화상그룹의 현재 화상을 코딩하는데 이용하기 위한 기준화상을 제공하기 위한 수단을 구비하여 이루어지고, 상기 기준화상이 인헨스먼트층에 제공되면, 상기 현재 화상의 적어도 일부분이 제1비트를 이용하여 코드되며, 상기 기준화상이 입체신호의 베이스층에 제공되면, 상기 현재 화상의 상기 부분이 상기 제1비트와 다른 제2비트를 이용하여 코드되는 것을 특징으로 하는 입체 디지털 데이터 신호의 인헨스먼트층에 비디오 데이터의 연속화상을 코딩하기 위한 장치.
  13. 제12항에 있어서, 상기 화상그룹을 코딩하기 위한 초기비트를 할당하기 위한 수단과, 코드된 상기 그룹에 상기 각 화상으로 이용가능한 나머지 비트의 실행합계를 유지하기 위한 수단을 구비하여 이루어지고, 상기 제1 및 제2비트중 적어도 어느 하나가 상기 실행합계에 따라 변경되는 것을 특징으로 하는 입체 디지털 데이터 신호의 인헨스먼트층에 비디오 데이터의 연속화상을 코딩하기 위한 장치.
  14. 제12항에 있어서, 상기 현재 화상의 상기 부분을 코딩하기 위한 상기 제1 및 제2비트에 따른 제1 및 제2양자화 스텝사이즈를 각각 결정하기 위한 수단을 구비하여 이루어진 것을 특징으로 하는 입체 디지털 데이터 신호의 인헨스먼트층에 비디오 데이터의 연속화상을 코딩하기 위한 장치.
  15. 제12항에 있어서, 상기 제1 및 제2비트는 상기 입체신호의 요구된 데이터율과 관련된 것을 특징으로 하는 입체 디지털 데이터 신호의 인헨스먼트층에 비디오 데이터의 연속화상을 코딩하기 위한 장치.
  16. 제12항에 있어서, 상기 현재 화상은 불일치-예측 화상(PD-화상)이고, 상기 인헨스먼트층에 내부코드 화상(I-화상)이 존재할 경우와 비교하여 상기 인헨스먼트층에 인트라 코드 화상(I-화상)이 없을 경우의 상기 제1 및 제2비트중 어느 하나를 증가하기 위한 수단을 구비하여 이루어진 것을 특징으로 하는 입체 디지털 데이터 신호의 인헨스먼트층에 비디오 데이터의 연속화상을 코딩하기 위한 장치.
  17. 제12항에 있어서, 상기 기준화상은 상기 베이스층에 제공되고, 상기 인헨스먼트층에 상기 현재 화상에 앞서 행해지는 적어도 화상 일부분의 활성레벨을 결정하기 위한 수단과, 상기 기준화상의 적어도 일부분의 활성레벨을 결정하기 위한 수단 및, 상기 보다 더 큰 제1 및 제2활성레벨로부터 상기 제1 및 제2비트중 어느 하나를 유도하기 위한 수단을 구비하여 이루어진 것을 특징으로 하는 입체 디지털 데이터 신호의 인헨스먼트층에 비디오 데이터의 연속화상을 코딩하기 위한 장치.
  18. 제12항에 있어서, 상기 기준화상은 상기 베이스층에 제공되고, 상기 인헨스먼트층에 상기 현재 화상에 앞서 행해지는 적어도 화상 일부분의 활성레벨을 결정하기 위한 수단과, 상기 기준화상의 적어도 일부분의 활성레벨을 결정하기 위한 수단 및, 상기 평균 제1 및 제2활성레벨로부터 상기 제1 및 제2비트중 어느 하나를 유도하기 위한 수단을 구비하여 이루어진 것을 특징으로 하는 입체 디지털 데이터 신호의 인헨스먼트층에 비디오 데이터의 연속화상을 코딩하기 위한 장치.
  19. 제12항에 있어서, 상기 현재 화상이 코드될 경우, 적어도 상기 현재 화상의 일부분의 활성레벨을 나타내는 값을 미리 계산하고 기억하기 위한 수단과, 상기 현재 화상을 코딩하는데 이용하기 위한 상기 값을 회복하기 위한 수단, 상기 기준화상의 적어도 일부분의 활성레벨을 결정하기 위한 수단 및, 상기 보다 더 큰 제1 및 제2활성레벨로부터 상기 제1 및 제2비트중 어느 하나를 유도하기 위한 수단을 구비하여 이루어진 것을 특징으로 하는 입체 디지털 데이터 신호의 인헨스먼트층에 비디오 데이터의 연속화상을 코딩하기 위한 장치.
  20. 제12항에 있어서, 상기 현재 화상이 코드될 경우, 적어도 상기 현재 화상의 일부분의 활성레벨을 나타내는 값을 미리 계산하고 기억하기 위한 수단과, 상기 현재 화상을 코딩하는데 이용하기 위한 상기 값을 회복하기 위한 수단, 상기 기준화상의 적어도 일부분의 활성레벨을 결정하기 위한 수단 및, 상기 평균 제1 및 제2활성레벨로부터 상기 제1 및 제2비트중 어느 하나를 유도하기 위한 수단을 구비하여 이루어진 것을 특징으로 하는 입체 디지털 데이터 신호의 인헨스먼트층에 비디오 데이터의 연속화상을 코딩하기 위한 장치.
  21. 상기 인헨스먼트층의 상기 화상의 그룹을 결정하기 위한 수단을 구비하여 이루어지고, 상기 베이스층의 화상그룹(GOP)의 제1화상인 상기 입체신호의 베이스층에 상기 그룹의 현재 화상이 대응할 경우, 상기 현재 화상은 내부코드 화상(I-화상)과 예측코드 화상(P-화상)중 어느 하나로서 코드되는 것을 특징으로 하는 입체 디지털 데이터 신호의 인헨스먼트층에 비디오 데이터의 연속화상을 코딩하기 위한 장치.
  22. 제21항에 있어서, 상기 인헨스먼트층에 상기 화상의 상기 그룹의 제1화상은 상기 베이스층의 상기 기준화상으로부터 일시적으로 오프셋하는 것을 특징으로 하는 입체 디지털 데이터 신호의 인헨스먼트층에 비디오 데이터의 연속화상을 코딩하기 위한 장치.
    ※ 참고사항:최초출원 내용에 의하여 공개하는 것임.
KR1019970030742A 1996-07-03 1997-07-03 입체 디지털 비디오 인코딩을 위한 속도제어 KR980011300A (ko)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US67485996A 1996-07-03 1996-07-03
US08/674,859 1996-07-03

Publications (1)

Publication Number Publication Date
KR980011300A true KR980011300A (ko) 1998-04-30

Family

ID=24708179

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1019970030742A KR980011300A (ko) 1996-07-03 1997-07-03 입체 디지털 비디오 인코딩을 위한 속도제어

Country Status (8)

Country Link
US (1) US6072831A (ko)
EP (1) EP0817493B1 (ko)
JP (1) JPH10174110A (ko)
KR (1) KR980011300A (ko)
CN (2) CN1190974C (ko)
CA (1) CA2208950A1 (ko)
DE (1) DE69736537T2 (ko)
NO (1) NO316250B1 (ko)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11457228B2 (en) * 2019-09-23 2022-09-27 Axis Ab Video encoding method and method for reducing file size of encoded video

Families Citing this family (121)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA2208950A1 (en) * 1996-07-03 1998-01-03 Xuemin Chen Rate control for stereoscopic digital video encoding
US6233356B1 (en) * 1997-07-08 2001-05-15 At&T Corp. Generalized scalability for video coder based on video objects
JP4240554B2 (ja) * 1997-07-11 2009-03-18 ソニー株式会社 画像符号化装置および画像符号化方法、並びに画像復号化装置および画像復号化方法
WO1999005864A1 (fr) * 1997-07-25 1999-02-04 Sony Corporation Dispositif d'edition, procede d'edition, dispositif d'epissage, procede d'epissage, dispositif de codage et procede de codage
CN1169373C (zh) * 1998-02-03 2004-09-29 皇家菲利浦电子有限公司 编码图像序列的切换方法及相应装置
JP2000013790A (ja) * 1998-06-19 2000-01-14 Sony Corp 画像符号化装置および画像符号化方法、画像復号装置および画像復号方法、並びに提供媒体
US6215825B1 (en) * 1998-07-09 2001-04-10 Canon Kabushiki Kaisha Stereographic image compression with image difference generation and lossy compression
US6275253B1 (en) 1998-07-09 2001-08-14 Canon Kabushiki Kaisha Stereographic image compression with image moment normalization
JP3185763B2 (ja) * 1998-07-13 2001-07-11 日本電気株式会社 動画像符号化装置
JP4021998B2 (ja) * 1998-08-07 2007-12-12 松下電器産業株式会社 データ伝送制御システム及びデータ伝送制御方法
US6963608B1 (en) 1998-10-02 2005-11-08 General Instrument Corporation Method and apparatus for providing rate control in a video encoder
US6151362A (en) * 1998-10-30 2000-11-21 Motorola, Inc. Joint rate control for stereoscopic video coding
EP1061750A3 (en) * 1999-06-18 2010-05-05 THOMSON multimedia Picture compression process, especially of the MPEG2 type
US7245663B2 (en) * 1999-07-06 2007-07-17 Koninklijke Philips Electronis N.V. Method and apparatus for improved efficiency in transmission of fine granular scalable selective enhanced images
US6765962B1 (en) * 1999-12-02 2004-07-20 Sarnoff Corporation Adaptive selection of quantization scales for video encoding
US6614936B1 (en) * 1999-12-03 2003-09-02 Microsoft Corporation System and method for robust video coding using progressive fine-granularity scalable (PFGS) coding
WO2001048537A2 (en) * 1999-12-28 2001-07-05 Vrex, Inc. Stereoscopic camera
US7865306B2 (en) 2000-09-28 2011-01-04 Michael Mays Devices, methods, and systems for managing route-related information
US6351710B1 (en) * 2000-09-28 2002-02-26 Michael F. Mays Method and system for visual addressing
US6907070B2 (en) * 2000-12-15 2005-06-14 Microsoft Corporation Drifting reduction and macroblock-based control in progressive fine granularity scalable video coding
JP2002271788A (ja) * 2001-03-08 2002-09-20 Monolith Co Ltd 画像符号化方法と装置および画像復号方法および装置
US7010043B2 (en) * 2001-07-05 2006-03-07 Sharp Laboratories Of America, Inc. Resolution scalable video coder for low latency
FR2832271A1 (fr) * 2001-11-13 2003-05-16 Koninkl Philips Electronics Nv Tuner comprenant un convertisseur de tension
DE10157111A1 (de) * 2001-11-21 2003-06-05 Deutsche Telekom Ag Begrenzung der Bitrate für die Übermittlung von Videosignalen mit zeitlich variablen Datenmengen im ATM-Netz
US7027982B2 (en) * 2001-12-14 2006-04-11 Microsoft Corporation Quality and rate control strategy for digital audio
FI114527B (fi) * 2002-01-23 2004-10-29 Nokia Corp Kuvakehysten ryhmittely videokoodauksessa
EP1670259A3 (en) * 2002-01-23 2010-03-03 Nokia Corporation Grouping of image frames in video coding
US7319720B2 (en) * 2002-01-28 2008-01-15 Microsoft Corporation Stereoscopic video
US6980695B2 (en) * 2002-06-28 2005-12-27 Microsoft Corporation Rate allocation for mixed content video
KR100754419B1 (ko) * 2002-07-16 2007-08-31 노키아 코포레이션 비디오 코딩시 랜덤 액세스 및 점진적 화상 리프레시를위한 방법
KR100751422B1 (ko) 2002-12-27 2007-08-23 한국전자통신연구원 스테레오스코픽 비디오 부호화 및 복호화 방법, 부호화 및복호화 장치
US8824553B2 (en) * 2003-05-12 2014-09-02 Google Inc. Video compression method
US10554985B2 (en) 2003-07-18 2020-02-04 Microsoft Technology Licensing, Llc DC coefficient signaling at small quantization step sizes
US7738554B2 (en) 2003-07-18 2010-06-15 Microsoft Corporation DC coefficient signaling at small quantization step sizes
US7580584B2 (en) * 2003-07-18 2009-08-25 Microsoft Corporation Adaptive multiple quantization
US7602851B2 (en) * 2003-07-18 2009-10-13 Microsoft Corporation Intelligent differential quantization of video coding
US7343291B2 (en) 2003-07-18 2008-03-11 Microsoft Corporation Multi-pass variable bitrate media encoding
US7383180B2 (en) * 2003-07-18 2008-06-03 Microsoft Corporation Constant bitrate media encoding techniques
US8218624B2 (en) * 2003-07-18 2012-07-10 Microsoft Corporation Fractional quantization step sizes for high bit rates
US8582659B2 (en) * 2003-09-07 2013-11-12 Microsoft Corporation Determining a decoding time stamp from buffer fullness
US8345754B2 (en) * 2003-09-07 2013-01-01 Microsoft Corporation Signaling buffer fullness
US9071846B2 (en) * 2003-12-25 2015-06-30 Nec Corporation Moving picture encoding method and apparatus for performing a multi-frame motion prediction with reference to a plurality of picture frames
US7675970B2 (en) * 2004-01-12 2010-03-09 General Instrument Corporation Method and apparatus for processing a bitstream in a digital video transcoder
EP1727090A1 (en) * 2004-02-27 2006-11-29 Tdvision Corporation S.A. DE C.V. Method and system for digital decoding 3d stereoscopic video images
JP2007525906A (ja) * 2004-02-27 2007-09-06 ティディヴィジョン コーポレイション エス.エー. デ シー.ヴィ. 立体3dビデオイメージディジタルコーディングのシステムおよび方法
US7801383B2 (en) * 2004-05-15 2010-09-21 Microsoft Corporation Embedded scalar quantizers with arbitrary dead-zone ratios
US7848428B2 (en) * 2004-06-17 2010-12-07 Broadcom Corporation System and method for reducing visible artifacts in video coding using multiple reference pictures
CN100581245C (zh) * 2004-07-08 2010-01-13 高通股份有限公司 用于视频编码的有效速率控制技术
US7710462B2 (en) * 2004-12-17 2010-05-04 Mitsubishi Electric Research Laboratories, Inc. Method for randomly accessing multiview videos
US20060156363A1 (en) * 2005-01-07 2006-07-13 Microsoft Corporation File storage for scalable media
KR100779875B1 (ko) * 2005-01-14 2007-11-27 주식회사 휴맥스 다-시점 코딩을 위한 참조 프레임 순서 설정 방법 및 그방법을 기록한 기록매체
US7403562B2 (en) * 2005-03-09 2008-07-22 Eg Technology, Inc. Model based rate control for predictive video encoder
KR100732961B1 (ko) * 2005-04-01 2007-06-27 경희대학교 산학협력단 다시점 영상의 스케일러블 부호화, 복호화 방법 및 장치
WO2006110007A1 (en) * 2005-04-13 2006-10-19 Industry-Academic Cooperation Foundation, Yonsei University Method for coding in multiview video coding/decoding system
KR100643291B1 (ko) 2005-04-14 2006-11-10 삼성전자주식회사 랜덤 엑세스의 지연을 최소화하는 비디오 복부호화 장치 및방법
US7974341B2 (en) * 2005-05-03 2011-07-05 Qualcomm, Incorporated Rate control for multi-layer video design
US8422546B2 (en) 2005-05-25 2013-04-16 Microsoft Corporation Adaptive video encoding using a perceptual model
US8139642B2 (en) * 2005-08-29 2012-03-20 Stmicroelectronics S.R.L. Method for encoding signals, related systems and program product therefor
CN100448297C (zh) * 2005-11-08 2008-12-31 上海广电(集团)有限公司中央研究院 一种码率控制方法
FR2895172A1 (fr) * 2005-12-20 2007-06-22 Canon Kk Procede et dispositif de codage d'un flux video code suivant un codage hierarchique, flux de donnees, procede et dispositif de decodage associes
US8503536B2 (en) 2006-04-07 2013-08-06 Microsoft Corporation Quantization adjustments for DC shift artifacts
US8059721B2 (en) 2006-04-07 2011-11-15 Microsoft Corporation Estimating sample-domain distortion in the transform domain with rounding compensation
US7974340B2 (en) 2006-04-07 2011-07-05 Microsoft Corporation Adaptive B-picture quantization control
US7995649B2 (en) 2006-04-07 2011-08-09 Microsoft Corporation Quantization adjustment based on texture level
US8130828B2 (en) 2006-04-07 2012-03-06 Microsoft Corporation Adjusting quantization to preserve non-zero AC coefficients
US8711925B2 (en) 2006-05-05 2014-04-29 Microsoft Corporation Flexible quantization
AU2007269575B2 (en) * 2006-07-06 2012-08-16 Interdigital Vc Holdings, Inc. Method and apparatus for decoupling frame number and/or picture order count (POC) for multi-view video encoding and decoding
CN100425077C (zh) * 2006-08-07 2008-10-08 浙江大学 采用帧目标比特数不平均分配的视频压缩码率控制方法
US8238424B2 (en) 2007-02-09 2012-08-07 Microsoft Corporation Complexity-based adaptive preprocessing for multiple-pass video compression
US8594180B2 (en) * 2007-02-21 2013-11-26 Qualcomm Incorporated 3D video encoding
US8498335B2 (en) 2007-03-26 2013-07-30 Microsoft Corporation Adaptive deadzone size adjustment in quantization
US8243797B2 (en) 2007-03-30 2012-08-14 Microsoft Corporation Regions of interest for quality adjustments
US8442337B2 (en) 2007-04-18 2013-05-14 Microsoft Corporation Encoding adjustments for animation content
DE102007022955A1 (de) * 2007-05-16 2008-11-20 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Qualitätsskalierbares Videosignal, Verfahren zu dessen Erzeugung, Codierer und Decodierer
US8331438B2 (en) 2007-06-05 2012-12-11 Microsoft Corporation Adaptive selection of picture-level quantization parameters for predicted video pictures
KR101345295B1 (ko) * 2007-06-11 2013-12-27 삼성전자주식회사 인트라 픽처만을 이용한 동영상 시퀀스의 부호화시의비트율 제어 방법 및 장치
EP2501137A3 (en) * 2007-06-11 2012-12-12 Samsung Electronics Co., Ltd. Method and apparatus for generating header information of stereoscopic image
US20080303832A1 (en) * 2007-06-11 2008-12-11 Samsung Electronics Co., Ltd. Method of generating two-dimensional/three-dimensional convertible stereoscopic image bitstream and method and apparatus for displaying the same
US8254455B2 (en) 2007-06-30 2012-08-28 Microsoft Corporation Computing collocated macroblock information for direct mode macroblocks
CN101785317B (zh) * 2007-08-15 2013-10-16 汤姆逊许可证公司 使用区域视差向量的多视角编码视频中的运动跳过模式的方法和装置
CN101415114B (zh) * 2007-10-17 2010-08-25 华为终端有限公司 视频编解码方法和装置以及视频编解码器
CN101420609B (zh) * 2007-10-24 2010-08-25 华为终端有限公司 视频编码、解码方法及视频编码器、解码器
JP2009135686A (ja) 2007-11-29 2009-06-18 Mitsubishi Electric Corp 立体映像記録方法、立体映像記録媒体、立体映像再生方法、立体映像記録装置、立体映像再生装置
CN100563338C (zh) * 2007-12-13 2009-11-25 上海广电(集团)有限公司中央研究院 一种恒定码率的控制方法
US8189933B2 (en) 2008-03-31 2012-05-29 Microsoft Corporation Classifying and controlling encoding quality for textured, dark smooth and smooth video content
US8325800B2 (en) 2008-05-07 2012-12-04 Microsoft Corporation Encoding streaming media as a high bit rate layer, a low bit rate layer, and one or more intermediate bit rate layers
US8379851B2 (en) 2008-05-12 2013-02-19 Microsoft Corporation Optimized client side rate control and indexed file layout for streaming media
KR101591085B1 (ko) * 2008-05-19 2016-02-02 삼성전자주식회사 영상 파일 생성 및 재생 장치 및 방법
US7925774B2 (en) * 2008-05-30 2011-04-12 Microsoft Corporation Media streaming using an index file
US8897359B2 (en) 2008-06-03 2014-11-25 Microsoft Corporation Adaptive quantization for enhancement layer video coding
US8265140B2 (en) 2008-09-30 2012-09-11 Microsoft Corporation Fine-grained client-side control of scalable media delivery
US8189666B2 (en) 2009-02-02 2012-05-29 Microsoft Corporation Local picture identifier and computation of co-located information
WO2010098134A1 (ja) * 2009-02-27 2010-09-02 パナソニック株式会社 記録媒体、再生装置、及び集積回路
WO2010100875A1 (ja) * 2009-03-02 2010-09-10 パナソニック株式会社 記録媒体、再生装置、及び集積回路
JP5274359B2 (ja) 2009-04-27 2013-08-28 三菱電機株式会社 立体映像および音声記録方法、立体映像および音声再生方法、立体映像および音声記録装置、立体映像および音声再生装置、立体映像および音声記録媒体
JP5627860B2 (ja) 2009-04-27 2014-11-19 三菱電機株式会社 立体映像配信システム、立体映像配信方法、立体映像配信装置、立体映像視聴システム、立体映像視聴方法、立体映像視聴装置
US9286709B2 (en) * 2009-07-27 2016-03-15 Dreamworks Animation Llc Variable frame rate rendering and projection
US9414080B2 (en) * 2009-08-21 2016-08-09 Broadcom Corporation Method and system for asymmetrical rate control for 3D video compression
US8428122B2 (en) * 2009-09-16 2013-04-23 Broadcom Corporation Method and system for frame buffer compression and memory resource reduction for 3D video
JP2011082683A (ja) * 2009-10-05 2011-04-21 Sony Corp 画像処理装置、画像処理方法、及び、プログラム
US9578325B2 (en) * 2010-01-13 2017-02-21 Texas Instruments Incorporated Drift reduction for quality scalable video coding
JP5667773B2 (ja) * 2010-03-18 2015-02-12 キヤノン株式会社 情報作成装置及びその制御方法
KR20110124161A (ko) * 2010-05-10 2011-11-16 삼성전자주식회사 계층 부호화 영상의 송수신 방법 및 장치
JP5768332B2 (ja) * 2010-06-24 2015-08-26 ソニー株式会社 送信機、受信機及び通信システム
JP2012034352A (ja) * 2010-06-30 2012-02-16 Panasonic Corp ステレオ動画像符号化装置及びステレオ動画像符号化方法
US9357229B2 (en) 2010-07-28 2016-05-31 Qualcomm Incorporated Coding motion vectors in video coding
CN103141115B (zh) * 2010-10-05 2016-07-06 瑞典爱立信有限公司 用于媒体流传送的客户端、内容创建器实体及其方法
US9066102B2 (en) 2010-11-17 2015-06-23 Qualcomm Incorporated Reference picture list construction for generalized P/B frames in video coding
US8873627B2 (en) * 2010-12-07 2014-10-28 Mediatek Inc Method and apparatus of video coding using picture structure with low-delay hierarchical B group
JP5377589B2 (ja) * 2011-07-07 2013-12-25 三菱電機株式会社 再生方法、再生装置、光ディスク
JP5383833B2 (ja) * 2012-01-20 2014-01-08 三菱電機株式会社 映像情報記録方法、映像情報再生方法、映像情報記録装置、映像情報再生装置、光ディスク
WO2014003379A1 (ko) * 2012-06-24 2014-01-03 엘지전자 주식회사 영상 디코딩 방법 및 이를 이용하는 장치
JPWO2014002900A1 (ja) * 2012-06-29 2016-05-30 ソニー株式会社 画像処理装置および画像処理方法
US20150085915A1 (en) * 2013-09-25 2015-03-26 Jay C.-C. Kuo Method and system for automatically encoding video with uniform throughput
JP2014042308A (ja) * 2013-10-03 2014-03-06 Mitsubishi Electric Corp 映像再生方法、映像再生装置、光ディスク
KR102274747B1 (ko) 2014-11-24 2021-07-07 삼성전자주식회사 코덱과 이를 포함하는 시스템 온 칩, 및 상기 시스템 온 칩을 포함하는 데이터 처리 시스템
US10218981B2 (en) * 2015-02-11 2019-02-26 Wowza Media Systems, LLC Clip generation based on multiple encodings of a media stream
US10553029B1 (en) 2016-09-30 2020-02-04 Amazon Technologies, Inc. Using reference-only decoding of non-viewed sections of a projected video
US10412412B1 (en) 2016-09-30 2019-09-10 Amazon Technologies, Inc. Using reference-only decoding of non-viewed sections of a projected video
US10609356B1 (en) * 2017-01-23 2020-03-31 Amazon Technologies, Inc. Using a temporal enhancement layer to encode and decode stereoscopic video content
EP3474548A1 (en) 2017-10-18 2019-04-24 Axis AB Method and encoder for encoding a video stream in a video coding format supporting auxiliary frames

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0698312A (ja) * 1992-09-16 1994-04-08 Fujitsu Ltd 画像高能率符号化方式
KR950005064A (ko) * 1993-07-09 1995-02-18 에렉 피. 헤르만 스테레오 비디오 신호를 인코딩하기 위한 방법 및 장치
JPH07123447A (ja) * 1993-10-22 1995-05-12 Sony Corp 画像信号記録方法および画像信号記録装置、画像信号再生方法および画像信号再生装置、画像信号符号化方法および画像信号符号化装置、画像信号復号化方法および画像信号復号化装置、ならびに画像信号記録媒体
JPH08126033A (ja) * 1994-10-24 1996-05-17 Sanyo Electric Co Ltd 立体動画像符号化方法
JPH0951538A (ja) * 1995-08-07 1997-02-18 Hitachi Ltd 画像信号の符号化方法
EP0817493A2 (en) * 1996-07-03 1998-01-07 General Instrument Corporation Of Delaware Rate control for stereoscopic digital video encoding

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
IL83752A (en) * 1987-09-02 1992-03-29 Ibm Israel Method and apparatus for transmitting and receiving 3-dimensional video images
GB9022326D0 (en) * 1990-10-15 1990-11-28 British Telecomm Signal coding
GB9102220D0 (en) * 1991-02-01 1991-03-20 British Telecomm Method and apparatus for decoding video signals
US5467136A (en) * 1991-05-31 1995-11-14 Kabushiki Kaisha Toshiba Video decoder for determining a motion vector from a scaled vector and a difference vector
US5179441A (en) * 1991-12-18 1993-01-12 The United States Of America As Represented By The Administrator Of The National Aeronautics And Space Administration Near real-time stereo vision system
NL9201593A (nl) * 1992-09-14 1994-04-05 Nederland Ptt Systeem omvattende een eerste encoder voor het coderen van een eerste digitaal signaal, een tweede encoder voor het coderen van een tweede digitaal signaal en ten minste één decoder voor het decoderen van gecodeerde digitale signalen, en encoder en decoder voor toepassing in het systeem.
US5515377A (en) * 1993-09-02 1996-05-07 At&T Corp. Adaptive video encoder for two-layer encoding of video signals on ATM (asynchronous transfer mode) networks

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0698312A (ja) * 1992-09-16 1994-04-08 Fujitsu Ltd 画像高能率符号化方式
KR950005064A (ko) * 1993-07-09 1995-02-18 에렉 피. 헤르만 스테레오 비디오 신호를 인코딩하기 위한 방법 및 장치
JPH07123447A (ja) * 1993-10-22 1995-05-12 Sony Corp 画像信号記録方法および画像信号記録装置、画像信号再生方法および画像信号再生装置、画像信号符号化方法および画像信号符号化装置、画像信号復号化方法および画像信号復号化装置、ならびに画像信号記録媒体
JPH08126033A (ja) * 1994-10-24 1996-05-17 Sanyo Electric Co Ltd 立体動画像符号化方法
JPH0951538A (ja) * 1995-08-07 1997-02-18 Hitachi Ltd 画像信号の符号化方法
EP0817493A2 (en) * 1996-07-03 1998-01-07 General Instrument Corporation Of Delaware Rate control for stereoscopic digital video encoding

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11457228B2 (en) * 2019-09-23 2022-09-27 Axis Ab Video encoding method and method for reducing file size of encoded video

Also Published As

Publication number Publication date
CN1496133A (zh) 2004-05-12
NO973060L (no) 1998-01-05
DE69736537D1 (de) 2006-10-05
CA2208950A1 (en) 1998-01-03
CN1190974C (zh) 2005-02-23
EP0817493A3 (en) 2001-06-27
NO973060D0 (no) 1997-07-01
EP0817493B1 (en) 2006-08-23
CN1175859A (zh) 1998-03-11
DE69736537T2 (de) 2007-08-23
EP0817493A2 (en) 1998-01-07
JPH10174110A (ja) 1998-06-26
US6072831A (en) 2000-06-06
NO316250B1 (no) 2003-12-29

Similar Documents

Publication Publication Date Title
EP0817493B1 (en) Rate control for stereoscopic digital video encoding
CA2252324C (en) View offset estimation for stereoscopic video coding
EP0838959B1 (en) Synchronization of a stereoscopic video sequence
EP0823826B1 (en) Optimal disparity estimation for stereoscopic video coding
US6563954B2 (en) Method for computational graceful degradation in an audiovisual compression system
EP1086593B1 (en) Sequence adaptive bit allocation for pictures encoding
EP0862835B1 (en) Method for modifying encoded digital video for improved channel utilization by reduction of coded B-frame data
EP1005232A2 (en) Rate control for an MPEG transcoder without a priori knowledge of picture type
US20090190662A1 (en) Method and apparatus for encoding and decoding multiview video
EP0924933A1 (en) Video data encoder, video data encoding method, video data transmitter, and video data recording medium
MXPA02011201A (es) Codificacion de video.
US20040234142A1 (en) Apparatus for constant quality rate control in video compression and target bit allocator thereof
KR19990007312A (ko) 디지털 신호 부호화 방법 및 장치, 신호 기록 매체 및 신호 전송 방법
EP1077000B1 (en) Conditional masking for video encoder
WO2006110007A1 (en) Method for coding in multiview video coding/decoding system
EP1014726A1 (en) Encoder and encoding method
US20040233984A1 (en) Apparatus for variable bit rate control in video compression and target bit allocator thereof
EP0871337A2 (en) Method and apparatus for modifying a digital data stream
US20060109906A1 (en) Methods and apparatus for dynamically adjusting f-codes for a digital picture header
KR100239867B1 (ko) 움직임예측 및 시차예측을 적용하는 경우의 화질열화억제를 위한 입체 동영상의 압축방법
MXPA97004998A (en) Control of the proportion for encoding digital video estereoscop
US20070025440A1 (en) Video encoding method and device
JPH07107458A (ja) 画像符号化装置

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
NORF Unpaid initial registration fee