JP2006525735A - 適応的な走査順序に基づいてブロックを使用するビデオ情報の符号化 - Google Patents

適応的な走査順序に基づいてブロックを使用するビデオ情報の符号化 Download PDF

Info

Publication number
JP2006525735A
JP2006525735A JP2006506940A JP2006506940A JP2006525735A JP 2006525735 A JP2006525735 A JP 2006525735A JP 2006506940 A JP2006506940 A JP 2006506940A JP 2006506940 A JP2006506940 A JP 2006506940A JP 2006525735 A JP2006525735 A JP 2006525735A
Authority
JP
Japan
Prior art keywords
data
data block
video information
block
scanning
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP2006506940A
Other languages
English (en)
Inventor
エッヘレン,ランベルテュス アー ファン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Koninklijke Philips NV
Original Assignee
Koninklijke Philips Electronics NV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Koninklijke Philips Electronics NV filed Critical Koninklijke Philips Electronics NV
Publication of JP2006525735A publication Critical patent/JP2006525735A/ja
Withdrawn legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/587Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal sub-sampling or interpolation, e.g. decimation or subsequent interpolation of pictures in a video sequence
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/112Selection of coding mode or of prediction mode according to a given display mode, e.g. for interlaced or progressive display mode
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/129Scanning of coding units, e.g. zig-zag scan of transform coefficients or flexible macroblock ordering [FMO]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/132Sampling, masking or truncation of coding units, e.g. adaptive resampling, frame skipping, frame interpolation or high-frequency transform coefficient masking
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/157Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
    • H04N19/16Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter for a given display mode, e.g. for interlaced or progressive display mode
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/172Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a picture, frame or field
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/177Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a group of pictures [GOP]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/46Embedding additional information in the video signal during the compression process
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

本発明は、入力ビデオ情報を符号化して対応する符号化された出力データを供給するためのエンコーダ100,200,300に関する。本エンコーダ100,200,300は、(a)画像フレームの系列20に対応するデータを含むビデオ情報を受ける入力手段、(b)それぞれのフレーム20に関連するデータを複数のデータマクロブロック30に細分する第一の処理ハードウェア110、(c)それぞれのマクロブロック30のデータを、その関連するマクロブロック30に存在する少なくとも空間情報を記録する対応する係数データブロックに変換する第二の処理ハードウェア110、(d)スキャニングルートに従ってそれぞれの係数データブロックをスキャニングして、対応する再構成されたデータブロックを生成する第三の処理ハードウェア110、(e)データ圧縮を再構成されたデータブロックに適用し、符号化された出力データを生成するデータコンプレッサ110を有する。第三の処理ハードウェア110は、符号化された出力データに存在するビデオ情報のデータ圧縮を強化するために、それぞれの係数ブロックにおける非対称性の程度に応じてスキャニングルートを自動的に選択するために作用する。さらに、第三の処理ハードウェア110は、それぞれの係数データブロックを処理して、その対応する再構成されたデータブロックを生成するために単一のスキャニングルートを利用するように作用する。

Description

本発明は、たとえば、デジタルビデオディスク(DVD)システム、デジタルテレビジョン及びビデオ伝送システムのような装置に関連するエンコーダ及び/デコーダにおけるビデオ情報の符号化といった、ビデオ情報の符号化に関する。
特に、排他するものではないが、本発明は、符号化係数のスキャンルートの選択が利用されるビデオ情報の符号化に関する。
たとえばビデオ信号及び画像データといった画像情報を符号化する方法が知られており、ITU(International Telecommunications Union)のITU−T勧告H.263+及びH.263/Lのような規格を含んでいる。結果的に、画像情報を符号化する初期の方法に関連する問題点に対処するため、国際規格MPEG−4(Moving Pictures Experts Group)指定のISO/IEC14496が1998年10月に完成された。たとえばMPEG−1及びMPEG−2といった初期のMPEG規格もまた現在使用されている。
最も現代のハイブリッドビデオ情報符号化技術は、ビデオ情報を受信して該情報を中間データに変換するための第一の動き補償されたDPCM(Differential Pulse Code Modulation)の手順、中間データに存在する特別の画像情報を対応するそれぞれの係数に変換するための第二の二次元DCT(Discrete Cosine Transform)の手順、これらDCT係数を量子化するための第三の手順、及び符号化された出力ビデオ情報を提供するために量子化されたDCT係数を圧縮するための第四の手順をそれぞれ採用している。
米国特許第5,767,909号では、ビデオフレームを含むデジタルビデオ信号を符号化するための方法及び関連する装置が記載されており、この方法は、適応的な走査技術を利用している。この方法は、符号化されるべき画像フレームを含むビデオ信号を受信して、該フレームに対応するデータブロックを生成し、該ブロックに対応する変換係数のセットを計算し、該係数のセットを量子化し、次いで、出力符号化データを生成するために量子化されたセットを符号化するためのソースコーダを利用することを含んでいる。更に、この方法は、非ゼロ値を有する多数の量子化された変換係数に基づいてそれぞれの画像フレームについて走査順序を適応的に決定するための量子化された変換係数のセットを走査するためのスキャナを利用する点で区別される。走査順序の適応的な決定により、エンコーダにより生成された符号化データ量において低減させることができ、すなわち、高められた程度のビデオ情報の圧縮となる。
本発明者は、上述された公開された米国特許に記載される方法が更なるデータ圧縮を提供しやすいが、より多くのデータ圧縮を提供するために現代のビデオ情報符号化装置を適応するとき、特に、幾つかのタイプのビデオ入力情報がかかる符号化装置により収容されるこことなるとき、本方法は潜在的に複雑であり、実際に実現するのに高価である点を理解している。
したがって、本発明の目的は、強化されたデータ圧縮をもたらすことができ、たとえば、比較的僅かな変更により、MPEGビデオ画像符号化規格に準拠するビデオエンコーダ及び対応するデコーダといった既存の現代のビデオ符号化装置に組み込まれやすい、ビデオ情報を符号化する方法を提供することにある。
本発明の第一の態様によれば、請求項1に記載されるような対応する符号化された出力データを提供するために、入力ビデオ情報を符号化する方法が提供される。
本発明は、本方法がこれと関連して実現されるときに現代のエンコーダに対して最小の変更を要求しつつ、強化されたデータ圧縮によりビデオ情報を符号化可能であるという利点を有している。
好ましくは、本方法のステップ(d)におけるスキャニングルーチンを制御するそれぞれの係数ブロックにおける非対称性の決定は、以下のうちの少なくとも1つに依存する。
入力ビデオ情報におけるフレームインタレースの利用。ビデオ情報に存在する1以上の画像フレームの空間スケーリングアスペクト比。1以上の画像フレームのデータに存在しているプルダウンマテリアル。ビデオ情報における先行する画像フレームを処理するために利用される1以上のスキャニングルーチン。一連の画像フレームで生じる時間的な動きの程度。先に選択されたスキャニングルーチン及びそれら関連するデータ圧縮性能に関する統計的データ。
かかる非対称のインジケータの利用により、本方法は、入力ビデオ情報の性質に正確に適応することができ、これに適用されるデータ圧縮を良好に最適化することができる。
好ましくは、フィールド及びフレームのマクロな動作モードは、本方法のステップ(b)で提供され、フィールドマクロモードは、本方法のステップ(c)における変換について対応するデータブロックを生成するためのそれら関連する時間的な瞬間に従って、インタレースされた画像フレームライン情報を相互に分離するために作用し、フレームマクロモードは、本方法のステップ(c)における変換について対応するデータマクロブロックを生成するため、それぞれの画像フレームとその関連されるデータマクロブロックとの間の空間的な対応関係を維持するために作用する。これらのモードの利用は、強化されたデータ圧縮を達成するために最も適切なスキャニングルートを本方法が採用するのを支援することができる。
好ましくは、再構成されたデータブロックを生成するために本方法のステップ(d)で利用されるスキャニングルートは、複数の画像フレーム、個々の画像フレーム、及びそれぞれのフレーム画像内のうちの1以上について切り替え可能である。
フレームからフレームに切り替え可能であるスキャニングルートについては位置することで、及びフレーム内でさえも、急速に変化するフォーマットからなる入力ビデオデータに本方法がより効率的に対処するのが可能である。
より好ましくは、利用されるスキャニングルートは、プログレッシブフォーマットである複数の画像フレームの比率とは相対的なインタレースフォーマットである複数の画像フレームの比率に応答して選択される。かかるスキャニングルートの選択は、実際に実現するために潜在的に簡単である。
好ましくは、本方法のステップ(c)におけるその関連するマクロブロックに存在する少なくとも空間的な情報を記録している対応する係数データブロックにそれぞれのマクロブロックのデータを変換することは、離散コサイン変換を使用して実現される。かかる変換は、本方法で代替的又は付加的に他のタイプの変換を利用することができるのが理解されるが、効果的なデータ圧縮を生じることができる。
好ましくは、本方法は、1以上のデジタルハードウェアロジック及びソフトウェアで実行可能である。本方法のハードウェアの実現は、実際に実現するのに潜在的に安価であり、本方法のソフトウェアの実現は、たとえばリモートドメスティックビデオ装置で、種々異なったロケーションで実現されるとき、簡単なアップデートを受けやすい。
本発明の第二の態様によれば、請求項7に記載される対応する符号化された出力データを提供するための入力ビデオ情報を符号化するためのエンコーダが提供される。
本発明の第三の態様によれば、本発明の第一の態様に係る対応する符号化された出力データを生成するためにビデオ情報を処理するために実行可能なソフトウェアが提供される。
好ましくは、ソフトウェアは、データキャリアに記録される。
本発明の第四の態様によれば、本発明の第一の態様に係る方法を使用して生成される符号化された出力データを復号化するためのデコーダが提供される。
好ましくは、デコーダは、対応する符号化された出力データからビデオ情報を再生するための本発明の第一の態様に係る方法の逆を適用するために作用する。
本発明の第五の態様では、本発明の第一の態様の方法を使用して生成される符号化された出力データが提供される。信号フォーマットは発明であると考えることができるので、データ及び信号が同義語として考えられるようにデータフォーマットも同様である。
好ましくは、符号化された出力データは、たとえば、コンパクトディスク及び/又はDVDディスクデータキャリアに記録される。
本発明の特徴は、本発明の範囲から逸脱することなしに何れかの組み合わせで結合することができる。本発明の実施の形態は、以下に添付図面を参照して例示のみで記載される。
本発明を文脈的に記載するため、現代のMPEGビデオ情報符号化に関する簡単な記載がはじめに提供される。
図1を参照して、画像情報を符号化するとき、現代のMPEGエンコーダにより実現される処理ステップが示されており、ステップは参照符号10により一般に示されている。概略では、エンコーダは、一連のビデオ画像フレーム(FRM)を時間的な系列tで受信し、これらを処理して、参照符号15により示される対応するMPEG符号化出力データ(OPD)を提供する。
それぞれ受信されたビデオフレームFRMは、2次元の画素フィールドを有しており、この画素フィールドは、エンコーダ内でデータマクロブロックDMBに小分割され、便宜的に、それぞれのマクロブロックDMBは、他のフィールドサイズもまた実施可能であるが、2次元の16×16画素フィールドを含んでいる。たとえば、エンコーダ内で現在処理されている参照符号20により示される画像フレームは、参照符号30により示される対応するマクロブロックDMBに分割される。
エンコーダは、これらマクロブロックDMBを更に処理し、それぞれのブロックDMBは、それについて4つの対応するルミナンスデータ値及び2つの対応するクロミナンスデータ値を生成し、これらの値は、参照符号40により示される関連するルミナンスブロックLBで記憶され、たとえば、それぞれのルミナンスブロックLBは、2次元の8×8画素フィールドを便宜的に含んでいるが、他の画素フィールドもまた実施可能である。ルミナンスデータ値は、それら対応するマクロブロックDMBにおけるそれぞれの画素の明るさに関する情報を含み、さらに、クロミナンスデータ値は、それら対応するマクロブロックDMBにおけるそれぞれの色に属する情報を含んでいる。
エンコーダは、参照符号45により示される変換DCTをそれぞれのルミナンスブロックLBに適用し、ルミナンスブロックLBに伝達される空間及び色情報を記述する参照符号50で示される対応する係数のブロックKBを導出し、便宜的に、係数ブロックKBは、他のアレイサイズも実施可能であるが、2次元の8×8アレイとしてもそれぞれ実現される。従来は、利用される変換DCTは、たとえばMPEG規格で記述されるように離散コサイン変換(DCT)であり、この変換は、空間的な相関を提供するために複雑な数学的手順である。変換DCTは、それぞれのブロックLBの画素値をより大きな整数で割ることを含んでおり、最下位ビットがそれぞれの画素から失われることとなり、さらに、これらの値は、コサイン関数を通して同時に通過され、刊行物“Discrete Cosine Transform − Algorithm, Advantages, Applications”by K. R. Roa, P. Yip; Academic Press Inc. 1990で提供されるように、式1(Eq.1)により概要的に記載されるように最終的に合計される。
Figure 2006525735
さらに、式1の他のパラメータは、上述された刊行物で定義されている。
次いで、係数ブロックKBは、参照符号55で示される処理演算ZTにエンコーダでそれぞれ向けられ、この処理動作は、係数を量子化し、次いでこれら量子化された係数を、参照符号60で示される対応する1次元ブロックLAに配列する。ブロックLAは、可変長符号化(VLC)を使用して最終的に処理され、上述された符号化された出力データ(OPD)15を生成する。VLC処理65は、他の実現も実施可能であるが、ルックアップテーブルを符号化することで便宜的に実現される。
変換DCTは、アレイエレメントP1,1,P8,1,P1,8及びP8,8を左上、右上、左下及び右下のそれぞれで例示されるように含む係数ブロックKBを生成する点で区別され、ここで、左上コーナにある係数は、右下コーナにある係数に比較して比較的大きな振幅の動作にある。量子化の後、右下コーナに向かう、すなわちエレメントP8,8に近づく多くの係数は、ゼロ値であると想定される。さらに、処理演算ZTは、ブロックLAを生成するときに例示されるような「ジグザグ」方式で量子化された係数値を選択するために作用し、かかる選択は、ブロックLAで互いにゼロ値係数をグループ化可能であり、VLC処理は、ゼロ値係数のグループ化に対応する情報を効率的に圧縮し、かかる圧縮されたゼロ値の情報を出力データOPDに含むことができる。動作ZTでは、量子化された係数は、順次に、すなわち以下のようなP1,1からP8,8への対称的なスキャニングルートで選択されるのが好ましい。
Figure 2006525735
変換DCT、演算ZTの対称「ジグザグ」スキャニングルート、VLC処理のゼロ値のグループ化特性を組み合わせることで、MPEG処理ステップ10は、有効なビデオ情報圧縮を提供することができる。
処理ステップ10は、ビデオフレームFRMが先に記載されたような時系列でエンコーダに提供されるとき、すなわちプログレッシブフレーム系列が提供されるとき、適用するのが比較的簡単である。しかし、ビデオフレームがインタレース系列に対応するとき、現代のMPEGエンコーダは、相互に異なる時間の瞬間に対応するインタレース画像フィールドに対処するための更なる特徴を含んでいる。このように、インタレース画像に対処するため、エンコーダは、プログレッシブフレーム系列が提供されたときにフレームマクロモードで動作可能であり、インタレースフレーム系列が提供されたときにフィールドマクロモードで動作可能である。
インタレースフレームは、奇数及び偶数のインタレース画素ラインを含んでおり、この場合、特定の画像フレームの奇数ライン及び偶数ラインが相互に異なる第一及び第二の時間のそれぞれで生じる。エンコーダは、たとえば、各マクロブロックについて、奇数及び偶数ラインに対応する隣接マクロブロックのペアの画素を分離し、それらを図2に例示されるような隣接する奇数及び偶数マクロブロックに割り当てることで、フィールドマクロモードにおいて、インタレースフレームFRMをデータマクロブロックDMBに処理するのが可能である。かかる画素ラインの再構成は、マクロブロックDMBにおける垂直スケーリング変化を導入し、これにより、スケーリングされたマクロブロックから生成される。
スケーリング変化は、係数ブロックKBで生成されるスペクトル密度の変更を導入する。すなわち、マクロブロックDMB内のスケーリングがそれら2つの直交する空間的な次元X,Yで類似するとき、対応する係数ブロックKB内の係数は、例示される軸A−Bに沿って、左上コーナP1,1から右下コーナP8,8に実質的に対称に減少する。しかし、スケーリングが係数マクロブロックDMBの2つの直交空間次元X,Yで異なるとき、それらの軸A−Bに関する対応するブロックKBにおける係数値の非対称性が結果的に生じる。
図1に示される演算ZTによる係数の対称的な「ジグザグ」選択は、スケーリングがデータマクロブロックDMBの2つの直交次元X,Yに類似するとき、最適なデータ圧縮について適している。しかし、インタレースされた画像フレームを処理するためにフィールドマクロモードでエンコーダが機能するとき、代替的な非対称性のスキャニングルートは、図3に示されるように最適なデータ圧縮を提供する。図3では、上述された「ジグザグ」スキャニングルートも比較の目的で示されている。代替的な非対称なスキャニングルートは、以下のようなP1,1からP8,8へのシーケンスに対応する。
Figure 2006525735
本発明者は、今日のMPEG規格は、演算ZTにより利用されるスケーリングルートについて、マクロブロックDMBを処理するとき、画像フレームFRM内で対称なルートと非対称なルートとの間で自動的に切り替え可能ではない。MPEG規格は、各データマクロブロックDMBについて、フレームモードからフィールドマクロモードの動作に切り替えるときに選択的に選択されるのを可能にするが、演算ZTにより適合されるスキャニングルートを各画像フレームFRM内で一定に維持する。
したがって、本発明者は、先に説明された処理ステップ10に基づいてビデオ情報を符号化する方法を考案している。本発明者の方法では、演算ZTのためのスキャニングルートの最適な選択のための予測子を利用しており、予測子は、たとえば、潜在的に低コストで今日のMPEGエンコーダに簡単に組み込み易い。かかる予測子の組み込みは、実質的に8%でMPEGエンコーダのビデオ情報の圧縮を強化可能である。これは、予測子により、フレームからフレームへのマクロデータブロックDMB及び/又は画像フレームFRMでのマクロデータブロックを処理するとき、スキャニングルートのダイナミックな選択が可能であるためである。特に、変換DCT及び演算ZTに対応して、フィールド−フレームDCTフォーマッタにより提供される情報を再使用することは実用的であることを発明者は理解しており、このフォーマッタは、予測子を実現するための今日のMPEGエンコーダに組み込まれ、これによりフレームFRMを符号化するときにスキャニングルートを動的に変更することができる。
さらに、データ圧縮を拡張するために予測子を含むかかるMPEGエンコーダは、コンパクトディスク(CD)でビデオ情報を書き込み可能なDVDレコーダすなわちDVD+RWレコーダ、テレビジョンセットトップボックス、マルチメディアシステム、及び幾つかの潜在的な例を言及するプロフェッショナルブロードキャストの使用のためのコンピュータソフトウェア及びプロフェッショナルMPEGエンコーダのような様々な装置で使用され易いことを本発明者は考えている。
上述した内容で明らかにされるように、1以上のソフトウェア及びハードウェアで実現される今日の低コストのMPEGエンコーダでは、演算ZTにより適応されるスキャニングルートは、ビデオストリーム符号化を始めるときにユーザ設定可能であり、全体のビデオストリームの処理の間に変更されないままで維持される。しかし、プロフェッショナルMPEGエンコーダのなかには、演算ZTのための非対称なスキャニングルート及び対称なスキャニングルートが、対応する出力データOPDを生成するため、たとえば2つのビデオ情報ストリームといった複数のビデオ情報ストリームを同時に処理することで共に受容され、最も圧縮された出力データを提供するビデオストリームは、最終的な出力データOPDを生成するためにかかるプロフェッショナルエンコーダで選択される。かかる同時処理は、係数ブロックKBからの係数値が複数回にわたり処理されるので、実現するのに高価である。
処理ステップ10に従って動作する今日のMPEGエンコーダが、1次元ブロックLAを生成するための係数ブロックKBを処理するときに、最適なスキャニングルートを予測するためのマクロブロックDMBを生成するために、これと関連して利用されるフィールド/フレームフォーマッタから提供される情報を再使用するために適応されることが実施可能であることを、本発明者は理解している。
本発明の方法では、そのフィールド/フレームフォーマッタは、それぞれのマクロブロックDMBを分析し、これより、そのマクロブロックDMBについて最適なDCTフォーマットを決定する。結果的に、フィールド/フレームフォーマッタが上述されたフィールドマクロモードでマクロブロックDMBを符号化するのを選択したとき、動作ZTは、ブロックLAを生成するための非対称的なルートを利用するのを選択し、対照的に、フィールド/フレームフォーマッタが上述されたフレームマクロモードでマクロブロックDMBを符号化するのを選択したとき、演算ZTは、ブロックLAを生成することにおいて実質的に対称的なルートを採用する。より好ましくは、ルートの選択は、処理されているそれぞれの画像フレーム内で動的に変更可能である。代替的に、スキャニングルートの選択は、時間的に先行する1以上のフレームFRMについて選択されたスキャニングルートに基づいてそれぞれのフレームFRMの処理の開始で行うことができる。以下では、本発明の方法に従って動作するエンコーダは、図4〜図8を参照して記載される。
図4をはじめに参照して、参照符号100により一般に示されるエンコーダが示されている。エンコーダ100は、たとえばコンテンポラリMPEG−2エンコーダといった標準的な今日のMPEGエンコーダ(MPEG)110を有している。エンコーダ110に結合されているのは、符号化されるべき到来するビデオ情報ストリーム(VI)を受信するための入力、及びビデオストリームをエンコーダ110に出力するための第一の出力(VO)を有するフィルム検出器(FDET)120である。フィルム検出器120は、到来するビデオ情報VIがプログレッシブフレームに対応するか、インタレースされたビデオ情報に対応するかを、スキャニングルートセレクタ(S−SEL)130に示すための第二の出力(PI)を更に含んでいる。セレクタ130は、そのSR出力を介して順次エンコーダ110に接続されており、上述されたように、係数ブロックKBを処理するとき、その動作ZTにより適応されるスキャニングルートを決定する。さらに、検出器120は、2:3プルダウンマテリアル及び/又は4:3レシオマテリアルがフィルム検出器120からエンコーダ110に提供されたビデオ情報VOから除かれるべきか否かを、エンコーダ110に示すための第三の出力(REM)を更に含んでいる。さらに、入力アスペクト比(ASP)の入力は、エンコーダ110の動作ZTにより選択されたスキャニングルートの決定において使用するためのルートセレクタ130に提供される。入力アスペクト比に依存するスキャニングルートのかかる選択は、以下に更に詳細に明らかにされるであろう。
また、エンコーダ110は、その符号化された出力データ(OPD)が提供される第一の出力を含んでいる。更に、エンコーダ110は、フィルタ150に符号化パラメータを出力するために、エンコーダ110の情報コレクタ140と関連する第二の符号化パラメータ出力(KP)を含んでおり、フィルタ150の出力(FO)は、エンコーダ110の動作ZTについて適応されるスキャニングルートの選択を支援するためのルートセレクタ130の入力に結合される。
エンコーダ100の動作が以下に記載される。
ビデオ情報VIは、検出器120に流れ込み、この検出器は情報を検出して、この情報がインタレース画像フレームに対応するか否か、及びこの情報が2:3プルダウンマテリアル及び/又は4:3レシオマテリアルを含むか否かを判定する。さらに、検出器120は、ビデオ情報VIのスキャニングレートを決定し、スキャニングレートは、たとえば、スキャニングルートセレクタ130における閾値を設定するために利用される。検出器120は、対応する分析出力をルートセレクタ130及びエンコーダ110にそれぞれ伝達する。検出器120がインタレースされた到来ビデオ情報を検出したとき、実質的に非対称なスキャニングルートがエンコーダ110の演算ZTにより利用されるべきことを、ルートセレクタ130を介してエンコーダ110に伝達し、逆に、検出器120がプログレッシブフレームの到来ビデオ情報、及び/又は2:3プルダウンビデオ情報、及び/又は4:3プルダウンビデオ情報を検出したとき、実質的に対称なスキャニングルートがエンコーダ110の演算ZTにより利用されるべきことを、セレクタ130を介してエンコーダ110に伝達する。エンコーダ110は、2:3プルダウンマテリアルが到来するビデオ情報ストリームVIに存在することを検出器120の第三の出力REMが示したときに、2:3プルダウン情報を除くために構成される。好ましくは、エンコーダ110は、エンコーダ100と互換性のある後続のデコーダが、入力ビデオストリーム(VI)を再構成するための出力データ(OPD)を復号化するときに、かかるマテリアルを追加可能であるようなやり方で、2:3プルダウンマテリアルを除く。
情報コレクタ140及びその関連するフィルタ150は、たとえば先行する画像フレームFRMについて適応されるスキャニングルートに依存して動作ZTのためのスキャニングルートの選択を制御するために作用する。
2:3プルダウンマテリアルの保持は出力データ(OPD)において許容される場合、図4に示されるエンコーダ100が簡略化しやすいことを本発明者は理解している。かかる簡略化されたエンコーダは図8に例示されており、簡略化されたエンコーダは、参照符号200により一般に示されている。エンコーダ200は、フレーム検出器120が省略された場合を除いてエンコーダ100に類似している。さらに、同期出力(SYNC)は、フレーム同期を支援するために、エンコーダ110からセレクタ130に提供される。エンコーダ200は、特に、比較的最小の変更による標準的な今日のMPEGエンコーダを使用して実現可能であるという利点を提供する間でも、エンコーダ110における動作ZTのために最適なスキャニングルートを選択可能であるという利点を有している。
エンコーダ100,200は、実際に特徴付けされ、実質的に類似の符号化性能及びロバスト性を提供することがわかる。調査された両方のエンコーダ100,200では、フィルタ150及びセレクタ130は、グループ・オブ・ピクチャの画像フレーム(GOP)の開始で演算ZTに適応されたスキャニングルートを変更するために実現されている。しかし、エンコーダ100,200を変更することで更に拡張された圧縮が達成可能であることを本発明者は考えており、それらセレクタ130が画像フレーム毎にスキャニングルートを変更するために作用し、望まれる場合に、エンコーダ100,200における画像処理の間にそれぞれのフレーム画像FRM内でスキャニングルートを変更するために作用する。
その演算ZTにための特定のスキャニングルートをエンコーダ110に調節させるようにセレクタ130に指示するとき、そのフィルタ150がフレームFRMの系列にわたり平均するようにエンコーダ200が構成されるときに問題が生じる。たとえば、エンコーダ200は、次いで、系列にわたりその動作ZTについて一定のスキャニングルートを結果的に適応し、この場合、系列は、幾つかの2:3プルダウンマテリアル及び/又は4:3レシオマテリアルを部分的に含んでいる。動作ZTにおける実質的に対称なスキャニングルートと非対称なスキャニングルートの間で選択のために調整される閾値に依存して、画像の全体の系列は、この例では、特定の選択されたスキャニングルートを使用して符号化される。かかる一定のスキャニングルートの調整から生じるデータ圧縮における低減に対処するため、エンコーダ200は、2:3プルダウンマテリアルに効率的に対処するために、図6に概念的に例示され、参照符号300により示されるエンコーダを提供するために更に適応することができる。
エンコーダ300のコンフィギュレーションは、図6を参照してはじめに記載される。
エンコーダ300は、逆符号化の再順序機能(INV)310、プルダウン検出機能(PLD−DET)320及びタイマ機能(RET)330を有している。再順序機能310は、情報コレクタ140から符号化パラメータ(PAPAM)を受信し、これらを処理してプルダウン機能320及びフィルタ150に対応するデータを提供する。さらに、プルダウン検出機能320は、データをタイマ機能330に出力し、セレクタ130に直接的に出力するために配置される。さらに、フィルタ150は、セレクタ130にデータを直接出力するために構成される。したがって、セレクタ130は、プルダウンマテリアルがそこに存在するか否かで、ビデオ情報ストリームVIに存在する連続する画像フレーム内の動きの1以上のレートに依存してエンコーダ110の動作ZTにより調整されるスキャニングルートを指示するために作用し、符号化パラメータの一般的な特性は、フィルタ150により通過される。情報コレクタ140それ自身は、たとえばマクロブロックのDMB処理に関する性能を符号化するエンコーダ110のインジケータを収集するためのエンコーダ110内で相互接続されている。
プルダウン機能320は、フォーム検出器(FORM−DET)400とこれに結合されるパターン認識検出器(PREC)410の組み合わせにより、図7に概念的に示されるように実現されやすい。エンコーダ110の情報コレクタ140から収集される情報ストリームI1〜Inは、フォーム検出器400により処理され、それぞれの画像フレームFRMがインタレースされるか一時的にプログレッシブであるかを符号化パラメータPARAMに基づいて画像フレーム当たり判定する。出力ストリームF1〜Fnは、フレームフォーマットを示している。出力ストリームFは、認識検出器410に伝達され、この検出器は、入力ビデオ情報VIが2:3プルダウンマテリアル(2:3PD)を含むかを判定し、すなわちかかるマテリアルの存在に関するyes/no(Y/N)の指示を出力する。
同様に、フィルタ150は、図8に例示されるように実現されやすく、この場合、パラメータI1〜I5は、たとえば、フィールドマクロモード及び/又はフレームマクロモードといった1以上の上述されたマクロモードで機能するエンコーダ300で符号化されたマクロモードの数を示す情報コレクタ140により収集される情報に固有である。
エンコーダ300は、上述されたフィールドマクロモードで動作しているとき、2:3プルダウンマテリアルの存在及び情報コレクタ140から提供される符号化パラメータからの位相を検出し、画像フレームFRM内での動きを消去するのが可能であり、実質的に低い程度の動きがエンコーダ300に提供される画像フレームFRMに存在するとき、インタレース画像は実質的に類似しており、エンコーダ300のエンコーダ100の動作ZTのための実質的に対称なスキャニングルートは、次いで、出力データOPDにおける効率的なデータ圧縮を達成するために有利にも調整され、逆に、比較的高い程度の動きが画像フレームに存在するとき、動作ZTのための非対称的なスキャニングルートは、次いで、出力データOPDにおける強化されたデータ圧縮を達成するために有利にも採用される。検出器120が著しい動きをもつ2:3プルダウンビデオ情報を検出したとき、演算ZTのための非対称のスキャニングルートが有利にも利用される。
エンコーダ100,200,300は、以下のように構成されることが好ましい。それらのエンコーダ110がフィールドマクロモードで動作しているとき、nGOPの間のマクロブロックの数に関してカウントが行われる。すなわち、GOP及びnは、「グループ・オブ・イメージピクチャ」及び整数にそれぞれ対応する。エンコーダ100,200,300において新たな後続のGOPの処理の開始が生じたとき、エンコーダ100,200,300は、マクロブロックDMBの実質的に10%以上がインタレースに対処するために処理されたときに、すなわちフィールドマクロモードにおけるように、それらの動作ZTについて非対称なスキャンルートを採用するために構成される。マクロブロックDMBの実質的に10%以下がインタレースに対処するために処理されたとき、新たな後続のGOPの処理の開始は、たとえば上述されたような対称な「ジグザグ」ルートといった、その動作ZPのための実質的に対称なスキャンルートを利用するために構成されるエンコーダ100,200,300のエンコーダ110で生じる。
10%の閾値が先に記載されたが、たとえば2〜50%の範囲で、より好ましくは5〜25%の範囲で1以上の閾値といった他の閾値を適用することができることを理解されたい。
さらに、アスペクト比をエンコーダ100,200,300内で設定することができることを理解されたい。たとえば、ASP入力に伝達されたとき、到来するビデオ情報に存在する画像フレームの所定のアスペクト比により、セレクタ130は、拡張されたビデオ情報の圧縮を達成するため、1以上の好適なスキャニングルートをエンコーダ110に適応させる。たとえば、4:3及び16:9の画像フレームのアスペクト比について、エンコーダ110は、その動作ZTについて2つの相互に異なる非対称なスキャニングルートを調整可能であることが好ましく、かかる異なるスキャニングルートは、かかるアスペクト比について最適化されることが好ましい。様々な画像のアスペクト比について適切なスキャニングルートは、エンコーダをプログラミング及び/又は分析したとき、適切な統計的な分析により前もって決定され、代替的又は付加的に、スキャニングルートは、エンコーダ100,200,300の圧縮性能を監視する間に、様々な画像のアスペクト比の様々なスキャニングルートを特徴付けることで経験的に決定することができる。
エンコーダ100,200,300は、それらの情報コレクタ140がnGOPの処理においてKB係数を符号化するために使用されるビット数をカウントするために作用するように適合される。新たなGOPの処理が開始されたとき、セレクタ130は、カウントされたビットの実質的に19%以上がフィールドマクロモードにおけるマクロブロックDMBの処理に関して使用されたとき、動作ZTに非対称的なスキャニングルートを利用させるように指示される。多かれ少なかれ実質的に19%がフィールドマクロモードにおけるマクロブロックDMBの処理に関して使用されるとき、セレクタ130は、動作ZTに対称なスキャニングルートに従わせるために作用する。動作ZTのためのスキャニングルートを決定するためのかかるビットカウント手順は、拡張されたデータ圧縮をそこで達成するためにエンコーダ100,200,300の動作を制御するために現実に利点がある。実質的に19%の閾値が先に記載されたが、望まれる場合には、たとえば10〜40%の範囲で閾値を変更することができることを理解されたい。
エンコーダ100,200,300は、たとえば、1以上の特定用途向け集積回路(ASIC)又は1以上のカスタム集積回路といった、符号化ハードウェアを使用して実現されるのが好ましい。代替的に、エンコーダ100,200,300は、たとえばプロプラエタリコンピューティングプラットフォームといった、コンピューティングハードウェアで実行しやすいソフトウェアで実現することができる。更なる代替として、エンコーダ100,200,300は、カスタマイズされたハードウェア及びソフトウェアと関連されるコンピューティングハードウェアとの組み合わせとして、ハイブリッドフォームで実現することができる。類似の実現の考察は、エンコーダ100,200,300により生成された出力データOPDを復号化するために利用される今日のデコーダに適する。かかるデコーダもまた本発明の範囲にあり、エンコーダ100,200,300での利用される符号化方法の逆の動作に対応するデータ処理機能を実行するために作用することが好ましい。
他の形態のエンコーダ100,200,300が本発明の範囲内で実施可能であることを理解されたい。同様に、かかる他のエンコーダからの符号化されたビデオ情報を復号化するのに適したデコーダ、及びエンコーダ100,200,300は、本発明の範囲である。本発明の方法、該方法を実現する装置、及び該方法を実現するソフトウェアは、本発明の範囲にある。本方法は、潜在的に比較的に低いコストでの拡張されたデータ圧縮を提供可能であり、たとえば製造されたビデオ符号化及び/又は復号化装置で工業的に適用可能である。
なお、上述された実施の形態は、本発明を限定するよりはむしろ例示するものであって、当業者であれば特許請求の範囲から逸脱することなしに多くの代替的な実施の形態を設計するであろう。請求項において、括弧間に配置される参照符号は、請求項を制限するものとして解釈されるべきではない。単語「有する“comprising”」は、請求項に列挙された構成要素又はステップ以外の構成要素又はステップを排除するものではない。本発明は、幾つかの個別の構成要素を有するハードウェアにより、適切にプログラムされたコンピュータにより実現することができる。幾つかの手段を列挙する装置の請求項では、これらの手段のうちの幾つかは、同一アイテムのハードウェアにより実施することができる。所定の手段が相互に異なる従属の請求項で引用される事実は、これらの手段の組み合わせを利用のために使用することができないことを示していない。
従来のMPEG画像情報符号化で利用される処理ステップの概念的な表現を示す図である。 インタレース画像のためのデータマクロブロック生成に関する概念的な例を示す図である。 連続するフレーム及びインタレース画像情報の受信に応じて、データマクロブロックの生成から生じる様々な画像スケーリングを収容するための対称及び非対称の係数ブロックスキャニングルートの例を示す図である。 本発明の方法を実行するための本発明に係る第一のエンコーダの概念的な表現を示す図である。 本発明の方法を実行するための本発明に係る第二のエンコーダの概念的な表現を示す図である。 本発明の方法を実行するための本発明に係る第三のエンコーダの概念的な表現を示す図である。 図6に例示される第三のエンコーダのプルダウン検出機能の概念図である。 図6に例示される第三のエンコーダのフィルタの概念図である。

Claims (10)

  1. 入力ビデオ情報を符号化して、対応する符号化された出力データを供給する方法であって、
    (a)画像フレームの系列に対応するデータを含むビデオ情報を受けるステップと、
    (b)それぞれのフレームに関連するデータを複数のデータブロックに細分するステップと、
    (c)それぞれのデータブロックのデータを、その関連するデータブロックに存在する少なくとも空間情報を記録する対応する係数データブロックに変換するステップと、
    (d)スキャニングルートに従ってそれぞれの係数データブロックをスキャニングし、対応する再構成されたデータブロックを生成するステップと、
    (e)データ圧縮を前記再構成されたデータブロックに適用し、前記符号化された出力データを生成するステップとを有し、
    当該方法は、前記ステップ(d)において、前記符号化された出力データに存在するビデオ情報のデータ圧縮を強化するために、それぞれの係数ブロックにおける非対称性の程度に応じて前記スキャニングルートを自動的に選択するために作用し、
    前記ステップ(d)において、それぞれの係数データブロックを処理して、その対応する再構成されたデータブロックを生成するために単一のスキャニングルートが利用される、
    ことを特徴とする方法。
  2. 前記ステップ(d)におけるスキャニングルートを制御するそれぞれの係数ブロックにおける非対称性の判定は、前記入力ビデオ情報におけるフレームインタレースの利用、前記ビデオ情報に存在する1以上の画像フレームの空間スケーリングアスペクト比、1以上の画像フレームのデータに存在するプルダウンマテリアル、前記ビデオ情報における先行する画像フレームを処理するために利用される1以上のスキャニングルート、一連の画像フレームで生じる時間的な動きの程度、並びに、前に選択されたスキャニングルート及びそれらの関連するデータ圧縮性能のうちの少なくとも1つに依存する、
    請求項1記載の方法。
  3. 前記ステップ(b)においてフィールドマクロモード及びフレームマクロモードの動作が提供され、前記フィールドマクロモードは、それら関連する時間に従ってインタレースされた画像フレームのライン情報を相互に分離して、前記ステップ(c)における変換のための対応するデータブロックを生成するために作用し、前記フレームマクロモードは、それぞれの画像フレームとその関連するデータブロックとの間の空間的な対応関係を維持して、前記ステップ(c)における変換のための対応するデータマクロブロックを生成するために作用する、
    請求項1記載の方法。
  4. 前記再構成されたデータブロックを生成するために前記ステップ(d)で利用されるスキャニングルートは、複数の画像フレーム、個々の画像フレーム及びそれぞれのフレーム画像内、のうちの1以上について切り替え可能である、
    請求項1記載の方法。
  5. 利用されるスキャニングルートは、プログレッシブフォーマットからなる複数の画像フレームの割合と相対的なインタレースフォーマットからなる複数の画像フレームの割合に応答して選択される、
    請求項4記載の方法。
  6. 前記ステップ(c)における、その関連するデータブロックに存在する少なくとも空間情報を記録する対応する係数データブロックにそれぞれのマクロブロックのデータを変換することは、離散コサイン変換を使用して実現される、
    請求項1記載の方法。
  7. 入力ビデオ情報を符号化し、対応する符号化された出力データを供給するためのエンコーダであって、
    (a)画像フレームの系列に対応するデータを含むビデオ情報を受ける入力手段と、
    (b)それぞれのフレームに関連するデータを複数のデータブロックに細分する第一の処理手段と、
    (c)それぞれのデータブロックのデータを、その関連するデータブロックに存在する少なくとも空間情報を記録する対応する係数データブロックに変換する第二の処理手段と、
    (d)スキャニングルートに従ってそれぞれの係数データブロックをスキャニングし、対応する再構成されたデータブロックを生成する第三の処理手段と、
    (e)データ圧縮を再構成されたデータブロックに適用し、前記符号化された出力データを生成する圧縮手段とを有し、
    前記第三の処理手段は、前記符号化された出力データに存在するビデオ情報のデータ圧縮を強化するために、それぞれの係数ブロックにおける非対称性の程度に応じて前記スキャニングルートを自動的に選択するために作用し、
    前記第三の処理手段は、それぞれの係数データブロックを処理して、その対応する再構成されたデータブロックを生成するために単一のスキャニングルートを利用するように作用する、
    ことを特徴とするエンコーダ。
  8. 請求項1の方法に係る対応する符号化された出力データを生成するため、ビデオ情報を処理するために実行可能なソフトウェア。
  9. 請求項1記載の方法を使用して生成される符号化された出力データ。
  10. 請求項9記載の符号化された出力データを記憶したデータキャリア。
JP2006506940A 2003-05-06 2004-05-04 適応的な走査順序に基づいてブロックを使用するビデオ情報の符号化 Withdrawn JP2006525735A (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
EP03101245 2003-05-06
PCT/IB2004/050575 WO2004100554A1 (en) 2003-05-06 2004-05-04 Encoding video information using block based adaptive scan order

Publications (1)

Publication Number Publication Date
JP2006525735A true JP2006525735A (ja) 2006-11-09

Family

ID=33427169

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006506940A Withdrawn JP2006525735A (ja) 2003-05-06 2004-05-04 適応的な走査順序に基づいてブロックを使用するビデオ情報の符号化

Country Status (6)

Country Link
US (1) US20070053436A1 (ja)
EP (1) EP1623577A1 (ja)
JP (1) JP2006525735A (ja)
KR (1) KR20060009898A (ja)
CN (1) CN1784904A (ja)
WO (1) WO2004100554A1 (ja)

Families Citing this family (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7738554B2 (en) 2003-07-18 2010-06-15 Microsoft Corporation DC coefficient signaling at small quantization step sizes
US10554985B2 (en) 2003-07-18 2020-02-04 Microsoft Technology Licensing, Llc DC coefficient signaling at small quantization step sizes
US8711925B2 (en) 2006-05-05 2014-04-29 Microsoft Corporation Flexible quantization
US8250618B2 (en) * 2006-09-18 2012-08-21 Elemental Technologies, Inc. Real-time network adaptive digital video encoding/decoding
US8184715B1 (en) 2007-08-09 2012-05-22 Elemental Technologies, Inc. Method for efficiently executing video encoding operations on stream processor architectures
US8121197B2 (en) 2007-11-13 2012-02-21 Elemental Technologies, Inc. Video encoding and decoding using parallel processors
US8897359B2 (en) 2008-06-03 2014-11-25 Microsoft Corporation Adaptive quantization for enhancement layer video coding
US8503527B2 (en) 2008-10-03 2013-08-06 Qualcomm Incorporated Video coding with large macroblocks
US8194991B2 (en) 2008-10-20 2012-06-05 Motorola Mobililty, Inc. Out-of-order coding
US20100177161A1 (en) * 2009-01-15 2010-07-15 Dell Products L.P. Multiplexed stereoscopic video transmission
US9094691B2 (en) * 2010-03-15 2015-07-28 Mediatek Singapore Pte. Ltd. Methods of utilizing tables adaptively updated for coding/decoding and related processing circuits thereof
US9288496B2 (en) 2010-12-03 2016-03-15 Qualcomm Incorporated Video coding using function-based scan order for transform coefficients

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2530090B2 (ja) * 1992-02-28 1996-09-04 三星電子株式会社 映像信号符号化装置
US5500678A (en) * 1994-03-18 1996-03-19 At&T Corp. Optimized scanning of transform coefficients in video coding
KR0178198B1 (ko) * 1995-03-28 1999-05-01 배순훈 영상 신호 부호화 장치
KR100192270B1 (ko) * 1996-02-03 1999-06-15 구자홍 에이치디티브이 비데오 디코더 회로
US5790706A (en) * 1996-07-03 1998-08-04 Motorola, Inc. Method and apparatus for scanning of transform coefficients
US6426975B1 (en) * 1997-07-25 2002-07-30 Matsushita Electric Industrial Co., Ltd. Image processing method, image processing apparatus and data recording medium
US6940557B2 (en) * 2001-02-08 2005-09-06 Micronas Semiconductors, Inc. Adaptive interlace-to-progressive scan conversion algorithm

Also Published As

Publication number Publication date
WO2004100554A1 (en) 2004-11-18
CN1784904A (zh) 2006-06-07
US20070053436A1 (en) 2007-03-08
EP1623577A1 (en) 2006-02-08
KR20060009898A (ko) 2006-02-01

Similar Documents

Publication Publication Date Title
JP4447197B2 (ja) 動画像符号化装置および動画像復号装置
EP0881835B1 (en) Interlaced video signal encoding and decoding method, using conversion of periodically selected fields to progressive scan frames
JP3840895B2 (ja) 動画像符号化データ変換装置及びその方法
US20040125204A1 (en) Moving picture coding apparatus and moving picture decoding apparatus
KR20040007139A (ko) 복수개의 주사 패턴을 이용한 부호화 방법, 복호화 방법,및 그 장치
US8085844B2 (en) Signaling reference frame distances
JP2006525735A (ja) 適応的な走査順序に基づいてブロックを使用するビデオ情報の符号化
KR20010078393A (ko) 스케일 가능한 코딩방법
JPH0937243A (ja) 動画像符号化装置及び復号装置
US7020342B1 (en) Scalable coding
JPH10136379A (ja) 動画像符号化方法および装置
US20020118757A1 (en) Motion image decoding apparatus and method reducing error accumulation and hence image degradation
US6904093B1 (en) Horizontal/vertical scanning frequency converting apparatus in MPEG decoding block
JPH0678297A (ja) ディジタルビデオ信号の符号化方法
KR100636465B1 (ko) 데이터 처리 장치 및 데이터 처리 방법
JPH08172628A (ja) 変換符号化された画像データの復号化時に生じる量子化ノイズの低減方法及び変換符号化された画像データの復号化装置
JP4828629B2 (ja) 動画像復号方法
JP4828630B2 (ja) 動画像復号方法
JPH09149420A (ja) 動画像圧縮方法および装置
US20220078430A1 (en) Image data encoding and decoding
JP2891251B2 (ja) 画像符号化装置及び画像復号化装置
EP4128758A1 (en) Video data encoding and decoding using a coded picture buffer
JP2010041408A (ja) 動画像符号化装置、動画像復号化装置、動画像符号化方法および動画像復号化方法
JP2000333203A (ja) 圧縮符号化方法、圧縮復号化方法、圧縮符号化装置及び圧縮復号化装置
JPH0851628A (ja) 動画像処理装置及びその制御方法及び動画像伝送システム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20070501

A761 Written withdrawal of application

Free format text: JAPANESE INTERMEDIATE CODE: A761

Effective date: 20070821