JP2008537427A - 効率的なビデオ復号化アクセラレータ - Google Patents

効率的なビデオ復号化アクセラレータ Download PDF

Info

Publication number
JP2008537427A
JP2008537427A JP2008507239A JP2008507239A JP2008537427A JP 2008537427 A JP2008537427 A JP 2008537427A JP 2008507239 A JP2008507239 A JP 2008507239A JP 2008507239 A JP2008507239 A JP 2008507239A JP 2008537427 A JP2008537427 A JP 2008537427A
Authority
JP
Japan
Prior art keywords
prediction
stripes
video
decoder device
stripe
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP2008507239A
Other languages
English (en)
Inventor
プラーニュ ジェロー
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NXP BV
Original Assignee
NXP BV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NXP BV filed Critical NXP BV
Publication of JP2008537427A publication Critical patent/JP2008537427A/ja
Withdrawn legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/42Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/105Selection of the reference unit for prediction within a chosen coding or prediction mode, e.g. adaptive choice of position and number of pixels used for prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/18Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a set of transform coefficients
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/44Decoders specially adapted therefor, e.g. video decoders which are asymmetric with respect to the encoder
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

本発明は、復号装置および、複数のブロックを伴う複数のビデオフレームを有する圧縮されたビデオデータを復号する方法に関するものであり、ビデオフレームを、ストライプの幅がハードウェア予測ラインサイズを超えない少なくとも2本のストライプとして第1所定方向に分割する。このとき、係数予測を、少なくとも2個のストライプにおける1個(一方)のストライプに対して実行し、少なくとも2個のストライプにおける他の少なくとも1個のストライプに対して第2所定方向、すなわち、第1所定方向に直交する第2所定方向のプレディクタ(予測因子)を提供する。さらに、フェイクブロックを発生させて、前記少なくとも2個のストライプにおける他(方)の少なくとも1個のストライプに挿入し、第2所定方向の予測を初期化する。これによって、固定処理幅を有するハードウェアアクセラレータを、より柔軟に使用できる。

Description

本発明は、ビデオデコーダ装置及び複数のブロックを伴う複数のビデオフレームを有する圧縮したビデオデータを復号する復号化方法に関するものである。
ビデオ復号化に関する広く知られる標準規格は、例えばMPEGであり、これは「Moving Picture Experts Group」の略称である。基本的に、MPEGは、デジタル圧縮フォーマットのオーディオ‐ビジュアル(視聴覚)情報を符号化するために用いる標準規格ファミリの名称である。1988年に設立された団体は、ビデオCD及びMP3のような製品が準拠する標準規格であるMPEG−1、デジタルテレビジョンのセットトップボックスおよびデジタル・ヴァーサタイル・ディスク(DVD)のような製品が準拠する標準規格であるMPEG−2、固定ウェブおよびモバイルウェブにおけるマルチメディアのための標準規格であるMPEG−4を策定した。MPEG−4は、標準規格ISO/IEC 14496−2001における、「オーディオ‐ビジュアルオブジェクトの符号化(CORDING OF AUDIO−VISUAL OBJECTS)」に記載されている。
少なくとも第1フェーズにおいて、従来のハードウェア解決手法として設計および実現されたMPEG−1およびMPEG−2と異なり、MPEG−4は、ソフトウェアで実装できる標準規格として着想された。このことは、対応するISO/IEC14496標準規格のパート5が、なぜ標準規格の参照ソフトウェア実装に関するリファレンスを含んでいるかの理由である。
MPEGビデオデータストリームは、例えばPAL(phase alternating line)解像度におけるピクチャを含み、単一のピクチャまたは複数のピクチャは、25Hzのピクチャ周波数で幅720ピクセル、高さ576ピクセルにより構成している。すなわち、この単一ピクチャの伝送には40msのタイムスロットがある。他のピクチャサイズ、例えばNTSC用のサイズ、ならびに他のピクチャ周波数、例えば30Hzも可能であることに留意されたい。さらに、MPEGにおいては、各ピクチャを、符号化のために複数個のブロックに分割する。この目的のため、1ブロックは、8×8ピクセルにより構成することができ、さらに他のサイズ、例えば、16×16または4×4のサイズ、または16×8のような非正方形のものでさえも可能である。したがって、720×576ピクセルのピクチャは、8×8のブロックを6480個有する。YUV色空間を用いる場合、各8×8ピクセルブロックに対して、通常64個のY値(各ピクセルにつき1個の値)ではあるが、32個のU値、32個のV値のみが記憶(格納)される。この符号化は4:2:2方式として知られ、RGBのフォーマットでは192バイトを必要とする代わりに、64ピクセル用に合計64+32+32=128バイトで済む。したがって、4:2:2方式の符号化では、ピクチャを符号化するためには、12960個のブロック総数となる。4:2:2の方式の他に、他の方式、例えば4:4:4または4:2:0も可能であることに留意されたい。
デジタル化のために、三つの信号成分(YUV)の各々は8×8ピクセルブロックに分割し、離散コサイン変換(DCT)の適用によって空間領域から周波数領域に変換される。DCTは、各8×8ピクセルブロックを8×8DCT係数マトリクスによって表されるそれぞれの周波数成分に分割する。周波数領域において、より大きいDCT係数値は、マトリクスの上方左側領域に位置する比較的低い周波数成分に一般的に集中する。この比較的低い周波数成分は、さらに、ゼロ周波数DCT係数を含み、このゼロ周波数DCT係数は、それぞれの画像ブロックの直流(DC)成分とも称される。比較的高い周波数成分は、0または0に近い振幅値のDCT係数を有する傾向がある。最も高い周波数成分は、DCTマトリクスの左下コーナーに位置する。簡潔に言うと、DCTマトリクスの下方右側領域は、それぞれの画像ブロックの小さい細部を表す。この態様は、さらに、DCT係数の量子化において、量子化マトリクスによる符号化処理の他のステップとみなすこともできる。最後に、64個に量子化されたDCT係数よりなる各DCTマトリクスは、マトリクス構成からアレイに変換しなければならない。この変換は、DCTマトリクスに対して、左上コーナー、すなわちDC DCT係数から始まって、右下コーナー、すなわち最も高いDCT周波数までに至るジグザグ経路によって実行することができる。この変換は量子化されたDCT係数のアレイを生じる。最後に、このアレイは、まず、走行長(RL)符号によって、またエントロピー符号、例えばハフマンエンコーダまたは可変長符号(VLC)によって可逆的に(劣化なく)符号化される。
ブロックとして符号化されたピクチャデータは、それぞれのMPEG標準規格に従って配列される。最後に、このようなMPEGビットストリームの特定フォーマットを知ることにより、受信装置は、転送されたビジュアル情報を復号することができる。簡潔に言うと、逆離散コサイン変換(iDCT)を適用することにより、各画像ブロックのDCT係数から、各単独の画像ブロックを、再構築することができる。
携帯電話は、現在、音声通信の他に、ゲーム及び動画配信を含む多種多様な高度なアプリケーションを提供する。しかし、第三世代(3G)携帯電話における、より高速の通信速度では、データ転送速度はより速くなり、更なる拡張性がビデオフォンのようなアプリケーション領域で期待され、より速い画像処理性能を有するプロセッサに対する要望がある。同時に、携帯電話に内蔵されるカメラのピクセル数が著しく増大し、時代のトレンドとしてはディスプレイ寸法の増大が予想され、このディスプレイ寸法に対処することができるプロセッサの必要性をもたらす。
このようなニーズに応じて、増大した画像処理速度を有するMPEG−4ハードウェアアクセラレータ及びカメラインタフェースのような拡張した機能が、開発された。3G携帯電話プラットフォームにおけるMPEG−4ビデオデコーダは、高速MPEG−4処理のために符号化/復号化処理能力を向上させる、このようなハードウェアアクセラレータをますます使用する。ハードウェア処理によって低い消費電力は達成されただけでなく、処理用のCPU(中央演算処理装置)の負荷もかなり減少した。このことは、動画再生、ビデオフォンおよび同様の高度な機能を組み込む、高性能で、低電力消費システムの実現を可能にする。
ハードウェアおよび/またはソフトウェア領域確保は、性能および/または最終製品のコストのための鍵であるが、また、後のソフトウェアアップグレードを可能にする。集積されたハードウェアアクセラレータ(例えば特定用途向け集積回路(ASIC)としての実装)における一つの問題は、柔軟性の欠如、特にそれらの内部メモリ編成に関するものである。
イントラ符号化の性能改善は、先に再構築されたDC係数を用いることにより、DCTブロックのDC係数を予測することによって得られた。マクロブロックまたはVOP(ビデオ・オブジェクト・プレーン)のイントラ符号化中に、そのマクロブロックまたはVOPからの情報のみを用いる。VOPは、ある時間におけるビデオオブジェクトのインスタンスに対応する。
他の改善は、MPEG−4において、AC係数を予測することによっても得られた。DC係数は、周波数が両方の次元でゼロであるDCT係数である。AC係数は、一方または両方の次元の周波数がゼロでないDCT係数である。AC/DC予測は、iDCTブロックからDCおよび/またはAC値を推定することによってイントラフレームを符号化するために必要なビットの数を減少する。
図2は従来の復号化データフローの線図的フローブロック図を示し、ここで、ソフトウェアはハードウェアアクセラレータによって全て一度に実行される1個のデータセットを発生する。基本のMPEG−4ストリームを、デコーダソフトウェア20によって読み込み、このデコーダソフトウェア20は単一のデータセット12を発生し、このデータセット12は、ランレングス符号(RL符号)化して量子化したAC/DC係数22、および単一ランの復号化プロセスを実行するためにデコーダハードウェアアクセラレータ50が用いるマイクロプログラム24を含む。高速化されたハードウェア復号化プロセスは、参照フレーム60及び復号化されたフレーム62を含む単一のフレーム領域70に基づき、ピンポンフレームバッファを使用して、一時的予測を行う。
MPEG−4ビデオの場合、ハードウェアアクセラレータにおけるハードウェアブロックとしての、係数予測の実施は、DC係数およびAC係数の双方により構成するプレディクタ(予測因子)のラインを内部メモリに保持し、更新する必要がある(上記の標準規格ISO/IEC 14496−2001の§7.4.3を参照)。垂直予測のために用いられる、このラインのサイズは、設計時に分かる製品要件によるコスト上の理由で決定される。例えば、CIF(352×288)ビデオ復号化の要件は、多くても、正確に22個のマクロブロックプレディクタ(すなわち352ピクセル)のラインを生じる結果となる。この構成においては、ハードウェアに、例えば40マクロブロックのラインが必要であるVGA(640×480)クリップのための係数予測を実行させることはできない。
一つの代案は、ソフトウェアで係数予測全体を行うことであるが、これは、ハードウェアがこの処理ステップをスキップする、または禁止するよう設計することが必要であり、かつ、CPU負荷の劇的な増大を可能にするシステムの十分なヘッドルームがあることが必要である。
したがって、本発明の目的は、係数予測を改善し、これにより、ハードウェアアクセラレータが直面する上述の制限を取り除くことができるようにする係数予測手法を得るにある。
この目的は、請求項1に記載のビデオデコーダ装置及び請求項13に記載の復号化方法によって達成することができる。
したがって、ハードウェアアクセラレータが直面する、最初に説明した制限は、ビデオフレームを適切な幅の複数個のストライプに分割し、これらストライプに基づいて係数の予測を実行することによって、回避することができる。
第1方向は、ビデオフレームの垂直方向に対応し、第2方向はビデオフレームの水平方向に対応させることができ、逆の対応関係にすることもできる。この場合、分割する方向は、AC/DC予測のコストを最小化できる予測方向に適応させる。
生成手段は、少なくとも2個のストライプにおける他の少なくとも1個のストライプ内に、第1カラムとして、偽ブロックを挿入する構成とする。これは、必要な予測の量をより一層減少するために役立つ。
さらに、分割手段は、少なくとも2個のストライプに対するそれぞれのマイクロプログラムを有するそれぞれのデータセット発生する構成とし、対応のデータセットおよびマイクロプログラムを予測手段が使用して係数予測を行う構成とする。予測手段はハードウェアアクセラレータを有し、分割手段はデコーダソフトウェアによって実現することができる。このように、予測手段、例えばハードウェアアクセラレータの固定処理幅により生ずる制限は、ソフトウェア動作のいくつかの最小量を(再)導入することによって軽減またはバイパスすることができる。また、生成手段は、デコーダソフトウェアによって実現することができる。
予測手段は、少なくとも2個のストライプを逐次的に処理する構成とすることができる。さらに、それは、部分的な予測を行う構成とする。少なくとも2個のストライプは、生成した偽(フェイク)ブロックを挿入する所定オーバーラップ領域でオーバーラップさせるものとする。生成手段は、少なくとも2個のストライプのうち1個のストライプに対する予測手段から得られたプレディクタ(予測因子)に基づく逆予測を実行することによって、偽ブロックを発生する構成とすることができる。
本発明が提案する改良した復号化メカニズムまたは製法のソフトウェア動作部分は、コンピュータデバイスで実行するとき、請求項13の方法による分割および生成ステップを行い得る符号化手段を有するコンピュータプログラム製品として、実現できる。コンピュータプログラム製品は、コンピュータが読み込むことができる媒体に格納することができる。
有利には、本発明によるビデオデコーダ装置及び復号化方法は、送信機から受信機までワイヤレス接続によってビデオデータを含む、ビットストリームの転送の送信機および受信機を有するシステムに組み込むことができる。受信機は、転送されたビデオデータを表示するワイヤレスモニタにより実現する、またはワイヤレスモニタに接続することができる。送信機は、ビデオデータを含む入力ビットストリーム用のソースに実現または接続することができ、例えば、デジタルビデオソースはDVDプレーヤまたはケーブルネットによってビデオプロバイダに対する接続、サテライト接続または同様のものであることができる。送信機は、カメラによって発生するビデオデータを含むビデオビットストリームを配信する、監視カメラのようなカメラに接続されることもできる。最後に、ただし重要なことであるが、好ましい実施形態による復号化方法は受信機側に用いるときに、データストリームフォーマットのための標準規格で、それぞれに用いる適合する任意のデバイスを、システムに組み込むことができる。
本発明を、以下に添付図面に参照して、好ましい実施形態に基づいて説明する。
以下において、本発明の好ましい実施形態は、ビデオデータストリーム、例えばMPEG−4基本ストリームの係数予測動作と関連して説明する。ビデオデータストリームは、ビデオソース、例えばDVDプレーヤまたはTVセットトップボックスから、ビデオデータストリームの画像情報を表示するディスプレイデバイス、例えば高解像のビデオLCDまたはプラズマモニタに配信することができる。このようなセットトップボックスに対するビデオ/オーディオデータのためのソースとしては、例えば、地上波として(DVB−T)、または衛星を介して(DVB−S)配信されるデジタルビデオ放送(DVB)信号がある。他のソースとしては、ネットワークストリーミングおよびダウンロード‐アンド‐プレイのアプリケーションに関するものがある。
マクロブロックのタイプに基づいて、動きベクトル情報及び反対側情報を、各マクロブロックにおける圧縮予測エラーによって符号化する。動きベクトルは、予測値に関する差を計算し、可変長符号を用いて符号化する。許容される動きベクトルの最大長さは、エンコーダで決定される。適正な動きベクトルを算出するのは、エンコーダの役目である。
好ましい実施形態によれば、AC/DC係数の復号化のために改良された予測プロセスは提案する。一般に、予測は、そのとき復号されているサンプル値またはデータ素子の推定を行うプレディクタ(predictor:予測因子)を使用することを意味する。プレディクタ(予測因子)は、先に復号されたサンプル値またはデータ要素の線形結合である。前方予測は過去の参照VOPからの予測と定義し、後方予測は将来の参照VOPからの予測と定義する。
空間予測は、空間スケーラビリティに用いられる参照レイヤデコーダの復号したフレームから導き出される予測であり、この空間スケーラビリティは、エンハンスレイヤ(拡張階層)が、動きベクトルを用いることなく、より低い階層のレイヤから導き出されるサンプルデータからの予測も用いるタイプのスケーラビリティ(拡張性)である。このレイヤは、種々のVOPサイズまたはVOPレートを含むことができる。
DC及びAC係数の予測は、イントラマクロブロック(I−MBs)のために行う。
DC及びAC予測方向の適応的選択は、復号すべきブロック周辺の、水平および垂直DC傾きの比較に基づいて行うことができる。次の事例の場合、復号すべきカレントブロック「X」を囲む3個のブロックを、「A」、「B」および「C」と称し、それぞれ、ブロックAは左側ブロック、ブロックBは左上ブロック、ブロックCはすぐ上のブロックに対応する。つぎに、先に復号したブロックの逆量子化DC値を使用して、DCおよびAC予測の方向を決定する。特に、ブロックAとブロックBとの間における逆量子化DC値の差の絶対値が、ブロックBとブロックCとの間における逆量子化DC値の差の絶対値より小さい場合、予測はブロックCに基づく。そうでない場合、予測は、ブロックAに基づく。
ブロックA、BまたはCのいずれかが、VOP境界、またはビデオパケット境界の外側にあり、またはそれらはイントラ符号化マクロブロックに属さない場合、それらの逆量子化DC値は所定値をとると仮定し、予測値を計算するのに用いる。
適応的DC予測方法は、上述したように決定された予測方向に基づいて、直前のブロックの逆量子化DC値、またはその直ぐ上方(先行ブロック行における)のブロックの逆量子化DC値のいずれかを選択することを含む。このプロセスは、適正に水平方向に直接隣接するブロックA、および垂直方向に直接隣接するブロックCを用いてマクロブロックのすべてのブロックに対してそれぞれ繰り返すことができる。
DC予測は、輝度および2個の色成分のそれぞれに対して同様に実行する。
適応的AC係数予測も使用することができ、この場合、先行の符号化ブロックの、第1行(ロウ)または第1列(カラム)からの各係数を使用し、カレントブロックの共通位置における係数を予測する。1ブロック毎に、DC係数予測のため(水平方向および垂直方向のうちから)最良の方向も使用して、AC係数予測方向を選択する。このようにして、マクロブロック内で、例えば、水平方向に隣接する先行ブロックまたは垂直方向に隣接する先行ブロックのいずれかから独立して、各ブロックを予測することができる。係数の二次元アレイを逆量子化して、再構築したDCT係数を生成する。この処理は、基本的に、量子化器(クウォンタイザ)のステップサイズによる乗算である。量子化器のステップサイズは、二つのメカニズムによって変更される。加重マトリクスを使用して1ブロック内のステップサイズを変更し、またスケール係数を使用して、ステップサイズを、(新規加重マトリクス全体を符号化することと比較して)数ビットのみのコストで変更する。
好ましい実施形態によれば、上述の手順によるハードウェアによる処理迅速化の柔軟性は、ストライプ幅がハードウェア予測ラインサイズを超えないストライプにビデオフレームを垂直方向(縦)に分割することによって、向上し、これによりハードウェア予測を行うことができる。このとき、軽量(部分)予測を、最も左側のストライプに対してソフトウェアによって行い、最も右側のストライプに対する、適切な水平方向プレディクタ(予測因子)を得る。この後、最も右側のストライプにおける第1列(カラム)として挿入すべき偽(フェイク)マクロブロックを作り出し、この偽(フェイク)マクロブロックは水平予測を初期化するためのものである。
以下の説明は、2個の垂直(縦)ストライプに分割される垂直(縦)フレームの実施例に基づくものである。しかし、本発明が提案する柔軟性のある予測メカニズムは、3個以上のストライプでも同一である。
図1は、好ましい実施形態による本発明が提案するフレーム分割手法を実施する復号化データフローの線図的フローブロック図を示す。図2の従来手法に反して、デコーダソフトウェア20は、このとき、2個のデータセットA及びBを、それぞれRL符号化および量子化したAC/DC係数30,40、およびそれぞれに対応するマイクロプログラム32,42とともに生成し、これらマイクロプログラム32,42は、カレントビデオフレームにおけるそれぞれの垂直(縦)ストライプをカバーする。2個のマイクロプログラム32,42は、ハードウェアアクセラレータ50によって逐次的に(すなわち、2回のハードウェアランで)実行し、最終的に目的フレーム全体をカバーする。
図3は好ましい実施形態による、フレーム分割したビデオフレームの線図的説明図を示し、データセットAおよびBのフレーム領域におけるそれぞれの位置を示す。とくに、図3は、ビデオフレームの幅がハードウェアアクセラレータ50のハードウェア能力を超えるビデオフレームを表す。各ビデオフレームは、ビデオ信号の空間情報のラインを含む。進行するビデオに関しては、これらラインは、一つの瞬間から始まって、フレームの一番下に向かう順次のラインに続くサンプルを含む。フレームレート(画面書き換え速度)は、フレームが合成プロセスから出力される速度を規定する。
好ましい実施形態の実施例において、ビデオフレームは、ハードウェアアクセラレータ50によって順次処理される、すなわちまずB、つぎにAが順次処理される、2個の領域AおよびBに分割する。ストライプのオーバーラップ領域(A∩B)の役割は、後で説明する。
一方では、本発明が提案する垂直ストライプは、垂直予測の問題を解決する。他方では、それは、ストライプ間境界での水平予測を中断する。
この結果、最も左側のストライプが除外されて、各垂直ストライプの各マクロブロックラインは、水平予測を初期化することが必要である。したがって、水平予測は、領域Aに対してはソフトウェア内で行わなければならない。
軽量または部分的な予測は、以下のようにして行うことができる。領域AとBとの間の垂直相互作用がないとき、AC及びDCの水平プレディクタ(予測因子)のみをA領域内で計算する必要がある。AC係数に関しては、これは、DCTマトリクスの第1列(カラム)の係数だけで十分であり、第1ラインの処理コストが節約されることを意味する。よって、B領域において、予測は全く必要でない。これにより、予測コストの節約は、AC/DC予測の全体最高60〜70%にも達することができる。
さらにまた、初期化マクロブロックは、以下のようにして作成することができる。
B領域内の水平AC/DC予測を初期化するために、マクロブロックを作成し、B領域における各マクロブロックラインの開始として規定する。このメカニズムは、なぜAおよびBをオーバーラップさせるかを説明する。作成したマクロブロック列(カラム)は、A∩B領域である。この領域はビデオシーケンスの一部でないとき、それは表示する前に上書きしなければならない。これは、B領域がA領域の前に復号化されるならば、付加な演算を必要としない。
図4は、好ましい実施形態による起こり得る予測方向を有するフレーム部分の線図的説明図を示す。とくに、これら起こり得る予測方向は、B領域における最も左側の最終的に可視となるマクロブロックに影響を与えることを示す。
破線矢印は、B領域内に適合する方向を示す。対応する予測は、ハードウェア、例えばハードウェアアクセラレータ50によって、ソフトウェア演算なしで最適に実行される。反対に、実線矢印は、ソフトウェア、例えばデコーダソフトウェア20によってA∩B領域を作り出すために、逆予測しなければならない方向である。得られた部分的なプレディクタ(予測因子)に基づいて、逆予測は、A∩B領域のコンテンツを与える。
要約すれば、本発明が提案するMPEG−4による復号化中に、フレームマクロブロックを、図3に示すように左→右、上→下の順で走査する。各マクロブロックラインに関して、マクロブロックは、ストライプに対する相対的なそれらの位置に基づいて、異なる処理を受ける。
次の表において、ソフトウェアプロセスの出力を、処理されるマクロブロックの関数として列挙する。
Figure 2008537427
上記の表において、‘基本’プロセスは、MPEG−4標準ソフトウェア復号化、例えばビットストリームパーシング(構文解析)、可変長復号化および動き復号化により構成する。
要約すれば、復号化装置および方法は、複数のブロックを伴う複数のビデオフレームを有する圧縮したビデオデータを復号化することに関して説明したが、この場合、ビデオフレームを、ストライプの幅がハードウェア予測ラインサイズを超えない、少なくとも2個のストライプとして第1所定方向に分割する。つぎに、係数予測を、少なくとも2個のストライプにおける1個のストライプに対して行い、少なくとも2個のストライプにおける他の少なくとも1個に対する、第2所定方向のプレディクタ(予測因子)を得るようにし、ただし、第2所定方向は第1所定方向に直交するものとする。さらに、偽のブロックを生成して、少なくとも2本のストライプにおける他の少なくとも1個のストライプに挿入し、第2所定方向の予測を初期化する。これによって、固定処理幅を有するハードウェアアクセラレータを、より柔軟に用いることができる。
MPEGビデオデータに関する本発明の上述の説明は、本発明を限定するものではないこと留意されたい。基本的に、本発明の発明の原理は、係数予測を必要とするビデオデータのいずれの復号化にも適用できる。とくに、本発明は、いわゆる Monet MPEG−4 Video Decoder IPを用いる、いずれのシステムにも適用されることができ、例えば移動体通信チップにおいて適用できる。さらに、ビデオフレームは、必ずしも垂直方向(縦)に指向する必要がないが、2個以上のストライプに分割することができる。水平方向(横)に分割することも、復号化のハードウェアおよび/またはソフトウェアが適正に適合するならば、実現可能な解決法である。生成した偽ブロックの挿入は、それらが、残りの予測を初期化するために適切な起点として用いられることができるならば、任意の適切な位置で行うことができる。
最後に重要なこととして、特許請求の範囲を含む明細書 で使用する用語「備える(comprising)」は、記載した特徴、手段、ステップまたはコンポーネントの存在を特定することを意図しているが、一つ以上の他の特徴、手段、ステップ、コンポーネントまたはそのグループの存在または付加を排除するものではないことに留意されたい。さらに、特許請求の範囲の要素における冠詞「a」または「an」は、このような要素の複数の存在を排除するものではない。本発明はハードウェアおよびソフトウェアの両方によって実現することができ、いくつかの「手段」は同じアイテムまたはハードウェアによって表すことができる。
好ましい実施形態による復号化動作を示すブロック図である。 従来の復号化動作を示すブロック図である。 好ましい実施形態によるフレーム分割を有するビデオフレームを示す線図的説明図である。 好ましい実施形態による起こり得る予測方向とともにフレーム部分を示す線図的説明図である。

Claims (15)

  1. 複数のブロックを伴う複数のビデオフレームを有する圧縮したビデオデータを復号するビデオデコーダ装置において、
    a)前記ビデオフレームを、第1所定方向に、ストライプの幅が前記デコーダ装置のハードウェア予測ラインサイズを超えない少なくとも2個のストライプに分割する分割手段と、
    b)前記少なくとも2個のストライプにおける1個のストライプの係数予測を実行し、前記少なくとも2個のストライプにおける他の少なくとも1個のストライプに対する、前記第1所定方向に直交する第2所定方向における予測因子を発生する予測手段と、
    c)前記少なくとも2個のストライプにおける前記他の少なくとも1個のストライプに挿入すべき偽ブロックを生成する生成手段と
    を有することを特徴とするビデオデコーダ装置。
  2. 前記第1方向は前記ビデオフレームの垂直方向に対応し、前記第2方向は前記ビデオフレームの水平方向に対応するものとした請求項1に記載のビデオデコーダ装置。
  3. 前記生成手段は、前記少なくとも2個のストライプにおける前記他の少なくとも1個のストライプ内に、第1カラムとして前記偽ブロックを挿入する構成とした請求項2に記載のビデオデコーダ装置。
  4. 前記分割手段は、前記少なくとも2個のストライプ各々のためのマイクロプログラムを有する対応のデータセットを発生する構成とし、前記対応のデータセットおよび前記マイクロプログラムを前記予測手段が使用して、係数予測を行う構成とした請求項1〜3のいずれか一項に記載のビデオデコーダ装置。
  5. 前記予測手段はハードウェアアクセラレータを有し、前記分割手段はデコーダソフトウェアによって実現した請求項1〜4のいずれか一項に記載のビデオデコーダ装置。
  6. 前記生成手段は前記デコーダソフトウェアによって実現した請求項5に記載のビデオデコーダ装置。
  7. 前記予測手段は、前記少なくとも2個のストライプを逐次的に処理する構成とした請求項1〜6のいずれか一項に記載のビデオデコーダ装置。
  8. 前記予測手段は、部分的な予測を行う構成とした請求項7に記載のビデオデコーダ装置。
  9. 前記少なくとも2個のストライプは、前記生成した偽ブロックを挿入する所定オーバーラップ領域でオーバーラップさせるものとした請求項7または8に記載のビデオデコーダ装置。
  10. 前記予測手段は、離散コサイン変換の係数を予測する構成とした請求項1〜9のいずれか一項に記載のビデオデコーダ装置。
  11. 前記生成手段は、前記少なくとも2個のストライプにおける前記1個のストライプに対する前記予測手段から得られた予測因子に基づいて逆予測を実行することによって、前記偽ブロックを生成する構成とした請求項1〜10のいずれか一項に記載のビデオデコーダ装置。
  12. 前記デコーダ装置を、MPEG−4デコーダとした請求項1〜11のいずれか一項に記載のビデオデコーダ装置。
  13. 複数のブロックを伴う複数のビデオフレームを有する圧縮したビデオデータを復号する復号化方法において、
    a)前記ビデオフレームを、第1所定方向に、ストライプの幅が前記デコーダ装置のハードウェア予測ラインサイズを越えない少なくとも2個のストライプに分割するステップと、
    b)前記少なくとも2個のストライプにおける1個のストライプに対して係数予測を行うステップであって、前記少なくとも2個のストライプにおける他の少なくとも1個のストライプに対する、前記第1所定方向に直交する第2所定方向の予測因子を発生する該係数予測ステップと、
    c)前記第2所定方向の予測を初期化するため、前記少なくとも2個のストライプにおける前記他の少なくとも1個のストライプに挿入すべき偽ブロック生成するステップと
    を有することを特徴とする復号化方法。
  14. コンピュータデバイスで実行するときに、請求項13に記載のステップa)及びステップc)を行うよう構成したことを特徴とする符号化手段を備えたことを特徴とするコンピュータプログラム製品。
  15. 請求項14に記載のコンピュータプログラム製品を格納したコンピュータ読み込み可能媒体。
JP2008507239A 2005-04-22 2006-04-14 効率的なビデオ復号化アクセラレータ Withdrawn JP2008537427A (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
EP05300310 2005-04-22
PCT/IB2006/051175 WO2006111915A1 (en) 2005-04-22 2006-04-14 Efficient video decoding accelerator

Publications (1)

Publication Number Publication Date
JP2008537427A true JP2008537427A (ja) 2008-09-11

Family

ID=36730308

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008507239A Withdrawn JP2008537427A (ja) 2005-04-22 2006-04-14 効率的なビデオ復号化アクセラレータ

Country Status (5)

Country Link
US (1) US20080285648A1 (ja)
EP (1) EP1875738A1 (ja)
JP (1) JP2008537427A (ja)
CN (1) CN101185335B (ja)
WO (1) WO2006111915A1 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2016517568A (ja) * 2013-03-15 2016-06-16 株式会社ソニー・インタラクティブエンタテインメント ハードウェアデコーダアクセラレータのためのセキュリティ強度の向上

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8121189B2 (en) 2007-09-20 2012-02-21 Microsoft Corporation Video decoding using created reference pictures
US8934539B2 (en) * 2007-12-03 2015-01-13 Nvidia Corporation Vector processor acceleration for media quantization
US8687875B2 (en) * 2007-12-03 2014-04-01 Nvidia Corporation Comparator based acceleration for media quantization
US8704834B2 (en) * 2007-12-03 2014-04-22 Nvidia Corporation Synchronization of video input data streams and video output data streams
US9848209B2 (en) 2008-04-02 2017-12-19 Microsoft Technology Licensing, Llc Adaptive error detection for MPEG-2 error concealment
US9788018B2 (en) 2008-06-30 2017-10-10 Microsoft Technology Licensing, Llc Error concealment techniques in video decoding
US9924184B2 (en) 2008-06-30 2018-03-20 Microsoft Technology Licensing, Llc Error detection, protection and recovery for video decoding
US9131241B2 (en) 2008-11-25 2015-09-08 Microsoft Technology Licensing, Llc Adjusting hardware acceleration for video playback based on error detection
US8340510B2 (en) 2009-07-17 2012-12-25 Microsoft Corporation Implementing channel start and file seek for decoder
WO2017195945A1 (ko) * 2016-05-10 2017-11-16 삼성전자 주식회사 영상을 부호화/복호화 하는 방법 및 그 장치
CN109217980B (zh) 2017-07-03 2020-11-06 腾讯科技(深圳)有限公司 一种编解码能力配置方法、设备和计算机存储介质

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5212742A (en) * 1991-05-24 1993-05-18 Apple Computer, Inc. Method and apparatus for encoding/decoding image data
EP0779744A3 (en) * 1995-12-06 1997-08-20 Thomson Multimedia Sa Method and device for coding digital video signals
US5767797A (en) 1996-06-18 1998-06-16 Kabushiki Kaisha Toshiba High definition video decoding using multiple partition decoders
KR100537123B1 (ko) * 1996-12-26 2006-02-28 소니 가부시끼 가이샤 화상 신호 부호화 장치, 화상 신호 부호화 방법, 화상 신호 복호 장치, 화상 신호 복호 방법 및 기록매체
WO1998044745A1 (en) * 1997-03-31 1998-10-08 Sharp Kabushiki Kaisha Apparatus and method for simultaneous video decompression
US8284844B2 (en) * 2002-04-01 2012-10-09 Broadcom Corporation Video decoding system supporting multiple standards
US6931061B2 (en) * 2002-11-13 2005-08-16 Sony Corporation Method of real time MPEG-4 texture decoding for a multiprocessor environment
FR2851111B1 (fr) * 2003-02-10 2005-07-22 Nextream France Dispositif de codage d'un flux de donnees video
TWI231714B (en) 2003-07-30 2005-04-21 Mediatek Inc Method for performing predictive image decoding with memory access
TWI228918B (en) 2003-09-19 2005-03-01 Mediatek Inc Video predictive decoding method and apparatus

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2016517568A (ja) * 2013-03-15 2016-06-16 株式会社ソニー・インタラクティブエンタテインメント ハードウェアデコーダアクセラレータのためのセキュリティ強度の向上

Also Published As

Publication number Publication date
CN101185335B (zh) 2010-06-23
WO2006111915A1 (en) 2006-10-26
EP1875738A1 (en) 2008-01-09
CN101185335A (zh) 2008-05-21
US20080285648A1 (en) 2008-11-20

Similar Documents

Publication Publication Date Title
US20230011071A1 (en) Hybrid backward-compatible signal encoding and decoding
JP2008537427A (ja) 効率的なビデオ復号化アクセラレータ
Srinivasan et al. Windows Media Video 9: overview and applications
CN102017615B (zh) 视频单元内的边界伪影校正
RU2409005C2 (ru) Способ масштабируемого кодирования и декодирования видеосигнала
US6222883B1 (en) Video encoding motion estimation employing partitioned and reassembled search window
JP4755093B2 (ja) 画像符号化方法および画像符号化装置
TWI510097B (zh) 視頻編碼方法和系統
US6771704B1 (en) Obscuring video signals for conditional access
US20030095603A1 (en) Reduced-complexity video decoding using larger pixel-grid motion compensation
JP2010501141A (ja) デジタル映像の可変解像度エンコードおよびデコード技術
US20160127728A1 (en) Video compression apparatus, video playback apparatus and video delivery system
KR20020051929A (ko) 비디오 데이터 스트림 변환 방법
US20070140351A1 (en) Interpolation unit for performing half pixel motion estimation and method thereof
KR20060093743A (ko) 비디오 트랜스 코딩 방법 및 장치와 이를 이용한 pvr
JP2006512838A (ja) ダイナミック・グラフィック・コンテンツ・ビューの符号化
JP2002515705A (ja) ビデオデコーダのコストを低減させる方法および装置
US7860327B2 (en) Systems and methods for enhanced coding gain
US7388620B2 (en) Method and system for pan-scan using motion vectors presentation
JP4043406B2 (ja) 画像復号方法と装置、およびそれらを利用可能なテレビジョン受信装置
KR20060016947A (ko) Mpeg 비디오 부호화 시스템 및 부호화 방법
Bhojani et al. Introduction to video compression
Akramullah et al. Video Coding Standards
Challapali et al. Video compression for digital television applications
Makris et al. Digital Video Coding Principles from H. 261 to H. 265/HEVC

Legal Events

Date Code Title Description
A761 Written withdrawal of application

Free format text: JAPANESE INTERMEDIATE CODE: A761

Effective date: 20090831