JP5324200B2 - 圧縮されたビデオデータストリームの切換え方法 - Google Patents

圧縮されたビデオデータストリームの切換え方法 Download PDF

Info

Publication number
JP5324200B2
JP5324200B2 JP2008312556A JP2008312556A JP5324200B2 JP 5324200 B2 JP5324200 B2 JP 5324200B2 JP 2008312556 A JP2008312556 A JP 2008312556A JP 2008312556 A JP2008312556 A JP 2008312556A JP 5324200 B2 JP5324200 B2 JP 5324200B2
Authority
JP
Japan
Prior art keywords
picture
macroblock
pictures
type
prediction
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2008312556A
Other languages
English (en)
Other versions
JP2009147930A (ja
JP2009147930A5 (ja
Inventor
トロ ドミニク
オリヴィエ ヤニック
イロン フランク
オルハン アニータ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Thomson Licensing SAS
Original Assignee
Thomson Licensing SAS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Thomson Licensing SAS filed Critical Thomson Licensing SAS
Publication of JP2009147930A publication Critical patent/JP2009147930A/ja
Publication of JP2009147930A5 publication Critical patent/JP2009147930A5/ja
Application granted granted Critical
Publication of JP5324200B2 publication Critical patent/JP5324200B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/44Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs
    • H04N21/44016Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs involving splicing one content stream with another content stream, e.g. for substituting a video clip
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/105Selection of the reference unit for prediction within a chosen coding or prediction mode, e.g. adaptive choice of position and number of pixels used for prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/129Scanning of coding units, e.g. zig-zag scan of transform coefficients or flexible macroblock ordering [FMO]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/157Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
    • H04N19/159Prediction type, e.g. intra-frame, inter-frame or bidirectional frame prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/174Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a slice, e.g. a line of blocks or a group of blocks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/234Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs
    • H04N21/23424Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs involving splicing one content stream with another content stream, e.g. for inserting or substituting an advertisement

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Business, Economics & Management (AREA)
  • Marketing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Description

本発明は、特に、イントラ、予測及び双方向タイプの符号化を利用した圧縮されたビデオデータストリームの切換え方法に関する。
本発明は、たとえば、英語表現“Motion Picture Expert Group, Advance Video
Coding”の頭字語であるMpeg4-avc規格に従って符号化されたビデオ系列又はプログラムセグメントの切換えに関する。
Mpeg4-avc規格に係る符号化は、異なるタイプのピクチャ符号化を要求する。イントラ符号化(ピクチャI)は、前又は後のピクチャを参照しない。予測型のインター符号化(ピクチャP)は、前の参照画像を要求する。双方向型のインター符号化(ピクチャB)は、前の参照画像及び/又は後続する参照画像を要求する。
Mpeg規格に係るピクチャは、GOP又はグループ オブ ピクチャでグループ化される。GOPの最初のピクチャは、イントラタイプのピクチャであり、後続する最初のタイプのBピクチャは、同じGOPのピクチャを要求し、それは閉じたGOPであり、又は、同じGOPからのピクチャ又は前のGOPのピクチャを要求し、それは開いたGOPである。
今日、フィルム又はビデオ系列は、必要とされるメモリ容量を低減するために圧縮された形式で記憶される。したがって、系列のスイッチングは、ベースバンドで行なわれないがMpeg符号化されたデータストリームから直接に行なわれる。
たとえば圧縮された形式で記憶されたデジタルデータからの2つの連続するビデオのブロードキャストを考え、第一の圧縮されたデータビデオストリームは、旧ストリームと呼ばれる第一のピクチャ系列に対応し、この旧ストリームは、スイッチングポイントト呼ばれるポイントから、新ストリームと呼ばれ、第二のピクチャ系列に対応する第二の圧縮されたタイプのビデオデータストリームで置き換えられる。問題は、スイッチングポイントに到達するデータストリームが開いたGOPで開始するときに生じる。確かに、この第二のストリームの最初のGOPの圧縮されたピクチャのデコーディングは、開いたGOPに対処する場合、前のGOPのピクチャの使用を必要とする。別の系列のデータストリームに対応する前のGOP、この開いたGOPに対応するデコードされたピクチャは、誤りを示すであろう。これらの誤りは、一般に非常に目に見えるものであり、第二の系列のこれら最初のタイプのBピクチャのデコーディングのため、符号化のために使用されるピクチャとは異なる参照画像の使用によるものである。効果的に、ピクチャから構成されるピクチャブロック又は双方向モードで符号化される開いたGOPピクチャは、同じピクチャ系列について前のGOPのタイプP又はIの参照画像からインター符号化されたピクチャブロックである。インター符号化されるブロック、残差情報又は予測誤差からなるブロックのデコーディングは、スイッチングポイントの後の第一の双方向タイプのピクチャについて、インター符号化された残差ブロックを計算するために使用されたものとは異なるブロックを利用する。復号化レベルで考慮される参照画像は、符号化レベルで考慮されるものとは異なる。
間違ったピクチャブロックの可視化からなる非常に厄介なブロックの効果は、第二の系列の最初のピクチャで現れる。
この問題に対するソリューションが存在し、文献ISO/IEC 13818-1annex K MPEG2規格のパート1に記載されている。このソリューションは、規格ではスプライシングポイントと呼ばれる可能性のあるスイッチングポイントに関する情報のシステムレイヤにおける統合を含んでおり、トランスポートストリームは、有益な特徴を有し、たとえば閉じたGOPを使用することで、上述した誤りなしにピクチャのデコーディングを可能にする。次いで、スイッチングは、これらのポイントの1つでのみ行なうことができる。勿論、この情報は、ピクチャの符号化からデータストリームに組み込まれる必要があり、データの新たな伸張及び圧縮を実現することなしに、その後に組み込むことがもはやできない。
GOPの開始にある認可されたスイッチングポイントは、このGOPが閉じたとき、双方向モードで符号化されるこのGOPにおける最初のピクチャの符号化に制約を加える。これらのピクチャは、参照画像としてもはや前の画像ではなく後続の画像のみを使用し、したがって、単一の方向のモードに強制される。したがって、この互換性のあるストリーム切換えのMpeg2符号化は、圧縮レートを低減し、フィルム又はビデオ系列の符号化のために通常は使用されない。今日、スイッチングの要件について閉じたGOPを強制する製品が市場で殆どなく、コーダレベルでレートを規制するために誘発される制約について扱いにくいことが分かる。他方で、データストリームにおけるどの辺りで閉じたGOPが使用される必要があるかを事前に決定し、すなわち、ブレイクが存在することとなる系列におけるポイントを予め決定し、系列の将来の利用を知るものとする。さもなければ、閉じたGOPを排他的に使用することが必要となる。
EP 0982948 A (THOMSON MULTIMEDIA SA [FR]) US 2003/206596 A1 (CARVER DAVID [US] ET AL) US 6275618 B1 (KODAMA TASUMASA [JP]) JP 2007 116604 A (NIPPON ELECTRIC CO)
したがって、このソリューションは、様々な問題点を有する。ビデオデータの圧縮レートにおける低減。このストリームのスイッチングの互換性を有さないデータストリームをデコード及びリコードする必要、及びデータの記憶、画質等にリンクされる全ての問題。
1つの公知のソリューションは、中間的な交換(commutation)ピクチャをイントラモードで符号化されたピクチャと置き換えることで、該中間的な交換ピクチャを記録することからなる。このソリューションは、問題となるピクチャのデータストリームの記録を必要とする。別の公知のソリューションは、たとえばブラックピクチャのイントラ符号化によるといった、中間的な交換ピクチャを予め定義されたピクチャと置き換えることで、該中間的な交換ピクチャを符号化することである。この方法の主要な問題点は、スイッチングの面倒な視覚的な生成(yield)にある。
本発明は、上述された問題点を克服することを狙いとする。
本発明は、第一のデータストリームの与えられたスイッチングポイントにおいて、第二のビデオ系列に対応する第二のデータストリームにより後続される第一のビデオ系列に対応する第一のデータストリームの送信のための圧縮されたビデオデータストリームのスイッチング方法に関する。それぞれの系列は、GOP(グループオブピクチャ)構造に従って符号化され、それぞれのGOPは、イントラ符号化されるイントラタイプのピクチャ、インター符号化される予測タイプのピクチャ、及びインター符号化される双方向タイプのピクチャを含んでおり、第二のデータストリームは、双方向タイプのピクチャ、ピクチャの符号化順序を考慮したときに、スイッチングポイントに続く第二の系列の第一のGOPのイントラピクチャに続くピクチャを、交換ピクチャと呼ばれる双方向ピクチャで置き換えることで、その送信の前に変更される。この交換ピクチャでは、ピクチャブロックは、ゼロの残余、及びピクチャにおけるブロックの位置に従い順方向又は逆方向であるゼロの動きベクトルを有する。特定の実現によれば、あるブロックの位置について、帰属される動きベクトルは、参照画像に関して属する交換ピクチャの時間的な位置にも依存する。特定の実現によれば、ピクチャブロックは、マクロブロック又はマクロブロックの小分割である。
実現の特定の手段によれば、順方向又は逆方向のベクトルは、マクロブロック又は小分割に帰属される参照画像に関するインデックスにより定義される。
特定の実現によれば、逆方向の予測における交換ピクチャのブロック数は、考慮されるピクチャの時間的な位置が後続する参照画像に近くなるとき、あるピクチャから別のピクチャに増加する。
特定の実現によれば、ピクチャブロックは、参照画像に関する予測に関して重み付けされ、重み付けレートは、参照画像に関して交換ピクチャの時間的な位置に関連される。
特定の実現によれば、重み付けレートは、マクロブロックのスライス当たり予め決定され、同じ重み付けレートが選択されるマクロブロックの位置に従ってピクチャがスライスに分割される。
特定の実現によれば、本方法は、スライスを定義するためにFMOツール(Flexible Macroblock Ordering)を利用する。
特定の実現によれば、順方向又は逆方向予測のブロックの位置は、以下のステップに従って、あるピクチャについて定義される。ピクチャブロックのそれぞれについて、0と1の間のランダム数の帰属。それぞれの交換ピクチャに対する閾値の帰属。この閾値は、考慮されるピクチャが後続する参照画像に向かって時間的に移動するときに増加する。あるピクチャについて、該ピクチャに帰属される閾値を上回る番号のブロックの選択。
特定の実現によれば、TVタイプのスキャンに従い、タイプBの現在のピクチャのNb個の最初のマクロブロックは、逆方向の動きベクトルを使用するものであり、Nbは以下により定義される。
b=NMB*α*b
MB=ピクチャ当たりのマクロブロックの数
α=1/M,MはPピクチャの周期。
bは、0<b<MであるI又はP予測ピクチャのインターバルにおける現在のBタイプピクチャの位置のインデックス1,2,3,...,である。
本方法は、最初のタイプBの遷移ピクチャを、前もって定義されるパターンに対応するタイプBの圧縮されたピクチャで置き換えることからなる。これらのパターンは、予測/圧縮ツール、逆方向の動きベクトル、順方向の動きベクトル及び重みからなる多かれ少なかれ複雑なセットを要求する。ひとたびピクチャが作製されると、事前にエンコードされたBタイプのピクチャを、最初の遷移のBタイプピクチャ、すなわち符号化順序を考慮したとき、第二の系列の最初のIピクチャの後に位置されるピクチャに置き換える。
本発明の主要な利点は、スイッチング動作又は幾つかのスイッチング動作の間に現れる可能性がある誤りを最小にしつつ、ビデオ系列の別の系列へのスイッチング、又はビデオ系列の別の系列への挿入を可能にすることである。本発明により、互換性のない、GOPオープンなストリームのスイッチングのMpeg符号化データストリーム、従って最適なやり方で圧縮されたビデオ系列を利用することができる。
B交換ピクチャを、予測モード、予測ベクトル及び予め定義された重みが設けられたBピクチャで置き換えることで、スイッチは、正しく、すなわちスイッチングアーチファクトなしに、おそらく基本的な特別の作用に類似した生成により動作することができる。また、系列の遷移は、新たなデータストリームの開始で開いたGOPにより生成される最も厄介なピクチャの誤りを削除することで平滑化される。
たとえばサーバレベルでデータストリームにおけるピクチャの置き換えは、所与のフォーマットについて、同じ予め定義されたピクチャから行なわれる。実現コストは、(Mpeg規格に従う)トランスポートストリームの構造が処理により変更されない事実のために低く、複雑なデパケット化(depacketisation)及びリパケット化(repacketisation)の動作が回避される。
本発明の他の特別の特徴及び利点は、限定するものではない例を提供することを狙いとする以下の記載で明らかに示され、添付図面に照らして明らかにされる。
図1は、ビデオ送信の間の、系列1と呼ばれるビデオ系列の系列2と呼ばれるビデオ系列へのスイッチングの原理を例示する。
使用されるビデオ系列は、Mpeg規格に従って符号化される系列である。ピクチャの符号化順序又は符号化される順序は、ピクチャがコーダの出力で送信される順序及び/又はコーダの入力でピクチャがデコード及び記憶される順序であり、双方向の符号化の可能性のため、これらデコードされたピクチャの表示順序とは異なる。
2つの系列1及び2はタイプI,B及びPピクチャから構成されるものとし、その符号化順序は、以下である。
系列1:B1 P1** B1 B1 B1 I1 B1* B1* B1* P1
系列2:B2 P2** B2 B2 B2 I2 B2* B2* B2* P2
イントラタイプのピクチャ(I1,I2)は、新たなGOPの境界を定義する。
イントラタイプのピクチャに続く3つの双方向タイプのピクチャは、アスタリスクでマークされたピクチャであり、イントラタイプのピクチャと呼ぶことができ、このイントラピクチャに先行するタイプPピクチャは、2つのアスタリスクでマークされたピクチャであり、したがって前のGOPに属する。この参照の選択は、マクロブロックのレベルで行なわれる。全体のピクチャの符号化は、2つのリファレンスであるイントラタイプのピクチャ及びタイプPピクチャを同時に求める。
GOPレベルでのスイッチングは、系列1からGOPの境界までで構成され、次いで系列2から構成される新たに送信される系列を与える。
スイッチされる系列:B1 P1** B1 B1 B1 I2 B2* B2* B2* P2
イントラタイプのピクチャに後続する3つの双方向タイプのB2*ピクチャは、デコーディングの間、イントラタイプのI2ピクチャ及び予測タイプのP1**ピクチャを参照する。したがって、3つのピクチャは、それらの参照画像のうちの1つを失っているので(P1**により置き換えられるP2**)、正しくデコードすることができない。
ここで、表示順序、すなわちディスプレイのためのリオーダリングの後の2つの符号化されたピクチャ系列を考える。
系列1:B1 P1** B1* B1* B1* I1 B1 B1 B1
系列2:B2 P2** B2* B2* B2* I2 B2 B2 B2
スイッチされる系列:B1 P1** B2* B2* B2* I2 B2 B2 B2
3つの双方向タイプのB2ピクチャのデコーディングは、コーディングの間に使用されるものとは異なる参照画像を利用する。この参照画像における違いは、B2ピクチャ*における視覚的な誤りの源である。
本発明に係る符号化方法は、1以上の参照画像に関して予測の残余の誤差の符号化に対応するB2ピクチャを、これらのタイプBピクチャのブロックに含まれる誤った予測情報がデコーディングの間に使用される参照画像とは独立であるようなやり方で、予め決定されたコンフィギュレーションを有するピクチャで置き換えることからなる。
図1について、ビットストリームは、表示順序並びに符号化/復号化順序に従って表現される。
a)では、可視化順序及び表示順序に従って第一の系列のストリームが表されており、次いで、符号化順序に従って、矢印は、Bピクチャの参照の観点での従属を示す。(b)では、第二の系列のピクチャが表されており、(c)では、第一の系列の一部及び第二の系列の一部から構成される新たなビットストリームが表されており、(d)では、(c)におけるのと同じ例示であり、本方法が適用されてスイッチングアーチファクトの回避を可能にするピクチャであるBと呼ばれるピクチャが表されている。
第一の方法は、ピクチャタイプの重み付け予測に基づいた、ピクチャベースと呼ばれる、系列のレベルでのプログレッシブタイプのスイッチングから構成される。第二の方法は、ピクチャのマクロブロックのレベルの特別の効果に基づいた、ブロックベースと呼ばれる、ピクチャのレベルでのプログレッシブなタイプのスイッチングから構成される。
ピクチャベースのプログレッシブなタイプのスイッチは、Mpeg4−avc規格の環境で、暗黙的又は明示的な重み付けを利用する。
その後、様々に言及される「ヘッダ」及びヘッダフィールドは、Mpeg4−avc規格を言及し、文献ISO/MEC14496−10で定義される。
暗黙的な重み付けツールは、たとえば、クロスフェージングを実行するために使用される。この例では全体で3である、B遷移ピクチャを介して2つの系列間でクロスフェージングを実現するため、ソリューションは、以下のステップに従ってBピクチャのそれぞれを符号化することから構成される。
Bピクチャのヘッダにおいて、このピクチャがいわゆる暗黙の重み付けを使用することを示すステップ。この情報は、スライスヘッダにおけるピクチャパラメータセット(PPS)フィールドで正確に発見され、スライスの全てのマクロブロックに関連する。したがって、クロスフェージングに専用とされるPPSを挿入することが必要である。
それぞれ順方向又は逆方向の動きベクトルがゼロのベクトルに対応する双方向モードで、16×16画素に等価なルミナンスサイズのそれぞれのマクロブロック(MB)を符号化するステップ。
係るデコーディングがクロスフェージングを実行するためにサーチされる予測に対応するように、予測の残余を符号化せず、すなわちこれらゼロ値の残余を考慮する。
Cピクチャは、I2ピクチャを示すが、P1ピクチャも示す。I2ピクチャが古典的なイントラピクチャではないが、IDRピクチャに先行する参照画像が維持されていないこと、すなわちP1ピクチャが参照画像のリストから削除されていることを意味するIDRタイプのイントラピクチャであるとき、I2ピクチャにおけるI(DR)2ピクチャの変換は、たとえば、デコーダがそのバッファから参照画像を空にしないようにヘッダを変更することで実行される。
そのように行なうことで、そのように符号化されたBピクチャのそれぞれは、表示順序に従い時間フレーム(P1,I2)で考慮される、Bciピクチャの位置に依存する、図1dに示されるP1及びI2である参照画像の混合に従って、系列1から系列2へのプログレッシブな遷移を形成する。
M−1のB遷移ピクチャに基づいて、前の参照画像Pprevと後の参照画像Inextとの間で、表示順序に従って、インデックス付けされたBピクチャのMBマクロブロックについて、重み付けが以下のやり方で実行される。
Figure 0005324200
ここで、MはPピクチャの周期であり、α=1/Mであり、bは、0<b<MのようなI又はP予測ピクチャのインターバルにおける現在のBタイプピクチャの位置インデックス1,2,3,...,である。
カップル(α,b)は、暗黙的な重みの原理に対応し、Pprev(xfor,yfor)は、現在のマクロブロックのxfor及びyfor成分の順方向の動きベクトルにより示される、前の参照画像の表示順序におけるマクロブロックに対応する。Inext(xback,yback)は、現在のマクロブロックのxback及びyback成分の逆方向の動きベクトルにより示される、後の参照画像の表示順序におけるマクロブロックに対応する。
例として、M=4の場合、インデックスb=3のBピクチャ、Inextに先行するBピクチャに属するマクロブロックの予測は以下のやり方で動作する。
Figure 0005324200
したがって、上位の重み付けは、クロスフェージングを実行するのを可能にするピクチャInextに適用される。
たとえば、明示的な重み付けツールは、フェージングを実行するために利用される。
ピクチャのヘッダでは、重み付けされた予測フィールドは、参照画像のそれぞれに関連される重み付けファクタの値で規定される。
この例では、新たな系列に向けてブラックフェージング、次いでリバースフェージングにより遷移を動作するため、明示的な重み付けが使用される。この方法は、所定の数のBピクチャを必要とし、このコンフィギュレーションは、Bピクチャの使用のみでなく、Mpeg4−avc規格でB記憶(Bstored)と呼ばれるタイプBの参照画像の使用の間に発見され、これらのピクチャは、参照画像としての役割を果たす。ここでのアイデアは、Bピクチャの第一の半分、クラシックなBタイプのピクチャを形成すること、ブラックへの遷移を実行することであり、第二の半分は、第二の系列のIピクチャのコンテンツに対するプログレッシブな遷移を形成する。
本方法は、以下に通りである。
遷移ピクチャの第一の半分はタイプB又はタイプPピクチャとして符号化され、この場合、MBマクロブロックがゼロベクトルをもち且つゼロの残余からなる順方向の予測にあり、明示的な重み付けは、以下のようにαに等しい。
Figure 0005324200
ここで、MはPピクチャの周期であり、α=2/Mであり、bは0<b<MのようなI又はP予測ピクチャの時間フレームにおける現在のBタイプのピクチャの位置インデックス(1,2,3,...)である。
遷移ピクチャの第二の半分はタイプBのピクチャとして符号化され、この場合、MBマクロブロックはゼロベクトルをもち且つゼロの残余からなる逆方向の予測にあり、明示的な重み付けは、以下のようなαに等しい。
Figure 0005324200
変形例は、ブラックにおいてB記憶における中央のピクチャを符号化することからなり、残りのBピクチャは、したがって暗黙的な重み付けによりBで符号化され、最初の部分のピクチャは、過去の参照画像及びB記憶ピクチャを参照し、他のBピクチャは、B記憶ピクチャ及び新たな系列の参照画像に依存する。
前のソリューションは、ピクチャに基づいた遷移を可能にする。確かに、B遷移ピクチャの全てのマクロブロックは同様なやり方で符号化される。以下に記載されるブロックベースのスイッチングは、ベクトル、特に、ゼロ値からなる、ベクトルが示されるマクロブロックのそれぞれの参照画像のインデックスを利用することで、オリジナル及びプログレッシブな空間−時間遷移を実行するのを可能にする。
図2は、係る遷移の例を与える。これら特別の効果の例は、勿論、包括的なものではない。
図2aは、分散されたマクロブロックによる遷移に対応し、図2bは、図の中央から外へのプログレッシブな遷移に対応し、図2cは、ピクチャの上からのプログレッシブなリニアな遷移に対応し、図2dは、ピクチャの左からの列における遷移に対応する。マクロブロックに帰属される番号は、ピクチャの出現の順番に対応する。移動の方向は、勿論、逆にすることができる。
このタイプの遷移は、時間的に連続して、逆方向の動きベクトルを介して、将来の参照画像、すなわちIピクチャに向かうマクロブロックを示すことで実行され、マクロブロックは、なお、前の系列のPピクチャを示す。
ここで、双方向の交換ピクチャは、ピクチャにおけるブロックの位置の関数である1以上の参照画像に関する予測に関連するゼロの動きベクトル、残余のゼロ値及び重み付けレートをピクチャブロックに帰属することで予め定義された順方向の予測及び逆方向の予測モードを有する。
図2cのラスタスキャンに関連する実現例は、以下に記載される。
MはPピクチャの周期であり、α=1/Mであり、bは0<b<MであるI又はP予測ピクチャのインターバルにおける現在のBタイプピクチャの位置のインデックス1,2,3,...,である。
将来の参照画像を示すbインデックスのBピクチャのマクロブロックのNbの数は、Nb=NMB*α*bに等しく、NMBはピクチャ当たりのマクロブロックの数である。
より詳細には、これは、ゼロ振幅の逆方向の動きベクトルにより、将来の参照画像を示す、マクロブロックによるピクチャのクラシックな符号化順序すなわちTVスキャンの順序に従う、BピクチャのNbの最初のマクロブロックであり、ピクチャの残りのマクロブロックは、過去の参照画像を示し、これは、ゼロベクトルに基づいた順方向の動きベクトルである。
別の例は、図2aの分散されたマクロブロックによる遷移からなる。これは、たとえば、関与する全てのピクチャの時間的に共に位置されるマクロブロックについて同じ数のレートで、第一のやり方で0と1の間に含まれるランダムな数をピクチャのフォーマットを構成するマクロブロックのそれぞれに帰属させることで得られる、ランダムに分散されたリパーティションを含み、次いで、そのランダムな数がα*bの値よりも上回るランクBピクチャのマクロブロックが将来の参照画像を示すことになり、他のマクロブロックが、過去のインデックスピクチャをなお参照することを考慮する。実際に、これらの閾値は、後続の参照画像において示すマクロブロックのパーセンテージを定義するために設計され、M=4の場合、1,2,3にそれぞれ等しいbについて1/4;1/2次いで3/4である。
図3は、3つのBタイプのピクチャのケースにおける左から右へのスイッチングの例を表し、最初のBピクチャは、将来のI参照画像を示すマクロブロックの1/4を含み、Pピクチャを示すマクロブロックの3/4を含み、第二のBピクチャのマクロブロックは、1/2で展開されており、第三のBピクチャは、Pピクチャを示すマクロブロックの1/4を含み、Iピクチャを示すマクロブロックの3/4を含む。
Bピクチャ、更には所定のコンフィギュレーションについてPピクチャのマクロブロックの符号化モードに関して、説明を明確にして本方法を理解する観点で順方向及び逆方向の双方向モードが使用される。幾つかのバリエーションは、Bピクチャの、Mpeg4−avcに特化した「ダイレクトモード」として知られるモード、順方向、逆方向の予測又は双方向の予測に対処するのを可能にするモードにわたり符号化コストの観点で更に効率的であることがわかる。さらに、これらダイレクトモードは、所定の条件に従って、マクロブロックの符号化コストが殆どゼロであるスキップモードと呼ばれるモード、このアプリケーションでは、残余の符号化コストがゼロに自発的に設定されるので使用される可能性が非常に高いモードと呼ばれるモードを達成する。
説明は、順方向ベクトル又は逆方向ベクトル又は双方向モードにおける両方のベクトルが帰属されるマクロブロックのエンティティに戻される動きの場の解像度から行なわれる。この選択は、シンプルな説明が行われるのを可能にする。実際、マクロブロックは、8×16,16×8,8×8,4×8,8×4及び4×4画素の大きさにされるルミナンスの小分割にスライスすることができる。これら小分割のなかで、これらの大きさ8×16,16×8、8×8は、異なるインデックスの参照画像を示すベクトルを有する。マクロブロックに適用される本方法は、これらマクロブロックの8×8の小分割にまで容易に拡張される。したがって、環状又は螺旋タイプの作用にとって非常に価値のある、空間的な作用の生成において薄い空間解像度を取得することができる。
重み付けされた予測フェージングとクロスフェージングに基づいた方法と、空間的な作用に基づいた方法の組み合わせは、このスイッチング技術の変形例を表す。参照画像に関する中間のBピクチャの重み付けについて、ピクチャにおけるマクロブロックの数だけでなく、輝度をも考慮する必要がある。したがって、空間的な作用、又はより正確にはBピクチャについて記載される空間的な生成に、フェージングに関連されないブロックの暗黙的な重み付け、双方向予測又は明示的な重み付け、順方向予測(リストI0)又は逆方向予測(リストI1)を結合することが可能である。
暗黙的又は明示的な重み付けは、マクロブロックのスライスのレベルでのみ決定される。H264標準に含まれるツール、Flexible Macroblock Orderingを意味するFMOを利用することができ、問題となるブロックに関してマクロブロックのスライスが構築されるのを可能にし、したがって、これらの制約を低減し、したがって可能性のある効果を高めることができる。図2cのラスタスキャンのケースにおいて、FMOツールを使用することなしにピクチャを4つのスライスに容易に分解することができる場合、同じことが左から右への列のスキャンで進まない。このプログレッシブスキャンにおけるピクチャに関する提案は、特に、図1に例示される時間的な参照(P1,I2)で考慮されるフレームの時間的なインデックスを考慮して、インタレーススキャンにおけるピクチャにも適用可能である。
本発明の分野の残りで、本出願すなわちピクチャの置き換えを、より少ない目に見えない視覚的なスイッチング効果を可能にするように、すなわち3以上の新たなタイプのBピクチャに限定せずに、たとえば第一のストリームの前のタイプのI又はPピクチャから第二のストリームの第一のタイプのIピクチャにまで更に重要なシーケンシャルな期間にまで拡張することが可能である。
また、本出願は、ストリーム内で前もって検出されている厳しいシーンの遷移の瞬間で既存のストリームにおいて特別な効果をなすために実現することができる。
本出願は、デジタル画像の送信に関する全てに関連し、より詳細には、圧縮されたビデオピクチャのビットストリームで直接に動作するもの関連する。これらの応用は、ビデオサーバ向けに意図される。
2つのビットストリーム間のストリームスイッチングを示す図である。 ピクチャレベルでの遷移の例を示す図である。 ある系列のレベルでの垂直方向の左から右への遷移の例を示す図である。
符号の説明
I:イントラ符号化ピクチャ
B:双方向型のインター符号化ピクチャ
P:予測型のインター符号化ピクチャ

Claims (6)

  1. 第一のデータストリームの与えられたスイッチングポイントで、第二のビデオ系列に対応する第二のデータストリームにより後続される第一のビデオ系列に対応する第一のデータストリームの送信のための、圧縮されたビデオデータストリームのスイッチング方法であって、
    前記第一及び第二のビデオ系列は、グループオブピクチャ(GOP)構造に従って符号化され、それぞれのGOPは、イントラモードで符号化されるイントラタイプのピクチャ、インターモードで符号化される予測タイプのピクチャ及びインターモードで符号化される双方向タイプのピクチャを含んでおり、
    当該方法は、
    その送信の前に、ピクチャの符号化順序に関して、前記スイッチングポイントに続く第一のGOPのイントラピクチャに続くピクチャ及び双方向タイプのピクチャを、交換ピクチャと呼ばれる双方向ピクチャで置き換えることで、前記第二のデータストリームを変更するステップを含み、
    前記交換ピクチャのピクチャブロックは、ゼロの残余と、前記交換ピクチャにおけるブロックの位置及びインター符号化のために使用される参照画像に関する前記交換ピクチャの時間的な位置に従って順方向又は逆方向のベクトルであるゼロの動きベクトルとを有し、
    前記順方向又は逆方向の動きベクトルは、前記マクロブロック又は前記サブパーティションに帰属される参照画像に関するインデックスにより定義され、前記第一及び第二のデータストリームはMPEGデータストリームであり、前記ピクチャブロックは、マクロブロック又はマクロブロックのサブパーティションであり、
    前記ピクチャブロックは、参照画像に関する予測に関して重み付けされ、重み付けの割合は、前記参照画像に関して交換ピクチャの時間的な位置に関連される、
    ことを特徴とする方法。
  2. 逆方向の予測の交換ピクチャにおけるブロック数は、問題とされるピクチャの時間的な位置が後続する参照画像に近くなるときに、あるピクチャから別のピクチャへと増加する、
    ことを特徴とする請求項1記載の方法。
  3. 重み付けの割合は、マクロブロックのスライスごとに予め決定され、 同じ重み付けの割合が選択されるマクロブロックの位置に従ってピクチャがスライスに分割される、
    ことを特徴とする請求項記載の方法。
  4. 前記スライスを定義するためにFMO(Flexible Macroblock
    Ordering)ツールが利用される、
    ことを特徴とする請求項記載の方法。
  5. 順方向又は逆方向予測のためのブロックの位置は、あるピクチャについて、
    ピクチャブロックのそれぞれについて、0と1の間のランダム数を帰属させるステップと、
    それぞれの交換ピクチャに閾値を帰属させるステップと、前記閾値は、問題とするピクチャが後続する参照画像に向かって時間的に移動するときに増加し、
    あるピクチャについて、前記ピクチャに帰属される閾値を上回る数のブロックを選択するステップと、
    に従って定義される、
    ことを特徴とする請求項1記載の方法。
  6. TVタイプのスキャンに従って、現在の双方向予測タイプのピクチャのNb個の最初のマクロブロックは、逆方向の動きベクトルを使用し、NbはNb=NMB*α*bにより定義され、NMBはピクチャ当たりのマクロブロックの数であり、αは1/Mであり、Mは予測タイプのピクチャの周期であり、bは、0<b<Mであるイントラ又は予測タイプのピクチャのインターバルにおける現在の双方向予測タイプのピクチャの位置のインデックス1,2,3,...,である、
    ことを特徴とする請求項1記載の方法。
JP2008312556A 2007-12-14 2008-12-08 圧縮されたビデオデータストリームの切換え方法 Expired - Fee Related JP5324200B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
FR0708750 2007-12-14
FR0708750 2007-12-14

Publications (3)

Publication Number Publication Date
JP2009147930A JP2009147930A (ja) 2009-07-02
JP2009147930A5 JP2009147930A5 (ja) 2012-01-05
JP5324200B2 true JP5324200B2 (ja) 2013-10-23

Family

ID=39400494

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008312556A Expired - Fee Related JP5324200B2 (ja) 2007-12-14 2008-12-08 圧縮されたビデオデータストリームの切換え方法

Country Status (5)

Country Link
US (1) US8743958B2 (ja)
EP (1) EP2076044A1 (ja)
JP (1) JP5324200B2 (ja)
CN (1) CN101459851B (ja)
TW (1) TWI441521B (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9860458B2 (en) * 2013-06-19 2018-01-02 Electronics And Telecommunications Research Institute Method, apparatus, and system for switching transport stream
JP6149562B2 (ja) * 2013-07-12 2017-06-21 富士通株式会社 ストリーム配信システム、ストリーム作成装置、ストリーム配信方法およびストリーム作成方法
WO2021125703A1 (ko) * 2019-12-20 2021-06-24 엘지전자 주식회사 영상/비디오 코딩 방법 및 장치

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH1066085A (ja) * 1996-08-14 1998-03-06 Sony Corp 画像処理装置および画像処理方法、並びに記録媒体
JPH114448A (ja) * 1997-06-13 1999-01-06 Sony Corp 画像信号送出装置及び画像信号送出方法
FR2782437B1 (fr) * 1998-08-14 2000-10-13 Thomson Multimedia Sa Procede de commutation de flux mpeg
FR2784845B1 (fr) * 1998-10-14 2001-02-23 France Telecom Procede de basculement de la ou des composantes video d'un premier programme audiovisuel sur la ou les composantes video d'un second programme audiovisuel numerique
JP3932546B2 (ja) * 2001-01-24 2007-06-20 日本電気株式会社 Mpegビデオ編集装置及びmpegビデオ編集方法
US20030206596A1 (en) * 2002-05-03 2003-11-06 David Carver Multimedia content assembly
US20090225832A1 (en) * 2004-07-29 2009-09-10 Thomson Licensing Error concealment technique for inter-coded sequences
EP2292749A3 (en) 2004-07-30 2011-12-21 Novozymes A/S Alanine 2, 3 aminomutases
JP4492518B2 (ja) * 2005-10-24 2010-06-30 日本電気株式会社 エンコーダ装置、そのストリーム切り替え制御方法、およびコーデック装置

Also Published As

Publication number Publication date
CN101459851A (zh) 2009-06-17
TWI441521B (zh) 2014-06-11
US20090154561A1 (en) 2009-06-18
US8743958B2 (en) 2014-06-03
TW200926829A (en) 2009-06-16
JP2009147930A (ja) 2009-07-02
EP2076044A1 (en) 2009-07-01
CN101459851B (zh) 2013-02-27

Similar Documents

Publication Publication Date Title
US7324595B2 (en) Method and/or apparatus for reducing the complexity of non-reference frame encoding using selective reconstruction
US8767819B2 (en) Moving picture encoding apparatus
JP4416796B2 (ja) 画像符号化装置、画像復号装置、画像符号化プログラム、及び画像復号プログラム
KR100972403B1 (ko) 비디오 인코딩시의 랜덤 억세스 포인트
JP4695129B2 (ja) 画像符号化におけるランダム・アクセス及び段階的画像更新に対する方法
US8917775B2 (en) Method and apparatus for encoding and decoding multi-view video data
KR101076506B1 (ko) 복수의 픽쳐를 갖는 영상 시퀀스의 엔코딩 및 디코딩 방법
JP5222958B2 (ja) 動画像符号化装置、動画像符号化方法、動画像復号化装置および動画像復号化方法
MXPA06002079A (es) Codificacion bi-direccional predictiva avanzada de video entrelazado.
JP2010022058A (ja) デジタルビデオコンテンツのマクロブロックレベルにおける適応フレーム/フィールド符号化
RU2538317C2 (ru) Способ предсказания движения и способ кодирования видеоинформации
JP2010110007A (ja) 画像符号化方法および画像復号方法、画像符号化装置および画像復号装置、並びに画像符号化ビットストリーム及び記録媒体
Suzuki et al. Inter frame coding with template matching averaging
JP3864098B2 (ja) 動画像符号化方法、動画像復号方法、及びこれらの方法の実行プログラムとこれらの実行プログラムを記録した記録媒体
JP2000175187A (ja) ビデオ圧縮のための領域ベ―スのリフレッシュ方法
KR100260475B1 (ko) 화상 데이타 부호화 방법 및 장치, 화상 데이타 복호화 방법 및 장치 및 화상 기록 매체
JP2005510984A5 (ja)
JP2004128749A (ja) 動画像符号化方法及び復号化方法
JP2004527981A (ja) 予測タイプの選択によるビデオデータブロックのイントラ符号化
JP5324200B2 (ja) 圧縮されたビデオデータストリームの切換え方法
WO2012089773A1 (en) Video encoding and decoding with improved error resilience
KR101431546B1 (ko) 다시점 동영상의 부호화 및 복호화 방법과 그 장치
CN107071404B (zh) 对具有多个图像的图像序列进行编码的方法及设备
JP2005303487A (ja) 動画像復号装置及び動画像復号プログラム
JP5946980B1 (ja) 画像復号化方法

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20111114

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20111114

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20120808

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120911

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20121204

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20130702

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20130718

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees