JP2011199899A - エンコーダ及びデコーダにおけるバッファのサイズ再設定 - Google Patents

エンコーダ及びデコーダにおけるバッファのサイズ再設定 Download PDF

Info

Publication number
JP2011199899A
JP2011199899A JP2011126245A JP2011126245A JP2011199899A JP 2011199899 A JP2011199899 A JP 2011199899A JP 2011126245 A JP2011126245 A JP 2011126245A JP 2011126245 A JP2011126245 A JP 2011126245A JP 2011199899 A JP2011199899 A JP 2011199899A
Authority
JP
Japan
Prior art keywords
picture
buffer
size
decoder
buffering
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2011126245A
Other languages
English (en)
Inventor
Miska Hannuksela
ハンヌクセラ,ミスカ
Emre Aksu
アクス,エンレ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nokia Oyj
Original Assignee
Nokia Oyj
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nokia Oyj filed Critical Nokia Oyj
Publication of JP2011199899A publication Critical patent/JP2011199899A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • H04N19/15Data rate or code amount at the encoder output by monitoring actual compressed data size at the memory before deciding storage at the transmission buffer
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/44Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs
    • H04N21/44004Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs involving video buffer management, e.g. video decoder buffer or video display buffer
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/234Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs
    • H04N21/23406Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs involving management of server-side video buffer

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Communication Control (AREA)

Abstract

【課題】符号化システムのバッファリング効率を改善する。
【解決手段】本発明は、符号化ピクチャをバッファリングする方法に関する。前記方法は、符号化ピクチャをエンコーダにて形成する符号化ステップを含む。前記方法は、前記符号化ピクチャを伝送ユニットとしてデコーダに伝送する伝送ステップと、デコーダに伝送された伝送ユニットをバッファにバッファリングするバッファリングステップと、復号化ピクチャを形成するため、前記符号化ピクチャを復号化する復号化ステップと、を更に含む。少なくとも2つの伝送ユニットの合計サイズが規定され、合計サイズに基づいて最大バッファサイズが規定されるように、バッファのサイズが規定される。
【選択図】図8

Description

本発明は、符号化ピクチャをバッファリングする方法であって、エンコーダにおいて符号化ピクチャを形成する符号化ステップと、前記符号化ピクチャをデコーダに伝送する伝送ステップと、復号化ピクチャを形成するため符号化ピクチャを復号化する復号化ステップと、復号化ピクチャを復号化順序に配置する再配置ステップとを含む方法に関する。本発明は、システム、伝送装置、受信装置、エンコーダ、デコーダ、電子装置、ソフトウェアプログラム及び記憶媒体にも関する。
発行されているビデオ符号化規格は、ITU‐T H.261、ITU‐T H.263、ISO/IEC MPEG‐1、ISO/IEC MPEG‐2及びISO/IEC MPEG‐4パート2を含む。本明細書では、これら規格を従来のビデオ符号化規格と称する。
ビデオ通信システム
ビデオ通信システムを対話型システム及び非対話型システムに分けることができる。対話型システムはテレビ会議及びテレビ電話を含む。このようなシステムの例として、ISDN、IP及びPSTNネットワークでそれぞれ動作するテレビ会議/電話システムを指定するITU‐T勧告H.320、H.323及びH.324が挙げられる。対話型システムは、(オーディオ‐ビデオ獲得から遠端オーディオ‐ビデオ表示までの)エンドツーエンド遅延を最小限に抑えてユーザ体験を改善する目的により特徴付けられている。
非対話型システムは、再生装置、デジタルTV及びストリーミングの大量メモリ内に格納されたビデオファイルまたはデジタル多用途ディスク(DVD)のような格納されたコンテンツの再生を含む。これら技術分野で最も重要な規格について下記に概説する。
今日のデジタルビデオ民生電子機器で支配的な規格は、ビデオ圧縮、オーディオ圧縮、ストレージ及びトランスポートの仕様を含むMPEG‐2である。符号化ビデオのストレージ及びトランスポートはエレメンタリストリームの概念に基づく。エレメンタリストリームは、単一のソース(例えば、ビデオ)からの符号化データと、ソース情報の同期化、識別及び特徴付けに必要とされる補助データとから成る。エレメンタリストリームは、パケット化エレメンタリストリーム(PES)を形成するように固定長または可変長パケットにパケット化される。各PESパケットは、ヘッダと、これに続くペイロードと呼ばれているストリームデータとから成る。様々なエレメンタリストリームからのPESパケットは、プログラムストリーム(PS)またはトランスポートストリーム(TS)を形成するように結合される。PSは、蓄積再生型のアプリケーションのような、無視できる伝送エラーを有するアプリケーションを対象としている。TSは、伝送エラーを許容するアプリケーションを対象としている。しかし、TSは、ネットワーク処理能力が一定であると保証されていると仮定する。
ITU‐T及びISO/IECのジョイントビデオチーム(JVT)において標準化活動が進行中である。JVTの作業は、H.26Lと呼ばれているITU‐Tの初期標準化プロジェクトに基づく。JVT標準化の目標は、ITU‐T勧告H.264及びISO/IEC国際標準14496‐10(MPEG‐4パート10)と同じ標準テキストを公開することにある。草案規格を本明細書でJVT符号化規格と称し、草案規格に準じるコーデックをJVTコーデックと称する。
コーデック仕様自体は、ビデオ符号化層(VCL)とネットワーク抽象化層(NAL)とを概念的に区別する。VCLは、コーデックの信号処理機能として、変換、量子化、動き検出/補償及びループフィルタなどを含む。これは今日のビデオコーデックの大部分、動き補償を含むピクチャ間予測を用いるマクロブロックベースのコーダ、並びに、残差信号の変換符号化の一般概念に従う。VCLの出力はスライスであり、すなわち、整数のマクロブロックのマクロブロックデータと、(スライスの第1マクロブロックの空間アドレス、初期の量子化パラメータなどを含む)スライスヘッダの情報とを含むビットストリングである。異なるマクロブロック割り当てがいわゆるフレキシブルマクロブロック順序付け構文を用いて指定されていなければ、スライスのマクロブロックは、走査順序に順序付けられている。ピクチャ間予測はスライス内にのみ用いられる。
NALは、パケットネットワーク上の伝送に適し、または、パケット指向の多重環境の使用に適するネットワーク抽象化層ユニット(NALU)内にVCLのスライス出力をカプセル化する。JVTのアネックスBは、このようなNALUをバイトストリーム指向のネットワーク上に伝送するカプセル化処理を規定する。
H.263の随意の参照ピクチャ選択モード及びMPEG‐4パート2のニュープレッド符号化ツールは、H.263において各ピクチャセグメント当たり例えば各スライス当たりの動き補償に対する参照フレームの選択を可能にする。更に、H.263の随意の拡張参照ピクチャ選択モード及びJVT符号化規格は、各マクロブロックに対する別々の参照フレームの選択を可能にする。
参照ピクチャ選択は、多くの種類の時間スケーラビリティ方式を可能にする。図1には、再帰的な時間スケーラビリティと本明細書で称する時間スケーラビリティ方式の一例を示す。この例示的な方式を3つの固定フレームレートで復号化することができる。図2には、一連のピクチャが、2つ以上の独立して符号化されたスレッドにインターリーブ形式に分割されるビデオ冗長符号化と称する方式を示す。これらの図面及びこれらに続くすべての図面の矢印は動き補償の方向を示し、フレームの下にある値は、フレームの相対的な獲得及び表示時間に対応する。
パラメータセットの概念
JVTコーデックの1つの極めて基本的な設計概念は、ヘッダ重複不要のような機構を形成するため自己充足型のパケットを生成することにある。これを達成する方法は、2つ以上のスライスに関する情報をメディアストリームから分離することである。この上層メタ情報を、スライスパケットを含むRTPパケットストリームから確実に非同期的に前もって送信する必要がある。この情報を、目的に適する帯域外のトランスポートチャネルを持たないアプリケーションに帯域内で送信することもできる。ハイレベルパラメータの組み合わせはパラメータセットと呼ばれている。パラメータセットは、ピクチャサイズ、表示ウィンドウ、用いられる随意の符号化モード、マクロブロック割り当てマップなどのような情報を含む。
スライスパケットストリームに同調してパラメータセット最新情報を伝送することを必要とせず、(ピクチャサイズのような)ピクチャパラメータを変更できるように、エンコーダ及びデコーダは2つ以上のパラメータセットのリストを維持することができる。各スライスヘッダは、用いられるパラメータセットを示す符号語を含む。
この機構により、パラメータセットの伝送をパケットストリームから分離し、パラメータセットを外部手段により、例えば、機能交換の副次的影響として、または(信頼できる、または信頼できない)制御プロトコルを介して伝送することができる。パラメータセットが全く伝送されず、アプリケーション設計仕様により固定されることさえも可能である。
伝送順序
従来のビデオ符号化規格では、Bピクチャを除いてピクチャの復号化順序は表示順序と同じである。表示順序において一方の参照ピクチャが時間的に先行し、他方の参照ピクチャが時間的に後に続いている2つの参照ピクチャから従来のBピクチャのブロックを双方向に時間予測することができる。復号化順序で最後の参照ピクチャのみ、表示順序でBピクチャの後に続くことができる(例外:H.263におけるインタレース符号化では、時間的に後に来る参照フレームの双方のフィールドピクチャが、復号化順序でBピクチャに先行することができる)。時間予測に対して従来のBピクチャを参照ピクチャとして用いることができない。従って、他のいかなるピクチャの復号化にも影響を及ぼすことなく従来のBピクチャを配列することができる。
JVT符号化規格は、初期の規格と比べて下記の新規な技術的特徴を含む。
− ピクチャの復号化順序は表示順序から分離されている。ピクチャ番号は復号化順序を示し、ピクチャオーダカウントは表示順序を示す。
− Bピクチャのブロックの参照ピクチャを、表示順序でBピクチャの前または後とすることができる。従って、Bピクチャは、双方向ピクチャというよりは双予測ピクチャを表している。
− 参照ピクチャとして用いられないピクチャには明白に印が付けられる。いかなる種類のピクチャ(イントラピクチャ、インターピクチャ、Bピクチャなど)も参照ピクチャまたは非参照ピクチャとすることができる。(従って、他のピクチャの時間予測に対してBピクチャを参照ピクチャとして用いることができる。)
− ピクチャは、異なる符号化タイプで符号化されているスライスを含むことができる。言い換えれば、符号化ピクチャは、例えばイントラ符号化スライス及びB符号化スライスから成ることができる。
復号化順序から表示順序を分離することは、圧縮効率及び誤り耐性の観点から有益である。
圧縮効率を改善する可能性を秘めている予測構造の一例を図3に示す。ボックスはピクチャを示し、ボックス内の大文字は符号化タイプを示し、ボックス内の数字はJVT符号化規格によるピクチャ番号を示し、矢印は予測依存性を示す。ピクチャB17がピクチャB18の参照ピクチャであることに留意すべきである。PBBPまたはPBBBP符号化ピクチャパターンを含む従来の符号化に比べてピクチャB18の参照ピクチャが時間的に近いので、圧縮効率は従来の符号化に比べて改善される可能性を秘めている。参照ピクチャの一部が双方向に予測されるので、圧縮効率は従来のPBP符号化ピクチャパターンに比べて改善される可能性を秘めている。
図4には、誤り耐性の改善に用いることができるイントラピクチャの後回し方式の一例を示す。通常、イントラピクチャは、例えば、シーンが切れた直後に、または、イントラピクチャリフレッシュ期間の終了に応答して符号化される。イントラピクチャの後回し方式では、イントラピクチャは、イントラピクチャを符号化する必要性が生じた直後に符号化されるのではなくむしろ、時間的に後に来るピクチャがイントラピクチャとして選択された直後に符号化される。符号化されたイントラピクチャと、イントラピクチャの従来の位置との間の各ピクチャは、時間的に後に来るピクチャから予測される。図4に示すように、イントラピクチャの後回し方式は、2つの独立したインターピクチャ予測チェーンを発生するのに対して、従来の符号化アルゴリズムは、1つのインターピクチャチェーンを発生する。2つのチェーンのアプローチが1つのチェーンの従来アプローチよりも消失エラーに耐えうることは直感的に明らかである。一方のチェーンがパケット損失を被る場合、他方のチェーンを依然として正確に受信することができる。従来の符号化では、パケット損失は、イントラピクチャ予測チェーンの残りの部分へエラー伝播を常に生じさせる。
2つの種類の順序付け及びタイミング情報は、通常、デジタルビデオすなわち符号化及び表示順序のデジタルビデオと関連している。下記で関連技術を詳しく検討する。
復号化タイムスタンプ(DTS)は、符号化データユニットを復号化することになっている、参照クロックに相対する時間を示す。DTSが符号化され伝送されれば、2つの目的に役立つ。すなわち、第1に、ピクチャの復号化順序が出力順序と異なれば、DTSは復号化順序を明白に示す。第2に、DTSは、受信レートが伝送レートに常に近いならば特定のプリデコーダのバッファリング動作を保証する。エンドツーエンドレイテンシが変化するネットワークでは、DTSの第2の用途は、ほとんど何の役割も果たさない。その代わり、受信データは、ポストデコーダのバッファに非圧縮ピクチャのための空間があれば、可能な限り高速に復号化される。
DTSの伝達は、使用される通信システム及びビデオ符号化規格に依存する。MPEG‐2システムでは、PESパケットのヘッダの一項目としてDTSを随意に伝送することができる。JVT符号化規格では、追加拡張情報(SEI)の一部としてDTSを随意に伝達することができ、DTSが随意の仮想参照デコーダの動作に用いられる。ISOベースメディアファイル形式では、DTSは、それ自体のボックスタイプであるDcoding Time to Sample Box(サンプルボックスに対する復号化時間)専用とされている。RTPに基づくストリーミングシステムのような多くのシステムでは、復号化順序が、伝送順序と同じであると推測され、正確な復号化時間が重要な役割を果たさないので、DTSは全く伝達されない。
H.263の随意のアネックスU及びアネックスW.6.12は、復号化順序で前にある参照ピクチャに対して1だけ増加されるようにピクチャ番号を指定する。JVT符号化規格では、フレーム番号の符号化要素はH.263のピクチャ番号と類似して指定される。JVT符号化規格は、瞬間デコーダリフレッシュ(IDR)ピクチャと呼ばれている特定タイプのイントラピクチャを指定する。後に続くいかなるピクチャも、復号化順序でIDRピクチャよりも先行するピクチャを参照することができない。IDRピクチャは、しばしば、シーンチェンジに応答して符号化される。JVT符号化規格では、図5a及び5bに示すようなIDRピクチャの損失の場合に誤り耐性を改善するため、フレーム番号はIDRピクチャで零に再設定される。しかし、ここで留意すべきは、シーンチェンジを検出するのにJVT符号化規格のシーン情報SEIメッセージも使用できることである。
参照ピクチャの復号化順序を回復するのにH.263ピクチャ番号を用いることができる。同様に、あるIDRピクチャ(これを含む)と、復号化順序で次のIDRピクチャ(これを含まない)との間のフレームの復号化順序を回復するのにJVTフレーム番号を用いることができる。しかし、相補的な参照フィールド対(異なるパリティを有するフィールドとして符号化された連続ピクチャ)が同一のフレーム番号を共有するので、フレーム番号から復号化順序を再構築することができない。
非参照ピクチャのH.263ピクチャ番号またはJVTフレーム番号は、復号化順序で前にある参照ピクチャのピクチャまたはフレーム番号に1を加えたものに等しくあるように指定される。幾つかの非参照ピクチャが復号化順序に連続していれば、これら非参照ピクチャは同一のピクチャまたはフレーム番号を共有する。非参照ピクチャのピクチャまたはフレーム番号は、復号化順序で次に来る参照ピクチャのピクチャまたはフレーム番号とも同一である。H.263の時間参照(TR)符号化要素またはJVT符号化規格のピクチャオーダカウント(POC)概念を用いて、連続する非参照ピクチャの復号化順序を回復することができる。
プレゼンテーションタイムスタンプ(PTS)は、ピクチャを表示することになっている、参照クロックに相対する時間を示す。プレゼンテーションタイムスタンプは、表示タイムスタンプ、出力タイムスタンプ及び作成タイムスタンプとも呼ばれている。
PTSの伝達は、使用される通信システム及びビデオ符号化規格に依存する。MPEG‐2システムでは、PESパケットのヘッダの一項目としてPTSを随意に伝送することができる。JVT符号化規格では、追加拡張情報(SEI)の一部としてPTSを随意に伝達することができ、PTSが仮想参照デコーダの動作に用いられる。ISOベースメディアファイル形式では、PTSは、それ自体のボックスタイプであるComposition Time to Sample Box(サンプルボックスに対する作成時間)専用とされ、プレゼンテーションタイムスタンプは対応の復号化タイムスタンプに対して符号化される。RTPでは、RTPパケットヘッダのRTPタイムスタンプはPTSに対応する。
従来のビデオ符号化規格は、多くの点でPTSに類似する時間参照(TR)符号化要素を特徴付ける。MPEG‐2ビデオのような従来の符号化規格の幾つかには、TRは、グループオブピクチャ(GOP)の初めで零に再設定される。JVT符号化規格では、ビデオ符号化層において時間の概念がない。ピクチャオーダカウント(POC)は各フレーム及びフィールドに対して指定され、例えば、Bスライスの直接時間予測でTRに類似して用いられる。POCはIDRピクチャで零に再設定される。
マルチメディアストリームの伝送
マルチメディアストリーミングシステムは、ストリーミングサーバと、ネットワークを介してサーバにアクセスする多数のプレーヤとから成る。ネットワークは典型的にパケット指向であり、サービスの品質を保証するのにほとんど何の手段も具えない。プレーヤは、予め格納されているマルチメディアコンテンツか生のマルチメディアコンテンツのどちらかをサーバからフェッチし、コンテンツがダウンロードされる間、リアルタイムでコンテンツを再生する。通信の種類を、ポイントツーポイントまたはマルチキャストとすることができる。ポイントツーポイントストリーミングでは、サーバは各プレーヤに対して別々の接続を行う。マルチキャストストリーミングでは、サーバは単一のデータストリームを多数のプレーヤに伝送し、必要である場合のみ、ネットワーク要素はストリームを複製する。
プレーヤがサーバへの接続を確立し、メディアストリームを要求したら、サーバは所望のストリームを伝送し始める。プレーヤはストリームを直ちに再生し始めるのではなくむしろ、典型的に受信データを数秒間バッファリングする。本明細書では、このバッファリングを初期バッファリングと称する。伝送遅延が時折増大するか、またはネットワーク処理能力が落ちた場合、プレーヤが、バッファに格納されたデータを復号化し再生できるので、初期バッファリングは、一時停止なしの再生を維持するのに役立つ。
無制限の伝送遅延を回避するため、ストリーミングシステムにおいて信頼できるトランスポートプロトコルを好むことはまれである。その代わり、システムは、一方で、安定した伝送遅延を継承するが他方ではデータ破損または損失をも被るUDPのような信頼できないトランスポートプロトコルを好む。
リアルタイム通信を制御するため、UDPの上部にRTP及びRTCPプロトコルを用いることができる。RTPは、伝送パケットの損失を検出し、受信端でパケットの正しい順序を再構築し、サンプリングタイムスタンプを各パケットと関連付ける手段を具える。RTCPは、正確に受信されたパケットの部分がどのくらい大きいかに関する情報を伝達し、従って、フロー制御の目的にRTCPを用いることができる。
伝送エラー
2つの主な種類の伝送エラーすなわちビットエラー及びパケットエラーがある。典型的にビットエラーは、移動通信における無線アクセスネットワーク接続のような回線交換チャネルと関連し、これらビットエラーは、無線干渉のような物理チャネルの不完全性により引き起こされる。このような不完全性は、伝送データにビット反転、ビット挿入及びビット削除を生じさせるおそれがある。パケットエラーは典型的にパケット交換ネットワークの要素により引き起こされる。例えば、パケットルータが過密するようになる可能性がある。すなわち、パケットルータは、多すぎるパケットを入力として獲得するおそれがあり、それらを同じ速度で出力することができない。この状況では、バッファはオーバフローし、幾つかのパケットが失われる。伝送と異なる順序でのパケット複製及びパケット配信も可能であるが、それらは、典型的にパケット損失よりも一般的ではないと考えられている。用いられるトランスポートプロトコルスタックの実施によってもパケットエラーを引き起こす可能性がある。例えば、幾つかのプロトコルは、送信機で計算されソース符号化データと共にカプセル化されるチェックサムを用いる。データ内にビット反転エラーがあれば、受信機は、同一のチェックサムになることができず、受信したパケットを廃棄しなければならない可能性がある。
GPRS、UMTS及びCDMA‐2000を含む第2世代(2G)及び第3世代(3G)移動ネットワークは、2つの基本的な種類の無線リンク接続、すなわち、確認接続及び非確認接続を行う。確認接続では、無線リンクフレームの完全性が送信先(移動局すなわちMS、または、基地局サブシステムすなわちBSSのどちらか)によりチェックされ、伝送エラーの場合、再伝送要求が無線リンクの他端に与えられる。リンク層再伝送のため、フレームに対する肯定応答が受信されるまで、発信元は無線リンクフレームをバッファに格納しなければならない。悪化した無線状態では、このバッファはオーバフローし、データ損失を引き起こすおそれがある。それにもかかわらず、ストリーミングサービスに確認無線リンクプロトコルモードを用いることは有益であることが示されている。非確認接続では、誤りのある無線リンクフレームが典型的に廃棄される。
パケット損失を補正または隠匿することができる。損失補正は、いかなる損失も持ち込まれたことがなかったかのように、失ったデータを完全に復元する機能を意味する。損失の隠匿は、再構築されたビデオシーケンス内に伝送損失が現われないように伝送損失の影響を隠匿する機能を意味する。
プレーヤがパケット損失を検出すれば、プレーヤはパケットの再伝送を要求することができる。初期バッファリングのため、再伝送されるパケットを、予定した再生時間より前に受信することができる。幾つかの市販のインターネットストリーミングシステムは、専用プロトコルを用いて再伝送要求を実施する。RTCPの一部として選択的な再伝送要求機構を標準化する作業がIETFにおいて始まっている。
これら再伝送要求プロトコルのすべてに対する共通の特徴は、ネットワークトラヒックが急激に増大するおそれがあるので、これら再伝送要求プロトコルが、多数のプレーヤに対しマルチキャストするのに適さないということである。結果として、マルチキャストストリーミング分野は非双方向性パケット損失制御に依存しなければならない。
ポイントツーポイントストリーミングシステムも、非双方向性エラー制御技術により利益を得ることができる。第1に、幾つかのシステムは、いかなる双方向性エラー制御機構も含まなくて良く、または、これらシステムは、システムを単純化するためプレーヤからのいかなるフィードバックも望まない。第2に、双方向性エラー制御の損失パケット及び他の形態の再伝送は、典型的に非双方向性エラー制御方法よりも大きい伝送データレート部分を取る。ストリーミングサーバは、双方向性エラー制御方法が、使用できるネットワーク処理能力の大部分を蓄えておかないようにしなければならない。実際には、サーバは、双方向性エラー制御動作の量を制限しなければならない場合がある。第3に、特定のデータサンプルに対してすべての双方向性エラー制御動作を、好ましくはデータサンプルが再生される前に行うべきなので、伝送遅延はサーバとプレーヤとの間の相互作用の数を制限することができる。
非双方向性パケット損失制御機構を、前方のエラー制御及び後処理による損失の隠匿に分類することができる。前方のエラー制御は、伝送損失がある場合であっても受信機が伝送データの少なくとも一部分を回復できる冗長性を送信機が伝送データに加える技術を意味する。後処理によるエラーの隠匿は全体として受信機指向である。これらの方法は、誤って受信されたデータの正しい表現を推定しようとする。
大部分のビデオ圧縮アルゴリズムは、時間的に予測されたインターまたはPピクチャを生成する。結果的には、1つのピクチャのデータ損失は、破損したものから時間的に予測され結果として生じたピクチャに、目に見える劣化を生じさせる。ビデオ通信システムは、表示される画像の損失を隠匿するか、または、破損したフレームから独立しているフレームを受信するまで、画面上で誤りのない最後のピクチャを凍結する。
従来のビデオ符号化規格では、復号化順序は出力順序と結合されている。言い換えれば、I及びPピクチャの復号化順序は出力順序と同じであり、Bピクチャの復号化順序は、出力順序でBピクチャの後にある参照ピクチャの復号化順序のすぐ後に続く。その結果として、既知の出力順序に基づいて復号化順序を回復することが可能である。出力順序は典型的に時間参照(TR)フィールドとRTPヘッダのようなシステム多重層との双方にエレメンタリビデオビットストリームで伝達される。従って、従来のビデオ符号化規格では、提示された問題は存在しない。
当該技術分野の専門家にとって明らかである1つの解決策は、(JVT符号化規格において行われるように)IDRピクチャで零に再設定することなく、H.263のピクチャ番号に類似するフレームカウンタを用いることである。しかし、この種の解決策が用いられるとき、幾つかの問題が生じるおそれがある。図5aには、連続番号付け方式が用いられている状況を示す。例えば、IDRピクチャI37が損失したら(IDRピクチャI37を受信/復号化できなかったら)、デコーダは後続のピクチャを復号化し続けるが、誤った参照ピクチャを用いる。このことは、破損したフレームから独立する次のフレームが正確に受信され復号化されるまで、後続のフレームへエラー伝播を生じさせる。図5bの例では、フレーム番号はIDRピクチャで零に再設定される。次に、IDRピクチャI0が損失した状況では、デコーダは、最後に正確に復号化されたピクチャP36の後にピクチャ番号付けで大きな隔たりがあることを報告する。デコーダは次に、エラーが生じたことを想定することができ、破損したフレームから独立する次のフレームが受信され復号化されるまでピクチャP36に対して表示を凍結することができる。
サブシーケンス
JVT符号化規格は、符号化ストリームの残りの部分のデコーダビリティに影響を及ぼすことなくインター予測ピクチャチェーンを全体として配列することができるように、非参照ピクチャの使用に比べて時間スケーラビリティを改良できるサブシーケンス概念をも含む。
サブシーケンスはサブシーケンス層内の一連の符号化ピクチャである。ピクチャは1つのサブシーケンス層内に、且つ、1つだけのサブシーケンス内に存在すべきである。サブシーケンスは、同一または上位のサブシーケンス層内の他のいかなるサブシーケンスにも依存すべきでない。層0内のサブシーケンスを、他のあらゆるサブシーケンスと、前の長期にわたる参照ピクチャとに無関係に復号化することができる。図6aには、層1にサブシーケンスを含むピクチャストリームの一例を表す。
サブシーケンス層はシーケンスに符号化ピクチャの一部を含む。サブシーケンス層は、負でない整数で番号付けられている。大きい層番号を有する層は、小さい層番号を有する層よりも高い層である。ある層がこの層よりも高い層のいずれにも依存せず、この層よりも低い層に依存できるように、層は相互依存性に基づいて階層的に順序付けられている。言い換えれば、層0を独立して復号化することができ、層0から層1のピクチャを予測することができ、層0及び1から層2のピクチャを予測することができる。主観的品質は復号化層の数と共に増大することが見込まれる。
サブシーケンス概念はJVT符号化規格に次の通りに含まれている。すなわち、符号化シーケンスがすべてのサブシーケンスを含まない場合があるシーケンスパラメータセット信号においてrequired_frame_num_update_behaviour_flagは1に等しい。required_frame_num_update_behaviour_flagの使用は、各参照フレームに対してフレーム番号を1だけ増大することに関する要件を免除する。その代わり、フレーム番号の隔たりは、復号化ピクチャバッファ内に明確に印を付けられる。「欠けている」フレーム番号がインター予測で言及されれば、ピクチャの損失が推測される。そうでなければ、「欠けている」フレーム番号に対応するフレームは、これらフレームが、スライディングウィンドウバッファリングモードを含む復号化ピクチャバッファに挿入された正常なフレームであるかのように処理される。従って、配列されたサブシーケンス内のすべてのピクチャには、「欠けている」フレーム番号が復号化ピクチャバッファ内で割り当てられるが、それらは決して他のサブシーケンスのインター予測に用いられない。
JVT符号化規格は、随意のサブシーケンス関連のSEIメッセージをも含む。サブシーケンス情報SEIメッセージは、復号化順序で次のスライスに関連する。サブシーケンス情報SEIメッセージは、サブシーケンス層と、スライスが属するサブシーケンスのサブシーケンス識別子(sub_seq_id)とを信号で伝える。
各IDRピクチャは識別子(idr_pic_id)を含む。2つのIDRピクチャが、いかなるピクチャも介在せずに復号化順序で連続していれば、idr_pic_idの値は最初のIDRピクチャから他のIDRピクチャに変更すべきである。復号化順序で最初のピクチャがIDRピクチャであるサブシーケンス内に現在のピクチャが存在していれば、sub_seq_idの値は、IDRピクチャのidr_pic_idの値と同じにすべきである。
いかなるデータもサブシーケンス層1以上に存在しない場合に限り、JVT‐D093の解決策は正確に機能する。伝送順序が復号化順序と異なり、符号化ピクチャがサブシーケンス層1に存在した場合、サブシーケンス層0のピクチャに対する復号化順序を、サブシーケンス識別子及びフレーム番号に基づいて推論することができない。出力順序が左から右に流れ、ボックスがピクチャを表し、ボックス内の大文字が符号化タイプを示し、ボックス内の数字はJVT符号化規格によるフレーム番号を示し、下線の文字が非参照ピクチャを示し、矢印が予測依存性を示す図6bに示す次の符号化方式を例えば検討する。ピクチャがI0、P1、P3、I0、P1、B2、B4、P5の順序に伝送される場合、B2が属する独立したGOPがどれかを推論することができない。
前の例において、ピクチャB2の正確な独立したGOPを出力タイムスタンプに基づいて推論することができると主張するかもしれない。しかし、復号化順序及び出力順序が切り離されているので、出力タイムスタンプ及びピクチャ番号に基づいてピクチャの復号化順序を回復することができない。出力順序が左から右に流れ、ボックスがピクチャを表し、ボックス内の大文字が符号化タイプを示し、ボックス内の数字はJVT符号化規格によるフレーム番号であり、矢印が予測依存性を示す次の例(図6c)を検討する。復号化順序が狂ってピクチャが伝送される場合、出力順序で1番目または2番目の独立したGOPのP3の後にピクチャP4を復号化すべきかを確実に検出することができない。
バッファリング
典型的にストリーミングクライアントは、比較的大量のデータを格納できる受信機バッファを有する。初めに、ストリーミングセッションが確立されると、クライアントはストリームを直ちに再生し始めるのではなくむしろ、典型的に受信データを数秒間バッファリングする。伝送遅延が時折増大するか、またはネットワーク処理能力が落ちた場合、クライアントが、バッファに格納されたデータを復号化し再生するので、このバッファリングは連続再生を維持するのに役立つ。そうでなければ、初期バッファリングなしに、クライアントは表示を凍結し、復号化を停止し、受信データを待たなければならない。また、バッファリングは任意のプロトコルレベルに自動的または選択的な再伝送を必要とする。ピクチャのどこか一部が損失した場合、損失したデータを再送信するのに再伝送機構を用いることができる。予定した復号化または再生時間前に再送信データが受信された場合、損失は完全に回復される。
復号化シーケンスの主観的品質の重要性に従って符号化ピクチャをランク付けすることができる。例えば、従来のBピクチャのような非参照ピクチャは主観的に最も重要でない。その理由は、それらの不在が他のいかなるピクチャの復号化にも影響を及ぼさないためである。データパーティションまたはスライス群に基づいても主観的ランク付けを行うことができる。主観的に最も重要である符号化スライス及びデータパーティションを、復号化順序が示すよりも前に送信することができるのに対して、主観的に最も重要でない符号化スライス及びデータパーティションを、本来の符号化順序が示すよりも後に送信することができる。その結果として、最も重要でないスライス及びデータパーティションに比べて、最も重要なスライス及びデータパーティションの再伝送部分のいずれかを、予定した復号化または再生時間の前に受信する可能性が高い。
プリデコーダバッファリング
プリデコーダバッファリングは、符号化データを復号化する前の符号化データのバッファリングを意味する。初期バッファリングは、ストリーミングセッションの初めのプリデコーダバッファリングを意味する。初期バッファリングは、下記に説明する2つの理由により従来通りに行われる。
従来のパケット切り替えマルチメディアシステムでは、例えば、IPに基づくテレビ会議システムでは、異なる種類のメディアは通常、別々のパケットで伝達される。更に、パケットは、一定の伝送遅延を保証できるのではなくむしろ遅延がパケットごとに変化する場合のあるベストエフォートネットワークの上部に典型的に伝達される。その結果として、同一のプレゼンテーション(再生)タイムスタンプを有するパケットを同時に受信することができず、2つのパケットの受信間隔が(時間の点から見て)表示間隔と同じでないおそれがある。従って、異なるメディアタイプ間で再生の同期化を維持するため、且つ、正確な再生レートを維持するため、マルチメディア端末は、典型的に受信データを短期間(例えば、1/2秒未満)バッファリングして遅延変動を取り除く。本明細書では、この種のバッファ要素を遅延ジッタバッファと称する。メディアデータの復号化前及び/または後にバッファリングを行うことができる。
遅延ジッタバッファリングはストリーミングシステムでも適用される。ストリーミングが非対話型アプリケーションであるため、必要とされる遅延ジッタバッファを対話型アプリケーションの場合よりもかなり大きくする場合がある。ストリーミングプレーヤがサーバへの接続を確立し、ダウンロードすべきマルチメディアストリームを要求したら、サーバは所望のストリームを伝送し始める。プレーヤがストリームを直ちに再生し始めるのではなくむしろ、典型的に受信データを特定の期間、代表的には数秒間バッファリングする。本明細書では、このバッファリングを初期バッファリングと称する。初期バッファリングは、対話型アプリケーションにおける遅延ジッタバッファリングにより行われる機能に類似して伝送遅延変動を取り除く機能を具える。その上、損失したプロトコルデータユニット(PDU)の再伝送をリンク層、トランスポート層及び/またはアプリケーション層の使用により可能にする。復号化され再生されるために予定した時刻に間に合うように再伝送PDUを受信することができるが、プレーヤは、バッファに格納されたデータを復号化し再生することができる。
ストリーミングクライアントにおける初期バッファリングは、対話型システムで達成することができない更なる別の利点を具える。すなわち、これにより、サーバから伝送されたメディアのデータレートを変更することができる。言い換えれば、受信機バッファがオーバフローまたはアンダーフローしない限り、メディアパケットを一時的に再生レートよりも速く、または遅く伝送することができる。データレートの変動は2つの原因から生じる。
第1には、ビデオのような幾つかのメディアタイプにおいて達成できる圧縮効率はソースデータのコンテンツに依存する。従って、安定した品質が望まれれば、結果として生じた圧縮ビットストリームのビットレートは変化する。典型的には、安定したオーディオビジュアル品質は、変化する品質よりも主観的に多く喜ばれる。それ故に、初期バッファリングにより、ビデオ会議システムのように初期バッファリングを用いないシステムに比べて多く喜ばれるオーディオビジュアル品質を達成することができる。
第2には、固定IPネットワーク内のパケット損失が集中的に生じるということが一般に知られている。集中的なエラーと、高いピークのビットレート及びパケットレートとを回避するため、適切に設計されたストリーミングサーバはパケットの伝送を慎重にスケジューリングする。パケットが受信端で再生されるレートでパケットを正確に送信できるのではなくむしろ、サーバは、安定した間隔を伝送パケット間で達成しようとすることができる。優勢なネットワーク状態に従ってサーバはパケット伝送のレートを調節することもできる。例えば、ネットワークが混雑するようになると、パケット伝送レートを減少させ、ネットワーク状態に余裕があれば、パケット伝送レートを増大させる。
仮想参照デコーダ(HRD)/ビデオバッファリングベリファイア(VBV)
多くのビデオ符号化規格は、規格の不可欠な部分としてHRD/VBV仕様を含む。HRD/VBV仕様は、入力(プリデコーダ)バッファを含む仮想デコーダモデルである。符号化データは典型的に一定のビットレートで入力バッファに流れる。出力タイムスタンプと同じにすることができる復号化タイムスタンプ時に符号化ピクチャは入力バッファから取り出される。入力バッファは、使用されるプロファイル及びレベルに依存する特定サイズを有する。HRD/VBVモデルは、処理及びメモリ要件の観点からインターオペラビリティポイントを指定するのに用いられる。符号化は、生成されたビットストリームが特定のプロファイル及びレベルのHRD/VBVパラメータ値に従ってHRD/VBV仕様に一致することを保証すべきである。特定のプロファイル及びレベルの支援を要求するデコーダは、HRD/VBVモデルに一致するビットストリームを復号化できなければならない。
HRDは、符号化データストリームを格納する符号化ピクチャバッファと、復号化参照ピクチャを格納し、復号化ピクチャを表示順序に再順序付けする復号化ピクチャバッファとを含む。復号化装置のデコーダが行うのに類似してHRDはデータをバッファ間で移動する。しかし、HRDは符号化ピクチャを完全に復号化するかまたは復号化ピクチャを出力する必要がないが、HRDは、符号化規格に与えられた制約の下でピクチャストリームの復号化を実行できることのみ検査する。HRDが動作中であるとき、HRDは符号化データストリームを受信し、それを符号化ピクチャバッファに格納する。更に、HRDは符号化ピクチャバッファから符号化ピクチャを取り出し、対応の仮想復号化ピクチャの少なくとも幾つかを復号化ピクチャバッファに格納する。HRDは、符号化データが符号化ピクチャバッファに流れる入力レートと、符号化ピクチャバッファからのピクチャの取り出しレートと、復号化ピクチャバッファからのピクチャの出力レートとを知っている。HRDは符号化または復号化ピクチャバッファのオーバフローについて検査し、復号化が現在の設定で可能でなければ指摘する。次に、HRDはバッファリング違反についてエンコーダに知らせる。バッファリング違反を回避するため、エンコーダは、例えば、参照フレームの数を減少させることにより符号化パラメータを変えることができる。その代わりに、または、それに加えて、エンコーダは、新たなパラメータを有するピクチャを符号化し始め、符号化ピクチャをHRDに送信し、HRDは、ピクチャの復号化及び必要な検査を再び実行する。更なる別の代わりとして、いかなるバッファリング違反も起こらないように、エンコーダは最後の符号化フレームを廃棄し、フレームを後で符号化することができる。
2種類のデコーダ適合性、すなわち、出力順序適合性(VCL適合性)及び出力時間適合性(VCL‐NAL適合性)はJVT符号化規格で指定されている。これらの種類の適合性はHRD仕様を用いて指定されている。出力順序適合性は、ピクチャの出力順序を正確に回復するデコーダの能力を意味する。HRD仕様は、ピクチャに新しいストレージスペースが必要とされるときに、出力順序で最も早い非圧縮ピクチャを出力する「バンピングデコーダ」モデルを含む。出力時間適合性は、HRDモデルが行うのと同じ速度でピクチャを出力するデコーダの能力を意味する。ピクチャの出力タイムスタンプを常に、「バンピングデコーダ」から取り出される時間以下にする必要がある。
インターリービング
フレームインターリービングは、オーディオストリーミングにおいて一般に使用される技術である。フレームインターリービング技術では、1つのRTPパケットは、復号化または出力順序で連続していないオーディオフレームを含む。オーディオパケットストリームにおいて1つのパケットが損失した場合、正確に受信されたパケットは、損失したオーディオパケットを(何らかの補間により)隠匿するのに用いることができる隣接したオーディオフレームを含む。多くのオーディオ符号化RTPペイロード及びMIMEタイプの仕様は、オーディオフレームに関して1つのパケットに最大量のインターリービングを信号送信する可能性を含む。
幾つかの従来技術の符号化/復号化方法では、必要とされるバッファのサイズが伝送ユニット数として知らされる。
デコーダのプリデコーディングバッファの最大サイズをバイトとしてデコーダに知らせることができる。バイトに基づく方式が用いられ、デコーダに対して再順序付け処理が規定されていなければ、バッファリングモデルは明確に規定されなければならない。その理由は、エンコーダ及びデコーダが異なるバッファリング方式を用いる場合があるためである。バッファに対してバイト単位で特定サイズが規定され、デコーダは、バッファが一杯になるまで、また、最も古いデータがバッファから取り出され復号化された後だけに伝送ユニットがバッファに格納されるバッファリング方式を用いるとする。このようなバッファリングは、復号化が開始される前に必要以上に長く続くことがある。
プリデコーディングバッファの最大サイズを知らせる別の実現性は伝送ユニットを用いることであり、この点、バッファのサイズは、バッファリングされる最大量の伝送ユニットとして知らされる。しかし、伝送ユニットの最大サイズは規定されておらず、伝送ユニットのサイズが変化するおそれがある。最大サイズが規定され、特定のデータユニットに対してサイズが小さすぎれば、データユニットを2つの以上の伝送ユニットに分割しなければならず、これによって符号化及び伝送オーバヘッドを増大させ、すなわち、圧縮効率を減少させ、且つ/または、システムの複雑性を増大させる。伝送ユニットの最大サイズは充分に大きくなければならず、バッファの合計サイズを不必要に大きくするおそれがある。
本発明では、少なくとも2つの伝送ユニットの合計サイズが規定され、この合計サイズに基づいて最大バッファサイズが規定されるように、バッファサイズが規定される。合計サイズに加えて、ネットワーク伝送ジッタを考慮することが必要である場合がある。
本発明の別の態様によれば、合計サイズの計算に用いられる伝送ユニットの数は、伝送ユニットの数に関して必要なバッファサイズの分数である。
本発明の更なる別の態様によれば、合計サイズの計算に用いられる伝送ユニットの数は、伝送ユニットの数に関して必要なバッファサイズの分数であり、分数は1/Nの形態を持っている。ここで、Nは整数である。
本発明の更に別の態様によれば、合計サイズの計算に用いられる伝送ユニットの数は、伝送ユニットの数に関して必要なバッファサイズと同じである。
本発明の実施形態では、合計サイズの計算に用いられる伝送ユニットの数は、伝送ユニットのバッファリング順序として表現される。バッファリング順序は、伝送ユニットが復号化のためにデコーダにバッファリングされる順序、すなわち、プリデコーダバッファにおけるバッファリング順序に関連する。
本発明は、デコーダに受信バッファのサイズを規定することができる。
以下では、独立したGOPは、あるIDRピクチャ(これを含む)から復号化順序で次のIDRピクチャ(これを含まない)までのピクチャより成る。
本発明では、所要バッファの最大量を信号送信するパラメータを提案する。このようなパラメータの幾つかの単位すなわち、継続期間、バイト、符号化ピクチャ、フレーム、VCL NALユニット、あらゆるタイプのNALユニット、並びに、RTPパケットまたはペイロードが検討されている。不規則の量を継続期間で指定することは、伝送ビットレートと、指定された継続期間との間に依存関係を生じさせて、バイトでバッファリングの所要量を断定する。伝送ビットレートが一般に知られていないので、継続期間に基づくアプローチは用いられない。不規則の量をバイト数で指定することは、信号送信限度を超えないように、伝送されるストリームを慎重に検査する送信機を必要とする。このアプローチは、すべてのサーバから多くの処理能力を要求する。このアプローチは、サーバに対してバッファリングベリファイアを指定することも要求する。不規則の量を符号化ピクチャまたはフレームで指定することは、単位を粗くしすぎる。その理由は、任意スライス順序をサポートしないデコーダのための単一スライスインターリービング方法が、復号化順序の回復のためにバッファリングの最小レイテンシを達成するサブピクチャ分解を必要とするためである。異なるタイプの集約パケットが優勢なネットワーク状態に依存して存在する場合があるため、不規則の量をRTPパケットの数で指定することは、適切であると考えられなかった。従って、あるRTPパケットは、変化する量のデータを含む場合がある。異なるSEIメッセージを優勢なネットワーク状態に依存して伝送する場合がある。例えば、比較的悪い状態では、シーン情報SEIメッセージのような、誤り耐性を対象としているSEIメッセージを伝送するのが有益である。従って、あらゆるタイプのNALユニットの数で指定された不規則の量すなわち、順番が狂って伝送されるSEI及びパラメータセットNALユニットの量は優勢なネットワーク状態に依存する。従って、「あらゆるタイプのNALユニット」も良好な単位と考えられなかった。故に、不規則の量をVCL NALユニットの数で指定することは最善の選択肢と考えられた。VCL NALユニットは、符号化スライス、符号化データパーティションまたはシーケンス終了マーカであるとJVT符号化規格に規定されている。
提案したパラメータはnum‐reorder‐VCL‐NAL‐unitsである。このパラメータは、NALユニット配信順序においてパケットストリーム内のいかなるVCL NALユニットにも先行し、RTPシーケンス番号順において、または、VCL NALユニットを含む集約パケットの作成順においてVCL NALユニットの後に続くVCL NALユニットの最大量を指定する。
MIMEタイプの通知における随意のパラメータとして、または随意のSDPフィールドとして、提案したパラメータを伝達することができる。提案したパラメータは、セッション設定手続きの段階及びプロトコルに応じてデコーダ機能またはストリーム特性またはその双方を示すことができる。
パラメータnum‐reorder‐VCL‐NAL‐unitsに従って構成されたバッファのバッファサイズをバイトで正確に指定することができない。バッファリングメモリ要件が正確に知られる受信機の設計を可能にするため、復号化時間適合性の指定を提案する。復号化時間適合性は仮想バッファリングモデルを用いて指定される。この仮想バッファリングモデルは一定の入力ビットレートをとるのではなくむしろ、伝送されたパケットストリームがモデルに整合することを保証するため、ストリーミングサーバがモデルを含むことを要求する。指定された仮想バッファモデルは場合によって集中的なパケットレートを防止し、結果として生じたビットストリームを一定のビットレートで仮想デコーダに入力できるようにNALユニットを伝送順序から復号化順序へ再順序付けする。
下記の記載では、エンコーダ‐デコーダに基づくシステムを用いることにより本発明を説明するが、ビデオ信号が格納されるシステムでも本発明を実装できること明らかである。格納されたビデオ信号を、符号化前に格納された符号化されていない信号、または、符号化後に格納された符号化信号、または、符号化及び復号化処理後に格納された復号化信号とすることができる。例えば、エンコーダは復号化順序でビットストリームを生成する。ファイルシステムは、例えば復号化順序にカプセル化されファイルとして格納されたオーディオ及び/またはビデオビットストリームを受信する。更に、エンコーダ及びファイルシステムは、NALユニット及びピクチャの主観的な重要性を知らせ、特にサブシーケンスに関する情報を含むメタデータを生成することができる。ファイルをデータベースに格納することができ、このデータベースからストリーミングサーバがNALユニットを読み取り、これらNALユニットをRTPパケットにカプセル化することができる。使用されるデータ接続及び随意のメタデータに従って、ストリーミングサーバは、例えば、復号化順序と異なるパケットの伝送順序を変更し、サブシーケンスを取り除き、SEIメッセージがあれば、何のSEIメッセージを伝送するかを決定することができる。受信端では、RTPパケットは受信され、バッファリングされる。典型的に、NALユニットがまず正確な順序に再順序付けされ、その後、NALユニットがデコーダに配信される。
更に、下記の記載では、エンコーダ‐デコーダに基づくシステムを用いることにより本発明を説明するが、エンコーダが符号化データをストリーミングサーバのような他の構成要素に復号化順序で出力し伝送するシステムでも本発明を実装できること明らかである。他の構成要素は、符号化データを復号化順序から他の順序へ再順序付けし、再順序付けした形態の符号化データをデコーダに転送する。
本発明による方法は、少なくとも2つの伝送ユニットの合計サイズが規定され、合計サイズに基づいて最大バッファサイズが規定されるように、バッファのサイズが規定されることを主として特徴とする。本発明によるシステムは、少なくとも2つの伝送ユニットの合計サイズが規定され、合計サイズに基づいて最大バッファサイズが規定されるように、バッファのサイズを規定するデファイナをシステムが更に含むことを主として特徴とする。本発明によるエンコーダは、少なくとも2つの伝送ユニットの合計サイズが規定され、合計サイズに基づいて最大バッファサイズが規定されるように、バッファのサイズを規定するデファイナをエンコーダが更に含むことを主として特徴とする。本発明によるデコーダは、デコーダが、バッファサイズを示す受信パラメータに従ってプリデコーディングバッファのためにメモリを割り当てるプロセッサを更に含み、少なくとも2つの伝送ユニットの合計サイズが規定され、合計サイズに基づいて最大バッファサイズが規定されるように、バッファサイズが規定されることを主として特徴とする。本発明による伝送装置は、少なくとも2つの伝送ユニットの合計サイズが規定され、合計サイズに基づいて最大バッファサイズが規定されるように、バッファのサイズを規定するデファイナを伝送装置が更に含むことを主として特徴とする。本発明による受信装置は、デコーダが、バッファサイズを示す受信パラメータに従ってプリデコーディングバッファのためにメモリを割り当てるプロセッサを更に含み、少なくとも2つの伝送ユニットの合計サイズが規定され、合計サイズに基づいて最大バッファサイズが規定されるように、バッファサイズが規定されることを主として特徴とする。本発明によるソフトウェアプログラムは、少なくとも2つの伝送ユニットの合計サイズが規定され、合計サイズに基づいて最大バッファサイズが規定されるように、バッファのサイズが規定されることを主として特徴とする。本発明による記憶媒体は、少なくとも2つの伝送ユニットの合計サイズが規定され、合計サイズに基づいて最大バッファサイズが規定されるように、バッファのサイズが規定されることを主として特徴とする。本発明による電子装置は、少なくとも2つの伝送ユニットの合計サイズが規定され、合計サイズに基づいて最大バッファサイズが規定されるように、バッファのサイズを規定するデファイナを電子装置が更に含むことを主として特徴とする。
本発明の有利な実施形態に従っていかなる復号化順序情報にもビデオビットストリームで信号送信する代替案を下記に提示する。復号化順序番号(DON)は、デコーダへのNALユニットの配信順序と異なるNALユニットの復号化順序を示す。以下、一般性を失わずに、DONを16ビット符号なし整数であると仮定する。あるNALユニットのDONがD1であり、別のNALユニットのDONがD2であるとする。D1<D2かつD2−D1<32768であれば、または、D1>D2かつD1−D2≧32768であれば、D1に等しいDONを有するNALユニットは、NALユニット配信順序において、D2に等しいDONを有するNALユニットに先行する。D1<D2かつD2−D1≧32768であれば、または、D1>D2かつD1−D2<32768であれば、D2に等しいDONを有するNALユニットは、NALユニット配信順序において、D1に等しいDONを有するNALユニットに先行する。異なる1次符号化ピクチャと関連するNALユニットは同一値のDONを持たない。同一の1次符号化ピクチャと関連するNALユニットは同一値のDONを持つことができる。1次符号化ピクチャのNALユニットすべてが同一値のDONを持っていれば、1次符号化ピクチャと関連する冗長符号化ピクチャのNALユニットは、1次符号化ピクチャのNALユニットと同じ値のDONを持つべきである。同一値のDONを有するNALユニットのNALユニット配信順序が次の通りであるのが好ましい。
1. ピクチャ区切りNALユニットがあるとすれば、ピクチャ区切りNALユニット
2. シーケンスパラメータセットNALユニットがあるとすれば、シーケンスパラメータセットNALユニット
3. ピクチャパラメータセットNALユニットがあるとすれば、ピクチャパラメータセットNALユニット
4. SEI NALユニットがあるとすれば、SEI NALユニット
5. 1次符号化ピクチャの符号化スライス及びスライスデータパーティションNALユニットがあるとすれば、1次符号化ピクチャの符号化スライス及びスライスデータパーティションNALユニット
6. 冗長符号化ピクチャの符号化スライス及びスライスデータパーティションNALユニットがあるとすれば、冗長符号化ピクチャの符号化スライス及びスライスデータパーティションNALユニット
7. フィラーデータNALユニットがあるとすれば、フィラーデータNALユニット
8. シーケンス終了NALユニットがあるとすれば、シーケンス終了NALユニット
9. ストリーム終了NALユニットがあるとすれば、ストリーム終了NALユニット
本発明は符号化システムのバッファリング効率を改善する。本発明を用いることにより、どのくらいプリデコーディングバッファリングが必要とされるかを復号化装置に知らせることができる。従って、復号化装置でプリデコーディングバッファに対して必要以上多くのメモリを割り当てる必要がない。しかも、プリデコーディングバッファのオーバフローを回避することができる。
再帰的な時間スケーラビリティ方式の一例を示す図である。 一連のピクチャが、2つ以上の独立して符号化されたスレッドにインターリーブ形式に分割されるビデオ冗長符号化と称する方式を示す図である。 圧縮効率を改善する可能性を秘めている予測構造の一例を示す図である。 誤り耐性の改善に用いることができるイントラピクチャの後回し方式の一例を示す図である。 符号化ビデオストリームのピクチャに対する異なる従来技術の番号付け方式を示す図である。 符号化ビデオストリームのピクチャに対する異なる従来技術の番号付け方式を示す図である。 層1にサブシーケンスを含むピクチャストリームの一例を表す図である。 層1にサブシーケンスを有する2つのグループオブピクチャを含むピクチャストリームの一例を表す図である。 異なるグループオブピクチャのピクチャストリームの一例を表す図である。 層1にサブシーケンスを含むピクチャストリームの他の例を表す図である。 本発明によるシステムの有利な実施形態を表す図である。 本発明によるエンコーダの有利な実施形態を表す図である。 本発明によるデコーダの有利な実施形態を表す図である。 本発明と用いることができるNALパケットフォーマットの一例を表す図である。 本発明と用いることができるNALパケットフォーマットの他の例を表す図である。 プリデコーダバッファにおける伝送ユニットのバッファリングの一例を表す図である。
デパケット化ルールの背後にある一般概念は、NALユニットのような伝送ユニットを伝送順序からNALユニット復号化順序に再順序付けすることにある。
受信機は、パケットを伝送順序からNALユニット復号化順序に再順序付けするのに用いられる受信機バッファ(またはプリデコーダバッファ)を含む。本発明の例示的な一実施形態では、受信機バッファサイズは、バイト数の観点から、deint‐buf‐sizeパラメータの値以上に、例えば、値1.2×deint‐buf‐size MIMEパラメータの値に設定されている。受信機は伝送遅延ジッタのバッファリングも考慮に入れて、別々のバッファを伝送遅延ジッタバッファリングのために取っておくか、または、伝送遅延ジッタのバッファを受信機バッファと結合する(従って、受信機バッファ内に幾つかの追加のスペースを遅延ジッタバッファリングのために取っておく)ことができる。
受信機は次の通りに受信NALユニットを受信順に受信機バッファ内に格納する。集約パケットのNALユニットを受信機バッファ内に個々に格納する。すべてのNALユニットについてDONの値を計算し、格納する。
ここで、Nは、NALユニット伝送順序においてパケットストリーム内のいかなるVCL NALユニットにも先行し、復号化順序においてVCL NALユニットの後に続くVCL NALユニットの最大量を指定する随意のパラメータnum‐reorder‐VCL‐NAL‐units(インターリーブ深さパラメータ)の値であるとする。パラメータが存在しない場合、0値の数であることを暗黙的に示す。
ビデオストリーム転送セッションが初期化されると、受信機8は、少なくともN個のVCL NALユニットを格納するため、メモリを受信バッファ9.1に割り当てる。次に、受信機はビデオストリームを受信し始め、受信したVCL NALユニットを受信バッファに格納する。初期バッファリングは、
‐ 少なくともN個のVCL NALユニットが受信バッファ9.1に格納されるまで、または、
‐ nが、受信したNALユニットのうちでAbsDONの最大値を有するNALユニットに対応し、mが、受信したNALユニットのうちでAbsDONの最小値を有するNALユニットに対応し、max‐don‐diff MIMEパラメータが存在すれば、関数don_diff(m,n)の値がmax‐don‐diffの値よりも大きくなるまで、または、
‐ 初期バッファリングが随意のinit‐buf‐time MIMEパラメータの値以上の期間経過するまで
持続する。
関数don_diff(m,n)は次の通りに指定されている。すなわち、
DON(m)==DON(n)であれば、don_diff(m,n)=0
DON(m)<DON(n)且つ DON(n)−DON(m)<32768であれば、don_diff(m,n)=DON(n)−DON(m)
DON(m)>DON(n)且つ DON(m)−DON(n)≧32768であれば、don_diff(m,n)=65536−DON(m)+DON(n)
DON(m)<DON(n)且つ DON(n)−DON(m)≧32768であれば、don_diff(m,n)=−(DON(m)+65536−DON(n))
DON(m)>DON(n)且つ DON(m)−DON(n)<32768であれば、don_diff(m,n)=−(DON(m)−DON(n))
ここで、DON(i)は、伝送順序でインデックスiを有するNALユニットの復号化順序番号である。
don_diff(m,n)の正の値は、伝送順序インデックスnを有するNALユニットが復号化順序において、伝送順序インデックスmを有するNALユニットの後に来るということを示す。
AbsDONは、65535の後で0にラップアラウンドしないNALユニットの復号化順序番号を意味する。言い換えれば、AbsDONは次の通りに計算される。
m及びnが、伝送順序に連続したNALユニットであるとする。(0であるインデックスを有する)伝送順序でまさしく最初のNALユニットに対して、AbsDON(0)=DON(0)である。他のNALユニットに対して、AbsDONは次の通りに計算される。すなわち、
DON(m)==DON(n)であれば、AbsDON(n)=AbsDON(m)
DON(m)<DON(n)且つ DON(n)−DON(m)<32768であれば、AbsDON(n)=AbsDON(m)+DON(n)−DON(m)
DON(m)>DON(n)且つ DON(m)−DON(n)≧32768であれば、AbsDON(n)=AbsDON(m)+65536−DON(m)+DON(n)
DON(m)<DON(n)且つ DON(n)−DON(m)≧32768であれば、AbsDON(n)=AbsDON(m)−(DON(m)+65536−DON(n))
DON(m)>DON(n)且つ DON(m)−DON(n)<32768であれば、AbsDON(n)=AbsDON(m)−(DON(m)−DON(n))
ここで、DON(i)は、伝送順序でインデックスiを有するNALユニットの復号化順序番号である。
受信機において通常2つのバッファリング状態すなわち初期バッファリングと再生中のバッファリングとがある。RTPセッションが初期化されると、初期バッファリングが起こる。初期バッファリングの後、復号化及び再生が開始され、再生中バッファリングモードが用いられる。
受信機バッファ9.1が少なくともN個のVCL NALユニットを含む場合、NALユニットは受信機バッファ9.1から1つずつ取り出され、デコーダ2に移される。NALユニットは必ずしも、NALユニットが格納された順序と同じ順序で受信機バッファ9.1から取り出されるとは限らないが、下記に説明するようにNALユニットのDONに従って取り出される。バッファがN個のVCL NALユニット未満すなわち(N−1)個のVCL NALユニットを含むまでデコーダ2へのパケットの供給は継続する。
受信機バッファから取り出されるNALユニットは以下の通りに決定される。すなわち、
− 受信機バッファが少なくともN個のVCL NALユニットを含めば、NALユニットは受信機バッファから取り出され、バッファが(N−1)個のVCL NALユニットを含むまで、下記に指定される順序でデコーダに移される。
− max‐don‐diffが存在すれば、don_diff(m,n)がmax‐don‐diffよりも大きいすべてのNALユニットmが受信機バッファから取り出され、下記に指定される順序でデコーダに移される。ここで、nは、受信したNALユニットのうちでAbsDONの最大値を有するNALユニットに対応する。
− NALユニットストリームの第1パケットが受信されたときに0に初期化されたシステムタイマの値に変数tsが設定される。受信機バッファが、ts−tr>init‐buf‐timeという条件を満たす受信時間trを有するNALユニットを含めば、NALユニットは、指定された条件を満たす受信時間trを有するNALユニットのいずれをも受信機バッファが含まなくなるまで、下記に指定される順序でデコーダに移され(受信機バッファから取り出され)る。
NALユニットがデコーダに移される順序は次の通りに指定される。
PDONが、RTPセッションの初めで0に初期化される変数であるとする。DONの値と関連する各NALユニットに対して、DON間隔は以下の通りに計算される。NALユニットのDONの値がPDONの値よりも大きければ、DON間隔はDON−PDONに等しい。そうでなければ、DON間隔は65535−PDON+DON+1に等しい。
NALユニットはDON間隔の昇順でデコーダに供給される。幾つかのNALユニットがDON間隔の同一値を共有すれば、それらを任意の順序でデコーダに移すことができる。所望の数のNALユニットがデコーダに移されていれば、PDONの値は、デコーダに移された最後のNALユニットのDONの値に設定される。
追加のデパケット化の指針
下記の追加のデパケット化ルールを用いて、操作可能なH.264デパケッタイザを実装することができる。
(例えば、ゲートウェイにおける)知的RTP受信機は、損失した符号化スライスデータパーティションA(DPA)を識別することができる。損失したDPAが検出されれば、ゲートウェイは、対応の符号化スライスデータパーティションB及びCを送信しないと決定することができる。その理由は、それら情報がH.264デコーダにとって意味のないものであるからである。このように、ネットワーク要素は、複雑なビットストリームを解析することなく、無駄なパケットを廃棄することによりネットワーク負荷を減少させることができる。
(例えば、ゲートウェイにおける)知的RTP受信機は、損失した部分的なユニット(FU)を識別することができる。損失したFUが検出されれば、ゲートウェイは、同一のNALユニットのうちで次に来るFUを送信しないと決定することができる。その理由は、それら情報がH.264デコーダにとって意味のないものであるからである。このように、ネットワーク要素は、複雑なビットストリームを解析することなく、無駄なパケットを廃棄することによりネットワーク負荷を減少させることができる。
パケットまたはNALUを廃棄する必要がある知的受信機は、NALユニットタイプオクテットのNRIフィールドの値が0に等しいすべてのパケット/NALUを最初に廃棄することができる。このことは、ユーザ体験に与える影響を最小限に抑えることができる。
以下では、デコーダにおいて最大のバッファサイズを示すのに用いられるパラメータについて説明する。パケット化モードを表すパケット化モードパラメータが存在しないときか、または、パケット化モードパラメータの値が0または1に等しいときには通常、パラメータdeint‐buf‐sizeは存在しない。このパラメータは、パケット化モードパラメータの値が2に等しいときには存在しなければならない。
パラメータdeint‐buf‐sizeの値は、以下の仮想デインターリービングバッファモデルと関連して指定される。最初に、仮想デインターリービングバッファは空であり、最大バッファ占有値mは0に設定されている。このモデルにおいて、以下の処理が用いられる。すなわち、
i)伝送順序で次のVCL NALユニットを仮想デインターリービングバッファに挿入する。
ii)sが、バイト単位で表すバッファにおけるVCL NALユニットの合計サイズであるとする。
iii)sがmよりも大きければ、mはsに等しく設定される。
iv)仮想デインターリービングバッファにおけるVCL NALユニットの数がインターリーブ深さの値以下であれば、段階viiから処理を継続する。
v)仮想デインターリービングバッファにおけるVCL NALユニットのうち復号化順序で最も早いVCL NALユニットを、RFC XXXXのセクション5.5に従ってVCL NALユニットのDONの値から決定する。
vi)最も早いVCL NALユニットを仮想デインターリービングバッファから取り出す。
vii)伝送順序においてそれ以上VCL NALユニットがなければ、処理を終了する。
viii)処理を段階iから継続する。
このパラメータは、NALユニットストリームのプロパティまたは受信機実行の可能性を通知する。パラメータがNALユニットストリームのプロパティを通知するのに用いられるとき、パラメータVの値は、
a)NALユニットストリームが仮想デインターリービングバッファモデルにより完全に処理されたときに生じるmの値は、v以下である。または、
b)バッファオーバフローがある限り、最も早いVCL NALユニットをデインターリービングバッファから取り出すことにより決定されたVCL NALユニットの順序は、仮想デインターリービングバッファからVCL NALユニットを取り出す順序と同じである。
その結果として、VCL NALユニット復号化順序回復のバッファサイズが、バイト単位で表す少なくともdeint‐buf‐sizeの値であるとき、受信機がVCL NALユニット復号化順序を再構築できることが保証される。
パラメータが、受信機実行の可能性を通知するのに用いられる場合、受信機は、deint‐buf‐sizeの同一値により特徴付けられるあらゆるNALユニットストリームのVCL NALユニット復号化順序を正確に再構築することができる。受信機が、deint‐buf‐sizeの値以上であるこのようなバイト数をバッファリングする場合、VCL NALユニット復号化順序を伝送順序から再構築することができる。
デインターリービングバッファのサイズを決定するときに非VCL NALユニットをも考慮すべきである。このパラメータが存在する場合、すべてのNALユニットに対してデインターリービングバッファの充分なサイズは、このパラメータの値よりも20%大きい値以下である。
このパラメータが存在しなければ、deint‐buf‐sizeに0の値が用いられる。deint‐buf‐sizeの値は、例えば0〜4294967295の範囲内にある整数である。
以下では、図8のシステムと、図9のエンコーダ1及び仮想参照デコーダ(HRD)5と、図10のデコーダ2とを参照して本発明を詳細に説明する。符号化されるピクチャを、例えば、ビデオ源3例えばカメラやビデオレコーダなどからのビデオストリームのピクチャとすることができる。ビデオストリームのピクチャ(フレーム)をスライスのような細かい部分に分割することができる。スライスを更にブロックに分割することができる。エンコーダ1では、ビデオストリームは、伝送チャネル4を介して伝送されるか、または記憶媒体(図示せず)へ伝送される情報を減少させるように符号化される。ビデオストリームのピクチャはエンコーダ1に入力される。エンコーダは、符号化されるピクチャの幾つかを一時的に格納する符号化バッファ1.1(図9)を有する。エンコーダ1は、本発明による符号化タスクを適用できるメモリ1.3及びプロセッサ1.2をも含む。メモリ1.3及びプロセッサ1.2は伝送装置6と共通化することができる。または、伝送装置6は、伝送装置6の他の機能のために他のプロセッサ及び/またはメモリ(図示せず)を有することができる。エンコーダ1は、ビデオストリームを圧縮するために動き補償及び/または他のタスクを実行する。動き推定では、符号化されるピクチャ(現在のピクチャ)と、前及び/または後のピクチャと間の類似点を検索する。類似点が検出されれば、比較されたピクチャまたはその一部を、符号化されるピクチャ用の参照ピクチャとして用いることができる。JVTでは、ピクチャの表示順序と復号化順序とが同一とは限らない。参照ピクチャとして用いられる限り、参照ピクチャをバッファ内(例えば、符号化バッファ1.1)に格納しなければならない。また、エンコーダ1は、ピクチャの表示順序に関する情報を伝送ストリームに挿入する。
必要ならば、符号化ピクチャは符号化処理から符号化ピクチャバッファ5.2に移動される。符号化ピクチャは、伝送チャネル4を介してエンコーダ1からデコーダ2に伝送される。デコーダ2では、符号化ピクチャは、可能な限り符号化ピクチャに一致する伸長ピクチャを形成するように復号化される。復号化ピクチャが復号化のほとんど直後に表示されず、参照ピクチャとして用いられる限り、各復号化ピクチャはデコーダ2のDPB2.1にバッファリングされる。本発明によるシステムでは、参照ピクチャバッファリング及び表示ピクチャバッファリングの双方は結合され、それらは同一の復号化ピクチャバッファ2.1を用いる。このことは、2つの異なる場所に同一のピクチャを格納する必要性を削減し、従って、デコーダ2のメモリ要件を減少させる。
デコーダ1は、本発明による復号化タスクを適用できるメモリ2.3及びプロセッサ2.2をも含む。メモリ2.3及びプロセッサ2.2を受信装置8と共通化することができる。または、受信装置8は、受信装置8の他の機能のために他のプロセッサ及び/またはメモリ(図示せず)を有することができる。
符号化
次に、符号化‐復号化処理を詳細に検討する。ビデオ源3からのピクチャはエンコーダ1に入力され、有利には、符号化バッファ1.1に格納される。符号化処理は、最初のピクチャがエンコーダに入力された直後に開始されるとは限らないが、符号化バッファ1.1内に特定量のピクチャが利用できるようになってから開始される。次に、エンコーダ1は、参照フレームとして用いられるピクチャから適切な候補を検出しようとする。次に、エンコーダ1は、符号化ピクチャを形成するように符号化を実行する。符号化ピクチャを、例えば、予測ピクチャ(P)、双予測ピクチャ(B)及び/またはイントラ符号化ピクチャ(I)とすることができる。他のいかなるピクチャをも用いず、イントラ符号化ピクチャを復号化することができるが、他のタイプのピクチャは、それらを復号化できる前に少なくとも1つの参照ピクチャを必要とする。上述したピクチャタイプのいずれかのピクチャを参照ピクチャとして用いることができる。
エンコーダは、2つのタイムスタンプすなわち復号化タイムスタンプ(DTS)及び出力タイムスタンプ(OTS)をピクチャに添付するのが有利である。デコーダは、正確な復号化時間及びピクチャの出力(表示)時間を決定するのにタイムスタンプを用いることができる。しかし、これらタイムスタンプはデコーダに伝送されるとは限らず、または、デコーダがこれらタイムスタンプを用いない場合がある。
また、エンコーダは、最下の層0よりも上にある1つ以上の層でサブシーケンスを形成する。層0のピクチャを独立して復号化することができるが、上位の層のピクチャは、ある下位の層または幾つかの下位の層のピクチャに依存することができる。図6aの例では、2つの層すなわち層0及び層1がある。図6aに示すように、ピクチャI0、P6及びP12が層0に属するのに対して、他のピクチャP1〜P5及びP7〜P11は層1に属する。有利には、エンコーダは、同一のグループオブピクチャ(GOP)のピクチャのみを用いることにより1つのGOPの各ピクチャを再構築できるようにGOPを形成する。言い換えれば、1つのGOPは、少なくとも1つの独立して復号化できるピクチャを含み、他のすべてのピクチャに対して、独立して復号化できるピクチャが参照ピクチャである。図7の例では、2つのグループオブピクチャがある。第1グループオブピクチャは、層0のピクチャI0(0),P1(0),P3(0)と層1のピクチャB2(0),2×B3(0),B4(0),2×B5(0),B6(0),P5(0),P6(0)とを含む。第2グループオブピクチャは、層0のピクチャI0(1),P1(1)と層1のピクチャ2×B3(1),B2(1)とを含む。各グループオブピクチャの層1のピクチャはサブシーケンスとして更に配置されている。第1グループオブピクチャの第1サブシーケンスはピクチャB3(0),B2(0),B3(0)を含み、第2サブシーケンスはピクチャB5(0),B4(0),B5(0)を含み、第3サブシーケンスはピクチャB6(0),P5(0),P6(0)を含む。第2グループオブピクチャのサブシーケンスはピクチャB3(1),B2(1),B3(1)を含む。かっこの中の数字は、ピクチャが属するグループオブピクチャに対して規定されているビデオシーケンスIDを示す。
ビデオシーケンスIDは各ピクチャについて転送される。ビデオシーケンスIDを追加拡張情報データの場合のようにビデオビットストリームで伝達することができる。JVT符号化規格のRTPペイロードヘッダでのようなトランスポートプロトコルのヘッダフィールドでもビデオシーケンスIDを伝送することができる。独立したGOPに与えられた分割によるビデオシーケンスIDを、MPEG‐4 AVCファイルフォーマットのようなビデオファイルフォーマットのメタデータに格納することができる。図11a及び図11bには、本発明と用いることができるNALパケットフォーマットの例を表す。パケットは、ヘッダ11及びペイロード部12を含む。ヘッダ11は、エラー表示子フィールド11.1(F,Forbidden(禁制))、優先フィールド11.2及びタイプフィールド11.3を含むのが有利である。エラー表示子フィールド11.1は、ビットエラーのないNALユニットを示す。エラー表示子フィールドが設定されている場合、デコーダは、ビットエラーがペイロードまたはNALUタイプオクテットに存在するおそれがあることを忠告するのが有利である。ビットエラーを処理できないデコーダは次に、このようなパケットを廃棄することができる。優先フィールド11.2は、パケットのペイロード部12にカプセル化されたピクチャの重要性を示すのに用いられる。例示的な実施形態では、優先フィールドは、次の通りに4つの異なる値を有することができる。00の値は、(将来の参照ピクチャとして用いることができる)格納されたピクチャを再構築するのにNALUの内容が用いられないということを示す。参照ピクチャの整合性を危うくすることなく、このようなNALUを廃棄することができる。00よりも上の値は、参照ピクチャの整合性を維持するのにNALUの復号化が必要とされるということを示す。更に、00よりも上の値は、エンコーダにより決定されるような相対移送優先順位を示す。この情報を用いて、知的ネットワーク要素は、重要性の低いNALUよりも重要性の高いNALUを保護することができる。11は、最も高い移送優先順位を示し、その後に10であって、次に01が続き、最後に、00が最も低い。
NALUのペイロード部12は、少なくともビデオシーケンスIDフィールド12.1、フィールド表示子12.2、サイズフィールド12.3、タイミング情報12.4及び符号化ピクチャ情報12.5を含む。ビデオシーケンスIDフィールド12.1は、ピクチャが属するビデオシーケンスの数を格納するのに用いられる。フィールド表示子12.2は、2フレームピクチャ形式が用いられる場合にピクチャが第1フレームであるか第2フレームであるかを信号送信するのに用いられる。双方のフレームを別々のピクチャとして符号化することができる。1に等しい第1フィールド表示子は、同一フレームのうち復号化順序で第2の符号化フィールドに先行する符号化フィールドまたは符号化フレームにNALUが属することを通知するのが有利である。0に等しい第1フィールド表示子は、同一フレームのうち復号化順序で第1の符号化フィールドの後に続く符号化フィールドにNALUが属することを通知する。タイミング情報フィールド11.3は、必要に応じ、時間に関する情報を変換するのに用いられる。
異なる種類のパケットでNALユニットを配信することができる。この有利な実施形態では、異なるパケットフォーマットは、単純パケット及び集約パケットを含む。集約パケットをシングルタイム集約パケット及びマルチタイム集約パケットに更に分割することができる。
本発明による単純パケットは1つのNALUから成る。単純パケットをRTPシーケンス番号順にデカプセル化することにより構成されたNALユニットストリームはNALユニット配信順序に合致しなければならない。
集約パケットは、このペイロード仕様のパケット集約方式である。この方式は、2つの異なるタイプのネットワークすなわち(Ethernet(登録商標)MTUサイズによりしばしば制限されるMTUサイズ‐‐約1500バイトを有する)有線IPネットワークと、254バイト以下の好ましい伝送ユニットサイズを有するIPまたは非IP(例えば、H.324/M)ベースの無線ネットワークとの劇的に異なるMTUサイズを反映するように導入されている。2つの世界間のメディアトランスコーディングを防止するため、また、不所望なパケット化オーバヘッドを回避するため、パケット集約方式は導入されている。
シングルタイム集約パケット(STAP)は、同一のNALUタイムでNALUを集約する。マルチタイム集約パケット(MTAP)は、異なる可能性を秘めているNALUタイムでNALUを集約する。NALUタイムスタンプオフセットの長さの点で異なる2つの異なるMTAPが規定されている。NALUタイムなる用語は、NALUがそれ自体のRTPパケットで移送される場合にRTPタイムスタンプが有する値として定義されている。
MTAP及びSTAPは、本発明の有利な実施形態による下記の限定されないパケット化ルールを共有する。RTPタイムスタンプを、集約されるすべてのNALUのNALUタイムの最小値に設定しなければならない。NALUタイプオクテットのタイプフィールドを、表1に示すような適切な値に設定しなければならない。集約されたNALUのすべてのエラー表示子フィールドが零であれば、エラー表示子フィールド11.1を消去しなければならず、そうでなければ、設定しなければならない。
Figure 2011199899
集約パケットのNALUペイロードは1つ以上の集約ユニットから成る。集約パケットは、必要な限り多くの集約ユニットを伝達できるが、集約パケットのデータの総量は、当然IPパケットに合致しなければならなく、結果として生じたIPパケットがMTUサイズよりも小さくなるようにサイズを選択しなければならない。
同一のNALUタイムを共有するNALUを集約するときはいつでもシングルタイム集約パケット(STAP)を用いなければならない。STAPのNALUペイロードは、ビデオシーケンスIDフィールド12.1(例えば、7ビット)と、シングルピクチャ集約ユニット(SPAU)が後に続くフィールド表示子12.2とから成る。
他の代替の実施形態では、シングルピクチャ集約パケット(STAP)のNALUペイロードは、シングルピクチャ集約ユニット(SPAU)が後に続く16ビット符号なし復号化順序番号(DON)から成る。
この仕様に準じるビデオシーケンスを、NALUストリームの他の部分から独立して復号化できるNALUストリームのいずれかの部分とすることができる。
フレームは、別々のピクチャとして符号化できる2つのフィールドから成る。1に等しい第1フィールド表示子は、同一フレームのうち復号化順序で第2の符号化フィールドに先行する符号化フィールドまたは符号化フレームにNALUが属することを信号送信する。0に等しい第1フィールド表示子は、同一フレームのうち復号化順序で第1の符号化フィールドの後に続く符号化フィールドにNALUが属することを信号送信する。
シングルピクチャ集約ユニットは、(2つのオクテットを除くが、NALUのNALUタイプオクテットを含む)後に続くNALUのサイズをバイトで示す例えば16ビット符号なしサイズ情報から成り、この後には、NALUタイプバイトを含むNALU自体が続く。
マルチタイム集約パケット(MTAP)は、STAPと類似する構造を有する。マルチタイム集約パケット(MTAP)は、NALUヘッダバイト及び1つ以上のマルチピクチャ集約ユニットから成る。異なるMTAPフィールド間の選択は用途に依存する。すなわち、タイムスタンプオフセットが大きい程、MTAPのフレキシビリティが高くなるが、オーバヘッドも大きくなる。
2つの異なるマルチタイム集約ユニットは、この仕様に規定されている。これら双方は、(STAPでのサイズ情報と同じ)後に続くNALUの例えば16ビット符号なしサイズ情報から成り、これら16ビットに加えて、ビデオシーケンスIDフィールド12.1(例えば、7ビット)と、フィールド表示子12.2と、このNALUに関するnビットのタイミング情報をも含む。ここで、nを、例えば16または24とすることができる。MTAPのRTPタイムスタンプからのタイミング情報を加えることによりMTAPにおける各NALUのRTPパケットのRTPタイムスタンプ(NALUタイム)を生成できるようにタイミング情報フィールドを設定しなければならない。
他の代替の実施形態では、マルチタイム集約パケット(MTAP)は、NALUヘッダバイト、復号化順序番号ベース(DONB)フィールド12.1(例えば、16ビット)及び1つ以上のマルチピクチャ集約ユニットから成る。この場合、2つの異なるマルチタイム集約ユニットは次の通りに規定される。これら双方は、(STAPでのサイズ情報と同じ)後に続くNALUの例えば16ビット符号なしサイズ情報から成り、これら16ビットに加えて、復号化順序番号デルタ(DOND)フィールド12.5(例えば、7ビット)と、このNALUに関するnビットのタイミング情報をも含む。ここで、nを、例えば16または24とすることができる。後に続くNALUのDONは、DONB+DONDに等しい。MTAPのRTPタイムスタンプからのタイミング情報を加えることによりMTAPにおける各NALUのRTPパケットのRTPタイムスタンプ(NALUタイム)を生成できるようにタイミング情報フィールドを設定しなければならない。DONBは、MTAPのNALユニットのうちで最も小さいDONの値を含めるべきである。
本発明によるバッファリングモデルの動作は、次のパラメータすなわち初期入力期間(例えば、90kHzクロックのクロックチック単位)及び仮想パケット入力バッファのサイズ(例えば、バイト単位)を用いて制御されるのが有利である。好ましくは、初期設定の初期入力期間及び仮想パケット入力バッファの初期設定サイズを0とする。PSSクライアントは、大きいバッファを機能交換過程で用いる機能を信号送信することができる。
最大ビデオビットレートを、例えば、SDPのメディアレベル帯域幅特性で、または、専用のSDPパラメータで信号送信することができる。ビデオレベル帯域幅特性がプレゼンテーション記述に存在しなかったなら、最大ビデオビットレートは、使用されているビデオ符号化プロファイル及びレベルに従って規定される。
例えばMIMEタイプパラメータまたは類似の非規格SDPパラメータを用いて、各ストリームの初期パラメータ値をストリームのSDP記述に信号送信することができる。通知されたパラメータ値は対応の初期設定パラメータ値をオーバライドする。(一定遅延の信頼できる伝送チャネルを仮定すれば、)SDP記述に信号送信された値はストリームの最初からストリームの最後まで一時停止なしの再生を保証する。
PSSサーバは、RTSP再生要求に応答してパラメータ値を更新することができる。更新されるパラメータ値が存在すれば、SDP記述に信号送信された値、または、初期設定のパラメータ値をPSSバッファリングモデルの動作中に置き換えなければならない。更新されるパラメータ値は、指示された再生範囲のみに有効であり、その後、何の効果もない。一定遅延の信頼できる伝送チャネルを仮定すれば、更新されるパラメータ値は、再生要求に応答して、指示された実際の範囲で一時停止なしの再生を保証する。指示された仮想入力パケットバッファのサイズ及び初期入力期間は、どちらも有効であるSDP記述での対応値または対応の初期設定値に等しいかそれ以下でなければならない。
サーババッファリングベリファイアは、指定のバッファリングモデルに従って指定される。このモデルは仮想パケット入力バッファに基づく。
バッファリングモデルを次に提示する。最初、バッファは空である。RTPパケットが伝送されるとすぐに、PSSサーバは、ビデオペイロードを有して各々伝送されたRTPパケットを仮想パケット入力バッファ1.1に加える。RTPまたはあらゆる下位層のすべてのプロトコルヘッダが取り除かれる。初期入力期間と呼ばれている期間中、仮想パケット入力バッファからデータは取り出されない。第1RTPパケットが仮想パケット入力バッファに加えられたときに初期入力期間は開始する。初期入力期間が終了したとき、仮想パケット入力バッファからのデータの取り出しが開始される。仮想パケット入力バッファ1.1が空でない限り、データの取り出しは最大ビデオビットレートで起こるのが好ましい。仮想パケット入力バッファ1.1から取り出されたデータは仮想参照デコーダ5に入力される。仮想参照デコーダ5は、設定パラメータに従って符号化ビデオストリームを確実に復号化できるようにする仮想復号化処理を実行する。または、例えば、仮想参照デコーダ5のピクチャバッファ5.2がオーバフローしていることに仮想参照デコーダ5が気付けば、バッファパラメータを変更することができる。この場合、新しいパラメータも受信装置8に伝送され、これに応じてバッファは再初期化される。
PSSサーバのような符号化及び伝送装置1は、伝送されるRTPパケットストリームが下記の要件に従うことを検証しなければならない。
− バッファリングモデルを初期設定パラメータ値で、または、信号送信されたバッファリングパラメータ値で用いるものとする。信号送信されたパラメータ値は対応の初期設定パラメータ値をオーバライドする。
− 仮想パケット入力バッファの占有値は、初期設定または信号送信されたバッファサイズを超えないものとする。
− 仮想パケット入力バッファの出力ビットストリームは仮想参照デコーダの規定に合致するものとする。
バッファリングモデルが用いられていれば、RTPパケットストリームが一定遅延の信頼できる伝送チャネルに伝達されるとき、PSSクライアントは、PSSサーババッファリングベリファイアに従うRTPパケットストリームを受信できなければならない。更に、PSSクライアントのデコーダは、受信されたパケットストリームのRTPタイムスタンプにより規定された正確なレートでフレームを出力しなければならない。
伝送
最初の符号化ピクチャが準備されると直ちに符号化ピクチャの伝送及び/または格納(及び随意の仮想復号化)を開始することができる。このピクチャは、デコーダ出力順序で最初のものとは限らない。その理由は、復号化順序及び出力順序が同じでない場合があるためである。
ビデオストリームの最初のピクチャが符号化されると、伝送を開始することができる。符号化ピクチャは、符号化ピクチャバッファ1.2に随意に格納される。後の段階でも、例えば、ビデオストリームの特定部分が符号化された後でも、伝送を開始することができる。
デコーダ2も、例えばピクチャオーダカウントの順序付けを用いることにより正確な順序で復号化ピクチャを出力すべきである。従って、再順序付け処理を明瞭にかつ標準的に規定する必要がある。
デパケット化
デパケット化処理は実装に依存する。従って、以下の説明は、適切な実装の非限定的な例である。他の方式も用いることができる。記載のアルゴリズムに関する最適化も可能である。
これらデパケット化ルールの背後にある一般概念は、NALユニットを伝送順序からNALユニット配信順序に再順序付けすることにある。
復号化
次に、受信機8の動作を説明する。受信機8は、ピクチャに属するすべてのパケットを収集して、これらを適切な順序の状態にする。順序の正確性は、用いられるプロファイルに依存する。受信されたパケットは受信バッファ9.1(プリデコーディングバッファ)に格納される。受信機8は、使用できないものを廃棄し、残りの部分をデコーダ2に移す。集約パケットは、NALUを伝達する個々のRTPパケットにペイロードをアップロードすることにより処理される。これらNALUは、それらが別々のRTPパケットで受信されたかのように、それらが集約パケットに配置された順序で処理される。
以後、Nは、パケットストリームにおいてNALユニット配信順序でいかなるVCL NALユニットにも先行し、RTPシーケンス番号順序で、または、VCL NALユニットを含む集約パケットの生成順序でVCL NALユニットの後に続くVCL NALユニットの最大量を指定する随意のnum‐reorder‐VCL‐NAL‐units MIMEタイプのパラメータ値であるとする。パラメータが存在しなければ、0値の数であることを意味することができる。
ビデオストリーム転送セッションが初期化されるとき、受信機8は、少なくともN個のVCL NALユニットを格納するため受信バッファ9.1にメモリを割り当てる。次に、受信機はビデオストリームを受信し始め、少なくともN個のVCL NALユニットが受信バッファ9.1に格納されるまで、受信したVCL NALユニットを受信バッファに格納する。
受信バッファ9.1が少なくともN個のVCL NALユニットを含めば、NALユニットは受信バッファ9.1から1つずつ取り出され、デコーダ2に移される。NALユニットは、それらが格納された順序と同じ順序で受信バッファ9.1から取り出されるとは限らないが、下記に説明するようにNALユニットのビデオシーケンスIDに従って取り出される。バッファがN個のVCL NALユニット未満すなわち(N−1)個のVCL NALユニットを含むまでデコーダ2へのパケットの供給は継続する。
図12では、デコーダのプリデコーダバッファにおける伝送ユニットのバッファリングの一例を表す。伝送ユニットが並ぶ順序が伝送順序(しかも、受信順序)を意味するが、数字は復号化順序を意味する。
以後、PVSIDは、デコーダに移された最後のNALユニットのビデオシーケンスID(VSID)であるとする。STAPのすべてのNALユニットは、同一のVSIDを共有する。NALユニットがデコーダに移される順序は次の通りに指定される。すなわち、バッファで最も古いRTPシーケンス番号が単純パケットに対応すれば、単純パケットのNALUは、NALユニット配信順序で次のNALUである。バッファで最も古いRTPシーケンス番号が集約パケットに対応すれば、次の単純パケット(これを含まない)までRTPシーケンス番号順序で集約パケットに運ばれたNALUの間でNALユニット配信順序が回復される。この一連のNALUは、以後、候補NALUと称する。単純パケットで運ばれたNALUのいずれもバッファ内に存在しなければ、すべてのNALUは候補NALUに属する。
候補NALUの各NALユニットに対して、VSID間隔は次の通りに計算される。NALユニットのVSIDがPVSIDよりも大きければ、VSID間隔は、VSID−PVSIDに等しい。そうでなければ、VSID間隔は、2^(VSIDを信号送信するのに用いられたビット数)−PVSID+VSIDに等しい。NALユニットはVSID間隔の昇順でデコーダに配信される。幾つかのNALユニットが同一のVSID間隔を共有すれば、これらをデコーダに移す順序は、この仕様に規定されたNALユニット配信順序に合致すべきである。下記に説明するようにNALユニット配信順序を回復することができる。
第1に、スライス及びデータパーティションは、フレーム番号、RTPタイムスタンプ及び第1フィールドフラグに従ってピクチャと関連付けられている。すなわち、同一値のフレーム番号、RTPタイムスタンプ及び第1フィールドフラグを共有するすべてのNALUは、同一のピクチャに属する。SEI NALU、シーケンスパラメータセットNALU、ピクチャパラメータセットNALU、ピクチャ区切りNALU、シーケンス終了NALU、ストリーム終了NALU及びフィラーデータNALUは、伝送順序で次のVCL NALユニットのピクチャに属する。
第2に、ピクチャの配信順序は、各ピクチャのnal_ref_idc、フレーム番号、第1フィールドフラグ及びRTPタイムスタンプに基づいて判断される。ピクチャの配信順序は、(モジュロ演算の)フレーム番号の昇順である。幾つかのピクチャが同一値のフレーム番号を共有すれば、0に等しいnal_ref_idcを有する(複数の)ピクチャは最初に配信される。幾つかのピクチャが同一値のフレーム番号を共有し、それらすべてが、0に等しいnal_ref_idcを有すれば、ピクチャは昇順のRTPタイムスタンプ順序に配信される。2つのピクチャが同一のRTPタイムスタンプを共有すれば、1に等しい第1フィールドフラグを有するピクチャは最初に配信される。留意すべきは、本明細書では、1次符号化ピクチャ及び対応の冗長符号化ピクチャが1つの符号化ピクチャと見なされるということである。
第3に、使用しているビデオデコーダが任意スライス順序をサポートしていなければ、スライス及びAデータパーティションの配信順序は、スライスヘッダのfirst_mb_in_slice構文要素の昇順である。更に、B及びCデータパーティションは、配信順序で対応のAデータパーティションのすぐ後に続く。
上記では、PVSID及びVSIDなる用語が用いられた。その代わりに、PDON(集約パケットのうちNALユニット配信順序で前のNALユニットの復号化順序番号)及びDON(復号化順序番号)なる用語を次の通りに用いることができる。デコーダに移される最初のNALユニットのPDONは0であるとする。NALユニットがデコーダに移される順序は次の通りに指定される。すなわち、バッファ内で最も古いRTPシーケンス番号が単純パケットに対応すれば、単純パケットのNALUは、NALユニット配信順序で次のNALUである。バッファ内で最も古いRTPシーケンス番号が集約パケットに対応すれば、次の単純パケット(これを含まない)までRTPシーケンス番号順に集約パケットで運ばれたNALU間でNALユニット配信順序が回復される。この一連のNALUを、以後、候補NALUと称する。単純パケットで運ばれたNALUのいずれもバッファ内に存在しなければ、すべてのNALUは候補NALUに属する。
候補NALUの各NALユニットに対して、DON間隔は次の通りに計算される。NALユニットのDONがPDONよりも大きければ、DON間隔は、DON−PDONに等しい。そうでなければ、DON間隔は、2^(符号なしの整数としてDON及びPDONを表すビット数)−PDON+DONに等しい。NALユニットはDON間隔の昇順にデコーダに配信される。
幾つかのNALユニットが同一のDON間隔を共有すれば、これらをデコーダに移す順序は、
1. ピクチャ区切りNALユニットがあるとすれば、ピクチャ区切りNALユニット
2. シーケンスパラメータセットNALユニットがあるとすれば、シーケンスパラメータセットNALユニット
3. ピクチャパラメータセットNALユニットがあるとすれば、ピクチャパラメータセットNALユニット
4. sEI NALUがあるとすれば、SEI NALU
5. 1次符号化ピクチャの符号化スライス及びスライスデータパーティションNALユニットがあるとすれば、1次符号化ピクチャの符号化スライス及びスライスデータパーティションNALユニット
6. 冗長符号化ピクチャの符号化スライス及びスライスデータパーティションNALユニットがあるとすれば、冗長符号化ピクチャの符号化スライス及びスライスデータパーティションNALユニット
7. フィラーデータNALユニットがあるとすれば、フィラーデータNALユニット
8. シーケンス終了NALユニットがあるとすれば、シーケンス終了NALユニット
9. ストリーム終了NALユニットがあるとすれば、ストリーム終了NALユニット
である。
使用しているビデオデコーダが任意スライス順序をサポートしていなければ、スライス及びAデータパーティションの配信順序は、スライスヘッダのfirst_mb_in_slice構文要素の昇順である。更に、B及びCデータパーティションは、配信順序で対応のAデータパーティションのすぐ後に続く。
動作可能なJVTデパケッタイザを実装するのに下記の追加のデパケット化ルールを用いることができる。すなわち、NALUはRTPシーケンス番号順でJVTデコーダに与えられる。集約パケットに運ばれるNALUはそれらの順序で集約パケットに与えられる。集約パケットのすべてのNALUは、次のRTPパケットが処理される前に処理される。
(例えば、ゲートウェイにおける)知的RTP受信機は、損失したDPAを識別することができる。損失したDPAが検出されれば、ゲートウェイは、DPB及びDPCを送信しないと決定することができる。その理由は、それら情報がJVTデコーダにとって意味のないものであるからである。このように、ネットワーク要素は、複雑なビットストリームを解析することなく、無駄なパケットを廃棄することによりネットワーク負荷を減少させることができる。
知的受信機は、0のNAL参照Idcを有するすべてのパケットを廃棄することができる。しかし、パケットが廃棄されれば、ユーザが不快な体験をするおそれがあるので、可能であれば、知的受信機はこれらパケットを処理しなければならない。
DPB2.1は、多くのピクチャを格納する記憶箇所を含む。本明細書では、これら箇所をフレームストアとも称する。デコーダ2は、受信したピクチャを正確な順序で復号化する。そうするため、デコーダは、受信したピクチャのビデオシーケンスID情報を検査する。エンコーダが各グループオブピクチャに対して自由にビデオシーケンスIDを選択していたら、デコーダはグループオブピクチャのピクチャを、それらが受信された順序で復号化する。エンコーダが、インクリメント(またはデクリメント)番号付け方式を用いることにより各グループオブピクチャに対してビデオシーケンスIDを規定していたら、デコーダはビデオシーケンスIDの順序でグループオブピクチャを復号化する。言い換えれば、最小(または最大)のビデオシーケンスIDを有するグループオブピクチャが最初に復号化される。
本発明を多くの種類のシステム及び装置に適用することができる。エンコーダ1を含み随意にHRD5を含むのが有利である伝送装置6は、符号化ピクチャを伝送チャネル4に伝送する送信機7をも含む。受信装置8は、符号化ピクチャを受信するための受信機9と、デコーダ2と、復号化ピクチャを表示できる表示装置10とを含む。伝送チャネルを、例えば、有線通信チャネル及び/または無線通信チャネルとすることができる。伝送装置及び受信装置は、本発明によるビデオストリームの符号化/復号化処理を制御する必要なステップを実行できる1つ以上のプロセッサ1.2,2.2をも含む。従って、本発明による方法を主にプロセッサのマシン実行可能ステップとして実装することができる。ピクチャのバッファリングを装置のメモリ1.3,2.3に実装することができる。エンコーダのプログラムコード1.4をメモリ1.3に格納することができる。また、デコーダのプログラムコード2.4をメモリ2.3に格納することができる。
仮想参照デコーダ5をエンコーダ1の後に位置付けすることができ、これによって、仮想参照デコーダ5が必要に応じて符号化ピクチャを再配置し、受信機8のプリデコーディングバッファがオーバフローしないことを保証できること明らかである。
仮想参照デコーダ5の一部とすることができ、または、仮想参照デコーダ5から分離することができるバッファリングベリファイアに本発明を実装することができる。

Claims (15)

  1. 符号化ピクチャをバッファリングする方法であって、符号化ピクチャをエンコーダにおいて形成する符号化ステップと、前記符号化ピクチャを伝送ユニットとしてデコーダに伝送する伝送ステップと、前記デコーダに伝送された伝送ユニットをバッファにバッファリングするバッファリングステップと、復号化ピクチャを形成するため、前記符号化ピクチャを復号化する復号化ステップとを含む方法において、少なくとも2つの伝送ユニットの合計サイズが規定され、前記合計サイズに基づいて最大バッファサイズが規定されるように、前記バッファのサイズが規定される方法。
  2. 前記合計サイズの計算に用いられる伝送ユニット数が、前記伝送ユニット数に関して必要なバッファサイズの分数である、請求項1に記載の方法。
  3. 前記合計サイズの計算に用いられる伝送ユニット数が、前記伝送ユニット数に関して必要なバッファサイズの分数であり、前記分数は1/Nの形態を持ち、ここで、Nは整数である、請求項1に記載の方法。
  4. 前記合計サイズの計算に用いられる伝送ユニット数が、前記伝送ユニット数に関して必要なバッファサイズと同じである、請求項1に記載の方法。
  5. 前記合計サイズの計算に用いられる伝送ユニット数が、前記伝送ユニットのバッファリング順序として表現される、請求項1に記載の方法。
  6. ピクチャを符号化するエンコーダと、前記符号化されたピクチャをVCL NALユニットとしてデコーダに伝送する送信機と、前記符号化されたピクチャを復号化して復号化ピクチャを形成するデコーダとを含むシステムであって、前記デコーダが、前記デコーダに伝送された伝送ユニットをバッファリングするバッファを含むシステムにおいて、少なくとも2つの伝送ユニットの合計サイズが規定され、前記合計サイズに基づいて最大バッファサイズが規定されるように、前記バッファのサイズを規定するデファイナを更に含むシステム。
  7. ピクチャを符号化するエンコーダであって、バッファにバッファリングし復号化するために、前記符号化されたピクチャを伝送ユニットとしてデコーダに伝送する送信機を含むエンコーダにおいて、少なくとも2つの伝送ユニットの合計サイズが規定され、前記合計サイズに基づいて最大バッファサイズが規定されるように、前記バッファのサイズを規定するデファイナを更に含むエンコーダ。
  8. 前記エンコーダが、前記符号化されたピクチャをバッファリングするバッファと、前記符号化されたピクチャを復号化するためのバッファリング要件を決定する仮想参照デコーダと含む、請求項7に記載のエンコーダ。
  9. 復号化ピクチャを形成するため符号化ピクチャを復号化するデコーダであって、復号化のために、受信した符号化ピクチャをバッファリングするプリデコーディングバッファを含むデコーダにおいて、前記デコーダが、バッファサイズを示す受信パラメータに従って前記プリデコーディングバッファのためにメモリを割り当てるプロセッサを更に含み、少なくとも2つの伝送ユニットの合計サイズが規定され、前記合計サイズに基づいて最大バッファサイズが規定されるように、前記バッファサイズが規定されるデコーダ。
  10. 符号化ピクチャをバッファリングする方法を実行するマシン実行可能ステップを含むソフトウェアプログラムであって、前記方法が、符号化ピクチャをエンコーダに形成する符号化ステップと、前記符号化ピクチャを伝送ユニットとしてデコーダに伝送する伝送ステップと、前記デコーダに伝送された伝送ユニットをバッファにバッファリングするバッファリングステップと、復号化ピクチャを形成するため、前記符号化ピクチャを復号化する復号化ステップとを含むソフトウェアプログラムにおいて、少なくとも2つの伝送ユニットの合計サイズが規定され、前記合計サイズに基づいて最大バッファサイズが規定されるように、前記バッファのサイズが規定されるソフトウェアプログラム。
  11. 符号化ピクチャをバッファリングする方法を実行するマシン実行可能ステップを含むソフトウェアプログラムを格納する記憶媒体であって、前記方法が、符号化ピクチャをエンコーダに形成する符号化ステップと、前記符号化ピクチャを伝送ユニットとしてデコーダに伝送する伝送ステップと、前記デコーダに伝送された伝送ユニットをバッファにバッファリングするバッファリングステップと、復号化ピクチャを形成するため、前記符号化ピクチャを復号化する復号化ステップとを含む記憶媒体において、少なくとも2つの伝送ユニットの合計サイズが規定され、前記合計サイズに基づいて最大バッファサイズが規定されるように、前記バッファのサイズが規定される記憶媒体。
  12. ピクチャを符号化するエンコーダと、バッファにバッファリングし復号化するために、前記符号化されたピクチャを伝送ユニットとしてデコーダに伝送する送信機とを含む電子装置において、少なくとも2つの伝送ユニットの合計サイズが規定され、前記合計サイズに基づいて最大バッファサイズが規定されるように、前記バッファのサイズを規定するデファイナを更に含む電子装置。
  13. 伝送ユニットとして符号化ピクチャを含む信号であって、前記符号化ピクチャを復号化するためのバッファリング要件が決定される信号において、少なくとも2つの伝送ユニットの合計サイズが規定され、前記合計サイズに基づいて最大バッファサイズが規定されるようにパラメータがバッファサイズを示し、前記パラメータが前記信号に添付される信号。
  14. ピクチャを符号化するエンコーダであって、バッファにバッファリングし復号化するために、前記符号化されたピクチャを伝送ユニットとしてデコーダに伝送する送信機を含むエンコーダを有する伝送装置において、少なくとも2つの伝送ユニットの合計サイズが規定され、前記合計サイズに基づいて最大バッファサイズが規定されるように、前記バッファのサイズを規定するデファイナを更に含む伝送装置。
  15. 復号化ピクチャを形成するため符号化ピクチャを復号化するデコーダであって、復号化のために、受信した符号化ピクチャをバッファリングするプリデコーディングバッファを含むデコーダを有する受信装置において、前記デコーダが、バッファサイズを示す受信パラメータに従って前記プリデコーディングバッファのためにメモリを割り当てるプロセッサを更に含み、少なくとも2つの伝送ユニットの合計サイズが規定され、前記合計サイズに基づいて最大バッファサイズが規定されるように、前記バッファサイズが規定される受信装置。
JP2011126245A 2004-02-13 2011-06-06 エンコーダ及びデコーダにおけるバッファのサイズ再設定 Pending JP2011199899A (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US54459804P 2004-02-13 2004-02-13
US60/544,598 2004-02-13

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP2006552649A Division JP5069006B2 (ja) 2004-02-13 2005-02-14 エンコーダ及びデコーダにおけるバッファのサイズ再設定

Publications (1)

Publication Number Publication Date
JP2011199899A true JP2011199899A (ja) 2011-10-06

Family

ID=34860508

Family Applications (2)

Application Number Title Priority Date Filing Date
JP2006552649A Active JP5069006B2 (ja) 2004-02-13 2005-02-14 エンコーダ及びデコーダにおけるバッファのサイズ再設定
JP2011126245A Pending JP2011199899A (ja) 2004-02-13 2011-06-06 エンコーダ及びデコーダにおけるバッファのサイズ再設定

Family Applications Before (1)

Application Number Title Priority Date Filing Date
JP2006552649A Active JP5069006B2 (ja) 2004-02-13 2005-02-14 エンコーダ及びデコーダにおけるバッファのサイズ再設定

Country Status (14)

Country Link
US (2) US20050201471A1 (ja)
EP (2) EP2760212A1 (ja)
JP (2) JP5069006B2 (ja)
KR (1) KR100837322B1 (ja)
CN (1) CN1934865B (ja)
AU (1) AU2005212896C1 (ja)
BR (1) BRPI0507925B1 (ja)
CA (1) CA2556120C (ja)
HK (1) HK1101847A1 (ja)
RU (1) RU2385541C2 (ja)
SG (1) SG153870A1 (ja)
TW (1) TWI396445B (ja)
WO (1) WO2005079070A1 (ja)
ZA (1) ZA200606634B (ja)

Families Citing this family (87)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
MY136056A (en) * 2003-02-18 2008-08-29 Nokia Corp Picture decoding method
EP1595405B1 (en) * 2003-02-18 2019-12-04 Nokia Technologies Oy Method and device for transmitting media data in nal units over rtp
US20050201471A1 (en) * 2004-02-13 2005-09-15 Nokia Corporation Picture decoding method
US7542435B2 (en) * 2004-05-12 2009-06-02 Nokia Corporation Buffer level signaling for rate adaptation in multimedia streaming
US20060002479A1 (en) * 2004-06-22 2006-01-05 Fernandes Felix C A Decoder for H.264/AVC video
RU2370909C2 (ru) 2004-07-01 2009-10-20 Квэлкомм Инкорпорейтед Способ и устройство для использования способов преобразования кадров с повышением частоты кадров при кодировании масштабируемого видео
KR101016168B1 (ko) 2004-07-20 2011-02-17 콸콤 인코포레이티드 비디오 압축에 대한 인코더 보조-프레임 레이트 업 컨버젼(ea-fruc)을 위한 방법 및 장치
US9124907B2 (en) * 2004-10-04 2015-09-01 Nokia Technologies Oy Picture buffering method
US20060080436A1 (en) * 2004-10-07 2006-04-13 Nokia Corporation System and method for multimedia streaming using interleaved packetization
MX2007012338A (es) * 2005-04-07 2007-11-23 Nokia Corp Almacenamiento temporal en la distribucion de corriente de datos.
EP1936996A3 (en) * 2005-04-28 2011-07-27 Apple Inc. Video processing in a multi-participant video conference
CN101268455B (zh) * 2005-08-10 2010-11-03 新加坡科技研究局 无线传输协议
US7933329B2 (en) * 2005-08-24 2011-04-26 Exfo Service Assurance Inc. System and method for monitoring video packets for quantifying video quality
KR20070038396A (ko) 2005-10-05 2007-04-10 엘지전자 주식회사 영상 신호의 인코딩 및 디코딩 방법
JP2009512306A (ja) * 2005-10-11 2009-03-19 ノキア コーポレイション スケーラブルビデオコーディングのためのデコードされたピクチャーの効率的なバッファマネージメント
US7716551B2 (en) * 2005-12-07 2010-05-11 Microsoft Corporation Feedback and frame synchronization between media encoders and decoders
BRPI0707457A2 (pt) * 2006-01-11 2011-05-03 Nokia Corp agregação compatìvel inversa de imagens em codificação de vìdeo redimensionável
US8767836B2 (en) * 2006-03-27 2014-07-01 Nokia Corporation Picture delimiter in scalable video coding
US7653055B2 (en) * 2006-03-31 2010-01-26 Alcatel-Lucent Usa Inc. Method and apparatus for improved multicast streaming in wireless networks
US8634463B2 (en) * 2006-04-04 2014-01-21 Qualcomm Incorporated Apparatus and method of enhanced frame interpolation in video compression
JP5248802B2 (ja) 2006-06-16 2013-07-31 カシオ計算機株式会社 動画符号化装置および動画符号化方法と、動画復号化装置および動画復号化方法と、動画記録装置
US20080056218A1 (en) * 2006-08-29 2008-03-06 Motorola, Inc. Method for transmitting multi-frame handover or assignment messages
KR100849495B1 (ko) * 2006-12-04 2008-07-31 한국전자통신연구원 Rtp 패킷화 모드별 비트율 생성 방법
ES2649757T3 (es) 2006-12-21 2018-01-15 Thomson Licensing Métodos y aparatos para señalización mejorada que utilizan sintaxis de alto nivel para la codificación y descodificación de vídeo de múltiples vistas
JP5535646B2 (ja) * 2007-01-05 2014-07-02 トムソン ライセンシング スケーラブル映像符号化用の仮想リファレンスデコーダ
WO2008087602A1 (en) * 2007-01-18 2008-07-24 Nokia Corporation Carriage of sei messages in rtp payload format
CN101669367A (zh) * 2007-03-02 2010-03-10 Lg电子株式会社 用于解码/编码视频信号的方法及设备
EP2135454A4 (en) * 2007-03-02 2010-09-01 Lg Electronics Inc METHOD AND DEVICE FOR DECODING / CODING A VIDEO SIGNAL
GB0705329D0 (en) 2007-03-20 2007-04-25 Skype Ltd Method of transmitting data in a communication system
US20100333152A1 (en) * 2007-03-29 2010-12-30 William Gibbens Redmann Method and apparatus for content distribution to and playout with a digital cinema system
US8488677B2 (en) * 2007-04-25 2013-07-16 Lg Electronics Inc. Method and an apparatus for decoding/encoding a video signal
US20080294446A1 (en) * 2007-05-22 2008-11-27 Linfeng Guo Layer based scalable multimedia datastream compression
US8938009B2 (en) * 2007-10-12 2015-01-20 Qualcomm Incorporated Layered encoded bitstream structure
BRPI0818444A2 (pt) * 2007-10-12 2016-10-11 Qualcomm Inc codificação adaptativa de informação de cabeçalho de bloco de vídeo
FR2923124A1 (fr) 2007-10-26 2009-05-01 Canon Kk Procede et dispositif de determination de la valeur d'un delai a appliquer entre l'envoi d'un premier ensemble de donnees et l'envoi d'un second ensemble de donnees
KR100951008B1 (ko) * 2007-12-17 2010-04-02 한국전자통신연구원 인터레이스 부호화에서의 실시간 비트율 제어 방법 및시스템
JP4577357B2 (ja) * 2007-12-27 2010-11-10 ソニー株式会社 符号化装置及び方法、並びにプログラム
US20090171970A1 (en) * 2007-12-31 2009-07-02 Keefe Robert A System and Method for Delivering Utility Usage Information and Other Content to a Digital Photo Frame
US8345774B2 (en) * 2008-01-11 2013-01-01 Apple Inc. Hypothetical reference decoder
US8369415B2 (en) * 2008-03-06 2013-02-05 General Instrument Corporation Method and apparatus for decoding an enhanced video stream
US9167246B2 (en) 2008-03-06 2015-10-20 Arris Technology, Inc. Method and apparatus for decoding an enhanced video stream
JP5098784B2 (ja) * 2008-04-30 2012-12-12 サクサ株式会社 映像通信装置
WO2010032636A1 (ja) * 2008-09-17 2010-03-25 シャープ株式会社 スケーラブルビデオストリーム復号装置およびスケーラブルビデオストリーム生成装置
US8649426B2 (en) * 2008-09-18 2014-02-11 Magor Communications Corporation Low latency high resolution video encoding
JP2010166387A (ja) * 2009-01-16 2010-07-29 Panasonic Corp バッファ制御装置及び無線通信端末
US8782267B2 (en) 2009-05-29 2014-07-15 Comcast Cable Communications, Llc Methods, systems, devices, and computer-readable media for delivering additional content using a multicast streaming
US9729939B2 (en) * 2009-09-14 2017-08-08 Thomson Licensing Distribution of MPEG-2 TS multiplexed multimedia stream with selection of elementary packets of the stream
TW201121331A (en) * 2009-12-10 2011-06-16 Novatek Microelectronics Corp Picture decoder
JP5482178B2 (ja) * 2009-12-16 2014-04-23 ソニー株式会社 送信装置および方法、並びに、受信装置および方法
KR20110106160A (ko) * 2010-03-22 2011-09-28 (주)인터큐비트 다중 디스플레이를 이용한 초고해상도 영상 재생 시스템
CN106162178B (zh) * 2010-04-13 2019-08-13 三星电子株式会社 执行去块滤波的对视频进行解码的设备
JP5837920B2 (ja) 2010-04-30 2015-12-24 ナウ テクノロジーズ (アイピー) リミティッド コンテンツアイテムのチャートを提供する装置、方法、製品及び移動装置が実行する方法
US8930277B2 (en) * 2010-04-30 2015-01-06 Now Technologies (Ip) Limited Content management apparatus
WO2011138900A1 (ja) 2010-05-06 2011-11-10 日本電信電話株式会社 映像符号化制御方法および装置
CA2798012A1 (en) * 2010-05-07 2011-11-10 Nippon Telegraph And Telephone Corporation Video encoding to prevent decoder buffer underflow by re-encoding selected pictures in a video sequence using a retry count or a retry point
KR101391661B1 (ko) 2010-05-12 2014-05-07 니폰덴신뎅와 가부시키가이샤 동화상 부호화 제어 방법, 동화상 부호화 장치 및 동화상 부호화 프로그램
US9549197B2 (en) * 2010-08-16 2017-01-17 Dolby Laboratories Licensing Corporation Visual dynamic range timestamp to enhance data coherency and potential of metadata using delay information
CN103416056A (zh) * 2011-03-10 2013-11-27 维德约股份有限公司 视频编码中的参数集维持
KR20120138604A (ko) * 2011-06-14 2012-12-26 삼성전자주식회사 멀티미디어 시스템에서 복합 미디어 컨텐츠를 송수신하는 방법 및 장치
EP2745477B1 (en) * 2011-08-18 2016-04-27 VID SCALE, Inc. Methods and systems for packet differentiation
US9237356B2 (en) 2011-09-23 2016-01-12 Qualcomm Incorporated Reference picture list construction for video coding
US8768079B2 (en) 2011-10-13 2014-07-01 Sharp Laboratories Of America, Inc. Tracking a reference picture on an electronic device
US8855433B2 (en) * 2011-10-13 2014-10-07 Sharp Kabushiki Kaisha Tracking a reference picture based on a designated picture on an electronic device
KR20130040090A (ko) * 2011-10-13 2013-04-23 삼성전자주식회사 복합 네트워크에서 멀티미디어 데이터를 전송하기 위한 장치 및 그 방법
US8787688B2 (en) * 2011-10-13 2014-07-22 Sharp Laboratories Of America, Inc. Tracking a reference picture based on a designated picture on an electronic device
GB2495927B (en) 2011-10-25 2015-07-15 Skype Jitter buffer
CN102378067B (zh) * 2011-11-21 2013-10-02 武汉大学 一种鲁棒性的移动视频解码方法
KR20130058584A (ko) 2011-11-25 2013-06-04 삼성전자주식회사 복호화기의 버퍼 관리를 위한 영상 부호화 방법 및 장치, 그 영상 복호화 방법 및 장치
RU2627109C2 (ru) * 2012-04-23 2017-08-03 Сан Пэтент Траст Способ кодирования, способ декодирования, устройство кодирования, устройство декодирования и устройство кодирования и декодирования
MY171975A (en) 2012-06-29 2019-11-09 Velos Media Int Ltd Decoding device and decoding method
US9654802B2 (en) * 2012-09-24 2017-05-16 Qualcomm Incorporated Sequence level flag for sub-picture level coded picture buffer parameters
US9479782B2 (en) 2012-09-28 2016-10-25 Qualcomm Incorporated Supplemental enhancement information message coding
US9661341B2 (en) 2013-01-07 2017-05-23 Microsoft Technology Licensing, Llc Syntax and semantics for buffering information to simplify video splicing
US9516330B2 (en) * 2013-02-06 2016-12-06 Broadcom Corporation Virtual field buffer based decoding
US9641834B2 (en) * 2013-03-29 2017-05-02 Qualcomm Incorporated RTP payload format designs
US9591321B2 (en) 2013-04-07 2017-03-07 Dolby International Ab Signaling change in output layer sets
CN109729364A (zh) 2013-04-07 2019-05-07 杜比国际公司 用信号通知输出层集的改变
US20150039714A1 (en) * 2013-07-30 2015-02-05 Opera Software Asa Multimedia cache with dynamic segmenting
WO2015014403A1 (en) * 2013-08-01 2015-02-05 Telefonaktiebolaget L M Ericsson (Publ) Method and apparatus for controlling streaming of video content
CN104754358B (zh) * 2013-12-27 2019-02-19 中兴通讯股份有限公司 码流的生成和处理方法、装置及***
CN104754341B (zh) * 2013-12-31 2019-02-26 华为技术有限公司 一种视频数据编码、解码的方法和装置
US10136145B2 (en) 2014-01-03 2018-11-20 Samsung Electronics Co., Ltd. Method and apparatus for managing buffer for encoding and decoding multi-layer video
US10887651B2 (en) * 2014-03-31 2021-01-05 Samsung Electronics Co., Ltd. Signaling and operation of an MMTP de-capsulation buffer
RU2630388C1 (ru) * 2014-04-25 2017-09-07 Сони Корпорейшн Устройство передачи, способ передачи, устройство приема и способ приема
EP2960864B1 (en) * 2014-06-23 2018-12-05 Harman Becker Automotive Systems GmbH Device and method for processing a stream of video data
US10283091B2 (en) * 2014-10-13 2019-05-07 Microsoft Technology Licensing, Llc Buffer optimization
CN108200481B (zh) * 2017-12-07 2020-12-15 北京佳讯飞鸿电气股份有限公司 一种rtp-ps流处理方法、装置、设备及存储介质

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007522749A (ja) * 2004-02-13 2007-08-09 ノキア コーポレイション エンコーダ及びデコーダにおけるバッファのサイズ再設定

Family Cites Families (72)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5122875A (en) * 1991-02-27 1992-06-16 General Electric Company An HDTV compression system
US5387941A (en) * 1991-06-14 1995-02-07 Wavephore, Inc. Data with video transmitter
US5467173A (en) 1993-02-05 1995-11-14 Konica Corporation Speed control circuit for an optical scanning system driving motor for an image forming apparatus
US5481543A (en) * 1993-03-16 1996-01-02 Sony Corporation Rational input buffer arrangements for auxiliary information in video and audio signal processing systems
US5481643A (en) * 1993-03-18 1996-01-02 U.S. Philips Corporation Transmitter, receiver and record carrier for transmitting/receiving at least a first and a second signal component
US5486864A (en) 1993-05-13 1996-01-23 Rca Thomson Licensing Corporation Differential time code method and apparatus as for a compressed video signal
US5398072A (en) * 1993-10-25 1995-03-14 Lsi Logic Corporation Management of channel buffer in video decoders
GB2287383A (en) 1994-03-11 1995-09-13 Motorola Ltd Notification by energy burst of messages with unacceptable quality
JPH0865665A (ja) * 1994-08-25 1996-03-08 Hitachi Denshi Ltd 画像圧縮伝送方法および画像圧縮伝送システム
WO1996020575A2 (en) 1994-12-28 1996-07-04 Philips Electronics N.V. Buffer management in variable bit-rate compression systems
US5517250A (en) 1995-02-28 1996-05-14 General Instrument Corporation Of Delaware Acquisition of desired data from a packetized data stream and synchronization thereto
US5677905A (en) * 1995-03-28 1997-10-14 Bell Atlantic Network Services, Inc. Access subnetwork controller for video dial tone networks
US5877812A (en) * 1995-11-21 1999-03-02 Imedia Corporation Method and apparatus for increasing channel utilization for digital video transmission
US5719632A (en) * 1996-01-25 1998-02-17 Ibm Corporation Motion video compression system with buffer empty/fill look-ahead bit allocation
CA2243359A1 (en) 1996-01-31 1997-08-07 Ipsilon Networks, Inc. Improved method and apparatus for dynamically shifting between routing and switching packets in a transmission network
US5892924A (en) 1996-01-31 1999-04-06 Ipsilon Networks, Inc. Method and apparatus for dynamically shifting between routing and switching packets in a transmission network
JP3493872B2 (ja) * 1996-02-29 2004-02-03 ソニー株式会社 画像データ処理方法およびその装置
TW351903B (en) 1996-07-03 1999-02-01 Matsushita Electric Ind Co Ltd Encoding method, encoding apparatus, decoding and compositing method, decoding and composition appratus, and record medium recorded with the aforesaid methods for multiple images
US6188700B1 (en) * 1996-11-07 2001-02-13 Sony Corporation Method and apparatus for encoding MPEG signals using variable rate encoding and dynamically varying transmission buffers
CN100484228C (zh) 1996-12-04 2009-04-29 松下电器产业株式会社 光盘再现设备
US6011590A (en) * 1997-01-03 2000-01-04 Ncr Corporation Method of transmitting compressed information to minimize buffer space
IL121815A (en) 1997-09-22 2000-09-28 Security 7 Software Ltd Method and system for the identification and the suppression of executable objects
KR100248080B1 (ko) 1997-10-06 2000-03-15 정선종 다자간 멀티미디어 통신에서의 에러제어 방법
JP4938171B2 (ja) 1997-10-09 2012-05-23 クゥアルコム・インコーポレイテッド 多元接続通信システムでのアイドルハンドオフを行う方法及び装置
US7301944B1 (en) 1997-10-24 2007-11-27 Tranz-Send Broadcasting Network, Inc. Media file distribution with adaptive transmission protocols
CN1156164C (zh) 1997-11-27 2004-06-30 英国电讯有限公司 代码转换器及其方法
US6023233A (en) * 1998-03-20 2000-02-08 Craven; Peter G. Data rate control for variable rate compression systems
US6289129B1 (en) 1998-06-19 2001-09-11 Motorola, Inc. Video rate buffer for use with push dataflow
US6526022B1 (en) 1998-06-30 2003-02-25 Sun Microsystems Detecting congestion by comparing successive loss of packets in windows to provide congestion control in reliable multicast protocol
US6573942B1 (en) 1998-08-17 2003-06-03 Sharp Laboratories Of America, Inc. Buffer system for controlled and timely delivery of MPEG-2F data services
JP3552929B2 (ja) * 1998-11-27 2004-08-11 松下電器産業株式会社 復号化装置及び復号化方法
US6496980B1 (en) 1998-12-07 2002-12-17 Intel Corporation Method of providing replay on demand for streaming digital multimedia
JP2000232649A (ja) * 1998-12-10 2000-08-22 Fujitsu Ltd Mpegビデオ復号器及びmpegビデオ復号方法
EP1069777A4 (en) 1999-02-05 2009-03-04 Sony Corp SYSTEMS AND METHODS FOR ENCODING AND DECODING, MULTIPLEXING SYSTEM AND METHOD, AND DISPLAY SYSTEM AND METHOD
US6782490B2 (en) 1999-03-17 2004-08-24 At&T Corp. Network-based service for the repair of IP multicast sessions
US6269080B1 (en) 1999-04-13 2001-07-31 Glenayre Electronics, Inc. Method of multicast file distribution and synchronization
FI113124B (fi) 1999-04-29 2004-02-27 Nokia Corp Tiedonsiirto
FR2795272B1 (fr) 1999-06-18 2001-07-20 Thomson Multimedia Sa Procede de commutation de flux mpeg
JP3587092B2 (ja) 1999-07-30 2004-11-10 松下電工株式会社 応答分散式通信方法および通信システム
KR100335057B1 (ko) * 2000-03-08 2002-05-02 구자홍 동영상 수신 장치
US6697426B1 (en) * 2000-03-17 2004-02-24 Koninklijke Philips Electronics N.V. Reduction of layer-decoding complexity by reordering the transmission of enhancement layer frames
JP3535496B2 (ja) 2000-04-06 2004-06-07 株式会社エヌ・ティ・ティ・ドコモ マルチキャスト伝送方法及びマルチキャスト伝送システム、並びに移動局及び基地局
JP3683468B2 (ja) 2000-04-13 2005-08-17 株式会社エヌ・ティ・ティ・ドコモ マルチキャストサービス提供システムにおける再送制御方法、情報配信装置及び無線端末
US6493388B1 (en) * 2000-04-19 2002-12-10 General Instrument Corporation Rate control and buffer protection for variable bit rate video programs over a constant rate channel
JP2002010216A (ja) * 2000-04-20 2002-01-11 Canon Inc 復号化装置及びその制御方法並びに記憶媒体
JP4407007B2 (ja) * 2000-05-02 2010-02-03 ソニー株式会社 データ送信装置及び方法
US7016970B2 (en) * 2000-07-06 2006-03-21 Matsushita Electric Industrial Co., Ltd. System for transmitting stream data from server to client based on buffer and transmission capacities and delay time of the client
JP3594296B2 (ja) 2000-07-24 2004-11-24 松下電器産業株式会社 動画像符号化データの送信装置および送信方法
FI120125B (fi) * 2000-08-21 2009-06-30 Nokia Corp Kuvankoodaus
WO2002037763A1 (fr) 2000-11-06 2002-05-10 Matsushita Electric Industrial Co., Ltd. Emetteur, recepteur, et procede de distribution de donnees radiodiffusees
FI118830B (fi) * 2001-02-08 2008-03-31 Nokia Corp Tietovirran toisto
JP2002330379A (ja) 2001-05-02 2002-11-15 Sony Corp コンテンツ提供装置
JP2002359641A (ja) 2001-05-31 2002-12-13 Matsushita Electric Ind Co Ltd ファイル配信システム、ファイル配信サーバ装置、及び受信クライアント装置
JP4556351B2 (ja) 2001-06-19 2010-10-06 ソニー株式会社 マルチキャスト通信方法およびシステム
US20030031175A1 (en) 2001-08-01 2003-02-13 Masato Hayashi Method of multicasting
US8923688B2 (en) 2001-09-12 2014-12-30 Broadcom Corporation Performing personal video recording (PVR) functions on digital video streams
US7356079B2 (en) * 2001-11-21 2008-04-08 Vixs Systems Inc. Method and system for rate control during video transcoding
JP2003209576A (ja) 2002-01-15 2003-07-25 Matsushita Electric Ind Co Ltd マルチキャスト通信方法及びそのシステム
FI114527B (fi) * 2002-01-23 2004-10-29 Nokia Corp Kuvakehysten ryhmittely videokoodauksessa
WO2004019530A1 (en) * 2002-02-15 2004-03-04 Visible World, Inc. System and method for seamless switching through buffering
US7831990B2 (en) * 2002-04-29 2010-11-09 Sony Corporation Generic adaptation layer for JVT video
EP1516449B1 (en) 2002-06-21 2016-06-22 BRITISH TELECOMMUNICATIONS public limited company Timer-based feedback in multicast communication
WO2004006446A2 (en) * 2002-07-02 2004-01-15 Conexant Systems, Inc. Hypothetical reference decoder for compressed image and video
EP1379085A1 (en) 2002-07-04 2004-01-07 Deutsche Thomson-Brandt Gmbh Method and device for linking multimedia data
US20040039796A1 (en) * 2002-08-08 2004-02-26 Virtual Radio, Inc. Personalized cyber disk jockey and Internet radio advertising
US7289500B1 (en) 2003-07-17 2007-10-30 Novell, Inc. Method and system for reliable multicast data transmission
EP1595405B1 (en) * 2003-02-18 2019-12-04 Nokia Technologies Oy Method and device for transmitting media data in nal units over rtp
MY136056A (en) 2003-02-18 2008-08-29 Nokia Corp Picture decoding method
US6873786B2 (en) * 2003-05-05 2005-03-29 Thomson Licensing S.A. Reverse trick modes on non-progressive video using special groups of pictures
US7415069B2 (en) * 2003-12-09 2008-08-19 Lsi Corporation Method for activation and deactivation of infrequently changing sequence and picture parameter sets
US7296205B2 (en) 2004-02-18 2007-11-13 Nokia Corporation Data repair
US9124907B2 (en) 2004-10-04 2015-09-01 Nokia Technologies Oy Picture buffering method

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007522749A (ja) * 2004-02-13 2007-08-09 ノキア コーポレイション エンコーダ及びデコーダにおけるバッファのサイズ再設定

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
JPN7009005147; Wegner,S.,Hannuksela,M.,Stockhammer,T., Westerlund,M., and Singer,D.: 'RTP payload Format for H.264 Video' Internet Draft draft-ietf-avt-rtp-h264-04.txt , 20040210 *

Also Published As

Publication number Publication date
AU2005212896C1 (en) 2013-11-14
BRPI0507925A8 (pt) 2016-04-05
CA2556120A1 (en) 2005-08-25
WO2005079070A1 (en) 2005-08-25
HK1101847A1 (en) 2007-10-26
CN1934865A (zh) 2007-03-21
RU2385541C2 (ru) 2010-03-27
EP2760212A1 (en) 2014-07-30
EP1714490A1 (en) 2006-10-25
JP5069006B2 (ja) 2012-11-07
BRPI0507925A (pt) 2007-07-17
KR20060116245A (ko) 2006-11-14
KR100837322B1 (ko) 2008-06-12
RU2006128854A (ru) 2008-03-20
CA2556120C (en) 2012-05-08
US20110019747A1 (en) 2011-01-27
BRPI0507925B1 (pt) 2018-11-13
TWI396445B (zh) 2013-05-11
TW200531555A (en) 2005-09-16
CN1934865B (zh) 2013-07-10
AU2005212896B2 (en) 2010-01-28
US20050201471A1 (en) 2005-09-15
SG153870A1 (en) 2009-07-29
ZA200606634B (en) 2007-11-28
EP1714490B1 (en) 2014-06-04
US8335265B2 (en) 2012-12-18
JP2007522749A (ja) 2007-08-09
AU2005212896A1 (en) 2005-08-25

Similar Documents

Publication Publication Date Title
JP5069006B2 (ja) エンコーダ及びデコーダにおけるバッファのサイズ再設定
JP5341629B2 (ja) ピクチャ復号化方法
JP5068947B2 (ja) ピクチャの符号化方法
US7403660B2 (en) Encoding picture arrangement parameter in picture bitstream
US9124907B2 (en) Picture buffering method
US20040218669A1 (en) Picture coding method
MXPA06009109A (en) Resizing of buffer in encoder and decoder

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A132

Effective date: 20120710

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20121204