JP2006505024A - データ処理方法及び装置 - Google Patents

データ処理方法及び装置 Download PDF

Info

Publication number
JP2006505024A
JP2006505024A JP2004505908A JP2004505908A JP2006505024A JP 2006505024 A JP2006505024 A JP 2006505024A JP 2004505908 A JP2004505908 A JP 2004505908A JP 2004505908 A JP2004505908 A JP 2004505908A JP 2006505024 A JP2006505024 A JP 2006505024A
Authority
JP
Japan
Prior art keywords
sample
data
metadata
multimedia data
data processing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Abandoned
Application number
JP2004505908A
Other languages
English (en)
Inventor
ヴィシャラム、モハメド、ズバイル
タバタバイ、アリ
ウォーカー、トビー
Original Assignee
ソニー エレクトロニクス インク
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from US10/371,464 external-priority patent/US20030163477A1/en
Priority claimed from US10/425,685 external-priority patent/US20040006575A1/en
Application filed by ソニー エレクトロニクス インク filed Critical ソニー エレクトロニクス インク
Publication of JP2006505024A publication Critical patent/JP2006505024A/ja
Abandoned legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/80Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
    • H04N21/83Generation or processing of protective or descriptive data associated with content; Content structuring
    • H04N21/845Structuring of content, e.g. decomposing content into time segments
    • H04N21/8451Structuring of content, e.g. decomposing content into time segments using Advanced Video Coding [AVC]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N7/00Television systems
    • H04N7/08Systems for the simultaneous or sequential transmission of more than one television signal, e.g. additional information signals, the signals occupying wholly or partially the same frequency band, e.g. by time division
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/46Embedding additional information in the video signal during the compression process
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/234Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs
    • H04N21/23424Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs involving splicing one content stream with another content stream, e.g. for inserting or substituting an advertisement
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/235Processing of additional data, e.g. scrambling of additional data or processing content descriptors
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/435Processing of additional data, e.g. decrypting of additional data, reconstructing software from modules extracted from the transport stream
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/44Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs
    • H04N21/44016Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs involving splicing one content stream with another content stream, e.g. for substituting a video clip
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/45Management operations performed by the client for facilitating the reception of or the interaction with the content or administrating data related to the end-user or to the client device itself, e.g. learning user preferences for recommending movies, resolving scheduling conflicts
    • H04N21/462Content or additional data management, e.g. creating a master electronic program guide from data received from the Internet and a Head-end, controlling the complexity of a video stream by scaling the resolution or bit-rate based on the client capabilities
    • H04N21/4621Controlling the complexity of the content stream or additional data, e.g. lowering the resolution or bit-rate of the video stream for a mobile client with a small screen
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/80Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
    • H04N21/83Generation or processing of protective or descriptive data associated with content; Content structuring
    • H04N21/84Generation or processing of descriptive data, e.g. content descriptors
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/80Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
    • H04N21/85Assembly of content; Generation of multimedia applications
    • H04N21/854Content authoring
    • H04N21/85406Content authoring involving a specific file format, e.g. MP4 format

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Databases & Information Systems (AREA)
  • Computer Security & Cryptography (AREA)
  • Business, Economics & Management (AREA)
  • Marketing (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

マルチメディアデータに関係する1つ以上の記述が特定され(図1)、マルチメディアデータに関連付けられる補足的拡張情報(SEI)に含められる(図24)。記述を含むSEIは、後に、復号システムに送信され、マルチメディアデータの復号処理において、任意に使用される(図2)。

Description

関連出願
この出願は、2002年4月29日に出願された米国特許仮出願番号60/376,651号及び2002年4月29日に出願された米国特許仮出願番号60/376,652号に関連し、これらに対する優先権を主張する。これらの文献は、引用により本願に援用される。更に、この出願は、2003年2月21日に出願された米国特許出願番号10/371.464号に関連する。
本発明は、マルチメディアファイル形式のオーディオビジュアルコンテンツのストレージ及び検索に関し、詳しくは、ISOメディアファイル形式と互換性があるファイルフォーマットに関する。
著作権表示/許諾
この明細書の開示内容の一部は、著作権保護の対象となるマテリアルを含む。著作権所有者は、この明細書が特許商標庁への特許出願であると認められる複製に対しては異議を唱えないが、この他のあらゆる全ての著作権を主張する。以下の表示は、後述するソフトウェア及びデータ、並びに添付の図面に適用される。:著作権(c)2003:全ての著作権はソニーエレクトロニクスインク社に帰属する(Copyright (c) 2003, Sony Electronics, Inc., All Rights Reserved)。
ネットワーク、マルチメディア、データベース及び他のデジタル容量に対する要求が急速に高まり、多くのマルチメディア符号化及びストレージ法が開発されている。オーディオビジュアルのデータを符号化して、保存するためのよく知られているファイル形式の1つとして、アップルコンピーター社によって開発されたクイックタイムファイルフォーマットがある。クイックタイムファイルフォーマットは、国際標準化機構(International Organization for Standardization:以下、ISOという。)マルチメディアファイル形式ISO/IEC14496−12オーディオビジュアルオブジェクトの情報技術符号化−パート12(Multimedia file format, ISO/IEC 14496-12, Information Technology-Coding of audio-visual objects-Part 12)の基礎技術として用いられた。ISOメディアファイルフォーマット(ISOファイルフォーマットとも呼ばれる。)は、次のような2つの標準ファイルフォーマットのためのテンプレートとして用いられる。(1)モーションピクチャエキスパートグループ(MPEG)によって開発されたMP4と呼ばれる(ISO/IEC14496−14、情報技術、オーディオビジュアルオブジェクトの符号化、パート14(ISO/IEC 14496-14, Information Technology--Coding of audio-visual objects--Part 14):MP4ファイルフォーマット)MPEG−4ファイルフォーマット。(2)ジョイントフォトグラフィックエキスパートグループ(JPEG)によって開発されたJPEG2000(ISO/IEC15444−1)のためのファイルフォーマット。
ISOメディアファイルフォーマットはボックス(アトム又はオブジェクトとも呼ばれる。)と呼ばれるオブジェクト指向構造によって構成される。2つの重要なトップレベルのボックスは、メディアデータ又はメタデータを含んでいる。ほとんどのボックスは、実際のメディアデータに関する、叙述的情報、構造的情報及び時間的情報を提供するメタデータの階層を記述する。このボックスのコレクションは、ムービーボックスとして知られているボックスに含まれている。メディアデータ自体は、メディアデータボックス内に含まれていてもよく、外部に存在してもよい。特定のメディアデータに関して情報を提供するメタデータボックスの集団的な階層は、トラックと呼ばれる。
主のメタデータは、ムービーオブジェクトである。ムービーボックスは、時間的に表現されたメディアデータを記述するトラックボックスを含んでいる。トラックのためのメディアデータには、様々な種類(例えば、ビデオデータ、オーディオデータ、バイナリ形式スクリーン表示(format screen representations:BIFS)等)がある。各トラックは更にサンプル(アクセスユニット又はピクチャとも呼ばれる。)に分割される。サンプルは、特定の時刻におけるメディアデータのユニットを表している。サンプルメタデータは、一組のサンプルボックスに含まれている。各トラックボックスは、各サンプルのための時間、バイトで表現される等を提供するボックスを含むサンプルテーブルボックスメタデータボックスを含んでいる。サンプルは、タイミング、位置及び他のメタデータ情報を表すことができる最も小さいデータ構成要素である。サンプルは、連続したサンプルの組を含むチャンクにグループ化できる。各チャンクは、それぞれ異なるサイズを有していてもよく、異なるサイズのサンプルを含んでいてもよい。
近年、MPEGの国際電気通信連合(ITU)のビデオグループと画像符号化エキスパートグループ(VCEG)とは、ジョイントビデオチームとして(JVT)、ITU勧告H.264又はMPEG4パート10、高度動画像符号化/復号標準(Advanced Video Codec:以下、AVCという。)又はJVTコーデックと呼ばれる新しい画像符号化/復号(コーデック)標準を開発するために共同標準化作業を始めた。これらの用語及びH.264や、JVTや、AVC等の略語は、ここでは交換可能に用いる。
JVTコーデック設計では、画像符号化レイヤ(VCL)とネットワーク抽象化レイヤ(NAL)の2つの異なる概念的なレイヤを区別する。VCLは、動き補償や、係数の変換符号化や、エントロピ符号化等の符号化に関連するコーデックの部分を含んでいる。VCLの出力はスライスであり、各スライスは、一連のマクロブロックと、関連するヘッダ情報とを含んでいる。NALは、VCLデータを伝送するために用いられたトランスポートレイヤの詳細からVCLを抜き取る。VCLは、スライスより高いレベルの情報について、包括的な、伝送から独立した表現を定義する。NALは、ビデオコーデック自体と、外部世界とのインタフェースを定義する。内部的には、NALは、NALパケットを用いる。NALパケットは、ペイロードのタイプを示すタイプフィールドと、ペイロード内のビットセットとを含んでいる。単一のスライス内のデータは、更に異なるデータ部分に分割できる。
多くの既存のビデオ符号化形式では、符号化されたストリームデータは、復号処理を制御するパラメータを含む様々な種類のヘッダを含んでいる。例えば、MPEG−2ビデオ規格は、シーケンスヘッダ、拡張されたグループオブピクチャ(group of pictures:以下、GOPという。)及びピクチャヘッダを、それらのアイテムに対応するビデオデータの前に設けている。JVTでは、VCLデータを復号するために必要な情報は、パラメータセットにグループ化される。各パラメータセットには、後にスライスからの参照情報として用いられる識別子が与えられている。パラメータセットは、ストリーム内(帯域内)で送信する代わりに、ストリーム外(帯域外)で送信してもよい。
既存のファイルフォーマットは、符号化されたメディアデータに関連しているパラメータセットを保存する機能を有しておらず、また、パラメータセットを効率的に検索して、伝送できるように、効率的にメディアデータ(すなわち、サンプル又はサブサンプル)をパラメータセットにリンクするための機能も有していない。
ISOメディアファイルフォーマットにおいては、構文解析メディアデータを用いることなくアクセスできる最小単位は、サンプル、すなわちAVC全体である。多くの符号化フォーマットでは、サンプルは、更にサブサンプル(サンプルフラグメント又はアクセスユニットフラグメントとも呼ばれる。)と呼ばれるより小さい単位に分割できる。AVCでは、サブサンプルは、スライスに対応している。しかしながら、既存のファイルフォーマットは、サンプルのサブパーツへのアクセスをサポートしていない。ファイルに保存されたデータに基づき、ストリーミングのためのパケットを柔軟に生成する必要があるシステムでは、サブサンプルにアクセスできないと、ストリーミングのためのJVTメディアデータを柔軟にパケット化することができない。
既存のストレージフォーマットでは、メディアデータをストリーミングする際のネットワーク状態の変化に応じて、異なる帯域幅で保存されたストリーム間を切り換えることに関する制約がある。典型的なストリーミングのシナリオにおける主要な要求の1つは、ネットワーク状態の変化に応じて圧縮データのビット伝送速度をスケーリングすることである。これは、通常、異なる帯域幅及び代表的なネットワーク状態のための品質設定を有する複数のストリームを符号化し、1つ以上のファイルにこれらを保存することによって実現される。サーバは、ネットワーク状態に応じて、予め符号化されたこれらのストリームを切り換えることができる。既存のファイルフォーマットでは、ストリームの切換は、先行するサンプルに依存することなくサンプルを再構築できる場合にのみ可能である。このようなサンプルは、Iフレームと呼ばれる。現在、先のサンプルに依存して再構築されるサンプル(すなわち、複数のサンプルを参照して再構築されるPフレーム又はBフレーム)の場合、ストリームの切換はサポートされていない。
AVC規格は、ストリーム間の効率的な切換、ランダムアクセスと、エラー回復、及びこの他の特徴を提供する切換ピクチャ(switching picture)と呼ばれるツールを提供する(SIピクチャ及びSPピクチャと呼ばれる)。切換ピクチャは、再構築される値が切り換えようとしているピクチャと正確に等しい特別な種類のピクチャである。切換ピクチャは、対応するピクチャを予測するために用いられた参照ピクチャとは異なる参照ピクチャを用いることができ、この結果、I−フレームを用いるより効率的に符号化を行うことができる。ファイルに保存された切換ピクチャを効率的に利用するためには、どのセットのピクチャが同等であるか及びどのピクチャが予測に用いられるかを知る必要がある。既存のファイルフォーマットでは、この情報は提供されず、したがって、この情報は、符号化されたを解析することによって、抽出する必要がある(このような処理は非効率的で時間がかかる)。
したがって、新しいビデオコード化規格によって提供される新しい能力に対応し、既存のストレージ方法における制約をなくすようにストレージ方法を改善することが望まれる。
マルチメディアデータに関係する1つ以上の記述が特定され、マルチメディアデータに関連付けられる補足的拡張情報(supplemental enhancement information:SEI)に含められる。記述を含むSEIは、後に、復号システムに送信され、マルチメディアデータの復号処理において、任意に使用される。
以下、添付の図面を用いて、本発明の実施例を詳細に説明する。添付の図面においては、類似する要素には、類似する参照符号を付す。添付の図面は、本発明を実現する特定の実施例を例示的に示している。これらの実施例については、当業者が本発明を実施することができるよう、詳細に説明するが、この他の実施例も可能であり、本発明の範囲から逸脱することなく、論理的、機械的、電気的、機能的及びこの他の変更を行うことができる。したがって、以下の詳細な説明は、限定的には解釈されず、本発明の範囲は、添付の請求の範囲によってのみ定義される。
概観
まず、本発明の動作の概観を説明するために、図1に符号化システム100の一実施例を示す。符号化システム100は、メディアエンコーダ104、メタデータ生成器106及びファイル作成器(file creator)108を備える。メディアエンコーダ104は、例えば、ビデオデータ(例えば、自然映像(natural source video scene)と他の外部の映像オブジェクトから作成されたビデオオブジェクト)、音声データ(例えば、自然音声(natural source audio scene)及び他の外部のオーディオオブジェクトから作成された音声オブジェクト)、合成オブジェクト、又はこれらの任意の組合せ組合せを含むメディアデータを受け取る。メディアエンコーダ104は、様々な種類のメディアデータを処理するために、複数の別個のエンコーダを備えていてもよく、サブエンコーダを備えていてもよい。メディアエンコーダ104は、メディアがデータを符号化して、メタデータ生成器106に渡す。メタデータ生成器106は、メディアファイルフォーマットに基づいて、メディアデータに関する情報を提供するメタデータを生成する。メディアファイルフォーマットは、ISOメディアファイルフォーマット(又は、これに由来するMPEG−4、JPEG2000等)、クイックタイム、又は他の任意のメディアファイルフォーマットに基づいていてもよく、幾つかの追加的データ構造を含んでいてもよい。一実施例では、メディアデータ内においてサブサンプルに関係するメタデータを保存するための追加的データ構造を定義する。他の実施例においては、従来ではメディアデータに保存されていた復号情報を含んでいる対応するパラメータセットにメディアデータの部分(例えば、サンプル又はサブサンプル)をリンクするメタデータを保存するための追加的データ構造を定義する。更に他の実施例ではメディアデータ内のサンプルの相互依存性に基づいて作成された、メタデータデータ内のサンプルの様々なグループに関係するメタデータを保存するための追加的データ構造を定義する。更に他の実施例では、メディアデータに関連している切換サンプルセット(switch sample set)に関係するメタデータを保存するための追加的データ構造を定義する。切換サンプルセットとは、同じ復号値を有するが、異なるサンプルに依存していてもよいサンプルの組を指す。更に他の実施例では、使用されているファイルフォーマットにおいて、追加的データ構造の様々な組合せを定義する。これらの追加的データ構造とその機能については、後に詳細に説明する。
ファイル作成器108は、符号化されたメディアデータとメタデータを保存する。一実施例では、符号化されたメディアデータと関係するメタデータ(例えば、サブサンプルメタデータ、パラメータセットメタデータ、グループサンプルメタデータ又は、切換サンプルメタデータ)は、同じファイルに保存される。このファイルの構造は、メディアファイルフォーマットによって定義されている。
他の実施例においては全ての種類又は幾つか種類のメタデータは、メディアデータとは別個に保存される。例えば、パラメータセットメタデータをメディアデータとは別個に保存してもよい。具体的には、ファイル作成器108は、符号化されたメディアデータのファイルを作成するメディアデータファイル作成器114と、メタデータのファイルを作成するメタデータファイル作成器112と、対応するメタデータとメディアデータを同期させるシンクロナイザ116とを備えていてもよい。メタデータを別個に保存する手法及びこれらのメタデータとメディアデータとの同期については、後により詳細に説明する。
一実施例において、メタデータファイル作成器112は、メディアデータから独立して保存されたメタデータとして、メディアデータに関連付けられた補足的拡張情報(supplemental enhancement information:以下、SEIという。)メッセージを保存する。SEIデータがなくても、復号処理を行うことができるので、デコーダは、SEIデータを使用する必要はない。一実施例では、SEIメッセージは、メディアデータの記述を含ませるために使用される。この記述は、MPEG−7規格に従って定義され、記述子と記述スキームから構成される。記述子は、オーディオビジュアルのコンテンツの特徴を表し、各特徴の表現の構文ととセマンティクスを定義する。記述子の具体例としては、カラー記述子、テクスチャ記述子、動き記述子等がある。記述スキーム(Description scheme:DS)は、それらのコンポーネントの間の関係の構造とセマンティクスを特定する。これらのコンポーネントとは、記述子と記述スキームのいずれであってもよい。この記述を用いることにより、メディアデータが復号された後のメディアデータの検索性と視覚的性能が向上する。SEIメッセージのオプションの性質のため、デコーダがSIEメッセージを使用するための特定の能力と特定の構成を備えていない場合、そのデコーダは、SEIメッセージの使用を強制されるわけではないので、SEIメッセージに記述を含めても、復号処理に悪い影響はない。SEIメッセージのメタデータとしての保存については、後により詳細に説明する。ファイル作成器108によって作成されたファイルは、チャンネル110を介して保存し又は伝送することができる。
図2は、復号システム200の一実施例を示している。復号システム200は、メタデータ抽出器204、メディアデータストリームプロセッサ206、メディアデコーダ210、合成器(compositor)212及びレンダリング器(renderer)214を備える。復号システム200をクライアント機器内に設け、ローカルな再生に用いてもよい。これに代えて、復号システム200は、データのストリーミングに用いてもよく、ネットワーク(例えば、インターネット)208を介して互いに通信を行うサーバ機器及びクライアント機器を備えていてもよい。サーバ機器は、メタデータ抽出器204とメディアデータストリームプロセッサ206を備えていてもよい。クライアント機器は、メディアデコーダ210、合成器212及びレンダリング器214を備えていてもよい。
メタデータ抽出器204は、データベース216に保存されている又は(例えば符号化システム100から)ネットワークを介して受信したファイルからメタデータを抽出する機能を担う。このファイルは、抽出されるメタデータに関連しているメディアデータを含んでいてもよく、含んでいなくてもよい。ファイルから抽出されたメタデータは、上述した追加的データ構造の1つ以上を含んでいる。
抽出されたメタデータは、メディアデータストリームプロセッサ206に渡される。このメディアデータストリームプロセッサ206は、関連する符号化されたメディアデータも受け取る。メディアデータストリームプロセッサ206は、メタデータを用いて、メディアデータストリームを生成し、これをメディアデコーダ210に供給する。一実施例では、メディアデータストリームプロセッサ206は、(例えば、パケット化のために)サブサンプルに関係するメタデータを用いて、メディアデータ内のサブサンプルの位置を特定する。他の実施例においては、メディアデータストリームプロセッサ206は、パラメータセットに関係するメタデータを用いて、メディアデータの一部を対応するパラメータセットにリンクさせる。更に他の実施例では、メディアデータストリームプロセッサ206は、メタデータを用いて、所定のグループ内のサンプルにアクセスするために、メタデータ内のサンプルの様々なグループを定義する(例えば、スケーラビリティのために、伝送条件に応じて、他のサンプルが依存していないサンプルのグループを除外して伝送ビットレートを低減する)。更に他の実施例では、メディアデータストリームプロセッサ206は、切換サンプルセットを定義するメタデータを用いて、切り換えるべきサンプルであって、導出されるサンプルが依存するサンプルに依存しないサンプルと同じ復号値を有する切換サンプルを特定する(例えば、Pフレーム又はBフレームにおいて、異なるビットレートを有するストリームへの切換を可能にする)。
作成されたメディアデータストリームは、直接(例えば、ローカル再生のために)又はネットワーク208を介して(例えばデータのストリーミングのために)、メディアデコーダ210に供給され、復号される。合成器212は、メディアデコーダ210の出力を受け取ってシーンを合成(compose)し、合成されたシーンは、ユーザディスプレイ装置内のレンダリング器214によってレンダリングされる。
以下に示す図3を参照した説明は、本発明の実施に適したコンピュータハードウェア及び他の操作コンポーネントに関する概要を明らかにするためのものであるが、これは、適用可能な環境を制限するものではない。図3は、図1に示すメタデータ生成器106及び/又はファイル作成器108、又は図2に示すメタデータ抽出器204及び/又はメディアデータストリームプロセッサ206の実現に好適なコンピュータシステムを示している。
コンピュータシステム340は、それぞれがシステムバス365に接続されたプロセッサ350と、メモリ355と、入出力装置(input/output capability)360とを備える。メモリ355は、プロセッサ350によって実行されることにより、ここに説明する処理を実現する命令を格納するよう構成されている。入出力装置360は、プロセッサ350によってアクセス可能なあらゆる種類のストレージ装置を含む、様々な種類の、コンピュータにより読取可能な媒体を含んでいる。なお、「コンピュータにより読取可能な媒体」という用語は、デジタル信号がエンコードされた搬送波をも含むことは、当業者にとって明らかである。コンピュータシステム340は、メモリ355において実行されるオペレーティングシステムソフトウェアによって制御される。入出力装置360及びこれに関連する媒体は、このオペレーティングシステムソフトウェアと、本発明に基づく処理とに関する命令と、アクセスユニットとを格納している。図1及び図2に示すメタデータ生成器106、ファイル作成器108、メタデータ抽出器204及びメディアデータストリームプロセッサ206は、プロセッサ350に接続されたそれぞれ独立した要素であってもよく、プロセッサ350によって実行される、コンピュータにより実行可能な命令として実現してもよい。一実施例においては、コンピュータシステム340は、インターネットサービスプロバイダ(Internet Service Provider:以下、ISPという。)の一部であってもよく、或いは、入出力装置360を介してISPに接続され、インターネットを介してアクセスユニットを送受信してもよい。なお、本発明は、インターネットアクセス及びインターネットウェブサイトに限定されるものではなく、直接接続されたコンピュータシステム及びプライベートネットワークに適用してもよいことは明らかである。
なお、コンピュータシステム340は、異なるアーキテクチャを有する様々な可能なコンピュータシステムの一例に過ぎないことは明らかである。一般的なコンピュータシステムは、少なくともプロセッサと、メモリと、及びプロセッサとメモリを接続するバスとを備えている場合が多い。なお、本発明は、マルチプロセッサシステム、ミニコンピュータ、メインフレームコンピュータ等を含む、他のコンピュータシステム構成によっても実現できることは当業者にとって明らかである。更に、本発明は、通信ネットワークを介してリンクされたリモートの処理装置によってタスクが実行される分散型コンピュータシステム環境によっても実現することができる。
サブサンプルのアクセス可能性(Sub-Sample Accessibility)
図4及び図5は、それぞれ符号化システム100及び復号システム200において実行されるサブサンプルメタデータの保存及び検索のための処理の具体例を示している。この処理は、ハードウェア(例えば回路、専用ロジック等)、ソフトウェア(汎用コンピュータシステム又は専用マシン上で実行されるソフトウェア)又はこれらの両方の組合せを含む処理ロジックによって実行してもよい。ソフトウェアによって実現できる処理については、これらのフローチャートを用いて本発明を説明することにより、当業者は、適切に構成されたコンピュータによってこの処理を実行するための命令を含むプログラムを開発することができる(コンピュータのプロセッサは、メモリを含むコンピュータにより読取可能な媒体から命令を読み出し、実行する)。コンピュータにより実行可能な命令は、コンピュータプログラミング言語として書いてもよく、ファームウェアロジックとして実現してもよい。一般的に認知されている規格に準拠するプログラミング言語で書いた場合、このような命令は、様々なオペレーティングシステムにインタフェースされ、様々な種類のハードウェアプラットホームで実行できる。更に、本発明では、如何なる特定のプログラミング言語にも基づくことなく、本発明を説明する。ここに開示する本発明の処理を実現するために、様々なプログラミング言語を用いてることができることは明らかである。更に、当分野においては、動作を行い又は結果を生じるものとして、ソフトウェアを様々な呼び方で呼ぶことがある(例えば、プログラム、手続き、プロセス、アプリケーション、モジュール、ロジック等)。これらの表現は、コンピュータによるソフトウェアの実行によって、コンピュータのプロセッサが動作を実行し又は結果を生じるということを単に簡略的に表現しているに過ぎない。また、本発明の範囲から逸脱することなく、図4及び図5に示す処理ステップを省略してもよく、他のステップを追加してもよく、更に、ここで説明する処理ステップの実行順序を変更してもよい。
図4は、符号化システム100において、サブサンプルメタデータを作成する処理400の一実施例を示すフローチャートである。まず、処理400は、処理ロジックが符号化されたメディアデータを含むファイルを受け取る(処理ブロック402)ことによって開始される。次に、処理ロジックは、メディアデータ内のサブサンプルの境界を特定する情報を抽出する(処理ブロック404)。用いられているファイルフォーマットに応じて、時間的属性を与えることができるデータストリームの最小単位は、サンプル(ISOメディアファイルフォーマット又はクイックタイムにおいて定義されている)、アクセスユニット(MPEG−4において定義されている)又はピクチャ(JVTにおいて定義されている)等と呼ばれる。サブサンプルは、サンプルのレベルより下位のデータストリームの連続する部分を表す。サブサンプルの定義は、符号化フォーマットに依存するが、包括的に言えば、サブサンプルとは、単一のエンティティ又はサブユニットの組合せとして復号でき、サンプルの部分的な再構築を可能にする、サンプルの重要なサブユニットである。また、サブサンプルは、アクセスユニットフラグメントとも呼ばれる。サブサンプルは、多くの場合、サンプルのデータストリームの部分(division)を表すので、各サブサンプルは、同じサンプル内の他のサブサンプルに対して依存関係をほとんど又は全く有していない。例えば、JVTでは、サブサンプルは、NALパケットである。同様に、MPEG−4ビデオでは、サブサンプルは、ビデオパケットである。
一実施例では、符号化システム100は、上述のように、JVTにおいて定義されているネットワーク抽象化レイヤで動作する。JVTメディアデータストリームは、一連のNALパケットから構成され、各NALパケット(また、NALユニットと呼ばれる)は、ヘッダ部とペイロード部分を含んでいる。ある種のNALパケットは、各スライスについて符号化されたVCLデータ又は1つのスライスの単一のデータ分割を格納するために用いられる。更に、NALパケットは、SEIメッセージを含む情報パケットであってもよい。JVTでは、サブサンプルは、ヘッダとペイロードの両方を有する完全なNALパケットであってもよい。
処理ブロック406において、処理ロジックは、メディアデータ内のサブサンプルを定義するサブサンプルメタデータを作成する。一実施例では、サブサンプルメタデータは、予め定義されたデータ構造の組(例えば、一組のボックス)として組織化される。予め定義されたデータ構造の組には、各サブサンプルのサイズに関する情報を含むデータ構造、各サンプルのサブサンプルの総数に関する情報を含むデータ構造、各サブサンプルを説明する情報(例えば、何がサブサンプルとして定義されているか)を含むデータ構造、各チャンク内のサブサンプルの総数に関する情報を含むデータ構造、各サブサンプルの優先順位に関する情報を含むデータ構造、又はサブサンプルに関係する任意のデータを含む他のデータ構造を含めることができる。
次に、一実施例において、処理ロジックは、データの繰り返しシーケンス(repeated sequence of data)を含むデータ構造が存在するか否かを判定する(デシジョンボックス408)。この判定の結果が肯定的である場合、処理ロジックは、データの各繰り返しシーケンスをシーケンス出現への参照情報(a reference to a sequence occurrence)及び繰り返しシーケンスの出現回数を表す情報に変換する(処理ブロック410)。
次に、処理ブロック412において、処理ロジックは、特定のメディアファイルフォーマット(例えば、JVTファイルフォーマット)を用いて、メディアデータに関連するファイルの中にサブサンプルメタデータを含める。メディアファイルフォーマットにより、サブサンプルメタデータは、サンプルメタデータとともに保存してもよく(例えば、サンプルデータ構造を含むサンプルテーブルボックスにサブサンプルデータ構造を含むことができる)、サンプルメタデータとは別に保存してもよい。
図5は、復号システム200においてサブサンプルメタデータを利用するための処理500の一具体例のフローチャートである。まず、処理500は、処理ロジックが符号化されたメディアデータに関連するファイルを受け取ることにより開始される(処理ブロック502)。ファイルは、データベース(ローカル又は外部の)、符号化システム100又はネットワーク上の他の如何なる機器から供給してもよい。ファイルは、メディアデータ内のサブサンプルを定義するサブサンプルメタデータを含んでいる。
次に、処理ロジックは、ファイルからサブサンプルメタデータを抽出する(処理ブロック504)。上述のように、サブサンプルメタデータは、データ構造の組(例えば、一組のボックス)に保存してもよい。
更に、処理ブロック506において、処理ロジックは、抽出されたメタデータを用いて、(同じファイル又は異なるファイルに保存されている)符号化されたメディアデータのサブサンプルを特定し、メディアデコーダに供給するために、複数のサブサンプルを結合してパケットを生成し、これにより、ストリーミングのためのメディアデータの柔軟なパケット化が可能となる(例えば、エラー回復、スケーラビリティ等をサポートできる)。
以下、拡張ISOメディアファイルフォーマット(拡張MP4と呼ばれる)に基づいて、サブサンプルメタデータ構造の具体例について説明する。なお、他のメディアファイルフォーマットを拡張して、サブサンプルメタデータを保存するための同様のデータ構造を組み込むことができることは当業者にとって明らかである。
サブサンプルを含む拡張MP4メディアストリームモデルを図6に示す。プレゼンテーションデータ(例えば、同期されたオーディオ及びビデオを含むプレゼンテーション)は、ムービー602として表されている。ムービー602は、一組のトラック604を含む。各トラック604は、メディアデータストリームを表している。各トラック604は、サンプル606に分割される。各サンプル606は、特定の時刻におけるメディアデータのユニットを表している。サンプル606は、更にサブサンプル608に分割される。JVT規格では、サブサンプル608は、NALパケット又は単一のピクチャのスライス、複数のデータ部分を含むスライスの1つのデータ部分、帯域内パラメータセット又はSEI情報パケット等のユニットを表すことができる。これに代えて、サブサンプル606は、例えば、メディアにおける空間的領域又は時間的領域を表すコードデータ等、サンプルにおける他の如何なる構造的要素を表していてもよい。一実施例においては、何らかの構造的基準又は意味的基準に基づく、符号化されたメディアデータの如何なる部分もサブサンプルとして扱うことができる。
トラック拡張ボックスは、トラックフラグメントにおけるサンプルを特定するためにムービーフラグメントが使用されている場合、各サンプルの所要時間とサイズに関する情報を提供し、各サンプルの劣化優先順位(degradation priority)及び他のサンプル情報を指定するために用いられる。劣化優先順位とは、サンプルの重要度を定義し、すなわち、(例えば、伝送時の損失のため)そのサンプルが失われた場合、映像の品質にどのような影響があるかを示している。一実施例においては、トラック拡張ボックスは、トラックフラグメントボックス内のサブサンプルのデフォルト情報を含むように拡張される。この情報は、例えば、サブサンプル記述のサブサンプル記述への参照情報とを含むことができる。
トラックは、複数のフラグメントに分割できる。各フラグメントは、0個以上の連続するサンプルのランを含むことができる。トラックフラグメントランボックスは、トラックフラグメント内のサンプルを特定し、トラックフラグメントに保存されたサンプルに関するトラックフラグメントのそれぞれのサンプルの所要時間とサイズに関する情報及びこの他の情報を提供する。トラックフラグメントヘッダボックスは、トラックフラグメントランボックスにおいて用いられるデフォルトデータ値を特定する。一実施例では、トラックフラグメントランボックス及びトラックフラグメントヘッダボックスは、トラックフラグメント内のサブサンプルに関する情報を含むように拡張される。トラックフラグメントランボックス内の拡張された情報としては、例えば、各サンプルのトラックフラグメントに保存されたサブサンプルの数、各サブサンプルのサイズ、サブサンプル記述への参照情報、一組のフラグ等を含めることができる。一組のフラグにより、トラックフラグメントがサンプルのチャンク又はサブサンプルにメディアデータを保存するか否か、サブサンプルデータがトラックフラグメントランボックスに存在しているか否か、各サブサンプルが、トラックフラグメントランボックス内にサイズデータ及び/又は記述参照情報データを有しているか否か等を示すことができる。トラックフラグメントヘッダボックスの拡張情報は、例えば、各サブサンプルが、サイズデータ及び/又は記述参照データを提供しているか否かを示すフラグのデフォルト値等の情報を含むことができる。
サブサンプルメタデータを保存するためのデータ構造の具体例を図7A〜図7Lに示す。
図7Aに示すように、ISOメディアファイルフォーマットによって定義されたサンプルメタデータボックスを含むサンプルテーブルボックス700は、サブサンプルサイズボックス(sub-sample size box)702、サブサンプル記述関連付けボックス(sub-sample description association box)704、サブサンプル−サンプルボックス(sub-sample to sample box)706、サブサンプル記述ボックス(sub-sample description box)708等のサブサンプルアクセスボックスを含むように拡張される。一実施例では、サブサンプルアクセスボックスは、サブサンプル−チャンク(sub-sample to chunk box)ボックス及び優先度ボックス(priority box)も含んでいる。一実施例では、サブサンプルアクセスボックスを用いるか否かは任意である。
図7Bに示すように、サンプル710は、例えば、スライス712等のスライスと、データ部分(data partition)714等のデータ部分と、ROI716等の重要な領域(regions of interest:ROI)とに分割することができる。これらの各実施例は、サンプルをサブサンプルに分割する様々な例を表している。単一のサンプル内の各サブサンプルは、互いに異なるサイズを有することができる。
サブサンプルサイズボックス718は、サブサンプルサイズボックス718のバージョンを指定するバージョンフィールドと、デフォルトサブサンプルサイズを指定するサブサンプルサイズフィールドと、トラック内のサブサンプルの数を表すサブサンプルカウントフィールドと、各サブサンプルのサイズを指定するエントリサイズフィールドとを含んでいる。サブサンプルサイズフィールドに0が設定されている場合、サブサンプルサイズテーブル720内に格納されているサブサンプルは異なるサイズを有する。サブサンプルサイズフィールドの値が0に設定されない場合、このフィールドは、サブサンプルサイズが一定であることを表し、サブサンプルサイズテーブル720が空であることを示す。テーブル720は、サブサンプルサイズを表すための32ビット固定長フィールド又は可変長フィールドを有していてもよい。フィールドが可変長である場合、サブサンプルテーブルは、サブサンプルサイズフィールドの長さをバイト単位で表現するフィールドを含んでいる。
図7Cに示すように、サブサンプル−サンプルボックス722は、サブサンプル−サンプルボックス722のバージョンを特定するバージョンフィールドと、テーブル723内のエントリの数を示すエントリカウントフィールドとを含んでいる。サブサンプル−サンプルテーブルにおける各エントリは、同数の1サンプルあたりのサブサンプルを共有するサンプルのラン(run)における第1のサンプルのインデクスを提供する第1のサンプルフィールドと、サンプルのランにおける各サンプルのサブサンプルの数を提供するサンプル毎サブサンプル(sub-samples-per-sample)フィールドとを含んでいる。
テーブル723を用いることにより、ランに幾つのサンプルがあるかを算出し、この数と適切な1サンプル毎のサブサンプルの数とを乗算し、全てのランの結果を合計することによって、トラックのサブサンプルの総数を算出することができる。
他の実施例では、サブサンプルは、サンプルではなくチャンクとしてグループ化する。そして、サブサンプル−チャンクボックス(sub-sample to chunk box)を用いて、チャンク内のサブサンプルが特定される。サブサンプル−チャンクボックスは、同じ数のサブサンプルと、各チャンク内のサブサンプルの数と、サブサンプル記述のためのインデクスとを共有するチャンクのランにおける第1のチャンクのインデクスに情報を保存する。サブサンプル−チャンクボックスを用いて、特定のサブサンプル、チャンク内のサブサンプルの位置及びこのサブサンプルの記述を含むチャンクを検出することができる。一実施例において、サブサンプルがチャンクとしてグループ化される場合、サブサンプル−サンプルボックス722は、存在しない。一方、サブサンプルがサンプルとしてグループ化される場合、サブサンプル−チャンクボックスは、存在しない。
上述のように、サブサンプルアクセスボックスは、各サブサンプルの劣化優先順位を指定する優先順位ボックスを含むことができる。劣化優先順位とは、サンプルの重要度を定義し、すなわち、(例えば、伝送時の損失のため)そのサンプルが失われた場合、復号されたメディアデータにどのような影響があるかを示している。優先順位ボックスのサイズは、サブサンプル−サンプルボックス722又はサブサンプル−チャンクボックスから判定さすることができるトラック内のサブサンプルの数によって定義される。
図7Dに示すように、サブサンプル記述関連付けボックス724は、サブサンプル記述関連付けボックス724のバージョンを指定するバージョンフィールドと、記述されるサブサンプルのタイプ(例えばNALパケット、関心領域)を示す記述タイプ識別子と、テーブル726内のエントリの数を提供するエントリカウントフィールドとを含んでいる。テーブル726内の各エントリは、サブサンプル記述IDを示すサブサンプル記述タイプ識別子フィールドと、同じサブサンプル記述IDを共有するサブサンプルのランにおける第1のサブサンプルへのインデクスを提供する第1のサブサンプルフィールドとを含んでいる。
サブサンプル記述タイプ識別子は、サブサンプル記述IDフィールドの使用を制御する。すなわち記述タイプ識別子において特定されたタイプに応じて、サブサンプル記述IDフィールド自体が記述ID自体の中のサブサンプル記述を直接符号化する記述IDを特定し、又は、サブサンプル記述IDフィールドは、異なるテーブル(すなわち、後述するサブサンプル記述テーブル)へのインデクスとして機能できる。例えば、記述タイプ識別子がJVT記述を指示する場合、サブサンプル記述IDフィールドは、JVTサブサンプルの特性を指定するコードを含むことができる。この場合、サブサンプル記述IDフィールドは、サブサンプル内に予め定義されたデータ部分が存在することを表すビットマスクとして用いられる下位8ビットと、NALパケットタイプを表すための、又は将来の拡張のための上位24ビットとを含む32ビットのフィールドであってもよい。
図7Eに示すように、サブサンプル記述ボックス728は、サブサンプル記述ボックス728のバージョンを指定するバージョンフィールドと、テーブル730内のエントリの数を示すエントリカウントフィールドと、サブサンプルの特性に関する情報を表すサブサンプル記述フィールドの記述タイプを示す記述タイプ識別子フィールドと、1つ以上のサブサンプル記述エントリ730を含むテーブルとを含む。サブサンプル記述タイプは、記述情報(descriptive information)が関係するタイプを特定し、サブサンプル記述関連付けテーブル724内の同じフィールドに対応している。テーブル730内の各エントリは、関連するサブサンプルの特性に関する情報を含むサブサンプル記述エントリを含んでいる。記述エントリの情報とフォーマットは、記述タイプフィールドに依存する。例えば、そして、記述タイプがパラメータセットである場合、各記述エントリは、パラメータセットの値を含む。
記述情報は、パラメータセット情報、ROIに関係する情報又はサブサンプルを特徴付けるために必要な他のあらゆる情報に関連付けることができる。パラメータセットについては、サブサンプル記述関連付けテーブル724は、各サブサンプルに関連するパラメータセットを示す。このような場合、サブサンプル記述IDは、パラメータセット識別子に対応している。同様に、サブサンプルは、以下のように異なる関心領域を表すことができる。まず、サブサンプルを1つ以上の符号化されたマクロブロックとして定義し、次に、サブサンプル記述関連付けテーブルを用いて、ビデオフレーム又は画像の符号化されたミクロブロックの異なる領域への分割を表現する。例えば、2つのサブサンプル記述ID(例えば、サブサンプル記述ID1、2)によって、フレーム内の符号化されたマクロブロックを、それぞれ前景領域及び背景領域への割当を示す前景マクロブロックと背景マクロブロックに分割できる。
異なる種類のサブサンプルを図7Fに示す。サブサンプルは、分割されていないスライス732、複数のデータに分割されたスライス734、スライス内のヘッダ736。1つのスライスの中央のデータ部分738、1つのスライスの最後のデータ部分740、SEI情報パケット742等を表すことができる。これらの各サブサンプルタイプは、図7Gに示す8ビットマスク744の特定の値に関連付けてもよい。8ビットマスクは、上述のように、32ビットのサブサンプル記述IDフィールドの最下位8ビットを構成してもよい。図7Hは、「jvtd」に等しい記述タイプ識別子を有するサブサンプル記述関連付けボックス724を示す。テーブル726は、図7Gに示した値を格納する32ビットのサブサンプル記述IDフィールドを有している。
図7H〜図7Kを用いて、サブサンプル記述関連付けテーブルにおけるデータの圧縮を説明する。
図7Iに示すように、圧縮されていないテーブル726は、シーケンス748を繰り返すサブサンプル記述IDのシーケンス750を含んでいる。圧縮されたテーブル746内では、繰り返しシーケンス750は、シーケンス748への参照情報と、このシーケンスが出現する回数を表す情報に圧縮されている。
図7Jに示す一実施例においては、サブサンプル記述IDフィールドにおいて、最上位ビットをシーケンスフラグのラン754として用い、次の23ビットを出現インデクス756として用い、これより下位のビットを出現長(occurrence length)758として用いることによって、シーケンス出現(sequence occurrence)を符号化することができる。シーケンスフラグのラン754に1が設定されている場合、これは、当該エントリが繰り返しシーケンスの出現を含んでいることを示している。シーケンスフラグのラン754に0が設定されている場合、このエントリは、サブサンプル記述IDであることを示している。出現インデクス756は、シーケンスの第1の出現のサブサンプル記述関連付けボックス724内の指標であり、出現長758は、繰り返しシーケンス出現の長さを示す。
図7Kに示す他の実施例においては、繰り返しシーケンス出現テーブル760は、繰り返しシーケンスの出現を表すために用いられる。サブサンプル記述IDフィールドの最上位ビットは、エントリがサブサンプル記述IDであるか否かを示すシーケンスフラグ762のランとして、又は、サブサンプル記述関連付けボックス724の一部である繰り返しシーケンス出現テーブル760内のエントリのシーケンスインデクス764として用いられる。繰り返しシーケンス出現テーブル760は、繰り返しシーケンスにおける最初のアイテムのサブサンプル記述関連付けボックス724におけるインデクスを特定するための出現インデックスフィールドと、繰り返しシーケンスの長さを指定するためのシーケンス長領域とを含んでいる。
パラメータセット
JVT等の所定のメディアフォーマットでは、メディアデータを適切に復号するために必要である基準制御値(critical control value)を含む「ヘッダ」情報が、符号化されたデータの残りの部分から分離され/切り離され、パラメータセット内に保存される。これにより、ストリームにおけるこれらの制御値を符号化されたデータに混在させるのではなく、一意的識別子等のメカニズムを用いて、符号化されたデータにより必要なパラメータセットを示すことができる。この手法により、符号化されたデータから、より高レベルの符号化パラメータの伝送を分離することができる。また、同時に、制御値の共通の組をパラメータセットとして共有することによって、冗長度を低下させることができる。
パラメータセットを用いる保存されたメディアストリームの効率的な送信をサポートするためには、送信側又はプレーヤは、パラメータセットを伝送し又はパラメータセットにアクセスする時刻及び場所を知るために、符号化されたデータを対応するパラメータに高速にリンクする必要がある。本発明の一実施例では、メディアデータのパラメータセットと対応する部分の間の関係を特定するデータをメディアファイルフォーマット内のパラメータセットメタデータとして格納することによりこの機能を実現する。
図8及び図9は、それぞれ符号化システム100及び復号システム200によって実行されるパラメータセットメタデータの保存及び検索のための処理を示している。この処理は、ハードウェア(例えば回路、専用ロジック等)、ソフトウェア(汎用コンピュータシステム又は専用マシン上で実行されるソフトウェア)又はこれらの両方の組合せを含む処理ロジックによって実行してもよい。
図8は、符号化システム100において、パラメータセットメタデータを作成するための処理800の一実施例を示すフローチャートである。まず、処理800は、処理ロジックが符号化されたメディアデータに関連するファイルを受け取ることにより開始される(処理ブロック802)。このファイルは、メディアデータの一部をどのように復号するかを指定する符号化パラメータの組を含んでいる。次に、処理ロジックは、パラメータセットと呼ばれる符号化パラメータの組と、メディアデータの対応する部分と間の関係を調べ(処理ブロック804)、パラメータセットと、このパラメータセットとメディアデータ部分との関係を定義するパラメータセットメタデータを作成する(処理ブロック806)。メディアデータ部分は、サンプル又はサブサンプルによって表してもよい。
一実施例では、パラメータセットメタデータは、一組の予め定義されたデータ構造(例えば、一組のボックス)に組織化される。予め定義されたデータ構造の組は、パラメータセットに関する記述的な情報を含むデータ構造と、サンプルとこれに対応するパラメータセットの間の関係を定義する情報を含むデータ構造とを含むことができる。一実施例においては、予め定義されたデータ構造の組は、サブサンプルとこれに対応するパラメータセットの間の関係を定義する情報を含むデータ構造を含んでいる。サブサンプル−パラメータセット関係情報(sub-sample to parameter set association information)を含むデータ構造は、サンプル−パラメータセット関係情報(sample to parameter set association information)を含むデータ構造に優先されてもよく、優先されなくてもよい。
次に、一実施例では、処理ロジックは、データの繰り返しシーケンスを含むパラメータセットデータ構造が存在するか否かを判定する(デシジョンボックス808)。この判定の結果が肯定的である場合、処理ロジックは、データの各繰り返しシーケンスをシーケンスの出現への参照情報及びシーケンスの出現回数を表す情報に変換する(処理ブロック810)。
次に、処理ブロック812において、処理ロジックは、特定のメディアファイルフォーマット(例えば、JVTファイルフォーマット)を用いて、メディアデータに関連するファイル内にパラメータセットメタデータを含める。メディアファイルフォーマットに応じて、パラメータセットメタデータは、トラックメタデータ及び/又はサンプルメタデータとともに保存してもよく(例えば、パラメータセットに関する記述的情報を含むデータ構造をトラックボックスに含めてもよく、関連付け情報を含むデータ構造をサンプルテーブルボックスに含めてもよい。)、トラックメタデータ及び/又はサンプルメタデータとは別に保存してもよい。
図9は、復号システム200においてパラメータセットメタデータを利用するための処理900の一実施例を示すフローチャートであるである。まず、処理900は、処理ロジックが符号化されたメディアデータに関連するファイルを受け取ることにより開始される(処理ブロック902)。ファイルは、データベース(ローカル又は外部のデータベース)、符号化システム100又はネットワーク内の他の如何なる機器から受け取ってもよい。ファイルは、メディアデータのためのパラメータセット及びこのメディアデータのパラメータセットと対応する部分(例えば、対応するサンプル又はサブサンプル)の間の関係を定義するパラメータセットメタデータを含んでいる。
次に、処理ロジックは、ファイルからパラメータセットメタデータを抽出する(処理ブロック904)。上述のように、パラメータセットメタデータは、一組のデータ構造(例えば、一組のボックス)に保存できる。
更に、処理ブロック906では、処理ロジックは、抽出されたメタデータを用いて、どのパラメータセットが特定のメディアデータ部分(例えば、サンプル又はサブサンプル)に関連するかを判定する。この情報は、メディアデータ部分とこれに対応するパラメータセットの伝送時刻を制御するために用いることができる。すなわち、特定のサンプル又はサブサンプルを復号するために用いるべきパラメータセットは、サンプル又はサブサンプルを含むパケットより先に、又はサンプル又はサブサンプルを含むパケットと共に送信する必要がある。
このように、パラメータセットメタデータを用いることにより、より信頼性が高いチャンネルを介して、パラメータセットを別個に送信することが可能となり、伝送エラー又はデータ損失によってメディアストリームの一部が欠落する可能性を低減することができる。
以下、拡張ISOメディアファイルフォーマット(拡張ISOと呼ばれる)について、例示的なパラメータセットメタデータ構造を用いて説明する。但し、パラメータセットメタデータを格納するための様々なデータ構造を組み込むように、この他のファイルフォーマットを拡張してもよいことは明らかである。
パラメータセットメタデータを保存するための例示的なデータ構造を図10A〜図10Eに示す。
図10Aに示すように、ISOファイルフォーマットによって定義されているトラックメタデータボックスを含むトラックボックス1002は、パラメータセット記述ボックス1004を含むように拡張される。更に、ISOファイルフォーマットによって定義されているサンプルメタデータボックスを含むサンプルテーブルボックス1006は、サンプル−パラメータセットボックス1008を含むように拡張される。一実施例においては、サンプルテーブルボックス1006は、サブサンプル−パラメータセットボックスを含んでいてもよく、これは、後に詳細に説明するように、サンプル−パラメータセットボックス1008へのサンプルに優先させることができる。
一実施例では、パラメータセットメタデータボックス1004、1008は、必須要件である。他の実施例においては、パラメータセット記述ボックス1004のみが必須要件である。更に他の実施例では、全てのパラメータセットメタデータボックスの全てが任意の要件である。
図10Bに示すように、パラメータセット記述ボックス1010は、パラメータセット記述ボックス1010のバージョンを指定するバージョンフィールドと、テーブル1012内のエントリの数を示すパラメータセット記述カウントフィールドと、パラメータセット自体のためのエントリを含むパラメータセットエントリフィールドとを含んでいる。
パラメータセットは、サンプルレベル又はサブサンプルレベルから参照することができる。図10Cに示すように、サンプル−パラメータセットボックス1014は、サンプルレベルからパラメータセットへの参照情報を提供する。サンプル−パラメータセットボックス1014は、サンプル−パラメータセットボックス1014のバージョンを指定するバージョンフィールドと、デフォルトパラメータセットIDを指定するデフォルトパラメータセットIDフィールドと、テーブル1016内のエントリの数を示すエントリカウントフィールドとを含んでいる。テーブル1016内の各エントリは、同じパラメータセットを共有するサンプルのランにおける第1のサンプルのインデクスを提供する第1のサンプルフィールドと、パラメータセット記述ボックス1010へのインデクスを指定するパラメータセットインデクスとを含んでいる。デフォルトパラメータセットIDが0のときは、テーブル1016内に格納されているサンプルは、異なるパラメータセットを有する。デフォルトパラメータセットIDが1のときは、各サンプルに対して、一定のパラメータセットが1つのみ用いられる。
一実施例では、サブサンプル記述関係テーブルに関連して上述したように、テーブル1016内のデータは、各繰り返しシーケンスを最初のシーケンスへの参照情報と、このシーケンスが出現する回数を表す情報に変換することによって圧縮される。
パラメータセットとサブサンプルの間の関係を定義することによって、サブサンプルレベルからパラメータセットを参照することができる。一実施例では、パラメータセットとサブサンプルの間の関係は、上述したサブサンプル記述関連付けボックスを用いて定義される。図10Dは、パラメータセットを識別する記述タイプ識別子を有するサブサンプル記述関連付けボックス1018を示す。(例えば、記述タイプ識別子は、「pars」に等しい)。テーブル1020内のサブサンプル記述IDは、この記述タイプ識別子に基づき、パラメータセット記述ボックス1010内のインデクスを示す。
一実施例では、パラメータセットを識別する記述タイプ識別子を含むサブサンプル記述関連付けボックス1018が存在している場合、これは、サンプル−パラメータセットボックス1014に優先される。
パラメータセットは、パラメータセットが作成された時点と、パラメータセットがメディアデータの対応する部分を復号するために用いられる時点との間で変更してもよい。このような変更が行われる場合、復号システム200は、パラメータセットの変更を示すパラメータ更新パケットを受け取る。パラメータセットメタデータは、更新前と更新後の両方のパラメータセットの状態を特定するデータを含んでいる。
図10Eに示すように、パラメータセット記述ボックス1010は、時刻t0において作成された初期パラメータセット1022のエントリと、時刻t1において受け取られたパラメータ更新パケット1026に応じて作成された更新パラメータセット1024のエントリとを含んでいる。サブサンプル記述関連付けボックス1018は、これらの2つのパラメータセットを対応するサブサンプルに関連付ける。
サンプルグループ
トラック内のサンプルは、メディアデータ内のハイレベルの構造を表すシーケンス(不連続であってもよい)に論理的にグループ化(区分)することができるが既存のファイルフォーマットは、このようにグループ化されたデータを表現及び保存する好適なメカニズムを有していない。例えば、JVT等の高度な符号化形式は、単一のトラック内のサンプルを、それらの相互依存性に基づいて複数のグループに組織化する。これらのグループ(ここでは、シーケンス又はサンプルグループとも呼ぶ。)を用いて、除外可能な一連のサンプルを特定することができ、ネットワーク状態によって必要とされた場合に、これにより、時間的なスケーラビリティをサポートすることができる。ファイルフォーマットにおいて、サンプルグループを定義するメタデータを保存することにより、メディアの送信側は、上述した特徴を容易且つ効率的に実現することができる。
サンプルグループの具体例としては、例えば、フレーム間の依存関係によって、それらのサンプルが他のサンプルに依存することなく復号できる組がある。JVTでは、このようなサンプルグループは、拡張グループオブピクチャ(enhanced group of pictures:以下、拡張GOPという。)と呼ばれる。拡張GOPでは、サンプルは、サブシーケンスに分割できる。各サブシーケンスは、互いに依存し、1つの単位として処理できる一組のサンプルを含んでいる。更に拡張GOPのサンプルは、より上位のレイヤのサンプルがより下位のレイヤのサンプルのみから予測され、これにより、他のサンプルを復号する能力に影響を与えることなく、最上位のレイヤのサンプルを除外できるように、複数のレイヤに階層的に構造化できる。他の如何なるレイヤのサンプルにも依存しないサンプルを含んでいる最下位のレイヤは、ベースレイヤと呼ばれる。ベースレイヤ以外の他の全てのレイヤは、エンハンスメントレイヤ(enhancement layer)と呼ばれる。
図11は、サンプルが2つのレイヤ、ベースレイヤ1102及びエンハンスメントレイヤ1104、及び2つのサブシーケンス1106、1108に分割される例示的な拡張GOPを示している。2つのサブシーケンス1106と1108は、互いに依存することなく破棄することができる。
図12及び図13は、それぞれ符号化システム100及び復号システム200によって実行されるサンプルグループメタデータの保存及び検索のための処理を示している。この処理は、ハードウェア(例えば回路、専用ロジック等)、ソフトウェア(汎用コンピュータシステム又は専用マシン上で実行されるソフトウェア)又はこれらの両方の組合せを含む処理ロジックによって実行してもよい。
図12は、符号化システム100においてサンプルグループメタデータを作成するための処理1200の一実施例を示すフローチャートである。まず、処理1200は、処理ロジックが符号化されたメディアデータに関連するファイルを受け取ることにより開始される(処理ブロック1202)。メディアデータのトラック内のサンプルは、ある種の相互依存性を有する。例えば、トラックは、他の如何なるサンプルにも依存しないIフレーム、先行する単一のサンプルに依存するPフレーム及びIフレーム、Pフレーム及びBフレームのあらゆる組合せを含む先行する2つのサンプルに依存するBフレームを含んでいてもよい。トラックのサンプルは、それらの相互依存性に基づいて、サンプルグループ(例えば、拡張GOP、レイヤ、サブシーケンス等)に論理的に結合できる。
次に、処理ロジックは、各トラック内のサンプルグループを特定するためにメディアデータを調べ(処理ブロック1204)、サンプルグループについて記述し、どのサンプルがどのサンプルグループに含まれているかを定義するサンプルグループメタデータを作成する(処理ブロック1206)。一実施例では、サンプルグループメタデータは、一組の予め定義されたデータ構造(例えば、一組のボックス)に組織化される。予め定義されたデータ構造の組は、各サンプルグループに関する記述的な情報を含むデータ構造と、各サンプルグループに含まれたサンプルを特定する情報を含むデータ構造と、サブシーケンスを記述する情報を含むデータ構造と、レイヤを記述する情報を含むデータ構造とを含むことができる。次に、一実施例では、処理ロジックは、データの繰り返しシーケンスを含むサンプルグループデータ構造が存在するか否かを判定する(デシジョンボックス1208)。この判定の結果が肯定的である場合、処理ロジックは、データの各繰り返しシーケンスをシーケンスの出現への参照情報及びシーケンスの出現回数を表す情報に変換する(処理ブロック1210)。
次に、処理ブロック1212において、処理ロジックは、特定のメディアファイルフォーマット(例えば、JVTファイルフォーマット)を用いて、メディアデータに関連するファイル内にサンプルグループメタデータを含める。メディアファイルフォーマットに応じて、サンプルグループメタデータは、サンプルメタデータとともに保存してもよく(サンプルグループデータ構造をサンプルテーブルボックスに含めてもよい。)、サンプルメタデータとは別に保存してもよい。
図13は、復号システム200においてサンプルグループメタデータを利用するための処理1300の一実施例を示すフローチャートである。まず、処理1300は、処理ロジックが符号化されたメディアデータに関連するファイルを受け取ることにより開始される(処理ブロック1302)。ファイルは、データベース(ローカル又は外部のデータベース)、符号化システム100又はネットワーク内の他の如何なる機器から受け取ってもよい。ファイルは、メディアデータ内のサンプルグループを定義するサンプルグループメタデータを含んでいる。
次に、処理ロジックは、ファイルからサンプルグループメタデータを抽出する(処理ブロック1304)。上述のように、サンプルグループメタデータは、一組のデータ構造(例えば、一組のボックス)に保存できる。
更に、処理ブロック1306では、処理ロジックは、抽出されたメタデータを用いて、他のサンプルを復号する能力に影響することなく除外でる一連のサンプルを特定する。一実施例では、この情報を用いて、特定のサンプルグループにおけるサンプルにアクセスし、ネットワーク容量の変化に応じてどのサンプルを破棄することができるかを判定することができる。他の実施例では、サンプルグループメタデータは、トラック内のサンプルの一部だけが処理又はレンダリングされるように、サンプルをフィルタリングするために用いられる。
このように、サンプルグループメタデータにより、サンプルへの選択的なアクセスと、スケーラビリティが容易に実現される。
以下、サンプルグループメタデータ構造の具体例について、拡張ISOメディアファイルフォーマット(拡張MP4とも呼ばれる。)に関連して説明する。但し、サンプルグループメタデータを格納するための様々なデータ構造を組み込むように、この他のファイルフォーマットを拡張してもよいことは明らかである。
サンプルグループメタデータを保存するための例示的なデータ構造を図14A〜図14Eに示す。
図14Aに示すように、MP4によって定義されたサンプルメタデータボックスを含むサンプルテーブルボックス1400は、サンプルグループボックス1402とサンプルグループ記述ボックス1404を含むように拡張される。一実施例では、サンプルグループメタデータボックス1402、1404は、任意の要素とする。一実施例(図示せず)では、サンプルテーブルボックス1400は、サブシーケンス記述エントリボックス及びレイヤ記述エントリボックス等の追加的な任意のサンプルグループメタデータボックスを含んでいる。
図14Bに示すように、サンプルグループボックス1406は、特定のサンプルグループに含まれるサンプルの組を検出するために用いられる。サンプルグループボックス1406の複数のインスタンスが異なる種類のサンプルグループ(例えば、拡張GOP、サブシーケンス、レイヤ、パラメータセット等)に対応できる。サンプルグループボックス1406は、サンプルグループボックス1406のバージョンを特定するバージョンフィールドと、テーブル1408内のエントリの数を示すエントリカウントフィールドと、サンプルグループの種類を特定するサンプルグループ識別子フィールドと、同じサンプルグループに含まれているサンプルのランにおける第1のサンプルへのインデクスを提供する第1のサンプルフィールドと、サンプルグループ記述ボックスへのインデクスを指定するサンプルグループ記述インデクスとを含んでいる。
図14Cに示すように、サンプルグループ記述ボックス1410は、サンプルグループの特性に関する情報を提供する。サンプルグループ記述ボックス1410は、サンプルグループ記述ボックス1410のバージョンを特定するバージョンフィールドと、テーブル1412内のエントリの数を示すエントリカウントフィールドと、サンプルグループの種類を特定するサンプルグループ識別子フィールドと、サンプルグループ記述子を提供するサンプルグループ記述フィールドとを含んでいる。
図14Dは、レイヤ(layr)サンプルグループタイプに関するサンプルグループボックス1416の使用を説明する図である。サンプル1〜11は、サンプルの相互依存性に基づいて、3個のレイヤに分割される。レイヤ0(ベース層)では、サンプル(サンプル1、6、11)は、相互に依存するのみであり、他の如何なるレイヤ内のサンプルにも依存しない。レイヤ1では、サンプル(サンプル2、5、7、10)は、下位のレイヤ(すなわち、レイヤ0)内のサンプル及びこのレイヤ1内のサンプルに依存する。レイヤ2では、サンプル(サンプル3、4、8、9)は、下位のレイヤ(すなわち、レイヤ0及びレイヤ1)内のサンプル及びこのレイヤ2内のサンプルに依存する。したがって、レイヤ2のサンプルは、下位のレイヤ0及びレイヤ1からのサンプルを復号する能力に影響することなく除外することができる。
サンプルグループボックス1416におけるデータは、上述したようなサンプルとレイヤの間の関係を示す。ここに示すように、このデータは、繰り返しレイヤパターン1414を含んでいる。この繰り返しレイヤパターン1414は、上述のように、各繰り返しレイヤパターン1414を最初のレイヤパターンへの参照情報と、このパターンが出現する回数を表す情報に変換することによって圧縮される。
図14Eは、サブシーケンス(sseq)サンプルグループタイプに関するサンプルグループボックス1418の使用を説明する図である。サンプル1〜11は、サンプルの相互依存性に基づいて、4個のサブシーケンスに分割される。レイヤ0におけるサブシーケンス0を除く各サブシーケンスは、他のサブシーケンスが依存しないサンプルを含んでいる。したがって、サブシーケンスにおけるサンプルは、必要に応じて、一括して除外できる。
サンプルグループボックス1418内のデータは、サンプルとサブシーケンスの間の関係を示している。このデータにより、対応するサブシーケンスの最初のサンプルにランダムアクセスすることができる。
一実施例では、サブシーケンス記述エントリボックスは、GOP内のサンプルの各サブシーケンスについて説明するために使用されている。サブシーケンス記述エントリボックスは、サブシーケンス識別子データ、平均ビットレートデータ、平均フレームレートデータ、参照番号データ及び参照されたデータに関する情報を含むアレーに関係する依存関係情報を提供する。
依存関係情報は、このエントリにおいて記述されるサブシーケンスへの参照情報として用いられるサブシーケンスを特定する。サブシーケンス識別子データは、このエントリにおいて記述するサブシーケンスの識別子を提供する。平均ビットレートデータは、このサブシーケンスの平均ビットレートを示す情報(例えば、ビット又は秒によって表される)を含んでいる。一実施例においては、平均ビットレートは、ペイロードとペイロードヘッダを考慮に入れて算出される。一実施例においては、平均ビットレートが未定義である場合、平均ビットレートは、0となる。
平均フレームレートデータは、エントリのサブシーケンスのフレームにおける平均フレームレートを示す情報を含んでいる。一実施例においては、平均フレームレートが未定義である場合、平均フレームレートは、0となる。
参照番号データは、エントリのサブシーケンスにおける、直接参照されたサブシーケンスの数を示す情報を提供する。参照されたデータのアレーは、参照されたサブシーケンスに関する識別情報を提供する。
一実施例においては、追加的な層記述エントリボックスを用いて、層情報を提供する。層記述エントリボックスは、層の数、層の平均ビットレート及び平均フレームレートに関する情報を提供する。ベース層及び1以上の各エンハンスメント層については、層の数は、0となる。平均ビットレートが未定義である場合、平均ビットレートは、0となり、平均フレームレートが未定義である場合、平均フレームレートは、0となる。
ストリーム切換
典型的なストリーミングのシナリオにおける主要な要求の1つは、ネットワーク状態の変化に応じて圧縮データのビット伝送速度をスケーリングすることである。これを実現する最も単純な手法は、代表的なネットワーク状態に対応する異なるビットレート及び品質設定で複数のストリームを符号化することである。これにより、サーバは、ネットワーク状態に応じて、これらの予め符号化されたストリーム間を切り換えることができる。
JVT規格は、2つのピクチャのそれぞれが予測に同じフレームを用いることなく一方のピクチャを他方のピクチャと同様に再構築できる切換ピクチャと呼ばれる新しい種類のピクチャを提供する。特に、JVTは、Iフレームと同様に、他の如何なるピクチャにも依存せずに符号化されるSIピクチャと、他のピクチャを参照して符号化されるSPピクチャの2つのタイプの切換ピクチャを提供する。切換ピクチャを用いることにより、伝送条件の変化に対応して、異なるビット伝送速度と品質設定を有するストリーム間で切換を行い、エラー回復及び早送り及び巻戻し等のトリックモードを実現することができる。
ここで、JVT切換ピクチャを有効に活用するためには、ストリーム切換、エラー回復、トリックモード及び他の特徴を実現する場合、プレーヤは、保存されたメディアデータのどのサンプルが代替的な表現を有するか及びこれらのサンプルの依存関係は如何なるものであるかを知る必要がある。既存のファイルフォーマットは、このような機能を提供しない。
本発明の一実施例では、切換サンプルセットを定義することによってこの問題を解決する。切換サンプルセットは、復号値が同じであるが、異なる参照サンプルを用いることができるサンプルの組を表す。参照サンプルは、他のサンプルの値を予測するために用いられるサンプルである。切換サンプルセットの各要素は、切換サンプルと呼ばれる。図15Aは、切換サンプルセットを用いたビットストリーム切換を説明する図である。
図15Aに示すように、ストリーム1及びストリーム2は、異なる品質及びビットレートパラメータを有する同じコンテンツの2つの符号化データ(encodings)を表している。サンプルS12は、どちらのストリームにも出現せず、ストリーム1からストリーム2への切換(切換は、方向的性質を有する)を実現するために用いられるSPピクチャである。サンプルのS12、S2は、切換サンプルセットに含まれている。S1とS12は、いずれもトラック1のサンプルP12から予測され、S2は、トラック2のサンプルP22から予測される。サンプルのS12とS2は、異なる参照サンプルを用いるが、これらの復号値は同一である。したがって、ストリーム1からストリーム2への(ストリーム1内のサンプルS1とストリーム2内のサンプルS2における)切換は、切換サンプルS12を介して行うことができる。
図16及び図17は、それぞれ符号化システム100及び復号システム200によって実行される切換サンプルメタデータの保存及び検索のための処理を示している。この処理は、ハードウェア(例えば回路、専用ロジック等)、ソフトウェア(汎用コンピュータシステム又は専用マシン上で実行されるソフトウェア)又はこれらの両方の組合せを含む処理ロジックによって実行してもよい。
図16は、符号化システム100において、切換サンプルメタデータを作成するための処理1600の一実施例を示すフローチャートである。まず、処理1600は、処理ロジックが符号化されたメディアデータに関連するファイルを受け取ることにより開始される(処理ブロック1602)。このファイルは、メディアデータに関する1以上の代替的な符号化データ(例えば、代表的なネットワーク状態に対応する異なる帯域幅及び品質設定を有する。)を含んでいる。代替的な符号化データは、1つ以上の切換ピクチャを含んでいる。このようなピクチャは、代替的なメディアデータストリーム内に含めてもよく、エラー回復又はトリックモード等の特別な特徴を実現する個別のエンティティとして作成してもよい。本発明では、これらのトラック及び切換ピクチャを作成する手法を特に限定しないが、当業者にとって、様々な手法を用いることができることは明らかである。例えば、代替的符号化データを含む各トラックの対の間に切換サンプルを周期的に(例えば、1秒毎に)挿入してもよい。
次に、処理ロジックは、異なる参照サンプルを用いて、同じ復号値が導出されるサンプルを含む切換サンプルセットを作成するためにファイルを調べ(処理ブロック1604)、メディアデータに関する切換サンプルセットを定義し、切換サンプルセット内のサンプルを記述する切換サンプルメタデータを作成する(処理ブロック1606)。一実施例では、切換サンプルメタデータは、ネスト化されたテーブルの組を含むテーブルボックス等の予め定義されたデータ構造に組織化される。
次に、一実施例において、処理ロジックは、切換サンプルメタデータ構造がデータの繰り返しシーケンスを含むか否かを判定する(デシジョンボックス1608)。この判定の結果が肯定的である場合、処理ロジックは、データの各繰り返しシーケンスをシーケンスの出現への参照情報及びシーケンスの出現回数を表す情報に変換する(処理ブロック1610)。
次に、処理ブロック1612において、処理ロジックは、特定のメディアファイルフォーマット(例えば、JVTファイルフォーマット)を用いて、メディアデータに関連するファイル内に切換サンプルメタデータを含める。一実施例においては、切換サンプルメタデータは、ストリーム切換のために指定された別のトラックに保存してもよい。他の実施例においては、切換サンプルメタデータは、サンプルメタデータとともに保存される(例えば、シーケンスデータ構造は、サンプルテーブルボックスに含めてもよい)。
図17は、復号システム200において切換サンプルメタデータを利用するための処理1700の一実施例を示すフローチャートであるである。まず、処理1700は、処理ロジックが符号化されたメディアデータに関連するファイルを受け取ることにより開始される(処理ブロック1702)。ファイルは、データベース(ローカル又は外部のデータベース)、符号化システム100又はネットワーク内の他の如何なる機器から受け取ってもよい。ファイルは、メディアデータに関連する切換サンプルセットを定義する切換サンプルメタデータを含んでいる。
次に、処理ロジックは、ファイルからサンプルグループメタデータを抽出する(処理ブロック1704)。上述のように、切換サンプルメタデータは、例えば、ネスト化されたテーブルの組を含むテーブルボックス等のデータ構造に保存できる。
更に処理ブロック1706において、処理ロジックは、抽出されたメタデータを用いて、特定のサンプルを含む切換サンプルセットを検出し、切換サンプルセットからの代替のサンプルを選択する。初期サンプルと同じ復号値を有する代替のサンプルを用いて、ネットワーク状態の変化に応じて、異なる符号化処理が施された2つのビットストリームを切り換えてもよく、これにより、ビットストリーム内にランダムアクセスエントリポイントを提供でき、エラー回復が容易になる。
以下、切換サンプルメタデータ構造の具体例について、拡張ISOメディアファイルフォーマット(拡張MP4とも呼ばれる。)に関連して説明する。但し、切換サンプルメタデータを格納するための様々なデータ構造を組み込むように、この他のファイルフォーマットを拡張してもよいことは明らかである。
図18は、切換サンプルメタデータを保存するための例示的なデータ構造を示している。例示的なデータ構造は、一組のネスト化されたテーブルを含む切換サンプルテーブルボックスの形式を有している。テーブル1802内の各エントリは、1つの切換サンプルセットを特定する。各切換サンプルセットは、再構築の結果が客観的に同じである(又は、知覚的に同じである)が、切換サンプルと同じ又は異なるトラック(ストリーム)内の異なる参照サンプルから予測される場合もある切換サンプルのグループからなる。テーブル1802内の各エントリは、対応するテーブル1804にリンクされる。テーブル1804は、切換サンプルセットに含まれる各切換サンプルを特定する。テーブル1804内の各エントリは、更に切換サンプルの位置(すなわち、そのトラックとサンプル番号)を定義する対応するテーブル1806にリンクされ、トラックは、切換サンプルによって用いられる参照サンプルと、切換サンプルによって用いられる参照サンプルの総数と、切換サンプルによって用いられる各切換サンプルとを含んでいる。
図15Aに示すように、一実施例では、切換サンプルメタデータは、同じコンテンツの異なる符号化が施されたされたバージョンを切り換えるために用いることができる。MP4では、各代替的な符号化データは、別々のMP4トラックとして保存され、トラックヘッダ内の「代替グループ(alternate group)」は、そのデータが特定のコンテンツを代替的な符号化データであることを示す。
図15Bは、図15Aに示すサンプルS2、S12からなる切換サンプルセット1502を定義するメタデータを含むテーブルを示している。
図15Cは、2つのビットストリーム間の切替を行うポイントを決定するための処理1510の一実施例を示すフローチャートである。ストリーム1からストリーム2への切換を行う場合、処理1510は、まず、切換サンプルメタデータを検索し、そしてストリーム1の参照トラックを有する切換サンプル及びストリーム2の切換サンプルトラックを有する切換サンプルを含む全ての切換サンプルセットを検出する(処理ブロック1512)。次に、検出された切換サンプルセットを評価し、ストリーム1の参考トラックを有する切換サンプルの全ての参照サンプルが利用可能である切換サンプルセットを選択する(処理ブロック1514)。例えばストリーム1の参照トラックを有する切換サンプルがPフレームである場合、切換を行う前に、1つのサンプルが利用可能である必要がある。更に、選択された切換サンプルセットにおけるサンプルは、切換ポイントを特定するために用いられる(処理ブロック1516)。すなわちストリーム1の参照トラックを有する切換サンプルを介して、ストリーム1の参照トラックを有する切換サンプルの最も高い参照サンプル(highest reference sample)の直後及びストリーム2の切換サンプルトラックを有する切換サンプルの直後のサンプルが切換ポイントであるとみなされる。
他の実施例においては、切換サンプルメタデータを用いて、図19A〜図19Cに示すように、ビットストリームにおけるエントリポイントへのランダムアクセスを容易に行うことができる。
図19A及び図19Bに示すように、切換サンプル1902は、サンプルS2、S12を含む。S2は、P22から予測され、通常のストリーム再生時に用いられるPフレームである。S12は、(例えばスプライスのために)ランダムアクセスポイントとして用いられる。S12が一旦復号されると、P24の復号を含むストリーム再生は、P24がS2の後に復号されているかのようにして続行される。
図19Cは、サンプルに関するランダムアクセスポイント(例えば、トラックTにおけるサンプルS)を決定するための処理1910の一実施例を示すフローチャートである。処理1910は、切換サンプルメタデータを検索し、切換サンプルトラックTを有する切換サンプルを含む全ての切換サンプルセットを検出することによって開始される(処理ブロック1912)。次に、検出された切換サンプルセットを評価し、切換サンプルトラックTを有する切換サンプルが、復号順序において、サンプルSに先行する最も近いサンプルである切換サンプルセットを選択する(処理ブロック1514)。更に選択された切換サンプルセットから、サンプルSへのランダムアクセスポイントとして、切換サンプルトラックTを有する切換サンプル以外の切換サンプル(サンプルSS)を選択する(処理ブロック1916)。ストリーム再生時には、サンプルSの代わりに(サンプルSSのためのエントリにおいて特定された全ての参照サンプルを復号することによって)サンプルSSが復号される。
更に別の実施例では図20A〜20Cに示すように、切換サンプルメタデータを用いて、エラー回復を容易に行うことができる。
図20A及び図20Bに示すように、切換サンプル2002は、サンプルS2、S12、S22を含む。サンプルS2は、サンプルP4から予測される。サンプルS12は、サンプルS1から予測される。サンプルのP2とP4の間にエラーが発生した場合、サンプルS2の代わりに切換サンプルS12を復号できる。これに続いて、ストリーミングは、通常通りサンプルP6から続行される。また、エラーがサンプルS1に影響を与えた場合、同様に、サンプルS2の代わりに切換サンプルS22を復号でき、これに続いて、ストリーミングは、通常通りサンプルP6から続行される。
図20Cは、サンプル(例えば、サンプルS)を送信する際のエラー回復を容易にするための処理2012の一実施例を示すフローチャートである。処理2012は、切換サンプルメタデータを検索し、サンプルSに等しい切換サンプルを含む全ての切換サンプルセットを検出することによって開始される(処理ブロック2010)。次に、検出された切換サンプルセットを評価し、サンプルSに最も近く、参照サンプル値が正しいことが既知である(フィードバック又は他の情報源を介して)切換サンプルSSを有する切換サンプルを選択する(処理ブロック2014)。そして、サンプルSの代わりに切換サンプルSSを送信する(処理ブロック2016)。
パラメータセット及び補足的拡張情報の保存
上述のように、パラメータセットメタデータ等の幾つかのメタデータは、関連するメディアデータから独立して保存できる。図21は、本発明の一実施例に基づいて、パラメータセットメタデータを別個に保存する手法を説明する図である。図21に示すように、メディアデータは、ビデオトラック2102に保存され、パラメータセットメタデータは、独立したパラメータトラック2104に保存される。このパラメータトラック2104には、メディアデータが保存されていないことを示すために、「非アクティブ(inactive)」のマークを付してもよい。タイミング情報2106は、ビデオトラック2102とパラメータトラック2104の間の同期に用いられる。一実施例においては、タイミング情報は、ビデオトラック2102とパラメータセットトラック2104のそれぞれのサンプルテーブルボックス内に保存される。一実施例においては、各パラメータセットは、1個のパラメータセットサンプルによって表され、同期は、メディアサンプルのタイミング情報がパラメータセットサンプルのタイミング情報と等しい場合に実現される。
他の実施例においては、オブジェクト記述子(object descriptor:OD)メッセージを用いて、パラメータセットメタデータが含められる。MPEG−4規格では、オブジェクト記述子は、単一のオブジェクト(メディアオブジェクト又はシーン記述)に関連するストリームの構成及びこの他の情報を提供する1つ以上のエレメンタリストリーム記述子を表す。オブジェクト記述子メッセージは、オブジェクト記述子ストリームを介して送信される。図22に示すように、パラメータセットは、オブジェクト記述子メッセージ2204としてオブジェクト記述子ストリーム2202に含まれている。オブジェクト記述子ストリーム2202は、メディアデータを搬送するビデオエレメンタリストリームと同期する。
SEIの保存について、更に詳細に説明する。
一実施例においては、SEIデータは、メディアデータとともに、エレメンタリストリームに保存される。図23は、メディアデータと共にエレメンタリストリームデータ2302に直接埋め込まれているSEIメッセージ2304を示す。
他の実施例においてはSEIメッセージは、サンプルとして独立したSEIトラックに保存される。
本発明の幾つかの実施例における、独立したトラックにおけるSEIメッセージの保存の手法を図24及び図25に示す、
図24に示す具体例では、メディアデータは、ビデオトラック2402に保存され、SEIメッセージは、サンプルとして、独立したSEIトラック2404に保存される。タイミング情報2406は、ビデオトラック2402とSEIトラック2404との間の同期に用いられる。
図25に示す具体例では、メディアデータは、ビデオトラック2502に保存され、SEIメッセージは、オブジェクトコンテンツ情報(object content information:以下、OCIという。)トラック2504に保存される。タイミング情報2506は、ビデオトラック2502とOCIトラック2504の間の同期に用いられる。MPEG−4規格では、OCIトラック2504は、シーンイベントに関する記述的なテキスト情報を提供するために共通に使用されるOCIデータを保存するために用いられる。各SEIメッセージは、オブジェクト記述子としてOCIトラック2504に保存される。一実施例においては、多くの場合、OCIトラックに格納されているデータのタイプを指定するOCI記述子エレメントフィールドは、SEIメッセージを搬送するために使用される。
更に別の実施例では、SEIデータは、メディアデータから独立したメタデータとして保存される。図26は、本発明の一実施例に従ってメタデータとして保存されたSEIデータを示している。
図26に示すように、ISOメディアファイルフォーマットによって定義されているユーザデータボックス2602は、SEIメッセージを保存するために使用されている。具体的には、各SEIメッセージは、トラック又はムービーボックスに含まれているユーザデータボックス2602内のSEIユーザデータボックス2604に保存される。
一実施例においては、SEIメッセージに含まれているメタデータは、メディアデータの記述を含んでいる。これらの記述は、MPEG−7規格よって定義されている記述子と記述スキームを表していてもよい。一実施例においては、SEIメッセージは、XMLに基づく記述等のXMLベースのデータの包含をサポートする。更に、SEIメッセージは、異なる種類のエンハンス情報の登録をサポートする。例えば、SEIメッセージは、新たな種類の登録を必要とすることなく、匿名のユーザデータをサポートできる。このようなデータは、特定の用途又は組織に限定して用いられることを意図するデータであってもよい。一実施例においては、SEIの存在は、ビットストリーム環境において、指定された開始コードによって示される。
一実施例においては、SEIメッセージにおいて記述されている拡張された能力の一部又は全てを提供するデコーダの能力は、外部の手法(例えば、H.245又はSDP勧告)によって示される。拡張された能力を有さないデコーダでは、単に、SEIメッセージを削除してもよい。
一実施例においては、後に詳細に説明するように、SEIメッセージのペイロードヘッダにおける指定されたフィールドを用いることにより、メディアデータ(例えば、画像符号化レイヤデータ)及びメディアデータの記述を含んでいるSEIメッセージを同期させる。
一実施例においては、ネットワークアダプテーション層は、基本的なトランスポートシステムにおける補足的拡張情報メッセージの伝送をサポートする。ネットワークアダプテーション層は、容認することができる帯域内(画像符号化層と同じトランスポートストリーム)又は帯域外のいずれによってSEIメッセージをシグナリングしてもよい。
一実施例においては、MPEG−7メタデータのSEIメッセージへの組込みは、MPEG−7メタデータのデリバリ層としてSEIを用いることによって実現される。詳しくは、SEIメッセージは、1つ以上の記述フラグメントを表すMPEG−7システムアクセスユニット(フラグメント)をカプセル化する。MPEG−7アクセスユニットとメディアデータとの同期は、SEIメッセージのペイロードヘッダにおいて、指定されたフィールドを用いることによって実現される。
他の実施例においては、MPEG−7メタデータのSEIメッセージへの組込みは、テキスト符号化又はバイナリの符号化のいずれかに基づいて、記述ユニットによってSEIメッセージを送信することによって実現される。記述ユニットは、単一のMPEG−7記述子であってもよく、記述スキームであってもよく、完全な記述からの部分的な情報を表すために用いることができる。スケーラブルなカラー記述子のためのXML構文の具体例を以下に示す。
Figure 2006505024
記述子又は記述スキームインスタンスは、後に詳細に説明するように、SEIメッセージヘッダを介して、メディアデータの対応する部分(例えば、サブサンプル、サンプル、フラグメント等)に関連付けることができる。この実施例では、例えば、単一のフレームのためのバイナリ符号化又はテキスト符号化されたカラー記述子をSEIメッセージとして送ることができる。SEIメッセージを用いることにより、画像符号化ストリームの潜在的な記述を提供できる。潜在的な記述とは、記述ユニットが潜在的に含まれている画像符号化ストリームの完全な記述である。潜在的な記述は、以下のような形式を有していてもよい。
Figure 2006505024
一実施例においては、記述のSEIメッセージへの組込みをサポートするためにSEIのフォーマットを改訂する。具体的には、SEIをSEIメッセージのグループとして表す。一実施例においては、SEIをデータのチャンクにカプセル化する。各SEIチャンクは、1つ以上のSEIメッセージを含むことができる。各SEIメッセージは、SEIヘッダとSEIペイロードを含む。SEIヘッダは、バイト列において、SEIチャンクの最初のバイトから又は先のSEIメッセージに続く最初の第1バイトから開始される。ペイロードは、SEIヘッダの直後に続き、SEIヘッダに続くバイトから開始される。
SEIヘッダは、メッセージの種類、メディアデータ部分の任意の識別子(例えば、サブサンプル、サンプル、フラグメント)、ペイロード長に関する情報を含んでいる。SEIヘッダの構文は、例えば、以下の通りである。
Figure 2006505024
MessageTypeフィールドは、ペイロードのメッセージの種類を示す。SEIメッセージタイプコードの具体例を以下の表1に示す。
Figure 2006505024
PayloadLengthフィールドは、バイトで表現されるSEIメッセージペイロードの長さを指定する。また、SEIヘッダは、このSEIメッセージが特定のサンプルに関連付けられているか否かをを示すサンプル同期フラグと、このSEIメッセージが特定のサブサンプルに関連付けられているか否かをを示すサブサンプル同期フラグと(サブサンプル同期フラグが設定されている場合、サンプル同期フラグも設定される)とを含んでいる。更に、SEIペイロードは、このメッセージが関連付けられているサンプルを指定するオプションのサンプル識別子フィールドと、メッセージが関連付けられているサブサンプルを指定するオプションのサブサンプル識別子フィールドとを含んでいる。サンプル識別子フィールドは、サンプル同期フラグが設定される場合にのみ存在する。同様に、サブサンプル識別子フィールドは、サブサンプル同期フラグが設定される場合にのみ存在する。サンプル識別子とサブサンプル識別子フィールドにより、SEIメッセージをメディアデータに同期させることができる。
一実施例においては、各SEIメッセージは、SEIメッセージ記述子によって送信される。SEI記述子は、1つ以上のSEIメッセージを含むSEIユニットにカプセル化される。SEIメッセージユニットの構文は、以下の通りである。
Figure 2006505024
SEIメッセージ記述子の構文は、以下の通りである。
Figure 2006505024
タイプフィールドは、SEIメッセージの種類を示す。SEIメッセージの具体例を以下の表2に示す。
Figure 2006505024
以下、表2に示す様々な種類のSEIメッセージについて、詳細に説明する。
SEIXMLDescriptorタイプは、例えば、完全なXML文書又はより大きい文書からのXMLフラグメントを含むことができるXMLベースのデータをカプセル化する記述子を示す。SEIXMLDescriptorの構文は、以下の通りである。
Figure 2006505024
SEIMetadataDescriptorタイプは、メタデータを含む記述子を示す。SEIMetadataDescriptorの構文は、以下の通りである。
Figure 2006505024
metadataFormatフィールドは、メタデータのフォーマットを特定する。メタデータフォーマットの値の具体例を以下の表3に示す。
Figure 2006505024
値0x10は、MPEG−7によって定義されているデータを示す。0x40〜0xFFまでの包括的な範囲に属する値は、独自のフォーマット(private format)の使用を示すために利用可能である。
metadataContentフィールドは、metadataFormatフィールドによって特定されたフォーマットによるメタデータの表現を含んでいる。
SEIMetadataRefDescriptorタイプは、メタデータの位置を示すURLを指定する記述子を示す。SEIMetadatRefDescriptorの構文は、以下の通りである。
Figure 2006505024
URLStringフィールドは、メタデータの位置を示すUTF−8符号化されたURLを含んでいる。
SEITextDescriptorタイプは、ビデオコンテンツを説明する又はビデオコンテンツに関係するテキストを含む記述子を示す。SEITextDescriptorの構文は、以下の通りである。
Figure 2006505024
languageCodeフィールドは、これに続くテキストフィールドの言語に関する言語コードを含んでいる。テキストフィールドは、UTF−8符号化されたテキストデータを含んでいる。
SEIURIDescriptorタイプは、ビデオコンテンツに関連するユニフォームリソース識別子(uniform resource identifier:URI)を含む記述子を示す。SEIURIDescriptorの構文は、以下の通りである。
Figure 2006505024
uriStringフィールドは、ビデオコンテンツのURIを含んでいる。
SEIOCLDescriptorタイプは、オブジェクトコンテンツ情報(Object Content Information:OCI)記述子を表すSEIメッセージを含む記述子を示す。SEIOCLDescriptorの構文は、以下の通りである。
Figure 2006505024
ociDescrフィールドは、OCI記述子を含んでいる。
SEIStartSegmentDescriptorタイプは、後に他のSEIメッセージに参照されることができるセグメントの最初を示す記述子を示す。セグメントの開始は、このSEI記述子が適用されるあるレイヤ(例えば、サンプルのグループ、セグメント、サンプル又はサブサンプル)に関連付けられる。SEIStartSegmentDecriptorの構文は、以下の通りである。
Figure 2006505024
segmentIDフィールドは、このセグメントを含むストリーム内における固有のバイナリ識別子(unique binary identifier)を示す。この値を用いて、他のSEIメッセージのセグメントを参照することができる。
SEIEndSegmentDecriptorタイプは、セグメントの最後を示す記述子を示す。これに先行して、同じsegmentID値を含むSEIStartSegmentメッセージが存在する必要がある。ここで不一致が発生した場合、デコーダは、このメッセージを無視する必要がある。セグメントの最後は、このSEI記述子が適用されるあるレイヤ(例えば、サンプルのグループ、セグメント、サンプル又はサブサンプル)に関連付けられる。SEIEndSegmentDecriptorの構文は以下の通りである。
Figure 2006505024
segmentIDフィールドは、このセグメントを含むストリーム内における固有のバイナリ識別子を示す。この値を用いて、他のSEIメッセージのセグメントを参照することができる。
オーディオビジュアルメタデータのストレージ及び検索について説明した。ここでは、特定の実施の形態を示したが、ここに示した特定の実施の形態に代えて、同じ目的を達成する如何なる構成を用いてもよいことは当業者にとって明らかである。したがって、本出願は、本発明のあらゆる適応例及び変形例を包含するものとする。
符号化システムの一実施例のブロック図である。 復号システムの一実施例のブロック図である。 本発明の実現に好適なコンピュータ環境のブロック図である。 符号化システムにおいて、サブサンプルメタデータを保存するための処理に関するフローチャートである。 復号システムにおいて、サブサンプルメタデータを使用するための処理に関するフローチャートである。 サブサンプルを有する拡張MP4メディアストリームモデルを説明する図である。 サブサンプルメタデータを保存するための例示的なデータ構造を示す図である。 サブサンプルメタデータを保存するための例示的なデータ構造を示す図である。 サブサンプルメタデータを保存するための例示的なデータ構造を示す図である。 サブサンプルメタデータを保存するための例示的なデータ構造を示す図である。 サブサンプルメタデータを保存するための例示的なデータ構造を示す図である。 サブサンプルメタデータを保存するための例示的なデータ構造を示す図である。 サブサンプルメタデータを保存するための例示的なデータ構造を示す図である。 サブサンプルメタデータを保存するための例示的なデータ構造を示す図である。 サブサンプルメタデータを保存するための例示的なデータ構造を示す図である。 サブサンプルメタデータを保存するための例示的なデータ構造を示す図である。 サブサンプルメタデータを保存するための例示的なデータ構造を示す図である。 符号化システムにおいてパラメータセットメタデータを保存するための処理に関するフローチャートである。 復号システムにおいて、パラメータセットメタデータを利用するための処理に関するフローチャートである。 パラメータセットメタデータを保存するための例示的なデータ構造を示す図である。 パラメータセットメタデータを保存するための例示的なデータ構造を示す図である。 パラメータセットメタデータを保存するための例示的なデータ構造を示す図である。 パラメータセットメタデータを保存するための例示的なデータ構造を示す図である。 パラメータセットメタデータを保存するための例示的なデータ構造を示す図である。 例示的な拡張グループオブピクチャ(GOP)を示す図である。 符号化システムにおいて、シーケンスメタデータを保存するための処理に関するフローチャートである。 復号システムにおいて、シーケンスメタデータを使用するための処理に関するフローチャートである。 シーケンスメタデータを保存するために例示的なデータ構造を示す図である。 シーケンスメタデータを保存するために例示的なデータ構造を示す図である。 シーケンスメタデータを保存するために例示的なデータ構造を示す図である。 シーケンスメタデータを保存するために例示的なデータ構造を示す図である。 シーケンスメタデータを保存するために例示的なデータ構造を示す図である。 ビットストリーム切換のための切換サンプルセットの使用法を示す図である。 ビットストリーム切換のための切換サンプルセットの使用法を示す図である。 2つのビットストリームの間の切換を行うポイントを判定するための処理の一実施例を示すフローチャートである。 符号化システムにおいて、切換サンプルメタデータを保存するための処理に関するフローチャートである。 復号システムにおいて、切換サンプルメタデータを使用するための処理に関するフローチャートである。 切換サンプルメタデータを保存するための例示的なデータ構造を示す図である。 ランダムアクセスエントリポイントを実現するための切換サンプルセットの使用法を示す図である。 ランダムアクセスエントリポイントを実現するための切換サンプルセットの使用法を示す図である。 サンプルのランダムアクセスポイントを判定するための処理の一実施例に関するフローチャートである。 エラー回復を実現するための切換サンプルセットの使用法を示す図である。 エラー回復を実現するための切換サンプルセットの使用法を示す図である。 サンプル送信時のエラー回復を実現するための処理の一実施例に関するフローチャートである。 本発明の幾つかの実施例に基づくパラメータセットメタデータの保存を説明する図である。 本発明の幾つかの実施例に基づくパラメータセットメタデータの保存を説明する図である。 本発明の幾つかの実施例に基づく補足的拡張情報(supplemental enhancement information:SEI)の保存を説明する図である。 本発明の幾つかの実施例に基づく補足的拡張情報(supplemental enhancement information:SEI)の保存を説明する図である。 本発明の幾つかの実施例に基づく補足的拡張情報(supplemental enhancement information:SEI)の保存を説明する図である。 本発明の幾つかの実施例に基づく補足的拡張情報(supplemental enhancement information:SEI)の保存を説明する図である。

Claims (34)

  1. マルチメディアデータの複数の部分の1つ以上のパラメータセットを定義するパラメータセットメタデータを特定するステップと、
    マルチメディアデータを復号するために復号システムに送信されるパラメータセットメタデータをマルチメディアデータとは別に保存するステップとを有するデータ処理方法。
  2. 上記マルチメディアデータの複数の部分は、該マルチメディアデータ内のサンプルであることを特徴とする請求項1記載のデータ処理方法。
  3. 上記マルチメディアデータの複数の部分は、該マルチメディアデータの部分内のサブサンプルであることを特徴とする請求項1記載のデータ処理方法。
  4. 上記マルチメディアデータは、ビデオトラックに保存され、
    上記パラメータセットメタデータは、パラメータトラックに保存されることを特徴とする請求項1記載のデータ処理方法。
  5. 上記パラメータトラックを上記ビデオトラックと同期させるステップを更に有する請求項4記載のデータ処理方法。
  6. 上記パラメータトラックは、非アクティブであることを特徴とする請求項4記載のデータ処理方法。
  7. 上記各パラメータセットは、パラメータセットサンプルとして、上記パラメータトラックに保存されることを特徴とする請求項4記載のデータ処理方法。
  8. ビデオエレメンタリストリームを介して上記マルチメディアデータを送信するステップと、
    上記パラメータセットメタデータをオブジェクト記述子ストリームとして送信するステップとを更に有する請求項1記載のデータ処理方法。
  9. 上記各パラメータセットは、オブジェクト記述子メッセージとして、オブジェクト記述子ストリームを介して送信されることを特徴とする請求項8記載のデータ処理方法。
  10. 上記オブジェクト記述子ストリームを上記ビデオエレメンタリストリームに同期させるステップを更に有する請求項8記載のデータ処理方法。
  11. 復号システムにおいて、マルチメディアデータ及び独立したパラメータセットメタデータを受信するステップを更に有し、該独立したパラメータセットメタデータは、少なくともマルチメディアデータの一部を復号するために必要である1つ以上のパラメータセットのどれかを特定するために用いられることを特徴とする請求項1記載のデータ処理方法。
  12. マルチメディアデータに関係する1つ以上の記述を特定するステップと、
    後に復号システムに送信され、上記マルチメディアデータの復号において任意に使用される補足的拡張情報(supplemental enhancement information:SEI)に上記マルチメディアデータに関連する1つ以上の記述を含めるステップとを有するデータ処理方法。
  13. 上記SEIは、マルチメディアデータとは別にSEIメタデータとして保存されることを特徴とする請求項12記載のデータ処理方法。
  14. 上記SEIメタデータは、複数のSEIメッセージを含んでいることを特徴とする請求項13記載のデータ処理方法。
  15. 上記複数のSEIメッセージのそれぞれは、ムービーボックスのトラックのボックスとして保存されることを特徴とする請求項14記載のデータ処理方法。
  16. 上記マルチメディアデータは、ビデオトラックに保存され、上記SEIメタデータは、SEIトラックに保存されることを特徴とする請求項13記載のデータ処理方法。
  17. 上記SEIトラックをビデオトラックに同期させるステップを更に有する請求項16記載のデータ処理方法。
  18. 上記SEIトラックは、サンプル内に複数のSEIメッセージを含んでいることを特徴とする請求項17記載のデータ処理方法。
  19. ビデオエレメンタリストリームを介して上記マルチメディアデータを送信するステップと、
    オブジェクトコンテンツ情報(object content information:OCI)ストリームを介して、上記SEIメタデータを送信するステップとを更に有する請求項13記載のデータ処理方法。
  20. 上記複数のSEIメッセージのそれぞれは、OCI記述子として、OCIストリームを介して送信されることを特徴とする請求項19記載のデータ処理方法。
  21. 上記1つ以上の記述のそれぞれは、記述子及び記述子スキームのいずれかであることを特徴とする請求項12記載のデータ処理方法。
  22. 上記複数のSEIメッセージのそれぞれは、該複数のSEIメッセージのそれぞれをマルチメディアデータの対応する部分に関連付けるデータを有するペイロードヘッダを含んでいることを特徴とする請求項14記載のデータ処理方法。
  23. 上記マルチメディアデータの対応する部分は、サンプル、サブサンプル、サンプルのグループのうちのいずれか1つであることを特徴とする請求項22記載のデータ処理方法。
  24. 上記1つ以上の記述をSEIに含めるステップは、MPEG−7システムアクセスユニットを複数のSEIメッセージの1つにカプセル化するステップを含むことを特徴とする請求項12記載のデータ処理方法。
  25. 上記1つ以上の記述のそれぞれを複数のSEIメッセージの1つによって送信するステップを更に有する請求項12記載のデータ処理方法。
  26. 上記1つ以上の記述は、テキスト的に又はバイナリ的に符号化されることを特徴とする請求項25記載のデータ処理方法。
  27. マルチメディアデータを含む第1のファイルを作成するメディアファイル作成器と、
    マルチメディアデータの複数の部分と1つ以上のパラメータセットを定義するパラメータセットメタデータを特定し、後に復号システムにおいて、マルチメディアデータを復号するときに使用される、パラメータセットメタデータを含む第2のファイルを作成するメタデータファイル作成器とを備えるデータ処理装置。
  28. マルチメディアデータを含む第1のファイルを作成するメディアファイル作成器と、
    マルチメディアデータに関係する1つ以上の記述を特定し、後に復号システムに送信され、上記マルチメディアデータの復号において任意に使用される補足的拡張情報(supplemental enhancement information:SEI)に上記マルチメディアデータに関連する1つ以上の記述を含めるメタデータ作成器とを備えるデータ処理装置。
  29. マルチメディアデータの複数の部分の1つ以上のパラメータセットを定義するパラメータセットメタデータを特定する特定手段と、
    マルチメディアデータを復号するために復号システムに送信されるパラメータセットメタデータをマルチメディアデータとは別に保存する保存手段とを備えるデータ処理装置。
  30. マルチメディアデータに関係する1つ以上の記述を特定する特定手段と、
    後に復号システムに送信され、上記マルチメディアデータの復号において任意に使用される補足的拡張情報(supplemental enhancement information:SEI)に上記マルチメディアデータに関連する1つ以上の記述を含める記述追加手段とを備えるデータ処理装置。
  31. メモリと、
    上記メモリに接続され、一組の命令を実行する少なくとも1つのプロセッサとを備え、
    上記少なくとも1つのプロセッサは、上記一組の命令を実行することにより、
    マルチメディアデータの複数の部分の1つ以上のパラメータセットを定義するパラメータセットメタデータを特定し、
    マルチメディアデータを復号するために復号システムに送信されるパラメータセットメタデータをマルチメディアデータとは別に保存するデータ処理システム。
  32. メモリと、
    上記メモリに接続され、一組の命令を実行する少なくとも1つのプロセッサとを備え、
    上記少なくとも1つのプロセッサは、上記一組の命令を実行することにより、
    マルチメディアデータに関係する1つ以上の記述を特定し、
    後に復号システムに送信され、上記マルチメディアデータの復号において任意に使用される補足的拡張情報(supplemental enhancement information:SEI)に上記マルチメディアデータに関連する1つ以上の記述を含めるデータ処理システム。
  33. プロセッサにより実行され、該プロセッサにデータ処理方法を実行させるコンピュータにより読取可能な媒体であって、該データ処理方法は、
    マルチメディアデータの複数の部分の1つ以上のパラメータセットを定義するパラメータセットメタデータを特定するステップと、
    マルチメディアデータを復号するために復号システムに送信されるパラメータセットメタデータをマルチメディアデータとは別に保存するステップとを有するコンピュータにより読取可能な媒体。
  34. プロセッサにより実行され、該プロセッサにデータ処理方法を実行させるコンピュータにより読取可能な媒体であって、該データ処理方法は、
    マルチメディアデータに関係する1つ以上の記述を特定するステップと、
    後に復号システムに送信され、上記マルチメディアデータの復号において任意に使用される補足的拡張情報(supplemental enhancement information:SEI)に上記マルチメディアデータに関連する1つ以上の記述を含めるステップとを有するコンピュータにより読取可能な媒体。
JP2004505908A 2002-04-29 2003-04-29 データ処理方法及び装置 Abandoned JP2006505024A (ja)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US37665202P 2002-04-29 2002-04-29
US37665102P 2002-04-29 2002-04-29
US10/371,464 US20030163477A1 (en) 2002-02-25 2003-02-21 Method and apparatus for supporting advanced coding formats in media files
US10/425,685 US20040006575A1 (en) 2002-04-29 2003-04-28 Method and apparatus for supporting advanced coding formats in media files
PCT/US2003/013145 WO2003098475A1 (en) 2002-04-29 2003-04-29 Supporting advanced coding formats in media files

Publications (1)

Publication Number Publication Date
JP2006505024A true JP2006505024A (ja) 2006-02-09

Family

ID=29554444

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004505908A Abandoned JP2006505024A (ja) 2002-04-29 2003-04-29 データ処理方法及び装置

Country Status (8)

Country Link
EP (1) EP1500002A1 (ja)
JP (1) JP2006505024A (ja)
KR (1) KR20040106414A (ja)
CN (1) CN100419748C (ja)
AU (1) AU2003237120B2 (ja)
DE (1) DE10392598T5 (ja)
GB (1) GB2403835B (ja)
WO (1) WO2003098475A1 (ja)

Cited By (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008136211A (ja) * 2006-11-27 2008-06-12 Thomson Licensing 符号化装置、復号化装置、記録装置、オーディオ/ビデオデータ送信システム
JP2008536193A (ja) * 2005-04-13 2008-09-04 ドルビー・ラボラトリーズ・ライセンシング・コーポレーション 音声メタデータ確認
JP2009535969A (ja) * 2006-05-03 2009-10-01 テレフオンアクチーボラゲット エル エム エリクソン(パブル) メディア表現からメディアを再構成する方法及び装置
JP2009543386A (ja) * 2006-03-27 2009-12-03 ヴィドヨ,インコーポレーテッド スケーラブルビデオ及びオーディオ符号化システムにおける、制御メッセージを用いた、スケーラビリティ情報の管理のためのシステム及び方法
JP2010509896A (ja) * 2006-11-14 2010-03-25 クゥアルコム・インコーポレイテッド チャネルスイッチングのためのシステムと方法
JP2010539834A (ja) * 2007-09-19 2010-12-16 フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン メディアデータコンテナとメタデータコンテナとを有するファイルを格納し読み取るための装置及び方法
JP2011501553A (ja) * 2007-10-16 2011-01-06 サムスン エレクトロニクス カンパニー リミテッド メディア・コンテンツ及びメタデータを符号化する方法及びその装置
US8229983B2 (en) 2005-09-27 2012-07-24 Qualcomm Incorporated Channel switch frame
JP2013051707A (ja) * 2007-04-17 2013-03-14 Thomson Licensing データストリームにおけるビデオデータ及び関連するメタデータを送信する方法
US8670437B2 (en) 2005-09-27 2014-03-11 Qualcomm Incorporated Methods and apparatus for service acquisition
US8761162B2 (en) 2006-11-15 2014-06-24 Qualcomm Incorporated Systems and methods for applications using channel switch frames
JP2014519789A (ja) * 2011-06-14 2014-08-14 サムスン エレクトロニクス カンパニー リミテッド マルチメディアシステムにおけるメディアコンテンツを送受信する方法及び装置
KR101484843B1 (ko) 2013-04-19 2015-01-20 삼성전자주식회사 멀티미디어 전송 시스템에서 미디어 전송 패킷 전송 방법 및 장치
JP2015053703A (ja) * 2010-07-20 2015-03-19 クゥアルコム・インコーポレイテッドQualcomm Incorporated ビデオデータをストリーミングするためのシーケンスデータセットを提供すること
JP2015519807A (ja) * 2012-04-25 2015-07-09 クゥアルコム・インコーポレイテッドQualcomm Incorporated ビデオ・ファイルにおけるパラメータ・セットを識別すること

Families Citing this family (48)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8472792B2 (en) 2003-12-08 2013-06-25 Divx, Llc Multimedia distribution system
US7519274B2 (en) 2003-12-08 2009-04-14 Divx, Inc. File format for multiple track digital data
BRPI0418464B1 (pt) 2004-02-10 2019-02-05 Thompson Licensing armazenamento de conjuntos de parâmetros de codificação de vídeo avançada (avc) no formato de arquivo avc
US8315307B2 (en) 2004-04-07 2012-11-20 Qualcomm Incorporated Method and apparatus for frame prediction in hybrid video compression to enable temporal scalability
US8010566B2 (en) 2004-10-13 2011-08-30 Electronics And Telecommunications Research Institute Extended multimedia file structure and multimedia file producting method and multimedia file executing method
RU2377736C2 (ru) 2005-04-13 2009-12-27 Нокиа Корпорейшн Кодирование, хранение и передача информации о масштабируемости
CN101313578B (zh) * 2005-09-26 2011-10-19 韩国电子通信研究院 用于在可伸缩视频编码中定义和重构感兴趣区域的方法和装置
FR2894739A1 (fr) * 2005-12-12 2007-06-15 Thomson Licensing Sa Procede de codage, procede de decodage, dispositif de codage et dispositif de decodage de donnees video
WO2007112384A2 (en) 2006-03-27 2007-10-04 Vidyo, Inc. System and method for management of scalability information in scalable video and audio coding systems using control messages
EP2041976A4 (en) 2006-07-12 2012-06-20 Nokia Corp SIGNALING OF SCALABILITY INFORMATION FROM THE INTERESTING REGION IN MEDIA FILES
EP2041974A4 (en) 2006-07-12 2014-09-24 Lg Electronics Inc METHOD AND DEVICE FOR CODING / DECODING A SIGNAL
AU2012202346B2 (en) * 2006-08-24 2014-07-24 Provenance Asset Group Llc System and method for indicating track relationships in media files
KR101021831B1 (ko) 2006-08-24 2011-03-17 노키아 코포레이션 미디어 파일에서 트랙 관계를 표시하는 시스템 및 방법
US8365060B2 (en) 2006-08-24 2013-01-29 Nokia Corporation System and method for indicating track relationships in media files
WO2008046243A1 (en) * 2006-10-16 2008-04-24 Thomson Licensing Method and device for encoding a data stream, method and device for decoding a data stream, video indexing system and image retrieval system
US20080181298A1 (en) * 2007-01-26 2008-07-31 Apple Computer, Inc. Hybrid scalable coding
RU2510908C2 (ru) * 2007-02-23 2014-04-10 Нокиа Корпорейшн Описание характеристик агрегированных блоков медиаданных с обратной совместимостью
US20100142613A1 (en) * 2007-04-18 2010-06-10 Lihua Zhu Method for encoding video data in a scalable manner
PL2528341T3 (pl) 2007-04-18 2017-10-31 Dolby Int Ab System kodowania, stosujący uzupełniający zestaw parametrów sekwencyjnych do skalowalnego kodowania wideo lub kodowania wielowidokowego
DE102007045741A1 (de) * 2007-06-27 2009-01-08 Siemens Ag Verfahren und Vorrichtung zum Codieren und Decodieren von Multimediadaten
KR101451239B1 (ko) * 2007-08-13 2014-10-15 삼성전자 주식회사 미디어 파일 포맷에서 메타데이터의 생성 방법, 접근 방법및 그 장치
EP2191402A4 (en) * 2007-08-20 2014-05-21 Nokia Corp SEGMENTED METADATA AND INDEXES FOR MULTIMEDIA FLOW DATA
WO2009065137A1 (en) 2007-11-16 2009-05-22 Divx, Inc. Hierarchical and reduced index structures for multimedia files
US8081635B2 (en) 2008-10-08 2011-12-20 Motorola Solutions, Inc. Reconstruction of errored media streams in a communication system
JP5542913B2 (ja) * 2009-04-09 2014-07-09 テレフオンアクチーボラゲット エル エム エリクソン(パブル) メディアファイルを生成し処理するための方法および構成
US8976871B2 (en) 2009-09-16 2015-03-10 Qualcomm Incorporated Media extractor tracks for file format track selection
JP5591932B2 (ja) * 2009-09-22 2014-09-17 クゥアルコム・インコーポレイテッド ファイルフォーマットトラック選択のためのメディアエクストラクタトラック
EP2537318A4 (en) * 2010-02-19 2013-08-14 Ericsson Telefon Ab L M METHOD AND ARRANGEMENT FOR DISPLAY SWITCHING IN AN HTTP STREAMING
CN103098485A (zh) * 2010-06-14 2013-05-08 汤姆森特许公司 封装编码的多组成视频的方法和装置
US9608748B2 (en) 2010-08-31 2017-03-28 Humax Co., Ltd. Methods of transmitting and receiving a media information file for HTTP streaming
CN103141115B (zh) 2010-10-05 2016-07-06 瑞典爱立信有限公司 用于媒体流传送的客户端、内容创建器实体及其方法
CN104247433B (zh) * 2012-04-06 2018-02-06 索尼公司 解码装置和解码方法以及编码装置和编码方法
KR20130116782A (ko) 2012-04-16 2013-10-24 한국전자통신연구원 계층적 비디오 부호화에서의 계층정보 표현방식
US9161039B2 (en) * 2012-09-24 2015-10-13 Qualcomm Incorporated Bitstream properties in video coding
KR20200045012A (ko) * 2013-07-15 2020-04-29 소니 주식회사 상호작용성을 위한 모션-구속된 타일 세트들 sei 메시지의 확장들
CN105409235B (zh) * 2013-07-19 2019-07-09 索尼公司 文件生成装置和方法以及内容重放装置和方法
BR112016021214B1 (pt) * 2014-03-18 2024-01-23 Koninklijke Philips N.V Método de geração de um sinal de áudio para um item de conteúdo audiovisual, aparelho para geração de um sinal de áudio para um item de conteúdo audiovisual e aparelho para geração de uma saída de áudio
US10129566B2 (en) * 2015-03-16 2018-11-13 Microsoft Technology Licensing, Llc Standard-guided video decoding performance enhancements
US9979983B2 (en) 2015-03-16 2018-05-22 Microsoft Technology Licensing, Llc Application- or context-guided video decoding performance enhancements
GB2539462B (en) * 2015-06-16 2019-04-03 Canon Kk Obtaining media data and metadata from encapsulated bit-streams wherein operating point descriptors can be dynamically set
CN108476327B (zh) * 2015-08-20 2021-03-19 皇家Kpn公司 基于媒体流来形成拼块化视频
US10999605B2 (en) * 2017-01-10 2021-05-04 Qualcomm Incorporated Signaling of important video information in file formats
US10701400B2 (en) * 2017-03-21 2020-06-30 Qualcomm Incorporated Signalling of summarizing video supplemental information
GB2560921B (en) * 2017-03-27 2020-04-08 Canon Kk Method and apparatus for encoding media data comprising generated content
US10887645B2 (en) 2017-07-13 2021-01-05 Qualcomm Incorporated Processing media data using file tracks for web content
US11321516B2 (en) 2018-01-19 2022-05-03 Qualcomm Incorporated Processing dynamic web content of an ISO BMFF web resource track
EP4038885A4 (en) * 2019-10-02 2023-07-19 Nokia Technologies Oy METHOD AND DEVICE FOR STORING AND SIGNALING SUB-SAMPLE INPUT DESCRIPTIONS
WO2023194179A1 (en) * 2022-04-05 2023-10-12 Canon Kabushiki Kaisha Method and apparatus for describing subsamples in a media file

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6400996B1 (en) * 1999-02-01 2002-06-04 Steven M. Hoffberg Adaptive pattern recognition based control system and method
US5706493A (en) * 1995-04-19 1998-01-06 Sheppard, Ii; Charles Bradford Enhanced electronic encyclopedia
US5659539A (en) * 1995-07-14 1997-08-19 Oracle Corporation Method and apparatus for frame accurate access of digital audio-visual information
US6453355B1 (en) * 1998-01-15 2002-09-17 Apple Computer, Inc. Method and apparatus for media data transmission
US6426778B1 (en) * 1998-04-03 2002-07-30 Avid Technology, Inc. System and method for providing interactive components in motion video
WO2000043910A1 (en) * 1999-01-22 2000-07-27 Kent Ridge Digital Labs Method and apparatus for indexing and retrieving images using visual keywords
GB2387287B (en) * 2002-04-05 2006-03-15 Snell & Wilcox Limited Video compression transcoding

Cited By (30)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008536193A (ja) * 2005-04-13 2008-09-04 ドルビー・ラボラトリーズ・ライセンシング・コーポレーション 音声メタデータ確認
US8670437B2 (en) 2005-09-27 2014-03-11 Qualcomm Incorporated Methods and apparatus for service acquisition
US8612498B2 (en) 2005-09-27 2013-12-17 Qualcomm, Incorporated Channel switch frame
US8229983B2 (en) 2005-09-27 2012-07-24 Qualcomm Incorporated Channel switch frame
JP2009543386A (ja) * 2006-03-27 2009-12-03 ヴィドヨ,インコーポレーテッド スケーラブルビデオ及びオーディオ符号化システムにおける、制御メッセージを用いた、スケーラビリティ情報の管理のためのシステム及び方法
JP2009535969A (ja) * 2006-05-03 2009-10-01 テレフオンアクチーボラゲット エル エム エリクソン(パブル) メディア表現からメディアを再構成する方法及び装置
US8345743B2 (en) 2006-11-14 2013-01-01 Qualcomm Incorporated Systems and methods for channel switching
JP2010509896A (ja) * 2006-11-14 2010-03-25 クゥアルコム・インコーポレイテッド チャネルスイッチングのためのシステムと方法
JP2012135027A (ja) * 2006-11-14 2012-07-12 Qualcomm Inc チャネルスイッチングのためのシステムと方法
US8761162B2 (en) 2006-11-15 2014-06-24 Qualcomm Incorporated Systems and methods for applications using channel switch frames
JP2008136211A (ja) * 2006-11-27 2008-06-12 Thomson Licensing 符号化装置、復号化装置、記録装置、オーディオ/ビデオデータ送信システム
JP2013051707A (ja) * 2007-04-17 2013-03-14 Thomson Licensing データストリームにおけるビデオデータ及び関連するメタデータを送信する方法
JP2010539834A (ja) * 2007-09-19 2010-12-16 フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン メディアデータコンテナとメタデータコンテナとを有するファイルを格納し読み取るための装置及び方法
JP2011501553A (ja) * 2007-10-16 2011-01-06 サムスン エレクトロニクス カンパニー リミテッド メディア・コンテンツ及びメタデータを符号化する方法及びその装置
US8660999B2 (en) 2007-10-16 2014-02-25 Samsung Electronics Co., Ltd. Method and apparatus for encoding media content and metadata thereof
JP2015053703A (ja) * 2010-07-20 2015-03-19 クゥアルコム・インコーポレイテッドQualcomm Incorporated ビデオデータをストリーミングするためのシーケンスデータセットを提供すること
JP2017175623A (ja) * 2010-07-20 2017-09-28 クゥアルコム・インコーポレイテッドQualcomm Incorporated ビデオデータをストリーミングするためのシーケンスデータセットを提供すること
KR101863410B1 (ko) 2011-06-14 2018-05-31 삼성전자주식회사 멀티미디어 시스템에서 복합 미디어 컨텐츠를 송수신하는 방법 및 장치
JP2014519789A (ja) * 2011-06-14 2014-08-14 サムスン エレクトロニクス カンパニー リミテッド マルチメディアシステムにおけるメディアコンテンツを送受信する方法及び装置
US10110655B2 (en) 2011-06-14 2018-10-23 Samsung Electronics Co., Ltd. Method and apparatus for transmitting/receiving media contents in multimedia system
KR20180122995A (ko) * 2011-06-14 2018-11-14 삼성전자주식회사 멀티미디어 시스템에서 복합 미디어 컨텐츠를 송수신하는 방법 및 장치
KR101918658B1 (ko) 2011-06-14 2019-02-08 삼성전자주식회사 멀티미디어 시스템에서 복합 미디어 컨텐츠를 송수신하는 방법 및 장치
KR101973544B1 (ko) 2011-06-14 2019-04-30 삼성전자주식회사 멀티미디어 시스템에서 복합 미디어 컨텐츠를 송수신하는 방법 및 장치
US10447754B2 (en) 2011-06-14 2019-10-15 Samsung Electronics Co., Ltd. Method and apparatus for transmitting/receiving media contents in multimedia system
US10542065B2 (en) 2011-06-14 2020-01-21 Samsung Electronics Co., Ltd. Method and apparatus for transmitting/receiving media contents in multimedia system
JP2015519807A (ja) * 2012-04-25 2015-07-09 クゥアルコム・インコーポレイテッドQualcomm Incorporated ビデオ・ファイルにおけるパラメータ・セットを識別すること
KR101484843B1 (ko) 2013-04-19 2015-01-20 삼성전자주식회사 멀티미디어 전송 시스템에서 미디어 전송 패킷 전송 방법 및 장치
US10412423B2 (en) 2013-04-19 2019-09-10 Samsung Electronics Co., Ltd. Method and apparatus for transmitting media data in multimedia transport system
US11245940B2 (en) 2013-04-19 2022-02-08 Samsung Electronics Co., Ltd. Method and apparatus for transmitting media data in multimedia transport system
US11665384B2 (en) 2013-04-19 2023-05-30 Samsung Electronics Co., Ltd. Method and apparatus for transmitting media data in multimedia transport system

Also Published As

Publication number Publication date
CN100419748C (zh) 2008-09-17
GB2403835B (en) 2005-11-23
AU2003237120A1 (en) 2003-12-02
AU2003237120B2 (en) 2008-10-09
CN1666195A (zh) 2005-09-07
GB0424069D0 (en) 2004-12-01
WO2003098475A1 (en) 2003-11-27
GB2403835A (en) 2005-01-12
EP1500002A1 (en) 2005-01-26
DE10392598T5 (de) 2005-05-19
KR20040106414A (ko) 2004-12-17

Similar Documents

Publication Publication Date Title
JP2006505024A (ja) データ処理方法及び装置
US7613727B2 (en) Method and apparatus for supporting advanced coding formats in media files
JP2010141900A (ja) Mp4においてavcをサポートするための方法及び装置
US20040006575A1 (en) Method and apparatus for supporting advanced coding formats in media files
US20040167925A1 (en) Method and apparatus for supporting advanced coding formats in media files
US6463445B1 (en) Multimedia information retrieval system and method including format conversion system and method
JP2005524128A (ja) Mp4においてavcをサポートするための方法及び装置
WO2015144735A1 (en) Methods, devices, and computer programs for improving streaming of partitioned timed media data
CN107634930B (zh) 一种媒体数据的获取方法和装置
JP2010124479A (ja) Mp4においてavcをサポートするための方法及び装置
Angelides et al. The handbook of MPEG applications: standards in practice
JP2006507553A (ja) Mp4においてavcをサポートするための方法及び装置
JP2019220974A (ja) 復号装置
JP4746817B2 (ja) マルチメディア・コンテンツの処理を行う方法
JP2002077855A (ja) マルチメディア情報処理システム及び方法
WO2024012915A1 (en) Method, device, and computer program for optimizing dynamic encapsulation and parsing of content data
Timmerer et al. Piece-wise multimedia content adaptation in streaming and constrained environments

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20060407

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20080530

RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20080530

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20080620

A762 Written abandonment of application

Free format text: JAPANESE INTERMEDIATE CODE: A762

Effective date: 20090205