JP5953307B2 - クライアント、コンテンツクリエータエンティティ及びそれらがメディアストリーミングする方法 - Google Patents

クライアント、コンテンツクリエータエンティティ及びそれらがメディアストリーミングする方法 Download PDF

Info

Publication number
JP5953307B2
JP5953307B2 JP2013532748A JP2013532748A JP5953307B2 JP 5953307 B2 JP5953307 B2 JP 5953307B2 JP 2013532748 A JP2013532748 A JP 2013532748A JP 2013532748 A JP2013532748 A JP 2013532748A JP 5953307 B2 JP5953307 B2 JP 5953307B2
Authority
JP
Japan
Prior art keywords
media
sample
segment
level
samples
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2013532748A
Other languages
English (en)
Other versions
JP2013543322A (ja
Inventor
ペル フレイデー,
ペル フレイデー,
エイナルソン, トルビェルン
トルビェルン エイナルソン,
Original Assignee
テレフオンアクチーボラゲット エルエム エリクソン(パブル)
テレフオンアクチーボラゲット エルエム エリクソン(パブル)
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by テレフオンアクチーボラゲット エルエム エリクソン(パブル), テレフオンアクチーボラゲット エルエム エリクソン(パブル) filed Critical テレフオンアクチーボラゲット エルエム エリクソン(パブル)
Publication of JP2013543322A publication Critical patent/JP2013543322A/ja
Application granted granted Critical
Publication of JP5953307B2 publication Critical patent/JP5953307B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L65/00Network arrangements, protocols or services for supporting real-time applications in data packet communication
    • H04L65/60Network streaming of media packets
    • H04L65/75Media network packet handling
    • H04L65/764Media network packet handling at the destination 
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/234Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs
    • H04N21/2343Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs involving reformatting operations of video signals for distribution or compliance with end-user requests or end-user device requirements
    • H04N21/23439Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs involving reformatting operations of video signals for distribution or compliance with end-user requests or end-user device requirements for generating different versions
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L65/00Network arrangements, protocols or services for supporting real-time applications in data packet communication
    • H04L65/60Network streaming of media packets
    • H04L65/65Network streaming protocols, e.g. real-time transport protocol [RTP] or real-time control protocol [RTCP]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L65/00Network arrangements, protocols or services for supporting real-time applications in data packet communication
    • H04L65/60Network streaming of media packets
    • H04L65/70Media network packetisation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/30Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/30Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
    • H04N19/31Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability in the temporal domain
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/44Decoders specially adapted therefor, e.g. video decoders which are asymmetric with respect to the encoder
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/238Interfacing the downstream path of the transmission network, e.g. adapting the transmission rate of a video stream to network bandwidth; Processing of multiplex streams
    • H04N21/2387Stream processing in response to a playback request from an end-user, e.g. for trick-play
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/435Processing of additional data, e.g. decrypting of additional data, reconstructing software from modules extracted from the transport stream
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/44Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs
    • H04N21/44008Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs involving operations for analysing video streams, e.g. detecting features or characteristics in the video stream
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/44Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs
    • H04N21/4402Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs involving reformatting operations of video signals for household redistribution, storage or real-time display
    • H04N21/440281Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs involving reformatting operations of video signals for household redistribution, storage or real-time display by altering the temporal resolution, e.g. by frame skipping
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/60Network structure or processes for video distribution between server and client or between remote clients; Control signalling between clients, server and network components; Transmission of management data between server and client, e.g. sending from server to client commands for recording incoming content stream; Communication details between server and client 
    • H04N21/61Network physical structure; Signal processing
    • H04N21/6106Network physical structure; Signal processing specially adapted to the downstream path of the transmission network
    • H04N21/6125Network physical structure; Signal processing specially adapted to the downstream path of the transmission network involving transmission via Internet
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/60Network structure or processes for video distribution between server and client or between remote clients; Control signalling between clients, server and network components; Transmission of management data between server and client, e.g. sending from server to client commands for recording incoming content stream; Communication details between server and client 
    • H04N21/65Transmission of management data between client and server
    • H04N21/658Transmission by the client directed to the server
    • H04N21/6587Control parameters, e.g. trick play commands, viewpoint selection
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/80Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
    • H04N21/83Generation or processing of protective or descriptive data associated with content; Content structuring
    • H04N21/845Structuring of content, e.g. decomposing content into time segments
    • H04N21/8455Structuring of content, e.g. decomposing content into time segments involving pointers to the content, e.g. pointers to the I-frames of the video stream
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/80Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
    • H04N21/83Generation or processing of protective or descriptive data associated with content; Content structuring
    • H04N21/845Structuring of content, e.g. decomposing content into time segments
    • H04N21/8456Structuring of content, e.g. decomposing content into time segments by decomposing the content in the time domain, e.g. in time segments
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/02Protocols based on web technology, e.g. hypertext transfer protocol [HTTP]

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
  • Television Signal Processing For Recording (AREA)

Description

本発明の実施形態は、メディアストリーミングに関し、特に、トリックモードの実現に関する。
メディア、特にビデオのハイパーテキスト転送プロトコル(HTTP)ストリーミングに対する関心が高まっている。これは、2つの新しい特徴、すなわち適応性及びライブコンテンツを提供するために、単純なプログレッシブダウンロードを超えて発展した。これは、各々が例えば10秒であるコンテンツの短い期間に対応する複数のセグメント又はファイルにコンテンツを分割することにより達成される。異なるセグメント及びそれらを取り出す場所を列挙するメディアプレゼンテーション記述(MPD)としても既知であるマニフェストファイルがクライアントに提供される。クライアントはセグメントを1つずつ取り出す。リアルタイムストリーミングプロトコル(RTSP)等のプロトコルに基づくストリーミングサーバと異なり、サーバ又はキャッシュにおける状態を必要としないため、HTTP等の標準的なウェブプロトコルを介して取り出される異なるセグメント/ファイルへの分割はキャッシュ又はコンテンツ配信ネットワーク(CDN)に対する負荷が小さいと言われる。
近年、3GPPはPSSのリリース9においてAHS(Adaptive HTTP Streaming)と呼ばれるHTTPストリーミングに対する解決策を標準化した。拡張バージョンは3GP−DASH(Dynamic Adaptive Streaming over HTTP)と呼ばれ、リリース10において現在仕様が定められている。MPEG(Motion Picture Experts Group)は現在、3GPP AHSに基づくDASH(Dynamic Adaptive Streaming over HTTP)を標準化している。
HTTPストリーミングに対する他の解決策と同様に、AHS及びDASHの解決策はクライアントによりサーバから取り出される2つの異なる種類のファイルを使用する。第1の種類は、セッション、特に入手可能な種々のコンテンツを記述するマニフェストである。AHS及びDASHにおいて、マニフェストはMPDファイルであり、異なる期間及び期間内のメディアの異なる表現のセグメントに関する情報を提供する。第2の種類はメディア自体であり、これはメディアファイルに含まれる。AHS及びDASHにおいて、これらはISO(国際標準化機構)のファイル形式に基づき、初期セグメント及びメディアセグメントから構成される。
メディア内を迅速にナビゲートするために、トリックモード並びに早送り又は巻き戻しによる別の再生速度を可能にすること、すなわちメディアストリームの表現を高速又は逆方向に再生することは一般的である。このように、ユーザはストリームを視覚的に探索し、所望の位置で通常再生を開始できる。
「早送り」の最も単純な方法は、ストリームを元の速度より速く再生することである。この方法は、多大な処理能力を必要とすること、並びにコンテンツがリモートサーバに存在する場合のダウンロード速度の上昇という欠点を有する。例えば、10倍速で早送りするためには10倍複雑な復号化が必要とされる。図1は、速度が通常の速度の2倍である早送りを示す。
早送りの単純な方法は、Iフレーム又はより正確にはランダムアクセスポイント(RAP)、すなわちキーフレームのみを再生することである。これにより、Iフレーム間の距離に応じて複雑性が大幅に低減する。Iフレームを1つおきに復号化することにより更に速いトリックモードを実行できるが、ビデオが時間レベルを使用して符号化されていない場合、わずかな画像距離に対応するトリックモードを実行することは容易でない。図2は、早送りを可能にするためのIフレーム間の飛び越しを示す。
本解決策の別の欠点は、オーバーヘッド(帯域幅の需要)が大きいことである。完全なストリーム(全フレーム)が受信機に送出される必要があり、受信機が「不要な」フレーム(フレームの大部分)をフィルタリング及び棄却する。
サンプルとも呼ばれるフレームは、時間レベルに分割される。1つの時間レベル内の全てのサンプルは、同一の時間レベル内のサンプル又は下位時間レベル内のサンプルのみに依存する。時間レベルをサポートするビデオコーデックの一例は、ビデオ符号化規格の最先端であるH.264(MPEG−4 AVC)である。これは、ピクチャ内の冗長に加えてピクチャ間の冗長の除去(B及びPピクチャを使用する)を利用する複合コーデックである。
H.264は、独立フレームのサブセットがビットストリームから抽出され且つストリームの残りのピクチャのいずれも使用せずに復号化されるようにピクチャ間の依存を制限する複数の方法をサポートする。例えば、固定のピクチャグループ(GOP)構造の場合にメディアストリーム内に定期的に出現するIフレームが抽出される。他のオプションは、メディアストリームの時間レベルを抽出するために階層型のB及び/又はPピクチャを利用することである。
時間スケーラビリティ符号化構造の一例を図3に示す。図3において、ピクチャ(I、P及びB)はそれらのレベル0、1、2又は3を用いて指標を付与される。1つの時間レベル内のサンプルは同一の時間レベル内のサンプル又は下位時間レベル内のサンプルのみに依存することが示される。
従って、異なる早送り(ff)速度(通常再生の倍速)は以下のようにして得られる。
8倍速の早送りは、レベル0のピクチャを使用することにより達成される。
4倍速の早送りは、レベル0及び1のピクチャを使用することにより達成される。
2倍速の早送りは、レベル0、1及び2のピクチャを使用することにより達成される。
通常再生は、全てのレベル0、1、2及び3に対応する。
3GPP及びMPEGはそれぞれ、3GPファイル形式及びMP4ファイル形式をHTTPストリーミング配信形式とする。それらは、ISOベースメディアファイル形式に基づく。
3GP又はMP4ファイルのファイル構造はオブジェクト指向であり、ファイルはボックスと呼ばれる一連のオブジェクトにより形成される。ボックスの構造はその種類により推測される。いくつかのボックスは他のボックスのみを含むが、大部分のボックスはデータを含む。ファイルの全てのデータはボックスに含まれる。
ファイルは、種類「moov」のムービーボックスに含まれる初期ムービーメタデータ部分及び種類「moof」のムービーフラグメントボックスに含まれる多くの増分ムービーフラグメントに分割される。各ムービーフラグメントはムービー(マルチメディアの提示)の時間を延長する。ムービーボックス及びムービーフラグメントボックスは、クライアントがメディアの提示を復号化及びレンダリングするために必要な情報を含むメタデータボックスである。実際のメディアデータは、種類「mdat」のメディアデータボックスに格納される。これらのボックス(「moov」、「moof」及び「mdat」)は全て最上位のボックスであり、すなわち、他のどんなボックスにも含まれず、ファイルのみに含まれる。
3GP−DASH及びMPEG DASHの場合、3GP及びMP4ファイルのセグメント化されたバージョンが使用される。2つの主な種類のセグメントが存在する:
初期化セグメント:ムービーボックス(「moov」)を含むが、ムービーフラグメントを含まない。
メディアセグメント:1つ以上のムービーフラグメント(「moof」)とメディアデータボックス(「mdat」)内の対応するメディアデータとを含むが、ムービーボックスを含まない。
HTTPストリーミングに対して上述したように、クライアントは最初に、関連する初期化セグメント及びメディアセグメントに対するポインタを含むMPDを必要とする。その後、HTTPストリーミングは、1つの初期化セグメント(あるいは、例えばオーディオ及びビデオのために並行表現が使用される場合は複数の初期化セグメント)をダウンロードすることでクライアントにより初期化される。その後、クライアントは、MPD内に記述されるようにメディアセグメントをダウンロードすることにより、HTTPストリーミングセッションを継続する。
ピクチャは、ファイル形式でアクセス単位として格納される。デフォルトでは、それらはビットストリーム内に復号化順に出現する。図4は、アクセス単位がデフォルトのビットストリーム順でムービーフラグメント内に格納される一例を示す。3つの時間レベル(0、1及び2)が存在する。
図4は、フラグメント内の異なる時間レベルを有するアクセス単位を復号化順に示す。すなわち、I(0)、P(4)、B(2)、B(1)、B(3)、P(8)、B(6)、B(5)、B(7)等である。括弧内の数字は提示順、すなわち、フレームが画面上にレンダリングされる順序を示す。すなわち、I(0)、B(1)、B(2)、B(3)、P(4)、B(5)、B(6)、B(7)、P(8)等である。I(0)、P(4)、P(8)、...、P(36)は時間レベル0であり、B(2)、B(6)、...、B(34)は時間レベル1であり、B(1)、B(3)、B(5)、B(7)、...、B(33)、B(35)は時間レベル2である。
クライアントが特定の時間レベルに属するサンプルのみをダウンロードしたい場合、必要以上のデータのダウンロードを回避するために複数のHTTP GET byte−range要求を発行する必要がある。例えばクライアントが時間レベル0をダウンロードしたい場合、4倍速の早送りに対応するアクセス単位I(0)、P(4)、P(8)等をダウンロードする必要がある。2倍速の早送りの場合、時間レベル0及び1、すなわちアクセス単位I(0)、P(4)、B(2)、P(8)、B(6)等が必要である。
上述のように、トリックモードを実現するための従来技術の方法は、復号化の複雑性及び例えばGET要求の発行である信号伝送オーバーヘッドに関するいくつかの欠点を有する。
本発明の実施形態の目的は、トリックモードを実現するための改善された解決策を達成することである。
目的は、サンプルグループ内の全てのサンプルが1つの時間レベルに属するようにトラック内のサンプルをサンプルグループに割り当てることと、クライアントが下位時間レベルから独立して1つの時間レベルにアクセスできるようにすることとにより達成される。このようにして、異なるフレームレートの再生に関するクライアントの融通性が向上し、その結果、帯域幅の利用が低減する。
本発明の実施形態の第1の態様によると、ファイルのシステムのトリックモードを可能にするコンテンツクリエータ(作成者)エンティティにおける方法が提供される。ファイルのシステムは少なくとも1つの初期化セグメント及び少なくとも1つのメディアセグメントを備え、少なくとも1つのメディアセグメントは複数のメディアサンプルを有する少なくとも1つのトラックを備え、少なくとも1つの初期化セグメントは少なくとも1つのメディアセグメントの記述を備える。方法において、1つのトラック内の同一の時間レベルを有するメディアサンプルが識別され、1つのサンプルグループ内の全てのメディアサンプルが同一の時間レベルを有するようにメディアサンプルがサンプルグループにグループ化される。少なくとも1つの初期化セグメントにおいて、サンプルグループはサンプルグループの各々のサンプルの時間レベルを示す時間レベル情報を用いて印を付けられ、時間レベルが下位時間レベルのグループからのサンプルを使用せずに独立して復号化可能であるかを示す情報が少なくとも1つの初期化セグメント内に追加される。
本発明の実施形態の第2の態様によると、ファイルのシステムの所望の速度を用いるトリックモードを可能にするクライアントにおける方法が提供される。ファイルのシステムは少なくとも1つの初期化セグメント及び少なくとも1つのメディアセグメントを備え、少なくとも1つのメディアセグメントは複数のメディアサンプルを有する少なくとも1つのトラックを備え、少なくとも1つの初期化セグメントは少なくとも1つのメディアセグメントの記述を備える。方法において、少なくとも1つのメディアセグメントの記述を備えるファイルの初期化セグメントが受信され、クライアントは、時間レベルが下位時間レベルのグループからのサンプルを使用せずに独立して復号化可能かを示す情報が含まれるかを識別するように構成される。時間レベルが下位時間レベルのグループからのサンプルを使用せずに独立して復号化可能かを示す情報が含まれる場合、他のレベルから独立して復号化可能な時間レベルが判定される。セグメント毎に、所望の速度と下位時間レベルのグループからのサンプルを使用せずに独立して復号化可能な時間レベルを示す情報とに基づいて、ダウンロードされるメディアセグメントの時間レベルが判定され、対応するメディアセグメントの初期化セグメントがダウンロードされ、メディアセグメントにおける関連する時間レベルの物理的場所が判定され、メディアセグメントの判定された時間レベルがダウンロードされる。
本発明の実施形態の第3の態様によると、ファイルのシステムのトリックモードを可能にするコンテンツクリエータエンティティが提供される。ファイルのシステムは少なくとも1つの初期化セグメント及び少なくとも1つのメディアセグメントを備え、少なくとも1つのメディアセグメントは複数のメディアサンプルを有する少なくとも1つのトラックを備え、少なくとも1つの初期化セグメントは少なくとも1つのメディアセグメントの記述を備える。コンテンツクリエータエンティティは、1つのトラック内の同一の時間レベルを有するメディアサンプルを識別し、1つのサンプルグループ内の全てのメディアサンプルが同一の時間レベルを有するようにメディアサンプルをサンプルグループにグループ化し、少なくとも1つの初期化セグメントにおいて、サンプルグループの各々のサンプルの時間レベルを示す時間レベル情報を用いてサンプルグループに印を付け、且つ時間レベルが下位時間レベルのグループからのサンプルを使用せずに独立して復号化可能であるかを示す情報を少なくとも1つの初期化セグメント内に追加するように構成されるプロセッサを備える。
本発明の実施形態の第4の態様によると、ファイルのシステムの所望の速度を用いるトリックモードを可能にするクライアントが提供される。ファイルのシステムは少なくとも1つの初期化セグメント及び少なくとも1つのメディアセグメントを備え、少なくとも1つのメディアセグメントは複数のメディアサンプルを有する少なくとも1つのトラックを備え、少なくとも1つの初期化セグメントは少なくとも1つのメディアセグメントの記述を備える。クライアントは、少なくとも1つのメディアセグメントの記述を備えるファイルの初期化セグメントを受信するように構成される入出力部を備え、クライアントは、時間レベルが下位時間レベルのグループからのサンプルを使用せずに独立して復号化可能かを示す情報が含まれるかを識別するように構成され且つ他のレベルから独立して復号化可能な時間レベルを判定するように構成されるプロセッサを更に備え、プロセッサは、セグメント毎に、所望の速度と下位時間レベルのグループからのサンプルを使用せずに独立して復号化可能な時間レベルを示す情報とに基づいて、ダウンロードされるメディアセグメントの時間レベルを判定するように構成される。入出力部は、対応するメディアセグメントに対する初期化セグメントをダウンロードするように構成され、プロセッサは、メディアセグメントにおける関連する時間レベルの物理的場所を判定するように構成される。更に、入出力部は、メディアセグメントの判定された時間レベルをダウンロードするように構成される。
本発明の実施形態の利点は、それらが3GP及びMP4ファイルにより使用されるH.264に対する既存の格納形式との上位互換性を有することである。
図1は、従来技術に係る通常の速度及び高速再生による早送りを示す図である。 図2は、従来技術に係る通常の速度及びB/Pフレームをスキップすることによる早送りを示す図である。 図3は、従来技術に係る時間的スケーラビリティに対する階層型Bピクチャ符号化を示す図である。 図4は、従来技術に係るフラグメント内の異なる時間レベルを有するサンプルを復号化順に示す図である。 図5aは、本発明の実施形態に係るコンテンツクリエータにおける方法を示すフローチャートである。 図5bは、本発明の実施形態に係るクライアントにおける方法を示すフローチャートである。 図6は、本発明の実施形態に係るクライアント及びコンテンツクリエータエンティティを概略的に示す図である。 図7は、本発明の実施形態に係るサンプルグループに分割された複数のサンプルを有するトラックを示す図である。
従って、トラック内のサンプルは階層型の時間レベルでグループ化され、それにより、クライアントは1つ以上のムービーフラグメントを含むメディアセグメント内のサンプルの時間レベルを推論できる。これは、トラック又はトラックフラグメントの全てのサンプルを時間レベルにグループ化するサンプルグループ化を使用することにより達成される。尚、時間レベルは時間層と呼ばれる場合もある。
上述のように、サンプルとも呼ばれるフレームは時間レベルに分割される。1つの時間レベル内の全てのサンプルは、同一の時間レベル内のサンプル又は下位時間レベル内のサンプルのみに依存する。
ISO/IEC 14496−12:2008「Information technology−Coding of audio−visual objects−Part 12:ISO base media file format」及びISO/IEC 15444−12:2008「Information technology−JPEG 2000 image coding system−Part12:ISO base media file format」によると、サンプルグループ化とは、トラック内の各サンプルが1つのサンプルグループの要素となるようにグループ化基準に基づいてそれらを割り当てることである。サンプルグループ化におけるサンプルグループは連続するサンプルであることに限定されず、隣接しないサンプルを含んでもよい。トラック内のサンプルに対する2つ以上のサンプルグループ化が存在する場合があるため、各サンプルグループ化はグループ化の種類を示す種類フィールドを有する。例えばファイルは、同一のトラックに対して2つのサンプルグループ化、すなわち、時間レベルに対するサンプルの割り当てに基づくサンプルグループ化及び時間列に対する別のサンプルグループ化を含んでもよい。
サンプルグループ化は2つのリンクデータ構造により表される。(1)SampleToGroupボックスはサンプルグループに対するサンプルの割り当てを表し、(2)SampleGroupDescriptionボックスはグループの特性を記述する各サンプルグループに対するサンプルグループエントリを含む。異なるグループ化基準に基づくSampleToGroup及びSampleGroupDescriptionボックスの複数の例が存在する。それらは、グループ化の種類を示すために使用される種類フィールドにより区別される。
ムービーフラグメント内のサンプルグループ構造に対するサポートは、SampleToGroupボックスをトラックフラグメントボックス(「traf」)である当該ボックスのコンテナと共に使用することにより提供される。
SampleToGroupボックスは、トラックフラグメント内のサンプルが属するグループ及び当該サンプルグループの関連する記述を見つけるために使用される。テーブルは、同一のサンプルグループ記述子を有する一連のサンプルのうちの第1のサンプルの指標を与える各エントリを用いて圧縮符号化される。サンプルグループ記述IDは、各サンプルグループの特徴を記述するエントリを含み且つSampleTableボックス内に存在するSampleGroupDescriptionボックスを示す指標である。トラックフラグメント内のサンプルに対する2つ以上のサンプルグループ化が存在する場合、SampleToGroupボックスの多くの例が存在する。SampleToGroupボックスの各例は、異なるサンプルグループ化を区別する種類コードを有する。関連するSampleGroupDescriptionは、グループ化の種類に対して同一の値を示す。
本発明の実施形態の第1の態様によると、ファイルのシステムのトリックモードを可能にするコンテンツクリエータエンティティにおける方法が提供される。ファイルのシステムは少なくとも1つの初期化セグメント及び少なくとも1つのメディアセグメントを備え、少なくとも1つのメディアセグメントは複数のメディアサンプルを有する少なくとも1つのトラックを備え、少なくとも1つの初期化セグメントは少なくとも1つのメディアセグメントの記述を備える。図5aのフローチャートに示すように、方法は以下を備える。
501.1つのトラック内の同一の時間レベルを有するメディアサンプルが識別される。
502.1つのサンプルグループ内の全てのメディアサンプルが同一の時間レベルを有するように、メディアサンプルがサンプルグループにグループ化される。
503.少なくとも1つの初期化セグメントにおいて、サンプルグループは各サンプルグループのサンプルの時間レベルを示す時間レベル情報を用いて印を付けられる。
504.時間レベルが下位時間レベルのグループからのサンプルを使用せずに独立して復号化可能であるかを示す情報が少なくとも1つの初期化セグメント内に追加される。
一実施形態によると、時間レベル情報はサンプルグループ化の種類に関連し、時間レベル情報はサンプルグループ記述指標である。
更に、更なる一実施形態によると、時間レベルが下位時間レベルのグループからのサンプルを使用せずに独立して復号化可能かを示す情報が、サンプルグループ記述に含まれる。以下のサンプルグループ定義(「tele」)は、各レベル(グループ)に対する当該情報を示す。
class TemporalLevelEntry() extends SampleGroupDescriptionEntry(‘tele’)
{
bit(1) level_independently_decodable;
bit(7) reserved=0
}
時間レベルが下位時間レベルのグループからのサンプルを使用せずに独立して復号化可能かを示す情報を追加することにより、他のフレームレートに関する融通性が向上される。
本発明の実施形態の第2の態様によると、クライアントにおける方法が提供される。方法は、図5bのフローチャートに示す以下のステップを備える。
第1のステップ510において、サンプルグループ記述を含むファイルの初期化セグメントを受信する。クライアントは、時間レベルが下位時間レベルのグループからのサンプルを使用せずに独立して復号化可能かを示す情報が含まれるかを識別するように構成される。
時間レベルが下位時間レベルのグループからのサンプルを使用せずに独立して復号化可能かを示す情報が含まれる場合(511)、他のレベルから独立して復号化可能な時間レベルを判定する(512)。
次に、所望の速度と下位時間レベルのグループからのサンプルを使用せずに独立して復号化可能な時間レベルを示す情報とに基づいて、ダウンロードされるメディアセグメントの時間レベルを判定する(513)。
対応するメディアセグメントに対する初期化セグメントをダウンロードし、メディアセグメントにおける関連する時間レベルの物理的場所を判定する(508)。
メディアセグメントの判定された時間レベルをダウンロードする(514)。
セグメント毎にステップ507〜509を繰り返す(516)。
次に図6を参照する。本発明の実施形態によると、初期化セグメント660及びメディアセグメント665を備えるファイルのシステムは、メディアコンテンツクリエータエンティティ610により作成される。コンテンツクリエータエンティティ610は、プロセッサ612と、メモリ614と、メッセージを送受信するための入出力部616とを備える。プロセッサ612は、本明細書中で説明されるコンテンツクリエータエンティティの機能を実行するように構成され、メモリ614は、例えばファイル記述を有する初期化セグメント及びメディアセグメントを格納するように構成される。クライアント620は、プロセッサ622、メモリ624、並びにメッセージを送受信するための入出力部626を備える。プロセッサ622は、本明細書中で説明されるクライアントの機能を実行するように構成され、メモリ624は、例えばファイル記述を有する初期化セグメント及びメディアセグメントを格納するように構成される。メディアコンテンツクリエータ610の例はTVオペレータ及び電気通信オペレータであり、クライアント620の例はPC、セットトップボックス、移動電話、パッド及びTVセットである。
図6に示すように、クライアント620は、ファイルのシステム670からの初期化セグメント660を求める要求を送出する(651)。コンテンツクリエータエンティティ610は要求された初期化セグメント660を送出し(652)、クライアント620は種類「moov」のムービーボックスに含まれるファイル記述情報を有する初期化セグメント660を受信する(653)。ファイル記述情報及びクライアントの所望の速度640に基づいて、クライアントは異なるメディアセグメント665を要求する(654)。メディアセグメントは、時間レベルに従ってサンプルグループに順序付けられたサンプルに対応する。その後、要求されたメディアセグメント665はクライアント620によりダウンロードされる(655)。
本発明の実施形態を更に説明するために、図7が提供される。図7は、異なる時間レベル1、2及び3のサンプルを有するトラックを示す。時間レベル1のサンプルを使用することにより1つの速度が提供され、時間レベル2のサンプルを使用することにより別の速度が提供され且つ時間レベル3のサンプルを使用することにより更に別の速度が提供されることが図7からわかる。従来技術の解決策において、1つの時間レベルのサンプルは下位時間レベルのサンプルに依存すると仮定される。本発明の実施形態を使用することにより、例えば時間レベル2及び1の双方のサンプルに加えて、例えば時間レベル2又は3のサンプルのみを使用できる。従って、1つの時間レベルのサンプルが下位時間レベルのサンプルから独立して使用されるようにすることにより、可能な速度の数に関する融通性が向上し、更に別の速度がトリックモードを実現するために提供される。
時間レベルが下位時間レベルのグループからのサンプルを使用せずに独立して復号化可能であるかを示す情報は、トリックモードを実現するためにIフレームのみが使用される場合にも有用である。Iフレームは異なる時間レベルに分割される。例えば、1つおきのIフレームがレベル1であり、1つおきのIフレームが時間レベル2である。Iフレームが他のどんなフレームにも依存しないため、時間レベルが下位時間レベルのグループからのサンプルを使用せずに独立して復号化可能であるかを示す本発明の実施形態に係る情報は、特定の速度を提供するトリックモードを実現するためにIフレームのグループを選択するために使用可能である。従って、Iフレーム間で互いに依存しないが、時間レベル間の依存を示すことを本来は意図するパラメータが一部のIフレームのみを使用する必要があることを示すために使用され、これにより融通性が向上する。
時間レベルにおけるビットストリームの別の例は、復号化順に、例えば
01234567891011
のように、定期的なI(イントラ)フレームの間にP(予測)フレーム(P)を有することである。本例において、メディアコンテナ(mdat)は、1つのレベルがより容易にダウンロードされるように、Pフレームの前にIフレームを単に移動することにより以下のように時間的に順序付けされる。
08412356791011
尚、単一のイントラ速度の前に2倍のイントラ速度を可能にするために、イントラフレームは階層型に順序付けされる。従って、本例において、Iフレームに対する2つの時間レベルと、I及びPフレームに対する1つの時間レベルとが存在する。
□例えばレベル1である基本レベルに対応するピクチャI081624等を使用することにより、8倍速の早送りが達成される。
□例えばレベル1及び2である基本レベル及び1つ上のレベルに対応するピクチャI04812等を使用することにより、4倍速の早送りが達成される。
□通常再生は、例えばレベル1、2及び3である全てのレベルに対応する全てのピクチャI01234567に対応する。
サンプル数に対する論理的な復号化順は、トラックフラグメントボックスにおいて各Iに対して1つのトラックランを使用し且つ後続の3つのPに対して1つのトラックランを使用することにより達成される。
trun[I0] trun[P123] trun[I4] trun[P567] trun[I8] trun[P91011
ここで、各trunは、時間的に順序付けられた上述のメディアコンテナ(mdat)内のデータを指す。
従って、サンプルを異なる時間レベルに分割することにより、クライアントが何らかの時間レベルのサンプルをダウンロードするだけで必要な帯域幅を制限できるようになる。更に、1つ以上の時間レベルが他から独立して使用可能であることを知らせる可能性を追加することにより、ダウンロードされる異なる時間レベルのサンプルを選択する融通性が向上するため、必要な帯域幅の細分性が増す。
一実施形態によると、時間レベル情報はサンプルグループ化の種類に関連する。更なる一実施形態によると、サンプルグループ化の種類はサンプルグループ記述指標である。これは、1つのサンプルグループ内のサンプルの時間レベルがサンプル記述指標として示されることを意味する。
更に、更なる一実施形態によると、時間レベルが下位時間レベルのグループからのサンプルを使用せずに独立して復号化可能であるかを示す情報はサンプルグループ記述指標に含まれる。
一例として、サンプルの時間レベルに基づいて全てのサンプルをグループ化するために、「tele」と示される時間レベルに関連するグループ化の種類が導入される。一実施形態によると、トラックフラグメントボックス(traf)に含まれるSample−To−Groupボックス(sbgp)は、このグループ化の種類に従ってサンプルグループ化を定義する。グループ記述指標は時間レベルに対応し、通常は、1、2、3等の連続する値をとる。
他の実施形態において、時間レベルに関する更なる情報が、例えばグループ化の種類「tele」に対するサンプルグループ記述と共に供給される。
class TemporalLevelEntry()
extends SampleGroupDescriptionEntry(‘tele’){
unsigned int(8) rate_factor;
unsigned int(32) data_offset;
}
ここで、パラメータrate_factorは、現在の時間レベル及び下位時間レベルの全サンプルを元のサンプルレートで再生することにより達成される増加した時間進行に対応する正の整数である。尚、時間レベルはグループ記述指標であってもよい。
パラメータdata_offsetは、このグループ記述の時間レベルを有する格納ファイルの先頭に対する第1のサンプルの先頭を指す整数である。
更に、パラメータdata_offsetは、トラックフラグメントヘッダボックスにおいて確立される黙示的又は明示的なdata_offsetに追加されてもよく且つ/あるいはパラメータdata_offsetはサンプルグループ記述において省略されてもよい。
別の代替例によると、時間レベルはグループ記述指標と同一である代わりに整数値としてサンプルグループ記述内に黙示的に含まれ且つ/あるいは時間レベルはグループ記述指標−1又は他の何らかの整数に更に対応してもよい。
本発明の更に別の実施形態において、メディアセグメントのセグメントタイプボックス(styp)内にブランド「tele」が存在することにより、下位時間レベルのサンプルが上位時間レベルのサンプルに先行するようにセグメントのメディアデータがグループ化されることを知らせる。本例において、上述のようなサンプルグループ化は、レベル数及びファイルにおけるそれらの場所に関する更なる情報をクライアントに提供する。
メディアセグメントのstyp内のブランド「tele」の存在により、メディアセグメントが時間的に順序付けされたレベルに関する情報を少しでも搬送するかをクライアントに事前に知らせる。ブランドはセグメントにおいて最初に知らせるため、クライアントがセグメントのダウンロードを開始する場合にセグメント内の後方の時間レベル情報を探すことに意味があるかを非常に迅速にチェックできる。

Claims (14)

  1. ァイルのシステムのトリックモードを可能にするコンテンツ作成計算デバイスにおける方法であって
    ここで、前記ファイルは少なくとも1つの初期化セグメントと少なくとも1つのメディアセグメントを有し、
    前記少なくとも1つのメディアセグメント複数のメディアサンプルを有する少なくとも1つのトラックを備え、
    前記少なくとも1つの初期化セグメント前記少なくとも1つのメディアセグメントの記述を備え、前記方法は、
    1つのトラック内の同一の時間レベルを有するメディアサンプルを識別するステップ
    1つのサンプルグループ内の全てのメディアサンプルが同一の時間レベルを有するように前記メディアサンプルをサンプルグループにグループ化するステップ
    前記少なくとも1つの初期化セグメントにおいて、前記サンプルグループの各々の前記メディアサンプルの前記時間レベルを示す時間レベル情報を用いて前記サンプルグループに印を付けるステップ
    位時間レベルのメディアサンプルを使用せずに独立して復号化可能であるゼロ、より大きい時間レベルを持つ少なくとも1つのサンプルグループを示す情報を、前記少なくとも1つの初期化セグメント内に追加するステップ
    前記サンプルグループごとの選択的ダウンロードとトリックモードを可能とするために、前記少なくとも1つの初期化セグメントをクライアント計算デバイスに送信するステップと
    を備えることを特徴とする方法。
  2. 前記時間レベル情報はサンプルグループ化の種類に関連することを特徴とする請求項1に記載の方法。
  3. 前記時間レベル情報はサンプルグループ記述指標であることを特徴とする請求項2に記載の方法。
  4. 前記サンプルグループ記述指標は、所与の時間レベル及び下位時間レベルの全メディアサンプルを元のサンプルレートで再生することにより、前記所与の時間レベルを持つ所与のサンプルグループについて達成される増加した時間進行を表す正の整数であるrate_factorパラメータをえることを特徴とする請求項3に記載の方法。
  5. 前記サンプルグループ記述指標は、前記メディアサンプルの前記時間レベルを有するメディアセグメントの先頭に対する第1のメディアサンプルの先頭を指す整数であるdata_offsetパラメータをえることを特徴とする請求項3に記載の方法。
  6. 前記追加される情報はサンプルグループ記述に含まれることを特徴とする請求項1に記載の方法。
  7. 前記メディアセグメントのセグメントタイプボックス(STYP)内の予め定義されたパラメータが、下位時間レベルのメディアサンプルが上位時間レベルのメディアサンプルに先行するように前記メディアセグメントのメディアサンプルがグループ化されることを知らせるために使用されることを特徴とする請求項1記載の方法。
  8. ァイルのシステムのトリックモードを可能にするコンテンツ作成装置あって、
    ここで、前記ファイルは、少なくとも1つの初期化セグメントと少なくとも1つのメディアセグメントを有し、
    前記少なくとも1つのメディアセグメントは複数のメディアサンプルを有する少なくとも1つのトラックを備え、
    前記少なくとも1つの初期化セグメントは前記少なくとも1つのメディアセグメントの記述を備え、
    前記コンテンツ作成装置は、
    1つのトラック内の同一の時間レベルを有するメディアサンプルを識別し、
    1つのサンプルグループ内の全てのメディアサンプルが同一の時間レベルを有するように前記メディアサンプルをサンプルグループにグループ化し、
    前記少なくとも1つの初期化セグメントにおいて、前記サンプルグループの各々の前記メディアサンプルの前記時間レベルを示す時間レベル情報を用いて前記サンプルグループに印を付け、且つ
    位時間レベルのメディアサンプルを使用せずに独立して復号化可能であるゼロ、より大きい時間レベルを持つ少なくとも1つのサンプルグループを示す情報を、前記少なくとも1つの初期化セグメント内に追加し、且つ、
    前記サンプルグループごとの選択的ダウンロードとトリックモードを可能とするために、前記少なくとも1つの初期化セグメントをクライアント計算デバイスに送信する
    ように構成されるプロセッサ備えることを特徴とするコンテンツ作成装置。
  9. 前記時間レベル情報はサンプルグループ化の種類に関連することを特徴とする請求項に記載のコンテンツ作成装置。
  10. 前記時間レベル情報はサンプルグループ記述指標であることを特徴とする請求項に記載のコンテンツ作成装置。
  11. 前記サンプルグループ記述指標は、所与の時間レベル及び下位時間レベルの全メディアサンプルを元のサンプルレートで再生することにより、前記所与の時間レベルを持つ所与のサンプルグループについて達成される増加した時間進行を表す正の整数であるrate_factorパラメータをえることを特徴とする請求項10に記載のコンテンツ作成装置。
  12. 前記サンプルグループ記述指標は、前記メディアサンプルの前記時間レベルを有するメディアセグメントの先頭に対する第1のサンプルの先頭を指す整数であるdata_offsetパラメータをえることを特徴とする請求項10に記載のコンテンツ作成装置。
  13. 前記追加される情報はサンプルグループ記述に含まれることを特徴とする請求項8に記載のコンテンツ作成装置。
  14. 前記メディアセグメントのセグメントタイプボックス(STYP)内の予め定義されたパラメータが、下位時間レベルのメディアサンプルが上位時間レベルのメディアサンプルに先行するように前記メディアセグメントのメディアサンプルがグループ化されることを知らせるために使用されることを特徴とする請求項に記載のコンテンツ作成装置。
JP2013532748A 2010-10-05 2011-10-03 クライアント、コンテンツクリエータエンティティ及びそれらがメディアストリーミングする方法 Active JP5953307B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US38988410P 2010-10-05 2010-10-05
US61/389,884 2010-10-05
PCT/SE2011/051176 WO2012047158A1 (en) 2010-10-05 2011-10-03 A client, a content creator entity and methods thereof for media streaming

Publications (2)

Publication Number Publication Date
JP2013543322A JP2013543322A (ja) 2013-11-28
JP5953307B2 true JP5953307B2 (ja) 2016-07-20

Family

ID=45464070

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2013532748A Active JP5953307B2 (ja) 2010-10-05 2011-10-03 クライアント、コンテンツクリエータエンティティ及びそれらがメディアストリーミングする方法

Country Status (6)

Country Link
US (4) US9137555B2 (ja)
EP (1) EP2625867A1 (ja)
JP (1) JP5953307B2 (ja)
KR (1) KR101620151B1 (ja)
CN (1) CN103141115B (ja)
WO (1) WO2012047158A1 (ja)

Families Citing this family (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2526674B1 (en) * 2010-01-18 2017-03-15 Telefonaktiebolaget LM Ericsson (publ) Method and arrangement for supporting playout of content
KR101739272B1 (ko) * 2011-01-18 2017-05-24 삼성전자주식회사 멀티미디어 스트리밍 시스템에서 컨텐트의 저장 및 재생을 위한 장치 및 방법
US9590814B2 (en) 2011-08-01 2017-03-07 Qualcomm Incorporated Method and apparatus for transport of dynamic adaptive streaming over HTTP (DASH) initialization segment description fragments as user service description fragments
US8407747B1 (en) * 2012-03-13 2013-03-26 Google Inc. Adaptive trick play streaming
US9438883B2 (en) * 2012-04-09 2016-09-06 Intel Corporation Quality of experience reporting for combined unicast-multicast/broadcast streaming of media content
WO2013163224A1 (en) * 2012-04-24 2013-10-31 Vid Scale, Inc. Method and apparatus for smooth stream switching in mpeg/3gpp-dash
CN104429093B (zh) 2012-07-09 2018-01-05 华为技术有限公司 超文本传输协议动态自适应流媒体客户端及其会话管理实施方法
US9282348B2 (en) 2012-08-13 2016-03-08 Disney Enterprises, Inc. Content based partitioning of digital media content
WO2014113193A1 (en) * 2013-01-17 2014-07-24 Intel IP Corporation Dash-aware network application function (d-naf)
US9307021B2 (en) 2013-02-27 2016-04-05 Comcast Cable Communications, Llc Adaptive media transmission processing
US20150350622A1 (en) 2014-05-30 2015-12-03 Apple Inc. Packed i-frames
US9532088B2 (en) 2014-06-18 2016-12-27 Arris Enterprises, Inc. Trick-play streams for adaptive bitrate streaming
GB2528039A (en) * 2014-07-01 2016-01-13 Canon Kk Method for identifying objects across time periods and corresponding device
CN106537881B (zh) * 2014-08-26 2021-01-29 Ctera网络有限责任公司 基于存根追踪允许同步访问云存储***的方法及计算设备
US20170272691A1 (en) * 2014-12-22 2017-09-21 Lg Electronics Inc. Broadcast signal transmission device, broadcast signal reception device, broadcast signal transmission method, and broadcast signal reception method
US9928297B2 (en) * 2015-02-11 2018-03-27 Qualcomm Incorporated Sample grouping signaling in file formats
WO2016205733A1 (en) * 2015-06-19 2016-12-22 Huawei Technologies Co., Ltd. Template uniform resource locator signing
US20170111642A1 (en) * 2015-10-14 2017-04-20 Qualcomm Incorporated Support of random access and switching of layers and sub-layers in multi-layer video files
US10735485B2 (en) 2015-12-04 2020-08-04 Telefonaktiebolaget Lm Ericsson (Publ) Technique for adaptive streaming of temporally scaling media segment levels
US11546402B2 (en) * 2019-01-04 2023-01-03 Tencent America LLC Flexible interoperability and capability signaling using initialization hierarchy
GB2597642B (en) * 2020-06-16 2023-08-02 Canon Kk Method, device, and computer program for encapsulating media data into a media file

Family Cites Families (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA2208950A1 (en) * 1996-07-03 1998-01-03 Xuemin Chen Rate control for stereoscopic digital video encoding
US20030061368A1 (en) * 1997-03-17 2003-03-27 Navin Chaddha Adaptive right-sizing of multicast multimedia streams
KR20020032803A (ko) * 2000-10-27 2002-05-04 구자홍 스트리밍 서비스를 위한 파일 구조
US6970640B2 (en) * 2001-05-14 2005-11-29 Microsoft Corporation Systems and methods for playing digital video in reverse and fast forward modes
EP1481553A1 (en) * 2002-02-25 2004-12-01 Sony Electronics Inc. Method and apparatus for supporting avc in mp4
WO2003098475A1 (en) 2002-04-29 2003-11-27 Sony Electronics, Inc. Supporting advanced coding formats in media files
WO2004012037A2 (en) 2002-07-26 2004-02-05 Prediwave Corporation On-the-fly mpeg trick mode processing
WO2004032519A1 (en) * 2002-10-07 2004-04-15 Koninklijke Philips Electronics N.V. Efficient motion-vector prediction for unconstrained and lifting-based motion compensated temporal filtering
FR2864407B1 (fr) * 2003-12-22 2006-03-10 Canon Kk Procede et dispositif de transmission continue d'une video dans un reseau de communication
US20060037057A1 (en) 2004-05-24 2006-02-16 Sharp Laboratories Of America, Inc. Method and system of enabling trick play modes using HTTP GET
KR100666325B1 (ko) 2004-12-15 2007-01-09 삼성전자주식회사 메모리 셀 어레이 블록 할당 방법, 메모리 셀 어레이블록의 어드레싱 방법 및 이를 이용한 반도체 메모리 장치
US20060233247A1 (en) * 2005-04-13 2006-10-19 Visharam Mohammed Z Storing SVC streams in the AVC file format
US20070014346A1 (en) * 2005-07-13 2007-01-18 Nokia Corporation Coding dependency indication in scalable video coding
CN101248668A (zh) * 2005-08-26 2008-08-20 汤姆森特许公司 使用时间分层的特技播放
KR20100030648A (ko) * 2007-06-26 2010-03-18 노키아 코포레이션 시간 레이어 스위칭 포인트들을 표시하는 시스템 및 방법
KR101651137B1 (ko) * 2010-07-19 2016-08-25 엘지전자 주식회사 미디어 세그먼트 송수신 방법 및 그를 이용한 송수신 장치
US8930562B2 (en) * 2010-07-20 2015-01-06 Qualcomm Incorporated Arranging sub-track fragments for streaming video data
US9456015B2 (en) * 2010-08-10 2016-09-27 Qualcomm Incorporated Representation groups for network streaming of coded multimedia data

Also Published As

Publication number Publication date
US20170149858A1 (en) 2017-05-25
EP2625867A1 (en) 2013-08-14
US9560398B2 (en) 2017-01-31
JP2013543322A (ja) 2013-11-28
KR20130139970A (ko) 2013-12-23
US9137555B2 (en) 2015-09-15
US20130185756A1 (en) 2013-07-18
CN103141115A (zh) 2013-06-05
US20180048692A1 (en) 2018-02-15
CN103141115B (zh) 2016-07-06
US10110654B2 (en) 2018-10-23
US9807142B2 (en) 2017-10-31
KR101620151B1 (ko) 2016-05-12
US20150350728A1 (en) 2015-12-03
WO2012047158A1 (en) 2012-04-12

Similar Documents

Publication Publication Date Title
JP5953307B2 (ja) クライアント、コンテンツクリエータエンティティ及びそれらがメディアストリーミングする方法
JP6839257B2 (ja) 送信方法、受信方法、送信装置および受信装置
JP6516766B2 (ja) 分割タイムドメディアデータのストリーミングを改善するための方法、デバイス、およびコンピュータプログラム
KR101750048B1 (ko) 변속 재생 서비스 제공 방법 및 장치
CN110089122B (zh) 用于检索媒体数据的方法、媒体装置及计算机可读存储媒体
US9699486B2 (en) Method and apparatus for transmitting and receiving data
KR101737325B1 (ko) 멀티미디어 시스템에서 멀티미디어 서비스의 경험 품질 감소를 줄이는 방법 및 장치
CA2758237C (en) Media container file management
US10375373B2 (en) Method and apparatus for encoding three-dimensional (3D) content
US10863211B1 (en) Manifest data for server-side media fragment insertion
US11805303B2 (en) Method and apparatus for storage and signaling of media segment sizes and priority ranks
EP3652952A1 (en) Processing media data using a generic descriptor for file format boxes

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20140903

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20150423

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20150508

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20150810

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20160322

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20160512

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20160603

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20160613

R150 Certificate of patent or registration of utility model

Ref document number: 5953307

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250