JP4838273B2 - メディア内同期化のための適応型メディア再生方法および装置 - Google Patents

メディア内同期化のための適応型メディア再生方法および装置 Download PDF

Info

Publication number
JP4838273B2
JP4838273B2 JP2008041186A JP2008041186A JP4838273B2 JP 4838273 B2 JP4838273 B2 JP 4838273B2 JP 2008041186 A JP2008041186 A JP 2008041186A JP 2008041186 A JP2008041186 A JP 2008041186A JP 4838273 B2 JP4838273 B2 JP 4838273B2
Authority
JP
Japan
Prior art keywords
playback
frame
media
buffer
current
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2008041186A
Other languages
English (en)
Other versions
JP2008206161A (ja
Inventor
ジョンウォン、キム
サンフン、パク
Original Assignee
クヮンジュ・インスティテュート・オブ・サイエンス・アンド・テクノロジー
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by クヮンジュ・インスティテュート・オブ・サイエンス・アンド・テクノロジー filed Critical クヮンジュ・インスティテュート・オブ・サイエンス・アンド・テクノロジー
Publication of JP2008206161A publication Critical patent/JP2008206161A/ja
Application granted granted Critical
Publication of JP4838273B2 publication Critical patent/JP4838273B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/44Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/44Decoders specially adapted therefor, e.g. video decoders which are asymmetric with respect to the encoder
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/44Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs
    • H04N21/44004Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs involving video buffer management, e.g. video decoder buffer or video display buffer
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/44Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs
    • H04N21/4402Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs involving reformatting operations of video signals for household redistribution, storage or real-time display
    • H04N21/440281Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs involving reformatting operations of video signals for household redistribution, storage or real-time display by altering the temporal resolution, e.g. by frame skipping
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/442Monitoring of processes or resources, e.g. detecting the failure of a recording device, monitoring the downstream bandwidth, the number of times a movie has been viewed, the storage space available from the internal hard disk
    • H04N21/44209Monitoring of downstream path of the transmission network originating from a server, e.g. bandwidth variations of a wireless network
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/60Network structure or processes for video distribution between server and client or between remote clients; Control signalling between clients, server and network components; Transmission of management data between server and client, e.g. sending from server to client commands for recording incoming content stream; Communication details between server and client 
    • H04N21/63Control signaling related to video distribution between client, server and network components; Network processes for video distribution between server and clients or between remote clients, e.g. transmitting basic layer and enhancement layers over different transmission paths, setting up a peer-to-peer communication via Internet between remote STB's; Communication protocols; Addressing
    • H04N21/643Communication protocols
    • H04N21/64322IP
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/80Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
    • H04N21/85Assembly of content; Generation of multimedia applications
    • H04N21/854Content authoring
    • H04N21/8547Content authoring involving timestamps for synchronizing content

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Databases & Information Systems (AREA)
  • Computer Security & Cryptography (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)

Description

本発明は、ネットワークメディアストリーミングシステムの受信側におけるメディア再生方法に関し、より詳しくは、ネットワークメディアストリーミングシステムの受信側におけるバッファ基盤適応型メディア内同期化技法を適用したメディア再生方法に関するものである。
最新のIPネットワークにおけるメディアストリーミングサービスでは、受信側において空間および時間の側面における再生品質が最終ユーザにとって満足できることが重要である。しかし、ネットワークが混雑した状況における再生品質はパケットの損失/遅延/ジッターなどによって深刻に損傷し得る。1つの例として、1つのビデオフレームの部分的なパケット損失は空間的な品質を測定する単位であるピーク信号対雑音比(Peak Signal to Noise Ratio;PNSR)を落とす。その一方、パケットの遅延およびジッターなどによって発生する再生途切れ(pause)とスキップ(skip)のような時間的側面における再生品質の減少もまた全体的な再生品質を落とす。
空間的な再生品質の減少は自動再送要求(Automatic Repeat reQuest;ARQ)や順方向エラー訂正(Forward Error Correction)のようなエラー制御技法によって取り扱われる反面、時間的な再生品質の減少問題はメディア同期化技法によって取り扱われる。一般的にメディア同期化問題は、メディア内同期化(intra−media synchronization)、メディア間同期化(inter−media synchronization)、クライアント間同期化(inter−client synchronization)に分けることができる。
メディア内同期化は1つの単一ストリーム内におけるメディアユニット(Media Unit;MU)間に時間的な関係を保存する技法である。その一方、メディア間同期化はオーディオとビデオ間のリップシンク(Lip Sync)のように、ストリーム間の時間的な関係を保存する技法である。最後に、クライアント間同期化は、スポーツ生放送やテレビ会議のようにマルチキャストメディアストリーミング応用においてクライアント間の再生時点を同一に合わせる技法である。
一般的なストリーミングシステムはメディア内同期化のための基本的な機能を含んでいる。第1の基本的機能として、送信者は、受信側でメディアユニットの再生時間を復元するために、メディアストリーム内にタイムスタンプ(timestamp)を生成して挿入する。例えば、MPEG(Moving Picture Experts Group)標準はSCR(System Clock Reference)、PTS(Presentation Time Stamp)、DTS(Decoding Time Stamp)のようなタイムスタンプを提供し、システム階層で同期化モデルを定義している。第2の機能として、受信側においてパケット遅延とジッターなどを緩衝させるための再生バッファを設ける。ここで、再生バッファの大きさに応じてパケット遅延とジッター(jitter)の緩衝量と再生遅延間の相反関係が存在する。よって、再生バッファの大きさはストリーミング応用の類型に応じて慎重に決定しなければならない。
しかし、上記のような基本的な機能だけでは益々混雑化するネットワークにおけるメディア内同期化を保障することができない。例えば、時間的に可変するネットワーク状況に応じて受信側におけるバッファアンダーフローやバッファオーバーフローが生じ得る。その結果、再生途切れや再生スキップのような再生不連続さが発生する。
適応型メディア再生(Adaptive Media Playout:以下、AMP)技法はメディアユニット間の再生時間を調節することによってメディア内同期化品質を向上させる。つまり、AMP技法は受信側においてネットワーク状況に応じてメディアユニットの再生時間をスケジューリングする。このようなAMP技法の基本動作は、メディア再生品質において、視聴者にとっては非予測的で長い再生不連続さよりはよく調節された短い不連続さを良い品質であると感じることに基づく。非公式的な実験によれば、AMPによる25%までの再生速度調節は視聴者にとってはそれほど大きく感じられず、メディアコンテンツの特性によっては50%まで受け入れることができる。
今まで提案されたAMP技法は時間基盤モデルとバッファ基盤モデルに分類することができる。時間基盤モデルを用いた技法は、送信側と受信側における時間情報とタイムスタンプを用いてネットワーク遅延とジッターを明示的に測定する。その一方、バッファ基盤モデルを用いた技法は受信側の再生バッファに溜まっているパケット量を用いてネットワークジッターや遅延などの量を暗示的に判断する。
前記時間基盤モデルとバッファ基盤モデルは二つとも再生不連続さを避けるために測定されたパラメータ(明示的なネットワーク遅延およびジッター、またはバッファ量)に基づいてメディアユニットの再生時間を調節する。しかし、時間基盤モデル技法の性能は送信者と受信者間の同期化した時間の存在有無によって左右される制約を有している。その理由は、測定されるネットワーク遅延とジッターの正確度が送信側と受信測間の時間誤差によって落ちるためである。それを解決するために近接時間測定技法と時間を用いない同期化技法が提案されている。バッファ基盤技法はこのような送信側と受信測間の同期化した時間が要求されないという側面で長所がある。
初期にAMP技法の適用応用対象はVoIP(Voice over Internet Protocol)のようなパケットオーディオ応用であった。Ramjee、J.Kurose、D.TowsleyおよびH.Schulzrinneの論文(“Adaptive playout mechanisms for packetized audio applications in wide−area networks、”in Proc.IEEE INFOCOM’94、vol.2、pp.680−688、June 1994)では可変するネットワーク遅延によるオーディオパケットの再生遅延を調節するAMPアルゴリズムが提案された。ここで提案されたアルゴリズムは時間基盤のモデルを用いて全体的に同期化した時間があると仮定している。Y.IshibashiおよびS.Tasakaの論文(“A synchronization mechanism for continuous media in multimedia communications、”in Proc.IEEE INFOCOM’95、pp.1010−1019、April 1995)では時間概念を導入したメディア同期化アルゴリズムが開示されている。上記論文ではネットワークの遅延時間が一定時間量に制限されると仮定する。S.B.Moon、J.KuroseおよびD.Towsleyの論文(“Packet audio playout delay adjustment:Performance bounds and algorithms、”ACM/Springer Multimedia Systems、vol.5、no.1、pp.17−28、Jan.1998)では時間基盤モデルにおけるパケットオーディオ応用のために最適な平均再生遅延計算技法を提案し、その性能を比較している。
K.RothermelおよびT.Helbigの論文(“An adaptive stream synchronization protocol、”in Proc.NOSSDAV’95、vol LNCS 1018、pp.189−202、April 1995)ではASP(Adaptive Synchronization Protocol)と呼ばれる1つのAMPプロトコルが開示されている。上記論文ではネットワークビデオ応用のために受信側再生バッファを調節する技法が開示されている。上記論文では下位バッファ閾値LWM (low water mark)と上位バッファ閾値HWM (high water mark)のようなバッファ閾値を定義している。上記論文において、再生速度は現在のバッファレベルがLWMより小さいかHWMより大きい場合に適応的に調節される。M.Kato、N.UsuiおよびS.Tasakaの論文(“Stored media synchronization based on buffer occupancy in PHS”、in Proc.IEEE PIMRC’97、vol.3、pp.1049−1053、Sept.1997)ではまた他のバッファ基盤のスライド制御プロトコルと呼ばれるAMP技法が開示されている。上記論文ではAMP制御の重要なガイドラインとなるバッファ閾値を適切に決定する方法が提示されている。
M.C.Yuang、P.L.TienおよびS.T.Liangの論文(“Intelligent video smoother for multimedia communications、”IEEE Journal on Selected Areas in Communications、vol.15、no.2、pp.136−146、Feb.1997)では1つのバッファ基盤のAMP技法が開示されている。上記論文では神経ネットワークトラフィック予測器を用いた適切なバッファ閾値を決める技法について開示しており、メディア内同期化品質尺度としてVoD(Variance of Discontinuity)を定義している。しかし、上記論文の技法を適用するためには複雑なトラフィック予測器が要るため、その実現が複雑である短所を有する。N.LaouarisおよびI.Stavrakakisの論文“Adaptive playout strategies for packet video receivers with finite buffer capacity”、in Proc.IEEE ICC’01、vol.3、pp.1660−1672、Sep.1999)では新しいメディア内同期化品質尺度であるVDoP(Variance of Distortion of Playout)を定義している。VDoPはVoDにバッファアンダーフローによるフレーム損失の効果を測定できる要素を追加したものである。H.LiuおよびM.E.Zarkiの論文(“A synchronization control scheme for real−time streaming multimedia applications”、in Proc.Packet Video Workshop 2003、April 2003)では過去の再生不連続のRMSE(Root Mean Square Error)に基づいて適応的に再生速度を決定する品質基盤の適応型メディア同期化技法が開示されている。
既存の再生不連続モデルを用いるAMP技法は、入力パラメータとして現在のバッファレベルと予め定義されたバッファ閾値、過去の再生不連続のRMSE値、または複雑なトラフィック分析器を用いて再生速度を決定してメディア内同期化を行うため、メディア内同期化品質を向上させるのに限界があった。
本発明はメディア内同期化品質を向上させるためのバッファ基盤の適応型メディア再生方法を提供することを第1目的とする。
本発明はメディア内同期化品質を向上させるための適応型メディア再生装置を提供することを第2目的とする。
上述した本発明の第1目的を達成するための本発明の一態様に係るネットワークメディアストリーミングシステムの受信側におけるバッファ基盤適応型メディア再生方法は、受信したメディアストリームの現在のj番目フレーム(ここで、jは自然数)を再生するための再生間隔を算出するステップ;および前記現在のj番目フレームを受信してから前記算出した再生間隔だけ待機した後に前記現在のj番目フレームを再生するステップを含み、前記現在のj番目フレームを再生するための再生間隔を算出するステップは、(j+w)番目フレーム(ここで、wは自然数)のバッファレベルを算出するステップ;前記算出したバッファレベルに基づいて再生途切れおよび再生スキップのうちの1つを予測するステップ;および前記予測した再生途切れおよび再生スキップのうちの1つの場合に対し、前記現在のj番目フレームを再生するための再生間隔を算出するステップを含む。前記(j+w)番目フレームのバッファレベルを算出するステップは、前記j番目フレームにおける所定の予測受信率を求めて算出することができる。前記(j+w)番目フレームのバッファレベルを算出するステップは、前記メディアストリームの平均受信率と(j−1)番目フレームの再生時間と(j−2)番目フレームの再生時間との間の受信率に加重値を適用して前記予測受信率を算出することができる。前記算出したバッファレベルに基づいて前記j番目フレームにおける再生途切れまたは再生スキップを予測するステップは、前記算出したバッファレベルにアンダーフローが発生する場合には前記再生途切れとして予測し、前記算出したバッファレベルにオーバーフローが発生する場合には前記再生スキップとして予測することができる。前記予測した再生途切れおよび再生スキップのうちの1つの場合に対して前記現在のj番目フレームを再生するための再生間隔を算出するステップは、前記予測した再生途切れおよび再生スキップのうちの1つの場合に対し、再生速度調節パラメータに基づいて前記現在のj番目フレームを再生するための再生間隔を算出することができる。前記予測した再生途切れまたは前記再生スキップ時の再生速度調節パラメータに基づいて前記現在のj番目フレームを再生するための再生間隔を算出するステップは、前記予測した再生途切れ時の再生速度調節パラメータの最大値と最小値または前記予測した再生スキップ時の再生速度調節パラメータの最大値と最小値に基づき、前記現在のj番目フレームを再生するための再生間隔を算出することができる。前記再生速度調節パラメータは、前記算出したバッファレベルに応じて求められた最大値と最小値の中間値で定められ得る。
また、本発明の第2目的を達成するための本発明の一態様に係る適応型メディア再生装置は、ネットワークから受信したメディアパケットを格納する再生バッファ;前記再生バッファに格納されたメディアパケットを復号化するビデオデコーダ;および前記復号化されたメディアパケットの(j+w)番目フレーム(ここで、jおよびwは自然数)のバッファレベルに基づいて再生途切れおよび再生スキップのうちの1つを予測し、前記予測した再生途切れおよび再生スキップのうちの1つの場合に対し、前記現在のj番目フレームを再生するための再生間隔を算出する適応型メディア再生制御部を含む。
本発明の一実施形態に係るバッファ基盤適応型メディア再生方法は、再生途切れと再生スキップのような再生不連続の場合を分析し、前記再生不連続の場合の分析に基づいて、再生途切れおよび再生スキップの場合の再生不連続または2つの場合ではない全ての場合に対して共通に適用できる1つの単一再生不連続モデルを定義する。また、前記定義された再生不連続モデルを用いて再生速度の最大値と最小値を求める。また、現在のj番目フレームから未来の(j+w)番目フレームのバッファレベルを予測し、予測したバッファレベルから再生途切れと再生スキップが予測される場合、再生不連続モデルに基づいてAMP因子値を動的に調節して再生速度を制御する。
したがって、既存のバッファ閾値基盤のメディア再生技法に比べ、遅延またはジッターなどによる再生不連続のRMSE値などのような時間的な歪み量を減らすことができる。
本発明は、様々な変更を加えることができるし、色々な実施形態を有することができるが、以下では特定の実施形態を図面に例示して詳細に説明する。
しかし、これは本発明を特定の実施形態に対して限定するものではなく、本発明の思想および技術範囲に含まれる全ての変更、均等物、および代替物を含むものとして理解しなければならない。
尚、第1、第2などの用語は多様な構成要素を説明するために用いられるが、前記構成要素は前記用語によって限定されるものではない。前記用語は1つの構成要素を他の構成要素から区別する目的のみで用いられる。例えば、本発明の権利範囲を逸脱しない限り、第1構成要素は第2構成要素として命名することができ、同じく第2構成要素も第1構成要素として命名することができる。「および/または」という用語は複数の関連した記載項目の組み合わせまたは複数の関連した記載項目のうちの1項目を含む。
以下、添付図面を参照して本発明の望ましい実施形態についてより詳細に説明する。以下、図面上の同一構成要素に対しては同一参照符号を用い、同一構成要素について重複する説明は省略する。
以下、メディア(media)とはビデオおよびオーディオのうちの1つを含む概念である。
1.1基本適応型メディア再生(AMP)のフレームワーク
図1は一般的な適応型メディア再生(AMP)方式を適用したネックワークシステム構造を示すブロック図である。図2は本発明の一実施形態に係る適応型メディア再生(AMP)を行う受信側の適応型メディア再生装置の構成を示すブロック図であり、図3は本発明の一実施形態に係る適応型メディア再生装置において行われる適応型メディア再生(AMP)過程を説明するための概念図である。
図1に示すように、適応型メディア再生(AMP)方式を適用したネットワークシステムは、送信機10、IPネットワーク20、および適応型メディア再生装置100からなっている。ここで、適応型メディア再生装置100は受信機を示す。図2に示すように、適応型メディア再生装置100は、中央処理部120、メインメモリ、AMP制御部130、ネットワークデバイス140、ビデオデコーダ150、およびビデオ出力部160を含む。中央処理部120、メインメモリ、およびAMP制御部130は、バス170によってネットワークデバイス140、ビデオデコーダ150、およびビデオ出力部160に連結される。メインメモリは再生バッファ115を含むことができる。図2において再生バッファ115はメインメモリの内部に含まれるものとして示されているが、メインメモリの外部に別途に備えることができる。以下、ビデオストリーミングを仮定して説明するが、本発明の実施形態はオーディオストリーミングにも適用することができる。
中央処理部120およびメインメモリは一般的な応用プログラムを遂行する。
再生バッファ115はネットワークデバイス140から受信するビデオパケットをバス170を介して受信して格納する。
AMP制御部130は、中央処理部120およびメインメモリによって制御されるように連結され、バス170に接続している再生バッファ115、ビデオデコーダ150、ビデオ出力部160間のバス170を介したデータの伝送を制御し、ビデオ出力部170の出力時間を制御する。
図3に示すように、再生バッファ115はネットワークデバイス140から受信するビデオパケットをバス170を介して受信して格納し、ビデオデコーダ150は再生バッファ115に格納されたビデオパケットを復号化する。
AMP制御部130は予測受信率を求めて未来のバッファレベルを予測し、前記予測した未来のバッファレベルに基づいて再生途切れまたは再生スキップのうちのいずれか1つの再生不連続モデルを決定する。また、AMP制御部130は前記決定した再生不連続モデルに対して前記予測した未来のバッファレベルに応じて再生間隔を決めるためにAMP因子値の最大値と最小値を求める。また、AMP制御部130は前記AMP因子値の最大値と最小値を用いて再生間隔を求めることにより、ビデオデコーダ150を介して伝えられた現在のメディアユニットの再生時間を制御する。
図1に示すように、一般的なメディアユニットの再生タイムラインは生成時間<g>、到着時間<a>、再生時間<p>で構成される。k番目メディアユニットの生成時間tg[k]は、一般式1のように、k−1番目メディアユニットの生成時間tg[k−1]から求めることができる。
Figure 0004838273
ここで、fps(frame per second)は原本ビデオストリームのフレーム率(frame rate)を示す。
送信機10においてタイムスタンプを有するメディアユニットは、図1に示すように、IPネットワーク20を介して適応型メディア再生装置100の再生バッファ115に伝送される。適応型メディア再生装置100におけるAMP制御部130はメディアユニットの再生時間をスケジュールする。
生成時間の場合と同じように、k番目メディアユニットの再生時間tp[k]は次の一般式2のようにk−1番目メディアユニットの再生時間tp[k−1]から求めることができる。
Figure 0004838273
ここで、△[k−1]はk−1番目メディアユニットのAMP因子を示し、AMP因子は再生速度を調節するためのパラメータとして用いられる。△[k−1]はk番目とk−1番目メディアユニット間の再生間隔を決める。例えば、△[k−1]が正数値を有する場合には再生速度が減少して再生時間が遅れる。図1のb[k]はt[k]におけるバッファレベルをビット単位で示す。
1.2再生不連続モデル
図5は再生途切れ時の再生不連続モデルを示す概念図であり、図6は再生スキップ時の再生不連続モデルを示す概念図であって、再生タイムラインにおける連続的なメディアユニット間の基本的な再生不連続モデルを示す。
一般式1と一般式2から、k番目とk−1番目メディアユニット間の再生不連続量は次の一般式3のように求められる。
Figure 0004838273
よって、k番目とk−1番目メディアユニットが本来のスケジュールされた時間に再生されるとd[k]は0になる。
さらに、t[k]における遅延は次の一般式4のように定義することができる。
Figure 0004838273
単一再生不連続モデルを定義するためには再生途切れとスキップのような場合を共に考慮する必要がある。先ず、図4のようにt[k]において再生途切れがある場合について調べてみる。ここでnp[k]は、t[k]とt[k−1]間の再生途切れになったフレームスロットの個数を意味する。
再生途切れの場合の再生不連続モデルは次の一般式5のように定義することができる。
Figure 0004838273
類似する方法によって再生スキップの場合の不連続モデルを次の一般式6のように定義することができる。
Figure 0004838273
ここでn[k]は、t[k]と最も最近再生したメディアユニット間にスキップされたメディアユニットの個数を示す(図5参照)。
最後に、一般式5と一般式6から、単一再生不連続モデルを次の一般式7のように定義することができる。
Figure 0004838273
1.3メディア内同期化品質
再生において時間的な歪み量を測定するためには、視聴者が感じる再生品質の特性を考慮するときに、長い再生不連続さが短い再生不連続さよりさらに加重値を与えて計算される。つまり、メディア内同期化品質は再生不連続さの長さが線形的に増加するに伴って幾何級数的に減少する。時間的歪み量を測定するための尺度として、再生不連続さの平均二乗誤差(Root Mean Square Error;以下、RMSE)を用いることができる。
j番目からk番目メディアユニットまでのメディア内同期化品質は次の一般式8のように計算することができる。
Figure 0004838273
ここで、
Figure 0004838273
はj番目からk番目メディアユニットまでの再生不連続のRMSEを示す。
一般式7からメディア内同期化品質を増加させるためには、再生途切れと再生スキップのような長い再生不連続の場合を最小化することが重要である。AMP技法は再生速度を調節することによって再生途切れとスキップの場合を減らすのに用いられ得る。ここで、AMP技法による再生速度調節の変化範囲は人間の知覚特性を考慮して決定することができる。よって、次の一般式9のようにAMP技法の再生速度の調節範囲を定義することができる。
Figure 0004838273
ここで、△thは最大許容AMP調節パラメータ(threshold of AMP parameter)を示す。例えば、△thは0.25を有することができ、この場合の再生速度の調節範囲は−25%〜25%までとなる。
一方、再生途切れおよび再生スキップによる再生不連続量がメディア内同期化品質の低下により大きく影響を及ぼすといっても、AMP技法によって発生する再生不連続量もメディア内同期化品質の低下に影響を及ぼし得る。よって、再生不連続のRMSEを最小化する効率的なAMP制御技法が求められる。以下、本発明の一実施形態に係る再生不連続モデルに基づいたAMPメディア再生方法について説明する。
2.再生不連続モデルに基づいたAMPメディア再生方法
時間的な歪みを最小化するためには、AMP技法は再生途切れと再生スキップを避けられるように設計されるべきであり、そのために再生途切れと再生スキップを防ぐための最大/最小AMP因子(factor)値を求める。先ず、単一メディアユニット(MU)途切れの場合を考慮する。ここでは、単一メディアユニット途切れの場合の時間的な歪みを最小化できるAMP因子値の効果的な範囲を求める。その後は複数のメディアユニット途切れの場合に広げることができる。また、再生スキップの場合にも再生途切れの場合と類似するように単一メディアユニット(MU)途切れおよび複数のメディアユニット途切れの場合を考慮することができる。
2.1再生途切れ
2.1.1単一メディアユニット途切れ
先ず、再生不連続モデルを用いて単一メディアユニット途切れの場合を分析する。AMP技法を適用しない場合、t[k]においてn[k]=1であると仮定する。そうすると、再生不連続のRMSEは一般式7と一般式8を用いて次の一般式10のように求めることができる。
Figure 0004838273
ここで、wはウィンドウサイズ(window size)を示し、一般式9と一般式10からwの範囲を次の一般式11のように決めることができる。
Figure 0004838273
一方、AMP技法を適用した時、n[k]を0であると仮定すれば、AMP技法を適用した時の再生不連続のRMSEは次の一般式12のようになる。
Figure 0004838273
ここで、△th/fpsはAMP技法の適用時の再生不連続のRMSEの最小値を示す。よって、一般式10と一般式12から、AMPフレームワーク(framework)は次の一般式13のようなAMP因子値の最大値の条件を満足する時に効率的であると言える。
Figure 0004838273
一方、バッファレベルb[k]に次の一般式14のようにアンダーフローが発生した時、k番目メディアユニットで再生途切れが発生する。
Figure 0004838273
ここで、b[k]はt[k]におけるバッファレベルを意味し、次の一般式15のように求めることができる。
Figure 0004838273
ここでr[i]は、t[i]とt[i−1]間の受信率を示し、Sは固定伝送率(Constant Bit Rate、以下、CBR)ビデオのビット率(bit rate)を示す。
よって、一般式14と一般式15から、t[k]において再生途切れを避けるためのAMP因子値の最小値は次の一般式16のように決定することができる。
Figure 0004838273
2.1.2複数のメディアユニット途切れ(Multiple MUs pause)
単一メディアユニットの場合の分析は複数のメディアユニット途切れの場合を考慮することで一般的な場合に広げることができる。t[k]後に連続的な(m+1)個のメディアユニット途切れがあると仮定すれば、一般式16は次の一般式17のように複数のメディアユニット途切れの場合の再生途切れを避けるためのAMP条件に広げることができる。
Figure 0004838273
よって、複数のメディアユニット途切れの場合のAMP因子値の最小値は次の一般式18のように定義することができる。
Figure 0004838273
また、一般式12と類似するようにAMP因子値の最小値は次の一般式19のように決定することができる。
Figure 0004838273
2.2再生スキップ
2.2.1複数のメディアユニットスキップ(Multiple MUs skip)
再生バッファのオーバーフローおよび再生スキップは、再生バッファ115のバッファレベルがb−S/fpsより大きい時に発生する。
再生スキップのための分析は再生途切れの場合と類似する。よって、具体的な分析過程は省略する。
先ず、t[k]において連続的な(m+1)個のメディアユニットがスキップしたと仮定すれば、AMP因子値の最大値は次の一般式20のように決定され、最小値は次の一般式21のように決定される。
Figure 0004838273
ここで、bは適応型メディア再生装置100の再生バッファ115の大きさを示す。
Figure 0004838273
2.3再生速度決定アルゴリズム
上記では再生途切れと再生スキップを避けるためのAMP因子値の最大値および最小値を定義した。上記AMP因子値の最大値および最小値の正義によって本発明の一実施形態に係る適応型メディア再生方法では、与えられた状況に伴うAMP因子値を動的に決定する。
本発明の一実施形態に係る適応型メディア再生方法は、1つの加重値式(一般式24参照)を用いて、現在のj番目フレームから未来の(j+w)番目フレームのバッファレベルを予測する。また、前記予測したバッファレベルから再生途切れと再生スキップが予測される場合に、再生不連続モデルに基づいて効果的なAMP因子値を動的に調節する。上記のようなアプローチ技法を適用することにより、本発明の一実施形態に係るAMP制御技法は、遅延またはジッターなどによる再生不連続のRMSE値などのような時間的歪み量を既存のバッファ閾値基盤の技法と比較して減らすことができる。
以下、本発明の一実施形態に係る適応型メディア再生方法について説明する。
2.3.1AMP制御アルゴリズムの説明
図7は本発明の一実施形態に係るネットワークメディアストリーミングシステムの適応型メディア再生装置におけるバッファ基盤適応型メディア再生方法を説明するフローチャートであり、図8は図7の現在フレームの再生間隔を計算するための過程を説明するフローチャートである。図9は図8の再生途切れ時の再生速度の最大値および最小値を求める過程を説明するフローチャートであり、図10は図8の再生スキップ時の再生速度の最大値および最小値を求める過程を説明するフローチャートである。
図7に示すように、本発明の一実施形態に係るバッファ基盤適応型メディア再生方法は、ネットワーク20を介して受信したメディアユニットの再生を開始するために、適応型メディア再生装置100では初期化過程を行って初期バッファリングを行う(ステップ710)。最初に受信したビデオパケットはネットワークデバイス140を経て、バス170を介して再生バッファ115に格納される。ここで、初期フレームはj=0に設定され、wは所定の初期値に設定される。wは一般式11のように
Figure 0004838273
より大きい値を有する。第1番目メディアユニットは再生バッファ115のバッファレベルが目標バッファレベルより大きい時に再生される。
AMP制御部130では、受信した現在のj番目フレームを再生するための再生間隔を計算する(ステップ720)。再生間隔は、一般式2に示すように、AMP因子値△[j]を用いて(1+△[j])/fpsで算出され得る。つまり、現在のj番目フレームは(1+△[j])/fpsだけ待機した後に再生される。上記現在のj番目フレームを再生するための再生間隔を計算する過程は図8〜図10を参照して後述する。
130では、前記現在のj番目フレームを受信してから前記算出した再生間隔だけ待機した後に前記現在のj番目フレームを再生する(ステップ730)。
AMP制御部130では、前記現在のj番目フレームを再生した後、次のフレームである(j+1)番目フレームに対してステップ720〜ステップ730の動作を行い、受信したメディアストリームの最後のフレームになるまでステップ720〜ステップ740の動作を繰り返し行った後(ステップ750)、メディアストリームの再生過程を終了する(ステップ760)。
以下、図8〜図10を参照して現在のj番目フレームを再生するための再生間隔を計算する過程について説明する。
先ず、AMP制御部130では現在のj番目フレームから未来の(j+w)番目フレームのバッファレベルを予測する(ステップ721)。具体的には、先ずAMP制御部130ではt[k]からt[j+w]までの受信率を次の一般式22の加重値式によって算出する。
Figure 0004838273
ここで、rest[i]はt[i]からt[i−1]までの予測受信率を示し、Rはrestの平均値として以前フレームまで求められたrest値の平均値を示す。αは加重値因子であり、例えば0.9にセッティングすることができる。
AMP制御部130では一般式15に前記予測した受信率rest[i]を適用して、未来の(j+w)番目フレームのバッファレベルbest[j+w]を予測することができる。
次に、再生不連続モデルを決めるために、前記予測したバッファレベルに基づいてバッファアンダーフロー(underflow)であるかまたはバッファオーバーフロー(overflow)であるかを予測して決める(ステップ723)。つまり、前記予測したバッファレベルに基づいて、現在のj番目フレームにおけるフレーム途切れまたはフレームスキップを予測する。バッファアンダーフローが予測された場合には再生途切れとして予測することができ、バッファオーバーフローが予測された場合にはフレームスキップとして予測することができる。
具体的には、予測された未来のバッファレベルbest[j+w]を一般式14のb[k]といった時、バッファアンダーフローは現在バッファに再生できるフレームが1つもない状態であるため、一般式14のようにb[k]がS/fpsより小さい場合にアンダーフローとして判断し、再生途切れという不連続モデルを適用するように決定することができる。同じく、予測された未来のバッファレベルbest[j+w]を一般式14のb[k]といった時、バッファオーバーフローは、バッファレベルがバッファ容量が溜っているにもかかわらず、再生側においてフレームデータをバッファから持って行かないことによってバッファ内でフレーム損失が生じた場合であるため、b[k]がbs−S/fpsより大きい場合にオーバーフローとして判断し、再生途切れという不連続モデルを適用するように決定することができる。
バッファアンダーフローであると予測した場合、前記予測したバッファレベルに応じてフレーム再生途切れ時の再生速度調節パラメータであるAMP因子値の最大値AMPmaxおよび最小値AMPminを算出する(ステップ724)。具体的には、フレーム再生途切れ時のAMP因子値の最大値は一般式13を用いて求めることができ(ステップ724−1)、フレーム再生途切れ時のAMP因子値の最小値は予測されたバッファレベルbest[j+w]をb[k]といった時、一般式16に前記予測したバッファレベルbest[j+w]を代入して求めることができる(ステップ724−2)。前記求められたフレーム再生途切れ時のAMP因子値の最大値および最小値は返還される(ステップ724−3)。ここで、一般式2を用いてフレーム再生途切れ時のAMP因子値の最大値AMPmaxおよび最小値AMPminを求めれば、フレーム再生途切れ時の再生速度の最大値および最小値を求めることができる。
バッファオーバーフローであると予測した場合、前記予測したバッファレベルに応じてフレーム再生スキップ時の再生速度調節パラメータであるAMP因子値の最大値AMPmaxおよび最小値AMPminを算出する(ステップ725)。具体的には、フレーム再生スキップ時のAMP因子値の最大値は、予測したバッファレベルbest[j+w]をb[i]といった時、一般式20に予測したバッファレベルbest[j+w]を代入して求めることができ(ステップ725−1)、フレーム再生スキップ時のAMP因子値の最小値は一般式21を用いて求めることができる(ステップ725−2)。前記求められたフレーム再生スキップ時のAMP因子値の最大値および最小値は返還される(ステップ725−3)。ここで、一般式2を用いてフレーム再生スキップ時のAMP因子値の最大値AMPmaxおよび最小値AMPminを求めれば、フレーム再生スキップ時の再生速度の最大値および最小値を求めることができる。
前記求められたAMP因子値の最大値および最小値に基づいて、現在のj番目フレームの再生間隔を算出する(ステップ726)。すなわち、前記予測したフレーム途切れまたは前記フレームスキップ時の再生速度に基づいて、前記現在のj番目フレームを再生するための再生間隔を算出する。例えば、前記求められたAMP因子値の最大値および最小値の中間値をAMP因子値△[j]として決定し、一般式20を用いて現在のj番目フレームの再生間隔を算出することができる。または、AMP因子値の最大値および最小値に所定の加重値を適用してAMP因子値△[j]として決定して再生間隔を決めるなど、前記中間値以外の他の方式によっても再生間隔を決めることもできる。ここで、再生間隔が大きくなる場合は再生速度が減少し、再生間隔が小さくなる場合は再生速度が増加する。
バッファアンダーフローおよびバッファオーバーフローの何れも予測されない場合には、現在のj番目フレームの再生間隔を0に設定する(ステップ727)。その結果、前記求められた再生間隔を返還する(ステップ728)。
3.性能評価
3.1シミュレーション環境
図11は、本発明の一実施形態に係るバッファ基盤適応型メディア再生方法の性能評価のためのシミュレーショントポロジーを示す概念図である。Node 0と34はビデオ送信機と受信機を示す。Node 0はビデオソースをNode 34でストリームする。ここで、ソースビット率は4.8Mbpsである。ネットワーク混雑を与えるためにNode 77はシミュレーションシナリオによってNode 33で3Mbpsのパレートトラフィック(pareto traffic)を伝送する。このような設定により、Node 2と10でボトルネック(bottle neck)地点が発生する。受信側のバッファ大きさであるbは4.8Mbitに設定される。また、AMP因子値の閾値△thは0.25に設定される。
多様なネットワーク状況下で評価するために図12のように3つの混雑シナリオを用いた。図12は本発明の一実施形態に係るバッファ基盤適応型メディア再生方法を3つのシナリオに対してシミュレーションした場合の受信機で測定されたフレーム当たりパケット数を示すグラフである。
図12において、y軸は受信側で測定されるフレーム当たりパケット数(ppf:packets per frame)を示し、x軸は再生タイムラインを示す。ソースビデオのフレーム率であるfpsは25にセッティングされた。よって、本来のフレーム当たりパケット数(ppforigin)は次の一般式23によって16になる。
Figure 0004838273
ここで、1500bytesはRTP(Real−time Transport Protocol)パケットの大きさと同一である。
よって、一般式15で用いられたr[i]はppf[i]*8*1500として計算され得る。ここでppf[i]はt[i]とt[i−1]との間の受信したパケット数を示す。図12のようにppfはppforiginを中心に変わる。シナリオ1において、Node 77はパレートトラフィックを2秒間隔で開始と止めを繰り返すように設定した。それと同様にシナリオ2では5秒、シナリオ3では20秒間隔で開始と止めを繰り返すように設定した。
以下では3つの技法の性能を比較した。第1番目技法(without AMP)はAMP技法を適用せず、第2番目技法(TH−based AMP)は2つの閾値であるLWMとHWMが適用された既存のバッファ閾値基盤のAMP技法である。バッファレベルが閾値範囲から脱する時に最大閾値である△thが適用される。閾値による性能比較を行うために多様なLWMとHWM下においてシミュレーションを行った。第3番目技法は本発明のバッファ基盤適応型メディア再生方法(proposed AMP)であり、これもまたwを多様に変化させながらシミュレーションを行った。
3.2シミュレーションの結果
図13は、本発明の一実施形態に係るバッファ基盤適応型メディア再生方法を3つのシナリオに対してシミュレーションした場合の受信機で測定された再生不連続のRMSE値を示すグラフである。シナリオ1は、第2番目技法(TH−based AMP)の下位閾値LWMが0.3secであり、上位閾値HWMが0.7secであり、第3番目技法である本発明のバッファ基盤適応型メディア再生方法のwが37である場合を示す。シナリオ2は、第2番目技法(TH−based AMP)の下位閾値LWMが0.1secであり、上位閾値HWMが0.9secであり、第3番目技法である本発明のバッファ基盤適応型メディア再生方法のwが25である場合を示す。シナリオ3は、第2番目技法(TH−based AMP)の下位閾値LWMが0.2secであり、上位閾値HWMが0.8secであり、第3番目技法である本発明のバッファ基盤適応型メディア再生方法のwが12である場合を示す。図13に示すように、3つのシナリオに対し、本発明のバッファ基盤適応型メディア再生方法が最も小さい再生不連続のRMSEを有することが分かる。
図14〜図16は本発明の一実施形態に係るバッファ基盤適応型メディア再生方法を各々のシナリオ1、シナリオ2、シナリオ3に対してシミュレーションした場合の受信機で測定されたバッファレベルとAMP因子値を示すグラフである。
図14〜図16に示すように、第2番目技法(TH−based AMP)において、AMP制御はバッファレベルに応じて動作し、AMP因子値は0.25、0、−0.25の3つの値だけを有する。しかし、本発明のバッファ基盤適応型メディア再生方法は、上述したAMP制御アルゴリズムに応じて動作するため、AMP因子値は動的に変わることが分かる。
図17は従来のバッファ基盤適応型メディア再生方法と本発明の一実施形態に係るバッファ基盤適応型メディア再生方法を3つのシナリオに対してバッファ閾値とwを可変させながらシミュレーションした場合の受信機で測定された再生不連続のRMSE値を示すグラフである。図17に示すように、シナリオ1において、TH−based AMPの再生不連続のRMSEはLWMが120である時に最小値を有する。また、LWMが16から120に増加するにつれて再生不連続のRMSEは徐々に減少する。しかし、LWMが180である時に再生不連続のRMSEは急激に大きくなる。また、シナリオ2と3における最も優れた値を有する閾値もまた異なる。図17に示すように、本発明のバッファ基盤適応型メディア再生方法では、再生不連続のRMSE値がw値によって変わり、TH−based AMPの再生不連続のRMSE値より小さい値を有することが分かる。
図18は従来のバッファ基盤適応型メディア再生方法と本発明の一実施形態に係るバッファ基盤適応型メディア再生方法を3つのシナリオに対してバッファ閾値とwを可変させながらシミュレーションした場合の受信機で測定された平均再生率を示すグラフであり、図19は従来のバッファ基盤適応型メディア再生方法と本発明の一実施形態に係るバッファ基盤適応型メディア再生方法を3つのシナリオに対してバッファ閾値とwを可変させながらシミュレーションした場合の受信機で測定された遅延値を示すグラフである。
図18に示すように、本発明の一実施形態に係るバッファ基盤適応型メディア再生方法を適用する場合、従来のTH−based AMP技法と比較して平均再生率がw値の変化に関わらず安定した値を有することが分かる。従来のTH−based AMP技法の適用時には、下位バッファ閾値(LWM)によって本発明の一実施形態に係るバッファ基盤適応型メディア再生方法より高い平均再生率を有する場合もあるが、下位バッファ閾値の変化に応じて平均再生率の変化が激しいことを確認することができる。同じく、図19に示すように、遅延値もまた本発明の一実施形態に係るバッファ基盤適応型メディア再生方法においてより安定した値を有することを確認することができる。
図20は従来の再生方法と本発明の一実施形態に係るバッファ基盤適応型メディア再生方法を3つのシナリオに対してシミュレーションした場合の性能値を示す図表である。図20はTH−based AMPと本発明のバッファ基盤適応型メディア再生方法に対する図17〜図19までの結果の平均と標準偏差値を示す。従来のTH−based AMP技法の性能はLWMとHWMの値に依存的である。例えば、LWMとHWMの値がbの1/2に設定されると仮定すれば、バッファオーバーフローとバッファアンダーフローを避けるために再生速度は頻繁に変わり、また頻繁なAMP制御による再生不連続さも増加する。一方、本発明のバッファ基盤適応型メディア再生方法の性能もwに依存的であるため、適切なwを選択する場合に性能を最大化することができる。図20に示すように、本発明のバッファ基盤適応型メディア再生方法は3つの技法のうちで最小の再生不連続のRMSE値を有する。また、本発明のバッファ基盤適応型メディア再生方法は再生不連続のRMSEの標準偏差も3つの技法のうちで最小値を有する。すなわち、本発明のバッファ基盤適応型メディア再生方法は、wに関わらず従来のTH−based AMP技法より良い性能を示すことが分かる。
本発明のバッファ基盤適応型メディア再生方法は、再生途切れと再生スキップのような再生不連続の場合を分析し、前記再生不連続の場合の分析に基づき、再生途切れおよび再生スキップの場合の再生不連続さまたは2つの場合がないすべての場合に対して共通に適用できる単一再生不連続モデルを定義する。上記単一再生不連続モデルを用いて、再生不連続のRMSEを用いた客観的メディア内同期化の品質尺度を定義する。
また、本発明のバッファ基盤適応型メディア再生方法は、上記で定義された再生不連続モデルを用いて再生速度の最大値と最小値を求めることができる。
また、本発明のバッファ基盤適応型メディア再生方法は、上記再生速度の最大値と最小値を求めるために現在のバッファレベルを用いず、wだけ以後の未来のバッファレベルを予測して用いる。
本発明のバッファ基盤適応型メディア再生方法はビデオストリームに対するメディア内同期化技法について説明したが、本発明のバッファ基盤適応型メディア再生方法はオーディオストリームにも適用可能である。オーディオストリームの再生速度調節は、時間変換技法(time−scale modification of audio)によって行うことができる。
本発明のバッファ基盤適応型メディア再生方法は、マルチメディアストリームの再生速度変更時における変更速度のパラメータを動的に決定する技法を提案しているため、再生速度を変更可能な多様なマルチメディアストリームに対して共通に適用可能である。但し、ストリームおよびコンテンツの特性によって再生速度変更範囲に対する閾値が変わり得る。例えば、動きが殆どないビデオストリームの場合、動きの速いビデオストリームに比べて再生速度変更の許容範囲が増し得る。また、オーディオや音声(voice)ストリームの場合、黙音(silent)区域に応じて再生速度変更に対する閾値に差が出る。
一方、上述した本発明の実施形態はコンピュータで実行できるプログラムで作成可能であり、コンピュータ読み取り可能な記録媒体を用いて前記プログラムを動作させる汎用のディジタルコンピューターで具現できる。上記コンピュータ読み取り可能な記録媒体は、マグネチック貯蔵媒体(例えば、ROM、フロッピーディスク、ハードディスクなど)、光学的判読媒体(例えば、CD−ROM、DVDなど)、およびキャリアウェーブ(例えば、インターネットを通じて転送)などの貯蔵媒体を含む。
以上、実施形態を参照して説明したが、当該技術分野で熟練の当業者であれば、下記特許請求の範囲に記載された本発明の思想および領域から逸脱しない範囲内で本発明の様々な修正および変更ができると理解しなければならない。
一般的な適応型メディア再生(AMP)方式を適用したネックワークシステム構造を示すブロック図である。 本発明の一実施形態に係る適応型メディア再生(AMP)を行う適応型メディア再生装置の構成を示すブロック図である。 本発明の一実施形態に係る適応型メディア再生装置において行われる適応型メディア再生(AMP)過程を説明するための概念図である。 再生時の連続的なメディアユニット間の基本的な再生不連続モデルを示す概念図である。 再生途切れ時の再生不連続モデルを示す概念図である。 再生スキップ時の再生不連続モデルを示す概念図である。 本発明の一実施形態に係るネットワークメディアストリーミングシステムの適応型メディア再生装置におけるバッファ基盤適応型メディア再生方法を説明するフローチャートである。 図7の現在フレームの再生間隔を計算するための過程を説明するフローチャートである。 図8の再生途切れ時の再生速度の最大値および最小値を求める過程を説明するフローチャートである。 図8の再生スキップ時の再生速度の最大値および最小値を求める過程を説明するフローチャートである。 本発明の一実施形態に係るバッファ基盤適応型メディア再生方法の性能評価のためのシミュレーショントポロジーを示す概念図である。 本発明の一実施形態に係るバッファ基盤適応型メディア再生方法を3つのシナリオに対してシミュレーションした場合の受信機で測定されたフレーム当たりパケット数を示すグラフである。 本発明の一実施形態に係るバッファ基盤適応型メディア再生方法を3つのシナリオに対してシミュレーションした場合の受信機で測定された再生不連続のRMSE値を示すグラフである。 本発明の一実施形態に係るバッファ基盤適応型メディア再生方法をシナリオ1に対してシミュレーションした場合の受信機で測定されたバッファレベルとAMP因子値を示すグラフである。 本発明の一実施形態に係るバッファ基盤適応型メディア再生方法をシナリオ2に対してシミュレーションした場合の受信機で測定されたバッファレベルとAMP因子値を示すグラフである。 本発明の一実施形態に係るバッファ基盤適応型メディア再生方法をシナリオ3に対してシミュレーションした場合の受信機で各再生時間ごとに測定されたバッファレベルとAMP因子値を示すグラフである。 従来のバッファ基盤適応型メディア再生方法と本発明の一実施形態に係るバッファ基盤適応型メディア再生方法を3つのシナリオに対してバッファ閾値とwを可変させながらシミュレーションした場合の受信機で測定された再生不連続のRMSE値を示すグラフである。 従来のバッファ基盤適応型メディア再生方法と本発明の一実施形態に係るバッファ基盤適応型メディア再生方法を3つのシナリオに対してバッファ閾値とwを可変させながらシミュレーションした場合の受信機で測定された平均再生率を示すグラフである。 従来のバッファ基盤適応型メディア再生方法と本発明の一実施形態に係るバッファ基盤適応型メディア再生方法を3つのシナリオに対してバッファ閾値とwを可変させながらシミュレーションした場合の受信機で測定された遅延値を示すグラフである。 従来の再生方法と本発明の一実施形態に係るバッファ基盤適応型メディア再生方法を3つのシナリオに対してシミュレーションした場合の性能値を示す図表である。
符号の説明
100:適応型メディア再生装置、受信機
115:再生バッファ
130:AMP制御部

Claims (11)

  1. ネットワークメディアストリーミングシステムの受信側におけるバッファ基盤適応型メディア再生方法は、
    受信したメディアストリームの現在のj番目フレーム(ここで、jは自然数)を再生するための再生間隔を算出するステップ;および
    前記現在のj番目フレームを受信してから前記算出した再生間隔だけ待機した後に前記現在のj番目フレームを再生するステップを含み、
    前記受信したメディアストリームの現在のj番目フレームを再生するための再生間隔を算出するステップは、
    前記メディアストリームの平均受信率と(j−1)番目フレームの再生時間と(j−2)番目フレームの再生時間との間の受信率に加重値を適用して前記 j番目フレームにおける予測受信率を算出し、(j−1)番目フレームのバッファレベルから前記予測受信率を利用して(j+w)番目フレーム(ここで、wは自然数)のバッファレベルを算出するステップ;
    前記算出したバッファレベルに基づいて前記現在のj番目フレームにおける再生途切れおよび再生スキップのうちの1つを予測するステップ;および
    前記予測した再生途切れおよび再生スキップのうちの1つの場合に対し、再生速度調節パラメータに基づいて前記現在のj番目フレームを再生するための再生間隔を算出するステップを含むことを特徴とするメディア再生方法。
  2. 前記算出したバッファレベルに基づいて前記現在のj番目フレームにおける再生途切れまたは再生スキップのうちの1つを予測するステップは、前記算出したバッファレベルにアンダーフローが発生する場合には前記再生途切れとして予測し、前記算出したバッファレベルにオーバーフローが発生する場合には前記再生スキップとして予測することを特徴とする、請求項1に記載のメディア再生方法。
  3. 前記予測した再生途切れおよび再生スキップのうちの1つの場合に対し、再生速度調節パラメータに基づいて前記現在のj番目フレームを再生するための再生間隔を算出するステップは、前記予測した再生途切れ時の再生速度調節パラメータの最大値と最小値を算出するか、または前記予測した再生スキップ時の再生速度調節パラメータの最大値と最小値を算出し、前記算出した再生速度調節パラメータの最大値と最小値に基づき前記現在のj番目フレームを再生するための再生間隔を算出することを特徴とする、請求項1に記載のメディア再生方法。
  4. 前記予測した再生途切れおよび再生スキップのうちの1つの場合に対し、再生速度調節パラメータに基づいて前記現在のj番目フレームを再生するための再生間隔を算出するステップは、 前記算出した再生速度調節パラメータの最大値と最小値の中間値に基づき前記現在のj番目フレームを再生するための再生間隔を算出すること特徴とする、請求項3に記載のメディア再生方法。
  5. 前記算出したバッファレベルにアンダーフローまたはオーバーフローが発生しない場合には、前記現在のj番目フレームを再生するための再生間隔を0に設定することを特徴とする、請求項4に記載のメディア再生方法。
  6. 前記現在のj番目フレームの次のフレームである(j+1)番目フレームから受信したメディアストリームの最後のフレームまで前記再生間隔を算出して再生するステップをさらに含むことを特徴とする、請求項1に記載のメディア再生方法。
  7. 請求項1に記載されたネットワークメディアストリーミングシステムの受信側におけるバッファ基盤適応型メディア再生方法を実行するためのプログラムを記録したコンピュータで読み取り可能な記録媒体。
  8. ネットワークから受信したメディアパケットを格納する再生バッファ;
    前記再生バッファに格納されたメディアパケットを復号化するビデオデコーダ;および
    前記メディアストリームの平均受信率と(j−1)番目フレームの再生時間と(j−2)番目フレームの再生時間との間の受信率に加重値を適用して前記 j番目フレームにおける予測受信率を算出し、(j−1)番目フレームのバッファレベルから前記予測受信率を利用して前記復号化されたメディアパケットの(j+w)番目フレーム(ここで、jおよびwは自然数)のバッファレベルを算出し、前記算出したバッファレベルに基づいて前記現在のj番目フレームにおける再生途切れおよび再生スキップのうちの1つを予測し、前記予測した再生途切れおよび再生スキップのうちの1つの場合に対し、再生速度調節パラメータに基づいて前記現在のj番目フレームを再生するための再生間隔を算出する適応型メディア再生制御部を含む適応型メディア再生装置。
  9. 前記適応型メディア再生制御部は、前記算出したバッファレベルにアンダーフローが発生する場合には前記再生途切れとして予測し、前記算出したバッファレベルにオーバーフローが発生する場合には前記再生スキップとして予測することを特徴とする、請求項8に記載の適応型メディア再生装置。
  10. 前記適応型メディア再生制御部は、前記予測した再生途切れ時の再生速度調節パラメータの最大値と最小値を算出するか、または前記予測した再生スキップ時の再生速度調節パラメータの最大値と最小値を算出し、前記算出した再生速度調節パラメータの最大値と最小値に基づき前記現在のj番目フレームを再生するための再生間隔を算出することを特徴とする、請求項9に記載の適応型メディア再生装置。
  11. 前記適応型メディア再生制御部は、 前記算出した再生速度調節パラメータの最大値と最小値の中間値に基づき前記現在のj番目フレームを再生するための再生間隔を算出することを特徴とする、請求項10に記載の適応型メディア再生装置。
JP2008041186A 2007-02-22 2008-02-22 メディア内同期化のための適応型メディア再生方法および装置 Expired - Fee Related JP4838273B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
KR10-2007-0017996 2007-02-22
KR20070017996A KR100787314B1 (ko) 2007-02-22 2007-02-22 미디어내 동기화를 위한 적응형 미디어 재생 방법 및 장치

Publications (2)

Publication Number Publication Date
JP2008206161A JP2008206161A (ja) 2008-09-04
JP4838273B2 true JP4838273B2 (ja) 2011-12-14

Family

ID=39147523

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008041186A Expired - Fee Related JP4838273B2 (ja) 2007-02-22 2008-02-22 メディア内同期化のための適応型メディア再生方法および装置

Country Status (3)

Country Link
US (1) US8351762B2 (ja)
JP (1) JP4838273B2 (ja)
KR (1) KR100787314B1 (ja)

Families Citing this family (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AP2557A (en) * 2005-08-05 2013-01-18 Nokia Corp Coordinating uplink control channel gating with channel quality indicator reporting
US8102878B2 (en) 2005-09-29 2012-01-24 Qualcomm Incorporated Video packet shaping for video telephony
US8514711B2 (en) * 2005-10-21 2013-08-20 Qualcomm Incorporated Reverse link lower layer assisted video error control
US8406309B2 (en) * 2005-10-21 2013-03-26 Qualcomm Incorporated Video rate adaptation to reverse link conditions
US8842555B2 (en) * 2005-10-21 2014-09-23 Qualcomm Incorporated Methods and systems for adaptive encoding of real-time information in packet-switched wireless communication systems
US8548048B2 (en) * 2005-10-27 2013-10-01 Qualcomm Incorporated Video source rate control for video telephony
EP2109982B1 (en) * 2007-01-10 2018-08-08 Qualcomm Incorporated Content- and link-dependent coding adaptation for multimedia telephony
US8797850B2 (en) * 2008-01-10 2014-08-05 Qualcomm Incorporated System and method to adapt to network congestion
EP2392138A4 (en) * 2009-01-28 2012-08-29 Nokia Corp METHOD AND APPARATUS FOR VIDEO ENCODING AND DECODING
US8891946B2 (en) 2009-09-09 2014-11-18 Netflix, Inc. Accelerated playback of streaming media
CN103339951B (zh) * 2010-11-30 2016-01-20 汤姆逊许可公司 根据丢帧图案测量视频质量的方法和装置
US20130170561A1 (en) * 2011-07-05 2013-07-04 Nokia Corporation Method and apparatus for video coding and decoding
US9286384B2 (en) 2011-09-21 2016-03-15 Sonos, Inc. Methods and systems to share media
US8874634B2 (en) 2012-03-01 2014-10-28 Motorola Mobility Llc Managing adaptive streaming of data via a communication connection
JP5972616B2 (ja) * 2012-03-15 2016-08-17 日本放送協会 受信装置、クロック復元方法及びプログラム
WO2014087449A1 (en) * 2012-12-04 2014-06-12 Hitachi, Ltd. Network device and method of controlling the network device
US9788078B2 (en) * 2014-03-25 2017-10-10 Samsung Electronics Co., Ltd. Enhanced distortion signaling for MMT assets and ISOBMFF with improved MMT QoS descriptor having multiple QoE operating points
GB2521883B (en) * 2014-05-02 2016-03-30 Imagination Tech Ltd Media controller
US10098082B2 (en) * 2015-12-16 2018-10-09 Sonos, Inc. Synchronization of content between networked devices
KR102419595B1 (ko) * 2016-01-07 2022-07-11 삼성전자주식회사 재생 지연 조절 방법 및 이를 적용한 전자 장치
US9967689B1 (en) 2016-09-29 2018-05-08 Sonos, Inc. Conditional content enhancement
EP3313043B1 (en) * 2016-10-19 2019-08-07 Sandvine Incorporated ULC System and method for determining quality of a media stream
CN109327716B (zh) * 2018-10-31 2020-09-11 北京达佳互联信息技术有限公司 延迟控制方法、延迟控制装置和计算机可读存储介质
EP4099710A1 (en) * 2021-05-31 2022-12-07 THEO Technologies Buffer management for live video streaming

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100298174B1 (ko) * 1998-12-23 2001-08-07 이계철 네트웍을통한멀티미디어스트리밍시스템및그방법
US6356664B1 (en) * 1999-02-24 2002-03-12 International Business Machines Corporation Selective reduction of video data using variable sampling rates based on importance within the image
US7155532B2 (en) * 2002-01-04 2006-12-26 Scientific-Atlanta, Inc. Transmitting streams over asynchronous networks
CN101065963B (zh) * 2003-08-29 2010-09-15 Rgb网络有限公司 提供低延迟类vcr效果和节目改变的视频多路复用器***
US7424026B2 (en) * 2004-04-28 2008-09-09 Nokia Corporation Method and apparatus providing continuous adaptive control of voice packet buffer at receiver terminal
KR100782343B1 (ko) * 2004-07-07 2007-12-06 한국과학기술원 영상 스트리밍 방법
KR100678891B1 (ko) * 2004-07-30 2007-02-05 삼성전자주식회사 Av데이터 수신시 버퍼량을 컨텐츠 속성에 따라탄력적으로 조절하는 방법 및 장치
KR20060065482A (ko) * 2004-12-10 2006-06-14 마이크로소프트 코포레이션 스트리밍 미디어 데이터의 코딩 비트 레이트의 제어 시스템및 프로세스

Also Published As

Publication number Publication date
US20080205856A1 (en) 2008-08-28
US8351762B2 (en) 2013-01-08
JP2008206161A (ja) 2008-09-04
KR100787314B1 (ko) 2007-12-21

Similar Documents

Publication Publication Date Title
JP4838273B2 (ja) メディア内同期化のための適応型メディア再生方法および装置
KR100750669B1 (ko) 멀티미디어 스트리밍 방법 및 장치
EP2255535B1 (en) Device and method for adaptation of target rate of video signals
US7657672B2 (en) Packet scheduling for data stream transmission
US7652994B2 (en) Accelerated media coding for robust low-delay video streaming over time-varying and bandwidth limited channels
JP4462996B2 (ja) パケット受信方法及びパケット受信装置
US20100290454A1 (en) Play-Out Delay Estimation
JP5191826B2 (ja) ストリーム通信装置、ストリーム通信方法及びストリーム通信システム
KR101982290B1 (ko) 적응적 스트리밍 서비스의 체감 품질 향상을 위한 콘텐츠 특성 기반 스트리밍 시스템 및 방법
CN103888381A (zh) 用于控制抖动缓冲器的装置和方法
KR101180540B1 (ko) 스트리밍 서비스 송/수신 장치 및 방법
Huang et al. Tsync: A new synchronization framework for multi-site 3d tele-immersion
Li et al. Arrival process-controlled adaptive media playout with multiple thresholds for video streaming
TWI431986B (zh) Information processing apparatus and method, and program
US6735223B1 (en) Method of controlling offset of time stamp and apparatus for transmitting packet using the same
US20100027428A1 (en) Scheduling method of providing multimedia service
Park et al. An adaptive media playout for intra-media synchronization of networked-video applications
JP5218995B2 (ja) 動画再生端末,動画再生方法及びプログラム
Agrawal et al. Use of statistical methods to reduce delays for media playback buffering
JP2010136159A (ja) データ受信装置
KR101636198B1 (ko) 무선 통신 환경에서 비디오 스트리밍의 트래픽 제어 방법 및 이를 구현하는 수신기 장치
Sreenan et al. Internet stream synchronization using Concord
KR100685982B1 (ko) 미디어 정보의 동기화 방법 및 그 장치
Jelassi et al. Adaptive playout scheduling algorithm tailored for real-time packet-based voice conversations over wireless ad-hoc networks
KR100986555B1 (ko) 프로그레시브 멀티미디어 스트리밍 서비스를 위한 초기버퍼링 시간 결정 방법 및 시스템

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110111

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110411

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110719

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110816

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20110906

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20110929

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20141007

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees