JP5346338B2 - ビデオを索引化する方法及びビデオを索引化する装置 - Google Patents

ビデオを索引化する方法及びビデオを索引化する装置 Download PDF

Info

Publication number
JP5346338B2
JP5346338B2 JP2010513897A JP2010513897A JP5346338B2 JP 5346338 B2 JP5346338 B2 JP 5346338B2 JP 2010513897 A JP2010513897 A JP 2010513897A JP 2010513897 A JP2010513897 A JP 2010513897A JP 5346338 B2 JP5346338 B2 JP 5346338B2
Authority
JP
Japan
Prior art keywords
interest
region
data stream
video data
indexing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2010513897A
Other languages
English (en)
Other versions
JP2010532121A (ja
Inventor
ファーブル,シルヴァン
ソシャール,レジ
ラガレイエ,ピエール・ローレン
ムール,オリヴィエ ル
ギヨテル,フィリップ
ヴェルミューレン,サミュエル
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Thomson Licensing SAS
Original Assignee
Thomson Licensing SAS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Thomson Licensing SAS filed Critical Thomson Licensing SAS
Publication of JP2010532121A publication Critical patent/JP2010532121A/ja
Application granted granted Critical
Publication of JP5346338B2 publication Critical patent/JP5346338B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/47End-user applications
    • H04N21/472End-user interface for requesting content, additional data or services; End-user interface for interacting with content, e.g. for content reservation or setting reminders, for requesting event notification, for manipulating displayed content
    • H04N21/4728End-user interface for requesting content, additional data or services; End-user interface for interacting with content, e.g. for content reservation or setting reminders, for requesting event notification, for manipulating displayed content for selecting a Region Of Interest [ROI], e.g. for requesting a higher resolution version of a selected region
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/59Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving spatial sub-sampling or interpolation, e.g. alteration of picture size or resolution
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/44Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs
    • H04N21/4402Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs involving reformatting operations of video signals for household redistribution, storage or real-time display

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Databases & Information Systems (AREA)
  • Human Computer Interaction (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Description

本発明は、ビデオを索引化する方法及びビデオを索引化する装置に関する。
いくつかのピクチャ処理アプリケーションは、ピクチャ品質を向上させるために関心領域(ROI)の検出を使用する。例えば、符号化アプリケーションは多くの場合、関心領域を復号化し、前述の領域を符号化するために、より多くの資源を活用する。
種々の方法が、ピクチャにおける関心領域の検出を可能にする。特に、視覚パラメータを考慮に入れ、ピクチャ又はビデオを視る際に人間の眼が永く残る領域の画定を可能にするピクチャ又はビデオの顕著性マップの確立に基づく手法が知られている。
関心領域の検出は現在、主に、(例えば、前述の領域の量子化ステップを削減することにより、)より多くの帯域幅を与えることにより、符号化中に関心領域を特権化するように、符号化前に使用される。
移動端末(携帯電話機、PDA、ゲーム・コンソール、ポータブルDVDプレイヤなど)の出現、ディスプレイ及び画面の手法の進展、及び新規サービスの台頭が全て組み合わさって、表示容量が低い端末上でビデオを表示することが必要になっている。例えば、携帯電話機上でテレビを受信することができることにより、寸法が小さな画面上に高密度のピクチャを表示するうえで問題が生じている。
本発明は、主に、関心領域の検出でなく、種々のアプリケーションについて考慮に入れ、移動端末であってもなくても、低い表示容量を備えた端末上でのピクチャ表示の問題を少なくとも解決することが可能な、装置又はアプリケーションへの前述の関心領域の伝送に関する。
この目的で、本発明は、符号化ビデオ・データ・ストリームを索引化する方法を提案している。本発明によれば、ビデオ・データ・ストリームは、各ピクチャの関心領域の位置に関する情報を含み、方法は、
符号化ビデオ・ストリームを受信する工程と、
記録サポート上に符号化ビデオ・ストリームする工程と、
関心領域の位置情報を復号化する工程と、
ピクチャ毎に関心領域を選択する工程と、
ビデオ・データを復号化する工程と、
ピクチャ毎に選択された関心領域からビデオ・データ・ストリームの所定数の関心領域を選択する工程と、
選択された関心領域を記録する工程と
を含む。
好ましい実施例では、記録する工程中に、
選択され、復号化されるにつれ、選択された関心領域が一時メモリに記録され、
選択された関心領域が全て、一時メモリに記録されると、選択された関心領域が永続的メモリ・サポート(503)に転送される。
好ましくは、記録される前に、関心領域は、選択された関心領域全てに均一のサイズを得るためにフォーマッティングされる。
好ましくは、方法は、暗号化鍵により、関心領域の位置を暗号化する工程を含む。
好ましくは、方法は、ユーザによる支払いにより、復号鍵を得る工程を含む。
好ましくは、ビデオ・データ・ストリームは符号化標準H.264/AVCに応じて符号化され、位置情報は付加拡張情報(SEI)タイプ・メッセージに含まれる。
好ましい実施例によれば、SEIメッセージは、リアルタイム・プロトコル・パケット(RTP)にカプセル化され、RTPパケットは暗号化される。
好ましくは、関心領域位置情報に関する付加拡張情報タイプ・メッセージは、参照する各ピクチャの前後の符号化データに挿入される。
好ましい実施例によれば、位置情報は、
各ピクチャにおける関心領域の数と、
ピクチャの寸法毎の関心領域毎の座標と、
関心領域毎の表面と、
ピクチャの他の関心領域に対する関心領域の重要度に対する重みと、
関心領域毎のコンテンツに関する情報と、
前述の情報の何れかの組合せ
から選ばれる情報を含む。
好ましくは、ピクチャ毎の関心領域の選択工程は、関心領域の重要度に対する重みに応じて関心領域を選択する。
好ましくは、ビデオ符号化標準は、柔軟なマクロブロック配列を使用し、関心領域は他のピクチャ・データとは無関係に、スライス群に符号化され、関心領域の位置情報は、関心領域が符号化されるスライス群番号を含む。
好ましくは、付加拡張情報メッセージは、一関心領域に関係しているかを、スライス群毎に示す識別子を含む。
好ましくは、方法はSEIメッセージを読み出す更なる工程を含み、ビデオ・データの復号化の工程は関心領域を含むスライス群のみを復号化する。
本発明は、符号化ビデオ・データ・ストリームを索引化する装置にも関する。本発明によれば、ビデオ・データ・ストリームは、各ピクチャの関心領域の位置に関する情報を含み、装置は、
符号化ビデオ・ストリームを受信する手段と、
記録サポート上に符号化ビデオ・ストリームを記録する手段と、
関心領域の位置情報を復号化する手段と、
ビデオ・データを復号化する手段と、
ピクチャ毎に関心領域を選択する手段と、
ピクチャ毎に選択された関心領域からビデオ・データ・ストリームの所定数の関心領域を選択する手段と、
選択された関心領域を記録する手段
とを備える。
ピクチャの関心領域の検出は一般に、符号化前に行われる。このデータは次いで、符号化を容易にするために使用される。関心領域の位置が、ピクチャの復号化中に、特に、表示容量が制限された装置上の表示中に、関心のあるということを本願の発明者は認識している。実際に、受信端末は、関心領域のみの表示を選び、完全なピクチャの表示に対して前述の領域のより良好な可視性を有することを可能にすることができる。
本発明の好ましい実施例による符号化装置を示す図である。 本発明の好ましい実施例による符号化方法を示す図である。 本発明の好ましい実施例による復号化装置を示す図である。 本発明の別の実施例による復号化方法を示す図である。 本発明の別の実施例による個人向記録タイプの装置を示す図である。 本発明の実施例を実現する個人向記録タイプの装置における索引化方法を示す図である。
本発明は、限定列挙でないが、添付図面を参照して実施例及び実現形態により、更に深く理解し、例証されよう。
図1は、本発明の好ましい実施例を実現するH.264/AVC符号化標準による符号化装置を示す。前述の好ましい実施例では、ビデオ・ストリームが符号化される。
現在のフレームFが、符号化器によって符号化されるために符号化器の入力に供給される。前述のフレームは、スライスの形式で符号化される、すなわち、前述のフレームは、16×16画素群に対応する特定数のマクロブロックをそれぞれが含むサブユニットに分割される。各マクロブロックはイントラ・モード又はインター・モードで符号化される。イントラ・モードであってもインター・モードであっても、マクロブロックは、再構成されたフレームに基づいて符号化される。モジュール109は、ピクチャのコンテンツに応じて、現在のピクチャの符号化モードをイントラ・モードに決定する。イントラ・モードでは、P(図2に示す)は、先行して符号化され、復号化され、再構成された(図2中のuF’n、uはフィルタリングされていない)現在のフレームFnのサンプルを含む。インター・モードでは、Pは、1つ又は複数のF’n−1フレームに基づいた動き推定から生じる。
動き推定モジュール101は、現在のフレームFnと少なくとも1つの先行フレームF’n−1との間の動きの推定を確立する。この動き推定から、動き補償モジュール102は、現在のピクチャFnがインター・モードで符号化しなければならない場合、フレームPを生成する。
減算器103は、信号Dn(すなわち、符号化する対象のピクチャFnと、ピクチャPとの間の差)を生成する。次いで、このピクチャは、モジュール104においてDCT変換によって変換される。変換されたピクチャが次いで、量子化モジュール105によって量子化される。次いで、ピクチャがモジュール111によって再編成される。CABAC(コンテキストベースの適応的二進算術符号化)型エントロピ符号化モジュール112は次いで、各ピクチャを符号化する。
モジュール106及び107(それぞれ、量子化モジュール及び逆変換モジュール)は、変換及び量子化に続く逆量子化及び逆変換の後、差D’nが再構成されることを可能にする。
ピクチャが、モジュール109により、イントラ・モードで符号化されると、イントラ予測モジュール108はピクチャを符号化する。uF’nピクチャ、並びにD’n信号及びP信号の和が、加算器の出力114で得られる。このモジュール108は、再構成されたフィルタリングされていないF’nのピクチャを入力で受け取る。
フィルタ・モジュール110は、uF’nピクチャから再構成され、フィルタリングされたF’nピクチャを得ることが可能である。
エントロピ復号化モジュール112は、NALタイプのユニットでカプセル化された符号化スライスを送信する。NALは、例えば、ヘッダに関する情報、及びスライスを含む。NALタイプ・ユニットはモジュール113に送信される。
モジュール116は、関心領域が求められることを可能にする。現在、いくつかの手法により、関心領域がピクチャ内で位置特定されることを可能にする。顕著性マップの確立に基づいた手法が特に知られている。例えば、トムソン・ライセンシング(Thompson Licensing)社により、西暦2006年7月13日付けで出願された特許出願の国際公開2006/07263号パンフレット(西暦2006年7月13日付け公開
)には、顕著性マップを作成する効果的な方法が開示されている。
手段116は次いで、ビデオのピクチャ毎に顕著性マップを確立する。前述の顕著性マップを確立するために、ユーザによって入力されるパラメータも考慮に入れ得る。例えば、ビデオが関係するイベントに応じて、撮影されたシーンの特定の重要な対象を規定し、特に、スポーツ・イベントの場合、それがサッカーの試合に関係している旨を規定することが可能である。効果的には、これにより、イベントに応じて顕著性ゾーンを重み付ける顕著性マップを得ることが可能になる。サッカーの試合では、スタンドではなくボールに焦点を当てることが好ましい。
関心領域モジュールはしたがって、1つ又は複数の顕著性ゾーン(関心領域としても表される)が抽出されることを可能にする。前述の関心領域は次いで、ピクチャ上で地理的に位置特定される。
前述の関心領域は、ピクチャの高さ及び幅に応じて座標によって識別される。前述のサイズは、関心領域毎に抽出することも可能である。意味情報の要素と関連付けることも可能である。実際に、サッカーの試合の場合、ユーザが、表示する対象のいくつかの関心領域の選択肢から、表示する対象の関心領域を選択することが可能な場合、関心領域に関する情報を必要とし得る。
モジュール115は、SEI(「付加拡張情報」)タイプ・メッセージにコード化するために関心領域に関する情報を受け取る。
SEIメッセージは、以下の表に示すように符号化される。
Figure 0005346338
uuid_iso_iec_11578:復号化器にメッセージ・タイプを示すための128ビットの単一のワード。
user_data_payload_byte:SEIメッセージの一部を含む8ビット
通常、この場合、
payloadSize=17(バイト)、よって、UUIDは16であり、固有データは1である。
user_data_payload_byte:
Figure 0005346338
number_of_ROI:ピクチャ(又は後続ピクチャ)内に存在している関心領域の数
roi_x_16:16個の画素の倍数での、関心領域のピクチャにおけるXの位置
roi_y_16:16個の画素の倍数で、関心領域のピクチャにおけるYの位置
roi_w_16:関心領域のピクチャ内の幅(16画素の倍数)
roi_h_16:関心領域のピクチャ内の高さ(16画素の倍数)
semantic_information:関心領域を特徴付ける題名
相対的重み:基本的に最も関心の高い関心領域が分かるようにピクチャの関心領域毎の重みを表す。
Macroblock_alignment:関心領域が存在する開始マクロブロックの数、マクロブロック数、幅、及び高さでの、関心領域のサイズを表す。
関心領域が、顕著性マップを使用して検出されると、顕著性レートが、関心領域毎に得られ、顕著性マップを得る手法によって予め求められた特定の閾値よりも顕著性が高い場合、領域は顕著であるとして分類される。よって、SEIメッセージでは、関心領域は、固定閾値よりも顕著性が高い領域全ての顕著性の昇順で分類される。
モジュール113は、SEIメッセージをデータ・ストリームに挿入し、そうして符号化されたビデオ・ストリームを伝送ネットワークに送出する。
SEIメッセージは、参照するピクチャそれぞれよりも前に伝送される。
他の実施例では、2つ以上のピクチャ間で少なくとも1つの関心領域の位置が変動した場合にのみ、SEIメッセージを伝送することも可能である。よって、復号化中、復号化器は、復号化する対象のピクチャの直前であっても、前述のSEIメッセージに現在のピクチャが先行しない場合に先行して受信されたピクチャに関する場合でも、直近に受信されたSEIメッセージを考慮に入れる。
図2は、本発明の好ましい実施例を実現するH.264/AVC符号化標準による符号化方法を示す。
工程E1中、放送する対象のビデオに関連付けられた顕著性マップが求められる。関心領域を示す前述の顕著性マップを求めるために、ビデオ・コンテンツに関する情報は、顕著性マップの確立中にこの情報を考慮に入れるために受け取ることも可能である。特に、スポーツ・イベントの間、ボールの位置は、ユーザの関心領域に対応し、この場合、ボールが位置しているピクチャのゾーンを特権化する。ビデオが、テレビ中継レポートの放送に対応する場合、例えば、既知のピクチャ処理手法を使用して顔を検出することにより、司会者を含むゾーンを特権化することにより、関心領域を求めるものとし得る。
E1工程の終了時に、ビデオ・コンテンツに関する1つ又は複数の関心領域がよって、得られる。
工程E2中に、ピクチャ内の関心領域の座標が求められる。関心領域のサイズは、画素においても求めることが可能であり、コンテンツ上の意味情報を各関心領域と関連付けることが可能である。
並列に、工程E3中に、ビデオ・ストリームは、H.264符号化標準に応じて符号化される。符号化中、関心領域として検出されたゾーンが特権化される。符号化レベルにおける関心領域を特権化するために、より低い量子化ステップが施される。
工程E2に続いて、工程E4中、SEIメッセージが、関心領域に関連付けられた意味情報及び位置から作成される。そうして作成されたSEIメッセージは、表1及び表2において上述されたSEIメッセージによる。
工程E5中、ストリームは、H.264標準による符号化ストリームを得るためにストリームにSEIメッセージを挿入することによって構成される。
そうして符号化されたビデオ・ストリームは、工程E6中に、リアルタイムで、又は遅らせて復号化装置に送信され、復号化装置は局所又は遠隔であり得る。
図3は、H.264/AVC符号化標準により、本発明による復号化装置の好ましい実施例を表す。
モジュール209は、入力においてSEIメッセージを受信する。モジュール209は、別々のSEIメッセージを抽出する。有用データのNALはエントロピ復号化モジュール201に送信される。
SEIメッセージはモジュール210によって解析される。このモジュールは、関心領域を表すSEIメッセージのコンテンツの復号化を可能にする。各ピクチャの関心領域はよって、単純なやり方で、かつ、macroblock_alignmentというフィールドに含まれる情報を使用して各ピクチャの復号化前に復号化装置のレベルで識別される。
マクロブロックは、係数の組を得るために再配列モジュール202に送信される。前述の係数は、モジュール203における逆量子化、及びモジュール204における逆DCT変換を経る。モジュール204の出力では、D’nのマクロブロックが得られ、D’nはDnの変形されたバージョンである。予測ブロックPを加算器205により、D’nに加算してマクロブロックuF’nを再構成する。ブロックPは、インター・モードにおける符号化中に、先行する復号化フレームの、モジュール208によって行われる動き補償後に、又は、イントラ・モードにおける符号化の場合、モジュール207による、マクロブロックuF’nのイントラ予測後に得られる。フィルタ206は、歪みの影響を削減するために信号uF’nに施され、再構成されたフレームF’nが一連のマクロブロックから生成される。
SEIメッセージに含まれる関心領域に関する情報を使用して、関心領域を表すブロックがストリームにおいて、表示前に検出され、前述のブロックが識別され、ユーザの選択に応じてクロッピングし、PDAや携帯電話機などの装置に、表示するために送信することが可能である。
例えば、意味情報を入力することにより、表示したいマクロブロックを選ぶためにユーザに選択を任せることも可能である。例えば、「ボール」を入力し、この場合、ボールを含む関心領域が表示される。この意味情報に関連付けられた関心領域が存在しない場合、関心領域全てを表示することが可能である。種々の関心領域を画面上にモザイクの形式で表示することが可能である。単一の関心領域が表示されると、前述の関心領域は、全画面を占めるように画面上にズームで表示される。
復号化装置はよって、ユーザに対する関心情報を含んでいる可能性が高いマクロブロックのみを復号化する。このようにして、復号化は、より高速になり、復号化装置のレベルで、かつ、したがって、受信側で必要とする資源が少なくなる。受信装置が、処理容量が限定的な移動端末である場合、このことは特に効果的である。
図4は、本発明の好ましい実施例を実現するH.264/AVC符号化標準による復号化方法を示す。
前述の方法は、表示容量が限定的な移動端末において実現することが可能である。
工程S1中、必要な表示のタイプが選択される。選択は、移動端末上に存在しているユーザ・インタフェースによって行われる。完全ピクチャ・モードで機能することにされる場合、送信器によって送信されるにつれ、ビデオ・ストリーム全体が表示される。あるいは、ピクチャの関心領域のみを表示することにされる。この特定のモードは、本発明の特徴を構成する。関心領域を表示することにした場合、工程S2に移り、さもなければ、工程S8に移る。各種SEIメッセージを、他のアプリケーションのビデオ・ストリームに挿入することが可能であり、この場合、工程S8前、又は工程S8中、SEIメッセージ解析の工程が存在し得る。
工程S2中、ユーザは、関心領域の使用法を選択する。特に、ユーザは、
表示したい関心領域の最大数、
画面上に種々の関心領域を表示したい態様(例えば、モザイクの形式)、
関心領域に対して望まれるズームの度合いを選択することが可能であり、
キーワードを使用して、「意味情報」フィールドがキーワードを含む関心領域
を選択することが可能である。この場合、ピクチャ毎に、キーワードを含むピクチャ毎に単一の関心領域(この場合、顕著度が最大の関心領域)を表示することが必要であるか、又はキーワードを含むいくつかの関心領域を表示することが必要であるかを規定することも可能である。
工程S3中、ストリームに存在しているSEIメッセージは、受信されるにつれて解析される。SEIメッセージは、ピクチャ符号化前に検出されたピクチャの関心領域の位置を符号化するために使用される。よって、ピクチャ毎に、ピクチャの視覚特性により、若しくはピクチャ・コンテンツにより、又は両方により、1つ又は複数の関心領域が存在し得る。SEIメッセージは、前述した表1及び表2によって符号化される。SEIメッセージに関する情報は、時間上、対応するピクチャの表示まで記録される。
工程S4中、ピクチャは全て、復号化標準に従って復号化される。
工程S5中、復号化された関心領域は、S2工程中にユーザが選択したものによって処理される。ユーザが、ピクチャの主関心領域のズームを選択した場合、工程S6中、最大表示サイズに達するようにゾーンが拡大される。ユーザが、関心領域のモザイクを選択した場合、ピクチャは関心領域で再構成され、それぞれの関心領域は、表示に選択された関心領域の数及び画面サイズによって拡大される。ユーザがキーワードを規定した場合、キーワードを含む関心領域が表示され、ズームされる。
工程S7中、関心領域が、ユーザの望みに応じて、移動端末の画面上に表示される。
工程S8中、ユーザによる、関心領域のみを表示する旨の非選択に続いて、ビデオ・ストリーム全体が、表示のために復号化される。
図5は、本発明のビデオ索引化アプリケーションを示す。
図5は、パーソナル・レコーダ(PVR)タイプの装置500を部分的に示す。PVR500は、その入力で圧縮ビデオ・ストリームを受信する。上述の実施例によれば、このビデオ・データ・ストリームは、H.264符号化標準に従っている。圧縮ビデオ・ストリームは、特に、表1及び表2で上述したようなSEIメッセージを含む。
このビデオ・データ・ストリームは、記録サポート503に部分的に送信される。記録サポートは、ハード・ディスク、ホログラフィック・サポート、メモリ・カード、又は「ブルー・レイ」ディスクとみなし得る。この記録サポートは他の実施例では遠隔であり得る。
ビデオ・データ・ストリームは、(例えば、テレビ受像機上に表示されるために)リアルタイムで復号化するために復号化器501に別の部分において送信される。既知の装置では、ストリームは、ユーザがリアルタイムで視たい場合、復号化器501に送信される。否定の場合、記録が要求された場合、復号化されないが、単純に記録される。
本発明は、この局面によれば、リアルタイムでの視聴が要求されない場合でも、ビデオ・データ・ストリームの部分の復号化を提供する。ビデオ・ストリームの部分の場合、特に、関心領域又は特定の関心領域である。
復号化器501が、記録が要求されたビデオ・ストリームを受信すると、データは、記録サポート503に送信される。記録サポート503は、受信されるにつれ、データを記録する。同時に、復号化器501は、ビデオ・データ・ストリームを受信し、SEIメッセージを漸次、復号化する。復号化された関心領域は、記録サポート503に送信する前に、一時的に記録する役割を果たすビデオ索引化モジュール502に送信される。
図6は、復号化器501及び索引化モジュール502によって実現される方法を示す。
工程T1中、ビデオ・データ・ストリームは復号化器501によって受信される。工程T2中、復号化器501は、ビデオ・データ・ストリームに存在しているSEIメッセージを復号化する。復号化されたSEIメッセージは、表1及び表2に上述されたようなSEIメッセージである。復号化器は、他のSEIメッセージを復号化することも可能であるが、これは本発明の目的でない。各SEIメッセージは、表1及び表2に上述したようなピクチャ毎に1つ又は複数の関心領域を表すことが可能である。工程T3中、復号化器501は、各SEIメッセージを解析し、各ピクチャを復号化する。この工程中、SEIメッセージにおいて示された重みは、どの関心領域がピクチャ毎に記録されるかを選択するために使用される。好ましい実施例では、顕著性が最大の(すなわち、重みが最高の)関心領域が維持される。
関心領域が復号化されると、工程T4中に、索引化モジュール502に送信される。ピクチャ(全てのピクチャ)毎の関心領域の記録に対する関心は低い。情報量が大きく、効率的なビデオ索引化を可能にしないからである。よって、索引化モジュールは、ビデオを索引化するためにどのピクチャを使用するかを決定する。上述の好ましい実施例によれば、約10のみのピクチャが、1.5時間のビデオについて選択される。他の実施例では、ピクチャの数が大きくなることが想定される。前述の10個のピクチャは、等間隔で撮られる。前述の選択されたピクチャは、索引化モジュール502に含まれるRAMタイプのメモリ(図示せず)に一時的に記録される。最善のやり方で表示されるために、ピクチャは、工程T5中にズーミングされる。すなわち、全て、同じサイズであるように拡大される。好ましい実施例では、このサイズはピクチャのサイズであり得る。そのために、それらは、一時メモリにおいて読み出され、拡大後に再記録される。別の実施例では、ピクチャは、一時メモリにおける記録前に拡大される。
別の実施例によれば、画像はディスプレイ上のモザイクとして提示される。したがって、拡大される代わりに、画像は、全てについて同様に、1つの単一サイズに縮小される。
ビデオ全体が受信され、記録サポート503において記録されると、索引化ピクチャは、一時メモリから記録サポート503に転送され、ファイルに記録される。
次いで、所望の使用によれば、関心領域は、索引化に使用される。上記索引化により、ユーザがデータベースの内容を照会したい場合に、レコーダがビデオの画像を表示することが可能になる。
本発明の別の局面によれば、SEIメッセージの符号化中に関心領域の位置データを暗号化することも可能である。よって、復号鍵を有するユーザのみが、関心領域にアクセスし、関心領域の視覚化にアクセスするか、又は、関心領域の位置情報により、ビデオ・ストリームの索引にアクセスすることが可能である。この暗号化工程(図2を参照)は、工程E4’(図示せず)になるが、工程E4後に挿入される。
復号鍵の取得は、例えば、番組放送者からの有料サービスの対象であり得る。
これを行うために、関心領域に関するSEIメッセージは、RTP(リアルタイム・プロトコル)タイプ・パケットにカプセル化され、別のビデオ・ポート上に送信される。時間CTSタイプ・ラベルは、対応するピクチャと、関心領域に関するSEIメッセージとを関係付けることが可能である。効果的には、この送信モードは、ビデオでなく、SEIメッセージを含むRTPパケットのみを暗号化することを可能にする。
復号は、端末受信器のレベルで行われる。
MPEG−2 TSカプセル化の場合、使用される暗号化標準はDVB−CSAであり、関心領域に関するSEIメッセージは、ビデオのものとは別のPIDにカプセル化される。関心領域に関するSEIメッセージは、PESパケット・ヘッダのPTS(タイムスタンプ)を介して、対応するピクチャに関係付けられる。この送信モードは、ビデオPIDではなく、関心領域に関するSEIメッセージを含むPIDのみの暗号化を可能にする。
別の実施例では、ビデオ・ストリームは、ピクチャの別々の部分を無関係に符号化し、よって、無関係に復号化することを可能にするFMO(柔軟なマクロブロック配列)を使用してH.264/AVC符号化標準によって符号化される。FMOモードは「スライス群」を使用する。「スライス群」は標準に規定されている。この実施例では、関心領域は、ピクチャの残りとは別の群において符号化される。PPSタイプのNALは、「スライス群」のマップを含む。関心領域が符号化された「スライス群」を示す、後述のものなどのSEIメッセージが挿入される。
以下の表は、この実施例によって使用されるSEIメッセージの形式を示す。
Figure 0005346338
uuid_iso_iec_11578:復号化器にメッセージ・タイプを示すための128ビットの単一のワード。
user_data_payload_byte:SEIメッセージの一部を含む8ビット
通常、この場合、
payloadSize=17(バイト)。よって、UUIDは16であり、固有データは1である。
user_data_payload_byte:
Figure 0005346338
Slice_group(i)_id: slice_group_idが「1」の場合、slice_groupは関心領域を表し、slice_group_idが「0」の場合、slice_groupはピクチャの残りを表す。
関心領域を表すslice_group毎に、意味情報、相対重み、及び関係するマクロブロックを規定することが可能である。
よって、関心領域に対応するマクロブロックのみを、無関係に識別され、符号化されるにつれ、受信中に復号化することが可能である。

Claims (14)

  1. パーソナル・レコーダ装置が符号化ビデオ・データ・ストリームを索引化する方法であって、前記ビデオ・データ・ストリームは、各ピクチャの関心領域の位置に関する情報を含み、前記方法は、
    前記パーソナル・レコーダ装置が復号化器用の符号化ビデオ・データ・ストリームを受信する工程と、
    記録サポートが前記記録サポート上に前記符号化ビデオ・データ・ストリームを記録する工程と、
    復号化器が関心領域の位置情報復号化する工程と、
    ビデオ索引化モジュールがピクチャ毎に関心領域選択する工程と、
    前記復号化器が符号化ビデオ・データ・ストリーム復号化する工程と、
    前記ビデオ索引化モジュールがピクチャ毎に前記選択された関心領域から前記ビデオ・データ・ストリームの所定数の関心領域選択する工程と、
    前記記録サポートが前記記録サポート上に前記ビデオ・データ・ストリームの前記選択された関心領域を記録する工程と
    を含む、索引化する方法。
  2. 請求項1記載の索引化する方法であって、前記記録サポートが前記ビデオ・データ・ストリームの前記選択された関心領域記録する工程中に、
    前記ビデオ・データ・ストリームが復号化され、前記ビデオ・データ・ストリームの前記関心領域が選択されるにつれ、前記ビデオ・データ・ストリームの前記選択された関心領域が一時メモリに記録され、
    前記ビデオ・データ・ストリームの前記選択された関心領域が前記一時メモリに記録されると、前記ビデオ・データ・ストリームの前記選択された関心領域が記録サポートに転送される、索引化する方法。
  3. 請求項1又は2の何れか一項に記載の索引化する方法であって、前記方法は、
    前記ビデオ索引化モジュールが前記ビデオ・データ・ストリームの所定数の関心領域を選択する工程と、前記記録サポートが前記ビデオ・データ・ストリームの前記選択された関心領域を記録する工程との間に、前記ビデオ・データ・ストリームの前記選択された関心領域の一様なサイズを得るために前記ビデオ・データ・ストリームの前記選択された関心領域を前記パーソナル・レコーダ装置がズーミングする工程を含む、索引化する方法。
  4. 請求項1乃至3の何れか一項に記載の索引化する方法であって、暗号化鍵により、前記関心領域の位置情報を前記パーソナル・レコーダ装置が暗号化する工程を含む、索引化する方法。
  5. 請求項4記載の索引化する方法であって、ユーザによる支払いにより、復号鍵を前記パーソナル・レコーダ装置が得る工程を含む、索引化する方法。
  6. 請求項1乃至5のうちの何れか一項に記載の索引化する方法であって、前記ビデオ・データ・ストリームはH.264/AVC符号化標準に応じて符号化され、前記位置情報は付加拡張情報(SEI)タイプ・メッセージに含まれる、索引化する方法。
  7. 請求項5又は6に記載の索引化する方法であって、付加拡張情報(SEI)タイプ・メッセージはリアルタイム・プロトコル・パケット(RTP)にカプセル化され、前記RTPパケットは暗号化される、索引化する方法。
  8. 請求項5乃至6の何れか一項に記載の索引化する方法であって、関心領域位置情報に関する付加拡張情報(SEI)タイプ・メッセージは、前記付加拡張情報タイプ・メッセージが参照するピクチャそれぞれの前又は後の符号化ビデオ・データ・ストリームに挿入される、索引化する方法。
  9. 請求項1乃至8のうちの何れか一項に記載の索引化する方法であって、前記位置情報は、
    各ピクチャにおける関心領域の数、
    ピクチャ幅及びピクチャ高さに応じた、関心領域それぞれの座標、
    関心領域それぞれの前記幅及び前記高さ、
    前記ピクチャの他の領域に対する前記関心領域の相対的重み、
    関心領域それぞれの内容に関する情報、及び
    情報の何れかの組合せ
    から選ばれる情報を含む、索引化する方法。
  10. 請求項1乃至9のうちの何れか一項に記載の索引化する方法であって、前記ビデオ索引化モジュールが前記ピクチャ毎関心領域選択する工程は、前記ビデオ索引化モジュールが前記関心領域の前記相対的重みに応じて関心領域を選択する、索引化する方法。
  11. 請求項6乃至10のうちの何れか一項に記載の索引化する方法であって、
    ビデオ符号化標準は、柔軟なマクロブロック配列を使用し、前記関心領域は、他のピクチャ・データと無関係にスライス群に符号化され、前記関心領域の位置情報は、前記関心領域が符号化されたスライス群番号を含む、索引化する方法。
  12. 請求項11記載の索引化する方法であって、付加拡張情報(SEI)タイプ・メッセージは、一関心領域に関係している場合、スライス群それぞれについて示す識別子を含む、索引化する方法。
  13. 請求項12記載の索引化する方法であって、前記パーソナル・レコーダ装置が前記付加拡張情報(SEI)タイプ・メッセージを読み出す更なる工程を含み、前記復号化器が前記符号化ビデオ・データ・ストリームを復号化する工程は、スライス群が一関心領域に関係する旨を識別子が示すスライス群のみを前記復号化器が復号化する、索引化する方法。
  14. 符号化ビデオ・データ・ストリームを索引化する装置であって、前記ビデオ・データ・ストリームは、各ピクチャの関心領域の位置に関する情報を含み、前記装置は、
    符号化ビデオ・データ・ストリームを受信する手段と、
    記録サポート上に前記符号化ビデオ・データ・ストリームを記録する手段と、
    前記関心領域の位置情報を復号化する手段と、
    ビデオ・データ・ストリームを復号化する手段と、
    ピクチャ毎に関心領域を選択する手段と、
    ピクチャ毎に選択された関心領域から前記ビデオ・データ・ストリームの所定数の関心領域を選択する手段と、
    前記ビデオ・データ・ストリームの前記選択された関心領域を記録する手段と
    を備える、索引化する装置。
JP2010513897A 2007-06-29 2008-06-25 ビデオを索引化する方法及びビデオを索引化する装置 Expired - Fee Related JP5346338B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
FR0756181 2007-06-29
FR0756181 2007-06-29
PCT/EP2008/058050 WO2009003885A2 (en) 2007-06-29 2008-06-25 Video indexing method, and video indexing device

Publications (2)

Publication Number Publication Date
JP2010532121A JP2010532121A (ja) 2010-09-30
JP5346338B2 true JP5346338B2 (ja) 2013-11-20

Family

ID=39204994

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2010513897A Expired - Fee Related JP5346338B2 (ja) 2007-06-29 2008-06-25 ビデオを索引化する方法及びビデオを索引化する装置

Country Status (5)

Country Link
EP (1) EP2174500A2 (ja)
JP (1) JP5346338B2 (ja)
KR (1) KR101488548B1 (ja)
CN (1) CN101690228B (ja)
WO (1) WO2009003885A2 (ja)

Families Citing this family (25)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5305451B2 (ja) * 2009-06-03 2013-10-02 独立行政法人情報通信研究機構 ホログラム符号化装置およびホログラム復号化装置、ならびに、ホログラム符号化プログラムおよびホログラム復号化プログラム
JP2011009949A (ja) 2009-06-24 2011-01-13 Toshiba Corp 映像処理装置及び映像処理方法
CN103096049A (zh) 2011-11-02 2013-05-08 华为技术有限公司 一种视频处理方法及***、相关设备
WO2013077236A1 (en) 2011-11-21 2013-05-30 Canon Kabushiki Kaisha Image coding apparatus, image coding method, image decoding apparatus, image decoding method, and storage medium
CN103246658B (zh) * 2012-02-03 2017-02-08 展讯通信(上海)有限公司 建立索引表方法和编码方法
PL2842313T3 (pl) 2012-04-13 2017-06-30 Ge Video Compression, Llc Skalowalny strumień danych i obiekt sieciowy
EP2868103B1 (en) * 2012-06-29 2016-12-07 GE Video Compression, LLC Video data stream concept
US9247225B2 (en) * 2012-09-25 2016-01-26 Intel Corporation Video indexing with viewer reaction estimation and visual cue detection
CN105075271A (zh) * 2013-04-08 2015-11-18 索尼公司 利用shvc的关注区域可伸缩性
WO2015014773A1 (en) * 2013-07-29 2015-02-05 Koninklijke Kpn N.V. Providing tile video streams to a client
US9532086B2 (en) 2013-11-20 2016-12-27 At&T Intellectual Property I, L.P. System and method for product placement amplification
US20150237351A1 (en) * 2014-02-18 2015-08-20 Penne Lee Techniques for inclusion of region of interest indications in compressed video data
WO2015197815A1 (en) 2014-06-27 2015-12-30 Koninklijke Kpn N.V. Determining a region of interest on the basis of a hevc-tiled video stream
WO2015197818A1 (en) 2014-06-27 2015-12-30 Koninklijke Kpn N.V. Hevc-tiled video streaming
US10715843B2 (en) 2015-08-20 2020-07-14 Koninklijke Kpn N.V. Forming one or more tile streams on the basis of one or more video streams
EP3360330B1 (en) 2015-10-08 2021-03-24 Koninklijke KPN N.V. Enhancing a region of interest in video frames of a video stream
US10582201B2 (en) * 2016-05-19 2020-03-03 Qualcomm Incorporated Most-interested region in an image
JP7040448B2 (ja) * 2016-08-30 2022-03-23 ソニーグループ株式会社 送信装置、送信方法、受信装置および受信方法
US10887572B2 (en) 2016-11-17 2021-01-05 Intel Corporation Suggested viewport indication for panoramic video
CN108810600B (zh) * 2017-04-28 2020-12-22 华为技术有限公司 一种视频场景的切换方法、客户端及服务器
US10771163B2 (en) * 2017-10-24 2020-09-08 Mediatek Inc. Apparatus and method for decoding ROI regions in image
US11523185B2 (en) 2019-06-19 2022-12-06 Koninklijke Kpn N.V. Rendering video stream in sub-area of visible display area
CN111510752B (zh) * 2020-06-18 2021-04-23 平安国际智慧城市科技股份有限公司 数据传输方法、装置、服务器及存储介质
CN113747151B (zh) * 2021-07-30 2024-04-12 咪咕文化科技有限公司 视频编解码方法、装置、设备及计算机可读存储介质
CN116074585B (zh) * 2023-03-03 2023-06-23 乔品科技(深圳)有限公司 基于ai和注意力机制的超高清视频编解码方法和装置

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07148155A (ja) * 1993-11-26 1995-06-13 Toshiba Corp コンピュータ断層撮影装置
US20020044696A1 (en) * 1999-11-24 2002-04-18 Sirohey Saad A. Region of interest high resolution reconstruction for display purposes and a novel bookmarking capability
US6549674B1 (en) * 2000-10-12 2003-04-15 Picsurf, Inc. Image compression based on tiled wavelet-like transform using edge and non-edge filters
US6909745B1 (en) * 2001-06-05 2005-06-21 At&T Corp. Content adaptive video encoder
FR2833132B1 (fr) * 2001-11-30 2004-02-13 Eastman Kodak Co Procede pour selectionner et enregistrer un sujet d'interet dans une image numerique fixe
JP3966461B2 (ja) * 2002-08-09 2007-08-29 株式会社リコー 電子カメラ装置
JP2005110145A (ja) * 2003-10-02 2005-04-21 Ricoh Co Ltd 符号列変換装置、符号列変換方法、撮影システム、画像表示システム、監視システム、プログラム、及び、情報記録媒体
US20060045381A1 (en) * 2004-08-31 2006-03-02 Sanyo Electric Co., Ltd. Image processing apparatus, shooting apparatus and image display apparatus
US7598977B2 (en) * 2005-04-28 2009-10-06 Mitsubishi Electric Research Laboratories, Inc. Spatio-temporal graphical user interface for querying videos
EP1748385A3 (en) * 2005-07-28 2009-12-09 THOMSON Licensing Method and device for generating a sequence of images of reduced size
US8024768B2 (en) * 2005-09-15 2011-09-20 Penthera Partners, Inc. Broadcasting video content to devices having different video presentation capabilities
KR101255226B1 (ko) * 2005-09-26 2013-04-16 한국과학기술원 스케일러블 비디오 코딩에서 다중 roi 설정, 복원을위한 장치 및 방법

Also Published As

Publication number Publication date
WO2009003885A2 (en) 2009-01-08
JP2010532121A (ja) 2010-09-30
WO2009003885A3 (en) 2009-03-26
KR101488548B1 (ko) 2015-02-02
CN101690228A (zh) 2010-03-31
CN101690228B (zh) 2012-08-08
EP2174500A2 (en) 2010-04-14
KR20100042632A (ko) 2010-04-26

Similar Documents

Publication Publication Date Title
JP5346338B2 (ja) ビデオを索引化する方法及びビデオを索引化する装置
US10911786B2 (en) Image processing device and method
US9918108B2 (en) Image processing device and method
US20180176468A1 (en) Preferred rendering of signalled regions-of-interest or viewports in virtual reality video
US11297354B2 (en) Encoding apparatus, decoding apparatus and transmission control method
EP1878260B1 (en) Method for scalably encoding and decoding video signal
EP2384002B1 (en) Moving picture decoding method using additional quantization matrices
US8509434B2 (en) Method and apparatus for protecting scalable video coding contents
WO2013129618A1 (ja) 画像処理装置および方法
CA3022221A1 (en) Apparatus and method for image processing for suppressing a reduction of coding efficiency
US20060062299A1 (en) Method and device for encoding/decoding video signals using temporal and spatial correlations between macroblocks
WO2015194394A1 (ja) 画像符号化装置および方法、並びに画像復号装置および方法
KR100630983B1 (ko) 화상 처리 방법과, 이 방법을 이용가능한 화상 부호화장치 및 화상 복호 장치
EP1879388A1 (en) Video information recording device, video information recording method, video information recording program, and recording medium containing the video information recording program
JPWO2013031315A1 (ja) 画像処理装置及び画像処理方法
JP7345051B2 (ja) サブピクチャ、スライス、およびタイルをサポートするビデオ符号化
WO2016157924A1 (ja) 画像処理装置、画像処理方法、プログラム及び記録媒体
JP2006311079A (ja) 画像ビットストリーム変換装置
WO2022050166A1 (ja) 再生装置、送信装置、再生方法、及び、送信方法
JP5387520B2 (ja) 情報処理装置と情報処理方法
JP2017216749A (ja) 画像処理装置及び画像処理方法
RU2809689C2 (ru) Устройство и способ кодирования изображения для управления контурной фильтрацией
JP2006109060A (ja) 画像符号化情報を利用した手ぶれ補正方法及び装置
RU2628198C1 (ru) Способ межканального предсказания и межканальной реконструкции для многоканального видео, снятого устройствами с различными углами зрения
JP2021197733A (ja) 符号化装置、復号装置、符号化方法、および復号方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20110601

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120807

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20121106

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20121113

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20130205

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20130409

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20130702

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20130730

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20130816

R150 Certificate of patent or registration of utility model

Ref document number: 5346338

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees