JP2009049667A - 情報処理装置、その処理方法およびプログラム - Google Patents

情報処理装置、その処理方法およびプログラム Download PDF

Info

Publication number
JP2009049667A
JP2009049667A JP2007213220A JP2007213220A JP2009049667A JP 2009049667 A JP2009049667 A JP 2009049667A JP 2007213220 A JP2007213220 A JP 2007213220A JP 2007213220 A JP2007213220 A JP 2007213220A JP 2009049667 A JP2009049667 A JP 2009049667A
Authority
JP
Japan
Prior art keywords
representative frame
representative
feature amount
candidate
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2007213220A
Other languages
English (en)
Inventor
Shinjiro Kakita
新次郎 柿田
Keita Shirane
慶太 白根
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Priority to JP2007213220A priority Critical patent/JP2009049667A/ja
Publication of JP2009049667A publication Critical patent/JP2009049667A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Television Signal Processing For Recording (AREA)

Abstract

【課題】動画を構成する各フレームから適切な代表フレームを判別する。
【解決手段】カラーヒストグラム抽出部210は、動画を構成するフレーム毎のカラーヒストグラムを抽出する。代表フレーム候補判別部230は、参照ヒストグラム保持部240に保持されている参照ヒストグラムと、抽出されたカラーヒストグラムとの差分値を算出し、この算出された差分値と、候補選択閾値保持部220に保持されている閾値とを比較することにより代表フレーム候補を判別する。代表フレーム判別部260は、代表ヒストグラム保持部270に保持されている各代表ヒストグラムと、判別された代表フレーム候補に対応するヒストグラムとの差分値を算出し、算出された差分値が決定閾値保持部250に保持されている閾値以下である代表フレーム候補を代表フレームとして選択しない。
【選択図】図2

Description

本発明は、情報処理装置に関し、特に、動画を検索することが可能な情報処理装置およびその処理方法ならびに当該方法をコンピュータに実行させるプログラムに関する。
従来、動画を構成するフレームの中から特徴のあるフレームである代表フレームを抽出し、この代表フレームに関する特徴量を記憶する情報処理装置が存在する。そして、動画を再生する場合には、このように記憶された代表フレームに関する特徴量を用いて、ユーザの好みに応じた再生をすることができる。また、上述した代表フレームに関する特徴量を用いて、この代表フレームに対応する動画と類似する動画を検索することが可能な情報処理装置が存在する。
上述した代表フレームを抽出する方法として、例えば、時間的に一定の周期でフレームをサンプリングする方法が存在する。この方法により代表フレームを抽出する場合には、各フレームの特徴量とは無関係にサンプリングが行われるため、互いに類似するフレームが代表フレームとしてサンプリングされる場合がある。この場合には、記憶すべき代表フレームに関する特徴量のサイズが大きくなるという問題がある。また、サンプリング周期が粗い場合には、特徴的な代表フレームを抽出することができない場合も考えられる。
そこで、例えば、ビデオ信号のフレーム間の相関に基づいてシーン変化を検出し、シーン変化が検出された場合には、ビデオ信号の1フレーム分を静止画データとして記録する画像記録装置が提案されている(例えば、特許文献1参照。)。
特開平06−217254号公報(図1)
上述の従来技術では、動画においてシーン変化が検出された場合には、ビデオ信号の1フレーム分を静止画データとして記録するため、互いに類似する1フレーム分のデータが記録されることを低減させることができる。
しかしながら、近年では、多数の動画を記録することが可能な画像記録装置が存在する。また、インターネット等のネットワーク技術の向上等によって、インターネットに接続されている複数のパソコン(パーソナルコンピュータ)間で動画を共有して閲覧することが可能な動画共有システムが普及している。このため、ユーザが取り扱うことが可能な動画の数は非常に多く、再生や検索等を迅速に処理することが求められている。これらの動画について、代表フレームに関する特徴量を用いて再生や類似検索を迅速に行うためには、記憶しておくべき代表フレームに関する特徴量の情報量をさらに削減して、再生や検索等に係る処理量を削減することが重要である。
そこで、本発明は、動画を構成する各フレームから適切な代表フレームを判別することを目的とする。
本発明は、上記課題を解決するためになされたものであり、その第1の側面は、動画を構成するフレーム毎の特徴量を抽出する特徴量抽出手段と、上記特徴量抽出手段により抽出された特徴量に基づいて、上記動画を構成するフレームの中から代表フレーム候補を判別する代表フレーム候補判別手段と、上記代表フレーム候補について抽出された特徴量である代表フレーム候補特徴量のそれぞれの差分を利用して、上記代表フレーム候補の中から代表フレームを判別する代表フレーム判別手段とを具備する情報処理装置およびその処理方法ならびに当該方法をコンピュータに実行させるプログラムである。これにより、動画を構成するフレーム毎の特徴量を抽出し、この抽出された特徴量に基づいて、動画を構成するフレームの中から代表フレーム候補を判別し、この代表フレーム候補について抽出された特徴量である代表フレーム候補特徴量のそれぞれの差分を利用して、代表フレーム候補の中から代表フレームを判別するという作用をもたらす。
また、この第1の側面において、上記代表フレーム判別手段は、上記代表フレーム候補特徴量のそれぞれの差分を算出し、当該算出された差分が所定の範囲内に存在するか否かに基づいて上記代表フレームを判別することができる。これにより、代表フレーム候補特徴量のそれぞれの差分を算出して、この算出された差分が所定の範囲内に存在するか否かに基づいて、代表フレーム候補の中から代表フレームを判別するという作用をもたらす。
また、この第1の側面において、上記代表フレーム候補のうちで最後に判別された代表フレーム候補について抽出された特徴量を参照特徴量として保持する参照特徴量保持手段をさらに具備し、上記代表フレーム候補判別手段は、上記参照特徴量と上記抽出された特徴量とを比較して当該比較結果に基づいて上記代表フレーム候補を判別することができる。これにより、代表フレーム候補のうちで最後に判別された代表フレーム候補について抽出された特徴量を参照特徴量として保持し、この参照特徴量と判別対象の特徴量とを比較して、この比較結果に基づいて代表フレーム候補を判別するという作用をもたらす。
また、この第1の側面において、上記代表フレーム候補を判別するための閾値を保持する候補選択閾値保持手段をさらに具備し、上記代表フレーム候補判別手段は、上記参照特徴量と上記抽出された特徴量との差分値を算出し、当該算出された差分値と上記候補選択閾値保持手段に保持されている閾値とを比較することにより上記代表フレーム候補を判別することができる。これにより、参照特徴量と判別対象の特徴量との差分値を算出し、この算出された差分値と候補選択閾値保持手段に保持されている閾値とを比較することによって、代表フレーム候補を判別するという作用をもたらす。
また、この第1の側面において、上記代表フレーム候補を判別するための閾値を保持する候補選択閾値保持手段をさらに具備し、上記代表フレーム候補判別手段は、上記参照特徴量と上記抽出された特徴量とのユークリッド距離を算出し、当該算出されたユークリッド距離の値と上記候補選択閾値保持手段に保持されている閾値とを比較することにより上記代表フレーム候補を判別することができる。これにより、参照特徴量と判別対象の特徴量とのユークリッド距離を算出し、この算出されたユークリッド距離の値と候補選択閾値保持手段に保持されている閾値とを比較することによって、代表フレーム候補を判別するという作用をもたらす。
また、この第1の側面において、上記代表フレームについて抽出された特徴量を代表特徴量として保持する代表特徴量保持手段をさらに具備し、上記代表フレーム判別手段は、上記代表特徴量保持手段に保持されている各代表特徴量と上記代表フレーム候補特徴量との差分を算出し、当該算出された差分が所定の範囲内に存在するか否かに基づいて上記代表フレームを判別することができる。これにより、代表フレームについて抽出された特徴量を代表特徴量として保持し、各代表特徴量と代表フレーム候補特徴量との差分を算出して、この算出された差分が所定の範囲内に存在するか否かに基づいて代表フレームを判別するという作用をもたらす。
また、この第1の側面において、上記代表フレームを判別するための閾値を保持する決定閾値保持手段をさらに具備し、上記代表フレーム判別手段は、上記代表特徴量保持手段に保持されている各代表特徴量と上記代表フレーム候補特徴量との差分値を算出し、当該算出された差分値と上記決定閾値保持手段に保持されている閾値とを比較することにより上記算出された差分値のうちの少なくとも1つが上記決定閾値保持手段に保持されている閾値以下である代表フレーム候補を上記代表フレームとして選択しないことができる。これにより、各代表特徴量と代表フレーム候補特徴量との差分値を算出し、この算出された差分値と決定閾値保持手段に保持されている閾値とを比較することによって、算出された差分値のうちの少なくとも1つが、その閾値以下である代表フレーム候補を代表フレームとして選択しないという作用をもたらす。
また、この第1の側面において、上記代表フレームを判別するための閾値を保持する決定閾値保持手段をさらに具備し、上記代表フレーム判別手段は、上記代表特徴量保持手段に保持されている各代表特徴量と上記代表フレーム候補特徴量とのユークリッド距離を算出し、当該算出されたユークリッド距離の値と上記決定閾値保持手段に保持されている閾値とを比較することにより上記算出されたユークリッド距離の値のうちの少なくとも1つが上記決定閾値保持手段に保持されている閾値以下である代表フレーム候補を上記代表フレームとして選択しないことができる。これにより、各代表特徴量と代表フレーム候補特徴量とのユークリッド距離を算出し、この算出されたユークリッド距離の値と、決定閾値保持手段に保持されている閾値とを比較することによって、算出されたユークリッド距離の値のうちの少なくとも1つが、その閾値以下である代表フレーム候補を代表フレームとして選択しないという作用をもたらす。
また、この第1の側面において、上記動画を構成するフレームに対応する画面において一定の変化が検出された時間軸における位置を示すチェンジ点を検出するチェンジ点検出手段と、上記検出されたチェンジ点間の間隔を示すチェンジ点間隔を算出するチェンジ点間隔算出手段とをさらに具備し、上記代表フレーム候補判別手段は、上記算出されたチェンジ点間隔毎に上記代表フレーム候補を判別し、上記代表フレーム判別手段は、上記チェンジ点間隔毎に判別された代表フレーム候補の中から代表フレームを判別することができる。これにより、チェンジ点を検出するとともにチェンジ点間隔を算出し、この算出されたチェンジ点間隔毎に代表フレーム候補を判別し、チェンジ点間隔毎に判別された代表フレーム候補の中から代表フレームを判別するという作用をもたらす。
本発明によれば、動画を構成する各フレームから適切な代表フレームを判別することができるという優れた効果を奏し得る。
次に本発明の実施の形態について図面を参照して詳細に説明する。
図1は、本発明の実施の形態における情報処理装置100の機能構成例を示すブロック図である。この情報処理装置100は、動画入力部110と、ビデオ・オーディオデマルチプレクサ120と、ビデオデコード部130と、データベース140と、特徴量照合部150と、判定結果出力部160と、特徴量抽出部200とを備える。なお、この情報処理装置100は、例えば、デジタルビデオカメラ等の撮像装置で撮影された動画について、映像解析により特徴量を抽出し、この抽出された特徴量を用いて各種画像処理を施すことが可能なパーソナルコンピュータによって実現することができる。
動画入力部110は、動画を入力する動画入力部であり、入力された動画をビデオ・オーディオデマルチプレクサ120に出力する。動画入力部110に入力される動画としては、例えば、撮像装置で撮影された動画やテレビジョン放送で受信された動画等が考えられる。
ビデオ・オーディオデマルチプレクサ120は、動画入力部110から出力された動画について、ビデオデータ(信号)とオーディオデータ(信号)とに分離するものであり、分離されたビデオデータをビデオデコード部130に出力する。なお、分離されたオーディオデータは、本発明の実施の形態においては特に利用されない。
ビデオデコード部130は、ビデオ・オーディオデマルチプレクサ120から出力されたビデオデータをデコードしてベースバンドデータを生成するものであり、生成されたベースバンドデータを特徴量抽出部200に出力する。
特徴量抽出部200は、ビデオデコード部130から出力されたベースバンドデータに基づいて特徴量を抽出するものであり、抽出された特徴量をデータベース140および特徴量照合部150に出力する。具体的には、特徴量抽出部200は、動画を構成する各フレームから少なくとも1つの代表フレームを判別して、この代表フレームに対応するカラーヒストグラムである代表ヒストグラムを特徴量としてデータベース140および特徴量照合部150に出力する。なお、特徴量抽出部200については、図2を参照して詳細に説明する。
データベース140は、特徴量抽出部200から出力された代表ヒストグラムを動画毎に格納するデータベースであり、格納されている代表ヒストグラムを動画毎に特徴量照合部150に出力する。
特徴量照合部150は、特徴量抽出部200から出力された代表ヒストグラムと、データベース140に格納されている代表ヒストグラムとを比較し、この比較結果に基づいて、動画入力部110に入力された動画と、データベース140に格納されている代表ヒストグラムに対応する動画とを照合して、両者が一致または類似するか否かを判定するものであり、この判定結果を示す類似リストを判定結果出力部160に出力する。すなわち、特徴量照合部150は、動画入力部110に入力された動画と一致または類似する動画に対応する代表ヒストグラムを、データベース140に格納されている代表ヒストグラムの中から検索して、一致または類似の判定を行う。
判定結果出力部160は、特徴量照合部150から出力された類似リストを出力するものである。例えば、特徴量照合部150から出力された類似リストを表示して出力することができる。
図2は、特徴量抽出部200の機能構成例を示すブロック図である。特徴量抽出部200は、カラーヒストグラム抽出部210と、候補選択閾値保持部220と、代表フレーム候補判別部230と、参照ヒストグラム保持部240と、決定閾値保持部250と、代表フレーム判別部260と、代表ヒストグラム保持部270とを備える。
図3(a)および(b)は、ビデオデコード部130から出力されたベースバンドデータからフレーム毎に抽出される輝度信号Y、色差信号(青)Cbおよび色差信号[0](赤)Crのカラーヒストグラムの一例を示す図である。図3(a)および(b)に示すグラフおいて、横軸は階調を示し、縦軸は頻度を示す。図3(c)は、図3(a)および(b)に示すカラーヒストグラムの面積の差分を示す図である。図3(c)において、斜線で示す領域が、図3(a)および(b)に示すカラーヒストグラムの面積の差分値に相当する領域である。なお、図3については、図2を参照して詳細に説明する。
図4は、動画を構成する各フレームを時系列に並べられた場合を概念的に示す図である。この例では、撮像装置により撮影された動画300を構成するフレーム301乃至315を概略的に示す。なお、図4については、図2を参照して詳細に説明する。
カラーヒストグラム抽出部210は、ビデオデコード部130から出力されたベースバンドデータをバッファに保持して、このバッファに保持されたベースバンドデータから画面全体のY、CbおよびCrのカラーヒストグラムをサンプリングし、このサンプリングされたカラーヒストグラムについて、階調をN段階(例えば、N=16)に分け、各階調における頻度の和が一定になるように正規化を行うものである。そして、正規化が施されたY、CbおよびCrのヒストグラムを代表フレーム候補判別部230にフレーム毎に出力するものである。例えば、動画を構成する1つのフレームについて抽出されたY、CbおよびCrのヒストグラムを図3(a)に示し、図3(a)に示すヒストグラムに対応するフレームとは異なるフレームについて抽出されたY、CbおよびCrのヒストグラムを図3(b)に示す。このように、動画入力部110に入力された動画を構成する各フレームについて、Y、CbおよびCrのヒストグラムが抽出される。
候補選択閾値保持部220は、代表フレーム候補判別部230が代表フレーム候補を判別する場合に用いられる閾値を保持するものであり、保持されている閾値を代表フレーム候補判別部230に出力する。
代表フレーム候補判別部230は、カラーヒストグラム抽出部210から出力されたカラーヒストグラムと、参照ヒストグラム保持部240に保持されている参照ヒストグラムとの面積の差分値を算出するものである。そして、代表フレーム候補判別部230は、この算出されたヒストグラム差分値が、候補選択閾値保持部220に保持されている閾値以上であるか否かに基づいて、カラーヒストグラム抽出部210から出力されたカラーヒストグラムに対応するフレームが代表フレーム候補であるか否かを判別する。すなわち、代表フレーム候補判別部230は、算出されたヒストグラム差分値が、候補選択閾値保持部220に保持されている閾値以上である場合には、カラーヒストグラム抽出部210から出力されたカラーヒストグラムに対応するフレームが代表フレーム候補であると判別して、そのカラーヒストグラムを参照ヒストグラム保持部240および代表フレーム判別部260に出力する。一方、代表フレーム候補判別部230は、算出されたヒストグラム差分値が、候補選択閾値保持部220に保持されている閾値未満である場合には、カラーヒストグラム抽出部210から出力されたカラーヒストグラムに対応するフレームが代表フレーム候補ではないと判別する。このように代表フレーム候補ではないと判別された場合には、参照ヒストグラム保持部240および代表フレーム判別部260にはカラーヒストグラムが出力されない。なお、代表フレーム候補判別部230は、カラーヒストグラム抽出部210から出力されたカラーヒストグラムに対応するフレームが、動画の先頭のフレームである場合には、参照ヒストグラム保持部240に保持されている参照ヒストグラムが存在しないため、この先頭のフレームが代表フレーム候補であると判別して、そのカラーヒストグラムを参照ヒストグラム保持部240および代表フレーム判別部260に出力する。
ここで、図4に示すフレーム301乃至315が代表フレーム候補判別部230に入力された場合について説明する。なお、図4に示すフレーム301乃至315において、例えば、フレーム301は先頭のフレームであり、フレーム315は後端のフレームであるものとする。この場合においては、フレーム301は先頭のフレームであるため、代表フレーム候補判別部230は、フレーム301が代表フレーム候補であると判別して、フレーム301に対応するカラーヒストグラムを参照ヒストグラム保持部240および代表フレーム判別部260に出力する。続いて、フレーム302が入力されると、代表フレーム候補判別部230は、参照ヒストグラム保持部240に保持されているフレーム301に対応するカラーヒストグラムと、フレーム302に対応するカラーヒストグラムとのヒストグラム差分値を算出し、算出されたヒストグラム差分値が、候補選択閾値保持部220に保持されている閾値以上であるか否かにより、フレーム302が代表フレーム候補であるか否かを判別する。また、同様に、フレーム301に対応するカラーヒストグラムと、フレーム303乃至307に対応するカラーヒストグラムとのヒストグラム差分値が順次算出され、フレーム303乃至307が代表フレーム候補であるか否かが順次判別される。
例えば、図4に示すフレーム301乃至315については、フレーム301および307、フレーム307および310、フレーム310および315に対応するカラーヒストグラムのそれぞれのヒストグラム差分値が、候補選択閾値保持部220に保持されている閾値以上であるものとし、これら以外のヒストグラム差分値は候補選択閾値保持部220に保持されている閾値未満であるものとする。この場合には、フレーム301、307、310、315が代表フレーム候補であると順次判別される。そして、フレーム301、307、310、315に対応するカラーヒストグラムが参照ヒストグラム保持部240および代表フレーム判別部260に順次出力される。
参照ヒストグラム保持部240は、代表フレーム候補判別部230から出力されたカラーヒストグラムを参照ヒストグラムとして保持するとともに、保持されている参照ヒストグラムを代表フレーム候補判別部230に出力するものである。なお、参照ヒストグラム保持部240は、代表フレーム候補判別部230からカラーヒストグラムが出力される毎に、保持されている参照ヒストグラムを削除する。すなわち、代表フレーム候補判別部230から最後に出力されたカラーヒストグラムのみが参照ヒストグラムとして保持される。
決定閾値保持部250は、代表フレーム判別部260が代表フレームを決定する場合に用いられる閾値を保持するものであり、保持されている閾値を代表フレーム判別部260に出力する。なお、候補選択閾値保持部220または決定閾値保持部250に保持される閾値は、同一の値を用いるようにしてもよく、異なる値を用いるようにしてもよい。
代表フレーム判別部260は、代表フレーム候補判別部230から出力されたカラーヒストグラムと、代表ヒストグラム保持部270に保持されている各カラーヒストグラムとの面積の差分値をそれぞれ算出するものである。そして、代表フレーム判別部260は、この算出された各ヒストグラム差分値が、決定閾値保持部250に保持されている閾値以下であるか否かに基づいて、代表フレーム候補判別部230から出力されたカラーヒストグラムに対応するフレームが代表フレームであるか否かを判別する。すなわち、代表フレーム判別部260は、算出されたヒストグラム差分値の全てが、決定閾値保持部250に保持されている閾値以上である場合には、代表フレーム候補判別部230から出力されたカラーヒストグラムに対応するフレームが代表フレームであると判別して、そのカラーヒストグラムを代表ヒストグラム保持部270、データベース140および特徴量照合部150に出力する。一方、代表フレーム判別部260は、算出されたヒストグラム差分値のうちの少なくとも1つが、決定閾値保持部250に保持されている閾値以下である場合には、代表フレーム候補判別部230から出力されたカラーヒストグラムに対応するフレームが代表フレームではなく類似フレームであると判別する。このように代表フレームではないと判別された場合には、代表ヒストグラム保持部270、データベース140および特徴量照合部150にはカラーヒストグラムが出力されない。なお、代表フレーム判別部260は、算出されたヒストグラム差分値のうちの少なくとも1つが、決定閾値保持部250に保持されている閾値以上である場合には、代表フレーム候補判別部230から出力されたカラーヒストグラムに対応するフレームが代表フレームであると判別するようにしてもよい。この場合において、代表フレーム判別部260は、算出されたヒストグラム差分値の全てが、決定閾値保持部250に保持されている閾値以下である場合には、代表フレーム候補判別部230から出力されたカラーヒストグラムに対応するフレームが代表フレームではなく類似フレームであると判別する。
例えば、図4に示すフレーム301、307、310、315が代表フレーム判別部260に順次入力される。例えば、フレーム310が代表フレーム判別部260に入力された場合には、代表ヒストグラム保持部270に既に保持されているフレーム301、307に対応する各カラーヒストグラムと、フレーム310に対応するカラーヒストグラムとのヒストグラム差分値が順次算出され、算出されたヒストグラム差分値の少なくとも1つが、決定閾値保持部250に保持されている閾値以下であるか否かにより、フレーム310が代表フレームであるか否かが判別される。
代表ヒストグラム保持部270は、代表フレーム判別部260から出力された各カラーヒストグラムの全てを代表ヒストグラムとして保持するとともに、保持されている各代表ヒストグラムを代表フレーム判別部260に出力するものである。なお、代表ヒストグラム保持部270は、代表ヒストグラムとして保持する各カラーヒストグラムを、1つの動画の判別が終了した後に削除する。
次に、本発明の実施の形態における情報処理装置100の動作について図面を参照して説明する。
図5は、情報処理装置100による代表フレーム候補判別処理の処理手順を示すフローチャートである。この代表フレーム候補判別処理は、代表フレーム候補判別部230により行われる。
最初に、カラーヒストグラム抽出部210により抽出されたカラーヒストグラムが入力される(ステップS901)。続いて、入力されたカラーヒストグラムに対応するフレームが、動画の先頭フレームであるか否かが判断される(ステップS902)。入力されたカラーヒストグラムに対応するフレームが、動画の先頭フレームである場合には(ステップS902)、入力されたカラーヒストグラムに対応するフレームが、代表フレーム候補であると判別され(ステップS905)、そのカラーヒストグラムが参照ヒストグラム保持部240および代表フレーム判別部260に出力される(ステップS906)。代表フレーム候補判別部230からカラーヒストグラムが出力されると、このカラーヒストグラムのみを参照ヒストグラム保持部240が保持する。
一方、入力されたカラーヒストグラムに対応するフレームが、動画の先頭フレームではない場合には(ステップS902)、入力されたカラーヒストグラムと、参照ヒストグラム保持部240に保持されている参照ヒストグラムとのヒストグラム差分値が算出される(ステップS903)。
続いて、算出されたヒストグラム差分値が、候補選択閾値保持部220に保持されている閾値以上であるか否かが判断される(ステップS904)。算出されたヒストグラム差分値が、候補選択閾値保持部220に保持されている閾値以上である場合には(ステップS904)、入力されたカラーヒストグラムに対応するフレームが、代表フレーム候補であると判別され(ステップS905)、そのカラーヒストグラムが参照ヒストグラム保持部240および代表フレーム判別部260に出力される(ステップS906)。
一方、算出されたヒストグラム差分値が、候補選択閾値保持部220に保持されている閾値未満である場合には(ステップS904)、入力されたカラーヒストグラムに対応するフレームが、代表フレーム候補ではないと判別され、代表フレーム候補判別処理の動作を終了する。
図6は、情報処理装置100による代表フレーム判別処理の処理手順を示すフローチャートである。この代表フレーム判別処理は、代表フレーム判別部260により行われる。また、この例では、代表フレーム候補判別部230から出力されたカラーヒストグラムと代表ヒストグラムとのヒストグラム差分値の全てが、決定閾値保持部250に保持されている閾値以上である場合に、そのカラーヒストグラムに対応するフレームが代表フレームであると判別し、そのヒストグラム差分値のうちの少なくとも1つが、決定閾値保持部250に保持されている閾値以下である場合に、そのカラーヒストグラムに対応するフレームが代表フレームではなく類似フレームであると判別する場合について説明する。
最初に、代表フレーム候補判別部230から出力されたカラーヒストグラムが入力されたか否かが判断される(ステップS911)。カラーヒストグラムが入力されていない場合には(ステップS911)、カラーヒストグラムが入力されるまで監視を継続する。
代表フレーム候補判別部230からのカラーヒストグラムが入力された場合には(ステップS911)、代表ヒストグラム保持部270に代表ヒストグラムが保持されているか否かが判断される(ステップS912)。代表ヒストグラム保持部270に代表ヒストグラムが保持されていない場合には(ステップS912)、ステップS911で入力されたカラーヒストグラムに対応する代表フレーム候補が代表フレームとして判別され(ステップS917)、そのカラーヒストグラムが代表ヒストグラム保持部270、データベース140および特徴量照合部150に出力される(ステップS918)。
代表ヒストグラム保持部270に代表ヒストグラムが保持されている場合には(ステップS912)、代表ヒストグラム保持部270に保持されている代表ヒストグラムの中から1つの代表ヒストグラムが取得され(ステップS913)、入力されたカラーヒストグラムと、取得された代表ヒストグラムとのヒストグラム差分値が算出される(ステップS914)。
続いて、算出されたヒストグラム差分値が、決定閾値保持部250に保持されている閾値以下であるか否かが判断される(ステップS915)。算出されたヒストグラム差分値が、決定閾値保持部250に保持されている閾値以下である場合には(ステップS915)、ステップS911で入力されたカラーヒストグラムに対応する代表フレーム候補に類似する代表フレームが存在すると判別され、そのカラーヒストグラムが削除される(ステップS919)。
一方、算出されたヒストグラム差分値が、決定閾値保持部250に保持されている閾値以下ではない場合には(ステップS915)、代表ヒストグラム保持部270に保持されている代表ヒストグラムの中で、取得されていない代表ヒストグラムが存在するか否かが判断される(ステップS916)。代表ヒストグラム保持部270に保持されている代表ヒストグラムの中で、取得されていない代表ヒストグラムが存在する場合には(ステップS916)、ステップS913に戻り、ヒストグラム差分値の比較処理を繰り返す(ステップS913乃至ステップS915)。
一方、代表ヒストグラム保持部270に保持されている代表ヒストグラムの中で、取得されていない代表ヒストグラムが存在しない場合には(ステップS916)、ステップS911で入力されたカラーヒストグラムに対応する代表フレーム候補が代表フレームとして判別され(ステップS917)、そのカラーヒストグラムが代表ヒストグラム保持部270、データベース140および特徴量照合部150に出力される(ステップS918)。
次に、動画におけるチェンジ点毎に代表フレームを判別する例について図面を参照して詳細に説明する。チェンジ点は、例えば、動画において撮影場面が瞬間的に変化する場合におけるその境界点を示すカットチェンジ点や、動画において撮影場面が比較的大きく変化する場合におけるその境界点を示すクロスフェード点等を含むものである。また、このチェンジ点間隔は、連続するチェンジ点間の区間における時間やフレーム数等の間隔を示すものである。
図7は、図1に示す情報処理装置100の一部を変形した情報処理装置101の構成例を示すブロック図である。情報処理装置101は、図1に示す情報処理装置100において、データベース140、特徴量照合部150および特徴量抽出部200の代わりに、データベース141、特徴量照合部151および特徴量抽出部400を設けた情報処理装置である。なお、データベース141、特徴量照合部151および特徴量抽出部400以外の構成は、図1に示す情報処理装置100と同様であるため、これらの以外の構成についての説明は省略する。
特徴量抽出部400は、ビデオデコード部130から出力されたベースバンドデータに基づいて、動画におけるチェンジ点間隔、および、チェンジ点間隔における代表フレームに対応する代表ヒストグラムを抽出するものであり、抽出されたチェンジ点間隔および代表ヒストグラムをデータベース141および特徴量照合部151に出力する。なお、特徴量抽出部400については、図8を参照して詳細に説明する。
データベース141は、特徴量抽出部400から出力されたチェンジ点間隔および代表ヒストグラムを動画毎に格納するデータベースであり、格納されているチェンジ点間隔および代表フレームを動画毎に特徴量照合部151に出力する。
特徴量照合部151は、特徴量抽出部400から出力されたチェンジ点間隔と、データベース141に格納されているチェンジ点間隔との比較、または、特徴量抽出部400から出力された代表ヒストグラムと、データベース141に格納されている代表ヒストグラムとの比較により、動画入力部110に入力された動画と、データベース141に格納されているチェンジ点間隔および代表フレームに対応する動画とが一致または類似するか否かを判定するものであり、この判定結果を示す類似リストを判定結果出力部160に出力する。なお、特徴量照合部151については、図10を参照して詳細に説明する。
図8は、特徴量抽出部400の機能構成例を示すブロック図である。特徴量抽出部400は、代表ヒストグラム抽出部201と、カラーヒストグラム抽出部410と、連続フレーム間ヒストグラム差分算出部420と、閾値保持部430と、カットチェンジ点判別部440と、Nフレーム間ヒストグラム差分算出部460と、閾値保持部470と、Nフレームチェンジ点判別部480と、チェンジ点間隔算出部490とを備える。なお、カラーヒストグラム抽出部410は、カラーヒストグラム抽出部210と同様であるため、ここでの説明を省略する。
連続フレーム間ヒストグラム差分算出部420は、カラーヒストグラム抽出部410から出力されたフレーム毎のY、CbおよびCrのカラーヒストグラムについて、連続する2フレーム間におけるカラーヒストグラムの面積の差分値を算出するものであり、算出されたヒストグラム差分値をカットチェンジ点判別部440に出力するものである。
閾値保持部430は、連続する2フレーム間がカットチェンジ点であるか否かをカットチェンジ点判別部440が判別する場合に用いられる閾値を保持するものであり、保持されている閾値をカットチェンジ点判別部440に出力する。
カットチェンジ点判別部440は、連続フレーム間ヒストグラム差分算出部420から出力されたヒストグラム差分値が、閾値保持部430に保持されている閾値を超えたか否かに基づいて、連続する2フレーム間がカットチェンジ点であるか否かを判別するものである。すなわち、カットチェンジ点判別部440は、連続フレーム間ヒストグラム差分算出部420から出力されたヒストグラム差分値が、閾値保持部430に保持されている閾値を超えた場合には、そのヒストグラム差分値に対応する連続する2フレーム間がカットチェンジ点であると判別して、そのフレーム間に対応する時刻をカットチェンジ点の時刻として、代表ヒストグラム抽出部201およびチェンジ点間隔算出部490に出力する。一方、カットチェンジ点判別部440は、連続フレーム間ヒストグラム差分算出部420から出力されたヒストグラム差分値が、閾値保持部430に保持されている閾値を超えていない場合には、そのヒストグラム差分値に対応する連続する2フレーム間がカットチェンジ点ではないと判別する。このようにカットチェンジ点ではないと判別された場合には、チェンジ点間隔算出部490には時刻が出力されない。
Nフレーム間ヒストグラム差分算出部460は、カラーヒストグラム抽出部410から出力されたフレーム毎のY、CbおよびCrのカラーヒストグラムについて、連続するNフレームにおける最初のフレームおよび最後のフレーム間におけるカラーヒストグラムの面積の差分値を算出するものであり、算出されたヒストグラム差分値をNフレームチェンジ点判別部480に出力するものである。
閾値保持部470は、連続するNフレーム間がチェンジ点であるか否かをNフレームチェンジ点判別部480が判別する場合に用いられる閾値を保持するものであり、保持されている閾値をNフレームチェンジ点判別部480に出力する。
Nフレームチェンジ点判別部480は、Nフレーム間ヒストグラム差分算出部460から出力されたヒストグラム差分値が、閾値保持部470に保持されている閾値を超えたか否かに基づいて、連続するNフレーム間がチェンジ点(クロスフェード点)であるか否かを判別するものである。すなわち、Nフレームチェンジ点判別部480は、Nフレーム間ヒストグラム差分算出部460から出力されたヒストグラム差分値が、閾値保持部470に保持されている閾値を超えた場合には、そのヒストグラム差分値に対応する連続するNフレーム間がチェンジ点であると判別して、そのフレーム間に対応する時刻をカットチェンジ点の時刻として、代表ヒストグラム抽出部201およびチェンジ点間隔算出部490に出力する。一方、Nフレームチェンジ点判別部480は、Nフレーム間ヒストグラム差分算出部460から出力されたヒストグラム差分値が、閾値保持部470に保持されている閾値を超えていない場合には、そのヒストグラム差分値に対応する連続するNフレーム間がチェンジ点ではないと判別する。このようにチェンジ点ではないと判別された場合には、チェンジ点間隔算出部490には時刻が出力されない。
チェンジ点間隔算出部490は、カットチェンジ点判別部440またはNフレームチェンジ点判別部480から出力されたカットチェンジ点またはチェンジ点の時刻に基づいて、隣接する2つのチェンジ点間の時間間隔を算出するものであり、算出されたチェンジ点間隔をデータベース141および特徴量照合部151に出力する。すなわち、チェンジ点間隔算出部490は、カットチェンジ点判別部440またはNフレームチェンジ点判別部480からカットチェンジ点またはチェンジ点の時刻が出力された場合には、この時刻と、この時刻の直前に出力された時刻との差の値を算出して、隣接する2つのチェンジ点間の時間間隔を算出する。なお、隣接する2つのチェンジ点間の間隔として、このチェンジ点間に含まれるフレームの数を算出し、この算出されたフレーム数をチェンジ点間隔とするようにしてもよい。
代表ヒストグラム抽出部201は、カットチェンジ点判別部440またはNフレームチェンジ点判別部480から出力されたカットチェンジ点またはチェンジ点の時刻に基づいて、隣接する2つのチェンジ点間に含まれるフレームから少なくとも1つの代表フレームを判別して、この代表フレームに対応する代表ヒストグラムをデータベース141および特徴量照合部151に出力する。すなわち、代表ヒストグラム抽出部201は、同一カット内における代表ヒストグラムを抽出する。なお、動画入力部110に入力された1つの動画について、カットチェンジ点判別部440またはNフレームチェンジ点判別部480からカットチェンジ点またはチェンジ点の時刻が1つも出力されない場合には、代表ヒストグラム抽出部201は、この入力された1つの動画を構成するフレームから少なくとも1つの代表フレームを判別して、この代表フレームに対応する代表ヒストグラムを抽出する。なお、代表ヒストグラム抽出部201については、図9を参照して詳細に説明する。
図9は、代表ヒストグラム抽出部201の機能構成例を示すブロック図である。代表ヒストグラム抽出部201は、図2に示す特徴量抽出部200において、カラーヒストグラム抽出部210を省略するとともに、参照ヒストグラム保持部240および代表ヒストグラム保持部270の代わりに、参照ヒストグラム保持部241および代表ヒストグラム保持部271を設けたものである。なお、参照ヒストグラム保持部241および代表ヒストグラム保持部271以外の構成は、図2に示す特徴量抽出部200と同様であるため、参照ヒストグラム保持部241および代表ヒストグラム保持部271以外の構成についての説明は省略する。
参照ヒストグラム保持部241は、代表フレーム候補判別部230から出力されたカラーヒストグラムを参照ヒストグラムとして保持するとともに、保持されている参照ヒストグラムを代表フレーム候補判別部230に出力するものである。なお、参照ヒストグラム保持部241は、代表フレーム候補判別部230からカラーヒストグラムが出力される毎に、保持されている参照ヒストグラムを削除する。また、カットチェンジ点判別部440またはNフレームチェンジ点判別部480からカットチェンジ点またはチェンジ点の時刻が入力された場合にも、保持されている参照ヒストグラムを削除する。
代表ヒストグラム保持部271は、代表フレーム判別部260から出力された各カラーヒストグラムの全てを代表ヒストグラムとして保持するとともに、保持されている各代表ヒストグラムを代表フレーム判別部260に出力するものである。なお、代表ヒストグラム保持部271は、カットチェンジ点判別部440またはNフレームチェンジ点判別部480からカットチェンジ点またはチェンジ点の時刻が入力された場合には、代表ヒストグラムとして保持する各カラーヒストグラムを削除する。
次に、チェンジ点間隔または代表ヒストグラムの何れかを用いて動画一致検索を行う例について図面を参照して詳細に説明する。
ここで、チェンジ点間隔および代表ヒストグラムのデータ量を比較した場合には、代表ヒストグラムのデータ量よりもチェンジ点間隔のデータ容量が少ない場合が多い。このため、動画の一致判定処理を行う場合において、チェンジ点間隔が存在する場合には、チェンジ点間隔を用いて一致判定処理を行う。一方、チェンジ点間隔が存在しない場合には、代表ヒストグラムを用いて一致判定処理を行う。これにより、動画の一致判定処理を迅速に行うことができる。
図10は、特徴量照合部151の機能構成例を示すブロック図である。特徴量照合部151は、照合方法決定部152と、チェンジ点間隔照合部153と、カラーヒストグラム照合部154とを備える。
図11は、照合方法決定部152が照合する方法を決定する場合における決定方法の概略を示す図である。本発明の実施の形態では、特徴量抽出部400からチェンジ点間隔が出力されたか否かと、データベース141にチェンジ点間隔が格納されているか否かに基づいて、照合方法が決定される。具体的には、図11に示すように、特徴量抽出部400からチェンジ点間隔が出力されるとともに(入力動画のチェンジ点間隔511が「有」の場合)、データベース141にチェンジ点間隔が格納されている場合(DB動画のチェンジ点間隔512が「有」の場合)には、照合方法としてチェンジ点間隔を用いた照合方法が決定される。一方、特徴量抽出部400からチェンジ点間隔が出力されない場合(入力動画のチェンジ点間隔511が「無」の場合)、または、データベース141にチェンジ点間隔が格納されていない場合(DB動画のチェンジ点間隔512が「無」の場合)には、照合方法としてカラーヒストグラムを用いた照合方法が決定される。
照合方法決定部152は、特徴量抽出部400からチェンジ点間隔が出力されたか否かと、データベース141にチェンジ点間隔が格納されているか否かとに応じて、図11に示すように、照合方法を決定するものであり、決定された照合方法に応じて、チェンジ点間隔照合部153またはカラーヒストグラム照合部154に照合指示信号を出力する。すなわち、照合方法決定部152は、照合方法としてチェンジ点間隔を用いた照合方法が決定された場合には、チェンジ点間隔照合部153に照合指示信号を出力し、照合方法としてカラーヒストグラムを用いた照合方法が決定された場合には、カラーヒストグラム照合部154に照合指示信号を出力する。
チェンジ点間隔照合部153は、照合方法決定部152からの照合指示信号を入力すると、特徴量抽出部400から出力されたチェンジ点間隔と、データベース141に格納されているチェンジ点間隔とを比較し、この比較結果に基づいて、動画入力部110に入力された動画と、データベース141に格納されているチェンジ点間隔に対応する動画とが一致するか否かを判定するものであり、この判定結果を示す一致リストを判定結果出力部160に出力する。すなわち、動画入力部110に入力された動画と一致する動画に対応するチェンジ点間隔を、データベース141に格納されている特徴量リストの中から検索する。
カラーヒストグラム照合部154は、照合方法決定部152からの照合指示信号を入力すると、特徴量抽出部400から出力された代表ヒストグラムと、データベース141に格納されている代表ヒストグラムとを比較し、この比較結果に基づいて、動画入力部110に入力された動画と、データベース141に格納されている代表ヒストグラムに対応する動画とが一致するか否かを判定するものであり、この判定結果を示す一致リストを判定結果出力部160に出力する。すなわち、カラーヒストグラム照合部154は、照合方法決定部152からの照合指示信号を入力すると、特徴量抽出部400から出力された代表ヒストグラムと、データベース141に格納されている代表ヒストグラムとを比較してヒストグラム差分値を算出し、この算出されたヒストグラム差分値が閾値以下となった場合に、動画入力部110に入力された動画と、データベース141に格納されている特徴量リストに対応する動画とが一致すると判別する。
例えば、映画、テレビ番組等のように編集された動画コンテンツについては、チェンジ点があると想定される。この場合には、チェンジ点間隔を用いて動画一致検索を迅速に行うことができる。また、入力動画の代表ヒストグラムとデータベースに格納されている代表ヒストグラムとを照合するカラーヒストグラム照合は、動画一致検索以外にも、動画類似検索を行うことが可能である。なお、チェンジ点が存在しない動画コンテンツについては、カラーヒストグラムの変化量が小さいか、カラーヒストグラムの変化がない動画であるため、カラーヒストグラムをサンプリングすべき画像を少なくすることができる。このため、情報量を削減することができる。
次に、動画入力部110から入力された動画の代表フレームを判別する判別方法として、その動画を構成するフレームに対応する各カラーヒストグラムの差分値以外の比較結果に基づいて動画の代表フレームを判別する例について、図面を参照して詳細に説明する。
図12(a)は、動画を構成する各フレームから抽出されたカラーヒストグラムが3階調(#1、#2、#3)で表される場合におけるカラーヒストグラムの一例を示す図である。図12(b)は、3次元空間上において、動画を構成する各フレームから抽出されたカラーヒストグラムの点の軌跡が時系列に配置された場合を概念的に示す図である。
例えば、動画を構成する各フレームから抽出されたカラーヒストグラムを16階調で表す場合には、カラーヒストグラムを示すデータは16次元のベクトルデータとして表現される。この例では、図12に示すように、動画を構成する各フレームから抽出されたカラーヒストグラムを3階調(#1、#2、#3)で表す場合を例にして説明するが、3階調以外の場合についても、3階調と同様に考えることができる。
図12(a)に示すグラフにおいて、横軸は階調を示し、縦軸は頻度を示す。また、図12(b)において、3次元空間上における互いに直行する3方向の各軸をx、y、z軸とし、x軸は、カラーヒストグラムの階調「#1」の頻度を示す軸とし、y軸は、カラーヒストグラムの階調「#2」の頻度を示す軸とし、z軸は、カラーヒストグラムの階調「#3」の頻度を示す軸とする。
ここで、図12(b)に示す3次元空間上において、動画を構成するフレームから抽出されたカラーヒストグラムのうちの2つカラーヒストグラムの位置をP(x,y,z)およびP(x,y,z)とする。この場合において、この2つのカラーヒストグラムの差分値は、以下に示す絶対距離d1の式1を用いて算出することができる。
d1(P,P)=|x−x|+|y−y|+|z−z|……(式1)
このように、図12(b)に示す3次元空間上における2つの位置P(x,y,z)およびP(x,y,z)の差分値を用いる代わりに、P(x,y,z)およびP(x,y,z)間のユークリッド距離を用いることができる。P(x,y,z)およびP(x,y,z)間のユークリッド距離d2は、以下に示す式2を用いて算出することができる。
Figure 2009049667
このユークリッド距離d2は、図12(b)に示す3次元空間上における2つの位置P(x,y,z)およびP(x,y,z)の距離に等しい。
図12(b)では、1つの動画を構成する各フレームから抽出された各カラーヒストグラムに対応する各位置を、点601乃至620として配置する。なお、1つの動画を構成する各フレームのうちの先頭のフレームに対応するカラーヒストグラムの位置を点601とし、1つの動画を構成するフレームのうちの後端のフレームに対応するカラーヒストグラムの位置を点620とし、点601および点620間の各点については、時系列に数字を付して、これらの各点を時系列に曲線で結ぶ。
2つのカラーヒストグラムのユークリッド距離は式2を用いて算出され、この算出されたユークリッド距離の値は、図12(b)に示す3次元空間上において、2つのカラーヒストグラムに対応する2つの点の距離に等しい。例えば、図12(b)に示す3次元空間上において、点601と点607とのユークリッド距離は、矢印631で示すベクトルの長さに等しい。また、同様に、点607と点613とのユークリッド距離、点613と点617とのユークリッド距離、点610と点607とのユークリッド距離は、それぞれ矢印632乃至634で示すベクトルの長さに等しい。
図12(b)に示す3次元空間上における点601乃至620について、ユークリッド距離を用いて代表フレームを判別する場合には、最初は、点601が参照ヒストグラムとされる。そして、点602以降の点と、点601とのユークリッド距離を順次算出していき、ユークリッド距離の値が候補選択閾値保持部220の閾値以上となる点を検出する。例えば、点601および点607のユークリッド距離(矢印631の長さ)が、候補選択閾値保持部220の閾値以上であるものとする。この場合には、点607が参照ヒストグラムとされる。そして、点601の場合と同様に、点608以降の点と、点607とのユークリッド距離を順次算出していき、ユークリッド距離の値が候補選択閾値保持部220の閾値以上となる点を検出する。
図12(b)に示す3次元空間上においては、このようにして検出された点を点601、607、613、617、620とする。このように検出された点601、607、613、617、620に対応するフレームが、代表フレーム候補と判別される。
続いて、代表フレーム候補の中から、互いに類似する代表フレーム候補を検出して、互いに類似する代表フレーム候補のうちの一方を削除する。そして、互いに類似する代表フレーム候補を削除した後に残っている代表フレーム候補が、代表フレームとして判別される。
例えば、代表フレーム候補として判別された点601、607、613、617、620について、代表フレーム候補が判別される毎に、この代表フレーム候補と、既に判別されている代表フレーム候補とを比較して、互いに類似するか否かが判別される。この判別は、例えば、比較対象の2つの代表フレーム候補に対応するカラーヒストグラムのユークリッド距離を算出して、この算出されたユークリッド距離の値が、決定閾値保持部250に保持されている閾値以下であるか否かに基づいて判別される。例えば、図12(b)に示す3次元空間上においては、点601および点620間のユークリッド距離が、決定閾値保持部250に保持されている閾値以下であるものとする。この場合には、点601よりも後に判別された点620が削除される。そして、代表フレーム候補として判別された点601、607、613、617、620のうちで、点620以外の点601、607、613、617が代表フレームとして判別される。
また、特徴量のベクトルデータを用いて代表フレームを判別する判別方法としては、図12(b)に示すように、ユークリッド距離を用いて代表フレームを判別する判別方法以外に、図12(b)に示す3次元空間上に配置される各点間における内積(コサイン尺度)を用いて代表フレームを判別する判別方法を用いることができる。
さらに、動画に関する特徴量として、動画を構成するフレームに対応するカラーヒストグラムを用いて代表フレームを判別する判別方法以外に、動画を構成するフレームを画面分割し、この分割された領域内の各カラーヒストグラムやエッジ情報を各フレームの特徴量として用いて、代表フレームを判別するようにしてもよい。
以上で示したように、本発明の実施の形態では、代表フレーム候補判別部230が代表フレーム候補を判別し、この代表フレーム候補の中から代表フレーム判別部260が代表フレームを判別する。このため、似ている特徴量を有するフレームを重複してサンプリングすることを阻止することができる。これにより、保存すべき特徴量のサイズを低減させることができる。
また、チェンジ点間隔においては、チェンジ点間隔に含まれる各フレームの中から代表フレームをチェンジ点間隔毎に判別することができる。なお、同一のチェンジ点間隔内では、カラーヒストグラムの変化量が小さいため、代表フレーム候補の中から互いに類似するフレームを削除して代表フレームを判別しても、検索精度に与える影響は少ない。
このように、本発明の実施の形態によれば、動画を構成する各フレームから適切な代表フレームを判別することができる。
また、本発明の実施の形態では、情報処理装置に入力される動画から代表フレームを判別して一致または類似検索する場合について説明したが、例えば、インターネット上に流通する動画コンテンツの検索、コンテンツホルダ内(映画会社、テレビ局、CMコンテンツホルダ)での一致または類似検索、テレビ番組等をユーザが携帯電話でキャプチャしてサーバ側に送信し、同一または類似のコンテンツを紹介または配信するシステム、動画コンテンツの分類、動画共有サイトでの動画コンテンツ分類等に本発明の実施の形態を適用することができる。
なお、本発明の実施の形態では、情報処理装置を例にして説明したが、動画を検索することができる携帯端末装置等の画像検索装置に本発明の実施の形態を適用することができる。
なお、本発明の実施の形態は本発明を具現化するための一例を示したものであり、以下に示すように特許請求の範囲における発明特定事項とそれぞれ対応関係を有するが、これに限定されるものではなく本発明の要旨を逸脱しない範囲において種々の変形を施すことができる。
すなわち、請求項1乃至9において、情報処理装置は、例えば情報処理装置100または101に対応する。
また、請求項1において、特徴量抽出手段は、例えば特徴量抽出部200または400に対応する。また、代表フレーム候補判別手段は、例えば代表フレーム候補判別部230に対応する。また、代表フレーム判別手段は、例えば代表フレーム判別部260に対応する。
請求項3において、参照特徴量保持手段は、例えば参照ヒストグラム保持部240または241に対応する。
また、請求項4または5において、候補選択閾値保持手段は、例えば候補選択閾値保持部220に対応する。
また、請求項6において、代表特徴量保持手段は、例えば代表ヒストグラム保持部270または271に対応する。
また、請求項7または8において、決定閾値保持手段は、例えば決定閾値保持部250に対応する。
また、請求項9において、チェンジ点検出手段は、例えばカットチェンジ点判別部440またはNフレームチェンジ点判別部480に対応する。また、チェンジ点間隔算出手段は、例えばチェンジ点間隔算出部490に対応する。
また、請求項10または11において、特徴量抽出手順は、例えば特徴量抽出部200または400により行われる。また、代表フレーム候補判別手順は、例えばステップS905に対応する。また、代表フレーム判別手順は、例えばステップS917に対応する。
なお、本発明の実施の形態において説明した処理手順は、これら一連の手順を有する方法として捉えてもよく、また、これら一連の手順をコンピュータに実行させるためのプログラム乃至そのプログラムを記憶する記録媒体として捉えてもよい。
情報処理装置100の機能構成例を示すブロック図である。 特徴量抽出部200の機能構成例を示すブロック図である。 フレーム毎に抽出される輝度信号Y、色差信号(青)Cbおよび色差信号[0](赤)Crのカラーヒストグラムの例を示す図である。 動画を構成する各フレームを時系列に並べられた場合を概念的に示す図である。 情報処理装置100による代表フレーム候補判別処理の処理手順を示すフローチャートである。 情報処理装置100による代表フレーム判別処理の処理手順を示すフローチャートである。 情報処理装置101の構成例を示すブロック図である。 特徴量抽出部400の機能構成例を示すブロック図である。 代表ヒストグラム抽出部201の機能構成例を示すブロック図である。 特徴量照合部151の機能構成例を示すブロック図である。 照合方法決定部152が照合する方法を決定する場合における決定方法の概略を示す図である。 カラーヒストグラムが3階調で表される場合におけるカラーヒストグラムの一例と、カラーヒストグラムの点の軌跡が時系列に3次元空間上に配置された場合を概念的に示す図である。
符号の説明
100、101 情報処理装置
110 動画入力部
120 ビデオ・オーディオデマルチプレクサ
130 ビデオデコード部
140、141 データベース
150、151 特徴量照合部
152 照合方法決定部
153 チェンジ点間隔照合部
154 カラーヒストグラム照合部
160 判定結果出力部
200、400 特徴量抽出部
201 代表ヒストグラム抽出部
210 カラーヒストグラム抽出部
220 候補選択閾値保持部
230 代表フレーム候補判別部
240、241 参照ヒストグラム保持部
250 決定閾値保持部
260 代表フレーム判別部
270、271 代表ヒストグラム保持部
410 カラーヒストグラム抽出部
420 連続フレーム間ヒストグラム差分算出部
430、470 閾値保持部
440 カットチェンジ点判別部
460 Nフレーム間ヒストグラム差分算出部
480 Nフレームチェンジ点判別部
490 チェンジ点間隔算出部

Claims (11)

  1. 動画を構成するフレーム毎の特徴量を抽出する特徴量抽出手段と、
    前記特徴量抽出手段により抽出された特徴量に基づいて、前記動画を構成するフレームの中から代表フレーム候補を判別する代表フレーム候補判別手段と、
    前記代表フレーム候補について抽出された特徴量である代表フレーム候補特徴量のそれぞれの差分を利用して、前記代表フレーム候補の中から代表フレームを判別する代表フレーム判別手段と
    を具備する情報処理装置。
  2. 前記代表フレーム判別手段は、前記代表フレーム候補特徴量のそれぞれの差分を算出し、当該算出された差分が所定の範囲内に存在するか否かに基づいて前記代表フレームを判別する
    請求項1記載の情報処理装置。
  3. 前記代表フレーム候補のうちで最後に判別された代表フレーム候補について抽出された特徴量を参照特徴量として保持する参照特徴量保持手段をさらに具備し、
    前記代表フレーム候補判別手段は、前記参照特徴量と前記抽出された特徴量とを比較して当該比較結果に基づいて前記代表フレーム候補を判別する
    請求項1記載の情報処理装置。
  4. 前記代表フレーム候補を判別するための閾値を保持する候補選択閾値保持手段をさらに具備し、
    前記代表フレーム候補判別手段は、前記参照特徴量と前記抽出された特徴量との差分値を算出し、当該算出された差分値と前記候補選択閾値保持手段に保持されている閾値とを比較することにより前記代表フレーム候補を判別する
    請求項3記載の情報処理装置。
  5. 前記代表フレーム候補を判別するための閾値を保持する候補選択閾値保持手段をさらに具備し、
    前記代表フレーム候補判別手段は、前記参照特徴量と前記抽出された特徴量とのユークリッド距離を算出し、当該算出されたユークリッド距離の値と前記候補選択閾値保持手段に保持されている閾値とを比較することにより前記代表フレーム候補を判別する
    請求項3記載の情報処理装置。
  6. 前記代表フレームについて抽出された特徴量を代表特徴量として保持する代表特徴量保持手段をさらに具備し、
    前記代表フレーム判別手段は、前記代表特徴量保持手段に保持されている各代表特徴量と前記代表フレーム候補特徴量との差分を算出し、当該算出された差分が所定の範囲内に存在するか否かに基づいて前記代表フレームを判別する
    請求項1記載の情報処理装置。
  7. 前記代表フレームを判別するための閾値を保持する決定閾値保持手段をさらに具備し、
    前記代表フレーム判別手段は、前記代表特徴量保持手段に保持されている各代表特徴量と前記代表フレーム候補特徴量との差分値を算出し、当該算出された差分値と前記決定閾値保持手段に保持されている閾値とを比較することにより前記算出された差分値のうちの少なくとも1つが前記決定閾値保持手段に保持されている閾値以下である代表フレーム候補を前記代表フレームとして選択しない
    請求項6記載の情報処理装置。
  8. 前記代表フレームを判別するための閾値を保持する決定閾値保持手段をさらに具備し、
    前記代表フレーム判別手段は、前記代表特徴量保持手段に保持されている各代表特徴量と前記代表フレーム候補特徴量とのユークリッド距離を算出し、当該算出されたユークリッド距離の値と前記決定閾値保持手段に保持されている閾値とを比較することにより前記算出されたユークリッド距離の値のうちの少なくとも1つが前記決定閾値保持手段に保持されている閾値以下である代表フレーム候補を前記代表フレームとして選択しない
    請求項6記載の情報処理装置。
  9. 前記動画を構成するフレームに対応する画面において一定の変化が検出された時間軸における位置を示すチェンジ点を検出するチェンジ点検出手段と、
    前記検出されたチェンジ点間の間隔を示すチェンジ点間隔を算出するチェンジ点間隔算出手段とをさらに具備し、
    前記代表フレーム候補判別手段は、前記算出されたチェンジ点間隔毎に前記代表フレーム候補を判別し、
    前記代表フレーム判別手段は、前記チェンジ点間隔毎に判別された代表フレーム候補の中から代表フレームを判別する
    請求項1記載の情報処理装置。
  10. 動画を構成するフレーム毎の特徴量を抽出する特徴量抽出手順と、
    前記特徴量抽出手順で抽出された特徴量に基づいて、前記動画を構成するフレームの中から代表フレーム候補を判別する代表フレーム候補判別手順と、
    前記代表フレーム候補について抽出された特徴量である代表フレーム候補特徴量のそれぞれの差分を利用して、前記代表フレーム候補の中から代表フレームを判別する代表フレーム判別手順と
    を含む情報処理方法。
  11. 動画を構成するフレーム毎の特徴量を抽出する特徴量抽出手順と、
    前記特徴量抽出手順で抽出された特徴量に基づいて、前記動画を構成するフレームの中から代表フレーム候補を判別する代表フレーム候補判別手順と、
    前記代表フレーム候補について抽出された特徴量である代表フレーム候補特徴量のそれぞれの差分を利用して、前記代表フレーム候補の中から代表フレームを判別する代表フレーム判別手順と
    をコンピュータに実行させるプログラム。
JP2007213220A 2007-08-20 2007-08-20 情報処理装置、その処理方法およびプログラム Pending JP2009049667A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2007213220A JP2009049667A (ja) 2007-08-20 2007-08-20 情報処理装置、その処理方法およびプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2007213220A JP2009049667A (ja) 2007-08-20 2007-08-20 情報処理装置、その処理方法およびプログラム

Publications (1)

Publication Number Publication Date
JP2009049667A true JP2009049667A (ja) 2009-03-05

Family

ID=40501455

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007213220A Pending JP2009049667A (ja) 2007-08-20 2007-08-20 情報処理装置、その処理方法およびプログラム

Country Status (1)

Country Link
JP (1) JP2009049667A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2010125757A1 (ja) * 2009-04-28 2010-11-04 三菱電機株式会社 映像音声再生装置、映像音声記録再生装置、映像音声再生方法、および映像音声記録再生方法
WO2012102276A1 (ja) * 2011-01-24 2012-08-02 エイディシーテクノロジー株式会社 静止画抽出装置
JP2015026202A (ja) * 2013-07-25 2015-02-05 日本放送協会 番組検索装置及び番組検索プログラム

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2010125757A1 (ja) * 2009-04-28 2010-11-04 三菱電機株式会社 映像音声再生装置、映像音声記録再生装置、映像音声再生方法、および映像音声記録再生方法
WO2012102276A1 (ja) * 2011-01-24 2012-08-02 エイディシーテクノロジー株式会社 静止画抽出装置
JPWO2012102276A1 (ja) * 2011-01-24 2014-06-30 エイディシーテクノロジー株式会社 静止画抽出装置
JP2015026202A (ja) * 2013-07-25 2015-02-05 日本放送協会 番組検索装置及び番組検索プログラム

Similar Documents

Publication Publication Date Title
JP4428424B2 (ja) 情報処理装置、情報処理方法、プログラムおよび記録媒体
US9432702B2 (en) System and method for video program recognition
US8295611B2 (en) Robust video retrieval utilizing audio and video data
JP5371083B2 (ja) 顔識別特徴量登録装置、顔識別特徴量登録方法、顔識別特徴量登録プログラム及び記録媒体
EP1081960A1 (en) Signal processing method and video/voice processing device
US20060245724A1 (en) Apparatus and method of detecting advertisement from moving-picture and computer-readable recording medium storing computer program to perform the method
US20050228849A1 (en) Intelligent key-frame extraction from a video
US20110085734A1 (en) Robust video retrieval utilizing video data
JP2005513663A (ja) コマーシャル及び他のビデオ内容の検出用のファミリーヒストグラムに基づく技術
KR101812103B1 (ko) 썸네일이미지 설정방법 및 설정프로그램
KR20090007177A (ko) 얼굴 인식 기반의 실시간 선별 녹화 장치 및 방법
WO2013056311A1 (en) Keypoint based keyframe selection
CN110688524A (zh) 视频检索方法、装置、电子设备及存储介质
JP4197014B2 (ja) 映像の検索方法および装置
KR100896336B1 (ko) 영상 정보 기반의 동영상 연관 검색 시스템 및 방법
JP5096259B2 (ja) 要約コンテンツ生成装置および要約コンテンツ生成プログラム
JP2009049667A (ja) 情報処理装置、その処理方法およびプログラム
JP4333808B2 (ja) 映像の検索方法および装置
KR100930529B1 (ko) 비디오 식별을 통한 유해 동영상 검열 시스템 및 방법
JP2006039753A (ja) 画像処理装置、画像処理方法
CN114189754A (zh) 一种视频情节分段方法及***
JP2007060606A (ja) ビデオの自動構造抽出・提供方式からなるコンピュータプログラム
JP4853564B2 (ja) 情報処理装置、情報処理方法、プログラムおよび記録媒体
JP3931890B2 (ja) 映像の検索方法および装置
JP2002044610A (ja) 信号検出方法、装置及びそのプログラム、記録媒体