JP3648199B2 - カット検出装置およびそのプログラム - Google Patents

カット検出装置およびそのプログラム Download PDF

Info

Publication number
JP3648199B2
JP3648199B2 JP2001398233A JP2001398233A JP3648199B2 JP 3648199 B2 JP3648199 B2 JP 3648199B2 JP 2001398233 A JP2001398233 A JP 2001398233A JP 2001398233 A JP2001398233 A JP 2001398233A JP 3648199 B2 JP3648199 B2 JP 3648199B2
Authority
JP
Japan
Prior art keywords
cut
feature
absolute value
video data
frames
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2001398233A
Other languages
English (en)
Other versions
JP2003196662A (ja
Inventor
賢一郎 鈴木
正臣 中嶋
鋭 坂野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NTT Data Corp
Original Assignee
NTT Data Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NTT Data Corp filed Critical NTT Data Corp
Priority to JP2001398233A priority Critical patent/JP3648199B2/ja
Publication of JP2003196662A publication Critical patent/JP2003196662A/ja
Application granted granted Critical
Publication of JP3648199B2 publication Critical patent/JP3648199B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Television Signal Processing For Recording (AREA)
  • Image Analysis (AREA)

Description

【0001】
【発明の属する技術分野】
この発明は、連続するフレームから成る映像データの時間変化の中よりカット部分を検出するカット検出装置およびそのプログラムに関するものである。
【0002】
【従来の技術】
従来、コンピュータで再生可能な映像データにおいて、映像の内容把握を容易にするためには、例えば本の目次のように何らかの形で映像データに対して構造化の処理を行う必要がある。その処理の基本となるのが、映像データを一台のカメラで連続的に撮影された映像区間として定義されるショットに切り分けるカット検出である。
このカット検出方法として、カットが存在する映像データのフレーム間では、カットが存在しない場合に比べて、画像の類似度が小さく、動きベクトル量が大きいなどの特徴に注目してカット検出を行っている。具体的には、フレーム間の輝度差や色差、動き補償情報とその予測誤差などや、それらのデータを基に算出した「色のヒストグラム」や「動きベクトルの長さ」などを、カット検出のための特徴量を抽出し、閾値判定することによってカット検出を行っていた。
【0003】
【発明が解決しようとする課題】
上述したように、従来のカット検出で用いられてきたフレーム間の輝度差や色差といった特徴量は、カットであるフレーム間や、動きの激しいシーンでのフレーム間で高い値となる。そのため、この特徴量を閾値判定してカット検出を行うと、動きの激しいシーンをカットとして誤検出する問題があった。
【0004】
この発明は、上述した事情を考慮してなされたもので、映像データのカット検出において、動きの激しいシーンの誤検出を減少させることができるカット検出装置およびそのプログラムを提供することを目的とする。
【0005】
【課題を解決するための手段】
この発明は、上述した課題を解決すべくなされたもので、本発明によるカット検出装置においては、連続するフレームから成る映像データの時間変化の中よりカット部分を検出するカット検出装置であって、フレームを所定数の区画に分割し、各区画においてフレーム間の動きベクトルを算出するベクトル算出手段と、フレーム間において算出した区画毎の動きベクトルを、所定数の方向に分類して、各方向に分類された動きベクトルと対応する区画の数を累計して方向別区画数を算出する分類区画数累計手段と、フレーム間の方向別区画数と、該フレーム間に対して前または後のフレーム間の方向別区画数との方向別の差分を求め、該差分の絶対値の和である絶対値差分量を算出する絶対値差分量算出手段と、算出した絶対値差分量を基に、前記映像データよりカット部分を検出するカット部分検出手段とを具備することを特徴とする。
【0006】
上述した、ベクトル算出手段は、フレームの一部または全部を、例えばMPEG(Moving Picture Experts Group)2などの規格にて定められる動きベクトル算出のための、所定数で、所定の大きさの区画に分割し、各区画においてフレーム間の動きベクトルを算出する。分類区画数累計手段は、フレーム間において算出した区画毎の動きベクトルを、8〜数十の方向に分類して、各方向に分類された区画の数を累計して方向別区画数(例えば方向別のヒストグラムが好適である)を算出する。
【0007】
また、絶対値差分量算出手段は、フレーム間の方向別区画数と、該フレーム間の一つまたは複数フレーム間前(または後)のフレーム間の方向別区画数との方向別の差分を求め、該差分の絶対値の和である絶対値差分量を算出する。以上により、映像データのフレーム間より抽出した動きベクトルの方向別の方向別区画数(ヒストグラム)の絶対値差分量を考慮したカット検出を行うことができる。この特徴を入れることで、映像データより「動きの激しいシーン」を「カット部分」と誤検出する確率を低減したカット検出を行うことができる。その理由は後述する。ここで、「動きの激しいシーン」とは、物体が高速で移動しているシーンや、カメラが高速でパンしているシーンなどである。
【0008】
また、本発明によるカット検出装置においては、上記ベクトル算出手段と、上記分類区画数累計手段と、上記絶対値差分量算出手段とを備え、映像データより上記絶対値差分量を含む複数の特徴項目についての特徴量である特徴情報を抽出する情報抽出手段を更に具備し、上記カット部分検出手段は、特徴情報に含まれる特徴量を識別関数へ代入計算する識別関数計算手段と、識別関数計算手段の計算結果を基に、カット部分であるかどうかを識別するカット部分識別手段とを具備することを特徴とする。
【0009】
これにより、動きベクトルの方向別の方向別区画数(ヒストグラム)の絶対値差分量を特徴量として映像データより抽出し、該特徴量を変数とする識別関数を用いてカット部分であるか非カット部分であるかの識別を行うことができる。また、映像データより抽出した複数の特徴項目に任意の重み付けを付与して処理できるので、各特徴項目の重み付けに応じて、全ての特徴項目を考慮したカット検出を行うことができる。
【0010】
また、本発明によるカット検出装置においては、カット部分が既知である映像データから、絶対値差分量を含む複数の特徴項目についての特徴量を抽出し、特徴量とカット部分および非カット部分のどちらから抽出したか識別する情報とを含めて特徴情報とする特徴情報抽出手段と、特徴情報を基に識別関数の係数を求め、識別関数を生成する識別関数生成手段とを更に具備することを特徴とする。
【0011】
これにより、動きベクトルの方向別の方向別区画数(ヒストグラム)の絶対値差分量を少なくとも含む特徴項目を用いて、映像データのカット部分の特徴量と、非カット部分の特徴量の違いを基に識別関数を生成できる。
【0012】
また、本発明によるカット検出装置においては、上記識別関数生成手段の生成した識別関数の係数が、有意なものか所定の計算式により検定する係数検定手段を更に具備し、上記係数検定手段が、有意でないと検定した係数がある場合に、上記識別関数生成手段は、有意でないと検定された係数に対応する特徴情報を除いた特徴情報を基に、識別関数の係数を求め、識別関数を生成することを特徴とする。
【0013】
これにより、生成した識別関数の係数が、有意なものであるか統計的に判別を行う所定の計算式を用いて計算することで、係数の有意について検定することができる。また、種々の特徴項目よりカット検出に有効でない特徴項目を削除して、有効な特徴項目のみに絞り込んだ識別関数を生成することができる。更には、映像データの内容に合わせて、より精度よくカット検出を行うように、映像データの内容別に、特徴項目の違う識別関数を生成することができる。
【0014】
また、本発明によるカット検出装置においては、上記識別関数として判別関数を用いることを特徴とする。
これにより、識別に貢献する特徴量のみを用いた判別関数でカット部分の検出しを行うことができる。
【0015】
また、本発明によるプログラムは、連続するフレームから成る映像データの時間変化の中よりカット部分を検出するカット検出方法のプログラムであって、フレームを所定数の区画に分割し、各区画においてフレーム間の動きベクトルを算出するステップと、フレーム間において算出した区画毎の動きベクトルを、所定数の方向に分類して、各方向に分類された区画の数を累計して方向別区画数を算出するステップと、フレーム間の方向別区画数と、該フレーム間の前または後のフレーム間の方向別区画数との方向別の差分を求め、該差分の絶対値の和である絶対値差分量を算出するステップと、算出した絶対値差分量を基に、映像データよりカット部分を検出するステップとをコンピュータへ実行させるためのプログラムである。
【0016】
【発明の実施の形態】
以下、発明の実施の形態を通じて本発明を説明する。ただし、以下の実施の形態は特許請求の範囲に記載された発明を限定するものではなく、また実施の形態の中で説明されている特徴の組み合わせのすべてが発明の解決手段に必要であるとは限らない。
まず、本発明の第一の実施形態として、識別関数として判別関数を用いたカット検出装置の概略構成について図を用いて説明する。
【0017】
図1は、本発明の第一の実施形態による識別関数として判別関数を用いたカット検出装置の概略構成を示すブロック図である。この図において符号10は、識別関数として判別関数を用いて、映像データよりカット部分を検出するカット検出装置である。11は、カット検出装置10内のデータの制御を行う制御部である。12は、カット検出処理用の映像データを格納する映像データベース12aと、判別関数の学習処理を行う為のカット部分が既知の映像データである学習情報を格納する学習情報データベース12bである。13は、カット検出を行う為の種々の処理プログラムを具備する処理プログラム部である。
【0018】
尚、カット検出装置10は、カット検出の対象となる映像データを取得する場合に、上述したように映像データベース12aより読み出す方法に限らない。即ち、映像データベース12aは、必ずしもカット検出装置10が具備する必要はない。他の方法としては、カット検出装置10は、処理する映像データを、通信ネットワーク経由で取得したり、CD−ROM等の記録媒体より読み取ったりして好適である。
【0019】
次に、学習情報データベース12bの構築例について図を用いて説明する。図6は、本発明の第一の実施形態における学習情報データベース12bの構成例を示す図である。図に示すように、カット部分が既知である映像データに関連付けて種々の情報を格納する。“映像データ”は、判別関数の学習用の映像データである。“フレーム間情報”は、各フレーム間において、カット部分であるかを示す“カット情報”や、該フレーム間より抽出した“特徴項目”毎の“特徴量”を含む“特徴情報”など、フレーム間に関する情報を格納する。“係数情報”は、各“映像データ”の“フレーム間情報”を基に求めた判別関数の係数に関する係数情報を格納する。
【0020】
次に、処理プログラム部13について構成を説明する。処理プログラム部13には、学習情報データベース12bに格納されるカット部分、非カット部分が既知の“映像データ”を基に、判別関数の係数を生成する為の学習処理を行う学習処理部14と、映像データベース12aに格納されるカット部分、非カット部分が未知の映像データを基に、カット部分を検出する検出処理部15から成る。
尚、本実施形態の判別関数とは、判別分析に用いられる関数であって、一つもしくは複数の観測値(本実施形態では特徴量)を変数とする線形式である線形判別関数である。また、上述した判別分析の方法の限りではなく、他の判別分析の方法を用いてもよい。
【0021】
上記判別関数について一例を示して更に説明する。対象となるサンプル(映像データにおけるフレーム間)のサンプル数をiとし、サンプルについてのp種類の特徴項目について特徴量xi1〜xipとした場合、図7に示すように、フレーム51の時間変化における、フレーム間の特徴量xi1〜xipが抽出される。この時、判別関数の定数項をa0とし、各特徴量に対する係数をa1〜apとすると、サンプルiにおける判別関数値fiは、以下の判別関数(式1)で表される
i=a0+a1i1+a2i2+…+apip …(式1)
【0022】
この(式1)に抽出したサンプルiの特徴量xi1〜xipを代入することでfiの値を求め、その値を基に映像データのi番目のフレーム間がカット部分であるか非カット部分であるかを判別する。
また、係数a1〜apの有意性を検定する方法は、まず、判別分析によって得られた結果から所定の計算式によりp個の特徴量からj番目の特徴量を除いた場合に、マハラノビスの汎距離がどのように変化するかを表す尺度であり、係数の貢献度の判定に用いる値“Fp,j”を以下の(式2)により求める。
【数1】
Figure 0003648199
以上の(式2)において、
p:特徴量の個数
1:カット部分のサンプル数
2:非カット部分のサンプル数
2 (p):p個の特徴量を使用した場合のマハラノビスの汎距離
2 (p-1):p個の特徴量から特徴量jを除いた場合のマハラノビスの汎距離
である。
次に、検定統計量がF分布に従っているとして所定の有意水準(%)のF分布値を求める。次に、貢献度の判定値“Fp,j”とF分布値の大小を比較して、j番目の特徴量がカット部分の識別にどの程度、貢献しているかを求める。
【0023】
ここで、本実施形態においては、映像データのフレーム間より、“動き方向ヒストグラムの絶対値差分和(絶対値差分量)”を含む、以下に示す4つの特徴項目について特徴量xi1〜xi4を抽出する。
・輝度の絶対値差分の平均値(xi1
・輝度ヒストグラムの絶対値差分値(xi2
・画面全体の平均動きベクトル長(xi3
・動き方向ヒストグラムの絶対値差分和(xi4
以上の場合に、(式1)に示した判別関数値fi
i=a0+a1i1+a2i2+a3i3+a4i4 … (式3)
となる。以下(式3)を用いてカット検出装置10の説明を行う。
【0024】
尚、“輝度の絶対値差分の平均値”とは、隣接フレーム間で同じ位置にあるブロック(フレームを所定数の区画に分割した際の1区画)の輝度の絶対値差分を求めて平均した値である。“輝度ヒストグラムの絶対値差分値”とは、隣接フレームでそれぞれの輝度ヒストグラムを求め、各段階(例えば16段階に分ける)毎に絶対値差分を求め合計した値である。
【0025】
“画面全体の平均動きベクトル長”とは、隣接するフレーム間で、動きベクトルの長さを本数で平均した値である。ここで、動きベクトルを算出する方法の一例を以下に示す。まず、フレーム内の16pixel×16pixelの各ブロックに対して、該フレームに隣接するフレームの同位置に同様のブロックおよび該ブロックの周囲にある32pixel×32pixelのブロックに対して、近似的な画像を含むブロックを探索するためブロック間のRGB値の絶対値誤差を求めるブロックマッチングを行う。次に、求めた絶対値誤差が最小となるブロックを動きベクトルの到達ブロックとすることで、動きベクトルを算出する。
【0026】
“動き方向ヒストグラムの絶対値差分和”とは、隣接するフレーム間で求めた動きベクトルを8方向に分類して32段階のヒストグラムを作成し、一つ前のフレーム間のヒストグラムと各段階において絶対値差分を求め合計した値である。尚、ヒストグラムの各段階で絶対値差分を求めるのは、上述した一つ前のフレーム間に限らず、任意の数だけ前または後のフレーム間のヒストグラムと格段階で絶対値差分を求め合計して好適である。尚、動きベクトルを分類する方向や、ヒストグラムの段階の数は、上述した限りではなく、計算精度と計算量のバランスを考慮して任意の数を用いればよい。
【0027】
また、本発明は上記の4つの特徴項目に限定されず、種々のカット検出する為の特徴項目の特徴量を用いて好適である。例えば、以下に示す特徴項目がある。・“ブロックRGB値の絶対値差分の合計の平均値”は、隣接したフレーム間で、同位置にある16pixel×16pixelのブロックを単位として、R、G、Bそれぞれの値について平均値の絶対値誤差を求めて合計し、その結果をフレーム全体で平均した値である。
・“ブロックRGB値の絶対値差分の合計の分散値”は、上記ブロック単位にR、G、Bそれぞれの平均値の絶対値差分について、フレーム全体における分散を求めた値である。
【0028】
・“ブロック色ヒストグラムの絶対値差分和”は、フレーム内で16pixel×16pixelのブロックを単位としたR、G、Bそれぞれの平均値の絶対値差分について、色ごとに64段階のヒストグラムを作成し、隣接フレーム間でヒストグラムの各段階における絶対値差分を求め、3色全てについて合計した値である。
・“動きベクトルの長さの分散”は、隣接したフレーム間で求められた動きベクトルの長さについて、フレーム全体における分散を求めた値である。
【0029】
以上、判別関数に関して、関数の具体例と、判別関数の変数となる特徴量として、種々の特徴項目の具体例を示して説明した。しかし、特徴項目の内容、数、組み合わせは上述した限りでなく、映像データよりカット検出するための特徴項目を種々の組み合わせで用いて好適である。また、特徴項目の効果的な組み合わせについては後述する。
【0030】
次に、学習処理部14について説明する。特徴情報抽出処理部16は、上記4つの特徴項目について、学習情報データベース12bより読み出したカット部分、非カット部分が既知の“映像データ”より特徴量(xi1、xi2、xi3、xi4)を抽出する。判別関数生成処理部17は、情報抽出処理部16が抽出したカット部分、非カット部分における特徴量を基に、係数(a1〜a4)を求めて判別関数(式3)を生成する。
【0031】
係数検定処理部18は、判別関数生成処理部17が、生成した判別関数の係数の各々について、カット検出の判別に有意なものであるか検定する。具体的には、係数検定処理部18は、判別分析によって得られた結果から所定の計算式によりj番目の特徴量の判別への貢献度の判定値“Fp,j”を求める。次に、係数検定処理部18は、検定統計量がF分布に従っているとして所定の有意水準(%)のF分布値を求める。次に、係数検定処理部18は、貢献度の判定値“Fp,j”とF分布値の大小を比較することで該特徴量の有意性を検定する。
【0032】
ここで、特徴量がカット部分の識別に貢献していない(有意性が無い)と検定した場合、新たにj番目の特徴量を除いたp−1個の特徴量による判別関数(式3)を求め、上述したように係数を求めて、該係数を用いた特徴量の検定を行う。このように、係数の学習と貢献度の検定を繰り返すことで、特徴量の選択を行うことができる。また、どの特徴量が有効であるかを調べることができる。以上に示したように、学習処理部14は、カット部分、非カット部分が既知の映像データを基に、より正確なカット検出を行う判別関数を生成する為の学習処理を行う。
【0033】
次に、検出処理部15について、以下に説明する。情報抽出処理部19は、映像データベース12aより参照する映像データより、判別関数生成処理部17が生成した判別関数(式3)に代入する特徴量(xi1、xi2、xi3、xi4)についての特徴情報を抽出する。判別関数計算処理部20は、特徴情報に含まれる特徴量を判別関数(式3)へ代入し計算する。カット部分識別処理部21は、判別関数計算処理部20の計算結果を基に、カット部分であるか非カット部分であるかを識別する。以上により、検出処理部15は、判別関数(式3)を用いて映像データベース12aより参照する映像データの各フレーム間に対してカット部分、非カット部分を識別してカット検出を行う。
【0034】
次に、上述した4つの特徴項目の特徴量を抽出する情報抽出処理部19の内部の概略構成について図を用いて説明する。
図2は、本発明の第一の実施形態における情報抽出処理部19の内部の概略構成を示すブロック図である。図に示すように、19aは、映像データのフレームを所定数のブロック(区画)に分割し、各ブロックにおいてフレーム間の動きベクトルを算出するベクトル算出処理部である。19bは、フレーム間において算出したブロック毎の動きベクトルを、8方向に分類して、各方向に分類されたブロックの数を累計した、方向別のブロック数のヒストグラムである“動き方向ヒストグラム”(方向別区画数)を算出する分類区画数累計処理部である。
【0035】
19cは、フレーム間の“動き方向ヒストグラム”と、該フレーム間に対して一つ前のフレーム間の“動き方向ヒストグラム”との方向別の差分を求め、該差分の絶対値の和である絶対値差分和を算出する絶対値差分量算出処理部である。以上のベクトル算出処理部19aおよび分類区画数累計処理部19bおよび絶対値差分量算出処理部19cの処理により、情報抽出部19は、特徴項目“動き方向ヒストグラムの絶対値差分和”の特徴量xi4を映像データより抽出する。
【0036】
ここで、上述した“動き方向ヒストグラムの絶対値差分和”の特徴量を判別関数の変数とすることが、映像データにおける「カット部分」と「動きの激しいシーン」とを精度よく判別するのに有効であることを以下に説明する。
図8は本発明の第一の実施形態における“動き方向ヒストグラムの絶対値差分和”の有効性を示す図である。図において、飛行機は右方向へ飛行しており、上の3フレームは「カット部分」のある3フレームであり、下の3フレームは「動きの激しいシーン」の3フレームである。
【0037】
符号81は、カット検出の対象の映像データにおいてn番目(nは任意の自然数)のフレームであるnフレームである。同様に、82、83は、n+1フレーム、n+2フレームである。84は、nフレーム81とn+1フレーム82より、抽出した各ブロックの動きベクトルを、方向別にしてブロック数を累計したヒストグラムである。同様に、85は、n+1フレーム82とn+2フレーム83より、抽出した各ブロックの動きベクトルを、方向別にしてブロック数を累計したヒストグラムである。86は、ヒストグラム84とヒストグラム85の絶対値差分を方向別に求めたヒストグラムである。
【0038】
ここで、n+1フレーム82とn+2フレーム83は、全く異なる映像であり、このフレーム間はカット部分である。この時、図に示すように、ヒストグラム85は、全方向に不規則な動きベクトルが生じたことを表すものとなる。そのため、ヒストグラム86は、図に示すようなヒストグラムとなる。すなわち、ヒストグラム86の全方向の合計(絶対値差分和)が大きな値となる。
【0039】
同様に、91、92、93は、m、m+1、m+2番目(mは任意の自然数)のフレームである。94は、mフレーム91とm+1フレーム92より抽出した各ブロックの動きベクトルを基に算出したヒストグラムである。95は、m+1フレーム92とm+2フレーム93より抽出した各ブロックの動きベクトルを基に算出したヒストグラムである。96は、ヒストグラム94とヒストグラム95の絶対値差分を方向別に求めたヒストグラムである。
【0040】
ここで、m+1フレーム92とm+2フレーム93は、連続する映像であり、このフレーム間は非カット部分である。この時、図に示すように、ヒストグラム94とヒストグラム95は、右方向に大きな動きベクトルが生じたことを表すものとなる。そのため、ヒストグラム96は、図に示すようなヒストグラムとなる。すなわち、ヒストグラム96の全方向の合計(絶対値差分和)が小さな値となる。
【0041】
以上に示したように、“動き方向ヒストグラムの絶対値差分和”は、映像データにおける「カット部分」の場合は大きな値になり、「動きの激しいシーン」の場合は小さな値となる。これにより、“動き方向ヒストグラムの絶対値差分和”の特徴量を判別関数の変数とすることで、映像データにおける「カット部分」と「動きの激しいシーン」とを精度よく判別することができる。
【0042】
19dは、特徴項目“輝度の絶対値差分の平均値”の特徴量xi1を映像データより抽出する輝度絶対値差分算出処理部である。19eは、特徴項目“輝度ヒストグラムの絶対値差分値”の特徴量xi2を映像データより抽出する輝度ヒストグラム差分算出処理部である。19fは、特徴項目“画面全体の平均動きベクトル長”の特徴量xi3を映像データより抽出する動きベクトル長算出処理部である。以上、情報抽出処理部19の概略構成を説明したが、この限りではなく、上述した種々の特徴項目の特徴量を抽出する処理部を具備して好適である。また、特徴情報抽出処理部16においては、同様の特徴量を抽出する処理部を具備してもよく、共用可能であれば情報抽出処理部19と処理部を共用してもよい。
【0043】
次に、上述したカット検出装置10の動作について図を用いて説明する。
まず、学習処理部14の動作についての説明を以下に示す。図3は、本発明の第一の実施形態におけるカット検出装置10の学習動作を示すフロー図である。まず、学習情報データベース12bよりカット部分が既知の映像データを読み出し、特徴情報抽出処理部16は、設定した四つの特徴項目について、特徴量(xi1、xi2、xi3、xi4)の抽出を行う(ステップS20)。次に、判別関数生成処理部17は、該特徴量(xi1、xi2、xi3、xi4)とカット部分か非カット部分かの情報を含む特徴情報を基に、係数(a1〜a4)を求めて判別関数(式3)を生成する(ステップS21)。
【0044】
次に、係数検定処理部18は、判別関数生成処理部17が生成した判別関数の各係数(a1〜a4)に対応する特徴量のF分布値および貢献度“Fp,j”を算出し比較することで、カット検出への貢献度(有意な係数であるか)を検定する(ステップS22)。ここで、全ての係数が有意と判断されなかった場合(ステップS22のNO)、最も有意でなかった係数に対応する特徴項目を削除する(ステップS23)。次に、判別関数生成処理部17が、残りの特徴項目に対応する特徴量を基に係数を求めるステップS21へ戻る。また、全ての係数(a1〜a4)が有意と判断された場合(ステップS22のYES)、学習処理部14は、該係数を含む判別関数(式3)を、検出処理部15におけるカット部分の検出処理に用いる判別関数と決定する(ステップS24)。
【0045】
以上により、学習処理部14は、“動き方向ヒストグラムの絶対値差分和”の特徴量を変数として含み、カット部分の識別に貢献している特徴量のみを用いた判別関数を生成することができる。尚、係数の有意性の検定は、上記の限りではなく、カット検出の判別に、各々の特徴量が貢献しているかどうかを検定する種々の方法を用いて好適である。また、上記では判別関数の決定の方法として、変数減少法を用いたがこの限りではない。
【0046】
次に、検出処理部15の動作について説明する。図4は、本発明の第一の実施形態におけるカット検出装置10のカット検出動作を示すフロー図である。まず、映像データベース12aよりカット部分、非カット部分が未知の映像データを読み出し、最初のフレーム間(サンプル1)について情報抽出処理部19は、学習処理部14が決定した判別関数(式3)に代入すべき特徴量(x11、x12、x13、x14)を抽出する(ステップS30)。この時、輝度絶対値差分算出処理部19dが、“輝度の絶対値差分の平均値”の特徴量x11を算出する。また、輝度ヒストグラム差分算出処理部19eが、“輝度ヒストグラムの絶対値差分値”の特徴量x12を算出する。また、動きベクトル長算出処理部19fが、“画面全体の平均動きベクトル長”の特徴量x13を算出する。
【0047】
次に、“動き方向ヒストグラムの絶対値差分和”の特徴量xi4の抽出方法について図を用いて説明する。図5は、本発明の第一の実施形態におけるカット検出装置10の“動き方向ヒストグラムの絶対値差分和”の特徴量xi4の抽出動作を示すフロー図である。まず、ベクトル算出処理部19aが、映像データのフレームを所定数のブロック(区画)に分割し、各ブロックにおいてフレーム間の動きベクトルを算出する(ステップS30a)。次に、分類区画数累計処理部19bは、フレーム間において算出したブロック毎の動きベクトルを、8方向に分類して、各方向に分類されたブロックの数を累計した、方向別のブロック数のヒストグラムである“動き方向ヒストグラム”を算出する(ステップS30b)。
【0048】
次に、絶対値差分量算出処理部19cは、分類区画数累計処理部19bの算出したフレーム間の“動き方向ヒストグラム”と、該フレーム間に対して一つ前のフレーム間の“動き方向ヒストグラム”との方向別の差分を求め、該差分の絶対値の和である絶対値差分和を算出する(ステップS30c)。以上により、情報抽出処理部19は、“動き方向ヒストグラムの絶対値差分和”の特徴量xi4を映像データより抽出する。
【0049】
次に、判別関数計算処理部20は、決定した判別関数(式3)へ抽出した特徴量を代入しf1を計算する(ステップS31)。次に、カット部分識別処理部21は、判別関数計算処理部20の計算結果f1を基に、カット部分である(f1がプラス値)か、非カット部分である(f1がマイナス値)かを識別する(ステップS32)。次に、上記の処理がカット検出中の映像データにおける最後のフレーム間についての処理でない場合(ステップS33のNO)、次のフレーム間(サンプル2)を処理する為、ステップS30へ戻る。
【0050】
以上の処理をサンプル3、4、…と繰り返すことにより、大量のフレーム数となる映像データのカット検出を行う。また、上記の処理がカット検出中の映像データにおける最後のフレーム間についての処理であった場合(ステップS33のYES)、カット検出の処理を終了する。以上により、検出処理部15は、“動き方向ヒストグラムの絶対値差分和”を変数とする判別関数を用いて映像データよりカット検出を行うことができる。
【0051】
次に、上述した本発明の実施形態に必須の特徴項目である“動き方向ヒストグラムの絶対値差分和”と合わせて判別関数に用いて効果的な特徴項目について説明する。“動き方向ヒストグラムの絶対値差分和”と合わせて判別関数の特徴量として抽出して効果的な特徴項目は“画面全体の平均動きベクトルの長”である。この“画面全体の平均動きベクトルの長”のみを特徴項目として判別関数に用いると、カット部分を見逃すことは少ないが、「動きの激しいシーン」をカット部分として誤検出する場合が多い。そこで、「動きの激しいシーン」の誤検出を防ぐための特徴項目“動き方向ヒストグラムの絶対値差分和”を加えた判別関数を用いることで飛躍的に誤検出を減らすことができる。
【0052】
ここで、「動きの激しいシーン」の多い映像データの約1500個のカット部分を検出する実験例を以下に示す。“画面全体の平均動きベクトルの長”のみが特徴項目の判別関数を用いてカット検出を行うと、約3000個をカット部分として検出した。すなわち、3000個のうち1500個は誤検出である。ここで上述した“動き方向ヒストグラムの絶対値差分和”を加えた2つを特徴項目とする判別関数を用いると、約1550個程度をカット部分として検出した。つまり、誤検出は50個程度であり、“動き方向ヒストグラムの絶対値差分和”を加える前に比べて飛躍的に誤検出を減らす効果が得られる。
【0053】
また、上述した“画面全体の平均動きベクトルの長”、“動き方向ヒストグラムの絶対値差分和”に、“ブロック色ヒストグラムの絶対値差分和”を特徴項目として加えると、更に高精度に判別関数によるカット検出を行うことができる。なぜなら、“画面全体の平均動きベクトルの長”、“動き方向ヒストグラムの絶対値差分和”の特徴項目による判別関数では、薄暗いシーンでのカット部分の見逃してしまう場合があるが、“ブロック色ヒストグラムの絶対値差分和”を特徴項目として加えることで、フレーム全体の色の変化を特徴量として抽出できるため、薄暗いシーンのため動きベクトル検出の精度が悪くなっても、色を比較することでカット部分の見逃しを減らすことができる。
【0054】
また、効果の具体例として、判別関数の評価項目として、“ブロックRGB値の絶対値差分の合計の平均値”、“ブロックRGB値の絶対値差分の合計の分散値”、“ブロック色ヒストグラムの絶対値差分和”、“画面全体の平均動きベクトル長”、“動き方向ヒストグラムの絶対値差分和”、“動きベクトルの長さの分散”を用いて、映像データ(ニュース番組)を処理した結果、適合率=(検出した正解カット数/検出した全カット数)×100が86.7%である。また、上述した特徴項目より“動き方向ヒストグラムの絶対値差分和”を削除した判別関数の場合は適合率が57.4%であった。すなわち、“動き方向ヒストグラムの絶対値差分和”を変数に含む判別関数を用いることで、カット検出の精度の良さを示す適合率が約29%向上する成果が得られた。
【0055】
次に、本発明の第二の実施形態として、SVM(Support Vector Machine)という識別手法の識別関数を用いたカット検出装置の概略構成について図を用いて説明する。
図9は、本発明の第二の実施形態として、SVMという識別手法の識別関数を用いたカット検出装置の概略構成を示すブロック図である。この図において符号60は、SVMという識別手法の識別関数を用いて、映像データよりカット部分を検出するカット検出装置である。尚、カット検出装置60のデータベース12は上述した図1に示したデータベース12と同様の構成であり、説明を省略する。
【0056】
尚、カット検出装置60は、カット検出の対象となる映像データを取得する場合に、映像データベース12aより読み出す方法に限らない。即ち、映像データベース12aは、必ずしもカット検出装置60が具備する必要はない。他の方法として、カット検出装置60は、処理する映像データを、通信ネットワーク経由で取得しても、CD−ROM等の記録媒体より読み取っても好適である。61は、カット検出装置60内のデータを制御する制御部である。
【0057】
次に、処理プログラム部62について構成を説明する。処理プログラム部62には、学習情報データベース12bに格納されるカット部分、非カット部分が既知の“映像データ”を基に、識別関数を決定する為の学習処理を行う学習処理部63と、映像データベース12aに格納されるカット部分、非カット部分が未知の映像データを基に、カット部分を検出する検出処理部64から成る。
尚、本実施形態の識別関数とは、非線形SVMという識別手法に用いられる関数である。また、本発明の識別関数は、上述した識別関数に限定されるものではなく、多変量解析やパターン認識に用いる種々の識別関数を用いて好適である。
【0058】
上記非線形SVMという識別手法に用いられる識別関数について一例を示して更に説明する。対象となるサンプルより抽出した特徴量(xi1、xi2、xi3、xi4)から、特徴ベクトルxi(以下、Xiとする)が求まる。この時に、Xiを変数とする識別関数f(Xi)は、以下の(式4)で表される
【数2】
Figure 0003648199
以上の(式4)において、
φ:非線形関数
重みベクトルw=(w1、w2、w3、…wd):重みベクトル(dは次元数)
j:サポートベクトルの数(1〜n)
サポートベクトルxj=(x1j、x2j、x3j、…xdj) :サポートベクトルyj:サポートベクトルxjがカット部分の時=1、非カット部分の時=−1
λj:正の乗数
K:カーネル関数
*:識別関数の定数項
【0059】
この(式4)にi番目のフレーム間から抽出したXi(特徴ベクトルxi)を入力することで識別関数f(Xi)の値を求める。
f(Xi)≧1なら、映像データのi番目のフレーム間はカット部分である。f(Xi)≦−1なら、映像データのi番目のフレーム間は非カット部分である。
以上のように、(式4)に示した識別関数f(Xi)を用いてカット部分を識別する。また、(式4)の識別関数に入力する特徴量は上述した限りではなく、(式1)において説明した種々の特徴項目を用いてよい。また、特徴項目の内容、数、組み合わせも、精度よく映像データよりカット検出するために適時変更して好適である。
【0060】
次に、学習処理部63について説明する。特徴情報抽出処理部65は、上述した特徴情報抽出処理部16と同様に4つの特徴項目について、学習情報データベース12bより読み出したカット部分、非カット部分が既知の“映像データ”より特徴量(xi1、xi2、xi3、xi4)を含む特徴情報抽出する。尚、特徴情報抽出処理部65は、上述したベクトル算出処理部19a、分類区画数累計処理部19b、絶対値差分量算出処理部19c、輝度絶対値差分算出処理部19d、輝度ヒストグラム差分算出処理部19e、動きベクトル長算出処理部19fを具備する。次に、特徴情報抽出処理部65は、抽出したカット部分、非カット部分における特徴情報を基に、特徴ベクトルであるXiを算出する。
【0061】
また、識別関数決定処理部66は、情報抽出処理部65が算出したXiの中より識別関数すなわち識別境界を決めるサポートベクトルxj(以下、Xjとする)を抽出し、λj、b*の値を決定する。以上により、識別関数決定処理部66は、(式4)に示す識別関数を決定する。
【0062】
次に、検出処理部64について、以下に説明する。情報抽出処理部67は、上述した情報抽出処理部19の動作と同様に映像データベース12aより参照する映像データより、特徴量(xi1、xi2、xi3、xi4)を含む特徴情報を抽出する。すなわち、情報抽出処理部67は、上述したベクトル算出処理部19a、分類区画数累計処理部19b、絶対値差分量算出処理部19c、輝度絶対値差分算出処理部19d、輝度ヒストグラム差分算出処理部19e、動きベクトル長算出処理部19fを具備する。次に、情報抽出処理部67は、抽出した特徴情報を基に識別関数決定処理部66が生成した識別関数(式4)に代入する特徴ベクトルXiを算出する。
【0063】
識別関数計算処理部68は、情報抽出処理部67が算出した特徴ベクトルXiを識別関数(式4)へ代入し計算する。カット部分識別処理部69は、識別関数計算処理部68の計算結果を基に、カット部分であるか非カット部分であるかを識別する。以上により、検出処理部64は、識別関数(式4)を用いて映像データベース12aより参照する映像データの各フレーム間に対してカット部分、非カット部分を識別してカット検出を行う。
【0064】
尚、図1および図9に示した各処理部は専用のハードウェアにより実現されるものであってもよく、また、各処理部はメモリおよびCPU(中央演算装置)により構成され、各処理部の機能を実現する為のプログラムをメモリにロードして実行することによりその機能を実現させるものであってもよい。
また、上記メモリは、ハードディスク装置や光磁気ディスク装置、フラッシュメモリ等の不揮発性のメモリや、CD−ROM等の読み出しのみが可能な記録媒体、RAM(Random Access Memory)のような揮発性のメモリ、あるいはこれらの組み合わせによるコンピュータ読み取り、書き込み可能な記録媒体より構成されるものとする。
【0065】
次に、上述したカット検出装置60の動作について図を用いて説明する。
まず、学習処理部63の動作についての説明を以下に示す。図10は、本発明の第二の実施形態におけるカット検出装置60の学習動作を示すフロー図である。まず、学習情報データベース12bよりカット部分が既知の映像データを読み出し、特徴情報抽出処理部65は、設定した四つの特徴項目について、特徴量(xi1、xi2、xi3、xi4)を含む特徴情報の抽出を行う(ステップS60)。特徴情報抽出処理部65は、抽出した特徴情報を基に、特徴ベクトルXiを算出する(ステップS61)。次に、識別関数決定処理部66は、情報抽出処理部65が算出したXiの中よりサポートベクトルXjを抽出し(式4)のλj、b*の値を決定することで、識別関数(式4)を生成する。(ステップS62)。
【0066】
以上により、学習処理部63は、“動き方向ヒストグラムの絶対値差分和”の特徴量を変数として含む特徴量を用いた、カット部分を識別するための識別関数を、学習処理により生成することができる。
【0067】
次に、検出処理部64の動作について説明する。図11は、本発明の第二の実施形態におけるカット検出装置60のカット検出動作を示すフロー図である。まず、映像データベース12aよりカット部分、非カット部分が未知の映像データを読み出し、最初のフレーム間(サンプル1)について情報抽出処理部67は、特徴量(x11、x12、x13、x14)を含む特徴情報の抽出を行う(ステップS70)。この時、輝度絶対値差分算出処理部19dが、“輝度の絶対値差分の平均値”の特徴量x11を算出する。また、輝度ヒストグラム差分算出処理部19eが、“輝度ヒストグラムの絶対値差分値”の特徴量x12を算出する。また、動きベクトル長算出処理部19fが、“画面全体の平均動きベクトル長”の特徴量x13を算出する。また、ベクトル算出処理部19aおよび分類区画数累計処理部19bおよび絶対値差分量算出処理部19cが“動き方向ヒストグラムの絶対値差分和”の特徴量xi4を算出する。
【0068】
次に、情報抽出処理部67は、学習処理部63が生成した識別関数(式4)に代入するために、抽出した特徴情報を基にサンプル1の特徴ベクトルであるX1を算出する(ステップS71)。次に、識別関数計算処理部68は、情報抽出処理部67が算出した特徴ベクトルX1を識別関数(式4)へ代入しf(X1)を計算する(ステップS72)。次に、カット部分識別処理部69は、識別関数計算処理部68の計算結果f(X1)を基に、サンプル1がカット部分(f(Xi)≧1)であるか、非カット部分(f(Xi)≦−1)であるかを識別する(ステップS73)。次に、上記の処理がカット検出中の映像データにおける最後のフレーム間についての処理でない場合(ステップS74のNO)、次のフレーム間(サンプル2)を処理する為、ステップS70へ戻る。
【0069】
以上の処理をサンプル3、4、…と繰り返すことにより、大量のフレーム数となる映像データのカット検出を行う。また、上記の処理がカット検出中の映像データにおける最後のフレーム間についての処理であった場合(ステップS74のYES)、カット検出の処理を終了する。以上により、検出処理部64は、“動き方向ヒストグラムの絶対値差分和”を特徴量として含む特徴ベクトルXiを変数とする識別関数(式4)を用いて映像データよりカット検出を行うことができる。
【0070】
尚、判別関数生成処理部17または識別関数決定処理部66は、映像データの内容(以下、カテゴリとする)別(各種のスポーツ中継、ニュース、ドラマなど)に判別関数または識別関数を生成して好適である。これにより、カテゴリ別の映像データに特徴的なシーンをカット部分または非カット部分として検出するのに有効な特徴項目を変数とする判別関数または識別関数を生成できる。また、検出処理部15または検出処理部64においては、まず、映像データのカテゴリを判別し、該カテゴリ用の判別関数または識別関数を用いて該映像データのカット検出を行う。これにより、より精度のよいカット検出を行うことができる。
【0071】
また、図1および図9において各種処理を行う処理部の機能を実現する為のプログラムをコンピュータ読み取り可能な記録媒体に記録して、この記録媒体に記録されたプログラムをコンピュータシステムに読み込ませ、実行することにより各処理を行っても良い。なお、ここでいう「コンピュータシステム」とは、OSや周辺機器等のハードウェアを含むものとする。
また、「コンピュータシステム」とは、WWWシステムを利用している場合であれば、ホームページ提供環境(あるいは表示環境)も含むものとする。
【0072】
また、「コンピュータ読み取り可能な記録媒体」とは、フレキシブルディスク、光磁気ディスク、ROM、CD−ROM等の可搬媒体、コンピュータシステムに内蔵されるハードディスク等の記憶装置のことをいう。さらに「コンピュータ読み取り可能な記録媒体」とは、インターネット等のネットワークや電話回線等の通信回線を介してプログラムが送信された場合のサーバやクライアントとなるコンピュータシステム内部の揮発メモリ(RAM)のように、一定時間プログラムを保持しているものも含むものとする。
【0073】
また、上記プログラムは、このプログラムを記憶装置等に格納したコンピュータシステムから、伝送媒体を介して、あるいは、伝送媒体中の伝送波により他のコンピュータシステムに伝送されてもよい。ここで、プログラムを伝送する「伝送媒体」は、インターネット等のネットワーク(通信網)や電話回線等の通信回線(通信線)のように情報を伝送する機能を有する媒体のことをいう。
【0074】
また、上記プログラムは、前述した機能の一部を実現する為のものであっても良い。さらに、前述した機能をコンピュータシステムに既に記録されているプログラムとの組み合わせで実現できるもの、いわゆる差分ファイル(差分プログラム)であっても良い。
以上、この発明の実施形態について図面を参照して詳述してきたが、具体的な構成はこの実施形態に限られるものではなく、この発明の要旨を逸脱しない範囲の設計等も含まれる。
【0075】
【発明の効果】
以上、説明したように、本発明によるカット検出装置においては、連続するフレームから成る映像データの時間変化の中よりカット部分を検出するカット検出装置であって、フレームを所定数の区画に分割し、各区画においてフレーム間の動きベクトルを算出するベクトル算出手段と、フレーム間において算出した区画毎の動きベクトルを、所定数の方向に分類して、各方向に分類された動きベクトルと対応する区画の数を累計して方向別区画数を算出する分類区画数累計手段と、フレーム間の方向別区画数と、該フレーム間に対して前または後のフレーム間の方向別区画数との方向別の差分を求め、該差分の絶対値の和である絶対値差分量を算出する絶対値差分量算出手段と、算出した絶対値差分量を基に、映像データよりカット部分を検出するカット部分検出手段とを具備するので、映像データのフレーム間より抽出した動きベクトルの方向別の方向別区画数(ヒストグラム)の絶対値差分量を考慮したカット検出を行うことができる。
【0076】
これにより、映像データより「動きの激しいシーン」を「カット部分」と誤検出する確率を低減したカット検出を行うことができる。また、映像データよりカット部分を自動で検出できることは、表示手段によりカット部分の画像の一覧を表示できるので、映像データに含まれている多数のシーンの全体像を簡便に把握することができる。さらには、ネットワーク上で映像データを配信する際に、該映像データの内容を、シーン単位で検索し、シーン単位で配信するシステムを簡便に構築することも可能となる。
【0077】
また、本発明によるカット検出装置においては、上記ベクトル算出手段と、上記分類区画数累計手段と、上記絶対値差分量算出手段とを備え、映像データより上記絶対値差分量を含む複数の特徴項目についての特徴量である特徴情報を抽出する情報抽出手段を更に具備し、上記カット部分検出手段は、特徴情報に含まれる特徴量を識別関数へ代入計算する識別関数計算手段と、識別関数計算手段の計算結果を基に、カット部分であるかどうかを識別するカット部分識別手段とを具備するので、動きベクトルの方向別の方向別区画数(ヒストグラム)の絶対値差分量を特徴量として映像データより抽出し、該特徴量を変数とする識別関数を用いてカット部分であるか非カット部分であるかの識別を行うことができる。
【0078】
これにより、映像データより抽出した複数の特徴項目に任意の重み付けを付与して処理できるので、各特徴項目の重み付けに応じて、全ての特徴項目を考慮したカット検出を行うことができる。
【0079】
また、本発明によるカット検出装置においては、カット部分が既知である映像データから、絶対値差分量を含む複数の特徴項目についての特徴量を抽出し、特徴量とカット部分および非カット部分のどちらから抽出したか識別する情報とを含めて特徴情報とする特徴情報抽出手段と、特徴情報を基に識別関数の係数を求め、識別関数を生成する識別関数生成手段とを更に具備するので、動きベクトルの方向別の方向別区画数(ヒストグラム)の絶対値差分量を少なくとも含む特徴項目を用いて、映像データのカット部分の特徴量と、非カット部分の特徴量の違いを基に識別関数を生成できる。
【0080】
これにより、識別に貢献している特徴量を変数とする識別関数を生成することができる。以上により、簡便に精度のよいカット検出を行うことができる。
【0081】
また、本発明によるカット検出装置においては、識別関数生成手段の生成した識別関数の係数が、有意なものか所定の計算式により検定する係数検定手段を更に具備し、上記係数検定手段が、有意でないと検定した係数がある場合、識別関数生成手段は、有意でないと検定された係数に対応する特徴情報を除いた特徴情報を基に、識別関数の係数を求め、識別関数を生成するので、生成した識別関数の係数が、有意なものであるか統計的に判別を行う所定の計算式を用いて計算することで、係数の有意について検定することができる。また、種々の特徴項目よりカット検出に有効でない特徴項目を削除して、有効な特徴項目のみに絞り込んだ識別関数を生成することができる。
これにより、映像データの内容に合わせて、より精度よくカット検出を行うように、映像データの内容別に、特徴項目の違う識別関数を生成することができる。
【0082】
また、本発明によるカット検出装置においては、上記識別関数として判別関数を用いるので、識別に貢献する特徴量のみを用いた判別関数でカット部分の検出しを行うことができる。
これにより、簡便に高精度な判別が期待できる判別器である線形判別分析を用いて、カット部分および非カット部分の検出を行うことができる。
【図面の簡単な説明】
【図1】 本発明の第一の実施形態による識別関数として判別関数を用いたカット検出装置の概略構成を示すブロック図である。
【図2】 本発明の第一の実施形態における情報抽出処理部19の内部の概略構成を示すブロック図である。
【図3】 本発明の第一の実施形態におけるカット検出装置10の学習動作を示すフロー図である。
【図4】 本発明の第一の実施形態におけるカット検出装置10のカット検出動作を示すフロー図である。
【図5】 本発明の第一の実施形態におけるカット検出装置10の“動き方向ヒストグラムの絶対値差分和”の特徴量xi4の抽出動作を示すフロー図である。
【図6】 本発明の第一の実施形態における学習情報データベース12bの構成例を示す図である。
【図7】 本発明の第一の実施形態によるカット検出装置10が映像データより抽出する特徴量を示す図である。
【図8】 本発明の第一の実施形態における“動き方向ヒストグラムの絶対値差分和”の有効性を示す図である。
【図9】 本発明の第二の実施形態によるSVMという識別手法の識別関数を用いたカット検出装置の概略構成を示すブロック図である。
【図10】 本発明の第二の実施形態におけるカット検出装置60の学習動作を示すフロー図である。
【図11】 本発明の第二の実施形態におけるカット検出装置60のカット検出動作を示すフロー図である。
【符号の説明】
10、60 カット検出装置
11、61 制御部
12 データベース
12a 映像データベース
12b 学習情報データベース
13、62 処理プログラム部
14、63 学習処理部
15、64 検出処理部
16、65 特徴情報抽出処理部
17 判別関数生成処理部
18 係数検定処理部
19、67 情報抽出処理部
19a ベクトル算出処理部
19b 分類区画数累計処理部
19c 絶対値差分量算出処理部
19d 輝度絶対値差分算出処理部
19e 輝度ヒストグラム差分算出処理部
19f 動きベクトル長算出処理部
20 判別関数計算処理部
21、69 カット部分識別処理部
66 識別関数決定処理部
68 識別関数計算処理部

Claims (6)

  1. 連続するフレームから成る映像データの時間変化の中よりカット部分を検出するカット検出装置であって、
    前記フレームを所定数の区画に分割し、各区画において前記フレーム間の動きベクトルを算出するベクトル算出手段と、
    前記フレーム間において算出した前記区画毎の動きベクトルを、所定数の方向に分類して、各方向に分類された前記動きベクトルと対応する前記区画の数を累計して方向別区画数を算出する分類区画数累計手段と、
    前記フレーム間の前記方向別区画数と、該フレーム間に対して前または後のフレーム間の前記方向別区画数との方向別の差分を求め、該差分の絶対値の和である絶対値差分量を算出する絶対値差分量算出手段と、
    算出した前記絶対値差分量を基に、前記映像データより前記カット部分を検出するカット部分検出手段と
    を具備することを特徴とするカット検出装置。
  2. 前記ベクトル算出手段と、前記分類区画数累計手段と、前記絶対値差分量算出手段とを備え、前記映像データより前記絶対値差分量を含む複数の特徴項目についての特徴量である特徴情報を抽出する情報抽出手段を更に具備し、
    前記カット部分検出手段は、
    前記特徴情報に含まれる特徴量を識別関数へ代入計算する識別関数計算手段と、
    前記識別関数計算手段の計算結果を基に、前記カット部分であるかどうかを識別するカット部分識別手段と
    を具備することを特徴とする請求項1に記載のカット検出装置。
  3. カット部分が既知である映像データから、前記絶対値差分量を含む複数の特徴項目についての特徴量を抽出し、前記特徴量とカット部分および非カット部分のどちらから抽出したか識別する情報とを含めて特徴情報とする特徴情報抽出手段と、
    前記特徴情報を基に前記識別関数の係数を求め、前記識別関数を生成する識別関数生成手段と
    を更に具備することを特徴とする請求項2に記載のカット検出装置。
  4. 前記識別関数生成手段の生成した前記識別関数の係数が、有意なものか所定の計算式により検定する係数検定手段を更に具備し、
    前記係数検定手段が、有意でないと検定した係数がある場合に、前記識別関数生成手段は、有意でないと検定された係数に対応する特徴情報を除いた特徴情報を基に、前記識別関数の係数を求め、前記識別関数を生成する
    ことを特徴とする請求項2または請求項3に記載のカット検出装置。
  5. 前記識別関数として判別関数を用いることを特徴とする請求項2から請求項4のいずれかに記載のカット検出装置。
  6. 連続するフレームから成る映像データの時間変化の中よりカット部分を検出するカット検出方法のプログラムであって、
    前記フレームを所定数の区画に分割し、各区画において前記フレーム間の動きベクトルを算出するステップと、
    前記フレーム間において算出した前記区画毎の動きベクトルを、所定数の方向に分類して、各方向に分類された前記区画の数を累計して方向別区画数を算出するステップと、
    前記フレーム間の前記方向別区画数と、該フレーム間の前または後のフレーム間の前記方向別区画数との方向別の差分を求め、該差分の絶対値の和である絶対値差分量を算出するステップと、
    算出した前記絶対値差分量を基に、前記映像データより前記カット部分を検出するステップと
    をコンピュータへ実行させるためのプログラム。
JP2001398233A 2001-12-27 2001-12-27 カット検出装置およびそのプログラム Expired - Fee Related JP3648199B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2001398233A JP3648199B2 (ja) 2001-12-27 2001-12-27 カット検出装置およびそのプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2001398233A JP3648199B2 (ja) 2001-12-27 2001-12-27 カット検出装置およびそのプログラム

Publications (2)

Publication Number Publication Date
JP2003196662A JP2003196662A (ja) 2003-07-11
JP3648199B2 true JP3648199B2 (ja) 2005-05-18

Family

ID=27603749

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001398233A Expired - Fee Related JP3648199B2 (ja) 2001-12-27 2001-12-27 カット検出装置およびそのプログラム

Country Status (1)

Country Link
JP (1) JP3648199B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009273539A (ja) * 2008-05-13 2009-11-26 Research Organization Of Information & Systems イメージングデータからの状態変化抽出方法、状態変化の可視化システム、および、コンピュータプログラム

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2007142646A1 (en) * 2006-06-08 2007-12-13 Thomson Licensing Scene change detection for video
JP4835540B2 (ja) * 2007-08-15 2011-12-14 ソニー株式会社 電子機器、映像特徴検出方法及びプログラム
JP5149033B2 (ja) * 2008-02-26 2013-02-20 岐阜車体工業株式会社 動作解析方法及び動作解析装置並びにその動作解析装置を利用した動作評価装置
JP5196425B2 (ja) * 2008-03-07 2013-05-15 Kddi株式会社 サポートベクトルマシンの再学習方法
KR101667011B1 (ko) * 2011-11-24 2016-10-18 에스케이플래닛 주식회사 입체 영상의 장면 전환 검출 장치 및 방법
CN106937114B (zh) * 2015-12-30 2020-09-25 株式会社日立制作所 用于对视频场景切换进行检测的方法和装置

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0636026A (ja) * 1992-07-13 1994-02-10 Toshiba Corp 動画像処理装置
US6597738B1 (en) * 1999-02-01 2003-07-22 Hyundai Curitel, Inc. Motion descriptor generating apparatus by using accumulated motion histogram and a method therefor
JP3899727B2 (ja) * 1999-03-31 2007-03-28 ソニー株式会社 画像再生装置
JP2001061131A (ja) * 1999-08-20 2001-03-06 Canon Inc 画像記録装置、方法及びコンピュータ読み取り可能な記憶媒体
JP2001309374A (ja) * 2000-04-25 2001-11-02 Matsushita Electric Ind Co Ltd 可変ビットレート符号化装置および記録装置

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009273539A (ja) * 2008-05-13 2009-11-26 Research Organization Of Information & Systems イメージングデータからの状態変化抽出方法、状態変化の可視化システム、および、コンピュータプログラム

Also Published As

Publication number Publication date
JP2003196662A (ja) 2003-07-11

Similar Documents

Publication Publication Date Title
CN110858394B (zh) 一种图像质量评估方法、装置、电子设备及计算机可读存储介质
KR100737176B1 (ko) 신호 처리 방법 및 영상 음성 처리 장치
KR100799557B1 (ko) 동영상의 비주얼 특징을 이용한 유해 동영상 판별함수 생성및 판별 방법 그리고 그 장치
US9323785B2 (en) Method and system for mobile visual search using metadata and segmentation
JP5371083B2 (ja) 顔識別特徴量登録装置、顔識別特徴量登録方法、顔識別特徴量登録プログラム及び記録媒体
JP4719224B2 (ja) マルチモーダル識別のための客観評価に基づいた識別器組み合わせ
US9323841B2 (en) Method and apparatus for multi-dimensional content search and video identification
JP2006172437A (ja) データのストリームにおけるセグメント境界の位置の決定方法、データサブセットを近隣のデータサブセットと比較してセグメント境界を決定する方法、コンピュータによって実行可能な命令のプログラム、ならびにデータのストリームにおける境界及び非境界を識別するシステム又は装置
CN110418204B (zh) 基于微表情的视频推荐方法、装置、设备和存储介质
CN110688524A (zh) 视频检索方法、装置、电子设备及存储介质
CN111210399A (zh) 一种成像质量评价方法、装置及设备
JP2016191975A (ja) 機械学習装置
CN110610123A (zh) 一种多目标车辆检测方法、装置、电子设备及存储介质
CN111814846B (zh) 属性识别模型的训练方法、识别方法及相关设备
CN113963303A (zh) 图像处理方法、视频识别方法、装置、设备及存储介质
JP2010081453A (ja) 付帯情報付加装置及び方法
JP3648199B2 (ja) カット検出装置およびそのプログラム
JPWO2015146113A1 (ja) 識別辞書学習システム、識別辞書学習方法および識別辞書学習プログラム
CN118094118A (zh) 数据集质量评估方法、***、电子设备及存储介质
US11527091B2 (en) Analyzing apparatus, control method, and program
CN117058534A (zh) 基于元知识适应迁移网络的少样本遥感图像目标检测方法
KR101551879B1 (ko) 비교데이터 프루닝과 가우시안 혼합 모델의 유사도 추정을 이용한 유해 동영상 필터링 시스템 및 방법
CN111723719B (zh) 基于类别外部记忆的视频目标检测方法、***、装置
CN114329055A (zh) 搜索推荐方法及推荐装置、电子设备、存储介质
KR100981125B1 (ko) 동영상 처리 방법 및 그 장치

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20041109

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20041217

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20050201

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20050210

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080218

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090218

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100218

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100218

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110218

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120218

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120218

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130218

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140218

Year of fee payment: 9

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees