JPH1139325A - 類似検索方法及び類似検索システム - Google Patents

類似検索方法及び類似検索システム

Info

Publication number
JPH1139325A
JPH1139325A JP9195356A JP19535697A JPH1139325A JP H1139325 A JPH1139325 A JP H1139325A JP 9195356 A JP9195356 A JP 9195356A JP 19535697 A JP19535697 A JP 19535697A JP H1139325 A JPH1139325 A JP H1139325A
Authority
JP
Japan
Prior art keywords
search key
search
feature
feature amount
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP9195356A
Other languages
English (en)
Inventor
Toshiaki Akimoto
俊昭 秋元
Natsuki Oka
夏樹 岡
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP9195356A priority Critical patent/JPH1139325A/ja
Publication of JPH1139325A publication Critical patent/JPH1139325A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Image Analysis (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

(57)【要約】 【課題】 サンプル画像が検索意図を反映した同一のカ
テゴリとなるように学習で得られた結果を検索キーとし
て抽出し、検索効率を向上できることを目的とする。 【解決手段】 指定した2つ以上の検索キー候補映像を
含む複数の検索キー候補映像の特徴量を抽出する特徴量
抽出手段5200と、抽出された特徴量の重みを学習する特
徴量重み学習手段5400と、重みづけされた特徴量を神経
回路網モデルを用いて分類する自動分類手段5500と、分
類した結果を評価する分類結果評価手段5600と、カテゴ
リを代表する特徴量とその重みと入出力ユニットのリン
クの重みを検索キーとして抽出する検索キー抽出手段57
00とを備え、検索キー候補映像の中から指定した検索キ
ー候補映像が同一分類となるように学習により生成した
検索キーにより類似した画像と音からなる映像を検索す
るとから構成される。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、映像情報を記憶し
ている媒体から、利用者が求める場面に類似したサンプ
ル映像から学習により生成した検索キーにより映像情報
を検索する類似検索方法及び類似検索システムに関する
ものである。
【0002】
【従来の技術】近年、オーサリングシステムのように、
テキスト、静止画、サウンド、AVデータ等の様々なデ
ータを扱うシステムにおいて、利用者が望むデータを効
率良く獲得できる検索システムが望まれている。現在、
キーワードを組み合わせた明示的な検索方法以外に、あ
いまいな検索意図を検索に適用するための方法がいくつ
か提案されている。類似検索は、その一例であり、自分
の検索意図に適合したサンプルを検索キーとして、検索
キーに類似したデータを検索対象とする方法である。従
来、類似検索システムとしては、特開平9−44518
号公報に開示されたものが知られている。
【0003】図8は、従来の類似検索システムのブロッ
ク構成図であり、図9は従来の類似検索システムの処理
を説明するフローチャートである。図8において、画像
データベースに画像データを登録する画像データベース
登録モジュール4と、上記画像データベース1から検索
条件に合う画像データを検索する画像データベース検索
モジュール5と、ファジィルールを適用するファジィ推
論手段3とからなる。上記画像データベース登録モジュ
ール4は、画像データから画像の特徴ベクトルを抽出す
る特徴ベクトル抽出手段41と、上記特徴ベクトルを入
力し、ファジィルールを適用して高次の特徴ベクトルを
生成する高次特徴ベクトル生成手段42と、上記画像デ
ータの上記特徴ベクトルを入力し、ファジィルールを適
用して上記入力された特徴ベクトルをパターンに分類す
るパターン分類手段43とからなる。上記画像データベ
ース検索モジュール5は、上記画像データベース1に登
録された上記画像データの縮小アブストラクト画像を表
示し、上記表示された画像の中から検索用画像を選択
し、上記選択された画像の画像データに基づいて検索よ
うデータを生成する検索用データ生成手段51と、上記
検索用生成手段51により生成された上記検索用データ
を入力し、上記ファジィルールを適用して上記画像デー
タベース1に登録された画像データを検索するファジィ
検索手段52とからなる。
【0004】上記のように構成された従来の類似検索シ
ステムの動作を図9のフローチャートを用いて以下に説
明する。
【0005】検索用の画像から上記画像の特徴量を表わ
す第1の特徴ベクトルを抽出する特徴抽出処理(ステッ
プ10)と、上記画像の抽出された第1の特徴ベクトル
をファジィルールに従って階層的なカテゴリにパターン
分類するパターン分類処理(ステップ20)と、上記第
1の特徴ベクトルと上記分類されたパターンから登録用
データを生成し、画像データベースに登録する画像デー
タ登録処理(ステップ30)とからなる。順次に高次の
特徴ベクトルを抽出して、ステップ10からステップ3
0を繰り返し行なうことにより、階層的なパターン分類
が行われる。
【0006】更に、ファジィルールを用いて階層的なカ
テゴリにパターン分類された画像の特徴ベクトルに応じ
て、上記画像データベースに分類して登録された上記画
像データの縮小されたアブストラクト画像を表示する画
像表示処理(ステップ40)と、上記表示された画像の
中から検索対象画像と類似した少なくとも一つの画像を
選択する検索条件指定処理(ステップ50)と、上記選
択された少なくとも一つの画像の上記特徴ベクトルから
検索用データを生成する検索用データ生成処理(ステッ
プ60)と、上記生成された検索用データを検索条件と
して上記画像データベースをファジィルールに基づいて
検索し、上記検索用データに対応する上記画像データが
分類されたパターンを得るファジィ検索処理(ステップ
70)とからなる。
【0007】このように、ファジールールを用いて検索
キーを階層的にパターン分類し、ファジィ検索すること
によって、あいまいな検索を行なうことができる。
【0008】
【発明が解決しようとする課題】しかし、パターン分類
された結果は、特徴量とパターン分類方法により決定さ
れるものであり、必ずしも検索意図と一致した分類には
ならない。また、静止画や映像は、見方(検索意図)を
変えることによって複数のカテゴリに属することができ
るが、階層的な分類方法では、多様な見方に十分対応で
きない。つまり、検索キーに類似したデータは、カテゴ
リの多様性を反映して一意に決めることはできないの
で、従来の方法では効率良く検索することができない。
【0009】この類似検索システムにおいては、検索意
図を反映したカテゴリに相当する検索キーを抽出するこ
とが求められている。
【0010】本発明は、検索意図を特徴づける特徴量の
重み学習と、神経回路網モデルを用いた分類及び分類結
果の評価を繰り返すことにより、サンプル画像が検索意
図を反映した同一のカテゴリとなるように学習で得られ
た結果を検索キーとして抽出し、検索効率を向上できる
ことを目的とする。
【0011】
【課題を解決するための手段】この課題を解決するため
に本発明は、検索キーにより類似した映像を検索する類
似検索方法において、検索キー候補映像の中から指定し
た検索キー候補映像が同一分類となるように学習により
検索キーを生成するものである。
【0012】また、指定した2つ以上の検索キー候補映
像を含む複数の検索キー候補映像の特徴量を抽出する特
徴量抽出手段と、前記特徴量抽出手段で抽出された特徴
量に対して、指定された検索キー候補映像同士と指定さ
れた検索キー候補映像とそれ以外の検索キー候補映像の
組合せで特徴量の重みを学習する特徴量重み学習手段
と、前記特徴量重み学習手段で重みづけされた特徴量を
神経回路網モデルを用いて分類する自動分類手段と、前
記自動分類手段で分類した結果を評価する分類結果評価
手段と、前記特徴量重み学習手段からのカテゴリを代表
する特徴量とその重みと前記自動分類手段からのリンク
の重みを検索キーとして抽出する検索キー抽出手段とを
備え、検索キー候補映像の中から指定した検索キー候補
映像が同一分類となるように学習により生成した検索キ
ーにより類似した画像と音からなる映像を検索するもの
である。
【0013】本発明によれば、検索意図を特徴づける特
徴量の重み学習と、神経回路網モデルを用いた分類及び
分類結果の評価を繰り返すことにより、サンプル画像が
検索意図を反映した同一カテゴリとなるように学習で得
られた検索キーにより、類似した画像と音からなる映像
を検索するもので、検索効率を向上できる。
【0014】
【発明の実施の形態】本発明の請求項1に記載の発明
は、検索キーにより類似した画像または音を検索する類
似検索方法において、検索キー候補の中から検索したい
画像または音に類似した検索キーを生成することを特徴
とするものであり、検索意図を反映したカテゴリの特徴
量を検索キーとして抽出するという作用を有する。
【0015】請求項2に記載の発明は、検索キーは、指
定した2つ以上の検索キー候補映像を含む複数の検索キ
ー候補映像の特徴量に対して、指定された検索キー候補
映像同士と指定された検索キー候補映像とそれ以外の検
索キー候補映像の組合せで特徴量の重み学習と学習した
特徴量の重み付けを用いて分類および分類結果の評価を
繰り返し、指定した検索キー候補映像が同一分類となる
ように学習した結果を検索キーとして生成することを特
徴とするものであり、検索意図を特徴づける特徴量の重
み学習と分類及び分類結果の評価を繰り返すことによ
り、検索意図を反映したカテゴリの特徴量を検索キーと
して抽出するという作用を有する。
【0016】請求項3に記載の発明は、学習した特徴量
の重み付けを用いた分類は、神経回路網モデルを用いた
ことを特徴とするもので、学習した結果を検索キーとし
て利用できるという作用を有する。
【0017】請求項4に記載の発明は、特徴量は、画像
の特徴量と音の特徴量を組み合わせたことを特徴とする
もので、画像と音の特徴量を用いることにより、多様な
分類を行なうという作用を有する。
【0018】請求項5に記載の発明は、画像の特徴量
は、色のヒストグラム、エッヂ画素情報、2つのフレー
ムのエッヂ画素変化情報の一つまたは複数を組み合わせ
ることを特徴とするもので、映像による多様な分類を行
なうという作用を有する。
【0019】請求項6に記載の発明は、音の特徴量は、
可聴音を32のサブバンドに分割し、サブバンド毎に、
場面全体の平均音量、最大音量、音量分散値、または周
波数成分、ケフレンシー(周波数成分を対数変換した値
を逆周波数変換した成分)、音量を一つまたは複数を組
み合わせることを特徴とするもので、音による多様な分
類を行なうという作用を有する。
【0020】請求項7に記載の発明は、画像または音か
らの検索意図を特徴づける特徴量は、映像の場面の変わ
り目のフレームから求めることを特徴とするもので、動
画像への適用を可能にするという作用を有する。
【0021】請求項8に記載の発明は、検索キーは、カ
テゴリを代表する特徴量とその重み並びに入出力ユニッ
トのリンクの重みであることを特徴とするもので、学習
した結果が検索意図を反映したものであり、学習した結
果を検索キーとして利用できるという作用を有する。
【0022】請求項9に記載の発明は、特徴量は、画像
または音からの検索意図を特徴づける特徴量から少なく
とも1つ以上の特徴量を選択することを特徴とするもの
で、特徴量の組み合わせを自由に変えられるという作用
を有する。
【0023】請求項10に記載の発明は、検索キーによ
り類似した画像または音を検索する類似検索方法におい
て、検索対象映像は予め特徴量を抽出した検索用データ
として求めておくことを特徴とするもので、予め検索用
データとして変換しておくことにより処理時間の大幅な
短縮を図ることができるという作用を有する。
【0024】請求項11に記載の発明は、検索キーに
は、検索キー候補映像の場面を反映したタグを付けるこ
とを特徴とするもので、場面を反映したタグにより容易
に検索キーを指定することができる。
【0025】請求項12に記載の発明は、指定した2つ
以上の検索キー候補映像を含む複数の検索キー候補映像
の特徴量を抽出する特徴量抽出手段と、前記特徴量抽出
手段で抽出された特徴量に対して、指定された検索キー
候補映像同士と指定された検索キー候補映像とそれ以外
の検索キー候補映像の組合せで特徴量の重みを学習する
特徴量重み学習手段と、前記特徴量重み学習手段で重み
づけされた特徴量を神経回路網モデルを用いて分類する
自動分類手段と、前記自動分類手段で分類した結果を評
価する分類結果評価手段と、前記特徴量重み学習手段か
らのカテゴリを代表する特徴量とその重みと前記自動分
類手段からのリンクの重みを検索キーとして抽出する検
索キー抽出手段とを備え、検索キー候補映像の中から指
定した検索キー候補映像が同一分類となるように学習に
より生成した検索キーにより類似した画像と音からなる
映像を検索するもので、検索意図を特徴づける特徴量の
重み学習と、神経回路網を用いた分類及び分類結果の評
価を繰り返すことにより、検索意図を反映したカテゴリ
の特徴量を検索キーとして抽出するという作用を有す
る。
【0026】以下、本発明の実施の形態について、図を
用いて説明する。 (実施の形態)図1は、本発明の実施の形態の類似検索
システムの構成図を示す。図1において、5000は検索キ
ー候補映像の中から利用者が指定した複数の検索キー候
補映像が同一分類となるように学習した結果を検索キー
として生成する検索キー生成部、4000は検索対象となる
映像、検索キー候補映像及び教師データを記憶、管理す
るデータ記憶管理部、3000は検索キー候補映像や検索の
結果見つかった映像や検索キー生成部5000で抽出された
検索キーの表示を行なう表示部、1000はキーボードやフ
ァイルなどからの、映像の検索指示や、検索キー生成部
5000で抽出した検索キーに対応する場面を表示する指示
や、検索キー生成部5000で行なう学習に必要なパラメー
タの入力や検索動作の指示を行なうデータ入力部、6000
は検索対象となる映像はデータ記憶管理部4000から読み
出され映像から特徴的なデータを抽出する検索用データ
生成部、7000はデータ記憶管理部4000から読み出した検
出用データを検索キー生成部5000で生成した検索キーを
用いて類似検索を行う検索部、2000はシステムの全ての
制御を行なう主制御部とから構成する。
【0027】また、検索キー生成部5000は、指定した検
索キー候補映像を含む全ての検索キー候補映像の画像の
色やエッヂ強度の変化を分析することによって場面の変
わり目を検出する場面切替え検出部5100と、場面切替え
検出部5100によって検出された場面単位に、場面の特徴
量を抽出する特徴量抽出部5200と、特徴量抽出部5200で
抽出された特徴量の中から、データ入力部1000を使って
指示された特徴量を選択する特徴量選択部5300と、特徴
量選択部5300で選択された特徴量の重みを分類結果の評
価を用いて特徴量の重みを学習する特徴量重み学習部54
00と、特徴量重み学習部5400で重みづけされた特徴量
を、神経回路網モデルの1つである自己組織化マップと
呼ばれるニューラルネットワークを用いてリンク重みを
学習し、分類する自動分類部5500と、自動分類部5500で
分類した結果を合致検索キー候補(利用者が指定した複
数の検索キー候補映像)が含まれるカテゴリにおいて合
致検索キー候補が含まれる割合を計算することにより評
価する分類結果評価部5600と、自動分類部5500で分類し
た結果から代表的な特徴量を抽出し、その代表的な特徴
量と特徴量重みさらに自動分類部5500で学習したリンク
重みを検索キーとして抽出する検索キー抽出部5700と、
検索キー抽出部5700で抽出された検索キーを蓄積・管理
する検索キー管理・蓄積部5800とを備える。
【0028】検索用データ生成部6000は、映像の色やエ
ッヂ強度の変化を分析することによって場面の変わり目
を検出する場面切替え検出部5100と、場面切替え検出部
5100によって検出された場面単位に、場面の特徴量を抽
出する特徴量抽出部5200とを備える。
【0029】検索部7000は、検索キー生成部部5000で抽
出された検索キーを蓄積・管理する検索キー管理・蓄積
部5800と、データ記憶管理部4000から読み出した検索用
データを検索キーの重み付けされた特徴量を用いて神経
回路網モデルの1つである自己組織化マップと呼ばれる
ニューラルネットワークを用いて分類する自動分類部55
00とを備える。
【0030】以上のように構成された類似検索システム
について、以下にその動作を述べる。
【0031】類似検索システムの動作は、検索キー抽出
動作、検索用データ生成動作、検索動作の3つに分類さ
れる。
【0032】まず、検索キー生成部5000の検索キー抽出
動作について説明する。検索キー生成部5000の検索キー
抽出動作は、検索動作前に行われ、既に検索キー抽出動
作が完了している場合には、データ入力部1000からの指
示により、抽出が完了した検索キーの指定を検索キー生
成部5000に対し行ない、検索キー抽出動作は行なわな
い。
【0033】検索キー抽出動作は、入力部1000から検索
キー抽出の指示が入力されることによって開始する。主
制御部2000は、検索キー生成部5000に対して、検索キー
抽出命令を出し、続いてデータ記憶管理部4000に対し、
検索キー候補映像の読み出しを指示し、読み出した検索
キー候補映像の表示を表示部3000に指示する。表示部30
00に表示された検索キー候補映像を見て利用者は、デー
タ入力部1000を用いて、検索したい映像に合致する検索
キー候補映像(以下合致検索キー候補)を2つ以上指定
する。
【0034】これを受けて検索キー生成部5000は、検索
キー抽出を行うもので、以下に詳細に説明する。
【0035】場面検出部5100は、合致検索キー候補を含
む検索キー候補映像の場面切替え検出動作を行なうもの
で、場面切替え検出結果を場面の先頭フレーム番号ある
いは場面の先頭の時間として特徴量抽出部5200に出力す
るものである。場面検出部5100の場面切替え検出動作に
ついて、図2のフローチャートを用いて説明する。
【0036】まず、データ記憶管理部4000から合致検索
キー候補を含む検索キー候補映像の時系列のフレーム画
像を逐次読み出す(ステップ1)。読み出しの終了かど
うかを判断し、終了の場合は動作を終了する(ステップ
2)。
【0037】場面切替え(次シーン)候補及び、場面切
替え型を検出する。場面切替え型には、4種類あり、場
面切り替わりの時間の短い短時間長型とそれ以外の型に
分類され、さらに、短時間長型以外のゆっくり場面が切
り替わる型には、前シーンまたは次シーンが拡大・縮小
・変形・移動する映像移動型、前シーンと次シーンの間
の対応する画素を合成しながら切り替わる画素合成型、
前シーンの映像の一部分が次シーンの対応する画素に置
換され、置換される画素を拡大しながら切り替わる画素
置換型がある(ステップ3)。場面切替え(次シーン)
候補があるかどうかを判断し、ない場合はステップ1に
戻る(ステップ4)。
【0038】場面切替え(次シーン)候補が検出された
場合に、場面切替え(次シーン)候補の先頭位置の検出
を行い、先頭位置として適当な条件を満たさなかった場
合には、場面切替えとはみなされない(ステップ5)。
先頭位置が検出されたかどうかを判断し、検出されない
場合はステップ1に戻る(ステップ6)。
【0039】先頭位置を検出した場合には、先頭フレー
ム画像と前シーンの先頭画像の例えば色の類似度を求
め、類似度の値がしきい値以下の場合、場面切替えと判
断する(ステップ7)。
【0040】先頭位置は、場面の切替え型によって異な
り、短時間長型は、色の類似度の時間変化を、また、映
像移動型、画素合成型は輝度変化量の大きい画素の時間
変化を、画素合成型は画面全体のエッヂ強度の時間変化
を用いて検出し、検出されなかった場合はステップ1に
戻る(ステップ8)。先頭位置が検出された場合は、先
頭のフレーム番号を通知しステップ1に戻る(ステップ
9)。
【0041】なお、場面切替え検出方法に関しては、文
献「編集効果を含む映像のシーンチェンジ検出方法、マ
ルチメディアと映像処理シンポジウム'94(テレビジョ
ン学会)、p.21-26(1994)」に詳しい。
【0042】なお、場面切替え処理については、さまざ
まな方式が提案されているが、本発明において、場面切
替え処理方法は上記場面切替え処理に限定するものでは
ない。
【0043】次に、特徴抽出処理部5200の特徴量抽出動
作について詳細に説明する。特徴抽出処理部5200は、場
面単位に映像や音の情報を分析処理し、特徴量選択部53
00に出力するものである。特徴抽出処理部5200の特徴量
抽出動作は、場面切替えの単位に、映像、音に関して
(表1)に示すような特徴量を抽出する。
【0044】
【表1】
【0045】映像については、場面の先頭フレームの色
ヒストグラム(特徴量1)、場面先頭フレームのエッヂ
画素情報(特徴量2)、先頭フレームと先頭から10フ
レーム目のエッヂ画素変化情報(特徴量3)、先頭から
10フレーム目と先頭から20フレーム目のエッヂ画素
変化情報(特徴量4)、場面末尾10フレーム前と末尾
フレームのエッヂ画素変化情報(特徴量5)を抽出す
る。エッヂ画素変化情報とは、フレーム上の同じ位置に
ある画素に対し、変化前の画素がエッヂであるかどうか
(1ビット)、変化後の画素がエッヂであるかどうか
(1ビット)を表す情報であり、1画素あたり合計2ビ
ットで表現できる。
【0046】なお、フレームを分割し、分割画面単位で
上記特徴量1から特徴量5までを抽出しても実施可能で
ある。また、以上の特徴量1及び特徴量2の説明では、
場面の先頭フレームを用いて説明したが、任意のフレー
ムについても同様に実施可能である。特徴量3、特徴量
4及び特徴量5の説明で用いたフレームの組み合わせ以
外でも実施可能である。
【0047】音については、20kHzまでの可聴音を32
のサブバンドに分割し、サブバンド毎に、場面全体の音
量平均(特徴量6)、音量最大値(特徴量7)、音量分
散(特徴量8)、500msecの切り出し区間で算出したケ
フレンシーの平均値において、切り出し区間の最小時間
におけるケフレンシー値が最大となるケフレンシー分布
パターン(特徴量9)、及び時間成分毎のケフレンシー
平均値の分布パターン(特徴量10)、場面先頭200mse
c分の音量平均(特徴量11)、場面末尾200msec分の音
量平均(特徴量12)、場面先頭500msecから1000msec
までの音量平均(特徴量13)、場面末尾1000msec前か
ら500msec前までの音量平均(特徴量14)、7.5kHz以
上のサブバンド音に対しては、さらに細かい周波数に分
割し、各サブバンドの高域音量が0以上となる継続時間
(特徴量15)を抽出する。
【0048】なお、特徴量6において、可聴音の帯域と
して、20kHzまでの帯域を用いたが、20kHzを超えた帯域
を用いても同様に実施可能である。また、32のサブバ
ンドに分割しているが、分割するサブバンド数を任意の
値にしても同様に実施可能である。特徴量11から特徴
量14までに示した音量の切り出し時間に任意の値を用
いても同様に実施可能である。
【0049】ここで、ケフレンシーの算出方法につい
て、図3のフローチャートを用いて説明する。音の標本
値系列を切り出す(ただし、標本化された時系列をx
(n),(0≦n≦N)と表す:ここでNは標本数を表す)(ス
テップ1)。切り出した区間の両端に急激な変化が起こ
らないように(数2)で示すハミング窓関数WH(n)を乗
じる(ステップ2)。
【0050】
【数1】
【0051】
【数2】
【0052】高速フーリエ変換アルゴリズムを用いて、
(数3)に示す離散的フーリエ変換S(w)を計算する
(ステップ3)。この離散的フーリエ変換を施された値
S(w)の絶対値をとり(| S(ω)|)(ステップ4)、対
数変換を行なう(log| S(ω)|)(ステップ5)。(数
4)に示す逆周波数変換した値Cnがケプストラムであ
る(ステップ6)。
【0053】
【数3】
【0054】
【数4】
【0055】なお、以上の説明で用いた特徴量以外に、
従来さまざまな特徴量が提案されており、本発明におい
て、その他の特徴量についても同様に実施可能である。
【0056】次に、特徴量選択部5300の特徴量を選択
し、パターン化する処理について説明する。特徴量選択
部5300は、特徴抽出処理部5200の分析によって得られた
複数の特徴量の内、データ入力部1000から指示のあった
特徴量を選択し特徴量重み学習部5400に出力する。
【0057】特徴量選択部5300の特徴量の選択は、デー
タ入力部1000の指示により行われる。例えば、全ての特
徴量を用いる指示や、特徴量1だけを用いる指示などが
ある。選択された特徴量をパターン化する処理を特徴量
1から特徴量15を用いて説明する。
【0058】特徴量1として抽出される16色ヒストグ
ラムに対し、頻度の最大値が1、最小値が0となるよう
に規格化を行なった後、16要素の入力パターンを生成
する。さらに、この16色ヒストグラムの頻度分散を計
算し、1要素の入力パターンを生成する。従って、特徴
量1からは最大17要素のパターンが生成される。な
お、ヒストグラムの色の種類は、色の値の量子化値を変
更する等の方法によって、任意の種類に変更でき、ヒス
トグラムの色の種類に任意の値を用いても同様に実施可
能である。
【0059】特徴量2については、フレームを構成する
全画素に対するエッヂ画素の割合を算出し、全ての場面
について、最大となる割合が1、最小となる割合が0と
なるように規格化した値を1つのパターンとする。ま
た、フレームを縦横3分割、計9分割し、それぞれの分
割場面に含まれる画素に対するエッヂ画素の割合を算出
する。さらに、全ての場面について、それぞれの分割画
面のエッヂ画素割合の最大値が1、最小値が0となるよ
うに規格化したものをパターンとする。従って、特徴量
2からは10パターンが生成される。なお、画面の分割
数に任意の値を用いても同様に実施可能である。
【0060】特徴量3、4、5は対象となるフレームが
異なるだけでパターン化する処理は同様である。フレー
ムを構成する全画素に対する変化のあった画素(エッヂ
画素がエッヂでなくなった画素/エッヂでない画素がエ
ッヂになった画素)の割合を算出し、全ての場面につい
て、最大となる割合が1、最小となる割合が0となるよ
うに規格化した値を1つのパターンとする。また、フレ
ームを縦横3分割、計9分割し、それぞれの分割場面に
含まれる画素に対する変化のあった画素の割合を算出す
る。さらに、全ての場面について、それぞれの分割画面
の変化のあった画素割合の最大値が1、最小値が0とな
るように規格化したものをパターンとする。
【0061】特徴量6については、32のサブバンド毎
に音量平均の最大値が1、最小値が0となるように規格
化を行なう。同様に、特徴量7は音量最大値について、
特徴量8は、音量分散について規格化を行なう。
【0062】特徴量9については、ケフレンシー成分毎
にそれぞれの最大値が1、最小値が0となるように規格
化する。ただし、ケフレンシー成分が16を超える場合
には、隣接する成分の平均値等を用いて16を超えない
ようにし、規格化を行なう。
【0063】特徴量10についても同様の動作を行な
う。なお、ケフレンシー成分のしきい値として16以外
の値を用いても同様に実施可能である。
【0064】特徴量11については、場面先頭200msec
分の音量平均の最大値が1、最小値が0となるように規
格化する。特徴量12、13、14についても対象とな
る音量が異なるだけで、同様の動作を行なう。
【0065】特徴量15についても、高域音持続時間の
最大値が1、最小値が0となるように規格化する。
【0066】なお、以上の説明で用いた特徴量以外の特
徴量についても同様に実施可能である。
【0067】次に、特徴量重み学習部5400、自動分類部
5500及び分類結果評価部5600の動作について、図4のフ
ローチャートを用いて説明する。
【0068】上記合致検索キー候補の指定により得られ
たどこに分類するかを指示した教師データをデータ記憶
管理部4000より入力し(ステップ1)、特徴量抽出部52
00によって抽出された合致キー候補映像を含む全ての検
索キー候補映像の特徴量データを特徴量重み学習部5400
に入力する(ステップ2)。
【0069】
【数5】
【0070】特徴量毎に相関係数c_coefを(数5)で計
算する。ここで、P_numは、相関のあったデータ数であ
り、T_numは相関係数を算出するためのデータ数であ
る。相関係数を算出するためのデータ数は、合致検索キ
ー候補を2つ選ぶ組み合わせの数をN1とし、合致検索キ
ー候補の1つと合致検索キー候補以外の検索キー候補を
1つ選ぶ組み合わせ数をN2としたとき、最大N1とN2の積
(N1*N2)になる。相関があるかどうかの判定は、合致検
索キー候補の2つの組み合わせにおける差分二乗値を
A、合致検索キー候補の1つと合致検索キー候補以外の
合致検索キー候補の組み合わせにおける差分二乗値をB
とした時B-A>0となる組み合わせ数であり、特徴量毎に
計算する。αは学習係数であり、0<α<1を満たすように
定める(ステップ3)。
【0071】終了条件1は、特徴量重み学習の繰り返し
回数であり、この条件によってあらかじめ設定された回
数の学習をおこなう(ステップ4)。既に学習済みの重
みを用いて学習するか、初期化するかの判定を行い(ス
テップ5)、初期化する場合は、特徴量重みの初期化を
行う(ステップ6)。初期化を行わない場合は、既に学
習済みの特徴量重みを用いて学習を行う(ステップ
7)。
【0072】特徴量重みは学習を重ねることによって、
変化していき、ある特徴量の特徴量重みが上限に達した
かどうかの判定を行う(ステップ8)。ある特徴量の特
徴量重みが上限に達したときには、全ての特徴量重みと
学習係数を小さくする。例えば、特徴量重みを2分の1
にし、学習係数を10分の1にする(ステップ9)。ス
テップ4からステップ9までを繰り返し行い、特徴量重
みを更新していく。
【0073】ステップ4において設定した繰り返し回数
を終了した場合、自動分類部5500では、まず、自己組織
化特徴マップ(以下SOM)と呼ばれるニューラルネッ
トワークのパラメータ設定、初期化が行なわれれ、この
後、設定された繰り返し回数に従い、重みづけされた特
徴量(入力ベクトル)を、SOMに繰り返し入力する。
入力ベクトルの繰り返し毎に学習は進行し、結果的に、
入力ベクトル空間で近い(類似した)パターンは、近い
出力ユニットに写像されるようになる。このようにし
て、入力ベクトルは出力ユニット単位に分類される(ス
テップ10)。
【0074】この分類結果は、分類結果評価部5600に伝
えられ、合致検索キー候補を含むカテゴリにおいて、合
致検索キー候補が含まれる割合、あるいは、全ての合致
検索キー候補に対する同じカテゴリに含まれる合致検索
キー候補の割合を計算することによって評価が行われる
(ステップ11)。ステップ11の評価結果を用いて終
了条件2の判定を行い(ステップ12)、終了条件2を
満足していない場合、特徴量重み学習の繰り返し回数
(終了条件1)を変更し(ステップ13)、ステップ4
に戻る。終了条件2を満足している場合、分類結果を検
索キー抽出部5700に出力する。
【0075】ステップ4からステップ13までの動作を
繰り返し行うことにより、検索意図と相関のある特徴量
の重みが増す結果として、指定された複数の合致検索キ
ー候補を含むカテゴリが同一のカテゴリに近づいていく
ことになる。ここで、繰り返しの終了条件は、繰り返し
回数あるいは分類結果の評価値のしきい値により設定さ
れる。
【0076】次に、特徴量重み学習部5400の特徴量重み
学習動作について詳細に説明する。特徴量重み学習部54
00の特徴量重み学習は、合致検索キー候補を含むカテゴ
リを検索意図を反映した同一のカテゴリに近づけるため
に行なう動作である。
【0077】合致検索キー候補を含むカテゴリに含まれ
る全ての検索キー候補を合致検索キー候補とそれ以外の
合致検索キー候補に分け、合致検索キー候補の類似度が
大きくなるように、かつ合致検索キー候補とそれ以外の
合致検索キー候補の類似度が小さくなるように特徴量重
みを更新するものである。
【0078】特徴量重み更新処理を図5のフローチャー
トを用いて説明する。(ただし、t時刻における特徴量
重みベクトルをW(t)とし、学習率係数βを0<β<
1を満たすように定める。) 初期の時刻をt=0とし、特徴量重みベクトルW(t)
の初期化を行なう(ステップ1)。終了条件を満たせば
動作を停止し、そうでなければステップ3に進む(ステ
ップ2)。合致検索キー候補の中から、ランダムに2つ
の場面を選択する(ステップ3)。ただし、ステップ3
では、2つの場面の選び方として、全ての組合せで選ん
でも良い。
【0079】時刻tにおけるステップ2で選択された場
面の差分の2乗値をそれぞれの特徴量に対し計算する。
こうして時刻tにおける差分2乗ベクトルd1(t)を
(数6)により得られる。(ステップ4)。
【0080】
【数6】
【0081】合致検索キー候補の中から、1つ、合致検
索キー候補以外の合致検索キー候補の中から1つランダ
ムに場面を選択する(ステップ5)。ただし、ステップ
5では、合致検索キー候補以外の選び方として均等に選
んでも良い。時刻tにおけるステップ4で選択された場
面の差分2乗ベクトルd2(t)を計算する(ステップ
6)。
【0082】
【数7】
【0083】特徴量重みベクトルをW(t+1)を(数
7)とおく(ステップ7)。次に、t=t+1として、
ステップ2に戻る。
【0084】このようにステップ2からステップ7まで
の動作を繰り返し行なうことにより、合致検索キー候補
の特徴量重みが大きくなるように、かつ合致検索キー候
補以外の合致検索キー候補の特徴量重みが小さくなるよ
うに学習されていく。
【0085】なお、終了条件は、次の3つから選択す
る。(1)特徴量重み学習部5400にあらかじめ設定し
た、動作の繰り返し回数に達した時、(2)自動分類部
5500の分類結果を表示部に表示し、利用者の判断で、デ
ータ入力部1000の指示により強制的に終了指示した時、
または(3)自動分類部5500で分類された場面のグルー
プに合致検索キー候補が含まれる割合あるいは数が一定
値以上に達した時の3つから選択する。
【0086】次に、自動分類部5500の自動分類動作につ
いて詳細に説明する。自動分類部5500の自動分類動作の
代表例として、SOM法による教師なし競合学習の動作
を説明する。SOM法は、ニューラルネットワークの一
種であり、1990年にT.Kohonenによって提案された。こ
のSOM法の特徴は、教師なしの学習によって、入力信
号パターンの似たもの同士は競合層上の空間的に近い位
置に、似ていないもの同士は、遠い位置に写像するよう
な入力信号パターンの組織化を行なうものである。
【0087】まず、SOM法のネットワーク構成図を図
6に示し、以下に説明する。ネットワークは、入力層と
競合層(出力層)の2層で構成され、入力層を構成する
ユニット(入力ユニット)は、1つの特徴量に対応し、
入力信号ベクトルと同じ数だけ用意され、競合層(出力
層)のユニットと全数結合している。一方、競合層(出
力層)を構成するユニット(出力ユニット)は、分類さ
れるグループに対応し、2次元格子に規則的に配置され
る。
【0088】次に、SOM法による学習動作を図7のフ
ローチャートを使って説明する。t時刻における入力ユ
ニットjへの入力をXj(t)、図6(b)に示すよう
に入力ユニットjから出力ユニットkへのリンクの重み
をWkj(t)とする。また、図6(a)に示すように
出力ユニットkのt時刻における近傍集合をN(k,
t)とし、t1<t2 を満たす任意の時刻t1,t2
に対して、N(k,t1)⊂N(k,t2)が成り立つ
ように時間の経過とともに近傍の領域を小さくしてい
く。この時、全てのリンクの重みWkjを小さなランダ
ム値に設定する(ステップ1)。
【0089】初期の時刻をt=0とし、全ての出力ユニ
ットkに対して近傍領域N(k,0)を定義する。例え
ば、kを中心とした大きな六角形をN(k,t1)とす
る。ここで、学習率α(0)を、0<α(0)<1か
つ、時間とともに減少していくとなるような関数として
定め、例えば(数8)のような関数とする(ステップ
2)。
【0090】
【数8】
【0091】t+1番目のデータがなければ動作を終了
し、そうでなければt+1番目のデータを入力する(ス
テップ3)。
【0092】出力ユニットkと入力ユニットjとの距離
Simkを、全ての出力ユニットkに対して、Xj(t)−
kj(t)を2乗した和として(数9)で計算する(ステ
ップ4)。
【0093】
【数9】
【0094】
【数10】
【0095】出力ユニットkと入力ユニットjとの最小
距離Simk_minを、全ての出力ユニットkに対し、ス
テップ4で計算した値の最小値を(数10)で求め、そ
れにより最小値をもつ出力ユニットk_minが得られる
(ステップ5)。
【0096】最終的に、自己組織化のリンク重みWkj(t
+1)として、全ての出力ユニットk∈N(k_min,t)
について、全ての入力ユニットjに対して(数11)に
より求める(ステップ6)。
【0097】
【数11】
【0098】t=t+1とおき、ステップ3に行く(ス
テップ7)。このようにステップ3からステップ6まで
の動作を繰り返し行なうことにより、入力ベクトルの分
布を代表するような結合重みが、いくつかの出力ユニッ
トに対して形成されるようになる。
【0099】次に、検索キー抽出部5700は、自動分類部
5500から出力された学習結果から、合致検索キー候補を
含むカテゴリからそのカテゴリを代表する特徴量と重み
並びに、自動分類部5500の自己組織化のリンク重みが検
索キーとして抽出される。ここで、カテゴリを代表する
特徴量とは、合致検索キー候補から抽出した特徴量ある
いは合致検索キー候補から抽出した特徴量が最も強く反
応した出力ユニットにおいて、合致検索キー候補よりも
強く反応した合致検索キー候補の特徴量のことをいう。
【0100】検索キー管理・蓄積部5800は、特徴量重み
学習部5400からの合致検索キー候補を含むカテゴリから
そのカテゴリを代表する特徴量と重み並び自動分類部55
00からの自己組織化のリンク重みが検索キーとして抽出
された検索キーを蓄積する。
【0101】なお、合致検索キー候補を含むカテゴリに
属する合致検索キー候補を表示部3000に出力した後、デ
ータ入力部1000からの指示によっても抽出できる。この
ようにして抽出された検索キーは、検索キー管理・蓄積
部5800に蓄積される。この時、検索キーの再利用に備え
て、利用者はデータ入力部1000を用いて、検索キーにタ
グを付けることもできる。
【0102】なお、自動分類部5500を自己組織化マップ
を用いて動作させる例で説明したが、その他の神経回路
網モデルについても同様に実施可能である。
【0103】次に、検索用データ生成部6000について説
明する。検索データ生成部6000は、図1に示すように検
索対象映像の色やエッヂ強度の変化を分析することによ
って場面の変わり目を検出する場面切替え検出部5100
と、場面切替え検出部5100によって検出された場面単位
に、場面の特徴量を抽出する特徴量抽出部5200とで構成
される。検索用データは、一般的に検索対象となるデー
タ量を削減するために、検索対象となる映像から特徴的
なデータを抽出したものである。
【0104】場面切替え検出部5100は、検索対象となる
映像はデータ記憶管理部4000から読み出され、場面切替
え検出部5100で検索キー候補映像の場面切替え検出動作
を行なうもので、場面切替え検出結果を場面の先頭フレ
ーム番号あるいは場面の先頭の時間として特徴量抽出部
5200に出力するものである。特徴抽出処理部5200は、場
面単位に映像や音の情報を分析処理し、特徴量選択部53
00に出力するものである。特徴抽出処理部5200の特徴量
抽出動作は、場面切替えの単位に、映像、音に関して表
1に示すような特徴量が検索用データとして抽出され、
再び、データ記憶管理部4000に記憶される。
【0105】場面切替え検出部5100と特徴抽出処理部52
00は、前述の検索キー生成部5000と同一のものであり、
詳細な説明は省略するものとする。
【0106】次に、検索部7000について説明する。検索
部7000は、図1に示すように検索キー生成部部5000で抽
出された検索キーを蓄積・管理する検索キー管理・蓄積
部5800と、データ記憶管理部4000から読み出した検索用
データを検索キーの重み付けされた特徴量を用いて神経
回路網モデルの1つである自己組織化マップと呼ばれる
ニューラルネットワークを用いて分類する自動分類部55
00から構成される。
【0107】検索部7000の検索動作は、予め検索キー生
成部5000で生成された検索キーを用いて、入力部1000か
ら検索キーに付けられた場面を反映したタグにより検索
指示が入力されることによって開始する。主制御部2000
は、検索キーのリンク重みを自動分類部5500に設定し、
検索キーの重みづけを行なって、データ記憶管理部4000
から読み出した検索用データを検索キーの特徴量ととも
に自動分類部5500に入力する。自動分類部5500は、学習
が終了したニューラルネットワークに、全場面の特徴ベ
クトルを入力し、それぞれの場面がどの出力ユニットの
近傍で最も強く反応するかを検出し、これを分類結果と
して出力し、表示部3000に表示される。この時検索キー
に類似した検索用データは、検索キーの近隣に表示され
る。この動作を全ての検索用データに対して行なう。
【0108】なお、検出結果に対し、検索意図に合致し
ているかどうかの評価を行い、検索キー候補映像に対し
て行なった検索キー生成動作と同様の動作も実施可能で
ある。
【0109】なお、自動分類部に神経回路網モデルを用
いた例で説明したが、これに限定されるものではなく、
パターン認識等で用いられる各種クラスタリング方法を
用いても良い。
【0110】
【発明の効果】以上のように本発明の類似検索システム
は、検索意図を特徴づける特徴量の重み学習と、神経回
路網モデルを用いた分類及び分類結果の評価を繰り返す
ことにより、サンプル画像が検索意図を反映した同一の
カテゴリとなるように学習で得られた結果を検索キーと
して抽出し、検索効率を向上できるという効果が得られ
る。
【0111】また、検索キーとして、特徴量重みおよび
入出力ユニットのリンク重みは学習した結果が検索意図
を反映したものであり、学習した結果を検索キーとして
利用できる。
【図面の簡単な説明】
【図1】本発明の実施の形態の類似検索システムの構成
【図2】同場面検出部の類似検索システムの場面切替え
検出動作を示すフローチャート
【図3】同類似検索システムの特徴量抽出部のケフレン
シーの算出動作を示すフローチャート
【図4】同類似検索システムの特徴量重み学習部、自動
分類部及び分類結果評価部の動作を示すフローチャート
【図5】同類似検索システムの特徴量重み学習部の特徴
量重み更新処理のフローチャート
【図6】同類似検索システムの自動分類部のSOM法の
ネットワーク構成図
【図7】同類似検索システムの自動分類部のSOM法の
学習動作のフローチャート
【図8】従来の類似検索システムのブロック構成図
【図9】従来の類似検索システムの動作説明のフローチ
ャート
【符号の説明】
1000 データ入力部 2000 主制御部 3000 表示部 4000 データ記憶管理部 4100 データ読み出し部 4200 データ記憶部 5000 検索キー生成部 5100 場面切替え検出部 5200 特徴量抽出部 5300 特徴量選択部 5400 特徴量重み学習部 5500 自動分類部 5600 分類結果評価部 5700 検索キー抽出部 5800 検索キー管理・蓄積部 6000 検索用データ生成部 7000 検索部
───────────────────────────────────────────────────── フロントページの続き (51)Int.Cl.6 識別記号 FI G06F 15/403 350C 15/70 465A

Claims (12)

    【特許請求の範囲】
  1. 【請求項1】 検索キーにより類似した映像を検索する
    類似検索方法において、検索キー候補映像の中から指定
    した検索キー候補映像が同一分類となるように学習によ
    り検索キーを生成することを特徴とする類似検索方法。
  2. 【請求項2】 検索キーは、指定した2つ以上の検索キ
    ー候補映像を含む複数の検索キー候補映像の特徴量に対
    して、指定された検索キー候補映像同士と指定された検
    索キー候補映像とそれ以外の検索キー候補映像の組合せ
    で特徴量の重み学習と学習した特徴量の重み付けを用い
    て分類および分類結果の評価を繰り返し、指定した検索
    キー候補映像が同一分類となるように学習した結果を検
    索キーとして生成することを特徴とする請求項1記載の
    類似検索方法。
  3. 【請求項3】 学習した特徴量の重み付けを用いた分類
    は、神経回路網モデルを用いたことを特徴とする請求項
    2記載の類似検索方法。
  4. 【請求項4】 特徴量は、画像の特徴量と音の特徴量を
    組み合わせたことを特徴とする請求項1または2記載の
    類似検索方法。
  5. 【請求項5】 画像の特徴量は、色のヒストグラム、エ
    ッヂ画素情報、2つのフレームのエッヂ画素変化情報の
    一つまたは複数を組み合わせることを特徴とする請求項
    4記載の類似検索方法。
  6. 【請求項6】 音の特徴量は、可聴音を32のサブバン
    ドに分割し、サブバンド毎に、場面全体の平均音量、最
    大音量、音量分散値、または周波数成分、ケフレンシー
    (周波数成分を対数変換した値を逆周波数変換した成
    分)、音量を一つまたは複数を組み合わせることを特徴
    とする請求項4記載の類似検索方法。
  7. 【請求項7】 画像または音からの検索意図を特徴づけ
    る特徴量は、映像の場面の変わり目のフレームから求め
    ることを特徴とする請求項2乃至6のいずれかに記載の
    類似検索方法。
  8. 【請求項8】 検索キーは、同一分類となるように学習
    した結果として、カテゴリを代表する特徴量とその重み
    並びに入出力ユニットのリンク重みであることを特徴と
    する請求項2乃至7のいずれかに記載の類似検索方法。
  9. 【請求項9】 特徴量は、画像または音からの検索意図
    を特徴づける特徴量から少なくとも1つ以上の特徴量を
    選択することを特徴とする請求項4乃至6のいずれかに
    記載の類似検索方法。
  10. 【請求項10】 検索キーにより類似した画像または音
    を検索する類似検索方法において、検索対象映像は予め
    特徴量を抽出した検索用データとして求めておくことを
    特徴とする請求項1または2記載の類似検索方法。
  11. 【請求項11】 検索キーには、検索キー候補映像の場
    面を反映したタグを付けることを特徴とする請求項1ま
    たは10記載の類似検索方法。
  12. 【請求項12】 指定した2つ以上の検索キー候補映像
    を含む複数の検索キー候補映像の特徴量を抽出する特徴
    量抽出手段と、前記特徴量抽出手段で抽出された特徴量
    に対して、指定された検索キー候補映像同士と指定され
    た検索キー候補映像とそれ以外の検索キー候補映像の組
    合せで特徴量の重みを学習する特徴量重み学習手段と、
    前記特徴量重み学習手段で重みづけされた特徴量を神経
    回路網モデルを用いて分類する自動分類手段と、前記自
    動分類手段で分類した結果を評価する分類結果評価手段
    と、前記特徴量重み学習手段からのカテゴリを代表する
    特徴量とその重みと前記自動分類手段からのリンクの重
    みを検索キーとして抽出する検索キー抽出手段とを備
    え、検索キー候補映像の中から指定した検索キー候補映
    像が同一分類となるように学習により生成した検索キー
    により類似した画像と音からなる映像を検索することを
    特徴とする類似検索システム。
JP9195356A 1997-07-22 1997-07-22 類似検索方法及び類似検索システム Pending JPH1139325A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP9195356A JPH1139325A (ja) 1997-07-22 1997-07-22 類似検索方法及び類似検索システム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP9195356A JPH1139325A (ja) 1997-07-22 1997-07-22 類似検索方法及び類似検索システム

Publications (1)

Publication Number Publication Date
JPH1139325A true JPH1139325A (ja) 1999-02-12

Family

ID=16339819

Family Applications (1)

Application Number Title Priority Date Filing Date
JP9195356A Pending JPH1139325A (ja) 1997-07-22 1997-07-22 類似検索方法及び類似検索システム

Country Status (1)

Country Link
JP (1) JPH1139325A (ja)

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000350156A (ja) * 1999-06-09 2000-12-15 Hitachi Ltd 動画像情報の記憶方法及びこれを記録した記録媒体
WO2001082646A1 (en) * 2000-04-24 2001-11-01 Mitsubishi Denki Kabushiki Kaisha Cellular phone and remote control system
JP2003050813A (ja) * 2001-08-05 2003-02-21 Shinya Mochida 情報の変換方法及び情報管理装置
JP2003076717A (ja) * 2001-09-04 2003-03-14 Nippon Telegr & Teleph Corp <Ntt> 情報検索方法及び装置と、情報検索プログラム及びそのプログラムの記録媒体
JP2006236311A (ja) * 2004-12-09 2006-09-07 Sony United Kingdom Ltd 情報処理方法
US7349895B2 (en) 2000-10-30 2008-03-25 Microsoft Corporation Semi-automatic annotation of multimedia objects
JP2008245040A (ja) * 2007-03-28 2008-10-09 Kddi Corp 動画像分類装置
US7499916B2 (en) 2000-10-30 2009-03-03 Microsoft Corporation Image retrieval systems and methods with semantic and feature based relevance feedback
JP2010206508A (ja) * 2009-03-03 2010-09-16 Olympus Imaging Corp 表示装置、撮像装置および表示装置用プログラム
JP2011507099A (ja) * 2007-12-12 2011-03-03 マイクロソフト コーポレーション イメージ検索における対話型概念学習
CN102369525A (zh) * 2008-12-10 2012-03-07 塔莱斯公司 搜索可视信息的***
WO2012032971A1 (ja) * 2010-09-07 2012-03-15 オリンパス株式会社 キーワード付与装置及び記録媒体
WO2022138547A1 (ja) * 2020-12-24 2022-06-30 Bird fab studio株式会社 生地検索装置、生地検索システム、生地検索方法およびプログラム

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05265997A (ja) * 1992-03-24 1993-10-15 Sharp Corp ニューラルネットワークの演算装置
JPH06110942A (ja) * 1992-09-25 1994-04-22 Toshiba Corp 映像インデックス作成装置
JPH07114567A (ja) * 1993-10-20 1995-05-02 Hitachi Ltd ビデオの検索方法および装置
JPH07220074A (ja) * 1994-02-07 1995-08-18 Matsushita Electron Corp パターン識別方法
JPH09101970A (ja) * 1995-10-06 1997-04-15 Omron Corp 画像検索方法および画像検索装置
JPH09185713A (ja) * 1996-01-08 1997-07-15 Olympus Optical Co Ltd 特徴ベクトル抽出装置及びこれを用いた情報処理装置

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05265997A (ja) * 1992-03-24 1993-10-15 Sharp Corp ニューラルネットワークの演算装置
JPH06110942A (ja) * 1992-09-25 1994-04-22 Toshiba Corp 映像インデックス作成装置
JPH07114567A (ja) * 1993-10-20 1995-05-02 Hitachi Ltd ビデオの検索方法および装置
JPH07220074A (ja) * 1994-02-07 1995-08-18 Matsushita Electron Corp パターン識別方法
JPH09101970A (ja) * 1995-10-06 1997-04-15 Omron Corp 画像検索方法および画像検索装置
JPH09185713A (ja) * 1996-01-08 1997-07-15 Olympus Optical Co Ltd 特徴ベクトル抽出装置及びこれを用いた情報処理装置

Cited By (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000350156A (ja) * 1999-06-09 2000-12-15 Hitachi Ltd 動画像情報の記憶方法及びこれを記録した記録媒体
WO2001082646A1 (en) * 2000-04-24 2001-11-01 Mitsubishi Denki Kabushiki Kaisha Cellular phone and remote control system
US7529732B2 (en) 2000-10-30 2009-05-05 Microsoft Corporation Image retrieval systems and methods with semantic and feature based relevance feedback
US7349895B2 (en) 2000-10-30 2008-03-25 Microsoft Corporation Semi-automatic annotation of multimedia objects
US7627556B2 (en) 2000-10-30 2009-12-01 Microsoft Corporation Semi-automatic annotation of multimedia objects
US7499916B2 (en) 2000-10-30 2009-03-03 Microsoft Corporation Image retrieval systems and methods with semantic and feature based relevance feedback
JP2003050813A (ja) * 2001-08-05 2003-02-21 Shinya Mochida 情報の変換方法及び情報管理装置
JP2003076717A (ja) * 2001-09-04 2003-03-14 Nippon Telegr & Teleph Corp <Ntt> 情報検索方法及び装置と、情報検索プログラム及びそのプログラムの記録媒体
JP2006236311A (ja) * 2004-12-09 2006-09-07 Sony United Kingdom Ltd 情報処理方法
JP2008245040A (ja) * 2007-03-28 2008-10-09 Kddi Corp 動画像分類装置
JP2011507099A (ja) * 2007-12-12 2011-03-03 マイクロソフト コーポレーション イメージ検索における対話型概念学習
US9008446B2 (en) 2007-12-12 2015-04-14 Microsoft Technology Licensing, LLP Interactive concept learning in image search
CN102369525A (zh) * 2008-12-10 2012-03-07 塔莱斯公司 搜索可视信息的***
JP2010206508A (ja) * 2009-03-03 2010-09-16 Olympus Imaging Corp 表示装置、撮像装置および表示装置用プログラム
WO2012032971A1 (ja) * 2010-09-07 2012-03-15 オリンパス株式会社 キーワード付与装置及び記録媒体
JP2012058926A (ja) * 2010-09-07 2012-03-22 Olympus Corp キーワード付与装置及びプログラム
WO2022138547A1 (ja) * 2020-12-24 2022-06-30 Bird fab studio株式会社 生地検索装置、生地検索システム、生地検索方法およびプログラム
JP2022101412A (ja) * 2020-12-24 2022-07-06 Bird fab studio株式会社 生地検索装置、生地検索システム、生地検索方法およびプログラム

Similar Documents

Publication Publication Date Title
He et al. Learning and incorporating top-down cues in image segmentation
Zhou et al. A compact representation of visual speech data using latent variables
EP1081960B1 (en) Signal processing method and video/voice processing device
JPH1055444A (ja) Dctをベースとするフィーチャー・ベクトルを使った顔の認識
JP4937578B2 (ja) 情報処理方法
CN111161715B (zh) 一种基于序列分类的特定声音事件检索与定位的方法
US20080219565A1 (en) Training device and pattern recognizing device
JPH1139325A (ja) 類似検索方法及び類似検索システム
KR20060133563A (ko) 온라인 학습을 통한 지속적인 얼굴 인식
WO2003030085A1 (en) System and method of face recognition using portions of learned model
CN111126396A (zh) 图像识别方法、装置、计算机设备以及存储介质
CN110598560A (zh) 基于神经网络增强的夜间监控识别方法和***
CN114782997B (zh) 基于多损失注意力自适应网络的行人重识别方法及***
US20030113002A1 (en) Identification of people using video and audio eigen features
JPWO2018203555A1 (ja) 信号検索装置、方法、及びプログラム
CN112733912B (zh) 基于多粒度对抗损失的细粒度图像识别方法
Woodford et al. Fruit image analysis using wavelets
Zhou et al. Learning-based scientific chart recognition
Pantazis et al. Salsum: Saliency-based video summarization using generative adversarial networks
CN111428730B (zh) 弱监督细粒度物体分类方法
US7181062B2 (en) Modular classification architecture for a pattern recognition application
Sahbi et al. Coarse to fine face detection based on skin color adaption
Lajevardi et al. Facial expression recognition using log-Gabor filters and local binary pattern operators
CN112766368A (zh) 一种数据分类方法、设备和可读存储介质
CN113537240B (zh) 一种基于雷达序列图像的形变区智能提取方法及***

Legal Events

Date Code Title Description
RD01 Notification of change of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7421

Effective date: 20050624

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20050628

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20050802

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20050830

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20051019

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20060124