WO2004006185A1

WO2004006185A1 - 類似度算出方法及び装置

Info

Publication number: WO2004006185A1
Application number: PCT/JP2003/008142
Authority: WO
Inventors: Mototsugu Abe; Masayuki Nishiguchi
Original assignee: Sony Corporation
Priority date: 2002-07-09
Filing date: 2003-06-26
Publication date: 2004-01-15
Also published as: CN1324509C; KR101021044B1; KR20050016278A; DE60330147D1; EP1521210A1; US7260488B2; JP2004046370A; EP1521210B9; US20050033523A1; EP1521210A4; JP4623920B2; EP1521210B1; CN1552042A

Abstract

　類似ベクトル検出装置（２）において、ベクトル変換部（２０），（２１）は、登録ベクトルｇ及び入力ベクトルｆに対して、順序行列による変換、離散コサイン変換、離散フーリエ変換、ウォルシュ−アダマール変換、或いはカルーネン−レーベ変換を施す。階層的距離演算部（２３）は、２つのベクトル間の距離計算を、有意性の高いベクトル成分、すなわち、上述の変換で分散や固有値の大きい成分、或いは低周波成分から順に階層的に行う。そして、ある階層までに計算された距離の積算値が閾値判定部（２４）において距離の閾値Ｓを上回ったと判定された場合、閾値Ｓを上回ったことのみを出力して距離計算を打ち切る。

Description

明細書類似度算出方法及び装置技術分野本発明は、 2つのべクトル間のパターンマッチングを高速に行う類似度算出方法及び装置、並びにプログラム及び記録媒体に関する。

本出願は、日本国において 2 0 0 2年 7月 9日に出願された日本特許出願番号 2 0 0 2— 2 0 0 4 8 1を基礎として優先権を主張するものであり、この出願は参照することにより、本出願に援用される。背景技術従来より、既知の'パターンと略々同じパターンを未知の入力信号から検出したり、 2つの信号間の類似性を評価したりするため、音響処理技術、画像処理技術、通信技術、レーダ技術など、信号処理が関係するあらゆる技術分野でデータの類似性や一致性の判定が行われている。一般に、類似データの検出には、データを特徴ベクトル化し、その距離又は角度（相関）の大きさによって類似性を判定する手法が用いられている。

特に、入力値と全ての候補それぞれとの類似度を求めた上で最も距離の近いものを決定する、いわゆる全探索（fu l l search) が、最もシンプル且つ検出漏れのない手法であり、データ量が少ない場合によく用いられている。しかしながら、例えば大量に蓄積された映像や音声から、入力映像や入力音声と類似する部分を検索する場合には、毎秒あたりの特徴ベクトルの次元が大きく、また、それらが数十乃至数百時間分蓄積されたものに対しての検索が行われるため、このような単純な全探索を行うと、検索時間が膨大なものとなる問題がある。

一方、大量のデータを検索するためには、例えば文書検索等の記号化されたデ —夕の完全一致検索を行う場合などに、二分木法（b inary t ree search) やハツシュ法などの高速化技術が用いられる。これは、予めデータを順序立てて格納し、検索時には入力データと異なる枝或いはテーブルの比較を省略することで高速化するものである。しかしながら、例えば映像や音声等の物理信号を対象とする場合、デ一夕には本質的に歪みやノイズがあるため、記号化されたデータが完全に一致することは稀であり、このような高速化技術を用いた場合には多数の検出漏れが発生してしまう。また、データが本質的に多次元であることから、予めデー夕に一意の順序付けを施しておくことが困難であるという問題がある。

そこで、日本特許公開公報平 8— 1 2 3 4 6 0号には、データ登録時に距離の近い複数のべクトルをグループ化して 1つの代表べクトルで代表させる処理を行い、検索時に先ず入力ベクトルと代表ベクトルとの間の距離を計算し、その距離が近いグループのべクトルについてのみグループ内の全てのべクトルとの比較を行うことで、類似ベクトル検索を高速化し、且つ、多次元でベクトルの歪みを反映させることのできる技術が提案されている。

また、日本特許公開公報 2 0 0 1 - 1 3 4 5 7 3号には、べクトルを符号化して短い符号により索引付けすることで、距離計算回数の増加を抑制し、高速な類似データ検索を可能とする技術が提案されている。

しかしながら、上述した日本特許公開公報平 8— 1 2 3 4 6 0号に記載された技術では、登録時に適切なグループ分けと代表ベクトルの選択が必要とされ、登録操作が煩雑になるという問題があった。また、検索時においても、例えば入力べクトルと最小距離にある登録べクトルが、入力べクトルと最小距離にある代表べクトルが代表するグループに属しているとは限らないため、検索すべきグループを決定する操作が煩雑になるという問題があった。

また、上述した日本特許公開公報 2 0 0 1 - 1 3 4 5 7 3号に記載された技術では、符号化する際にベクトル間の距離関係が失われるか、又は非加算的若しくは非単調で複雑な距離関係となり、登録や検索の仕組みが煩雑になるという問題があった。

ここで、映像や音声は本質的に時系列であるため、登録は実時間で行われることが望ましく、また、検索時には、時間順序を反映できるものであることが望ましい。言い換えれば、上述の日本特許公開公報平 8— 1 '2 3 4 6 0号や日本特許公開公報 2 0 0 1 - 1 3 4 5 7 3号に記載された技術のように、時系列を入れ替えるような登録操作を必要としたり、更新時に既登録のデータや索引に対する配置替えを必要とするような手法は、時系列データの検索には適切でない場合がある。

すなわち、

( a ) 全探索の構造的シンプルさ、歪みに対する頑健さを失わず、

( b ) 登録や削除が実時間以内で行われ、

( c ) 登録や削除によって他の既登録データに対する操作を必要としないという条件を満たしつつ、全探索よりも遙かに短時間に検索が行われるような仕組みが望まれている。発明の開示本発明は、このような従来の実情に鑑みて提案されたものであり、上述の条件を満たしつつ、 2つのべクトル間のパターンマッチングを高速に行う類似度算出方法及び装置、並びにその類似度算出処理をコンピュータに実行させるプロダラム及びそのようなプログラムが記録されたコンピュータ読み取り可能な記録媒体を提供することを目的とする。

上述した目的を達成するために、本発明に係る類似度算出方法は、 2つの入力べクトル間の類似度を求める類似度算出方法であって、上記 2つの入力べクトル間の距離算出を階層的に行う階層的距離算出工程と、上記階層的距離算出工程の各階層で算出された距離の積算値を予め設定された閾値と比較する閾値比較工程と、上記閾値比較工程における比較結果に応じて、上記階層的距離算出工程における距離算出を制御する制御工程と、最後の階層までに算出された距離の積算値を上記類似度として出力する出力工程とを有し、上記制御工程では、上記閾値比較工程において、ある階層までに算出された距離の積算値が上記閾値を上回った場合、距離算出を打ち切るように制御する。

このような類似度算出方法は、 2つのべクトル間の距離算出を階層的に行い、ある階層までに算出された距離の積算値が所定の閾値を上回るものについては閾値以上であることのみを検出して実際の距離を算出しないことにより、演算を高速化する。

また、この類似度算出方法は、上記 2つの入力ベクトルに対して所定の変換を施す変換工程をさらに有していてもよく、この場合、上記階層的距離算出工程では、上記変換工程にて変換された上記 2つの入力ベクトル間の距離算出が、上記所定の変換に基づく所定の順序で行われる。ここで、上記所定の変換とは、例えば、入力べクトルを構成する各成分の順序を当該各成分の分散の大きさに従って並べ替える変換、離散コサイン変換、離散フーリエ変換、ウオルシューァダマ一ル変換、或いは力ルーネンーレ一ベ変換である。

さらに、この類似度算出方法は、上記変換工程にて変換された上記 2つの入力べクトルの各々について、当該入力べクトルを構成する各成分を上記所定の順序で取り出して階層的な複数の部分べクトルに分割する分割工程を有していてもよく、この場合、上記階層的距離算出工程では、最上位階層の部分ベクトルから順に部分べクトルを構成する各成分間の距離算出が階層的に行われ、ある階層までの部分べクトルを構成する全ての成分間について算出された距離の積算値が上記閾値を下回った場合、一階層下位の部分べクトルを構成する各成分間の距離算出が行われる。

また、上述した目的を達成するために、本発明に係る類似度算出装置は、 2つの入力べクトル間の類似度を求める類似度算出装置であって、上記 2つの入力べクトル間の距離算出を階層的に行う階層的距離算出手段と、上記階層的距離算出手段によって各階層で算出された距離の積算値を予め設定された閾値と比較する閾値比較手段と、上記閾値比較手段による比較結果に応じて、上記階層的距離算出手段による距離算出を制御する制御手段と、最後の階層までに算出された距離の積算値を上記類似度として出力する出力手段とを備え、上記制御手段は、上記閾値比較工程による比較の結果、ある階層までに算出された距離の積算値が上記閾値を上回った場合、距離算出を打ち切るように制御する。

このような類似度算出装置は、 2つのべクトル間の距離算出を階層的に行い、ある階層までに算出された距離の積算値が所定の閾値を上回るものについては閾値以上であることのみを検出して実際の距離を算出しないことにより、演算を高速化する。

また、この類似度算出装置は、上記 2つの入力べクトルに対して所定の変換を施す変換手段をさらに備えていてもよく、この場合、上記階層的距離算出手段は，上記変換手段によって変換された上記 2つの入力べクトル間の距離算出を、上記所定の変換に基づく所定の順序で行う。ここで、上記所定の変換とは、例えば、入力べクトルを構成する各成分の順序を当該各成分の分散の大きさに従って並べ替える変換、離散コサイン変換、離散フーリエ変換、ウオルシュ一アダマール変換、或いはカルーネンーレーべ変換である。

さらに、この類似度算出装置は、上記変換手段によって変換された上記 2つの入力べクトルの各々について、当該入力べクトルを構成する各成分を上記所定の順序で取り出して階層的な複数の部分ベクトルに分割する分割手段を備えていてもよく、この場合、上記階層的距離算出手段は、最上位階層の部分ベクトルから順に部分べクトルを構成する各成分間の距離算出を階層的に行い、ある階層までの部分べクトルを構成する全ての成分間について算出した距離の積算値が上記閾値を下回った場合、一階層下位の部分べクトルを構成する各成分間の距離算出を行う。

また、本発明に係るプログラムは、上述した類似度算出処理をコンピュータに実行させるものであり、本発明に係る記録媒体は、そのようなプログラムが記録されたコンピュー夕読み取り可能なものである。

本発明の更に他の目的、本発明によって得られる具体的な利点は、以下に説明される実施例の説明から一層明らかにされるであろう。図面の簡単な説明図 1は、第 1の実施の形態における類似べクトル検出装置の概略構成を説明する図である。

図 2は、同類似べクトル検出装置におけるべクトル登録時の処理を説明するフ口—チヤ—卜である。

図 3は、同類似べクトル検出装置におけるべクトル検索時の処理を説明するフローチャー卜である。

図 4は、第 1の実施の形態における処理を直観的に説明するための図である。図 5は、特徴空間内のべクトルの分布に偏りがある例を示す図である。

図 6は、第 2の実施の形態における類似べクトル検出装置の概略構成を説明する図である。

図 7は、同類似べクトル検出装置におけるべクトル登録時の処理を説明するフローチャートである。

図 8は、同類似べクトル検出装置におけるべクトル検索時の処理を説明するフ口—チヤ一トである。

図 9は、第 3の実施の形態における類似べクトル検出装置の概略構成を説明する図である。

図 1 0は、同類似べクトル検出装置におけるべクトル登録時の処理を説明するフローチヤ一トである。

図 1 1は、同類似ベクトル検出装置におけるベクトル検索時の処理を説明するフローチヤ一トである。

図 1 2は、音響信号から音響特徴ベクトルを抽出する処理の一例を説明するフ口一チヤ一トである。

図 1 3は、音響信号から音響特徴べクトルを抽出する処理の一例を説明する図である。

図 1 4は、音響信号における変換符号化を説明する図である。

図 1 5は、符号化音響信号から音響特徴ベクトルを抽出する処理の一例を説明するフローチャートである。

図 1 6は、符号化音響信号から音響特徴ベクトルを抽出する処理の一例を説明する図である。

図 1 7は、映像信号から映像特徴ベクトルを抽出する処理の一例を説明するフ口—チヤ一トである。

図 1 8は、映像信号から映像特徴ベクトルを抽出する処理の一例を説明する図である。

図 1 9は、映像信号から映像特徴ベクトルを抽出する処理の他の例を説明するフロ一チヤ一トである。

図 2 0は、映像信号から映像特徴ベクトルを抽出する処理の他の例を説明する図である。

図 2 1は、符号化映像信号から映像特徴ベクトルを抽出する処理の他の例を説明するフローチヤ一トである。

図 2 2は、符号化映像信号から映像特徴べクトルを抽出する処理の他の例を説明する図である。発明を実施するための最良の形態以下、本発明を適用した具体的な実施の形態について、図面を参照しながら詳細に説明する。この実施の形態は、本発明を、複数の登録ベクトルの中から入力べクトルに類似するべクトルを高速に検出する類似べクトル検出方法及びその装置に適用したものである。

具体的には、本実施の形態における類似べクトル検出方法及びその装置では、 2つのべクトル間の距離を算出するにあたり、その距離が所定の閾値を下回るものについてはその距離を算出し、所定の閾値を上回るものについては閾値以上であることのみを検出して実際の距離を算出しないことにより、類似べクトル検出の演算を高速化する。なお、本実施の形態における類似ベクトル検出装置では、距離が閾値を上回る場合には、便宜上一 1を出力することとする。

以下、距離を算出する 2つのべクトル f 及びべクトル gを、以下の式（1 ) 、 ( 2 ) のように表記する。

f = (f [l],f [2]，一,f [N])t · · · (1) g = (g [l [2],' ',g [N])t · · · (2) ここで、式（ 1 ) において、 f [1] , f [2] ,…は、べクトル f の各成分を表し、式（2 ) において g [1] , g [2] ,…は、ベクトル gの各成分を表す。また、 tは転置を表し、 Nはベクトルの次元を表す。

( 1 ) 第 1の実施の形態

第 1の実施の形態における類似べクトル検出装置の概略構成を図 1に示す。図 1に示すように、類似ベクトル検出装置 1は、ベクトル f 、ベクトル gを入力してそのベクトル間の自乗距離（又は— 1 ) を出力するものであり、記録部 1 0と、階層的距離演算部 1 1と、閾値判定部 1 2とから構成される。

この類似べクトル検出装置 1における登録時の処理を図 2のフローチヤ一トを用いて説明する。先ずステツプ S 1において、記録部 1 0 (図 1 ) は、予め登録ベクトル gを入力する。一般にベクトル gは複数であり、膨大な数になることが多い。そして、続くステップ S 2において、記録部 1 0は、入力したベクトル g を記録する。

このように、第 1の実施の形態では、登録時に特別な操作を行う必要がないため簡便であり、実時間での処理に適する。なお、記録部 1 0は、例えば磁気ディスク、光ディスク、或いは半導体メモリ等である。

続いて、類似べクトル検出装置 1における検索時の処理を図 3のフ口一チヤ一トを用いて説明する。先ずステップ S 1 0において、閾値判定部 1 2 (図 1 ) は, 距離の閾値 Sを設定し、続くステップ S 1 1において、階層的距離演算部 1 1は, べクトル f を入力すると共に、記録部 1 0に記録されているべクトル gを 1つ取得する。

続いてステップ S 1 2において、階層的距離演算部 1 1は、内部変数である成分番号 iを 1に、距離の積算値 s u mを 0にそれぞれセットし、ステップ S 1 3 において、ベクトル f の第 i成分 f [i]とベクトル gの第 i成分 g [i]との間で、以下の式（3 ) で示すような積算演算を行う。

sum =sum +(f [i] - gは ι )² . . . (3) ステップ S 1 4において、閾値判定部 1 2は、積算値 s u mが閾値 S未満であるか否かを判別する。積算値 s u mが閾値 S未満である場合（Yes) にはステップ S 1 6に進み、積算値 s u mが閾値 S以上である場合（No) にはステップ S 1 5 で閾値判定部 1 2が— 1を出力して処理を終了する。ここで、出力される一 1は、上述したように、入力されたべクトル f と取得されたべクトル gとの距離が閾値 Sを上回り、このベクトル gが棄却されたことを示す便宜的な数値である。このように、閾値判定部 1 2は、閾値 Sを設け、積算演算の途中の階層で積算値 s u mが閾値 Sを上回つた場合に階層的距離演算部 1 1での積算演算を打ち切ることで、処理の高速化を図っている。

ステップ S 1 6では、成分番号 iがベクトル f 、ベクトル gの次元数 N以下であるか否かが判別される。成分番号 iが N以下である場合（Yes) には、ステップ S 1 7で iをインクリメントしてステップ S 1 3に戻る。一方、成分番号 iが N よりも大きい場合（No) には、ベクトル f 、ベクトル gの最後の成分まで積算演算が終了しているため、ステップ S 1 8で閾値判定部 1 2が積算値 s u mを出力して処理を終了する。なお、このときの積算値 s u mは、ベクトル間距離の自乗となる。

以上、図 3のフローチャートでは、 1つの登録ベクトル gに対する処理を示したが、実際には登録されている全てのベクトル gについて同様の処理を行い、ベクトル ίとの距離の積算値 s u mが閾値 Sを下回った全てのべクトル gを、べクトル f に類似するべクトルとして出力する。

以上説明した第 1の実施の形態における処理を直観的に説明すると、図 4に黒丸で示す多数の登録べクトルについて、図中 Xで示す入力べクトルからの距離が半径の超球の範囲内の登録べクトルに対してのみ正確な距離を算出し、範囲外の登録べクトルに対しては、各軸毎の距離の積算値が半径を上回った時点で棄却する処理を行っていることに相当する。

なお、上述の説明ではベクトル間の自乗距離を用いたが、自乗距離に限らず、任意の距離尺度に対して同様の手法を用いることができる。但し、自乗距離を用いる場合には、積算値 s u mが各成分間距離の積算値に対して単調に増加するため、誤棄却を発生させることがない。また、各成分間の距離の総和はベクトル間の距離に一致するため、距離が閾値^ S以下であるベクトル f 、ベクトル gに関しては、単純な全探索法と全く同じ距離が出力され、誤差が発生することがない。さらに、この手法では、時系列関係を崩す参照テーブル等を作成す'る必要がないため、デ一夕の更新や削除を時系列順序に従って行うことができ、処理や管理が容易である。また、時系列順序に従って検索を行うことや、検索する時系列範囲を指定することも容易に可能である。

( 2 ) 第 2の実施の形態

上述した第 1の実施の形態では、距離の閾値 Sを設定することで、全検索と同等の検索を高速に行うことができたが、この手法では、どのベクトル成分から検索を行うかはべクトルの並び順に依存するため、この並び順によつて検索速度に差が生じる。例えば、図 5のように特徴空間内のベクトルの分布に偏りがあるような場合には、 f [1]軸と f [2]軸とのどちらを先に積算するかによって検索速度が大きく異なる。この例では、 f [2]軸を先に評価する方が余計な積算が少なくなり高速化できる。

そこで、以下に説明する第 2の実施の形態では、以下の式（4 ) 、 ( 5 ) に示すように、入力ベクトル f 、登録ベクトル gに対して正規直交変換行列 Uを乗算して直交変換を行い、この直交変換後のベクトル f '、ベクトル g 'を用いて有意性の高い順に検索を行うことで、さらに検索を高速化する。

f '- Uf ' · · (4) g - Ug . . . (5)

なお、以下の式（6 ) に示すように、正規直交変換行列 Uによっては 2つのべクトル g、べクトル f 間の自乗距離 d ²は変わらない。

(6)

第 2の実施の形態における類似べクトル検出装置の概略構成を図 6に示す。図 6に示すように、類似ベクトル検出装置 2は、ベクトル、ベクトル gを入力してそのベクトル間の距離（又は— 1 ) を出力するものであり、ベクトル変換部 2 0 , 2 1と、記録部 2 2と、階層的距離演算部 2 3と、閾値判定部 2 4とから構成される。ここで、ベクトル変換部 2 0， 2 1は、それぞれベクトル g、べクトル f に対して同様の変換を施すものである。また、記録部 2 2は、例えば磁気デイスク、光ディスク、或いは半導体メモリ等である。

この類似べクトル検出装置 2における登録時の処理を図 7のフローチャートを用いて説明する。先ずステップ S 2 0において、ベクトル変換部 2 0 (図 6 ) は、予め登録べクトル gを入力し、続くステップ S 2 1において、上述した式 ( 5 ) のようにベクトル gを変換し、ベクトル g 'を生成する。そして、ステップ S 2において、記録部 1 0は、変換されたベクトル g 'を記録する。

続いて、類似べクトル検出装置 2における検索時の処理を図 8のフローチヤ一トを用いて説明する。先ずステップ S 3 0において、閾値判定部 2 4 (図 6 ) は、距離の閾値 Sを設定し、続くステップ S 3 1において、ベクトル変換部 2 1がべクトル f を入力すると共に、階層的距離演算部 2 3が記録部 2 2に記録されているベクトル g 'を 1つ取得する。

続いてステップ S 3 2において、ベクトル変換部 2 1は、上述した式（4 ) のようにべクトル f を変換し、ベクトル： f 'を生成する。

ステップ S 3 3において、階層的距離演算部 2 3は、内部変数である成分番号 iを 1に、距離の積算値 s u mを 0にそれぞれセットし、. ステップ S 3 4において、ベクトル f 'の第 i成分 f ' [i]とベクトル g 'の第 i成分 g' [i]との間で、以下の式（7 ) で示すような積算演算を行う。 sum =sum ⁺(f'[i]^_g'[i])² · · · (7)

ステップ S 3 5において、閾値判定部 24は、積算値 s umが閾値 S未満であるか否かを判別する。積算値 s umが閾値 S未満である場合（Yes) にはステップ S 37に進み、積算値 s umが閾値 S以上である場合（No) にはステップ S 3 6 で閾値判定部 24がー 1を出力して処理を終了する。

ステップ S 37では、成分番号 iがベクトル Γ、ベクトル g'の次元数 Ν以下であるか否かが判別される。成分番号 iが N以下である場合（Yes) には、ステツプ S 38で i をインクリメントしてステツプ S 34に戻る。一方、成分番号 iが Nよりも大きい場合（No) には、ベクトル f '、ベクトル g'の最後の成分まで積算演算が終了しているため、ステップ S 3 9で閾値判定部 24が積算値 s umを出力して処理を終了する。なお、このときの積算値 s umは、ベクトル間距離の自乗となる。

以上、図 8のフローチャートでは、 1つの登録ベクトル g'に対する処理を示したが、実際には登録されている全てのベクトル g'について同様の処理を行い、ベクトル f 'との距離の積算値 s umが閾値 Sを下回った全てのべクトル g'を、ベクトル f 'に類似するべクトルとして出力する。

ここで、上述した正規直交変換行列 Uとしては、種々のものを用いることができるが、以下では、具体的に 4つの例を挙げて説明する。

(2 - 1) 直交変換の具体例

(2 - 1 - 1)

直交変換の最も簡単なものとして順序行列が挙げられる。これは、単純にべクトル成分の順序を並べ替えるものであり、例えば 8次の順序行列 Pは、以下の式 (8) に示すような形で表される。 0 1 0 0 0 0 0 0

1 0 0 0 0 0 0 0

0 0 0 1 0 0 0 0

0 0 1 0 0 0 0 0

P = (8)

0 0 0 0 0 1 0 0

0 0 0 0 1 0 0 0

0 0 0 0 0 0 0 1

0 0 0 0 0 0 1 0

上述した図 5のようにべクトルの各成分の分布が異なる場合、明らかに分散の大きな成分ほど距離に対する寄与が大きい。したがって、並べ替えの順序を決定する際には、予め十分な数（ I個）のサンプルベクトル g iを用意し、以下の式 (9 ) で計算される分散べクトル Vの大きい順に並ぶような順序行列を設定するのが最適である。

なお、この順序行列を用いた直交変換は、各ベクトル成分の広がり方が異なるような場合に有効であり、並べ替えのみでよく乗除算や条件分岐が必要ないため高速である。

( 2— 1 - 2 )

映像特徴量や音響特徴量など、隣接成分間の相関関係が大きい特徴量では、特徵ベクトルを離散信号とみなした場合のエネルギが低周波成分に偏る。

そこで、直交変換として、以下の式（1 0) 、（1 1) で表される離散コサイン変換（Discrete Cosine Transf orm:DCT) や、以下の式（ 12) 、 (1 3) で表される離散フーリエ変換（Discrete Fourier Transforni:DFT) を用い、低周波成分から順に積算を行うことで、有意性の高い成分から順に積算することができ. 距離計算が高速化される。

丄 (n = l)

（m - 1)(2η-1)π

a〔m -丄 )cos ― ― α 一 (11)

- (n≠l)

N

ここで、離散コサイン変換や離散フーリエ変換には高速変換法を用いることができ、また変換行列も全部を保持する必要がないため、計算機で実現する場合のメモリ使用量や演算速度は、行列の全計算を行う場合よりも遙かに有利である。

(2 - 1 - 3)

ウオルシュ一アダマール（Walsh- Hadamard) 変換は、変換行列の各要素が ± 1 のみで構成される直交変換であり、変換時に乗算が必要ないため、高速な変換に適する。ここで、周波数に近い概念として交番数（senuency) を用い、低交番数の成分から順に並べることで、上述した離散コサイン変換や離散フーリエ変換と同様に、隣接成分間の相関関係が大きなべクトルに対して距離計算の高速化が図られる。

ウオルシュ一アダマール変換行列は、フーリェ変換行列の符号に従って構成するか、又は行列の再帰的拡大演算によって構成する。一例として、交番数順に並ベた 8次のウオルシュ一アダマール変換行列 Wを以下の式（ 14) に示す。

(2 - 1 - 4)

予め十分な数のサンプルベクトルが収集され、また、変換演算に多少のコストをかけてもよい場合には、直交変換として最適な力ルーネンーレ一ベ（Karhunen -Loeve) 変換（以下、 KL変換という。 ) を用いることが有効である。

KL変換行列 Tは、サンプルべクトルの分散行列 Vを固有値分解する固有行列であり、固有値を ···， λ_Νとした場合に、以下の式（ 1 5) のように定義される。

V = Τ'ΛΤ , A=diag {λ_ΐ5λ₂,···,λ_Ν} (15) ここで、 K L変換は、各成分間の相関関係を完全に取り除く直交変換行列であり、変換されたベクトル成分の分散が固有値 λ iとなる。したがって、固有値を大きい順に並べるように K L変換行列 Τを構成することで、全ての成分を統合し重複する情報を取り除いた上で、最も分散の大きい軸から距離の積算を行うことができる。

なお、この K L変換を用いた手法では、演算時に K L変換行列 Tを原則として全次元に亘つて保持する必要があり、また、全てのベクトルに対して全次数の行列演算を行う必要があるため、演算コストがかかる。しかしながら、この演算は登録時に行うものであるため、特に高速化が要求される検索処理に要する時間を増やすものではない。

また、若干の精度の劣化は伴うものの、固有値の大きいベクトル成分のみを抽出して保持し、固有値の小さいベクトル成分は保持しないようにすることで、ベクトル自体を圧縮し、記録部 2 2 (図 6 ) の記憶領域やデータ読み込み時間を低減することもできる。

( 3 ) 第 3の実施の形態

上述した第 1、第 2の実施の形態では、距離計算の高速化により検索演算を高速化したが、検索する際には、例えば八一ドディスク等の記録部からのデータ読み込み時間も大きなォ一パ一ヘッドの要因となる。

ここで、上述した第 2の実施の形態における K L変換は、多変量解析分野で主成分分析と呼ばれる分析法にあたり、べクトルを構成する主要な成分を抽出する演算となっている。そこで、以下に説明する第 3の実施の形態では、第 2の実施の形態で得られた変換後のべクトル g 'の主要成分を索引べクトル g i、残りの成分を詳細ベクトル g ₂として記録する。検索時には、先ず索引ベクトル g を参照して距離計算を行い、その結果が閾値 S未満である場合にのみ詳細べクトル g ₂を取得してさらに距離計算を行うことで、データ読み込み時間の短縮化を図ることができる。

第 3の実施の形態における類似べクトル検出装置の概略構成を図 9に示す。図 9に示すように、類似ベクトル検出装置 3は、ベクトル f 、ベクトル gを入力してそのベクトル間の自乗距離（又は— 1 ) を出力するものであり、ベクトル変換部 3 0 , 3 1と、索引記録部 3 2と、詳細記録部 3 3と、階層的距離演算部 3 4 と、閾値判定部 3 5とから構成される。ここで、ベクトル変換部 3 0 , 3 1は、それぞれべクトリレ8、べクトル f に対して上述した第 2の実施の形態と同様の変換を施すものである。また、索引記録部 3 2、詳細記録部 3 3は、例えば磁気デイスク、光ディスク、或いは半導体メモリ等である。

この類似べクトル検出装置 3における登録時の処理を図 1 0のフローチャートを用いて説明する。先ずステップ S 4 0において、ベクトル変換部 3 0 (図 9) は、予め登録ベクトル gを入力し、続くステップ S 4 1において、上述した式

( 5 ) のようにベクトル gを変換し、ベクトル g'を生成する。さらにベクトル変換部 3 0は、成分番号の小さいもの、すなわち上述した変換で分散や固有値の大きい成分、或いは低周波成分から順に、所定数 M (1≤ <N) の成分を持つ索引ベクトルと、残りの成分を持つ詳細ベクトル g₂とに分割する。そしてステップ S 42において、索引記録部 3 2が索引ベクトル g iを記録し、ステップ S 4 3において、詳細記録部 3 3が詳細べクトル g ₂を記録する。

続いて、類似べクトル検出装置 3における検索時の処理を図 1 1のフローチヤートを用いて説明する。先ずステップ S 5 0において、閾値判定部 3 5 (図 9 ) は、距離の閾値 Sを設定し、続くステップ S 5 1において、ベクトル変換部 3 1 がべクトル f を入力すると共に、階層的距離演算部 3 4が索引記録部 3 2に記録されている索引ベクトル g iを 1つ取得する。

続いてステップ S 5 2において、ベクトル変換部 3 1は、上述した式（4) のようにベクトル f を変換し、ベクトル Γを生成する。さらにベクトル変換部 3 1 は、成分番号の小さいものから順に、所定数 M ( 1≤M<N) の成分を持つ索引べクトル f iと、残りの成分を持つ詳細べクトル ί ₂とに分割する。

ステップ S 5 3において、階層的距離演算部 3 4は、内部変数である成分番号 iを 1に、距離の積算値 s umを 0にそれぞれセットし、ステップ S 5 4において、ベクトル ί 'の第 i成分 Γ [i]とベクトル g'の第 i成分 g' [i]との間で、以下の式（1 6) で示すような積算演算を行う。 sum =sum +(f '[i] - g'fi])² · . · (16)

ステップ S 5 5において、閾値判定部 3 5は、積算値 s umが閾値 S未満であるか否かを判別する。積算値 s umが閾値 S未満である場合（Yes) にはステップ S 5 7に進み、積算値 s umが閾値 S以上である場合（No) にはステップ S 56 で閾値判定部 3 5が— 1を出力して処理を終了する。ここで、出力される一 1は、上述したように、距離が閾値を上回り棄却されたことを示す便宜的な数値である。ステップ S 5 7では、成分番号 iが索引ベクトル f 索引ベクトルの次元数 M以下であるか否かが判別される。成分番号 iが M以下である場合（Yes) には、ステップ S 58で iをインクリメントしてステップ S 54に戻る。一方、成分番号 iが Mよりも大きい場合（No) には、階層的距離演算部 34は、詳細記録部 3 3に記録されている詳細べクトル g ₂を 1つ取得する。

ステップ S 6 0において、階層的距離演算部 34は、ベクトルの第 i成分 ί ' [i]とべクトル g'の第 i成分 g' [i]との間で、上述の式（1 6) で示すような積算演算を行う。

ステップ S 6 1において、閾値判定部 3 5は、積算値 s umが閾値 S未満であるか否かを判別する。積算値 s umが閾値 S未満である場合（Yes) にはステップ S 6 3に進み、積算値 s umが閾値 S以上である場合（No) にはステップ S 6 2 で閾値判定部 3 5がー 1を出力して処理を終了する。

ステップ S 6 3では、成分番号 iがベクトル f '、ベクトル g'の次元数 N以下であるか否かが判別される。成分番号 iが N以下である場合（Yes) には、ステツプ S 64で iをインクリメントしてステップ S 6 0に戻る。一方、成分番号 iが Nよりも大きい場合（No) には、ベクトル f '、ベクトル g'の最後の成分まで積算が終了しているため、ステップ S 6 5で閾値判定部 3 5が積算値 s umを出力して処理を終了する。このとき積算値 s umは、ベクトル間距離の自乗となる。以上、図 1 1のフローチャートでは、 1つの登録ベクトル g 'に対する処理を示したが、実際には登録されている全てのべクトル g 'について同様の処理を行い、べクトル Γとの距離の積算値 s u mが閾値 Sを下回った全てのべクトル g 'を、ベクトル 'に類似するべクトルとして出力する。

上述した第 3の実施の形態では、第 1、第 2の実施の形態と比較して記憶容量や精度は変わらず、演算速度も殆ど変わらないが、大半の比較が索引ベクトル g の段階で棄却され詳細べクトル g ₂を取得する必要が少ない場合に、デ一夕ァクセスによるオーバーへッドが解消される。

なお、上述の説明では、ベクトルを索引ベクトルと詳細ベクトルとの 2段階に分割するものとしたが、同様に索引べクトルをさらに上位の索引べクトルと詳細な索引べクトルに分割して 3段構成にするなど、多段化への拡張が可能であることは勿論である。

( 4 ) 特徴べクトルの抽出

以下では、音響信号や映像信号から特徴べクトルを抽出する手法について説明する。後述のようにして音響特徴べクトル及び/又は映像特徴べクトルを抽出し、これを上述したベクトル f 、ベクトル gとして用いることで、音響信号や映像信号が入力された場合に、上述の第 1乃至第 3の実施の形態の手法を用いて、登録された音響信号や映像信号から、類似する音響信号や映像信号を高速に検索することができる。

( 4 - 1 ) 音響特徴ベクトルの抽出

( 4 - 1 - 1 )

音響信号に関する特徴量としてパワースぺクトル係数を用いる場合の例について、図 1 2のフローチャートと図 1 3を用いて説明する。先ずステツプ S 7 0において、図 1 3に示すように、対象時区間内の音響信号から時間区間 T毎の音響信号を取得する。

次にステップ S 7 1では、取得した音響信号に対して例えば高速フーリエ変換等のスペクトル演算を施し、短時間区間毎にパワースペクトル係数 S _q ( q = 0 , 1 , Q - 1 ) を求める。ここで、 Qは離散周波数を表すインデックスであり、 Qは最大離散周波数である。続いてステップ S 7 2では、対象時区間内の計算を終えたか否かが判別され、終えている場合（Yes) にはステップ S 7 3に進み、終えていない場合（No) にはステップ S 7 0に戻る。

ステップ S 7 3では、求めたパワースぺクトル係数 S _qの平均スぺクトル S'_qを計算し、ステップ S 74においてこの平均スペクトル Sヽをベクトル化し、音響特徴ベクトル aを生成する。この音響特徴ベクトル aは、例えば以下の式（1 7) のように表される。

なお、上述の例では、対象時区間内の音響信号を時間区間 T毎に区切るものとして説明したが、対象時区間が短い場合には、時間区間 T毎に区切らずにスぺクトル演算を施すようにしても構わない。

また、上述の例では、パワースペクトル係数を用いた例について説明したが、これに限定されるものではなく、例えば等価な情報を持つケプストラム係数等を用いることもできる。さらに、フーリエ変換ではなく AR (Auto-Regressive) モデルを用いる線形予測係数によっても同様の効果を得ることができる。

(4 - 1 - 2)

音響信号は膨大であるため、圧縮符号化されて記録、或いは伝送されることが多い。符号化された音響信号を復号してベースバンドに戻した後、上述の手法を用いて音響特徴べクトル aを抽出することも可能であるが、部分的な復号のみで音響特徴ベクトル aを抽出できれば、抽出処理を効率化、高速化することができる。

ここで、一般的に用いられる符号化法である変換符号化では、図 14に示すように、原音となる音響信号が時間区間 T毎にフレームに区切られる。そして、そのフレーム毎の音響信号に対して変更離散コサイン変換（Modified Discrete Co s ine Trans f orm:MDCT) 等の直交変換が施され、その係数が量子化されて符号化される。この際、周波数帯域毎に、大きさの正規化係数であるスケールファクタが抽出され、別途符号化される。そこで、このスケールファクタのみを復号することにより、音響特徴べクトル aとして用いることができる。

このように、音響信号に関する特徴量としてスケールファクタを用いる場合の例について、図 1 5のフローチャートと図 1 6を用いて説明する。先ずステツプ S 8 0において、対象時区間における時間区間 T内の符号化音響信号が取得され、ステップ S 8 1において、フレーム毎のスケールファクタが部分的に復号される。続いてステップ S 8 2では、対象時区間内の復号を終えたか否かが判別され、終えている場合（Ye s) にはステップ S 8 3に進み、終えていない場合（No) にはステツプ S 8 0に戻る。

ステップ S 8 3では、対象時区間内のスケールファクタの中から各帯域毎に最大のスケールファクタを検出し、ステップ S 8 4においてそれらをべクトル化し、音響特徴べクトル aを生成する。

このようにして、符号化音響信号を完全に復号することなく、上述と等価な音響特徴べクトル aを高速に抽出することができる。

( 4一 2 ) 映像特徴ベクトルの抽出

( 4 - 2 - 1 )

映像信号に関する特徴量として輝度情報及び色情報を用いる場合の例について、図 1 7のフ口一チヤ一ト及ぴ図 1 8を用いて説明する。先ずステツプ S 9 0において、図 1 8に示すように、対象時区間 T内の映像信号から映像フレームを取得する。

次にステップ S 9 1では、取得した全ての映像フレームに基づいて、時間平均画像 1 0 0を作成する。

続いてステップ S 9 2では、作成された時間平均画像 1 0 0を橫縦 X X Y個の小ブロックに分割し、各ブロック内の画素値を平均したブロック平均画像 1 1 0 を作成する。

そしてステップ S 9 3では、これらを例えば左上から右下へ向かって R , G , Bの順に並べて、 1次元の映像特徴ベクトル Vを生成する。この映像特徴べクトル vは、例えば以下の式（1 8 ) のように表される。

v = R 00 , R Χ-Ι,Υ-1 , G 00： , G χ-ι,γ· I , D₀₀， '，B X-LY-1 (1 8)

なお、上述の例では、時間平均画像 1 0 0を分割したブロック平均画像 1 1 0 の画素値を並べ替えて 1次元の映像特徴べクトル Vを生成する例について説明したが、これに限定されるものではなく、ブロック平均画像 1 1 0を作成せずに、時間平均画像 1 0 0の画素値を並べ替えて 1次元の映像特徴べクトル Vを生成するようにしても構わない。

また、通常、映像信号の時間変化はあまり激しくないため、時間平均画像 1 0 0を作成せずに、対象時区間内の 1フレームを代表画像として選択して代用しても、ほぼ同様の効果を得ることができる。

( 4 — 2 — 2 )

全く同一な映像信号でなくても、例えばニュース映像の同じアンダルから撮影されたスタジオ映像など、全画像に対する色の分布が鑌似する映像には何らかの関連があることが多く、これらを同一視して検索する要求もある。このような場合には、画像の空間依存性を排除し、色分布のヒストグラムを作成して比較すると効果的である。

そこで、このように色分布のヒストグラムを特徴量として用いる場合の例について、図 1 9のフローチヤ一ト及び図 2 0を用いて説明する。先ずステツプ S 1 0 0において、図 2 0に示すように、対象時区間 T内の映像信号から映像フレームを取得する。

次にステップ S 1 0 1では、各映像フレームの信号値から、各色、例えば R， G , Bの信号値に対するヒストグラムを作成する。

そしてステップ S 1 0 2では、これらを例えば R , G , Bの順に並べて、 1次元の映像特徴ベクトル Vを生成する。この映像特徴ベクトル Vは、例えば以下の式（ 1 9) のように表される,

v=(R₀,-₅R_N__l5G₀,-,G_N__l5B_c ,Β N-l (19)

なお、上述の例では、 R， G, Bの信号値に対するヒストグラムを作成するものとして説明したが、輝度（Y) 、色差（C b、 C r) の信号値に対するヒストグラムを作成するようにしても、同様の効果を得ることができる。

(4 - 2 - 3 )

映像信号は膨大であるため、圧縮符号化されて記録、或いは伝送されることが多い。符号化された映像信号を復号してベースバンドに戻した後、上述の手法を用いて映像特徴べクトル Vを抽出することも可能であるが、部分的な復号のみで映像特徴ベクトル Vを抽出できれば、抽出処理を効率化、高速化することができる。

MP EG 1 (Moving Picture Experts Grou 1) 又は M P E G 2で圧縮符号化された映像信号から映像特徴ベクトル vを抽出する場合の例について、図 2 1のフローチャートと図 22を用いて説明する。先ずステップ S 1 10において、ベクトル化する対象時区間 Tに対して、その直近の符号化グループ（Group of Pic tures:G0P) の符号化映像信号を取得し、その GO P内のフレーム内符号化ピクチャ（ I ピクチャ） 1 20を取得する。

ここで、フレーム画像は、マクロブロック MB ( 1 6 X 1 6画素、又は 8 X 8 画素）を単位として符号化されており、また、離散コサイン変換（DCT) が用いられている。この D C T変換された D C係数は、マクロブロック内画像の画素値の平均値にあたる。

そこで、ステップ S 1 1 1では、この DC係数を取得し、続くステップ S 1 1 2では、これらを例えば Y, Cb, C rの順に並べて、 1次元の映像特徴べク卜ル Vを生成する。この映像特徴ベクトル Vは、例えば以下の式（20) のように表される。

v一 (Too , · · ·， Υχ-ι'γ-ι ' Cb₀₀ , · · · , Cb_x_j _Y_j , Cr₀₀ , · · · , Cr_x -l.Y-l (20)

このようにして、符号化映像信号を完全に復号することなく、映像特徴べクトル Vを高速に抽出することができる。

なお、上述の例では、 M P E G 1又は M P E G 2で圧縮符号化された映像信号を用いるものとして説明したが、他の圧縮符号化方式にも適用可能である。

( 5 ) その他

以上説明したように、本実施の形態によれば、ベクトル間の距離に基づいて類似ベクトルを検出する際に、階層的な距離積算演算を行い、予め設定された距離に対する閾値を上回った時点で打ち切ることで、類似べクトルを高速に検出することができる。特に、大量の登録ベクトルの中から、入力ベクトルと類似するべクトルを検出するような場合には、殆どの登録べクトルは非類似であり閾値を上回ってしまうため、距離計算を早期に打ち切ることができ、検出時間を大幅に短縮することができる。

また、予めベクトルに対して順序変換、離散コサイン変換、離散フーリエ変換、ウオルシュ一アダマール変換、或いは K L変換を施し、有意性の高いベクトル成分、すなわち、上述の変換で分散や固有値の大きい成分、或いは低周波成分から順に積算演算を行うようにすることで、ベクトル成分の分布を考慮して、効率的且つ高速に類似するべクトルを検出することができる。

したがって、音響信号や映像信号の検索を行う際にも、予め音響特徴ベクトル及び Z又は映像特徴べクトルを抽出して登録しておくことで、任意の音響信号や映像信号が入力された場合に、全検索と同様の構造的シンプルさや検索精度を保持したまま、類似する音響信号や映像信号を高速に検索することができる。

なお、本発明は、図面を参照して説明した上述の実施例に限定されるものではなく、添付の請求の範囲及びその主旨を逸脱することなく、様々な変更、置換又はその同等のものを行うことができることは当業者にとって明らかである。

例えば、上述の実施の形態では、ハードウェアの構成として説明したが、これに限定されるものではなく、任意の処理を、 C P U (Central Process ing Uni t) にコンピュータプログラムを実行させることにより実現することも可能である。この場合、コンピュータプログラムは、記録媒体に記録して提供することも可能であり、また、インタ一ネットその他の伝送媒体を介して伝送することにより提供することも可能である。産業上の利用可能性上述した本発明によれば、 2つのベクトル間の距離算出を階層的に行い、ある階層までに算出された距離の積算値が所定の閾値を上回るものについては閾値以上であることのみを検出して実際の距離を算出しないことにより、演算を高速化することができる。特に、大量の登録ベクトルの中から、入力ベクトルと類似するべクトルを検出するような場合には、殆どの登録べクトルは非類似であり閾値を上回ってしまうため、距離算出を早期に打ち切ることができ、検出時間を大幅に短縮することができる。

Claims

請求の範囲

1 . 2つの入力べクトル間の類似度を求める類似度算出方法であって、

上記 2つの入力ベクトル間の距離算出を階層的に行う階層的距離算出工程と、上記階層的距離算出工程の各階層で算出された距離の積算値を予め設定された閾値と比較する閾値比較工程と、

上記閾値比較工程における比較結果に応じて、上記階層的距離算出工程における距離算出を制御する制御工程と、

最後の階層までに算出された距離の積算値を上記類似度として出力する出力ェ程とを有し、

上記制御工程では、上記閾値比較工程において、ある階層までに算出された距離の積算値が上記閾値を上回った場合、距離算出を打ち切るように制御することを特徴とする類似度算出方法。

2 . 請求の範囲第 1項記載の類似度算出方法であって、

上記階層的距離算出工程では、上記 2つの入力べクトルを構成する各成分間の距離算出が階層的に行われ、ある階層までに算出された距離の積算値が上記閾値を下回った場合、次の成分間の距離算出が行われることを特徴とする類似度算出方法。

3 . 請求の範囲第 2項記載の類似度算出方法であって、

上記 2つの入力べクトルに対して所定の変換を施す変換工程をさらに有し、上記階層的距離算出工程では、上記変換工程にて変換された上記 2つの入力べクトル間の距離算出が、上記所定の変換に基づく所定の順序で行われることを特徴とする類似度算出方法。

4 . 請求の範囲第 3項記載の類似度算出方法であって、

上記所定の変換は、上記 2つの入力べクトルを構成する各成分の順序を当該各成分の分散の大きさに従って並べ替える変換であり、

上記階層的距離算出工程では、上記変換工程にて変換された上記 2つの入力べクトル間の距離算出が、分散の大きな成分から順に行われること

を特徴とする類似度算出方法。

5 . 請求の範囲第 3項記載の類似度算出方法であって、

上記所定の変換は、離散コサイン変換又は離散フーリエ変換であり、上記階層的距離算出工程では、上記変換工程にて変換された上記 2つの入力べクトル間の距離算出が、低周波成分から順に行われること

を特徴とする類似度算出方法。

6 . 請求の範囲第 3項記載の類似度算出方法であって、

上記所定の変換は、ウオルシュ—アダマール変換であり、

上記階層的距離算出工程では、上記変換工程にて変換された上記 2つの入力べクトル間の距離算出が、低交番数成分から順に行われること

を特徴とする類似度算出方法。

7 . 請求の範囲第 3項記載の類似度算出方法であって、

上記所定の変換は、カル一ネン—レーべ変換であり、

上記階層的距離算出工程では、上記変換工程にて変換された上記 2つの入力べクトル間の距離算出が、固有値の大きな成分から順に行われること

を特徴とする類似度算出方法。

8 . 請求の範囲第 3項記載の類似度算出方法であって、

上記変換工程にて変換された上記 2つの入力べクトルの各々について、当該入力ベクトルを構成する各成分を上記所定の順序で取り出して階層的な複数の部分べクトルに分割する分割工程をさらに有し、

上記階層的距離算出工程では、最上位階層の部分べクトルから順に部分べクトルを構成する各成分間の距離算出が階層的に行われ、ある階層までの部分べクトルを構成する全ての成分間について算出された距離の積算値が上記閾値を下回つた場合、一階層下位の部分べクトルを構成する各成分間の距離算出が行われること

を特徴とする類似度算出方法。

9 . 請求の範囲第 1項記載の類似度算出方法であって、

上記入力べクトルは、音響信号を特徴べクトル化したものであり、

上記特徴べクトルは、上記音響信号の所定の時区間内のパワースペクトル係数をべクトル化したものであることを特徴とする類似度算出方法。

1 0 . 請求の範囲第 1項記載の類似度算出方法であって、

上記特徴べクトルは、上記音響信号の所定の時区間内の線形予測係数をべクトル化したものであること

を特徴とする類似度算出方法。

1 1 . 請求の範囲第 1項記載の類似度算出方法であって、

上記入力べクトルは、符号化音響信号を特徴べクトル化したものであり、上記特徴べクトルは、上記符号化音響信号の各フレーム内の周波数成分の強さを表すパラメータをべクトル化したものであること

を特徴とする類似度算出方法。

1 2 . 請求の範囲第 1項記載の類似度算出方法であって、

上記入力べクトルは、映像信号を特徴べクトル化したものであり、

上記特徴ベクトルは、上記映像信号の所定の時区間内の代表画像、上記所定の時区間内のフレーム画像の平均画像、又は上記代表画像若しくは上記平均画像を所定のプロック単位に分割した小画像の信号値をベクトル化したものであることを特徴とする類似度算出方法。

1 3 . 請求の範囲第 1項記載の類似度算出方法であって、

上記特徴ベクトルは、上記映像信号の所定の時区間内のフレーム画像の、輝度及び/又は色に対するヒス卜グラムをべクトル化したものであること

を特徴とする類似度算出方法。

1 4 . 請求の範囲第 1項記載の類似度算出方法であって、

上記入力べクトルは、符号化映像信号を特徴べクトル化したものであり、上記特徴べクトルは、上記符号化映像信号の所定の時区間の直近にあるフレーム内符号化画像の符号化単位となる各プロックの D C成分の信号値をべクトル化したものであること

を特徴とする類似度算出方法。

1 5 . 2つの入力べクトル間の類似度を求める類似度算出装置であって、上記 2つの入力べクトル間の距離算出を階層的に行う階層的距離算出手段と、上記階層的距離算出手段によって各階層で算出された距離の積算値を予め設定された閾値と比較する閾値比較手段と、

上記閾値比較手段による比較結果に応じて、上記階層的距離算出手段による距離算出を制御する制御手段と

最後の階層までに算出された距離の積算値を上記類似度として出力する出力手段とを備え、

上記制御手段は、上記閾値比較手段による比較の結果、ある階層までに算出された距離の積算値が上記閾値を上回った場合、距離算出を打ち切るように制御すること

を特徴とする類似度算出装置。

1 6 . 請求の範囲第 1 5項記載の類似度算出装置であって、

上記階層的距離算出手段は、上記 2つの入力ベクトルを構成する各成分間の距離算出を階層的に行い、ある階層までに算出した距離の積算値が上記閾値を下回つた場合、次の成分間の距離算出を行うことを特徴とする類似度算出装置。

1 7 . 請求の範囲第 1 6項記載の類似度算出装置であって、

上記 2つの入力べクトルに対して所定の変換を施す変換手段をさらに備え、上記階層的距離算出手段は、上記変換手段によって変換された上記 2つの入力べクトル間の距離算出を、上記所定の変換に基づく所定の順序で行うこと

を特徴とする類似度算出装置。

1 8 . 請求の範囲第 1 7項記載の類似度算出装置であって、

上記変換手段によって変換された上記 2つの入力べクトルの各々について、当該入力べクトルを構成する各成分を上記所定の順序で取り出して階層的な複数の部分べクトルに分割する分割手段を備え、

上記階層的距離算出手段は、最上位階層の部分べクトルから順に部分べクトルを構成する各成分間の距離算出を階層的に行い、ある階層までの部分べクトルを構成する全ての成分間について算出した距離の積算値が上記閾値を下回った場合、一階層下位の部分べクトルを構成する各成分間の距離算出を行うこと

を特徴とする類似度算出装置。

1 9 . 2つの入力べクトル間の類似度を求める類似度算出処理をコンピュータに実行させるプログラムであって、

上記閾値比較工程における比較結果に応じて、上記階層的距離算出工程における距離算出を制御する制御工程と

上記制御工程では、上記閾値比較工程において、ある階層までに算出された距離の積算値が上記閾値を上回った場合、距離算出を打ち切るように制御することを特徴とするプログラム。

2 0 . 請求の範囲第 1 9項記載のプログラムであって、

上記階層的距離算出工程では、上記 2つの入力べクトルを構成する各成分間の距離算出が階層的に行われ、ある階層までに算出された距離の積算値が上記閾値を下回った場合、次の成分間の距離算出が行われることを特徴とするプログラム

2 1 . 請求の範囲第 2 0項記載のプログラムであって、

上記 2つの入力べクトルに対して所定の変換を施す変換工程を有し、上記階層的距離算出工程では、上記変換工程にて変換された上記 2つの入力べクトル間の距離算出が、上記所定の変換に基づく所定の順序で行われることを特徴とするプログラム。

2 2 . 請求の範囲第 2 1項記載のプログラムであって、

上記変換工程にて変換された上記 2つの入力べクトルの各々について、当該入力べクトルを構成する各成分を上記所定の順序で取り出して階層的な複数の部分べクトルに分割する分割工程をさらに有し、

を特徴とするプログラム。

2 3 . 2つの入力べクトル間の類似度を求める類似度算出処理をコンピュータに実行させるプログラムが記録されたコンピュータ読み取り可能な記録媒体であつて、

上記 2つの入力べクトル間の距離算出を階層的に行う階層的距離算出工程と、上記階層的距離算出工程の各階層で算出された距離の積算値を予め設定された閾値と比蛟する閾値比較工程と、

上記制御工程では、上記閾値比較工程において、ある階層までに算出された距離の積算値が上記閾値を上回った場合、距離算出を打ち切るように制御することを特徴とするプログラムが記録された記録媒体。

2 4 . 請求の範囲第 2 3項記載の記録媒体であって、

上記階層的距離算出工程では、上記 2つの入力べクトルを構成する各成分間の距離算出が階層的に行われ、ある階層までに算出された距離の積算値が上記閾値を下回った場合、次の成分間の距離算出が行われることを特徴とする記録媒体。

2 5 . 請求の範囲第 2 4項記載の記録媒体であって、

上記プログラムは、上記 2つの入力べクトルに対して所定の変換を施す変換ェ程をさらに有し、

上記階層的距離算出工程では、上記変換工程にて変換された上記 2つの入力べクトル間の距離算出が、上記所定の変換に基づく所定の順序で行われることを特徴とする記録媒体。

2 6 . 請求の範囲第 2 5項記載の記録媒体であって、

上記プログラムは、上記変換工程にて変換された上記 2つの入力べクトルの各々について、当該入力べクトルを構成する各成分を上記所定の順序で取り出して階層的な複数の部分べクトルに分割する分割工程を有し、上記階層的距離算出工程では、最上位階層の部分べクトルから順に部分べクトルを構成する各成分間の距離算出が階層的に行われ、ある階層までの部分べクトルを構成する全ての成分間について算出された距離の積算値が上記閾値を下回つた場合、一階層下位の部分べクトルを構成する各成分間の距離算出が行われること

を特徴とする記録媒体。