JP3500616B2

JP3500616B2 - 信号波形データ比較装置およびその方法

Info

Publication number: JP3500616B2
Application number: JP29528993A
Authority: JP
Inventors: 呉亜棟
Original assignee: Omron Corp
Current assignee: Omron Corp
Priority date: 1993-11-25
Filing date: 1993-11-25
Publication date: 2004-02-23
Anticipated expiration: 2019-02-23
Also published as: JPH07146938A

Description

【発明の詳細な説明】

【０００１】

【産業上の利用分野】この発明は、信号波形データ比較
装置に関し、特に、高速かつ高精度の比較に関する。

【０００２】

【従来技術】２つの音声信号を比較する場合に、周波数
変動が問題となる。周波数変動とは、発声される単語の
周波数が人により異なることである。周波数変動を吸収
する方法の１つとして、マルチテンプレート法が知られ
ている。

【０００３】マルチテンプレート法について説明する。
入力された音声信号を、例えば、１フレーム２５．６ｍ
ｓ、フレーム周期１５ｍｓでＦＦＴケプストラム分析を
行なう。第１次元〜第１０次元までのケプストラム係数
を、単語音声認識のための特徴量として用い、さらに全
ての音声信号を、例えば、ＤＰ（dynamic programmin
g）マッチング法を用いて、２２フレームになるよう正
規化を行う。

【０００４】これにより、１の単語について、各フレー
ム毎に第１次元〜第１０次元までのケプストラム係数の
値が得られる。このような特徴ベクトル時系列データを
話者Ｈｉ（ｉ＝１〜Ｉ）の数だけ（ｉ枚）作成する（図
２１参照）。つぎに、ｉ枚の特徴ベクトル時系列データ
を１または２以上のグループに分類して、ある単語の標
準パターンを作成する。

【０００５】具体的には、人数分の特徴ベクトル時系列
データのうち、各フレーム毎および各次元毎にケプスト
ラム係数値を比較し、各フレーム毎および各次元毎のず
れの総計が所定値以下であれば、同一グループに分類す
る。そして、同一グループに分類された特徴ベクトル時
系列データのケプストラム係数値の平均を、各フレーム
毎および各次元毎に算出し、これを当該グループの標準
パターンとして記憶する。このようにして、１の単語に
ついて、人数分の特徴ベクトル時系列データから、複数
の標準パターンが作成される。すなわち、標準パターン
は、１の単語につき複数の存在し、これをマルチテンプ
レート法という。なお、前記標準パターンは、登録する
単語の分だけ作成される。

【０００６】つぎに、音声信号の比較について説明す
る。比較対象の音声信号が入力されると、上述と同様
に、各フレーム毎に第１次元〜第１０次元までのケプス
トラム係数の値を求める。つぎに、各フレーム毎および
各次元毎にケプストラム係数値を、記憶している全ての
標準パターンと比較する。

【０００７】標準パターンと比較対象の音声信号との各
フレーム毎および各次元毎のずれを、各標準パターンご
とに求め、総計が最も少ない標準パターンを求める。そ
して、比較対象の音声信号は、前記総計が最も少ない標
準パターンで表される音声信号であると判断する。

【０００８】このように、マルチテンプレート法によ
り、周波数変動を吸収し、音声信号を精度よく比較する
ことができる。

【０００９】

【発明が解決しようとする課題】しかしながら、従来の
マルチテンプレート法においては、次のような問題があ
った。高精度の比較を行なう為には、できる限り多くの
テンプレートを記憶しておく必要がある。しかし、多く
のテンプレートを記憶すると（すなわち、標準パターン
を多く記憶すると）、多くの記憶領域を必要とするだけ
でなく、テンプレートの数だけの演算処理が必要とな
り、すべて比較するまでの演算時間を要する。

【００１０】特に、マルチテンプレート法では、１の単
語について複数の標準パターンを記憶する。したがっ
て、単語の数が１つ増えただけで、記憶する量は標準パ
ターンの数だけ増える。

【００１１】これに対して、演算速度をあげるために、
記憶する標準パターン数を減らすと、精度の低い比較と
なる。

【００１２】この発明は上記のような問題を解決し、高
精度かつ高速に信号波形を比較することができる信号波
形比較装置又はその方法を提供することを目的とする。

【００１３】

【課題を解決するための手段】請求項１の信号波形デー
タ比較装置は、1)信号波形データが入力される入力手
段、前記信号波形データを複数フレームに分割し、各フ
レーム毎の周波数成分をフレーム特徴量として抽出する
特徴量抽出手段、2)前記各フレーム特徴量から所望の特
徴量成分値を抽出し、抽出した特徴量成分値に基づい
て、抽出した複数の特徴量成分を各次元の成分とする要
素ベクトルを、多次元ベクトル空間に配置するととも
に、各フレームの要素ベクトルを連結させた特徴ベクト
ル時系列データを演算する時系列データ演算手段、3)前
記特徴ベクトル時系列データを、時間軸にて正規化し、
正規化後特徴ベクトル時系列データを演算する正規化手
段、4)得られた正規化後特徴ベクトル時系列データを記
憶する正規化後時系列データ記憶手段、5)複数の信号波
形データに基づき得られた複数の正規化後特徴ベクトル
時系列データの各特徴量成分値をファジィ数化して得ら
れたファジィ標準パターンデータを登録データとして予
め記憶しておくファジィ標準パターンデータ記憶手段、
6)前記正規化後時系列データ記憶手段に記憶された判定
対象の正規化後特徴ベクトル時系列データの各フレーム
及び各次元の特徴量成分値について、ファジィ標準パタ
ーン記憶手段に記憶されたファジィ標準パターンデータ
とのファジィ関係を演算するファジィ関係演算手段、7)
演算したファジィ関係に基づき、ファジィ標準パターン
データと判定対象の正規化後特徴ベクトル時系列データ
との類似度を演算する類似度演算手段を備え、 8) 前記類
似度演算手段は、前記登録データ毎のファジィ標準パタ
ーンデータに基づき、各フレームの各次元毎の特徴量成
分値の平均値を求め、当該平均値に対して前記特徴量成
分値が大きい度合いに応じてその重み値を各フレームお
よび各ベクトル空間ごとに演算し、得られた重み値およ
び前記ファジィ関係に基づき、前記登録データと判定対
象の正規化後特徴ベクトル時系列データとの類似度を演
算することを特徴とする。

【００１４】請求項２の信号波形データ比較装置におい
ては、前記類似度演算手段は、 1)単語毎のファジィ標準パターンデータに基づき、各フ
レームの各次元毎の特徴量成分値の平均値を求め、当該
平均値に対して前記特徴量成分値が大きい度合いに応じ
てその重み値を各フレームおよび各ベクトル空間ごとに
演算し、 2)得られた重み値および前記ファジィ関係に基づき、フ
ァジィ標準パターンデータと判定対象の正規化後特徴ベ
クトル時系列データとの類似度を演算すること、を特徴
とする。

【００１５】請求項３の信号波形データ比較装置におい
ては、前記正規化手段は、 1)前記各特徴ベクトル時系列データの各特徴量成分値を
ファジィ分類するファジィ分類手段、 2)ファジィ分類された各特徴量成分値に基づき、代表特
徴点を演算するとともに、求めた代表特徴点を時系列順
に連結し、代表特徴点時系列データを演算する代表特徴
点時系列データ演算手段、 3)前記代表特徴点時系列データに基づいて、正規化後特
徴ベクトル時系列データを演算して出力する正規化後時
系列データ演算手段、を備えたことを特徴とする。

【００１６】請求項４の信号波形データ比較方法にお
いては、入力された信号波形データを複数フレームに分
割し、各フレーム毎の周波数成分をフレーム特徴量とし
て抽出し、前記各フレーム特徴量から所望の特徴量成分
値を抽出し、抽出した特徴量成分値に基づいて、抽出し
た複数の特徴量成分を各次元の成分とする要素ベクトル
を、多次元ベクトル空間に配置し、各フレームの要素ベ
クトルを連結させた特徴ベクトル時系列データを演算
し、前記特徴ベクトル時系列データを、時間軸にて正規
化し、正規化後特徴ベクトル時系列データを演算し、得
られた正規化後特徴ベクトル時系列データを記憶し、複
数の信号波形データに基づき得られた複数の正規化後特
徴ベクトル時系列データの各特徴量成分値をファジィ数
化して得られたファジィ標準パターンデータを登録デー
タとして予め記憶しておき、判定対象の正規化後特徴ベ
クトル時系列データの各フレーム及び各次元の特徴量成
分値について、前記ファジィ標準パターンデータとのフ
ァジィ関係を演算し、得られたファジィ関係に基づき、
ファジィ標準パターンデータと判定対象の正規化後特徴
ベクトル時系列データとの類似度を演算し、その類似度
を出力する信号波形データ比較方法であって、前記登録
データ毎のファジィ標準パターンデータに基づき、各フ
レームの各次元毎の特徴量成分値の平均値を求め、当該
平均値に対して前記特徴量成分値が大きい度合いに応じ
てその重み値を各フレームおよび各ベクトル空間ごとに
演算し、得られた重み値および前記ファジィ関係に基づ
き、前記登録データと判定対象の正規化後特徴ベクトル
時系列データとの類似度を演算することを特徴とする。

【００１７】

【作用】請求項１、請求項４の信号波形データ比較装置
またはその方法においては、入力された信号波形データ
を複数フレームに分割し、各フレーム毎の周波数成分を
フレーム特徴量として抽出する。前記各フレーム特徴量
から所望の特徴量成分値を抽出し、抽出した特徴量成分
値に基づいて、抽出した複数の特徴量成分を各次元の成
分とする要素ベクトルを、多次元ベクトル空間に配置す
る。各フレームの要素ベクトルを連結させた特徴ベクト
ル時系列データを演算し、前記特徴ベクトル時系列デー
タを、時間軸にて正規化し、正規化後特徴ベクトル時系
列データを演算し記憶する。

【００１８】また、あらかじめ、複数の信号波形データ
に基づき得られた複数の正規化後特徴ベクトル時系列デ
ータの各特徴量成分値をファジィ数化して得られたファ
ジィ標準パターンデータを記憶しておく。

【００１９】判定対象の正規化後特徴ベクトル時系列
データの各フレーム及び各次元の特徴量成分値につい
て、前記ファジィ標準パターンデータとのファジィ関係
を演算し、得られたファジィ関係に基づき、ファジィ標
準パターンデータと判定対象の正規化後特徴ベクトル時
系列データとの類似度を演算し、その類似度を出力す
る。このように、ファジィ標準パターンデータは、正規
化後特徴ベクトル時系列データの各特徴量成分値をファ
ジィ数化されたものであるので、所属度を的確に判断す
ることができる。また、前記登録データ毎のファジィ標
準パターンデータに基づき、各フレームの各次元毎の特
徴量成分値の平均値を求め、当該平均値に対して前記特
徴量成分値が大きい度合いに応じてその重み値を各フレ
ームおよび各ベクトル空間ごとに演算し、得られた重み
値および前記ファジィ関係に基づき、前記登録データと
判定対象の正規化後特徴ベクトル時系列データとの類似
度を演算する。したがって、当該平均値に対して前記特
徴量成分値が大きい度合いをもつフレームおよび各ベク
トル空間の類似度を高く評価することができる。

【００２０】請求項２の信号波形データ比較装置におい
ては、前記類似度演算手段は、単語毎のファジィ標準パ
ターンデータに基づき、各フレームの各次元毎の特徴量
成分値の平均値を求め、当該平均値に対して前記特徴量
成分値が大きい度合いに応じてその重み値を各フレーム
および各ベクトル空間ごとに演算し、得られた重み値お
よび前記ファジィ関係に基づき、ファジィ標準パターン
データと判定対象の正規化後特徴ベクトル時系列データ
との類似度を演算する。したがって、当該平均値に対し
て前記特徴量成分値が大きい度合いをもつフレームおよ
び各ベクトル空間の類似度を高く評価することができ
る。

【００２１】請求項３の信号波形データ比較装置におい
ては、ファジィ分類手段は、前記各特徴ベクトル時系列
データの各特徴量成分値をファジィ分類する。代表特徴
点時系列データ演算手段は、ファジィ分類された各特徴
量成分値に基づき、代表特徴点を演算するとともに、求
めた代表特徴点を時系列順に連結し、代表特徴点時系列
データを演算する。正規化後時系列データ演算手段は、
前記代表特徴点時系列データに基づいて、正規化後特徴
ベクトル時系列データを演算して出力する。これにより
正規化をより高速に演算することができる。

【００２２】

【実施例】本発明の一実施例を図面に基づいて説明す
る。信号波形データ比較装置１は、入力手段３、特徴量
抽出手段５、時系列データ演算手段７、正規化手段９、
正規化後時系列データ記憶手段１１、ファジィ標準パタ
ーンデータ記憶手段１３、ファジィ標準パターンデータ
作成手段１５、ファジィ関係演算手段１７、および類似
度演算手段１９を備えている。

【００２３】入力手段３には信号波形データが入力され
る。特徴量抽出手段５は、前記信号波形データを複数フ
レームに分割し、各フレーム毎の周波数成分をフレーム
特徴量として抽出する。時系列データ演算手段７は、前
記各フレーム特徴量から所望の特徴量成分値を抽出し、
抽出した特徴量成分値に基づいて、抽出した複数の特徴
量成分を各次元の成分とする要素ベクトルを、多次元ベ
クトル空間に配置するとともに、各フレームの要素ベク
トルを連結させた特徴ベクトル時系列データを演算す
る。

【００２４】正規化手段９は、ファジィ分類手段３１、
代表特徴点時系列データ演算手段３２、および正規化後
時系列データ演算手段３３を備えており、与えられた前
記特徴ベクトル時系列データを、以下のようにして時間
軸にて正規化し、正規化後特徴ベクトル時系列データを
演算する。

【００２５】ファジィ分類手段３１は、前記各特徴ベク
トル時系列データの各特徴量成分値をファジィ分類す
る。代表特徴点時系列データ演算手段３３は、ファジィ
分類された各特徴量成分値に基づき、代表特徴点を演算
する。さらに、ファジィ分類手段３１に与えられた特徴
ベクトル時系列データに基づき、求めた代表特徴点を時
系列順に連結し、代表特徴点時系列データを演算する。
正規化後時系列データ演算手段３５は、前記代表特徴点
時系列データに基づいて、正規化後特徴ベクトル時系列
データを演算して出力する。

【００２６】図１に戻って、正規化後時系列データ記憶
手段１１は、得られた正規化後特徴ベクトル時系列デー
タを記憶する。ファジィ標準パターンデータ作成手段１
５は、複数の信号波形データに基づき得られた複数の正
規化後特徴ベクトル時系列データの各特徴量成分値をフ
ァジィ数化して得られたファジィ標準パターンデータ
を、演算する。ファジィ標準パターンデータ記憶手段１
３は、前記ファジィ標準パターンデータを記憶する。

【００２７】ファジィ関係演算手段１７は、正規化後時
系列データ記憶手段１１に記憶された判定対象の正規化
後特徴ベクトル時系列データの各フレーム及び各次元の
特徴量成分値について、ファジィ標準パターン記憶手段
１３に記憶されたファジィ標準パターンデータとのファ
ジィ関係を演算する。類似度演算手段１９は、単語毎の
ファジィ標準パターンデータに基づき、各フレームの各
次元毎の特徴量成分値の平均値を求め、当該平均値に対
して前記特徴量成分値が大きい度合いに応じてその重み
値を各フレームおよび各ベクトル空間ごとに演算し、得
られた重み値および前記ファジィ関係に基づき、ファジ
ィ標準パターンデータと判定対象の正規化後特徴ベクト
ル時系列データとの類似度を演算する。

【００２８】図３に、本発明にかかる信号波形データ比
較装置をＣＰＵを用いて実現したハードウェア構成の一
例を示す。信号波形データ比較装置２１は、ＣＰＵ２
３、ＲＯＭ２５、ＲＡＭ２７、音声Ａ／Ｄ変換ＩＦ２
６、キーボード２８、ＣＲＴ２９、およびバスライン３
０を備えている。

【００２９】ＲＯＭ２５には、ＣＰＵ２３の制御プログ
ラム等が記憶されており、ＣＰＵ２３は、この制御プロ
グラムに従いバスライン３０を介して、各部を制御す
る。キーボード２８は、モード切換え信号を入力するモ
ード切換え手段である。音声Ａ／Ｄ変換ＩＦ２６は信号
波形データを入力する入力手段である。

【００３０】本装置は、ファジィ標準パターンを作成す
るモード（以下標準パターン作成モードという）および
未知信号波形データを予め記憶したファジィ標準パター
ンとを比較するモード（比較モードという）を有する。

【００３１】［標準パターン作成モードの動作］まず、
信号波形データ比較装置２１の標準パターン作成モード
の動作につき、図４を用いて説明する。

【００３２】音声Ａ／Ｄインタフェイス（ＩＦ）２６か
ら、信号波形データが入力されると（図３ステップＳＴ
１）、ＣＰＵ２３は、前記信号波形データを時系列順に
複数フレームに分割し、各フレーム毎の周波数成分をフ
レーム特徴量として抽出する（ステップＳＴ２）。本実
施例においては、１フレーム２５．６ｍｓとし、フレー
ムごとにスペクトルの包絡情報を求めるケプストラム分
析を用いて、フレーム特徴量を演算した。

【００３３】ＣＰＵ２３は、前記各フレーム特徴量を、
多次元ベクトル空間に配置した特徴点を求めＲＡＭ２７
に記憶する。本実施例においては、多次元ベクトル空間
として１０次元ベクトル空間を採用した。１０次元ベク
トル空間に配置した状態を図５に示す。この場合、入力
された信号波形データが３０フレームあったので、特徴
点ａ１〜ａ３０が配置された。なお、これらの特徴点ａ
１〜ａ３０はベクトルとして表わされる。

【００３４】以上のことを一般式で表わすと次の様にな
る。入力信号波形を表わす特徴ベクトルの時系列Ａは、Ａ＝a(o)a(1)・・・a(i)・・・a(I-1) ・・・・・（１）｛a(i)=(ai1,ai2,・・・,aip,・・・,aiP)} として表現される。ここで、Ｉは入力時間長（フレーム
数）で、Ｐはベクトルの次元数である。

【００３５】この特徴ベクトルa(i)は、Ｐ次元空間での
一つの特徴点として見ることができるので、この特徴点
の時系列を追跡することにより、Ｐ次元空間での近似的
な連続曲線（折れ線）が得られる。

【００３６】しかしながら、特徴点の揺らぎがあるの
で、前記特徴点ａ１〜ａ３０をそのまま時系列で追跡し
た近似的な連続曲線を求めても意味がない。本実施例に
おいては、ＣＰＵ２３は、前記各特徴点をファジィ分類
して、代表特徴点を求めるとともに、求めた代表特徴点
を時系列順に連結し、代表特徴点時系列線データを求め
る。

【００３７】ＣＰＵ２３は、前記特徴点ａ１〜ａ３０の
ベクトル時系列Ａ１をＲＡＭ２７から読み出す。ベクト
ル時系列Ａ１は、Ａ１＝ａ１，ａ２，・・・ａ３０で表わされる。

【００３８】ＣＰＵ２３は、この入力ベクトル時系列Ａ
１の各特徴点ベクトルａ１〜ａ３０をファジィ分類し、
代表特徴点ベクトル（図５、ａ１０１〜ａ１０４参照）
を求める。本実施例においては、既知理論であるファジ
ィＣ―ミーンズ法（Fuzzy C-means)を採用した。

【００３９】ファジィＣ―ミーンズ法の具体的なアルゴ
リズムは以下のようになる。まず、各個体Ai（Ai：ベク
トル；i=1,2,...N）が各クラスタg（g=1,2,...,G）に属
する度合（０から１の値）を次の行列(menbership matr
ix)で表わす。

【００４０】

【数１】

【００４１】ここで、ｕ(g,i)=[0,1]は、ｕ(g,i)は０か
ら１の間の値をとることを示している。

【００４２】つぎに、クラスタ数をＧに定め、Ｕの初期
分割行列Ｕ⁽⁰⁾と適当な収束判定値εを与える。つぎ
に、式（３）により初期クラスタg(g=1,2,...,G)の平均
ベクトルVgを求める。

【００４３】

【数２】

【００４４】つぎに、式（４）によってＵ⁽⁰⁾をＵ⁽¹⁾に
更新する。

【００４５】

【数３】

【００４６】これを演算子Ｔを使って、Ｕ⁽¹⁾をＴ
⁽¹⁾（Ｕ⁽⁰⁾）と表わし、これを反復する。すなわち、Ｕ^(k+1)＝Ｔ^(k+1)（Ｕ^(k)） (k=0,1,2,...) ・・・（５）とする。

【００４７】上記反復は、｜Ｕ^(k+1)−Ｕ^(k)｜≦εとな
ったとき計算を終了する。もし、｜Ｕ^(k+1)−Ｕ^(k)｜≦
εとならない場合は、上記計算を繰り返す。

【００４８】ＣＰＵ２３は、このようにして得られた代
表特徴点ベクトルをＲＡＭ２７に記憶する。なお、この
状態では、求められた代表特徴点ベクトルには、時系列
概念が取払われている。そこで、ＣＰＵ２３は、ＲＡＭ
２７に記憶された代表特徴点ベクトルを時系列順に連結
し、代表特徴点時系列線データを求める。

【００４９】各代表特徴点ベクトルを時系列順に連結す
る為、各代表特徴点ベクトルと各特徴点ベクトルａ１〜
ａ３０を時系列順に、最も近い代表特徴点ベクトルに置
き換えて連結する。例えば、特徴点ベクトルａ１は、最
も近い代表特徴点ベクトルａ１０１に置き換えられ、特
徴点ベクトルａ２は、最も近い代表特徴点ベクトルａ１
０１に置き換えられ、・・・特徴点ベクトルａ８は、最
も近い代表特徴点ベクトルａ１０２に置き換えられ、・
・・・特徴点ベクトルａ３０は、最も近い代表特徴点ベ
クトルａ１０４に置き換えられる。これにより、各代表
特徴点ベクトルａ１０１〜ａ１０４が時系列順に連結さ
れることになる。

【００５０】このようにして、ベクトル時系列Ａ１をベ
クトル量子化したベクトル時系列Ａ１０１が得られる。

【００５１】なお、ベクトル時系列Ａ１０１は、Ａ１０１＝ａ１０１，ａ１０２，ａ１０３，ａ１０４で表わされる。ベクトル時系列Ａ１０１を表わす代表特
徴点時系列線Ｌ１を図５に示す。

【００５２】ＣＰＵ２３は、求めた代表特徴点時系列線
を正規化する。キーボード２８にモード切換え信号が与
えられると、これに基づき、ＲＡＭ２７に記憶された代
表特徴点時系列線データに基づいて、正規化後特徴点時
系列線データを演算する。

【００５３】このような正規化を行なうのは次のような
理由による。まず、同じ音韻（定常部）例えば、”オ”
であっても、周波数のずれにより、ベクトル空間内の”
オ”という特徴点の分布バラツキができ、そのバラツキ
の中心点も変動するからである。

【００５４】また、異なる音韻間の遷移（非定常部：た
とえば”オ”と”ム”の間）区間と対応するベクトル空
間内の特徴点は、遷移区間の時間軸のサンプリングの時
点の違いにより、その位置が異なる。したがって、それ
らの変動は空間曲線の長さに影響を与える。すなわち、
同じ単語を表わす特徴点時系列線データであっても、ベ
クトル空間においてはその長さ、形状が異なるからであ
る。

【００５５】ＣＰＵ２３が行なう正規化後特徴点時系列
線データの演算の概略はつぎのようである。まず、代表
特徴点時系列線データの軌跡の長さを求め、これを（Ｎ
−１）等分割する。この分割点に基づき新たな軌跡を求
め、求めた軌跡に沿って再サンプリングしたＮ点の特徴
点を正規化後特徴点として用いる。

【００５６】つぎに、図６〜図８を用いてＰ次元ベクト
ル空間における近似的連続曲線の正規化の方法に具体的
に説明する。

【００５７】まず、Ｐ次元空間における入力特徴点と補
間点との関係を図６を用いて説明する。図に示すよう
に、入力特徴点ａ(i-1)、ａ(i)、ａ(i+1)があった場
合、補間点xは、以下の（６）式で表わされる。

【００５８】 x=a(i)+(a(i+1)-a(i))・t; (0≦t≦1; i=0,・・・,I-2) ・・・（６）また、Ａの軌跡の長さをＬ(A)で表わすと、式（３）の
ように定義される。

【００５９】

【数４】

【００６０】なお、

【００６１】

【数５】

【００６２】である。

【００６３】つぎに、軌跡長Ｌ(A)をＮ−１等分割し軌
跡Ｘに沿って再サンプリングしたＮ点の特徴点を正規化
後特徴点として用いる。

【００６４】ここで、再サンプリングするＮ点の正規化
後特徴点を、Ｂ＝b(0)b(1)・・・b(n)・・・b(N-1) ・・・・（８） {b(n)=(bn1,bn2,...,bnp,...,bnP)} で表わした場合、正規化後特徴点は以下の（９）〜（１
２）式によって求められる。なお、b(0)=a(0)であり b
(N-1)=a(I-1)とする。

【００６５】但し、図８に示すＩ、Ｐ、ｉ、ｎ、Ａ、ｄ
(ｉ)、Ｌ(A)、Ｎ−１、△Ｌ、Ｂ、Ｄ(A)、Ｄ(B)、Ｓ(n)
については、以下を表わすものとする。

【００６６】Ｉ：入力時間長（フレーム数）Ｐ：ベクトル次元数ｉ：軌跡上の入力特徴点の番号； i=0,・・・,I-1 ｎ：軌跡上の正規化後特徴点の番号； n=0,・・・,N-1 Ａ：入力音声特徴ベクトルの時系列；Ａ＝a(0)a(1)・・・a(i) ・・・a(I) {a(i)=ai1,ai2,・・・,aip,
・・・,aiP)} ｄ(ｉ)：近隣両特徴点間の距離；

【００６７】

【数６】

【００６８】Ｌ(A)：Ａの軌跡長；

【００６９】

【数７】

【００７０】Ｎ−１：軌跡上の等分割数 ΔＬ：軌跡上の等分割の線分長Ｂ：正規化される特徴ベクトルの時系列；Ｂ＝b(0)b(1)・・・b(n)・・・b(N-1) {b(n)=(bn1,bn2,・・・,bnp,・・・,bnP)} Ｄ(A)：軌跡に沿ってある特徴点a(i)までの軌跡長；

【００７１】

【数８】

【００７２】Ｄ(B)：軌跡に沿ってある正規特徴点ｂ(n)
までの軌跡長；Ｄ(B)＝ｎ・△ＬＳ(n)：再サンプリング時点ｂ(n)の局所軌跡長であり、
具体的には、図８に示すように、隣接する入力特徴点か
らの軌跡長である。

【００７３】 △Ｌ＝Ｌ(A)／（Ｎ−１）・・・（９）

【００７４】

【数９】

【００７５】なお、ここで、ｉ＝ｎｕｍｂｅ｛ｋ｜（・
・・）｝とは、”ｋ””が（・・・）内の条件を満たす
時の番号を、ｉとしてとるということを意味する。

【００７６】 t(n)=S(n)／ｄ(ｉ+1）; (0≦t(n)≦1) ・・・（１１） b(n)=a(i)+(a(i+1)-a(i))・t(n) ・・・（１２）この演算アルゴリズムについて、図９を用いて説明す
る。図９ステップＳＴ１１においては、まず初期化がな
される。

【００７７】つぎに、ステップＳＴ１２〜ステップＳＴ
１５にて、S(n)を求める。ステップＳＴ１２において
は、Ｄ(A)（ここではＤ(A)＝０）に、つぎの入力特徴点
までの距離ｄ(i+1)を加える。ステップＳＴ１３では、
Ｄ(A)＞Ｄ(B)かを判断する。すなわち、つぎの入力特徴
点までの距離ｄ(i+1)がΔＬよりも大きいか否かを判断
する。

【００７８】条件を満足していれば、ステップＳＴ１４
に進み、Ｄ(A)＝Ｄ(A)−ｄ(i+1)とする。そして、Ｓ(n)
＝Ｄ(B)−Ｄ(A)（ステップＳＴ１５）とする。これによ
り、入力特徴点ａ(i)からの軌跡長Ｓ(n)を得ることがで
きる。

【００７９】なお、ステップＳＴ１３にて、Ｄ(A)＞Ｄ
(B)が成立しなければ、ステップＳＴ１６に進み、i＝i+
1とし、さらにつぎの入力特徴点までの距離をＤ(A)に加
える（ステップＳＴ１７）。ステップＳＴ１２に戻り、
ステップＳＴ１３〜ステップＳＴ１７までを繰り返す。

【００８０】つぎに、求めた軌跡長Ｓ(n)に基づき、再
サンプリングする補間点b(n)を求める。既に説明した入
力特徴点と補間点との関係に基づき、補間点b(n)を求め
る（ステップＳＴ１８）。ステップＳＴ１９にて、ｎ＝
Ｎ−２に達した場合には、終了する。ステップＳＴ１９
にて、ｎ＝Ｎ−２に達していない場合には、ステップＳ
Ｔ２０に進み、n＝n+1、Ｄ(B)＝ｎ・△Ｌとして、ステ
ップＳＴ１２以下を繰り返すことにより、軌跡長Ｓ(n+
1)を求める。

【００８１】このようにして求めた正規化後特徴点時系
列線ＳＬ１を図６に示す。図において、特徴点ａ１０１
〜ａ１０４が入力特徴点であり、特徴点b１０１〜b１１
０が求めた補間点である。

【００８２】このように、本実施例においては、入力信
号波形の特徴ベクトルを正規化するのに、ファジィＣ―
ミーンズ法を用いたので、従来のＤＰマッチング法に比
べて、高速演算が可能である。なぜなら、ＤＰマッチン
グ法のように時間軸平面上にて１つ１つ比較する必要が
なく、演算量を少なくすることができるからである。標
準パターン作成モードでは、このような正規化を行なっ
た後、図４ステップＳＴ４に進み、ファジィ標準パター
ンを作成する。具体的には、フレーム毎に、ベクトル空
間ごとに、特徴ベクトルの特徴量成分値を求め、図１０
Ａに示すような話者ｉが単語Ｗ１をＪ回発生した正規化
後特徴ベクトルの特徴量成分値を、フレーム毎、ベクト
ル空間ごとにあらわした表を作成する。

【００８３】本実施例においては、１０ｋＨｚ、１０ビ
ットでＡ／Ｄ変換した音声を１フレーム２５．６ｍｓ、
フレーム周期１５ｍｓでＦＦＴケプストラム分析を行
い、１〜１０次までのケプストラム係数を、単語音声認
識のための特徴パラメータとして用い、さらに全ての単
語音声を２２フレームになるよう正規化を行なった（す
なわち、Ｐ＝１０，Ｌ＝２２である）。

【００８４】つぎに、図１０Ａに示すような表を各単語
ごとに複数人分作成し、図１１に示すようにフレーム
毎、ベクトル空間ごとに、特徴ベクトルの特徴量成分値
をファジィ数化する。本実施例においては、図１２に示
す方法にてファジィ数化した。例えば、異なるＩ人の話
者が、単語Ｗ_nに対してＪ回発声し時間軸正規化によっ
て得られたＩ×Ｊ個の特徴ベクトルＦⁿ _ijは、Ｆⁿ _ij＝（fⁿ _ij(L)）(i=1,・・・,I; j=1,・・・,J; L=1,・・・,
L) で表される。ここで、ｆⁿ _ij(L)は、以下の式で表され
る。

【００８５】ｆⁿ _ij(L)=(fⁿ _ij(L,1),・・・,fⁿ _ij(L,p),・・・,fⁿ _ij(L,P)) ここで、Ｌ：フレーム番号(L=1,・・・,L)を示し、正規化
された単語Ｗ_nのフレーム数であり、ｐ：ベクトルの次
元番号を示し、特徴ベクトルの次元数であり、ｉ：話者
の番号、ｊ：発声回数の番号、Ｉ：話者の人数、Ｊ：発
声回数である。

【００８６】つぎに、単語Ｗ_nの平均特徴パターン^aｆⁿ
を求める。平均特徴パターン^aｆⁿは、以下の式で表され
る。

【００８７】^a ｆⁿ=((^aｆⁿ _p(L), ｆⁿ _p,min(L), ｆⁿ _p,max(L)) (p=1,・・
・,P; L=1,・・・,L)

【００８８】

【数１０】

【００８９】ここで、^aｆⁿ _p(L)：第Lフレーム目のｐ次
元成分（ケプストラム値）の平均値、ｆⁿ _p,min(L)：第L
フレーム目のｐ次元成分の最小値、ｆⁿ _p,max(L)：第Lフ
レーム目のｐ次元成分の最大値である。

【００９０】具体的には、図１２の数式に示すように、
異なるＩ人の話者が、単語Ｗ_nに対してＪ回発声して得
られた特徴ベクトルの特徴量成分値について、フレーム
毎、ベクトル空間ごとに平均値^aｆⁿ _p(L)を求める。ま
た、フレーム毎、ベクトル空間ごとの値のうち最小値を
ｆⁿ _p,minとし、最大値をｆⁿ _p,maxとする。そして、前記
平均値^aｆⁿ _p(L)をファジィ数を表す三角形の頂点座標と
し、最小値ｆⁿ _p,minおよび最大値ｆⁿ _p,maxを三角形の底
辺の座標とする。

【００９１】すなわち、_fｆⁿ _p(L)=(_fｆⁿ _p(L), _fｆⁿ _p(L)
-fⁿ _p,min(L), fⁿ _p,max(L)-_fｆⁿ _p(L))であり、_fｆⁿ _p(L)
は、左右のあいまさをそれぞれ_fｆⁿ _p(L)ーfⁿ _p,min(L), f
ⁿ _p,ma _x(L)-_fｆⁿ _p(L)になる正規三角ファジィ数である
（図１２参照）。

【００９２】これにより、図１２に示すようなファジィ
数_fｆⁿ _p(L)が得られる。このような各次元毎、各フレー
ム毎のファジィ数で表される標準パターンを、ファジィ
標準パターンという。

【００９３】図１６に単語Ｗ₁「東京」およびＷ₂「愛
知」のファジイ標準パターン（いずれも第１次元の第
９、１４フレーム目のファジィ化特徴ベクトルと第２次
元の第３、１１フレーム目のファジィ化特徴ベクトルを
例として表示している）を示している。

【００９４】つぎに、単語「東京」、「愛知」を各々単
語Ｗ1、Ｗ2として、各々のファジィ標準パターンを作成
する場合を例として具体的に説明する。

【００９５】単語「東京」に関してそれぞれ５人の話者
（Ｉ＝５）が５回（Ｊ＝５）発声して時間軸正規化（Ｌ
＝２２）によって得られた２５個の特徴ベクトル（Ｉ×
Ｊ）から求められた第１、２次元成分の特徴量成分値を
時系列順に配置すると図１４Ａ，Ｂに示すようになる。

【００９６】図１４Ａにおいて、単語Ｗ₁「東京」の第
１次元成分については、第９フレーム目の特徴量成分値
は、ファジィ数_fｆ¹ ₁(9)＝（^aｆ¹ ₁(9), ｆ¹ _1,min(9),
ｆ¹ _1,m_ax(9))で表されるので、ファジィ数_fｆ¹ ₁(9)は、_f ｆ¹ ₁(9)＝(0.07, -2.49, 2,71) で表される。また、第１４フレーム目の特徴量成分値
は、ファジィ数_fｆ¹ ₁(14)＝（^aｆ¹ ₁(14), f¹ _1,min(14),
f¹ _1,max(14))であるので、ファジィ数_fｆ¹ ₁(14)は、_f ｆ¹ ₁(14)＝(4.51, 0.52, 7.04) で表される。

【００９７】同様にして、図１４Ｂを参照して、単語Ｗ
₁「東京」の第２次元成分については、第３フレーム目
の特徴量成分値はファジィ数_fｆ¹ ₂(3)＝（^aｆ¹ ₂(3), f¹
_2,min(3), f¹ _2,max(3))＝(0.50, -1.95, 2.82)で、第１
１フレーム目の特徴量成分値はファジィ数_fｆ¹ ₂(11)＝(
^aｆ¹ ₂(11), f¹ _2,min(11), f¹ _2,max(11))＝(-3.23, -5.4
8, -1.19)で表される。

【００９８】また、図１５Ａ，Ｂは、同様にして得られ
た単語Ｗ2「愛知」に関する第１、２次元成分の特徴量
成分値の時系列の例である。単語「愛知」の各次元成分
についても同様に、表される。

【００９９】このようにして、各単語ごとに、各次元
毎、各フレームごとの特徴量成分値をファジィ数で表し
たファジィ標準パターンを作成する（図１１参照）。

【０１００】このようなファジィ標準パターンを各単語
Ｗ1〜ＷNについて作成し、図１３に示すようなファジィ
標準パターン群が得られる。図１３においては、各テン
プレートについては、単語Ｗ１〜ＷNについて、各次元
毎のファジィ数が各々正規化したフレームの数だけ存在
する。

【０１０１】図１３において、_fｆⁿ(L)は、単語ＷNの第
Ｌフレームにおけるファジィ特徴量成分値を意味し、ベ
クトルで表される。なお、_fｆⁿ(L)は、_f ｆⁿ(L)＝（_fｆⁿ,₁(L)，_fｆⁿ,₂(L)，・・・，_fｆⁿ,
_p(L)，・・・_fｆⁿ,_P(L)）（ｎ＝１，２，・・・ｎ・
・・Ｎ）で表される。

【０１０２】また、_fｆⁿ _p(L)とは、ファジィ特徴ベクト
ル_fｆⁿ(L)のP番目の要素であり、ファジィ数である（図
１２参照）。また、^aｆ_p(L)とは、単語集合全体につい
て第Ｌフレーム目のファジィ特徴ベクトルの平均であ
り、以下の式(11)で表される。

【０１０３】

【数１１】

【０１０４】また、^aｆ(L)は、以下の式で表される。

【０１０５】^aｆ_p(L)＝（^aｆ₁(L)，^aｆ₂(L)，・・・，^a
ｆ_p(L)，・・・^aｆ_P(L)）このようにして、登録する単語の音声信号に対応するフ
ァジィ標準パターンを単語の数だけ作成し、ＲＡＭ２７
に記憶する（図４ステップＳＴ５）。

【０１０６】［比較モード］つぎに、未知信号波形デー
タと予め記憶したファジィ標準パターンとを比較する比
較モードについて概略を説明する。未知信号波形が入力
される（図４ステップＳＴ１）と、ステップＳＴ２〜ス
テップＳＴ３により、正規化を行ない、図１０Ｂに示す
ようなフレーム毎、次元毎の特徴量成分値（以下、未知
信号波形特徴量成分値という）を求める。ここで、キー
ボード２８から与えられたモード切換え信号が比較モー
ドであると、ＣＰＵ２３は、ステップＳＴ６に進み、未
知信号波形特徴量成分値と全ての登録単語のファジィ標
準パターンとのファジィ関係の求める。

【０１０７】つぎに、ＣＰＵ２３は、図４ステップＳＴ
５にて記憶したファジィ標準パターンと入力未知信号波
形との類似度を判断する（ステップＳＴ８）。つぎに、
ステップＳＴ９にて、累積類似度を判断し、入力された
未知信号波形は、最大類似度を有するファジィ標準パタ
ーンに対応する信号波形であると判断する（ステップＳ
Ｔ１０）。

【０１０８】以下各処理について、詳細に説明する。ま
ず、前記未知信号波形の特徴ベクトルをｆ^x _p(L)(p=1,・・
・,10; L=1,・・・,22)で表す。そして、図１３に示すファ
ジィ標準パターン群を参照して、未知信号波形データと
各単語Ｗ_nとのファジィ類似関係行列を作成する。

【０１０９】具体的には、未知信号波形特徴量成分値に
ついて、各次元毎、各フレームごとに、あらかじめ記憶
されているファジィ数との適合度（０〜１．０）を求め
る。これにより、図２０に示すような、各次元毎、各フ
レームごとの適合度μ_L(P,W_n)(p=1...P, L=1・・・L, W_n=1
・・・N)を得ることができる。

【０１１０】以上のファジィ関係を図で表すと図１７、
１８に示すようになる。図１７Ｂは、未知入力音声信号
の特徴量成分値の第１次元成分の時系列データを示して
いる。図１７Ａと図１７Ｃはそれぞれ、未知信号波形特
徴量成分値の第１次元成分の第９フレーム目、第１４フ
レーム目の成分と２つのファジィ標準パターン（東京、
愛知２単語）との適合度μ_L(P,W_n)(p=1, L=9,14, WN=W1
=東京)を示している。図１７Ｂより、例えば、未知入力
信号の第９フレーム目の特徴量成分値は、「−０．５
７」であり、この値は図１７Ａにおいては、ファジィ標
準パターン「東京」の第９フレーム目のファジィ数
_fｆ¹,₁(9)との適合度μ₉(1,W1)=0.78であることがわか
る。同様にして、標準パターン「愛知」の第９フレーム
目のファジィ数_fｆ²,₁(9)との適合度μ₉(1, W2)=0であ
ることがわかる。また、同様にして、図１７Ｃより、第
１４フレーム目の特徴量成分値と標準パターン「東京」
「愛知」との適合度は、それぞれμ₁₄(1,W1)=0.80, μ
₁₄(1,W2)=0であることがわかる。

【０１１１】第２次元成分についても、図１８Ａ，Ｂ，
Ｃを用いて、同様にして、μ₃(2,w₁)=0.57, μ₃(2,W2)=
0,μ₁₁(2,W1)=0.37, μ₁₁(2,W2)=0.16であることがわか
る。このようにして得られた適合度について、ファジィ
標準パターンごとに適合度の総計を求める。具体的に
は、各標準パターンごとに、フレーム毎、次元毎の適合
度を総計すればよい。例えば、図１９において、単語W1
との累積類似度Ｖ₁は、以下の式で表される。

【０１１２】Ｖ¹＝μ₁(1,1)+μ₁(2,1)+・・・+μ₁(p,1)+・・
・+μ₁(P,1)＋μ₂(1,1)+μ₂(2,1)+・・・+μ_L(P,1) このようにして、各標準パターンの累積類似度Ｖ_Nを求
め、最大累積類似度に対応する単語ＷNＡを認識結果と
して出力する。

【０１１３】このように、本実施例においては、従来の
マルチテンプレート法と異なり、多くのテンプレートを
記憶する必要がなく、各単語に１のファジィ標準パター
ンを記憶しておけばよい。したがって、記憶領域を少な
くできるとともに、演算処理数も減少することができ
る。その際、標準パターンをファジィ数で記憶している
ので、各単語について１の標準パターンを記憶するだけ
で、精度の高い比較を行なうことができる。すなわら、
高精度かつ高速に信号波形を比較することができる。

【０１１４】［重みづけについて］なお、上記演算方法
では、各フレームおよび各ベクトル空間について、その
特徴量成分値の大小に関係なく類似度を評価している。
しかし、前記特徴量成分値が大きいフレームおよび各ベ
クトル空間における類似度を高く評価するように重みづ
けをおこなうことにより、より、的確に類似度を評価す
ることができる。なぜなら、前記特徴量成分値の大きな
フレームおよび各ベクトル空間に、信号波形の特徴がよ
り強く表れるからである。

【０１１５】特徴量成分値の重みは、以下のようにして
求められる。ファジィ関係行列の各要素μ_L(p, WN)(L=
1, ・・・,L; p=1,・・・,P; N=1・・・N)の重み付けをＷ_p(L)と
して

【０１１６】

【数１２】

【０１１７】で求められる。

【０１１８】例えば、Ｗ₁(9)は、つぎのようにして求め
られる。上記（１４）式より、^aｆ₁(9)=(^aｆ¹ ₁(9)+^aｆ²
₁(9))/2である。ここで、^aｆ¹ ₁(9)および^aｆ² ₁(9)につ
いては、図１６Ａから、各々0.07，+5.06であるので、
代入すると、^aｆ₁(9)=2.57となる。また、上記（１３）
式より、W'₁(9)=f^X ₁(9)/^aｆ₁(9)で表されるので、W'
₁(9)=-0.57/2.57=-0.22となる。得られたW'_p(L)を前記
（１２）式に示すように、正規化する。すなわち、W
₁(9)は、 W₁(9)=(-0.22)／(-0.22+W'₂(9)+・・・+W'₁₀(9)）で表される。

【０１１９】このようにして各次元毎、各フレームごと
に得られた重みを、前記適合度に乗じた後（図２０参
照）、上述のように累積類似度を求めればよい。

【０１２０】このようにして、各次元毎、各フレームご
との重みづけを行なうことにより、より的確な類似判断
を行なうことができる。

【０１２１】［他の応用例］なお、本実施例において
は、入力信号波形を正規化するのに、ファジィＣ―ミー
ンズ法を用いたので、従来のＤＰマッチング法に比べ
て、高速演算が可能である。しかしこれに限られること
なく、入力信号波形の特徴ベクトルを正規化できるもの
であれば、どのような方法でもよく、例えば、当該部分
を従来のＤＰマッチング法等を用いてもよい。

【０１２２】なお、本実施例においては、入力される信
号波形データとして音声信号を用いて説明したが、信号
の特徴量を抽出できる信号波形データであればどのよう
なものであってもよく、例えば、筆跡信号の照合等にも
応用することができる。

【０１２３】なお、本実施例においては、モード切換え
信号をキーボード２８から入力するようにしたが、バス
ライン３０を介して、他の機器（図示せず）から与える
ようにしてもよい。

【０１２４】また、本実施例においては、複数人が複数
回発声してファジィ標準パターンを作成したが、人数、
回数についてはこれに限られることなく、同一人でもよ
い。上記実施例では、図１に示す機能を実現する為に、
ＣＰＵ２３を用い、ソフトウェアによってこれを実現し
ている。しかし、その一部もしくは全てを、ロジック回
路等のハードウェアによって実現してもよい。

【０１２５】

【発明の効果】請求項１、請求項４の信号波形データ比
較装置またはその方法においては、入力された信号波形
データを複数フレームに分割し、各フレーム毎の周波数
成分をフレーム特徴量として抽出する。前記各フレーム
特徴量から所望の特徴量成分値を抽出し、抽出した特徴
量成分値に基づいて、抽出した複数の特徴量成分を各次
元の成分とする要素ベクトルを、多次元ベクトル空間に
配置する。各フレームの要素ベクトルを連結させた特徴
ベクトル時系列データを演算し、前記特徴ベクトル時系
列データを、時間軸にて正規化し、正規化後特徴ベクト
ル時系列データを演算し記憶する。

【０１２６】また、あらかじめ、複数の信号波形データ
に基づき得られた複数の正規化後特徴ベクトル時系列デ
ータの各特徴量成分値をファジィ数化して得られたファ
ジィ標準パターンデータを記憶しておく。

【０１２７】判定対象の正規化後特徴ベクトル時系列
データの各フレーム及び各次元の特徴量成分値につい
て、前記ファジィ標準パターンデータとのファジィ関係
を演算し、得られたファジィ関係に基づき、ファジィ標
準パターンデータと判定対象の正規化後特徴ベクトル時
系列データとの類似度を演算し、その類似度を出力す
る。このように、標準パターンデータは、正規化後特徴
ベクトル時系列データの各特徴量成分値をファジィ数化
されたものであるので、所属度を的確に判断することが
できる。また、前記登録データ毎のファジィ標準パター
ンデータに基づき、各フレームの各次元毎の特徴量成分
値の平均値を求め、当該平均値に対して前記特徴量成分
値が大きい度合いに応じてその重み値を各フレームおよ
び各ベクトル空間ごとに演算し、得られた重み値および
前記ファジィ関係に基づき、前記登録データと判定対象
の正規化後特徴ベクトル時系列データとの類似度を演算
する。したがって、当該平均値に対して前記特徴量成分
値が大きい度合いをもつフレームおよび各ベクトル空間
の類似度を高く評価することができる信号波形データ比
較装置またはその方法を提供することができる。

【０１２８】請求項２の信号波形データ比較装置におい
ては、前記類似度演算手段は、単語毎のファジィ標準パ
ターンデータに基づき、各フレームの各次元毎の特徴量
成分値の平均値を求め、当該平均値に対して前記特徴量
成分値が大きい度合いに応じてその重み値を各フレーム
および各ベクトル空間ごとに演算し、得られた重み値お
よび前記ファジィ関係に基づき、ファジィ標準パターン
データと判定対象の正規化後特徴ベクトル時系列データ
との類似度を演算する。したがって、当該平均値に対し
て前記特徴量成分値が大きい度合いをもつフレームおよ
び各ベクトル空間の類似度を高く評価することができ
る。

【０１２９】これにより、２つの信号波形データをより
高精度に比較することができる信号波形データ比較装置
を提供することができる。

【０１３０】請求項３の信号波形データ比較装置におい
ては、ファジィ分類手段は、前記各特徴ベクトル時系列
データの各特徴量成分値をファジィ分類する。特徴点時
系列データ演算手段は、ファジィ分類された各特徴量成
分値に基づき、代表特徴点を演算するとともに、求めた
代表特徴点を時系列順に連結し、特徴点時系列データを
演算する。正規化後時系列データ演算手段は、前記特徴
点時系列データに基づいて、正規化後特徴ベクトル時系
列データを演算して出力する。これにより正規化をより
高速に演算することができる。

【０１３１】したがって、２つの信号波形データをより
高速に比較することができる信号波形データ比較装置を
提供することができる。

【図面の簡単な説明】

【図１】本発明にかかる信号波形データ比較装置１の機
能ブロック図である。

【図２】正規化手段９の構成を示すブロック図である。

【図３】信号波形データ比較装置１をＣＰＵで実現した
ハードウェアー構成を示す図である。

【図４】信号波形データ比較装置１の全体処理のフロー
チャートである。

【図５】Ｐ次元ベクトル空間に特徴点を配置した状態を
示す図である。

【図６】正規化後特徴点時系列線ＳＬ１を示す図であ
る。

【図７】Ｐ次元ベクトル空間における入力特徴点と補間
点との関係を示す図である。

【図８】Ｐ次元ベクトル空間における再サンプリングす
るＮ点の正規化後特徴点を説明する為の図である。

【図９】正規化する際の演算アルゴリズムを示す図であ
る。

【図１０】話者ｉがＪ回発声した信号波形の特徴量成分
値を示す図である。

【図１１】複数の特徴量成分値に基づいて得られた単語
Ｗｎのファジィ標準パターンデータを示す図である。

【図１２】複数の特徴成分値に基づいて、ファジィ数化
する方法を説明する為の図である。

【図１３】単語Ｗ１〜ＷＮのファジィ標準パターンデー
タ群を示す図である。

【図１４】単語「東京」のファジィ特徴量成分値を各次
元ごとにフレーム順（時系列）に表した図である。

【図１５】単語「愛知」のファジィ特徴量成分値を各次
元ごとにフレーム順（時系列）に表した図である。

【図１６】単語Ｗ１，Ｗ２の特徴量成分値の第一次元成
分のフレーム毎のファジィ数の例を示す図である。

【図１７】未知の音声信号の正規化後特徴ベクトルにつ
いて、第一次元成分におけるファジィ標準パターンとの
ファジィ関係を示す図である。

【図１８】未知の音声信号の正規化後特徴ベクトルにつ
いて、第二次元成分におけるファジィ標準パターンとの
ファジィ関係を示す図である。

【図１９】未知の音声信号の各次元、各フレームにおけ
る特徴量成分値について、ファジィ標準パターンとのフ
ァジィ関係を示す図である。

【図２０】特徴量成分値に重みづけを与えた場合を説明
する為の図である。

【図２１】従来のマルチテンプレート法における標準パ
ターンを説明する為の図である。

【符号の説明】

３・・・・・入力手段５・・・・・特徴量抽出手段７・・・・・時系列データ演算手段９・・・・・正規化手段１１・・・・正規化後時系列データ記憶手段１３・・・・ファジィ標準パターンデータ記憶手段１７・・・・ファジィ関係演算手段１９・・・・類似度演算手段

フロントページの続き (56)参考文献特開昭59−71100（ＪＰ，Ａ) 特開昭59−127098（ＪＰ，Ａ) 特開昭62−66299（ＪＰ，Ａ) 特開昭57−56898（ＪＰ，Ａ) 特開平７−13597（ＪＰ，Ａ) 特開平１−269998（ＪＰ，Ａ) 特公平６−54439（ＪＰ，Ｂ２) 特公平５−56520（ＪＰ，Ｂ２) 特許2899024（ＪＰ，Ｂ２) 藤本潤一郎，ファジィ理論を用いた音声認識，情報処理，日本，1989年８月 15日，Ｖｏｌ．30，Ｎｏ．８，ｐ. 957−962 (58)調査した分野(Int.Cl.⁷，ＤＢ名) G10L 15/00 - 15/28 ＪＩＣＳＴファイル（ＪＯＩＳ)

Claims

(57)【特許請求の範囲】

【請求項１】信号波形データが入力される入力手段、前記信号波形データを複数フレームに分割し、各フレー
ム毎の周波数成分をフレーム特徴量として抽出する特徴
量抽出手段、前記各フレーム特徴量から所望の特徴量成分値を抽出
し、抽出した特徴量成分値に基づいて、抽出した複数の
特徴量成分を各次元の成分とする要素ベクトルを、多次
元ベクトル空間に配置するとともに、各フレームの要素
ベクトルを連結させた特徴ベクトル時系列データを演算
する時系列データ演算手段、前記特徴ベクトル時系列データを、時間軸にて正規化
し、正規化後特徴ベクトル時系列データを演算する正規
化手段、得られた正規化後特徴ベクトル時系列データを記憶する
正規化後時系列データ記憶手段、複数の信号波形データに基づき得られた複数の正規化後
特徴ベクトル時系列データの各特徴量成分値をファジィ
数化して得られたファジィ標準パターンデータを登録デ
ータとして予め記憶しておくファジィ標準パターンデー
タ記憶手段、前記正規化後時系列データ記憶手段に記憶された判定対
象の正規化後特徴ベクトル時系列データの各フレーム及
び各次元の特徴量成分値について、ファジィ標準パター
ン記憶手段に記憶されたファジィ標準パターンデータと
のファジィ関係を演算するファジィ関係演算手段、演算したファジィ関係に基づき、ファジィ標準パターン
データと判定対象の正規化後特徴ベクトル時系列データ
との類似度を演算する類似度演算手段、を備えた信号波形データ比較装置であって、前記類似度演算手段は、1) 前記登録データ毎のファジィ標準パターンデータに基
づき、各フレームの各次元毎の特徴量成分値の平均値を
求め、当該平均値に対して前記特徴量成分値が大きい度
合いに応じてその重み値を各フレームおよび各ベクトル
空間ごとに演算し、 2) 得られた重み値および前記ファジィ関係に基づき、前
記登録データと判定対象の正規化後特徴ベクトル時系列
データとの類似度を演算すること、を特徴とする信号波形データ比較装置。
【請求項２】請求項１の信号波形データ比較装置におい
て、前記類似度演算手段は、 1)単語毎のファジィ標準パターンデータに基づき、各フ
レームの各次元毎の特徴量成分値の平均値を求め、当該
平均値に対して前記特徴量成分値が大きい度合いに応じ
てその重み値を各フレームおよび各ベクトル空間ごとに
演算し、 2)得られた重み値および前記ファジィ関係に基づき、フ
ァジィ標準パターンデータと判定対象の正規化後特徴ベ
クトル時系列データとの類似度を演算すること、を特徴とする信号波形データ比較装置。
【請求項３】請求項１または請求項２の信号波形データ
比較装置において、前記正規化手段は、 1)前記各特徴ベクトル時系列データの各特徴量成分値を
ファジィ分類するファジィ分類手段、 2)ファジィ分類された各特徴量成分値に基づき、代表特
徴点を演算するとともに、求めた代表特徴点を時系列順
に連結し、代表特徴点時系列データを演算する代表特徴
点時系列データ演算手段、 3)前記代表特徴点時系列データに基づいて、正規化後特
徴ベクトル時系列データを演算して出力する正規化後時
系列データ演算手段、を備えたことを特徴とする信号波
形データ比較装置。
【請求項４】入力された信号波形データを複数フレーム
に分割し、各フレーム毎の周波数成分をフレーム特徴量
として抽出し、前記各フレーム特徴量から所望の特徴量成分値を抽出
し、抽出した特徴量成分値に基づいて、抽出した複数の特徴
量成分を各次元の成分とする要素ベクトルを、多次元ベ
クトル空間に配置し、各フレームの要素ベクトルを連結させた特徴ベクトル時
系列データを演算し、前記特徴ベクトル時系列データを、時間軸にて正規化
し、正規化後特徴ベクトル時系列データを演算し、得られた正規化後特徴ベクトル時系列データを記憶し、複数の信号波形データに基づき得られた複数の正規化後
特徴ベクトル時系列データの各特徴量成分値をファジィ
数化して得られたファジィ標準パターンデータを登録デ
ータとして予め記憶しておき、判定対象の正規化後特徴ベクトル時系列データの各フレ
ーム及び各次元の特徴量成分値について、前記ファジィ
標準パターンデータとのファジィ関係を演算し、得られたファジィ関係に基づき、ファジィ標準パターン
データと判定対象の正規化後特徴ベクトル時系列データ
との類似度を演算し、その類似度を出力する信号波形デ
ータ比較方法であって、前記登録データ毎のファジィ標
準パターンデータに基づき、各フレームの各次元毎の特
徴量成分値の平均値を求め、当該平均値に対して前記特
徴量成分値が大きい度合いに応じてその重み値を各フレ
ームおよび各ベクトル空間ごとに演算し、得られた重み
値および前記ファジィ関係に基づき、前記登録データと
判定対象の正規化後特徴ベクトル時系列データとの類似
度を演算すること、を特徴とする信号波形データ比較方法。