JPS6024597A

JPS6024597A - 音声登録方式

Info

Publication number: JPS6024597A
Application number: JP58133313A
Authority: JP
Inventors: 松木　智子; 秀夫田中
Original assignee: Nippon Electric Co Ltd
Current assignee: NEC Corp
Priority date: 1983-07-21
Filing date: 1983-07-21
Publication date: 1985-02-07
Also published as: EP0135046A1; US4731845A; DE3466818D1; EP0135046B1

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】本発明は、音声認識処理における音声登録方式従来、音
声認識処理のｒｃめには、音声登録、すなわち登録用の
音声データを作成する必要がある。

それには、いろいろな方法があると考えられるが、一般
的に、第１図のアルゴリズムに示すように、一度の発声
によシ登録データを作成し、音声登録を行う。従って、
登録する際の発声に失敗した場合、音声認識のために、
何度発声しても認識できないということが起こる。また
、同一話者が同一音声を発生する際、はとんどの場合音
声データは発声ごとに異なる。そのため、登録のための
発声が普段と全く異なった場合、発声に失敗した時と同
様に認識が困難になると考えられる。これらの場合、認
識が困難になる原因が発声する際の失敗によると断定す
ることは難しい。認識できない原因を発声の失敗による
とした場合、再登録する必要があるが、再度失敗するこ
とも考えられる。

同一話者認識において、発声による失敗をなくすために
予め練習した上で音声登録を行った場合、普段と極端に
異なる発声を避けることができ、良質の登録データを作
成することが可能である。さらに、認識させるための発
声においても、登録のための練習の効果が期待できるた
め、認識が容易になると考えられる。しかし、音声認識
処理を簡単に行えるようにするためには、音声登録にお
いて発声の練習を必要とするのは望ましくないことであ
る。

このように、従来の音声登録方式においては、発声デー
タが発声ごとに異なることに起因する音声認識の困難や
、音声認識の困難を克服するためには発声練習を必要と
するという欠点があった。

本発明の目的は、上記欠点を除去し、音声登録のための
発声が原因となる音声認識処理の失敗を排除し、また発
声の失敗による再登録及び良質な登録音声作成のための
発声練習などを不要とする音声登録方式を提供すること
にある。

本発明の音声登録方式は、同一語として認識されるべき
音声を３回以上発声することによシ得られる３以上の音
声パターン全記憶し、該記憶された音声パターン、＋４
１互間でマツチング距離計算を行い、前記３以上の音声
パターンごとにマツチング距離の和をめ、前記３以上の
音声パターンの中から前記マツチング距離の和が最も小
さい音声パターンを選択し、登録音声として採用するこ
とを特徴とする。

音声認識処理におけるマツチング処理とは、２つの音声
パターンの差を絶対値、即ち距離をめることである。マ
ツチング処理によシ得られる距離をマツチング距離とい
う。マツチング距離がゼロになるということは、マツチ
ング処理を行った２つの音声パターンが、全く等しいも
のであることを示す。

マツチング処理にはいくつかの方法があるが、ここでは
ＤＰマツチング・アルゴリズムに基づいたパターンマツ
チング方式について説明する。

（１）音声の分析マツチング処理を行うためには、まず音声を分析する必
要がある。ここではバンドパスフィルタバンクに異る音
声の分析方法について説明する。入力音ｔｋｋいくつか
の周波数帯域に分けたバンドパスフィルタで帯域分割し
、分割された音声データを整流回路、ローパスフィルタ
に通す。こうして得られた値′ｔ−２０ｍ５ｅｃ程度の
フレーム周期でＡ／Ｄ変換する。その結果、音声パター
ン人は、以下のようにベクトルの時系列で表わされる。

Ａ＝ａ、、ａ、、・・・・・・・−・、＆１．・・・・
・・・・・、　ａ１１６チヤネルのフィルタバンクの場
合にはＩＬｉは以下のように表わされる。

ａｌ　＝（ａｓ、　ａｓ、・・−・・・・・・、ａｌ・
）（１）ＤＰマツチングマツチング処理を行う２つの音声ノくターンＡ。

Ｂを以下のように示す。

Ａ　＝　ｉＬ　ｔ　ｒ　ａ　＊、・・・・・・−・・、
ａｔ、・・・・・・・・・、１ＬＩ３＝ｂ、、ｂ寡、・
・・・・・・・・、　ｂｊ、・・・・・・・・・、ｂＪ
ここで、Ｉ、Ｊはそれぞれのノ（ターンのフレーム数で
ある。２つのベクトルｉｌｌとｂｊの間の距離ｄ（＋、
ｊ）は以下の計算式を用いる。

ｄ　（Ｉ、　ｊ　）＝ｌｌａｔ　−ｂｊ　ｌｌ＝Σ１ａ
ｔｘ−ｂｊＩＩＣ＝１（Ｉ）ＤＰマツチングアルゴリズムによれば２つの音声パター
ン人、Ｂの間のマツチング距離ｇ（Ｉ。

Ｊ）は以下の漸化式を（ｔ、］）＝（１，ｉ）からＣＩ
、Ｊ）ｔで計算することによシ得られる。

時間軸の整合を行うＤＰマツチングにおいて、時間軸の
極端な変＃を避けるために整合窓を設け、整合窓内での
み（Ｉ）の漸化式計算を行う。

第２図にＤＰマッデングにおける整合窓を示す。

以上のことから二つのパターンの間のマツチング距離が
小さい程２つの音声は似ていることがわかる。音声認識
処理において未知入力音声パターンと登録音声パターン
とのマツチング距離が最も小さい登録音声が認識音声と
して採用される。次に、本発明の、実施例について図面
を用いて説明する。第３図は゛本発明の実施例において
使用する音声−識登録装置のプ四ツク図である。ある音
声全４回発声し、その中から登録する音声を選択する場
合について説明する。まず、第３図の発声回数指定部ｌ
において登録音声選択のための発声の回数を４回と指定
する。次に、音声発声部２において、登録しようとする
音声を、４回発声する。１回目に発声された音声（ｉ−
Ａｘとおき、音声記録部３において、メモリＡ１に格納
する。この処理を４回繰り返すことにより、同様に２．
３．４回目に発声された音声を、それぞれＡ２．Ａａ’
、Ａ４とおき、音声記録部３において、メモリＡ２．メ
モリＡｓ、メモリＡ４に格納する。マツチング距離ｉ１
算部４において、４回の発声より得られる音声パターン
について、すべての組合わせでマツチング距離をめる。

即ち、ＡｌとＡ２、ＡＸとＡａ。

・・・・・・、Ａ３とＡ４の間でＤＰマツチング処理を
行い、それぞれの音声パターン間のマツチング距離Ｄ１
２，１）１３１・・・・・・、Ｄａ４を計算する。ＤＰ
マツチング処理に関しては、新美１ｊｉ永著「音声認識
」（情幸科学講座Ｅ、１９．３．共立出版（株）　）　
１０７ページに述べられている。発声が全く等しい場合
には、マツチング距離がゼロになるが、完全に同じ発声
ケすることはほとんど不可能である。従って、各音声パ
ターン間のマツチング距離がゼロになるこ七はほとんど
なく、また、各音声パターン間のマツチング距離が等し
くなることもほとんどない。マツチング距離計算部４に
よシ得られた各音声ハターン間のマツチング距離は、マ
ツチング距離記録部５において、メモリＤ１２．メモリ
Ｄｕｓ。

・・・・・・、メモリＤ３４　に格納する。各音声パタ
ーン間のマツチング距離を第１表に示すよう゛に仮定す
る。マツチング距離加算部６において、各音声パターン
ごとに他の音声パターンとのマツチング距離の和をめる
。即ち、Ａｘについてマツチング距離の和をめる場合、
ＤＩ２＋０１３＋Ｄ１４がめる値であＪ、Ａｔについて
のマツチング距離の和は、Ｄ１２＋Ｄ２３＋Ｄ２４であ
る。得られたマツチング距離の和を、：Ａ１．Ａ２．Ａ
ａ、Ａ４についてそれぞれＤＩ、Ｄ２．Ｄａ、Ｄ４とし
、距離和記録部７において、メモリＤ１．メモリＤ２．
メモリＤａ、メモリＤ４に格納する。各音声パターンご
とのマツチング距離の和の大きさを、比較選択部８にお
いて比較し、マツチング距離の和の小さいものを選択す
る。第１表に示すように、１）ｌは第１表Ｄ２．Ｄａ、Ｄ４と比較して最も小さい。従って、比較
選択部８においてＡＩを登録音声として選択し、音声登
録部９において、登録音声格納領域に登録する。音声認
識処理において、未知入力音声パターンとのマツチング
距離が最も小さい登録音声ｋｇＲ音声として採用する。

このことから、同一音声を複数回発声した場合に、各音
声パターン間のマツチング距離が小さいものｔｌど、よ
シ近い音声、即ち、等しい音声として認識する。従って
、本実施例におけるＡＩ、Ａ２．Ａ３．Ａ４の４回発声
された音声の中で、マツチング距離の和が最も小さい音
声Ａｌｉ登録音声として採用する。このことは、最も認
識されやすい音声を登録音声として用いることを示して
いる。

以上のことから、本発眠による音声登録方式を用いれば
、発声の失敗による再登録の繁雑さを避け、よい登録の
ための発声練習を不要とし、認識率を向上させる登録音
声データに作成する効果がある。

【図面の簡単な説明】

第１図は従来の音声登録方式を示す流れ図、第２図はマ
ツチング処理における整合窓を示す図、第３図は本発明
の実施例において使用する音声認識登録装置のブロック
図である。１・・・・・・音声回数指定部、２・・・・・・音声発
声部、３・・・・・・音声記録部、４・・・・・・マツ
チング距離計耳部、５・・・・・・マツチング距離記録
部、６・・・・・・マツチング距離加算部、７・・・・
・・距離和記録部、８・・・・・・比較選択部、９・・
・・・・音声登録部。

Claims

【特許請求の範囲】

同一語として認識されるべき音声を３回以上発生するこ
とによシ得られる３以上の音声パターンを記憶し、該記
憶された音声パターン相互間でマツチング距離計算ヲ行
い、前記３以上の音声パターンごとにマツチング距離の
和をめ、前記３以上の音声パターンの中から前記マツチ
ング距離の和が最も小さい音声パターンを選択し、登録
音声として採用すること全特徴とする音声登録方式。