JP3090344B2

JP3090344B2 - 音声認識装置

Info

Publication number: JP3090344B2
Application number: JP03152940A
Authority: JP
Inventors: 洋一貞本; 洋一竹林; 宏之坪井; 博史金澤
Original assignee: Toshiba Corp
Current assignee: Toshiba Corp
Priority date: 1991-06-25
Filing date: 1991-06-25
Publication date: 2000-09-18
Anticipated expiration: 2015-09-18
Also published as: JPH052399A

Description

【発明の詳細な説明】

【０００１】

【産業上の利用分野】本発明は、荷物の区分け、券売機
等に用いられる音声認識装置に関する。

【０００２】

【従来の技術】近年、マンマシン・インタ―フェ―スと
して音声認識・合成の技術発展が目ざましく、荷物の区
分け、券売機等に音声認識装置が使用されている。しか
し、現在の音声認識装置の多くは、使用する環境のノイ
ズが多くなると認識率が低下してしまう。そこでこのノ
イズを人工的に重畳した学習用音声デ―タより作成した
音声認識辞書を用いるという手法、あるいは、ノイズ除
去の諸手法を用いて対応されていた。

【０００３】しかしながら、ノイズを人工的に重畳した
学習用音声デ―タより作成した音声認識辞書を用いる場
合、ノイズの種類を限定しなければ認識性能は向上しな
いにも拘らず、周囲の環境は一様ではなく常に変化する
ため、ノイズを限定して音声認識辞書を用いることは困
難であった。

【０００４】さらに、ノイズ除去を行う方法を用いる場
合にも、一般にノイズは非定常・有色であるので、ノイ
ズの音声波としての特徴やそのノイズの発生のタイミン
グをとらえることが難しい。したがって、周囲の環境が
変化すると、発生したノイズに適したノイズ除去を十分
に行うことができなかった。

【０００５】

【発明が解決しようとする課題】このように従来の音声
認識装置では、上述したノイズ対策を行っていても、周
囲の環境が時事刻々変化するノイズに対して的確に対応
することができず、認識率を低下させる要因となってい
た。

【０００６】本発明はこのような事情を考慮してなされ
たもので、その目的とするところは、周囲の環境の変化
に伴って時事刻々変化するノイズに対しても充分に認識
率の向上を図ることのできる実用性の高い音声認識装置
を提供することにある。

【０００７】

【課題を解決するための手段】第一の発明に係る音声認
識装置は、複数種類のノイズを重畳してそれぞれ作成さ
れた複数の音声認識辞書を備え、音声を入力する入力部
と、入力した音声を分析する分析部と、ノイズの発生に
関する例えば時間長、時刻、周期等の時間的情報を予め
記憶しておく記憶部と、タイマ―からの現在の時刻に対
応するノイズを重畳して作成された音声認識辞書を記憶
部の情報をもとに選択する選択部と、分析部の分析結果
と選択部で選択した音声認識辞書とを照合して入力した
音声を認識する認識部とを備えたことを特徴とするもの
である。

【０００８】第二の発明に係る音声認識装置は、複数種
類のノイズデ―タを保持し、音声を入力する入力部と、
上記と同様に予め記憶しておいたノイズの発生に関する
時間的情報を用いて現在の時刻に対応するノイズデ―タ
を選択する選択部と、選択部で選択されたノイズデ―タ
を用いて入力された音声からノイズを除去し、ノイズを
除去した音声を分析する分析部と、分析部の分析結果を
音声認識辞書と照合して入力した音声を認識する認識部
とを備えたことを特徴とするものである。

【０００９】

【作用】本発明によれば、予め記憶したノイズの発生の
時間的情報を参照して、あるノイズが発生する時刻や時
間長を得、その時点で発生するノイズと同じようなノイ
ズを重畳した音声デ―タより作成された音声認識辞書を
選択することにより、時間を追って変化する環境ノイズ
の下でも、ノイズの種類を限定した音声認識辞書を用い
ることができる。同様に、予め記憶したノイズの発生に
関する時間的情報を参照して、その時点で発生するノイ
ズに当たるノイズデ―タを選択してノイズ除去を行うこ
とにより、ノイズが時間とともに変化する環境下でも、
入力音声から適切にノイズを除去することができる。し
たがって、音声認識の性能を高めることができる。この
ようなノイズ対策を、対象音声が入力された時刻をモニ
タすることで、全自動的に行うことができる。

【００１０】

【実施例】以下、本発明を参照しながら本発明の一実施
例について説明する。 ○実施例１

【００１１】図１は、本発明の第１の実施例に係る音声
認識装置のブロック図である。本装置は、音声入力部
１、音響分析部２、音声認識部３、認識辞書スイッチ
４、認識辞書部５、ノイズ対策部６により構成される。

【００１２】音声入力部１は、マイクロホン等を通じて
電気信号に変換される入力音声を、例えば12kHz の標本
化周波数にて16bitsの量子化ビット数のデジタル信号に
変換し、音響分析部２に出力する。音響分析部２は、Ｆ
ＥＴ分析（高速フ―リエ変換による周波数分析）、ＬＰ
Ｃ（線形予測法）分析、ケプストラム分析、フィルタ分
析等の分析法のうちいずれかにより、例えば８ms毎に特
徴パラメ―タを求め、その時系列を音声認識部３に出力
する。音声認識部３では、音響分析部２から得た特徴パ
ラメ―タと認識辞書部５の認識辞書のリファレンス特徴
パラメ―タとの照合を行い、類似度を算出して、音声認
識する。例えば、音響分析部でＦＥＴ分析して得られた
周波数スペクトルパタ―ンと認識辞書中の各単語のリフ
ァレンスパタ―ンとの照合を行い、複合類似度法により
類似度を計算して、最も類似度の高い単語を認識結果と
して出力する。ここで用いる認識辞書は、後述するノイ
ズ対策部６により選択されたものである。

【００１３】ここで、認識辞書部５は複数の認識辞書１
〜ｎを保持している。各々の認識辞書は、本音声認識装
置が設置された環境での固有の特徴的環境音を、静かな
環境で収集された学習用音声に重畳して、パタ―ン変形
した音声デ―タより作成したものである。例えば、本装
置が学校のエレベ―タ内に設置された場合においては、
認識辞書１は、朝の登校時でエレベ―タが最も混雑して
いるときの、足音、話し声を多く含んだ環境ノイズを、
認識辞書２は、授業中でエレベ―タが比較的混まないと
きの、エレベ―タの動力音をわずかに含んだ環境ノイズ
を、それぞれ学習用音声に重畳した音声デ―タにより作
成されるものである。あるいはまた、例えば、本装置が
駅構内に設置された場合においては、認識辞書１は列車
の発着に伴う人の移動音を含む環境ノイズを、認識辞書
２はホ―ムで鳴るベル音を含む環境ノイズを、認識辞書
３は列車の動力音を含む環境ノイズを、それぞれ学習用
音声に重畳した音声デ―タにより作成されるものであ
る。なお、これらの認識辞書を、各状況の環境音と学習
用音声とが混合した音声を入力、分析した音声デ―タよ
り作成するという方法もある。

【００１４】ノイズ対策部６は、タイマ―（６１）と時
間情報管理テ―ブル１（６２）と対策部（６３）とから
構成される。時間情報管理テ―ブル１は、例えば表１に
示すように、各々の認識辞書が使われるべき時間の情報
（曜日、時刻、時間等）と認識辞書（辞書番号）との対
応関係を保持している。このテ―ブルは例えば、上述し
たうち後者の例では、時刻表から列車の発着の時刻を参
照して作成される。

【００１５】

【表１】

【００１６】対策部（６３）の動作を図３のフロ―図に
従って説明する。まず、タイマ―（６１）より時刻をモ
ニタする（Ｓ１）。次に、その時刻が当てはまる時間帯
を時間情報管理テ―ブル１（６２）の曜日、時刻、時間
長等の項目より検索し、検索した時間帯に用いるべき認
識辞書番号を抽出する（Ｓ２）。例えば、タイマ―から
の時刻が水曜日の８：20：00であれば、表１の月〜金の
８：00：00〜８：24：59に当てはまるので、認識辞書番
号１を抽出し、タイマ―からの時刻が土曜日の９：25：
00であれば、表１の土〜日の８：00：00〜９：59：59に
当てはまるので、認識辞書番号４を抽出する。次に、抽
出した認識辞書番号の認識辞書が音声認識部３において
用いられるように、認識辞書スイッチ４を制御する（Ｓ
３）。そして、再びタイマ―からの時刻をモニタして同
様の処理を繰り返す。

【００１７】このように、本実施例装置においては、環
境ノイズの発生に関する時間的情報を用いて、その場の
環境を反映した環境ノイズを重畳した学習用音声デ―タ
により作成した認識辞書を選択的に使用するため、環境
情報を効果的に利用して適切なノイズ対策を行うことが
でき、認識性能が向上する。

【００１８】なお、ここでの「タイマ―」は、任意のあ
る時点を基準としてある期間（例えば１ケ月、１週間、
１日等）中ある単位（秒、分、時間）で時間のカウント
をする装置であるが、これを通常の時計（場合によって
は日付や曜日つきの時計）に置き換えてもよい。 ○実施例２

【００１９】図２は、第２の実施例に係る音声認識装置
のブロック図である。この音声認識装置は、音声入力部
１、音響分析部２、音声認識部３、ノイズ除去部８、ノ
イズデ―タ部９、ノイズデ―タスイッチ１０、認識辞書
１１、ノイズ対策部７により構成される。

【００２０】音声入力部１、音響分析部２、音声認識部
３の機能は第１の実施例と同様である。但し、音響分析
部２にあるノイズ除去部８が、入力音声に含まれる環境
ノイズを除去する。

【００２１】ここでは、ノイズ除去の方法として、スペ
クトルサブストラクション法と呼ばれる手法を用いた場
合について説明する。まず、認識対象となる音声が入力
されていないときに環境ノイズを取り込み、そのノイズ
のバンド周波数毎のパワ―スペクトルを求めて、ノイズ
デ―タとする。つまり、バンド周波数毎のパワ―スペク
トル列：｜ｘ₁｜｜ｘ₂｜…｜ｘ_n｜（ｎはバンド数、
｜ｘ_i｜はバンド周波数ｉのパワ―スペクトル）がノイ
ズデ―タとなる。このノイズデ―タを作成するために取
り込む環境ノイズは、本音声認識装置が設置された環境
での固有の特徴的環境音である。ノイズデ―タはノイズ
デ―タ部９に複数（１〜ｎ）保持される。例えば、本装
置が駅構内に設置されているならば、ノイズデ―タ１
は、列車の発着に伴い固定位置にあるベルから発せられ
るベル音を固定位置にあるマイクから入力してパワ―ス
ペクトル化したものにであり、ノイズデ―タ２は、列車
の発着に伴い人が移動するざわざわした音を入力してパ
ワ―スペクトル化したものである。

【００２２】ノイズ対策部７は、タイマ―（７１）と時
間情報管理テ―ブル２（７２）と対策部（７３）とから
構成される。時間情報管理テ―ブル２は、例えば表２に
示すように、各々のノイズデ―タが使われるべき時間の
情報（曜日、時刻、時間長等）とノイズデ―タとの対応
関係を保持している。このテ―ブルは、上述した例で
は、時刻表を参照して作成される。

【００２３】

【表２】

【００２４】対策部（７３）は、第１の実施例と同様
に、タイマ―（７１）により現在の時刻をモニタし、時
間管理情報テ―ブル２（７２）からある時刻に使われる
べきノイズデ―タ番号を抽出する。例えば、現在の時刻
が木曜日の８：00：00のとき、表２の月〜金、８：00：
00〜８：00：05に対応するノイズデ―タ番号１を抽出す
る。次に、抽出したノイズデ―タ番号のノイズデ―タが
ノイズ除去部８によって用いられるように、ノイズデ―
タスイッチ１０を制御する。

【００２５】ノイズ除去部８では、音声入力部１に入力
された音声の全てのバンド周波数のパワ―スペクトルか
ら、ノイズ対策部７で選択されたノイズデ―タの｜ｘ_i
｜（ｉ＝１，２，…，ｎ）をそれぞれ差し引く。つま
り、（入力音声のパワ―スペクトル｜ｙ_i｜−上記｜ｘ
_i｜）という処理を行う。

【００２６】認識対象となる音声がノイズと共に入力さ
れると、上記のように、音響分析部においてノイズ成分
を除去して認識対象となる音声信号のパワ―スペクトル
を推定し、このパワ―スペクトルパタ―ンを音声認識部
３において認識辞書１１中のリファレンスパタ―ンと照
合して認識を行う。

【００２７】ノイズ除去の方法としては、このほか、適
応フィルタを用いたアクティブノイズ制御等がある。こ
れは、ノイズの混入した音声を入力する入力部と、ノイ
ズのみを入力する入力部と、適応フィルタとを用いてノ
イズ除去を行うもので、この場合には、各時間帯のノイ
ズに対応する適応フィルタの初期値を、ノイズデ―タ１
〜ｎとして保持する。

【００２８】以上のように、環境音が時間帯によって変
化するとき、環境ノイズの発生に関する時間的情報を用
いて、その場の環境を反映したノイズデ―タを選択的に
使用してノイズ除去を行うため、Ｓ／Ｎ比を高めて認識
性能を向上させることができる。

【００２９】なお、第１及び第２の実施例において、そ
れぞれ、認識辞書作成の際に重畳させる環境ノイズ及び
ノイズデ―タ作成の際に取り込む環境ノイズは、上で説
明したように状況に対応したものを収集して、後で時間
情報管理テ―ブル作成の際に時間と対応させていてもよ
いし、あるいは、まず状況の時間的変化を時間情報管理
テ―ブルの形に記述して、各時間帯における環境ノイズ
を収集しその番号の認識辞書かノイズデ―タを作成する
ようにしてもよい。 ○実施例３

【００３０】図４は、第３の実施例に係る音声認識装置
のブロック図である。この音声認識装置は、第１と第２
の実施例を組み合わせたもので、認識辞書部５・認識辞
書スイッチ４とノイズ除去部８・ノイズデ―タ部９・ノ
イズデ―タスイッチ１０とを両方備えている。また、ノ
イズ対策部６７は、時間情報管理テ―ブル１及び２を両
方保持している。

【００３１】処理の流れを簡単に説明する。ノイズ対策
部６７では、タイマ―から音声を入力した時刻を知り、
時間情報管理テ―ブル２を参照してノイズデ―タ部９の
ノイズデ―タを選択し、時間情報管理テ―ブル１を参照
して認識辞書部５の認識辞書を選択する。ここで、時間
情報管理テ―ブル１と２を合体させた、時間の情報の項
目・ノイズデ―タ番号・認識辞書番号を１セットとする
テ―ブルを持つようにしてもよい。選択したノイズデ―
タを用いて、音響分析部２とその中のノイズ除去部８
が、分析と共にノイズ除去を行い、その結果を音声認識
部３に出力する。音声認識部３は、選択した認識辞書を
用いて認識を行う。ここで、認識辞書は、対応するノイ
ズデ―タを用いてノイズ除去を行ってもまだ残るノイズ
を学習用音声に重畳した音声デ―タをもとに作成された
ものである。

【００３２】本実施例では、第２の実施例におけるノイ
ズ除去の効果が不十分である場合にも、除去しきれなか
ったノイズに即した認識辞書を選択的に用いることによ
り、更に認識性能が向上する。 ○実施例４

【００３３】図５は、第４の実施例に係る音声認識装置
のブロック図である。この音声認識装置は、第１の実施
例と、ワ―ドスポッティング法により認識辞書を学習さ
せる機能とを組み合わせたもので、第１の実施例の構成
に、学習用音声デ―タファイル１２、学習用音声デ―タ
加工部１３、認識辞書作成部１４を付加した構成を持
つ。

【００３４】ワ―ドスポッティング法による認識辞書の
学習は、特願平１−２５５２７０号に述べられている方
式が利用できる。音声入力部１から認識すべき音声が入
力されていない（環境ノイズのみが入力されている）時
に、音声入力部１から入力され音響分析部２で分析され
た環境ノイズと、学習用音声デ―タファイル１２の学習
用音声デ―タとを、学習用音声デ―タ加工部１３におい
て重畳し、この結果を音響分析部２を通して認識辞書作
成部１４に送る。

【００３５】この認識辞書作成部１４において、認識辞
書部５の内どの認識辞書を学習させるかという判断は、
ノイズ対策部６に保持されている、ある認識辞書が使用
されるべき時間とその辞書との対応関係の情報よりなさ
れる。例えば、タイマ―７からの時刻と時間情報管理テ
―ブル１の曜日、時刻、時間長が合致した辞書番号の認
識辞書を選択し、認識辞書スイッチ４を制御して、選択
した認識辞書をそのときの環境ノイズで学習させる。

【００３６】本実施例では、実際にこの音声認識装置を
使用すると全く同一の環境で、その環境に特有のノイズ
を用いて認識辞書を作成するため、第一の実施例の効果
に加えて更に音声認識の性能を向上させることができ
る。 ○実施例５

【００３７】図６は、第５の実施例に係る音声認識装置
のブロック図である。この音声認識装置は、第３と第４
の実施例を組み合わせたもので、処理の流れは第３、第
４の実施例と同様である。 ○実施例６

【００３８】図７は、第６の実施例に係る音声認識装置
のブロック図である。第５の実施例までは、ノイズ対策
を講じて認識性能を高めるものであったが、本実施例
は、発声者を限定することにより認識性能を高めようと
するものである。この音声認識装置は、音声入力部１、
音響分析部２、音声認識部３、認識辞書１１、発声者予
測部１５、語彙・発声者対応テ―ブル１６により構成さ
れる。音声入力部１、音響分析部２の機能は第１の実施
例と同様である。

【００３９】語彙・発声者対応テ―ブル１６には、例え
ば語彙・発声者対応テ―ブル（表３）のように語彙毎に
その語彙を主に発話する人の集合を対応づけたものであ
る。例えば、「おかあちゃん」という語彙には、小学生
という集合が対応づけられている。

【００４０】

【表３】

【００４１】発声者予測部１５は、例えば時間情報管理
テ―ブル３（１５２）（表４）のように時間情報とその
時間に本音声認識装置の入力音声の発声者となる確率の
高い人の集合を対応づけた情報を保持している。そして
タイマ―（１５１）より時刻をモニタして、その時刻に
発声者となりやすい人の集合（これを予測発声者と呼
ぶ）を時間情報管理テ―ブル３より選択し、音声認識部
３に伝える。予測発声者とは例えば、人をある基準によ
りいくつかの集団に分け、集団に属する人がその時間帯
に本装置に音声を入力する頻度を集団毎に集計し、この
頻度が最も高い集団である。

【００４２】

【表４】

【００４３】音声認識部３では、第１の実施例で説明し
たように複合類似度法により認識対象語彙の類似度を算
出する。そして、例えば単語を認識する際、発声者予測
部１５より伝えられた現在の予測発声者と語彙・発声者
対応テ―ブル１の対象発声者の集合が一致する語彙（単
語）を確認し、一致する語彙（単語）の類似度に重みづ
けして大きくし、また一致しない語彙（単語）の類似度
を小さくする。次ぎに、重みづけられた類似度により認
識単語の判定を行う。

【００４４】例えば、店舗において月〜金曜日の15：30
〜17：00に小学生がいつもたくさん来る場合、発声者予
測部１５により時間情報管理テ―ブル３を用いて小学生
の集合を表す情報が音声認識部３に伝えられる。音声認
識部３では、認識辞書１１中の「キャンデイ」「おにい
ちゃん」「おかあちゃん」等の語彙は語彙・発声者対応
テ―ブル１より予測発声者が小学生であるために類似度
が重みづけられ大きくなるため、認識単語として判定さ
れやすくなる。よって、例えば小学生が２０歳前後の男
性店員を「おにいちゃん」と呼んだ場合など音声を認識
してその店員に知らせる事ができる。

【００４５】このように、本実施例によれば、発声者と
なる確率の高い人の情報を用いて語彙の類似度に重みづ
けし、高い認識率を得ることができる。更に、発声者と
なる確率の高い人の情報を時間と対応づけて用いること
により、刻々と変化する環境に適応した認識を行うこと
ができる。 ○実施例７

【００４６】図８は、第７の実施例に係る音声軟式装置
のブロック図である。この音声認識装置は、第１と第６
の実施例を組み合わせたもので、認識辞書部５、認識辞
書スイッチ４と語彙・発声者対応テ―ブル１６とを両方
備えており、ノイズ対策部６と発声者予測部１５の機能
を兼ね備えた環境適応部１７を持つ。処理の流れは第
１、第６の実施例と同様である。 ○実施例８

【００４７】図９は、第８の実施例に係る音声認識装置
のブロック図である。この音声認識装置は、第２と第６
の実施例を組み合わせたもので、ノイズ除去部８、ノイ
ズデ―タ部９、ノイズデ―タスイッチ１０と語彙・発声
者対応テ―ブル１６とを両方備えており、ノイズ対策部
７と発声者予測部１５の機能を兼ね備えた環境適応部１
８を持つ。処理の流れは第２、第６の実施例と同様であ
る。 ○実施例９

【００４８】図１０は、第９の実施例に係る音声認識装
置のブロック図である。第８の実施例までは、時間情報
管理テ―ブルのスケジュ―ル通りに環境が変化すること
を前提とするものであったが、本実施例は、環境の変化
の時間的なズレにも対応できるようにしたものである。
この音声認識装置は、音声入力部１、音響分析部２、音
声認識部３、認識辞書スイッチ４、認識辞書部５、ノイ
ズ対策部１９、臨時事象選択部２０により構成される。

【００４９】環境の変化には、駅構内で電車が到着す
る、電車の発着にともなってベルが鳴る等の、観測可能
な「事象」が起きることによってもたらされるノイズ
と、群集によってかもし出されるざわざわした音や、早
朝に鳴く鳥の声等の、ノイズとそのノイズが発生する原
因との因果関係がはっきりせず事象という概念ではとら
えきれない「状況」のノイズとがある。第８の実施例ま
では、環境の変化を時間という枠でとらえて、前者も後
者も含めてノイズ対策をするものであった。ところがこ
の方法では、事象が予め定まった時間通りに起こらなか
った場合に対応することができない。

【００５０】そこで、本実施例のノイズ対策部１９は、
時間情報管理テ―ブル４（１９３）に、時刻とその時刻
に発生する事象とは対応づけた情報を保持している。例
えば、時刻ｔ₁に事象Ｂ（例えば電車が到着する）、時
刻ｔ₄に事象Ｅ（例えばサイレンが鳴る）が起こる予定
であることが記憶されている。認識辞書部５は、各ノイ
ズ毎に作成された認識辞書ａ，ｂ，ｃ，…と予備の汎用
認識辞書（あるノイズに特有のものではなく一般の認識
辞書）とを備えている。各認識辞書は、例えば、ａは早
朝に鳴く鳥の声を含むノイズを、ｂは事象Ｂが起きたと
きのノイズを、ｃは事象Ｂに引き続いて起こるホ―ムの
ベル音とラッシュの音を含むノイズを、ｄは昼間行き来
する人の足音を含むノイズを、ｅは事象Ｅが起きたとき
のノイズを、それぞれ学習用音声に重畳した音声デ―タ
をもとに作成されている。さらに、本実施例のノイズ対
策部１９は、事象・辞書テ―ブル（１９４）に、事象と
その事象が生起したときに用いるべき認識辞書とを対応
づけた情報を保持している。ここには、事象と対応づけ
られた認識辞書ｂ，ｅが登録され、事象でくくれない状
況に対応する認識辞書ａ，ｄは登録されない。

【００５１】次に、臨時事象選択部２０は、現在または
将来に起きる事象をノイズ対策部１９に伝える機能を持
つ。例えば、電車の到着が１０分遅れそうなときは、手
動で、予定時の１０分後に電車が到着することをノイズ
対策部１９に伝える。または、監視カメラを用いて、現
在起こっている事象を観測してその結果（到着予定の電
車が見えたかまだ見えないか）をノイズ対策部１９に伝
える。

【００５２】ノイズ対策部１９の動きについて図１１の
フロ―図を参照しながら述べる。タイマ―（１９１）よ
り現在の時刻ｔをモニタし、時間情報管理テ―ブル４
（１９３）から現在の時刻に起きる予定の事象を検出
し、これと臨時事象選択部２０から送られてくる事象発
生の情報とが一致する場合（上記の例ではｔ＝ｔ₁に事
象Ｂが生起し、ｔ＝ｔ₄に事象Ｅが生起し、ｔ≠ｔ₁，
ｔ₄には事象生起が観測されない場合）、第１の実施例
と同様に、時間と認識辞書を対応させた時間情報管理テ
―ブル１（１９２）を用いて、全認識辞書のうち１つを
選択する為に認識辞書スイッチ４を制御する（Ｓ１０
３，Ｓ１０７，Ｓ１１５）。

【００５３】ここで、例えば電車の到着が遅れる等の事
象発生の時間のズレが生じた場合、臨時事象選択部２０
から送られてくる電車が来ないという情報によって、時
間情報管理テ―ブル１の内容を一時的に変更する。例え
ば、ｔ＝ｔ₁に事象Ｂが生起しない場合には、時間情報
管理テ―ブル１の、事象Ｂに対応する認識辞書ｂが用い
られるはずであった時間ｔ₁〜ｔ₂の認識辞書の項をａ
または汎用と書き換える（Ｓ１０４）。これは、事象が
起きなかったということはその直前の状況が続いている
と考えて、この状況に適した認識辞書を選択するためで
ある。直前のものが状況に適した認識辞書とはならない
場合には、汎用認識辞書を選択する。ｔ＝ｔ₄に事象Ｅ
が生起しない場合も同様の考え方で時間情報管理テ―ブ
ル１の認識辞書の項を書き換える（Ｓ１０８）。なお、
ｔ₂〜ｔ₃に用いられるはずの認識辞書ｃは、事象Ｂに
引き続いてなる状況に即したものであるから、事象Ｂが
起こらない場合は時間ｔ₂〜ｔ₃の認識辞書の項もａま
たは汎用と書き換える。さらに、ｔ≠ｔ₁に事象Ｂが生
起した場合には、事象・辞書テ―ブル（１９４）を参照
して該当する認識辞書ｂを選択し（Ｓ１１０）、時間情
報管理テ―ブル１の、事象Ｂに対応する認識辞書ｂが用
いられるはずであった時間ｔ₁〜ｔ₂を（ｔ−ｔ₁）分
ずらすように書き換える（Ｓ１１１）。ｔ≠ｔ₄に事象
Ｅが生起した場合にも同様に事象・辞書テ―ブルにより
認識辞書ｅを選択して（Ｓ１１３）、時間情報管理テ―
ブル１の認識辞書ｅが用いられるばずであった時間の項
を書き換える（Ｓ１１４）。

【００５４】このように、本実施例によれば、環境の変
化を事象によるものも状況ととらえられるものも時間と
いう枠でくくってノイズ対策をする場合に、事象が予め
定まった時間通りに起こらない非常事態にも対応するこ
とができる。

【００５５】

【発明の効果】以上説明したように本発明によれば、非
定常な環境ノイズに対して、そのノイズの時間的情報を
予め記憶して利用することにより、環境に適した音声認
識辞書を選択的に用いたり、適切なノイズ除去を行った
りすることが可能となり、認識性能の向上を図ることの
できる音声認識装置を提供できるという実用上多大なる
効果が奏せられる。

【図面の簡単な説明】

【図１】第１の実施例に係る音声認識装置の構成図。

【図２】第２の実施例に係る音声認識装置の構成図。

【図３】ノイズ対策部６の動作を示すフロ―図。

【図４】第３の実施例に係る音声認識装置の構成図。

【図５】第４の実施例に係る音声認識装置の構成図。

【図６】第５の実施例に係る音声認識装置の構成図。

【図７】第６の実施例に係る音声認識装置の構成図。

【図８】第７の実施例に係る音声認識装置の構成図。

【図９】第８の実施例に係る音声認識装置の構成図。

【図１０】第９の実施例に係る音声認識装置の構成
図。

【図１１】ノイズ対策部１９の動作を示すフロ―図。

【符号の説明】

１音声入力部２音響分析部３音声認識部４認識辞書スイッチ５認識辞書部６，７，６７，１９ノイズ対策部６１，７１，１５１，１９１タイマ― ６２，１９２時間情報管理テ―ブル１７２時間情報管理テ―ブル２１９３時間情報管理テ―ブル４１９４事象・辞書テ―ブル８ノイズ除去部９ノイズデ―タ部１０ノイズデ―タスイッチ１１認識辞書１２学習用音声デ―タファイル１３学習用音声デ―タ加工部１４認識辞書作成部１５発声者予測部１５２時間情報管理テ―ブル３１６語彙・発声者対応テ―ブル１７，１８環境適応部２０臨時事象選択部

───────────────────────────────────────────────────── フロントページの続き (72)発明者金澤博史神奈川県川崎市幸区小向東芝町１番地株式会社東芝総合研究所内 (56)参考文献特開昭59−168496（ＪＰ，Ａ) 特開昭62−103699（ＪＰ，Ａ) 特開昭59−34595（ＪＰ，Ａ) 特開昭59−34596（ＪＰ，Ａ) 特公昭61−27758（ＪＰ，Ｂ２) 特公昭63−67197（ＪＰ，Ｂ２) (58)調査した分野(Int.Cl.⁷，ＤＢ名) G10L 15/00 - 17/00

Claims

(57)【特許請求の範囲】

【請求項１】複数の音声認識辞書を備え、音声を入力す
る入力手段と、この入力手段により入力された音声を分析する分析手段
と、時間と前記時間に用いるべき音声認識辞書とを対応づけ
て記憶しておく記憶手段と、前記入力手段により音声が入力された時間を検出する時
間検出手段と、この時間検出手段により検出された時間に対応する音声
を認識辞書を前記記憶手段を用いて選択する選択手段
と、前記分析手段による分析結果と前記選択手段により選択
された音声認識辞書とを照合して入力された前記音声を
認識する認識手段と、時間と前記時間に生起する予定の事象を予め記憶してお
く事象記憶手段と、事象と前記事象が生起した時に用いるべき音声認識辞書
とを対応づけて予め記憶しておく予備記憶手段と、前記時間検出手段により検出された時間に生起する事象
を検知する事象検知手段と、この事象検知手段により検知された事象に対応する音声
認識辞書を前記予備記憶手段を用いて選択する予備選択
手段とを具備し、前記時間検出手段により検出された時間に生起する予定
の事象を前記事象記憶手段より調べ、この予定の事象と
前記事象検知手段により検知された事象とが一致しない
場合には、前記選択手段を前記予備選択手段に切り換え
て前記認識手段を動作させることを特徴とする音声認識
装置。
【請求項２】音声を入力する入力手段と、この入力手段により入力された音声を分析する分析手段
と、この分析手段による分析結果と音声認識辞書とを照合し
て前記入力された音声を認識する認識手段とを有する音
声認識装置において、前記音声認識辞書中の語彙と前記語彙を発声する発声集
合とを対応づけて予め記憶しておく第１の記憶手段と、予め時間と対応づけて、音声を入力する確率の最も大き
い発声集合を記憶しておく第２の記憶手段と、前記入力手段により音声が入力された時間を検出する時
間検出手段と、この時間検出手段により検出された時間に対応する発声
者集合を前記第２の記憶手段から検索する検索手段とを
具備し、前記認識手段において前記分析結果と前記音声認識辞書
とを照合する際に、前記第１の記憶手段に記憶された発
声者集合が前記検索手段により検索された発声者集合と
一致する語彙を一致しない語彙よりも優先度を高くし
て、認識を行うことを特徴とする音声認識装置。